本书是基于SparkML和Scala语言编写的机器学习实战书籍。基于目前新版本的Spark框架展开,首先是机器学习准备部分,分别介绍了Spark与大数据技术的基础知识、Spark环境的安装与配置、Scala编程基础、Spark数据结构基础。然后是机器学习核心部分,分别介绍了机器学习基础、线性回归、分类算法及应用、数据降
本书系统地介绍大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。全书共13章,内容包含大数据概述、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、MapReduce、Hadoop再探讨、数据仓库Hive、Spark、流计算、Flink
本书从数据资产的基本概念入手,分析和论述了数据价值的产生机制、实现路径与方法;同时对传统的资产评估方法(成本法、收益法和市场法)进行丰富和发展,特别是对市场法的发展进行了深入探讨,并结合企业数据资产评估案例进行分析,对于从事数据资产评估实务的相关专业技术人
"《MATLAB/Simulink控制系统仿真》介绍了MATLAB/Simulink的主要功能及其在控制理论中的应用。全书共分17章,第1~4章介绍了MATLAB的程序设计、常用功能及其相关函数,Simulink的操作方法,控制系统的基本概念与控制系统仿真的基本原理,重点叙述了仿真中常用的M函数和S函数在Simulin
本书主要向读者介绍基于互联网技术的数据分析原理与方法,帮助读者理解并掌握数据分析能力,可使用到实践中并提升工作能力。本书具体内容包括学数据分析有什么用,数据分析的基础方法,数据分析的起点,数据分析的基础,数据分析的准备;通过数据分析看清现实,通过数据分析抓住业务增长机会,通过数据分析发现异常、处理异常、防止异常,通过数
本书共9章,分四部分,全面讲解数据跨境流动的背景、意义、政策、合规制度、技术保障和国际规则。第一部分(第1章至第2章)介绍数据跨境流动的基本定义、发展阶段及内涵,同时从全球治理、全球经济发展、全球科技创新3个角度阐明数据跨境流动所蕴含的巨大价值。第二部分(第3章至第4章)详细介绍我国对数据跨境流动的政策以及相关法律体系
《数据科学面试通关》详细阐述了与数据科学面试相关的基本解决方案,主要包括探索现代数据科学领域、在数据科学领域寻找工作、Python编程、数据可视化与数据叙述、使用SQL查询数据库、Linux中的Shell和Bash脚本编写、使用Git进行版本控制、用概率和统计挖掘数据、理解特征工程和为建模准备数据、精通机器学习概念、用
数据是数字经济的关键要素已经形成共识,数据资源入表成为数据资产正在探索推进中。数据资产不同于通常意义上的有形实物资产和无形知识产权资产,它是一类新的资产类别。有用的数据积累到一定的规模具备开发价值后就形成数据资源,数据资源在满足了数据权属明确、成本或价值能够被可靠地计量、数据可机读等基本条件后就可以成为数据资产。本书分
本书是一本全面深入探讨数据资产评估方法与系统设计的专业图书。本书基础篇介绍了数据资产的定义、特征和类型,阐述了数据资产评估的重要性和面临的挑战,分析了数据质量、数据资产价值和风险评估的基础理论。方法篇提供了数据质量、数据资产价值和数据资产风险的相关评估方法,并讨论了它们的适用性和实践应用。系统设计篇重点介绍了数据资产评
本书以科学、实用、简明易懂的语言,以数据时代大数据技术发展与实践为框架,对大数据的技术支撑、基于Hadoop的大数据平台的实现、大数据应用的相关技术、云时代的大数据技术应用案例等内容做深入分析。