内容简介这是一本指导各类型组织科学构建数据体系,并通过对数据体系的管理和运营让数据实现价值转化的实战性著作,是作者在数字化领域近20年工作经验的总结。本书深度剖析了数字化时代数据体系建设的关键要素与实施路径,系统而全面地介绍了数据体系建设的方法论、框架与实战案例。从全面认识数据与数据要素的价值出发,逐步深入探讨了数据管
本书以Python为基础,深入讲解HDFS分布式文件系统和PySpark3编程。全书共9章,内容包括Docker环境下Hadoop与Spark的配置、HDFS操作技巧、RDD编程方法、SparkSQL应用、Spark架构及运行机制、PandasonSpark使用及SparkML编程实践。本书通过实际操作案例,帮助读者掌
本书是一本面向数据分析初学者、进阶从业者及管理者的实用指南。本书通过系统化的学习路径和丰富的案例,全面介绍了DeepSeek这款AI工具在数据分析中的应用。书中从数据分析的基础概念入手,详细讲解了数据分析的目的、流程和常用工具,强调了数据分析在企业决策中的重要性。通过实际案例分析,展示了DeepSeek如何通过自
本书主要介绍数据科学中数据准备阶段常用的数据处理方法。全书内容分为五个部分:数据准备概览、数据清理、数据变换、数据归约和案例分析。本书注重方法的原理及其应用,在方法原理引介部分强调重要的统计学思想,在方法应用部分强化数据思维和数据处理规范。
本书属于大数据分析领域的学术专著,由理论基础、数据处理技术、算法应用、模型创新及案例分析等部分组成。全书以大数据技术的发展趋势、处理算法与应用模型为研究对象。深入分析了大数据环境下的数据采集、存储、处理及挖掘技术,提出了针对海量数据处理的优化算法和模型。特别关注了机器学习、深度学习在大数据分析中的应用,探讨了它们在不同
本书属于数据挖掘领域的著作,从数据挖掘基本知识入手,简要阐述了数据预处理技术,在此基础上深入研究了关联规则、聚类分析、分类规则、时间序列挖掘等数据挖掘等核心技术;此外,本书还关注了复杂类型数据的挖掘,最后分析了数据挖掘技术在金融、教育、医疗等关键行业中的实际应用。
本书共十章,第一章为研究的背景、意义、现状和特点;第二章为AI、冰山理论、金课三者的内涵与融合方式;第三章从高职院校大数据与会计专业课程现状进行剖析,指出目前在教育理念、课程内容、教学内容与方法等方面存在的问题;第四、五、六章,分析了冰山理论在金课建设中的应用、建设框架和建设路径,主要讲述在借用AI技术或手段的基础上,
本书从数据资产的基本概念入手,分析和论述了数据价值的产生机制、实现路径与方法;同时对传统的资产评估方法(成本法、收益法和市场法)进行丰富和发展,特别是对市场法的发展进行了深入探讨,并结合企业数据资产评估案例进行分析,对于从事数据资产评估实务的相关专业技术人
本书主要向读者介绍基于互联网技术的数据分析原理与方法,帮助读者理解并掌握数据分析能力,可使用到实践中并提升工作能力。本书具体内容包括学数据分析有什么用,数据分析的基础方法,数据分析的起点,数据分析的基础,数据分析的准备;通过数据分析看清现实,通过数据分析抓住业务增长机会,通过数据分析发现异常、处理异常、防止异常,通过数
本书共9章,分四部分,全面讲解数据跨境流动的背景、意义、政策、合规制度、技术保障和国际规则。第一部分(第1章至第2章)介绍数据跨境流动的基本定义、发展阶段及内涵,同时从全球治理、全球经济发展、全球科技创新3个角度阐明数据跨境流动所蕴含的巨大价值。第二部分(第3章至第4章)详细介绍我国对数据跨境流动的政策以及相关法律体系