《数据科学面试通关》详细阐述了与数据科学面试相关的基本解决方案,主要包括探索现代数据科学领域、在数据科学领域寻找工作、Python编程、数据可视化与数据叙述、使用SQL查询数据库、Linux中的Shell和Bash脚本编写、使用Git进行版本控制、用概率和统计挖掘数据、理解特征工程和为建模准备数据、精通机器学习概念、用
数据是数字经济的关键要素已经形成共识,数据资源入表成为数据资产正在探索推进中。数据资产不同于通常意义上的有形实物资产和无形知识产权资产,它是一类新的资产类别。有用的数据积累到一定的规模具备开发价值后就形成数据资源,数据资源在满足了数据权属明确、成本或价值能够被可靠地计量、数据可机读等基本条件后就可以成为数据资产。本书分
本书是一本全面深入探讨数据资产评估方法与系统设计的专业图书。本书基础篇介绍了数据资产的定义、特征和类型,阐述了数据资产评估的重要性和面临的挑战,分析了数据质量、数据资产价值和风险评估的基础理论。方法篇提供了数据质量、数据资产价值和数据资产风险的相关评估方法,并讨论了它们的适用性和实践应用。系统设计篇重点介绍了数据资产评
本书以科学、实用、简明易懂的语言,以数据时代大数据技术发展与实践为框架,对大数据的技术支撑、基于Hadoop的大数据平台的实现、大数据应用的相关技术、云时代的大数据技术应用案例等内容做深入分析。
本书分为4篇,共12章。第1篇(第1、2章)准备篇,主要介绍Hadoop和Spark的基本概念,以及如何快速搭建Hadoop和Spark的学习环境。第2篇(第3-6章)入门篇,涵盖Hadoop的高级特性、Spark的基础知识与高级特性,以及大数据安全。第3篇(第7-10章)进阶篇,深入讲解数据采集与清洗、数据存储与管理
"《复杂系统影响因素研究的数据驱动分析方法》聚焦于复杂系统影响因素研究的数据驱动分析方法(DAC),为应对大数据和人工智能时代复杂系统问题提供创新思路与实用工具。第1章阐述了传统分析方法在处理复杂系统多变量、非线性和动态变化等特征时的不足,而DAC凭借先进的数据挖掘和机器学习算法,通过数据获取、数据处理与变量测量、聚类
本书围绕配套教材《Hadoop大数据分布式框架-原理与应用》的教学任务,根据教学内容和教学进度设置相应的实验,整本实验指导书共分为20个实验,主要介绍Hadoop分布式环境的部署过程、HDFS编程、MapReduce编程及应用、Hadoop的相关生态组件HBase、Hive、Spark、MySql的安装及应用,以及集成
《大数据分析与应用(微课版)》紧跟大数据技术的最新发展,采用简明易懂的语言和逐步深入的案例,系统地讲解了大数据分析的相关知识。《大数据分析与应用(微课版)》的主要内容包括:大数据分析概论、需求分析与指标体系构建、大数据存储与管理、云计算与大数据的集成应用、网页结构分析与Python编程基础、大数据采集、大数据预处理、大
本书系统的围绕设计可追踪的数据隐私保护方法这一核心问题,从不同角度提出了多种数据隐私保护和追踪功能结合方案,在此基础上对方案深度应用,证实了可追踪的数据隐私保护方案的可行性。此书提出的可追踪的数据隐私保护方法为隐私保护研究领域提出了一种新的解决方式,目前已有多所学校或者研究机构的人员加入到此研究中。
本书通过大量案例介绍了数据分析工作中常用的数据技术方法与工具。本书包括4章内容,分别是数据技术简介——数据获取技术即用python和可视化工具获取数据——数据分析技术:即如何预处理数据、文本数据如何分析等——数据可视化:即通过可视化操作将分析结果呈现出来。