本书以数据思维为主题,以数据分析全流程为主线,融合了与数据思维相关的编程语言、统计学基础及案例分析等内容,全书分为4篇,囊括了数据思维的概念和培养方法、数据来源及体系建设、数据分析三大思维方式及用户流失、用户转化实战等共11章的内容。本书囊括了数据分析中常用的分析方法,包括经典的海盗(AARRR)模型、麦肯锡的MECE
本书详细阐述了大数据领域数据采集与预处理的相关理论和技术。全书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。本书在第3章至第8章中安排了丰富的实践操作,以便读者更好地学习和掌握数据采集
随着科学技术的迅猛发展,具有复杂分层结构的数据在现实生活中很普遍。能完全剖析这类数据,发觉该类数据表象下的潜在规律性对于统计学等科研领域很有意义。本书致力于介绍复杂分层数据分析前沿知识,侧重于分层分位回归理论、方法及其应用研究。内容主要包括三大块:分层数据建模、分位回归与分层-分位回归。主要涉及到线性分层分位回归模拟、
本书通过理论与实践相结合的方式,深入浅出地介绍了文件系统的概念、原理和具体实现。本书涵盖本地文件系统、网络文件系统、分布式文件系统和对象存储等内容,可以说涵盖了数据持久化文件系统的主要领域。为了使读者更加深入地理解文件系统的原理,本书不仅介绍了文件系统的原理和关键技术,还结合开源项目介绍了文件系统的实现细节。最后,本书
数据分析是指用适当的数学方法对收集来的大量数据进行分析,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究及概括总结的过程。数据分析的目的在于把隐藏在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来。 数据科学是高等学校非计算机专业本科学生必修的一门公共基础课程,
伺服驱动技术作为数控机床、工业机器人及其他产业机械控制的关键技术之一,在国内外普遍受到关注。本书从工控系统实际需要出发,通过大量典型的伺服驱动控制系统实例讲解,全面解读了伺服控制技术的基本概念、伺服驱动器的基本结构和工作原理,透彻讲解了各典型伺服驱动器的安装、接线及调试与维修,伺服电机的选型、应用、维修,以及伺服驱动系
PLC、变频器、触摸屏、伺服系统(电机)是当前自动化设备经常用到的核心产品,通过以上产品可以实现多样化的智能控制,如生产流水线、机械手、自动包装机等的智能控制。伴随工业自动化的发展与升级,伺服/步进控制以及PLC、变频器、触摸屏等人机交互控制系统的应用会更加广泛。本书全面介绍了伺服控制系统、PLC、变频器、触摸屏实现电
本书是有关数据科学内涵、方法、历史、意义及方法论、发展趋势、学科边界、核心科技问题、人才培养方案等方面的一部综合性论著。《BR》全书分7章。第1章阐述数据科学的产生背景,主要从人类社会、物理世界、信息空间三元世界理论出发,阐述大数据在信息化社会中的基础地位、作用与价值。第2章尝试用数据科学的语言来沟通不同学科,以统一的
本书采用双色图解的方式,系统地介绍了西门子SINAMICSV90伺服驱动系统的应用技术及工程案例,内容主要包括:伺服驱动器的工作原理;西门子SINAMICSV90伺服驱动系统及其接线;V90伺服驱动系统的参数设置;V90伺服驱动系统速度控制;V90伺服驱动系统位置控制;V90伺服驱动系统扭矩控制;V90伺服驱动系统的工
在处理现实的工程或管理问题时,数据的微小波动不可忽略且影响深远,这为鲁棒优化方法的产生提供了契机并推动其迅速发展.本书主要介绍了不确定决策系统中鲁棒优化及分布鲁棒优化方法的一些研究进展.在鲁棒优化方面,给出了不确定集交下的一些新结果并将其应用到可持续发展与应急救援问题中.在分布鲁棒优化方面,介绍了随机分布鲁棒优化及模糊