随着数据量的爆炸式增长,大数据存储技术在数据科学、人工智能、云计算等领域的重要性日益凸显。大数据不仅为个人生活、企业经营,以及国家与社会的发展带来了机遇,也带来了挑战。本书是一本大数据入门图书,主要介绍了Hive、HBase、Sqoop等内容。本书采用理论与实践相结合的讲解方式,旨在帮助读者摆脱枯燥的理论学习,注重实际
本书前八章主要介绍人工智能及大数据分析处理相关内容,包括人工智能、深度学习、生成模型、预测、因果推断、系统辨识、大规模预训练模型和强化学习;后四章主要介绍协同优化博弈相关理论方法,具体包括协同优化、大规模整数规划、多目标优化和多智能体博弈。
本书详细介绍了大数据与数据治理、大数据思维变革、大数据可视化、大数据商业规则、大数据促进医疗与健康、大数据激发创造力、大数据预测分析、大数据存储技术、大数据处理技术、大数据与云计算、大数据与人工智能、大数据安全与法律、数据科学及其职业、大数据发展展望等内容,深入浅出,具有较强的系统性、可读性和实用性。
本书聚焦数据资产价值管理的关键点,从数据资源化、数据资产化,到数据资本化的演进过程,梳理数据资产的价值特征、管理逻辑与实践路径。
本书共15章,分四部分。第一部分是“数据准备与清洗”(第1-4章),首先介绍自助式数据分析的六大应用场景(第1章),然后详解PowerQuery在数据清洗、表格结构管理以及数据转换方面的全流程操作。第二部分是“数据整合与高级查询”(第5-7章),深入探讨数据管理(第5章)、数据查询(第6章)以及多表合并技术(第7章)。
本书全面阐述了湖仓架构相关知识。首先介绍数据架构及其在构建数据平台中的作用,剖析湖仓架构的概念、特征和优势。接着对比传统架构(数据湖与数据仓库)和现代数据平台,明确湖仓架构在未来数据平台的重要地位。然后讲解行存储与列存储等概念,以及云对象存储、文件格式和表格式等组件,还给出设计存储时的考量因素。接着阐述数据目录、计算引
本书分为三部分:第一部分介绍差分隐私的理论,详细解释了准备数据和执行差分隐私数据发布所需的各个概念;第二部分探讨差分隐私的应用,包括如何查询不同的数据格式(如搜索日志)以及在机器学习算法中添加差分隐私;第三部分则关注从业者需要了解的重要主题,例如理解隐私攻击、设置隐私参数以及部署首次差分隐私数据发布。
端点检测与响应(endpointdetectionandresponse,EDR)是一种网络安全技术,专注于监控、检测和应对终端设备上的可疑活动。通过持续收集和分析端点行为数据,帮助组织及时发现潜在威胁,并提供调查和响应工具,以防止攻击扩散和数据泄露。本书聚焦EDR在Windows操作系统上的工作原理,围绕EDR攻防展
本书围绕网络安全原理与实践展开,全书共8章。第1章介绍网络安全基础,对网络安全问题进行综述;第2章介绍常见的网络攻击技术,重点结合TCP/IP各层协议存在的弱点分析相应的各类攻击原理和常用的攻击手段,如木马攻击、口令攻击、缓冲区溢出攻击、拒绝服务攻击、APT攻击等;第3-7章针对各种网络安全威胁及攻击手段,提出多种安全
本书从移动情境感知视角探究用户行为模式。研究覆盖个体、群体、社区三类用户,提出四种行为模式挖掘方法。在个体层面,本书通过嵌套键值模型与自适应挖掘法,构建效用评估机制实现序列推荐;在群体层面,本书以城市居民通勤为切入点,构建框架与算法,揭示其行为规律及与城市空间结构的关联,助力城市规划;在社区层面,鉴于传统方法的局限,本