我国在大数据“共建、共享、共治”新发展格局的基础上,要求加快数据要素新发展,激发数字经济新动能,促动人工智能新态势。时代赋予了统计学发展壮大的机会,也要求我们深入研究大数据的统计技术方法、开辟大数据的统计应用领域。在此,我们整合了近年来大数据研究中在统计理论和应用方面的核心成果,系统地形成了大数据的统计技术知识体系。本书共 6章,内容包括大数据发展的新态势、统计学的未来发展动态、数据准备技术、大数据的统计技术体系,及其在计算社会经济学、计算社会医学、企业数字化转型等方面的应用。 本书内容新颖,体系清晰,案例充实,重点反映统计学对大数据发展的影响,注重学科交叉,并突出六大特点:①树立数据要素地位;②体现学科交叉融合;③思考统计未来发展;④改进统计研究方式;⑤形成统计技术体系;⑥扩展统计应用领域,主要体现统计理论方法的融合、统计技术体系的整合和统计应用领域的拓展。 本书对从事大数据挖掘、机器学习、人工智能和数据分析的科研人员具有重要的参考价值,也可以用作统计学、计算机技术、人工智能、大数据管理及工商管理等专业或研究方向硕士生、博士生的教材。
朱建平,南开大学理学博士学位。现任厦门大学管理学院教授、博士生导师,厦门大学健康医疗大数据国家研究院副院长、厦门大学数据挖掘研究中心主任,国家社科基金重大项目首席专家,湖北经济学院特聘教授,教育部新世纪优秀人才,福建省哲学社会科学领军人才,福建省首批高层次A类人才。担任中国统计学会顾问、教育部高等学校统计学类专业教学指导委员会副主任委员、中国统计教育学会副会长、中国商业统计学会副会长、全国工业统计学教学研究会副会长、中国商业统计学会数据科学与商业智能分会会长、厦门市统计学会会长、全国统计教材编审委员会第七届委员会专业委员。主要研究方向:数理统计、数据挖掘、数据科学与商业智能、健康医疗大数据。
目 录
第 1章 概论 !!!!!!!!!!!!!!!!!!!!!!!!!!! 1
11 大数据发展的新格局 !!!!!!!!!!!!!!!!!!!! 2
12 大数据概念的创新剖析 !!!!!!!!!!!!!!!!!!! 3
13 数据要素推动大数据发展的新态势 !!!!!!!!!!!!!! 9
14 数据要素对社会经济发展的推动作用 !!!!!!!!!!!!! 12
15 发挥统计学在人工智能技术中的新动能 !!!!!!!!!!!! 17
16 交叉学科促进统计学的发展 !!!!!!!!!!!!!!!!! 20
17 统计学的未来发展动态 !!!!!!!!!!!!!!!!!!! 27
第 2章 数据准备!!!!!!!!!!!!!!!!!!!!!!!!! 33
21 定向资料收集 !!!!!!!!!!!!!!!!!!!!!!! 34
22 数据去噪 !!!!!!!!!!!!!!!!!!!!!!!!! 38
23 缺失值填充 !!!!!!!!!!!!!!!!!!!!!!!! 41
24 不平衡数据处理 !!!!!!!!!!!!!!!!!!!!!! 48
25 数据变换 !!!!!!!!!!!!!!!!!!!!!!!!! 56
26 数据类型的衍生 !!!!!!!!!!!!!!!!!!!!!! 63
27 多源数据整合 !!!!!!!!!!!!!!!!!!!!!!! 66
第 3章 大数据的统计技术方法!!!!!!!!!!!!!!!!!!! 71
31 指标体系和智能画像 !!!!!!!!!!!!!!!!!!!! 72
32 社会网络 !!!!!!!!!!!!!!!!!!!!!!!!! 84
33 粗糙集 !!!!!!!!!!!!!!!!!!!!!!!!!! 89
34 文本挖掘 !!!!!!!!!!!!!!!!!!!!!!!!! 93
35 深度神经网络 !!!!!!!!!!!!!!!!!!!!!! 101
36 集成方法 !!!!!!!!!!!!!!!!!!!!!!!! 117
37 正则化模型 !!!!!!!!!!!!!!!!!!!!!!! 128
38 贝叶斯方法与深度学习 !!!!!!!!!!!!!!!!!! 131
Ⅶ
39 函数型数据分析 !!!!!!!!!!!!!!!!!!!!! 140
310 关联规则的提升 !!!!!!!!!!!!!!!!!!!!! 148
第 4章 计算社会经济学应用研究 !!!!!!!!!!!!!!!!! 164
41 新冠肺炎疫情新闻对原油期货价格波动率的预测研究 !!!!! 165
42 金融系统性风险分析 !!!!!!!!!!!!!!!!!!! 172
43 新战略背景下城市经济发展状况测度研究 !!!!!!!!!! 181
44 基于公共服务单位分布的均衡化研究 !!!!!!!!!!!! 191
45 基于粗糙集的游戏核心竞争要素与购买模式挖掘 !!!!!!! 197
46 基于函数型数据分析方法的高频资产价格波动率测度研究 !!! 205
第 5章 计算社会医学应用研究 !!!!!!!!!!!!!!!!!! 215
51 健康服务资源均衡指数 !!!!!!!!!!!!!!!!!! 216
52 器官移植舆情分析 !!!!!!!!!!!!!!!!!!!! 224
53 健康中国舆情分析 !!!!!!!!!!!!!!!!!!!! 243
54 基于我国医疗卫生应急管理全过程的综合评价 !!!!!!!! 257
55 通过可解释的机器学习方法自动鉴别克罗恩病和肠结核 !!!! 269
56 我国医疗卫生服务体系演化路径分析 !!!!!!!!!!!! 279
57 线上就医行为分析 !!!!!!!!!!!!!!!!!!!! 286
第 6章 企业数字化转型应用研究 !!!!!!!!!!!!!!!!! 292
61 信贷风险分析 !!!!!!!!!!!!!!!!!!!!!! 293
62 先进制造业 !!!!!!!!!!!!!!!!!!!!!!! 302
63 南方经济及电力景气指数构建与分析 !!!!!!!!!!!! 312
64 基于深度迁移学习的食材图像识别算法研究 !!!!!!!!! 324
65 租赁房资源禀赋研究 !!!!!!!!!!!!!!!!!!! 335
参考文献 !!!!!!!!!!!!!!!!!!!!!!!!!!!!! 34