关于我们
书单推荐
新书推荐
|
创新统计思维——让数据说话 读者对象:本书可作为高等院校理工、经济、统计、管理等高年级本科生、硕士和博士研究生学习统计计算及应用概率统计等相关课程的教材,也可以作为相关学科和工程技术人员的参考书。
本书遵循统计研究的思维特点,提出了工具思维、直观思维、随机思维、发散思维、探究思维、优化思维、工程思维与决策思维8种思维,并配套相应的问题结合R软件展开探讨。本书具有两个特点:一个是聚焦问题驱动和方法研究,将内容集中在学科基本问题的统计研究与随机模拟上;另一个是聚焦数据驱动和模型研究,将内容集中在实际问题的统计建模与数据处理上。 本书可作为高等院校理工、经济、统计、管理等高年级本科生、硕士和博士研究生学习统计计算及应用概率统计等相关课程的教材,也可以作为相关学科和工程技术人员的参考书。
吕书龙,福州大学数学与统计学院副教授、硕导、教学名师,数学公共基础课教学研究中心负责人,主要从事概率统计方面的研究。近年来主编《应用统计分析与R语言实战》,参编《应用统计方法》《概率论与数理统计》等多部教材;在《应用概率统计》《实验技术与管理》《实验室研究与探索》《福州大学学报(自然科学版)》《高等理科教育》《大学数学》等刊物发表教科研论文六十余篇。刘文丽,福州大学数学与统计学院副教授,近年来参编《应用统计分析与R语言实战》《概率论与数理统计》等多部教材,在《中国管理科学》、《系统工程学报》《福州大学学报(自然科学版)》《大学数学》等刊物发表论文五十余篇。主持1项省级教研课题、4项校级课题,参与多项国家级、省级、校级课题。目前主要从事概率统计、统计与管理工程交叉融合等教学与研究工作。
第1章 工具思维:R语言是一把利器 ................................................................................................. 1
1.1 为何选择R语言 ..................................................................................................................................... 1 1.2 如何学习R语言 ..................................................................................................................................... 2 1.2.1 学习R语言的五点小建议 ................................................................................................................................. 2 1.2.2 RGui软件的初步使用 ........................................................................................................................................ 4 1.3 R语言的语法注意点 ............................................................................................................................... 6 1.4 R语言的数据类型与输入/输出 .............................................................................................................. 7 1.4.1 数据类型 .............................................................................................................................................................. 7 1.4.2 输入/输出 ............................................................................................................................................................ 8 1.5 R语言的流程控制与执行效率 ............................................................................................................. 12 1.5.1 分支控制 ............................................................................................................................................................ 12 1.5.2 循环控制 ............................................................................................................................................................ 13 1.6 R语言的表达式与环境 ......................................................................................................................... 15 1.6.1 R语言的表达式 ................................................................................................................................................ 16 1.6.2 R语言的运行环境 ............................................................................................................................................ 16 1.7 R语言的函数设计 ................................................................................................................................ 17 1.7.1 函数的定义 ........................................................................................................................................................ 17 1.7.2 带特殊参数的函数 ........................................................................................................................................... 18 1.7.3 嵌套函数 ............................................................................................................................................................ 19 1.7.4 递归函数 ............................................................................................................................................................ 19 1.7.5 关于脚本和函数调用 ....................................................................................................................................... 21 1.7.6 按引用传递参数 ............................................................................................................................................... 22 1.7.7 管道运算 ............................................................................................................................................................ 22 1.8 R语言提供的系列函数与数据集.......................................................................................................... 23 1.8.1 17个系列函数 ................................................................................................................................................... 23 1.8.2 内置的数据集.................................................................................................................................................... 34 1.9 实例分析—疫情数据的爬取 ............................................................................................................. 39 思考与练习 .................................................................................................................................................... 44 第2章 直观思维:数据可视化 ........................................................................................................... 46 2.1 可视化的形式 ........................................................................................................................................ 46 2.2 比较的可视化 ........................................................................................................................................ 47 2.2.1 分组报表 ........................................................................................................................................................... 47 2.2.2 分组统计图 ....................................................................................................................................................... 49 2.2.3 分组多图 ........................................................................................................................................................... 51 2.2.4 有条件分组绘图 ............................................................................................................................................... 54 2.3 占比的可视化 ....................................................................................................................................... 55 2.3.1 平面饼图与3D饼图 ......................................................................................................................................... 55 2.3.2 条形比例图 ....................................................................................................................................................... 58 2.3.3 金字塔图 ........................................................................................................................................................... 58 2.4 趋势的可视化 ....................................................................................................................................... 60 2.4.1 时间序列 ........................................................................................................................................................... 60 2.4.2 极限相关 ........................................................................................................................................................... 60 2.5 分布的可视化 ....................................................................................................................................... 62 2.5.1 数据的位置分布 ............................................................................................................................................... 62 2.5.2 数据的形态分布 ............................................................................................................................................... 63 2.5.3 数据的空间分布 ............................................................................................................................................... 64 2.5.4 数据的降维可视化 ........................................................................................................................................... 68 2.6 关系的可视化 ....................................................................................................................................... 71 2.6.1 调和曲线图与聚类 ........................................................................................................................................... 71 2.6.2 相关性的可视化 ............................................................................................................................................... 72 2.6.3 散布图 ............................................................................................................................................................... 74 2.7 实例分析—人口数据的可视化 ........................................................................................................ 76 思考与练习 .................................................................................................................................................... 79 第3章 随机思维:随机数与随机模拟 ............................................................................................... 81 3.1 随机数发生器 ....................................................................................................................................... 81 扩展阅读 ........................................................................................................................................................................ 83 3.2 概率极限理论的模拟 ............................................................................................................................ 84 3.2.1 大数定律 ........................................................................................................................................................... 84 3.2.2 中心极限定理 ................................................................................................................................................... 87 3.3 Monte-Carlo随机模拟方法及应用 ....................................................................................................... 92 3.3.1 圆周率π的估计 .............................................................................................................................................. 93 3.3.2 函数积分的模拟计算 ....................................................................................................................................... 94 3.3.3 产品合格率问题 ............................................................................................................................................... 96 3.3.4 投资决策问题 ................................................................................................................................................... 97 3.4 样本独立同分布的模拟 ...................................................................................................................... 100 3.5 抽样分布渐近正态性的模拟 .............................................................................................................. 103 3.5.1 问题描述 ......................................................................................................................................................... 104 3.5.2 求使用正态分布替代的最小自由度 .............................................................................................................. 105 3.6 抽样定理的模拟 .................................................................................................................................. 112 3.6.1 格里汶科定理 ................................................................................................................................................. 112 3.6.2 单正态总体的抽样分布 ................................................................................................................................. 114 3.6.3 双正态总体的抽样分布 ................................................................................................................................. 116 3.6.4 非正态总体的抽样分布 ................................................................................................................................. 118 3.7 混合分布的模拟 ................................................................................................................................. 121 3.8 多维分布的模拟 .................................................................................................................................. 124 3.9 排列组合的抽样 .................................................................................................................................. 127 3.10 实例分析—微信抢红包 ................................................................................................................. 133 3.10.1 红包分配算法 ............................................................................................................................................... 133 3.10.2 红包金额的数字特征 ................................................................................................................................... 134 3.10.3 红包分配的随机模拟 ................................................................................................................................... 136 思考与练习 .................................................................................................................................................. 139 第4章 发散思维:参数估计问题 ................................................................................................... 141 4.1 常见点估计方法的比较 ....................................................................................................................... 141 4.2 非参数逆向思维估计法 ....................................................................................................................... 146 4.3 区间估计的实现方法 ........................................................................................................................... 149 4.4 区间估计中的计算问题 ....................................................................................................................... 153 4.5 Bootstrap方法 ..................................................................................................................................... 158 4.6 混合分布参数的EM估计 ................................................................................................................... 164 4.7 众数的估计方法 .................................................................................................................................. 171 4.8 中位数的区间估计 ............................................................................................................................... 175 4.9 经验分布函数的区间估计 ................................................................................................................... 179 4.10 参数估计的综合与模拟 ..................................................................................................................... 182 4.11 实例分析—传染病潜伏期的估计 ................................................................................................. 188 思考与练习 .................................................................................................................................................. 190 第5章 探究思维:假设检验问题 ................................................................................................... 192 5.1 检验p值的解析 .......................................................................................................................... 192 5.2 基于Bootstrap思想的检验p值估计法 ..................................................................................... 194 5.3 假设检验与区间估计之间的互推 .............................................................................................. 200 5.4 基于Q-Q图的分布拟合优度检验 ............................................................................................. 203 5.5 同分布族的直观检验方法 .......................................................................................................... 207 5.6 2χ检验法的非常规探讨 ............................................................................................................ 214 5.7 基于距离的分布拟合优度2χ检验 ............................................................................................ 218 5.8 连续总体的独立性检验 .............................................................................................................. 225 5.9 置换检验 ..................................................................................................................................... 231 5.10 实例分析—关于圆周率π的检验问题................................................................................. 235 思考与练习 .......................................................................................................................................... 239 第6章 优化思维:回归分析问题 ................................................................................................... 240 6.1 回归模型概述 .............................................................................................................................. 240 6.2 拟合度的解析 .............................................................................................................................. 242 6.3 过拟合的正则化校正 .................................................................................................................. 247 6.4 寻找合适的回归模型 .................................................................................................................. 252 6.5 组合回归模型 .............................................................................................................................. 259 6.6 分类与回归 ................................................................................................................................. 262 6.6.1 Logistic回归模型 ................................................................................................................................. 262 6.6.2 Probit回归模型 ..................................................................................................................................... 264 6.6.3 Poisson计数回归模型 ........................................................................................................................... 266 6.6.4 过度离势问题 ....................................................................................................................................... 267 6.7 实例分析—无配对样本回归 .................................................................................................. 268 6.7.1 问题再现 ............................................................................................................................................... 268 6.7.2 模型构建与应用 ................................................................................................................................... 270 思考与练习 ......................................................................................................................................... 273 第7章 工程思维:图像处理中的统计问题 .................................................................................. 275 7.1 灰度图像的生成 ......................................................................................................................... 275 7.2 灰度图像的直方图 ..................................................................................................................... 279 7.3 图像二值化方法 ......................................................................................................................... 284 7.3.1 OTSU二值化算法 ................................................................................................................................ 284 7.3.2 K-means聚类二值化算法 ..................................................................................................................... 287 7.4 图像匹配 .................................................................................................................................... 289 7.5 图像特征提取 ............................................................................................................................. 293 7.5.1 梯度方向直方图 ................................................................................................................................... 293 7.5.2 图像HOG计算 ..................................................................................................................................... 293 7.6 初识机器学习 ............................................................................................................................. 299 7.7 实例分析—图像分类 ............................................................................................................. 305 7.7.1 读取数据集 ........................................................................................................................................... 305 7.7.2 图像的描述性统计 ............................................................................................................................... 307 7.7.3 机器学习模型 ....................................................................................................................................... 308 思考与练习 ......................................................................................................................................... 313 第8章 决策思维:文本挖掘中的统计问题 ................................................................................... 314 8.1 中文分词与词云可视化 ............................................................................................................. 314 8.2 分词的实现算法 ......................................................................................................................... 318 8.3 朴素贝叶斯决策 ......................................................................................................................... 322 8.3.1 文本中的贝叶斯概率 ............................................................................................................................ 322 8.3.2 概率计算的简化 ................................................................................................................................... 323 8.3.3 实例计算 ............................................................................................................................................... 324 8.4 实例分析—酒店评价的统计分析 .......................................................................................... 327 8.4.1 探索性分析 ........................................................................................................................................... 327 8.4.2 贝叶斯决策 ........................................................................................................................................... 334 思考与练习 ......................................................................................................................................... 335
你还可能感兴趣
我要评论
|