关于我们
书单推荐
新书推荐
|
对比Excel,轻松学习Python统计分析 读者对象:主要面向数据分析师群体以及想要从事数据分析师的大学生。
本书是“对比 Excel”的第 4 本书,全书依旧突出对比学习的特点,通过对比 Excel 的方式来讲解如何利用 Python 学习统计学知识,即统计分析。本书是“对比 Excel”之前 3 本书的延续,同时也是数据分析师技能树的扩展。本书的主线是围绕统计学的理论知识展开的,层层递进,依次为描述性分析、概率和概率分布、抽样推断与参数估计、假设检验、方差分析、卡方分析、回归模型、相关性分析、时间序列。每个理论知识又由核心的 3 个部分组成:该理论知识在数据分析中的应用、理论知识讲解、Excel 和Python 工具的实现,让大家学完本书以后既学到了理论知识,也知道如何将理论知识在数据分析中应用,还知道如何用 Excel 和 Python 去实现。
张俊红,某互联网公司资深数据分析师,畅销书《对比Excel,轻松学习Python数据分析》作者。对比学习法倡导者,入职数据分析师系列丛书作者。喜欢分享,致力于做一个数据科学路上的终身学习者、实践者、分享者。公众号“俊红的数据分析之路”运营人。
第1章 认识统计学 / 1
1.1 统计学是什么 ................................................................................................... 1 1.2 统计学和数据分析有什么关系 ...................................................................... 1 1.3 Python 统计学和统计学有什么区别 .............................................................. 2 第2章 描述性分析 / 3 2.1 描述性分析在数据分析中的应用 .................................................................. 3 2.2 数据类型 ........................................................................................................... 3 2.3 数据整理与展示 ............................................................................................... 3 2.3.1 分类型数据整理与展示 ...................................................................... 4 2.3.2 数值型数据整理与展示 ...................................................................... 7 2.4 概括性分析 ..................................................................................................... 17 2.4.1 集中趋势指标 .................................................................................... 18 2.4.2 离散程度指标 .................................................................................... 23 2.4.3 分布情况指标 .................................................................................... 25 2.5 其他容易混淆的概念 ..................................................................................... 28 2.5.1 均值与期望 ........................................................................................ 28 2.5.2 比例和比率 ........................................................................................ 30 2.5.3 百分比和百分点 ................................................................................ 31 第3章 概率和概率分布 / 33 3.1 概率和概率分布在数据分析中的应用场景 ................................................ 33 3.2 常见概念 ......................................................................................................... 33 3.2.1 什么是随机事件 ................................................................................ 33 3.2.2 什么是随机变量 ................................................................................ 34 3.2.3 什么是概率 ........................................................................................ 34 3.3 离散型随机变量概率分布 ............................................................................ 36 3.3.1 概率分布表与概率分布图 ................................................................ 36 3.3.2 累积分布函数与百分点函数 ............................................................ 37 3.3.3 期望与方差 ........................................................................................ 37 3.3.4 常见离散型概率分布 ........................................................................ 38 3.4 连续型随机变量概率分布 ............................................................................ 46 3.4.1 概率密度与累积分布 ........................................................................ 46 3.4.2 期望与方差 ........................................................................................ 50 3.4.3 常见连续型概率分布 ........................................................................ 50 第4章 抽样推断与参数估计 / 65 4.1 抽样推断与参数估计在数据分析中的应用场景 ........................................ 65 4.2 抽样的基本概念 ............................................................................................. 65 4.2.1 总体和样本 ........................................................................................ 65 4.2.2 常用统计量 ........................................................................................ 66 4.3 常用的抽样方式 ............................................................................................. 66 4.3.1 简单随机抽样 .................................................................................... 67 4.3.2 分层抽样 ............................................................................................ 67 4.4 为什么样本可以代表总体 ............................................................................ 68 4.4.1 中心极限定理 .................................................................................... 68 4.4.2 大数定理 ............................................................................................ 70 4.5 参数估计的基本方法 ..................................................................................... 71 4.5.1 点估计 ................................................................................................ 71 4.5.2 区间估计 ............................................................................................ 72 4.6 区间估计的类型 ............................................................................................. 72 4.6.1 一个总体参数的区间估计 ................................................................ 72 4.6.2 两个总体参数的区间估计 ................................................................ 80 第5章 假设检验 / 88 5.1 假设检验在数据分析中的应用场景 ............................................................ 88 5.2 假设检验基本思想 ......................................................................................... 88 5.3 假设检验中常见的两种错误 ........................................................................ 90 5.4 显著性水平和功效 ......................................................................................... 90 5.5 假设检验的基本步骤 ..................................................................................... 91 5.6 一个总体参数的检验 ..................................................................................... 94 5.6.1 总体均值的检验 ................................................................................ 94 5.6.2 总体比例的检验 ................................................................................ 98 5.6.3 总体方差的检验 ................................................................................ 99 5.7 两个总体参数的检验 ................................................................................... 101 5.7.1 两个总体均值之差的检验 .............................................................. 101 5.7.2 两个总体比例之差的检验 .............................................................. 106 5.7.3 两个总体方差比的检验 .................................................................. 107 5.8 假设检验中最小样本量的确定 .................................................................. 109 5.9 A/B 测试的完整流程 .................................................................................... 111 第6章 方差分析 / 113 6.1 方差分析在数据分析中的应用场景 ........................................................... 113 6.2 方差分析的 3 个假设 .................................................................................... 113 6.3 正态性检验方法 ............................................................................................ 113 6.3.1 直方图检验 ....................................................................................... 113 6.3.2 Q-Q 图检验法 ................................................................................... 114 6.3.3 KS 检验 ............................................................................................. 114 6.3.4 AD 检验 ............................................................................................ 115 6.3.5 W 检验 .............................................................................................. 116 6.3.6 非正态数据转换 ............................................................................... 116 6.4 方差齐性检验方法 ........................................................................................ 118 6.4.1 方差比检验 ....................................................................................... 118 6.4.2 Hartley 检验 ...................................................................................... 118 6.4.3 Bartlett 检验 ...................................................................................... 119 6.4.4 Levene 检验 ...................................................................................... 119 6.5 方差分析的基本步骤 ................................................................................... 120 6.6 方差分析的多重比较 ................................................................................... 125 6.6.1 LSD 多重比较法 .............................................................................. 125 6.6.2 Sidak 多重比较法 ............................................................................ 127 6.6.3 Bonferroni 多重比较法 ................................................................... 128 6.7 多因素方差分析 ........................................................................................... 129 6.7.1 无交互作用的多因素方差分析 ...................................................... 129 6.7.2 有交互作用的多因素方差分析 ...................................................... 134 第7章 卡方分析 / 140 7.1 卡方分析在数据分析中的应用 .................................................................. 140 7.2 理论讲解 ....................................................................................................... 140 7.3 Excel 与 Python 实现 ................................................................................... 142 第8章 回归模型 / 144 8.1 回归模型在数据分析中的应用场景 .......................................................... 144 8.2 一元线性回归 ............................................................................................... 144 8.2.1 多元回归方程形式 .......................................................................... 144 8.2.2 最小二乘参数估计法 ...................................................................... 145 8.2.3 拟合程度判断 .................................................................................. 147 8.2.4 显著性检验 ...................................................................................... 147 8.2.5 Excel 与 Python 实现 ....................................................................... 149 8.3 多元线性回归 ............................................................................................... 151 8.3.1 回归方程形式 .................................................................................. 151 8.3.2 最小二乘参数估计 .......................................................................... 151 8.3.3 拟合程度判断 .................................................................................. 151 8.3.4 显著性检验 ...................................................................................... 152 8.3.5 多重共线性 ...................................................................................... 153 8.3.6 Excel 与 Python 实现 ....................................................................... 153 8.4 协方差分析 ................................................................................................... 155 8.4.1 理论讲解 .......................................................................................... 155 8.4.2 Excel 与 Python 实现 ....................................................................... 157 第9章 相关性分析 / 159 9.1 相关性分析在数据分析中的应用场景 ...................................................... 159 9.2 相关系数的种类 ........................................................................................... 159 9.2.1 皮尔逊相关系数 .............................................................................. 159 9.2.2 斯皮尔曼相关系数 .......................................................................... 162 9.2.3 肯德尔相关系数 .............................................................................. 162 9.2.4 Excel 与 Python 实现 ....................................................................... 163 9.3 相关与因果 ................................................................................................... 164 第 10 章 时间序列 / 165 10.1 时间序列在数据分析中的应用 ................................................................ 165 10.2 平稳时间序列预测 .................................................................................... 165 10.2.1 简单平均法 .................................................................................... 166 10.2.2 移动平均法 .................................................................................... 167 10.2.3 指数平滑法 .................................................................................... 169 10.3 时间序列预测模型 .................................................................................... 172 10.3.1 AR 模型 .......................................................................................... 172 10.3.2 MA 模型 ......................................................................................... 174 10.3.3 ARMA 模型 ................................................................................... 175 10.3.4 ARIMA 模型 .................................................................................. 176 10.4 时间序列分解预测 .................................................................................... 177 10.5 趋势时间序列预测 .................................................................................... 187 10.5.1 线性趋势预测 ................................................................................ 187 10.5.2 指数趋势预测 ................................................................................ 189
你还可能感兴趣
我要评论
|