本书提供了24个多元分析程序,涉及多元回归分析、多因素分析、聚类分析和概率统计模型等内容。为了方便读者使用本书中所提供的程序,每个方法都对数学原理做了简要的论述,对程序的使用做了较为详细的说明,并附有实例和计算结果。
本书可供从事多元统计分析的研究人员使用,也可作为大专院校数据科学与大数据技术专业及相关专业教师、学生学习多元统计分析或程序设计的参考书。
在科研和教学工作中,我们经常会遇到多因素、多指标的实际问题,需要进行定量分析,探索其内在规律和联系。笔者开展了甘肃省哲学社会科学规划项目“大数据推动农民增收应用研究”课题的研究,研究的内容涉及基于分布式计算的投入产出分析模型、多元回归分析模型、多因素分析模型、预测分析模型、聚类分析模型和判别分析模型、时间序列分析模型、马尔科夫链分析模型等统计分析模型。由于所处理的对象涉及较大规模的数据以及计算机技术的快速发展,一些原有的多元统计分析程序已经不能直接用来分析、处理教学科研中所遇到的实际问题。为了解决科研项目中所遇到的难点,并适应计算机技术的发展和科研生产不断增长的需求,我们将开展课题研究时编写的程序进行了系统规划和编排,编写了本书,供从事此项工作的人员查阅和使用。
本书的选材着眼于我们在实际工作中常遇到的一些多因素、多指标问题的解析,每个方法都对数学原理做了简要的论述,对程序的使用做了较为详细的说明,每一程序之后均附有计算实例。这些计算实例有一部分来自于公开发表的文献,读者可通过所列出的参考文献进行查阅,有一部分内容是我们在科研教学活动中所使用的范例,可供读者在调试有关程序时参考,以便增强对多元分析方法的理解,掌握相关分析方法的技巧,领会多元分析的运用,设计自己在科研教学工作中的有关程序。在编写本书时,我们对利用Excel作为分析程序的输入与输出端进行了探索,由于Excel可以存储数以亿计的数据,将有关科研教学工作中的海量数据存储于Excel中,分析程序可非常方便地进行存取,这为开展大数据计算进行了有益的探索。但由于程序设计没有统一的格式,读者可根据自己的计算结果和数据读取和存入的多少,进行有关程序设计,本书不再一一赘述。
书中所有的程序都在Visual Basic 6.0环境下进行了认真的调试。本书的出版得到了甘肃省哲学社会科学规划项目“大数据推动农民增收应用研究”课题的资助,在此表示诚挚谢意!
限于作者水平,书中难免有疏漏之处,恳请读者批评指正!
第1章 多元回归分析 1
1.1 多元线性回归分析 1
1.2 逐步回归分析 9
1.3 岭回归分析 17
1.4 配方回归分析 32
1.5 阶段回归分析 38
1.6 多项式回归分析 44
1.7 调和趋势分析 49
第2章 多因素分析 61
2.1 主成分分析 61
2.2 因子分析 69
2.3 费歇准则二类线性判别分析 90
2.4 贝叶斯准则多类逐步判别分析 99
2.5 模糊模型识别 114
2.6 典型相关分析 121
2.7 多类训练迭代法 143
2.8 主坐标分析 151
第3章 聚类分析 162
3.1 Q模式系统聚类分析 162
3.2 R模式系统聚类分析 176
3.3 图论聚类分析 186
3.4 动态聚类分析 195
3.5 模糊聚类分析 203
3.6 费歇最优分段法 208
3.7 非线性映射 216
第4章 概率统计模型 224
4.1 一维时间序列分析 224
4.2 马尔科夫链分析 234
参考文献 266