《数据挖掘方法与应用》对数据挖掘中常用的建模算法进行系统介绍,内容涵盖了数据预处理、关联规则挖掘、聚类分析、决策树及组合算法、贝叶斯分类、支持向量机、人工神经网络等。在阐述每种算法基本理论的基础上,同时给出基于R软件的应用方法。这种理论与应用相结合的方式为读者理解和运用这些方法提供了坚实的基础,有助于读者由浅入深、循序渐进地理解相关内容并用以解决实际问题。
更多科学出版社服务,请扫码获取。
目录
第1章 数据挖掘导论 1
1.1 数据挖掘的概念 1
1.2 数据挖掘的产生背景及意义 2
1.3 数据挖掘的功能及步骤 3
1.4 数据挖掘的常用方法 5
1.5 小结 7
思考题与练习题 7
第2章 数据预处理 8
2.1 数据预处理简介 8
2.2 数据清洗 9
2.3 数据集成 11
2.4 数据变换 11
2.5 数据规约 14
2.6 基于R语言的数据预处理 17
2.7 小结 28
思考题与练习题 29
第3章 关联规则挖掘 30
3.1 关联规则的基本概念 30
3.2 简单关联规则挖掘 32
3.3 序列关联规则挖掘 36
3.4 基于R语言的关联规则挖掘 40
3.5 小结 47
思考题与练习题 48
第4章 聚类分析 49
4.1 聚类分析的简介 49
4.2 距离与相似度的度量 49
4.3 K均值聚类 53
4.4 密度聚类 56
4.5 层次聚类 58
4.6 基于R语言的聚类分析 60
4.7 小结 66
思考题与练习题 67
第5章 决策树及组合算法 68
5.1 决策树简介 68
5.2 决策树的生长 70
5.3 决策树的剪枝 76
5.4 基于决策树的组合算法 78
5.5 基于R语言的决策树建模 81
5.6 小结 89
思考题与练习题 90
第6章 贝叶斯分类 91
6.1 贝叶斯定理 91
6.2 朴素贝叶斯 93
6.3 贝叶斯信念网络 96
6.4 贝叶斯信念网络特点及应用 100
6.5 基于R语言的贝叶斯分类建模 100
6.6 小结 105
思考题与练习题 105
第7章 支持向量机 107
7.1 支持向量机简介 107
7.2 线性支持向量机 110
7.3 非线性支持向量机 116
7.4 基于R语言的支持向量机建模 121
7.5 小结 134
思考题与练习题 134
第8章 人工神经网络 135
8.1 人工神经网络概述 135
8.2 感知机模型 138
8.3 BP算法原理 140
8.4 BP神经网络的R语言实现 145
8.5 小结 151
思考题与练习题 151