
数据挖掘——概念、模型、方法和算法
《数据挖掘——概念、模型、方法和算法》是一本由清华大学出版社在2004年出版的书籍。
基本介绍
- 书名:数据挖掘——概念、模型、方法和算法
- ISBN: 9787302067771
- 定价: 42元
- 出版时间:2004-2-26
- 装帧: 平装
- 印次:1-2
内容简介
作为一本教科书,本书全面讲述了数据挖掘的概念、模型、方法和算法。本书共包括13章和2个附录,全面、详细地讲述了从数据挖掘的基本概念到数据挖掘的整个过程,以及数据挖掘工具及其典型套用领域。本书编写严谨、内容权威、结构合理、科学规範、语言流畅,特别适合作为高等院校数据挖掘课程的教科书,还适合作为数据挖掘研究人员必备的参考书。
目录
第1章数据挖掘的概念 1
1.1概述 1
1.2数据挖掘的起源 3
1.3数据挖掘过程 5
1.3.1陈述问题和阐明假设 5
1.3.2数据收集 6
1.3.3数据预处理 6
1.3.4模型评估 7
1.3.5解释模型和得出结论 7
1.4大型数据集 8
1.5数据仓库 12
1.6本书的结构 14
1.7複习题 15
1.8参考书目 16
第2章数据準备 17
2.1原始数据的表述 17
2.2原始数据的特性 20
2.3原始数据的转换 22
2.4丢失数据 24
2.5时间相关数据 25
2.6异常点分析 29
2.7複习题 32
2.8参考书目 33
第3章数据归约 35
3.1大型数据集的维度 35
3.2特徵归约 37
3.3特徵排列的熵度量 41
3.4主成分分析 43
3.5值归约 45
3.6特徵离散化:ChiMerge技术 48
3.7案例归约 51
3.8複习题 54
3.9参考书目 55
第4章从数据中学习 57
4.1机器学习 58
4.2统计学习原理 62
4.3学习方法的类型 67
4.4常见的学习任务 68
4.5模型估计 72
4.6複习题 76
4.7参考书目 77
第5章统计方法 78
5.1统计推断 78
5.2评测数据集的差异 80
5.3贝叶斯定理 82
5.4预测回归 84
5.5方差分析 89
5.6对数回归 92
5.7对数-线性模型 93
5.8线性判别分析 96
5.9复?疤?98
5.10参考书目 99
第6章聚类分析 101
6.1聚类概念 101
6.2相似度的度量 104
6.3凝聚层次聚类 108
6.4分区聚类 112
6.5增量聚类 114
6.6複习题 117
6.7参考书目 119
第7章决策树和决策规则 120
7.1决策树 121
7.2C4.5算法:生成一个决策树 122
7.3未知属性值 128
7.4修剪决策树 132
7.5C4.5算法:生成决策规则 133
7.6决策树和决策规则的局限性 136
7.7关联分类方法 137
7.8複习题 140
7.9参考书目 142
第8章关联规则 144
8.1购物篮分析 144
8.2APRIORI算法 146
8.3从频繁项集得到关联规则 148
8.4提高APRIORI算法的效率 149
8.5频繁模式增长方法(FP-增长方法) 151
8.6多维关联规则挖掘 153
8.7WEB挖掘 154
8.8HITS和LOGSOM算法 156
8.9挖掘路径遍历模式 161
8.10文本挖掘 164
8.11複习题 167
8.12参考书目 169
第9章人工神经网路 171
9.1人工神经元的模型 172
9.2人工神经网路的结构 176
9.3学习过程 177
9.4学习任务 181
9.5多层感知机 183
9.6竞争网路和竞争学习 189
9.7複习题 193
9.8参考书目 195
第10章遗传算法 196
10.1遗传算法的基本原理 197
10.2用遗传算法进行最佳化 198
10.3遗传算法的一个简单例证 203
10.4图式(SCHEMATA) 208
10.5旅行推销员问题 210
10.6使用遗传算法的机器学习 212
10.7複习题 216
10.8参考书目 217
第11章模糊集和模糊逻辑 219
11.1模糊集 219
11.2模糊集的运算 224
11.3扩展原理和模糊关係 229
11.4模糊逻辑和模糊推理系统 233
11.5多因子评价 237
11.6从数据中提取模糊模型 239
11.7複习题 244
11.8参考书目 246
第12章可视化方法 247
12.1感知和可视化 247
12.2科学可视化和信息可视化 248
12.3平行坐标 253
12.4放射性可视化 256
12.5KOHONEN自组织映射 258
12.6数据挖掘的可视化系统 259
12.7複习题 263
12.8参考书目 264
第13章参考书目 266
附录A数据挖掘工具 281
附录B数据挖掘套用 300