新闻资讯
看你所看,想你所想

数据挖掘十大算法

数据挖掘十大算法

数据挖掘十大算法

《数据挖掘十大算法》是2014年清华大学出版社出版的图书,作者是(美)吴信东、库玛尔。

基本介绍

  • 书名:数据挖掘十大算法
  • 作者:(美)吴信东、库玛尔 
  • 译者:李文波 吴素研 译
  • ISBN:9787302310617
  • 定价:39元
  • 出版社:清华大学出版社 
  • 出版时间:2014-12-26
  • 装帧:平装

内容简介

数据挖掘这一学科近年来发展十分迅速,不仅产生了大量不同类型的挖掘算法,而且也表现出与机器学习等学科深度融合的态势。无论是从事研究的专家学者还是从事套用的开发人员都十分希望能一窥其大略,从而比较準确地把握数据挖掘领域当前的主干技术,并比较全面地了解当前的发展趋势。
当前,在市场上流通的数据挖掘方面的着作已经不算少了,主要是两大类:一类是具有完整体系的教材类图书,一类是面向特定领域的套用型图书。前者主要是服务教学,所以侧重原理、逻辑严谨,但是通常对数据挖掘的前沿介绍比较欠缺。后者往往集中于介绍某一领域的问题和方法,或者是关于某些典型工具的使用方法,其优点在于直观有效,但相对于整个数据挖掘领域其覆盖面偏小。
为此,很有必要对整个数据挖掘领域的近期发展和前沿成果进行梳理,而这一类信息往往散见于相关的大量学术期刊和会议文集中,限于视野和精力,任何个人都难以完成这一任务。在此基础上,还需要对当前庞大的数据挖掘知识体系进行恰当的取捨和凝练,这一工作必须依靠该领域的高水平学者。所以,国际数据挖掘社区合众人之力,在2006年推出了TheTopTenAlgorithmsinDataMining这一继往开来之作。

目录

第1章C4.51
1.1引言2
1.2算法描述3
1.3算法特性6
1.3.1决策树剪枝6
1.3.2连续型属性8
1.3.3缺失值处理8
1.3.4规则集诱导9
1.4软体实现10
1.5示例10
1.5.1Golf数据集10
1.5.2Soybean数据集11
1.6高级主题11
1.6.1二级存储12
1.6.2斜决策树12
1.6.3特徵选择12
1.6.4集成方法12
1.6.5分类规则13
1.6.6模型重述13
1.7习题14
参考文献15
第2章kmeans18
2.1引言19
2.2算法描述19
2.3可用软体22
2.4示例23
2.5高级主题27
2.6小结28
2.7习题28
参考文献29
第3章SVM: 支持向量机31
3.1支持向量分类器32
3.2支持向量分类器的软间隔最佳化34
3.3核技巧35
3.4理论基础38
3.5支持向量回归器40
3.6软体实现41
3.7当前和未来的研究41
3.7.1计算效率41
3.7.2核的选择41
3.7.3泛化分析42
3.7.4结构化支持向量机的学习42
3.8习题43
参考文献44
第4章Apriori47
4.1引言48
4.2算法描述48
4.2.1挖掘频繁模式和关联规则48
4.2.2挖掘序列模式52
4.2.3讨论53
4.3软体实现54
4.4示例55
4.4.1可行示例55
4.4.2性能评估60
4.5高级主题61
4.5.1改进Apriori类型的频繁模式挖掘61
4.5.2无候选的频繁模式挖掘62
4.5.3增量式方法63
4.5.4稠密表示: 闭合模式和最大模式63
4.5.5量化的关联规则64
4.5.6其他的重要性/兴趣度度量方法65
4.5.7类别关联规则66
4.5.8使用更丰富的形式: 序列、树和图66
4.6小结67
4.7习题67
参考文献68
第5章EM72
5.1引言73
5.2算法描述74
5.3软体实现74
5.4示例75
5.4.1例5.1: 多元正态混合75
5.4.2例5.2: 混合因子分析78
5.5高级主题80
5.6习题81
参考文献87
第6章PageRank90
6.1引言91
6.2算法描述92
6.3一个扩展: TimedPageRank95
6.4小结96
6.5习题96
参考文献97
第7章AdaBoost98
7.1引言99
7.2算法描述99
7.2.1符号定义99
7.2.2通用推举过程100
7.2.3AdaBoost算法101
7.3示例103
7.3.1异或问题求解103
7.3.2真实数据上的性能104
7.4实际套用105
7.5高级主题107
7.5.1理论问题107
7.5.2多类别AdaBoost110
7.5.3其他高级主题111
7.6软体实现111
7.7习题112
参考文献113
第8章kNN: k最近邻115
8.1引言116
8.2算法描述116
8.2.1巨观描述116
8.2.2若干议题117
8.2.3软体实现118
8.3示例118
8.4高级主题120
8.5习题121
致谢121
参考文献122
第9章Naive Bayes124
9.1引言125
9.2算法描述125
9.3独立给力127
9.4模型扩展128
9.5软体实现130
9.6示例130
9.6.1例1130
9.6.2例2132
9.7高级主题133
9.8习题133
参考文献134
第10章CART: 分类和回归树136
10.1前身137
10.2概述138
10.3示例138
10.4算法描述140
10.5分裂準则141
10.6先验机率和类别均衡142
10.7缺失值的处理144
10.8属性的重要度145
10.9动态特徵构造146
10.10代价敏感学习147
10.11停止準则、剪枝、树序列和树选择147
10.12机率树149
10.13理论基础150
10.14CART之后的相关研究150
10.15可用软体151
10.16习题152
参考文献153

相关推荐

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:yongganaa@126.com