
化学数据挖掘方法与套用
《化学数据挖掘方法与套用》是2012年化学工业出版社出版的图书,作者是陆文聪、李国正、刘亮、包新华。
基本介绍
- 书名:化学数据挖掘方法与套用
- 作者:陆文聪、李国正、刘亮、包新华 着
- ISBN:9787122127082
- 出版社:化学工业出版社
- 出版时间:2012年02月
- 开卷分类:自然科学
出版信息
ISBN:9787122127082
定价:68.00元
作者:陆文聪、李国正、刘亮、包新华 着
出版社:化学工业出版社
出版时间:2012年02月
版次:1-1
装帧:精
字数:289千字
开卷分类:自然科学
内容简介
本书主要介绍了化学常用数据挖掘方法和技术的基本原理,并重点介绍了模式识别、支持向量机、集成学习方法在材料设计、工业最佳化、构效关係、生物信息学等领域的套用研究实例。书中所有套用研究实例全部取自作者的套用研究课题,有关算法程式可採用作者开发的套用软体HyperMiner(见附录1)。 本书可供化学、化工及相关领域的科研人员和工程技术人员阅读,亦可作为高等学校的教学参考书。
目录
1 化学数据挖掘综述
1.1 化学数据挖掘的目的和意义
1.1.1 数据挖掘与材料设计
1.1.2 数据挖掘与构效关係
1.1.3 数据挖掘与工业最佳化
1.2 化学数据挖掘方法概要
1.3 化学数据挖掘套用进展
1.3.1 机器学习的数学本质
1.3.2 统计模型的“过拟合”问题
1.3.3 模式识别最佳化算法及其改进
1.3.4 支持向量机算法的套用效果
1.3.5 建立综合运用多种算法的数据处理平台
参考文献
2 模式识别基本原理和方法
2.1 模式识别方法的基本原理和预备知识
2.2 模式识别经典方法
2.2.1 最近邻方法
2.2.2 主成分分析方法
2.2.3 多重判别矢量和Fisher判别矢量方法
2.2.4 偏最小二乘方法
2.2.5 非线性映照方法
2.3 模式识别套用技术
2.3.1 最佳投影识别方法
2.3.2 超多面体建模
2.3.3 逐级投影建模方法
2.3.4 最佳投影回归方法
2.3.5 模式识别逆投影方法
2.4 决策树算法
2.4.1 C4.5算法
2.4.2 随机决策树算法
2.4.3 随机森林算法
参考文献
3 人工神经网路和遗传算法
3.1 人工神经网路
3.1.1 反向人工神经网路
3.1.2 Kohonen自组织网路
3.2 遗传算法
参考文献
4 支持向量机方法
4.1 统计学习理论(SLT)简介
4.1.1 背景
4.1.2 原理
4.2 支持向量分类(SVC)算法
4.2.1 线性可分情形
4.2.2 非线性可分情形
4.3 支持向量机(SVM)的核函式
4.4 支持向量回归(SVR)方法
4.4.1 线性回归情形
4.4.2 非线性回归情形
4.5 支持向量机分类与回归算法的实现
4.6 套用前景
参考文献
5 集成学习方法
5.1 集成学习算法概述
5.2 Boosting算法
5.3 Adaboost算法
5.4 Bagging算法
参考文献
6 特徵选择方法和套用
6.1 特徵选择研究概述
6.2 基于支持向量分类的特徵选择
6.2.1 后向浮动搜寻算法
6.2.2 用SVM?BFS进行特徵选择
6.3 支持向量回归的特徵选择
6.3.1 PRIFER算法
6.3.2 计算结果的评价準则
6.3.3 PRIFER方法与常规计算方法的结果比较
6.4 集成学习及其特徵选择
6.4.1 个体子集的特徵选择
6.4.2 基于预报风险的特徵选择
6.4.3 PRIFEB算法
6.4.4 UCI数据集上的计算结果
参考文献
7 钙钛矿型离子导体导电性的数据挖掘
7.1 钙钛矿型离子导体与燃料电池材料
7.2 钙钛矿的结构特性
7.3 钙钛矿型晶体的原子参数
7.3.1 钙钛矿容忍因子
7.3.2 钙钛矿平均离子半径
7.3.3 钙钛矿单位晶格边值与临界半径
7.3.4 钙钛矿组成元素的电负性
7.3.5 钙钛矿平均离子极化率与所带电荷
7.3.6 钙钛矿原子参数与量化参数的组合
7.4 钙钛矿离子导体数据的收集
7.5 数据集的自变数筛选
7.5.1 自变数的经典统计相关性分析
7.5.2 贝叶斯网路进行变数关联性分析
7.5.3 前进?后退法进行自变数筛选
7.6 多种数据挖掘方法建立原子参数?钙钛矿导电能力模型
7.6.1 PLS,BP?ANN与SVR建立的回归模型
7.6.2 回归模型的留一法交叉验证与独立测试集验证
7.6.3 SVR模型的敏感性分析
参考文献
8 熔盐相图资料库的数据挖掘
8.1 相图计算的意义
8.2 原子参数?模式识别方法概述
8.3 智慧型资料库技术在材料科学中的套用
8.4 熔盐相图智慧型资料库的研究和开发
8.5 判别卤化物体系是否形成中间化合物
8.6 白钨矿结构物相含稀土异价固溶体的形成规律
8.6.1 白钨矿型物相及其异价固溶体的形成规律
8.6.2 白钨矿型MⅠM′Ⅲ(XO4)2(X=Mo,W)物相及其异价固溶体的形成规律
8.7 钙钛矿及类钙钛矿结构的物相的若干规律性
8.7.1 钙钛矿结构的复卤化物的若干规律性
8.7.2 含钙钛矿结构层的夹层化合物的规律
参考文献
9 镀锡薄钢板质量的数据挖掘
9.1 镀锡薄钢板的发展
9.2 镀锡板生产过程简介
9.3 镀锡板耐蚀性能与工业生产软熔条件的关係
9.4 镀锡板耐蚀性能与实验室模拟软熔条件的关係
9.5 工业生产中防止淬水斑产生的数学模型
9.6 镀锡板淬水斑的实验室模拟研究
参考文献
10 合成氨生产效益的数据挖掘
10.1 氨合成装置简介
10.1.1 生产原理
10.1.2 生产流程
10.1.3 生产数据的複杂性和数据挖掘的必要性
10.2 DMOS合成氨最佳化系统的开发
10.2.1 DMOS合成氨最佳化系统简介
10.2.2 DMOS合成氨最佳化系统离线版软体
10.2.3 DMOS合成氨最佳化系统线上版软体
10.2.4 DMOS合成氨最佳化系统最佳化生产实施步骤
10.2.5 DMOS合成氨最佳化系统主要特点
10.3 氨合成装置生产最佳化模型的研究
10.3.1 数据集
10.3.2 1号合成塔生产最佳化数学模型
10.4 讨论和结论
参考文献
11 分子结构性质关係的数据挖掘
11.1 偶氮染料最大吸收波长的支持向量回归模型
11.1.1 分子结构特徵参数的计算和筛选
11.1.2 支持向量回归的计算结果
11.1.3 讨论
11.2 胍类化合物Na/H交换抑制活性的支持向量分类模型
11.2.1 特徵参数的计算与筛选
11.2.2 支持向量分类的计算结果
11.2.3 与其他方法的比较
11.3 抗爱滋病药物HEPT活性的支持向量分类模型
11.3.1 特徵参数的计算与筛选
11.3.2 支持向量分类的计算结果
11.3.3 与其他方法的比较
11.4 三唑类化合物分子筛选的最佳投影识别模型
11.4.1 特徵参数的计算和筛选
11.4.2 特徵参数间的共线性检查
11.4.3 OPR法的计算
11.4.4 OPR法的测试结果
11.4.5 结论
参考文献
12 HIV?1蛋白酶特异性位点的数据挖掘
12.1 数据集準备
12.2 mRMR方法和特徵选取
12.3 不同的特徵子集建模预报能力比较
12.4 特徵分析和结论
参考文献
13 蛋白质结构及功能类型预测
13.1 用集成学习方法预测蛋白质的亚细胞定位
13.1.1 蛋白质亚细胞定位的生物学基础及研究现状
13.1.2 蛋白质亚细胞定位数据集以及特徵参数的提取
13.1.3 亚细胞定位预测中模型参数的选择与模型的验证
13.1.4 分析与讨论
13.2 蛋白质结构类型的集成学习方法预测
13.2.1 蛋白质结构类型简介及研究现状
13.2.2 数据集以及特徵参数的提取
13.2.3 预测蛋白质结构类型时的模型参数选择与模型验证
13.2.4 分析与讨论
13.3 膜蛋白类型的集成学习方法预测
13.3.1 膜蛋白简介及计算预测研究现状
13.3.2 膜蛋白预测的数据集以及特徵参数的提取
13.3.3 预测膜蛋白质类型的模型参数选择与模型验证
13.3.4 预测膜蛋白质类型的模型变数分析
13.4 蛋白质亚细胞定位和膜蛋白类型预报的线上Web服务
参考文献
附录1 “HyperMiner数据挖掘软体”下载和套用说明
一、软体简介和下载方法
二、套用案例:V?PTC材料最佳配方及最佳工艺条件的探索
附录2 第6章所用的数据集
一、大脑胶质瘤数据集
二、多元校正数据集
三、基因晶片数据集
参考文献