第一章 數(shù)據挖掘概述
1.1 什么是數(shù)據挖掘
1.2 數(shù)據挖掘的應用
1.3 數(shù)據挖掘方法論
第二章 數(shù)據理解和數(shù)據準備
2.1 數(shù)據理解
2.2 數(shù)據準備
2.3 使用SAS進行數(shù)據理解和數(shù)據準備:FNBA信用卡數(shù)據
第三章 關聯(lián)規(guī)則挖掘
3.1 關聯(lián)規(guī)則的實際意義
3.2 關聯(lián)規(guī)則的基本概念及Apriori算法
3.3 負關聯(lián)規(guī)則
3.4 序列關聯(lián)規(guī)則
3.5 使用SAS進行關聯(lián)規(guī)則挖掘
第四章 多元統(tǒng)計中的降維方法
4.1 主成分分析
4.2 探索性因子分析
4.3 多維標度分析
第五章 聚類分析
5.1 距離與相似度的度量
5.2 k均值聚類法
5.3 層次聚類法
第六章 預測性建模的一些基本方法
6.1 判別分析
6.2 樸素貝葉斯分類算法
6.3 k近鄰法
6.4 線性模型與廣義線性模型
第七章 神經網絡
7.1 神經網絡架構及基本組成
7.2 誤差函數(shù)
7.3 神經網絡訓練算法
7.4 提高神經網絡模型的可推廣性
7.5 數(shù)據預處理
7.6 使用SAS建立神經網絡模型
7.7 自組織圖
第八章 決策樹
8.1 決策樹簡介
8.2 決策樹的生長與修剪
8.3 對缺失數(shù)據的處理
8.4 變量選擇
8.5 決策樹的優(yōu)缺點
第九章 模型評估
9.1 因變量為二分變量的情形
9.2 因變量為多分變量的情形
9.3 因變量為連續(xù)變量的情形
9.4 使用SAS評估模型
第十章 模型組合與兩階段模型
10.1 模型組合
10.2 隨機森林
10.3 兩階段模型
參考文獻