第1章實驗工具的選擇1
11實驗工具選擇1
12R語言3
13Python語言15
第2章數(shù)據的準備34
21數(shù)據采集34
22數(shù)據抽樣51
23數(shù)據質量分析55
第3章數(shù)據預處理方法77
31數(shù)據清洗77
32數(shù)據集成85
33數(shù)據變換90
34數(shù)據規(guī)約97
35數(shù)據降維106
第4章回歸方法110
41多元線性回歸110
42邏輯回歸120
43線性判別分析126
第5章分類方法131
51K近鄰分類131
52貝葉斯分類139
53神經網絡146
54決策樹153
55隨機森林160
56支持向量機164
57分類的評價175
第6章關聯(lián)規(guī)則192
61關聯(lián)規(guī)則概要192
62Apriori算法193
63FPGrowth算法200
第7章聚類分析207
71聚類方法概要207
72Kmeans聚類算法209
73K中心點聚類算法216
74密度聚類算法220
75層次聚類算法225
76期望最大化聚類算法228
77神經網絡聚類算法232
78模糊C均值聚類算法235
79高斯混合聚類算法238
第8章預測方法241
81預測方法概要241
82灰色預測241
83馬爾科夫預測247
第9章離群點診斷251
91單變量的離群點診斷251
92基于回歸的離群點診斷
254
93基于聚類的離群點診斷
259
94局部離群點因子檢測263
第10章時間序列分析方法267
101季節(jié)指數(shù)預測法267
102解讀自回歸時間序列模型
272
103時間序列分解280
第11章綜合案例286
111員工離職預測分析286
112北京二手房房價分析299