注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡數(shù)據(jù)庫數(shù)據(jù)庫挖掘/數(shù)據(jù)倉庫數(shù)據(jù)挖掘算法實踐與案例詳解

數(shù)據(jù)挖掘算法實踐與案例詳解

數(shù)據(jù)挖掘算法實踐與案例詳解

定 價:¥59.00

作 者: 丁兆云 沈大勇 徐偉 周鋆
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111760696 出版時間: 2025-02-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字數(shù):  

內(nèi)容簡介

  數(shù)據(jù)挖掘算法為大數(shù)據(jù)與人工智能的核心,掌握數(shù)據(jù)挖掘各算法的編程實現(xiàn),有助于提升大數(shù)據(jù)的實踐運用能力。本書詳細闡述了數(shù)據(jù)挖掘常用算法與編程實現(xiàn),同時,本書以多個經(jīng)典的數(shù)據(jù)挖掘賽題為案例,詳細論述了數(shù)據(jù)預處理、特征選擇、可視化、算法選擇等全流程數(shù)據(jù)挖掘過程的編程實現(xiàn),有助于提升讀者面對實際數(shù)據(jù)問題時靈活運用各類算法能力。

作者簡介

  丁兆云,國防科技大學博士畢業(yè)后留校任教至今,長期教授數(shù)據(jù)挖掘課程,負責國防科技大學系統(tǒng)工程學院“數(shù)據(jù)挖掘”專業(yè)方向考博命題工作,主持湖南省教改課題1項、國防科技大學教改課題1項、發(fā)表教學論文3篇,獲得國防科技大學研究生教學優(yōu)秀獎。

圖書目錄

目  錄
前言
第1章 緒論  1
1.1 數(shù)據(jù)挖掘技術(shù)的由來  1
1.2 數(shù)據(jù)挖掘的分類  2
1.2.1 關聯(lián)規(guī)則挖掘  2
1.2.2 監(jiān)督式機器學習  3
1.2.3 非監(jiān)督式機器學習  4
1.3 Python的安裝步驟  5
1.3.1 Python環(huán)境的配置  5
1.3.2 PyCharm的安裝  7
1.4 常見的數(shù)據(jù)集  10
1.4.1 鳶尾花數(shù)據(jù)集  10
1.4.2 員工離職預測數(shù)據(jù)集  11
1.4.3 泰坦尼克號災難預測數(shù)據(jù)集  12
1.4.4 PM2.5空氣質(zhì)量預測數(shù)據(jù)集  13
1.5 本章小結(jié)  13
第2章 分類  14
2.1 分類的概念  14
2.2 分類中的訓練集與測試集  14
2.3 分類的過程及驗證方法  15
2.3.1 準確率  15
2.3.2 k折交叉驗證  16
2.4 貝葉斯分類的編程實踐  17
2.4.1 鳶尾花數(shù)據(jù)集的貝葉斯分類  17
2.4.2 基于貝葉斯分類的員工離職
預測  17
2.5 本章小結(jié)  19
第3章 數(shù)據(jù)的特征選擇  20
3.1 直方圖  20
3.1.1 直方圖可視化  20
3.1.2 直方圖特征選擇  23
3.2 直方圖與柱狀圖的差異  24
3.3 特征選擇實踐  26
3.4 本章小結(jié)  29
第4章 數(shù)據(jù)預處理之數(shù)據(jù)清洗  30
4.1 案例概述  30
4.2 缺失值處理  31
4.2.1 缺失值處理概述  31
4.2.2 缺失值處理實例  32
4.3 噪聲數(shù)據(jù)處理  32
4.3.1 正態(tài)分布噪聲數(shù)據(jù)檢測  32
4.3.2 用箱線圖檢測噪聲數(shù)據(jù)  34
4.4 數(shù)據(jù)預處理案例實踐  35
4.4.1 問題  35
4.4.2 解決方法  35
4.4.3 實踐結(jié)論  37
4.5 本章小結(jié)  38
第5章 數(shù)據(jù)預處理之轉(zhuǎn)換  39
5.1 數(shù)據(jù)的數(shù)值化處理  39
5.1.1 順序編碼  39
5.1.2 二進制編碼  40
5.2 數(shù)據(jù)規(guī)范化  42
5.2.1 最小–最大規(guī)范化  42
5.2.2 z分數(shù)規(guī)范化  43
5.2.3 小數(shù)定標規(guī)范化  43
5.3 本章小結(jié)  43
第6章 數(shù)據(jù)預處理之數(shù)據(jù)降維  44
6.1 散點圖可視化分析  44
6.2 主成分分析  46
6.3 本章小結(jié)  49
第7章 不平衡數(shù)據(jù)分類  50
7.1 不平衡數(shù)據(jù)分類問題的特征  50
7.1.1 數(shù)據(jù)稀缺問題  50
7.1.2 噪聲問題  51
7.1.3 決策面偏移問題  51
7.1.4 評價標準問題  51
7.2 重采樣方法  51
7.2.1 上采樣  52
7.2.2 對上采樣方法的改進  53
7.2.3 下采樣  58
7.2.4 對下采樣方法的改進  60
7.2.5 不平衡問題的其他處理方式  65
7.3 不平衡數(shù)據(jù)分類實踐  65
7.4 本章小結(jié)  66
第8章 回歸分析  67
8.1 線性回歸  67
8.1.1 一元線性回歸  67
8.1.2 多元線性回歸  69
8.2 回歸分析檢測  71
8.2.1 正態(tài)分布可能性檢測  71
8.2.2 線性分布可能性檢測  72
8.2.3 log轉(zhuǎn)換后的分布  73
8.3 回歸預測案例實踐  74
8.3.1 案例背景  74
8.3.2 代碼實現(xiàn)  74
8.4 本章小結(jié)  82
第9章 聚類分析  83
9.1 k均值聚類  83
9.1.1 算法的步驟  83
9.1.2 代碼實現(xiàn)  83
9.2 層次聚類  84
9.2.1 算法的步驟  84
9.2.2 代碼實現(xiàn)  85
9.3 密度聚類  85
9.3.1 算法的步驟  85
9.3.2 代碼實現(xiàn)  86
9.4 本章小結(jié)  88
第10章 關聯(lián)分析  90
10.1 Apriori算法  90
10.2 關聯(lián)分析案例實踐  92
10.2.1 案例背景  92
10.2.2 案例的數(shù)據(jù)集  93
10.2.3 代碼實現(xiàn)  93
10.2.4 運行結(jié)果  93
10.3 提升Apriori算法性能的方法  95
10.4 本章小結(jié)  95
第11章 KNN分類  96
11.1 KNN算法的步驟  96
11.2 KNeighborsClassifier函數(shù)  97
11.3 KNN的代碼實現(xiàn)  98
11.4 結(jié)果分析  98
11.5 KNN案例實踐  99
11.5.1 案例分析  99
11.5.2 案例實現(xiàn)  100
11.5.3 運行結(jié)果  103
11.6 本章小結(jié)  104
第12章 支持向量機  105
12.1 支持向量機的可視化分析  105
12.2 SVM的代碼實現(xiàn)  108
12.2.1 鳶尾花數(shù)據(jù)分類  108
12.2.2 新聞文本數(shù)據(jù)分類  110
12.3 本章小結(jié)  111
第13章 神經(jīng)網(wǎng)絡分類  112
13.1 多層人工神經(jīng)網(wǎng)絡  112
13.2 多層人工神經(jīng)網(wǎng)絡的代碼實現(xiàn)  113
13.3 神經(jīng)網(wǎng)絡分類案例實踐  114
13.3.1 案例背景  114
13.3.2 數(shù)據(jù)說明  114
13.3.3 代碼實現(xiàn)  115
13.4 本章小結(jié)  120
第14章 集成學習  121
14.1 Bagging方法  121
14.2 隨機森林  123<>

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號