注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)庫挖掘/數(shù)據(jù)倉庫Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第3版)

Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第3版)

Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第3版)

定 價:¥89.00

作 者: 張春福 白婧 張良均 范林元 吳建平
出版社: 機械工業(yè)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787111764793 出版時間: 2024-12-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字數(shù):  

內(nèi)容簡介

  本書共13章,分三個部分:基礎(chǔ)篇、實戰(zhàn)篇、提高篇。 (1)基礎(chǔ)篇(第1~5章),第1章的主要內(nèi)容是數(shù)據(jù)挖掘概述;第2章對本書所用到的數(shù)據(jù)挖掘建模工具Python語言進行了簡明扼要的說明;第3章、第4章、第5章對數(shù)據(jù)挖掘的建模過程,包括數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理及挖掘建模的常用算法與原理進行了介紹。 (2)實戰(zhàn)篇(第6~12章),重點對數(shù)據(jù)挖掘技術(shù)在金融、航空、零售、農(nóng)業(yè)、制造和互聯(lián)網(wǎng)等行業(yè)的應(yīng)用進行了分析。在案例結(jié)構(gòu)組織上,本書是按照先介紹案例背景與挖掘目標(biāo),再闡述分析方法與過程,最后完成模型構(gòu)建的順序進行的,在建模過程關(guān)鍵環(huán)節(jié),穿插程序?qū)崿F(xiàn)代碼。最后通過上機實踐,加深數(shù)據(jù)挖掘技術(shù)在案例應(yīng)用中的理解。 (3)提高篇(第13章),圍繞去編程化的TipDM大數(shù)據(jù)挖掘建模平臺,先介紹了平臺每個模塊的功能,再以航空公司客戶價值分析案例為例,介紹如何使用平臺快速搭建數(shù)據(jù)分析與挖掘的工程,展示平臺去編程化、流程化的特點。

作者簡介

  資深大數(shù)據(jù)挖掘?qū)<液湍J阶R別專家,高級信息項目管理師。10余年大數(shù)據(jù)挖掘應(yīng)用、咨詢和培訓(xùn)經(jīng)驗。為電信、電力、政府、互聯(lián)網(wǎng)、生產(chǎn)制造、零售、銀行、生物、化工、醫(yī)藥等多個行業(yè)上百家大型企業(yè)提供過數(shù)據(jù)挖掘應(yīng)用與咨詢服務(wù),實踐經(jīng)驗非常豐富。精通Java EE企業(yè)級應(yīng)用開發(fā),是華南師范大學(xué)、中南財經(jīng)政法大學(xué)、廣東工業(yè)大學(xué)、西安理工大學(xué)、廣西科技大學(xué)、重慶交通大學(xué)、桂林電子科技大學(xué)等校外碩導(dǎo)。

圖書目錄

目  錄 Contents
前言
基礎(chǔ)篇
第1章 數(shù)據(jù)挖掘基礎(chǔ)2
1.1 某知名連鎖餐飲企業(yè)的困惑2
1.2 從餐飲服務(wù)到數(shù)據(jù)挖掘4
1.3 數(shù)據(jù)挖掘的基本任務(wù)4
1.4 數(shù)據(jù)挖掘的建模過程5
1.4.1 目標(biāo)定義5
1.4.2 數(shù)據(jù)采集6
1.4.3 數(shù)據(jù)探索7
1.4.4 數(shù)據(jù)預(yù)處理8
1.4.5 挖掘建模8
1.4.6 模型評價8
1.5 常用的數(shù)據(jù)挖掘建模工具8
1.6 小結(jié)10
第2章 Python數(shù)據(jù)分析簡介11
2.1 搭建Python開發(fā)平臺12
2.1.1 需要考慮的問題12
2.1.2 基礎(chǔ)平臺的搭建13
2.2 Python使用入門14
2.2.1 運行方式14
2.2.2 基本命令15
2.2.3 數(shù)據(jù)結(jié)構(gòu)18
2.2.4 庫的導(dǎo)入與添加23
2.3 Python數(shù)據(jù)分析工具25
2.3.1 NumPy26
2.3.2 SciPy27
2.3.3 Matplotlib28
2.3.4 pandas29
2.3.5 StatsModels31
2.3.6 scikit-learn31
2.3.7 Keras33
2.3.8 Gensim35
2.3.9 TensorFlow35
2.3.10 PyTorch39
2.3.11 PaddlePaddle42
2.3.12 XGBoost45
2.4 配套附件使用設(shè)置47
2.5 小結(jié)47
第3章 數(shù)據(jù)探索48
3.1 數(shù)據(jù)質(zhì)量分析48
3.1.1 缺失值分析49
3.1.2 異常值分析49
3.1.3 一致性分析53
3.2 數(shù)據(jù)特征分析53
3.2.1 分布分析53
3.2.2 對比分析58
3.2.3 統(tǒng)計量分析60
3.2.4 周期性分析63
3.2.5 貢獻度分析65
3.2.6 相關(guān)性分析67
3.3 Python的主要數(shù)據(jù)探索函數(shù)71
3.3.1 基本統(tǒng)計特征函數(shù)71
3.3.2 拓展統(tǒng)計特征函數(shù)75
3.3.3 統(tǒng)計繪圖函數(shù)76
3.4 小結(jié)83
第4章 數(shù)據(jù)預(yù)處理84
4.1 數(shù)據(jù)清洗84
4.1.1 缺失值處理84
4.1.2 異常值處理89
4.1.3 重復(fù)值處理89
4.2 數(shù)據(jù)集成91
4.2.1 實體識別91
4.2.2 冗余屬性識別91
4.3 數(shù)據(jù)變換92
4.3.1 簡單函數(shù)變換92
4.3.2 數(shù)據(jù)規(guī)范化92
4.3.3 連續(xù)屬性離散化95
4.3.4 屬性構(gòu)造97
4.3.5 小波變換98
4.4 數(shù)據(jù)歸約101
4.4.1 屬性歸約101
4.4.2 數(shù)值歸約106
4.5 Python的主要數(shù)據(jù)預(yù)處理函數(shù)109
4.6 小結(jié)111
第5章 挖掘建模113
5.1 分類與預(yù)測113
5.1.1 實現(xiàn)過程114
5.1.2 常用的分類與預(yù)測算法114
5.1.3 回歸分析115
5.1.4 決策樹119
5.1.5 人工神經(jīng)網(wǎng)絡(luò)126
5.1.6 分類與預(yù)測算法評價131
5.1.7 Python的分類預(yù)測模型136
5.2 聚類分析136
5.2.1 常用的聚類分析算法137
5.2.2 k均值聚類算法138
5.2.3 聚類分析算法評價143
5.2.4 Python的主要聚類分析算法144
5.3 關(guān)聯(lián)規(guī)則146
5.3.1 常用的關(guān)聯(lián)規(guī)則算法147
5.3.2 Apriori算法147
5.4 時序模式153
5.4.1 時間序列算法153
5.4.2 時間序列的預(yù)處理154
5.4.3 平穩(wěn)時間序列分析156
5.4.4 非平穩(wěn)時間序列分析159
5.4.5 Python的主要時序模式算法167
5.5 離群點檢測170
5.5.1 離群點的成因及類型170
5.5.2 離群點檢測方法171
5.5.3 基于統(tǒng)計模型的離群點
   檢測方法172
5.5.4 基于聚類的離群點檢測方法174
5.6 小結(jié)177
實戰(zhàn)篇
第6章 房屋租金影響因素分析
    與預(yù)測180
6.1 背景與挖掘目標(biāo)180
6.2 分析方法與過程181
6.2.1 數(shù)據(jù)預(yù)處理181
6.2.2 數(shù)據(jù)探索190
6.2.3 模型構(gòu)建201
6.3 上機實驗207
6.4 拓展思考208
6.5 小結(jié)209
第7章 商超客戶價值分析210
7.1 背景與挖掘目標(biāo)210
7.2 分析方法與過程211
7.2.1 數(shù)據(jù)探索與預(yù)處理212
7.2.2 模型構(gòu)建及結(jié)果分析228
7.3 上機實驗238
7.4 拓展思考239
7.5 小結(jié)240
第8章 商品零售購物籃分析241
8.1 背景與挖掘目標(biāo)241
8.2 分析方法與過程242
8.2.1 數(shù)據(jù)探索分析243
8.2.2 數(shù)據(jù)預(yù)處理249
8.2.3 模型構(gòu)建249
8.3 上機實驗255
8.4 拓展思考256
8.5 小結(jié)256
第9章 基于水色圖像的水質(zhì)評價257
9.1 背景與挖掘目標(biāo)257
9.2 分析方法與過程258
9.2.1 分析流程259
9.2.2 數(shù)據(jù)預(yù)處理259
9.2.3 模型構(gòu)建263
9.2.4 水質(zhì)評價264
9.3 上機實驗265
9.4 拓展思考265
9.5 小結(jié)266
第10章 家用熱水器用戶行為
     分析與事件識別267
10.1 背景與挖掘目標(biāo)267
10.2 分析方法與過程268
10.2.1 數(shù)據(jù)探索分析269
10.2.2 數(shù)據(jù)預(yù)處理272
10.2.3 模型構(gòu)建283
10.2.4 模型檢驗284
10.3 上機實驗285
10.4 拓展思考287
10.5 小結(jié)288
第11章 電視產(chǎn)品個性化推薦289
11.1 背景與挖掘目標(biāo)289
11.2 分析方法與過程290
11.2.1 分析流程291
11.2.2 數(shù)據(jù)預(yù)處理291
11.2.3 分析與建模306
11.2.4 模型評價310
11.3 上機實驗313
11.4 拓展思考314
11.5 小結(jié)314
第12章 天問一號事件中的網(wǎng)民
    評論情感分析315
12.1 背景與挖掘目標(biāo)315
12.2 分析方法與過程316
12.2.1 分析流程316
12.2.2 數(shù)據(jù)說明317
12.2.3 數(shù)據(jù)探索318
12.2.4 文本預(yù)處理323
12.2.5 繪制詞云圖327
12.2.6 使用樸素貝葉斯構(gòu)建
    情感分析模型331
12.2.7 模型評價338
12.2.8 模型優(yōu)化340
12.3 上機實驗344
12.4 拓展思考345
12.5 小結(jié)345
提高篇
第13章 基于TipDM大數(shù)據(jù)挖掘
     建模平臺實現(xiàn)商超客戶
     價值分析348
13.1 平臺簡介348
13.1.1 “共享庫”模塊350
13.1.2 “數(shù)據(jù)連接”模塊350
13.1.3 “數(shù)據(jù)集”模塊350
13.1.4 “我的工程”模塊351
13.1.5 “個人組件”模塊354
13.2 快速構(gòu)建數(shù)據(jù)挖掘工程355
13.2.1 數(shù)據(jù)源配置355
13.2.2 數(shù)據(jù)探索與處理360
13.2.3 模型構(gòu)建與結(jié)果分析379
13.3 小結(jié)393

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號