注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡人工智能Java機器學習

Java機器學習

Java機器學習

定 價:¥49.00

作 者: [斯洛文尼亞] 博思蒂安·卡魯扎(Bo·tjan Kalu·a) 著;武傳海 譯
出版社: 人民郵電出版社
叢編項: 圖靈程序設計叢書
標 簽: 暫缺

ISBN: 9787115466808 出版時間: 2017-09-01 包裝: 平裝
開本: 16開 頁數(shù): 171 字數(shù):  

內容簡介

  本書介紹如何使用Java創(chuàng)建并實現(xiàn)機器學習算法,既有基礎知識,又提供實戰(zhàn)案例。主要內容包括:機器學習基本概念、原理,Weka、Mahout、Spark等常見機器學習庫的用法,各類機器學習常見任務,包括分類、預測預報、購物籃分析、檢測異常、行為識別、圖像識別以及文本分析。最后還提供了相關Web資源、各種技術研討會議以及機器學習挑戰(zhàn)賽等進階所需內容。本書適合機器學習入門者,尤其是想使用Java機器學習庫進行數(shù)據(jù)分析的讀者。

作者簡介

  作者:[斯洛文尼亞]博思蒂安·卡魯扎(Bo?tjan Kalu?a) 譯者:武傳海博士,人工智能與機器學習專家,現(xiàn)任Evolven公司(領先的IT運營分析公司,致力于配置管理業(yè)務)首席數(shù)據(jù)科學家,主攻機器學習、預測分析、模式挖掘與異常檢測,旨在把數(shù)據(jù)轉化為人類可理解的信息與可供實用的知識。 更多信息請訪問http://bostjankaluza.net。

圖書目錄

第1章 機器學習應用快速入門\t1
1.1 機器學習與數(shù)據(jù)科學\t1
1.1.1 機器學習能夠解決的問題\t2
1.1.2 機器學習應用流程\t3
1.2 數(shù)據(jù)與問題定義\t4
1.3 數(shù)據(jù)收集\t5
1.3.1 發(fā)現(xiàn)或觀察數(shù)據(jù)\t5
1.3.2 生成數(shù)據(jù)\t6
1.3.3 采樣陷阱\t7
1.4 數(shù)據(jù)預處理\t7
1.4.1 數(shù)據(jù)清洗\t8
1.4.2 填充缺失值\t8
1.4.3 剔除異常值\t8
1.4.4 數(shù)據(jù)轉換\t9
1.4.5 數(shù)據(jù)歸約\t10
1.5 無監(jiān)督學習\t10
1.5.1 查找相似項目\t10
1.5.2 聚類\t12
1.6 監(jiān)督學習\t13
1.6.1 分類\t14
1.6.2 回歸\t16
1.7 泛化與評估\t18
1.8 小結\t21
第2章 面向機器學習的Java庫與
平臺\t22
2.1 Java環(huán)境\t22
2.2 機器學習庫\t23
2.2.1 Weka\t23
2.2.2 Java機器學習\t25
2.2.3 Apache Mahout\t26
2.2.4 Apache Spark\t27
2.2.5 Deeplearning4j\t28
2.2.6 MALLET\t29
2.2.7 比較各個庫\t30
2.3 創(chuàng)建機器學習應用\t31
2.4 處理大數(shù)據(jù)\t31
2.5 小結\t33
第3章 基本算法——分類、回歸、
聚類\t34
3.1 開始之前\t34
3.2 分類\t35
3.2.1 數(shù)據(jù)\t35
3.2.2 加載數(shù)據(jù)\t36
3.2.3 特征選擇\t37
3.2.4 學習算法\t38
3.2.5 對新數(shù)據(jù)分類\t40
3.2.6 評估與預測誤差度量\t41
3.2.7 混淆矩陣\t41
3.2.8 選擇分類算法\t42
3.3 回歸\t43
3.3.1 加載數(shù)據(jù)\t43
3.3.2 分析屬性\t44
3.3.3 創(chuàng)建與評估回歸模型\t45
3.3.4 避免常見回歸問題的小技巧\t48
3.4 聚類\t49
3.4.1 聚類算法\t49
3.4.2 評估\t50
3.5 小結\t51
第4章 利用集成方法預測客戶關系\t52
4.1 客戶關系數(shù)據(jù)庫\t52
4.1.1 挑戰(zhàn)\t53
4.1.2 數(shù)據(jù)集\t53
4.1.3 評估\t54
4.2 最基本的樸素貝葉斯分類器基準\t55
4.2.1 獲取數(shù)據(jù)\t55
4.2.2 加載數(shù)據(jù)\t56
4.3 基準模型\t58
4.3.1 評估模型\t58
4.3.2 實現(xiàn)樸素貝葉斯基準線\t59
4.4 使用集成方法進行高級建模\t60
4.4.1 開始之前\t60
4.4.2 數(shù)據(jù)預處理\t61
4.4.3 屬性選擇\t62
4.4.4 模型選擇\t63
4.4.5 性能評估\t66
4.5 小結\t66
第5章 關聯(lián)分析\t67
5.1 購物籃分析\t67
5.2 關聯(lián)規(guī)則學習\t69
5.2.1 基本概念\t69
5.2.2 Apriori算法\t71
5.2.3 FP-增長算法\t71
5.2.4 超市數(shù)據(jù)集\t72
5.3 發(fā)現(xiàn)模式\t73
5.3.1 Apriori算法\t73
5.3.2 FP-增長算法\t74
5.4 在其他領域中的應用\t75
5.4.1 醫(yī)療診斷\t75
5.4.2 蛋白質序列\(zhòng)t75
5.4.3 人口普查數(shù)據(jù)\t76
5.4.4 客戶關系管理\t76
5.4.5 IT運營分析\t76
5.5 小結\t77
第6章 使用Apache Mahout制作
推薦引擎\t78
6.1 基本概念\t78
6.1.1 關鍵概念\t79
6.1.2 基于用戶與基于項目的分析\t79
6.1.3 計算相似度的方法\t80
6.1.4 利用與探索\t81
6.2 獲取Apache Mahout\t81
6.3 創(chuàng)建一個推薦引擎\t84
6.3.1 圖書評分數(shù)據(jù)集\t84
6.3.2 加載數(shù)據(jù)\t84
6.3.3 協(xié)同過濾\t89
6.4 基于內容的過濾\t97
6.5 小結\t97
第7章 欺詐與異常檢測\t98
7.1 可疑與異常行為檢測\t98
7.2 可疑模式檢測\t99
7.3 異常模式檢測\t100
7.3.1 分析類型\t100
7.3.2 事務分析\t101
7.3.3 規(guī)劃識別\t101
7.4 保險理賠欺詐檢測\t101
7.4.1 數(shù)據(jù)集\t102
7.4.2 為可疑模式建模\t103
7.5 網(wǎng)站流量異常檢測\t107
7.5.1 數(shù)據(jù)集\t107
7.5.2 時序數(shù)據(jù)中的異常檢測\t108
7.6 小結\t113
第8章 利用Deeplearning4j進行
圖像識別\t114
8.1 圖像識別簡介\t114
8.2 圖像分類\t120
8.2.1 Deeplearning4j\t120
8.2.2 MNIST數(shù)據(jù)集\t121
8.2.3 加載數(shù)據(jù)\t121
8.2.4 創(chuàng)建模型\t122
8.3 小結\t128
第9章 利用手機傳感器進行
行為識別\t129
9.1 行為識別簡介\t129
9.1.1 手機傳感器\t130
9.1.2 行為識別流水線\t131
9.1.3 計劃\t132
9.2 從手機收集數(shù)據(jù)\t133
9.2.1 安裝Android Studio\t133
9.2.2 加載數(shù)據(jù)采集器\t133
9.2.3 收集訓練數(shù)據(jù)\t136
9.3 創(chuàng)建分類器\t138
9.3.1 減少假性轉換\t140
9.3.2 將分類器嵌入移動應用\t142
9.4 小結\t143
第10章 利用Mallet進行文本挖掘——
主題模型與垃圾郵件檢測\t144
10.1 文本挖掘簡介\t144
10.1.1 主題模型\t145
10.1.2 文本分類\t145
10.2 安裝Mallet\t146
10.3 使用文本數(shù)據(jù)\t147
10.3.1 導入數(shù)據(jù)\t149
10.3.2 對文本數(shù)據(jù)做預處理\t150
10.4 為BBC新聞做主題模型\t152
10.4.1 BBC數(shù)據(jù)集\t152
10.4.2 建模\t153
10.4.3 評估模型\t155
10.4.4 重用模型\t156
10.5 垃圾郵件檢測\t157
10.5.1 垃圾郵件數(shù)據(jù)集\t158
10.5.2 特征生成\t159
10.5.3 訓練與測試模型\t160
10.6 小結\t161
第11章 機器學習進階\t162
11.1 現(xiàn)實生活中的機器學習\t162
11.1.1 噪聲數(shù)據(jù)\t162
11.1.2 類不平衡\t162
11.1.3 特征選擇困難\t163
11.1.4 模型鏈\t163
11.1.5 評價的重要性\t163
11.1.6 從模型到產品\t164
11.1.7 模型維護\t164
11.2 標準與標記語言\t165
11.2.1 CRISP-DM\t165
11.2.2 SEMMA方法\t166
11.2.3 預測模型標記語言\t166
11.3 云端機器學習\t167
11.4 Web資源與比賽\t168
11.4.1 數(shù)據(jù)集\t168
11.4.2 在線課程\t169
11.4.3 比賽\t170
11.4.4 網(wǎng)站與博客\t170
11.4.5 場館與會議\t171
11.5 小結\t171

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號