注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書教育/教材/教輔教材高職高專教材大數(shù)據(jù)分析技術

大數(shù)據(jù)分析技術

大數(shù)據(jù)分析技術

定 價:¥59.00

作 者: 李俊翰,聶強
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111712084 出版時間: 2022-08-01 包裝:
開本: 16開 頁數(shù): 216 字數(shù):  

內容簡介

  本書主要面向高職大數(shù)據(jù)技術專業(yè)的學生,注重大數(shù)據(jù)分析技術的應用和實踐。本書每個項目主要分為兩個部分。部分是大數(shù)據(jù)分析技術的理論知識,主要講解了大數(shù)據(jù)分析模型、Python數(shù)據(jù)分析工具、NumPy和Pandas數(shù)據(jù)分析庫、Matplotlib數(shù)據(jù)分析可視化庫、Hadoop及其常用組件以及scikitlearn機器學習庫的基本原理和操作。第二部分是任務實施,通過17個實操任務充分展現(xiàn)了大數(shù)據(jù)分析技術的主要功能和特點。 \n本書既可作為高等職業(yè)院校大數(shù)據(jù)技術、信息安全與管理、軟件技術、計算機網(wǎng)絡技術、云計算技術等專業(yè)的教材,也適合有一定Python編程經(jīng)驗并對大數(shù)據(jù)分析技術感興趣的讀者閱讀。

作者簡介

  李俊翰,中共黨員,執(zhí)教13年。教學經(jīng)驗豐富。作為主研參與大數(shù)據(jù)技術與應用國家專業(yè)教學資源庫建設工作,主持子課程《應用程序開發(fā)基礎(Java)》;發(fā)表SCI2篇,中文核心3篇;完成軟件著作權1項,實用新型專利4項,橫向課題2項;作為指導教師,指導學生參加全國職業(yè)院校技能大賽“大數(shù)據(jù)技術與應用”賽項獲二等獎,重慶市職業(yè)院校技能競賽“大數(shù)據(jù)技術與應用”賽項獲得一等獎3項,“一帶一路”暨金磚國際技能大賽大數(shù)據(jù)賽項三等獎等;主參編教材《大數(shù)據(jù)采集與爬蟲》《大數(shù)據(jù)平臺應用》《Python編程基礎》《Spark大數(shù)據(jù)實時分析實戰(zhàn)》;作為主講教師先后承擔《數(shù)據(jù)預處理》《大數(shù)據(jù)編程基礎(Python)》和《大數(shù)據(jù)可視化技術》等十余門課程。

圖書目錄

目錄 \n
前言 \n
項目1 認識大數(shù)據(jù)分析 \n
1.1 大數(shù)據(jù)分析概述 \n
1.1.1 大數(shù)據(jù)分析的概念和發(fā)展 \n
1.1.2 大數(shù)據(jù)分析的作用和影響 \n
1.2 大數(shù)據(jù)分析模型 \n
1.2.1 大數(shù)據(jù)分析的技術和工具 \n
1.2.2 大數(shù)據(jù)分析的流程 \n
1.2.3 大數(shù)據(jù)分析的模型簡介 \n
【任務實施】 \n
任務1 網(wǎng)站用戶活躍度指標綜合分析 \n
任務2 身高體重指標數(shù)據(jù)關聯(lián)分析 \n
練習題 \n
項目2 安裝Python數(shù)據(jù)分析工具 \n
2.1 Python數(shù)據(jù)分析基本概念 \n
2.1.1 Python數(shù)據(jù)分析的特點 \n
2.1.2 Python與其他數(shù)據(jù)分析工具的比較 \n
2.2 Python數(shù)據(jù)分析常用庫介紹 \n
2.2.1 NumPy簡介 \n
2.2.2 Pandas簡介 \n
2.2.3 SciPy簡介 \n
2.2.4 Matplotlib簡介 \n
2.2.5 scikitlearn簡介 \n
2.2.6 Statmodels簡介 \n
2.2.7 Seaborn簡介 \n
【任務實施】 \n
任務1 在Windows系統(tǒng)中安裝Anaconda \n
任務2 運行Jupyter Notebook \n
任務3 PyCharm的安裝和使用 \n
練習題 \n
項目3 使用NumPy實現(xiàn)統(tǒng)計分析和處理 \n
3.1 NumPy的基本概念 \n
3.1.1 NumPy基礎理論和引用方法 \n
3.1.2 ndarry對象 \n
3.1.3 NumPy數(shù)據(jù)類型 \n
3.1.4 NumPy數(shù)組屬性 \n
3.1.5 NumPy切片和索引 \n
3.2 NumPy函數(shù) \n
3.2.1 NumPy數(shù)學函數(shù) \n
3.2.2 NumPy數(shù)組維度操作函數(shù) \n
3.2.3 NumPy創(chuàng)建數(shù)組函數(shù) \n
3.2.4 NumPy常用IO函數(shù) \n
3.2.5 NumPy廣播 \n
【任務實施】 \n
任務1 使用Numpy實現(xiàn)股票數(shù)據(jù)分析 \n
任務2 使用Numpy實現(xiàn)豆瓣電影數(shù)據(jù) \n
分析 \n
練習題 \n
項目4 Pandas數(shù)據(jù)分析和處理 \n
4.1 Pandas的基本概念 \n
4.1.1 Pandas基礎理論和引用方法 \n
4.1.2 Pandas基本數(shù)據(jù)結構 \n
4.2 Pandas的基本用法 \n
4.2.1 創(chuàng)建Pandas對象 \n
4.2.2 查看Pandas基本數(shù)據(jù) \n
4.2.3 Pandas索引和切片 \n
4.2.4 Pandas缺失值和空值處理 \n
4.2.5 Pandas連接和合并數(shù)據(jù) \n
4.2.6 Pandas分組 \n
4.2.7 Pandas重塑 \n
4.2.8 Pandas數(shù)據(jù)透視表 \n
4.2.9 Pandas時間序列 \n
4.2.10 Pandas分類 \n
4.2.11 Pandas IO操作 \n
【任務實施】 \n
任務1 使用Pandas實現(xiàn)水果銷售數(shù)據(jù)分析 \n
任務2 使用Pandas實現(xiàn)用戶消費行為數(shù)據(jù)分析 \n
任務3 使用Pandas實現(xiàn)電商銷售數(shù)據(jù)分析 \n
練習題 \n
項目5 Matplotlib數(shù)據(jù)分析可視化庫 \n
5.1 Matplotlib的基本概念 \n
5.1.1 Matplotlib基礎理論和引用方法 \n
5.1.2 散點圖 \n
5.1.3 條形圖 \n
5.1.4 折線圖 \n
5.1.5 餅圖 \n
5.1.6 直方圖 \n
5.1.7 箱形圖 \n
5.2 組合圖 \n
5.2.1 曲線組合圖 \n
5.2.2 柱狀、散點、折線組合圖 \n
5.2.3 直方圖組合圖123 【任務實施】 \n
任務1 使用餅圖實現(xiàn)零售總額數(shù)據(jù)分析 \n
任務2 使用折線圖實現(xiàn)零售總額數(shù)據(jù)分析 \n
任務3 使用雙柱狀圖實現(xiàn)零售總額變化情況數(shù)據(jù)分析 \n
練習題 \n
項目6 基于Hadoop的數(shù)據(jù)分析 \n
6.1 掌握Hadoop框架和生態(tài)組件 \n
6.1.1 Hadoop簡介 \n
6.1.2 Hadoop核心組件和工作原理 \n
6.1.3 Hadoop安裝、部署和應用 \n
6.2 Hadoop生態(tài)組件 \n
6.2.1 Hadoop生態(tài)圈簡介 \n
6.2.2 Hive的安裝、部署和應用 \n
6.2.3 Spark的安裝、部署和應用 \n
6.2.4 HBase的安裝、部署和應用 \n
6.2.5 Kafka的安裝、部署和應用 \n
6.2.6 Flume的安裝、部署和應用 \n
6.2.7 Sqoop的安裝、部署和應用 \n
6.2.8 Zookeeper的安裝、部署和應用 \n
【任務實施】 \n
任務1 使用Hadoop及其組件Hive實現(xiàn)數(shù)據(jù)分析 \n
任務2 使用Hadoop及其組件Spark實現(xiàn)數(shù)據(jù)分析 \n
練習題 \n
項目7 基于scikitlearn機器學習庫的數(shù)據(jù)分析 \n
7.1 掌握機器學習基本概念 \n
7.1.1 機器學習簡介 \n
7.1.2 機器學習基本流程 \n
7.1.3 機器學習開發(fā)流程 \n
7.1.4 機器學習算法分類 \n
7.2 掌握scikitlearn的基本用法 \n
7.2.1 scikitlearn的安裝和引用方法 \n
7.2.2 scikitlearn的基本用法 \n
【任務實施】 \n
任務1 使用scikitlearn實現(xiàn)鳶尾花數(shù)據(jù)分析 \n
任務2 使用scikitlearn實現(xiàn)波士頓房價數(shù)據(jù)分析 \n
練習題 \n
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號