本書較為全面地介紹了大數據開發(fā)技術平臺Hadoop及其生態(tài)系統(tǒng)的相關知識。全書共12章,包括Hadoop概述、大數據開發(fā)平臺Hadoop環(huán)境的搭建、Hadoop通用命令與編程原理、Hadoop分布式文件存儲HDFS、作業(yè)調度與集群資源管理框架YARN、Hadoop分布式計算框架MapReduce、Hadoop數據庫HBase、Hadoop數據倉庫Hive、Hadoop數據的快速通用計算引擎Spark,以及大數據應用開發(fā)綜合實例。本書從應用角度出發(fā),重點培養(yǎng)學生應用大數據技術平臺Hadoop解決實際問題的能力。 本書內容新穎,簡明易懂,可操作性強,可作為普通高等學校、高職高專院校數據科學與大數據、軟件工程等計算機相關專業(yè)和信息管理類專業(yè)“大數據開發(fā)技術”課程的教材,也可作為大數據技術培訓的教材,還適合大數據技術研發(fā)人員和廣大計算機愛好者自學使用。