《Hadoop實戰(zhàn)》是一本系統(tǒng)且極具實踐指導意義的hadoop工具書和參考書。內容全面,對hadoop整個技術體系進行了全面的講解,不僅包括hdfs和mapreduce這兩大核心內容,而且還包括hive、hbase、mahout、pig、zookeeper、avro、chukwa等與hadoop相關的子項目的內容。實戰(zhàn)性強,為各個知識點精心設計了大量經典的小案例,易于理解,可操作性強。全書一共18章:第1章全面介紹了hadoop的概念、優(yōu)勢、項目結構、體系結構,以及它與分布式計算的關系;第2章詳細講解了hadoop集群的安裝和配置,以及常用的日志分析技巧;第3章分析了hadoop在yahoo!、ebay、facebook和百度的應用案例,以及hadoop平臺上海量數(shù)據(jù)的排序;第4-7章深入地講解了mapreduce計算模型、mapreduce應用的開發(fā)方法、mapreduce的工作機制,同時還列出了多個mapreduce的應用案例,涉及單詞計數(shù)、數(shù)據(jù)去重、排序、單表關聯(lián)和多表關聯(lián)等內容;第8-11章全面地闡述了hadoop的i/o操作、hdfs的原理與基本操作,以及hadoop的各種管理操作,如集群的維護等;第12-17章詳細而系統(tǒng)地講解了hive、hbase、mahout、pig、zookeeper、avro、chukwa等所有與hadoop相關的子項目的原理及使用,以及這些子項目與hadoop的整合使用;第18章以實例的方式講解了常用hadoop插件的使用和hadoop插件的開發(fā)?!禜adoop實戰(zhàn)》既適合沒有hadoop基礎的初學者系統(tǒng)地學習,又適合有一定hadoop基礎但是缺乏實踐經驗的讀者實踐和參考。