全書共十個項目,除了項目一介紹大數(shù)據(jù)基礎理論外,其余項目均以實戰(zhàn)為主線,內容循序漸進,逐步深入,圍繞大數(shù)據(jù)技術的應用層層展開。內容主要包括大數(shù)據(jù)的基本概念、Ubuntu及服務安裝配置、Hadoop集群部署、MapReduce編程、HBase數(shù)據(jù)庫部署與應用、Hive數(shù)據(jù)倉庫安裝與應用、Pig數(shù)據(jù)分析、Sqoop數(shù)據(jù)遷移、Spark部署及數(shù)據(jù)分析等知識,最后以大數(shù)據(jù)技術的具體應用介紹了MapReduce大數(shù)據(jù)編程、Mahout的K-Means計算、決策樹和隨機森林的分類預測、頻繁項集運算和關聯(lián)分析等知識。本書秉承“實踐為主、理論夠用,注重實用”原則,將實驗環(huán)節(jié)及實操內容融入各個知識點與課程教學中,以便讀者能更好地學習和掌握大數(shù)據(jù)關鍵技術。