如果你是一位在校大學生,對大數據感興趣,也知道使用的企業(yè)越來越多,市場需求更是日新月異,但苦于自己基礎不夠,心有余而力不足;也看過不少大數據方面的書籍、博客、視頻等,但感覺進步不大;如果你是一位在職人員,但目前主要使用傳統技術,雖然對大數據很有興趣,也深知其對未來的影響,但因時間不夠,雖有一定的基礎,常常也是打兩天魚、曬三天網,進展不是很理想。如果你有上述疑惑或遇到相似問題,本書正好比較適合你。本書從OpenStack云平臺搭建、軟件部署、需求開發(fā)實現到結果展示,以縱向角度講解了生產性大數據項目上線的整個流程;以完成一個實際項目需求貫穿各章節(jié),講述了Hadoop生態(tài)圈中互聯網爬蟲技術、Sqoop、Hive、HBase組件協同工作流程,并展示了Spark計算框架、R制圖軟件和SparkRHive組件的使用方法。本書的一大特色是提供了實際操作環(huán)境,用戶可以在線登錄云平臺來動手操作書中的數據和代碼,登錄網址請參考http://www.feiguyun.com/support。