《循序漸進Spark大數(shù)據應用開發(fā)》結合作者一線開發(fā)實踐,循序漸進地介紹了新版Apache Spark 3.x的開發(fā)技術。全書共10章,第1章和第2章主要介紹Spark的基本概念、安裝,并演示如何編寫最簡單的Spark程序。第3章深入探討了Spark的核心組件RDD。第4章講解了Spark集群管理,幫助讀者理解任務提交與執(zhí)行的基本原理。第5章介紹了Spark SQL,這是處理結構化數(shù)據的基礎工具。第6章展示了Spark Web UI,通過界面化的方式了解Spark集群運行狀況。第7章和第8章分別介紹了Spark流式數(shù)據處理框架Spark Streaming和Structured Streaming。第9章和第10章則分別介紹了業(yè)界流行的機器學習和圖計算處理框架MLlib和GraphX。書中各章節(jié)還提供了豐富的實戰(zhàn)案例和上機練習題,以便讀者在學習的同時進行實際操作,迅速提升動手能力。《循序漸進Spark大數(shù)據應用開發(fā)》技術先進,案例豐富,適合對Spark大數(shù)據應用感興趣的學生、大數(shù)據開發(fā)人員及架構師使用,也可作為培訓機構和高校大數(shù)據課程的教學用書。