本書介紹了大數(shù)據分析的多種模型、所涉及的算法和技術、實現(xiàn)大數(shù)據分析系統(tǒng)所需的工具以及大數(shù)據分析的具體應用。本書共16章。第1章為緒論,就大數(shù)據、大數(shù)據分析等概念進行了闡釋,并對本書內容進行了概述;第2~7章介紹了關聯(lián)分析模型、分類分析模型、聚類分析模型、結構分析模型和文本分析模型;第8章介紹大數(shù)據分析的數(shù)據預處理問題;第9章介紹降維方法;第10章介紹了數(shù)據倉庫的概念、內涵、組成、體系結構和建立方法,還介紹了分布式數(shù)據倉庫系統(tǒng)和內存數(shù)據倉庫系統(tǒng)。第11章介紹大數(shù)據分析算法中的回歸算法、關聯(lián)規(guī)則挖掘算法、分類算法以及聚類算法的實現(xiàn)。第12~14章介紹了三種用于實現(xiàn)大數(shù)據分析算法的平臺,即并行計算平臺、流式計算平臺和大圖分析平臺。第15章和第16章介紹兩類大數(shù)據分析的具體應用,分別講述了社會網絡分析和推薦系統(tǒng)。本書可作為高等院校大數(shù)據相關專業(yè)的教學用書,也可以作為從事大數(shù)據相關工作的工程技術人員的參考用書。