本書面向所有對機器學習與數(shù)據(jù)挖掘的實踐及競賽感興趣的讀者,從零開始,以Python編程語言為基礎,在不涉及大量數(shù)學模型與復雜編程知識的前提下,逐步帶領讀者熟悉并且掌握當下流行的機器學習、數(shù)據(jù)挖掘與自然語言處理工具,如Scikit-learn、NLTK、Pandas、gensim、XGBoost、Google Tensorflow等。全書共分4章。第1章簡介篇,介紹機器學習概念與Python編程知識;第2章基礎篇,講述如何使用Scikit-learn作為基礎機器學習工具;第3章進階篇,涉及怎樣借助高級技術或者模型進一步提升既有機器學習系統(tǒng)的性能;第4章競賽篇,以Kaggle平臺為對象,幫助讀者一步步使用本書介紹過的模型和技巧,完成三項具有代表性的競賽任務。