本書從零開始,循序漸進地介紹了目前*流行的網絡爬蟲框架Scrapy。本書共13章。其中第1~4章為基礎篇,介紹了Python基礎、網絡爬蟲基礎、Scrapy框架及基本的爬蟲功能。第5~10章為進階篇,介紹了如何將爬蟲數據存儲于MySQL、MongoDB和Redis數據庫中;如何實現異步的Ajax數據的爬??;如何使用Selenium和Splash實現動態(tài)網站的爬取;如何實現模擬登錄功能;如何突破反爬蟲技術,以及如何實現文件和圖片的下載。第11~13章為高級篇,介紹了使用Scrapy-Redis實現分布式爬蟲;使用Scrapyd和Docker部署分布式爬蟲;使用Gerapy管理分布式爬蟲,并實現了一個搶票軟件的綜合項目。 本書適合爬蟲初學者、爬蟲愛好者及高校相關學生,也適合數據爬蟲工程師作為參考讀物,同時也適合各大院校和培訓機構作為教材使用。