強化學習是人工智能領域近年來崛起的新興技術,在機器人、圖像識別、語音識別等多個領域有著重要應用,而自主行為決策則是車輛智能化的重要體現。本書將二者結合起來,從數據采集、模型構建、模型驗證等角度系統性地闡述了一系列基于強化學習的行為決策方法。全書共7章,第1,2章介紹了智能車輛系統的基本構成,以及強化學習技術的基礎知識;第3至6章基于不同強化學習的特點,詳細闡述了經典強化學習、深度強化學習、逆強化學習和分層強化學習在智能車行為決策系統構建中的應用,以及如何測試這些系統;第7章則從更宏觀的角度探討了目前強化學習方法在遷移和泛化方面的缺陷,并介紹了一種可遷移的強化學習決策方法。書中涉及的所有模型和數據均來自于作者團隊的研究成果,每一章都有相關的引申閱讀材料,可供讀者參考。本書可作為智能交通系統、智能車輛、地面無人車輛及移動機器人等相關專業(yè)高年級本科生和研究生的教學資料,也可以作為從事智能決策與控制技術領域研究的科研技術人員的參考資料。