這是一部融合了企業(yè)界先進工程實踐經驗和學術界前沿技術和思想的ORC著作。 本書由阿里巴巴本地生活研究院算法團隊技術專家領銜,從組件、算法、實現(xiàn)、工程應用等維度系統(tǒng)講解基于深度學習的OCR技術的原理和落地。書中一步步剖析了算法背后的數(shù)學原理,提供大量簡潔的代碼實現(xiàn),幫助讀者從零基礎開始構建OCR算法。 全書共9章: 第1章從宏觀角度介紹了ORC技術的發(fā)展歷程、概念和產業(yè)應用; 第2章講解了OCR的圖像預處理方法; 第3~4章介紹了傳統(tǒng)機器學習方法和深度學習的相關基礎; 第5章講解了基于傳統(tǒng)方法和深度學習方法的OCR的數(shù)據(jù)生成; 第6章講解了與OCR相關的一些高級深度學習方法,方便讀者理解后續(xù)的檢測和識別部分; 第7章講解了文字的檢測技術,從通用的目標檢測到文字的檢測,一步步加深讀者對文字檢測問題的認識; 第8章討論了文字識別的相關技術,定位到文字的位置之后,需要對文字的內容進行進一步的解析; 第9章介紹了一些OCR后處理的方法。