注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡人工智能中文印刷體文檔識別技術

中文印刷體文檔識別技術

中文印刷體文檔識別技術

定 價:¥42.00

作 者: 王科俊,馮偉興 著
出版社: 科學出版社
叢編項:
標 簽: 人工智能

ISBN: 9787030287601 出版時間: 2010-08-01 包裝: 平裝
開本: 16開 頁數(shù): 203 字數(shù):  

內容簡介

  中文印刷體文檔識別的原理、方法和系統(tǒng)組成,依據(jù)中文印刷體文檔的特點,分別介紹了文檔圖像預處理、版面分析、漢字識別、公式的定位與提取、公式字符分割與識別、公式結構分析與表示、圖表處理等內容的基本原理和技術實現(xiàn)方法,并提供了一個中文印刷體文檔識別系統(tǒng)實例?!吨形挠∷Ⅲw文檔識別技術》可作為研究公式識別、表格識別和漢字識別技術的參考書,可供從事圖像處理、文字識別的研究人員閱讀,也可作為計算機、信息工程、電子技術、自動化等相關學科專業(yè)的研究生和高年級本科生學習圖像處理、模式識別技術的輔助教材參考使用.《中文印刷體文檔識別技術》還配有完整的實例代碼光盤,供讀者參考。

作者簡介

暫缺《中文印刷體文檔識別技術》作者簡介

圖書目錄

《智能科學技術著作叢書》序
前言
第1章 緒論
1.1 中文印刷體文檔識別基本原理
1.2 中文印刷體文檔識別研究現(xiàn)狀
1.2.1 印刷體文檔的漢字識別
1.2.2 印刷體文檔的公式識別
1.2.3 印刷體文檔的表格識別
1.3 中文印刷體文檔識別中的難點
第2章 中文印刷體文檔圖像預處理
2.1 中文印刷體文檔圖像采集
2.1.1 文檔圖像采集
2.1.2 文檔圖像顯示
2.1.3 文檔圖像格式
2.2 中文印刷體文檔圖像特點
2.3 二值化處理
2.3.1 圖像灰度化
2.3.2 圖像二值化
2.4 平滑去噪
2.4.1 鄰域平均法
2.4.2 中值平均法
2.4.3 噪聲直接去除法
2.5 傾斜校正
2.5.1 圖像傾斜檢測
2.5.2 圖像傾斜校正
第3章 版面分析
3.1 版面結構
3.2 版面分析方法
3.2.1 基于連通域的版面分析方法
3.2.2 二分法
3.2.3 基于組合特征的版面分析方法
3.2.4 基于神經網(wǎng)絡的版面分析方法
3.2.5 基于最近鄰連接強度和行列可信度的版面分析方法
3.3 版面理解
3.3.1 文字區(qū)域
3.3.2 圖片區(qū)域
3.3.3 表格區(qū)域
3.3.4 版面結構表示與存儲
3.4 版面重構
第4章 印刷體漢字識別
4.1 文本區(qū)域預處理
4.1.1 文本增強
4.1.2 字符分割
4.1.3 字符細化
4.1.4 字符歸一化
4.1.5 文本區(qū)域處理效果圖
4.2 印刷體漢字的特征提取
4.2.1 印刷體漢字的統(tǒng)計特性
4.2.2 印刷體漢字的常用特征
4.3 印刷體漢字識別的實現(xiàn)方式
第5章 公式的定位與提取
5.1 印刷體文檔公式的特點
5.2 基于投影的公式定位和提取
5.2.1 獨立行公式的定位
5.2.2 內嵌公式的定位
5.3 基于Parzen窗的獨立行公式定位和提取
5.3.1 待分類文本行的特征數(shù)據(jù)提取
5.3.2 Parzen窗方法
5.3.3 公式定位與提取效果
5.4 基于字符寬度中心矩的公式定位和提取
5.4.1 文本區(qū)域基本數(shù)據(jù)獲取
5.4.2 含公式的文本行提取
5.4.3 文本行中公式判別
5.4.4 獨立行公式的定位
5.4.5 內嵌公式的定位
5.4.6公式定位與提取效果
5.5 基于漢字拒識的內嵌公式定位和提取
5.5.1 內嵌公式的定位
5.5.2 公式定位與提取效果
第6章 公式字符分割與識別
6.1 公式字符的特點
6.2 公式字符的分割
6.2.1 基于輪廓跟蹤的字符分割
6.2.2 基于連通域的字符分割
6.3 公式字符的識別
6.3.1 公式字符圖像預處理
6.3.2 基于模板匹配的公式字符識別
6.3.3 基于特征的公式字符識別
6.3.4 印刷體公式字符識別的實現(xiàn)
6.3.5 公式字符識別方法
第7章 公式結構分析與表示
7.1 公式結構分析的難點
7.1.1 數(shù)學運算符的模糊性
7.1.2 符號的上下文敏感性
7.1.3 表示習慣的差異性
7.1.4 公式的復雜性
7.1.5 公式的多行結構
7.2 公式結構分析前的字符預處理
7.3 公式結構分析方法
7.4 公式結構表示方法
7.4.1 公式的典型表示方法
7.4.2 實驗結果
第8章 圖表處理
8.1 文檔中圖形圖像的表示與處理
8.1.1 游程壓縮
8.1.2 霍夫曼編碼壓縮
8.1.3 算術壓縮方法
8.1.4 Rice壓縮方法
8.1.5 LZW壓縮方法
8.2 文檔中表格的分析與識別
8.2.1 表格預處理
8.2.2 表格直線提取
8.2.3 表格結構分析
8.2.4 表格字符提取與識別
第9章 中文印刷體文檔識別軟件HEUOCR的設計與實現(xiàn)
9.1 應用程序框架的構建
9.1.1 框架風格
9.1.2 數(shù)字圖像處理類
9.2 文檔圖像預處理
9.2.1 圖像灰度化
9.2.2 圖像平滑濾波
9.2.3 圖像閾值分割
9.3 文檔圖像版面分析
9.3.1 基本連通域提取
9.3.2 基本連通域分析
9.4 文本漢字識別
9.4.1 字符分割
9.4.2 字符識別
9.5 公式識別
9.5.1 公式定位
9.5.2 公式字符分割
9.5.3 公式字符特征提取
9.5.4 公式字符識別
9.5.5 公式結構分析
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) www.stefanvlieger.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號