傾斜校正識別反饋通用性論文_第1頁
傾斜校正識別反饋通用性論文_第2頁
傾斜校正識別反饋通用性論文_第3頁
傾斜校正識別反饋通用性論文_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于識別反饋的文檔圖像傾斜校正的研究和應(yīng)用【摘要】 通過OCR (Optical Character Recognition,光學(xué)字符識別)技術(shù),可以將紙制文檔的內(nèi)容輸出為可編輯的文字。目前OCR技術(shù)的發(fā)展已相對成熟,對于掃描或拍攝質(zhì)量較好的圖像有著很高的識別率。然而,在對紙質(zhì)文檔掃描或拍照時(shí),不可避免會(huì)產(chǎn)生文檔放置傾斜的現(xiàn)象,對這樣采集到的圖像在進(jìn)行OCR識別時(shí),會(huì)產(chǎn)生很大誤差,識別率急劇下降。所以對文檔圖像進(jìn)行傾斜校正是非常必要的。在對文本圖像進(jìn)行傾斜校正的過程中發(fā)現(xiàn),影響校正效果的因素有很多方面,如文本的字體、字型、腳本以及是否含有圖片等,這些都會(huì)在不同程度上影響校正算法的效果,并給傾斜

2、校正帶來了一定的復(fù)雜性。本課題來源于國家“十一五”國家科技支撐平臺重點(diǎn)項(xiàng)目-“視障者閱讀輔助器具的研制”,該項(xiàng)目的主要目標(biāo)是研制視障者使用的、基于文字識別的便攜式閱讀輔具。該閱讀輔具通過采用OCR技術(shù)和語音合成技術(shù)實(shí)現(xiàn)了印刷文字和電子文檔轉(zhuǎn)換為語音輸出的功能,這樣使得視障者可以像常人一樣閱讀報(bào)紙和書籍。在OCR識別前需要進(jìn)行對文檔圖像的預(yù)處理,其中傾斜校正是很關(guān)鍵的一步,要求能夠?qū)σ话愕奈谋径寄艿玫揭粋€(gè)較好的處理效果,即算法應(yīng)具有良好的通用性,并.更多還原【Abstract】 You can output the contents of paper documents to editable

3、computer text through OCR (Optical Character Recognition) technology. Currently, OCR technology is relatively mature, and it can get a high recognition rate for good quality scanned or shoot images. However, scanned paper documents or pictures will produce a phenomenon of document placed tilt inevit

4、ably, when we do the OCR recognition to the image which is collected under this conditions, it will produce a big error so that the recogniti.更多還原 【關(guān)鍵詞】 傾斜校正; 識別反饋; 通用性; 【Key words】 skew detection; recognized feedback; universality; 【索購論文全文】138113721 139938848 即付即發(fā)目錄摘要 4-5 Abstract 5-6 1 緒論 9-13 1.1

5、 課題背景與研究意義 10 1.2 國內(nèi)外研究現(xiàn)狀 10-11 1.3 研究方法 11 1.4 本文結(jié)構(gòu) 11-13 2 圖像處理理論基礎(chǔ) 13-15 2.1 數(shù)字圖像的基本概念 13 2.2 圖像的格式簡介 13-15 3 文檔圖像的預(yù)處理 15-24 3.1 二值化算法 15-19 3.1.1 OTSU算法 17 3.1.2 Bernsen算法 17-19 3.2 去除噪聲處理 19-21 3.3 文本行的膨脹處理和提取中心線 21-23 3.4 本章小結(jié) 23-24 4 傾斜角度檢測算法 24-35 4.1 Hough變換算法 25-27 4.2 投影法 27-28 4.3 交叉相關(guān)性方法 28-29 4.4 近鄰法 29-30 4.5 Fourier變換法 30-31 4.6 基于內(nèi)容的文檔圖像傾斜估計(jì) 31-32 4.7 旋轉(zhuǎn)變換算法 32-34 4.8 本章小結(jié) 34-35 5 基于OCR識別反饋的文檔圖像的傾斜校正算法 35-46 5.1 課題創(chuàng)新文檔圖像的傾斜校正算法概述 35-36 5.2 文本子區(qū)域的選取 36-37 5.3 整幅圖像的文本線跟蹤算法 37-41 5.3.1 文本線跟蹤并擬合算法 39-40 5.3.2 對圖像中間行的文本線跟蹤算法 40-41 5.4 基于自動(dòng)分塊的文本線跟蹤算法 41 5.5 OCR識

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論