智能信息處理文字識(shí)別聯(lián)機(jī)識(shí)別and脫機(jī)識(shí)別課件_第1頁
智能信息處理文字識(shí)別聯(lián)機(jī)識(shí)別and脫機(jī)識(shí)別課件_第2頁
智能信息處理文字識(shí)別聯(lián)機(jī)識(shí)別and脫機(jī)識(shí)別課件_第3頁
智能信息處理文字識(shí)別聯(lián)機(jī)識(shí)別and脫機(jī)識(shí)別課件_第4頁
智能信息處理文字識(shí)別聯(lián)機(jī)識(shí)別and脫機(jī)識(shí)別課件_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

智能信息處理第3章文字識(shí)別技術(shù)3.1-3.33.1文字識(shí)別系統(tǒng)3.2脫機(jī)文字識(shí)別3.3聯(lián)機(jī)文字識(shí)別第3章文字識(shí)別技術(shù)3.1-3.3

3.1文字識(shí)別系統(tǒng)

主要介紹模式識(shí)別中的文字識(shí)別的原理對(duì)分類器的具體實(shí)現(xiàn)做了詳細(xì)剖析列舉常見的文字識(shí)別方法對(duì)于文字識(shí)別的前景與挑戰(zhàn)的分析

第3章文字識(shí)別技術(shù)3.1-3.3

文字是人類相互交流信息的重要工具。社會(huì)發(fā)展進(jìn)入信息時(shí)代,人們已經(jīng)不再停留在自己的耳朵和眼睛去直接獲得這些信息,而是使用計(jì)算機(jī)將文字自動(dòng)的輸入計(jì)算機(jī),用計(jì)算機(jī)對(duì)他們進(jìn)行處理,隨時(shí)以各種方式滿足人們的不同需要。因此,研究如何用計(jì)算機(jī)自動(dòng)識(shí)別文字圖像,解決文字自動(dòng)輸入計(jì)算機(jī),并進(jìn)行高速加工處理的問題已引起大家的關(guān)注。通俗的說,文字識(shí)別就是由計(jì)算機(jī)自動(dòng)識(shí)別各種字符,如字母、數(shù)字、漢字或其他語言中的字符。文字識(shí)別有如下分類:根據(jù)識(shí)別對(duì)象的不同,文字識(shí)別可分為西文識(shí)別、數(shù)字識(shí)別和漢字識(shí)別等。這些字符可以是手寫體和印刷體,因此文字識(shí)別又可分為手寫體文字識(shí)別和印刷體文字識(shí)別。根據(jù)采用的輸入設(shè)備不同,文字識(shí)別可分為聯(lián)機(jī)識(shí)別和脫機(jī)識(shí)別。其中聯(lián)機(jī)識(shí)別是指將字符書寫在與計(jì)算機(jī)相連的書寫板上,由計(jì)算機(jī)根據(jù)字符的書寫軌跡進(jìn)行實(shí)時(shí)識(shí)別,因此聯(lián)機(jī)識(shí)別主要是針對(duì)手寫體而言的;脫機(jī)識(shí)別是指將字符書寫或打印在紙張上,用掃描儀或其他光電轉(zhuǎn)換裝置將其轉(zhuǎn)換成電信號(hào)輸入到計(jì)算機(jī)中,再由機(jī)器進(jìn)行識(shí)別。因此,脫機(jī)識(shí)別又稱為光學(xué)文字識(shí)別,即我們通常所說的OCR(OpticalCharacterRecognition)。限制性(Constrainted)和非限制性(Unconstrained)手寫體字符識(shí)別(或稱自由手寫體字符識(shí)別)。無論是聯(lián)機(jī)還是脫機(jī)手寫體字符識(shí)別,都經(jīng)歷了一個(gè)由限制性識(shí)別到非限制性識(shí)別的過程。目前,人類所使用的各種文字,絕大多數(shù)都只包含很小的字符集。如英文字符集由26個(gè)字母組成,俄文由32個(gè)字母組成,這些字母及其變化的不同組合構(gòu)成了具有不同含義的文字,是這類文字的基本組成部分。對(duì)于小類別數(shù)的字符集,如阿拉伯?dāng)?shù)字,手寫體識(shí)別已經(jīng)可以做到對(duì)書寫者不加任何限制。但對(duì)于大類別數(shù)的字符集,如漢字,還必須對(duì)書寫者施加某些限制,以保證較高的識(shí)別率。未來隨著技術(shù)的發(fā)展,將逐步放松限制,最終可以達(dá)到最自由手寫體文本的識(shí)別。文字識(shí)別系統(tǒng)的原理及組成文字識(shí)別屬于模式識(shí)別的范疇,模式這個(gè)概念的內(nèi)涵是很豐富的。“我們把凡是人類能用其感官直接或間接接受的外界信息都稱為模式”。比如:文字、圖片、景物、聲音、語言等;模式識(shí)別的目的就是要研究出能自動(dòng)進(jìn)行模式分類和描述的機(jī)器系統(tǒng),以完成人類的模式識(shí)別的功能。一個(gè)模式識(shí)別主要分為四個(gè)組成部分,其框圖如下:數(shù)據(jù)獲?。狠斎肽J睫D(zhuǎn)換成適合于機(jī)器處理的形式的過程。預(yù)處理的目的是去除噪聲,加強(qiáng)有用的信息,對(duì)由輸入設(shè)備或其他因素造成的退化現(xiàn)象進(jìn)行復(fù)原,以利于特征提取經(jīng)過預(yù)處理后的數(shù)據(jù)維數(shù)很高,為了有效地實(shí)現(xiàn)分類識(shí)別,需要對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映原始模式本質(zhì)的特征向量。把原始數(shù)據(jù)組成的空間叫做測(cè)量空間,把分類識(shí)別賴以進(jìn)行的空間叫做特征空間。通過變換可以把在維數(shù)較高的測(cè)量空間中表示的模式變?yōu)樵诰S數(shù)較低的特征空間中表示的模式,這就是特征的提取和選擇。分類決策是在特征空間中用所設(shè)計(jì)的分類器把被識(shí)別對(duì)象歸為某一類別。模式識(shí)別的過程具體化到文字識(shí)別系統(tǒng)中,則分為下面的幾個(gè)過程:光電變換檢測(cè)部分的主要功能,是對(duì)紙面上的文字進(jìn)行光電轉(zhuǎn)換,然后經(jīng)模數(shù)轉(zhuǎn)換成具有一定灰度的數(shù)字信號(hào),送往其后的各部分進(jìn)行處理和識(shí)別。常用的檢測(cè)設(shè)備是掃描儀,攝像頭等。灰度:灰度使用黑色調(diào)表示物體。每個(gè)灰度對(duì)象都具有從0%(白色)到100%(黑色)的亮度值。文字圖像分割的目的就是根據(jù)文字圖像的特征實(shí)現(xiàn)文字圖像區(qū)域的定位和分割,將真正的文字圖形分割出來,以便后續(xù)進(jìn)行識(shí)別。識(shí)別預(yù)處理部分的功能是將已分割出的文字圖形信息加以區(qū)分,去除信號(hào)中的污點(diǎn)、空白等噪聲,增強(qiáng)文字圖像的信息。并根據(jù)一定的準(zhǔn)則除掉一些非本質(zhì)信號(hào),對(duì)文字的大小、位置和筆畫粗細(xì)等進(jìn)行規(guī)范化,以便簡(jiǎn)化判斷部分的復(fù)雜性。特征提取部分是從整形和規(guī)范化的信號(hào)中抽取反映字符本身的有用信息,供識(shí)別部分進(jìn)行識(shí)別。作為特征提取的內(nèi)容是比較多的,可以是幾何特征,如文字線條的端點(diǎn)、折點(diǎn)和交點(diǎn)等。識(shí)別判斷部分則是根據(jù)抽取的特征,運(yùn)用一定的識(shí)別原理,對(duì)文字進(jìn)行分類,確定其屬性,達(dá)到識(shí)別的目的,實(shí)際上判斷部分就是一個(gè)分類器?!み@邊東西有點(diǎn)多,到word里邊去看脫機(jī)識(shí)別概述由于有些場(chǎng)合,不能采用書寫板等專用的輸入設(shè)備輸入文字,或文字信息已經(jīng)存在,如果要利用計(jì)算機(jī)進(jìn)行文字識(shí)別,就只能進(jìn)行脫機(jī)識(shí)別。OCR概念

OCR技術(shù)是光學(xué)字符識(shí)別(OpticalCharacterRecognition)的縮寫,是通過掃描等光學(xué)輸入方式將各種票據(jù)、報(bào)刊、書籍、文稿及其它印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識(shí)別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計(jì)算機(jī)輸入技術(shù)。脫機(jī)手寫體字符識(shí)別系統(tǒng)結(jié)構(gòu)待識(shí)別文檔掃描儀或數(shù)碼相機(jī)灰度圖或二值圖預(yù)處理預(yù)處理圖像版面分析文字塊圖像行分割文字行圖像字符分割單一字符圖像識(shí)別單詞后處理修正后的單詞結(jié)果字符特征特征提取圖像的輸入原始文稿通過光電掃描儀或數(shù)碼相機(jī)等輸入設(shè)備轉(zhuǎn)換成原始的二維圖像信號(hào),可以是彩色圖像、灰度圖像(grayscaleimage)或二值圖像(binaryimage)。這個(gè)模塊僅僅需要的是在獲取圖像過程中,盡可能的保證原始文稿的二維圖像有比較好的質(zhì)量,從而有利于后面識(shí)別模塊的識(shí)別。預(yù)處理預(yù)處理是脫機(jī)手寫識(shí)別系統(tǒng)中需要解決問題最多的一個(gè)模塊。預(yù)處理通常包括以下幾個(gè)過程:1、二值化2、消除干擾3、細(xì)化原圖像二值化細(xì)化版面分析

版面分析與理解是文字識(shí)別的前處理技術(shù)之一。它是利用圖像處理、人工智能等技術(shù)完成文檔圖像文件中的文字域的分揀工作。其難度取決于版面的復(fù)雜程度,是文字識(shí)別系統(tǒng)提高實(shí)用化水平的主要技術(shù)指標(biāo)之一。

1、圖像定位2、傾斜校正原圖像校正后字符的分割1、行切割對(duì)于輸入的二值化文字圖像,首先要逐行地把各文字行圖像切割出來,行切割的方法是:對(duì)二值化圖像從上到下逐行掃描并同時(shí)計(jì)算每個(gè)掃描行的像素,以獲取圖像的水平投影,根據(jù)水平投影值確定文字行的位置,利用文字行間空白間隔造成的水平投影空白間隙,即可將各行文字分割出來2、字切割

字切割是從行切割后得到的文字圖像中將單個(gè)漢字的圖像分割出來?;痉椒ㄊ抢米峙c字之間的空白間隙在圖像行垂直投影上形成的空白間隙將單個(gè)漢字的圖像切割開來。漢字的構(gòu)造決定了字切割是更為困難的文字歸一化1.位置歸一化

為了消除漢字點(diǎn)陣位置上的偏差,需要把整個(gè)漢字點(diǎn)陣圖形移動(dòng)到規(guī)定的位置上,這個(gè)過程被稱作為位置歸一化兩種方法:1、基于質(zhì)心的位置歸一化2、基于文字外邊框的位置歸一化2.大小歸一化對(duì)不同大小的文字做變換,使之成為同一尺寸大小的文字,這個(gè)過程被稱做大小歸一化。通過大小歸一化,許多特征就能夠用于識(shí)別不同字號(hào)混排的文字。兩種方法:1、將文字的外邊框按比例線性放大或縮小成為規(guī)定尺寸的文字

2、根據(jù)水平和垂直兩個(gè)方向文字黑像素的分布進(jìn)行大小歸一化特征提取

穩(wěn)定特征的抽取是整個(gè)識(shí)別系統(tǒng)的核心之一,它決定了識(shí)別系統(tǒng)的性能。用于脫機(jī)手寫字符識(shí)別的統(tǒng)計(jì)特征,根據(jù)特征抽取屈居的不同可粗略地分為全局統(tǒng)計(jì)特征和局部統(tǒng)計(jì)特征兩大類。全局統(tǒng)計(jì)特征是將整個(gè)漢字點(diǎn)陣作為研究對(duì)象,從整體上抽取特征。

局部統(tǒng)計(jì)特征是將字符點(diǎn)陣圖像分割成不同區(qū)域或網(wǎng)絡(luò),在各個(gè)小區(qū)域內(nèi)分別抽取統(tǒng)計(jì)特征識(shí)別識(shí)別也即分類器的設(shè)計(jì),良好性能的分類器的設(shè)計(jì)也是整個(gè)識(shí)別系統(tǒng)的核心之一,它直接決定了識(shí)別系統(tǒng)的性能。

識(shí)別的方法很多,多方案集成是近年來文字識(shí)別領(lǐng)域的一個(gè)主要研究方向,任何一種特征、任何一種識(shí)別方法都有其優(yōu)點(diǎn)和局限性,借鑒印刷體字符識(shí)別的成功經(jīng)驗(yàn),走多特征融合、多方案集成的道路,是脫機(jī)字符識(shí)別系統(tǒng)走向?qū)嵱没挠行緩?。?lián)機(jī)識(shí)別

聯(lián)機(jī)識(shí)別是指將字符書寫在與計(jì)算機(jī)相連的書寫板上,由計(jì)算機(jī)根據(jù)字符的書寫軌跡進(jìn)行實(shí)時(shí)識(shí)別,因此聯(lián)機(jī)識(shí)別主要是針對(duì)手寫體而言的;手寫識(shí)別能夠使用戶按照最自然、最方便的輸入方式進(jìn)行文字輸入,易學(xué)易用,可取代鍵盤或者鼠標(biāo)。用于手寫輸入的設(shè)備有許多種,比如電磁感應(yīng)手寫板、壓感式手寫板、觸摸屏、觸控板、超聲波筆等。

手寫識(shí)別,是指將在手寫設(shè)備上書寫時(shí)產(chǎn)生的有序軌跡信息化轉(zhuǎn)化為漢字內(nèi)碼的過程,實(shí)際上是手寫軌跡的坐標(biāo)序列到漢字的內(nèi)碼的一個(gè)映射過程,是人機(jī)交互最自然、最方便的手段之一。聯(lián)機(jī)手寫識(shí)別是指將在手寫設(shè)備上書寫時(shí)產(chǎn)生的有序軌跡信息轉(zhuǎn)化為漢字內(nèi)碼的過程,實(shí)際上是手寫軌跡的坐標(biāo)序列到漢字內(nèi)碼的一個(gè)映射過程。后處理文本識(shí)別后處理是指對(duì)單字識(shí)別的結(jié)果,利用詞義、語義等上下文先驗(yàn)信息進(jìn)行識(shí)別結(jié)果的確認(rèn)或糾錯(cuò)。通常,在識(shí)別實(shí)際文本時(shí),需要對(duì)單字識(shí)別的結(jié)果進(jìn)行基于上下文關(guān)系的識(shí)別后處理。利用后處理技術(shù),應(yīng)該能夠?qū)崿F(xiàn)對(duì)單字識(shí)別結(jié)果的確認(rèn)或糾錯(cuò),并進(jìn)一步區(qū)分相似字。手寫識(shí)別中存在的問題及困難

由于手寫變形的存在,使得手寫體中相似字符的區(qū)分比印刷

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論