




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、西南科技大學專業(yè)方向設(shè)計報告課程名稱:專業(yè)方向設(shè)計設(shè)計名稱:基于圖像的字符識別設(shè)計名:學號:班級:電子0801指導教師:起止日期:西南科技大學信息工程學院制 圖1 方向設(shè)計任務(wù)書學生班級:電子0801學生姓名:謝輝林學號:20084685設(shè)計名稱:基于圖像的字符識別設(shè)計起止日期:指導教師:王學淵設(shè)計要求:本題目是針對文字圖像進行計算機圖像處理,應(yīng)用c語言或matlab語言進行軟件編程形成應(yīng)用程序界面,對邊緣檢測、特征提取等算法上進行優(yōu)化。從而對文字圖像實現(xiàn)分析、識別和提取說明:對圖片中的漢字,數(shù)字與字母應(yīng)用模板匹配法進行識別,主要用到特征提取,模板相減法進行識別。方向設(shè)計學生日志時間設(shè)計內(nèi)容2
2、011.12.25分析設(shè)計題目,查詢相關(guān)資料2011.12.26學習設(shè)計將會用到的材料以及熟悉應(yīng)用軟件2011.12.28分析設(shè)計原理和步驟,并初步開始進行編程調(diào)試2011.12.29修改程序錯誤,反復糾正2011.12.30完成設(shè)計報告基于圖像的字符識別設(shè)計摘要許多文檔是以紙質(zhì)文檔的形式存在,例如銀行票據(jù)、稅務(wù)報表、標準化考試中的機讀卡、人口普查表、彩標投注單、選票、定貨單等。紙質(zhì)文檔不便于保存、檢索、統(tǒng)計和修改,而將這些信息錄入計算機是一件非常繁瑣的事情。長期以來人們通過鍵盤手工輸入,不但費時費力且容易出錯。在實時性要求較高的場合自動、快速、準確地處理文檔顯得尤為重要。因此,對這些文檔進行
3、計算機自動錄入具有重要的現(xiàn)實意義。本課題研究了字符圖像的計算機識別問題,系統(tǒng)針對每種字符各自的特點,通過對字符的預處理,提取字符本身特征,然后運用特定的匹配識別算法,實現(xiàn)了字符圖像的自動識別。二、設(shè)計目的和意義(1)目的通過編程設(shè)計能夠?qū)D像中的漢字、數(shù)字與字母進行識別并輸出識別結(jié)果,了解此次設(shè)計應(yīng)用到的基本原理以及相關(guān)算法,能夠得出較高的識別率,學會如何結(jié)合軟件編程來對基于圖像的字符進行識別。(2)意義通過對圖像進行處理并進行識別,能夠幫助熟悉圖像處理的相關(guān)方法,同時也能加強對字符識別算法的研究,學會利用特征提取和模板匹配的方法進行字符識別,完成相關(guān)設(shè)計的研究。三、設(shè)計原理整個設(shè)計的基本流程
4、框架圖如下所示由以上基本原理圖可以看出,先要對待識別的圖像進行預處理,把字符圖像處理成能利于便于后續(xù)工作用。此次設(shè)計中,主要是利用對漢字、數(shù)字與字母進行邊緣檢測、特征提取的方法,最后再與標準模板進行比較相匹配,得出正確的處理結(jié)果,成功地識別出待識別字符。四、詳細設(shè)計步驟1圖像預處理圖像預處理是對輸入的圖像進行一系列變換處理,使之成為符合字符識別模塊要求的圖像。圖像預處理環(huán)節(jié)對于最終識別的正確率有很大影響,由于圖像本身受到各種自然因素或設(shè)備因素的影響,圖像的清晰度往往不是很理想,有時還會帶有較明顯的圖像噪聲。若不對圖像進行預處理,這些噪聲將給后續(xù)的識別模塊帶來嚴重影響,最終可能造成識別錯誤。因此
5、,預處理的好壞一定程度上影響到字符識別的正確率。圖像預處理首先需要將待識別的字符從輸入的灰度圖中分離出來。最常用的方法就是圖像二值化。所謂圖像二值化就是指將灰度圖轉(zhuǎn)化為只含有兩種灰度值的圖像,一種為背景,另一種為待識別的字符。這就需要找出一個合適的閾值1,將背景與字符良好地區(qū)分。其數(shù)學表達式如下:其中th為二值化的域值。通過二值化處理,雖然可以去除或減輕部分噪聲,但不能完全濾除。本文采用二值形態(tài)學的基本運算來去除這些圖像中殘留的噪聲。首先對圖像進行閉合運算,可以濾除字符中的黑色噪聲;然后再對圖像進行開啟運算,這樣可以濾除背景中的白色噪聲。至此獲得的圖像已基本滿足識別模塊的要求,為了使識別模塊具
6、有統(tǒng)一的評判標準,需對輸入的圖像進行插值運算,使其擁有相同的尺寸。這樣才能使提取出來的特征量具有良好的區(qū)分能力。圖像經(jīng)過上述步驟處理后,已經(jīng)從帶有噪聲的灰度圖像轉(zhuǎn)變?yōu)榉献R別要求的圖像。該圖像為只包含兩種灰度值的二值圖像,并且具有統(tǒng)一尺寸。而且在預處理環(huán)節(jié)中,已最大限度地去除了輸入圖像中的噪聲,在保持字符原本信息不丟失的前提下,把待識別的字符從背景中成功地分離出來。2字符提取字符包括漢字字符、英文字符以及阿拉伯數(shù)字字符,不同的字符有不同的特征,對其進行快速而高效地分類,有助于系統(tǒng)對其做出正確的識別。同時高效的分類,可以大大縮小下一步模板匹配的字符范圍,進一步提升系統(tǒng)的識別速度。本系統(tǒng)首先可將字
7、符分為兩大類:漢字字符和英文數(shù)字字符。本文通過對字符中的像素塊個數(shù)區(qū)分漢字字符與英文數(shù)字字符。對于像素塊的定義如下,二值圖像中上、下、左,右四個方向上相互連通的所有白色象素點所組成一個連通區(qū)域為一個像素塊。由此可知,所有的英文字符和數(shù)字字符的像素塊數(shù)均為1,像素塊數(shù)大于1的均為漢字字符。(1)英文字符字字符進行進一步地分類,將每個待識別字符的匹配范圍盡可能地縮小,已降低識別 所需的時間。其具體特征量如下:字符的輪廓數(shù)。字符的輪廓可以通過圖像的相減來獲得。通過該特征量可把字符分為三大類:一個輪廓,如:1,C;兩個輪廓,如:4,A;三個輪廓,如:8,B。字符輪廓的形狀。每個字符輪廓的變化蘊含著大量
8、的信息,通過對這些信息的提取更有利于對其的分類。本文通過對待識別字符的左右邊緣部分進行投影的方法來對其輪廓進行分類。首先提取字符圖像左右各四分之一的兩個邊緣。然后對其進行橫向投影,字符邊緣投影的信息可用一個一維數(shù)組來描述,數(shù)組的長度為圖像高度的兩倍,分別用于記錄圖像的左右邊緣信息。按此分類可以粗略的劃分為:字符左右輪廓對稱,如:1,8,M,H;左上部分無字符信息,如:4,J;左下部分無字符信息,如:7,T;右上部分無字符信息,如:L;右下部分無字符信息,如:P,V,W;左側(cè)有長豎線,如:B,D,K;以及其他各種條件。(2)漢字字符對于漢字字符也可以按照其字符結(jié)構(gòu)特征進行分類。漢字擁有其獨特的字
9、符結(jié)構(gòu),因此這也是特征量提取的重要依據(jù)。字符投影。對漢字字符進行水平和垂直投影可以明顯的區(qū)分出漢字的結(jié)構(gòu),判斷其投影零點的位置,可進一步縮小漢字字符的范圍。如:貴,京屬于上下結(jié)構(gòu)。漢字字符垂直投影原理及分類與水平投影類似,可以提取字符左右結(jié)構(gòu)的信息,如:川,滬。字符像素塊個數(shù)。通過計算每個字符的像素塊個數(shù),對漢字字符進行區(qū)分。兩個像素塊,如:云;三個像素塊,如:川;四個像素塊,如:京;以及其他。字符輪廓的形狀。本環(huán)節(jié)通過提取漢字字符中邊緣信息對漢字進行分類。其具體方法同數(shù)字字符的輪廓信息分類方法根據(jù)漢字的對稱性,可分為輪廓對稱,如:冀,黑,貴;對于其他的復雜輪廓無法用單一的條件進行區(qū)分,需對投
10、影分析后進行分類。此外,對字符進行分組時是有冗余的,即系統(tǒng)中并非每個字符只分到其中某一組中,而是分到符合特征要求的若干組中。這樣的冗余可以避免分組偏差所帶來的識別錯誤。在對字符進行提取時,具體可以用投影的方法來處理。具體方法如下:對單行字符圖像作垂直投影,統(tǒng)計每一列的邊緣點數(shù),再以全圖像列平均邊緣點數(shù)為準則提取所有位于該值之上的投影峰;搜索相鄰投影峰問的距離,如果小于一定距離就并入同一個區(qū)域;如果一個區(qū)域內(nèi),至少包含了規(guī)定數(shù)量的投影峰,那么該區(qū)域加上一定量的冗余就是字符所在的水平范圍。根據(jù)水平范圍縮小圖像,再一次計算全圖像列平均邊緣點數(shù)瓦,以某閾值提取垂直投影中的峰值區(qū)域,取相鄰峰間的最小值作
11、為分界線;然后再配合字符問距、最小列投影數(shù)等參數(shù)加以調(diào)整,完成對每一字符的劃分。搜索各個字符最上、最下,最左、最右的象素點,確定字符邊界。整個基本特征提取方法即為上所述,通過對字符的特征提取分類,以便接下來進行對其的模板匹配,以及正確識別。3.模板匹配進行模板匹配前需要進行字符特征庫的建立,采集相關(guān)資料建立一個比較完善盡可能容量大的標準模板庫,以便對待測字符進行比較匹配。字符特征量的提取主要針對的是對字符的個體特征,但是對于某些字符對于一些特征量具有一定程度的相似性,因此必須對相似的具有某一類特征量的字符再進行進一步的模板匹配,利用字符的整體特征來提高系統(tǒng)的識別正確率。模板匹配方法是實現(xiàn)離散輸
12、入模式分類的有效途徑之一,其實質(zhì)是度量輸入模式與樣本之間的某種相似性,取相似性最大者為輸入模式所屬類別。它根據(jù)字符的直觀形象抽取特征,用相關(guān)匹配原理進行識別,即是將輸入字符與標準字符在一個分類器中進行匹配。模板匹配法有兩種:一種是不進行特征提取,直接將字符點陣與模板進行匹配;一種是進行特征提取后與模板匹配。模板匹配法根據(jù)建模時所取特征的不同,有圖形匹配、筆劃分析、幾何特征抽取等幾種形式。圖形匹配法在建模和匹配比較時,都是基于字符的圖形塊本身而進行匹配,并根據(jù)其相似程度而得出識別結(jié)果。有一些字母與數(shù)字形狀和結(jié)構(gòu)很相似,在出現(xiàn)筆劃斷裂、粘連和模糊不清的情況時,僅進行模板匹配可能會造成誤判斷,需要對
13、其進行二次識別。為此,有學者采用特征點匹配法加以快速區(qū)分:特征點識別字符是先對待識別字符進行關(guān)鍵點提取,即對字符進行拓撲分析以得到字符邊緣的關(guān)鍵點,再確定字符的分類。特征點匹配法具有快速、準確、計算冗余量小的特點。但用特征點匹配法進行檢測,對字符分割要求較高,統(tǒng)計量大,特征點的完備性也很難保證。將模板匹配與特征點匹配相結(jié)合的方法,既利用了模板匹配的簡單快捷,又利用特征點匹配對傳統(tǒng)的模板匹配方法進行了改進,改善了傳統(tǒng)模板匹配方法對圖像質(zhì)量要求很高,對于斷裂和粘連筆劃容易產(chǎn)生錯誤結(jié)論的情況,使得正確率和適應(yīng)性都得到了提高。模板匹配傳統(tǒng)的做法是取標準模板為二值圖像模板(字符為1象素,背景為0象素),
14、同時標準化后得到的圖像也是字符為1,背景為0的二值圖像。匹配是以建立在二值圖像基礎(chǔ)上的一種距離或相似函數(shù)經(jīng)閾值處理后的值作為判據(jù)準則,即將輸入的字符直接與模板庫中模板逐個比較,將具有最大相似度的字符作為識別結(jié)果。在提取圖像信息之前,沿字符外圍矩形輪廓進行切割,使字符充滿整個圖像。需對邊緣進行檢測,為了消除字符點陣位置上的偏差,需要對字符圖像進行歸一化。縮放過程可以用雙線性插值或者高階插值等圖像處理的方法,本文采用基于按比例線性縮放的歸一化方法,將待識別字符歸一化為16x32大小(可根據(jù)實際情況進行更改)的標準尺寸,其中灰度0代表背景,灰度1代表字符。歸一化有效地避免了字符沒有位于攝像頭的垂直方
15、向,側(cè)視帶來的水平偏差。一般對于尺寸均為,IxJ的字符圖X和模板Pk,相似度公式采用如下形式:$二這刃戈(門)5G川)/(0t-i尸1/.-Ij=i此外,上述方法容易受到筆畫粗細、字符傾斜等因素影響,結(jié)果不太穩(wěn)定。為此,可引入距離變換,使最大相似度與第二相似度的差值變大,從而提高識別率。距離變換是二值圖像的一種操作,結(jié)果是將一幅二值圖像轉(zhuǎn)化為一幅灰度圖像,每個象素的灰度級與該象素到其最近背景點的距離成正比。從理論上講。要計算一個象素點到背景象素點的最短距離,需要對圖像進行全局操作運算,即計算此象素點與所有背景象素點的距離,再取最小值。用X代表二值圖像中前景點集合,Xc代表背景點集合,/代表輸出
16、灰度圖,貝V:/何二min(滄城芯y)|jeXxeX除非數(shù)字圖像的尺寸非常小,不然這種全局操作的計算量將非常大。實際運用中的距離變換是從鄰近象素點入手,根據(jù)全局距離是在局部距離按比例疊加而成的原理,每次只計算與局部相鄰的幾個象素點距離,并取最小值。局部相鄰點的距離可采用各種距離模板,考慮到精度和速度的要求,一般常采用3x3或者5x5模板等。對二值圖X實現(xiàn)距離轉(zhuǎn)換的大致流程如下:(1)根據(jù)二值圖X,初始化輸出圖像將所有背景點的灰度取為零,前景點灰度取一個大于最大距離的值(max)。0嚴丈max,rg從上到下,從左到右對圖像進行掃描。參照距離模板,對每一個非零點x利用各鄰域y的灰度值計算自己的灰度
17、:式中ti是距離模板中對應(yīng)鄰域點y的數(shù)值,Nx是點x的鄰域點集合。從下到上,從右到左對圖像廠進行掃描。參照距離模板,對每一個菲零點X利用各鄰域點的灰度(距離)值計算自己的灰度。重復計算,直到輸出穩(wěn)定(其實一般只需循環(huán)二、三次即可)。這種算法計算速度快,為求取距離灰度圖提供了基礎(chǔ)。模板匹配改進算法如下:采用合適的距離模板,通過距離變換將二值圖像轉(zhuǎn)化為距離灰度圖,然后在距離灰度圖上進行相似度匹配。該方法的特點在于相似度不但與相同點數(shù)、差異點數(shù)有關(guān)外,還與差異點的空間相關(guān)性有關(guān)。比較待識別字符和所有模板的相似度,搜索尋找最大相似度。如果該值大于閾值,判斷識別出的字符是否是易誤識字符。如果是,那么就進
18、行筆畫分析。在設(shè)計模板時,根據(jù)標號機最常見的錯誤,將模板圖中的字符分為若干個連通區(qū)域,標以不同的灰度加以區(qū)別;通過分析待定字符在各個連通區(qū)域內(nèi)的分布情況,如匹配度大小、是否連通、筆畫寬度等,得到結(jié)果。如果不是,則直接輸出識別結(jié)果。五、設(shè)計結(jié)果及分析經(jīng)過編程在MATLAB中運行調(diào)試,結(jié)果如下:其中待識別字符是:S識別結(jié)果:S3Fiaure2-1FiEcVi.IrsToDeslWii旦E、匚ommandMndow匚ommandMndow # -M?K鶴入要識別的圉片容胃援回豐點認為a.ti:s.iPE鞘入諛別的字歸禰:歆回車班偽耶:輸入堡片中包含的宇符第,直竣回車黯認為Eng;要陰忡文踐文餓回車為
19、英文,訥任意討為中文:專舊別的5hA約是?亙接回車則交給程耳甘阜:正在胎.正在分圻連通甜正在組合宇符正在收集詡集中各詡的二值圈翩據(jù)正柱訃當相關(guān)度.-.正在匹配,.訐克翡果如下:A由上圖結(jié)果可以看出,識別成功,此程序的運行結(jié)果表示已經(jīng)正確識別出了圖像中的字符s。對字符特征的提取比較成功,對字符信息的分析和匹配輸出也比較成功,在識別過程中的工作量比較適中,比較理想。但又經(jīng)過幾次其它的字符識別調(diào)試,發(fā)現(xiàn)大部分可以比較正確地識別出來,但仍然有部分不能正確識別,可知程序不盡完善,識別率達不到百分之百,還有待改進的地方和算法,盡量提高識別率。這一方面是識別算法和處理細節(jié)不夠完美,另一方面是標準數(shù)據(jù)模板庫不
20、夠大未綜合多方面數(shù)據(jù),不夠囊括多種識別情形。所以結(jié)果帶有一定的模糊性,對灰度圖像的識別處理需要從更細節(jié)的地方著手,以便提高結(jié)果的正確率。六、總結(jié)圖像字符檢測識別可以快速獲取大量信息,易于進行各種處理應(yīng)用,而對字符的識別的算法方法有很多,盡可能好的方法能夠有助于準確識別漢字、數(shù)字和字母,得到正確的信息。從整個設(shè)計過程來看,先對輸入的待識別字符進行預處理,然后進行特征提取分類處理,最終再進行模板匹配,識別成功的則輸出識別結(jié)果。對于分組中沒有滿足特定要求的模糊字符圖像以及分組識別不成功的字符圖像,需要再進行一次全字符的模板匹配,這樣可以確保系統(tǒng)整體的識別正確率,但識別速度會受影響。在測試環(huán)節(jié)中,分組失敗及識別失敗圖像的概率比較小,整體
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 提升社區(qū)服務(wù)效率的策略計劃
- 小學機器人編程課 1.《抽油機》活動教學設(shè)計
- 人教版初中歷史與社會七年級上冊 1.2 .1鄉(xiāng)村聚落教學設(shè)計
- 員工參與感與歸屬感提升計劃
- 音樂家的新年個人工作計劃
- 2025年美術(shù)《烏龜》標準教案
- 藝術(shù)行業(yè):平面設(shè)計師求職信簡歷
- 2025年籃球運球教學標準教案
- 三病母嬰阻斷知識
- 2025年南平貨運從業(yè)資格證考試模擬
- 2024年《網(wǎng)絡(luò)反不正當競爭暫行規(guī)定》重點解讀
- 運動解剖學(李世昌主編,第二版)-緒論
- 護理團體標準解讀-成人氧氣吸入療法護理
- 水利工程冬季施工方案及注意事項
- 2024屆陜西省西安地區(qū)高考模擬英語試題試卷含解析
- 幼兒園運動晨間鍛煉
- 2024年中鐵十一局集團限公司招聘公開引進高層次人才和急需緊缺人才筆試參考題庫(共500題)答案詳解版
- 2024年廣東深圳市龍崗坂田街道招考綜合網(wǎng)格員招聘筆試沖刺題(帶答案解析)
- 人力資源外包投標方案
- 利那洛肽治療便秘病例
- 2024年上海市楊浦區(qū)高三二模英語試卷及答案
評論
0/150
提交評論