基于并行bp神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別_第1頁
基于并行bp神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別_第2頁
基于并行bp神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基于并行bp神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別

雖然只有10個(gè)手寫符號(hào),但它的構(gòu)圖是構(gòu)成其他符號(hào)的基礎(chǔ)。因此,識(shí)別方法可以擴(kuò)展到復(fù)雜單詞的識(shí)別。同時(shí),手寫數(shù)字識(shí)別系統(tǒng)也有實(shí)際應(yīng)用,如編碼、發(fā)票處理等。這些應(yīng)用程序?qū)ψR(shí)別的精度有很高的要求。因此,除了識(shí)別手寫符號(hào)以外的數(shù)字外,對(duì)手寫符號(hào)的研究還有實(shí)際應(yīng)用。由于神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)、容錯(cuò)性、分類能力強(qiáng)和并行處理等特點(diǎn),對(duì)于識(shí)別手寫體數(shù)字來說,采用神經(jīng)網(wǎng)絡(luò)是有效的手段.PawlickiTF曾做過多層BP等多種神經(jīng)網(wǎng)絡(luò)用于識(shí)別手寫體數(shù)字的試驗(yàn),在比較試驗(yàn)結(jié)果后,證實(shí)多層BP網(wǎng)絡(luò)的分類能力要比其他幾種網(wǎng)絡(luò)好.多層BP網(wǎng)絡(luò)用于識(shí)別手寫體數(shù)字可以采用兩種形式:一種是通過一些算法,抽取字符特征,然后將一組特征值輸入網(wǎng)絡(luò),利用神經(jīng)網(wǎng)絡(luò)對(duì)特征分類,達(dá)到識(shí)別字符的目的,這也叫作特征輸入網(wǎng)絡(luò),它僅起分類作用;另一種是點(diǎn)陣(0,1點(diǎn)陣)直接輸入網(wǎng)絡(luò)利用網(wǎng)絡(luò)來抽取特征并進(jìn)行分類,這也叫作點(diǎn)陣輸入網(wǎng)絡(luò).研究證明:對(duì)于識(shí)別手寫體數(shù)字,特征輸入網(wǎng)絡(luò)要比點(diǎn)陣輸入網(wǎng)絡(luò)效果好,但特征輸入網(wǎng)絡(luò)的識(shí)別效果要取決于特征集的完備性,而要得到一個(gè)相對(duì)完備的特征集是非常困難的,要用大量算法并且消耗很多時(shí)間.1手寫體數(shù)字識(shí)別系統(tǒng)的結(jié)構(gòu)及流程基于神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識(shí)別系統(tǒng)大致可以分為輸入、預(yù)處理、特征提取、神經(jīng)網(wǎng)絡(luò)識(shí)別4個(gè)部分.輸入包括數(shù)字樣本集掃描輸入和待識(shí)別數(shù)字輸入,先用數(shù)字樣本集掃描輸入圖像經(jīng)預(yù)處理后特征提取的特征向量來訓(xùn)練神經(jīng)網(wǎng)絡(luò),再用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)來識(shí)別待識(shí)別數(shù)字.預(yù)處理部分包括二值化、行字切分、平滑、去噪、細(xì)化,再對(duì)預(yù)處理后二值點(diǎn)陣圖像進(jìn)行特征提取,所提取的特征量如下節(jié)所示.最后將所提取的特征量輸入訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,輸出識(shí)別結(jié)果.基于神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識(shí)別系統(tǒng)的結(jié)構(gòu)及流程如圖1所示.2本文在此基礎(chǔ)上提出了基于手動(dòng)結(jié)構(gòu)的數(shù)字幾何結(jié)構(gòu)的資源提取技術(shù)2.1文本圖像的數(shù)字化進(jìn)行特征提取前先對(duì)手寫數(shù)字進(jìn)行了二值化、行字切分、平滑、去噪聲、規(guī)范化(歸一化)和細(xì)化等預(yù)處理,然后對(duì)其進(jìn)行特征提取.二值化采用全局閾值法.全局閾值法根據(jù)文本圖像的直方圖或灰度的空間分布確定一個(gè)閾值,并根據(jù)此閾值實(shí)現(xiàn)灰度文本圖像到二值化文本圖像的轉(zhuǎn)化.行字切分采用投影法.圖像點(diǎn)陣區(qū)域進(jìn)行行(X軸)、列(Y軸)方向上的投影,分別得到橫向和縱向的黑像素的統(tǒng)計(jì)直方圖.字符點(diǎn)陣區(qū)域在直方圖上呈現(xiàn)出波峰狀,而字符間的空隙在直方圖上呈現(xiàn)出波谷狀.圖像的細(xì)化操作采用模板匹配的方法,針對(duì)當(dāng)前處理的像素點(diǎn)逐個(gè)與預(yù)設(shè)的模板比較,從而確定當(dāng)前點(diǎn)的狀態(tài).歸一化可分為線性歸一和非線性歸一兩種方法.需要采用線性歸一化.線性歸一化就是將文字圖像按比例線性放大或縮小為同一尺寸,算法簡單,失真較小.2.2數(shù)字特征—特征選擇特征選擇是至關(guān)重要的,其好壞決定著網(wǎng)絡(luò)的規(guī)模與最終識(shí)別的效果,因此所選用的特征必須能充分反映字符的本質(zhì)特征.對(duì)于手寫體數(shù)字,所選用的特征提取方法對(duì)不同書寫者造成的差異必須有較強(qiáng)的適應(yīng)能力.數(shù)字是由弧線和直線構(gòu)成的,弧線的彎曲方向和程度不同,字符形狀不同.但同一類不同形狀的字符,它的端點(diǎn)數(shù)及其方向,凸點(diǎn)數(shù)及其方向,三點(diǎn)數(shù)和四叉點(diǎn)數(shù)基本上是穩(wěn)定的,而這些特征反映了數(shù)字的結(jié)構(gòu),是數(shù)字的重要特征.這里所采用的特征是:(1)端點(diǎn)數(shù),端點(diǎn)方向及其位置;(2)凸點(diǎn)數(shù),凸點(diǎn)方向及其位置;(3)三叉點(diǎn)位置;(4)四叉點(diǎn)位置.設(shè)數(shù)字最多有4個(gè)端點(diǎn),6個(gè)凸點(diǎn),1個(gè)三叉點(diǎn),1個(gè)四叉點(diǎn),這樣形成24個(gè)特征.2.3d0是端點(diǎn)三叉點(diǎn)特征的提取是沿著輪廓點(diǎn)掃描的辦法來實(shí)現(xiàn)的,起始點(diǎn)是按行掃描從上至下掃描找到的第一個(gè)特征點(diǎn).為此,把被處理點(diǎn)d0連同它周圍的8個(gè)點(diǎn)構(gòu)成1個(gè)9點(diǎn)輔助陣,如圖2.當(dāng)處理點(diǎn)d0=1時(shí),計(jì)算k=d1+d2+d3+d4+d5+d6+d7+d8.若k=1時(shí),則d0是端點(diǎn),其中有端點(diǎn)記為1,無端點(diǎn)記為0;k=2時(shí),d0是一般連點(diǎn)或凸點(diǎn);k=3時(shí),d0是三叉點(diǎn);k=4時(shí),d0是四叉點(diǎn).凸點(diǎn)是弧線段與垂直線的切點(diǎn).根據(jù)弧線段與切線的相對(duì)位置,可將凸分為左凸點(diǎn)和右凸點(diǎn)兩類.若切線段在弧線左邊,則為左凸點(diǎn);切線段在弧線右邊,則為右凸點(diǎn).其中左凸點(diǎn)記為1,右凸點(diǎn)記為1/2,無凸點(diǎn)記為0.如圖3特征點(diǎn)相對(duì)于字符的位置,我們是根據(jù)字符大小選擇一個(gè)窗.這個(gè)窗剛好能框住字符,然后將這個(gè)窗分為16個(gè)小窗.所謂特征點(diǎn)的位置就是指特征點(diǎn)位于哪一個(gè)小窗內(nèi),各個(gè)小窗的位置編碼如圖4所示.3同的類別處理采用多層BP網(wǎng)來訓(xùn)練手寫體數(shù)字,為了訓(xùn)練時(shí)收斂速度快且效果比較好,先采用了10個(gè)并行的單輸出BP網(wǎng),每個(gè)網(wǎng)絡(luò)對(duì)應(yīng)一個(gè)數(shù)字.但是為了提高網(wǎng)絡(luò)識(shí)別精度,對(duì)于同一個(gè)數(shù)字的多種不同手寫體,如果形體差別(特指特征量)比較大的,在用神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別的時(shí)候,先作為不同的類別來處理,因而,需要增加并行的單輸出BP網(wǎng)的個(gè)數(shù),這里只對(duì)數(shù)字2和數(shù)字4的兩個(gè)差別比較大的字體進(jìn)行分辨,因此單輸出BP網(wǎng)的個(gè)數(shù)增加至12個(gè).對(duì)這12個(gè)輸出結(jié)果,再用識(shí)別程序來識(shí)別出這10個(gè)數(shù)字.該BP網(wǎng)分為3層,其輸入層有14個(gè)輸入點(diǎn),分別對(duì)應(yīng)特征向量的14個(gè)分量,即1個(gè)端點(diǎn)數(shù)和4個(gè)端點(diǎn)位置,1個(gè)凸點(diǎn)數(shù)和6個(gè)凸點(diǎn)方向,1個(gè)三叉點(diǎn)位置和1個(gè)四叉點(diǎn)位置,其輸出層有1個(gè)輸出點(diǎn),它取值為,對(duì)應(yīng)該網(wǎng)絡(luò)與訓(xùn)練樣本是同一類別的,取值為1.0;否則取值為0.8,對(duì)應(yīng)各個(gè)數(shù)字隱含層節(jié)點(diǎn)數(shù)目的選擇是一個(gè)十分復(fù)雜的問題,到目前為止,還沒有用數(shù)學(xué)公式來明確表示應(yīng)該怎樣確定隱含層的節(jié)點(diǎn)數(shù)目.事實(shí)上,節(jié)點(diǎn)數(shù)目太少,可能訓(xùn)練不出來,或者訓(xùn)練的網(wǎng)絡(luò)不夠強(qiáng)壯,不能識(shí)別以前沒有看到的樣本,容錯(cuò)性差;但隱含層節(jié)點(diǎn)太多又導(dǎo)致學(xué)習(xí)訓(xùn)練時(shí)間太長,誤差

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論