神經(jīng)網(wǎng)絡(luò)在車牌字符識別中應(yīng)用_第1頁
神經(jīng)網(wǎng)絡(luò)在車牌字符識別中應(yīng)用_第2頁
神經(jīng)網(wǎng)絡(luò)在車牌字符識別中應(yīng)用_第3頁
神經(jīng)網(wǎng)絡(luò)在車牌字符識別中應(yīng)用_第4頁
神經(jīng)網(wǎng)絡(luò)在車牌字符識別中應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、神經(jīng)網(wǎng)絡(luò)在車牌字符識別中應(yīng)用摘要:近年來,以改進型BP網(wǎng)絡(luò)為代表的神經(jīng)網(wǎng)絡(luò)在模式識別、模式分類和模糊控制等領(lǐng)域得到廣泛應(yīng)用,它具有具有良好的自學(xué)習(xí)能力、強大的分類能力、容錯能力或魯棒性。本文將神經(jīng)網(wǎng)絡(luò)引入到車牌字符識別中來,先論述了基于神經(jīng)網(wǎng)絡(luò)圖像識別系統(tǒng)的理論;再結(jié)合車牌字符識別的特征提取法進行BP神經(jīng)網(wǎng)絡(luò)分類器的設(shè)計。關(guān)鍵詞:車牌字符;BP人工神經(jīng)網(wǎng)絡(luò);圖像識別;模式識別引言近年來,神經(jīng)網(wǎng)絡(luò)的智能化特征與能力使其應(yīng)用領(lǐng)域日益擴大,潛力日趨明顯。許多用傳統(tǒng)信息處理方法無法解決的問題采用神經(jīng)網(wǎng)絡(luò)后取得了良好的效果。其中,神經(jīng)網(wǎng)絡(luò)在車牌字符識別中的應(yīng)用效果尤為明顯。目前,車牌字符識別主要采用兩種

2、方法,即模式匹配法和神經(jīng)網(wǎng)絡(luò)法。由于神經(jīng)網(wǎng)絡(luò)模式識別方法能夠?qū)崿F(xiàn)基于計算理論層次上的模式識別理論所無法完成的模式信息處理工作,這種方法是選用適當(dāng)?shù)淖址麍D像特征提取方法,然后使用訓(xùn)練樣本訓(xùn)練網(wǎng)絡(luò)并構(gòu)建一個識別網(wǎng)絡(luò)作為分類器。所以,相信未來一段時期內(nèi)神經(jīng)網(wǎng)絡(luò)在車牌字符識別領(lǐng)域中的應(yīng)用還會是趨于主導(dǎo)地位。 1 人工神經(jīng)網(wǎng)絡(luò)簡介人工神經(jīng)網(wǎng)絡(luò)【1】(ARTIFICIAL NEURAL NETWORK ,ANN),亦稱為神經(jīng)網(wǎng)絡(luò),是對人腦或生物神經(jīng)網(wǎng)絡(luò)的抽象和建模,具有學(xué)習(xí)能力,以類似生物的交互方式適應(yīng)環(huán)境。神經(jīng)網(wǎng)絡(luò)是智能科學(xué)和計算智能的重要部分,為解決復(fù)雜問題和實現(xiàn)自動控制提供有效的途徑。1.1人工神經(jīng)

3、元人工神經(jīng)元是可以模擬生物神經(jīng)元的一階特性一輸人信號的加權(quán)和。神經(jīng)元在獲得網(wǎng)絡(luò)輸入后,它應(yīng)當(dāng)給出適當(dāng)?shù)妮敵觥0凑丈锷窠?jīng)元的特性,每個神經(jīng)元有一個閾值,當(dāng)輸入信號的累計效果超過閾值時,就處于激發(fā)態(tài);反之,則處于抑止態(tài)。為使系統(tǒng)有更寬的適用面,人工神經(jīng)元應(yīng)有一個更一般的變換函數(shù),用來變換所獲得的網(wǎng)絡(luò)輸入,這就是激活函數(shù)。將人工神經(jīng)元的基本模型和激活函數(shù)合在一起構(gòu)成人工神經(jīng)元。一個典型的人工神經(jīng)元【1】模型如圖1:圖1 典型人工神經(jīng)元模型2 反向傳播網(wǎng)絡(luò)反向傳播網(wǎng)絡(luò)(BP網(wǎng)絡(luò))是一種多層前饋網(wǎng)絡(luò),它是神經(jīng)網(wǎng)絡(luò)的重要一類,一直是神經(jīng)網(wǎng)絡(luò)中最為流行的神經(jīng)計算模型,得到了極其廣泛的應(yīng)用。反向傳播網(wǎng)絡(luò)有以

4、下三個突出的特點。1.網(wǎng)絡(luò)中的每個神經(jīng)元模型包括一個非線性激活函數(shù)。2.網(wǎng)絡(luò)包括一層或多層神經(jīng)元的隱層,這些隱層神經(jīng)元逐步從輸入模式(向量)中提取更多的有用特征,可以是網(wǎng)絡(luò)學(xué)習(xí)復(fù)雜的任務(wù)。3.網(wǎng)絡(luò)的連接強度由網(wǎng)絡(luò)突觸決定。2.1 反向傳播網(wǎng)絡(luò)的結(jié)構(gòu)反向傳播網(wǎng)絡(luò)實際上是一個多層感知器【5】,因而具有具有類似多層感知器的體系結(jié)構(gòu),也即典型的前饋神經(jīng)網(wǎng)絡(luò)的體系結(jié)構(gòu)。下圖所示為一個具有一個隱層和一個輸出層的多層感知器結(jié)構(gòu)圖:圖2為BP網(wǎng)絡(luò)結(jié)構(gòu)圖2.2 BP網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計原則首先,隱層數(shù)的選擇:理論分析表明,具有單隱層的前饋網(wǎng)可以映射所有連續(xù)函數(shù),只有當(dāng)學(xué)習(xí)不連續(xù)函數(shù)時,才需要兩個隱層,所以多層前饋網(wǎng)最

5、多只需兩個隱層。本文采用只含一個隱含層的三層BP神經(jīng)網(wǎng)絡(luò)來進行車牌字符的識別。其次,隱節(jié)點數(shù)的選擇: 隱節(jié)點的作用是從樣本中提取并存儲其內(nèi)在規(guī)律,每個隱節(jié)點有若干個權(quán)值,而每個權(quán)值都是增強網(wǎng)絡(luò)映射能力的一個參數(shù)。隱節(jié)點數(shù)量太少,網(wǎng)絡(luò)從樣本中獲取的信息能力就差,不足以概括和體現(xiàn)訓(xùn)練集中的樣本規(guī)律;若節(jié)點數(shù)量太多,則會出現(xiàn)所謂“過度吻合”問題,反而降低了泛化能力,還會增加訓(xùn)練時間。因此,通常情況下,網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)目的選擇原則是:在能夠解決問題的前提下,再加上1到2個神經(jīng)元以加快誤差的下降速度。2.3 BP算法的缺陷與改進將BP算法用于具有非線性轉(zhuǎn)移函數(shù)的三層前饋網(wǎng),可以以任意精度逼近任何非線性

6、函數(shù),這一優(yōu)勢是多層前饋網(wǎng)得到廣泛的應(yīng)用。然而標(biāo)準(zhǔn)的BP算法在應(yīng)用中暴露不少內(nèi)在缺陷。如:容易形成局部極??;收斂速度慢;學(xué)習(xí)新樣本有遺忘舊樣本的趨勢等。針對以上問題,對BP算法的改進常用的方法主要有:增加動量項;自適應(yīng)調(diào)節(jié)學(xué)習(xí)率;引入陡度因子等。3 基于神經(jīng)網(wǎng)絡(luò)圖像識別系統(tǒng)神經(jīng)網(wǎng)絡(luò)的圖像識別系統(tǒng)是神經(jīng)網(wǎng)絡(luò)模式識別系統(tǒng)的一種。一般神經(jīng)網(wǎng)絡(luò)圖像識別系統(tǒng)由預(yù)處理,特征提取和神經(jīng)網(wǎng)絡(luò)分類器組成。預(yù)處理就是將原始數(shù)據(jù)中的無用信息刪除,二值化和進行幅度歸一化等。神經(jīng)網(wǎng)絡(luò)圖像識別系統(tǒng)中的特征提取部分實際上是傳統(tǒng)方法與神經(jīng)網(wǎng)絡(luò)方法技術(shù)的結(jié)合,這種方法可以充分利用人的經(jīng)驗來獲取模式特征以及神經(jīng)網(wǎng)絡(luò)分類能力來識別

7、目標(biāo)圖像【6】。特征提取必須能反映整個圖像的特征,具有很強的抗干擾能力。當(dāng)BP網(wǎng)用于分類時,首先要選擇各類的樣本進行訓(xùn)練,每類樣本的個數(shù)要近似相等。其原因在于一方面防止訓(xùn)練后網(wǎng)絡(luò)對樣本多的類別響應(yīng)過于敏感,而對樣本數(shù)少的類別不敏感。另一方面可以大幅度提高訓(xùn)練速度,避免網(wǎng)絡(luò)陷入局部最小點。神經(jīng)網(wǎng)絡(luò)在樣本學(xué)習(xí)中就像人記數(shù)字一樣,學(xué)習(xí)樣本時的網(wǎng)絡(luò)權(quán)值調(diào)整就相當(dāng)于人記住各個數(shù)字的形象,網(wǎng)絡(luò)權(quán)值就是網(wǎng)絡(luò)記住的內(nèi)容,網(wǎng)絡(luò)學(xué)習(xí)階段就像人由不認識數(shù)字到認識數(shù)字反復(fù)學(xué)習(xí)過程是一樣的。神經(jīng)網(wǎng)絡(luò)是按整個特征向量的整體來記憶圖像的,只要大多數(shù)特征符合曾學(xué)習(xí)過的樣本就可識別為同一類別,所以當(dāng)樣本存在較大噪聲時神經(jīng)網(wǎng)絡(luò)分

8、類器仍可正確識別。在圖像識別階段,只要將圖像的點陣向量作為神經(jīng)網(wǎng)絡(luò)分類器的輸入,經(jīng)過網(wǎng)絡(luò)的計算,分類器的輸出就是識別結(jié)果。4 BP神經(jīng)網(wǎng)絡(luò)在車牌字符識別中應(yīng)用設(shè)計對采集到的車牌圖像,經(jīng)過定位、預(yù)處理、分割和歸一化等處理之后,下面就要從被分割歸一處理完畢的字符中,提取最能體現(xiàn)這個字符特點的特征向量。將提取出訓(xùn)練樣本中的特征向量輸入BP網(wǎng)絡(luò)之中就可以對網(wǎng)絡(luò)進行訓(xùn)練,提取出待識別的樣本中的特征向量代入到訓(xùn)練好的BP網(wǎng)絡(luò)中,就可以對字符進行識別【2】。4.1 13點特征提取法本文采用13點特征提取法【4】來提取特征向量,把字符平均分成8份,統(tǒng)計每一份內(nèi)黑色像素點的個數(shù)作為8個特征, 即分別統(tǒng)計這8個區(qū)

9、域中的黑色像素點的數(shù)目,可以得到8個特征。然后統(tǒng)計水平方向中間兩列和豎直方向中間兩列的黑色像素點的個數(shù)作為4個特征,最后統(tǒng)計所有黑色像素點的個數(shù)作為第13個特征。如下圖所示:圖3 13特征提取法4.2BP網(wǎng)絡(luò)分類器設(shè)計。根據(jù)車牌字符的特點: 車牌第一個字符為漢字,第二個字符為英文字母,第三、四個字符為英文字母或數(shù)字,第五到第七個字符均為數(shù)字。本文構(gòu)造了4個含一個隱含層的三層BP神經(jīng)網(wǎng)絡(luò),分別用來識別漢字、英文字母、英文字母或數(shù)字以及數(shù)字。用于識別漢字的BP神經(jīng)網(wǎng)絡(luò),它有13節(jié)點輸入(即13特征提取法),6個輸出節(jié)點。用于識別英文字母的BP神經(jīng)網(wǎng)絡(luò),它有13個節(jié)點輸入,10個節(jié)點輸出(由于實際情

10、況的限制,拍攝到的漢字和英文字母樣本較少)。用于識別英文字母或數(shù)字的BP神經(jīng)網(wǎng)絡(luò),它有13個輸入節(jié)點,20個輸出節(jié)點(其中英文字母10個,數(shù)字10個,共20個)。用于識別數(shù)字的BP神經(jīng)網(wǎng)絡(luò),它有13個輸入節(jié)點輸出節(jié)點10個【3】。5. 實驗以識別數(shù)字的神經(jīng)網(wǎng)絡(luò)為例,通過matlab模擬。首先,樣本的選擇。實驗采用由CCD拍攝到的50幅汽車圖片,選取其中的20張為訓(xùn)練樣本,剩余的30張為測試樣本。首先對采集到的各圖片進行定位、預(yù)處理、分割以及歸一化等操作后,各原始圖片變成大小都為1616的字符圖像,接著利用13特征法進行特征提取,將其作為網(wǎng)絡(luò)的輸入。對于每一個車牌字符,通常選用5個左右的不同字符

11、作為訓(xùn)練樣本,例如字符1,從分割后的圖片中選,5個不同的字符1作為網(wǎng)絡(luò)的輸入。其次,初始權(quán)值、激活函數(shù)的選取以及各參數(shù)的設(shè)定。網(wǎng)絡(luò)的權(quán)值和閾值為隨機選取,各層的激活函數(shù)依次為雙曲正切S型函數(shù)tansig.m和線性函數(shù)purelin.m。本文采用了附加動量法和自適應(yīng)學(xué)習(xí)速率調(diào)整法兩種策略,各參數(shù)依次設(shè)定為:誤差目標(biāo)goal=510-3;學(xué)習(xí)速率=0.1;學(xué)習(xí)速率的遞增乘因子_inc=1.15;學(xué)習(xí)速率的遞減乘因子_dec=0.8;動量因子mc=0.95【1】。最后,識別數(shù)字的網(wǎng)絡(luò)輸出。網(wǎng)絡(luò)的設(shè)計是為了使其輸出矢量在正確的位置上輸出為1,而在其他位置上輸出為0。然而噪聲輸入矢量可能導(dǎo)致網(wǎng)絡(luò)的1或0

12、輸出不正確,或出現(xiàn)其他輸出值。為了使網(wǎng)絡(luò)具有抗干擾能力,在網(wǎng)絡(luò)訓(xùn)練后,再將其輸出經(jīng)過一層競爭網(wǎng)絡(luò)函數(shù)的處理(在MATLAB下為compet.m),使網(wǎng)絡(luò)的輸出只在最接近輸入值的輸出位置輸出為1,保證在其他位置輸出均為0。對于1到5的這5個數(shù)字,實驗結(jié)果表明網(wǎng)絡(luò)對測試樣本的識別率接近100%,其對應(yīng)的輸出表如下表所示:數(shù)字輸出神經(jīng)元0123456789神經(jīng)元10100000000神經(jīng)元20010000000神經(jīng)元30001000000神經(jīng)元40000100000神經(jīng)元50000010000表1 數(shù)字網(wǎng)絡(luò)的期望輸出表6. 結(jié)論目前BP網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)中字符識別應(yīng)用比較在成功的,BP人工神經(jīng)網(wǎng)絡(luò)具有很

13、強的自適應(yīng)學(xué)習(xí)能力;具有執(zhí)行非線性任務(wù)和去除噪聲的能力,使它能夠很好的用于分類和預(yù)測問題;因此,BP神經(jīng)網(wǎng)絡(luò)為車牌識別系統(tǒng)中的重要環(huán)節(jié)即車牌字符識別,不僅提供了有效的智能化的理論思想,還對車牌字符識別的效果和速率及質(zhì)量提供了保障,擴展和豐富了車牌字符識別的方式方法。參考文獻:【1】 高雋 人工神經(jīng)網(wǎng)絡(luò)原理及仿真實例. 2007.2月第2版 【2】 魏武,黃心漢等.基于模板匹配和神經(jīng)網(wǎng)絡(luò)的車牌字符識別方法.模式識別與人工智能,2001,14(1):123126【3】 苗迪銘,宣國榮.神經(jīng)網(wǎng)絡(luò)在車牌字符識別中的應(yīng)用.微型電腦應(yīng)用,1999,4(16):58【4】 劉智勇,劉迎建.車牌識別中的圖像提取及分割.中文信息學(xué)報,2000,14(4):2934【5】 R.Parisi,et.al.Car Plate Recognition by Netural Networks and I

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論