特征提取方法_第1頁(yè)
特征提取方法_第2頁(yè)
特征提取方法_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、4.2.2特征提取方法圖像經(jīng)過(guò)一系列的預(yù)處理之后,原來(lái)大小不同、分布不規(guī)則的各個(gè)字符變成 了一個(gè)個(gè)大小相同、排列整齊的字符。下面接要從被分割歸一處理完畢的字符中, 提取最能體現(xiàn)這個(gè)字符特點(diǎn)的特征向量。將提取出訓(xùn)練樣本中的特征向量代入 BP網(wǎng)絡(luò)之中就可以對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,提取出待識(shí)別的樣本中的特征向量代入到 訓(xùn)練好的BP網(wǎng)絡(luò)中,就可以對(duì)漢字進(jìn)行識(shí)別。特征向量的提取方法多種多樣,可以分為基于結(jié)構(gòu)特征的方法和基于像素分 布特征的方法,下面給予簡(jiǎn)單介紹,并說(shuō)明本文所用的方法。(1) 結(jié)構(gòu)特征。結(jié)構(gòu)特征充分利用了字符本身的特點(diǎn),由于車(chē)牌字符通常都是較規(guī)范的印刷體,因此可以較容易地從字符圖像上得到它的字符筆

2、畫(huà)信息, 并可根據(jù)這些信息來(lái)判別字符。例如,漢字的筆畫(huà)可以簡(jiǎn)化為4類(lèi):橫、豎、左斜和右斜。根據(jù)長(zhǎng)度不同乂可分為長(zhǎng)橫、短橫、長(zhǎng)豎和短豎等。將漢字分塊,并提取每一塊的筆畫(huà)特征,就可得到一個(gè)關(guān)于筆畫(huà)的矩陣,以此作為特征來(lái)識(shí)別漢 字。(2) 像素分布特征。像素分布特征的提取方法很多,常見(jiàn)的有水平、垂直 投影的特征,微結(jié)構(gòu)特征和周邊特征等。水平、垂直投影的特征是計(jì)算字符圖像 在水平和垂直方向上像素值的多少,以此作為特征。微結(jié)構(gòu)法將圖像分為幾個(gè)小 塊,統(tǒng)計(jì)每個(gè)小塊的像素分布。周邊特征則計(jì)算從邊界到字符的距離。優(yōu)點(diǎn)是排 除了尺寸、方向變化帶來(lái)的十?dāng)_,缺點(diǎn)是當(dāng)字符出現(xiàn)筆劃融合、斷裂、部分缺失時(shí)不適用。 逐像素

3、特征提取法這是一種最簡(jiǎn)單的特征提取方法。 它可以對(duì)圖像進(jìn)行逐行逐列的掃描, 當(dāng)遇 到黑色像素時(shí)取其特征值為1,遇到白色像素時(shí)取其特征值為 0,這樣當(dāng)掃描結(jié) 束后就獲得一個(gè)維數(shù)與圖像中的像素點(diǎn)的個(gè)數(shù)相同的特征向量矩陣。這種特征提取方法的特點(diǎn)就是算法簡(jiǎn)單,運(yùn)算速度快,可以使 BP網(wǎng)絡(luò)很快 的收斂,訓(xùn)練效果好,更重要的是對(duì)于數(shù)字圖像這樣特征較少的圖像, 這種方法 提取的信息量最大,所以對(duì)于本系統(tǒng)來(lái)說(shuō),這種方法較為適用。但是它的缺點(diǎn)也 很明顯,就是適應(yīng)性不強(qiáng),所以本文沒(méi)有選用這種方法。 骨架特征提取法兩幅圖像由丁它們的線條的粗細(xì)不同, 使得兩幅圖像差別很大,但是將它們 的線條進(jìn)行細(xì)化后,統(tǒng)一到相同的寬

4、度,如一個(gè)像素寬時(shí),這是兩幅圖像的差距 就不那么明顯。利用圖形的骨架作為特征來(lái)進(jìn)行數(shù)碼識(shí)別,就使得識(shí)別有了一定 的適應(yīng)性。一般使用細(xì)化的方法來(lái)提取骨架,細(xì)化的算法有很多,如 Hilditch算 法、Rosenfeld算法等。對(duì)經(jīng)過(guò)細(xì)化的圖像利用 EveryPixel函數(shù)進(jìn)行處理就可以 得到細(xì)化后圖像的特征向量矩陣。骨架特征提取的方法對(duì)丁線條粗細(xì)不同的數(shù)碼 有一定的適應(yīng)性,但是圖像一旦出現(xiàn)偏移就難以識(shí)別。 微結(jié)構(gòu)法本文使用此方法實(shí)現(xiàn)車(chē)牌漢字的識(shí)別。其具體算法是:微結(jié)構(gòu)法將圖像分為幾個(gè)小塊,統(tǒng)計(jì)每個(gè)小塊的像素分布。本文提取出漢字 的39個(gè)特征,存儲(chǔ)在數(shù)組f0f38中。具體算法可分為四步:步驟一:把

5、字符平均分成9份,如圖4.1所示,給每一份編號(hào)如圖4.2,統(tǒng) 計(jì)每一份內(nèi)黑色像素的個(gè)數(shù),存儲(chǔ)在數(shù)字tz0tz9中,統(tǒng)計(jì)在行方向和歹U方向 上每一份內(nèi)的黑色像素個(gè)數(shù)和與之相鄰的一份內(nèi)黑色像素個(gè)數(shù)的比值作為一個(gè) 特征,例如:行方向上提取特征 f0 =tz1/ tz0 , f1 =tz2/ tz1 , f2 =tz0/ tz2, ,f8 =tz6/tz8;列方向上 f9 =tz3/ tz0 , f10 =tz6/ tz3 , f11 =tz0/ tz6,,f17 = tz2/ tz8,共 18 個(gè)特征。步驟二:把字符橫向分成三份,如圖4.3所示,統(tǒng)計(jì)每一份內(nèi)的黑色像素個(gè) 數(shù),每一份內(nèi)的黑色像素個(gè)數(shù)與

6、前一份內(nèi)黑色像素個(gè)數(shù)的比值作為一個(gè)特征, f18 = tz10/ tz9 , f19 = tz11/ tz10, f20 = tz9/ tz11;把字符縱向分成三 份,如圖4.4所示,統(tǒng)計(jì)每一份內(nèi)的黑色像素個(gè)數(shù),每一份內(nèi)的黑色像素個(gè)數(shù)與 前一份內(nèi)黑色像素個(gè)數(shù)的比值作為一個(gè)特征,f21 =tz13/ tz12 , f22 =tz14/ tz13, f23 = tz12/ tz14;共六個(gè)特征。步驟三:如圖4.5,在豎直方向上找出三列,統(tǒng)計(jì)在該列中跳變點(diǎn)的個(gè)數(shù),即相鄰點(diǎn)像素值從0變到255的次數(shù),共三個(gè)特征,記為f24, f25, f26;在水平方向上找出三行列,統(tǒng)計(jì)在該行中跳變點(diǎn)的個(gè)數(shù),即相鄰點(diǎn)象素值從0變到255的次數(shù),共三個(gè)特征,記為

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論