車輛牌照圖像識別算法研究與實現(xiàn)_第1頁
車輛牌照圖像識別算法研究與實現(xiàn)_第2頁
車輛牌照圖像識別算法研究與實現(xiàn)_第3頁
車輛牌照圖像識別算法研究與實現(xiàn)_第4頁
車輛牌照圖像識別算法研究與實現(xiàn)_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、西南科技大學(xué)畢業(yè)設(shè)計(論文)題目名稱:車輛牌照圖像識別算法研究與實現(xiàn)年 級:2003級 本科 ??茖W(xué)生學(xué)號:20035064學(xué)生姓名:何建斌 指導(dǎo)教師:方艷紅學(xué)生單位:信息工程學(xué)院 技術(shù)職稱:講師學(xué)生專業(yè):生物醫(yī)學(xué)工程 教師單位:信息工程學(xué)院西 南 科 技 大 學(xué) 教 務(wù) 處 制車輛牌照圖像識別算法研究與實現(xiàn)摘要:近年來隨著國民經(jīng)濟(jì)的蓬勃發(fā)展,國內(nèi)高速公路、城市道路、停車場建設(shè)越來越多,對交通控制、安全管理的要求也日益提高。因此,汽車牌照識別技術(shù)在公共安全及交通管理中具有特別重要的實際應(yīng)用意義。本文對車牌識別系統(tǒng)中的車牌定位、字符分割和字符識別進(jìn)行了初步研究。對車牌定位,本文采用投影法對車牌進(jìn)

2、行定位;在字符分割方面,本文使用閾值規(guī)則進(jìn)行字符分割;針對車牌圖像中數(shù)字字符識別的問題,本文采用了基于BP神經(jīng)網(wǎng)絡(luò)的識別方法。在學(xué)習(xí)并掌握了數(shù)字圖像處理和模式識別的一些基本原理后,使用VC+6.0軟件利用以上原理針對車牌識別任務(wù)進(jìn)行編程。實現(xiàn)了對車牌的定位和車牌中數(shù)字字符的識別。關(guān)鍵詞:車牌定位;字符分割;BP神經(jīng)網(wǎng)絡(luò);車牌識別;VC+Research and Realization of License Plate Recognition AlgorithmAbstract: In recent years, with the vigorous development of the nati

3、onal economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the pu

4、blic security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, t

5、he liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recogniti

6、on, the task of license plate recognition was programmed with VC+ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented.Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC+目 錄第1章

7、緒論11.1 課題研究背景11.2 車輛牌照識別系統(tǒng)原理11.3 車輛牌照識別在國內(nèi)外研究現(xiàn)狀21.4 本文主要工作及內(nèi)容安排3第2章 車輛牌照的定位方法42.1 車輛牌照圖像的預(yù)處理42.1.1 256色位圖灰度化42.1.2 灰度圖像二值化52.1.3 消除背景干擾去除噪聲62.2 車輛牌照的定位方法簡介62.3 系統(tǒng)采用的定位方法72.3.1 車輛牌照的水平定位72.3.2 車輛牌照的垂直定位72.3.3 定位的算法實現(xiàn)102.4 實驗結(jié)果分析12第3章 車輛牌照的字符分割133.1 車牌預(yù)處理133.1.1 去邊框處理133.1.2 去噪聲處理133.1.3 梯度銳化153.1.4 傾

8、斜調(diào)整163.2 字符分割方法簡介173.3 系統(tǒng)采用的分割方法193.3.1 算法介紹193.3.2 算法的實現(xiàn)203.4 字符分割實驗結(jié)果21第4章 特征提取與字符識別224.1 字符的特征提取224.2 字符的識別方法簡介234.3 系統(tǒng)采用的識別方法244.3.1 人工神經(jīng)網(wǎng)絡(luò)簡介244.3.2 BP神經(jīng)網(wǎng)絡(luò)識別車牌254.3.3 BP神經(jīng)網(wǎng)絡(luò)識別算法實現(xiàn)284.4 實驗結(jié)果分析29總結(jié)32致謝33參考文獻(xiàn)34第1章 緒論1.1 課題研究背景現(xiàn)代社會已經(jīng)進(jìn)入信息時代,計算機(jī)技術(shù)、通信技術(shù)和計算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,自動化信息處理能力的不斷提高,在人們社會活動和生活的各個領(lǐng)域得到了廣泛的

9、應(yīng)用,在這種情況下,作為信息來源的自動檢測、圖像識別技術(shù)越來越受到人們的重視。 隨著汽車數(shù)量的急劇增加,車牌自動識別(license plate recognition, LPR)技術(shù)日益成為交通管理自動化的重要手段1。車牌自動識別技術(shù)是計算機(jī)視覺、圖像處理技術(shù)與模式識別等技術(shù)的融合,是智能交通系統(tǒng)中一項非常重要的技術(shù)。通過車輛牌照自動識別,就可以對運(yùn)動車輛查詢相關(guān)的數(shù)據(jù)庫,根據(jù)提取的車輛信息,實現(xiàn)有針對性的車輛檢查,極大的提高工作人員的效率,降低工作強(qiáng)度,同時也減少了國家財政收入的流失,減少交通事故的發(fā)生以及加強(qiáng)社會治安。因此對車牌識別技術(shù)研究有巨大的經(jīng)濟(jì)價值和現(xiàn)實意義。由于車牌自動識別技術(shù)

10、在智能化交通控制管理中發(fā)揮的重要作用,吸引了各國的科研工作者對其進(jìn)行廣泛的研究,目前已有眾多的算法,有些已應(yīng)用于交叉路口、車庫管理、路口收費(fèi)、高速公路等場合。由于需適應(yīng)各種復(fù)雜背景,加之要識別的車輛種類繁多,顏色變化多端,以及檢測時要適應(yīng)不同天氣變化導(dǎo)致的不同光照條件,因此,目前的系統(tǒng)都或多或少地存在一些問題。但隨著計算機(jī)性能的提高和計算機(jī)視覺理論及技術(shù)的發(fā)展,這種技術(shù)必將日趨成熟。車牌的定位與識別技術(shù),總體來說是圖像處理技術(shù)與車牌本身特點(diǎn)的有機(jī)結(jié)合,當(dāng)然也包括小波分析、神經(jīng)網(wǎng)絡(luò)、數(shù)學(xué)形態(tài)學(xué)、模糊理論等數(shù)學(xué)知識的有效運(yùn)用2。本課題是對汽車圖像進(jìn)行分析,從算法角度來研究車牌的定位與識別。1.2

11、車輛牌照識別系統(tǒng)原理一個典型的車輛牌照識別系統(tǒng)(LPR)是由圖像采集系統(tǒng)和圖像識別系統(tǒng)組成的,如圖1-13。當(dāng)系統(tǒng)發(fā)現(xiàn)有車時,圖像采集系統(tǒng)便開始采集車輛牌照信息,得到的信息是圖像識別系統(tǒng)的輸入。通過識別系統(tǒng)的預(yù)處理,為目標(biāo)搜索提供一個良好的定位環(huán)境。在預(yù)處理的基礎(chǔ)上把圖像中的車牌從背景中分割出來。對車牌中的字符做字符分割,最后把分割后的字符進(jìn)行識別,便得到了汽車牌照的號碼。整套系統(tǒng)實際是一種硬件和軟件的集成。在硬件上,它需要集成可控照明燈、鏡頭、圖像采集模塊、數(shù)字信號處理器、存儲器、通信模塊、溫控模塊、單片機(jī)等;在軟件上,它包括車牌定位、車牌字符切割、車牌字符識別等算法。這樣一體化的結(jié)構(gòu)形式能

12、在現(xiàn)實中降低對環(huán)境的要求。 圖1-1 車輛牌照識別系統(tǒng)原理框圖1.3 車輛牌照識別在國內(nèi)外研究現(xiàn)狀自1988年以來,人們就對車輛牌照識別系統(tǒng)進(jìn)行了廣泛的研究,目前國內(nèi)外已經(jīng)有眾多的算法,一些實用的LPR技術(shù)也開始用于車流監(jiān)控、出入控制、電子收費(fèi)等場合。然而無論是LPR算法還是LPR產(chǎn)品都存在一定的局限性,都需要適應(yīng)新的要求而不斷完善。如以色列Hi-Tech公司的See/Car System系列,它需要多種變形的產(chǎn)品來分別適應(yīng)某一個國家的車牌;新加坡Optasia公司的VLPRS系列,只適合于新加坡的車牌;See/Car Chinese系統(tǒng)可以對中國大陸的車牌進(jìn)行識別,但都存在一定的缺陷,而且不

13、能識別車牌中的漢字。我國在90年代初期開始了車輛牌照識別技術(shù)的研究。但由于以下幾個原因使我國的車輛牌照識別技術(shù)在研究和應(yīng)用方面都有一定難度,且落后于其它國家:我國的標(biāo)準(zhǔn)汽車牌照是由漢字、英文字母和阿拉伯?dāng)?shù)字組成,漢字的識別與字母和數(shù)字的識別有很大的不同,從而增加了識別的難度。國外許多國家汽車牌照的底色和字符顏色通常只有對比度較強(qiáng)的兩種顏色,而我國汽車牌照僅底色就有藍(lán)、黃、黑、白等多種顏色,字符顏色也有黑、紅、白等幾種顏色。其他國家的汽車牌照格式通常只有一種,而我國則根據(jù)不同車輛、車型、用途,規(guī)定了多種牌照格式。我國汽車牌照的規(guī)范懸掛位置并不唯一,而且由于環(huán)境、道路或人為因素造成汽車牌照污染的情

14、況比較嚴(yán)重,這都給車牌識別造成了一定的難度。因此,我國車輛牌照識別技術(shù)的提高和廣泛應(yīng)用還需廣大科研工作者和相關(guān)交通部門的共同努力。1.4 本文主要工作及內(nèi)容安排本文主要研究車輛牌照識別系統(tǒng)中的數(shù)字識別技術(shù),將數(shù)字圖像處理技術(shù)與模式識別技術(shù)緊密結(jié)合,針對汽車牌照字符識別的特點(diǎn),分析了車牌定位與分割、字符分割、特征提取、BP神經(jīng)網(wǎng)絡(luò)等算法。在車牌定位、字符分割和特征提取的基礎(chǔ)上,詳細(xì)研究了車牌數(shù)字字符的識別。文章在接下來的第二章介紹了車輛牌照的定位方法;第三章介紹了車輛牌照的字符分割算法;第四章介紹了車輛牌照數(shù)字字符的識別。其中車輛牌照數(shù)字字符的識別是本課題的重點(diǎn)。文章在每一步處理后給出了實驗結(jié)果

15、,并給出了最后的識別結(jié)果。第2章 車輛牌照的定位方法車輛牌照的定位方法是基于圖像處理的基礎(chǔ)上,對圖像進(jìn)行分析、總結(jié)并經(jīng)過大量的試驗所獲得的。定位方法的研究與車牌特征和圖像處理技術(shù)是分不開的。從自然背景中準(zhǔn)確可靠地分割出車牌區(qū)域是提高系統(tǒng)識別率的關(guān)鍵,但是由于車牌圖像攝于背景復(fù)雜且光照不均勻的自然場景,因而會出現(xiàn)顏色失真或低對比度的圖像,這給車輛牌照的定位帶來了很大的困難。為此人們進(jìn)行了大量的研究,并取得了一定的成果。本課題中,根據(jù)車牌的二值圖像在水平和垂直方向的投影特性提出了基于二值化圖像投影法和數(shù)學(xué)形態(tài)學(xué)相結(jié)合的車牌定位算法,該算法具有快速、簡潔實用和與背景相關(guān)性小的特點(diǎn)。車牌的定位算法分為

16、預(yù)處理、水平定位、垂直定位。其流程圖如圖2-1所示。 圖2-1 車輛牌照定位原理2.1 車輛牌照圖像的預(yù)處理為了使車牌能夠被精確定位,在定位搜索以前,要對車牌圖像進(jìn)行預(yù)處理。為了能夠方便的進(jìn)行后期的數(shù)字圖像處理,需要將彩色圖像轉(zhuǎn)化成256色的灰度圖后進(jìn)行處理,然后對圖像做二值化處理,削弱背景干擾,消除噪聲。經(jīng)過以上的預(yù)處理,就可以對車牌進(jìn)行定位和分割處理。 256色位圖灰度化由于256色的位圖的調(diào)色板內(nèi)容比較復(fù)雜,使得圖像處理的許多算法都沒有辦法展開,因此有必要對它進(jìn)行灰度處理。所謂灰度圖像就是圖像的每一個象素的RGB分量的值是相等的。彩色圖像的每個象素的RGB值是不同的,所以顯示出紅綠藍(lán)等各

17、種顏色?;叶葓D像沒有這些顏色差異,有的只是亮度上的不同?;叶戎荡蟮南笏乇容^亮,反之比較暗。圖像灰度化有各種不同的算法,比較直接的一種是給象素的RGB值各自一個加權(quán)系數(shù),然后求和。經(jīng)常用到的灰度化公式由式(2-1)完成: (2-1)式(2-1)中為灰度值。加權(quán)系數(shù)的取值是建立在人眼的視覺模型之上的,對于人眼較為敏感的綠色取較大的權(quán)值,對人眼較為不敏感的藍(lán)色則取較小的權(quán)值。這樣可以使得到的灰度圖像在視覺上更接近人的主觀感覺。應(yīng)該注意的是最后得到結(jié)果一定要?dú)w一到0255之內(nèi)。 灰度圖像二值化在進(jìn)行了灰度化處理以后,圖像中的每個象素只有一個值,即象素的灰度值。它的大小決定了象素的亮暗程度。為了更加便利

18、的開展下面的圖像處理操作,還需要對已經(jīng)得到的灰度圖像做一個二值化處理。圖像的二值化就是把圖像中的象素的灰度值根據(jù)一定的標(biāo)準(zhǔn)分化成兩種顏色。在系統(tǒng)中是根據(jù)象素的灰度值將圖像處理成黑白兩種顏色。圖像的二值化有很多成熟的方法:可以采用閾值分割法,也可以采用給定閾值法。閾值分割法可以分為全局閾值法和局部閾值分割法。所謂局部閾值分割法是將原始圖像劃分成較小的圖像,并對每個子圖像選取相應(yīng)的閾值。在閾值分割后,相鄰子圖像之間的邊界處可能產(chǎn)生灰度級的不連續(xù),因此需用平滑技術(shù)進(jìn)行排除。局部閾值法常用的方法有灰度差直方圖法、微分直方圖法。全局閾值分割方法在圖像處理中應(yīng)用比較多,它在整幅圖像內(nèi)采用固定的閾值分割圖像

19、。根據(jù)閾值選擇方法的不同,可以分為模態(tài)方法、迭代式閾值選擇等方法。這些方法都是以圖像的灰度直方圖為研究對象來確定閾值的。另外還有類間方差閾值分割法、二維最大熵分割法、模糊閾值分割法、共生矩陣分割法、區(qū)域生長法等等。在本系統(tǒng)中考慮到所要進(jìn)行處理的圖像大多是噪聲比較少的灰度車牌,系統(tǒng)中采用全局閾值分割的方法進(jìn)行處理,初始閾值的確定方法是由式(2-2)完成: (2-2)和分別是最高和最低灰度值。該閾值對不同牌照有一定的適應(yīng)性,能夠保證背景基本被置為0,以突出牌照區(qū)域。經(jīng)過二值化,可以進(jìn)行下一步處理。 消除背景干擾去除噪聲對二值化后的圖像進(jìn)行相鄰象素灰度值相減,得到新的圖像,左邊緣可以直接賦值,不會影

20、響整體效果??紤]到圖像中的文字是由短的橫豎線組成,而背景噪聲有一大部分是孤立噪聲,所以用模板(1,1,1,1) T對圖像進(jìn)行中值濾波,得到去除大部分干擾的圖像。2.2 車輛牌照的定位方法簡介經(jīng)過以上的預(yù)處理,我們就可以對圖像進(jìn)行車牌的定位和分割。為了快速、準(zhǔn)確地定位車牌,目前已有很多學(xué)者提出許多定位算法。其中,眾多算法都是利用了車牌自身異于背景區(qū)域的特征來進(jìn)行車牌定位的。這些特征包括車牌的顏色特征、幾何特征、紋理特征和經(jīng)過處理運(yùn)算后得到的車牌區(qū)域固有的特征(異于背景區(qū)域特征)等。車牌定位的算法基本上可以分為兩大類:第1類是通過一個步驟將車牌定位出來;第2類是通過兩個步驟將車牌定位出來4。第1類

21、:這類算法的主要特點(diǎn)是通過一個步驟就可以將車牌區(qū)域定位出來。其主要的算法介紹如下:(1)基于神經(jīng)網(wǎng)絡(luò)的車牌定位方法:該方法首先是用神經(jīng)網(wǎng)絡(luò)對大量的樣本圖像進(jìn)行訓(xùn)練,然后再進(jìn)行圖像預(yù)處理,最后用訓(xùn)練的神經(jīng)網(wǎng)絡(luò)提取真正的車牌區(qū)域。該算法要求把圖像中每一個像素所提取特征輸入神經(jīng)網(wǎng)絡(luò)來進(jìn)行學(xué)習(xí),計算量很大,同時需處理好網(wǎng)絡(luò)局部收斂的問題,且車牌定位時間長5。(2)基于模板匹配的車牌定位方法:該算法主要是設(shè)立一個滑動窗口,該窗口有若干向量值,利用該窗口在汽車圖像上滑動,并計算該窗口所覆蓋的那塊車牌圖像的向量值,找出最佳的向量值,認(rèn)為是車牌區(qū)域。(3)直線邊緣檢測:這種方法主要利用Hough變化檢測車牌周

22、圍邊框直線。這種方法的缺點(diǎn)是Hough變換計算量大,對于邊框不連續(xù)的實際車牌,需附加大量的運(yùn)算6。(4)統(tǒng)計直方圖及投影方法:該方法通過對圖像的水平和垂直兩個方向灰度投影直方圖來分析推斷出牌照的位置。該方法的缺點(diǎn)是對噪聲敏感,且牌照圖像存在傾斜時,不能達(dá)到預(yù)期的效果。第2類:即先對車輛圖像進(jìn)行車牌的粗定位,然后再進(jìn)行精定位。所謂粗定位有兩種含義:第1種粗定位的含義就是從車輛圖像中找出車牌的大致位置,它并不要求非常精確的定位出車牌的位置,只需要給出包含車牌的相對較小或較大的一塊區(qū)域就達(dá)到目的;第2種粗定位的含義就是利用粗分割,即給出包含車牌區(qū)域在內(nèi)的若干候選區(qū)域,再從這些區(qū)域中提取車牌區(qū)域7。這

23、里不再作詳細(xì)的論述。2.3 系統(tǒng)采用的定位方法在系統(tǒng)中,采用投影法來實現(xiàn)車輛牌照的定位。利用水平投影來檢測車牌的水平位置,利用垂直投影和形態(tài)學(xué)的方法檢測車牌的垂直位置8。 車輛牌照的水平定位得到二值化圖像以后,首先把二值圖像投影到y(tǒng)軸。根據(jù)車牌特征,車牌區(qū)域中的垂直邊緣較密集,而且車牌一般懸掛在車身較低的位置其下方?jīng)]有很多的邊緣密集區(qū)域。因此在車牌對應(yīng)的水平位置上會出現(xiàn)一個峰值,如圖2-2所示。峰值的兩個低谷點(diǎn)就是車牌的垂直位置,這樣就得到了包含了車牌的帶狀區(qū)域。所以問題轉(zhuǎn)成確定低谷點(diǎn)的位置。但是從圖中可以發(fā)現(xiàn)投影圖不是十分的光滑,會給精確定位帶來一些困難,所以對投影圖進(jìn)行平滑。窗口尺寸比較關(guān)

24、鍵,選小了不足以平滑,選大了則會改變投影圖原有的基本變化特性。對于實際的投影曲線可以通過找差分曲線的過零點(diǎn)來確定低谷點(diǎn),所以對平滑以后的投影圖求一階差分: (2-3)找出其由正至負(fù)的點(diǎn),也就是局部最小值。但是并不是所有的局部最小值之間都能稱為峰的,它可能附屬鄰近的一個峰,因而要確定哪一個局部最小值是峰谷,哪一個是毛刺。如何判決峰的獨(dú)立性呢?本文采取了3個判決依據(jù):1. 獨(dú)立峰具有一定峰頂和峰谷的落差,當(dāng)局部最大值和鄰近的局部最小值的差大于閾值,則該局部最小值為谷底,反之則為毛刺。2獨(dú)立峰具有一定的寬度,這是由車牌的寬度信息決定的。3獨(dú)立峰具有一定的面積,這是因為在經(jīng)過邊緣提取,二值化后,在車牌

25、區(qū)域具有明顯的紋理特征。在光照均勻和背景不是很復(fù)雜的圖像中,車牌的峰值特性十分明顯,很容易就可以定位出車牌區(qū)域的水平位置。但在光照不均勻或背景復(fù)雜的圖像中峰值特性就不是很明顯了。如何準(zhǔn)確地確定局部最小值是否為谷底,關(guān)鍵在于閾值的選取。 車輛牌照的垂直定位根據(jù)車牌的特征可以知道,車牌在垂直方向的投影呈現(xiàn)有規(guī)律的“峰、谷、峰”的分布。字符與字符之間的間隔是近似相等的,而且字符的寬度是近似相等的,而車 (a)二值化圖像 (b)水平投影圖 圖2-2 水平投影牌具有7個字符,所以車牌區(qū)域在垂直方向上的投影應(yīng)該存在6個低谷點(diǎn),而且相鄰低谷點(diǎn)之間的距離是近似相等的,第二和第三字符之間的距離略大于其他字符間的

26、距離。但在現(xiàn)實中得到二值圖像的“峰、谷、峰”的特點(diǎn)并不十分明顯,采用這種方法對車牌的垂直位置進(jìn)行定位效果不是很好,本文考慮使用形態(tài)學(xué)與投影法相結(jié)合的方法來對車牌進(jìn)行垂直定位,下面簡單介紹圖像形態(tài)學(xué)9。最初形態(tài)學(xué)是生物學(xué)中研究動物和植物的一個分支,后來也用數(shù)學(xué)形態(tài)學(xué)來表示以形態(tài)學(xué)為基礎(chǔ)的圖像分析數(shù)學(xué)工具。形態(tài)學(xué)的基本思想是使用具有一定形態(tài)的結(jié)構(gòu)元素來度量和提取圖像中的對應(yīng)形狀,從而達(dá)到對圖像進(jìn)行分析和識別的目的。數(shù)學(xué)形態(tài)學(xué)可以用來簡化圖像數(shù)據(jù),保持圖像的基本形狀特性,同時去掉圖像中與研究目的無關(guān)的部分。使用形態(tài)學(xué)操作可以實現(xiàn)增強(qiáng)對比度、消除噪聲、細(xì)化、填充和分割等常用的圖像處理任務(wù)。數(shù)學(xué)形態(tài)學(xué)的

27、數(shù)學(xué)基礎(chǔ)和使用的語言是集合論,其基本運(yùn)算有四種:膨脹(Dilation ) 、腐蝕(Erosion )、開啟(Open)和閉合(Close )?;谶@些基本運(yùn)算還可以推導(dǎo)和組成各種數(shù)學(xué)形態(tài)學(xué)運(yùn)算方法。其運(yùn)算對象是集合,通常給出一個圖像集合和一個結(jié)構(gòu)元素集合,利用結(jié)構(gòu)元素對圖像進(jìn)行操作。結(jié)構(gòu)元素是一個用來定義形態(tài)操作中所用到的鄰域的形狀和大小的矩陣,可以具有任意的大小和維數(shù)。下面簡單介紹一下以上4種運(yùn)算。1、膨脹膨脹的運(yùn)算符為“”,圖像集合用結(jié)構(gòu)元素來膨脹,記作,其定義見式(2-4),其中表示的映像,即與關(guān)于原點(diǎn)對稱的集合。式(2-4)表明,用對進(jìn)行膨脹的過程是這樣的:首先對作關(guān)于原點(diǎn)的映射,再

28、將其映像平移,當(dāng)與映像的交集不為空集時,的原點(diǎn)就是膨脹集合的像素。也就是說,用來膨脹得到的集合是的位移與至少有一個非零元素相交時的原點(diǎn)的位置的集合。 (2-4)膨脹的作用效果如圖2-3所示。其中白色表示目標(biāo),背景為黑色,結(jié)構(gòu)元素為一3×3正方形對象。 (a)膨脹前 (b)膨脹后 圖2-3 圖像膨脹前后的顯示效果對比2、腐蝕腐蝕的運(yùn)算符是,圖像集合用結(jié)構(gòu)元素來腐蝕記作,其定義為: (2-5)式(2-5)表明,用來腐蝕的結(jié)果是所有滿足將平移后,仍全部包含在中的的集合,從直觀上看就是經(jīng)過平移后全部包含在中的原點(diǎn)組成的集合。腐蝕的操作效果如圖2-4所示,其中白色為目標(biāo),黑色為背景,結(jié)構(gòu)元素為

29、一3×3正方形對象。 (a)腐蝕前 (b)腐蝕后 圖2-4 圖像腐蝕前后的顯示效果對比3、開啟開啟的運(yùn)算符為“”, 用來開啟記為,其定義如下: (2-6)4、閉合閉合的運(yùn)算符為“”,用來閉合記為,其定義見式(2-7): (2-7)開啟和閉合運(yùn)算不受原點(diǎn)位置的影響,無論原點(diǎn)是否包含在結(jié)構(gòu)元素中,開啟和閉合的結(jié)果都是一樣的。開啟和閉合操作的效果如圖2-5所示,其中白色為目標(biāo),黑色為背景。對形態(tài)學(xué)了解后,我們用形態(tài)學(xué)來進(jìn)行定位,具體算法為:1、對得到的帶狀區(qū)域用結(jié)構(gòu)算子先進(jìn)行一次腐蝕運(yùn)算,消除一些獨(dú)立的亮點(diǎn),但使用的結(jié)構(gòu)算子不能太大,否則會失去一部分車牌的信息。 (a)原圖 (b)對原圖開

30、啟操作后 (c)對原圖閉合操作后 圖2-5 圖像的開啟、閉合操作的顯示效果2、再進(jìn)行二次膨脹運(yùn)算,由于膨脹的目的是要把車牌區(qū)域連通,因此使用的結(jié)構(gòu)算子和腐蝕的結(jié)構(gòu)算子不一樣,要略大一些。3、最后進(jìn)行一次開運(yùn)算,將車牌區(qū)域平滑一下。可以發(fā)現(xiàn)車牌在圖像中形成了一個塊狀區(qū)域。如圖2-6所示。將得到的圖像再投影到垂直方向,再根據(jù)車牌的寬度信息,設(shè)定一個范圍,可以把這個范圍設(shè)置大些,這是因為經(jīng)過形態(tài)學(xué)變化后,車牌的長度會變大,而且有可能把附近的一些雜點(diǎn)連在一起了,從而增大了車牌連通區(qū)域的長度,如果范圍定的太小,就有可能檢測不到車牌區(qū)域10。 定位的算法實現(xiàn)利用投影法,在Visual C+中用C+語言對以

31、上算法進(jìn)行編程,對車輛牌照進(jìn)行定位。實驗中水平方向上的定位函數(shù)為HprojectDIB();垂直方向上的定位函數(shù)為VprojectDIB();定位以后分割過程所用的函數(shù)為TempSubert();iTop和iBottom分別是車牌的上下邊緣,iLeft和iRight為車牌的左右邊緣。定出車牌的四個邊緣以后,就可以通過分割函數(shù)TempSubert()將車牌從源圖像中裁減出來,為了使裁減的準(zhǔn)確,可以設(shè)置邊緣的微量調(diào)整。圖像定位算法流程圖如圖2-7所示。 (a) 水平投影分割得到的圖像 (b) 腐蝕運(yùn)算得到的圖像 (c) 第一次膨脹運(yùn)算得到的圖像 (d) 第二次膨脹運(yùn)算得到的圖像圖2-6 形態(tài)學(xué)變化

32、得到的圖像圖2-7 定位流程圖2.4 實驗結(jié)果分析經(jīng)實驗,大部分圖片中的牌照能夠被正確的定位出來如圖2-8,極少部分牌照不能正確定位。實驗表明,投影法基本上實現(xiàn)了車輛牌照的定位,但同時不難看出被定位的車牌還包括車牌邊框,與理想要求還有很大差距,如果在這些車牌上進(jìn)行字符分割,將會有很大的困難。另外在實驗中還發(fā)現(xiàn)該算法對車牌背景環(huán)境要求比較嚴(yán)格,車牌如果比較傾斜或者車牌顏色與汽車顏色相近或者車牌背景中的噪聲較大,則定位起來比較困難,不能實現(xiàn)車牌的精確定位,以后需要進(jìn)一步改進(jìn)。圖2-8 定位前后的圖像第3章 車輛牌照的字符分割在做字符分割以前,必須對定位出來的圖像做進(jìn)一步的處理,要對車牌做去邊框處理

33、、去噪聲處理、梯度銳化、傾斜度調(diào)整等預(yù)處理才能進(jìn)行字符分割。3.1 車牌預(yù)處理 去邊框處理一般藍(lán)底白字的車牌都有白色邊框,與字符的顏色相同,它的存在將對后繼的字符識別造成影響,因此它的濾除十分必要。1、濾除上下邊框?qū)z測到的二值牌照圖像進(jìn)行水平投影,在0<I<Height的范圍內(nèi),計算各sumI,( sumI為從0到Width的范圍內(nèi),二值化牌照圖像的白像素點(diǎn)數(shù))然后,將所有的sumI累加起來,記為一值,然后將該值除以2*Height-(2/3)*Height,如果sumI小于該商,就令該sumI為0。這樣直方圖中必有連零塊和非連零塊,測試每個非連零塊的寬度,如果它不在車牌高度的范

34、圍內(nèi),就置其為零,那么就將邊框濾除了(其中Height,Width為牌照圖像的高度和寬度)。2、濾除左右邊框濾除左右邊框的方法與濾除上下邊框的方法類似,只是閾值有些不同,不再贅述。 去噪聲處理圖像在掃描或者傳輸過程中夾帶了噪聲,去噪聲是圖像處理中常用的手法。通常去噪聲用濾波的方法,比如空間域濾波和同態(tài)濾波。采用合適的濾波方法不但可以濾除噪聲還可以對圖像進(jìn)行銳化,增強(qiáng)圖像的邊緣信息。下面介紹幾種常用的濾波方法。1、鄰域平均法為了消除圖像中的噪聲,可以直接在空間域上對圖像進(jìn)行平滑濾波。它的作用有兩種:一種是模糊;另一種是消除噪聲??臻g域的平滑濾波一般采用簡單平均法進(jìn)行,就是求鄰近像素點(diǎn)的平均亮度值

35、,稱為鄰域平均法。鄰域的大小與平滑的效果直接相關(guān),鄰域越大平滑的效果越好,但鄰域過大,平滑會使邊緣信息損失的越大,從而使輸出的圖像變得模糊,因此需要合理選擇鄰域的大小。典型的鄰域有兩種:四鄰域和八鄰域,其模板見式(3-1)。如果圖像中的噪聲是隨機(jī)不相關(guān)的加性噪聲,窗口內(nèi)各點(diǎn)噪聲是獨(dú)立分布的,經(jīng)過上述模板平滑后,信號與噪聲的方差比可提高許多倍。這種算法簡單,處理速度快,但它的主要缺點(diǎn)是在降低噪聲的同時使圖像產(chǎn)生模糊,特別在邊緣和細(xì)節(jié)處。而且, (3-1)隨著鄰域的增大,雖然增強(qiáng)了去噪聲的能力,但同時模糊程度也更嚴(yán)重。2、高通濾波在進(jìn)行圖像處理時,我們經(jīng)常要對圖像進(jìn)行銳化以便突出圖像的邊緣。同樣的

36、,可以采用在空間域?qū)D像進(jìn)行濾波的方法,只不過這時采用的沖激響應(yīng)陣列與空間域低通濾波時所采用的完全不同。采用高通濾波器讓高頻分量順利通過,而對低頻分量則充分限制,使圖像的邊緣變得清晰,實現(xiàn)圖像的銳化。但是,對圖像進(jìn)行空間域的高通濾波,在增強(qiáng)圖像邊緣的同時,孤立的噪聲點(diǎn)也得到了增強(qiáng)。常用于空間域高通濾波的沖激響應(yīng)陣列有以下幾種: (3-2)3、中值濾波中值濾波是一種非線性濾波,它也是一種鄰域運(yùn)算,類似于卷積。但中值濾波的計算不是加權(quán)求和,而是把它鄰域內(nèi)的所有像素按灰度值進(jìn)行排序,然后取該組的中間值作為鄰域中心像素點(diǎn)的輸出值。中值濾波的突出優(yōu)點(diǎn)是在消除噪聲的同時,還能防止邊緣模糊。如果圖像的噪聲多

37、是孤立的點(diǎn),這些點(diǎn)對應(yīng)的像素又很少,而圖像則是由像素較多、面積較大的塊構(gòu)成,中值濾波效果很好。4、同態(tài)濾波同態(tài)濾波器的思想就是用一系列方法把乘性信號變換成加性組合信號,經(jīng)過處理后再反變換回乘性信號。同態(tài)濾波以圖像的照明反射模型作為頻域處理的基礎(chǔ),它在數(shù)字圖像處理中有著十分重要的應(yīng)用。這里不再詳細(xì)論述。去除噪聲處理要根據(jù)不同的噪聲特點(diǎn)選取合適的方法。本系統(tǒng)采用的是去除雜點(diǎn)的方法來進(jìn)行去噪聲處理。具體的算法如下:掃描整個圖像,當(dāng)發(fā)現(xiàn)一個黑色點(diǎn)的時候就考察和該點(diǎn)直接或間接相連接的黑色點(diǎn)的個數(shù)有多少,如果大于一定的值,就說明該點(diǎn)不是離散點(diǎn),否則就是離散點(diǎn),把它去除掉。在考察相連的黑色點(diǎn)的時候用的是遞歸

38、的方法。 梯度銳化我們所得到的二值化圖像的字體一般是比較模糊的,對識別造成了一定的困難,所以有時要對圖像進(jìn)行銳化處理使模糊的圖像變得清晰,同時可以對噪聲起到一定的抑制和去除作用。圖像的銳化有很多方法,一種是微分法,一種是高通濾波法,梯度銳化的方法就是微分法的一種。梯度對應(yīng)一階導(dǎo)數(shù),梯度算子是一階導(dǎo)數(shù)算子。對一個連續(xù)函數(shù)它在位置的梯度可以表示為一個矢量: (3-3)這個矢量的幅度(也常直接簡稱為梯度)和方向角分別為: (3-4) (3-5) 以上三式中的偏導(dǎo)數(shù)需要對每個象素位置計算。在實際中常用小區(qū)域模板卷積來近似計算。對和各用一個模板,所以需要兩個模板組合起來構(gòu)成一個梯度算子。根據(jù)模板的大小,

39、其中元素值的不同,人們提出了許多種不同的算子如圖3-1。在這三個算子中,最簡單的算子是Roberts算子,Roberts算子是效果比較好的一種,我們采用的就是這個算子,效果如圖3-2所示。算子運(yùn)算時是采用類似卷積的方式,將模板在圖像上移動并在每個位置計算中心象素的梯度值。在邊緣灰度值過渡比較尖銳且圖像中噪聲比較小時,梯度算子的工作效果較好。 (a)Roberts (b) Prewitt (c) Sobel 圖3-1 幾種常見的梯度模板算子通過圖3-2可以看出梯度銳化可以讓模糊的邊緣變的清楚,同時選擇合適的閾值還可以減弱和消除一些細(xì)小的噪聲。實驗證明梯度銳化具備一定的去噪聲能力,但同時也會對字符

40、的邊緣有所損傷。從處理結(jié)果可以看出圖像的邊緣變得清晰而且少了很多細(xì)小的雜點(diǎn),但梯度銳化有其自身的缺陷,當(dāng)處理的圖像邊緣很細(xì)的時候可能造成邊緣信息的損失。在實驗中,如果圖像中的字符較為細(xì)小,則不使用梯度銳化。 (a)原始圖像 (b)利用Roberts算子檢測到的邊緣 (c)利用Prewitt算子檢測到的邊緣 (d)利用Sobel算子檢測到的邊緣圖3-2 梯度算子的檢測效果比較 傾斜調(diào)整雖然在拍攝車輛車牌時,可以調(diào)整CCD攝像機(jī)的俯仰角度、攝取方向和水平度,以保持車牌的橫向邊緣的傾斜度盡可能小,并且讓車牌在整幅圖像中處于相對居中的位置,即圖像的視覺中心上。但是,實際上CCD攝像機(jī)通常安裝在路邊或頂

41、部,這將造成車輛車牌與CCD攝像頭成像平面不平行,產(chǎn)生不同程度的車牌圖像的傾斜與變形,影響車牌的檢測和分割。就圖像的旋轉(zhuǎn)傾斜的問題,更多的情況下,圖像的水平校正是放在車牌的二值化和分割,甚至是在車牌字符切分之后再進(jìn)行,這樣圖像的運(yùn)算量大大減少。然而,傾斜的車牌圖像本身就極不利于車牌字符的切分,因此,將圖像水平校正放在圖像預(yù)處理過程中是切實可行的11。一般情況下,可將傾斜的車牌圖像近似看成一個平行四邊形,它有三種傾斜模式:水平傾斜見圖3-3,垂直傾斜見圖3-4和水平垂直傾斜見圖3-5,分別如下所示。水平傾斜時,字符基本上無傾斜,車牌的水平軸與圖像坐標(biāo)系的水平軸有一個傾斜角度,只要求取,將圖像繞軸

42、旋轉(zhuǎn)即可。垂直傾斜時,傾斜實際上是同一行間像素的錯位偏移,只要檢測到垂直傾斜角度進(jìn)行錯位偏移校正即可。水平垂直傾斜時,既存在水平傾斜又存在垂直傾斜,是最一般的情況??上葯z測水平傾斜角度,進(jìn)行水平傾斜校正,然后再求取垂直傾斜角度進(jìn)行垂直傾斜校正。對車輛牌照做預(yù)處理以后就可以進(jìn)行字符分割的步驟。(a) 水平傾斜() (b) 水平傾斜() 圖3-3 水平傾斜(a) 垂直傾斜() (b) 垂直傾斜() 圖3-4 垂直傾斜(a) 水平垂直傾斜() (b) 水平垂直傾斜() 圖3-5 水平垂直傾斜3.2 字符分割方法簡介圖像分割是一種基本的計算機(jī)視覺技術(shù),是由圖像處理進(jìn)行到圖像分析的關(guān)鍵步驟,這是因為圖像

43、的分割、目標(biāo)的分離、特征的提取和參數(shù)的測量將原始圖像轉(zhuǎn)化為更抽象更緊湊的形式,使得更高層的分析和理解成為可能。圖像分割多年來一直得到人們的高度重視,至今已提出各種類型的分割算法12。字符分割的算法很多,通常根據(jù)處理對象的不同有許多相應(yīng)的方法。為了實現(xiàn)更好的分割,有關(guān)景物的總體知識和先驗信息是很有用的,根據(jù)包含在圖像中的信息,可以定制相應(yīng)的判決準(zhǔn)則和控制策略,使其完成自動分割,比如對多行文本的處理,郵政部門對郵政編碼和地址的識別,金融等部門對支票簽名手寫字跡的分割識別等等,都是針對具體的不同研究對象而采用不同的算法。傳統(tǒng)的字符分割算法可以歸納為以下三類:直接的分割法,基于識別基礎(chǔ)上的分割法,自適

44、應(yīng)分割線聚類法13。直接的分割法簡單,但它的局限是分割點(diǎn)的確定需要較高的準(zhǔn)確性;基于識別結(jié)果的分割是把識別和分割結(jié)合起來,但是需要識別的高準(zhǔn)確性,它根據(jù)分割和識別的耦合程度又有不同的劃分;自適應(yīng)分割線聚類法是要建立一個分類器,用它來判斷圖像的每一列是否是分割線,但是對于粘連的字符是很難訓(xùn)練的。因為分割不可能做到完全正確,現(xiàn)在有的算法已經(jīng)把字符的分割作為不必要的步驟,而是直接把字符組成的單詞當(dāng)作一個整體來識別。利用諸如馬爾可夫數(shù)學(xué)模型等方法進(jìn)行處理,這主要是應(yīng)用于文本識別。以上的字符分割算法均是基于二值圖像進(jìn)行的??紤]到二值圖像丟失掉了很多信息,而且可能會造成字符粘連、模糊或斷裂的缺陷,對灰度圖

45、像的直接處理已經(jīng)有人開始研究。在一般的字符識別系統(tǒng)中,字符識別之前要經(jīng)過閾值化過程和行字切分過程,以分割出一個具體的二值表示的字符圖像點(diǎn)陣,作為單字符識別的輸入數(shù)據(jù)。其中,識別字符過程中的第一步就是要將獲得的數(shù)字灰度圖像轉(zhuǎn)變?yōu)閿?shù)字二值圖像,這個過程稱為二值化過程,采用的技術(shù),通常稱為閾值化技術(shù)。由于獲得的文本圖像不但包含了組成文本的一個個字符,而且包含了字符行間與字間的空白,甚至還會帶有各種標(biāo)點(diǎn)符號,這就需要采用一定的處理技術(shù),將文本中的一個個字符切分出來,形成單個字符的圖像陣列,以進(jìn)行單字識別處理。這就是字符文本的行字切分問題,分為行切分和字切分兩個主要步驟,首先由行切分得到一行行文本字行,

46、然后在文本字行中進(jìn)行列切分得到一個個單獨(dú)的字符點(diǎn)陣。車牌的字符切分是在車牌定位的基礎(chǔ)上,對取出的牌照圖像區(qū)域進(jìn)行下一步處理,定出牌照上每一個字符的上下左右邊界,從而將牌照上的字符完整準(zhǔn)確地切割下來,作為下一步字符識別的數(shù)據(jù)源。牌照切分是在二值圖上進(jìn)行的。字符切分分為兩步進(jìn)行,先進(jìn)行字符的垂直切分,定出每個字符的左右邊界,然后進(jìn)行字符的水平切分,定出每個字符的上下邊界。字符切割過程往往容易被人忽視,但是它對于字符識別的重要性是不言而喻的,因為切割錯誤的字符被正確識別的概率基本上等于零。3.3 系統(tǒng)采用的分割方法 根據(jù)以上介紹的算法,本文采用了一種比較實用的方法,通過對圖像的掃描,得到分割的字符。

47、 算法介紹經(jīng)過處理后的車牌可以進(jìn)行字符分割,本文的分割算法如下:1、先自上而下對圖像進(jìn)行逐行掃描直至遇到第一個黑色象素點(diǎn)。記錄下來。然后在自下而上對圖像進(jìn)行逐行掃描直至找到第一個黑色象素,記錄下來。這樣就可以找到圖像的大致高度范圍。2、在上面得到的高度范圍內(nèi)對圖像進(jìn)行自左向右逐列進(jìn)行掃描,遇到第一個黑色象素時認(rèn)為是字符分割的起始位置,然后繼續(xù)掃描,直至遇到有一列中沒有黑色象素,則認(rèn)為是第一個字符分割結(jié)束,然后繼續(xù)掃描,按照上面的方法一直掃描到圖像的最右端。這樣就得到了每個字符比較精確的寬度范圍。3、在已知的每個字符的比較精確的寬度范圍內(nèi),按照第一步的方法,分別進(jìn)行自上而下和自下而上的逐行掃描來

48、獲取每個字符精確的高度范圍。經(jīng)過以上3個步驟的循環(huán),就可以實現(xiàn)字符的分割。字符分割以后要做歸一化和緊縮排列,以便做特征提取14。因為掃描進(jìn)來的圖像字符大小存在差異,而相對來說,統(tǒng)一尺寸的字符識別的標(biāo)準(zhǔn)性更強(qiáng)準(zhǔn)確率自然也更高,標(biāo)準(zhǔn)化圖像就是要把原來各不相同的字符統(tǒng)一到同一尺寸,在本系統(tǒng)中是統(tǒng)一到同一高度然后根據(jù)高度來調(diào)整字符的寬度。具體算法為:先得到原來字符的高度,并與系統(tǒng)要求的高度作比較,得出要變換的系數(shù),然后根據(jù)得到的系數(shù)求變換后應(yīng)有的寬度。在得到寬度高度之后,把新圖像里面的點(diǎn)按照插值的方法映射到原圖像中。圖像標(biāo)準(zhǔn)歸一化的高度和寬度信息可以通過一個對話框輸入,但為了以后特征提取的時候處理方便

49、。建議歸一化的寬度為8,高度為16。經(jīng)過標(biāo)準(zhǔn)歸一化處理后的各字符在圖像中的位置不定,要對它進(jìn)行特征提取處理起來比較麻煩,所以要把歸一化處理后的字符進(jìn)行緊縮排列,以形成新的位圖句柄,以方便下一步的提取工作至此已經(jīng)基本上完成圖像中字符的分割工作。此外還可以采用其他方法以達(dá)到更好的效果。 算法的實現(xiàn)根據(jù)以上算法在VC+中用C+語言編程,可以實現(xiàn)字符分割,并實現(xiàn)字符的歸一化和緊縮排列。實驗中的字符分割函數(shù)為CharSegment();DrawFrame()函數(shù)用來給分割后的字符周圍畫邊框;StdDIBbyRec()函數(shù)用來實現(xiàn)歸一化處理;緊縮排列由函數(shù)AutoAlign()完成。下面圖3-6顯示了分割

50、算法實現(xiàn)流程: 圖3-6 分割算法的實現(xiàn)流程3.4 字符分割實驗結(jié)果實驗結(jié)果如下面幾幅圖所示,為了便于觀察分割結(jié)果,每個被分割后的字符都用方框分割開來。從實驗可以得出,該字符分割模塊基本上可以完成大部分的數(shù)字字符分割。圖3-12中“川”字被分割成了三份,這說明分割算法的正確性,但它對漢字的分割卻是錯誤的。圖3-13中為了可以清楚的觀察字符的緊縮排列,歸一化的字符寬度為12,高度為24(圖3-11中的字符寬度為8,高度為16)。由于漢字結(jié)構(gòu)比較復(fù)雜,所以該算法不能對漢字作字符的分割。在實驗時,圖中如果含有漢字,則系統(tǒng)就會出現(xiàn)錯誤而拒絕作字符分割,實現(xiàn)漢字分割還需要作進(jìn)一步改進(jìn)。圖3-7字符分割的

51、結(jié)果 圖3-8 緊縮排列的結(jié)果 圖3-9 車牌的字符分割結(jié)果 圖3-10 車牌的字符緊縮排列結(jié)果 第4章 特征提取與字符識別經(jīng)過上面的一系列變換,車牌中的字符被分割提取出來。下面就要從被分割歸一化處理完畢的字符中提取最能體現(xiàn)這個字符特點(diǎn)的特征向量。將提取出的訓(xùn)練樣本中的特征向量代入BP網(wǎng)絡(luò)之中就可以對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,提取出待識別樣本的特征向量代入到訓(xùn)練好的BP網(wǎng)絡(luò)中,就可以對字符進(jìn)行識別。4.1 字符的特征提取特征提取的方法多種多樣,有逐象素特征提取法,骨架特征提取法,垂直方向數(shù)據(jù)統(tǒng)計特征提取法,13點(diǎn)特征點(diǎn)提取法,弧度梯度特征提取法等很多種方法,根據(jù)具體情況的不同我們可以選擇不同的方法。1、逐

52、象素特征提取法這是一種最簡單的特征提取方法,對圖像進(jìn)行逐行逐列的掃描,當(dāng)遇到黑色象素時取其特征值為1,遇到白色象素時取其特征值為0,這樣當(dāng)掃描結(jié)束以后就形成了一個維數(shù)與圖像中象素點(diǎn)的個數(shù)相同的特征向量矩陣。2、骨架特征提取法兩幅圖像由于它們的線條的粗細(xì)不同,使得兩幅圖像的差別很大,但將它們的線條細(xì)化后,統(tǒng)一到相同的高度,這時兩幅圖像的差距就不那么明顯。利用圖形的骨架作為特征來進(jìn)行數(shù)碼識別,就使得識別有了一定的適應(yīng)性。一般使用細(xì)化的方法來提取骨架,細(xì)化的算法很多如Hilditch算法、Rosenfeld算法等。對經(jīng)過細(xì)化的圖像利用EveryPixel函數(shù)進(jìn)行處理就可以得到細(xì)化后圖像的特征向量矩陣

53、。骨架特征提取的方法對于線條粗細(xì)不同的圖像有一定的適應(yīng)性,但圖像一旦出現(xiàn)偏移就難以識別。3、垂直方向數(shù)據(jù)統(tǒng)計特征提取法這種算法就是自左向右對圖像進(jìn)行逐列的掃描,統(tǒng)計每列黑色象素的個數(shù),然后自上向下逐行進(jìn)行掃描,統(tǒng)計每行的黑色象素的個數(shù),將統(tǒng)計結(jié)果作為字符的特征向量,如果字符的寬度w,長度為h,則特征向量的維數(shù)是w+h。該提取方法的缺點(diǎn)是適應(yīng)性不強(qiáng),當(dāng)字符存在傾斜和偏移時都會對識別產(chǎn)生誤差。4、13點(diǎn)特征點(diǎn)提取法首先把字符平均分成8份,統(tǒng)計每一份內(nèi)黑色象素點(diǎn)的個數(shù)作為8個特征,分別統(tǒng)計這8個區(qū)域黑色象素的數(shù)目,可以得到8個特征。然后統(tǒng)計水平方向中間兩列和豎直方向中間兩列的黑色象素點(diǎn)的個數(shù)作為4個特征,最后統(tǒng)計所有黑色象素點(diǎn)的個數(shù)作為第13個特征。也就是說,畫4道線,統(tǒng)計線穿過的黑色象素的數(shù)目??梢缘玫?個特征示意圖,最后將字符圖像的全部黑色象素的數(shù)目的總和作為一個特征總共即得到13個特征。13特征提取法有著極好的適應(yīng)性,但是由于特征點(diǎn)的數(shù)目太少所以樣本訓(xùn)練的時候比較難收斂。系統(tǒng)采用了第一種方法即逐象素特征提取法做特征提取。因為這種方法算法簡單,運(yùn)算速度快,可以用BP網(wǎng)絡(luò)很快的收斂,訓(xùn)練效果好。4.2 字符的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論