版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
本科畢業(yè)論文(設計)論文(設計)題目:汽車牌照識別系統(tǒng)的研究——車牌字符分割學院:專業(yè):班級:學號:學生姓名:___指導教師:年月日第PAGEV頁貴州大學本科畢業(yè)論文(設計)
目錄TOC\o"1-3"\h\u29019目錄 I26200摘要 IV3606Abstract V26542第一章緒論 1311341.1論文研究的目的 1297181.2論文研究的背景和意義 237211.3國內(nèi)外研究現(xiàn)狀 34493第二章車牌識別系統(tǒng)的構(gòu)成 54072.1系統(tǒng)基本組成框架 5137372.2車牌圖像的提取 6324002.3車牌的定位 6244332.3.1車牌圖像定位研究現(xiàn)狀 623642.3.2車牌圖像定位實現(xiàn)方法 726883第三章圖像的預處理 9109863.1色彩校正、圖像增強 959993.2灰度化 10310743.2.1灰度變化的實現(xiàn) 10252033.2.2圖像的灰度拉伸 12108073.3二值化 13314753.3.1全局化閾值 14158263.3.2自適應閾值 1436913.4去噪 15265433.5車牌的傾斜校正 16303753.5.1車牌的傾斜類型 17178243.5.2以線性回歸法對車牌圖像的校正 1816518第四章車牌字符的分割 20179404.1字符切割研究現(xiàn)狀 2024554.2車牌上字符的基本特征 20239924.3投影法分割字符 22296414.4粗切割方法 23283894.4.1車牌圖像上字符的粗切割 23101304.4.2去掉車牌圖像上字符的多余空間 2465864.5連通域提取的車牌字符分割 25246184.5.1連通域矩形的位置關系 2586614.5.2連通域的合并 2668674.5.3連通域提取字符分割 27161364.5.4誤連接區(qū)的分割 282382第五章車牌字符的識別算法分析 2962685.2歸一化 29104655.3神經(jīng)網(wǎng)絡對車牌字符的識別 30261415.3.1神經(jīng)網(wǎng)絡概述 30109035.4.2神經(jīng)網(wǎng)絡的工作過程 30210675.5漢字部分字符識別 32324355.5.1支持矢量機基本原理 32179525.5.2基于SVM的車牌漢字識別 3393105.6車牌數(shù)字字母部分字符識別 3323749第六章總結(jié)與展望 35102646.1總結(jié) 35242486.2展望 3620093參考文獻 3727628致謝 385718附錄 39
汽車牌照識別系統(tǒng)的研究——車牌字符分割摘要本文主要介紹了車牌識別的過程,車牌識別系統(tǒng)是制約道路交通智能化的重要因素,其流程主要包括圖像采集、圖像預處理與圖像識別,車牌字符的分割是圖像預處理的一個重要處理過程。由于車牌圖像攝取的特殊性以及車牌本身的破損,使得車牌圖像上的字符通常模糊不清,而破損不清晰的車牌圖像對于字符的分割是很困難的,因此車牌字符的分割已成為汽車牌照識別系統(tǒng)中一個必需解決的問題。本設計主要對車牌圖像的分割方法的構(gòu)成原理及算法實現(xiàn)進行了詳細分析,并用軟件實現(xiàn)了完整的系統(tǒng)。使用MATLAB軟件編程實現(xiàn)了整個系統(tǒng),并驗證了所提出的方法的可行性。本文主要給出了車牌字符分割的幾種方法,并詳細介紹了完成圖像分割的原理、算法、具體程序?qū)崿F(xiàn)過程、仿真結(jié)果及各自的優(yōu)缺點。關鍵詞:車牌識別,字符分割,圖像處理,MATLAB
AbstractThearticleintroducestheprocessoflicenseplaterecognitionwhoselaggardrestrainstheroadtrafficfrombeingintelligent.Theproceduresmainlyincludeimageacquisition,imagepre-processingandimagerecognition,andthelicenseplatecharactersegmentationisanimportantprocessofimagepre-processing.Duetotheparticularityoflicenseplateimagecaptureandlossofthelicenseplateitselfmakingthecharactersonthelicenseplateimageisusuallyblurred,Whilethedamageandunclearlicenseplateimagescausecharacterssegmentationdifficult,sothelicenseplatecharactersegmentationhasbecomeaproblemthatmustbesettledinlicenseplaterecognitionsystem.ThisdesignanalysestheprincipleandalgorithmofthecompositionofthelicenseplateimagesegmentationmethodtoachieveadetailedanalysisofacompletesystemandsoftwareimplementationusingMATLABsoftwaretoprogramtheentiresystem,andverifythethefeasibilityoftheproposedmethod.Thispapergivesseveralmethodsoflicenseplateimagesegmentationanddetailsoftheprincipletocompletetheimagesegmentationalgorithm,specificproceduresfortheimplementationprocess,thesimulationresultsandexpoundstheiradvantagesanddisadvantages.Keywords:licenseplaterecognition,charactersegmentation,imageprocessing,,MATLAB第48頁貴州大學本科畢業(yè)論文(設計)
第一章緒論1.1論文研究的目的論文的主要目的有兩個方面;一是對我們的基礎知識進行一次全面的考核。二是對我們進行科學研究基本功的訓練,培養(yǎng)我們綜合運用所學知識獨立地分析問題和解決問題的能力,為以后的工作打下良好的基礎與創(chuàng)新意識。
大學本科畢業(yè)論文的撰寫是對大學生所學基礎知識的最后一次全面性的檢驗,是對我們基本理論、基本知識與基本的技能掌握跟提高的一次總的測試。在大學期間,我們雖然已經(jīng)按照學校教學計劃中的規(guī)定,完成了基礎課、公共課、選修課跟相關專業(yè)的科目,并且每一門學科也都通過了學校的考查或考試。但是在校期間的這些考試是單方面進行的。這些考試的主要目的是考察學生對所學科目的一些基本知識的理解程度和記憶程度。跟畢業(yè)論文相比則不同,畢業(yè)論文不是單方面的對我們大學生進行某一課程的基本知識進行考察,而是著重考查我們應用所學到的基本知識來對一些問題進行深度的研究和探討的能力。要做好畢業(yè)設計,它不僅要系統(tǒng)地了解和應用我們所學到的專業(yè)基本知識,還要要求我們有寬廣的知識,并且同時也要具有一定的寫作功底和邏輯思維推導能力。這樣一來就使得我們不僅需要有良好的基礎知識和公共科目的知識,而且更需要具有深厚的專業(yè)知識和良好的創(chuàng)新能力。通過論文的寫作,使我們發(fā)現(xiàn)自己的長處和短處,以便在今后的工作中有針對性地克服缺點。畢業(yè)論文的撰寫是培養(yǎng)我們的科學研究能力,讓我們在學大學生初步掌握對科學研究所需要的基本方法和程序。在我們畢業(yè)后,不論從事何種工作,都必須具有一定的研究和寫作能力。大學是高層次的教育,其培養(yǎng)的人才應該具有開拓精神,既有較扎實的基礎知識和專業(yè)知識,又能發(fā)揮無限的創(chuàng)造力,不斷解決實際工作中出現(xiàn)的新問題;既能運用已有的知識熟練地從事一般性的專業(yè)工作,又能對人類未知的領域大膽探索,不斷向科學的高峰攀登。
另外撰寫畢業(yè)論文的過程是訓練我們獨立進行科學研究的過程。通過撰寫畢業(yè)論文,可以使學生了解科學研究的過程,掌握怎樣調(diào)查、怎樣觀察和作樣本的分析;怎樣收集、整理和利用材料;怎樣在網(wǎng)上收索文獻資料,怎樣使用圖書館里的相關書籍;怎樣操作實驗儀器等諸多方法。撰寫大學生本科畢業(yè)論文,是我們對科學研究的過程的學習的一個很好的機會!因為在論文的寫作過程中不僅有老師的傳授與指導,可以讓我們減少一些錯誤,讓我們少走一些彎路,而且還可以直接參與并親身體驗科學的研究工作中所涉及到的全部過程和各環(huán)節(jié),是一次系統(tǒng)的、全面的實踐機會。在寫論文的過程同時也是專業(yè)基礎知識更深一步學習的過程,并且是更加的生動、更加深入、更加切實的專業(yè)基礎知識全面學習的一個過程。首先,寫做大學生本科畢業(yè)論文是與科研課題相結(jié)合,把在學校學過的相關專業(yè)基礎知識應用于實際之中,在實際和理論結(jié)合的過程中更進一步的消化和加深、鞏固自己所學到的相關專業(yè)基礎知識,并且把所學到的專業(yè)基礎知識轉(zhuǎn)變?yōu)榻鉀Q和分析問題的一種能力;其次,當我們在調(diào)查研究和搜集所用材料、接觸到實際操作的整個過程當中,既可以學到很多學校和課本里面學不到的、活生生的全新的知識,也可以通過實踐來印證所學過的課本知識。1.2論文研究的背景和意義隨著社會經(jīng)濟的發(fā)展,人民生活水平的不斷提高,私人擁有機動車輛的數(shù)量迅速增加,車輛普及成為必然的趨勢。在此情況下,伴隨而來的交通事故、違章逃逸屢見不鮮,但僅僅依靠大力發(fā)展和改造交通設施,現(xiàn)在已經(jīng)不能解決掉交通事故的發(fā)生、交通比較擁擠和環(huán)境污染越來越嚴重等問題。雖然世界上的諸多國家仍然主要靠修建更多的公路基本設施并建設完善的公路網(wǎng)絡來緩解交通擁擠的問題,但由于修建新的道路所需要的資金比較多以及環(huán)境污染嚴重呢的壓力和城市空間的不斷減小將使得建設道路的空間將受到限制。因此,只有道路建設和現(xiàn)代化管理齊頭并進,在加強交通建設的同時,大力發(fā)展智能交通系統(tǒng),才有可能真正地解決日益嚴重的交通問題。車輛牌照識別(LPR)技術是智能交通系統(tǒng)中的一個重要環(huán)節(jié),它在交通監(jiān)視和控制中占有很重要的地位,車輛牌照識別技術作為交通信息服務系統(tǒng)的重要手段,其任務是分析處理車輛圖像,自動識別汽車牌號碼。為了避免人工干預所帶來的弊端,提高管理效率,對車輛牌照自動識別系統(tǒng)的需求和標準的要求越來越高。汽車牌照自動識別技術己經(jīng)越來越受到人們的重視。車牌牌照自動識別系統(tǒng)的目的是在車輛圖像中自動定位牌照位置并識別牌照號碼,是數(shù)字圖像處理與模式識別技術的典型應用。系統(tǒng)可以解決通緝車輛、停車場交通堵塞等問題;還可以通過最簡單的方式完成交通部門的車輛信息聯(lián)網(wǎng),解決數(shù)據(jù)統(tǒng)計自動化,模糊查詢的問題。系統(tǒng)在橋梁路口自動收費、停車場無人管理的黑名單和自動放行方面、違章車輛自動記錄等領域也有著廣泛的應用。車牌圖像由于受到采集鏡頭與車牌之間的距離,道路坡度,汽車駕駛速度,司機所掛車牌位置以及車牌本身的破損等原因,導致車牌在采集圖像的時候會出現(xiàn)圖像不清晰、傾斜、字符邊緣破損等問題。這就為后期車牌圖像的進一步處理帶來了一定的困難,因此在圖像預處理的字符分割階段顯得非常的重要。于是,對于車牌圖像字符的分割的研究便也顯得具有十分重要的意義。下面是車牌識別系統(tǒng)在生活當中的應用。EQ\o\ac(○,1).小區(qū)和停車場管方面的管理:在智能的停車場和小區(qū)中,應用汽車牌照識別系統(tǒng)之后,對出入的車輛就能夠不停車直接通過入口,而且系統(tǒng)就可以及時的識別出車牌號,并將車輛的信息經(jīng)過網(wǎng)絡傳送到停車場或小區(qū)的管理系統(tǒng)中,這樣就免去了管理人員干擾,可以節(jié)省人力和物力。=2\*GB3②.交通道路的監(jiān)控:在道路交通的檢測部門中,每天都會出現(xiàn)大量的違規(guī)車輛。對于那些列進“黑名冊”中的車輛,比如那些肇事過后逃跑的車輛和那些已經(jīng)掛失過的車輛與那些欠費過的汽車等,我們通常可以將這些車的車牌用攝像機錄制成視頻記錄下來。如果通過人工識別并比較車牌號碼,這樣會導致工作的效率會讓你低,而且容易出現(xiàn)錯吳,大事應用汽車牌照識別系統(tǒng),就只要把車輛的信息輸入到系統(tǒng)當中去,系統(tǒng)就可以在二十四小時之中連續(xù)的對過往的車進行自動的檢測。對于車牌號碼識別之后做比較并處理,如果符合條件就立刻報警。EQ\o\ac(○,3).收費站管理系統(tǒng):在橋梁、高速公路與隧道等諸多地點,我們將LPR系統(tǒng)應用在收費站管理系統(tǒng)當中,就可以實現(xiàn)效率高、自動、準確和不停收費,這樣就能真正的實現(xiàn)了無人干預的過程,克服平常的收費系統(tǒng)中的工作量較大和人工容易產(chǎn)生疲勞等等的不足,汽車牌照識別系統(tǒng)極大的減少了勞動的強度,也節(jié)省了大量物力和人力。同時,對于那種不停車的收費系統(tǒng)還能夠節(jié)省司機的大量開車時間。=4\*GB3④.車流統(tǒng)計、車牌驗證和移動車載系統(tǒng)汽車牌照識別系統(tǒng)也能夠應用在路橋卡口和交通管理部門等單位進行車流量的統(tǒng)計。在移動車載之中,應用汽車牌照識別系統(tǒng)可以對街道和公路等比較復雜的地點的車輛進行車輛的牌照識別。這樣有利于了管理部門的監(jiān)管、巡視和處理突發(fā)的情況。同時,LPR的基本方法我們還可運用到其他的識別和檢測領域。所以對汽車牌照識別的問題已經(jīng)成為了交通工程這個領域中比較重點的研究話題之一。從上面的介紹中可以看出,車輛識別系統(tǒng)在道路交通監(jiān)控、交通事故現(xiàn)場勘察、交通違章自動紀錄、高速公路自動收費系統(tǒng)、停車場自動安全管理等方面有著廣泛的應用前景,所以其研究的意義是非常大的。1.3國內(nèi)外研究現(xiàn)狀目前,對于數(shù)字圖像處理方法是車牌自動識別中最為常用和最為有效的方法。車牌識別系統(tǒng)的兩個重要指標是識別速度和識別精度。隨著計算機技術的發(fā)展,計算機處理能力越來越強,識別速度有了很大的提高,隨著LPR技術的發(fā)展,國內(nèi)外中都有很多關于車牌號碼識別這一方面地研究報道。國內(nèi)也有大量的學者從事這方面的研究,中國科學院自動化所的劉智勇等發(fā)表文章針對車牌特點,設計了一個變換函數(shù)來突出其特點,從而進行車牌提取,該方法采用最大方差法來進行二值化閩值的選取,并對二值化后的圖像進行水平掃描,找出候選區(qū)域。他們用一個樣本的數(shù)目為3281的樣本集合中,車牌的識別準確率為98,52%。分割準確率是96.51%,從那個時候看來這應該是一個很高的指標了,這套系統(tǒng)在后來和另一家公司所用的車牌識別系統(tǒng)有著很大的連系。在國外對這方面的一些研究工作發(fā)展的也比較早,在其中就有幾個比較具有代表意義的工作:R.Mullot等開發(fā)了一種可以用在集裝箱的識別,還可以用在車牌識別的系統(tǒng),這種系統(tǒng)它主要是通過文字的紋理在車牌圖像中的一些共性來進行識別和定位。車牌識別與集裝箱的識別共用一套硬件系統(tǒng)。Youngsungso開發(fā)出一套實時車牌識別系統(tǒng),據(jù)報道該系統(tǒng)的車牌定位正確率達到99.2%。日本在車牌圖像的獲取的方面作了大量的研究,并為系統(tǒng)產(chǎn)業(yè)化作了大量的工作。
第二章車牌識別系統(tǒng)的構(gòu)成牌照自動識別是一項利用車輛的動態(tài)視頻或靜態(tài)圖像進行牌照號碼、牌照顏色自動識別模式識別技術。有一些汽車車牌號碼識別系統(tǒng)還可以過視頻所采集到的圖像來判斷車輛的駛?cè)胍曇肮δ芊Q作視頻車輛的檢測。其硬件的基礎一般都包括了攝像裝置、觸發(fā)裝置、照明裝置、圖像采集裝置和對車牌號碼識別的計算機等,其軟件的核心部分包括車牌定位的算法、車牌字符的分割算法跟字符的識別算法等。對于一個完整地車牌識別系統(tǒng)來說還應包括車輛的檢測、牌照的識別、圖像的采集等幾部分。當車輛經(jīng)過識別系統(tǒng)所管轄的區(qū)域時,檢測裝置檢測出車輛處在觸發(fā)單元的范圍,然后圖像采集裝置就提取當前的一些視頻圖像。后由牌照識別裝置對采集到的圖像進行預處理,并定位牌照的位置,在將牌照里面的有用字符分割出來后進行識別,最后組成車牌號碼并輸出。2.1系統(tǒng)基本組成框架車牌識是一輛汽車獨一無二的信息,因此,對車輛牌照的識別技術可以作為辨識一樣車最為有效地方法。車牌識別系統(tǒng)包括攝取的汽車圖像,車牌號碼的識別,車牌圖像的采集和預處理,牌照區(qū)域的定位和提取,牌照字符的分割和識別等幾個部分組成,如圖2.1所示。圖2.1車牌識別系統(tǒng)流程圖2.2車牌圖像的提取如圖2.2所示:當有汽車經(jīng)過時,車輛檢測單元(這里指的是地感裝置)就會受到觸發(fā),接著圖像采集裝置會被觸發(fā)自動獲取車輛上的反面或正面圖像,并且將所采集到的圖像傳送至計算機上處理,經(jīng)車牌定位裝置提取出車牌,由字符分割裝置對車牌上面的字符進行分割,最后再經(jīng)過字符識別裝置進行字符的識別并且將識別的結(jié)果傳送到監(jiān)控中心去或收費處一些應用場合。圖2.2車牌圖像提取2.3車牌的定位2.3.1車牌圖像定位研究現(xiàn)狀因為車牌圖像的定位對于整個識別系統(tǒng)對牌照的識別的成功與失敗起著很關鍵性地作用;所以國內(nèi)外的許多研究員在研究車牌智能識別系統(tǒng)這一領域時,很早就開始對其進行了深入的研究。目前在研究車牌圖像定位與提取方面主要有兩種技術。第一種技術就是原始的黑白二值化基于灰度級的圖像處理技術。當然這種方法出現(xiàn)的根源是因為存計算機發(fā)展的早期,由于受到了計算機硬件,如內(nèi)存、CPU的速度方面的限制而不得不采取的圖像處理技術。這種技術的主要局限性就是誤識率比較高,而且無法提供車牌顏色等方面的信息。第二種技術是彩色圖像處理技術。這種技術的基本思想就是車牌顏色(包括文字的顏色和車牌的背景顏色)是車牌的重要特征,不同種類的車輛的車牌有不同的顏色模式。近年來,隨著計算機技術的發(fā)展和硬件價格的大幅度地下降,有很多學者在車牌的處理方面應用了后一種彩色圖像處理技術。這種技術又可以分為四種方法:(1)利用彩色邊緣術和區(qū)域生長相結(jié)合的方法來共同定位和提取車牌;(2)首先利用神經(jīng)網(wǎng)絡技術對圖像進行顏色分割,然后計算車牌底色的水平和垂肖投影值,最后根據(jù)車牌的寬高比相定位和提取車牌;(3)利用顏色空間距離和相似度進行車牌的底色的顏色分割,再利用投影法根據(jù)車牌的寬高比確定侯選車牌區(qū)域.最后對侯選車牌區(qū)域的灰度圖像進行紋琿分割來定位和提取車牌。(4)基于邊緣顏色對來對車牌圖像進行提取和定位。雖然,這些方法都有自己的優(yōu)點:但是它們也或多或少存在著一定的缺點。2.3.2車牌圖像定位實現(xiàn)方法牌照的定位從圖像處理的意義上來說就是從一幅隨機圖像中找出一塊具有某種特征的區(qū)域,該區(qū)域中包含了汽車牌照。這種特征就是牌照本身區(qū)別于圖像其他部分的特征。根據(jù)特征提取的不同,牌照定位的方法也就有很大的不同:=1\*GB3①.利用牌照具有四邊形邊框的特點,通過檢測圖像中的長直線段,然后用一定的約束條件進行搜索的方法來確定牌照的位置。這種方法定位的精度較高,但是易受到噪聲的影響。且對有些邊框磨損、不明顯的牌照效果不好。=2\*GB3②.利用統(tǒng)計投影直方圖的方法,通過對含有汽車的圖像水平和垂直兩個方向的灰度投影直方圖的分析,來推斷出汽車牌照的位置,如圖2.3所示。這種方法優(yōu)點是對圖像中的噪聲不敏感,缺點是定位精度不夠高。=3\*GB3③.區(qū)域生長法是對邊緣圖像進行均勻性區(qū)域生長以獲得潛在車牌區(qū)域,然后利用車牌的幾何特征以及車牌區(qū)域內(nèi)的邊緣灰度直方圖統(tǒng)計特征刪除偽車牌,即得到真實車牌。=4\*GB3④.DTF變換法是先對圖像逐行做DTF變換,然后把頻率系數(shù)逐行累加平均,并根據(jù)這些平均值做出頻率譜曲線,根據(jù)頻譜曲線中的“峰”的起始點位置確定車牌水平位置,對這一水平區(qū)域逐列做DTF變換可確定車牌豎直位置。=5\*GB3⑤.近年來又出現(xiàn)了基于彩色汽車圖像牌照定位的方法。這種方法主要是利用我國汽車牌照字符與底色對比較多,彩色圖像比灰度圖像能夠更多的視覺信息并對各種光照不敏感等特點。這種方法也取得了較好的效果。本文采用的是統(tǒng)計投影直方圖的方法來對車牌圖像的定位,定位后的圖像如下所示:圖2.3水平和垂直兩個方向的灰度投影直方圖圖2.4車牌定位后的圖像
第三章圖像的預處理3.1色彩校正、圖像增強本文采用的是RGB轉(zhuǎn)化為CIE-XYZ系統(tǒng)來進行運算。CIE國際照明委員會選取的標準紅、綠、藍三種光的波長分別為:紅光,R,波長=700nm綠光,G,波長=546nm藍光,B,波長=435.8nm任何光的顏色可以表示為式(3.1)所示:C=Rr+Gg+Bb(3.1)其中權(quán)值r/g/b為需要R/G/B三色光的相對量,即三刺激值,這個系統(tǒng)被稱為CIE-RGB系統(tǒng)。在此系統(tǒng)中,三刺激值可能是負數(shù),由于實際上不存在負的光強,而且這種計算極不方便,不易理解,1931年的CIE-XYZ系統(tǒng)利用三種假想的標準原色X(紅)、Y(綠)、Z(藍),能夠使得到的顏色的三刺激值都是正值。即在CIE-XYZ系統(tǒng)中,任意光的顏色可以表示為:C=Xx+Yy+Zz(3.2)而且x/y/z均為正。由XYZ在坐標平面形成的虛線三角形將整個光譜軌跡包含在內(nèi)。因此整個光譜色變成了以XYZ三角形作為色域的域內(nèi)色。在XYZ系統(tǒng)中所得到的光譜三刺激值和色度坐標x、y、z將完全變成正值。經(jīng)數(shù)學變換,兩組顏色空間的三刺激值有以下關系:X=0.490R+0.310G+0.200BY=0.177R+0.812G+0.011BZ=0.010G+0.990B兩組顏色空間色度坐標的相互轉(zhuǎn)換關系為:x=(0.490r+0.310g+0.200b)/(0.667r+1.132g+1.200b)y=(0.117r+0.812g+0.010b)/(0.667r+1.132g+1.200b)z=(0.000r+0.010g+0.990b)/(0.667r+1.132g+1.200b)只要知道某一顏色的色度坐標r、g、b,即可以求出它們在新設想的三原色XYZ顏色空間的的色度坐標x、y、z。通過上式的變換,對光譜色或一切自然界的色彩而言,變換后的色度坐標均為正值,而且等能白光的色度坐標仍然是(0.33,0.33),沒有改變。由CIE-RGB系統(tǒng)按表的數(shù)據(jù),計算的結(jié)果。所有光譜色度坐標,,的數(shù)值均為正值。通過以上的變換,完全色彩簡單的校正與圖像增強。3.2灰度化用數(shù)碼相機獲取的圖像是彩色圖像,它由R、G、B三個單色調(diào)配而成。在汽車牌照分割中,也有一些基于彩色圖像的處理方法,但實際效果并不顯著,一般情況下,由CCD采集到的圖像會有不理想的情況,如光線過強,或者偏弱,這些都會對后續(xù)的圖像處理產(chǎn)生影響。而且車牌位于車身下部,靠近散熱片,對比度較差,此時若直接對灰度圖像進行定位會有不小的困難,為了獲得較好處理的灰度圖像,在對CCD采集的原始圖像進行灰度化后,要對其灰度轉(zhuǎn)換?;叶葓D(GrayScale)是指只包含亮度信息,不包含色彩信息的圖像,例如平時看到的亮度由暗到明連續(xù)變化的黑白照片。要表示灰度圖,就需要把亮度值量化,通常分成0~255共256個級別,O表示最暗(全黑),255表示最亮(全白)。由于256級灰度比較簡單,若是彩色圖像,其顏色種類較多,不利于圖像處理,因此一般部是將彩色圖像轉(zhuǎn)換為灰度圖進行處理。其轉(zhuǎn)化式可為式(3.3)。灰度值=O.299R+0.587G+0.114B(3.3)3.2.1灰度變化的實現(xiàn)顏色可以分為黑色和彩色,黑白是指顏色中不包含任何的色彩成分,僅由黑色、白色組成。在RGB模型中,如果R=G=B,則顏色(R、G、B)表示一種黑白顏色,其中R=G=B的值叫灰度值,所以黑白顏色又稱為灰度顏色,色彩和灰度之間可以相互轉(zhuǎn)換,由彩色轉(zhuǎn)換為灰度的過程叫做灰度化處理灰度花就是使彩色的R、G、B分量值相等的過程,由于R、G、B的取值范圍一般是0至255,所以灰度的級別只有256級,即灰度圖像只能表現(xiàn)256種灰度?;叶然幚淼姆椒ㄖ饕腥N:=1\*GB3①.最大值法:使R、G、B的值等于三者中最大的一個作為該點的灰度,即:R=G=B=max(R、G、B)(3.4)本方法會形成亮度很高的灰度圖像。=2\*GB3②.平均值法:用R、G、B的值求出平均值作為該點的灰度,即:R=G=B=(R+G+B)/3(3.5)本方法會形成較為柔和的灰度圖像。=3\*GB3③.加權(quán)平均值法:根據(jù)某種指標給R、G、B賦予不同的權(quán)值,取R、G、B的加權(quán)平均值作為該點的灰度,即:R=G=B()/3(3.6)式中的、、分別為R、G、B的權(quán)值。、、取不同的值,加權(quán)平均值法就會形成不同的灰度圖像。由于人眼對顏色的敏感最高,對紅色的敏感度次之,對藍色的敏感度最低,所以使>>將得到合理的灰度圖像。當=0.587,=0.229,=0.114時能得到最合理的灰度圖像。由于一般通過攝像機獲得的是RGB彩色圖,所以使用公式:Gray=(Red×299+Green×587+Blue×114)/1000(3.7)把圖像化為256級的灰度圖像,式中Gray是灰度值,Red、Green、Blue是像素的紅綠藍色彩分量?;叶然脑蛟谟冢弘m然色彩圖像包含了更多的信息,但同時也增加了處理的時間和難度。標準的24位彩色BMP圖像的一個像素需要用三個字節(jié)來表示,而256級的灰度BMP圖像一個像素只需要用一個字節(jié),轉(zhuǎn)換為灰度圖像可以使圖像的大小縮小為原來的1/3,對于節(jié)約硬盤容量、減小計算量來說都十分有必要。另外RGB彩色圖像也存在著缺點,在有些光照情況下色彩會發(fā)生失真,不能真實再現(xiàn)物體的原貌。在轉(zhuǎn)換為灰度圖像后同樣可以獲得足夠的圖像細節(jié),減少了不必要的干擾,降低處理的復雜。3.1車牌的灰度圖像3.2灰度圖的直方圖3.2.2圖像的灰度拉伸圖像的灰度拉伸變換和灰度的線性變換有點類似,都用到了灰度的線性變換。但不同之處在于灰度拉伸不是完全的線性變換,而是分段的線性變換。它的灰度變換函數(shù)的表達式可表示為:(3.8)它的圖,如下圖所示:圖3.3灰度拉伸變換上圖中橫軸為原灰度,縱軸為變換后的灰度,灰度拉伸可以更加靈活的控制輸出灰度直方圖的分布,它可以有選擇的拉伸某段灰度區(qū)間以改善輸出圖像。上圖所示的變換函數(shù)的運算結(jié)果是將原圖在和之間的灰度拉伸到和之間。如果一副圖像灰度集中在較暗的區(qū)域而導致圖像偏暗,可以用灰度拉伸功能來拉伸(斜率>1)物體灰度區(qū)間以改善圖像,同樣如果圖像灰度集中在較亮的區(qū)域而導致圖像偏亮也可以用灰度拉伸功能來壓縮(斜率<1)物體灰度區(qū)間以改善圖像質(zhì)量。3.3二值化二值圖像是指整幅圖像內(nèi)僅有黑、白二值的圖像,在它們之間不存在其它灰度層次的變化。二值化算法又稱閾值算法,目的是找出一個合適的閾值將待研究的車牌區(qū)域劃分為前景和背景兩部分。二值化后的車牌要能再現(xiàn)原字符圖像,基本不出現(xiàn)筆畫斷裂和粘連現(xiàn)象,盡量不丟失原字符的特征。另外二值化算法可以用于車牌定位過程中精確定位車牌的上下左右邊界。對圖像進行二值化可以給后續(xù)的分割識別工作帶來很大的方便。圖像的二值化算法很多,常用的二值化方法有直方圖統(tǒng)計法、固定門限法、動態(tài)閾值法、松弛法、抖動矩陣二值化法等。由于在光照較弱的情況下,車牌圖像的光照程度很不均勻,車牌字符與底色的對比度偏低,所以采取全局動態(tài)閾值法。全局動態(tài)閾值法對于目標物體和背景明顯分離、直方圖有明顯雙峰特性的效果較好,但也存在不足,主要是對于輸入圖像量化噪聲或不均勻光照等情況抵抗能力差,而局部自適應閾值法則對光照不均勻、噪聲干擾較大等較為復雜的情況更為有效。本文采用一種改進的限定閾值二值化算法,即先對圖像灰度拉伸,再設定閾值。因為對于前景和背景區(qū)別較大的車牌而言,其圖像灰度直方圖具有明顯的雙峰特征,進行灰度拉伸后,雙峰之間的波谷范圍變大,使得在不同光照下的照片得到共同的波谷范圍,在這段灰度范圍內(nèi)確定的閾值可以適用于不同的圖像?;叶壤旌?,在視覺上體現(xiàn)為增加了背景和前景的對比度。3.3.1全局化閾值采用閾值確定邊界的最簡單做法是在整個圖像中將灰度閾值的值設置為常數(shù)。如果背景的灰度值在整個圖像中可合理地看作為恒定,而且所有物體與背景都具有幾乎相同的對比度,那么,只要選擇了正確的閾值,使用一個固定的全局閾值一般會有較好的分割效果。如圖4-7所示,我們能夠看出該圖像的灰度級直方圖有兩個波峰和一個波谷;在這兩個波峰中第一個波峰是背景的灰度級直方圖,它的像素數(shù)目比較多,顏色比較淡。第二個波峰是物體的灰度級直方圖,它的像素數(shù)目相對于背景來說比較少,顏色比較濃。圖中的一個波谷對應于物體邊緣附近相對較少數(shù)目的點。在類似于這樣的情況下,通常使用固定閾值來對圖像進行二值化操作。這時候我們可以定義灰度閾值T對物體面積進行計算的表達式為:(3.9)顯然,如果閾值對應于直方圖的谷,閾值從T增加到T+AT只會引起面積略微減少。因此,在這種情況下我們就把閾值設在直方圖的波谷處,可以把閾值選擇中的小錯誤對面積測量的影響降到最低。3.3.2自適應閾值在許多情況下,背景的灰度值并不是一個常數(shù),物體顏色和背景顏色的對比度在圖像中也有變化。這時,一個在圖像中某一區(qū)域效果良好的閾值在其他區(qū)域卻可能效果很差。在這種情況下,把灰度值取成一個隨圖像中位置緩慢變化的函數(shù)值是適宜的。二值化后的車牌圖像如圖3.5所示。圖3.4灰度的取值變化圖圖3.5二值化后的車牌圖像3.4去噪在灰度化后,由于光照、天氣、成像設備等因素的影響,圖像會存在有噪聲、模糊等干擾,影響進一步的圖想想處理,所以我們必須對圖像進行增強處理。在圖像處理中一般使用濾波技術去除噪聲干擾,比較常用的幾種濾波器是均值濾波器、高斯濾波器和中值濾波器。均值濾波器是一種線性濾波器,對圖像進行局部均值運算,每一個像素值用其局部領域內(nèi)所有值的均值來代替,其公式為:(3.10)其中:F(x,y)是輸出圖像,是點(x,y)附近的點,M是鄰域N內(nèi)的像素點數(shù)目。鄰域N的大小控制著濾波程度,大尺度的鄰域會加大濾波程度,去除大噪聲的同時也會導致圖像細節(jié)損失。一般使用的有3×3、5×5鄰域進行濾波。高斯濾波器是根據(jù)高斯函數(shù)的形狀來選擇權(quán)值的線性平滑濾波器,對于濾除服從正態(tài)分布的噪聲十分有效。一維零均值高斯函數(shù)為:(3.10)其中高斯分別參數(shù)決定了高斯濾波器的寬度。對于圖像處理來說,常用二維零均值離散高斯函數(shù)作平滑濾波器,函數(shù)表達式為:(3.11)中值濾波是一種非線性濾波器,其基本思想是用像素點鄰域灰度值的中值來代替該像素的灰度值,能有效的去掉脈沖噪聲同時又保持了圖像中的邊緣細節(jié),這是因為它不依賴與鄰域內(nèi)與典型值差別很大的值。中值濾波器在處理圖像時與線性濾波器的工作方式類似,但濾波過程不是加權(quán)運算,以3×3鄰域為列求點[i,j]的灰度值計算方法為:=1\*GB3①按灰度值順序排列[i,j]鄰域中的像素點:=2\*GB3②取排序像素集的中間值作為[i,j]的灰度值。對以上三種濾波器進行比較我們認為在字符圖像識別過程中值濾波器可以克服線性濾波器造成圖像細節(jié)模糊的缺點,能夠強化圖像的邊緣特征,濾除掉干擾噪聲,其應用效果較好。本文采用的是均值濾波器,對車牌的濾波結(jié)果如下圖所示:圖3.6均值濾波前圖3.7均值濾波后3.5車牌的傾斜校正車牌圖像由于受到采集鏡頭與車牌之間的距離,道路坡度,汽車駕駛速度以及司機所掛車牌位置的影響等的影響,總有一定的傾斜度。這就為后期車牌圖像的進一步處琿帶來了一定的困難,因此在后續(xù)的處理之間必須要對其進行傾斜校正。根據(jù)許多文獻資料的記載,目前車牌傾斜校正的主要方法有:1、通過模板匹配來尋找車牌固定時的二個頂點或四個頂點,再通過雙線性空間的變換來重建車牌所在的矩形區(qū)域,從而得到車牌傾斜校正目的。這種方法的主要缺點就是當車牌的背景顏色與車子的顏色差別不大時,所取得的車牌的傾斜校正的結(jié)果將不理想。2、通過求取車牌字符區(qū)域的極大特征點和極小特征點,再對它們進行投影來求得車牌的傾斜角,最后再進行圖像旋轉(zhuǎn),從而得到車牌傾斜校正的目的。這種方法的主要缺點就是當車牌上的噪聲比較大時,所取得的結(jié)果將很不理想。3、通過求得車牌上各個字符連通域的中心點,然后擬合成近似的直線來確定車牌的傾斜角,最后再對車牌圖像進行旋轉(zhuǎn),從而得到車牌傾斜校正的目的。這種方法的主要缺點就是當需要對車牌進行二值化處理時,車牌卜的符就會出現(xiàn)斷裂等現(xiàn)象,這就使得該方法在有些情況下也不夠理想。4、Hough變換法。這種方法主要就是通過Hough變換來求得車牌的區(qū)域邊框,這樣進一步地確定了車牌的傾斜角;雖后冉對車牌圖像進行旋轉(zhuǎn),從而得到車牌傾斜校正的目的。這種方法的主要缺點就是當車牌上的噪盧比較大時,所取得的結(jié)果將很不理想。5、先進行水平邊緣的檢測,然后再旋轉(zhuǎn)邊緣圖像并進行垂直投影,并把垂直投影的最大投影值所得到的角作為車牌的傾斜角。并根據(jù)這個傾斜角來對車牌圖像進行旋轉(zhuǎn),從而得到車牌傾斜校正的目的。這種方法的主要缺點就是它只考慮了水平傾斜沒有考慮垂直傾斜。因而得到的結(jié)果具有偏面性。6、通過采用水平和垂直邊緣檢測法相結(jié)合的辦法來旋轉(zhuǎn)投影求取車牌的水平和垂直傾斜角度,對水平的車牌圖像進行雙線性插值旋轉(zhuǎn)校正,對垂直傾斜的車牌進行雙線性插值錯位校正,而且在進行校正時確定車牌的上下位置。進而得到傾斜校正的目的”“。這種法的最大缺點就是當傾斜角比較大時,所得到的結(jié)果不夠理想。因此,本文將在前人水平垂直傾斜校正方法的基礎上提出一種新的水平垂直傾斜旋轉(zhuǎn)校正方法,并使它分別在垂直方向上和水平方向上進行傾斜校正。由于車牌在垂直方向上發(fā)生了傾斜,使得所得到的圖像的像素在不同行之間發(fā)生了錯位或重疊;車牌在水平方向上發(fā)生了傾斜,使得所得到的圖像的像素在不同列之間發(fā)生了錯位或重疊:對于下一步字符的切割來說,水平的投影應該更加重要;因此為了不影響下一步字符的切割,本文提出了先進行垂直方向上的傾斜校正,然后再在水平方向上進行傾斜校正。3.5.1車牌的傾斜類型眾所周知,在中國車牌都是一個矩形。它在不同的車輛上可能有不同的傾斜類型和傾斜角,但總的來說,它的傾斜樣式可以分成三種不同的類型:①水平傾斜、②垂直傾斜、③水平垂直傾斜。它們的傾斜樣式分別如圖3.8所示。對于水平傾斜的這種情況,不管它是向上傾斜或是向下傾斜(從x軸的正方向看),只要將車牌圖像向下或向上旋轉(zhuǎn)所傾斜的角度即可。對垂直傾斜這種情況,不管它是向內(nèi)傾斜或是向外傾斜(從Y軸的正方向看),只要將車牌圖像向外或向內(nèi)旋轉(zhuǎn)所傾斜的角度即可。對于水平垂直傾斜,這也是最多的一種情況。為了解決這種情況我們必須先在水平方向上進行向下或向上旋轉(zhuǎn)在水平方向上所傾斜的角度;再進行垂直方向上進行向外或向內(nèi)旋轉(zhuǎn)在垂直方向下所傾斜的角度,這樣才能達到傾斜校止的效果。(a)(b)(c)圖3.8(a)圖像的水平傾斜(b)圖像的垂直傾斜(c)圖像的水平垂直傾斜3.5.2以線性回歸法對車牌圖像的校正如果我們有一系列相互獨立的點,其近似分布在一條直線附近,我們就可以通過一元線性回歸法擬合這條直線。圖3.9最小二乘原理圖這條直線的一元線性回歸模型為:(3.12)(3.13)設上圖中點的坐標分別是(x1,y1),(x2,y2),……,(xn,yn)。用最小二乘算法來估計和。則有:I=1,2,3,…,n,(3.14)用最小二乘算法來計算,找到準則函數(shù),記為(3.15)求Q的最小值:(3.17)(3.18)由上式可得:(3.19)(3.20)其中:(3.21)(3.22)估計出了直線的斜率和截距,我們就可以估計出這條直線的方程了。將汽車牌照圖像進行二值化,就可以得到其與背景的明顯的交線,對于汽車牌照圖像二值化的閾值完全可以取的高一點。具體方法如下:(1)找出邊界直線上的點(每列第一次由黑變白的點,且這一列的下兩點還是白的話就可以判為邊界點[6]),將其行坐標存入數(shù)組a即,列坐標存入數(shù)組b。(2)通過最小二乘法擬和這條邊界直線,計算出其斜率L。(3)通過rot=atan(L),計算直線的傾斜角度,然后對其矯正。
第四章車牌字符的分割4.1字符切割研究現(xiàn)狀由于車牌圖像字符切割足下一步字符識別的前提,而且字符切割的好壞將直接影響到下一步字符的識別率。因此,國內(nèi)外的研究者們對這一步的研究一直都很重視。在已有的印刷體字符分割技術的基礎上,研究者們提出了各式各樣的方法,目前,關于這一方面研究的主要方法有:①利用車牌上字符的固定長寬比和字符之間的間距作為先驗知識來以字符進行切割。這種方法在切割字符前先估算出字符的長度和寬度,還有字符之間的間距,并從圖像的垂直方向上的投影直方圖中確定字符的起始位置,再參考以上估算值逐個定位切割各個字符。②根據(jù)車牌圖像在垂直方向上的投影直方圖的數(shù)學期望E和方差D來確定一個閾值T=E—D,當像素值滿足piexl[i]<T<piexl[i+1]時,判別該點為字符的起始位置,當像素值滿足piexl[O<T<piexl[i-l]時,判別該點piexl[i]<T<piexl[i-l]為字符的結(jié)束位置,就這樣劃出所有的字符。當然這種方法的切割效果主要取決于閾值T,因此這種方法要求每次對切割的結(jié)果進行研究,如果偏離太大就要對閾值重新進行調(diào)整。③根據(jù)車牌圖像在水平和垂直方向上的投影值得劍灰度直方圖,再根據(jù)這個灰度直方圖,選擇合適的閩值再來分離車牌圖像的背景和字符,然后再結(jié)合字符的一定長寬比進行字符切割,并做歸一化處理,以便下一步的特征提取。本文將在前人研究的基礎上先對車牌圖像應用基本形態(tài)學中的開運算進行處理,然后再對車牌圖像進行二值化處理,并將其二值化圖像在垂直方向上進行投影,而且利用先驗知識中的字符長寬比和字符之問的間距,再加上輪廓分析的幫助來切割車牌圖像上的字符。4.2車牌上字符的基本特征中國車牌都有一定的特點;一般來說,它的字符為規(guī)則的印刷字體其字符串的長寬比、字符之間的間隙、字符的長寬比及筆畫寬度都是嚴格地按照一定的標準來制造的;雖然車牌圖像數(shù)據(jù)化后,會對它上面的字符進行提取和校正時會代入一定的噪聲,但字符串中原有的表示各個字符之間關系的各個參數(shù)之間的相互關系不會發(fā)生太大的變化。為了準確地識別牌照上的漢字、英文字母和數(shù)字。必須把單個字符從牌照中提取分離出來。在實際處理中,我們面對的是要識別的牌照字符情況非常復雜。可能會存在較大的干擾、噪聲,這是由于各種設備可能產(chǎn)生的噪聲所引起的,使得牌照圖像中可能產(chǎn)生字符之間斷裂的現(xiàn)象,圖像中算符的筆畫可能產(chǎn)生字符之間粘連或者字符斷裂的現(xiàn)象;算符的筆畫可能變粗,其影響是字符的輪廓模糊不清、字符之間粘連。同時,經(jīng)牌照定位而分割出的牌照區(qū)域亦非完全精確到牌照上的字符區(qū)域,所面對的是在牌照四個邊框附近誤差幾個象素;并且字符為白字,還將有汽車保險杠與牌照四邊邊框的殘留圖像以及牌照上兩個鉚釘干擾的一個區(qū)域。這就要求我們對牌照要有一定的了解?,F(xiàn)有的牌照有四種類型:(1)小功率汽車所用的藍底白字牌照;(2)大功率汽車所用的黃底黑字牌照;(3)軍用或警用的白底黑字、紅字牌照;(4)國外駐華機構(gòu)用的黑底白字牌照。這四種牌照的外輪廓長度均為45Omm,總的寬度為150mm,共有字符7個(不包括第二、三字符之間的小圓點)。標準的民用車輛牌照(軍車、警車、教練車、領事館車除外)均為七個字符,首位為省名縮寫(漢字),次位為英文字母,再次位為英文字母或阿拉伯數(shù)字,末四位字符均為數(shù)字。字符總長度為409mm,其中單個字符統(tǒng)一寬度為45mm,高90mm,第二三個字符間間距為34mm(中間小圓點10mm寬,小圓點與第二、三個字符間間距分別為12mm),其余字符間間距為12mm。牌照字符為規(guī)則的印刷體字,其字符串長度比、字符間隙、字符的寬高比及筆畫寬高都是按照嚴格的標準制造的,在牌照圖像數(shù)字化、提取和校正的過程中會代入一些干擾,但字符串參數(shù)之間的相互關系都不會發(fā)生很大的變化。以下是中國車牌的特征:①②③④其中式中的L為字符串長度,H為字符串的高度,為常規(guī)字符的寬度(這里的常規(guī)字符不包含‘1’),為字符‘1’的寬度,為字符‘1’的兩側(cè)的字符間隙。上面的4個公式為中國車牌上字符之間關系的主要參數(shù),其中的參數(shù)常量是實際車牌圖像統(tǒng)計的平均值。利用它們之間的關系,可使單一字符之間的估計更加準確。下面我們將利用這些關系對車牌進行切割。4.3投影法分割字符傳統(tǒng)的字符分割方法是使用投影法來進行分割。字符圖像二值化后,以像素點為單位逐列掃描圖像,累加該列值為1的像素點,累積的結(jié)果即為該列的垂直投影。對圖像的的所有列掃描完畢后即得到整幅圖像的垂直投影。在垂直投影直方圖中由于字符的分界處灰度為1的像素點很少,故投影后該處表現(xiàn)為很低的波谷,將統(tǒng)計值等于零的列作為字符分割的界限。據(jù)此我們就可以實現(xiàn)字符分割。但簡單的垂直投影法也存在很大的缺陷,由于字符中經(jīng)常存在空洞,導致字符的垂直投影具有多處波谷,在進行分割時難以依據(jù)波谷來確定字符的分界點。而且當獲取圖像質(zhì)量不高時二值化后字符會粘連在一起,這時垂直投影基本上不會出現(xiàn)十分明顯的波谷。對傳統(tǒng)的垂直投影法的一種改進方法是使用上下邊緣投影。上下邊緣投影是指字符上邊緣與下邊緣間的距離,其中“字符上邊緣”指以像素為單位沿圖像某列自上而下搜索直至遇到字符區(qū)域的第一個點,“字符下邊緣”是指以像素為單位沿圖像某列自下而上搜索直至遇到字符區(qū)域的第一個點,則上下邊緣投影即為字符上邊緣與下邊緣兩者之間距離之差,如圖4.1所示。圖4.1字符的垂直投影和上下邊緣投影對比從圖4.1可以看出,由于字符內(nèi)部空洞的存在,簡單垂直投影中大部分都存在一個波谷,單純一句投影的波谷來分割字符很難避免將單個字符分割為兩個部分。與垂直投影相比,上下邊緣投影具有較好的單波峰特性,對投影曲線使用分裂算法可以較容易地分割出完整的字符區(qū)域。分割結(jié)果如下圖所示:圖4.2分割結(jié)果圖投影法實現(xiàn)起來比較簡單,但是適應性較差,在預處理不好的情況下,很難有滿足條件的圖像,而為了獲取滿足傳統(tǒng)方法的條件,只有加強預處理的條件。因此,處理完的圖像不可避免的損失一部分有用的信息,給進一步的處理造成不必要的困難,可能引入額外的誤差。當字符傾斜的角度比較大、多行字符或是拍攝的圖像上的字符較為密集的時候,投影法就完全失效了。另外對于很多漢字來說是由多個部分組成,在投影的時候會形成多個相互獨立的波峰,其結(jié)果是經(jīng)常把完整的漢字錯誤地分離開,總的來說,投影法只適應于較為清晰、包含的數(shù)字和字母、傾斜不太大的圖像,對于很多其他復雜的應用場合,投影的方法經(jīng)常從本質(zhì)上失去了意義。因此,我們就引入了一些更為實用的車牌字符分割方法。4.4粗切割方法4.4.1車牌圖像上字符的粗切割大家都知道,我的車牌都是由7個字符加上一個點所構(gòu)成的。它們的排列順序依次為,漢字、英文字母、點、英文字母、阿拉伯數(shù)字、阿拉伯數(shù)字、阿拉伯數(shù)字、阿拉伯數(shù)字;或者是漢字、英文字母、點、阿拉伯數(shù)字、阿拉伯數(shù)字、阿拉伯數(shù)字、阿拉伯數(shù)字、阿拉伯數(shù)字。當然還有其它的樣式的車牌,但他們的數(shù)目特別少,可以忽略不記。而且從表向卜看,這7個字符加上一個點不可能以第四字符對稱,但仔細分析這7個字符加上一個點的實際車牌會發(fā)現(xiàn),它們的的確確是以第四字符,也就是倒數(shù)第四個阿拉伯數(shù)字為對稱的,而且車牌上的7個字符都有同一個高度?;谶@種思想,按照下面的步驟我們來切割車牌上的字符。①首先,在內(nèi)存中開辟七個長為車牌長的七分之一和寬為車牌寬的區(qū)域。②從車牌圖像長邊的巾問向下開始掃描車牌圖像,并把掃描到的所有的點灰度值復制到0區(qū)域的第四個區(qū)域?qū)恢蒙?。然后再從上向下掃描剛掃描過這一努的左邊或右邊,直到所掃描的這一峰上的所有點的灰度都是0時為止,并把這一豎認為是字符的分離處。③切割第五到第七個字符。方法就是,切割完了第四個字符之后,再依次掃描剩下的空間,直到所掃描的這一豎上的所有點的灰度值不全為0時,認為是字符的開始并依次掃描直到所掃描的這一豎上的所有點的灰度值全為0時認為是字符的結(jié)束。④切割第三到第四個字符。這兩個字符的切割方式與第五到第七個字符一樣。⑤切割第一到第二個字符。當?shù)谌齻€字符切割完之后,我們將遇到一個點,我們也把它看作一個字符,只不過這個點掃描之后就不要了。掃描完這個點之后,我們來切割第二個字符,它的切割方式與前面一樣。切割完了第二個字符之后,再向左掃描,直到所掃描的這一豎上的所有點的灰度值不全為0時,認為是字符的開始,并依次掃描直到所掃描所有剩下的,并填到相應的位置,直到剩下的空間填滿。經(jīng)過粗分割后,可以得到一些單個字符區(qū)域和多余的空間。下一步我們將把這些多余的空間去掉。這將更有利于下一步字符的識別。4.4.2去掉車牌圖像上字符的多余空間車牌上的字符經(jīng)過了粗切割所得到的是一些單的字符,但由于在分配空間時是按照車牌的寬和長的七分之一來分配的;所以這個空間可能大于字符應該占的空問。因此,這一步我們將把它去掉。對于第一個字符從第一行開始向下掃描,把那些一行中所有的點的灰度值全為0的點去掉,直到掃描到有一行不全為0時為止。然后再從第一列開始向右掃描把那些一列中所有的點的灰度值全為0的點去掉,直到掃描到有一列不全為0時為止。接下來從最后一行開始向上掃描,把那些一行中所有的點的灰度值全為0的點去掉,直到掃描到有一行不全為0時為止。最后從最后一列開始向左掃描把那些一列中所有的點的灰度值全為0的點去掉,直到掃描到有一列不全為0時為止。重復上面的步驟完成剩下字符的切割。下圖顯示了切割的結(jié)果。圖4.3投影法車牌字符的切割結(jié)果4.5連通域提取的車牌字符分割4.5.1連通域矩形的位置關系只要確定了矩形的相對位置,我們就可以對矩形進行合并,下面就對矩形的四種位置關系分別進行討論。=1\*GB3①包含關系給定兩個矩形m和n,如果m包含n,則這個包含關系可以定義為:且且且(4.1)=2\*GB3②交錯關系給定兩個矩形m和n,如果m與n相交,則m或n必有一個定點在另一個矩形內(nèi),設點在矩形內(nèi)的判定式為,矩形的定點為,則交錯關系可以定義為:或者(4.2)=3\*GB3③上下關系這個判定要稍微復雜一些,我們定義為一個矩形的中心點的垂直投影落在另一個矩形的垂直投影內(nèi),即:或者(4.3)=4\*GB3④左右關系經(jīng)過前三個關系的處理,圖像中的大部分連通域矩形已經(jīng)進行了合并,剩下的就是左右合并,一般來說,同一字符區(qū)域中字符的大小是基本相同的,字符間距離也大致是左右合并,一般來說,同一字符區(qū)域中字符的大小是基本相同的,字符間距也大致一樣相同,而字符間距明顯要大于字符內(nèi)筆畫的間距。設矩形的平均寬度和平均間距為:(4.4)對于兩個矩形m和n,定義左右關系如下:且且或者(4.5)其中、、為常數(shù),式(4.8)的意義為兩個矩形寬度小于平均寬度并且兩者的間距小于平均間距,式(4.9)的意義為兩個矩形合并后的寬度接近于平均寬度。4.5.2連通域的合并在作出字符連通域矩形后,我們看到,由于英文字母和數(shù)字都是一個連通域,其外接矩形恰好就包含了整個字符,故可以很容易地進行分割,而漢字由于本身結(jié)構(gòu)的原因,一個漢字很有可能由多個連通域構(gòu)成,單個矩形可能只是漢字的一個部分,所以必須對連通域進行合并。漢字的結(jié)構(gòu)有若干種情況,上下、包含、左右等,連通域的矩形的相對位置也可以歸結(jié)為四種基本情況,包含、交錯、上下、左右,其合并的順序先左后右。設整個圖像中的矩形集合為,則字符可定義為集合中一個或者若干個矩形的并集,即,而所有個矩形集合,即。矩形的基本信息是四個定點的坐標,可以具體化為四個參數(shù):,,,,故兩個矩形m和n合并為矩形k可以表示為:(4.6)4.5.3連通域提取字符分割通過圖像的預處理后,一般車牌的第2個到第7個字符,構(gòu)成了獨立的連通域。于是只要得到每個連通域行列的起始位置和終止位置,構(gòu)成一個矩形區(qū),就得到了包含連通域的最小矩形區(qū),最后,將每個矩形分別剪切,分割出各個字符,算法具體的實現(xiàn)過程如下:=1\*GB3①初始化。將標記數(shù)組flag附初值為0。掃描中值為0時,表示未被掃描;為N(從自然數(shù)1開始)表示該像素點被掃描過,且表示該點在第N個連通域。=2\*GB3②尋找起始點。順序掃描二值圖,如果像素灰度值為0,掃描下一個像素。若灰度值為1且未被標記,則依次掃描相鄰像素的標記值,當全為零,說明當前像素是新連通域的起始點,標記值為前一個標記值加1。=3\*GB3③確定同一連通區(qū)域的像素集合。從起始點開始順序掃描,當目標像素標記值為N時掃描相鄰像素。對于起始點像素,遍歷它所有相鄰像素,如果相鄰像素中有m(1m8)個像素點的灰度值為1,且未被標記,則這m個像素與當前像素屬于同一連通域,標記值都置為N。之后該連通域的所有目標像素只需掃描右側(cè)的3個相鄰像素。而當目標像素標記值不為N時,停止前向掃描,轉(zhuǎn)到第=2\*GB3②步。=4\*GB3④尋找連通域的始終位置。從標記數(shù)組的左上角開始,從左到右、從上到下逐行掃描標記數(shù)組的標記值,當找到第一個像素點標記值為N時,記錄該點像素的橫坐標為方框左上頂點的橫坐標;從上到下,從左到右掃描,當找到第一個像素點標記值為N時,記錄該點像素的縱坐標為方框左上頂點的縱坐標y1;同理,逆向掃描,找出方框的右下頂點的橫、縱坐標,。以這兩點畫框,就能把屬于同一連通域的分離出來。按照這種方法,最后也能把二值圖像中的所有獨立的連通域都用方框標示出來,如圖4.4(a)所示。=5\*GB3⑤分割字符。車牌圖像每個字符都有一個外接矩形,而連通域的數(shù)字標識并不是按車牌字符順序排列的,需將各個外接矩形的左頂點的橫坐標值按降序排列。車牌字符中除了漢字外,其它都是連通的,因此,按左頂點坐標的大小從右到左切割出6個字符后,剩下的就為漢字字符。其中,字符塊的寬為,字符塊的高為,按此方法剪切出各個字符。分割結(jié)果如圖4.4(b)所示。(a)方框分離連通域圖(b)分割出來的單個字符圖4.4連通域字符分割結(jié)果4.5.4誤連接區(qū)的分割由于拍攝條件的影響或者物體本身的污損等原因,二值化后的字符區(qū)域有可能會出現(xiàn)粘連現(xiàn)象,表現(xiàn)為兩個貨若干個字符相互連接,形成了一個較大的連通域。這種情況下僅使用連通域方法不能把他們分割出來,我們可以用以下的公式來確定有無誤連區(qū)域:或者(4.7)式中的和為根據(jù)實驗確定的常數(shù),發(fā)現(xiàn)有誤連區(qū)域后,可以使用垂直投影的方法,找出區(qū)域中最低的波谷作為分割界限,這樣就可以把誤連接區(qū)域分割開來。
第五章車牌字符的識別算法分析5.1字符識別現(xiàn)狀車牌圖像字符識別是整個智能化識別系統(tǒng)的最后一步,也是整個系統(tǒng)的設計目的所在;因此,研究人員很早就注意對這一步的研究。到目前為止,他們已經(jīng)提出了各式各樣的識別方法和算法。但總的來說可以分成以下幾類:①基于模板匹配字符識別方法。這種車牌圖像的工作過程是,首先對待識別字符進行二值化處理并將其尺寸大小縮放為字符數(shù)據(jù)庫中模板的大小,然后與所有的模板進行匹配,最后選最佳匹配作為結(jié)果。它的缺點是,任何有關光照、字符清晰度和大小的變化都會影響模板的匹配結(jié)果,在實際應用中為了提高正確率往往必須使用大的模板或者多個模板進行匹配,當然處理的時間則隨著模板的增大和增多而增加。②基于神經(jīng)網(wǎng)絡的字符識別方法。它又可以分為有特征提取和沒有特征提取。③基于小波包特征提取的車牌字符識別。這種方法的工作過程是,針對車牌字符識別的特點,提出了基于二維小波包的車牌字符特征提取方法,將車牌字符圖像進行二維小波包變換,搜索最佳小波包基,提出了尋找最佳小波包基的準則,最后應用神經(jīng)網(wǎng)絡進行識別。④基于模板匹配和神經(jīng)網(wǎng)絡的車牌字符識別方法。5.2歸一化歸一化圖像就是要把原來各不相同的字符統(tǒng)一到同一尺寸。因為掃描進來的圖像中字符大小存在較大的差異,而相對來說,統(tǒng)一尺寸的字符識別的標準性更強,準確率自然也更高。具體算法如下:先得到原來字符的高度和寬度,與系統(tǒng)要求的作比較,得出要變換的系數(shù),然后根據(jù)得到的系數(shù)按照插值的方法映射到原圖像中。歸一化仿真圖如圖5.1所示:圖5.1歸一化5.3神經(jīng)網(wǎng)絡對車牌字符的識別5.3.1神經(jīng)網(wǎng)絡概述人工神經(jīng)網(wǎng)絡是近幾年開始應用于圖像模式識別的一種重要的工具和方法,可以理解為一個由大量類似于生物神經(jīng)系統(tǒng)的簡單計算處理單元構(gòu)成的非線形動力學系統(tǒng)。人工神經(jīng)網(wǎng)絡在不同程度和層次上對人腦神經(jīng)系統(tǒng)的信息處理、存儲和檢索等功能進行了模仿,并且具備學習、記憶和計算的能力。由于人工神經(jīng)網(wǎng)絡表現(xiàn)出類似于人腦的學習分類能力以及并行、分布式處理方式,使得圖像在模式識別上的處理方式有了質(zhì)的飛躍。另外,由于其具有自學能力,在進行圖像識別時,可以先把許多不同的圖像樣板和對應的識別結(jié)果輸入到人工神經(jīng)網(wǎng)絡,這樣網(wǎng)絡就會在訓練中通過自學功能慢慢學會識別類似的圖像。這種自學功能對于預測有著特別重要的意義??偠灾斯ど窠?jīng)網(wǎng)絡在模式識別問題上,相比其他傳統(tǒng)方法的優(yōu)勢大致可以總結(jié)為以下三點:①要求對問題的了解少;②可對特征空間進行較為復雜的劃分;③適合于用高速并行處理系統(tǒng)來實現(xiàn)。但是,人工神經(jīng)網(wǎng)絡同其他理論一樣也不是完美的,也有其固有的弱點,比如需要更多的訓練數(shù)據(jù),在非并行處理系統(tǒng)中的模擬運行速度很慢,以及無法獲取特征空間中的決策面等。目前,雖然對人工神經(jīng)網(wǎng)絡的研究日臻深入并且已經(jīng)做了大量的工作,但是時至今日仍未有任何突破性進展,甚至連一個可以稱為“理論”的理論基礎都沒有建立。由于人工神經(jīng)網(wǎng)絡自身理論不夠完善,加之人工神經(jīng)網(wǎng)絡對圖像模式識別的研究也才剛剛起步,這就使得人工神經(jīng)網(wǎng)絡在對包括模式識別在內(nèi)的圖像理解與計算機視覺等領域的研究有著廣闊的探索空間。人工神經(jīng)網(wǎng)絡根據(jù)結(jié)構(gòu)可以分為前向傳播網(wǎng)絡、反向傳播網(wǎng)絡、自組織競爭網(wǎng)絡、交互傳播網(wǎng)絡和隨機網(wǎng)絡等多咱。目前常用的神經(jīng)網(wǎng)絡模型已有數(shù)十種之多,如BP網(wǎng)絡、Hopfield網(wǎng)絡、ART網(wǎng)絡和Kohonen網(wǎng)絡等均為其中比較典型的模型。5.4.2神經(jīng)網(wǎng)絡的工作過程一個人工神經(jīng)網(wǎng)絡是由為數(shù)眾多的相互連接的處理單元(Pro
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三年級語文上冊第八單元測試卷-基礎知識與綜合能力篇 含答案 部編版
- 2024建設工程合作合同范本
- 2024門面房出租合同范本門面房轉(zhuǎn)讓步驟及合同范本2
- 2024招投標購買合同書樣本
- 規(guī)劃課題申報范例:第二輪“雙一流”建設績效評價研究(附可修改技術路線圖)
- 深圳大學《學前兒童家庭教育學》2022-2023學年第一學期期末試卷
- 北京健身合同(2篇)
- 商務公寓預售協(xié)議書(2篇)
- 關于班學期工作計劃模板合集6篇
- 放射治療核醫(yī)學衛(wèi)生監(jiān)督
- 廣東省深圳市龍崗區(qū)多校2024-2025學年一年級(上)期中語文試卷(含答案部分解析)
- 2024-2025學年度第一學期期中學業(yè)質(zhì)量監(jiān)測
- 河南省南陽市2023-2024學年高一上學期期中數(shù)學試題含答案
- 統(tǒng)編語文四年級上冊第六單元教材解讀及集體備課
- 2024年河南省軍隊文職(臨床醫(yī)學)高頻備考核心試題庫(含答案詳解)
- 2023年國家公務員錄用考試《行測》副省級卷-解析
- 2024年銀行考試-招商銀行考試近5年真題附答案
- 食品工藝學:食品的輻射保藏
- 大學生職業(yè)規(guī)劃大賽生涯發(fā)展
- 職業(yè)發(fā)展生涯報告
- 《HSK標準教程3》第10課
評論
0/150
提交評論