




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、目 錄摘 要1Abstract2第一章 緒 論31.1研究意義31.2 國內(nèi)外研究現(xiàn)狀31.2.1 卷積神經(jīng)網(wǎng)絡(luò)研究現(xiàn)狀31.2.2 定位算法研究現(xiàn)狀41.2.3 識別算法研究現(xiàn)狀41.3 研究內(nèi)容和結(jié)構(gòu)安排41.4 人工神經(jīng)網(wǎng)絡(luò)51.5卷積神經(jīng)網(wǎng)絡(luò)61.5.1 卷積神經(jīng)網(wǎng)絡(luò)簡介61.5.1 卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點71.6車牌識別系統(tǒng)7第二章 定位算法92.1 車牌的采集和預(yù)處理92.2 車牌特征以及位置選定112.2.1 Roberts算子邊緣檢測112.2.2 定位車牌大致位置122.2.3 精確定位車牌16第三章 分割算法183.1 預(yù)處理183.2 固定分割183.3 字符歸一化19第四章
2、 基于卷積神經(jīng)網(wǎng)絡(luò)的車牌識別算法204.1 卷積神經(jīng)網(wǎng)絡(luò)204.1.1卷積神經(jīng)網(wǎng)絡(luò)的前向傳播204.1.2卷積神經(jīng)網(wǎng)絡(luò)的反向傳播214.2 網(wǎng)絡(luò)訓(xùn)練與測試214.2.1 網(wǎng)絡(luò)結(jié)構(gòu)214.2.2 網(wǎng)絡(luò)參數(shù)調(diào)整224.3 車牌識別26第五章 總結(jié)與期望28參考文獻29致 謝30摘 要本論文主要是基于卷積神經(jīng)網(wǎng)絡(luò)的中國車牌自動識別算法的設(shè)計與實現(xiàn)。構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)來進行識別是一種穩(wěn)定可靠的方法,能夠有很高的識別精準(zhǔn)度,因此得到了較為廣泛的應(yīng)用。本論文用邊緣檢測的定位方法大致定位出車輛車牌的位置,再用藍點掃描截取圖像的方式定位出車牌,然后將車牌的固定位置分割,截取出車牌中的七個字符,最后將七個字符輸入
3、到訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)當(dāng)中進行識別。本論文按照這樣的方法,用了三個章節(jié)分別表達了定位、分割以及識別。在測試過程中,定位算法測試的100張車牌均能準(zhǔn)確定位,識別算法在50張車牌測試中,350個字符能夠準(zhǔn)確識別302個字符。最后,本論文做出了一些總結(jié)和期望。關(guān)鍵詞:中國車牌識別,卷積神經(jīng)網(wǎng)絡(luò),圖像定位與分割31AbstractThis thesis is designed and achieved based on convolutional neural network in China's license plate recognition algorithm. Convolution
4、al neural network for identification has been widely applied owing to its stable, reliable and high recognition accuracy.In this thesis, the location of vehicle license plate is roughly located using the location method of edge detection firstly. Secondly, the license plate is located by interceptin
5、g the image using blue point scanning. Thirdly, the fixed position of the license plate is segmented and seven characters in the license plate are intercepted. Finally, the seven characters are input into the trained volume neural network to recognize.According to this method, this study uses three
6、chapters to demonstrate location, segmentation and recognition, respectively. In the process of testing, the 100 license plates in the location algorithm can be accurately located. In 50 license plate tests of the recognition algorithm, 350 characters can identify 302 characters accurately. At the e
7、nd of this paper, we make a summary and prospect.Keywords:Chinese license plate recognition,Convolutional neural network,Image positioning and segmentation第1章 緒 論1.1研究意義伴隨中國經(jīng)濟的飛速發(fā)展,人民的生活水平日益提高?,F(xiàn)如今的城市機動車數(shù)量已經(jīng)是一個非常龐大的數(shù)字,并且仍然在高速上漲。這樣的情況也給城市機動車管理增加了不小的壓力。不管是小區(qū)停車場還是車輛違章監(jiān)控,其中所需要的處理事件規(guī)模已經(jīng)遠遠大于人力負荷,所以,車輛智能管理系
8、統(tǒng)的研究發(fā)展勢在必行。車輛牌照作為每個車輛獨一無二的“身份證”,隨著模式識別技術(shù)的發(fā)展,車牌字符識別已成為智能交通系統(tǒng)的重要組成部分,它可以從復(fù)雜的背景中準(zhǔn)確地提取、識別汽車牌照、車輛類型等信息,在交通控制和監(jiān)視中占有很重要的地位,具有廣泛的應(yīng)用前景【1】。 本論文在車牌識別部分主要應(yīng)用了卷積神經(jīng)網(wǎng)絡(luò)來進行字符識別,卷積神經(jīng)網(wǎng)絡(luò)領(lǐng)域目前已經(jīng)取得了許多令人矚目的研究成果,其研究意義主要體現(xiàn)在三個方面: 理論研究挑戰(zhàn)、特征表達研究、應(yīng)用價值【2】。在本論文中,意義主要體現(xiàn)在這三者中的應(yīng)用價值,將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于車牌識別系統(tǒng)能夠為社會帶來管理上的便利。1.2 國內(nèi)外研究現(xiàn)狀1.2.1 卷積神經(jīng)網(wǎng)絡(luò)
9、研究現(xiàn)狀卷積神經(jīng)網(wǎng)絡(luò)作為一種深度學(xué)領(lǐng)域,如: 行人檢測、行為識別、人體姿勢識別等。近期,卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用進一步向更深層次的人工智能發(fā)展,如: 自然 語言處理、語音識別等。最近,由Google 開發(fā)的人工智能圍棋程序 Alphago成功利用了卷積神經(jīng)網(wǎng)絡(luò)分析圍棋盤面信息,并且在挑戰(zhàn)賽中接連戰(zhàn)勝了圍棋歐洲冠軍和世界冠軍,引起了廣泛的關(guān)注。從當(dāng)前的研究趨勢來看,卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用前景充滿了可能性【2】。1.2.2 定位算法研究現(xiàn)狀車牌定位算法是車輛智能管理系統(tǒng)的熱門研究課題。早在20世紀(jì)90年代,國外就開始了對定位算法的深入研究??紤]到車牌的形狀一般為矩形且寬高比值已知,車牌定位問題可以被轉(zhuǎn)化為用
10、邊緣檢測算法尋找圖像中可能的矩形【3】。由于一些國家對車牌的顏色有所規(guī)定,一些發(fā)表的工作是通過處理顏色來定位車牌的,如ERLee等人將圖像從RGB空間轉(zhuǎn)化到HLS空間,用神經(jīng)網(wǎng)絡(luò)輸出每個像素值的顏色,利用車牌的寬高比和顏色密度來確定車牌區(qū)域【3】。我國智能化車輛管理系統(tǒng)起步比較晚,但發(fā)展得很快。上海交通大學(xué)的郭捷等提出了一種基于顏色和紋理分析相結(jié)合的車牌定位算法。用該算法對60張不同復(fù)雜背景的彩色車牌照片進行定位實驗,成功率達到95%以上【4】。1.2.3 識別算法研究現(xiàn)狀車牌識別一般分為基于灰度圖像識別方法和基于彩色圖像識別方法這兩類方法。基于灰度圖像的車牌識別方法是將采集到的彩色圖形進行灰
11、度處理,然后再進行車牌定位、字符分割和字符識別等步驟;基于彩色圖像的車牌識別方法是利用采集得到的彩色圖像直接進行車牌定位、字符分割和字符識別等【5】。我們國家車牌的識別因為有漢字的關(guān)系,所以不能直接使用國外的車牌識別方法。同時因為漢字較為復(fù)雜、車牌的顏色和樣式都有很多種,給很多應(yīng)用于國外的識別技術(shù)增添了障礙,需要我們國家自主研發(fā)。查閱了很多的國內(nèi)車牌識別文獻,其中已經(jīng)有了很多成熟高效的方法。曾泉使用BP神經(jīng)網(wǎng)絡(luò)的方法選取了260張不同環(huán)境下的車牌來進行字符識別,結(jié)果表明在結(jié)果整體識別率上到達了95.2%【6】;陳瑋,曹志廣等人使用模塊匹配的方法,同時又在基于歐拉數(shù)的模板匹配上做了一定程度上的改
12、進,讓識別準(zhǔn)確率到達了96.67%,并且識別時間只有0.559s【7】;彭清,季桂樹等人用CNN提取隱層特征后,進行SVM分類,將800個測試樣本進行識別,其準(zhǔn)確率達到了97.00%【8】。1.3 研究內(nèi)容和結(jié)構(gòu)安排本論文在整個程序的設(shè)計編寫上分為三個章節(jié),一般來說,車牌的識別與一般的圖像識別還是有較大的區(qū)別。車牌的形狀方正,易于檢測定位,但又因為拍攝角度的不同,所定位的車牌又會有扭曲變化的難度。所以我將車牌識別分為了三步,也就是車牌的定位、定位后車牌當(dāng)中的字符塊的分割以及當(dāng)字符塊分割后作為獨立個體的字符塊識別。本論文第二章會用邊緣檢測后,再用藍點掃描記錄橫縱坐標(biāo)定位車牌位置;第三章會用固定位
13、置分割截取車牌內(nèi)的七個字符,同時進行歸一化處理;第四章會基于卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建識別模塊,其中涉及網(wǎng)絡(luò)的構(gòu)建、參數(shù)的選擇以及最后車牌識別的結(jié)果統(tǒng)計。1.4 人工神經(jīng)網(wǎng)絡(luò)1.4.1人工神經(jīng)網(wǎng)絡(luò)簡介1943年,美國的心理學(xué)家 W.S.McCulloch 和數(shù)學(xué)家W.A.Pitts 在論文神經(jīng)活動中所蘊含思想的邏輯活動中,提出了一個非常簡單的神經(jīng)元模型,即MP模型。該模型將神經(jīng)元當(dāng)作一個功能邏輯器件來對待,從而開創(chuàng)了神經(jīng)網(wǎng)絡(luò)模型的理論研究【9】。以比較形象的角度上看,其原理就像現(xiàn)實中生物身體內(nèi)的一個神經(jīng)系統(tǒng)-通過建立無數(shù)個神經(jīng)元,再通過神經(jīng)互相進行感知交流傳遞“信息”,其中就包括了傳遞信息和反饋調(diào)整兩個
14、方面。不同的神經(jīng)元,不同的連接方式構(gòu)成了許多用途多樣的網(wǎng)絡(luò)。在工程和學(xué)術(shù)界,將其定義為人工神經(jīng)網(wǎng)絡(luò)或者類神經(jīng)網(wǎng)絡(luò)。圖 1.1 人工神經(jīng)網(wǎng)絡(luò) (1.1) (1.2) 如圖1.1所示,其中x代表各個輸入量;w為各個神經(jīng)元的權(quán)值;f為傳輸(傳遞)函數(shù);t為輸出。通過公式(1.1),(1.2)可知,單個輸入神經(jīng)元的作用是在求出輸入向量,然后經(jīng)過權(quán)值向量的內(nèi)積計算之后,通過傳遞函數(shù)得到一個標(biāo)量輸出t。1.5卷積神經(jīng)網(wǎng)絡(luò)卷積神經(jīng)網(wǎng)絡(luò)【2】是近年來發(fā)展起來的,一種高效準(zhǔn)確的識別方法。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的其中一個分支,他作為一種深度前饋的人工神經(jīng)網(wǎng)絡(luò),已經(jīng)得到了廣泛的應(yīng)用。在20世紀(jì)60年代,Hubel和
15、Wiesel在研究動物腦皮層的部分神經(jīng)元時發(fā)現(xiàn)了其獨特的網(wǎng)絡(luò)連接結(jié)構(gòu),并且這樣的結(jié)構(gòu)可以很大程度的降低網(wǎng)絡(luò)反饋的多樣復(fù)雜性,從而他們提出了卷積神經(jīng)網(wǎng)絡(luò)的概念。在現(xiàn)如今的識別系統(tǒng)中,卷積神經(jīng)網(wǎng)絡(luò)憑借其出色的高效識別功能,已經(jīng)得到了廣泛的認可。目前,很多的國內(nèi)外學(xué)者都致力于研究卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)優(yōu)化,比方說激活函數(shù)、卷積核等等。圖 1.2 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖在卷積神經(jīng)網(wǎng)絡(luò)中,如圖1.2所示,我們一般將其分為輸入層、卷積層、池化層、全連接層以及輸出層。與BP網(wǎng)絡(luò)不同的是,在卷積神經(jīng)網(wǎng)絡(luò)當(dāng)中最主要的是特征提取層,即由卷積層和他的子采樣層構(gòu)成了一個特征提取器。也就是說,在卷積神經(jīng)網(wǎng)絡(luò)的卷積層中,通常情況
16、下一個神經(jīng)元只與部分神經(jīng)元連接,這樣就避免了類似BP網(wǎng)絡(luò)每一層都是全連接,大大的降低了訓(xùn)練的難度。1.5.1 卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點卷積神經(jīng)網(wǎng)絡(luò)的與其他網(wǎng)絡(luò)比較起來,它的每個神經(jīng)元因為有卷積池化層的構(gòu)建,所以有著很獨特的優(yōu)越性,即權(quán)值的共享大大減少了神經(jīng)網(wǎng)絡(luò)需要訓(xùn)練的參數(shù)個數(shù),很大程度上降低了訓(xùn)練的難度以及網(wǎng)絡(luò)的復(fù)雜性;網(wǎng)絡(luò)結(jié)構(gòu)也與圖像結(jié)構(gòu)更加搭配,在圖像的特征提取和圖像識別上有著不錯的效果。1.6車牌識別系統(tǒng)伴隨著經(jīng)濟的發(fā)展,中國的車輛數(shù)量在近幾十年來已經(jīng)上漲到了一個非常龐大的數(shù)量,面對這樣的情況,政府相關(guān)部門已經(jīng)對車輛的管理采取了很多方法,非常重視這一問題。在經(jīng)歷了上個世紀(jì)末的起步階段之后,車
17、牌識別技術(shù)已日趨走向成熟,并開始在交通、公安、路政、停車場、安防、門禁、智能小區(qū)等許多領(lǐng)域得到了廣泛的應(yīng)用。 車牌識別系統(tǒng)簡單地說是一種以特定目標(biāo)為對象的專用視覺系統(tǒng),它能夠從一幅圖像中提取分割并識別出車輛牌照,運用先進的圖像處理、模式識別和人工智能技術(shù),通過對圖像的采集和處理完成車輛牌照的自動識別,識別結(jié)果可按需求分別包括車牌的字符、數(shù)字、牌照圖像,以至牌照顏色、坐標(biāo)、字體顏色等【1】。一般地,生活當(dāng)中的車牌常見的有小型汽車號牌藍底白字和大型汽車牌號黃底黑字。本論文主要研究的是小型汽車號牌,查閱相關(guān)文獻后得知,小型汽車是藍底白字,大小為的車牌【10】。第2章 定位算法2.1 車牌的采集和預(yù)處
18、理一般來說,中國車牌的字符顏色與背景顏色搭配有:白底紅字、黃底黑字、藍底白字等等。本文主要研究的是對于生活中最常見的小型汽車牌照,也就是藍底白字的車牌。因為車牌的色彩特征與其背景的色彩特征有很大的差別,所以當(dāng)我們使用不同的色彩通道,就能夠讓我們的牌照和其他的背景區(qū)分出來。對本文研究的藍底車牌來說,當(dāng)我們使用藍色的B通道時,牌照的區(qū)域就是一個亮矩形。就個人經(jīng)驗來說,雖然顏色掃描區(qū)分能夠簡單方便的得到一個較為準(zhǔn)確的車牌圖像,但是我們在拍攝車輛的時候會發(fā)現(xiàn)圖像當(dāng)中會有很多藍色或者相近顏色的“噪聲”干擾我們的掃描定位,甚至當(dāng)車輛本身是藍色或者相近顏色的時候,這個掃描顏色的程序就會出現(xiàn)重大失敗。通過觀察
19、與分析,我將定位的方法設(shè)計為:預(yù)先的對圖像進行處理和篩選去噪,將車牌的位置先大致作出劃分,之后再進行我們的色彩特征區(qū)分工作。圖 2-2車牌定位結(jié)構(gòu)圖我們采集到的圖片是一個包括車牌的車輛前端或者車輛尾部的彩色照片,在預(yù)處理中,首先是將整個彩色圖片灰度化。將彩色圖片灰度化,我用到了以下的幾個公式:(2.1) (2.2)將公式(2.1)、(2.2)帶入程序中,并用MATLAB的figure函數(shù)將圖片展示出來:圖 2.2 采集的車牌彩色原圖圖 2.3 彩色原圖灰度化圖 2.4 灰度圖灰度直方圖2.2 車牌特征以及位置選定2.2.1 Roberts算子邊緣檢測在本文的預(yù)處理當(dāng)中,以及將原圖像轉(zhuǎn)化為灰度圖
20、表示。不同圖像因為灰度的不同,這些圖像的邊界處一般就會有明顯的邊緣,然后我們可以利用這個特點來分割圖像。在實際的圖像處理的應(yīng)用當(dāng)中,我們有很多的算子來對圖像進行邊緣檢測。在本文的應(yīng)用中,我選擇了Roberts算子。Roberts邊緣檢測算子是一種利用局部差分算子尋找邊緣的算子,Robert算子圖像處理后結(jié)果邊緣不是很平滑。經(jīng)分析,由于Robert算子通常會在圖像邊緣附近的區(qū)域內(nèi)產(chǎn)生較寬的響應(yīng),故采用上述算子檢測的邊緣圖像常需做細化處理11。表 2.1 Roberts交叉算子模板Roberts交叉算子模板10010-1-10 (2.3) (2.4) (2.5) (2.6)設(shè)圖像的梯度幅度為公式(
21、2.3),然后根據(jù)Robert交叉算子模板去計算,可以得到運算結(jié)果(2.4)、(2.5)以及(2.6)。當(dāng)最后(2.6)的結(jié)果大于某一個閾值時,那我們就可以判定即為邊緣點。選擇Roberts算子在于其計算簡單高效,因為我所應(yīng)用的方面在于車牌檢測,車牌的形狀方正,而Roberts算子在檢測垂直邊緣時效果較好,定位精確度高。圖 2.5 Roberts算子邊緣檢測圖2.5是我用MATLAB對車牌灰度化圖像進行邊緣檢測的結(jié)果,從結(jié)果可以看出,能夠顯示車輛輪廓以及能夠檢測出車牌位置,但同時其中也有一些場景的噪聲輪廓邊緣。接下來將進行去噪處理來定位出車牌位置。2.2.2 定位車牌大致位置2.2.2.1圖像
22、腐蝕在邊緣檢測后,我對圖像2.5進行分析,圖像當(dāng)中有很多干擾信息。所以我對圖像做了腐蝕處理。腐蝕主要用于形態(tài)學(xué)中除去圖像的某些部分。腐蝕的本質(zhì)就是用結(jié)構(gòu)算子覆蓋的所有像素點的最小值代替中心位置的像素值【12】。圖 2.6 腐蝕處理后的圖像腐蝕處理的作用【13】有三:1. 邊緣檢測,將形態(tài)骨架進行提?。?. 對原圖像進行了濾波,出去了一部分的噪聲;3. 從圖2.6中我們可以觀察到,除了車牌和車標(biāo)之外,其余部分的車輛輪廓已經(jīng)變得很微小,為接下來的篩選工作做了一些準(zhǔn)備。2.2.2.2圖像平滑圖像平滑的主要目的是減少圖像噪聲【14】。圖像在采集的過程中,可能會出現(xiàn)在某些地方亮度過大,而在另外一處地方亮
23、度又過小的情況,這種明暗變化較大的區(qū)域,會出現(xiàn)一些亮點,也就是噪聲。而為了抑制或過濾這樣的噪聲,讓圖像的亮度變化變得比較平穩(wěn),這種方法就是圖像平滑。圖 2.7 平滑處理后的圖像實際上,對圖像作平滑處理,相當(dāng)于是用一個低通濾波器過濾了圖像,雖然能抑制一部分的噪聲,但會對圖像的邊緣造成模糊化。不同的平滑算法適應(yīng)于特定類型的噪聲模型,實際應(yīng)用中應(yīng)該根據(jù)實際圖像中包含的噪聲情況靈活地選取適當(dāng)?shù)钠交惴ā?5】。在本文的應(yīng)用中,考慮了邊緣模糊化這一點,在之后的掃描處理中,會讓模糊化變成一種優(yōu)點,讓車牌圖像信息不丟失。2.2.2.3圖像去除較小對象通過對圖2.7的分析觀察,我們可以清楚的看到,在圖像當(dāng)中的
24、信息已經(jīng)只剩下車牌、車標(biāo)以及一些較小的干擾噪聲。對比圖像信息的大小,我們可以得出當(dāng)前圖像中車牌所占的比例是最大的。當(dāng)我們對圖像當(dāng)中的白點面積進行判定,當(dāng)其面積大于某一個閾值的時候,我們就可以將其視作車牌。圖 2.8 圖像去除較小對象流程圖在MATLAB中,利用函數(shù)可以實現(xiàn)去除圖像當(dāng)中的較小對象,其中的面積2000像素是我選定的一個參考值,可以根據(jù)自己所應(yīng)用的環(huán)境條件來進行調(diào)整。圖 2.9 圖像經(jīng)過去除較小對象處理后得到的車牌圖像經(jīng)過去除較小對象處理后,得到圖2.9。從中我們已經(jīng)能夠得到車牌的一個大致位置信息。因為在之前的邊緣檢測、腐蝕以及平滑處理當(dāng)中,信息會有一定的缺失和模糊,所以在圖2.9當(dāng)
25、中所顯示的車牌并不能夠精確的代表車牌的真實位置。2.2.3 精確定位車牌在本文章節(jié)2.1當(dāng)中本論文就論述了掃描藍色車牌的基本思路,但在實際的操作當(dāng)中,現(xiàn)實場景會有藍色的噪聲干擾以及車輛本身就有可能會是藍色的,直接對圖像進行藍點掃描的話,會有很多的錯誤率,更不適合實際應(yīng)用。所以我對圖像做了很多的處理,以此來分析出車牌的大致位置,縮小圖像的掃描范圍。用這樣的辦法,我們就可以在車牌大致的范圍當(dāng)中,進行藍點掃描,精確的定位車牌位置,同時大幅度地降低錯誤概率。圖 2.10 藍點掃描定位車牌通過分別對車牌x軸和y軸的確定,以此來確定車牌的準(zhǔn)確位置。在實際操作中,考慮到會有一些誤差,所以對掃描的結(jié)果做出了一
26、些校正,即分別對掃描出的x軸和y軸的數(shù)值做出加減2到6的調(diào)整,以此來減少實際遇到的誤差。圖 2.11 定位后截取的彩色車牌圖片通過對坐標(biāo)的確定和一定調(diào)整,將所得到的坐標(biāo)帶入到原圖像當(dāng)中,即可得到車牌的信息。在用來測試的100張車牌圖片中,所有圖片均能夠準(zhǔn)確定位。第三章 分割算法3.1 預(yù)處理在分割這一步當(dāng)中,很大程度上是在為之后的識別模塊在做準(zhǔn)備工作。在第二章的定位算法當(dāng)中,本論文通過的是藍點掃描來進行定位截取車牌圖片,也即最后獲取的是一張彩色的,易于人眼觀察的車牌圖片。但對于計算機識別來說,我只需要獲取字符的輪廓來進行識別就行,彩色會增加我們的誤差。所以,我在分割這一步中,先對車牌做了二值化
27、處理。圖 3.1 車牌二值化圖片如圖3.1所示,這是將圖2.11的原車牌圖像進行了二值化處理。從兩幅圖的對比中,我們不難看出,二值化后的車牌信息變得更加明顯,凸顯了每一個字符塊的輪廓,同時也簡化了我們車牌所表達的矩陣信息,即其中只含有1和0的表達。3.2 固定分割一般地,對車牌的分割有很多種算法,比方說垂直投影法、模塊匹配法等等。每種方法都很實用,有其各自的優(yōu)點。但對于本論文來說,獲取的圖片信息清晰且位置明確,所以沒有用到這些分割方法。本論文根據(jù)定位到的車牌信息,采用的是固定分割的辦法來對每個字符進行分割。圖 3.2 車牌字符分割如圖3.2所示,這是對圖3.1二值化后的車牌進行固定分割的結(jié)果。
28、其中不難看出,如果我們獲取的車牌有一定的扭曲變形,那對分割這一步的影響是非常大的。所以在應(yīng)用到實際生活時,需要根據(jù)面對的環(huán)境條件作出算法調(diào)整。在本論文中,獲取的車牌無扭曲變形,所以用固定位置分割能快速有效的得出所需要的字符塊。3.3 字符歸一化在本論文第二章節(jié)的研究中,在對車牌的處理中,都是對輸入的車牌圖片進行直接處理。在2.2.3小節(jié)中,對于每一個車牌圖片來說,其最后掃描出的車牌其實也是有所區(qū)別的,即并不是統(tǒng)一標(biāo)準(zhǔn)的矩陣表達。本論文將分割這一部分也視作是對車牌識別之前所做的預(yù)處理工作。定位和分割并不需要很嚴格的統(tǒng)一標(biāo)準(zhǔn),但識別不同,它需要嚴謹?shù)膱D像表達才能提升圖像識別的精準(zhǔn)度。所以在分割環(huán)節(jié)
29、的末尾,本論文將每一個分割出的字符塊都統(tǒng)一歸一化為的標(biāo)準(zhǔn)圖形。第4章 基于卷積神經(jīng)網(wǎng)絡(luò)的車牌識別算法4.1 卷積神經(jīng)網(wǎng)絡(luò)4.1.1卷積神經(jīng)網(wǎng)絡(luò)的前向傳播圖 4.1 卷積神經(jīng)網(wǎng)絡(luò)如圖4.1所示,這是一個簡單的卷積神經(jīng)網(wǎng)絡(luò)示意圖。其中的、代表卷積層,、代表池化層。卷積層和池化層的一般含義在本論文第一章1.2節(jié)卷積神經(jīng)網(wǎng)絡(luò)簡介中有定義表達,這里就不再繼續(xù)贅述。在卷積層當(dāng)中,輸入的圖像表達為一個二維矩陣,經(jīng)過一個可訓(xùn)練的大小可定義的矩陣來對輸入矩陣進行卷積計算。一般地,我們會在卷積計算過程中加入一個偏置量。這樣就得到了我們的卷積層。不過在當(dāng)中的輸入是原圖像矩陣,而在之后的卷積層的輸入是經(jīng)過池化的特征映
30、射圖矩陣【16】。在池化層當(dāng)中,卷積層的圖像將輸入池化層。在卷積神經(jīng)網(wǎng)絡(luò)當(dāng)中,池化層的處理方式有很多種,一般地思路是通過大小的池化矩陣將輸入矩陣的值做池化處理,將對應(yīng)的4個像素通過池化矩陣進行加權(quán),再加入一個偏置量,然后將4個像素化為一個像素的值放入激活函數(shù)計算得到池化層和。在本論文中,用到的常用的最大池化,即輸出一個最大的像素。在全連接層當(dāng)中,按照一般人工神經(jīng)網(wǎng)絡(luò)當(dāng)中的思路去計算,參照第一章公式(1.1)、(1.2)計算得出。4.1.2卷積神經(jīng)網(wǎng)絡(luò)的反向傳播在訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)時,反向傳播是一個很關(guān)鍵的步驟,很多參數(shù)的調(diào)整更新都是在反向傳播當(dāng)中實現(xiàn)。圖 3.2 神經(jīng)網(wǎng)絡(luò)訓(xùn)練如圖4.2所示,這是
31、一個卷積神經(jīng)網(wǎng)絡(luò)的基本流程。在本論文4.1.1小節(jié)中講述了前向傳播的一些簡單流程,當(dāng)神經(jīng)網(wǎng)絡(luò)在訓(xùn)練的時候,我們會對輸出的參數(shù)進行判別,在根據(jù)其誤差進行反向傳播,調(diào)整各層的各個參數(shù)。不斷的迭代最后達到一個比較理想的效果。4.2 網(wǎng)絡(luò)訓(xùn)練與測試4.2.1 網(wǎng)絡(luò)結(jié)構(gòu)圖 4.3 卷積池化層本論文在網(wǎng)絡(luò)構(gòu)建時,如圖4.3所示,在輸入層之后,分別加了兩層卷積層和池化層,卷積層在先,池化層在后,分別用、和、表示。其中、皆為大小的卷積核,設(shè)了兩個輸出通道,設(shè)了四個輸出通道。圖 4.4 全連接層和輸出層在圖4.3的基礎(chǔ)上,網(wǎng)絡(luò)將輸入的車牌進行特征提取之后,設(shè)立三個全連接層,輸出層也包括在其中,分別用、表示。其中
32、設(shè)了120個輸出節(jié)點,設(shè)了85個輸出節(jié)點,輸出層設(shè)了45個輸出節(jié)點,也即將訓(xùn)練數(shù)據(jù)分為了45類。4.2.2 網(wǎng)絡(luò)參數(shù)調(diào)整4.2.2.1 迭代次數(shù)、學(xué)習(xí)率調(diào)整在設(shè)定網(wǎng)絡(luò)參數(shù)時,首先將學(xué)習(xí)率調(diào)整為1,慣性系數(shù)設(shè)定為0.5,同時因為要觀察誤差與迭代次數(shù)之間的大致關(guān)系,所以將迭代周期設(shè)定為比較大的值300方便觀察。圖 4.5 迭代次數(shù)和均方誤差關(guān)系如圖4.5所示,其中x軸net.epochs代表的是迭代次數(shù),y軸net.err代表的是均方誤差。比對后發(fā)現(xiàn):誤差越低越好,且隨著迭代次數(shù)的增大,誤差會越來越快的減小。其中在迭代次數(shù)到100次左右時,均方誤差已經(jīng)是小于0.1了。圖 4.6 學(xué)習(xí)率為0.5時的
33、均方誤差變化圖 4.7 學(xué)習(xí)率為1時的均方誤差變化圖4.6和圖4.7是在其他參數(shù)不變,調(diào)整了學(xué)習(xí)率后的對比。我將迭代次數(shù)設(shè)為150,當(dāng)完成訓(xùn)練時,學(xué)習(xí)率為0.5的網(wǎng)絡(luò)錯誤率為7.63%。學(xué)習(xí)率為1的網(wǎng)絡(luò)錯誤率為5.58%。在均方差相差不大時,學(xué)習(xí)率的變化對錯誤率還是會起到一定的影響。經(jīng)過對比后,本論文將學(xué)習(xí)率設(shè)置為1、迭代次數(shù)設(shè)置為300,這樣可以大大加快均方誤差的收斂,同時也能降低我們的錯誤率。但在比對參數(shù)影響時,本論文會將迭代次數(shù)設(shè)置為150加快訓(xùn)練速度,方便比對。4.2.2.2 網(wǎng)絡(luò)結(jié)構(gòu)調(diào)整圖 4.8 將全連接層F2輸出通道由85減少到60如圖4.8所示,這是在其他參數(shù)不變的情況下,將的
34、輸出通道由85減少到60時的均方誤差變化,其中x軸net.epochs代表的是迭代次數(shù),y軸net.err代表的是均方誤差,迭代周期在150次后的錯誤率為。我們將圖4.8和圖4.7所示,當(dāng)?shù)妮敵鐾ǖ罍p少時,錯誤率有一定的減少,同時均方誤差變得更加平滑。圖 4.9 將全連接層F2輸出通道由85增加到100如圖4.9所示,這是在其他參數(shù)不變的情況下,將的輸出通道由85增加到100時候的誤差變化,其中x軸net.epochs代表的是迭代次數(shù),y軸net.err代表的是均方誤差,在迭代150次后的錯誤率為。相較與圖4.7、圖4.8,均方誤差曲線變得陡峭、錯誤率在連接數(shù)大于85之后沒有特別明顯的變化。表
35、 4.1 學(xué)習(xí)率為1,迭代次數(shù)為150時全連接層F2通道數(shù)目對網(wǎng)絡(luò)的影響輸出通道數(shù)目6585100均方誤差變化曲線更為平緩中等幅度變化曲線更為陡峭錯誤率3.27%5.58%5.51%經(jīng)過對比之后,本論文將輸出通道設(shè)置為120不變,的輸出通道改變?yōu)?5。輸出通道仍然為45個類別。4.3 車牌識別車牌字符圖片的預(yù)處理和歸一化都在定位分割中得以完成,所以在網(wǎng)絡(luò)訓(xùn)練完成后,直接將車牌字符輸入到訓(xùn)練好的網(wǎng)絡(luò)數(shù)據(jù)集當(dāng)中進行比對,最后就能輸出完成識別的字符。圖 4.10 車牌識別結(jié)果如圖4.10所示,紅字部分就是識別結(jié)果,與下方的字符圖片一一對應(yīng)。圖 4.11 車牌識別結(jié)果2圖 4.12 車牌識別錯誤結(jié)果如圖4.11所示,這是另一個車牌的識別結(jié)果圖。實驗結(jié)果較為理想,但有時候也會出現(xiàn)失誤,如圖4.12所示,當(dāng)車牌出現(xiàn)一定程度的扭曲時,分割的時候就會讓文字出現(xiàn)一定的偏移,同時車牌的邊界也會進入到字符圖片當(dāng)中干擾識別。表 4.2 抽取50張車牌測試統(tǒng)計結(jié)果測試車牌數(shù)錯一個字符錯兩個字符完全識別車牌5016826字符3501616302選取了50張車牌圖片進行識別,其中有16張車牌識別錯誤1個字符,8張車牌識別錯誤2個字符,26張車牌識別完全正確。總共350個字符,錯誤32個字符。第5章 總結(jié)與期
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人與公司投資合作合同范本2025
- 包裝材料供應(yīng)合同
- 證券交易合同格式規(guī)范
- 車輛過戶合同協(xié)議書模板
- 商業(yè)綜合體給排水工程清包合同范本
- 版臨時電力施工合作合同
- 出口代理合同模板
- 旅行期間的緊急情況應(yīng)對準(zhǔn)備加強考核試卷
- 農(nóng)村集體經(jīng)濟組織可持續(xù)發(fā)展能力評價與實踐考核試卷
- 咖啡館行業(yè)品牌延伸策略考核試卷
- 2025年常州工業(yè)職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫及答案1套
- 2025年湖南理工職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫必考題
- 2025年湖南城建職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫完美版
- 會計信息化練習(xí)題庫+參考答案
- 武漢2025年湖北武漢市教育系統(tǒng)專項招聘教師679人筆試歷年參考題庫附帶答案詳解
- 高中主題班會 借哪吒精神燃開學(xué)斗志!課件-高一下學(xué)期開學(xué)第一課班會
- 2024年12月2025浙江湖州市長興縣綜合行政執(zhí)法局公開招聘輔助執(zhí)法人員8人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 水產(chǎn)養(yǎng)殖尾水處理技術(shù)-第1篇-深度研究
- 財務(wù)管理畢業(yè)論文
- 二零二五年度醫(yī)療援助派駐服務(wù)協(xié)議4篇
- 合同簽訂培訓(xùn)課件
評論
0/150
提交評論