人民幣紙幣冠字號識別_第1頁
人民幣紙幣冠字號識別_第2頁
人民幣紙幣冠字號識別_第3頁
人民幣紙幣冠字號識別_第4頁
人民幣紙幣冠字號識別_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

人民幣紙幣冠字號識別摘要人民幣是我國的唯一合法貨幣,自人民幣發(fā)行以來,總共有5套,目前流通于市面的人民幣,是上世紀九十年代發(fā)行的第五套人民幣。近年來,隨著中國經濟的高速發(fā)展,人民幣的發(fā)行量也越來越大,對于中國的防偽技術也有了越來越大的考驗。冠字號作為人民幣的“身份證”,在防偽方面有著至關重要的地位,所以,人民幣的冠字號識別技術在近年越來越受到關注。利用計算機自動實現(xiàn)人民幣的冠字號識別技術,是模式識別應用的一個重要領域。本文提出了一套完整的人民幣紙幣冠字號識別的算法,主要包括人民幣的預處理和冠字號的識別兩部分。在人民幣預處理中,本文提出了一種基于先驗知識和垂直投影的算法對冠字號區(qū)域進行定位,有效的節(jié)省了后期的運算時間,通過比較選擇Otsu法進行二值化處理和5×5中值濾波進行濾波處理,并且采用Hough變換進行傾斜校正,避免影響識別效果,對校正后的冠字號采用垂直投影法進行分割并歸一化,為接下來的識別打下基礎;在冠字號識別中,本文采用HOG算法提取出字符特征,該算法與SVM的組合運用廣泛,在詳細介紹模板匹配法、人工神經網絡和SVM(支持向量機)三種算法后,采用了一種基于SVM的一對一多分類識別算法,成功識別出冠字號。經過MATLAB計算機仿真實驗證明,本文提出的完整的人民幣紙幣冠字號識別的算法準確率能達到85.25%,具有一定的應用價值。關鍵詞:人民幣冠字號,MATLAB,SVM注:本設計(論文)題目來源于教師的國家級(或部級、省級、廳級、市級、校級、企業(yè))科研項目,項目編號為:。AbstractTheRMBistheofficialcurrencyofthePeople'sRepublicofChina.ThemostofthecurrentlycirculatingRMBisthefifthsetwhichissuedin1990s.Inrecentyears,withtherapiddevelopmentofChina'seconomy,thecirculationoftheRMBisgrowingaswell,andtherehasbeenanincreasingchallengeforChina'santi-counterfeitingtechnology.Asthe"identitycard"oftheRMB,theCrownwordnumberhasavitalpositioninanti-counterfeiting.Therefore,theRMBidentificationtechnologyhasbeenpaidmoreattentioninrecentyears.UsingcomputertechnologytoautomaticallyrecognizetheCrownwordnumberofRMBisanimportantfieldofpatternrecognitionapplication.ThispaperproposesacompletealgorithmfortheidentificationoftheCrownwordnumberofRMB,includingthepreprocessingoftheRMBandtheidentificationofthecrownnumber.IntheRMBpreprocessing,thispaperproposesanalgorithmbasedoncommonsenseandverticalprojectiontolocatetheCrownwordnumbersizearea,whicheffectivelysavesthelateroperationtime.Aftercomparing,wechoosetheOtsumethodforbinarizationand5×5medianfilterforfiltering,andtheHoughtransformfortiltcorrectiontoavoidaffectingrecognitionaccuracy.ThecorrectedCrownwordnumberaredividedbytheverticalprojectionmethodandthenbenormalizedtolaythefoundationforthenextrecognition.IntheCrownwordnumberrecognition,thispaperusestheHOGalgorithmtoextractcharacterfeatures,whichiswidelyusedinthecombinationofSVM.Afterintroducingthetemplatematchingmethod,artificialneuralnetworkandSVM(SupportVectorMachine),weuseanone-versus-onemulti-classSVMidentificationalgorithmsuccessfullyidentifiestheCrownwordnumber.TheMATLABcomputersimulationexperimentprovesthatthecorrectionofthecompletealgorithmfortheidentificationoftheCrownwordnumberofRMBcanreach85.25%,whichhascertainapplicationvalue.Keyword:Crownwordnumber,MATLAB,SVM目錄8839_WPSOffice_Level11緒論 113898_WPSOffice_Level11.1本課題的研究背景與意義 18593_WPSOffice_Level11.2本課題的研究現(xiàn)狀 210730_WPSOffice_Level11.3本課題主要工作 310501_WPSOffice_Level11.4論文的章節(jié)安排 416177_WPSOffice_Level12人民幣冠字號的定位以及二值化和濾波處理 528262_WPSOffice_Level12.1人民幣的冠字號區(qū)域定位 58593_WPSOffice_Level22.1.1冠字號在人民幣的獨有性質 516177_WPSOffice_Level22.1.2基于先驗知識和投影的定位算法 618189_WPSOffice_Level12.2冠字號區(qū)域的圖像二值化 1126704_WPSOffice_Level22.2.1圖像分割技術 1119042_WPSOffice_Level22.2.2邊緣檢測算法 1124335_WPSOffice_Level22.2.3閾值分割算法 136130_WPSOffice_Level12.3冠字號區(qū)域的濾波處理 179233_WPSOffice_Level22.3.1噪聲的定義 174611_WPSOffice_Level22.3.2數(shù)字濾波處理 1811175_WPSOffice_Level12.4本章小結 2122665_WPSOffice_Level13人民幣冠字號的傾斜校正以及字符分割和歸一化 2226704_WPSOffice_Level13.1冠字號區(qū)域的傾斜校正 2219042_WPSOffice_Level13.2冠字號的字符分割 2411198_WPSOffice_Level23.2.1區(qū)域連通法 2412408_WPSOffice_Level23.2.2先驗知識法 243516_WPSOffice_Level23.2.3基于垂直投影的字符分割法 2412774_WPSOffice_Level13.3冠字號的字符歸一化 2619552_WPSOffice_Level13.4本章小結 2723378_WPSOffice_Level14人民幣冠字號的字符識別 2824335_WPSOffice_Level14.1冠字號的特征提取 287951_WPSOffice_Level14.2冠字號的字符識別 312947_WPSOffice_Level24.2.1模板匹配識別 319276_WPSOffice_Level24.2.2人工神經網絡識別 323311_WPSOffice_Level24.2.3支持向量機識別 349877_WPSOffice_Level14.3基于SVM的冠字號的識別 4032224_WPSOffice_Level14.4本章小結 428473_WPSOffice_Level1結論 439233_WPSOffice_Level1參考文獻 4423916_WPSOffice_Level1致謝 46人民幣冠字號的定位以及二值化和濾波處理常識告訴我們,冠字號位置固定且占比小,位于整張人民幣的左小角,因此我們可以采取先定位出冠字號區(qū)域,這樣可以減少后期處理的運算時間。為了區(qū)分目標和背景,需要對定位好的冠字號區(qū)域進行二值化,不僅可以在后面的處理中減少占用空間和運算時間,更好的突出目標增加識別的準確率。由于人民幣在流通過程中或多或少的會有污損,而且在采集過程中由于光照、設備電路等原因,會在圖像中引入噪聲,因此需要對冠字號區(qū)域進行濾波處理,否則會影響識別的精度,2.1人民幣的冠字號區(qū)域定位2.1.1冠字號在人民幣的獨有性質2005版和2015版的百元人民幣是現(xiàn)在市面流通最廣的面額最大的人民幣[11],本文主要研究這兩個版本的人民幣。2005版的人民幣上的冠字號固定位于其左下角(橫向排列),占比小,冠字號字符的大小和高寬比有一個嚴格的標準,字符間的間距也有一定的要求。冠字號一共有十位,其中兩位是英文大寫字母(除了V),剩余的八位為阿拉伯數(shù)字,英文大寫字母只可能出現(xiàn)在冠字號前四位,顏色為深紅色,后六位為黑色。2015新版人民幣在2005版人民幣的基礎上,適當?shù)恼{整了一些圖案,其中位于左下角的冠字號不變,但是在人民幣的右側增加了一列冠字號(縱向排列),顏色為藍色,如下圖所示。圖2.12005版百元人民幣及其冠字號圖2.22015版百元人民幣及其冠字號2.1.2基于先驗知識和投影的定位算法從人民幣的特征分析我們得知,冠字號只占整張人民幣的左小角一小部分,若對整張人民幣進行圖像處理會對算法的要求較高,而且需要剔除許多無用特征,增加運算量,無法滿足實時性。所以,對人民幣的冠字號定位,可以根據先驗知識來研究[12]。由于本文研究的人民幣的冠字號只位于左下角位置,所有對于右側的冠字號,我們并不需要處理。根據先驗知識,我們可以將處理的范圍限定在人民幣寬和高的這個左下角小區(qū)域內,有效的剔除了人民幣的其他特征,如圖2.3所示。圖2.3人民幣寬和高的左下角區(qū)域基于先驗知識和投影的定位算法如下:縮小區(qū)域假設采集到的人民幣高度為H,寬度為W,根據上面所述的先驗知識,左小角小區(qū)域的高度,寬度,截取原始圖像的(H1*2:H,1:W1)即可得到左小角小區(qū)域。將圖像降維成二值化圖像由于獲取的原始圖像為彩色圖像(三維),我們需要將圖像降維成灰度圖像(二維),再處理成二值化圖像,縮短運算時間。數(shù)學形態(tài)學處理二值化圖像數(shù)學形態(tài)學是圖像處理中的一個強有力工具,主要包括腐蝕、膨脹、開操作、閉操作等處理方式。腐蝕的實質是求局部最小值的操作,可用公式2.1表示,其中其中A表示待圖像,B表示構造元素。(2.1)在處理圖像的方面上來說,通過構造的結構元素與圖像矩陣進行卷積,若構造元素完全覆蓋圖像點的領域則在該點賦值為1,反之不賦值.在二值化圖像中,相當于黑色部分增加,白色部分減少,原理如圖2.4所示,其中A表示待圖像,B表示構造元素。圖2.4形態(tài)學腐蝕處理原理圖與腐蝕處理相反,膨脹操作對二值化圖像來說是使白色部分增加,黑色部分減少,用公式2.2表示,其中A表示待圖像,B表示構造元素。(2.2)膨脹的原理圖如圖2.5所示,其中A表示待圖像,B表示構造元素。圖2.5形態(tài)學膨脹處理原理圖本文采用的形態(tài)學處理是腐蝕和閉操作(相當于先進行膨脹再進行腐蝕處理)。通過上面的確定小區(qū)域處理,我們發(fā)現(xiàn)由于采集圖像時掃描的偏差,容易造成處理整張圖片左側邊界或者右側邊界的缺失,導致在確定小區(qū)域時大量紅色特征引入到圖片中,如圖2.6(a)所示,在進行形態(tài)學處理時帶來了干擾。為了除去這些干擾,,構造2×2的矩形結構元素,采用形態(tài)學閉操作直接對二值化圖像處理,即可消除右邊引入的干擾,如圖2.6(b)和2.6(c)所示。圖2.6(a)有干擾左小圖2.6(b)二值化圖像圖2.6(c)形態(tài)學閉操作角區(qū)域后的二值化圖像由于二值化后背景是白色(像素值為255),冠字號是黑色,在接下來的投影算法中需要行列值像素的累加,所以我們先進行取反操作,使背景變?yōu)楹谏?,冠字號變?yōu)榘咨?。為了能夠使投影算法的像素累加連續(xù),先對圖像進行腐蝕,在通過構造25×25的矩形結構元素閉操作,進行聚類填充。由于冠字號下面的圖標對投影結果有影響,再通過去除小像素操作將這些干擾去除,這一系列處理如圖2.7(a)、2.7(b)、2.7(c)所示。圖2.7(a)取反操作圖2.7(b)聚類填充圖2.7(c)移除小圖標(4)投影算法水平投影和垂直投影是數(shù)字處理中的兩種算法。設二值化圖像為,那么它的水平投影和垂直投影分別由公式2.3和2.4表示,其中x,y為像素點的坐標,為該點的像素值,H1、W1分別為圖像的高度和寬度,、分別為各行像素值累加和以及各列像素值累加和。水平投影:(2.3)垂直投影:(2.4)水平投影結果得到的是冠字號的上下邊界,記上邊界為,下邊界為,垂直投影結果得到的是冠字號的左右邊界,記左邊界為,右邊界為,所以得到的冠字號定位區(qū)域為(:,:)。圖2.7(c)的行、列像素累加值如圖2.8所示,從圖中可以得出=100,=150,=60,=480。圖2.8矩形填充區(qū)域的行、列像素灰度值累計(5)邊界修正考慮到定位的邊界正好是冠字號的邊界,切割出的結果可能會造成一些冠字號的不完整,現(xiàn)將冠字號區(qū)域進行邊界修正。上邊界:=;下邊界:;左邊界:;右邊界:。修正后冠字號如圖2.9所示圖2.9冠字號區(qū)域本文結合冠字號的性質,先將整張人民幣處理成左下角的一小部分,再使用數(shù)字形態(tài)學處理去除掉了一些無關信息,最后基于水平和垂直投影法,有效的定位出冠字號區(qū)域。本算法耗時短、效果好,具有實時性和準確性。2.2冠字號區(qū)域的圖像二值化圖像分割技術實質就是將圖像分成“前景”和“背景”,其中前景是我們想要的特征,通常將其處理成白色(像素為255),而背景是無用特征,通常將其處理成黑色(像素為0),通過圖像分割技術我們可以有效的提取出研究的特征,這個處理過程通常也叫做圖像二值化[13][14]。2.2.1圖像分割技術圖像分割技術在當今圖像工程的發(fā)展過程中的有著重要的地位,應用廣泛,為了滿足需求,人們致力于研究新的理論來提高圖像的質量[15]。近年來,出現(xiàn)了諸如人工神經網絡、小波理論、分形理論等理論,這些理論的發(fā)展推動了圖像分割技術的發(fā)展。雖然現(xiàn)在提出的分割算法種類繁多,但是邊緣檢測、閾值分割等經典算法依然占主流算法。2.2.2邊緣檢測算法(1)Sobel算子Sobel算子是邊緣檢測中最基本一階差分算子,通過引入局部平均算法,可以求得圖像對應點的梯度幅值和方向。Sobel算子的模板包括:橫向模板,縱向模板,通過這兩個3×3的矩陣與圖像作卷積運算可近似得到圖像的橫向、縱向梯度值。用公式2.5和2.6表示,其中、分別表示圖像在橫向和縱向的邊緣檢測圖像,為圖像在該點的像素值。(2.5)(2.6)求出、后,根據公式2.7和2.8即可求出圖像的梯度幅值和對應的方向,其中G代表梯度幅值,代表梯度方向。(2.7)(2.8)采用Sobel算子對冠字號區(qū)域進行邊緣檢測,如下圖所示。圖2.10Sobel算子處理冠字號效果圖(2)Roberts算子Roberts算子是邊緣檢測處理中最簡單的一個算子,精度較高,但是噪聲對其影響很大。與Sobel算子一樣,Roberts算子也采用兩個模板,但是結構簡單,是2×2的模板,其中橫向模板為,縱向模板為,運算橫向、縱向的邊緣檢測圖像與公式2.5和2.6類似,這里寫成差分的形式,如公式2.9和2.10所示。(2.9)(2.10)其中、分別表示圖像在橫向和縱向的邊緣檢測圖像,為圖像在該點的像素值。求出、后,可根據公式2.11求出梯度的幅值,其中表示該點的幅值。(2.11)采用Roberts算子對冠字號區(qū)域進行邊緣檢測,如下圖所示。圖2.11Roberts算子處理冠字號效果圖LOG(Laplacian-Gauss)算子LOG算子與上述算子不同,它是一個二階微分算子,形象一點的說,在一階微分算子中,邊緣是圖像的極值點,而在二階微分中,邊緣是圖像的極值之間的零點。LOG算子實質是一種改進的Laplacian算子,由于Laplacian算子抗干擾能力差,通過引入平滑濾波能夠有效去除噪聲帶來的影響。LOG算子的模板為,擴展模板為。采用LOG算子對冠字號區(qū)域進行邊緣檢測,如下圖所示。圖2.12LOG算子處理冠字號效果圖2.2.3閾值分割算法通常在使用閾值分割算法之前,需要將彩色的RGB圖像轉換為灰色圖像,RGB之間的組合基本覆蓋了我們人眼可識別的顏色范圍。將RGB彩色圖像轉為灰度圖像的公式如2.12所示。(2.12)其中代表像素點的位置,代表該點的灰度值(0-255),將彩色圖像轉為灰色圖像不僅降低了內存的開銷,也加快了運算的速度。通過選取一個恰當?shù)拈撝?,運用公式2.13將灰度圖像轉為二值化圖像,其中表示二值化點的像素值。(2.13)轉換后的圖像的像素值只有255(白色)和0(黑色),即實現(xiàn)了前景和背景的區(qū)分。根據對閾值T的不同約束,可將T分成三種類型:全局閾值、局部閾值和動態(tài)閾值[16]。全局閾值法只使用一個閾值對整張圖片進行二值化,算法簡單且區(qū)分效果好。局部閾值法與像素點的像素值和該點局部領域特征都有關,將整張圖片劃分成多個子區(qū)域,每個區(qū)域使用不同的閾值,該方法的效果比全局閾值明顯,但是耗時長,且容易造成筆畫斷裂。動態(tài)閾值法不僅與上面的兩個因素有關,還要考慮像素點的位置,即不僅要考慮當前像素點的信息,也要考慮周圍像素點的信息,該算法區(qū)分效果最明顯,但是算法復雜,不具有實時性?;谏衔奈覀兌ㄎ坏墓谧痔枀^(qū)域的特點,采用全局閾值法能達到有效的區(qū)分,而且滿足了實時性。我們對直方圖閾值分割法、迭代閾值分割法、Otsu法這三種全局閾值法進行簡單的介紹并進行測試比較,選擇出適合冠字號區(qū)域的最優(yōu)二值化算法。直方圖閾值分割法通過直方圖分析實現(xiàn)圖像的分割即為直方圖閾值分割法。一個典型的直方圖如圖2.13所示。閾值T閾值T圖2.13典型的直方圖和閾值T的選取上圖中的橫軸代表灰度級,縱軸代表該級出現(xiàn)的概率,該算法的主要依據是圖像中的前景和背景對比度強,在圖像灰度直方圖中就會出現(xiàn)如圖所示的兩個波峰和一個波谷,在波谷處取得閾值,即可將目標和背景區(qū)分開來。直方圖閾值法方法簡單,容易實現(xiàn),但是該算法對圖像有一定的要求,就是形成的直方圖必須有兩個明顯的波峰,閾值才可選取在波谷,在很多實際情況中直方圖并沒有兩個波峰,或者是即使存在兩個波峰,波谷也很平,這在選取閾值的過程中就顯得十分困難,所以這個算法的局限性很大。經過對冠字號區(qū)域的直方圖檢測,設置的閾值為120,用此閾值進行二值化,效果如圖2.14所示。圖2.14直方圖閾值分割法處理冠字號效果圖迭代式閾值選擇法迭代式閾值選擇法采用多次重復迭代求得一個閾值T,再對圖像進行二值化處理,具體算法如下:①圖像的最大像素值和最小像素值的平均值作為初始閾值T0。(2.14)②大于閾值的確定為前景,而小于閾值的確定為背景,分別計算兩個區(qū)域的灰度均值u1、u2。(2.15)③用u1、u2來計算新閾值T1。(2.16)④當T0和T1相等時,所求的T1為閾值,否則重復②~③步驟。迭代式閾值選擇法是直方圖閾值法的改進算法,在選擇閾值時的效果比直方圖閾值法好,但是該算法較直方圖閾值法復雜,運算時間較長。圖2.15是采用迭代式閾值選擇法對冠字號區(qū)域進行二值化處理。圖2.15迭代式閾值選擇法處理冠字號效果圖Otsu法Otsu法(即大津算法)是日本學者Otus于1979年提出的一種處理圖像二值化的高效算法,運用廣泛,具有良好的適應性[17]。主要思想是尋找最優(yōu)的類間方差方差,進而取得最優(yōu)閾值,具體算法如下:①假設原始圖像的大小是M×N,像素值大于閾值的個數(shù)為N0,小于閾值的個數(shù)為N1,計算出前景占比和背景占比。(2.17)②計算前景的平均灰度u0和背景的平均灰度u1。(2.18)③計算區(qū)間的像素累加值u(2.19)④計算類間方差(2.20)⑤將(2.19)代入(2.20)得到的化簡公式。(2.21)⑥通過遍歷的方法,當求出使類間方差最大時的T,即為所求的最優(yōu)閾值。Otus算法能夠優(yōu)化圖像的細節(jié),使細節(jié)更加明顯,且自適應能力強,選取出的閾值能夠有效的區(qū)分前景和背景,圖2.16為采用Otsu算法對冠字號進行二值化處理的效果圖。圖2.16Otsu法對冠字號區(qū)域進行二值化處理結合三種全局閾值的算法,表2.1顯示了三種算法對冠字號區(qū)域進行二值化處理的效果圖。表2.1各類算法對冠字號區(qū)域的二值化處理效果圖二值化算法二值化效果圖直方圖閾值分割法迭代式閾值選擇法Otsu法從效果圖的比較上來看,Otsu法處理冠字號區(qū)域的二值化效果最明顯,每一位冠字號的筆畫連貫,且粗細均勻,雖然在用時的層面上來說Otsu法的耗時最長,但是區(qū)分度并不大,結合實際圖像的特點,直方圖閾值分割法雖然算法簡單且實時性好,但是并不是每張圖片的直方圖都能形成兩個波峰,所以實際效果并不理想。迭代式閾值選擇法雖然和Otsu法一樣都具有一定的自適應性,但是在處理低分辨率和光照不均的圖片時,迭代式閾值選擇法的效果沒有Otsu法那么好。綜上所述,本文采用Otsu算法進行對冠字號的二值化處理。2.3冠字號區(qū)域的濾波處理2.3.1噪聲的定義圖像噪聲是指位于圖像數(shù)據中多余的、帶有干擾性的信息,噪聲的存在或多或少會影響圖片的質量,在某些高精度的圖像處理中,噪聲的存在會嚴重影響處理的效果[18]。圖像的噪聲來源主要從兩個方面,一是圖片的采集過程,噪聲源包括圖像傳感器的材質、環(huán)境、傳感器內部構造等因素;二是圖像信號的傳輸過程,當傳輸設備不完善或者某些輸入環(huán)節(jié)不理想會引入各種噪聲。本文中的噪聲主要是人民幣流通過程中所受到的污染,為了模擬實際過程中產生的噪聲,本文對冠字號區(qū)域添加噪聲密度為0.05的椒鹽噪聲,效果如圖2.17所示。圖2.17添加了椒鹽噪聲的冠字號區(qū)域2.3.2數(shù)字濾波處理數(shù)字濾波處理是將圖像中的噪聲等影響精確度的因素去除的過程,主要包括空間域濾波和頻域濾波兩方面[19]。通過模板構造直接對原圖像進行卷積處理這個過程為空間域濾波,而先將圖像進行傅里葉變換和反變換處理這個過程,即為頻域濾波??臻g域濾波和頻域濾波各有優(yōu)缺點,結合冠字號區(qū)域的特點和椒鹽噪聲的特點,本文采用空間域濾波對圖像進行處理,常見的空間域濾波包括均值濾波、中值濾波、拉普拉斯濾波等等。均值濾波算法均值濾波是一種典型的線性濾波,用內值之和為1的奇數(shù)模板與圖像進行卷積運算,并取均值結果代替原來點的像素值。如公式2.22所示,其中為像素點,為該點均值,為該點像素值,M為模板中像素的個數(shù)。(2.22)以3×3的均值濾波為例,3×3的均值濾波模板為,設原始圖像的矩陣為,首先將3×3模板中心對準圖像的(1,1),該點的像素值為1,點對點的進行運算,模板在矩陣外的點用0自動填充,求得(1,1)點的均值為,同理用3×3模板對原始圖像的其余點遍歷,求得均值濾波后的圖像矩陣為。均值濾波算法實現(xiàn)簡單,對噪聲有良好的抑制效果,但是缺點也很明顯,均值濾波會造成圖像的模糊和細節(jié)的丟失。分別用3×3、5×5和7×7的均值濾波模板對添加了椒鹽噪聲的冠字號區(qū)域進行濾波,效果如表2.2所示。表2.2不同模板的均值濾波的濾波效果圖均值濾波模板的大小濾波效果圖3×35×57×7從上表可以看出,均值濾波總體對椒鹽噪聲的抑制效果不明顯,且隨著模板大小的增加,圖像變得越來越模糊,丟失了許多細節(jié),這并不利于接下來的圖像處理,所以均值濾波并不適用于本課題。中值濾波器與均值濾波相反,中值濾波是非線性濾波,在濾波處理上運用十分廣泛[20]。中值濾波的算法與均值濾波類似,主要思想是構造一個奇數(shù)模板,該模板為全1模板,通過模板與圖像卷積運算,并將卷積結果排序并取中值來代替原來像素點的像素值。中值的定義如公式2.23所示,其中y為輸出中值,x1~xn代表樣本。(2.23)以3×3的中值濾波為例,3×3的中值濾波模板為,原始圖像的矩陣依然選擇,先將3×3模板的中心對準圖像的(1,1),該點的像素值為1,點對點的進行運算,超出矩陣外的點用0自動填充,得到該點的樣本為{1,2,4,5},進行中值排序后,由于樣本數(shù)為4,所以求得的中值為2和4的均值,即為3,同理用3×3模板對原始圖像的其余點遍歷,求得中值濾波后的圖像矩陣為。分別用3×3、、5×5和7×7的中值濾波模板對添加了椒鹽噪聲的冠字號區(qū)域進行濾波,效果如表2.3所示。表2.3不同模板的中值濾波的濾波效果圖中值濾波模板的大小濾波效果圖3×35×57×7從上表中的效果圖可以看出,采用3×3的中值濾波模板的濾波效果不佳,噪聲依然存在,而采用7×7的中值濾波模板雖然能有效的抑制椒鹽噪聲,但是對原始圖像的影響也較大,造成一些筆畫連在一起,5×5的中值濾波的效果最佳,不僅有效的抑制了椒鹽噪聲,而且保留了冠字號的許多細節(jié)信息,因此在冠字號預處理中我們采用5×5的中值濾波對冠字號區(qū)域進行去噪處理。由于使用中值濾波后的圖像的四個邊角有黑點,為了去除黑點,我們使用數(shù)字形態(tài)學處理中的閉操作將黑點去除,最終采用5×5濾波的冠字號區(qū)域效果如圖2.18所示。圖2.185×5中值濾波效果圖2.4本章小結本章介紹了人民幣紙幣冠字號預處理過程中的前三步處理。在冠字號定位部分,本文提出了一種基于先驗知識和投影的定位能夠有效的定位出位于人民幣左下角的冠字號區(qū)域;在冠字號二值化部分,本文對比了3種全局閾值算法,經過比較分析選擇了Otsu法對冠字號進行二值化;在冠字號濾波處理部分,本文對比了空間域濾波中的均值濾波和中值濾波,經過檢測對比選擇5×5的中值濾波對冠字號進行處理。3人民幣冠字號的傾斜校正以及字符分割和歸一化由于人民幣本身存在折痕,以及掃描儀采集角度等原因,采集到的人民幣圖像并不是完全擺正的,會有一定的傾斜角,因此冠字號區(qū)域也會受到影響,導致了冠字號出現(xiàn)字符傾斜、大小不一,因此我們有必要對冠字號進行傾斜校正。由于我們采用基于支持向量機進行識別,因此需要切割冠字號,使之成為單字符。對單字符進行歸一化處理,使其具有相同的大小,以便后期的識別準確高效。3.1冠字號區(qū)域的傾斜校正由于采集過程中的操作不當以及紙幣本身的褶皺,我們發(fā)現(xiàn)采集到的一些冠字號的字符大小和高度不一,這對接下來的字符分割處理造成了一定的影響,帶來誤差。為了消除傾斜角度帶來的影響,本文采用Hough變換檢測冠字號的傾斜角,并依據傾斜角度對冠字號進行傾斜校正[21]。Hough變換的基本思想是利用點與線的對偶性,將原圖像空間中的每個邊緣點轉換成極坐標系下的正弦曲線,通過這樣的映射關系,就把檢測出原圖像中的直線,并得到直線的表達式,進而可以校正原圖像。假設空間中的直線的斜率為k,截距為b,直線的表達式如式3.1所示。(3.1)當直線與x軸垂直,斜率k為無窮大,這對我們的表達帶來了不便,為了更好地計算,改用表達式3.2來表示直線方程。(3.2)其中表示(x,y)到原點的距離,表示過點(x,y)和原點的直線與x軸之間的夾角。公式3.2已將點(x,y)映射到空間,上式表明,直角坐標系下的直線映射到極坐標系下為一個點,關系如圖3.1所示。圖3.1Hough變換通過上圖可知:左側直角坐標系下的藍色直線就相當于右側極坐標系下的黑色點,反之,直角坐標系下的一個點相當于極坐標系下的一條正弦曲線。傾斜校正具體算法如下:①通過邊緣檢測,找出圖像可能存在的邊緣點。②對所有邊緣點進行Hough變換。③檢測極坐標系下的交點,由于Hough變換實質是一個投票過程,每個交點的值累加,投票結果最大者認為是期望,所以正弦曲線相交次數(shù)最多的那個點即是值最大的交點。④極坐標下的點對應直角坐標系下的直線,重合最多的點對應圖像中的直線。⑤獲取了冠字號的直線即可得出傾斜角度,對圖像進行旋轉處理就實現(xiàn)了傾斜校正的目的。圖3.2顯示了采用Hough變換的傾斜校正效果。傾斜校正前的冠字號(b)傾斜校正后的冠字號圖3.2采用Hough變換的傾斜校正3.2冠字號的字符分割冠字號字符分割即把連續(xù)的冠字號上的英文字母和阿拉伯數(shù)字切割成10個單個字符,并將這些字符貼上標簽作為后期識別過程所需要的訓練集和測試集,所以字符分割的好壞直接影響了后期識別的準確率,是識別的基礎。做字符切割,需要獲取的是單個字符的左右邊界,無需上下邊界,將單個字符切割出來,需要切割的大小剛好合適,過大會帶來無用的干擾,過小又會丟失有用的信息,最重要的是,在處理切割算法時必須要保證切割的字符圖像完整,以免影響識別[22][23]。3.2.1區(qū)域連通法區(qū)域連通法通過區(qū)域生長提取出包括初始點的圖像全部連通域。通過第一章的分析我們知道,冠字號是由英文大寫字母和阿拉伯數(shù)字組成,基本都可以由一筆寫成,即可分割出一個連通分量,連通分量以外的圖像我們可以當做噪聲去除。區(qū)域連通法對去除噪聲的要求較高,若噪聲去除不明顯容易造成字符之間的黏連現(xiàn)象,導致單個字符無法正確的提取出來,且該算法耗時長,不滿足實時性。3.2.2先驗知識法由于冠字號都為標準的印刷字體,規(guī)格統(tǒng)一,字符之間的間距也有嚴格的標準,冠字號矩形區(qū)域的大小規(guī)格一般為28mm×3.5mm,每個冠字號的寬為2mm,高為3.5mm,字符之間的間距為1.5mm。先驗知識法的基本思想正是基于冠字號的大小規(guī)格固定所提出的,根據冠字號定位的結果,估算出單個字符的寬度和字符之間的間距,逐個分割出字符。先驗知識法分割的準確率很大程度上取決于冠字號的定位結果,由于該算法的分割點是由人為估算設定的,因此精度不高,而且先驗知識法的適應性差,容易造成分割錯誤。3.2.3基于垂直投影的字符分割法垂直投影投影法是運用十分廣泛的算法,該算法不僅可以運用在冠字號區(qū)域的定位,也可以運用在冠字號的字符分割上,由于冠字號的單個字符大小規(guī)范且字與字之間的間隔固定,采用垂直投影法簡單,切割的效果也非常好。垂直投影法的主要思想是掃描冠字號區(qū)域的每一列,并計算出每一列的像素值,即得到冠字號的垂直投影圖。在二值化圖像中,白色代表像素255,黑色代表像素0,而二值化后的冠字號數(shù)字和字母是黑色,背景是白色,因為需要累加每列的像素值,所以在進行垂直投影前需要將圖像求補,即冠字號為白色,背景為黑色。求補后的圖像運用垂直投影算法,逐列掃描并進行列的像素累加,為了再次抑制噪聲的影響,我們對圖像采用平滑處理,效果如圖3.3所示。(a)求補后的冠字號圖像(b)冠字號的垂直投影圖圖3.3冠字號的垂直投影效果圖在進行垂直投影后,計算出投影結果的像素最大值和最小值,并設置切割閾值為。MATLAB中的findpeaks函數(shù)為尋找波峰函數(shù),通過像素最大值減去每列的像素值即可以實現(xiàn)尋找波谷,圖中綠色的點為尋找到的波谷位置,一共9個點,代表著10位數(shù)冠字號的9個間隙。通過閾值調整綠色波谷點的位置,對圖像進行切割,即可實現(xiàn)將冠字號分割成單字符,如圖3.4所示。圖3.4切割成單字符的冠字號基于垂直投影的字符分割法算法簡單,響應速度快,有較好的自適應性,分割的效果好。3.3冠字號的字符歸一化冠字號歸一化是預處理中的最后一個環(huán)節(jié),從冠字號的字符分割效果圖可以看出,每個字符的大小會存在差異,這對我們接下來的識別帶來了一定的影響。所謂的歸一化,就是將大小不同的單個字符轉成大小相等的單個字符,歸一化算法有兩種:線性歸一化和非線性歸一化。線性歸一化是將原有的圖片按線性縮放成規(guī)定的圖片大小,該算法簡單,耗時短,但是該算法不考慮字符筆畫的粗細問題,容易造成字符變形;非線性歸一化是基于字符筆畫粗細的一種改進算法,在字符筆畫粗的地方進行放大,在字符筆畫細的地方進行縮小,該算法就解決了字符的變形問題,但是算法復雜,耗時長。結合冠字號是標準印刷體這個性質,本文采用線性歸一化算法,將分割好的單字符歸一化成28×28的像素矩陣,效果如圖3.5所示。圖3.5歸一化后的冠字號本文采集的人民幣圖像一共1641張,均是用掃描儀掃描出的圖像,按照訓練集和測試集大約8:2的比例,隨機將1397張人民幣作為訓練集,244張人民幣作為測試集,經過一系列預處理得到冠字號的單個字符,并貼好標簽放在對應的文件夾下,效果如圖3.6所示。圖3.6歸一化字符分類3.4本章小結本章介紹了人民幣冠字號識別預處理的后三步處理。在傾斜校正部分,本文介紹了Hough變換的算法原理并采用Hough變換作為本課題傾斜校正算法。在單字符分割部分,本文對比了幾種常用的字符分割算法,經過對比分析選擇了基于垂直投影的單字符分割算法進行分割,效果良好。在字符歸一化處理部分,本文結合人民幣冠字號是標準印刷體的特性,采用線性歸一化處理實現(xiàn)了每個字符的歸一化,并將處理好的字符貼上標簽作為識別的訓練集和測試集。本文的冠字號預處理效果良好,對接下來的冠字號識別打下堅實的基礎。4人民幣冠字號的字符識別經過前期的預處理,我們得到了貼好標簽的訓練集和測試集,在進行冠字號識別之前,我們需要提取出字符的特征,以便輸入到分類器中訓練出模型。字符識別作為人民幣紙幣冠字號識別算法的最后一步,也是最為關鍵復雜的一步,一個分類器的優(yōu)劣直接影響到識別的準確率和速度,對分類器的研究是本文的重點。4.1冠字號的特征提取特征提取是進行字符識別之前的必要步驟,是對預處理后的數(shù)據進行分析、提取關鍵信息的過程[25]。特征提取有許多方法,比如HOG特征提取、LBP特征提取、Haar特征提取等等,基于人民幣冠字號為大寫英文字母和阿拉伯數(shù)字的特點,本文特征提取采用HOG算法。HOG(HistogramofOrientedGradient)算法[26],即梯度直方圖算法,是法國人Dalal于2005年提出,在圖像的特征提取運用得非常廣泛,基于HOG特征提取和SVM(SupportVectorMachine)結合的算法在許多領域都取得了巨大的成功,HOG+SVM的思想已經成為現(xiàn)在識別的主流思想。HOG特征提取的具體算法如下:①對原始圖形進行灰度處理并進行歸一化。②HOG特征提取的主要思想就是進行梯度運算,分別使用橫向模板和縱向模板對圖像進行卷積運算得到水平梯度值和垂直梯度值,公式如4.1所示。其中(x,y)為當前的像素點,為像素值,為水平方向的梯度,為垂直方向的梯度。(4.1)③求得水平方向的梯度和垂直方向的梯度后,通過公式4.2和4.3可以分別計算出圖像的梯度幅值G和梯度方向。(4.2)(4.3)④定義窗口大小WinSize、塊大小BlockSize、塊滑動步長BlockStride和元胞大小CellSize。元胞是小像素點之間的組合,通常元胞大小定義為8×8,即每8×8個像素點組成一個元胞。塊是元胞的上一級,通常塊的大小定義為2×2個元胞,即一個塊中包含4個元胞,以2×2的方陣排列,所以塊的大小也可以說是16×16。窗口是塊的上一級,通常大小設置成64×128,圖像掃描的原理是基于塊在窗口內滑動,滑動步長通常設置為8個像素,即塊每滑動一次走過了8個像素,元胞、塊、窗口、圖像的關系如圖4.1所示。(a)元胞與塊的關系(b)塊與窗口的關系(c)窗口與圖像的關系圖4.1元胞、塊、窗口、圖像之間的關系圖⑤定義梯度方向數(shù)bins。梯度方向數(shù)表示一個元胞中統(tǒng)計梯度方向的數(shù)目,也叫做特征向量,通常定義的梯度方向數(shù)為9,即一個元胞統(tǒng)計9個方向的梯度直方圖,每個梯度代表的方向為度,如圖4.2所示。圖4.2梯度方向分類圖⑥將圖像掃描的結果反映在直方圖上面,值得注意的是,某點梯度某方向上的幅值是多少,在對應的直方圖上該方向所加的值為幅值的值。通過計算機計算樣本的HOG特征向量,以上面定義的大小為例,樣本的特征向量為3780維,最終將這3780維特征向量輸入到分類器做訓練。在預處理中,本文已經將冠字號進行了二值化和歸一化,考慮到歸一化的圖像大小為28×28,在基于響應速度和準確率的權衡上,本文設置元胞的大小為8×8,梯度方向數(shù)為9,該設置提取的字符特征效果較優(yōu),具有實時性,效果圖如4.3所示。圖4.3對字符進行HOG特征提取4.2冠字號的字符識別經過HOG特征提取,得到了冠字號字母和阿拉伯數(shù)字對應的特征,輸入到分類器即可訓練出模型進行冠字號的識別。常用的字符識別方法有很多,比如模板匹配識別、人工神經網絡識別、支持向量機識別等等,不同的識別方法有不同的優(yōu)缺點,運用的場景也不盡相同,下文對這些方法進行詳細的介紹。4.2.1模板匹配識別模板匹配法是最基本、最原始的識別方法,該算法的基本思想是每個字符都有一個對應的模板,模板一一在原圖像上進行滑動,相當于掃描過程,過程結束后計算模板與原圖像的匹配度,匹配度最大的模板所代表的字符就是識別的結果。該算法在處理相似字符是的表現(xiàn)不盡人意,比如冠字號中的0和O、1和I、S和5、B和8等等,容易造成誤判,準確率不高,并且局限性較大,不能處理有一定傾斜角的字符。結合冠字號的特點,組成的元素有25個英文大寫字母(除了V)和10個阿拉伯數(shù)字,需要的模板較少,計算量也較小,模板匹配法在進行冠字號識別也有一定的研究意義。設待識別的圖像為S,模板為T,大小為m×n,模板T在待識別圖像S上滑動,被覆蓋的區(qū)域叫做子圖,i、j代表子圖左下角的坐標,如圖4.4所示。圖4.4被搜索圖S和模板T相似性由以下公式衡量:(4.4)將其歸一化,得到模板匹配相關系數(shù),公式如下:(4.5)當時,代表著相關度最大,即待識別字符與該模板完全匹配,S全部掃描后,最大值對應的子圖即位匹配目標。公式4.5結構復雜,使用該公式進行模板匹配響應時間慢,因此使用另一種算法來衡量T和的相似性,公式如下:(4.6)公式4.6計算了兩個圖像的誤差,當誤差最小時即為最佳匹配對象。與公式4.5相比,該公式沒有采用平方、開根號運算,取而代之的是絕對值差運算,算法簡便。4.2.2人工神經網絡識別人工神經網絡(ArtificialNeuralNetwork,即ANN),也稱為神經網絡,一直以來都是人工智能研究的重點,在近年來的應用十分廣泛[27][28]。常識告訴我們,人腦是由大量的神經元構成,而人工神經網絡正是模擬人腦的結構,通過不同神經元網絡的搭建來模擬人腦進行識別。神經網絡由大量神經元連接形成,不同層的神經元之間存在連接權重,單層所有神經元權重與輸入之積經過積激活函數(shù)輸出到下一層,最終輸出因上述因素的不同而不同。圖4.5顯示了單個神經元的結構。圖4.5神經元的結構單層感知網絡作為最初的神經網絡,具有結構簡單、計算量小等優(yōu)點,但是隨著問題的深入,發(fā)現(xiàn)單層神經網絡無法解決非線性問題,使在具體應用上受到了很大的限制。20世紀80年代,誤差反向傳播算法(ErrorBackPropagationTraining),簡稱BP算法的提出,通過反向傳播思想解決了單層網絡無法解決的非線性問題,在現(xiàn)在的識別領域運用廣泛[29]。圖4.6典型BP神經網絡結構圖BP神經網絡包括正、反向傳播兩個過程。正向傳播過程是輸入信號從輸入層輸入,經過中間層的處理,最終到輸出層得到結果。若結果達不到預期,就會引入反向傳播過程,該過程將輸出層的誤差信號反向傳回中間層,在所有的中間層調節(jié)神經元之間的連接權重,通過這種方式使得輸出結果逼近預期。公式4.7表示正向傳播過程,其中表示第層第j個神經元的激活輸出,激活函數(shù)用表示,表示從層的的第k個神經元指向層的第j個神經元之間的連接權重,表示層第j個神經元的偏移量。(4.7)為了便于表達,第層第j個神經元的線性結果我們用變量表示,公式如4.8所示,因此簡化公式可以寫成4.9的形式。(4.8)(4.9)反向傳播算法的原理是基于梯度下降法,反向傳播公式總共有4條,如下所示。輸出層誤差:(4.10)其中L代表輸出層所在的層數(shù)。中間層誤差:(4.11)參數(shù)變化率:(4.12)參數(shù)更新規(guī)則:(4.13)人工神經網絡是新興的算法,具有自學習性和適應性,且能夠處理非線性問題,通過神經元之間的權重實現(xiàn)了存儲功能,在各行各業(yè)的運用都很廣泛,但是不可否認,人工神經網絡也有劣勢,比如在其學習速度慢,一個簡單的問題可能需要迭代上千次才能結得結果,此外,在中間層層數(shù)的選擇上和神經元個數(shù)的安排上并沒有一個具體的理論指導,完全憑借試湊和經驗選擇,基于以上原因,本文并未采用神經網絡識別。4.2.3支持向量機識別支持向量機[30][31](SupportVectorMachine,即SVM)是一種典型的二分類模型,與傳統(tǒng)的分類器不同,SVM分類器在實現(xiàn)經驗風險最小化的基礎上,還要求置信范圍盡可能小,也就是說最終目的是尋找結構風險最小化。通俗的來說,SVM二分類本質就是通過在特征空間內尋找間距最大的超平面將數(shù)據劃分為兩類,以實現(xiàn)區(qū)分。SVM于1964年提出,該算法能夠有效處理非線性問題,泛化能力強,具有魯棒性,至今依然是解決一些非線性問題的首選方法,其中HOG+SVM的特征提取識別組合成了許多識別問題的主要思想,下面介紹SVM的基本算法。假設給定訓練樣本,在一個樣本空間內的劃分超平面有無數(shù)個,如圖4.7所示。圖4.7樣本空間存在無數(shù)個劃分樣本的超平面雖然劃分樣本的超平面很多,但是最優(yōu)超平面只有一個,正如圖4.7的粗線所示。由于數(shù)據噪聲等因素的影響,可能導致圖中的正例向下偏移,而負例向上偏移,這就導致了一些超平面的劃分出現(xiàn)了錯誤,圖中粗線所在的超平面能夠有效的避免這個問題,因此它的泛化能力最強,抗干擾能力最好,求解出這個超平面正是SVM算法的目的。通常我們定義樣本空間的超平面如下面公式:(4.14)其中、x均是n維列向量,代表法向量,x為樣本,b是偏移量,因為樣本是固定給出的,是定值,顯然需要求解超平面的變量是和b。我們將超平面定義為(,b),那么樣本空間內的任意點到超平面(,b)的距離為:(4.14)其中代表的是的第二范數(shù)。假設超平面(,b)能夠正確的劃分樣本,可以用如下的公式定義樣本的屬于類:(4.15)公式4.15表明,對于樣本,若,則;反之,若,。當樣本點能夠取得等號成立時,我們將這些點定義成“支持向量”。我們將兩類支持向量到超平面之間的距離定義為“間隔”,公式如4.16所示,圖4.8將這些定義標注。(4.16)圖4.8支持向量與間隔圖例要找到最大間隔的劃分超平面前提下,必須滿足一定約束,即:(4.17)為了求得最大間隔,等價于求||||的最小值,為了后面的求導運算的簡便,將公式4.17重寫:(4.18)式4.18也叫做凸二次規(guī)劃問題,為了求解,引入拉格朗日乘子,該問題的拉格朗日函數(shù)就可以寫成:(4.19)分別對系數(shù)、b、求導令其等于零,最終將模型化成如下的形式:(4.20)通過拉格朗日乘子法,把轉變成了,減少了約束條件數(shù),使求解方程變得簡單。上述求解過程嚴格滿足KKT(Karush-Kuhn-Tucker)條件:(4.21)為了求解上述的對偶二次規(guī)劃問題,我們采用SMO(SequentialMinimalOptimizaion)算法,與傳統(tǒng)的算法相比,SMO算法將優(yōu)化問題繼續(xù)細分,劃分后的優(yōu)化問題比未劃分的問題求解簡單,也就加快了求解的速度。SMO算法的解法主要有8個步驟:計算誤差:(4.22)計算上下邊界L和H,其中代表松弛變量:(4.23)計算學習率:(4.24)更新:(4.25)根據取值范圍修剪:(4.26)更新:(4.27)更新:(4.28)根據更新b:(4.29)上述介紹的SVM是典型的線性SVM,在實際情況中,大多數(shù)樣本并不是線性可分的,如果依然用上述的方法處理非線性樣本,將會進入死循環(huán),無解。處理非線性,一種方法是將SVM分類器的維度提升,通過映射關系,低維的線性不可分問題轉到高維就變成了線性可分問題,但是提升維度的方法對造成運算復雜化;另一種方法,也是SVM處理非線性問題最常用的方法,就是采用核技巧,引入核函數(shù),該算法不需要處理樣本空間的維度,引入核函數(shù)即可實現(xiàn)從不可分問題變成可分問題,計算結果與高維映射一樣,如圖4.9所示,常用的幾種核函數(shù)如表4.1所示。非線性問題求得的劃分超平面(b)高維空間實現(xiàn)線性可分圖4.9引入核函數(shù)實現(xiàn)非線性的可分表4.1幾種常用的核函數(shù)及其表達式核函數(shù)名稱表達式線性核k多項式核k高斯核k徑向核k將非線性不可分問題通過轉成轉成可分問題,雖然在理想的情況SVM可以做出完全正確的分類,但是實際情況中會有個別樣本“越界”,如圖4.10所示。一些正例樣本越界到超平面的下方,被分類成負例;而一些負例樣本越界到超平面的上方,被分類成正例,導致了分類錯誤。上文介紹的分類器采用的是“硬間隔”的分類方法,即硬性要求所有樣本點都滿足公式4.15,采用這種方法很容易造成整個規(guī)劃問題的無解,因此我們引入“軟間隔”的概念。圖4.10某些不受約束條件的樣本示意圖軟間隔的實質是引入了松弛變量到式4.18的約束條件,使可以間隔小于1,引入了松弛變量,SVM在進行分類時會自動放棄對如上圖所示的離群點(紅色的點)的分類,對離群點的重視程度,我們引入一個新的設置常量:懲罰因子C,C設置得越大代表著越重視離群點。最終優(yōu)化問題轉成:(4.30)SVM算法是典型的二分類算法,通過一個超平面將樣本劃分成正例和負例實現(xiàn)區(qū)分,人民幣冠字號識別不是簡單的兩類樣本問題,冠字號總共包括25位英文大寫字母(除了V)和10位阿拉伯數(shù)字,是一個35類的多分類問題,下文介紹SVM的多分類算法。4.3基于SVM的冠字號的識別SVM的多分類算法分為直接法和間接法。直接法即在一個優(yōu)化問題中一次實現(xiàn)多分類,如圖4.11所示。圖4.11SVM多分類算法的直接法原理圖如上圖所示,直接法用多個超平面將樣本空間劃分成多個區(qū)域,每個區(qū)域代表一個類別,實現(xiàn)分類。該算法對運算量的要求非常大,該算法并沒有在實際中采用。間接法主要有兩種,一種是一對多法,另一種是一對一法。兩種算法是實際運用中視具體情況使用。一對多法一對多法(one-versus-rest),也稱為OVR支持向量機算法[32],該算法將一個樣本歸為一類,剩余的樣本歸為另一類,測試結果有總共k個,取其中的最大值為分類結果。一對多法訓練的分類器少,訓練速度快,但是容易出現(xiàn)數(shù)據集偏斜的問題,且有新類引入,需要重新訓練模型。根據人民幣冠字號識別為35類多分類問題,可構造35類分類器實現(xiàn)冠字號的識別,該算法在實際工程中有一定的意義。一對一法一對一法(one-versus-one),也稱為OVO支持向量機算法,該算法是基于投票的思想,兩兩樣本之間都構造一個SVM分類器,這樣k個樣本就需要構造個SVM分類器,測試時把測試向量放入個分類器中進行分類,結果在對應的輸出SVM投票,最終投票數(shù)多的為分類結果。以A、B、C三類舉例,需要構造3個SVM分類器,分別是A和B;A和C;B和C。初始時輸出分類器A=B=C=0,以A做測試,將A的特征向量輸入到A,B分類器,A為正例,輸出分類器A+1;將A的特征向量輸入到A,C分類器,A為正例,輸出分類器A+1;將A的特征向量輸入到B,C分類器,假設B為正例,輸出分類器B+1。最終輸出分類器的結果為A=2,B=1,C=0,分類器A的票數(shù)最高,所以識別結果為A。一對一法的識別速度快,準確率高,但是當樣本數(shù)過多時,的SVM分類器的成本很大,訓練時間慢。結合人民幣冠字號是一個35類多分類問題,樣本數(shù)目只有35個并不算多,本文采用的是一對一的SVM多分類算法進行冠字號的識別。在人民幣冠字號的預處理中,已經將分割成單字符的冠字號貼上標簽并分好類,其中1397張人民幣作為訓練集,分割成單字符即13970個樣本提取特征向量輸入到SVM進行訓練,本文使用MATLAB仿真工具,調用了fitcecoc函數(shù),訓練出的模型采用10倍的交叉驗證來驗證模型,求解出的泛化誤差為0.0076,表示該模型有很好的分類效果。將貼好標簽的單個字符樣本測試集,經過HOG特征提取輸入到SVM模型中進行識別,測試結果如下表所示:表4.2冠字號識別結果表樣本識別數(shù)量識別單個樣本的平均速度識別正確個數(shù)正確率單個字符24400.68s241498.93%冠字號2446.8s20885.25%測試結果表明,本文采用基于SVM的一對一多分類算法,處理人民幣冠字號單個字符的準確率高達98.93%,處理完整的10位數(shù)冠字號序列的準確率為85.25%,達到了預期的效果,本算法的響應速率較快,平均識別一張人民幣的冠字號時間為6.8秒,滿足了實時性的要求。出于某些原因,本算法存在一定的錯誤率,一些相似的字母和數(shù)字,比如“I”和“1”,“0”、“O”和“Q”,“5”和“S”,“C”和“G”等識別容易造成誤分,對精確度有一定的影響。圖4.11MATLAB仿真結果4.4本章小結本章詳細介紹了人民幣紙幣冠字號識別過程中的字符識別部分,該部分也是整個識別算法的核心,直接決定了冠字號識別的準確率。在字符提取部分,本文詳細介紹了HOG特征提取的算法,并采用該算法對冠字號字符進行特征提取。在字符識別部分,本文詳細介紹了模板匹配識別、人工神經網絡識別和SVM識別三種主要的識別算法,并進行比較,最終結合人民幣冠字號的特點采用了基于SVM的一對一多類識別,該算法在識別單個字符的準確率達到98.93%,識別冠字號準確率達到85.25%,均達到了預期效果,且該算法識別冠字號的平均時間為6.8秒,滿足實時性。結論隨著科技的發(fā)展,利用計算機技術對人民幣紙幣的冠字號識別是模式識別的一個重要領域,該技術對維護市場穩(wěn)定、打擊經濟犯罪有著重要的意義。本文這個大背景下,針對2005版和2015版的人民幣,提出了一種基于SVM的人民幣紙幣冠字號識別算法,實驗結果表明,該算法有一定的應用前景。本文主要研究的內容如下:研究了人民幣冠字號的定位、二值化和濾波算法。基于冠字號的特點,本文提出了一種基于先驗知識和投影的定位算法,該算法運算時間短,準確率高,能夠有效的定位出冠字號區(qū)域。為了減少后期的運算時間,經過對比分析采用Otsu法對冠字號區(qū)域進行二值化處理。由于圖片傳輸過程會在圖像中引入噪聲,本文采用5×5的中值濾波對圖像進行濾波處理,有效抑制噪聲的影響。研究了人民幣冠字號的傾斜校正、單字符分割和字符歸一化算法。由于采集的圖像存在一定的傾斜角,本文采用Hough變換對圖像進行傾斜校正。在歸一化處理部分,本文采用與定位算法一樣的垂直投影的算法,對冠字號進行字符分割,接著使用線性歸一化算法對字符進行歸一化處理,為識別部分打下基礎。研究分析了現(xiàn)有的特征提取算法和識別算法,采用了HOG+SVM的組合算法對冠字號進行多分類識別,識別結果顯示,本算法對單個字符的識別率到達98.93%,識別冠字號準確率達到85.25%,且響應速度較快,具有一定的現(xiàn)實意義。本文對人民幣紙幣冠字號識別過程始終在計算機上仿真完成,由于時間、能力有限,論文依然有許多不足,具體如下:冠字號的定位算法要求采集的人民幣完整,若不完整可能造成定位的錯誤,今后需結合冠字號的性質研究適應性更強的算法。識別過程依然不能完全區(qū)分相似字符,比如“I”和“1”,“0”、“O”和“Q”,“5”和“S”,“C”和“G”等,識別的準確率有待提高,今后需研究更有效的特征提取算法區(qū)分這些相似字符。參考文獻[1] 鄒平.人民幣發(fā)展史:五套人民幣的歷史[J].中國防偽報道,2015(08):38-42.[2] 錢海飛.新版百元人民幣防偽性能提升[J].人民公安,2016(Z1):23.[3] 徐全發(fā).紫金冠字號跟蹤系統(tǒng)在商業(yè)銀行反假幣中的應用和推廣[J].中國金融電腦,20

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論