![基于深度學(xué)習(xí)的身份證二維碼識別算法_第1頁](http://file4.renrendoc.com/view/5c10ac648d6108f280306266825ac700/5c10ac648d6108f280306266825ac7001.gif)
![基于深度學(xué)習(xí)的身份證二維碼識別算法_第2頁](http://file4.renrendoc.com/view/5c10ac648d6108f280306266825ac700/5c10ac648d6108f280306266825ac7002.gif)
![基于深度學(xué)習(xí)的身份證二維碼識別算法_第3頁](http://file4.renrendoc.com/view/5c10ac648d6108f280306266825ac700/5c10ac648d6108f280306266825ac7003.gif)
![基于深度學(xué)習(xí)的身份證二維碼識別算法_第4頁](http://file4.renrendoc.com/view/5c10ac648d6108f280306266825ac700/5c10ac648d6108f280306266825ac7004.gif)
![基于深度學(xué)習(xí)的身份證二維碼識別算法_第5頁](http://file4.renrendoc.com/view/5c10ac648d6108f280306266825ac700/5c10ac648d6108f280306266825ac7005.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
基于深度學(xué)習(xí)的身份證二維碼識別算法
隨著計算機(jī)科學(xué)的發(fā)展和多段制應(yīng)用的發(fā)展,身份快速識別技術(shù)越來越受到重視。傳統(tǒng)的身份證識別方法主要有2種:一種是通過芯片掃描設(shè)備讀取身份證內(nèi)嵌芯片信息,該方法需要專用的芯片識別裝置,成本較高,且便攜性不足;另一種方法是手動登記,效率低下且容易出錯。近幾年來,模式識別理論以及圖像處理技術(shù)的發(fā)展為利用光學(xué)圖像實(shí)現(xiàn)證件識別奠定了理論基礎(chǔ),具備拍照功能的智能手機(jī)廣泛使用為證件識別提供了硬件平臺?;诠鈱W(xué)攝像頭圖像處理及模式識別理論的光學(xué)字符識別(opticalcharacterrecognition,OCR)在社會生活的各個行業(yè)得到了廣泛的使用,如車牌識別、掃碼支付等。OCR在文字識別方面具有高速、高效、低成本的優(yōu)勢。人工神經(jīng)網(wǎng)絡(luò)是對動物神經(jīng)網(wǎng)絡(luò)的簡單模仿,依靠系統(tǒng)的復(fù)雜程度,通過調(diào)整內(nèi)部大量節(jié)點(diǎn)之間的相互連接關(guān)系,從而達(dá)到處理信息的目的,被廣泛應(yīng)用于語音分析、圖像識別、數(shù)字水印、計算機(jī)視覺等很多領(lǐng)域,取得了許多突出的成果1編碼編碼的切割在實(shí)際應(yīng)用中,我們可以通過設(shè)定拍攝窗口的方式獲得身份證的整個版面信息,如圖1(a)是自然拍攝得到的一個身份證圖片。為了減少數(shù)據(jù)的處理量和提取身份證號碼區(qū)域,將拍攝得到的RGB圖片做灰度化處理。Ostu是一種常用的二值化方法,通過統(tǒng)計整個圖像的直方圖特性來實(shí)現(xiàn)全局閾值的自動選取,圖像像素能夠根據(jù)閾值被分成背景和目標(biāo)2部分。圖1(a)是自然拍攝得到的身份證照片,對其進(jìn)行ostu運(yùn)算后得到二值化圖像如圖1(b)所示。觀察身份證可知號碼行與其他信息部分之間有明顯的間隔,可以通過對圖1(b)進(jìn)行投影統(tǒng)計法來提取身份證號碼行內(nèi)容。遍歷二值化圖片,將其黑色像素點(diǎn)往水平方向投影,統(tǒng)計每一行黑色像素點(diǎn)數(shù)目如圖2(a)所示。觀察圖2(a)可知,最右側(cè)的波柱對應(yīng)著身份證號碼行,可以通過設(shè)置閾值來實(shí)現(xiàn)對號碼行的切割,最終切割效果如圖2(b)所示。同理,將提取到的身份證號碼行進(jìn)行垂直方向的投影,統(tǒng)計每一列黑色像素點(diǎn)的數(shù)目,選取合適閾值即可獲得每個數(shù)字的字符圖片。一般而言,投影得到的數(shù)字圖片高度是一致的,但是寬度并不一致。為了規(guī)范神經(jīng)網(wǎng)絡(luò)的輸入,我們需要對其進(jìn)行大小歸一化。數(shù)字圖片的寬高比例大概為3∶4,所以本文統(tǒng)一將圖片歸一化為寬15pix,高20pix(即15×20)大小。圖片大小歸一化的常用方法有雙線性插值法、最近鄰法、面積插值法等。本文使用線性插值法來歸一化圖片大小,雙線性插值法工作如下:設(shè)原圖高寬為heightX×widthY,原圖像素坐標(biāo)用(x,y)表示,要變換為高寬heightI×widthJ的目標(biāo)圖,目標(biāo)圖像素坐標(biāo)用(i,j)表示,變換公式為對于目標(biāo)圖中的(i,j)點(diǎn),通過式(1)可以找到在原圖中對應(yīng)的一個點(diǎn)(x,y),取點(diǎn)(x,y)十字方向上的4個點(diǎn)(x-1,y)、(x+1,y)、(x,y-1)和(x,y+1)的像素值來確定目標(biāo)圖中的(i,j)點(diǎn)的像素值。式中s2從簡單特征中提取更復(fù)雜的特征深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個分支,它除了可以學(xué)習(xí)特征和任務(wù)之間的關(guān)聯(lián)之外,還能自動從簡單特征中提取更復(fù)雜的特征。多層神經(jīng)網(wǎng)絡(luò)可以解決異或運(yùn)算。文獻(xiàn)2.1網(wǎng)絡(luò)生成神經(jīng)元的分類搭建神經(jīng)網(wǎng)絡(luò)一般采用分層結(jié)構(gòu),輸入層作為第一層神經(jīng)網(wǎng)絡(luò),該層的每一個輸入神經(jīng)元對應(yīng)特征向量中每一個特征的取值,同層節(jié)點(diǎn)彼此獨(dú)立沒有任何連接,按照傳遞方向每層節(jié)點(diǎn)只與后一層節(jié)點(diǎn)連接直至到輸出層。傳遞是有方向性進(jìn)行的,傳遞路徑不可逆。在輸入層和輸出層之間的神經(jīng)網(wǎng)絡(luò)叫做隱藏層。網(wǎng)絡(luò)中所有的神經(jīng)元具有完全相同的結(jié)構(gòu)。圖片識別問題的本質(zhì)是圖像分類本文通過自然拍攝687張身份證圖片(包含0~9個數(shù)字和英文字符X),并對其做如第1章的切割處理,得到的像素寬高為15pix×20pix的二值化圖片共12366張,將其中8280張圖片作為訓(xùn)練集,其余4086張圖片作為測試機(jī),訓(xùn)練集和測試集圖片相互獨(dú)立、沒有重疊。2.2化策略優(yōu)化結(jié)合BP算法和梯度下降法來優(yōu)化網(wǎng)絡(luò)中參數(shù)的取值。參數(shù)調(diào)優(yōu)是使用神經(jīng)網(wǎng)絡(luò)時最為關(guān)鍵的步驟之一,優(yōu)化策略的優(yōu)劣直接影響了網(wǎng)絡(luò)最終的識別性能。梯度下降法能將單個參數(shù)更新迭代到局部最優(yōu)值,反向傳播算法給出了一個高效的方式能在所有參數(shù)上使用梯度下降算法用θ表示神經(jīng)網(wǎng)絡(luò)中的參數(shù),J(θ)表示在參數(shù)為θ時網(wǎng)絡(luò)模型在訓(xùn)練集上損失函數(shù),則優(yōu)化過程就是尋找一個參數(shù)θ,使得J(θ)最小。2.2.1過大的超參數(shù)會導(dǎo)致極優(yōu)值被重塑學(xué)習(xí)率用來控制每次參數(shù)更新的幅度,參數(shù)更新公式為式中η表示學(xué)習(xí)率。學(xué)習(xí)率是訓(xùn)練神經(jīng)網(wǎng)絡(luò)最重要的超參數(shù),如果η過大,則有可能導(dǎo)致參數(shù)在極優(yōu)值的兩側(cè)來回震蕩移動,更有甚者會不收斂;如果η過小,雖然保證網(wǎng)絡(luò)收斂,但犧牲了優(yōu)化速度。因此η的選取不能過大也不能過小,本文使用指數(shù)衰減法來設(shè)置學(xué)習(xí)率:式中:η是每一輪優(yōu)化時所使用的學(xué)習(xí)率;η2.2.2網(wǎng)絡(luò)過擬合問題的解決神經(jīng)網(wǎng)絡(luò)的訓(xùn)練并不是為了追求在訓(xùn)練集上有很好的表現(xiàn),而是為了在測試未知樣例時能有最好的表現(xiàn)。在訓(xùn)練時網(wǎng)絡(luò)常會發(fā)生過擬合現(xiàn)象,通俗來講就是網(wǎng)絡(luò)“記住”了訓(xùn)練集中每一個隨機(jī)噪聲而忽略了根據(jù)趨勢進(jìn)行合理排除的能力常用正則化(regularization)來解決網(wǎng)絡(luò)過擬合問題。正則化的思想是每一個網(wǎng)絡(luò)參數(shù)(權(quán)重和偏置)都能對預(yù)測產(chǎn)生一點(diǎn)影響,而不是其中幾個網(wǎng)絡(luò)參數(shù)起決定作用。具體操作就是在優(yōu)化時不是直接對J(θ)進(jìn)行優(yōu)化,而是對J(θ)+λR(w)進(jìn)行優(yōu)化。λ為參數(shù)懲罰系數(shù),R(w)表示對網(wǎng)絡(luò)參數(shù)的抑制懲罰。θ為神經(jīng)網(wǎng)絡(luò)參數(shù)集合(所有權(quán)重w和偏置b)。常用的懲罰函數(shù)R(w)有2種方式:L另一種減少過擬合的方式是dropout方法,dropout是一個同正則化完全不同的技術(shù),與L通常對于同一批量訓(xùn)練樣例,用不同神經(jīng)元組合訓(xùn)練之后求輸出的平均值可以減少過擬合,dropout利用這個原理在訓(xùn)練過程中對網(wǎng)絡(luò)中的神經(jīng)元按照一定的概率將其暫時從網(wǎng)絡(luò)中丟棄,這樣就相當(dāng)于在不同的神經(jīng)網(wǎng)絡(luò)上進(jìn)行訓(xùn)練,減少了層與層之間神經(jīng)元的依賴性從而使得神經(jīng)網(wǎng)絡(luò)更加健壯。2.2.3神經(jīng)網(wǎng)絡(luò)的輸出神經(jīng)網(wǎng)絡(luò)應(yīng)用于分類時一般不直接輸出結(jié)果為哪類,而是輸出一個一維數(shù)組向量,向量的長度為類別個數(shù)。判斷每一個樣例分類網(wǎng)絡(luò)就輸出一個數(shù)組,數(shù)組中的每一個元素對應(yīng)一個類別的得分。如果某個樣本屬于A類,那么此時網(wǎng)絡(luò)的輸出數(shù)組對應(yīng)于A的元素應(yīng)該為1,數(shù)組其余元素均為0。但是這樣的輸出在意義上很難直觀理解,可以用softmax來優(yōu)化分類。神經(jīng)網(wǎng)絡(luò)輸出為y經(jīng)過式(6)運(yùn)算后,神經(jīng)網(wǎng)絡(luò)的輸出數(shù)組變成了一個概率分布。能直觀地看到一個樣例為各個類別的概率是多大。采用交叉熵(crossentropy)評判輸出向量和期望向量之間的接近程度式(7)的意義是通過概率分布q來表達(dá)概率分布p的困難程度。因?yàn)橄M玫秸_的結(jié)果,所以選取交叉熵作為神經(jīng)網(wǎng)絡(luò)的損失函數(shù)時,用p表示樣例正確的分類標(biāo)注,用q表示網(wǎng)絡(luò)輸出的預(yù)測值。交叉熵表示p、q越接近(即預(yù)測得越準(zhǔn)確)。結(jié)合式(6)、(7),可以得到神經(jīng)網(wǎng)絡(luò)的損失函數(shù)為通過式(8)可以判斷預(yù)測答案和真實(shí)答案之間的距離越小越好。3確定實(shí)驗(yàn)結(jié)果的比較為了驗(yàn)證本文算法識別性能,共設(shè)計3個實(shí)驗(yàn)進(jìn)行驗(yàn)證。3.1knn模板匹配法識別結(jié)果根據(jù)我們切割算法及歸一化處理可知。切割所得到的字符在15×20大小區(qū)域中位置相對固定,可使用模版匹配法來結(jié)合kNN算法來進(jìn)行識別。kNN算法也叫最近鄰法,算法的思想是,每個字符類各取n個有代表性的不同相態(tài)字符作為標(biāo)準(zhǔn)模版。待識別圖片要進(jìn)行識別時,將圖片與模版里的每一張圖片逐個像素點(diǎn)做灰度差值計算,求出2張圖片的像素差值絕對之和。在所有模版選取出前k張(本文選取k=5)與待識別圖片像素差值絕對值之和最小的圖片,統(tǒng)計這k張圖片屬于哪一個字符類最多的即判斷圖片為該類,若圖片所屬類別樣例數(shù)一樣,則選排序在前的類別作為判斷類別。如5張圖片分別為(1,6,2,3,6),則判斷圖片為6;若為(2,7,4,X,1),則判斷圖片為2。表1為kNN模板匹配法識別結(jié)果表。kNN模版匹配法識別的正確性很大程度上依賴于標(biāo)準(zhǔn)模版的規(guī)模。標(biāo)準(zhǔn)模版規(guī)模越大,識別正確率越高,但是因?yàn)槊恳淮巫R別時圖片都要與模版庫里面所有的圖片做比較,模版庫規(guī)模越大,識別所需時間越長。3.2神經(jīng)網(wǎng)絡(luò)的構(gòu)建待識別圖片大小為15×20=300個像素點(diǎn),因此輸入層神經(jīng)元為300個,輸出為11類,所以輸出層為11個神經(jīng)元。搭建一個3層全連接神經(jīng)網(wǎng)絡(luò)(輸入層+掩藏層+輸出層),采用2.2節(jié)的優(yōu)化策略,隱藏層數(shù)目與正確率的關(guān)系如表2所示。搭建一個4層全連接神經(jīng)網(wǎng)絡(luò),輸入層和2個隱藏層神經(jīng)元數(shù)目相同,每層都為300個,輸出層神經(jīng)元為11個,測試的正確率為99.40%。搭建一個5層的全連接神經(jīng)網(wǎng)絡(luò)(每層隱藏層神經(jīng)元數(shù)目與輸入層一致),測試集上測試正確率為99.38%,由此可判斷多層全連接神經(jīng)網(wǎng)絡(luò)與3層全連接神經(jīng)網(wǎng)絡(luò)識別性能相當(dāng)。3.3卷積層篩選和正確率分析卷積神經(jīng)網(wǎng)絡(luò)是一種深度前饋人工神經(jīng)網(wǎng)絡(luò)輸入層→(卷積層+→池化層?)+→全連接層+“卷積層+”表示一層或多層卷積層;“池化層?”表示有或者沒有池化層。在經(jīng)過多輪卷積層和池化層之后,卷積神經(jīng)網(wǎng)絡(luò)在輸出前一般會經(jīng)過1~2個全連接層。實(shí)驗(yàn)所用為7層卷積網(wǎng)絡(luò)(圖6所示,不含輸入層),使用了2個卷積層+池化層組合。第1層卷積層接收的輸入層大小為15×20×1的原始文字灰度圖片像素,第1個卷積層過濾器的尺寸為5×5,深度為32,使用全0填充,步長為1。第2層池化層,采用最大池化降采樣,選擇尺寸為2×2的過濾器,使用全0填充且移動步長為2。第3層卷積層,選取邊長為5,深度為64的過濾器,移動的步長為1,使用全0填充。第4層池化層結(jié)構(gòu)和第2層池化層結(jié)構(gòu)一致。使用2.1節(jié)優(yōu)化策略訓(xùn)練如圖7。經(jīng)過1200輪迭代訓(xùn)練,CNN網(wǎng)絡(luò)在測試集上的識別正確率能達(dá)到99.96%。實(shí)驗(yàn)看到BP全連接神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的識別正確率相近,為了進(jìn)一步比較2種網(wǎng)絡(luò)的識別性能,對他們分別初始化訓(xùn)練5次,比較2個網(wǎng)絡(luò)在5次訓(xùn)練中測試集上的識別正確率如表3。不使用優(yōu)化策略,CNN連續(xù)進(jìn)行5次的識別平均正確率為98.926%;采用優(yōu)化算法后的網(wǎng)絡(luò)識別性能提升了0.7%,健壯性更強(qiáng)。由圖6可以看出隨著訓(xùn)練次數(shù)的增加,網(wǎng)絡(luò)的模型識別率也在穩(wěn)步提高,沒發(fā)生強(qiáng)過擬合現(xiàn)象。在識別用時上,識別4086張圖片各模型用時如表4所示。圖8是識別時錯誤識別的樣本,左圖實(shí)際為5,但網(wǎng)絡(luò)識別為3;右圖實(shí)際為6,被識別為0。觀察圖片可以發(fā)現(xiàn),誤判很大的原因在于拍攝時曝光不適導(dǎo)致提取字符時噪聲過多,致使網(wǎng)絡(luò)識
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年合作伙伴入住合同范本
- 2025年勞動合同和社保協(xié)議中工傷保險的細(xì)節(jié)
- 2025年辦公文具用品供貨合同范文
- 2025年基礎(chǔ)設(shè)施建設(shè)監(jiān)理框架協(xié)議
- 2025年養(yǎng)殖戶種牛交易申請協(xié)議范本
- 2025年采購合同簽訂與風(fēng)險控制
- 2025年企業(yè)結(jié)構(gòu)重組協(xié)議書模板
- 2025年住宿生校園安全責(zé)任協(xié)議
- 2025年企業(yè)兼職外貿(mào)業(yè)務(wù)員招聘協(xié)議
- 2025年專利申請輔導(dǎo)合作協(xié)議
- 2024黑龍江公務(wù)員考試【A類、B類、省直、筆試】四套真題及答案
- 2025年中國高價HPV疫苗行業(yè)競爭格局分析及投資規(guī)劃研究報告
- 醫(yī)院感染與醫(yī)療器械消毒
- 2025年春新北師大版物理八年級下冊課件 第七章 運(yùn)動和力 第四節(jié) 同一直線上二力的合成
- 智能客服系統(tǒng)中人工智能技術(shù)的應(yīng)用
- 2025年公司年會活動總結(jié)樣本(3篇)
- 村衛(wèi)生室2025年初工作計劃
- 派出所校園安全創(chuàng)新
- 飛書項(xiàng)目管理
- 醫(yī)院醫(yī)共體2025年度工作計劃
- UL498標(biāo)準(zhǔn)中文版-2019插頭插座UL標(biāo)準(zhǔn)中文版
評論
0/150
提交評論