下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
用空間特征和結(jié)構(gòu)特征提取身份證號
1身份證自動識別錄入作為居民身份的象征,身份是生活中不可或缺的證書。出于保障公民合法權(quán)益和社會治安的考慮,越來越多的行業(yè)都開始要求進行實名制和身份證登記管理,如公安、海關(guān)、銀行、通信、網(wǎng)吧及酒店旅館、洗浴業(yè)等,因此利用計算機進行自動識別錄入尤為必要。身份證自動識別代替手工錄入可以大大提高工作效率,因而具有廣闊的應(yīng)用前景。本文以第二代居民身份證為研究對象,從身份證號碼圖像中提取號碼數(shù)字0~9的空間分布特征和結(jié)構(gòu)特征,采用相似系數(shù)最大和結(jié)構(gòu)特征一致準則,應(yīng)用Matlab軟件編程實現(xiàn)了身份證號碼的快速識別。2數(shù)據(jù)特征預(yù)處理身份證號碼識別技術(shù)的基本原理如圖1所示。第二代居民身份證的大小是固定的,寬度為8.6cm,高度為5.4cm,因此掃描身份證得到的圖像可以縮放到同一個大小,本文采用的圖像寬度為366個像素,高度為233像素,這樣在從身份證圖像中提取號碼數(shù)字圖像時可以快速定位。由于第二代居民身份證的號碼字體比較特殊,所以需要從身份證圖像中獲取號碼數(shù)字0~9的圖像作為樣本,用于提取特征。樣本數(shù)字圖像如圖2所示。該樣本數(shù)字圖像為真彩色圖像,需要對其進行預(yù)處理。首先將真彩色數(shù)字圖像轉(zhuǎn)化為二值圖像:設(shè)P為真彩色數(shù)字圖像的任意點,P的顏色三分量值分別為r、g、b,若0.299*r+0.587*g+0.114*b<0.5,則二值圖像對應(yīng)的點為白色,否則為黑色。然后對二值圖像進行數(shù)字分割,將圖像中的10個數(shù)字完整、單獨地分割出來。最后對分割后的每個數(shù)字圖像進行規(guī)范化處理:若單個數(shù)字圖像的整行或整列全為0,則刪除該行或該列。預(yù)處理后的各樣本數(shù)字圖像如圖3所示。注:為達到較好的視覺效果,在每個樣本數(shù)字圖像周圍増加了一個黑色矩形方框。完成預(yù)處理后,接下來就是提取每個數(shù)字的特征。本文考慮每個數(shù)字的空間分布情況和形狀結(jié)構(gòu)特點,作為分類識別的特征。2.1空間分布情況首先將預(yù)處理后的樣本數(shù)字圖像看成是有質(zhì)量的圖形,其中白色點的質(zhì)量為1,黑色點的質(zhì)量為0。該圖形的質(zhì)心坐標總體上能反映對應(yīng)數(shù)字的空間分布情況,用x再將樣本數(shù)字圖像等分成上、下兩個部分,用x最后將樣本數(shù)字圖像等分成左、右兩個部分,用x各區(qū)域的質(zhì)心橫坐標為該區(qū)域內(nèi)的白色點的橫坐標之和除以該區(qū)域內(nèi)的白色點的個數(shù);各區(qū)域的質(zhì)心縱坐標為該區(qū)域內(nèi)的白色點的縱坐標之和除以該區(qū)域內(nèi)的白色點的個數(shù)。這10個質(zhì)心坐標組成的向量:就是該樣本數(shù)字圖像對應(yīng)的數(shù)字的空間分布特征。逐個計算各數(shù)字的空間分布特征向量,并將它們存放于數(shù)組中。2.2數(shù)的阿姆斯特丹數(shù)采用數(shù)字的空間分布特征可以將數(shù)字“1”、“2”、“4”、“5”、“7”正確識別出來,但數(shù)字“0”、“3”、“6”、“8”、“9”有時卻不能正確識別。針對這幾個會出現(xiàn)誤判情形的數(shù)字進行分析,不難發(fā)現(xiàn)它們的形狀結(jié)構(gòu)特征明顯,數(shù)字“0”和“6”及“9”含有一個洞;數(shù)字“3”不包含洞;數(shù)字“8”包含兩個洞。由于身份證號碼字體的特殊性,數(shù)字“1”、“2”、“4”、“5”、“7”均不含有洞。Matlab中的bweuler函數(shù)返回二值圖像的歐拉數(shù)。歐拉數(shù)是對圖像的拓撲度量,它是指圖像中對象的總個數(shù)與這些對象中洞的個數(shù)的差,可以使用4連通或8連通鄰域。各數(shù)字的歐拉數(shù)參見表1。本文采用8連通鄰域,將各樣本數(shù)字圖像的歐拉數(shù)作為它的結(jié)構(gòu)特征,并存放于數(shù)組中E(10)。2.3號碼數(shù)字特征樣本數(shù)字圖像的空間分布特征和結(jié)構(gòu)特征分別存于數(shù)組digital(10,10)和E(10)中。對于待識別身份證號碼(共18個)的目標,按照前面類似的處理過程,提取各號碼數(shù)字的空間分布特征和結(jié)構(gòu)特征,并存放于數(shù)組obj(18,10)和objE(18)中。令x=(x對于待識別的目標數(shù)字號碼,計算該數(shù)字號碼的空間分布特征與10個樣本數(shù)字的空間分布特征的相似系數(shù),其分類識別準則是:在結(jié)構(gòu)特征一致的條件下,相似系數(shù)最大的對應(yīng)的樣本數(shù)字就是該目標號碼的識別結(jié)果。3身份證號碼的實現(xiàn)采用Matlab6.5(releaseR13)作為開發(fā)工具,在WindowsXP平臺下實現(xiàn)了身份證號碼的快速識別。圖4是程序使用的身份證圖像,程序輸出結(jié)果為對多個身份證圖像進行測試,均得到正確的結(jié)果。身份證號碼識別的程序代碼如下:四、多個身份證圖像的分類識別本文對第二代居民身份證的號碼數(shù)字進行分析,提出了基于空
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人旅游規(guī)劃服務(wù)合同范本3篇
- 用洗衣機洗衣
- 2025年個人技術(shù)投資入股合同范本4篇
- 二零二五年度門窗安裝工程合同糾紛處理協(xié)議4篇
- 二零二五年度美縫施工企業(yè)信用評價與合同4篇
- 2025個人合伙清算協(xié)議書(清算審計報告)4篇
- 2024年幼兒園安全管理制度2
- 語音辨識課程設(shè)計
- 2024年心理咨詢師題庫及參考答案【培優(yōu)】
- 2024年心理咨詢師題庫含答案【典型題】
- 眼內(nèi)炎患者護理查房課件
- 肯德基經(jīng)營策略分析報告總結(jié)
- 買賣合同簽訂和履行風(fēng)險控制
- 中央空調(diào)現(xiàn)場施工技術(shù)總結(jié)(附圖)
- 水質(zhì)-濁度的測定原始記錄
- 數(shù)字美的智慧工業(yè)白皮書-2023.09
- -安規(guī)知識培訓(xùn)
- 2021-2022學(xué)年四川省成都市武侯區(qū)部編版四年級上冊期末考試語文試卷(解析版)
- 污水處理廠設(shè)備安裝施工方案
- 噪聲監(jiān)測記錄表
- 中國傳統(tǒng)文化服飾文化
評論
0/150
提交評論