數(shù)字圖像處理第十三章_第1頁
數(shù)字圖像處理第十三章_第2頁
數(shù)字圖像處理第十三章_第3頁
數(shù)字圖像處理第十三章_第4頁
數(shù)字圖像處理第十三章_第5頁
已閱讀5頁,還剩108頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1第十三章圖像模式識(shí)別第十三章圖像模式識(shí)別模式:客觀世界和主觀世界即物質(zhì)和意識(shí)的所有方面、所有個(gè)體、所有單元、所有事物的抽象。模式還可分成概念的和具體的兩種形式:前者如意識(shí)、思想、議論等,屬于概念識(shí)別研究的范疇,是人工智能的另一研究分支。我們所指的模式識(shí)別主要是對(duì)語音波形、地震波、心電圖、腦電圖、圖片、照片、文字、符號(hào)、生物的傳感器等對(duì)象進(jìn)行測量的具體模式進(jìn)行分類和辨識(shí)。模式識(shí)別(PatternRecognition)是指對(duì)表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程。模式識(shí)別是信息科學(xué)和人工智能的重要組成部分。第十三章圖像模式識(shí)別模式識(shí)別研究主要集中在兩方面:一是研究生物體(包括人)是如何感知對(duì)象的,屬于認(rèn)識(shí)科學(xué)的范疇,二是在給定的任務(wù)下,如何用計(jì)算機(jī)實(shí)現(xiàn)模式識(shí)別的理論和方法。前者是生理學(xué)家、心理學(xué)家、生物學(xué)家和神經(jīng)生理學(xué)家的研究內(nèi)容。后者通過數(shù)學(xué)家、信息學(xué)專家和計(jì)算機(jī)科學(xué)工作者近幾十年來的努力,已經(jīng)取得了系統(tǒng)的研究成果。第十三章圖像模式識(shí)別圖像模式識(shí)別是圖像處理的另一類問題:就是不要求其結(jié)果并不是一幅完整圖像的本身,而是將經(jīng)過前述圖像處理后的圖像,再經(jīng)過分割和描述提取有效的特征,進(jìn)而加以判決分類。例如:從遙感圖像中分割出各種農(nóng)作物、森林資溉、礦產(chǎn)資源等等,并進(jìn)一步判斷其產(chǎn)量或蘊(yùn)藏量;由氣象云圖結(jié)合其它觀察數(shù)據(jù)進(jìn)行自動(dòng)天氣預(yù)報(bào);用人工地震波形圖尋找有油的巖層結(jié)構(gòu);根據(jù)醫(yī)學(xué)X光圖像判斷分析各種病變;郵政系統(tǒng)中的信函自動(dòng)分揀等。因此,可以認(rèn)為把圖像(或圖像中的對(duì)象)進(jìn)行區(qū)別分類就是圖像的模式識(shí)別。模式識(shí)別方法和應(yīng)用很廣泛,也相當(dāng)復(fù)雜,正在發(fā)展之中。第十三章圖像模式識(shí)別模式識(shí)別的研究對(duì)象基本上可概括為二大類:一類是有直覺形象的如圖像、相片、圖案、文字等;一類是沒有直覺形象而只有數(shù)據(jù)或信息波形如語音、心電脈沖、地震波等。但是,對(duì)模式識(shí)別來說,無論是數(shù)據(jù)、信號(hào)還是平面圖形或立體景物都是除掉他們的物理內(nèi)容而找出它們的共性,把具有同一共性的歸為一類,把具有另一種共性的歸為另一類。模式識(shí)別研究的任務(wù)是研究出能夠自動(dòng)處理某些信息的機(jī)器系統(tǒng),以便代替人完成分類和辨識(shí)的任務(wù)。13.1圖像模式識(shí)別的基本概念模式識(shí)別的定義:根據(jù)對(duì)某個(gè)物理對(duì)象的觀測信息,利用計(jì)算機(jī)對(duì)該物理對(duì)象進(jìn)行分類,從而給出該物理對(duì)象所屬的類別。觀測信息可以是圖像、聲音、溫度、壓力等任何可以測量的觀測量。為了讓機(jī)器自動(dòng)完成模式識(shí)別任務(wù),我們需要:(1)數(shù)據(jù)采集設(shè)備;(2)模式識(shí)別算法。

13.1圖像模式識(shí)別的基本概念圖像模式識(shí)別過程可分為三個(gè)階段:第一階段是圖像信息的獲??;第二階段是信息的加工與處理。它的作用在于把調(diào)查了解到的數(shù)據(jù)材料進(jìn)行加工、整理、分析、歸納以去偽存真,去粗取精,抽出事物本質(zhì)的特征。當(dāng)然,抽取什么特征,保留多少特征與采用何種判決有很大關(guān)系。第三階段是判決或分類。這相當(dāng)于人們從感性認(rèn)識(shí)升到理性認(rèn)識(shí)而做出結(jié)論的過程。第三階段與特征抽取的方式密切相關(guān)。它的復(fù)雜程度也依賴于特征的抽取方式。例如:類似度、相關(guān)性、最小距離等等。13.1圖像模式識(shí)別的基本概念圖像模式識(shí)別的應(yīng)用領(lǐng)域:地球資源、環(huán)境的調(diào)查研究(遙感圖像識(shí)別、分類);生物醫(yī)學(xué)工程(腦電圖、B超、CT、MRI(核磁共振)、PET;染色體、癌細(xì)胞);生產(chǎn)自動(dòng)化(產(chǎn)品缺損檢查、智能機(jī)器人、機(jī)器人視覺);文件處理和管理自動(dòng)化(資料、數(shù)據(jù)自動(dòng)識(shí)別、登記、分類、OCR、條碼);軍事(目標(biāo)識(shí)別、自動(dòng)瞄準(zhǔn)、自動(dòng)搜索);公安偵破、身份識(shí)別(指紋、人面、虹膜);商業(yè)自動(dòng)化(自動(dòng)售貨機(jī)、自動(dòng)檢票機(jī))。13.2圖像模式識(shí)別的基本方法模式識(shí)別已初步形成三大類:統(tǒng)計(jì)模式識(shí)別;句法模式識(shí)別;模糊集識(shí)別。

13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別統(tǒng)計(jì)模式識(shí)別是模式識(shí)別中應(yīng)用最廣的方法,而且對(duì)它的掌握是徹底理解各種模式識(shí)別過程的基礎(chǔ)。統(tǒng)計(jì)模式識(shí)別認(rèn)為圖像可能包含一個(gè)或多個(gè)物體,并且每個(gè)物體屬于若干事先定義的類型、范疇或模式之一。由于不確定性是客觀存在的,因而發(fā)生錯(cuò)誤的決策分類在所難免,只能借助概率論的知識(shí),使得決策的錯(cuò)誤率達(dá)到最小。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別統(tǒng)計(jì)模式識(shí)別的過程如下圖所示。這是計(jì)算機(jī)識(shí)別的基本過程,數(shù)字化是把圖像信號(hào)變成計(jì)算機(jī)能夠接受的數(shù)字信號(hào)。預(yù)處理的目的是去除干擾、噪聲及差異,將原始信號(hào)變成適合于計(jì)算機(jī)進(jìn)行特征抽取的形式。然后對(duì)經(jīng)過預(yù)處理的信號(hào)進(jìn)行特征抽取。最后進(jìn)行判決分類,得到識(shí)別的結(jié)果。為了進(jìn)行分類,必須有圖像樣本。對(duì)樣本圖像進(jìn)行特征選擇及學(xué)習(xí)是識(shí)別處理中所必要的分析工作。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別一、決策理論方法如前框圖所示,統(tǒng)計(jì)模式識(shí)別方法最終歸結(jié)為分類問題。假如已抽取出N個(gè)特征,而圖像可分為m類。那么就可以根據(jù)N個(gè)特征進(jìn)行分類,從而決定未知圖像屬于m類中的哪一類。一般把識(shí)別模式看成是N維空間中的向量X,即而模式類別為ω1、

ω2、…、

ωm。識(shí)別就是要判斷X是否屬于ωi以及xi屬于ωm中的哪一類。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別一、決策理論方法在這個(gè)過程中主要解決兩個(gè)問題:如何選擇和抽取特征,要求特征數(shù)N盡可能小而且對(duì)分類判斷有效;假設(shè)已有了代表模式的向量,如何決定它屬于哪一類,即需要判別函數(shù)。例如,模式ω1、

ω2、…、

ωm共有m類,則應(yīng)有D1(X)、D2(X)、D3(X)、…Dm(X)共m個(gè)判別函數(shù)。如果X屬于第i類,則有問題的關(guān)鍵是找到合適的判別函數(shù)。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別一、決策理論方法1.線性判別函數(shù)線性判別函數(shù)是應(yīng)用較廣的一種判別函數(shù),所謂線性判別函數(shù)是指判別函數(shù)是圖像所有特征量的線性組合,即

式中Di(X)代表第i個(gè)判別函數(shù),ωik是系數(shù)或權(quán),ωi0為常數(shù)或稱為閾值。其判決過程可如下進(jìn)行:如果Di(X)>Dj(X)或Di(X)-Dj(X)>0,則X~ωi,如果Di(X)<Dj(X)或Di(X)-Dj(X)<0,則X~ωj。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別一、決策理論方法1.線性判別函數(shù)用線性判別函數(shù)進(jìn)行分類是線性分類器。任何m類問題都可以分解為(m-1)個(gè)2類識(shí)別問題。方法是先把模式空間分為1類和其他類,如此進(jìn)行下去即可。因此,2類線性分類器是最簡單和最基本的。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別一、決策理論方法1.線性判別函數(shù)分離2類的判決邊界由D1-D2=0表示。對(duì)于任何特定的輸入模式必須判定D1大還是D2大。若考慮函數(shù)D=D1-D2,對(duì)于1類模式D為正,對(duì)于2類模式D為負(fù)。于是,只要判斷處理D的輸出符號(hào)即可進(jìn)行分類。執(zhí)行這種運(yùn)算的分類器的原理框圖如右圖所示。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別一、決策理論方法1.線性判別函數(shù)在線性分類器中要找到合適的系數(shù),以便使分類盡可能不出差錯(cuò),唯一的辦法就是試驗(yàn)法。例如,先設(shè)所有的系數(shù)為1,送進(jìn)每一個(gè)模式,如果分類有錯(cuò)就調(diào)整系數(shù),這個(gè)過程就叫做線性分類器的訓(xùn)練或?qū)W習(xí)。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別一、決策理論方法2.最小距離分類器線性分類器中重要的一類是用輸入模式與特征空間作為模板的點(diǎn)之間的距離作為分類的準(zhǔn)則。假定有m類,給出m個(gè)參考向量R1、R2、R3、…、Rm,Ri與模式類ωi相聯(lián)系。對(duì)于Ri的最小距離分類就是把輸入的新模式X分為ωi類,其分類準(zhǔn)則就是x與參考模型原型R1、R2、R3、…、Rm之間的距離,跟哪一個(gè)最近就屬于哪一類。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別一、決策理論方法2.最小距離分類器X和R之間的距離可表示為其中(X-Ri)T,是(X-Ri)的轉(zhuǎn)置。由上式可得由此可設(shè)定最小距離判別函數(shù)Di(X)為最小距離分類器也是一個(gè)線性分類器。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別一、決策理論方法此外還有:3.最近鄰域分類法;4.非線性判別函數(shù)。等判別函數(shù)和判別方法。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別二、統(tǒng)計(jì)分類法以上談到的分類方法是在沒有噪聲干擾的情況下進(jìn)行的,此時(shí)測得的特征確能代表模式。如果在抽取特征時(shí)有噪聲,那么可能抽取的特征代表不了模式,這時(shí)就要用統(tǒng)計(jì)分類法。用統(tǒng)計(jì)方法對(duì)圖像進(jìn)行特征抽取、學(xué)習(xí)和分類是研究圖像識(shí)別的主要方法之一,而統(tǒng)計(jì)方法的最基本內(nèi)容之一是貝葉斯分析,其中包括:貝葉斯決策方法、分類器、估計(jì)理論、貝葉斯學(xué)習(xí)、貝葉斯距離等等。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別二、統(tǒng)計(jì)分類法1.貝葉斯公式在古典概率中貝葉斯定理已為大家所熟悉:式中B1、B2、…、Bn是n個(gè)互不相容的事件,P(Bi)是事件Bi的先驗(yàn)概率,P(A/Bi)是A在Bi已發(fā)生條件下的條件概率。貝葉斯定理說明在給定了隨機(jī)事件B1、B2、…、Bn的各先驗(yàn)概率P(Bi)及條件概率P(A/Bi)時(shí),可算出事件A出現(xiàn)時(shí),去掉事件Bi出現(xiàn)的后驗(yàn)概率P(Bi/A)。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別二、統(tǒng)計(jì)分類法1.貝葉斯公式假定事件A代表肝炎病發(fā)生,而B1、B2、…、Bn分別代表引起肝炎病發(fā)生的事件,如B1代表抽血時(shí)的交叉感染,B2代表吃某種不衛(wèi)生食品所引起的感染,而P(A/Bi)表示在Bi發(fā)生時(shí),肝炎病發(fā)生的概率,則肝炎病發(fā)生時(shí)由某種原因Bi導(dǎo)致的后驗(yàn)概率就可以用貝葉斯定理來計(jì)算。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別二、統(tǒng)計(jì)分類法1.貝葉斯公式貝葉斯公式常用于分類問題和參數(shù)估值問題中。假如設(shè)X表示事件的狀態(tài)或特征的隨機(jī)變量,它可以表示圖像的灰度或形狀等,設(shè)ωi表示事件類別的離散隨機(jī)變量。對(duì)事物(比如是圖像的亮度或形狀)進(jìn)行分類就可以用如下的公式13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別二、統(tǒng)計(jì)分類法1.貝葉斯公式式中P(ωi)稱為ωi的先驗(yàn)概率,它表示事件屬于ωi的預(yù)先粗略了解P(X/ωi)表示事件屬于ωi類而具有X狀態(tài)的條件概率,P(ωi/X)是X條件下ωi的后驗(yàn)概率,它表示對(duì)事件X的狀態(tài)作觀察后判斷屬于ωi類的可能性。由上式可見,只要類別的先驗(yàn)概率及X的條件概率為已知,就可以得到類別的后驗(yàn)概率。再加上最小誤差概率或最小風(fēng)險(xiǎn)法則,就可以進(jìn)行統(tǒng)計(jì)判決分類。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別二、統(tǒng)計(jì)分類法1.貝葉斯公式在參數(shù)估計(jì)問題中,貝葉斯公式中二個(gè)變量常常為連續(xù)隨機(jī)變量,如果寫作變量X及參數(shù)Q,則有如下的公式通過上式,由參數(shù)的先驗(yàn)分布P(Q)及預(yù)先設(shè)定的條件分布P(X/Q),即可求得參數(shù)的后驗(yàn)分布P(Q/X)。貝葉斯公式是參數(shù)估計(jì)的有力工具。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別二、統(tǒng)計(jì)分類法2.貝葉斯決策根據(jù)類別的先驗(yàn)概率(歷史資料、經(jīng)驗(yàn)或主觀判斷)及事件X的條件概率,利用貝葉斯定理求得后驗(yàn)概率,據(jù)以進(jìn)行決策的方法,稱為貝葉斯決策方法。13.2圖像模式識(shí)別的基本方法13.2.1統(tǒng)計(jì)模式識(shí)別二、統(tǒng)計(jì)分類法2.貝葉斯決策貝葉斯決策過程中,可能會(huì)產(chǎn)生錯(cuò)誤(如下圖)。引入代價(jià)函數(shù),貝葉斯決策方法還可進(jìn)一步分為兩類:最小錯(cuò)誤率決策;最小風(fēng)險(xiǎn)決策。13.2圖像模式識(shí)別的基本方法13.2.2句法(結(jié)構(gòu))模式識(shí)別方法句法:描述語言規(guī)則的一種法則。一個(gè)完整的句子一定是由主語+謂語或主語+謂語+賓語(或表語)構(gòu)成,如下圖。識(shí)別時(shí),首先是將一個(gè)復(fù)雜圖像分解成一個(gè)個(gè)子圖像,再進(jìn)一步將子圖像分解成一些最簡單的基元,最后按對(duì)象的結(jié)構(gòu)規(guī)則去組成這些基元,形成一個(gè)句子---模式。以這個(gè)模式為準(zhǔn)則去匹配要識(shí)別的對(duì)象,作決策輸出。13.2圖像模式識(shí)別的基本方法13.2.2句法(結(jié)構(gòu))模式識(shí)別方法句法的形式語言描述:G=(VN,VT,P,S)VN:非終止符的有限集VT:終止符的有限集P:寫作規(guī)則〈名詞短語〉〈冠詞〉〈名詞〉S:起始符句法模式識(shí)別的應(yīng)用:次中性染色體的句法結(jié)構(gòu);13.2圖像模式識(shí)別的基本方法13.2.2句法(結(jié)構(gòu))模式識(shí)別方法次中性染色體的句法結(jié)構(gòu)右圖上行是染色體文法的基元。順時(shí)針跟蹤染色體的邊界,就可以得到由基元連接而成的串。下行的次中性染色體可以描述為babcbabdacad。染色體文法:

G=(VN,VT,P,S),其中:VN={S,S1,S2,A,B,C,D,E,F}VT={a,b,c,d,e}P:S→S1,B→e,S→S2,C→bC,S1→AAC→Cb,S2→BA,C→b,A→CA,C→dA→AC,D→bD,A→DE,D→Db,A→FDD→a,B→bB,E→CD,B→Bb,F→Dc13.2圖像模式識(shí)別的基本方法13.2.3模糊集合識(shí)別方法隸屬函數(shù)和判別準(zhǔn)則13.2圖像模式識(shí)別的基本方法各種模式識(shí)別方法的特點(diǎn)統(tǒng)計(jì)模式識(shí)別方法:發(fā)展早,應(yīng)用廣泛;對(duì)已知條件要求太多;句法(結(jié)構(gòu))模式識(shí)別方法:用分析的方法識(shí)別,還可以描述圖象的內(nèi)容;模糊集合識(shí)別方法:以模糊集合論為基礎(chǔ),識(shí)別結(jié)果并非絕對(duì)的二值,而是有隸屬度的概念。13.2圖像模式識(shí)別的基本方法例子:以魚的分類為例,圖像獲取如右圖,經(jīng)預(yù)處理()后作圖像分割處理,將每條魚分割成獨(dú)立的區(qū)域。每條魚只能屬于:鱸魚(salmon)或者鮭魚(seabass)定義ω描述魚的類別狀態(tài)ω=ω1

表示鱸魚ω=ω2

表示鮭魚13.2圖像模式識(shí)別的基本方法例子:以魚的分類為例(續(xù))每條魚只能屬于:鱸魚(salmon)或者鮭魚(seabass)定義ω描述魚的類別狀態(tài)ω=ω1

表示鱸魚ω=ω2

表示鮭魚定義先驗(yàn)概率P(ω)P(ω1):表示下一條魚是鱸魚的先驗(yàn)概率;P(ω2):表示下一條魚是鮭魚的先驗(yàn)概率。只有鱸魚和鮭魚的情況下:P(ω1)+P(ω2)=1簡單的判斷規(guī)則:P(ω1)>P(ω2),則判為ω1,否則判為ω2如果只有一條魚,規(guī)則尚是可行的;如果是很多條魚,則全部歸于一類。顯然,還需引入其他規(guī)則。

13.2圖像模式識(shí)別的基本方法例子:以魚的分類為例:(續(xù))特征:魚的光澤度指標(biāo)X:不同的魚擁有不同的光澤度(根據(jù)樣本而來)。

13.2圖像模式識(shí)別的基本方法例子:以魚的分類為例:(續(xù))定義類條件概率密度p(x/ω)

p(x/ω):即類別狀態(tài)為ω時(shí)的x的概率密度函數(shù)p(x/ω1)與p(x/ω2)間的區(qū)別表示了鱸魚和鮭魚間光澤間的區(qū)別。13.2圖像模式識(shí)別的基本方法例子:以魚的分類為例:(續(xù))假設(shè)我們知道:先驗(yàn)概率P(ω1)=1/3,和P(ω2)=2/3;條件概率密度p(x/ω1)和p(x/ω2)(如前圖);某條魚的光澤度指標(biāo)x;則可根據(jù)13.2圖像模式識(shí)別的基本方法例子:以魚的分類為例:(續(xù))求得上述條件下的后驗(yàn)概率如下圖:13.2圖像模式識(shí)別的基本方法思考題:1.上例中,如果改用長度特征:salmon一般較短,seabass一般較長。識(shí)別過程將是怎樣?2.上例中,如果再加入長度特征,識(shí)別過程將是怎樣?13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別

13.3.1概述光學(xué)字符識(shí)別OCR(OpticalCharacterRecognition)是模式識(shí)別理論的一個(gè)重要應(yīng)用領(lǐng)域,OCR將文字的數(shù)字圖像轉(zhuǎn)換為計(jì)算機(jī)可處理字符代碼(內(nèi)碼),用于將文字信息自動(dòng)輸入計(jì)算機(jī),是實(shí)現(xiàn)智能人機(jī)接口的重要途徑。按識(shí)別對(duì)象的形式,OCR可以分為:印刷體識(shí)別;手寫體識(shí)別。而手寫體識(shí)別又可以分為:聯(lián)機(jī)(OnLine);脫機(jī)(OffLine)。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別

13.3.1概述按識(shí)別對(duì)象的種類,OCR可以分為:數(shù)字及西文字符識(shí)別;漢字識(shí)別。從識(shí)別技術(shù)的難度來說,手寫體識(shí)別的難度高于印刷體識(shí)別,而在手寫體識(shí)別中,脫機(jī)手寫體的難度又遠(yuǎn)遠(yuǎn)超過了聯(lián)機(jī)手寫體識(shí)別。漢字識(shí)別問題屬于超多類模式集合的分類問題,更為復(fù)雜。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別

13.3.1概述OCR的發(fā)展1929年,德國的科學(xué)家Tausheck首先提出了OCR的概念,并且申請(qǐng)了專利。幾年后,美國科學(xué)家Handel也提出了利用技術(shù)對(duì)文字進(jìn)行識(shí)別的想法。但這種夢想直到計(jì)算機(jī)的誕生才變成了現(xiàn)實(shí)。在60~70年代,世界各國相繼開始了OCR的研究,而研究的初期,多以文字的識(shí)別方法研究為主,且識(shí)別的文字僅為0至9的數(shù)字。以同樣擁有方塊文字的日本為例,1960年左右開始研究OCR的基本識(shí)別理論,初期以數(shù)字為對(duì)象,直至1965至1970年之間開始有一些簡單的產(chǎn)品,如印刷文字的郵政編碼識(shí)別系統(tǒng),識(shí)別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè);也因此至今郵政編碼一直是各國所倡導(dǎo)的地址書寫方式。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別

13.3.1概述OCR識(shí)別系統(tǒng)的工作流程圖像輸入:經(jīng)光學(xué)儀器,如影像掃描儀、傳真機(jī)、攝影器材以及手寫輸入設(shè)備將影像轉(zhuǎn)入計(jì)算機(jī)。預(yù)處理:包含圖像拼接、消噪、修復(fù)粘連及斷裂、傾斜矯正、去網(wǎng)紋、增強(qiáng)、二值化、版面分析和理解、行切分和字切分等處理。特征抽取:特征抽取是OCR的核心,分為兩類:統(tǒng)計(jì)特征或結(jié)構(gòu)特征。對(duì)比識(shí)別:根據(jù)不同的特征特性,對(duì)比數(shù)據(jù)庫,識(shí)別出結(jié)果。后處理:可能有相似候選字,人工校正,機(jī)器學(xué)習(xí)。得出結(jié)果。

13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別

13.3.1概述OCR系統(tǒng)的用途辦公自動(dòng)化中漢字英文資料的自動(dòng)輸入;手寫輸入(PDA、手機(jī));建立漢字和英文的文獻(xiàn)檔案庫;書刊資料的自動(dòng)輸入;智能全文信息管理系統(tǒng)和辦公管理系統(tǒng);智能漢英翻譯系統(tǒng);多媒體應(yīng)用系統(tǒng)。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別

13.3.1概述OCR系統(tǒng)的發(fā)展方向減少錯(cuò)誤率:出版要求萬分之一;提高識(shí)別的正確率;通過改進(jìn)人工校對(duì)的效率。智能化、自動(dòng)化;自動(dòng)分析、自動(dòng)識(shí)別、版面自動(dòng)恢復(fù)。適應(yīng)各種質(zhì)量差的文本;識(shí)別更多種字體;識(shí)別更大字符集;彩色圖像處理;視頻圖像處理。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別

13.3.2手寫字符識(shí)別手寫字符因人而異,一人一個(gè)寫法,而且同一個(gè)人在不同的時(shí)間書寫的字符也不盡相同,具體表現(xiàn)在以下幾個(gè)方面:基本筆畫變化。橫不平,豎不直,直筆變彎,折筆的拐角變成圓弧符等。筆畫模糊,不規(guī)范,該連的不連,不該連的卻相連。筆畫與筆畫之間、部件與部件之間的位置發(fā)生變化。筆畫的傾斜角、筆畫的長短、部件的大小發(fā)生變化。對(duì)于脫機(jī)手寫字符,不同人使用不同的書寫筆可能造成筆畫的粗細(xì)變化。

13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別

13.3.2手寫字符識(shí)別手寫字符識(shí)別又可分為聯(lián)機(jī)識(shí)別與脫機(jī)識(shí)別兩類。一般認(rèn)為,聯(lián)機(jī)手寫字符識(shí)別較脫機(jī)手寫字符識(shí)別相對(duì)容易些。聯(lián)機(jī)手寫字符識(shí)別是一種人工實(shí)時(shí)地把字符輸入計(jì)算機(jī)的方法,它利用書寫板把筆畫變?yōu)橐痪S電信號(hào),輸入計(jì)算機(jī)的是以坐標(biāo)點(diǎn)序列表示的筆尖移動(dòng)軌跡,因而被處理的是一維的線條(筆畫)串,這些線條串含有筆畫數(shù)目、筆畫走向、筆順和書寫速度等信息。而脫機(jī)手寫字符識(shí)別處理的僅是二維的字符點(diǎn)陣圖像,是字符識(shí)別領(lǐng)域中一個(gè)十分困難的問題。手寫字符識(shí)別中,對(duì)非特定人脫機(jī)手寫字符識(shí)別則難度更大。

13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.2手寫字符識(shí)別如前所述,字符識(shí)別的關(guān)鍵是特征量的選定,而特征量選定的方法也是多種多樣:下圖左顯示的是所謂狹縫法,它用每個(gè)狹縫切出的圖形的波形作為特征量。下圖右則是方向線素筆畫穿透數(shù)目特征法,在圖形平面上作幾條直線,把字符與各條特征線的交點(diǎn)數(shù)作為特征量。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.2手寫字符識(shí)別作為一種實(shí)用的手寫文字圖像的識(shí)別方法,為了提高識(shí)別精度,有必要選取較多的特征量。本法使用的特征量如下圖所示,為圖像平面上縱、橫、斜交差的12條直線。這12條直線分別標(biāo)記上1~12的序號(hào)。當(dāng)圖像平面上輸入一個(gè)手寫文字時(shí),計(jì)算文字的各個(gè)筆劃與各條直線的相交次數(shù),把它們作為該文字的特征量。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.2手寫字符識(shí)別對(duì)于任意一個(gè)輸入的圖像模式(字符),我們可以用相同的方法對(duì)其抽取特征量C1,C2,…,Cn,把這些特征量逐一與各個(gè)字符的標(biāo)準(zhǔn)模式的特征量計(jì)算求取相似距離值D,假設(shè)與第i個(gè)標(biāo)準(zhǔn)模式的相似距離值Di是所有求得的距離值D中最小的一個(gè),那么我們就說輸入模式最接近于第i個(gè)標(biāo)準(zhǔn)模式。這樣,作為圖像識(shí)別的結(jié)果,我們說輸入模式就是第i個(gè)標(biāo)準(zhǔn)模式所代表的字符。相似距離D是這樣計(jì)算的。設(shè)輸入圖像模式的特征量為C1,C2,…,Cn,某個(gè)標(biāo)準(zhǔn)模式的特征量是R1,R2,…,Rn,則輸入模式與該標(biāo)準(zhǔn)模式的相似距離D由下式計(jì)算:13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別

13.3.2手寫字符識(shí)別設(shè)特征量

C={Ci|i=l,2,…,12}中各分量的值表示相應(yīng)序號(hào)的特征線與各筆劃的相交次數(shù)。這種文字識(shí)別方法對(duì)于各種文字,包括中文、英文、日文、數(shù)字等等都適用。當(dāng)然,要能夠用本法來識(shí)別某種文字,其先決條件是必須準(zhǔn)備該種文字的標(biāo)準(zhǔn)模式,因?yàn)闆]有文字的標(biāo)準(zhǔn)模式,識(shí)別是無從談起的。如前圖,當(dāng)圖像平面中輸入一個(gè)手寫“A”字后,它的各個(gè)筆劃與12條特征直線的交點(diǎn)分別為:

C1=1,C2=2,C3=2,C4=2,C5=2,C6=2C7=3,C8=3,C9=0,C10=1,C11=2,C12=1因此其特征量是C(A)={1,2,2,2,2,2,2,3,3,0,1,2,1}。我們把C(A)定義成“A”的標(biāo)準(zhǔn)模式特征量。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.2手寫字符識(shí)別但是,單靠一次手寫輸入來定義標(biāo)準(zhǔn)模式特征量是不行的,因?yàn)樗哂械拇硇院懿睢Mǔ5淖鞣ㄊ?,由不同的書寫者反?fù)輸入多次,求其平均值來作為“A”這個(gè)手寫字的標(biāo)準(zhǔn)模式特征量。即C={C1,C2,…,C12}其中:式中,M是該手寫文字輸入的總次數(shù)。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.2手寫字符識(shí)別這樣作出的標(biāo)準(zhǔn)模式會(huì)更具有代表性,因而能夠提高文字的識(shí)別能力。一般地,M值越大(輸入的次數(shù)越多),標(biāo)準(zhǔn)模式所能提供的識(shí)別能力會(huì)越大。如果我們用這種方法作出從A到Z這26個(gè)英文字母的大寫和小寫字母的標(biāo)準(zhǔn)模式特征量,我們就能利用它們來識(shí)別任何一個(gè)手寫的英文字母了。識(shí)別的方法還是利用前述的相似距離的概念。分別計(jì)算輸入模式與各個(gè)標(biāo)準(zhǔn)模式之間的相似距離Di,然后在Di中找出最小值Dmin,就把Dmin對(duì)應(yīng)的標(biāo)準(zhǔn)模式所代表的字母作為識(shí)別結(jié)果輸出。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.2手寫字符識(shí)別設(shè)輸入模式的特征量為C’={x1,x2,…,x12},某個(gè)標(biāo)準(zhǔn)模式的特征量為C={y1,y2,…,y12},為了提高計(jì)算速度和精度,采用下式計(jì)算相似距離:其中wi為各條特征直線的權(quán)。根據(jù)每條特征直線所處位置的重要性賦給各條特征直線不同的權(quán)值。例如在前圖中處于中心的兩條縱、橫直線(豎線2和橫線5)應(yīng)該有最大的權(quán)值,而9,10,11,12等四條直線可取最小的權(quán)值。究竟應(yīng)賦給各個(gè)權(quán)以多大的絕對(duì)值為宜?回答是不確定的。因?yàn)閷?duì)于權(quán)值來講,有意義的是它們之間的相對(duì)大小,而不是每個(gè)權(quán)值的絕對(duì)大小。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.2手寫字符識(shí)別在實(shí)用手寫體識(shí)別系統(tǒng)中,都具備學(xué)習(xí)(訓(xùn)練)功能。學(xué)習(xí)功能實(shí)際上就是將標(biāo)準(zhǔn)模式的生成過程延續(xù)到每一次的實(shí)際識(shí)別過程,以期不斷提高識(shí)別率的一種強(qiáng)化識(shí)別功能的方式。這就是說,假定某一次的識(shí)別結(jié)果正確,把這個(gè)被識(shí)別的文字模式的特征量加入到該文字的標(biāo)準(zhǔn)模式特征量中去(按前述求平均的方法);假定某一次的識(shí)別結(jié)果不正確,則通過交互的方法要求操作者用鍵盤輸入正確的答案,而把這一次被識(shí)別的文字模式的特征量加到正確答案的標(biāo)準(zhǔn)模式特征量中去。這樣,就使得每一次的實(shí)際識(shí)別過程都成了標(biāo)準(zhǔn)模式的生成過程。通過這種不斷的累積,可以使得識(shí)別系統(tǒng)的正確識(shí)別率不斷得到提高。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.2手寫字符識(shí)別上述是一個(gè)脫機(jī)(離線)手寫體識(shí)別系統(tǒng),以下是一個(gè)聯(lián)機(jī)手寫數(shù)字識(shí)別系統(tǒng)的示例程序及其源代碼,右圖是其界面。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.2手寫字符識(shí)別下圖是微軟拼音輸入法所提供的漢字手寫輸入板。它支持簡體中文、繁體中文、英語、日語和朝鮮語的手寫輸入,由于有提示選擇,識(shí)別正確率較高,甚至支持連筆。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別印刷體文字識(shí)別一般指從掃描儀(傳真機(jī)、數(shù)碼相機(jī)等)輸入到計(jì)算機(jī)里的事務(wù)文書、技術(shù)檔案等文書圖像中識(shí)別逐個(gè)文字。印刷體文字識(shí)別中漢字識(shí)別已經(jīng)實(shí)用化。而且在向更高的性能、更完善的用戶界面的方向發(fā)展。有著廣泛的應(yīng)用前景。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別后處理版面理解版面重構(gòu)輸出13.3.3印刷體文字的識(shí)別:識(shí)別系統(tǒng)的流程

13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別噪聲的例子強(qiáng)噪聲使行間粘連背面圖像透過噪聲加傾斜13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別消噪處理:13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別版面分析的難點(diǎn):沒有簡單數(shù)學(xué)模型;不能簡單橫豎分割;圖文繞排復(fù)雜;文章數(shù)目多。版面分析常用算法:自上而下法:從整體到局部遞歸分割;自下而上法:從局部到整體逐步合并;綜合法:綜合上面的算法;其它方法:紋理分析、背景分析等。下一頁是版面分析的一個(gè)實(shí)例。版面分析的例子13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別傾斜或行間距過小時(shí)投影失效13.3.3印刷體文字的識(shí)別行切分投影法13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別實(shí)際的行切分算法13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別字切分投影法連通域分析法字切分的困難字符斷裂字符粘連中英文判別13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別:識(shí)別算法印刷體文字的識(shí)別的算法種類很多:印刷體文字的模式表達(dá)形式和相應(yīng)的字典形成方法有多種,每種形式又可以選擇不同的特征,每種特征又有不同的抽取方法,這就使得判別方法和準(zhǔn)則以及所用的數(shù)學(xué)工具不同,形成了種類繁多、形式各異的識(shí)別方法。通??梢苑譃椋航Y(jié)構(gòu)模式識(shí)別(句法模式識(shí)別)方法;統(tǒng)計(jì)模式識(shí)別方法;統(tǒng)計(jì)與結(jié)構(gòu)相結(jié)合的識(shí)別方法;人工神經(jīng)網(wǎng)絡(luò)方法;單以識(shí)別率而言,特征抽取可以說是OCR的核心,用什么特征,怎么抽取,直接影響識(shí)別好壞。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別:識(shí)別算法結(jié)構(gòu)模式識(shí)別(句法模式識(shí)別)方法文字圖形含有豐富的結(jié)構(gòu)信息,提取這些結(jié)構(gòu)特征及其組字規(guī)律的信息,作為識(shí)別的依據(jù),這就是結(jié)構(gòu)模式識(shí)別法。印刷體文字是由筆劃或更小的結(jié)構(gòu)基元構(gòu)成的。由這些結(jié)構(gòu)基元及其相互關(guān)系完全可以精確地對(duì)文字加以描述,就像一篇文章由單字、詞、短語和句子按語法規(guī)律所組成一樣。故亦稱句法模式識(shí)別。識(shí)別時(shí),利用上述結(jié)構(gòu)信息及句法分析的方法進(jìn)行識(shí)別,類似一個(gè)邏輯推理器。在實(shí)際應(yīng)用中,此方法面臨的主要問題:抗干擾能力差,如傾斜,扭曲,斷裂,粘連,對(duì)比度差等等。結(jié)構(gòu)模式識(shí)別的描述比較復(fù)雜,匹配過程的復(fù)雜度也較高。只有得到可靠、穩(wěn)定、獨(dú)立且數(shù)量較小的特征,結(jié)構(gòu)識(shí)別方法的優(yōu)勢才能夠最大限度地發(fā)揮出來。如果上述問題得到較好的解決的話,結(jié)構(gòu)識(shí)別方法將顯示出其巨大的優(yōu)勢:匹配方法直觀、形象;識(shí)別穩(wěn)定性好,算法的泛化能力強(qiáng)。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別:識(shí)別算法統(tǒng)計(jì)模式識(shí)別方法提取待識(shí)別模式的一組統(tǒng)計(jì)特征,然后按照一定準(zhǔn)則所確定的決策函數(shù)進(jìn)行分類判決。統(tǒng)計(jì)模式識(shí)別是將字符點(diǎn)陣看作一個(gè)整體,所用的特征是從這個(gè)整體上經(jīng)過大量的統(tǒng)計(jì)而得到的。統(tǒng)計(jì)特征的特點(diǎn)是抗干擾性強(qiáng),匹配與分類的算法簡單,易于實(shí)現(xiàn)。不足之處在于細(xì)分能力較弱,區(qū)分相似字的能力差一些。特征無直觀性的物理意義。常見的統(tǒng)計(jì)模式識(shí)別方法有:(1)模板匹配;(2)筆劃密度特征;(3)外圍特征;(4)特征點(diǎn)特征;(5)利用變換特征的方法;(6)投影直方圖法;(7)幾何矩(GeometricMoment)特征;(8)Spline曲線近似與傅立葉描繪子(FourierDescriptor);(9)基于微結(jié)構(gòu)特征的方法。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別下例采用模板匹配法(像素貼近度法)進(jìn)行識(shí)別。模板匹配不需要特征提取過程。字符的圖像直接作為特征,與字典中的模板相比,相似度最高的模板類即為識(shí)別結(jié)果。這種方法簡單易行,可以并行處理;但是一個(gè)模板只能識(shí)別同樣大小、同種字體的字符,對(duì)于傾斜、筆劃變粗變細(xì)均無良好的適應(yīng)能力。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別模板匹配法把輸入圖像與各個(gè)標(biāo)準(zhǔn)圖像分別重疊起來,觀察兩者的重合度有多大。具體的算法就是對(duì)這兩個(gè)圖像求邏輯與(and),當(dāng)且僅當(dāng)同一坐標(biāo)點(diǎn)處的象素都為黑象素時(shí)結(jié)果才為黑象素,否則為白象素。然后計(jì)算求與結(jié)果的圖像中黑象素的個(gè)數(shù),越接近圖像中的黑象素個(gè)數(shù)時(shí),輸入圖像的文字等于該標(biāo)準(zhǔn)圖像文字的概率就越高。毫無疑問,輸入文字只能與相同字體、相同字型大小的標(biāo)準(zhǔn)文字圖像進(jìn)行比較,否則是沒有意義的。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別另外需要注意的是,筆劃較多的輸入文字與筆劃較少的標(biāo)準(zhǔn)文字進(jìn)行重疊比較時(shí)容易發(fā)生誤識(shí)別。例如,輸入文字為“玉”字,標(biāo)準(zhǔn)文字為“三”字時(shí),重疊求與的結(jié)果仍將為“三”,結(jié)果就可能把輸入的“玉”認(rèn)作“三”。為了避免這個(gè)缺陷,應(yīng)該將輸入文字盡量只與和它的筆劃大致相同的標(biāo)準(zhǔn)文字圖像進(jìn)行比較。要做到這一點(diǎn),只需計(jì)算輸入文字圖像中黑象素的個(gè)數(shù)m,并只使用標(biāo)準(zhǔn)文字圖像集中黑象素的個(gè)數(shù)接近m的那部分標(biāo)準(zhǔn)文字與之進(jìn)行比較。這樣一方面可以提高正確識(shí)別率,同時(shí)也因避免了與全部標(biāo)準(zhǔn)字型進(jìn)行比較,從而可以提高識(shí)別速度。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別:商品化軟件TH-OCR9.013.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別:閱讀器內(nèi)嵌OCR13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別:表格識(shí)別OCR識(shí)別還可以識(shí)別和還原各種通用型印刷體表格,在表格理解上做出了令人滿意的實(shí)用結(jié)果。可實(shí)現(xiàn)表格自動(dòng)錄入,識(shí)別后按表格格式輸出。表格識(shí)別的分類無模板指導(dǎo)的表格識(shí)別有模板指導(dǎo)的表格識(shí)別識(shí)別過程表格線分析表格單元定位表格線及原始內(nèi)容去除單元圖像切分與識(shí)別識(shí)別結(jié)果編輯修改結(jié)果送數(shù)據(jù)庫13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別:表格識(shí)別有模板的特定表格識(shí)別增值稅發(fā)票識(shí)別13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別13.3.3印刷體文字的識(shí)別:表格識(shí)別有模板的特定表格識(shí)別中華人民共和國出口許可證錄入檢測

(THOCR-97批量表格自動(dòng)識(shí)別錄入子系統(tǒng)人機(jī)界面)13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別其它識(shí)別系統(tǒng)OMR;郵政分揀;名片識(shí)別;身份證識(shí)別;信封地址識(shí)別;票據(jù)識(shí)別;發(fā)票識(shí)別。13.3圖像模式識(shí)別應(yīng)用:光學(xué)字符識(shí)別思考題根據(jù)所熟悉的某一部門的工作流程,設(shè)計(jì)一個(gè)實(shí)用的文本圖像處理系統(tǒng)。輸入何種文本圖像?(表格?)需要識(shí)別何種信息?用課上的何種技術(shù)?(表格分析、切分、識(shí)別?)輸出結(jié)果有何用途?(減輕人工勞動(dòng)?)13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別我們經(jīng)常需要用各種證件證明我們的身份,如身份證、工作證、信用卡等,但是,它們都容易被竊取、丟失或忘記,都不夠保險(xiǎn)。生物特征識(shí)別(Biometric)技術(shù):根據(jù)個(gè)人獨(dú)特的生理學(xué)特征自動(dòng)識(shí)別個(gè)人身份的技術(shù)。生物特征識(shí)別系統(tǒng)最大的優(yōu)點(diǎn)是使用方便。而且日益明顯地顯示出快速和準(zhǔn)確的特點(diǎn)。多種生物統(tǒng)計(jì)學(xué)識(shí)別系統(tǒng)可以共同使用,這樣大大地提高了準(zhǔn)確率。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別常用的生物特征:人臉、指紋、掌紋、虹膜、DNA、語音、姿態(tài)等。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別各種生物特征識(shí)別技術(shù)應(yīng)用市場報(bào)告13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.1生物特征識(shí)別原理

生物特征識(shí)別系統(tǒng)基本上都采用相同的工作原理:采集樣品:指紋、面孔的圖像等,或是語音;特征提?。焊鶕?jù)樣品與眾不同的特征,用一種算法為其分配一個(gè)特征代碼。代碼存入識(shí)別數(shù)據(jù)庫:可以對(duì)人的面部特征、人手的幾何形狀、人的聲音或人的虹膜進(jìn)行檢索和匹配。當(dāng)某人需要被識(shí)別身份時(shí),一種特征匹配算法將存在數(shù)據(jù)庫里的該人的特征代碼與被識(shí)別人的特征相匹配,從而驗(yàn)明其身份。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.1生物特征識(shí)別原理

生物特征識(shí)別屬于有監(jiān)督分類:即我們在已知一些類樣本的情況下,對(duì)新的樣本進(jìn)行分類。它的中心問題是類內(nèi)距離和類間距離。類內(nèi)距離:同一個(gè)類中的樣本的距離或差別;類間距離:指不同類的樣本的距離或差別。理想的情況是,類內(nèi)距離相當(dāng)小,類間距離相當(dāng)大。那么,我們就可以識(shí)別不同類別的樣本。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.2人臉識(shí)別人臉識(shí)別是模式識(shí)別領(lǐng)域的前沿課題,它具有廣泛的應(yīng)用前景:公安系統(tǒng)(criminalmugshot);銀行,海關(guān)等(Identification);自動(dòng)門衛(wèi)系統(tǒng)(Authentication)。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.2人臉識(shí)別人臉識(shí)別到目前為止,還是一個(gè)世界性的難題,即使是同一個(gè)人臉,也會(huì)因?yàn)橐韵略蚨鞑幌嗤罕砬椋‥xpression)年齡(age)光照(light)姿態(tài)(pose)部分遮擋(帽子,圍巾,眼鏡)此外,我們對(duì)人腦的識(shí)別機(jī)理尚不清楚,也是導(dǎo)致識(shí)別困難的原因。人臉圖像可以看作一個(gè)維數(shù)為M*N(圖像大?。┑氖噶?,數(shù)據(jù)量大,是一個(gè)高維空間的分類問題。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.2人臉識(shí)別人臉識(shí)別系統(tǒng)的框圖如下:采集跟蹤定位特征提取匹配識(shí)別結(jié)果活動(dòng)人臉活動(dòng)人臉檢測靜態(tài)人臉識(shí)別13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.2人臉識(shí)別早期人臉識(shí)別方法人臉識(shí)別的研究始于60年代末,早期的人臉識(shí)別方法主要有兩大方向:幾何特征的方法:提取特征點(diǎn),如眼角,嘴角,鼻尖等;模板匹配的方法:計(jì)算模板和圖像灰度的自相關(guān)性。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.2人臉識(shí)別90年代以來的人臉識(shí)別方法:基于特征分析的方法提取部件的灰度及輪廓信息進(jìn)行識(shí)別。基于整體的方法:模板匹配;PCA(主成分分析PrincipalComponentAnalysis);FLD(Fisher線性判別方法FisherLinearDiscriminantAnalysis);彈性匹配(ElasticGraphMatch);神經(jīng)網(wǎng)絡(luò)(NeuralNetwork);隱馬爾科夫模型(HiddenMarkovModel)。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.2人臉識(shí)別主元分析(PrincipalComponentAnalysis,PCA)法:是一種基于KL(Karhunen-Loeve卡夫納-勒維)變換的方法,KL變換是一種最優(yōu)的能量壓縮方法,但是它并不是最優(yōu)的模式分類方法。通過對(duì)訓(xùn)練樣本KL變換得到的特征向量也叫特征臉,是一組標(biāo)準(zhǔn)正交基,通常取部分基構(gòu)成特征空間,待識(shí)別人臉在特征空間的投影作為特征字串,通過比較特征子串之間的距離來作為識(shí)別的判據(jù)。主元分析法的任務(wù):就是構(gòu)造一個(gè)能更好描述人臉的人臉空間,降低空間維數(shù),是新的人臉空間的基向量(稱為主元)能更好地描述典型的人臉模式。前N個(gè)特征值對(duì)應(yīng)的特征矢量是定義在圖像空間的,可以被看成是圖像,它們也確實(shí)與人臉相似,稱之為特征臉。特征臉技術(shù)很容易擴(kuò)展到特征眼、特征鼻、特征嘴等。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.2人臉識(shí)別彈性匹配方法:在二維空間定義了一個(gè)距離,這個(gè)距離對(duì)通常的人臉變形具有一定的不變性,他用屬性拓?fù)鋱D來表達(dá)人臉,拓?fù)鋱D的任一頂點(diǎn)包含一個(gè)特征矢量,識(shí)別時(shí)候計(jì)算最佳拓?fù)鋱D和原拓?fù)鋱D的“距離”,作為識(shí)別的判據(jù)。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.2人臉識(shí)別彈性匹配方法:最佳拓?fù)鋱D的生成同時(shí)考慮了特征矢量的匹配和相對(duì)幾何位置的匹配彈性匹配:即最佳拓?fù)鋱D的網(wǎng)格發(fā)生了變形以進(jìn)一步的減小能量函數(shù)。正是因?yàn)檫@樣,彈性匹配適應(yīng)了人臉表情的細(xì)微變化。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.2人臉識(shí)別結(jié)論人臉識(shí)別是一個(gè)跨學(xué)科富挑戰(zhàn)性的前沿課題,但目前人臉識(shí)別還很不成熟,尚不是實(shí)用化領(lǐng)域的活躍課題研究重點(diǎn)從傳統(tǒng)的點(diǎn)和曲線的分析方法,過渡到用新的人臉模型來表達(dá)和識(shí)別人臉,其中彈性圖匹配就是較成功的嘗試。人臉識(shí)別的研究也和心理學(xué)、解剖學(xué)、生理學(xué)等的研究密切相關(guān)13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.3指紋識(shí)別隨著社會(huì)發(fā)展,取得高度準(zhǔn)確的自動(dòng)個(gè)人身份認(rèn)證的能力變得日益重要;人們注意到,包括指紋在內(nèi)的許多皮膚紋路在圖案、斷點(diǎn)和交叉點(diǎn)上每個(gè)人是各不相同的,也就是說,是唯一的。依靠這種唯一性,我們就可以把一個(gè)人同他的指紋對(duì)應(yīng)起來,通過比較他的指紋和預(yù)先保存的指紋進(jìn)行比較,就可以驗(yàn)證他的真實(shí)身份。指紋識(shí)別是生物識(shí)別技術(shù)的一種,是目前最流行、最方便、最成熟以及最可靠的個(gè)人身份認(rèn)證方法之一。當(dāng)今市場上可以提供從指紋取像設(shè)備到完整的指紋識(shí)別軟件開發(fā)包,包括嵌入式的系統(tǒng)和其他應(yīng)用指紋驗(yàn)證的計(jì)算機(jī)軟件。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別自動(dòng)13.4.3指紋識(shí)別指紋識(shí)別系統(tǒng)簡介系統(tǒng)框圖圖像增強(qiáng)特征提取特征匹配指紋數(shù)據(jù)庫指紋輸入手工確認(rèn)13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別自動(dòng)13.4.3指紋識(shí)別指紋輸入現(xiàn)場采集指紋要求指紋質(zhì)量不能太差。對(duì)于嚴(yán)重蛻皮和嚴(yán)重出汗的手指,采集到的指紋質(zhì)量較差,進(jìn)行圖像增強(qiáng)后出現(xiàn)較大面積的不可恢復(fù)區(qū),很難再做特征提取,也就無法進(jìn)行特征匹配。圖像增強(qiáng)一幅指紋圖像的區(qū)域分為以下三種類型:清晰區(qū)、可恢復(fù)的壞區(qū)、不可恢復(fù)的壞區(qū)。前兩個(gè)又被稱作可恢復(fù)區(qū),后一個(gè)被稱作不可恢復(fù)區(qū)。指紋增強(qiáng)的目的:提高可恢復(fù)區(qū)的清晰度并標(biāo)記出不可恢復(fù)區(qū),而且此間不能帶來過多的偽細(xì)節(jié)特征。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.3指紋識(shí)別指紋的特征指紋的兩類特征:總體特征;局部特征。在考慮局部特征的情況下,英國學(xué)者E.R.Herry認(rèn)為,只要比對(duì)13個(gè)特征點(diǎn)重合,就可以確認(rèn)為是同一個(gè)指紋。13.4圖像模式識(shí)別應(yīng)用:生物特征識(shí)別13.4.3指紋識(shí)別總體特征是指那些用肉眼直接就可以觀察到的特征,包括:

紋形模式區(qū)(PatternArea)核心點(diǎn)(CorePoint)三角點(diǎn)(Delta)紋數(shù)(RidgeCount)方向(Orientation)曲率(Curvature)位置(Position)13.4圖像模式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論