人臉識別的主要方法_第1頁
人臉識別的主要方法_第2頁
人臉識別的主要方法_第3頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1.1人臉識別的主要方法目前,國內(nèi)外人臉識別的方法很多,并且不斷有新的研究成果出現(xiàn)。人臉識別的方法根 據(jù)研究角度的不同,有不同的分類方法。根據(jù)輸入圖像中人臉的角度不同,可以分為正面, 側(cè)面,傾斜的人臉圖像的識別;根據(jù)圖像來源的不同,可分為靜態(tài)和動態(tài)的人臉識別;根據(jù) 輸入圖像的特點,又可分為灰度圖像和彩色圖像的人臉識別等等。本文重點研究基于正面的、 靜態(tài)的灰度圖像的識別方法。對于靜態(tài)的人臉識別方法從總體上看可以分為三大類:一是基于統(tǒng)計的識別方法,主要 包括特征臉(Eigenface)方法和隱馬爾科夫模型(Hidden Markov Model簡稱HMM)方法等;二 是基于連接機制的識別方法,包括

2、人工神經(jīng)網(wǎng)路(Artifical Neural Network簡稱ANN)方法和 彈性圖匹配(Elastic Bunch Graph Matching簡稱EBGM)方法等;三是一些其他的綜合方法及 處理非二維灰度圖像的方法。下面分別進行介紹。1.1.1基于特征臉的方法特征臉方法5,又稱為主成份分析法(Principal Component Analysis簡稱PCA),它是 20世紀90年代初期由Turk和Pentland提出的,是一種經(jīng)典的算法。它根據(jù)圖像的統(tǒng)計 特征進行正交變換(即K-L變換),以消除原有向量各個分量之間的相關(guān)性。變換得到對應 特征值依次遞減的特征向量,即特征臉。特征臉方法

3、的基本思想是將圖像經(jīng)過K-L變換后由高維向量轉(zhuǎn)換為低維向量,并形成 低維線性向量空間,利用人臉投影到這個低維空間所得到的投影系數(shù)作為識別的特征矢量。 這樣,就產(chǎn)生了一個由“特征臉”矢量張成的子空間,稱為“人臉子空間”或“特征子空間”, 每一幅人臉圖像向其投影都可以獲得一組坐標系數(shù),這組坐標系數(shù)表明了人臉在子空間中的 位置,因此利用特征臉方法可以重建和識別人臉。通過人臉向量向特征子空間作投影得到的向量稱之為主分量或特征主分量。主分量特征 具有如下性質(zhì):主分量特征具有很強的信息壓縮能力。對于任何屬于樣本空間的人臉模式都有唯一的主分量特征與之相對應。主分量特征具有穩(wěn)定性。即當輸入的人臉模式向量有微小

4、變化時,其對應的主分量特征 變化將小于輸入模式的變化。這一點對于模式的分類是非常有利的。經(jīng)過變換矩陣的映射,隨著空間維數(shù)的降低,模式之間的距離也得以縮小,從而避免了 在高維空間中進行分類的復雜性由于PCA方法主要是利用了 K-L變換,因此它具有良好的穩(wěn)定性、位移不變性、特 征向量與圖像的高度成比例變化以及轉(zhuǎn)置不變性,且K-L變換是統(tǒng)計最優(yōu)的、具有速度快, 實現(xiàn)方便、對正面圖像識別率高等特點,但是特征臉的不足之處是容易受人臉姿態(tài)和表情, 光照改變及位移改變等因素的影響。為了克服這些缺點,研究人員提出了許多改進方案,如Bartlett等采用獨立分量分析 (ICA,Independent Compo

5、nent Analysis)的方法識別人臉;將特征臉與線性判別函數(shù)相結(jié)合的 Fisher臉方法等?,F(xiàn)在還出現(xiàn)了很多其他子空間的人臉識別方法,如借鑒SVM的Kernel方 法,PCA,IDA等都被擴展到Kernel PCA和 Kernel ICA等等。從以上介紹不難發(fā)現(xiàn),利用特征臉方法進行人臉識別有其他人臉識別方法無法取代的優(yōu) 勢,因此在人臉識別領(lǐng)域,特征子空間的方法仍是人們研究的一個熱門方向。1.1.2基于幾何特征的人臉識別方法基于幾何特征的方法,有時也稱為結(jié)構(gòu)匹配方法,是早期的人臉識別方法6,7,該方法 常采用的幾何特征有人臉的五官如眼睛、鼻子、嘴巴等的局部形狀特征,臉型特征以及五官 在臉上

6、分布的幾何特征。因此該方法需要先檢測人臉的眼睛,眉毛,鼻子和嘴巴等各種幾何 特征,然后將特征點的位置,距離和角度等各個特征和相互的聯(lián)系用作人臉識別的特征。提 取特征時往往要用到人臉結(jié)構(gòu)的一些先驗知識。在這種基于幾何特征的識別中,識別歸為特 征矢量之間的匹配,其中基于歐氏距離的判決是最常用的識別方法。基于幾何特征的識別方法具有如下優(yōu)點:符合人類識別人臉的機理,易于理解;存儲量 小,對每幅圖像只需存儲一個特征矢量;具有光照不變性;模板匹配高識別率等。但這種方 法存在如下問題:對強烈的表情變化和姿態(tài)變化的魯棒性較差;從圖像中抽取穩(wěn)定的特征比 較困難,特別是特征受到遮擋時。因此一般不單獨利用基于幾何特

7、征的方法進行人臉識別, 而是和其他方法結(jié)合使用。1.1.3彈性圖匹配的方法彈性圖匹配法最早由Lades在1993年提出的8。該方法使用一種基于動態(tài)鏈接結(jié)構(gòu) 的彈性匹配法來定位人臉,并根據(jù)已有人臉數(shù)據(jù)庫進行匹配識別。彈性圖匹配法將人臉用格 狀的稀疏圖形描述,圖形中的每個節(jié)點用圖像位置的Gabor小波分解得到的特征向量標記, 這些特征向量記錄人臉在該頂點位置的分布信息,稀疏圖的邊用連接節(jié)點的距離向量標記, 表示連接關(guān)系。在進行匹配的時候,先尋找與輸入圖像的最相似的模型圖,再對圖中的每個 節(jié)點位置進行最佳匹配。彈性匹配方法提取了人臉圖像的局部特征,同時保留了人臉圖像的 空間信息,可以在一定程度上容忍

8、人臉從三維到二維投影引起的變形。由于Gabor變換具 有局部性、帶通性以及方向選擇性,能夠很好地提取目標的本質(zhì)特征,對于目標局部變換、 小的旋轉(zhuǎn)、以及光照改變等情況都能得到較好的識別。彈性模板的方法考慮了人臉的特征和 非剛性,因此該方法的識別率較高,但是計算量非常大識別速度慢。1.1.4基于人工神經(jīng)網(wǎng)絡的方法神經(jīng)網(wǎng)絡方法在人臉識別的應用中有很長的歷史,如早期的 Kohonen自聯(lián)想映射網(wǎng) 絡,后來出現(xiàn)的BP網(wǎng)絡、SOM網(wǎng)絡等。人工神經(jīng)網(wǎng)絡(ANN)是在對大腦的生理研究成果 的基礎上,用機器來模擬大腦的某些機理與機制,實現(xiàn)某方面功能的方法,它具有強大的非 線性逼近能力。它即可以做特征提取器,又可

9、以做分類器。神經(jīng)網(wǎng)絡中的神經(jīng)元是對人類大 腦神經(jīng)單元的一種簡化,神經(jīng)網(wǎng)絡以這些具有非線性映射能力的神經(jīng)元為節(jié)點,神經(jīng)元之間 通過加權(quán)系數(shù)連接。目前,比較有代表性的方法有混合型神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、基于概 率決策的神經(jīng)網(wǎng)絡、主元神經(jīng)網(wǎng)絡等。將神經(jīng)網(wǎng)絡應用在人臉識別中,實際上是把模型的統(tǒng)計特征隱含于神經(jīng)網(wǎng)絡的結(jié)構(gòu)和參 數(shù)中。通過神經(jīng)網(wǎng)絡各神經(jīng)元之間的相互關(guān)系體現(xiàn)人臉特征之間的內(nèi)部聯(lián)系。人工神經(jīng)網(wǎng)絡 方法的優(yōu)點很多,如適應性更強、比較容易實現(xiàn),但其也存在網(wǎng)絡難以收斂、訓練時間長等 問題。神經(jīng)網(wǎng)絡方法在人臉識別上的應用和其他幾類方法比較有一定的優(yōu)勢9,因為對人臉 識別的許多規(guī)律或規(guī)則進行顯性的描述是

10、相當困難的,而神經(jīng)網(wǎng)絡方法則可以通過學習的過 程獲得對這些規(guī)律和規(guī)則的隱性表達10,它的適應性更強,一般也比較容易實現(xiàn)。1.1.5基于支持向量機的方法支持向量機(Support Vector Machine簡稱SVM)的方法,起源于統(tǒng)計學習理論,它研 究如何構(gòu)造學習機,實現(xiàn)模式分類問題。其基本思想是通過非線性變換將輸入空間變換 到一個高維空間,在高維空間求取最優(yōu)線性分類面,以解決那些線性不可分的分類問題。 而這種非線性變換是通過定義適當?shù)膬?nèi)積函數(shù)(即核函數(shù))來實現(xiàn)的。由于該方法是基于 結(jié)構(gòu)風險最小化原理,而不是傳統(tǒng)統(tǒng)計學的經(jīng)驗風險最小化,因而表現(xiàn)出很多優(yōu)于已有 方法的性能。但該方法需要大量的存

11、儲空間,并且訓練速度慢。1.1.6隱馬爾可夫模型的方法隱馬爾科夫模型(Hidden Markov Model,HMM)是用于描述信號概率統(tǒng)計特性的一組統(tǒng) 計模型。HMM使用馬爾科夫鏈來模擬信號統(tǒng)計特性的變化,而這種變化又是間接地通過觀 察序列來描述的,因此,隱馬爾科夫過程是一個雙重的隨機過程。在HMM中,節(jié)點表示 狀態(tài),有向邊表示狀態(tài)之間的轉(zhuǎn)移,一個狀態(tài)可以具有特征空間中的任意特征,對同一特征, 不同狀態(tài)表現(xiàn)出這一特征的概率不同。由于HMM是一個統(tǒng)計模型,對于同一特征序列, 可能會對應于許多狀態(tài)序列,特征序列與狀態(tài)序列之間的對應關(guān)系是非確定的。這種模型對 于狀態(tài)序列來說是隱的,故稱為隱馬爾科夫

12、模型。隱馬爾可夫模型最初用于一維的語音信號,為了把HMM應用于二維的圖像,需要在 圖像上取一個采樣窗口,該窗口的寬度就是圖像的寬度,高度可能只有幾個像素,然后將其 在圖像上由上至下滑動,相鄰窗口之間允許重疊,這樣就把人臉垂直分成了五個區(qū)域:前額, 眼睛,鼻子,嘴巴,下顎,然后用一個五狀態(tài)的HMM模型來表達人臉。馬爾可夫模型的 特性主要用“轉(zhuǎn)移概率”來表示。后一狀態(tài)出現(xiàn)的概率取決于其以前出現(xiàn)過的狀態(tài)次序。這 種方法魯棒性較好、對不同角度和不同光照條件的人臉圖像都可以取得較好的識別效果。該 方法實現(xiàn)的復雜度高,且識別效果主要取決于特征定位的準確性。1.1.7其他綜合方法以上介紹的是幾種典型的人臉識別方法,從分析中可以看出,每種方法都各有其優(yōu)缺點, 因此一些研

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論