基于隱馬爾科夫模型的人臉識(shí)別_第1頁
基于隱馬爾科夫模型的人臉識(shí)別_第2頁
基于隱馬爾科夫模型的人臉識(shí)別_第3頁
基于隱馬爾科夫模型的人臉識(shí)別_第4頁
基于隱馬爾科夫模型的人臉識(shí)別_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于隱馬爾科夫的人臉識(shí)別1人臉檢測(cè)及常用算法人臉檢測(cè),指的是從輸入的圖像〔或者視頻〕中確定人臉的位置、大小和姿態(tài)的過程,是進(jìn)行人臉識(shí)別的根底,也是實(shí)現(xiàn)人臉識(shí)別功能的一個(gè)關(guān)鍵環(huán)節(jié)。人臉檢測(cè)是一種計(jì)算機(jī)視覺中的模式識(shí)別問題,就是將所有的人臉作為一個(gè)模式,而非人臉作為另一種模式,人臉檢測(cè)的核心問題就是將人臉模式和非人臉模式區(qū)別開來。人臉檢測(cè)的算法主要分為兩大類,基于先驗(yàn)知識(shí)的和基于后驗(yàn)知識(shí)的學(xué)習(xí)和訓(xùn)練的算法。常見人臉檢測(cè)的算法有:基于特征子臉人臉檢測(cè)算法:該算法將所有人臉的集合視作一個(gè)人臉子空間,通過檢測(cè)樣本與子空間之間的投影距離檢測(cè)樣本中是否存在人臉;基于模板匹配的人臉檢測(cè)算法:該算法先設(shè)計(jì)一個(gè)代表標(biāo)準(zhǔn)人臉的模板,將進(jìn)行檢測(cè)的樣本與標(biāo)準(zhǔn)模板進(jìn)行比對(duì),通過考察樣本與標(biāo)準(zhǔn)模板的匹配程度,設(shè)置合理的閾值來檢測(cè)樣本中是否存在人臉;神經(jīng)網(wǎng)絡(luò)人臉檢測(cè)算法:該算法是一種學(xué)習(xí)算法,用于學(xué)習(xí)的訓(xùn)練集分為屬于人臉圖像的訓(xùn)練集和非人臉圖像的訓(xùn)練集兩類,通過學(xué)習(xí)從而產(chǎn)生分類器進(jìn)行人臉檢測(cè);基于紋理模型的算法,對(duì)于人臉圖像的灰度共生矩陣進(jìn)行計(jì)算可以獲得倒數(shù)分差、慣量相關(guān)特征這三個(gè)特征矩陣,然后通過迭代計(jì)算求得人臉圖像矩陣中的參數(shù)。使用這種方法取得的模型就被稱為人臉紋理模型。假設(shè)人臉姿態(tài)有旋轉(zhuǎn),通過對(duì)眼睛進(jìn)行定位可以計(jì)算出人臉的旋轉(zhuǎn)角度或者使用投影直方圖FFT變換等方法確定人臉旋轉(zhuǎn)的方向,再進(jìn)行人臉檢測(cè)。1.1Haar特征Harr特征是一種矩形特征,在特征提取時(shí)由四類特征組成特征模板—邊緣特征、圓心環(huán)繞特征、線性特征和特定方向的特征。特征模板包括白色矩形和黑色矩形兩種。白色矩形內(nèi)像素和〔Sum白〕減去黑色矩形像素和〔Sum黑〕就是模板的特征值。Haar特征反映的是圖像中相鄰矩形區(qū)域的灰度變化。Haar特征的每一個(gè)特征值feature可以表示為:其中表示矩形的權(quán)重,表示矩形所包圍圖像的灰度值之和。PaulViola和MichaclJoncs提出積分圖算法提高圖像舉行特征的計(jì)算速度。對(duì)于對(duì)象中的任意一點(diǎn),其灰度值為,積分圖,經(jīng)過對(duì)圖片的一次遍歷,就可以得到圖像中每一個(gè)點(diǎn)的積分圖的值。假設(shè)需要計(jì)算矩形D的特征,其頂點(diǎn)為點(diǎn)1、2、3、4。這樣,矩形D的特征為。1.2AdaBoostAdaBoost〔theAdaptiveBoostingAlgorithm〕算法是一種用于分類器訓(xùn)練的算法該分類器算法,是一種基于統(tǒng)計(jì)模型的迭代算法。核心思想在于將一系列弱分類〔BasicClassifier〕器通過一定的方式進(jìn)行疊加〔Boost〕后形成一個(gè)分類能力很強(qiáng)的強(qiáng)分類器〔StrongClassifier〕。首先,獲得用于訓(xùn)練的樣本庫,樣本庫需包含正負(fù)樣本。就人臉識(shí)別而言,即需獲得人臉圖片與非人臉圖片,選擇人臉圖片時(shí)需考慮樣本的多樣性,選擇非人臉圖片時(shí)需要考慮樣本是否具有代表性。在選取了適宜的樣本集合后對(duì)其進(jìn)行循環(huán)處理,每次循環(huán)處理后可以得到一個(gè)假設(shè)。接下來對(duì)這個(gè)假設(shè)進(jìn)行驗(yàn)證,得到使用該假設(shè)進(jìn)行分類的錯(cuò)誤率。在開始下一輪循環(huán)之前依據(jù)該錯(cuò)誤率調(diào)整每個(gè)樣本所占的權(quán)重。在實(shí)際訓(xùn)練過程中,第一次使所有樣本的權(quán)重相同進(jìn)行訓(xùn)練,從而得到一個(gè)弱分類器。然后使用這個(gè)得到的弱分類器進(jìn)行人臉圖片與非人臉圖片的分類,得到分類結(jié)果。依據(jù)結(jié)果降低可正確分類的樣本的權(quán)重,提高被錯(cuò)誤分類的樣本所占的權(quán)重再進(jìn)行訓(xùn)練,從而得到一個(gè)新的分類器,之后重復(fù)上述步驟進(jìn)行循環(huán)訓(xùn)練。這樣,經(jīng)過T次循環(huán)訓(xùn)練之后,就得到了T個(gè)弱分類器,將這T個(gè)弱分類器經(jīng)過加權(quán)疊加,就得到了強(qiáng)分類器,理論上將,無窮多個(gè)大于50%的弱分類器的聯(lián)合,其分辨正確率可以到達(dá)100%。1.3分類器最初的弱分類器可能只是一個(gè)最根本的Haar-like特征,計(jì)算輸入圖像的Haar-like特征值,和最初的弱分類器的特征值比擬,以此來判斷輸入圖像是不是人臉。比擬輸入圖片的特征值和弱分類器中特征,一定需要一個(gè)閾值,當(dāng)輸入圖片的特征值大于該閾值時(shí)才判定其為人臉。訓(xùn)練最優(yōu)弱分類器的過程實(shí)際上就是在尋找適宜的分類器閾值,使該分類器對(duì)所有樣本的判讀誤差最低。具體操作過程:1、對(duì)于每個(gè)特征f,計(jì)算所有訓(xùn)練樣本的特征值,并將其排序。2、掃描一遍排好序的特征值,對(duì)排好序的表中的每個(gè)元素,計(jì)算下面四個(gè)值:全部人臉樣本的權(quán)重的和t1;全部非人臉樣本的權(quán)重的和t0;在此元素之前的人臉樣本的權(quán)重的和s1;在此元素之前的非人臉樣本的權(quán)重的和s03、求出每個(gè)元素的分類誤差,在表中尋找r值最小的元素,那么該元素作為最優(yōu)閾值。有了該閾值,就生成一個(gè)最優(yōu)弱分類器。強(qiáng)分類器的誕生需要T輪的迭代,具體操作如下:歸一化權(quán)重:2、對(duì)每一個(gè)特征f,訓(xùn)練一個(gè)弱分類器h,計(jì)算此f特征的加權(quán)錯(cuò)誤率:3、選取具有最小錯(cuò)誤率的弱分類器h4、調(diào)整權(quán)重,其中表示x被正確分類,表示被錯(cuò)誤分類,級(jí)聯(lián)成強(qiáng)分類器,其中將多個(gè)訓(xùn)練出來的強(qiáng)分類器按照一定的規(guī)那么串聯(lián)起來,形成最終正確率很高的級(jí)聯(lián)分類器。對(duì)于人臉需要進(jìn)行多尺度檢測(cè),通常是不斷初始化搜索窗口size為訓(xùn)練時(shí)的圖片大小,不斷擴(kuò)大搜索窗口,進(jìn)行搜索。級(jí)聯(lián)分類器在進(jìn)行串聯(lián)時(shí)的原那么是“先重后輕〞,即將重要特征構(gòu)成的結(jié)構(gòu)比擬簡(jiǎn)單的分類器放在前面,而后一級(jí)的分類器都比前一級(jí)使用更為復(fù)雜的矩形特征,由于靠前的分類器用于判斷的特征相對(duì)簡(jiǎn)單,例如只有一兩個(gè)矩形框,這種分類器并不能滿足人臉檢測(cè)的需求,但是能夠迅速篩選掉大量不是人臉的子窗口。這樣,雖然后續(xù)分類器的矩形特征在增多,但是由于需要進(jìn)行后續(xù)檢測(cè)的子窗口的數(shù)量大為減少,整體計(jì)算量在減少,極大地提升了人臉檢測(cè)的速度,并且保證了最后的得到的人臉檢測(cè)結(jié)果偽正〔falsepositive〕的可能性非常低。2人臉識(shí)別算法人臉識(shí)別是對(duì)對(duì)某張?zhí)囟ㄈ四槇D片進(jìn)行身份確認(rèn),關(guān)鍵在于在人臉共性特征中尋找不同人物的個(gè)性特征并以有效的算法〔計(jì)算機(jī)可以理解并加以運(yùn)算〕進(jìn)行描述和區(qū)分。常用的識(shí)別算法有:基于幾何特征的識(shí)別算法—1966年,Bledsoe就提出了基于幾何特征的人臉識(shí)別算法,選取的幾何特征是人臉面部特征點(diǎn)之間的距離和比例。基于PCA的識(shí)別算法—輸入的人臉圖像描述為“特征臉〞的線性組合,不同的人臉特性用構(gòu)成該種線性組合的系數(shù)來進(jìn)行描述,其關(guān)鍵技術(shù)是PCA基于隱馬爾可夫模型的識(shí)別算法—以二維離散余弦變換特征提取獲得觀察向量,構(gòu)建起人臉的EHMM模型。之后,利用EM〔ExpectationMaximization〕算法〔B-W算法〕進(jìn)行訓(xùn)練,訓(xùn)練后得到每個(gè)人對(duì)應(yīng)的EHMM模型。這樣在識(shí)別階段就可以計(jì)算得到人臉圖片觀察向量屬于每個(gè)人物EHMM模型的概率,用于該概率進(jìn)行比擬,選擇概率大者為匹配結(jié)果,從而完成識(shí)別工作。其他的還有基于神經(jīng)網(wǎng)絡(luò)的識(shí)別算法、基于支持向量機(jī)識(shí)別算法、三維人臉識(shí)別算法等等。幾種主流識(shí)別算法比擬:算法名稱特點(diǎn)基于幾何特征的算法特征簡(jiǎn)單,但是不易提取到穩(wěn)定的特征,識(shí)別率不高,魯棒性不高特征臉?biāo)惴ā睵CA〕簡(jiǎn)單有效,是人臉識(shí)別的基準(zhǔn)算法,但是識(shí)別率不高,對(duì)于表情和姿態(tài)的魯棒性不強(qiáng),計(jì)算時(shí)間隨著樣本數(shù)量增多呈指數(shù)增加,新樣本擴(kuò)容時(shí)需要對(duì)多有的樣本進(jìn)行重新訓(xùn)練。隱馬爾科夫模型〔HMM〕識(shí)別率高、對(duì)人臉姿態(tài)、表情變化魯棒性強(qiáng),對(duì)于人臉庫擴(kuò)容適應(yīng)性好,實(shí)現(xiàn)比擬復(fù)雜神經(jīng)網(wǎng)絡(luò)〔NN〕不需要復(fù)雜的特征提取,可使用硬件進(jìn)行加速,但是神經(jīng)元的數(shù)量多,運(yùn)算時(shí)間長,需要較多的人臉進(jìn)行訓(xùn)練,訓(xùn)練過程需要認(rèn)為控制支持向量機(jī)〔SVM〕在小樣本空間識(shí)別率較好,但是識(shí)別過程中需要對(duì)核心函數(shù)參數(shù)進(jìn)行調(diào)整。奇異值分解〔SVD〕特征穩(wěn)定性好,具有選擇、位移等不變性質(zhì),但是識(shí)別率不高。三維人臉識(shí)別算法識(shí)別率高,人臉三維模型的構(gòu)造和存儲(chǔ)開銷大、需要借助專業(yè)設(shè)備進(jìn)行三維建模。3隱馬爾可夫〔HMM〕數(shù)學(xué)模型馬爾可夫模型可視為隨機(jī)有限狀態(tài)自動(dòng)機(jī)。HMM是建立的馬爾科夫模型根底上,由兩個(gè)隨機(jī)過程構(gòu)成,一個(gè)是具有狀態(tài)轉(zhuǎn)移的馬爾科夫鏈,另一個(gè)是描述觀察值和狀態(tài)之間關(guān)系的隨機(jī)過程。HMM構(gòu)成:N:HMM中馬爾科夫鏈的狀態(tài)數(shù)。假設(shè)S是狀態(tài)的集合,,該模型在t時(shí)刻的狀態(tài)為。:初始狀態(tài)矢量,,A:狀態(tài)轉(zhuǎn)移概率,,M:狀態(tài)可能對(duì)應(yīng)觀察值的數(shù)目,可能的觀察值為,t時(shí)刻的觀察值為B:觀察值概率矩陣,,其中HMM的三個(gè)根本問題是:1.給定模型〔五元組〕,求某個(gè)觀察序列O的概率。2.給定模型和觀察序列O,求可能性最大的隱藏狀態(tài)序列。3.對(duì)于給定的觀察序列O,調(diào)整HMM的參數(shù),使觀察序列出現(xiàn)的概率最大。3.1向前算法解決1,但其時(shí)間復(fù)雜度到達(dá)指數(shù)級(jí)別,太慢了,用動(dòng)態(tài)規(guī)劃的思想解決—向前算法:定義向前變量:初始化先前變量:再將向前變量進(jìn)行遞歸運(yùn)算,其中:結(jié)束:向后算法類似于向前算法〔向后變量為:〕3.2Viterbi算法解決2將定義為時(shí)刻t沿一條路徑,并且,產(chǎn)生出的最大概率值:最優(yōu)狀態(tài)序列進(jìn)行求解過程如下:對(duì)進(jìn)行初始化:,2、進(jìn)行遞歸運(yùn)算:結(jié)束4、最優(yōu)狀態(tài)序列:3.3EM算法EM算法是Dempster,Laind,Rubin于1977年提出的求參數(shù)極大似然估計(jì)的一種方法,它可以從非完整數(shù)據(jù)集中對(duì)參數(shù)進(jìn)行MLE估計(jì)。EM算法流程:初始化分布參數(shù)重復(fù)以下步驟直到收斂:E步驟:根據(jù)參數(shù)初始值或上一次迭代的模型參數(shù)來計(jì)算出隱形變量的后驗(yàn)概率,即隱性變量的期望,將其作為隱藏變量的現(xiàn)估計(jì)值:M步驟:將似然函數(shù)最大化以獲得新的參數(shù)值3.4Baum-Welch解決HMM問題3該問題是對(duì)于一個(gè)觀察值序列,如何調(diào)整HMM模型的參數(shù),從而使最大。采用遞歸的思想,從局部最大遞歸至全局最大。定義輔助變量:對(duì)于給定的訓(xùn)練序列O,HMM模型,馬爾科夫鏈在t時(shí)刻的狀態(tài)為i,在t+1時(shí)刻的狀態(tài)為j的概率:,其也可表示為:另外一個(gè)輔助變量是后驗(yàn)概率,該概率表示的是HMM模型在t時(shí)刻的狀態(tài)為i的概率:兩個(gè)輔助變量的關(guān)系是:如果對(duì)于時(shí)間軸t上的所有相加,我們可以得到一個(gè)總和,它可以被解釋為從其他隱藏狀態(tài)訪問Si的期望,或者如果我們求和時(shí)不包括時(shí)間軸上的t=T時(shí)刻,那么它可以被解釋為從隱藏狀態(tài)Si出發(fā)的狀態(tài)轉(zhuǎn)移期望值。相似地,如果對(duì)在時(shí)間軸t上求和〔從t=1到t=T-1〕,那么該和可以被解釋為從狀態(tài)Si到狀態(tài)Sj的狀態(tài)轉(zhuǎn)移期望值。=expectednumberoftransitionfrom=expectednumberoftransitionfrom使用Baum-Wclch算法對(duì)進(jìn)行參數(shù)估計(jì),從而使得這個(gè)概率最大。計(jì)算過程如下:計(jì)算向前變量,向后變量,兩個(gè)輔助變量使用下面公式對(duì)HMM模型的參數(shù)進(jìn)行估計(jì),得到的新模型為重復(fù)上述過程,直至不再明顯增大,就認(rèn)為收斂,這樣對(duì)樣本HMM訓(xùn)練完成。4人臉的EHMM模型人臉圖像是二維的,僅用一維的HMM模型對(duì)人臉圖像進(jìn)行描述并不精確。為了提高人臉識(shí)識(shí)別的精確度,Nefian提出了嵌入式隱馬爾可夫模型〔EmbeddedHidenMarkovModel,EHMM〕。對(duì)于嵌入式隱馬爾可夫模型的研究是建立在HMM的根底上的。HMM模型表示的是人臉圖片從上到下的結(jié)構(gòu)特點(diǎn),同樣,人臉具有從左到右的穩(wěn)定結(jié)構(gòu)??梢詫?duì)人臉圖片先進(jìn)行上到下的劃分,得到人臉一維HMM模型,稱之為主HMM。在已經(jīng)劃分出的五個(gè)狀態(tài)從水平方向再進(jìn)行一次劃分,可以到的5組水平方向的HMM狀態(tài),這5組HMM稱之為子HMM。主HMM的狀態(tài)通常情況下被稱為超狀態(tài)〔SuperState〕,子狀態(tài)〔State〕那么是水平方向的子HMM的狀態(tài)。由于子HMM是限定在主HMM內(nèi)部進(jìn)行劃分的,所以將這種模型稱之為嵌入式隱馬爾可夫模型〔EHMM〕。4.1離散余弦變換離散余弦變換時(shí)一種常用的數(shù)據(jù)壓縮方法。壓縮質(zhì)量接近于信息壓縮的最優(yōu)變換—KL。對(duì)于一副圖像M*N的數(shù)字圖像,其2D離散余弦變換定義為:式中,為變換結(jié)果,也稱作DCT系數(shù),定義為:離散余弦變換的特點(diǎn):頻域變化因子,較大時(shí),DCT系數(shù)的值很小,而數(shù)值較大的主要分布在,v較小的左上角區(qū)域,也就是有用信息的集中區(qū)域。4.2二維Gabor小波小波函數(shù)的實(shí)質(zhì)是:帶通濾波器。Gabor濾波器可以看作是一個(gè)對(duì)方向和尺度敏感的方向性的顯微鏡,Gabor濾波器函數(shù)將在與其震蕩垂直的邊沿處產(chǎn)生強(qiáng)烈的響應(yīng),而邊緣對(duì)物體的識(shí)別是至關(guān)重要的,Gabor濾波器函數(shù)還能夠檢測(cè)到(即響應(yīng))圖像中的一些具有相應(yīng)的方向頻率信息的局部的顯著特征,從而可以形成亮點(diǎn)圖像的局部特征圖譜,這些局部特征形成了原始輸入圖像的一種魯棒、緊湊的特征表示Gabor小波變換作為唯一能夠取得空域和頻域聯(lián)合不確定關(guān)系下限的Gabor核函數(shù)經(jīng)常被用作小波基函數(shù),是圖像的多尺度表示和分析的有力工具,二維Gabor濾波器的函數(shù)形式可以表示為:.方括號(hào)中的第一項(xiàng)決定了Gabor核的震蕩局部,刻畫圖像邊緣局部的特性,第二項(xiàng)為補(bǔ)償直流分量,用以消除和函數(shù)響應(yīng)對(duì)圖像亮度絕對(duì)值變化的依賴,以保證不同亮度值構(gòu)成的均勻亮度區(qū)域的響應(yīng)接近相同。其中,參數(shù)控制著高斯窗口的寬度、震蕩局部的波長和方向,參數(shù)那么決定了窗口的寬度和波長的比例關(guān)系。上式定義的Gabor核函數(shù)可以定義出一組濾波器。在進(jìn)行運(yùn)算過程中,需要對(duì)核函數(shù)進(jìn)行頻域下采樣,即將離散化:其中,,表達(dá)濾波器的方向性,,為濾波器的采樣頻率,v和為尺度參數(shù)和方向參數(shù),一般情況下。臉圖像的Gabor特征由人臉圖像和Gabor濾波器組卷積得到,令表示人臉圖像的灰度分布,那么和Gabor濾波器的卷積可定義為:Gabor卷積過程實(shí)際產(chǎn)生由實(shí)部和虛部兩個(gè)分量構(gòu)成的復(fù)數(shù)響應(yīng),在邊緣附近,Gabor變換的實(shí)部和虛部會(huì)產(chǎn)生振蕩,而不是一個(gè)平滑的峰值響應(yīng),而幅值的變化相對(duì)平滑而穩(wěn)定,人臉識(shí)別的Gabor特征通常只是采用Gabor特征的幅值,也就是實(shí)部和虛部的模值。提取到的Gabor特征維數(shù)巨大,需要后續(xù)的降維處理?!睵CA降維〕4.3人臉特征向量的提取使用二維離散余弦變換對(duì)人臉圖片進(jìn)行特征提取,對(duì)于一副圖像,其2D-DCT變換為:,圖像變換為能量集中在低頻區(qū)域,所以選擇低頻系數(shù)作為觀察向量。從而降低里觀察向量的維數(shù),從而減少了進(jìn)行HMM訓(xùn)練時(shí)和識(shí)別的計(jì)算量。對(duì)圖片進(jìn)行特征提取時(shí),并不是對(duì)整幅圖片進(jìn)行2D-DCT采樣,而是對(duì)圖片使用遍歷的算法進(jìn)行采樣,采樣時(shí),使用像素值為P〔寬度〕*L〔長度〕的采樣窗口在圖像上從左至右,從上到下進(jìn)行滑動(dòng),相近的采樣窗口移動(dòng)的步長為X*Y,采樣完畢后截取2D-DCT變換的低頻系數(shù)作為特征

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論