畢業(yè)論文-基于Eigenfaces的人臉識(shí)別算法實(shí)現(xiàn)_第1頁(yè)
畢業(yè)論文-基于Eigenfaces的人臉識(shí)別算法實(shí)現(xiàn)_第2頁(yè)
畢業(yè)論文-基于Eigenfaces的人臉識(shí)別算法實(shí)現(xiàn)_第3頁(yè)
畢業(yè)論文-基于Eigenfaces的人臉識(shí)別算法實(shí)現(xiàn)_第4頁(yè)
畢業(yè)論文-基于Eigenfaces的人臉識(shí)別算法實(shí)現(xiàn)_第5頁(yè)
已閱讀5頁(yè),還剩21頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 河北農(nóng)業(yè)大學(xué) 本科畢業(yè)論文(設(shè)計(jì))題 目: 基于Eigenfaces的人臉識(shí)別算法實(shí)現(xiàn) 學(xué) 院: 信息科學(xué)與技術(shù)學(xué)院 專(zhuān)業(yè)班級(jí): 計(jì)算機(jī)1002班 學(xué) 號(hào): 學(xué)生姓名: 指導(dǎo)教師姓名: 指導(dǎo)教師職稱(chēng): 講師 2014年 6 月 5 日 PAGE PAGE 26摘要隨著科技的快速發(fā)展,視頻監(jiān)控技術(shù)在我們生活中有著越來(lái)越豐富的應(yīng)用。在這些視頻監(jiān)控領(lǐng)域迫切需要一種遠(yuǎn)距離,非配合狀態(tài)下的快速身份識(shí)別,以求能夠快速識(shí)別所需要的人員信息,提前智能預(yù)警。人臉識(shí)別無(wú)疑是最佳的選擇??梢酝ㄟ^(guò)人臉檢測(cè)從視頻監(jiān)控中快速提取人臉,并與人臉數(shù)據(jù)庫(kù)對(duì)比從而快速識(shí)別身份。這項(xiàng)技術(shù)可以廣泛應(yīng)用于國(guó)防,社會(huì)安全,銀行電子商務(wù)

2、,行政辦公,還有家庭安全防務(wù)等多領(lǐng)域。本文按照完整人臉識(shí)別流程來(lái)分析基于PCA(Principal Component Analysis)的人臉識(shí)別算法實(shí)現(xiàn)的性能。首先使用常用的人臉圖像的獲取方法獲取人臉圖像。本文為了更好的分析基于PCA人臉識(shí)別系統(tǒng)的性能選用了ORL人臉數(shù)據(jù)庫(kù)。然后對(duì)人臉數(shù)據(jù)庫(kù)的圖像進(jìn)行了簡(jiǎn)單的預(yù)處理。由于ORL人臉圖像質(zhì)量較好,所以本文中只使用灰度處理。接著使用PCA提取人臉特征,使用奇異值分解定理計(jì)算協(xié)方差矩陣的特征值和特征向量以及使用最近鄰法分類(lèi)器歐幾里得距離來(lái)進(jìn)行人臉判別分類(lèi)。關(guān)鍵詞:人臉識(shí)別 PCA算法 奇異值分解定理 歐幾里得距離ABSTRACTWith the

3、rapid development of technology, video surveillance technology has become increasingly diverse applications in our lives. In these video surveillance urgent need for a long-range, with rapid identification of non-state, in order to be able to quickly identify people the information they need, advanc

4、e intelligence warning. Face recognition is undoubtedly the best choice. Face detection can quickly extract human faces from video surveillance, and contrast with the face database to quickly identify identity. This technology can be widely used in national defense, social security, bank e-commerce,

5、 administrative offices, as well as home security and defense and other areas.In accordance with the full recognition process to analyze the performance of PCA-based face recognition algorithm. The first to use the method of access to commonly used face images for face images. In order to better ana

6、lysis is based on the performance of the PCA face recognition system selected ORL face database. Then the image face database for a simple pretreatment. Because ORL face image quality is better, so this article uses only gray scale processing. Then use the PCA for face feature extraction using singu

7、lar value decomposition theorem to calculate the covariance matrix of the eigenvalues and eigenvectors, and use the Euclidean distance of the nearest neighbor classifier to the classification of human face discrimination.KEYWORDS: face recognition PCA algorithm SVD Euclidean distance目錄TOC o 1-3 h u

8、HYPERLINK l _Toc1982 摘要 PAGEREF _Toc1982 2 HYPERLINK l _Toc10941 ABSTRACT PAGEREF _Toc10941 3 HYPERLINK l _Toc22463 1 人臉識(shí)別概述 PAGEREF _Toc22463 5 HYPERLINK l _Toc15789 1.1 人臉識(shí)別的研究概況和發(fā)展趨勢(shì) PAGEREF _Toc15789 5 HYPERLINK l _Toc30777 1.1.1 人臉識(shí)別的研究概況 PAGEREF _Toc30777 5 HYPERLINK l _Toc10751 1.1.2 人臉識(shí)別的發(fā)展趨

9、勢(shì) PAGEREF _Toc10751 6 HYPERLINK l _Toc15644 1.2 人臉識(shí)別的主要難點(diǎn) PAGEREF _Toc15644 7 HYPERLINK l _Toc25706 1.3 人臉識(shí)別的流程 PAGEREF _Toc25706 7 HYPERLINK l _Toc32443 1.3.1 人臉圖像采集 PAGEREF _Toc32443 8 HYPERLINK l _Toc10374 1.3.2 預(yù)處理 PAGEREF _Toc10374 8 HYPERLINK l _Toc1182 1.3.3 特征提取 PAGEREF _Toc1182 8 HYPERLINK

10、l _Toc22748 1.4 本章小結(jié) PAGEREF _Toc22748 9 HYPERLINK l _Toc960 2 人臉圖像 PAGEREF _Toc960 10 HYPERLINK l _Toc10413 2.1 人臉圖像獲取 PAGEREF _Toc10413 10 HYPERLINK l _Toc13256 2.2 人臉圖像數(shù)據(jù)庫(kù) PAGEREF _Toc13256 10 HYPERLINK l _Toc9417 2.3 人臉圖像預(yù)處理 PAGEREF _Toc9417 11 HYPERLINK l _Toc23294 2.3.1 灰度變化 PAGEREF _Toc23294

11、11 HYPERLINK l _Toc7204 2.3.2 二值化 PAGEREF _Toc7204 12 HYPERLINK l _Toc28436 2.3.3 圖像銳化 PAGEREF _Toc28436 12 HYPERLINK l _Toc11789 2.4 本章小結(jié) PAGEREF _Toc11789 13 HYPERLINK l _Toc6389 3 人臉識(shí)別 PAGEREF _Toc6389 14 HYPERLINK l _Toc13112 3.1 PCA算法理論 PAGEREF _Toc13112 14 HYPERLINK l _Toc7215 3.2 PCA人臉識(shí)別算法的實(shí)現(xiàn)

12、 PAGEREF _Toc7215 15 HYPERLINK l _Toc8183 3.2.1 K-L變換 PAGEREF _Toc8183 15 HYPERLINK l _Toc26310 3.2.2 SVD 定理 PAGEREF _Toc26310 15 HYPERLINK l _Toc12628 3.2.3 PCA算法 PAGEREF _Toc12628 16 HYPERLINK l _Toc29797 3.2.4 人臉識(shí)別過(guò)程 PAGEREF _Toc29797 17 HYPERLINK l _Toc1008 3.3 程序運(yùn)行效果 PAGEREF _Toc1008 17 HYPERLI

13、NK l _Toc18504 3.4 程序代碼 PAGEREF _Toc18504 18 HYPERLINK l _Toc27336 3.4.1 代碼類(lèi)關(guān)系 PAGEREF _Toc27336 18 HYPERLINK l _Toc7002 3.4.2 代碼的OpenCV相關(guān) PAGEREF _Toc7002 19 HYPERLINK l _Toc19805 3.4.3 關(guān)鍵函數(shù)代碼 PAGEREF _Toc19805 19 HYPERLINK l _Toc2137 3.5 本章小結(jié) PAGEREF _Toc2137 23 HYPERLINK l _Toc20426 結(jié)論 PAGEREF _T

14、oc20426 24 HYPERLINK l _Toc3580 致謝 PAGEREF _Toc3580 25 HYPERLINK l _Toc23751 參考文獻(xiàn) PAGEREF _Toc23751 261 人臉識(shí)別概述1.1 人臉識(shí)別的研究概況和發(fā)展趨勢(shì)1.1.1 人臉識(shí)別的研究概況人臉識(shí)別的研究開(kāi)始于上世紀(jì)七十年代,當(dāng)時(shí)的研究主要是基于人臉外部輪廓的方法。到現(xiàn)在為止,人臉識(shí)別主要經(jīng)歷了三個(gè)階段的發(fā)展。對(duì)于人臉識(shí)別的研究歷史可分為三個(gè)階段:第一階段(1964-1990)這個(gè)階段主要采取的技術(shù)是基于人臉幾何結(jié)構(gòu)的。研究的重點(diǎn)主要在剪影上。研究人員做了大量關(guān)于如何提取面部剪影曲線(xiàn)的結(jié)構(gòu)特征的研究

15、。這個(gè)階段屬于人臉識(shí)別的初級(jí)階段,突出的研究成果不多,也沒(méi)有獲得的實(shí)際應(yīng)用。第二階段(1991-1997)這個(gè)階段雖然時(shí)間相對(duì)較短,但是碩果累累,出現(xiàn)了若干具有代表性的算法和幾個(gè)商業(yè)化的人臉識(shí)別系統(tǒng),如Identix(原為Visionics)公司的FaceIt系統(tǒng)。這個(gè)時(shí)期最具盛名的人臉識(shí)別方法是MIT媒體實(shí)驗(yàn)室的Turk和Pentland提出的的“特征臉”方法。后來(lái)很多人臉識(shí)別技術(shù)都與特征臉有關(guān),現(xiàn)在特征臉已與歸一化的協(xié)相關(guān)量方法一起成為了人臉識(shí)別性能測(cè)試的基準(zhǔn)算法。這個(gè)時(shí)期的主要成果有:1992年左右,Brunelli和Poggio做了一個(gè)基于結(jié)構(gòu)特征的方法和基于模板匹配的方法性能對(duì)比的實(shí)

16、驗(yàn),并得出了模塊匹配的方法優(yōu)于基于特征的方法的結(jié)論。這個(gè)結(jié)論和特征臉的共同作用,基本上停止了純粹基于結(jié)構(gòu)特征人臉識(shí)別的研究,并且很大的促進(jìn)了基于表觀(guān)的線(xiàn)性子空間建模和基于統(tǒng)計(jì)模式識(shí)別技術(shù)的發(fā)展,使其逐漸成為主流技術(shù)。Belhumeur等人的Fisherface方法也是此階段一個(gè)重要的成果。該方法目前依然是主流人臉識(shí)別方法中的一種,產(chǎn)生了很多變種,比如子空間判別模型等。其先使用PCA即特征臉對(duì)人臉圖像表現(xiàn)特征進(jìn)行降維,并使用線(xiàn)性判別分析方法對(duì)降維后的主成分進(jìn)行變換以獲得“盡量大的類(lèi)間散度和盡量小的類(lèi)內(nèi)散度”。彈性匹配技術(shù)為另一個(gè)重要方法。它用一個(gè)屬性圖來(lái)描述人臉:屬性的頂點(diǎn)代表面部關(guān)鍵特征點(diǎn),它

17、的屬性為相應(yīng)特征點(diǎn)處的多分辨率,多方向局部特征Gabor變換,稱(chēng)為Jet;邊的屬性為不同特征點(diǎn)間的幾何關(guān)系。對(duì)于輸入的圖像,其通過(guò)一種優(yōu)化搜索策略來(lái)定位預(yù)先定位的若干面部關(guān)鍵特征點(diǎn),同時(shí)提取它們的Jet特征,得到輸入人臉圖像的屬性圖。最后通過(guò)計(jì)算其與已知人臉屬性圖的相似度來(lái)完成識(shí)別過(guò)程。彈性匹配方法的優(yōu)點(diǎn)是既保留了面部的全局結(jié)構(gòu)特征,也對(duì)人臉關(guān)鍵局部特征進(jìn)行了建模。局部特征分析由Atick等提出。其在本質(zhì)上是基于統(tǒng)計(jì)的低維對(duì)象描述方法,與PCA相比,局部特征分析在全局主成分分析的基礎(chǔ)上提取的是局部特征。它既保留了全局拓?fù)湫畔ⅲ刑崛×司植刻卣?,使其具有了更好的描述和識(shí)別能力。局部特征分析技術(shù)已

18、商業(yè)化為著名FaceIt系統(tǒng)。柔性模型,包括主動(dòng)形狀模型和主動(dòng)外觀(guān)模型。它是人臉建模方面的一個(gè)新的進(jìn)步。其主要將人臉描述為2D形狀和紋理兩個(gè)分離的部分,分別用PCA建模,然后再通過(guò)PCA將兩者合成來(lái)對(duì)人臉建模。柔性模型具有良好的人臉合成能力,可以使用基于合成的圖像分析技術(shù)對(duì)人臉圖像進(jìn)行特征提取和建模。這個(gè)階段所提出的算法在理想圖像采集條件,人員配合,中小規(guī)模正面人臉數(shù)據(jù)庫(kù)上達(dá)到了非常好的性能。,也誕生幾個(gè)著名的人臉識(shí)別系統(tǒng)。第三階段(1998年現(xiàn)在)這個(gè)時(shí)期關(guān)于人臉識(shí)別的研究非常熱門(mén)。有大量的研究人員從事這方面的研究。主要針對(duì)的是主流的人臉識(shí)別技術(shù)在采集條件不理想和用戶(hù)不配合下魯棒性差的問(wèn)題。

19、光照和姿態(tài)問(wèn)題成為了研究焦點(diǎn)。這個(gè)時(shí)期主要成果有:Georghiades等人基于光照錘模型的多姿態(tài),多光照條件人臉識(shí)別方法。Blanz和Vetter等人基于3D變形模型的多姿態(tài),多光照的人臉識(shí)別方法。Shashua等人基于上圖像的人臉圖像識(shí)別與繪制技術(shù)??傮w而言,目前非理想成像條件下(尤其是光照和姿態(tài)),對(duì)象不配合,大規(guī)模人臉數(shù)據(jù)庫(kù)上的人臉識(shí)別已逐漸成為研究的重點(diǎn)。而非線(xiàn)性建模方法,統(tǒng)計(jì)學(xué)習(xí)理論,基于Boosting的學(xué)習(xí)技術(shù),基于3D模型的人臉建模與識(shí)別方法等逐漸成為備受重視的技術(shù)發(fā)展趨勢(shì)。從整個(gè)人臉識(shí)別的研究歷史來(lái)看,基于PCA的特征臉識(shí)別方法占據(jù)了非常重要的地位,也對(duì)后來(lái)的人臉識(shí)別技術(shù)產(chǎn)

20、生甚遠(yuǎn)的影響。在后來(lái)很多的人臉識(shí)別技術(shù),我們或多或少都會(huì)發(fā)現(xiàn)它的影子。人臉圖像維數(shù)都很高,PCA方法不但很好表征人臉而且通過(guò)去除相關(guān)性,減少冗余,解決了在人臉識(shí)別過(guò)程中圖像為數(shù)過(guò)高的問(wèn)題。并且隨著現(xiàn)代社會(huì)的發(fā)展,快速人臉識(shí)別的需求越來(lái)越大。所以研究基于PCA的人臉識(shí)別算法的實(shí)現(xiàn)還是有實(shí)際意義。1.1.2 人臉識(shí)別的發(fā)展趨勢(shì)人臉識(shí)別至今雖然取得了豐碩的研究成果,但是還有很多問(wèn)題需要解決。人臉識(shí)別的難度在于:人臉是非剛性物體,并且會(huì)隨著年齡的增長(zhǎng)而改變,特征難以完全描述;人臉常常有許多遮擋物,如:眼鏡,帽子等;環(huán)境的光照和人臉的姿態(tài)等。人臉識(shí)別的未來(lái)主要的發(fā)展趨勢(shì)如下:多數(shù)據(jù)融合與方法綜合人臉識(shí)別

21、技術(shù)經(jīng)過(guò)這幾十年的發(fā)展,已取得非常不錯(cuò)的成果。但是各種技術(shù)和方法都有自己不同的適應(yīng)環(huán)境和各自的特點(diǎn)。如何使用數(shù)據(jù)融合理論,將不同的方法綜合起來(lái),相互補(bǔ)充,來(lái)取得較好的人臉識(shí)別效果,便成為人們的研究熱點(diǎn)之一。動(dòng)態(tài)跟蹤人臉識(shí)別系統(tǒng)目前的靜態(tài)人臉識(shí)別技術(shù)只能滿(mǎn)足一般身份識(shí)別場(chǎng)合如門(mén)禁系統(tǒng),考勤系統(tǒng)等,無(wú)法進(jìn)行人臉的動(dòng)態(tài)跟蹤與識(shí)別。隨著現(xiàn)在社會(huì)的發(fā)展,目前對(duì)動(dòng)態(tài)人臉的跟蹤與識(shí)別的需求越來(lái)越大,尤其是在一些安全領(lǐng)域?;谛〔ㄉ窠?jīng)網(wǎng)絡(luò)的人臉識(shí)別小波自提出以來(lái),其理論和應(yīng)用得到了長(zhǎng)足的發(fā)展。它被認(rèn)為是傅里葉分析的突破性的發(fā)展。隨著神經(jīng)網(wǎng)絡(luò)的理論研究的深入,與小波,混沌,模糊集等非線(xiàn)性理論相結(jié)合已成為一個(gè)非常

22、重要的發(fā)展方向。小波變換具有時(shí)頻特性和變焦特性,神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí),自適應(yīng),魯棒性,容錯(cuò)性和推廣能力。如果能結(jié)合兩者的優(yōu)勢(shì),將會(huì)取得人臉識(shí)別不錯(cuò)的效果。三維人臉識(shí)別 目前許多人臉識(shí)別成果是建立在二維人臉基礎(chǔ)上的,而實(shí)際的人臉是三維的。三維人臉相比較于二維圖像提供了更加完整的人臉信息。隨著現(xiàn)在三維人臉采集技術(shù)的逐步發(fā)展,如何利用三維人臉進(jìn)行人臉識(shí)別已成為一個(gè)新的研究熱點(diǎn)。適應(yīng)各種復(fù)雜背景的人臉?lè)指罴夹g(shù)現(xiàn)在在復(fù)雜背景下的人臉?lè)指钜呀?jīng)取得了一定的成果,如彈性匹配,但檢測(cè)速度和效果還無(wú)法令人滿(mǎn)意。在復(fù)雜背景下快速有效檢測(cè)和分割人臉技術(shù)還需進(jìn)一步的研究。全自動(dòng)人臉識(shí)別技術(shù)全自動(dòng)人臉識(shí)別技術(shù)目前還處于初級(jí)

23、研究階段,識(shí)別效果和速度離實(shí)際的要求還相差甚遠(yuǎn)。具體原因是人臉是非剛體,無(wú)法得到準(zhǔn)確完整的描述人臉特征。如何有效的表達(dá)人臉特征將是其研究的重點(diǎn)。1.2 人臉識(shí)別的主要難點(diǎn)目前的人臉識(shí)別技術(shù)在人員配合,較理想采集條件下可以取得比較滿(mǎn)意的結(jié)果。但在人員不配合,采集條件不理想下,系統(tǒng)的性能陡然下降。目前的主要的難點(diǎn)為:人的臉部結(jié)構(gòu)相似,甚至人的五官結(jié)構(gòu)、臉部紋理和外形都很相似。由于不同個(gè)體之間的區(qū)別不大,這樣的特點(diǎn)對(duì)于檢測(cè)人臉的存在有利,但是對(duì)用人臉區(qū)分人的身份不利。人可以通過(guò)臉部變化產(chǎn)生豐富的表情,同時(shí)通過(guò)不同的視角觀(guān)察人臉,其視覺(jué)圖像差別很大,甚至?xí)霈F(xiàn)同一個(gè)人在不同情況下的臉內(nèi)差異大于不同人臉

24、之間的臉間差異,因此人臉的外部形態(tài)很不穩(wěn)定給識(shí)別帶來(lái)很大的困難。背景的變化及復(fù)雜程度在很大程度上會(huì)影響人臉檢測(cè)的準(zhǔn)確度,例如將人臉判斷為非人臉或?qū)⒎侨四樥`判為人臉等。而視頻監(jiān)控系統(tǒng)往往設(shè)置在背景較復(fù)雜的場(chǎng)所,所以解決背景干擾問(wèn)題成為一個(gè)重要問(wèn)題,同時(shí)也是一個(gè)難點(diǎn)問(wèn)題。視頻監(jiān)控區(qū)域往往出現(xiàn)一個(gè)以上的人臉,如何將所有人臉都準(zhǔn)確地進(jìn)行定位是一個(gè)比較困難的地方。與姿勢(shì)和觀(guān)察角度的變化相似不同的光照條件也會(huì)造成識(shí)別的困難。即使是同一個(gè)人,在相同的表情和視角情況下,人臉的區(qū)別也很大。人臉遮擋物的不同,同樣會(huì)給識(shí)別帶來(lái)很大的難度。而且,同一個(gè)人隨著年齡的變化,人臉特色會(huì)出現(xiàn)很大的不同,因此會(huì)出現(xiàn)采集到的人臉

25、與人臉庫(kù)中的同一個(gè)人的人臉差異很大。其中第一類(lèi)的變化是個(gè)體間的變化,稱(chēng)之為類(lèi)間變化:第二類(lèi)變化是同一個(gè) 體間不同情況下的變化,稱(chēng)之為類(lèi)內(nèi)變化。很多情況下,類(lèi)內(nèi)變化甚至?xí)笥陬?lèi) 間變化,從而使受類(lèi)內(nèi)變化干擾情況下的人臉識(shí)別準(zhǔn)確率大大降低。1.3 人臉識(shí)別的流程圖1-1 人臉識(shí)別流程圖1.3.1 人臉圖像采集采集人臉圖像是通過(guò)傳感器采集人臉圖像,并將其轉(zhuǎn)換為計(jì)算機(jī)可以處理的數(shù)字信號(hào)。這是人臉識(shí)別的第一步。在采集人臉圖像時(shí),要注意用戶(hù)人臉姿態(tài),臉部有無(wú)遮擋,周?chē)庹帐欠駶M(mǎn)足要求及設(shè)備采集圖像的質(zhì)量是否能滿(mǎn)足要求。1.3.2 預(yù)處理預(yù)處理是為了除去噪聲和對(duì)測(cè)量?jī)x器或其他因素對(duì)人臉圖像造成退化現(xiàn)象進(jìn)行復(fù)

26、原。從傳感器采集到圖像除了包含人臉特征信息,還包含背景信息,所以必須從原始人臉圖像分割出我們要處理的部分。如何分割就需要定位和分割算法。他們一般以人臉圖像在圖像結(jié)構(gòu)和人臉信號(hào)分布的先驗(yàn)知識(shí)為依據(jù)。常用的人臉預(yù)處理有人臉圖像灰度化,人臉圖像二值化,人臉圖像歸一化,直方圖修正,圖像濾波和圖像銳化。1.3.3 特征提取特征提取就是計(jì)算機(jī)通過(guò)提取人臉圖像中能夠凸顯個(gè)性化差異的的本質(zhì)特征,進(jìn)而來(lái)實(shí)現(xiàn)身份識(shí)別。本文講解如何使用PCA算法提取人臉特征,進(jìn)而實(shí)現(xiàn)人臉識(shí)別。特征主要包括三種類(lèi)型:物理特征,結(jié)構(gòu)特征和數(shù)學(xué)特征。由于物理特征和結(jié)構(gòu)特征容易被察覺(jué),觸覺(jué)以及其他感覺(jué)器官所感知,所以人類(lèi)常常是利用這些特征

27、來(lái)對(duì)對(duì)象進(jìn)行識(shí)別。對(duì)于計(jì)算機(jī)而言,模擬人類(lèi)的感覺(jué)器官是很難實(shí)現(xiàn)的,但計(jì)算機(jī)在處理數(shù)學(xué)特征的能力上要比人類(lèi)強(qiáng)得多,因此我們通過(guò)諸如協(xié)方差矩陣,統(tǒng)計(jì)平均值和相關(guān)系數(shù)等數(shù)學(xué)特征來(lái)構(gòu)建人臉識(shí)別系統(tǒng)。特征提取和選擇的根本任務(wù)就是從許多特征中找出那些最有效的特征。在樣本數(shù)不是很多的情況下,可以利用這些特征進(jìn)行分類(lèi)器的設(shè)計(jì),但是在大多數(shù)情況下,由于測(cè)量空間的維數(shù)很高,不能直接進(jìn)行分類(lèi)器的設(shè)計(jì)。因此,如何把高維測(cè)量空間壓縮到低維特征空間,以便有效的設(shè)計(jì)分類(lèi)器,便成為了一個(gè)值得思考的問(wèn)題。為了獲得有效的特征,一般需要經(jīng)過(guò)特征形成,特征提取和特征選擇等步驟。1)特征形成特征形成是根據(jù)被識(shí)別對(duì)象產(chǎn)生出一組基本特征的

28、過(guò)程,當(dāng)被識(shí)別的對(duì)象是波形或數(shù)字圖像時(shí),這些特征可以通過(guò)計(jì)算得來(lái);當(dāng)被識(shí)別對(duì)象是實(shí)物或某種過(guò)程時(shí),這些特征可以用儀表或傳感器測(cè)量來(lái)得到。通過(guò)上面方法獲得特征被稱(chēng)為原始特征。2)特征提取原始數(shù)據(jù)組成的空間被稱(chēng)為測(cè)量空間。由于測(cè)量空間的維數(shù)一般都很高,不易設(shè)計(jì)分類(lèi)器,所以在分類(lèi)器設(shè)計(jì)之前,需要從測(cè)量空間變換到維數(shù)很少的特征空間,由特征向量表示。通過(guò)映射或變換方法用低緯空間來(lái)表示樣本的過(guò)程被稱(chēng)為特征提取。映射后的特征稱(chēng)為二次特征,它們是原始特征的某種組合,通常是線(xiàn)性組合。3)特征選擇從一組特征中挑出一些最有效的特征從而達(dá)到降低特征空間維數(shù)目的的過(guò)程稱(chēng)為特征選擇。由于在許多實(shí)際問(wèn)題中常常不容易找到那些

29、最重要的特征,或者由于條件限制而不能對(duì)這些重要特征進(jìn)行測(cè)量。從而使得特征選擇和特征提取的任務(wù)復(fù)雜化。特征提取和特征選擇在有些情況下并不是截然分開(kāi)的,因?yàn)閺囊欢ㄒ饬x上來(lái)講,二者都是要達(dá)到對(duì)數(shù)據(jù)進(jìn)行降維的目的,只是實(shí)現(xiàn)的途徑不同。特征提取是通過(guò)某種變換的方法組合原有的高維特征,從而得到一組低維的特征。而特征選擇是根據(jù)專(zhuān)家的檢驗(yàn)知識(shí)或評(píng)價(jià)準(zhǔn)則來(lái)挑選對(duì)分類(lèi)最有影響的特征。比如可以先將原始特征空間映射到維數(shù)較低的空間,在這個(gè)空間中在進(jìn)一步選擇特征來(lái)進(jìn)一步降低維度;也可以先去除那些明顯不含有分類(lèi)信息的特征,而后再進(jìn)行映射以降低維度。4)特征匹配特征匹配是計(jì)算兩個(gè)人臉圖像特征樣本的特征模塊間的相似度即將采集

30、到的人臉圖像的特征模版與系統(tǒng)中已存儲(chǔ)的特征模版進(jìn)行比對(duì),并輸出最佳匹配對(duì)象。在本文主要講解使用最近鄰法分類(lèi)器歐幾里得距離來(lái)判別人臉圖像,在實(shí)際廣泛使用的還有基于SVM即支持向量機(jī),基于神經(jīng)網(wǎng)絡(luò)和圖匹配的方法。1.4 本章小結(jié)本章由人臉識(shí)別的研究概況和發(fā)展趨勢(shì),人臉識(shí)別技術(shù)的主要難點(diǎn),和人臉識(shí)別流程三個(gè)小節(jié)構(gòu)成。在人臉識(shí)別的研究概況和發(fā)展趨勢(shì)小節(jié)主要講解人臉識(shí)別的研究概況及基于PCA人臉識(shí)別算法實(shí)現(xiàn)的研究意義還有人臉識(shí)別技術(shù)未來(lái)的走向。在人臉識(shí)別技術(shù)的主要難點(diǎn)小節(jié)主要講解人臉識(shí)別的主要技術(shù)難點(diǎn)。人臉識(shí)別小節(jié)講解本文人臉識(shí)別的流程。2 人臉圖像2.1 人臉圖像獲取著計(jì)算機(jī)科技和微電子的發(fā)展,現(xiàn)在人

31、臉圖像采集設(shè)備也越來(lái)越多。常用的采集設(shè)備有數(shù)碼相機(jī),數(shù)碼攝影機(jī)等。但是采集設(shè)備成像原理各異,有些設(shè)備對(duì)某類(lèi)人臉圖像的采集效果比較好,進(jìn)而人臉識(shí)別率高,對(duì)不同類(lèi)的人臉圖像采集效果差,進(jìn)而人臉識(shí)別率低。不過(guò)隨著現(xiàn)在科技的發(fā)展,這個(gè)問(wèn)題已基本上被解決。另外,人臉圖像采集的形式不同也會(huì)影響識(shí)別率。人臉圖像的采集形式主要有兩種:一為靜態(tài)人臉圖像,二位動(dòng)態(tài)人臉圖像。靜態(tài)人臉圖像的采集相對(duì)比較簡(jiǎn)單,用數(shù)碼相機(jī)即可獲取。動(dòng)態(tài)人臉圖像相比靜態(tài)人臉圖像獲取難度較大,但其更加貼近實(shí)際需求,應(yīng)用場(chǎng)合更加廣闊。2.2 人臉圖像數(shù)據(jù)庫(kù)人臉數(shù)據(jù)庫(kù)是人臉識(shí)別研究,開(kāi)發(fā)和評(píng)測(cè)不可缺少的。每個(gè)人臉識(shí)別系統(tǒng)都需要一個(gè)人臉數(shù)據(jù)庫(kù)。人

32、臉圖像數(shù)據(jù)庫(kù)的設(shè)計(jì)對(duì)人臉識(shí)別系統(tǒng)的識(shí)別率有著非常大影響。設(shè)計(jì)一個(gè)在所有變化情況下都能正確識(shí)別的系統(tǒng)是非常困難的,而且也沒(méi)有必要。所有人臉識(shí)別系統(tǒng)都是在一定的約束條件進(jìn)行的。所以有必要建立滿(mǎn)足不同需要的人臉數(shù)據(jù)庫(kù)。常用人臉數(shù)據(jù)庫(kù)如下:國(guó)外人臉數(shù)據(jù)庫(kù)的有FERET人臉數(shù)據(jù)庫(kù), MIT人臉數(shù)據(jù)庫(kù),YALE人臉數(shù)據(jù)庫(kù),PIE人臉數(shù)據(jù)庫(kù),ORL人臉數(shù)據(jù)庫(kù),AR人臉數(shù)據(jù)庫(kù)和Essex人臉數(shù)據(jù)庫(kù)。FERET人臉數(shù)據(jù)庫(kù)是人臉識(shí)別中最常用的數(shù)據(jù)庫(kù),包含多姿態(tài)和多光照的人臉灰度圖像,但其多為西方人臉圖像,每個(gè)人的人臉圖像變化較少。MIT人臉數(shù)據(jù)庫(kù)有麻省理工大學(xué)媒體實(shí)驗(yàn)室建立,由16位志愿者的2592副多姿態(tài),多光

33、照和不同大小的圖像組成。PIE人臉數(shù)據(jù)庫(kù)有卡內(nèi)基梅隆大學(xué)建立,由68位志愿者的41368副不同姿態(tài),多光照和不同表情的圖像組成。ORL人臉數(shù)據(jù)庫(kù)由劍橋大學(xué)AT&T實(shí)驗(yàn)室建立由40位志愿者的400幅圖像組成,其中部分志愿者的圖像還有姿態(tài),表情和光照的變化。由于其人臉變化模式較少,現(xiàn)已很少使用。AR人臉數(shù)據(jù)庫(kù)為西班牙巴塞羅那計(jì)算機(jī)視覺(jué)中心建立,由116人的3228幅圖像構(gòu)成。采集是在嚴(yán)格控制攝像機(jī)參數(shù),光照變化,攝像機(jī)距離等條件下進(jìn)行的。Essex人臉數(shù)據(jù)庫(kù)是英國(guó)埃塞克斯大學(xué)的人臉數(shù)據(jù)庫(kù)。任何人都可以下載它的人臉數(shù)據(jù)庫(kù),但是你不能發(fā)布,打印,銷(xiāo)售或發(fā)行這些圖像。這個(gè)人臉數(shù)據(jù)庫(kù)由Libor Spea

34、cek博士主持的計(jì)算機(jī)視覺(jué)研究項(xiàng)目在維護(hù)。這個(gè)數(shù)據(jù)庫(kù)由faces94,faces95,faces96,grimace四個(gè)庫(kù)組成。這樣做的目的是為了增加難度。Faces96和grimace是這個(gè)數(shù)據(jù)庫(kù)最難識(shí)別的。它們的背景和比例是變化的,人臉表情是極度變化的。英國(guó)埃塞克斯大學(xué)計(jì)算機(jī)視覺(jué)研究項(xiàng)目鼓勵(lì)研究者公布使用這個(gè)數(shù)據(jù)庫(kù)取得人臉識(shí)別結(jié)果。我們?cè)诒疚牟捎玫氖撬膄ace94數(shù)據(jù)庫(kù)。faces94數(shù)據(jù)庫(kù)中人臉圖像是在受試者坐在距離相機(jī)固定位置,并要求講話(huà)的情況下采集而成。講話(huà)的目的是為了采集面部表情的變化。每個(gè)圖像的大小為180*200,圖像的背景是藍(lán)色的。有輕微的姿態(tài)變換,無(wú)光照變換。國(guó)內(nèi)人臉數(shù)據(jù)

35、庫(kù)有中科院計(jì)算技術(shù)研究所銀晨科技面向識(shí)別聯(lián)合實(shí)驗(yàn)室建立的CASPEAL人臉數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)是基于目前的人臉數(shù)據(jù)庫(kù)大多都較小或圖像變化因素單一,人臉圖像的多為西方人,其面部特征與東方人存在一定的差別,需要建立一個(gè)大規(guī)模,多因素的東方人臉數(shù)據(jù)庫(kù)的需求建立的,共采集了1040位志愿者(595名男性,445名女性)的99450幅圖像。該數(shù)據(jù)庫(kù)根據(jù)不同的變化因素又分為7種模式子庫(kù)。這7種變化因素為姿態(tài),表情,飾物,光照,背景,距離和時(shí)間跨度,其中以姿態(tài),表情,飾物和光照為主,故稱(chēng)為PEAL(pose,expression,accessory和lighting的簡(jiǎn)寫(xiě))。CASEPEALR1為CASEPEA

36、L的共享版,可以提供給研究人員用以研究使用。其中研究人員指的是研究生導(dǎo)師或其他固定職位的研究員,不包括學(xué)生。2.3 人臉圖像預(yù)處理一般,系統(tǒng)采集到的原始圖像都會(huì)受到各種各樣的噪聲的影響而失真。并且由于各種條件的限制,采集到的原始圖像不能直接進(jìn)行使用,必須做預(yù)處理,即消除噪聲,校正失真,將圖像變化為標(biāo)準(zhǔn)形式。這樣才有利于穩(wěn)定的進(jìn)行特征提取。常用的人臉預(yù)處理有:灰度變化,二值化,圖像銳化等。2.3.1 灰度變化人臉識(shí)別的研究常以灰度圖像為處理對(duì)象。因?yàn)椴噬珗D像的顏色信息常常受到復(fù)雜背景的影響。利用彩色圖像進(jìn)行人臉識(shí)別存在較多缺陷,而灰度圖像為一種最簡(jiǎn)單有效的對(duì)比增強(qiáng)方法。彩色圖像有紅綠藍(lán)三原色組合

37、而成,灰度圖像只含有亮度信息,并且灰度圖像的亮度為連續(xù)變化的,所以灰度圖像要對(duì)亮度值進(jìn)行量化,為0-255,共256個(gè)等級(jí)。0為全黑,255為全亮。常用的經(jīng)驗(yàn)公式為gray=0.39*R+0.5*G+0.11*B.常用變換的方法如下:線(xiàn)性變換:假設(shè)圖像為灰度變化范圍為,變換后的圖像為灰度變化范圍為,則它們之間關(guān)系為 (2-1)分段線(xiàn)性變換:假設(shè)圖像為灰度變化范圍為,變換后的圖像為,目標(biāo)的灰度變化范圍為,想使灰度變化到,則對(duì)應(yīng)關(guān)系為 (2-2)非線(xiàn)性變換:使用非線(xiàn)性函數(shù)作為映射函數(shù)如對(duì)數(shù)函數(shù),進(jìn)行灰度變換。對(duì)數(shù)變換和指數(shù)變換分別為 (2-3) (2-4)其中a, b, c用來(lái)調(diào)整曲線(xiàn)的位置和形狀

38、。指數(shù)變換能對(duì)圖像的高灰度區(qū)以較大的拉伸。對(duì)數(shù)變換可以使圖像低灰度區(qū)有較大拉伸而高灰度區(qū)進(jìn)行壓縮。對(duì)數(shù)變換可以使圖像灰度分布相匹配于人的視覺(jué)特性。2.3.2 二值化二值化是通過(guò)選取適當(dāng)?shù)拈y值將灰度圖像的灰度值從0到255變換為只有0和255的黑白圖像。在人臉識(shí)別中二值化用來(lái)把人的頭發(fā),眼睛,臉的輪廓及背影與人臉的亮域分開(kāi)。在圖像二值化過(guò)程中選擇合適的閥值非常重要。常用的圖像二值化選擇方法如下:整體閥值法:在二值化時(shí)候只使用一個(gè)全局閥值t。假設(shè)圖像為,灰度范圍為,t為和之間選擇的一個(gè)合適的灰度值,轉(zhuǎn)換后的圖像為,則轉(zhuǎn)換關(guān)系為 (2-5)局部閥值法:它是根據(jù)當(dāng)前像素的灰度值和此像素周?chē)c(diǎn)局部灰度特

39、征值來(lái)共同決定閥值。動(dòng)態(tài)閥值法:它的閥值不僅和該像素和周?chē)袼赜嘘P(guān),還和該像素的坐標(biāo)位置有關(guān)。整體閥值法適合圖像質(zhì)量比較好的情況,此時(shí)圖像在直方圖一般有兩個(gè)峰值。局部閥值法可以處理比較復(fù)雜的情況,但有些情況會(huì)發(fā)生失真。動(dòng)態(tài)閥值法適應(yīng)性和性能都比較好,實(shí)際中對(duì)于人臉識(shí)別常采用此法進(jìn)行二值化。2.3.3 圖像銳化圖像銳化用于解決圖像提取,圖像傳輸及相關(guān)處理過(guò)程受到某些因素影響而變得模糊。圖像模糊是圖像遭受了平均或積分運(yùn)算造成,可以通過(guò)對(duì)圖像進(jìn)行逆運(yùn)算來(lái)使圖像變得清晰。但是圖像銳化存在一個(gè)前提條件,圖像必須要有較高的信噪比,否則會(huì)造成信噪比更低,圖像噪聲增加比圖像信號(hào)更多。在實(shí)際中,一般先濾除噪聲后

40、在進(jìn)行圖像銳化處理。常用的圖像銳化方法為拉普拉斯銳化。假設(shè)拉普拉斯算子為即 (2-6)離散數(shù)字圖像為,其一階偏導(dǎo)數(shù)為 (2-7)則其二階偏導(dǎo)數(shù)為 (2-8)所以 (2-9)對(duì)于擴(kuò)算現(xiàn)象引起的人臉圖像模糊,可通過(guò)進(jìn)行圖像銳化,其中k為擴(kuò)算效應(yīng)的相關(guān)系數(shù)。k值要選擇合理,若k過(guò)大,圖像輪廓邊緣會(huì)過(guò)沖。若k過(guò)小會(huì)導(dǎo)致銳化效果不明顯。2.4 本章小結(jié)本小結(jié)主要介紹了常用的人臉圖像采集方式,國(guó)內(nèi)外常用的人臉數(shù)據(jù)庫(kù)和常用的人臉預(yù)處理有:灰度變化,二值化,圖像銳化。3 人臉識(shí)別3.1 PCA算法理論主成分分析(Principal Component Analysis)是一種掌握事物主要矛盾的統(tǒng)計(jì)分析方法,它

41、可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡(jiǎn)化復(fù)雜的問(wèn)題。計(jì)算主成分的目的是將高維數(shù)據(jù)投影到較低維空間。給定n個(gè)變量的m個(gè)觀(guān)察值,形成一個(gè)n*m的數(shù)據(jù)矩陣,n通常比較大。對(duì)于一個(gè)由多個(gè)變量描述的復(fù)雜事物,認(rèn)識(shí)難度會(huì)很大,于是我們可以抓住事物主要方面進(jìn)行重點(diǎn)分析,如果事物的主要方面剛好體現(xiàn)在幾個(gè)主要變量上,那么我們只需要將體現(xiàn)事物主要方面的較少的幾個(gè)主要變量分離出來(lái),對(duì)此進(jìn)行詳細(xì)分析。但是在一般情況下,我們并不能直接找出這樣的關(guān)鍵變量。這時(shí)我們可以用原有變量的線(xiàn)性組合來(lái)表示事物的主要方面,PCA就是這樣一種分析方法。PCA主要用于數(shù)據(jù)降維,對(duì)于由一系列特征組成的多維向量,其中某些元素本

42、身沒(méi)有區(qū)分性,比如某個(gè)元素在所有的樣本中都相等,或者彼此差距不大,那么這個(gè)元素本身就沒(méi)有區(qū)分性,如果用它做特征來(lái)區(qū)分,貢獻(xiàn)會(huì)非常小。所以我們的目的是找那些變化大的元素,即方差大的那些維,而去除掉那些變化不大的維,從而使特征留下的都是“精品”,使得計(jì)算量也相應(yīng)變小。對(duì)于一個(gè)k維的特征來(lái)說(shuō),相當(dāng)于它的每一維特征與其他維都是正交的(相當(dāng)于在多維坐標(biāo)系中,坐標(biāo)軸都是垂直的),那么我們可以變化這些維的坐標(biāo)系,從而使這個(gè)特征在某些維上方差大,而在某些維上方差很小。例如,一個(gè)45度傾斜的橢圓,在第一坐標(biāo)系,如果按照x,y坐標(biāo)來(lái)投影,這些點(diǎn)的x和y的屬性很難用于區(qū)分他們,因?yàn)樗麄冊(cè)趚,y軸上坐標(biāo)變化的方差都差

43、不多,我們無(wú)法根據(jù)這個(gè)點(diǎn)的某個(gè)x屬性或y屬性來(lái)判斷這個(gè)點(diǎn)是哪個(gè),而如果將坐標(biāo)軸旋轉(zhuǎn),以橢圓長(zhǎng)軸為x軸,則橢圓在長(zhǎng)軸上的分布比較長(zhǎng),方差大,而在短軸上的分布短,方差小,所以可以考慮只保留這些點(diǎn)的長(zhǎng)軸屬性,來(lái)區(qū)分橢圓上的點(diǎn),這樣區(qū)分性比x,y軸的方法要好! 所以我們的做法就是求得一個(gè)k維特征的投影矩陣,這個(gè)投影矩陣可以將特征從高維降到低維。投影矩陣也可以叫做變換矩陣。新的低維特征必須每個(gè)維都正交,特征向量都是正交的。通過(guò)求樣本矩陣的協(xié)方差矩陣,然后求出協(xié)方差矩陣的特征向量,這些特征向量就可以構(gòu)成這個(gè)投影矩陣了。特征向量的選擇取決于協(xié)方差矩陣的特征值的大小。經(jīng)過(guò)PCA分析,一個(gè)多維變量的復(fù)雜問(wèn)題被簡(jiǎn)

44、化為低維空間的簡(jiǎn)單問(wèn)題。PCA的目標(biāo)是尋找r(rn)個(gè)新變量,使它們反映事物的主要特征,壓縮原有數(shù)據(jù)矩陣的規(guī)模。每個(gè)新變量是原有變量的線(xiàn)性組合,體現(xiàn)原有變量的綜合效果,具有一定的實(shí)際含義。這r個(gè)新變量稱(chēng)為“主成分”,它們可以在很大程度上反映原來(lái)n個(gè)變量的影響,并且這些新變量是互不相關(guān)的,也是正交的。通過(guò)主成分分析,可以壓縮數(shù)據(jù)空間,將多元數(shù)據(jù)的特征在低維空間里直觀(guān)地表示出來(lái)。舉一個(gè)例子:對(duì)于一個(gè)訓(xùn)練集,100個(gè)對(duì)象模板,特征是10維,那么我們可以建立一個(gè)10*100的矩陣作為樣本。求這個(gè)樣本的協(xié)方差矩陣,得到一個(gè)10*10的協(xié)方差矩陣,然后求出這個(gè)協(xié)方差矩陣的特征值和特征向量,應(yīng)該有10個(gè)特征

45、值和10個(gè)特征向量,我們根據(jù)特征值的大小,取前四個(gè)特征值所對(duì)應(yīng)的特征向量,構(gòu)成一個(gè)10*4(投影矩陣)的矩陣,這個(gè)矩陣就是我們要求的特征矩陣,100*10的樣本矩陣乘以這個(gè)10*4的特征矩陣,就得到了一個(gè)100*4的新的降維之后的樣本矩陣,每個(gè)特征的維數(shù)下降了。當(dāng)給定一個(gè)測(cè)試的特征集之后,比如1*10維的特征,乘以上面得到的10*4的特征矩陣,便可以得到一個(gè)1*4的特征,用這個(gè)特征去分類(lèi)。所以做PCA實(shí)際上是求得這個(gè)投影矩陣,用高維的特征乘以這個(gè)投影矩陣,便可以將高維特征的維數(shù)下降到指定的維數(shù)。3.2 PCA人臉識(shí)別算法的實(shí)現(xiàn)3.2.1 K-L變換PCA方法是由Turk和Pentlad提出來(lái)的

46、,它的基礎(chǔ)就是Karhunen-Loeve變換(簡(jiǎn)稱(chēng)K-L變換),是一種常用的正交變換。首先對(duì)K-L變換作一個(gè)簡(jiǎn)單介紹:假設(shè)X為n維的隨機(jī)變量,X可以用n個(gè)基向量的加權(quán)和來(lái)表示:X= ii (3-1)式中:i是加權(quán)系數(shù),i是基向量,此式可以用矩陣的形式表示:X =(1 ,2,3 ,n)( 1, 2 , n)= (3-2)系數(shù)向量為:=TX (3-3)綜上所述,K-L展開(kāi)式的系數(shù)可用下列步驟求出:求隨機(jī)向量X的自相關(guān)矩陣R=EXTX,由于沒(méi)有類(lèi)別信息的樣本集的均值向量,常常沒(méi)有意義,所以也可以把數(shù)據(jù)的協(xié)方差矩陣=E(x-)(x-)T作為K-L坐標(biāo)系的產(chǎn)生矩陣,這里是總體均值向量。求出自相關(guān)矩陣或

47、者協(xié)方差矩陣R的本征值i和本征向量i =(1 ,2,3 ,n)展開(kāi)式系數(shù)即為=TXK-L變換的實(shí)質(zhì)是建立一個(gè)新的坐標(biāo)系,將一個(gè)物體主軸沿特征矢量對(duì)齊的轉(zhuǎn)變換,這個(gè)變換解除了原有數(shù)據(jù)向量的各個(gè)分量之間相關(guān)性,從而有可能去掉那些帶有較少信息的坐標(biāo)系以達(dá)到降低特征空間維數(shù)的目的。3.2.2 SVD 定理人臉訓(xùn)練圖像的協(xié)方差矩陣為,其中人臉訓(xùn)練樣本為,維度為,則協(xié)方差矩陣C的維度為。這就出現(xiàn)問(wèn)題,C的維度過(guò)高,在實(shí)際中直接計(jì)算它的特征值和特征向量非常困難。因此,本文使用SVD定理(奇異值分解定理)來(lái)解決這個(gè)問(wèn)題。假設(shè)B為維秩為p的矩陣,則存在兩個(gè)正交矩陣和一個(gè)對(duì)角矩陣:正交矩陣為 (3-4) (3-5

48、)其中 (3-6) (3-7)對(duì)角矩陣為 則可以得到,而且和有共同的非零特征值,和分別為和對(duì)應(yīng)特征值的正交特征向量。由上述定理可以得到 (3-8)則可以由協(xié)方差矩陣,構(gòu)造出矩陣,從而容易求出L的特征值和特征向量,再根據(jù)上述式可以求得協(xié)方差C的特征值和特征向量。3.2.3 PCA算法在人臉識(shí)別中PCA方法是一種基于整幅人臉圖像的識(shí)別算法用于降維。一個(gè)NN的二維臉部圖片可以看成是N的一個(gè)一維向量,一張11292的圖片可以看成是一個(gè)10304維的向量,同時(shí)也可以看成是一個(gè)10304維空間中一點(diǎn)。圖片映射到這個(gè)巨大的空間后,由于人臉的構(gòu)造相對(duì)來(lái)說(shuō)比較接近,因此,可以用一個(gè)相應(yīng)的低維子空間來(lái)表示。我們把

49、這個(gè)子空間叫做“臉空間”。PCA的主要思想就是找到能夠最好地說(shuō)明圖片在圖片空間中的分布情況的那些向量。這些向量能夠定義“臉空間”,每個(gè)向量的長(zhǎng)度為N,描述一張NN的圖片,并且是原始臉部圖片的一個(gè)線(xiàn)性組合。對(duì)于一副M*N的人臉圖像,將其每列相連構(gòu)成一個(gè)大小為D=M*N維的列向量。D就是人臉圖像的維數(shù),也即是圖像空間的維數(shù)。設(shè)n是訓(xùn)練樣本的數(shù)目;Xj表示第j幅人臉圖像形成的人臉向量,則所需樣本的協(xié)方差矩陣為:Sr= (3-9)其中u為訓(xùn)練樣本的平均圖像向量:u = (3-10)令A(yù)=x1-u x2-uxn-u,則有Sr=AAT,其維數(shù)為D*D。根據(jù)K-L變換原理,需要求得的新坐標(biāo)系由矩陣AAT的非

50、零特征值所對(duì)應(yīng)得特征向量組成。直接計(jì)算的計(jì)算量比較大,所以采用奇異值分解(SVD)定理,通過(guò)求解ATA的特征值和特征向量來(lái)獲得AAT的特征值和特征向量。依據(jù)SVD定理,令li(i=1,2,r)為矩陣ATA的r個(gè)非零特征值,vi為ATA對(duì)應(yīng)于li的特征向量,則AAT的正交歸一特征向量ui為:(i=1,2,r) (3-11)則特征臉空間為:w=(u1 ,u2 ur,)3.2.4 人臉識(shí)別過(guò)程人臉識(shí)別過(guò)程分為訓(xùn)練和測(cè)試兩個(gè)階段。在訓(xùn)練階段,主要是提取數(shù)據(jù)庫(kù)人臉圖像的特征,并形成特征庫(kù)。在測(cè)試階段,主要是提取待識(shí)別圖像的特征和計(jì)算提取的特征和特征庫(kù)中特征之間的距離測(cè)度,并輸出最小距離測(cè)度對(duì)應(yīng)的人臉圖像

51、作為結(jié)果。具體步驟如下:訓(xùn)練階段將規(guī)范化的圖像矩陣A中的每一列向量投影到特征子空間,形成特征庫(kù)。測(cè)試階段假設(shè)測(cè)試人臉圖像為Y,在人臉識(shí)別前,先對(duì)其進(jìn)行標(biāo)準(zhǔn)化,即。把標(biāo)準(zhǔn)化后的人臉圖像向特征子空間進(jìn)行投影得到向量。本文使用最近領(lǐng)法分類(lèi)器歐幾里德距離進(jìn)行判決分類(lèi)。測(cè)試圖像與每個(gè)人臉圖像間的距離為 (k=1,2,P),并將最小距離對(duì)應(yīng)的訓(xùn)練圖像作為測(cè)試圖像的匹配圖像。3.3 程序運(yùn)行效果訓(xùn)練的人臉數(shù)據(jù)庫(kù)為下列20張人臉圖像圖3-1 訓(xùn)練人臉數(shù)據(jù)庫(kù)讀入待識(shí)別的人臉圖像圖3-2 讀入帶識(shí)別人臉圖像輸出識(shí)別結(jié)果圖3-3 輸出識(shí)別結(jié)果3.4 程序代碼3.4.1 代碼類(lèi)關(guān)系圖3-4 代碼類(lèi)關(guān)系圖FacePca

52、類(lèi)主要實(shí)現(xiàn)PCA人臉的訓(xùn)練計(jì)算出人臉特征子空間FaceRec類(lèi)主要實(shí)現(xiàn)對(duì)帶識(shí)別人臉進(jìn)行計(jì)算歐幾里得距離進(jìn)行識(shí)別MainWindow類(lèi)主要實(shí)現(xiàn)界面和帶識(shí)別人臉圖像的錄入3.4.2 代碼的OpenCV相關(guān)使用OpenCV的圖像基本容器Mat(數(shù)據(jù)矩陣)進(jìn)行圖像基本操作和矩陣變換使用OpenCV的cvSVD接口執(zhí)行矩陣的奇異值分解使用OpenCV的cvNorm接口計(jì)算計(jì)算出歐幾里得距離3.4.3 關(guān)鍵函數(shù)代碼FacePca主要方法/讀取訓(xùn)練圖像數(shù)據(jù)m_trainDatavoid FacePca:SetTrainData(const char*fileName, const int trainNumb

53、er)cv:Mat trainData(IMAGE_SIZE,trainNumber,CV_32FC1);for(int i=0; i trainNumber; i+)std:string imageFileName(fileName);char chNum10;_itoa(i+1,chNum,10);imageFileName.append(chNum);imageFileName += .bmp;/創(chuàng)建灰度圖像大小是*112的,跟訓(xùn)練圖像大小一致IplImage *trainImage = cvCreateImage(cvSize(IMAGE_WIDTH,IMAGE_HEIGHT),IPL

54、_DEPTH_32F,1);/讀入訓(xùn)練圖像,存到trainImage trainImage = cvLoadImage(imageFileName.data(),0);int j=0;for (size_t row=0; row height; row+)/獲得灰度值數(shù)據(jù)指針uchar* ptr = (uchar*)(trainImage-imageData) + row * (trainImage-width);for (size_t cols=0; cols width; cols+)/*讀出gray的灰度值存到Data里*/float k = ptrcols;trainData.at(j

55、,i) = k;j+;/釋放灰度圖內(nèi)存cvReleaseImage(&trainImage);m_trainData = trainData;m_trainNumber = trainNumber;/計(jì)算平均圖像向量m_dataMeanvoid FacePca:CalDataMean()/矩陣Data的行平均cv:Mat dataMean(IMAGE_SIZE, 1,CV_32FC1);for(int i = 0; i IMAGE_SIZE; i+)float sum = 0;for(int j = 0;j m_trainNumber;j+)sum += m_trainData.at(i,j)

56、;sum = sum / m_trainNumber;dataMean.at(i,0) = sum;m_dataMean = dataMean;/計(jì)算協(xié)方差矩陣 通過(guò)SVD定理求解特征值和特征向量 計(jì)算出特征臉空間void FacePca:CalEigenFace()/求矩陣Data跟矩陣Data_mean的差值cv:Mat Data_normal(IMAGE_SIZE, m_trainNumber,CV_32FC1);for(int i=0;i IMAGE_SIZE;i+)for(int j=0;j m_trainNumber;j+)Data_normal.at(i,j)= m_trainD

57、ata.at(i,j)- m_dataMean.at(i,0);/求矩陣Data_normal的協(xié)方差矩陣Data_covcv:Mat Data_cov(m_trainNumber,m_trainNumber,CV_32FC1);Data_cov = Data_normal.t()*Data_normal;/SVD定理求解矩陣V為矩陣Data_cov的特征向量矩陣矩陣D為矩陣Data_cov的特征值對(duì)角矩陣cv:Mat D(m_trainNumber,m_trainNumber,CV_32FC1), V(m_trainNumber,m_trainNumber,CV_32FC1);cvSVD(&

58、CvMat(Data_cov), &CvMat(D), NULL, &CvMat(V);int count=0;for(int i = 0;i D.cols; i+)if( D.at (i,i) 1)/非特征值的數(shù)量count+;cv:Mat tem_V( m_trainNumber,count,CV_32FC1 ), tem_D( count,1,CV_32FC1 );for(int i = 0,k = 0;i V.cols; i+)if(D.at (i,i) 1) V.col(i).copyTo(tem_V.col(k);tem_D.at (k,0)= D.at (i,i);k+;/求特征

59、子空間cv:Mat eigenFace(IMAGE_SIZE,tem_V.cols,CV_32FC1);eigenFace = Data_normal * tem_V;for(int i=0;item_V.cols;i+)for(int j=0;jIMAGE_SIZE;j+)eigenFace.at(j,i) = eigenFace.at(j,i) / sqrt(tem_D.at(i,0);m_eigenFace = eigenFace;/去中心的圖像投影轉(zhuǎn)化為臉空間cv:Mat projectedImage(tem_V.cols,m_trainNumber,CV_32FC1);project

60、edImage = eigenFace.t()* Data_normal;m_projectedImage = projectedImage;FaceRec主要方法/讀入帶識(shí)別圖像m_recImagevoid FaceRec:InputRecImage( const char* fileName)/創(chuàng)建測(cè)試圖像大小是*112的IplImage *testImage=cvCreateImage(cvSize(IMAGE_WIDTH,IMAGE_HEIGHT),IPL_DEPTH_32F,1);/導(dǎo)入測(cè)試圖像testImage=cvLoadImage(fileName,0);cv:Mat recI

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論