人臉識別的綜合性方法:小波變換、PCA及ANN方法(肖韜 南京大學(xué) 計算機系)-_第1頁
人臉識別的綜合性方法:小波變換、PCA及ANN方法(肖韜 南京大學(xué) 計算機系)-_第2頁
人臉識別的綜合性方法:小波變換、PCA及ANN方法(肖韜 南京大學(xué) 計算機系)-_第3頁
人臉識別的綜合性方法:小波變換、PCA及ANN方法(肖韜 南京大學(xué) 計算機系)-_第4頁
人臉識別的綜合性方法:小波變換、PCA及ANN方法(肖韜 南京大學(xué) 計算機系)-_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、人臉識別的綜合性方法:小波變換、PCA及ANN方法1Masoud Mazloom, 2Saeed Ayat1 Department of Computer Engineering, Shahid Chamran University, Ahwaz, IRAN2 Department of Computer Engineering, Payame Noor University, Najafabad, IRANmmazloom scu.ac.irdr.ayatpnu.ac.ir摘要本文提出了一種綜合利用小波變換、PCA 及神經(jīng)網(wǎng)絡(luò)的能夠改善人臉識別精確度的方法。預(yù)處理、特征提取及分類規(guī)則是人臉識

2、別的三個關(guān)鍵方面。本文提出了一種綜合考慮這三個方面的方法。在預(yù)處理以及特征提取步驟,我們混合應(yīng)用了小波變換和PCA方法。在分類階段,我們使用了神經(jīng)網(wǎng)絡(luò)(MLP方法來實現(xiàn)對各種人臉實現(xiàn)確定性的識別。與基于耶魯及ORL人臉數(shù)據(jù)庫的原始PCA方法相比,本文提出的方法能夠極大地減少計算負(fù)荷,同時能夠大大提高人臉識別的精確度。1.簡介在過去的幾年中,由于無所不在的安全控制的要求,用戶鑒別變得越來越重要。傳統(tǒng)上,身份證及密碼對于身份鑒別來說是很常見的手段,但是安全性卻不高,也很不方便。近年來,聲音、虹膜、指紋、掌紋及人臉等生物鑒別技術(shù)變得越來越重要,吸引了很多研究人員的極大興趣。在這幾種方法中,人臉識別是

3、最友好的,因為它可以在不打斷用戶活動的情況下就能夠完成鑒別。同時,人臉識別系統(tǒng)也很經(jīng)濟(jì),因為它只需要低成本的攝像頭和計算機。對于實體鑒別、訪問控制以及監(jiān)控等,該方法也是高度可行的。在過去的20年里,在人工及機器人臉識別的許多方面,物理學(xué)家、神經(jīng)學(xué)家以及工程技術(shù)人員已經(jīng)開展了廣泛的研究1, 2, 12, 19, 20, 21, 22,25。物理學(xué)家及神經(jīng)學(xué)家已經(jīng)研究了諸如人臉的唯一性、嬰兒怎樣識別人臉以及對人臉記憶的組織等課題。而工程技術(shù)人員已經(jīng)設(shè)計并發(fā)展了人臉識別的算法。本論文將繼續(xù)開展工程技術(shù)人員在機器人臉識別方面的工作。由機器進(jìn)行的自動人臉識別可以劃分為兩個主要的方法,即基于內(nèi)容的以及基于

4、人臉的1,2。對于基于內(nèi)容的識別方法,識別是基于各種面部特征之間的關(guān)系,如眼睛、嘴、鼻子、輪廓及臉部邊界3,4,5,6。每一張人臉都有相似的面部特征;一個小的抽取特征就可能產(chǎn)生重大的分類錯誤。基于人臉的識別方法試圖捕捉并將整張人臉定義為一個整體7,8,5,9。人臉被視為關(guān)于強度變化的二維模型。在該方法中,人臉將通過統(tǒng)計規(guī)則來進(jìn)行匹配。主成份分析(PCA, Principal Component Analysis方法已經(jīng)被證明是一種有效的基于人臉的識別方法。Sirovich和Kirby首先提出了使用Karhunen- Loeve (KL 變換來表征人臉10。在他們的方法中,人臉由帶權(quán)特征值的線性

5、組合來表征,被稱為特征臉(eigenfaces。Turk和Pentland利用PCA提出了一個人臉識別系統(tǒng)8。然而,普通的基于PCA的方法會受到兩點約束,即較差的辨別力以及較大的計算負(fù)荷。眾所周知,PCA能夠給出對人臉非常好的表征。給定同一個人的兩張圖片,在使用PCA表征的情況下它們的相似度非常高。然而,給定不同人的兩張圖片,所測出的相似度依然很高。這意味著,使用PCA表征方法會帶來非常差的辨別力。Swets和Weng11也注意到了PCA方法的這個缺陷,通過增加線性辨別分析(Linear Discriminatory Analysis, LDA,改進(jìn)了PCA方法的辨別力。但是,為了獲得準(zhǔn)確的結(jié)

6、果,每一個類都必須有大量的樣本。另一方面,OToole等12提出了選擇特征臉的不同方法。他們指出,較大特征值的特征向量對于區(qū)分人臉圖片并不是最好的。他們還證明了,盡管低維度的表征方法對于人臉識別不是最優(yōu)的,但是在人臉的物理范疇方面,如性別和人種,卻能給出很好的結(jié)果。但是, OToole等并沒有解決怎樣為辨別選擇特征向量的標(biāo)準(zhǔn)?;赑CA方法的第二個問題是尋找特征向量時的較高的計算負(fù)荷。該方法的計算復(fù)雜度是O(d2,d是訓(xùn)練圖片的像素數(shù),其值通常是128128。對于當(dāng)前大部分的計算機而言,該方法的計算復(fù)雜度超出了它們的計算能力。幸運的是,從矩陣論我們知道,如果訓(xùn)練圖片的數(shù)量N小于d的值,計算復(fù)雜

7、度將減小到O(N2。然而,如果N增長,那么計算負(fù)荷將以三次方的速度增長。考慮到當(dāng)前基于PCA的方法的局限性,我們提出了一個新的方法,將PCA應(yīng)用于小波子帶來進(jìn)行特征提取。在該方法中,我們使用小波變換,將一幅圖像分解成一系列帶有不同頻率組件的子帶。文獻(xiàn)29中給出的結(jié)果顯示,三級小波變換在人臉識別中具有較好的效果。我們所提出的方法工作在更低的分辨率下,如1616,而不是原來圖像的分辨率,128128。因此,當(dāng)訓(xùn)練圖片的數(shù)量大于1616時,我們所提出的方法能夠減小計算復(fù)雜性,而這正是現(xiàn)實世界中的很多應(yīng)用所希望的。另外,實驗結(jié)果也證明了,相比于對整幅圖像應(yīng)用PCA,將PCA 應(yīng)用于WT子圖可以帶來更好

8、的識別精度與更好的鑒別能力。本論文的組織如下:第二部分回顧了PCA 的背景;第三部分回顧了對圖像進(jìn)行小波分解;我們提出的方法將在第四部分進(jìn)行討論;第五部分給出了實驗結(jié)果;最后,第六部分給出了結(jié)論。2.回顧PCAPCA用于尋找對數(shù)據(jù)的低維表示。文獻(xiàn)13中如下強調(diào)了PCA的一些重要細(xì)節(jié)。令是全體向量。在圖像應(yīng)用中,將圖像數(shù)據(jù)按照行一次連接起來就形成了X(dxd是圖像寬與高的積。令全體向量的均值向量為將X的每個元素均減去該均值,我們就得到了一個修改過的全體向量,這里。而X的協(xié)方差矩陣M 定義為,其中M是d2xd2的矩陣,它的元素是從矩陣論可知,M是正定矩陣,只有非負(fù)的實數(shù)特征根13。向量M的特征向量

9、形成了R dxd的標(biāo)準(zhǔn)正交基,這個基被稱作K-L基。因為K-L特征向量的自協(xié)方差矩陣是對角化的,因此,就K-L基而言,在樣本空間向量的坐標(biāo)是不相關(guān)的隨機變量。令Yn, n = 1, 2, , N表示向量空間,K為d2xd2矩陣(它的列是向量Y1, Y2, , Y N。K的共軛矩陣,將標(biāo)準(zhǔn)坐標(biāo)映射到K-L坐標(biāo),被稱作K-L變換。在許多應(yīng)用中,K的特征向量將根據(jù)特征值以降序排列。在計算M的dxd特征值時,我們必須首先計算一個d2xd2矩陣。一般來說, d=128,因此,在計算特征向量和特征值時,我們必須首先計算出一個1616的矩陣。從矩陣論可知,如果訓(xùn)練圖片的數(shù)量N比M的維度要小很多,比如N dx

10、d,那么計算復(fù)雜度就可以減小到O(N。同時,矩陣M的維度也可以減小到NxN。文獻(xiàn)7給出了具體的數(shù)學(xué)推導(dǎo)過程?,F(xiàn)在,對人臉的特征化的實現(xiàn)過程就可以變得非常的靈活。在目前已有的工作中,訓(xùn)練圖片的數(shù)量一般很小,大約是200。然而,當(dāng)數(shù)據(jù)庫中的圖片的數(shù)量很大時,例如2000,則計算復(fù)雜度會急劇增加。3.對圖片進(jìn)行小波分解在過去的十年里,小波變換(WT是分析圖像十分流行的工具。關(guān)于小波變換在信號處理方面的數(shù)學(xué)背景以及優(yōu)勢已經(jīng)在很多的研究論文中被討論過了。在已有的系統(tǒng)中,小波變換基于如下的原因被用于進(jìn)行小波分解:通過使用小波變換,子圖的分辨率被降低了。進(jìn)而,在一個較低的圖像上進(jìn)行操作,計算復(fù)雜度也被大大降

11、低了。Harmon16已經(jīng)證明,具備1616的分辨率的圖像對于人臉識別來說已經(jīng)足夠。 與初始的具有128128分辨率的圖像相比,子圖的大小減小了64倍,這意味著計算負(fù)荷也將減小64倍。使用小波變換,圖像將根據(jù)不同的頻域被分解為子帶。這些子帶能夠滿足下一個主要步驟對于輸入的要求,這樣,就使得系統(tǒng)的計算負(fù)荷達(dá)到最小化。小波解析為空域和頻域都提供了局部信息,而傅立葉解析則只能為頻域提供全局信息。在整片論文中,我們將應(yīng)用著名的Daubechies D4小波17,18與Haar小波27。我們提出了使用系數(shù)的方法:h0 = 0.48296291314453h1 = 0.83651630373781h2 =

12、 0.22414386804201h3 = 0.12940952255126對于Daubechies小波以及系數(shù):h0 = 0.5,h1 = 0.5對于Haar小波,一幅圖像被分解為四個子帶。LL帶是對原始圖像較粗的近似。LH和HL帶分別記錄了圖像在水平和垂直方向上的變化。HH帶顯示了圖像中較高頻率的構(gòu)件,這是第一層的解析。對于LL子帶,解析可以進(jìn)一步地展開。在進(jìn)行了三級小波變換之后,一幅圖像就被分解成了如圖1所示中的由不同頻率構(gòu)成的子帶。如果一幅圖像的分辨率是128128,那么子帶1、2、3、4的大小就是1616,子帶5、6、7的大小就是3232,子帶8、9、10的大小為6464。4.提出的

13、方法人們提出了基于小波的PCA方法,以此來克服原始PCA方法所具有的局限性;更進(jìn)一步地說,我們利用神經(jīng)網(wǎng)絡(luò)來展開對人臉的分類。我們采用了一種多層感知機體系,它的輸入是化簡過的輸入單元,以及由小波和PCA綜合產(chǎn)生的特征向量。我們提出了一種方法,利用人臉圖像中PCA的一個特別的頻率帶,來解決PCA的第一個問題。圖1. 人臉識別系統(tǒng)的塊圖第二個局限性可以通過使用一幅低分辨率的圖像來解決。圖1展示了如何將新的基于PCA的方法與神經(jīng)網(wǎng)絡(luò)結(jié)合起來。我們所提出的系統(tǒng)包含兩個階段,即1訓(xùn)練階段特征提取、降維以及調(diào)整MPL神經(jīng)網(wǎng)絡(luò)的權(quán)值;2識別階段識別未知的人臉圖像。訓(xùn)練階段包括了對所引用圖片進(jìn)行特征提取,以及

14、對神經(jīng)網(wǎng)絡(luò)參數(shù)的調(diào)整。特征提取可以實現(xiàn)識別我們感興趣的領(lǐng)域中的圖片的基本表征。其次,在識別階段,未知的輸入圖片被轉(zhuǎn)化為訓(xùn)練階段的基本表征。在訓(xùn)練階段有三個重要的步驟。第一個步驟中,小波變換(WT被用于進(jìn)行解析被引用的圖像;由此,在三級小波解析中獲得的1616像素的子圖就可以被選中。在下一個步驟中,主成份分析(PCA, Principal Component Analysis 被應(yīng)用于子圖,以獲得根據(jù)最大特征值和子空間投影而得到的一系列基本表征。最后,由前面的幾個步驟而得到的對引用圖片的特征向量被應(yīng)用在使用倒傳播算法的訓(xùn)練神經(jīng)網(wǎng)絡(luò)。在識別階段的處理類似于訓(xùn)練階段,只是有一點除外:識別階段還利用神

15、經(jīng)網(wǎng)絡(luò)將未知的輸入與數(shù)據(jù)庫中的引用文件進(jìn)行匹配。當(dāng)識別階段收到一個未知的人臉圖片,小波變換(WT和主成份分析(PCA被應(yīng)用于將未知的人臉圖像轉(zhuǎn)化為在識別階段所識別基本表征,而分類也可以藉由經(jīng)過訓(xùn)練的MPL 神經(jīng)網(wǎng)絡(luò)來獲得14,15。5.實驗結(jié)果為了評估我們所提出的方法的性能, 我們使用了耶魯大學(xué)的人臉圖像數(shù)據(jù)庫26和ORL 人臉數(shù)據(jù)庫28。耶魯大學(xué)數(shù)據(jù)庫中的所有圖像都具備160121的分辨率,但是這些圖像的維度并不是2的冪,因此無法進(jìn)行高效的小波變換。為了解決這個問題,我們將這些圖片剪裁到9191,然后重新放大到128128。同理,ORL數(shù)據(jù)庫中的所有圖片的大小也剪裁到128128。在這項工作

16、中,三級小波分解被用于將圖片的分辨率從128128轉(zhuǎn)換為1616。表1與表2給出了利用基小波對耶魯和ORL數(shù)據(jù)庫中的數(shù)據(jù)使用我們所提出的算法所得到的結(jié)果。表3與表4給出了利用Daubechies基小波對耶魯和ORL數(shù)據(jù)庫中的數(shù)據(jù)使用我們所提出的算法所得到的結(jié)果。從實驗結(jié)果可以看出,使用Daubechies小波比使用Haar小波可以獲得更好的效果。在選定了基小波之后,就必須去確定主成份的數(shù)量,而主成份指定了神經(jīng)網(wǎng)絡(luò)中輸入層中神經(jīng)元的數(shù)量。圖5和圖6顯示了對耶魯和ORL數(shù)據(jù)庫中的測試圖像使用不同數(shù)量的主成份所獲得的識別性能。在下一個步驟中,我們必須指定我們的神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)。表1. 對耶魯數(shù)據(jù)庫

17、使用Haar基小波算法的結(jié)果表2. 對ORL數(shù)據(jù)庫使用Haar基小波算法的結(jié)果表3. 對ORL數(shù)據(jù)庫使用Daubechies4基小波算法的結(jié)果表4. 對耶魯數(shù)據(jù)庫使用Daubechies4基小波算法的結(jié)果表5. 對耶魯數(shù)據(jù)庫中的測試圖像使用不同數(shù)量的主成份所獲得的識別性能表6. 對ORL數(shù)據(jù)庫中的測試圖像使用不同數(shù)量的主成份所獲得的識別性能表7和表8顯示了針對耶魯和ORL數(shù)據(jù)庫中的測試圖像,在由前面的步驟中抽取出的輸入層的神經(jīng)元的數(shù)量固定的情況下,使用MLP神經(jīng)網(wǎng)絡(luò)所獲得的識別性能(作者使用了一個數(shù)據(jù)庫用于測試,另一個數(shù)據(jù)庫用于訓(xùn)練。當(dāng)將小波變換和PCA方法綜合使用時,其性能超過了使用PCA、

18、DWT和DCT的方法。表9展示了結(jié)果。 表7. 對耶魯數(shù)據(jù)庫中的測試圖片使用含 有25個主成份的MLP 神經(jīng)網(wǎng)絡(luò)時 所獲得的識別性能表8. 對ORL 數(shù)據(jù)庫中的測試圖片使用含 有40個主成份的MLP 神經(jīng)網(wǎng)絡(luò)時 所獲得的識別性能表9. 不同識別率的性能比較6. 結(jié)論 本論文提出了一種識別人臉的綜合性方法,該方法綜合了三種不同的解決方式。在預(yù)處理和特征提取步驟,我們使用了小波變換和PCA的綜合方法。在分類階段,神經(jīng)網(wǎng)絡(luò)(MLP被用于在寬泛的人臉范圍內(nèi)進(jìn)行精確定位。我們在耶魯和ORL 數(shù)據(jù)庫中做的實驗表明,將PCA 、小波變換和MLP 綜合起來的方法可以達(dá)到最好的性能(因為與已經(jīng)介紹的其他類似的方

19、法相比,它耗費最少的訓(xùn)練時間、最少的冗余數(shù)據(jù)并獲得最高的識別率。與目前已有的綜合性方法相比,我們所提出的方法在訓(xùn)練階段和識別階段均耗費最小的計算負(fù)荷。另一個方面便是它的高精確度。7. 參考文獻(xiàn)1 R. Chellappa, C. L. Wilson and S. Sirohey, Human and machine recognition of faces: asurvey, Proceedings of the IEEE, May 1995, Vol. 83, No. 5, 705-740.2 G. Chow and X. Li, Towards a system forautomatic

20、facial feature detection, Pattern Recognition, 1993, Vol. 26, No. 12, 1739-1755.3 F. Goudail, E. Lange, T. Iwamoto, K. Kyuma and N. Otsu, Face recognition system using local autocorrelations and multiscale integration, IEEE Trans. PAMI, 1996, Vol. 18, No. 10, 1024-1028.4 K. M. Lam and H. Yan, Locati

21、ng and extracting the eye in human face images, Pattern Recognition, 1996, Vol. 29, No.5 771-779. 5 D. Valentin, H. Abdi, A. J. OToole and G. W.Cottrell, Connectionist models of face processing: A Survey, Pattern Recognition, 1994, Vol. 27, 1209-1230. 6 A. L. Yuille, P . W. Hallinan and D. S. Cohen,

22、 Feature extraction from faces using deformable templates, Int. J. of Computer Vision, 1992, Vol. 8, No. 2, 99-111.7 M. Kirby and L. Sirovich, Application of the Karhunen-Loeve procedure for the characterization of human faces” IEEE Trans.PAMI., 1990, Vol. 12, 103-108.8 M. Turk and A. Pentland, Eige

23、nfaces forrecognition,” J. Cognitive Neuroscience,1991, Vol. 3, 71-86.9M. V. Wickerhauser, Large-rank approximate component analysis with wavelets for signalfeature discrimination and the inversion of complicated maps,” J. Chemical Information and Computer Sciences, 1994, Vol. 34, No. 5, 1036-1046.1

24、0 L.Sirovich and M. Kirby, Low-dimensional procedure for the characterization of human faces, J. Opt. Soc. Am. A, 1987, Vol. 4, No. 3, 519-524.11 D. L. Swets and J. J. Weng, UsingCombinational Method for Face Recognition: Wavelet, PCA and ANN 2008. DICTA 08.Digital Image. IEEE discriminant eigenfeat

25、ures for image retrieval, IEEE Trans. PAMI, 1996, Vol. 18, No. 8, 831-836. 12 A. J. OToole, H. Abdi, K. A. Deffenbacher and D. Valentin, A low-dimensional representation of faces in the higher dimensions of the space, J. Opt. Soc. Am., A, 1993, Vol. 10, 405-411. 13 A. K. Jain, Fundamentals of digita

26、l image processing, Prentice Hall, 1989, pp.163-175. 14 A.I. Wasserman.”Neural Computing: Theory and Practice New York: Van Nostrand Reinhold, 1989. 15 Golovko V., Gladyschuk V. Recirculation Neural Network Training for Image Processing,” Advanced Computer Systems, 1999, P. 73-78. 16 L. Harmon, The

27、recognition of faces, Scientific American, 1973, Vol. 229, 71-82. 17 I. Daubechies, Ten Lectures on Wavelets, CBMS-NSF series in Applied Mathematics, SIAM Press, Philadelphia, 1992, Vol. 61. 18 I. Daubechies, The wavelet transform, time-frequency localization and signal analysis, IEEE Trans. Informa

28、tion Theory, 1990, Vol. 36, No. 5, 961-1005. 19 A. Pentland, B. Moghaddam and T. Starner, View-based and modular eigenspaces for face recognition, Proc. IEEE Conf. Computer vision and Pattern Recognition, 1994, Seattle, June, 84-91. 20 H. A. Rowley, S. Baluja and T. Kanade, Neural network-based face detection, IEEE Transaction on PAMI, 1998, Vol. 20, No. 1,23-38. 21 E.M.-Tzanakou, E. Uyeda, R. Ray, A Sharma, R. Ramanujan and J. Dong, Comparison of neural network algorithm for face recognition, Simulation, 1995, 64, 1, 15-27. 22 D. Valentin, H.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論