人臉識別技術(shù)畢業(yè)論文_第1頁
人臉識別技術(shù)畢業(yè)論文_第2頁
人臉識別技術(shù)畢業(yè)論文_第3頁
人臉識別技術(shù)畢業(yè)論文_第4頁
人臉識別技術(shù)畢業(yè)論文_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 本科畢業(yè)設(shè)計(jì)說明書(論文) 第 29 頁 共 29 頁1 引言1.1 研究背景和意義隨著社會(huì)的進(jìn)步,對身份識別技術(shù)的需求越來越大。尤其在安全、經(jīng)濟(jì)以及商貿(mào)等領(lǐng)域,這種識別技術(shù)的需求更是無處不在。即使在生活中,我們也要經(jīng)常驗(yàn)證或被驗(yàn)證他人或自己的身份來保證我們的人身、財(cái)產(chǎn)以及信息的安全。如今,社會(huì)在不斷的進(jìn)步,社會(huì)的生產(chǎn)、生活等方面也有了很大的提高,這就使得對人們身份的認(rèn)證有了更高的要求。傳統(tǒng)的個(gè)人身份識別主要是通過其本身的標(biāo)識物品等方式來實(shí)現(xiàn)的,如證件、口令或鑰匙等。這些傳統(tǒng)識別方法很容易被忘記或者被偽造,而且它們更無法區(qū)別所有人與冒充者,他人獲得后也可以擁有相同的權(quán)利,從而使得真正的持有者

2、蒙受巨大的損失。例如,當(dāng)他人獲得自己的銀行卡和密碼后就可以通過自動(dòng)取款機(jī)來盜取金錢?;谶@些原因,使得傳統(tǒng)識別方法已經(jīng)跟不上時(shí)代的腳步,滿足不了當(dāng)代人們的安全需求。而人們本身擁有的面部特征、指紋、虹膜等都能夠唯一的標(biāo)識個(gè)人的身份。這些屬性具有固定不變性和個(gè)體差異,利用這一屬性可以有效的、可靠的、穩(wěn)定的對個(gè)人身份進(jìn)行識別,而基于面部特征的識別相對于基于其它特征的識別更容易實(shí)現(xiàn),也更容易被接受,從而被廣泛的研究與應(yīng)用。該技術(shù)在現(xiàn)代社會(huì)具有非常重大的研究意義,例如,通過人臉識別確認(rèn)犯罪分子。另外采用人臉識別設(shè)計(jì)的自動(dòng)取款機(jī),通過人臉識別來判斷用戶是否為本人。人臉識別的出現(xiàn)使得人們的信息和財(cái)產(chǎn)的安全有

3、了很大的提高。人臉識別涵蓋了圖像處理、模式識別、神經(jīng)網(wǎng)絡(luò)、計(jì)算機(jī)視覺、生理學(xué)以及數(shù)學(xué)等諸多學(xué)科,是一項(xiàng)非常綜合的技術(shù),它的應(yīng)用正隨著社會(huì)的進(jìn)步與日俱增。1.2 人臉識別技術(shù)的應(yīng)用人臉識別的出現(xiàn)在一定程度上緩解了人們對于身份識別的巨大需求。以下的幾個(gè)領(lǐng)域是人臉識別研究方向的重點(diǎn):(1)在公安方面,人臉識別可以幫助公安干警刑偵破案。公安部門根據(jù)獲得的疑犯照片與檔案庫里的疑犯照片進(jìn)行比對,可以迅速的確定疑犯身份,從而提高破案的效率。(2)在物業(yè)管理方面,主要是用來保護(hù)物主的財(cái)產(chǎn)安全。如需要驗(yàn)證某人的身份,以防止非法分子進(jìn)入小區(qū)、辦公樓等地方盜取物主財(cái)產(chǎn),但使用人工識別,其識別速度慢而且容易發(fā)生遺漏,

4、而人臉識別技術(shù)可以由機(jī)器完成這種反復(fù)而簡單的驗(yàn)證工作,從而實(shí)現(xiàn)自動(dòng)化智能管理。(3)在考勤方面,由于人臉的無法替代性,可以提供準(zhǔn)確的考勤記錄,杜絕了打卡考勤機(jī)的代打卡現(xiàn)象,具有可遠(yuǎn)程管理,識別速度快等優(yōu)點(diǎn),并且不論識別是否成功,被識別人的圖像都會(huì)被記錄下來,方便以后查驗(yàn)。(4)在網(wǎng)絡(luò)安全方面,當(dāng)使用信用卡進(jìn)行網(wǎng)絡(luò)支付時(shí),人臉識別系統(tǒng)可以有效的防止他人冒用信用卡。(5)在金融方面,由于人臉的唯一性,同時(shí)又由于金融業(yè)務(wù)涉及客戶的經(jīng)濟(jì)機(jī)密,故采用人臉識別能夠很好的保護(hù)這些機(jī)密。而人臉識別在金融業(yè)的應(yīng)用的不斷增長也證明了它的安全性。1.3 人臉識別技術(shù)的主要問題人臉識別雖然有著巨大的應(yīng)用價(jià)值,但也存在

5、一些問題需要解決。在日常生活中,人們可以毫不費(fèi)力的識別人臉,但是對于計(jì)算機(jī)來說,卻存在著巨大的困難。這種困難主要是人臉形態(tài)的多樣性和環(huán)境的復(fù)雜性造成的,同時(shí)也有計(jì)算機(jī)本身的學(xué)習(xí)能力的問題,這些問題主要體現(xiàn)在以下幾個(gè)方面:(1)人臉特征穩(wěn)定性較差由于人臉是一個(gè)可塑的、三維的可變形體,用數(shù)學(xué)模型很難描述,且當(dāng)受到年齡、化妝、表情以及意外傷害等因素的影響后,會(huì)使采集到的人臉圖像發(fā)生較大的變化。(2)人臉受外界因素影響大人臉圖像采集時(shí)會(huì)受到不同的光照條件、面部方向、采集視角等因素的影響,使得同一個(gè)人的人臉圖像在不同的條件下產(chǎn)生很大的差異,這些因素提高了人臉識別算法的要求。(3)人臉圖像的質(zhì)量問題人臉圖

6、像的來源很多,但最普通的來源是攝像頭,由于攝像設(shè)備的不同,得到的人臉圖像質(zhì)量也不相同?,F(xiàn)在的人臉識別主要是針對高質(zhì)量的圖像。(4)人臉圖像受相似問題的影響眾所周知,人類的面孔雖然各不相同,但是由于人口基數(shù)大,導(dǎo)致經(jīng)常出現(xiàn)相似面孔,即二者之間的差距非常小,這使得利用機(jī)器來識別這種差距非常小的人臉具有相當(dāng)大的難度。上述問題表明,所采集到的人臉圖像具有復(fù)雜性和多變性,這就提高了人臉識別的難度,而如何消除這些影響以及如何提高識別精度成為了現(xiàn)在和未來的研究主題。1.4 論文結(jié)構(gòu)安排本文分為五個(gè)章節(jié),每章具體情況如下:第一章簡要敘述了人臉識別的研究背景及其應(yīng)用,概要分析了人臉識別面臨的問題。第二章介紹了在

7、進(jìn)行人臉識別前的圖像處理。第三章簡要介紹了關(guān)于人臉識別的一些基礎(chǔ)理論。第四章首先分別介紹了PCA算法和LDA算法,然后分析了兩種算法融合的意義,并提出了PCA+LDA的融合算法。第五章采用PCA+LDA融合算法在人臉庫ORL和YALE上進(jìn)行人臉識別,并分析了實(shí)驗(yàn)結(jié)果。2 人臉圖像的預(yù)處理2.1 人臉圖像的灰度化處理日常所采集到的人臉圖像通常為彩色圖像,而彩色圖像是由紅(R)、綠(G)、藍(lán)(B)三種基本顏色構(gòu)成的,使得識別計(jì)算復(fù)雜,不利于識別的進(jìn)行,所以要進(jìn)行灰度化處理?;叶然褪鞘沟眉t、綠、藍(lán)三色取相同值,此時(shí)的像素值就是灰度值。由于像素的灰度值存放在一個(gè)字節(jié)中,因此變化范圍只有0-255。由

8、于點(diǎn)與點(diǎn)之間的灰度程度不同,因此使得圖像表現(xiàn)出顏色深度。對彩色圖像的灰度處理,一般采用下列方法:(1)分量法將彩色圖像的R、G、B中某一個(gè)的值作為灰度值,公式如下: (2.1) (2.2) (2.3)(2)最大值法將彩色圖像三種基本顏色紅、綠、藍(lán)中亮度最大的值作為灰度值,公式如下: (2.4)(3)平均值法將彩色圖像三種基本顏色紅、綠、藍(lán)的平均值作為灰度值,公式如下: (2.5)(4)加權(quán)平均法根據(jù)三種基本色在人眼中的敏感性,以不同的權(quán)值進(jìn)行加權(quán)平均。由于人眼對綠色的敏感最高故權(quán)值最大,對藍(lán)色敏感最低故權(quán)值最小,故其公式如下: (2.6)灰度圖的出現(xiàn)降低了計(jì)算的繁瑣程度,使得計(jì)算速度與最終的圖

9、像識別的準(zhǔn)確度有了很大的提高。2.2 人臉圖像的平滑去噪人臉圖像的采集和傳輸過程中,圖像信號不可避免的會(huì)受到噪聲的影響,這將影響到系統(tǒng)對圖像信息的分析和理解。一般來說,出現(xiàn)位置隨機(jī),幅值基本相同的噪聲為椒鹽噪聲,而位置一定的,幅值是隨機(jī)的噪聲為高斯噪聲。由于噪聲對圖像的采集和處理有著一定的影響,使得圖像的識別準(zhǔn)確度降低,因此對圖像進(jìn)行去噪的處理就顯得非常必要了。圖像平滑去噪的理想狀態(tài)是保持圖像的邊界和細(xì)節(jié)的同時(shí),去除圖像噪聲,也是現(xiàn)在去噪研究的重點(diǎn)。圖像的成像模型可描述為: (2.7)其中是理想圖像,是實(shí)際圖像,為噪聲。圖像的去噪問題就是找到一個(gè)算子,使得: (2.8)圖像去噪的主流方法有三種

10、:均值濾波、中值濾波、維納濾波。2.2.1 均值濾波(1)均值濾波原理均值濾波的基本思想是用目標(biāo)像素周圍的八個(gè)像素的平均值來取代目標(biāo)像素的值,其主要方法是領(lǐng)域平均法。假定圖像有個(gè)像素,則平滑處理后的為: (2.9)式中,,是點(diǎn)周圍點(diǎn)的坐標(biāo)的集合,但其中不包括本身,是集合內(nèi)的坐標(biāo)點(diǎn)的總數(shù)。由上式可知,圖像中每個(gè)像素的值都是由這個(gè)點(diǎn)周圍的幾個(gè)像素值的平均值決定的。(2)均值濾波的改進(jìn)算法雖然均值濾波對噪聲有一定的抑制作用,但是效果仍然不理想,其最主要的問題是:由于它對所有的點(diǎn)都是同等對待,所以它將噪聲點(diǎn)分?jǐn)偟耐瑫r(shí),也將圖像的邊界分?jǐn)偭耍@就使得圖像變的模糊,且模糊程度與領(lǐng)域半徑成正比。加權(quán)平均法是

11、改進(jìn)后的典型算法,該算法可如下表示: (2.10)式中,是權(quán)值,表示該點(diǎn)所起作用的大小。不論是均值濾波還是加權(quán)平均法,它們都丟失了圖像的邊界信息。為了改善這一狀況,提出了中值濾波。2.2.2 中值濾波中值濾波法是以選定的像素為中心,對該像素周圍的像素按值進(jìn)行排序,排序后取中間的像素值為選定的像素的值。表示如下: (2.11)式中,是領(lǐng)域中各點(diǎn)的灰度值,所以中值濾波后的是以為中心的領(lǐng)域的各像素的中間值,因此能夠在消除噪聲的同時(shí),較好的保存邊界信息。對于椒鹽噪聲,由于其幅值是基本相同的,但分布是隨機(jī)的,即圖像中有干凈點(diǎn)也有污染點(diǎn),而中值濾波的方法就是選擇合適的點(diǎn)代替污染點(diǎn)的值,故去噪效果好。而均值

12、濾波則由于噪聲的均值不為0,故不能很好的除去噪聲。對于高斯噪聲,由于其幅值近似正態(tài)分布,但分布點(diǎn)是一定的,即圖像中的每點(diǎn)都是污染點(diǎn),所以中值濾波的方法對于高斯噪聲來說是無法選擇到干凈點(diǎn)來代替污染點(diǎn)的,故去噪效果差。而因?yàn)檎龖B(tài)分布的均值為0,故均值濾波的去噪效果好。2.2.3 維納濾波最早最經(jīng)典的圖像修復(fù)方法是維納濾波法。首先計(jì)算圖像像素的均值和方差,公式如下: (2.12) (2.13)式中,表示噪聲,和分別為圖像的行數(shù)和列數(shù),為噪聲的均值表示圖像中噪聲的總體強(qiáng)度,則根據(jù)維納濾波器估計(jì)出的圖像灰度值為: (2.14)其中,是圖像的總方差,是局部方差。越大,去除噪聲的效果就越好,反之噪聲的去除效

13、果就越差。適應(yīng)面廣是維納濾波器的優(yōu)點(diǎn),但是其缺點(diǎn)也很明顯,就是使用維納濾波器要先得到半無限時(shí)間區(qū)內(nèi)的全部數(shù)據(jù),這點(diǎn)以現(xiàn)在的技術(shù)很難做到。所以實(shí)際中維納濾波器并不常用。2.3 人臉圖像的歸一化處理圖像的歸一化就是將圖像轉(zhuǎn)化成統(tǒng)一的標(biāo)準(zhǔn)形式的過程。通過對圖像進(jìn)行標(biāo)準(zhǔn)化處理,以此消除其它因素對圖像識別的影響。人臉圖像在經(jīng)過灰度化、平滑去噪后仍然存在著一些問題,如:頭部的傾斜、偏轉(zhuǎn)、光照、距離以及表情等,這些因素都會(huì)使得識別率下降。而人臉圖像的歸一化目的就是使人臉圖像經(jīng)過處理后取得同樣大小的尺寸,且灰度范圍取值也相同的標(biāo)準(zhǔn)化圖像,即使得受不良因素影響的同一個(gè)人的不同照片具有同一個(gè)標(biāo)準(zhǔn),從而消除不良影響

14、,提高識別率。人臉圖像的歸一化主要對圖像幾何和灰度進(jìn)行修正。2.3.1 幾何歸一化幾何歸一化是為了消除人臉位置、大小和角度的不同所造成的影響,使人臉圖像具有一定程度上的幾何不變性。因此,幾何歸一化又稱為位置校正。因?yàn)橥组g的距離受不良因素的影響較小,所以通常被作為幾何歸一化的標(biāo)準(zhǔn)。一般來說,幾何歸一化主要經(jīng)過以下兩個(gè)步驟,如圖2.1、2.2所示。(1)圖像旋轉(zhuǎn)由于人臉圖像在采集時(shí)多少會(huì)出現(xiàn)一定的傾斜,因此要將圖像進(jìn)行旋轉(zhuǎn),使得兩眼之間的連線保持水平。具體做法是,確定兩眼之間的連線,然后計(jì)算出連線與水平線之間的角度,再根據(jù)角度將圖像在平面內(nèi)進(jìn)行旋轉(zhuǎn)。(2)尺度歸一化計(jì)算出每幅圖像人臉兩眼的距離,

15、再根據(jù)求得的數(shù)據(jù)計(jì)算人臉兩眼距離的平均值,按照平均值對圖像進(jìn)行適當(dāng)?shù)目s放,從而使得每幅圖像的尺度基本相同。圖2.1 處理前的原圖圖2.2 處理后的圖像2.3.2 灰度歸一化經(jīng)過幾何歸一化后的人臉圖像尚未消除不同光照所造成的影響,故需要經(jīng)過進(jìn)一步的處理,即灰度歸一化。其原理是調(diào)整人臉圖像的灰度,使得圖像的對比加深,從而使得人臉圖像的特征更加明顯。灰度歸一化的經(jīng)典方法是直方圖均衡化。通過對圖像的處理,使得灰度級增加,從而提高對比度,使得圖像更加清晰。所以本質(zhì)上來說,灰度歸一化就是增加灰度級。設(shè)為總像素?cái)?shù),為第灰度級的像素?cái)?shù),表示第個(gè)灰度級,表示灰度級總數(shù),則該灰度級出現(xiàn)的概率的計(jì)算式為: (2.1

16、5)直方圖均衡化處理公式為: (2.16)原第K灰度級的像素經(jīng)過直方圖變換后的灰度級為: (2.17)由于圖像的均值和方差與其直方圖密切相關(guān),圖像的均值反映了圖像的平均亮度,而方差則反映了亮度的變化,所以通過計(jì)算圖像的均值和方差來驗(yàn)證和比較處理前和處理后的效果。圖像的均值為: (2.18)圖像的方差為: (2.19)如下圖2.3、2.4所示,為直方圖均衡化前后的圖像與直方圖的比較。 圖2.3 處理前的原始圖像和其直方圖 圖2.4 處理后的圖像和其直方圖3 人臉識別的相關(guān)理論3.1 人臉識別的基本原理識別技術(shù)分為廣義的和狹義的。廣義的是指人臉圖像的采集、人臉識別預(yù)處理、人臉定位、身份確認(rèn)以及身份

17、查找等。狹義的是指僅對個(gè)人的身份進(jìn)行識別的人臉識別。而特征的提取是識別技術(shù)的核心。上文介紹的人臉圖像的處理就是為了使計(jì)算機(jī)能夠更好的提取人臉特征而作準(zhǔn)備,而人臉識別也是根據(jù)特征來進(jìn)行的。3.1.1 人臉特征提取人臉在計(jì)算機(jī)中能夠表現(xiàn)為不同的灰度值矩陣,人臉識別就是通過比較不同圖像的矩陣來進(jìn)行圖像的識別,因此,如何很好的描述人臉成為了關(guān)鍵的問題。但是人臉的數(shù)據(jù)量十分龐大,如果盡數(shù)提取就會(huì)使得計(jì)算的代價(jià)非常高,如何降低數(shù)據(jù)量,提高識別效率成為了研究的重點(diǎn),對此研究人員提出了人臉特征提取。人臉特征包括鼻梁、眉骨、下巴、眼睛、鼻子、耳朵等,對這些特征進(jìn)行提取的同時(shí),也達(dá)到了對人臉矩陣的降維,保證了識別

18、率的同時(shí),提高了識別效率。所以,識別算法的好壞要根據(jù)特征臉的提取來判斷。人臉特征的提取可以看作一種變換,設(shè)表示原始數(shù)據(jù)的高維空間,是特征空間,則提取的過程為如下映射: (3.1)理論上,訓(xùn)練樣本(人臉圖像)的數(shù)目越多,特征提取的效果就越好。代數(shù)方法的特征提取是人臉特征提取方法中較為常用的,其中最常用的方法是特征臉方法。設(shè)為圖像的特征向量,為圖像維數(shù),則的協(xié)方差矩陣為: (3.2)式中,圖像的特征平均值為。通過這種變換后,原始圖像的矩陣就會(huì)轉(zhuǎn)換成一個(gè)矩陣維數(shù)較低,但仍然能夠代表原始圖像的新矩陣。利用這種方法,避過了面部器官等特征,從而避免了表情的影響,但樣本數(shù)目是制約該方法優(yōu)劣的一個(gè)重要因素。3

19、.1.2 特征的匹配與分類在提取完特征后,通過何種方法比較人臉圖像,并通過何種方法對人臉特征進(jìn)行判別和分類也是一個(gè)非常重要的方面。(1)相似性度量常用的相似性度量準(zhǔn)則有:(a)歐氏距離 (3.3)(b)馬氏距離 (3.4)其中,是第個(gè)特征值,對應(yīng)第個(gè)特征向量。(c)絕對值距離 (3.5)(d)余弦距離 (3.6)除以上幾個(gè)常用的方法外,還有明式準(zhǔn)則、歐氏距離平方、均方誤差以及相關(guān)系數(shù)法。(2)常用分類器常用的分類器分為距離分類器和統(tǒng)計(jì)學(xué)習(xí)分類器。按照距離的分類器有如下幾種:(a)最小距離分類器:使用最小距離分類器需要知道訓(xùn)練樣本的類的平均點(diǎn),將測試樣本(待識別樣本)歸為與其距離最近的點(diǎn)所在的類

20、。(b)最近鄰分類器:該分類器需要預(yù)先將訓(xùn)練樣本分類,然后計(jì)算測試樣本與訓(xùn)練樣本的距離,則測試樣本就屬于與其距離最近的訓(xùn)練樣本所在的類。(c)K-近鄰分類器:K近鄰分類器是典型的非參數(shù)分類器,不需要學(xué)習(xí)或訓(xùn)練,也不需要確定參數(shù),只需確定測試樣本與訓(xùn)練樣本的K個(gè)近鄰中的哪個(gè)近鄰相似度最高,就可將測試樣本劃分為該近鄰所在的類。3.2 人臉識別的常用訓(xùn)練與測試模式3.2.1 訓(xùn)練模式在人臉識別的訓(xùn)練階段,一般需要以下幾個(gè)數(shù)據(jù)集合:(1)訓(xùn)練集已經(jīng)確定身份的圖像所組成的集合就是訓(xùn)練集。利用該訓(xùn)練集合對人臉識別的算法進(jìn)行測試,從而改正和改進(jìn)人臉識別的算法,調(diào)整算法中的參數(shù),以達(dá)到最佳識別的效果。(2)參

21、照集參照集是人臉原型的集合。主要通過其與測試樣本的比較來完成測試。實(shí)驗(yàn)數(shù)據(jù)較少時(shí),將訓(xùn)練集作為參照集。(3)測試集測試集是原集外或者原集中除參照集以外的人臉圖片。用來測試識別系統(tǒng)的正確性。3.2.2 測試模式(1)開集測試:主要判斷輸入的圖像在原集中是否存在,若存在,則給出結(jié)果。大規(guī)模的人臉庫一般采用該方法。(2)閉集測試:這種測試不用判斷輸入的圖像在原集中是否存在,只需給出最后的識別結(jié)果即可。小規(guī)模的人臉庫多采用該方法。(3)單樣本測試:這種測試指的是訓(xùn)練集中每類的樣本圖片數(shù)目只有1幅。在樣本數(shù)量有限或難以獲得的情況下,這種方法比較常用。(4)多樣本測試:該測試指的是訓(xùn)練集中每類的樣本圖片數(shù)

22、目至少有2幅。所以樣本充足時(shí),采用該方法效果較好。3.3 人臉識別的主流數(shù)據(jù)庫人臉識別同樣受到人臉庫的影響,優(yōu)秀的人臉庫不僅能提高識別率,同時(shí)使得識別結(jié)果具有說服力。對此,研究人員不停的更新和建立人臉庫。目前主流數(shù)據(jù)庫有FERET人臉庫、ORL人臉庫、YALE人臉庫、XM2VTS人臉庫、CAS-PEAL人臉庫和MIT人臉庫等。其中,F(xiàn)ERET人臉庫是由美國軍方制作的,是目前世界上最權(quán)威的人臉庫,而ORL人臉庫是由英國劍橋大學(xué)研究設(shè)計(jì)的,是目前使用最多的人臉庫。3.4 人臉識別的評價(jià)標(biāo)準(zhǔn)人臉識別最終要應(yīng)用到現(xiàn)實(shí)生活中,所以對于一個(gè)識別算法的優(yōu)劣,主要考慮算法的識別率和識別時(shí)間兩方面。而算法的優(yōu)劣

23、由識別率決定,算法的實(shí)用性則由識別時(shí)間來衡量。3.4.1 識別準(zhǔn)確率通常采用下列幾個(gè)指標(biāo)對人臉識別系統(tǒng)的精度進(jìn)行評價(jià):(1)拒識率(FRR):指系統(tǒng)將正確圖像當(dāng)成錯(cuò)誤圖像的概率,其公式如下: (3.7)(2)誤識率(FAR):指系統(tǒng)將錯(cuò)誤圖像當(dāng)成正確圖像的概率,其公式如下: (3.8)(3)總體正確識別率:正確識別的圖像數(shù)目在總圖像數(shù)目中的比例,其公式如下: (3.9)3.4.2 識別時(shí)間眾所周知,人臉識別算法的研究最終要回歸到實(shí)際的應(yīng)用中,因此,一個(gè)識別算法的運(yùn)行時(shí)間的長短也影響著其能否真正的運(yùn)用到現(xiàn)實(shí)中。人臉識別的時(shí)間由兩部分組成:一是人臉識別系統(tǒng)對訓(xùn)練集進(jìn)行處理,產(chǎn)生判別向量所需要的時(shí)間

24、;二是人臉識別系統(tǒng)將測試樣本向由判別向量組成的低維子空間投影,形成投影系數(shù),并最終得出結(jié)果所需要的時(shí)間。其中,第二方面是識別算法能否在現(xiàn)實(shí)中使用的決定因素。4 基于PCA和LDA融合的人臉識別算法4.1 基于PCA的人臉識別方法4.1.1 概述主成分分析(PCA)又稱K-L變換。通過線性變換,從眾多數(shù)據(jù)中選出能夠代表整體的少數(shù)數(shù)據(jù)的一種統(tǒng)計(jì)分析方法,是特征提取的一個(gè)經(jīng)典算法。其目的在于,從人臉圖像的數(shù)據(jù)組成的矩陣中提取出最能代表該矩陣,且含有數(shù)據(jù)較少的新矩陣,以達(dá)到縮小龐大的原矩陣的目的。4.1.2 特征臉?biāo)惴?1)特征臉的原理特征臉?biāo)惴ㄊ莵碜訮CA算法的經(jīng)典識別算法。特征臉?biāo)惴ǖ淖R別過程是先

25、將訓(xùn)練樣本中的圖像投影到特征臉子空間上,然后將測試樣本的人臉圖像也投影到特征臉子空間上,最后對所得的數(shù)據(jù)進(jìn)行對比,具體步驟如下:(a)獲得訓(xùn)練集,并計(jì)算圖像集的特征臉,存儲(chǔ)到模板庫中;(b)輸入另外的人臉圖像,保存其到特征臉上的投影數(shù)據(jù);(c)利用相似度準(zhǔn)則判斷輸入的圖像是否屬于人臉;(d)若為人臉,再次利用分類器準(zhǔn)則判斷該人臉屬于哪個(gè)人。(2)特征臉的計(jì)算設(shè)有大小為的維列向量的人臉圖像,則圖集為,其中,為圖像總數(shù),則其平均向量為: (4.1)則人臉與平均人臉之間的差為: (4.2)訓(xùn)練樣本的協(xié)方差矩陣為: (4.3)式中,。由上述公式可知,由協(xié)方差矩陣的求解特征值和特征向量。特征臉向量為,在

26、對其進(jìn)行歸一化處理后即可獲得特征臉,下式為歸一化公式: (4.4)此時(shí),所獲得的特征向量組成的特征臉空間非常大,需要縮小其數(shù)據(jù)量。首先降序排列特征值,則特征臉子空間由前個(gè)特征值所對應(yīng)的特征向量組成。特征值為,特征向量,則: , (4.5)將訓(xùn)練集中的人臉圖像投影到特征臉子空間上,該投影為: (4.6)常用的5種特征值提取法有:(1)標(biāo)準(zhǔn)空間投影法;(2)保留前面的90%的特征向量法;(3)能量維數(shù)法;(4)擴(kuò)展維數(shù)法;(5)去掉最大特征值法。其中,最常用的是能量維數(shù)法,即選取的特征值數(shù)目應(yīng)滿足下式: (4.7)該方法的思想是,不停的計(jì)算前個(gè)特征值之和與總特征值之和的比值,當(dāng)這個(gè)比值大于某個(gè)閾值

27、時(shí),就認(rèn)為此時(shí)的特征值數(shù)目是所需要的能夠代表整體的最少的特征值數(shù)目。(3)特征臉的識別過程訓(xùn)練和識別兩個(gè)階段組成了特征臉?biāo)惴ǖ淖R別過程。在訓(xùn)練階段,將每個(gè)訓(xùn)練集中的人臉圖像投影到特征臉子空間上,得到降維后的特征臉的維數(shù)為,其計(jì)算公式如下: (4.8)式中,第個(gè)人臉測試的結(jié)果就是。而在識別階段,主要完成訓(xùn)練集中的人臉圖像到特征臉子空間的投影,同樣得到維向量: (4.9)由于已知圖像組成了訓(xùn)練樣本,故人臉識別實(shí)際是求解測試樣本中人臉圖像的分類問題。通常,都是選擇一種合適的分類器準(zhǔn)則來判斷測試樣本的歸類,該準(zhǔn)則應(yīng)使得識別率最高。每個(gè)人臉圖像在空間中都是一個(gè)點(diǎn),則同一個(gè)人的圖像點(diǎn)就集中在一個(gè)有限的區(qū)域

28、里,而不同的人的圖像點(diǎn)在不同的區(qū)域里。所以,通過計(jì)算兩點(diǎn)之間距離的遠(yuǎn)近就可以知道人臉樣本屬于哪一個(gè)人。式(3.3)中的為特征空間的維數(shù),由該式可知,若它們屬于同一個(gè)人的不同人臉圖像,則應(yīng)是比較小的,反之應(yīng)該比較大。先求解訓(xùn)練樣本中的各個(gè)人臉圖像的距離,采用歐氏距離算法: (4.10)則待測的圖像與已知的人臉集的距離為: (4.11)最后,只要判斷是否小于計(jì)算得到的,就可以判斷該圖像屬于哪個(gè)人。4.2 基于LDA的人臉識別方法4.2.1 概述線性判別分析(LDA)又稱為Fisherface線性判別分析,其目的是提取低維的特征空間來代表原高維的特征空間。通過這種方法使得同類內(nèi)的樣本盡可能的集中在一

29、起,不同類內(nèi)的樣本盡可能的遠(yuǎn)離。4.2.2 傳統(tǒng)LDA算法(1)算法原理設(shè)集合內(nèi)的樣本有個(gè),且每個(gè)樣本為維,樣本共分為類,其中類有個(gè)樣本,類有個(gè)樣本,則該樣本的類內(nèi)散布矩陣、類間散布矩陣和總體散布矩陣為分別為: (4.12) (4.13) (4.14)式中,第類樣本的第個(gè)樣本為,第類樣本的平均值為,為總體樣本均值,為第類樣本的先驗(yàn)概率,一般取。線性判別準(zhǔn)則函數(shù)定義為: (4.15)投影后,為了達(dá)到同類內(nèi)的樣本聚集,而不同類內(nèi)的樣本分開的要求,就要使類內(nèi)離散度盡量的小,而類間離散度盡量的大,即式(4.15)取得最大值的時(shí)候的向量就是所求的最佳投影方向,且滿足如下等式的解。 (4.16)(2)同時(shí)

30、對角化求一個(gè)矩陣,使得和同時(shí)對角化,公式為: (4.17)式中,為對角線上的元素降序排列的對角矩陣。4.2.3 基于核的LDA算法核LDA算法是研究人員在LDA的基礎(chǔ)上,提出的對人臉識別等非線性分類問題有良好解決能力的改進(jìn)算法。設(shè)樣本特征空間的維數(shù)為,樣本分類數(shù)為,為第類樣本數(shù),則每個(gè)樣本表示為,訓(xùn)練樣本總數(shù)為。定義非線性映射,其中為映射特征空間,維數(shù)為,則第映射類為: (4.18)則,映射類的均值和總體均值分別為: (4.19) (4.20)則矩陣、矩陣和矩陣的求解公式分別為: (4.21) (4.22)式中: (4.23) (4.24) (4.25) (4.26)則,核Fisher準(zhǔn)則為:

31、 (4.27)使式(4.27)取得最大值的向量,即為所求的最佳投影空間,而該向量的列向量形成的圖像成為“Fisherfaces”。4.2.4 直接LDA算法前文提到的同時(shí)對角化是直接LDA算法的核心。算法的關(guān)鍵是保存特征空間中的有用信息,同時(shí)去掉無用信息。即保留中的零特征值,同時(shí),去掉矩陣中的零特征值。具體的步驟如下:(1)求使得對角化的矩陣: (4.28)其中,為對角線上的元素降序排列的對角矩陣。故一個(gè)特征向量表示為矩陣中的一列,且所有的特征值都在中。(2)定義為的前列,即矩陣是維,其特征空間的維數(shù)為,則的維主子矩陣為: (4.29)(3)定義,則: (4.30)(4)根據(jù)特征分析方法求的對

32、角化,得: (4.31)式中,對角線上的元素可能包含0,所以需要保存這些0的元素,故要舍棄元素排序較靠前的特征值所對應(yīng)的特征向量。(5)定義矩陣為: (4.32)此時(shí),所得的矩陣可以同時(shí)對角化和。(6)最終的樣本矩陣為: (4.33)4.3 基于PCA和LDA融合的人臉識別4.3.1 PCA算法和LDA算法之間的區(qū)別和聯(lián)系LDA算法的核心思想是找到一個(gè)投影方向,這個(gè)投影方向可以讓同一個(gè)人的圖像在平面內(nèi)的點(diǎn)盡量的集中在一起,而不同人的圖像的點(diǎn)盡量的分散開。而PCA算法則是直接分析整個(gè)人臉庫,即將人臉庫看做一個(gè)個(gè)體。特征臉方法由于求解的是圖像變化最大的部分,則其受光照等不良因素的影響較大。而LDA

33、算法由前文的分析可知,其忽略了光照等因素,而關(guān)注不同人臉之間的差異度。因此,當(dāng)圖像的影響因素主要為光照等因素時(shí),LDA算法的效果要更好,而提供的訓(xùn)練集不充足時(shí),PCA算法的效果要好于LDA算法。但這兩種方法都有一個(gè)共同的缺陷,即變化圖像的尺寸對識別的效果影響較大。由前文可知,常用的降維方法就是PCA算法和LDA算法。在人臉識別中,PCA算法基于圖像的整體灰度值進(jìn)行操作,關(guān)注于主要特征信息的提取,忽略了圖像的分類問題。LDA算法則是基于圖像的分類,更多的考慮了不同類別間的特征問題。因此,將兩種算法的優(yōu)點(diǎn)進(jìn)行結(jié)合,在人臉識別的研究領(lǐng)域中有著很高的研究價(jià)值。4.3.2 PCA算法和LDA算法的融合不

34、論是PCA算法還是LDA算法,它們的缺陷都非常明顯。PCA算法由于特征臉對于光照等因素較為敏感,所以光照、表情等因素會(huì)導(dǎo)致識別率下降,且PCA算法是把圖像看作一個(gè)整體,即圖像中的像素都擁有相同的地位,在特征空間里就表現(xiàn)為沒有差異性。LDA算法的特征空間雖然具有差異性,但其計(jì)算過程要反復(fù)的進(jìn)行矩陣操作,當(dāng)矩陣過大的時(shí)候,就會(huì)使得計(jì)算產(chǎn)生的誤差較大,最終影響到識別精度,所以,直接使用LDA對人臉圖像進(jìn)行識別,會(huì)使得矩陣為奇異的,最終導(dǎo)致投影方向無法求解,這就是通常所說的“小樣本”問題。因此,提出了PCA與LDA相融合的算法,即PCA+LDA算法,該算法先通過PCA和LDA的兩次降維處理,產(chǎn)生理想狀

35、態(tài)的最優(yōu)投影子空間。具體的計(jì)算過程如下:(1)根據(jù)PCA算法求解特征臉子空間,記為;(2)根據(jù)LDA算法求解特征子空間,記為;(3)利用式(4.16)求解特征值和特征向量,組成最佳分類空間;(4)融合根據(jù)PCA算法和LDA算法求得的兩個(gè)特征子空間,得到最優(yōu)特征子空間,公式如下: (4.34)(5)將訓(xùn)練樣本和測試樣本分別投影到最優(yōu)特征子空間上,得到各自的識別特征,再利用最近鄰準(zhǔn)則進(jìn)行人臉分類。5 人臉識別系統(tǒng)的實(shí)現(xiàn)5.1 人臉識別流程人臉識別的流程圖如下:人臉庫圖像預(yù)處理訓(xùn)練樣本測試樣本特征提取特征比對結(jié)束輸出結(jié)果圖5.1 人臉識別流程圖本次實(shí)驗(yàn),分別采用人臉庫ORL和YALE。實(shí)驗(yàn)一的人臉測

36、試是在ORL人臉庫上進(jìn)行,當(dāng)人數(shù)分別為15、25、35、40人時(shí),訓(xùn)練樣本數(shù)分別取2、3、4、5、6、7、8、9幅,測試樣本為其余的圖像。實(shí)驗(yàn)二是在YALE人臉庫上進(jìn)行的,當(dāng)人數(shù)分別取5、10、15人時(shí),訓(xùn)練樣本數(shù)分別取2、3、4、5、6、7、8、9幅。流程為先輸入訓(xùn)練樣本,通過PCA算法和LDA算法,求出最優(yōu)投影子空間,將訓(xùn)練樣本投影到最優(yōu)投影子空間,然后輸入測試樣本,同樣投影到最優(yōu)投影子空間,利用最近鄰準(zhǔn)則比較二者,最后統(tǒng)計(jì)正確識別率。5.2 實(shí)驗(yàn)步驟與結(jié)果及其圖像曲線5.2.1 ORL人臉庫的實(shí)驗(yàn)(1)實(shí)驗(yàn)步驟(a)讀入ORL圖像庫的訓(xùn)練圖像,先選取15人,選取每個(gè)人的人臉圖像數(shù)分別為2

37、、3、4、5、6、7、8、9幅圖像,圖像大小為11292。(b)根據(jù)讀入的訓(xùn)練樣本圖像生成圖像矩陣,根據(jù)PCA算法生成特征臉子空間。(c)對于特征臉子空間,利用LDA算法求解基于LDA算法的特征子空間。(d)根據(jù)和,求得最優(yōu)投影子空間。(e)訓(xùn)練樣本投影到最優(yōu)投影子空間,獲得數(shù)據(jù)。(f)讀入測試樣本,將測試樣本的圖像矩陣投影到最優(yōu)投影子空間,獲得數(shù)據(jù)。(g)利用最近鄰準(zhǔn)則比較和,并根據(jù)比較結(jié)果計(jì)算最終的識別率。(f)依次更改測試人數(shù)為25、35、40人,重復(fù)上述操作。(2)實(shí)驗(yàn)結(jié)果表5.1 基于ORL人臉庫的測試結(jié)果臉人數(shù)識率別數(shù)人23456789150.94170.95240.97780.9

38、6000.98331.00000.96670.9333250.81000.88000.92670.91200.96000.97330.98000.9600350.80360.82860.89520.93710.96430.96190.97140.9714400.76560.84290.85830.88000.93750.95830.97500.9750如圖5.2所示:圖5.2 ORL人臉庫的識別結(jié)果曲線圖5.2.2 YALE人臉庫的實(shí)驗(yàn)(1)實(shí)驗(yàn)步驟(a)讀入YALE圖像庫的訓(xùn)練圖像,先選取5人,取每個(gè)人的人臉圖像數(shù)分別為2、3、4、5、6、7、8、9幅圖像,圖像大小為100100。(b)根據(jù)

39、讀入的訓(xùn)練樣本圖像生成圖像矩陣,根據(jù)PCA算法生成特征臉子空間。(c)對于特征臉子空間,利用LDA算法求解基于LDA算法的特征子空間。(d)根據(jù)和,求得最優(yōu)投影子空間。(e)訓(xùn)練樣本投影到最優(yōu)投影子空間,獲得數(shù)據(jù)。(f)讀入測試樣本,將測試樣本的圖像矩陣投影到最優(yōu)投影子空間,獲得數(shù)據(jù)。(g)利用最近鄰準(zhǔn)則比較和,并根據(jù)比較結(jié)果計(jì)算最終的識別率。(f)依次更改測試人數(shù)為10、15人,重復(fù)上述操作。(2)實(shí)驗(yàn)結(jié)果表5.2 基于YALE人臉庫的測試結(jié)果臉人數(shù)識率別數(shù)人2345678950.91110.92501.00001.00001.00001.00001.00001.0000100.81110.

40、83750.97140.95000.92001.00001.00001.0000150.82220.84170.91430.93330.93330.98331.00001.0000如圖5.3所示:圖5.3 YALE人臉庫的識別結(jié)果曲線圖5.3 實(shí)驗(yàn)結(jié)果分析由實(shí)驗(yàn)結(jié)果可以知道如下幾點(diǎn):(1)在相同的閾值下,不論是基于ORL人臉庫的測試,還是基于YALE人臉庫的測試,其識別率總體上都是隨著訓(xùn)練樣本數(shù)的增加而增加。這是因?yàn)殡S著訓(xùn)練樣本數(shù)的增加,經(jīng)過降維所得的特征子空間含有足夠的信息,從而使得識別率提升。(2)在相同的閾值與相同的訓(xùn)練樣本數(shù)下,參與測試的人數(shù)越少,識別率越高。這是因?yàn)槿藬?shù)的減少使得類間

41、離散度變大,從而使得識別率提升。(3)在條件完全相同的情況下,YALE人臉庫比ORL人臉庫的識別率高。這是因?yàn)镺RL人臉庫的人臉圖像受不利因素的影響較大。(4)通過結(jié)果曲線圖可以發(fā)現(xiàn),不論是ORL人臉庫的識別率,還是YALE人臉庫的識別率都出現(xiàn)了所謂的“拐點(diǎn)”。這是因?yàn)椋藭r(shí)的訓(xùn)練樣本數(shù)使得類內(nèi)離散度大于類間離散度,造成誤識別,所以識別率反而下降。綜上所述,隨著訓(xùn)練樣本數(shù)的增加,圖像的識別率也增加。結(jié)束語人臉識別已經(jīng)成為計(jì)算機(jī)領(lǐng)域的一個(gè)重要的研究方向,其包含了圖像處理、人工智能、神經(jīng)網(wǎng)絡(luò)以及模式識別等領(lǐng)域的知識,是一門非常綜合的學(xué)科。到目前為止,雖然人臉識別的研究經(jīng)過30多年的發(fā)展,并取得了巨

42、大成果,但是仍然有許多問題需要解決。特征臉的提取是人臉識別的核心。優(yōu)秀的特征臉提取算法可以使得人臉圖像的維數(shù)在盡可能低的同時(shí),最大限度的反映了原圖像的特征。本文主要探討了基于PCA與LDA融合算法的人臉識別,在MATLAB平臺上開發(fā)應(yīng)用了基于此算法的人臉識別系統(tǒng),其用到了包括特征臉的提取、相似性度量等方面的知識。由于PCA算法所得的特征臉子空間,每個(gè)像素的點(diǎn)都具有同等地位,即沒有明確的差異性,同時(shí),利用LDA算法進(jìn)行人臉識別會(huì)產(chǎn)生“小樣本”問題,因此對二者進(jìn)行融合,利用PCA先對人臉圖像進(jìn)行降維,使得類內(nèi)散布矩陣為非奇異矩陣,從而消除了“小樣本”問題,而LDA在進(jìn)行處理后又可使得最終獲得的特征

43、子空間具有差異性,從而提高了人臉識別率。通過本次實(shí)驗(yàn)得知如下幾點(diǎn):(1)識別率受到特征值數(shù)目的影響。實(shí)驗(yàn)中,利用能量維數(shù)法來選擇特征值數(shù)目,分別嘗試了閾值為70%到96%值間的各個(gè)數(shù)值,經(jīng)過測試,最終分別選取85%和94%在ORL人臉庫和YALE人臉庫上的進(jìn)行實(shí)驗(yàn)。(2)不同的人臉庫有著不同的識別率。(3)相同的特征值數(shù)目下,理論上,訓(xùn)練樣本數(shù)的增加有助于識別率的提高。雖然融合后的算法解決了單個(gè)算法的主要缺點(diǎn),但是仍然有著一些缺陷尚未完善。比如,過往的研究表明,PCA算法在降維的時(shí)候不可避免的丟失了一些數(shù)據(jù),這些數(shù)據(jù)可能含有重要的信息,而這些信息的丟失導(dǎo)致了識別率的下降。由于每種識別算法都或多或少的存在著缺點(diǎn),且人臉圖像受不良因素的影響較大,因此,更新或創(chuàng)造出新的算法,或者更新圖像的采集方法都會(huì)消耗大量的人力、物力和財(cái)力,故將兩種或兩種以上的識別算法進(jìn)行融合得到新的算法,將成為一個(gè)新的研究方向,PCA與LDA融合的算法也將更加完善。致 謝論文的最后,我要首先

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論