版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、摘要人臉識(shí)別技術(shù)是一種新型的身份識(shí)別技術(shù),它是生物識(shí)別技術(shù)的一種,人臉識(shí)別技術(shù)也是一個(gè)非?;钴S的研究領(lǐng)域,它覆蓋了數(shù)字圖像處理等諸多領(lǐng)域。隨著人們應(yīng)用需求的不斷深入,人臉識(shí)別技術(shù)將呈現(xiàn)出主流化、芯片化、標(biāo)準(zhǔn)化發(fā)展趨勢(shì)。人臉識(shí)別系統(tǒng)主要由檢測(cè)與定位、特征提取與識(shí)別兩部分組成,在這兩部分的基礎(chǔ)上還包括預(yù)處理等步驟,對(duì)于一個(gè)全自動(dòng)的人臉識(shí)別系統(tǒng),整個(gè)的識(shí)別過(guò)程可歸納為人臉檢測(cè)與定位、特征提取和識(shí)別。實(shí)現(xiàn)流程如下:首先是預(yù)處理,對(duì)圖像進(jìn)行光照處理等以改善圖像質(zhì)量;檢測(cè)與定位,從不同場(chǎng)景中檢測(cè)出人臉并將其從背景中分割出來(lái);對(duì)人臉庫(kù)中所有圖像大小和各器官位置歸一化;最后對(duì)歸一化的人臉圖像進(jìn)行特征提取與識(shí)別
2、。由于動(dòng)態(tài)識(shí)別研究處于起步階段,該技術(shù)相對(duì)較欠缺,因此本文只研究基于靜態(tài)人臉圖像的識(shí)別方法。關(guān)鍵詞:人臉識(shí)別;數(shù)字圖像處理;檢測(cè)方法AbstractFace recognition technology is a new identity, it is a kind of biometric technology, face recognition technology is also a very active research area, which covers digital image processing and many other fields. With the deepen
3、ing of peoples application requirements, the face recognition technology will appear in the mainstream, chip, standardization, development trends. Face recognition system mainly by the detection and location, feature extraction and recognition of two parts, including the pretreatment steps in these
4、two parts on the basis of a fully automatic face recognition system, the whole recognition process can be summarized as the human face detection and location, feature extraction and recognition. The process is as follows: First, pretreatment, light processing to improve image quality; detection and
5、location on the image to detect a persons face from different scenes and split out from the background; face database image size and each organ location normalization; Finally, the normalized face image feature extraction and recognition. Dynamic discrimination in its infancy, the technology is rela
6、tively lacking This article only study identification method based on the static face images.Key Words:face recognition; digital image processing; detection method- 2 -目錄摘要1Abstract21 緒論11.1 課題背景11.1.1 課題來(lái)源11.1.2 生物特征識(shí)別的意義11.1.3 生物特征識(shí)別分類21.1.4 人臉識(shí)別技術(shù)51.1.5 人臉識(shí)別技術(shù)的研究意義61.2 人臉識(shí)別發(fā)展歷史與概況71.3 人臉識(shí)別的難點(diǎn)82 人
7、臉識(shí)別的相關(guān)理論92.1 人臉特征92.1.1 膚色特征92.1.2 灰度特征92.2 PCA的基本概念92.2.1 PCA算法的原理102.2.2 PCA算法113 人臉識(shí)別算法設(shè)計(jì)133.1 人臉檢測(cè)與定位133.2 基于PCA的人臉特征提取143.3 人臉識(shí)別方法153.3.1 幾何特征法153.3.2 特征臉?lè)?63.3.3 彈性圖匹配法173.3.4 神經(jīng)網(wǎng)絡(luò)法184 基于PCA的人臉識(shí)別系統(tǒng)設(shè)計(jì)194.1 算法流程194.2 人臉識(shí)別系統(tǒng)實(shí)現(xiàn)195 總結(jié)及展望225.1 總結(jié)225.2 展望22致謝語(yǔ)23參考文獻(xiàn)24附錄25241 緒論1.1 課題背景1.1.1 課題來(lái)源隨著安全入
8、口控制和金融貿(mào)易方面應(yīng)用需要的快速增長(zhǎng),生物統(tǒng)計(jì)識(shí)別技術(shù)得到了新的重視。目前,微電子和視覺系統(tǒng)的新進(jìn)展使得高性能自動(dòng)識(shí)別技術(shù)在成本領(lǐng)域的實(shí)施降到可接受的水平。而臉識(shí)別是所有的生物識(shí)別方法,人臉識(shí)別技術(shù)中應(yīng)用最廣泛的技術(shù)之一是近年來(lái)的一種新的識(shí)別技術(shù),它是一種生物識(shí)別技術(shù)。隨著應(yīng)用需求的不斷深入,人臉識(shí)別技術(shù)將呈現(xiàn)主流,芯片,標(biāo)準(zhǔn)化發(fā)展趨勢(shì)。近年來(lái)受到各國(guó)研究人員的廣泛關(guān)注,主要用于安全等領(lǐng)域。人們更多的是在電影中看到這項(xiàng)技術(shù)的魔力:警察拍攝嫌疑人的面部圖像,輸入電腦,將數(shù)據(jù)庫(kù)中的數(shù)據(jù)與警方進(jìn)行比較,并找出嫌疑犯和犯罪記錄的細(xì)節(jié)。這不是虛構(gòu)的情節(jié)。在國(guó)外,國(guó)家和軍警等安全部門,很多重要部門長(zhǎng)期以
9、來(lái)一直使用面部識(shí)別技術(shù)。在家中,面部識(shí)別技術(shù)研究始于20世紀(jì)90年代,主要用于公安,金融,網(wǎng)絡(luò)安全,物業(yè)管理和考勤等。根據(jù)信息來(lái)源的人臉識(shí)別可分為兩類:基于靜態(tài)基于動(dòng)態(tài)信息的面部圖像識(shí)別和識(shí)別。由于其初期的動(dòng)態(tài)識(shí)別研究,技術(shù)相對(duì)較短,因此本文僅針對(duì)靜態(tài)面部圖像識(shí)別方法進(jìn)行研究。1.1.2 生物特征識(shí)別的意義生物識(shí)別技術(shù)(Biometric Identification Technology)是利用人體生物特征進(jìn)行身份認(rèn)證的一種技術(shù)1。生物特征是唯一的(與他人不同)、可以測(cè)量或可以自動(dòng)識(shí)別和驗(yàn)證的生理特性或行為方式,分為生理特征和行為特征。生物識(shí)別系統(tǒng)對(duì)生物特性進(jìn)行取樣,提取其唯一特征并進(jìn)行身份
10、認(rèn)證。典型的生物識(shí)別系統(tǒng)的系統(tǒng)結(jié)構(gòu)如圖1.1:圖1.1 生物識(shí)別系統(tǒng)結(jié)構(gòu)框圖目前的許多計(jì)算機(jī)系統(tǒng),包括許多敏感系統(tǒng),都是使用“用戶ID +密碼”方式對(duì)用戶的身份認(rèn)證和訪問(wèn)控制。事實(shí)上,這種方法意味著一些問(wèn)題。密碼,比如說(shuō)容易忘記,也容易被盜。而且,如果用戶忘了他的密碼,他無(wú)法進(jìn)入系統(tǒng),當(dāng)然可以由系統(tǒng)管理員重設(shè)你的密碼再次啟動(dòng)工作,但一旦系統(tǒng)管理員忘記了我的密碼,只有重新安裝整個(gè)系統(tǒng)才能工作。相關(guān)機(jī)構(gòu)調(diào)查,由于忘記密碼和IT廠商售后服務(wù)造成的問(wèn)題已成為最常見的問(wèn)題之一2。除了計(jì)算機(jī)網(wǎng)絡(luò)和應(yīng)用系統(tǒng),一些傳統(tǒng)的需求認(rèn)證,還有類似的安全問(wèn)題。如偽造和盜竊證書,不當(dāng)?shù)燃?jí)等。一些犯罪通過(guò)偽造文件進(jìn)入秘密地
11、點(diǎn)竊取機(jī)密信息,移民或一些非法犯罪偽造簽證和護(hù)照,這是因?yàn)閭鹘y(tǒng)文件使用易于偽造,未加密的紙質(zhì)文件。為了防止這種事件的發(fā)生,人們需要直接的身份認(rèn)證手段,這就是“人體生物識(shí)別技術(shù)”。他根據(jù)每個(gè)人都有自己的生物特征來(lái)識(shí)別每個(gè)人的身份。這些特點(diǎn)大多具有“個(gè)性”,“終身”和“攜帶”特征,以確保認(rèn)證的準(zhǔn)確性和可靠性。1.1.3 生物特征識(shí)別分類到目前為止,通過(guò)現(xiàn)代科技手段,人人同時(shí)發(fā)現(xiàn),每個(gè)人都有自己的視野,主要生物特征的三個(gè)特點(diǎn)有指紋,虹膜,人類細(xì)胞的遺傳遺傳等。雖然還有一些不能完全滿足上述三個(gè)特點(diǎn),但在一段時(shí)間內(nèi),“每個(gè)人都有自己的視野”是生物特征的特征,如面部,掌紋識(shí)別,言語(yǔ),行為等已成為專業(yè)生物檢
12、測(cè)的熱點(diǎn)研究與開發(fā),學(xué)習(xí)相關(guān)技術(shù),也被稱為“生物識(shí)別技術(shù)”。(1)虹膜識(shí)別虹膜識(shí)別技術(shù)是使用終身不變性的虹膜識(shí)別和差異。虹膜識(shí)別技術(shù)結(jié)合相應(yīng)的算法,可以實(shí)現(xiàn)非常高的精度。彩虹模具是眼睛包含顏料環(huán)形薄膜,由結(jié)締組織細(xì)胞和纖維組成,中間部分是眼睛。因?yàn)檠劬Φ念伾怯珊缒ど厮鶝Q定的,所謂的虹膜,老叫彩虹。虹膜的結(jié)構(gòu)被確定為人們誕生。虹膜識(shí)別是將虹膜的視覺特征轉(zhuǎn)換為512字節(jié)代碼的虹膜,代碼模板存儲(chǔ)以供以后使用識(shí)別。由于虹膜代碼是通過(guò)計(jì)算的復(fù)雜度獲得的,并且可以提供更多的特征點(diǎn),因此虹膜識(shí)別具有最高的準(zhǔn)確性。整個(gè)識(shí)別過(guò)程非常簡(jiǎn)單,虹膜的位置可以在一秒鐘內(nèi)完成。虹膜識(shí)別技術(shù)的缺點(diǎn),虹膜識(shí)別系統(tǒng)只是使用
13、統(tǒng)計(jì)原理,小規(guī)模實(shí)驗(yàn)還沒(méi)有做過(guò)全球認(rèn)證測(cè)試。此外,圖像采集設(shè)備昂貴,難以實(shí)現(xiàn)小型化。(2)視網(wǎng)膜識(shí)別視網(wǎng)膜識(shí)別技術(shù)使用激光來(lái)照射眼球的背面,以獲得具有唯一性的視網(wǎng)膜特征。視網(wǎng)膜是非常小的神經(jīng)背后的一些眼睛(1/50英寸),它是人的感覺光,并將是通過(guò)視神經(jīng)到大腦的信息的重要器官,它有一些相似之處膜的功能,用于神經(jīng)視網(wǎng)膜周圍的生物識(shí)別血管分布,即視網(wǎng)膜的四層細(xì)胞的距離。視網(wǎng)膜掃描設(shè)備為視網(wǎng)膜圖像,用戶的眼睛和輸入設(shè)備的距離應(yīng)在半英寸內(nèi),并且要讀取圖像輸入設(shè)備,眼睛必須處于靜止?fàn)顟B(tài),用戶的眼睛看著旋轉(zhuǎn)的綠色,輸入設(shè)備400特征點(diǎn)可以從視網(wǎng)膜獲取,與輸入指紋相比,指紋只能提供30到40個(gè)特征點(diǎn)用于輸入
14、,創(chuàng)建模板并完成確認(rèn)。像虹膜識(shí)別技術(shù)一樣,視網(wǎng)膜掃描可能是最可靠和最可靠的生物識(shí)別技術(shù),但沒(méi)有任何測(cè)試,技術(shù)將會(huì)損害用戶的眼球,但仍有待進(jìn)一步研究。 (3)面部識(shí)別基于面部特征的面部識(shí)別技術(shù)及其相互之間的關(guān)系,識(shí)別基于這些獨(dú)特特征的識(shí)別技術(shù)非常復(fù)雜,需要人工智能和機(jī)器學(xué)習(xí)系統(tǒng)的知識(shí),用于捕獲兩種技術(shù)的面部圖像的標(biāo)準(zhǔn)視頻和熱成像技術(shù)。標(biāo)準(zhǔn)視頻技術(shù)通過(guò)標(biāo)準(zhǔn)攝像頭吸收面部圖像或一系列圖像,抓住臉部,經(jīng)過(guò)一些重點(diǎn)記錄,面部識(shí)別技術(shù)通?;谝韵聨追N方式:A.分析面部外觀特征。B.全球面部圖像分析。C.分析了圖像中的面部溫譜圖和面部特征。雖然已經(jīng)有一些實(shí)用的面部識(shí)別技術(shù)產(chǎn)品,但目前面部識(shí)別系統(tǒng)收集的面部圖
15、像仍然有一定的局限性,如背景,光,表達(dá),其廣泛的最高識(shí)別精度范圍只有99左右。因此,臉部識(shí)別技術(shù)主要適用于某些應(yīng)用中,用戶可以抵制類型而完全無(wú)需人為干預(yù),其使用效果仍不能令人滿意。 (4)簽名識(shí)別簽名作為認(rèn)證手段成千上萬(wàn)年,我們熟悉銀行形式在簽名中作為我們身份的象征。數(shù)字簽名是否是這樣一個(gè)過(guò)程,測(cè)量圖像本身的運(yùn)動(dòng)和每個(gè)字母與字母,順序和壓力之間不同速度的簽名,簽名識(shí)別和語(yǔ)音識(shí)別,學(xué)習(xí)的確定是一種行為。使用簽名識(shí)別更有可能是可以接受的,它是一種公認(rèn)的識(shí)別技術(shù)。但隨著經(jīng)驗(yàn)的增長(zhǎng),生活方式隨著氣質(zhì)的變化而變化,簽名也隨之而變,為了處理不可避免的自然變化的簽名,我們必須在安全方面妥協(xié);用于簽名復(fù)雜而昂
16、貴的平板電腦,因?yàn)楣P記本電腦觸控板的分辨率有很大的差異,我們?cè)诩夹g(shù)上難以組合這兩者,它的尺寸很小型化。(5)語(yǔ)音識(shí)別語(yǔ)音識(shí)別是一種行為識(shí)別,語(yǔ)音識(shí)別設(shè)備不斷測(cè)量,記錄語(yǔ)音波形和變異特征,然后到現(xiàn)場(chǎng)進(jìn)行語(yǔ)音和注冊(cè)語(yǔ)音模板比較,最終判斷。語(yǔ)音識(shí)別是基于生理特征的聲音,它與語(yǔ)言識(shí)別的區(qū)別不是說(shuō)自己被識(shí)別,而是通過(guò)分析語(yǔ)音的獨(dú)特特征(例如,發(fā)音的頻率)到識(shí)別揚(yáng)聲器。屬于非接觸識(shí)別技術(shù),用戶可以自然接受。 和其他的行為識(shí)別技術(shù)一樣,語(yǔ)音因?yàn)樽兓姆秶?,故而很難進(jìn)行一些精確的匹配;語(yǔ)音會(huì)隨著音量、速度和音質(zhì)的變化(例如當(dāng)你感冒時(shí))而影響到采集與比對(duì)的結(jié)果。(6)基因識(shí)別DNA基因鑒定是迄今為止最準(zhǔn)確的
17、生物測(cè)定方法之一。但實(shí)施技術(shù)所需的設(shè)備非常復(fù)雜和昂貴,還需要專業(yè)技術(shù)人員的專門培訓(xùn)來(lái)操作和使用這些設(shè)備,識(shí)別時(shí)間更長(zhǎng),因此DNA基因鑒定不廣泛用于各種日常生活領(lǐng)域。(7)指紋識(shí)別指紋識(shí)別現(xiàn)在是生物檢測(cè)研究中最深入的研究,應(yīng)用最廣泛,發(fā)展最成熟的技術(shù)。指紋識(shí)別已經(jīng)是數(shù)百年歷史的識(shí)別技術(shù)。基于指紋識(shí)別技術(shù)的指紋識(shí)別技術(shù),可以從指紋特征值中得出的指紋特征點(diǎn)和指紋特征點(diǎn)等指紋特征點(diǎn)以及完成,分叉點(diǎn)或分支的全局特征指紋和局部特征進(jìn)行分析,以便可靠地通過(guò)指紋確認(rèn)一個(gè)人的身份。平均每個(gè)指紋有幾個(gè)獨(dú)特的特征點(diǎn)可以測(cè)量,每個(gè)特征點(diǎn)都有七個(gè)特點(diǎn),大約我們的10個(gè)手指具有最低的4900個(gè)獨(dú)立特征可以測(cè)量。足以識(shí)別指
18、紋識(shí)別是一種更可靠的識(shí)別方式。指紋識(shí)別技術(shù)長(zhǎng)期以來(lái),已經(jīng)在司法和刑事調(diào)查領(lǐng)域得到應(yīng)用,使人們經(jīng)常把指紋識(shí)別技術(shù)與犯罪調(diào)查有關(guān),具有一定的心理阻力,影響了指紋識(shí)別系統(tǒng)的可接受性。另外有些人或某些指紋由于指紋特征很少,所以很難形象化,也影響了指紋識(shí)別的準(zhǔn)確性。指紋識(shí)別技術(shù)有很多優(yōu)點(diǎn):指紋是人體的獨(dú)特特征,其準(zhǔn)確性和復(fù)雜性足以提供足夠的特征用于識(shí)別;如果要增加可靠性,只需注冊(cè)更多的指紋,識(shí)別更多的手指,最多可達(dá)十個(gè),每個(gè)指紋都是獨(dú)一無(wú)二的;掃描指紋快,使用起來(lái)很方便;讀取指紋,用戶必須手指和指紋采集相互接觸,是與指紋采集頭直接接觸讀取人體的生物學(xué)特性是最可靠的方法。指紋采集頭可以更小型化,價(jià)格會(huì)更便
19、宜。可以看出,指紋識(shí)別技術(shù)是最方便,可靠,非侵入和廉價(jià)的生物識(shí)別技術(shù)解決方案,對(duì)于廣大的市場(chǎng)應(yīng)用潛力巨大。每種生物識(shí)別技術(shù)均有各自的優(yōu)點(diǎn)和缺點(diǎn),其實(shí)用性也與應(yīng)用的領(lǐng)域密切相關(guān)。沒(méi)有一種技術(shù)在任何工作環(huán)境下都優(yōu)于其他技術(shù)。常用的各種生物特征識(shí)別技術(shù)的技術(shù)性能比較如表1.1所示:表1.1 常用生物識(shí)別技術(shù)比較類型鑒別可靠度可否運(yùn)用1對(duì)1比照可否運(yùn)用1對(duì)多比照傳感器價(jià)格尺寸虹膜很好是是高較大視網(wǎng)膜很好是是高較大面部一般是否低中等簽名一般是否低較小語(yǔ)音一般是否極低非常小基因最好是否極高很大指紋很好是是較低非常小1.1.4 人臉識(shí)別技術(shù)所謂的臉部識(shí)別,面部圖像或視頻是指輸入,確定是否有臉,如果有臉,進(jìn)一
20、步給出每個(gè)臉部的位置,大小和各種面部主要器官的位置,并基于此信息,每個(gè)面都進(jìn)一步提取身份,并與圖書館面對(duì)的已知臉部進(jìn)行比較,以便識(shí)別每張臉的身份。其研究?jī)?nèi)容包括以下五個(gè)方面:(1)從不同面部檢測(cè)的背景中檢測(cè)是否有臉部,并確定其位置,尺寸,形狀和過(guò)程等信息。與后續(xù)認(rèn)可有關(guān),可以正常工作,并保證最終識(shí)別結(jié)果的可靠性。(2)面部表示確定說(shuō),檢測(cè)人臉和已知面孔的數(shù)據(jù)庫(kù)的描述方式。通常意味著包括幾何特征(如歐氏距離和曲率,角度等),代數(shù)特征(如矩陣的特征向量)和固定特征模板等。(3)面部識(shí)別在狹義上面對(duì)認(rèn)知,往往是指在面對(duì)已知面孔的數(shù)據(jù)庫(kù)中識(shí)別臉部,獲取相關(guān)信息。這個(gè)過(guò)程的核心是選擇適當(dāng)?shù)娜四槺憩F(xiàn)和匹配
21、策略,系統(tǒng)結(jié)構(gòu)與人臉表現(xiàn)密切相關(guān)。(4)表達(dá)/姿勢(shì)分析即識(shí)別表情或手勢(shì)的面部,并進(jìn)行分類。(5)物理分類識(shí)別面對(duì)分類的物理特征,得出的結(jié)論是,有些信息如年齡,性別,種族或衍生自少數(shù)人的圖像,如面部的圖像來(lái)源于他們的父母孩子的臉像等本文的人臉識(shí)別主要是指在狹義上進(jìn)行人臉識(shí)別,是指采用數(shù)據(jù)庫(kù)識(shí)別已知臉部識(shí)別之間的匹配。面部識(shí)別是為了具有面部特征的計(jì)算機(jī)的目的來(lái)識(shí)別功能的身份?;谌四樧R(shí)別特征的主要設(shè)計(jì)到面部檢測(cè)和識(shí)別技術(shù)的復(fù)雜場(chǎng)景,是一種基于圖像理解,模式識(shí)別和計(jì)算機(jī)視覺,如統(tǒng)計(jì)和人工智能技術(shù)研究方向。1.1.5 人臉識(shí)別技術(shù)的研究意義(1)富有挑戰(zhàn)性的課題人臉識(shí)別是機(jī)器視覺和模式識(shí)別的領(lǐng)域,同時(shí)
22、也是最具挑戰(zhàn)性的問(wèn)題之一也有更廣泛的應(yīng)用。人臉識(shí)別技術(shù)是一個(gè)非?;钴S的研究領(lǐng)域,涵蓋數(shù)字圖像處理,模式識(shí)別,計(jì)算機(jī)視覺,神經(jīng)網(wǎng)絡(luò),心理學(xué),生理學(xué),數(shù)學(xué)等學(xué)科的內(nèi)容。如今,雖然在這方面的研究取得了一些令人鼓舞的成果,但FRT在實(shí)際應(yīng)用中仍然面臨著一個(gè)非常嚴(yán)重的問(wèn)題,因?yàn)槊娌刻卣鞯姆植挤浅O嗨疲槺旧砭褪且粋€(gè)靈活的對(duì)象,表達(dá),姿勢(shì)或發(fā)型,化妝萬(wàn)花筒正確識(shí)別帶來(lái)了相當(dāng)大的麻煩。如何正確識(shí)別很多人并滿足實(shí)時(shí)性要求是迫切需要解決的問(wèn)題。(2)面部感知系統(tǒng)的重要內(nèi)容基于視覺信息的面部感知系統(tǒng),包括面部檢測(cè)和跟蹤,面部特征位置和面部識(shí)別,面部分類(如年齡,種族,性別歧視),面部表情識(shí)別,唇讀三分系統(tǒng),如圖
23、1所示,你可以看到,面部檢測(cè)和追逐后,面部特征位置通常是面對(duì)感知的一個(gè)基本環(huán)節(jié),是后續(xù)工作的基礎(chǔ),具有重要的意義。雖然臉部識(shí)別不能說(shuō)其他面部感知模塊是一個(gè)必要的功能,但可以肯定的是,使用已知信息的身份,結(jié)合人的先前知識(shí),可以改善表情分析,唇讀和言語(yǔ)識(shí)別,手勢(shì)識(shí)別和手寫識(shí)別可靠性。而計(jì)算機(jī)對(duì)用戶身份的最直接應(yīng)用是基于特定的用戶環(huán)境設(shè)置:如用戶的個(gè)性化工作環(huán)境,信息共享和隱私保護(hù)等。(3)實(shí)際應(yīng)用廣泛人臉識(shí)別研究已經(jīng)有40多年的歷史,作為生物識(shí)別的一種,廣泛應(yīng)用在身份識(shí)別,海關(guān)監(jiān)控等領(lǐng)域。目前,人臉識(shí)別技術(shù)也逐漸走向了商用,如Eyematic公司研發(fā)的人臉識(shí)別系統(tǒng)等。目前研究較多的是靜態(tài)人臉識(shí)別技
24、術(shù),計(jì)算機(jī)靜態(tài)人臉識(shí)別是一個(gè)經(jīng)典的模式識(shí)別問(wèn)題。人臉識(shí)別的傳統(tǒng)方法主要分為:整體匹配方法,其中最具代表性的是主元分析法,其他混合型的算法。這些人臉識(shí)別系統(tǒng)多數(shù)都要依賴于面部特征(比如眼睛中心位置)的嚴(yán)格特征匹配來(lái)歸一化人臉以便提取人臉描述特征靜態(tài)人臉識(shí)別系統(tǒng)主要由檢測(cè)與定位,特征提取與識(shí)別兩部分組成,在這兩部分的基礎(chǔ)上海包括預(yù)處理等步驟。常用的人臉識(shí)別試驗(yàn)庫(kù)以美國(guó)軍方的FERET庫(kù)最為權(quán)威,它包括多人種,多年齡段,各種表情變化,光照變化,姿態(tài)變化的圖象,圖像的數(shù)量和實(shí)驗(yàn)的人數(shù)也非常多,可以充分地驗(yàn)證人臉識(shí)別算法。目前尚沒(méi)有專門測(cè)試人臉檢測(cè)和定位算法的圖像庫(kù)。如圖1.2所示是面部感知系統(tǒng)結(jié)構(gòu)圖。
25、圖1.2 面部感知系統(tǒng)結(jié)構(gòu)圖1.2 人臉識(shí)別發(fā)展歷史與概況在1960年代末到70年代初,臉上的研究剛剛開始。是Bledsoe最早的研究人員之一,他建立了半自動(dòng)人臉識(shí)別系統(tǒng),主要參數(shù)如跨度,面部特征點(diǎn)比例。自20世紀(jì)90年代以來(lái),要快速提高計(jì)算機(jī)硬件和軟件的性能,以及對(duì)面部識(shí)別能力的高需求,是開發(fā)更健壯的面部識(shí)別方法,稱為時(shí)代2是不可避免的。所以基于整體運(yùn)算的識(shí)別方法,很快成為研究重點(diǎn),如面法和彈性圖匹配法。自90年代中期以來(lái),考慮到人臉識(shí)別方法的整體識(shí)別和分量分析,結(jié)合發(fā)展趨勢(shì)。研究人員開始認(rèn)識(shí)到人臉識(shí)別算法必須能夠充分利用人臉各種特征信息,整合形狀的臉部拓?fù)浣Y(jié)構(gòu)特征,局部灰度特征和全局灰度分
26、布特征等特點(diǎn)。因此,出現(xiàn)了許多新算法,這些算法是原始的單一算法在一起,常見于完成人臉識(shí)別。可變形模型方法的灰度和形狀分離是其中之一。90年代末,一些商業(yè)面部識(shí)別系統(tǒng)開始逐漸進(jìn)入市場(chǎng),面部識(shí)別技術(shù)是當(dāng)今國(guó)際上最重要的手段之一。然而,這些技術(shù)和系統(tǒng)與實(shí)際應(yīng)用,性能和準(zhǔn)確性有一定距離。自2000年以來(lái),面部識(shí)別方法的表現(xiàn)雖然有一定的提高,但仍然存在與人們要求的差距,現(xiàn)有的照明方法,年齡,條件變化等表情,姿勢(shì)距離更敏感,當(dāng)某些條件發(fā)生變化時(shí),識(shí)別效果不是很理想。目前,人臉識(shí)別技術(shù)仍然只能用于某些要求的精度不高。1.3 人臉識(shí)別的難點(diǎn)目前人臉識(shí)別的難點(diǎn)主要存在于以下幾個(gè)方面:(1)光照變化是影響人臉識(shí)別
27、性能的最關(guān)鍵因素,對(duì)這個(gè)問(wèn)題的解決程度關(guān)系著人臉識(shí)別實(shí)用化進(jìn)程的成敗,在人臉圖像預(yù)處理或者歸一化階段,盡可能地補(bǔ)償乃至至消除其對(duì)識(shí)別性能的影響。(2)成像角度及成像距離等因素的影響,即人臉的姿態(tài)的變化,會(huì)垂直于圖像平面的兩個(gè)方向的深度旋轉(zhuǎn),會(huì)造成面部信息的部分缺失。(3)不同年齡的人臉有著較大的差別。身份證是以前照的,在逃犯的照片也是以前的,因此在公安部門的實(shí)際應(yīng)用中,年齡問(wèn)題是一個(gè)最突出的問(wèn)題。(4)采集圖像的設(shè)備較多,主要有掃描儀,數(shù)碼相機(jī),攝像機(jī)等。由于成像的機(jī)理不同,形成了同類人臉圖像的識(shí)別率較高,而不同類間人臉圖像識(shí)別率較低的情況。隨著人臉識(shí)別技術(shù)的發(fā)展,這一問(wèn)題也將逐步得到解決。(
28、5)人臉圖像的數(shù)據(jù)量巨大。目前由于計(jì)算量的考慮,人臉定位和識(shí)別算法研究大多使用尺寸很小的灰度圖像。一張64 * 64像素的256級(jí)灰度圖像就有4096個(gè)數(shù)據(jù),每個(gè)數(shù)據(jù)有256種可能的取值。定位和識(shí)別算法一般都很復(fù)雜,在人臉庫(kù)較大的情況下,計(jì)算量十分大,很多情況下速度令人難以忍受。而灰度數(shù)據(jù)事實(shí)上是喪失了色彩,運(yùn)動(dòng)等有用信息的。如果使用全部的有用信息,計(jì)算量就更了了。2 人臉識(shí)別的相關(guān)理論特征提取是人臉識(shí)別中的核心步驟,直接影響識(shí)別精度。由于人臉是多維彈性體,易受表情、光照等因素影響,提取特征的困難較大。特征提取的任務(wù)就是針對(duì)這些干擾因素,提取出具有穩(wěn)定性、有效性的信息用于識(shí)別。2.1 人臉特征
29、人臉特征3是識(shí)別的重要依據(jù)之一,檢測(cè)定位過(guò)程中也會(huì)用到人臉特征,其中膚色特征和灰度特征是兩類常用特征。2.1.1 膚色特征由膚色模型描繪的皮膚特征的顏色,其使用統(tǒng)計(jì)方法對(duì)目標(biāo)對(duì)象建模的顏色。 基于顏色特征的識(shí)別方法簡(jiǎn)單,可以快速定位臉部。 臉部膚色不依賴于細(xì)節(jié),大部分背景顏色差異,但方法對(duì)光和圖像采集裝置的特性敏感。 膚色在顏色空間聚合,膚色復(fù)雜,造成統(tǒng)一造型的一定難度。 該方法通常用作統(tǒng)計(jì)模型的輔助輔助方法,適用于粗略位置或?qū)\(yùn)行時(shí)間要求較高。2.1.2 灰度特征灰度特征包括輪廓特征,灰度分布特征(直方圖特征,鑲嵌圖特征等),結(jié)構(gòu)特征,模板特征等。由于人臉五官位置相對(duì)固定,灰度分布呈一定規(guī)律
30、性,因此,可利用灰 度特征來(lái)進(jìn)行人臉識(shí)別。通常采用統(tǒng)一的方法或特征空間變換的方法進(jìn)行灰度特征的提取,如利用K-L變換法4(由卡爾胡寧(Karhumen)與勒夫(Loeve )分別提出的一種圖像變換方法)得到的特征臉,利用小波變換得到的小波特征等。2.2 PCA的基本概念主成分分析(PCA)是廣泛使用的特征提取方法之一,最早提出了Ttirk和Pentland?;舅枷胧菍⒚娌孔兂墒噶烤仃?,然后提取特征向量。 PCA方法是模式識(shí)別領(lǐng)域的有效方法近年來(lái)也得到了一定的發(fā)展。與傳統(tǒng)PCA方法相比,2004年提出的ZDPCA方法是處理lh-zd矩陣更有效的方法之一,不需要將圖像轉(zhuǎn)換為向量,而是將原始圖像矩
31、陣直接用于協(xié)方差矩陣的重建圖像,與協(xié)方差矩陣的PCA方法相比,協(xié)方差矩陣的大小的ZDPCA圖像較小,如:假設(shè)圖像的大小為128128,ZDPCA協(xié)方差矩陣大小為128128,因此,ZDPCA具有顯著的優(yōu)越性計(jì)算。最近很多研究表明,ZDPCA方法在模式識(shí)別方面,特別是在面部識(shí)別領(lǐng)域是非常受歡迎的,是基于子模式二維二維主成分分析的人臉識(shí)別,通過(guò)阻擋原始圖像,該方法可以有效提取原始圖像的局部特征,同時(shí)通過(guò)直接在子圖像矩陣中使用雙向二維主成分的方法進(jìn)行特征提取,避免矩陣向量變換,可以精確計(jì)算特征向量的協(xié)方差矩陣并能有效降低特征尺寸,方法在姿勢(shì)條件下,面部表情和光照條件發(fā)生變化,具有良好的識(shí)別性能;模塊
32、ZDPCA文章7提出改進(jìn)面部識(shí)別方法,每個(gè)子塊的訓(xùn)練樣本中每個(gè)訓(xùn)練樣本的類別和類中的自適應(yīng)加權(quán)平均值的方法,以及訓(xùn)練樣本類中的自適應(yīng)加權(quán)平均值對(duì)相應(yīng)子塊的類進(jìn)行歸一化處理,然后由歸一化子塊組成的通用離散度矩陣,得到最優(yōu)投影矩陣;通過(guò)將訓(xùn)練樣本和測(cè)試樣本的子塊子塊的訓(xùn)練集合的加權(quán)平均值,將子塊的投影矩陣標(biāo)準(zhǔn)化為最佳投影矩陣,并獲得識(shí)別特征,該方法可以更好地反映局部特征圖像差異,提高識(shí)別率;文章8提出了一種模塊化ZDPCA和CSPCA面部驗(yàn)證算法,該方法從原始數(shù)據(jù),二維數(shù)據(jù)塊中使用ZDPCA進(jìn)行特征提取,可以有效提取局部特征的圖像,而不是新的原始圖像的低維模式,則CSPCA的新模式(基于客戶相關(guān)的
33、子空間線性判別分析方法),不僅在類中,類差異,構(gòu)成了PCA的缺陷。和客戶相關(guān)的子空間可以更好地描述不同個(gè)體之間的差異,比傳統(tǒng)判別能力的個(gè)體特征更好。這種方法可以更好地描述臉部特征,縮小尺寸,計(jì)算簡(jiǎn)單。由于協(xié)方差矩陣的維數(shù),將圖像矩陣轉(zhuǎn)換為高維向量的PCA方法是高且較少的訓(xùn)練樣本,導(dǎo)致計(jì)算復(fù)雜度和難度增加。 ZDPCA方法直接通過(guò)使用二維圖像來(lái)計(jì)算協(xié)方差矩陣,由于其協(xié)方差矩陣和相對(duì)足夠的訓(xùn)練樣本,ZDPCA方法計(jì)算特征向量的協(xié)方差更準(zhǔn)確,更快。雖然在文章中已經(jīng)表明ZDPCA方法比傳統(tǒng)的PCA方法有很多優(yōu)點(diǎn),但也有缺點(diǎn):首先,需要更多的系數(shù)來(lái)表示圖像,是基于雙向ZDPCA投影提出的,首先在同一個(gè)時(shí)
34、間為lh-zd矩陣空間的行和列方向?yàn)樽罴淹队?,然后lh-zd面向行向量和列的矩陣投影到兩個(gè)不同的子空間,兩邊的投影方法是最大的優(yōu)點(diǎn)是與最小量的面部圖像系數(shù),從而達(dá)到最高的壓縮率;二,筆者在文章中已經(jīng)失去了一些ZDPCA協(xié)方差信息的方法,這個(gè)信息包括一些重要的面對(duì)局部幾何結(jié)構(gòu)變化信息,但PCA方法可以保留信息。如果ZDPCA方法可以用于協(xié)方差的更多信息,則可以提高該方法的識(shí)別率。因此,本節(jié)ZDPCA方法研究如何使用協(xié)方差更多的信息。2.2.1 PCA算法的原理令為表示環(huán)境的維隨機(jī)變量。假設(shè)均值為零,即:令w表示維單位向量,在其上投影。這個(gè)投影被定義為向量和w的內(nèi)積,表示為:滿足約束而主成分分析的
35、目的就是尋找一個(gè)權(quán)值向量w使得表達(dá)式Ey2的值最大化:根據(jù)線性代數(shù)的理論,可以知道滿足式子值最大化的w應(yīng)該滿足下、式:即使得上述式子最大化的w是矩陣Cx的最大特征值所對(duì)應(yīng)的特征向量。2.2.2 PCA算法從本質(zhì)上來(lái)說(shuō),主成分分析法是一種線性映射算法,它的算法步驟如下:設(shè)原始觀測(cè)數(shù)據(jù)樣本集合為一組(個(gè))零均值(如果不是的話,則先做去均值預(yù)處理,相當(dāng)于對(duì)全體向量作一次平移變換)的n維隨機(jī)向量:,以樣本集合的協(xié)方差矩陣(總體散度矩陣)為產(chǎn)生矩陣。即, 或 其中為觀測(cè)樣本的均值向量,由于是零值向量,所以為零值向量。顯然,是一個(gè)對(duì)稱、半正定的nn矩陣,對(duì)它進(jìn)行特征值分解得到: 其中U是正交矩陣,是的特征
36、值,且,各特征值對(duì)應(yīng)的特征向量就是矩陣U的各列(從左到右),它是一組正交基。作線性變換y =UTx,原始的各觀測(cè)數(shù)據(jù)向量變換成一組特征向量,其協(xié)方差矩陣為: 新特征向量組的稱為第個(gè)主成分。顯然,的第個(gè)特征值等于的方差,第個(gè)主成分的方差貢獻(xiàn)率為: 那么前m個(gè)主成分的累計(jì)方差貢獻(xiàn)率為: 當(dāng)前m個(gè)主成分的累計(jì)方差貢獻(xiàn)率足夠大時(shí),就可以只取前m個(gè)主成分作為新特征,而將其余的n-m個(gè)新的特征舍去,從而實(shí)現(xiàn)了觀測(cè)數(shù)據(jù)樣本集合的特征提取。此時(shí)重構(gòu)誤差的極小值為: 重構(gòu)誤差的極小值為: 3 人臉識(shí)別算法設(shè)計(jì)當(dāng)人臉圖象的來(lái)源是一幅靜態(tài)圖象時(shí)進(jìn)行的人臉識(shí)別屬于靜態(tài)人臉識(shí)別。人臉識(shí)別算法包含2部分:人臉定位和歸一化
37、(如圖3.1),對(duì)于一個(gè)全自動(dòng)的人臉識(shí)別系統(tǒng),整個(gè)的識(shí)別過(guò)程可歸納為人臉檢測(cè)與定位、特征提取和識(shí)別,這兩個(gè)環(huán)節(jié)獨(dú)立性很強(qiáng),而在許多特定情況下,人臉檢測(cè)與定位工作比較簡(jiǎn)單,而“特征提取與識(shí)別”環(huán)節(jié)得到了更為廣泛和深入研究。圖3.1 人臉定位3.1 人臉檢測(cè)與定位目前人臉檢測(cè)還是一個(gè)相當(dāng)困難的工作,其中所面臨的問(wèn)題可以歸結(jié)如下:圖像中是否存在人臉:這是人臉檢測(cè)不同于其它有關(guān)人臉研究工作的地方,即如何判斷圖像中是否存在人臉,如何區(qū)別人臉和類似人臉的非人臉圖像。檢測(cè)不同表現(xiàn)形式的人臉:人臉可能以不同視角出現(xiàn)在圖像中,也可能被某些物體遮擋,造成某些用于檢測(cè)而需提取的人臉特征不可見。圖像中存在著噪聲:由于
38、成像時(shí)亮度、對(duì)比度等因素的影響使圖像不清晰,人臉與背景區(qū)別不大,給檢測(cè)帶來(lái)一定的難度。人臉自身的因素:由于人臉結(jié)構(gòu)復(fù)雜,某些局部特征具有隨機(jī)性(如眼鏡、胡須、發(fā)型等),而且還存在著不同表情的人臉,這些都給人臉檢測(cè)帶來(lái)難度。由此可見,人臉檢測(cè)是一個(gè)復(fù)雜而具有挑戰(zhàn)性的問(wèn)題。任意給定一個(gè)圖像或者一組圖像序列,人臉檢測(cè)的目的就在于判定該圖像或圖像序列中是否存在人臉。如果存在,則返回其位置和空間分布,將所有人臉從背景圖象 中分割出來(lái),并確定每個(gè)人臉在圖象中的大小和位置,人臉檢測(cè)系統(tǒng)的輸入是可能包含人臉的圖象,輸出是關(guān)于圖象中是否存在人臉以及人臉的數(shù)目,位置 ,尺度等信息的參數(shù)化描述。根據(jù)這個(gè)定義可知,人
39、臉檢測(cè)可分為兩類:第一類是在靜止圖像中判斷是否存在人臉,若存在,則定位人臉的位置;第二類 是在視頻圖像序列中判斷是否存在人臉,若存在,則動(dòng)態(tài)地跟蹤人臉。顯然,后一種所采用的人臉檢測(cè)方法要比前一種困難。人臉檢測(cè)的基本思想是用知識(shí)或統(tǒng)計(jì)的方法對(duì)人臉建模,比較所有可能的待檢測(cè)區(qū)域與人臉模型的匹配度,從而得到可能存在人臉的區(qū)域。3.2 基于PCA的人臉特征提取通常得到的數(shù)據(jù)量直接由圖像很大,為了有效地分類識(shí)別,是轉(zhuǎn)換原始數(shù)據(jù),最能反映分類性質(zhì)的特征,這是特征提取和選擇的過(guò)程。 我們稱之為由原始數(shù)據(jù)測(cè)量空間組成的空間,稱為特征空間分類的空間取決于。 通過(guò)轉(zhuǎn)換,我們可以將所述模型的高維空間的測(cè)量值放在下模
40、型的特征空間的維度上。 特征空間模型中的表示也稱為樣本,它通常表示為向量,即特征空間中的單個(gè)點(diǎn)。人臉圖像可以看作是一個(gè)矢量(如圖3.2所示),如果圖像的高度和寬度分別為h和w,則對(duì)應(yīng)的矢量維數(shù)為w*h,人臉矢量屬于一個(gè)空間,稱為是圖像空間。圖3.2 人臉矢量示意圖7由于每個(gè)人臉都非常類似,在相同的位置都有兩只眼睛,一個(gè)嘴巴,一個(gè)鼻子等等,所以在圖像空間里所有的人臉矢量都聚集在一個(gè)狹窄的區(qū)域內(nèi)(如圖3.3所示),所以整個(gè)圖像空間不是人臉描述的一個(gè)優(yōu)化空間,PCA主元分析法的任務(wù)就是構(gòu)造一個(gè)能更好描述人臉的人臉空間,降低空間維數(shù),使新的人臉空間的基向量(又叫主元)能更好地描述典型的人臉模式。圖3.
41、3 人臉空間示意圖8PCA主元分析法又稱Karhunen-Loece(KL)變換,它的目的是降維,人臉空間是典型的高維空間,一個(gè)128*128像素的人臉若視為向量,就有16384維,運(yùn)算極不方便。若將人臉看作是平穩(wěn)的高斯過(guò)程,就可以利用KL變換提取主元,達(dá)到降維的目的。KL變換是圖像壓縮的一種最優(yōu)化變換,高維的圖像空間經(jīng)過(guò)KL變換后得到一組新的正交基(主元),保留其中最重要的正交基,由這些正交基可以組成低維線性空間。如果假設(shè)人臉在這些低維線性空間的投影具有可分性,那么就可以把這些投影用作識(shí)別的特征向量。這就是PCA的主要思想。PCA最早是由統(tǒng)計(jì)學(xué)發(fā)展過(guò)來(lái)的,然后就被用在人工神經(jīng)網(wǎng)絡(luò)理論中,所以
42、對(duì)PCA的理論描述可以從兩方面進(jìn)行,一種是從人工神經(jīng)網(wǎng)絡(luò)理論這個(gè)角度來(lái)理解,這樣相對(duì)來(lái)講比較直觀。另一種就是從統(tǒng)計(jì)學(xué)角度來(lái)理解,這就比較嚴(yán)格,比較難懂,因?yàn)檫@是嚴(yán)格的按照數(shù)學(xué)的理論來(lái)推導(dǎo)出來(lái)的。3.3 人臉識(shí)別方法高水平的識(shí)別工作一般需要復(fù)雜的處理過(guò)程,如將圖象映射到表面,恢復(fù)為三維模型,進(jìn)行模型匹配等,但基于二維的圖象處理也可進(jìn)行人臉識(shí)別,下面介紹常用的幾種方法。3.3.1 幾何特征法很多人也將使用面部識(shí)別中的幾何特征方法。例如,常用的幾何特征具有面部特征如眼睛,鼻子,嘴巴,臉部特征的局部形狀特征和面部特征分布在臉部上的幾何特征。通過(guò)拓?fù)湎闰?yàn)知識(shí)的面部幾何關(guān)系來(lái)提取特征。在這種基于幾何特征的
43、識(shí)別中,將其識(shí)別為特征向量的匹配,基于歐幾里德距離的決策是最常用的識(shí)別方法。面對(duì)眼睛,鼻子,嘴巴,下巴等部位,由于這些部件的形狀,尺寸和結(jié)構(gòu)各不相同,使得世界各個(gè)面孔在千差萬(wàn)別,所以對(duì)于這些部分的形狀和結(jié)構(gòu)幾何描述之間的關(guān)系,可以作為面部識(shí)別中最重要的特征。使用幾何特征進(jìn)行正面識(shí)別通常通過(guò)提取人眼,嘴,鼻等重要特征點(diǎn)位置和重要器官如眼幾何作為分類特征?;趲缀翁卣髯R(shí)別方法具有較少的記憶,對(duì)光不敏感,其優(yōu)點(diǎn)簡(jiǎn)單易懂。這種方法也有一些問(wèn)題:提取圖像的穩(wěn)定性特征很困難;(2)強(qiáng)烈的表情變化和姿勢(shì)變化不好的魯棒性;(3)由于某些信息丟失,適用于粗略分類??勺冃文0宸梢员徽J(rèn)為是改進(jìn)的幾何特征,它是一種
44、經(jīng)典的模式識(shí)別方法,這種方法主要是使用歸一化互相關(guān),直接計(jì)算兩個(gè)圖像之間的匹配度。最簡(jiǎn)單的面部模板將面向橢圓形,橢圓形在檢測(cè)面是圖像。另一種方式是面對(duì)一組獨(dú)立的小模板,例如眼睛,鼻子,嘴巴模板模板模板,眉模板和下巴模板等。這些模板必須利用每個(gè)功能的輪廓,而傳統(tǒng)的方法邊緣檢測(cè)非常難以獲得高連續(xù)邊緣。即使具有高可靠性的邊緣,也難以自動(dòng)提取所需的特性。因此,使用彈性模板法提取特征表現(xiàn)出其獨(dú)特優(yōu)勢(shì)。具有一套彈性模板根據(jù)形狀的特點(diǎn),先驗(yàn)知識(shí)設(shè)計(jì)的可調(diào)參數(shù)被定義。為了找出這組參數(shù),有必要使用圖像的邊緣,峰谷值和強(qiáng)度信息以及先驗(yàn)知識(shí)的形狀特征來(lái)設(shè)計(jì)適當(dāng)?shù)哪芰亢瘮?shù)。參數(shù)調(diào)整時(shí),能量方向能量在能量達(dá)到最大時(shí)間時(shí)
45、,相應(yīng)模板的這組參數(shù)最符合形狀特征。其基本思想是:設(shè)計(jì)模型參數(shù)可調(diào)節(jié)器官(可變形模板,如圖3.4所示),并定義能量函數(shù),并通過(guò)調(diào)整模型參數(shù)來(lái)最小化能量函數(shù),將模型參數(shù)作為幾何特征器官。圖3.4可變形模板方法的眼模型93.3.2 特征臉?lè)ㄟ@種方法的原理是PCA(Principal Component Analysis 主分量分析法)PCA用于特征選擇和降低圖象維數(shù)的一種通用方法,因此可以用K-L變換獲取其正交K-L基底,對(duì)應(yīng)其中較大特征值的基底具有與人臉相似的形狀,因此,又稱之為特征臉,得到人臉重要特征之后,要對(duì)其進(jìn)行主成份分析(PCA),其具體的算法思想如下: 若抽樣參加訓(xùn)練的人臉圖像有M張,
46、每張圖像的維數(shù)是N*N,則可以分別表示為:x1、x2、x3、x M ,那么平均臉可以表示為:每張人臉和平均人臉的距離可以表示為:假設(shè)矩陣A=d1,d2,d2,d M,特征臉需要做的就是找出矩陣 AAT的前Z個(gè)較大特征值的特征向量,但AAT是一個(gè)N2*N2維的大矩陣,求這樣一個(gè)矩陣的特征值計(jì)算量是非常大的。為此我們可以先求出 AAT的特征值與特征向量,然后求出uiuj表示AAT的特征向量,uj表示ATA的特征向量,ni是ATA的特征值,uj就是所指的特征臉。求出特征臉以后,所剩下的工作就是要對(duì)庫(kù)中的人臉進(jìn)行降維,由uj可以組成一個(gè)投影矩陣,表示為W=u1u2,,u Z-1,并進(jìn)行降維:由上式得出
47、所有人臉向量的降維向量?;谔卣髂樀淖R(shí)別方法優(yōu)點(diǎn):它大大降低了原始空間的維數(shù),在這個(gè)低維空間中可進(jìn)行人臉檢測(cè)和識(shí)別。Pentland等人在人臉檢測(cè)中使用了特征臉?lè)椒ǎ玫降奶卣髂樔鐖D3.5所示:圖3.5特征臉10缺點(diǎn):這種方法對(duì)照明條件的變化更為敏感。如果您在光線條件下提供面部圖像更改,則投影矩陣保留主要元素,并由于光線而發(fā)生變化。因此,點(diǎn)投影矩陣不是很好的分類,甚至變得模糊的輪廓。作為面部技術(shù)改進(jìn),F(xiàn)isher線性判斷標(biāo)準(zhǔn)可以應(yīng)用于面部識(shí)別(Fisher Linear Discriminant,簡(jiǎn)寫為FLD)。并比較PCA和FLD,結(jié)論是面對(duì)不在區(qū)域分類和類別之間不同角色之間的變化,但它們是
48、平等的; FLD的一個(gè)缺點(diǎn)是克服了PCA;它可以在類之間的區(qū)域分類和散射矩陣內(nèi)。線性判斷標(biāo)準(zhǔn)分析并不總是比PCA好。當(dāng)每種樣本較小時(shí),PCA的效果優(yōu)于FLD。在許多領(lǐng)域,特別是在面部識(shí)別領(lǐng)域,人們不了解不同分類的基本分布。因此,實(shí)際上很難找出現(xiàn)有的培訓(xùn)數(shù)據(jù)(如適用)。他們的研究結(jié)果表明,這一考慮是正確的,在一些實(shí)驗(yàn)中,PCA的效果優(yōu)于FLD,而在其他試驗(yàn)中,F(xiàn)LD的作用優(yōu)于PCA。3.3.3 彈性圖匹配法彈性圖匹配法11(Elastic Graph Matching)是一種基于動(dòng)態(tài)鏈接結(jié)構(gòu)(Dynamic Link Architecture,DLA)的方法。該方法在二維空間中為人臉建立屬性拓?fù)?/p>
49、圖,把拓?fù)鋱D放置在人臉上,每一節(jié)點(diǎn)包含一特征向量,它記錄了人臉在該頂點(diǎn)附近的分布信息,節(jié)點(diǎn)間的拓?fù)溥B接關(guān)系用幾何距離來(lái)標(biāo)記,從而構(gòu)成基于二維拓?fù)鋱D的人臉描述。利用該方法進(jìn)行人臉識(shí)別時(shí),可同時(shí)考慮節(jié)點(diǎn)特征向量匹配和相對(duì)幾何位置匹配。在待識(shí)別人臉圖像上掃描拓?fù)鋱D結(jié)構(gòu)并提取相應(yīng)節(jié)點(diǎn)特征向量,把不同位置的拓?fù)鋱D和庫(kù)中人臉模式的拓?fù)鋱D之間的距離作為相似性度量。此外,可用一個(gè)能量函數(shù)來(lái)評(píng)價(jià)待識(shí)別人臉圖像向量場(chǎng)和庫(kù)中已知人臉向量場(chǎng)間的匹配度,即最小能量函數(shù)時(shí)的匹配。該方法使得幾何特征描述越來(lái)越充分,保留了人臉的拓?fù)浣Y(jié)構(gòu)和局部特征,通過(guò)局部節(jié)點(diǎn)調(diào)節(jié)和彈性圖變形,以及局部特征的多級(jí)Gabor變換描述,使得該方法
50、對(duì)光照,姿態(tài)變化等具有較好的適應(yīng)性。該方法的主要缺點(diǎn)是計(jì)算量較大,必須對(duì)每個(gè)存儲(chǔ)的人臉計(jì)算其模型圖,占用很大存儲(chǔ)空間。3.3.4 神經(jīng)網(wǎng)絡(luò)法基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法是近幾年比較活躍的一個(gè)研究方向,已被應(yīng)用于人臉檢測(cè)、人臉識(shí)別、表情分析等問(wèn)題,并取得了較好的效果。該類方法將人臉用灰度圖表征,利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和分類能力進(jìn)行識(shí)別。通常需考慮兩方面的因素:選擇圖像哪些參數(shù)作為輸入;選擇何種神經(jīng)網(wǎng)絡(luò)。目前主要有兩種輸入策略,第一種是將提取的特征向量作為輸入向量;第二種是將圖像像素直接輸入神經(jīng)網(wǎng)絡(luò)。第一種輸入策略可有效控制神經(jīng)網(wǎng)絡(luò)規(guī)模,但對(duì)提取特征的要求較高;第二種對(duì)于提取要求降低,并可根據(jù)樣本集自身
51、的方差特征來(lái)進(jìn)行特征選擇,但網(wǎng)絡(luò)規(guī)模擴(kuò)大而造成收斂緩慢。用于人臉識(shí)別的神經(jīng)網(wǎng)絡(luò)有很多,如基于反向傳播(Back Propogation,BP)算法的BP神經(jīng)網(wǎng)絡(luò),該方法基本理論簡(jiǎn)單且有很強(qiáng)的學(xué)習(xí)能力,運(yùn)算量較??;Cottrell等人提出使用級(jí)聯(lián)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別,對(duì)受損人臉的識(shí)別能力較好;LinSH等人提出基于概率決策的神經(jīng)網(wǎng)絡(luò)(Probabilistic Decision-Based Neural Network,PDBNN)方法,采用虛擬樣本進(jìn)行強(qiáng)化和反強(qiáng)化學(xué)習(xí),從而得到較理想的概率估計(jì)結(jié)果,并采用模塊化網(wǎng)絡(luò)結(jié)構(gòu)加快學(xué)習(xí)。徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(Radial Basis Function N
52、etwork,RBFN)因具有逼近性好、空間描述緊湊、訓(xùn)練速度快等特點(diǎn)也被用于人臉識(shí)別。神經(jīng)網(wǎng)絡(luò)用以解決復(fù)雜模式識(shí)別與行為控制問(wèn)題,其特色在于信息分布式存儲(chǔ),具有良好的容錯(cuò)性、聯(lián)想記憶功能以及通過(guò)學(xué)習(xí)獲取知識(shí)并解決問(wèn)題的能力。但該類方法要求訓(xùn)練集中包含較多的人臉圖像,只能適合于小型人臉庫(kù)。由于原始灰度圖像數(shù)據(jù)量龐大,神經(jīng)元數(shù)目多,該方法運(yùn)算量較大。4 基于PCA的人臉識(shí)別系統(tǒng)設(shè)計(jì)4.1 算法流程根據(jù)前面第二,三章所述,我們知道經(jīng)過(guò)Gabor小波變換后,維數(shù)將會(huì)變得很高,不利于人臉識(shí)別。很多研究成果表明,PCA在多數(shù)人臉識(shí)別方法中都起到重要的作用,因此降維選擇了這種方法。但是,子空間的維數(shù)要慎重
53、考慮,通過(guò)降維并慎重選擇降維后的維數(shù),可以解決人臉識(shí)別中的學(xué)習(xí)問(wèn)題。圖4.1描述了這個(gè)人臉識(shí)別系統(tǒng)的構(gòu)成。圖4.1 人臉識(shí)別系統(tǒng)總體結(jié)構(gòu)具體的訓(xùn)練和識(shí)別過(guò)程如下:將c個(gè)人臉圖像通過(guò)gabor小波變換后組成訓(xùn)練樣本集,其中那么全部人臉圖像均值為:對(duì)每幅人臉圖像求與均值的差值,其協(xié)方差矩陣為 根據(jù)第三章所提到的計(jì)算方法,求出協(xié)方差矩陣的特征值和特征向量,從而獲得映射矩陣其中,m是與前m個(gè)最大特征值對(duì)應(yīng)的特征向量,選擇,將訓(xùn)練樣本集全部投影到m維特征空間。同樣,建立測(cè)試人臉庫(kù),經(jīng)過(guò)gabor小波變換后,再投影到m維特征空間中,然后根據(jù)歐氏距離,通過(guò)求出訓(xùn)練圖像與測(cè)試圖像特征點(diǎn)的距離來(lái)分類。最后確定類
54、別。4.2 人臉識(shí)別系統(tǒng)實(shí)現(xiàn)通過(guò)GUI架構(gòu)的支持下,設(shè)計(jì)了基于圖像不均勻分割的人臉識(shí)別系統(tǒng)。系統(tǒng)的主界面如圖4.2所示:圖4.2 系統(tǒng)主界面圖像識(shí)別結(jié)果界面如圖4.3所示。圖4.3 圖像識(shí)別結(jié)果界面5 總結(jié)及展望5.1 總結(jié)人臉識(shí)別技術(shù)(Face Recognition Technology)就是利用計(jì)算機(jī)分析人臉圖像,從中提取有用的識(shí)別信息,用來(lái)辨認(rèn)身份的一門技術(shù)。由于人的行動(dòng)和人臉的裝飾表情都具有復(fù)雜的模式變化,加之存在人臉的圖像背景的復(fù)雜性,使得人臉的檢測(cè)成為一個(gè)極具挑戰(zhàn)的課題,具有很高的學(xué)術(shù)價(jià)值和應(yīng)用前景。本文主要介紹了靜態(tài)人臉識(shí)別的技術(shù),對(duì)其進(jìn)行了分類總結(jié),同時(shí),詳細(xì)介紹了其中的關(guān)鍵
55、技術(shù)和研究成果。本文綜述了靜態(tài)人臉識(shí)別技術(shù)國(guó)內(nèi)外研究的現(xiàn)狀、以及發(fā)展趨勢(shì),分析了存在的問(wèn)題,提出了一些研究思路和技術(shù)方案。5.2 展望人類對(duì)人臉識(shí)別的研究已經(jīng)有40多年的時(shí)間,并取得了相當(dāng)?shù)某删?,但距離實(shí)際可用行還有一定的距離,存在的問(wèn)題也不少。從目前的研究成果來(lái)看,成功的人臉識(shí)別至少需要考慮以下幾個(gè)方面:(1)人臉是具有一定可變形部分的三維固體的表面,目前仍存在爭(zhēng)議的是在選用人臉模型時(shí),是用二維表面還是三維模型基哪一個(gè)更好點(diǎn)。 (2)由于外部干擾不可避免,預(yù)處理的效果將會(huì)影響到識(shí)別結(jié)果,好的人臉模型應(yīng)能夠在識(shí)別的同時(shí),抑制分離外在干擾的影響。 (3)對(duì)于表達(dá)人臉的各種特征需要進(jìn)行比較和選擇,
56、以找出人臉最活躍的特征。這可以通過(guò)如下兩種途徑:一是比較同一個(gè)人的多張圖片,以得到穩(wěn)定的特征;另一種方法就是比較不同人的圖片,以得出該人最“與眾不同”之處。 (4)人臉識(shí)別是人類視覺的獨(dú)特過(guò)程,因此人臉識(shí)別必須結(jié)合生理學(xué)和心理學(xué)的研究成果。致謝語(yǔ)在論文完成之際,我的心情無(wú)法平靜,從選題、資料收集到論文的撰寫整個(gè)過(guò)程中,老師、同學(xué)、朋友給了我熱情的幫助,在這里請(qǐng)接受我誠(chéng)摯的謝意!我首先要感謝xxx老師,在選題以及實(shí)驗(yàn)過(guò)程中給予我指導(dǎo)。畢老師多次詢問(wèn)實(shí)驗(yàn)進(jìn)程,并為我指點(diǎn)迷津,幫助我開拓思路。畢老師花費(fèi)很多的精力一遍又一遍指出每稿中的具體問(wèn)題,嚴(yán)格把關(guān),在此我表示衷心的感謝。同時(shí),我還要感謝在我大學(xué)四年悉心教導(dǎo)我,給予我極大關(guān)心和支持的各位電信學(xué)院領(lǐng)導(dǎo)與老師,是你們教會(huì)了我很多有用的知識(shí),特別是教會(huì)了我思考問(wèn)題、解決問(wèn)題的方
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 承接豬場(chǎng)項(xiàng)目合同范例
- 業(yè)務(wù)委托服務(wù)合同范例
- 更換供熱合同范例
- 學(xué)校垃圾分類合同范例
- 墻壁打磨保潔合同范例
- 弱電規(guī)劃設(shè)計(jì)合同范例
- 2007簡(jiǎn)易勞動(dòng)合同范例
- 護(hù)士短期聘用合同范例
- 廣告銷售耗材合同范例
- 大額物業(yè)維修合同范例
- 2024年安徽省蚌埠二中高一自主招生考試英語(yǔ)
- 2024年學(xué)校工會(huì)工作總結(jié)參考范本(2篇)
- 《比賽場(chǎng)次》(教學(xué)設(shè)計(jì))-2023-2024學(xué)年北師大版數(shù)學(xué)六年級(jí)上冊(cè)
- 重難點(diǎn)專題41 圓錐曲線中定比點(diǎn)差法的應(yīng)用十一大題型-備戰(zhàn)2025年高考《數(shù)學(xué)》重難點(diǎn)題型突破(新高考)解析版
- S學(xué)習(xí)問(wèn)題個(gè)性化分析診斷系統(tǒng)v2.0 分析標(biāo)準(zhǔn)
- 因式分解法一元二次方程練習(xí)100題及答案
- 產(chǎn)品逆向設(shè)計(jì)智慧樹知到期末考試答案章節(jié)答案2024年武漢職業(yè)技術(shù)學(xué)院
- 人音版 一年級(jí)上冊(cè)《國(guó)旗國(guó)旗真美麗》(教案)
- 上海生活垃圾分類現(xiàn)狀調(diào)查報(bào)告
- 《數(shù)與形》(教案)2023-2024學(xué)年數(shù)學(xué)六年級(jí)上冊(cè)
- 北京市東城區(qū)2023-2024學(xué)年八年級(jí)上學(xué)期期末生物試題【含答案解析】
評(píng)論
0/150
提交評(píng)論