基于稀疏表示的魯棒人臉識別_第1頁
基于稀疏表示的魯棒人臉識別_第2頁
基于稀疏表示的魯棒人臉識別_第3頁
基于稀疏表示的魯棒人臉識別_第4頁
基于稀疏表示的魯棒人臉識別_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)字圖像處理期末大作業(yè)(報告)基于稀疏表示的魯棒人臉識別Robust Face Recognition via Sparse Representation學(xué)院(系):創(chuàng)新實(shí)驗(yàn)學(xué)院專業(yè):信息與通信工程學(xué)生姓名:李潤順學(xué)號:任課教師:馬曉紅完成日期:2015年7月20日大連理工大學(xué)Dalia n Uni versity of Tech no logy摘要人臉識別是現(xiàn)代生物信息識別中的一項(xiàng)重要技術(shù),對于給定的人臉圖像,利用已經(jīng) 存儲的人臉數(shù)據(jù)庫確認(rèn)該圖像中的一個或多個人的身份。 現(xiàn)有的人臉識別方法大多需要 進(jìn)行圖像預(yù)處理及復(fù)雜的特征提取,選擇何種特征對識別率影響非常大,并且對遮擋、 噪聲等情況缺少魯

2、棒性,這些問題往往使得現(xiàn)有的識別方法在應(yīng)用中受到制約。不同于 傳統(tǒng)的人臉識別算法,稀疏表示通過最小11范數(shù)計算得到的,文獻(xiàn)1提出了一個用于 (基于圖像)目標(biāo)識別的一般分類算法。這個新框架對人臉識別中兩個重要問題(特征 提取和遮擋魯棒性)提出了新思路。稀疏表示是壓縮感知中的關(guān)鍵理論,數(shù)據(jù)的稀疏表示,可以從本質(zhì)上降低數(shù)據(jù)處理 的成本,提高壓縮效率。稀疏表示用在分類識別上有獨(dú)特的優(yōu)勢,對于特征提取,如果 我們在識別中適當(dāng)?shù)乩孟∈栊?,特征的選取不再至關(guān)重要,然而,重要的是特征數(shù)目 是否充分大,稀疏表示是否得到準(zhǔn)確計算。只要特征空間維數(shù)超過某個閾值(用稀疏表 示理論估計得到),非傳統(tǒng)特征例如下采樣圖像

3、和隨機(jī)投影和傳統(tǒng)特征例如特征臉和拉 普拉斯臉效果一樣。利用這些誤差相對于標(biāo)準(zhǔn)基是稀疏的事實(shí),這個框架可以處理因遮 擋帶來的誤差。本次課程設(shè)計主要通過閱讀文獻(xiàn) 1 ,理解基于稀疏表示的人臉識別,并對算法實(shí) 現(xiàn)仿真和對比。由于文獻(xiàn) 1 中的實(shí)驗(yàn)繁多,本報告只對正常圖像和噪聲污染圖像的人 臉識別實(shí)驗(yàn)進(jìn)行重現(xiàn)。關(guān)鍵詞:壓縮感知;稀疏表示;人臉識別;特征提??;最小 ll范數(shù);1 引言人臉識別的背景及意義隨著社會的網(wǎng)絡(luò)信息化程度的不斷提高, 人類身份的數(shù)字化和隱性化特征也日趨明 顯,隨之而來的關(guān)乎信息安全的身份鑒別問題也就成了一個關(guān)鍵性問題。比較傳統(tǒng)的身 份鑒別方法有身份證、個人簽名、 IC 卡、條形編碼

4、等方法。隨著科技的發(fā)展和計算機(jī)網(wǎng) 絡(luò)的普及,這些身份鑒別方法變得不再安全。這時候,生物識別技術(shù)的出現(xiàn),為當(dāng)今社 會的身份認(rèn)證提供了更安全,更準(zhǔn)確,更快速的方法。利用人體生物特征進(jìn)行身份認(rèn)證 的技術(shù)叫做生物識別技術(shù)。生物識別技術(shù)主要利用人體自身的一些生理特征,如臉像、 指紋、虹膜等,結(jié)合行為特征,如語音、筆跡、姿態(tài)等,再通過計算機(jī)技術(shù)與聲學(xué)、光 學(xué)、生物信息學(xué)和生物統(tǒng)計學(xué)原理等領(lǐng)域的技術(shù)手段來進(jìn)行個人身份的鑒定。生物特征 較難模仿或偽造,并且使用時不用擔(dān)心丟失或忘記攜帶,因此生物識別技術(shù)相比傳統(tǒng)的 身份鑒定方法更具安全性、保密性和便捷性 2 。人臉識別是生物識別技術(shù)中一個重要的研究領(lǐng)域。 人臉識

5、別是指從靜態(tài)人臉圖像或 動態(tài)視頻圖像中檢測到人臉,結(jié)合計算機(jī)技術(shù),將人臉身份識別出來。人臉識別問題一 般可描述為:給定一個包含人臉的場景,可以是靜態(tài)圖像或動態(tài)視頻,與已經(jīng)存儲的人 臉數(shù)據(jù)庫中的圖像進(jìn)行比對,識別出該圖像中人臉的身份。人臉一向被認(rèn)為是基于圖像 的識別中最廣泛的研究課題。一部分是因?yàn)槿祟愐曈X系統(tǒng)的強(qiáng)大的人臉識別能力,另一 部分是因?yàn)槿四樧R別技術(shù)有許多重要的應(yīng)用。另外,人臉識別的相關(guān)技術(shù)問題也是目標(biāo) 識別甚至一般的數(shù)據(jù)分類問題中具有代表性的問題。一般人臉識別的過程如圖 1 所示。圖 1 人臉識別流程圖人臉識別研究現(xiàn)狀人臉識別方法總體上可以分為基于局部特征的方法和基于整體的方法兩種。

6、基于局 部特征的方法是從人臉上獲取一系列的幾何特征進(jìn)行識別, 基于整體的方法考慮了人臉 模式的全局特性, 將人臉作為一個整體來識別。 人臉識別常用的方法主要有以下幾類 3 : 基于幾何特征的人臉識別、基于子空間的人臉識別、基于神經(jīng)網(wǎng)絡(luò)的人臉識別。1) 基于幾何特征的人臉識別: 最早的人臉識別采用最直觀的人臉特征幾何特征進(jìn) 行人臉識別。基本思想是從人臉幾何特征中提取信息作為特征參數(shù),形成特征向量,繼 而對這些特征向量進(jìn)行分類處理?;趲缀翁卣鞯娜四樧R別特征比較直觀,計算量也不 大,但是對光照、遮擋、表情、姿態(tài)變化的魯棒性較差。而且,由于只計算人臉部件的 形狀與結(jié)構(gòu),忽略了局部細(xì)節(jié),因此也丟失了部

7、分信息,識別率不高,穩(wěn)定性也不夠, 實(shí)際應(yīng)用比較困難。2) 基于子空間的人臉識別: 基于子空間的方法是最為常用的人臉識別方法。 基本思 想是把人臉看成一個矩陣或高維向量,通過一個空間變換,把原始人臉圖像變換到一個 子空間。子空間中,在不破壞原始人臉結(jié)構(gòu)的前提下,人臉的表示更為緊湊,從而降低 了計算的復(fù)雜度,也使分類更為準(zhǔn)確??臻g變換可以是線性的或者非線性的。常用的線 性變換有主成分分析(PCA)、獨(dú)立成分分析(ICA)、線性判別分析(LDA)等;非線性變換 有流形學(xué)習(xí)法、基于核技術(shù)的非線性子空間分析方法等。3) 基于神經(jīng)網(wǎng)絡(luò)的人臉識別: 因?yàn)樯窠?jīng)網(wǎng)絡(luò)具有良好的學(xué)習(xí)能力, 因此該方法就利 用這種

8、能力對人臉圖像進(jìn)行特征提取并識別。 Paul 最早提出使用神經(jīng)網(wǎng)絡(luò)對人臉幾何特 征進(jìn)行提取。 和提出徑向基神經(jīng)網(wǎng)絡(luò)用于人臉識別利用非監(jiān)督和監(jiān)督兩種神經(jīng)網(wǎng)絡(luò)相結(jié) 合的方法進(jìn)行人臉識別,其中,非監(jiān)督網(wǎng)絡(luò)用于特征提取,而監(jiān)督網(wǎng)絡(luò)則進(jìn)行識別。基 于神經(jīng)網(wǎng)絡(luò)的識別方法即使在困難的情況下也可以完成識別工作, 因?yàn)樗泻軓?qiáng)的學(xué)習(xí) 能力,能夠?qū)Ρ容^難描述的人臉進(jìn)行多次學(xué)習(xí),得到規(guī)律的隱性表達(dá)。同時在信息處理 和編碼壓縮等方面效果也很顯著, 但是訓(xùn)練時間長,神經(jīng)元數(shù)目多, 導(dǎo)致運(yùn)算速度較慢, 這也是它最明顯的缺點(diǎn)。雖然人臉識別是一種高效、簡單、易于實(shí)現(xiàn)和普及的識別方法,但是在實(shí)際用中, 依然存在很多難以克服的問

9、題 4 :(1) 對環(huán)境影響較為敏感。周圍環(huán)境如光照強(qiáng)度、光 源方向、環(huán)境色彩等,這些因素的變化使得人臉圖像也隨之產(chǎn)生較大的變化,這些變動 因素會使得針對人臉的檢測和識別遇到很大的困難。 (2) 人臉表情、角度等的復(fù)雜性和 變化性。不同圖像中人臉的表情、角度、大小等要素有較大差異,因此人臉?biāo)尸F(xiàn)出來 的姿態(tài)具有極大的不確定性, 另外遮擋腐蝕等問題, 都給人臉的檢測帶來了很大的困難。 (3) 對微小的差別不敏感。當(dāng)人臉比較相似,甚至只在極其細(xì)微的部分有差別的時候, 漏檢測或誤檢測的比率就會上升。Candes 和 Donoho5 在相關(guān)研究基礎(chǔ)上于2006 年正式提出了壓縮感知 (Compress

10、Sensing,CS) 的概念。它的獨(dú)特之處在于對信號的采樣與壓縮過程同時進(jìn)行,而不像傳 統(tǒng)方式,先采樣后壓縮,產(chǎn)生大量的無用數(shù)據(jù)。對信號進(jìn)行非自適應(yīng)線性投影值進(jìn)行采 樣得到觀測值,再通過一定的重構(gòu)算法恢復(fù)原始信號。壓縮感知理論依賴于兩條原則: 稀疏性和不相干性。文獻(xiàn) 1 利用壓縮感知的稀疏性原則,提出了基于稀疏表示的人臉識別方法,包括 稀疏表示分類方法下的特征提取,論證了用稀疏表示進(jìn)行人臉識別的魯棒性,以及有遮 擋、噪聲與未配準(zhǔn)等情況人臉圖像的識別方法。在假設(shè)不考慮姿態(tài)變化,只考慮表情變 化的情況下并做了大量的仿真與對比,驗(yàn)證了基于稀疏表示的人臉識別方法的優(yōu)越性。2 基于稀疏表示的人臉識別方

11、法基于稀疏表示的分類人臉識別的一個基本問題是如何利用標(biāo)記過類別信息的訓(xùn)練樣本將新的測試樣本正確歸類。將第i類的口個訓(xùn)練樣本作為列向量,排列成矩陣A n i,2,., i,ni Rm ni。 具體的就是將一副w h的灰度人臉圖像作為列向量Rm(m wh),由這些列向量構(gòu)成過完備字典。測試樣本是訓(xùn)練樣本的線性稀疏組合假定第i類有足夠多的訓(xùn)練樣本 A叩,眾,,5Rmni,則來自同類的測試樣本y Rm近似處于這些訓(xùn)練樣本張成的子空間中:y i,1 i,1i,2 i,2i,ni i,ni(1)其中 i,j R 是標(biāo)量, j 1,2,., ni 。由于測試樣本所屬類別i是未知的,我們定義一個新的矩陣A,其

12、列由k個類別的i,1i,2k,nk2)所有訓(xùn)練樣本構(gòu)成:A A1,A2,.,Ak這樣,y可以重寫為所有訓(xùn)練樣本的線性表示:y AxoRm(3)其中x00,.,0,-佔(zhàn).,0,0 丁 Rn是一個系數(shù)向量,其中只有第i類的值非零。由于X。中的元素包含測試樣本y的信息,故可以考慮求解線性方程組 y Ax。用全部訓(xùn)練樣本求解x與最近鄰分類(NN和最近鄰子空間(NS (NN每次只用單 個樣本,NS每次只用一類樣本)有很大不同。這種用全局表示得到的分類器要好于局部 方法(NN和NS。它可以更好的對用訓(xùn)練樣本表示的對象進(jìn)行識別,還能夠排除不屬 于訓(xùn)練樣本集中任何一類的無關(guān)樣本。顯然,如果m n,方程組y A

13、x是超定的,可求得唯一解X。但在人臉識別中,經(jīng)過降維后訓(xùn)練樣本構(gòu)成的方程組是欠定的,解不唯 一。按照慣例,這個難題可以用最小12解決:I2 :捲 arg min|x2 .Ax y(4)盡管通過A的偽逆,這個最優(yōu)問題很容易求解,但黑中沒有特別豐富的信息用于識別測 試樣本y,因?yàn)橥ǔX资浅砻艿?,較大的非零元素分布在很多類的訓(xùn)練樣本上。為了解 決這個難題,我們可利用一種簡單的觀測:一個有效的測試樣本y只用該類中的訓(xùn)練樣本充分表示。如果類別數(shù)k大到一定程度,這個表示自然是稀疏的。例如,如果 k 20, x0中只有5%的元素非零?;謴?fù)的x0越稀疏,就越容易確定測試樣本 y的類別。因此為 了找到y(tǒng) Ax的

14、最稀疏解,可求解下面的最優(yōu)問題:丨0 :対) arg min x 0 .Ax y(5)最小l1范數(shù)求稀疏解I。范數(shù)優(yōu)化問題是NP難問題,需用其它方法替代解決。當(dāng)解X。足夠稀疏時,最小h 范數(shù)和最小I0范數(shù)是等價的,故可轉(zhuǎn)化為最小li范數(shù)問題:l1 :対 arg min x 1.Ax y(6)到目前為止,我們都是假設(shè)(3)是精確的。但實(shí)際數(shù)據(jù)是有噪聲的,用訓(xùn)練樣本的稀 疏疊加難以精確地表示測試樣本。可以通過改寫模型(3)處理含小噪聲的問題:其中z Rm是噪聲項(xiàng),能量范圍|z2。稀疏解X0仍可以大致地通過求解下面的穩(wěn)定最小11范數(shù)得到重構(gòu):冷 argmin x 1.Ax y 2(8)這個凸最優(yōu)問題

15、可以通過二階錐規(guī)劃有效解決。有人指出 A是隨機(jī)矩陣時,通過(8) 可以基本重構(gòu)稀疏解。對于常數(shù) 和,如果X)0 m , z2 ,則所求解対以極大 的概率滿足:II $ x0|2(9)基于稀疏表示的分類對于給定的屬于第i類的測試樣本y ,通過(6)可以求出稀疏表示 対。理想情況是, 估計出的非零元素只存在于對應(yīng)著 A中第i類的位置,由此便容易判斷出y的歸屬類別。 然而,由于噪聲及模型誤差的存在,其它類別也存在小的非零值?;谌窒∈璞硎?, 我們可以設(shè)計許多可行的分類器。一般來說,類別數(shù)較多且類別中樣本個數(shù)較少時,系 統(tǒng)會有較大誤差,此時可以簡單地將 対中最大元素所屬類別視為y的類別;但當(dāng)類別數(shù)

16、適中且每類訓(xùn)練樣本個數(shù)較多時,可用下面的重構(gòu)誤差方法進(jìn)行判斷。對于每一類i,令i:Rn Rn是選擇與第i類相關(guān)的系數(shù)的特征函數(shù),對于 x Rn, 向量i x Rn中的非零元素為x中與第i類相關(guān)的元素。只用與第i類相關(guān)的元素,我 們可以將測試樣本y的估計值寫為卅A:対,計算所有卅與y之間的差,并將y歸于 使殘差最小的類:m.in r, y y A ,(10)稀疏表示分類算法如下:1) 輸入:k類的訓(xùn)練樣本矩陣A Ai,A2,.,Ak Rmn,測試樣本y Rm,(可選誤差 容限 0 )。2)將A中所有列向量歸一化到單位12長度。3)求解最小11范數(shù)問題:対 argmin x 1.Ax y(11)(

17、或選 X arg min x 1 .Ax y 2)4) 對i 1,.,k,計算重構(gòu)殘差斤y ” A j x。5) 輸出 identity yargmin y。結(jié)合特征提取的稀疏表示方法特征提取的好處就是降低數(shù)據(jù)維數(shù)及減少計算代價。對于原始的人臉圖像,其對應(yīng) 的線性系統(tǒng)y Ax十分龐大。例如,假設(shè)給定的人臉圖像的分辨率為640 480像素,m 維數(shù)將達(dá)到105數(shù)量級。雖然SRC算法是基于可擴(kuò)展的方法,例如線性規(guī)劃,但是直接 應(yīng)用于如此高分辨率的圖像仍然超出了常規(guī)計算機(jī)的能力。既然大部分的特征變換都只涉及線性操作(或類似),那么從圖像空間到特征空間的 投影就可以表述成一個矩陣R Rd m,其中d

18、= m。將R同時應(yīng)用到等式(3)的兩邊:% Ry RAx0Rd( 12)事實(shí)上,特征空間的維數(shù)d是遠(yuǎn)遠(yuǎn)小于n的。在這種情況下,線性方程組% RAx Rd在 x Rn未知的情況下是欠定的。但是,既然期望的解 X。是稀疏的,就希望通過解如下簡 化的最小11范數(shù)來重構(gòu)它:出 argminK .| RAx y;(13)其中 是誤差容限。因此,SRC算法中的訓(xùn)練圖像的矩陣A現(xiàn)在變成了 d維的特征矩陣 RA Rd n ;測試圖像y用它的特征取代。稀疏表示分類器對遮擋和噪聲的魯棒性在許多實(shí)際人臉識別場景中,測試圖像y含有遮擋,這種情況下,線性模型(3)可以改寫為y yo eo Ax。 e。(14)其中eo

19、Rm是誤差向量,由于遮擋和噪聲通常只存在于圖像的一小部分上, 因此可以認(rèn)為q中只有一小部分的元素是非零的,設(shè)其比例為,對應(yīng)著y中被遮擋、或被噪聲污染的部分。這些非零元素存在的位置是未知的,幅度具有隨機(jī)性,而且通常不會小到可 以被忽略的程度。這樣,即使這部分元素被嚴(yán)重破壞,我們也可以利用其他元素的信息 來進(jìn)行分類。把(14)重寫為x0y A, IBw0( 15)e。其中B A, I Rm(nm),貝U方程y Bwo是欠定的。稀疏表示向量wo xT,eT T最多有nim個非零元素。我們希望重構(gòu)的y Bw的最稀疏解w即為w。通常來說,如果遮擋占據(jù)少于m一匹個像素,即可滿足w w0。2一般地,我們也可

20、以認(rèn)為污染噪聲eo在某個正交基Ae Rm(nm)下有更稀疏的表示, 如傅立葉基或者小波基。我們只需把式(15)變?yōu)閥 Ae, I X。Bwo(16)eo這樣就可以對求出的wo更稀疏的表示。同樣地,通過求解下面擴(kuò)展的最小 11范數(shù)可以重 構(gòu)稀疏解wo:刈 arg min|xh . Bw y(17)3實(shí)驗(yàn)仿真及討論基于以上推導(dǎo),本節(jié)為了驗(yàn)證基于稀疏表示人臉識別方法的有效性,首先對提取圖 像特征,采用的提取特征的方法包括下采樣特征、Eige nfaces特征、拉普拉斯特征、Fisher特征和隨機(jī)特征,然后對根據(jù)(13)式最小h范數(shù)問題求解稀疏表示,從而達(dá)到 分類的目的。同時還與最近鄰分類器(NN、最

21、近鄰子空間分類器(NS、支持向量機(jī) 分類(SVM方法相比較。除了對正常圖像進(jìn)行識別外,根據(jù)式(17)還對有噪聲情況的圖像進(jìn)行分類識別。實(shí)驗(yàn)中涉及的問題特征提取特征提取算法主要參考文獻(xiàn)3 , Eigenfaces特征就是采用主成分分析(PCA提取 的特征,拉普拉斯特征是用局部保持投影(LPP方法提取的特征,F(xiàn)isher特征指的是 在PCA勺基礎(chǔ)上采用Fisher線性判別進(jìn)一步降維。值的注意的是隨機(jī)特征提取,隨機(jī) 特征提取可以看做是每一幅圖在高斯隨機(jī)變換矩陣R IRdm上的投影,R的每一個元素都服從標(biāo)準(zhǔn)正態(tài)分布,并且每一行都被規(guī)范到單位長度。與其他特征提取算法相比,隨 機(jī)特征提取是獨(dú)立于訓(xùn)練數(shù)據(jù)集

22、的,R的計算簡單、有效,即使數(shù)據(jù)集發(fā)生變化時,也 不用重新計算隨機(jī)矩陣。最小11范數(shù)問題求解通過最小h范數(shù)問題求解稀疏表示的方法有很多種,這里主要包括有梯度投影(Gradient Projection )、同倫算法、迭代閾值收縮、領(lǐng)域梯度(Proximal Gradient )、 增廣拉格朗日方法,這幾種方法都比正交匹配追蹤算法(OMP要高效的多。上述幾種快速算法中,采用增廣拉格朗日的對偶實(shí)現(xiàn)相比其它的快速算法要更好。但本人直接采 用基于matlab的CVX凸優(yōu)化工具包來求解。對比分類算法最近鄰分類器(NN參考網(wǎng)絡(luò)資料6實(shí)現(xiàn),最近鄰子空間分類器(NS借鑒網(wǎng) 絡(luò)資料7中的matlab代碼中心的文

23、件實(shí)現(xiàn),支持向量機(jī)分類(SVM方法基于網(wǎng)絡(luò)資 料8實(shí)現(xiàn),這三種分類算法均為成熟的算法,不再對細(xì)節(jié)進(jìn)行闡述。實(shí)驗(yàn)需求實(shí)驗(yàn)數(shù)據(jù)庫采用拓展Yale B圖像庫和AR圖像庫,實(shí)驗(yàn)程序采用 matlab語言編寫,并額外添加了 CVX凸優(yōu)化工具包,最終在、2G內(nèi)存的Inter Core2 CPU上運(yùn)行基于稀疏表示的人臉識別程序框圖本人編寫基于稀疏表示的人臉識別程序是基于以下流程框圖實(shí)現(xiàn),如圖2 所示。在對有噪圖像進(jìn)行人臉識別時,求解的是如式( 17)的拓展最小 l1 范數(shù)問題,同時對于基 于稀疏表示的分類(SRC不再提取特征,其特征就是96X 84的圖像。而其他三種對比 算法,分別提取PCA ICA、LNM

24、F特征。因此,在對有噪圖像進(jìn)行人臉識別時的程序流 程圖只是在圖 2 上做微小改動。圖 2 稀疏表示人臉識別程序流程框圖實(shí)驗(yàn)結(jié)果拓展 Yale B 圖像庫拓展Yale B圖像庫是由38個個體組成2432張正臉圖像,每個個體對應(yīng)著 64種不 同的光照,并且已經(jīng)經(jīng)過裁剪,大小為 192X 168。該庫中有 18 張圖像在獲取過程中損 壞,屬于無效圖像。實(shí)驗(yàn)中計算識別率時,采用的特征空間維數(shù)分別是 30、 56、 120和 504,它們分別 對應(yīng)的采樣率為 1/32、 1/24、 1/16 和 1/8 。值得注意的是 Fisher 特征不同于其他特征, 其最佳特征維度小于圖像類別數(shù) 38,因此在仿真中

25、只有特征維數(shù)為 30才是可行的。圖 3-圖 6 給出了在拓展 Yale B 圖像庫上,分別采用下采樣特征、隨機(jī)特征、Eigenfaces特征、Fisher特征和拉普拉斯特征,并運(yùn)用稀疏表示分類(SRC、最近鄰 分類(NN最近子空間分類(NS和支持向量機(jī)分類(SVM進(jìn)行人臉識別的結(jié)果。圖 3 基于稀疏表示的識別圖 4 最近鄰( NN 識別圖 5 最近子空間( NS 識別圖6支持向量機(jī)(SVM識別由圖可知,稀疏表示分類的識別率在特征維度為 120時在到之間(文獻(xiàn) 1 達(dá)到和之 間),在特征維數(shù)為 504 時,采用拉普拉斯特征得到最大識別率,采用隨機(jī)特征的識別 率也達(dá)到(文獻(xiàn) 1 中采用隨機(jī)特征是達(dá)

26、到最大識別率)。最近鄰分類、最近子空間分 類和SVM分類的最大識別率分別達(dá)到、(文獻(xiàn)1中分別是、)。AR 圖像庫AR圖像庫由126個個體的4000張正臉圖像組成,每個個體對應(yīng)26張圖像,并分為 兩部分,每部分 13張。與拓展 Yale B 圖像庫比起來,這些圖像包含更多的面部變化、 光照變化、更多表情和偽裝。在實(shí)驗(yàn)中,選擇 50個男人和 50個女人的圖像集。每一個 個體只選光照變化和表情變化的 1 4幅圖像:7張來自第一部分用于訓(xùn)練, 7張來自第二 部分用于測試。圖像被裁減成 120X165大小,并被轉(zhuǎn)換成灰度圖像。特征空間維數(shù)分 別是 30、 54、 130 和 540,它們分別對應(yīng)的采樣率

27、為 1/24、 1/18、 1/12 和 1/6。 Fisher 特征最佳特征維度小于圖像類別數(shù) 100,因此在仿真中只有特征維數(shù)為 30和56才是可 行的。AR圖像庫比拓展Yale B圖像庫更具挑戰(zhàn)性,因?yàn)樗膱D像類別數(shù)為 100,但是每 個個體的訓(xùn)練圖像降到 7 張:4張不同光照和 3張不同表情圖7-圖10給出了在AR圖像庫上,分別采用下采樣特征、隨機(jī)特征、 Eigenfaces 特征、Fisher特征和拉普拉斯特征,并運(yùn)用稀疏表示分類(SRC、最近鄰分類(NN 最近子空間分類(NS和支持向量機(jī)分類(SVM進(jìn)行人臉識別的結(jié)果。圖 7 基于稀疏表示的識別圖8最近鄰(NN識別圖9最近子空間(N

28、S識別圖10支持向量機(jī)(SVM識別由圖7-圖10可知,在特征維數(shù)為540時,稀疏表示分類的識別率在到之間,采用 隨機(jī)特征時識別率達(dá)到。最近鄰分類、最近子空間分類和SVM分類的最高識別率分別為、 和。正常圖像識別結(jié)果討論根據(jù)拓展Yale B和AR圖像庫上的人臉識別實(shí)驗(yàn),我們能夠得出如下分析:1)在兩個圖像庫上,稀疏表示分類、SVM類、最近子空間分類的最大識別率都高于最近鄰分類的最大識別率。在 Yale B上,稀疏表示分類、SVM類及最近子空間分類 的最大識別率分別為、和,而文獻(xiàn)1中為、和。顯然稀疏表示分類識別率變低了,而 最近子空間分類的識別率變高了。這可能是因?yàn)樵诒緢蟾嬷校钚1范數(shù)問題求解

29、稀疏表示采用CVX凸優(yōu)化包(文獻(xiàn)1中采用增廣拉格朗日的對偶實(shí)現(xiàn));還有最近子空間 分類根據(jù)文獻(xiàn)7實(shí)現(xiàn)(文獻(xiàn)1中最近子空間分類根據(jù)文獻(xiàn)9實(shí)現(xiàn)),在文獻(xiàn)7中該 分類方法已經(jīng)被改進(jìn)。2)最近鄰分類、最近鄰子空間分類和 SVM分類比較依賴于特征的選擇,并且隨著 特征維數(shù)增大,識別率都呈增長趨勢。最近鄰分類和 SVM類隨著特征維數(shù)增大,不同 特征的識別率沒有表現(xiàn)出收斂性。3)對于稀疏表示分類,在特征維數(shù)達(dá)到一定值時,采用非傳統(tǒng)特征(下采樣特征 和隨機(jī)特征)與采用傳統(tǒng)特征(Eigenfaces特征、Fisher特征和拉普拉斯特征)能達(dá) 到相似的識別率,且下采樣特征和隨機(jī)特征提取是簡單、易操作的,因此有很好

30、的實(shí)用 性。隨機(jī)噪聲圖像的人臉識別在實(shí)驗(yàn)中,為了驗(yàn)證基于稀疏表示分類(SRC對噪聲的魯棒性,要求解拓展最小11 范數(shù)問題,如( 17)式所示。實(shí)驗(yàn)采用拓展 Yale B 圖像庫,該圖像庫根據(jù)光源方向與 攝像機(jī)坐標(biāo)之間的夾角可分為 5個 Subset10 ,選擇 Subset1 和 Subset2 ( 722幅圖像, 光照條件有弱到中等)作為訓(xùn)練集, Subset3 (542幅圖像,光照條件更加強(qiáng)烈)用于測 試集。先把圖像大小采樣為 96 X 84,則在(17)式中,B A I為8064X 8786的矩 陣。隨機(jī)噪聲圖像人為地生成,對每一幅測試圖像,根據(jù)噪聲強(qiáng)度百分?jǐn)?shù)隨機(jī)地選擇像 素個數(shù),然后在

31、被選擇的像素位置的灰度值用 0, 255間均勻分布的隨機(jī)數(shù)取代。噪聲 強(qiáng)度百分?jǐn)?shù)由0%變化到90%圖11展示了采用SRC對一些圖像進(jìn)行測試的例子。為了凸顯基于稀疏表示分類(SRC的優(yōu)勢,該方法將與三種常見的人臉識別技術(shù) 進(jìn)行比較。第一種方法是采用主成分分析法(PCA提取特征11,采用最近鄰分類器(NN 分類。第二種方法是采用獨(dú)立成分分析(ICA)提取特征12,采用最近鄰分類器(NN 分類。第三種方法是采用局部非負(fù)矩陣分解(LNMF提取特征13,采用最近鄰分類器(NN 分類。為了方便起見,本人在仿真時設(shè)這三種方法的特征維數(shù)為 500。不同方法在不同 噪聲情況下的正確識別率曲線如圖 12所示。圖1

32、1隨機(jī)噪聲圖像的 SRC人臉識別:(a)從上到下分別加噪 30% 50% 70%勺測試圖像;(b)估計 誤差 e?1 ; (c) 估計出的稀疏系數(shù) x?1 ; (d) 重建圖像 yr 。圖 12 隨機(jī)噪聲圖像的人臉正確識別率曲線圖12給出了隨著噪聲強(qiáng)度變化,基于稀疏表示分類(SRC和其他三種人臉識別方 法識別正確率性能。由圖可知,SRC算法性能遠(yuǎn)好于其他方法。噪聲強(qiáng)度在 0%到50%之 間時,SRC算法幾乎能將所有目標(biāo)正確分類。在噪聲強(qiáng)度為50%寸,其他方法的正確識別率沒有一個能超過50%而SRC算法的正確識別率達(dá)到99%即使在噪聲強(qiáng)度為70% 時,SRC算法的正確識別率也達(dá)到%本次課程設(shè)計主

33、要通過閱讀文獻(xiàn)1,理解基于稀疏表示的人臉識別,并對算法實(shí) 現(xiàn)仿真和對比。由于文獻(xiàn)1中的實(shí)驗(yàn)繁多,本報告只對正常圖像和噪聲污染圖像的人 臉識別實(shí)驗(yàn)進(jìn)行重現(xiàn)?;谙∈璞硎痉诸悓φD像進(jìn)行人臉識別時,對不同的圖像數(shù) 據(jù)庫,都能達(dá)到很高的識別率,在并且在提取的特征維數(shù)一定時,采用簡單、易操作的 非傳統(tǒng)特征(下采樣特征和隨機(jī)特征)能達(dá)到和采用傳統(tǒng)特征(Eigenfaces特征、Fisher 特征和拉普拉斯特征)相似的識別率?;谙∈璞硎痉诸悓﹄S機(jī)噪聲圖像進(jìn)行人臉識別 時,該算法表現(xiàn)出很強(qiáng)的魯棒性,在噪聲強(qiáng)度小于50%寸,人臉正確識別率相當(dāng)高。參考文獻(xiàn)1 J. Wright, A. Y. Yang, A. Ganesh,et al. Robust face recognition via sparse representationJ. P

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論