![基于稀疏表示的魯棒人臉識別_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/85f50a39-16cd-4072-a450-c84614db6c82/85f50a39-16cd-4072-a450-c84614db6c821.gif)
![基于稀疏表示的魯棒人臉識別_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/85f50a39-16cd-4072-a450-c84614db6c82/85f50a39-16cd-4072-a450-c84614db6c822.gif)
![基于稀疏表示的魯棒人臉識別_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/85f50a39-16cd-4072-a450-c84614db6c82/85f50a39-16cd-4072-a450-c84614db6c823.gif)
![基于稀疏表示的魯棒人臉識別_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/85f50a39-16cd-4072-a450-c84614db6c82/85f50a39-16cd-4072-a450-c84614db6c824.gif)
![基于稀疏表示的魯棒人臉識別_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/85f50a39-16cd-4072-a450-c84614db6c82/85f50a39-16cd-4072-a450-c84614db6c825.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)字圖像處理期末大作業(yè)(報告)基于稀疏表示的魯棒人臉識別Robust Face Recognition via Sparse Representation 學(xué) 院(系): 創(chuàng)新實驗學(xué)院 專 業(yè): 信息與通信工程 學(xué) 生 姓 名: 李潤順 學(xué) 號: 21424011 任課 教 師: 馬曉紅 完 成 日 期: 2015年7月20日 大連理工大學(xué)Dalian University of Technology基于稀疏表示的魯棒人臉識別摘 要 人臉識別是現(xiàn)代生物信息識別中的一項重要技術(shù),對于給定的人臉圖像,利用已經(jīng)存儲的人臉數(shù)據(jù)庫確認(rèn)該圖像中的一個或多個人的身份?,F(xiàn)有的人臉識別方法大多需要進行圖像預(yù)處理
2、及復(fù)雜的特征提取,選擇何種特征對識別率影響非常大,并且對遮擋、噪聲等情況缺少魯棒性,這些問題往往使得現(xiàn)有的識別方法在應(yīng)用中受到制約。不同于傳統(tǒng)的人臉識別算法,稀疏表示通過最小范數(shù)計算得到的1,文獻1提出了一個用于(基于圖像)目標(biāo)識別的一般分類算法。這個新框架對人臉識別中兩個重要問題(特征提取和遮擋魯棒性)提出了新思路。稀疏表示是壓縮感知中的關(guān)鍵理論,數(shù)據(jù)的稀疏表示,可以從本質(zhì)上降低數(shù)據(jù)處理的成本,提高壓縮效率。稀疏表示用在分類識別上有獨特的優(yōu)勢,對于特征提取,如果我們在識別中適當(dāng)?shù)乩孟∈栊裕卣鞯倪x取不再至關(guān)重要,然而,重要的是特征數(shù)目是否充分大,稀疏表示是否得到準(zhǔn)確計算。只要特征空間維數(shù)超
3、過某個閾值(用稀疏表示理論估計得到),非傳統(tǒng)特征例如下采樣圖像和隨機投影和傳統(tǒng)特征例如特征臉和拉普拉斯臉效果一樣。利用這些誤差相對于標(biāo)準(zhǔn)基是稀疏的事實,這個框架可以處理因遮擋帶來的誤差。本次課程設(shè)計主要通過閱讀文獻1,理解基于稀疏表示的人臉識別,并對算法實現(xiàn)仿真和對比。由于文獻1中的實驗繁多,本報告只對正常圖像和噪聲污染圖像的人臉識別實驗進行重現(xiàn)。關(guān)鍵詞:壓縮感知;稀疏表示;人臉識別;特征提?。蛔钚》稊?shù);1 引言1.1 人臉識別的背景及意義隨著社會的網(wǎng)絡(luò)信息化程度的不斷提高,人類身份的數(shù)字化和隱性化特征也日趨明顯,隨之而來的關(guān)乎信息安全的身份鑒別問題也就成了一個關(guān)鍵性問題。比較傳統(tǒng)的身份鑒別方
4、法有身份證、個人簽名、IC卡、條形編碼等方法。隨著科技的發(fā)展和計算機網(wǎng)絡(luò)的普及,這些身份鑒別方法變得不再安全。這時候,生物識別技術(shù)的出現(xiàn),為當(dāng)今社會的身份認(rèn)證提供了更安全,更準(zhǔn)確,更快速的方法。利用人體生物特征進行身份認(rèn)證的技術(shù)叫做生物識別技術(shù)。生物識別技術(shù)主要利用人體自身的一些生理特征,如臉像、指紋、虹膜等,結(jié)合行為特征,如語音、筆跡、姿態(tài)等,再通過計算機技術(shù)與聲學(xué)、光學(xué)、生物信息學(xué)和生物統(tǒng)計學(xué)原理等領(lǐng)域的技術(shù)手段來進行個人身份的鑒定。生物特征較難模仿或偽造,并且使用時不用擔(dān)心丟失或忘記攜帶,因此生物識別技術(shù)相比傳統(tǒng)的身份鑒定方法更具安全性、保密性和便捷性2。人臉識別是生物識別技術(shù)中一個重要
5、的研究領(lǐng)域。人臉識別是指從靜態(tài)人臉圖像或動態(tài)視頻圖像中檢測到人臉,結(jié)合計算機技術(shù),將人臉身份識別出來。人臉識別問題一般可描述為:給定一個包含人臉的場景,可以是靜態(tài)圖像或動態(tài)視頻,與已經(jīng)存儲的人臉數(shù)據(jù)庫中的圖像進行比對,識別出該圖像中人臉的身份。人臉一向被認(rèn)為是基于圖像的識別中最廣泛的研究課題。一部分是因為人類視覺系統(tǒng)的強大的人臉識別能力,另一部分是因為人臉識別技術(shù)有許多重要的應(yīng)用。另外,人臉識別的相關(guān)技術(shù)問題也是目標(biāo)識別甚至一般的數(shù)據(jù)分類問題中具有代表性的問題。一般人臉識別的過程如圖1所示。圖1人臉識別流程圖1.2 人臉識別研究現(xiàn)狀人臉識別方法總體上可以分為基于局部特征的方法和基于整體的方法兩
6、種。基于局部特征的方法是從人臉上獲取一系列的幾何特征進行識別,基于整體的方法考慮了人臉模式的全局特性,將人臉作為一個整體來識別。人臉識別常用的方法主要有以下幾類3:基于幾何特征的人臉識別、基于子空間的人臉識別、基于神經(jīng)網(wǎng)絡(luò)的人臉識別。1) 基于幾何特征的人臉識別:最早的人臉識別采用最直觀的人臉特征幾何特征進行人臉識別。基本思想是從人臉幾何特征中提取信息作為特征參數(shù),形成特征向量,繼而對這些特征向量進行分類處理。基于幾何特征的人臉識別特征比較直觀,計算量也不大,但是對光照、遮擋、表情、姿態(tài)變化的魯棒性較差。而且,由于只計算人臉部件的形狀與結(jié)構(gòu),忽略了局部細(xì)節(jié),因此也丟失了部分信息,識別率不高,穩(wěn)
7、定性也不夠,實際應(yīng)用比較困難。2) 基于子空間的人臉識別:基于子空間的方法是最為常用的人臉識別方法?;舅枷胧前讶四樋闯梢粋€矩陣或高維向量,通過一個空間變換,把原始人臉圖像變換到一個子空間。子空間中,在不破壞原始人臉結(jié)構(gòu)的前提下,人臉的表示更為緊湊,從而降低了計算的復(fù)雜度,也使分類更為準(zhǔn)確??臻g變換可以是線性的或者非線性的。常用的線性變換有主成分分析(PCA)、獨立成分分析(ICA)、線性判別分析(LDA)等;非線性變換有流形學(xué)習(xí)法、基于核技術(shù)的非線性子空間分析方法等。3) 基于神經(jīng)網(wǎng)絡(luò)的人臉識別:因為神經(jīng)網(wǎng)絡(luò)具有良好的學(xué)習(xí)能力,因此該方法就利用這種能力對人臉圖像進行特征提取并識別。Paul最
8、早提出使用神經(jīng)網(wǎng)絡(luò)對人臉幾何特征進行提取。S.Ranganatn和K.Arun提出徑向基神經(jīng)網(wǎng)絡(luò)用于人臉識別利用非監(jiān)督和監(jiān)督兩種神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法進行人臉識別,其中,非監(jiān)督網(wǎng)絡(luò)用于特征提取,而監(jiān)督網(wǎng)絡(luò)則進行識別?;谏窠?jīng)網(wǎng)絡(luò)的識別方法即使在困難的情況下也可以完成識別工作,因為它有很強的學(xué)習(xí)能力,能夠?qū)Ρ容^難描述的人臉進行多次學(xué)習(xí),得到規(guī)律的隱性表達。同時在信息處理和編碼壓縮等方面效果也很顯著,但是訓(xùn)練時間長,神經(jīng)元數(shù)目多,導(dǎo)致運算速度較慢,這也是它最明顯的缺點。雖然人臉識別是一種高效、簡單、易于實現(xiàn)和普及的識別方法,但是在實際用中,依然存在很多難以克服的問題4:(1) 對環(huán)境影響較為敏感。周
9、圍環(huán)境如光照強度、光源方向、環(huán)境色彩等,這些因素的變化使得人臉圖像也隨之產(chǎn)生較大的變化,這些變動因素會使得針對人臉的檢測和識別遇到很大的困難。(2) 人臉表情、角度等的復(fù)雜性和變化性。不同圖像中人臉的表情、角度、大小等要素有較大差異,因此人臉?biāo)尸F(xiàn)出來的姿態(tài)具有極大的不確定性,另外遮擋腐蝕等問題,都給人臉的檢測帶來了很大的困難。(3) 對微小的差別不敏感。當(dāng)人臉比較相似,甚至只在極其細(xì)微的部分有差別的時候,漏檢測或誤檢測的比率就會上升。 Candes和Donoho5在相關(guān)研究基礎(chǔ)上于2006年正式提出了壓縮感知(Compress Sensing,CS)的概念。它的獨特之處在于對信號的采樣與壓縮
10、過程同時進行,而不像傳統(tǒng)方式,先采樣后壓縮,產(chǎn)生大量的無用數(shù)據(jù)。對信號進行非自適應(yīng)線性投影值進行采樣得到觀測值,再通過一定的重構(gòu)算法恢復(fù)原始信號。壓縮感知理論依賴于兩條原則:稀疏性和不相干性。文獻1利用壓縮感知的稀疏性原則,提出了基于稀疏表示的人臉識別方法,包括稀疏表示分類方法下的特征提取,論證了用稀疏表示進行人臉識別的魯棒性,以及有遮擋、噪聲與未配準(zhǔn)等情況人臉圖像的識別方法。在假設(shè)不考慮姿態(tài)變化,只考慮表情變化的情況下并做了大量的仿真與對比,驗證了基于稀疏表示的人臉識別方法的優(yōu)越性。2 基于稀疏表示的人臉識別方法2.1 基于稀疏表示的分類 人臉識別的一個基本問題是如何利用標(biāo)記過類別信息的訓(xùn)練
11、樣本將新的測試樣本正確歸類。將第類的個訓(xùn)練樣本作為列向量,排列成矩陣。具體的就是將一副的灰度人臉圖像作為列向量(),由這些列向量構(gòu)成過完備字典。2.1.1 測試樣本是訓(xùn)練樣本的線性稀疏組合 假定第類有足夠多的訓(xùn)練樣本,則來自同類的測試樣本近似處于這些訓(xùn)練樣本張成的子空間中: (1)其中是標(biāo)量,。 由于測試樣本所屬類別是未知的,我們定義一個新的矩陣,其列由個類別的所有訓(xùn)練樣本構(gòu)成: (2)這樣,可以重寫為所有訓(xùn)練樣本的線性表示: (3)其中是一個系數(shù)向量,其中只有第類的值非零。由于中的元素包含測試樣本的信息,故可以考慮求解線性方程組。 用全部訓(xùn)練樣本求解與最近鄰分類(NN)和最近鄰子空間(NS)
12、(NN每次只用單個樣本,NS每次只用一類樣本)有很大不同。這種用全局表示得到的分類器要好于局部方法(NN和NS)。它可以更好的對用訓(xùn)練樣本表示的對象進行識別,還能夠排除不屬于訓(xùn)練樣本集中任何一類的無關(guān)樣本。顯然,如果,方程組是超定的,可求得唯一解。但在人臉識別中,經(jīng)過降維后訓(xùn)練樣本構(gòu)成的方程組是欠定的,解不唯一。按照慣例,這個難題可以用最小解決: s.t. (4)盡管通過的偽逆,這個最優(yōu)問題很容易求解,但中沒有特別豐富的信息用于識別測試樣本,因為通常是稠密的,較大的非零元素分布在很多類的訓(xùn)練樣本上。為了解決這個難題,我們可利用一種簡單的觀測:一個有效的測試樣本只用該類中的訓(xùn)練樣本充分表示。如果
13、類別數(shù)大到一定程度,這個表示自然是稀疏的。例如,如果,中只有5%的元素非零?;謴?fù)的越稀疏,就越容易確定測試樣本的類別。因此為了找到的最稀疏解,可求解下面的最優(yōu)問題: s.t. (5)2.1.2 最小范數(shù)求稀疏解 范數(shù)優(yōu)化問題是難問題,需用其它方法替代解決。當(dāng)解足夠稀疏時,最小范數(shù)和最小范數(shù)是等價的,故可轉(zhuǎn)化為最小范數(shù)問題: s.t. (6) 到目前為止,我們都是假設(shè)(3)是精確的。但實際數(shù)據(jù)是有噪聲的,用訓(xùn)練樣本的稀疏疊加難以精確地表示測試樣本。可以通過改寫模型(3)處理含小噪聲的問題: (7)其中是噪聲項,能量范圍。稀疏解仍可以大致地通過求解下面的穩(wěn)定最小范數(shù)得到重構(gòu): s.t. (8)這個
14、凸最優(yōu)問題可以通過二階錐規(guī)劃有效解決。有人指出是隨機矩陣時,通過(8)可以基本重構(gòu)稀疏解。對于常數(shù)和,如果,則所求解以極大的概率滿足: (9)2.1.3 基于稀疏表示的分類 對于給定的屬于第類的測試樣本,通過(6)可以求出稀疏表示。理想情況是,估計的非零元素只存在于對應(yīng)著中第類的位置,由此便容易判斷出的歸屬類別。然而,由于噪聲及模型誤差的存在,其它類別也存在小的非零值?;谌窒∈璞硎?,我們可以設(shè)計許多可行的分類器。一般來說,類別數(shù)較多且類別中樣本個數(shù)較少時,系統(tǒng)會有較大誤差,此時可以簡單地將中最大元素所屬類別視為的類別;但當(dāng)類別數(shù)適中且每類訓(xùn)練樣本個數(shù)較多時,可用下面的重構(gòu)誤差方法進行判斷。
15、 對于每一類,令是選擇與第類相關(guān)的系數(shù)的特征函數(shù),對于,向量中的非零元素為中與第類相關(guān)的元素。只用與第類相關(guān)的元素,我們可以將測試樣本的估計值寫為,計算所有與之間的差,并將歸于使殘差最小的類: (10) 稀疏表示分類算法如下:1)輸入:類的訓(xùn)練樣本矩陣,測試樣本,(可選誤差容限)。2)將中所有列向量歸一化到單位長度。3)求解最小范數(shù)問題: s.t. (11) (或選 s.t. )4)對,計算重構(gòu)殘差。5)輸出。2.2 結(jié)合特征提取的稀疏表示方法特征提取的好處就是降低數(shù)據(jù)維數(shù)及減少計算代價。對于原始的人臉圖像,其對應(yīng)的線性系統(tǒng)十分龐大。例如,假設(shè)給定的人臉圖像的分辨率為像素,維數(shù)將達到數(shù)量級。雖
16、然算法是基于可擴展的方法,例如線性規(guī)劃,但是直接應(yīng)用于如此高分辨率的圖像仍然超出了常規(guī)計算機的能力。既然大部分的特征變換都只涉及線性操作(或類似),那么從圖像空間到特征空間的投影就可以表述成一個矩陣,其中。將R同時應(yīng)用到等式(3)的兩邊: (12)事實上,特征空間的維數(shù)是遠遠小于的。在這種情況下,線性方程組在未知的情況下是欠定的。但是,既然期望的解是稀疏的,就希望通過解如下簡化的最小范數(shù)來重構(gòu)它: s.t. (13)其中是誤差容限。因此,算法中的訓(xùn)練圖像的矩陣現(xiàn)在變成了維的特征矩陣;測試圖像用它的特征取代。2.3 稀疏表示分類器對遮擋和噪聲的魯棒性 在許多實際人臉識別場景中,測試圖像含有遮擋,
17、這種情況下,線性模型(3)可以改寫為 (14)其中是誤差向量,由于遮擋和噪聲通常只存在于圖像的一小部分上,因此可以認(rèn)為中只有一小部分的元素是非零的,設(shè)其比例為,對應(yīng)著y中被遮擋、或被噪聲污染的部分。這些非零元素存在的位置是未知的,幅度具有隨機性,而且通常不會小到可以被忽略的程度。這樣,即使這部分元素被嚴(yán)重破壞,我們也可以利用其他元素的信息來進行分類。把(14)重寫為 (15)其中,則方程是欠定的。稀疏表示向量最多有個非零元素。我們希望重構(gòu)的的最稀疏解即為。通常來說,如果遮擋占據(jù)少于個像素,即可滿足。 一般地,我們也可以認(rèn)為污染噪聲在某個正交基下有更稀疏的表示,如傅立葉基或者小波基。我們只需把式
18、(15)變?yōu)?(16)這樣就可以對求出的更稀疏的表示。同樣地,通過求解下面擴展的最小范數(shù)可以重構(gòu)稀疏解: s.t. (17)3 實驗仿真及討論基于以上推導(dǎo),本節(jié)為了驗證基于稀疏表示人臉識別方法的有效性,首先對提取圖像特征,采用的提取特征的方法包括下采樣特征、Eigenfaces特征、拉普拉斯特征、Fisher特征和隨機特征,然后對根據(jù)(13)式最小范數(shù)問題求解稀疏表示,從而達到分類的目的。同時還與最近鄰分類器(NN)、最近鄰子空間分類器(NS)、支持向量機分類(SVM)方法相比較。除了對正常圖像進行識別外,根據(jù)式(17)還對有噪聲情況的圖像進行分類識別。3.1 實驗中涉及的問題3.1.1 特征
19、提取特征提取算法主要參考文獻3,Eigenfaces特征就是采用主成分分析(PCA)提取的特征,拉普拉斯特征是用局部保持投影(LPP)方法提取的特征,F(xiàn)isher特征指的是在PCA的基礎(chǔ)上采用Fisher線性判別進一步降維。值的注意的是隨機特征提取,隨機特征提取可以看做是每一幅圖在高斯隨機變換矩陣上的投影,R的每一個元素都服從標(biāo)準(zhǔn)正態(tài)分布,并且每一行都被規(guī)范到單位長度。與其他特征提取算法相比,隨機特征提取是獨立于訓(xùn)練數(shù)據(jù)集的,R的計算簡單、有效,即使數(shù)據(jù)集發(fā)生變化時,也不用重新計算隨機矩陣。3.1.2 最小范數(shù)問題求解通過最小范數(shù)問題求解稀疏表示的方法有很多種,這里主要包括有梯度投影(Grad
20、ient Projection)、同倫算法、迭代閾值收縮、領(lǐng)域梯度(Proximal Gradient)、增廣拉格朗日方法,這幾種方法都比正交匹配追蹤算法(OMP)要高效的多。上述幾種快速算法中,采用增廣拉格朗日的對偶實現(xiàn)相比其它的快速算法要更好。但本人直接采用基于matlab的CVX凸優(yōu)化工具包來求解。3.1.3 對比分類算法最近鄰分類器6(NN)參考網(wǎng)絡(luò)資料6實現(xiàn),最近鄰子空間分類器7(NS)借鑒網(wǎng)絡(luò)資料7中的matlab代碼中心的NSC.m文件實現(xiàn),支持向量機分類8(SVM)方法基于網(wǎng)絡(luò)資料8實現(xiàn),這三種分類算法均為成熟的算法,不再對細(xì)節(jié)進行闡述。3.1.4 實驗需求實驗數(shù)據(jù)庫采用拓展Y
21、ale B圖像庫和AR圖像庫,實驗程序采用matlab語言編寫,并額外添加了CVX凸優(yōu)化工具包,最終在2.93GHz、2G內(nèi)存的Inter Core2 CPU上運行。3.2 基于稀疏表示的人臉識別程序框圖本人編寫基于稀疏表示的人臉識別程序是基于以下流程框圖實現(xiàn),如圖2所示。在對有噪圖像進行人臉識別時,求解的是如式(17)的拓展最小范數(shù)問題,同時對于基于稀疏表示的分類(SRC)不再提取特征,其特征就是96×84的圖像。而其他三種對比算法,分別提取PCA、ICA、LNMF特征。因此,在對有噪圖像進行人臉識別時的程序流程圖只是在圖2上做微小改動。圖2 稀疏表示人臉識別程序流程框圖3.3 實
22、驗結(jié)果3.3.1 拓展Yale B圖像庫拓展Yale B圖像庫是由38個個體組成2432張正臉圖像,每個個體對應(yīng)著64種不同的光照,并且已經(jīng)經(jīng)過裁剪,大小為192×168。該庫中有18張圖像在獲取過程中損壞,屬于無效圖像。實驗中計算識別率時,采用的特征空間維數(shù)分別是30、56、120和504,它們分別對應(yīng)的采樣率為1/32、1/24、1/16和1/8。值得注意的是Fisher特征不同于其他特征,其最佳特征維度小于圖像類別數(shù)38,因此在仿真中只有特征維數(shù)為30才是可行的。圖3-圖6給出了在拓展Yale B圖像庫上,分別采用下采樣特征、隨機特征、Eigenfaces特征、Fisher特征
23、和拉普拉斯特征,并運用稀疏表示分類(SRC)、最近鄰分類(NN)最近子空間分類(NS)和支持向量機分類(SVM)進行人臉識別的結(jié)果。圖3 基于稀疏表示的識別圖4 最近鄰(NN)識別圖5 最近子空間(NS)識別圖6 支持向量機(SVM)識別 由圖可知,稀疏表示分類的識別率在特征維度為120時在0.9030到0.9290之間(文獻1達到0.921和0.956之間),在特征維數(shù)為504時,采用拉普拉斯特征得到最大識別率0.9507,采用隨機特征的識別率也達到0.9370(文獻1中采用隨機特征是達到最大識別率0.981)。最近鄰分類、最近子空間分類和SVM分類的最大識別率分別達到0.9019、0.96
24、22、0.9304(文獻1中分別是0.907、0.941、0.977)。3.3.2 AR圖像庫AR圖像庫由126個個體的4000張正臉圖像組成,每個個體對應(yīng)26張圖像,并分為兩部分,每部分13張。與拓展Yale B圖像庫比起來,這些圖像包含更多的面部變化、光照變化、更多表情和偽裝。在實驗中,選擇50個男人和50個女人的圖像集。每一個個體只選光照變化和表情變化的14幅圖像:7張來自第一部分用于訓(xùn)練,7張來自第二部分用于測試。圖像被裁減成120×165大小,并被轉(zhuǎn)換成灰度圖像。特征空間維數(shù)分別是30、54、130和540,它們分別對應(yīng)的采樣率為1/24、1/18、1/12和1/6。Fis
25、her特征最佳特征維度小于圖像類別數(shù)100,因此在仿真中只有特征維數(shù)為30和56才是可行的。AR圖像庫比拓展Yale B圖像庫更具挑戰(zhàn)性,因為它的圖像類別數(shù)為100,但是每個個體的訓(xùn)練圖像降到7張:4張不同光照和3張不同表情圖7-圖10給出了在AR圖像庫上,分別采用下采樣特征、隨機特征、Eigenfaces特征、Fisher特征和拉普拉斯特征,并運用稀疏表示分類(SRC)、最近鄰分類(NN)最近子空間分類(NS)和支持向量機分類(SVM)進行人臉識別的結(jié)果。圖7 基于稀疏表示的識別圖8 最近鄰(NN)識別圖9 最近子空間(NS)識別圖10 支持向量機(SVM)識別由圖7-圖10可知,在特征維數(shù)
26、為540時,稀疏表示分類的識別率在0.8829到0.9029之間,采用隨機特征時識別率達到0.8900。最近鄰分類、最近子空間分類和SVM分類的最高識別率分別為0.7871、0.7614和0.8586。3.3.3 正常圖像識別結(jié)果討論根據(jù)拓展Yale B和AR圖像庫上的人臉識別實驗,我們能夠得出如下分析:1) 在兩個圖像庫上,稀疏表示分類、SVM分類、最近子空間分類的最大識別率都高于最近鄰分類的最大識別率。在Yale B上,稀疏表示分類、SVM分類及最近子空間分類的最大識別率分別為0.9507、0.9252和0.9622,而文獻1中為0.9881、0.977和0.941。顯然稀疏表示分類識別率
27、變低了,而最近子空間分類的識別率變高了。這可能是因為在本報告中,最小范數(shù)問題求解稀疏表示采用CVX凸優(yōu)化包(文獻1中采用增廣拉格朗日的對偶實現(xiàn));還有最近子空間分類根據(jù)文獻7實現(xiàn)(文獻1中最近子空間分類根據(jù)文獻9實現(xiàn)),在文獻7中該分類方法已經(jīng)被改進。2)最近鄰分類、最近鄰子空間分類和SVM分類比較依賴于特征的選擇,并且隨著特征維數(shù)增大,識別率都呈增長趨勢。最近鄰分類和SVM分類隨著特征維數(shù)增大,不同特征的識別率沒有表現(xiàn)出收斂性。3)對于稀疏表示分類,在特征維數(shù)達到一定值時,采用非傳統(tǒng)特征(下采樣特征和隨機特征)與采用傳統(tǒng)特征(Eigenfaces特征、Fisher特征和拉普拉斯特征)能達到相
28、似的識別率,且下采樣特征和隨機特征提取是簡單、易操作的,因此有很好的實用性。3.3.4 隨機噪聲圖像的人臉識別在實驗中,為了驗證基于稀疏表示分類(SRC)對噪聲的魯棒性,要求解拓展最小范數(shù)問題,如(17)式所示。實驗采用拓展Yale B圖像庫,該圖像庫根據(jù)光源方向與攝像機坐標(biāo)之間的夾角可分為5個Subset10,選擇Subset1和Subset2(722幅圖像,光照條件有弱到中等)作為訓(xùn)練集,Subset3(542幅圖像,光照條件更加強烈)用于測試集。先把圖像大小采樣為96×84,則在(17)式中,為8064×8786的矩陣。隨機噪聲圖像人為地生成,對每一幅測試圖像,根據(jù)噪
29、聲強度百分?jǐn)?shù)隨機地選擇像素個數(shù),然后在被選擇的像素位置的灰度值用0, 255間均勻分布的隨機數(shù)取代。噪聲強度百分?jǐn)?shù)由0%變化到90%,圖11展示了采用SRC對一些圖像進行測試的例子。為了凸顯基于稀疏表示分類(SRC)的優(yōu)勢,該方法將與三種常見的人臉識別技術(shù)進行比較。第一種方法是采用主成分分析法(PCA)提取特征11,采用最近鄰分類器(NN)分類。第二種方法是采用獨立成分分析(ICA)提取特征12,采用最近鄰分類器(NN)分類。第三種方法是采用局部非負(fù)矩陣分解(LNMF)提取特征13,采用最近鄰分類器(NN)分類。為了方便起見,本人在仿真時設(shè)這三種方法的特征維數(shù)為500。不同方法在不同噪聲情況下
30、的正確識別率曲線如圖12所示。圖11 隨機噪聲圖像的SRC人臉識別:(a) 從上到下分別加噪30%、50%、70%的測試圖像;(b) 估計誤差;(c) 估計出的稀疏系數(shù);(d) 重建圖像。圖12 隨機噪聲圖像的人臉正確識別率曲線圖12給出了隨著噪聲強度變化,基于稀疏表示分類(SRC)和其他三種人臉識別方法識別正確率性能。由圖可知,SRC算法性能遠好于其他方法。噪聲強度在0%到50%之間時,SRC算法幾乎能將所有目標(biāo)正確分類。在噪聲強度為50%時,其他方法的正確識別率沒有一個能超過50%,而SRC算法的正確識別率達到99%,即使在噪聲強度為70%時,SRC算法的正確識別率也達到90.7%。結(jié) 論
31、 本次課程設(shè)計主要通過閱讀文獻1,理解基于稀疏表示的人臉識別,并對算法實現(xiàn)仿真和對比。由于文獻1中的實驗繁多,本報告只對正常圖像和噪聲污染圖像的人臉識別實驗進行重現(xiàn)。基于稀疏表示分類對正常圖像進行人臉識別時,對不同的圖像數(shù)據(jù)庫,都能達到很高的識別率,在并且在提取的特征維數(shù)一定時,采用簡單、易操作的非傳統(tǒng)特征(下采樣特征和隨機特征)能達到和采用傳統(tǒng)特征(Eigenfaces特征、Fisher特征和拉普拉斯特征)相似的識別率?;谙∈璞硎痉诸悓﹄S機噪聲圖像進行人臉識別時,該算法表現(xiàn)出很強的魯棒性,在噪聲強度小于50%時,人臉正確識別率相當(dāng)高。參 考 文 獻1 J. Wright, A. Y. Yang, A. Ganesh,et al. Robust face recognition via sparse representationJ. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2009, 31(2): 210-227.2趙曉. 基于稀疏表示的人臉識別方法研究D. 北京工業(yè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年河源道路運輸從業(yè)資格考試系統(tǒng)
- 2024-2025學(xué)年新教材高中語文第六單元課時優(yōu)案5拿來主義習(xí)題含解析新人教版必修上冊
- 光學(xué)實驗室建設(shè)方案
- 華師大版數(shù)學(xué)八年級下冊《平面直角坐標(biāo)系》聽評課記錄
- 高中老師工作總結(jié)
- 個人培訓(xùn)研修計劃
- 實驗教學(xué)聽評課記錄
- 餐飲合伙人合同范本
- 應(yīng)急照明施工合同范本
- 華中農(nóng)業(yè)大學(xué)《礦井熱害防治》2023-2024學(xué)年第二學(xué)期期末試卷
- (康德一診)重慶市2025屆高三高三第一次聯(lián)合診斷檢測 英語試卷(含答案詳解)
- 2025年福建泉州文旅集團招聘24人高頻重點提升(共500題)附帶答案詳解
- 建筑行業(yè)砂石物資運輸方案
- 2024政府采購評審專家考試真題庫及答案
- 2025年道路貨運駕駛員從業(yè)資格證模擬考試題
- 數(shù)學(xué)-安徽省皖南八校2025屆高三上學(xué)期12月第二次大聯(lián)考試題和答案
- 腫瘤全程管理
- 融資報告范文模板
- 桃李面包盈利能力探析案例11000字
- GB/Z 30966.71-2024風(fēng)能發(fā)電系統(tǒng)風(fēng)力發(fā)電場監(jiān)控系統(tǒng)通信第71部分:配置描述語言
- 污泥處置合作合同模板
評論
0/150
提交評論