基于稀疏表示的人臉識(shí)別算法_第1頁
基于稀疏表示的人臉識(shí)別算法_第2頁
基于稀疏表示的人臉識(shí)別算法_第3頁
基于稀疏表示的人臉識(shí)別算法_第4頁
基于稀疏表示的人臉識(shí)別算法_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于摘要稀疏表示的數(shù)學(xué)實(shí)質(zhì)就是在超完備字典下對(duì)給定信號(hào)的線性分解。本文研究了一種基于稀疏表示的正交匹配追蹤(orthogonalmarchingpursuit,簡(jiǎn)稱OMP)算法,遞歸的對(duì)所選原子集合進(jìn)行正交化,并且利用矩陣cholesky分解簡(jiǎn)化迭代過程中矩陣求逆的計(jì)算。在人臉識(shí)別的實(shí)際應(yīng)用中,利用實(shí)驗(yàn)樣本構(gòu)建冗余字典,將待檢測(cè)樣本表示成試驗(yàn)樣本的線性組合。通過在不同人臉庫上的實(shí)驗(yàn)證明了該算法的有效性。關(guān)鍵字稀疏表示稀疏編碼人臉識(shí)別正交匹配追蹤1緒論1.1背景及意義隨著科技的迅猛發(fā)展,人類社會(huì)已經(jīng)進(jìn)入信息時(shí)代,信息安全問題日益得到高度重視。鑰匙、密碼、證件等傳統(tǒng)形式的身份認(rèn)證技術(shù)已經(jīng)遠(yuǎn)遠(yuǎn)不能完

2、全滿足現(xiàn)代社會(huì)中對(duì)信息安全有高質(zhì)量要求的部門的需要。因此,新一代的身份認(rèn)證技術(shù)應(yīng)運(yùn)而生。人的生物特征具有唯一性、穩(wěn)定性等多種優(yōu)點(diǎn),已逐漸成為新一代的身份認(rèn)證技術(shù)的主要依據(jù)。在眾多的基于生物特征的身份識(shí)別技術(shù)中,人臉識(shí)別技術(shù)因其自然性、友好性等顯著優(yōu)勢(shì)而受到廣泛關(guān)注,目前已經(jīng)被應(yīng)用到模式識(shí)別、人工智能、計(jì)算機(jī)視覺、認(rèn)知科學(xué)等多個(gè)領(lǐng)域中。然而,由于人臉圖像易受到光照、姿態(tài)、遮擋和表情等多種因素的影響,識(shí)別效果也易受圖像數(shù)據(jù)庫大小的干擾1-2,計(jì)算機(jī)智能識(shí)別課題的研究仍然具有較高的挑戰(zhàn)性。1.2發(fā)展?fàn)顩r1888年,Nature上發(fā)表了第一篇利用人臉進(jìn)行身份識(shí)別的文章,由此開啟了近代對(duì)人臉識(shí)別技術(shù)的研

3、究。1965年,Chan和Bledsoe共同創(chuàng)建了世界上第一個(gè)自動(dòng)人臉識(shí)別系統(tǒng)3-4。隨著計(jì)算機(jī)技術(shù)的迅猛發(fā)展和相關(guān)理論的日益成熟,人臉識(shí)別技術(shù)的到了快速的發(fā)展與廣泛的應(yīng)用,其發(fā)展過程大致可以劃分為以下三個(gè)階段:起步階段早期人臉識(shí)別技術(shù)主要利用人臉的幾何結(jié)構(gòu)特性(GeometricFeatureBased)以及它們之間的角度、距離和區(qū)域形狀等參數(shù)作為識(shí)別依據(jù)。在這一階段,很多參數(shù)的測(cè)定需要人工標(biāo)定,因此只能稱之為半自動(dòng)人臉識(shí)別系統(tǒng),但是這種方法的提出為后續(xù)其他方法的提出提供了理論參考。發(fā)展階段90年代初,研究人員發(fā)現(xiàn)人臉圖像之間存在很強(qiáng)的相關(guān)性,人臉圖像本身只是高維圖像空間中的一個(gè)子空間,若直

4、接使用,會(huì)因維數(shù)過高而產(chǎn)生“維數(shù)災(zāi)難”等問題。因此,各種降維方法陸續(xù)產(chǎn)生。本階段主要產(chǎn)生了線性判別分析(LinearDisriminantAnalysis,簡(jiǎn)稱LDA)算法、主成分分析(principalcomponentanalysis,簡(jiǎn)稱PCA)算法以及統(tǒng)計(jì)模式識(shí)別方法等多種算法。攻堅(jiān)階段進(jìn)入二十一世紀(jì),人臉識(shí)別技術(shù)進(jìn)入攻堅(jiān)階段。在前兩個(gè)階段的發(fā)展過程中,人臉識(shí)別技術(shù)已經(jīng)積累了豐富的理論和大量的算法,基本能夠解決可控條件下的身份識(shí)別問題。但是,非理想條件、大規(guī)模人臉數(shù)據(jù)庫等問題下的人臉識(shí)別仍有待解決。針對(duì)這些問題,產(chǎn)生了等距離映射(IsometricalMapping,簡(jiǎn)稱ISOMAP)

5、、局部線性嵌入(LocallyLinearEmbedding,簡(jiǎn)稱LLE)、最大方差展開(MaximumVarianeeUnfolding,簡(jiǎn)稱MVU)等多種方法,基于稀疏表示的人臉識(shí)別方法也生在這一階段脫穎而出。2人臉識(shí)別2.1人臉識(shí)別概念人臉識(shí)別就是利用人臉的生物特征對(duì)身份進(jìn)行判別,這些生物特征可分為眼、鼻、嘴的幾何形狀或關(guān)系等外部特征以及人臉的結(jié)構(gòu)關(guān)系等內(nèi)部特征兩個(gè)方面。2.2影響因素及相應(yīng)解決方法2.2.1光照問題人臉識(shí)別系統(tǒng)的性能與人臉識(shí)別算法的設(shè)計(jì)以及人臉圖像的質(zhì)量等有密切的關(guān)系。在影響人臉圖像質(zhì)量的眾多因素之中,光照問題不容忽視。一般將人臉識(shí)別中處理光照問題的方法分為三類:基于圖

6、像處理技術(shù)的方法;基于子空間的方法;基于光照不變特征提取算法?;趫D像處理技術(shù)的方法主要從圖像本身出發(fā),利用對(duì)光照變化不敏感或無變化的特征進(jìn)行圖像處理?;谧涌臻g的方法原理是同一物體在不同光照下的圖像屬于一個(gè)低維度的線性子空間,通過尋求與輸入圖像最為接近的子空間進(jìn)行識(shí)別。基于光照不變特征提取方法的算法可以分為傳統(tǒng)光照不變特征提取和基于人臉反射系數(shù)的光照不變特征提取兩大類。2.2.2姿態(tài)問題姿態(tài)問題同樣也是人臉識(shí)別中亟待解決的一個(gè)難點(diǎn)。目前多數(shù)的人臉識(shí)別算法僅適用于正面或準(zhǔn)正面的人臉圖像條件下的人臉識(shí)別,對(duì)于其他姿態(tài)下的人臉圖像,識(shí)別率相對(duì)較低。針對(duì)這一問題,目前已經(jīng)提出了局部線性回歸(Loca

7、llyLinearRegression,簡(jiǎn)稱LLR)算法、基于神經(jīng)網(wǎng)絡(luò)的方法和光度立體分析等方法。2.2.3數(shù)據(jù)庫大小問題在人臉識(shí)別技術(shù)中,人臉圖像數(shù)據(jù)庫的大小存在兩種極端情況:人臉圖像數(shù)據(jù)庫過大;單樣本或少樣本人臉數(shù)據(jù)庫。如果人臉圖像數(shù)據(jù)庫過大,則對(duì)相關(guān)算法的運(yùn)算速度要求較高,如果人臉圖像數(shù)據(jù)庫樣本過少,則會(huì)影響人臉識(shí)別的正確率。針對(duì)數(shù)據(jù)庫過大問題,目前主要提出了主成分分析、線性辨別分析和隱馬爾可夫模型等方法來提高效率56。針對(duì)單樣本問題,主要的解決方法有樣本擴(kuò)張法、圖像增強(qiáng)法和特征子空間擴(kuò)張法等。2.2.4遮擋、年齡、表情等問題喜怒哀樂,生老病死是所有人類都不可避免的人生成長經(jīng)歷。然而,伴

8、隨而來的表情表情年齡、遮擋等問題給自動(dòng)人臉識(shí)別系統(tǒng)的設(shè)計(jì)增加了很大的難度。目前,針對(duì)表情及年齡問題,已提出了基于多分類融合的3D算法、利用(2)三維數(shù)據(jù)對(duì)圖像進(jìn)行重構(gòu)等方法7-8;針對(duì)遮擋問題,也已提出了帶遮擋人臉的支持向量機(jī)、尺度不變特征變換(ScaleInvariantFeatureTransform,簡(jiǎn)稱SIFT)、隨機(jī)非均勻局部Gabor二值模式(RandomNonuniformLocalGaborBinaryPattern,簡(jiǎn)稱RNLGBP)等算法。3稀疏表示3.1稀疏表示的意義香農(nóng)定理表明,模擬信號(hào)可以用一定采樣頻率的周期函數(shù)來表示。然而,這種表示方法對(duì)信號(hào)的分析帶來了一些不便。對(duì)

9、于壓縮問題,希望用較少的系數(shù)表示較多的信息;對(duì)于識(shí)別問題,希望信號(hào)的主要特征突出;對(duì)于去噪問題,希望將有用信號(hào)與噪聲進(jìn)行有效分離。這些應(yīng)用都有一個(gè)共同的特點(diǎn),就是簡(jiǎn)化信號(hào)的表示(稀疏化)。3.2稀疏表示的概念研究人員發(fā)現(xiàn),通過使用原子庫(過完備冗余函數(shù)體系)取代傳統(tǒng)完備正交函數(shù)集,可有效從原子庫中找到具有最佳線性組合的n項(xiàng)原子信號(hào)來表示一個(gè)給定信號(hào),而這些組合的系數(shù)大部分為0或接近于0,即稀疏表示。稀疏表示主要采用稀疏逼近原理即高度非線性逼近原理。對(duì)于一個(gè)給定集合S=u;ii=1,2,I,其元素u是張成整個(gè)Hilert空間H=rm的單位矢量,IM。集合iS稱為原子庫,元素u稱為原子。對(duì)于任意給

10、定的信號(hào)feH,預(yù)想在S中自適i應(yīng)的選取n個(gè)原子對(duì)信號(hào)做n項(xiàng)逼近:f=工cunrrreKn(1)其中K是u的下標(biāo)集,card(K)=n,則B=span(u,reK)就是由nnrnrn個(gè)原子在原子庫S中張成的最佳子集。我們定義逼近誤差為:(f,S)=intf-f由于n遠(yuǎn)小于空間的維數(shù)M,所以這種逼近也被稱作稀疏逼近。由于原子庫存在定的冗余性,知上式存在多組解。稀疏表示的目的就是從中選取解的系數(shù)最為稀疏的或使n取值最小的解。這個(gè)問題等同于下述問題:Minimize口csubjecttof=cu0kki=0(3)稀疏表示的最初目的是為了以低于香農(nóng)定理的采樣頻率表示和壓縮信號(hào)2,事上,在去噪方面,小波

11、變換和平以不變小波也開發(fā)出許多有效算法4;稀疏表示已成功應(yīng)用與圖像動(dòng)態(tài)范圍的壓縮9,圖像卡通和紋理成分的分離10等。在這些應(yīng)用中,算法的性能取決于表示的稀疏性是否忠實(shí)于原始信號(hào)。3基于稀疏表示的人臉識(shí)別3.1基于稀疏表示的人臉識(shí)別原理訓(xùn)練集圖像圖像預(yù)處理=特征提取稀疏表示分類圖1基于稀疏表示的人臉識(shí)別框圖設(shè)給定的訓(xùn)練集A中有i類已標(biāo)記好的樣本,其中第k類中含有n個(gè)樣本。k則屬于第k類的樣本集合可以用矩陣A=a,aaeRmxnk來表示,且每kk1k2k“k個(gè)樣本對(duì)應(yīng)于矩陣的一個(gè)列向量,m為人臉圖像的維數(shù)。為了提高效率,現(xiàn)假定每個(gè)類別的矩陣對(duì)應(yīng)于用于稀疏表示的訓(xùn)練字典。對(duì)于任意給定的測(cè)試樣本y,若

12、其屬于某一訓(xùn)練集所包含的類別a,那么便可以用a的線性組合來表Z示o為便于理解,現(xiàn)假設(shè)第k類中有足夠多的訓(xùn)練樣本構(gòu)成矩陣A,且待測(cè)試樣k本y屬于第k類,則可以用具有相同類別屬性的第k類訓(xùn)練樣本的線性組合近1似表示待測(cè)試樣本y,即1y=xa+xa+.+xa其中xgR,j=1,2,jn1k1k1k2k2knkknkkjk(4)然而,一般情況下的待測(cè)試樣本所屬類別并不知曉,因此用于實(shí)驗(yàn)的樣本字典是由i類訓(xùn)練樣本集的所有樣本共同構(gòu)成的,即:A=A,A,.,A=a,aaaa12i1112lni1in.因此,任意待測(cè)試樣本y就可以用字典線的性表示,即:Y=Ax(6)其中x=0,0,,0,x,xx,0,0,.

13、,0TGRm是-個(gè)很稀疏的系數(shù)矢k1k2knk量。由x就可以獲得關(guān)于y的類別信息。顯然,若mn,易知方程組(6)為過定的,解向量x唯一。但是對(duì)于人臉識(shí)別問題,經(jīng)降維處理后的樣本構(gòu)成的方程組是典型欠定的,故解向量x并不唯一。由壓縮感知理論和稀疏表示可知,如果向量x足夠稀疏,那么稀疏解的個(gè)數(shù)L范數(shù)問題可以轉(zhuǎn)化為L范數(shù)問題,即02X=argmin口xsubjecttoy=Ax223.2基于稀疏表示的人臉識(shí)別算法3.2.1正交匹配追蹤算法正交匹配追蹤算法是稀疏表示的經(jīng)典算法之一,為求得式(7)提出的問題的最佳逼近解正交匹配追蹤算法在每一步的迭代過程中選擇和當(dāng)前迭代殘差最相關(guān)的原子,將信號(hào)正交投影到這些

14、原子張成的空間中,循環(huán)計(jì)算殘差直到滿足約束條件(詳細(xì)步驟見算法一)。注意第5行是貪婪算法選擇原子的步驟,第7行是正交投影的步驟。算法1正交匹配追蹤Input:dietionaryA,targetsparsityKOutput:sparserepresentationxInit:SetI=,r=y,x=0while(stoppingcriterionnotmet)dok=argmaxIdTrlk1kI=(I,k)7-x=(A)+yIIr=y-axIIendwhile3.2.2快速正交匹配追蹤快速正交匹配追蹤算法通過在基本的正交匹配追蹤算法中對(duì)冗余字典采用Cholesky分解,提高了算法的整體效率

15、。算法2快速正交匹配追蹤Input:dietionaryA,targetsparsityKOutput:sparserepresentationxInit:SetI=,L=1,r=y,x=0,a(o)=aty,m=1while(stoppingcriterionnotmet)dok=argmax|dTr|kkifm1thenw=solveforwLw=atakL0L=WTJl-WTWendifI=(I,k)x=solveforcLLtc=aIIr=y-axIIn=n+1endwhile4實(shí)驗(yàn)結(jié)果與分析我們運(yùn)用本文所述算法主要在ORL和擴(kuò)展的YaleB兩個(gè)人臉數(shù)據(jù)庫進(jìn)行識(shí)別精度與時(shí)間的測(cè)試。我們

16、主要關(guān)心在不同的光照和不同的表情兩種主要因素下的測(cè)試結(jié)果。ORL人臉數(shù)據(jù)庫含有40個(gè)不同人的臉,每個(gè)人臉有10張不同表情的圖像,總共400張圖像。擴(kuò)展的YaleB是一個(gè)比較大的人臉數(shù)據(jù)庫,含有16128張人臉圖像,包含了38個(gè)不同人臉的64種光照條件下的不同圖像。本實(shí)驗(yàn)僅從中選取了一個(gè)小的子集,但已足夠測(cè)試本文算法對(duì)光照條件的敏感性。4.1有表情變化的實(shí)驗(yàn)本算法隨機(jī)從ORL人臉庫每個(gè)人臉的圖像中選取不同比重的圖像作為訓(xùn)練集,余下的圖像做為測(cè)試樣本,稀疏閾值設(shè)置為訓(xùn)練樣本數(shù)目。表1顯示的是隨著訓(xùn)練樣本比重增大識(shí)別率的變化情況??傊?,在訓(xùn)練樣本足夠多的情況下測(cè)試樣本都可以用字典中所屬類別的原子的線

17、性組合來表示。圖2ORL數(shù)據(jù)庫不同表情變化表1正交匹配追蹤算法應(yīng)用于ORL數(shù)據(jù)庫訓(xùn)練圖像測(cè)試圖像稀疏閾值識(shí)別率(%)5556467378284.2不同光照條件的實(shí)驗(yàn)本算法隨機(jī)從擴(kuò)展的YaleB數(shù)據(jù)庫的一個(gè)子集下每個(gè)人臉的圖像中選取不同比例的圖像作為訓(xùn)練集,余下的圖像作為測(cè)試樣本,稀疏閾值設(shè)置為訓(xùn)練樣本數(shù)目。表2顯示的是隨著訓(xùn)練樣本比重變大識(shí)別率的變化情況。從中可以看出,本算法在不同光照條件下表現(xiàn)出較高的識(shí)別率。圖2YaleB數(shù)據(jù)庫種不同光照條件表2正交匹配追蹤算法應(yīng)用于YaleB數(shù)據(jù)庫訓(xùn)練圖像測(cè)試圖像稀疏閾值識(shí)別率()164816323232481648結(jié)束語本文研究了稀疏表示理論并且應(yīng)用矩陣

18、Cholesky分解實(shí)現(xiàn)正交匹配追蹤快速算法,該算法簡(jiǎn)化了迭代過程中逆矩陣的計(jì)算,提高了識(shí)別的速度,并在具有表情變化和光照變化的條件下取得了很好的識(shí)別率。人臉識(shí)別的困難主要在于遮擋、單樣本、魯棒性等的問題。稀疏表示在這些限制下的識(shí)別中仍具有很大的發(fā)展?jié)摿?,有待于進(jìn)一步研究,這也是目前一個(gè)比較熱門的研究方向。參考文獻(xiàn)P.JonathonPhillips,W.ToddScruggs,PatrickJ.Flynn,KevinW.Bowyer,etal.FRVT2006andICE2006Large-ScaleExperimentResultsJ.IEEETransactionsonPatternAn

19、alysisandMachineIntelligenee,2010,35(5):830-852.JitaoSang,ZhenLei,andStanZ.LiFaceImageQualityEvaluationforISO/IECStandards19794-5and29794-5C.InThirdInternationalConferencesICB2009,2009:225-340.SubhransuMaji,AlexanderC.Berg,JitendraMalik.Classificationusingintersectionkernelsupportvectormachinesiseff

20、icientC.2008IEEEConfereneeonComputerVisionandPatternRecognition,pp.1-12,2008.Stan乙LiandAnilK.Jain,HandbookofFaceRecognitionM,2011.Z.Stone,T.Zickler,T.Darrell.TowardLarge-ScaleFaceRecognitionUsingSocialNetworkContext卩.ProceedingsoftheIEEE,2010,98(8):10461417.ZhenLei,ShengcaiLiao,M.Pietikainen,S.Z.Li;FaceRecognitionbyExploringInformationJointlyinSpace,ScaleandOrientationJ.IEEETransactionsonImageProcessing,2011,20(1):244-261.H.H.K.Tin,M.M.Sein.RobustMethodofAgeDependentFaceRecognitionC.Intell

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論