




已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基于PCA的人臉識(shí)別算法Alen Fielding摘要:文章具體討論了主成分分析( PCA)人臉識(shí)別算法的原理及實(shí)現(xiàn)。它具有簡(jiǎn)單、快速和易行等特點(diǎn),能從整體上反映人臉圖像的灰度相關(guān)性具有一定的實(shí)用價(jià)值。關(guān)鍵詞:人臉識(shí)別;PCA;生物特征;識(shí)別技術(shù)中圖分類(lèi)號(hào): TP302文獻(xiàn)標(biāo)識(shí)碼: AFace recognition method based on PCA Zhangjinhua(Information engineering college,Southwest university of science and technology,Sichuan,621010,China)Abstract : The paper discussed the principal component analysis (PCA) face recognition algorithm of principle and realization. It is simple, rapid and easy wait for a characteristic, can reflect from whole face image gray correlation has certain practical value.Key words : Face recognition; PCA; Biological characteristics; Recognition technology1引言 PCA,即Principal Component Analysis,主成分分析方法,是一種得到廣泛應(yīng)用的事實(shí)上的標(biāo)準(zhǔn)人臉識(shí)別方法。傳統(tǒng)主成分分析方法的基本原理是:利用K-L變換抽取人臉的主要成分,構(gòu)成特征臉空間,識(shí)別時(shí)將測(cè)試圖像投影到此空間,得到一組投影系數(shù),通過(guò)與各個(gè)人臉圖像比較進(jìn)行識(shí)別。這種方法使得壓縮前后的均方誤差最小,且變換后的低維空間有很好的分辨能力。2 K-L變換 PCA方法是由Turk和Pentlad提出來(lái)的,它的基礎(chǔ)就是Karhunen-Loeve變換(簡(jiǎn)稱(chēng)K-L變換),是一種常用的正交變換。首先對(duì)K-L變換作一個(gè)簡(jiǎn)單介紹:假設(shè)X為n維的隨機(jī)變量,X可以用n個(gè)基向量的加權(quán)和來(lái)表示: X= ii式中:i是加權(quán)系數(shù),i是基向量,此式可以用矩陣的形式表示: X =(1 ,2,3 ,n)( 1, 2 , n)= 系數(shù)向量為: =TX綜上所述,K-L展開(kāi)式的系數(shù)可用下列步驟求出:步驟一 求隨機(jī)向量X的自相關(guān)矩陣R=EXTX,由于沒(méi)有類(lèi)別信息的樣本集的均值向量,常常沒(méi)有意義,所以也可以把數(shù)據(jù)的協(xié)方差矩陣=E(x-)(x-)T作為K-L坐標(biāo)系的產(chǎn)生矩陣,這里是總體均值向量。步驟二 求出自相關(guān)矩陣或者協(xié)方差矩陣R的本征值i和本征向量i,=(1 ,2,3 ,n)步驟三 展開(kāi)式系數(shù)即為=TX K-L變換的實(shí)質(zhì)是建立一個(gè)新的坐標(biāo)系,將一個(gè)物體主軸沿特征矢量對(duì)齊的轉(zhuǎn)變換,這個(gè)變換解除了原有數(shù)據(jù)向量的各個(gè)分量之間相關(guān)性,從而有可能去掉那些帶有較少信息的坐標(biāo)系以達(dá)到降低特征空間維數(shù)的目的。3 PCA方法 PCA方法,也被叫做特征臉?lè)椒?eigenfaces),是一種基于整幅人臉圖像的識(shí)別算法,被廣泛用于降維,在人臉識(shí)別領(lǐng)域也表現(xiàn)突出。一個(gè)NN的二維臉部圖片可以看成是N的一個(gè)一維向量,一張11292的圖片可以看成是一個(gè)10,304維的向量,同時(shí)也可以看成是一個(gè)10,304維空間中一點(diǎn)。圖片映射到這個(gè)巨大的空間后,由于人臉的構(gòu)造相對(duì)來(lái)說(shuō)比較接近,因此,可以用一個(gè)相應(yīng)的低維子空間來(lái)表示。我們把這個(gè)子空間叫做“臉空間”。PCA的主要思想就是找到能夠最好地說(shuō)明圖片在圖片空間中的分布情況的那些向量。這些向量能夠定義“臉空間”,每個(gè)向量的長(zhǎng)度為N,描述一張NN的圖片,并且是原始臉部圖片的一個(gè)線性組合。對(duì)于一副M*N的人臉圖像,將其每列相連構(gòu)成一個(gè)大小為D=M*N維的列向量。D就是人臉圖像的維數(shù),也即是圖像空間的維數(shù)。設(shè)n是訓(xùn)練樣本的數(shù)目;Xj表示第j幅人臉圖像形成的人臉向量,則所需樣本的協(xié)方差矩陣為: Sr= (1)其中u為訓(xùn)練樣本的平均圖像向量: u = (2) 令A(yù)=x1-u x2-uxn-u,則有Sr=AAT,其維數(shù)為D*D。 根據(jù)K-L變換原理,需要求得的新坐標(biāo)系由矩陣AAT的非零特征值所對(duì)應(yīng)得特征向量組成。直接計(jì)算的計(jì)算量比較大,所以采用奇異值分解(SVD)定理,通過(guò)求解ATA的特征值和特征向量來(lái)獲得AAT的特征值和特征向量。 依據(jù)SVD定理,令li(i=1,2,r)為矩陣ATA的r個(gè)非零特征值,vi為ATA對(duì)應(yīng)于li的特征向量,則AAT的正交歸一特征向量ui為: (i=1,2,r) (3)則特征臉空間為:w=(u1 ,u2 ur,)。將訓(xùn)練樣本投影到“特征臉”空間,得到一組投影向量=wTu,構(gòu)成人臉識(shí)別的數(shù)據(jù)庫(kù)。在識(shí)別時(shí),先將每一幅待是識(shí)別的人臉圖像投影到“特征臉”空間,再利用最近鄰分類(lèi)器的比較其與庫(kù)中人臉的位置,從而識(shí)別出該圖像是否是庫(kù)中的人臉,如果是,是哪一個(gè)人臉。4利用PCA進(jìn)行人臉識(shí)別 完整的PCA人臉識(shí)別的應(yīng)用包括幾個(gè)步驟:人臉圖像預(yù)處理;讀入人臉庫(kù),訓(xùn)練形成特征子空間;把訓(xùn)練圖像和測(cè)試圖像投影到上一步驟中得到的子空間上;選擇一定的距離函數(shù)進(jìn)行識(shí)別。本文采用matlab7.5作為工具平臺(tái), 實(shí)現(xiàn)了一個(gè)人臉自動(dòng)識(shí)別的系統(tǒng)原型。實(shí)驗(yàn)在樣本圖庫(kù)英國(guó)劍橋大學(xué)的ORL( Olivetti Research Laboratory) 人臉庫(kù)上進(jìn)行,它為網(wǎng)上下載的國(guó)外標(biāo)準(zhǔn)人臉數(shù)據(jù)庫(kù)。ORL 庫(kù)包含40 個(gè)人,每個(gè)人10副圖像,共計(jì)400 幅人臉正面圖像,每幅圖像大小為92112,圖像是在不同時(shí)間,光線輕微變化的條件下攝制的,其中包括姿態(tài)、光照和表情的差別。其中部分如圖1 所示:圖1ORL 人臉數(shù)據(jù)庫(kù)中的 5幅圖像該數(shù)據(jù)庫(kù)提供了經(jīng)過(guò)預(yù)處理的人臉訓(xùn)練集和測(cè)試集。選取前5 張人臉圖像作為訓(xùn)練樣本,后5 張人臉圖像作為測(cè)試樣本。本實(shí)驗(yàn)運(yùn)行的環(huán)境是IntelCelero n CPU 2.00GHz 處 理器、512MB 內(nèi) 存,Window s XP 操作系統(tǒng),對(duì)ORL 人臉庫(kù)樣本訓(xùn)練時(shí)間為70. 91s,識(shí)別率為90% ,訓(xùn)練樣本數(shù)目多增加人臉特征庫(kù)的容量,會(huì)幾何級(jí)增加人臉識(shí)別核心算法的時(shí)間和空間復(fù)雜度。在識(shí)別結(jié)果的顯示窗口中, 一共顯示了在整個(gè)人臉圖像庫(kù)中最小的10 個(gè)歐氏距離,它們的排列也是從小到大進(jìn)行排列的,同時(shí), 換句話說(shuō),這10 個(gè)歐氏距離,也就分別代表了與實(shí)驗(yàn)中選取的待識(shí)別的人臉圖像最相近的10 幅人臉圖像。距離最近, 當(dāng)然也就是我們實(shí)驗(yàn)所需識(shí)別的人臉圖像。下面詳細(xì)描述整個(gè)過(guò)程:4.1 讀入人臉庫(kù) 歸一化人臉庫(kù)后,將庫(kù)中的沒(méi)人選擇一定數(shù)量的圖像構(gòu)成訓(xùn)練集,其余的構(gòu)成測(cè)試集。設(shè)歸一化后的圖像時(shí)n*m維,按列相連就構(gòu)成N=n*m維矢量,可視為N維空間中的一個(gè)點(diǎn),可以空過(guò)K-L變換用一個(gè)低維子空間描述這個(gè)圖像。4.2 計(jì)算通過(guò)K-L變換的生成矩陣所有訓(xùn)練樣本的協(xié)方差矩陣為(以下三個(gè)等價(jià));a. C1=( T)/M-mx.mxTb. C1=(A.AT)/M (1)c. C1= /MA=(12,m), i=xi-mx,其中mx是平均人臉,M是訓(xùn)練人臉數(shù),協(xié)方差矩陣C1是一個(gè)N*N的矩陣,N是xi的維數(shù)。為了方便計(jì)算特征值和特征向量,一般選用第二個(gè)公式。根據(jù)K-L變換原理,我們所求的新坐標(biāo)即由矩陣A.AT的非零特征值所對(duì)應(yīng)的特征向量組成。直接求N*N大小矩陣的C1的特征值和正交歸一特征向量是很困難的,根據(jù)奇異值分解原理,可以通過(guò)求解ATA的特征值和特征向量來(lái)獲得AAT的特征值和特征向量。4.3 識(shí)別利用公式Y(jié)=UT*X,首先把所有圖片進(jìn)行投影,然后對(duì)于測(cè)試圖片也進(jìn)行同樣的投影,采用判別函數(shù)對(duì)投影系數(shù)進(jìn)行識(shí)別。5結(jié)論與展望人臉識(shí)別是目前較活躍的研究領(lǐng)域, 本文詳細(xì)給出了基于主成分分析的人臉特征提取的原理與方法。并使用matlab 作為工具平臺(tái), 實(shí)現(xiàn)了一個(gè)人臉自動(dòng)識(shí)別的系統(tǒng)原型。實(shí)驗(yàn)結(jié)果表明, 該系統(tǒng)識(shí)別率為85%, 達(dá)到預(yù)期的效果。如果想進(jìn)一步提高人臉識(shí)別率, 可以考慮與其他方法結(jié)合。僅單獨(dú)使用任何一種現(xiàn)有的方法一般都不會(huì)取得很好的識(shí)別效果, 將其他人臉識(shí)別方法組合是今后研究的一種趨勢(shì)。也可以考慮改進(jìn)分類(lèi)決策的方法。本系統(tǒng)采用的最小距離分類(lèi)法屬于線性的分類(lèi)器, 而利用神經(jīng)網(wǎng)絡(luò)這類(lèi)學(xué)習(xí)能力更強(qiáng)的非線性分類(lèi)器對(duì)高維人臉識(shí)別問(wèn)題可能會(huì)有更好的解決。參考文獻(xiàn):1 鄧楠, 基于主成份分析的人臉識(shí)別. 2006.06.2 龔勛, PCA 與人臉識(shí)別及其理論基礎(chǔ). 2007.04.3 田印中, 董志學(xué), 黃建偉, 基于PCA 的人臉識(shí)別算法研究及實(shí)現(xiàn). 2010.03.4 李華勝, 楊樺,袁保宗. 人臉識(shí)別系統(tǒng)中的特征提取. 2001,06.5 溫福喜, 劉宏偉. 基于 2D PCA和 2D LDA的人臉識(shí)別方法. 2007.08.6 李剛, 高政.人臉識(shí)別理論研究進(jìn)展. 2003, 01.7 張翠平, 蘇光大.人臉識(shí)別技術(shù)綜述. 2000, 05.8 羅昊, 孟傳良.基于特征臉和LDA的人臉識(shí)別.2005,12附錄-Matlab源代碼:function FaceRecognitionclear% calc xmean,sigma and its eigen decompositionallsamples=;%所有訓(xùn)練圖像for i=1:40 for j=1:5 a=imread(strcat(D:rawdataORLs,num2str(i),num2str(j),.pgm); % imshow(a); b=a(1:112*92); % b是行矢量 1N,其中N10304,提取順序是先列后行,即從上到下,從左到右 b=double(b); allsamples=allsamples; b; % allsamples 是一個(gè)M * N 矩陣,allsamples 中每一行數(shù)據(jù)代表一張圖片,其中M200 endendsamplemean=mean(allsamples); % 平均圖片,1 Nfor i=1:200 xmean(i,:)=allsamples(i,:)-samplemean; % xmean是一個(gè)M N矩陣,xmean每一行保存的數(shù)據(jù)是“每個(gè)圖片數(shù)據(jù)-平均圖片”end;sigma=xmean*xmean; % M * M 階矩陣v d=eig(sigma);d1=diag(d);d2 index=sort(d1); %以升序排序cols=size(v,2);% 特征向量矩陣的列數(shù)for i=1:cols vsort(:,i) = v(:, index(cols-i+1) ); % vsort 是一個(gè)M*col(注:col一般等于M)階矩陣,保存的是按降序排列的特征向量,每一列構(gòu)成一個(gè)特征向量 dsort(i) = d1( index(cols-i+1) ); % dsort 保存的是按降序排列的特征值,是一維行向量end %完成降序排列%以下選擇90%的能量dsum = sum(dsort); dsum_extract = 0; p = 0; while( dsum_extract/dsum 0.9) p = p + 1; dsum_extract = sum(dsort(1:p); endi=1;% (訓(xùn)練階段)計(jì)算特征臉形成的坐標(biāo)系while (i0) base(:,i) = dsort(i)(-1/2) * xmean * vsort(:,i); % base是Np階矩陣,除以dsort(i)(1/2)是對(duì)人臉圖像的標(biāo)準(zhǔn)化,詳見(jiàn)基于PCA的人臉識(shí)別算法研究p31 i = i + 1;end% add by wolfsky 就是下面兩行代碼,將訓(xùn)練樣本對(duì)坐標(biāo)系上進(jìn)行投影,得到一個(gè) M*p 階矩陣allcoorallcoor = allsamples * base;accu = 0;% 測(cè)試過(guò)程for i=1:40 for j=6:10 %讀入40 x 5 副測(cè)試圖像 a=imread(strcat(D:rawdataORLs,num2str(i),num2str(j),.pgm); b=a(1:10304); b=double(b); tcoor= b * base; %計(jì)算坐標(biāo),是1p階矩陣 for k=1:200 mdist(k)=norm(tcoor-allcoor(k,:); end; %三階近鄰 dist,index2=sort(mdist);
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 學(xué)校派遣工管理制度
- 學(xué)校綠化員管理制度
- 學(xué)生星級(jí)化管理制度
- 學(xué)齡前培訓(xùn)管理制度
- 安全注射室管理制度
- 安徽生育證管理制度
- 宏寶萊公司管理制度
- 實(shí)行項(xiàng)目庫(kù)管理制度
- 實(shí)驗(yàn)室試樣管理制度
- 室內(nèi)籃球場(chǎng)管理制度
- 融媒體保密管理制度
- 2025江蘇揚(yáng)州寶應(yīng)縣“鄉(xiāng)村振興青年人才”招聘67人筆試參考題庫(kù)附答案詳解
- 2025年河南高考真題化學(xué)試題含答案
- 陜西省榆林市2023-2024學(xué)年高二下學(xué)期期末質(zhì)量檢測(cè)政治試卷(含答案)
- 2025年高考全國(guó)二卷數(shù)學(xué)高考真題解析 含參考答案
- 2025年普通高等學(xué)校招生全國(guó)統(tǒng)一考試數(shù)學(xué)試題(全國(guó)一卷)(有解析)
- 護(hù)士文職面試題及答案
- 解剖期末試題題庫(kù)及答案
- 2025年山西焦煤集團(tuán)公司招聘筆試參考題庫(kù)含答案解析
- 【MOOC】生理學(xué)-中南大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 2024年浙江省中考數(shù)學(xué)試題及答案
評(píng)論
0/150
提交評(píng)論