




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、人臉識(shí)別特征臉?lè)椒ㄙZ東亞12346046一、實(shí)驗(yàn)?zāi)康?、學(xué)會(huì)使用PCA主成分分析法。2、初步了解人臉識(shí)別的特征法。3、更熟練地掌握 matlab的使用。二、原理介紹1、PCA (主成分分析法介紹)引用一個(gè)網(wǎng)上的例子。假設(shè)有一份對(duì)遙控直升機(jī)操作員的調(diào)查,用x1(i)表示飛行員i的飛行技能,x2(i)表示飛行員i喜歡飛行的程度。通常遙控直升飛機(jī)是很難操作的,只有那些 非常堅(jiān)持而且真正喜歡駕駛的人才能熟練操作。所以這兩個(gè)屬性x1(i)和x2(i)相關(guān)性是非常強(qiáng)的。我們可以假設(shè)兩者的關(guān)系是按正比關(guān)系變化的。如下圖里的任意找的向量u1所示,數(shù)據(jù)散布在u1兩側(cè),有少許噪聲。現(xiàn)在我們有兩項(xiàng)數(shù)據(jù),是二維的。那
2、么如何將這兩項(xiàng)變量轉(zhuǎn)變?yōu)橐粋€(gè)來(lái)描述飛行員呢?由圖中的點(diǎn)的分布可知,如果我們找到一個(gè)方向的U,所有的數(shù)據(jù)點(diǎn)在 U的方向上的投影之和最大,那么該 U就能表示數(shù)據(jù)的大致走向。而在垂直于U的方向,各個(gè)數(shù)據(jù)點(diǎn)在該方向的投影相對(duì)于在 U上的投影如果足夠小,那么我們可以忽略掉各數(shù)據(jù)在該方向的投影,這 樣我們就把二維的數(shù)據(jù)轉(zhuǎn)化成了在U方向上的一維數(shù)據(jù)。為了將u選出來(lái),我們先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。先求出所有數(shù)據(jù)的平均值,然后用數(shù)據(jù)與 平均值的偏差代替數(shù)據(jù)本身。然后對(duì)數(shù)據(jù)歸一化以后,再代替數(shù)據(jù)本身。而我們求最大的投影和,其實(shí)就是求各個(gè)數(shù)據(jù)點(diǎn)在U上的投影距離的方差最大。而XTu就是投影的距離。故我們要求下式的最大值:1
3、mi=1m(x(i)Tu)2=uT(1mi=1mx(i)x(i)T)u按照u是單位向量來(lái)最大化上式,就是求1mi=1mx(i)x(i)T的特征向量。而此式是數(shù)據(jù)集的協(xié)方差矩陣。在實(shí)際應(yīng)用中,我們不止面臨二維的數(shù)據(jù)。因此不能使用幾何的形式呈現(xiàn),但原理也是一樣。就是找到一組相互正交的單位向量uk,然后根據(jù)貢獻(xiàn)率考慮選擇其中的部分作為考量的維數(shù),這也就實(shí)現(xiàn)了數(shù)據(jù)的降維。三、實(shí)驗(yàn)步驟1、將庫(kù)里的400張照片分成兩組。一組作為訓(xùn)練,一組作為庫(kù)。每個(gè)人的前五張照片作為 訓(xùn)練,后五張作為庫(kù)。訓(xùn)練的照片按照順序的數(shù)字重命名。庫(kù)的照片名字不變。2、庫(kù)照片處理。 將每一張庫(kù)的照片轉(zhuǎn)化成 N維的向量。(庫(kù)里的照片是
4、112*92,故將轉(zhuǎn)化成的矩陣按列或行展開(kāi),就是個(gè)10304維的向量)我們稍后要對(duì)如此多維的向量用PCA進(jìn)行降維。然后把這些向量存入一個(gè)矩陣?yán)铩6沂菍⑦@200個(gè)向量以列的形式存在了矩陣?yán)?。即z= ri23, r 4r 200 將這200個(gè)向量的每個(gè)元素相加起來(lái)求出平均值。再用Z里的每一個(gè)向量減去這個(gè)平均值得到每個(gè)的偏差。平均值r =1200k=1200 rk每個(gè)向量的偏差?k= rk- r即最后Z= ? 1 , ?2, ?3, ?4 ?200 接下來(lái)我們就要針對(duì)這些預(yù)處理后的數(shù)據(jù)進(jìn)行降維。我們要求的N個(gè)相互正交的向量就是協(xié)方差矩陣ZZT的特征向量,而對(duì)應(yīng)的特征值就是各個(gè)向量所占的比重。但是Z
5、是個(gè)10304*200的矩陣,那么 ZZT就是個(gè)10304*10304的矩陣。使用 matlab直接求其特征值與 特征向量不太實(shí)際。所以我們考慮一個(gè)簡(jiǎn)單的運(yùn)算方法:協(xié)方差矩陣的秩受到訓(xùn)練圖像的限制:如果有N個(gè)訓(xùn)練樣本,則最多有N-1個(gè)對(duì)應(yīng)非零特 征值的特征向量,其他的特征向量對(duì)應(yīng)的特征值都是0。如果訓(xùn)練樣本的數(shù)目比圖像的維數(shù)低,則可以通過(guò)如下方法簡(jiǎn)化主成份的計(jì)算。-設(shè)Z是預(yù)處理圖像的矩陣,每一列對(duì)應(yīng)一個(gè)減去均值圖像之后的圖像。則,協(xié)方差矩陣為S=TTT,并且對(duì)S的特征值分解為Sv i=TTT v i=入 i vi然而,TTT是一個(gè)非常大的矩陣。因此,如果轉(zhuǎn)而使用如下的特征值分解。TTTui二入
6、 iui此時(shí),我們發(fā)現(xiàn)如果在等式兩邊乘以T,可得到TTTTui=入 iTui這就意味著,如果 Ui是TtT的一個(gè)特征向量,則 V i=Tui是S的一個(gè)特征向量。 我們的庫(kù)里 有200張112 * 92像素的圖像,則 TtT是一個(gè)200*200的矩陣,這就比原先的 10304 * 10304 的協(xié)方差矩陣要容易處理許多。需要注意的是,上面的特征向量V沒(méi)有進(jìn)行歸一化,如果需要,應(yīng)該在后面在進(jìn)行處理。 降維處理。上面的步驟已經(jīng)求到了所有的特征向量與特征值。而特征值就是各數(shù)據(jù)點(diǎn)在該特征向量上的方差。 跟據(jù)PCA,我們要選岀占主要比重的特征向量即可,而判定標(biāo)準(zhǔn)就是特征值。先把方差(特征值)降序排列,并把
7、對(duì)應(yīng)的特征向量也排列好。依次選擇方差,使選出的方 差和占所有方差和大約 95%左右。然后選擇對(duì)應(yīng)的特征向量。其余的特征向量與特征值可以拋 棄不用了。這就完成了降維。(中一共有200個(gè)不為零的方差(特征值) 歸一化處理。數(shù)據(jù)歸一化處理是數(shù)據(jù)挖掘的一項(xiàng)基礎(chǔ)工作,不同評(píng)價(jià)指標(biāo)往往具有不同的量綱和量綱單位,這樣的情況會(huì)影響到數(shù)據(jù)分析的結(jié)果, 為了消除指標(biāo)之間的量綱影響, 需要進(jìn)行 數(shù)據(jù)標(biāo)準(zhǔn)化處理,以解決數(shù)據(jù)指標(biāo)之間的可比性。 原始數(shù)據(jù)經(jīng)過(guò)數(shù)據(jù)標(biāo)準(zhǔn)化處理后, 各指標(biāo)處于 同一數(shù)量級(jí),適合進(jìn)行綜合對(duì)比評(píng)價(jià)。我使用的是Z-score法。經(jīng)過(guò)處理得數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,轉(zhuǎn)化函數(shù)為x*=
8、x-其中卩為所有數(shù)據(jù)的均值,b為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。在里求得的特征值就是方差。所以我們要用1入k乘上每一個(gè)對(duì)應(yīng)的特征向量。本來(lái)這個(gè)歸一化處理應(yīng)該放在第一步的數(shù)據(jù)預(yù)處理那里。但由于那里的計(jì)算還沒(méi)有涉及到協(xié)方差矩陣,而我們需要的方差在后面才出現(xiàn),故把歸一化處理放在這里。即中,v i=1 入 iTui這些特征向量都是 10304*1的大小,跟我們一開(kāi)始處理后的照片向量的大小一樣。這些就 是特征臉。特征臉可以線性組合成所有庫(kù)里的臉。 用特征臉對(duì)庫(kù)里的臉進(jìn)行標(biāo)示,也就是將庫(kù)里的每張臉圖數(shù)據(jù)轉(zhuǎn)化成各個(gè)特征臉?biāo)嫉谋戎?。? k= v kT?i,i=1,2,3200,k=1,2,3n 是最后n岀的方差數(shù)量
9、Q iT= 3 1, 3 2, 3 3, 3 43 n 人臉識(shí)別。先對(duì)訓(xùn)練的臉圖進(jìn)行預(yù)處理。預(yù)處理即中所說(shuō)的求偏差。求到訓(xùn)練圖的 偏差向量后,如那樣用特征臉對(duì)訓(xùn)練圖進(jìn)行標(biāo)示。即求得Q *T= 3 1, 3 2, 3 3, 343然后求Q *T與Q iT的歐式距離,此距離表明兩圖的接近度。即& = Q *TQ iT2該距離越小,則這兩張圖越接近,則越有可能是同一個(gè)人。四、編程實(shí)現(xiàn)代碼:函數(shù):zz, y, tzl=circ(),對(duì)庫(kù)圖像的處理,并求出處理訓(xùn)練圖像需要的特征臉和數(shù)據(jù)平均值。function zz,y,till - circ*)航疋是經(jīng)過(guò)特征臉標(biāo)示的庫(kù)圖像胃y是庫(kù)圏像的教據(jù)平均
10、值y=zBros (92*112, 1);畔zeroH (畝*11盎 200):d=l;for i=l;40for j=6:10if i<10&ij<10t= J Q0J nu*2str (i) ' (T numiStr(j) bTnp1; a=uiLteadHt * ;a=dpuble*'a);y=y+a(:):2(:,(1)=3(:);歸旳;else if (i<10fc&j=10)t= r CO1 nu*2str (i) J 10. bmp':a=imread(t);3Fdouble (a):y=y+a(:):z (:; d)=a
11、"':);d=dH-l ;else if i>=lUAj<10t= O' num2 st r (i) j nun2st r (j ). bmp? J :aimreadQ'1 :a=double(a):y=y+a (:):z(:, d)=a(:) ;d=d+l;eLse if i>=lDtj=10t= ' j nunSstr (i J bmp'a=imread(t);a=doutil# (a):y=jrl-3(:); (ir 1) =u(;) ; d=d+l :?ndendendendend endy=y/200:軻是平均值hf
12、ar i= 1:210旳dEinz 3tz :rsiinvcc,'sin1 :殆盪用* simvcz是特征向重隼siAVal-ei£ (si*) ”(IE值辜sunval, lzid=SdtT siivalj ' des c end'),siJsvec'suvec' : ind' ;ETfc=O;for i=l:200 sunrs+simuaKi);-trtd脳u*蕪特證值的和d=0 r v*ig?Ll=0 ; smnl=0.while( weifht<0. 95)dd+1sum s lmval (d) +sum 1 ;TeiBl
13、=sujnl/sum:筈d為取的特征向1 weight為最終的比重endsimval=£iiLval (L : d, : i :sijnvaJ= sinvl. (0. 5);simvec=sinvec(:j l:dl ;til=;*sijii7ec*(kag (siAvali :*lzlzz=z:J ;函數(shù):ws=ld(zz,y,tzl)這三個(gè)自變量都是上面的函數(shù)的輸出變量。Ws是200張訓(xùn)練人臉識(shí)別的正確性。if yus hu= 0if zhengshu>8 g1=zhengshn.elseg l=-hengshu;endfttn亡tion itfs = Id ( Z2? y
14、j t zl J舄網(wǎng)藥HO張訓(xùn)練人臉識(shí)別的正確率if zhengshu>8ct=0 :irs-0.gl=zherLgshu+l ;for k=l;2QQelseks= niniZstr (k) ' . bnp :f lzhengshu+l ;ss-imreads):亡ndWijiishov(5S):end55=d.ouble * ssi :ky=mod(l£j 5):ss=ss(:)-y:(k-ky)/5;SS=3SJ *t zl :if ky=0SS=SSJ :覺(jué)特征臉標(biāo)示完畢£2=ki:硏皓識(shí)別elseOSJ=:g2=lE2+l :far 1=1:200e
15、ndosj= Io5jf non(HB-zz(;ti)>2):if gl=g2en.dct=ct+::xnujiij 耐 dd =min1 cs j1 :end5ni£h.u-mo d1 madd3 5).ws=ct/200;zhengsliu1 anadd-yushu) /5:end運(yùn)行結(jié)果:» xjYj z>circ();» vldfxj y, z)vs =0. 9150200張訓(xùn)練圖片的識(shí)別率為91.5%加了顯示代碼后顯示的圖片結(jié)果:j r .口 I 回 £3 Q Figure 1Fil Ed Vie Ime Toe Dekl Wind Hel E M d%企注氏* M五、實(shí)驗(yàn)總結(jié)收獲:這次實(shí)驗(yàn)讓我更加熟練地應(yīng)用了matlab。對(duì)矩陣的運(yùn)算也理解地更加的透徹。學(xué)習(xí)了PCA主成分分析法,這個(gè)方法在分析較多的數(shù)據(jù)時(shí)是非常有用的。在如今的大數(shù)據(jù)時(shí)代,PCA是個(gè)非常實(shí)用的分析手段。這次在做實(shí)驗(yàn)的過(guò)程中, 上網(wǎng)查閱了許多關(guān)于人臉識(shí)別的資料, 發(fā)覺(jué)雖然自己完成了初 步的人臉識(shí)別的功能,但遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到現(xiàn)實(shí)生活的需求。我們做實(shí)驗(yàn)的orl庫(kù)的像素不僅非常低,而且每張人臉的位置與大小也非常接近,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度倉(cāng)儲(chǔ)物流勞務(wù)派遣安全責(zé)任書
- 2025年度在線貸款中介居間合作協(xié)議
- 二零二五年度企業(yè)內(nèi)部員工外出安全免責(zé)合同
- 2025年度個(gè)人租房合同協(xié)議書模板(含租賃房屋維修費(fèi)用承擔(dān))
- 2025年度應(yīng)屆大學(xué)生實(shí)習(xí)合同
- 國(guó)際發(fā)展合作的中國(guó)實(shí)踐 第六期綠色發(fā)展援助篇
- 2025年度抖音網(wǎng)紅達(dá)人合作推廣合同模板
- 2025年度合作社土地入股與農(nóng)業(yè)資源環(huán)境監(jiān)測(cè)合作協(xié)議
- 2025年度房屋租賃合同租賃雙方租賃期間租賃物租賃權(quán)轉(zhuǎn)讓協(xié)議
- 沙石運(yùn)輸行業(yè)自律公約
- 《煉油化工基本知識(shí)》課件
- 關(guān)于高中語(yǔ)文教學(xué)中“微課”的運(yùn)用分析獲獎(jiǎng)科研報(bào)告論文
- 《射頻同軸電纜》課件2
- 口腔頜面部感染患者的營(yíng)養(yǎng)狀況及輔助營(yíng)養(yǎng)治療策略
- 以工代賑政策培訓(xùn)課件
- 垃圾分類校本教材
- 中職學(xué)生開(kāi)學(xué)心理知識(shí)講座
- 虛擬現(xiàn)實(shí)技術(shù)中的智能感知與識(shí)別技術(shù)應(yīng)用
- DD 2014-11 地面沉降干涉雷達(dá)數(shù)據(jù)處理技術(shù)規(guī)程
- 咖啡與茶文化培訓(xùn)1
- 一+《展示國(guó)家工程++了解工匠貢獻(xiàn)》(教學(xué)課件)-【中職專用】高二語(yǔ)文精講課堂(高教版2023·職業(yè)模塊)
評(píng)論
0/150
提交評(píng)論