K-L變換進(jìn)行特征提取_第1頁
K-L變換進(jìn)行特征提取_第2頁
K-L變換進(jìn)行特征提取_第3頁
K-L變換進(jìn)行特征提取_第4頁
K-L變換進(jìn)行特征提取_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 利用K-L變換進(jìn)行特征提取的實(shí)驗(yàn)一、 基本要求用FAMALE.TXT和MALE.TXT的數(shù)據(jù)作為本次實(shí)驗(yàn)使用的樣本集,利用K-L變換對(duì)該樣本集進(jìn)行變換,與過去用Fisher線性判別方法或其它方法得到的分類面進(jìn)行比較,從而加深對(duì)所學(xué)內(nèi)容的理解和感性認(rèn)識(shí)。二、 具體做法1. 不考慮類別信息對(duì)整個(gè)樣本集進(jìn)行K-L變換(即PCA),并將計(jì)算出的新特征方向表示在二維平面上,考察投影到特征值最大的方向后男女樣本的分布情況并用該主成分進(jìn)行分類2. 利用類平均向量提取判別信息,選取最好的投影方向,考察投影后樣本的分布情況并用該投影方向進(jìn)行分類。3. 將上述投影和分類情況與以前做的各種分類情況比較,考察各自的

2、特點(diǎn)和相互關(guān)系。三、 實(shí)驗(yàn)原理 K-L變換是一種基于目標(biāo)統(tǒng)計(jì)特性的最佳正交變換。它具有一些優(yōu)良的性質(zhì):即變換后產(chǎn)生的新的分量正交或者不相關(guān);以部分新的分量表示原矢量均方誤差最??;變換后的矢量更趨確定,能量更集中。這一方法的目的是尋找任意統(tǒng)計(jì)分布的數(shù)據(jù)集合之主要分量的子集。設(shè)n維矢量,其均值矢量,協(xié)方差陣,此協(xié)方差陣為對(duì)稱正定陣,則經(jīng)過正交分解克表示為,其中,為對(duì)應(yīng)特征值的特征向量組成的變換陣,且滿足。變換陣為旋轉(zhuǎn)矩陣,再此變換陣下變換為,在新的正交基空間中,相應(yīng)的協(xié)方差陣。通過略去對(duì)應(yīng)于若干較小特征值的特征向量來給y降維然后進(jìn)行處理。通常情況下特征值幅度差別很大,忽略一些較小的值并不會(huì)引起大的

3、誤差。1.不考慮類別信息對(duì)整個(gè)樣本集進(jìn)行K-L變換(即PCA)(1)讀入female.txt 和male.txt 兩組數(shù)據(jù),組成一個(gè)樣本集。計(jì)算樣本均值向量和協(xié)方差(2)計(jì)算協(xié)方差陣C的特征值和特征向量U(3)選取特征值最大的特征向量作為投影方向(4)選取閾值進(jìn)行判斷2.利用類平均信息提取判別信息(1)讀入female.txt 和male.txt 兩組數(shù)據(jù),分別計(jì)算樣本均值向量和協(xié)方差,及總均值向量(2)計(jì)算類間離散度矩陣Sb ()與類內(nèi)離散度矩陣Sw()(3)用比較分類性能,選擇最佳投影方向(4)選取閾值進(jìn)行判斷四、 實(shí)驗(yàn)結(jié)果與分析1.不考慮類別信息對(duì)整個(gè)樣本集進(jìn)行K-L變換(即PCA)U=

4、(0.6269,0.7791)T ,P1=0.5, P2=0.5判錯(cuò)個(gè)數(shù)錯(cuò)誤率采用K-L變換判別方法1414%采用Fisher線性判別方法1212%2.利用類平均信息提取判決信息U=(0.5818,0.8133)T,P1=0.5, P2=0.5判錯(cuò)個(gè)數(shù)錯(cuò)誤率采用K-L變換判別方法1313%采用Fisher線性判別方法1212%五、 心得體會(huì)%不考慮類別信息clc;clear all;FH FW=textread(C:UsersrengangDesktophomeworkFEMALE.txt,%f %f);MH MW=textread(C:UsersrengangDesktophomeworkM

5、ALE.txt,%f %f);FA=FH FW;FA=FA;MA=MH MW;MA=MA;for k=1:50 NT(:,k)=FA(:,k);end for k=51:100 NT(:,k)=MA(:,k-50); end X=(sum(NT)/length(NT);%這里NT是一個(gè)100*2的矩陣,X為總樣本均值。c=cov(NT);u,v=eig(c);%求矩陣c的全部特征值,構(gòu)成對(duì)角陣v,并求c的特征向量構(gòu)成u的列向量。a,b=max(v);c,d=max(a); U=u(:,d) x=U*X; errorg=0; errorb=0;for k=1:100 TT(:,k)=U*NT(:,k); if kx errorg=errorg + 1; end else if TT(:,k)u(:,2)*Sb*u(:,2)/v(2,2) u=u(:,1);else u=u(:,2);endfor k=1:50 TF(:,k)=u*FA(:,k); TM(:,k)=u*MA(:,k);end w=(sum(TF)+sum(TM)/100;errorg=0;errorb=0;for k=1:50 if TF(:,k)w errorg=erro

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論