版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
模式識(shí)別大作業(yè)--fisher線性判別和近鄰法學(xué)號(hào):021151**姓名:**任課教師:張**I.Fisher線性判別A.fisher線性判別簡(jiǎn)述在應(yīng)用統(tǒng)計(jì)方法解決模式識(shí)別的問(wèn)題時(shí),一再碰到的問(wèn)題之一是維數(shù)問(wèn)題.在低維空間里解析上或計(jì)算上行得通的方法,在高維里往往行不通.因此,降低維數(shù)就成為處理實(shí)際問(wèn)題的關(guān)鍵.我們考慮把維空間的樣本投影到一條直線上,形成一維空間,即把維數(shù)壓縮到一維.這樣,必須找一個(gè)最好的,易于區(qū)分的投影線.這個(gè)投影變換就是我們求解的解向量.B.fisher線性判別的降維和判別1.線性投影與Fisher準(zhǔn)那么函數(shù)各類在維特征空間里的樣本均值向量:,(1)通過(guò)變換映射到一維特征空間后,各類的平均值為:,(2)映射后,各類樣本“類內(nèi)離散度”定義為:,(3)顯然,我們希望在映射之后,兩類的平均值之間的距離越大越好,而各類的樣本類內(nèi)離散度越小越好。因此,定義Fisher準(zhǔn)那么函數(shù):(4)使最大的解就是最正確解向量,也就是Fisher的線性判別式。2.求解從的表達(dá)式可知,它并非的顯函數(shù),必須進(jìn)一步變換。:,,依次代入上兩式,有:,(5)所以:(6)其中:(7)是原維特征空間里的樣本類內(nèi)離散度矩陣,表示兩類均值向量之間的離散度大小,因此,越大越容易區(qū)分。將(4.5-6)和(4.5-2)代入(4.5-4)式中:(8)其中:,(9)因此:(10)顯然:(11)稱為原維特征空間里,樣本“類內(nèi)離散度”矩陣。是樣本“類內(nèi)總離散度”矩陣。為了便于分類,顯然越小越好,也就是越小越好。將上述的所有推導(dǎo)結(jié)果代入表達(dá)式:可以得到:其中,是一個(gè)比例因子,不影響的方向,可以刪除,從而得到最后解:(12)就使取得最大值,可使樣本由維空間向一維空間映射,其投影方向最好。是一個(gè)Fisher線性判斷式.這個(gè)向量指出了相對(duì)于Fisher準(zhǔn)那么函數(shù)最好的投影線方向。C.算法流程圖左圖為算法的流程設(shè)計(jì)圖。II.近鄰法近鄰法線簡(jiǎn)述K最近鄰(k-NearestNeighbor,KNN)分類算法,是一個(gè)理論上比擬成熟的方法,也是最簡(jiǎn)單的機(jī)器學(xué)習(xí)算法之一。該方法的思路是:如果一個(gè)樣本在特征空間中的k個(gè)最相似(即特征空間中最鄰近)的樣本中的大多數(shù)屬于某一個(gè)類別,那么該樣本也屬于這個(gè)類別。KNN算法中,所選擇的鄰居都是已經(jīng)正確分類的對(duì)象。該方法在定類決策上只依據(jù)最鄰近的一個(gè)或者幾個(gè)樣本的類別來(lái)決定待分樣本所屬的類別。KNN方法雖然從原理上也依賴于極限定理,但在類別決策時(shí),只與極少量的相鄰樣本有關(guān)。由于KNN方法主要靠周?chē)邢薜泥徑臉颖?,而不是靠判別類域的方法來(lái)確定所屬類別的,因此對(duì)于類域的交叉或重疊較多的待分樣本集來(lái)說(shuō),KNN方法較其他方法更為適合。將與測(cè)試樣本最近鄰樣本的類別作為決策的結(jié)果。對(duì)一個(gè)類別問(wèn)題,每類有個(gè)樣本,,那么第類的判別函數(shù)為:(1)因此,最近鄰決策規(guī)那么:假設(shè)(2)那么決策III.實(shí)驗(yàn)仿真實(shí)驗(yàn)設(shè)計(jì):實(shí)驗(yàn)內(nèi)容對(duì)以下數(shù)據(jù)進(jìn)行判別。在每一類里面隨機(jī)選一半作為訓(xùn)練樣本,另一半作為測(cè)試樣本。來(lái)判別屬于第一類的是否都正確,屬于第二類中是否都屬于第二類。文件名類別數(shù)維數(shù)樣本數(shù)Sonar.xls260208Wdbc.data230569用fisher判別法和對(duì)這兩組數(shù)據(jù)進(jìn)行判別。B.代碼設(shè)計(jì)1.fisher判別%%clc,clear;M=xlsread('E:\power\專業(yè)課程\大作業(yè)們\sonar.xls');%讀取數(shù)據(jù)sum1=0;sum2=0;foriii=1:10[aa,bb]=size(M);num1=1;num2=1;forn=1:aaifM(n,bb)==1Data1(num1,:)=(M(n,1:bb-1));num1=num1+1;elseData2(num2,:)=(M(n,1:bb-1));num2=num2+1;endendd1=Data1(randsample([1:num1-1],floor(num1/2)),:);d2=Data2(randsample([1:num2-1],floor(num2/2)),:);m1=mean(d1);m2=mean(d2);S1=zeros(bb-1,bb-1);forii=1:floor(num1/2)S1=S1+(d1(ii,:)-m1)'*(d1(ii,:)-m1);endS2=zeros(bb-1,bb-1);forii=1:floor(num2/2)S2=S2+(d2(ii,:)-m2)'*(d2(ii,:)-m2);endSw=S1+S2;w=inv(Sw)*(m1-m2)';forii=1:floor(num1/2)dd1(ii)=w'*d1(ii,:)';endforii=1:floor(num2/2)dd2(ii)=w'*d2(ii,:)';endmm1=mean(dd1')';mm2=mean(dd2')';yo=(mm1+mm2)/2;forii=1:208y=w'*M(ii,1:bb-1)';if(y>=yo)result(ii)=1;elseify<yoresult(ii)=2;%else%result(ii)=4;endenderr=M(:,61)-result';err1=err(1:num1-1);err2=err(num1:aa);ErrRate1=sum(abs(err1))/(num1-1);sum1=sum1+ErrRate1;ErrRate2=sum(abs(err2))/(num2-1);sum2=sum2+ErrRate2;endcorrectrate1=1-sum1/10correctrate2=1-sum2/10figure(1)holdonplot(dd1,'^');plot(dd2,'*')figure(2)holdonplot(d1,'^');plot(d2,'*')近鄰法%對(duì)wdbc數(shù)據(jù)求解clc;clear;M=csvread('E:\power\專業(yè)課程\大作業(yè)們\wdbc.csv');[aa,bb]=size(M);%求行數(shù)(aa),求列數(shù)(bb)sum1=0;sum2=0;foriii=1:10num1=1;num2=1;forn=1:aaifM(n,1)==1Data1(num1,:)=M(n,2:bb);%按行抽取數(shù)據(jù)num1=num1+1;elseData2(num2,:)=M(n,2:bb);%抽取數(shù)據(jù)num2=num2+1;endendvector1=randsample([1:num1-1],floor(num1/2));vector2=randsample([1:num2-1],floor(num2/2));d1=Data1(vector1,:);%取一半的數(shù)據(jù)d2=Data2(vector2,:);forii=1:aamin1=inf;%初始化min1為最小值forjj=1:floor(num1/2)x=norm(M(ii,2:bb)-d1(jj,:));if(x<min1)min1=x;endend%訓(xùn)練樣本和第一組樣本比擬min2=inf;forjj=1:floor(num2/2)x=norm(M(ii,2:bb)-d2(jj,:));if(x<min2)min2=x;endend%訓(xùn)練樣本和第二組樣本比擬%找出最短歐氏距離ifmin1<min2result(ii,1)=1;elseresult(ii,1)=2;endendcounter1=0;counter2=0;forii=1:aaifM(ii,1)-result(ii,1)==-1counter1=counter1+1;elseifM(ii,1)-result(ii,1)==1counter2=counter2+1;endendcorrectrate1=1-abs(counter1)/aa;%第一類錯(cuò)分到第二類(第一類被判別為第一類)correctrate2=1-counter2/aa;%第二類錯(cuò)分到第一類(第二類被判別為第二類)correctrate1sum1=correctrate1+sum1;sum2=correctrate2+sum2;endcorrectrate1=sum1/10correctrate2=sum2/10C.實(shí)驗(yàn)結(jié)果及分析1〕sonar數(shù)據(jù)fisher判別圖1,sonar數(shù)據(jù)的fisher判別識(shí)別率分析:隨機(jī)在第一類里面選取一半的數(shù)據(jù)作為訓(xùn)練樣本,然后與全部的數(shù)據(jù)進(jìn)行作差比擬,看剩下的原本屬于第一類的樣本是否也屬于第一類,假設(shè)測(cè)試樣本仍然屬于第一類,就計(jì)數(shù)得到正確率;假設(shè)不為第一類,那么計(jì)數(shù)得到錯(cuò)誤率。在sonar樣本中,用fisher判別得到的上組數(shù)據(jù)的識(shí)別率如上圖。識(shí)別率的上下意味著原本分類的正確程度。這就說(shuō)明原本這兩類數(shù)據(jù)的給出已經(jīng)分的較開(kāi)。圖2,sonar數(shù)據(jù)fisher判別的降維分類圖上圖是sonar六十維度的數(shù)據(jù)經(jīng)過(guò)降維得到的二維圖像,可以很明顯的看出,在第二類里面有一個(gè)‘*’被錯(cuò)分。而w*也可以清晰的看出他的大致范圍。我不太會(huì)把他們投影到一條一線上,像網(wǎng)上得到的那種圖,但是用這個(gè)圖也可以清晰的看出他的劃分程度。近鄰法圖3,sonar數(shù)據(jù)的近鄰法識(shí)別率分析:近鄰法同樣是在兩類里面選取一半的數(shù)據(jù)作為實(shí)驗(yàn)樣本,另一半作為測(cè)試樣本,過(guò)程是用測(cè)試的樣本與第一類里的實(shí)驗(yàn)樣本和第二類里的實(shí)驗(yàn)樣本分別做歐氏距離。假設(shè)用第一類的測(cè)試樣本中的一個(gè)數(shù)據(jù)做測(cè)試,假設(shè)與第一類中得到的歐式距離最近那么劃分為第一類,同時(shí)也證明了原來(lái)劃分是正確的;假設(shè)與第二類中的得到的歐式距離最近那么劃分為第二類,計(jì)數(shù)它為錯(cuò)誤的劃分。近鄰法得到的識(shí)別率比f(wàn)isher得到的識(shí)別率高,這也說(shuō)明了近鄰法比f(wàn)isher更優(yōu)。2.wdbc數(shù)據(jù)1〕fisher判別圖4,wdbc數(shù)據(jù)的fisher判別識(shí)別率Wdbc是30維度的數(shù)據(jù)測(cè)試結(jié)果如上圖。得到的識(shí)別率相對(duì)較高。圖
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025醫(yī)院市場(chǎng)部工作計(jì)劃模板
- 四年級(jí)學(xué)期的班主任工作計(jì)劃范文
- 2025學(xué)年第二學(xué)期六班班級(jí)工作計(jì)劃
- XX年安全保衛(wèi)年度工作計(jì)劃
- 2025年春季教學(xué)計(jì)劃表
- 2025小學(xué)圖書(shū)室工作計(jì)劃怎么寫(xiě)
- 公司網(wǎng)絡(luò)部2019年工作計(jì)劃范文
- 《大專生物化學(xué)酶》課件
- 圖書(shū)出版合同三方協(xié)議
- 天津勞務(wù)合同填寫(xiě)范本
- 2024年保密協(xié)議書(shū)(信息技術(shù)行業(yè))2篇
- 2024-2025學(xué)年高一【數(shù)學(xué)(人教A版)】函數(shù)的零點(diǎn)與方程的解-教學(xué)設(shè)計(jì)
- 【課件】程式與意蘊(yùn)-中國(guó)傳統(tǒng)繪畫(huà)+課件-2024-2025學(xué)年高中美術(shù)人美版(2019)美術(shù)鑒賞
- 社會(huì)學(xué)概論-終結(jié)性考核-國(guó)開(kāi)(SC)-參考資料
- 2022年全國(guó)應(yīng)急普法知識(shí)競(jìng)賽試題庫(kù)大全-上(單選題庫(kù)-共4部分-1)
- 四川省南充市2023-2024學(xué)年高一上學(xué)期期末考試 生物 含解析
- 2024年廠長(zhǎng)崗位聘用合同范本版B版
- 2024河北石家莊市辛集市大學(xué)生鄉(xiāng)村醫(yī)生專項(xiàng)計(jì)劃招聘5人筆試備考試題及答案解析
- 2023年護(hù)理人員分層培訓(xùn)、考核計(jì)劃表
- 汽車(chē)修理廠噴漆合作合同
- 24《古人談讀書(shū)》說(shuō)課稿-2024-2025學(xué)年統(tǒng)編版五年級(jí)語(yǔ)文上冊(cè)
評(píng)論
0/150
提交評(píng)論