




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上§8.利用Matlab和SPSS軟件實(shí)現(xiàn)聚類分析1. 用Matlab編程實(shí)現(xiàn)運(yùn)用Matlab中的一些基本矩陣計(jì)算方法,通過(guò)自己編程實(shí)現(xiàn)聚類算法,在此只討論根據(jù)最短距離規(guī)則聚類的方法。調(diào)用函數(shù):min1.m求矩陣最小值,返回最小值所在行和列以及值的大小min2.m比較兩數(shù)大小,返回較小值std1.m用極差標(biāo)準(zhǔn)化法標(biāo)準(zhǔn)化矩陣ds1.m用絕對(duì)值距離法求距離矩陣cluster.m應(yīng)用最短距離聚類法進(jìn)行聚類分析print1.m調(diào)用各子函數(shù),顯示聚類結(jié)果聚類分析算法假設(shè)距離矩陣為vector, a階,矩陣中最大值為max,令矩陣上三角元素等于max聚類次數(shù)=a-1,以下
2、步驟作a-1次循環(huán):求改變后矩陣的階數(shù),計(jì)作c求矩陣最小值,返回最小值所在行e和列f以及值的大小gfor l=1:c,為vector(c+1,l)賦值,產(chǎn)生新類令第c+1列元素,第e行和第f行所有元素為,第e列和第f列所有元素為max源程序如下:%std1.m,用極差標(biāo)準(zhǔn)化法標(biāo)準(zhǔn)化矩陣function std=std1(vector)max=max(vector); %對(duì)列求最大值min=min(vector);a,b=size(vector); %矩陣大小,a為行數(shù),b為列數(shù)for i=1:a for j=1:b std(i,j)= (vector(i,j)-min(j)/(max(j)-m
3、in(j); endend%ds1.m,用絕對(duì)值法求距離function d=ds1(vector);a,b=size(vector); d=zeros(a);for i=1:a for j=1:a for k=1:b d(i,j)=d(i,j)+abs(vector(i,k)-vector(j,k); end endendfprintf('絕對(duì)值距離矩陣如下:n');disp(d)%min1.m,求矩陣中最小值,并返回行列數(shù)及其值function v1,v2,v3=min1(vector);%v1為行數(shù),v2為列數(shù),v3為其值v,v2=min(min(vector')
4、;v,v1=min(min(vector);v3=min(min(vector);%min2.m,比較兩數(shù)大小,返回較小的值function v1=min(v2,v3);if v2>v3 v1=v3;else v1=v2;end%cluster.m,最短距離聚類法function result=cluster(vector);a,b=size(vector);max=max(max(vector); for i=1:a for j=i:b vector(i,j)=max; end end;for k=1:(b-1) c,d=size(vector); fprintf('第%g次聚
5、類:n',k); e,f,g=min1(vector); fprintf('最小值=%g,將第%g區(qū)和第%g區(qū)并為一類,記作G%gnn',g,e,f,c+1); for l=1:c if l<=min2(e,f) vector(c+1,l)=min2(vector(e,l),vector(f,l); else vector(c+1,l)=min2(vector(l,e),vector(l,f); end end; vector(1:c+1,c+1)=max; vector(1:c+1,e)=max; vector(1:c+1,f)=max; vector(e,1:
6、c+1)=max; vector(f,1:c+1)=max; end%print1,調(diào)用各子函數(shù)function print=print1(filename,a,b); %a為地區(qū)個(gè)數(shù),b為指標(biāo)數(shù)fid=fopen(filename,'r')vector=fscanf(fid,'%g',a b);fprintf('標(biāo)準(zhǔn)化結(jié)果如下:n')v1=std1(vector)v2=ds1(v1);cluster(v2);%輸出結(jié)果print1('fname',9,7)2.直接調(diào)用Matlab函數(shù)實(shí)現(xiàn)2.1調(diào)用函數(shù)層次聚類法(Hierarch
7、ical Clustering)的計(jì)算步驟:計(jì)算n個(gè)樣本兩兩間的距離dij,記D構(gòu)造n個(gè)類,每個(gè)類只包含一個(gè)樣本;合并距離最近的兩類為一新類;計(jì)算新類與當(dāng)前各類的距離;若類的個(gè)數(shù)等于1,轉(zhuǎn)到5);否則回3);畫聚類圖;決定類的個(gè)數(shù)和類;Matlab軟件對(duì)系統(tǒng)聚類法的實(shí)現(xiàn)(調(diào)用函數(shù)說(shuō)明):cluster 從連接輸出(linkage)中創(chuàng)建聚類clusterdata 從數(shù)據(jù)集合(x)中創(chuàng)建聚類dendrogram 畫系統(tǒng)樹狀圖linkage 連接數(shù)據(jù)集中的目標(biāo)為二元群的層次樹pdist 計(jì)算數(shù)據(jù)集合中兩兩元素間的距離(向量)squareform 將距離的輸出向量形式定格為矩陣形式zscore 對(duì)數(shù)
8、據(jù)矩陣 X 進(jìn)行標(biāo)準(zhǔn)化處理 各種命令解釋 T = clusterdata(X, cutoff)其中X為數(shù)據(jù)矩陣,cutoff是創(chuàng)建聚類的臨界值。即表示欲分成幾類。以上語(yǔ)句等價(jià)與以下幾句命令: Y=pdist(X,euclid) Z=linkage(Y,single) T=cluster(Z,cutoff)以上三組命令調(diào)用靈活,可以自由選擇組合方法! T = cluster(Z, cutoff)從逐級(jí)聚類樹中構(gòu)造聚類,其中Z是由語(yǔ)句likage產(chǎn)生的(n-1)×3階矩陣,cutoff是創(chuàng)建聚類的臨界值。 Z = linkage(Y) Z = linkage(Y, 'method
9、') 創(chuàng)建逐級(jí)聚類樹,其中Y是由語(yǔ)句pdist產(chǎn)生的n(n-1)/2 階向量,method表示用何方法,默認(rèn)值是歐氏距離(single)。有complete最長(zhǎng)距離法;average類平均距離;centroid重心法 ;ward遞增平方和等。 Y = pdist(X) Y = pdist(X, 'metric') 計(jì)算數(shù)據(jù)集X中兩兩元素間的距離, metric表示使用特定的方法,有歐氏距離euclid 、標(biāo)準(zhǔn)歐氏距離SEuclid 、馬氏距離mahal、明可夫斯基距離Minkowski 等。 H = dendrogram(Z) H = dendrogram(Z, p)由
10、likage產(chǎn)生的數(shù)據(jù)矩陣z畫聚類樹狀圖。P是結(jié)點(diǎn)數(shù),默認(rèn)值是30。2.2舉例說(shuō)明設(shè)某地區(qū)有八個(gè)觀測(cè)點(diǎn)的數(shù)據(jù),樣本距離矩陣如表1所示,根據(jù)最短距離法聚類分析。%最短距離法系統(tǒng)聚類分析X=7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.29; 7.68 50.37 11.35 13.3 19.25 14.59 2.75 14.87; 9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.76; 9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.35; 10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.81;BX=zscore(X); % 標(biāo)準(zhǔn)化數(shù)據(jù)矩陣Y=pdist(X) % 用歐氏距離計(jì)算兩兩之間
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 如何提升農(nóng)業(yè)電商用戶體驗(yàn)試題及答案
- 生鮮供應(yīng)鏈中的農(nóng)產(chǎn)品冷鏈物流損耗控制與物流技術(shù)創(chuàng)新研究報(bào)告
- 環(huán)境友好型材料在新能源汽車中的運(yùn)用試題及答案
- 2025南航招聘面試問(wèn)題及答案
- 2025民航招飛面試常見(jiàn)問(wèn)題及答案
- 2025量化分析師面試試題及答案
- 新媒體在農(nóng)業(yè)電商中的應(yīng)用研究試題及答案
- 報(bào)考必看土木工程師考試試題及答案
- 農(nóng)業(yè)廢棄物資源化利用與循環(huán)經(jīng)濟(jì)發(fā)展報(bào)告
- 幼兒園數(shù)學(xué)趣味運(yùn)算試題及答案
- 環(huán)境藝術(shù)設(shè)計(jì)職業(yè)生涯規(guī)劃書
- 2025年java開發(fā)面試題及答案
- (完整版)公司的代賬協(xié)議模板合同7篇
- 2《建筑機(jī)械使用安全技術(shù)規(guī)程》JGJ33-2012
- GB/T 4745-2012紡織品防水性能的檢測(cè)和評(píng)價(jià)沾水法
- GB/T 17791-1999空調(diào)與制冷用無(wú)縫銅管
- 項(xiàng)目部施工安全風(fēng)險(xiǎn)源識(shí)別清單
- 泥水平衡頂管施工方案(專家論證)
- 鐵路運(yùn)輸調(diào)度指揮與統(tǒng)計(jì)分析
- 漏纜安裝施工作業(yè)指導(dǎo)書資料
- 《大學(xué)物理》說(shuō)課課件
評(píng)論
0/150
提交評(píng)論