(6)聚類分析例子_第1頁
(6)聚類分析例子_第2頁
(6)聚類分析例子_第3頁
(6)聚類分析例子_第4頁
(6)聚類分析例子_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、例題1:下表是我國16個(gè)地區(qū)農(nóng)民在1982年支出情況的抽樣調(diào)查數(shù)據(jù)的匯總資料,每個(gè)地區(qū)都調(diào)查了反映每人平均生活消費(fèi)支出情況的六個(gè)指標(biāo)。試?yán)谜{(diào)查資料對(duì)16個(gè)地區(qū)進(jìn)行分類。生活用品及其文化生活服務(wù)支地區(qū)食品衣著燃料住房他出北京190.3343.779.7360.5449.019.04天津135.236.410.4744.1636.493.94河北95.2122.839.322.4422.812.8山西104.7825.116.49.8918.173.25內(nèi)蒙古128.4127.638.9412.5823.993.27遼寧145.6832.8317.1927.2939.093.47吉林159.37

2、33.3818.3711.8125.295.52黑龍江116.2229.5713.2413.7621.756.04上海221.1138.6412.53115.6550.825.89江蘇144.9829.1211.6742.627.35.74浙江169.9232.7512.7247.1234.355安徽153.1123.0915.6223.5418.186.39福建144.9221.2616.9619.5221.756.73江西140.5121.517.6419.1915.974.94山東115.8430.2612.233.6133.773.85河南101.1823.268.4620.220.5

3、4.3下面用統(tǒng)計(jì)學(xué)軟件SAS(StatisticalAnalysisSystem)datadfdf;inputcity$x1x2x3x4x5x6;cards;beijing190.3343.779.7360.5449.019.04tianjing135.2036.4010.4744.1636.493.94hebei95.2122.839.3022.4422.812.80shanxi104.7825.116.409.8918.173.25neimenggu128.4127.638.9412.5823.993.27liaoning145.6832.8317.1927.2939.093.47jili

4、n159.3733.3818.3711.8125.295.22heilongjiang116.2229.5713.2413.7621.756.04shanghai221.1138.6412.53115.6550.825.89jiangsu144.9829.1211.6742.6027.305.74zhejiang169.9232.7512.7247.1234.355.00anhui1531123.0915.6223.5418.186.39fujian144.9221.2616.9619.5221.756.73jiangxi140.5421.5017.6419.1915.974.94shando

5、ng115.8430.2612.2033.6133.773.85henan101.1823.268.4620.2020.504.30;run;procclusterdata=dfdfstdouttree=treemethod=avepesudorsq;idcity;run;/*ward離差平方和法war;類平均法ave;重心法cen;最長距離法com;中間距離法med;最短距離法sin;密度估計(jì)法den;極大似然法eml;可變類平均fle;相似分析法mcq;兩階段密度估計(jì)two;*/proctreedata=treeout=newgraphicshorizontal;idcity;run;Cl

6、usterHistoryNormRMSNCLClustersJoined-FREQSPRSQRSQPSFPST2Dist15anhuifujian20.00250.99828.70.19314hebeihenan20.00550.99219.10.286913CL14shanxi30.00680.98516.71.20.311612CL15jiangxi30.00990.97514.440.348111jiangsuzhejiang20.00890.96614.40.36610CL13neimengg40.01060.95614.41.70.36929tianjingshandong20.00

7、920.94715.50.37118CL9CL1140.02370.92313.72.60.49577liaoningjilin20.01890.90414.10.53296heilongjCL1240.02670.87714.34.30.54635CL8CL760.05280.82412.93.50.66814CL5CL6100.12690.6989.26.60.78233CL4CL10140.19550.5026.67.80.87512beijingshanghai20.05620.44611.30.91841CL2CL3160.4458011.31.5454city(l)R2統(tǒng)計(jì)量(列標(biāo)

8、題為RSQ)用于評(píng)價(jià)每次合并成NCL個(gè)類時(shí)的聚類效果?,F(xiàn)考察R2的值隨NCL的變化。比如,在分為四個(gè)類之前(NCL4)的并類過程中R2的減少是逐漸的,改變不大;當(dāng)分為四個(gè)類時(shí)的R2二0.697,而下一次合并后分為三個(gè)類時(shí)R2下降較多43(R2二0.502),由此可以通過對(duì)R2統(tǒng)計(jì)量的變化分析可得出分為四個(gè)3類是較合適的。(2)半偏R2(列標(biāo)題為SPRSQ)得到。根據(jù)半偏R2的值是上一步NCLNCL驟R2與該步驟R2的差值,故某步驟的半偏R2值越大,說明上一NCL+1NCLNCL步驟合并的效果越好,此例半偏R2最大和次大分別為NCL二1,3和4,NCL說明根據(jù)半偏R2準(zhǔn)則分為兩個(gè)類,四個(gè)類和五個(gè)

9、類是較合適的。(3)偽f統(tǒng)計(jì)量(列標(biāo)題為PSF)用于評(píng)價(jià)分為NCL個(gè)類的聚類效果。偽F值越大表示這些觀測(cè)樣品可以顯著地分為NCL個(gè)類。此例NCL中偽F最大和次大分別為NCL=5和2(當(dāng)NC6),說明根據(jù)偽f準(zhǔn)NCL則分為五個(gè)類或兩個(gè)類較合適的。(4)偽t2統(tǒng)計(jì)量(列標(biāo)題為PST2)用以評(píng)價(jià)此步驟合并的效果。由該統(tǒng)計(jì)量的定義知,偽12大表明上一次合并的兩個(gè)類是很分開的,也就是上依次聚類的效果是好的。此例子中12最大和次大分別為NCL=1,3和4,說明根據(jù)偽12準(zhǔn)則分為兩個(gè)類,四個(gè)類和五個(gè)類是較合適的。綜合分析,認(rèn)為采用類平均法分類,將16個(gè)地區(qū)分為兩個(gè)類或五個(gè)類較合適。分為五個(gè)類的結(jié)果為:北京,

10、上海,天津、山東、江蘇、浙江、遼寧、吉林,黑龍江、安徽、福建、江西,河北、河南、山西、內(nèi)蒙;若分為兩類,北京,上海,天津、山東、江蘇、浙江、遼寧、吉林,黑龍江、安徽、福建、江西,河北、河南、山西、內(nèi)蒙。類別第一類第二類第三類第四類第五類該類所包含的區(qū)域河北河南山西內(nèi)蒙黑龍江安徽福建江西天津山東江蘇浙江遼寧吉林北京上海食品平均消費(fèi)107.395138.698145.165190.33221.11衣著平均24.70823.85532.45743.7738.64消費(fèi)燃料平均消費(fèi)8.27515.86513.8709.7312.53住房平均消費(fèi)16.27819.00034.43160.54115.65生

11、活用品以及其他平均消費(fèi)21.36819.41332.71549.0150.82文化生活服務(wù)支出平均消費(fèi)3.4056.0254.5379.045.89例題2:對(duì)305名女中學(xué)生測(cè)量八個(gè)體型指標(biāo):xxxx1:身高5:體重x2:手臂長x6:頸圍xxxx3上肢長7:胸圍4:下肢長8:胸寬相關(guān)矩陣如下表。我們用相關(guān)系數(shù)來度量各對(duì)變量之間的相似性。相應(yīng)于最長距離法,類與類之間的相似系數(shù)定義為兩類變量間的最小相關(guān)系數(shù),每次聚類時(shí)合并兩個(gè)相似系數(shù)最大的類。xxxxxxxxx1.000 x20.8461.000 x30.8050.8811.000 x40.8590.8260.8011.000 x50.4730.3760.3800.4361.000 x60.3980.3260.3190.3290.7621.000 x70.3010.2770.2370.3270.7300.5831.000 x80.3820.4150.3450.3650.6290.5770.5391.000/*用變量聚類過程varclus對(duì)變量進(jìn)行分類*/datajlfx(type=corr);inputidx1x2x3x4x5x6x7x8;_type_=corr;cards;11.0002084610003080508811000408590826080110005047303760380043610

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論