聚類分析-陳倩文20143212577_第1頁
聚類分析-陳倩文20143212577_第2頁
聚類分析-陳倩文20143212577_第3頁
聚類分析-陳倩文20143212577_第4頁
聚類分析-陳倩文20143212577_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

聚類分析

————以2008年東部和南部沿海省、市農(nóng)村居民家庭年均生活消費(fèi)支出為例2一、分析背景為研究我國東部及南部沿海11個(gè)省、市2008年農(nóng)村居民消費(fèi)支出的區(qū)域性特征,根據(jù)當(dāng)年農(nóng)村居民家庭人均生活消費(fèi)支出為例進(jìn)行聚類分析。2/3/2023地區(qū)x1x2x3x4x5x6x7x8上海7108.621520.611646.191182.24755.293373.192874.54937.21廣東5866.91975.061748.16947.54836.392623.081936.38594.45浙江5522.561546.461333.69713.31933.112392.632195.58520.95江蘇4544.641166.911042.10813.45794.631357.961799.75458.10福建5078.851105.311300.10722.17540.631777.061453.18523.83海南4226.90491.841106.39565.51536.401303.50930.87247.08廣西4082.99772.28891.33603.84529.361376.031081.54290.04山東3699.421394.111247.04806.35799.791410.451277.43372.01遼寧4378.141187.411270.95507.40913.131295.701145.46533.29河北3155.401137.221097.41574.84808.881062.31946.38304.28天津5005.091153.661528.28817.181220.921567.871608.97520.492008年東部及南部沿海11個(gè)省、市農(nóng)村居民家庭人均生活消費(fèi)支出2/3/2023x1:人均食品支出(元/人)x2:人均衣著支出(元/人)x3:人均住房支出(元/人)x4:人均家庭設(shè)備及服務(wù)支出(元/人)x5:人均交通和通信支出(元/人)x6:人均文教娛樂用品及服務(wù)支出(元/人)x7:人均醫(yī)療保健支出(元/人)x8:其他商品及服務(wù)支出(元/人)二、分析方法2/3/2023系統(tǒng)聚類法——Q型聚類(對樣本進(jìn)行分類)三、結(jié)果解釋

結(jié)果輸出中首先給出案例處理匯總表格,本例中數(shù)據(jù)沒有缺失值,因此該表格主要提供的信息是距離測量指標(biāo)為平方歐氏距離,聚類方法為組間平均聯(lián)接。(一)近似矩陣和聚類表

(一)近似矩陣和聚類表

聚類表給出了聚類分析的詳細(xì)步驟,“群集組合”列給出了在某一步驟中哪些對象會參與合并,從圖中可以看出,第一步是6和7合并,第二步是4和8合并,第三步是9和10合并,第四步4和8所在類別又合并了5,以此類推。直到所有樣本全部被合并為一類。

“系數(shù)列”給出了每一聚類步驟的聚類系數(shù),該數(shù)值表示被合并的兩個(gè)類別之間的距離大小,本例主要指的是按照組間平均聯(lián)接法計(jì)算出的兩類間平均平方歐氏距離?!笆状纬霈F(xiàn)階群集”列表示參與合并的對象最早在第幾步出現(xiàn),0代表該對象是第一次出現(xiàn)在聚類過程中?!跋乱浑A”表示在這一步驟中合并的類別,下一次將在第幾步中與其他類再進(jìn)行合并。

近似矩陣計(jì)算的是兩類間的平方歐氏距離,通過圖表看出,6和7之間的平方歐氏距離最小為1.670,所以6和7最先被歸為一類。(二)冰柱圖

冰柱圖橫軸表示的是待分類的案例,豎軸表示的是群集數(shù),也就是樣本可以劃分的類別。(三)樹狀圖

圖左側(cè)列出進(jìn)行聚類的對象或事物,對象或者類別的合并則通過線條連接的方式來表示。在圖中可看到樣本1(上海)首先被單獨(dú)區(qū)分開來,并且和其他樣本的類別差異較大。從10向下切可以將樣本分為三類。樣本6、7、9、10、4、8、5為一類,樣本3、11、2為一類,樣本1單獨(dú)為一類。(四)群集成員表群集成員表表示在將樣本分別歸集為三、四、五類的分類情況。四、結(jié)論

通過對2008年我國東部及南部沿海11個(gè)省、市農(nóng)村年均生活消費(fèi)支出情況進(jìn)行聚類分析,我們大致可以將這11個(gè)城市分為4類:第一類,上海。上海市人均生活消費(fèi)支出從總體來看都是最高的,所以單獨(dú)分為一類。第二類,廣東、浙江、天津。這三個(gè)省市屬于沿海經(jīng)濟(jì)發(fā)達(dá)省市,生活水平和居民消費(fèi)水平高,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論