多元統(tǒng)計(jì)關(guān)于社會(huì)經(jīng)濟(jì)案例的聚類分析_第1頁(yè)
多元統(tǒng)計(jì)關(guān)于社會(huì)經(jīng)濟(jì)案例的聚類分析_第2頁(yè)
多元統(tǒng)計(jì)關(guān)于社會(huì)經(jīng)濟(jì)案例的聚類分析_第3頁(yè)
多元統(tǒng)計(jì)關(guān)于社會(huì)經(jīng)濟(jì)案例的聚類分析_第4頁(yè)
多元統(tǒng)計(jì)關(guān)于社會(huì)經(jīng)濟(jì)案例的聚類分析_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

大連民族學(xué)院數(shù)學(xué)實(shí)驗(yàn)報(bào)告課程:多元統(tǒng)計(jì)分析實(shí)驗(yàn)題目:關(guān)于社會(huì)經(jīng)濟(jì)案例的聚類分析系別:理學(xué)院專業(yè):信息與計(jì)算科學(xué)姓名:歷紅影班級(jí):信息102班指導(dǎo)教師:滕穎俏完成學(xué)期:2013年4月26日實(shí)驗(yàn)?zāi)康模?.通過本次上機(jī),掌握利用SPSS進(jìn)行聚類分析;2.加深對(duì)聚類分析的理解,學(xué)會(huì)用聚類分析解決現(xiàn)實(shí)生活中的問題;3.學(xué)會(huì)利用最長(zhǎng)距離法等多種方法進(jìn)行聚類分析并對(duì)其進(jìn)行比較。實(shí)驗(yàn)內(nèi)容:(問題、數(shù)學(xué)模型、要求、關(guān)鍵詞)城鎮(zhèn)居民消費(fèi)水平通常用表1中的八項(xiàng)指標(biāo)來描述,八項(xiàng)指標(biāo)間存在一定的線性相關(guān)。為研究城鎮(zhèn)居民的消費(fèi)結(jié)構(gòu),需將相關(guān)性強(qiáng)的指標(biāo)歸并到一起,這實(shí)際就是對(duì)指標(biāo)聚類。原始數(shù)據(jù)列于表1。表12005年31個(gè)省、直轄市、自治區(qū)城鎮(zhèn)區(qū)民月平均消費(fèi)數(shù)據(jù)x1人均糧食支出(元/人)x5人均衣著支出(元/人)x2人均副食支出(元/人)x6人均日用雜品支出(元/人)x3人均煙、酒、飲料支出(元/人)x7人均水電燃料支出(元/人)x4人均其他副食支出(元/人)x8人均其他非商品支出(元/人)x1x2x3x4x5x6x7x8北京21.30124.8935.4373.9893.0120.5843.97433.73天津21.50122.3929.0851.6455.0411.3054.88288.13河北18.2590.2124.4532.4462.487.4547.50178.84山西21.8466.3818.0531.3274.488.1934.97177.45內(nèi)蒙古21.3767.0820.2835.2781.0710.9439.46182.20遼寧22.74115.8828.2142.4458.079.6348.65194.85吉林20.2288.9418.5435.6365.728.8150.29186.52黑龍江21.3375.5014.0029.5669.298.2442.08165.90上海21.13168.6940.8170.1274.3215.4650.90422.74江蘇18.61122.5127.0742.5063.4715.3836.14240.92浙江19.96142.2443.3350.74101.7712.9253.44394.55安徽19.61107.1332.8535.7761.347.5334.60142.23福建25.56171.6522.3040.5357.1312.6054.03225.08江西18.75104.6815.5535.6151.8011.1836.27142.72山東18.2788.3419.0743.1972.9812.5942.16200.18河南19.0773.1818.0129.3864.518.9138.14155.45湖北18.76102.6721.8730.4764.3311.9942.14168.17湖南20.25104.4520.7238.1562.9812.6739.16213.56廣東23.68173.3017.4343.5953.6616.8665.02385.94廣西18.70131.3511.6932.0641.5410.8442.77178.51海南16.16139.9212.9823.5824.8710.7632.35144.21重慶18.18120.3926.1837.9468.1611.6438.48246.37四川18.53109.9521.4933.0450.9810.8833.96183.85貴州18.3392.4325.3832.1956.3214.0038.57144.82云南22.3099.0833.3632.0152.067.0432.85190.04西藏29.67146.9064.5154.3686.1014.7732.19193.10陜西20.0370.7519.7534.9553.2910.5538.20189.41甘肅18.6872.7423.7238.6962.419.6535.26170.12青海20.3375.6420.8833.8653.8110.0632.82171.32寧夏19.7570.2418.6736.7161.7510.0840.26165.22新疆21.0378.5514.3534.3364.989.8333.87161.67實(shí)驗(yàn)方法和步驟(包括數(shù)值公式、算法步驟、程序):將原始數(shù)據(jù)錄入SPSS,并依次點(diǎn)擊Analyze->Correlate->Bivariate,打開BivariateCorrelations對(duì)話框,把八個(gè)變量選入Variables欄中,單擊“OK”,得到這八個(gè)指標(biāo)對(duì)應(yīng)的相關(guān)系數(shù),列于表2。下面采用歐氏距離,分別運(yùn)用類平均法、最短距離法、最長(zhǎng)距離法,對(duì)31個(gè)省、直轄市、自治區(qū)分類。類平均法聚類在SPSS中的操作為:點(diǎn)選“Analyze”→“Classify”→“HierarchicalCluster”,打開HierarchicalClusterAnalysis對(duì)話框,將八個(gè)聚類指標(biāo)選入Variables欄中,將表示地區(qū)的變量選入LabelCasesBy欄中,按“Plots”按鈕,在彈出的窗口中選中Dendrogram(譜系圖)選項(xiàng),按“Continue”返回主對(duì)話框,在按“Method”按鈕,在ClusterMethod下拉菜單中選擇Between-groupslinkage(組間連接法,即類平均法)選項(xiàng),返回主對(duì)話框后按“OK”即可得到聚類結(jié)果,結(jié)果見圖2。最短距離法操作步驟與類平均法一樣,只不過要在ClusterMethod下拉菜單中選擇NearestNeighbo選項(xiàng),結(jié)果見圖3。最長(zhǎng)距離法操作步驟與類平均法一樣,只不過要在ClusterMethod下拉菜單中選擇NearestNeighbor選項(xiàng),結(jié)果見圖4。分別顯示了三種方法的分類結(jié)果。為便于對(duì)照,將三種方法分類的結(jié)果綜合列于圖5。實(shí)驗(yàn)數(shù)據(jù)和分析:表2相似性系數(shù)(相關(guān)系數(shù))矩陣表2中最大的相關(guān)系數(shù)為r4,8=0.837,將G4和G8并成一新類G9,然后計(jì)算G9與各類的相關(guān)系數(shù),再找最大的相關(guān)系數(shù),每次縮小一類,得到圖1。我們可以看出全國(guó)城鎮(zhèn)居民得消費(fèi)結(jié)構(gòu)大致可以分為三個(gè)方面,一類是各種副食、日用品及交通通信、文化教育和住房等支出,這是在消費(fèi)結(jié)構(gòu)中起主導(dǎo)作用的方面;其次是居民購(gòu)買煙、酒、飲料及著裝支出;糧食和水電燃料是兩項(xiàng)很重要的消費(fèi)指標(biāo),但目前在城鎮(zhèn)居民的消費(fèi)中占的比例較小,可將它們歸并為同一類。圖1城鎮(zhèn)居民消費(fèi)指標(biāo)聚類圖下面我們對(duì)31個(gè)省進(jìn)行聚類分析,得到不同方法的聚類結(jié)果。圖1類平均法譜系圖圖2最短距離法譜系圖圖3最長(zhǎng)距離法譜系圖圖5:三個(gè)方法結(jié)果比較表序號(hào)地區(qū)類平均距離法標(biāo)號(hào)最短距離法標(biāo)號(hào)最長(zhǎng)距離法標(biāo)號(hào)1北京1112天津2223河北3234山西3235內(nèi)蒙古3236遼寧3237吉林3238黑龍江3239上海11110江蘇22211浙江11112安徽32313福建22214江西32315山東32316河南32317湖北32318湖南32319廣東11120廣西32321海南32322重慶22223四川32324貴州32325云南32326西藏22227陜西32328甘肅32329青海32330寧夏32331新疆323由圖可直觀看出,類平均法分為三類:{1,9,11,19}為第一類,{13,2,22,10}為第二類,其他為第三類;最短距離法分為兩類,{1,9,11,19}為一類,其余的省市歸為一大類;最長(zhǎng)距離法也分為三類:{1,9,11,19}為第一類,{10,22,2,13,26}為第二類,其余的省市為第三類。很顯然,這三種方法的分類效果是有差異的。那么究竟采用哪一種分類為好呢?一種方法是根據(jù)分類問題本身的知識(shí)來決定取舍。另一種方法是將幾種方法的共性取出來,有爭(zhēng)議的樣品根據(jù)其實(shí)際情況再劃分。綜合考慮這兩點(diǎn),筆者認(rèn)為從全國(guó)各省、市、區(qū)的消費(fèi)情況來看,分為三類較為合適。由分類結(jié)果可以看出,類平均法和最長(zhǎng)距離法的分類結(jié)果基本上一致,只是在西藏應(yīng)該劃入第二類還是第三類上存在差異,從表3—5的實(shí)際情來看,西藏

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論