版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
大連民族學(xué)院數(shù)學(xué)實(shí)驗(yàn)報(bào)告課程:多元統(tǒng)計(jì)分析實(shí)驗(yàn)題目:關(guān)于社會(huì)經(jīng)濟(jì)案例的聚類分析系別:理學(xué)院專業(yè):信息與計(jì)算科學(xué)姓名:歷紅影班級(jí):信息102班指導(dǎo)教師:滕穎俏完成學(xué)期:2013年4月26日實(shí)驗(yàn)?zāi)康模?.通過本次上機(jī),掌握利用SPSS進(jìn)行聚類分析;2.加深對(duì)聚類分析的理解,學(xué)會(huì)用聚類分析解決現(xiàn)實(shí)生活中的問題;3.學(xué)會(huì)利用最長(zhǎng)距離法等多種方法進(jìn)行聚類分析并對(duì)其進(jìn)行比較。實(shí)驗(yàn)內(nèi)容:(問題、數(shù)學(xué)模型、要求、關(guān)鍵詞)城鎮(zhèn)居民消費(fèi)水平通常用表1中的八項(xiàng)指標(biāo)來描述,八項(xiàng)指標(biāo)間存在一定的線性相關(guān)。為研究城鎮(zhèn)居民的消費(fèi)結(jié)構(gòu),需將相關(guān)性強(qiáng)的指標(biāo)歸并到一起,這實(shí)際就是對(duì)指標(biāo)聚類。原始數(shù)據(jù)列于表1。表12005年31個(gè)省、直轄市、自治區(qū)城鎮(zhèn)區(qū)民月平均消費(fèi)數(shù)據(jù)x1人均糧食支出(元/人)x5人均衣著支出(元/人)x2人均副食支出(元/人)x6人均日用雜品支出(元/人)x3人均煙、酒、飲料支出(元/人)x7人均水電燃料支出(元/人)x4人均其他副食支出(元/人)x8人均其他非商品支出(元/人)x1x2x3x4x5x6x7x8北京21.30124.8935.4373.9893.0120.5843.97433.73天津21.50122.3929.0851.6455.0411.3054.88288.13河北18.2590.2124.4532.4462.487.4547.50178.84山西21.8466.3818.0531.3274.488.1934.97177.45內(nèi)蒙古21.3767.0820.2835.2781.0710.9439.46182.20遼寧22.74115.8828.2142.4458.079.6348.65194.85吉林20.2288.9418.5435.6365.728.8150.29186.52黑龍江21.3375.5014.0029.5669.298.2442.08165.90上海21.13168.6940.8170.1274.3215.4650.90422.74江蘇18.61122.5127.0742.5063.4715.3836.14240.92浙江19.96142.2443.3350.74101.7712.9253.44394.55安徽19.61107.1332.8535.7761.347.5334.60142.23福建25.56171.6522.3040.5357.1312.6054.03225.08江西18.75104.6815.5535.6151.8011.1836.27142.72山東18.2788.3419.0743.1972.9812.5942.16200.18河南19.0773.1818.0129.3864.518.9138.14155.45湖北18.76102.6721.8730.4764.3311.9942.14168.17湖南20.25104.4520.7238.1562.9812.6739.16213.56廣東23.68173.3017.4343.5953.6616.8665.02385.94廣西18.70131.3511.6932.0641.5410.8442.77178.51海南16.16139.9212.9823.5824.8710.7632.35144.21重慶18.18120.3926.1837.9468.1611.6438.48246.37四川18.53109.9521.4933.0450.9810.8833.96183.85貴州18.3392.4325.3832.1956.3214.0038.57144.82云南22.3099.0833.3632.0152.067.0432.85190.04西藏29.67146.9064.5154.3686.1014.7732.19193.10陜西20.0370.7519.7534.9553.2910.5538.20189.41甘肅18.6872.7423.7238.6962.419.6535.26170.12青海20.3375.6420.8833.8653.8110.0632.82171.32寧夏19.7570.2418.6736.7161.7510.0840.26165.22新疆21.0378.5514.3534.3364.989.8333.87161.67實(shí)驗(yàn)方法和步驟(包括數(shù)值公式、算法步驟、程序):將原始數(shù)據(jù)錄入SPSS,并依次點(diǎn)擊Analyze->Correlate->Bivariate,打開BivariateCorrelations對(duì)話框,把八個(gè)變量選入Variables欄中,單擊“OK”,得到這八個(gè)指標(biāo)對(duì)應(yīng)的相關(guān)系數(shù),列于表2。下面采用歐氏距離,分別運(yùn)用類平均法、最短距離法、最長(zhǎng)距離法,對(duì)31個(gè)省、直轄市、自治區(qū)分類。類平均法聚類在SPSS中的操作為:點(diǎn)選“Analyze”→“Classify”→“HierarchicalCluster”,打開HierarchicalClusterAnalysis對(duì)話框,將八個(gè)聚類指標(biāo)選入Variables欄中,將表示地區(qū)的變量選入LabelCasesBy欄中,按“Plots”按鈕,在彈出的窗口中選中Dendrogram(譜系圖)選項(xiàng),按“Continue”返回主對(duì)話框,在按“Method”按鈕,在ClusterMethod下拉菜單中選擇Between-groupslinkage(組間連接法,即類平均法)選項(xiàng),返回主對(duì)話框后按“OK”即可得到聚類結(jié)果,結(jié)果見圖2。最短距離法操作步驟與類平均法一樣,只不過要在ClusterMethod下拉菜單中選擇NearestNeighbo選項(xiàng),結(jié)果見圖3。最長(zhǎng)距離法操作步驟與類平均法一樣,只不過要在ClusterMethod下拉菜單中選擇NearestNeighbor選項(xiàng),結(jié)果見圖4。分別顯示了三種方法的分類結(jié)果。為便于對(duì)照,將三種方法分類的結(jié)果綜合列于圖5。實(shí)驗(yàn)數(shù)據(jù)和分析:表2相似性系數(shù)(相關(guān)系數(shù))矩陣表2中最大的相關(guān)系數(shù)為r4,8=0.837,將G4和G8并成一新類G9,然后計(jì)算G9與各類的相關(guān)系數(shù),再找最大的相關(guān)系數(shù),每次縮小一類,得到圖1。我們可以看出全國(guó)城鎮(zhèn)居民得消費(fèi)結(jié)構(gòu)大致可以分為三個(gè)方面,一類是各種副食、日用品及交通通信、文化教育和住房等支出,這是在消費(fèi)結(jié)構(gòu)中起主導(dǎo)作用的方面;其次是居民購(gòu)買煙、酒、飲料及著裝支出;糧食和水電燃料是兩項(xiàng)很重要的消費(fèi)指標(biāo),但目前在城鎮(zhèn)居民的消費(fèi)中占的比例較小,可將它們歸并為同一類。圖1城鎮(zhèn)居民消費(fèi)指標(biāo)聚類圖下面我們對(duì)31個(gè)省進(jìn)行聚類分析,得到不同方法的聚類結(jié)果。圖1類平均法譜系圖圖2最短距離法譜系圖圖3最長(zhǎng)距離法譜系圖圖5:三個(gè)方法結(jié)果比較表序號(hào)地區(qū)類平均距離法標(biāo)號(hào)最短距離法標(biāo)號(hào)最長(zhǎng)距離法標(biāo)號(hào)1北京1112天津2223河北3234山西3235內(nèi)蒙古3236遼寧3237吉林3238黑龍江3239上海11110江蘇22211浙江11112安徽32313福建22214江西32315山東32316河南32317湖北32318湖南32319廣東11120廣西32321海南32322重慶22223四川32324貴州32325云南32326西藏22227陜西32328甘肅32329青海32330寧夏32331新疆323由圖可直觀看出,類平均法分為三類:{1,9,11,19}為第一類,{13,2,22,10}為第二類,其他為第三類;最短距離法分為兩類,{1,9,11,19}為一類,其余的省市歸為一大類;最長(zhǎng)距離法也分為三類:{1,9,11,19}為第一類,{10,22,2,13,26}為第二類,其余的省市為第三類。很顯然,這三種方法的分類效果是有差異的。那么究竟采用哪一種分類為好呢?一種方法是根據(jù)分類問題本身的知識(shí)來決定取舍。另一種方法是將幾種方法的共性取出來,有爭(zhēng)議的樣品根據(jù)其實(shí)際情況再劃分。綜合考慮這兩點(diǎn),筆者認(rèn)為從全國(guó)各省、市、區(qū)的消費(fèi)情況來看,分為三類較為合適。由分類結(jié)果可以看出,類平均法和最長(zhǎng)距離法的分類結(jié)果基本上一致,只是在西藏應(yīng)該劃入第二類還是第三類上存在差異,從表3—5的實(shí)際情來看,西藏
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 煤炭行業(yè)新技術(shù)與新型業(yè)態(tài)發(fā)展考核試卷
- 《檔案治理視閾下檔案職業(yè)發(fā)展研究》
- 大壽生日壽辰宴會(huì)活動(dòng)策劃方案
- 2024年EPS再生料項(xiàng)目申請(qǐng)報(bào)告
- 2024-2030年中國(guó)鹽酸西替利嗪行業(yè)發(fā)展現(xiàn)狀分析及投資價(jià)值研究報(bào)告
- 2024-2030年中國(guó)白金首飾產(chǎn)業(yè)未來發(fā)展趨勢(shì)及投資策略分析報(bào)告
- 《Ag(Ⅰ)-富勒烯立方微晶光催化與抗菌效能研究》
- 《FSTSG股份有限公司財(cái)務(wù)風(fēng)險(xiǎn)控制研究》
- 2024年新浪微博生態(tài)項(xiàng)目申請(qǐng)報(bào)告
- 2024年激光癌癥診斷儀項(xiàng)目申請(qǐng)報(bào)告范文
- 北京市第四中學(xué)2024-2025學(xué)年七年級(jí)上學(xué)期期中生物學(xué)試題(含答案)
- 體育教師先進(jìn)個(gè)人事跡材料
- 2025屆江蘇省蘇州市第一中學(xué)物理高三第一學(xué)期期末學(xué)業(yè)水平測(cè)試模擬試題含解析
- 企業(yè)財(cái)務(wù)管理數(shù)字化轉(zhuǎn)型實(shí)施方案
- 第九課+發(fā)展中國(guó)特色社會(huì)主義文化+課件高中政治統(tǒng)編必修四哲學(xué)與文化
- 牙用漂白凝膠市場(chǎng)環(huán)境與對(duì)策分析
- 人教版七年級(jí)道德與法治上冊(cè) 期中復(fù)習(xí)知識(shí)梳理
- 建筑施工企業(yè)(安全管理)安全生產(chǎn)管理人員安全生產(chǎn)考試參考題及答案
- 鍋爐應(yīng)急預(yù)案演練方案
- 關(guān)于高技能人才培養(yǎng)問題的思考高技能人才培養(yǎng)方案
- 中國(guó)航天發(fā)展史主題班會(huì) 課件
評(píng)論
0/150
提交評(píng)論