琳聚類分析大作業(yè)_第1頁
琳聚類分析大作業(yè)_第2頁
琳聚類分析大作業(yè)_第3頁
琳聚類分析大作業(yè)_第4頁
琳聚類分析大作業(yè)_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

摘在數(shù)據(jù)選取方面,選取國家統(tǒng)計年鑒2011年度31個省市的經(jīng)濟發(fā)展和消費水:聚類分析,判別分析,SPSS,經(jīng)濟發(fā)展水Inthispaper,clusterysisanddiscriminantysismethodwereusedfortheclassificationofdifferentprovincesinChina,andamathematicalmodelwasestablished.Intermsofdataselection,economicdevelopmentandconsumptionlevelindicatorsofChinese31provinceswereselectedfromtheNationalStatisticalYearbookof2011andsixfactorswerechosenfromit.ByusingSPSSasthestatisticalysissoftware,thepaperusesystemclusteringmethodtoclassifythelevelofeconomicdevelopmentofdifferentprovincesandrectifiedbyusingdiscriminantysis.Bycomparison,theclassificationisconsistentwiththeactualsituation,sothepapergotabetterclassificationresults.:Clusterysis,discriminantysis,SPSS,thelevelofeconomic 第一 引 研究目的及意 聚類分析與判別分析的研 第二章聚類分 聚類分 樣本間距離常用度 SPSS進行聚類分 數(shù)據(jù)來 聚類分 分析結(jié) 第三章判別分 判別分 SPSS進行判別分 數(shù)據(jù)來 判別分 分析結(jié) 第四章心得與體 參考文 第一章研究目的及意開放以來隨著經(jīng)濟高速的增長化也經(jīng)歷了快速增長的過程然而,受地理、環(huán)境、資源以及國家政策等因素的影響,我國不同區(qū)域的進程尚存在很大差異。2011發(fā)展報告中,從區(qū)域角度看,目前四大區(qū)域城市科學(xué)發(fā)展指了最后。顯然,通過研究不同城市的經(jīng)濟發(fā)展狀況和經(jīng)濟類型,其發(fā)展差異所在,可以引導(dǎo)在今后正確的出臺相關(guān)政策來平衡區(qū)域經(jīng)濟發(fā)展縮小不同地區(qū)人民生活水平的差異,從而最終實現(xiàn)這一遠大目標。本文目的即在于通過選取主要的經(jīng)濟指標對不同區(qū)域的代表市進行聚類分析聚類分析與判別分析的研第四章,對聚類分析和判別分析中的問題進行綜述,并了本文的不足之處聚類分QR型聚類分析,但前者應(yīng)用較本文主要用系統(tǒng)聚類法對數(shù)據(jù)進行聚類分析,系統(tǒng)聚類法的基本思想如下首先,將n個樣品看成n類,即一類只包括一個樣品,然后將性質(zhì)最接近的兩類合并成一個新類,這樣得到n-1類,再從n-1類中找到性質(zhì)相近的兩類進行合并,得到n-2類,如此繼續(xù)下去,知道所有的樣品全在一類為止。將上述聚類過程畫成一張圖稱為樣本間距離常用度距離等。另外,還有相似系數(shù)cosine(變量矢量的余弦)和pearsoncorrelation(SPSS進行聚類分本文在國家上收集了2011年度31個省市的經(jīng)濟發(fā)展和消費水平,x2:,x3:,x4:,x5:,x6:12-1地常住人口(萬人生產(chǎn)總工業(yè)平均工人均可支配收消費市市河北山西內(nèi)遼寧吉林黑龍江市江蘇浙江省福建江西山東省省湖南省廣西壯族海南重慶省省云南陜西省青海依次選擇分析→分類→系統(tǒng)聚類進入設(shè)置框。聚類方法選擇離差平方(wardmethod)的方法,度量標準采用歐氏距離。聚類數(shù)設(shè)置為4。其它均為默認設(shè)2-217180.18091420個個案進行聚類,個的距離系數(shù)為0.387,這個結(jié)果將在第3步中用到;第三步是將第二步聚類后的個案14和個案15與個案25進行聚類,個的距離系數(shù)為103130表2-2階群集群集群集群集1.0033204006550064070087009018034708003003.719000056503946200254232121402-331個個案分別被分成了哪一類??梢允褂脀ardmethod2-42-3群集41:12:23:24:35:26:27:38:39:110:411:212:213:214:315:416:217:218:219:420:321:322:223:224:325:3327:328:329:3332-4ward內(nèi)省省2-1ward2-1根據(jù)表2-4可以看出,第一類地區(qū)為經(jīng)濟發(fā)展水平最高的地區(qū),有和;第判別分常用的判別分析方法有距離判別法、Fisher判別法、Bayes判別法和逐步判別法[3]。k個總體G1,G2,Gkk個類,希望建立一個準則,對給定的任意一個xWilks的λ統(tǒng)計量進行檢驗[4]。SPSS進行判別分5年度26個省的經(jīng)濟發(fā)展和消費水平指標,并選取了具有代表性的6個相關(guān)指標,,x2:,x3:,x4:,x5:,x6:家庭人均現(xiàn)金消費支出(元)。另外,還有在第二章中的分類號記為c。具體數(shù)據(jù)如表3-13-1地常住人口(人生產(chǎn)總工業(yè)增值平均資人均可支配入消費性出c市13市28山西35內(nèi)28遼寧2黑龍江3市19浙江25省25福建28江西32山東45省23省26湖南26省48廣西壯37海南3省28省3云南33陜西3青海33自3區(qū)重慶7吉林3江蘇7省河北6平方和的大小。表3-2是分類處理案例表,表明共有31條記錄,應(yīng)分好類的有26條表3-2分類處理案例未案N50053-3表3-3c有效的N(列表狀態(tài)未已12222222342222223-46表3-4----------表3-5123a.分析中使用了前33-6是對判別函數(shù)的顯著性檢驗結(jié)果表。從顯著性概率來看,判別函數(shù)的效果還表3-6WilksLambdaWilks的1到2到343-7F1=0.285x1+2.739x2?1.890x3+1.269x4?0.434x5+0.071x6????F2=1.268x1?0.684x2?1.046x3+0.309x4+0.380x5+0.512x6????F3=1.359x1?3.156x2+2.160x3?0.387x4+0.130x5+1.253x6????表3-7123------3-13-1是各類區(qū)域圖及分類標記情況。根據(jù)每個個案計算出的判別函數(shù)為坐標,以典則判別函數(shù)1為橫軸,典則判別函數(shù)2為縱軸,所3-1如圖3-2為分類的質(zhì)心分布圖,橫坐標為典則判別函數(shù)12圖3-23-84個分類函數(shù)。將各變量值代入這四個表3-8c1234-1.268E-------------Fisher3-926表3-9c12341220000002%3400000103021251234圖3-3是工作表數(shù)據(jù)文件的部分數(shù)據(jù)的。最后一行為預(yù)測值3-3對于前26個數(shù)據(jù)來說,預(yù)測分組恰好與實際分組是一致的,判對率為100%,此結(jié)北省的預(yù)測分類號分別為3、3、4、3、2,對比聚類分析得到的分組數(shù)分別為2、3、4、31個省市進行了分類。根據(jù)查閱中和的分類有些奇怪,不知如何解釋。由此猜測,這三個省市人口密度均較大,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論