多元統計分析案例分析_第1頁
多元統計分析案例分析_第2頁
多元統計分析案例分析_第3頁
多元統計分析案例分析_第4頁
多元統計分析案例分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多元統計分析案例分析多元統計分析案例分析多元統計分析案例分析V:1.0精細整理,僅供參考多元統計分析案例分析日期:20xx年X月一、對我國30個省市自治區(qū)農村居民生活水平作聚類分析1、指標選擇及數據:為了全面分析我國農村居民的生活狀況,主要考慮從收入、消費、就業(yè)等幾個方面對農村居民的生活狀況進行考察。因此選取以下指標:農村產品價格指數、農村住宅投資、農村居民消費水平、農村居民消費支出、農村居民家庭人均純收入、耕地面積及農村就業(yè)人數?,F從2010年的調查資料中抽?。常皞€樣本,指標數據如下:地區(qū)農產品價格指數(上年=100)農村住宅投資

(億元)農村居民消費水平(元)農村居民生活消費支出合計

(元)農村居民家庭人均純收入(元)耕地面積2008

(萬公頃)農村私營企業(yè)就業(yè)人數(萬人)北京1288613262天津781410075河北38675958山西45004736內蒙古44865530遼寧57396908吉林46636237黑龍江45366211上海1360913978江蘇81969118浙江987811303安徽44475285福建68797427江西43975789山東57336990河南40615524湖北47585832湖南45135622廣東58807890廣西35614543海南38465275重慶36525277四川47485087貴州29263472云南36033952陜西36834105甘肅29753425青海36843863寧夏38944675新疆35904643數據來源:《中國統計年鑒2010》.2、將數據進行標準化變換:地區(qū)農產品價格指數(上年=100)農村住宅投資

(億元)農村居民消費水平(元)農村居民生活消費支出合計

(元)農村居民家庭人均純收入(元)耕地面積2008

(萬公頃)農村私營企業(yè)就業(yè)人數(萬人)北京天津河北山西內蒙古遼寧吉林黑龍江上海江蘇浙江安徽福建江西山東河南湖北湖南廣東廣西海南重慶四川貴州云南陜西甘肅青海寧夏新疆3、用K-均值聚類法對樣本進行分類如下:聚類成員案例號地區(qū)聚類距離1北京12天津23河北34山西45內蒙古36遼寧27吉林38黑龍江39上海110江蘇211浙江112安徽313福建214江西415山東316河南317湖北318湖南419廣東220廣西421海南422重慶423四川324貴州425云南326陜西427甘肅428青海429寧夏430新疆4分四類的情況下,最終分類結果如下:第一類:北京、上海、浙江。第二類:天津、、遼寧、、福建、甘肅、江蘇、廣東。第三類:浙江、河北、內蒙古、吉林、黑龍江、安徽、山東、河南、湖北、四川、云南。第四類:山西、青海、寧夏、新疆、重慶、貴州、陜西、湖南、廣西、江西、。從分類結果上看,根據2010年的調查數據,第一類地區(qū)的農民生活水平較高,第二類屬于中等水平,第三類、第四類屬于較低水平。二、判別分析針對以上分類結果進行判別分析。其中將新疆作作為待判樣本。判別結果如下:案例數目實際組預測組p1112223334445336227338339111022111112331322144415331633173318441922204421442244233324442534**26442744284429443044**.錯誤分類的案例從上可知,只有一個地區(qū)判別組和原組不同,回代率為96%。下面對新疆進行判別:已知判別函數系數和組質心處函數如下:標準化的典型判別式函數系數函數123農產品價格指數農村住宅投資農村居民價格水平生活消費支出人均純收入耕地面積就業(yè)人數組質心處的函數函數組號1231234判別函數分別為:Y1=++++Y2=++++Y3=+++將西藏的指標數據代入函數得:Y1=Y2=Y3=計算Y值與不同類別均值之間的距離分別為:D1=D2=12.D3=D4=經過判別,D4最小,所以新疆應歸于第四類,這與實際情況也比較相符。三,因子分析:分析數據在上表的基礎上去掉兩個耕地面積和農村固定資產投資兩個指標。經spss軟件分析結果如下:(1)各指標的相關系數陣:從中可以看出,大部分指標的相關系數都比較高,各變量之間的線性關系較明確,能夠從中提取公共因子,適合因子分子。(2)檢驗:由上表可知:巴特利特球度檢驗統計量的觀測值為.相應的概率p接近為0.如果顯著性水平a為,由于顯著性水平小于,拒絕零假設,認為相關系數矩陣與單位陣有顯著差異,同時,KOM值為,根據Kaiser給出的度量標準可知原有變量適合進行因子分析(3)各指標的貢獻率如下表:從中可以看出,各個指標的貢獻率都在百分之五十之上比較高。從上表中可以看出,第一個因子的特征根為.解釋原有五個變量總方差的68%,累積方差貢獻率為%。第二個因子的特征根為,解釋原有變量總方差%,累計方差貢獻率為%。(4)碎石圖:(5)因子載荷陣如下:由上表可知,各指標在第一個因子上的載荷比較高,說明第一個因子很重要;第二個因子與原有變量的相關性較小,它對原有變量的解釋作用不顯著。為便于對各因子進行命名,對因子載荷陣實施正交旋轉。旋轉之后的因子載荷陣:(6)從上表可見,每個因子只有幾個指標的因子載荷較大,因此可根據上表進行分類。將五個指標按高載荷分成兩類:四,主成分分析:(1)各指標間的相關系數矩陣如下表所示:可以看到有些指標之間的相關性較強,如果直接進行綜合分析會造成信息重疊,所以用主成分分析將多個指標化成幾個不相關的綜合指標。(2)求相關矩陣的特征值和特征向量:從上表可知,前兩個特征值累計貢獻率已達%。說明前兩個主成分基本包含了全部指標具有的信息。因此,取前兩個特征值,并計算相應的特征向量:(3)由上述因子分子的因子載荷陣計算主成分的特征向量陣為:所以,前兩個主成分為:第一個主成分:F1=X1++++第二個主成分:F2=在第一主成分中第二、三、四個指標的系數較大,這三個指標起主要作用,刻劃了農居民的收入支出狀況的綜合指標。在第二主成分中,第一個指標系數較大,是農產品價格水平指標。(4)因子得分:根據上表寫出以下因子得分函數:F1=農產品價格指數+農村居民消費+消費支出+家庭人均純收入+就業(yè)人數 F2=農產品價格指數+農村居民消費消費支出+家庭人均純收入就業(yè)人數(5)綜合評價:以兩個因子的方差貢獻率為權數,綜合評價模型為:Z=+(旋轉之后的方差貢獻率)F1=X1++++F2=將各地區(qū)指標值代入上式得到各地區(qū)農村生活水平的綜合值及排名:(6)對結果進行分析:從中可以看出,各地區(qū)的農村居民生活水平存在差異。其中,北京、上海、浙江、江蘇地區(qū)的綜合評價值排名前列,說明這幾個城市農村居民的生活水平比較高。主要表現在農民收入水平和消費水平兩個方面。這幾個城市屬于沿海地區(qū),經濟比較發(fā)達,工農業(yè)發(fā)展遙遙領先于其他地區(qū)。其次,天津、山東

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論