《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第1頁
《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第2頁
《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第3頁
《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第4頁
《統(tǒng)計分析與SPSS的應用(第五版)》課后練習答案(第10章)_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質文檔-傾情為你奉上精選優(yōu)質文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質文檔-傾情為你奉上專心-專注-專業(yè)統(tǒng)計分析與SPSS的應用(第五版)(薛薇)課后練習答案第10章SPSS的聚類分析1、根據(jù)“高??蒲醒芯?sav”數(shù)據(jù),利用層次聚類分析對各省市的高??蒲星闆r進行層次聚類分析。要求:1) 根據(jù)凝聚狀態(tài)表利用碎石圖對聚類類數(shù)進行研究。2) 繪制聚類樹形圖,說明哪些省市聚在一起。3) 繪制各類的科研指標的均值對比圖。4) 利用方差分析方法分析各類在哪些科研指標上存在顯著差異。采用歐氏距離,組間平均鏈鎖法利用凝聚狀態(tài)表中的組間距離和對應的組數(shù),回歸散點圖,得到碎石圖。大約聚成4

2、類。步驟:分析分類系統(tǒng)聚類按如下方式設置 結果:凝聚計劃階段組合的集群系數(shù)首次出現(xiàn)階段集群下一個階段集群 1集群 2集群 1集群 212630328.18900222629638.295107320251053.42300544121209.922001558201505.03503668161760.170509724261831.926021087111929.89100119582302.02406221024312487.209702211272709.88708161222282897.1060019136232916.55100171410193280.75200251542134

3、91.585402116234229.37511021176134612.42313020189185377.25300251914225622.41501224206155933.5181702321246827.276161526225247930.76591024236279475.498200262451414959.7042219282591019623.050181427262624042.6692123282791732829.46625029282548360.854262429292991313.5302827303012.5030290將系數(shù)復制下來后,在EXCEL中建立工

4、作表。選中數(shù)據(jù)列,點擊“插入”菜單拆線圖 碎石圖:由圖可知,北京自成一類,江蘇、廣東、上海、湖南、湖北聚成一類。其他略。接下來,添加一個變量CLU4_1,其值為類別值。(1、2、3、4),再數(shù)據(jù)匯總設置確定。均值對比,依據(jù)聚類解,利用分類匯總,計算各個聚類變量的均值方差分析結果:分析比較均值單因素ANOVA設置確定ANOVA平方和df均方F顯著性投入人年數(shù)組之間.1963.73226.428.000組內.15927.858總計.35530投入高級職稱的人年數(shù)組之間.8203.27334.553.000組內.14727.783總計.96830投入科研事業(yè)費(百元)組之間0.8843.628324

5、.318.000組內.79427.474總計7.67730課題總數(shù)組之間.5643.85532.181.000組內.43627.720總計.00030專著數(shù)組之間.3853.12861.327.000組內.8092739154.363總計.19430論文數(shù)組之間.2193.74017.693.000組內.71727.915總計.93530獲獎數(shù)組之間.049356627.3503.619.026組內.7902715645.807總計.83930不同組在各個聚類變量上的均值均存在顯著差異。2、試說明當變量存在數(shù)量級上的差異,進行層次聚類分析時為什么要對數(shù)據(jù)進行標準化處理?因為數(shù)量級將對距離產(chǎn)生較

6、大影響,并影響最終聚類結果。試說明變量之間的高度相關性是否會對層次聚類分析結果造成影響?為什么?會。如果所選變量之間存在較強的線性關系,能夠相互替代,在計算距離時同類變量將重復“貢獻”,占有較高權重,而使最終的聚類結果偏向該類變量。試說明K-Mean聚類分析的基本步驟。K-Means聚類分析步驟:確定聚類數(shù)目K-確定K個初始類中心點-根據(jù)距離最近原則進行分類-重新確定K個類中心點-判斷是否已經(jīng)滿足終止條件。是一個反復迭代的分類過程。在聚類過程中,樣本所屬的類會不斷調整,直至達到最終穩(wěn)定為止。5、收集到我國2007年各地區(qū)城鎮(zhèn)居民家庭平均每人全年消費支出數(shù)據(jù),數(shù)據(jù)文件名為:“消費結構.sav”,

7、 變量包括:地區(qū)、消費性支出總額、食品、衣著、居住、家庭設備用品及服務、醫(yī)療保健、交通和通信、教育文化娛樂服務、醫(yī)療保健、雜項商品和服務支出。若采用層次聚類法(個體間距離定義為平方歐氏距離,類間距離定義為組間平均鏈鎖距離),繪制的碎石圖如下:(1)依據(jù)上圖,數(shù)據(jù)聚成幾類較為恰當?(2)試采用K-MEANS聚類方法,從類內相似性和類間差異性角度分析將數(shù)據(jù)聚成幾類較為恰當。(1)聚成3類較為恰當。注:碎石圖可按第9章第1題方式繪制,也可按如下方式繪制。步驟:分析降維因子分析導入全部變量到變量框中(地區(qū)變量除外)抽?。哼x中碎石圖繼續(xù)確定。得到:(可以看出,分成3類恰當)(2)用K-MEANS聚類方法

8、進行分類,比較分類數(shù)為2、3、4時的差別。步驟:分析分類K-平均聚類地區(qū)變量導入到標注個案,其他變量全部導入到變量框中聚類數(shù)填2選項:選中初始聚類中心和ANOVA繼續(xù)確定。得到:ANOVA聚類錯誤F顯著性均方df均方df食品.9671.7792956.445.000衣著.565137555.425297.422.011居住.436131940.7642920.901.000家庭設備用品及服務.258114558.0412928.277.000醫(yī)療保健.302134400.296299.456.005交通和通信.457157486.40029178.922.000教育文化娛樂服務.4651690

9、80.9332975.656.000雜項商品和服務.93116496.5502938.222.000僅當出于描述目的時才應該使用 F 檢驗,因為已選擇聚類用于將不同聚類中的個案的差異最大化。 受觀察的顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設的檢驗。每個聚類中的個案數(shù)量聚類14.000227.000有效31.000缺失.000將上圖中的聚類數(shù)修改為3,則得到:ANOVA聚類錯誤F顯著性均方df均方df食品.5092.7702852.178.000衣著.509241645.317282.422.107居住.147216508.6902834.274.000家庭設

10、備用品及服務.836212833.0272818.488.000醫(yī)療保健.996233054.746286.011.007交通和通信.064290458.7482852.067.000教育文化娛樂服務.304267059.9262839.905.000雜項商品和服務.66624829.5552831.213.000僅當出于描述目的時才應該使用 F 檢驗,因為已選擇聚類用于將不同聚類中的個案的差異最大化。 受觀察的顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設的檢驗。每個聚類中的個案數(shù)量聚類11.000225.00035.000有效31.000缺失.000將上圖中的

11、聚類數(shù)修改為4,則得到:ANOVA聚類錯誤F顯著性均方df均方df食品.597362963.25127102.619.000衣著.013335623.106273.799.022居住.271332618.140277.288.001家庭設備用品及服務.914315077.322279.435.000醫(yī)療保健.289336553.186273.064.045交通和通信.324343056.2632783.536.000教育文化娛樂服務.568366335.5862727.329.000雜項商品和服務97486.29135342.7412718.246.000僅當出于描述目的時才應該使用 F 檢驗,因為已選擇聚類用于將不同聚類中的個案的差異最大化。 受觀察的顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設的檢驗。每個聚類中的個案數(shù)量聚類11.00023.000315.000412.000有效31.000缺失.000從3個ANOVA表可以看出,分為2類時,P-值均小于0.05,表明有顯著差異;

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論