《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第1頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第2頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第3頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第4頁
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》課后練習(xí)答案(第10章)_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)(薛薇)課后練習(xí)答案第10章SPSS的聚類分析1、根據(jù)“高??蒲醒芯?sav”數(shù)據(jù),利用層次聚類分析對各省市的高??蒲星闆r進(jìn)行層次聚類分析。要求:1) 根據(jù)凝聚狀態(tài)表利用碎石圖對聚類類數(shù)進(jìn)行研究。2) 繪制聚類樹形圖,說明哪些省市聚在一起。3) 繪制各類的科研指標(biāo)的均值對比圖。4) 利用方差分析方法分析各類在哪些科研指標(biāo)上存在顯著差異。采用歐氏距離,組間平均鏈鎖法利用凝聚狀態(tài)表中的組間距離和對應(yīng)的組數(shù),回歸散點(diǎn)圖,得到碎石圖。大約聚成4類。步驟:分析分類系統(tǒng)聚類按如下方式設(shè)置 結(jié)果:凝聚計(jì)劃階段組合的集群系數(shù)首次出現(xiàn)階段集群下一個(gè)階段集群 1集群 2集群 1集

2、群 212630328.18900222629638.295107320251053.42300544121209.922001558201505.03503668161760.170509724261831.926021087111929.89100119582302.02406221024312487.209702211272709.88708161222282897.1060019136232916.55100171410193280.7520025154213491.585402116234229.37511021176134612.42313020189185377.25300251

3、914225622.41501224206155933.5181702321246827.276161526225247930.76591024236279475.498200262451414959.7042219282591019623.050181427262624042.6692123282791732829.46625029282548360.854262429292991313.5302827303012.5030290將系數(shù)復(fù)制下來后,在EXCEL中建立工作表。選中數(shù)據(jù)列,點(diǎn)擊“插入”菜單拆線圖 碎石圖:由圖可知,北京自成一類,江蘇、廣東、上海、湖南、湖北聚成一類。其他略。接下來

4、,添加一個(gè)變量CLU4_1,其值為類別值。(1、2、3、4),再數(shù)據(jù)匯總設(shè)置確定。均值對比,依據(jù)聚類解,利用分類匯總,計(jì)算各個(gè)聚類變量的均值方差分析結(jié)果:分析比較均值單因素ANOVA設(shè)置確定ANOVA平方和df均方F顯著性投入人年數(shù)組之間.1963.73226.428.000組內(nèi).15927.858總計(jì).35530投入高級職稱的人年數(shù)組之間.8203.27334.553.000組內(nèi).14727.783總計(jì).96830投入科研事業(yè)費(fèi)(百元)組之間0.8843.628324.318.000組內(nèi).79427.474總計(jì)7.67730課題總數(shù)組之間.5643.85532.181.000組內(nèi).43627

5、.720總計(jì).00030專著數(shù)組之間.3853.12861.327.000組內(nèi).8092739154.363總計(jì).19430論文數(shù)組之間.2193.74017.693.000組內(nèi).71727.915總計(jì).93530獲獎(jiǎng)數(shù)組之間.049356627.3503.619.026組內(nèi).7902715645.807總計(jì).83930不同組在各個(gè)聚類變量上的均值均存在顯著差異。2、試說明當(dāng)變量存在數(shù)量級上的差異,進(jìn)行層次聚類分析時(shí)為什么要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理?因?yàn)閿?shù)量級將對距離產(chǎn)生較大影響,并影響最終聚類結(jié)果。3、 試說明變量之間的高度相關(guān)性是否會對層次聚類分析結(jié)果造成影響?為什么?會。如果所選變量之間存在

6、較強(qiáng)的線性關(guān)系,能夠相互替代,在計(jì)算距離時(shí)同類變量將重復(fù)“貢獻(xiàn)”,占有較高權(quán)重,而使最終的聚類結(jié)果偏向該類變量。4、 試說明K-Mean聚類分析的基本步驟。K-Means聚類分析步驟:確定聚類數(shù)目K-確定K個(gè)初始類中心點(diǎn)-根據(jù)距離最近原則進(jìn)行分類-重新確定K個(gè)類中心點(diǎn)-判斷是否已經(jīng)滿足終止條件。是一個(gè)反復(fù)迭代的分類過程。在聚類過程中,樣本所屬的類會不斷調(diào)整,直至達(dá)到最終穩(wěn)定為止。5、收集到我國2007年各地區(qū)城鎮(zhèn)居民家庭平均每人全年消費(fèi)支出數(shù)據(jù),數(shù)據(jù)文件名為:“消費(fèi)結(jié)構(gòu).sav”, 變量包括:地區(qū)、消費(fèi)性支出總額、食品、衣著、居住、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通和通信、教育文化娛樂服務(wù)、醫(yī)

7、療保健、雜項(xiàng)商品和服務(wù)支出。若采用層次聚類法(個(gè)體間距離定義為平方歐氏距離,類間距離定義為組間平均鏈鎖距離),繪制的碎石圖如下:(1)依據(jù)上圖,數(shù)據(jù)聚成幾類較為恰當(dāng)?(2)試采用K-MEANS聚類方法,從類內(nèi)相似性和類間差異性角度分析將數(shù)據(jù)聚成幾類較為恰當(dāng)。(1)聚成3類較為恰當(dāng)。注:碎石圖可按第9章第1題方式繪制,也可按如下方式繪制。步驟:分析降維因子分析導(dǎo)入全部變量到變量框中(地區(qū)變量除外)抽?。哼x中碎石圖繼續(xù)確定。得到:(可以看出,分成3類恰當(dāng))(2)用K-MEANS聚類方法進(jìn)行分類,比較分類數(shù)為2、3、4時(shí)的差別。步驟:分析分類K-平均聚類地區(qū)變量導(dǎo)入到標(biāo)注個(gè)案,其他變量全部導(dǎo)入到變量

8、框中聚類數(shù)填2選項(xiàng):選中初始聚類中心和ANOVA繼續(xù)確定。得到:ANOVA聚類錯(cuò)誤F顯著性均方df均方df食品.9671.7792956.445.000衣著.565137555.425297.422.011居住.436131940.7642920.901.000家庭設(shè)備用品及服務(wù).258114558.0412928.277.000醫(yī)療保健.302134400.296299.456.005交通和通信.457157486.40029178.922.000教育文化娛樂服務(wù).465169080.9332975.656.000雜項(xiàng)商品和服務(wù).93116496.5502938.222.000僅當(dāng)出于描述目

9、的時(shí)才應(yīng)該使用 F 檢驗(yàn),因?yàn)橐堰x擇聚類用于將不同聚類中的個(gè)案的差異最大化。 受觀察的顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設(shè)的檢驗(yàn)。每個(gè)聚類中的個(gè)案數(shù)量聚類14.000227.000有效31.000缺失.000將上圖中的聚類數(shù)修改為3,則得到:ANOVA聚類錯(cuò)誤F顯著性均方df均方df食品.5092.7702852.178.000衣著.509241645.317282.422.107居住.147216508.6902834.274.000家庭設(shè)備用品及服務(wù).836212833.0272818.488.000醫(yī)療保健.996233054.746286.011

10、.007交通和通信.064290458.7482852.067.000教育文化娛樂服務(wù).304267059.9262839.905.000雜項(xiàng)商品和服務(wù).66624829.5552831.213.000僅當(dāng)出于描述目的時(shí)才應(yīng)該使用 F 檢驗(yàn),因?yàn)橐堰x擇聚類用于將不同聚類中的個(gè)案的差異最大化。 受觀察的顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設(shè)的檢驗(yàn)。每個(gè)聚類中的個(gè)案數(shù)量聚類11.000225.00035.000有效31.000缺失.000將上圖中的聚類數(shù)修改為4,則得到:ANOVA聚類錯(cuò)誤F顯著性均方df均方df食品.597362963.25127102.61

11、9.000衣著.013335623.106273.799.022居住.271332618.140277.288.001家庭設(shè)備用品及服務(wù).914315077.322279.435.000醫(yī)療保健.289336553.186273.064.045交通和通信.324343056.2632783.536.000教育文化娛樂服務(wù).568366335.5862727.329.000雜項(xiàng)商品和服務(wù)97486.29135342.7412718.246.000僅當(dāng)出于描述目的時(shí)才應(yīng)該使用 F 檢驗(yàn),因?yàn)橐堰x擇聚類用于將不同聚類中的個(gè)案的差異最大化。 受觀察的顯著性級別并未因此得到更正,所以無法將這些級別解釋為“聚類方法是等同的”假設(shè)的檢驗(yàn)。每個(gè)聚類中的個(gè)案數(shù)量聚類11.00023.000315.000412.000有效31.000缺失.000從3個(gè)ANOVA表可以看出,分為2類時(shí),P-值均小于0.05,表明有顯著差異;分為3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論