SPSS聚類分析--用于篩選聚類變量的一套方法_第1頁(yè)
SPSS聚類分析--用于篩選聚類變量的一套方法_第2頁(yè)
SPSS聚類分析--用于篩選聚類變量的一套方法_第3頁(yè)
SPSS聚類分析--用于篩選聚類變量的一套方法_第4頁(yè)
SPSS聚類分析--用于篩選聚類變量的一套方法_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS聚類分析:用于篩選聚類變量的一套方法來(lái)源:數(shù)據(jù)小兵聚類分析是常見的數(shù)據(jù)分析方法之一,主要用于市場(chǎng)細(xì)分、用戶細(xì)分等領(lǐng)域。利用SPSS進(jìn)行聚類分析時(shí),用于參與聚類的變量決定了聚類的結(jié)果,無(wú)關(guān)變量有時(shí)會(huì)引起嚴(yán)重的錯(cuò)分, 因此,篩選有效的聚類變量至關(guān)重要。案例數(shù)據(jù)源:在SPSS自帶數(shù)據(jù)文件 plastic.sav中記錄了 20中塑料的三個(gè)特征, 分別是tear_res (抗拉 力)、gloss (光滑度)、opacity (透明度),相關(guān)經(jīng)驗(yàn)表面這 20中塑料可以分為3個(gè)種 類,如果用這三個(gè)變量進(jìn)行聚類,請(qǐng)判斷和篩選有效聚類變量。一套篩選聚類變量的方法盲選、初步方差均值多線進(jìn)入z聚類分析描述均

2、值總盲詵貢獻(xiàn)量分可視化結(jié)果一、盲選將根據(jù)經(jīng)驗(yàn)得到的、現(xiàn)有的備選聚類變量全部納入模型,暫時(shí)不考慮某些變量是否不合適。本案例采用SPSS系統(tǒng)聚類方法。對(duì)話框如下統(tǒng)計(jì)量選項(xiàng)卡:聚類成員選擇單一方案,聚類數(shù)輸入數(shù)字3;繪制選項(xiàng)卡:勾選樹狀圖;方法選項(xiàng)卡:默認(rèn)選項(xiàng),不進(jìn)行標(biāo)準(zhǔn)化;保存選項(xiàng)卡:聚類成員選擇單一方案,聚類數(shù)輸入數(shù)字3 ;、初步聚類 這是盲選得到的初步聚類結(jié)果, 并且在數(shù)據(jù)視圖我們可以看到已經(jīng)自動(dòng)生成了一個(gè)聚類結(jié)果 變量,這個(gè)變量非常有用。Dendrogram using Average Linkage Between Groups)Rescaled Ditince Cluster Combi

3、ne51D15202512 1211S813 13151514 1420 205571A15 191111S9£61717521Q101B1916 16、方差分析是不是每一個(gè)納入模型的聚類變量都對(duì)聚類過(guò)程有貢獻(xiàn)?利用已經(jīng)生成的初步聚類結(jié)果,我們可以用一個(gè)單因素方差分析來(lái)判斷分類結(jié)果在三個(gè)變量上的差異是否顯著,進(jìn)而判斷哪些 變量對(duì)聚類是沒(méi)有貢獻(xiàn)的。tA單西養(yǎng)方差分析分析一一比較均值一一單因素方差分析:選項(xiàng)選項(xiàng)卡:勾選均值圖ANOVASum ofSquaresdfMean SquareFL冒呷和吃Between GroupsWithin GroupsTotal55.26017.S4574

4、J0S2171926 1301.05526 弓49.000耳:問(wèn)笛Between GroupsWithin GroupsTotal039S.04B5,06521719.019.297053Wi力 Between GroupsWithin GroupsTotal1204 145+.266217伯060.244.247.7S4I1由方差分析我們很明確的得知,納入模型的三個(gè)聚類變量,其中只有“透明度”指標(biāo)在各個(gè)分類上有顯著的差異, 也就是說(shuō)分類有效果, 讓每個(gè)分類的差異很大, 而兩外兩個(gè)變量則在 三個(gè)分類上沒(méi)有顯著差異,沒(méi)有很好的類別區(qū)分度,所以,我們可以認(rèn)為,這兩個(gè)變量對(duì)聚 類無(wú)作用或者無(wú)貢獻(xiàn),可

5、考慮踢出模型。我們還想從可視化的角度來(lái)查看和判斷,單因素方差分析為我們提供了均值圖,可惜,這三個(gè)圖卻最容易誤導(dǎo)我們的判斷,因?yàn)镾PSS在自動(dòng)生產(chǎn)均值圖時(shí)為每一個(gè)變量單獨(dú)制圖,而且分配不同的縱軸坐標(biāo), 導(dǎo)致每個(gè)圖看起來(lái)都有非常大的差異,從視覺(jué)上迷惑我們做出錯(cuò)誤的判斷。AwfeUf*&aiif 邛這里需要改進(jìn)!四、均值描述為改進(jìn)以上SPSS默認(rèn)選項(xiàng)的不足之處,我們需要自己生成三個(gè)變量在不同類別上的均值, means過(guò)程可以幫助到我們。從數(shù)字上來(lái)看,抗拉力(6.8、6.7、7.1 )、光滑度(9.3、9.4、9.2 )兩個(gè)指標(biāo)在三個(gè)類別 上并沒(méi)有多大的差異,而對(duì)聚類有貢獻(xiàn)的透明度指標(biāo)在不同類

6、別上區(qū)分度非常明顯。ReportAverage 口恥護(hù) Between Groups)r a_ ri V啟底透明度16.7869 3002 88626.7209.3605.93037.1009 2006400Total6.7859.315I3.935五、多線均值圖也就是制作一個(gè)多線均克服縱軸刻度的方法是將這三個(gè)指標(biāo)放在同一個(gè)坐標(biāo)軸上進(jìn)行對(duì)比,值圖。10.0D-光滑慣-抗扭力J.uO-斗.'?0-2.00D.L-012類別此時(shí),結(jié)果已經(jīng)一目了然了。綜上,我們可以將抗拉力、 光滑度兩個(gè)指標(biāo)從模型中剔除,只留下透明度一個(gè)指標(biāo)再進(jìn)行聚 類。序號(hào)1tear_resglossopacityCLU3_1Cl IT 7-46.59.64 11166.59.2r ,.6116699 1&72277210.02 011e&.99.93.91196.19.51911106.3945722116.79 12 811126.69.34 11113728.33 811147.18化611156.S3.53.411157.19.28 433V70a a5 222107.29.76922197.610 12.71120769.21 911我們發(fā)現(xiàn),前

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論