




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
./實驗指導之一聚類分析的SPSS操作方法系統(tǒng)聚類法實驗例城鎮(zhèn)居民消費水平通常用下表中的八項指標來描述。八項指標間存在一定的線性相關。為研究城鎮(zhèn)居民的消費結構,需將相關性強的指標歸并到一起,這實際上就是對指標聚類。實驗數(shù)據(jù)表20XX30個省。市,自治區(qū)城鎮(zhèn)居民月平均消費數(shù)據(jù)x1人均糧食支出<元/人>x5人均衣著商品支出<元/人>x2人均副食支出<元/人>x6人均日用品支出<元/人>x3人均煙、酒、茶支出<元/人>x7人均燃料支出<元/人>x4人均其他副食支出<元/人>x8人均非商品支出<元/人>x1x2x3x4x5x6x7x8北京7.7848.448.0020.5122.1215.731.1516.61天津10.8544.687.3214.5117.1312.081.2611.57河北9.0928.127.409.6217.2611.122.4912.65山西8.3523.537.518.6217.4210.001.0411.219.2523.756.619.1917.7710.481.7210.51遼寧7.9039.778.4912.9419.2711.052.0413.29吉林8.1930.504.729.7816.287.602.5210.327.7329.205.429.4319.298.492.5210.00上海8.2864.348.0022.2220.0615.520.7222.89江7.2145.797.6610.3616.5612.862.2511.69浙江7.6850.3711.3513.3019.2514.592.7514.87安徽8.1437.759.618.4913.159.761.2811.28福建10.6052.417.709.9812.5311.702.3114.69江西6.2535.024.726.2810.037.151.9310.39山東8.8233.707.5910.9818.8214.731.7810.10河南9.4227.938.208.1416.179.421.559.76湖北8.6736.057.317.7516.6711.682.3812.88湖南6.7738.696.018.8214.7911.441.7413.23廣東12.4776.395.5211.2414.5222.005.4625.50廣西7.2752.653.849.1613.0315.261.9814.57海南13.4555.855.507.459.559.522.2116.30四川7.1840.917.328.9417.6012.751.1414.80貴州7.6735.718.048.3115.137.761.4113.25云南9.9837.697.018.9416.1511.080.8311.67西藏7.9439.6520.9720.8222.5212.411.757.90陜西9.4128.205.7710.8016.3611.561.5312.17甘肅9.1627.989.019.3215.999.101.8211.35青海10.0628.6410.5210.0516.188.391.9610.81寧夏8.7028.127.2110.5319.4513.301.6611.96新疆6.9329.854.549.4916.6210.651.8813.61系統(tǒng)聚類法的SPSS操作:1.從數(shù)據(jù)編輯窗口點擊Analyze→Classify→HierachicalCluster,〔見圖1圖1系統(tǒng)聚類法打開層次聚類法對話如圖2。圖2系統(tǒng)聚類法對話框選擇需要進行聚類分析的變量進入Variable框后,在Cluster欄中選擇聚類類型,SPSS有兩種層次聚類方法:Cases對樣品聚類〔Q型;系統(tǒng)默認,Variable對指標變量聚類<R型,本例選擇。在Display欄中選擇默認的輸出項。2.點擊Statistics按鈕,打開對話框如圖3.圖3Statistics對話框Agglomerationschedule輸出凝聚狀態(tài)表〔聚類進度表;本例選擇。Ploximitymatrix輸出個體間的距離矩陣,本例選擇。ClusterMembership欄中顯示每個觀測量被分派到的類。None不輸出。本例選擇。Simplesolution指定分類數(shù),并輸出樣本所屬類,單一解。Rengeofsolution指定輸出從m到n類的各樣本所屬類。多個解。選好后返回主對話框。3.單擊Method按鈕,打開對話框如圖4-1.ClusterMethod:選擇聚類方法:SPSS中提供7種聚類方法,分別是:類間平均,類平均,最短距離,最長距離,重心法,中值法,最小平方和法。本例選擇類間平均。Measure欄:對距離的測度方法選擇SPSS中提供了三種類型:Interval等間距度量的變量〔連續(xù)型,Counts計數(shù)型變量〔離散型和Binary二值變量。Interval等間隔測度的變量方法包括:Euclideandistance歐氏距離;SquaredEuclideandistance歐氏平方距離;Cosine夾角余弦〔R型聚類;PearsonCorrelation皮爾遜相關系數(shù)距離〔R型聚類,本例選擇此項。Chebychev契比雪夫距離;block距離;Minkowski明氏距離;Customized用戶自定義距離--即變量絕對值的第p次冪之和的第r次根。p與r由用戶指定。圖4-1Method對話框TransformValues欄,選擇消除數(shù)量級差的方法〔見圖4-2,依次是:None不作處理〔系統(tǒng)默認;本例選擇此項。Zscores標準化處理;Range-1to1各變量值除全距;Range0to1各變量值減最小值后除全距;Maximummagnitudeof1各變量值除最大值;Meanof1各變量值除以均值;Standarddeviationof1各變量值除以標準差。圖4-2Method對話框4.單擊Plots按鈕,打開對話框如圖5.圖5Plots對話框Dendrogram表示輸出樹形圖,本例選擇此項。Icicle表示輸出冰柱圖。其中,Allclusters表示輸出聚類分析每個階段的冰柱圖;本例選擇此項。Specifiedrangeofcluster表示只輸出某個階段的冰柱圖,輸入從第幾步開始到第幾步結束,中間間隔幾步。Orientationk欄中指定如何顯示冰掛圖:Vertical縱向顯示,本例選擇此項。Horizontal橫向顯示。圖6SaveNewVariables對話框5.單擊Save按鈕,打開SaveNewVariables對話框,如圖6所示。選擇是否將聚類的結果以變量形式保存在數(shù)據(jù)文件中。變量名為:clun_m,其中n表示類數(shù),m表示第m次分析。ClusterMembership欄None不輸出Simplesolution指定分類數(shù),并輸出樣本所屬類。單一變量。Rengeofsolution指定輸出從m到n類的各樣本所屬類。多個變量。當選擇結束后,在主對話框中點擊OK,可得下面的輸出表和圖。ProximityMatrix兩兩變量間距離矩陣〔相關系數(shù)矩陣CaseMatrixFileInput人均糧食支出〔元/人人均副食支出<元/人>人均煙、酒、茶支出<元/人>人均其他副食支出<元/人>人均衣著商品支出<元/人>人均日用品支出<元/人>人均燃料支出<元/人>人均非商品支出<元/人>人均糧食支出〔元/人.000.334-.055-.061-.289.197.349.319人均副食支出<元/人>.334.000-.023.399-.156.716.414.835人均煙、酒、茶支出<元/人>-.055-.023.000.533.497.033-.139-.258人均其他副食支出<元/人>-.061.399.533.000.698.478-.171.313人均衣著商品支出<元/人>-.289-.156.497.698.000.284-.208-.081人均日用品支出<元/人>.197.716.033.478.284.000.408.710人均燃料支出<元/人>.349.414-.139-.171-.208.408.000.399人均非商品支出<元/人>.319.835-.258.313-.081.710.399.000AverageLinkage<BetweenGroups>類間平均AgglomerationSchedule凝聚狀態(tài)進度表;StageClusterCombinedCoefficientsStageClusterFirstAppearsNextStageCluster1Cluster2Cluster1Cluster2128.835002226.713105345.698004434.515037527.407206612.299057713.004640凝聚狀態(tài)進度表:第一列<Stage>表示聚類的進度順序;第二、三列<Clustercombine>表示每一步將哪兩類合并;第四列<Cofficients>表示被合并的兩類之間的距離;第五、六列<StageClusterFirstAppares>表示被合并的兩類上一次合并分別是在哪一步形成的。0表示被合并的類為單個樣品。最后一列<NextStage>表示每一步形成的新類將在哪一步參與下一次合并。VerticalIcicle冰柱圖NumberofclustersCase人均衣著商品支出<元/人>人均其他副食支出<元/人>人均煙、酒、茶支出<元/人>人均燃料支出<元/人>人均日用品支出<元/人>人均非商品支出<元/人>人均副食支出<元/人>人均糧食支出〔元/人1XXXXXXXXXXXXXXX2XXXXXXXXXXXXXX3XXXXXXXXXXXXX4XXXXXXXXXXXX5XXXXXXXXXXX6XXXXXXXXXX7XXXXXXXXXDendrogram表示輸出樹形圖〔譜分析圖******HIERARCHICALCLUSTERANALYSIS******DendrogramusingAverageLinkage<BetweenGroups類間平均>RescaledDistanceClusterCombineCASE0510152025LabelNum++++++X22X88X66X77X11X44X55X33二:K-聚類法的具體操作以例10.4為例,說明快速聚類法的操作過程。1.在數(shù)據(jù)窗口單擊Analyze→Classify→K-MeanCluster打開對話框〔見圖7圖7K-MeansClusterAnalysis對話框將變量選入Variables欄;將標識變量選入LabelCases欄〔可省略將分類數(shù)輸入Numberof框〔系統(tǒng)默認為2,本例中選擇4.Method欄聚類方法欄Iterateandclassify〔按K-means算法疊代分類〔系統(tǒng)默認。Classifyonly僅按初始類別中心點分類〔不疊代。Centers類中心數(shù)據(jù)的輸入與輸出〔可省略Readinitialfrom使用指定數(shù)據(jù)文件中的數(shù)據(jù)作為初始類中心〔文件格式參考Writefinalas文件格式選擇Writefinalas把聚類結果中的各類中心數(shù)據(jù)保存到指定的文件。本例中選擇系統(tǒng)默認項。2.單擊Iterate按鈕,打開Iterate對話框如圖8所示:MaximumIterations限定K-Means算法的迭代次數(shù),系統(tǒng)默認值10ConvergenceCriterion-指定限定收斂標準,系統(tǒng)默認值為0。Userunningmeans限定在每個觀測量被分配到一類后即刻計算新的類中心,不選此項表示只有當全部樣本的類分配完后再計算類中心,可以節(jié)省運算時間,所以一般情況下不選擇此項。本例中選擇默認項。圖8Iterate對話框3.單出Save按鈕,打開Save對話框見圖9.ClusterMember在原數(shù)據(jù)文件中保存分類結果〔本例選擇。Distancefromclustercenter在原數(shù)據(jù)文件中保存各觀測量距所屬類中心間的歐氏距離。圖9Save對話框4.單擊Options按鈕,打開Options對話框見圖10。Statistics欄Initialclustercenters輸出初始類中心。ANOVAtable輸出方差分析表Clusterinformationforeachcase每個觀測量的分類信息<分類結果和該觀測量距所屬類中心的距離等圖10Options對話框MissingValues欄Excludecaseslistwise將出現(xiàn)在Variables變量表中變量帶有缺失值得觀測量從分析中剔除〔系統(tǒng)默認Excludecasespairwise只有當一個觀測量的全部聚類變量值均缺失時才將其從分析中剔除,否則根據(jù)所有其他非缺失變量值把它分配到最近的一類中去。全部選擇完成后得到輸出結果。InitialClusterCenters初始類中心Cluster1234x1人均糧食支出〔元/人21.3023.6825.5619.07x2人均副食支出〔元/人124.89173.30171.6573.18x3人均煙、酒、飲料支出〔元/人35.4317.4322.3018.01x4人均其他副食支出〔元/人73.9843.5940.5329.38x5人均衣著支出〔元/人93.0153.6657.1364.51x6人均日用雜品支出〔元/人20.5816.8612.608.91x7人均水電燃料支出〔元/人43.9765.0254.0338.14x8人均其他非商品支出〔元/人433.73385.94225.08155.45IterationHistorya迭代過程表IterationChangeinClusterCenters1234129.250.00038.95025.3212.000.0008.4152.4043.000.000.000.000a.Convergenceachievedduetonoorsmallchangeinclustercenters.Themaximumabsolutecoordinatechangeforanycenteris.000.Thecurrentiterationis3.Theminimumdistancebetweeninitialcentersis88.803.ClusterMembership〔聚類結果CaseNumber地區(qū)ClusterDistance1北京129.2502天津357.2953河北413.0144山西430.5285434.5116遼寧437.3507吉林420.5208421.3969上海129.12810江314.37111浙江130.02312安徽435.51913福建345.00514江西432.83415山東433.83916河南425.20617湖北413.68918湖南336.63719廣東2.00020廣西445.45321海南467.00422重慶319.28923四川424.56724貴州427.32625云南426.22826西藏361.06627陜西428.34828甘肅420.17529青海417.87430寧夏422.44831新疆418.804聚類結果中的第四列顯示的是各樣本與其所屬類的中心之間的距離。上述結果可通過"save"按鈕設置,保存至原始數(shù)據(jù)文件中。FinalClusterCenters類中心Cluster1234x1人均糧食支出〔元/人20.8023.6822.2919.72x2人均副食支出〔元/人145.27173.30131.3891.46x3人均煙、酒、飲料支出〔元/人39.8617.4331.6420.63x4人均其他副食支出〔元/人64.9543.5944.1933.93x5人均衣著支出〔元/人89.7053.6665.4859.43x6人均日用雜品支出〔元/人16.3216.8613.069.96x7人均水電燃料支出〔元/人49.4465.0242.4838.91x8人均其他非商品支出〔元/人417.01385.94234.53171.13ANOVA方差分析表ClusterErrorFSig.MeanSquaredfMeanSquaredfx1人均糧食支出〔元/人14.17035.710272.482.082x2人均副食支出〔元/人5809.6463474.0872712.254.000x3人均煙、酒、飲料支出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2019-2025年消防設施操作員之消防設備基礎知識模擬考試試卷A卷含答案
- 2019-2025年消防設施操作員之消防設備中級技能題庫練習試卷B卷附答案
- 2019-2025年消防設施操作員之消防設備基礎知識題庫練習試卷A卷附答案
- 人民防空知識培訓課件
- 酒店推廣傭金合同(2篇)
- 采購分包付款合同(2篇)
- 宮頸癌疫苗知識培訓課件
- 2025年愛國知識競賽題及答案(67題)
- 文化遺產保護與傳承合作協(xié)議
- 細胞制備服務合作協(xié)議
- GB/T 23111-2008非自動衡器
- GB/T 18877-2020有機無機復混肥料
- GA/T 1073-2013生物樣品血液、尿液中乙醇、甲醇、正丙醇、乙醛、丙酮、異丙醇和正丁醇的頂空-氣相色譜檢驗方法
- 三大構成之立體構成-課件
- 最新家政服務員培訓課件
- TB T2075-《電氣化鐵道接觸網(wǎng)零部件》
- NB∕T 10730-2021 煤礦井下斷層導水性探查與治理技術規(guī)范
- 科學儀器設備分類編碼表
- 分布式光伏電站現(xiàn)場勘查表
- 2019年健康體檢結果調查分析報告
- 新版理念篇-養(yǎng)老課件
評論
0/150
提交評論