




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、聚類分析聚類分析- 聚類分析是用多元統(tǒng)計技術進行分類的一種方法,聚類分析是用多元統(tǒng)計技術進行分類的一種方法, 其中類是指其中類是指相似相似元素的集合。元素的集合。 聚類分析基本概念如何衡量如何衡量相似相似程度?程度? 距離:相似程度越大,相當于距離越短距離:相似程度越大,相當于距離越短 包括點間距離和類間距離。包括點間距離和類間距離。 類間距離是根據(jù)點間距離來確定的,如兩類的最近點之間、最類間距離是根據(jù)點間距離來確定的,如兩類的最近點之間、最遠點之間、中心點之間的距離均可以定義為類間距離。遠點之間、中心點之間的距離均可以定義為類間距離。 聚類分析中距離算法 (1) (1)歐氏距離歐氏距離 歐氏
2、距離基于勾股定理,可以很容易推廣到三個以上變量。對歐氏距離基于勾股定理,可以很容易推廣到三個以上變量。對于于n n個變量,個變量,21()nijkikjkdxx (2) (2)閔閔( (明明) )氏距離氏距離11( )()nqqijkikjkdqxxq=0,閔氏距離,閔氏距離 同歐氏距離同歐氏距離 缺點:距離大小和各指標觀測單位有關缺點:距離大小和各指標觀測單位有關 沒有考慮指標間的相關性沒有考慮指標間的相關性 SPSS中聚類功能 ( (1) )非系統(tǒng)聚類法非系統(tǒng)聚類法 快速聚類法快速聚類法kk值聚類法值聚類法( (K-Means Cluster) ) ( (2) )系統(tǒng)聚類法系統(tǒng)聚類法 分層
3、聚類法分層聚類法( (Hierarchical Cluster過程過程) ) 樣本聚類樣本聚類( (Q型型) )、變量聚類、變量聚類( (R型型) ) ( (3) )其他聚類方法其他聚類方法 分解聚類法、動態(tài)聚類法、降維法及圖法、分解聚類法、動態(tài)聚類法、降維法及圖法、 有序樣品聚類等有序樣品聚類等 K-Means Cluster K-Means Cluster過程可完成由用戶指定類別數(shù)的大樣本資料的過程可完成由用戶指定類別數(shù)的大樣本資料的逐步聚類分析。所謂逐步聚類分析就是先把被聚對象進行初始分類,逐步聚類分析。所謂逐步聚類分析就是先把被聚對象進行初始分類,然后逐步調整,直到得到最終分類。然后逐
4、步調整,直到得到最終分類。 原理:原理: (1)選擇選擇n個數(shù)值型個數(shù)值型觀測量觀測量,確定最后的,確定最后的聚類數(shù)聚類數(shù)k (2)由系統(tǒng)選擇由系統(tǒng)選擇(也可由用戶指定也可由用戶指定)k個觀測量作為初始聚心個觀測量作為初始聚心 (3)計算歐氏距離計算歐氏距離(距離最小的原則距離最小的原則)把所有觀測量選入把所有觀測量選入k個類中個類中 (4)重新計算每個類中的均值,作為第二次迭代的聚心重新計算每個類中的均值,作為第二次迭代的聚心 (5)然后根據(jù)這個聚心重復第三、第四步驟,直到兩次迭代計算然后根據(jù)這個聚心重復第三、第四步驟,直到兩次迭代計算的聚心之間距離的最大改變量小于初始聚心之間最小距離的倍數(shù)
5、時,的聚心之間距離的最大改變量小于初始聚心之間最小距離的倍數(shù)時,或者是達到迭代次數(shù)的上限時,停止迭代。或者是達到迭代次數(shù)的上限時,停止迭代。 K-Means Cluster- K-Means Cluster激活數(shù)據(jù)管理窗口激活數(shù)據(jù)管理窗口定義變量名定義變量名 K-Means Cluster數(shù)據(jù)輸入數(shù)據(jù)輸入 K-Means Cluster數(shù)據(jù)標準化處理數(shù)據(jù)標準化處理 K-Means Cluster查看描述統(tǒng)計量查看描述統(tǒng)計量 K-Means Cluster數(shù)據(jù)儲存數(shù)據(jù)儲存 K-Means Cluster打開打開“分析分析”菜單菜單選選“分類分類”中的中的“k-k-均值聚類均值聚類”項項 K-Me
6、ans Cluster觀測量觀測量選擇選擇“迭代與分類迭代與分類”所有輸入量所有輸入量聚類數(shù)聚類數(shù)k=5k=5 K-Means Cluster確定確定“最大迭代次數(shù)最大迭代次數(shù)”確定確定“收斂標準值收斂標準值” K-Means Cluster存儲最終結果輸出情況,存儲最終結果輸出情況,在數(shù)據(jù)文件中在數(shù)據(jù)文件中(QCL-1/QCL-2)(QCL-1/QCL-2) K-Means Cluster初始聚心選項初始聚心選項輸出方差分析表輸出方差分析表 K-Means Cluster初始聚類中心表初始聚類中心表 K-Means Cluster K-Means Cluster方差分析表方差分析表 K-Me
7、ans Cluster K-Means Cluster聚類結果:聚類結果: K-Means Cluster具體城市聚類結果具體城市聚類結果QCL-1QCL-1說明聚類結果,說明聚類結果,QCL-2QCL-2說明聚類的長度情況說明聚類的長度情況 Hierarchical Cluster 系統(tǒng)聚類法系統(tǒng)聚類法( (分層聚類法分層聚類法) ) 樣本聚類樣本聚類( (Q型型) )、變量聚類、變量聚類( (R型型) ) 開始時,有多少點就是多少類,第一步先把最近的兩個點合并開始時,有多少點就是多少類,第一步先把最近的兩個點合并成一類,然后再把剩下的最近的兩類合并成一類,這樣每次都少一成一類,然后再把剩下
8、的最近的兩類合并成一類,這樣每次都少一類,直到最后只有一大類為止,越是后來合并的類距離越遠。類,直到最后只有一大類為止,越是后來合并的類距離越遠。 優(yōu)點:既可以對觀測量優(yōu)點:既可以對觀測量( (樣本樣本) ),也可以對變量進行聚類,既可,也可以對變量進行聚類,既可以是連續(xù)變量也可以是分類變量。以是連續(xù)變量也可以是分類變量。Hierarchical Cluster (Q Q型型)- Hierarchical Cluster (Q Q型型)激活數(shù)據(jù)管理窗口激活數(shù)據(jù)管理窗口定義變量名定義變量名數(shù)據(jù)輸入數(shù)據(jù)輸入 Hierarchical Cluster (Q Q型型)數(shù)據(jù)標準化處理數(shù)據(jù)標準化處理 Hi
9、erarchical Cluster (Q Q型型)查看描述統(tǒng)計量查看描述統(tǒng)計量 Hierarchical Cluster (Q Q型型)數(shù)據(jù)儲存數(shù)據(jù)儲存 Hierarchical Cluster (Q Q型型)打開打開“分析分析”菜單菜單選選“分類分類”中的中的“系統(tǒng)聚類系統(tǒng)聚類”項項 Hierarchical Cluster (Q Q型型)觀測量觀測量所有輸入量所有輸入量選擇個案聚類選擇個案聚類輸出統(tǒng)計量和圖像輸出統(tǒng)計量和圖像 Hierarchical Cluster (Q Q型型)選擇“合并進程表”和“相似性矩陣”選項 Hierarchical Cluster (Q Q型型)選擇圖像輸出
10、“樹狀圖”選項 Hierarchical Cluster (Q Q型型)SPSS提供了7種類間距離的測量方法1、組間鏈接法2、組內(nèi)鏈接法3、最近距離法4、最遠距離法5、重心法6、中間距離法7、Ward最小偏差平 方和法SPSS提供了8種距離度量標準1、Euclidean 距離2、Euclidean 距離平方3、Cosine 距離4、Pearson 相關距離5、Chebychev 距離6、City-Block 距離7、Minkowski 距離8、自定義距離 Hierarchical Cluster (Q Q型型) Hierarchical Cluster (Q Q型型) Hierarchical
11、 Cluster (Q Q型型)觀測量描述表 Hierarchical Cluster (Q Q型型) Hierarchical Cluster (Q Q型型) Hierarchical ClusterHierarchical Cluster (R R型型)- Hierarchical Cluster (R R型型)選擇變量聚類 Hierarchical Cluster (R R型型) Hierarchical Cluster (R R型型) Hierarchical Cluster (R R型型) Hierarchical Cluster聚類方法選擇組間聯(lián)接度量方法選擇Pearson相關性 Hierarchical Clus
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國絕緣制品市場十三五規(guī)劃與投資戰(zhàn)略研究報告
- 2025-2030年中國紅木市場競爭格局及發(fā)展趨勢分析報告
- 2025-2030年中國精密減速器市場發(fā)展現(xiàn)狀及前景趨勢分析報告
- 2025-2030年中國碲行業(yè)運行狀況及發(fā)展趨勢分析報告
- 2025年遼寧省安全員C證考試(專職安全員)題庫附答案
- 2025-2030年中國皮帶輸送機市場運行狀況及發(fā)展前景分析報告
- 2025-2030年中國電解銅行業(yè)發(fā)展?jié)摿σ?guī)劃研究報告
- 重慶郵電大學《電腦輔助設計》2023-2024學年第二學期期末試卷
- 成都信息工程大學《藝用人體解剖學》2023-2024學年第二學期期末試卷
- 泰山學院《財政政策與貨幣政策》2023-2024學年第二學期期末試卷
- 義務教育物理課程標準(2022年版word版)
- 研學旅行概論教學課件匯總完整版電子教案
- 12月腹痛護理常規(guī)
- 控股集團公司組織架構圖.docx
- 高爐煤氣安全知識的培訓
- 2008 年全國高校俄語專業(yè)四級水平測試試卷
- 需求供給與均衡價格PPT課件
- 最常用2000個英語單詞_(全部標有注釋)字母排序
- 在銀行大零售業(yè)務工作會議上的講話講解學習
- 古代傳說中的藝術形象-
- 水電站大壩土建安裝工程懸臂模板施工手冊
評論
0/150
提交評論