下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、S P S S 聚 類 分 析 過 程聚類的主要過程一般可分為如下四個(gè)步驟:1. 數(shù)據(jù)預(yù)處理(標(biāo)準(zhǔn)化)2. 構(gòu)造關(guān)系矩陣(親疏關(guān)系的描述)3. 聚類(根據(jù)不同方法進(jìn)行分類)4. 確定最佳分類(類別數(shù))SPS漱件聚類步驟1. 數(shù)據(jù)預(yù)處理(標(biāo)準(zhǔn)化)t Analyze 宀Classify 宀Hierachical Cluster Analysis然后從對(duì)話框中進(jìn)行如下選擇從Transform Values框中點(diǎn)擊向下箭頭,此為標(biāo)準(zhǔn)化方法,將出現(xiàn)如下可選項(xiàng),從中選一即 可:標(biāo)準(zhǔn)化方法解釋:None:不進(jìn)行標(biāo)準(zhǔn)化,這是系統(tǒng)默認(rèn)值;Z Scores標(biāo)準(zhǔn)化變換;Range-1 to 1極差標(biāo)準(zhǔn)化變換(作用:
2、變換后的數(shù)據(jù)均值為 0,極差為1,且| xj*|<1,消去了量綱的影 響;在以后的分析計(jì)算中可以減少誤差的產(chǎn)生。 ); Range 0 to 1(極差正規(guī)化變換 / 規(guī)格化變 換);2. 構(gòu)造關(guān)系矩陣在SPSS如何選擇測度(相似性統(tǒng)計(jì)量):t Analyze t Classify t Hierachical Cluster Analysis然后從對(duì)話框中進(jìn)行如下選擇常用測度(選項(xiàng)說明):Euclidean distanee :歐氏距離(二階 Minkowski距離),用途:聚類 分析中用得最廣泛的距離;Squared Eucidean dista nee :平方歐氏距離;Cos ine:
3、夾角余弦(相似性測度;Pearson correlation :皮爾遜相關(guān)系數(shù);3. 選擇聚類方法SPS沖如何選擇系統(tǒng)聚類法 常用系統(tǒng)聚類方法a)Between-groups linkage 組間平均距離連接法方法簡述:合并兩類的結(jié)果使所有的兩兩項(xiàng)對(duì)之間的平均距離最小。(項(xiàng)對(duì)的兩成員分屬不同類)特點(diǎn):非最大距離,也非最小距離b)Within-groups linkage 組內(nèi)平均連接法 方法簡述:兩類合并為一類后,合并后的類中所有項(xiàng)之間的平均距離最小C) Nearest neighbor 最近鄰法(最短距離法)方法簡述:用兩類之間最遠(yuǎn)點(diǎn)的距離代表兩類之間的距離,也稱之為完全連接法d) Furt
4、hest neighbor 最遠(yuǎn)鄰法(最長距離法) 方法簡述:用兩類之間最遠(yuǎn)點(diǎn)的距離代表兩類之間的距離,也稱之為完全連接法e) Centroid clustering 重心聚類法 方法簡述:兩類間的距離定義為兩類重心之間的距離,對(duì)樣品分類而言,每一類中心就是 屬于該類樣品的均值 特點(diǎn):該距離隨聚類地進(jìn)行不斷縮小。該法的譜系樹狀圖很難跟蹤,且符號(hào)改變頻繁,計(jì) 算較煩。f) Median clustering 中位數(shù)法 方法簡述:兩類間的距離既不采用兩類間的最近距離,也不采用最遠(yuǎn)距離,而采用介于兩 者間的距離 特點(diǎn):圖形將出現(xiàn)遞轉(zhuǎn),譜系樹狀圖很難跟蹤,因而這個(gè)方法幾乎不被人們采用。g) Ward&
5、#39; s method差平方和法 方法簡述:基于方差分析思想,如果分類合理,則同類樣品間離差平方和應(yīng)當(dāng)較小,類與 類間離差平方和應(yīng)當(dāng)較大 特點(diǎn):實(shí)際應(yīng)用中分類效果較好,應(yīng)用較廣;要求樣品間的距離必須是歐氏距離。譜系分類的確定經(jīng)過系統(tǒng)聚類法處理后,得到聚類樹狀譜系圖,Demirmen(1972) 提出了應(yīng)根據(jù)研究的目的來確定適當(dāng)?shù)姆诸惙椒ǎ⑻岢隽艘恍└鶕?jù)譜系圖來分類的準(zhǔn)則:A. 任何類都必須在臨近各類中是突出的,即各類重心間距離必須極大B. 確定的類中,各類所包含的元素都不要過分地多C. 分類的數(shù)目必須符合實(shí)用目的D. 若采用幾種不同的聚類方法處理,則在各自的聚類圖中應(yīng)發(fā)現(xiàn)相同的類實(shí)例分析
6、SPSS19分析軟件聚類分析4.2聚類分析 系統(tǒng)聚類法在數(shù)據(jù)編輯窗口的主菜單中選擇分析(A) ” 分類(F)系統(tǒng)聚類(H) ”(如圖-4所示),彈出“系統(tǒng)聚類分析 ”對(duì)話框,將 “地區(qū)”變量選入 “標(biāo)注個(gè)案 (C) ”中,將其他變量選入 “變量框中,如圖-5所示。在 分群”單選框中選中 個(gè)案”,表示進(jìn)行的是 Q型聚類。在 輸出”復(fù)選 框中選中 統(tǒng)計(jì)量 ”和 圖”,表示要輸出的結(jié)果包含以上兩項(xiàng)。單擊 統(tǒng)計(jì)量 (S) ”按鈕,在 系統(tǒng)聚類分析:統(tǒng)計(jì)量 ”對(duì)話框中選擇 合并進(jìn)程表 ”、 相似性矩 陣”,如圖 -6 所示,表示輸出結(jié)果將包括這兩項(xiàng)內(nèi)容。單擊 繪制(T) ”按鈕,在 系統(tǒng)聚類分析:圖”對(duì)
7、話框中選擇 樹狀圖”、冰柱”如圖-7所 示,表示輸出的結(jié)果將包括譜系聚類圖(樹狀)以及冰柱圖(垂直)。單擊 方法(M)”按鈕,彈出 系統(tǒng)聚類分析:方法”對(duì)話框,如下圖-8所示。聚類方法(M) ”選項(xiàng)條中可選項(xiàng)包括如圖-9所示的幾種方法,本例中選擇組間聯(lián)接”:度量標(biāo)準(zhǔn)-區(qū)間(N)選項(xiàng)條中可選項(xiàng)包括如圖-10所示的幾種度量方法,本例中選擇平方Euclidean 距離”:轉(zhuǎn)換值-標(biāo)準(zhǔn)化(S)選項(xiàng)條中可選項(xiàng)包括如圖-11所示的幾種將原始數(shù)據(jù)標(biāo)準(zhǔn)化的方法,本例中選擇全局從0到1”:冰柱圖解釋聚類分析冰柱圖形狀類似于屋檐上垂下的冰柱,因此而得名。橫軸:案例(Case)表示被聚類的對(duì)象或變量;縱軸:群集數(shù)(Number of clusters )表示被聚成幾類;觀察冰柱圖應(yīng)從最后一行開始。舉例如下:當(dāng)聚成6類時(shí)X4和X8和X6聚成一類,其他個(gè)案自成一類,用白板將6類一下?lián)跎峡梢钥闯鋈鐖D;當(dāng)聚成5類時(shí)X4和X8和X6和X2聚成一類,其他個(gè)案自成一類。冰柱圖的優(yōu)點(diǎn)是不僅可以顯示出不同類數(shù)時(shí)個(gè)案所屬的分類結(jié)果,還能表現(xiàn)出聚類的過程步驟,生動(dòng)形象;缺點(diǎn)是不能表現(xiàn)出聚類過程中距
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年成都租賃市場住宅裝修合同4篇
- 二零二五年度魚塘經(jīng)營承包金融服務(wù)合同3篇
- 2025年度瓷磚行業(yè)專業(yè)市場開發(fā)與運(yùn)營合作協(xié)議4篇
- 二零二五年度大氣合同封面設(shè)計(jì)授權(quán)使用協(xié)議4篇
- 二零二五年度海洋資源開發(fā)合作出資協(xié)議書4篇
- 二零二五白酒灌裝委托加工與品牌營銷合作協(xié)議3篇
- 2025廠區(qū)節(jié)能減排及廢棄物處理合作協(xié)議3篇
- 成都市三診試卷數(shù)學(xué)試卷
- 二零二五年度環(huán)保項(xiàng)目代理人貸款合同3篇
- 二零二五年度木工材料采購與倉儲(chǔ)分包合同4篇
- 海外資管機(jī)構(gòu)赴上海投資指南(2024版)
- 山東省青島市2023-2024學(xué)年七年級(jí)上學(xué)期期末考試數(shù)學(xué)試題(含答案)
- 墓地銷售計(jì)劃及方案設(shè)計(jì)書
- 從偏差行為到卓越一生3.0版
- 優(yōu)佳學(xué)案七年級(jí)上冊(cè)歷史
- 鋁箔行業(yè)海外分析
- 紀(jì)委辦案安全培訓(xùn)課件
- 超市連鎖行業(yè)招商策劃
- 城市道路智慧路燈項(xiàng)目 投標(biāo)方案(技術(shù)標(biāo))
- 【公司利潤質(zhì)量研究國內(nèi)外文獻(xiàn)綜述3400字】
- 工行全國地區(qū)碼
評(píng)論
0/150
提交評(píng)論