


版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、地球科學(xué)與學(xué)院中國地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室數(shù)學(xué)在地學(xué)中的應(yīng)用實習(xí)三、聚類分析實驗?zāi)康模?.2.3.熟悉系統(tǒng)聚類和 k-均值聚類方法;熟悉 R 型、Q 型系統(tǒng)聚類分析 SPSS 操作流程; 理解聚類分析結(jié)果分析思路。一、系統(tǒng)聚類分析1.2.3.系統(tǒng)聚類主要有兩種方法:分解法和凝聚法; 系統(tǒng)聚類的功能:樣品的聚類和變量的聚類;系統(tǒng)聚類分析流程:數(shù)據(jù)的標(biāo)準(zhǔn)化à測度方法的選擇(距離方法的選擇或相似性、關(guān)聯(lián)程度的選擇)à聚類方法的選擇à輸出圖形的選擇1.數(shù)據(jù)的標(biāo)準(zhǔn)化處理導(dǎo)入數(shù)據(jù)。打開“實習(xí)三”文件夾中“實習(xí)三.xlsx”文件,在“打開 Excel 數(shù)據(jù)源” 擊確
2、定。框中保留默認(rèn)設(shè)置,點數(shù)據(jù)的標(biāo)準(zhǔn)化處理。點擊工具欄中的“分析”(A)à“描述統(tǒng)計”à“描述”,進(jìn)入“描述性”框(B),選擇除 FID 以框中保留默認(rèn)選擇,外所有元素變量進(jìn)行分析,點擊“選項”à進(jìn)入“描述:選項”框。在該系統(tǒng)將對所選元素含量的均值、標(biāo)準(zhǔn)差、最小值、最大值進(jìn)行統(tǒng)計分析à點擊“繼續(xù)”返回“描述性”框(B)à“將標(biāo)準(zhǔn)化得分另存為變量(Z)”à點擊“確定”,得到各元素統(tǒng)計分析結(jié)果(D),并且可以在“變量視圖”中查看標(biāo)準(zhǔn)化后的各元素含量以新變量的形式出現(xiàn)在窗口中(E)。地球科學(xué)與學(xué)院中國地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室(A)
3、(B)(C)(D)(E)當(dāng)重復(fù)步驟,對標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行統(tǒng)計分析時,可以得到新變量均值為 0,標(biāo)準(zhǔn)差為 1,如下圖分析結(jié)果所示。接下來的聚類分析過程,將使用標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行。地球科學(xué)與學(xué)院中國地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室2.Q 型(基于樣本)聚類分析點擊“分析”à“分類”à“系統(tǒng)聚類”進(jìn)入“系統(tǒng)聚類分析”對數(shù)據(jù)進(jìn)行 Q 型聚類分析???。選擇分群“個案”,即選擇“個案”,即對樣本進(jìn)行聚類(Q 型聚類)設(shè)置分類方案。點擊“統(tǒng)計量”à進(jìn)入“系統(tǒng)聚類分析:統(tǒng)計量”框。按圖計量à點擊“繼續(xù)”返回“系統(tǒng)聚類分析”框。分類信息表:ØØ無:
4、表示不列示分類信息表; 單一方案:指定分類數(shù)的分類信息表。若要顯示分為 6 類, 則在此填入 6;方案范圍:指定分為多類的分類信息。若要顯示分為 3、4、5、6 類的情況,則在最小和最大聚類數(shù)中分別填寫 3、6。也稱“凝聚狀態(tài)表”相似性矩陣表Ø設(shè)置繪圖方案。在“系統(tǒng)聚類分析”框中,點擊“繪制”,進(jìn)入“系統(tǒng)聚類分析:圖”框。按下圖相應(yīng)選項à點擊“繼續(xù)”,返回“系統(tǒng)聚類分析”框。地球科學(xué)與學(xué)院中國地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室輸出所有分類的冰柱圖輸出指定類分類結(jié)果冰柱圖不輸出分類結(jié)果冰柱圖冰柱圖水平或垂直顯示設(shè)置分類方法。在“系統(tǒng)聚類分析”框中,點擊“方法”,進(jìn)入“系統(tǒng)聚
5、類分析:方法”框。按下圖相應(yīng)選項à點擊“繼續(xù)”,返回“系統(tǒng)聚類分析”框。相似性度量指標(biāo):類間距離定義方法:數(shù)據(jù)標(biāo)準(zhǔn)化處理方式選擇;系統(tǒng)默認(rèn)為不進(jìn)行標(biāo)準(zhǔn)化處理。本實驗第一步已對數(shù)據(jù)按變量進(jìn)行了標(biāo)準(zhǔn)化處理。設(shè)置保存方案。在“系統(tǒng)聚類分析”框中,點擊“保存”,進(jìn)入“系統(tǒng)聚類分析:保存”框。在這里選擇是否將某分類信息以新變量的形式保存在數(shù)據(jù)文件中à按下圖在“單一方案聚類數(shù)”中填入 6à點擊“繼續(xù)”,返回“系統(tǒng)聚類分析”框à點擊“確定”,得到聚類分析結(jié)果。ØØ系統(tǒng)默認(rèn):不保存;單一方案:保存指定分類的分類結(jié)果。若要保存分為 6 類的情況, 則在
6、“聚類數(shù)”中填入 6。系統(tǒng)將產(chǎn)生一個新變量,將所有樣本分到 6 類中某一類結(jié)果標(biāo)示在新變量中;方案范圍:保存指定分為某幾類Ø地球科學(xué)與學(xué)院中國地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室3.查看 Q 型聚類分析結(jié)果樣本基本情況。本例中有效分類樣本數(shù)量為 80 個。查看相似性矩陣。表中矩陣了 80 個樣本點兩兩之間的距離。凝聚狀態(tài)表。第五、六列(首次出現(xiàn)階群集):表示該步驟是樣本的聚類還是樣本與類的聚類或者是類與類的聚類; 0-樣本;非 0-類,數(shù)字表示第幾步聚成的類。第一列(階):聚類進(jìn)行到第幾步。第二、三列(群集):表示是哪兩個樣本或類第四列(聚類系數(shù)):表示該步中實現(xiàn)聚類的兩樣本(或類)
7、之間的距離第七列(下一階):表示該果會在后面第幾步用到。類結(jié) 分類信息表。該表表示在設(shè)定為 6 類的情況下,各樣本點的分類情況。 冰柱圖。冰柱圖因其樣子形似冬天房頂上垂下的冰柱而得名。一般從冰柱圖的最后一行開始觀察,縱坐標(biāo)表示類的順序,橫坐標(biāo)表示樣品號。兩樣品之間實心部分,表示在該類上把這兩個樣品進(jìn)行聚合地球科學(xué)與學(xué)院中國地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室形成一類。 系統(tǒng)聚類譜系圖(樹狀圖)。4. R 型(基于變量)聚類分析及結(jié)果 R 型聚類分析步驟與 Q 型聚類分析步驟雷同,僅需在“系統(tǒng)聚類分析”“變量”類型??虻摹胺秩骸狈桨钢羞x擇 用相同方法得到 R 型聚類分析結(jié)果,所得到的各種圖標(biāo)均變
8、量進(jìn)行聚類分析。二、K-means 聚類分析注意:K-均值聚類只能做 Q 型(樣本)聚類;如要做 R 型(變量)聚類,需要把數(shù)據(jù)陣進(jìn)行轉(zhuǎn)置。以下過程為樣本聚類。1. k-均值聚類分析K-Means 聚類分析的步驟為:Step1:指定聚類的數(shù)目,假設(shè)要分成 k 類;Step2:確定類的初始中心。可由用戶自定義,也可讓系統(tǒng)選定;地球科學(xué)與學(xué)院中國地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室Step3:根據(jù)距離最近原則進(jìn)行聚類; Step4:重新確定 K 個類的中心;Step5:重復(fù) Setp3 Step4,直到滿足停止聚類分析的條件。點擊“分析”à“分類”à“k-均值聚類”進(jìn)入“K-均
9、值聚類分析”框(A)。設(shè)置聚類變量和數(shù)目。將全部經(jīng)過標(biāo)準(zhǔn)化后的變量導(dǎo)入“變量”欄中;聚類數(shù)量改為“6”。設(shè)置終止聚類分析的條件。點擊“迭代”à進(jìn)入“K-均值聚類分析:寫入文件”框(B)à保留默認(rèn)迭代次數(shù)為 10à點擊“繼續(xù)”返回“K 均值聚類分析”框。迭代次數(shù):進(jìn)行 10 次迭代后,聚類分析停止,不再重新確定K 個類的中心聚類數(shù)量應(yīng)少于樣本數(shù)量收斂性標(biāo)準(zhǔn):說明類中心點偏移的程度,即迭代前后中心點的最大偏移量是否超過預(yù)定值,一般取 0.02。設(shè)置初始聚類中心。點擊“選項”à進(jìn)入“K 均值聚類分析:選項”點擊“繼續(xù)”返回“K 均值聚類分析”框。框(A),如圖
10、計量à輸出方差分析表,反映哪些變量對分類起著顯著作用樣本的處理,可不用選擇,默認(rèn)即可。輸出每個樣本的分類信息設(shè)置保存方式。點擊“保存”à進(jìn)入“K-Means 群集:保存新變量”框。如圖即將保存的結(jié)果à點擊“繼續(xù)”返回“K 均值聚類分析”框à點擊“確定”,得到聚類分析結(jié)果。以新變量“QCL_1”保存“分類信息”到 SPSS 數(shù)據(jù)文件中以新變量“QCL_2”保存“每個 樣本到各自所在類的類中心的距離”到 SPSS 數(shù)據(jù)文件中地球科學(xué)與學(xué)院中國地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室2.查看 K-Means 聚類分析結(jié)果初始聚類中心表和最終聚類中心表。表中給出了每一個變量所有樣品的聚類情況。由于沒有指定初始 聚類中心,對每一個變量的樣品進(jìn)行聚類分析時,系統(tǒng)自動選取了初始聚類中心。經(jīng)過聚類分析最終得到的聚類中心與初始聚類中心有差異。聚類成員。該表中顯示了每一個樣品其分類,及距離聚類中心的距離。聚類中心間的距離。該表顯示了兩兩類聚類中心間的距離。聚類案例數(shù)。該表反映了每一類樣本個數(shù)信息,本例中,第一類有 2 個樣本;第二類有 1 個樣本地球科學(xué)與學(xué)院中國地質(zhì)大學(xué)(北京)遙感與地學(xué)信息教研室ANOVA 方差分析表。該表對各指數(shù)的均值在各類中的差異進(jìn)行顯著性檢驗,反映了哪些聚類變量對分類起著顯著作
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年楚雄教練員從業(yè)資格理論考試題庫
- ××超市監(jiān)控系統(tǒng)細(xì)則
- 移動支付業(yè)務(wù)合作協(xié)議附風(fēng)險控制措施條款
- 財務(wù)成本控制與預(yù)算分析練習(xí)題
- 信息技術(shù)支持農(nóng)業(yè)發(fā)展的合作協(xié)議
- 新聞版權(quán)與報道協(xié)議
- 2025年無縫管熱連軋機(jī)項目申請報告
- 農(nóng)業(yè)種植技術(shù)與知識產(chǎn)權(quán)共享協(xié)議
- 2025年系統(tǒng)集成項目管理工程師考試網(wǎng)絡(luò)技術(shù)與應(yīng)用試卷
- 2025年地區(qū)事業(yè)單位招聘面試真題試卷:農(nóng)業(yè)科學(xué)研究與發(fā)展
- 【精編美術(shù)課】《仕女簪花》課件
- 半導(dǎo)體設(shè)備零部件公司質(zhì)量檢驗
- Q∕SY 1302-2010 強(qiáng)制電流陰極保護(hù)電源設(shè)備應(yīng)用技術(shù)
- 2022年《基礎(chǔ)會計》第八版ppt課件(完整版)
- KTV工程預(yù)算表模板
- (完整版)鋼筋加工棚驗算
- 勇者斗惡龍怪獸篇joker2專家版中文配合表(附圖)
- 黑龍江公共場所衛(wèi)生許可申請表
- 美的審廠資料清單
- 人教版八年級美術(shù)下冊紋樣與生活第二課時設(shè)計紋樣
- 東北大學(xué)學(xué)報(自然科學(xué)版)排版模板(共4頁)
評論
0/150
提交評論