系統(tǒng)聚類分析_第1頁
系統(tǒng)聚類分析_第2頁
系統(tǒng)聚類分析_第3頁
系統(tǒng)聚類分析_第4頁
系統(tǒng)聚類分析_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第4節(jié) 系統(tǒng)聚類分析聚類要素的數(shù)據(jù)處理距離的計算直接聚類法 最短距離聚類法 最遠距離聚類法系統(tǒng)聚類法計算類之間距離的統(tǒng)一公式系統(tǒng)聚類分析實例 一、聚類要素的數(shù)據(jù)處理 在聚類分析中,聚類要素的選擇是十分重要的,它直接影響分類結(jié)果的準(zhǔn)確性和可靠性。 在地理分類和分區(qū)研究中,被聚類的對象常常是多個要素構(gòu)成的。不同要素的數(shù)據(jù)往往具有不同的單位和量綱,其數(shù)值的變異可能是很大的,這就會對分類結(jié)果產(chǎn)生影響。因此當(dāng)分類要素的對象確定之后,在進行聚類分析之前,首先要對聚類要素進行數(shù)據(jù)處理。 要 素聚 類 對 象 假設(shè)有m 個聚類的對象,每一個聚類對象都有n個要素構(gòu)成。它們所對應(yīng)的要素數(shù)據(jù)可用表3.4.1給出。

2、mi21mnmjmminijiinjnjxxxxxxxxxxxxxxxx2121222221111211njxxxx21表3.4.1 聚類對象與要素數(shù)據(jù) 在聚類分析中,常用的聚類要素的數(shù)據(jù)處理方法有如下幾種: 總和標(biāo)準(zhǔn)化。分別求出各聚類要素所對應(yīng)的數(shù)據(jù)的總和,以各要素的數(shù)據(jù)除以該要素的數(shù)據(jù)的總和,即 這種標(biāo)準(zhǔn)化方法所得到的新數(shù)據(jù)滿足), 2 , 1;, 2 , 1(1njmixxxmiijijij(3.4.1) miijnjx1), 2 , 1(1 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化,即 由這種標(biāo)準(zhǔn)化方法所得到的新數(shù)據(jù),各要素的平均值為0,標(biāo)準(zhǔn)差為1,即有),2, 1;,2, 1(njmisxxxjjijij(3.

3、4.2) 1)(101121mijijjmiijjxxmsxmx 極大值標(biāo)準(zhǔn)化,即 經(jīng)過這種標(biāo)準(zhǔn)化所得的新數(shù)據(jù),各要素的極大值為1,其余各數(shù)值小于1。 極差的標(biāo)準(zhǔn)化,即 經(jīng)過這種標(biāo)準(zhǔn)化所得的新數(shù)據(jù),各要素的極大值為1,極小值為0,其余的數(shù)值均在0與1之間。 ), 2 , 1;, 2 , 1(maxnjmixxxijiijij(3.4.3) ), 2 , 1;, 2 , 1(minmaxminnjmixxxxxijiijiijiijij(3.4.4)例題例題: :表3.4.2給出了某地區(qū)9個農(nóng)業(yè)區(qū)的7項指標(biāo),它們經(jīng)過極差標(biāo)準(zhǔn)化處理后,如表3.4.3所示。 表3.4.2 某地區(qū)9個農(nóng)業(yè)區(qū)的7項經(jīng)濟

4、指標(biāo)數(shù)據(jù) 區(qū)代號人均耕地X1/(hm2人-1)勞均耕地X2/(hm2個-1 )水田比重X3/%復(fù)種指數(shù)x4/%糧食單產(chǎn)x5/(kghm -2)人均糧食x6/(kg人-1 )稻谷占糧食比重x7/% G10.2941.0935.63113.64 510.51 036.412.2G20.3150.9710.3995.12 773.5683.70.85G30.1230.3165.28148.56 934.5611.16.49G40.1790.5270.391114 458632.60.92G50.0810.21272.04217.812 249791.180.38G60.0820.21143.7817

5、9.68 973636.548.17G70.0750.18165.15194.710 689634.380.17G80.2930.6665.3594.93 679.5771.77.8G90.1670.4142.994.84 231.5574.61.17表3.4.3 極差標(biāo)準(zhǔn)化處理后的數(shù)據(jù)x1x2x3x4X5X6X7G10.911.000.070.150.181.000.14G21.000.870.000.000.000.240.00G30.200.150.070.440.440.080.07G40.440.380.000.130.180.130.00G50.030.031.001.001.00

6、0.451.00G60.030.030.610.690.650.130.59G70.000.000.900.810.840.131.00G80.910.530.070.000.100.430.09G90.380.260.040.000.150.000.00二、距離的計算 常見的距離有 絕對值距離 歐氏距離 明科夫斯基距離 ), 2 , 1, (1mjixxdnijkikij(3.4.5) ), 2 , 1, ()(12mjixxdnkjkikij(3.4.6) ), 2 , 1, (11mjixxdpnkpjkikij(3.4.7) 切比雪夫距離。當(dāng)明科夫斯基距 時,有 據(jù)表3.4.3中的數(shù)據(jù)

7、,用公式(3.4.5)式計算可得9個農(nóng)業(yè)區(qū)之間的絕對值距離矩陣如下 ), 2 , 1,(maxmjixxdjkikkij(3.4.8) 040. 132. 306. 384. 451. 020. 166. 162. 2003. 596. 314. 529. 124. 288. 032. 1007. 183. 006. 493. 253. 579. 5078. 199. 286. 146. 472. 4077. 464. 302. 686. 5023. 147. 119. 2070. 210. 3052. 10)(99ijdD(3.4.9) p三、直接聚類法 原理原理 先把各個分類對象單獨視為一

8、類,然后根據(jù)距離最小的原則,依次選出一對分類對象,并成新類。如果其中一個分類對象已歸于一類,則把另一個也歸入該類;如果一對分類對象正好屬于已歸的兩類,則把這兩類并為一類。每一次歸并,都劃去該對象所在的列與列序相同的行。經(jīng)過m-1次就可以把全部分類對象歸為一類,這樣就可以根據(jù)歸并的先后順序作出聚類譜系圖。 例題:例題:根據(jù)距離矩陣式(3.4.9),用直接聚類法對某地區(qū)的9個農(nóng)業(yè)區(qū)進行聚類分析,步驟如下: (1)在距離矩陣D中,除去對角線元素以外,d49=d94=0.51為最小者,故將第4區(qū)與第9區(qū)并為一類,劃去第9行和第9列; (2)在余下的元素中,除對角線元素以外,d75= d57=0.83為

9、最小者,故將第5區(qū)與第7區(qū)并為一類,劃掉第7行和第7列; (3)在第2步之后余下的元素之中,除對角線元素以外,d82= d28=0.88為最小者,故將第2區(qū)與第8區(qū)并為一類,劃去第8行和第8列; (4)在第3步之后余下的元素中,除對角線元素以外,d43= d34=1.23為最小者,故將第3區(qū)與第4區(qū)并為一類,劃去第4行和第4列,此時,第3、4、9區(qū)已歸并為一類; (5)在第4步之后余下的元素中,除對角線元素以外,d21= d12=1.52為最小者,故將第1區(qū)與第2區(qū)并為一類,劃去第2行和第2列,此時,第1、2、8區(qū)已歸并為一類; (6)在第5步之后余下的元素中,除對角線元素以外,d65= d5

10、6=1.78為最小者,故將第5區(qū)與第6區(qū)并為一類,劃去第6行和第6列,此時,第5、6、7區(qū)已歸并為一類; (7)在第6步之后余下的元素中,除對角線元素以外,d31= d13=3.10為最小者,故將第1區(qū)與第3區(qū)并為一類,劃去第3行和第3列,此時,第1、2、3、4、8、9區(qū)已歸并為一類; (8) 在第7步之后余下的元素中,除去對角線元素以外,只有d51= d15=5.86,故將第1區(qū)與第5區(qū)并為一類,劃去第5行和第5列,此時,第1、2、3、4、5、6、7、8、9區(qū)均歸并為一類。 根據(jù)上述步驟,可以作出聚類過程的譜系圖3.4.1。圖3.4.1 直接聚類譜系圖 四、最短距離聚類法 n原理原理 最短距

11、離聚類法,是在原來的mm距離矩陣的非對角元素中找出 ,把分類對象Gp和Gq歸并為一新類Gr,然后按計算公式 計算原來各類與新類之間的距離,這樣就得到一個新的(m1)階的距離矩陣; 再從新的距離矩陣中選出最小者dij,把Gi和Gj歸并成新類;再計算各類與新類的距離,這樣一直下去,直至各分類對象被歸為一類為止。),(,minqpkdddqkpkrk(3.4.10) minijpqdd 例題例題:以下根據(jù)式(3.4.9)中的距離矩陣,用最短距離聚類法對某地區(qū)的9個農(nóng)業(yè)區(qū)進行聚類分析。 (1) 在99階距離矩陣D中,非對角元素中最小者是d94=0.51,首先將第4區(qū)與第9區(qū)并為一類,記為G10=G4,

12、G9。按照公式(3.4.10)式分別計算G1,G2,G3,G5,G6,G7,G8與G10之間的距離得 d1,10=mind14,d19= min2.19,2.62=2.19d2,10=mind24,d29= min1.47,1.66=1.47d3,10=mind34,d39= min1.23,1.20=1.20d5,10=mind54,d59= min4.77,4.84=4.77d6,10=mind64,d69= min2.99,3.06=2.99d7,10=mind74,d79= min4.06,3.32=3.32d8,10=mind84,d89= min1.29,1.40=1.29 (2)

13、這樣就得到G1,G2,G3,G5,G6,G7,G8,G10上的一個新的88階距離矩陣 029.132.399.277.420.147.119.2003.596.314.524.288.032.1007.183.093.253.579.5078.186.146.472.4064.302.686.5070.210.3052.10108765321108765321GGGGGGGGGGGGGGGG (3)在上一步驟中所得到的88階距離矩陣中,非對角元素中最小者為d57=0.83,故將G5與G7歸并為一類,記為G11,即G11=G5,G7。 按照公式(3.4.10)式分別計算G1,G2,G3,G6,G

14、8,G10與G11之間的距離,可得到一個新的77階距離矩陣 (4)在第2步所得到的77階距離矩陣中,非對角元素中最小者為d28=0.88,故將G2與G8歸并為一類,記為G12,即G12=G2,G8。再按照公式(3.4.10)分別計算G1,G3,G6,G10,G11與G12之間的距離,可得到一個新的66階距離矩陣 032.303.507.193.253.579.5029.199.220.147.119.2096.324.288.032.1086.146.472.4070.210.3052.10111086321111086321GGGGGGGGGGGGGG (5)在第3步所得的66階距離矩陣中,

15、非對角元素中最小者為d6,11=1.07,故將G6與G11歸并為一類,記為G13,即G13=G6,G11=G6,(G5,G7)。再按照公式(3.4.10)計算G1,G3,G10,G12與G13之間的距離,可得到一個新的55階距離矩陣 003. 529. 196. 324. 232. 1032. 307. 193. 279. 5099. 220. 119. 2086. 172. 4010. 30121110631121110631GGGGGGGGGGGG (6)(6)在第4步所得的55階距離矩陣中,非對角線元素中最小者為d3,10=1.20,故將G3與G10歸并為一類,記為G14,即G14=G3

16、,G10=G3,(G4,G9)。再按照公式(3.4.10)計算G1,G12,G13與G14之間的距離,可得一個新的44階距離矩陣 096. 399. 286. 172. 4029. 124. 232. 1020. 119. 2010. 301312103113121031GGGGGGGGGG (7)(7)在第5步所得到的44階距離矩陣中,非對角線元素中最小者為d12,14=1.29,故將G12與G14歸并為一類,記為G15,即G15=G12,G14=(G2,G8),(G3,(G4,G9)。再按照公式(3.4.10)計算G1,G13與G15之間的距離,可得一個新的33階距離矩陣 086. 129

17、. 119. 2096. 372. 4032. 1014131211413121GGGGGGGG (8)在第6步所得的33階距離矩陣中,非對角線元素中最小者為d1,15=1.32,故將G1與G15歸并為一類,記為G16,即G16=G1,G15=(G1,(G2,G8),(G3,(G4,G9)。再按照公式(3.4.10)計算G13與G16之間的距離,可得一個新的22階距離矩陣 086. 132. 1072. 401513115131GGGGGG (9)將G13與G16歸并為一類。此時,所有分類對象均被歸并為一類。 綜合上述聚類過程,可以作出最短距離聚類譜系圖(圖3.4.2)。 086. 10161

18、31613GGGG圖3.4.2 最短距離聚類譜系圖 五、最遠距離聚類法 最遠距離聚類法與最短距離聚類法的區(qū)別在于計算原來的類與新類距離時采用的公式不同。 最遠距離聚類法的計算公式是),(,maxqpkdddqkpkrk(3.4.11) 例題例題: :對于前面的例子,最遠距離聚類法的聚類過程如下: (1)(1) 在99階距離矩陣中,非對角元素中最小者是d94=0.51,將第4區(qū)與第9區(qū)并為一類,記為G10,即G10=G4,G9。按照公式(3.4.11)分別計算G1,G2,G3,G5,G6,G7,G8與G10之間的距離,得到一個新的88階距離矩陣040. 106. 406. 384. 423. 1

19、66. 162. 2003. 596. 314. 524. 288. 032. 1007. 183. 093. 253. 579. 5078. 186. 146. 472. 4064. 302. 686. 5070. 210. 3052. 10108765321108765321GGGGGGGGGGGGGGGG (2) 在第1步所得到的88階距離矩陣中,非對角線元素中最小者為d57=0.83,故將G5與G7歸并為一類,記為G11,即G11=G5,G7。按照公式(3.4.11)式分別計算G1,G2,G3,G6,G8,G10與G11之間的距離,得到一個新的77階距離矩陣如下 084. 414. 5

20、78. 164. 302. 686. 5040. 106. 323. 166. 162. 2096. 324. 288. 032. 1086. 146. 472. 4070. 210. 3052. 10111086321111086321GGGGGGGGGGGGGG (3) 在第2步所得到的77階距離矩陣中,非對角線元素中最小者為d28=0.88,故將G2與G8歸并為一類,記為G12,即G12=G2,G8。再按照公式(3.4.11)分別計算G1,G3,G6,G10,G11與G12之間的距離,得到一個新的66階距離矩陣如下 002. 666. 146. 470. 252. 1084. 478.

21、164. 386. 5006. 323. 162. 2086. 172. 4010. 30121110631121110631GGGGGGGGGGGG (4)在第3步所得的66階距離矩陣中,非對角元素中最小者為d3,10=1.23,故將G3與G10歸并為一類,記為G13,即G13=G3,G10=G3,(G4,G9)。再按照公式(3.4.11)計算G1,G6,G11,G12與G13之間的距離,得到一個新的55階距離矩陣如下 070. 284. 406. 310. 3002. 646. 452. 1078. 186. 5072. 401312106113121061GGGGGGGGGG (5)在第

22、4步所得的55階距離矩陣中,非對角線元素中最小者為d1,12=1.52,故將G1與G12歸并為一類,記為G14,即G14=G1,G12=G1,(G2,G8)。再按照公式(3.4.11)分別計算G6,G11,G13與G14之間的距離,得到一個新的44階距離矩陣如下 010.320.672.4084.406.3078.1014131161413116GGGGGGGG (6)在第5步所得的44階距離矩陣中,非對角線元素中最小者為d6,11=1.78,故將G6與G11歸并為一類,記為G15,即G15=G6,G11=G6,(G5,G7)。再按照公式(3.4.11)分別計算G13,G14和G15之間的距離

23、,得到一個新的33階距離矩陣如下002.684.4010.30151413151413GGGGGG (7) 在第6步所得的33階距離矩陣中,非對角線元素中最小者為d13,14=3.10,故將G13與G14歸并為一類,記為G16,即G16=G13,G14=(G3,(G4,G9),(G1,(G2,G8)。再按照公式(3.4.11)計算G15與G16之間的距離,可得一個新的22階距離矩陣如下002. 6016151615GGGG (8) (8)將G15與G16歸并為一類。此時,各個分類對象均已歸并為一類。 綜合上述聚類過程,可以作出最遠距離聚類譜系圖(圖3.4.3)。 圖3.4.3 最遠距離聚類譜系圖G1G2G8G3G4G9G5G7G6六、計算類之間距離的統(tǒng)一公式n最短距離和最遠距離最短距離和最遠距離 可以用一個公式表示 用圖3.4.4表示二者關(guān)系:|22222qkpkqkqpkpkrddddd(3.4.12) 最短距離最遠距離圖3.4.4 兩種不同的空間距離a1Ab1b2Ba2 當(dāng)、三個參數(shù)取不同的值時,就形成了不同的聚類方法(表3.4.4),在表3.4.4中,np是p類中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論