遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件_第1頁
遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件_第2頁
遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件_第3頁
遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件_第4頁
遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

遙感影像識別

第三章:聚類分析PartⅡ遙感影像識別

第三章:聚類分析PartⅡ§3-1相似性準(zhǔn)則§3-2聚類準(zhǔn)則函數(shù)§3-3兩種簡單的聚類算法§3-4動態(tài)聚類算法§3-5聚類的評價主要內(nèi)容§3-1相似性準(zhǔn)則主要內(nèi)容課堂回顧廣義線性判別函數(shù)

xy非線性判別函數(shù)分段線性判別函數(shù):距離均值二次判別函數(shù):判別方程課堂回顧廣義線性判別函數(shù)課堂回顧聚類分析符合“物以類聚,人以群分“的原則,它把相似性大的樣本聚集為一個類型,在特征空間里占據(jù)著一個局部區(qū)域。每個局部區(qū)域都形成一個聚合中心,聚合中心代表相應(yīng)類型。相似性準(zhǔn)則:包括距離相似性度量和角度相似性度量。距離相似性度量:歐氏距離、馬氏距離、明氏距離。課堂回顧聚類分析符合“物以類聚,人以群分“的原則,它把相似性課堂回顧在樣本相似性度量的基礎(chǔ)上,聚類分析還需要一定的準(zhǔn)則函數(shù),才能把真正屬于同一類的樣本聚合成一個類型的子集,而把不同類的樣本分離開來。聚類準(zhǔn)則函數(shù):包括誤差平方和準(zhǔn)則、加權(quán)平均平方距離和準(zhǔn)則、類間距離和準(zhǔn)則。誤差平方和準(zhǔn)則(最常用):課堂回顧在樣本相似性度量的基礎(chǔ)上,聚類分析還需要一定的準(zhǔn)則函課后思考線性判別函數(shù)的適用性?聚類分析的優(yōu)缺點?ERDASimageModel工具如何實現(xiàn)聚類?課后思考線性判別函數(shù)的適用性?§3-3兩種簡單的聚類算法本節(jié)介紹兩種簡單的聚類分析方法,它是對某些關(guān)鍵性的元素進行試探性的選取,使某種聚類準(zhǔn)則達到最優(yōu),又稱為基于試探的聚類算法。

采用最近鄰規(guī)則的聚類算法最大最小距離聚類算法§3-3兩種簡單的聚類算法本節(jié)介紹兩種簡單的聚類分1.采用最近鄰規(guī)則的聚類算法

假設(shè)已有混合樣本集,按照最近鄰原則進行聚類,算法如下:①選取距離閾值,并且任取一個樣本作為第一個聚合中心,如:。②計算樣本到的距離:1.采用最近鄰規(guī)則的聚類算法假設(shè)已有混合樣本集③按照某種聚類準(zhǔn)則考察聚類結(jié)果,若不滿意,則重新選取距離閾值、第一個聚合中心,返回②,直到滿意,算法結(jié)束。在樣本分布一定時,該算法的結(jié)果在很大程度上取決于第一個聚合中心的選取和距離閾值的大小?!鈖66該算法的優(yōu)點是簡單,如果有樣本分布的先驗知識用于指導(dǎo)閾值和起始點的選取,則可較快得到合理結(jié)果。對于高維的樣本集來說,則只有經(jīng)過多次試探,并對聚類結(jié)果進行驗算,從而選擇最優(yōu)的聚類結(jié)果。遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件2.最大最小距離聚類算法

該算法以歐氏距離為基礎(chǔ),除首先辨識最遠的聚類中心外,與上述算法相似。用一個例子說明該算法?!嵋灶愰g歐式距離最大作為選擇聚類中心的條件。2.最大最小距離聚類算法該算法以歐氏距離為基礎(chǔ),除

遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件§3-4動態(tài)聚類算法在聚類分析中,動態(tài)聚類法是較普遍采用的方法,該算法首先選擇某種樣本相似性度量和適當(dāng)?shù)木垲悳?zhǔn)則函數(shù),使用迭代算法,在初始劃分的基礎(chǔ)上,逐步優(yōu)化聚類結(jié)果,使準(zhǔn)則函數(shù)達到極值。1.C-均值聚類算法(即:K-均值聚類算法)2.ISODATA聚類算法§3-4動態(tài)聚類算法在聚類分析中,動態(tài)聚類法是較普

算法要解決的關(guān)鍵問題:①首先選擇有代表性的點作為起始聚合中心。若類型數(shù)目已知,則選擇代表點的數(shù)目等于類型數(shù)目;若未知,那么聚類過程要形成的類型數(shù)目,就是一個值得研究的問題。②代表點選擇好之后,如何把所有樣本區(qū)分到以代表點為初始聚合中心的范圍內(nèi),形成初始劃分,是算法的另一個關(guān)鍵問題。算法要解決的關(guān)鍵問題:1.C-均值聚類算法C-均值聚類算法使用的聚類準(zhǔn)則函數(shù)是誤差平方和準(zhǔn)則:

為了使聚類結(jié)果優(yōu)化,應(yīng)該使準(zhǔn)則最小化。1.C-均值聚類算法C-均值聚類算法使用的聚類準(zhǔn)則函數(shù)是誤差

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

算法特點:①每次迭代中都要考查每個樣本的分類是否正確,若不正確,就要調(diào)整,在全部樣本調(diào)整完之后,再修改聚合中心,進入下一次迭代。如果在某一個迭代運算中,所有的樣本都被正確分類,則樣本不會調(diào)整,聚合中心也不會有變化,也就是收斂了。②c個初始聚合中心的選擇對聚類結(jié)果有較大影響。在算法迭代過程中,樣本分類不斷調(diào)整,因此誤差平方和也在逐步減小,直到?jīng)]有樣本調(diào)整為止,此時不再變化,聚類達到最優(yōu)。但是上述算法中沒有計算值,也就是說不是算法結(jié)束的明顯依據(jù)。

算法特點:

(2)C-均值算法(二)(2)C-均值算法(二)

(2)C-均值算法(二)(2)C-均值算法(二)

(2)C-均值算法(二)(2)C-均值算法(二)

(3)與C的關(guān)系曲線(3)與C的關(guān)系曲線

(3)與C的關(guān)系曲線圖中,曲線的拐點A對應(yīng)著接近最優(yōu)的c值。并非所有的情況都容易找到-C關(guān)系曲線的拐點,此時c值將無法確定。(3)與C的關(guān)系曲線2.ISODATA聚類算法ISODATA算法:IterativeSelf-OrganizingDataAnalysisTechniquesAlgorithm,迭代自組織的數(shù)據(jù)分析算法。ISODATA算法特點:可以通過類的自動合并(兩類合一)與分裂(一類分為二),得到較合理的類型數(shù)目c。2.ISODATA聚類算法ISODATA算法:Iterati

具體算法步驟:⑴給定控制參數(shù):預(yù)期的聚類中心數(shù)目。:每一聚類中最少的樣本數(shù)目,如果少于此數(shù)就不能作為一個獨立的聚類。:一個聚類域中樣本距離分布的標(biāo)準(zhǔn)差(閾值)。:兩個聚類中心之間的最小距離,如果小于此數(shù),兩個聚類合并。:每次迭代允許合并的最大聚類對數(shù)目。:允許的最多迭代次數(shù)。給定n個混合樣本,令(迭代次數(shù)),預(yù)選c個起始聚合中心,,。具體算法步驟:

具體算法步驟:⑵計算每個樣本與聚合中心距離:。若:,則:。把全部樣本劃分到c個聚合中去,且表示各子集中的樣本數(shù)目。⑶判斷:若,則舍去子集,返回②。⑷計算修改聚合中心:。⑸計算類內(nèi)距離平均值:

,具體算法步驟:,

具體算法步驟:⑹計算類內(nèi)總平均距離(全部樣本對其相應(yīng)聚類中心的總平均距離):⑺判別分裂、合并及迭代運算等步驟。(a)如迭代運算次數(shù)已達I次,即最后一次迭代,置,跳到⑾,運算結(jié)束。(b)如,即聚類中心的數(shù)目等于或不到規(guī)定值的一半,則轉(zhuǎn)⑻,將已有的聚類分裂。(c)如迭代運算的次數(shù)是偶數(shù),或,則不進行分裂,跳到⑾,若不符合上述兩個條件,則進入⑻,進行分裂處理。

,具體算法步驟:,

具體算法步驟:⑻計算每個聚合的標(biāo)準(zhǔn)偏差向量:。每個分量為:。表示x的第i個分量,表示的第i個分量。d為維數(shù)。⑼求出每個聚合的最大標(biāo)準(zhǔn)偏差分量:。⑽考查,若有,同時滿足以下兩條件之一,(a),(樣本數(shù)目超過規(guī)定值一倍以上)。(b)。具體算法步驟:

具體算法步驟:則把該集合分為兩個新的聚合,聚合中心分別為:其中:令:返回⑵其中,K的選擇很重要,應(yīng)使中的樣本到的距離不同,但又使樣本全部在這兩個集合中。⑾計算兩兩聚合中心間的距離:

⑿比較與,并把小于的按遞增次序排隊:為給定的合并參數(shù)。具體算法步驟:

具體算法步驟:⒀考查⑿中的不等式,對每一個,相應(yīng)有兩個聚類中心和,假使在同一次迭代中,還沒把和合并,則把兩者合并,合并后中心為:

⒁若,則,如果修改給定參數(shù)則返回⑴,不修改參數(shù)返回⑵,否則,算法結(jié)束。注意:⑻~⑽步為分裂,⑾~⒀為合并。具體算法步驟:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:ISODATA算法:

ISODATA算法中,起始聚合中心的選取對聚類過程和結(jié)果都有較大影響,如果選擇的好,則算法收斂快,聚類質(zhì)量高。注意:ISODATA與C-均值算法的異同點:①都是動態(tài)聚類算法。②C-均值簡單,ISODATA復(fù)雜。③C-均值中,類型數(shù)目固定,ISODATA中,類型數(shù)目可變。

ISODATA算法流程框圖如下圖所示:

ISODATA算法流程框圖如下圖所示:§3-5聚類的評價聚類幾何分布的顯示圖表分析各聚類中心間的距離各聚類域中樣本數(shù)目的分析各聚類域樣本方差的分析屏幕顯示與實地抽樣檢核借助有關(guān)文獻、圖件和已有成果評價聚類結(jié)果§3-5聚類的評價聚類幾何分布的顯示謝謝!遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件遙感影像識別

第三章:聚類分析PartⅡ遙感影像識別

第三章:聚類分析PartⅡ§3-1相似性準(zhǔn)則§3-2聚類準(zhǔn)則函數(shù)§3-3兩種簡單的聚類算法§3-4動態(tài)聚類算法§3-5聚類的評價主要內(nèi)容§3-1相似性準(zhǔn)則主要內(nèi)容課堂回顧廣義線性判別函數(shù)

xy非線性判別函數(shù)分段線性判別函數(shù):距離均值二次判別函數(shù):判別方程課堂回顧廣義線性判別函數(shù)課堂回顧聚類分析符合“物以類聚,人以群分“的原則,它把相似性大的樣本聚集為一個類型,在特征空間里占據(jù)著一個局部區(qū)域。每個局部區(qū)域都形成一個聚合中心,聚合中心代表相應(yīng)類型。相似性準(zhǔn)則:包括距離相似性度量和角度相似性度量。距離相似性度量:歐氏距離、馬氏距離、明氏距離。課堂回顧聚類分析符合“物以類聚,人以群分“的原則,它把相似性課堂回顧在樣本相似性度量的基礎(chǔ)上,聚類分析還需要一定的準(zhǔn)則函數(shù),才能把真正屬于同一類的樣本聚合成一個類型的子集,而把不同類的樣本分離開來。聚類準(zhǔn)則函數(shù):包括誤差平方和準(zhǔn)則、加權(quán)平均平方距離和準(zhǔn)則、類間距離和準(zhǔn)則。誤差平方和準(zhǔn)則(最常用):課堂回顧在樣本相似性度量的基礎(chǔ)上,聚類分析還需要一定的準(zhǔn)則函課后思考線性判別函數(shù)的適用性?聚類分析的優(yōu)缺點?ERDASimageModel工具如何實現(xiàn)聚類?課后思考線性判別函數(shù)的適用性?§3-3兩種簡單的聚類算法本節(jié)介紹兩種簡單的聚類分析方法,它是對某些關(guān)鍵性的元素進行試探性的選取,使某種聚類準(zhǔn)則達到最優(yōu),又稱為基于試探的聚類算法。

采用最近鄰規(guī)則的聚類算法最大最小距離聚類算法§3-3兩種簡單的聚類算法本節(jié)介紹兩種簡單的聚類分1.采用最近鄰規(guī)則的聚類算法

假設(shè)已有混合樣本集,按照最近鄰原則進行聚類,算法如下:①選取距離閾值,并且任取一個樣本作為第一個聚合中心,如:。②計算樣本到的距離:1.采用最近鄰規(guī)則的聚類算法假設(shè)已有混合樣本集③按照某種聚類準(zhǔn)則考察聚類結(jié)果,若不滿意,則重新選取距離閾值、第一個聚合中心,返回②,直到滿意,算法結(jié)束。在樣本分布一定時,該算法的結(jié)果在很大程度上取決于第一個聚合中心的選取和距離閾值的大小?!鈖66該算法的優(yōu)點是簡單,如果有樣本分布的先驗知識用于指導(dǎo)閾值和起始點的選取,則可較快得到合理結(jié)果。對于高維的樣本集來說,則只有經(jīng)過多次試探,并對聚類結(jié)果進行驗算,從而選擇最優(yōu)的聚類結(jié)果。遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件2.最大最小距離聚類算法

該算法以歐氏距離為基礎(chǔ),除首先辨識最遠的聚類中心外,與上述算法相似。用一個例子說明該算法。♂以類間歐式距離最大作為選擇聚類中心的條件。2.最大最小距離聚類算法該算法以歐氏距離為基礎(chǔ),除

遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件遙感影像識別-第三章-聚類分析-Part-Ⅱ要點課件§3-4動態(tài)聚類算法在聚類分析中,動態(tài)聚類法是較普遍采用的方法,該算法首先選擇某種樣本相似性度量和適當(dāng)?shù)木垲悳?zhǔn)則函數(shù),使用迭代算法,在初始劃分的基礎(chǔ)上,逐步優(yōu)化聚類結(jié)果,使準(zhǔn)則函數(shù)達到極值。1.C-均值聚類算法(即:K-均值聚類算法)2.ISODATA聚類算法§3-4動態(tài)聚類算法在聚類分析中,動態(tài)聚類法是較普

算法要解決的關(guān)鍵問題:①首先選擇有代表性的點作為起始聚合中心。若類型數(shù)目已知,則選擇代表點的數(shù)目等于類型數(shù)目;若未知,那么聚類過程要形成的類型數(shù)目,就是一個值得研究的問題。②代表點選擇好之后,如何把所有樣本區(qū)分到以代表點為初始聚合中心的范圍內(nèi),形成初始劃分,是算法的另一個關(guān)鍵問題。算法要解決的關(guān)鍵問題:1.C-均值聚類算法C-均值聚類算法使用的聚類準(zhǔn)則函數(shù)是誤差平方和準(zhǔn)則:

為了使聚類結(jié)果優(yōu)化,應(yīng)該使準(zhǔn)則最小化。1.C-均值聚類算法C-均值聚類算法使用的聚類準(zhǔn)則函數(shù)是誤差

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

(1)C-均值算法(一)(1)C-均值算法(一)

算法特點:①每次迭代中都要考查每個樣本的分類是否正確,若不正確,就要調(diào)整,在全部樣本調(diào)整完之后,再修改聚合中心,進入下一次迭代。如果在某一個迭代運算中,所有的樣本都被正確分類,則樣本不會調(diào)整,聚合中心也不會有變化,也就是收斂了。②c個初始聚合中心的選擇對聚類結(jié)果有較大影響。在算法迭代過程中,樣本分類不斷調(diào)整,因此誤差平方和也在逐步減小,直到?jīng)]有樣本調(diào)整為止,此時不再變化,聚類達到最優(yōu)。但是上述算法中沒有計算值,也就是說不是算法結(jié)束的明顯依據(jù)。

算法特點:

(2)C-均值算法(二)(2)C-均值算法(二)

(2)C-均值算法(二)(2)C-均值算法(二)

(2)C-均值算法(二)(2)C-均值算法(二)

(3)與C的關(guān)系曲線(3)與C的關(guān)系曲線

(3)與C的關(guān)系曲線圖中,曲線的拐點A對應(yīng)著接近最優(yōu)的c值。并非所有的情況都容易找到-C關(guān)系曲線的拐點,此時c值將無法確定。(3)與C的關(guān)系曲線2.ISODATA聚類算法ISODATA算法:IterativeSelf-OrganizingDataAnalysisTechniquesAlgorithm,迭代自組織的數(shù)據(jù)分析算法。ISODATA算法特點:可以通過類的自動合并(兩類合一)與分裂(一類分為二),得到較合理的類型數(shù)目c。2.ISODATA聚類算法ISODATA算法:Iterati

具體算法步驟:⑴給定控制參數(shù):預(yù)期的聚類中心數(shù)目。:每一聚類中最少的樣本數(shù)目,如果少于此數(shù)就不能作為一個獨立的聚類。:一個聚類域中樣本距離分布的標(biāo)準(zhǔn)差(閾值)。:兩個聚類中心之間的最小距離,如果小于此數(shù),兩個聚類合并。:每次迭代允許合并的最大聚類對數(shù)目。:允許的最多迭代次數(shù)。給定n個混合樣本,令(迭代次數(shù)),預(yù)選c個起始聚合中心,,。具體算法步驟:

具體算法步驟:⑵計算每個樣本與聚合中心距離:。若:,則:。把全部樣本劃分到c個聚合中去,且表示各子集中的樣本數(shù)目。⑶判斷:若,則舍去子集,返回②。⑷計算修改聚合中心:。⑸計算類內(nèi)距離平均值:

,具體算法步驟:,

具體算法步驟:⑹計算類內(nèi)總平均距離(全部樣本對其相應(yīng)聚類中心的總平均距離):⑺判別分裂、合并及迭代運算等步驟。(a)如迭代運算次數(shù)已達I次,即最后一次迭代,置,跳到⑾,運算結(jié)束。(b)如,即聚類中心的數(shù)目等于或不到規(guī)定值的一半,則轉(zhuǎn)⑻,將已有的聚類分裂。(c)如迭代運算的次數(shù)是偶數(shù),或,則不進行分裂,跳到⑾,若不符合上述兩個條件,則進入⑻,進行分裂處理。

,具體算法步驟:,

具體算法步驟:⑻計算每個聚合的標(biāo)準(zhǔn)偏差向量:。每個分量為:。表示x的第i個分量,表示的第i個分量。d為維數(shù)。⑼求出每個聚合的最大標(biāo)準(zhǔn)偏差分量:。⑽考查,若有,同時滿足以下兩條件之一,(a),(樣本數(shù)目超過規(guī)定值一倍以上)。(b)。具體算法步驟:

具體算法步驟:則把該集合分為兩個新的聚合,聚合中心分別為:其中:令:返回⑵其中,K的選擇很重要,應(yīng)使中的樣本到的距離不同,但又使樣本全部在這兩個集合中。⑾計算兩兩聚合中心

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論