版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
聚類分析法預(yù)測(cè)第1頁,共88頁,2023年,2月20日,星期二聚類分析原理介紹什么是自然分組結(jié)構(gòu)Naturalgrouping?我們看看以下的例子:有16張牌如何將他們分為一組一組的牌呢?AKQJ第2頁,共88頁,2023年,2月20日,星期二聚類分析原理介紹分成四組每組里花色相同組與組之間花色相異AKQJ花色相同的牌為一副Individualsuits第3頁,共88頁,2023年,2月20日,星期二聚類分析原理介紹分成四組符號(hào)相同的牌為一組AKQJ符號(hào)相同的的牌Likefacecards第4頁,共88頁,2023年,2月20日,星期二聚類分析原理介紹分成兩組顏色相同的牌為一組AKQJ顏色相同的配對(duì)Blackandredsuits第5頁,共88頁,2023年,2月20日,星期二聚類分析原理介紹分成兩組大小程度相近的牌分到一組AKQJ大配對(duì)和小配對(duì)Majorandminorsuits第6頁,共88頁,2023年,2月20日,星期二聚類分析原理介紹這個(gè)例子告訴我們,分組的意義在于我們?cè)趺炊x并度量“相似性”Similar因此衍生出一系列度量相似性的算法AKQJ大配對(duì)和小配對(duì)Majorandminorsuits第7頁,共88頁,2023年,2月20日,星期二YOURSITEHERE第一節(jié)引言第二節(jié)聚類統(tǒng)計(jì)量第三節(jié)系統(tǒng)聚類法第四節(jié)動(dòng)態(tài)聚類法主要內(nèi)容第8頁,共88頁,2023年,2月20日,星期二YOURSITEHERE第一節(jié)引言第9頁,共88頁,2023年,2月20日,星期二YOURSITEHERE人類認(rèn)識(shí)事物、認(rèn)識(shí)世界,往往從分類開始。聚類分析和判別分析是研究事物分類的基本方法。在數(shù)學(xué)分類和模式識(shí)別中,有兩類問題:第一類問題:研究對(duì)象存在一個(gè)事前分類,將未知個(gè)體歸屬于其中的一類——判別分析(有監(jiān)督或稱有導(dǎo)師的Supervised,樣品的類別屬性是“被標(biāo)記了”的labeled)另一類問題:不存在一個(gè)事前分類,對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行分類(分組)——聚類分析(無監(jiān)督或稱無導(dǎo)師的Unsupervised)第10頁,共88頁,2023年,2月20日,星期二YOURSITEHERE判別分析數(shù)據(jù)格式第11頁,共88頁,2023年,2月20日,星期二YOURSITEHERE聚類分析數(shù)據(jù)格式第12頁,共88頁,2023年,2月20日,星期二YOURSITEHERE在地學(xué)領(lǐng)域中,經(jīng)常面臨著大量的分類問題,即對(duì)一定量的事物(如地質(zhì)體、樣品或變量)按其屬性進(jìn)行歸類。由于地質(zhì)對(duì)象的復(fù)雜性,單靠定性標(biāo)志或少數(shù)定量標(biāo)志進(jìn)行分類,常常不能揭示客觀事物內(nèi)在本質(zhì)的差別和聯(lián)系,難以確定地質(zhì)體本質(zhì)屬性的歸屬。同時(shí)也造成很多分類計(jì)算具有很大的主觀性和任意性,而且所得的結(jié)果因人而異,常不能反映客觀實(shí)際情況。地學(xué)研究中的分類問題較多,如巖石分類、礦物分類、構(gòu)造期次研究、古氣候古環(huán)境劃分等,這些都有可能需要利用聚類分析來研究。第13頁,共88頁,2023年,2月20日,星期二YOURSITEHERE聚類分析是一種研究分類問題的多元統(tǒng)計(jì)方法。聚類分析的職能是建立一種分類方法,它將一批樣品或變量,按照它們?cè)谛再|(zhì)上的親疏、相似程度進(jìn)行分類。聚類分析的出發(fā)點(diǎn)是研究對(duì)象之間可能存在的相似性和親疏關(guān)系。所以,根據(jù)研究對(duì)象之間各種特征標(biāo)志的相似程度或相關(guān)程度的大小,可將它們進(jìn)行分類歸組。物以類聚,人以群分第14頁,共88頁,2023年,2月20日,星期二YOURSITEHERE聚類分析的分類原則是①同一類中的分類對(duì)象在某種意義上趨于彼此相似(有較大的相似性);②不同類中的分類對(duì)象趨于不相似(有很大的差異)。聚類分析的目的是把分類對(duì)象按一定規(guī)則分成若干類,這些類不是事先給定的,而是根據(jù)數(shù)據(jù)的特征而確定。第15頁,共88頁,2023年,2月20日,星期二YOURSITEHERE根據(jù)已知數(shù)據(jù),計(jì)算各觀察個(gè)體或變量之間親疏關(guān)系的統(tǒng)計(jì)量(距離、相關(guān)系數(shù)等),根據(jù)某種準(zhǔn)則(最短距離法、最長距離法、中間距離法、重心法等),使同一類內(nèi)的差別較小,而類與類之間的差別較大,最終將觀察個(gè)體或變量分為若干類。聚類分析基本思想第16頁,共88頁,2023年,2月20日,星期二YOURSITEHERE兩個(gè)“距離”概念按照遠(yuǎn)近程度來聚類需要明確兩個(gè)概念:一個(gè)是點(diǎn)和點(diǎn)之間的距離,一個(gè)是類和類之間的距離。點(diǎn)間距離有很多定義方式。最簡(jiǎn)單的是歐氏距離,還有其他的距離。當(dāng)然還有一些和距離相反但起同樣作用的概念,比如相似性等,兩點(diǎn)越相似度越大,就相當(dāng)于距離越短。由一個(gè)點(diǎn)組成的類是最基本的類;如果每一類都由一個(gè)點(diǎn)組成,那么點(diǎn)間的距離就是類間距離。但是如果某一類包含不止一個(gè)點(diǎn),那么就要確定類間距離,第17頁,共88頁,2023年,2月20日,星期二YOURSITEHERE類間距離是基于點(diǎn)間距離定義的:比如兩類之間最近點(diǎn)之間的距離可以作為這兩類之間的距離,也可以用兩類中最遠(yuǎn)點(diǎn)之間的距離作為這兩類之間的距離;當(dāng)然也可以用各類的中心之間的距離來作為類間距離。在計(jì)算時(shí),各種點(diǎn)間距離和類間距離的不同選擇,其結(jié)果會(huì)有所不同,但一般不會(huì)差太多。第18頁,共88頁,2023年,2月20日,星期二YOURSITEHERE聚類分析的分類按聚類方法分系統(tǒng)聚類法,也叫分層聚類法,
hierarchicalcluster動(dòng)態(tài)聚類法,也叫快速聚類法quickcluster
逐步聚類、迭代聚類 k-均值聚類k-meanscluster最優(yōu)分割法(有序樣品聚類法)模糊聚類法圖論聚類法聚類預(yù)報(bào)法等第19頁,共88頁,2023年,2月20日,星期二YOURSITEHERE按聚合方式分聚合法:分類開始時(shí)每個(gè)樣品自成一類。最常用,分類結(jié)果常用分類譜系圖表達(dá)。分裂法:分類開始將全部樣品看成一類。通常只能是求局部最優(yōu)解的方法。調(diào)優(yōu)法:首先對(duì)樣品進(jìn)行粗糙的分個(gè)類。動(dòng)態(tài)聚類法就是其中最典型的方法。加入法:業(yè)已存在一個(gè)分類結(jié)果,確定每個(gè)新加入樣品在分類結(jié)構(gòu)中最合適的位置。等聚類分析的分類第20頁,共88頁,2023年,2月20日,星期二YOURSITEHERE聚類分析的分類按聚類對(duì)象Q型聚類:對(duì)樣品的聚類(cases)R型聚類:對(duì)變量的聚類(variables)R型聚類和Q型聚類這兩種聚類在數(shù)學(xué)處理上是對(duì)稱的,沒有什么不同。
第21頁,共88頁,2023年,2月20日,星期二YOURSITEHERER型聚類分析和Q型聚類分析研究變量之間的相似程度,對(duì)變量進(jìn)行分組。從幾何意義上說,是以N個(gè)樣品為坐標(biāo)軸,每個(gè)變量視為坐標(biāo)空間的一點(diǎn)或一個(gè)向量,研究樣本空間變量點(diǎn)之間的關(guān)系。1.R型聚類分析(對(duì)變量的聚類)如研究控礦地質(zhì)因素及礦化標(biāo)志間的相關(guān)關(guān)系,多用于礦物,化學(xué)元素等方面的分組,以助于礦床成因問題的研究。樣品2樣品3樣品1變量1變量2變量3是一種降維的方法第22頁,共88頁,2023年,2月20日,星期二YOURSITEHERER型聚類分析和Q型聚類分析研究樣品之間的相似程度,對(duì)樣品進(jìn)行分類。從幾何意義上說,是以P個(gè)變量為坐標(biāo)軸,每個(gè)樣品視為p維空間中一點(diǎn)或一個(gè)向量,研究樣本空間樣品點(diǎn)之間的關(guān)系。2.Q型聚類分析(對(duì)樣品的聚類)變量2變量3變量1樣品1樣品2樣品3第23頁,共88頁,2023年,2月20日,星期二YOURSITEHERE對(duì)礦床統(tǒng)計(jì)預(yù)測(cè)來說,主要是進(jìn)行Q型聚類。(1)對(duì)研究區(qū)所劃分的單元,可視為樣品,各單元所測(cè)定的各種地質(zhì)特征作為變量構(gòu)成原始數(shù)據(jù)組。(2)各單元成礦遠(yuǎn)景的好壞,決定于單元內(nèi)有利成礦地質(zhì)因素及礦化標(biāo)志的發(fā)育程度,根據(jù)這些地質(zhì)因素和標(biāo)志的相似程度對(duì)單元進(jìn)行歸類分組。這實(shí)際上是一種對(duì)地質(zhì)環(huán)境的分類。(3)然后,據(jù)分類中已知有礦和已知無礦單元的分類歸組,結(jié)合地質(zhì)條件分析,相對(duì)地評(píng)價(jià)各未知單元的成礦遠(yuǎn)景。第24頁,共88頁,2023年,2月20日,星期二YOURSITEHERE第二節(jié)聚類統(tǒng)計(jì)量樣品Case變量Variable第25頁,共88頁,2023年,2月20日,星期二YOURSITEHERE絕對(duì)值距離歐氏距離閔可夫斯基距離切比雪夫距離方差加權(quán)距離蘭氏距離馬哈拉諾比斯距離夾角余弦相似系數(shù)距離系數(shù)聚類統(tǒng)計(jì)量(也稱相似性統(tǒng)計(jì)量)dij|Cij|,|rij|越接近于1,相似程度越高Cij|dij|越小,相似程度越高Q型聚類統(tǒng)計(jì)量R型聚類統(tǒng)計(jì)量相關(guān)系數(shù)rij第26頁,共88頁,2023年,2月20日,星期二YOURSITEHERE樣品xi=(xi1,xi2,…,xip)樣品xj=(xi1,xi2,…,xip)間的距離絕對(duì)值距離歐氏距離閔可夫斯基距離切比雪夫距離第27頁,共88頁,2023年,2月20日,星期二YOURSITEHERE樣品xi=(xi1,xi2,…,xip)樣品xj=(xi1,xi2,…,xip)間的距離方差加權(quán)距離蘭氏距離馬氏距離(要求xij>0)第28頁,共88頁,2023年,2月20日,星期二YOURSITEHERE變量xi=(x1i,x2i,…,xni)T變量xj=(x1i,x2i,…,xnj)T間的相似系數(shù)夾角余弦相關(guān)系數(shù)第29頁,共88頁,2023年,2月20日,星期二YOURSITEHERE樣品2樣品3樣品1變量1變量2變量3變量2變量3變量1樣品1樣品2樣品3距離系數(shù)夾角余弦第30頁,共88頁,2023年,2月20日,星期二
距離系數(shù)是一個(gè)衡量空間兩點(diǎn)之間相似程度的統(tǒng)計(jì)量,距離系數(shù)越小,兩點(diǎn)越相似。條件:直角坐標(biāo)系,要求變量是獨(dú)立的。距離系數(shù)在二維情況下第31頁,共88頁,2023年,2月20日,星期二第32頁,共88頁,2023年,2月20日,星期二N個(gè)樣品,P個(gè)指標(biāo)R型:變量P個(gè)指標(biāo)Q型:樣品N個(gè)指標(biāo)第33頁,共88頁,2023年,2月20日,星期二將N個(gè)樣品的兩兩間的距離系數(shù)求出來,可排一個(gè)距離系數(shù)矩陣第34頁,共88頁,2023年,2月20日,星期二
相似系數(shù)是衡量空間兩個(gè)向量相似性的一個(gè)指標(biāo),相似系數(shù)越大,兩個(gè)向量越相似。相似系數(shù)第35頁,共88頁,2023年,2月20日,星期二第36頁,共88頁,2023年,2月20日,星期二將N個(gè)樣品相似系數(shù)求出來,排成一個(gè)相似系數(shù)矩陣第37頁,共88頁,2023年,2月20日,星期二相關(guān)系數(shù)
相關(guān)系數(shù)是衡量變量之間相關(guān)程度的一個(gè)指標(biāo),變量xi與xj的相關(guān)系數(shù)定義為:
第38頁,共88頁,2023年,2月20日,星期二第39頁,共88頁,2023年,2月20日,星期二YOURSITEHERE距離和相似系數(shù)之間的轉(zhuǎn)換一般說來,距離越小,兩樣品之間關(guān)系越密切,而相似系數(shù)越大,兩變量之間關(guān)系越密切。為了聚類方便起見,可以用下面的公式從相關(guān)系數(shù)得到變量間的距離。dij2=1-rij2
第40頁,共88頁,2023年,2月20日,星期二YOURSITEHERE第三節(jié)系統(tǒng)聚類法hierarchicalclusteringmethod系統(tǒng)聚類方式:聚合法:先視每個(gè)為一類,再合并為幾大類分裂法:先視為一大類,再分成幾類可用于Q型聚類和R型聚類第41頁,共88頁,2023年,2月20日,星期二YOURSITEHERE開始時(shí)將每個(gè)樣品(或變量)都視為一類,然后將各樣品(或變量)相互之間兩兩加以比較,根據(jù)聚類統(tǒng)計(jì)量逐步歸類,關(guān)系密切的聚合到一個(gè)小的分類單位,關(guān)系疏遠(yuǎn)的聚合到一個(gè)較大的分類單位,直到把所有樣品(或變量)都聚合并為一大類完畢為止,形成一個(gè)由小到大的分類系統(tǒng),并繪制聚類譜系圖,把樣品之間的親疏關(guān)系簡(jiǎn)明直觀地展示出來。一、系統(tǒng)聚類的特點(diǎn)第42頁,共88頁,2023年,2月20日,星期二YOURSITEHERE二、系統(tǒng)聚類的基本思路和做法(1)先將待聚類的n個(gè)樣品(或者變量)各作為一類;(2)選定聚類統(tǒng)計(jì)量,計(jì)算每?jī)蓚€(gè)類之間的聚類統(tǒng)計(jì)量,將關(guān)系最密切的兩類并為一類,其余不變,即得n-1類。再按前面的計(jì)算方法,計(jì)算新類與其它類之間的距離(或者相似系數(shù)),再將關(guān)系最密切的兩類并為一類,其余不變,即得n-2類;(3)如此繼續(xù)下去,每次重復(fù)都減少一類,直到最后所有所有樣品(或變量)歸為一類為止。第43頁,共88頁,2023年,2月20日,星期二YOURSITEHEREX=1.02.02.54.52.02.04.01.54.02.5x1x2相似性標(biāo)尺k=1k=2k=3k=4012345012345第44頁,共88頁,2023年,2月20日,星期二YOURSITEHERE任給兩類,Gk,Gl
,規(guī)定其類間距離為兩類樣品間的最短距離,若類Gk與Gl合并成一個(gè)新類Gm,則Gm與任一類Gr的距離為多少?GkGlGrGm記類Gk與類Gl之間的距離為Dkl
d(xi,xj)表示點(diǎn)xi∈Gk和xj∈Gl之間的距離最短距離三、類間距離問題:當(dāng)最親近的兩個(gè)樣品合并為一個(gè)類時(shí),則形成一個(gè)樣品集團(tuán),即p維空間中的一個(gè)點(diǎn)群。如何度量類與類之間的距離?第45頁,共88頁,2023年,2月20日,星期二YOURSITEHERE1.最短距離法(singlelinkage)2.最長距離法(completelinkage)3.中間距離法(medianlinkage)4.重心法(centroidmethod)5.類平均法(averagelinkage)6.可變類平均法(flexible-betamethod)7.可變法8.離差平方和法(亦稱Ward法,Ward'sminimum-variancemethod)等以上聚類方法的計(jì)算步驟完全相同,僅類與類之間的定義不同。四、系統(tǒng)聚類方法第46頁,共88頁,2023年,2月20日,星期二YOURSITEHERE四、譜系圖的形成和應(yīng)用聚類的原則(譜系圖的形成過程)一步形成法多步形成法第47頁,共88頁,2023年,2月20日,星期二YOURSITEHERE①若選出的一對(duì)樣品在已經(jīng)分好的組中都未出現(xiàn)過,則把它們形成一個(gè)新組。(形成新類)②若選出的一對(duì)樣品中,有一個(gè)出現(xiàn)在已經(jīng)分好的組里,則把另一個(gè)也加入到該組。(加入類中)③若選出的兩個(gè)樣品,它們分別出現(xiàn)在已經(jīng)分好的兩組中,則把這兩個(gè)組連在一起。(合并兩類)④若選出的兩個(gè)樣品都出現(xiàn)在同一組中,則不須再分組。(不再分類)聚合歸類時(shí)一般應(yīng)遵從以下四條原則:按上述四條原則反復(fù)進(jìn)行,直到將所有的樣品(或變量)都聚合完畢為止。最終可形成譜系圖,也稱樹狀圖。1.聚類的原則(譜系圖的形成過程)第48頁,共88頁,2023年,2月20日,星期二YOURSITEHERE2.一步形成法(一次計(jì)算分類法)一步形成法是一種最簡(jiǎn)單的聚類方法,計(jì)算量不大。它由距離矩陣或相似性系數(shù)矩陣出發(fā)得到最終的分類結(jié)果。方法原理:根據(jù)距離或相似系數(shù)的大小,依次將諸樣品(或變量)歸類連接起來,形成一個(gè)從小類到大類的分類系統(tǒng)。在連接過程中,要遵循前述四條原則。第49頁,共88頁,2023年,2月20日,星期二YOURSITEHERE例:對(duì)鄂東7個(gè)矽卡巖體的化探資料的Q型聚類分析。距離矩陣連接表123456第50頁,共88頁,2023年,2月20日,星期二YOURSITEHERE根據(jù)相似性水平的地質(zhì)意義對(duì)譜系圖進(jìn)行分組,并對(duì)每組作出地質(zhì)解釋。相似性水平的不同反映了要求精度的差別,其結(jié)果表現(xiàn)為分組的粗細(xì)不同。58795680839810200.20.40.60.81.0Cu/W/Mo型Cu型Cu礦化Cu第51頁,共88頁,2023年,2月20日,星期二一次形成法(相似系數(shù))1)對(duì)原始數(shù)據(jù)進(jìn)行變換2)計(jì)算相似系數(shù)
第52頁,共88頁,2023年,2月20日,星期二3)用一次形成法形成分群圖
1X1
X4
0.9907劃去4行4列X1X2X3X4X5X6X1X2X3X4X5X6第53頁,共88頁,2023年,2月20日,星期二1X1X40.99072X5
X6
0.9886劃去6行6列X1X2X3X4X5X6X1X2X3X4X5X6第54頁,共88頁,2023年,2月20日,星期二劃去3行3列X1X2X3X4X5X6X1X2X3X4X5X61X1X40.9907X5
X6
0.9886X2X30.9843第55頁,共88頁,2023年,2月20日,星期二劃去5行5列X1X2X3X4X5X6X1X2X3X4X5X61X1X40.9907X5
X6
0.9886X2X30.9843X2X3X5X60.9664第56頁,共88頁,2023年,2月20日,星期二劃去2行2列X1X2X3X4X5X6X1X2X3X4X5X61X1X40.9907X5
X6
0.9886X2X30.9843X2X3X5X60.9664X1X4X2X3X5X60.9624第57頁,共88頁,2023年,2月20日,星期二聚類譜系圖1X1X40.9907X5
X6
0.9886X2X30.9843X2X3X5X60.9664X1X4X2X3X5X60.9624第58頁,共88頁,2023年,2月20日,星期二優(yōu)點(diǎn):方法簡(jiǎn)單,易于操作,工作量小。缺點(diǎn):一次形成法有缺點(diǎn),很可能把不相似的樣品歸入一類,如上例中第四次挑了X2和X5,按分類原則就把X2、X3和X5、X6劃為了一類,但X6是否與X2相似,X3是否與X5相似就沒有定量標(biāo)準(zhǔn)1X1X40.9907X5
X6
0.9886X2X30.9843X2X3X5X60.9664X1X4X2X3X5X60.9624第59頁,共88頁,2023年,2月20日,星期二第60頁,共88頁,2023年,2月20日,星期二第61頁,共88頁,2023年,2月20日,星期二第62頁,共88頁,2023年,2月20日,星期二第63頁,共88頁,2023年,2月20日,星期二YOURSITEHERE2.多步形成法(逐步計(jì)算成群法)與一步形成法基本步驟相似,唯一的區(qū)別是每一步分類后,要把分過類變量合并成為一個(gè)新的變量,即在相關(guān)系數(shù)矩陣中劃出最大的元素,將相應(yīng)的變量合并,賦予新的記號(hào),把合并的變量的數(shù)據(jù)加權(quán)平均作為新的變量的數(shù)據(jù),再計(jì)算合并后新變量與其余各變量的相關(guān)系數(shù),建立新的相關(guān)矩陣,再進(jìn)行下一步分類,重復(fù)這一過程直到把所有變量都合并為一類。最后按歸類作譜系圖。以距離作為聚類統(tǒng)計(jì)量(Q型聚類)情形: 見前關(guān)于類間距離的系統(tǒng)聚類方法以相關(guān)系數(shù)作為聚類統(tǒng)計(jì)量(R型聚類)情形:
(1)轉(zhuǎn)換成距離來處理
(2)連續(xù)計(jì)算相關(guān)系數(shù)矩陣第64頁,共88頁,2023年,2月20日,星期二(1)計(jì)算樣品(或變量)間的相似性系數(shù)矩陣,挑出關(guān)系最密切的樣品對(duì)(或變量對(duì))(2)把挑出的成對(duì)樣品或樣品組(變量或變量組)的值做加權(quán)平均,形成一個(gè)新的樣品(或變量)數(shù)據(jù)(3)把原有兩個(gè)樣品或代表樣品組(變量或代表變量組)的數(shù)據(jù)刪除掉,一般習(xí)慣把新數(shù)據(jù)放在序號(hào)小的樣品數(shù)據(jù)上(4)對(duì)新形成的樣品(變量)數(shù)據(jù)與剩余樣品(變量)數(shù)據(jù)重新計(jì)算相似性系數(shù),再從中挑出關(guān)系最密切的樣品。重復(fù)(2)(3)(4)步驟,直到把所有樣品(變量)歸類完為止。第65頁,共88頁,2023年,2月20日,星期二第66頁,共88頁,2023年,2月20日,星期二第67頁,共88頁,2023年,2月20日,星期二第68頁,共88頁,2023年,2月20日,星期二第69頁,共88頁,2023年,2月20日,星期二第70頁,共88頁,2023年,2月20日,星期二第71頁,共88頁,2023年,2月20日,星期二選擇滲透率、孔隙度、平均孔隙半徑、分選系數(shù)、特征結(jié)構(gòu)參數(shù)、排驅(qū)壓力、飽和度中值壓力7個(gè)參數(shù),儲(chǔ)層分成3類第72頁,共88頁,2023年,2月20日,星期二依據(jù)樣品間歐式距離系數(shù)相似性第73頁,共88頁,2023年,2月20日,星期二第74頁,共88頁,2023年,2月20日,星期二第75頁,共88頁,2023年,2月20日,星期二第76頁,共88頁,2023年,2月20日,星期二第77頁,共88頁,2023年,2月20日,星期二第78頁,共88頁,2023年,2月20日,星期二第79頁,共88頁,2023年,2月20日,星期二YOURSITEHERE第四節(jié)動(dòng)態(tài)聚類法也叫快速聚類法、逐步聚類、迭代聚類quickclustermethod,k-meansmodel樣本量很大,用系統(tǒng)聚類法計(jì)算的工作量極大,作出的樹狀圖也十分復(fù)雜,不便于分析第80頁,共88頁,2023年,2月20日,星期二YOURSITEHERE(1)選取若干樣品作為初始凝聚點(diǎn)(給出允許分類的最大個(gè)數(shù)k);(2)計(jì)算各樣品與各凝聚點(diǎn)的距離,并作初始分類;(3)根據(jù)初始分類,計(jì)算各類重心,用重心代替初始凝聚點(diǎn),進(jìn)行第二次分類;(4)重復(fù)(2)步,直至所有樣品都不再調(diào)整,分類達(dá)到穩(wěn)定為止(稱為聚類過程收斂)動(dòng)態(tài)聚類的基本思想首先將樣品粗略地分為若干類,然后在按照某種原則逐步修改直到合理的分類為止。計(jì)算步驟:選凝聚點(diǎn),作初始分類調(diào)整不適合點(diǎn)——修改分類第81頁,共88頁,2023年,2月20日,星期二YOURSITEHERE小結(jié)第82頁,共88頁,2023年,2月20日,星期二YOURSITEHERE與多元分析的其他方法相比,盡管聚類分析較為粗糙,沒有明顯的理論性,但應(yīng)用方面取得了很大成功,確實(shí)是模式識(shí)別研究中非常有用的一類技術(shù)。(1)綜合性:Q
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度人工智能與物聯(lián)網(wǎng)融合股權(quán)投資股權(quán)轉(zhuǎn)讓合同(0620版)
- 2025年度新能源合同履行擔(dān)保體系構(gòu)建與實(shí)施
- 2025年固井工程地質(zhì)勘察承包合同
- 2025年度叉車租賃及設(shè)備維護(hù)合同模板
- 二零二四年度職業(yè)技能培訓(xùn)中心新生入學(xué)合同3篇
- 2025年度國際文化演出交流活動(dòng)組織合同范本
- 2025年度回遷安置房買賣合同解除條件范本
- 2025年知識(shí)產(chǎn)權(quán)授權(quán)合同終止及后續(xù)權(quán)益保障協(xié)議
- 2025年度新能源儲(chǔ)能技術(shù)股權(quán)分配與市場(chǎng)拓展合同
- 2025年度荒山荒地林業(yè)資源承包合同范本
- 0-9任意四位數(shù)手機(jī)密碼排列組合全部數(shù)據(jù)列表
- 2023高考語文文言文復(fù)習(xí):《說苑》練習(xí)題(含答案解析)
- VW-Formel-Q審核提問表(完整版)
- 物業(yè)客服溝通技巧培訓(xùn)課件
- 工程造價(jià)咨詢服務(wù)方案(技術(shù)方案)
- 整體租賃底商運(yùn)營方案(技術(shù)方案)
- 常用藥物作用及副作用課件
- 小學(xué)生作文方格紙A4紙直接打印版
- 幼兒阿拉伯?dāng)?shù)字描紅(0-100)打印版
- 標(biāo)桿地產(chǎn)集團(tuán) 研發(fā)設(shè)計(jì) 工程管理 品質(zhì)地庫標(biāo)準(zhǔn)研發(fā)成果V1.0
- 2023年1月浙江高考英語聽力試題及答案(含MP3+錄音原文)
評(píng)論
0/150
提交評(píng)論