聚類分析算法論文_第1頁
聚類分析算法論文_第2頁
聚類分析算法論文_第3頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

聚類分析算法論文聚類分析又稱群分析,它是研究(樣品或指標)分類問題的一種統(tǒng)計分析方法,同時也是數(shù)據(jù)挖掘的一個重要算法。下面是小編分享給大家的聚類分析算法論文,歡迎閱讀。聚類分析算法是給定m維空間R中的n個向量,把每個向量歸屬到k個聚類中的某一個,使得每一個向量與其聚類中心的距離最小。聚類可以理解為:類內的相關性盡量大,類間相關性盡量小。聚類問題作為一種無指導的學習問題,目的在于通過把原來的對象集合分成相似的組或簇,來獲得某種內在的數(shù)據(jù)規(guī)律。聚類分析的基本思想是:采用多變量的統(tǒng)計值,定量地確定相互之間的親疏關系,考慮對象多因素的聯(lián)系和主導作用,按它們親疏差異程度,歸入不同的分類中一元,使分類更具客觀實際并能反映事物的內在必然聯(lián)系。也就是說,聚類分析是把研究對象視作多維空間中的許多點,并合理地分成若干類,因此它是一種根據(jù)變量域之間的相似性而逐步歸群成類的方法,它能客觀地反映這些變量或區(qū)域之間的內在組合關系。鹽礦區(qū)系統(tǒng)是一個多層次、復雜的大系統(tǒng),涉及諸多模糊、不確定的因素。平頂山市鹽礦區(qū)的經(jīng)濟分類是以整個平頂山市的所有鹽礦區(qū)為研究對象,以各鹽礦區(qū)為基本單元,以經(jīng)濟為中心,以發(fā)展戰(zhàn)略和合理布局為目標進行經(jīng)濟類型區(qū)劃。其基本原則是:平頂山市的鹽礦區(qū)資源開發(fā)、利用的相對一致性;自然、經(jīng)濟、社會條件的一致性;保持一定行政地域單元的相對穩(wěn)定性?,F(xiàn)行的平頂山市鹽礦區(qū)行政劃分不能反映出各個鹽礦區(qū)的共同點,有必要通過模糊聚類分析將那些經(jīng)濟實際狀況相似的鐵礦區(qū)歸類,剖析、發(fā)現(xiàn)各況礦區(qū)的差異,對癥下藥,為制定發(fā)展對策提供依據(jù)。1、確定分類指標進行經(jīng)濟區(qū)劃分,應考慮的指標因素是多種多樣的。既要以巖鹽礦資源儲量為主,又要適當考慮巖鹽質量和勘察階段和開發(fā)利用狀況;既要有直接指標,又要有間接指標;既要考慮礦區(qū)發(fā)展的現(xiàn)狀,又要考慮礦區(qū)發(fā)展的過程和礦區(qū)發(fā)展的未來方向。參考有關資料,結合專家意見,我們確定了對平頂山市鹽礦區(qū)進行經(jīng)濟區(qū)劃分的指標。如表1所示。表中列舉了具體指標及各指標的原始數(shù)據(jù)(數(shù)據(jù)來源于河南省2006年礦產(chǎn)資源儲量簡表)。表1鹽礦區(qū)經(jīng)濟劃分指標體系及指標數(shù)據(jù)注:表中N表示缺失數(shù)據(jù),勘察階段1、2、3分別表示:初步勘探、詳細普查、詳細勘探,利用狀況1~7分別表示:近期不宜進一步工作、可供進一步工作、近期難以利用、推薦近期利用、計劃近期利用、基建礦區(qū)、開采礦區(qū)。2、轉換指標數(shù)據(jù)由于不同變量之間存在不同量綱由于不同變量之間存在不同量綱、不同數(shù)量級,為使各個變量更具有可比性,有必要對數(shù)據(jù)進行轉換。目前進行數(shù)據(jù)處理的方法大致有三種,即標準化、極差標準化和正規(guī)化。為便于更直觀的比較各市之間同一指標的數(shù)值大小,我們采用了正規(guī)化轉換方式。其計算公式為:為了方便敘述,做如下設定:設Xi(i=1,2,值,0≤Pi≤1,Xs,i(Xs,i=Xmax-Xmin),為第i個評價指標的標準值,Xmax為最大值,Xmin為最③Xmin<Xi<Xmax,則其計算式為:Pi=Xi-Xmin/Xs,i(2)對于越低越好的指標①2Xi≤Xmin,則Pi=1;②Xi≥Xmax,則Pi=0聚類分析的指標數(shù)據(jù)見表2。三、聚類分析1、聚類步驟(Stage).從1~3表示聚類的先后順序。2、個案合并(ClusterCombined)。表示在某步中合并的個案,如第一步中個案1葉縣田莊鹽礦段和個案2葉縣馬莊鹽礦段合并,合并以后用第一項的個案號表示生成的新類。3、相似系數(shù)(Coefficients).據(jù)聚類分析的基本原理,個案之間親密程度最高即相似系數(shù)最接近于1的,最先合并。因此該列中的系數(shù)與第一列的聚類步驟相對應,系數(shù)值從小到大排列。4、新類首次出現(xiàn)的步驟(StageClusterFirstAppears)。對應于各聚類步驟參與合并的兩項中,如果有一個是新生成的類(即由兩個或兩個以上個案合并成的類),則在對應列中顯示出該新類在哪一步第一次生成。如第三步中該欄第一列顯示值為1,表示進行合并的兩項中第一項是在第一步第一次生成的新類。如果值為O,則表示對應項還是個案(不是新類)。5、新類下次出現(xiàn)步驟(NextStage)。表示對應步驟生成的新類將在第幾步與其他個案或新類合并。如第一行的值是11,表示第一步聚類生成的新類將在第11步與其他個案或新類合并。DendrogramusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombine聚類樹狀圖(方法:組間平均連接法)圖清晰的顯示了聚類的全過程。他將實際距離按比例調整到0~25之間,用逐級連線的方式連接性質相近的個案或新類,直至并未一類。在該圖上部的距離標尺上根據(jù)需要(粗分或細分)選定一個劃分類的距離值,然后垂直標尺劃線,該垂線將與水平連線相交,則相交的交點數(shù)即為分類的類別數(shù),相交水平連線所對應的個案聚成一類。例如,選標尺值為5,則聚為3類:葉縣田莊鹽段、葉縣馬莊鹽礦段為一類,葉縣婁莊鹽礦、葉縣五里堡鹽礦段為一類,葉縣姚寨鹽礦為一類。若選標尺值為10,則聚為2類:葉縣田莊鹽段、葉縣馬莊鹽礦段為一類,葉縣婁莊鹽礦、葉縣五里堡鹽礦段、葉縣姚寨鹽礦為一類。四、結論對平頂山市5個鹽礦區(qū)進行經(jīng)濟區(qū)劃分,究竟劃分為幾個區(qū)合適,既不是越多越好,也不是越少越好。劃分經(jīng)濟區(qū)的目的,就是要根據(jù)各鹽礦經(jīng)濟區(qū)資源特點、勘察、開發(fā)的不同,分類指導經(jīng)濟活動,使人們的經(jīng)濟活動更加符合當?shù)氐膶嶋H,使各經(jīng)濟區(qū)能充分發(fā)揮各自的優(yōu)勢,做到揚長避短,趨利避害,達到投人少、產(chǎn)出多,創(chuàng)造良好的經(jīng)濟效益和社會效益之目的。分區(qū)太多,就失去了分區(qū)的意義,分區(qū)太少,則分類指導很難做到有的放矢。綜合以上聚類分析結果,我們可以得出三個方案。其中兩個方案比較合適,可供選擇。方案一當比例尺為5時,分為3類)葉縣田莊鹽段、葉縣馬莊鹽礦段為一類,葉縣婁莊鹽礦、葉縣五里堡鹽礦段為一類,葉縣姚寨鹽礦為一類。從聚類分析中看出平頂山市鹽礦區(qū)分類圖方案一。方案二:(當比例尺為10時,分為2類)葉縣田莊鹽段、葉縣馬莊鹽礦段為一類,葉縣婁莊鹽礦、葉縣五里堡鹽礦段、葉縣姚寨鹽礦為一類。從聚類分析中看出平頂山市鹽礦區(qū)分類圖方案二。平頂山市鹽礦區(qū)分類圖方案2聚類分析的原理就是將礦石質量、資源儲量、勘查階段、利用狀況相近或相類似的礦區(qū)聚合在一起,其分析結果也是直觀易見的。在此結合平頂山市實際行政區(qū)劃以及礦山企業(yè)特征我們對鐵礦區(qū)劃分做一個調整使其理論與實際能夠結合的更緊密使其更好的指導實踐。1、葉縣田莊鹽段、葉縣馬莊鹽礦段為一類,這一類屬于礦床規(guī)模相當,資源儲量接近,勘查開發(fā)階段接近,利用程度相當,故,可以分為一類。2、葉縣婁莊鹽礦、葉縣五里堡鹽礦段為一類,這一類屬于勘查開發(fā)階段處于同一階段。3、葉縣姚寨鹽礦為一類,這一類屬于儲量較高,鹽礦品位較高,故其勘察開采規(guī)劃有別于其它兩類??偟恼f來,運用聚類分析是基本成功的,大部分的分類是符合實際的。綜合以上論述鹽礦區(qū)劃分如下表所示:當然聚類分析有其優(yōu)點也有其缺點:(1)優(yōu)點:聚類分析模型的優(yōu)點就是直觀,結論形式簡明。(2)缺點:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論