多元統(tǒng)計論文聚類分析論文_第1頁
多元統(tǒng)計論文聚類分析論文_第2頁
多元統(tǒng)計論文聚類分析論文_第3頁
多元統(tǒng)計論文聚類分析論文_第4頁
多元統(tǒng)計論文聚類分析論文_第5頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、多元統(tǒng)計論文聚類分析論文:淺析聚類分析法【摘要】多元統(tǒng)計是研究多個隨機變量之間相互依賴關(guān)系以及內(nèi)在規(guī)律性的一門統(tǒng)計學科?!娟P(guān)鍵詞】多元統(tǒng)計;聚類分析【中圖分類號】g648.4【文章標識碼】b 【文章編號】1326-3587(2011)07-0004-02聚類分析是多元統(tǒng)計中研究“物以類聚”的一種方法。在經(jīng)濟、社會、人口等諸多方面的研究中,都需要采用聚類分析作分析研究。過去人們主要靠經(jīng)驗做定性分類處理,很少利用數(shù)學方法和原理。所以許多的分類往往帶有主觀性和任意性,不能解釋客觀事物內(nèi)在的本質(zhì)差別和聯(lián)系,特別是對于多因素、多指標的分類問題。聚類分析正處于發(fā)展階段,理論上雖然不很完善,但由于它能夠解決

2、許多實際問題,所以現(xiàn)在越來越來多的收到人們的重視。一、聚類分析的基本思想聚類分析方法認為,在所研究的統(tǒng)計總體中,各樣品或指標(變量)之間存在著程度不同的相似性(親疏關(guān)系),因此可以根據(jù)一批樣品的多個觀測指標,找到一些能夠度量其相似程度的統(tǒng)計量,并根據(jù)這些統(tǒng)計量事物的分來進行分類。二、聚類分析的基本概念(1)分類。1、按照其聚類的方法可以分為以下幾種:系統(tǒng)聚類法:開始每個對象自成一類,然后每次將最相似的兩類合并,合并后重新計算新類與其他類的距離或相近性測度。調(diào)優(yōu)類(動態(tài)聚類法):對n個對象初步分類,然后根據(jù)分類的損失函數(shù)盡可能小的原則對其進行調(diào)整,直到分類合理為止。最有分割法:先將n個對象看成一

3、類,然后根據(jù)某種最有準則將它們分割為二類、三類,分割到合理的k類為止。還有模糊聚類法,圖論聚類法和聚類預報法。2、按照對象的不同可以分為q型聚類和r型聚類。其中q型聚類是根據(jù)樣品進行的分類處理,而r型聚類,則是根據(jù)變量。(2)測量尺度:距離和相似系數(shù)。距離和相似系數(shù),是聚類時用來度量其接近或相似程度的統(tǒng)計量。通常的方法,是根據(jù)統(tǒng)計研究對象的特點,設置一些指標并采集一些樣品,如選用n個樣品,p個指標,則可得到一個n*p的數(shù)據(jù)矩陣 。矩陣的意義,可認為是p維空間中的n個點,他們分別代表代表具有p個特性和n個樣品。通??梢赃@樣理解,具有共同特性的樣品在空間上的距離較近或具有較高的相似性,且它們可以用

4、距離或相系系數(shù)去具體刻畫。聚類,是根據(jù)樣品聚類時,用來刻畫其“靠近”程度的;相似系數(shù)是根據(jù)指標聚類時,用類刻畫其相似性或相關(guān)性的。(1)距離,用 表示第i個樣品與第j個樣品之間的距離。最常見,最直觀的距離有絕對值距離和歐氏距離,即:絕對值距離歐氏距離 兩者可以統(tǒng)一為“閔科夫斯基距離(minkowki)”:在刻畫距離時,數(shù)據(jù)的標準化處理往往是必要的。還有蘭氏距離,馬氏距離,斜交空間距離等。(2)相似系數(shù),用 表示第i個指標與第j個指標間的相似系數(shù),其值從0到1,表示從疏遠到密切的程度,常用的相似系數(shù),有夾角余弦和相關(guān)系數(shù),即:它是指標向量之間的夾角余弦,可以證明, =1- 關(guān)系式成立。三、聚類過

5、程以對指標聚類(r型聚類)為例,其聚類過程為:(1)取 =1,把每個指標各作一類,m個指標有m類。(2)取 =max ,將具有相同 的指標歸并為一新類,如n= 。(3)構(gòu)造新的m-1階矩陣。在新的m-1階矩陣中,新類(如n= )與其余類如 (wt,ws)的聚類統(tǒng)計量的計算方法有:最大法 =max , ;最小法 =min , ;加權(quán)法 = + 。(4)取 將具有相同 的指標歸并為又一新類。(5)構(gòu)造新的m-2階矩陣。在新的m-2階矩陣中,該新類與其余類的聚類統(tǒng)計量的計算方法同步驟(3)。仿此繼續(xù)進行聚類,直到所有指標均歸為一類。根據(jù)選取的聚類統(tǒng)計量的不同計算方法,可把聚類過程分為:a、最大統(tǒng)計量法聚類過程;b、最小統(tǒng)計量法聚類過程;c、加權(quán)統(tǒng)計量法聚類過程。其中加權(quán)統(tǒng)計量法聚類過程因 的不同選取將變化多端,如選 即為常用的平均統(tǒng)計量法聚類過程。四、不同聚類方法的比較系統(tǒng)聚類法一次形成類以后就不能改變了,這對分類方法的要求比較高,計算量較高,相應地,對計算機的內(nèi)存要求較高。動態(tài)聚類法具有計算量較小,占用計算機內(nèi)存空間較少,方法簡單的優(yōu)點,適用于大樣本的q型聚類分析?!緟⒖嘉墨I】1、石軍、熊苡,多元統(tǒng)計、聚類分析法在自然資源開發(fā)中的應用山東理工大學學報2、張世強,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論