3主成分分析法34530_第1頁
3主成分分析法34530_第2頁
3主成分分析法34530_第3頁
3主成分分析法34530_第4頁
3主成分分析法34530_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、三  主成分分析方法 地理環(huán)境是多要素的復(fù)雜系統(tǒng),在我們進(jìn)行地理系統(tǒng)分析時(shí),多變量問題是經(jīng)常會(huì)遇到的。變量太多,無疑會(huì)增加分析問題的難度與復(fù)雜性,而且在許多實(shí)際問題中,多個(gè)變量之間是具有一定的相關(guān)關(guān)系的。因此,我們就會(huì)很自然地想到,能否在各個(gè)變量之間相關(guān)關(guān)系研究的基礎(chǔ)上,用較少的新變量代替原來較多的變量,而且使這些較少的新變量盡可能多地保留原來較多的變量所反映的信息?事實(shí)上,這種想法是可以實(shí)現(xiàn)的,這里介紹的主成分分析方法就是綜合處理這種問題的一種強(qiáng)有力的方法。一、主成分分析的基本原理主成分分析是把原來多個(gè)變量化為少數(shù)幾個(gè)綜合指標(biāo)的一種統(tǒng)計(jì)分析方法,從數(shù)學(xué)角度來看,這是一種降

2、維處理技術(shù)。假定有n個(gè)地理樣本,每個(gè)樣本共有p個(gè)變量描述,這樣就構(gòu)成了一個(gè)n×p階的地理數(shù)據(jù)矩陣: (1)如何從這么多變量的數(shù)據(jù)中抓住地理事物的內(nèi)在規(guī)律性呢?要解決這一問題,自然要在p維空間中加以考察,這是比較麻煩的。為了克服這一困難,就需要進(jìn)行降維處理,即用較少的幾個(gè)綜合指標(biāo)來代替原來較多的變量指標(biāo),而且使這些較少的綜合指標(biāo)既能盡量多地反映原來較多指標(biāo)所反映的信息,同時(shí)它們之間又是彼此獨(dú)立的。那么,這些綜合指標(biāo)(即新變量)應(yīng)如何選取呢?顯然,其最簡單的形式就是取原來變量指標(biāo)的線性組合,適當(dāng)調(diào)整組合系數(shù),使新的變量指標(biāo)之間相互獨(dú)立且代表性最好。如果記原來的變量指標(biāo)為x1,x2,xp,

3、它們的綜合指標(biāo)新變量指標(biāo)為z1,z2,zm(mp)。則 (2)在(2)式中,系數(shù)lij由下列原則來決定:(1)zi與zj(ij;i,j=1,2,m)相互無關(guān);(2)z1是x1,x2,xp的一切線性組合中方差最大者;z2是與z1不相關(guān)的x1,x2,xp的所有線性組合中方差最大者;zm是與z1,z2,zm-1都不相關(guān)的x1,x2,xp的所有線性組合中方差最大者。這樣決定的新變量指標(biāo)z1,z2,zm分別稱為原變量指標(biāo)x1,x2,xp的第一,第二,第m主成分。其中,z1在總方差中占的比例最大,z2,z3,zm的方差依次遞減。在實(shí)際問題的分析中,常挑選前幾個(gè)最大的主成分,這樣既減少了變量的數(shù)目,又抓住了

4、主要矛盾,簡化了變量之間的關(guān)系。從以上分析可以看出,找主成分就是確定原來變量xj(j=1,2,p)在諸主成分zi(i=1,2,m)上的載荷lij(i=1,2,m;j=1,2,p),從數(shù)學(xué)上容易知道,它們分別是x1,x2,xp的相關(guān)矩陣的m個(gè)較大的特征值所對應(yīng)的特征向量。二、主成分分析的計(jì)算步驟通過上述主成分分析的基本原理的介紹,我們可以把主成分分析計(jì)算步驟歸納如下:(1) 計(jì)算相關(guān)系數(shù)矩陣 (3)在公式(3)中,rij(i,j=1,2,p)為原來變量xi與xj的相關(guān)系數(shù),其計(jì)算公式為因?yàn)閞是實(shí)對稱矩陣(即rij=rji),所以只需計(jì)算其上三角元素或下三角元素即可。(2)計(jì)算特征值與特征向量首先

5、解特征方程i-r=0求出特征值i(i=1,2,p),并使其按大小順序排列,即12,p0;然后分別求出對應(yīng)于特征值i的特征向量ei(i=1,2,p)。(2) 計(jì)算主成分貢獻(xiàn)率及累計(jì)貢獻(xiàn)率主成分貢獻(xiàn)率:,累計(jì)貢獻(xiàn)率:。一般取累計(jì)貢獻(xiàn)率達(dá)85-95的特征值1,2,m所對應(yīng)的第一,第二,第m(mp)個(gè)主成分。(3) 計(jì)算主成分載荷 (5)由此可以進(jìn)一步計(jì)算主成分得分: (6)三、主成分分析實(shí)例對于某區(qū)域地貌-水文系統(tǒng),其57個(gè)流域盆地的九項(xiàng)地理要素:x1為流域盆地總高度(m)x2為流域盆地山口的海拔高度(m),x3為流域盆地周長(m),x4為河道總長度(km),x5為河表2-14  某57個(gè)

6、流域盆地地理要素?cái)?shù)據(jù)道總數(shù),x6為平均分叉率,x7為河谷最大坡度(度),x8為河源數(shù)及x9為流域盆地面積(km2)的原始數(shù)據(jù)如表2-14所示。張超先生(1984)曾用這些地理要素的原始數(shù)據(jù)對該區(qū)域地貌-水文系統(tǒng)作了主成分分析。下面,我們將其作為主成分分析方法的一個(gè)應(yīng)用實(shí)例進(jìn)行介紹。表2-15相關(guān)系數(shù)矩陣 (1)首先將表2-14中的原始數(shù)據(jù)作標(biāo)準(zhǔn)化處理,由公式(4)計(jì)算得相關(guān)系數(shù)矩陣(見表2-15)。(2)由相關(guān)系數(shù)矩陣計(jì)算特征值,以及各個(gè)主成分的貢獻(xiàn)率與累計(jì)貢獻(xiàn)率(見表2-16)。由表2-16可知,第一,第二,第三主成分的累計(jì)貢獻(xiàn)率已高達(dá)86.5,故只需求出第一,第二,第三主成分z1

7、,z2,z3即可。表2-16  特征值及主成分貢獻(xiàn)率(3)對于特征值1=5.043,2=1.746,3=0.997分別求出其特征向量e1,e2,e3,并計(jì)算各變量x1,x2,x9在各主成分上的載荷得到主成分載荷矩陣(見表2-17)。表2-17  主成分載荷矩陣從表2-17可以看出,第一主成分z1與x1,x3,x4,x5,x8,x9有較大的正相關(guān),這是由于這六個(gè)地理要素與流域盆地的規(guī)模有關(guān),因此第一主成分可以被認(rèn)為是流域盆地規(guī)模的代表:第二主成分z2與x2有較大的正相關(guān),與x7有較大的負(fù)相關(guān),而這兩個(gè)地理要素是與流域切割程度有關(guān)的,因此第二主成分可以被認(rèn)為是流域侵蝕狀況的代表;第三主成分z3與x6有較大的正相關(guān),而地理要素x6是流域比較獨(dú)立的特性河系形態(tài)的表征,因此,第三主成成可以被認(rèn)為是代表河系形態(tài)的主成分。以上分析結(jié)果表明,根據(jù)主成分載荷,該區(qū)域地貌-水文系統(tǒng)的九項(xiàng)地理要素可以被歸為三類,即流

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論