實(shí)驗(yàn)六 主成分分析.doc_第1頁(yè)
實(shí)驗(yàn)六 主成分分析.doc_第2頁(yè)
實(shí)驗(yàn)六 主成分分析.doc_第3頁(yè)
實(shí)驗(yàn)六 主成分分析.doc_第4頁(yè)
實(shí)驗(yàn)六 主成分分析.doc_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

實(shí)驗(yàn)六 主成分分析一、實(shí)驗(yàn)?zāi)康耐ㄟ^(guò)本次實(shí)驗(yàn),掌握SPSS及ENVI的主成分分析方法。二、有關(guān)概念1 主成分分析的概念主成分分析(又稱因子分析),是將多個(gè)實(shí)測(cè)變量轉(zhuǎn)換為少數(shù)幾個(gè)不相關(guān)的綜合指標(biāo)的多元統(tǒng)計(jì)分析方法。代表各類信息的綜合指標(biāo)就稱為因子或主成份。主成分分析的數(shù)學(xué)模型可寫為:其中,x1、x2、 x3、 x4 xm為原始變量;z1、 z2、 z3、 z4 zn為主成份,且有mn。寫成矩陣形式為:Z=AX。Z為主成份向量,A為主成份變換矩陣,X為原始變量向量。主成份分析的目的是把系數(shù)矩陣A求出,主成份Z1、Z2、Z3在總方差中所占比重依次遞減。從理論上講m=n即有多少原始變量就有多少主成份,但實(shí)際上前面幾個(gè)主成份集中了大部分方差,因此取主成份數(shù)目遠(yuǎn)遠(yuǎn)小于原始變量的數(shù)目,但信息損失很小。因子分析的一個(gè)重要目的還在于對(duì)原始變量進(jìn)行分門別類的綜合評(píng)價(jià)。如果因子分析結(jié)果保證了因子之間的正交性(不相關(guān))但對(duì)因子不易命名,還可以通過(guò)對(duì)因子模型的旋轉(zhuǎn)變換使公因子負(fù)荷系數(shù)向更大(向1)或更小(向0)方向變化,使得對(duì)公因子的命名和解釋變得更加容易。進(jìn)行正交變換可以保證變換后各因子仍正交,這是比較理想的情況。如果經(jīng)過(guò)正交變換后對(duì)公因子仍然不易解釋,也可進(jìn)行斜交旋轉(zhuǎn)。2 因子提取方法SPSS提供的因子提取方法有:Principal components 主成份法。該方法假設(shè)變量是因子的純線性組合。這是SPSS最通用的因子提取方法,故因子分析有時(shí)又稱為主成份分析。Unweighted least square不加權(quán)最小平方法。該方法使觀測(cè)的和再生的相關(guān)陣之差的平方最小。Generalized least square 用變量的單值加權(quán),使觀測(cè)的和再生的相關(guān)陣之差的平方最小。Maximum likelihood 最大似然法。此方法不要求多元正態(tài)分布。給出參數(shù)估計(jì),如果樣本來(lái)自多元正態(tài)總體它們與原始變量的相關(guān)陣極為相似。Principal axis factoring 使用多元相關(guān)的平方作為對(duì)公因子方差的初始估計(jì)。Alpha factoring 因子提取法3 因子旋轉(zhuǎn)方法 SPSS提供的因子旋轉(zhuǎn)方法有: None 不進(jìn)行旋轉(zhuǎn)。此為系統(tǒng)默認(rèn)的選擇項(xiàng)。Varimax方差最大旋轉(zhuǎn)。Equamax 平均正交旋轉(zhuǎn)。Quartmax四次方最大正交旋轉(zhuǎn)。Direct Oblimin 斜交旋轉(zhuǎn),指定此項(xiàng)可以在下面的矩形框中鍵入Delta值,該值應(yīng)該在0-1之間,是因子映象自相關(guān)的范圍。0值產(chǎn)生最高相關(guān)因子,大負(fù)數(shù)產(chǎn)生旋轉(zhuǎn)的結(jié)果與正交接近。三、實(shí)驗(yàn)內(nèi)容1. 在上海市寶山、吳淞地區(qū)的環(huán)境質(zhì)量綜合評(píng)價(jià)中,對(duì)20個(gè)監(jiān)測(cè)點(diǎn)的大氣、地面水和土壤要素進(jìn)行監(jiān)測(cè),得到三種要素的實(shí)測(cè)超標(biāo)倍數(shù)數(shù)據(jù)。本實(shí)驗(yàn)對(duì)這批資料進(jìn)行主成份分析,為進(jìn)一步進(jìn)行環(huán)境綜合分析作準(zhǔn)備。2. 對(duì)2009年錢塘江灣TM影像進(jìn)行主成分分析四、實(shí)驗(yàn)步驟(一)SPSS主成分分析1主成分分析的基本步驟(1)打開“d:SPSS實(shí)習(xí)主成份分析.sav”文件,選擇Analyze菜單下的Data Reduction的Factor項(xiàng),展開主對(duì)話框。(2)在左側(cè)源變量框中選取“大氣超標(biāo)倍數(shù)”、“地面水超標(biāo)倍數(shù)” “土壤超標(biāo)倍數(shù)”變量,進(jìn)入Variables框中,作為參與因子分析的變量。(3)單擊Descriptives按鈕,展開相應(yīng)的子對(duì)話框。在Statistics組中選取Initial solution 選擇項(xiàng),顯示初始分析結(jié)果,給出原始變量的公因子方差、與變量數(shù)目相等的因子、各因子的特征值、各因子特征占總方差的百分比以及累積百分比。在Correlation Matrix組中選取Coefficients,顯示原始變量相關(guān)系數(shù)矩陣。按Continue返回主對(duì)話框。(Statistics組中的Univariate descriptive項(xiàng)要求給出各變量的均數(shù)和標(biāo)準(zhǔn)差;Correlation Matrix組提供以下幾種檢驗(yàn)變量是否適合作因子分析的方法:(4)單擊Extraction按鈕,展開相應(yīng)的子對(duì)話框。 在Method組中選擇Principal components主成份法作為提取公因子的方法;在Extract組中選取Number of factors,并在其右側(cè)框中輸入“2”,指定提取公因子的數(shù)目為2;在Display組中選取Unrotated factor solution及Screen plot選項(xiàng),要求顯示未經(jīng)旋轉(zhuǎn)的因子提取結(jié)果因了載荷碎石圖;Maximum iterations for convergence為因子分析收斂的最大迭代次數(shù),系統(tǒng)默認(rèn)為25;按Continue返回主對(duì)話框。(5)單擊Scores按鈕,展開相應(yīng)的子對(duì)話框。 選取Save as variables 選項(xiàng),即要求將因子得分作為新變量保存在數(shù)據(jù)文件中;在Method組選取Regression選項(xiàng),即因子的得分用回歸法,其因子得分的均值為0(Regression Method: A method for estimating factor score coefficients. The scores that are produced have a mean of 0 and a variance equal to the squared multiple correlation between the estimated factor scores and the true factor values. The scores may be correlated even when factors are orthogonal.);選取Display factor score coeffient matrix,顯示因子得分系數(shù)矩陣;按Continue返回主對(duì)話框(6)單擊OK,提交運(yùn)行。(7)輸出結(jié)果分析。2主成分分析結(jié)果分析輸出結(jié)果分析如下列表6.1表6.6所示:表6.1給出了三個(gè)原始變量的相關(guān)系數(shù)矩陣。表 6.1Correlation Matrix 大氣超標(biāo)倍數(shù)地面水超標(biāo)倍數(shù)土壤超標(biāo)倍數(shù)Correlation大氣超標(biāo)倍數(shù)1.000.124.279 地面水超標(biāo)倍數(shù).1241.000.613 土壤超標(biāo)倍數(shù).279.6131.000表6.2第二列給出原始變量的公因子方差,三個(gè)均為1,三個(gè)變量的公因子方差之總和為3;第三列給出的是使用兩個(gè)因子代替原始變量后對(duì)各原始變量方差解釋的百分比。表 6.2Communalities InitialExtraction大氣超標(biāo)倍數(shù)1.000.987地面水超標(biāo)倍數(shù)1.000.839土壤超標(biāo)倍數(shù)1.000.808Extraction Method: Principal Component Analysis.表6.3為方差解釋表。第一列為主成份名,第二、三、四列分別為第一、二、三主成份的特征值、方差百分比、方差累積百分比;后三列為選用兩個(gè)主成份時(shí)的特征值、方差百分比、方差累積百分比。表 6.3Total Variance ExplainedComponentInitial EigenvaluesExtraction Sums of Squared LoadingsTotal% of VarianceCumulative %Total% of VarianceCumulative %11.72657.53657.5361.72657.53657.5362.90830.26987.806.90830.26987.8063.36612.194100.000 Extraction Method: Principal Component Analysis.表6.4為因子矩陣表。給出原始變量對(duì)第一、第二主成份的貢獻(xiàn)。表 6.4Component Matrix(a)Component12大氣超標(biāo)倍數(shù).484.867地面水超標(biāo)倍數(shù).835-.376土壤超標(biāo)倍數(shù).891-.119Extraction Method: Principal Component Analysis.a 2 components extracted.表6.5為因子得分系數(shù)矩陣。給出第一、第二主成份與原始變量的關(guān)系。根據(jù)該矩陣可以寫出因子的表達(dá)式為:Factor1=0.281*x1*+0.484*x2*+0.516*x3*Factor2=0.955*x1*-0.414*x2*-0.131*x3*可以說(shuō),用這兩個(gè)因子代替三個(gè)原始變量,可以概括原始變量所包含信息的87.806%。表 6.5 Component Score Coefficient MatrixComponent12大氣超標(biāo)倍數(shù).281.955地面水超標(biāo)倍數(shù).484-.414土壤超標(biāo)倍數(shù).516-.131Extraction Method: Principal Component Analysis. Component Scores.表6.6給出了兩主成份間的協(xié)方差矩陣。表 6.6Component Score Covariance MatrixComponent1211.000.0002.0001.000Extraction Method: Principal Component Analysis. Component Scores. 圖6.1可以看出因子1與因子2,以及因子2與因子3之間的特征值之差值比較大,可以初步得出提取兩個(gè)因子將能概括絕大部分信息。圖 6.1注:在“Factor1=0.281*x1*+0.484*x2*+0.516*x3* 及Factor2=0.955*x1*-0.414*x2*-0.131*x3*”中的x1* x2*x3*變量是原始變量做了均值為0處理后的新變量。(二)ENVI主成分分析1. 打開LT51180392009262BJC00下的B1-6及B7, 用Basic Tools下的Layer Stacking進(jìn)行6波段疊合(如圖6-2,拾取Import File選擇疊合的波段,拾取Reorder Files對(duì)波段進(jìn)行排序,建議按B1B7順序),并選擇Output Result to File,將結(jié)果輸出到QT_River文件。圖6-22. 用ROI TOOLS選擇一塊感興趣區(qū)(建議選擇地類比較全的部分),并將子集存為subset文件。3 ENVI 【Transform】-【Principal Components】-【Forward PC Rotate正向PC旋轉(zhuǎn)】-【Compute New Statistics and Rotate】,展開如圖所示對(duì)話框,選中文件,并進(jìn)行空間子集、光譜子集以及掩膜設(shè)置后,按OK,進(jìn)入如圖6-3所示對(duì)話框。圖6-3圖6-44. 在圖6-4對(duì)話框的Stats Subset中,輸入小于1如0.1的值,表示在統(tǒng)計(jì)計(jì)算時(shí)只用到十分之一像元(也可保持缺省值不變,表示統(tǒng)計(jì)全部像元),在Output Stats Filename 中輸入PC_stats,即將統(tǒng)計(jì)結(jié)果放入該文件,并在“Select Subset from Eigenvalues”中選擇Yes, 統(tǒng)計(jì)信息將被計(jì)算,并出現(xiàn)如圖6-5 Select Output PC Bands 對(duì)話框。該對(duì)話框中列出每個(gè)波段和其相應(yīng)的特征值,同時(shí)也列出每個(gè)主成分波段中包含的數(shù)據(jù)方差的累積百分比。在“Number of Output PC Bands”文本框中,鍵入一個(gè)數(shù)字或點(diǎn)擊箭頭按鈕,確定要輸出的波段數(shù),此處可選3,也可保持6不變,看主成份結(jié)果圖。可以看出,前三個(gè)主成份占了原始6個(gè)波段信息的98%以上,因此完全可以用前三個(gè)主成份來(lái)代替原始6個(gè)波段來(lái)進(jìn)行后續(xù)的分類處理。圖6-55. 用【Basic Tools】 -【Statistics】-【View statistics File】工具查看PC_Stats.sta文件信息,在對(duì)話框的Select Plot中,拾取Engevalus, 展開如圖6-6所示對(duì)話框,上方圖表示各主成份的值。圖6-6原始子影像RGB 用Band5、4、3顯示的效果圖 RGB顯示第三、第二、第一主成分的效果圖圖6-7五、思考與練習(xí)1. 對(duì)“某地區(qū)主要污染源數(shù)據(jù)p.xls”中的各污染物排放指標(biāo)進(jìn)行主成分分析,并說(shuō)明分析結(jié)果;再用主成份分析結(jié)果進(jìn)行聚類分析,與實(shí)驗(yàn)四結(jié)果進(jìn)行對(duì)比分析。2. 參照中國(guó)地級(jí)以上城市腹地的測(cè)度分析,試采用ArcGIS分析工具,分析“某地區(qū)主要污染源數(shù)據(jù)p.xls”中各

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論