![實例說明利用Excel進行主成分分析_第1頁](http://file4.renrendoc.com/view/4481f9dcb0416ceed722fc21fd59859c/4481f9dcb0416ceed722fc21fd59859c1.gif)
![實例說明利用Excel進行主成分分析_第2頁](http://file4.renrendoc.com/view/4481f9dcb0416ceed722fc21fd59859c/4481f9dcb0416ceed722fc21fd59859c2.gif)
![實例說明利用Excel進行主成分分析_第3頁](http://file4.renrendoc.com/view/4481f9dcb0416ceed722fc21fd59859c/4481f9dcb0416ceed722fc21fd59859c3.gif)
![實例說明利用Excel進行主成分分析_第4頁](http://file4.renrendoc.com/view/4481f9dcb0416ceed722fc21fd59859c/4481f9dcb0416ceed722fc21fd59859c4.gif)
![實例說明利用Excel進行主成分分析_第5頁](http://file4.renrendoc.com/view/4481f9dcb0416ceed722fc21fd59859c/4481f9dcb0416ceed722fc21fd59859c5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
PAGE4方法:1利用Excel2000進行主成分分析第一步,錄入數(shù)據(jù),并對進行標準化?!纠恳唤M古生物腕足動物貝殼標本的兩個變量:長度和寬度。圖1原始數(shù)據(jù)和標準化數(shù)據(jù)及其均值、方差(取自張超、楊秉庚《計量地理學基礎》)計算的詳細過程如下:=1\*GB2⑴將原始數(shù)據(jù)繪成散點圖(圖2)。主持分分析原則上要求數(shù)據(jù)具有線性相關趨勢——如果數(shù)據(jù)之間不相關(即正交),則沒有必要進行主成分分析,因為主成分分析的目的就是用正交的變量代替原來非正交的變量;如果原始數(shù)據(jù)之間為非線性關系,則有必要對數(shù)據(jù)進行線性轉換,否則效果不佳。從圖2可見,原始數(shù)據(jù)具有線性相關趨勢,且測定系數(shù)R2=0.4979,相應地,相關系數(shù)R=0.7056。=2\*GB2⑵對數(shù)據(jù)進行標準化。標準化的數(shù)學公式為這里假定按列標準化,式中,分別為第j列數(shù)據(jù)的均值和標準差,為第i行(即第i個樣本)、第j列(即第j個變量)的數(shù)據(jù),為相應于的標準化數(shù)據(jù),為樣本數(shù)目。圖2原始數(shù)據(jù)的散點圖圖3標準化數(shù)據(jù)的散點圖圖8協(xié)方差選項框=4\*GB2⑷計算特征根。我們已經(jīng)得到相關系數(shù)矩陣為,而二階單位矩陣為,于是根據(jù)公式,我們有按照行列式化為代數(shù)式的規(guī)則可得根據(jù)一元二次方程的求根公式,當時,我們有據(jù)此解得,(對于本例,顯然,)。這便是相關系數(shù)矩陣的兩個特征根。=5\*GB2⑸求標準正交向量。將代入矩陣方程,得到在系數(shù)矩陣中,用第一行加第二行,化為由此得,令,則有,于是得基礎解系,單位化為單位化的公式為()。完全類似,將代入矩陣方程,得到用系數(shù)矩陣的第二行減去第一行,化為于是得到,取,則有,因此得基礎解系為,單位化為這里、便是標準正交向量。=6\*GB2⑹求對角陣。首先建立標準正交矩陣P,即有該矩陣的一個特殊性質便是,即矩陣的轉置等于矩陣的逆。根據(jù),可知下面說明一下利用Excel進行矩陣乘法運算的方法。矩陣乘法的命令為mmult,語法是mmult(矩陣1的單元格范圍,矩陣2的單元格范圍)。例如,用矩陣與矩陣C相乘,首先選擇一個輸出區(qū)域如G1:H2,然后輸入“=mmult(A1:B2,C1:D2)”,然后按下“Ctrl+Shift+Enter”鍵(圖9),即可給出1.2060441.2060440.20817-0.20817再用乘得的結果與P陣相乘,便得對角矩陣1.705603000.294397如果希望一步到位也不難,選定輸出區(qū)域如C3:D4,然后輸入“=mmult(mmult(A1:B2,C1:D2),E1:F2)”(圖10),同時按下“Ctrl+Shift+Enter”鍵,立即得到結果(圖11)。顯然,對角矩陣對角線的數(shù)值恰是相關系數(shù)矩陣的特征值。圖9矩陣乘法示例圖10矩陣連乘的命令與語法至此,標準化的原始變量x與主成分之間z之間可以表作顯然與之間正交。圖11乘法結果:對角矩陣=7\*GB2⑺根據(jù)特征根計算累計方差貢獻率?,F(xiàn)已求得第一特征根為,第二特征根為,二者之和剛好就是矩陣的維數(shù),即有,這里m=2為變量數(shù)目(注意前面的n=25為樣本數(shù)目)。比較圖6或圖10中給出的相關系數(shù)矩陣C與圖11中給出的對角矩陣D可以看出,Tr.(C)=1+1=2,Tr.(D)=1.7056+0.2944=2,即有Tr.(C)=Tr.(D),可見將相關系數(shù)亦即協(xié)方差矩陣轉換為對角矩陣以后,矩陣的跡(trace,即對角線元素之和)沒有改變,這意味著將原始變量化為主成分以后,系統(tǒng)的信息量沒有減少?,F(xiàn)在問題是,如果我們只取一個主成分代表原來的兩個變量,能反映原始變量的多少信息?這個問題可以借助相關系數(shù)矩陣的特征根來判斷。利用Excel容易算出,第一特征根占特征根總和即矩陣維數(shù)的85.28%(見下表),即有特征根累計值百分比累計百分比1.7056031.70560385.28%85.28%0.294397214.72%100.00%也就是說::1.7056,:0.2944,:2,這表明,如果僅取第一個主成分,可以反映原來數(shù)據(jù)85.28%的信息——換言之,舍棄第二個主成分,原來數(shù)據(jù)的信息僅僅損失14.72%,但分析變量的自由度卻減少一個,整個分析將會顯得更加簡明。=8\*GB2⑻計算主成分載荷。根據(jù)公式,容易算出=9\*GB2⑼計算公因子方差和方差貢獻。根據(jù)上述計算結果可以比較公因子方差和方差貢獻。再考慮全部的兩個主成分的時候,對應于和的公因子方差分別為對應于第一主成分z1和第二主成分z2的方差貢獻分別為可以看出(圖12):第一,方差貢獻等于對應主成分的特征根,即有第二,公因子方差相等或彼此接近,即有第一,公因子方差之和等于方差貢獻之和,即有第一個規(guī)律是我們決定提取主成分數(shù)目的判據(jù)與之一,第二個規(guī)律是我們判斷提取主成分數(shù)目是否合適的判據(jù)之一,第三個規(guī)律是我們判斷提取主成分后是否損失信息的判據(jù)之一。去掉次要的主成分以后,上述規(guī)律理當仍然滿足。這時如果第二個規(guī)律不滿足,就意味著主成分的提取是不合適的。此外,上述規(guī)律也是我們檢驗計算結果是否正確的判據(jù)之一。圖12公因子方差、方差貢獻的計算結果及其與特征根的貢獻=10\*GB2⑽計算主成分得分。根據(jù)主成分與原始變量的關系,應有或者對于本例而言,式中,,這里,為前面計算的標準化特征向量。于是有化為代數(shù)形式便是式中的x均為標準化數(shù)據(jù)。對進行轉置,可得圖13計算特征向量的公式及語法圖14計算主成分得分根據(jù)這個式子,利用Excel計算主成分得分的步驟如下:=1\*GB3①將特征向量復制到標準化數(shù)據(jù)的附近;=2\*GB3②選中一個與標準化數(shù)據(jù)占據(jù)范圍一樣大小的數(shù)值區(qū)域(如G2:H26);=3\*GB3③輸入如下計算公式“=mmult(標準化數(shù)據(jù)的范圍,特征向量的范圍)”,在本例中就是“=MMULT(B2:C26,E2:F3)”(圖13);=4\*GB3④同時按下“Ctrl+Shift+Enter”鍵。=5\*GB3⑤計算主成分得分的均值和方差,可以發(fā)現(xiàn),均值為0(由于誤差之故,約等于0),方差等于特征根。=6\*GB3⑥最后,可以對主成分得分進行標準化。已知主成分得分的均值為0,我們不按總體方差進行標準化,而按樣本方差進行標準化。圖15主成分得分的標準化結果樣本方差的計算公式為相應地,標準差為標準化公式同前面給出的一樣。結果見表15。注意,這里之所以按樣本方差進行標準化,主要目的是為了與SPSS的計算結果進行比較。分別以z1、z2為坐標軸,將主成分得分(包括標準化的得分)點列標繪于坐標圖中,可以發(fā)現(xiàn),點列分布沒有任何趨勢:回歸結果表明,回歸系數(shù)和相關系數(shù)均為零,即有,,(圖16,圖17)。這從幾何圖形上顯示:主成分之間是正交的,即有(試將圖16、圖17與圖2、圖3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度公路貨運車輛運輸保險合同模板
- 2025年度井蓋維修工具與配件采購合同
- 2025年度城市軌道交通建設與運營合同范本
- 2025年度醫(yī)療家具采購及配置合同范本
- 2025年度新能源汽車充電站租賃及智能電網(wǎng)服務合同
- 2025年度農(nóng)業(yè)無人機采購合同(精準農(nóng)業(yè))
- 2025年國際貨物保險合同基本條款及保險合同爭議解決機制
- 2025年度戶外景觀用高檔苗木供應與養(yǎng)護服務合同
- 2025年度智能網(wǎng)聯(lián)汽車停車設施共享租賃合同范本
- 2025年度家電行業(yè)市場調研與分析合同
- 2025公司借款合同范本借款合同
- 閩教版(2020)小學信息技術三年級上冊第2課《人工智能在身邊》說課稿及反思
- 語文-百師聯(lián)盟2025屆高三一輪復習聯(lián)考(五)試題和答案
- 地理-山東省濰坊市、臨沂市2024-2025學年度2025屆高三上學期期末質量檢測試題和答案
- 正面上手發(fā)球技術 說課稿-2023-2024學年高一上學期體育與健康人教版必修第一冊
- 基層醫(yī)療機構基本情況調查報告
- 六西格瑪(6Sigma)詳解及實際案例分析
- 機械制造技術-成都工業(yè)學院中國大學mooc課后章節(jié)答案期末考試題庫2023年
- 電解槽檢修施工方案
- 正常分娩 分娩機制 助產(chǎn)學課件
- 廣東縣級農(nóng)商銀行聯(lián)社高管候選人公開競聘筆試有關事項上岸提分題庫3套【500題帶答案含詳解】
評論
0/150
提交評論