版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、PCA的基本原理 PCA的計算步驟 PCA應(yīng)用實例 主成分分析(PCA)具體例子秦楠1;.一、主成分分析的基本原理 v假定有n個樣本,每個樣本共有p個變量,構(gòu)成一個np階的數(shù)據(jù)矩陣npnnppxxxxxxxxxX212222111211(1) 2;.v降維處理!當p較大時,在p維空間中考察問題比較麻煩。降維是用較少的幾個綜合指標代替原來較多的變量指標,而且使這些較少的綜合指標既能盡量多地反映原來較多變量指標所反映的信息,同時它們之間又是彼此獨立的。3;.定義:記x1,x2,xP為原變量指標,z1,z2,zm(mp)為新變量指標pmpmmmppppxlxlxlzxlxlxlzxlxlxlz221
2、12222121212121111(2) 4;.v系數(shù)lij的確定原則: zi與zj( ij;i,j=1,2,m )相互無關(guān); z1是x1,x2,xP的一切線性組合中方差最大者,z2是與z1不相關(guān)的x1,x2,xP的所有線性組合中方差最大者; zm是與z1,z2,zm1都不相關(guān)的x1,x2,xP, 的所有線性組合中方差最大者。 則新變量指標z1,z2,zm分別稱為原變量指標x1,x2,xP的第一,第二,第m主成分。 5;. 從以上的分析可以看出,主成分分析的實質(zhì)就是確定原來變量xj(j=1,2 , p)在諸主成分zi(i=1,2,m)上的載荷 lij( i=1,2,m; j=1,2 ,p)。
3、從數(shù)學上可以證明,載荷lij分別是相關(guān)矩陣的m個較大的特征值所對應(yīng)的特征向量。 6;.二、計算步驟 (一)計算相關(guān)系數(shù)矩陣(一)計算相關(guān)系數(shù)矩陣 rij(i,j=1,2,p)為原變量xi與xj的相關(guān)系數(shù), rij=rji,其計算公式為:pppppprrrrrrrrrR212222111211(3) nknkjkjikinkjkjikiijxxxxxxxxr11221)()()((4) 7;. (二)計算特征值與特征向量:(二)計算特征值與特征向量: 解特征方程,求出特征值,并使其按大小順序排列 ; 0RI0,21p 分別求出對應(yīng)于特征值的特征向量 ,要求 =1,即,其中表示向量 的第j個分量。
4、i), 2 , 1(piliil112pjijlijlil8;. 計算主成分貢獻率及累計貢獻率 貢獻率:),2, 1(1pipkki累計貢獻率: ),2, 1(11pipkkikk一般取累計貢獻率達8595%的特征值所對應(yīng)的第一、第二、第m(mp)個主成分。 m,219;.pnpnnppxxxlllllllllZ.21212222111211(6) 各主成分的得分10;.三、 主成分分析方法應(yīng)用實例表表1 1 某農(nóng)業(yè)生態(tài)經(jīng)濟系統(tǒng)各區(qū)域單元的有關(guān)數(shù)據(jù)某農(nóng)業(yè)生態(tài)經(jīng)濟系統(tǒng)各區(qū)域單元的有關(guān)數(shù)據(jù) 11;.668.3372.03276.2041540.29216.398.1284.0650.0114.86
5、1795.4160.80171.106926.35291.528.1354.0630.0124.862862.9011.65273.3071501.24225.2518.3522.6450.0343.201986.6240.84168.904897.36196.3716.8615.1760.0556.1671091.3940.81266.502911.24226.5118.2795.6430.0764.4771176.9120.85850.302103.52217.0919.7934.8810.0016.1651251.2741.04164.609968.33181.384.0054.0660
6、.0155.4021368.8310.83662.804957.14194.049.114.4840.0025.791477.3010.62360.102824.37188.0919.4095.7215.0558.4131576.9481.02268.0011255.42211.5511.1023.1330.013.4251699.2650.65460.7021251.03220.914.3834.6150.0115.59317118.5050.66163.3041246.47242.1610.7066.0530.1548.70118141.4730.73754.206814.21193.46
7、11.4196.4420.01212.94519137.7610.59855.9011124.05228.449.5217.8810.06912.65420117.6121.24554.503805.67175.2318.1065.7890.0488.46121122.7810.73149.1021313.11236.2926.7247.1620.09210.07812;.步驟如下:(1)將表1中的數(shù)據(jù)作標準差標準化處理,然后將它們代入公式(4)計算相關(guān)系數(shù)矩陣(見表2)。x1x2x3x4x5x6x7x8x9x11-0.327 -0.714 -0.3360.3090.4080.790.1560
8、.744x2-0.331-0.0350.6440.420.2550.009-0.0780.094x3-0.71-0.03510.07-0.74-0.755-0.93-0.109-0.924x4-0.340.6440.0710.3830.069-0.05-0.0310.073x50.3090.42-0.740.38310.7340.6720.0980.747x60.4080.255-0.7550.0690.73410.6580.2220.707x70.790.009-0.93-0.0460.6720.6581-0.030.89x80.156-0.078 -0.109 -0.0310.0980.2
9、22-0.0310.29x90.7440.094-0.9240.0730.7470.7070.890.291表表2 2相關(guān)系數(shù)矩陣相關(guān)系數(shù)矩陣 13;. (2)由相關(guān)系數(shù)矩陣計算特征值,以及各個主成分的貢獻率與累計貢獻率(見表3)。由表3可知,第一,第二,第三主成分的累計貢獻率已高達86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可。 14;.表表3 3特征值及主成分貢獻率特征值及主成分貢獻率 15;. (3)對于特征值=4.6610,=2.0890,=1.0430分別求出其特征向量l1,l2,l3。16;.表表4 4 主成分載荷主成分載荷 z1z2z3占方差
10、的百分數(shù)(%)x10.739-0.532-0.006182.918x20.1230.887-0.002880.191x3-0.9640.00960.009592.948x40.00420.8680.003775.346x50.8130.444-0.001185.811x60.8190.1790.12571.843x70.933-0.133-0.25195.118x80.197-0.10.9798.971x90.964-0.00250.009292.93917;. 第一主成分z1與x1,x5,x6,x7,x9呈顯出較強的正相關(guān),與x3呈顯出較強的負相關(guān),而這幾個變量則綜合反映了生態(tài)經(jīng)濟結(jié)構(gòu)狀況,因此可以認為第一主成分z1是生態(tài)經(jīng)濟結(jié)構(gòu)的代表。 第二主成分z2與x2,x4,x5呈顯出較強的正相關(guān),與x1呈顯出較強的負相關(guān),其中,除了x1為人口總數(shù)外,x2,x4,x5都反映了人均占有資源量的情況,因此可以認為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024石材加工行業(yè)標準化及質(zhì)量管理體系合作協(xié)議3篇
- 個人向公司借款詳細條款合同版B版
- 專業(yè)租車協(xié)議范本:2024年版
- 2025年度地質(zhì)勘查測繪合作協(xié)議書8篇
- 2024版銷售代表獎勵提成協(xié)議樣本一
- 集合2024年度醫(yī)療設(shè)備采購及安裝服務(wù)合同
- 2025年度文化旅游項目合作協(xié)議補充協(xié)議3篇
- 2024精密波紋管訂貨及銷售協(xié)議條款版B版
- 2025年度廠房租賃及品牌授權(quán)使用合同4篇
- 二零二五年度汽車后市場銷售提成及品牌代理協(xié)議
- 礦山隱蔽致災(zāi)普查治理報告
- 2024年事業(yè)單位財務(wù)工作計劃例文(6篇)
- 副總經(jīng)理招聘面試題與參考回答(某大型國企)2024年
- PDCA循環(huán)提高護士培訓(xùn)率
- 2024年工程咨詢服務(wù)承諾書
- 青桔單車保險合同條例
- 車輛使用不過戶免責協(xié)議書范文范本
- 《獅子王》電影賞析
- 2023-2024學年天津市部分區(qū)九年級(上)期末物理試卷
- DB13-T 5673-2023 公路自愈合瀝青混合料薄層超薄層罩面施工技術(shù)規(guī)范
- 河北省保定市定州市2025屆高二數(shù)學第一學期期末監(jiān)測試題含解析
評論
0/150
提交評論