![主成份分析的分析和步驟_第1頁](http://file4.renrendoc.com/view14/M04/01/0A/wKhkGWZpSoiAGaTVAAIRJXTRShY133.jpg)
![主成份分析的分析和步驟_第2頁](http://file4.renrendoc.com/view14/M04/01/0A/wKhkGWZpSoiAGaTVAAIRJXTRShY1332.jpg)
![主成份分析的分析和步驟_第3頁](http://file4.renrendoc.com/view14/M04/01/0A/wKhkGWZpSoiAGaTVAAIRJXTRShY1333.jpg)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
====Word行業(yè)資料分享--可編輯版本--雙擊可刪====源-于-網(wǎng)-絡(luò)-收-集主成分分析的概念與步驟1.主成分分析基本思想主成分分析是數(shù)學(xué)上對數(shù)據(jù)降維的一種方法。其基本思想是設(shè)法將原來眾多的具有一定相關(guān)性的指標(比如p個指標),重新組合成一組新的互不相關(guān)的綜合指標來代替原來指標。通常數(shù)學(xué)上的處理就是將原來p個指標作線性組合,作為新的綜合指標。但是這種線性組合,如果不加限制,則可以有很多,應(yīng)該如何去選取呢?在所有的線性組合中所選取的F1應(yīng)該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來p個指標的信息,再考慮選取F2即選第二個線性組合。為了有效地反映原有信息,F(xiàn)1已有的信息就不需要再出現(xiàn)在F2中,用數(shù)學(xué)語言表達就是要求Cov(F1,F(xiàn)2)=0。稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四、…、第p個主成分。2.主成分分析的數(shù)學(xué)模型設(shè)有n個樣品(多元觀測值),每個樣品觀測p項指標(變量):X1,X2,…,Xp,得到原始數(shù)據(jù)資料陣:其中Xi=(x1i,x2i,…,xni)',i=1,2,…,p。用數(shù)據(jù)矩陣X的p個列向量(即p個指標向量)X1,X2,…,Xp作線性組合,得綜合指標向量:簡寫成:Fi=a1iX1+a2iX2+…+apiXpi=1,2,…,p為了加以限制,對組合系數(shù)ai'=(a1i,a2i,…,api)作如下要求:即:ai為單位向量:ai'ai=1,且由下列原則決定:1)Fi與Fj(i≠j,i,j=1,…,p)互不相關(guān),即Cov(Fi,F(xiàn)j)=0,并有Var(Fi)=ai'Σai,其中Σ為X的協(xié)方差陣2)F1是X1,X2,…,Xp的一切線性組合(系數(shù)滿足上述要求)中方差最大的,即,其中c=(c1,c2,…,cp)'F2是與F1不相關(guān)的X1,X2,…,Xp一切線性組合中方差最大的,…,F(xiàn)p是與F1,F(xiàn)2,…,F(xiàn)p-1都不相關(guān)的X1,X2,…,Xp的一切線性組合中方差最大的。滿足上述要求的綜合指標向量F1,F(xiàn)2,…,F(xiàn)p就是主成分,這p個主成分從原始指標所提供的信息總量中所提取的信息量依次遞減,每一個主成分所提取的信息量用方差來度量,主成分方差的貢獻就等于原指標相關(guān)系數(shù)矩陣相應(yīng)的特征值i,每一個主成分的組合系數(shù)ai'=(a1i,a2i,…,api)就是相應(yīng)特征值i所對應(yīng)的單位特征向量ti。方差的貢獻率為,i越大,說明相應(yīng)的主成分反映綜合信息的能力越強。3.主成分分析的步驟(1)計算協(xié)方差矩陣計算樣品數(shù)據(jù)的協(xié)方差矩陣:Σ=(sij)pp,其中i,j=1,2,…,p(2)求出Σ的特征值及相應(yīng)的特征向量求出協(xié)方差矩陣Σ的特征值12…p>0及相應(yīng)的正交化單位特征向量:則X的第i個主成分為Fi=ai'Xi=1,2,…,p。(3)選擇主成分在已確定的全部p個主成分中合理選擇m個來實現(xiàn)最終的評價分析。一般用方差貢獻率解釋主成分Fi所反映的信息量的大小,m的確定以累計貢獻率達到足夠大(一般在85%以上)為原則。(4)計算主成分得分計算n個樣品在m個主成分上的得分:,i=1,2,…,m(5)標準化實際應(yīng)用時,指標的量綱往往不同,所以在主成分計算之前應(yīng)先消除量綱的影響。消除數(shù)據(jù)的量綱有很多方法,常用方法是將原始數(shù)據(jù)標準化,即做如下數(shù)據(jù)變換:其中,,j=1,2,…,p。標準化后的數(shù)據(jù)陣記為X*,其中每個列向量(標準化變量)的均值為0,標準差為1,數(shù)據(jù)無量綱。標準化后變量的協(xié)方差矩陣(CovarianceMatrix)Σ=(sij)pp,即原變量的相關(guān)系數(shù)矩陣(CorrelationMatrix)R=(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代企業(yè)管理中的信息安全風(fēng)險管理
- 一年級聽評課記錄語文
- 現(xiàn)代辦公環(huán)境中磁頭的創(chuàng)新應(yīng)用
- 聽評課記錄30篇范文圖片
- 蘇科版數(shù)學(xué)九年級上冊《1.4 用一元二次方程解決問題》聽評課記錄3
- 人教版九年級數(shù)學(xué)上冊第二十一章一元二次方程《21.2解一元二次方程》第3課時聽評課記錄
- 2022年新課標八年級上冊道德與法治《9.1 認識總體國家安全觀 》聽課評課記錄
- 班級社會實踐活動的組織策略研究
- 電力設(shè)備健康狀態(tài)在線監(jiān)測技術(shù)探討
- 班組長領(lǐng)導(dǎo)力與目標管理技巧
- 2022年北京海淀區(qū)高三一模物理試題和答案
- 施工工法的編寫與申報(完整版)
- 歇后語大全500條
- 中小學(xué)教師校園安全培訓(xùn)
- 2024年北京法院聘用制審判輔助人員招聘筆試參考題庫附帶答案詳解
- (高清版)DZT 0276.13-2015 巖石物理力學(xué)性質(zhì)試驗規(guī)程 第13部分:巖石比熱試驗
- 2024浙江省農(nóng)發(fā)集團社會招聘筆試參考題庫附帶答案詳解
- (高清版)DZT 0017-2023 工程地質(zhì)鉆探規(guī)程
- 華為狼性培訓(xùn)課件
- 慢性壓力對身體健康的影響與調(diào)理方法
- 杏花鄉(xiāng)衛(wèi)生院崗位說明樣本
評論
0/150
提交評論