![鄭州大學-機器學習 主成分分析_第1頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y958.jpg)
![鄭州大學-機器學習 主成分分析_第2頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y9582.jpg)
![鄭州大學-機器學習 主成分分析_第3頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y9583.jpg)
![鄭州大學-機器學習 主成分分析_第4頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y9584.jpg)
![鄭州大學-機器學習 主成分分析_第5頁](http://file4.renrendoc.com/view5/M01/0B/32/wKhkGGYlzqeAcQfCAAE4xaTKC8Y9585.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
PRINCIPALCOMPONENTANALYSIS主成分分析匯報人:秦文靜朱曼產(chǎn)生背景在研究工作中,我們常常針對我們關(guān)注的研究對象,收集大量有關(guān)他的特征屬性,從而對其進行觀測和分析。比如,對一組城市進行研究的時候,我們可以從人口、GDP、面積、年降水量、年平均溫度、人均壽命、人均工資、人均受教育年份、性別比例、宗教人口、汽車保有量、人均住房面積等等收集相關(guān)數(shù)據(jù)。理論上,我們收集越多的特征屬性就越方便我們?nèi)矫娴膶κ挛镞M行細致的研究,對深層次的規(guī)律進行探尋。但實際上,隨著樣本特征屬性數(shù)量的增多,我們需要分析處理的數(shù)據(jù)量也是直線上升的。同時,樣本的特征屬性之間還存在著相關(guān)性:比如GDP與汽車保有量之間,人均工資與人均受教育年份都是存在著某種關(guān)聯(lián)的。01總體主成分分析利用正交變換,把用線性相關(guān)變量表示的數(shù)據(jù)轉(zhuǎn)換為有線性無關(guān)變量表示。線性無關(guān)的變量稱主成分。無監(jiān)督學習01點擊輸入您在損失很少信息的前提下的具體內(nèi)容用簡潔的語言文字進行闡述,精準的詞匯表達勝過長篇大論的文字表述添加標題從無標注數(shù)據(jù)中學習預測模型的機器學習問題,本質(zhì)是學習數(shù)據(jù)中的統(tǒng)計規(guī)律或潛在結(jié)構(gòu)。02降維思想在損失很少信息的前提下,把多個指標轉(zhuǎn)化為幾個綜合指標的多元統(tǒng)計方法,主成分的個數(shù)通常小于原始變量的個數(shù)將訓練數(shù)據(jù)中的樣本從高維空間轉(zhuǎn)換到低維空間基本思想規(guī)范化通過正交變換變成由若干個線性無關(guān)的新變量表示的數(shù)據(jù)正交變換選擇方差最大的方向(第一主成分)作為新坐標系的第一坐標軸,之后選擇與第一坐標軸正交且方差次之的方向(第二主成分)作為新坐標系的第二坐標軸。方差最大使得數(shù)據(jù)每一變量平均值為0方差為1基本思想
基本思想基本思想
如何選取坐標軸(主成分)主成分分析的基本思想是在保留原始變量盡可能多的信息的前提下達到降維的目的,從而簡化問題的復雜性。而對多維隨機變量而言,其協(xié)方差矩陣就是對各變量離散程度的反映,我們所說的保留原始變量盡可能多的信息,也就是指生成的較少的綜合變量的方差盡可能地接近原始變量方差的總合定義和導出定義和導出定義和導出
定義和導出主要性質(zhì)
主要性質(zhì)采用拉格朗日乘子法求主成分首先來求第一主成分
主要性質(zhì)
主要性質(zhì)主要性質(zhì)主要性質(zhì)主要性質(zhì)主要性質(zhì)主要性質(zhì)主要性質(zhì)
主要性質(zhì)
主要性質(zhì)
主要性質(zhì)
主要性質(zhì)
主成分的個數(shù)主成分的個數(shù)主成分的個數(shù)
主成分的個數(shù)主成分的個數(shù)主成分的個數(shù)主成分的個數(shù)主成分個數(shù)的篩選依據(jù)累計方差貢獻率:當前k個主成分的方差貢獻率達到某一特定值(一般85%以上)就可以保留前k個主成分。
主成分的個數(shù)規(guī)范化變量的總體主成分規(guī)范化變量的總體主成分規(guī)范化變量的總體主成分基本步驟1.對原來的k個指標標準化,以消除變量在數(shù)量級和量綱上的影響2.根據(jù)標準化后的數(shù)據(jù)矩陣求出協(xié)方差或相關(guān)矩陣3.求出協(xié)方差矩陣的特征值和對應的特征向量4.確定主成分實例實例規(guī)范化實例主成分分析適用于變量之間存在較強相關(guān)性的數(shù)據(jù),如果變量之間的相關(guān)性較弱的話,并不能起到很好的降維作用,通常認為當大多數(shù)變
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度私家車租賃與駕駛技能考核協(xié)議
- 2025-2030全球乙二胺四乙酸鈣二鈉鹽行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國有線起子行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年全球及中國越野探險房車行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 二零二五年度體育賽事贊助合同補充協(xié)議4篇
- 高端會所室內(nèi)設計合同范本
- 二零二五年度企業(yè)內(nèi)部股權(quán)轉(zhuǎn)讓與員工持股計劃執(zhí)行合同
- 二零二五年度退休教師教育咨詢合同
- 主題書店裝修貸款合同
- 奶制品冷藏液氮供應合同
- 五年級下冊語文四大名著??贾R點
- 2025年1月日歷表(含農(nóng)歷-周數(shù)-方便記事備忘)
- 2024年同等學力人員申請碩士學位英語試卷與參考答案
- 臨床用血管理培訓
- 介入手術(shù)室護理風險
- 工業(yè)自動化生產(chǎn)線操作手冊
- 《走進神奇》說課稿
- 2024年內(nèi)蒙古中考語文試卷五套合卷附答案
- 五年級下冊語文教案 學習雙重否定句 部編版
- 南京地區(qū)幼兒園室內(nèi)空氣污染物與兒童健康的相關(guān)性研究
- 2024年湖南鐵路科技職業(yè)技術(shù)學院單招職業(yè)技能測試題庫及答案解析
評論
0/150
提交評論