![EM算法主要思想_第1頁](http://file4.renrendoc.com/view/50d80595eae6220e27642ef74f16179d/50d80595eae6220e27642ef74f16179d1.gif)
![EM算法主要思想_第2頁](http://file4.renrendoc.com/view/50d80595eae6220e27642ef74f16179d/50d80595eae6220e27642ef74f16179d2.gif)
![EM算法主要思想_第3頁](http://file4.renrendoc.com/view/50d80595eae6220e27642ef74f16179d/50d80595eae6220e27642ef74f16179d3.gif)
![EM算法主要思想_第4頁](http://file4.renrendoc.com/view/50d80595eae6220e27642ef74f16179d/50d80595eae6220e27642ef74f16179d4.gif)
![EM算法主要思想_第5頁](http://file4.renrendoc.com/view/50d80595eae6220e27642ef74f16179d/50d80595eae6220e27642ef74f16179d5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
會計學1EM算法主要思想內容概述1、背景簡介2、問題描述3、EM算法原理4、結論與討論第1頁/共15頁1、背景簡介EM是一種聚類算法聚類:將數據集中的數據分成若干類(簇),使類內相似度盡可能大,類間相似度盡可能小。聚類算法:基于劃分的方法(K均值)、層次聚類、基于密度的方法、基于網格的方法、基于模型的方法。第2頁/共15頁2、問題描述EM算法是基于模型的聚類方法,假設樣本分布符合高斯混合模型,算法目的是確定各個高斯部件的參數,充分擬合給定數據,并得到一個模糊聚類,即每個樣本以不同概率屬于每個高斯分布,概率數值將由以上各個參數計算得到。第3頁/共15頁2、問題描述(續(xù))高斯混合模型被定義為M個高斯密度函數的線性組合:其中為均值為,協(xié)方差為的高斯分布,是混合參數,看做第i個高斯分布的權重,表征先驗概率。且第4頁/共15頁2、問題描述(續(xù))
的概率密度函數為參數估計的最常用方法是最大似然估計,通過使似然函數達到最大值得到參數的估計值。將高斯混合密度函數中所有待定的參數記為,則似然函數為:第5頁/共15頁2、問題描述(續(xù))為了使問題簡化,我們求的最大值。這里由于有和的對數,求導后形式復雜,因此不能使用一般的求偏導并令導數為零的方法。第6頁/共15頁3、EM算法原理簡化的問題:某混合高斯分布一共有k個分布,并且對于每一個觀察到的x,如果我們同時還知道它是屬于k中哪一個分布的,則求各個參數并不是件難事。比如用z來表示每一個高斯分布,那么我們的觀察集不僅僅是{x1,x2,x3…},而是{(x1,z2),(x2,z3),(x3,z1)…}而現(xiàn)實往往是:我們不知道每個x屬于哪個分布,也就是說z是我們觀察不到的,z是隱藏變量。第7頁/共15頁3、EM算法原理(續(xù))假定可以觀察到Z,問題變?yōu)榍笙率阶畲笾档荶是觀察不到的,因此EM算法假設Z的分布依據上一輪的估計參數確定,求取上式期望的最大值。定義:第8頁/共15頁第9頁/共15頁對上式使用拉格朗日乘數法可得求偏導并令值為零分別得:第10頁/共15頁其中,可由下式求得。第11頁/共15頁EM算法的具體流程為重復執(zhí)行以下兩個步驟直到收斂:第一步稱為E步驟,是根據參數初始值或上一次迭代所得結果值來計算似然函數關于條件分布的期望:第二步稱為M步驟,是將似然函數最大化以獲得新的參數值,用更新使最大化。第12頁/共15頁4、結論與討論1)EM算法比K-means算法計算復雜,收斂也較慢,不適于大規(guī)模數據集和高維數據,但比K-means算法計算結果穩(wěn)定、準確。(數學手段加快收斂)2)需要已知樣本聚類數目(?)3)對初值敏感(可以多運行幾次解決/密度/最大最小原則/模糊/…)4)爬山技術,局部最優(yōu)解(可以多運行幾次解決?)5)對孤立點敏感,有噪音時效果差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)境設計的藝術性與審美培養(yǎng)探討
- 生產線作業(yè)計劃與實時調度分析
- 班級紀律執(zhí)行與校園文化建設的互動關系
- 生態(tài)城市規(guī)劃中的綠色交通系統(tǒng)建設
- 現(xiàn)代辦公中的網絡教育平臺應用
- Unit 6 My family(說課稿)-2024-2025學年滬教版(五四制)(2024)英語一年級上冊
- 2024年二年級品生下冊《大自然的奧秘》說課稿 冀教版001
- 2024-2025學年高中歷史 專題一 古代中國經濟的基本結構與特點 1.3 古代中國的商業(yè)經濟說課稿 人民版必修2
- 10的認識和加減法(說課稿)-2024-2025學年一年級上冊數學人教版(2024)001
- 14《圓明園的毀滅》第二課時(說課稿)2024-2025學年語文五年級上冊統(tǒng)編版
- 2025年度廚師職業(yè)培訓學院合作辦學合同4篇
- 《組織行為學》第1章-組織行為學概述
- GB/T 19228.1-2024不銹鋼卡壓式管件組件第1部分:卡壓式管件
- 2024年計算機二級WPS考試題庫380題(含答案)
- (高清版)DZT 0399-2022 礦山資源儲量管理規(guī)范
- 初一英語英語閱讀理解專項訓練15篇
- 山東省中考物理總復習 八上 第4講 光現(xiàn)象
- DB11∕T 1875-2021 市政工程施工安全操作規(guī)程
- 傳統(tǒng)節(jié)日春節(jié)英文介紹課件
- 水資源論證報告
- 實現(xiàn)結構化:初中語文大單元教學設計的核心
評論
0/150
提交評論