




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、關(guān)于算法及其推廣第一張,PPT共二十六頁,創(chuàng)作于2022年6月EM算法是一種迭代算法,1977年由Dempster 等人總結(jié)提出,用于含有隱變量的概率模型參數(shù)的極大似然估計,或極大后驗概率估計。EM算法的每次迭代由兩步組成:E步,求期望;M步,求極大。所以這一算法稱為期望極大算法(Expectation Maximization),簡稱EM算法。第二張,PPT共二十六頁,創(chuàng)作于2022年6月極大似然估計極大似然估計是概率論在統(tǒng)計學(xué)中的應(yīng)用,它是參數(shù)估計的方法之一。說的是已知某個隨機樣本滿足某種概率分布,但是其中具體的參數(shù)不清楚,參數(shù)估計就是通過若干次實驗,觀察其結(jié)果,利用結(jié)果推出參數(shù)的大概值。
2、第三張,PPT共二十六頁,創(chuàng)作于2022年6月 極大似然估計似然函數(shù):已知樣本集X,X是通過概率密度p(x|)抽取。樣本集X中各個樣本的聯(lián)合概率:為了便于分析,由于L()是連乘的,還可以定義對數(shù)似然函數(shù),將其變成連加的:第四張,PPT共二十六頁,創(chuàng)作于2022年6月 極大似然估計求極值可以轉(zhuǎn)換為以下方程:的極大似然估計量表示為:第五張,PPT共二十六頁,創(chuàng)作于2022年6月9.1 EM算法的引入9.1.1EM算法9.1.2EM算法的導(dǎo)出9.1.3EM算法在非監(jiān)督學(xué)習(xí)中的應(yīng)用9.2 EM算法的收斂性第六張,PPT共二十六頁,創(chuàng)作于2022年6月9.1.1 EM算法例9.1(三硬幣模型)假設(shè)有3枚
3、硬幣,分別記作A, B, C. 這些硬幣正面出現(xiàn)的概率分別是, p, q. 進行如下擲硬幣試驗:先擲硬幣A,根據(jù)其結(jié)果選出硬幣B或硬幣C,正面選硬幣B,反面選硬幣C;然后擲選出的硬幣,擲硬幣的結(jié)果,出現(xiàn)正面記作1,出現(xiàn)反面記作0;獨立地重復(fù)n次試驗(這里,n=10),觀測結(jié)果如下:1,1,0,1,0,0,1,0,1,1假設(shè)只能觀測到擲硬幣的結(jié)果,不能觀測擲硬幣的過程。問如何估計三硬幣正面出現(xiàn)的概率,即三硬幣模型的參數(shù)。第七張,PPT共二十六頁,創(chuàng)作于2022年6月解 三硬幣模型可以寫作y: 觀測變量,表示一次試驗觀測的結(jié)果是1或0z: 隱變量,表示未觀測到的擲硬幣A的結(jié)果:=(,p,q)是模型
4、參數(shù)第八張,PPT共二十六頁,創(chuàng)作于2022年6月將觀測數(shù)據(jù)表示為Y=(Y1,Y2,Yn)T,未觀測數(shù)據(jù)表示為Z=(Z1,Z2,Zn)T,則觀測數(shù)據(jù)的似然函數(shù)為即考慮求模型參數(shù)=(,p,q)的極大似然估計,即 第九張,PPT共二十六頁,創(chuàng)作于2022年6月EM算法首先選取參數(shù)的初值,記作 ,然后通過下面的步驟迭代計算參數(shù)的估計值,直至收斂為止。第i次迭代參數(shù)的估計值為 。EM算法的第i+1次迭代如下E步:計算在模型參數(shù) 下觀測數(shù)據(jù)yj 來自擲硬幣B的概率那么觀測數(shù)據(jù)yj 來自硬幣C的概率為1-(i+1)第十張,PPT共二十六頁,創(chuàng)作于2022年6月M步:先寫出期望然后分別求導(dǎo),計算模型參數(shù)的新
5、估計值第十一張,PPT共二十六頁,創(chuàng)作于2022年6月假設(shè)模型參數(shù)的初值取為由E步公式對yj=1與yj=0均有j(1)=0.5利用M步迭代公式,得到繼續(xù)計算j(2)=0.5,j=1,2,10繼續(xù)迭代,得于是得到模型參數(shù)的極大似然估計:EM算法與初值的選擇有關(guān),選擇不同的初值可能得到不同的參數(shù)估計值。如果取初值那么得到的模型參數(shù)的極大似然估計是第十二張,PPT共二十六頁,創(chuàng)作于2022年6月算法9.1(EM算法)輸入:觀測變量數(shù)據(jù)Y,隱變量數(shù)據(jù)Z,聯(lián)合概率分布P(Y,Z|),條件概率分布P(Z,Y|);輸出:模型參數(shù).(1)選擇參數(shù)的初值 ,開始迭代,參數(shù)的初值可以任意選擇,但需注意EM算法對初
6、值是敏感的;(2)E步:記 為第i次迭代參數(shù)的估計值,在第i+1次迭代得E步,計算這里, 是在給定觀測數(shù)據(jù)Y和當(dāng)前的參數(shù)估計 下隱變量數(shù)據(jù)Z的條件概率分布.注意, 的第一個變元表示要極大化的參數(shù),第2個變元表示參數(shù)的當(dāng)前估計值.每次迭代實際在求Q函數(shù)及其極大;第十三張,PPT共二十六頁,創(chuàng)作于2022年6月(3)M步:求使 極大化的,確定i+1次迭代得參數(shù)的估計值(4)重復(fù)第(2)步和第(3)步,直到收斂,這里給出停止迭代得條件,一般是對較小的正數(shù) ,若滿足則停止迭代.第十四張,PPT共二十六頁,創(chuàng)作于2022年6月定義9.1(Q函數(shù))完全數(shù)據(jù)(觀測變量數(shù)據(jù)Y和隱變量數(shù)據(jù)Z)的對數(shù)似然函數(shù) 關(guān)
7、于在給定觀測數(shù)據(jù)Y和當(dāng)前參數(shù) 下對未觀測數(shù)據(jù)Z的條件概率分布 的期望稱為Q函數(shù),即第十五張,PPT共二十六頁,創(chuàng)作于2022年6月9.1.2 EM算法的導(dǎo)出琴生( Jensen )不等式如果f是凸函數(shù),X是隨機變量,那么Ef(X)f(EX)特別地,如果f是嚴格凸函數(shù),Ef(X)f(EX)那么當(dāng)且僅當(dāng)p(x=EX)=1,也就是說X是常量。這里我們將f(EX)簡寫為f(EX)Jensen不等式應(yīng)用于凹函數(shù)時,不等號方向反向,也就是 Ef(X)f(EX)第十六張,PPT共二十六頁,創(chuàng)作于2022年6月下面通過近似求解觀測數(shù)據(jù)的對數(shù)似然函數(shù)的極大化問題來導(dǎo)出EM算法,由此可以清楚地看出EM算法的作用。
8、假設(shè)在第i次迭代后的估計值是 .我們希望新估計值能使L()增加,即L()L( ),并逐步達到極大值.為此,考慮兩者的差:第十七張,PPT共二十六頁,創(chuàng)作于2022年6月利用Jensen不等式得到其下界:令則 第十八張,PPT共二十六頁,創(chuàng)作于2022年6月任何可以使 增大的,也可以使L()增大.為了使L()有盡可能大的增長,選擇 使 達到極大,即現(xiàn)在求 的表達式.省去對的極大化而言是常數(shù)的項,有上式等價于EM算法的一次迭代,即求Q函數(shù)及其極大化.EM算法是通過不斷求解下界的極大化逼近求解對數(shù)似然函數(shù)極大化的算法.第十九張,PPT共二十六頁,創(chuàng)作于2022年6月第二十張,PPT共二十六頁,創(chuàng)作于
9、2022年6月9.1.3 EM算法在非監(jiān)督學(xué)習(xí)中的應(yīng)用有時訓(xùn)練數(shù)據(jù)只有輸入沒有對應(yīng)的輸出(x1,),(x2,),(xn,),從這樣的數(shù)據(jù)學(xué)習(xí)模型稱為非監(jiān)督學(xué)習(xí)問題EM算法可以用于生產(chǎn)模型的非監(jiān)督學(xué)習(xí)生成模型由聯(lián)合概率分布P(X,Y)表示,可以認為非監(jiān)督學(xué)習(xí)訓(xùn)練數(shù)據(jù)是聯(lián)合概率分布產(chǎn)生的數(shù)據(jù).X為觀測數(shù)據(jù),Y為未觀測數(shù)據(jù).第二十一張,PPT共二十六頁,創(chuàng)作于2022年6月9.2 EM算法的收斂性定理9.1 設(shè)P(Y|)為觀測數(shù)據(jù)的似然函數(shù), (i=1,2,)為EM算法得到的參數(shù)估計序列,則 (i=1,2,)為對應(yīng)的似然函數(shù)序列,則 是單調(diào)遞增的,即第二十二張,PPT共二十六頁,創(chuàng)作于2022年6月證明由于取對數(shù)有由令于是對數(shù)似然函數(shù)可以寫成第二十三張,PPT共二十六頁,創(chuàng)作于2022年6月只需證明右端為非負值即得出結(jié)果,由于使 達到極大,所以有其第二項,由得出第二十四張,PPT共二十六頁,創(chuàng)作于2022年6月定理9.2 設(shè)L()=logP(Y|)為觀測數(shù)據(jù)的對數(shù)似然函數(shù), (i=1,2,)為EM算法得到的參數(shù)估計序列, (i=1,2,)為對應(yīng)的對數(shù)似然函數(shù)序列.(1)如果 P(Y|)有上界,則收斂到某
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商業(yè)攝影承包合同
- 八年級地理上冊 第四章 中國的經(jīng)濟發(fā)展 第二節(jié)農(nóng)業(yè) 第2課時 我國農(nóng)業(yè)的地區(qū)分布教學(xué)實錄 (新版)新人教版
- 信息技術(shù)《制作動態(tài)圖像》教學(xué)設(shè)計
- TCCGA 20018-2024 液氫、液氦空溫式氣化器技術(shù)要求
- TCASMES 383-2024 面向離散制造行業(yè)的數(shù)字生產(chǎn)力評估體系及方法
- 第一單元《第3課 隨機魅色-隨機數(shù)、坐標(biāo)和限次循環(huán)》教學(xué)設(shè)計-2023-2024學(xué)年清華版(2012)信息技術(shù)五年級下冊
- 基于多目標(biāo)優(yōu)化的電動汽車物流配送路徑規(guī)劃:充電策略的關(guān)鍵影響與應(yīng)用
- XX鎮(zhèn)2025年生態(tài)環(huán)境保護工作實施方案
- 學(xué)生聽課評語
- 校園辦公室主任述職報告
- 拉薩市2025屆高三第一次聯(lián)考(一模)語文試卷(含答案解析)
- 2024解析:第八章牛頓第一定律、二力平衡-講核心(解析版)
- 《勞動法與勞動關(guān)系》課件
- 2025陜西延長石油(集團)有限責(zé)任公司招聘(1881人)筆試備考題庫及答案解析
- 無人機航拍技術(shù)教案(完整版)
- 2024腦血管病指南
- GB/T 25229-2024糧油儲藏糧倉氣密性要求
- 《大氣細顆粒物及其主要組分致肺衰老與纖維化的分子機制研究》
- 數(shù)字經(jīng)濟學(xué)-課件 第1、2章 數(shù)字經(jīng)濟學(xué)基礎(chǔ)、數(shù)據(jù)要素
- 《保密法》培訓(xùn)課件
- 期權(quán)入門基礎(chǔ)知識單選題100道及答案解析
評論
0/150
提交評論