機(jī)器學(xué)習(xí)-貝葉斯網(wǎng)絡(luò)

上傳人：a*** IP屬地：湖北上傳時間：2023-02-06 格式：PPT 頁數(shù)：13 大小：438.50KB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩8頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

6.11.4學(xué)習(xí)貝葉斯信念網(wǎng)6.11.5貝葉斯網(wǎng)的梯度上升訓(xùn)練

6.11.6學(xué)習(xí)貝葉斯網(wǎng)的結(jié)構(gòu)

6.11.6學(xué)習(xí)貝葉斯網(wǎng)是否可以設(shè)計出有效的算法以從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到貝葉斯信念網(wǎng)？對于這一問題有多種可以考慮的框架：—首先網(wǎng)絡(luò)結(jié)構(gòu)可以預(yù)先給出，或可由訓(xùn)練數(shù)據(jù)中推得?！浯危械木W(wǎng)絡(luò)變量可以直接從每個訓(xùn)練樣例中觀察到，或某些變量不能觀察到。當(dāng)網(wǎng)絡(luò)結(jié)構(gòu)預(yù)先已知且變量可以從訓(xùn)練樣例中完全獲得時，通過學(xué)習(xí)得到條件概率表就比較簡單，只需要像在樸素貝葉斯分類器中那樣估計表中的條件概率項(xiàng)。網(wǎng)絡(luò)結(jié)構(gòu)已知，但只有一部分變量值能在數(shù)據(jù)中觀察到，學(xué)習(xí)就困難得多了。這一問題在某種程度上類似于在人工神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)隱藏單元的權(quán)值，其中輸入輸出的節(jié)點(diǎn)值由訓(xùn)練樣例給出，但隱藏單元的值未指定。針對這一問題，采用簡單的梯度上升過程以學(xué)習(xí)條件概率表中的項(xiàng)。這一梯度上升過程搜索一個假設(shè)空間，它對應(yīng)于條件概率表中所有可能的項(xiàng)。在梯度上升中被最大化的指標(biāo)函數(shù)是給定假設(shè)h下觀察到訓(xùn)練數(shù)據(jù)D的概率P(D|h)。就相當(dāng)于極大似然假設(shè)

6.11.5貝葉斯網(wǎng)的梯度上升訓(xùn)練梯度上升的規(guī)則：通過lnP(D|h)的梯度來使P(D|h)最大化。其中代表?xiàng)l件概率表中的一個表項(xiàng)。為在給定父節(jié)點(diǎn)取值時,網(wǎng)絡(luò)變量值為

的概率。

例如:圖6-3中條件概率表中最右上方的表項(xiàng)，那么為變量Campfire，是其父節(jié)點(diǎn)的元組<Storm，BusTourGroup>，=true,并且=

<False,False>。具體的算法：對于每個，lnP(D|h)的梯度是對每個求導(dǎo)數(shù)得到。

（6.25）

例如：為計算對應(yīng)圖6-3中表左上方的表項(xiàng)的導(dǎo)數(shù)，需要對D中的每個訓(xùn)練樣例d計算P(Camfire=True，Storm=False,BusTourGroup=False|d)。當(dāng)訓(xùn)練樣例d中無法觀察到這些變量時，這些概率可用標(biāo)準(zhǔn)的貝葉斯網(wǎng)絡(luò)推理的過程中計算得到。用梯度上升來更新每一個

+其中

是一個小常量，稱為學(xué)習(xí)率。將權(quán)值

歸一化，保持有效的概率在區(qū)間[0,1]之間，還要求對所有的i,k保持1像其他基于梯度算法中的那樣，該算法只能保證尋找到局部最優(yōu)解

6.11.6學(xué)習(xí)貝葉斯網(wǎng)的結(jié)構(gòu)當(dāng)網(wǎng)絡(luò)的結(jié)構(gòu)是未知的，數(shù)據(jù)是可完全觀察，學(xué)習(xí)貝葉斯因此網(wǎng)絡(luò)也是很困難的。此時常采用K2的啟發(fā)式搜索算法來學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)。K2算法用于貪婪搜索(總是做出在當(dāng)前看來是做好的選擇，而不是從整體出發(fā))處理模型選擇問題：先定義一種評價網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)劣的評分函數(shù)，再從一個網(wǎng)絡(luò)的開始，根據(jù)事先確定的最大父節(jié)點(diǎn)數(shù)目和節(jié)點(diǎn)的次序，選擇分值最高的節(jié)點(diǎn)作為該節(jié)點(diǎn)的父節(jié)點(diǎn)。K2算法使用后驗(yàn)概率作為評分函數(shù)：算法的偽代碼：過程描述：k2的出發(fā)點(diǎn)是一個包含所有節(jié)點(diǎn)，但卻沒有邊的無向圖。在搜索的過程中，k2按順序逐個考察中的變量，確定其父親節(jié)點(diǎn)，然后添加相應(yīng)的邊。

對某一變量Xj,假設(shè)K2已經(jīng)找到它的一些父親節(jié)點(diǎn)。如果||<u,即Xj的父親節(jié)點(diǎn)的個數(shù)還未達(dá)到上界u，那么就繼續(xù)為它尋找父節(jié)點(diǎn)，具體的做法是首先考慮那些在中排在Xj之前，但還不是Xj的父節(jié)點(diǎn)的變量，從這些變量中選出Xi,使得新的家族CH評分

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

機(jī)器學(xué)習(xí)-貝葉斯網(wǎng)絡(luò)

文檔簡介

溫馨提示

最新文檔

評論

機(jī)器學(xué)習(xí)-貝葉斯網(wǎng)絡(luò)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔