已閱讀5頁(yè),還剩28頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2020 2 22 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘 1 第7章貝葉斯網(wǎng)絡(luò) 2 貝葉斯網(wǎng)絡(luò)是20世紀(jì)80年代發(fā)展起來的 最早由JudeaPearl于1986年提出 多用于專家系統(tǒng) 成為表示不確定性知識(shí)和推理問題的流行方法 貝葉斯網(wǎng)絡(luò)最早起源于貝葉斯統(tǒng)計(jì)分析 它是概率理論和圖論相結(jié)合的產(chǎn)物 本章通過引例討論貝葉斯網(wǎng)絡(luò)需要解決的問題 介紹貝葉斯概率基礎(chǔ) 對(duì)貝葉斯網(wǎng)絡(luò)進(jìn)行概述 講解貝葉斯網(wǎng)絡(luò)的預(yù)測(cè) 診斷和訓(xùn)練算法 講述SQLServer2005中貝葉斯網(wǎng)絡(luò)的應(yīng)用方法 3 7 l引例先看一個(gè)關(guān)于概率推理的例子 圖7 1中有6個(gè)結(jié)點(diǎn) 參加晚會(huì) party PT 宿醉 hangover HO 患腦瘤 braintumor BT 頭疼 headache HA 有酒精味 smellalcohol SA 和X射線檢查呈陽(yáng)性 posxray PX 可以把圖7 1想象成為這樣一個(gè)場(chǎng)景 一個(gè)中學(xué)生回家后 其父母猜測(cè)她參加了晚會(huì) 并且喝了酒 第二天這個(gè)學(xué)生感到頭疼 她的父母帶她到醫(yī)院做頭部的X光檢查 圖7 1基于結(jié)點(diǎn)間概率關(guān)系的推理 4 通過長(zhǎng)期的觀察 或者從別人那里了解 這個(gè)中學(xué)生的父母知道他們的女兒參加晚會(huì)的概率 通過長(zhǎng)時(shí)間的數(shù)據(jù)積累 他們也知道他們的女兒參加晚會(huì)后宿醉的概率 因此 結(jié)點(diǎn)party和結(jié)點(diǎn)hangover之間有一條連線 同樣 有明顯的因果關(guān)系或相關(guān)關(guān)系的結(jié)點(diǎn)之間都有一條連線 并且連線從原因結(jié)點(diǎn)出發(fā) 指向結(jié)果結(jié)點(diǎn) 針對(duì)圖7 1所示的網(wǎng)絡(luò) 有許多問題需要解決 例如 1 如果父母已知他們的女兒參加了晚會(huì) 那么第二天一早 她呼出的氣體中有酒精味的概率有多大 也就是說 當(dāng)party發(fā)生時(shí) smellalcohol發(fā)生的概率有多大 2 如果他們的女兒頭疼 那么她患腦瘤的概率有多大 這時(shí) 如果他們又知道昨晚她參加了晚會(huì) 那么綜合這些情況 她患腦瘤的可能性有多大 這兩個(gè)例子都是從原因推理結(jié)果的 還有許多從結(jié)果反推原因的例子 例如 如果父母早晨聞到他們的女兒呼出的氣體中有酒精味 那么她昨晚參加晚會(huì)的概率有多大 等等 為了系統(tǒng)地解決上面的各類問題 需要先掌握一定的概率基礎(chǔ)知識(shí) 5 7 2貝葉斯概率基礎(chǔ)貝葉斯概率是貝葉斯網(wǎng)絡(luò)運(yùn)行的理論基礎(chǔ) 就貝葉斯概率而言 其原理和應(yīng)用都比較簡(jiǎn)單 但貝葉斯概率理論經(jīng)歷了長(zhǎng)時(shí)間的波折才被逐漸認(rèn)可 直到20世紀(jì)60年代 貝葉斯概率理論才被廣泛接受并大量應(yīng)用 下面將從基本的條件概率公式和全概率公式入手介紹貝葉斯概率 7 2 1先驗(yàn)概率 后驗(yàn)概率和條件概率下面介紹貝葉斯概率中用到的有關(guān)概率論的基本概念 1 先驗(yàn)概率 先驗(yàn)概率是指根據(jù)歷史的資料或主觀判斷所確定的各種事件發(fā)生的概率 該概率沒有經(jīng)過實(shí)驗(yàn)證實(shí) 屬于檢驗(yàn)前的概率 2 后驗(yàn)概率 后驗(yàn)概率一般是指通過貝葉斯公式 結(jié)合調(diào)查等方式獲取了新的附加信息 對(duì)先驗(yàn)概率修正后得到的更符合實(shí)際的概率 3 條件概率 當(dāng)條件確定時(shí) 某事件發(fā)生的條件概率就是該事件的條件概率 6 例如 1號(hào)箱中有2個(gè)白球和4個(gè)紅球 2號(hào)箱中有5個(gè)白球和3個(gè)紅球 現(xiàn)隨機(jī)地從1號(hào)箱中取出一球放人2號(hào)箱 然后從2號(hào)箱隨機(jī)取出一球 問從2號(hào)箱取出紅球的概率是多少 解 令A(yù)表示事件 最后從2號(hào)箱中取出的是紅球 令B表示從1號(hào)箱中取出的是紅球 則 由式 7 5 7 2 3全概率公式 設(shè)A B是兩個(gè)事件 那么A可以表示為 顯然 如果P B P B 0 則 7 上例采用的方法是概率論中常用的方法 為了求復(fù)雜事件的概率 往往可以把它分解成若干個(gè)互不相容的簡(jiǎn)單事件 然后利用條件概率和乘法公式 求出這些簡(jiǎn)單事件的概率 最后利用概率可加性 得到最終結(jié)果 這一方法的一般化就是所謂的全概率公式 設(shè) 為試驗(yàn)E的樣本空間 A為E的事件 B1 B2 Bn為E的一組事件 若滿足以下兩個(gè)條件 則稱B1 B2 Bn為樣本空間 的一個(gè)分割 若B1 B2 Bn為樣本空間的一個(gè)分割 那么 對(duì)每一次試驗(yàn) 事件B1 B2 Bn必有一個(gè)且僅有一個(gè)發(fā)生 8 例如 設(shè)實(shí)驗(yàn)E為 擲一顆骰子觀察其點(diǎn)數(shù) 它的樣本空間 1 2 3 4 5 6 的一組事件B1 l 2 B2 3 4 B3 5 6 是樣本空間 的一個(gè)分割 而事件組B1 1 2 3 B2 3 4 B3 5 6 不是樣本空間 的一個(gè)分割 因?yàn)锽1B2 3 設(shè)實(shí)驗(yàn)E為樣本空間 A為E的事件 B1 B2 Bn為 的一個(gè)分割 且P Bi 0 i 1 2 n 則 式 7 6 被稱為全概率公式 9 例 甲 乙 丙三人向同一飛機(jī)射擊 設(shè)甲 乙 丙射中的概率分別為0 4 0 5和0 7 又設(shè)若只有一人射中 飛機(jī)墜落的概率為0 2 若有兩人射中 飛機(jī)墜落的概率為0 6 若有三人射中 飛機(jī)必墜落 求飛機(jī)墜落的概率 解 記A 飛機(jī)墜落 Bi 共i個(gè)人射中飛機(jī) i 1 2 3 Bi分別為 B1 甲射中 乙丙未射中 乙射中 甲丙未射中 丙射中 甲乙未射中 B2 甲未射中 乙丙射中 乙未射中 甲丙射中 丙未射中 甲乙射中 B3 甲乙丙均射中 可以計(jì)算i個(gè)人射中飛機(jī)的概率P B1 0 4 0 5 0 3 0 6 0 5 0 3 0 6 0 5 0 7 0 36P B2 0 6 0 5 0 7 0 4 0 5 0 7 0 4 0 5 0 3 0 41P B3 0 4 0 5 0 7 0 14再由題設(shè) P A B1 0 2 P A B2 O 6 P A B3 1 利用全概率公式 10 設(shè)實(shí)驗(yàn)E為樣本空間 A為E的事件 B1 B2 Bn為 的一個(gè)分割 且P Bi 0 i 1 2 n 則 式 7 7 被稱為貝葉斯公式 例如 某電子設(shè)備廠所用的元件是由三家元件廠提供的 根據(jù)以往的記錄 這三個(gè)廠家的次品率分別為0 02 0 01 0 03 提供元件的份額分別為0 15 0 8 0 05 設(shè)這三個(gè)廠家的產(chǎn)品在倉(cāng)庫(kù)是均勻混合的 且無(wú)區(qū)別的標(biāo)志 問題1 在倉(cāng)庫(kù)中隨機(jī)地取一個(gè)元件 求它是次品的概率 問題2 在倉(cāng)庫(kù)中隨機(jī)地取一個(gè)元件 若已知它是次品 為分析此次品出自何廠 需求出此元件由三個(gè)廠家分別生產(chǎn)的概率是多少 7 2 4貝葉斯公式 11 0 15 0 02 0 80 0 01 0 05 0 03 0 0125對(duì)于問題2 由貝葉斯公式 解 設(shè)A取到的元件是次品 Bi標(biāo)識(shí)取到的元件是由第i個(gè)廠家生產(chǎn)的 則P B1 0 15 P B2 0 8 P B3 0 05對(duì)于問題1 由全概率公式 以上結(jié)果表明 這個(gè)次品來自第2家工廠的可能性最大 來自第1家工廠的概率次之 來自第3家工廠的概率最小 12 7 3貝葉斯網(wǎng)絡(luò)概述貝葉斯網(wǎng)絡(luò)是一種圖形模型 概率理論和圖論相結(jié)合的產(chǎn)物 又被稱為貝葉斯信念網(wǎng)絡(luò) 因果網(wǎng)絡(luò) 是描述隨機(jī)變量 事件 之間依賴關(guān)系的一種圖形模式 是一種將因果知識(shí)和概率知識(shí)相結(jié)合的信息表示框架 使得不確定性推理在邏輯上變得更為清晰 理解性更強(qiáng) 已經(jīng)成為數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)和決策支持系統(tǒng)的有效方法 從大量數(shù)據(jù)中構(gòu)造貝葉斯網(wǎng)絡(luò)模型 進(jìn)行不確定性知識(shí)的發(fā)現(xiàn) 7 3 1貝葉斯網(wǎng)絡(luò)的組成和結(jié)構(gòu)貝葉斯網(wǎng)絡(luò)由網(wǎng)絡(luò)結(jié)構(gòu)和條件概率表兩部分組成 貝葉斯網(wǎng)的網(wǎng)絡(luò)結(jié)構(gòu)是一個(gè)有向無(wú)環(huán)圖 由結(jié)點(diǎn)和有向弧段組成 每個(gè)結(jié)點(diǎn)代表一個(gè)事件或者隨機(jī)變量 變量值可以是離散的或連續(xù)的 結(jié)點(diǎn)的取值是完備互斥的 表示起因的假設(shè)和表示結(jié)果的數(shù)據(jù)均用結(jié)點(diǎn)表示 例如 圖7 1描述的網(wǎng)絡(luò)符合貝葉斯網(wǎng)絡(luò)的條件 是一個(gè)典型的貝葉斯網(wǎng)絡(luò) 13 7 3 2貝葉斯網(wǎng)絡(luò)的優(yōu)越性貝葉斯網(wǎng)絡(luò)的優(yōu)勢(shì)主要體現(xiàn)在以下方面 1 貝葉斯網(wǎng)絡(luò)推理是利用其表達(dá)的條件獨(dú)立性 根據(jù)已有信息快速計(jì)算待求概率值的過程 應(yīng)用貝葉斯網(wǎng)絡(luò)的概率推理算法 對(duì)已有的信息要求低 可以進(jìn)行信息不完全 不確定情況下的推理 2 具有良好的可理解性和邏輯性 這是神經(jīng)元網(wǎng)絡(luò)無(wú)法比擬的 神經(jīng)元網(wǎng)絡(luò)從輸入層輸入影響因素信息 經(jīng)隱含層處理后傳人輸出層 是黑匣子似的預(yù)測(cè)和評(píng)估 而貝葉斯網(wǎng)絡(luò)是白匣子 3 專家知識(shí)和試驗(yàn)數(shù)據(jù)的有效結(jié)合相輔相成 忽略次要聯(lián)系而突出主要矛盾 可以有效避免過學(xué)習(xí) 4 貝葉斯網(wǎng)絡(luò)以概率推理為基礎(chǔ) 推理結(jié)果說服力強(qiáng) 而且相對(duì)貝葉斯方法來說 貝葉斯網(wǎng)絡(luò)對(duì)先驗(yàn)概率的要求大大降低 貝葉斯網(wǎng)絡(luò)通過實(shí)踐積累可以隨時(shí)進(jìn)行學(xué)習(xí)來改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù) 提高預(yù)測(cè)診斷能力 并且基于網(wǎng)絡(luò)的概率推理算法 貝葉斯網(wǎng)絡(luò)接受了新信息后立即更新網(wǎng)絡(luò)中的概率信息 14 7 3 3貝葉斯網(wǎng)絡(luò)的三個(gè)主要議題貝葉斯網(wǎng)絡(luò)的主要功能是進(jìn)行預(yù)測(cè)和診斷 在貝葉斯網(wǎng)絡(luò)工作之前 需要對(duì)歷史數(shù)據(jù)進(jìn)行訓(xùn)練 所以 預(yù)測(cè) 診斷和訓(xùn)練構(gòu)成了貝葉斯網(wǎng)絡(luò)的三個(gè)主要議題 1 貝葉斯網(wǎng)絡(luò)預(yù)測(cè)貝葉斯網(wǎng)絡(luò)是一種概率推理技術(shù) 使用概率理論來處理在描述不同知識(shí)成分之間的條件而產(chǎn)生的不確定性 貝葉斯網(wǎng)絡(luò)的預(yù)測(cè)是指從起因推測(cè)一個(gè)結(jié)果的推理 也稱為由頂向下的推理 目的是由原因推導(dǎo)出結(jié)果 已知一定的原因 證據(jù) 利用貝葉斯網(wǎng)絡(luò)的推理計(jì)算 求出由原因?qū)е碌慕Y(jié)果發(fā)生的概率 2 貝葉斯網(wǎng)絡(luò)診斷貝葉斯網(wǎng)絡(luò)的診斷是指從結(jié)果推測(cè)一個(gè)起因的推理 也稱為由底至上的推理 目的是在已知結(jié)果時(shí) 找出產(chǎn)生該結(jié)果的原因 已知發(fā)生了某些結(jié)果 根據(jù)貝葉斯網(wǎng)絡(luò)推理計(jì)算造成該結(jié)果發(fā)生的原因和發(fā)生的概率 該診斷作用多用于病理診斷 故障診斷中 目的是找到疾病發(fā)生 故障發(fā)生的原因 15 3 貝葉斯網(wǎng)絡(luò)學(xué)習(xí)貝葉斯網(wǎng)絡(luò)學(xué)習(xí)是指由先驗(yàn)的貝葉斯網(wǎng)絡(luò)得到后驗(yàn)的貝葉斯網(wǎng)絡(luò)的過程 先驗(yàn)貝葉斯網(wǎng)絡(luò)是根據(jù)用戶的先驗(yàn)知識(shí)構(gòu)造的貝葉斯網(wǎng)絡(luò) 后驗(yàn)貝葉斯網(wǎng)絡(luò)是把先驗(yàn)貝葉斯網(wǎng)絡(luò)和數(shù)據(jù)相結(jié)合而得到的貝葉斯網(wǎng)絡(luò) 貝葉斯網(wǎng)絡(luò)學(xué)習(xí)的實(shí)質(zhì)是用現(xiàn)有數(shù)據(jù)對(duì)先驗(yàn)知識(shí)的修正 貝葉斯網(wǎng)絡(luò)能夠持續(xù)學(xué)習(xí) 上次學(xué)習(xí)得到的后驗(yàn)貝葉斯網(wǎng)絡(luò)變成下一次學(xué)習(xí)的先驗(yàn)貝葉斯網(wǎng)絡(luò) 每一次學(xué)習(xí)前用戶都可以對(duì)先驗(yàn)貝葉斯網(wǎng)絡(luò)進(jìn)行調(diào)整 使得新的貝葉斯網(wǎng)絡(luò)更能體現(xiàn)數(shù)據(jù)中蘊(yùn)涵的知識(shí) 貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)關(guān)系如圖7 2所示 圖7 2貝葉斯網(wǎng)絡(luò)持續(xù)學(xué)習(xí) 16 貝葉斯網(wǎng)絡(luò)模型是由網(wǎng)絡(luò)結(jié)構(gòu)和條件概率分布表 ConditionalProbabilityTable CPT 組成的 因此 必須通過給出貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)及每個(gè)結(jié)點(diǎn)上的CPT表來描述一個(gè)貝葉斯網(wǎng)絡(luò) 相應(yīng)地 基于貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)包括結(jié)構(gòu)學(xué)習(xí)和參數(shù)學(xué)習(xí)兩個(gè)內(nèi)容 結(jié)構(gòu)學(xué)習(xí) 即利用訓(xùn)練樣本集 盡可能結(jié)合先驗(yàn)知識(shí) 確定最合適的貝葉斯網(wǎng)絡(luò)模型結(jié)構(gòu) 參數(shù)學(xué)習(xí)是在給定結(jié)構(gòu)下 確定貝葉斯網(wǎng)絡(luò)模型的參數(shù) 即每個(gè)結(jié)點(diǎn)上的CPT表 按照學(xué)習(xí)的目的以及訓(xùn)練樣本集是否完整 可以把學(xué)習(xí)方法歸為以下幾類 如表7 1所示 表7 1貝葉斯網(wǎng)絡(luò)學(xué)習(xí)算法分類表 17 7 4貝葉斯網(wǎng)絡(luò)的預(yù)測(cè) 診斷和訓(xùn)練算法本節(jié)將從圖7 1所示的簡(jiǎn)單貝葉斯網(wǎng)絡(luò)的例子人手 分別介紹貝葉斯網(wǎng)絡(luò)的預(yù)測(cè) 診斷和訓(xùn)練算法 假定網(wǎng)絡(luò)中的概率和條件概率都已經(jīng)知道 也就是說網(wǎng)絡(luò)已經(jīng)訓(xùn)練完畢 這些數(shù)據(jù)給出如下 7 4 1概率和條件概率數(shù)據(jù)圖7 1中的Party和BrainTumor兩個(gè)結(jié)點(diǎn)是原因結(jié)點(diǎn) 沒有連線以它們作為終點(diǎn) 首先給出這兩個(gè)結(jié)點(diǎn)的無(wú)條件概率 如表7 2所示 表7 2中的第二列是關(guān)于Party 參加晚會(huì) 的概率 參加晚會(huì)的概率是0 2 不參加晚會(huì)的概率是0 8 第三列是關(guān)于患腦瘤的概率 患腦瘤的概率是0 001 不患腦瘤的概率是0 999 下面還將給出幾組條件概率 分別是PT已知的情況下HO的條件概率 如表7 3所示 HO已知的情況下SA的條件概率 如表7 4所示 BT已知的情況下PX的概率 如表7 5所示 表7 2結(jié)點(diǎn)PT BT的無(wú)條件概率分布 18 上面三個(gè)表的結(jié)構(gòu)相似 給出的都是條件概率 表7 3中第2列的意思是 當(dāng)參加晚會(huì)后 宿醉的概率是0 7 不宿醉的概率是0 3 第3列的意思是 當(dāng)不參加晚會(huì)后 不會(huì)發(fā)生宿醉的情況 對(duì)表7 4和表7 5的解釋類似 表7 3已知結(jié)點(diǎn)PT時(shí)HO的條件概率 19 最后給出的是一個(gè)聯(lián)合條件概率 已知HO和BT時(shí)HA的概率 如表7 6所示 表7 6已知HO和BT時(shí)HA的概率 當(dāng)沒有宿醉但患有腦瘤的情況下 頭疼的概率是0 9 不頭疼的概率是0 01 B 當(dāng)宿醉發(fā)生和有腦瘤的情況下 頭疼的概率是0 99 不頭疼的概率是0 01 當(dāng)宿醉發(fā)生但沒有腦瘤的情況下 頭疼的概率是0 7 不頭疼的概率是0 3 表7 6中數(shù)據(jù)的意義是 20 貝葉斯網(wǎng)絡(luò)的功能之一就是在已知某些條件結(jié)點(diǎn)的情況下 預(yù)測(cè)結(jié)果結(jié)點(diǎn)的概率 當(dāng)然 貝葉斯網(wǎng)絡(luò)也可以在不知任何結(jié)點(diǎn)信息的情況下計(jì)算某個(gè)結(jié)果結(jié)點(diǎn)的發(fā)生概率 例如 在圖7 1中 如果不知道任何結(jié)點(diǎn)發(fā)生與否的信息 仍然可以估算結(jié)點(diǎn)HA的概率 為了方便 約定 對(duì)于一個(gè)結(jié)點(diǎn)Point P Point 表示Point發(fā)生的概率 P Point 表示不發(fā)生的概率 例7 1 下面計(jì)算結(jié)點(diǎn)HA的概率 根據(jù)全概率公式 有P HA P BT P H0 0 99 P BT P H0 0 9 P BT P H0 0 7 P BT P H0 0 02 0 116P HA 1 P HA O 884也就是說 在沒有任何結(jié)點(diǎn)信息 稱為證據(jù) 的情況下 頭疼的概率是0 116 不頭疼的概率是0 884 用同樣的方式 可以計(jì)算所有結(jié)點(diǎn)的概率 這樣可以使得圖7 1所示的網(wǎng)絡(luò)進(jìn)一步完善 事實(shí)上 完善結(jié)點(diǎn)概率也是預(yù)測(cè)貝葉斯網(wǎng)絡(luò)預(yù)測(cè)的一種情況 即在不知結(jié)點(diǎn)明確信息 證據(jù) 情況下的預(yù)測(cè) 下面進(jìn)行一個(gè)原因結(jié)點(diǎn)明確情況下的預(yù)測(cè) 7 4 2貝葉斯網(wǎng)絡(luò)的預(yù)測(cè)算法 21 例7 2 計(jì)算已知參加晚會(huì)的情況下 第二天早晨呼吸有酒精味的概率 首先 由表7 3可以看出 當(dāng)PT發(fā)生時(shí) HO發(fā)生的概率是0 7 也就是說 當(dāng)參加晚會(huì)后 宿醉發(fā)生的概率是0 7 不發(fā)生的概率是O 3 由全概率公式P SA P H0 P SA H0 P H0 P SA H0 O 7 O 8 0 3 0 1 O 59 22 例7 3 計(jì)算已知參加晚會(huì)的情況下 頭疼發(fā)生的概率 由表7 3可知 當(dāng)PT發(fā)生時(shí) HO發(fā)生的概率是0 7 不發(fā)生的概率是0 3 由表7 2可以看出 BT發(fā)生的概率是0 001 不發(fā)生的概率是0 999 已知HO和BT后 根據(jù)全概率公式 得到P HA P H0 P BT P HA H0 BT P H0 P BT 0 7 P HO P BT 0 9 P HO P BT 0 02 0 7 0 001 0 99 0 7 0 999 0 7 0 3 0 001 0 9 0 3 0 999 0 02 0 496467P HA l P HA 0 503533也就是說 如果知道已經(jīng)參加了晚會(huì) 而沒有其他方面的任何證據(jù) 則這個(gè)人頭疼的概率是0 496 不頭疼的概率是0 504 B 23 讀者可以比較分析例7 1和例7 3的結(jié)果 由于參加晚會(huì) 頭疼發(fā)生的概率大大增加了 結(jié)合上面給出的三個(gè)例子 下面給出貝葉斯網(wǎng)絡(luò)預(yù)測(cè)算法的步驟描述 如下所示 輸入 給定貝葉斯網(wǎng)絡(luò)B 包括網(wǎng)絡(luò)結(jié)構(gòu)m個(gè)結(jié)點(diǎn)以及某些結(jié)點(diǎn)間的連線 原因結(jié)點(diǎn)到中間結(jié)點(diǎn)的條件概率或聯(lián)合條件概率 給定若干個(gè)原因結(jié)點(diǎn)發(fā)生與否的事實(shí)向量F 或者稱為證據(jù)向量 給定待預(yù)測(cè)的某個(gè)結(jié)點(diǎn)t 輸出 結(jié)點(diǎn)t發(fā)生的概率 1 把證據(jù)向量輸入到貝葉斯網(wǎng)絡(luò)B中 2 對(duì)于B中的每一個(gè)沒處理過的結(jié)點(diǎn)n 如果它具有發(fā)生的事實(shí) 證據(jù) 則標(biāo)記它為已經(jīng)處理過 否則繼續(xù)下面的步驟 3 如果它的所有父結(jié)點(diǎn)中有一個(gè)沒有處理過 則不處理這個(gè)結(jié)點(diǎn) 否則 繼續(xù)下面的步驟 4 根據(jù)結(jié)點(diǎn)n的所有父結(jié)點(diǎn)的概率以及條件概率或聯(lián)合條件概率計(jì)算結(jié)點(diǎn)n的概率分布 并把結(jié)點(diǎn)n標(biāo)記為已處理 5 重復(fù)步驟 2 4 共m次 此時(shí) 結(jié)點(diǎn)f的概率分布就是它的發(fā)生 不發(fā)生的概率 算法結(jié)束 需要注意的是 第 5 步的作用是使得每個(gè)結(jié)點(diǎn)都有被計(jì)算概率分布的機(jī)會(huì) 24 根據(jù)條件概率公式P BT PX P PX BT P BT P PX 0 98 0 001 0 011 0 08909P BT PX l P BT PX 0 91l也就是說 當(dāng)X光檢查呈陽(yáng)性的情況下 患腦瘤的概率是0 089 不患腦瘤的概率是0 911 7 4 3貝葉斯網(wǎng)絡(luò)的診斷算法 本部分將做相反方向的工作 在已知結(jié)果結(jié)點(diǎn)發(fā)生與否的情況下推斷條件結(jié)點(diǎn)發(fā)生的概率 例7 4 計(jì)算已知X光檢查呈陽(yáng)性的情況下 患腦瘤的概率 由 P AB P A B p B 得到 P A B P AB P B 而 P AB P B A P A 所以 P A B P AB P B P B A P A P B 上面的例子比較簡(jiǎn)單 可以直接用條件概率公式計(jì)算獲得 下面再看一個(gè)比較復(fù)雜的例子 先驗(yàn)概率 25 例7 5 計(jì)算已知頭疼的情況下 患腦瘤的概率 首先 根據(jù)表7 6給出的聯(lián)合條件分布計(jì)算已知BT情況下HA的邊緣條件概率 為此 要首先計(jì)算結(jié)點(diǎn)HO的概率分布 根據(jù)表7 3和全概率公式P HO P HO PT P PT P HO PT P PT 0 7 0 2 0 0 14 上面的計(jì)算表明 沒有任何證據(jù)的情況下 宿醉發(fā)生的概率是0 14 不發(fā)生的概率是0 86 通過宿醉的發(fā)生概率 可以計(jì)算已知BT情況下HA的邊緣條件概率 26 最后 根據(jù)表7 7提供的條件概率 利用條件概率公式 可得P BT HA P HA BT P BT P HA 0 9126 0 001 0 116 0 007867 P HA BT P HO P HA BT HO P HO P HA BT HO 0 14 0 99 0 86 0 9 0 9126P HA BT 1 P HA BT 0 087上面的計(jì)算得到了已知患腦瘤的情況下頭疼的概率是0 913 不頭疼的概率是0 087 這個(gè)條件概率是一個(gè)邊緣分布 它是從聯(lián)合條件概率分布 H0 BT HA 去掉一個(gè)條件HO得到的 我們把這個(gè)邊緣分布的內(nèi)容整理在表7 7中 B 表7 6 表7 7已知BT情況下HA的 邊緣 條件概率 全概率公式 27 例7 4和例7 5分別從簡(jiǎn)單和復(fù)雜兩種情況進(jìn)行了貝葉斯網(wǎng)絡(luò)的診斷示例 下面的部分將介紹同時(shí)具有預(yù)測(cè)功能和診斷功能的算法 根據(jù)上面的兩個(gè)例子 可以總結(jié)出貝葉斯網(wǎng)絡(luò)診斷算法的一般步驟 如下所示 輸入 給定貝葉斯網(wǎng)絡(luò)B 給定若干個(gè)結(jié)果結(jié)點(diǎn)發(fā)生與否的事實(shí)向量F 或者稱為證據(jù)向量 給定待診斷的某個(gè)結(jié)點(diǎn)t 輸出 結(jié)點(diǎn)t發(fā)生的概率 1 把證據(jù)向量輸入到貝葉斯網(wǎng)絡(luò)B中 2 對(duì)于B中的每一個(gè)沒處理過的結(jié)點(diǎn)n 如果它具有發(fā)生的事實(shí) 證據(jù) 則標(biāo)記它為已經(jīng)處理過 否則繼續(xù)下面的步驟 3 如果它的所有子結(jié)點(diǎn)中有一個(gè)沒有處理過 則不處理這個(gè)結(jié)點(diǎn) 否則 繼續(xù)下面的步驟 4 根據(jù)結(jié)點(diǎn)n的所有子結(jié)點(diǎn)的概率以及條件概率或聯(lián)合條件概率計(jì)算結(jié)點(diǎn)n的概率分布 并把結(jié)點(diǎn)n標(biāo)記為已處理 5 重復(fù)步驟 2 4 共m次 此時(shí) 原因結(jié)點(diǎn)t的概率分布就是它的發(fā)生 不發(fā)生的概率 算法結(jié)束 需要注意的是 第 5 步的作用是使得每個(gè)結(jié)點(diǎn)都有被計(jì)算概率分布的機(jī)會(huì) 28 例7 6 計(jì)算已知參加晚會(huì)并且第二天早上呼吸有酒精味的情況下 宿醉的發(fā)生概率 由于已知參加了晚會(huì) PT 那么根據(jù)表7 3 宿醉發(fā)生的概率是0 7 不發(fā)生的概率是0 3 根據(jù)全概率公式P SA P SA HO P HO P SA HO P 一HO 0 8 0 7 0 1 0 3 0 59這個(gè)結(jié)果就是已知參加晚會(huì)的情況下 有酒精味的發(fā)生概率 再利用條件概率公式 可得P H0 SA P SA HO P HO P SA 0 8 0 7 0 59 0 94915這是最終的結(jié)果 也就是說 當(dāng)參加晚會(huì)并且第二天早晨有酒精味的情況下 宿醉發(fā)生的概率是0 949 從上面的計(jì)算過程可以總結(jié)出解決這類綜合問題的一般思路 首先 要把原因結(jié)點(diǎn)的證據(jù) 此例中是 PT 進(jìn)行擴(kuò)散 得到中間結(jié)點(diǎn) HO 或結(jié)果結(jié)點(diǎn) SA 的概率分布 最后根據(jù)條件概率公式計(jì)算中間結(jié)點(diǎn)的概率分布 7 4 4貝葉斯網(wǎng)絡(luò)預(yù)測(cè)和診斷的綜合算法 利用貝葉斯網(wǎng)絡(luò)進(jìn)行單純的預(yù)測(cè)或進(jìn)行單純的診斷的情況是比較少的 一般情況下 需要綜合使用預(yù)測(cè)和診斷的功能 29 這是解決預(yù)測(cè)和診斷綜合問題的一般思路 下面將給出一個(gè)更復(fù)雜的綜合問題的例子 例7 7 計(jì)算在已知有酒精味 頭疼的情況下 患腦瘤的概率 首先 由條件概率公式可以計(jì)算在有酒精味的情況下宿醉的發(fā)生概率P H0 SA P SA HO P HO P SA 0 5656然后 由全概率公式可以計(jì)算患腦瘤的情況下頭疼的發(fā)生概率 當(dāng)然 這時(shí)宿醉的概率已經(jīng)是0 5656 它參與了下面的運(yùn)算 P HA BT P HA BT HO P HO P HA BT 一HO P 一HO 0 99 P HO 0 9 P 一HO 0 9509最后 再由條件概率公式可以計(jì)算患腦瘤的概率P BT HA P HA BT P BT P HA 0 9509 0 001 0 4052 0 002347可以比較例7 7和例7 5的計(jì)算結(jié)果 例7 7中計(jì)算得到的患腦瘤的概率要相對(duì)小一些 同樣患有頭疼 兩個(gè)例子中患腦瘤的概率是不一樣的 這是因?yàn)?例7 7中的結(jié)果結(jié)點(diǎn) 有酒精味 發(fā)生 這意味著頭疼的原因有更大的可能是因?yàn)樗拮?而不是患腦瘤 除了上面的7個(gè)例子外 讀者可以試著解決圖7 1所示貝葉斯網(wǎng)絡(luò)中更復(fù)雜的例子 或者解決本章后面的習(xí)題 30 7 4 5貝葉斯網(wǎng)絡(luò)的建立和訓(xùn)練算法本章前面各節(jié)所進(jìn)行工作的前提是假設(shè)貝葉斯網(wǎng)絡(luò)已經(jīng)建立 有了結(jié)點(diǎn)和連線 原因結(jié)點(diǎn)的概率分布已經(jīng)確定 并且有連線結(jié)點(diǎn)間的條件概率也已經(jīng)確定 那么 如何建立一個(gè)貝葉斯網(wǎng)絡(luò)呢 要建立貝葉斯網(wǎng)絡(luò) 首先要把實(shí)際問題的事件抽象為結(jié)點(diǎn) 這些結(jié)點(diǎn)必須有明確的意義 至少有是 非兩個(gè)狀態(tài) 或者有多個(gè)狀態(tài) 并且這些狀態(tài)在概率意義上是
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年羽絨服裝設(shè)計(jì)與生產(chǎn)合同
- 草金魚養(yǎng)殖知識(shí)培訓(xùn)課件
- 2024年綠色出行子女上下學(xué)接送合同示范3篇
- 2024年項(xiàng)目啟動(dòng)專項(xiàng)合同版B版
- 2024年度高新技術(shù)產(chǎn)品推廣合作服務(wù)合同3篇
- A、B雙方合作經(jīng)營(yíng)合同2024版版B版
- 浙江宇翔職業(yè)技術(shù)學(xué)院《企業(yè)倫理與會(huì)計(jì)職業(yè)道德》2023-2024學(xué)年第一學(xué)期期末試卷
- 酒店財(cái)務(wù)管理實(shí)踐經(jīng)驗(yàn)
- 2025年度幼兒園幼兒教育質(zhì)量評(píng)價(jià)合同3篇
- 樂器行業(yè)行政后勤協(xié)調(diào)總結(jié)
- 汽車修理業(yè)務(wù)受理程序、服務(wù)承諾、用戶抱怨制度
- GB/T 44670-2024殯儀館職工安全防護(hù)通用要求
- 8.制作豆腐 教案 2023-2024學(xué)年江蘇鳳凰出版社九年級(jí)勞動(dòng)技術(shù)
- 《聯(lián)合國(guó)教科文:學(xué)生人工智能能力框架》-中文版
- 合同債務(wù)人變更協(xié)議書模板
- 高中生物必修一知識(shí)點(diǎn)總結(jié)(必修1)
- 《風(fēng)力發(fā)電技術(shù)》課件-第三章 機(jī)組運(yùn)行與維護(hù)
- 2024年高中生物新教材同步選擇性必修第三冊(cè)學(xué)習(xí)筆記第4章 本章知識(shí)網(wǎng)絡(luò)
- 物料報(bào)廢回收合同范本
- 西班牙可再生能源行業(yè)市場(chǎng)前景及投資研究報(bào)告-培訓(xùn)課件外文版2024.6光伏儲(chǔ)能風(fēng)電
- 科研機(jī)構(gòu)成果轉(zhuǎn)化困境與對(duì)策
評(píng)論
0/150
提交評(píng)論