下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
通俗地理解貝葉斯公式(定理)樸素貝葉斯(NaiveBayesianalgorithm)是有監(jiān)督學(xué)習(xí)的一種分類算法,它基于“貝葉斯定理”實(shí)現(xiàn),該原理的提出人是英國(guó)著名數(shù)學(xué)家托馬斯·貝葉斯。貝葉斯定理是基于概率論和統(tǒng)計(jì)學(xué)的相關(guān)知識(shí)實(shí)現(xiàn)的,因此在正式學(xué)習(xí)“樸素貝葉斯算法”前,我們有必要先認(rèn)識(shí)“貝葉斯定理”。貝葉斯定理貝葉斯定理的發(fā)明者
托馬斯·貝葉斯
提出了一個(gè)很有意思的假設(shè):“如果一個(gè)袋子中共有10個(gè)球,分別是黑球和白球,但是我們不知道它們之間的比例是怎么樣的,現(xiàn)在,僅通過(guò)摸出的球的顏色,是否能判斷出袋子里面黑白球的比例?”上述問(wèn)題可能與我們高中時(shí)期所接受的的概率有所沖突,因?yàn)槟闼佑|的概率問(wèn)題可能是這樣的:“一個(gè)袋子里面有10個(gè)球,其中4個(gè)黑球,6個(gè)白球,如果你隨機(jī)抓取一個(gè)球,那么是黑球的概率是多少?”毫無(wú)疑問(wèn),答案是0.4。這個(gè)問(wèn)題非常簡(jiǎn)單,因?yàn)槲覀兪孪戎懒舜永锩婧谇蚝桶浊虻谋壤?,所以很容易算出摸一個(gè)球的概率,但是在某些復(fù)雜情況下,我們無(wú)法得知“比例”,此時(shí)就引出了貝葉斯提出的問(wèn)題。在統(tǒng)計(jì)學(xué)中有兩個(gè)較大的分支:一個(gè)是“頻率”,另一個(gè)便是“貝葉斯”,它們都有各自龐大的知識(shí)體系,而“貝葉斯”主要利用了“相關(guān)性”一詞。下面以通俗易懂的方式描述一下“貝葉斯定理”:通常,事件A在事件B發(fā)生的條件下與事件B在事件A發(fā)生的條件下,它們兩者的概率并不相同,但是它們兩者之間存在一定的相關(guān)性,并具有以下公式(稱之為“貝葉斯公式”):看到上述公式,你可能一頭霧水,不過(guò)不必慌張,下面我們來(lái)了解一下“貝葉斯”公式。符號(hào)意義首先我們要了解上述公式中符號(hào)的意義:P(A)這是概率中最基本的符號(hào),表示A出現(xiàn)的概率。比如在投擲骰子時(shí),P(2)指的是骰子出現(xiàn)數(shù)字“2”的概率,這個(gè)概率是六分之一。P(B|A)是條件概率的符號(hào),表示事件A
發(fā)生的條件下,事件B
發(fā)生的概率,條件概率是“貝葉斯公式”的關(guān)鍵所在,它也被稱為“似然度”。P(A|B)是條件概率的符號(hào),表示事件B
發(fā)生的條件下,事件A發(fā)生的概率,這個(gè)計(jì)算結(jié)果也被稱為“后驗(yàn)概率”。有上述描述可知,貝葉斯公式可以預(yù)測(cè)事件發(fā)生的概率,兩個(gè)本來(lái)相互獨(dú)立的事件,發(fā)生了某種“相關(guān)性”,此時(shí)就可以通過(guò)“貝葉斯公式”實(shí)現(xiàn)預(yù)測(cè)。條件概率條件概率是“貝葉斯公式”的關(guān)鍵所在,那么如何理解條件概率呢?其實(shí)我們可以從“相關(guān)性”這一詞語(yǔ)出發(fā)。舉一個(gè)簡(jiǎn)單的例子,比如小明和小紅是同班同學(xué),他們各自準(zhǔn)時(shí)回家的概率是P(小明回家)=1/2和P(小紅回家)=1/2,但是假如小明和小紅是好朋友,每天都會(huì)一起回家,那么P(小紅回家|小明回家)=1(理想狀態(tài)下)。上述示例就是條件概率的應(yīng)用,小紅和小明之間產(chǎn)生了某種關(guān)聯(lián)性,本來(lái)倆個(gè)相互獨(dú)立的事件,變得不再獨(dú)立。但是還有一種情況,比如小亮每天準(zhǔn)時(shí)到家P(小亮回家)=1/2,但是小亮喜歡獨(dú)來(lái)獨(dú)往,如果問(wèn)P(小亮回家|小紅回家)的概率是多少呢?你會(huì)發(fā)現(xiàn)這兩者之間不存在“相關(guān)性”,小紅是否到家,不會(huì)影響小亮的概率結(jié)果,因此小亮準(zhǔn)時(shí)到家的概率仍然是1/2。貝葉斯公式的核心是“條件概率”,譬如P(B|A),就表示當(dāng)A發(fā)生時(shí),B發(fā)生的概率,如果P(B|A)的值越大,說(shuō)明一旦發(fā)生了A,B就越可能發(fā)生。兩者可能存在較高的相關(guān)性。先驗(yàn)概率在貝葉斯看來(lái),世界并非靜止不動(dòng)的,而是動(dòng)態(tài)和相對(duì)的,他希望利用已知經(jīng)驗(yàn)來(lái)進(jìn)行判斷,那么如何用經(jīng)驗(yàn)進(jìn)行判斷呢?這里就必須要提到“先驗(yàn)”和“后驗(yàn)”這兩個(gè)詞語(yǔ)。我們先講解“先驗(yàn)”,其實(shí)“先驗(yàn)”就相當(dāng)于“未卜先知”,在事情即將發(fā)生之前,做一個(gè)概率預(yù)判。比如從遠(yuǎn)處駛來(lái)了一輛車,是轎車的概率是45%,是貨車的概率是35%,是大客車的概率是20%,在你沒有看清之前基本靠猜,此時(shí),我們把這個(gè)概率就叫做“先驗(yàn)概率”。后驗(yàn)概率在理解了“先驗(yàn)概率”的基礎(chǔ)上,我們來(lái)研究一下什么是“后驗(yàn)概率?”我們知道每一個(gè)事物都有自己的特征,比如前面所說(shuō)的轎車、貨車、客車,它們都有著各自不同的特征,距離過(guò)遠(yuǎn)的時(shí)候,我們無(wú)法用肉眼分辨,而當(dāng)距離達(dá)到一定范圍內(nèi)就可以根據(jù)各自的特征再次做出概率預(yù)判,這就是后驗(yàn)概率。比如轎車的速度相比于另外兩者更快可以記做P(轎車|速度快)=55%,而客車體型可能更大,可以記做P(客車|體型大)=35%。如果用條件概率來(lái)表述P(體型大|客車)=35%,這種通過(guò)“車輛類別”推算出“類別特征”發(fā)生的的概率的方法叫作“似然度”。這里的似然就是“可能性”的意思。樸素+貝葉斯了解完上述概念,你可能對(duì)貝葉斯定理有了一個(gè)基本的認(rèn)識(shí),實(shí)際上貝葉斯定理就是求解后驗(yàn)概率的過(guò)程,而核心方法是通過(guò)似然度預(yù)測(cè)后驗(yàn)概率,通過(guò)不斷提高似然度,自然也就達(dá)到了提高后驗(yàn)概率的目的。我們知道“樸素貝葉斯算法”由兩個(gè)詞語(yǔ)組成。樸素(native)是用來(lái)修飾“貝葉斯”這個(gè)名詞的。按照中文的理解“樸素”意味著簡(jiǎn)單不奢華。樸素的英文是“native”,意味著“單純天真”。樸素
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東科學(xué)技術(shù)職業(yè)學(xué)院《工程材料與構(gòu)造》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東交通職業(yè)技術(shù)學(xué)院《油層物理實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東建設(shè)職業(yè)技術(shù)學(xué)院《電子商務(wù)原理》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東工商職業(yè)技術(shù)大學(xué)《中國(guó)影視鑒賞》2023-2024學(xué)年第一學(xué)期期末試卷
- 閑聊培訓(xùn)課件
- 《動(dòng)態(tài)路由協(xié)議配置》課件
- 贛西科技職業(yè)學(xué)院《大數(shù)據(jù)金融應(yīng)用》2023-2024學(xué)年第一學(xué)期期末試卷
- 應(yīng)急救援安全培訓(xùn)課件
- 贛州師范高等??茖W(xué)?!缎畔踩夹g(shù)導(dǎo)論》2023-2024學(xué)年第一學(xué)期期末試卷
- 工程寶培訓(xùn)課件
- 腰椎骨折病人的護(hù)理ppt
- 《保障農(nóng)民工工資支付條例》口袋書課件
- 2020 新ACLS-PCSA課前自我測(cè)試-翻譯版玉二醫(yī)【復(fù)制】附有答案
- 危險(xiǎn)化學(xué)品安全周知卡氧氣
- DB13∕T 5517-2022 大田作物病蟲草害防控關(guān)鍵期植保無(wú)人飛機(jī)作業(yè)技術(shù)規(guī)程
- 《編譯原理》考試試習(xí)題及答案(匯總)
- 贏在執(zhí)行力:團(tuán)隊(duì)執(zhí)行力-下
- 鉆孔灌注樁后注漿施工方案(最全版)
- 政工干部年度述職報(bào)告
- 1000MW電廠水處理DCS控制系統(tǒng)設(shè)計(jì)
- 硬件設(shè)計(jì)checklist
評(píng)論
0/150
提交評(píng)論