數(shù)學(xué)、思維與人工智能_第1頁
數(shù)學(xué)、思維與人工智能_第2頁
數(shù)學(xué)、思維與人工智能_第3頁
數(shù)學(xué)、思維與人工智能_第4頁
數(shù)學(xué)、思維與人工智能_第5頁
已閱讀5頁,還剩281頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)學(xué)、思維與人工智能目錄\h第1章初始之旅\h學(xué)生問難\h走上貝葉斯主義的道路\h統(tǒng)一的知識哲學(xué)\h科學(xué)方法的替代\h客觀性的迷夢\h本書的目標(biāo)\h第2章貝葉斯定理\h小孩謎題\h蒙蒂·霍爾問題\h薩莉·克拉克的審判\(zhòng)h被判非法的貝葉斯主義\h貝葉斯定理\h貝葉斯公式的組成部分\h貝葉斯主義對化驗(yàn)結(jié)果的解讀\h貝葉斯主義對薩莉·克拉克的辯護(hù)\h小孩謎題終于解決了!\h幾句鼓勵(lì)的話\h第3章從邏輯上來說……\h兩種思考模式\h邏輯的規(guī)則\hQ的背面都是藍(lán)色的嗎?\h量詞與謂詞\h重新解釋亞里士多德三段論\h公理化方法\h柏拉圖主義者對陣直覺主義者\(yùn)h貝葉斯邏輯※\h超越真與假\h矛盾理論走向共存\h第4章必須(正確地)泛化!\h蘇格蘭的黑色綿羊\h認(rèn)識論簡史\h行星研究簡史\h科學(xué)與波普爾背道而馳?\h頻率主義※\h反對p值的統(tǒng)計(jì)學(xué)家\hp值操控\h統(tǒng)計(jì)學(xué)課本講了什么\h智慧方程\h漸進(jìn)學(xué)習(xí)\h再談愛因斯坦\h第5章榮耀歸于偏見\h琳達(dá)問題\h用偏見解釋琳達(dá)問題※\h偏見是必要的\hxkcd1的太陽\h用偏見解釋xkcd\h用偏見為薩莉·克拉克辯護(hù)\h用偏見對抗偽科學(xué)\h偏見拯救科學(xué)\h貝葉斯主義者對萬物均有偏見\h錯(cuò)誤的偏見\h偏見與道德\h第6章貝葉斯主義的“先知”\h一段起伏跌宕的歷史\h概率論的起源\h神秘的托馬斯·貝葉斯\h拉普拉斯,貝葉斯主義之父\h拉普拉斯接續(xù)法則\h貝葉斯主義的寒冬\h貝葉斯主義拯救盟軍\h頻率主義海洋中的貝葉斯孤島\h被實(shí)干者拯救的貝葉斯主義\h貝葉斯主義的勝利\h貝葉斯無處不在\h第7章所羅門諾夫妖\h非人類,也非機(jī)器\h算法基礎(chǔ)\h“模式”是什么?\h所羅門諾夫復(fù)雜度\h算法與概率的聯(lián)姻\h所羅門諾夫的偏見※\h貝葉斯主義造就所羅門諾夫妖※\h所羅門諾夫完備性\h所羅門諾夫歸納法的不可計(jì)算性\h所羅門諾夫不完備性\h對實(shí)用的追求\h第8章保守秘密\h保密\h今天的密碼學(xué)\h用貝葉斯主義破譯密碼\h隨機(jī)調(diào)查問卷\h隨機(jī)調(diào)查的私密性\h差分隱私的定義※\h拉普拉斯型機(jī)制\h組合健壯性\h隱私損失的可加性\h在實(shí)踐中可行不通!\h同態(tài)加密\h第9章博弈已成定局\h“心計(jì)”\h平分還是獨(dú)占\h貝葉斯式游說\h謝林點(diǎn)\h混合均衡\h貝葉斯博弈\h貝葉斯機(jī)制設(shè)計(jì)※\h邁爾森的拍賣\h貝葉斯主義的社會影響\h第10章達(dá)爾文遇上貝葉斯\h幸存者偏差\h加利福尼亞的五彩蜥蜴\h洛特卡-沃爾泰拉動力學(xué)※\h遺傳算法\h構(gòu)筑自己的意見?\h單個(gè)科學(xué)家并不可靠\h訴諸權(quán)威\h科學(xué)共識\h“標(biāo)題黨”\h市場的預(yù)測能力\h金融泡沫\h第11章指數(shù)超乎直覺\h那些大得過分的數(shù)\h計(jì)算的“玻璃天花板”\h指數(shù)爆炸\h印度-阿拉伯?dāng)?shù)字的魔法\h本福特定律\h對數(shù)尺度\h對數(shù)\h貝葉斯公式搶到了哥德爾獎(jiǎng)\h貝葉斯主義者的度假方法\h技術(shù)奇點(diǎn)\h第12章?lián)]動奧卡姆的剃刀\h上星期四……\h足球里沒有命中注定\h過度詮釋的災(zāi)難\h追尋簡單性的復(fù)雜旅程\h世事并非一貫簡單\h交叉驗(yàn)證\h蒂布斯蘭尼正則化\h穩(wěn)健優(yōu)化\h用貝葉斯方法解決過度擬合※\h只有貝葉斯推斷才是可容許的※\h奧卡姆剃刀來自貝葉斯主義!\h第13章真相在撒謊\h公立醫(yī)院還是私人診所?\h相關(guān)并非因果\h尋找混雜因素\h回歸平均\h斯坦悖論\h內(nèi)生分層的失效\h進(jìn)行隨機(jī)化吧!\h蘇格蘭黑色綿羊的回歸\h貓是什么?\h詩性自然主義\h第14章又快又(足夠)好\h素?cái)?shù)的奧秘\h素?cái)?shù)定理\h的近似\h漸近展開\h實(shí)用主義的限制\h圖靈的機(jī)器學(xué)習(xí)\h實(shí)用貝葉斯主義\h次線性算法\h思考的多種模式\h邁進(jìn)后嚴(yán)謹(jǐn)階段!\h貝葉斯的近似\h第15章不走運(yùn)導(dǎo)致的錯(cuò)誤\hFiveThirtyEight與2016年美國總統(tǒng)大選\h量子力學(xué)是概率性的嗎?\h混沌理論\h無法預(yù)測的確定性自動機(jī)\h熱力學(xué)\h香農(nóng)熵\h香農(nóng)的最優(yōu)壓縮\h香農(nóng)冗余度\hKL散度\h沃瑟斯坦度量\h生成式對抗網(wǎng)絡(luò)\h第16章記憶缺陷\h數(shù)據(jù)的價(jià)值\h數(shù)據(jù)泛濫\h廁所問題\h信息洪流的高速處理\h卡爾曼濾波器\h面對大數(shù)據(jù)的人類大腦\h擦除記憶創(chuàng)傷\h虛假回憶\h用貝葉斯幫助記憶\h短期記憶與長期記憶\h遞歸神經(jīng)網(wǎng)絡(luò)\h應(yīng)該學(xué)什么,應(yīng)該教什么?\h第17章睡夢是你的顧問\h想法從何而來?\h人工智能的創(chuàng)新藝術(shù)\h隱含狄利克雷分布\h向LDA施以援手的中餐館\h蒙特卡羅模擬\h隨機(jī)梯度下降法\h偽隨機(jī)數(shù)\h重要性抽樣\h重要性抽樣能助LDA一臂之力\h伊辛模型※\h玻爾茲曼機(jī)\hMCMC與谷歌的PageRank\h梅特羅波利斯-黑廷斯抽樣\h吉布斯抽樣\hMCMC與認(rèn)知偏差\h對比散度與夢\h第18章抽象方法超出常理的有效性\h深度學(xué)習(xí),真的行!\h特征學(xué)習(xí)\h單詞的向量表示\h指數(shù)式的表達(dá)能力※\h復(fù)雜性的涌現(xiàn)\h柯爾莫哥洛夫精致度※\h精致度就是所羅門諾夫的MAP估計(jì)!※\h本內(nèi)特的邏輯深度\h數(shù)學(xué)的深度\h數(shù)學(xué)的簡潔性\h數(shù)學(xué)的模塊性\h第19章貝葉斯大腦\h大腦不可思議\h山峰還是山谷?\h視錯(cuò)覺\h運(yùn)動的感知\h貝葉斯抽樣\h歸納問題\h學(xué)習(xí)如何學(xué)習(xí)\h抽象的恩賜\h嬰兒都是天才\h語言\h學(xué)習(xí)計(jì)數(shù)\h心智理論\h先天還是后天?\h第20章一切都是虛構(gòu)\h柏拉圖的洞穴\h反實(shí)在主義\h生命是否存在?\h貨幣是否存在?\h目的論,科學(xué)中的一條死路?\h關(guān)于現(xiàn)實(shí),圖靈-丘奇論題有何說法?\h(工具主義的)非實(shí)在論有用嗎?\h大腦之外的世界是否存在?\h貓存在于二進(jìn)制代碼中嗎?\h所羅門諾夫妖的非實(shí)在論\h第21章信念的起源\h發(fā)散級數(shù)的奇聞\h但那是錯(cuò)的,不是嗎?\h軍官學(xué)生\h我的亞洲之旅\h都是因?yàn)槟Ч慝@得了權(quán)力?\h故事比數(shù)字更有效果\h心理作用\h意識形態(tài)的達(dá)爾文式演化\h心理作用有用\h視頻網(wǎng)站的魔法\h旅途仍在繼續(xù)\h第22章超越貝葉斯主義\h貝葉斯不考慮道德哲學(xué)\h自然(選擇得到的)道德\h無意識的道德\h胡蘿卜加大棒\h大多數(shù)人的道德?\h道德義務(wù)論\h知識是合理的目的嗎?\h效用主義第1章初始之旅學(xué)生問難在加拿大蒙特利爾綜合理工學(xué)校,我教完一節(jié)概率統(tǒng)計(jì)課后,有個(gè)來“釣魚”的學(xué)生過來問了我一個(gè)看起來很簡單的謎題:某人有兩個(gè)孩子,其中至少有一個(gè)是男孩,那么另一個(gè)孩子也是男孩的概率是多少?想了幾秒之后,我找到了這個(gè)謎題的正確答案——我們之后會看到答案不是1/2。這位學(xué)生點(diǎn)點(diǎn)頭,又接著問了第二個(gè)謎題:假設(shè)你現(xiàn)在知道這個(gè)人至少有一個(gè)出生在星期二的男孩,那么另一個(gè)孩子也是男孩的概率是多少?這次我答錯(cuò)了,學(xué)生把我難住了。人們一般認(rèn)為這兩個(gè)謎題只不過是數(shù)學(xué)游戲。它們確實(shí)有正確答案,但這只不過是對嚴(yán)謹(jǐn)而受限的數(shù)學(xué)框架而言。我們也會在學(xué)校的習(xí)題或者考試中遇到這種問題,但這只不過是數(shù)學(xué)問題。然而,這位“釣魚”學(xué)生的謎題只能說是充斥日常生活的眾多思考的超級簡化版。我們是否應(yīng)該相信某項(xiàng)醫(yī)學(xué)診斷?能否從某個(gè)例子歸納得出結(jié)論?如果有一千個(gè)甚至一百萬個(gè)例子呢?訴諸權(quán)威是否有某種價(jià)值?是否應(yīng)該相信金融市場?轉(zhuǎn)基因作物是否有害?科學(xué)在什么意義上比偽科學(xué)更“有道理”?機(jī)器人會不會征服世界?是否應(yīng)該譴責(zé)資本主義?是否應(yīng)該相信上帝的存在?什么是好,什么是壞?對很多人來說,這些問題與數(shù)學(xué)毫無瓜葛。確實(shí),面對這種問題,數(shù)學(xué)自身無能為力。你不能只靠證明定理來解決世界上的饑饉。但可以打賭的是,數(shù)學(xué)可以幫助我們更好地整理思緒,理解與之關(guān)聯(lián)的事物并得到出人意料的答案。許多學(xué)科越來越數(shù)學(xué)化,其中包括人道主義援助[1],這大概并不是什么偶然。盡管已有的數(shù)學(xué)模型比比皆是,但我們之中大部分人似乎堅(jiān)持希望將“現(xiàn)實(shí)世界”和學(xué)校逼著我們學(xué)習(xí)的知識區(qū)分開來。特別是,人們經(jīng)常認(rèn)為現(xiàn)實(shí)世界遠(yuǎn)遠(yuǎn)超出了數(shù)學(xué)的范疇,而數(shù)學(xué)定理似乎從來不應(yīng)該甚至不能應(yīng)用到現(xiàn)實(shí)世界中。一個(gè)人要有多愚蠢才會認(rèn)為數(shù)學(xué)跟“法律面前人人平等”有關(guān)系[2]?而且,這種對數(shù)學(xué)應(yīng)用的懷疑不僅僅是差學(xué)生的條件反射。在面對“釣魚”學(xué)生失利之后的幾年內(nèi),我自己也沒有意識到,這個(gè)數(shù)學(xué)上的失誤揭示出我正確思考現(xiàn)實(shí)世界的能力有缺陷。即使是我自己也沒有認(rèn)識到,更好地理解這個(gè)謎題能讓我更好地傾聽那些愛好旅游的朋友的建議,以便更好地選擇下一次假期的目的地——我們之后再談這個(gè)問題。走上貝葉斯主義的道路當(dāng)然,當(dāng)天晚上我就解決了那位“釣魚”學(xué)生的謎題——代價(jià)是一堆神秘難懂的計(jì)算。但僅僅在三年之后的2016年初,當(dāng)我開始密切關(guān)注頻率主義和貝葉斯主義統(tǒng)計(jì)學(xué)家之間的論戰(zhàn)時(shí)[3],我才真正開始深思那位“釣魚”學(xué)生的謎題,特別是將它放到純粹數(shù)學(xué)的框架以外來思考。在接下來的兩年中,我開始以幾乎每天一次的頻率思考用于解開這個(gè)謎題的神奇公式。令我喜出望外的是,這個(gè)神秘的公式向我一步步展示了它的秘密。耀眼的它一步步吸引著我,甚至改變了我思考世界、科學(xué)與知識的方式。在幾個(gè)月內(nèi),我最終沉浸于這個(gè)無法抗拒的公式的高貴優(yōu)雅之中。這實(shí)在太厲害了,我必須用這個(gè)題材寫整整一本書。就這樣,在2016年底,我投身于創(chuàng)作你現(xiàn)在打開的這本書。至于我剛才說到的無法抗拒的公式,我喜歡把它夸張地說成“智慧方程”。但數(shù)學(xué)家、統(tǒng)計(jì)學(xué)家和計(jì)算機(jī)科學(xué)家早已認(rèn)識這個(gè)公式,他們用的是“貝葉斯公式”這個(gè)名字。在法國高中課程里,貝葉斯公式是一個(gè)簡明扼要的數(shù)學(xué)定理,是一個(gè)緊湊的等式。其證明只需要一行,而且只需要用到乘法、除法和有關(guān)概率的概念。特別是,比起要求高中生和大學(xué)生掌握的許多其他數(shù)學(xué)概念來說,這個(gè)公式似乎遠(yuǎn)遠(yuǎn)更容易學(xué)會。然而我敢說,即使是最好的數(shù)學(xué)家也未必理解這個(gè)貝葉斯公式——甚至有數(shù)學(xué)定理解釋了為什么我們無法掌握這個(gè)公式!即使說得不那么絕對,但對我來說毫無疑問的是,我仍然不理解貝葉斯公式。說到底,假如我在教那門概率統(tǒng)計(jì)課的時(shí)候真正理解了貝葉斯公式的話,那么當(dāng)時(shí)我就應(yīng)該可以直接看出“一個(gè)男孩生在星期二”的事實(shí)與其同胞的性別之間的聯(lián)系,并能立刻回答出那位“釣魚”學(xué)生的問題,而不應(yīng)該被他難住。自此兩年后,我絞盡腦汁不再這樣被人問倒。我想知道、想理解、想感受貝葉斯公式。我已經(jīng)學(xué)到了不少東西,但我還在繼續(xù)學(xué)習(xí)。我?guī)缀趺刻於荚诔了钾惾~斯公式,它就像一位神祇,我每天都必須花一部分時(shí)間向它“祈禱”。這種沉思帶來了何等的幸福!這絲毫不是重復(fù)勞動,更像是在一直灌溉我的好奇心,一點(diǎn)一滴地向我低語貝葉斯公式那些令人驚訝的推論。在數(shù)月的長久思考之后,我最終確信,像貝葉斯公式那么深邃的想法并不多。今天我甚至愿意說,“理性”本質(zhì)上可以歸結(jié)于貝葉斯公式的應(yīng)用——這樣說的話,人人都不理性!無論如何,我們所說的貝葉斯的哲學(xué),或貝葉斯主義,就建基于此。統(tǒng)一的知識哲學(xué)因?yàn)槲以谶@里還沒有時(shí)間講述貝葉斯公式是什么,所以,關(guān)于貝葉斯主義我現(xiàn)在只能講個(gè)大概。如果必須用三句話粗略概括貝葉斯主義的話,我會給出以下定義:貝葉斯主義就是假設(shè)“現(xiàn)實(shí)”的所有模型、理論或概念都只不過是某種信念、虛構(gòu)或詩歌,尤其要指出的是,“所有模型都是錯(cuò)的”;然后,實(shí)際數(shù)據(jù)應(yīng)該迫使我們調(diào)整賦予不同模型的重要性,即置信度;關(guān)鍵在于,調(diào)整這些置信度的方式應(yīng)該盡可能嚴(yán)謹(jǐn)?shù)刈裱惾~斯公式。我之前一直覺得這種知識哲學(xué)沒有意義。它似乎否定了所有關(guān)于現(xiàn)實(shí)和真理的概念,即使這些概念對研究人員來說如此重要;但它又似乎完全符合物理學(xué)家、諾貝爾物理學(xué)獎(jiǎng)獲得者理查德·費(fèi)曼的說法[4]:“我能帶著疑問、不確定和無知活著。我覺得,比起知道一些可能錯(cuò)誤的答案,還是不知道答案的生活更有趣。我有些近似的答案,對于各種問題也有些確定程度或高或低的合理信念,但我不會絕對確信任何事情。也有很多我一點(diǎn)都不明白的事情,但我不一定需要一個(gè)答案。我不害怕‘我不知道’這個(gè)事實(shí)。”你可能會覺得這種觀點(diǎn)激動人心,或者希望將這種看待知識的方法拒之門外。然而在選擇接受還是拒絕貝葉斯主義之前,我只能鼓勵(lì)你先花點(diǎn)時(shí)間,長考一下貝葉斯公式與它的推論。遺憾的是,這本書里的主要向?qū)В簿褪俏?,對這個(gè)公式的理解還非常淺薄。為了幫助思考,我會引入一位虛構(gòu)人物,叫作“純粹貝葉斯主義者”,然后我們會嘗試想象這位純粹貝葉斯主義者在不同的情景下會做出什么反應(yīng)。我希望大家考驗(yàn)的不是我,而是這位純粹貝葉斯主義者,我們會在本書中一直進(jìn)行這樣的考驗(yàn)。我們將會考慮眾多思想實(shí)驗(yàn),也就是這位純粹貝葉斯主義者應(yīng)當(dāng)完成的挑戰(zhàn)。我們也會細(xì)心觀察、衡量并批評這位純粹貝葉斯主義者的各種反應(yīng)——即使這些批評通常很快就會掉轉(zhuǎn)矛頭,針對我們自身的直覺和難以摒棄的自信過度。偉大的皮埃爾–西蒙·拉普拉斯稱得上史上第一位貝葉斯主義者,即便是他,也只是純粹貝葉斯主義者的不完全寫照,純粹貝葉斯主義者能做的所有計(jì)算、思考和預(yù)言都已經(jīng)在半個(gè)世紀(jì)前被雷·所羅門諾夫這位驍將嚴(yán)謹(jǐn)?shù)孛枋隽顺鰜?。可惜的是,所羅門諾夫描述的這位純粹貝葉斯主義者似乎必然會違背物理法則,特別是之后會提到的圖靈–丘奇論題,我們之后會更深入地討論這一點(diǎn)。正是這種限制迫使我們只能考慮一種必定僅作為近似的貝葉斯主義,我稱之為實(shí)用貝葉斯主義。它跟純粹貝葉斯主義的不同之處,就是它要求(迅速的)可計(jì)算性。我用另一位虛構(gòu)人物來代表它,我把這個(gè)人物叫作“實(shí)用貝葉斯主義者”。不巧(或者說湊巧)的是,我對實(shí)用貝葉斯主義者的描述也遠(yuǎn)非完全,因?yàn)閷?shí)用貝葉斯主義仍然是一個(gè)廣闊并大有可為的研究領(lǐng)域——沒人敢說這個(gè)領(lǐng)域有朝一日能被完全解明??赡苣阋膊碌搅?,理解純粹貝葉斯主義者與實(shí)用貝葉斯主義者并不容易。為此,我們必須考慮大量的基礎(chǔ)概念,它們來自數(shù)學(xué)、邏輯學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、人工智能,甚至還有物理學(xué)、生物學(xué)、神經(jīng)科學(xué)、心理學(xué)和經(jīng)濟(jì)學(xué)。我們需要談到對數(shù)、逆否命題、值、所羅門諾夫復(fù)雜度和神經(jīng)網(wǎng)絡(luò),還有熵、達(dá)爾文式演化、虛假回憶、認(rèn)知偏差和金融泡沫。另外,我們也會用到科學(xué)史中的大量例子來考驗(yàn)我們這兩位虛構(gòu)人物。對,我知道為了理解貝葉斯公式,要明白的東西可不少……但這豈不是正好,因?yàn)槲蚁矚g在閑暇時(shí)解釋現(xiàn)代科學(xué),我甚至為此開通了名為Science4All的YouTube頻道!所以,與其把這本書當(dāng)成哲學(xué)書來讀,我請大家不如把它當(dāng)成科學(xué)和數(shù)學(xué)的科普書。另外,在解釋貝葉斯主義的途中,我也不惜繞幾個(gè)彎,拐到科學(xué)的漫談上,暗地里就是為了鼓勵(lì)你在了解科學(xué)理論的道路上走得更遠(yuǎn)!但現(xiàn)在還是回到哲學(xué)上吧。你也看到了,我最后還是屈從于貝葉斯的迷人歌聲。在長達(dá)數(shù)月的思考之后,出乎意料的是,貝葉斯主義是如此吸引著我,讓我覺得必須向你講述它的內(nèi)容。我不禁覺得純粹貝葉斯主義者實(shí)在太有智慧了,希望能越來越向她靠近……即使在開始寫這本書之后,我仍然一遍又一遍地從這個(gè)主題中發(fā)現(xiàn)了不可勝數(shù)的驚人奇景,它已經(jīng)變成我最喜歡的數(shù)學(xué)等式了。剛開始寫這本書的時(shí)候,我是一個(gè)狂熱的貝葉斯主義者。此后,我完全確信貝葉斯主義,特別是跟其他自稱貝葉斯主義者的人相比,我甚至可以說是極端貝葉斯主義者。但我尤其希望有朝一日能成為一名合格的貝葉斯主義者。我的夢想就是能夠正確應(yīng)用貝葉斯公式,因?yàn)槲掖_信,只有這樣,我才能成為一個(gè)理性的人!有趣的是,盡管看似矛盾,但貝葉斯公式在我心中激起的情感沖動似乎是一種非理性的狂熱。我無法否認(rèn)這一點(diǎn)。我甚至肯定自己受制于巨大的認(rèn)知偏差,使我在心中神化了貝葉斯公式。畢竟,我無法對自己發(fā)現(xiàn)了這個(gè)公式的眾多秘密的事實(shí)置之不理——盡管其他人比我早半個(gè)世紀(jì)得到了同樣的發(fā)現(xiàn)。盡管如此,我向你保證,在意識到這個(gè)偏差之后,我曾嘗試否定純粹貝葉斯主義者,而這項(xiàng)嘗試仍在進(jìn)行中。我不停地嘗試尋找她的缺陷,嘗試在辯論中勝過她。然而徒勞無功??茖W(xué)方法的替代在數(shù)學(xué)中,只要某個(gè)猜想似乎沒有問題,我們就會趕緊嘗試證明它,好將它擢升到定理的行列。貝葉斯主義跟這個(gè)差不多!我們將會看到,杰恩斯–考克斯定理證明了,要將亞里士多德式的邏輯擴(kuò)展到能以前后一致的方式處理可能性這個(gè)概念,唯一的推廣方式正是貝葉斯主義;所羅門諾夫的完備性定理則證明了,如果數(shù)據(jù)集中存在某些規(guī)律的話,那么純粹貝葉斯主義者最終會辨認(rèn)出所有這些規(guī)律;額外信息期望收益定理則證明了,純粹貝葉斯主義者收集更多數(shù)據(jù)總不會有壞處。最后,統(tǒng)計(jì)決策論表明,貝葉斯推斷基本上就是唯一可接受的統(tǒng)計(jì)學(xué)習(xí)方法,意思就是,對于某種統(tǒng)計(jì)學(xué)習(xí)方法來說,當(dāng)且僅當(dāng)它相當(dāng)于貝葉斯公式的某種應(yīng)用時(shí),才不會被另一種方法全面領(lǐng)先1。1這些理論將分別在第3章、第7章、第9章和第12章中談到。除了這些定理以外,還有很多其他定理,可惜我們在這本書里不會談到。比如說特勒[5]–斯克姆斯[6]定理,它證明了只有貝葉斯主義者才能在所謂的“荷蘭賭”[7]中立于不敗之地。更妙的是,喬伊斯的定理[8]證明了,將我們的信念與概率定理保持一致就一定會得益,這也是貝葉斯主義要求我們做的。雙信封悖論[9]也完美詮釋了這些不同的結(jié)果。我在這里只能粗略地?cái)⑹鲞@些定理,因?yàn)樗鼈儗?yīng)的定義與假設(shè)用一句話說不清楚。問題就在這里。所有希望否認(rèn)貝葉斯主義的純粹主義者都懂得去挑剔這些定理的假設(shè)。所以,我不會說這些定理能證明貝葉斯主義的必要性。更普遍地說,實(shí)際上我們似乎不可能“理性地”說服自己,貝葉斯主義是正確的知識哲學(xué)、關(guān)于理論模型的正確理論或理性的正確定義。畢竟,要確信某個(gè)概念是正確的,需要事先有一套能衡量概念正確性的知識哲學(xué);要用理論化的方式思考各種理論模型,需要有一套理論來判斷和區(qū)分關(guān)于理論模型的不同理論;要以理性的方式談?wù)摾硇?,就要先用理性的方式定義理性……這就像一條咬著自己尾巴的蛇。這個(gè)難點(diǎn)當(dāng)然并非貝葉斯公式所獨(dú)有,所有知識哲學(xué)似乎都必然受制于這種自我指涉。數(shù)學(xué)家也曾花上數(shù)個(gè)世紀(jì)的努力來發(fā)展沒有自我指涉的理論,然而并不成功。(哥德爾,謝謝你?。┧?,波普爾的哲學(xué),也就是某些人心中科學(xué)方法的正確描述,它的追隨者希望將知識建基在認(rèn)識的可證偽性之上。然而,即使是這個(gè)可證偽性原則,似乎也不是可證偽的。所以,波普爾的哲學(xué)似乎跟自身完全矛盾,或者至少可以說,波普爾的哲學(xué)根據(jù)波普爾的標(biāo)準(zhǔn)似乎是無法接受的。這就是為什么許多人會在科學(xué)和哲學(xué)之間畫出一條清晰的界線,在科學(xué)和神學(xué)之間也是如此。然而如果細(xì)細(xì)考慮的話,這種劃界只是波普爾哲學(xué)中的一種純粹(也許又麻煩)的假象而已。在這方面,純粹貝葉斯主義者的辯白就有力得多。實(shí)際上,即使不能在自身思考的框架以外證明思想的正確性,純粹貝葉斯主義者(我們會看到,對她來說,一切都是信念)似乎仍然能夠不自相矛盾地談?wù)撠惾~斯主義。更棒的是,在進(jìn)行純粹貝葉斯主義者的思想實(shí)驗(yàn)之后,我可以由此在我對貝葉斯主義的置信度上應(yīng)用貝葉斯公式。我的粗略計(jì)算只增加了我對貝葉斯哲學(xué)的置信度。但還有兩個(gè)更令人信服的額外理由,使我在各種知識哲學(xué)中選擇了貝葉斯主義。第一個(gè)理由就是貝葉斯主義的普遍性。貝葉斯主義對應(yīng)用范圍沒有任何限制,這與波普爾哲學(xué)不同。波普爾哲學(xué)將自身限制于知識范疇,比如主張科學(xué)實(shí)驗(yàn)的可重復(fù)性2和理論的可證偽性。任何現(xiàn)象,無論來自社會學(xué)、歷史還是神學(xué),都可以通過貝葉斯主義的視角來分析。貝葉斯主義是通用的知識哲學(xué)。2我們可以將這種對于可重復(fù)性的要求看成頻率主義規(guī)定的必需事項(xiàng)。第二個(gè)理由就是貝葉斯主義的嚴(yán)謹(jǐn)、簡潔與清晰。它定義了如此清晰的推理規(guī)則3,應(yīng)用這些規(guī)則似乎足以相對精確地(即使只是近似地)理解這個(gè)世界。這正是計(jì)算機(jī)科學(xué)家的理想,只要按下啟動按鈕,機(jī)器就能執(zhí)行一系列指令來自動達(dá)到目標(biāo)。這說的當(dāng)然就是人工智能!30年以來,貝葉斯公式一直處于這個(gè)領(lǐng)域中眾多研究的核心,這大概并非偶然。3我們很快就會看到這是什么意思。近來,在喬?!ぬ啬硝U姆、卡爾·弗里斯頓和斯坦尼斯拉斯·德阿納等研究者的推動下,在理解人類自身的智能如何運(yùn)作時(shí),貝葉斯主義甚至似乎成了一個(gè)無法避免的理論框架。特別是2012年,德阿納在法蘭西學(xué)院開設(shè)了一門認(rèn)知科學(xué)的課程,名為“做統(tǒng)計(jì)的大腦:認(rèn)知科學(xué)中的貝葉斯革命”(Lecerveaustatisticien:larévolutionbayésienneensciencescognitives)?!霸S多生物學(xué)家懷疑神經(jīng)科學(xué)中可能存在某種一般性理論這個(gè)想法,”德阿納在報(bào)告中如此說道,“(然而)我們似乎碰到了這樣的理論框架,其應(yīng)用極其廣闊。”他還說:“即使是大腦皮層的結(jié)構(gòu)中非常普遍的結(jié)構(gòu),都可以追溯到這個(gè)假說,(也就是)大腦如此構(gòu)成,目的就是進(jìn)行貝葉斯式的統(tǒng)計(jì)推斷?!保▽?shí)用)貝葉斯主義似乎就是自然母親為了使(差不多)有智能的生命得以出現(xiàn)而找到的答案[10]……客觀性的迷夢但神秘的是,貝葉斯主義長期以來被許多代頂級科學(xué)家所否定。為什么呢?這些大科學(xué)家是不是并不理性?他們出于什么動機(jī)否認(rèn)貝葉斯主義?如果這種否認(rèn)沒有依據(jù),那么這些大科學(xué)家做出的又是什么樣的錯(cuò)誤推理?說起來,本書嘗試終結(jié)的這場兩個(gè)世紀(jì)以來關(guān)于認(rèn)識論的“游擊戰(zhàn)”,可以被簡單歸結(jié)為一場在“客觀性”這個(gè)概念上的沖突。我們甚至可以將主觀的貝葉斯主義者和客觀的頻率主義者的對立歸結(jié)為這個(gè)問題:概率是什么?對我個(gè)人來說,這個(gè)問題產(chǎn)生的影響尤其深刻。在巴黎高等師范學(xué)院入學(xué)競考的TIPE口試4中,我就被問到了這個(gè)問題。這個(gè)口試本應(yīng)是對一整年所進(jìn)行的研究項(xiàng)目的報(bào)告。我特別自傲于我的研究項(xiàng)目,那是對足球比賽的建模,我估算了不同球隊(duì)的水平并模擬了多場比賽。我利用此前兩年的比賽結(jié)果得出的模擬結(jié)果是,2006年世界杯的前三大熱門球隊(duì)是葡萄牙隊(duì)、法國隊(duì)和意大利隊(duì),他們奪冠的概率分別是20%、15%和10%。這結(jié)果不錯(cuò),因?yàn)樽詈筮@三支球隊(duì)在比賽中最后的排名分別是第四、第二和第一!4TIPE的全稱是“Travaild'initiativepersonnelleencadré”,意為“適度發(fā)揮個(gè)人創(chuàng)造力”,與中國的“研究性學(xué)習(xí)”相似,是法國工程師學(xué)校競考中的一門科目。每個(gè)學(xué)年初,管理競考的部門會公布當(dāng)年的主題,學(xué)生在當(dāng)年內(nèi)必須自行提出與主題相關(guān)的研究題目,并在教師的指導(dǎo)下,通過檢索已有成果、自行研究與實(shí)驗(yàn)的方式,在進(jìn)行自主研究的過程中學(xué)習(xí)研究。最后,學(xué)生需要將研究過程與結(jié)果寫成報(bào)告提交,并在口試時(shí)進(jìn)行答辯?!g者注巴黎中央理工學(xué)院組和巴黎高等礦業(yè)學(xué)院組5的考官非常欣賞這個(gè)項(xiàng)目。我獲得了不錯(cuò)的分?jǐn)?shù)6:19/207。然而,巴黎高等師范學(xué)院組的考官對比賽模擬并不感興趣。他們很快就打斷了我,只想知道我知不知道概率怎么定義。5法國工程師學(xué)校的競考分為數(shù)個(gè)獨(dú)立的組,也叫“學(xué)校庫”(banque),同一個(gè)組每年只會進(jìn)行一次競考,競考的結(jié)果受組內(nèi)所有學(xué)校承認(rèn)。目前的競考組包括巴黎綜合理工學(xué)院組、巴黎高等師范學(xué)院組、巴黎中央理工學(xué)院組和巴黎高等礦業(yè)學(xué)院組,等等。不同的組之間也會合并某些考試?!g者注6這實(shí)際上是我在TIPE-ADS項(xiàng)目上的總分。(ADS的全稱是“analysededocumentsscientifiques”,意為“科技文獻(xiàn)分析”,形式與TIPE相仿??忌M(jìn)入考場后,有約兩小時(shí)的準(zhǔn)備時(shí)間研讀一篇約20頁的科學(xué)文獻(xiàn),之后向考官總結(jié)文獻(xiàn)內(nèi)容并進(jìn)行答辯?!g者注)7法國的打分制以20分為滿分,19/20即在20分的滿分中取得了19分?!g者注我的回答是頻率主義式的。我斷言,某個(gè)事件的概率就是在重復(fù)無數(shù)次實(shí)驗(yàn)時(shí),這個(gè)事件發(fā)生的頻率的極限。特別是,所有經(jīng)驗(yàn)上的頻率都似乎只是某個(gè)基本而客觀的概率的近似。不管這組考官是不是數(shù)學(xué)上的純粹主義者,反正他們都不太滿意。實(shí)際上,他們期待我給出概率的數(shù)學(xué)定義,比如說概率就是某個(gè)單位測度上定義的代數(shù)上的某種測度。我這場口試的得分只有6/20。還是忘了我的遭遇吧,純粹貝葉斯主義者會說,這是由于年輕而犯下的錯(cuò)誤,我們之后會再談到。我從小到大都是頻率主義者。我一直沉浸于尋求真理,無論是數(shù)學(xué)真理還是科學(xué)真理。我接受了客觀結(jié)果的存在與優(yōu)越性。就算在2013年我被“釣魚”學(xué)生問倒的時(shí)候,我教的那門課絕大部分也是頻率主義的。而我當(dāng)時(shí)覺得,這就是應(yīng)該教給學(xué)生的正確的統(tǒng)計(jì)學(xué)!另外,我的足球比賽模型也是典型的頻率主義,正如我們之后會講到的施泰因悖論那樣,如果這個(gè)模型能再加上一點(diǎn)貝葉斯主義,本應(yīng)更準(zhǔn)確。更驚人的是,即使是我算出來的概率,在本質(zhì)上也不符合頻率主義!法國贏得2006年世界杯的頻率并不是15%,而是0。的確,2006年世界杯只有一次,而且法國輸了。但如果說模型預(yù)測出的15%顯然不是頻率,那么這個(gè)數(shù)值應(yīng)該怎么解釋?我們還能不能說它是個(gè)概率?純粹貝葉斯主義者的回答是肯定的。這個(gè)數(shù)字就是根據(jù)我的數(shù)學(xué)模型得到的法國贏得世界杯的概率。換句話說,這個(gè)概率是主觀的,它是模型的意見。然而所有概率都是如此。對純粹貝葉斯主義者來說,任何概率或者認(rèn)識都不是客觀的,而任何否定這一點(diǎn)的人,都在將自己的主觀愿望作為一種現(xiàn)實(shí)強(qiáng)加于別人。的確,如果認(rèn)真思考的話,我們就會發(fā)現(xiàn)所有尋求和整理知識的方法似乎都必然有某種偏見,偏見就在于選擇了這個(gè)方法,而不是其他方法——當(dāng)我們援引不精確的奧卡姆剃刀、“已然確立”的科學(xué)知識或者本身就有問題的值的時(shí)候更是如此。更糟糕的是,我們審視、處理和選擇數(shù)據(jù)的方式,不可避免會影響數(shù)據(jù)分析得出的結(jié)論。我們將會花一點(diǎn)篇幅來討論事實(shí)有時(shí)候是如何嚴(yán)重誤導(dǎo)我們的[11]。此外,即使指明用到了什么方法也不夠。利用機(jī)器學(xué)習(xí)在大數(shù)據(jù)中推斷出有用信息的數(shù)據(jù)科學(xué)家很早就發(fā)現(xiàn)了,沒有人工干擾不一定能保證客觀性。無論是人還是機(jī)器,我們似乎都必定要在某個(gè)模型內(nèi)部進(jìn)行推理。所以說,我們的結(jié)論似乎必然依賴于模型。純粹貝葉斯主義者斷定,這就說明了所有知識都必然是主觀的。這也許會令你不安。貝葉斯主義似乎更接近相對主義。如果所有知識都是主觀的,那么是不是什么意見都是等價(jià)的?答案當(dāng)然是否定的。即使我們每個(gè)人都看到了屬于自己的紅色,這也并不說明,對于“法國國旗上有沒有紅色”這個(gè)問題來說,所有意見都是等價(jià)的。尤其要指出的是,對于在同一組數(shù)據(jù)上嚴(yán)格應(yīng)用貝葉斯公式的人來說,他們的置信度最終會落在同一組模型上,特別是在數(shù)據(jù)量大的情況下。但對純粹貝葉斯主義者來說,就算在數(shù)據(jù)量相對小的情況下,即使所有人面對的數(shù)據(jù)都相同,那些贏得了貝葉斯主義者置信度的模型也比其他沒有應(yīng)用貝葉斯公式的人所青睞的模型更貼切、更有用。要特別注意的是,貝葉斯主義(特別是實(shí)用貝葉斯主義)并不能代替數(shù)學(xué)建模。這種哲學(xué)的首要目標(biāo)是分辨出有用的模型。貝葉斯主義的基礎(chǔ)實(shí)際上可以用貝葉斯主義的“至圣先師”喬治·博克斯的一句話概括:“所有模型都是錯(cuò)的,有些模型很有用。”我經(jīng)常復(fù)述這句話!不管這句引語是否“正確”,但它對我來說非常有用,可以幫我跳過那些一開始就注定走進(jìn)死胡同、沒完沒了、能把人煩死的辯論。就像那些貝葉斯主義前輩那樣,我最后發(fā)現(xiàn)判定模型的用處更有趣,尤其是它對預(yù)言能力的判定,其真實(shí)性則無所謂。然而純粹貝葉斯主義者會說,要正確地衡量不同模型是否有用,唯一的方式就是借助貝葉斯公式。本書的目標(biāo)即使我希望分享并論證貝葉斯主義讓我感受到的熱情,即使我暗暗希望這會讓數(shù)學(xué)家、哲學(xué)家和科學(xué)家質(zhì)疑各自領(lǐng)域中那些他們自以為已經(jīng)知道的東西,但這本書的目的不是讓你接受貝葉斯主義。我希望與讀者分享讓我轉(zhuǎn)向貝葉斯主義的一些珠玉。我敢打賭——這也是典型貝葉斯式的反應(yīng)——面對貝葉斯公式那些令人震驚的推論,以及它在應(yīng)用數(shù)學(xué)、我們自身思考方式甚至社會結(jié)構(gòu)中的普遍存在,你大概會大吃一驚,甚至?xí)悬c(diǎn)被它吸引,這正是我希望的。貝葉斯主義解釋了為什么科學(xué)共同體比其中每一個(gè)成員更可靠,也解釋了為什么我們大腦里的小傻瓜們一直會受到錨定效應(yīng)的影響。它還解釋了為什么將互相不兼容的模型組合起來能得到更好的結(jié)果,還有為什么奧卡姆剃刀是不可或缺的工具。它甚至可能是理解記憶的運(yùn)轉(zhuǎn)和夢的作用的鑰匙。就像特奧多修斯·多布然斯基所說的:“生物學(xué)中的任何東西只有在演化之光下才有意義。”我也認(rèn)為,為數(shù)眾多的機(jī)制只能通過貝葉斯的視點(diǎn)來理解。我發(fā)現(xiàn)了貝葉斯主義,這對我來說是探知自身無知的絕佳機(jī)會。比如說,概率的語言能讓我們量化不確定性,但我無法正確應(yīng)用貝葉斯公式,就算是“釣魚”學(xué)生謎題的那個(gè)簡單情況也是如此,這迫使我重新認(rèn)識到自己只是一個(gè)蹩腳的思考者。我之前經(jīng)常對自己的直覺有一種非理性、無根據(jù)的自信,有時(shí)還伴隨著一種對貝葉斯公式的奇怪的不信任感。但在不斷接近純粹貝葉斯主義者的過程中,這段貝葉斯主義的經(jīng)歷迫使我意識到自己頑固的自信過度,因此我更應(yīng)該將置信度放在貝葉斯公式上。這也是本書的主要目標(biāo)之一。我們努力對抗自信過度,嘗試探知自己有多無知。這本書接下來可以大略分為四個(gè)部分。從第2章到第7章,我們會先著手于貝葉斯公式以及純粹貝葉斯主義。第8章到第13章的目標(biāo)是揭示各種現(xiàn)象中隱藏的貝葉斯原理——我們或許未曾意識到,這些現(xiàn)象中有著貝葉斯主義的一面。在接下來的第14章到第19章中,我們會探討實(shí)用貝葉斯主義及其不可或缺的工具。最后三章與之前的章節(jié)關(guān)聯(lián)不太大,題為“一切都是虛構(gòu)”的第20章探討的是貝葉斯主義的哲學(xué)推論,尤其是有關(guān)實(shí)在論的推論;第21章會追溯我的那些信念的起源,考問我們反復(fù)出現(xiàn)的自信過度;第22章探討的是貝葉斯主義在道德哲學(xué)上的推論??上У氖牵@本書跟一切篇幅有限的書一樣,難免掛一漏萬。我在這里先為本書不可勝數(shù)的不足之處說聲抱歉,尤其是因?yàn)槲覜]有花時(shí)間將貝葉斯主義與其他與之競爭的哲學(xué)流派進(jìn)行深入比較。我的目標(biāo)沒那么遠(yuǎn)大,只是希望能幫助你理解貝葉斯主義的某些重要方面,至少是我理解的那些方面。的確,跟本書一樣,我的大腦也是有限的,所以請你原諒我的無知之處。我會嘗試提及和揭示盡可能多的對我來說重要的思想,但也必定會遺漏那些我不知道或誤判其重要性的內(nèi)容。另外,本書描述的是截至出版時(shí)我的認(rèn)知狀態(tài),但在掌握貝葉斯主義的旅程中,我希望之后能取得更多的進(jìn)展。如果你愿意伴隨我踏上這段旅程的話,請?jiān)赥witter上關(guān)注我(@science4all),并查看我的視頻頻道Science4All,我從2018年末開始在頻道中放了一系列關(guān)于貝葉斯公式的視頻。我同樣邀請你前往我和哲學(xué)家蒂博·吉羅(網(wǎng)名是MonsieurPhi)共同主持的播客“公理”(Axiome),傾聽我們的思考。盡管我們的目標(biāo)是探討所有與數(shù)學(xué)、哲學(xué)和各種自然科學(xué)有關(guān)的東西,但鑒于我們都對概率和邏輯無比著迷,我們也反復(fù)談到了貝葉斯主義的方方面面,其中一些內(nèi)容在本書中沒有提及,比如貝特朗悖論的貝葉斯解釋[12]。除了我的認(rèn)知限制以外,因?yàn)檫@本書的目標(biāo)讀者是一般大眾,無須任何預(yù)備知識,所以我不會寫出純粹貝葉斯主義者避不開的那種嚴(yán)謹(jǐn)證明——盡可能讓你遠(yuǎn)離那些違反直覺的內(nèi)容,畢竟本書屬于科普讀物。你很可能無法完全理解所有內(nèi)容。因?yàn)槲也幌胩^那些最有說服力的論據(jù),所以我冒昧留下了幾個(gè)難度頗高的章節(jié),它們被打上了星號(※)。我不得不提醒你一點(diǎn):即使你是數(shù)學(xué)博士,你可能也只有在極認(rèn)真、努力地閱讀本書的情況下,才能掌握我向你講述的所有概念。讀這本書的時(shí)候請不要急躁,要多花點(diǎn)時(shí)間思考,但也不要輕易放棄。這本書并不是越往后面越難,你可以在沒有閱讀之前章節(jié)的情況下享受每一章——雖然按順序閱讀每一章可能更好。這不是一本教材,也沒有考試。我不會要求你理解所有內(nèi)容,甚至強(qiáng)烈建議你跳過那些太復(fù)雜的段落繼續(xù)閱讀(如果你之后肯回到這些難度較大的段落的話)。我的目標(biāo)不是讓你成為貝葉斯主義的專家。我最希望的是,你能享受貝葉斯的推理以及在理解貝葉斯主義的基礎(chǔ)和推論時(shí)用到的那些科學(xué)內(nèi)容,并從中找到美感。我希望你能把自己當(dāng)作一位探險(xiǎn)家,出發(fā)去探索未知的土地,發(fā)現(xiàn)各種各樣的動物、植物、文化與引人入勝的風(fēng)景,而不一定要花時(shí)間學(xué)會本地語言中的所有細(xì)微之處。我希望你能從這段旅程中獲益。如果你跟隨我的腳步的話,那么我希望你也會沉浸在熱忱、魅力和疑問之中,這就是本書的首要目的。跟許多我認(rèn)識的人一樣,我的思考范式最大的轉(zhuǎn)變之一就是學(xué)會了貝葉斯的法則。朱莉婭·加利夫(1983—)我們都是本能上不理性的笨蛋,無法正確修訂我們的信念,而理解貝葉斯的這個(gè)法則真的可以幫助改善我們自身。蒂博·吉羅(1986—)貝葉斯統(tǒng)計(jì)很難,就像思考那么難。唐納德·貝里(1940—)第2章貝葉斯定理小孩謎題我們回到那位“釣魚”學(xué)生的謎題上。一位父親有兩個(gè)孩子,至少一個(gè)孩子是男孩,那么另一個(gè)孩子也是男孩的概率是多少?我請你先嘗試自己解決這個(gè)問題。即使你解不出來,這種智力鍛煉對之后的閱讀也可能有幫助。我現(xiàn)在向你展示這個(gè)問題的解答,最簡單的解法就是列出所有可能的情況。我們將兩個(gè)孩子叫作小晨和小迪??赡艿那闆r有四種:小晨和小迪都是男孩;小晨是男孩,小迪是女孩;小晨是女孩,小迪是男孩;小晨和小迪都是女孩。這四種情況是等可能的,也就是說,它們的概率都一樣,雖然這也不太準(zhǔn)確。生物學(xué)家會明確指出,事實(shí)上51%的新生兒是男孩——這個(gè)結(jié)果是拉普拉斯通過貝葉斯式的計(jì)算得到的。但我們先簡化一下,假設(shè)每個(gè)孩子是男孩的先驗(yàn)概率是50%。但是我們知道小晨和小迪中至少有一個(gè)是男孩,前三種可能性符合這個(gè)新信息,第四種可能性不符合。所以,我們可以劃掉第四種可能性?,F(xiàn)在,如果已知小晨和小迪中至少有一個(gè)是男孩的話,那么另一個(gè)孩子也是男孩的可能性恰好對應(yīng)小晨和小迪都是男孩的情況。這就是一個(gè)孩子是男孩,而另一個(gè)孩子也是男孩的唯一可能性。換句話說,我們嘗試計(jì)算的,就是在已知其中至少一個(gè)孩子是男孩的情況下,兩個(gè)孩子都是男孩的概率。這對應(yīng)剩下三種可能性中的一種。于是,要計(jì)算的概率就等于1/3,而不是1/2!驚不驚人?我記得第一次詳讀這個(gè)證明的時(shí)候(遠(yuǎn)遠(yuǎn)在“釣魚”學(xué)生向我提出這個(gè)謎題之前),我并沒有信服。這個(gè)論證是否的確有效這一點(diǎn)并不明確。我們是不是真的可以劃掉第四種可能性,只考慮前三個(gè)仍然等概率的可能性?我可以幫你走出這個(gè)困境,現(xiàn)在就給你指出思考這個(gè)問題的正確方法——當(dāng)然是應(yīng)用貝葉斯公式!但是,我覺得現(xiàn)在還是認(rèn)真思考一下為好。蒙蒂·霍爾問題現(xiàn)在我們來考慮蒙蒂·霍爾問題。這個(gè)概率論經(jīng)典問題的靈感來自20世紀(jì)60年代由蒙蒂·霍爾主持的一個(gè)叫作《達(dá)成協(xié)議》(Let'sMakeaDeal)的美國電視游戲節(jié)目。在節(jié)目的最后,參賽者必須在三道門簾中選一道。其中一道門簾之后有一輛汽車,其余兩道門簾后面是山羊。參賽者選擇之后,蒙蒂·霍爾會增加懸念:在參賽者沒有選擇的門簾之中,至少有一道門簾背后是山羊。然后,蒙蒂·霍爾會將這道背后是山羊的門簾打開?,F(xiàn)在剩下兩道門簾,其中一道后面有汽車,另一道后面則有山羊。這時(shí),蒙蒂·霍爾就會向參賽者提出一個(gè)新選擇:他可以維持自己的選擇或者換一道門簾。這位參賽者應(yīng)該怎么做?他應(yīng)該遵循一開始的直覺,還是應(yīng)該改變主意?跟“釣魚”學(xué)生的謎題一樣,我們似乎又落入了去掉一種可能性的相似情況中。我們傾向于認(rèn)為汽車的所在位置仍然是等概率的,是否改變主意并不重要。如果你就是這么想的話,要知道在你之前許多頂級數(shù)學(xué)家都犯了跟你一樣的錯(cuò)誤。蒙蒂·霍爾問題難倒了很多聰明絕頂?shù)娜恕?990年,當(dāng)瑪麗蓮·沃斯·薩萬特在美國《大觀》(Parade)雜志中給出這個(gè)問題的正確答案時(shí),一萬名讀者給雜志寫信,斷言沃斯·薩萬特搞錯(cuò)了,其中一千名讀者還持有博士學(xué)位。即使是著名數(shù)學(xué)家埃爾德什·帕爾,也就是數(shù)學(xué)史上發(fā)表論文最多的人,也不相信沃斯·薩萬特的嚴(yán)謹(jǐn)證明。只有在看到模擬結(jié)果之后,大為驚訝的埃爾德什才認(rèn)輸。大數(shù)學(xué)家埃爾德什也不理解貝葉斯公式,他也不是唯一一個(gè)不理解的人。我是在13歲的時(shí)候遇到蒙蒂·霍爾問題的,我當(dāng)時(shí)并不知道貝葉斯公式。但有一個(gè)論證既有足夠的說服力,又能讓我理解。其實(shí),在選擇一道門簾之后,如果你知道自己不會改變主意,那么接下來的結(jié)果就像蒙蒂·霍爾沒有增加懸念掀起有山羊的門簾那樣。你選到汽車的可能性,也就是一開始選擇的門簾后面有汽車的概率,等于1/3。所以如果你不改變主意的話,那么贏的概率就是1/3。奇怪的是,這個(gè)結(jié)果說服了我,但我還是不能計(jì)算改變主意之后贏的概率。如果你維持選擇卻輸了的話,也就是說,未選擇的門簾背后就是汽車,即蒙蒂·霍爾建議你改主意選擇的那道門簾,那么實(shí)際上發(fā)生的事情是,三次中有兩次你一開始選擇的門簾后面是山羊。在這種情況下,當(dāng)只剩下兩道門簾的時(shí)候,汽車必定在另一道門簾背后。如果你改變選擇就能贏,三次中贏兩次。這里的數(shù)學(xué)原理毋庸置疑。你換一道門簾就能使贏得汽車的可能性加倍!與那些沒有花心力慢慢仔細(xì)思考這個(gè)問題并保留最初選擇的人相比,純粹貝葉斯主義者贏得汽車的可能性是他們的2倍。如果你還沒有被這個(gè)論證說服,那么我請你以埃爾德什為榜樣,自己做個(gè)實(shí)驗(yàn)。在英國廣播公司(BBC)的一部出色的紀(jì)錄片中,數(shù)學(xué)家馬庫斯·杜·索托伊向喜劇演員阿蘭·戴維斯提出了蒙蒂·霍爾問題。一臉懷疑的阿蘭·戴維斯相信,在重復(fù)進(jìn)行的蒙蒂·霍爾游戲中不改變門簾的選擇會有優(yōu)勢,跟絕對會改變的馬庫斯·杜·索托伊正好相反。在20次嘗試中,阿蘭·戴維斯只贏了2次,而馬庫斯·杜·索托伊贏了16次。當(dāng)然,這些數(shù)字似乎不符合貝葉斯理論預(yù)言的1/3和2/3——這都是小數(shù)定律1的錯(cuò)!但好處就是這說服了阿蘭·戴維斯自己錯(cuò)了,或者說他至少做到了這一點(diǎn),因?yàn)樗坪醪]有明白馬庫斯·杜·索托伊的解釋。1小數(shù)定律是對大數(shù)定律的一種戲仿。大數(shù)定律說的是某個(gè)事件在重復(fù)足夠多次后,出現(xiàn)的頻率會趨向于事件的概率。而小數(shù)定律可以說是人類在認(rèn)知中對大數(shù)定律的一種誤用:即使在事例數(shù)量較少,不符合大數(shù)定律前提的情況下,人們也會認(rèn)為可以應(yīng)用大數(shù)定律,認(rèn)為事例足夠有代表性,輕率地就此做出結(jié)論,而不考慮例子數(shù)目不足導(dǎo)致錯(cuò)誤的可能性?!g者注這一局過后,阿蘭·戴維斯只是丟掉了一點(diǎn)尊嚴(yán),要是他知道就連鴿子對蒙蒂·霍爾游戲的理解都比他更正確的話[1],那他丟掉的尊嚴(yán)就可不止這一點(diǎn)點(diǎn)了。有時(shí)候,“誤解”貝葉斯公式會導(dǎo)致更嚴(yán)重的后果。薩莉·克拉克就為此在人生中付出了最慘重的代價(jià)。薩莉·克拉克的審判1996年,薩莉·克拉克的新生兒在出生兩周后就去世了。一年之后歷史重演,她生下的第二名嬰兒也去世了。薩莉·克拉克被控兩宗謀殺罪。兒科醫(yī)生羅伊·梅多出庭作證,他宣稱兩名新生兒接連由于自然原因死亡的概率是7300萬分之一,這段證詞給薩莉·克拉克定了罪。然而在三年之后,人們發(fā)現(xiàn)負(fù)責(zé)尸檢的醫(yī)生阿蘭·威廉斯當(dāng)時(shí)沒有報(bào)告他的分析結(jié)果:第二個(gè)新生兒的的確確死于自然原因。薩莉·克拉克最終被釋放了,但并非毫無遺患,她的精神受到了極大的創(chuàng)傷,四年后死于飲酒過量導(dǎo)致的昏迷。除了威廉斯醫(yī)生的疏忽以外,薩莉·克拉克苦難的原因可以追溯到一類對貝葉斯公式的誤用,又叫檢察官謬誤。法官(你可能也)混淆了兩名新生兒由于自然原因死亡的概率以及薩莉·克拉克無罪的概率。然而罕見的犯罪證據(jù)不一定能作為犯罪指控。我們之后會詳細(xì)討論檢察官謬誤,因?yàn)樗嬖谟诳茖W(xué)方法的大部分經(jīng)典解釋之中。但現(xiàn)在我們就應(yīng)該強(qiáng)調(diào)這是個(gè)謬誤。犯罪證據(jù)很罕見,可能只是因?yàn)橄右煞傅那闆r特殊而已。薩莉·克拉克遇到的情況罕見無比,兩名新生兒死亡的概率本身就極端地低。所以,這兩名新生兒由于自然原因死亡的概率只可能同樣極端地低。事實(shí)上,英國索爾福德大學(xué)數(shù)學(xué)教授雷·希爾進(jìn)行的近似計(jì)算證明,雖然兩名新生兒由于自然原因死亡的概率很低,但這也要比雙重謀殺的概率高5~10倍。換句話說,貝葉斯公式會迫使我們更強(qiáng)烈傾向于自然死亡的假設(shè),而不是雙重謀殺——順帶一提,希爾同時(shí)指出了兒科醫(yī)生梅多的計(jì)算中的一個(gè)重大錯(cuò)誤,那就是他沒有考慮兩名新生兒的死亡之間的相關(guān)性,這一相關(guān)性會使貝葉斯計(jì)算的最終結(jié)論更利于自然死亡的假設(shè)。被判非法的貝葉斯主義在薩莉·克拉克案件的審理中,英國司法鑄成了大錯(cuò)。但這場悲劇并沒有使人們認(rèn)識到貝葉斯公式的重要性,反而加深了人們對統(tǒng)計(jì)的不信任,以至于在2010年,一位英國法官將貝葉斯定理排除在法院審理之外。在法官面前主張貝葉斯主義變成了非法行為!智慧方程在法院中被禁止了!但我們也難以怪罪這位法官。就算是埃爾德什在貝葉斯公式的應(yīng)用上也遇到了困難。要求法官和陪審團(tuán)在這個(gè)公式的基礎(chǔ)上思考,這真的合理嗎?即使純粹貝葉斯主義者可以自如穿行司法系統(tǒng)這個(gè)復(fù)雜迷宮,也必須注意不要讓法庭被眾多無人能解或者易被誤解的統(tǒng)計(jì)數(shù)據(jù)淹沒。在發(fā)表于期刊《統(tǒng)計(jì)與應(yīng)用年度評論》(TheAnnualReviewofStatisticsandItsApplications)上的一篇文章中,芬頓、尼爾和伯杰也做出了如下評論:“有另一個(gè)之前少有陳述但以后會變得重要的原因,它限制了(貝葉斯公式的)應(yīng)用:為了使計(jì)算能夠手算進(jìn)行,貝葉斯方法的大部分例子都過分簡化了它們所建模的法律論證?!边@幾位作者意識到了這個(gè)困難,提出了一個(gè)更精細(xì)的貝葉斯理論,那就是我們之后會再談到的貝葉斯網(wǎng)絡(luò)?,F(xiàn)在必須看到的是,司法系統(tǒng)有多么不理性,而且修正它又極端困難。極端簡化的貝葉斯計(jì)算有著很大的局限性,即使對于最聰明的人來說,正確的貝葉斯計(jì)算也過于復(fù)雜,難以完成。所以,這本書的目的絕對不是讓你成為能應(yīng)用貝葉斯公式的機(jī)器,那只會徒勞無功。然而,我認(rèn)為要是真正花時(shí)間思考的話,每個(gè)人都能掌握那些簡單的例子。當(dāng)在最實(shí)際的情況下進(jìn)行近似的貝葉斯思考時(shí),這些例子可以作為參照或者練習(xí)。我不會強(qiáng)求你成為純粹貝葉斯主義者,但我希望你成為成熟的思考者,希望能幫助你(掌握如何)將直覺貝葉斯化。我同樣希望成功向你展示直覺在概率計(jì)算上何等不堪大用。然而,對于純貝葉斯主義者來說,理性就是遵循概率法則。當(dāng)我們深思那些面對貝葉斯公式產(chǎn)生的疑問,希望說服自己這個(gè)公式就是一切認(rèn)識論困境的解決辦法時(shí),我們當(dāng)然會懷疑自身的所有信念。我認(rèn)為,這就是發(fā)現(xiàn)自己的思考方式多么糟糕時(shí)的正常反應(yīng)。我們要接受自己總是自以為是的這一事實(shí),還必須減少對非貝葉斯的直覺和推理的置信度。貝葉斯定理閑話休提,現(xiàn)在是時(shí)候給你看看我最喜歡的數(shù)學(xué)公式了。下面我將要介紹的就是貝葉斯公式。為此,我要引入來自醫(yī)學(xué)領(lǐng)域的第四個(gè)例子。想象一下,化驗(yàn)結(jié)果顯示你感染了埃博拉病毒,而你知道自己剛從尼日利亞度假歸來。你自然會詢問化驗(yàn)的可靠程度。別人告訴你,健康的人得到正確的化驗(yàn)結(jié)果的概率是90%。你是不是應(yīng)該開始寫遺囑了?純粹貝葉斯主義者的回答只有一個(gè):不急。即使在受這種病毒影響最大的撒哈拉以南的非洲,感染埃博拉病毒的人也萬中無一。所以你這個(gè)只在尼日利亞短暫停留過的人,感染這個(gè)病毒的可能性顯然不足萬分之一。我們可以將這個(gè)概率,它也叫作先驗(yàn)概率。現(xiàn)在假設(shè)你得知化驗(yàn)結(jié)果為陽性,之后需要考慮的就是已知化驗(yàn)結(jié)果為陽性時(shí)感染埃博拉病毒的概率,我們將它記為|,其中這個(gè)符號表示化驗(yàn)結(jié)果為陽性。反之,我們用符號來表示化驗(yàn)結(jié)果為陰性。所謂的條件概率|是什么意思呢?概率論的基本公設(shè)假定這個(gè)條件概率與事件和的概率有如下聯(lián)系:換句話說,在已知化驗(yàn)結(jié)果為陽性的情況下感染病毒的概率,就是化驗(yàn)結(jié)果為陽性并且感染病毒的人在所有化驗(yàn)結(jié)果為陽性的人群中所占的比例。值得指出的是,在今天,即使是最反對貝葉斯主義的統(tǒng)計(jì)學(xué)家也接受這個(gè)公設(shè)。實(shí)際上,我們可以把它當(dāng)成條件概率的定義。跟所有定義一樣,它不可能出錯(cuò)。然而,人們可能會懷疑這是不是條件概率的一個(gè)貼切(而有用)的定義,特別是人們還會考慮它是否跟自然語言一致,以及應(yīng)該怎么用它來思考。純粹貝葉斯主義者的信念就是,這個(gè)定義不僅接近自然語言中的說法,而且正是這個(gè)概念的正確思考方式。貝葉斯主義,就是將條件概率的語言作為所有知識的基礎(chǔ)。跟隨純粹貝葉斯主義者的腳步,我們承認(rèn)條件概率|的確描述了在已知化驗(yàn)結(jié)果為陽性的情況下感染病毒的概率。然而,你獲知的數(shù)值并不是這個(gè)概率。你聽到的90%這個(gè)數(shù)值,其實(shí)是當(dāng)你沒有感染埃博拉病毒時(shí),化驗(yàn)結(jié)果正確的概率。換句話說,90%這個(gè)數(shù)字是當(dāng)你沒有感染埃博拉病毒時(shí),化驗(yàn)結(jié)果為陰性的概率,記為|(指的是你健康的情況)。于是剩下的10%對應(yīng)著在沒有感染病毒時(shí)獲得陽性結(jié)果的概率|。要確定當(dāng)獲得陽性結(jié)果時(shí)你感染病毒的概率,我們需要證明并應(yīng)用貝葉斯定理。為此,我們寫出逆概率|的定義|且。注意到了嗎?這里的分子與條件概率|的定義中的分子是一樣的!由此得出,兩個(gè)事件同時(shí)發(fā)生的概率可以寫成且|。這相當(dāng)于感染病毒且化驗(yàn)結(jié)果為陽性的概率,等于先感染病毒,然后在已知感染病毒的情況下化驗(yàn)結(jié)果為陽性的概率。我們幾乎完成貝葉斯定理的證明了?,F(xiàn)在只需要將上面的公式代入條件概率|的定義之中,就能得到本書介紹的知識哲學(xué)中最重要的公式,也就是貝葉斯公式。請花點(diǎn)時(shí)間仔細(xì)品味它形式上的優(yōu)雅以及符號遵循的模式。換句話說,要在化驗(yàn)結(jié)果為陽性的情況下確定感染埃博拉病毒的概率,只需要將感染病毒時(shí)化驗(yàn)結(jié)果為陽性的概率(這需要一點(diǎn)想象力)乘以感染埃博拉病毒的先驗(yàn)概率,然后除以化驗(yàn)結(jié)果為陽性的概率。就像作為導(dǎo)論的第1章所說的,你需要知道的就只有乘法和除法!還有比這更簡單的嗎?讓這個(gè)公式如此難以理解的,當(dāng)然并非其中必須用到的計(jì)算,而是如何解釋其中的每一項(xiàng),這些項(xiàng)至少在本章內(nèi)簡化過的例子中都可以解釋。在考慮這些項(xiàng)的時(shí)候,很容易產(chǎn)生誤解。我只能請你多花時(shí)間思考。貝葉斯公式的組成部分等式右邊的概率被稱為先驗(yàn)概率。這就是我們在看到化驗(yàn)結(jié)果之前可能(或應(yīng)該)認(rèn)為的概率。在這里,我們估算這個(gè)概率的方法,就是將自己的情況與在撒哈拉以南的非洲國家人口中統(tǒng)計(jì)得到的埃博拉病毒感染人數(shù)進(jìn)行比較。但這只是一個(gè)粗略的估計(jì),況且我們沒有考慮在尼日利亞滯留的時(shí)間,這毫無疑問是先驗(yàn)置信度的決定性因素。同樣重要的還有與尼日利亞當(dāng)?shù)厝嘶拥念l率,以及與感染者接觸導(dǎo)致的暴露。要量化所有這些因素可謂難于登天。我們在這里就只取之前的粗略估計(jì)。等式右邊分子的另一項(xiàng),就是在感染埃博拉病毒后化驗(yàn)結(jié)果為陽性的概率|。這一項(xiàng)需要一些想象力。我們需要跳出現(xiàn)實(shí)世界,想象在某種平行世界中,我們知道自己感染了埃博拉病毒。在這個(gè)平行世界里,我們得到的化驗(yàn)結(jié)果為陽性的可能性是多少?這個(gè)問題的答案就是|。純粹貝葉斯主義者跟我們不一樣,她不僅能夠設(shè)身處地想象別人想象的東西,而且事實(shí)上她整天都在這樣想象!這就是著名的思想實(shí)驗(yàn)的藝術(shù)。這種實(shí)驗(yàn)事實(shí)上對于貝葉斯哲學(xué)來說必不可少。沒有這些實(shí)驗(yàn),我們就不可能估計(jì)像|這樣的項(xiàng),也就不可能應(yīng)用貝葉斯公式。這對純粹貝葉斯主義者來說就是非理性的。遺憾的是,有些人往往會斷然拒絕單單為了探索某個(gè)理論的后果而暫時(shí)接受它那些反直覺的前提。爭論雙方很多時(shí)候只愿意以自身的知識論、自身對現(xiàn)實(shí)的模型、自身的神學(xué)與道德觀點(diǎn)看這個(gè)世界。如果沒有共同前提的話,這樣的爭論就注定變成空對空。這種爭論常常跳過了對類似|的項(xiàng)的計(jì)算。這樣的項(xiàng)被統(tǒng)計(jì)學(xué)家統(tǒng)一稱為似然度。然而,在我看來這個(gè)術(shù)語不太合適,因?yàn)樗苋菀讓?dǎo)致誤解。實(shí)際上,我們最好記住一點(diǎn):似然度其實(shí)是在給定關(guān)于這個(gè)世界的某個(gè)假說時(shí),觀察到現(xiàn)有數(shù)據(jù)的似然度。這跟某個(gè)假說在已知觀察數(shù)據(jù)下的似然度完全不同。即使之后我有時(shí)候會接受通用的術(shù)語,但為了避免之后可能出現(xiàn)的混亂,我更傾向于將這些項(xiàng)叫作思想實(shí)驗(yàn)項(xiàng)。最后剩下的就是等式右邊的分母,也就是化驗(yàn)結(jié)果為陽性的概率。這一項(xiàng)很麻煩,是貝葉斯公式中最大的困難。就是這一項(xiàng)讓許多研究概率(或者人工智能)的研究者度過了許多不眠之夜。這一項(xiàng)又叫邊緣概率或配分函數(shù)。它對我來說也是最難看清、最難理解的一項(xiàng),即使它在本章的某些簡化情況中顯而易見。要計(jì)算化驗(yàn)結(jié)果為陽性的概率,就要區(qū)分兩種情況:因感染埃博拉病毒而化驗(yàn)結(jié)果為陽性,還有化驗(yàn)不完美導(dǎo)致結(jié)果為陽性。對每一種情況,我們都要將其先驗(yàn)概率乘以這種情況導(dǎo)致陽性結(jié)果的概率。換句話說,我們要用到所謂的全概率公式2:2跟貝葉斯公式一樣,全概率公式可以通過條件概率的定義,以及兩個(gè)獨(dú)立事件發(fā)生的概率就是兩個(gè)事件的概率的和這個(gè)事實(shí)推出。這樣的話,配分函數(shù)的計(jì)算需要兩個(gè)思想實(shí)驗(yàn),分別對應(yīng)兩個(gè)不同的情況,因此它的計(jì)算很困難。貝葉斯主義者應(yīng)該訓(xùn)練自己進(jìn)行這項(xiàng)精細(xì)的腦力體操——自己在互不兼容的現(xiàn)實(shí)可能性之中進(jìn)行思考的能力。這大概就是貝葉斯公式如此難以應(yīng)用與理解的原因。貝葉斯主義對化驗(yàn)結(jié)果的解讀最后,我們將全概率公式與貝葉斯公式結(jié)合,得到:我們現(xiàn)在差不多知道了等式右邊所有的項(xiàng)。我們已經(jīng)看到估計(jì)約為1/100003,由此可以得到至少是9999/10000。然后我們注意到|對應(yīng)著健康的人化驗(yàn)結(jié)果出錯(cuò)的概率,之前我們已經(jīng)知道這個(gè)概率是10%。最后剩下的就是|,也就是對于感染埃博拉病毒的人來說化驗(yàn)結(jié)果的可靠性。我們注意到一個(gè)簡單的事實(shí):這一項(xiàng)是一個(gè)概率,不能大于1。將這些事實(shí)總結(jié)起來,通過下面的計(jì)算就能得出:3事實(shí)上這是一個(gè)上界。|也就是說,你即便知道化驗(yàn)結(jié)果是陽性,但這個(gè)結(jié)果告訴你,你真正感染埃博拉病毒的概率小于1/1000。這個(gè)概率小得很,可以忽略,所以你還不需要立刻開始寫遺囑。這里發(fā)生了什么?為什么最終的結(jié)果那么???我們應(yīng)該如何引導(dǎo)自己的直覺,才能在不依靠對計(jì)算的盲目信任感知到最終結(jié)果有多???我請你自己思考這些問題。關(guān)于分母中的配分函數(shù),我要說點(diǎn)有用的題外話。我們剛才看到,這個(gè)數(shù)分為兩部分:感染埃博拉病毒的情況,以及化驗(yàn)出錯(cuò)的情況。這兩種情況的概率絕對不一樣。事實(shí)上,感染埃博拉病毒的情況發(fā)生的概率是化驗(yàn)出錯(cuò)情況的1/1000。兩種情況的差異如此巨大,我們在計(jì)算配分函數(shù)時(shí)完全有理由忽略感染埃博拉病毒的情況。這樣的話,貝葉斯公式就是一個(gè)單純的比值,其分子不變,計(jì)算的仍是感染埃博拉病毒的情況,分母計(jì)算的則是化驗(yàn)出錯(cuò)的情況。于是貝葉斯公式比較的就是化驗(yàn)結(jié)果為陽性的兩種不同解釋。最終公式得到的結(jié)果很小,可以解釋為感染埃博拉病毒的情況遠(yuǎn)比化驗(yàn)出錯(cuò)更不可能發(fā)生。解釋貝葉斯公式的另一種方法就是置信度的轉(zhuǎn)移。也就是說,思想實(shí)驗(yàn)項(xiàng)小的理論會失去置信度,而思想實(shí)驗(yàn)項(xiàng)大的理論就會從中獲益。在這一情況中,|是|的1/10。所以的置信度會上升為此前的10倍,代價(jià)是的置信度下降。然而的先驗(yàn)概率大概是的1/10000,所以的后驗(yàn)概率只是的1/10004。4這對應(yīng)著如下的嚴(yán)格計(jì)算:。在今天,醫(yī)務(wù)人員實(shí)際上會嘗試保護(hù)你免受無謂的恐懼,方法就是將多個(gè)盡可能獨(dú)立的化驗(yàn)組合起來,只有在大量的化驗(yàn)結(jié)果都是陽性的時(shí)候,醫(yī)務(wù)人員才會做出陽性的診斷。也就是說,醫(yī)務(wù)人員會嘗試盡量降低健康人群獲得陽性結(jié)果的概率|。貝葉斯主義對薩莉·克拉克的辯護(hù)為了更好地理解貝葉斯公式,我們現(xiàn)在將它應(yīng)用到薩莉·克拉克的情況中。我們想要知道在已知兩名新生兒死亡的情況下她無罪的概率?,F(xiàn)在我們寫出貝葉斯公式。跟剛才一樣,我們需要思考三個(gè)數(shù)值:薩莉·克拉克無罪的先驗(yàn)概率,以及兩個(gè)思想實(shí)驗(yàn)項(xiàng)|和|,分別對應(yīng)在薩莉·克拉克無罪和有罪的前提下,兩名新生兒死亡的概率。我們先考慮薩莉·克拉克無罪的先驗(yàn)概率,它必定非常重要。這個(gè)先驗(yàn)概率,就是某個(gè)任意選定的人沒有殺死自己的兩名新生兒的概率。然而,絕大部分人沒有殺死過自己的兩名新生兒!實(shí)際上,希爾醫(yī)生估計(jì)薩莉·克拉克有罪的先驗(yàn)概率大約是500萬分之一!這就支持了無罪推定。對于嚴(yán)重犯罪,在沒有犯罪證據(jù)的情況下,任何人無罪的可能性都遠(yuǎn)遠(yuǎn)大于有罪的可能性。所以無罪推定就是正確的先驗(yàn)假設(shè)。然而,無罪推定不能被推廣到適用范圍以外,它只對應(yīng)沒有犯罪證據(jù)時(shí)的先驗(yàn)假定。如果眾多證據(jù)都指向嫌疑人有罪,那么嫌疑人無罪的概率會降低到小于有罪的概率。但證據(jù)可能也并不足夠。純粹貝葉斯主義者會迫使我們應(yīng)用貝葉斯公式,以更好地理解在面對指控的證據(jù)時(shí),什么程度的懷疑才是適當(dāng)?shù)?。特別是,至少在必須解釋如何計(jì)算出應(yīng)該以什么程度來懷疑時(shí),她不會只引用無罪推定得出結(jié)論,因?yàn)檫@個(gè)概念假定了指控的證據(jù)不存在?,F(xiàn)在我們來考慮思想實(shí)驗(yàn)項(xiàng)。在薩莉·克拉克無罪的前提下,兩名新生兒死亡的概率|對應(yīng)的是自然死亡的情況。這就是前文所述的7000萬分之一這個(gè)數(shù)值(這個(gè)估算值偏低)。最后,在薩莉·克拉克有罪的前提下,兩名新生兒死亡的概率等于1。我們現(xiàn)在可以將所有已知數(shù)值結(jié)合起來,進(jìn)行如下的計(jì)算:|換句話說,即使兩名新生兒自然死亡的估算值偏低,薩莉·克拉克無罪的概率仍然非常大。她無罪的可能性仍然比有罪大得多。判決薩莉·克拉克有罪似乎并不合理,即使如我們在第1章看到的,這個(gè)判斷處于貝葉斯主義的框架之外。目前為止,我們將貝葉斯公式應(yīng)用到了兩個(gè)實(shí)際例子之中。正如應(yīng)用數(shù)學(xué)中的很多情況那樣,這些實(shí)際例子其實(shí)已經(jīng)很難準(zhǔn)確理解了。畢竟準(zhǔn)確估計(jì)感染埃博拉病毒的先驗(yàn)概率和新生兒自然死亡的概率|實(shí)際上非常困難。因此不能忘記,最終得到的結(jié)果必然是一種近似?!八心P投际清e(cuò)的?!币虼?,純粹貝葉斯主義者不會堅(jiān)信任何人得到的數(shù)值結(jié)果,甚至聰明得會計(jì)算自己對于和|的各種不同數(shù)值得到的結(jié)果的置信度。但如果法官要求她給出唯一的結(jié)果,那么她會以置信度為權(quán)重,計(jì)算得到的不同結(jié)果的加權(quán)平均值。她也會注意到當(dāng)化驗(yàn)結(jié)果呈陽性時(shí)感染埃博拉病毒的概率只會非常小,而薩莉·克拉克案件的結(jié)果沒有那么牢靠,所以結(jié)果并不明確。小孩謎題終于解決了!最后我想向你展示如何用貝葉斯公式來解答那位“釣魚”學(xué)生的問題?;貞浺幌?,在兩個(gè)孩子小晨和小迪之中,至少有一個(gè)是男孩,那么另一個(gè)孩子也是男孩的概率是多少?我們之前已經(jīng)看到,這相當(dāng)于在小晨或小迪是男孩的前提下,求小晨和小迪都是男孩的概率。為了簡化記號,我們將“小晨是男孩”記作♂,將“小迪是男孩”記作♂。在小晨或小迪是女孩的情況下,我們也會用到♀這個(gè)符號。于是貝葉斯公式可以寫成:先驗(yàn)概率♂且♂就是小晨和小迪都是男孩的先驗(yàn)概率,它等于1/4。思想實(shí)驗(yàn)項(xiàng)♂或♂|♂且♂就是在小晨和小迪都是男孩的情況下,他們之中有一個(gè)是男孩的概率。但“有一個(gè)是男孩”這個(gè)條件正是“兩個(gè)都是男孩”的邏輯推論,所以這個(gè)概率等于1。最后剩下的就是配分函數(shù)♂或♂。它對應(yīng)著小晨和小迪的4種性別組合中的3種可能性。另外,我們也可以解釋本章開頭的推理的合理性。在排除女孩–女孩的假設(shè)之后,男孩–男孩、男孩–女孩、女孩–男孩這三種假設(shè)的可能性相等,因?yàn)檫@三個(gè)假設(shè)的思想實(shí)驗(yàn)項(xiàng)都等于1。所以這三個(gè)假設(shè)之間并沒有置信度的傳遞5。[2]5這個(gè)問題有一個(gè)變體,我們隨機(jī)選取一個(gè)孩子并得知他是個(gè)男孩。這時(shí),男孩-女孩以及女孩-男孩兩種情況的思想實(shí)驗(yàn)項(xiàng)不等于1,這就會產(chǎn)生置信度的傳遞,得到的結(jié)論也不一樣。書后注釋[2]中的視頻討論了這個(gè)問題變體。就這樣,我們得到了所有需要的數(shù)據(jù),剩下的就是計(jì)算。于是我們得到,等于1/3。這就是我們在本章開頭利用不嚴(yán)謹(jǐn)?shù)摹笆炙恪钡玫降慕Y(jié)果。幾句鼓勵(lì)的話本章的貝葉斯計(jì)算并不簡單。每個(gè)計(jì)算都需要整整一頁來明確解釋,即使是最喜歡數(shù)學(xué)的人也會被嚇倒。的確,即使在最簡單的情況下,實(shí)際應(yīng)用貝葉斯公式也很難,理解它就更難了。正如一般的數(shù)學(xué)內(nèi)容,這個(gè)公式的抽象性和復(fù)雜程度足以嚇退我們之中不夠勇敢的那些人。我只能鼓勵(lì)你堅(jiān)持不懈。貝葉斯公式對所有人來說都很難理解。即使是大數(shù)學(xué)家也難以將它應(yīng)用到類似蒙蒂·霍爾問題這樣的簡化情況中。即使毅力再強(qiáng),你也不能完全理解貝葉斯公式,但你可以在對它的理解上取得長足的進(jìn)展。為了做到這一點(diǎn),你要努力奮斗,不能放棄。要付出的代價(jià)就是大量腦力勞動,但其回報(bào)絕對豐厚。對于純粹貝葉斯主義者來說,最終能夠(足夠)正確思考的能力就在航程的終點(diǎn)。然而,僅僅閱讀這本書還不夠。數(shù)學(xué)的學(xué)習(xí)在于練習(xí),在于讓頭腦擺弄抽象的對象,在于自己不斷嘗試闡明數(shù)學(xué)概念。不停地思考數(shù)學(xué)才能變得擅長數(shù)學(xué)。所以請你不斷重復(fù)本章中的那些貝葉斯推理,無論是在空閑時(shí)、在淋浴時(shí)、在路上還是在散步中。當(dāng)你覺得自己準(zhǔn)備好了,就請你嘗試解決蒙蒂·霍爾問題,然后嘗試解決小孩謎題的第二部分——正確答案是13/27。努力吧,我能給你的最重要的建議就是不斷嘗試從中找到樂趣。我在之后的章節(jié)中最強(qiáng)調(diào)的就是這種樂趣。特別是,貝葉斯公式如此緊湊、如此充滿陷阱,同時(shí)它對于理解這個(gè)世界來說又如此重要,這個(gè)事實(shí)本身就包含了某種令人極度著迷的東西。比如說,我們已經(jīng)看到了貝葉斯公式能解釋為什么最好的醫(yī)療化驗(yàn)也并非毋庸置疑的,還有為什么在法律中無罪推定如此切合實(shí)際。這些還只是起點(diǎn)!貝葉斯公式的優(yōu)雅,還有它的推論將我引向了不可勝數(shù)的快樂思考,從中得出的知識哲學(xué)讓我一直感受著快樂和幸福。正因如此,我最終得出,貝葉斯公式是數(shù)學(xué)中最優(yōu)美的等式。邏輯將我們帶到比其他任何學(xué)科離天國更近的地方。伯特蘭·羅素(1872—1970)亞里士多德式邏輯推廣到關(guān)于可能性的任何理論都同構(gòu)于貝葉斯概率論。彼得里·米呂邁基第3章從邏輯上來說……兩種思考模式假設(shè)有人對你說:“如果一張撲克牌的正面是Q,那么它的背面就是藍(lán)色的。”也就是說,我們考慮“→”這個(gè)假設(shè)。你面前有4張牌,第一張正面朝上,是Q;第二張正面朝上,是10;第三張背面朝上,是藍(lán)色的;第四張背面朝上,是紅色的(圖3.1)。檢驗(yàn)之前的假設(shè)需要翻轉(zhuǎn)哪些牌?圖3.1從左到右分別是Q、10、藍(lán)色牌和紅色牌實(shí)驗(yàn)者向許多人問過這個(gè)問題。在被詢問的數(shù)千人中,只有4%的人給出了正確答案。請你也思考一下,不要掉到陷阱里。我強(qiáng)烈建議你在選擇好答案之后,去看看HygièneMentale的精彩視頻[1]??茖W(xué)哲學(xué)以及知識哲學(xué)在傳統(tǒng)上會區(qū)分兩種非常不同的推理,分別是演繹推理和歸納推理。學(xué)校里通常教的是,科學(xué)研究者應(yīng)該結(jié)合這兩種推理,進(jìn)行所謂的“假說–演繹推理”。這就是你在上述謎題中應(yīng)該部分采取的研究方法,從某個(gè)假設(shè)出發(fā),你應(yīng)該推斷出它的后果并對其進(jìn)行測試。作為一名合格的數(shù)學(xué)研究者,我很快就愛上了這種推理中的演繹部分;但作為一名合格的數(shù)學(xué)研究者,我同樣一直不滿意科學(xué)方法的歸納部分。我經(jīng)常覺得那只是一種權(quán)宜之計(jì),經(jīng)不起推敲,也與研究人員的日常生活相去甚遠(yuǎn)。更糟糕的是,我常常有一種印象:很多科學(xué)方法的支持者在斟酌科學(xué)方法的描述時(shí),都有一種策略性目的,就是將科學(xué)和偽科學(xué)區(qū)分開來。我經(jīng)常覺得,他們對“科學(xué)”的定義背后隱藏著某種“科學(xué)流氓”的行徑,在保衛(wèi)科學(xué)共同體的愿望驅(qū)使下將錯(cuò)誤的事情合理化。這種“流氓”行徑尤其喜歡遮掩歸納推理中的困難,對我來說這是個(gè)相當(dāng)嚴(yán)重的問題。不要誤會,指出科學(xué)與偽科學(xué)在可靠性上的差異這一點(diǎn)非常重要,我會在之后的章節(jié)中用更多篇幅強(qiáng)調(diào)這一點(diǎn)。但我更愿意現(xiàn)在就說清楚一點(diǎn):我對“科學(xué)方法”感到不自在,不代表我要否定科學(xué)研究的結(jié)論,更不代表我會轉(zhuǎn)而接受偽科學(xué)。特別是我們之后會看到,有一條貝葉斯原則會讓我們向科學(xué)共識賦予非常大的置信度。但在討論那些內(nèi)容之前,我們先回到演繹推理和歸納推理的區(qū)別上。對于今天受過正式訓(xùn)練的科學(xué)工作者來說,這個(gè)區(qū)別似乎是顯然的。但有趣的是,純粹貝葉斯主義者并不會做出這樣的區(qū)分。對她來說,推理方式只有一種,那就是貝葉斯公式。更準(zhǔn)確地說,整個(gè)歸納推理系統(tǒng)都只是貝葉斯公式的特例,而人們常用的歸納推理則不過是貝葉斯公式的一種錯(cuò)誤近似。當(dāng)我領(lǐng)悟到這一點(diǎn)的時(shí)候,整個(gè)人都驚呆了。正是這項(xiàng)發(fā)現(xiàn)與其他東西讓我確信自己必須著手寫這本書!我們在本章中只考慮演繹推理,下一章再討論歸納推理。在這里,我們會看到演繹推理實(shí)際上要比人們的樸素認(rèn)知更精細(xì)、更違反直覺,也更晦澀。實(shí)際上,與一些接受過專業(yè)訓(xùn)練的科學(xué)工作者的想法相反,演繹邏輯有數(shù)種。我們還會看到貝葉斯邏輯與目前在學(xué)校中講授的邏輯相比也毫不遜色。邏輯的規(guī)則邏輯推理的經(jīng)典例子就是亞里士多德的三段論,它先考慮下面兩個(gè)前提:所有人都會死;蘇格拉底是人。亞里士多德斷言這兩個(gè)前提會引出下面的結(jié)論1:1實(shí)際上,亞里士多德似乎沒有考慮過這樣的三段論,因?yàn)樗睦碚摬豢紤]個(gè)體的情況(因此其推理中不接受第二個(gè)前提)。這與斯多葛主義者的角度相反,他們發(fā)展了命題邏輯,我們之后會討論。更詳細(xì)的討論請見吉爾·多維克的杰作《計(jì)算進(jìn)化史》(人民郵電出版社,2017年)。因此,蘇格拉底會死。亞里士多德的邏輯似乎無可挑剔。它看上去如此自然,其正確性不容置疑。幾年前,一位朋友向我提出挑戰(zhàn),說我不可能懷疑亞里士多德的三段論,我承認(rèn)了自己做不到。然而,亞里士多德的這個(gè)三段論啟發(fā)了眾多哲學(xué)家、邏輯學(xué)家和數(shù)學(xué)家,他們接下來進(jìn)行了認(rèn)真的分析,目的是確定邏輯的規(guī)則。這些邏輯規(guī)則又叫作替換規(guī)則與肯定前件規(guī)則。如同現(xiàn)代數(shù)學(xué)那樣,亞里士多德的三段論實(shí)際上基于這兩條邏輯規(guī)則。要理解它們,最好從一個(gè)比亞里士多德的三段論更簡單的情況出發(fā)??紤]下面這個(gè)包含兩個(gè)事件的例子::現(xiàn)在正在下雨;:我?guī)Я藗?。每個(gè)事件都可能是真的或者假的。這兩個(gè)事件又被稱為布爾變量,由此出發(fā)可以構(gòu)建新的事件,我們把這些新事件叫作邏輯公式。比如說,我們可以構(gòu)造“非”“或者”甚至“且”這些公式,甚至還有類似“(非)或者”這種更復(fù)雜的公式。要理解這些公式,一種有用的方法就是構(gòu)造它們的真值表(表1),根據(jù)布爾變量的真值列出邏輯公式的真值。表1“現(xiàn)在正在下雨或者我?guī)Я擞陚恪钡恼嬷当?/p>

====比如說,在表1中,中間一行對應(yīng),也就是“現(xiàn)在正在下雨”的情況,而中間一列則對應(yīng),也就是“我?guī)Я藗恪钡那闆r。所以,正中間的格子代表當(dāng)和同時(shí)為真時(shí),“或者”的邏輯真值。這個(gè)格子指出,如果和都為真的話,那么“或者”也為真。請你花點(diǎn)時(shí)間自己分析這個(gè)真值表,并列出其他邏輯公式的真值表。目前為止,我們還只研究了由兩個(gè)布爾變量組成的公式,但我們可以更進(jìn)一步,考慮由3個(gè)、8個(gè)甚至更多布爾變量組成的公式。為了列出這些布爾變量所有可能的取值組合,這些公式的真值表當(dāng)然會變得更龐大。你可以計(jì)算一下這些巨大的真值表有多少項(xiàng),以及所有可能的真值表的數(shù)目。但我非常不建議你列出包含3個(gè)或以上布爾變量的所有真值表,畢竟3個(gè)布爾變量的真值表有256個(gè)……而包含8個(gè)布爾變量的真值表數(shù)目約等于宇宙中的粒子數(shù)!在實(shí)踐中,有一個(gè)邏輯公式特別重要,那就是“(非)或者”,通常我們也把它寫成“→”。這個(gè)公式可以直觀地讀成“蘊(yùn)涵”,或者“對于所有都有”,又或者“如果那么”。請你多花點(diǎn)時(shí)間思考這個(gè)公式的真值表(表2),它一定會令沒有仔細(xì)思考過它的人吃驚。表2“如果下雨的話我就帶了雨傘”的真值表

====“→”這個(gè)公式之所以特別重要,是因?yàn)樗幱谶壿嬔堇[的核心。邏輯演繹正是從前提出發(fā),推導(dǎo)出結(jié)論。如果蘊(yùn)涵關(guān)系是正確的,而且前提也正確,那么結(jié)論本身也必定正確。用符號表示的話,我們可以寫出邏輯公式“((→)且)→”,這個(gè)公式就是我們所說的肯定前件2。[2]2實(shí)際上要比這個(gè)公式更加復(fù)雜。為了保證嚴(yán)謹(jǐn),必須將元語言中的“蘊(yùn)涵”和“而且”與描述邏輯的語言中的“→”和“且”區(qū)分開。你可以將代表“蘊(yùn)涵”的箭頭替換成它的定義,用我們之前定義的“或者”“且”和“非”來表達(dá)。擺弄一下這樣得到的公式,或者寫出它的真值表,你就會得出一個(gè)結(jié)論:無論和的真值是什么,肯定前件推理總是正確的。我們說肯定前件推理是一個(gè)重言式,因?yàn)閷τ谏婕暗牟紶栕兞克锌赡艿恼嬷?,它都是對的。與常識相反的是,在邏輯中,重言式可能一點(diǎn)都不“顯然”。它不一定顯而易見或不言而喻。如同肯定前件推理,某些重言式是大部分人看不出來的,我們需要一點(diǎn)時(shí)間來思考。Q的背面都是藍(lán)色的嗎?我們回到本章開頭的撲克牌問題?;貞浺幌?,我們要測試的假設(shè)是→。你面前有4張牌,第一張是Q,第二張是10,第三張背面向上,為藍(lán)色,第四張背面向上,為紅色。要測試這個(gè)假設(shè),需要將幾張牌翻過來?第一張牌是Q??隙ㄇ凹评碜屛覀兡茏龀瞿撤N預(yù)測。的確,“((→)且)→”是一個(gè)重言式,如果要測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論