貝葉斯決策理論的起源與發(fā)展_第1頁
貝葉斯決策理論的起源與發(fā)展_第2頁
貝葉斯決策理論的起源與發(fā)展_第3頁
貝葉斯決策理論的起源與發(fā)展_第4頁
貝葉斯決策理論的起源與發(fā)展_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

貝葉斯決策理論的起源與發(fā)展

貝葉斯決策理論是關(guān)于決策者在信息不確定的情況下做出判斷和選擇的理論。最重要的問題是,什么選擇對決策者來說是最好的,也就是說,只有執(zhí)行哪些行為才能獲得最優(yōu)的結(jié)果。所以,貝葉斯決策理論的主要目的是要建立一種理性選擇的普遍原則,以指導(dǎo)決策者在不確定性的情況下作出合理的決策,并采取相應(yīng)的行動。決策理論的基礎(chǔ)是概率邏輯理論,因此,它是概率邏輯的應(yīng)用。貝葉斯決策理論起源于18世紀(jì)人們對概率論的研究,但其作為一門系統(tǒng)化、理論化的科學(xué)理論提出來,卻是20世紀(jì)的事情了。它的正式提出有賴于當(dāng)時概率論、統(tǒng)計學(xué)、經(jīng)濟學(xué)等的發(fā)展和完善。貝葉斯決策理論最完善的理論形態(tài)是由薩維奇在《統(tǒng)計學(xué)基礎(chǔ)》(TheFoundationsofStatistics)(1954年)一書中提出來的,我們稱之為經(jīng)典貝葉斯決策理論(ClassicalBayesianDecisionTheory)。貝葉斯決策理論的發(fā)展經(jīng)歷了從最初的經(jīng)典貝葉斯決策理論到稍后的證據(jù)決策理論(EvidentialDecisionTheory),再到后來的因果決策理論(CausalDecisionTheory)的發(fā)展歷程??疾熵惾~斯決策理論的演進過程和研究動態(tài),通過梳理其發(fā)展脈絡(luò)而預(yù)測其發(fā)展趨勢,對于我們研究和發(fā)展歸納邏輯理論及其應(yīng)用具有重要的意義。一貝葉斯定理貝葉斯決策理論有許多不同的理論形態(tài),所采用的決策原則也有所不同,但它們的重要理論基礎(chǔ)是貝葉斯定理(Bayestheorem)和期望效用最大化原則(theprincipleofexpectedutilitymaximization)。貝葉斯定理是英國數(shù)學(xué)家貝葉斯(ThomasBayes)在《論機遇學(xué)說中一個問題的解》中提出的一個重要定理。它可以用來計算條件概率,以及描述兩個條件概率之間的關(guān)系。比如,A在B上的條件概率可以用下式來表示:Ρ(A|B)=Ρ(A)×Ρ(B|A)Ρ(B)P(A|B)=P(A)×P(B|A)P(B)貝葉斯定理為主體利用搜集到的信息對原有判斷進行修正提供了有效手段,也就是說,貝葉斯定理能夠告知我們?nèi)绾卫眯伦C據(jù)修改已有的看法。利用貝葉斯定理,我們可以很好地刻畫我們的決策準(zhǔn)則。例如,當(dāng)我們面臨一個選擇時,如果我們已經(jīng)有了一個用數(shù)字來表示的價值概念,那么,貝葉斯定理就可以給我們提供一個算法來幫助我們決定哪種選擇更好。令u是一個效用函數(shù),它給一個行動可能導(dǎo)致的每一個結(jié)果都指派一個數(shù)值,以反映該結(jié)果的好壞程度。如此一來,如果行動A1比A2好,那么就可以用下面這個式子來表示:∑ipiui>∑jpjuj其中,pi是行動A1可能導(dǎo)致的結(jié)果的概率,ui是那些結(jié)果的效用;同樣地,pj是行動A2可能導(dǎo)致的結(jié)果的概率,uj是相應(yīng)的結(jié)果的效用?!苅piui的值叫做行動A1的期望效用(ExpectedUtility,簡記為EU)。實際上,我們總是選擇那些具有最大期望效用的行動,因此,這種決策規(guī)則叫做期望效用最大化原則,簡記為EU-最大化。二狀態(tài)存在的概率以貝葉斯定理為基礎(chǔ),使用主觀概率并遵守期望效用最大化原則的決策理論稱為經(jīng)典貝葉斯決策理論,簡稱為經(jīng)典決策理論。對經(jīng)典決策理論的建立作出了重要貢獻的學(xué)者主要有蘭姆賽(E.P.Ramsey)、德·菲耐蒂(deFinetti)、馮·諾依曼(J.vonNeumann)、摩根斯坦(O.Morgenstern)和薩維奇(L.J.Savage)。蘭姆賽的主要貢獻在于他首次把主觀概率引入了期望效用理論,而且還給出了測度主觀概率的方法。德·菲耐蒂的主要貢獻在于他提出并發(fā)展了主觀概率理論。馮·諾依曼與摩根斯坦的主要貢獻在于他們在《博弈論和經(jīng)濟行為》(1944年)一書中建立了現(xiàn)代效用理論。薩維奇的主要貢獻在于他系統(tǒng)地提出并發(fā)展了經(jīng)典決策理論。“由于薩維奇的工作,貝葉斯決策理論的基本框架形成了。”下面,我們就以薩維奇的決策理論為例來討論經(jīng)典貝葉斯決策理論及其優(yōu)缺點。薩維奇給出的決策模型包括三個要素:行動(acts)、狀態(tài)(states)和結(jié)果(outcomes),我們分別用A,S和O來表示。其中,A指的是可供決策者選擇的備選行動;S指的是決策者進行選擇時需要考慮的世界狀態(tài)(或外在條件);O指的是決策者選擇行動A后所導(dǎo)致的結(jié)果。當(dāng)備選行動和世界狀態(tài)都是有窮的時候,一個決策問題可以用如下矩陣來表示:其中,O[A,S]表示行動A在狀態(tài)S下可能導(dǎo)致的結(jié)果。例如,在輪盤賭中,我們需要決定是賭紅色(記為AR)還是賭黑色(記為AB)。有兩種可能的狀態(tài):轉(zhuǎn)輪停在紅色圖案上(記為SR),或者轉(zhuǎn)輪停在黑色圖案上(記為SB)。可能的結(jié)果就有4種。決策者面臨的決策矩陣如下所示:由此可知,所有行動的結(jié)果都依賴于最終的實際狀態(tài):如果你賭紅色,那么轉(zhuǎn)輪停在紅色圖案上你就贏,停在黑色圖案上你就輸。反之亦然。假如我們以10美元去下賭注,那么上述決策矩陣就變?yōu)?因此,我們可以把行動看做是狀態(tài)和結(jié)果之間的一個函數(shù),即O[A,S]=A(S)。作為一個決策者,我們非常關(guān)注最后的結(jié)果以及它所帶來的效用(utility)。但是,由于我們并不知道哪個狀態(tài)最終會出現(xiàn),所以,我們需要為狀態(tài)指派概率,即確定狀態(tài)出現(xiàn)的可能性。在薩維奇的框架中,我們該如何計算期望效用呢?假如已經(jīng)給定了行動A,那么,我們就可以把各種狀態(tài)的概率與行動A所導(dǎo)致的結(jié)果的效用乘起來,即p(Si)u(A(Si))。其中,A(Si)是行動A在狀態(tài)Si中所導(dǎo)致的結(jié)果。因此,薩維奇框架下的期望效用是:EU(A)=∑ip(Si)u(Ο(A?Si))=∑ip(Si)u(A(Si))=∑ip(Si)u(A∧Si)有了這個期望效用公式之后,決策者就可以根據(jù)以下的原則來進行決策了:行動A1比A2好,當(dāng)且僅當(dāng),EU(A1)>EU(A2)值得注意的是,薩維奇認(rèn)為,上式中的概率p是唯一的,效用u也是唯一的。也就是說,“薩維奇通過上式表明,一個決策者的偏好只要滿足他的公理條件,他就可以通過一個唯一確定的概率和一個幾乎是唯一確定的效用來最大化他的期望效用,并以此對其行動前景進行評價和預(yù)測?!?9當(dāng)然,如果兩個行動的期望效用相同,那么就無所謂好壞之分了。例如,在輪盤賭那個例子中,假定效用就是金錢,而且,我們面臨的兩個選擇是:以10美元為賭注賭轉(zhuǎn)輪停在黑色圖案上(記為AB),或者以10美元為賭注賭轉(zhuǎn)輪停在紅色圖案上(記為AR)。此外,由于轉(zhuǎn)輪最終是停在黑色圖案上還是紅色圖案上,是完全隨機的,所以,這兩種狀態(tài)出現(xiàn)的概率都是1/2。根據(jù)薩維奇的期望效用公式,AR的期望效用為:EU(AR)=p(AR)u(AR(SR))+p(AB)u(AR(SB))=(1/2)×10+(1/2)×(-10)=0該結(jié)果與我們所期待的結(jié)果相同。同樣地,以10美元為賭注賭轉(zhuǎn)輪停在黑色圖案上即AB的期望效用也是如此。因此,在這兩種行動方案中,沒有哪種更具優(yōu)越性,這也是非常符合我們的直觀的。當(dāng)然,如果非要作出一個選擇的話,那么,我們隨機選擇一個行動即可。事實上,薩維奇是想利用“偏好”這一概念來定義行動的效用并刻畫人們的決策過程。為此,它引入了一個二元偏好關(guān)系算子≥,該算子的意思是,決策者認(rèn)為前一個行動好于后一個行動(至少不比后一個行動差)。因此,“薩維奇試圖用理性偏好來為期望效用最大化原則進行辯護。他通過在偏好等級上加上一些限制條件,并給出了一個表征定理來表明,任何一個偏好滿足那些限制條件的決策者都能夠通過增加期望效用來自動為他們的行動進行排序?!?8薩維奇系統(tǒng)中最重要的一條公理就是“確定性原則”(sure-thingprinciple),即令A(yù)1和A2是兩個備選行動,如果決策者在狀態(tài)S中對這兩個行動并沒有明顯的偏好,那么,不管A1和A2的結(jié)果是什么,都不會改變決策者的上述偏好。21換句話說,S中的結(jié)果是一個“確定性的事件”,它并不依賴于人們是選擇行動A1還是選擇行動A2。薩維奇框架非常簡單、優(yōu)美,而且在多數(shù)情況下都是非常恰當(dāng)?shù)摹5?正如杰弗里所指出的那樣,該框架存在一些看上去并不那么合理的決策問題,由此作出的決策,往往不太令人滿意。8-9正如下面的這個“停車”案例115-116所指出的那樣。假如你剛把車停在一個破舊的街區(qū),一個男子走過來向你要10美元的“保護費”以保護你的汽車不受損。你意識到這純粹是敲詐勒索,而且你也知道,那些曾經(jīng)拒絕交“保護費”的人的車,擋風(fēng)玻璃都壞了,而那些交了“保護費”的人的車卻沒有遭此“劫難”。而你此時又不能選擇把車停在別處,因為你要參加一個非常重要的會議,而會議馬上就要召開了。并且,換一塊擋風(fēng)玻璃得花400美元。你是否應(yīng)該交“保護費”呢?現(xiàn)在,假定你作如下推理。首先,這里無非有兩種可能的狀態(tài):一種是該男子砸壞了你的擋風(fēng)玻璃,一種是該男子沒有砸壞你的擋風(fēng)玻璃。其次,如果你給了他10美元,那么,可能的結(jié)果就有兩種,一種是你支付了10美元給那個男子且你的擋風(fēng)玻璃沒有被砸壞,另一種是你支付了10美元給那個男子且你的擋風(fēng)玻璃被砸壞;如果你不給他10美元,那么,可能的結(jié)果也有兩種,一種是你沒有支付10美元給那個男子且你的擋風(fēng)玻璃被砸壞,另一種是你沒有支付10美元給那個男子且你的擋風(fēng)玻璃沒有被砸壞。其決策矩陣如下:在薩維奇看來,不管那兩種狀態(tài)的概率是多少,“不交給那男子10美元”的期望效用都比“交給那男子10美元”的期望效用要高一些,因為在所有的可能狀態(tài)中,由前一個行動導(dǎo)致的結(jié)果都比后一個行動導(dǎo)致的結(jié)果要好,表現(xiàn)在決策矩陣中即為,在S1和S2這兩種狀態(tài)下,下一行的效用都比上一行的效用要高(決策者都可以多擁有10美元)。但這是錯誤的。很明顯,你最終將面臨的情況是:如果你不給那男子10美元的保護費,那么你的擋風(fēng)玻璃就會被砸壞;相反,如果你給了那男子10美元的保護費,那么你的擋風(fēng)玻璃就不太可能被砸壞。以10美元的極小代價就可以避免擋風(fēng)玻璃被砸壞的糟糕結(jié)果,所以你應(yīng)該付那10美元。三“條件概率psa”取代“不交10億美元”經(jīng)典貝葉斯決策理論之所以會出現(xiàn)上述違背人們直觀的決策問題,主要原因在于它忽略了下述事實,即我們的行動與世界的狀態(tài)是密切相關(guān)的?!八_維奇的期望效用最大化是根據(jù)他的(期望效用)公式來定義的,而該公式是建立在一個假定上面的,即理性主體關(guān)于世界狀態(tài)的可能性的信念與他的行動無關(guān)?!?15這種假定顯然是有問題的。我們以一個簡單的例子來說明這個問題。假如一個學(xué)生正在考慮是否有必要對即將舉行的考試進行復(fù)習(xí)。他的推理如下:如果他將順利通過考試,那么復(fù)習(xí)就是浪費時間。同樣,如果他沒有通過考試,那么復(fù)習(xí)也是浪費時間。所以,不管最后是否通過了考試,復(fù)習(xí)都是在做無用功。因此,最佳的選擇是“不復(fù)習(xí)”。顯然,這種推理是有問題的,因為復(fù)習(xí)可以提高他的考試通過率,也就是說,他成功通過考試的概率很有可能受到其所采取的行動(復(fù)習(xí)或者不復(fù)習(xí))的影響。因此,在進行決策的時候,我們必須考慮行動對結(jié)果的概率的影響。為了解決這個問題,杰弗里建議我們允許狀態(tài)的概率隨著我們擬采取的行動的不同而改變,即對同一狀態(tài)在不同的情況下賦予不同的概率權(quán)重。比如,在上述的“停車”案例中,在“交10美元”的情況下,“擋風(fēng)玻璃被砸壞”的可能性就非常小(比如0.01),而在“不交10美元”的情況下,“擋風(fēng)玻璃被砸壞”的可能性就非常大(比如0.99)。同樣,在剛剛提到的“考試”案例中,在采取“復(fù)習(xí)”這一行動的情況下,“通過考試”這一狀態(tài)的概率可能是0.8,而在“不復(fù)習(xí)”的情況下可能是0.3。實際上,杰弗里的這一建議就是讓我們用條件概率p(S|A)取代薩維奇公式中的非條件概率p(S)來計算期望效用。當(dāng)然,杰弗里之所以可以給出這樣的建議,得益于他一個巧妙的技術(shù)處理,即杰弗里把行動、狀態(tài)和結(jié)果均看做命題,而不是像薩維奇那樣在行動、狀態(tài)和結(jié)果之間作出明確的區(qū)分。如此一來,我們就可以談?wù)撐覀償M采取的某個行動命題的概率、某個狀態(tài)命題的概率,以及由此導(dǎo)致的某個結(jié)果命題的概率了。對于效用來說也是如此。而且,我們還可以用概率來刻畫行動和狀態(tài)之間的關(guān)系,以及行動-狀態(tài)對(action-statepairs)與結(jié)果之間的關(guān)系。因此,在杰弗里的系統(tǒng)中,行動的證據(jù)期望效用可以用下式來計算:EEU(A)=∑ip(wi|A)u(Ο[A?wi])=∑ip(wi|A)u(A∧wi)其中,wi是事情發(fā)生的所有可能方式,即決策空間Ω的所有單元素集wi(為了保持形式系統(tǒng)的簡單性和一致性,我們假設(shè)Ω存在且是有窮可數(shù)的)。把這種新的方法應(yīng)用到前面提到過的“停車”案例中,我們會發(fā)現(xiàn),一個恰當(dāng)?shù)母怕手概煽梢詫?dǎo)致“交10美元”這一行動獲得一個較高的證據(jù)期望效用。比如,在“交10美元”的情況下,我們給狀態(tài)“擋風(fēng)玻璃被砸壞”指派0.01的概率,而給狀態(tài)“擋風(fēng)玻璃不被砸壞”指派0.99的概率;相反,在“不交10美元”的情況下,我們給狀態(tài)“擋風(fēng)玻璃被砸壞”指派0.99的概率,而給狀態(tài)“擋風(fēng)玻璃不被砸壞”指派0.01的概率。此時,我們面臨的決策矩陣變?yōu)?此時,行動A1和A2的證據(jù)期望效用分別為:EEU(A1)=(-410)×0.01+(-10)×0.99=-14EEU(A2)=(-400)×0.99+0×0.01=-396顯然,行動A1的期望效用高于行動A2,因此,我們應(yīng)該“交10美元給那男子”。這也說明了杰弗里系統(tǒng)與薩維奇系統(tǒng)的最大區(qū)別,即p(wi|A)隨行動A的不同而變化。而作出上述概率指派也是合理的,因為“交10美元”這個行動的確會極大地增加“我的擋風(fēng)玻璃不會被砸壞”這一個優(yōu)勢結(jié)果的概率。當(dāng)然,薩維奇也意識到了在“停車”案例這類情況中,結(jié)果的概率依賴于我們擬采取的行動。他認(rèn)為,在這類情況中,我們應(yīng)該對那些可能的狀態(tài)進行個別化處理,即對可能的狀態(tài)進行一個劃分(partition),以使得它們獨立于行動。例如,我們可以對上述“停車”案例中的狀態(tài)作如下劃分115-116:S1:不管你怎么做,擋風(fēng)玻璃都會壞。S2:如果你交了保護費,那么你的擋風(fēng)玻璃就不會壞;但是,如果你不交保護費,那么你的擋風(fēng)玻璃就會壞。S3:如果你交了保護費,那么你的擋風(fēng)玻璃就會壞;但是,如果你不交保護費,那么你的擋風(fēng)玻璃就不會壞。S4:不管你怎么做,擋風(fēng)玻璃都不會壞。如此一來,期望效用就可以繼續(xù)用薩維奇的公式來計算了。因此,只要我們對可能狀態(tài)作一個恰當(dāng)?shù)膭澐?我們就可以找到一個公式,它可以給出該問題的正確答案。但是,薩維奇的這種處理方式面臨著一個難題,即我們需要找到一個劃分,使得狀態(tài)和行動在其中是概率獨立的。這相對于杰弗里的理論,有許多的“不足”之處:首先,在薩維奇的框架上,行動和結(jié)果并不具有概率,也就是說,p(A)和p(A∧S)是未經(jīng)定義的,所以,我們無法在薩維奇的框架上來表述“狀態(tài)概率獨立于行動”這一思想,即p(A∧S)=p(A)p(S)。其次,證據(jù)決策理論不僅讓我們表達出行動和結(jié)果之間的概率關(guān)系,而且不管我們怎么處理此問題,它都會讓我們得到相同的答案。一個命題的期望效用與其在任意劃分下的期望效用是相等的。這種劃分不變性(partition-invariance)非常重要,它“使得人們在小世界(SmallWorld)中作決策時也可以采用期望效用最大化原則?!?21四吸煙是否會導(dǎo)致肺癌隨之而來的問題是:證據(jù)決策理論是否真的沒有任何缺陷呢?回答是否定的。事實上,后來人們發(fā)現(xiàn),證據(jù)決策理論也存在一些問題。正如喬伊斯所說,“在一些決策問題中,我們對好消息的追求可以得到最優(yōu)的結(jié)果。但這只是在主體的選擇和期望結(jié)果的出現(xiàn)之間具有統(tǒng)計學(xué)的或證據(jù)性的聯(lián)系且沒有任何因果聯(lián)系時才成立。當(dāng)行動的證據(jù)性結(jié)果和因果性結(jié)果不一致時,證據(jù)理論就會告訴決策者應(yīng)當(dāng)優(yōu)先追求好消息而不是好結(jié)果。包括我在內(nèi)的許多哲學(xué)家都認(rèn)為這是錯誤的。”146下面我們以一個簡單的例子來說明。假如你正在考慮是否吸煙,而且你也知道,吸煙是一件非常愉快的事情。此外,最近的科學(xué)研究還表明,吸煙對身體無害,更不會導(dǎo)致肺癌,人們患肺癌是由于他們具有一種“吸煙基因”,該基因可以導(dǎo)致以下兩種情況發(fā)生:(1)使得這些人覺得吸煙是一件非常愉快的事情;并且(2)使得這些人容易患上肺癌(但肺癌并不是由于吸煙所致)。在這種情況下,即吸煙不僅能讓你覺得非常愉快而且對身體無害,你有理由拒絕吸煙嗎?證據(jù)決策理論給出的建議是:拒絕吸煙。因為吸煙是某人具有吸煙基因的一個有力證據(jù),所以,吸煙會大大提高該人患上肺癌的風(fēng)險。而患上癌癥遠(yuǎn)比享受吸煙的樂趣要糟糕得多。因此,證據(jù)決策理論建議你戒煙。但是,這種建議似乎并不合理。因為科學(xué)研究已經(jīng)表明,吸煙并不會導(dǎo)致肺癌,吸煙僅僅是某人具有吸煙基因并因此很有可能患上肺癌的一個證據(jù)而已。如果你具有吸煙基因,那么,不管你是否吸煙,你都依然具有該基因。因此,戒煙并不能阻止你患上肺癌。也就是說,不管你是否具有吸煙基因,這都是你無法改變的事實。因此,你可以放心地選擇吸煙并享受吸煙帶來的樂趣。大多數(shù)人認(rèn)為后面那個論證更有說服力,理由如下:如果你拒絕吸煙,這也許是一個好消息,因為它減少了你患肺癌的風(fēng)險;但是,拒絕吸煙并不能阻止你患肺癌,因此,拒絕吸煙即使有證據(jù)價值也沒有任何實際價值。如果你贊同這種觀點,那么,你就已經(jīng)脫離了證據(jù)決策論者的陣營,轉(zhuǎn)而加入了另一個新的決策論者的陣營:因果決策論者的陣營。1因果決策理論和證據(jù)決策理論之間最主要的區(qū)別在于,如何去計算行動的效用。因果決策理論基于行動的效力(efficacy),即它們帶來好結(jié)果的能力來評價它們,而不是基于作為好消息的行動的價值(value),即證據(jù)決策理論所考慮的對象來評價它們。在上述的吸煙案例中,證據(jù)決策理論建議你拒絕吸煙,主要是它把你吸煙看成是你具有吸煙基因的一個證據(jù),因而也是你很有可能會患上肺癌的一個證據(jù),所以,你應(yīng)該拒絕吸煙。因果決策理論建議你吸煙,主要是它并不把這種由某種“公共原因”所導(dǎo)致的行動和壞結(jié)果之間的證據(jù)聯(lián)系看成是你應(yīng)該拒絕吸煙的一個理由,因為吸煙和患上肺癌之間的聯(lián)系僅僅是證據(jù)性的,而不是實質(zhì)性的,即它并不是導(dǎo)致人們患上肺癌的真正原因?!霸诳紤]是否執(zhí)行某個行動時,我們需要考慮的是執(zhí)行該行動后會導(dǎo)致的后果(consequences)。而這種后果應(yīng)該是因果性的,而不是證據(jù)性的。這就表明,一個正確的決策理論公式應(yīng)該使用‘因果概率’,而不是條件概率P(O/A)。”具有上述特征的決策理論就是因果決策理論。因果決策理論的一種非常經(jīng)典的表述方式來自斯科姆斯(B.Skyrms)。斯科姆斯的想法是,尋找一種特殊的劃分,它把Ω劃分為大衛(wèi)·劉易斯(DavidLewis)所說的那種“依賴性假設(shè)”(“dependencyhypotheses”),這種理論將表明你所關(guān)注的那些結(jié)果是如何因果地依賴于你的行動的。這種劃分中的每一個元素都將清楚地表明你潛在的行動是如何影響可能出現(xiàn)的結(jié)果的。我們把這樣的劃分叫做K-劃分。于是,一個行動的因果期望效用就可以用下式來計算了。CEU(A)=∑ip(Κi)∑jp(wj|A∧Κi)u(wj)事實上,當(dāng)世界的因果結(jié)構(gòu)已經(jīng)給定的時候,證據(jù)期望效用與因果期望效用是一致的。也就是說,一個行動導(dǎo)致一個結(jié)果的趨勢(tendency)恰好與給定行動下的結(jié)果的條件概率相吻合。但是,由于你的行動和可能的結(jié)果之間的因果關(guān)系是未知的,所以,我們必須先計算出所有可能的相關(guān)假設(shè)的證據(jù)期望效用,然后用它們各自的概率作為它們的權(quán)重進行加權(quán)求和。當(dāng)然,實現(xiàn)上述思想的方法還有許多。比如吉伯德(A.Gibbard)和哈伯(W.Harper)就建議我們用虛擬條件句來刻畫行動的因果影響。我們知道,虛擬條件句具有如下形式:“如果A成立,那么B也成立”(簡記為A□→B)。一般說來,如果B不發(fā)生則A也不會發(fā)生,那么,A就是B的一個原因。所以,吉伯德和哈伯建議我們用下列公式來計算行動A的期望效用:∑ip(A□→wi)u(wi)如此一來,我們就可以利用A的特性來得到好的結(jié)果,并將其作為我們行動的指南。不過,劉易斯認(rèn)為,吉伯德-哈伯的方法以及其他類似的方法其實是同一方法的不同表述而已,它們和前面講到過的通過K-劃分來定義的因果期望效用是等價的。然而,喬伊斯認(rèn)為,應(yīng)用K-劃分雖然可以獲得直觀上正確的結(jié)論,但我們?yōu)榇烁冻龅拇鷥r卻是:我們必須找到一個正確的劃分。這似乎又回到了薩維奇的方法上去了。所以,喬伊斯提出了另外一種方法,即“想象法”(imaging)來實現(xiàn)上述設(shè)想。172-176他建議我們用下式來計算因果期望效用:CEU(A)=∑ipA(wi)u(wi)其中,pA是p在A上的象(image)。當(dāng)然,我們也可以把pA看做一個概率函數(shù)。它是喬伊斯發(fā)明的一種計算行動功效值的方法,他通過把P(·\A)與PA(·)等價來得到U(A)的正確值。想象法的作用是把集合A外面的世界的概率遷移到A中那些與其最相似的世界上去。在喬伊斯看來,這還是一種很不錯的信念修正法。具體的做法是:當(dāng)一個決策者在評估A的功效值的時候,他通過假定A為真來暫時修改他的觀點,并且通過關(guān)于A-世界集中的世界之間的整體比較相似性的判斷來給A-世界集中的┓A重新指派主觀概率。所以,這也是一種判斷“如果A為真,那么B將會怎么樣”的認(rèn)識論方法。174-175以此為基礎(chǔ)而構(gòu)建的喬伊斯因果決策理論可以很好地區(qū)分因果期望效用和證據(jù)期望效用,而且,它還允許我們把證據(jù)決策理論和因果決策理論看做是具有一個共同基礎(chǔ)(即條件期望效用)的兩種理論形式。然而,因果決策理論本身也存在著一些問題。最近,伊根(Egan)就發(fā)現(xiàn)了它的一個問題。比如,有一個“消滅所有瘋子”的按鈕,只要按下它,就可以殺死所有的瘋子。保羅相信他自己不是瘋子,并且非常希望能消滅地球上所有的瘋子(因為他認(rèn)為生活在一個沒有瘋子的世界上比生活在一個有瘋子的世界上要舒服得多)。然而,保羅卻認(rèn)為只有瘋子才會去按下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論