關(guān)于囚徒困境的幾個(gè)問(wèn)題_第1頁(yè)
關(guān)于囚徒困境的幾個(gè)問(wèn)題_第2頁(yè)
關(guān)于囚徒困境的幾個(gè)問(wèn)題_第3頁(yè)
關(guān)于囚徒困境的幾個(gè)問(wèn)題_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)于囚徒困境的幾個(gè)問(wèn)題     摘要:囚徒困境是博奕論中的一個(gè)重要范例,對(duì)這個(gè)問(wèn)題的研究涉經(jīng)濟(jì)學(xué)政治學(xué)社會(huì)學(xué)哲學(xué)、理學(xué)等廣泛的領(lǐng)域。本文簡(jiǎn)要地介紹和評(píng)述了中外學(xué)者在這個(gè)問(wèn)題研究中取得的成果及進(jìn)行解釋時(shí)提出的多種見(jiàn)解。囚徒困境提示的個(gè)人理性和集體理性、個(gè)人主義與道德主義的關(guān)系深化了對(duì)這些問(wèn)題的認(rèn)識(shí)。本文最后介紹了計(jì)算機(jī)比賽方法研究重復(fù)的囚徒困境和合作問(wèn)題的成果,分析了“一報(bào)還一報(bào)”程序取得成功和合作得以出現(xiàn)的原因和條件。關(guān)鍵詞:囚徒困境理性道德合作一、什么是囚徒困境1994年10月12日,瑞典皇家科學(xué)院宣布把該年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予約翰·納什(

2、J.Nash)、約翰·豪爾紹尼(J.Harsanyi)和萊因哈德·澤爾騰(Reinhard Selten)以表彰他們把博奕論(game theory,又譯為對(duì)策論或游戲論)應(yīng)用于現(xiàn)代經(jīng)濟(jì)分析所作的卓越貢獻(xiàn)。以此為契機(jī),我國(guó)在1995年出現(xiàn)了一個(gè)小小的介紹博奕論的“熱潮”。許多讀者大概已經(jīng)注意到:在介紹博奕論的文章中幾乎篇篇都會(huì)提到所謂的囚徒的困境。囚徒困境的原文為the Prisoner's Dilemma,又譯為囚犯的兩難困難,囚犯難題等。這個(gè)問(wèn)題是大約在1950年首先由社會(huì)心理學(xué)家梅里爾·M 弗勒德(Merril M.Flood )和經(jīng)濟(jì)學(xué)家梅爾文&#

3、183;德雷希爾(Melvin Dresher)提出來(lái)的,后來(lái)由艾伯特·W塔克 (Albert W.Tucker)明確地?cái)⑹隽诉@種“困境”1,p.3。納什有兩篇關(guān)于非合作博奕的重要文章分別發(fā)表于1950年和1951年。有人認(rèn)為:塔克的這項(xiàng)工作同納什的著作一起“基本上奠定了現(xiàn)代非合作博奕論的基石。2 囚徒困境的重要地位和重要意義由此就不難想象了。所謂囚徒困境可簡(jiǎn)要地?cái)⑹鋈缦拢簝蓚€(gè)涉嫌共謀犯罪的嫌疑犯被捕后被警察關(guān)在相互隔離的牢房中。他們面臨的選擇是:或者坦白或者保持沉默(即不坦白)。他們被告知:如果某個(gè)嫌疑犯坦白而其同伙不坦白,則坦白者可獲自由而拒不坦白者要被判10年監(jiān)禁;如果二人都坦

4、白,則二人都被判5年監(jiān)禁; 如果二人都不坦白,則二人皆被判1年監(jiān)禁。上述情況我們亦可用一支付矩陣表示如下:嫌疑犯乙 坦白沉默嫌疑犯甲坦白 -5, -50, -10沉默 -10, 0-1, -1在這種情況下,兩個(gè)嫌疑犯將如何決策和選擇呢?在囚徒困境的分析和推論中有以下的前提性設(shè)定:每個(gè)局中人(在囚徒困境中就是兩個(gè)囚徒)都知道“博奕的規(guī)則”和“博奕結(jié)果”的支付矩陣;每個(gè)局中人都是理性的,而這里的所謂“理性”是指只要給出兩種備擇策略(alternatives),他將總是選擇其中對(duì)他更有利的那種策略;局中人是相互隔離不能“串通”,不能“結(jié)盟”的。在這種條件下,兩個(gè)囚徒怎樣分析問(wèn)題和運(yùn)用“理性”并得到什

5、么結(jié)果呢?從甲的“立場(chǎng)”來(lái)看,共有兩種可能情況。第一種可能情況是乙采取坦白的策略,這時(shí),如果他也坦白則要入獄5年,如果他不坦白, 則更糟:要入獄10年;兩相比較,結(jié)論是他應(yīng)以坦白“對(duì)付”乙的坦白策略。第二種可能情況是乙采取沉默的策略,這時(shí)他若也沉默,要入獄1 年,如果他坦白,則可獲得自由;兩相比較,結(jié)論是他應(yīng)以坦白對(duì)付乙的“沉默”策略。把以上兩種可能情況的結(jié)論歸納在一起,總結(jié)論”是:無(wú)論乙采用坦白策略還是沉默策略,甲都以采取坦白策略為更“佳”的對(duì)策;所以,甲要采取坦白策略。很顯然,以上推理對(duì)于乙也是適用的。這樣,兩個(gè)囚徒在“精心推理”之后都采取了坦白策略,結(jié)局是兩人都被判5年徒刑。不難看出,這

6、個(gè)推理中似乎帶有某種悖論性的因素;因?yàn)?,如果甲、乙兩個(gè)囚徒都采取沉默策略,則二人都只被判1年徒刑, 顯然它是一個(gè)比二人都入獄5年更好的結(jié)果。然而,甲、 乙兩個(gè)富于“理性計(jì)算”精神的囚徒在“邏輯上正確”的計(jì)算一番之后都采取了坦白策略,獲得了都被判5年徒刑的結(jié)果。這里說(shuō)“邏輯上正確”,是因?yàn)榧缀鸵叶际且罁?jù)以下的推理形式進(jìn)行推理的:(1)P或Q(2)如果P,則R(3)如果Q,則R所以:R顯然,這是一個(gè)正確的邏輯推理形式。需要指出,上述案例中的那些具體數(shù)字究竟是多少,并不具有重要意義,甚至四種可能的結(jié)果組合能否“數(shù)字化”也不具有關(guān)鍵性意義;問(wèn)題的關(guān)鍵是四種可能的結(jié)果組合對(duì)于當(dāng)事人來(lái)說(shuō),其“好”“壞”程

7、度構(gòu)成一個(gè)有序的“序列”。即當(dāng)事人(上述案中的“囚徒”)可在互相比較后將四個(gè)結(jié)果排出他所認(rèn)為的“最好”、“次好”、“第三好”和“最糟”的次序來(lái)。為了把囚徒困境中的“兩難(dilemma)”性甚至“悖論(paradox)”性因素更突出、更尖銳地顯示出來(lái),有人虛構(gòu)了一個(gè)更“典型”的情景1,p.6(按:以下的中文轉(zhuǎn)述,為了便于理解,略有改動(dòng)):假定在前述“案例”中,法庭向兩個(gè)囚犯“宣布”了新的“判決規(guī)則”:如果兩人都坦白認(rèn)罪,將被判為快刀砍頭的死刑;如果兩人都沉默,則兩人將被宣布無(wú)罪釋放并獲賠償1000元;如果一人坦白,一人沉默,則坦白者可獲自由并加10000元獎(jiǎng)賞,而沉默者將被凌遲處死。 在這個(gè)“

8、案例”中,“無(wú)情”而“嚴(yán)格”的邏輯將使兩個(gè)“理性”的囚徒共同選擇坦白策略,從而走上高懸一把快刀的斷頭臺(tái),而不選擇共同沉默從而獲得自由并且還能在皮包中裝上1000元貨幣。難道這竟然會(huì)是“理性人”的“理性”選擇嗎?二、囚徒困境的若干分析和實(shí)例在庫(kù)恩的“范式”理論中,范式的一個(gè)重要含義就是范例??墒牵S多人都只注意了作為“理論框架”和“科學(xué)方法”的范式,而忽略了作為范例的范式。其實(shí),在科學(xué)理論體系中和科學(xué)活動(dòng)中,范例所起的重要作用也是不可低估的。不難看出,囚徒困境正是博奕論中的一個(gè)重要范例。有人可能會(huì)認(rèn)為:囚徒困境只是“象牙之塔”中的理論家虛構(gòu)的一種“思想游戲”,或是一種難得一見(jiàn)的特例。這實(shí)在是一種

9、錯(cuò)覺(jué)。應(yīng)該承認(rèn):囚徒困境最初的確是“象牙之塔”中的“抽象理論思維”的“產(chǎn)物”。如同其他的許多“象牙之塔”中的產(chǎn)物一樣,人們愈來(lái)愈深刻地感覺(jué)到它同“現(xiàn)實(shí)世界”實(shí)際上是存在著密切聯(lián)系的。已經(jīng)發(fā)現(xiàn),在經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)及現(xiàn)實(shí)生活中類似囚徒困境的事例是大量存在的。對(duì)于囚徒困境的原因、條件、性質(zhì)、意義等問(wèn)題,博奕論專家、經(jīng)濟(jì)學(xué)家、政治學(xué)家、社會(huì)學(xué)家、哲學(xué)家、倫理學(xué)家、社會(huì)心理學(xué)家已從許多方面進(jìn)行了大量的研究。有人注意到在囚徒困境的“案例”中兩個(gè)局中人不能互通信是一個(gè)限制性條件,因此他們?cè)O(shè)想這就是造成囚徒困境的“原因”。例如,有人說(shuō):“囚徒的苦惱在于他們不能商量溝通?!?于是, 有人便提出了如下的解決

10、問(wèn)題的途徑:兩個(gè)局中人可以“進(jìn)行通信,然后合作”。反對(duì)者認(rèn)為這是于事無(wú)補(bǔ)、不解決問(wèn)題的?!帮@然,一個(gè)囚徒要保持沉默的意圖不可能引起另一個(gè)囚徒有同樣的意圖如果另一方忽視這個(gè)意圖的話。不準(zhǔn)通信的假定對(duì)于囚徒困境來(lái)說(shuō)不是關(guān)鍵性的??梢栽黾右粋€(gè)通信條件,但這仍然不能造成什么不同,只要假定每個(gè)人對(duì)可能結(jié)果的偏愛(ài)順序與以前相同并且每個(gè)人可以自由地選擇與另一個(gè)人的意圖相反的策略。每個(gè)囚徒都可以對(duì)另一個(gè)囚徒說(shuō):如果你將保持沉默,那么我也將保持沉默;可是,只要每個(gè)囚徒可自由地說(shuō)一套而做另一套,那么困境就沒(méi)有什么變化”?!坝腥艘苍S會(huì)假定可能存在著強(qiáng)迫性協(xié)議條款,比方說(shuō)對(duì)違反協(xié)議進(jìn)行特定的處罰,這就會(huì)改變囚徒的偏好

11、順序。這樣的假定會(huì)改變?cè)械臎Q策問(wèn)題的結(jié)構(gòu)。而我們一直假定每一方只對(duì)造成他有可能獲得的最有利的結(jié)果有興趣,并且他的偏好順序是嚴(yán)格給定的。在這個(gè)假定之下似乎沒(méi)有任何合作協(xié)議能造成什么不同。”(1,pp.910)從上述分析中可以看出,囚徒困境的“要害”不是通信問(wèn)題。有人可能會(huì)認(rèn)為囚徒困境的“要害”在于:每個(gè)局中人只關(guān)心自己的利益而對(duì)他人的利益漠不關(guān)心,為了自利的目的他甚至不惜違背“協(xié)議”。這就是囚徒困境的“要害”。于是,有人提出了相應(yīng)的解決問(wèn)題的答案:不要做一個(gè)利己主義者?!斑@個(gè)回答,至少就其現(xiàn)在的敘述方式而言,由于立足于誤解而陷于失敗。在這個(gè)上下文中利己主義者的最自然的解釋是指那些主要如果不是唯

12、一地只關(guān)心個(gè)人利益的人。因此,只關(guān)心他自己將在監(jiān)獄中關(guān)多長(zhǎng)時(shí)間的囚徒是一個(gè)利己主義者。但是,很清楚,囚徒困境無(wú)須受限于這種意義上的利己主義者??梢詷?gòu)造出一些例子其中的每個(gè)人在其所處的選擇環(huán)境中都與利他主義的。讀者可以回想起,對(duì)于每個(gè)局中人對(duì)結(jié)果之偏好的全部要求只是存在著一定的順序。在此順序背后的動(dòng)因可以是利己的,或是利他的,或者是兼有二者?!北确秸f(shuō),我們可以很簡(jiǎn)便地構(gòu)造出另一個(gè)例子:情景和條件與本文開(kāi)頭所舉的例子皆相同,只是假定兩個(gè)囚徒在進(jìn)行決策選擇時(shí),決定偏好順序的標(biāo)準(zhǔn)不是完全與唯一的利己標(biāo)準(zhǔn),而是完全是唯一的利他標(biāo)準(zhǔn),這時(shí)的結(jié)果會(huì)有什么變化嗎?沒(méi)有。所謂的囚徒困境在這個(gè)“利他主義者”的“情

13、景”中依然是一個(gè)“困境”。所以,囚徒困境的前提條件是偏好的發(fā)散(divergence)而不是自私自利或?qū)λ说哪魂P(guān)心1,p.10值得特別注意的是,我國(guó)學(xué)者在介紹、解釋和評(píng)論囚徒困境時(shí)許多人都特別強(qiáng)調(diào)囚徒困境凸現(xiàn)了個(gè)人理性和集體理性的矛盾。例如,張維迎說(shuō):“囚徒困境反映了一個(gè)很深刻的問(wèn)題,這就是個(gè)人理性與集體理性的矛盾?!保?,p.123)鄭也夫說(shuō):“理性的個(gè)人,加在一起成了非理性的社會(huì)?!?茅于軾說(shuō):“囚犯難題具有極深刻的含義, 它解釋了何以短視地以利益為目標(biāo)將導(dǎo)致對(duì)大家都不利的結(jié)局。 ”4李子江使用了專業(yè)性的學(xué)術(shù)用語(yǔ),指出在囚徒困境中,“雙方都會(huì)選擇對(duì)自己收益最大,風(fēng)險(xiǎn)最小的策略,從而導(dǎo)致

14、了對(duì)策的穩(wěn)定均衡點(diǎn)的出現(xiàn)?!边@就是所謂納什均衡點(diǎn)(其定義為:假使其他參加者不變換策略,任何單個(gè)參加者不能以單方面變換策略來(lái)提高他的支付)。但這一納什均衡點(diǎn)卻不是全局的最優(yōu)解(帕累托最優(yōu))?!庇纱丝梢?jiàn),雙方都采取最優(yōu)策略時(shí),整個(gè)對(duì)策系統(tǒng)卻處于較劣的品質(zhì)?!? 這些專門術(shù)語(yǔ)的含義換成“易懂”的術(shù)語(yǔ)也是認(rèn)為囚徒困境揭示“個(gè)人理性與集體理性之間存在著一種內(nèi)在的矛盾”。我國(guó)學(xué)者已舉出了許多為我國(guó)讀者所熟悉的屬于囚徒困境的事例。在人民公社制度下,“如大家都好好干,糧食打得多些,大家不是都可以過(guò)得好些嗎?問(wèn)題在于:我好好干,你不好好干,我吃虧,你好好干,我不好好干,我占便宜,于是,納什均衡就是大家都不好好干,都餓肚子?!保?,p.124)在囚徒困境中,兩個(gè)囚徒都選擇了坦白認(rèn)罪策略?!斑@個(gè)結(jié)果與他們是否真的有罪(按:本段為敘述方便,轉(zhuǎn)引時(shí)對(duì)原文略有改動(dòng),但對(duì)原文之原義絕無(wú)修改)無(wú)關(guān),他們即使無(wú)罪,也會(huì)做出承認(rèn)有罪的選擇。文革中坦白從寬、抗拒從嚴(yán)的政策之所以能使一大批人承認(rèn)自己的罪行,其奧妙即在于此?!?此外, 大家常見(jiàn)的公共汽車,大家痛恨的行賄成風(fēng),也都是囚徒困境的“表現(xiàn)”。實(shí)際的現(xiàn)實(shí)生活是復(fù)雜的。人們發(fā)現(xiàn):囚徒困境的“社會(huì)效果”也并不總是負(fù)面效果,在特定條件下,它也可能造成某種對(duì)社會(huì)有益的效果。在經(jīng)濟(jì)學(xué)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論