下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、“囚徒困境”博弈是圖克( Tucker) 1950年提出的一個著名的博弈模型,是完全信息靜態(tài)博弈的典型例子。一、 基本模型囚徒困境博弈的基本情況如下:警察抓住了兩個合伙犯罪的罪犯,但卻缺乏足夠的證據(jù)指證他們所犯的罪行。如果其中至少有一人供認(rèn)犯罪,就能確認(rèn)罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押以防止他們串供或結(jié)成攻守同盟,并給他們同樣的選擇機會;如果他們兩人都拒不認(rèn)罪,則他們會被以較輕的妨礙公務(wù)罪各判 1 年徒刑;如果兩人中有一人坦白認(rèn)罪,則坦白者從輕認(rèn)罪,立即釋放,而另一人則將重判 8 年徒刑;如果兩人同時坦白認(rèn)罪,則他們將被各判 5 年監(jiān)禁。如果分別用 1、 5 和 8 表示
2、罪犯被判刑 1 年、 5 年和 8 年的得益,用 0 表示罪犯被立即釋放的得益,則兩囚徒的得益矩陣如下:囚徒2坦白 不坦白囚徒1坦白 5, 5 0, 8不坦白 8, 0 1, 1在上圖中,“囚徒1 ”、“囚徒2”分別代表本博弈中的兩個博弈方,也就是兩個罪犯;他們各自都有“不坦白”和“坦白”兩種可選擇的策略;因為這兩個囚徒被隔離開,其中任何一人在選擇策略時都不可能知道另一人的選擇是什么,因此不管他們決策的時間是否真正相同,我們都可以把他們的決策看作是同時做出的。其中矩陣中第一個數(shù)字代表決策結(jié)果后囚徒1 的得益,第二個數(shù)字代表決策結(jié)果后囚徒2 的得益。博弈的結(jié)果是:由于這兩個囚徒之間不能串通,并且
3、各人都追求自己的最大利益而不會顧及同伙的利益,雙方又都不敢相信或者說指望對方有合作精神,因此只能實現(xiàn)對他們都不理想的結(jié)果(各判 5 年),并且這個結(jié)果具有必然性,很難擺脫,因此這個博弈被稱為“囚徒困境”。 1關(guān)于完全理性的思考囚徒困境博弈的一個假設(shè)是博弈方都是完全理性。完全理性來源于經(jīng)濟學(xué)中的理性人假設(shè),即博弈方都以個體利益最大化為目標(biāo),且有準(zhǔn)確的判斷選擇能力,也不會“犯錯誤”。以個體利益最大為目標(biāo)被稱為“個體理性”,有完美的分析判斷能力和不會犯選擇行為的錯誤稱為“完全理性”。完全理性包括追求最大利益的理性意識、分析推理能力、識別判斷能力、記憶能力和準(zhǔn)確行為能力等多方面的完美性要求,其中任何一
4、方面不完美就不屬于完全理性。 1我們可以看出,這是一個要求非常嚴(yán)格的假設(shè)。即便如此,完全理性仍在一個方面沒有做出規(guī)定(至少是沒有意識到或明確地規(guī)定出來),就是思維方式,也即是博弈方是以將問題分解的方式來思考問題呢,還是以系統(tǒng)的整體的方式來思考問題的。我引用第五項修煉上的一段話來表達(dá)這兩種思維方式的不同。自幼我們就被教導(dǎo)把問題加以分解,把世界拆成片片段段來理解。這顯然能夠使復(fù)雜的問題容易處理,但是無形中,我們卻付出了巨大的代價一一 全然失掉對“整體”的連屬感,也不了解自身行動所帶來的一連串后果。于是,當(dāng)我們想一窺全貌時,便努力重整心中的片段,試圖拼湊所有的碎片。但是就如物理學(xué)家鮑姆(DavidB
5、ohn)所說的,這只是白費力氣;就像試著重新組合一面破鏡子的碎片,想要看清鏡中的真像。經(jīng)過一陣子努力,我們甚至干脆放棄一窺全貌的意圖?,F(xiàn)在我們以系統(tǒng)的整體的思維方式來重新分析囚徒困境博弈。警察的目的是獲得證據(jù),以使囚徒獲得應(yīng)有的懲罰,囚徒的目的是“獲取”最少的懲罰。雙方的這種矛盾使得囚徒有串通的傾向,為了離間兩個囚徒,警察確立了模型中的規(guī)則(且不論這些規(guī)則和設(shè)置合不合理)。對每個囚徒來說,要想達(dá)到自身的目的,而不考慮整個模型設(shè)置的目的,很顯然是不行的。囚徒該如何選擇呢?答案是不坦白。如果囚徒看出了該模型的目的,若選擇坦白,以自推人,對方也會選擇坦白,必然落入警察的圈套,此所謂鷸蚌相爭,漁翁得利
6、。當(dāng)兩博弈方都用系統(tǒng)思維來考慮這個問題時,相互配合1 是其最好的選擇,因為在完全理性假設(shè)前提下,自己選擇坦白而另一方選擇不坦白,這種機會是沒有的,這種饒幸心理也是取不得的,剩余的只有要不都坦白,要不都不坦白,所以相互配合是其最好的選擇,結(jié)果一定是不坦白。此所謂兄弟鬩于墻,外御其侮,這也是空城記能夠唱成的原因。如果任何博弈方不是采用系統(tǒng)的思維方式來思慮這個問題的,因為一方用分解的思維方式來思考囚徒困境,他會選擇坦白,那么另一方不管用什么思維方式來思考這個問題,選擇坦白都是最好的,因此其結(jié)果必然是都坦白。三、關(guān)于概率的思考從概率上來說,都坦白的概率上是非常大的,可能很接近1 或者等于1。但概率沒有
7、表示出事件到底是怎么樣發(fā)生的,它只表示了發(fā)生的可能。概率等于 1 代表的是事件發(fā)生的可能性是100%,而不是事件發(fā)生了;同樣,概率為0 代表的是事件發(fā)生的可能性為0,但這不能就此說事件不會發(fā)生了。例如,我們擲飛鏢,從理論上講,對于圓盤上每一點來說概率都為 0,但只要我們把飛鏢擲到了圓盤上,對于圓盤上的被擲到的那一點來說,被擲到的概率為 0,但它還是被擲到了,事件還是發(fā)生了。這有點像紅軍的爬雪山過草地,在蔣介石看來,并且從當(dāng)時的歷史和實際來看,紅軍的爬過雪山走過草地的可能性為 0 ,但正是這個0 的概率,使中國的歷史走到了今天。反過來,我們也可以說概率等于 1 的事件不一定就發(fā)生。在概率論中,隨
8、機變量分為離散型隨機變量和連續(xù)型隨機變量兩種。對于離散型隨機變量,由于其對概率為 0 的可能值不會包括在內(nèi),這使我們習(xí)慣性地把概率為 0 的可能值視為不會發(fā)生。也正是由于此,我們無法找到概率為 0 的離散型隨機變量,也就無法證明它會發(fā)生。對于任意的連續(xù)型隨機變量 ,對于任何常數(shù)和 ( ), 。對于隨機變量的取值范圍內(nèi)的任何一點來說,其概率為 ,顯然為 0;對于某一事件來說,其發(fā)生的值假定為 ,那么,我們得出在概率為 0 的 點事件發(fā)生 了。 在大家都認(rèn)為都坦白的概率等于 1 時,其實其前提是大家都是以分解的思維方式來考慮問題的?,F(xiàn)在我們假定在社會中用系統(tǒng)思維方式考慮問題的人占所有社會人的 (
9、),用分解思維方式考慮問題的為 。假定用系統(tǒng)思維方式考慮問題的人相遇時,囚徒困境的結(jié)果是都不坦白。假定一方坦白,另一方不坦白的概率為0。假定兩種不同的思維方式相遇或都用分解思維方式時,結(jié)果都是坦白。那么警察能夠達(dá)到目的的概率為 。在雙方都知道對方是什么樣的思維方式的前提下,一方坦白另一方不坦白的博弈結(jié)果,因為其概率為0,所以不會對我們的概率(統(tǒng)計)結(jié)果有什么明顯的影響。然而就某一次博弈來說,我們無法確定最后的結(jié)果是什么,只能說一切皆有可能發(fā)生。四、 關(guān)于完全信息的思考關(guān)于完全信息,我的問題是完全信息是等于共同知識還是等于一致信念?共同知識指的是“所有參與人知道,所有參與人知道所有參與人知道,所
10、有參與人知道所有參與人知道所有參與人知道”的知識。一致信念是指這種情況,即使所有參與人“共同”享有某種知識,每個參與人也許并不知道其他參與人知道這些知識,或者并不知道其他人知道自己擁有這些知識。2張維迎在博弈論與信息經(jīng)濟學(xué)中關(guān)于完全信息的表述為:完全信息是指自然不首先行動或自然的初始行動被所有參與人準(zhǔn)確觀察到的情況,即沒有事前的不確定性。信息是參與人有關(guān)博弈的知識,特別是有關(guān)“自然”的選擇、其他參與人的特征和行動的知識。謝識予在經(jīng)濟博弈論在的表述為:各博弈方都完全了解其他博弈方各種情況下得益的博弈稱為“完全信息( Complete Information )博弈”。我們可以看出,張維迎認(rèn)為完全
11、信息即沒有事前的不確定性,也就是說完全信息等于共同知識。謝識予認(rèn)為只要各博弈方都完全了解其他博弈方各種情況下得益就是完全信息,可以說他認(rèn)為完全信息等于一致信念。當(dāng)完全信息等于共同知識時,就如上面的分析。但當(dāng)完全信息只等于一致信念時,情況就會變得比較復(fù)雜。在完全信息等于一致信念的情況下,我們假定囚徒困境中的博弈方只知道各博弈方在各種情況下得益,任何一方都不知道另一方知道不知道自己知道這些得益以及以后的情況2。如果我們假定雙方都以對方不知道自己知道這些得益為前提來思考這個博弈,那么情況會怎么樣呢?因為囚徒困境中的均衡是一個上策納什均衡,在分解思維方式下,不管自己還是對方知道不知道這些信息,自己的上
12、策都是坦白,所以在信息方面不用考慮那么多。但在系統(tǒng)思維方式下,如果完全信息僅僅是一致信念,以后的信息就可以說是具有不確定性。在面臨不確定性時,我們的完全理性假設(shè)就不成立,因為不確定性是指決策者根本不知道某一變量有幾個可能的取值,更不知道第一可能值發(fā)生的概率;Knight ( 1921)指出有限理性的根基是所謂的“根本的不確定性”。可以和完全理性并存的是不完全信息或稱風(fēng)險,即決策者知道某一變量所有可能的取值,以及每一值發(fā)生的概率。3因此,完全信息應(yīng)該等于共同知識,否則我們無法分析囚徒困境。通過以上的分析,本文認(rèn)為,即便我們對囚徒困境的前提假設(shè)再增加上以分解思維方式思考和完全信息等于共同知識,在面臨概率的問題時我們?nèi)匀徊荒艽_保囚徒困境一定發(fā)生,要不現(xiàn)實中對犯罪的審問也就非常簡單了。參考文獻(xiàn):謝識予.經(jīng)濟博弈論MD .上海:復(fù)旦大學(xué)出版社,2002.張維迎.博弈論
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 連接坐課程設(shè)計
- 解決現(xiàn)實問題的課程設(shè)計
- 商業(yè)教育中的創(chuàng)新素質(zhì)培養(yǎng)課程設(shè)計
- GB/T 45157-2024安全與韌性社區(qū)韌性組織間信息交互指南
- 二零二五年度地下綜合管廊設(shè)計施工合同3篇
- 二零二五版O2O電子商務(wù)代運營與品牌推廣合同2篇
- 二零二五版醫(yī)療健康行業(yè)第三方擔(dān)保借款服務(wù)協(xié)議2篇
- 二零二五年度石油化工工程轉(zhuǎn)讓合同2篇
- 2024版消防水電分包合同范本
- 2025年度健康醫(yī)療大數(shù)據(jù)應(yīng)用服務(wù)合同樣本2篇
- 垃圾焚燒發(fā)電環(huán)保培訓(xùn)
- 北京市朝陽區(qū)2024-2025學(xué)年高一(上)期末化學(xué)試卷(含答案)
- 中醫(yī)基礎(chǔ)學(xué)考試題(附答案)
- 2025貴州建筑安全員B證考試題庫附答案
- 2024年杭州師范大學(xué)附屬醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 2024-2025學(xué)年八年級歷史上冊期末復(fù)習(xí)課件
- 2025年云南省大理州事業(yè)單位招聘339人歷年高頻重點提升(共500題)附帶答案詳解
- 2024-2025學(xué)年度第一學(xué)期三年級數(shù)學(xué)寒假作業(yè) 有答案
- 大型起重機械現(xiàn)場管理手冊
- 2024年貴州省公務(wù)員錄用考試《行測》真題及答案解析
- 江蘇省南京市聯(lián)合體2024-2025學(xué)年九年級上學(xué)期期中學(xué)情分析化學(xué)試卷(無答案)
評論
0/150
提交評論