“囚徒困境”中非納什均衡出現(xiàn)的可能性及其原因分析_第1頁
“囚徒困境”中非納什均衡出現(xiàn)的可能性及其原因分析_第2頁
“囚徒困境”中非納什均衡出現(xiàn)的可能性及其原因分析_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、“囚徒困境”中非納什均衡出現(xiàn)的可能性及其原因分析         內(nèi)容包括 囚徒困境 完全理性 概率 完全信息 整體思維方式 困境 均衡 可能性 原因分析        摘要:“囚徒困境”博弈是完全信息靜態(tài)博弈的典型例子,被認(rèn)為是上策納什均衡,具有必然性,但在現(xiàn)實中非納什均衡也同樣出現(xiàn)。本文就“囚徒困境”中非納什均衡出現(xiàn)的問題,對博弈的前提假設(shè)完全理性、完全信息以及概率進(jìn)行了分析,得出的結(jié)論是:完全理性中的整體思維方式和概率為零的事件的

2、發(fā)生以及完全信息等于一致信念時引起的不確定性,都可能導(dǎo)致非納什均衡出現(xiàn),而其出現(xiàn)的可能性則取決于采取整體思維方式的人的比例。; 關(guān)鍵詞:囚徒困境;完全理性;概率;完全信息;整體思維方式; The;Analysis;about;the;Probability;and;Reasons;of;Non-Nash;Equilibrium;in;Prisoners;Dilemma; Abstract:;The;prisoners;dilemma,;which;is;the;representative;example;of;complete;information;static;game,;is;deem

3、ed;to;dominant-strategy;Nash;equilibrium;and;has;the;inevitability,;but;in;fact;non-Nash;equilibrium;also;appears.;To;the;question;of;non-Nash;equilibrium;in;prisoners;dilemma,;this;paper;makes;an;analysis;to;Game;Theorys;hypothesis:;complete;rationality,;complete;information;and;probability,;and;ge

4、ts;a;result:;systems;thinking;style;in;complete;rationality,;the;happen;of;the;event;of;zero;probability,;and;the;uncertainty;that;is;brought;out;when;complete;information;is;concordant;beliefs,;all;can;bring;the;appearance;of;non-Nash;equilibrium,;and;the;probability;of;appearance;is;decided;by;the

5、;proportion;of;men;who;think;in;systems;thinking;style.; Key;Words:;prisoners;dilemma;complete;rationality;probability;complete;information;systems;thinking;style; “囚徒困境”博弈是圖克(Tucker)1950年提出的一個著名的博弈模型,是完全信息靜態(tài)博弈的典型例子。; 一、;“囚徒困境”博弈及其納什均衡; 囚徒困境博弈的基本情況如下:警察抓住了兩個合伙犯罪的罪犯,但卻缺乏足夠的證據(jù)指證他們所犯的罪行。如果其中至少有一人供認(rèn)犯罪,就

6、能確認(rèn)罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押以防止他們串供或結(jié)成攻守同盟,并給他們同樣的選擇機會;如果他們兩人都拒不認(rèn)罪,則他們會被以較輕的妨礙公務(wù)罪各判1年徒刑;如果兩人中有一人坦白認(rèn)罪,則坦白者從輕認(rèn)罪,立即釋放,而另一人則將重判8年徒刑;如果兩人同時坦白認(rèn)罪,則他們將被各判5年監(jiān)禁。*; 如果分別用1、5和8;表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即釋放的得益,則兩囚徒的得益矩陣如下:; 囚;徒2; 坦白;不坦白; 囚徒1;坦白;5,5;0,8; 不坦白;8,0;1,1; 在上圖中,“囚徒1”、“囚徒2”分別代表本博弈中的兩個博弈方,也就是兩個罪犯;他們各

7、自都有“不坦白”和“坦白”兩種可選擇的策略;因為這兩個囚徒被隔離開,其中任何一人在選擇策略時都不可能知道另一人的選擇是什么,因此不管他們決策的時間是否真正相同,我們都可以把他們的決策看作是同時做出的。其中矩陣中第一個數(shù)字代表決策結(jié)果后囚徒1的得益,第二個數(shù)字代表決策結(jié)果后囚徒2的得益。; 博弈的結(jié)果是:由于這兩個囚徒之間不能串通,并且各人都追求自己的最大利益而不會顧及同伙的利益,雙方又都不敢相信或者說指望對方有合作精神,因此只能實現(xiàn)對他們都不理想的結(jié)果(各判5年),并且這個結(jié)果具有必然性,很難擺脫,因此這個博弈被稱為“囚徒困境”。1; 二、;非納什均衡出現(xiàn)的可能性及其原因分析; 1、完全理性與

8、非納什均衡; 囚徒困境博弈的一個假設(shè)是博弈方具有完全理性的行為能力。完全理性來源于學(xué)中的理性人假設(shè),即博弈方都以個體利益最大化為目標(biāo),且有準(zhǔn)確的判斷選擇能力,也不會“犯錯誤”。以個體利益最大為目標(biāo)被稱為“個體理性”,有完美的分析判斷能力和不會犯選擇行為的錯誤稱為“完全理性”。具體地說來,完全理性包括追求最大利益的理性意識、分析推理能力、識別判斷能力、記憶能力和準(zhǔn)確行為能力等多方面的完美性要求,其中任何一方面不完美就不屬于完全理性。1我們可以看出,這是一個要求非常嚴(yán)格的假設(shè)。即便如此,完全理性仍在一個方面沒有做出規(guī)定(至少是沒有意識到或明確地規(guī)定出來),就是思維方式,也即是博弈方是以將問題分解的

9、方式來思考問題呢,還是以系統(tǒng)的整體的方式來思考問題的。我引用第五項修煉上的一段話來表達(dá)這兩種思維方式的不同。; 自幼我們就被教導(dǎo)把問題加以分解,把世界拆成片片段段來理解。這顯然能夠使復(fù)雜的問題容易處理,但是無形中,我們卻付出了巨大的代價全然失掉對“整體”的連屬感,也不了解自身行動所帶來的一連串后果。于是,當(dāng)我們想一窺全貌時,便努力重整心中的片段,試圖拼湊所有的碎片。但是就如學(xué)家鮑姆(David;Bohm)所說的,這只是白費力氣;就像試著重新組合一面破鏡子的碎片,想要看清鏡中的真像。經(jīng)過一陣子努力,我們甚至干脆放棄一窺全貌的意圖。; 現(xiàn)在我們以系統(tǒng)的整體的思維方式來重新分析囚徒困境博弈。警察的目

10、的是獲得證據(jù),以使囚徒獲得應(yīng)有的懲罰,囚徒的目的是“獲取”最少的懲罰。雙方的這種矛盾使得囚徒有串通的傾向,為了離間兩個囚徒,警察確立了模型中的規(guī)則(且不論這些規(guī)則和設(shè)置合不合理)。對每個囚徒來說,要想達(dá)到自身的目的,而不考慮整個模型設(shè)置的讓雙方都坦白的目的,很顯然是不行的。囚徒該如何選擇呢?答案是不坦白。如果囚徒看出了該模型的目的,若選擇坦白,以自推人,對方也會選擇坦白,必然落入警察的圈套,此所謂鷸蚌相爭,漁翁得利。當(dāng)兩博弈方都用整體思維來考慮這個問題時,相互配合;是其最好的選擇,因為在完全理性假設(shè)前提下,自己選擇坦白而另一方選擇不坦白,這種機會是沒有的,這種饒幸也是取不得的,剩余的只有要不都

11、坦白,要不都不坦白,所以相互配合是其最好的選擇,結(jié)果一定是不坦白。此所謂兄弟鬩于墻,外御其侮,這也是空城記能夠唱成的原因。如果任何博弈方不是采用系統(tǒng)的思維方式來思慮這個問題的,因為一方用分解的思維方式來思考囚徒困境,他會選擇坦白,那么另一方不管用什么思維方式來思考這個問題,選擇坦白都是最好的,因此其結(jié)果必然是都坦白。; 為什么分解思維方式在這兒會犯錯誤呢?問題在于1+12。1+12大家不會有任何的質(zhì)疑,依照,N個1相加等于N,大家也一樣不會有疑問。舉個例子,把一塊磚放在另一塊磚的上面,這是大家很容易接受也很容易辦到的事情,但萬丈高樓卻不是一塊磚一塊磚地蓋起來的,大家首先需要的是整體設(shè)計。我們回來說1+12,在方面這是沒有質(zhì)疑的,但把它運用到經(jīng)濟學(xué)領(lǐng)域,其邏輯是否就一定像在數(shù)學(xué)領(lǐng)域一樣可靠?這其實要回到斯密,斯密當(dāng)年做出理性人的假設(shè),從理論建設(shè)的角度來說,他是為了他的觀點的成立。依靠這個大家從不質(zhì)疑的邏輯,他完成了他的看不見的手,但是失靈出現(xiàn)了,問題的原因一定程度上是由于這個邏輯的可靠性。從概率方面來說,符合邏輯是一種可能,不符合邏輯也是一種可能,擲篩子(隨機)同樣是一種可能。斯密的理性人假設(shè)是為了把符合邏輯變成唯一的可能。但當(dāng)符合邏輯變成唯一的可能后,市場失靈仍然會出現(xiàn)。在第五項修煉上有一個啤酒的實驗例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論