“囚徒困境”中非納什均衡出現(xiàn)的可能性及其原因分析

上傳人：7*** IP屬地：湖北上傳時(shí)間：2022-02-10 格式：DOC 頁數(shù)：3 大?。?9KB 積分：15 舉報(bào) 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、“囚徒困境”中非納什均衡出現(xiàn)的可能性及其原因分析內(nèi)容包括囚徒困境完全理性概率完全信息整體思維方式困境均衡可能性原因分析摘要：“囚徒困境”博弈是完全信息靜態(tài)博弈的典型例子，被認(rèn)為是上策納什均衡，具有必然性，但在現(xiàn)實(shí)中非納什均衡也同樣出現(xiàn)。本文就“囚徒困境”中非納什均衡出現(xiàn)的問題，對(duì)博弈的前提假設(shè)完全理性、完全信息以及概率進(jìn)行了分析，得出的結(jié)論是：完全理性中的整體思維方式和概率為零的事件的

2、發(fā)生以及完全信息等于一致信念時(shí)引起的不確定性，都可能導(dǎo)致非納什均衡出現(xiàn)，而其出現(xiàn)的可能性則取決于采取整體思維方式的人的比例。; 關(guān)鍵詞：囚徒困境；完全理性；概率；完全信息；整體思維方式; The;Analysis;about;the;Probability;and;Reasons;of;Non-Nash;Equilibrium;in;Prisoners;Dilemma; Abstract:;The;prisoners;dilemma,;which;is;the;representative;example;of;complete;information;static;game,;is;deem

3、ed;to;dominant-strategy;Nash;equilibrium;and;has;the;inevitability,;but;in;fact;non-Nash;equilibrium;also;appears.;To;the;question;of;non-Nash;equilibrium;in;prisoners;dilemma,;this;paper;makes;an;analysis;to;Game;Theorys;hypothesis:;complete;rationality,;complete;information;and;probability,;and;ge

4、ts;a;result:;systems;thinking;style;in;complete;rationality,;the;happen;of;the;event;of;zero;probability,;and;the;uncertainty;that;is;brought;out;when;complete;information;is;concordant;beliefs,;all;can;bring;the;appearance;of;non-Nash;equilibrium,;and;the;probability;of;appearance;is;decided;by;the

5、;proportion;of;men;who;think;in;systems;thinking;style.; Key;Words:;prisoners;dilemma;complete;rationality;probability;complete;information;systems;thinking;style; “囚徒困境”博弈是圖克（Tucker）1950年提出的一個(gè)著名的博弈模型，是完全信息靜態(tài)博弈的典型例子。; 一、;“囚徒困境”博弈及其納什均衡; 囚徒困境博弈的基本情況如下：警察抓住了兩個(gè)合伙犯罪的罪犯，但卻缺乏足夠的證據(jù)指證他們所犯的罪行。如果其中至少有一人供認(rèn)犯罪，就

6、能確認(rèn)罪名成立。為了得到所需的口供，警察將這兩名罪犯分別關(guān)押以防止他們串供或結(jié)成攻守同盟，并給他們同樣的選擇機(jī)會(huì)；如果他們兩人都拒不認(rèn)罪，則他們會(huì)被以較輕的妨礙公務(wù)罪各判1年徒刑；如果兩人中有一人坦白認(rèn)罪，則坦白者從輕認(rèn)罪，立即釋放，而另一人則將重判8年徒刑；如果兩人同時(shí)坦白認(rèn)罪，則他們將被各判5年監(jiān)禁。*; 如果分別用1、5和8;表示罪犯被判刑1年、5年和8年的得益，用0表示罪犯被立即釋放的得益，則兩囚徒的得益矩陣如下：; 囚;徒2; 坦白;不坦白; 囚徒1;坦白;5，5;0，8; 不坦白;8，0;1，1; 在上圖中，“囚徒1”、“囚徒2”分別代表本博弈中的兩個(gè)博弈方，也就是兩個(gè)罪犯；他們各

7、自都有“不坦白”和“坦白”兩種可選擇的策略；因?yàn)檫@兩個(gè)囚徒被隔離開，其中任何一人在選擇策略時(shí)都不可能知道另一人的選擇是什么，因此不管他們決策的時(shí)間是否真正相同，我們都可以把他們的決策看作是同時(shí)做出的。其中矩陣中第一個(gè)數(shù)字代表決策結(jié)果后囚徒1的得益，第二個(gè)數(shù)字代表決策結(jié)果后囚徒2的得益。; 博弈的結(jié)果是：由于這兩個(gè)囚徒之間不能串通，并且各人都追求自己的最大利益而不會(huì)顧及同伙的利益，雙方又都不敢相信或者說指望對(duì)方有合作精神，因此只能實(shí)現(xiàn)對(duì)他們都不理想的結(jié)果（各判5年），并且這個(gè)結(jié)果具有必然性，很難擺脫，因此這個(gè)博弈被稱為“囚徒困境”。1; 二、;非納什均衡出現(xiàn)的可能性及其原因分析; 1、完全理性與

8、非納什均衡; 囚徒困境博弈的一個(gè)假設(shè)是博弈方具有完全理性的行為能力。完全理性來源于學(xué)中的理性人假設(shè)，即博弈方都以個(gè)體利益最大化為目標(biāo)，且有準(zhǔn)確的判斷選擇能力，也不會(huì)“犯錯(cuò)誤”。以個(gè)體利益最大為目標(biāo)被稱為“個(gè)體理性”，有完美的分析判斷能力和不會(huì)犯選擇行為的錯(cuò)誤稱為“完全理性”。具體地說來，完全理性包括追求最大利益的理性意識(shí)、分析推理能力、識(shí)別判斷能力、記憶能力和準(zhǔn)確行為能力等多方面的完美性要求，其中任何一方面不完美就不屬于完全理性。1我們可以看出，這是一個(gè)要求非常嚴(yán)格的假設(shè)。即便如此，完全理性仍在一個(gè)方面沒有做出規(guī)定（至少是沒有意識(shí)到或明確地規(guī)定出來），就是思維方式，也即是博弈方是以將問題分解的

9、方式來思考問題呢，還是以系統(tǒng)的整體的方式來思考問題的。我引用第五項(xiàng)修煉上的一段話來表達(dá)這兩種思維方式的不同。; 自幼我們就被教導(dǎo)把問題加以分解，把世界拆成片片段段來理解。這顯然能夠使復(fù)雜的問題容易處理，但是無形中，我們卻付出了巨大的代價(jià)全然失掉對(duì)“整體”的連屬感，也不了解自身行動(dòng)所帶來的一連串后果。于是，當(dāng)我們想一窺全貌時(shí)，便努力重整心中的片段，試圖拼湊所有的碎片。但是就如學(xué)家鮑姆（David;Bohm）所說的，這只是白費(fèi)力氣；就像試著重新組合一面破鏡子的碎片，想要看清鏡中的真像。經(jīng)過一陣子努力，我們甚至干脆放棄一窺全貌的意圖。; 現(xiàn)在我們以系統(tǒng)的整體的思維方式來重新分析囚徒困境博弈。警察的目

10、的是獲得證據(jù)，以使囚徒獲得應(yīng)有的懲罰，囚徒的目的是“獲取”最少的懲罰。雙方的這種矛盾使得囚徒有串通的傾向，為了離間兩個(gè)囚徒，警察確立了模型中的規(guī)則（且不論這些規(guī)則和設(shè)置合不合理）。對(duì)每個(gè)囚徒來說，要想達(dá)到自身的目的，而不考慮整個(gè)模型設(shè)置的讓雙方都坦白的目的，很顯然是不行的。囚徒該如何選擇呢？答案是不坦白。如果囚徒看出了該模型的目的，若選擇坦白，以自推人，對(duì)方也會(huì)選擇坦白，必然落入警察的圈套，此所謂鷸蚌相爭(zhēng)，漁翁得利。當(dāng)兩博弈方都用整體思維來考慮這個(gè)問題時(shí)，相互配合;是其最好的選擇，因?yàn)樵谕耆硇约僭O(shè)前提下，自己選擇坦白而另一方選擇不坦白，這種機(jī)會(huì)是沒有的，這種饒幸也是取不得的，剩余的只有要不都

11、坦白，要不都不坦白，所以相互配合是其最好的選擇，結(jié)果一定是不坦白。此所謂兄弟鬩于墻，外御其侮，這也是空城記能夠唱成的原因。如果任何博弈方不是采用系統(tǒng)的思維方式來思慮這個(gè)問題的，因?yàn)橐环接梅纸獾乃季S方式來思考囚徒困境，他會(huì)選擇坦白，那么另一方不管用什么思維方式來思考這個(gè)問題，選擇坦白都是最好的，因此其結(jié)果必然是都坦白。; 為什么分解思維方式在這兒會(huì)犯錯(cuò)誤呢？問題在于1+12。1+12大家不會(huì)有任何的質(zhì)疑，依照，N個(gè)1相加等于N，大家也一樣不會(huì)有疑問。舉個(gè)例子，把一塊磚放在另一塊磚的上面，這是大家很容易接受也很容易辦到的事情，但萬丈高樓卻不是一塊磚一塊磚地蓋起來的，大家首先需要的是整體設(shè)計(jì)。我們回來說1+12，在方面這是沒有質(zhì)疑的，但把它運(yùn)用到經(jīng)濟(jì)學(xué)領(lǐng)域，其邏輯是否就一定像在數(shù)學(xué)領(lǐng)域一樣可靠？這其實(shí)要回到斯密，斯密當(dāng)年做出理性人的假設(shè)，從理論建設(shè)的角度來說，他是為了他的觀點(diǎn)的成立。依靠這個(gè)大家從不質(zhì)疑的邏輯，他完成了他的看不見的手，但是失靈出現(xiàn)了，問題的原因一定程度上是由于這個(gè)邏輯的可靠性。從概率方面來說，符合邏輯是一種可能，不符合邏輯也是一種可能，擲篩子（隨機(jī)）同樣是一種可能。斯密的理性人假設(shè)是為了把符合邏輯變成唯一的可能。但當(dāng)符合邏輯變成唯一的可能后，市場(chǎng)失靈仍然會(huì)出現(xiàn)。在第五項(xiàng)修煉上有一個(gè)啤酒的實(shí)驗(yàn)例

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

“囚徒困境”中非納什均衡出現(xiàn)的可能性及其原因分析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

“囚徒困境”中非納什均衡出現(xiàn)的可能性及其原因分析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔