第三講 動(dòng)態(tài)博弈與逆向歸納法_第1頁(yè)
第三講 動(dòng)態(tài)博弈與逆向歸納法_第2頁(yè)
第三講 動(dòng)態(tài)博弈與逆向歸納法_第3頁(yè)
第三講 動(dòng)態(tài)博弈與逆向歸納法_第4頁(yè)
第三講 動(dòng)態(tài)博弈與逆向歸納法_第5頁(yè)
已閱讀5頁(yè),還剩74頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 趣味博弈論 楊馭云華南師范大學(xué)南海校區(qū) 第三講 動(dòng)態(tài)博弈與逆向歸納法 動(dòng)態(tài)博弈 博弈的本質(zhì)在于各參與者的決策相互依博弈的本質(zhì)在于各參與者的決策相互依存,這種相互作用或者互動(dòng)通過(guò)兩種方式體存,這種相互作用或者互動(dòng)通過(guò)兩種方式體現(xiàn)出來(lái)。現(xiàn)出來(lái)。 第一種方式:參與者同時(shí)行動(dòng)或者雖非第一種方式:參與者同時(shí)行動(dòng)或者雖非同時(shí)行動(dòng),但后行動(dòng)者并不知道先行動(dòng)者的同時(shí)行動(dòng),但后行動(dòng)者并不知道先行動(dòng)者的選擇。比如石頭、剪刀、布,還有囚徒困境。選擇。比如石頭、剪刀、布,還有囚徒困境。 這一類博弈稱為靜態(tài)博弈。這一類博弈稱為靜態(tài)博弈。 第二種方式:參與者的行動(dòng)有先后順序,第二種方式:參與者的行動(dòng)有先后順序,后行動(dòng)者

2、可以觀察到先行動(dòng)者做了什么選擇,后行動(dòng)者可以觀察到先行動(dòng)者做了什么選擇,先行動(dòng)者的選擇影響后行動(dòng)者的選擇空間。先行動(dòng)者的選擇影響后行動(dòng)者的選擇空間。 此類博弈稱為動(dòng)態(tài)博弈。此類博弈稱為動(dòng)態(tài)博弈。21支旗游戲 美國(guó)哥倫比亞廣播公司的電視真人秀節(jié)美國(guó)哥倫比亞廣播公司的電視真人秀節(jié)目目Survivor (幸存者)中有這樣一個(gè)(幸存者)中有這樣一個(gè)游戲:游戲: 地面插著地面插著21支旗,兩個(gè)人輪流移走這支旗,兩個(gè)人輪流移走這些旗。每個(gè)人在輪到自己時(shí)可以選擇移走些旗。每個(gè)人在輪到自己時(shí)可以選擇移走1支、支、2支或支或3支旗。拿走最后支旗。拿走最后1支旗的人獲勝,支旗的人獲勝,無(wú)論這支旗是最后無(wú)論這支旗是

3、最后1支,還是支,還是2支或支或3支中的支中的一支。一支。 請(qǐng)大家兩兩配對(duì)來(lái)玩這個(gè)游戲,輪流充請(qǐng)大家兩兩配對(duì)來(lái)玩這個(gè)游戲,輪流充當(dāng)先行者。時(shí)間為當(dāng)先行者。時(shí)間為10分鐘。分鐘。 你是跟著感覺(jué)走來(lái)玩這個(gè)游戲嗎?你是跟著感覺(jué)走來(lái)玩這個(gè)游戲嗎? 你是否發(fā)現(xiàn)越玩到后面、剩下的旗越少你是否發(fā)現(xiàn)越玩到后面、剩下的旗越少的時(shí)候就越清晰地知道自己正確的策略是什的時(shí)候就越清晰地知道自己正確的策略是什么?么? 那就讓我們向前展望、倒后推理,即面那就讓我們向前展望、倒后推理,即面向未來(lái),思考現(xiàn)在,站在未來(lái)的立場(chǎng)來(lái)確定向未來(lái),思考現(xiàn)在,站在未來(lái)的立場(chǎng)來(lái)確定現(xiàn)在的最優(yōu)行動(dòng)?,F(xiàn)在的最優(yōu)行動(dòng)。 倒數(shù)第二步,你必須留給對(duì)方倒

4、數(shù)第二步,你必須留給對(duì)方4支旗。支旗。 倒數(shù)第三步,你必須留給對(duì)方倒數(shù)第三步,你必須留給對(duì)方8支旗。支旗。 依此類推,你必須依次給對(duì)方留下依此類推,你必須依次給對(duì)方留下12、16、20支旗來(lái)確保取勝。支旗來(lái)確保取勝。 所以,在這個(gè)游戲中,先行者能確保取所以,在這個(gè)游戲中,先行者能確保取勝。勝。 但如果游戲開(kāi)始時(shí)是但如果游戲開(kāi)始時(shí)是20支旗,那么后支旗,那么后行者能確保取勝行者能確保取勝。n這是一個(gè)典型的完全完美信息動(dòng)態(tài)博弈。這是一個(gè)典型的完全完美信息動(dòng)態(tài)博弈。n完全信息:每個(gè)參與者的策略集合及收益函完全信息:每個(gè)參與者的策略集合及收益函數(shù)均為博弈各方的共同知識(shí)。數(shù)均為博弈各方的共同知識(shí)。 n完

5、美信息:每個(gè)參與者都知道先前行動(dòng)的參完美信息:每個(gè)參與者都知道先前行動(dòng)的參與者采取了什么策略。與者采取了什么策略。n序貫理性:每個(gè)參與者在其每一個(gè)決策時(shí)點(diǎn)序貫理性:每個(gè)參與者在其每一個(gè)決策時(shí)點(diǎn)上都將重新優(yōu)化自己的選擇,并且會(huì)把自己上都將重新優(yōu)化自己的選擇,并且會(huì)把自己將來(lái)會(huì)重新優(yōu)化其選擇這一點(diǎn)也納入當(dāng)前的將來(lái)會(huì)重新優(yōu)化其選擇這一點(diǎn)也納入當(dāng)前的優(yōu)化決策當(dāng)中。優(yōu)化決策當(dāng)中。n在序貫理性下不會(huì)有在序貫理性下不會(huì)有“后悔后悔”出現(xiàn)。出現(xiàn)。n“每個(gè)參與者是序貫理性的每個(gè)參與者是序貫理性的”是博弈的共同是博弈的共同知識(shí)。知識(shí)。序貫理性n逆向歸納法:按與博弈進(jìn)行順序相反的方向逆向歸納法:按與博弈進(jìn)行順序相反

6、的方向逐一找出每個(gè)參與者在其所有決策時(shí)點(diǎn)上的逐一找出每個(gè)參與者在其所有決策時(shí)點(diǎn)上的最優(yōu)策略選擇,直到第一個(gè)決策時(shí)點(diǎn)為止。最優(yōu)策略選擇,直到第一個(gè)決策時(shí)點(diǎn)為止。n“每個(gè)參與者是序貫理性的每個(gè)參與者是序貫理性的”是逆向歸納法是逆向歸納法的基礎(chǔ)。的基礎(chǔ)。逆向歸納法索馬里海盜人力資源部招聘啟事 你忍心蝸居在不到你忍心蝸居在不到10平米的小屋里嗎?你忍平米的小屋里嗎?你忍心看著自己的女友和你奮斗一輩子還供不起一套房心看著自己的女友和你奮斗一輩子還供不起一套房嗎?你忍心看著父母縮衣節(jié)食把僅有的一點(diǎn)養(yǎng)老金嗎?你忍心看著父母縮衣節(jié)食把僅有的一點(diǎn)養(yǎng)老金幫你還房貸嗎?幫你還房貸嗎? 這里才是實(shí)現(xiàn)你夢(mèng)想的地方。加入

7、我們,待遇這里才是實(shí)現(xiàn)你夢(mèng)想的地方。加入我們,待遇從優(yōu),裝備齊全,食宿全免,一條大褲衩,一雙人從優(yōu),裝備齊全,食宿全免,一條大褲衩,一雙人字拖,一把字拖,一把AK47,800美元底薪美元底薪+提成,全天移提成,全天移動(dòng)式海景套房,多勞多得。只要大干一票,在大都動(dòng)式海景套房,多勞多得。只要大干一票,在大都市買樓不再是夢(mèng)想;干兩票,躋身上層社會(huì),直接市買樓不再是夢(mèng)想;干兩票,躋身上層社會(huì),直接與奧巴馬對(duì)話不再是距離。別再猶豫了,給你一片與奧巴馬對(duì)話不再是距離。別再猶豫了,給你一片海域,換你一生奇跡!海域,換你一生奇跡!海盜分金 有有10名海盜搶得了名海盜搶得了100塊金子,并打算瓜分這塊金子,并打

8、算瓜分這些戰(zhàn)利品。這是一些講民主的海盜,也就是遵循少些戰(zhàn)利品。這是一些講民主的海盜,也就是遵循少數(shù)服從多數(shù)原則,他們按照習(xí)慣的方式進(jìn)行分配:數(shù)服從多數(shù)原則,他們按照習(xí)慣的方式進(jìn)行分配:最厲害的一名海盜提出分配方案,然后所有的海盜最厲害的一名海盜提出分配方案,然后所有的海盜包括提出方案本人就此方案進(jìn)行表決。如果半數(shù)以包括提出方案本人就此方案進(jìn)行表決。如果半數(shù)以上(含半數(shù))的海盜贊同這一方案,那么這一方案上(含半數(shù))的海盜贊同這一方案,那么這一方案就獲得通過(guò)并按照這一方案進(jìn)行戰(zhàn)利品的分配;否就獲得通過(guò)并按照這一方案進(jìn)行戰(zhàn)利品的分配;否則,提出方案的海盜將被扔進(jìn)海里喂鯊魚(yú),然后剩則,提出方案的海盜將

9、被扔進(jìn)海里喂鯊魚(yú),然后剩余海盜中最厲害的海盜又重復(fù)上述過(guò)程。余海盜中最厲害的海盜又重復(fù)上述過(guò)程。 假設(shè):沒(méi)有兩名海盜是同等厲害的;這假設(shè):沒(méi)有兩名海盜是同等厲害的;這些金塊不能再分,也不允許幾名海盜共有些金塊不能再分,也不允許幾名海盜共有1塊金子。塊金子。 那么,最厲害的一名海盜應(yīng)該提出什么那么,最厲害的一名海盜應(yīng)該提出什么樣的分配方案呢?樣的分配方案呢? 考慮到分析的便利,這里按照這些海盜考慮到分析的便利,這里按照這些海盜能力的差異給他們編上序號(hào)。最怯懦的海能力的差異給他們編上序號(hào)。最怯懦的海盜為盜為1 1號(hào)海盜,次怯懦的海盜為號(hào)海盜,次怯懦的海盜為2 2號(hào)海盜,號(hào)海盜,依此類推,最厲害的海

10、盜為依此類推,最厲害的海盜為1010號(hào)海盜。號(hào)海盜。 海盜們基于三個(gè)因素來(lái)做決定:首先,海盜們基于三個(gè)因素來(lái)做決定:首先,自己要能存活下來(lái);其次,自己得到的利益自己要能存活下來(lái);其次,自己得到的利益最大化;最后,在所有其它條件相同的情況最大化;最后,在所有其它條件相同的情況下,優(yōu)先選擇把別人扔進(jìn)海里。下,優(yōu)先選擇把別人扔進(jìn)海里。 這些海盜殘酷的分配規(guī)則給人的第一印這些海盜殘酷的分配規(guī)則給人的第一印象是:最厲害的那名海盜是個(gè)多么不幸的人象是:最厲害的那名海盜是個(gè)多么不幸的人?。∫?yàn)樽鳛轭^一個(gè)提出方案的人,僅僅能??!因?yàn)樽鳛轭^一個(gè)提出方案的人,僅僅能活下來(lái)的機(jī)會(huì)都微乎其微:即使他自己一分活下來(lái)的機(jī)

11、會(huì)都微乎其微:即使他自己一分不要,把金子全部送給另外不要,把金子全部送給另外9人,那些人可人,那些人可能也不贊同他的分配方案,那么他只有死路能也不贊同他的分配方案,那么他只有死路一條!一條! 真的是這樣嗎?真的是這樣嗎? 任何一個(gè)海盜想讓自己的方案獲得通過(guò)任何一個(gè)海盜想讓自己的方案獲得通過(guò)的關(guān)鍵是事先考慮清楚的關(guān)鍵是事先考慮清楚“繼承者繼承者”的分配方的分配方案是什么,然后拉攏案是什么,然后拉攏“繼承者繼承者”分配方案中分配方案中最不得意的人們,爭(zhēng)取用最小的代價(jià)獲取最最不得意的人們,爭(zhēng)取用最小的代價(jià)獲取最大收益。大收益。 因此,推理過(guò)程應(yīng)該是從后向前,因?yàn)橐虼耍评磉^(guò)程應(yīng)該是從后向前,因?yàn)樵酵?/p>

12、后策略越容易看清。越往后策略越容易看清。 分析的出發(fā)點(diǎn)應(yīng)該是博弈進(jìn)行到只剩兩分析的出發(fā)點(diǎn)應(yīng)該是博弈進(jìn)行到只剩兩名海盜,即名海盜,即1號(hào)和號(hào)和2號(hào)的時(shí)候。這時(shí)最厲害的號(hào)的時(shí)候。這時(shí)最厲害的海盜是海盜是2號(hào),而他的最佳分配方案一目了然:號(hào),而他的最佳分配方案一目了然:100塊金子全歸他一人所有,塊金子全歸他一人所有,1號(hào)海盜什么號(hào)海盜什么也得不到。也得不到。 為什么呢?為什么呢? 現(xiàn)在加上現(xiàn)在加上3號(hào)海盜。號(hào)海盜。 1號(hào)海盜知道:如果號(hào)海盜知道:如果3號(hào)的方案被否決,號(hào)的方案被否決,那么最后只剩兩個(gè)海盜,而那么最后只剩兩個(gè)海盜,而1號(hào)將肯定一無(wú)號(hào)將肯定一無(wú)所獲;另外,所獲;另外,3號(hào)也明白號(hào)也明白

13、1號(hào)了解形勢(shì)。因此,號(hào)了解形勢(shì)。因此,只要只要3號(hào)的分配方案給號(hào)的分配方案給1號(hào)一點(diǎn)兒甜頭使他不號(hào)一點(diǎn)兒甜頭使他不至于空手而歸,那么不論至于空手而歸,那么不論3號(hào)提出什么樣的號(hào)提出什么樣的分配方案,分配方案,1號(hào)都將投贊成票,因此號(hào)都將投贊成票,因此3號(hào)需要號(hào)需要分出盡可能少的一點(diǎn)兒金子來(lái)收買分出盡可能少的一點(diǎn)兒金子來(lái)收買1號(hào)海盜。號(hào)海盜。 那么,那么,3號(hào)海盜會(huì)提出什么樣的分配方號(hào)海盜會(huì)提出什么樣的分配方案呢?案呢? 答案是:答案是:3號(hào)海盜分得號(hào)海盜分得99塊金子,塊金子,2號(hào)號(hào)海盜一無(wú)所獲,海盜一無(wú)所獲,1號(hào)海盜分得號(hào)海盜分得1塊金子。塊金子。 4號(hào)海盜的策略也差不多。他需要有半號(hào)海盜的

14、策略也差不多。他需要有半數(shù)以上的支持票,因此同數(shù)以上的支持票,因此同3號(hào)一樣也需要再號(hào)一樣也需要再找一人做同謀。他可以給同謀的最低賄賂是找一人做同謀。他可以給同謀的最低賄賂是1塊金子,在這里,他可以用這塊金子來(lái)收塊金子,在這里,他可以用這塊金子來(lái)收買買2號(hào)海盜。因?yàn)槿绻?hào)海盜。因?yàn)槿绻?號(hào)被否決而號(hào)被否決而3號(hào)得以號(hào)得以通過(guò),則通過(guò),則2號(hào)將一無(wú)所獲。號(hào)將一無(wú)所獲。 因此,因此,4號(hào)的分配方案就是:號(hào)的分配方案就是:99塊金子塊金子歸自己,歸自己,2號(hào)得號(hào)得1塊金子,塊金子,1號(hào)和號(hào)和3號(hào)什么也號(hào)什么也得不到。得不到。 5號(hào)海盜的策略略有不同。他需要收買號(hào)海盜的策略略有不同。他需要收買另外兩名

15、海盜,因此至少得用兩塊金子來(lái)賄另外兩名海盜,因此至少得用兩塊金子來(lái)賄賂才能使自己的方案得到采納。他的分配方賂才能使自己的方案得到采納。他的分配方案應(yīng)該是:案應(yīng)該是: 98塊金子歸自己,塊金子歸自己,1塊金子給塊金子給3號(hào),號(hào),1塊金子給塊金子給1號(hào)。號(hào)。 這一分析過(guò)程可以按照上述思路繼續(xù)進(jìn)這一分析過(guò)程可以按照上述思路繼續(xù)進(jìn)行下去。每個(gè)分配方案都是唯一確定的,它行下去。每個(gè)分配方案都是唯一確定的,它可以讓提出這個(gè)方案的海盜獲得盡可能多的可以讓提出這個(gè)方案的海盜獲得盡可能多的金子,同時(shí)保證該方案肯定能獲得通過(guò)。金子,同時(shí)保證該方案肯定能獲得通過(guò)。 10號(hào)海盜提出的方案將是:號(hào)海盜提出的方案將是:9

16、6塊金子塊金子歸自己所有,其他編號(hào)為偶數(shù)的海盜各得歸自己所有,其他編號(hào)為偶數(shù)的海盜各得1塊金子,而編號(hào)為奇數(shù)的海盜什么也得不塊金子,而編號(hào)為奇數(shù)的海盜什么也得不到。到。 如果海盜的人數(shù)變成了如果海盜的人數(shù)變成了100人,金子仍人,金子仍然是然是100塊。那么,最厲害的海盜,也就是塊。那么,最厲害的海盜,也就是編號(hào)編號(hào)100的海盜,他的方案應(yīng)該是什么呢?的海盜,他的方案應(yīng)該是什么呢? 100號(hào)海盜提出的方案將是:號(hào)海盜提出的方案將是:51塊金子塊金子歸自己所有,其他編號(hào)為偶數(shù)的海盜各得歸自己所有,其他編號(hào)為偶數(shù)的海盜各得1塊金子,而編號(hào)為奇數(shù)的海盜什么也得不到。塊金子,而編號(hào)為奇數(shù)的海盜什么也得

17、不到。 如果海盜的人數(shù)變成了如果海盜的人數(shù)變成了200人,金子仍人,金子仍然是然是100塊。那么,最厲害的海盜,也就是塊。那么,最厲害的海盜,也就是編號(hào)編號(hào)200的海盜,他的方案應(yīng)該是什么呢?的海盜,他的方案應(yīng)該是什么呢? 所有偶數(shù)號(hào)的海盜將各得所有偶數(shù)號(hào)的海盜將各得1塊金子,而所塊金子,而所有奇數(shù)號(hào)的海盜將一無(wú)所獲。有奇數(shù)號(hào)的海盜將一無(wú)所獲。 如果海盜人數(shù)為如果海盜人數(shù)為201201人呢?人呢? 201201號(hào)海盜的分配方案是:給號(hào)海盜的分配方案是:給1 1到到199199號(hào)號(hào)的所有奇數(shù)號(hào)海盜每人一塊金子,自己則一的所有奇數(shù)號(hào)海盜每人一塊金子,自己則一塊也不要。雖然分不到金子,至少保證了自塊

18、也不要。雖然分不到金子,至少保證了自己不會(huì)被扔進(jìn)海里喂鯊魚(yú)。己不會(huì)被扔進(jìn)海里喂鯊魚(yú)。 如果海盜人數(shù)為如果海盜人數(shù)為202202人呢?人呢? 202202號(hào)海盜同樣別無(wú)選擇,只能號(hào)海盜同樣別無(wú)選擇,只能1 1塊金子塊金子都不要了,他必須把這都不要了,他必須把這100100塊金子全部用來(lái)塊金子全部用來(lái)收買收買100100名海盜,而且這名海盜,而且這100100名海盜還必須是名海盜還必須是那些按照那些按照201201號(hào)方案將一無(wú)所獲的人。由于號(hào)方案將一無(wú)所獲的人。由于這樣的海盜有這樣的海盜有101101名,因此名,因此202202號(hào)的方案將不號(hào)的方案將不再是唯一的,因?yàn)橘V賂方案有再是唯一的,因?yàn)橘V賂

19、方案有101101種。種。 如果海盜人數(shù)為如果海盜人數(shù)為203203人呢?人呢? 203203號(hào)海盜必須獲得號(hào)海盜必須獲得102102張贊成票,但他張贊成票,但他顯然沒(méi)有足夠的金子去收買顯然沒(méi)有足夠的金子去收買101101名同伙。因名同伙。因此,無(wú)論提出什么樣的分配方案,他都注定此,無(wú)論提出什么樣的分配方案,他都注定會(huì)被扔進(jìn)大海喂鯊魚(yú)。會(huì)被扔進(jìn)大海喂鯊魚(yú)。 悲催??!悲催??! 如果海盜人數(shù)為如果海盜人數(shù)為204204人呢?人呢? 204204號(hào)海盜知道,號(hào)海盜知道,203203號(hào)為了能保住性命,就必號(hào)為了能保住性命,就必須避免由他自己來(lái)提出分配方案這樣一種局面,因須避免由他自己來(lái)提出分配方案這樣

20、一種局面,因此不管此不管204204號(hào)提出什么樣的方案,號(hào)提出什么樣的方案,203203號(hào)都一定會(huì)投號(hào)都一定會(huì)投贊成票。這樣,贊成票。這樣,204204號(hào)海盜總算可以揀到一條命:號(hào)海盜總算可以揀到一條命:他可以得到他自己的他可以得到他自己的1 1票、票、203203號(hào)的號(hào)的1 1票以及另外票以及另外100100名被收買的海盜的贊成票,剛好達(dá)到保命所需的一名被收買的海盜的贊成票,剛好達(dá)到保命所需的一半票數(shù)。獲得金子的海盜,就是根據(jù)半票數(shù)。獲得金子的海盜,就是根據(jù)202202號(hào)方案肯號(hào)方案肯定一無(wú)所獲的那定一無(wú)所獲的那100100名海盜,即名海盜,即1 1到到199199號(hào)的所有奇號(hào)的所有奇數(shù)號(hào)海

21、盜。數(shù)號(hào)海盜。 如果海盜人數(shù)為如果海盜人數(shù)為205205人呢?人呢? 205205號(hào)海盜沒(méi)有那么走運(yùn)了。他不能指號(hào)海盜沒(méi)有那么走運(yùn)了。他不能指望望203203號(hào)和號(hào)和204204號(hào)支持他的方案,因?yàn)槿绻?hào)支持他的方案,因?yàn)槿绻麄兺镀狈磳?duì)們投票反對(duì)205205號(hào)方案,就可以看到號(hào)方案,就可以看到205205號(hào)被號(hào)被扔進(jìn)海里,而他們自己的性命卻仍然能夠保扔進(jìn)海里,而他們自己的性命卻仍然能夠保全。這樣,無(wú)論全。這樣,無(wú)論205205號(hào)海盜提出什么方案都號(hào)海盜提出什么方案都活不了命?;畈涣嗣?。 206號(hào)海盜的命運(yùn)也是這樣。他肯定可號(hào)海盜的命運(yùn)也是這樣。他肯定可以得到以得到205號(hào)的支持,但這不足以

22、救他一命。號(hào)的支持,但這不足以救他一命。 同樣,同樣,207號(hào)海盜需要號(hào)海盜需要104張贊成票,除了他收張贊成票,除了他收買的買的100張贊成票以及他自己的張贊成票以及他自己的1張贊成票之外,他張贊成票之外,他還需還需3張贊成票才能免于一死。他可以獲得張贊成票才能免于一死。他可以獲得205號(hào)和號(hào)和206號(hào)的支持,但還差號(hào)的支持,但還差1張票卻是無(wú)論如何也弄不到張票卻是無(wú)論如何也弄不到了,因此了,因此207號(hào)海盜的命運(yùn)也是被扔進(jìn)大海里。號(hào)海盜的命運(yùn)也是被扔進(jìn)大海里。 可是,可是,208號(hào)海盜卻又時(shí)來(lái)運(yùn)轉(zhuǎn)了。他需要號(hào)海盜卻又時(shí)來(lái)運(yùn)轉(zhuǎn)了。他需要104張贊成票,而張贊成票,而205、206、207都會(huì)

23、支持他,加上他都會(huì)支持他,加上他自己一票及收買的自己一票及收買的100票,他得以過(guò)關(guān)保命。獲得票,他得以過(guò)關(guān)保命。獲得他賄賂的必定屬于那些根據(jù)他賄賂的必定屬于那些根據(jù)204號(hào)方案肯定將一無(wú)號(hào)方案肯定將一無(wú)所獲的人,候選人包括所獲的人,候選人包括2到到200號(hào)中所有偶數(shù)號(hào)的數(shù),號(hào)中所有偶數(shù)號(hào)的數(shù),以及以及201、202、203、204號(hào)。號(hào)。 現(xiàn)在,出現(xiàn)了一條新的并在此之后會(huì)持續(xù)有效現(xiàn)在,出現(xiàn)了一條新的并在此之后會(huì)持續(xù)有效的規(guī)律:那些方案能過(guò)關(guān)的海盜的分配方案全都是的規(guī)律:那些方案能過(guò)關(guān)的海盜的分配方案全都是把金子用來(lái)收買把金子用來(lái)收買100名同伙而自己一點(diǎn)都得不到,名同伙而自己一點(diǎn)都得不到,他

24、們相隔的距離越來(lái)越遠(yuǎn),而在他們之間的海盜則他們相隔的距離越來(lái)越遠(yuǎn),而在他們之間的海盜則無(wú)論提什么樣的方案都會(huì)被扔進(jìn)大海,因此為了保無(wú)論提什么樣的方案都會(huì)被扔進(jìn)大海,因此為了保命,他們必定會(huì)投票支持比他們厲害的海盜提出的命,他們必定會(huì)投票支持比他們厲害的海盜提出的任何分配方案。任何分配方案。 得以避免葬身魚(yú)腹的海盜包括:得以避免葬身魚(yú)腹的海盜包括:201、202、204、208、216、232、264、328、456號(hào),也就是其號(hào)碼等于號(hào),也就是其號(hào)碼等于200加上加上2的某一的某一冪的海盜。冪的海盜。 那么,哪些海盜是獲得賄賂(那么,哪些海盜是獲得賄賂(1塊金子)塊金子)的人呢?的人呢? 分配

25、賄賂的方法不是唯一的,其中一種分配賄賂的方法不是唯一的,其中一種方法是讓方法是讓201號(hào)海盜把賄賂分給號(hào)海盜把賄賂分給1到到199號(hào)號(hào)的所有奇數(shù)編號(hào)的海盜,讓的所有奇數(shù)編號(hào)的海盜,讓202號(hào)分給號(hào)分給2到到200號(hào)的所有偶數(shù)編號(hào)的海盜,然后是讓號(hào)的所有偶數(shù)編號(hào)的海盜,然后是讓204號(hào)賄賂奇數(shù)編號(hào)的海盜,號(hào)賄賂奇數(shù)編號(hào)的海盜,208號(hào)賄賂偶號(hào)賄賂偶數(shù)編號(hào)的海盜,依此類推,也就是輪流賄賂數(shù)編號(hào)的海盜,依此類推,也就是輪流賄賂奇數(shù)編號(hào)和偶數(shù)編號(hào)的海盜。奇數(shù)編號(hào)和偶數(shù)編號(hào)的海盜。 如果表決的規(guī)則是必須超過(guò)半數(shù)贊同時(shí)如果表決的規(guī)則是必須超過(guò)半數(shù)贊同時(shí)才通過(guò)分配方案,假設(shè)是才通過(guò)分配方案,假設(shè)是5名海盜和

26、名海盜和100塊塊金子。金子。5號(hào)海盜應(yīng)該提出什么樣的分配方案號(hào)海盜應(yīng)該提出什么樣的分配方案呢?呢?蜈蚣博弈悖論 悖論,是一種邏輯矛盾,它指這樣一個(gè)悖論,是一種邏輯矛盾,它指這樣一個(gè)命題:由它的真可以推出它的假;相反,由命題:由它的真可以推出它的假;相反,由它的假又可以推出它的真。它的假又可以推出它的真。 理發(fā)師悖論 小城里的理發(fā)師放出豪言:小城里的理發(fā)師放出豪言:“我?guī)颓抑晃規(guī)颓抑粠统抢锼胁蛔约汗文樀娜斯文槑统抢锼胁蛔约汗文樀娜斯文槨薄?理發(fā)師該給自己刮臉嗎?理發(fā)師該給自己刮臉嗎? 蜈蚣博弈是由羅森塞爾(蜈蚣博弈是由羅森塞爾(Rosenthal )在在1981年提出的一個(gè)完全完美信息條件

27、下的年提出的一個(gè)完全完美信息條件下的動(dòng)態(tài)博弈問(wèn)題。由于這個(gè)博弈的擴(kuò)展形式很動(dòng)態(tài)博弈問(wèn)題。由于這個(gè)博弈的擴(kuò)展形式很像一條蜈蚣,因此被稱為像一條蜈蚣,因此被稱為“蜈蚣博弈蜈蚣博弈”。 兩個(gè)參與者兩個(gè)參與者A、B輪流進(jìn)行策略選擇,可供選擇的策輪流進(jìn)行策略選擇,可供選擇的策略有略有“合作合作”和和“不合作不合作”兩種。當(dāng)出現(xiàn)兩種。當(dāng)出現(xiàn)“不合作不合作”時(shí),時(shí),博弈結(jié)束。博弈結(jié)束。 規(guī)則是:規(guī)則是:A、B兩次決策為一組,進(jìn)行至第兩次決策為一組,進(jìn)行至第n組時(shí),若組時(shí),若A決策結(jié)束,則決策結(jié)束,則A、B的收益都是的收益都是n;若;若B決策結(jié)束,則決策結(jié)束,則A得得n-1,B得得n+2。 假定假定A先選,然

28、后是先選,然后是B,接著是,接著是A,如此交替進(jìn)行。另,如此交替進(jìn)行。另外,外,A、B之間的博弈次數(shù)為有限次,比如之間的博弈次數(shù)為有限次,比如198次。若雙次。若雙方始終選擇方始終選擇“合作合作”,則最后,則最后A、B的收益都是的收益都是100。 A、B該如何進(jìn)行策略選擇呢?該如何進(jìn)行策略選擇呢? 當(dāng)當(dāng)A決策時(shí),他考慮博弈的最后一步即第決策時(shí),他考慮博弈的最后一步即第198步。步。B在在“合作合作”和和“不合作不合作”之間作出選之間作出選擇時(shí),因擇時(shí),因“合作合作”給給B帶來(lái)帶來(lái)100的收益,而的收益,而“不不合作合作”帶來(lái)帶來(lái)101的收益,根據(jù)的收益,根據(jù)“理性人理性人”的假定,的假定,B會(huì)

29、選擇會(huì)選擇“不合作不合作”。 但是,要經(jīng)過(guò)第但是,要經(jīng)過(guò)第197步才到第步才到第198步。在第步。在第197步,步,A考慮到考慮到B在第在第198步時(shí)會(huì)選擇步時(shí)會(huì)選擇“不合不合作作”,此時(shí)他的最優(yōu)策略是,此時(shí)他的最優(yōu)策略是“不合作不合作”“不不合作合作”的收益的收益99大于大于“合作合作”的收益的收益98。 因此,在第因此,在第197步時(shí)步時(shí)A會(huì)選擇會(huì)選擇“不合作不合作”。 同樣,要經(jīng)過(guò)第同樣,要經(jīng)過(guò)第196步才到第步才到第197步。在第步。在第196步時(shí),步時(shí),B考慮到考慮到A在第在第197步時(shí)會(huì)選擇步時(shí)會(huì)選擇“不合不合作作”,此時(shí)他的最優(yōu)策略是,此時(shí)他的最優(yōu)策略是“不合作不合作”“不不合作

30、合作”的收益的收益100大于大于“合作合作”的收益的收益99。 因此,在第因此,在第196步時(shí)步時(shí)B會(huì)選擇會(huì)選擇“不合作不合作”。 如此推論下去,最后的結(jié)論是:在第如此推論下去,最后的結(jié)論是:在第1步時(shí)步時(shí)A將選擇將選擇“不合作不合作”,博弈結(jié)束,此時(shí),博弈結(jié)束,此時(shí)雙方的收益均為雙方的收益均為1。 這個(gè)結(jié)果是令人悲傷的。這個(gè)結(jié)果是令人悲傷的。 從邏輯推理來(lái)看,逆向歸納法是嚴(yán)密的,但從邏輯推理來(lái)看,逆向歸納法是嚴(yán)密的,但結(jié)論是違反直覺(jué)的。結(jié)論是違反直覺(jué)的。 直覺(jué)告訴我們,一開(kāi)始就采取直覺(jué)告訴我們,一開(kāi)始就采取“不合作不合作”的的策略獲取的收益只能為策略獲取的收益只能為1,而采取,而采取“合作合

31、作”策略策略有可能獲取的收益為有可能獲取的收益為100,因此,因此A應(yīng)采取應(yīng)采取“合作合作”的策略。而從邏輯的角度,一開(kāi)始的策略。而從邏輯的角度,一開(kāi)始A就應(yīng)采取就應(yīng)采取“不合作不合作”的策略。的策略。 有實(shí)驗(yàn)經(jīng)濟(jì)學(xué)家做過(guò)蜈蚣博弈的實(shí)驗(yàn),實(shí)驗(yàn)有實(shí)驗(yàn)經(jīng)濟(jì)學(xué)家做過(guò)蜈蚣博弈的實(shí)驗(yàn),實(shí)驗(yàn)的結(jié)果顯示不會(huì)出現(xiàn)一開(kāi)始選擇的結(jié)果顯示不會(huì)出現(xiàn)一開(kāi)始選擇“不合作不合作”策略策略而使雙方獲得收益而使雙方獲得收益1的情況。參與者都會(huì)自動(dòng)選的情況。參與者都會(huì)自動(dòng)選擇合作性策略,從而走向合作。擇合作性策略,從而走向合作。 人們?cè)诓┺闹械恼鎸?shí)行動(dòng)人們?cè)诓┺闹械恼鎸?shí)行動(dòng)“偏離偏離”了運(yùn)用逆了運(yùn)用逆向歸納法關(guān)于博弈的理論預(yù)測(cè),

32、造成二者間的矛向歸納法關(guān)于博弈的理論預(yù)測(cè),造成二者間的矛盾和不一致,這就是蜈蚣博弈的悖論。盾和不一致,這就是蜈蚣博弈的悖論。 逆向歸納法在邏輯上是嚴(yán)密的,然而逆向歸納法在邏輯上是嚴(yán)密的,然而它存在著它存在著“困境困境”,蜈蚣博弈悖論恰好反,蜈蚣博弈悖論恰好反映了這種映了這種“困境困境” 。 蜈蚣博弈悖論的產(chǎn)生其實(shí)是源于逆向歸納法蜈蚣博弈悖論的產(chǎn)生其實(shí)是源于逆向歸納法的適用范圍問(wèn)題,即逆向歸納法只是在一定的條件的適用范圍問(wèn)題,即逆向歸納法只是在一定的條件下和一定的范圍內(nèi)有效,忽略了這一點(diǎn)籠統(tǒng)去談?wù)撓潞鸵欢ǖ姆秶鷥?nèi)有效,忽略了這一點(diǎn)籠統(tǒng)去談?wù)撃嫦驓w納法的有效性不是科學(xué)的研究思路。逆向歸納法的有效性

33、不是科學(xué)的研究思路。 第一,從逆向歸納法的適用范圍來(lái)看,第一,從逆向歸納法的適用范圍來(lái)看,應(yīng)當(dāng)避免在較長(zhǎng)階段的動(dòng)態(tài)博弈中使用逆向應(yīng)當(dāng)避免在較長(zhǎng)階段的動(dòng)態(tài)博弈中使用逆向歸納法。博弈的階段數(shù)不同,博弈方的策略歸納法。博弈的階段數(shù)不同,博弈方的策略選擇會(huì)有很大的差異。選擇會(huì)有很大的差異。 以下象棋為例說(shuō)明這個(gè)問(wèn)題。下象棋是一種完以下象棋為例說(shuō)明這個(gè)問(wèn)題。下象棋是一種完全完美信息動(dòng)態(tài)博弈,而且博弈階段和路徑數(shù)量是全完美信息動(dòng)態(tài)博弈,而且博弈階段和路徑數(shù)量是有限的,但由于象棋博弈的路徑數(shù)量很大、分支選有限的,但由于象棋博弈的路徑數(shù)量很大、分支選擇很多,即使用最先進(jìn)的電子計(jì)算機(jī)也無(wú)法在短時(shí)擇很多,即使用最

34、先進(jìn)的電子計(jì)算機(jī)也無(wú)法在短時(shí)間內(nèi)找出每步的最優(yōu)決策,因此不可能有人一開(kāi)始間內(nèi)找出每步的最優(yōu)決策,因此不可能有人一開(kāi)始就用逆向歸納法下棋。但是實(shí)踐卻表明,下棋人往就用逆向歸納法下棋。但是實(shí)踐卻表明,下棋人往往在象棋博弈的局部階段,即在有限步數(shù)、有限選往在象棋博弈的局部階段,即在有限步數(shù)、有限選擇的范圍內(nèi)局部地使用逆向歸納法。正因?yàn)槿绱?,擇的范圍?nèi)局部地使用逆向歸納法。正因?yàn)槿绱?,才有才有“下一步看三步下一步看三步”的說(shuō)法。的說(shuō)法。 又如,在蜈蚣博弈中,如果蜈蚣博弈的階段又如,在蜈蚣博弈中,如果蜈蚣博弈的階段數(shù)大大減少,比如說(shuō)只有數(shù)大大減少,比如說(shuō)只有6步,那么開(kāi)始時(shí)合作步,那么開(kāi)始時(shí)合作的可能性就小得多,因?yàn)檫x擇合作的潛在利益減的可能性就小得多,因?yàn)檫x擇合作的潛在利益減少了很多,而承擔(dān)的初始風(fēng)險(xiǎn)卻

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論