




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2020/8/1,1,博弈論(10),社會(huì),船,都要準(zhǔn)備掌舵。-易卜生,2020/8/1,2,3.6動(dòng)態(tài)游戲分析的問(wèn)題和擴(kuò)展討論,1,逆向歸納法的問(wèn)題2,顫抖的手平衡和順式歸納法3,蜈蚣游戲問(wèn)題,2020/8/1第二,逆向歸納法也可以分析比較復(fù)雜的動(dòng)態(tài)游戲逆向歸納法的推理方法是從動(dòng)態(tài)博弈的最后階段開(kāi)始比較每個(gè)可能的路徑,所以適用范圍包括人們可以判斷的選擇路徑數(shù)(包括數(shù)量不多的離散策略)或持續(xù)收益函數(shù)連續(xù)分布戰(zhàn)略。2020/8/1,4,另外,如果兩條路徑的利益遇到相同的情況,逆向歸納法也很難選擇。逆向歸納法是通過(guò)分階段的唯一最佳選擇找到平衡路徑的方法,因此,如果某個(gè)博弈方在某個(gè)階段遇到?jīng)]有兩個(gè)茄
2、子差異的行動(dòng),就無(wú)法確定唯一的最佳路徑,逆向歸納法程序?qū)⒃谶@里中斷。(約翰f肯尼迪,Northern Exposure(美國(guó)電視電視劇),事實(shí)上,逆向歸納法更大的問(wèn)題是對(duì)游戲的理性要求太高。要求所有玩家不僅要有高度的理性,也不允許任何失誤,而且要求所有玩家徐璐理解彼此信任的理性。(威廉莎士比亞,哈姆雷特,信)對(duì)李晟(個(gè)人性別、集體理性、風(fēng)險(xiǎn)偏好等)有相同的理解,或有更多的“理性共同知識(shí)”?;谀嫦驓w納法和子博弈完美納什均衡分析的預(yù)測(cè)有效性經(jīng)常成為問(wèn)題。2020/8/1,5,逆向歸納法和子博弈精煉納什均衡問(wèn)題,1,D,(1,1),a,2,D,(1/)因此,如果多個(gè)游戲當(dāng)事人或每個(gè)游戲當(dāng)事人有多次
3、行動(dòng)機(jī)會(huì),逆向歸納法的結(jié)果可能不是這樣。對(duì)于多個(gè)游戲交易方:(2,2),2020/8/1,6,1,d,(1,1),a,2,d給定游戲當(dāng)事人選擇A的概率為P1,所有n-1游戲當(dāng)事人選擇A的概率為pn-1,如果N牙齒大,則牙齒值非常小。此外,即使游戲方1牙齒確信所有n-1游戲方都選擇了A,他也可能懷疑第二游戲方是否相信所有n-2游戲方都選擇了A。牙齒鏈越長(zhǎng),共同知識(shí)的要求就越難滿足。2020/8/1,7,右下圖是一個(gè)不復(fù)雜的多階段動(dòng)態(tài)游戲。用逆向歸納法很容易找到牙齒游戲的子博弈完美的納什均衡戰(zhàn)略組合和相應(yīng)的游戲路徑。子博弈完美的納什均衡是“在博弈1牙齒1階段選擇L,在第3階段選擇T”。游戲側(cè)2在第
4、2階段選擇N,相應(yīng)的游戲路徑是游戲側(cè)1的第1階段選擇L,游戲結(jié)束。2020/8/1,8,根據(jù)上面子博弈完美的納什均衡策略,博弈側(cè)2應(yīng)該選擇N。因此,必須將更多選擇的權(quán)利移交給游戲方1。因?yàn)槔硇缘牟┺膫?cè)1會(huì)在第3階段選擇T,所以博弈側(cè)2可以獲得3個(gè)單位的收益,而如果在第2階段直接選擇M,則可以獲得2個(gè)單位的收益。但是一個(gè)茄子明確的問(wèn)題是,在第一階段選擇R而不是L牙齒后,游戲2能否相信游戲1的理性?(威廉莎士比亞,Northern Exposure(美國(guó)電視電視劇),考慮游戲方理性的有限性,不能完全排除在游戲方牙齒第一階段的行動(dòng)選擇(或可以解釋為行動(dòng)執(zhí)行)中出錯(cuò)并采用R代替L的可能性。如果游戲方2
5、是理性的,該如何選擇呢?顯然,對(duì)“失誤”行為的判斷不同,有效的對(duì)策也不同。對(duì)錯(cuò)誤本質(zhì)的判斷是犯錯(cuò)誤和引起問(wèn)題的根本基礎(chǔ)。2020/8/1,9,右邊的圖片是靜態(tài)游戲。第二,顫抖的手平衡,游戲側(cè)2考慮到游戲側(cè)L的這種想法,選擇R代替L,因此(D,L)不再是穩(wěn)定的平衡??紤]到游戲方面的選擇和行動(dòng)會(huì)有偏差,情況會(huì)有一定的變化。如果游戲方2有可能采用R,那么不管牙齒的可能性有多大,因?yàn)橛螒蚍?的最佳選擇不是D,而是U。(阿爾伯特愛(ài)因斯坦,美國(guó)電視電視劇,游戲名言),在牙齒游戲中,(D,L)和(U,R)都是納什均衡。2020/8/1,10,注:在納什均衡(U,R)的情況下,游戲方1牙齒U偏離的概率為P(即
6、選擇D的概率為P,選擇U的概率為1p),0(1-;r;相反,(u,r)情況不同。從牙齒戰(zhàn)略組合出發(fā),所以無(wú)論游戲方2是否有可能偏離R,游戲方1都不需要偏離U。對(duì)于游戲當(dāng)事人2,從游戲當(dāng)事人1牙齒U到D的偏離對(duì)他的利益有不利影響,但除非游戲當(dāng)事人1牙齒23以上,否則改變自行策略是不合理的。因此,(U,R)概率較小的偶然偏差具有穩(wěn)定性。很明顯,我們把這種性質(zhì)的戰(zhàn)略組合稱(chēng)為“顫抖的手均衡”。2020/8/1,11,雖然游戲1牙齒仍然考慮游戲2偏離選錯(cuò)L的R的可能性,但是只要牙齒的可能性確實(shí)很小(例如不超過(guò)20),因?yàn)橛螒?選擇D而不是切換到U是最佳策略。(阿爾伯特愛(ài)因斯坦,Northern Expo
7、sure(美國(guó)電視電視劇),游戲名言)所以在下一個(gè)游戲(D,L)中,也有顫抖的手的平衡,牙齒游戲中有兩個(gè)顫抖的手的平衡。在上述游戲中,如果把游戲當(dāng)事人1的優(yōu)惠換成右邊的圖,那么顫抖的手就會(huì)改變均衡。(David assell,Northern Exposure(美國(guó)電視電視劇),游戲規(guī)則),注意:在納什均衡(D,L)的情況下,游戲雙方選擇R的概率是P(即選擇R的概率是P,L的概率是1p)也就是說(shuō),這是對(duì)脫離者沒(méi)有損失的戰(zhàn)略。包括弱策略在內(nèi)的納什均衡不能成為顫抖的手的均衡。因?yàn)榻?jīng)不起不完全理性的“擾動(dòng)”,在有限的李晟條件下缺乏穩(wěn)定性。現(xiàn)在,讓我們回到可擴(kuò)展表達(dá)的動(dòng)態(tài)游戲,看看下圖中的一個(gè)游戲。(
8、約翰肯尼迪,Northern Exposure美國(guó)電視電視劇,2020/8/1,13),但第二不是顫抖的手平衡路徑,牙齒游戲有兩條完整的納什平衡路徑,一條在游戲1牙齒1階段選擇L結(jié)束游戲,另一條在RNTV(威廉莎士比亞,美國(guó)電視電視劇,游戲名言),2020/8/1,14,將牙齒游戲換成Y右邊的圖片。情況也會(huì)改變。此時(shí),牙齒游戲的R NTV是牙齒游戲唯一的子游戲完美的納什均衡路徑,也是顫抖的手的均衡。(威廉莎士比亞,Northern Exposure(美國(guó)電視電視劇),因?yàn)橹灰總€(gè)游戲方犯了錯(cuò)誤,偏離該路線的概率就比較小。然后,游戲方有主觀堅(jiān)持它的愿望。2020/8/1,15,最后,我們回到之前
9、的動(dòng)態(tài)游戲問(wèn)題。根據(jù)上面提到的顫抖的手均衡思想,在牙齒游戲中,在游戲1牙齒1階段選擇L結(jié)束游戲并不難。這是牙齒游戲唯一的子游戲,完美的納什均衡路徑,也是牙齒游戲唯一的顫抖手均衡。(阿爾伯特愛(ài)因斯坦,Northern Exposure(美國(guó)電視電視劇),通過(guò)以上分析,可以看出顫抖的手平衡是精細(xì)子博弈的完美納什均衡的概念。通過(guò)顫抖的手均衡測(cè)試,通過(guò)子游戲納什均衡,在動(dòng)態(tài)游戲中的穩(wěn)定性要更強(qiáng),預(yù)測(cè)也更可靠。(威廉莎士比亞,哈姆雷特),2020/8/1,16,但實(shí)際上,在玩牙齒游戲的時(shí)候,如果在游戲1牙齒1階段選擇R代替L,此時(shí)游戲2根據(jù)顫抖的手均衡的想法考慮,那么在第2階段選擇N而不是M牙齒。因?yàn)樵?/p>
10、從第二階段游戲方的選擇開(kāi)始的子游戲中,MT是子游戲的完美納什。2020/8/1,17,下圖是一個(gè)游戲的例子,展示了純遞歸歸納法的思想。牙齒游戲的第一步是游戲第一方牙齒首先要在U和R之間選擇。如果他選擇U,游戲結(jié)束。如果他選擇R,雙方進(jìn)行第二階段的靜態(tài)游戲。三,純歸納法,顫抖的手的平衡只是理解游戲方面的失誤和精密平衡的思想方法和概念之一,我們實(shí)際上不能保證它一定與現(xiàn)實(shí)中游戲方面的思想方法一致?,F(xiàn)實(shí)中,游戲方面很可能對(duì)相關(guān)問(wèn)題有不同的理解和處理方法,是“循序歸納法”牙齒中最重要的一個(gè)。(阿爾伯特愛(ài)因斯坦,美國(guó)電視電視劇,),2020/8/1,18,牙齒靜態(tài)游戲中有三個(gè)茄子納什均衡:純戰(zhàn)略納什均衡(
11、A,D)和(B,C)注意,2020/8/1,19,牙齒博弈的納什均衡路徑之一是在博弈1牙齒1階段選擇U,如果達(dá)到了第2階段的靜態(tài)博弈(博弈1本身在第1階段實(shí)際選擇R),雙方將采用第2階段靜態(tài)博弈的納什均衡(B,C)。實(shí)際上,根據(jù)上述策略,子博弈的第二階段不在均衡路徑上。到達(dá)牙齒子游戲可以認(rèn)為在選擇游戲方1牙齒時(shí)存在某種錯(cuò)誤。很容易確認(rèn)。(UB,C)和(RA,D)都是牙齒游戲的子博弈,完美的納什均衡,也是顫抖的手均衡。是的,(UB,C)是顫抖的手平衡。即使是游戲第一階段的“誤用”牙齒R,根據(jù)顫抖的手均衡的思想,也可以理解兩個(gè)游戲方面不會(huì)影響在第二階段采用納什均衡(B,C)。2020/8/1,20
12、,根據(jù)牙齒戰(zhàn)略型,理性的游戲本身在第一階段不會(huì)選擇U,這不難理解。因?yàn)槭菄?yán)格的下策。在步驟1中選擇R,但不選擇U,就是準(zhǔn)備在步驟2中選擇A。(阿爾伯特愛(ài)因斯坦,Northern Exposure(美國(guó)電視電視劇),挑戰(zhàn))但是,(UB,C)是否真的是牙齒游戲的穩(wěn)定平衡還是個(gè)疑問(wèn)。在牙齒游戲中,如果在游戲當(dāng)事人1牙齒的第一階段選擇了U,那么顯然,比起游戲當(dāng)事人1的選擇,錯(cuò)誤更有說(shuō)服力的解釋。也就是說(shuō),游戲當(dāng)事人1牙齒有意識(shí)地這樣選擇了。將牙齒游戲用下圖的利益矩陣(或戰(zhàn)略型)形式表示,牙齒點(diǎn)就容易理解了。2020/8/1,21,以上分析表明,顫抖的手平衡的思維方式不能完全解決動(dòng)態(tài)游戲中平衡的精煉問(wèn)題
13、,因此子游戲中完美的納什均衡和顫抖的手平衡(UB,C)實(shí)際上很少出現(xiàn)。(David aser,Northern Exposure(美國(guó)電視電視劇),牙齒游戲中真的很有穩(wěn)定性??杀容^的均衡是另一個(gè)子博弈,完美的納什均衡和顫抖的手均衡(RA,D)。在這樣的判斷中,游戲方2在第二階段最好的選擇只有D。如果你相信游戲方1牙齒游戲方2具有分析能力,那么你可以預(yù)測(cè)游戲方2的推理,知道自己的第一階段選擇型R,知道第二階段實(shí)現(xiàn)對(duì)自己有利的均衡(A,D)。這當(dāng)然比在步驟1中直接選擇U更有利。,2020/8/1,22,4,蜈蚣游戲問(wèn)題,前面討論的主要問(wèn)題是現(xiàn)實(shí)中決策者理性的限制對(duì)逆向歸納法和子博弈完美納什均衡分析
14、預(yù)測(cè)能力的影響,可以得到更準(zhǔn)確的預(yù)測(cè)。但這并不完全是真的。因?yàn)閯?dòng)態(tài)游戲分析還有另一個(gè)意想不到的困難。對(duì)此,我們可以通過(guò)“蜈蚣游戲”來(lái)說(shuō)明。2020/8/1,23,例如游戲問(wèn)題1:1,d,(1,0),A,2,d,(0,2),2,D,(0,3),A,1,D,(98,98),A,2,D,(98,)特別是,如何修改游戲方面對(duì)異性的評(píng)價(jià)?2020/8/1,25,我們?cè)谟螒虍?dāng)事人1牙齒游戲開(kāi)始時(shí)選擇A,根據(jù)理性人的假設(shè),可以發(fā)現(xiàn)游戲當(dāng)事人1牙齒非理性。顯然,這取決于游戲第二方對(duì)游戲第一方的期待。如果認(rèn)為游戲當(dāng)事人2是游戲當(dāng)事人1牙齒無(wú)意的失誤,那么原意是選擇D,但由于手的顫抖而選擇A,那么基于這種想法,游
15、戲當(dāng)事人2將選擇D。相反,如果游戲當(dāng)事人2認(rèn)為游戲當(dāng)事人1牙齒選擇了A向自己發(fā)送這樣的信號(hào),那么再次游戲當(dāng)事人1牙齒的時(shí)候,他還是選擇了A,開(kāi)始時(shí)游戲當(dāng)事人1牙齒故意失誤。那么游戲當(dāng)事人2也應(yīng)該選擇A。然后看看牙齒游戲能走多遠(yuǎn)。在2020/8/1,26,美國(guó)19世紀(jì),有一位優(yōu)秀的政治家,是幼年流浪街頭的孤兒。他總是在街上向行人要錢(qián),但當(dāng)有人讓他在一元和二元之間選擇時(shí),他選擇了一元。所以很多人來(lái)找他,親自驗(yàn)證他“愚蠢”行為的傳聞,讓他在1美元和2美元之間做出選擇。他仍然在我們這里只選擇了一元,所以找他的人越來(lái)越多。例如,智慧,智慧,智慧,智慧,智慧,智慧,智慧,2020/8/1,27,終于有一天,一個(gè)女人問(wèn)他?!澳悴恢?元比1元有更多的錢(qián)嗎?他這樣回答。如果我一次選擇2元,沒(méi)有人會(huì)讓我來(lái)在1元和2元之間選擇。我也收不到錢(qián)。牙齒故事告訴我們,有時(shí)做“傻瓜”會(huì)很好。再舉一個(gè)茄子的例子。這是動(dòng)態(tài)游戲。游戲A有兩次決策機(jī)會(huì)。一次在游戲B決策之前,另一次在B決策之后。2020/8/1,28,圖4動(dòng)態(tài)游戲使用“逆向歸納法”,A在第二次決策時(shí)選擇L,B選擇L。給出
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 本科畢業(yè)論文完整范文(滿足查重要求)基于大數(shù)據(jù)技術(shù)的智慧物流管理模式構(gòu)建研究
- 本科畢業(yè)論文完整范文(滿足查重要求)大數(shù)據(jù)嵌入政府治理效能研究
- 2024年六年級(jí)道德與法治下冊(cè) 第一單元 完善自我 健康成長(zhǎng) 1 學(xué)會(huì)尊重教學(xué)實(shí)錄 新人教版
- 鄉(xiāng)村農(nóng)業(yè)產(chǎn)業(yè)園區(qū)建設(shè)協(xié)議
- 5 以?xún)?nèi)的減法(教學(xué)設(shè)計(jì))-2024-2025學(xué)年一年級(jí)上冊(cè)數(shù)學(xué)北京版
- 2023三年級(jí)數(shù)學(xué)上冊(cè) 一 混合運(yùn)算第5課時(shí) 過(guò)河教學(xué)實(shí)錄 北師大版
- 農(nóng)民職業(yè)培訓(xùn)與指導(dǎo)手冊(cè)
- 2024年屆九年級(jí)歷史上冊(cè) 第1課 向人性扼殺者宣戰(zhàn)教學(xué)實(shí)錄2 北師大版
- 三農(nóng)村土地承包經(jīng)營(yíng)權(quán)確權(quán)登記頒證方案
- 3 學(xué)會(huì)反思(教學(xué)設(shè)計(jì))-統(tǒng)編版道德與法治六年級(jí)下冊(cè)
- Aptitude態(tài)度的重要性
- 《推薦》500kV輸電線路應(yīng)急處置預(yù)案6個(gè)
- 麗聲北極星分級(jí)繪本第三級(jí)下 The Class Trip 課件
- 放射性元素的衰變
- 第一課想聽(tīng)聽(tīng)我的忠告嗎
- 高英Lesson3 Pub Talk and the King27s English
- 氣柜培訓(xùn)(課堂PPT)
- 防洪堤防工程堤頂高程的計(jì)算表
- 古詩(shī)詞常見(jiàn)題材之思鄉(xiāng)懷人詩(shī)鑒賞
- 《平方差公式(1)》導(dǎo)學(xué)案
- 等保三級(jí)基線要求判分標(biāo)準(zhǔn)v10
評(píng)論
0/150
提交評(píng)論