




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡三應(yīng)用舉例博弈的戰(zhàn)略表述案例-房地產(chǎn)開發(fā)項(xiàng)目-假設(shè)有A.B兩家開發(fā)商市場需求:可能大,也可能小投入:1億假定市場上有兩棟樓出售:需求大時(shí),每棟售價(jià)1.4億,需求小時(shí),售價(jià)7千萬;如果市場上只有一棟樓需求大時(shí),可賣1.8億需求小時(shí),可賣1.1億博弈戰(zhàn)略表述4000,40004000,40004000,40004000,4000不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-3000-3000,-3000-3000,-3000-3000,-3000不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述一博弈擴(kuò)展式表述博弈的擴(kuò)展式表述包括三個(gè)要素:參與人集合每個(gè)參與人的戰(zhàn)略集合由戰(zhàn)略組合決定的每個(gè)參與人的支付進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者市場進(jìn)入阻撓博弈樹不可置信威脅合作(40,50)斗爭(-10,0)A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動(dòng)順序參與人的行動(dòng)空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)終點(diǎn)結(jié)枝結(jié),初始結(jié)
信息集一博弈擴(kuò)展式表述博弈的基本構(gòu)造結(jié):包括決策結(jié)和終點(diǎn)結(jié)兩類;決策結(jié)是參與人行動(dòng)的始點(diǎn),終點(diǎn)結(jié)是決策人行動(dòng)的終點(diǎn).結(jié)滿足傳遞性和非對(duì)稱性x之前的所有結(jié)的集合,稱為x的前列集P(x),x之后的所有結(jié)的集合稱為x的后續(xù)集T(x)。枝:枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇.信息集:每個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié):1每個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié);2該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié).A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B在決策時(shí)不確切地知道自然的選擇,因此,B的決策結(jié)由4個(gè)變?yōu)?個(gè)。房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的選擇;但不知道A的選擇(或A.B同時(shí)決策)房地產(chǎn)開發(fā)博弈一博弈擴(kuò)展式表述只包含一個(gè)決策結(jié)的信息集稱為單結(jié)信息集。如果博弈樹的所有信息集都是單結(jié)的,該博弈稱為完美信息博弈。自然總是假定是單結(jié)的,因?yàn)樽匀辉趨⑴c人決策之后行動(dòng)等價(jià)于自然在參與人之前行動(dòng)但參與人不能觀測到自然的行動(dòng)。不同的博弈樹可以代表相同的博弈,但是有一個(gè)基本規(guī)則:一個(gè)參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。AB坦白抵賴BBAA坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)囚徒困境博弈的擴(kuò)展式表述智豬博弈的擴(kuò)展式表述?5,15,15,15,1等待小豬大豬按等待按案例2-智豬博弈第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例博弈的劃分博弈的劃分:從參與人行動(dòng)的先后順序:靜態(tài)博弈和動(dòng)態(tài)博弈靜態(tài)博弈:參與人同時(shí)選擇行動(dòng)或非同時(shí)行動(dòng)但后行動(dòng)者并不知道前行動(dòng)者采取了什么具體行動(dòng);動(dòng)態(tài)博弈:參與人行動(dòng)有先后順序,且后行動(dòng)者能夠觀察先行動(dòng)者選擇的行動(dòng)。博弈的劃分參與人對(duì)其他參與人(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)的知識(shí):完全信息博弈和不完全信息博弈。完全信息:每一個(gè)參與人對(duì)所有其他參與人的(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí),否則為不完全信息。博弈的劃分:
行動(dòng)順序信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950,1951)完全信息動(dòng)態(tài)博弈子博弈精練納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)不完全信息動(dòng)態(tài)博弈精練貝葉斯納什均衡澤爾騰(1965)Kreps
和Wilson(1982)Fudenberg
和Tirole(1991)考慮下列問題:一個(gè)博弈可能有多個(gè)(甚至無窮多個(gè))納什均衡,究竟哪個(gè)更合理?納什均衡假定每一個(gè)參與人在選擇自己的最優(yōu)戰(zhàn)略時(shí)假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動(dòng)有先有后,后行動(dòng)者的選擇空間依賴于前行動(dòng)者的選擇,前行動(dòng)者在選擇時(shí)不可能不考慮自己的行動(dòng)對(duì)后行動(dòng)者的影響。子博弈精練納什均衡的一個(gè)重要改進(jìn)是將“合理納什均衡”與“不合理納什均衡”分開。子博弈精練納什均衡子博弈精練納什均衡(舉例)進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者合作(40,50)斗爭(-10,0)市場進(jìn)入阻撓博弈樹特點(diǎn):剔除博弈中包含的不可置信威脅。承諾行動(dòng)-破釜沉舟-背水一戰(zhàn)給定進(jìn)入者進(jìn)入,剔除(進(jìn)入,斗爭),(進(jìn)入,默許)是唯一的子博弈精練納什均衡不可置信威脅支付函數(shù)行動(dòng)完全信息動(dòng)態(tài)博弈
-子博弈精練納什均衡:澤爾騰(1965)曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻(xiàn)破袁之策,程昱獻(xiàn)了十面埋伏之計(jì),他讓曹操退軍河上,誘袁前來追擊,到那時(shí)“我軍無退路,必將死戰(zhàn),可退袁矣”。曹操采納此計(jì),令許褚誘袁軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例戰(zhàn)略的表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動(dòng)的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動(dòng),是參與人的“相機(jī)行動(dòng)方案”。在靜態(tài)博弈中,戰(zhàn)略和行動(dòng)是相同的。作為一種行動(dòng)規(guī)則,戰(zhàn)略必須是完備的。擴(kuò)展式表述博弈的納什均衡足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’男的策略:{足球,芭蕾}選擇足球;還是選擇芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追隨策略:他選擇什么,我就選擇什么2、對(duì)抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不管他選什么,我都選芭蕾;4.足球策略:不管他選什么,我都選足球。策略:即如果他選擇什么,我就怎樣行動(dòng)的相機(jī)行動(dòng)方案。在擴(kuò)展式博弈里,參與人是相機(jī)行事,即“等待”博弈到達(dá)一個(gè)自己的信息集(包含一個(gè)或多個(gè)決策結(jié)后,再采取行動(dòng)方案。什么是動(dòng)態(tài)博弈?擴(kuò)展式表述博弈的納什均衡若A先行動(dòng),B在知道A的行動(dòng)后行動(dòng),則A有一個(gè)信息集,兩個(gè)可選擇的行動(dòng),戰(zhàn)略空間為:(開發(fā),不開發(fā));B有兩個(gè)信息集,四個(gè)可選擇的行動(dòng),B有四個(gè)純戰(zhàn)略:開發(fā)策略:不論A開發(fā)不開發(fā),我開發(fā);追隨策略:A開發(fā)我開發(fā),A不開發(fā)我不開發(fā);對(duì)抗策略:A開發(fā)我不開發(fā),A不開發(fā)我開發(fā);不開發(fā)策略不論A開發(fā)不開發(fā)我不開發(fā),簡寫為:(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開發(fā)),括號(hào)內(nèi)的第一個(gè)元素對(duì)應(yīng)A選擇“開發(fā)”時(shí)B的選擇,第二個(gè)元素對(duì)應(yīng)A選擇“不開發(fā)”時(shí)B的選擇。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’什么是參與人的戰(zhàn)略?擴(kuò)展式-3,-3-3,-31,01,00,10,00,10,0{開發(fā),開發(fā)}{開發(fā),不開發(fā)}{不開發(fā),開發(fā)}{不開發(fā),不開發(fā)}開發(fā)不開發(fā)開發(fā)商B開發(fā)商A戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’{開發(fā),(開發(fā),不開發(fā))}納什均衡與均衡結(jié)果:存在三個(gè)純戰(zhàn)略納什均衡:(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))兩個(gè)均衡結(jié)果:(開發(fā),不開發(fā))(不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果擴(kuò)展式-3,-3-3,-31,01,00,10,00,10,0{開發(fā),開發(fā)}{開發(fā),不開發(fā)}{不開發(fā),開發(fā)}{不開發(fā),不開發(fā)}開發(fā)不開發(fā)開發(fā)商B開發(fā)商A戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’{開發(fā),(開發(fā),不開發(fā))}路徑在擴(kuò)展式博弈中,所有n個(gè)參與人的一個(gè)純戰(zhàn)略組合決定了博弈樹上的一個(gè)路徑。(開發(fā),{不開發(fā),開發(fā)})決定了博弈的路徑為A—開發(fā)—B—不開發(fā)--(1,0)(不開發(fā),{開發(fā),開發(fā)})決定了路徑:?第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例子博弈精煉納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。子博弈精煉納什均衡-不可置信威脅美國普林斯頓大學(xué)古爾教授在1997年的《經(jīng)濟(jì)學(xué)透視》里發(fā)表文章,提出一個(gè)例子說明威脅的可信性問題:兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個(gè)關(guān)起來,關(guān)起來比沒有玩具更可怕。現(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會(huì)使你的境遇變得更壞,所以你不會(huì)告狀,因此哥哥對(duì)弟弟的警告置之不理。的確,如果弟弟是會(huì)算計(jì)自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢姡艿苁抢硇匀?,他的告狀威脅是不可置信的。子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))如果A選擇開發(fā),B的最優(yōu)選擇是不開發(fā),如果A選擇不開發(fā),B的最優(yōu)選擇是開發(fā),A預(yù)測到自己的選擇對(duì)B的影響,因此開發(fā)是A的最優(yōu)選擇。子博弈精練納什均衡結(jié)果是:A選擇開發(fā),B選擇不開發(fā)。xx’對(duì)于(不開發(fā),(開發(fā),開發(fā))),這個(gè)組合之所以構(gòu)成納什均衡,是因?yàn)锽威脅不論A開發(fā)還是不開發(fā),他都將選擇開發(fā),A相信了B的威脅,不開發(fā)是最優(yōu)選擇,但是A為什么要相信B的威脅呢?畢竟,如果A真開發(fā),B選擇開發(fā)得-3,不開發(fā)得0,所以B的最優(yōu)選擇是不開發(fā)。如果A知道B是理性的,A將選擇開發(fā),逼迫B選擇不開發(fā)。自己得1,B得0,即納什均衡(不開發(fā),(開發(fā),開發(fā)))是不可置信的。因?yàn)樗蕾囉贐的一個(gè)不可置信的威脅。同樣:(不開發(fā),不開發(fā))也是一個(gè)不可置信威脅,納什均衡(開發(fā),(不開發(fā),不開發(fā)))是不合理的。子博弈精練納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測結(jié)果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。什么是子博弈,什么是子博弈精練納什均衡?有沒有更好的方法找到子博弈精練納什均衡?子博弈:是原博弈的一部分,它本身也可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析:(1)子博弈必須從一個(gè)單結(jié)信息點(diǎn)開始:只有決策者在原博弈中確切地知道博弈進(jìn)入一個(gè)特定的決策結(jié)時(shí),該決策結(jié)才能作為一個(gè)子博弈的初始結(jié)。如果信息集包含兩個(gè)以上的決策結(jié),則這兩個(gè)都不可以作為子博弈的初始結(jié)。(2)子博弈的信息集和支付向量都直接繼承自原博弈,即當(dāng)x’和x’’在原博弈中屬于同一信息集時(shí),他們?cè)谧硬┺闹胁艑儆谕恍畔⒓A?xí)慣上,任何博弈的本身稱為自身的一個(gè)子博弈。A開發(fā)不開發(fā)XX大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人X的信息集不能開始一個(gè)子博弈,否則的話,參與人B的信息將被切割。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’不開發(fā)開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x’子博弈I子博弈II房地產(chǎn)開發(fā)博弈A坦白抵賴BB坦白抵賴坦白(-8,-8)(0,-10)(-10,0)(-1,-1)找出房地產(chǎn)開發(fā)博弈的子博弈(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)子博弈精練納什均衡:擴(kuò)展式博弈的戰(zhàn)略組合是一個(gè)子博弈精練納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個(gè)子博弈上給出納什均衡。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x’子博弈I子博弈II(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))在c上構(gòu)成均衡,在b上不構(gòu)成;在b和c上都構(gòu)成在c上構(gòu)成均衡,在b上不構(gòu)成完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)不開發(fā)判斷下列均衡結(jié)果哪個(gè)構(gòu)成子博弈精練納什均衡?不開發(fā)bc完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)如果一個(gè)博弈有幾個(gè)子博弈,一個(gè)特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”,博弈樹上的其他路徑稱為“非均衡路徑”。納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的;而構(gòu)成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈精練納什均衡的實(shí)質(zhì)區(qū)別。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)戰(zhàn)略是參與人行動(dòng)規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見的情況下(即每一個(gè)決策結(jié))上選擇什么行動(dòng),即使這種情況實(shí)際上沒有發(fā)生(甚至參與人并不預(yù)期它會(huì)發(fā)生)。因此,只有當(dāng)一個(gè)戰(zhàn)略規(guī)定的行動(dòng)規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個(gè)合理的可置信的戰(zhàn)略,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動(dòng)規(guī)則。第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例用逆向歸納法求-子博弈精練納什均衡1UDL(3,1)(0,0)22,2R給定博弈達(dá)到最后一個(gè)決策結(jié),該決策結(jié)上行動(dòng)的參與人有一個(gè)最優(yōu)選擇,這個(gè)最優(yōu)選擇即該決策結(jié)開始的子博弈的納什均衡倒數(shù)第二個(gè)決策結(jié),找倒數(shù)第二個(gè)的最優(yōu)選擇,這個(gè)最優(yōu)選擇與我們?cè)诘谝徊秸业降淖顑?yōu)選擇構(gòu)成一個(gè)納什均衡。如此重復(fù)直到初始結(jié)。每一步都得到對(duì)應(yīng)于子博弈的一個(gè)納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈的納什均衡,這個(gè)過程的最后一步得到整個(gè)博弈的納什均衡完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)用逆向歸納法求子博弈精練納什均衡:對(duì)于有限完美信息博弈,逆向歸納法求解子博弈精練納什均衡是一個(gè)最簡便的方法。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’房地產(chǎn)開發(fā)博弈完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)1UDL(1,1)22,0RU’(3,0)(0,2)2D’子博弈精練納什均衡((U,U’),L).U’和L分別是參與人1和參與人2在非均衡路徑上的選擇。逆向歸納法求解子博弈精練納什均衡的過程,實(shí)質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過程:從最后一個(gè)決策結(jié)依次剔除每個(gè)子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精練納什均衡。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)用逆向歸納法求解的子博弈精練納什均衡也要求“所有的參與人是理性的”是共同知識(shí)。如果博弈由多個(gè)階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者市場進(jìn)入阻撓博弈樹不可置信威脅支付函數(shù)行動(dòng)合作(40,50)斗爭(-10,0)完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)練習(xí):參與人1(丈夫)和參與人2(妻子)必須獨(dú)立決定出門時(shí)是否帶傘。他們知道下雨和不下雨的可能性軍委50%,支付函數(shù)為:如果只有一人帶傘,下雨時(shí)帶傘者的效用為-2.5,不帶傘者的效用為-3不下雨時(shí)帶傘的效用為-1,不帶的效用為0;如兩人都不帶傘,下雨時(shí)每人的效用為-5,不下雨時(shí)每人的效用為1;給出下列四種情況下的擴(kuò)展式及戰(zhàn)略式表述:(1)兩人出門前都不知道是否會(huì)下雨;并且兩人同時(shí)決定是否帶傘(即每一方在決策時(shí)都不知道對(duì)方的決策);(2)兩人在出門前都不知道是否會(huì)下雨,但丈夫先決策,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘;(3)丈夫出門前知道是否會(huì)下雨,但妻子不知道,但丈夫先決策,妻子后決策;(4),同(3),但妻子先決策,丈夫后決策.第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例承諾行動(dòng)與子博弈精練納什均衡承諾行動(dòng)與子博弈精練納什均衡有些戰(zhàn)略之所以不是精練納什均衡,是因?yàn)樗瞬豢芍眯诺耐{戰(zhàn)略,如果參與人能在博弈之前采取某種行動(dòng)改變自己的行動(dòng)空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會(huì)隨之改變.這些改變博弈結(jié)果而采取的措施稱為承諾行動(dòng).完全承諾:承諾可以使某項(xiàng)行動(dòng)完全沒有可能(破釜沉舟).不完全承諾:承諾只是增加了某個(gè)行動(dòng)的成本而不是使該活動(dòng)完全沒有可能.承諾行動(dòng)與子博弈精練納什均衡曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻(xiàn)破袁之策,程昱獻(xiàn)了十面埋伏之計(jì),他讓曹操退軍河上,誘袁前來追擊,到那時(shí)“我軍無退路,必將死戰(zhàn),可退袁矣”。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中國低功耗LED燈行業(yè)市場發(fā)展前景及發(fā)展趨勢與投資戰(zhàn)略研究報(bào)告
- 健康知識(shí)講座課件圖片
- 健康看電視講課課件
- 醫(yī)藥安全政策解讀課件
- 2024年疊片機(jī)資金需求報(bào)告代可行性研究報(bào)告
- 2024年食品冷凍機(jī)械投資申請(qǐng)報(bào)告代可行性研究報(bào)告
- 蕭山區(qū)小區(qū)監(jiān)控管理辦法
- 蛋糕廠生產(chǎn)管理辦法標(biāo)準(zhǔn)
- 衡山縣村民建房管理辦法
- 健康活到百歲課件
- 關(guān)心下一代工作先進(jìn)工作者事跡
- 廣西壯族自治區(qū)桂林市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名明細(xì)居民村民委員會(huì)
- 脈動(dòng)真空壓力蒸汽滅菌器故障應(yīng)急預(yù)案流程
- 曾仕強(qiáng)講易經(jīng)的奧秘(PPT)
- 食品企業(yè)客訴處理培訓(xùn)
- 雷達(dá)操作與模擬器
- 中壓電纜載流量、電容、電感、電抗參數(shù)表
- 小學(xué)校本課程教材《趣味數(shù)學(xué)》下冊(cè)(共27頁)
- 外墻石材維修施工方案
- 橋本甲狀腺炎PPT幻燈片課件
- 第二臨床醫(yī)學(xué)院審核評(píng)估自評(píng)報(bào)告
評(píng)論
0/150
提交評(píng)論