完全信息動態(tài)博弈_第1頁
完全信息動態(tài)博弈_第2頁
完全信息動態(tài)博弈_第3頁
完全信息動態(tài)博弈_第4頁
完全信息動態(tài)博弈_第5頁
已閱讀5頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第三章 完全信息動態(tài)博弈n一 博弈擴展式表述n二 子博弈精練納什均衡n三 應用舉例n28頁博弈的策略表述案例- 房地產(chǎn)開發(fā)項目-假設有A、B兩家開發(fā)商市場需求:可能大,也可能小投入:1億v假定市場上有兩棟樓出售:需求大時,每棟售價1.4億,需求小時,售價7千萬;v如果市場上只有一棟樓需求大時,可賣1.8億需求小時,可賣1.1億 博弈策略表述40004000,4000400080008000,0 00 0,800080000 0,0 0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開

2、發(fā)開發(fā)開發(fā)商B需求小的情況需求小的情況需求大的情況需求大的情況博弈的策略式表述一 博弈擴展式表述n博弈的擴展式表述包括三個要素:參與人集合每個參與人的策略集合由策略組合決定的每個參與人的支付進入者進入不進入(0,300)在位者市場進入阻撓博弈樹不可置信威脅合作(40,50)斗爭(-10,0)A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)策略支付房地產(chǎn)開發(fā)博弈結,決策結結,終點結枝結,初始結 信息集一 博弈擴展式表述博弈的基本構造l結: 包括決

3、策結和終點結兩類;決策結是參與人行動的始點,終點結是決策人行動的終點.l枝: 枝是從一個決策結到它的直接后續(xù)結的連線,每一個枝代表參與人的一個行動選擇.l信息集: 每個信息集是決策結集合的一個子集,該子集包括所有滿足下列條件的決策結:1 每個決策結都是同一個參與人的決策結;2 該參與人知道博弈進入該集合的某個決策結,但不知道自己究竟處于哪一個決策結.A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在決策時不確切地知道自然的選擇; B的決策結由4個變?yōu)?個房地產(chǎn)

4、開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時決策) 房地產(chǎn)開發(fā)博弈一 博弈擴展式表述n只包含一個決策結的信息集稱為單結信息集,如果博弈樹的所有信息集都是單結的,該博弈稱為完美信息博弈。例122左右ABCD(3,1)(5,6)(4,2)(2,7)2. 博弈樹規(guī)則(1) 每一個結至多有一個其他結直接位于它的前面。(2) 在博弈樹中沒有一條路徑可以使決策結與自身相連。(3) 博弈樹必須有初始結(4) 每個博弈

5、樹只有一個初始結3、完美信息與不完美信息n定義定義:假如一個局中人在輪到他行動時知道自己處于博弈樹的那個結上,我們稱該局中人有完美信息。博弈中的每一個局中人都具有完美信息,則稱該博弈有完美信息。如果局中人在不知道另外的局中人前面行動的情況下必須行動,則稱該局中人具有不完美信息。倘若至少有一個局中人具有不完美信息,則稱該博弈具有不完美信息。122左右ABCD(3,1)(5,6) (4,2)(2,7)h1h12h22(3,1)(2,7)122左右ABAB(5,6)(4,2)h1h2h2左ABCD(2, 0)(1, 1)(0, 0.5)(3, 1)(2, 2)EFh21h22h12h1右左ABCDh

6、1h12h22右ababcdcdh21h21h31h31(1,2)(0,3)(3,1)(-1,4)(2,1)(0,0) (-1,1)(3,2)二、擴展式博弈的策略與均衡1.概念n信息集Hi=hi: hi是局中人i的信息集n行動空間A(hi): 局中人i基于信息集hi的行動全體Ai= hiHiA(hi):局中人i的所有行動的集合n純策略空間局中人i的一個純策略si:HiAi ( hiHi, si (hi) A(hi)Si=si: si是局中人i的一個純策略Si= hiHiA(hi)n純策略組合S=Sin局中人局中人1 1信息集:H1=h1;行動空間:A(h1)=左,右純策略空間:S1=A(h1)

7、=左,右122左右ABCD(3,1) (5,6)(4,2)(2,7)h1h12h22 局中人局中人2 2信息集:H2=h12,h22;行動空間:A(h12)=A,B; A(h22)=C,D純策略空間:S2=A(h12)A(h22)=(A,C),(A,D),(B,C),(B,D)n純策略組合S=左, (A,C),左, (A,D),左, (B,C),左, (B,D), 右, (A,C),右, (A,D),右, (B,C),右, (B,D)122左右ABCD(3,1)(5,6) (4,2)(2,7)h1h12h222、擴展式博弈的策略式表示3,13,15,65,64,22,74,22,7左右(A,C

8、)(A,D)(B,C)(B,D)122左右ABCD(3,1)(5,6)(4,2)(2,7)h1h12h22(3,1)(2,7)122左右ABAB(5,6)(4,2)h1h2h2n局中人局中人1 1信息集:H1=h1;行動空間:A(h1)=左,右純策略空間:S1=A(h1)=左,右 局中人局中人2 2信息集:H2=h2;行動空間:A(h2)=A,B純策略空間:S2=A(h2)=A,B 純策略組合純策略組合S= 左, A,左,B,右,A,右,B擴展式博弈的策略式表示3,15,64,22,7左右AB(3,1)(2,7)122左右ABAB(5,6)(4,2)h1h2h2n局中人局中人1 1信息集:H1

9、=h1,h21行動空間:A(h1)=左,右; A(h21)=E,F純策略空間:S1=A(h1)A(h21)=(左,E),(左,F),(右,E),(右,F)左ABCD(2,0)(1,1)(0,0.5)(3,1)(2,2)EFh21h22h12h1右n局中人局中人2 2信息集:H2=h12,h22行動空間:A(h12)=A,B; A(h22)=C,D純策略空間:S2=A(h12)A(h22)=(A,C),(A,D),(B,C),(B,D)左ABCD(2,0)(1,1)(0,0.5)(3,1)(2,2)EFh21h22h12h1右n純策略組合 S= S1S2=(左,E),(左,F),(右,E),(右

10、,F) (A,C),(A,D),(B,C),(B,D)左ABCD(2,0)(1,1)(0,0.5)(3,1)(2,2)EFh21h22h12h1右(A,C)(A,D)(B,C)(B,D)(左,E)(左,F)(右,E)(右,F)2,02,01,11,12,02,01,11,10,0.53,10,0.53,10,0.52,20,0.52,2左ABCD(2,0)(1,1)(0,0.5)(3,1)(2,2)EFh21h22h12h1右第三章 完全信息動態(tài)博弈 n一 博弈擴展式表述n二 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子博弈精練納什均衡承諾行動與子博弈精練納什均

11、衡逆向歸納法與子博弈精練納什均衡的存在問題n三 應用舉例完全信息動態(tài)博弈n考慮下列問題:一個博弈可能有多個(甚至無窮多個)納什均衡,究竟哪個更合理?納什均衡假定每一個參與人在選擇自己的最優(yōu)策略時假定所有其他參與人的策略是給定的,但是如果參與人的行動有先有后,后行動者的選擇空間依賴于前行動者的選擇,前行動者在選擇時不可能不考慮自己的行動對后行動者的影響。子博弈精練納什均衡的一個重要改進是將“合理的合理的納什均衡”與“不合理的不合理的納什均衡”分開。完全信息動態(tài)博弈進入者進入不進入(0,300)在位者默許(40,50)斗爭(-10,0)市場進入阻撓博弈樹特點:剔除博弈中包含的不可置信威脅。 承諾行

12、動:如破釜沉舟、背水一戰(zhàn)等v給定進入者進入,剔除(不進入,斗爭),(進入,默許)是唯一的子博弈精練納什均衡不可置信威脅支付函數(shù)行動二 子博弈精練納什均衡n一個納什均衡稱為精練納什均衡,當且僅當參與人的策略在每個子博弈中都構成納什均衡,也就是說,組成精練納什均衡的策略必須在每一個子博弈中都是最優(yōu)的。n一個精練納什均衡首先必須是一個納什均衡,但納什均衡不一定是精練納什均衡。n承諾行動-當事人使自己的威脅策略變得可置信的行動。完全信息動態(tài)博弈n澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅策略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預測結果,簡單說,子博弈精練納什均衡要求均

13、衡策略的行為規(guī)則在每一個信息集上是最優(yōu)的。策略的表述策略:參與人在給定信息集的情況下選擇行動的規(guī)則,策略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人它規(guī)定參與人在什么情況下選擇什么行動,是參與人的的“相機行動方案相機行動方案”。 個人選擇的戰(zhàn)略表示第)稱為一個戰(zhàn)略組合,(維向量戰(zhàn)略,個參與人每人選擇一個如果戰(zhàn)略集合個參與人所有可選擇的代表第個參與人的特定戰(zhàn)略表示第issssssnnisSisiniiii21在靜態(tài)博弈中,策略和行動是相同的。作為一種行動規(guī)則,策略必須是完備的。擴展式表述博弈的納什均衡足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-

14、1)(0,0)(2,1)xx男的策略:足球,芭蕾選擇足球;還是選擇芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追隨策略:他選擇什么,我就選擇什么2、對抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不管他選什么,我都選芭蕾;4、足球策略:不管他選什么,我都選足球。策略即:如果他選擇什么,我就怎樣行動的相機行動方案。在擴展式博弈里,參與人是相機行事,即“等待”博弈到達一個自己的信息集(包含一個或多個決策結后,再采取行動方案。擴展式表述博弈的納什均衡n若A先行動,B在知道A的行動后行動,則A有一個信息集,兩個可選擇的行動,策略空間為:(:(開發(fā),不開發(fā))開發(fā),不

15、開發(fā));nB有兩個信息集,四個可選擇的行動,B有四個純策略:開發(fā)策略:不論開發(fā)策略:不論A A開發(fā)不開發(fā),我開發(fā);開發(fā)不開發(fā),我開發(fā);追隨策略:追隨策略:A A開發(fā)我開發(fā),開發(fā)我開發(fā),A A不開發(fā)我不開發(fā);不開發(fā)我不開發(fā);對抗策略:對抗策略:A A開發(fā)我不開發(fā),開發(fā)我不開發(fā),A A不開發(fā)我開發(fā);不開發(fā)我開發(fā);不開發(fā)策略不論不開發(fā)策略不論A A開發(fā)不開發(fā)我不開發(fā),開發(fā)不開發(fā)我不開發(fā),n簡寫為:簡寫為:n(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開(不開發(fā),開發(fā)),(不開發(fā),不開發(fā)),發(fā)),括號內(nèi)的第一個元素對應括號內(nèi)的第一個元素對應A A選

16、擇選擇“開發(fā)開發(fā)”時時B B的選擇,第二個元素對應的選擇,第二個元素對應A A選擇選擇“不開發(fā)不開發(fā)”時時B B的選擇。的選擇。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx什么是參與人什么是參與人的策略?的策略?擴展式擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商開發(fā)商B B開發(fā)商開發(fā)商A A策略式策略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx開發(fā),(開發(fā),開發(fā))納什均衡與均衡結果:納什均衡與均衡結果:存在三個純策

17、略納什均衡:存在三個純策略納什均衡: ( (不開發(fā),(開發(fā),開發(fā)),不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā))兩個均衡結果:兩個均衡結果: (開發(fā),不開發(fā))(開發(fā),不開發(fā)) (不開發(fā),開發(fā))(不開發(fā),開發(fā))注意:均衡不同于均衡結果注意:均衡不同于均衡結果擴展式擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商開發(fā)商B B開發(fā)商開發(fā)商A A策略式策略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(

18、0,0)不開發(fā)xx開發(fā),(開發(fā),開發(fā))路徑路徑在擴展式博弈中,所有在擴展式博弈中,所有n n個參與人個參與人的一個純策略組合決定了博弈樹的一個純策略組合決定了博弈樹上的一個路徑。上的一個路徑。(開發(fā),(開發(fā), 不開發(fā),開發(fā)不開發(fā),開發(fā) )決定)決定了博弈的路徑為了博弈的路徑為A A開發(fā)開發(fā)B B不不開發(fā)開發(fā)-(1 1,0 0)(不開發(fā),(不開發(fā), 開發(fā),開發(fā)開發(fā),開發(fā) )決定)決定了路徑:?了路徑:?子博弈精煉納什均衡n澤爾騰引入子博弈精練納什均衡概念的目的是將那些不可置信威脅策略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預測結果,簡單說,子博弈精練納什均衡要求均衡策略的行為規(guī)則在每

19、一個信息集上是最優(yōu)的。子博弈精煉納什均衡-不可置信威脅n美國普林斯頓大學古爾教授古爾教授在1997年的經(jīng)濟學透視里發(fā)表文章,提出一個例子說明威脅的可信性威脅的可信性問題:n兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關起來,關起來比沒有玩具更可怕。現(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。各個想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,因此哥哥對弟弟的警告置之不理。n的確,如果弟弟是會算

20、計自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢?,弟弟是理性人,他的告狀威脅是不可置信的。子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)( (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā)) 如果A選擇開發(fā),B的最優(yōu)選擇是不開發(fā),如果A選擇不開發(fā),B的最優(yōu)選擇是開發(fā),A預測到自己的選擇對B的影響,因此開發(fā)是A的最優(yōu)選擇。子博弈精練納什均衡結果是:A選擇開發(fā),B選擇不開發(fā)。xx 對于對于( (不開發(fā),(開發(fā),開發(fā)),不開發(fā),(開發(fā),

21、開發(fā)),這個組合之所以構成納什均衡,是因這個組合之所以構成納什均衡,是因為為B B威脅不論威脅不論A A開發(fā)還是不開發(fā),他都開發(fā)還是不開發(fā),他都將選擇開發(fā),將選擇開發(fā),A A相信了相信了B B的威脅,不開的威脅,不開發(fā)是最優(yōu)選擇,但是發(fā)是最優(yōu)選擇,但是A A為什么要相信為什么要相信B B的威脅呢?的威脅呢? 畢竟,如果畢竟,如果A A真開發(fā),真開發(fā),B B選擇開發(fā)選擇開發(fā)得得-3-3,不開發(fā)得,不開發(fā)得0 0,所以,所以B B的最優(yōu)選擇的最優(yōu)選擇是不開發(fā)。如果是不開發(fā)。如果A A知道知道B B是理性的,是理性的,A A將選擇開發(fā),逼迫將選擇開發(fā),逼迫B B選擇不開發(fā)。自選擇不開發(fā)。自己得己得1

22、 1,B B得得0 0,即納什均衡,即納什均衡( (不開發(fā),不開發(fā),(開發(fā),開發(fā))是不可置信的。因(開發(fā),開發(fā))是不可置信的。因為它依賴于為它依賴于B B的一個不可置信的威脅。的一個不可置信的威脅。 同樣:同樣: (不開發(fā),不開發(fā))也是一(不開發(fā),不開發(fā))也是一個不可置信威脅,納什均衡(開發(fā)個不可置信威脅,納什均衡(開發(fā), ,(不(不開發(fā),不開發(fā))是不合理的。開發(fā),不開發(fā))是不合理的。子博弈精練納什均衡n澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅策略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預測結果,簡單說,子博弈精練納什均衡要求均衡策略的行為規(guī)則在每一個信息集上是

23、最優(yōu)的。n什么是子博弈,什么是子博弈精練納什均衡?n有沒有更好的方法找到子博弈精練納什均衡?完全信息動態(tài)博弈n子博弈:是原博弈的一部分,它本身也可以作為一個獨立的博弈進行分析:(1)子博弈必須從一個單結信息點開始:只有決策者在原博弈中確切地知道博弈進入一個特定的決策結時,該決策結才能作為一個子博弈的初始結。如果信息集包含兩個以上的決策結,則這兩個都不可以作為子博弈的初始結(見下頁)。(2)子博弈的信息集和支付向量都直接繼承自原博弈,即當x和x在原博弈中屬于同一信息集時,他們在子博弈中才屬于同一信息集。n習慣上,任何博弈的本身稱為自身的一個子博弈。A開發(fā)不開發(fā)XX大小1/21/2大小1/21/2

24、BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 參與人X的信息集不能開始一個子博弈,否則的話,參與人B的信息將被切割。完全信息動態(tài)博弈不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx不開發(fā)開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II房地產(chǎn)開發(fā)博弈A坦白抵賴BB坦白抵賴坦白(-8,-8)(0,-10)(-10,0) (-1,-1)找出房地產(chǎn)開發(fā)博弈的子博弈找出房地產(chǎn)開發(fā)博弈的子博弈( (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開

25、發(fā)不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā))完全信息動態(tài)博弈n子博弈精練納什均衡: 擴展式博弈的策略組合是一個子博弈精練納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個子博弈上給出納什均衡。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))在c上構成均衡,在b上不構成; 在b和c上都構成 在c上構成均衡,在b上不構成完全信息動態(tài)博

26、弈不開發(fā) 判斷下列均衡結果哪個構成子博弈精練納什均衡?不開發(fā)bc完全信息動態(tài)博弈n如果一個博弈有幾個子博弈,一個特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”,博弈樹上的其他路徑稱為“非均衡路徑”。n納什均衡只要求均衡策略在均衡路徑的決策結上是最優(yōu)的;n而構成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結上也是最優(yōu)的。這是納什均衡與子博弈精練納什均衡的實質(zhì)區(qū)別。完全信息動態(tài)博弈n策略是參與人行動規(guī)則的完備描述完備描述,它要告訴參與人在每一種可預見的情況下每一種可預見的情況下(即每一個決策結)上選擇什么行動,即使這種情況實際上沒有發(fā)生(甚至

27、參與人并不預期它會發(fā)生)。n因此,只有當一個策略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個合理的可置信的策略,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動規(guī)則。第三章 完全信息動態(tài)博弈 n一 博弈擴展式表述n二 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子博弈精練納什均衡承諾行動與子博弈精練納什均衡逆向歸納法與子博弈精練納什均衡的存在問題n三 應用舉例用逆向歸納法求子博弈精練納什均衡子博弈精練納什均衡1UDL(3,1)(0,0)22,2R 給定博弈達到最后一個決策結,該決策結上行動的參與人有一個最優(yōu)選擇,這個最優(yōu)選

28、擇即該決策結開始的子博弈的納什均衡 倒數(shù)第二個決策結,找倒數(shù)第二個的最優(yōu)選擇,這個最優(yōu)選擇與我們在第一步找到的最優(yōu)選擇構成一個納什均衡。 如此重復直到初始結。每一步都得到對應于子博弈的一個納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈的納什均衡,這個過程的最后一步得到整個博弈的納什均衡完全信息動態(tài)博弈n用逆向歸納法求子博弈精練納什均衡 對于有限完美信息博弈,逆向歸納法求解子博弈精練納什均衡是一個最簡便的方法。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈完全信息動態(tài)博弈1UDL(1,1)22,0RU(3,0)(0,2)1D 子博弈精練納什

29、均衡(U,U),L). U和L分別是參與人1和參與人2在非均衡路徑上的選擇。 逆向歸納法求解子博弈精練納什均衡的過程,實質(zhì)上是重復剔除劣策略的過程:從最后一個決策結依次剔除每個子博弈的劣策略,最后生存下來的策略構成精練納什均衡。完全信息動態(tài)博弈n用逆向歸納法求解的子博弈精練納什均衡也要求“所有的參與人是理性的”是共同知識。n如果博弈由多個階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。完全信息動態(tài)博弈進入者進入不進入(0,300)在位者市場進入阻撓博弈樹不可置信威脅支付函數(shù)行動合作(40,50)斗爭(-10,0)承諾行動與子博弈精練納什均衡n承諾行動與子博弈精練納什均衡n有些策略之所以

30、不是精練納什均衡,是因為它包含了不可置信的威脅策略,如果參與人能在博弈之前采取某種行動改變自己的行動空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會隨之改變。n這些改變博弈結果而采取的措施稱為承諾行動。n完全承諾: 承諾可以使某項行動完全沒有可能(破釜沉舟)。n不完全承諾: 承諾只是增加了某個行動的成本而不是使該活動完全沒有可能。承諾行動與子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈如果在A決策之前,B與某客戶簽定了一個合同,規(guī)定B若不在特定時期內(nèi)開發(fā)若干面積的寫字樓,則將支付違約金3.5,這個合同就是承諾行

31、動。(1,-3.5)不可置信威脅n精煉納什均衡剔除了不可置信的威脅,使得我們可以更合理地對博弈中參與人行為的預測;n不可置信威脅的根源是事前最優(yōu)與事后最優(yōu)不同,導致許多均衡結果無法實現(xiàn);n管教孩子為什么困難?n家族企業(yè)為什么難以實行制度化管理?一個例子n苦惱的父母:如何處置與人私奔的女兒?Eg. 司馬相如與卓文君承諾n承諾是將不可置信的威脅變成可置信的威脅的行動:威脅不僅是事前最優(yōu)的,也是事后最優(yōu)的。n承諾意味著限制自己的自由:選擇少反而對自己好。n如“破釜沉舟”的故事。承諾舉例n婚姻中的承諾:彩禮、昂貴的婚禮可以理解為一種對婚姻的承諾;n訂金、抵押物做為對交易的承諾;n“安營扎寨”;n固定資產(chǎn)投資可以作為承諾;n所有權的承諾作用;最惠條款n生產(chǎn)耐用品的企業(yè)經(jīng)常被“降價預期”所困擾:如果消費者預期企業(yè)將降價,他們將會等待,結果,企業(yè)只能降價。如汽車行業(yè)面臨的問題;n最惠條款可以起到承諾的作用:企業(yè)不會降價了。畫家和政府的苦惱n名畫的價值取決于數(shù)量,畫家常為無法承諾而苦惱:誰相信他不會再畫呢?這可能是為什么死了畫家的畫最值錢。n政府也有類似的問題。政府經(jīng)常缺乏承諾:給定投資者進入的情況下,多征稅是最優(yōu)的;但投資者預期到這一點,將不愿意進入。n中國許多地方政府有嚴重的機會主義行為。n“坦白從寬,抗拒從嚴”面臨的問題也如此。作為承諾的法律n法律改變事后的選擇空間或選擇成本,所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論