第14章精煉貝葉斯Nash均衡的精煉

上傳人：2*** IP屬地：湖北上傳時間：2022-03-23 格式：PPT 頁數(shù)：85 大?。?60.50KB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩80頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四部分：不完全信息動態(tài)博弈第十四章第十四章精煉貝葉斯精煉貝葉斯Nash均均衡的精煉衡的精煉主要內(nèi)容：一、精練貝葉斯Nash均衡的精煉二、其它形式的精煉均衡Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng主要內(nèi)容：一、精練貝葉斯Nash均衡的精煉二、其它形式的精煉均衡第十四章第十四章精煉貝葉斯精煉貝葉斯Nash均衡的精煉均衡的精煉Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 一個

2、博弈問題可能存在多個精煉貝葉斯Nash均衡，需要對精煉貝葉斯Nash均衡進(jìn)行精煉，最簡單和直接的方法就是對非均衡路徑上的信念施加一些直觀、合理的限制。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 常用的設(shè)定參與人在非均衡路徑上信念的方法有兩種：剔除劣戰(zhàn)略法和直觀標(biāo)準(zhǔn)。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1. 剔除劣戰(zhàn)略剔除劣戰(zhàn)略產(chǎn)生精煉貝葉斯Nash均衡多重性的一個重要原

3、因就是精煉貝葉斯Nash均衡的定義對參與人在非均衡路徑上的信念如何設(shè)定，沒有給出明確的定義或規(guī)定。因此，當(dāng)博弈存在多個精煉貝葉斯Nash均衡時，到底哪一個均衡會實(shí)際出現(xiàn)，在很大程度上就依賴于如何定義或規(guī)定參與人在非均衡路徑上的信念。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在精煉貝葉斯Nash均衡中，沒有參與人的戰(zhàn)略包含始于任何信息集的嚴(yán)格劣戰(zhàn)略，因此，精煉貝葉斯Nash均衡排除了參與人選擇的戰(zhàn)略包含始于任何信息集的嚴(yán)格劣戰(zhàn)略的可能性。Control Science and En

4、gineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在精煉貝葉斯Nash均衡中，任何參與人都不應(yīng)該認(rèn)為其他參與人選擇嚴(yán)格劣戰(zhàn)略(或含有始于某個信息集的嚴(yán)格劣戰(zhàn)略的戰(zhàn)略)的概率大于0。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng例如:21 p1pLMLLRRR4,22,02,12,23,34,22,02,12,23,33,3LMRLR12Control Science and Engineering, HUST All Right

5、s Reserved, 2007, Luo Yunfeng 博弈存在兩個純戰(zhàn)略Nash均衡(L,L )和 (R,R )；兩個純戰(zhàn)略精煉貝葉斯Nash均衡(L,L),p=1)和(R,R ),p1/3) Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng M是參與人l的一個嚴(yán)格劣戰(zhàn)略，因此，要讓參與人2相信l可能選擇了M是不合理的，1-p不可能為正，于是p一定等于l。如果推斷1-p0不合理，則(R,R),p1/3)不再是精煉貝葉斯Nash均衡。此時，只有(L,L),p=1)成為滿足這一要求的惟

6、一的純戰(zhàn)略精煉貝葉斯Nash均衡。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng例如:11 p1pLMAABBR2,40,21,22,23,31,22BA1x2x3x2,41,23,30,22,23,31,21,21,21,21,21,2LRM,A A,A B12,B B,B AControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng M并不是參與人2在整個博弈中的嚴(yán)格劣戰(zhàn)略，但在參與人1選擇A

7、的情況下(即假設(shè)參與人1將戰(zhàn)略B剔除的情況下)，M卻是參與人2在信息集I2(x1)的嚴(yán)格劣戰(zhàn)略。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng信息集的嚴(yán)格劣戰(zhàn)略: 考慮輪到參與人行動的一個信息集。戰(zhàn)略si*為始于這一信息集的嚴(yán)格劣戰(zhàn)略，如果存在另一個戰(zhàn)略si使得對i在給定信息集可能持有的每一推斷，并且對每一其他參與人后續(xù)戰(zhàn)略可能的組合，i在給定信息集根據(jù)si選擇行動并在其后根據(jù)si選擇后續(xù)戰(zhàn)略得到的收益，嚴(yán)格大于根據(jù)si*選擇行動和后續(xù)戰(zhàn)略得到的收益。Control Science and

8、 Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng信念精煉標(biāo)準(zhǔn)信念精煉標(biāo)準(zhǔn)1(C1)：在可能的情況下，在每一參與人均衡路徑之外的推斷中，如果一個節(jié)點(diǎn)只有在另一參與人選擇始于某些信息集的嚴(yán)格劣戰(zhàn)略時，才能夠到達(dá)，則應(yīng)認(rèn)定到達(dá)這一節(jié)點(diǎn)的概率為0。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng例如:jLLLRRR4,13,23,22,3jLLLRRR4,23,43,21,1i r1 r q p1p1qijABix1ixjx1jx2

9、jx3jxControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng,L L,L RRLj,R L,R RjiAB4,14,13,23,23,23,22,32,34,23, 44,23,43,21,13.21,1,L L,L R,R L,R RRLiiControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 無論參與人i在信息集Ii(xi,xi+1)上的信念如何，R是參與人i在(即始于信息集Ii(xi,xi

10、+1)的后續(xù)博弈)上的嚴(yán)格劣戰(zhàn)略，因此，根據(jù)信念精煉標(biāo)準(zhǔn)1可得：1-p=0，1-q=0。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng注意：信念精煉標(biāo)準(zhǔn)1只是“在可能的情況下”，作為精煉參與人在均衡路徑之外推斷的標(biāo)準(zhǔn)，并非任何情況下都適用。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng例如：21 p1pLMLLRRR2,20,22,12,23,31x2xControl Science

11、 and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 參與人1，M和R都劣于L。在這種情況下，不可能在推斷中令到達(dá)節(jié)點(diǎn)x1和x2的概率都為0，于是信念精煉標(biāo)準(zhǔn)1不再適用。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng對于信號博弈的精練貝葉斯Nash均衡，可將信念精煉標(biāo)準(zhǔn)1重新表述如下。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo

12、Yunfeng 在信號博弈中，M中的信號mj稱為T中類型ti的劣信號，如果存在另外一個信號mj，使得ti選擇mj的最小可能收益大于ti選擇mj的最大可能收益，即,kksijksijkaAaAMinut m aMaxut m aControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng信號條件信號條件(5) 如果mj之后的信息集處于均衡路徑之外，且mj為類型ti的劣信號，則(在可能的情況下)接收者的推斷中，認(rèn)為發(fā)送者的類型為ti的概率應(yīng)該等于0(只要mj不對T中所有的類型都是劣信號，即為適用這一條件的

13、可能情況)。 ijp t mControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng例如：1tRL p quudd3,22,00,11,02tRLuudd1,01,10,02,1接收者接收者1q1p0.50.5自然Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 對q1/2，戰(zhàn)略和推斷(L,L),(u,u),p=0.5,q構(gòu)成博弈的一個混同精煉貝葉斯Nash均衡。Control Science a

14、nd Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 由于類型為t1的發(fā)送者選擇R的最大收益為1，而選擇L的最小收益為2，因此，發(fā)送者的戰(zhàn)略(R, L)和(R, R)為始于類型為t1的發(fā)送者的信息集的嚴(yán)格劣戰(zhàn)略。所以，根據(jù)信號條件(5)，q=0。因此，博弈的精煉貝葉斯Nash均衡(L,L),(u,u),p=0.5, q1/2不滿足信號條件(5)。分離精煉貝葉斯Nash均衡(L,R),(u,d),p=1,q=0則自然滿足信號條件(5)。Control Science and Engineering, HUST All Right

15、s Reserved, 2007, Luo Yunfeng考察下面的例子：1tRL p quudd3,22,00,11,02tRLuudd1,01,10,12,0接收者接收者1q1p0.50.5自然發(fā)送者發(fā)送者Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 對任意的q值都是一個混同精煉貝葉斯Nash均衡，于是(L,L),(u,u),p=0.5,q=0就是一個滿足信號條件(5)的混同精煉貝葉斯Nash均衡。Control Science and Engineering, HUST All R

16、ights Reserved, 2007, Luo Yunfeng 對Spence勞動力市場模型的分析可以看到，在模型中存在大量的混同、分離以及雜合精煉貝葉斯Nash均衡。但這些均衡中，并非所有的都能滿足信號條件(5)。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 對于Spence勞動力市場模型，在任意的精煉貝葉斯Nash均衡中，如果工人選擇教育水平e，且企業(yè)據(jù)此推斷工人是高能力的概率為，則工人的工資將等于Hp te ,(1),HHHLw ep ter tep ter teContro

17、l Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 所以，不論企業(yè)在觀測到e之后所持有的推斷如何，低能力工人選擇e*(L)的無差異曲線不會在IL的下方，而選擇任何ees時的無差異曲線都不會位于IL的上方，因此，根據(jù)信號條件(5)，對低能力的工人而言，任何大于es的教育水平e都是劣信號。所以，對，有。See 0Lp t e Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在此推斷下，高能力工人選擇

18、任何ees的無差異曲線都位于IH的下方，因此，教育水平es是高能力工人對給定企業(yè)的戰(zhàn)略與推斷的最優(yōu)反應(yīng)，所以，高能力工人e=es選擇是滿足信號條件(5)的分離均衡。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 與此同時，高能力工人選擇任何的分離均衡都不能滿足信號條件(5)，因?yàn)樵谶@樣一個均衡中企業(yè)必須對任意給出推斷，而這與相矛盾。 See, See e1Hp te 1()HSp teeeControl Science and Engineering, HUST All Righ

19、ts Reserved, 2007, Luo Yunfeng該均衡是惟一滿足信號條件(5)的分離均衡we *LetSe,HSr te *LwtLIHI,Hr te,Lr teControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 當(dāng)均衡滿足信號條件(5)時，對因此，在均衡中高能力工人的無差異曲線都不會位于IH的下方。因此，分兩種情況討論滿足信號條件(5)的混同及雜合精煉貝葉斯Nash均衡。 ,1SHeep te Control Science and Engineering, HUST All

20、 Rights Reserved, 2007, Luo Yunfeng例如：假設(shè)工人是高能力的概率q足夠低，使得工資函數(shù) 處于高能力工人通過點(diǎn) 的無差異曲線IH的下方。 ,(1),HLw eq r teqr te,SHSer teControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfengwe *LetSe,HSr te *LwtLIHI,Hr te,Lr te,(1),HLqr teq r teControl Science and Engineering, HUST All Rights Rese

21、rved, 2007, Luo Yunfeng不存在滿足信號條件(5)的混同精煉貝葉斯Nash均衡。we*LetSe,HSr te *LwtLIHI,Hr te,Lr te,(1),HLqr teq r teLIHIpeControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng不存在滿足信號條件(5)的雜合精煉貝葉斯Nash均衡。首先，不存在高能力工人隨機(jī)選擇信號的雜合均衡。其次，也不存在低能力工人隨機(jī)選擇信號的雜合均衡 Control Science and Engineering, HUST

22、All Rights Reserved, 2007, Luo Yunfeng不存在高能力工人隨機(jī)選擇信號的雜合均衡we( , )Lr te(, )Hr teHILI*()Hw t*()Lw t*()He t*()Le tLIHIControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng不存在低能力工人隨機(jī)選擇信號的雜合均衡 we *LetSe,HSr te *LwtLIHI,Hr te,Lr te,(1),HLqr teq r teHIle lw e,(1),HLvr tev r teControl

23、Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng再例如：假設(shè)工人是高能力的概率q足夠高，使得工資函數(shù) 與高能力工人通過點(diǎn) 的無差異曲線相交。 ,(1),HLw eq r teqr te( ,)sHSe r teControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng給定的生產(chǎn)函數(shù)和無差異曲線如下圖1和圖2所示we *LetSe,HSr te *LwtLIHI,Hr te,Lr te,(1),HLqr teq

24、r teeeLIHIpe圖1Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng給定的生產(chǎn)函數(shù)和無差異曲線如下圖1和圖2所示we *LetSe,HSr te *LwtLIHI,Hr te,Lr te,(1),HLqr teq r teee圖2Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng因此，有以下結(jié)論：不存在低能力工人隨機(jī)選擇信號且滿足信號條件(5)的雜合均衡。存在滿足信號條件(5)的混

25、同均衡，混同教育水平ep滿足：。存在高能力工人隨機(jī)選擇信號且滿足信號條件(5)的雜合均衡，混同發(fā)生點(diǎn) 位于圖2中陰影區(qū)域之內(nèi)。 ,pee e (,)hhe w eControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng2.直觀標(biāo)準(zhǔn) 利用剔除劣戰(zhàn)略的方法(即根據(jù)信念精煉標(biāo)準(zhǔn)1)，可以將許多不合理的精煉貝葉斯Nash均衡剔除掉，但是，在信號博弈中，仍可發(fā)現(xiàn)許多滿足信號條件(5)但卻與直覺不相符的均衡。 Control Science and Engineering, HUST All Rights R

26、eserved, 2007, Luo Yunfeng例如：“啤酒或熱狗”信號博弈 1t啤酒熱狗 p q沖突不1,13,00,12,02t0,-12,01,-13,0接收者接收者1q1p0.10.9自然軟弱型粗暴型不不不沖突沖突沖突熱狗啤酒Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng各方收益情況表現(xiàn)出如下特征：軟弱類型發(fā)送者偏好選擇熱狗作早餐，粗暴類型發(fā)送者偏好啤酒；與早餐吃什么相比，兩種類型發(fā)送者更關(guān)心是否與接收者發(fā)生沖突；接收者則偏好與軟弱類型發(fā)送者挑起沖突，但不希望與粗暴類型發(fā)送者挑

27、起沖突。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在這一博弈中，(熱狗, 熱狗), (不沖突, 沖突), p=0.1,q1/2 構(gòu)成一個混同精煉貝葉斯Nash均衡，而且這一均衡滿足信號條件(5)，因?yàn)槠【茖煞N類型的發(fā)送者都不是劣信號。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 但是，上述均衡要求：如果接收者意料之外地觀測到啤酒，則他推測發(fā)送者至少有一半的可能性是軟弱型(即q

28、1/2)，這種推斷十分令人懷疑。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng均衡劣信號給定信號博弈中的一個精煉貝葉斯Nash均衡，M中的信號mj稱為T中類型ti的均衡劣信號，如果ti的均衡收益u*(ti)，大于ti選擇mj時最大的可能收益，即 *,kisijkaAutMaxut m aControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng信號條件(6)直觀標(biāo)準(zhǔn) 在可能的情況下，如果mj之后

29、的信息集處于均衡路徑之外，且mj為類型ti的均衡劣信號，則接收者的推斷中分配給類型ti的概率應(yīng)該等于0 (如果mj不對T中所有的類型都是均衡劣信號，即屬要求中的“可能情況”)。ijp t mControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng “啤酒或熱狗”證明了一個信號mj可以是ti的均衡劣信號，即使它不是ti的劣信號。不過，如果mj為ti的劣信號，則mj一定為ti的均衡劣信號，于是信號條件(6)的限定使得信號條件(5)成為多余。Control Science and Engineering

30、, HUST All Rights Reserved, 2007, Luo Yunfeng例如：考察下圖所示的混同的均衡 we *LetSe,HSr te *LwtLIHI,Hr te,Lr te,(1),HLqr teq r teeepepwLIHIControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 不存在滿足信號條件(6)的混同精煉貝葉斯Nash均衡。也不存在滿足信號條件(6)的雜合均衡。于是，滿足信號條件(6)的惟一精煉貝葉斯Nash均衡就是下圖所示的分離均衡。Control Sci

31、ence and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng惟一精煉貝葉斯Nash均衡分離均衡we *LetSe,HSr te *LwtLIHI,Hr te,Lr teControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng主要內(nèi)容：一、精練貝葉斯Nash均衡的精煉二、其它形式的精煉均衡第十四章第十四章精煉貝葉斯精煉貝葉斯Nash均衡的精煉均衡的精煉Control Science and Engineering, HUST Al

32、l Rights Reserved, 2007, Luo Yunfeng 對于不完全信息博弈，除了定義精煉貝葉斯Nash均衡以外，還可以用其它的方式定義精煉均衡。下面介紹兩種常用的精煉均衡，一種是定義在擴(kuò)展式博弈上的序貫均衡序貫均衡，一種是定義在戰(zhàn)略式博弈上的顫抖手精煉均衡顫抖手精煉均衡。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1.序貫均衡 Kreps和Wilson(1982)定義在擴(kuò)展式博弈上的一種新的精煉均衡序貫均衡(sequential equilibrium)，最大優(yōu)點(diǎn)就在于

33、它可以將貝葉斯法則應(yīng)用于任何博弈路徑(包括均衡路徑和非均衡路徑)，克服精煉貝葉斯Nash均衡中當(dāng)零概率事件發(fā)生時無法修正后驗(yàn)概率的不足。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 給定一個擴(kuò)展式博弈，用X表示決策結(jié)的集合，表示一個特定的決策結(jié)，Ii(x)表示參與人i的包含決策結(jié)x的信息集；i(|x)表示參與人i在x(或Ii(x)上的混合戰(zhàn)略，表示所有戰(zhàn)略組合(1, 2, n)的集合。 xXControl Science and Engineering, HUST All Right

34、s Reserved, 2007, Luo Yunfeng 給定，P(x)和P(Ii(x)分別表示博弈到達(dá)決策結(jié)x和信息集Ii(x)的概率。 (x)表示給定博弈到達(dá)信息集Ii(x)的情況下參與人i在Ii(x)上的信念(即概率分布)，表示所有(x)的集合(即信念系統(tǒng))。 ui(| Ii(x), (x)表示參與人i在Ii(x)上的期望效用。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 給定一個混合戰(zhàn)略，如果對于所有的信息集I和，，即參與人i選擇每一個行動的概率嚴(yán)格為正，則為一個嚴(yán)格混合

35、戰(zhàn)略。( )iaA I(| )0iiaIControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 令表示所有嚴(yán)格混合戰(zhàn)略組合的集合，若，則對于所有的決策結(jié)x，，因此，貝葉斯法則在每一個信息集上都有定義：00( )0Px( )( )/( ( )ixPxPI xControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng序貫均衡 (,)是一個序貫均衡，如果它滿足下列兩個條件：(S) (,)是序貫理性的(se

36、quential rational)，即對于所有的信息集Ii(x)和任何可選擇的戰(zhàn)略i，；(C) (,)是一致的(consisitent)，即存在一個嚴(yán)格混合戰(zhàn)略組合序列m和貝葉斯法則決定的概率序列m，使得(,)是(m,m)的極限即。(|( ), ( )(,|( ), ( )iiiiiiuI xxuI xx ( ,)lim(,)mmm Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng例子：當(dāng)博弈到達(dá)參與人1的信息集時，參與人1認(rèn)為(x)=1/3 ，(x)=2/3。xxyyUDDU121

37、/32/31010Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 無論處于哪一個決策結(jié)，參與人1的最優(yōu)戰(zhàn)略都是U，因此，參與人2的信息集是非均衡路徑。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 如果參與人1偏離均衡選擇D，參與人2的后驗(yàn)概率應(yīng)該如何設(shè)定呢？因?yàn)閰⑴c人1不能區(qū)分x和x，所以，可以認(rèn)為參與人1在兩個決策結(jié)上偏離的可能性都是一樣的。在這種情況下，參與人2的信念可以設(shè)

38、為(y)=1/3 ，(y)=2/3 。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 如果根據(jù)精煉貝葉斯Nash均衡的定義，就無法對參與人2的這種信念給出合理的解釋，因?yàn)檫x擇D是零概率事件，參與人2的任何信念(y)都與貝葉斯法則相容。但是，序貫均衡中一致性條件(C)卻可以給出正確的結(jié)論。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 考慮收斂于0的序列 (其中 )，并將解釋為參與

39、人1“顫抖”并繼續(xù)博弈下去的概率。對于這個序列m01m( )1( )( )( )3mmmmmmmxyxxControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 參與人1從決策結(jié)x“顫抖”地到達(dá)y的概率為，從決策結(jié)x “顫抖”地到達(dá)y的概率為，參與人1不能區(qū)分x和x，所以參與人2相信“顫抖”地到達(dá)y的概率應(yīng)為上式所示的條件概率。這樣，“顫抖”就保證了參與人2的后驗(yàn)概率尊重了原來的信息結(jié)構(gòu)。( )mx( )mxControl Science and Engineering, HUST All Ri

40、ghts Reserved, 2007, Luo Yunfeng Fudenberg和Tirole(1991)證明：在多階段不完全信息博弈中，如果每個參與人最多只有兩個類型，或者博弈只有兩個階段，那么精煉貝葉斯Nash均衡與序貫均衡是重合的。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng Kreps和Wilson(1982)證明：在“幾乎所有的”博弈中，序貫均衡與精煉貝葉斯Nash均衡是相同的。由于要檢查一個給定的“評估” (,)是否滿足一致性條件是非常繁瑣，相對而言，精煉貝葉斯Nash

41、均衡更為直觀和容易定義，所以，習(xí)慣上大多數(shù)學(xué)者喜歡使用精煉貝葉斯Nash均衡這個概念而不是序貫均衡。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng2. 顫抖手精煉均衡 “顫抖手精煉均衡”(trembling-hand perfect equilibrium)是Selten在改進(jìn)子博弈精煉Nash均衡時提出的一種精煉均衡。它的基本思想是，在任何一個博弈中，每一個參與人都有一定的可能性犯錯誤；一個戰(zhàn)略組合，只有當(dāng)它在允許所有參與人都可能犯錯誤時仍是每一個參與人的最優(yōu)戰(zhàn)略組合時，才是一個均衡。

42、 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 給定一個戰(zhàn)略式博弈，對參與人i的某個戰(zhàn)略i，我們可以對任意固定的正數(shù)0構(gòu)造一個嚴(yán)格混合戰(zhàn)略，使得對如果當(dāng)趨于0時，收斂于i(即 )。此時，嚴(yán)格混合戰(zhàn)略序列就是參與人i采用戰(zhàn)略i時發(fā)生的顫抖。 iiisS ( )iisi0limiiiControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 顫抖可以解釋為參與人i采用戰(zhàn)略i時發(fā)生了“小錯誤”。設(shè)(1, 2, n)，嚴(yán)格混合戰(zhàn)略組合序列即為參與人采用戰(zhàn)略組合時發(fā)生的顫抖。1(,)nControl Science and Engineering, HUST All Rights Reserved, 2007,

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第14章精煉貝葉斯Nash均衡的精煉

文檔簡介

溫馨提示

最新文檔

評論

第14章精煉貝葉斯Nash均衡的精煉

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔