第12章精煉貝葉斯Nash均衡_第1頁
第12章精煉貝葉斯Nash均衡_第2頁
第12章精煉貝葉斯Nash均衡_第3頁
第12章精煉貝葉斯Nash均衡_第4頁
第12章精煉貝葉斯Nash均衡_第5頁
已閱讀5頁,還剩71頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第四部分:不完全信魚動態(tài)博弈第十二章精煉貝葉斯Nash均衡主要內(nèi)宕:,均衡的精煉與信念二、信念設(shè)定三、精煉貝葉斯Nash均衡5、 JL種均衡概念的比較第十二章精煉貝葉斯Nash均衡主要內(nèi)彖:一、均衡的精煉與信念二、信念設(shè)定三、精煉貝葉斯Nash均衡四、幾種均衡概念的比較在完全信息動態(tài)博弈中,假設(shè)/為一子博 弈精煉Nash均衡,那么在參與人采用均 衡戰(zhàn)略s*的情況下,不管博弈的進(jìn)程如何 或是否發(fā)生,每個參與人的戰(zhàn)略對從任一決策結(jié)開始的子博弈(或在其后輪著他采取的行動)都是最優(yōu)的o子博弈精煉Nash均衡中的這種“均衡精煉”的恩、想,也可應(yīng)用到不完全信息擴(kuò)展式博弈中。作為上述“均衡精煉恩想的自然應(yīng)用

2、,必然要求每個參與人的均衡戰(zhàn)略在其每 個信息集上都為最優(yōu)。Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng例如Control Science and Engineering, HUST1RAll Rights Reserved, 2007, Luo Yunfeng不僅要求參與人2的均衡由單決策 結(jié)構(gòu)成的信息集上最優(yōu),而且還要求參 與人3的均衡戰(zhàn)略在由多決策結(jié)構(gòu)成的信 息集和上最優(yōu)。但對于住于由多決策結(jié)構(gòu)成的信息集(厶 (兀4,兀5)或厶(兀6,兀7)上的參與人3,當(dāng)輪 到他行動肘,由于對己發(fā)生

3、的易史即參 與人2是選擇了厶還是尺并不請楚,因此 也就不知道自己是住于決策結(jié)百(或兀6)還 是決策結(jié)兀5 (或兀7)上。在這種情況下,參與人3對信息集 (厶(兀4,兀5)或厶(兀6,兀7)后的博弈進(jìn) 程就不請楚,因而對自己的選擇所 導(dǎo)致的博弈結(jié)果也就不請楚,從而 使得參與人3無由確定自己的最優(yōu) 行動。雖然住于多決策結(jié)信息集上的參與人, 對自己到底住于信息集中哪一個決策結(jié) 上不能給出一個朗確的判斷7但一般情況下還是能夠?qū)ρ鹤∮谀囊粋€決策結(jié),給出一個“丸概的估計”當(dāng)住于多決策結(jié)信息集上的參與人能夠用 個走義在該信息集上的概率分布,來對 i己住于哪一個決策結(jié)進(jìn)行描述肘,就稱 參與人在該信息集上具有

4、了關(guān)于自己住于 哪一個決策結(jié)的信念(或推斷)。而當(dāng)參與 人具有了關(guān)于自己住于哪一個決策結(jié)的信 念(或推斷)肘,就可借助這種宿念(或推斷) 來指導(dǎo)自己的決策(或選擇)??疾烊缦峦耆煌昝佬畔討B(tài)博弈:如果參與人1選擇7?,則博弈結(jié)柬(參與人 2沒有行動)。如果參與人1選擇了厶或M,則參與人2就 會知道1沒有選擇7?(但不請楚1是選擇了 L 還是M),并在厶和尺兩個行動中進(jìn)行選 擇,博弈瞼之結(jié)柬。給出了上述博弈的戰(zhàn)略式描述參與人2LRL050參與人1 M0,20,1R1,3l-pf這就排除 了參與人2選靱,的可能性。因此,在上述博弈中,簡單要求參與人2 持有一個推斷,并且在此推斷下選擇最 優(yōu)行動

5、,就足以使我們排除不合理的均 衡(R,R)。考寨燙一般情形的博弈:2,1 0,2 0,2 0,1在該博弈中,戰(zhàn)j略組合(R,R)也是參與人2的信息集未能達(dá)到的一個子博弈精煉Nash均衡。如果參與人2的信息集一旦能夠達(dá)到,參與人2的最優(yōu)選擇就依賴于他關(guān)于己 發(fā)生易史的信念,即一旦博弈進(jìn)入?yún)⑴c人2的信息集,參與人2關(guān)于自己住于哪個決策結(jié)的推斷。參與人2選擇L與R的期望收益分別為2-p和1+p,因此,如果pl/2,則最優(yōu)戰(zhàn)j略為R,;如果vl/2 ,則最優(yōu)戰(zhàn)j略為厶。Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo

6、 Yunfeng要將子博弈精煉Nash均衡中“均衡精煉 的思想應(yīng)用到不完全信息護(hù)展式博弈中,就必須做到:1)對每個參與人幾在其信息集上給出關(guān)Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo YunfengControl Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng于自己住于該信息集中哪一個決策結(jié)的信念(或推斷);2)對參與人i的每個信息集,在給定參與人i在該信息集上的信念(或推斷)情況下, 參與人的戰(zhàn)j略是對其他參與人戰(zhàn)

7、j略的一 個最優(yōu)反應(yīng),即參與人的選擇必須滿足 序慣理性(sequential rationality)。第十二章精煉貝葉斯Nash均衡主要內(nèi)彖:、均衡的精煉與信念二、信念段定三、精煉貝葉斯Nash均衡四、幾種均衡概念的比較精煉貝葉斯Nash均衡既包含了一個戰(zhàn)j略 組合,又包含一個信念糸統(tǒng)。這里信念糸統(tǒng)對每個信息集都確定了住 于該信息集上的參與人所持有的信念。這種信念是信念持有人對己發(fā)生易史的 -個推斷,也可理解為他對旬己住于信 息集上哪一個決策結(jié)的“一種估計”。通過給定參與人在信息集上的信念,來 對不完全信息擴(kuò)謖式博弈的均衡進(jìn)行精 煉,是Sei ten子博弈精煉Nash均衡中均 衡精煉”的思想

8、在不完全信息護(hù)展式博 弈中的自然應(yīng)用。Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng給定參與人的均衡戰(zhàn)J略,參與人的信念必 須滿足:(1) 與戰(zhàn)略的一致性(consistency with strateg ies)原則;(2) 結(jié)構(gòu)一致性(structural consistency)原則;(3) 共同信念(common beliefs)原則。與戰(zhàn)略的一玫性原則指導(dǎo)不完全信息護(hù) 謖式博弈中處于均衡路徑之上信息集的信念役定;結(jié)構(gòu)政性原則應(yīng)用于處于均衡路徑之外信息集的信念設(shè)定;異同信念原則是博弈

9、問題解的特性所決 定的對博弈問題的結(jié)構(gòu)要求。走艾對于一個給定的不完全信息擴(kuò)畏式J博棄中給 定的均衡,如果博棄根據(jù)均衡戰(zhàn)略進(jìn)行時將 以正的概率達(dá)到禁信息集,稱此信息集處于 均衡路徑之上(on the equilibrium path) o 反之,如果博棄根據(jù)均衡戰(zhàn)略進(jìn)行對,奇定 不會達(dá)到禁信息集,稱之為處于均衡珞徑之 外的信息集(off the equilibrium path),簡稱非 均衡路徑信息集。與戰(zhàn)略的一致性:指對于任一與參與人的戰(zhàn)J略相一玫的信息集,即處于均衡路徑之上的信息集,參與人關(guān)于己發(fā)生歷史的信念即博弈如何到達(dá)該信息集的信念,應(yīng)該由貝葉斯法則及參與人的均衡戰(zhàn)略共同確定。N假設(shè)在

10、所涉及到的均衡中,參與人1的 均衡戰(zhàn)略為(厶厶厶),也就是說,無論是什么類型的參與人1,他的選擇都為厶。因此,參與人2住于均衡路徑上的信息集為?2(兀1,兀3,兀5 在給定參與人1的均衡戰(zhàn)J略為(厶厶厶)的前提下,參與人2住于信息集/2(xpx3,x5)中任一決策結(jié)的可能性都存在,所以,x0,x,0 且 1 -x-x? 0 o用(心1,2,3)表示當(dāng)參與人2觀測到參 與人1的選擇為厶肘,參與人1為類型右的 概率。因此,p(t L) rp(t2 L) = x恥|厶)=1 XXControl Science and Engineering, HUSTAll Rights Reserved, 200

11、7, Luo Yunfeng根據(jù)貝葉斯法則,有如乙)p(L|r.)p(r.)P(L)Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng由全概率公式可得P(乙)=工卩(乙卜)卩(切0Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng將全概率公式代入貝葉斯公式,可得P(厶|右)卩4) 工卩(厶卜w 0NControl Science and Engineering, HUSTAll Rights Re

12、served, 2007, Luo YunfengIPlxl.p+l.z+lq P + P2 + P31卩2x = p(t2 L)=Pl1 P+I P2+I P3 P1+Z+P31 6p3P31-x-x = p(t3 |L)=1P1+1P2+1P3 Pl+Z+KControl Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng結(jié)構(gòu)一玫性指對于給定均衡戰(zhàn)J略下未能達(dá)到的信息集,即處于非均衡路徑之上的信息集, 參與人在該信息集上的信念由貝葉斯法則及參與人禁個可能選擇使用的均衡戰(zhàn)略共同確定。由于博弈能夠到達(dá)非均衡路徑

13、上信息集的概率為0,因此,無法直接應(yīng)用貝 葉斯公式來確定非均衡路徑上信息集的信念。在賣際計算中,可先任確定一信念,但該信念必須與參與人“禁個可能選擇使用的均衡戰(zhàn)略”相吻合。共同信念指所有參與人在任一信息集(包括給定戰(zhàn) 略下能夠到達(dá)的信息集與未能到達(dá)的信息集)上的信念相同。Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng第十二章精煉貝葉斯Nash均衡主要內(nèi)彖:、均衡的精煉與信念二、信念設(shè)定三、精煉貝葉斯Nash均衡四、幾種均衡概念的比較Control Science and Engineerin

14、g, HUSTAll Rights Reserved, 2007, Luo Yunfeng精煉貝葉斯Nash均衡是Selten子博弈精煉 Nash均衡的“均衡精煉”的思想,在不 完全信息擴(kuò)展式博弈中的自然推廣。Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng一個精嫁貝葉斯Nash均衡由滿足以下條件 的戰(zhàn)J略與信念構(gòu)成:(1) 對于每一個信息集,在該傳息集采取行動的參 與人關(guān)于博棄到達(dá)信息集中的智一個結(jié)必須有 一個穆念。打于多決策結(jié)扁歳島信息集,信念 是信息集中各個結(jié)上的概率分布。對于單決策 結(jié)

15、信息集,信念則置概率1于單決策結(jié)上;(2) 在給定的信念下,參與人的戰(zhàn)略必須是序貫理 桂的。就是說,在每一個信息集,具有行動的 參與人所采取的行動(以及參與人往后的行動), 在給定該參與人在該崙息集上的信念與其他參 與人以后的盛略的情況下必須是最優(yōu)的;-個精煉貝葉斯Nash均衡由滿足以下條件 的戰(zhàn)j略與信念構(gòu)成:(3) 參與人在均衡路徑信息集上的信念設(shè)定應(yīng)滿足與戰(zhàn)j略一致性原則,即通過貝葉 斯法則與參與人的均衡戰(zhàn)略來確定;參與人在非均衡路徑信息集上的信念設(shè) 走應(yīng)滿足結(jié)構(gòu)一致性原則,即通過貝葉 斯法則和參與人可能的均衡戰(zhàn)略來確定。Control Science and Engineering,

16、HUSTAll Rights Reserved, 2007, Luo YunfengControl Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng參與人2和3之間的子博弈惟一的Nash均 衡為(L,R)于是整個博弈惟一的子博 弈精煉Nash均衡為(D,LR)。這一組戰(zhàn)) 略和參與人3的推斷卩二1滿足了精煉貝葉 斯Nash均衡的定義,于是(D,L,R),p=L) 構(gòu)成了 一個精煉貝葉斯Nash均衡。該博弈是否還存在其它純戰(zhàn)略精煉貝葉斯Nash均衡呢?給出上述博弈的戰(zhàn)j略式描述:LfRfLf 3 R;2:0;0

17、7 2,0,0 31,2,1 3,3,3? 0,1,20,1,1Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng原博弈問題中除了 (D厶用)為Nash均衡外, 還存在其它3個純戰(zhàn)j略Nash均衡(4厶厶),(AW)和人)。Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng通過分析可知,(4厶厶),(4,尺厶)和(4,& R )這3個Nash均衡與任意信念一起都不 構(gòu)成精煉貝葉斯Nash均衡。Co

18、ntrol Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng因此,在該博弈中()厶7?),p二1)構(gòu)成淮 精嫁貝葉斯Nash均衡。Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng第十二章精煉貝葉斯Nash均衡主要內(nèi)彖:、均衡的精煉與信念二、信念設(shè)定三、精煉貝葉斯Nash均衡四、幾種均衡概念的比較Control Science and Engineering, HUSTAll Rights Reserved,

19、2007, Luo Yunfeng對完全信息靜態(tài)博弈中的Nash均衡、完全信息動態(tài)博弈中的子博弈精嫁Nash均衡、不完全信息靜態(tài)博弈中的貝葉斯Nash均衡以及不完全信息動態(tài)博弈中的精嫁貝葉斯Nash均衡 的比較可以發(fā)現(xiàn): 1) A Nash均衡中,每一參與人的戰(zhàn)j略必 須是其他參與人戰(zhàn)略的一個最優(yōu)反應(yīng), 于是沒有參與人會選擇嚴(yán)格劣戰(zhàn)略。在精煉貝葉斯Nash均衡中,走義中條件 (1)和(2)事賣上就是要保證沒有參與人的 戰(zhàn)略是始于任何一個信息集的劣戰(zhàn)略。 Nash均衡及貝葉斯Nash均衡對處于均衡路徑之外的信息集則沒有這方面的要求,即使是子博弈精嫁Nash均衡對禁些處于均衡路徑之外的信息集也沒有

20、這方面的要求。精嫁貝葉斯Nash均衡徐補(bǔ)了這一 缺陷:參與人不可以威脅使用始于任何信息集的嚴(yán)格劣戰(zhàn)j略,即使該信息集處于均衡路徑之外。 2)隨著研克的博弈逐步復(fù)雜,我們對均衡概念也逐漸強(qiáng)化,從而可以排除復(fù)雜 博弈中不合理或沒有意義的均衡,而如 果我們運(yùn)用迨用于簡單博弈的均衡概念就無法li分Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng(a,a)(/&)(W)Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo YunfengControl Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng030o3o2,1丿 .73:1,11,31,1Control Science and Engineering, HUSTAll Rights Reserved, 2007, Luo Yunfeng博弈存在3個純戰(zhàn)j略Nash均衡:(a,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論