ch3 納什均衡的擴(kuò)展與精煉

上傳人：r*** IP屬地：湖北上傳時間：2023-01-12 格式：PPT 頁數(shù)：76 大小：1.84MB 積分：22 舉報 版權(quán)申訴

已閱讀5頁，還剩71頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第3章

納什均衡的擴(kuò)展與精煉1不完全信息靜態(tài)博弈完全且完美信息動態(tài)博弈重復(fù)博弈不完全信息動態(tài)博弈2第2章討論了完全信息的靜態(tài)博弈以及納什均衡的概念.然而,在現(xiàn)實的經(jīng)濟(jì)生活和社會活動中,這樣簡單的博弈是很少的.這是因為:在博弈中,局中人對于其它局中人的了解和認(rèn)識往往不可能是完全清楚的；在博弈過程中,局中人采取行動也不一定是同時的.基于這樣的現(xiàn)實情況,有必要對完全信息下的靜態(tài)博弈做進(jìn)一步的擴(kuò)展研究.相應(yīng)地,對納什均衡的概念也要進(jìn)行擴(kuò)展和精煉.3如何擴(kuò)展首先對靜態(tài)博弈在不完全信息下進(jìn)行擴(kuò)展,將納什均衡擴(kuò)展到貝葉斯納什均衡.其次,將完全信息下的靜態(tài)博弈擴(kuò)展到完全信息下的動態(tài)博弈,將一般納什均衡精煉為子博弈完美納什均衡.第三,討論不完全信息下的動態(tài)博弈,給出精煉貝葉斯納什均衡的概念.4信息集每一個信息集是決策結(jié)集合的子集,由滿足以下條件的決策結(jié)組成:–一定是同一個參與人的決策結(jié)；–該參與人知道博弈進(jìn)入該集合中的某個決策結(jié),但不知道自己處于哪一個決策結(jié)；–一個參與人在屬于同一個信息集的每一個決策結(jié)上的行動空間是相同的.5開發(fā)商A不知道市場需求的大小開發(fā)商B不知道市場需求的大小6完全信息(completeinformation)—指每個參與人沒有私人信息,即他的行動空間、支付函數(shù)為所有其他參與人所知.(參與者的信息特征)完美信息（perfectinformation)—是指一個局中人對其他局中人(包括虛擬參與人“自然”)的行動選擇有了準(zhǔn)確的了解(對前面所發(fā)生的情況很清楚),并且沒有同時的行動,即每個信息集只含有一個元素.(博弈的結(jié)構(gòu)特征)例如,如果兩個參與人都知道對方的支付函數(shù),行動空間,以及市場需求是大,還是小,則信息是完全的,但如果A不知B的行動選擇,則A的信息是不完美的.完美信息與完全信息7策略策略是參與人在給定的信息集的情況下的行動規(guī)則.—因為參與人的每個信息集實質(zhì)上代表了參與人可能會遇到的幾種情況,因此必須給出所有可能情況下的行動規(guī)則.每個參與人的一個策略,合在一起形成一個策略組合。83.1不完全信息的靜態(tài)博弈不完全信息博弈與海薩尼轉(zhuǎn)換例3.1.1不完全信息的行業(yè)博弈假定行業(yè)內(nèi)有一個在位者(局中人1)和一個潛在的進(jìn)入者(局中人2).局中人1決定是否在某地建立一個新工廠,同時局中人2決定是否在該地進(jìn)入該行業(yè).假定局中人2不知道局中人1建廠的成本是高還是低,但局中人1自己知道.這個博弈的收益如表3.1.1所示.局中人2的收益取決于局中人1是否建廠,而不是直接取決于局中人1的成本.當(dāng)且僅當(dāng)局中人1不建廠時,局中人2進(jìn)入才有利可圖.9表3.1.1不完全信息的行業(yè)博弈規(guī)范式在本例,進(jìn)入者似乎是在與兩個不同的在位者博弈:高成本建廠的在位者,低成本建廠的在位者.(如果在位者有T種可能的不同成本函數(shù),進(jìn)入者就似乎是在與T個不同的在位者博弈)在1967年以前,博弈論專家認(rèn)為這樣的不完全信息博弈是沒法分析的,因為當(dāng)—個局中人并不知道他在與誰博弈時,博弈的規(guī)則是沒有定義的.1967年,海薩尼提出了海薩尼轉(zhuǎn)換解決了這個問題.進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入建廠(0,-1)(2,0)(1.5,-2)(3.5,0)不建廠(2,1)(3,0)(2,1)(3,0)局中人1的建廠成本高局中人1的建廠成本低局中人1局中人2局中人210海薩尼轉(zhuǎn)換(1)引入一個虛擬的局中人—“自然”(nature),他不用考慮自己的得失,他的唯一作用就是賦予博弈中各局中人的類型向量t=(t1,t2,…,tn),其中ti屬于可行類型空間Ti(Ti為局中人i的特征的完備描述);(2)自然只把局中人i的真實的類型ti告訴局中人i本人,卻不讓其他局中人知道.但“自然”將把在t=(t1,t2,…,tn)上的概率分布p(t1,t2,…,tn)告訴每一個局中人;(3)所有局中人同時行動,局中人i從自己的策略空間Si中選擇si其中局中人i的策略空間Si與局中人i的類型ti有關(guān),一般記為Si(ti);(4)各局中人除“自然”外的支付函數(shù)為ui=ui(s1,…,sn;ti),i=1,2,…,n.11借助(1)和(2)中“自然”的行動,就把一個不完全信息的靜態(tài)博弈轉(zhuǎn)化成了一個完全但不完美信息的博弈;該博弈由兩個階段構(gòu)成:第一階段是準(zhǔn)備階段:“自然”選擇行動,它決定概率向量p(t1,…,tn);第二階段則是實際博弈階段:由n個局中人同時行動,他們雖然各自知道“自然”為自己選定的類型ti,卻不知道“自然”為其他局中人(至少一個其他局中人)選定的類型,因此至少有一個局中人對“自然”的行動是具有不完美信息的.不過每一個局中人的類型空間Ti及其概率分布Pi(t-i|ti),是共同知識.

這樣,就可以運用概率論的知識(尤其是“貝葉斯法則”),對不完全信息博弈問題進(jìn)行分析.12有了海薩尼轉(zhuǎn)換,在例3.1.1中,自然決定了局中人1有兩種類型,“高成本”和“低成本”.自然決定了局中人2有一種類型.若局中人1屬于“高成本”類型,而局中人2只有一種類型,則構(gòu)成表3.1.1中左邊一個標(biāo)準(zhǔn)的完全信息下的靜態(tài)博弈.若局中人1屬于“低成本”類型而局中人2只有一種類型,則構(gòu)成下表中左邊一個標(biāo)準(zhǔn)的完全信息下的靜態(tài)博弈.局中人1知道自己的類型,而局中人2則不知道局中人1的類型,但兩個局中人對“自然”決定的局中人1的類型的概率分布具有一致的判斷.假設(shè)P(高成本)=2/3,P(底成本)=1/3.進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入建廠(0,-1)(2,0)(1.5,-2)(3.5,0)不建廠(2,1)(3,0)(2,1)(3,0)局中人1的建廠成本高局中人1的建廠成本低局中人1局中人2局中人213規(guī)范式表述和貝葉斯納什均衡通過海薩尼轉(zhuǎn)換可將不完全信息博弈轉(zhuǎn)換成不同局中人類型下的博弈,但這種結(jié)果依賴于局中人的類型.利用完全信息靜態(tài)博弈的規(guī)范式表述,可以給出不完全信息靜態(tài)博弈的規(guī)范式表示.定義3.1.1

不完全信息靜態(tài)博弈包括如下4個要素.1.局中人集合N={1,2,…,n};2.每個局中人有個類型空間Ti={ti},i∈N,以及在全體類型空間上的概率分布P(t1,t2,…,tn);3.每個局中人有(與自身的類型ti相關(guān)的)策略集Si={si},i∈N.且策略集Si與其它局中人的類型無關(guān).4.每一個局中人都有其收益函數(shù)ui(s1,s2,…,sn,ti),即收益函數(shù)不僅依賴于策略組合(s1,s2,…,sn),也依賴于自身的類型ti.14以上4個因素都是共同知識.局中人在以上情況下同時選擇策略以追求自身收益最大化.將這種博弈稱為不完全信息的靜態(tài)博弈,也稱為貝葉斯靜態(tài)博弈,記為G=[N,{Ti},P,{Si(ti)},{ui}].定義3.1.2在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,若是一個策略組合,且對每一個i∈N,對任意si∈Si都有:則稱策略組合是一個貝葉斯納什均衡.15(1)貝葉斯納什均衡用貝葉斯公式得到的,以概率分布作為依據(jù),考慮自己的期望收益.貝葉斯靜態(tài)博弈中的期望收益是對其它局中人不同類型下的期望收益,而不是自己類型下的期望收益(所有的局中人知道自己的類型).(2)貝葉斯納什均衡研究的是局中人的策略選擇,并且這種策略選擇依賴于自身的類型,當(dāng)類型不同時,它們選擇的策略就不一樣.定義3.1.2只給出了貝葉斯納什均衡的定義,但未給出在什么條件下貝葉斯納什均衡一定存在.類似于完全信息靜態(tài)博弈中純策略納什均衡的存在性討論,有下面一些概念和定理.貝葉斯均衡是Nash均衡在不完全信息博弈中的自然擴(kuò)展.貝葉斯納什均衡概念與一般納什均衡概念相比有兩個不同點:16定義3.1.3設(shè)u是凸集XRn上的函數(shù),對任意的x1,x2∈X及任意的λ∈[0,1],若有u(λx1+(1-λ)x2)≥λu(x1)+(1-λ)u(x2)(3.1.4)則稱u為X上的凹函數(shù).若(3.1.4)中不等號為嚴(yán)格不等號,則稱u為X上的嚴(yán)格凹函數(shù).**一個凹函數(shù)一定是擬凹函數(shù).**如果u(x1,x2,…,xn)是一個Rn中的函數(shù),若對任意的xi都有,則函數(shù)u是變量xi的凹函數(shù).定理3.1.1設(shè)u1和u2都是凸集XRn上的凹函數(shù),則對任意,函數(shù)(3.1.5)也是x的凹函數(shù).17定理3.1.2在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,若局中人i策略集Si(ti)是有界閉凸集,其收益函數(shù)ui(s-i,si,ti),對局中人i的任何類型ti以及對任意s-i都是si的凹函數(shù),則博弈G一定存在貝葉斯納什均衡.局中人i在類型為ti的情況下,全部混合策略集記為Xi(ti).混合策略:在貝葉斯博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,局中人i在類型ti∈Ti下的純策略集為:,若局中人i以概率選擇純策略,則稱為局中人i在類型ti下的一個混合策略.在不引起混淆的情況下,簡記為,其中18在混合策略下,貝葉斯納什均衡的定義如下:定義3.1.4在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,若是一個混合策略組合,且對每一個i∈N和對任意的xi(ti)∈Xi(ti)都有則稱混合策略組合是一個混合策略下的貝葉斯納什均衡.i在混合策略組合下對其ui求期望.對類型求期望19定理3.1.3在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,是G的一個混合策略下的貝葉斯納什均衡的充分必要條件是:對每一個局中人i和每一個純策略有定理3.1.4在貝葉斯靜態(tài)博弈G=[N,{Ti},P,{Si(ti)},{ui}]中,必有混合策略下的貝葉斯納什均衡.20例3.1.1假定行業(yè)內(nèi)有一個在位者(局中人1)和一個潛在的進(jìn)入者(局中人2).局中人1決定是否在某地建立一個新工廠,同時局中人2決定是否在該地進(jìn)入該行業(yè).假定局中人2不知道局中人1建廠的成本是高還是低,但局中人1自己知道.這個博弈的收益如表3.1.1所示.局中人2的收益取決于局中人1是否建廠,而不是直接取決于局中人1的成本.當(dāng)且僅當(dāng)局中人1不建廠時,局中人2進(jìn)入才有利可圖.求該博弈的所有納什均衡.進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入建廠(0,-1)(2,0)(1.5,-2)(3.5,0)不建廠(2,1)(3,0)(2,1)(3,0)局中人1的建廠成本高局中人1的建廠成本低局中人1局中人2局中人221進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入建廠(0,-1)(2,0)(1.5,-2)(3.5,0)不建廠(2,1)(3,0)(2,1)(3,0)局中人1的建廠成本高局中人1的建廠成本低局中人1局中人2局中人2如果局中人2在觀察到1的行動后在作決定,信息集如何畫?擴(kuò)展式表示22局中人類型:在位者(局中人1)有兩種類型T1={t11,t12},t11代表高成本,t12代表低成本;潛在進(jìn)入者(局中人2)只有1種類型,T2={t2}.自然決定局中人1類型的概率分布為：P(高成本)=2/3P(低成本)=1/3策略集設(shè)高成本時局中人1的策略集為代表建廠,表示不建廠.局中人1采用策略的概率為x1,采用策略的概率為1-x1.設(shè)低成本時局中人1的策略集為代表建廠,表示不建廠.局中人1采用策略的概率為x2,采用策略的概率為1-x2.設(shè)局中人2的策略集為,代表進(jìn)入,表示不進(jìn)入.局中人2采用策略的概率為y,采用策略的概率為1-y.23收益局中人1在高成本時期望收益記為,在低成本時的期望收益為,局中人2的期望收益記為.(3.1.8)(3.1.9)(3.1.10)混合策略下的貝葉斯納什均衡的計算設(shè)混合策略下的貝葉斯納什均衡為:((x1,1-x1),(x2,1-x2),(y,1-y))由定理3.1.3,該貝葉斯納什均衡應(yīng)滿足下列不等式組：24(3.1.11)(3.1.12)(3.1.13)(3.1.14)(3.1.15)(3.1.16)由(3.1.8)(3.1.9)(3.1.10)25對上述不等式化簡可得如下等價關(guān)系由(3.1.11)(3.1.12)(Ⅰ)由(3.1.13)(3.1.14)(Ⅱ)由(3.1.15)(3.1.16)(Ⅲ)26由不等式組(Ⅰ)可得x1=0,將x1=0帶入不等式組(Ⅲ),有(Ⅲ’)用作圖法解不等式組(Ⅱ)和(Ⅲ’).混合策略貝葉斯納什均衡求解不等式組(Ⅱ)不等式組(Ⅲ’)滿足不等式組(Ⅱ)和(Ⅲ’)的(x,y)點為A點和DE線段.27不等式組(Ⅱ)不等式組(Ⅲ’)滿足不等式組(Ⅱ)和(Ⅲ’)的(x,y)點為A點和DE線段.混合策略貝葉斯納什均衡集為:(3.1.17)該博弈的混合策略貝葉斯納什均衡包含兩個純策略貝葉斯納什均衡：(1)在位者為高成本和低成本都不建廠,而進(jìn)入者進(jìn)入.(2)在位者為高成本時不建廠,為低成本時建廠,而進(jìn)入者不進(jìn)入.另有無窮多個混合策略下的貝葉斯納什均衡:在位者為高成本時不建廠,為低成本時建廠.進(jìn)入者以y的概率進(jìn)入,以1-y的概率不進(jìn)入,.28設(shè)市場上有1、2兩個廠商,生產(chǎn)同一種產(chǎn)品.廠商1、2生產(chǎn)的商品的數(shù)量分別為q1和q2.他們有不同的不變邊際成本.廠商1的邊際成本為c1=1,廠商2有兩種邊際成本,低成本為c2L=3/4,高成本為c2H=5/4.但廠商2的邊際成本是低成本還是高成本,只有廠商2自己知道,廠商1不知道.即廠商2有自己成本的私人信息.廠商1對廠商2的成本是高還是低有一個判斷信念,即高成本的可能性為μ,低成本的可能性為1-μ,這里假定μ=0.5.同時,市場的逆需求函數(shù)p=a-(q1+q2).a是大于邊際成本的一個常數(shù),這里取a=2.兩個廠商在沒有任何協(xié)議和約定的情況下,同時分別決定生產(chǎn)產(chǎn)量,以追求市場利潤最大化.例3.1.2不完全信息下的古諾模型29利用不完全信息博弈海薩尼轉(zhuǎn)換方法,可以視為“自然”決定廠商類型,廠商1有1種類型,廠商2有兩種類型{低成本,高成本},自然將廠商2的類型通知了廠商2,并且給出了在類型空間上的概率分布:p(低成本)=0.5,p(低成本)=0.5.廠商2在低成本類型下生產(chǎn)q2L時的收益函數(shù)為:廠商2在高成本類型下生產(chǎn)q2H時的收益函數(shù)為:(3.1.18)(3.1.19)廠商1只有一種類型,對廠商2的兩種類型,它生產(chǎn)q1的期望收益為：(3.1.20)30上述三個函數(shù)對自身變量都是凹函數(shù),分別求并令其為0解該方程組,得:(3.1.21)(3.1.22)31因此,廠商1生產(chǎn)產(chǎn)量為,廠商2在低成本類型時生產(chǎn)產(chǎn)量為,在高成本類型時生產(chǎn)產(chǎn)量為.將代入即可求得解的具體值.32例3.1.4獨立私人價值下的一級密封拍賣假設(shè):有兩個競標(biāo)人:競標(biāo)人1和競標(biāo)人2.令競標(biāo)人i對拍賣物的估價為vi,出價為bi(vi),i=1,2.只有競標(biāo)人i自己知道vi是多少.bi(vi)為競標(biāo)人i的策略,即Si=[0,vi].這里“自然”確定了投標(biāo)人i的類型vi,并給出了vi的概率分布.兩個競標(biāo)人都知道自己的估價vi.并假定v1和v2都是[0,1]上的獨立均勻分布.競標(biāo)人都是風(fēng)險中性的.上述假定都是共同知識.在獨立私人價值下的一級密封拍賣中,每一個競標(biāo)者對拍賣物有一個自己的估價;這個估價是競標(biāo)者的私人信息,其他競標(biāo)人是不知道的.競標(biāo)人的估價不僅決定了報價的多少,也決定了競標(biāo)人在得到拍賣物后的凈收益.在一級密封拍賣中,每個競標(biāo)人只獨立地出一個價.這樣,多個競標(biāo)人為獲得競標(biāo)物構(gòu)成了一個不完全信息下的靜態(tài)博弈.33競標(biāo)人i的收益函數(shù):(3.1.39)競標(biāo)人i在自己的類型為vi,出價為bi的情況下,其期望收益為:(3.1.40)對局中人i的策略bi(vi)作如下規(guī)定:bi(vi)=ai+civiai,ci為常數(shù),ci>0,i=1,2(3.1.41)這里ai可視為競標(biāo)人i的最低標(biāo)價.由于i的出價低于j最低的可能的出價沒有意義,而又不應(yīng)該高于j最高的可能出價,因此有:aj≤bi≤aj+cji,j=1,2i≠j(3.1.42)34假設(shè)競標(biāo)人j采取策略bj(vj)=aj+cjvj,對一個給定的vi值,競標(biāo)人i的最優(yōu)反應(yīng)為下式的解.(3.1.43)(3.1.39)(3.1.40)這兩項均為0求解(3.1.43),得:(3.1.44)35由于bi(vi)=ai+civi用同樣的方法,可得:由此可得:(3.1.45)上式表明,在上述假定下,兩個競標(biāo)人的出價都為自己估價的一半.363.2完全且完美信息動態(tài)博弈完全信息(completeinformation)指每個局中人沒有私人信息,即他的行動空間、支付函數(shù)和類型為所有其他局中人所知.(信息特征)完美信息（perfectinformation)指每個局中人對其他局中人(包括虛擬參與人自然)的行動選擇有了準(zhǔn)確的了解(對前面所發(fā)生的情況很清楚),并且沒有同時的行動,即每個信息集只含有一個元素.(博弈的結(jié)構(gòu)特征)動態(tài)博弈可以按博弈中局中人對信息的認(rèn)識和了解分為完全信息和不完全信息博弈,完美信息和不完美信息博弈.動態(tài)博弈存在局中人行動先后順序的博弈.37在完全且完美信息下,動態(tài)博弈的中心問題是可信任性.若動態(tài)博弈按靜態(tài)博弈分析,所求出的納什均衡一些是可信任的,而一些是不可信任的.因此需要對靜態(tài)博弈中所求出的納什均衡進(jìn)行“精煉”,去掉不可信任的納什均衡,保留下的是可信任的納什均衡,并稱為子博弈完美納什均衡.38例3.2.1借債與還債博弈該博弈中有2個局中人.第一階段,局中人2向局中人1借款2萬元,并承諾一年后還給局中人1連本帶息共3萬元.局中人1面臨借款還是不借錢給局中人2.若局中人1答應(yīng)借錢給局中人2,則博弈進(jìn)行到第二個階段.這時,局中人2靠這筆錢共賺到4萬元.他面臨著到底履行諾言還是不履行諾言.若不履行諾言,則博弈進(jìn)入到第三階段,這時局中人1是將局中人2告上法庭還是不告上法庭.若告上法庭,則局中人1可以要回自己2萬元,而局中人2則分文得不到.若不告上法庭,則局中人獨占4萬元.在這個博弈中,局中人1和局中人2分別應(yīng)采取什么策略呢？39動態(tài)博弈的特征(P77)1.階段和行動順序動態(tài)博弈中,局中人是依照一定的規(guī)則依次進(jìn)行行動.每個階段至少有一個局中人要選擇行動,這里允許一個階段中有多人行動.402.行動與策略動態(tài)博弈中,輪到某個局中人行動時,他在自己的行動集中選擇一個行動.局中人i的行動集一般記為Ai.在不同的狀態(tài)下和不同的階段,局中人的行動集可能不一樣.動態(tài)博弈的策略是指局中人在這個博弈前對自己各階段行動的一個完整計劃.在靜態(tài)博弈中,只有一個階段,局中人的策略集與行動集是一致的.但動態(tài)博弈中策略集與行動集是不同的.3.行動組合和策略組合動態(tài)博弈中,每個局中人在每個階段出一個行動構(gòu)成一個行動組合,而每個局中人出一個策略則構(gòu)成策略組合.414.收益函數(shù)在動態(tài)博弈中,為了分析方便,局中人i的收益函數(shù)是所有行動組合到實數(shù)集的映射.如果博弈的局中人為n個人,則每個行動組合對應(yīng)一個n維實數(shù)向量.但若動態(tài)博弈是用策略式表示,其收益函數(shù)仍是策略組合到實數(shù)集的映射.在完全信息動態(tài)博弈中,博弈的收益函數(shù)是一個共同知識。5.信息在動態(tài)博弈中,當(dāng)每個局中人行動時,它對此前各局中人的行動組合是完全了解和知道的,稱為完美信息博弈.反之,則稱為不完美信息博弈.42納什均衡的可信性與不可信性跟隨領(lǐng)頭羊大軟驅(qū)與小軟驅(qū)局中人1先行動,局中人2在觀察到局中人1的行動后再選擇.43局中人2(大,大)(大,小)(小,大)(小,小)局中人1大(2,2)(2,2)(-1,-1)(-1,-1)小(-1,-1)(1,1)(-1,-1)(1,1)局中人2的策略集:1.(1選大,2選大;1選小,2選大)2.(1選大,2選大;1選小,2選小)3.(1選大,2選小;1選小,2選大)4.(1選大,2選小;1選小,2選小)三個純策略納什均衡44三個規(guī)范式表述的納什均衡均衡策略結(jié)果E1(大,(大,大))都選大E2(大,(大,小))都選大E3(小,(小,小))都選小局中人21234局中人1大(2,2)(2,2)(-1,-1)(-1,-1)小(-1,-1)(1,1)(-1,-1)(1,1)E1E2E345E3:(小,(小,小))是一個合理的均衡嗎?考慮均衡E3中的策略(小,小).如果局中人1偏離均衡而選擇了大,就沒有理由再讓局中人2堅持選小.相反,他也會選擇大.如果局中人1預(yù)期到了對方的反應(yīng)是大,那么他從一開始就會選擇大.因此,E3是一個不可信任的納什均衡.46E1(大,(大,大))考慮均衡E1中的策略(大,大).如果局中人1偏離均衡而選擇了小,就沒有理由再讓局中人2堅持選大.相反,他也會選擇小.如果局中人1預(yù)期到了對方的反應(yīng)是小,那么他從一開始就會選擇小.因此,E1是一個不可信任的納什均衡.E1:(大,(大,大))是一個合理的均衡嗎?47哪一個納什均衡最合理?E2(大,(大,小))考慮均衡E2中的策略(大,小).如果局中人1選大,局中人2當(dāng)然也會選大;如果局中人1偏離均衡而選擇了小,局中人2會堅持選小.由于2>1,局中人1會選擇大,因此,E2是一個合理的納什均衡.48從該例還可以看出,對簡單的動態(tài)博弈,使用博弈的擴(kuò)展式,可以使分析問題的思路和理解更直觀.因此,我們盡可能地使用擴(kuò)展式來分析動態(tài)博弈.從上例中可以看出,在動態(tài)博弈中,采用靜態(tài)博弈的方法求出來的納什均衡,并不一定是可信的.必須對其進(jìn)行“精煉”,求出可信的納什均衡.49子博弈與子博弈完美納什均衡動態(tài)博弈的擴(kuò)展型表述定義3.2.1一個動態(tài)博弈的擴(kuò)展式包括:(1)博弈中的局中人,必要時包括“自然”局中人;(2)局中人的行動順序;(3)局中人的行為空間(行動集),若“自然”局中人的行動,即它賦予其它局中人i不同類型,則同時應(yīng)給出不同行動的概率分布;(4)每次輪到某一局中人行動時,他所了解的信息;(5)對局中人可能選擇的每一行動組合相對應(yīng)的各局中人的收益;(6)“自然”對局中人類型確定的概率分布.以上各要點均是共同知識.由于本大節(jié)討論的完全且完美信息的動態(tài)博弈,因此無“自然”局中人.50對于博弈的擴(kuò)展式描述,可通過博弈樹來表示.在擴(kuò)展式表示的博弈中,我們更關(guān)心的是各局中人在各階段中的行動,因此也稱其為行為博弈.對應(yīng)地,將使用行動、行動組合、行動組合上的收益函數(shù)等概念.子博弈與子博弈完美納什均衡定義3.2.2擴(kuò)展式博弈中,滿足下面三個條件的博弈,稱為該博弈的一個子博弈:(1)始于單節(jié)信息集的決策結(jié)點n(但不包括博弈的第一個決策結(jié)點);(2)包含博弈樹中n之下所有的決策結(jié)點和終結(jié)點(但不在n下面的除外);(3)沒有對任何信息集形成分割.(即如果博弈樹中n之下有一個決策結(jié)點n’,則和n’處于同一信息集的其他決策結(jié)點也必須在n之下,從而也必須包含于該子博弈中.)51圖3.2.3存在著信息集分割的博弈樹在定義中要加上(3)的限制,是希望能夠把子博弈當(dāng)成一個獨立的博弈進(jìn)行分析,并且分析的結(jié)果能用于原博弈.在上圖中,如果我們試著把局中人2左邊的決策節(jié)看成一個子博弈的起點,則在我們制造的這一個“子博弈”中,局中人3不僅不知道參與者2的行動,也不知道局中人l的行動.對這樣一個子博弈就無法進(jìn)行分析了,這樣違規(guī)制造的“子博弈”是沒有分析價值的.子博弈52在完全且完美信息的動態(tài)博弈中,由于在每一階段需行動的局中人對該階段以前的行動組合是完全了解的,因此它的擴(kuò)展式博弈表示中,該決策結(jié)點一定是單信息集結(jié)點.因此,在完全且完美信息的動態(tài)博弈中,從任何一個結(jié)點(不含最頂端的結(jié)點和終端結(jié)點)出發(fā),都存在一個子博弈.有兩個子博弈的博弈樹53例3.2.1的博弈擴(kuò)展式與它的子博弈54定義3.2.3(澤爾騰,1965)在完全且完美信息的動態(tài)博弈中,如果局中人的策略組合或行動組合在每一個子博弈中都構(gòu)成了納什均衡,則稱納什均衡是子博弈精煉的,并稱為原博弈的子博弈納什均衡.(大,(大,小))子博弈納什均衡55子博弈完美納什均衡與逆向歸納法完全且完美信息動態(tài)博弈的主要特點是:(1)行動是順序發(fā)生的;(2)下一步行動選擇之前,所有以前的行動都可以被觀察到;(3)每個可能的行動組合下局中人的收益是共同知識.下面分析只有兩個階段的完全且完美信息動態(tài)博弈.這時的博弈為：(1)局中人1從可行集A1中選擇一個行動a1;(2)局中人2觀察到a1之后從可行集A2中選擇一個行動a2;(3)兩人的收益分別為u1(a1,a2)和u2(a1,a2).對完全且完美信息的兩階段動態(tài)博弈,可以使用逆向歸納法對其進(jìn)行求解.56求解思路:在這樣的博弈中,局中人1在第一階段很難給出自己的最優(yōu)行動.因此可以倒過來分析.假設(shè)局中人1在第一階段選擇了行動a1,在博弈的第二階段局中人2行動時,考慮到其前局中人1若選擇行動a1,他面臨的決策問題可用下式表示:若每個a1∈A1,局中人2的這一最優(yōu)化問題只有唯一解,用R2(a1)表示,這是局中人2對局中人1的行動的(最優(yōu))反應(yīng).因為局中人1可以預(yù)測到局中人2對自己每個可能的行動a1∈A1做出的反應(yīng),這樣局中人1在第一階段要解決的問題可歸結(jié)為假定局中人1的這一最優(yōu)化問題同樣有唯一解,表示為a1*,再將a1*帶回R2(a1)中得到R2(a1*).這樣就得到兩個局中人的行動組合(a1*,a2*).57稱(a1*,a2*)為這個博弈的逆向歸納解.跟隨領(lǐng)頭羊該博弈的子博弈完美納什均衡:(大,(大,小))58逆向歸納解不含有不可置信的威脅:局中人1預(yù)測局中人2將對1可能選擇的任何行動a1做出最優(yōu)反應(yīng),選擇行動R2(a1);這一預(yù)測排除了局中人2的不可置信的威脅,即排除了局中人2將在第二階段到來時做出不符合自身利益的反應(yīng).因此,逆向歸納解就是完全且完美信息的動態(tài)博弈的子博弈完美納什均衡.局中人2威脅小,不可信.局中人2威脅大,不可信.59對有多個階段的完全且完美信息的動態(tài)博弈的子博弈完美納什均衡的尋求，可以仿照兩階段的情形逆向推導(dǎo).若完全且完美信息動態(tài)博弈用擴(kuò)展式表示,只需從最后的子博弈逐層向上推導(dǎo).對于有限完全且完美信息的擴(kuò)展式動態(tài)博弈,逆向歸納法是求解子博弈精煉納什均衡的一個簡便方法.逆向歸納法從動態(tài)博弈的最后一個階段或最后一個子博弈開始,逐步向前倒推一直倒推到博弈的起點.在倒推過程中,局中人選擇使自己的支付最大的策略,最終得到一條從博弈起點到某一終點的每一階段的路徑,該路徑集就是此博弈的逆向歸納解.這種從動態(tài)博弈的最后一步分析局中人的理性行為而往回推以求解該博弈的子博弈完美納什均衡的方法稱為逆向歸納法.60例3.2.1借債與還債博弈的子博弈完美納什均衡該博弈有兩個子博弈,設(shè)為(1),(2),按如下步驟求其子博弈完美納什均衡.1.子博弈(1)子博弈(1)612.子博弈(2)子博弈(2)的簡化3.原博弈原博弈的簡化624.原博弈的子博弈完美納什均衡借債與還債博弈63用逆向歸納法求解出的子博弈完美納什均衡并不是一條以樹的根為起點的完整路徑,但是它對每個局中人在各個階段的行動選擇給予了描述,并且是每個局中人策略的一種完整表述.假若只考慮(借,履行諾言)這一完整路徑,它顯然不能構(gòu)成均衡.因為局中人1的“起訴”行為是一個可信任的威脅,若缺少局中人1在第三階段這一可信的威脅,局中人2在第二階段就不會采取“履行諾言”的行為,進(jìn)而在第一階段局中人1也就可能會“不借”.對完全且完美動態(tài)博弈,利用逆向歸納法,很容易求得逆向歸納解,而逆向歸納解又是子博弈完美納什均衡.這就奠定了在完全且完美動態(tài)博弈中逆向歸納法的重要作用.64跟隨領(lǐng)頭羊65完全且完美信息動態(tài)博弈的應(yīng)用例3.2.2斯塔克爾貝格雙寡頭競爭模型斯塔克爾貝格(Stackelberg,1934)提出了雙寡頭壟斷的動態(tài)模型,其中一個支配企業(yè)(領(lǐng)導(dǎo)者)首先行動,然后從屬企業(yè)(追隨者)行動.根據(jù)斯塔克爾貝格的假定,模型中企業(yè)選擇其產(chǎn)量(與古諾模型的相同點:選擇產(chǎn)量;不同點:古諾模型中企業(yè)是同時行動的,這里是序貫行動).博弈順序:首先,企業(yè)1選擇產(chǎn)量q1≥0,然后,企業(yè)2在觀測到q1后,并選擇產(chǎn)量q1≥0;企業(yè)i的收益由下面的利潤函數(shù)給出這里p(Q)=a-Q,p是市場上的總產(chǎn)量Q=q1+q2時的市場出清價格,c是兩個企業(yè)生產(chǎn)的邊際成本,為一常數(shù)(令固定成本為0).66這是完全且完美信息兩階段博弈,逆向歸納法求解.假設(shè)企業(yè)1有產(chǎn)量q1,首先計算企業(yè)2對企業(yè)1任意產(chǎn)量的最優(yōu)反應(yīng),q2=R2(q1)應(yīng)滿足:由上式可得這與古諾模型中,得到的R2(q1)相同,兩者不同的在于,這里得到的R2(q1)是企業(yè)2對假定企業(yè)1產(chǎn)量為q1時的最優(yōu)反應(yīng).由于企業(yè)1考慮到當(dāng)它產(chǎn)量為q1時,企業(yè)2的最優(yōu)反應(yīng)為R2(q1).那么,在博弈的第一階段,企業(yè)1要先行決定自己的產(chǎn)量,因而企業(yè)1面臨的問題可表示為:67由上式可得斯塔克爾貝格博弈是一個二階段的完全且完美信息動態(tài)博弈,也稱為主從博弈.第一階段選擇行動的局中人稱為主局中人,第二階段選擇行動的局中人稱為從局中人.至于主局中人是否具有先動優(yōu)勢，這與具體的博弈有關(guān).是斯塔克爾貝格雙寡頭壟斷博弈的逆向歸納解.68例3.2.5制造商與銷售商的博弈設(shè)有一個由制造商和銷售商組成的二級供應(yīng)鏈,為市場提供某種商品,該商品的市場需求函數(shù)設(shè)為Q=a-p.其中p為商品的價格,Q為市場對商品需求數(shù)量,a為一常數(shù),其經(jīng)濟(jì)意義是商品的最高需求量.制造商提供給銷售商的批發(fā)價為每件ω元.制造商和銷售商都有不變的邊際成本c1和c2.制造商和銷售商的博弈順序規(guī)定如下:制造商先確定產(chǎn)品的批發(fā)價

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > 工程機(jī)械

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

ch3 納什均衡的擴(kuò)展與精煉

文檔簡介

溫馨提示

最新文檔

評論

ch3 納什均衡的擴(kuò)展與精煉

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔