《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件_第1頁
《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件_第2頁
《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件_第3頁
《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件_第4頁
《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 第三節(jié)第三節(jié) 完全但不完美信息動態(tài)博弈完全但不完美信息動態(tài)博弈 一、不完美信息動態(tài)博弈一、不完美信息動態(tài)博弈1概念和例子動態(tài)博弈的基本特征是各個博弈方的行為不是同時,而是有先后次序的。既然各個博弈方不在同一個時刻行為,那么在多數(shù)情況下,后行為的博弈方在自己行為之前都可以觀察到先于自己行為的其他博弈方的行為,也即后面階段選擇的博弈方有關(guān)于前面階段博弈進(jìn)程的充分信息。這種完全了解自己行為之前博弈進(jìn)程的博弈方稱為“有完美信息(PerfectInformation)的博弈方”。如果一個動態(tài)博弈中的所有博弈方都是有完美信息的,我們就稱這種博弈為“完美信息的動態(tài)博弈”。產(chǎn)業(yè)經(jīng)濟(jì)

2、學(xué)第五章(博弈2)但是,由于博弈方可能會故意保密或信息傳遞不暢等原因,動態(tài)博弈中也可能存在至少部分后行為的博弈方,無法了解在自己之前行為的部分或全部博弈方行為的情況。我們稱它們?yōu)椤安煌昝佬畔⒌膭討B(tài)博弈不完美信息的動態(tài)博弈”,相應(yīng)的博弈方則稱為“有不完美信息的博弈方”。本節(jié)所討論的不完美信息動態(tài)博弈中,各博弈方對博弈結(jié)束時每個博弈方的得益是完全清楚的,因此博弈方是有“完全信息”(CompleteInformation)的,這類博弈我們稱之為“完全但不完美信息動態(tài)博弈”,或簡稱“不完美信息動態(tài)博弈”。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) (1)二手車博弈不完美信息動態(tài)博弈的基本特征之一是博弈方之間在信息方面

3、的不對稱性。以關(guān)于二手車的博弈問題為例。如果你在二手車市場上買了一輛二手車,則你過后常會發(fā)覺合算、不合算,或占了大便宜、吃了大虧等等,而買一輛新車則這種感覺相對較少。之所以買二手車后常會發(fā)覺價值與原先估計(jì)的有距離,主要原因是你作為買方在二手車交易中信息較少。而賣方對車子的真實(shí)情況和價值比買方具有多得多的了解。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)我們把這個二手車交易抽象成這樣一個博弈問題:先是原車主(即賣方)選擇如何使用車子。為了簡單起見,我們假設(shè)有好、差兩種方式,分別對應(yīng)二手車市場上內(nèi)在質(zhì)量好、差兩種情況的二手車;第二階段是原車主作為賣方?jīng)Q定是否要賣,賣價可以只有一種、有高低兩種或更多,價格越多當(dāng)然問題

4、就越復(fù)雜;最后是買方?jīng)Q定是否買下,我們假設(shè)買方要么接受賣方價格,要么不買,但不能討價還價。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)由于在這個動態(tài)博弈中,買方作為一個博弈方對第一階段賣方的行為不了解,即買方具有不完美信息,這是一個不完美信息的動態(tài)博弈。值得注意的是本博弈中第一階段賣方對車子的選擇,嚴(yán)格講起來是在這個二手車交易發(fā)生之前早就存在的,是在買賣雙方考慮這個交易之前就已經(jīng)確定了的,只是買方不清楚而已,因此嚴(yán)格意義上講,它并不構(gòu)成本博弈的一個階段。這種將早已存在、確定或者非主動性的選擇引進(jìn)動態(tài)博弈作為一個階段,并用對該階段情況了解程度的差異反映博弈中不完美信息的方法是一種常用的處理方法。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(

5、博弈2) (2)市場進(jìn)入博弈 在前面討論過的市場進(jìn)入博弈中,給定在位者和進(jìn)入者各種策略組合下的得益,假設(shè)進(jìn)入者先行動,最后均衡結(jié)果是進(jìn)入者進(jìn)入,在位者默許。這個博弈中,雙方的得益都是共同的知識,即信息是完全的,但現(xiàn)實(shí)中的企業(yè)進(jìn)入和遏制是沒有那么簡單的,其博弈往往滿足不了完美信息的要求。事實(shí)上,當(dāng)一個企業(yè)要想進(jìn)入某個市場時,它并不清楚已在市場上的企業(yè)的實(shí)際成本函數(shù),也就不知道其得益即具體盈利情況。故潛在進(jìn)入者只能根據(jù)市場上大家都能觀察到的一些信息,如在位者的定價來對在位企業(yè)的類型(是高成本的還是低成本的或者兩者的可能概率多大等)作一個大致的判斷,幫助自己決策。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 市場進(jìn)入

6、的簡單博弈:潛在進(jìn)入者要決定是否進(jìn)入一個新的產(chǎn)業(yè),但不知道在位者的成本函數(shù),只知道在位者有兩種可能的成本函數(shù),即高成本或低成本,對應(yīng)兩種成本情況的不同策略組合的得益矩陣如下表: 在位者 高成本情況 低成本情況 默許 打擊 默許 打擊 進(jìn) 進(jìn)入 40,50 -10,0 30,80 -10,100 入 者 不進(jìn)入 0,300 0,300 0,400 0,400 表5-7 不完全信息情況市場進(jìn)入博弈的得益矩陣產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)在此例中,進(jìn)入者有關(guān)在位者的成本信息是不完美的,但在位者知道進(jìn)入者的有關(guān)成本信息,即信息是不對稱的。從上表可以看出,如果在位者是高成本的,給定進(jìn)入者進(jìn)入,在位者的最優(yōu)選

7、擇是默許;而如果在位者是低成本的,由得益矩陣可以看出,給定進(jìn)入者進(jìn)入,在位者的最優(yōu)選擇是打擊,故最后的均衡結(jié)果是進(jìn)入者不進(jìn)入,在位者打擊。因此如果是在完全信息的情況下,知道在位者是高成本則進(jìn)入者進(jìn)入;知道在位者是低成本,則進(jìn)入者就不進(jìn)入。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 但現(xiàn)在因?yàn)檫M(jìn)入者并不知道在位者究竟是高成本還是低成本,進(jìn)入者的最優(yōu)選擇只能依賴于他的判斷,即在多大程度上認(rèn)為在位者是高成本的或低成本的。假定進(jìn)入者認(rèn)為在位者是高成本的概率為P,低成本的概率為(1-P),那么進(jìn)入者選擇進(jìn)入的期望利潤是P(40)+(1-P)(-10),選擇不進(jìn)入的期望利潤是0。所以只有當(dāng)進(jìn)入者的期望利潤大于不進(jìn)入的期望

8、利潤時,即P(40)+(1-P)(-10)0,或者P1/5時才選擇進(jìn)入;如果P1/5則不進(jìn)入。 現(xiàn)實(shí)中的市場進(jìn)入與遏制基本就是這樣,一現(xiàn)實(shí)中的市場進(jìn)入與遏制基本就是這樣,一般要用不完美信息博弈來分析般要用不完美信息博弈來分析。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)從這個例子我們可以看出,在不完美信息情況下的博弈參與人的最優(yōu)策略不僅僅依賴于其他參與人的策略,更依賴于他對其他參與人情況的判斷。如上述例子中,當(dāng)進(jìn)入者判斷在位者高成本的概率P1/5時,他的最優(yōu)策略是不進(jìn)入;而當(dāng)他判斷在位者高成本的概率P1/5時,則最優(yōu)策略是進(jìn)入。這實(shí)際上就是完全但不完美信息博弈的標(biāo)準(zhǔn)分析方法,在對其他參與人的各種可能類型出現(xiàn)概率

9、的大小做出判斷,然后根據(jù)該判斷計(jì)算自己各種策略在其他參與人這種類型的分布下能給自己帶來的期望得益,找出其中最大期望得益對應(yīng)的策略就是己方的最優(yōu)策略。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 2 2不完美信息動態(tài)博弈的擴(kuò)展式表示不完美信息動態(tài)博弈的擴(kuò)展式表示 以前面介紹過的二手車交易為例,我們可用圖511來表示這個不完美信息博弈問題。圖511中最上面一個節(jié)點(diǎn)表示第一階段賣方(記博弈方1)對如何使用汽車的選擇,共有“好”和“差”兩種可能的選擇。賣方對自己的這個選擇當(dāng)然是清楚的,因此第二階段他選擇“賣”還是“不賣”時,是根據(jù)兩種不同情況的針對性選擇。在第一階段為“好”的情況下,賣方第二階段可以選擇“賣”或“不賣”

10、,在第一階段為“差”的情況下,同樣也可以選擇“賣”或“不賣”。如果他選擇的是“不賣”,則不管第一階段是“好”是“差”,博弈都告結(jié)束,雙方都既無損失也無得利。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)如果他選擇的是“賣”,則博弈進(jìn)行到第三階段,輪到買方進(jìn)行選擇。我們是假設(shè)買方無法知道第一階段賣方的選擇的,因此在第二階段賣方選擇賣的情況下,買方無法知道賣方前兩階段的路徑究竟是“好賣”還是“差賣”,因此他無法分別作針對性的選擇。我們把兩個代表前面階段博弈(就是賣方的選擇)不同路徑的節(jié)點(diǎn)放在一個信息集中,表示買方在該決策階段的信息不完美性。這同樣意味著雖然買方在此處只有“買”、“不買”兩種選擇,但可能的結(jié)果卻有四種,

11、包括“買”到好車、差車,“不買”好車、差車。前兩種結(jié)果對買方、賣方都有差異,而后兩種結(jié)果則最多只對賣方有差異。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)設(shè)使用好時對買方而言該車值3千元,使用差時值1千元,賣方要價2千元(可理解為買方想買的檔次)。再假設(shè)使用差時賣方需要花費(fèi)1千元才能將車子偽裝成使用良好。那么,如果用凈收益(收益減成本)作為賣方的得益,用消費(fèi)者剩余(價值減價格)作為買方的得益,則該博弈的雙方得益如圖5-11所示。其中各個得益數(shù)組的第一個數(shù)字為賣方,即博弈方1的得益。我們注意當(dāng)賣方在第二階段選擇賣而買方在第三階段選擇不買時,車況好、差對買方利益毫無影響,都是既無得也無失,但對賣方來講則明顯不同,因

12、為當(dāng)車況差時賣方想賣必須先花代價偽裝,賣不出去就會白白損失這筆費(fèi)用,即1千元的損失。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)1 好 差11 不賣 賣 (0,0) 賣 不賣 (0,0) 2 2 買 不買 買 不買 (2,1) (0,0) (1,-1) (-1,0) 圖5-11 二手車交易擴(kuò)展式表示產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)根據(jù)上述得益情況看,買方在賣方選擇賣的前提下,選擇買既有賺的可能(車況好),也有虧的可能(車況差),選擇不買當(dāng)然肯定不會吃虧,但也失去了獲得利益的機(jī)會,因此沒有一個選擇絕對比另一個好。對賣方來說,車況好時賣不賣得出去都無損失,只有得益的可能,因此賣總是比不賣好,但當(dāng)車況差時賣得出賣不出卻截然

13、相反,賣得出有所得利,賣不出卻要虧損,因此是否該賣就不那么容易判斷。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)要讓賣方在車況差的情況下決定是否賣必須有進(jìn)一步的信息或判斷,即買方會買下的概率究竟有多大;要讓買方?jīng)Q定是否買還必須要有進(jìn)一步的信息或判斷,實(shí)際上就是在賣方選賣的前提下車況好、車況差各自的概率。因?yàn)橛辛诉@樣的信息或判斷,買方或賣方就至少能對獲利機(jī)會、損失風(fēng)險(xiǎn)的大小程度心中有數(shù),在自己承受能力的基礎(chǔ)上做出正確的判斷和選擇。但雙方?jīng)Q策需要的這些信息或判斷又都與雙方的選擇有關(guān),因此在兩個博弈方的選擇、信息和判斷之間就形成了一種復(fù)雜的交互決定關(guān)系。事實(shí)上,這種交互決定關(guān)系正是不完美信息動態(tài)博弈的關(guān)鍵和主要研究對

14、象。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 二、完美貝葉斯均衡二、完美貝葉斯均衡在完全且完美信息動態(tài)博弈中,我們通過要求均衡策略組合滿足子博弈完美性(即策略組合在每個子博弈中都構(gòu)成納什均衡)來保證均衡策略中沒有任何不可信的威脅或承諾,其核心均衡概念就是子博弈精煉(完美)納什均衡。但是,在完全但不完美信息的動態(tài)博弈中,因?yàn)榇嬖诙喙?jié)點(diǎn)信息集,一些重要的選擇及其后續(xù)階段不構(gòu)成真子博弈,因此子博弈完美性要求無法滿足,也就無法完全排除不可信的威脅或承諾,無法保證均衡策略中所有選擇的可信性,子博弈精煉納什均衡的概念失去了意義,因此必須發(fā)展新的均衡概念。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 1 1完美貝葉斯均衡的定義完美貝葉斯均

15、衡的定義 當(dāng)一個策略組合及相應(yīng)的判斷滿足如下四個要求時,稱為一個“完美貝葉斯均衡”。這些要求是:要求要求1 1:在各個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達(dá)到該信息集中每個節(jié)點(diǎn)可能性的“判斷”,對非單節(jié)點(diǎn)信息集,一個“判斷”就是博弈達(dá)到該信息集中各個節(jié)點(diǎn)可能性的概率分布,對單節(jié)點(diǎn)信息集,則可理解為“判斷達(dá)到該節(jié)點(diǎn)的概率為 l”。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 要求要求2 2:給定各博弈方的“判斷”,他們的策略必須是“序列理性序列理性”的。即在各個信息集,給定輪到選擇博弈方的判斷和其他博弈方的“后續(xù)策略”,該博弈方的行為及以后階段的“后續(xù)策略”,必須使自己的得益或期望得益最大。 要求要求3

16、3:在均衡路徑上的信息集處,“判斷”要符合貝葉斯法則和各博弈方的均衡策略。要求要求4 4:在非均衡路徑上的信息集處,“判斷”也要符合貝葉斯法則和各博弈方在此處可能有的均衡策略。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 這是完美貝葉斯均衡的比較完全的定義方法。之所以稱這種均衡為完美貝葉斯均衡,首先是因?yàn)樗牡诙€要求“序列理性”,與子博弈精煉納什均衡中的子博弈完美性要求相似;其次是因?yàn)橐?和要求4中規(guī)定“判斷”的形成必須符合貝葉斯法則。根據(jù)上述定義不難看出,子博弈精煉納什均衡是完美貝葉斯均衡在完全且完美信息動態(tài)博弈中的特例。即在完全且完美信息博弈中子博弈精煉納什均衡就是完美貝葉斯均衡。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈

17、2)實(shí)際上,序列理性用于子博弈中就是指子博弈的完美性,用在整個博弈中就是納什均衡概念,而在完全且完美信息動態(tài)博弈中,所有輪到選擇博弈方的信息集都是單節(jié)點(diǎn)的,他們對博弈達(dá)到該節(jié)點(diǎn)的“判斷”都是概率等于1,這些判斷當(dāng)然都是滿足貝葉斯法則和以其他博弈方的后續(xù)策略為基礎(chǔ)的。更進(jìn)一步,完美貝葉斯均衡在靜態(tài)博弈中就是納什均衡。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 2 2均衡要求的初步解釋均衡要求的初步解釋 下面我們以圖512中的完全但不完美信息動態(tài)博弈為例,進(jìn)一步說明上述要求的重要性。1R (1,3) L(p) M(1-p) 2 2 U D U D (2,1) (0,0) (0,0) (0,1) 圖5-12 完全但

18、不完美信息動態(tài)博弈產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)圖512是一個兩博弈方各一次選擇的動態(tài)博弈。因?yàn)樵诓┺姆?第一階段選擇不是R的情況下,博弈方2無法看到博弈方1究竟選擇的是L還是M,因此博弈方2具有不完美信息,這是一個不完美信息的動態(tài)博弈。如果輪到博弈方2選擇時(博弈方1第一階段沒選R),若他不對博弈方1的選擇給出判斷的話,則他就不知該選U和D中哪一個才合理。因此,博弈方2在這兩個節(jié)點(diǎn)信息集處須對到達(dá)這兩個節(jié)點(diǎn)的可能性進(jìn)行判斷,也就是L、M兩條路徑的 “判斷” 是決策的必要基礎(chǔ),從而也是均衡策略的基礎(chǔ)。這就說明了要求1的必要性。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)要求 2也是非常必要的。從圖中可知,除了原來的

19、博弈之外,該博弈不存在任何其他真子博弈(子博弈完美性要求自然滿足),于是,對于這類博弈,子博弈精煉納什均衡定義實(shí)際上就是納什均衡,從圖 5-12可知(L,U)和(R,D)都是納什均衡。然而,(R,D)顯然依賴于一個不可信威脅:那就是博弈方2威脅在輪到自己選擇時將唯一地只選D,但是D是一個劣策略,至少劣于U。如果博弈方2采取這個策略,博弈方1的最佳對策就是第一階段直接選擇R使博弈結(jié)束,雙方得益是(1,3)。博弈方 1清楚,理性的博弈方2在什么情況下都不會采用D策略,因此,博弈方1決不會(只要他是理性的)因?yàn)椴┺姆?威脅采用D而被迫采取策略R,為了最大化自己的得益,博弈方1一定會采取L策略,迫使博

20、弈方2只得采取U策略。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 上述分析反應(yīng)了這樣一個事實(shí),在完全但不完美信息博弈中,盡管(R,D)是一個納什均衡,可是它依賴于一個不可信的威脅,理應(yīng)從合理的預(yù)測中剔除掉。因此,要求 2對于保證不完美信息動態(tài)博弈的均衡策略中沒有不可信的威脅或承諾具有關(guān)鍵作用。為了進(jìn)一步說明要求 1和要求 2的必要性,我們假定當(dāng)博弈方2在博弈方1第一階段沒有選R的情況下,“判斷”博弈方1選L的概率為p,選M的概率l-p,在給定這樣的判斷的前提下,博弈方2選擇U的期望得益為: ppp)1 (01產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 而選D的期望得益為:顯然,當(dāng)p1-p時,即p 1/2時,博弈方2選U的得益

21、總大于選D的得益,根據(jù)要求2,博弈方2不會選D,只會選U。這時,博弈方1在第一階段的選擇就應(yīng)該是L,而非M,也非R。因此,博弈方1第一階段選L,博弈方2在博弈方1第一階段未選R的情況下選擇U,加上博弈方2對博弈方1選L、M的概率判斷p和1-p(p1-p),構(gòu)成一個滿足序列理性要求的策略組合(注意這里還沒有稱為完美貝葉斯均衡),滿足了要求1和要求2事實(shí)上已經(jīng)排除了前面提及的那個依賴于不可置信威脅從而不合理的納什均衡策略(R,D)。ppp1)1 ( 10產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)對于要求3和要求4中的“均衡路徑上”和“非均衡路徑上”一對概念,首先要弄清什么是均衡路徑。 在不完美信息博弈中,由于至少

22、對一個博弈方的一個階段來說,博弈實(shí)際達(dá)到何處是無法看到的,因此即使按均衡策略進(jìn)行博弈,某些信息集是否一定會達(dá)到也不確定。所以,在這種博弈中所謂所謂“在在均衡路徑上均衡路徑上”的信息集意味著如果博弈按照均衡策的信息集意味著如果博弈按照均衡策略進(jìn)行,則該信息集會以正的概率達(dá)到略進(jìn)行,則該信息集會以正的概率達(dá)到,而“不在均衡路徑上”的信息集就意味著博弈按均衡策略進(jìn)行時絕對不可能達(dá)到,或者達(dá)到的概率為0。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 對于圖 5-12中博弈方2的信息集,當(dāng)博弈方1第一階段的均衡策略選擇是 R 時不在均衡路徑上,而當(dāng)不是R時就在均衡路徑上。清楚了什么是“在”和“不在”均衡路徑上的信息集以后

23、,我們現(xiàn)在用圖5-12中博弈為例來分析一下要求3和要求4。首先討論要求3。為此,我們先假設(shè)均衡策略組合就是上面提到的“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)首先,因?yàn)樵摬┺闹兄挥胁┺姆?有一個兩節(jié)點(diǎn)信息集,因此要求3實(shí)際上針對的就是博弈方2在其兩節(jié)點(diǎn)信息集處的“判斷”;其次,本博弈兩博弈方的選擇都是針對獲取最優(yōu)得益的主動選擇,沒有非主動選擇和外生不確定性,因此不需要額外信息幫助“判斷”;第三,在本博弈中博弈方2的“判斷”是直接針對博弈方1的上期選擇的,因此不存在條件概率問題,貝葉斯法則自動滿足;第四,要求3要求博弈方2對博弈方1的上期選擇的“判斷”符合

24、各博弈方的均衡策略,在這里就是符合博弈方1第一階段的選擇和博弈方2自己本階段的選擇。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 由于博弈方1的均衡策略在第一階段選擇的是L,因此只有博弈方2的 “判斷”是“博弈方1選擇L的概率 p=1”才與博弈方1的策略相符合,而且這種判斷也與博弈方2自己在本階段的選擇U相符合,因此該“判斷”正是博弈方 2決策和雙方策略均衡的穩(wěn)定基礎(chǔ)。如果博弈方2“判斷” p=0.75,則首先與博弈方1的選擇不完全符合,而且這種判斷對博弈方2選U的信心有不良影響,從而均衡就有不穩(wěn)定性。如果博弈方2“判斷” p=0.25,則與所設(shè)均衡策略組合“博弈方1選L,博弈方2選U”是完全矛盾的。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)

25、第五章(博弈2) 上述分析充分說明了在不完美信息博弈中,“判斷”和均衡策略之間的相互依存關(guān)系,只有兩者是一致、協(xié)調(diào)的,才可能是真正的均衡。這正是要求3的真實(shí)含義?,F(xiàn)在我們討論要求 4。首先對于均衡策略組合“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”來說,因?yàn)椴┺姆?的多節(jié)點(diǎn)信息集在均衡路徑上,不存在不在均衡路徑上需要“判斷”的信息集,因此要求4自動滿足,不用再作討論。為此我們針對另一個納什均衡策略組合(R,D),即“博弈方1第一階段選擇R,博弈方2第二階段選擇D”來討論。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)在該均衡策略組合下,博弈方2的兩節(jié)點(diǎn)信息集是不在均衡路徑上的信息集。 要求4要求博弈方2

26、此時在這個信息集的 “判斷”,也要滿足貝葉斯法則和雙方的均衡策略。同要求3,貝葉斯法則仍然自動滿足,因此我們只需要討論博弈方2的“判斷”與雙方在此處可能有的均衡策略的一致性。 從得益分布情況可知,很顯然,如果萬一博弈方1在第一階段偏離了上述均衡策略R,按照前面的分析博弈方2一定會“判斷”博弈方1必然選擇L策略,產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 而博弈方1這時選擇L的概率p=1這一判斷是不符合要求4的,因?yàn)檫@與博弈方2自己的均衡策略D不符合。因此博弈方2此時的“判斷”只能是博弈方1選M的概率1-p=l,這樣博弈方2的“判斷”就與自己的策略相一致了。 但是,博弈方2“判斷”1-p=1,意味著博弈方1肯定

27、選擇了M。這顯然是有問題的,因?yàn)閷τ诓┺姆?來說,M既是相對于R的下策,也是相對于L的下策,即使他不愿選R,也只會選L而不會選M。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 因此,博弈方2的“判斷”1-p=1雖然可以與自己的策略D相符合,但卻無法與博弈方1在此處可能有的均衡策略相符合,這意味著該“判斷”也不滿足要求4。事實(shí)上,在上述得益結(jié)構(gòu)下,該博弈不可能存在與均衡策略組合“博弈方1第一階段選擇R,博弈方2第二階段選擇D”相符合的不在均衡路徑上的博弈方“判斷”,這實(shí)際上就意味著(R,D)策略組合不可能是該博弈具有真正穩(wěn)定性的完美貝葉斯均衡。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 3 3關(guān)于判斷形成的進(jìn)一步解釋關(guān)于判斷形成

28、的進(jìn)一步解釋 例例1 1,二手車交易。圖511中的二手車交易博弈中,當(dāng)然是在賣方(博弈方1)決定賣以后,買方(博弈方2)的選擇信息集需要作出“判斷”。首先,買方需要的“判斷”是在博弈方1決定賣的情況下車況是好還是差,或者好、差的機(jī)會各是多少。我們可以用兩個條件概率p(g|s)和p(b|s)來表示買方對賣方?jīng)Q定賣車時車況好、差的“判斷”(顯然有p(g|s)+p(b|s)=1)。在買方作出判斷之前,先要知道車況好與差的機(jī)會各有多少,也即賣方在第一階段使用車子的情況是好還是差的可能性。我們用P(g)和P(b)來表示它們的概率,當(dāng)然這兩個概率一般是通過經(jīng)驗(yàn)性的知識和數(shù)據(jù),或平均情況得到。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五

29、章(博弈2)但是,光有這兩個概率仍然不能得出需要的判斷p(g|s)和p(b|s)。因?yàn)橘u方在車況好、差兩種情況下對賣和不賣的選擇往往是不同的,并不是不管好、差都會選擇賣,因此上述車況好、差的概率不一定等于所賣車子好、差的概率。不過,如果我們知道賣方在好、差兩種情況下選擇賣或不賣的概率分別是多大,就可以根據(jù)貝葉斯法則計(jì)算出條件概率p(g|s)和p(b|s),也就是買方需要的“判斷”。若p(s|g)和p(s|b)分別表示車況好、差時賣方選賣的概率,那么根據(jù)貝葉斯法則:產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 而p(b|s)可以根據(jù)p(b|s)=1-p(g|s)確定。因此我們的關(guān)鍵任務(wù)是確定賣方在車況好、差兩種情

30、況下,分別選擇賣和不賣的概率分布p(s|g)、1-p(s|g)和p(s|b)、1-p(s|b)。由于賣方是主動選擇和理性行為的,因此上述概率分布取決于賣方的均衡策略。)()()()()()()()()()(bspbpgspgpgspgpspgspgpsgp產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 根據(jù)圖5-11中的得益情況,首先可以肯定當(dāng)車況好時賣方肯定會選擇賣,因?yàn)橘u掉有正的得益,賣不掉跟不賣相比也沒任何區(qū)別,因此p(s|g)=1肯定成立。相反,在車況差時選擇賣而賣不出去就有損失,因此如何選擇就需要更多的斟酌。賣方究竟是應(yīng)該選擇賣還是不賣,或者選擇混合策略,需要考慮賣出去的機(jī)會,即買方選擇買的概率的大小。

31、產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)如果我們假設(shè)買方選擇買的概率是0.5,那么賣方在車況差的情況下選擇賣的期望得益為0.510.5(1)=0,與不賣的得益相等,作為一個風(fēng)險(xiǎn)中性的博弈方,賣方可采用(0.5,0.5)的概率分布選擇賣或不賣的混合策略。這時候,買方“判斷”p(s|b)=0.5就是符合賣方均衡策略的,并且也符合自己的均衡策略。有了p(s|g)=1和p(s|b)=0.5這兩個概率判斷,再假設(shè)已知總體車況好、差的概率p(g)=p(b)=0.5,則根據(jù)貝葉斯法則我們不難算出:產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 這就是買方在自己選擇的兩節(jié)點(diǎn)信息集處對賣方所賣車中好車所占比例的“判斷”。對差車所占比例的“判斷”

32、就是 。由于在賣方的上述策略下,買方選擇的信息集至少有相當(dāng)大的概率會達(dá)到,因此該信息集是在均衡路徑上的信息集。這就是說,我們通過分析得到的上述“判斷”是滿足要求3的判斷。這里的分析進(jìn)一步使我們對要求3使均衡策略和判斷之間具有的相互依存關(guān)系有了更深的體會。3275.05 .05 .05 .015 .015 .0)()()()()()()(bspbpgspgpgspgpsgp3/13/21)(1)(sgpsbp產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)例2,為了進(jìn)一步理解4個要求的意義,我們再分析一個簡單的例子。圖5-13是一個有三個博弈方的三階段不完全信息動態(tài)博弈。第一階段博弈方1有F和B兩種選擇,他的選擇博弈

33、方2和博弈方3都能看見。第二階段博弈方2有L和R兩種選擇,跟在后面的博弈方3卻看不見博弈方2的選擇。博弈方3的信息集是一個兩節(jié)點(diǎn)信息集,即信息是不完美的。一般地我們假設(shè)他“判斷”博弈方2選L和R的概率分別是p和1p。如果博弈方1在第一階段選F,則博弈繼續(xù)下去,共有四種可能的結(jié)果,各方得益分別為相應(yīng)得益數(shù)組中同次序數(shù)值。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 1 F B2 (2,0,0) L(p) R(1-p) 3 3 U D U D (1,2,1) (3,3,3) (0,1,2) (0,1,1) 圖5-13 三博弈方三階段動態(tài)博弈產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 用逆推歸納法先考察博弈方3的選擇,他選U的期望得益為Pl+(l-P)2 = 2-P,選D的期望得益為P3 +(1-P)1 = 1+2P,因此當(dāng) 2-p1+2p,即pl3時他該選 U,當(dāng) pl/3時他該選D,P=1/3時選U、D或者混合策略都可以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論