《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件

上傳人：石*** IP屬地：廣東上傳時(shí)間：2022-02-02 格式：PPT 頁(yè)數(shù)：46 大?。?4KB 積分：18 舉報(bào) 版權(quán)申訴

《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件_第2頁(yè)

《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件_第3頁(yè)

《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件_第4頁(yè)

《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件_第5頁(yè)

已閱讀5頁(yè)，還剩41頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 第三節(jié)第三節(jié) 完全但不完美信息動(dòng)態(tài)博弈完全但不完美信息動(dòng)態(tài)博弈一、不完美信息動(dòng)態(tài)博弈一、不完美信息動(dòng)態(tài)博弈1概念和例子動(dòng)態(tài)博弈的基本特征是各個(gè)博弈方的行為不是同時(shí)，而是有先后次序的。既然各個(gè)博弈方不在同一個(gè)時(shí)刻行為，那么在多數(shù)情況下，后行為的博弈方在自己行為之前都可以觀察到先于自己行為的其他博弈方的行為，也即后面階段選擇的博弈方有關(guān)于前面階段博弈進(jìn)程的充分信息。這種完全了解自己行為之前博弈進(jìn)程的博弈方稱為“有完美信息（PerfectInformation）的博弈方”。如果一個(gè)動(dòng)態(tài)博弈中的所有博弈方都是有完美信息的，我們就稱這種博弈為“完美信息的動(dòng)態(tài)博弈”。產(chǎn)業(yè)經(jīng)濟(jì)

2、學(xué)第五章(博弈2)但是，由于博弈方可能會(huì)故意保密或信息傳遞不暢等原因，動(dòng)態(tài)博弈中也可能存在至少部分后行為的博弈方，無(wú)法了解在自己之前行為的部分或全部博弈方行為的情況。我們稱它們?yōu)椤安煌昝佬畔⒌膭?dòng)態(tài)博弈不完美信息的動(dòng)態(tài)博弈”，相應(yīng)的博弈方則稱為“有不完美信息的博弈方”。本節(jié)所討論的不完美信息動(dòng)態(tài)博弈中，各博弈方對(duì)博弈結(jié)束時(shí)每個(gè)博弈方的得益是完全清楚的，因此博弈方是有“完全信息”（CompleteInformation）的，這類博弈我們稱之為“完全但不完美信息動(dòng)態(tài)博弈”，或簡(jiǎn)稱“不完美信息動(dòng)態(tài)博弈”。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) （1）二手車博弈不完美信息動(dòng)態(tài)博弈的基本特征之一是博弈方之間在信息方面

3、的不對(duì)稱性。以關(guān)于二手車的博弈問(wèn)題為例。如果你在二手車市場(chǎng)上買了一輛二手車，則你過(guò)后常會(huì)發(fā)覺(jué)合算、不合算，或占了大便宜、吃了大虧等等，而買一輛新車則這種感覺(jué)相對(duì)較少。之所以買二手車后常會(huì)發(fā)覺(jué)價(jià)值與原先估計(jì)的有距離，主要原因是你作為買方在二手車交易中信息較少。而賣方對(duì)車子的真實(shí)情況和價(jià)值比買方具有多得多的了解。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)我們把這個(gè)二手車交易抽象成這樣一個(gè)博弈問(wèn)題：先是原車主（即賣方）選擇如何使用車子。為了簡(jiǎn)單起見(jiàn)，我們假設(shè)有好、差兩種方式，分別對(duì)應(yīng)二手車市場(chǎng)上內(nèi)在質(zhì)量好、差兩種情況的二手車；第二階段是原車主作為賣方?jīng)Q定是否要賣，賣價(jià)可以只有一種、有高低兩種或更多，價(jià)格越多當(dāng)然問(wèn)題

4、就越復(fù)雜；最后是買方?jīng)Q定是否買下，我們假設(shè)買方要么接受賣方價(jià)格，要么不買，但不能討價(jià)還價(jià)。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)由于在這個(gè)動(dòng)態(tài)博弈中，買方作為一個(gè)博弈方對(duì)第一階段賣方的行為不了解，即買方具有不完美信息，這是一個(gè)不完美信息的動(dòng)態(tài)博弈。值得注意的是本博弈中第一階段賣方對(duì)車子的選擇，嚴(yán)格講起來(lái)是在這個(gè)二手車交易發(fā)生之前早就存在的，是在買賣雙方考慮這個(gè)交易之前就已經(jīng)確定了的，只是買方不清楚而已，因此嚴(yán)格意義上講，它并不構(gòu)成本博弈的一個(gè)階段。這種將早已存在、確定或者非主動(dòng)性的選擇引進(jìn)動(dòng)態(tài)博弈作為一個(gè)階段，并用對(duì)該階段情況了解程度的差異反映博弈中不完美信息的方法是一種常用的處理方法。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(

5、博弈2) （2）市場(chǎng)進(jìn)入博弈在前面討論過(guò)的市場(chǎng)進(jìn)入博弈中，給定在位者和進(jìn)入者各種策略組合下的得益，假設(shè)進(jìn)入者先行動(dòng)，最后均衡結(jié)果是進(jìn)入者進(jìn)入，在位者默許。這個(gè)博弈中，雙方的得益都是共同的知識(shí)，即信息是完全的，但現(xiàn)實(shí)中的企業(yè)進(jìn)入和遏制是沒(méi)有那么簡(jiǎn)單的，其博弈往往滿足不了完美信息的要求。事實(shí)上，當(dāng)一個(gè)企業(yè)要想進(jìn)入某個(gè)市場(chǎng)時(shí)，它并不清楚已在市場(chǎng)上的企業(yè)的實(shí)際成本函數(shù)，也就不知道其得益即具體盈利情況。故潛在進(jìn)入者只能根據(jù)市場(chǎng)上大家都能觀察到的一些信息，如在位者的定價(jià)來(lái)對(duì)在位企業(yè)的類型（是高成本的還是低成本的或者兩者的可能概率多大等）作一個(gè)大致的判斷，幫助自己決策。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 市場(chǎng)進(jìn)入

6、的簡(jiǎn)單博弈：潛在進(jìn)入者要決定是否進(jìn)入一個(gè)新的產(chǎn)業(yè)，但不知道在位者的成本函數(shù)，只知道在位者有兩種可能的成本函數(shù)，即高成本或低成本，對(duì)應(yīng)兩種成本情況的不同策略組合的得益矩陣如下表：在位者高成本情況低成本情況默許打擊默許打擊進(jìn) 進(jìn)入 40，50 -10，0 30，80 -10，100 入者不進(jìn)入 0，300 0，300 0，400 0，400 表5-7 不完全信息情況市場(chǎng)進(jìn)入博弈的得益矩陣產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)在此例中，進(jìn)入者有關(guān)在位者的成本信息是不完美的，但在位者知道進(jìn)入者的有關(guān)成本信息，即信息是不對(duì)稱的。從上表可以看出，如果在位者是高成本的，給定進(jìn)入者進(jìn)入，在位者的最優(yōu)選

7、擇是默許；而如果在位者是低成本的，由得益矩陣可以看出，給定進(jìn)入者進(jìn)入，在位者的最優(yōu)選擇是打擊，故最后的均衡結(jié)果是進(jìn)入者不進(jìn)入，在位者打擊。因此如果是在完全信息的情況下，知道在位者是高成本則進(jìn)入者進(jìn)入；知道在位者是低成本，則進(jìn)入者就不進(jìn)入。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 但現(xiàn)在因?yàn)檫M(jìn)入者并不知道在位者究竟是高成本還是低成本，進(jìn)入者的最優(yōu)選擇只能依賴于他的判斷，即在多大程度上認(rèn)為在位者是高成本的或低成本的。假定進(jìn)入者認(rèn)為在位者是高成本的概率為P，低成本的概率為（1-P），那么進(jìn)入者選擇進(jìn)入的期望利潤(rùn)是P(40)+（1-P）(-10),選擇不進(jìn)入的期望利潤(rùn)是0。所以只有當(dāng)進(jìn)入者的期望利潤(rùn)大于不進(jìn)入的期望

8、利潤(rùn)時(shí)，即P(40)+（1-P）(-10)0，或者P1/5時(shí)才選擇進(jìn)入；如果P1/5則不進(jìn)入。現(xiàn)實(shí)中的市場(chǎng)進(jìn)入與遏制基本就是這樣，一現(xiàn)實(shí)中的市場(chǎng)進(jìn)入與遏制基本就是這樣，一般要用不完美信息博弈來(lái)分析般要用不完美信息博弈來(lái)分析。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)從這個(gè)例子我們可以看出，在不完美信息情況下的博弈參與人的最優(yōu)策略不僅僅依賴于其他參與人的策略，更依賴于他對(duì)其他參與人情況的判斷。如上述例子中，當(dāng)進(jìn)入者判斷在位者高成本的概率P1/5時(shí)，他的最優(yōu)策略是不進(jìn)入；而當(dāng)他判斷在位者高成本的概率P1/5時(shí)，則最優(yōu)策略是進(jìn)入。這實(shí)際上就是完全但不完美信息博弈的標(biāo)準(zhǔn)分析方法，在對(duì)其他參與人的各種可能類型出現(xiàn)概率

9、的大小做出判斷，然后根據(jù)該判斷計(jì)算自己各種策略在其他參與人這種類型的分布下能給自己帶來(lái)的期望得益，找出其中最大期望得益對(duì)應(yīng)的策略就是己方的最優(yōu)策略。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 2 2不完美信息動(dòng)態(tài)博弈的擴(kuò)展式表示不完美信息動(dòng)態(tài)博弈的擴(kuò)展式表示以前面介紹過(guò)的二手車交易為例，我們可用圖511來(lái)表示這個(gè)不完美信息博弈問(wèn)題。圖511中最上面一個(gè)節(jié)點(diǎn)表示第一階段賣方（記博弈方1）對(duì)如何使用汽車的選擇，共有“好”和“差”兩種可能的選擇。賣方對(duì)自己的這個(gè)選擇當(dāng)然是清楚的，因此第二階段他選擇“賣”還是“不賣”時(shí)，是根據(jù)兩種不同情況的針對(duì)性選擇。在第一階段為“好”的情況下，賣方第二階段可以選擇“賣”或“不賣”

10、，在第一階段為“差”的情況下，同樣也可以選擇“賣”或“不賣”。如果他選擇的是“不賣”，則不管第一階段是“好”是“差”，博弈都告結(jié)束，雙方都既無(wú)損失也無(wú)得利。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)如果他選擇的是“賣”，則博弈進(jìn)行到第三階段，輪到買方進(jìn)行選擇。我們是假設(shè)買方無(wú)法知道第一階段賣方的選擇的，因此在第二階段賣方選擇賣的情況下，買方無(wú)法知道賣方前兩階段的路徑究竟是“好賣”還是“差賣”，因此他無(wú)法分別作針對(duì)性的選擇。我們把兩個(gè)代表前面階段博弈（就是賣方的選擇）不同路徑的節(jié)點(diǎn)放在一個(gè)信息集中，表示買方在該決策階段的信息不完美性。這同樣意味著雖然買方在此處只有“買”、“不買”兩種選擇，但可能的結(jié)果卻有四種，

11、包括“買”到好車、差車，“不買”好車、差車。前兩種結(jié)果對(duì)買方、賣方都有差異，而后兩種結(jié)果則最多只對(duì)賣方有差異。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)設(shè)使用好時(shí)對(duì)買方而言該車值3千元，使用差時(shí)值1千元，賣方要價(jià)2千元（可理解為買方想買的檔次）。再假設(shè)使用差時(shí)賣方需要花費(fèi)1千元才能將車子偽裝成使用良好。那么，如果用凈收益（收益減成本）作為賣方的得益，用消費(fèi)者剩余（價(jià)值減價(jià)格）作為買方的得益，則該博弈的雙方得益如圖5-11所示。其中各個(gè)得益數(shù)組的第一個(gè)數(shù)字為賣方，即博弈方1的得益。我們注意當(dāng)賣方在第二階段選擇賣而買方在第三階段選擇不買時(shí)，車況好、差對(duì)買方利益毫無(wú)影響，都是既無(wú)得也無(wú)失，但對(duì)賣方來(lái)講則明顯不同，因

12、為當(dāng)車況差時(shí)賣方想賣必須先花代價(jià)偽裝，賣不出去就會(huì)白白損失這筆費(fèi)用，即1千元的損失。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)1 好差11 不賣賣（0，0）賣不賣（0，0） 2 2 買不買買不買（2，1）（0，0）（1，-1）（-1，0）圖5-11 二手車交易擴(kuò)展式表示產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)根據(jù)上述得益情況看，買方在賣方選擇賣的前提下，選擇買既有賺的可能（車況好），也有虧的可能（車況差），選擇不買當(dāng)然肯定不會(huì)吃虧，但也失去了獲得利益的機(jī)會(huì)，因此沒(méi)有一個(gè)選擇絕對(duì)比另一個(gè)好。對(duì)賣方來(lái)說(shuō)，車況好時(shí)賣不賣得出去都無(wú)損失，只有得益的可能，因此賣總是比不賣好，但當(dāng)車況差時(shí)賣得出賣不出卻截然

13、相反，賣得出有所得利，賣不出卻要虧損，因此是否該賣就不那么容易判斷。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)要讓賣方在車況差的情況下決定是否賣必須有進(jìn)一步的信息或判斷，即買方會(huì)買下的概率究竟有多大；要讓買方?jīng)Q定是否買還必須要有進(jìn)一步的信息或判斷，實(shí)際上就是在賣方選賣的前提下車況好、車況差各自的概率。因?yàn)橛辛诉@樣的信息或判斷，買方或賣方就至少能對(duì)獲利機(jī)會(huì)、損失風(fēng)險(xiǎn)的大小程度心中有數(shù)，在自己承受能力的基礎(chǔ)上做出正確的判斷和選擇。但雙方?jīng)Q策需要的這些信息或判斷又都與雙方的選擇有關(guān)，因此在兩個(gè)博弈方的選擇、信息和判斷之間就形成了一種復(fù)雜的交互決定關(guān)系。事實(shí)上，這種交互決定關(guān)系正是不完美信息動(dòng)態(tài)博弈的關(guān)鍵和主要研究對(duì)

14、象。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 二、完美貝葉斯均衡二、完美貝葉斯均衡在完全且完美信息動(dòng)態(tài)博弈中，我們通過(guò)要求均衡策略組合滿足子博弈完美性（即策略組合在每個(gè)子博弈中都構(gòu)成納什均衡）來(lái)保證均衡策略中沒(méi)有任何不可信的威脅或承諾，其核心均衡概念就是子博弈精煉（完美）納什均衡。但是，在完全但不完美信息的動(dòng)態(tài)博弈中，因?yàn)榇嬖诙喙?jié)點(diǎn)信息集，一些重要的選擇及其后續(xù)階段不構(gòu)成真子博弈，因此子博弈完美性要求無(wú)法滿足，也就無(wú)法完全排除不可信的威脅或承諾，無(wú)法保證均衡策略中所有選擇的可信性，子博弈精煉納什均衡的概念失去了意義，因此必須發(fā)展新的均衡概念。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 1 1完美貝葉斯均衡的定義完美貝葉斯均

15、衡的定義當(dāng)一個(gè)策略組合及相應(yīng)的判斷滿足如下四個(gè)要求時(shí)，稱為一個(gè)“完美貝葉斯均衡”。這些要求是：要求要求1 1：在各個(gè)信息集，輪到選擇的博弈方必須具有一個(gè)關(guān)于博弈達(dá)到該信息集中每個(gè)節(jié)點(diǎn)可能性的“判斷”，對(duì)非單節(jié)點(diǎn)信息集，一個(gè)“判斷”就是博弈達(dá)到該信息集中各個(gè)節(jié)點(diǎn)可能性的概率分布，對(duì)單節(jié)點(diǎn)信息集，則可理解為“判斷達(dá)到該節(jié)點(diǎn)的概率為 l”。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 要求要求2 2：給定各博弈方的“判斷”，他們的策略必須是“序列理性序列理性”的。即在各個(gè)信息集，給定輪到選擇博弈方的判斷和其他博弈方的“后續(xù)策略”，該博弈方的行為及以后階段的“后續(xù)策略”，必須使自己的得益或期望得益最大。要求要求3

16、3：在均衡路徑上的信息集處，“判斷”要符合貝葉斯法則和各博弈方的均衡策略。要求要求4 4：在非均衡路徑上的信息集處，“判斷”也要符合貝葉斯法則和各博弈方在此處可能有的均衡策略。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 這是完美貝葉斯均衡的比較完全的定義方法。之所以稱這種均衡為完美貝葉斯均衡，首先是因?yàn)樗牡诙€(gè)要求“序列理性”，與子博弈精煉納什均衡中的子博弈完美性要求相似；其次是因?yàn)橐?和要求4中規(guī)定“判斷”的形成必須符合貝葉斯法則。根據(jù)上述定義不難看出，子博弈精煉納什均衡是完美貝葉斯均衡在完全且完美信息動(dòng)態(tài)博弈中的特例。即在完全且完美信息博弈中子博弈精煉納什均衡就是完美貝葉斯均衡。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈

17、2)實(shí)際上，序列理性用于子博弈中就是指子博弈的完美性，用在整個(gè)博弈中就是納什均衡概念，而在完全且完美信息動(dòng)態(tài)博弈中，所有輪到選擇博弈方的信息集都是單節(jié)點(diǎn)的，他們對(duì)博弈達(dá)到該節(jié)點(diǎn)的“判斷”都是概率等于1，這些判斷當(dāng)然都是滿足貝葉斯法則和以其他博弈方的后續(xù)策略為基礎(chǔ)的。更進(jìn)一步，完美貝葉斯均衡在靜態(tài)博弈中就是納什均衡。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 2 2均衡要求的初步解釋均衡要求的初步解釋下面我們以圖512中的完全但不完美信息動(dòng)態(tài)博弈為例，進(jìn)一步說(shuō)明上述要求的重要性。1R （1，3） L(p) M(1-p) 2 2 U D U D (2,1) (0,0) (0,0) (0,1) 圖5-12 完全但

18、不完美信息動(dòng)態(tài)博弈產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)圖512是一個(gè)兩博弈方各一次選擇的動(dòng)態(tài)博弈。因?yàn)樵诓┺姆?第一階段選擇不是R的情況下，博弈方2無(wú)法看到博弈方1究竟選擇的是L還是M，因此博弈方2具有不完美信息，這是一個(gè)不完美信息的動(dòng)態(tài)博弈。如果輪到博弈方2選擇時(shí)（博弈方1第一階段沒(méi)選R），若他不對(duì)博弈方1的選擇給出判斷的話，則他就不知該選U和D中哪一個(gè)才合理。因此，博弈方2在這兩個(gè)節(jié)點(diǎn)信息集處須對(duì)到達(dá)這兩個(gè)節(jié)點(diǎn)的可能性進(jìn)行判斷，也就是L、M兩條路徑的 “判斷” 是決策的必要基礎(chǔ)，從而也是均衡策略的基礎(chǔ)。這就說(shuō)明了要求1的必要性。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)要求 2也是非常必要的。從圖中可知，除了原來(lái)的

19、博弈之外，該博弈不存在任何其他真子博弈（子博弈完美性要求自然滿足），于是，對(duì)于這類博弈，子博弈精煉納什均衡定義實(shí)際上就是納什均衡，從圖 5-12可知（L，U）和（R，D）都是納什均衡。然而，（R，D）顯然依賴于一個(gè)不可信威脅：那就是博弈方2威脅在輪到自己選擇時(shí)將唯一地只選D，但是D是一個(gè)劣策略，至少劣于U。如果博弈方2采取這個(gè)策略，博弈方1的最佳對(duì)策就是第一階段直接選擇R使博弈結(jié)束，雙方得益是（1，3）。博弈方 1清楚，理性的博弈方2在什么情況下都不會(huì)采用D策略，因此，博弈方1決不會(huì)（只要他是理性的）因?yàn)椴┺姆?威脅采用D而被迫采取策略R，為了最大化自己的得益，博弈方1一定會(huì)采取L策略，迫使博

20、弈方2只得采取U策略。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 上述分析反應(yīng)了這樣一個(gè)事實(shí)，在完全但不完美信息博弈中，盡管（R，D）是一個(gè)納什均衡，可是它依賴于一個(gè)不可信的威脅，理應(yīng)從合理的預(yù)測(cè)中剔除掉。因此，要求 2對(duì)于保證不完美信息動(dòng)態(tài)博弈的均衡策略中沒(méi)有不可信的威脅或承諾具有關(guān)鍵作用。為了進(jìn)一步說(shuō)明要求 1和要求 2的必要性，我們假定當(dāng)博弈方2在博弈方1第一階段沒(méi)有選R的情況下，“判斷”博弈方1選L的概率為p，選M的概率l-p，在給定這樣的判斷的前提下，博弈方2選擇U的期望得益為： ppp)1 (01產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 而選D的期望得益為：顯然，當(dāng)p1-p時(shí)，即p 1/2時(shí)，博弈方2選U的得益

21、總大于選D的得益，根據(jù)要求2，博弈方2不會(huì)選D，只會(huì)選U。這時(shí)，博弈方1在第一階段的選擇就應(yīng)該是L，而非M，也非R。因此，博弈方1第一階段選L，博弈方2在博弈方1第一階段未選R的情況下選擇U，加上博弈方2對(duì)博弈方1選L、M的概率判斷p和1-p（p1-p），構(gòu)成一個(gè)滿足序列理性要求的策略組合（注意這里還沒(méi)有稱為完美貝葉斯均衡），滿足了要求1和要求2事實(shí)上已經(jīng)排除了前面提及的那個(gè)依賴于不可置信威脅從而不合理的納什均衡策略（R，D）。ppp1)1 ( 10產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)對(duì)于要求3和要求4中的“均衡路徑上”和“非均衡路徑上”一對(duì)概念，首先要弄清什么是均衡路徑。在不完美信息博弈中，由于至少

22、對(duì)一個(gè)博弈方的一個(gè)階段來(lái)說(shuō)，博弈實(shí)際達(dá)到何處是無(wú)法看到的，因此即使按均衡策略進(jìn)行博弈，某些信息集是否一定會(huì)達(dá)到也不確定。所以，在這種博弈中所謂所謂“在在均衡路徑上均衡路徑上”的信息集意味著如果博弈按照均衡策的信息集意味著如果博弈按照均衡策略進(jìn)行，則該信息集會(huì)以正的概率達(dá)到略進(jìn)行，則該信息集會(huì)以正的概率達(dá)到，而“不在均衡路徑上”的信息集就意味著博弈按均衡策略進(jìn)行時(shí)絕對(duì)不可能達(dá)到，或者達(dá)到的概率為0。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 對(duì)于圖 5-12中博弈方2的信息集，當(dāng)博弈方1第一階段的均衡策略選擇是 R 時(shí)不在均衡路徑上，而當(dāng)不是R時(shí)就在均衡路徑上。清楚了什么是“在”和“不在”均衡路徑上的信息集以后

23、，我們現(xiàn)在用圖5-12中博弈為例來(lái)分析一下要求3和要求4。首先討論要求3。為此，我們先假設(shè)均衡策略組合就是上面提到的“博弈方1在第一階段選擇L，博弈方2在第二階段選擇U”。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)首先，因?yàn)樵摬┺闹兄挥胁┺姆?有一個(gè)兩節(jié)點(diǎn)信息集，因此要求3實(shí)際上針對(duì)的就是博弈方2在其兩節(jié)點(diǎn)信息集處的“判斷”；其次，本博弈兩博弈方的選擇都是針對(duì)獲取最優(yōu)得益的主動(dòng)選擇，沒(méi)有非主動(dòng)選擇和外生不確定性，因此不需要額外信息幫助“判斷”；第三，在本博弈中博弈方2的“判斷”是直接針對(duì)博弈方1的上期選擇的，因此不存在條件概率問(wèn)題，貝葉斯法則自動(dòng)滿足；第四，要求3要求博弈方2對(duì)博弈方1的上期選擇的“判斷”符合

24、各博弈方的均衡策略，在這里就是符合博弈方1第一階段的選擇和博弈方2自己本階段的選擇。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 由于博弈方1的均衡策略在第一階段選擇的是L，因此只有博弈方2的 “判斷”是“博弈方1選擇L的概率 p=1”才與博弈方1的策略相符合，而且這種判斷也與博弈方2自己在本階段的選擇U相符合，因此該“判斷”正是博弈方 2決策和雙方策略均衡的穩(wěn)定基礎(chǔ)。如果博弈方2“判斷” p=0.75，則首先與博弈方1的選擇不完全符合，而且這種判斷對(duì)博弈方2選U的信心有不良影響，從而均衡就有不穩(wěn)定性。如果博弈方2“判斷” p=0.25，則與所設(shè)均衡策略組合“博弈方1選L，博弈方2選U”是完全矛盾的。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)

25、第五章(博弈2) 上述分析充分說(shuō)明了在不完美信息博弈中，“判斷”和均衡策略之間的相互依存關(guān)系，只有兩者是一致、協(xié)調(diào)的，才可能是真正的均衡。這正是要求3的真實(shí)含義?，F(xiàn)在我們討論要求 4。首先對(duì)于均衡策略組合“博弈方1在第一階段選擇L，博弈方2在第二階段選擇U”來(lái)說(shuō)，因?yàn)椴┺姆?的多節(jié)點(diǎn)信息集在均衡路徑上，不存在不在均衡路徑上需要“判斷”的信息集，因此要求4自動(dòng)滿足，不用再作討論。為此我們針對(duì)另一個(gè)納什均衡策略組合（R,D），即“博弈方1第一階段選擇R，博弈方2第二階段選擇D”來(lái)討論。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)在該均衡策略組合下，博弈方2的兩節(jié)點(diǎn)信息集是不在均衡路徑上的信息集。要求4要求博弈方2

26、此時(shí)在這個(gè)信息集的 “判斷”，也要滿足貝葉斯法則和雙方的均衡策略。同要求3，貝葉斯法則仍然自動(dòng)滿足，因此我們只需要討論博弈方2的“判斷”與雙方在此處可能有的均衡策略的一致性。從得益分布情況可知，很顯然，如果萬(wàn)一博弈方1在第一階段偏離了上述均衡策略R，按照前面的分析博弈方2一定會(huì)“判斷”博弈方1必然選擇L策略，產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 而博弈方1這時(shí)選擇L的概率p=1這一判斷是不符合要求4的，因?yàn)檫@與博弈方2自己的均衡策略D不符合。因此博弈方2此時(shí)的“判斷”只能是博弈方1選M的概率1-p=l，這樣博弈方2的“判斷”就與自己的策略相一致了。但是，博弈方2“判斷”1-p=1，意味著博弈方1肯定

27、選擇了M。這顯然是有問(wèn)題的，因?yàn)閷?duì)于博弈方1來(lái)說(shuō)，M既是相對(duì)于R的下策，也是相對(duì)于L的下策，即使他不愿選R，也只會(huì)選L而不會(huì)選M。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 因此，博弈方2的“判斷”1-p=1雖然可以與自己的策略D相符合，但卻無(wú)法與博弈方1在此處可能有的均衡策略相符合，這意味著該“判斷”也不滿足要求4。事實(shí)上，在上述得益結(jié)構(gòu)下，該博弈不可能存在與均衡策略組合“博弈方1第一階段選擇R，博弈方2第二階段選擇D”相符合的不在均衡路徑上的博弈方“判斷”，這實(shí)際上就意味著（R，D）策略組合不可能是該博弈具有真正穩(wěn)定性的完美貝葉斯均衡。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 3 3關(guān)于判斷形成的進(jìn)一步解釋關(guān)于判斷形成

28、的進(jìn)一步解釋例例1 1，二手車交易。圖511中的二手車交易博弈中，當(dāng)然是在賣方（博弈方1）決定賣以后，買方（博弈方2）的選擇信息集需要作出“判斷”。首先，買方需要的“判斷”是在博弈方1決定賣的情況下車況是好還是差，或者好、差的機(jī)會(huì)各是多少。我們可以用兩個(gè)條件概率p(g|s)和p(b|s)來(lái)表示買方對(duì)賣方?jīng)Q定賣車時(shí)車況好、差的“判斷”（顯然有p(g|s)+p(b|s)=1）。在買方作出判斷之前，先要知道車況好與差的機(jī)會(huì)各有多少，也即賣方在第一階段使用車子的情況是好還是差的可能性。我們用P（g）和P（b）來(lái)表示它們的概率，當(dāng)然這兩個(gè)概率一般是通過(guò)經(jīng)驗(yàn)性的知識(shí)和數(shù)據(jù)，或平均情況得到。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五

30、況下，分別選擇賣和不賣的概率分布p(s|g)、1-p(s|g)和p(s|b)、1-p(s|b)。由于賣方是主動(dòng)選擇和理性行為的，因此上述概率分布取決于賣方的均衡策略。)()()()()()()()()()(bspbpgspgpgspgpspgspgpsgp產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 根據(jù)圖5-11中的得益情況，首先可以肯定當(dāng)車況好時(shí)賣方肯定會(huì)選擇賣，因?yàn)橘u掉有正的得益，賣不掉跟不賣相比也沒(méi)任何區(qū)別，因此p(s|g)=1肯定成立。相反，在車況差時(shí)選擇賣而賣不出去就有損失，因此如何選擇就需要更多的斟酌。賣方究竟是應(yīng)該選擇賣還是不賣，或者選擇混合策略，需要考慮賣出去的機(jī)會(huì)，即買方選擇買的概率的大小。

31、產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)如果我們假設(shè)買方選擇買的概率是0.5，那么賣方在車況差的情況下選擇賣的期望得益為0.510.5（1）=0，與不賣的得益相等，作為一個(gè)風(fēng)險(xiǎn)中性的博弈方，賣方可采用（0.5，0.5）的概率分布選擇賣或不賣的混合策略。這時(shí)候，買方“判斷”p(s|b)=0.5就是符合賣方均衡策略的，并且也符合自己的均衡策略。有了p(s|g)=1和p(s|b)=0.5這兩個(gè)概率判斷，再假設(shè)已知總體車況好、差的概率p（g）=p（b）=0.5，則根據(jù)貝葉斯法則我們不難算出：產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 這就是買方在自己選擇的兩節(jié)點(diǎn)信息集處對(duì)賣方所賣車中好車所占比例的“判斷”。對(duì)差車所占比例的“判斷”

32、就是。由于在賣方的上述策略下，買方選擇的信息集至少有相當(dāng)大的概率會(huì)達(dá)到，因此該信息集是在均衡路徑上的信息集。這就是說(shuō)，我們通過(guò)分析得到的上述“判斷”是滿足要求3的判斷。這里的分析進(jìn)一步使我們對(duì)要求3使均衡策略和判斷之間具有的相互依存關(guān)系有了更深的體會(huì)。3275.05 .05 .05 .015 .015 .0)()()()()()()(bspbpgspgpgspgpsgp3/13/21)(1)(sgpsbp產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2)例2，為了進(jìn)一步理解4個(gè)要求的意義，我們?cè)俜治鲆粋€(gè)簡(jiǎn)單的例子。圖5-13是一個(gè)有三個(gè)博弈方的三階段不完全信息動(dòng)態(tài)博弈。第一階段博弈方1有F和B兩種選擇，他的選擇博弈

33、方2和博弈方3都能看見(jiàn)。第二階段博弈方2有L和R兩種選擇，跟在后面的博弈方3卻看不見(jiàn)博弈方2的選擇。博弈方3的信息集是一個(gè)兩節(jié)點(diǎn)信息集，即信息是不完美的。一般地我們假設(shè)他“判斷”博弈方2選L和R的概率分別是p和1p。如果博弈方1在第一階段選F，則博弈繼續(xù)下去，共有四種可能的結(jié)果，各方得益分別為相應(yīng)得益數(shù)組中同次序數(shù)值。產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 1 F B2 (2,0,0) L(p) R(1-p) 3 3 U D U D (1,2,1) (3,3,3) (0,1,2) (0,1,1) 圖5-13 三博弈方三階段動(dòng)態(tài)博弈產(chǎn)業(yè)經(jīng)濟(jì)學(xué)第五章(博弈2) 用逆推歸納法先考察博弈方3的選擇，他選U的期望得益為Pl+（l-P）2 = 2-P，選D的期望得益為P3 +（1-P）1 = 1+2P，因此當(dāng) 2-p1+2p，即pl3時(shí)他該選 U，當(dāng) pl/3時(shí)他該選D，P=1/3時(shí)選U、D或者混合策略都可以

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《產(chǎn)業(yè)經(jīng)濟(jì)學(xué)》第五章(博弈2)課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔