博弈論第四章 完全且完美信息動態(tài)博弈ppt課件_第1頁
博弈論第四章 完全且完美信息動態(tài)博弈ppt課件_第2頁
博弈論第四章 完全且完美信息動態(tài)博弈ppt課件_第3頁
博弈論第四章 完全且完美信息動態(tài)博弈ppt課件_第4頁
博弈論第四章 完全且完美信息動態(tài)博弈ppt課件_第5頁
已閱讀5頁,還剩101頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第四章第四章 完全且完美信息動態(tài)博弈完全且完美信息動態(tài)博弈 本章討論動態(tài)博弈,所有博弈方都對博弈過程和得益完全了解的完全且完美信息動態(tài)博弈。這類博弈也是現(xiàn)實中常見的基本博弈類型。由于動態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表示方法、利益關(guān)系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。本章對動態(tài)博弈分析的概念和方法,特別是子博弈完美均衡和逆推歸納法作系統(tǒng)介紹,并介紹各種經(jīng)典的動態(tài)博弈模型。完全且完美信息動態(tài)博弈的主要特點(1行動是順序發(fā)生的,行動是順序發(fā)生的,(2下一步行動選擇之前,所有以前的行動都下一步行動選擇之前,所有以前的行動都可以被觀察到,可以被觀察到,(3每個可能的行動組

2、合下局中人的收益是共每個可能的行動組合下局中人的收益是共同知識。同知識。第三章 完全且完美信息動態(tài)博弈n一 博弈擴展式表述n二 子博弈完美納什均衡n三、用逆向歸納法求-子博弈完美納什均衡n四、完全且完美信息的動態(tài)博弈的案例一 博弈擴展式表述(一博弈的標(biāo)準(zhǔn)式或戰(zhàn)略式、正則式或策略式)女足球芭蕾男足球2,10,0芭蕾0,01,2博弈的標(biāo)準(zhǔn)式戰(zhàn)略式)博弈的標(biāo)準(zhǔn)式戰(zhàn)略式)40004000,4000400080008000,0 00 0,800080000 0,0 0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不開發(fā)

3、開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求小的情況需求大的情況需求大的情況(二博弈擴展式表述(二博弈擴展式表述u博弈的擴展式表述包括四個要素博弈的擴展式表述包括四個要素: :u參與人集合參與人集合PlayerPlayer)u每個參與人的戰(zhàn)略集合每個參與人的戰(zhàn)略集合StrategyStrategy)u博弈的順序博弈的順序OrderOrder)u由戰(zhàn)略組合決定的每個參與人的支付由戰(zhàn)略組合決定的每個參與人的支付PayoffPayoff)擴展式表示的一個例子 博弈樹始于 局中人1 的一個決策結(jié)點,這時1要從L和R中作出選擇,如果局中人1選擇L,其后就到達 局中人2 的一個決策結(jié)點,這時,局

4、中人2要從L和R中作出選擇。類似地,如果局中人1選擇R,則將到達局中人2的另一個決策結(jié)點。 這時局中人2從L和R中選擇行動。無論局中人2選擇了哪一個,都將到達終結(jié)點 (即博弈結(jié)束)且兩局中人分別得到相應(yīng)終點節(jié)下面的收益。 A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動順序參與人的行動空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)結(jié),終點結(jié)枝結(jié),初始結(jié) 信息集橫向擴展式舉例:橫向擴展式舉

5、例:進入者進入不進入0,300)在位者市場進入阻撓博弈樹協(xié)作40,50)斗爭(-10,0)擴展型擴展型 為了讓“樹描繪博弈,其結(jié)點和枝需要滿足三條性質(zhì): 1單一的出發(fā)點。重要的是知道博弈從何處開始,所以必須有一個,也只能有一個出發(fā)點。2 無循環(huán)。重要的是在博弈運行中,我們不要陷入僵局;樹枝循原路折回并造成一個循環(huán)一定是不可接受的。3 單方向前進。重要的是,對于博弈如何進行下去不能模棱兩可,因此,必定不存在二個或多個枝導(dǎo)向同一個結(jié)。為保證這三條性質(zhì),在前結(jié)點上強加下述限為保證這三條性質(zhì),在前結(jié)點上強加下述限制:制: 1結(jié)點不能是自身的前結(jié)點。2前結(jié)點的前結(jié)點也是前結(jié)點:如果結(jié)點是的前結(jié)點,依次結(jié)

6、點是的前結(jié)點,那么也是的前結(jié)點。3前結(jié)點可以排序:假設(shè)和都是的前結(jié)點,必定是或者是的前結(jié)點,或者反過來。4必定存在一個共同的前結(jié)點:考慮任意兩個結(jié),和,它們之間沒有一個是另一個的前結(jié)點。那么,必定存在一個結(jié)點,它是和雙方的前結(jié)點。動態(tài)博弈的動態(tài)博弈的戰(zhàn)略戰(zhàn)略動態(tài)博弈的戰(zhàn)略的表述動態(tài)博弈的戰(zhàn)略的表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人的與人在什么情況下選擇什么行動,是參與人的“相機行動方案相機行動方案”。 個人選擇的戰(zhàn)略表示第)稱為一個戰(zhàn)略組合,(維向量戰(zhàn)略,個參與人每人選擇一個如果

7、戰(zhàn)略集合個參與人所有可選擇的代表第個參與人的特定戰(zhàn)略表示第issssssnnisSisiniiii21在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。作為一種行動規(guī)則,戰(zhàn)略必須是完備的。足球男足球芭蕾女女芭蕾足球芭蕾(2,1)(0,0)(1,2)(0,0)xxBattle of Sexes if Boy moves first足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx男的策略:足球,芭蕾選擇足球;還是選擇芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追隨策略:他選擇什么,我就選擇什么2、對抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不

8、管他選什么,我都選芭蕾;4、足球策略:不管他選什么,我都選足球。策略即:如果他選擇什么,我就怎樣行動的相機行動方案。在擴展式博弈里,參與人是相機行事,即“等待博弈到達一個自己的信息集包含一個或多個決策結(jié)后,再采取行動方案。Battle of Sexes if Boy moves first可以寫成標(biāo)準(zhǔn)式可以寫成標(biāo)準(zhǔn)式(戰(zhàn)略式戰(zhàn)略式)-3, -3-3, -31, 01, 00, 10, 00, 10, 0足球,足球足球,芭蕾芭蕾, 足球芭蕾,足球足球芭蕾wifewifehusbandhusband標(biāo)準(zhǔn)式標(biāo)準(zhǔn)式(戰(zhàn)略式戰(zhàn)略式)The strategy combinations.248( B, B,

9、 B ),?在在8個圖里找納什均衡個圖里找納什均衡Of 8 strategy combination, 3 are Nash Three Nash equilibria of Battle of Sexes are: ( B, B, B ), ( S, S, S ), and ( S, B, S );Their corresponding outcomes are all: ( Ballet, Ballet ), ( Soccer, Soccer ), and ( Soccer, Soccer ).BBBSSSBBBSSSBBBSSS不同的納什均衡可以對應(yīng)相同的結(jié)果一個動態(tài)博弈可能有多個甚至無

10、窮多個納一個動態(tài)博弈可能有多個甚至無窮多個納什均衡,究竟哪個更合理?什均衡,究竟哪個更合理?子博弈完美納什均衡子博弈完美納什均衡- -不可置信威脅不可置信威脅l美國普林斯頓大學(xué)古爾教授在美國普林斯頓大學(xué)古爾教授在20192019年的年的 里發(fā)表文章,提出一個例子說明威脅的可信性問題:里發(fā)表文章,提出一個例子說明威脅的可信性問題:l兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具。兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具。l不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關(guān)起來,關(guān)起來比不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關(guān)起來

11、,關(guān)起來比沒有玩具更可怕。沒有玩具更可怕。l如今,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。如今,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,因此哥哥對弟弟的警告置之不理。會使你的境遇變得更壞,所以你不會告狀,因此哥哥對弟弟的警告置之不理。l確實,如果弟弟是會算計自己利益的理性人,在這樣的環(huán)

12、境下,還是不告狀的好。可見,弟弟是理性人,確實,如果弟弟是會算計自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢?,弟弟是理性人,他的告狀威脅是不可置信的。他的告狀威脅是不可置信的。完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰澤爾騰1965)l考慮下列問題:考慮下列問題:l一個博弈可能有多個甚至無窮多個納什均衡,究竟哪個更合一個博弈可能有多個甚至無窮多個納什均衡,究竟哪個更合理?理?l納什均衡假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假定所有其納什均衡假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動有先有后,后他參與人

13、的戰(zhàn)略是給定的,但是如果參與人的行動有先有后,后行動者的選擇空間依賴于前行動者的選擇,前行動者在選擇時不行動者的選擇空間依賴于前行動者的選擇,前行動者在選擇時不可能不考慮自己的行動對后行動者的影響??赡懿豢紤]自己的行動對后行動者的影響。l子博弈完美納什均衡的一個重要改進是將子博弈完美納什均衡的一個重要改進是將“合理納什均衡合理納什均衡與與“不合理納什均衡不合理納什均衡分開。分開。二、子博弈精煉納什均衡或子二、子博弈精煉納什均衡或子博弈完美納什均衡)博弈完美納什均衡)l一個納什均衡稱為精煉納什均衡,當(dāng)只當(dāng)參與人的戰(zhàn)略在每個子博弈中都構(gòu)成納什均衡,也就是說,組成完美納什均衡的戰(zhàn)略必須在每一個子博弈

14、中都是最優(yōu)的。l一個精煉納什均衡首先必須是一個納什均衡,但納什均衡不一定是精煉納什均衡。l承諾行動-當(dāng)事人使自己的威脅戰(zhàn)略變得可置信的行動。子博弈完美納什均衡子博弈完美納什均衡l澤爾騰引入子博弈完美納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說,子博弈完美納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。l什么是子博弈,什么是子博弈完美納什均衡?l有沒有更好的方法找到子博弈完美納什均衡?完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰澤爾騰1965)l子博弈? Think of a branch

15、 of a tree as a (smaller) tree.If a branch of a tree representing a game does not divide any information set of the game, then it is a subgame of the game. l王 P175 什么是“支”?不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈找出房地產(chǎn)開發(fā)博弈的子博弈找出房地產(chǎn)開發(fā)博弈的子博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈IIA開發(fā)不開發(fā)BB開發(fā)不開發(fā)開

16、發(fā)(1,0)(0,1)(0,0)(-3,-3)xx子博弈動態(tài)博弈中的子博弈l虛線框出的部分正是博弈方2在博弈方1選擇進時所面臨的決策問題,它本身構(gòu)成博弈方2的一個單人博弈,我們稱它為原先來后到博弈的一個“子博弈”。Game and subgames子博弈未標(biāo)完)子博弈未標(biāo)完)子博弈定義子博弈定義 由一個動態(tài)博弈第一階段以外的某個階段開始的后續(xù)博弈階段構(gòu)成,它必須有初始信息集,具備進行博弈所需要的各種信息,能夠自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個“子博弈”。l子博弈不好找!l學(xué)完后面的信息集請看P177信息集信息集 為了擴展式表述也可用來表述靜態(tài)博弈,我們?yōu)榱藬U展式表述也可用來表述

17、靜態(tài)博弈,我們使用虛線圈。如:使用虛線圈。如:情愛博弈的擴展式表述情愛博弈的擴展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xxA開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在決策時不確切地知道自然的選擇; B的決策結(jié)由4個變?yōu)?個房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8

18、,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時決策) 房地產(chǎn)開發(fā)博弈Battle of Sexes againif Boy moves firstBoyGirlBalletBalletBalletSoccerSoccerSoccer( 1, 2)( -1, -1)( 0, 0)( 2, 1)Represent Battle of Sexes as a simultaneous-move game with a tree Information setsBoyGirlBalletBalletBalletSoccerSocc

19、erSoccer( 1, 2)( -1, -1)( 0, 0)( 2, 1)博弈樹的結(jié)構(gòu)博弈樹的結(jié)構(gòu)包括決策結(jié)和終點結(jié)。決策結(jié)是參包括決策結(jié)和終點結(jié)。決策結(jié)是參與人采取行動的時點;終點結(jié)是博與人采取行動的時點;終點結(jié)是博弈行動路徑的終點。弈行動路徑的終點。枝是從一個決策結(jié)到它的直接后續(xù)枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個枝代表參與人的結(jié)的連線,每一個枝代表參與人的一個行動選擇。一個行動選擇。一個信息集是決策結(jié)集合的一個子集一個信息集是決策結(jié)集合的一個子集(信息集信息集是由決策結(jié)構(gòu)成的集合是由決策結(jié)構(gòu)成的集合),該子集包括所有滿,該子集包括所有滿足下列條件的決策結(jié):足下列條件的決策結(jié):

20、(1)每一個決策結(jié)都是同一個參與人的決策結(jié)每一個決策結(jié)都是同一個參與人的決策結(jié)(2)該參與人知道博弈進入該集合的某個決策該參與人知道博弈進入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決策結(jié)。結(jié),但不知道自己究竟處于哪一個決策結(jié)。l錯誤信息集示例見書166.l1、一個信息集罩住的首先必須是同一個局中人的決策節(jié)點。l2、一個信息集罩住的必須是同一個局中人在同一個時點的決策節(jié)點。l3、3、Same-set-same-strategies principle:At any decision node belonging to a specific information set, the play

21、er has same strategies/actions to choose.Thus, no games like this:2.1 博弈的擴展式表述 如果博弈樹的所有信息集都是單結(jié)的,如果博弈樹的所有信息集都是單結(jié)的,則稱為則稱為“完美信息博弈完美信息博弈”,沒有任何兩,沒有任何兩個決策結(jié)是用虛線連起來的個決策結(jié)是用虛線連起來的 自然信息集總是假設(shè)為單結(jié)的自然信息集總是假設(shè)為單結(jié)的 博弈樹上是否出現(xiàn)連接不同決策結(jié)的虛博弈樹上是否出現(xiàn)連接不同決策結(jié)的虛線取決于如何劃決策結(jié)的順序線取決于如何劃決策結(jié)的順序 有了信息集的概念,擴展式表述也可用有了信息集的概念,擴展式表述也可用來表述靜態(tài)博弈來

22、表述靜態(tài)博弈完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰澤爾騰1965)l子博弈:是原博弈的一部分,它本身也可以作為一個獨立的博弈進行分析:l(1子博弈必須從一個單結(jié)信息點開始:只有決策者在原博弈中確切地知道博弈進入一個特定的決策結(jié)時,該決策結(jié)才能作為一個子博弈的初始結(jié)。如果信息集包含兩個以上的決策結(jié),則這兩個都不可以作為子博弈的初始結(jié)見下頁)。l(2子博弈的信息集和支付向量都直接繼承自原博弈,即當(dāng)x和x在原博弈中屬于同一信息集時,他們在子博弈中才屬于同一信息集。l習(xí)慣上,任何博弈的本身稱為自身的一個子博弈。l書上的定義175:l1S的博弈樹是T的博弈樹的一支什

23、么是支?見175);l2博弈S不能分割博弈T的信息集,具體說,質(zhì)押博弈T的某個信息集的任何一個決策節(jié)點是博弈S的一個決策節(jié)點,那么T的這個信息集的每一個決策節(jié)點都必須是博弈S的決策節(jié)點。l3) lP177l圖表514A開發(fā)不開發(fā)XX大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 參與人X的信息集不能開始一個子博弈,否則的話,參與人B的信息將被切割。完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰澤爾騰1965)l子博弈完美納什均衡:l 擴展式博弈的戰(zhàn)

24、略組合是一個子博弈完美納什均衡,假設(shè):l(1它是原博弈的納什均衡;l(2它在每一個子博弈上給出納什均衡。BBBSSSBBBSSSBBBSSSRestricted to the circled subgames, the Nash are unstable.Thus there is only one subgame-perfect equilibrium.A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),

25、不開發(fā))在c上構(gòu)成均衡,在b上不構(gòu)成; 在b和c上都構(gòu)成 在c上構(gòu)成均衡,在b上不構(gòu)成完全信息動態(tài)博弈-子博弈完美納什均衡澤爾騰1965)不開發(fā) 判斷下列均衡結(jié)果哪個構(gòu)成子博弈完美納什均衡?不開發(fā)bc完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰澤爾騰1965)l如果一個博弈有幾個子博弈,一個特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”,博弈樹上的其他路徑稱為“非均衡路徑”。l納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的;l而構(gòu)成子博弈完美納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡

26、與子博弈完美納什均衡的實質(zhì)區(qū)別。BBBSSSBBBSSSBBBSSSRestricted to the circled subgames, the Nash are unstable.Thus there is only one subgame-perfect equilibrium.完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰澤爾騰1965)l戰(zhàn)略是參與人行動規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見的情況下即每一個決策結(jié)上選擇什么行動,即使這種情況實際上沒有發(fā)生甚至參與人并不預(yù)期它會發(fā)生)。l因此,只有當(dāng)一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的,

27、它才是一個合理的可置信的戰(zhàn)略,子博弈完美納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動規(guī)則。完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰澤爾騰1965)l練習(xí)練習(xí): :l參與人參與人1 1丈夫和參與人丈夫和參與人2 2妻子必須獨立決定出門時是否帶傘。妻子必須獨立決定出門時是否帶傘。他們知道下雨和不下雨的可能性均為他們知道下雨和不下雨的可能性均為50%50%,支付函數(shù)為:如果只有一人,支付函數(shù)為:如果只有一人帶傘,下雨時帶傘者的效用為帶傘,下雨時帶傘者的效用為-2.5-2.5,不帶傘者的效用為,不帶傘者的效用為-3-3不下雨時帶不下雨時帶傘

28、的效用為傘的效用為-1,-1,不帶的效用為不帶的效用為0;0;如兩人都不帶傘如兩人都不帶傘, ,下雨時每人的效用為下雨時每人的效用為- -5,5,不下雨時每人的效用為不下雨時每人的效用為1;1;給出下列四種情況下的擴展式及戰(zhàn)略式表給出下列四種情況下的擴展式及戰(zhàn)略式表述述: :l(1)(1)兩人出門前都不知道是否會下雨兩人出門前都不知道是否會下雨; ;并且兩人同時決定是否帶傘并且兩人同時決定是否帶傘( (即每即每一方在決策時都不知道對方的決策一方在決策時都不知道對方的決策););l(2)(2)兩人在出門前都不知道是否會下雨兩人在出門前都不知道是否會下雨, ,但丈夫先決策,妻子觀察到丈但丈夫先決策

29、,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘夫是否帶傘后才決定自己是否帶傘; ;l(3)(3)丈夫出門前知道是否會下雨丈夫出門前知道是否會下雨, ,但妻子不知道,但丈夫先決策,妻子但妻子不知道,但丈夫先決策,妻子后決策后決策; ;l(4),(4),同同(3),(3),但妻子先決策,丈夫后決策但妻子先決策,丈夫后決策. .三、用逆向歸納法求三、用逆向歸納法求-子博弈完美納子博弈完美納什均衡什均衡微軟公司的入門考試題微軟公司的入門考試題l強盜分贓向前展望,倒后推理)強盜分贓向前展望,倒后推理)l有有5 5個強盜搶得個強盜搶得100100枚金幣,在如何分贓上爭論枚金幣,在如何分贓上爭論不休,于是他們

30、決定:不休,于是他們決定:l(1 1抽簽決定個人的號碼抽簽決定個人的號碼1 1,2 2,3 3,4 4,5 5)l(2 2由由1 1號提出分配方案,然后號提出分配方案,然后5 5人表決,如人表決,如果方案超過半數(shù)同意就通過,否則他被扔進大果方案超過半數(shù)同意就通過,否則他被扔進大海喂鯊魚;海喂鯊魚;l(3 31 1號死后,號死后,2 2號提方案,號提方案,4 4人表決,當(dāng)且僅人表決,當(dāng)且僅當(dāng)超過半數(shù)同意時方案通過,否則當(dāng)超過半數(shù)同意時方案通過,否則2 2號被扔進號被扔進大海;大海;l(4 4依次類推,知道找到一個每個人都接受依次類推,知道找到一個每個人都接受的方案當(dāng)然,如果只剩的方案當(dāng)然,如果只

31、剩5 5號,他獨吞)號,他獨吞)l結(jié)果會如何?結(jié)果會如何?強盜1234501001000098011970120強盜1234501001000098011970120970102三、用逆向歸納法求三、用逆向歸納法求-子博弈完美納什均衡子博弈完美納什均衡1UDL(3,1)(0,0)22,2R三、用逆向歸納法求三、用逆向歸納法求-子博弈完美納什均衡子博弈完美納什均衡1UDL(3,1)(0,0)22,2R 給定博弈達到最后一個決策結(jié),該決策結(jié)上行動的參與人有一個最優(yōu)選擇,這個最優(yōu)選擇即該決策結(jié)開始的子博弈的納什均衡 倒數(shù)第二個決策結(jié),找倒數(shù)第二個的最優(yōu)選擇,這個最優(yōu)選擇與我們在第一步找到的最優(yōu)選擇構(gòu)

32、成一個納什均衡。 如此重復(fù)直到初始結(jié)。每一步都得到對應(yīng)于子博弈的一個納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈納什均衡,這個過程的最后一步得到整個博弈的納什均衡完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰澤爾騰1965)1UDL(1,1)22,0RU(3,0)(0,2)1D 子博弈完美納什均衡子博弈完美納什均衡(U U,UU),),L L). . U U和和L L分別是參與人分別是參與人1 1和參與人和參與人2 2在非均衡路徑上在非均衡路徑上的選擇。的選擇。 逆向歸納法求解子博弈逆向歸納法求解子博弈完美納什均衡的過程,實質(zhì)完美納什均衡的過程,實質(zhì)上

33、是重復(fù)剔除劣戰(zhàn)略的過程:上是重復(fù)剔除劣戰(zhàn)略的過程:從最后一個決策結(jié)依次剔除從最后一個決策結(jié)依次剔除每個子博弈的劣戰(zhàn)略,最后每個子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成完美納生存下來的戰(zhàn)略構(gòu)成完美納什均衡。什均衡。122左右ABCD(3,1) (5,6)(4,2)(2,7)h1h12h22122左右BD(5,6)(2,7)h1h12h2212左B(5,6)h1h12完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰澤爾騰1965)l用逆向歸納法求解的子博弈完美納什均衡也要求“所有的參與人是理性的是共同知識。l如果博弈由多個階段組成,則從逆向歸納法得到的均衡可能并不非常令人

34、信服。1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向歸納法要求“所有參與人是理性的是所有參與人的共同知識。因此,在有多個參與人或每個參與人有多次行動機會的情況下,逆向歸納法的結(jié)果可能并非如此。多個參與人的情況多個參與人的情況(2,2)如果如果n很小,逆向很小,逆向歸納法的結(jié)果歸納法的結(jié)果逆向歸納法與子搏弈完美納什均衡的存在問題逆向歸納法與子搏弈完美納什均衡的存在問逆向歸納法與子搏弈完美納什均衡的存在問題題l如果n很大,結(jié)果又如何呢?1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多個參與人的情況多個參與人的

35、情況(2,2)如果如果n很大很大 對于參與人1,獲得2單位支付前提是所有n-1個參與人都選A,否則就要考慮是否應(yīng)該選擇D以保證1的支付。如果給定一個參與人選擇A的概率是p0; (2)企業(yè)2觀測到然后選擇產(chǎn)量q2 0(3)企業(yè)1的收益由下面的利潤函數(shù)給出:P(Q)l對上面的通過求極值可得:對上面的通過求極值可得:l已知q1 a-c,在前面我們分析同時行動的古諾博弈中,得出的R2(q1)和上式完全一致,兩者的不同之處在于這里的R2(q1)是企業(yè)2對企業(yè)1已觀測到的產(chǎn)量的真實反應(yīng),而在古諾的分析中, R2(q1)是企業(yè)2對假定的企業(yè)1的產(chǎn)量的最優(yōu)反應(yīng),且企業(yè)1的產(chǎn)量選擇是和企業(yè)2同時作出的。l 由于

36、企業(yè)1也能夠像企業(yè)2一樣解出企業(yè)2的最優(yōu)反應(yīng),企業(yè)1就可以預(yù)測到他如選擇q1,企業(yè)2將根據(jù)R2(q1)選擇產(chǎn)量。那么在博弈的第一階段,企業(yè)1的問題就可表示為:解得:解得:l這就是斯塔克爾貝里雙頭壟斷博弈的逆向歸納解。這就是斯塔克爾貝里雙頭壟斷博弈的逆向歸納解。l對斯塔科爾貝里雙頭壟斷博弈的逆向歸納解的評價:對斯塔科爾貝里雙頭壟斷博弈的逆向歸納解的評價:l 回顧在古諾博弈的納什均衡中,每一企業(yè)的產(chǎn)量為回顧在古諾博弈的納什均衡中,每一企業(yè)的產(chǎn)量為(a一一c)/3,也就是說,斯塔克爾貝里博弈中逆向歸納解的總也就是說,斯塔克爾貝里博弈中逆向歸納解的總產(chǎn)量產(chǎn)量3(a-c)/4,比古諾博弈中納什均衡的總產(chǎn)

37、量,比古諾博弈中納什均衡的總產(chǎn)量l2(a-c)/3要高,從而斯塔克爾貝里博弈相應(yīng)的市場出清要高,從而斯塔克爾貝里博弈相應(yīng)的市場出清價格就比較低。價格就比較低。l不過在斯塔克爾貝里博弈中,企業(yè)不過在斯塔克爾貝里博弈中,企業(yè)1完全可以選擇古諾完全可以選擇古諾均衡產(chǎn)量均衡產(chǎn)量(a一一c)/3 ,這時企業(yè),這時企業(yè)2的最優(yōu)反應(yīng)同樣是古諾的最優(yōu)反應(yīng)同樣是古諾均衡的產(chǎn)量,也就是說在斯塔克爾貝里博弈中,企業(yè)均衡的產(chǎn)量,也就是說在斯塔克爾貝里博弈中,企業(yè)1完全可以使利潤水平達到古諾均衡的水平,而卻選擇了完全可以使利潤水平達到古諾均衡的水平,而卻選擇了其他產(chǎn)量,其他產(chǎn)量,l那么企業(yè)那么企業(yè)1在斯塔克爾貝里博弈中

38、的利潤一定高于其在在斯塔克爾貝里博弈中的利潤一定高于其在古諾博弈中的利潤。但斯塔克爾貝里博弈中的市場出清古諾博弈中的利潤。但斯塔克爾貝里博弈中的市場出清價格降低了,從而總利潤水平也會下降,那么和古諾博價格降低了,從而總利潤水平也會下降,那么和古諾博弈的結(jié)果相比,在斯塔克爾貝里博弈中,企業(yè)弈的結(jié)果相比,在斯塔克爾貝里博弈中,企業(yè)1利潤的利潤的增加必定意味著企業(yè)增加必定意味著企業(yè)2福利的惡化。福利的惡化。l 和古諾博弈相比,斯塔克爾貝里博弈中企業(yè)和古諾博弈相比,斯塔克爾貝里博弈中企業(yè)2利潤水平利潤水平的降低,揭示了單人決策問題和多人決策間題的一個重的降低,揭示了單人決策問題和多人決策間題的一個重要

39、不同之處。在單人決策理論中,占有更多的信息決不要不同之處。在單人決策理論中,占有更多的信息決不會對決策制定者帶來不利,然而在博弈論中,了解更多會對決策制定者帶來不利,然而在博弈論中,了解更多的信息的信息(或更為精確地說,是讓其他參加者知道一個人或更為精確地說,是讓其他參加者知道一個人掌握更多的信息掌握更多的信息)卻可以讓一個參與者受損。卻可以讓一個參與者受損。斯塔科爾貝里博弈中信息進一步的探討斯塔科爾貝里博弈中信息進一步的探討l 在斯塔克爾貝里博弈中,存在問題的信息是企業(yè)的產(chǎn)量:企業(yè)2知道q1,并且(重要的是)企業(yè)1知道企業(yè)2知道q1。為看清楚這一信息的影響,我們把上面序貫行動的博弈稍作修改,

40、假設(shè)企業(yè)1先選擇q1 ,之后企業(yè)2選擇q2,但事前并沒有觀測到q1,如果企業(yè)2確信企業(yè)1選擇了它的斯塔克爾貝里產(chǎn)量(a-c)/2,則企業(yè)2的最優(yōu)反應(yīng)仍是R2 (q1)=(a-c)/4。l但是,如果企業(yè)1預(yù)測到企業(yè)2將持有這一推斷并選擇這一產(chǎn)量,企業(yè)1就會傾向于它對l(a-c)/4的最優(yōu)反應(yīng)的最優(yōu)反應(yīng)-即即3(a-c)/8而不愿去選擇斯而不愿去選擇斯塔克爾貝里產(chǎn)量塔克爾貝里產(chǎn)量(a-c)/2,那么企業(yè),那么企業(yè)2就不會相信企就不會相信企業(yè)業(yè)1選擇了斯塔克爾貝里產(chǎn)量。從而這一修改過的選擇了斯塔克爾貝里產(chǎn)量。從而這一修改過的序貫行動博弈的惟一納什均衡,對兩個企業(yè)都是選序貫行動博弈的惟一納什均衡,對兩

41、個企業(yè)都是選擇產(chǎn)量擇產(chǎn)量(a-c)/3.-這正是古諾博弈中的納什均衡,這正是古諾博弈中的納什均衡,其中企業(yè)是同時行動的。其中企業(yè)是同時行動的。2 2、里昂惕夫的工會模型、里昂惕夫的工會模型l 在里昂惕夫(1946)模型中,討論了一個企業(yè)和一個壟斷的工會組織(即作為企業(yè)勞動力惟一供給者的工會組織)的相互關(guān)系:工會對工資水平說一不二,但企業(yè)卻可以自主決定就業(yè)人數(shù)(在更符合現(xiàn)實情況的模型中,企業(yè)和工會間就工資水平討價還價,但企業(yè)仍自主決定就業(yè),得到的定性結(jié)果與本模型相似)。工會的效用函數(shù)為U(W, L),其中W為工會向企業(yè)開出的工資水平,L為就業(yè)人數(shù)。l假定假定U(W, L)是是W和和L的增函數(shù)。企

42、業(yè)的利潤函數(shù)的增函數(shù)。企業(yè)的利潤函數(shù)為為 ,其中,其中R (L)為企業(yè)雇傭為企業(yè)雇傭L名工名工人可以取得的收入人可以取得的收入(在最優(yōu)的生產(chǎn)和產(chǎn)品市場決策下在最優(yōu)的生產(chǎn)和產(chǎn)品市場決策下),假定假定R (L)是增函數(shù),并且為凹函數(shù)。是增函數(shù),并且為凹函數(shù)。l 假定博弈的時序為假定博弈的時序為:(1)工會給出需要的工資水平工會給出需要的工資水平W;(2)企業(yè)觀測到企業(yè)觀測到(并接受并接受)W,隨后選擇雇傭人數(shù),隨后選擇雇傭人數(shù)L;(3)收益分收益分別為別為U(W, L)和和 。即使沒有假定。即使沒有假定U(W, L)和和R (L)的具體的表達式,從而無法明確解出該博弈的逆向的具體的表達式,從而無法

43、明確解出該博弈的逆向歸納解,但我們?nèi)钥梢跃徒獾闹饕卣鬟M行討論。歸納解,但我們?nèi)钥梢跃徒獾闹饕卣鬟M行討論。l 首先,對工會在第一階段任意一個工資水平w,我們能夠分析在第二階段企業(yè)最優(yōu)反應(yīng)L*(W)的特征。給定w,企業(yè)選擇L*(W)滿足下式:l 一階條件為:l 為了滿足上述一階條件,假設(shè)R(0)=; R()=0.l 下面的圖把L *(w)表示為w的函數(shù)(但坐標(biāo)軸經(jīng)過旋轉(zhuǎn)以便于和以后的數(shù)據(jù)相比較),并表示出它和企業(yè)每條等利潤線交于其最高點。若令L保持不變,lL保持不變,保持不變,w降低時企業(yè)的利潤就會提高,于是較低降低時企業(yè)的利潤就會提高,于是較低的等利潤曲線代表了較高的利潤水平。的等利潤曲線代

44、表了較高的利潤水平。l這張圖描述了工會的無差異曲線,若令這張圖描述了工會的無差異曲線,若令L不變,當(dāng)不變,當(dāng)w提高時工會的福利就會增加。于是較高的無差異曲線提高時工會的福利就會增加。于是較高的無差異曲線代表了工會較高的效用水平。代表了工會較高的效用水平。l下面我們分析工會在第一階段的問題,由于工會和企業(yè)下面我們分析工會在第一階段的問題,由于工會和企業(yè)同樣可以解出企業(yè)在第二階段的問題,工會就可預(yù)測到同樣可以解出企業(yè)在第二階段的問題,工會就可預(yù)測到如果它要求的工資水平為如果它要求的工資水平為w1,企業(yè)最優(yōu)反應(yīng)的就業(yè)人,企業(yè)最優(yōu)反應(yīng)的就業(yè)人數(shù)將會是數(shù)將會是L*(w1)。那么,工會在第一階段的問題可以

45、表。那么,工會在第一階段的問題可以表示為示為:l表現(xiàn)在圖中的無差異曲線上就是,工會希望選擇一個工表現(xiàn)在圖中的無差異曲線上就是,工會希望選擇一個工資水平資水平w,由此得到的結(jié)果,由此得到的結(jié)果(w, L*(w)處于可能達到的處于可能達到的最高的無差異線上。這一最優(yōu)化間題的解為最高的無差異線上。這一最優(yōu)化間題的解為w*,這樣,這樣一個工資要求將使得工會通過一個工資要求將使得工會通過(w*, L*(w*)的無差異曲的無差異曲線與線與L*(w)相切于該點,如下圖。從而相切于該點,如下圖。從而(w*, L*(w*)就就是這一工資與就業(yè)博弈的逆向歸納解。是這一工資與就業(yè)博弈的逆向歸納解。l 更進一步我們還可以看出,(w*,L*(w*)是低效率的,在上圖中,如果w和L處于圖中陰影部分以內(nèi),企業(yè)和工會的效用水平都會提高。這種低效率對實踐中企業(yè)對雇傭工人數(shù)量保持的絕對控制權(quán)提出了質(zhì)疑。(允許工人和企業(yè)就工資相互討價還價,但企業(yè)仍對雇傭工人數(shù)量絕對控制,也會得到相似的低效率解)。l埃斯皮諾薩和里埃斯皮諾薩和里(Espi nosa&Rhee, 1989 )基于如下事基于如下事實為這一質(zhì)疑提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論