第六章博弈論初步_第1頁
第六章博弈論初步_第2頁
第六章博弈論初步_第3頁
第六章博弈論初步_第4頁
第六章博弈論初步_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第六章第六章 博弈論初步博弈論初步內(nèi)容提要內(nèi)容提要概述概述完全信息靜態(tài)博弈完全信息靜態(tài)博弈完全信息動態(tài)博弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈不完全信息動態(tài)博弈博弈論(博弈論(Game Theory)Game theory models strategic behavior by agents who understand that their actions affect the actions of other agents. J.Von.Neumann(1903-1957)計算機(jī)之父;計算機(jī)之父;天才的數(shù)學(xué)家;天才的數(shù)學(xué)家;數(shù)理經(jīng)濟(jì)學(xué)奠基人。數(shù)理經(jīng)濟(jì)學(xué)奠

2、基人。代表作品:代表作品:博弈論博弈論與經(jīng)濟(jì)行為,經(jīng)濟(jì)學(xué)與經(jīng)濟(jì)行為,經(jīng)濟(jì)學(xué)領(lǐng)域的革命領(lǐng)域的革命,(與,(與摩根斯坦合著,摩根斯坦合著,1944)John.Nash(1928_)1948年進(jìn)入普林斯頓年進(jìn)入普林斯頓大學(xué)攻讀數(shù)學(xué)博士學(xué)大學(xué)攻讀數(shù)學(xué)博士學(xué)位;位;1950-51年提出納什均年提出納什均衡;衡;1958年患精神分裂癥;年患精神分裂癥;1994年獲諾貝爾經(jīng)濟(jì)年獲諾貝爾經(jīng)濟(jì)學(xué)獎。學(xué)獎。Some Applications of Game TheoryThe study of oligopolies (industries containing only a few firms)The stud

3、y of cartels; e.g. OPECThe study of externalities; e.g. using a common resource such as a fishery.The study of military strategies.一、博弈的三要素一、博弈的三要素A game consists ofla set of playersla set of strategies for each playerlthe payoffs to each player for every possible list of strategy choices by the pla

4、yers.Two-Player GamesA game with just two players is a two-player game.We will study only games in which there are two players, each of whom can choose between only two strategies.An Example of a Two-Player GameThe players are called A and B.Player A has two strategies, called “Up” and “Down”.Player

5、 B has two strategies, called “Left” and “Right”.The table showing the payoffs to both players for each of the four possible strategy combinations is the games payoff matrix.An Example of a Two-Player GamePlayer BPlayer ALRUD(3,9)(0,0)(1,8)(2,1)二、博弈的分類二、博弈的分類以結(jié)果為依據(jù):以結(jié)果為依據(jù):l零和博弈(零和博弈(zero sum game)l正

6、和博弈(正和博弈(positive sum game)l負(fù)和博弈(負(fù)和博弈(negative sum game)是否能達(dá)成協(xié)議是否能達(dá)成協(xié)議l合作博弈(合作博弈(cooperative game) l非合作博弈(非合作博弈(noncooperative game) 博弈的分類博弈的分類博弈的次數(shù)博弈的次數(shù)l重復(fù)博弈重復(fù)博弈l非重復(fù)博弈非重復(fù)博弈博弈的次序博弈的次序l靜態(tài)博弈(靜態(tài)博弈(static game)l動態(tài)博弈(動態(tài)博弈(dynamic game)擁有的信息擁有的信息l完全信息完全信息l不完全信息不完全信息三、均衡解三、均衡解最大最小均衡最大最小均衡納什均衡納什均衡An Example

7、 of a Two-Player GamePlayer BPlayer ALRUD(3,9)(0,0)(1,8)(2,1)Nash EquilibriumA play of the game where each strategy is a best reply to the other is a Nash equilibrium.Our example has two Nash equilibria; (U,L) and (D,R).An Example of a Two-Player GamePlayer BPlayer A(U,L) and (D,R) are both Nash equ

8、ilibria forthe game.LRUD(3,9)(0,0)(1,8)(2,1)An examplePlayer BUDLR(3,3)Player A (3,2)(2,3)(4,5)Different resultsAccording to maxmin principle, the equilibria solution is (D,R);While the nash equilibria solution of this example is (D,L)Which is better?The Prisoners DilemmaTo see if Pareto-preferred o

9、utcomes must be what we see in the play of a game, consider a famous second example of a two-player game called the Prisoners Dilemma.The Prisoners DilemmaWhat plays are we likely to see for thisgame?ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSCThe Prisoners DilemmaSo no matter what Bonnie plays,

10、Clydesbest reply is always Confess.Confess is a dominant strategy for Clyde.ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSCThe Prisoners DilemmaSimilarly, no matter what Clyde plays,Bonnies best reply is always Confess.Confess is a dominant strategy(占優(yōu)策略)占優(yōu)策略) forBonnie also.ClydeBonnie(-5,-5)(-30,-

11、1)(-1,-30)(-10,-10)SCSCThe Prisoners DilemmaSo the only Nash equilibrium for thisgame is (C,C), even though (S,S) givesboth Bonnie and Clyde better payoffs.The only Nash equilibrium is inefficient.ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC囚徒困境引發(fā)的思考囚徒困境引發(fā)的思考在該模型中,每個局中人都有嚴(yán)格占在該模型中,每個局中人都有嚴(yán)格占優(yōu)策略,即無

12、論對手作出何種選擇,優(yōu)策略,即無論對手作出何種選擇,當(dāng)事人都有一種選擇嚴(yán)格比其他選擇當(dāng)事人都有一種選擇嚴(yán)格比其他選擇要好;要好;該模型可以解釋生活中的現(xiàn)象該模型可以解釋生活中的現(xiàn)象l經(jīng)濟(jì)增長中的環(huán)境污染;經(jīng)濟(jì)增長中的環(huán)境污染;l企業(yè)之間的廣告戰(zhàn);企業(yè)之間的廣告戰(zhàn);l大國之間的軍事備戰(zhàn);大國之間的軍事備戰(zhàn);l對公共產(chǎn)品的過度使用;對公共產(chǎn)品的過度使用;l腐敗現(xiàn)象;腐敗現(xiàn)象;l問題問題納什均衡與效率?納什均衡與效率?如何走出囚徒困境?如何走出囚徒困境?Iterated dominance equilibrium(重復(fù)剔除的占優(yōu)戰(zhàn)略均衡)重復(fù)剔除的占優(yōu)戰(zhàn)略均衡)“Boxed Pigs” gameBo

13、xed PigsThe small oneynyn(0,0)The big one (3,1)(2,4)(7,-1)Boxed PigsIn this game, the big pig doesnt have a dominance strategy, while the small one has a strictly dominated strategy.When the big pig realizes the small one will never choose “y”, then he has a dominance strategy, more precisely, the b

14、ig pig is obliged to choose y.So the small pig chooses to be a “free-rider”.智豬模型可以解釋的現(xiàn)實(shí)經(jīng)濟(jì)現(xiàn)象智豬模型可以解釋的現(xiàn)實(shí)經(jīng)濟(jì)現(xiàn)象R&D;股市中機(jī)構(gòu)與散戶的博弈(羊群效應(yīng));股市中機(jī)構(gòu)與散戶的博弈(羊群效應(yīng));政治中的領(lǐng)導(dǎo)人;政治中的領(lǐng)導(dǎo)人;公共產(chǎn)品的提供;公共產(chǎn)品的提供;市場開發(fā);市場開發(fā);國企與私企對員工的培訓(xùn);國企與私企對員工的培訓(xùn);How Many Nash Equilibria?Player BPlayer AHere is a new game. Are there any purestrat

15、egy Nash equilibria?(1,2)(0,4)(0,5)(3,2)UDLRPure StrategiesPlayer BPlayer AIs (U,L) a Nash equilibrium? No.Is (U,R) a Nash equilibrium? No.Is (D,L) a Nash equilibrium? No.Is (D,R) a Nash equilibrium? No.(1,2)(0,4)(0,5)(3,2)UDLRPure StrategiesSo the game has no Nash equilibria in purestrategies. Even

16、 so, the game does have aNash equilibrium, but in mixed strategies(混合策略)(混合策略).How Many Nash Equilibria?A game with a finite number of players, each with a finite number of pure strategies, has at least one Nash equilibrium.So if the game has no pure strategy Nash equilibrium then it must have at le

17、ast one mixed strategy Nash equilibrium.Wilson theoremWilson證明,在有限次博弈中,總存證明,在有限次博弈中,總存在奇數(shù)個納什均衡。在奇數(shù)個納什均衡。Mixed strategy:more examplesChicken gameSocial welfare gamefinger-guessing gameSex battle Chicken gamewifeIyIy(0,0)husband (-3,-3)(2,0)(0,2)(2/5,3/5),(2/5,3/5)Social welfare gameunemployerynsk(0,0

18、)govermant (3,2)(-1,3)(-1,1)solution),),(,(因此混合策略均衡解為同理可得:可得:)()()(),即:(不救濟(jì),)救濟(jì),成立:對于政府而言,有下式。者積極尋找工作的概率為失業(yè)),其中,(混合策略均衡為救濟(jì)的概率;失業(yè)者的為政府對失業(yè)者給予),其中,(為設(shè)政府的混合策略均衡考慮混合均衡情況,弈不存在純策略均衡。由已知條件可知,該博解8 . 02 . 05 . 05 . 05 . 02 . 01*0*11*13(11:2221vvWho Plays When?In examples above the players chose their strategi

19、es simultaneously.Such games are simultaneous play games.Who Plays When?But there are games in which one player plays before another player.Such games are sequential play games.The player who plays first is the leader. The player who plays second is the follower.A Sequential Game ExampleSometimes a

20、game has more than one Nash equilibrium and it is hard to say which is more likely to occur.When such a game is sequential it is sometimes possible to argue that one of the Nash equilibria is more likely to occur than the other. A Sequential Game ExamplePlayer BPlayer A(U,L) and (D,R) are both Nash

21、equilibriawhen this game is played simultaneouslyand we have no way of deciding whichequilibrium is more likely to occur.LRUD(3,9)(0,0)(1,8)(2,1)A Sequential Game ExamplePlayer BPlayer ASuppose instead that the game is playedsequentially, with A leading and B following.We can rewrite the game in its

22、 extensive form.LRUD(3,9)(0,0)(1,8)(2,1)A Sequential Game ExampleUDLLRR(3,9)(1,8) (0,0)(2,1)ABBA plays first.B plays second.A Sequential Game ExampleUDLLRR(3,9)(1,8) (0,0)(2,1)ABBA plays first.B plays second.(U,L) is a Nash equilibrium.A Sequential Game ExampleUDLLRR(3,9)(1,8) (0,0)(2,1)ABBA plays f

23、irst.B plays second.(U,L) is a Nash equilibrium.(D,R) is a Nash equilibrium.Which is more likely to occur?A Sequential Game ExampleUDLLRR(3,9)(1,8) (0,0)(2,1)ABBA plays first.B plays second.If A plays U then B plays L; A gets 3.A Sequential Game ExampleUDLLRR(3,9)(1,8) (0,0)(2,1)ABBA plays first.B p

24、lays second.If A plays U then B plays L; A gets 3.If A plays D then B plays R; A gets 2.A Sequential Game ExampleUDLLRR(3,9)(1,8) (0,0)(2,1)ABBA plays first.B plays second.If A plays U then B plays L; A gets 3.If A plays D then B plays R; A gets 2.So (U,L) is the likely Nash equilibrium.Stackelberg

25、model假設(shè)某種產(chǎn)品只有兩個企業(yè)提供假設(shè)某種產(chǎn)品只有兩個企業(yè)提供產(chǎn)品產(chǎn)品,市場需求函數(shù)為市場需求函數(shù)為: ,兩個寡頭的平均成本與邊際成兩個寡頭的平均成本與邊際成本均為本均為100.根據(jù)上述資料分析根據(jù)上述資料分析達(dá)到均衡時兩個企業(yè)的產(chǎn)量和達(dá)到均衡時兩個企業(yè)的產(chǎn)量和市場價格市場價格.21,8900qqQQp其中Stackelberg model在經(jīng)典的古諾模型中,我們假定兩個在經(jīng)典的古諾模型中,我們假定兩個企業(yè)同時行動,通過反應(yīng)曲線得到均企業(yè)同時行動,通過反應(yīng)曲線得到均衡解。現(xiàn)在我們假定企業(yè)衡解?,F(xiàn)在我們假定企業(yè)1先行動,企先行動,企業(yè)業(yè)2觀察到它的行動后決定自己的最優(yōu)觀察到它的行動后決定自己

26、的最優(yōu)產(chǎn)量。產(chǎn)量。Stackelberg model對于動態(tài)博弈,我們通常采用逆向歸納法來分析均對于動態(tài)博弈,我們通常采用逆向歸納法來分析均衡解。首先考慮寡頭衡解。首先考慮寡頭2的選擇,由于它是后行動者,的選擇,由于它是后行動者,因此它必須將寡頭因此它必須將寡頭1的選擇視為既定,即有:的選擇視為既定,即有:q2=50-q1/2.對于寡頭對于寡頭1,其受益,其受益R1有賴于寡頭有賴于寡頭2的產(chǎn)量,它需要的產(chǎn)量,它需要對寡頭對寡頭2的產(chǎn)量作出預(yù)期。作為理性的決策者,它的產(chǎn)量作出預(yù)期。作為理性的決策者,它知道寡頭知道寡頭2將按照上述原則來確定產(chǎn)量,因此,對將按照上述原則來確定產(chǎn)量,因此,對于寡頭于寡

27、頭1,有:,有:R1 =900-8(q1+50-q1/2) q1求一階條件并讓求一階條件并讓MR=MC,可得:,可得:q1=50將該結(jié)果帶入前述反應(yīng)函數(shù),可得:將該結(jié)果帶入前述反應(yīng)函數(shù),可得: q2=25該模型的結(jié)果可以得出該模型的結(jié)果可以得出“先動優(yōu)勢先動優(yōu)勢”。完全信息動態(tài)博弈中的威脅與承諾完全信息動態(tài)博弈中的威脅與承諾房地產(chǎn)開發(fā)博弈房地產(chǎn)開發(fā)博弈私奔博弈私奔博弈性別戰(zhàn)性別戰(zhàn)分期付款博弈分期付款博弈房地產(chǎn)開發(fā)博弈房地產(chǎn)開發(fā)博弈ynyynn(-3,-3)(1,0) (0,1)(0,0)ABB子博弈精煉均衡子博弈精煉均衡Sub-game perfect equilibrium子博弈是指能夠自成

28、一個博弈的某個動態(tài)子博弈是指能夠自成一個博弈的某個動態(tài)博弈的從其某個階段開始的后續(xù)階段,它博弈的從其某個階段開始的后續(xù)階段,它必須有一個初始信息集,并且具備進(jìn)行博必須有一個初始信息集,并且具備進(jìn)行博弈所需要的各種信息。弈所需要的各種信息。對于有限完美信息動態(tài)博弈,如果通過逆對于有限完美信息動態(tài)博弈,如果通過逆向歸納法求得其納什均衡,則可以去掉所向歸納法求得其納什均衡,則可以去掉所有不可置信的威脅(或承諾),有不可置信的威脅(或承諾),Selton(1965)將這種博弈成為子博弈精煉納什)將這種博弈成為子博弈精煉納什均衡。均衡。借款博弈(一)借款博弈(一)(0, 0)RBYN(40,40)(40

29、,30)12L(-10,90)1G借款博弈(二)借款博弈(二)(0, 0)RBYN(40,40)(-15,30)12L(-10,90)1G制定政策中的制定政策中的“欺騙沖動欺騙沖動”現(xiàn)實(shí)經(jīng)濟(jì)中,我們經(jīng)常發(fā)現(xiàn)政府會違背自己的承現(xiàn)實(shí)經(jīng)濟(jì)中,我們經(jīng)常發(fā)現(xiàn)政府會違背自己的承諾。例如,為了鼓勵外資進(jìn)入,有些發(fā)展中國家諾。例如,為了鼓勵外資進(jìn)入,有些發(fā)展中國家經(jīng)常許諾給予稅收優(yōu)惠,但在外資進(jìn)入后,政府經(jīng)常許諾給予稅收優(yōu)惠,但在外資進(jìn)入后,政府又經(jīng)常通過提高稅收(或者各種名目的收費(fèi))甚又經(jīng)常通過提高稅收(或者各種名目的收費(fèi))甚至沒收外資企業(yè)的方法來增加財政收入;又如,至沒收外資企業(yè)的方法來增加財政收入;又如

30、,有些標(biāo)榜民主的國家,在大選時對選民作出許多有些標(biāo)榜民主的國家,在大選時對選民作出許多承諾,但在當(dāng)選后卻又無情地背叛自己的選民,承諾,但在當(dāng)選后卻又無情地背叛自己的選民,等等。等等。Kydland和和Prescott(1977)就一國貨幣政策的制定就一國貨幣政策的制定建立了一個著名的模型,不僅可以解釋貨幣政策建立了一個著名的模型,不僅可以解釋貨幣政策的動態(tài)不一致性,也可以給上述行為給出解釋。的動態(tài)不一致性,也可以給上述行為給出解釋。貨幣政策的動態(tài)不一致性貨幣政策的動態(tài)不一致性考慮政府和公眾之間的博弈。政府同時關(guān)考慮政府和公眾之間的博弈。政府同時關(guān)心通貨膨脹和失業(yè)問題,其效用函數(shù)為:心通貨膨脹和

31、失業(yè)問題,其效用函數(shù)為:上式的只管含義是:上式的只管含義是: (1) K1,表明由于,表明由于受到公眾的壓力,政府偏好的產(chǎn)出總是大受到公眾的壓力,政府偏好的產(chǎn)出總是大于自然失業(yè)率產(chǎn)出水平;(于自然失業(yè)率產(chǎn)出水平;(2)由于市場扭)由于市場扭曲使實(shí)際產(chǎn)量低于政府偏好的產(chǎn)量,將給曲使實(shí)際產(chǎn)量低于政府偏好的產(chǎn)量,將給政府帶來的效用為負(fù)值;(政府帶來的效用為負(fù)值;(3)若能將產(chǎn)量)若能將產(chǎn)量提高政府希望的水平,它也能容忍一定程提高政府希望的水平,它也能容忍一定程度的通脹。度的通脹。產(chǎn)出與通貨膨脹之間的關(guān)系由下式給出:產(chǎn)出與通貨膨脹之間的關(guān)系由下式給出:1, 0,)(),(22kcykycym0),(_

32、eyy貨幣政策的動態(tài)不一致性貨幣政策的動態(tài)不一致性首先考慮政府,給首先考慮政府,給定公眾的通脹預(yù)期,定公眾的通脹預(yù)期,則政府的決策是:則政府的決策是:將約束條件帶入效將約束條件帶入效用函數(shù)可得:用函數(shù)可得:)(:.)(),(:max22eyyt sykycym2*22) 1(:.)(cykCOFykycmee貨幣政策的動態(tài)不一致性貨幣政策的動態(tài)不一致性現(xiàn)在考慮公眾,由于假定他們有理性預(yù)期,因此現(xiàn)在考慮公眾,由于假定他們有理性預(yù)期,因此有:有:將該式帶入前述政府反應(yīng)函數(shù),可得:將該式帶入前述政府反應(yīng)函數(shù),可得:將該式帶入政府效用函數(shù)并用將該式帶入政府效用函數(shù)并用Phillips函數(shù)消去函數(shù)消去Y

33、,可以得到政府的短期效用函數(shù)為:可以得到政府的短期效用函數(shù)為:*ecyke) 1(*)/1 () 1(222cykms貨幣政策的動態(tài)不一致性貨幣政策的動態(tài)不一致性若政府考慮零通脹率,則其效用水平為:若政府考慮零通脹率,則其效用水平為:顯然有顯然有msmp,那么,政府會選擇零通脹率嗎?,那么,政府會選擇零通脹率嗎?答案式是否定的!答案式是否定的!現(xiàn)在假定政府許諾零通脹率,而公眾也相信了政府現(xiàn)在假定政府許諾零通脹率,而公眾也相信了政府的承諾,則政府的最優(yōu)決策為:的承諾,則政府的最優(yōu)決策為:22) 1(ykmpcykmFOCykycm/1) 1(:)(2222貨幣政策的動態(tài)不一致性貨幣政策的動態(tài)不一

34、致性顯然顯然msmp 0,即即P1/5時,時,A選選擇進(jìn)入。因此,此時貝葉斯均衡為:擇進(jìn)入。因此,此時貝葉斯均衡為: (進(jìn)入,默認(rèn)),高成本,(進(jìn)入,默認(rèn)),高成本,P1/5; (進(jìn)入,斗爭),低成本,進(jìn)入,斗爭),低成本,P1/5; (不進(jìn)入,(不進(jìn)入,*),),P1/5不完全信息條件下公共品的提供不完全信息條件下公共品的提供該模型由該模型由Palfrey 和和Rosenthal(1989)構(gòu)建。構(gòu)建。在該模型中,兩個參與人同時決定是否提供,在該模型中,兩個參與人同時決定是否提供,這是一種這是一種“01”決策(提供即決策(提供即ai 1,否則,否則ai 0),如果有一個人提供,每個人得到一)

35、,如果有一個人提供,每個人得到一個單位的正效用;如果無人提供,則效用都個單位的正效用;如果無人提供,則效用都為為0。因此,局中人因此,局中人i的收益函數(shù)為:的收益函數(shù)為:Ui (s i ,sj,ci ) = max(ai ,aj)-ci ai不完全信息條件下公共品的提供不完全信息條件下公共品的提供 1-c1, 1-c2,1-c1 ,1 1, 1-c20,0A提供提供不提供不提供B提供提供不提供不提供不完全信息條件下公共品的提供不完全信息條件下公共品的提供記記Zj為參與人為參與人j提供的概率,為了最大提供的概率,為了最大化期望收益,局中人化期望收益,局中人i只有預(yù)期參與人只有預(yù)期參與人j不提供時

36、才會考慮自己提供,因?yàn)閰⒉惶峁r才會考慮自己提供,因?yàn)閰⑴c人與人j不提供的概率為不提供的概率為1 Zj,參與人,參與人i提供的期望收益為提供的期望收益為1* (1 Zj),因),因此,只有當(dāng)此,只有當(dāng)ci (1 Zj)時,參與人)時,參與人i才會提供。才會提供。即當(dāng)即當(dāng)ci (1 Zj)時,)時,si*(ci )=1,否則,否則, si*(ci )=0。根據(jù)對稱性,局中人根據(jù)對稱性,局中人j也是相同的考慮。也是相同的考慮。不完全信息條件下公共品的提供不完全信息條件下公共品的提供在該例中,如果信息是完全的,均衡在該例中,如果信息是完全的,均衡解不外乎三種情況解不外乎三種情況:(:(1) c11,

37、 c21,該模型演變成了一個小雞博弈;,該模型演變成了一個小雞博弈;(2)如果兩人的成本都大于)如果兩人的成本都大于1,就是,就是囚徒困境;(囚徒困境;(3)如果有一個人的成本)如果有一個人的成本大于大于1,另一個人的成本小于,另一個人的成本小于1,演變,演變成智豬博弈。成智豬博弈。不完全信息動態(tài)博弈不完全信息動態(tài)博弈(Dynamic game of incomplete information)不完全信息靜態(tài)博弈中的私人信息體現(xiàn)在不完全信息靜態(tài)博弈中的私人信息體現(xiàn)在收益函數(shù)上但在不完全信息動態(tài)博弈中,收益函數(shù)上但在不完全信息動態(tài)博弈中,由于參與人的行動有先后順序,因此,其由于參與人的行動有先

38、后順序,因此,其中的私人信息有可能體現(xiàn)在收益函數(shù)上,中的私人信息有可能體現(xiàn)在收益函數(shù)上,也可能表現(xiàn)在行動的選擇上。在理論上,也可能表現(xiàn)在行動的選擇上。在理論上,通常將前者稱為不完全信息,后者稱為不通常將前者稱為不完全信息,后者稱為不完美信息完美信息由于海薩尼轉(zhuǎn)換的出現(xiàn),所有的不頑癬信由于海薩尼轉(zhuǎn)換的出現(xiàn),所有的不頑癬信息動態(tài)博弈都可以轉(zhuǎn)換為完全但不完美信息動態(tài)博弈都可以轉(zhuǎn)換為完全但不完美信息博弈而加以分析,息博弈而加以分析,標(biāo)準(zhǔn)的不完全信息動態(tài)博弈樹標(biāo)準(zhǔn)的不完全信息動態(tài)博弈樹在這種博弈中,沿用海薩尼轉(zhuǎn)換,我在這種博弈中,沿用海薩尼轉(zhuǎn)換,我們引入一個虛擬的局中人們引入一個虛擬的局中人“自自然然”

39、,它的特征與定義同不完全信息,它的特征與定義同不完全信息靜態(tài)博弈靜態(tài)博弈“自然自然”首先選擇參與人的類型,該首先選擇參與人的類型,該參與人知道自己的真實(shí)類型,但其他參與人知道自己的真實(shí)類型,但其他局中人不確切地知道在自然選擇之局中人不確切地知道在自然選擇之后,其他局中人依次行動,后行動者后,其他局中人依次行動,后行動者能觀察到先行動者的行動,但無法觀能觀察到先行動者的行動,但無法觀察到先行動者的真實(shí)類型察到先行動者的真實(shí)類型標(biāo)準(zhǔn)的不完全信息動態(tài)博弈樹標(biāo)準(zhǔn)的不完全信息動態(tài)博弈樹(*,*) (*,*)()(*,*)()(*,*) (*,*)()(*,*)單節(jié)點(diǎn)與多節(jié)點(diǎn)信息集單節(jié)點(diǎn)與多節(jié)點(diǎn)信息集單節(jié)

40、點(diǎn):在完全信息動態(tài)博弈中,博單節(jié)點(diǎn):在完全信息動態(tài)博弈中,博弈樹上的每個節(jié)點(diǎn)都是一個獨(dú)立的決弈樹上的每個節(jié)點(diǎn)都是一個獨(dú)立的決策節(jié),表示局中人在該時點(diǎn)對此前的策節(jié),表示局中人在該時點(diǎn)對此前的博弈過程有完全的了解博弈過程有完全的了解多節(jié)點(diǎn)信息集多節(jié)點(diǎn)信息集:()在此信息集中:()在此信息集中的每個節(jié)點(diǎn)都輪到該參與人行動;的每個節(jié)點(diǎn)都輪到該參與人行動;()當(dāng)博弈進(jìn)行到該信息集中的某()當(dāng)博弈進(jìn)行到該信息集中的某個節(jié)點(diǎn)時,輪到行動的局中人并不知個節(jié)點(diǎn)時,輪到行動的局中人并不知道實(shí)際到達(dá)了哪個節(jié)點(diǎn),而只知道到道實(shí)際到達(dá)了哪個節(jié)點(diǎn),而只知道到達(dá)了某個節(jié)點(diǎn)的概率達(dá)了某個節(jié)點(diǎn)的概率始于單節(jié)點(diǎn)信息集的節(jié)點(diǎn)(不包

41、括始于單節(jié)點(diǎn)信息集的節(jié)點(diǎn)(不包括博弈樹的第一個決策節(jié)點(diǎn));博弈樹的第一個決策節(jié)點(diǎn));包含之下所有的決策節(jié)點(diǎn)(不在包含之下所有的決策節(jié)點(diǎn)(不在之下的除外);之下的除外);沒有對信息集的分割沒有對信息集的分割對于沒有子博弈的不完全信息動態(tài)博對于沒有子博弈的不完全信息動態(tài)博弈,無法用逆向歸納法來求得均衡弈,無法用逆向歸納法來求得均衡解解多節(jié)點(diǎn)信息集中的子博弈多節(jié)點(diǎn)信息集中的子博弈例例1(,)(,) (,)(,)(,)(,)(,)(,)(,)(,)均衡解的特性均衡解的特性要求:要求:在每個信息集上,輪到行動的局中人必在每個信息集上,輪到行動的局中人必須對博弈進(jìn)行到該信息集中各個決策節(jié)點(diǎn)的概率須對博弈進(jìn)

42、行到該信息集中各個決策節(jié)點(diǎn)的概率作出判斷;作出判斷;要求:要求:給定局中人的判斷,其策略必須是序貫給定局中人的判斷,其策略必須是序貫理性的;理性的;要求:要求:在處于均衡路徑之上的信息集處,概率在處于均衡路徑之上的信息集處,概率判斷由貝葉斯法則和局中人的均衡策略給出;判斷由貝葉斯法則和局中人的均衡策略給出;要求:要求:在處于均衡路徑之外的信息集中,概率在處于均衡路徑之外的信息集中,概率判斷由貝葉斯法則和局中人在此處可能有的均衡判斷由貝葉斯法則和局中人在此處可能有的均衡策略決定策略決定Solution在上例中,如果局中人實(shí)際選擇,則局中在上例中,如果局中人實(shí)際選擇,則局中人無選擇機(jī)會,博弈結(jié)束如

43、果沒有選擇,人無選擇機(jī)會,博弈結(jié)束如果沒有選擇,則輪到局中人在和之間選擇此時他不則輪到局中人在和之間選擇此時他不知道局中人選擇的是還是知道局中人選擇的是還是根據(jù)上述要求,局中人給出概率判斷(,根據(jù)上述要求,局中人給出概率判斷(,),其中,表示局中人選擇的概),其中,表示局中人選擇的概率此時他選擇的期望收益為:率此時他選擇的期望收益為:*+(-)*-,選擇的期望收益為:,選擇的期望收益為:*+(-)*-顯然,對于任何給定的概率(),顯然,對于任何給定的概率(),局中人選擇的收益恒大于選擇的收局中人選擇的收益恒大于選擇的收益所以,一旦他觀察到?jīng)]有選擇,他就益所以,一旦他觀察到?jīng)]有選擇,他就絕對不會

44、選擇因此,根據(jù)要求,排除了絕對不會選擇因此,根據(jù)要求,排除了他選擇的可能性他選擇的可能性Solution對于要求和要求,它們的含義分對于要求和要求,它們的含義分別是:對于一個給定的均衡,如果博別是:對于一個給定的均衡,如果博弈按照均衡策略進(jìn)行將會以正的概率弈按照均衡策略進(jìn)行將會以正的概率到達(dá)某信息集,則稱該信息集處于均到達(dá)某信息集,則稱該信息集處于均衡路徑之上(衡路徑之上(on the equilibrium path);反之,如果博弈以均衡策略進(jìn)行時,反之,如果博弈以均衡策略進(jìn)行時,肯定不會到達(dá)某信息集,則稱該信息肯定不會到達(dá)某信息集,則稱該信息集處于均衡路徑之外(集處于均衡路徑之外( off the equilibrium path).Solution在上例中在上例中,均衡解為均衡解為(L,T;P=1),滿足條件滿足條件3;如果局中人如果局中人2隨意給出一個概率判斷隨意給出一個概率判斷,如如p=0.6,則此時則此時(L,T;P=0.6)是不穩(wěn)定的是不穩(wěn)定的.因?yàn)榇艘驗(yàn)榇藭r局中人時局中人2還有還有0.4的概率選擇的概率選擇M,盡管選擇盡管選擇T還是局中人的理性選擇還是局中人的理性選擇,但他的最優(yōu)選擇不但他的最優(yōu)選擇不再是再是L或或M,而是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論