教案中級(jí)微觀2015chapter_第1頁(yè)
教案中級(jí)微觀2015chapter_第2頁(yè)
教案中級(jí)微觀2015chapter_第3頁(yè)
教案中級(jí)微觀2015chapter_第4頁(yè)
教案中級(jí)微觀2015chapter_第5頁(yè)
已閱讀5頁(yè),還剩46頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1Chapter Twenty-EightGame Theory博弈論2博弈論博弈論(game theory)研究主體(agent)的策略行為(strategic behavior)。博弈論可以分析存在兩個(gè)或多個(gè)行為主體時(shí)的最佳策略。如寡頭壟斷廠商的行為,以及不同壟斷廠商行為之間的相互影響。博弈論已經(jīng)成為當(dāng)代主流經(jīng)濟(jì)學(xué)家不可或缺的分析工具之一。3博弈一個(gè)完整的博弈包括以下要素:博弈人(players):兩個(gè)以上。規(guī)則(rules):誰在什么時(shí)候行動(dòng)?如何行動(dòng)?每個(gè)博弈人有至少兩個(gè)以上可供選擇的策略(strategies)。結(jié)果:每個(gè)可能的策略都有一個(gè)相應(yīng)的報(bào)酬(payoffs)。理性的博弈人偏

2、好于報(bào)酬高的結(jié)果。4雙人博弈雙人博弈(two-player game)模型,即每個(gè)博弈只有兩個(gè)博弈人。同時(shí),假設(shè)每個(gè)博弈人只有兩個(gè)可供選擇的策略。5雙人博弈:一個(gè)例子兩個(gè)博弈人(A和B)。A有兩個(gè)策略選擇:上(up)或下(down)。B有兩個(gè)選擇:左(left)或右(right)。A和B的策略選擇可以相同也可以不同;兩個(gè)博弈人,每個(gè)博弈人各有兩個(gè)選擇,結(jié)果有四個(gè)不同的策略選擇組合:上左,上右,下左,下右。每個(gè)策略組合中,每個(gè)博弈人的報(bào)酬已知,見下頁(yè)收益矩陣(payoff matrix)。6雙人博弈:一個(gè)例子收益矩陣Player BPlayer A通常,第一個(gè)博弈人的報(bào)酬在前,第二個(gè)博弈人的報(bào)酬

3、在后。LRUD(3,9)(0,0)(1,8)(2,1)7雙人博弈:一個(gè)例子博弈人將怎樣選擇策略呢?博弈的結(jié)果是什么呢?Player BPlayer ALRUD(3,9)(0,0)(1,8)(2,1)8雙人博弈:一個(gè)例子Player BPlayer A如果B選擇Right,那么A的最佳策略是Down。所以,(U,R) 不會(huì)被選擇。會(huì)選擇(U,R)嗎?LRUD(3,9)(0,0)(1,8)(2,1)9雙人博弈:一個(gè)例子Player BPlayer A如果B選擇Right;那么A的最佳策略是Down。如果A選擇Down;那么B的最佳策略是Right。所以,(D,R) 有可能被選擇。會(huì)選擇(D,R)

4、嗎?LRUD(3,9)(0,0)(1,8)(2,1)10雙人博弈:一個(gè)例子Player BPlayer A如果A 選擇Down,那么B的最佳策略是Right。所以, (D,L) 不會(huì)被選擇。會(huì)選擇(D,L) 嗎?LRUD(3,9)(0,0)(1,8)(2,1)11雙人博弈:一個(gè)例子Player BPlayer A如果A選擇Up,那么B的最佳策略是Left.如果B選擇Left,那么A的最佳策略是Up.所以,(U,L) 可能被選。會(huì)選擇(U,L) 嗎?LRUD(3,9)(0,0)(1,8)(2,1)12Nash Equilibrium納什均衡納什均衡(Nash Equilibrium):如果給定B

5、的策略選擇,A的策略選擇是最佳策略(optimal strategy);同樣地,給定A的策略選擇,B的策略選擇也是最佳的,這樣的策略組合就叫做納什均衡。在我們的例子中有兩個(gè)納什均衡: (U,L) 和 (D,R)。13Player BPlayer A(U,L) 和(D,R) 都是納什均衡,但是博弈最后的結(jié)果會(huì)是哪一個(gè)呢?顯然對(duì)兩個(gè)博弈人來說 (U,L)要優(yōu)于(D,R)。LRUD(3,9)(0,0)(1,8)(2,1)14The Prisoners Dilemma囚徒困境博弈的納什均衡不一定會(huì)導(dǎo)致帕累托有效率的結(jié)果。一個(gè)囚徒困境(Prisoners Dilemma)的例子。15囚徒困境納什均衡是?

6、乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSilenceConfess16囚徒困境如果甲選擇沉默,那么乙的最佳策略是坦白;如果甲選擇坦白,那么乙的最佳策略還是坦白。乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC17囚徒困境所以,無論甲選擇什么,乙的最佳策略都是坦白;坦白是乙的一個(gè)占優(yōu)策略( dominant strategy )。乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC18囚徒困境同樣的,無論乙選擇什么策略,甲的最佳策略總是坦白;所以坦白也是甲的一個(gè)占優(yōu)策略。乙甲(-5,-5)(-30,-1)(-1

7、,-30)(-10,-10)SCSC19囚徒困境唯一的納什均衡是(C,C),雖然(S,S)會(huì)給兩個(gè)博弈人都帶來更高的收益。此時(shí)的納什均衡是無效率的。乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC20同時(shí)博弈在前面兩個(gè)例子中,兩個(gè)博弈人同時(shí)決定他們的策略,這樣的博弈叫同時(shí)博弈(simultaneous play game)。21序貫博弈在有些博弈中,一個(gè)博弈人先于另一個(gè)博弈人決定其策略,這樣的博弈叫序貫博弈(sequential play game)。在序貫博弈中,先決定策略的那個(gè)博弈人叫領(lǐng)頭者(leader),后決定策略的叫跟從者(follower)。例如上一章的

8、斯塔科爾伯格模型、價(jià)格領(lǐng)導(dǎo)模型。22序貫博弈:一個(gè)例子有時(shí)候一個(gè)博弈會(huì)有多個(gè)納什均衡,而且很難說最后的結(jié)果會(huì)出現(xiàn)哪一個(gè)均衡。但是在序貫博弈中,常常可以找出比其它納什均衡更可能出現(xiàn)的納什均衡。23序貫博弈:一個(gè)例子Player BPlayer A當(dāng)兩個(gè)博弈人同時(shí)博弈時(shí),(U,L) 和 (D,R) 都是納什均衡。而且我們很難說哪一個(gè)均衡更有可能出現(xiàn)。LRUD(3,9)(0,0)(1,8)(2,1)24序貫博弈:一個(gè)例子Player BPlayer A如果是序貫博弈,A先行動(dòng),然后是B作出反應(yīng)。我們可以給出這個(gè)博弈的擴(kuò)展形式(extensive form)。LRUD(3,9)(0,0)(1,8)(2

9、,1)25序貫博弈:一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).26序貫博弈:一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).(U,L) 是納什均衡.27序貫博弈:一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).(U,L) 是納什均衡.(D,R) 也是納什均衡.哪一個(gè)更有可能出現(xiàn)呢?28序貫博弈:一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).如果A選擇U,那么B會(huì)選擇L; A的收益為3.如果A選擇D,那么B會(huì)選擇R; A的

10、收益為2.所以,(U,L) 更可能被選擇。29Pure Strategies純策略Player BPlayer A再回到我們開始的例子.兩個(gè)博弈人如果是同時(shí)博弈,那么就有兩個(gè)納什均衡(U,L) 和(D,R).LRUD(3,9)(0,0)(1,8)(2,1)30純策略Player BPlayer A我們假定博弈人A要么選擇策略U, 要么選擇D,U 和D 是博弈人A的純策略(pure strategies).LRUD(3,9)(0,0)(1,8)(2,1)31純策略Player BPlayer A同樣的, L和R是博弈人B的純策略。LRUD(3,9)(0,0)(1,8)(2,1)32純策略Play

11、er BPlayer A那么, (U,L)和(D,R) 就是純策略納什均衡( purestrategy Nash equilibria). 是否每一個(gè)博弈至少會(huì)存在一個(gè)純策略納什均衡呢?LRUD(3,9)(0,0)(1,8)(2,1)33純策略Player BPlayer A例如,這個(gè)博弈是否存在純策略納什均衡呢?(1,2)(0,4)(0,5)(3,2)UDLR34純策略Player BPlayer A不存在純策略納什均衡!(1,2)(0,4)(0,5)(3,2)UDLR35純策略Player BPlayer A但是,這個(gè)博弈存在混合策略( mixed strategies )納什均衡。(1,

12、2)(0,4)(0,5)(3,2)UDLR36Mixed Strategies混合策略博弈人A會(huì)選擇一個(gè)概率分布 (pU,1-pU),即博弈人A將以概率pU 選擇策略Up,以概率 1-pU 選擇策略 Down。概率分布 (pU,1-pU)就是博弈人A的混合策略。37混合策略同樣的,博弈人B也會(huì)混合選擇策略Left和Right。概率分布 (pL,1-pL) 是博弈人B的混合策略。38混合策略Player A這個(gè)博弈雖然沒有純策略納什均衡,但是卻存在混合策略納什均衡. 怎樣求出混合策略納什均衡呢?(1,2)(0,4)(0,5)(3,2)UDLRPlayer B39混合策略Player A(1,2)

13、(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B40混合策略Player A如果博弈人B選擇策略Left,那么他的期望收益為:(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B41混合策略Player A如果B選擇策略Right,那么他的期望收益為:(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B42混合策略Player A要存在納什均衡,博弈人B必定對(duì)策略Left或Right無差異; i.e.(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR

14、,1-pLPlayer B43混合策略Player A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B44混合策略Player A如果A選擇Up,那么他的期望收益為:(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,Player B45混合策略Player A如果A選擇Down,那么他的期望收益為:(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,Player B46混合策略Player A要存在納什均衡,那么A必定對(duì)策略Up或者Down無差異; i.e.(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,Player B47混合策略Player BPlayer A所以,這個(gè)博弈存在唯一的納什均衡是A選擇混合策略(3/5, 2/5), B選擇混合策略(3/4, 1/4).(1,2)(0,4)(0,5)(3,2)U,D,L,R,48混合策略Player BPlayer A收益 (1,2)出現(xiàn)的概率為:(1,2)(0,4)(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論