教案中級(jí)微觀2015chapter

上傳人：鐘*** IP屬地：四川上傳時(shí)間：2022-07-12 格式：PPTX 頁(yè)數(shù)：51 大小：240.15KB 積分：9.6 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩46頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1Chapter Twenty-EightGame Theory博弈論2博弈論博弈論（game theory）研究主體（agent）的策略行為（strategic behavior）。博弈論可以分析存在兩個(gè)或多個(gè)行為主體時(shí)的最佳策略。如寡頭壟斷廠商的行為，以及不同壟斷廠商行為之間的相互影響。博弈論已經(jīng)成為當(dāng)代主流經(jīng)濟(jì)學(xué)家不可或缺的分析工具之一。3博弈一個(gè)完整的博弈包括以下要素：博弈人（players）：兩個(gè)以上。規(guī)則（rules)：誰在什么時(shí)候行動(dòng)？如何行動(dòng)？每個(gè)博弈人有至少兩個(gè)以上可供選擇的策略（strategies）。結(jié)果：每個(gè)可能的策略都有一個(gè)相應(yīng)的報(bào)酬（payoffs）。理性的博弈人偏

2、好于報(bào)酬高的結(jié)果。4雙人博弈雙人博弈（two-player game）模型，即每個(gè)博弈只有兩個(gè)博弈人。同時(shí)，假設(shè)每個(gè)博弈人只有兩個(gè)可供選擇的策略。5雙人博弈：一個(gè)例子兩個(gè)博弈人（A和B）。A有兩個(gè)策略選擇：上（up）或下（down）。B有兩個(gè)選擇：左（left）或右（right）。A和B的策略選擇可以相同也可以不同；兩個(gè)博弈人，每個(gè)博弈人各有兩個(gè)選擇，結(jié)果有四個(gè)不同的策略選擇組合：上左，上右，下左，下右。每個(gè)策略組合中，每個(gè)博弈人的報(bào)酬已知，見下頁(yè)收益矩陣（payoff matrix）。6雙人博弈：一個(gè)例子收益矩陣Player BPlayer A通常，第一個(gè)博弈人的報(bào)酬在前，第二個(gè)博弈人的報(bào)酬

3、在后。LRUD(3,9)(0,0)(1,8)(2,1)7雙人博弈：一個(gè)例子博弈人將怎樣選擇策略呢？博弈的結(jié)果是什么呢？Player BPlayer ALRUD(3,9)(0,0)(1,8)(2,1)8雙人博弈：一個(gè)例子Player BPlayer A如果B選擇Right，那么A的最佳策略是Down。所以，(U,R) 不會(huì)被選擇。會(huì)選擇(U,R)嗎?LRUD(3,9)(0,0)(1,8)(2,1)9雙人博弈：一個(gè)例子Player BPlayer A如果B選擇Right；那么A的最佳策略是Down。如果A選擇Down；那么B的最佳策略是Right。所以，(D,R) 有可能被選擇。會(huì)選擇(D,R)

4、嗎?LRUD(3,9)(0,0)(1,8)(2,1)10雙人博弈：一個(gè)例子Player BPlayer A如果A 選擇Down，那么B的最佳策略是Right。所以， (D,L) 不會(huì)被選擇。會(huì)選擇(D,L) 嗎?LRUD(3,9)(0,0)(1,8)(2,1)11雙人博弈：一個(gè)例子Player BPlayer A如果A選擇Up，那么B的最佳策略是Left.如果B選擇Left，那么A的最佳策略是Up.所以，(U,L) 可能被選。會(huì)選擇(U,L) 嗎?LRUD(3,9)(0,0)(1,8)(2,1)12Nash Equilibrium納什均衡納什均衡（Nash Equilibrium）：如果給定B

5、的策略選擇，A的策略選擇是最佳策略（optimal strategy）；同樣地，給定A的策略選擇，B的策略選擇也是最佳的，這樣的策略組合就叫做納什均衡。在我們的例子中有兩個(gè)納什均衡： (U,L) 和 (D,R)。13Player BPlayer A(U,L) 和(D,R) 都是納什均衡，但是博弈最后的結(jié)果會(huì)是哪一個(gè)呢？顯然對(duì)兩個(gè)博弈人來說 (U,L)要優(yōu)于(D,R)。LRUD(3,9)(0,0)(1,8)(2,1)14The Prisoners Dilemma囚徒困境博弈的納什均衡不一定會(huì)導(dǎo)致帕累托有效率的結(jié)果。一個(gè)囚徒困境（Prisoners Dilemma）的例子。15囚徒困境納什均衡是？

6、乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSilenceConfess16囚徒困境如果甲選擇沉默，那么乙的最佳策略是坦白；如果甲選擇坦白，那么乙的最佳策略還是坦白。乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC17囚徒困境所以，無論甲選擇什么，乙的最佳策略都是坦白；坦白是乙的一個(gè)占優(yōu)策略（ dominant strategy ）。乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC18囚徒困境同樣的，無論乙選擇什么策略，甲的最佳策略總是坦白；所以坦白也是甲的一個(gè)占優(yōu)策略。乙甲(-5,-5)(-30,-1)(-1

7、,-30)(-10,-10)SCSC19囚徒困境唯一的納什均衡是(C,C)，雖然(S,S)會(huì)給兩個(gè)博弈人都帶來更高的收益。此時(shí)的納什均衡是無效率的。乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC20同時(shí)博弈在前面兩個(gè)例子中，兩個(gè)博弈人同時(shí)決定他們的策略，這樣的博弈叫同時(shí)博弈（simultaneous play game）。21序貫博弈在有些博弈中，一個(gè)博弈人先于另一個(gè)博弈人決定其策略，這樣的博弈叫序貫博弈（sequential play game）。在序貫博弈中，先決定策略的那個(gè)博弈人叫領(lǐng)頭者（leader），后決定策略的叫跟從者（follower）。例如上一章的

8、斯塔科爾伯格模型、價(jià)格領(lǐng)導(dǎo)模型。22序貫博弈：一個(gè)例子有時(shí)候一個(gè)博弈會(huì)有多個(gè)納什均衡，而且很難說最后的結(jié)果會(huì)出現(xiàn)哪一個(gè)均衡。但是在序貫博弈中，常常可以找出比其它納什均衡更可能出現(xiàn)的納什均衡。23序貫博弈：一個(gè)例子Player BPlayer A當(dāng)兩個(gè)博弈人同時(shí)博弈時(shí)，(U,L) 和 (D,R) 都是納什均衡。而且我們很難說哪一個(gè)均衡更有可能出現(xiàn)。LRUD(3,9)(0,0)(1,8)(2,1)24序貫博弈：一個(gè)例子Player BPlayer A如果是序貫博弈，A先行動(dòng)，然后是B作出反應(yīng)。我們可以給出這個(gè)博弈的擴(kuò)展形式（extensive form）。LRUD(3,9)(0,0)(1,8)(2

9、,1)25序貫博弈：一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).26序貫博弈：一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).(U,L) 是納什均衡.27序貫博弈：一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).(U,L) 是納什均衡.(D,R) 也是納什均衡.哪一個(gè)更有可能出現(xiàn)呢?28序貫博弈：一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).如果A選擇U，那么B會(huì)選擇L; A的收益為3.如果A選擇D，那么B會(huì)選擇R; A的

10、收益為2.所以，(U,L) 更可能被選擇。29Pure Strategies純策略Player BPlayer A再回到我們開始的例子.兩個(gè)博弈人如果是同時(shí)博弈，那么就有兩個(gè)納什均衡(U,L) 和(D,R).LRUD(3,9)(0,0)(1,8)(2,1)30純策略Player BPlayer A我們假定博弈人A要么選擇策略U，要么選擇D，U 和D 是博弈人A的純策略（pure strategies）.LRUD(3,9)(0,0)(1,8)(2,1)31純策略Player BPlayer A同樣的， L和R是博弈人B的純策略。LRUD(3,9)(0,0)(1,8)(2,1)32純策略Play

11、er BPlayer A那么， (U,L)和(D,R) 就是純策略納什均衡( purestrategy Nash equilibria). 是否每一個(gè)博弈至少會(huì)存在一個(gè)純策略納什均衡呢？LRUD(3,9)(0,0)(1,8)(2,1)33純策略Player BPlayer A例如，這個(gè)博弈是否存在純策略納什均衡呢？(1,2)(0,4)(0,5)(3,2)UDLR34純策略Player BPlayer A不存在純策略納什均衡！(1,2)(0,4)(0,5)(3,2)UDLR35純策略Player BPlayer A但是，這個(gè)博弈存在混合策略（ mixed strategies ）納什均衡。(1,

12、2)(0,4)(0,5)(3,2)UDLR36Mixed Strategies混合策略博弈人A會(huì)選擇一個(gè)概率分布 (pU,1-pU)，即博弈人A將以概率pU 選擇策略Up，以概率 1-pU 選擇策略 Down。概率分布 (pU,1-pU)就是博弈人A的混合策略。37混合策略同樣的，博弈人B也會(huì)混合選擇策略Left和Right。概率分布 (pL,1-pL) 是博弈人B的混合策略。38混合策略Player A這個(gè)博弈雖然沒有純策略納什均衡，但是卻存在混合策略納什均衡. 怎樣求出混合策略納什均衡呢？(1,2)(0,4)(0,5)(3,2)UDLRPlayer B39混合策略Player A(1,2)

13、(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B40混合策略Player A如果博弈人B選擇策略Left，那么他的期望收益為：(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B41混合策略Player A如果B選擇策略Right，那么他的期望收益為：(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B42混合策略Player A要存在納什均衡，博弈人B必定對(duì)策略Left或Right無差異; i.e.(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR

14、,1-pLPlayer B43混合策略Player A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B44混合策略Player A如果A選擇Up，那么他的期望收益為：(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,Player B45混合策略Player A如果A選擇Down，那么他的期望收益為：(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,Player B46混合策略Player A要存在納什均衡，那么A必定對(duì)策略Up或者Down無差異; i.e.(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,Player B47混合策略Player BPlayer A所以，這個(gè)博弈存在唯一的納什均衡是A選擇混合策略(3/5, 2/5)， B選擇混合策略(3/4, 1/4).(1,2)(0,4)(0,5)(3,2)U,D,L,R,48混合策略Player BPlayer A收益 (1,2)出現(xiàn)的概率為：(1,2)(0,4)(

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

教案中級(jí)微觀2015chapter

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

教案中級(jí)微觀2015chapter

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔