版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1Chapter Twenty-EightGame Theory博弈論2博弈論博弈論(game theory)研究主體(agent)的策略行為(strategic behavior)。博弈論可以分析存在兩個(gè)或多個(gè)行為主體時(shí)的最佳策略。如寡頭壟斷廠商的行為,以及不同壟斷廠商行為之間的相互影響。博弈論已經(jīng)成為當(dāng)代主流經(jīng)濟(jì)學(xué)家不可或缺的分析工具之一。3博弈一個(gè)完整的博弈包括以下要素:博弈人(players):兩個(gè)以上。規(guī)則(rules):誰在什么時(shí)候行動(dòng)?如何行動(dòng)?每個(gè)博弈人有至少兩個(gè)以上可供選擇的策略(strategies)。結(jié)果:每個(gè)可能的策略都有一個(gè)相應(yīng)的報(bào)酬(payoffs)。理性的博弈人偏
2、好于報(bào)酬高的結(jié)果。4雙人博弈雙人博弈(two-player game)模型,即每個(gè)博弈只有兩個(gè)博弈人。同時(shí),假設(shè)每個(gè)博弈人只有兩個(gè)可供選擇的策略。5雙人博弈:一個(gè)例子兩個(gè)博弈人(A和B)。A有兩個(gè)策略選擇:上(up)或下(down)。B有兩個(gè)選擇:左(left)或右(right)。A和B的策略選擇可以相同也可以不同;兩個(gè)博弈人,每個(gè)博弈人各有兩個(gè)選擇,結(jié)果有四個(gè)不同的策略選擇組合:上左,上右,下左,下右。每個(gè)策略組合中,每個(gè)博弈人的報(bào)酬已知,見下頁(yè)收益矩陣(payoff matrix)。6雙人博弈:一個(gè)例子收益矩陣Player BPlayer A通常,第一個(gè)博弈人的報(bào)酬在前,第二個(gè)博弈人的報(bào)酬
3、在后。LRUD(3,9)(0,0)(1,8)(2,1)7雙人博弈:一個(gè)例子博弈人將怎樣選擇策略呢?博弈的結(jié)果是什么呢?Player BPlayer ALRUD(3,9)(0,0)(1,8)(2,1)8雙人博弈:一個(gè)例子Player BPlayer A如果B選擇Right,那么A的最佳策略是Down。所以,(U,R) 不會(huì)被選擇。會(huì)選擇(U,R)嗎?LRUD(3,9)(0,0)(1,8)(2,1)9雙人博弈:一個(gè)例子Player BPlayer A如果B選擇Right;那么A的最佳策略是Down。如果A選擇Down;那么B的最佳策略是Right。所以,(D,R) 有可能被選擇。會(huì)選擇(D,R)
4、嗎?LRUD(3,9)(0,0)(1,8)(2,1)10雙人博弈:一個(gè)例子Player BPlayer A如果A 選擇Down,那么B的最佳策略是Right。所以, (D,L) 不會(huì)被選擇。會(huì)選擇(D,L) 嗎?LRUD(3,9)(0,0)(1,8)(2,1)11雙人博弈:一個(gè)例子Player BPlayer A如果A選擇Up,那么B的最佳策略是Left.如果B選擇Left,那么A的最佳策略是Up.所以,(U,L) 可能被選。會(huì)選擇(U,L) 嗎?LRUD(3,9)(0,0)(1,8)(2,1)12Nash Equilibrium納什均衡納什均衡(Nash Equilibrium):如果給定B
5、的策略選擇,A的策略選擇是最佳策略(optimal strategy);同樣地,給定A的策略選擇,B的策略選擇也是最佳的,這樣的策略組合就叫做納什均衡。在我們的例子中有兩個(gè)納什均衡: (U,L) 和 (D,R)。13Player BPlayer A(U,L) 和(D,R) 都是納什均衡,但是博弈最后的結(jié)果會(huì)是哪一個(gè)呢?顯然對(duì)兩個(gè)博弈人來說 (U,L)要優(yōu)于(D,R)。LRUD(3,9)(0,0)(1,8)(2,1)14The Prisoners Dilemma囚徒困境博弈的納什均衡不一定會(huì)導(dǎo)致帕累托有效率的結(jié)果。一個(gè)囚徒困境(Prisoners Dilemma)的例子。15囚徒困境納什均衡是?
6、乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSilenceConfess16囚徒困境如果甲選擇沉默,那么乙的最佳策略是坦白;如果甲選擇坦白,那么乙的最佳策略還是坦白。乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC17囚徒困境所以,無論甲選擇什么,乙的最佳策略都是坦白;坦白是乙的一個(gè)占優(yōu)策略( dominant strategy )。乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC18囚徒困境同樣的,無論乙選擇什么策略,甲的最佳策略總是坦白;所以坦白也是甲的一個(gè)占優(yōu)策略。乙甲(-5,-5)(-30,-1)(-1
7、,-30)(-10,-10)SCSC19囚徒困境唯一的納什均衡是(C,C),雖然(S,S)會(huì)給兩個(gè)博弈人都帶來更高的收益。此時(shí)的納什均衡是無效率的。乙甲(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC20同時(shí)博弈在前面兩個(gè)例子中,兩個(gè)博弈人同時(shí)決定他們的策略,這樣的博弈叫同時(shí)博弈(simultaneous play game)。21序貫博弈在有些博弈中,一個(gè)博弈人先于另一個(gè)博弈人決定其策略,這樣的博弈叫序貫博弈(sequential play game)。在序貫博弈中,先決定策略的那個(gè)博弈人叫領(lǐng)頭者(leader),后決定策略的叫跟從者(follower)。例如上一章的
8、斯塔科爾伯格模型、價(jià)格領(lǐng)導(dǎo)模型。22序貫博弈:一個(gè)例子有時(shí)候一個(gè)博弈會(huì)有多個(gè)納什均衡,而且很難說最后的結(jié)果會(huì)出現(xiàn)哪一個(gè)均衡。但是在序貫博弈中,常常可以找出比其它納什均衡更可能出現(xiàn)的納什均衡。23序貫博弈:一個(gè)例子Player BPlayer A當(dāng)兩個(gè)博弈人同時(shí)博弈時(shí),(U,L) 和 (D,R) 都是納什均衡。而且我們很難說哪一個(gè)均衡更有可能出現(xiàn)。LRUD(3,9)(0,0)(1,8)(2,1)24序貫博弈:一個(gè)例子Player BPlayer A如果是序貫博弈,A先行動(dòng),然后是B作出反應(yīng)。我們可以給出這個(gè)博弈的擴(kuò)展形式(extensive form)。LRUD(3,9)(0,0)(1,8)(2
9、,1)25序貫博弈:一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).26序貫博弈:一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).(U,L) 是納什均衡.27序貫博弈:一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).(U,L) 是納什均衡.(D,R) 也是納什均衡.哪一個(gè)更有可能出現(xiàn)呢?28序貫博弈:一個(gè)例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行動(dòng).B 后行動(dòng).如果A選擇U,那么B會(huì)選擇L; A的收益為3.如果A選擇D,那么B會(huì)選擇R; A的
10、收益為2.所以,(U,L) 更可能被選擇。29Pure Strategies純策略Player BPlayer A再回到我們開始的例子.兩個(gè)博弈人如果是同時(shí)博弈,那么就有兩個(gè)納什均衡(U,L) 和(D,R).LRUD(3,9)(0,0)(1,8)(2,1)30純策略Player BPlayer A我們假定博弈人A要么選擇策略U, 要么選擇D,U 和D 是博弈人A的純策略(pure strategies).LRUD(3,9)(0,0)(1,8)(2,1)31純策略Player BPlayer A同樣的, L和R是博弈人B的純策略。LRUD(3,9)(0,0)(1,8)(2,1)32純策略Play
11、er BPlayer A那么, (U,L)和(D,R) 就是純策略納什均衡( purestrategy Nash equilibria). 是否每一個(gè)博弈至少會(huì)存在一個(gè)純策略納什均衡呢?LRUD(3,9)(0,0)(1,8)(2,1)33純策略Player BPlayer A例如,這個(gè)博弈是否存在純策略納什均衡呢?(1,2)(0,4)(0,5)(3,2)UDLR34純策略Player BPlayer A不存在純策略納什均衡!(1,2)(0,4)(0,5)(3,2)UDLR35純策略Player BPlayer A但是,這個(gè)博弈存在混合策略( mixed strategies )納什均衡。(1,
12、2)(0,4)(0,5)(3,2)UDLR36Mixed Strategies混合策略博弈人A會(huì)選擇一個(gè)概率分布 (pU,1-pU),即博弈人A將以概率pU 選擇策略Up,以概率 1-pU 選擇策略 Down。概率分布 (pU,1-pU)就是博弈人A的混合策略。37混合策略同樣的,博弈人B也會(huì)混合選擇策略Left和Right。概率分布 (pL,1-pL) 是博弈人B的混合策略。38混合策略Player A這個(gè)博弈雖然沒有純策略納什均衡,但是卻存在混合策略納什均衡. 怎樣求出混合策略納什均衡呢?(1,2)(0,4)(0,5)(3,2)UDLRPlayer B39混合策略Player A(1,2)
13、(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B40混合策略Player A如果博弈人B選擇策略Left,那么他的期望收益為:(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B41混合策略Player A如果B選擇策略Right,那么他的期望收益為:(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B42混合策略Player A要存在納什均衡,博弈人B必定對(duì)策略Left或Right無差異; i.e.(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR
14、,1-pLPlayer B43混合策略Player A(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayer B44混合策略Player A如果A選擇Up,那么他的期望收益為:(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,Player B45混合策略Player A如果A選擇Down,那么他的期望收益為:(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,Player B46混合策略Player A要存在納什均衡,那么A必定對(duì)策略Up或者Down無差異; i.e.(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,Player B47混合策略Player BPlayer A所以,這個(gè)博弈存在唯一的納什均衡是A選擇混合策略(3/5, 2/5), B選擇混合策略(3/4, 1/4).(1,2)(0,4)(0,5)(3,2)U,D,L,R,48混合策略Player BPlayer A收益 (1,2)出現(xiàn)的概率為:(1,2)(0,4)(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 南京航空航天大學(xué)《電動(dòng)力學(xué)》2022-2023學(xué)年期末試卷
- 南京工業(yè)大學(xué)浦江學(xué)院《信號(hào)與系統(tǒng)》2021-2022學(xué)年第一學(xué)期期末試卷
- 南京工業(yè)大學(xué)浦江學(xué)院《設(shè)計(jì)語義與風(fēng)格》2021-2022學(xué)年第一學(xué)期期末試卷
- 分?jǐn)?shù)初步認(rèn)識(shí)的說課稿
- 渠涵施工組織設(shè)計(jì)
- 《元次方程應(yīng)用》說課稿
- 《下雨啦》說課稿
- 南京工業(yè)大學(xué)浦江學(xué)院《發(fā)動(dòng)機(jī)原理》2023-2024學(xué)年第一學(xué)期期末試卷
- 租船合同范本(2篇)
- 紋身免責(zé)協(xié)議書(2篇)
- 2024年山東青島城投金融控股集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- 工業(yè)機(jī)器人應(yīng)用4-裝配
- 中醫(yī)外治治療風(fēng)濕病
- 美國(guó)實(shí)時(shí)總統(tǒng)大選報(bào)告
- 外貿(mào)業(yè)務(wù)與國(guó)際市場(chǎng)培訓(xùn)課件
- 信創(chuàng)醫(yī)療工作總結(jié)
- 教師教育教學(xué)質(zhì)量提升方案
- 滅火器的規(guī)格與使用培訓(xùn)
- 2024《中央企業(yè)安全生產(chǎn)治本攻堅(jiān)三年行動(dòng)方案(2024-2026年)》
- 紀(jì)錄片《園林》解說詞
- 《民間文學(xué)導(dǎo)論》課件
評(píng)論
0/150
提交評(píng)論