版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第二十八章博弈論博弈論博弈論n博弈論能夠幫助我們來對市場中主體的行為受到其他主體行為的影響的策略行為進行建模。博弈論的一些應用n寡頭壟斷的研究 (行業(yè)中僅包含幾個廠商)n卡特爾的研究; 例如 OPECn外部性的研究; 例如對于公共資源的使用比如捕魚。n對于軍事策略的研究。n討價還價。n市場的運行機制。博弈是什么?n一個博弈博弈包含:n一些參與者參與者n每個參與者的策略策略n每個參與者選擇不同決策行為的收益矩陣。收益矩陣。兩人博弈n一個僅包含兩個參與者的博弈稱為兩人博弈兩人博弈。n我們研究的博弈僅包含兩個參與者,每個參與者可以選擇兩種不同的行為策略。兩人博弈的一個例子n參與者A 和 B。nA 可
2、以采取兩種行為:“上” 和 “下”。nB 可以采取兩種行為: “左” 和 “右”。n包含了四種可能決策組合支付的表格稱為博弈的收益矩陣收益矩陣。兩人博弈的一個例子這是博弈的收益矩陣參與者 B參與者 A左邊顯示A的收益右邊顯示B的收益LRUD(3,9)(0,0)(1,8)(2,1)兩人博弈的一個例子博弈的一組策略為一對決策組合如(U,R) ,其中第一個元素為參與者A的策略,第二個元素為參與者B的策略。LRUD(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A兩人博弈的一個例子例如. 假如A采取上上而B采取右右的策略,那么A的收益為1,B的收益為8。博弈收益矩陣LRUD(3,9)(0,0
3、)(1,8)(2,1)參與者 B參與者A兩人博弈的一個例子假如A采取下下的策略而B采取右右的策略,那么A的收益為2,B的收益為1。博弈的收益矩陣LRUD(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A兩人博弈的一個例子我們可能看到哪種策略組合結(jié)果?LRUD(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A兩人博弈的一個例子(U,R) 是否為一個有可能的策略組合結(jié)果?LRUD(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A兩人博弈的一個例子假如B采取右的策略那么A的最優(yōu)策略為下,因為它能使得A的收益從1變?yōu)?。因此(U,R)不是一個有可能出現(xiàn)的策略組合結(jié)果。LR
4、UD(3,9)(0,0)(1,8)(2,1)(U,R) 是否為一個有可能的策略組合結(jié)果?參與者 B參與者 A兩人博弈的一個例子LRUD(3,9)(0,0)(1,8)(2,1)(D,R) 是否為一個有可能的策略組合結(jié)果?參與者 B參與者 A兩人博弈的一個例子假如B采取右的策略,A的最佳策略為下。LRUD(3,9)(0,0)(1,8)(2,1)(D,R) 是否為一個有可能的策略組合結(jié)果?參與者 B參與者 A兩人博弈的一個例子假如B采取右的策略,A的最佳策略為下。假如A采取下的策略,B的最佳策略為右。因此(D,R) 是一個可能出現(xiàn)的策略組合結(jié)果。LRUD(3,9)(0,0)(1,8)(2,1)(D,
5、R) 是否為一個有可能的策略組合結(jié)果?參與者 B參與者 A兩人博弈的一個例子LRUD(3,9)(0,0)(1,8)(2,1)(D,L) 是否為一個有可能的策略組合結(jié)果?參與者B參與者 A兩人博弈的一個例子假如A采取下的策略,B的最佳策略為右。因此 (D,L)不是一個可能出現(xiàn)的策略組合結(jié)果。LRUD(3,9)(0,0)(1,8)(2,1)(D,L) 是否為一個有可能的策略組合結(jié)果?參與者 B參與者 A兩人博弈的一個例子LRUD(3,9)(0,0)(1,8)(2,1)(U,L) 是否為一個有可能的策略組合結(jié)果?參與者 B參與者 A兩人博弈的一個例子假如A采取上的策略,B的最佳策略為左。LRUD(3
6、,9)(0,0)(1,8)(2,1)(U,L) 是否為一個有可能的策略組合結(jié)果?參與者 B參與者 A兩人博弈的一個例子假如A采取上的策略,B的最佳策略為左。假如B采取左的策略,A的最佳策略為上。因此(U,L) 為一個可能出現(xiàn)的策略組合結(jié)果。LRUD(3,9)(0,0)(1,8)(2,1)(U,L) 是否為一個有可能的策略組合結(jié)果?參與者 B參與者 A納什均衡n博弈論中的策略組合中,每個參與者的決策都是對其它參與者決策的最佳反應決策時所達到的均衡稱為 納什均衡。納什均衡。n我們的例子中有兩個納什均衡 (U,L) 和(D,R)。兩人博弈的例子(U,L) 和 (D,R) 為此博弈的納什均衡。LRUD
7、(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A兩人博弈的例子(U,L) 和 (D,R) 為此博弈的納什均衡。但是我們發(fā)現(xiàn): 對兩個參與者來說,(U,L) 比 (D,R) 更受偏好。我們是否一定僅會看到 (U,L)的博弈均衡結(jié)果?LRUD(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A囚徒困境n為了了解帕累托偏好結(jié)果是否一定就是一個博弈的結(jié)果。考慮一個很有名的囚徒困境囚徒困境博弈問題。囚徒困境這個博弈的可能結(jié)果是什么樣子?克萊德邦妮(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCS(沉默沉默)C(供認供認)囚徒困境假如邦妮選擇沉默,克萊德的最佳策略為
8、供認。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克萊德邦妮囚徒困境假如邦妮選擇沉默,克萊德的最佳策略為供認。假如邦妮選擇供認,克萊德的最優(yōu)策略為供認。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克萊德邦妮囚徒困境因此不論邦妮選擇什么策略,克萊德的最優(yōu)策略總是供認。供認對于克萊德來說是一個占優(yōu)策略占優(yōu)策略。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克萊德邦妮囚徒困境同樣地,不論克萊德選擇什么策略,邦妮的最佳策略為供認。供認對于邦妮來說也是占優(yōu)策略。(-5,-5)(-30,-1)(-1,-30)(-10,-10
9、)SCSC克萊德邦妮囚徒困境唯一的納什均衡為 (C,C),盡管 (S,S) 能使得邦妮和克萊德的處罰更輕。這個唯一的納什均衡是無效率的。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克萊德邦妮決策時機n在上面來兩個例子中,參與者同時做出他們的決策。n這樣的博弈稱為同步博弈同步博弈。決策時機n在上面來兩個例子中,參與者同時做出他們的決策。n這樣的博弈稱為同步博弈同步博弈。n首先行動的參與者稱為領(lǐng)導者領(lǐng)導者,后行動的參與者稱為追隨者追隨者。序貫博弈的例子n有時一個博弈可能含有幾個納什均衡,很難確定哪一種均衡結(jié)果更有可能發(fā)生。n當一個博弈為一個序貫博弈時,那么就有可能其中的
10、一個納什均衡比其它均衡更有可能發(fā)生。序貫博弈的例子參與者 B參與者 A(U,L) 和 (D,R) 都為同時決策時的納什均衡,我們無法判斷哪種均衡更有可能發(fā)生。LRUD(3,9)(0,0)(1,8)(2,1)序貫博弈的例子假設(shè)這個博弈為序貫博弈,A為領(lǐng)導者而B為追隨者。我們可以把這個博弈的拓展形式拓展形式寫出來。LRUD(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A序貫博弈的例子UDLLRR(3,9)(1,8) (0,0)(2,1)ABBA 先行動B 后行動序貫博弈的例子(U,L) 為一個納什均衡。為一個納什均衡。UDLLRR(3,9)(1,8) (0,0)(2,1)ABBA 先行
11、動B 后行動序貫博弈的例子UDLLRR(3,9)(1,8) (0,0)(2,1)ABBA 先行動B 后行動(U,L) 為一個納什均衡。 (D,R)也是一個納什均衡。這兩個均衡哪個更有可能發(fā)生?序貫博弈的例子假如A先選擇決策U ,B后選擇策略L;A 所得收益為3。UDLLRR(3,9)(1,8) (0,0)(2,1)ABBA 先行動B 后行動序貫博弈的例子假如A先選擇決策U ,B后選擇策略L;A 所得收益為3。假如A先選擇策略D,B后選擇策略R;A 所得收益為2。UDLLRR(3,9)(1,8) (0,0)(2,1)ABBA 先行動B 后行動序貫博弈的例子假如A先選擇決策U ,B后選擇策略L;A
12、 所得收益為3。假如A先選擇策略D,B后選擇策略R;A 所得收益為2。UDLLRR(3,9)(1,8) (0,0)(2,1)ABBA 先行動B 后行動因此(U,L)很可能為均衡結(jié)果。序貫博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A在考慮我們之前的例子。假設(shè)博弈是同步的,我們發(fā)現(xiàn)這個博弈有兩個納什均衡; (U,L) 和 (D,R)。序貫博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A參與者A 已經(jīng)被考慮了上或者下的決策,但沒有把這兩種策略聯(lián)合起來考慮。例如,僅做出單純的上或下決策。上和下為參與者A的純策略純策略。序貫博弈的例子LRU
13、D(3,9)(0,0)(1,8)(2,1)參與者B參與者A類似地,左和右為參與者B的純策略純策略。序貫博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)參與者 B參與者 A因此,(U,L)和(D,R) 為純策略納什均衡純策略納什均衡。是否每一個博弈都至少有一個純策略納什均衡?純策略參與者 B參與者 A這是一個新的博弈。是否存在純策略的納什均衡?(1,2)(0,4)(0,5)(3,2)UDLR純策略參與者 B參與者 A (U,L)是否為一個納什均衡?(1,2)(0,4)(0,5)(3,2)UDLR純策略參與者 B參與者 A(U,L)是否為一個納什均衡?不是。(U,R) 是否為一個納什均衡
14、?(1,2)(0,4)(0,5)(3,2)UDLR純策略參與者 B參與者 A(U,L)是否為一個納什均衡?不是。(U,R)是否為一個納什均衡?不是。(D,L)是否為一個納什均衡?(1,2)(0,4)(0,5)(3,2)UDLR純策略參與者 B參與者A(U,L)是否為一個納什均衡?不是。(U,R)是否為一個納什均衡?不是。(D,L)是否為一個納什均衡?不是。(D,R) 是否為一個納什均衡?(1,2)(0,4)(0,5)(3,2)UDLR純策略參與者 B參與者 A(U,L)是否為一個納什均衡?不是。(U,R)是否為一個納什均衡?不是。(D,L)是否為一個納什均衡?不是。(D,R) 是否為一個納什均
15、衡?不是。(1,2)(0,4)(0,5)(3,2)UDLR純策略參與者 B參與者 A因此單采取純策略時,該博弈沒有納什均衡。但是這個博弈在采取混合策略混合策略時有一個納什均衡。(1,2)(0,4)(0,5)(3,2)UDLR混合策略n參與者A選擇一個概率分布(pU,1-pU),表示參與者A有pU的概率選擇策略上,有1-pU的概率選擇策略下;而不是單純的選擇上或者下的策略。n參與者A混合混合了上和下的純策略。n概率分布概率分布(pU,1-pU)為參與者為參與者A的混合策略。的混合策略。混合策略n類似地,參與者B選擇概率分布 (pL,1-pL),表示有pL的概率他會選擇左,有1-pL的概率他會選擇
16、右。n參與者B混合混合了左和右的純策略。n概率分布概率分布(pL,1-pL)為參與者為參與者B的混合策略。的混合策略?;旌喜呗詤⑴c者 B參與者 A這個博弈沒有純策略納什均衡,但有混合策略納什均衡。混合納什均衡結(jié)果是如何計算的?(1,2)(0,4)(0,5)(3,2)UDLR混合策略參與者 B參與者 A(1,2)(0,4)(0,5)(3,2)U, pUD, 1-pUL, pLR, 1-pL混合策略參與者 B參與者 A(1,2)(0,4)(0,5)(3,2)U, pUD, 1-pUL, pLR, 1-pLA選擇上策略時的預期收益為多少?混合策略參與者 B參與者 A(1,2)(0,4)(0,5)(3
17、,2)U, pUD, 1-pUL, pLR, 1-pLA選擇上策略的預期收益為pL。A選擇下策略的預期收益為多少?混合策略參與者 B參與者 A(1,2)(0,4)(0,5)(3,2)U, pUD, 1-pUL, pLR, 1-pLA選擇上策略的預期收益為pL。A選擇下策略的預期收益為3(1 - pL)。A選擇上策略的預期收益為pL。A選擇下策略的預期收益為3(1 - pL)。假如 pL 3(1 - pL) 那么A僅選擇上的策略,但是當A采用上的純策略時沒有納什均衡。混合策略參與者 B參與者 A(1,2)(0,4)(0,5)(3,2)U, pUD, 1-pUL, pLR, 1-pL混合策略參與者
18、 B參與者 A(1,2)(0,4)(0,5)(3,2)U, pUD, 1-pUL, pLR, 1-pLA選擇上策略的預期收益為pL。A選擇下策略的預期收益為3(1 - pL)。 假如 pL 4pU + 2(1 - pU) 那么B僅選擇左的策略,但是當B僅采用左的策略時不存在納什均衡。混合策略參與者B參與者 A(1,2)(0,4)(0,5)(3,2)U, pUD, 1-pUL, 3/4R, 1/4B選擇左的策略的預期收益為2pU + 5(1 - pU)。B選擇右的策略的預期收益為4pU + 2(1 - pU) 。 假如2pU + 5(1 - pU) 4pU + 2(1 - pU)那么B僅采取右的
19、策略,但是當B僅采取右的策略時不存在納什均衡?;旌喜呗詤⑴c者 B參與者 A(1,2)(0,4)(0,5)(3,2)U, pUD, 1-pUL, 3/4R, 1/4存在納什均衡的必要條件為:2pU + 5(1 - pU) = 4pU + 2(1 - pU) pU = 3/5;A使用上和下的混合策略必須要使得B采取左和右的策略時所得收益無差異?;旌喜呗詤⑴c者 B參與者 A(1,2)(0,4)(0,5)(3,2)U, 3/5D, 2/5L, 3/4R, 1/4A的混合策略為 (3/5, 2/5)而B的混合策略為(3/4, 1/4)時,此博弈存在唯一的納什均衡?;旌喜呗詤⑴c者 B參與者 A(1,2)(
20、0,4)(0,5)(3,2)U, 3/5D, 2/5L, 3/4R, 1/4出現(xiàn)收益(1,2)的概率為: 3/5 3/4 = 9/20。混合策略參與者 B參與者 A(1,2) 9/20(0,4)(0,5)(3,2)U, 3/5D, 2/5L, 3/4R, 1/4出現(xiàn)收益 (0,4) 的概率為: 3/5 1/4 = 3/20。混合策略參與者 B參與者 A(1,2) 9/20(0,4)3/20(0,5)(3,2)U, 3/5D, 2/5L, 3/4R, 1/4出現(xiàn)收益(0,5)的概率為: 2/5 3/4 = 6/20?;旌喜呗詤⑴c者 B參與者 A(1,2) 9/20(0,4)3/20(0,5) 6
21、/20U, 3/5D, 2/5L, 3/4R, 1/4(3,2)出現(xiàn)收益 (3,2) 的概率為: 2/5 1/4 = 2/20?;旌喜呗詤⑴c者 B參與者 A(1,2) 9/20(0,4)3/20(0,5) 6/20(3,2) 2/20U, 3/5D, 2/5L, 3/4R, 1/4A的納什均衡預期收益為: 19/20 + 32/20 = 3/4?;旌喜呗詤⑴c者 B參與者 A(1,2) 9/20(0,4)3/20(0,5) 6/20(3,2) 2/20U, 3/5D, 2/5L, 3/4R, 1/4A的納什均衡預期收益為: 19/20 + 32/20 = 3/4。B的納什均衡預期收益為: 29/
22、20 + 43/20 + 56/20 + 22/20 = 16/5 混合策略參與者 B參與者 A(1,2) 9/20(0,4)3/20(0,5) 6/20(3,2) 2/20U, 3/5D, 2/5L, 3/4R, 1/4納什均衡的數(shù)量有多少?n一個有著有限個參與者,每個參與者都有有限個純策略的博弈至少存在一個納什均衡。n假如沒有純策略納什均衡,那么該博弈至少存在一個混合策略納什均衡。重復博弈n重復博弈是指一定時期內(nèi)重復進行的博弈。n參與者對某一策略是否敏感很大程度上取決于該博弈是否n重復有限次n重復無限次重復博弈n一個典型的例子為重復囚徒困境博弈。一期博弈的例子我們之前已經(jīng)考察過。囚徒困境假
23、設(shè)這個博弈在三個時期t = 1, 2, 3每期內(nèi)僅會進行一次。哪些結(jié)果是有可能的?(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克萊德邦妮囚徒困境假設(shè)第3期博弈已經(jīng)開始, (該博弈已經(jīng)進行了兩次)。 克萊德應該怎么做?邦妮又該怎么做?(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克萊德邦妮囚徒困境假設(shè)第3期博弈已經(jīng)開始, (該博弈已經(jīng)進行了兩次)。 克萊德應該怎么做?邦妮又該怎么做?兩個都應該供認。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克萊德邦妮囚徒困境現(xiàn)在假設(shè)第二期博弈已經(jīng)開始??巳R德和邦妮都預期下次對方會供認??巳R德和邦妮會怎么做?(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克萊德邦妮囚徒困境現(xiàn)在假設(shè)第二期博弈已經(jīng)開始??巳R德和邦妮都預期下次對方會供認??巳R德和邦妮
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年花卉保養(yǎng)服務協(xié)議范本
- 2023-2024學年浙江省溫州市蒼南縣金鄉(xiāng)衛(wèi)城中學高三5月第二次聯(lián)考數(shù)學試題文試卷
- 2023-2024學年浙江省金蘭教育合作組織高三下學期質(zhì)量調(diào)查(一)數(shù)學試題
- 2024年設(shè)計服務外包協(xié)議范本2
- 2024年深度鉆井工程服務協(xié)議
- 2024年荒山開發(fā)承包協(xié)議樣本
- 2024年個人消費貸款協(xié)議模板指南
- 2024年適用車輛租賃長租協(xié)議樣式
- 底商租賃協(xié)議精簡(2024年)
- 2024移動網(wǎng)絡(luò)運營商服務協(xié)議
- 康復醫(yī)院設(shè)置標準匯總
- CA碼生成原理及matlab程序?qū)崿F(xiàn)
- 國家開放大學《電氣傳動與調(diào)速系統(tǒng)》章節(jié)測試參考答案
- 須彌(短篇小說)
- 旋風除塵器設(shè)計與計算
- 《裝配基礎(chǔ)知識培訓》
- 出口退稅的具體計算方法及出口報價技巧
- PCB鍍層與SMT焊接
- Unit 1 This is my new friend. Lesson 5 課件
- 2019年青年英才培養(yǎng)計劃項目申報表
- 芳香油的提取
評論
0/150
提交評論