![第三章 擴展型博弈論_第1頁](http://file4.renrendoc.com/view/69dfb1e118eaee9e1e7f7e51948f8312/69dfb1e118eaee9e1e7f7e51948f83121.gif)
![第三章 擴展型博弈論_第2頁](http://file4.renrendoc.com/view/69dfb1e118eaee9e1e7f7e51948f8312/69dfb1e118eaee9e1e7f7e51948f83122.gif)
![第三章 擴展型博弈論_第3頁](http://file4.renrendoc.com/view/69dfb1e118eaee9e1e7f7e51948f8312/69dfb1e118eaee9e1e7f7e51948f83123.gif)
![第三章 擴展型博弈論_第4頁](http://file4.renrendoc.com/view/69dfb1e118eaee9e1e7f7e51948f8312/69dfb1e118eaee9e1e7f7e51948f83124.gif)
![第三章 擴展型博弈論_第5頁](http://file4.renrendoc.com/view/69dfb1e118eaee9e1e7f7e51948f8312/69dfb1e118eaee9e1e7f7e51948f83125.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
第三章擴展型博弈授課人:吳有k>=1堆硬幣,各堆分別含有N1,N2,……NK枚。游戲法則如下:1.兩個游戲人交替進行游戲;2.當輪到每個游戲人取子時,選擇這些堆中的一堆,并從所選的堆中取走至少一枚硬幣(可以取走所選堆中的全部硬幣);3.如果輪到某個游戲人時所有的硬幣堆都已經(jīng)被拿空了,則判負。第一節(jié)擴展型博弈的含義及其表示在完全信息博弈中,局中人的行動有先有后,后行動者可以觀察到先行動者的行動,又可稱為完全信息動態(tài)博弈,或者序貫博弈。只剩一張門票免費發(fā)送,先到先得,若得到效用都為100。甲、乙二人可以選擇兩種交通工具,B或T,B需要花5個單位,T需要花50個單位。假設甲先下班先行動,乙可以觀察到甲的行動選擇后行動。
博弈樹(1)同一個局中人的一些結(jié)點構(gòu)成的集合;(2)表示博弈到了這個集合,但不知到了這個集合的哪一個結(jié)點上。決策結(jié):局中人采取行動的時點
初始結(jié)(根)終點結(jié):博弈行動路徑的終點枝:局中人采取的行動甲BTBTBT乙乙(95,-5)(-5,50)(50,-5)(50,-50)信息集:決策結(jié)的子集,用來描述局
中人所知道的信息結(jié)點完美信息博弈:博弈樹中的所有信息集都只有一個決策結(jié)——博弈中沒有任何兩個局中人同時行動,并且所有后行動者能夠確切地知道先行動者的行動選擇
構(gòu)成要素:局中人
策略支付函數(shù)
行動順序
行動信息集策略:
博弈局中人在給定信息集的情況下的行動規(guī)則或者行動指南,規(guī)定局中人在什么時候選擇什么行動。
甲的策略:B或者T
乙的策略:(B,B)(B,T)(T,B)(T,T)相機性——策略是有條件的,只有博弈達到某一決策結(jié),局中人才會采取某一行動。完備性——策略是關于行動的一個完整的計劃,它明確了在局中人可能會遇到的各種情況下對可行行動的選擇。第二節(jié)擴展型博弈的納什均衡
乙甲(B,B)(B,T)(T,B)(T,T)B95,-595,-5-5,50-5,50T50,-550,-5050,-550,-50兩個連鎖店A與B銷售幾乎同樣的產(chǎn)品,他們在考慮是否進入同一個區(qū)域市場的決策問題,A先決策,B后決策。ENB(0,1)(0,0)EAENNB(-3,-3)(1,0)BA(E,E)(E,N)(N,E)(N,N)E-3,-3-3,-31,01,0N0,10,00,10,0練習:
利用擴展型描述囚徒困境
乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2甲BTBTBT乙乙(95,-5)(-5,50)(50,-5)(50,-50)信息集:
決策結(jié)的子集,用來描述局中人所知道的信息(1)同一個局中人的一些決策結(jié)構(gòu)成的集合;(2)如果決策結(jié)屬于同一個信息集,用折彎的虛線將這些決策結(jié)相連;(3)表示博弈到了這個集合,但不知到了這個集合的哪一個結(jié)點上。策略:
博弈局中人在給定信息集的情況下的行動規(guī)則或者行動指南,規(guī)定局中人在什么時候選擇什么行動。
甲的策略:B或者T
乙的策略:(B,B)(B,T)(T,B)(T,T)甲BTBTBT乙乙(95,-5)(-5,50)(50,-5)(50,-50)
乙甲
(B,B)(B,T)(T,B)(T,T)B95,-595,-5-5,50-5,50T50,-550,-5050,-550,-50甲在開采一價值4萬元的金礦時缺1萬元資金,而乙正好有1萬元資金可以投資,設甲試圖說服乙將1萬元資金借給自己,并許諾采到金子后與乙對半分成,乙是否該借錢給甲?分乙借不借不分甲(2,2)(0,4)(1,0)是否有辦法使甲的許諾變成可信?乙在甲違約時,可以采用“打官司”的方式來保護自己的利益。但打官司要消耗人力物力,假設打官司的結(jié)果是乙能收回本錢1萬元,甲失去全部采金收入。打不打(1,0)(0,4)乙如果法律不能充分保障勝訴當事人的全部收益(保護力度不夠大)或?qū)η趾λ死嬲邲]有足夠的震懾作用?(-1,0)開金礦博弈練習:“仿冒和反仿冒博弈”請給出擴展型設有一家企業(yè)的產(chǎn)品被另一家企業(yè)仿冒,如果被仿冒企業(yè)采取措施制止,仿冒企業(yè)就會停止仿冒;如果被仿冒企業(yè)不采取措施制止,那么仿冒企業(yè)就會繼續(xù)仿冒。假設仿冒最多進行兩次,第一次不仿冒、仿冒被制止、及仿冒沒被制止情況下,第二次不仿冒、仿冒被制止、仿冒沒被制止的情況下,仿冒和被仿冒企業(yè)的得益分別為0和10,-2和5,5和5,2和2,10和4。第三節(jié)子博弈完美納什均衡從單一決策結(jié)出發(fā)包含了這個決策結(jié)的每一個后續(xù)結(jié)如果它包含了一個信息集的若干部分,那么它一定包含該信息集的所有節(jié)點子博弈1abcd2(2,4)(4,3)(8,5)(5,3)1efgh2(3,6)1223333問題:
完全信息博弈與完美信息博弈的區(qū)別?
完全信息博弈強調(diào)局中人互相清楚得益情況;完美信息博弈強調(diào)后選擇行為者清楚先選擇行為者的策略選擇。是原博弈上的納什均衡子博弈內(nèi)的策略組合是每個子博弈的納什均衡
“策略組合是任何子博弈的納什均衡”子博弈完美納什均衡任何有限的完美信息動態(tài)博弈都至少存在一個子博弈完美納什均衡存在定理從位置在最后決策結(jié)的子博弈開始,求出對應的局中人的最佳選擇,然后在這種選擇給定的情況下,倒推至該節(jié)點的前一個節(jié)點,求出相應局中人的最佳選擇,然后再向前倒推,直至初始結(jié),這樣得到的策略組合就是子博弈完美納什均衡。子博弈完美納什均衡的求法——倒推法ENB(0,1)(0,0)EAENNB(-3,-3)(1,0)(N,E)斯塔克爾伯格模型兩個寡頭地位不對等進行產(chǎn)量競爭,企業(yè)1是領頭者,先選擇產(chǎn)量q1,企業(yè)2是跟隨者,觀察到q1后再選擇自己的產(chǎn)量q2,其他條件不變。古諾模型兩家處于同等地位的寡頭同時做出產(chǎn)量決策,企業(yè)1產(chǎn)量為q1,企業(yè)2產(chǎn)量為q2,假定逆需求函數(shù)為P(q1,q2)=a-(q1+q2),兩個企業(yè)有相同的不變單位成本c,固定成本為0。給定q1的情況下,企業(yè)2的最優(yōu)選擇:例子:春節(jié)前夕,某小鎮(zhèn)上兩個商鋪主甲和乙同時看到一個賺錢機會:去城里批發(fā)一批鞭炮回來零售,購貨款加上運輸費用共5000元,如果沒有競爭對手,這批貨在小鎮(zhèn)上能賣6000元;但如果另一家商鋪同時在小鎮(zhèn)上賣鞭炮,價格下跌使得這批鞭炮只能賣4000元,請求出納什均衡?假設甲先行動,商鋪乙看到對方的選擇后再決定是否進貨,請求出子博弈完美納什均衡?如果甲先行動,但在博弈開始前商鋪主乙有一次行動A的機會,請利用子博弈完美納什均衡概念分析下述兩種情況下的博弈結(jié)果(1)A:商鋪主乙逢人便說自己一定要進貨,無論對方如何行動他都不會改變這個決定;(2)A:商鋪主乙與某個嘲笑他說大話的第三者丙打賭:如果自己到時不進貨,向丙支付1500元;如果自己到時候進貨,丙向他支付100元。并且,乙將這個賭局通知甲。甲進不進進不進進不進乙乙(-1000,-1000)(1000,0)(0,1000)(0,0)甲進不進進不進進不進乙乙(-1000,-900)(1000,-1500)(0,1100)(0,-1500)作業(yè):
閱讀“蜈蚣博弈”拍賣人拿出一張10元鈔票,請大家給這張鈔票開價,無底價,競拍者可無限制的輪流叫價,每次叫價的增幅以5毛為單位,出價最高者可以得到這張10元鈔票,但出價最高和次高者都要向拍賣人支付出價數(shù)目的費用?!K比克拍賣模型第四節(jié)重復博弈
單次博弈重復進行構(gòu)成的博弈過程,但博弈方的行為和博弈結(jié)果不一定是單次博弈的簡單重復,其中,單次博弈可稱為階段博弈重復博弈重復博弈的基本特征:單次博弈之間沒有實質(zhì)聯(lián)系,即前一階段的博弈不改變其它階段的博弈結(jié)構(gòu);所有局中人能夠觀測并記憶以往的博弈歷史;局中人的總支付為各階段支付的貼現(xiàn)值之和或者加權(quán)平均值。重復博弈的分類:有限次博弈由單次博弈的有限次重復構(gòu)成的重復博弈,有明確的重復次數(shù)或結(jié)束時間無限次博弈由單次博弈一直重復進行下去的重復博弈,沒有可以預見的結(jié)束時間,各博弈方主觀上認為博弈會不斷進行下去
企業(yè)甲(在位者)在20個相同的市場各開了一家連鎖店,每個市場有一個潛在進入者,每個進入者序貫決定是否進入相應市場,企業(yè)甲對各個市場的進入者選擇默認或者打壓策略,忽略進入者之間的微小差異,這個問題可以看成是一個20次(階段)重復博弈。有限次重復博弈-連鎖店悖論(0,300)默認進入者EN打壓甲(40,50)(-10,0)思考:在位者是否應對開頭幾個市場的進入者采取打擊策略,使打擊的示范效應嚇退其他市場的潛在進入者,從而能夠獨享其余市場的利益?子博弈完美納什均衡為:在位者在每一個市場選擇默許,進入者在每一個市場選擇進入。以階段博弈G構(gòu)成的重復T次(T<∞)的重復博弈中,如果G中僅存在唯一的納什均衡,那么重復博弈G(T)的唯一子博弈完美均衡是階段博弈的唯一納什均衡重復T次,即每次博弈結(jié)局都是該納什均衡。無限次重復博弈
乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2支付函數(shù)的表達——貼現(xiàn)因子貼現(xiàn)因子在數(shù)值上可以理解為貼現(xiàn)率,就是1個份額經(jīng)過一段時間后所等同的現(xiàn)在份額。設局中人的支付函數(shù)為,并且在第t(t=1,2,…)次階段博弈中獲得的階段博弈支付是,則冷酷策略
也稱作觸發(fā)策略,以囚徒困境為例:開始選擇“不坦白”,一旦對手“坦白”,那么以后永遠選擇“坦白”。思考:局中人都選擇冷酷策略時是否會構(gòu)成一個子博弈完美納什均衡?
乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2(1)若之前沒有人選“坦白”,A若選“坦白”,該階段得益為-1,但此舉將觸發(fā)B之后永遠的報復,即B在之后永遠選“坦白”,A在之后也只能永遠選“坦白”,其總得益貼現(xiàn)最多為
A若選“不坦白”,并且之后每階段都選“不坦白”時,B之后也會配合,即每階段都選“不坦白”,A總得益貼現(xiàn)為當時,A選“不坦白”是最優(yōu)的,即給定囚徒B選擇冷酷策略,證明囚徒A選擇冷酷策略是最優(yōu)的。當時,A在沒有人先選“坦白”時選“不坦白”是最優(yōu)的,并且A在之后每階段都選“不坦白”是最優(yōu)的選擇。
乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2(2)若之前有人選“坦白”,B若在之前選了“坦白”,則B之后
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代醫(yī)療用品的冷鏈物流管理策略
- 現(xiàn)代農(nóng)業(yè)技術(shù)推廣與農(nóng)業(yè)可持續(xù)發(fā)展
- 媽媽班活動方案國慶節(jié)
- 2023八年級物理上冊 第二章 物質(zhì)世界的尺度、質(zhì)量和密度第二節(jié) 物體的質(zhì)量及其測量說課稿 (新版)北師大版
- 4《同學相伴》第一課時 說課稿-2023-2024學年道德與法治三年級下冊統(tǒng)編版
- 《6~9的加減法-用減法解決問題》說課稿-2024-2025學年一年級上冊數(shù)學人教版001
- 1少讓父母為我擔心(說課稿)-統(tǒng)編版(五四制)道德與法治四年級上冊
- 2024-2025學年高中物理 第四章 勻速圓周運動 第3節(jié) 向心力的實例分析說課稿 魯科版必修2
- Unit3《It's a colourful world!》(說課稿)-2024-2025學年外研版(三起)(2024)英語三年級上冊(2課時)
- Unit 4 I have a pen pal Part B Let's learn(說課稿)-2023-2024學年人教PEP版英語六年級上冊
- (二模)遵義市2025屆高三年級第二次適應性考試試卷 地理試卷(含答案)
- 二零二五隱名股東合作協(xié)議書及公司股權(quán)代持及回購協(xié)議
- 風電設備安裝施工專項安全措施
- IQC培訓課件教學課件
- 2025年計算機二級WPS考試題目
- 高管績效考核全案
- 2024年上海市中考英語試題和答案
- 教育部《中小學校園食品安全和膳食經(jīng)費管理工作指引》知識培訓
- 長沙醫(yī)學院《無機化學》2021-2022學年第一學期期末試卷
- eras婦科腫瘤圍手術(shù)期管理指南解讀
- GB/T 750-2024水泥壓蒸安定性試驗方法
評論
0/150
提交評論