版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第二部分: 完全信息動(dòng)態(tài)博弈第八章第八章 重復(fù)博弈重復(fù)博弈 主要內(nèi)容:一、有限重復(fù)博弈二、無限重復(fù)博弈三、討價(jià)還價(jià)博弈Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng第八章第八章 重復(fù)博弈重復(fù)博弈 主要內(nèi)容:一、有限重復(fù)博弈二、無限重復(fù)博弈三、討價(jià)還價(jià)博弈Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng一、有限重復(fù)博弈 重復(fù)博弈所關(guān)心的議題: 將來可信的威脅或承諾如何影響到當(dāng)前的行動(dòng)Con
2、trol Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng考察下列博弈1,15,00,54,4UDLR12Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 上述博弈存在唯一的Nash均衡。 將上述博弈重復(fù)兩次,其中第二次博弈開始時(shí),第一次博弈的結(jié)果已知。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng兩
3、次重復(fù)博弈的博弈樹121Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 上述重復(fù)博弈只存在唯一的Nash均衡:在每次博弈中,參與人1都選擇U,參與人2都選擇L,即( (U, U, U, U, U), (L, L, L, L, L) ) 可以證明:該均衡為精煉Nash均衡。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1,15,00,54,4UDLR121,15,00,54,4UDLR1
4、21+1,1+1 5+1,0+10+1,5+1 4+1,4+1UDLR12Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 前面的分析說明:在兩次重復(fù)博弈中,合作仍無法到達(dá)。 同樣可證明:在n階段重復(fù)博弈(即博弈重復(fù)n次且每次博弈開始時(shí),前面博弈的結(jié)果都已知)中,合作同樣無法到達(dá)。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng重復(fù)博弈定義 對于給定的階段博弈G,令G(T)表示G重復(fù)進(jìn)行T
5、次的有限重復(fù)博弈,并且在下一此博弈開始前,所有以前博弈的進(jìn)程都可被觀測到, G(T)的收益為T次階段博弈收益的簡單相加。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在重復(fù)博弈中,當(dāng)全部博弈進(jìn)行到任何一個(gè)階段,到此為止的進(jìn)行過程就成為參與各方的共同知 識,而其后尚未開始進(jìn)行的部分就是一個(gè)子博弈。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng定理: 如果階段博弈G有唯一的Nash均衡,
6、則對任意有限的T,重復(fù)博弈G(T)有唯一的子博弈精煉解,即G的Nash均衡結(jié)果在每一個(gè)階段重復(fù)進(jìn)行。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng考察下列博弈1,15,00,00,54,40,00,00,03,3121L2L1M1R2M2RControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 上述博弈存在兩個(gè)Nash均衡: (L1 , L2)和(R1 , R2) 將上述博弈重復(fù)兩次。Cont
7、rol Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 1) 戰(zhàn)略: 每個(gè)局中人都有個(gè)戰(zhàn)略;(1+9)3= 59049Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 2) 戰(zhàn)略組合: 一共存在 個(gè)戰(zhàn)略組合; 59049 59049=3,486,784,401Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunf
8、eng 3) 均衡: 可以根據(jù)以下原則構(gòu)造均衡: 由第一階段的結(jié)果,預(yù)測第二階段的均衡。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng例如: 若第一階段出現(xiàn)(M1,M2)(即出現(xiàn)合作),則第二階段為(R1,R2)(即“好的均衡”); 若第一階段沒有出現(xiàn)(M1, M2 ), 則第二階段為(L1,L2)(即“差的均衡”)。 Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng根據(jù)上述原則,可構(gòu)
9、造如下策略:S1:第一階段選擇M1;如第一階段結(jié)果為(M1,M2),則下一階段選R1;否則選擇L1。S2:第一階段選擇M2;如第一階段結(jié)果為(M1,M2) ,則下一階段選R2;否則選擇L2。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 在上述策略下,博弈可表示為:這意味著:合作可以在第一階段達(dá)到1+1,1+1 5+1,0+1 0+1,0+10+1,5+1 4+3,4+3 0+1,0+10+1,0+1 0+1,0+1 3+1,3+1121L2L1M1R2M2RControl Science
10、 and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 定理: 如果G= 是一個(gè)有多個(gè)Nash均衡的完全信息靜態(tài)博弈,則G(T)可以存在子博弈精煉解,其中對每一 t(1)2 sssssssss當(dāng)時(shí),參與人1接受參與人2的建議。而當(dāng) 時(shí),參與人2可得1-。由于1-,所以參與人 會(huì)在第二階段提出自己的最優(yōu)建議 。此時(shí)參與人1接受建議。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 考察參與人1在第一階段的最優(yōu)選擇。 參與人1在
11、第一階段即可預(yù)測到參與人2在第二階段的最優(yōu)選擇2ss Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng211 1-1-(1)1(1)1ssssssss 由于參與人2的選擇為 時(shí),參與人1接受其建議,且自己可得。而相當(dāng)于第一階段的,所以參與人1在第一階段提出的 滿足如下條件, 則參與人2將會(huì)接受參與人 的建議。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng11(1)1ss 所以 時(shí),則參與
12、人2將會(huì)接受參與人 的建議。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng11221(1) 1(1) 1 ssssss 當(dāng) 時(shí), Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng111(1) 1(1)ssss 這意味著:當(dāng) -時(shí),參與人1的所獲大于博弈進(jìn)入第二階段的所獲,且此時(shí)參與人2接受自己的建議。因此,參與人1在第一階段的最優(yōu)選擇為:-Control Science and Engi
13、neering, HUST All Rights Reserved, 2007, Luo Yunfeng11(1)ss 因此博弈的均衡結(jié)果為:參與人1在第一階段建議 ,參與人2接受該建議。 博弈結(jié)束。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng假設(shè)參與人的貼現(xiàn)率分別為: 首先考察參與人2的最優(yōu)選擇。 12, 。212 ss 參與人 在第二階段提出自己的最優(yōu)建議此時(shí)參與人1接受建議。Control Science and Engineering, HUST All Rights Reser
14、ved, 2007, Luo Yunfeng 考察參與人1在第一階段的最優(yōu)選擇。 1121(1)1sss參與人1在第一階段提出的 滿足如下條件 1-則參與人2將會(huì)接受參與人的建議。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1211(1)1ss 所以 時(shí),則參與人2將會(huì)接受參與人 的建議。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng121121212121(1) 1(1) 1 ss
15、ssss 當(dāng) 時(shí),+Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng121 1(1)ss參與人1在第一階段的最優(yōu)選擇為:Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1211(1)ss因此博弈的均衡結(jié)果為:參與人1在第一階段建議 ,參與人2接受該建議。 博弈結(jié)束。Control Science and Engineering, HUST All Rights Reserved, 2007
16、, Luo Yunfeng 考慮以上述討價(jià)還價(jià)博弈為階段博弈的無限重復(fù)博弈。 假設(shè)貼現(xiàn)率為 。12,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 由于在無限重復(fù)博弈 中,由 t+1 階段開始的每個(gè)子博弈都等同于初始博弈 ,因此,從第 t 階段開始的子博弈等同于 t+2 階段開始的子博弈。(,)G(,)GControl Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng212122( ,1- )( ,1-
17、 ) 1(1)1 1tsstsssss 假設(shè)從階段開始的子博弈的均衡解為,所以,從 階段開始的子博弈的均衡解為。由三階段討價(jià)還價(jià)博弈的均衡可得:所以Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng221212121()11 因此,以上述三階段討價(jià)還價(jià)博弈為階段博弈的無限重復(fù)博弈的均衡為: ,Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 從均衡結(jié)果可以看到:每個(gè)參與人在博弈中的所得都隨自
18、己的貼現(xiàn)率(即自己的耐心)增大而增加,隨對方的貼現(xiàn)率(即對方的耐心)的減少而增加。 這說明在討價(jià)還價(jià)博弈中,耐心越大越有利,越不耐心越不利!Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 進(jìn)一步討論均衡結(jié)果與參與人貼現(xiàn)率的關(guān)系。2112 1. 111 2. 102ss給定 ,當(dāng)時(shí),參與人 得到整個(gè)蛋糕(即一美元);給定 ,當(dāng)時(shí),參與人 得到整個(gè)蛋糕(即一美元);Control Science and Engineering, HUST All Rights Reserved, 2007,
19、Luo Yunfeng 從上述分析可以看到:有絕對耐心的參與人總可以通過拖延時(shí)間使自己獨(dú)吞整個(gè)蛋糕。這種“耐心優(yōu)勢”在一般情況也成立:給定其他條件(如參與人的出價(jià)次序),越有耐心的參與人得到的份額越大。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng120.50.9210.18210.812ss 比如說,令, ,即假定參與人 比 更有耐心,則均衡結(jié)果為: , Control Science and Engineering, HUST All Rights Reserved, 2007, Lu
20、o Yunfeng123.1112“”s 令,所以 因此,在討價(jià)還價(jià)博弈中,存在所謂的 先動(dòng)優(yōu)勢 。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng1220 01211“” 特別地,當(dāng),時(shí),參與人 得不到整個(gè)蛋糕,除非。就是說沒有任何耐心的參與人 總可以得到一點(diǎn)份額。 這也是 先動(dòng)優(yōu)勢 的一種體現(xiàn)。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 4. 貼現(xiàn)率還可以理解為討價(jià)還價(jià)的一種成本,類似蛋糕隨時(shí)間的推延而不斷縮小,每一論討價(jià)還價(jià)的總成本與剩余的蛋糕成比例。Control Science and Engineering, HUST All Rights Reserved, 2007, Luo Yunfeng 討價(jià)還價(jià)的成本可以分為兩類:固定成本和變動(dòng)成本。貼現(xiàn)率可以認(rèn)為是變動(dòng)成本,參與人每出一次價(jià),蛋糕都要按一定比例(貼現(xiàn)率)縮小。Control Science and Engi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 風(fēng)景名勝區(qū)自行車租借協(xié)議
- 建筑安裝工程承包合作協(xié)議
- 廣告委托制作協(xié)議書
- 民間借款協(xié)議書的格式要求
- 私車出租給機(jī)構(gòu)協(xié)議
- 2024年加盟經(jīng)銷合同范本
- 建筑工程勞務(wù)擴(kuò)大分包合同完整2024年
- 2024正規(guī)版私人借款合同樣本
- 吉林省農(nóng)業(yè)產(chǎn)品訂購協(xié)議
- 房產(chǎn)物業(yè)抵押借款協(xié)議
- 人工智能在文化傳承與遺產(chǎn)保護(hù)中的價(jià)值實(shí)現(xiàn)
- 2024年汽修廠開業(yè)計(jì)劃書
- ISTA標(biāo)準(zhǔn)-2A、2B、2C系列解讀(圖文)
- 日間手術(shù)應(yīng)急預(yù)案方案
- 退費(fèi)賬戶確認(rèn)書
- 幼兒園小班《汽車滴滴響》
- 杭州娃哈哈精密機(jī)械有限公司新增年產(chǎn)40000臺(tái)展示冰柜產(chǎn)品生產(chǎn)線的技術(shù)改造項(xiàng)目環(huán)境影響報(bào)告
- 安徽省示范高中培優(yōu)聯(lián)盟2023-2024學(xué)年高一上學(xué)期冬季聯(lián)賽數(shù)學(xué)試題(含答案)
- 聲母h教學(xué)課件-副本
- 印度尼西亞概況
- 變應(yīng)性支氣管肺曲霉病診治專家-共識(2022年修訂版)解讀
評論
0/150
提交評論