重復(fù)博弈同樣結(jié)構(gòu)的博弈重復(fù)多次課件

上傳人：2*** IP屬地：貴州上傳時(shí)間：2022-12-02 格式：PPTX 頁數(shù)：24 大小：346.26KB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩19頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一節(jié)概述一、含義1.含義：同樣結(jié)構(gòu)的博弈重復(fù)多次，其中的每次博弈稱為“階段博弈”（stagegame）階段博弈既可以是靜態(tài)博弈，也可以是動(dòng)態(tài)博弈?！巴瑯咏Y(jié)構(gòu)”的博弈是指相同的局中人集合、相同的可行行為空間或策略空間、相同的效用函數(shù)。若在每一階段博弈的末期，局中人的行為可被觀察到，那么局中人就有可能在對(duì)手過去行為的基礎(chǔ)上，在下一階段博弈采取相應(yīng)的策略，由此可能導(dǎo)致的均衡結(jié)局與一次博弈的均衡不同。2.重復(fù)博弈與序貫博弈的區(qū)別（123）

“序貫博弈”（se-quentialgame）:參與人在前一個(gè)階段的行動(dòng)選擇決定隨后的子博弈的結(jié)構(gòu);從后一個(gè)決策結(jié)開始的子博弈不同于從前一個(gè)決策結(jié)開始的子博弈，也即是，同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次。重復(fù)博弈則是同樣結(jié)構(gòu)的博弈重復(fù)多次。重復(fù)博弈分為有限次重復(fù)博弈和無限次重復(fù)博弈。3.重復(fù)博弈的基本特征：（1)階段博弈之間沒有“物質(zhì)上”的聯(lián)系（nophysicallinks)，也就是說，前一階段的博弈不改變后一階段博弈的結(jié)構(gòu)（對(duì)比之下，序貫博弈涉及物質(zhì)上的聯(lián)系）；（2)所有參與人都觀測(cè)到博弈過去的歷史（如在每一個(gè)新的階段博弈，兩個(gè)囚徒都知道同伙在過去的每次博弈中選擇了抵賴還是坦白）；（3）參與人的總支付是所有階段博弈支付的貼現(xiàn)值之和或加權(quán)平均值。由于其他參與人過去行動(dòng)的歷史是觀測(cè)得到的，一個(gè)參與人可以使自己在某個(gè)階段博弈的選擇依賴于其他參與人過去的行動(dòng)歷史，因此，參與人在重復(fù)博弈中的戰(zhàn)略空間遠(yuǎn)遠(yuǎn)大于且復(fù)雜于在每一個(gè)階段博弈中的戰(zhàn)略空間，從而使重復(fù)博弈可能帶來一些“額外的”均衡結(jié)果，這些均衡結(jié)果在一次博弈中是從來不會(huì)出現(xiàn)的。這正是分析重復(fù)博弈的意義所在。4.影響重復(fù)博弈均衡結(jié)果的主要因素是:博弈重復(fù)的次數(shù)和信息的完備性（com-pleteness)。重復(fù)次數(shù)的重要性：來自于參與人在短期利益和長遠(yuǎn)利益之間的權(quán)衡。當(dāng)博弈只進(jìn)行一次時(shí)，每個(gè)參與人只關(guān)心一次性的支付；但如果博弈重復(fù)多次，參與人可能會(huì)為了長遠(yuǎn)利益而犧牲眼前利益從而選擇不同的均衡戰(zhàn)略。

信息的完備性的重要性：當(dāng)一個(gè)參與人的支付函數(shù)（特征）不為其他參與人所知時(shí)，該參與人可能有積極性建立一個(gè)“好”的聲譽(yù)（reputation）以換取長遠(yuǎn)利益。本節(jié)我們只討論重復(fù)次數(shù)對(duì)均衡結(jié)果的影響，有關(guān)信息的完備性的影響將在不完全信息動(dòng)態(tài)博弈部分討論。二、幾個(gè)基本概念1.重復(fù)博弈的策略、子博弈和均衡路徑在重復(fù)博弈中，博弈方的一個(gè)策略就是在每一階段（即每次重復(fù)）針對(duì)每種情況（以前階段的結(jié)果）如何行動(dòng)的計(jì)劃。重復(fù)博弈的子博弈是從某個(gè)階段（不包括第一階段）開始，包括此后所有階段的重復(fù)博弈部分。動(dòng)態(tài)博弈中各博弈方的策略組合對(duì)應(yīng)一條路徑，均衡策略組合對(duì)應(yīng)一條均衡路徑，這些路徑由各個(gè)階段輪到行動(dòng)的博弈方的行為依次連接而成。重復(fù)博弈的路徑即是由每個(gè)階段博弈方的行為組合串聯(lián)而成的。2.重復(fù)博弈博弈方的得益：要考慮整個(gè)重復(fù)博弈過程得益的總體情況。當(dāng)重復(fù)次數(shù)較多，每次重復(fù)間隔時(shí)間又較長時(shí)，需考慮得益的時(shí)間先后。一般是將每一階段的得益折算成當(dāng)前階段的得益（即現(xiàn)在值）的貼現(xiàn)值。貼現(xiàn)系數(shù)δ=1/（1+γ），γ為以一階段為期限的市場(chǎng)利率。方法1：計(jì)算重復(fù)博弈的“總得益”，即博弈方各次重復(fù)博弈的得益的總和；方法2：計(jì)算重復(fù)博弈各階段的“平均得益”

第二節(jié)有限次重復(fù)博弈一、有限次重復(fù)博弈的含義定理：給定一個(gè)基本博弈G（可以是靜態(tài)博弈，也可以是動(dòng)態(tài)博弈），重復(fù)進(jìn)行T次，且在每次重復(fù)G之前各博弈方都能觀測(cè)到以前博弈的結(jié)果，這樣的博弈過程稱為“G的T次重復(fù)博弈”，記為G（T），G稱為G（T）的原博弈或階段博弈，G（T）中的每次重復(fù)稱為G（T）的一個(gè)“階段”。

二、有限次重復(fù)博弈類型1.兩人零和博弈的有限次重復(fù)博弈博弈方的最佳策略都是每一次博弈都重復(fù)原博弈的混合策略NE策略。2.存在唯一純策略NE博弈的有限次重復(fù)博弈例：有限次重復(fù)的囚徒困境博弈有限次重復(fù)削價(jià)競(jìng)爭(zhēng)博弈連鎖店悖論（澤爾騰1978年提出）（124）定理：設(shè)G是階段博弈，G(T)是G重復(fù)T次的重復(fù)博弈（T<∞），那么，如果G有唯一的NE，則重復(fù)博弈G(T)的唯一子博弈精煉NE結(jié)果是階段博弈G的NE重復(fù)T次，即每個(gè)階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果。3.存在多個(gè)純策略NE博弈的有限次重復(fù)博弈（1）存在兩個(gè)純戰(zhàn)略納什均衡的有限次重復(fù)博弈（課本）三價(jià)博弈設(shè)一市場(chǎng)有兩個(gè)生產(chǎn)同質(zhì)產(chǎn)品的廠商，他們對(duì)產(chǎn)品的定價(jià)有高、中、低三種可能。

設(shè)高價(jià)時(shí)市場(chǎng)總利潤為10單位中價(jià)時(shí)市場(chǎng)總利潤為6單位低價(jià)時(shí)市場(chǎng)總利潤為2單位。再假設(shè)兩廠商同時(shí)決定價(jià)格，價(jià)格不等時(shí)價(jià)格低者獨(dú)享利潤，價(jià)格相等時(shí)雙方平分利潤。由此，兩廠商對(duì)價(jià)格的選擇就構(gòu)成了一個(gè)靜態(tài)博弈問題。原博弈有兩個(gè)純策略NE：（M,M），(L,L)一次博弈結(jié)果不會(huì)出現(xiàn)效率最高的（H,H）在兩次博弈中，則存在第一階段采用（H,H）的SPNE。雙方策略：對(duì)廠商1，第一次選擇H；若第一次結(jié)果為（H,H），則第二次選擇M;若第一次結(jié)果為其他，則第二次選擇L。廠商2的選擇同廠商1。在上述雙方策略組合下，兩次重復(fù)博弈的路徑為：第一階段選擇（H,H），第二階段選擇（M,M），這是一個(gè)SPNE路徑。若重復(fù)N次，結(jié)論也相似，SPNE路徑是：每次都選擇（H,H），最后一次選擇原博弈的NE（M,M）。

觸發(fā)機(jī)制：首先試探合作，一旦發(fā)覺對(duì)方不合作，也用不合作相報(bào)復(fù)。觸發(fā)機(jī)制是重復(fù)博弈中實(shí)現(xiàn)合作和提高均衡效率的關(guān)鍵機(jī)制。第三節(jié)無限次重復(fù)博弈與有限次重復(fù)博弈相比：一是是否存在最后一次博弈：對(duì)有限次重復(fù)博弈，存在最后一次重復(fù)是破壞重復(fù)博弈中博弈方和行為的相互制約關(guān)系，使重復(fù)博弈無法實(shí)現(xiàn)更高效率均衡的關(guān)鍵問題。二是無限次重復(fù)博弈必須考慮得益的貼現(xiàn)問題，將每一期的得益折算成現(xiàn)值。對(duì)博弈方行為選擇和博弈均衡的分析必須以平均得益或總得益的現(xiàn)值為根據(jù)。三是觸發(fā)機(jī)制也是無限次重復(fù)博弈實(shí)現(xiàn)理想均衡的關(guān)鍵。一、兩人零和博弈的無限次重復(fù)博弈在這種無限次重復(fù)博弈中，博弈方仍是每次都采用原博弈的混合策略NE。二、存在唯一純策略NE博弈的無限次重復(fù)博弈如囚徒困境(課本)觸發(fā)機(jī)制：第一階段采取抵賴，在第t階段，如果前t-1階段的結(jié)果都是（抵賴，抵賴），則繼續(xù)采取抵賴；否則，采取坦白。可以證明，當(dāng)δ足夠大時(shí)，雙方采用上述觸發(fā)機(jī)制構(gòu)成一個(gè)無限次重復(fù)博弈的SPNE。三、無限次重復(fù)古諾模型四、無限次重復(fù)博弈的無名氏定理無名氏定理（Friedman，1971）：令G為一個(gè)n人階段博弈，G(∞,δ)為以G為階段博弈的無限次重復(fù)博弈，a*是一個(gè)NE（純戰(zhàn)略或混合戰(zhàn)略），e=(e1,e2,….en)是a*決定的支付向量，U=(u1,u2,…un)是一個(gè)任意可行的支付向量，V是可行支付向量集合。那么，對(duì)于任何滿足ui>ei的u∈V(對(duì)任意i）,存在一個(gè)貼現(xiàn)因子δ(*)<1，使得對(duì)于所有的δ≥δ(*)，v=(v1,v2,,….v

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

重復(fù)博弈同樣結(jié)構(gòu)的博弈重復(fù)多次課件

文檔簡介

溫馨提示

最新文檔

評(píng)論

重復(fù)博弈同樣結(jié)構(gòu)的博弈重復(fù)多次課件

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔