第四章重復(fù)博弈課件

上傳人：1*** IP屬地：江蘇上傳時(shí)間：2023-10-21 格式：PPTX 頁(yè)數(shù)：34 大小：1.65MB 積分：6 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩29頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章重復(fù)博弈1重復(fù)博弈：基本博弈重復(fù)進(jìn)行重復(fù)博弈中博弈方的行為和博弈結(jié)果不一定是基本博弈的簡(jiǎn)單重復(fù)必須把整個(gè)重復(fù)博弈過(guò)程作為整體進(jìn)行研究。本章分三節(jié)重復(fù)博弈引論有限次重復(fù)博弈無(wú)限次重復(fù)博弈已知概率的隨機(jī)停止重復(fù)博弈24.1重復(fù)博弈引論3為何研究重復(fù)博弈基本概念4.1.1為何研究重復(fù)博弈普遍存在性：經(jīng)濟(jì)中的長(zhǎng)期關(guān)系與一次性博弈的差異：未來(lái)利益對(duì)當(dāng)前行為的制約與動(dòng)態(tài)博弈的差異：各階段有獨(dú)立的選擇和利益短期關(guān)系中缺乏形

成某種默契或合作

關(guān)系，或通過(guò)報(bào)復(fù)、制裁的威脅，約束

相互行為，追求共

同利益的機(jī)會(huì)44

.1有.2限基次重本復(fù)概博弈念：給定一個(gè)基本博弈G（可以是靜態(tài)博弈，也可以是動(dòng)態(tài)博弈），重復(fù)進(jìn)行T次G，并且在每次重復(fù)G之前各博弈方都能觀察到以前博弈的結(jié)果，這樣的博弈過(guò)程稱為“G的T次重復(fù)博弈”，記為G(T)。而G則稱為G(T)的“原博弈”。G(T)中的每次重復(fù)稱為G(T)的一個(gè)“階段

”。無(wú)限次重復(fù)博弈：一個(gè)基本博弈G一直重復(fù)進(jìn)行下去的博弈，記為G(

)—沒(méi)有可以預(yù)見(jiàn)的結(jié)束時(shí)間，主觀上認(rèn)為會(huì)不斷進(jìn)行策略：博弈方在每個(gè)階段針對(duì)每種情況如何行為的計(jì)劃子博弈：從某個(gè)階段（不包括第一階段）開(kāi)始，包括此后所有的重復(fù)博弈部分均衡路徑：由每個(gè)階段博弈方的行為組合串聯(lián)而成5重復(fù)博弈的得益若重復(fù)次數(shù)較少，或每次重復(fù)時(shí)間間隔短6隨機(jī)停止和貼現(xiàn)率

隨機(jī)結(jié)束重復(fù)博弈：停止重復(fù)概率p，重復(fù)下去概率1-p。其設(shè)中某，博弈方第t階段得益為πt，利率為γ，則該博弈方

期望得益的現(xiàn)在值為：74.2有限次重復(fù)博弈8兩人零和博弈的有限次重復(fù)博弈唯一純策略納什均衡博弈的有限次重復(fù)博弈多個(gè)純策略納什均衡博弈的有限次重復(fù)博弈有限次重復(fù)博弈的民間定理4.2.1兩人零和博弈的有限次重復(fù)博弈9零和博弈是嚴(yán)格競(jìng)爭(zhēng)的，重復(fù)博弈并不改變這一點(diǎn)。以零和博弈為原博弈的有限次重復(fù)博弈與猜硬幣博弈的有限次重復(fù)博弈一樣，博弈方的正確策略是重復(fù)一次性博弈中的納什均衡策略。上述結(jié)論可推廣到非零和或多個(gè)博弈方，沒(méi)有純策略納什均衡的嚴(yán)格競(jìng)爭(zhēng)博弈中。4.2.2唯一純策略納什均衡博弈的有限次重復(fù)博弈10定理：設(shè)原博弈G有唯一的純策略納什均衡,則對(duì)任意整數(shù)T，重復(fù)博弈

G(T)有唯一的子博弈完美納什均衡，即各博弈方每個(gè)階段都采用G的納什均衡策略。各博弈方在G(T)中的總得益為在G中得益的T倍，平均得益等于原博弈G的得益。-5，-50，-8-8，0-1，-1坦白不坦白囚徒2坦白不坦白囚徒1（-5，-5）囚徒2坦

白不坦白-10，-10-5，-13-13，-5-6，-6坦白不坦白囚徒1（-10，-10）有限次重復(fù)削價(jià)競(jìng)爭(zhēng)博弈100，10020，150150，2070，70高

價(jià)低

價(jià)高價(jià)低價(jià)寡頭2寡頭1削價(jià)競(jìng)爭(zhēng)博弈有唯一純策略納什均衡（70，70）11有限次重復(fù)的結(jié)果仍然是（低價(jià)，低價(jià)）上述結(jié)論對(duì)有限次古諾模型重復(fù)博弈也成立。重復(fù)囚徒困境悖論和連鎖店悖論（-2，3）

（5，5）癥結(jié)：較多階段的動(dòng)態(tài)博弈中逆推歸納法的適用性B不進(jìn)重復(fù)囚徒困境博弈結(jié)果與直覺(jué)經(jīng)驗(yàn)和大量實(shí)驗(yàn)結(jié)果不一致；進(jìn)（1，10A不打擊12塞爾頓(1978)提出”連鎖店悖論”打擊4.2.3多個(gè)純策略納什均衡博弈的有限次重復(fù)博弈5，50，60，26，03，30，22，02，01，1HH

ML廠商2ML廠商1三價(jià)博弈8，81，71，37，14，41，33，13，12，2廠商1廠商2MH

MLHL兩次重復(fù)三價(jià)博弈的等價(jià)模型觸發(fā)策略：兩博弈方先試探合作，一旦發(fā)現(xiàn)對(duì)方不合作則也用不合作報(bào)復(fù)博弈方1：第一次選H；如第一次結(jié)果為(H,H)，則第二次選M，否則選L博弈方2：同博弈方1子博弈完美納什均衡路徑：第一階段(H,H)，第二階段(M,M)可以運(yùn)用觸發(fā)策略實(shí)現(xiàn)較好的結(jié)果13觸發(fā)策略的進(jìn)一步討論觸發(fā)策略存在報(bào)復(fù)機(jī)制的可信性問(wèn)題如果第一階段一方偏離H，另一方第二階段采用報(bào)復(fù)性的L策略是不可信的。觸發(fā)策略在不少情況是非?？尚诺?，83，93，59，36，63，55，35，34，4廠商1廠商2MH

MLHL重復(fù)三價(jià)博弈的等價(jià)博弈：不可信報(bào)復(fù)觸發(fā)策略不可信，因此

不管第一階段結(jié)果如何，第二階段都是(M,M)第一階段得益矩陣14兩市場(chǎng)博弈的重復(fù)博弈（重復(fù)兩次）3，31，44，10，0廠商1廠商2A

BAB沒(méi)有運(yùn)用觸發(fā)策略的條件（或機(jī)會(huì)）兩市場(chǎng)博弈(A,B)+(A,B)

(B,A)+(B,A)——(1,4)(4,1)連續(xù)兩次采用混合策略——(2,2)(A,B)+(B,A)

(B,A)+(A,B)——(2.5,2.5)輪換策略一次純策略+一次混合策略——(1.5,3)(3,1.5)策略與平均得益觸發(fā)策略不是普遍存在的15重復(fù)博弈不同策略、均衡及一次性博弈得益比較不同策略組合、均衡得益圖示廠商2得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)廠商1得益(1.5,3)平均效率和公平性較好的均衡結(jié)果16兩市場(chǎng)博弈的重復(fù)博弈（重復(fù)三次或以上）三次及以上存在觸發(fā)策略運(yùn)用的條件觸發(fā)策略廠商1

第一階段選A；若第一階段結(jié)果為(A,A),則第二階段選A,若第一階段為(A,B),則第二階段選B，第三階段無(wú)條件選B廠商2

第一階段選A；第二階段無(wú)條件選B,若第一階段結(jié)果為(A,A),則第三階段選A，若第一階段為(B,A),則第三階段選B觸發(fā)策略有很強(qiáng)的可信性，是子博弈完美納什均衡，雙方每階段平均得益:(3+1+4)/3=2.67均衡路徑(A,A)

(A,B)

(B,A)174.2.4有限次重復(fù)博弈的民間定理個(gè)體理性得益：不管其它博弈方的行為如何，一博弈方在某個(gè)博弈中只要自己采取某種特定的策略，最低限度保證能獲得的得益可實(shí)現(xiàn)得益：博弈中所有純策略組合得益的加權(quán)平均數(shù)組定理：設(shè)原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于w，那么在該博弈的多次重復(fù)中所有不小于個(gè)體理性得益的可實(shí)現(xiàn)得益，都至少有一個(gè)子博弈完美納什均衡的極限的平均得益來(lái)實(shí)現(xiàn)它們廠商2得益廠商1得益(1,4)(3,3)(1，(4,1)w=(1.1)1)18其中w為一次性博弈中各方最差均衡得益數(shù)組4.3無(wú)限次重復(fù)博弈19兩人零和博弈的無(wú)限次重復(fù)博弈唯一純策略納什均衡博弈的無(wú)限次重復(fù)博弈無(wú)限次重復(fù)古諾模型有效工資率4.3.1兩人零和博弈的無(wú)限次重復(fù)博弈兩人零和博弈無(wú)限次重復(fù)的所有階段都不可能發(fā)生合作，博弈方會(huì)一直重復(fù)原博弈的混合策略納什均衡上述結(jié)論可以推廣到更多博弈方、非零和嚴(yán)格競(jìng)爭(zhēng)的無(wú)限次重復(fù)博弈不存在合作的潛在利益204.3.2唯一純策略納什均衡博弈的無(wú)限次重復(fù)博弈21兩寡頭削價(jià)競(jìng)爭(zhēng)博弈4，40，55，01，1HL該博弈一次性博弈均衡是都采用低價(jià)，是囚徒困境型博弈HL無(wú)限次重復(fù)兩寡頭削價(jià)博弈觸發(fā)策略：第一階段采用H，如果前t-1階段的結(jié)果都是(H,H)，則繼續(xù)采用H，否則采用L。如果博弈方2采用L，總得益現(xiàn)值為如果博弈方2采用H，總得益現(xiàn)值為因此當(dāng) 時(shí)，此觸發(fā)策略為納什均衡策略22兩寡頭削價(jià)競(jìng)爭(zhēng)無(wú)限次重復(fù)博弈的民間定理廠商2得益(0,5)(1,4)(4,4)(4,1)(1,1)(5,0)廠商1得益234.3.3無(wú)限次重復(fù)古諾模型假定：，邊際成本都為2。在無(wú)限次重復(fù)古諾模型中，當(dāng)貼現(xiàn)率滿足一定條件時(shí)，兩廠商采用下列觸發(fā)策略構(gòu)成一個(gè)子博弈完美納什均衡：在第一階段生產(chǎn)壟斷產(chǎn)量的一半1.5；在第t階段，如果前t-1階段結(jié)果都是(1.5,1.5)，則繼續(xù)生產(chǎn)1.5，否則生產(chǎn)古諾產(chǎn)量2。24設(shè)廠商1已采用該觸發(fā)策略，若廠商2也采用該觸發(fā)策略，則每期得益4.5，無(wú)限次重復(fù)博弈總得益的現(xiàn)值為：如果廠商2偏離上述觸發(fā)策略，則他在第一階段所選產(chǎn)量應(yīng)為給定廠商1產(chǎn)量為1.5時(shí)，自己的最大利潤(rùn)產(chǎn)量，即滿足：解得，此時(shí)利潤(rùn)為5.0625，高于觸發(fā)策略第一階段得益4.5。25但從第二階段開(kāi)始，廠商1將報(bào)復(fù)性地永遠(yuǎn)采用古諾產(chǎn)量2，這樣廠商2也被迫永遠(yuǎn)采用古諾產(chǎn)量，從此得利潤(rùn)4。因此，無(wú)限次重復(fù)博弈第一階段偏離的情況下總得益的現(xiàn)值為：當(dāng)上述策略是廠商2對(duì)廠商1的同樣觸發(fā)策略的最佳反應(yīng)，否則偏離是最佳反應(yīng)。26低水平的合作δ<9/17時(shí)，可構(gòu)造如下觸發(fā)策略：第一階段生產(chǎn)q*(qm/2<q*<qc)，第t階段，如果前t-1階段的結(jié)果都是(q*,q*)，則繼續(xù)生產(chǎn)q*，否則生產(chǎn)古諾產(chǎn)量qc。設(shè)廠商1已采用該觸發(fā)策略，則廠商2期望得益采用觸發(fā)策略：π*/(1-δ)第一階段偏離：此時(shí)廠商2最優(yōu)產(chǎn)量q2=(6-q*)/2,得益

πd=(6-q*)2/4，無(wú)限次博弈得益現(xiàn)值為27低水平的合作只有當(dāng)廠商2才愿意采用觸發(fā)策略，否則肯定會(huì)偏離。即只有當(dāng)

q*≥2(9-5δ)/(9-δ)時(shí)，觸發(fā)策略是穩(wěn)定的。結(jié)論：δ越大，能支持越低的子博弈完美納什均衡產(chǎn)量q*δ接近0時(shí)，q*接近古諾產(chǎn)量20<δ<9/17時(shí)，qm/2<q*<qc因此，通貨膨脹越嚴(yán)重的國(guó)家，企業(yè)在經(jīng)濟(jì)活動(dòng)中的短期行為更嚴(yán)重。28加大懲罰力度提高合作水平29構(gòu)造如下觸發(fā)策略：第一階段生產(chǎn)壟斷產(chǎn)量的一半qm/2 ；在第

t 階段，如果前

t-1 階段結(jié)果都是(qm/2,

qm/2)，則繼續(xù)生產(chǎn)qm/2，如果第t 階段結(jié)果為(x,x)，也生產(chǎn)qm/2，否則生產(chǎn)x。其中x>

qc，待定懲罰性產(chǎn)量可以證明對(duì)給定的貼現(xiàn)值δ，只要懲罰力度x足夠大，上述觸發(fā)策略為子博弈完美納什均衡。4.3.4有效工資率模型設(shè)定：首先廠商選擇工資率為，然后工人選擇接受或拒絕。如果拒絕，則他作個(gè)體戶得到收入小于，如果接）還是偷懶（無(wú)受，則工人選擇努力工作（負(fù)效用負(fù)效用）。廠商只能看到產(chǎn)量高低，高產(chǎn)量為，低產(chǎn)量0。工人努力工作時(shí)一定是高產(chǎn)量，不努力時(shí)卻并不一定是0，而是高產(chǎn)量的概率為，低產(chǎn)量0的概率為。工人努力工作時(shí)，廠商得益為工人偷懶時(shí)，廠商期望得益為，工人得益為，工人得益為；。30考慮如下的觸發(fā)策略：廠商在第一階段給工資率面t-1階段結(jié)果都是從此永遠(yuǎn)是

。工人的策略是如果，在第t階段，如果前則繼續(xù)給，否則則接受，否則寧愿作個(gè)體戶得到，并在以前各期結(jié)果都是和當(dāng)前工資率為時(shí)努力工作，否則偷懶。設(shè)廠商已采用上述觸發(fā)策略。由于，工人記工人努力工作時(shí)無(wú)限次接受工作是最佳反應(yīng)。用重復(fù)博弈得益的現(xiàn)值，則即31用記工人選偷懶時(shí)無(wú)限重復(fù)博弈得益的現(xiàn)值，則：或因此當(dāng)即時(shí)，努力是工人的最佳選擇。基本補(bǔ)償32升水反過(guò)來(lái)，設(shè)工人已

人人文庫(kù)> 全部分類(lèi)> 圖紙下載 > 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第四章重復(fù)博弈課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第四章重復(fù)博弈課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔