第四章重復(fù)博弈課件_第1頁
第四章重復(fù)博弈課件_第2頁
第四章重復(fù)博弈課件_第3頁
第四章重復(fù)博弈課件_第4頁
第四章重復(fù)博弈課件_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章 重復(fù)博弈1重復(fù)博弈:基本博弈重復(fù)進(jìn)行重復(fù)博弈中博弈方的行為和博弈結(jié)果不一定是基本博弈的簡單重復(fù)必須把整個(gè)重復(fù)博弈過程作為整體進(jìn)行研究。本章分三節(jié)重復(fù)博弈引論有限次重復(fù)博弈無限次重復(fù)博弈已知概率的隨機(jī)停止重復(fù)博弈24.1重復(fù)博弈引論3為何研究重復(fù)博弈基本概念4.1.1為何研究重復(fù)博弈普遍存在性:經(jīng)濟(jì)中的長期關(guān)系與一次性博弈的差異:未來利益對當(dāng)前行為的制約與動(dòng)態(tài)博弈的差異:各階段有獨(dú)立的選擇和利益短期關(guān)系中缺乏形

成某種默契或合作

關(guān)系,或通過報(bào)復(fù)、制裁的威脅,約束

相互行為,追求共

同利益的機(jī)會(huì)44

.1有.2限基次重本復(fù)概博弈念:給定一個(gè)基本博弈G(可以是靜態(tài)博弈,也可以是動(dòng)態(tài)博弈),重復(fù)進(jìn)行T次G,并且在每次重復(fù)G之前各博弈方都能觀察到以前博弈的結(jié)果,這樣的博弈過程稱為“G的T次重復(fù)博弈”,記為G(T)。而G則稱為G(T)的“原博弈”。G(T)中的每次重復(fù)稱為G(T)的一個(gè)“階段

”。無限次重復(fù)博弈:一個(gè)基本博弈G一直重復(fù)進(jìn)行下去的博弈,記為G(

)—沒有可以預(yù)見的結(jié)束時(shí)間,主觀上認(rèn)為會(huì)不斷進(jìn)行策略:博弈方在每個(gè)階段針對每種情況如何行為的計(jì)劃子博弈:從某個(gè)階段(不包括第一階段)開始,包括此后所有的重復(fù)博弈部分均衡路徑:由每個(gè)階段博弈方的行為組合串聯(lián)而成5重復(fù)博弈的得益若重復(fù)次數(shù)較少,或每次重復(fù)時(shí)間間隔短6隨機(jī)停止和貼現(xiàn)率

隨機(jī)結(jié)束重復(fù)博弈:停止重復(fù)概率p,重復(fù)下去概率1-p。其設(shè)中某,博弈方第t階段得益為πt,利率為γ,則該博弈方

期望得益的現(xiàn)在值為:74.2有限次重復(fù)博弈8兩人零和博弈的有限次重復(fù)博弈唯一純策略納什均衡博弈 的有限次重復(fù)博弈多個(gè)純策略納什均衡博弈 的有限次重復(fù)博弈有限次重復(fù)博弈的民間定理4.2.1兩人零和博弈的有限次重復(fù)博弈9零和博弈是嚴(yán)格競爭的,重復(fù)博弈并不改變這一點(diǎn)。以零和博弈為原博弈的有限次重復(fù)博弈與猜硬幣博弈的有限次重復(fù)博弈一樣,博弈方的正確策略是重復(fù)一次性博弈中的納什均衡策略。上述結(jié)論可推廣到非零和或多個(gè)博弈方,沒有純策略納什均衡的嚴(yán)格競爭博弈中。4.2.2唯一純策略納什均衡博弈的有限次重復(fù)博弈10定理:設(shè)原博弈G有唯一的純策略納什均衡,則對任意整數(shù)T,重復(fù)博弈

G(T)有唯 一的子博弈完美納什均衡,即各博弈方每個(gè)階段都采用G的納什均衡策略。各博弈方在G(T)中的總得益為在G中得益的T倍,平均得益等于原博弈G的得益。-5,-50,-8-8,0-1,-1坦白不坦白囚徒2坦白不坦白囚徒1(-5,-5)囚徒2坦

白 不坦白-10,-10-5,-13-13,-5-6,-6坦白不坦白囚徒1(-10,-10)有限次重復(fù)削價(jià)競爭博弈100,10020,150150,2070,70高

價(jià)低

價(jià)高價(jià)低價(jià)寡頭2寡頭1削價(jià)競爭博弈有唯一純策略納什均衡(70,70)11有限次重復(fù)的結(jié)果仍然是(低價(jià),低價(jià))上述結(jié)論對有限次古諾模型重復(fù)博弈也成立。重復(fù)囚徒困境悖論和連鎖店悖論(-2,3)

(5,5)癥結(jié):較多階段的動(dòng)態(tài)博弈中逆推歸納法的適用性B不進(jìn)重復(fù)囚徒困境博弈結(jié)果與直覺經(jīng)驗(yàn)和大量實(shí)驗(yàn)結(jié)果不一致;進(jìn)(1,10A不打擊12塞爾頓(1978)提出”連鎖店悖論”打擊4.2.3多個(gè)純策略納什均衡博弈的有限次重復(fù)博弈5,50,60,26,03,30,22,02,01,1HH

ML廠商2ML廠商1三價(jià)博弈8,81,71,37,14,41,33,13,12,2廠商1廠商2MH

MLHL兩次重復(fù)三價(jià)博弈的等價(jià)模型觸發(fā)策略:兩博弈方先試探合作,一旦發(fā)現(xiàn)對方不合作則也用不合作報(bào)復(fù)博弈方1:第一次選H;如第一次結(jié)果為(H,H),則第二次選M,否則選L博弈方2:同博弈方1子博弈完美納什均衡路徑:第一階段(H,H),第二階段(M,M)可以運(yùn)用觸發(fā)策略實(shí)現(xiàn)較好的結(jié)果13觸發(fā)策略的進(jìn)一步討論觸發(fā)策略存在報(bào)復(fù)機(jī)制的可信性問題如果第一階段一方偏離H,另一方第二階段采用報(bào)復(fù)性的L策略是不可信的。觸發(fā)策略在不少情況是非??尚诺?,83,93,59,36,63,55,35,34,4廠商1廠商2MH

MLHL重復(fù)三價(jià)博弈的等價(jià)博弈:不可信報(bào)復(fù)觸發(fā)策略不可信,因此

不管第一階段結(jié)果如何,第二階段都是(M,M)第一階段得益矩陣14兩市場博弈的重復(fù)博弈(重復(fù)兩次)3,31,44,10,0廠商1廠商2A

BAB沒有運(yùn)用觸發(fā)策略的條件(或機(jī)會(huì))兩市場博弈(A,B)+(A,B)

OR

(B,A)+(B,A)——(1,4)(4,1)連續(xù)兩次采用混合策略——(2,2)(A,B)+(B,A)

OR

(B,A)+(A,B)——(2.5,2.5)輪換策略一次純策略+一次混合策略——(1.5,3)(3,1.5)策略與平均得益觸發(fā)策略不是普遍存在的15重復(fù)博弈不同策略、均衡及一次性博弈得益比較不同策略組合、均衡得益圖示廠商2得益(1,4)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)廠商1得益(1.5,3)平均效率和公平性較好的均衡結(jié)果16兩市場博弈的重復(fù)博弈(重復(fù)三次或以上)三次及以上存在觸發(fā)策略運(yùn)用的條件觸發(fā)策略廠商1

第一階段選A;若第一階段結(jié)果為(A,A),則第二階段選A,若第一階段為(A,B),則第二階段選B,第三階段無條件選B廠商2

第一階段選A;第二階段無條件選B,若第一階段結(jié)果為(A,A),則第三階段選A,若第一階段為(B,A),則第三階段選B觸發(fā)策略有很強(qiáng)的可信性,是子博弈完美納什均衡,雙方每階段平均得益:(3+1+4)/3=2.67均衡路徑(A,A)

(A,B)

(B,A)174.2.4有限次重復(fù)博弈的民間定理個(gè)體理性得益:不管其它博弈方的行為如何,一博弈方在某個(gè)博弈中只要自己采取某種特定的策略,最低限度保證能獲得的得益可實(shí)現(xiàn)得益:博弈中所有純策略組合得益的加權(quán)平均數(shù)組定理:設(shè)原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于w,那么在該博弈的多次重復(fù)中所有不小于個(gè)體理性得益的可實(shí)現(xiàn)得益,都至少有一個(gè)子博弈完美納什均衡的極限的平均得益來實(shí)現(xiàn)它們廠商2得益廠商1得益(1,4)(3,3)(1,(4,1)w=(1.1)1)18其中w為一次性博弈中各方最差均衡得益數(shù)組4.3無限次重復(fù)博弈19兩人零和博弈的無限次重復(fù)博弈唯一純策略納什均衡博弈 的無限次重復(fù)博弈無限次重復(fù)古諾模型有效工資率4.3.1兩人零和博弈的無限次重復(fù)博弈兩人零和博弈無限次重復(fù)的所有階段都不可能發(fā)生合作,博弈方會(huì)一直重復(fù)原博弈的混合策略納什均衡上述結(jié)論可以推廣到更多博弈方、非零和嚴(yán)格競爭的無限次重復(fù)博弈不存在合作的潛在利益204.3.2唯一純策略納什均衡博弈的無限次重復(fù)博弈21兩寡頭削價(jià)競爭博弈4,40,55,01,1HL該博弈一次性博弈均衡是都采用低價(jià),是囚徒困境型博弈HL無限次重復(fù)兩寡頭削價(jià)博弈觸發(fā)策略:第一階段采用H,如果前t-1階段的結(jié)果都是(H,H),則繼續(xù)采用H,否則采用L。如果博弈方2采用L,總得益現(xiàn)值為如果博弈方2采用H,總得益現(xiàn)值為因此當(dāng) 時(shí),此觸發(fā)策略為納什均衡策略22兩寡頭削價(jià)競爭無限次重復(fù)博弈的民間定理廠商2得益(0,5)(1,4)(4,4)(4,1)(1,1)(5,0)廠商1得益234.3.3無限次重復(fù)古諾模型假定: ,邊際成本都為2。在無限次重復(fù)古諾模型中,當(dāng)貼現(xiàn)率滿足一定條件時(shí),兩廠商采用下列觸發(fā)策略構(gòu)成一個(gè)子博弈完美納什均衡:在第一階段生產(chǎn)壟斷產(chǎn)量的一半1.5;在第t階段,如果前t-1階段結(jié)果都是(1.5,1.5),則繼續(xù)生產(chǎn)1.5,否則生產(chǎn)古諾產(chǎn)量2。24設(shè)廠商1已采用該觸發(fā)策略,若廠商2也采用該觸發(fā)策略,則每期得益4.5,無限次重復(fù)博弈總得益的現(xiàn)值為:如果廠商2偏離上述觸發(fā)策略,則他在第一階段所選產(chǎn)量應(yīng)為給定廠商1產(chǎn)量為1.5時(shí),自己的最大利潤產(chǎn)量,即滿足:解得 ,此時(shí)利潤為5.0625,高于觸發(fā)策略第一階段得益4.5。25但從第二階段開始,廠商1將報(bào)復(fù)性地永遠(yuǎn)采用古諾產(chǎn)量2,這樣廠商2也被迫永遠(yuǎn)采用古諾產(chǎn)量,從此得利潤4。因此,無限次重復(fù)博弈第一階段偏離的情況下總得益的現(xiàn)值為:當(dāng)上述策略是廠商2對廠商1的同樣觸發(fā)策略的最佳反應(yīng),否則偏離是最佳反應(yīng)。26低水平的合作δ<9/17時(shí),可構(gòu)造如下觸發(fā)策略:第一階段生產(chǎn)q*(qm/2<q*<qc),第t階段,如果前t-1階段的結(jié)果都是(q*,q*),則繼續(xù)生產(chǎn)q*,否則生產(chǎn)古諾產(chǎn)量qc。設(shè)廠商1已采用該觸發(fā)策略,則廠商2期望得益采用觸發(fā)策略:π*/(1-δ)第一階段偏離:此時(shí)廠商2最優(yōu)產(chǎn)量q2=(6-q*)/2,得益

πd=(6-q*)2/4,無限次博弈得益現(xiàn)值為27低水平的合作只有當(dāng)廠商2才愿意采用觸發(fā)策略,否則肯定會(huì)偏離。即只有當(dāng)

q*≥2(9-5δ)/(9-δ)時(shí),觸發(fā)策略是穩(wěn)定的。結(jié)論:δ越大,能支持越低的子博弈完美納什均衡產(chǎn)量q*δ接近0時(shí),q*接近古諾產(chǎn)量20<δ<9/17時(shí),qm/2<q*<qc因此,通貨膨脹越嚴(yán)重的國家,企業(yè)在經(jīng)濟(jì)活動(dòng)中的短期行為更嚴(yán)重。28加大懲罰力度提高合作水平29構(gòu)造如下觸發(fā)策略:第一階段生產(chǎn)壟斷產(chǎn)量的一半qm/2 ;在第

t 階段,如果前

t-1 階段結(jié)果都是(qm/2,

qm/2),則繼續(xù)生產(chǎn)qm/2,如果第t 階段結(jié)果為(x,x),也生產(chǎn)qm/2,否則生產(chǎn)x。其中x>

qc,待定懲罰性產(chǎn)量可以證明對給定的貼現(xiàn)值δ,只要懲罰力度x足夠大,上述觸發(fā)策略為子博弈完美納什均衡。4.3.4有效工資率模型設(shè)定:首先廠商選擇工資率為,然后工人選擇接受或拒絕。如果拒絕,則他作個(gè)體戶得到收入 小于,如果接)還是偷懶(無受 ,則工人選擇努力工作(負(fù)效用負(fù)效用)。廠商只能看到產(chǎn)量高低,高產(chǎn)量為,低產(chǎn)量0。工人努力工作時(shí)一定是高產(chǎn)量 ,不努力時(shí)卻并不一定是0,而是高產(chǎn)量 的概率為 ,低產(chǎn)量0的概率為。工人努力工作時(shí),廠商得益為工人偷懶時(shí),廠商期望得益為,工人得益為,工人得益為;。30考慮如下的觸發(fā)策略:廠商在第一階段給工資率面t-1階段結(jié)果都是從此永遠(yuǎn)是

。工人的策略是如果,在第t階段,如果前則繼續(xù)給 ,否則則接受,否則寧愿作個(gè)體戶得到 ,并在以前各期結(jié)果都是和當(dāng)前工資率為 時(shí)努力工作,否則偷懶。設(shè)廠商已采用上述觸發(fā)策略。由于,工人記工人努力工作時(shí)無限次接受工作是最佳反應(yīng)。用重復(fù)博弈得益的現(xiàn)值,則即31用記工人選偷懶時(shí)無限重復(fù)博弈得益的現(xiàn)值,則:或因此當(dāng)即時(shí),努力是工人的最佳選擇?;狙a(bǔ)償32升水反過來,設(shè)工人已

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論