博弈論重復(fù)博弈

上傳人：n*** IP屬地：廣東上傳時間：2021-10-10 格式：PPT 頁數(shù)：44 大?。?33.50KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩39頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、博弈論重復(fù)博弈第四章重復(fù)博弈本章介紹基本博弈重復(fù)進行構(gòu)成的重復(fù)博弈。雖然形式上是基本博弈的重復(fù)進行，但重復(fù)博弈中博弈方的行為和博弈結(jié)果卻不一定是基本博弈的簡單重復(fù)，因為博弈方對于博弈會重復(fù)進行的意識，會使他們對利益的判斷發(fā)生變化，從而使他們在重復(fù)博弈過程中的行為選擇受到影響。這意味著不能把重復(fù)博弈當(dāng)作基本博弈的簡單疊加，必須把整個重復(fù)博弈過程作為整體進行研究。博弈論重復(fù)博弈本章分三節(jié)4.1 重復(fù)博弈引論4.2 有限次重復(fù)博弈4.3 無限次重復(fù)博弈博弈論重復(fù)博弈4.1 重復(fù)博弈引論4.1.1 為何研究重復(fù)博弈4.1.2 基本概念博弈論重復(fù)博弈4.1.1 為何研究重復(fù)博弈n經(jīng)濟中的長期關(guān)系n人

2、們的預(yù)見性n未來利益對當(dāng)前行為的制約n長期合同、回頭客、長客和一次性買賣的區(qū)別n有無確定的結(jié)束時間博弈論重復(fù)博弈4.1.2 基本概念n有限次重復(fù)博弈有限次重復(fù)博弈：給定一個基本博弈G（可以是靜態(tài)博弈，也可以是動態(tài)博弈），重復(fù)進行T次G，并且在每次重復(fù)G之前各博弈方都能觀察到以前博弈的結(jié)果，這樣的博弈過程稱為“G的T次重復(fù)博弈”，記為G(T)。而G則稱為G(T)的“原博弈”。G(T)中的每次重復(fù)稱為G(T)的一個“階段”。n無限次重復(fù)博弈無限次重復(fù)博弈：一個基本博弈G一直重復(fù)博弈下去的博弈，記為G( )n策略策略：博弈方在每個階段針對每種情況如何行為的計劃n子博弈子博弈：從某個階段（不包括第一階

3、段）開始，包括此后所有的重復(fù)博弈部分n均衡路徑均衡路徑：由每個階段博弈方的行為組合串聯(lián)而成博弈論重復(fù)博弈重復(fù)博弈的得益的平均得益為相同的現(xiàn)在值，則稱得益序列階段的得益，能產(chǎn)生與無限次重復(fù)博弈）各個重復(fù)博弈或作為重復(fù)博弈（有限次：如果一常數(shù)，,2121平均得益11)1 (ttt慮貼現(xiàn)問題無限次重復(fù)博弈必須考考慮貼現(xiàn)因素有限次重復(fù)博弈不一定博弈論重復(fù)博弈4.2 有限次重復(fù)博弈4.2.1 兩人零和博弈的有限次重復(fù)博弈4.2.2唯一純策略納什均衡博弈的有限次重復(fù)博弈4.2.3多個純策略納什均衡博弈的有限次重復(fù)博弈4.2.4 有限次重復(fù)博弈的民間定理博弈論重復(fù)博弈4.2.1 兩人零和博弈的有限次重復(fù)

4、博弈n零和博弈是嚴(yán)格競爭的，重復(fù)博弈并不改變這一點。n以零和博弈為原博弈的有限次重復(fù)博弈與猜硬幣博弈的有限次重復(fù)博弈一樣，博弈方的正確策略是重復(fù)一次性博弈中的納什均衡策略。博弈論重復(fù)博弈4.2.2唯一純策略納什均衡博弈的有限次重復(fù)博弈n定理定理：設(shè)原博弈G有唯一的純策略納什均衡,則對任意整數(shù)T，重復(fù)博弈 G(T)有唯一的子博弈完美納什均衡，即各博弈方每個階段都采用G的納什均衡策略。各博弈方在G(T)中的總得益為在G中得益的T倍，平均得益的與原博弈G中的得益。-5，-50，-8-8，0-1，-1坦白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1（-5，-5）-10，-10-13，-5-5，-13-6

5、，-6坦白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1（-10，-10）博弈論重復(fù)博弈有限次重復(fù)削價競爭博弈100，10020，150150，2070，70高價低價高價低價寡頭寡頭2寡寡頭頭1削價競爭博弈有唯一純策略納什均衡（70，70）有限次重復(fù)的結(jié)果仍然是（低價，低價）博弈論重復(fù)博弈4.2.3多個純策略納什均衡博弈的有限次重復(fù)博弈5，53，32，00，22，06，00，20，61，1HMH廠商廠商2ML廠廠商商1L三價博弈2，23，13，11，34，47，11，31，78，8廠廠商商1廠商廠商2LMHHML兩次重復(fù)三價博弈的等價模型觸發(fā)策略觸發(fā)策略：兩博弈方先試探合作，一旦發(fā)現(xiàn)對方不合作則

6、也用不合作報復(fù)博弈方1：第一次選h；如第一次結(jié)果為(H,H)，則第二次選M，否則選L博弈方2：同博弈方1博弈論重復(fù)博弈兩市場博弈的重復(fù)博弈（重復(fù)兩次）n(A,B)+(A,B) OR (B,A)+(B,A)(1,4)(4,1)n連續(xù)兩次采用混合策略(2,2)n(A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)輪換策略n一次純策略+一次混合策略(1.5,3)(3,1.5)0，04，11，33，3廠廠商商1廠商廠商2BAAB兩市場博弈博弈論重復(fù)博弈重復(fù)博弈不同策略、均衡及一次性博弈得益比較n不同策略組合、均衡得益圖示廠商2得益廠商1得益(1,4)(3,3)(2.5,2.5)(2,

7、2)(3,1.5)(4,1)(1.5,3)博弈論重復(fù)博弈4.2.4 有限次重復(fù)博弈的民間定理n個體理性得益?zhèn)€體理性得益：不管其它博弈方的行為如何，一博弈方在某個博弈中只要自己采取某種特定的策略，最低限度保證能獲得的得益n可實現(xiàn)得益可實現(xiàn)得益：博弈中所有純策略組合得益的加權(quán)平均數(shù)組n定理定理：設(shè)原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于w，那么在該博弈的多次重復(fù)中所有不小于個體理性得益的可實現(xiàn)得益，都至少有一個子博弈完美納什均衡的極限的平均得益來實現(xiàn)它們廠商2得益廠商1得益(1,4)(3,3)(1，1)(4,1)w=(1.1)博弈論重復(fù)博弈4.3 無限次重復(fù)博弈n回顧上節(jié)內(nèi)容：重復(fù)博弈是一種特殊的動態(tài)

8、博弈，對應(yīng)現(xiàn)實中具有相對穩(wěn)定性的長期關(guān)系。因此必須考慮長期利益關(guān)系，所以博弈方的行為就可能表現(xiàn)出與一次性博棄不同的特點。重復(fù)博弈主要包括有限次重復(fù)博棄和無限次重復(fù)博弈，當(dāng)有限次重復(fù)博弈的重復(fù)次數(shù)較多或是無限次重復(fù)博弈時，必須考慮先后得到利益的價值差別。博弈論重復(fù)博弈4.3 無限次重復(fù)博弈n有限重復(fù)博弈中，對于無純策略納什均衡的原博弈來說，不可能產(chǎn)生比一次性博弈更理想的結(jié)果，因為原博弈各博弈方的利益是嚴(yán)格對立的。重復(fù)博弈不會改變這種利益關(guān)系。對于有惟一純策略納什均衡博棄的重復(fù)博弈來說，結(jié)論是在有限次重復(fù)博弈中結(jié)果也不會更理想，因為其子博弈完美納什均街是各博弈方在每次重復(fù)時都采用原博棄的納什均衡。

9、博弈論重復(fù)博弈4.3 無限次重復(fù)博弈n重復(fù)的囚徒困境悖論和連鎖店悖論（塞爾頓，1978）n前面討論的兩種情況的結(jié)果并不比一次性博弈結(jié)果更好。對于有多個純策略納什均衡博弈的重復(fù)博弈來說，有限次重復(fù)博弈有可能實現(xiàn)一次性博弈潛在的合作利益和提高博弈效率，有限次重復(fù)博弈的民間定理也進一步給出了更強的結(jié)論等。n觸發(fā)策略博弈論重復(fù)博弈4.3 無限次重復(fù)博弈n對于無限次重復(fù)博弈，兩人零和博弈、惟一純策略納什均衡博弈、以及其他問題的結(jié)果到底如何呢？n區(qū)別：根據(jù)我們對有限次重復(fù)博弈的分析可知，存在最后一次重復(fù)正是破壞重復(fù)博弈中博弈方利益和行為的相互制約關(guān)系，使重復(fù)博弈無法實現(xiàn)更高效率均衡的關(guān)鍵間題。因此無限次

10、重復(fù)博弈與有限次重復(fù)博弈的上述區(qū)別至關(guān)重要。與有限次重復(fù)博弈的另一個關(guān)鍵差異是，無限次重復(fù)博弈不能忽視不同時間得益的價值差異和貼現(xiàn)問題，必須考慮后一期得益折算成前一期得益的貼現(xiàn)系數(shù)，對博弈方選擇和博弈均衡的分析必須以平均得益或總得益的現(xiàn)在值為根據(jù)。博弈論重復(fù)博弈4.3 無限次重復(fù)博弈4.3.1 兩人零和博弈的無限次重復(fù)博弈4.3.2 惟一純策略納什均衡博弈的無限次重復(fù)博弈4.3.3 無限次重復(fù)古諾模型4.3.4 有效工資率博弈論重復(fù)博弈4.3.1 兩人零和博弈的無限次重復(fù)博弈n兩人零和博弈無限次重復(fù)的所有階段不能改變原博弈中博弈方之間在利益上的對立關(guān)系，也不會創(chuàng)造出潛在的合作利益，因此博弈

11、方仍然是每次重復(fù)都根據(jù)當(dāng)時的最大利益行為，會一直重復(fù)原博弈的混合策略納什均衡。n不能采用逆推歸納法證明博弈論重復(fù)博弈4.3.2唯一純策略納什均衡博弈的無限次重復(fù)博弈囚徒困境式博弈的無限次重復(fù)（兩寡頭削價競爭博弈）1、帕累托意義上的最佳組合2、不是效率最高的策略組合該博弈一次性博弈均衡是都采用低價，是囚徒困境型博弈，有限次博弈也不能實現(xiàn)合作。4，40，55，01，1HLHL博弈論重復(fù)博弈無限次重復(fù)兩寡頭削價博弈n在這個博弈的無限次重復(fù)博弈中，我們假設(shè)兩博弈方都采用如下觸發(fā)策略:第一階段采用H，在第t階段，如果前t一1階段的結(jié)果都是(H,H)，則繼續(xù)采用H，否則采用L。也就是說，雙方在無限次重

12、復(fù)博弈中都是先試圖合作，第一次無條件選H，如果對方采取的也是合作態(tài)度，則堅持選H;一旦發(fā)現(xiàn)對方不合作(選L)，則用以后永遠選L報復(fù)。博弈論重復(fù)博弈無限次重復(fù)兩寡頭削價博弈觸發(fā)策略觸發(fā)策略：第一階段采用H，如果前t-1階段的結(jié)果都是(H,H)，則繼續(xù)采用H，否則采用L。如果博弈方2采用L，總得益現(xiàn)值為如果博弈方2采用H，總得益現(xiàn)值為其中V V為博弈方2在該重復(fù)博弈中每階段都能采用最佳選擇的總得益現(xiàn)在值。因此當(dāng) 時，博弈方2采用H策略，否則采用L.151152VV 44/1博弈論重復(fù)博弈無限次重復(fù)兩寡頭削價博弈n 當(dāng) 時，博弈方2對博弈方1觸發(fā)策略的最佳反應(yīng)是第一階段采用H。由于從第二階段

13、開始的無限次重復(fù)博弈，與從第一階段開始的無限次重復(fù)博弈是完全相同的，因此博弈方第二階段的選擇必然也是H，第三階段也同樣。依次類推，只要博弈方1采用前述觸發(fā)策略，那么博弈方2的最優(yōu)選擇就始終是H。當(dāng)然，如果博弈方l偏離H,博弈方2也必須用L來報復(fù)。這就證明了雙方都采用上述觸發(fā)策略是一個納什均衡。4/1博弈論重復(fù)博弈兩寡頭削價競爭無限次重復(fù)博弈的民間定理n在有限次重復(fù)博弈中只有在原博弈有多個純策略納什均衡的情況下會存在的合作，在無限次重復(fù)博弈的情況下只要原博弈有一個納什均衡就可能存在。n其實，與上述結(jié)論相對應(yīng)的，我們還有如下結(jié)論:在有限次重復(fù)博弈中，針對有多個純策略納什均衡博弈重復(fù)博弈的民間定理，

14、在無限次重復(fù)博弈中對有惟一純策略納什均衡的博弈也是成立的。當(dāng)然兩個民間定理的表達略有不同。博弈論重復(fù)博弈兩寡頭削價競爭無限次重復(fù)博弈的民間定理廠商2得益廠商1得益(4,4)(1,1)(5,0)(0,5),(),(1),(),(11niininxxGiexGxxGeeG均得益為什均衡，各博弈方的平完美納中一定存在一個子博弈次重復(fù)博弈，那么無限足夠接近都成立，而對任意博弈方果的任意可實現(xiàn)得益。如表示用的納什均衡的得益，記的靜態(tài)博弈。用是一個完全信息理：設(shè)無限次重復(fù)博弈民間定博弈論重復(fù)博弈4.3.3 無限次重復(fù)古諾模型博弈方的行為選擇越多，重復(fù)博弈的路徑也越多，在無限次重復(fù)博弈中實現(xiàn)較高效率均衡

15、的機會也越多。假定假定：設(shè)兩廠商無固定成本，邊際成本都為2。n一次博弈存在惟一的納什均衡（2,2）。即兩廠商都生產(chǎn)2單位產(chǎn)量，該產(chǎn)量也稱為“古諾產(chǎn)量”，用表示。如果該市場是一家廠商壟斷，那么最佳壟斷產(chǎn)量為，納什均衡的總產(chǎn)量4大于壟斷產(chǎn)量3。如果兩廠商各生產(chǎn)壟斷產(chǎn)量的一半1.5，則兩廠商的得益都會增加，但這在一次性靜態(tài)博弈中不可能實現(xiàn)，在有限次重復(fù)博弈中也不可能實現(xiàn)。 21),0P, 8Q, 8(8)(qqQQQQPP其中則若cq3mq博弈論重復(fù)博弈4.3.3 無限次重復(fù)古諾模型在無限次重復(fù)古諾模型中，當(dāng)貼現(xiàn)率滿足一定條件時，兩廠商采用下列觸發(fā)策略構(gòu)成一個子博弈完美納什均衡：在第一階

16、段生產(chǎn)壟斷產(chǎn)量的一半1.5；在第 t 階段，如果前 t-1 階段結(jié)果都是(1.5,1.5)，則繼續(xù)生產(chǎn)1.5，否則生產(chǎn)古諾產(chǎn)量 =2。雙方都采用上述觸發(fā)策略的博弈路徑為每階段生產(chǎn)產(chǎn)量（1.5,1.5），雙方每階段的得益都是。cq5 . 4*博弈論重復(fù)博弈設(shè)廠商1已采用該觸發(fā)策略，若廠商2也采用該觸發(fā)策略，則每期得益4.5，無限次重復(fù)博弈總得益的現(xiàn)值為：如果廠商2偏離上述觸發(fā)策略，則他在第一階段所選產(chǎn)量應(yīng)為給定廠商1產(chǎn)量為1.5時，自己的最大利潤產(chǎn)量，即滿足：解得，此時利潤為5.0625，高于觸發(fā)策略第一階段得益4.5。15 . 415 . 4222225 . 4max25 . 18m

17、ax222qqqqqqq25. 22q博弈論重復(fù)博弈但從第二階段開始，廠商1將報復(fù)性地永遠采用古諾產(chǎn)量2，這樣廠商2也被迫永遠采用古諾產(chǎn)量，從此得利潤4。因此，無限次重復(fù)博弈第一階段偏離的情況下總得益的現(xiàn)值為：當(dāng) 上述策略是廠商2對廠商1的同樣觸發(fā)策略的最佳反應(yīng)，否則偏離是最佳反應(yīng)。 140625. 540625. 52179140625. 515 . 4即博弈論重復(fù)博弈n低水平合作n當(dāng) 時上述觸發(fā)策略不是無限次重復(fù)博弈的納什均衡，更不是子博弈完美納什均衡。但這并不是說當(dāng) 時，兩廠商就一定只能每階段都采用古諾產(chǎn)量，實現(xiàn)每階段結(jié)果為原博弈的低效率納什均衡的得益。n其實，各廠商的產(chǎn)量可以控制在

18、壟斷產(chǎn)量的一半和古諾產(chǎn)量之間的某個水平17/917/9)2(*之間和cmqqq博弈論重復(fù)博弈n我們以為基礎(chǔ)構(gòu)造一中雙方共同采用的觸發(fā)策略：在第一階段生產(chǎn) ；在第t階段，如果前t-1階段的結(jié)果都是，則繼續(xù)生產(chǎn)，否則生產(chǎn)古諾產(chǎn)量 =2 。雙方都采用該觸發(fā)策略時均衡路徑為每階段都是，兩廠商的得益都是無限次重復(fù)博弈得益的現(xiàn)在值為*q*q),(*qqcq),(*qq博弈論重復(fù)博弈n如廠商2第一階段偏離，并根據(jù)廠商1的產(chǎn)量決定自己該階段的最大利潤產(chǎn)量，則該產(chǎn)量必滿足：得益為：但從第二階段開始，廠商1報復(fù)，將采用古諾產(chǎn)量，廠商2也將一直采用古諾產(chǎn)量2。*q2cq博弈論重復(fù)博弈n得益將一直為：n這樣

19、無限次重復(fù)得益的現(xiàn)值為：n只有當(dāng)4c博弈論重復(fù)博弈n也就是說，對于給定的水平，它能夠支持的具有穩(wěn)定的最低 “合作”產(chǎn)量滿足 *q博弈論重復(fù)博弈n加大懲罰力度和提高合作水平就是在條件比較寬松的觸發(fā)策略中，我們也可能構(gòu)造其他同樣也能實現(xiàn)夠效率的子博弈完美那是均衡。第一階段生產(chǎn)壟斷產(chǎn)量的一半；在第t階段，如果第t-1階段的結(jié)果為，則生產(chǎn) ，如果第t階段的結(jié)果為（x,x），也生產(chǎn) ，否則生產(chǎn)x。上述x是比古諾產(chǎn)量更高的待定懲罰性高產(chǎn)量，因為在本策略中懲罰不是永久的，采用古諾產(chǎn)量不足以約束對方的行為。2mq)2,2(mmqq2mq2mq博弈論重復(fù)博弈胡蘿卜加大棒策略雙方如果都采用上述策

20、略，雙方每階段都得到壟斷利潤的一半，無限次重復(fù)博弈得益的現(xiàn)在值為如果廠商2在第一階段偏離，采用偏離產(chǎn)量為，則必有 )2,2(mmqq2mdq博弈論重復(fù)博弈n因此得到n第二階段廠商1開始懲罰，因此兩廠商都采用x,從第三階段開始將都回歸到原產(chǎn)量。n廠商2第二階段的得益為：0625. 5,25. 2ddq2mq博弈論重復(fù)博弈n第一階段偏離得到的好處與第二階段得到的懲罰比較博弈論重復(fù)博弈n石油輸出國組織的例子n根據(jù)上面對無限次重復(fù)古諾模型的分析，我們知道OPEC成員國之間的合作是有可能出現(xiàn)的，也就是說限產(chǎn)計劃是有可能成功的。那么，現(xiàn)實中DPEC成員國的實踐結(jié)果是否支持上述結(jié)論呢? 從OPE

21、C成員主觀期望的角度判斷，可知OPEC在限產(chǎn)博弈中確實是既有成功的時期，也有很不成功的時期。博弈論重復(fù)博弈n從成功的時期看，除了無限次重復(fù)博弈提供了形成合作的條件以外，主要有OPEC協(xié)調(diào)作用的因素;有最大成員國帶頭作用的因素;有海灣戰(zhàn)爭的影響和世界石油需求上升的因素等。n從不成功的時期看，則有OPEC成員國自身理性和決策能力的問題，需要學(xué)習(xí)博弈和建立相互信任過程的因素;有部分成員國石油資源趨于枯竭，對他們來說重復(fù)博弈次數(shù)有限，長期利益的制約作用減弱的因素;有非OPEC國家竟?fàn)帀毫Φ囊蛩?有成員國之間利益不平衡，部分國家覺得限額不公平，從而不愿合作的因素;有一些國家因為財政緊張，從而殺雞取卵不考慮長期利益的因素;也有近年世界石油需求減少，市場情況發(fā)生較大變化的因素等。博弈論重復(fù)博弈4.3.4 有效工資率（動態(tài)博弈）模型設(shè)定模型設(shè)定：首先廠商選擇

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論重復(fù)博弈

文檔簡介

溫馨提示

最新文檔

評論

博弈論重復(fù)博弈

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔