博弈論重復(fù)博弈_第1頁
博弈論重復(fù)博弈_第2頁
博弈論重復(fù)博弈_第3頁
博弈論重復(fù)博弈_第4頁
博弈論重復(fù)博弈_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、博弈論重復(fù)博弈第四章 重復(fù)博弈 本章介紹基本博弈重復(fù)進行構(gòu)成的重復(fù)博弈。雖然形式上是基本博弈的重復(fù)進行,但重復(fù)博弈中博弈方的行為和博弈結(jié)果卻不一定是基本博弈的簡單重復(fù),因為博弈方對于博弈會重復(fù)進行的意識,會使他們對利益的判斷發(fā)生變化,從而使他們在重復(fù)博弈過程中的行為選擇受到影響。這意味著不能把重復(fù)博弈當(dāng)作基本博弈的簡單疊加,必須把整個重復(fù)博弈過程作為整體進行研究。博弈論重復(fù)博弈本章分三節(jié)4.1 重復(fù)博弈引論4.2 有限次重復(fù)博弈4.3 無限次重復(fù)博弈博弈論重復(fù)博弈4.1 重復(fù)博弈引論4.1.1 為何研究重復(fù)博弈4.1.2 基本概念博弈論重復(fù)博弈4.1.1 為何研究重復(fù)博弈n經(jīng)濟中的長期關(guān)系n人

2、們的預(yù)見性n未來利益對當(dāng)前行為的制約n長期合同、回頭客、長客和一次性買賣的區(qū)別n有無確定的結(jié)束時間博弈論重復(fù)博弈4.1.2 基本概念n有限次重復(fù)博弈有限次重復(fù)博弈:給定一個基本博弈G(可以是靜態(tài)博弈,也可以是動態(tài)博弈),重復(fù)進行T次G,并且在每次重復(fù)G之前各博弈方都能觀察到以前博弈的結(jié)果,這樣的博弈過程稱為“G的T次重復(fù)博弈”,記為G(T)。而G則稱為G(T)的“原博弈”。G(T)中的每次重復(fù)稱為G(T)的一個“階段”。n無限次重復(fù)博弈無限次重復(fù)博弈:一個基本博弈G一直重復(fù)博弈下去的博弈,記為G( )n策略策略:博弈方在每個階段針對每種情況如何行為的計劃n子博弈子博弈:從某個階段(不包括第一階

3、段)開始,包括此后所有的重復(fù)博弈部分n均衡路徑均衡路徑:由每個階段博弈方的行為組合串聯(lián)而成博弈論重復(fù)博弈重復(fù)博弈的得益的平均得益為相同的現(xiàn)在值,則稱得益序列階段的得益,能產(chǎn)生與無限次重復(fù)博弈)各個重復(fù)博弈或作為重復(fù)博弈(有限次:如果一常數(shù),,2121平均得益11)1 (ttt慮貼現(xiàn)問題無限次重復(fù)博弈必須考考慮貼現(xiàn)因素有限次重復(fù)博弈不一定博弈論重復(fù)博弈4.2 有限次重復(fù)博弈4.2.1 兩人零和博弈的有限次重復(fù)博弈4.2.2唯一純策略納什均衡博弈 的有限次重復(fù)博弈4.2.3多個純策略納什均衡博弈 的有限次重復(fù)博弈4.2.4 有限次重復(fù)博弈的民間定理博弈論重復(fù)博弈4.2.1 兩人零和博弈的有限次重復(fù)

4、博弈n零和博弈是嚴(yán)格競爭的,重復(fù)博弈并不改變這一點。n以零和博弈為原博弈的有限次重復(fù)博弈與猜硬幣博弈的有限次重復(fù)博弈一樣,博弈方的正確策略是重復(fù)一次性博弈中的納什均衡策略。博弈論重復(fù)博弈4.2.2唯一純策略納什均衡博弈的 有限次重復(fù)博弈n定理定理:設(shè)原博弈G有唯一的純策略納什均衡,則對任意整數(shù)T,重復(fù)博弈 G(T)有唯 一的子博弈完美納什均衡,即各博弈方每個階段都采用G的納什均衡策略。各博弈方在G(T)中的總得益為在G中得益的T倍,平均得益的與原博弈G中的得益。-5,-50,-8-8,0-1,-1坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-5,-5)-10,-10-13,-5-5,-13-6

5、,-6坦 白不坦白囚徒囚徒2坦白不坦白囚囚徒徒1(-10,-10)博弈論重復(fù)博弈有限次重復(fù)削價競爭博弈100,10020,150150,2070,70高 價低 價高價低價寡頭寡頭2寡寡頭頭1削價競爭博弈有唯一純策略納什均衡(70,70)有限次重復(fù)的結(jié)果仍然是(低價,低價)博弈論重復(fù)博弈4.2.3多個純策略納什均衡博弈的 有限次重復(fù)博弈5,53,32,00,22,06,00,20,61,1HMH廠商廠商2ML廠廠商商1L三價博弈2,23,13,11,34,47,11,31,78,8廠廠商商1廠商廠商2LMHHML兩次重復(fù)三價博弈的等價模型觸發(fā)策略觸發(fā)策略:兩博弈方先試探合作,一旦發(fā)現(xiàn)對方不合作則

6、也用不合作報復(fù)博弈方1:第一次選h;如第一次結(jié)果為(H,H),則第二次選M,否則選L博弈方2:同博弈方1博弈論重復(fù)博弈兩市場博弈的重復(fù)博弈(重復(fù)兩次)n(A,B)+(A,B) OR (B,A)+(B,A)(1,4)(4,1)n連續(xù)兩次采用混合策略(2,2)n(A,B)+(B,A) OR (B,A)+(A,B)(2.2,2.5)輪換策略n一次純策略+一次混合策略(1.5,3)(3,1.5)0,04,11,33,3廠廠商商1廠商廠商2BAAB兩市場博弈博弈論重復(fù)博弈重復(fù)博弈不同策略、均衡及一次性博弈得益比較n不同策略組合、均衡得益圖示廠商2得益廠商1得益(1,4)(3,3)(2.5,2.5)(2,

7、2)(3,1.5)(4,1)(1.5,3)博弈論重復(fù)博弈4.2.4 有限次重復(fù)博弈的民間定理n個體理性得益?zhèn)€體理性得益:不管其它博弈方的行為如何,一博弈方在某個博弈中只要自己采取某種特定的策略,最低限度保證能獲得的得益n可實現(xiàn)得益可實現(xiàn)得益:博弈中所有純策略組合得益的加權(quán)平均數(shù)組n定理定理:設(shè)原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于w,那么在該博弈的多次重復(fù)中所有不小于個體理性得益的可實現(xiàn)得益,都至少有一個子博弈完美納什均衡的極限的平均得益來實現(xiàn)它們廠商2得益廠商1得益(1,4)(3,3)(1,1)(4,1)w=(1.1)博弈論重復(fù)博弈4.3 無限次重復(fù)博弈n回顧上節(jié)內(nèi)容:重復(fù)博弈是一種特殊的動態(tài)

8、博弈,對應(yīng)現(xiàn)實中具有相對穩(wěn)定性的長期關(guān)系。因此必須考慮長期利益關(guān)系,所以博弈方的行為就可能表現(xiàn)出與一次性博棄不同的特點。重復(fù)博弈主要包括有限次重復(fù)博棄和無限次重復(fù)博弈,當(dāng)有限次重復(fù)博弈的重復(fù)次數(shù)較多或是無限次重復(fù)博弈時,必須考慮先后得到利益的價值差別。博弈論重復(fù)博弈4.3 無限次重復(fù)博弈n有限重復(fù)博弈中,對于無純策略納什均衡的原博弈來說,不可能產(chǎn)生比一次性博弈更理想的結(jié)果,因為原博弈各博弈方的利益是嚴(yán)格對立的。重復(fù)博弈不會改變這種利益關(guān)系。對于有惟一純策略納什均衡博棄的重復(fù)博弈來說,結(jié)論是在有限次重復(fù)博弈中結(jié)果也不會更理想,因為其子博弈完美納什均街是各博弈方在每次重復(fù)時都采用原博棄的納什均衡。

9、 博弈論重復(fù)博弈4.3 無限次重復(fù)博弈n重復(fù)的囚徒困境悖論和連鎖店悖論(塞爾頓,1978)n前面討論的兩種情況的結(jié)果并不比一次性博弈結(jié)果更好。對于有多個純策略納什均衡博弈的重復(fù)博弈來說,有限次重復(fù)博弈有可能實現(xiàn)一次性博弈潛在的合作利益和提高博弈效率,有限次重復(fù)博弈的民間定理也進一步給出了更強的結(jié)論等。n觸發(fā)策略博弈論重復(fù)博弈4.3 無限次重復(fù)博弈n對于無限次重復(fù)博弈,兩人零和博弈、惟一純策略納什均衡博弈、以及其他問題的結(jié)果到底如何呢?n區(qū)別:根據(jù)我們對有限次重復(fù)博弈的分析可知,存在最后一次重復(fù)正是破壞重復(fù)博弈中博弈方利益和行為的相互制約關(guān)系,使重復(fù)博弈無法實現(xiàn)更高效率均衡的關(guān)鍵間題。因此無限次

10、重復(fù)博弈與有限次重復(fù)博弈的上述區(qū)別至關(guān)重要。與有限次重復(fù)博弈的另一個關(guān)鍵差異是,無限次重復(fù)博弈不能忽視不同時間得益的價值差異和貼現(xiàn)問題,必須考慮后一期得益折算成前一期得益的貼現(xiàn)系數(shù),對博弈方選擇和博弈均衡的分析必須以平均得益或總得益的現(xiàn)在值為根據(jù)。 博弈論重復(fù)博弈4.3 無限次重復(fù)博弈4.3.1 兩人零和博弈的無限次重復(fù)博弈4.3.2 惟一純策略納什均衡博弈 的無限次重復(fù)博弈4.3.3 無限次重復(fù)古諾模型4.3.4 有效工資率博弈論重復(fù)博弈4.3.1 兩人零和博弈的無限次重復(fù)博弈n兩人零和博弈無限次重復(fù)的所有階段不能改變原博弈中博弈方之間在利益上的對立關(guān)系,也不會創(chuàng)造出潛在的合作利益,因此博弈

11、方仍然是每次重復(fù)都根據(jù)當(dāng)時的最大利益行為,會一直重復(fù)原博弈的混合策略納什均衡。n不能采用逆推歸納法證明博弈論重復(fù)博弈4.3.2唯一純策略納什均衡博弈 的無限次重復(fù)博弈囚徒困境式博弈的無限次重復(fù)(兩寡頭削價競爭博弈)1、帕累托意義上的最佳組合2、不是效率最高的策略組合 該博弈一次性博弈均衡是都采用低價,是囚徒困境型博弈,有限次博弈也不能實現(xiàn)合作。4,40,55,01,1HLHL博弈論重復(fù)博弈無限次重復(fù)兩寡頭削價博弈n在這個博弈的無限次重復(fù)博弈中,我們假設(shè)兩博弈方都采用如下觸發(fā)策略:第一階段采用H,在第t階段,如果前t一1階段的結(jié)果都是(H,H),則繼續(xù)采用H,否則采用L。也就是說,雙方在無限次重

12、復(fù)博弈中都是先試圖合作,第一次無條件選H,如果對方采取的也是合作態(tài)度,則堅持選H;一旦發(fā)現(xiàn)對方不合作(選L),則用以后永遠選L報復(fù)。 博弈論重復(fù)博弈無限次重復(fù)兩寡頭削價博弈 觸發(fā)策略觸發(fā)策略:第一階段采用H,如果前t-1階段的結(jié)果都是(H,H),則繼續(xù)采用H,否則采用L。 如果博弈方2采用L,總得益現(xiàn)值為 如果博弈方2采用H,總得益現(xiàn)值為其中V V為博弈方2在該重復(fù)博弈中每階段都能采用最佳選擇的總得益現(xiàn)在值。因此當(dāng) 時,博弈方2采用H策略,否則采用L.151152VV 44/1博弈論重復(fù)博弈無限次重復(fù)兩寡頭削價博弈n 當(dāng) 時,博弈方2對博弈方1觸發(fā)策略的最佳反應(yīng)是第一階段采用H。由于從第二階段

13、開始的無限次重復(fù)博弈,與從第一階段開始的無限次重復(fù)博弈是完全相同的,因此博弈方第二階段的選擇必然也是H,第三階段也同樣。依次類推,只要博弈方1采用前述觸發(fā)策略,那么博弈方2的最優(yōu)選擇就始終是H。當(dāng)然,如果博弈方l偏離H,博弈方2也必須用L來報復(fù)。這就證明了雙方都采用上述觸發(fā)策略是一個納什均衡。4/1博弈論重復(fù)博弈兩寡頭削價競爭無限次重復(fù)博弈的民間定理n在有限次重復(fù)博弈中只有在原博弈有多個純策略納什均衡的情況下會存在的合作,在無限次重復(fù)博弈的情況下只要原博弈有一個納什均衡就可能存在。n其實,與上述結(jié)論相對應(yīng)的,我們還有如下結(jié)論:在有限次重復(fù)博弈中,針對有多個純策略納什均衡博弈重復(fù)博弈的民間定理,

14、在無限次重復(fù)博弈中對有惟一純策略納什均衡的博弈也是成立的。當(dāng)然兩個民間定理的表達略有不同。 博弈論重復(fù)博弈兩寡頭削價競爭無限次重復(fù)博弈的民間定理廠商2得益廠商1得益(4,4)(1,1)(5,0)(0,5),(),(1),(),(11niininxxGiexGxxGeeG均得益為什均衡,各博弈方的平完美納中一定存在一個子博弈次重復(fù)博弈,那么無限足夠接近都成立,而對任意博弈方果的任意可實現(xiàn)得益。如表示用的納什均衡的得益,記的靜態(tài)博弈。用是一個完全信息理:設(shè)無限次重復(fù)博弈民間定博弈論重復(fù)博弈4.3.3 無限次重復(fù)古諾模型 博弈方的行為選擇越多,重復(fù)博弈的路徑也越多,在無限次重復(fù)博弈中實現(xiàn)較高效率均衡

15、的機會也越多。假定假定: 設(shè)兩廠商無固定成本,邊際成本都為2。n一次博弈存在惟一的納什均衡(2,2)。即兩廠商都生產(chǎn)2單位產(chǎn)量,該產(chǎn)量也稱為“古諾產(chǎn)量”,用 表示。如果該市場是一家廠商壟斷,那么最佳壟斷產(chǎn)量為 ,納什均衡的總產(chǎn)量4大于壟斷產(chǎn)量3。如果兩廠商各生產(chǎn)壟斷產(chǎn)量的一半1.5,則兩廠商的得益都會增加,但這在一次性靜態(tài)博弈中不可能實現(xiàn),在有限次重復(fù)博弈中也不可能實現(xiàn)。 21),0P, 8Q, 8(8)(qqQQQQPP其中則若cq3mq博弈論重復(fù)博弈4.3.3 無限次重復(fù)古諾模型 在無限次重復(fù)古諾模型中,當(dāng)貼現(xiàn)率 滿足一定條件時,兩廠商采用下列觸發(fā)策略構(gòu)成一個子博弈完美納什均衡: 在第一階

16、段生產(chǎn)壟斷產(chǎn)量的一半1.5;在第 t 階段,如果前 t-1 階段結(jié)果都是(1.5,1.5),則繼續(xù)生產(chǎn)1.5,否則生產(chǎn)古諾產(chǎn)量 =2。 雙方都采用上述觸發(fā)策略的博弈路徑為每階段生產(chǎn)產(chǎn)量(1.5,1.5),雙方每階段的得益都是。cq5 . 4*博弈論重復(fù)博弈 設(shè)廠商1已采用該觸發(fā)策略,若廠商2也采用該觸發(fā)策略,則每期得益4.5,無限次重復(fù)博弈總得益的現(xiàn)值為: 如果廠商2偏離上述觸發(fā)策略,則他在第一階段所選產(chǎn)量應(yīng)為給定廠商1產(chǎn)量為1.5時,自己的最大利潤產(chǎn)量,即滿足: 解得 ,此時利潤為5.0625,高于觸發(fā)策略第一階段得益4.5。15 . 415 . 4222225 . 4max25 . 18m

17、ax222qqqqqqq25. 22q博弈論重復(fù)博弈 但從第二階段開始,廠商1將報復(fù)性地永遠采用古諾產(chǎn)量2,這樣廠商2也被迫永遠采用古諾產(chǎn)量,從此得利潤4。因此,無限次重復(fù)博弈第一階段偏離的情況下總得益的現(xiàn)值為: 當(dāng) 上述策略是廠商2對廠商1的同樣觸發(fā)策略的最佳反應(yīng),否則偏離是最佳反應(yīng)。 140625. 540625. 52179140625. 515 . 4即博弈論重復(fù)博弈n低水平合作n當(dāng) 時上述觸發(fā)策略不是無限次重復(fù)博弈的納什均衡,更不是子博弈完美納什均衡。但這并不是說當(dāng) 時,兩廠商就一定只能每階段都采用古諾產(chǎn)量,實現(xiàn)每階段結(jié)果為原博弈的低效率納什均衡的得益。n其實,各廠商的產(chǎn)量可以控制在

18、壟斷產(chǎn)量的一半和古諾產(chǎn)量之間的某個水平17/917/9)2(*之間和cmqqq博弈論重復(fù)博弈n我們以 為基礎(chǔ)構(gòu)造一中雙方共同采用的觸發(fā)策略:在第一階段生產(chǎn) ;在第t階段,如果前t-1階段的結(jié)果都是 ,則繼續(xù)生產(chǎn),否則生產(chǎn)古諾產(chǎn)量 =2 。雙方都采用該觸發(fā)策略時均衡路徑為每階段都是 ,兩廠商的得益都是無限次重復(fù)博弈得益的現(xiàn)在值為*q*q),(*qqcq),(*qq博弈論重復(fù)博弈n如廠商2第一階段偏離,并根據(jù)廠商1的產(chǎn)量 決定自己該階段的最大利潤產(chǎn)量,則該產(chǎn)量必滿足:得益為:但從第二階段開始,廠商1報復(fù),將采用古諾產(chǎn)量 ,廠商2也將一直采用古諾產(chǎn)量2。*q2cq博弈論重復(fù)博弈n得益將一直為:n這樣

19、無限次重復(fù)得益的現(xiàn)值為:n只有當(dāng)4c博弈論重復(fù)博弈n也就是說,對于給定的 水平,它能夠支持的具有穩(wěn)定的最低 “合作”產(chǎn)量 滿足 *q博弈論重復(fù)博弈n加大懲罰力度和提高合作水平 就是在條件比較寬松的觸發(fā)策略中,我們也可能構(gòu)造其他同樣也能實現(xiàn)夠效率的子博弈完美那是均衡。 第一階段生產(chǎn)壟斷產(chǎn)量的一半 ;在第t階段,如果第t-1階段的結(jié)果為 ,則生產(chǎn) ,如果第t階段的結(jié)果為(x,x),也生產(chǎn) ,否則生產(chǎn)x。 上述x是比古諾產(chǎn)量更高的待定懲罰性高產(chǎn)量,因為在本策略中懲罰不是永久的,采用古諾產(chǎn)量不足以約束對方的行為。2mq)2,2(mmqq2mq2mq博弈論重復(fù)博弈 胡蘿卜加大棒策略 雙方如果都采用上述策

20、略 ,雙方每階段都得到壟斷利潤的一半 ,無限次重復(fù)博弈得益的現(xiàn)在值為 如果廠商2在第一階段偏離,采用偏離產(chǎn)量為 ,則必有 )2,2(mmqq2mdq博弈論重復(fù)博弈n因此得到n第二階段廠商1開始懲罰,因此兩廠商都采用x,從第三階段開始將都回歸到原產(chǎn)量 。n廠商2第二階段的得益為:0625. 5,25. 2ddq2mq博弈論重復(fù)博弈n第一階段偏離得到的好處與第二階段得到的懲罰比較博弈論重復(fù)博弈n石油輸出國組織的例子n根據(jù)上面對無限次重復(fù)古諾模型的分析,我們知道OPEC成員國之間的合作是有可能出現(xiàn)的,也就是說限產(chǎn)計劃是有可能成功的。 那么,現(xiàn)實中DPEC成員國的實踐結(jié)果是否支持上述結(jié)論呢? 從OPE

21、C成員主觀期望的角度判斷,可知OPEC在限產(chǎn)博弈中確實是既有成功的時期,也有很不成功的時期。博弈論重復(fù)博弈n從成功的時期看,除了無限次重復(fù)博弈提供了形成合作的條件以外,主要有OPEC協(xié)調(diào)作用的因素;有最大成員國帶頭作用的因素;有海灣戰(zhàn)爭的影響和世界石油需求上升的因素等。n從不成功的時期看,則有OPEC成員國自身理性和決策能力的問題,需要學(xué)習(xí)博弈和建立相互信任過程的因素;有部分成員國石油資源趨于枯竭,對他們來說重復(fù)博弈次數(shù)有限,長期利益的制約作用減弱的因素;有非OPEC國家竟?fàn)帀毫Φ囊蛩?有成員國之間利益不平衡,部分國家覺得限額不公平,從而不愿合作的因素;有一些國家因為財政緊張,從而殺雞取卵不考慮長期利益的因素;也有近年世界石油需求減少,市場情況發(fā)生較大變化的因素等。博弈論重復(fù)博弈4.3.4 有效工資率(動態(tài)博弈)模型設(shè)定模型設(shè)定: 首先廠商選擇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論