重復(fù)博弈同樣結(jié)構(gòu)的博弈重復(fù)多次課件_第1頁
重復(fù)博弈同樣結(jié)構(gòu)的博弈重復(fù)多次課件_第2頁
重復(fù)博弈同樣結(jié)構(gòu)的博弈重復(fù)多次課件_第3頁
重復(fù)博弈同樣結(jié)構(gòu)的博弈重復(fù)多次課件_第4頁
重復(fù)博弈同樣結(jié)構(gòu)的博弈重復(fù)多次課件_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一節(jié)概述一、含義1.含義:同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為“階段博弈”(stagegame)階段博弈既可以是靜態(tài)博弈,也可以是動(dòng)態(tài)博弈?!巴瑯咏Y(jié)構(gòu)”的博弈是指相同的局中人集合、相同的可行行為空間或策略空間、相同的效用函數(shù)。若在每一階段博弈的末期,局中人的行為可被觀察到,那么局中人就有可能在對(duì)手過去行為的基礎(chǔ)上,在下一階段博弈采取相應(yīng)的策略,由此可能導(dǎo)致的均衡結(jié)局與一次博弈的均衡不同。2.重復(fù)博弈與序貫博弈的區(qū)別(123)

“序貫博弈”(se-quentialgame):參與人在前一個(gè)階段的行動(dòng)選擇決定隨后的子博弈的結(jié)構(gòu);從后一個(gè)決策結(jié)開始的子博弈不同于從前一個(gè)決策結(jié)開始的子博弈,也即是,同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次。重復(fù)博弈則是同樣結(jié)構(gòu)的博弈重復(fù)多次。重復(fù)博弈分為有限次重復(fù)博弈和無限次重復(fù)博弈。3.重復(fù)博弈的基本特征:(1)階段博弈之間沒有“物質(zhì)上”的聯(lián)系(nophysicallinks),也就是說,前一階段的博弈不改變后一階段博弈的結(jié)構(gòu)(對(duì)比之下,序貫博弈涉及物質(zhì)上的聯(lián)系);(2)所有參與人都觀測(cè)到博弈過去的歷史(如在每一個(gè)新的階段博弈,兩個(gè)囚徒都知道同伙在過去的每次博弈中選擇了抵賴還是坦白);(3)參與人的總支付是所有階段博弈支付的貼現(xiàn)值之和或加權(quán)平均值。由于其他參與人過去行動(dòng)的歷史是觀測(cè)得到的,一個(gè)參與人可以使自己在某個(gè)階段博弈的選擇依賴于其他參與人過去的行動(dòng)歷史,因此,參與人在重復(fù)博弈中的戰(zhàn)略空間遠(yuǎn)遠(yuǎn)大于且復(fù)雜于在每一個(gè)階段博弈中的戰(zhàn)略空間,從而使重復(fù)博弈可能帶來一些“額外的”均衡結(jié)果,這些均衡結(jié)果在一次博弈中是從來不會(huì)出現(xiàn)的。這正是分析重復(fù)博弈的意義所在。4.影響重復(fù)博弈均衡結(jié)果的主要因素是:博弈重復(fù)的次數(shù)和信息的完備性(com-pleteness)。重復(fù)次數(shù)的重要性:來自于參與人在短期利益和長遠(yuǎn)利益之間的權(quán)衡。當(dāng)博弈只進(jìn)行一次時(shí),每個(gè)參與人只關(guān)心一次性的支付;但如果博弈重復(fù)多次,參與人可能會(huì)為了長遠(yuǎn)利益而犧牲眼前利益從而選擇不同的均衡戰(zhàn)略。

信息的完備性的重要性:當(dāng)一個(gè)參與人的支付函數(shù)(特征)不為其他參與人所知時(shí),該參與人可能有積極性建立一個(gè)“好”的聲譽(yù)(reputation)以換取長遠(yuǎn)利益。本節(jié)我們只討論重復(fù)次數(shù)對(duì)均衡結(jié)果的影響,有關(guān)信息的完備性的影響將在不完全信息動(dòng)態(tài)博弈部分討論。二、幾個(gè)基本概念1.重復(fù)博弈的策略、子博弈和均衡路徑在重復(fù)博弈中,博弈方的一個(gè)策略就是在每一階段(即每次重復(fù))針對(duì)每種情況(以前階段的結(jié)果)如何行動(dòng)的計(jì)劃。重復(fù)博弈的子博弈是從某個(gè)階段(不包括第一階段)開始,包括此后所有階段的重復(fù)博弈部分。動(dòng)態(tài)博弈中各博弈方的策略組合對(duì)應(yīng)一條路徑,均衡策略組合對(duì)應(yīng)一條均衡路徑,這些路徑由各個(gè)階段輪到行動(dòng)的博弈方的行為依次連接而成。重復(fù)博弈的路徑即是由每個(gè)階段博弈方的行為組合串聯(lián)而成的。2.重復(fù)博弈博弈方的得益:要考慮整個(gè)重復(fù)博弈過程得益的總體情況。當(dāng)重復(fù)次數(shù)較多,每次重復(fù)間隔時(shí)間又較長時(shí),需考慮得益的時(shí)間先后。一般是將每一階段的得益折算成當(dāng)前階段的得益(即現(xiàn)在值)的貼現(xiàn)值。貼現(xiàn)系數(shù)δ=1/(1+γ),γ為以一階段為期限的市場(chǎng)利率。方法1:計(jì)算重復(fù)博弈的“總得益”,即博弈方各次重復(fù)博弈的得益的總和;方法2:計(jì)算重復(fù)博弈各階段的“平均得益”

第二節(jié)有限次重復(fù)博弈一、有限次重復(fù)博弈的含義定理:給定一個(gè)基本博弈G(可以是靜態(tài)博弈,也可以是動(dòng)態(tài)博弈),重復(fù)進(jìn)行T次,且在每次重復(fù)G之前各博弈方都能觀測(cè)到以前博弈的結(jié)果,這樣的博弈過程稱為“G的T次重復(fù)博弈”,記為G(T),G稱為G(T)的原博弈或階段博弈,G(T)中的每次重復(fù)稱為G(T)的一個(gè)“階段”。

二、有限次重復(fù)博弈類型1.兩人零和博弈的有限次重復(fù)博弈博弈方的最佳策略都是每一次博弈都重復(fù)原博弈的混合策略NE策略。2.存在唯一純策略NE博弈的有限次重復(fù)博弈例:有限次重復(fù)的囚徒困境博弈有限次重復(fù)削價(jià)競(jìng)爭(zhēng)博弈連鎖店悖論(澤爾騰1978年提出)(124)定理:設(shè)G是階段博弈,G(T)是G重復(fù)T次的重復(fù)博弈(T<∞),那么,如果G有唯一的NE,則重復(fù)博弈G(T)的唯一子博弈精煉NE結(jié)果是階段博弈G的NE重復(fù)T次,即每個(gè)階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果。3.存在多個(gè)純策略NE博弈的有限次重復(fù)博弈(1)存在兩個(gè)純戰(zhàn)略納什均衡的有限次重復(fù)博弈(課本)三價(jià)博弈設(shè)一市場(chǎng)有兩個(gè)生產(chǎn)同質(zhì)產(chǎn)品的廠商,他們對(duì)產(chǎn)品的定價(jià)有高、中、低三種可能。

設(shè)高價(jià)時(shí)市場(chǎng)總利潤為10單位中價(jià)時(shí)市場(chǎng)總利潤為6單位低價(jià)時(shí)市場(chǎng)總利潤為2單位。再假設(shè)兩廠商同時(shí)決定價(jià)格,價(jià)格不等時(shí)價(jià)格低者獨(dú)享利潤,價(jià)格相等時(shí)雙方平分利潤。由此,兩廠商對(duì)價(jià)格的選擇就構(gòu)成了一個(gè)靜態(tài)博弈問題。原博弈有兩個(gè)純策略NE:(M,M),(L,L)一次博弈結(jié)果不會(huì)出現(xiàn)效率最高的(H,H)在兩次博弈中,則存在第一階段采用(H,H)的SPNE。雙方策略:對(duì)廠商1,第一次選擇H;若第一次結(jié)果為(H,H),則第二次選擇M;若第一次結(jié)果為其他,則第二次選擇L。廠商2的選擇同廠商1。在上述雙方策略組合下,兩次重復(fù)博弈的路徑為:第一階段選擇(H,H),第二階段選擇(M,M),這是一個(gè)SPNE路徑。若重復(fù)N次,結(jié)論也相似,SPNE路徑是:每次都選擇(H,H),最后一次選擇原博弈的NE(M,M)。

觸發(fā)機(jī)制:首先試探合作,一旦發(fā)覺對(duì)方不合作,也用不合作相報(bào)復(fù)。觸發(fā)機(jī)制是重復(fù)博弈中實(shí)現(xiàn)合作和提高均衡效率的關(guān)鍵機(jī)制。第三節(jié)無限次重復(fù)博弈與有限次重復(fù)博弈相比:一是是否存在最后一次博弈:對(duì)有限次重復(fù)博弈,存在最后一次重復(fù)是破壞重復(fù)博弈中博弈方和行為的相互制約關(guān)系,使重復(fù)博弈無法實(shí)現(xiàn)更高效率均衡的關(guān)鍵問題。二是無限次重復(fù)博弈必須考慮得益的貼現(xiàn)問題,將每一期的得益折算成現(xiàn)值。對(duì)博弈方行為選擇和博弈均衡的分析必須以平均得益或總得益的現(xiàn)值為根據(jù)。三是觸發(fā)機(jī)制也是無限次重復(fù)博弈實(shí)現(xiàn)理想均衡的關(guān)鍵。一、兩人零和博弈的無限次重復(fù)博弈在這種無限次重復(fù)博弈中,博弈方仍是每次都采用原博弈的混合策略NE。二、存在唯一純策略NE博弈的無限次重復(fù)博弈如囚徒困境(課本)觸發(fā)機(jī)制:第一階段采取抵賴,在第t階段,如果前t-1階段的結(jié)果都是(抵賴,抵賴),則繼續(xù)采取抵賴;否則,采取坦白。可以證明,當(dāng)δ足夠大時(shí),雙方采用上述觸發(fā)機(jī)制構(gòu)成一個(gè)無限次重復(fù)博弈的SPNE。三、無限次重復(fù)古諾模型四、無限次重復(fù)博弈的無名氏定理無名氏定理(Friedman,1971):令G為一個(gè)n人階段博弈,G(∞,δ)為以G為階段博弈的無限次重復(fù)博弈,a*是一個(gè)NE(純戰(zhàn)略或混合戰(zhàn)略),e=(e1,e2,….en)是a*決定的支付向量,U=(u1,u2,…un)是一個(gè)任意可行的支付向量,V是可行支付向量集合。那么,對(duì)于任何滿足ui>ei的u∈V(對(duì)任意i),存在一個(gè)貼現(xiàn)因子δ(*)<1,使得對(duì)于所有的δ≥δ(*),v=(v1,v2,,….v

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論