哈工大博弈論第7講_第1頁
哈工大博弈論第7講_第2頁
哈工大博弈論第7講_第3頁
哈工大博弈論第7講_第4頁
哈工大博弈論第7講_第5頁
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

經(jīng)典案例(2):討價(jià)還價(jià)博弈討價(jià)還價(jià)(bargaining)是市場中最常見、普通的事情。也是博弈論中典型的動(dòng)態(tài)博弈問題。討價(jià)還價(jià)模型還可以推廣到談判問題。這里介紹的是討價(jià)還價(jià)最為經(jīng)典的模型。1經(jīng)典案例(2):討價(jià)還價(jià)博弈假設(shè)有兩個(gè)人分割一塊蛋糕,參與人1先出價(jià)(offer),參與人2可以選擇接受(accept)或拒絕(reject);如果參與人2接受,博弈結(jié)束,蛋糕按參與人1的方案分配。如果參與人2拒絕,參與人2出價(jià),參與人1決定接受或拒絕;如果參與人1接受,博弈結(jié)束,蛋糕按參與人2的方案分配。如果參與人1拒絕,參與人1再出價(jià)…2經(jīng)典案例(2):討價(jià)還價(jià)博弈上述過程反復(fù)進(jìn)行,直到一個(gè)參與人的出價(jià)被另一個(gè)參與人接受為止。這是一個(gè)無限期完美信息博弈,參與人1在1,3,5,…出價(jià),參與人2在時(shí)期2,4,6,…出價(jià)。3經(jīng)典案例(2):討價(jià)還價(jià)博弈若用x表示參與人1的份額,(1-x)表示參與人2的份額,x1和(1-x1)分別是參與人1出價(jià)時(shí)參與人1和參與人2的份額,x2和1-x2分別是參與人2出價(jià)時(shí)參與人1和參與人2的份額。假定參與人1和參與人2的貼現(xiàn)因子分別為δ1和δ2,如果博弈在時(shí)期t結(jié)束,t是參與人i的出價(jià)階段,則參與人1支付的貼現(xiàn)值是π1=δ1t-1xi,參與人2支付的貼現(xiàn)值是π2=δ2t-1(1-xi)4經(jīng)典案例(2):討價(jià)還價(jià)博弈結(jié)合切蛋糕問題,貼現(xiàn)值既可以理解為資金的時(shí)間價(jià)值由于蛋糕由于未被分割出去所造成的自然縮減。雙方的耐心程度。5經(jīng)典案例(2):討價(jià)還價(jià)博弈問題分析由于該博弈是無限期博弈,因此,不能直接采用逆推歸納法。為分析上述問題,先考慮階段數(shù)有限的情形。6經(jīng)典案例(2):討價(jià)還價(jià)博弈有限階段討價(jià)還價(jià)問題假定博弈只進(jìn)行兩個(gè)時(shí)期,在T=2,參與人2出價(jià),如果他提出x2=0,參與人1會(huì)接受(假定參與人在接受和拒絕之間無差異時(shí),我們假定他選擇接受)。因?yàn)椴┺脑赥=2時(shí),參與人1再?zèng)]有討價(jià)還價(jià)的機(jī)會(huì)。7經(jīng)典案例(2):討價(jià)還價(jià)博弈參與人2在T=2時(shí)得到的1單位等價(jià)于在t=1時(shí)的δ2單位,因此,如果參與人1在t=1時(shí)出價(jià)1-x1≥δ2,參與人2會(huì)接受;因?yàn)閰⑴c人1沒有必要給參與人2多于他會(huì)接受的最低份額,博弈均衡結(jié)果是參與人1得到x=x1=1-δ2,參與人2得到1-x=δ28

(a)T=1時(shí)參與人1出價(jià)情況(b)T=2時(shí)參與人2出價(jià)情況

圖2-18兩階段討價(jià)還價(jià)示意δ21-δ2經(jīng)典案例(2):討價(jià)還價(jià)博弈9經(jīng)典案例(2):討價(jià)還價(jià)博弈再假定T=3在最后階段,參與人1出價(jià),他可以得到的最大份額是x1=1;因?yàn)閰⑴c人1在T=3時(shí)1單位等價(jià)于T=2時(shí)的δ1單位,因此,如果參與人2在T=2時(shí)出價(jià)x2=δ1,參與人1將會(huì)接受;因?yàn)閰⑴c人2在T=2的(1-δ1)單位等價(jià)于T=1時(shí)的δ2(1-δ1),因此,如果參與人1在T=1時(shí)出價(jià)1-x1=δ2(1-δ1),參與人2將會(huì)接受。因此,子博弈精煉均衡結(jié)果是x=1-δ2(1-δ1)10當(dāng)T=4,5,…等有限整數(shù)值時(shí),仿照前述方法,可以推導(dǎo)出任何給定的T的子博弈精煉納什均衡。如果δ1=δ2=0,不論T為多少,子博弈精煉均衡的結(jié)果是x=1;就是說,如果兩個(gè)參與人都是絕對無耐心的,第一個(gè)出價(jià)的人得到整個(gè)蛋糕;如果δ2=0,不論δ1為多少,子博弈精煉均衡結(jié)果仍然是x=1;如果δ1=0,δ2>0,子博弈精煉均衡結(jié)果是x=1-δ2經(jīng)典案例(2):討價(jià)還價(jià)博弈11經(jīng)典案例(2):討價(jià)還價(jià)博弈如果δ1=δ2=1,即雙方都有無限耐心,那么,如果T=1,3,5,…,均衡結(jié)果是x=1;如果T=2,4,6,…,均衡結(jié)果是x=0。這里的結(jié)果可以稱之為“后動(dòng)優(yōu)勢”(last-moveradvantage)12經(jīng)典案例(2):討價(jià)還價(jià)博弈一般說來,如果0<δi<1,i=1,2,均衡結(jié)果不僅依賴于貼現(xiàn)因子的相對比率,而且還依賴于博弈時(shí)期T和誰在最后階段出價(jià)。然而,這種依存關(guān)系隨著T的變大而變小當(dāng)T趨于無窮時(shí),我們得到“先動(dòng)優(yōu)勢”:如果δ1=δ2=δ,唯一的納什均衡結(jié)果為x=1/(1+δ)13無限階段討價(jià)還價(jià)問題羅賓斯坦恩(Rubinstein,1982):在無限期輪流出價(jià)博弈中,唯一的子博弈精煉納什均衡結(jié)果是經(jīng)典案例(2):討價(jià)還價(jià)博弈14無限階段討價(jià)還價(jià)問題羅賓斯坦恩(Rubinstein,1982):在無限期輪流出價(jià)博弈中,唯一的子博弈精煉納什均衡結(jié)果是如果δ1=δ2=δ,則經(jīng)典案例(2):討價(jià)還價(jià)博弈15經(jīng)典案例(2):討價(jià)還價(jià)博弈上述定理的證明由于T=∞,博弈沒有最后階段,不可能使用逆推歸納法。但根據(jù)Shaked,Sutton(1984),因?yàn)閺膮⑴c人1出價(jià)的任何一個(gè)階段開始的子博弈等價(jià)于從T=1開始的整個(gè)博弈,因此可轉(zhuǎn)換為有限階段討價(jià)還價(jià)問題。見圖2-19。16從任一階段開始的子博弈(t為奇數(shù))…圖2-19無限階段討價(jià)還價(jià)問題t=1t=2t=k…t=3從t=1階段開始的整個(gè)博弈經(jīng)典案例(2):討價(jià)還價(jià)博弈17假定在時(shí)期t≥3時(shí)參與人1出價(jià),參與人1能得到的最大份額是M;對參與人1而言,t期的M等價(jià)于t-1期的δ1M,參與人2知道在t-1時(shí)期的任何x2≥δ1M的出價(jià)將被參與人1接受,因此參與人出價(jià)x2=δ1M,自己獲得1-δ1M;對于參與人2而言,t-1期的1-δ1M等價(jià)于t-2期的δ2(1-δ1M),參與人知道在t-2期的任何x1<=1-δ2(1-δ1M)出價(jià)將被參與人2接受,因此參與人1出價(jià)x1=1-δ2(1-δ1M)t=1t=2t=k…t=3x=Mx=δ1Mx=1-δ2(1-δ1M)經(jīng)典案例(2):討價(jià)還價(jià)博弈18因此有x=1-δ2(1-δ1M)=M進(jìn)而求得t=1t=2t=k…t=3x=Mx=δ1Mx=1-δ2(1-δ1M)經(jīng)典案例(2):討價(jià)還價(jià)博弈19與此類似,可求出參與人1能夠獲得的最小份額m,為經(jīng)典案例(2):討價(jià)還價(jià)博弈由于參與人1能得到的最大份額和最小份額相同,均衡結(jié)果是唯一的,為20多階段靜態(tài)博弈該類模型中至少在某個(gè)階段參與人同時(shí)選擇其決策。21多階段靜態(tài)博弈模型一例博弈中有四個(gè)參與人,分別用參與人1~4表示。第一階段是參與人1與2的決策選擇階段,他們同時(shí)在各自的策略集A1和A2中分別選擇a1和a2。第二階段是參與人3與4決策選擇階段,他們看到參與人1和2的決策a1和a2后,同時(shí)在各自的策略集A3,A4中分別選擇a3和a4。各參與人的支付函數(shù)是參與人的策略a1,a2,a3,a4的函數(shù),記為ui

=ui

(a1,a2,a3,a4)22多階段靜態(tài)博弈有同時(shí)選擇的動(dòng)態(tài)博弈問題如國際競爭中最優(yōu)關(guān)稅博弈問題,兩個(gè)制定關(guān)稅的國家可看成標(biāo)準(zhǔn)模型中的參與人1與2;兩國各自的一個(gè)相互進(jìn)行產(chǎn)量競爭的企業(yè)就是模型中的參與人3于4。上述標(biāo)準(zhǔn)模型的變形,如某個(gè)階段只有一個(gè)參與人;第二階段的參與人3于4與第一階段的參與人1與2相同等,也屬于同時(shí)選擇的動(dòng)態(tài)博弈問題。23多階段靜態(tài)博弈這類模型實(shí)質(zhì)上就是完美信息動(dòng)態(tài)博弈,因此仍然可以采用逆推歸納法進(jìn)行分析。因?yàn)榇嬖谕瑫r(shí)選擇,因此每個(gè)階段不再是單人優(yōu)化問題,而是一個(gè)靜態(tài)博弈。24

1988年杭州市許多儲蓄點(diǎn)被擠兌,原因是搶購風(fēng)潮。

2000年6月河北省灤縣發(fā)生銀行擠兌,原因是灤縣縣政府行政干預(yù)金融業(yè)務(wù),引發(fā)儲戶心理發(fā)慌。當(dāng)月28日,灤縣縣政府召開有縣土地局、質(zhì)量技術(shù)監(jiān)督局等5個(gè)單位參加的協(xié)調(diào)會(huì),要求與會(huì)單位將存在建設(shè)銀行灤縣支行的公款轉(zhuǎn)存到其他銀行。此舉引起一些群眾對建行的信譽(yù)產(chǎn)生懷疑,造成部分儲戶恐慌,最終導(dǎo)致建設(shè)銀行灤縣支行的7個(gè)儲蓄網(wǎng)點(diǎn)中先后有6個(gè)網(wǎng)點(diǎn)被擠提存款。這事件隨在有關(guān)部門的努力下及時(shí)得到平息,但已嚴(yán)重干擾了金融秩序。25多階段靜態(tài)博弈簡例:擠兌博弈問題描述:銀行信貸對社會(huì)經(jīng)濟(jì)發(fā)展的作用無可估量,但它在帶來巨大利益的同時(shí)也蘊(yùn)含著一定的風(fēng)險(xiǎn)。設(shè)一家銀行為了給一個(gè)企業(yè)貸放一筆20000元的貸款,以20%的年利率吸引客戶存款。若兩個(gè)客戶各有10000元資金,如果他們把資金作為1年期定期存款存入該銀行,那么銀行就可以向企業(yè)貸款。如果兩客戶都不愿存款或只有一個(gè)客戶存款,那么銀行就無法給上述企業(yè)貸款,這時(shí)候客戶的本金可以保全。26多階段靜態(tài)博弈簡例:擠兌博弈在兩個(gè)客戶都存款,從而銀行給上述企業(yè)提供貸款的情況下,如果銀行滿1年收回貸款,企業(yè)就能完成一筆生意,銀行可收回貸款本息,并可支付存款客戶的存款本息。如果在不到1年的時(shí)候,其中任何一個(gè)客戶單獨(dú)或同時(shí)要求提前取出存款,銀行就不得不提前收回貸款。假設(shè)銀行只能收回80%的本錢。若只有一個(gè)客戶要求提前取款,則銀行會(huì)償還其全部本金,余款則屬于另一客戶;若兩客戶同時(shí)要求提前取款,則平分回收的資金。27多階段靜態(tài)博弈簡例:擠兌博弈根據(jù)上述假設(shè),可以用圖2-20的兩個(gè)矩陣表示該問題。不存存款不存1,11,1存款1,1下一階段提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客戶2客戶1圖2-20銀行擠兌風(fēng)險(xiǎn)客戶2客戶1第一階段第二階段28多階段靜態(tài)博弈簡例:擠兌博弈用逆推歸納法來分析該博弈。在第二個(gè)階段的博弈。這是一個(gè)二人完全信息靜態(tài)博弈,可以得出該博弈有兩個(gè)純策略納什均衡(提前,提前)和(到期,到期)。對應(yīng)的支付情況分別為(0.8,0.8)和(1.2,1.2)。分別為風(fēng)險(xiǎn)占優(yōu)均衡和帕雷托占優(yōu)均衡。提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客戶2客戶1第二階段29多階段靜態(tài)博弈簡例:擠兌博弈其中,風(fēng)險(xiǎn)占優(yōu)均衡就是“擠兌”現(xiàn)象,而帕雷托占優(yōu)則是金融健康的經(jīng)濟(jì)現(xiàn)象。若采用風(fēng)險(xiǎn)占優(yōu)策略的客戶比例較大,超出了銀行承受能力,就可能會(huì)造成金融危機(jī)。提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客戶2客戶1第二階段30如果第二個(gè)階段博弈結(jié)果是比較理想的(到期,到期)納什均衡,那么這時(shí)候第一階段的博弈相當(dāng)于圖2-21的支付矩陣(完全信息靜態(tài)博弈)。不存存款不存1,11,1存款1,1下一階段提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2第一階段31如果第二個(gè)階段博弈結(jié)果是比較理想的(到期,到期)納什均衡,那么這時(shí)候第一階段的博弈相當(dāng)于圖2-21的支付矩陣(完全信息靜態(tài)博弈)。不存存款不存1,11,1存款1,11.2,1.2多階段靜態(tài)博弈簡例:擠兌博弈圖2-21第一階段等價(jià)博弈(1)32此時(shí)也有兩個(gè)純戰(zhàn)略納什均衡,為(不存,不存),(存款,存款),且后一個(gè)均衡策略帕雷托優(yōu)于前一個(gè),同時(shí)也是風(fēng)險(xiǎn)占優(yōu)均衡。因此,兩客戶都會(huì)選擇存款給銀行。這是銀行融資信用很好起的作用。不存存款不存1,11,1存款1,11.2,1.2多階段靜態(tài)博弈簡例:擠兌博弈圖2-21第一階段等價(jià)博弈(1)33如果第二個(gè)階段博弈結(jié)果是不甚理想的(提前,提前)納什均衡,那么這時(shí)候第一階段的博弈支付如圖2-22的矩陣。此時(shí)(不存,不存)是兩客戶的納什均衡,也是占優(yōu)均衡。因此,兩客戶都會(huì)選擇“不存”,這相當(dāng)于客戶不再信任銀行的情況。但這時(shí)候不會(huì)引起銀行擠兌現(xiàn)象及金融危機(jī)。因?yàn)闆]有人存錢給銀行。不存存款不存1,11,1存款1,10.8,0.8多階段靜態(tài)博弈簡例:擠兌博弈圖2-22第一階段等價(jià)博弈(2)34多階段靜態(tài)博弈簡例:擠兌博弈由該模型,可將由于擠兌導(dǎo)致的金融危機(jī)解釋為:在金融穩(wěn)定時(shí)期,社會(huì)閑散資金會(huì)選擇銀行;企業(yè)多數(shù)從銀行貸款進(jìn)行發(fā)展,但若從事的項(xiàng)目風(fēng)險(xiǎn)較大,有些企業(yè)可能到期不能償還貸款;社會(huì)儲戶由于上述信息引起恐慌,引發(fā)擠兌現(xiàn)象;擠兌現(xiàn)象達(dá)到一定程度,引發(fā)一些銀行倒閉;金融危機(jī)由此產(chǎn)生。35多階段靜態(tài)博弈簡例:工作競賽博弈論在經(jīng)濟(jì)、機(jī)制理論上的應(yīng)用,是現(xiàn)代博弈論的一個(gè)重要應(yīng)用領(lǐng)域。傳統(tǒng)經(jīng)濟(jì)理論分析往往是“思辨似的”,“語言式的”分析方式,“一千個(gè)讀者就有一千個(gè)哈姆雷特”。因此,在看似合理的分析的同時(shí),可能產(chǎn)生不同甚至相互矛盾的結(jié)論也就不足為奇了博弈論以定量化分析為主要特色,分析更具有嚴(yán)密性。36工作競賽問題描述有兩個(gè)工人,工人i(i=1或2)的產(chǎn)出,可用yi=ei+εi,其中ei

是努力程度,εi是隨機(jī)擾動(dòng)項(xiàng)。多階段靜態(tài)博弈簡例:工作競賽37生產(chǎn)程序如下:第一,兩個(gè)工人同時(shí)選擇非負(fù)的努力水平ei≥0;第二,隨機(jī)擾動(dòng)項(xiàng)ε1,ε2彼此獨(dú)立,并服從期望值為0、密度為f(ε)的概率分布;第三,工人的產(chǎn)出可以觀測,但各自選擇的努力水平無法觀測,從而工人的工資可以決定于個(gè)人的產(chǎn)出,但無法直接取決于其努力水平。多階段靜態(tài)博弈簡例:工作競賽38老板的激勵(lì)措施是,工作競賽的優(yōu)勝者(即產(chǎn)出水平較高的工人)獲得的工資為wH;失敗者的工資為wL.工人獲得工資水平w并付出努力程度e時(shí)的收益為u(w,e)=w–g(e),其中g(shù)(e)表示努力工作帶來的負(fù)效用,是遞增的凸函數(shù)(g’>0,g’’>0)。老板的收益為y1+y2-wH-wL多階段靜態(tài)博弈簡例:工作競賽39記老板為參與人1,他的行動(dòng)a1是選擇工作競賽中的工資水平wH,wL;兩個(gè)工人是參與人3,4,他們觀測第一階段選定的工資水平,然后同時(shí)選擇行動(dòng)a3,a4,也就是選擇努力的程度e1,e2參與者各自的收益如前面所給出。多階段靜態(tài)博弈簡例:工作競賽40分析假定老板已經(jīng)選定了工資水平wH,wL,如果一對努力水平組合(e1*,e2*)是第二階段兩工人博弈的納什均衡,則對于每一個(gè)i,ei*必須使工人的期望工資減去努力帶來的負(fù)效用后的凈收益最大,即多階段靜態(tài)博弈簡例:工作競賽41進(jìn)一步化簡該式,得其中多階段靜態(tài)博弈簡例:工作競賽42進(jìn)一步化簡該式,得多階段靜態(tài)博弈簡例:工作競賽上式的一階最優(yōu)條件為43該式的含義是,工人i選擇努力程度ei,從而使得額外努力的邊際負(fù)效用g’等于增加努力的邊際收益,后者又等于對優(yōu)勝者的獎(jiǎng)勵(lì)工資(wH-wL),乘以因努力程度提高而使獲勝概率的增加。多階段靜態(tài)博弈簡例:工作競賽44根據(jù)貝葉斯法則多階段靜態(tài)博弈簡例:工作競賽45于是一階條件可化為多階段靜態(tài)博弈簡例:工作競賽46于是一階條件可化為多階段靜態(tài)博弈簡例:工作競賽在對稱均衡下,e1*=e2*=e*,得到新的式子47于是一階條件可化為多階段靜態(tài)博弈簡例:工作競賽在對稱均衡下,e1*=e2*=e*,得到新的式子48階段結(jié)論由于g(e)是凸函數(shù),優(yōu)勝獲得的獎(jiǎng)勵(lì)越高,就會(huì)激發(fā)更大的努力;另一方面,在同樣的獎(jiǎng)勵(lì)水平下,對產(chǎn)出的隨機(jī)擾動(dòng)因素越大,越不值得努力工作,因?yàn)檫@時(shí)工作競賽的最終結(jié)果在很大程度上取決于運(yùn)氣,而非努力程度。多階段靜態(tài)博弈簡例:工作競賽49按照逆向歸納法,假定工人們同意參加工作競賽,對于給定的wH

和wL的反應(yīng),就是前面描述的對稱納什均衡策略多階段靜態(tài)博弈簡例:工作競賽50假定工人可以尋求其他就業(yè)機(jī)會(huì),得到的效用為Ua,如果老板要使工人有動(dòng)力參加工作競賽,則他必須選擇滿足下式的工資水平多階段靜態(tài)博弈簡例:工作競賽51直觀上就可看出,老板給出的工資水平在滿足下式的基礎(chǔ)上,越低越好。因此,成立多階段靜態(tài)博弈簡例:工作競賽52直觀上就可看出,老板給出的工資水平在滿足下式的基礎(chǔ)上,越低越好。因此,成立多階段靜態(tài)博弈簡例:工作競賽53此時(shí)老板的利潤為多階段靜態(tài)博弈簡例:工作競賽該式的一階條件為54由式子多階段靜態(tài)博弈簡例:工作競賽該式的一階條件為55可以得出多階段靜態(tài)博弈簡例:工作競賽該式的一階條件為56可以得出多階段靜態(tài)博弈簡例:工作競賽與下式聯(lián)立,就可得出老板的最優(yōu)工資確定策略57前向歸納法前面已經(jīng)說明,完美信息動(dòng)態(tài)博弈的經(jīng)典求解方法為逆序歸納法。還有一種分析方式,就是前向歸納法(forwardinduction)。前向歸納法由科爾博格和莫頓斯(1986)提出。這里不進(jìn)行嚴(yán)格的數(shù)學(xué)描述,僅通過一個(gè)例題進(jìn)行說明。58前向歸納法一例:燒錢博弈回顧博弈論的經(jīng)典問題,性別戰(zhàn)博弈PLAYER2LRT3,10,0B0,01,3圖2-23

性別戰(zhàn)博弈PLAYERl59前向歸納法一例:燒錢博弈該博弈有兩個(gè)純策略均衡(T,L),(B,R)以及一個(gè)混合策略均衡。PLAYER2LRT3,10,0B0,01,3圖2-23

性別戰(zhàn)博弈PLAYERl60前向歸納法一例:燒錢博弈現(xiàn)對博弈進(jìn)行稍微修改,見圖2-24圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,261前向歸納法一例:燒錢博弈這時(shí)博弈的合理結(jié)果是什么?圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,262前向歸納法一例:燒錢博弈如果博弈到達(dá)第2階段…圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,263前向歸納法一例:燒錢博弈說明參與人1放棄了第一階段獲取2單位效用的機(jī)會(huì)…圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,264前向歸納法一例:燒錢博弈如果參與人是理性的,必然在第二階段追求更好(>2)的結(jié)局。圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,265前向歸納法一例:燒錢博弈因此,在第二階段,參與人1必然要選取策略T.圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,266前向歸納法一例:燒錢博弈預(yù)見到上述情況,參與人2將選擇策略L圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,267前向歸納法一例:燒錢博弈因此,按照前向歸納法邏輯,合理結(jié)局是…圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,268重復(fù)博弈和無名氏定理重復(fù)博弈(repeatedgame)的定義指同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為“階段博弈(stagegame)”。如兩個(gè)多次犯罪的“囚徒問題”。由于動(dòng)態(tài)博弈是相機(jī)行動(dòng),反映到重復(fù)博弈中,就是可以使自己在某個(gè)階段的博弈選擇依賴于其他參與人過去的行動(dòng)歷史。69重復(fù)博弈和無名氏定理如囚徒困境的重復(fù)博弈的一個(gè)策略可以是:“如果這次你選擇了坦白,我下次將選擇坦白;如果你這次選擇了抵賴,我下次將選擇抵賴”。因此,參與人在重復(fù)博弈中的戰(zhàn)略空間遠(yuǎn)遠(yuǎn)大于和復(fù)雜于在每個(gè)階段博弈中的戰(zhàn)略空間。70重復(fù)博弈和無名氏定理影響重復(fù)博弈均衡結(jié)果的主要因素是博弈重復(fù)次數(shù)和信息的完備性(completeness)。重復(fù)次數(shù)對參與人可能會(huì)有的影響是:參與人為了獲得長遠(yuǎn)利益而犧牲眼前利益的策略成為可能。關(guān)于完備性,簡單地說,但一個(gè)參與人的支付函數(shù)不為其他參與人所知時(shí),該參與人可能有積極性建立一個(gè)“好”的聲譽(yù)(reputation)以換取長遠(yuǎn)利益。在社會(huì)行為中,經(jīng)??梢钥吹奖举|(zhì)不好的人在相當(dāng)長的時(shí)期內(nèi)干好事的原因。該部分內(nèi)容在不完全信息動(dòng)態(tài)博弈中再作分析。71重復(fù)博弈和無名氏定理有限次重復(fù)博弈:連鎖店悖論考慮如圖2-25所示的市場進(jìn)入博弈。如果進(jìn)入者先行動(dòng),則可表示為完全信息動(dòng)態(tài)博弈的博弈樹形式,見圖2-26。圖中A表示進(jìn)入者,B表示在位者。圖2-25市場進(jìn)入博弈默許斗爭進(jìn)入40,50-10,0不進(jìn)入0,3000,300在位者進(jìn)入者72該博弈唯一的子博弈精煉納什均衡結(jié)果是進(jìn)入者進(jìn)入,在位者默許,分別得到40和50的支付。不進(jìn)入進(jìn)入斗爭默許(0,300)(0,300)圖2-26市場進(jìn)入博弈ABB(40,50)(-10,0)默許斗爭重復(fù)博弈和無名氏定理73重復(fù)博弈和無名氏定理現(xiàn)在假定同樣的市場有20個(gè)(可以理解為在位者有20個(gè)連鎖店),進(jìn)入者每次進(jìn)入一個(gè)市場,博弈就變成了20次重復(fù)博弈。假定進(jìn)入者先進(jìn)入第1個(gè)市場,在位者應(yīng)該作如何反應(yīng)?按照一般的認(rèn)識,在位者應(yīng)該堅(jiān)決進(jìn)行斗爭,即便是損失該市場,但可以阻止其他19個(gè)市場的進(jìn)入者的進(jìn)入。但按照子博弈精練納什均衡分析方法,卻與上述結(jié)論相左。74重復(fù)博弈和無名氏定理分析過程如下:設(shè)想前19個(gè)市場已被進(jìn)入,進(jìn)入者現(xiàn)在進(jìn)入第20個(gè)市場。因?yàn)樵谧詈箅A段,選擇斗爭已沒有任何威懾意義,在位者最優(yōu)選擇是默許,進(jìn)入者將選擇進(jìn)入?,F(xiàn)在考慮第19個(gè)市場。因?yàn)闊o論在位者選擇什么行動(dòng),第20個(gè)市場上的均衡結(jié)果不受影響(因?yàn)檫M(jìn)入者知道第20各市場上在位者將選擇默許),在位者最優(yōu)選擇仍然是默許。75重復(fù)博弈和無名氏定理如此一直倒推回去,我們得到這個(gè)博弈的唯一子博弈精煉均衡是在位者在每一個(gè)市場上都選擇默許,進(jìn)入者在每一個(gè)市場上選擇進(jìn)入。這就是所謂的“連鎖店悖論”(chain-storeparadox,Selten,1978)76重復(fù)博弈和無名氏定理囚徒困境問題與市場進(jìn)入博弈類似,只要博弈的重復(fù)次數(shù)是有限的,最后階段博弈的唯一納什均衡是兩個(gè)囚徒都選擇坦白,且“總是坦白”是唯一的子博弈精煉均衡。上述結(jié)果可以一般化為下述定理。定理:令G是階段博弈,G(T)是G重復(fù)T次的重復(fù)博弈(T<∞)。那么,如果G有唯一的納什均衡,重復(fù)博弈G(T)的唯一子博弈精煉納什均衡結(jié)果是階段博弈G的納什均衡重復(fù)T次(即每個(gè)階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果)。77重復(fù)博弈和無名氏定理上述定理說明,只要博弈的重復(fù)次數(shù)是有限的,重復(fù)本身并不改變囚徒困境的均衡結(jié)果。上述定理中“唯一性”是一個(gè)重要條件。如果納什均衡不是唯一的,上述結(jié)論就不一定成立。當(dāng)博弈有多個(gè)納什均衡時(shí),參與人可以使用不同的納什均衡懲罰前面階段的不合作行為或獎(jiǎng)勵(lì)第一階段的合作行為。78重復(fù)博弈和無名氏定理前述連鎖店悖論的一個(gè)解釋是引入信息的不完全性。在不完全信息動(dòng)態(tài)博弈中,可以看到這一點(diǎn)。這里先給出一個(gè)解釋模型,即當(dāng)博弈重復(fù)無窮多次而不是有限次時(shí),存在著完全不同于一次博弈的子博弈精煉均衡。以囚徒問題為例,對此進(jìn)行說明。79重復(fù)博弈和無名氏定理為便于討論,將囚徒問題復(fù)制于此,見圖2-27。可以證明,如果參與人有足夠的耐心,(抵賴,抵賴)是一個(gè)子博弈精煉納什均衡結(jié)果。圖2-27囚徒困境問題坦白抵賴坦白-8,-80,-10抵賴-10,0-1,-1囚徒2囚徒180考慮下列所謂的“冷酷戰(zhàn)略”(grimstrategies):開始時(shí)選擇抵賴;選擇抵賴直到有一方選擇了坦白,然后永遠(yuǎn)選擇坦白。重復(fù)博弈和無名氏定理圖2-27囚徒困境問題坦白抵賴坦白-8,-80,-10抵賴-10,0-1,-1囚徒2囚徒181重復(fù)博弈和無名氏定理首先證明冷酷戰(zhàn)略是一個(gè)納什均衡回顧一下,所謂納什均衡,就是這樣的一個(gè)狀態(tài),對于任意一個(gè)參與人,給定其他參與人選擇納什均衡策略,該參與人都無法偏離納什均衡策略。因此,證明囚徒問題中冷酷戰(zhàn)略是一個(gè)納什均衡的方法是:給定其中任意一個(gè)參與人堅(jiān)持“冷酷戰(zhàn)略”,另外一個(gè)參與人的最優(yōu)選擇也是堅(jiān)持冷酷戰(zhàn)略。82重復(fù)博弈和無名氏定理設(shè)a為貼現(xiàn)因子(假定兩人貼現(xiàn)因子相同)。如果i在博弈的某個(gè)階段首先選擇了坦白,在該階段得到0單位的支付,優(yōu)于選擇抵賴得到的-1。但這個(gè)機(jī)會(huì)主義行為將觸發(fā)他的伙伴選擇“永遠(yuǎn)坦白”的懲罰,因此i隨后每個(gè)階段的支付都是-8。因此,如果下列條件滿足,給定對手沒有選擇坦白,i將不會(huì)選擇坦白即83重復(fù)博弈和無名氏定理該式可以化簡為a≥1/8同樣道理,若對手首先選擇了坦白,不論a的值為多少,參與人i都有積極性堅(jiān)持冷酷戰(zhàn)略。因此,冷酷戰(zhàn)略是一個(gè)納什均衡。84重復(fù)博弈和無名氏定理該戰(zhàn)略是否是子博弈精煉均衡?因?yàn)椴┺闹貜?fù)無限次,從任何一個(gè)階段開始的子博弈與這個(gè)博弈的結(jié)構(gòu)完全相同。在冷酷戰(zhàn)略均衡下,子博弈可以分為兩類:在類型a,沒有任何參與人曾經(jīng)坦白;在類型b,至少有一個(gè)參與人曾經(jīng)坦白。85重復(fù)博弈和無名氏定理在類型a中,我們已經(jīng)證明,冷酷戰(zhàn)略在a類型子博弈

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論