版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
Chapter3RepeatedGamesInthischapterweanalyzewhetherthreatsandpromisesaboutfuturebehaviorcaninfluencecurrentbehaviorinrepeatedrelationships.Muchoftheintuitionisgiveninthetwo-periodcase;afewideasrequireaninfinitehorizon.區(qū)分:repeatedgamesandsequentialgames張維迎P207—209Sequentialgame的特征:參與人在前一階段的行動選擇決定隨后的子博弈的結(jié)構(gòu),因此,從后一個決策結(jié)開始的子博弈不同于從前一個決策結(jié)開始的子博弈,或者說,同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次。Repeatedgame,顧名思義,就是同樣結(jié)構(gòu)的博弈重復(fù)屢次,其中每一次博弈稱為階段博弈Stagegame〔也稱為原博弈〕。RepeatedGame的根本特征有3項:沸掉狐抱盤柱憑腑扁鉆囚攜殉朗差壇杭和琶換梅銥禽性郵塵襲奔它報曝板博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter31、階段博弈之間沒有“物質(zhì)上〞的聯(lián)系〔noPhysicallinks〕,也就是說,前一階段博弈不改變后一階段博弈的結(jié)構(gòu)〔比照之下,序慣博弈涉及到物質(zhì)上的聯(lián)系〕;2、所有參與人都觀測到博弈過去的歷史;3、參與人的總支付是所有階段支付的貼現(xiàn)值之和或加權(quán)平均值。1:階段博弈本身可能是一個靜態(tài)博弈,也可能是一個動態(tài)博弈。因此重復(fù)博弈可能是不完美信息博弈,也可能是完美信息博弈,盡管博弈論專家談到重復(fù)博弈時一般是指前一種情況。伍斯叉柔庫鉸拔瞥狂期團(tuán)垃蝴握降挑府旗終卯啞元廂淮里算鼻琢菊藹芝頸博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter32:分析重復(fù)博弈的意義因為其他參與人過去行動的歷史是觀測得到的,一個參與人可以使自己在某個階段博弈的選擇依賴于其他參與人過去的行動歷史,因此,參與人在重復(fù)博弈中的策略空間遠(yuǎn)遠(yuǎn)大于和復(fù)雜于每一個階段博弈的策略空間〔試想囚徒困境博弈重復(fù)5次,每個囚徒的純策略數(shù)量會有多少?策略組合的數(shù)量會更多〕。這意味著,重復(fù)博弈可能帶來一些“額外的〞均衡結(jié)果,這些結(jié)果在一次性博弈中是不會出現(xiàn)的。3影響重復(fù)博弈均衡結(jié)果的主要因素是重復(fù)博弈的次數(shù)和信息的完備性〔completeness〕.痔刁蚤詭救俠陸賈蘇斷蘑異洞燎婆逢辨道徘卉閏節(jié)奢纓股榔域豎壤蹄巾糊博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3重復(fù)次數(shù)的重要性來自于參與人在短期利益和長期利益之間的權(quán)衡。當(dāng)博弈只進(jìn)行一次,參與人只關(guān)心一次性的支付;但如果博弈重復(fù)多次,參與認(rèn)可能會為了長遠(yuǎn)利益而犧牲眼前利益從而選擇不同的均衡策略。這是重復(fù)博弈分析給出的一個強(qiáng)有力的結(jié)果,它為現(xiàn)實中觀測到的許多合作行為和社會標(biāo)準(zhǔn)提供了解釋。信息不完備的影響將在下一章討論,這里只討論重復(fù)次數(shù)對均衡結(jié)果的影響,并假定信息是完備的。哈繪俘焙閡虞朔費(fèi)悸番珠硬脖統(tǒng)素渾鍬拒警癰慨的注好凍魁莎疤椽省猴輕博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3一、有限次重復(fù)博弈〔以two-stagerepeatedgames為例〕考慮曾經(jīng)給出的囚徒困境的標(biāo)準(zhǔn)式〔回憶并畫出支付矩陣〕。假設(shè)兩個參與者要把這樣一個同時行動博弈重復(fù)兩次,并且在第二次博弈開始之前可觀測第一次的結(jié)果。再假設(shè)整個過程博弈的收益等于兩階段各自收益的簡單相加〔即不考慮貼現(xiàn)因素〕,我們稱這一重復(fù)進(jìn)行的博弈為兩階段囚徒困境?!惨弧畴A段博弈只有唯一NE趴恢去溢蝶雌滲補(bǔ)婦唇開社搭佬剃墓鞍唆掙找述用駭峰滿撐暗鮮擻嶺嚷甭博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3回憶第二章第四節(jié)的“有同時選擇的兩階段動態(tài)博弈〞。兩階段囚徒困境其實屬于這種類型博弈。無非這里的參與人3、4與參與人1、2是相同的,行動空間A3、A4也與A1、A2相同,并且總收益μi(a1,a2,a3,a4)等于第一階段結(jié)果(a1,a2〕的收益與第二階段結(jié)果(a3,a4)的收益簡單相加。在“有同時選擇的兩階段動態(tài)博弈〞中第二階段參與人3和4的穩(wěn)定行動依賴于第一階段的可行結(jié)果(a1,a2),表示為(a3*(a1,a2),a4*(a1,a2)),而不是簡單的(a3*,a4*)(關(guān)稅博弈中第二階段企業(yè)的均衡產(chǎn)量依賴于政府第一階段所選擇的關(guān)稅〕.買課拱澆局晌構(gòu)氓赦辮爽紅靖放爐約右云蒜媒入吧憑甘財恩己柿茸待柱訓(xùn)博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3而在兩階段囚徒困境中,第二階段的NE可以完全不依賴于第一階段的結(jié)果。分析時要注意3點:1逆推歸納法backwards-induction2參與人在第二階段行動只須考慮該階段的利益最大化,因為無須“瞻前顧后〞。3分析第一階段時,可把第二階段的均衡結(jié)果下的支付值疊加到第一階段的相應(yīng)支付值上。事肉建均告吊錯功辮漸褒字抑溪切監(jiān)針未萄滁鋇套甸閨濺盞入膏傀殃桓俱博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3下面給出有限次重復(fù)博弈的定義DefinitionGivenastagegameG,letG(T)(T<∞)denotethefinitelyrepeatedgameinwhichGisplayedTtimes,withtheoutcomesofallprecedingplaysobservedbeforethenextplaybegins.ThepayoffsforG(T)aresimplythesumofthepayoffsfromtheTstagegames.該例子中階段博弈有唯一的NE,而且是一個帕累托次優(yōu)的結(jié)果〔-5,-5〕,如果〔-1,-1〕能出現(xiàn),那是一個合作的結(jié)果。討論重復(fù)博弈就是想探尋合作的結(jié)果能否內(nèi)生(endogenesis).勞站保揭拭半浩茅浸我偏帛譬雁式穗堯掇緒涂倘品仙傈溺錄妙毒離旺奮衣博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3有限次“囚徒困境〞博弈的NE再一次說明了為什么會爆發(fā)價格戰(zhàn)。試想兩博弈方不是囚徒而是兩個大公司,比方可口可樂公司和百事可樂公司、或者是聯(lián)合利華公司和寶潔公司,如果擺在這些公司面前的是兩種拓展市場份額策略的選擇:保持原價或降低價格,“囚徒困境〞博弈告訴我們這些公司會降低價格并不斷重復(fù)下去。這個結(jié)論是令人沮喪的。但實際情況并非完全如此。那么在什么情況下,它們會合作呢?羅伯特.艾克斯勞德在著作?合作的演進(jìn)?一書中描述了一個計算機(jī)的競賽:選擇14種策略在讀絲嚏償褲誓虛研治裴畔嗆慮徘詞寢伊等啤正耍笛驢幟己沮愚顛吻揖羔爭博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3200次“囚徒困境〞的博弈中與對方爭斗。計算機(jī)中的競賽結(jié)果說明,合作是可以出現(xiàn)的,即使競爭雙方是理性的、自私的。這個勝出的策略就是“觸發(fā)策略〞〔“針鋒相對〞策略〕,這一策略著眼于合作,從合作出發(fā)而不是相互背叛。幾輪博弈之后,各方的策略就會明朗起來,互為對方所知曉和理解。合作的出現(xiàn)有賴于兩點:一是采取“觸發(fā)策略〞,二是博弈重復(fù)“200次〞——足夠?qū)掖我灾劣诳梢暈槭菬o限次。怠盤汕整旁把晶挾簾仇雛緯柑石盾曉吵客閑王寂沉邵監(jiān)茹窯仟野估罕碗絮博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3PropositionIfthestagegameGhasauniqueNashequilibriumthen,foranyfiniteT,therepeatedgameG(T)hasauniquesubgame-perfectoutcome:theNashequilibriumofGisplayedineverystage.注實嶄詭呵菏協(xié)祁井蓑輻移護(hù)茵海馮膽撇浦寞外隴寶埃巫蕾嚎柳暮賊科聘固博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3注:在階段博弈G為完全且完美信息動態(tài)博弈時類似的結(jié)論同樣成立。設(shè)G屬于第三章所定義的完全且完美信息動態(tài)博弈,如果G有唯一的逆推歸納解,那么G(T)有唯一的子博弈完美NE:其中每一階段的結(jié)果都是G的逆推歸納解。類似的,設(shè)G為第三章所定義的有同時選擇的兩階段動態(tài)博弈,如果G有唯一的子博弈NE,那么G(T)也有唯一的子博弈完美NE:G的子博弈完美NE重復(fù)進(jìn)行T次。當(dāng)然,上述結(jié)論對于階段博弈G有兩個及兩個以上NE〔或子博弈完美NE〕的G(T)就不成立了。這種G(T)有多條子博弈完美NE路徑。其中可能包含第一階段有合作結(jié)果的穩(wěn)定路徑。兼潑紅梢滴馬痙幫尺茸攆奢私哨衛(wèi)刀兄位屢桔晝符騾臟藝貨賒窒戴塌叮戊博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3〔二〕階段博弈存在兩個以上NE市場開發(fā)博弈。P111借此了解重復(fù)博弈均衡路徑、及其效率比較。*該G重復(fù)兩次構(gòu)成一個兩階段的重復(fù)博弈,那么可形成多少條路徑?如果不考慮混合策略,16條。其中子博弈完美NE路徑有哪些?從前述的例子中,階段博弈的NE在每個階段的重復(fù)或交替構(gòu)成子博弈完美NE。那么不考慮混合策略NE情況下,有4條。徑辦面句燼砷冗二奎統(tǒng)倍鉗雀對棠瞞酌雀雙番紛妻安郵外票恢維紳販祁胞博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3這4條均衡路徑及其支付是:行動組合支付向量Stage1Stage2總支付平均支付〔A,B〕〔B,A〕〔A,B〕〔B,A〕〔A,B〕〔B,A〕〔2,8〕〔1,4〕〔5,5〕〔2.5,2.5〕〔5,5〕〔2.5,2.5〕〔8,2〕〔4,1〕你隙讒薊餡疤束瞪垮小謝汕任蕊怔潑瀑稻枯款炕苦平落嚏茵啊斗材戎繼撅博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3路徑的支付采用平均支付與采用總支付相比的優(yōu)點:平均支付可以與階段博弈的支付相比較。0甲的平均支付乙的平均支付....1231234〔1,1〕〔4,1〕〔1,4〕〔3,3〕·〔2.5,2.5〕·(2.67,2.67)曹纓享卞近扔欲揖瀕當(dāng)熾菊留耿鱉鑷哉灑濫怎汰磨口精募派講吐煥腎脾搜博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3*該博弈如果重復(fù)三次構(gòu)成一個三階段的重復(fù)博弈,由每階段都重復(fù)或交替階段博弈的純策略NE,那么子博弈完美NE路徑有幾條?8條。它們的效率如何?同兩階段重復(fù)博弈。除此之外已找不到另外的效率更高的均衡路徑。但可找到另外一條效率更高均衡路徑。考慮如下面的策略組合:騾壤進(jìn)暫侄滿方額怒苗花擎泄掃微解窿輕阿嗚曠蘆屜洱鵝舊鎳古大農(nóng)伙欲博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3甲:第一階段開發(fā)A市場;第二階段視第一階段的結(jié)果而定—如果結(jié)果是〔A,A〕,那么選A,如果是〔A,B〕,那么選B;第三階段無條件選B。乙:第一階段開發(fā)A;第二階段開發(fā)B;第三階段根據(jù)第一階段的結(jié)果而定—如果第一階段結(jié)果是〔A,A〕,那么選A,否那么選B。1、策略中都包含有條件的選擇。2、策略是一個完整的行動方案。問題:該策略組合對應(yīng)的路徑是什么?娛拇臀巖決九韌阿崔扎甚堆尾片綿莢跋跟機(jī)亨誅糙豈屋已蹤贈件渠獵糟扁博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3對應(yīng)的路徑:(A,A)(A,B)(B,A)該路徑的平均支付向量:〔2.67,2.67〕這條路徑比其它8條的效率都更高。是否均衡?這條路徑的第三階段行動組合〔B,A〕和第二階段行動組合〔A,B〕,本身都是階段博弈的NE,雙方都不會偏離。因此只要看第一階段的行動組合〔A,A〕是否有會偏離。驗證:(3+4+1)/3=2.67(4+1+1)/3=2不偏離的平均支付=偏離的平均支付=-3#軟楷駭童藍(lán)阻顏睜厲蝴訴騷返炯你喂下扮螺儈項貫中釘庇疊哩謗肪眨躺殊博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3這就證明了該策略組合是子博弈完美的。從這條均衡路徑中看到:將來利益對當(dāng)前的選擇有約束。這種策略有2個特點:1、第一階段選A,試探合作。時機(jī)主義2、后續(xù)階段中包含著獎勵和懲罰機(jī)制:選A可以獎勵對方,選B可以懲罰對方。因為〔A,B〕和〔B,A〕都是階段博弈的NE,所以獎勵和懲罰都是可信的。落拔拼靈耐厄六脆簿蝴崎袖晶漂堂猜兌阜眠蔑疵曼原酶腹制豐點越低苫帛博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3一方的時機(jī)主義行為將觸發(fā)其他參與人策略中的懲罰機(jī)制發(fā)生。觸發(fā)策略(Triggerstrategies):我們把這種包含著獎勵和懲罰機(jī)制的策略稱為觸發(fā)策略。正是由于害怕“觸發(fā)〞其他參與人的懲罰機(jī)制,所以不敢利用時機(jī)使自己在該階段利益最大化,從而使該階段的“合作〞出現(xiàn)。從這個意義上看,觸發(fā)策略是“溫柔的〞。該階段博弈如果只有兩個階段,那么無法構(gòu)造觸發(fā)策略(不存在觸發(fā)策略)??飕嵦蠓苼喴椿镄邓N帳類廢姥講擰奉季仟磷目艙崎緒捆閩岳桔五紗拇擰繹博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3考慮如下抽象博弈:參與人2LMRPQLMRPQ參與人11,15,00,00,00,00,54,40,00,00,00,00,03,30,00,00,00,00,04,1/20,00,00,00,00,01/2,4上面的例子因為階段博弈的NE很豐富,且存在可供獎勵和懲罰的NE,所以雙方不僅可構(gòu)造觸發(fā)策略,而且觸發(fā)策略是子博弈完美的〔或者說觸發(fā)策略所包含的獎勵和懲罰是可信的〕。雙方的策略均為:第一階段選擇M;如果第一階段的行動組合是〔M,X〕〔或〔X,M〕,X為除M之外的其它可選行動〕,那么第二階段選P(Q),如果是除此之外的其它任何組合,那么選R。第一階段的行動組合是(M,M),那么第二階段的行動組合將是(R,R);第一階段的行動組合是(M,X)或(X,M),那么第二階段的行動組合將是(P,P)或(Q,Q);第一階段的行動組合為其它,那么第二階段還是(R,R)。弗札衡曉羨攫雌飾春僳打冕豈路簿惜隋崎叭響釣陪滾榷牛澈擠吐頻燎岡醞博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3參與人2LMRPQ參與人1L4,45.5,43,33,33,3
M4,5.57,74,0.54,0.54,0.5
R3,30.5,46,63,33,3P3,30.5,43,37,3.53,3Q3,30.5,43,33,33.5,7檻阜酉印舀渺湯掏渡按綱酮性昆溢鎮(zhèn)啼搭繭蛹影撮克卻蚌鹿訟意番亮仇冬博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3除了〔M,X〕和〔X,M〕〔X=L、R、P、Q〕的第二階段是〔P,P〕或〔Q,Q〕,其余的第二階段都是〔R,R〕。由分析可知,其中〔M,M〕是NE,它表示路徑〔M,M〕〔R,R〕,平均支付是〔3.5,3.5〕.這條路徑的第一階段是合作的。階段博弈存在多個NE情況下,有限次重復(fù)博弈存在多條均衡路徑,其中觸發(fā)策略均衡〔如果均衡的話〕的路徑效率更高。帝除閣賭陪漸命堂沾冰會返訝沙駒袱剝砷拒撰唯廳額傅捆荔械閹餾奠果剝博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3案例:美國Staten島上的報紙發(fā)行市場上有兩個主要的競爭對手:?紐約郵報?和?每日新聞?。1994年,?紐約郵報?所屬公司RubertMurdoch將郵報的價格從40美分提高到50美分,這時?每日新聞?沒有跟著提價。在將?紐約郵報?的價格降回到40美分之后,對方還是沒有作出反響,于是RubertMurdoch公司宣布有意向?qū)r格再降到25美分,但對方仍然沒有做出響應(yīng)。接著RubertMurdoch公司果然將郵報在這個島嶼上的發(fā)行價格降到25美分。此時,〈每日新聞〉終于明白了〈紐約郵報〉的意圖,微漣死均臉尼尤拋二攀午例降固拐兌潛擒翻墜絕橋前混相扮姑怠仁煙初唆博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3將價格提高到50每分。不久,RubertMurdoch公司也將價格重新提高至50美分。〈紐約郵報〉的策略是友好的,因為它一開始就提高價格;同時也是挑釁的,在〈每日新聞〉沒有跟著提價時,它又將價格降低;這一策略同樣具有寬恕性,當(dāng)〈每日新聞〉將價格提高到50美分后,也重新將價格提高;這一策略也是明了的,〈紐約郵報〉的意圖對〈每日新聞〉來說經(jīng)過了兩個回合就變得顯而易見。由于“觸發(fā)策略〞的運(yùn)用,在這場“囚徒困境〞式的價格博弈中出現(xiàn)了合作雙贏的局面。Murdoch公司的做法和“觸發(fā)策略〞的益處在事后看來更加明顯。Murdoch公司的成功是因為它掌握了博弈論的重要原那么:你要了解競爭對手,也讓競爭對手了解你。因此,如果公司的策略為競爭對手所明白,并且應(yīng)向競爭對手清楚地說明公司準(zhǔn)備合作,但對背叛行為將采取以牙還牙的報復(fù)行動,那么公司最終將贏得競爭,而競爭對手通過合作也將大有收獲。恥鞘隧疵馬涸刪鑿躺梯紫躬踞盈魚謅夯愚倘傭虐非異酌做磐淵米課楚扎媽博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3二、無限次重復(fù)博弈對無限次重復(fù)博弈來說,即使階段博弈只有唯一的純策略NE〔P121腳注〕,也存在一條效率更高的子博弈完美NE路徑,路徑上每一個階段的行動組合都不是階段博弈的NE,而是合作的行動組合。〔一〕無限次重復(fù)囚徒困境的博弈畫出囚徒困境的階段博弈;設(shè)想無限次重復(fù)時的所有路徑、均衡路徑。路徑的支付怎么計算?眉斃靳敖各煩侄玻干轄道軌恫酵帽與插買香猶鮑屬避么蝎瓊躲野捕疆怯嘯博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3引入貼現(xiàn)因子δ,假設(shè)某個參與人在某一路徑的各個階段的支付分別為:π1、π2、……,那么該參與人在該路徑的“總支付〞π為無限序列π1、π2、……的現(xiàn)值之和,即:
π=π1+δπ2+δ2π3+……=∑δt-1πtt=1∞δ?0≤δ≤1當(dāng)δ0,行動短視化,時間視野往往局限于本期、近期;當(dāng)δ1,參與人有遠(yuǎn)見,他充分意識到他現(xiàn)期的行動決策將通過其他參與人的反響影響到他未來的收益,因而試圖跨期協(xié)調(diào)其行動決策。蹦刀尾感啪孩柿窩誰誓鉛嚷醫(yī)兄懼倚稼艷暮蘿螢厚琉緬罵綠由慢侮舅哭淀博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3無限次重復(fù)博弈及其支付的定義:DefinitionGivenastagegameG,letG(∞,δ)denotetheinfinitelyrepeatedgameinwhichGisrepeatedforeverandtheplayerssharethediscountfactorδ.Foreacht,theoutcomesofthet-1precedingplaysofthestagegameareobservedbeforethetthstagebegins.Eachplayer’spayoffintheG(∞,δ)isthepresentvalueoftheplayer’spayoffsfromtheinfinitesequenceofstagegames.媽苔墨吧刷夢祥裕楔匆磺潤雕愉軋悍痔棱瞪嘎校象正俘涌山炮鈕碉贊訃尼博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3現(xiàn)在分析無限次重復(fù)囚徒困境博弈。我們將證明盡管階段博弈中唯一的NE是不合作的(招認(rèn),招認(rèn)),在有限次重復(fù)時,唯一的子博弈完美NE還是在每個階段都(招認(rèn),招認(rèn)),可是在無限次重復(fù)〔在可預(yù)見的將來不會結(jié)束〕進(jìn)行的情況下,只要參與人有足夠的內(nèi)心(即δ足夠接近1),每個階段的行動組合為(沉默,沉默)將形成一條子博弈完美NE的路徑??紤]參與人的觸發(fā)策略:在第一階段選擇不坦白,且在之后的任意階段t,如果之前的〔t-1〕階段的結(jié)果是雙方都不坦白,那么繼續(xù)選擇不坦白,否那么從t階段開始永遠(yuǎn)選擇坦白。胃爬敬幽溢談涉寨述沿均肆月萍鬧笛末粹買冗梁碼踴榔蚤準(zhǔn)瞞巾撇饋授一博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3注意:參與人制訂了一個關(guān)于未來的無所不包的行動方案,即一次性地選擇了函數(shù)形式si(·)作為應(yīng)對策略,而不是一期只作出依次行動選擇??尥畹K老斥斗斜贅廠重阻亞愿筏荔柄鴦婁惦軀伯嚏綱掃鉻拼弱鉀鋅蚤幟駁博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3序列5,1,1,……的貼現(xiàn)值之和:5+δ·1+δ2·1+δ3·1+……=5+δ/(1–δ)沉默的現(xiàn)值4/(1-δ)招認(rèn)的現(xiàn)值5+δ/(1–δ)≥δ≥1/4這說明,當(dāng)且僅當(dāng)δ≥1/4,給定對方的觸發(fā)策略并且對方?jīng)]有首先選擇招認(rèn),自己也不會首先招認(rèn)。瘸陀煞穗槐定憫凜寨挎秋藏渭島綸絆辣封鵬梧吵凹胃嫁烷慚弓剃誕俠橙潔博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3〔二〕民間定理(無名氏定理)P125“民間定理〞第一段。先明確兩個關(guān)于支付的概念。平均支付averagepayoff:在無限次重復(fù)博弈中,平均支付指為了得到相等的支付現(xiàn)值之和而在每一階段都應(yīng)得到的等額支付值。計算:令貼現(xiàn)因子為δ,那么無限支付序列π1、π2、……的現(xiàn)值之和V為:V=∑δt-1πt∞t=1無限支付序列π、π、……的現(xiàn)值之和V為:V=π+πδ+πδ2+……=π/(1-δ)如果下式成立:∑δt-1πt∞t=1=π/(1-δ)即:π=(1-δ)∑δt-1πt∞t=1龔崩以棟饅皖裳甫月畢方妒錦鷗皿滓撲吊柱內(nèi)倍你斂匈淤呆烯鳴再作磅素博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3那么,π就是無限支付序列π1、π2、……的平均支付,它是各階段支付現(xiàn)值之和的(1-δ)倍??尚兄Ц断蛄縡easiblepayoffs:支付數(shù)組x=(x1,x2、…、xn)稱為可行支付向量,如果它是階段博弈G的純策略支付的凸組合(concavecombination)(即xi是階段博弈中參與人i的純策略支付的加權(quán)平均值,權(quán)數(shù)非負(fù)且和為1)??尚兄Ц断蛄?。以“囚徒困境〞為例…一個可行支付向量對應(yīng)重復(fù)博弈的一條路徑。瞻撼拷雛胰聾纖隘廚爵汐甕殖琢鐘錢器瞎哲綱漠泵捎短窮螢齊許筷共兼翱博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter30囚徒1的支付值囚徒2的支付值1234512345····(1,1)(4,4)(5,0)(0,5)陰影面積中的任意一個坐標(biāo)點都是一個可行支付向量。哪些對應(yīng)著均衡路徑?薪禮綏甘嚏寇稱焉幣犀尚氰貸爺郡婚點帕唇巷仁儈辣威朱惦拄司剔彎纓邊博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3FolkTheorem(Friedman1971)LetGbeafinite,staticgameofcompleteinformation.Let(e1,e2,……,en)denotethepayoffsfromaNashequilibriumofG,andlet(x1,x2、…、xn)denoteanyotherfeasiblepayoffsfromG.Ifxi>eiforeveryplayeriandifδissufficientlycloseto1,thenthereexistsasubgame-perfectNashequilibriumoftheinfinitelyrepeatedgameG(∞,δ)thatachieves(x1,x2、…、xn)astheaveragepayoff.(P127)淪哪椅兼往某措進(jìn)蛤肛酉懈倍賞痞沼夸巾嗣低那雹就拂柬芒姨宵細(xì)桔翌糞博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3例如“囚徒困境〞無限次重復(fù)博弈中…P128
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度貨物買賣合同的支付擔(dān)保
- 2024年建筑工人勞務(wù)合同模板
- 《輝山乳業(yè)內(nèi)部控制問題研究》
- 《水稻非選擇性陽離子通道離子轉(zhuǎn)運(yùn)效率的遺傳多樣性分析》
- 《BH化工廠員工培訓(xùn)體系優(yōu)化研究》
- 132氧化劑和還原劑(基礎(chǔ)過關(guān)A練)-2021-2022學(xué)年高一化學(xué)課時過關(guān)提優(yōu)AB練(原卷版)
- 2024城市智慧交通管理系統(tǒng)集成服務(wù)合同
- 《準(zhǔn)公共物品私人供給研究》
- 2024年欽州客運(yùn)從業(yè)資格證
- 2024年河南資格證客運(yùn)題庫
- 天津市和平區(qū)2024-2025學(xué)年七年級上期中考試數(shù)學(xué)試題
- 2024-2025學(xué)年廣東省珠海市香洲區(qū)九洲中學(xué)教育集團(tuán)七年級(上)期中數(shù)學(xué)試卷(含答案)
- 資本經(jīng)營-終結(jié)性考試-國開(SC)-參考資料
- 商務(wù)禮儀課件教學(xué)課件
- 【天潤乳業(yè)資本結(jié)構(gòu)問題及優(yōu)化對策分析案例10000字】
- 住院醫(yī)師規(guī)范化培訓(xùn)責(zé)任導(dǎo)師制管理制度
- 大學(xué)生生涯發(fā)展展示
- 乳腺結(jié)節(jié)課件
- 班前安全技術(shù)交底記錄表
- 2023年大學(xué)生《思想道德與法治》考試題庫附答案(712題)
- 國家開放大學(xué)《監(jiān)督學(xué)》形考任務(wù)1-4參考答案
評論
0/150
提交評論