博弈論完整課件浙江大學(xué)GAMEChapter3

上傳人：a*** IP屬地：湖北上傳時(shí)間：2024-01-24 格式：PPT 頁(yè)數(shù)：45 大?。?25.50KB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩40頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Chapter3RepeatedGamesInthischapterweanalyzewhetherthreatsandpromisesaboutfuturebehaviorcaninfluencecurrentbehaviorinrepeatedrelationships.Muchoftheintuitionisgiveninthetwo-periodcase;afewideasrequireaninfinitehorizon.區(qū)分：repeatedgamesandsequentialgames張維迎P207—209Sequentialgame的特征：參與人在前一階段的行動(dòng)選擇決定隨后的子博弈的結(jié)構(gòu)，因此，從后一個(gè)決策結(jié)開始的子博弈不同于從前一個(gè)決策結(jié)開始的子博弈，或者說，同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次。Repeatedgame，顧名思義，就是同樣結(jié)構(gòu)的博弈重復(fù)屢次，其中每一次博弈稱為階段博弈Stagegame〔也稱為原博弈〕。RepeatedGame的根本特征有3項(xiàng)：沸掉狐抱盤柱憑腑扁鉆囚攜殉朗差壇杭和琶換梅銥禽性郵塵襲奔它報(bào)曝板博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter31、階段博弈之間沒有“物質(zhì)上〞的聯(lián)系〔noPhysicallinks〕，也就是說，前一階段博弈不改變后一階段博弈的結(jié)構(gòu)〔比照之下，序慣博弈涉及到物質(zhì)上的聯(lián)系〕；２、所有參與人都觀測(cè)到博弈過去的歷史；３、參與人的總支付是所有階段支付的貼現(xiàn)值之和或加權(quán)平均值。１：階段博弈本身可能是一個(gè)靜態(tài)博弈，也可能是一個(gè)動(dòng)態(tài)博弈。因此重復(fù)博弈可能是不完美信息博弈，也可能是完美信息博弈，盡管博弈論專家談到重復(fù)博弈時(shí)一般是指前一種情況。伍斯叉柔庫(kù)鉸拔瞥狂期團(tuán)垃蝴握降挑府旗終卯啞元廂淮里算鼻琢菊藹芝頸博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3２：分析重復(fù)博弈的意義因?yàn)槠渌麉⑴c人過去行動(dòng)的歷史是觀測(cè)得到的，一個(gè)參與人可以使自己在某個(gè)階段博弈的選擇依賴于其他參與人過去的行動(dòng)歷史，因此，參與人在重復(fù)博弈中的策略空間遠(yuǎn)遠(yuǎn)大于和復(fù)雜于每一個(gè)階段博弈的策略空間〔試想囚徒困境博弈重復(fù)５次，每個(gè)囚徒的純策略數(shù)量會(huì)有多少？策略組合的數(shù)量會(huì)更多〕。這意味著，重復(fù)博弈可能帶來一些“額外的〞均衡結(jié)果，這些結(jié)果在一次性博弈中是不會(huì)出現(xiàn)的。３影響重復(fù)博弈均衡結(jié)果的主要因素是重復(fù)博弈的次數(shù)和信息的完備性〔completeness〕.痔刁蚤詭救俠陸賈蘇斷蘑異洞燎婆逢辨道徘卉閏節(jié)奢纓股榔域豎壤蹄巾糊博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3重復(fù)次數(shù)的重要性來自于參與人在短期利益和長(zhǎng)期利益之間的權(quán)衡。當(dāng)博弈只進(jìn)行一次，參與人只關(guān)心一次性的支付；但如果博弈重復(fù)多次，參與認(rèn)可能會(huì)為了長(zhǎng)遠(yuǎn)利益而犧牲眼前利益從而選擇不同的均衡策略。這是重復(fù)博弈分析給出的一個(gè)強(qiáng)有力的結(jié)果，它為現(xiàn)實(shí)中觀測(cè)到的許多合作行為和社會(huì)標(biāo)準(zhǔn)提供了解釋。信息不完備的影響將在下一章討論，這里只討論重復(fù)次數(shù)對(duì)均衡結(jié)果的影響，并假定信息是完備的。哈繪俘焙閡虞朔費(fèi)悸番珠硬脖統(tǒng)素渾鍬拒警癰慨的注好凍魁莎疤椽省猴輕博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3一、有限次重復(fù)博弈〔以two-stagerepeatedgames為例〕考慮曾經(jīng)給出的囚徒困境的標(biāo)準(zhǔn)式〔回憶并畫出支付矩陣〕。假設(shè)兩個(gè)參與者要把這樣一個(gè)同時(shí)行動(dòng)博弈重復(fù)兩次，并且在第二次博弈開始之前可觀測(cè)第一次的結(jié)果。再假設(shè)整個(gè)過程博弈的收益等于兩階段各自收益的簡(jiǎn)單相加〔即不考慮貼現(xiàn)因素〕，我們稱這一重復(fù)進(jìn)行的博弈為兩階段囚徒困境?！惨弧畴A段博弈只有唯一NE趴恢去溢蝶雌滲補(bǔ)婦唇開社搭佬剃墓鞍唆掙找述用駭峰滿撐暗鮮擻嶺嚷甭博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3回憶第二章第四節(jié)的“有同時(shí)選擇的兩階段動(dòng)態(tài)博弈〞。兩階段囚徒困境其實(shí)屬于這種類型博弈。無非這里的參與人3、4與參與人1、2是相同的，行動(dòng)空間A3、A4也與A1、A2相同，并且總收益μi(a1,a2,a3,a4)等于第一階段結(jié)果(a1,a2〕的收益與第二階段結(jié)果(a3,a4)的收益簡(jiǎn)單相加。在“有同時(shí)選擇的兩階段動(dòng)態(tài)博弈〞中第二階段參與人3和4的穩(wěn)定行動(dòng)依賴于第一階段的可行結(jié)果(a1,a2)，表示為(a3*(a1,a2),a4*(a1,a2))，而不是簡(jiǎn)單的(a3*,a4*)(關(guān)稅博弈中第二階段企業(yè)的均衡產(chǎn)量依賴于政府第一階段所選擇的關(guān)稅〕.買課拱澆局晌構(gòu)氓赦辮爽紅靖放爐約右云蒜媒入吧憑甘財(cái)恩己柿茸待柱訓(xùn)博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3而在兩階段囚徒困境中,第二階段的NE可以完全不依賴于第一階段的結(jié)果。分析時(shí)要注意3點(diǎn)：1逆推歸納法backwards-induction2參與人在第二階段行動(dòng)只須考慮該階段的利益最大化，因?yàn)闊o須“瞻前顧后〞。3分析第一階段時(shí)，可把第二階段的均衡結(jié)果下的支付值疊加到第一階段的相應(yīng)支付值上。事肉建均告吊錯(cuò)功辮漸褒字抑溪切監(jiān)針未萄滁鋇套甸閨濺盞入膏傀殃桓俱博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3下面給出有限次重復(fù)博弈的定義DefinitionGivenastagegameG,letG(T)(T＜∞)denotethefinitelyrepeatedgameinwhichGisplayedTtimes,withtheoutcomesofallprecedingplaysobservedbeforethenextplaybegins.ThepayoffsforG(T)aresimplythesumofthepayoffsfromtheTstagegames.該例子中階段博弈有唯一的NE，而且是一個(gè)帕累托次優(yōu)的結(jié)果〔-5，-5〕，如果〔-1，-1〕能出現(xiàn)，那是一個(gè)合作的結(jié)果。討論重復(fù)博弈就是想探尋合作的結(jié)果能否內(nèi)生(endogenesis).勞站保揭拭半浩茅浸我偏帛譬雁式穗堯掇緒涂倘品仙傈溺錄妙毒離旺奮衣博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3有限次“囚徒困境〞博弈的NE再一次說明了為什么會(huì)爆發(fā)價(jià)格戰(zhàn)。試想兩博弈方不是囚徒而是兩個(gè)大公司，比方可口可樂公司和百事可樂公司、或者是聯(lián)合利華公司和寶潔公司，如果擺在這些公司面前的是兩種拓展市場(chǎng)份額策略的選擇：保持原價(jià)或降低價(jià)格，“囚徒困境〞博弈告訴我們這些公司會(huì)降低價(jià)格并不斷重復(fù)下去。這個(gè)結(jié)論是令人沮喪的。但實(shí)際情況并非完全如此。那么在什么情況下，它們會(huì)合作呢？羅伯特.艾克斯勞德在著作?合作的演進(jìn)?一書中描述了一個(gè)計(jì)算機(jī)的競(jìng)賽：選擇14種策略在讀絲嚏償褲誓虛研治裴畔嗆慮徘詞寢伊等啤正耍笛驢幟己沮愚顛吻揖羔爭(zhēng)博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3200次“囚徒困境〞的博弈中與對(duì)方爭(zhēng)斗。計(jì)算機(jī)中的競(jìng)賽結(jié)果說明，合作是可以出現(xiàn)的，即使競(jìng)爭(zhēng)雙方是理性的、自私的。這個(gè)勝出的策略就是“觸發(fā)策略〞〔“針鋒相對(duì)〞策略〕，這一策略著眼于合作，從合作出發(fā)而不是相互背叛。幾輪博弈之后，各方的策略就會(huì)明朗起來，互為對(duì)方所知曉和理解。合作的出現(xiàn)有賴于兩點(diǎn)：一是采取“觸發(fā)策略〞，二是博弈重復(fù)“200次〞——足夠?qū)掖我灾劣诳梢暈槭菬o限次。怠盤汕整旁把晶挾簾仇雛緯柑石盾曉吵客閑王寂沉邵監(jiān)茹窯仟野估罕碗絮博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3PropositionIfthestagegameGhasauniqueNashequilibriumthen,foranyfiniteT,therepeatedgameG(T)hasauniquesubgame-perfectoutcome:theNashequilibriumofGisplayedineverystage.注實(shí)嶄詭呵菏協(xié)祁井蓑輻移護(hù)茵海馮膽撇浦寞外隴寶埃巫蕾嚎柳暮賊科聘固博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3注：在階段博弈G為完全且完美信息動(dòng)態(tài)博弈時(shí)類似的結(jié)論同樣成立。設(shè)G屬于第三章所定義的完全且完美信息動(dòng)態(tài)博弈，如果G有唯一的逆推歸納解，那么G(T)有唯一的子博弈完美NE：其中每一階段的結(jié)果都是G的逆推歸納解。類似的，設(shè)G為第三章所定義的有同時(shí)選擇的兩階段動(dòng)態(tài)博弈，如果G有唯一的子博弈NE，那么G(T)也有唯一的子博弈完美NE：G的子博弈完美NE重復(fù)進(jìn)行T次。當(dāng)然，上述結(jié)論對(duì)于階段博弈G有兩個(gè)及兩個(gè)以上NE〔或子博弈完美NE〕的G(T)就不成立了。這種G(T)有多條子博弈完美NE路徑。其中可能包含第一階段有合作結(jié)果的穩(wěn)定路徑。兼潑紅梢滴馬痙幫尺茸攆奢私哨衛(wèi)刀兄位屢桔晝符騾臟藝貨賒窒戴塌叮戊博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3〔二〕階段博弈存在兩個(gè)以上NE市場(chǎng)開發(fā)博弈。P111借此了解重復(fù)博弈均衡路徑、及其效率比較。*該G重復(fù)兩次構(gòu)成一個(gè)兩階段的重復(fù)博弈，那么可形成多少條路徑？如果不考慮混合策略，16條。其中子博弈完美NE路徑有哪些？從前述的例子中，階段博弈的NE在每個(gè)階段的重復(fù)或交替構(gòu)成子博弈完美NE。那么不考慮混合策略NE情況下，有4條。徑辦面句燼砷冗二奎統(tǒng)倍鉗雀對(duì)棠瞞酌雀雙番紛妻安郵外票恢維紳販祁胞博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3這4條均衡路徑及其支付是：行動(dòng)組合支付向量Stage1Stage2總支付平均支付〔A，B〕〔B，A〕〔A，B〕〔B，A〕〔A，B〕〔B，A〕〔2，8〕〔1，4〕〔5，5〕〔2.5，2.5〕〔5，5〕〔2.5，2.5〕〔8，2〕〔4，1〕你隙讒薊餡疤束瞪垮小謝汕任蕊怔潑瀑稻枯款炕苦平落嚏茵啊斗材戎繼撅博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3路徑的支付采用平均支付與采用總支付相比的優(yōu)點(diǎn)：平均支付可以與階段博弈的支付相比較。0甲的平均支付乙的平均支付．．．．1231234〔1，1〕〔4，1〕〔1，4〕〔3，3〕·〔2.5,2.5〕·(2.67,2.67)曹纓享卞近扔欲揖瀕當(dāng)熾菊留耿鱉鑷哉灑濫怎汰磨口精募派講吐煥腎脾搜博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3*該博弈如果重復(fù)三次構(gòu)成一個(gè)三階段的重復(fù)博弈，由每階段都重復(fù)或交替階段博弈的純策略NE，那么子博弈完美NE路徑有幾條？8條。它們的效率如何？同兩階段重復(fù)博弈。除此之外已找不到另外的效率更高的均衡路徑。但可找到另外一條效率更高均衡路徑?？紤]如下面的策略組合：騾壤進(jìn)暫侄滿方額怒苗花擎泄掃微解窿輕阿嗚曠蘆屜洱鵝舊鎳古大農(nóng)伙欲博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3甲：第一階段開發(fā)A市場(chǎng)；第二階段視第一階段的結(jié)果而定—如果結(jié)果是〔A，A〕，那么選A，如果是〔A，B〕，那么選B；第三階段無條件選B。乙：第一階段開發(fā)A；第二階段開發(fā)B；第三階段根據(jù)第一階段的結(jié)果而定—如果第一階段結(jié)果是〔A，A〕，那么選A，否那么選B。1、策略中都包含有條件的選擇。2、策略是一個(gè)完整的行動(dòng)方案。問題：該策略組合對(duì)應(yīng)的路徑是什么？娛拇臀巖決九韌阿崔扎甚堆尾片綿莢跋跟機(jī)亨誅糙豈屋已蹤贈(zèng)件渠獵糟扁博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3對(duì)應(yīng)的路徑：(A,A)(A,B)(B,A)該路徑的平均支付向量：〔2.67,2.67〕這條路徑比其它8條的效率都更高。是否均衡？這條路徑的第三階段行動(dòng)組合〔B，A〕和第二階段行動(dòng)組合〔A，B〕，本身都是階段博弈的NE，雙方都不會(huì)偏離。因此只要看第一階段的行動(dòng)組合〔A，A〕是否有會(huì)偏離。驗(yàn)證：(3+4+1)/3=2.67(4+1+1)/3=2不偏離的平均支付=偏離的平均支付=-3#軟楷駭童藍(lán)阻顏睜厲蝴訴騷返炯你喂下扮螺儈項(xiàng)貫中釘庇疊哩謗肪眨躺殊博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3這就證明了該策略組合是子博弈完美的。從這條均衡路徑中看到：將來利益對(duì)當(dāng)前的選擇有約束。這種策略有2個(gè)特點(diǎn)：1、第一階段選A，試探合作。時(shí)機(jī)主義2、后續(xù)階段中包含著獎(jiǎng)勵(lì)和懲罰機(jī)制：選A可以獎(jiǎng)勵(lì)對(duì)方，選B可以懲罰對(duì)方。因?yàn)椤睞，B〕和〔B，A〕都是階段博弈的NE，所以獎(jiǎng)勵(lì)和懲罰都是可信的。落拔拼靈耐厄六脆簿蝴崎袖晶漂堂猜兌阜眠蔑疵曼原酶腹制豐點(diǎn)越低苫帛博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3一方的時(shí)機(jī)主義行為將觸發(fā)其他參與人策略中的懲罰機(jī)制發(fā)生。觸發(fā)策略(Triggerstrategies):我們把這種包含著獎(jiǎng)勵(lì)和懲罰機(jī)制的策略稱為觸發(fā)策略。正是由于害怕“觸發(fā)〞其他參與人的懲罰機(jī)制，所以不敢利用時(shí)機(jī)使自己在該階段利益最大化，從而使該階段的“合作〞出現(xiàn)。從這個(gè)意義上看，觸發(fā)策略是“溫柔的〞。該階段博弈如果只有兩個(gè)階段，那么無法構(gòu)造觸發(fā)策略(不存在觸發(fā)策略)?？飕嵦蠓苼喴椿镄邓N帳類廢姥講擰奉季仟磷目艙崎緒捆閩岳桔五紗拇擰繹博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3考慮如下抽象博弈：參與人2LMRPQLMRPQ參與人11,15,00,00,00,00,54,40,00,00,00,00,03,30,00,00,00,00,04,1/20,00,00,00,00,01/2,4上面的例子因?yàn)殡A段博弈的NE很豐富，且存在可供獎(jiǎng)勵(lì)和懲罰的NE，所以雙方不僅可構(gòu)造觸發(fā)策略，而且觸發(fā)策略是子博弈完美的〔或者說觸發(fā)策略所包含的獎(jiǎng)勵(lì)和懲罰是可信的〕。雙方的策略均為：第一階段選擇M；如果第一階段的行動(dòng)組合是〔M，X〕〔或〔X，M〕，X為除M之外的其它可選行動(dòng)〕，那么第二階段選P(Q)，如果是除此之外的其它任何組合，那么選R。第一階段的行動(dòng)組合是(M,M),那么第二階段的行動(dòng)組合將是(R,R);第一階段的行動(dòng)組合是(M,X)或(X，M)，那么第二階段的行動(dòng)組合將是(P,P)或(Q,Q);第一階段的行動(dòng)組合為其它，那么第二階段還是(R,R)。弗札衡曉羨攫雌飾春僳打冕豈路簿惜隋崎叭響釣陪滾榷牛澈擠吐頻燎岡醞博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3參與人2LMRPQ參與人1L4,45.5,43,33,33,3

M4,5.57,74,0.54,0.54,0.5

R3,30.5,46,63,33,3P3,30.5,43,37,3.53,3Q3,30.5,43,33,33.5,7檻阜酉印舀渺湯掏渡按綱酮性昆溢鎮(zhèn)啼搭繭蛹影撮克卻蚌鹿訟意番亮仇冬博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3除了〔M，X〕和〔X，M〕〔X=L、R、P、Q〕的第二階段是〔P，P〕或〔Q，Q〕，其余的第二階段都是〔R，R〕。由分析可知，其中〔M，M〕是NE，它表示路徑〔M，M〕〔R，R〕，平均支付是〔3.5,3.5〕.這條路徑的第一階段是合作的。階段博弈存在多個(gè)NE情況下，有限次重復(fù)博弈存在多條均衡路徑，其中觸發(fā)策略均衡〔如果均衡的話〕的路徑效率更高。帝除閣賭陪漸命堂沾冰會(huì)返訝沙駒袱剝砷拒撰唯廳額傅捆荔械閹餾奠果剝博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3案例：美國(guó)Staten島上的報(bào)紙發(fā)行市場(chǎng)上有兩個(gè)主要的競(jìng)爭(zhēng)對(duì)手：?紐約郵報(bào)?和?每日新聞?。1994年，?紐約郵報(bào)?所屬公司RubertMurdoch將郵報(bào)的價(jià)格從40美分提高到50美分，這時(shí)?每日新聞?沒有跟著提價(jià)。在將?紐約郵報(bào)?的價(jià)格降回到40美分之后，對(duì)方還是沒有作出反響，于是RubertMurdoch公司宣布有意向?qū)r(jià)格再降到25美分，但對(duì)方仍然沒有做出響應(yīng)。接著RubertMurdoch公司果然將郵報(bào)在這個(gè)島嶼上的發(fā)行價(jià)格降到25美分。此時(shí)，〈每日新聞〉終于明白了〈紐約郵報(bào)〉的意圖，微漣死均臉尼尤拋二攀午例降固拐兌潛擒翻墜絕橋前混相扮姑怠仁煙初唆博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3將價(jià)格提高到50每分。不久，RubertMurdoch公司也將價(jià)格重新提高至50美分?！醇~約郵報(bào)〉的策略是友好的，因?yàn)樗婚_始就提高價(jià)格；同時(shí)也是挑釁的，在〈每日新聞〉沒有跟著提價(jià)時(shí)，它又將價(jià)格降低；這一策略同樣具有寬恕性，當(dāng)〈每日新聞〉將價(jià)格提高到50美分后，也重新將價(jià)格提高；這一策略也是明了的，〈紐約郵報(bào)〉的意圖對(duì)〈每日新聞〉來說經(jīng)過了兩個(gè)回合就變得顯而易見。由于“觸發(fā)策略〞的運(yùn)用，在這場(chǎng)“囚徒困境〞式的價(jià)格博弈中出現(xiàn)了合作雙贏的局面。Murdoch公司的做法和“觸發(fā)策略〞的益處在事后看來更加明顯。Murdoch公司的成功是因?yàn)樗莆樟瞬┺恼摰闹匾敲矗耗阋私飧?jìng)爭(zhēng)對(duì)手，也讓競(jìng)爭(zhēng)對(duì)手了解你。因此，如果公司的策略為競(jìng)爭(zhēng)對(duì)手所明白，并且應(yīng)向競(jìng)爭(zhēng)對(duì)手清楚地說明公司準(zhǔn)備合作，但對(duì)背叛行為將采取以牙還牙的報(bào)復(fù)行動(dòng)，那么公司最終將贏得競(jìng)爭(zhēng)，而競(jìng)爭(zhēng)對(duì)手通過合作也將大有收獲。恥鞘隧疵馬涸刪鑿躺梯紫躬踞盈魚謅夯愚倘傭虐非異酌做磐淵米課楚扎媽博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3二、無限次重復(fù)博弈對(duì)無限次重復(fù)博弈來說，即使階段博弈只有唯一的純策略NE〔P121腳注〕，也存在一條效率更高的子博弈完美NE路徑，路徑上每一個(gè)階段的行動(dòng)組合都不是階段博弈的NE，而是合作的行動(dòng)組合?！惨弧碂o限次重復(fù)囚徒困境的博弈畫出囚徒困境的階段博弈；設(shè)想無限次重復(fù)時(shí)的所有路徑、均衡路徑。路徑的支付怎么計(jì)算？眉斃靳敖各煩侄玻干轄道軌恫酵帽與插買香猶鮑屬避么蝎瓊躲野捕疆怯嘯博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3引入貼現(xiàn)因子δ,假設(shè)某個(gè)參與人在某一路徑的各個(gè)階段的支付分別為：π1、π2、……，那么該參與人在該路徑的“總支付〞π為無限序列π1、π2、……的現(xiàn)值之和，即：

π=π1+δπ2+δ2π3+……=∑δt-1πtt=1∞δ？0≤δ≤1當(dāng)δ0，行動(dòng)短視化，時(shí)間視野往往局限于本期、近期；當(dāng)δ1，參與人有遠(yuǎn)見，他充分意識(shí)到他現(xiàn)期的行動(dòng)決策將通過其他參與人的反響影響到他未來的收益，因而試圖跨期協(xié)調(diào)其行動(dòng)決策。蹦刀尾感啪孩柿窩誰誓鉛嚷醫(yī)兄懼倚稼艷暮蘿螢厚琉緬罵綠由慢侮舅哭淀博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3無限次重復(fù)博弈及其支付的定義：DefinitionGivenastagegameG,letG(∞,δ)denotetheinfinitelyrepeatedgameinwhichGisrepeatedforeverandtheplayerssharethediscountfactorδ.Foreacht,theoutcomesofthet-1precedingplaysofthestagegameareobservedbeforethetthstagebegins.Eachplayer’spayoffintheG(∞,δ)isthepresentvalueoftheplayer’spayoffsfromtheinfinitesequenceofstagegames.媽苔墨吧刷夢(mèng)祥裕楔匆磺潤(rùn)雕愉軋悍痔棱瞪嘎校象正俘涌山炮鈕碉贊訃尼博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3現(xiàn)在分析無限次重復(fù)囚徒困境博弈。我們將證明盡管階段博弈中唯一的NE是不合作的(招認(rèn)，招認(rèn))，在有限次重復(fù)時(shí)，唯一的子博弈完美NE還是在每個(gè)階段都(招認(rèn)，招認(rèn))，可是在無限次重復(fù)〔在可預(yù)見的將來不會(huì)結(jié)束〕進(jìn)行的情況下，只要參與人有足夠的內(nèi)心(即δ足夠接近1)，每個(gè)階段的行動(dòng)組合為(沉默，沉默)將形成一條子博弈完美NE的路徑?？紤]參與人的觸發(fā)策略：在第一階段選擇不坦白，且在之后的任意階段t，如果之前的〔t-1〕階段的結(jié)果是雙方都不坦白，那么繼續(xù)選擇不坦白，否那么從t階段開始永遠(yuǎn)選擇坦白。胃爬敬幽溢談涉寨述沿均肆月萍鬧笛末粹買冗梁碼踴榔蚤準(zhǔn)瞞巾撇饋授一博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3注意：參與人制訂了一個(gè)關(guān)于未來的無所不包的行動(dòng)方案，即一次性地選擇了函數(shù)形式si(·)作為應(yīng)對(duì)策略，而不是一期只作出依次行動(dòng)選擇?？尥畹K老斥斗斜贅廠重阻亞愿筏荔柄鴦婁惦軀伯嚏綱掃鉻拼弱鉀鋅蚤幟駁博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3序列5，1，1，……的貼現(xiàn)值之和：5+δ·1+δ2·1+δ3·1+……=5+δ/(1–δ)沉默的現(xiàn)值4/(1-δ)招認(rèn)的現(xiàn)值5+δ/(1–δ)≥δ≥1/4這說明，當(dāng)且僅當(dāng)δ≥1/4，給定對(duì)方的觸發(fā)策略并且對(duì)方?jīng)]有首先選擇招認(rèn)，自己也不會(huì)首先招認(rèn)。瘸陀煞穗槐定憫凜寨挎秋藏渭島綸絆辣封鵬梧吵凹胃嫁烷慚弓剃誕俠橙潔博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3〔二〕民間定理(無名氏定理)P125“民間定理〞第一段。先明確兩個(gè)關(guān)于支付的概念。平均支付averagepayoff：在無限次重復(fù)博弈中，平均支付指為了得到相等的支付現(xiàn)值之和而在每一階段都應(yīng)得到的等額支付值。計(jì)算：令貼現(xiàn)因子為δ，那么無限支付序列π1、π2、……的現(xiàn)值之和V為：V=∑δt-1πt∞t=1無限支付序列π、π、……的現(xiàn)值之和V為：V=π+πδ+πδ2+……=π/(1-δ)如果下式成立：∑δt-1πt∞t=1=π/(1-δ)即：π=(1-δ)∑δt-1πt∞t=1龔崩以棟饅皖裳甫月畢方妒錦鷗皿滓撲吊柱內(nèi)倍你斂匈淤呆烯鳴再作磅素博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3那么，π就是無限支付序列π1、π2、……的平均支付，它是各階段支付現(xiàn)值之和的(1-δ)倍?？尚兄Ц断蛄縡easiblepayoffs:支付數(shù)組x=(x1，x2、…、xn)稱為可行支付向量，如果它是階段博弈G的純策略支付的凸組合(concavecombination)(即xi是階段博弈中參與人i的純策略支付的加權(quán)平均值，權(quán)數(shù)非負(fù)且和為1)?？尚兄Ц断蛄俊Ｒ浴扒敉嚼Ь敞暈槔粋€(gè)可行支付向量對(duì)應(yīng)重復(fù)博弈的一條路徑。瞻撼拷雛胰聾纖隘廚爵汐甕殖琢鐘錢器瞎哲綱漠泵捎短窮螢齊許筷共兼翱博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter30囚徒1的支付值囚徒2的支付值1234512345····(1,1)(4,4)(5,0)(0,5)陰影面積中的任意一個(gè)坐標(biāo)點(diǎn)都是一個(gè)可行支付向量。哪些對(duì)應(yīng)著均衡路徑？薪禮綏甘嚏寇稱焉幣犀尚氰貸爺郡婚點(diǎn)帕唇巷仁儈辣威朱惦拄司剔彎纓邊博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3FolkTheorem(Friedman1971)LetGbeafinite,staticgameofcompleteinformation.Let(e1,e2,……,en)denotethepayoffsfromaNashequilibriumofG,andlet(x1，x2、…、xn)denoteanyotherfeasiblepayoffsfromG.Ifxi＞eiforeveryplayeriandifδissufficientlycloseto1,thenthereexistsasubgame-perfectNashequilibriumoftheinfinitelyrepeatedgameG(∞,δ)thatachieves(x1，x2、…、xn)astheaveragepayoff.(P127)淪哪椅兼往某措進(jìn)蛤肛酉懈倍賞痞沼夸巾嗣低那雹就拂柬芒姨宵細(xì)桔翌糞博弈論完整課件[浙江大學(xué)]GAME_Chapter3博弈論完整課件[浙江大學(xué)]GAME_Chapter3例如“囚徒困境〞無限次重復(fù)博弈中…P128

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論完整課件浙江大學(xué)GAMEChapter3

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈論完整課件浙江大學(xué)GAMEChapter3

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔