版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二部分:完全信息動(dòng)態(tài)博弈第二部分:1第八章重復(fù)博弈
主要內(nèi)容:一、有限重復(fù)博弈二、無限重復(fù)博弈三、討價(jià)還價(jià)博弈第八章重復(fù)博弈主要內(nèi)容:2第八章重復(fù)博弈
主要內(nèi)容:一、有限重復(fù)博弈二、無限重復(fù)博弈三、討價(jià)還價(jià)博弈ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng第八章重復(fù)博弈主要內(nèi)容:ControlScience一、有限重復(fù)博弈重復(fù)博弈所關(guān)心的議題:將來可信的威脅或承諾如何影響到當(dāng)前的行動(dòng)ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng一、有限重復(fù)博弈重復(fù)博弈所關(guān)心的議題:ControlS考察下列博弈ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng考察下列博弈ControlScienceandEngi上述博弈存在唯一的Nash均衡。將上述博弈重復(fù)兩次,其中第二次博弈開始時(shí),第一次博弈的結(jié)果已知。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng上述博弈存在唯一的Nash均衡。Cont兩次重復(fù)博弈的博弈樹ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng兩次重復(fù)博弈的博弈樹ControlScienceand上述重復(fù)博弈只存在唯一的Nash均衡:在每次博弈中,參與人1都選擇U,參與人2都選擇L,即((U,U,U,U,U),(L,L,L,L,L))可以證明:該均衡為精煉Nash均衡。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng上述重復(fù)博弈只存在唯一的Nash均衡:在ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerin前面的分析說明:在兩次重復(fù)博弈中,合作仍無法到達(dá)。同樣可證明:在n階段重復(fù)博弈(即博弈重復(fù)n次且每次博弈開始時(shí),前面博弈的結(jié)果都已知)中,合作同樣無法到達(dá)。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng前面的分析說明:在兩次重復(fù)博弈中,合作仍重復(fù)博弈定義對(duì)于給定的階段博弈G,令G(T)表示G重復(fù)進(jìn)行T次的有限重復(fù)博弈,并且在下一此博弈開始前,所有以前博弈的進(jìn)程都可被觀測到,G(T)的收益為T次階段博弈收益的簡單相加。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng重復(fù)博弈定義對(duì)于給定的階段博弈G,令G在重復(fù)博弈中,當(dāng)全部博弈進(jìn)行到任何一個(gè)階段,到此為止的進(jìn)行過程就成為參與各方的共同知識(shí),而其后尚未開始進(jìn)行的部分就是一個(gè)子博弈。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng在重復(fù)博弈中,當(dāng)全部博弈進(jìn)行到任何一個(gè)定理:如果階段博弈G有唯一的Nash均衡,則對(duì)任意有限的T,重復(fù)博弈G(T)有唯一的子博弈精煉解,即G的Nash均衡結(jié)果在每一個(gè)階段重復(fù)進(jìn)行。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng定理:如果階段博弈G有唯一的Nash均考察下列博弈ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng考察下列博弈ControlScienceandEngi上述博弈存在兩個(gè)Nash均衡:(L1,L2)和(R1,R2)將上述博弈重復(fù)兩次。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng上述博弈存在兩個(gè)Nash均衡:Control1)戰(zhàn)略:每個(gè)局中人都有個(gè)戰(zhàn)略;ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng1)戰(zhàn)略:ControlScienceand2)戰(zhàn)略組合:一共存在個(gè)戰(zhàn)略組合;
ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng2)戰(zhàn)略組合:ControlSciencea3)均衡:可以根據(jù)以下原則構(gòu)造均衡:由第一階段的結(jié)果,預(yù)測第二階段的均衡。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng3)均衡:ControlSciencean例如:若第一階段出現(xiàn)(M1,M2)(即出現(xiàn)合作),則第二階段為(R1,R2)(即“好的均衡”);
若第一階段沒有出現(xiàn)(M1,M2),則第二階段為(L1,L2)(即“差的均衡”)。
ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng例如:ControlScienceandEnginee根據(jù)上述原則,可構(gòu)造如下策略:S1:第一階段選擇M1;如第一階段結(jié)果為(M1,M2),則下一階段選R1;否則選擇L1。S2:第一階段選擇M2;如第一階段結(jié)果為(M1,M2),則下一階段選R2;否則選擇L2。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng根據(jù)上述原則,可構(gòu)造如下策略:S1:第一階段選擇M1;如第一在上述策略下,博弈可表示為:這意味著:合作可以在第一階段達(dá)到ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng在上述策略下,博弈可表示為:這意味著:合作可以在第一階段定理:如果G=<T,(Ai),(ui)>是一個(gè)有多個(gè)Nash均衡的完全信息靜態(tài)博弈,則G(T)可以存在子博弈精煉解,其中對(duì)每一t<T,t階段的結(jié)果都不是G的Nash均衡。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng定理:如果G=<T,(Ai),(上述結(jié)論說明:對(duì)將來行動(dòng)所作的可信威脅或承諾可以影響到當(dāng)前的行動(dòng)。考察下列博弈。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng上述結(jié)論說明:ControlSciencControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerin
如果第一階段出現(xiàn)(Y1,Y2),則第二階段(Z1,Z2);
如果第一階段出現(xiàn)(Y1,w),其中(w
Y2),則第二階段為(P1,P2);ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng如果第一階段出現(xiàn)(Y1,Y2),則第二階
如果第一階段出現(xiàn)(w,Y2),其中(w
Y1),則第二階段(Q1,Q2);
如果第一階段出現(xiàn)(w1,w2),其中(w1
Y1,w2
Y2),則第二階段為(Z1,Z2)。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng如果第一階段出現(xiàn)(w,Y2),其中(wControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerin顯然,上述策略構(gòu)成博弈的Nash均衡,且為子博弈精煉Nash均衡。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng顯然,上述策略構(gòu)成博弈的Nash均衡,第八章重復(fù)博弈
主要內(nèi)容:一、有限重復(fù)博弈二、無限重復(fù)博弈三、討價(jià)還價(jià)博弈ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng第八章重復(fù)博弈主要內(nèi)容:ControlScience二、無限重復(fù)博弈定義(無線重復(fù)博弈)給定一階段博弈G,令表示相應(yīng)的無限重復(fù)博弈,其中G將無限次低重復(fù)進(jìn)行,且參與人的貼現(xiàn)率為。對(duì)每個(gè)t,之前t-1次階段博弈的結(jié)果在t階段開始進(jìn)行前都可以被觀測到,每個(gè)參與人在中的收益都是該參與人在無限次的階段博弈中所得受益的現(xiàn)值。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng二、無限重復(fù)博弈定義(無線重復(fù)博弈)給定一階段博弈G,令
在有限重復(fù)博弈G(T)中,由第t+1階段開始的一個(gè)子博弈為G進(jìn)行T-t次的重復(fù)博弈,可表示為G(T-t)。
由第t+1階段開始有許多子博弈,到t階段為止的每一可能的進(jìn)行過程之后都是不同的子博弈。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng在有限重復(fù)博弈G(T)中,由第t+1
在無限重復(fù)博弈中,由t+1階段開始的每個(gè)子博弈都等同于初始博弈,和在有限情況下相似,博弈到t階段為止有多少不同的可能進(jìn)行過程,就有多少從t+1階段開始的子博弈。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng在無限重復(fù)博弈
對(duì)于無限重復(fù)博弈,參與人在博弈的每一時(shí)點(diǎn),都不必考慮過去的得失,也就是說,無限重復(fù)博弈中,參與人過去的得失并不重要,可以看成是沉沒成本(或收入)。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng對(duì)于無限重復(fù)博弈,參與人在博弈的每一時(shí)點(diǎn)下列博弈重復(fù)無限次。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng下列博弈重復(fù)無限次。ControlScienceand對(duì)于階段博弈為上述博弈的有限重復(fù)博弈,合作不可能形成。但對(duì)于無限重復(fù)博弈,在一定的貼現(xiàn)率下,合作有可能形成。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng對(duì)于階段博弈為上述博弈的有限重復(fù)博弈,合構(gòu)造如下觸發(fā)策略:S1:第i階段選擇D;如第i階段結(jié)果為(D,R),則下一階段選D;否則以后一直選擇U。S2:第i階段選擇R;如第i階段結(jié)果為(D,R),則下一階段選R;否則以后一直選擇L。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng構(gòu)造如下觸發(fā)策略:S1:第i階段選擇D;如第i階段結(jié)果為(D
可用證明:在一定的貼現(xiàn)率下,上述觸發(fā)策略構(gòu)成Nash均衡。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng可用證明:在一定的貼現(xiàn)率下,上述觸發(fā)策略貼現(xiàn)率的求解所以ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng貼現(xiàn)率的求解所以ControlScienceandEn可行收益
一組收益為階段博弈G的可行收益,如果它們是G的純戰(zhàn)略收益的凸組合(即純戰(zhàn)略收益的加權(quán)平均,權(quán)重非負(fù)且和為1)。
前述階段博弈的可行收益集合如下圖所示。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng可行收益一組收益陰影部分為上述博弈的可行收益區(qū)間(0,5)(1,1)(0,0)(4,4)(5,0)ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng陰影部分為上述博弈的可行收益區(qū)間(0,5)(1,1)(0,0平均收益
給定貼現(xiàn)率,無限的收益序列的平均收益ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng平均收益給定貼現(xiàn)率,無限的收所以故ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng所以故ControlScienceandEnginee令G為一個(gè)有限的完全信息靜態(tài)博弈,令為G的一個(gè)Nash均衡下的收益,且用表示G的其它任何可行收益。若存在則存在足夠接近1的貼現(xiàn)率,使無限重復(fù)博弈存在一個(gè)子博弈精煉Nash均衡,其平均收益可達(dá)到定理:ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng令G為一個(gè)有限的完全信息靜態(tài)博弈,令定理:ControlS子博弈精煉Nash均衡的可行收益區(qū)間(0,5)(1,1)(0,0)(4,4)(5,0)ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng子博弈精煉Nash均衡的可行收益區(qū)間(0,5)(1,1)(0在貼現(xiàn)因子并不“足夠接近于1”時(shí),子博弈精煉Nash均衡能達(dá)到什么樣的平均收益?ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng在貼現(xiàn)因子并不“足夠接近于1”時(shí),子博
思路之一:令貼現(xiàn)率等于一個(gè)固定值,并在假設(shè)參與者運(yùn)用觸發(fā)戰(zhàn)略,一旦發(fā)生任何偏離就永遠(yuǎn)轉(zhuǎn)到階段博弈的Nash均衡的條件下,計(jì)算可以達(dá)到的平均收益。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng思路之一:ControlScienceandEn
在決定當(dāng)前階段是否偏離時(shí),貼現(xiàn)率越小,下一階段開始進(jìn)行懲罰的效果就越小。然而,一般來講參與者總可以比簡單重復(fù)階段博弈的Nash均衡得到更高的收益。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng在決定當(dāng)前階段是否偏離時(shí),貼現(xiàn)率越小,
思路之二:由阿布勒(Abreu,1988)最先提出,它基于如下思路,即阻止一個(gè)參與者偏離既定戰(zhàn)略的最有效的方法是威脅該參與者,一旦偏離,就將受到最嚴(yán)厲的可信的懲罰,即威脅該參與者,一旦偏離,就將選擇使偏離者收益最低的無限重復(fù)博弈的子博弈精煉Nash均衡。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng思路之二:ControlScienceandEn
在絕大多數(shù)博弈中,永遠(yuǎn)轉(zhuǎn)到階段博弈的Nash均衡并不是最嚴(yán)厲的可信懲罰,于是有些使用觸發(fā)戰(zhàn)略方法無法達(dá)到的平均收益,運(yùn)用阿布勒的方法可以達(dá)到。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng在絕大多數(shù)博弈中,永遠(yuǎn)轉(zhuǎn)到階段博弈的N
考慮古諾博弈為階段博弈的無限重復(fù)博弈,兩企業(yè)的貼現(xiàn)率都為。計(jì)算兩個(gè)企業(yè)的下述觸發(fā)戰(zhàn)略成為無限重復(fù)博弈的Nash均衡時(shí),貼現(xiàn)率的值。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng考慮古諾博弈為階段博弈的無限重復(fù)博弈,兩觸發(fā)戰(zhàn)略
在第一階段都生產(chǎn)壟斷產(chǎn)量的一半。第t階段,如果前面t-1個(gè)階段兩個(gè)企業(yè)的產(chǎn)量都為,則生產(chǎn);否則,生產(chǎn)古諾產(chǎn)量。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng觸發(fā)戰(zhàn)略在第一階段都生產(chǎn)壟斷產(chǎn)量的一半當(dāng)雙方都生產(chǎn)時(shí),每個(gè)企業(yè)的利潤為,用來表示。當(dāng)雙方都生產(chǎn)時(shí),每個(gè)企業(yè)的利潤為我們用表示。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng當(dāng)雙方都生產(chǎn)時(shí),每個(gè)企業(yè)若企業(yè)i將在本期生產(chǎn),則使企業(yè)j本期利潤最大化的產(chǎn)量為下式的解其解為,其利潤水平為ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng若企業(yè)i將在本期生產(chǎn),則使企業(yè)j本期利潤最大ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerin首先計(jì)算對(duì)任意一個(gè)給定貼現(xiàn)率,如果雙方都采用觸發(fā)戰(zhàn)略,一旦出現(xiàn)背離就永遠(yuǎn)轉(zhuǎn)到古諾產(chǎn)出,企業(yè)可以達(dá)到的利潤最大化的產(chǎn)量。顯然,該產(chǎn)量處于古諾產(chǎn)出與壟斷產(chǎn)出之間。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng首先計(jì)算對(duì)任意一個(gè)給定貼現(xiàn)率,如果雙方考慮如下的觸發(fā)戰(zhàn)賂:第一階段生產(chǎn)。在第t階段,如果在此之前的t-1個(gè)階段兩企業(yè)的產(chǎn)量都是,生產(chǎn);否則,生產(chǎn)古諾產(chǎn)出。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng考慮如下的觸發(fā)戰(zhàn)賂:ControlControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerin考慮下面的“兩面”(亦稱胡蘿卜加大棒)戰(zhàn)略:在第一階段生產(chǎn)壟斷產(chǎn)量的一半,即;第t階段,如果兩個(gè)企業(yè)在第t-1階段都生產(chǎn),則生產(chǎn);如果兩個(gè)企業(yè)在t-1階段的產(chǎn)量都是x,則生產(chǎn);其他情況下生產(chǎn)x。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng考慮下面的“兩面”(亦稱胡蘿卜加大棒)戰(zhàn)略上述戰(zhàn)略為參與者提供了兩種手段:其一是(單階段的)懲罰,這時(shí)企業(yè)生產(chǎn)x;其二是(潛在無限階段的)合作,這時(shí)企業(yè)的產(chǎn)量為。如果任何一個(gè)企業(yè)偏離了合作,則懲罰開始,如果任何一個(gè)企業(yè)背離了懲罰,則會(huì)使博弈進(jìn)入又一輪懲罰。如果兩個(gè)企業(yè)都不肯離懲罰,則在下一階段又回到合作。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng上述戰(zhàn)略為參與者提供了兩種手段:ControlScControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerin
如果兩企業(yè)都采用上面的“兩面”戰(zhàn)略,則無限重復(fù)博弈里的子博弈就可歸為兩類:(1)合作的子博弈,其前面一個(gè)階段的結(jié)果是或(x,x);(2)懲罰的子博弈,其前面一個(gè)階段的結(jié)果既非,又不是(x,x)。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng如果兩企業(yè)都采用上面的“兩面”戰(zhàn)略,則兩企業(yè)都采取上面的“兩面”戰(zhàn)略要成為一個(gè)子博弈精煉Nash均衡,則在其每一類子博弈中遵循該戰(zhàn)略必須是Nash均衡。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng兩企業(yè)都采取上面的“兩面”戰(zhàn)略要成為具體地說,在合作的子博弈中,每一企業(yè)與本期得到的收益,且下期得到懲罰的現(xiàn)值收益V(x)相比,必須更愿意永遠(yuǎn)得到壟斷收益的一半,即ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng具體地說,在合作的子博弈中,每一企業(yè)與
在懲罰的子博弈中,每一企業(yè)與本期得到的收益,且下期又開始懲罰相比,企業(yè)更愿意共同執(zhí)行懲罰產(chǎn)量,即ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng在懲罰的子博弈中,每一企業(yè)與本期得到ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerin羅伯特·愛克斯羅德實(shí)驗(yàn)羅伯特·愛克斯羅德(政治科學(xué)家),對(duì)合作的問題具有研究興趣。為了進(jìn)行關(guān)于合作的研究,他組織了一場計(jì)算機(jī)競賽。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng羅伯特·愛克斯羅德實(shí)驗(yàn)羅伯特·愛克斯這個(gè)競賽的思路非常簡單:任何想?yún)⒓舆@個(gè)計(jì)算機(jī)競賽的人都扮演“囚徒困境”案例中一個(gè)囚犯的角色。他們把自己的策略編入計(jì)算機(jī)程序,然后他們的程序會(huì)被成雙成對(duì)地融入不同的組合。分好組以后,參與者就開始玩“囚徒困境”的游戲。他們每個(gè)人都要在合作與背叛之間做出選擇,并且游戲重復(fù)多次。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng這個(gè)競賽的思路非常簡單:Control競賽的第一個(gè)回合交上來的14個(gè)程序中包含了各種復(fù)雜的策略。但使愛克斯羅德和其他人深為吃驚的是,競賽的桂冠屬于其中最簡單的策略:一報(bào)還一報(bào)(TITFORTAT)。這是多倫多大學(xué)心理學(xué)家阿納托·拉帕波特提交上來的策略。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng競賽的第一個(gè)回合交上來的14個(gè)程序中包一報(bào)還一報(bào)的策略是這樣的:它總是以合作開局,但從此以后就采取以其人之道還治其人之身的策略。也就是說,一報(bào)還一報(bào)的策略實(shí)行了胡蘿卜加大棒的原則。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng一報(bào)還一報(bào)的策略是這樣的:它總是以合作一報(bào)還一報(bào)的策略永遠(yuǎn)不先背叛對(duì)方,從這個(gè)意義上來說它是“善意的”。
一報(bào)還一報(bào)策略會(huì)在下一輪中對(duì)對(duì)手的前一次合作給予回報(bào)(哪怕以前這個(gè)對(duì)手曾經(jīng)背叛過它),從這個(gè)意義上來說它是"寬容的"。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng一報(bào)還一報(bào)的策略永遠(yuǎn)不先背叛對(duì)方,從但一報(bào)還一報(bào)策略會(huì)采取背叛的行動(dòng)來懲罰對(duì)手前一次的背叛,從這個(gè)意義上來說它又是“強(qiáng)硬的”。
而且,一報(bào)還一報(bào)策略的策略極為簡單,對(duì)手程序一望便知其用意何在,從這個(gè)意義來說它又是"簡單明了的"。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng但一報(bào)還一報(bào)策略會(huì)采取背叛的行動(dòng)來懲罰為了驗(yàn)證上述結(jié)果的合理性,愛克斯羅德又舉行了第二輪競賽,特別邀請了更多的人,看看能否從一報(bào)還一報(bào)策略那兒將桂冠奪過來。這次有62個(gè)程序參加了競賽,結(jié)果是一報(bào)還一報(bào)又一次奪魁。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng為了驗(yàn)證上述結(jié)果的合理性,愛克斯羅德又競賽的結(jié)論無可爭議地證明:好人,或更確切地說,具備以下特點(diǎn)的人,將總會(huì)是贏家。1.善意的;2.寬容的;3.強(qiáng)硬的;4.簡單明了的。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng競賽的結(jié)論無可爭議地證明:好人,或更確切一報(bào)還一報(bào)策略的勝利對(duì)人類和其他生物的合作行為的形成具有深刻地含義。愛克斯羅德在《合作進(jìn)化》一書中指出,一報(bào)還一報(bào)策略能導(dǎo)致社會(huì)各個(gè)領(lǐng)域的合作,包括在最無指望的環(huán)境中的合作。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng一報(bào)還一報(bào)策略的勝利對(duì)人類和其他生物的典型的例子就是第一次世界大戰(zhàn)中自發(fā)產(chǎn)生的“自己活,也讓他人活”的原則。
當(dāng)時(shí),前線戰(zhàn)壕里的軍隊(duì)約束自己不開槍殺傷人,只要對(duì)方也這么做。使這個(gè)原則能夠?qū)嵭械脑蚴牵p方軍隊(duì)都已陷入困境數(shù)月,這給了他們相互適應(yīng)的機(jī)會(huì)。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng典型的例子就是第一次世界大戰(zhàn)中自發(fā)產(chǎn)生的一報(bào)還一報(bào)的相互作用使得自然界即使沒有智能也能產(chǎn)生合作關(guān)系。這樣的例子很多:真菌從地下的石頭中汲取養(yǎng)分,為海藻提供了食物,而海藻反過來又為真菌提供了光合作用;金蟻合歡樹為一種螞蟻提供了食物,而這種螞蟻反過來又保護(hù)了該樹;無花果樹的花是黃蜂的食物,而黃蜂反過來又為無花果樹傳授花粉,將樹種撒向四處。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng一報(bào)還一報(bào)的相互作用使得自然界即使沒有更廣泛地說,共同演化會(huì)使一報(bào)還一報(bào)的合作風(fēng)格在這個(gè)充滿背信棄義劣行的世界上蔚然成風(fēng)。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng更廣泛地說,共同演化會(huì)使一報(bào)還一報(bào)的假設(shè)少數(shù)采取一報(bào)還一報(bào)策略的個(gè)人在這個(gè)世界上通過突變而產(chǎn)生了。那么,只要這些個(gè)體能互相遇見,足夠在今后的相逢中形成利害關(guān)系,他們就會(huì)開始形成小型的合作關(guān)系。一旦發(fā)生了這種情況,他們就能遠(yuǎn)勝于他們周圍的那些背后藏刀的類型。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng假設(shè)少數(shù)采取一報(bào)還一報(bào)策略的個(gè)人在這這樣,參與合作的人數(shù)就會(huì)增多。很快,一報(bào)還一報(bào)式的合作就會(huì)最終占上風(fēng)。而一旦建立了這種機(jī)制,相互合作的個(gè)體就能生存下去。如果不太合作的類型想侵犯和利用他們的善意,一報(bào)還一報(bào)政策強(qiáng)硬的一面就會(huì)狠狠地懲罰他們,讓他們無法擴(kuò)散影響。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng這樣,參與合作的人數(shù)就會(huì)增多。很快,一第八章重復(fù)博弈
主要內(nèi)容:一、有限重復(fù)博弈二、無限重復(fù)博弈三、討價(jià)還價(jià)博弈ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng第八章重復(fù)博弈主要內(nèi)容:ControlScience討價(jià)還價(jià)博弈亦稱序貫談判。其具體過程如下。三、討價(jià)還價(jià)博弈ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng討價(jià)還價(jià)博弈亦稱序貫談判。其具體過程如下參與人1和參與人2就一美元的分配進(jìn)行談判。他們輪流提出方案:首先參與人1提出一個(gè)分配建議,參與人2可以接受或拒絕;如果參與人2拒絕,就由參與人2提出分配建議,參與人1選擇接受或拒絕;如此一直進(jìn)行下去。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng參與人1和參與人2就一美元的分配進(jìn)行談注意:在博弈中,一個(gè)條件一旦被拒絕,它就不再具有任何約束力,并和博弈下面的進(jìn)程不再相關(guān)。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng注意:ControlScienceandEngi第一階段:在第一階段開始時(shí),參與人1建議他分得1美元的s1,參與人2得1-s1;參與人2接受這一建議,則博弈結(jié)束,否則博弈進(jìn)入第二階段??疾烊A段的序貫談判ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng第一階段:考察三階段的序貫談判ControlScience第二階段:在第二階段開始時(shí),參與人2建議參與人分得1美元的s2,參與人2得1-s2;參與人1接受這一建議,則博弈結(jié)束,否則博弈進(jìn)入第三階段。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng第二階段:ControlScienceandEngin第三階段:在第三階段,參與人1得1美元的s,參與人2得1-s。博弈結(jié)束。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng第三階段:ControlScienceandEngin如不考慮貼現(xiàn),由逆向歸納法很容易求得均衡結(jié)果——(s,1-s)。
博弈的結(jié)果就是外界強(qiáng)加的結(jié)果。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng如不考慮貼現(xiàn),由逆向歸納法很容易求得均衡假設(shè)參與人的貼現(xiàn)率都為。
首先考察參與人2在第二階段的最優(yōu)選擇。
ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng假設(shè)參與人的貼現(xiàn)率都為。Cont由于若博弈進(jìn)入第三階段,參與人1可得s,相當(dāng)于第二階段的,因此,ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng由于若博弈進(jìn)入第三階段,參與人1可得s,考察參與人1在第一階段的最優(yōu)選擇。參與人1在第一階段即可預(yù)測到參與人2在第二階段的最優(yōu)選擇ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng考察參與人1在第一階段的最優(yōu)選擇。ConControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerin假設(shè)參與人的貼現(xiàn)率分別為:首先考察參與人2的最優(yōu)選擇。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng假設(shè)參與人的貼現(xiàn)率分別為:ControlSci考察參與人1在第一階段的最優(yōu)選擇。
ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng考察參與人1在第一階段的最優(yōu)選擇。ContrControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerin
考慮以上述討價(jià)還價(jià)博弈為階段博弈的無限重復(fù)博弈。
假設(shè)貼現(xiàn)率為。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng考慮以上述討價(jià)還價(jià)博弈為階段博弈的無限
由于在無限重復(fù)博弈中,由t+1階段開始的每個(gè)子博弈都等同于初始博弈,因此,從第t階段開始的子博弈等同于t+2階段開始的子博弈。ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfeng由于在無限重復(fù)博弈ControlScienceandEngineering,HUSTAllRights
Reserved,
2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度模特時(shí)尚品牌代言聘用合同-@-15
- 2025年度事業(yè)單位網(wǎng)絡(luò)安全管理員勞動(dòng)合同范本3篇
- 二零二五年度內(nèi)墻涂料研發(fā)生產(chǎn)與品牌營銷承包合同
- 2025年度智能晾曬系統(tǒng)配套個(gè)人木工裝修合同3篇
- 2025年度個(gè)人閑置物品轉(zhuǎn)讓合同范本3篇
- 2025年度個(gè)人投資理財(cái)咨詢服務(wù)合同范本8篇
- 2025年度個(gè)人住房貸款質(zhì)押合同標(biāo)準(zhǔn)文本及貸款逾期處理規(guī)定3篇
- 2025年度個(gè)人房地產(chǎn)抵押借款合同電子簽名版
- 二零二五年度農(nóng)家樂民宿設(shè)施使用權(quán)轉(zhuǎn)讓合同4篇
- 2025年度個(gè)人股權(quán)收購與轉(zhuǎn)讓合同(資產(chǎn)重組版)3篇
- 射頻在疼痛治療中的應(yīng)用
- 和平精英電競賽事
- 四年級(jí)數(shù)學(xué)豎式計(jì)算100道文檔
- “新零售”模式下生鮮電商的營銷策略研究-以盒馬鮮生為例
- 項(xiàng)痹病辨證施護(hù)
- 職業(yè)安全健康工作總結(jié)(2篇)
- 懷化市數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展概況及未來投資可行性研究報(bào)告
- 07FD02 防空地下室電氣設(shè)備安裝
- 教師高中化學(xué)大單元教學(xué)培訓(xùn)心得體會(huì)
- 彈簧分離問題經(jīng)典題目
- 部編版高中歷史中外歷史綱要(下)世界史導(dǎo)言課課件
評(píng)論
0/150
提交評(píng)論