第五章有限理性和進(jìn)化博弈_第1頁
第五章有限理性和進(jìn)化博弈_第2頁
第五章有限理性和進(jìn)化博弈_第3頁
第五章有限理性和進(jìn)化博弈_第4頁
第五章有限理性和進(jìn)化博弈_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第五章第五章 有限理性和進(jìn)化博弈有限理性和進(jìn)化博弈進(jìn)化博弈分析是有限理性博弈分析的基本框架。進(jìn)化博弈分析是有限理性博弈分析的基本框架。本章介紹以本章介紹以最優(yōu)反應(yīng)動(dòng)態(tài)最優(yōu)反應(yīng)動(dòng)態(tài)和和復(fù)制動(dòng)態(tài)復(fù)制動(dòng)態(tài)為核心,以為核心,以進(jìn)進(jìn)化穩(wěn)定策略化穩(wěn)定策略為基本均衡概念的進(jìn)化博弈分析。為基本均衡概念的進(jìn)化博弈分析。本章分四節(jié)本章分四節(jié)5.1 5.1 有限理性博弈及其分析框架有限理性博弈及其分析框架5.2 5.2 最優(yōu)反應(yīng)動(dòng)態(tài)最優(yōu)反應(yīng)動(dòng)態(tài)5.3 5.3 復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性:復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性: 兩人對(duì)稱博弈兩人對(duì)稱博弈5.4 5.4 復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性:復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性: 兩人非對(duì)稱博弈兩人非對(duì)稱博

2、弈5.1 有限理性博弈及其分析框架有限理性博弈及其分析框架5.1.1 5.1.1 有限理性及其對(duì)博弈的影響有限理性及其對(duì)博弈的影響5.1.2 5.1.2 有限理性博弈分析框架有限理性博弈分析框架5.1.1 有限理性及其對(duì)博弈的影響有限理性及其對(duì)博弈的影響n有限理性博弈方有限理性博弈方:不滿足完全理性假設(shè)的博弈方:不滿足完全理性假設(shè)的博弈方n有限理性意味著一般至少有部分博弈方不會(huì)采用有限理性意味著一般至少有部分博弈方不會(huì)采用完全理性博弈的均衡策略完全理性博弈的均衡策略n有限理性意味著均衡是不斷調(diào)整和改進(jìn)而不是一有限理性意味著均衡是不斷調(diào)整和改進(jìn)而不是一次性選擇的結(jié)果,而且即使達(dá)到了均衡也可能再次

3、性選擇的結(jié)果,而且即使達(dá)到了均衡也可能再次偏離次偏離n有限理性博弈方會(huì)在博弈過程中學(xué)習(xí)博弈,通過有限理性博弈方會(huì)在博弈過程中學(xué)習(xí)博弈,通過試錯(cuò)尋找較好的策略試錯(cuò)尋找較好的策略有一定的統(tǒng)計(jì)分析能有一定的統(tǒng)計(jì)分析能力和對(duì)不同策略效果力和對(duì)不同策略效果的事后判斷能力的事后判斷能力5.1.2 有限理性博弈分析框架有限理性博弈分析框架n最優(yōu)反應(yīng)動(dòng)態(tài):最優(yōu)反應(yīng)動(dòng)態(tài):有快速學(xué)習(xí)能力的小群體成員的反有快速學(xué)習(xí)能力的小群體成員的反復(fù)博弈復(fù)博弈n復(fù)制動(dòng)態(tài):復(fù)制動(dòng)態(tài):學(xué)習(xí)速度很慢的成員組成的大群體隨機(jī)學(xué)習(xí)速度很慢的成員組成的大群體隨機(jī)配對(duì)的反復(fù)博弈配對(duì)的反復(fù)博弈n進(jìn)化穩(wěn)定策略(進(jìn)化穩(wěn)定策略(ESSESS)確定博弈方

4、學(xué)習(xí)和策略確定博弈方學(xué)習(xí)和策略調(diào)整的模式調(diào)整的模式關(guān)鍵關(guān)鍵5.2 最優(yōu)反應(yīng)動(dòng)態(tài)最優(yōu)反應(yīng)動(dòng)態(tài)5.2.1 5.2.1 協(xié)調(diào)博弈的有限博弈方協(xié)調(diào)博弈的有限博弈方 快速學(xué)習(xí)模型快速學(xué)習(xí)模型5.2.2 5.2.2 古諾調(diào)整過程古諾調(diào)整過程給定前期經(jīng)驗(yàn)給定前期經(jīng)驗(yàn)(博弈結(jié)果博弈結(jié)果),各博弈,各博弈方本期能找到和采用針對(duì)前期其方本期能找到和采用針對(duì)前期其他博弈方策略的最佳反應(yīng)策略他博弈方策略的最佳反應(yīng)策略5.2.1 協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型n模型:模型:n初始狀態(tài):共初始狀態(tài):共3232種可能,只有種可能,只有. .無無A,1A,1個(gè)個(gè)A,A,有相鄰有相鄰2A2A,

5、有不相鄰有不相鄰2A2A,有連,有連3A3A,有非,有非3 3連連A A,4 4個(gè)個(gè)A,5A,5個(gè)個(gè)A A共共8 8種有種有實(shí)質(zhì)差異。實(shí)質(zhì)差異。5050,50500 0,49496060,60604949,0 0A A博弈方博弈方2 2B BA AB B博博弈弈方方1 1協(xié)調(diào)博弈協(xié)調(diào)博弈12345反應(yīng)、策略調(diào)整規(guī)則推導(dǎo)反應(yīng)、策略調(diào)整規(guī)則推導(dǎo)BtxAtxtxtxBtxtxAiiiiii時(shí),采用;當(dāng)時(shí),采用當(dāng)?shù)牡靡妫翰捎玫牡靡妫翰捎?1/22)(61/22)(60)(20)(49)(250)(設(shè)設(shè)x xi i( (t t) )為在為在t t時(shí)期博弈方時(shí)期博弈方i i的鄰居中采用的鄰居中采用A A策

6、略鄰居策略鄰居的數(shù)量的數(shù)量 xi(t)=0,1,2,博弈方博弈方i i的得益:的得益:即:即:t t期期i i的鄰居中只要有的鄰居中只要有1 1個(gè)采用個(gè)采用A A,則,則i i在在t+1t+1期采用期采用A A特點(diǎn):特點(diǎn):i i在在t+1t+1期策略與自己在第期策略與自己在第t t期策略無直接關(guān)系期策略無直接關(guān)系最優(yōu)反應(yīng)動(dòng)態(tài)模擬:初次博弈最優(yōu)反應(yīng)動(dòng)態(tài)模擬:初次博弈 1個(gè)個(gè)AABABABABBBAAAAABAAAABAABB初次博弈初次博弈 相鄰相鄰2個(gè)個(gè)AAAAAAAABAABBBAA初次博弈初次博弈 相連相連3個(gè)個(gè)ABAABAAAAAA進(jìn)化穩(wěn)定策略進(jìn)化穩(wěn)定策略(ESS)(ESS):(1) (

7、1) 在博弈方的動(dòng)態(tài)調(diào)整中會(huì)達(dá)到在博弈方的動(dòng)態(tài)調(diào)整中會(huì)達(dá)到(2) (2) 對(duì)少量偏離的擾動(dòng)有穩(wěn)健性對(duì)少量偏離的擾動(dòng)有穩(wěn)健性5.2.2 古諾調(diào)整過程古諾調(diào)整過程-博弈策略無限連續(xù)博弈策略無限連續(xù)古諾模型反應(yīng)函數(shù)古諾模型反應(yīng)函數(shù)23231221qqqq 1 2 3 4博弈方博弈方1 1 2.5 1.5 2.125 1.875博弈方博弈方2 2 3 1.75 2.25 1.93751|1221dqdrdqdr問題:兩寡頭始終假設(shè)對(duì)方產(chǎn)量不變問題:兩寡頭始終假設(shè)對(duì)方產(chǎn)量不變最優(yōu)反應(yīng)動(dòng)態(tài)模擬最優(yōu)反應(yīng)動(dòng)態(tài)模擬收斂條件收斂條件博弈方有限理性:博弈方有限理性:知知道自己的反應(yīng)函數(shù),道自己的反應(yīng)函數(shù),不知道對(duì)方

8、的利潤、不知道對(duì)方的利潤、反應(yīng)函數(shù),也沒有預(yù)反應(yīng)函數(shù),也沒有預(yù)見能力見能力反應(yīng)函反應(yīng)函數(shù)斜率數(shù)斜率5.3 復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性:復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性: 兩人對(duì)稱博弈兩人對(duì)稱博弈n理性層次理性層次:博弈方有限理性,學(xué)習(xí)速度較慢:博弈方有限理性,學(xué)習(xí)速度較慢n分析框架分析框架:大群體成員的隨機(jī)配對(duì)反復(fù)博弈:大群體成員的隨機(jī)配對(duì)反復(fù)博弈n隱含:隱含:博弈方都是相似的博弈方都是相似的,即對(duì)稱博弈,即對(duì)稱博弈n學(xué)習(xí)速度慢學(xué)習(xí)速度慢的表示:的表示:優(yōu)勢策略轉(zhuǎn)變是一個(gè)漸進(jìn)的過優(yōu)勢策略轉(zhuǎn)變是一個(gè)漸進(jìn)的過程,非所有博弈方同時(shí)調(diào)整程,非所有博弈方同時(shí)調(diào)整5.3 復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性:復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性: 兩人對(duì)

9、稱博弈兩人對(duì)稱博弈5.3.1 5.3.1 簽協(xié)議博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略簽協(xié)議博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略5.3.2 5.3.2 一般兩人對(duì)稱博弈復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略一般兩人對(duì)稱博弈復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略5.3.3 5.3.3 協(xié)調(diào)博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定博弈協(xié)調(diào)博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定博弈5.3.4 5.3.4 鷹鴿博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略鷹鴿博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略5.3.5 5.3.5 蛙鳴博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略蛙鳴博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略5.3.1 簽協(xié)議博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略簽協(xié)議博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略簽協(xié)議博弈:簽協(xié)議博弈:1 1,1 10 0,

10、0 00 0,0 00 0,0 0同意同意博弈方博弈方2 2不同意不同意同意同意不同意不同意博博弈弈方方1 12)1 (00)1 (00)1 (1xuxuxuxxuxxxunyny假設(shè)群體中采用假設(shè)群體中采用“同意同意”比比例例x x則不同策略期望得益:則不同策略期望得益:群體平均得益群體平均得益:n博弈方策略類型比例動(dòng)態(tài)變化是有限理性博博弈方策略類型比例動(dòng)態(tài)變化是有限理性博弈分析的核心,其關(guān)鍵是動(dòng)態(tài)變化的速度弈分析的核心,其關(guān)鍵是動(dòng)態(tài)變化的速度n決定模仿速度的因素決定模仿速度的因素:q模仿對(duì)象的數(shù)量大小模仿對(duì)象的數(shù)量大小q模仿對(duì)象的成功程度模仿對(duì)象的成功程度n以采用以采用“同意同意”策略類型

11、博弈方的比例為例,策略類型博弈方的比例為例,其動(dòng)態(tài)變化速度可用下列微分方程反映:其動(dòng)態(tài)變化速度可用下列微分方程反映:3222)1 ()()(xxxxxxxuuxdtdxy動(dòng)態(tài)微分方程的相位圖動(dòng)態(tài)微分方程的相位圖dx/dtx010.5n穩(wěn)定狀態(tài)、不動(dòng)點(diǎn):穩(wěn)定狀態(tài)、不動(dòng)點(diǎn):x*=0, x*=1簽協(xié)議博弈復(fù)制動(dòng)態(tài)相位圖簽協(xié)議博弈復(fù)制動(dòng)態(tài)相位圖X=0X=0時(shí)采用同意策略類型博弈方比例的變時(shí)采用同意策略類型博弈方比例的變化率為化率為0 0。必須要有模仿的對(duì)象才能學(xué)習(xí)。必須要有模仿的對(duì)象才能學(xué)習(xí)除除X=0X=0外,從其他初始外,從其他初始情況出發(fā)的復(fù)制動(dòng)態(tài)過情況出發(fā)的復(fù)制動(dòng)態(tài)過程,最終都收斂到程,最終都收

12、斂到x=1x=1,即都即都“同意同意”進(jìn)化穩(wěn)定策略的檢驗(yàn)進(jìn)化穩(wěn)定策略的檢驗(yàn)2)1 ()1 (000)1 (101)1 (nynyuuuuu2)1 (000)1 (10)1 (ynnyuuuuu策略選擇了“不同意”意”比例的博弈方偏離“同策略選擇了“同意”同意”比例的博弈方偏離“不ESSxuy是進(jìn)化穩(wěn)定策略101不是進(jìn)化穩(wěn)定策略00 xuuny5.3.2一般兩人對(duì)稱博弈復(fù)制動(dòng)態(tài)一般兩人對(duì)稱博弈復(fù)制動(dòng)態(tài) 和進(jìn)化穩(wěn)定策略和進(jìn)化穩(wěn)定策略一般模型一般模型a, aa, ac, bc, bd, dd, db, cb, c策略策略1 1博弈方博弈方2 2策略策略2 2策略策略1 1策略策略2 2博博弈弈方方1

13、 1一般一般2X22X2對(duì)稱博弈對(duì)稱博弈n進(jìn)化博弈設(shè)定是在一個(gè)大群體的成員中進(jìn)行隨機(jī)配對(duì)進(jìn)化博弈設(shè)定是在一個(gè)大群體的成員中進(jìn)行隨機(jī)配對(duì)的反復(fù)博弈。的反復(fù)博弈。n基本模型是兩個(gè)博弈方之間的對(duì)稱博弈。含義是兩個(gè)基本模型是兩個(gè)博弈方之間的對(duì)稱博弈。含義是兩個(gè)博弈位置是無差異的。博弈位置是無差異的。n其中其中abcdabcd可以是任何得益,根據(jù)問題設(shè)定??梢允侨魏蔚靡?,根據(jù)問題設(shè)定。復(fù)制動(dòng)態(tài)分析復(fù)制動(dòng)態(tài)分析2121)1()1()1(uxuxudxcxubxaxu)(1 ()()1 ()(1 (21dbxcaxxxuuxxdx/dtx1X*)1 ()(2111uxxuuxuuxdtdx復(fù)制動(dòng)態(tài)的進(jìn)化規(guī)復(fù)

14、制動(dòng)態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物則是生物學(xué)中生物特征進(jìn)化規(guī)則特征進(jìn)化規(guī)則設(shè)設(shè)x x為采用策略為采用策略1 1的的比例比例復(fù)制動(dòng)態(tài)復(fù)制動(dòng)態(tài)相位圖相位圖X X* *可能與可能與x=0 x=0或或x=1x=1重合重合5.3.3 協(xié)調(diào)博弈的復(fù)制動(dòng)態(tài)協(xié)調(diào)博弈的復(fù)制動(dòng)態(tài) 和進(jìn)化穩(wěn)定博弈和進(jìn)化穩(wěn)定博弈5050,50500 0,49496060,60604949,0 0策略策略1 1博弈方博弈方2 2策略策略2 2策略策略1 1策略策略2 2博博弈弈方方1 1一般一般2 2* *2 2對(duì)稱博弈對(duì)稱博弈dx/dtx111/61復(fù)制動(dòng)態(tài)進(jìn)化博弈的結(jié)果復(fù)制動(dòng)態(tài)進(jìn)化博弈的結(jié)果常常取決與帶有很大偶然常常取決與帶有很大偶然

15、性的初始狀態(tài)。性的初始狀態(tài)。)(1 ()()1 ()(dbxcaxxxxFdtdx)1161)(1 (xxx5.3.4 鷹鴿博弈的復(fù)制動(dòng)態(tài)鷹鴿博弈的復(fù)制動(dòng)態(tài) 和進(jìn)化穩(wěn)定策略和進(jìn)化穩(wěn)定策略, , 0, v0, v, , v, 0v, 0鷹鷹博弈方博弈方2 2鴿鴿?jì)楘楕濜澆┎┺霓姆椒? 1鷹鴿博弈鷹鴿博弈2cv 2cv 2v2v雙方爭奪雙方爭奪的利益的利益失敗一方失敗一方的損失的損失復(fù)制動(dòng)態(tài)方程和相位圖復(fù)制動(dòng)態(tài)方程和相位圖2)1 (2)()1 ()(vxcvxxxxFdtdx)61)(1 (xxxdx/dtx11/6采用鷹策略博采用鷹策略博弈方比例弈方比例設(shè)設(shè)v=2,=2,c=12=12ESS,意

16、義:在較大規(guī)模群體的長期進(jìn)化中,意義:在較大規(guī)模群體的長期進(jìn)化中,采取攻擊型策略的博弈方數(shù)量最終穩(wěn)定在采取攻擊型策略的博弈方數(shù)量最終穩(wěn)定在1/61/6左右,發(fā)生嚴(yán)重戰(zhàn)爭的可能性為左右,發(fā)生嚴(yán)重戰(zhàn)爭的可能性為1/361/365.3.5 蛙鳴博弈的復(fù)制動(dòng)態(tài)蛙鳴博弈的復(fù)制動(dòng)態(tài) 和進(jìn)化穩(wěn)定策略和進(jìn)化穩(wěn)定策略n動(dòng)物進(jìn)化競爭是生物多樣性、復(fù)雜性的基本機(jī)制動(dòng)物進(jìn)化競爭是生物多樣性、復(fù)雜性的基本機(jī)制蛙鳴博弈:蛙鳴博弈:P-z, P-zP-z, P-z1-m, m-z1-m, m-z0, 00, 0m-z, 1-mm-z, 1-m鳴叫鳴叫雄蛙雄蛙2 2不鳴不鳴鳴叫鳴叫不鳴不鳴雄雄蛙蛙1 1蛙鳴博弈不同均衡的條件

17、蛙鳴博弈不同均衡的條件Z ZM M1 11 1鳴叫鳴叫混合策略混合策略不鳴叫不鳴叫m=1-P+zm=1-P+zm=zm=z蛙鳴博弈復(fù)制動(dòng)態(tài)方程和不動(dòng)點(diǎn)蛙鳴博弈復(fù)制動(dòng)態(tài)方程和不動(dòng)點(diǎn)x x鳴叫雄蛙比例鳴叫雄蛙比例)(1 ()1()1 (zmxmzPxxxdtdx可能的不動(dòng)點(diǎn):可能的不動(dòng)點(diǎn): x*=0 x*=1 x*=(m-z)/(1-p)復(fù)制動(dòng)態(tài)方程復(fù)制動(dòng)態(tài)方程蛙鳴博弈復(fù)制動(dòng)態(tài)相位圖蛙鳴博弈復(fù)制動(dòng)態(tài)相位圖xdx/dt1(m-z)/(1-P)0dx/dtx1(m-z)/(1-P)0(m-z)/(1-P)15.4 復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性:復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性: 兩人非對(duì)稱博弈兩人非對(duì)稱博弈5.4.1 5

18、.4.1 市場阻入博弈的復(fù)制動(dòng)態(tài)市場阻入博弈的復(fù)制動(dòng)態(tài) 和進(jìn)化穩(wěn)定策略和進(jìn)化穩(wěn)定策略5.4.2 5.4.2 非對(duì)稱鷹鴿博弈的進(jìn)化分析非對(duì)稱鷹鴿博弈的進(jìn)化分析5.4.1 市場阻入博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略市場阻入博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略)1 ()1 (2)1 (11)1 (1)1 ( 22)1 (011111xyxuxuxuyyuyyyunene1 12 2進(jìn)入進(jìn)入不進(jìn)不進(jìn)打擊打擊不打不打(0 0,0 0)(2 2,2 2)(1 1,5 5)xxyuyuyuxxxuxxxunsns325)1 (355)1 (2555)1 (022222采用采用“打擊打擊”策略博弈方比策略博弈方比例例采用采用“進(jìn)入進(jìn)入”策略博弈方比策略博弈方比例例博弈方博弈方1 1位置位置博弈群體復(fù)制動(dòng)態(tài)相位圖博弈群體復(fù)制動(dòng)態(tài)相位圖xdx/dt1y1/2xdx/dt1yv20設(shè)設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論