第五章-演化博弈課件_第1頁(yè)
第五章-演化博弈課件_第2頁(yè)
第五章-演化博弈課件_第3頁(yè)
第五章-演化博弈課件_第4頁(yè)
第五章-演化博弈課件_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章有限理性和進(jìn)化博弈本章介紹有限理性基礎(chǔ)上的進(jìn)化博弈分析。完全理性在現(xiàn)實(shí)中很難滿足,當(dāng)社會(huì)經(jīng)濟(jì)環(huán)境和決策問題較復(fù)雜時(shí),人們存在很大的理性局限。有限理性對(duì)人們的決策、行為選擇方式有很大影響,有限理性基礎(chǔ)上的博弈分析與完全理性博弈分析也有很大區(qū)別。進(jìn)化博弈分析是有限理性博弈分析的基本框架。本章介紹以最優(yōu)反應(yīng)動(dòng)態(tài)和復(fù)制動(dòng)態(tài)為核心,以進(jìn)化穩(wěn)定策略為基本均衡概念的進(jìn)化博弈分析,包括基本方法、概念和各種經(jīng)典模型等。第五章有限理性和進(jìn)化博弈本章介紹有限理性基礎(chǔ)上15.1有限理性博弈及其分析框架問題的提出:Nash在其博士論文“Non-cooperativegames”(1950年)給出Nash均衡的兩種解釋,一種是完全理性的解釋——均衡是通過理性的參與者進(jìn)行嚴(yán)密的邏輯演繹推理得到的,對(duì)參與者的理性能力有較高要求。一種是基于群體行為的解釋——當(dāng)時(shí)沒有很好的方法構(gòu)建數(shù)學(xué)模型。5.1有限理性博弈及其分析框架問題的提出:Nash2傳統(tǒng)博弈中的理性要求1目標(biāo)理性(主觀理性):參與者追求自身利益的最大化(經(jīng)濟(jì)學(xué)理性的內(nèi)涵);2具有理性的能力:參與者具有計(jì)算推理、預(yù)見、記憶、分析判斷的能力(例如:求解動(dòng)態(tài)博弈均衡的遞推歸納法),不會(huì)犯錯(cuò)誤(例如:顫抖手均衡要求犯錯(cuò)誤時(shí)仍具有穩(wěn)健性);3認(rèn)知理性:參與者了解博弈的結(jié)構(gòu)和規(guī)則、以及理性的“共同知識(shí)”(遞推歸納法的基礎(chǔ))、作為不完全信息博弈均衡求解基礎(chǔ)的貝葉斯理性(參與者對(duì)不確定性事物具有事前概率分布的判斷,在動(dòng)態(tài)過程中進(jìn)行更新的貝葉斯決策)。傳統(tǒng)博弈的理性假設(shè)過于嚴(yán)格傳統(tǒng)博弈中的理性要求1目標(biāo)理性(主觀理性):參與者追求自身利3有限理性的概念:aHerbetSimon提出有限理性概念,是指:參與者具有目標(biāo)的理性,但是由于面對(duì)復(fù)雜的,多元化的,不確定性的社會(huì)現(xiàn)實(shí),其認(rèn)知能力的有限性造成參與者在決策時(shí)只能達(dá)到滿意解,即缺少理性的能力。b另一種觀點(diǎn):有限理性是由于Knight提出的內(nèi)在的不確定性造成的,即非線性系統(tǒng)固有的不可預(yù)知性。有限理性的概念:4有限理性博弈分析的目標(biāo)a放寬參與者嚴(yán)格的理性要求,分析有限理性的參與者通過各種學(xué)習(xí)過程,如何達(dá)到穩(wěn)定的均衡狀態(tài)。b.傳統(tǒng)博弈主要解決:Nash均衡的選擇(例如子博弈Nash均衡)和多重Nash均衡的精練(例如顫抖手均衡)問題。有限理性博弈分析主要解決:針對(duì)不同條件下具體的學(xué)習(xí)過程(構(gòu)建的學(xué)習(xí)模型體現(xiàn)了理性的不同要求)、學(xué)習(xí)調(diào)整過程中均衡的穩(wěn)定性(運(yùn)用穩(wěn)定性理論,分析原Nash均衡是否收斂)。有限理性博弈分析的目標(biāo)a放寬參與者嚴(yán)格的理性要求,分析有5有限理性博弈分析的范圍a.個(gè)體層次上的有限理性博弈:古諾模型—參與者根據(jù)對(duì)手的上一期行動(dòng)決定當(dāng)期策略選擇;虛擬行動(dòng)—參與者對(duì)對(duì)手行動(dòng)有一個(gè)包括先驗(yàn)概率在內(nèi)的概率分布的估計(jì),然后最大化自己的預(yù)期收益。b.群體層次上的有限理性博弈:演化博弈理論(MaynardSmithandPrice與1973年研究生物種群系統(tǒng)的進(jìn)化現(xiàn)象時(shí)提出生物系統(tǒng)的演化博弈基本概念)。有限理性博弈分析的范圍a.個(gè)體層次上的有限理性博弈:65.1.1有限理性及其對(duì)博弈的影響有限理性博弈方:不滿足完全理性假設(shè)的博弈方有限理性意味著一般至少有部分博弈方不會(huì)采用完全理性博弈的均衡策略有限理性意味著均衡是不斷調(diào)整和改進(jìn)而不是一次性選擇的結(jié)果,而且即使到達(dá)了均衡也可能再次偏離有限理性博弈方會(huì)在博弈過程中學(xué)習(xí),博弈通過試錯(cuò)尋找較好的策略5.1.1有限理性及其對(duì)博弈的影響有限理性博弈方:不滿足完75.1.2有限理性博弈分析框架有限博弈方構(gòu)成的一定規(guī)模的特定群體內(nèi)成員的某種反復(fù)博弈.關(guān)鍵是確定博弈方學(xué)習(xí)和策略調(diào)整的模式.最優(yōu)反應(yīng)動(dòng)態(tài):有快速學(xué)習(xí)能力的小群體成員的反復(fù)博弈及策略調(diào)整的動(dòng)態(tài)機(jī)制.復(fù)制動(dòng)態(tài):學(xué)習(xí)速度很慢的成員組成的大群體隨機(jī)配對(duì)的反復(fù)博弈及策略調(diào)整的動(dòng)態(tài)機(jī)制.進(jìn)化穩(wěn)定策略(ESS)5.1.2有限理性博弈分析框架有限博弈方構(gòu)成的一定規(guī)85.2最優(yōu)反應(yīng)動(dòng)態(tài)5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型考慮5個(gè)有限博弈方相互博弈的快速學(xué)習(xí)動(dòng)態(tài)調(diào)整模型:50,500,4960,6049,0A博弈方2BAB博弈方1協(xié)調(diào)博弈123455.2最優(yōu)反應(yīng)動(dòng)態(tài)5.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)9反應(yīng)、策略調(diào)整規(guī)則推導(dǎo)反應(yīng)、策略調(diào)整規(guī)則推導(dǎo)10最優(yōu)反應(yīng)動(dòng)態(tài)模擬:初次博弈1個(gè)AABABABABBBAAAAABAAAABAABB最優(yōu)反應(yīng)動(dòng)態(tài)模擬:初次博弈1個(gè)AABABABABBBAAAA11初次博弈相鄰2個(gè)AAAAAAAABAABBBAA初次博弈相鄰2個(gè)AAAAAAAABAABBBAA12初次博弈相連3個(gè)ABAABAAAAAA初次博弈相連3個(gè)ABAABAAAAAA135.2.2古諾調(diào)整過程古諾模型反應(yīng)函數(shù)

1234………博弈方12.51.52.1251.875博弈方231.752.251.9375問題:兩寡頭始終假設(shè)對(duì)方產(chǎn)量不變最優(yōu)反應(yīng)動(dòng)態(tài)模擬收斂條件5.2.2古諾調(diào)整過程古諾模型反應(yīng)函數(shù)145.3復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn):兩人對(duì)稱博弈5.3.1簽協(xié)議博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略5.3.2一般兩人對(duì)稱博弈復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略5.3.3協(xié)調(diào)博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定博弈5.3.4鷹鴿博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略5.3.5蛙鳴博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略5.3復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn):兩人對(duì)稱博弈5.3.1簽協(xié)議博155.3.1簽協(xié)議博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略經(jīng)濟(jì)活動(dòng)中的各種合作都可以用簽協(xié)議博弈描述。特點(diǎn)理性層次低,大規(guī)模群體隨機(jī)配對(duì)反復(fù)博弈。1,10,00,00,0同意博弈方2不同意同意不同意博弈方1假設(shè)群體中采用“同意”比例x則不同策略期望得益和平均得益為:5.3.1簽協(xié)議博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略經(jīng)濟(jì)活動(dòng)中的各16博弈方策略類型比例動(dòng)態(tài)變化是有限理性博弈分析的核心,其關(guān)鍵是動(dòng)態(tài)變化的速度以采用“同意”策略類型博弈方的比例為例,其動(dòng)態(tài)變化速度可用下列微分方程反映:博弈方策略類型比例動(dòng)態(tài)變化是有限理性博弈分析的核心,其關(guān)鍵是17動(dòng)態(tài)微分方程的相位圖dx/dtx010.5穩(wěn)定狀態(tài)、不動(dòng)點(diǎn):x*=0,x*=1動(dòng)態(tài)微分方程的相位圖dx/dtx010.518進(jìn)化穩(wěn)定策略的檢驗(yàn)進(jìn)化穩(wěn)定策略的檢驗(yàn)195.3.2一般兩人對(duì)稱博弈復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略一般模型a,ac,bd,db,c策略1博弈方2策略2策略1策略2博弈方1一般2X2對(duì)稱博弈進(jìn)化博弈設(shè)定是在一個(gè)大群體的成員中進(jìn)行隨機(jī)配對(duì)的反復(fù)博弈?;灸P褪莾蓚€(gè)博弈方之間的對(duì)稱博弈。含義是兩個(gè)博弈位置是無差異的。其中abcd可以是任何得益,根據(jù)問題設(shè)定。5.3.2一般兩人對(duì)稱博弈復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略一般模型a,205.3.3演化博弈均衡的一個(gè)判斷標(biāo)準(zhǔn)——演化穩(wěn)定策略(EvolutionaryStableStrategy,ESS)演化穩(wěn)定策略(ESS)是演化博弈的一個(gè)核心概念,其反映了均衡解的穩(wěn)定性狀態(tài)(另一個(gè)是模仿者動(dòng)態(tài),其反映了最常用的一種向均衡穩(wěn)定狀態(tài)的動(dòng)態(tài)收斂過程)。ESS定義:對(duì)于非常小的正數(shù)ε,所有的σ≠σ*,。ESS等價(jià)的定義表述:條件1,對(duì)所有的σ≠σ*,,即嚴(yán)格Nash均衡;條件2,如果

,則。5.3.3演化博弈均衡的一個(gè)判斷標(biāo)準(zhǔn)——演化穩(wěn)定策略(21復(fù)制動(dòng)態(tài)分析dx/dtx1x復(fù)制動(dòng)態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物特征進(jìn)化規(guī)則設(shè)x為采用策略1的比例復(fù)制動(dòng)態(tài)相位圖復(fù)制動(dòng)態(tài)分析dx/dtx1x復(fù)制動(dòng)態(tài)的進(jìn)化規(guī)則是生物學(xué)中生物225.3.3協(xié)調(diào)博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定博弈50,500,4960,6049,0策略1博弈方2策略2策略1策略2博弈方1一般2*2對(duì)稱博弈dx/dtx111/16復(fù)制動(dòng)態(tài)進(jìn)化博弈的結(jié)果常常取決與帶有很大偶然性的初始狀態(tài)。5.3.3協(xié)調(diào)博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定博弈50,500,4235.3.4鷹鴿博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略,0,v,v,0鷹博弈方2鴿?jì)楕澆┺姆?鷹鴿博弈5.3.4鷹鴿博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略,0,v24復(fù)制動(dòng)態(tài)方程和相位圖dx/dtx11/6復(fù)制動(dòng)態(tài)方程和相位圖dx/dtx11/6255.3.5蛙鳴博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略動(dòng)物進(jìn)化競(jìng)爭(zhēng)是生物多樣性、復(fù)雜性的基本機(jī)制蛙鳴博弈:P-z,P-z1-m,m-z0,0m-z,1-m鳴叫雄蛙2不鳴鳴叫不鳴雄蛙15.3.5蛙鳴博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略動(dòng)物進(jìn)化競(jìng)爭(zhēng)是生26蛙鳴博弈不同均衡的條件ZM11鳴叫混合策略不鳴叫m=1-P+zm=z蛙鳴博弈不同均衡的條件ZM1鳴叫混合策略不鳴叫m=1-P+z27蛙鳴博弈復(fù)制動(dòng)態(tài)方程和不動(dòng)點(diǎn)x——鳴叫雄蛙比例可能的不動(dòng)點(diǎn):

x*=0x*=1x*=(m-z)/(1-p)復(fù)制動(dòng)態(tài)方程蛙鳴博弈復(fù)制動(dòng)態(tài)方程和不動(dòng)點(diǎn)x——鳴叫雄蛙比例可能的不動(dòng)點(diǎn):28蛙鳴博弈復(fù)制動(dòng)態(tài)相位圖xdx/dt1(m-z)/(1-P)<0dx/dtx1(m-z)/(1-P)0<(m-z)/(1-P)<1xdx/dt1(m-z)/(1-P)>1蛙鳴博弈復(fù)制動(dòng)態(tài)相位圖xdx/dt1(m-z)/(1-P)<295.4復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性:兩人非對(duì)稱博弈5.4.1市場(chǎng)阻入博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略5.4.2非對(duì)稱鷹鴿博弈的進(jìn)化分析5.4復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定性:兩人非對(duì)稱博弈5.4.1市場(chǎng)305.4.1市場(chǎng)阻入博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略12進(jìn)入不進(jìn)打擊不打(0,0)(2,2)(1,5)5.4.1市場(chǎng)阻入博弈的復(fù)制動(dòng)態(tài)和進(jìn)化穩(wěn)定策略12進(jìn)入不進(jìn)31博弈方1位置博弈群體復(fù)制動(dòng)態(tài)相位圖xdx/dt1y>1/2xdx/dt1y<1/2dx/dtx1y=1/2博弈方1位置博弈群體復(fù)制動(dòng)態(tài)相位圖xdx/dt1y>1/2x32博弈方2位置博弈群體復(fù)制動(dòng)態(tài)相位圖xdy/dt1x=0xdy/dt1x=0博弈方2位置博弈群體復(fù)制動(dòng)態(tài)相位圖xdy/dt1x=0x33兩群體復(fù)制動(dòng)態(tài)的關(guān)系和穩(wěn)定性xy111/20兩群體復(fù)制動(dòng)態(tài)的關(guān)系和穩(wěn)定性xy11/20345.4.2非對(duì)稱鷹鴿博弈的進(jìn)化分析鷹博弈方1鴿?jì)棽┺姆?鴿5.4.2非對(duì)稱鷹鴿博弈的進(jìn)化分析鷹博鴿?jì)棽┺姆?鴿35非對(duì)稱鷹鴿博弈博弈方1群體復(fù)制動(dòng)態(tài)相位圖xdx/dt1y>5/6xdx/dt1y<5/6xdx/dt1y=5/6非對(duì)稱鷹鴿博弈博弈方1群體復(fù)制動(dòng)態(tài)相位圖xdx/dt1y>536非對(duì)稱鷹鴿博弈博弈方2群體復(fù)制動(dòng)態(tài)相位圖ydy/dt1x>1/6ydy/dt1x<1/6ydy/dt1x=1/6非對(duì)稱鷹鴿博弈博弈方2群體復(fù)制動(dòng)態(tài)相位圖ydy/dt1x>137兩群體復(fù)制動(dòng)態(tài)關(guān)系和穩(wěn)定性xY111/65/6BDCA兩群體復(fù)制動(dòng)態(tài)關(guān)系和穩(wěn)定性xY11/65/6BDCA38總結(jié)和前沿研究的管窺傳統(tǒng)博弈和演化博弈的各自適用范圍:傳統(tǒng)(古典)博弈a基本特點(diǎn):假定參與者在信息收集、預(yù)期形成、后果推斷和決策上是超理性的,但是這種共同預(yù)期是如何形成的未加說明。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論