進(jìn)化博弈基本動(dòng)態(tài)理論_第1頁
進(jìn)化博弈基本動(dòng)態(tài)理論_第2頁
進(jìn)化博弈基本動(dòng)態(tài)理論_第3頁
進(jìn)化博弈基本動(dòng)態(tài)理論_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、進(jìn)化博弈基本動(dòng)態(tài)理論         內(nèi)容包括 進(jìn)化穩(wěn)定策略 模仿者動(dòng)態(tài) 隨機(jī)穩(wěn)定均衡 進(jìn)化 進(jìn)化博弈 博弈        摘要;本文主要介紹進(jìn)化博弈理論的基本動(dòng)態(tài)模型:對(duì)稱博弈模仿者動(dòng)態(tài)模型和非對(duì)稱博弈模仿者動(dòng)態(tài)模型及其相關(guān)結(jié)論。為了便于理解,在文中引用了一些簡(jiǎn)單的例子說明它們之間的區(qū)別與聯(lián)系。在此基礎(chǔ)上文中還介紹了理論家們對(duì)隨機(jī)動(dòng)態(tài)所進(jìn)行的相關(guān)研究及其所取得的理論成果。最后本文比較了經(jīng)典博弈理論 與進(jìn)化博弈理論在動(dòng)態(tài)概念上的差別。關(guān)

2、鍵詞:進(jìn)化穩(wěn)定策略;模仿者動(dòng)態(tài);隨機(jī)穩(wěn)定均衡;進(jìn)化博弈理論至少自Lewontin(1960)用于解釋生態(tài)現(xiàn)象就已經(jīng)產(chǎn)生了,并被廣泛應(yīng)用于生態(tài)學(xué)、學(xué)及學(xué)等領(lǐng)域來研究群體行為的演化過程及其結(jié)果。進(jìn)化博弈理論從有限理性的個(gè)體出發(fā),以群體為研究對(duì)象,認(rèn)為現(xiàn)實(shí)中個(gè)體并不是行為最優(yōu)化者,個(gè)體的決策是通過個(gè)體之間模仿、學(xué)習(xí)和突變等動(dòng)態(tài)過程來實(shí)現(xiàn)的。進(jìn)化博弈理論強(qiáng)調(diào)系統(tǒng)達(dá)到均衡的動(dòng)態(tài)調(diào)整過程,認(rèn)為系統(tǒng)的均衡是達(dá)到均衡過程的函數(shù),也就說均衡依賴于達(dá)到均衡的路徑。動(dòng)態(tài)概念在進(jìn)化博弈理論中占有相當(dāng)重要的地位,許多博弈理論家對(duì)群體行為調(diào)整過程進(jìn)行了廣泛而深入的研究,根據(jù)他們考慮問題的角度不同而提出了不同的動(dòng)態(tài)模型,如

3、Weibull(1995) 提出的模仿動(dòng)態(tài)(Imitation Dynamics)模型;Börgers and Sarin(1995,1997)等提出的強(qiáng)化動(dòng)態(tài) (Reinforcement Dynamics)模型等等。但到目前為止,在進(jìn)化博弈理論中應(yīng)用最多的還是由Taylor and Jonker(1978)提出的模仿者動(dòng)態(tài)(Replicator Dynamics)模型。模仿者動(dòng)態(tài)是進(jìn)化博弈理論的基本動(dòng)態(tài),它能較好地描繪出有限理性個(gè)體的群體行為變化趨勢(shì),由之得出的結(jié)論能夠比較準(zhǔn)確地預(yù)測(cè)個(gè)體的群體行為,因而倍受博弈論理論家們的重視。本文集中介紹確定性模仿者動(dòng)態(tài)概念、模型及其與經(jīng)典博弈

4、動(dòng)態(tài)概念的區(qū)別。一、確定性模仿者動(dòng)態(tài);一般的進(jìn)化過程都包括兩個(gè)可能的行為演化機(jī)制:選擇機(jī)制(Selection Mechanism)和突變機(jī)制(Mutation mechanism)。選擇機(jī)制是指本期中能夠獲得較高支付的策略,在下期被更多參與者選擇;突變是指參與者以隨機(jī)(無目的性)的方式選擇策略,因此突變策略可能獲得較高支付也可能獲得較低支付,突變一般很少發(fā)生。新的突變也必須經(jīng)過選擇,并且只有獲得較高支付的策略才能生存(Survive)下來。按所研究的群體數(shù)目不同,進(jìn)化博弈動(dòng)態(tài)模型可分為兩大類:?jiǎn)稳后w(Monomorphic Population)動(dòng)態(tài)模型與多群體(Polymorphic Po

5、pulations)動(dòng)態(tài)模型。單群體動(dòng)態(tài)模型是指所考察的對(duì)象只含有一個(gè)群體,并且群體中個(gè)體都有相同的純策略集,個(gè)體與虛擬的參與人 進(jìn)行對(duì)稱博弈。多群體動(dòng)態(tài)模型 是指所考察的對(duì)象中含有多個(gè)群體,不同群體個(gè)體可能有不同的純策略集,不同群體個(gè)體之間進(jìn)行的是非對(duì)稱博弈。博弈中個(gè)體選擇純策略所得的支付不僅隨其所在群體的狀態(tài)變化而變化,而且也隨其他群體狀態(tài)的變化而變化。下面重點(diǎn)介紹單群體與多群體動(dòng)態(tài)模仿者動(dòng)態(tài)模型。;1.1、單群體確定性模仿者動(dòng)態(tài)模型;單群體模仿者動(dòng)態(tài)模型是由Taylor and Jonker (1978)在考察生態(tài)演化現(xiàn)象時(shí)首次提出的。他們把一個(gè)生態(tài)中所有的種群看作為一個(gè)大群體,而把群體

6、中每個(gè)種群都想象或程式化為一個(gè)特定的純策略。群體在不同時(shí)刻所處的狀態(tài)一般用混合策略來表示。所謂模仿者動(dòng)態(tài)是指使用某一純策略的人數(shù)所占比例的增長(zhǎng)率等于使用該策略時(shí)所得支付 與群體平均支付之差,或者與平均支付成正比例。為了說明的方便,本文首先給出一些符號(hào),然后給出Taylor and Jonker (1978)模仿者動(dòng)態(tài)公式的推導(dǎo)過程。;假定群體中每一個(gè)個(gè)體在任何時(shí)候只選擇一個(gè)純策略,比如,第j個(gè)個(gè)體在某時(shí)刻選擇純策略(當(dāng)然由于突變或策略轉(zhuǎn)移,同一個(gè)體在不同時(shí)刻可以選擇不同的純策略)。表示群體中各個(gè)體可供選擇的純策略集;N表示群體中個(gè)體總數(shù);表示在時(shí)刻t選擇純策略i的個(gè)體數(shù)。表示群體在時(shí)刻t所處的

7、狀態(tài),其中表示在該時(shí)刻選擇純策略i的人數(shù)在群體中所占的比例,即。表示群體中個(gè)體進(jìn)行隨機(jī)配對(duì)匿名博弈時(shí),群體中選擇純策略的個(gè)體所得的期望支付。表示群體平均期望支付。;下面給出連續(xù)時(shí)間模仿者動(dòng)態(tài)公式,此時(shí)動(dòng)態(tài)系統(tǒng)的演化過程可以用微分方程來表示。在對(duì)稱博弈中每一個(gè)個(gè)體都認(rèn)為其對(duì)手來自于狀態(tài)為x 的群體。事實(shí)上,每個(gè)個(gè)體所面的對(duì)手是代表群體狀態(tài)的虛擬個(gè)體 。假定選擇純策略的個(gè)體數(shù)的增長(zhǎng)率等于,那么可以得到如下的等式:由定義可知,兩邊對(duì)t微分可以 :兩邊同時(shí)除以N得到: ;上式就是對(duì)稱博弈模型中模仿者動(dòng)態(tài)公式的微分形式??梢钥闯觯绻粋€(gè)選擇純策略的個(gè)體得到的支付少于群體平均支付,那么選擇純策略的個(gè)體在

8、群體中所占比例將會(huì)隨著時(shí)間的演化而不斷減少;如果一個(gè)選擇策略的個(gè)體得到的支付多于群體平均支付,那么選擇策略的個(gè)體在群體中所占比例將會(huì)隨著時(shí)間的演化而不斷地增加;如果個(gè)體選擇純策略所得的支付恰好等群體平均支付,則選擇該純策略的個(gè)體在群體中所占比例不變。;從上面的公式推導(dǎo)過程可以看出,Taylor and Jonker提出的模仿者動(dòng)態(tài)僅僅考慮到純策略的繼承性,而沒有考慮到混合策略的可繼承性。Bomze(1986)證明了如果允許混合策略也可以被繼承,那么在模仿者動(dòng)態(tài)下,進(jìn)化穩(wěn)定策略 等價(jià)于漸近穩(wěn)定性。另外,下面不加證明 地給出Hofbauer et al. (1979); Zeeman (1980)

9、提出并證明的一個(gè)命題,“在模仿者動(dòng)態(tài)下,對(duì)稱博弈中每一個(gè)ESS都是漸近穩(wěn)定的”。這個(gè)命題的逆命題并不成立,下面用Fudenberg(1995)的一個(gè)反例來給予說明,考察表矩陣所示的對(duì)稱博弈:;該博弈有唯一對(duì)稱的納什均衡 (),且均衡時(shí)的期望支付為。這個(gè)均衡并不是進(jìn)化穩(wěn)定均衡,因?yàn)樗軌虮徊呗郧秩?;又因?yàn)樵谄胶恻c(diǎn)處雅可比行列式的特征根是和,該均衡狀態(tài)是動(dòng)態(tài)系統(tǒng)的匯 (Sink),因此均衡是漸近穩(wěn)定的,所以對(duì)稱博弈的漸近穩(wěn)定均衡并不一定是進(jìn)化穩(wěn)定均衡。;從模擬者動(dòng)態(tài)方程可以看出,支付函數(shù)的正向變換或者位移變換只改變?nèi)后w演化速度而不影響群體演化路徑。因而,在進(jìn)行分析時(shí),可以對(duì)支付矩陣進(jìn)行必要的簡(jiǎn)化處

10、理。;另外,由此還可以求出的兩個(gè)種群相對(duì)增長(zhǎng)率:;上式說明:個(gè)體博弈時(shí),獲得相對(duì)較多支付的群體則具有更高的增長(zhǎng)率。;1.2、多群體模仿者動(dòng)態(tài)模型;Selten(1980)引入角色限制行為(Role Conditioned Behavior)而把群體分為單群體與多群體,不同群體根據(jù)個(gè)體可供選擇的純策略集不同來劃分。多群體時(shí),不同群體中的個(gè)體有不同純策略集、不同群體平均支付及不同群體演化速度。因而,多群體模仿者動(dòng)態(tài)公式推導(dǎo)比較復(fù)雜,下面給出多群體模仿者動(dòng)態(tài)方程(參閱文獻(xiàn)24):;其中,上標(biāo)j表示第j個(gè)群體,其中K表示有K個(gè)群體;表示第j個(gè)群體中選擇第個(gè)純策略的個(gè)體數(shù)占該群體總數(shù)的百分比;表示群體j在某時(shí)刻所處的狀態(tài),表示第j個(gè)群體以外的其他群體在t時(shí)刻所處的狀態(tài);表示群體j中個(gè)體行為集中的第i個(gè)純策略;x表示混合群體的混合策略組合,表示混合群體狀態(tài)為x時(shí)群體j中個(gè)體選擇純策略時(shí)所能得到的期望支付;表示混合群體的平均支付。;多群體模型并不是對(duì)單群體模型的簡(jiǎn)單改進(jìn),由單群體到多群體涉及到一系列的如均衡及穩(wěn)定性等問題的變化。Selten(1980)證明了“在多群體博弈中進(jìn)化穩(wěn)定均衡都是嚴(yán)格納

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論