進(jìn)化博弈基本動(dòng)態(tài)理論

上傳人：7*** IP屬地：湖北上傳時(shí)間：2022-01-26 格式：DOC 頁數(shù)：4 大小：44.50KB 積分：18 舉報(bào) 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、進(jìn)化博弈基本動(dòng)態(tài)理論內(nèi)容包括進(jìn)化穩(wěn)定策略模仿者動(dòng)態(tài) 隨機(jī)穩(wěn)定均衡進(jìn)化進(jìn)化博弈博弈摘要;本文主要介紹進(jìn)化博弈理論的基本動(dòng)態(tài)模型：對(duì)稱博弈模仿者動(dòng)態(tài)模型和非對(duì)稱博弈模仿者動(dòng)態(tài)模型及其相關(guān)結(jié)論。為了便于理解，在文中引用了一些簡(jiǎn)單的例子說明它們之間的區(qū)別與聯(lián)系。在此基礎(chǔ)上文中還介紹了理論家們對(duì)隨機(jī)動(dòng)態(tài)所進(jìn)行的相關(guān)研究及其所取得的理論成果。最后本文比較了經(jīng)典博弈理論與進(jìn)化博弈理論在動(dòng)態(tài)概念上的差別。關(guān)

2、鍵詞：進(jìn)化穩(wěn)定策略；模仿者動(dòng)態(tài)；隨機(jī)穩(wěn)定均衡;進(jìn)化博弈理論至少自Lewontin（1960）用于解釋生態(tài)現(xiàn)象就已經(jīng)產(chǎn)生了，并被廣泛應(yīng)用于生態(tài)學(xué)、學(xué)及學(xué)等領(lǐng)域來研究群體行為的演化過程及其結(jié)果。進(jìn)化博弈理論從有限理性的個(gè)體出發(fā)，以群體為研究對(duì)象，認(rèn)為現(xiàn)實(shí)中個(gè)體并不是行為最優(yōu)化者，個(gè)體的決策是通過個(gè)體之間模仿、學(xué)習(xí)和突變等動(dòng)態(tài)過程來實(shí)現(xiàn)的。進(jìn)化博弈理論強(qiáng)調(diào)系統(tǒng)達(dá)到均衡的動(dòng)態(tài)調(diào)整過程，認(rèn)為系統(tǒng)的均衡是達(dá)到均衡過程的函數(shù)，也就說均衡依賴于達(dá)到均衡的路徑。動(dòng)態(tài)概念在進(jìn)化博弈理論中占有相當(dāng)重要的地位，許多博弈理論家對(duì)群體行為調(diào)整過程進(jìn)行了廣泛而深入的研究，根據(jù)他們考慮問題的角度不同而提出了不同的動(dòng)態(tài)模型，如

3、Weibull(1995) 提出的模仿動(dòng)態(tài)（Imitation Dynamics）模型；Börgers and Sarin(1995，1997)等提出的強(qiáng)化動(dòng)態(tài) （Reinforcement Dynamics）模型等等。但到目前為止，在進(jìn)化博弈理論中應(yīng)用最多的還是由Taylor and Jonker(1978)提出的模仿者動(dòng)態(tài)（Replicator Dynamics）模型。模仿者動(dòng)態(tài)是進(jìn)化博弈理論的基本動(dòng)態(tài)，它能較好地描繪出有限理性個(gè)體的群體行為變化趨勢(shì)，由之得出的結(jié)論能夠比較準(zhǔn)確地預(yù)測(cè)個(gè)體的群體行為，因而倍受博弈論理論家們的重視。本文集中介紹確定性模仿者動(dòng)態(tài)概念、模型及其與經(jīng)典博弈

4、動(dòng)態(tài)概念的區(qū)別。一、確定性模仿者動(dòng)態(tài);一般的進(jìn)化過程都包括兩個(gè)可能的行為演化機(jī)制：選擇機(jī)制(Selection Mechanism)和突變機(jī)制（Mutation mechanism）。選擇機(jī)制是指本期中能夠獲得較高支付的策略，在下期被更多參與者選擇；突變是指參與者以隨機(jī)（無目的性）的方式選擇策略，因此突變策略可能獲得較高支付也可能獲得較低支付，突變一般很少發(fā)生。新的突變也必須經(jīng)過選擇，并且只有獲得較高支付的策略才能生存（Survive）下來。按所研究的群體數(shù)目不同，進(jìn)化博弈動(dòng)態(tài)模型可分為兩大類：?jiǎn)稳后w(Monomorphic Population)動(dòng)態(tài)模型與多群體(Polymorphic Po

5、pulations)動(dòng)態(tài)模型。單群體動(dòng)態(tài)模型是指所考察的對(duì)象只含有一個(gè)群體，并且群體中個(gè)體都有相同的純策略集，個(gè)體與虛擬的參與人進(jìn)行對(duì)稱博弈。多群體動(dòng)態(tài)模型是指所考察的對(duì)象中含有多個(gè)群體，不同群體個(gè)體可能有不同的純策略集，不同群體個(gè)體之間進(jìn)行的是非對(duì)稱博弈。博弈中個(gè)體選擇純策略所得的支付不僅隨其所在群體的狀態(tài)變化而變化，而且也隨其他群體狀態(tài)的變化而變化。下面重點(diǎn)介紹單群體與多群體動(dòng)態(tài)模仿者動(dòng)態(tài)模型。;1.1、單群體確定性模仿者動(dòng)態(tài)模型;單群體模仿者動(dòng)態(tài)模型是由Taylor and Jonker (1978)在考察生態(tài)演化現(xiàn)象時(shí)首次提出的。他們把一個(gè)生態(tài)中所有的種群看作為一個(gè)大群體，而把群體

6、中每個(gè)種群都想象或程式化為一個(gè)特定的純策略。群體在不同時(shí)刻所處的狀態(tài)一般用混合策略來表示。所謂模仿者動(dòng)態(tài)是指使用某一純策略的人數(shù)所占比例的增長(zhǎng)率等于使用該策略時(shí)所得支付與群體平均支付之差，或者與平均支付成正比例。為了說明的方便，本文首先給出一些符號(hào)，然后給出Taylor and Jonker (1978)模仿者動(dòng)態(tài)公式的推導(dǎo)過程。;假定群體中每一個(gè)個(gè)體在任何時(shí)候只選擇一個(gè)純策略，比如，第j個(gè)個(gè)體在某時(shí)刻選擇純策略（當(dāng)然由于突變或策略轉(zhuǎn)移，同一個(gè)體在不同時(shí)刻可以選擇不同的純策略）。表示群體中各個(gè)體可供選擇的純策略集；N表示群體中個(gè)體總數(shù)；表示在時(shí)刻t選擇純策略i的個(gè)體數(shù)。表示群體在時(shí)刻t所處的

7、狀態(tài)，其中表示在該時(shí)刻選擇純策略i的人數(shù)在群體中所占的比例，即。表示群體中個(gè)體進(jìn)行隨機(jī)配對(duì)匿名博弈時(shí)，群體中選擇純策略的個(gè)體所得的期望支付。表示群體平均期望支付。;下面給出連續(xù)時(shí)間模仿者動(dòng)態(tài)公式，此時(shí)動(dòng)態(tài)系統(tǒng)的演化過程可以用微分方程來表示。在對(duì)稱博弈中每一個(gè)個(gè)體都認(rèn)為其對(duì)手來自于狀態(tài)為x 的群體。事實(shí)上，每個(gè)個(gè)體所面的對(duì)手是代表群體狀態(tài)的虛擬個(gè)體。假定選擇純策略的個(gè)體數(shù)的增長(zhǎng)率等于，那么可以得到如下的等式：由定義可知，兩邊對(duì)t微分可以：兩邊同時(shí)除以N得到: ;上式就是對(duì)稱博弈模型中模仿者動(dòng)態(tài)公式的微分形式?？梢钥闯觯绻粋€(gè)選擇純策略的個(gè)體得到的支付少于群體平均支付，那么選擇純策略的個(gè)體在

8、群體中所占比例將會(huì)隨著時(shí)間的演化而不斷減少；如果一個(gè)選擇策略的個(gè)體得到的支付多于群體平均支付，那么選擇策略的個(gè)體在群體中所占比例將會(huì)隨著時(shí)間的演化而不斷地增加；如果個(gè)體選擇純策略所得的支付恰好等群體平均支付，則選擇該純策略的個(gè)體在群體中所占比例不變。;從上面的公式推導(dǎo)過程可以看出，Taylor and Jonker提出的模仿者動(dòng)態(tài)僅僅考慮到純策略的繼承性，而沒有考慮到混合策略的可繼承性。Bomze（1986）證明了如果允許混合策略也可以被繼承，那么在模仿者動(dòng)態(tài)下，進(jìn)化穩(wěn)定策略等價(jià)于漸近穩(wěn)定性。另外，下面不加證明地給出Hofbauer et al. (1979); Zeeman (1980)

9、提出并證明的一個(gè)命題，“在模仿者動(dòng)態(tài)下，對(duì)稱博弈中每一個(gè)ESS都是漸近穩(wěn)定的”。這個(gè)命題的逆命題并不成立，下面用Fudenberg(1995)的一個(gè)反例來給予說明，考察表矩陣所示的對(duì)稱博弈：;該博弈有唯一對(duì)稱的納什均衡（），且均衡時(shí)的期望支付為。這個(gè)均衡并不是進(jìn)化穩(wěn)定均衡，因?yàn)樗軌虮徊呗郧秩?；又因?yàn)樵谄胶恻c(diǎn)處雅可比行列式的特征根是和，該均衡狀態(tài)是動(dòng)態(tài)系統(tǒng)的匯（Sink），因此均衡是漸近穩(wěn)定的，所以對(duì)稱博弈的漸近穩(wěn)定均衡并不一定是進(jìn)化穩(wěn)定均衡。;從模擬者動(dòng)態(tài)方程可以看出，支付函數(shù)的正向變換或者位移變換只改變?nèi)后w演化速度而不影響群體演化路徑。因而，在進(jìn)行分析時(shí)，可以對(duì)支付矩陣進(jìn)行必要的簡(jiǎn)化處

10、理。;另外，由此還可以求出的兩個(gè)種群相對(duì)增長(zhǎng)率：;上式說明：個(gè)體博弈時(shí)，獲得相對(duì)較多支付的群體則具有更高的增長(zhǎng)率。;1.2、多群體模仿者動(dòng)態(tài)模型;Selten(1980)引入角色限制行為（Role Conditioned Behavior）而把群體分為單群體與多群體，不同群體根據(jù)個(gè)體可供選擇的純策略集不同來劃分。多群體時(shí)，不同群體中的個(gè)體有不同純策略集、不同群體平均支付及不同群體演化速度。因而，多群體模仿者動(dòng)態(tài)公式推導(dǎo)比較復(fù)雜，下面給出多群體模仿者動(dòng)態(tài)方程（參閱文獻(xiàn)24）：;其中，上標(biāo)j表示第j個(gè)群體，其中K表示有K個(gè)群體；表示第j個(gè)群體中選擇第個(gè)純策略的個(gè)體數(shù)占該群體總數(shù)的百分比；表示群體j在某時(shí)刻所處的狀態(tài)，表示第j個(gè)群體以外的其他群體在t時(shí)刻所處的狀態(tài)；表示群體j中個(gè)體行為集中的第i個(gè)純策略；x表示混合群體的混合策略組合，表示混合群體狀態(tài)為x時(shí)群體j中個(gè)體選擇純策略時(shí)所能得到的期望支付；表示混合群體的平均支付。;多群體模型并不是對(duì)單群體模型的簡(jiǎn)單改進(jìn)，由單群體到多群體涉及到一系列的如均衡及穩(wěn)定性等問題的變化。Selten(1980)證明了“在多群體博弈中進(jìn)化穩(wěn)定均衡都是嚴(yán)格納

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

進(jìn)化博弈基本動(dòng)態(tài)理論

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

進(jìn)化博弈基本動(dòng)態(tài)理論

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔