進(jìn)化博弈論讀書心得

上傳人：l*** IP屬地：天津上傳時(shí)間：2022-08-13 格式：DOCX 頁數(shù)：10 大小：47.82KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩5頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、進(jìn)化博弈論讀書報(bào)告汪波1973年，梅拉德史密斯和普瑞斯將博弈論的思想引入到生物演化的分析中，二人提出了進(jìn)化穩(wěn)定策略(ESS)，隨著1978年，Taylor和Jonker發(fā)現(xiàn)了進(jìn)化穩(wěn)定策略和復(fù)制動(dòng)力學(xué)之間的關(guān)系，標(biāo)志著進(jìn)化博弈理論的誕生，因?yàn)榕c復(fù)制動(dòng)力學(xué)之間的關(guān)系，進(jìn)化穩(wěn) 定策略也因此成為進(jìn)化博弈理論最經(jīng)典的概念。1982年，梅拉德史密斯出版了演化與博弈論，該書揭示動(dòng)物群體的行為變化的動(dòng)力學(xué)機(jī)制，也因此書他被稱為進(jìn)化博弈論之父，1995 年，Weibull 著作了Evolutionary Game Theory,2009 年初，Sandholm 出版 TPopulation Game a

2、nd Evolutionary Dynamics專著，這篇讀書報(bào)告是在看了這三本著作的很少的一部分內(nèi)容之下，理解其中一些淺顯的內(nèi)容后完成的。一、進(jìn)化穩(wěn)定策略最初的模型進(jìn)化博弈理論是將博弈論引入到生物學(xué)背景下產(chǎn)生的，當(dāng)生物的特定表現(xiàn)型的適應(yīng)度依賴于群體中的頻率分布時(shí)，進(jìn)化博弈論就是從這個(gè)角度來思考生物演化的問題的一種方法，古典博弈中，參與者根據(jù)自利的原則表現(xiàn)出理性行為，但在生物進(jìn)化的背景下是不合適的，由此，理性原則被群體的動(dòng)態(tài)性和穩(wěn)定性取代，而自利原則則被達(dá)爾文的適應(yīng)度所取代。在一些重要的假設(shè)下，將會(huì)得到博弈的一個(gè)新形式解：進(jìn)化穩(wěn)定策略。它是這樣一個(gè)策略，如果整個(gè)群體的每個(gè)成員都采取

3、這個(gè)策略，那么在自然選擇的作用下，不存在一個(gè)具有突變特征的策略能夠侵犯這個(gè)種群。最初的簡化的模型由梅拉德史密斯和普瑞斯給出，他和普瑞斯也給出了進(jìn)化穩(wěn)定策略的數(shù)學(xué)式的描述定義，這一模型的本質(zhì)特征是假設(shè)該群體有無限大的規(guī)模，繁衍以無性生殖的方式進(jìn)行，競爭只在兩個(gè)不存在任何差異的對(duì)手間展開即是成對(duì)的競爭。生物學(xué)中價(jià)值是指兩個(gè)動(dòng)物為了爭奪資源而增加的或者減少的達(dá)爾文適應(yīng)度。故我們用適應(yīng)度作為最后個(gè)體的收益的衡量，假想在這個(gè)無限的種群中，有兩個(gè)策略/、J，每一個(gè)成員都采取這兩個(gè)策略之一，且策略的選擇是隨機(jī)的，在有競爭前個(gè)體的初始適應(yīng)度為巧0，再假設(shè)整個(gè)群體中選擇1的概率為p，w(I)、w(

4、J)分別表示選擇相應(yīng)策略帶來的適應(yīng)度，而E(L J)表示個(gè)體選擇策略1而對(duì)手選擇J時(shí)的收益，其他E(I,I)等表示類同的意義。若每一個(gè)個(gè)體都參與到競爭當(dāng)中，則有w( I )=w0+(1-p) E (I, I) + pE (I, J)(1-1)w( J )=w0+(1-p) E (J, I) + pE (J, J)(1-2)穩(wěn)定的策略具有下列性質(zhì)：整個(gè)種群中幾乎所有的個(gè)體都采取了這個(gè)策略，且這些個(gè)體的適應(yīng)度必將高于競爭對(duì)手或者可能出現(xiàn)的突變異種的適應(yīng)度，否則競爭對(duì)手或者產(chǎn)生的突變異種會(huì)侵害整個(gè)種群，以致種群的削弱或者毀滅等，這時(shí)此策略便不可能是穩(wěn)定的策略。若 I是進(jìn)化穩(wěn)定策略，則w(I)

5、w( J)，且p = 1，所以當(dāng)I豐J，有E(I, I) E(J, I)(1-3)當(dāng) E(I, I) = E(J, I)時(shí)有 E(I, J) E(J, J)(1-4)滿足上述條件(1-3)、(1-4)的策略就稱為進(jìn)化穩(wěn)定策略，而上述的兩個(gè)條件1-3、1-4也被認(rèn)為是判別ESS的標(biāo)準(zhǔn)條件。上述的策略是在純策略情形下考慮的，當(dāng)策略I是從一個(gè)可能策略集合中隨機(jī)的選擇而構(gòu)成的，此時(shí)的策略稱為混合策略。此時(shí)/若是一個(gè)混合進(jìn)化穩(wěn)定策略，假設(shè)*,s2,.,sk 等是該群體的純策略，賦予這些純策略非零的概率值，那么/必須滿足如下條件：E (s1) = E (s2) =. = E (七)二E (I, I)(1

6、-5)保證所有純策略的回報(bào)是相等的，群體中的個(gè)體才不會(huì)選擇偏離的策略。此時(shí)起滿足的條件和上述是相同的形式。二、對(duì)稱博弈1.對(duì)稱博弈的定義兩人對(duì)稱博弈對(duì)于許多進(jìn)化博弈論內(nèi)容而言是基礎(chǔ)的，而且，許多進(jìn)化博弈論中的深刻見解都可以從二人對(duì)稱博弈這種特殊情形中得到，這也是單獨(dú)列出對(duì)稱博弈內(nèi)容的主要原因。一個(gè)二人對(duì)稱博弈G = (I,S,u)，可假設(shè)有兩個(gè)玩家的位置，每個(gè)位置上有相同的純策略，而任意的策略的支付則依賴于玩家所選的位置，因此有如下的定義：博弈G = (I,S,u)稱為二人對(duì)稱博弈，如果I = 1,2，S = S1 = S2 = 1,2,n且對(duì) 于任意的(s , s ) e S有u (s

7、,s ) = u (s , s )成立。12112221為第二個(gè)人的支付矩陣e A, b該對(duì)稱博弈要求兩個(gè)位置上的支付矩陣是互為轉(zhuǎn)置的，即若為第二個(gè)人的支付矩陣e A, baa.aaa.a11121n11212naa.aaa.a21222n則B =12221n.aa.aaa.aL n1n2nn1n2nnn即，=At也即有若a ij j例如：囚徒困境情形就是一個(gè)非常好的對(duì)稱博弈的例子。上述是在純策略下的情形，現(xiàn)在描述混合策略情形：S = S1 = S2 = 1,2, , n，用 (氣,x,.,七)表示策略集上的一個(gè)概率分布，即為該博弈的一個(gè)混合策略，用表示其混合策略集，則混合策略組合空間為 E

8、=?，此時(shí)任意的純策略i e S在對(duì)手選擇混合策略x eA 時(shí)的支付為u(ei,x) = ei - Ax = (Ax).。2.對(duì)稱博弈的特點(diǎn)對(duì)稱博弈是一種很特殊情形，它有自己的特征，一是對(duì)稱博弈的最優(yōu)回應(yīng)對(duì)應(yīng)P *和通常的最優(yōu)回應(yīng)對(duì)應(yīng)階一樣，通常的俠是策略組合空間到策略組合空間之間的映射，而6* 是策略集到策略集之間的映射，即6 *(y) = x eA : u(x, y) u(z, y), Vz eA(1-6)這是對(duì)稱博弈策略集相同所決定的。二是對(duì)稱博弈有更特殊的形式：雙對(duì)稱博弈。此時(shí)在其他條件滿足下當(dāng)且僅當(dāng)B = A時(shí)稱為雙對(duì)稱博弈。例如：協(xié)調(diào)博弈就是一個(gè)很好的雙對(duì)稱博弈的例子。三是對(duì)稱

9、博弈的納什均衡的形式也有所不同，對(duì)稱博弈具有不對(duì)稱的納什均衡，也具有對(duì)稱的納什均衡。策略組合(x, y) eA2被稱為對(duì)稱博弈的納什均衡，當(dāng)且僅當(dāng)尤ep *( y), y ep ，其中：AA ,這與通常的納什均衡的定義是一致的，用。海表示納什均衡集合。當(dāng)x = y時(shí)我們稱該納什均衡為對(duì)稱的，此時(shí)納什均衡可以表示為Ane = x e A: (x, x) e。 NE (1-7)對(duì)稱的情形下，它本質(zhì)是一個(gè)策略空間，不同于往常的策略組合空間，當(dāng)然，對(duì)稱博弈的納什均衡并非都要求是對(duì)稱的，但也可以證明任意的對(duì)稱博弈一定能夠存在至少一個(gè)對(duì)稱的納什均衡，即對(duì)于任意的二人有限對(duì)稱博弈，ANE。例如：鷹-

10、鴿博弈、石頭-剪刀-布等博弈都是具有混合策略均衡的且是對(duì)稱的。以鷹鴿博弈為例：不是一般地，下面支付矩陣為一方甲的支付矩陣：(v (v - c)/2v0v/2_B = AT其中v表示一定價(jià)值的資源適應(yīng)度，在此表示獲得的支付，雙方甲、乙都選擇鷹策略則各自獲得(v-c).，2，c表示雙方爭斗產(chǎn)生的適應(yīng)度的下降或者說是損失，若甲選擇鷹策略乙選擇鴿策略，則甲獲得全部資源v而乙獲得0，若都選鴿策略則平分資源。當(dāng)v c時(shí)，則鷹策略是納什均衡，因?yàn)榇藭r(shí)雙方都寧愿冒著受傷的風(fēng)險(xiǎn)獲得大于零的資源適應(yīng)度，而當(dāng)v a和a a，兩個(gè)的 2121支付一正一負(fù)，此時(shí)博弈都存在嚴(yán)格占優(yōu)的策略，故都存在純策略納什均衡。第

11、I類的解為2,2 u S，納什均衡集合為N = (e2,e2)和Ane = e2 o第IV類的解為1,1 u S，納什均衡集合為NE = (e1,e1)和ANE = e1。當(dāng)博弈是第II類或者第iii類時(shí)，支付函數(shù)值同號(hào)，此時(shí)不僅僅存在對(duì)稱的純策略的納什均衡，也存在對(duì)稱的混合策略納什均衡。第II類博弈，二者支付都為正數(shù)。有兩個(gè)對(duì)稱的嚴(yán)格占優(yōu)的納什均衡，還有一個(gè)對(duì)稱的混合策略納什均衡，故它的解為1,2u S，納什均衡集合為ne = (e1,e1),(e2,e2),(x*,x*)，Ane = e1,e2,x*。其中x* = (a /(a + a ),a /(a + a )。這一類博弈常見的例子

12、如調(diào)和博弈。221121第IV類博弈，二者的支付都為負(fù)數(shù)，沒有嚴(yán)格占優(yōu)的策略。它的解為1,2 u S，納什均衡集合為ne = (e1,e2),(e2,e1),(x*,x*)，Ane = x*。其中x* = (a /(a + a ),a /(a + a )。這一類常見的博弈如鷹鴿博弈3 u(y, w)=uy,8y + (1-8)x, Vy。x(3-1)其中 u (x, w) = xTAw。策略x eA在任意的策略j eA下的最優(yōu)回應(yīng)集合為6*( y)。此時(shí)若x是該博弈的進(jìn)化穩(wěn)定策略，則它必須滿足x e6*( y)，即x必須是該博弈的納什均衡即x eA ne，但還需要滿足另外的條件才能保證x

13、是進(jìn)化穩(wěn)定的策略，由此可知，若用Aess表示博弈的進(jìn)化穩(wěn)定策略集合，那么有Aess uAne，由進(jìn)化穩(wěn)定策略的含義可以更詳細(xì)的表示Aess的形式如下:A ess = x e A ne : u (x, y) u (y, y) Vy e 6 *( x)，y 豐 x(3-2)由此我們又回到了進(jìn)化穩(wěn)定策略的第一種定義的形式：稱x是該博弈的進(jìn)化穩(wěn)定策略，若滿足如下兩個(gè)條件：u(x, x) u(x, y), Vy(3-3)當(dāng)存在 y 滿足 u(x, x) = u(x, y)時(shí)有 u(x, y) u(y, y), Vy。x。( 3-4)這兩個(gè)條件就如我們一開始所說的是判斷一個(gè)策略是不是進(jìn)化穩(wěn)定策略的標(biāo)準(zhǔn)。

14、2.兩種等價(jià)定義的作用將上述(3-1)式在定義計(jì)數(shù)函數(shù)：f ：，1xk R下可寫為f餌，y)，且其等于 f (, y) = u(x- y,y + (1-)x)由x是進(jìn)化穩(wěn)定的可知當(dāng)足夠小且y。x時(shí)，f (,y) 0，由于函數(shù)u是雙線性的，f (, y)可寫為：f (, y) = u(x y, x) + u(x y, y x)當(dāng)x,y eA固定時(shí)，計(jì)數(shù)函數(shù)f(,y)是一個(gè)關(guān)于的仿射函數(shù)，它的截距為 u(x y, x)斜率為u(x y, y x)，如下圖所示：f( ,y 1u (x - y, x)斜率為 u(x - y, y - x)條件(3-3)等價(jià)于截距是非負(fù)的，而條件(3-4)則等價(jià)于當(dāng)截距

15、為零時(shí)斜率是正值。因此當(dāng)兩個(gè)條件都滿足時(shí)，則存在廠e(01)使得對(duì)于所有的 e(0,)都有 f ( , y) 0成立，因此x eAess。對(duì)于進(jìn)化穩(wěn)定策略說明兩個(gè)地方：一是并非所有的博弈都有進(jìn)化穩(wěn)定策略，有部分博弈是沒有進(jìn)化穩(wěn)定策略的，例如石頭-剪刀-布博弈就不具有進(jìn)化穩(wěn)定策略，不然隨著時(shí)間的推移，就沒有玩的意義了，因?yàn)橥婕抑滥莻€(gè)策略是對(duì)自己最好的。二是進(jìn)化穩(wěn)定性并不意味著群體平均支付是最優(yōu)的。3.進(jìn)化穩(wěn)定策略集、ESS的結(jié)構(gòu)從3-1、3-3可知，一個(gè)進(jìn)化穩(wěn)定策略的支撐不可能包含另外一個(gè)進(jìn)化穩(wěn)定策略的支撐，更進(jìn)一步說不可能包含對(duì)稱的納什均衡策略的支撐。例如：假設(shè)x eA ess，存在

16、 C(j) u C(x), y。x，那么 u(x,x) = u(x, y)，因?yàn)?x eAne，所以 u(x, y) u(y, y)，所以y wAne，與C(y) u C(x), y。x矛盾。因此有如下推論：若 x eAess 且 C(y) u C(x), y。x，那么 y wAne。另外，如果博弈的一個(gè)進(jìn)化穩(wěn)定策略是本質(zhì)的(即完全混合策略)，那么它是該博弈的唯一的進(jìn)化穩(wěn)定策略，而且在有限博弈中，支集是有限的，所以進(jìn)化穩(wěn)定策略也總是有限的，甚至可能為零。因此有下面的引理：集合AESSu A是有限的，且如果x e AESS cint(A)，那么Aess = x。4. ESS與非合作博弈中的NE、pe等之間的關(guān)系從進(jìn)化穩(wěn)定策略的定義可以知道一個(gè)博弈的進(jìn)化穩(wěn)定策略必定是該博弈的納什均衡，反之則不然，即Aess uANE。劣策略肯定不會(huì)是進(jìn)化穩(wěn)定的，因?yàn)樗旧聿豢赡艹蔀榧{什均衡，弱劣策略也不會(huì)是進(jìn)化穩(wěn)定策略，就算

人人文庫> 全部分類> 圖紙下載 > 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

進(jìn)化博弈論讀書心得

文檔簡介

溫馨提示

最新文檔

評(píng)論

進(jìn)化博弈論讀書心得

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔