進化穩(wěn)定對策_第1頁
進化穩(wěn)定對策_第2頁
進化穩(wěn)定對策_第3頁
進化穩(wěn)定對策_第4頁
進化穩(wěn)定對策_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第3章 進化穩(wěn)定對策第3章 進化穩(wěn)定對策張大勇最優(yōu)化理論(optimization theory)和對策論(game theory,又稱博弈論)是進化生物學中兩個最常用的、非常相近的研究途徑。它們之間的主要區(qū)別體現(xiàn)在適用范圍上:優(yōu)化理論適用的情形是當一個個體的最優(yōu)行為不依賴于其它個體的行為時,而對策論則適用于一個個體的最優(yōu)行為依賴于其它個體如何行動的情形。最優(yōu)化理論的基本出發(fā)點是,自然選擇總是傾向于使生物最有效地傳遞它們的基因,因而也將是最有效地從事各種活動,包括使它們在時間和能量分配方面達到最優(yōu)狀態(tài)。第2章我們討論生活史性狀問題時采用的都是優(yōu)化理論。但是,最優(yōu)化理論也遇到了一定困難,即在許多

2、情況下普遍意義上的最佳策略往往并不存在。一個個體采取某一對策是好還是壞不僅取決于這個對策本身,而且往往還取決于種群內(nèi)其它個體所采取的對策是什么。例如,一個雄性糞蠅在尋覓雌蠅時的最優(yōu)占位往往取決于其它雄蠅停落在什么位置;在爭奪配偶的戰(zhàn)斗中,一個雄性動物的最佳對策經(jīng)常取決于他的對手如何行動,有時退讓是有利的,有時激烈爭斗是更適合的。在這些例子中,不存在一個任何情形下都一律適用的最佳對策。這時我們觀察到的自然界生物它們應(yīng)該采取何種對策呢?為解決這一難題,Maynard Smith(1982;Maynard Smith & Price 1973)創(chuàng)造性地提出了一個全新概念進化穩(wěn)定對策,或稱ES

3、S(為英文全稱evolutionarily stable strategy的簡寫)。當種群內(nèi)所有個體都采取了某個對策后,其它對策者都不能侵入該種群,那么這個對策就是進化上穩(wěn)定的。這個概念不強調(diào)絕對意義上的優(yōu)化,而是從相對意義上尋求所謂的最佳:當種群完全是由ESS對策者組成的時候,ESS對策者的適合度將大于所有突變對策者的適合度。因而,ESS是一個弱化了的最優(yōu)化概念(Ehrlich & Roughgarden 1987)。本章的目的就是向讀者介紹對策論在進化生物學中的應(yīng)用,以及它的核心概念進化穩(wěn)定對策(關(guān)于ESS的綜述包括有Maynard Smith 1982; Parker 1984;

4、 Hines 1987)。在生物學中,簡單地說,一個對策(或者策略)就是一套供選擇的各種行動路線中的某一個。例如,對策可以是指在生產(chǎn)兒子和生產(chǎn)女兒之間分配親本資源的一個從0到1之間連續(xù)變化的特定比例(第4章),或者為某些離散形式,“如果對手逃跑就追擊,如果對手還擊就逃跑”。當然,對策并不是個體有意識地制定出來的,而是通過自然選擇而定型的產(chǎn)物。所有可能的對策合在一起稱為對策集(strategy set)。3.1 鷹鴿對策與進化穩(wěn)定對策概念的提出自然界的每一動物都經(jīng)常要與其它個體爭奪食物、領(lǐng)域和配偶等有限資源。進化穩(wěn)定對策概念的起源很大程度上是和分析這些動物爭斗行為聯(lián)系在一起的(Maynard S

5、mith & Price 1973),其后又被推廣應(yīng)用到其它各式各樣頻率依賴選擇(frequency-dependent selection)的情形(Maynard Smith 1982)。進化穩(wěn)定對策理論與傳統(tǒng)種群遺傳學對頻率依賴選擇的研究相比,最明顯的差別可能主要是強調(diào)的重點不同。種群遺傳學家主要考察基因頻率的動態(tài)以及平衡態(tài)的性質(zhì),目的是探討不同類型的選擇對一個位點上不同基因型的效應(yīng)。為了分析上的方便,對策集經(jīng)常被高度簡化,經(jīng)常是只考慮對應(yīng)于兩個等位基因的兩個對策。而ESS理論家對于遺傳學系統(tǒng)本身的問題考慮很少,經(jīng)常假定對策可以無性繁殖或者有機體是單倍體。這種遺傳學上的高度簡化使得

6、人們可以考察更為復雜、更為廣泛的對策集,以及對策之間更加微妙的適合度相互作用。用Maynard Smith 的話說,ESS概念的精髓就是假定簡單化的遺傳學而考察復雜的生態(tài)學(Hines 1987)。另外一點不同是,ESS只注重考慮種群達到平衡時的性質(zhì),而基本上忽略了動態(tài)。容易看到,種群遺傳學和ESS理論各自都在不同方面上作了一些不現(xiàn)實的假定,因此二者之間更具有互補性,而不是相互對立。Maynard Smith & Price(1973)最初的目的是希望理解動物個體之間的爭斗為什么總是一場“有限的戰(zhàn)爭”,很少造成嚴重的傷害。例如,許多蛇類的雄性個體相互之間扭纏打斗時從不使用它們的毒牙。在

7、Maynard Smith & Price研究這個問題之前,人們通常給出的解釋是,否則許多個體將受到嚴重傷害,最終對物種生存不利。但是Maynard Smith & Price不滿意這種群體選擇的觀點,并從個體選擇的角度運用對策論提出了他們自己的生物學解釋。他們的分析是以動物爭斗為例進行的。首先讓我們只考慮“鷹”“鴿”兩種戰(zhàn)斗對策。鷹對策者戰(zhàn)斗起來總是全力以赴,除非身受重傷否則決不退讓;如果爭斗雙方都是鷹對策者,那么其中一方將最終受到傷害并退讓。而鴿對策者則只限于威脅恫嚇,對方一旦表現(xiàn)出爭斗升級跡象立刻退讓;如果對方也是鴿對策者,那么相互對峙一定時間后便會有一方自動退卻(鴿子通

8、常視為和平的象征,這里也取其這層含義。但我們都知道,事實上鴿子是非常好斗的)。這里我們假定鷹對策和鴿對策之間沒有連續(xù)過渡的中間類型;對策集是離散的。 表3.1 鷹鴿對策的贏得矩陣鷹鴿鷹(V-C)/2V鴿0V/2令V表示被爭奪資源的價值;勝利的一方獲得該資源并使適合度增加V;爭斗失敗的鷹對策者其適合度損失C。鷹鴿對策的贏得矩陣(payoff matrix)可以表示為表3.1。在完全由鴿對策者組成的種群里,鷹對策者一旦進入它的適合度將可增加V,而鴿對策者的適合度只能增加V/2(未考慮對峙帶來的能量或時間消耗);因此,我們得出結(jié)論:鴿對策屬于在進化上不穩(wěn)定的類型,它將很容易地被鷹對策侵入。那么完全的

9、鷹對策種群是否就是進化穩(wěn)定的呢?根據(jù)表3.1我們?nèi)菀卓吹?,鷹對策是否為進化穩(wěn)定的對策取決于V和C值的相對大小。在一個鷹對策種群里,鷹對策者的平均贏得為(V-C)/2,而侵入的鴿對策者的贏得為0。如果V>C,那么鷹對策者的適合度大于鴿對策者的適合度;反之,如果V<C,那么鴿對策者的適合度大于鷹對策者的適合度,它將能夠侵入鷹對策種群。這時我們看到,無論是純鷹對策種群還是純鴿對策種群都不是進化穩(wěn)定的。所以,種群必然是一個鷹、鴿對策的混合體。那么鷹、鴿對策者在種群內(nèi)各自所占比例應(yīng)該是多少呢?令p為種群內(nèi)鷹對策者所占比例。鷹、鴿對策者的適合度可以分別表示為(3.1)其中,W0表示與對策無關(guān)的

10、基本適合度。鷹對策者和鴿對策者的適合度都不是恒定值,依賴于種群內(nèi)鷹、鴿對策的相對比例,因而我們稱其為頻率依賴的選擇(frequency-dependent selection)。假定個體無性生殖,鷹對策者生育的后代都是鷹對策者,鴿對策者生育的后代也都是鴿對策者,并且每個個體生育的后代數(shù)量與其適合度成正比。一代之后,鷹對策者的頻率將為(3.2)其中。方程(3.2)準確地描述了系統(tǒng)的動態(tài)。知道了V和C的值以及初始的鷹對策者頻率就可以很容易地計算種群內(nèi)鷹對策者頻率的變化過程。然而,對于這類頻率依賴的選擇,人們往往更關(guān)心的是系統(tǒng)將向什么狀態(tài)趨近,或者說穩(wěn)定的系統(tǒng)狀態(tài)是什么。在一個穩(wěn)定種群內(nèi),鷹、鴿對策

11、者的適合度應(yīng)該相等,即Wh=Wd;據(jù)此我們可以求出鷹對策者的比例為。如果C值相對于V值來說很大,那么種群內(nèi)鷹對策者的比例將會很低,鷹-鷹爭斗的情形也將極為罕見。我們當然不能期望這個高度簡化的模型能夠完全解釋為什么動物個體間爭斗不產(chǎn)生嚴重傷害的后果。但是這個模型至少可以幫助我們理解為什么在自然界導致嚴重傷害的激烈爭斗非常罕見。上面我們假定個體要么是純粹的鷹對策者、要么是純粹的鴿對策者。或者說種群在遺傳構(gòu)成上是多態(tài)的。ESS也可以用另一種方式來達到:種群內(nèi)每個個體都以一定概率采取兩種對策,而且在每次博弈中所采取的對策必須是隨機確定的。這時種群在遺傳構(gòu)成上是單態(tài)的,但表現(xiàn)型上是兩種對策共存。以表3.

12、1贏得矩陣為例,ESS對策是以V/C的概率采取鷹對策,以(1V/C)的概率采取鴿對策。在對策論中,人們通常考慮遺傳上單態(tài)的ESS,而往往忽略了遺傳多態(tài)所帶來的復雜性。隱含在上面這個模型中的一個重要假設(shè)是無性生殖。為了使問題簡化,人們經(jīng)常明確或暗含地假設(shè)無性(孤雌)生殖,或者真實遺傳(breed true),即通俗地說就是“龍生龍,鳳生鳳”;后代與親代之間由于有性生殖過程而必然存在的遺傳差異被忽略了。因為我們面對的有機體絕大多數(shù)都是有性生殖的二倍體生物,所以這個假設(shè)只能理解為對非常復雜問題的一個初步探索。Maynard Smith(1982)認為,忽略有性生殖多數(shù)情形下不會產(chǎn)生太大的影響。值得注

13、意的是,在ESS種群內(nèi)每個個體的期望贏得為,而在純鴿對策種群內(nèi)每個個體的期望贏得為V/2。雖然純鴿對策種群個體平均適合度大于ESS種群內(nèi)個體的平均適合度,但它是一個不穩(wěn)定的種群,隨時都有可能受到其它對策(鷹對策)的侵蝕。人們普遍相信,自然選擇所選擇的最終結(jié)果應(yīng)該是穩(wěn)定的、不會受到任何其它對策侵蝕的ESS種群。ESS,與最優(yōu)化理論一樣,都是只能從可供選擇的對策集(strategy set)中選取“最佳”的對策。所以進化穩(wěn)定對策也將受到可供選擇的對策范圍所制約。為了說明這一點,讓我們在上面的鷹鴿對策的博弈中再增加一種對策,中庸對策。中庸對策者表現(xiàn)的行為是:當自己是資源(例如一塊領(lǐng)域)占有者時表現(xiàn)為

14、鷹,當自己是入侵者時表現(xiàn)為鴿;并且假定中庸對策者表現(xiàn)為鷹(資源占有者)或鴿(入侵者)的概率相等。贏得矩陣為表3.2。當兩個中庸相遇時,一個肯定是資源占有者并采取鷹對策,而另一個則是入侵者并采取鴿對策。表3.2 鷹、鴿和中庸三種對策博弈時的贏得矩陣鷹鴿中庸鷹(V-C)/2VV/2+(V-C)/4鴿0V/2V/4中庸(V-C)/43V/4V/2我們?nèi)菀鬃C明,當V<C時,中庸對策是進化穩(wěn)定的對策,并且是唯一的ESS。所以ESS具體形式是什么依賴于有多少可供選擇的對策。同時,這個博弈與前面的鷹鴿博弈還有一個不同之處:鷹鴿博弈是對稱的,而表3.2的博弈是非對稱的。所謂對稱是指爭斗雙方處于完全等同的

15、地位:它們可選擇的對策集相同,它們的期望贏得也相同。而在鷹-鴿-中庸博弈中,中庸對策者根據(jù)其對資源的擁有狀況選取相應(yīng)的對策,因而爭斗雙方在對策的選擇上不是完全對等的。后面我們還將回到這個博弈問題上來。3.2 對稱的二人博弈現(xiàn)在我們來考察對稱的、二人進化博弈的一些一般性質(zhì)。假設(shè)有m個可能的對策,表示為1,2,m。博弈(爭斗)可以發(fā)生在任何一對隨機選取的動物個體之間。贏得矩陣 dij 為m×m,其中dij表示采取對策i的動物與j對策者博弈時的贏得值(適合度增加值)。系統(tǒng)動態(tài)可以用兩種稍有不同的方式進行分析。首先,我們假定一個個體總是采取相同的純對策,并且這種特性被它所有后代所繼承。令ni

16、 為 i對策者在某一時刻的個體數(shù)量,pi 為它們的相對頻率。一個 i對策者的適合度為(3.3)而種群的平均適合度為(3.4)各個對策的個體數(shù)量增加符合下列方程(3.5)因此,我們可以得到(3.6)當系統(tǒng)達到平衡時,即,必然有或者。因此在系統(tǒng)達到平衡態(tài)時,所有頻率不為零的對策它們的適合度必然相等。在頻率依賴的選擇下,各個類型的頻率將受到調(diào)整以使它們的適合度正好相等。我們還需要確定一個系統(tǒng)平衡態(tài)是否是局域穩(wěn)定的;數(shù)學上這可以通過解雅可比矩陣的特征根來判斷。模型(3.6)的一個穩(wěn)定平衡態(tài),稱為進化穩(wěn)定的狀態(tài)(evolutionarily stable state);其中代表平衡種群內(nèi)采用i對策的個體

17、所占的比例。這個模型的結(jié)果是導致產(chǎn)生各種純對策的多態(tài),也被稱為“純對策模型”(pure strategy model; Bulmer 1994)。而另外一種在博弈論中更常見的途徑是認為,個體可以采取混合對策,即是以一定概率采取各個純對策。例如,在前面介紹的鷹鴿博弈中,動物可能以50%的概率采取鷹對策,以50%的概率采取鴿對策。然后,我們來尋找這樣的混合對策(或者純對策),當它在種群內(nèi)被所有成員采納時,任何其它對策都不能成功地侵入。這樣的一個對策就稱為進化穩(wěn)定對策,或者簡稱為ESS。這種途徑的一個優(yōu)點是我們不必明確考慮系統(tǒng)平衡態(tài)的動態(tài)穩(wěn)定性問題??紤]混合對策p和q,它們分別以概率pi 和qi采用

18、純對策i。一個p對策者與q對策者博弈時其平均贏得值(用表示)為(3.7)或者我們用矩陣形式表示,即(3.8)如果對策p是個ESS,那么當它的適合度必須大于突變對策q的適合度。用x表示q在種群內(nèi)的頻率,對策p和q的適合度分別為(3.9)p為ESS的條件是當x無限小時,對于所有的qp都有WP>Wq;因此,如果滿足條件(3.10)那么p即為ESS;如果則需要滿足(3.11)p才是一個ESS。(3.10)式是說,對策p是對自己的最好應(yīng)答。如果你知道你的對手將采取對策p,那么你別無選擇只能也采取對策p,因為采取任何其它對策都不如采取對策p好。換言之,這要求p是一個嚴格的Nash平衡(Nash 19

19、51)。(3.11)式則是說,如果q是另外一個同樣好的對于p的應(yīng)答,那么p對q的應(yīng)答就必須比q對自己的應(yīng)答更好。這個條件保證了任何稀有突變,q-對策者,都不能侵入p-對策者組成的種群。這時的p我們說是一個弱Nash平衡。所有具有非零概率的純對策組分就稱為混合對策p的支集(support)。支集中各個組分概率相加應(yīng)該等于1。對于ESS混合對策p來說,支集中任一純對策k都有(3.12)我們使用反證法證明這個結(jié)果。假設(shè)。定義一個新的q對策,它的支集除了純對策k外所有其它組分均與p相同;相應(yīng)的概率為qi=pi/(1-pk),i¹k。重新整理E(p,p)如下:因此有E(p,p)< E(q

20、,p),與p為ESS的假設(shè)相矛盾。這個結(jié)果是由Bishop & Cannings (1978)最先給出的,在進化博弈論中被稱為Bishop-Cannings定理。如果對策不是離散的而是連續(xù)的,Bishop-Cannings定理可以很容易地推廣到連續(xù)對策的情形,此處不再贅述。下面我們分析幾個具體的生物學應(yīng)用實例。3.3 相互利他行為與囚犯的困境表3.3 一個簡單的合作進化博弈的贏得矩陣欺騙合作欺騙0b合作-cb-cTrivers(1971)提出,遺傳上沒有親緣關(guān)系的個體之間也可以進化產(chǎn)生利他行為。這種相互利他行為的出現(xiàn)是因為利他付出代價很小而收益方得到的收獲卻很大;這樣如果個體之間能夠相

21、互回報,它們都可以從利他行為中獲得較大適合度收益。問題是,無論是進化上還是在人類社會里,怎樣有效地防止欺騙對策侵入?由于在一個個體的利他行為和受益者的回報行為之間存在著一定的時間間隔,所以有可能一個個體會采取這樣對策:今天它接受對方的幫助,但明天卻拒絕給對方提供同樣的幫助。這種欺騙行為能夠為自然選擇所淘汰嗎?或者說,相互合作的利他行為能否抵抗住欺騙行為的侵蝕?因為一個個體所采取對策是好還是壞依賴于對方所采取的對策是什么,所以這是頻率依賴的選擇,需要采用博弈論來分析。下面我們考慮一個簡單的博弈。在一場博弈中,博弈雙方(A和B)都面臨著兩個可能的抉擇:或者合作或者欺騙。表3.3是這種博弈的贏得矩陣

22、,它給出了博弈雙方各種對策組合的贏得值。這些贏得值代表的是適合度得分,即所得到的后代數(shù)。采取合作行為的個體需要付出一定代價,可用c表示;但合作的行為可以給受益者帶來較大的收益,用b來表示;這里我們假定收益大于代價。如果雙方都欺騙,那么即無代價也無收獲;如果雙方合作,那么贏得值為收益減去代價,即b-c。容易看出,在這個博弈中只有欺騙是ESS。在ESS種群內(nèi)每個個體的贏得值都是0;但是,如果個體都采取合作對策,那么對它們都是有利的。這種類型的博弈使個體行為在進化上陷入了一種困境,說明自然選擇可以在群體水平上產(chǎn)生消極影響。在進化生物學中,這類合作對大家都有利但最終卻都陷入欺騙泥潭的問題通常被稱為囚犯

23、的困境(prisoners dilemma)。這個名稱的由來是因為最初的博弈模型是以兩個合謀犯罪的囚犯為原型而構(gòu)造的;每個囚犯都可以揭發(fā)對方開脫自己(欺騙),或者是守口如瓶(合作)使法官對誰都無法定罪。如果一方檢舉而另一方守口如瓶,那么檢舉者將被無罪釋放而由沉默一方承擔所有的罪責。盡管合作可以使兩個囚犯都得以釋放,但互相揭發(fā)并均受到懲罰才是必然的結(jié)果。表3.3所示的博弈如果在兩個個體之間只進行一次,那么欺騙行為是不可避免的;但如果博弈可以反復進行多次,那么個體可以根據(jù)過去相互作用的歷史而采取更為復雜的對策,并使得個體合作有了可能。Axelrod (1984)曾經(jīng)組織了一次比賽;他把來自世界各地

24、博弈理論家所提出的62種不同行為對策在計算機內(nèi)進行了演算。在比賽中,每個參賽對策都要與所有其它參賽對策相遇,并博弈200次,然后計算平均贏得值。獲勝者是一個非常簡單的“一還一報”(tit for tat)對策:第一輪相遇總是采取合作對策,以后再相遇時就采取對手上次相遇所使用的對策。Axelrod總結(jié)了一還一報對策成功的原因;善良,因為從不先欺騙;寬容,對于對手的一次偶爾的欺騙行為只給予一次反擊;報復,不管什么時候只要對方表現(xiàn)出欺騙行為它就不再合作。Axelrod與Hamilton(1981)一道共同探討了一還一報對策在進化上的意義。我們已經(jīng)看到,如果博弈只進行一次,只有欺騙才是穩(wěn)定的對策。這個

25、結(jié)論對于任何固定次數(shù)的博弈也同樣成立,理由如下。在最后一輪的博弈中,只有欺騙才是穩(wěn)定的;同樣在次最后一輪也是如此,因為下一輪的對策是確定的。如此反復直到第一輪;每一輪博弈個體將都是采取欺騙對策。然而,更加現(xiàn)實的假設(shè)不是讓博弈次數(shù)恒定,而是兩個博弈者以某一概率再次相遇。這個博弈被叫做多次重復的囚犯困境(iterated prisoners dilemma);它已被廣泛地用作為分析合作進化的模型(Axelrod & Dion 1988)。因為可能的對策非常多,所以理論分析常常太復雜。這里我們只限于三種對策情形:永遠欺騙(AD),一還一報(TFT),和永遠合作(AC)。表3.4 多次重復囚犯

26、困境博弈的兩個對策的贏得矩陣ADTFTAD0bTFT-c(b-c)/(1-p)首先考慮只有AD和TFT兩個對策的情況。TFT和自己博弈時的贏得值為其它贏得值都很容易計算;贏得矩陣如表3.4。在這個博弈里,AD在任何時候都是ESS;而且如果(b-c)/(1-p)>b,或者pb>c,TFT也是個ESS。雖然一還一報對策一旦固定下來就會保持穩(wěn)定,但是它最初如何能夠打入一個完全由不合作的騙子所組成的種群呢?要知道,騙子種群也是一個穩(wěn)定的、可以抵抗其它對策侵蝕的種群。Axelrod & Hamilton(1981)認為有兩種可能的解決辦法:(1)合作行為最初可能出現(xiàn)在有親緣關(guān)系的個體

27、之間(親緣選擇),然后散布開也包括了無親緣關(guān)系的個體;自然選擇將保留能夠指示親緣關(guān)系的一些特征。這些特征之一就是合作行為的相互回報。(2)具有合作傾向的TFT個體可能聚集在一起形成一個小圈子,然后再從這個小圈子向外散步;但從不合作向相互利他轉(zhuǎn)變顯然是困難的。表3.5 多次重復囚徒困境博弈在有三種對策時的贏得矩陣ADTFTACAD0bb/(1-p)TFT-c(b-c)/(1-p)(b-c)/(1-p)AC-c/(1-p)(b-c)/(1-p)(b-c)/(1-p)現(xiàn)在我們引入第三個對策,永遠合作(AC)。贏得矩陣為表3.5。注意,在TFT和AC博弈時二者將表現(xiàn)完全相同;TFT對策的優(yōu)越性只表現(xiàn)在

28、它和AD博弈時。如果pb>c,TFT將是一個弱Nash平衡,但不是ESS。在一個純粹TFT對策的種群里,AC個體與TFT個體有相同的適合度,因而可通過漂變侵入TFT種群。一旦AC在種群內(nèi)擁有一定比例,AD對策就可以侵入,因為AD可以靠剝削AC而走向繁榮。TFT對策還有一個缺陷是它對一次偶然失誤很敏感;兩個TFT博弈者之中任何一個如果因為失誤欺騙了一次,他們今后將卷入到一個欺騙/合作交替系列當中,而不再是完全合作。TFT對策的這些缺點促使人們努力尋找更強健的替代對策。Nowak & Sigmund(1993)表明巴甫洛夫?qū)Σ弑纫贿€一報(TFT)對策更優(yōu)越,因為巴甫洛夫?qū)Σ吣軌蚋恼?/p>

29、爾的錯誤,同時還能剝削永遠合作(AC)的對策者。巴甫洛夫?qū)Σ哒卟扇〉囊?guī)則是:如果上次博弈是成功的(贏得大于0)就重復上次的對策;如果上次博弈是不成功的(贏得等于或小于0)那么就采取和上次相反的對策。因此,對于巴甫洛夫?qū)Σ哒?,無論上次雙方合作還是雙方不合作,這次都采取合作;只有上次一方合作而另一方欺騙時,被欺騙的一方才會采取欺騙行為。相互回報式利他行為的一個很好的實例就是吸血蝠的反吐喂食現(xiàn)象(Wilkinson 1984)。許多吸血蝠夜晚覓食時吸不到血;它們白天向其它個體乞食一些血液,這些昨晚吸飽了的個體常常反吐一些食物給饑餓的同伴。很少一點食物可以大大提高受惠者存活的機會,而施與者受到很小的影

30、響。所以,相互回報利他的條件是滿足的。然而,反吐喂食行為只發(fā)生在近親個體,以及經(jīng)常同棲一地的個體之間。很可能這個行為的出現(xiàn)是由親屬選擇導致的;“同棲一地”被當做為“親屬”的指示器。既然這種反吐喂食行為已經(jīng)散步開,它已成為相互回報式利他的一個穩(wěn)定的例子,并且沒有選擇壓力使個體使用比“同棲一地”更可靠的指示器。對于不是經(jīng)常同棲一地的個體,反吐喂食行為的發(fā)生有兩個障礙。首先,它們再次相遇的概率很小,因此反吐喂食將不是穩(wěn)定的ESS;其次,非同棲一地的個體之間關(guān)系應(yīng)處于一個不合作的ESS狀態(tài);個體將很難從這個不合作的ESS中解放出來。以上我們只考慮了離散對策問題。但在自然界中,許多博弈對策問題不是一個

31、“非此即彼”的有限形式,而是在兩個或多個極端中間有無限多的連續(xù)過渡。下面讓我們分析一個具體的連續(xù)對策的消耗戰(zhàn)(war of attrition)模型(Maynard Smith & Price 1973; Maynard Smith 1974)。3.4 消耗戰(zhàn)消耗戰(zhàn)模型考慮的情形與鷹鴿對策模型基本類似,但它不考慮使戰(zhàn)斗升級并造成傷害的可能性。兩個個體可以說都是“鴿對策者”,誰能取得勝利是由堅持的時間長短決定的。如果誰比對手堅持時間長,那么誰就是勝利者。堅持時間的長短(對策)是在爭斗開始之前預(yù)決定好了的。令V為勝利后得到的適合度收益;c為消耗代價的速率參數(shù):對峙時間為t時,累計適合度代價

32、為ct。對于一個采取純對策T的種群,平均贏得為(3.13)如果cT<V/2,那么任何突變對策t>T都將可以侵入種群,因為(3.14)這里需要注意的是,由于T對策者首先放棄了等待,所以t對策者的實際等待時間是T,代價為cT。同樣道理,如果cTV/2,那么t=0對策總可以侵入種群。因此不存在純對策的ESS。假設(shè)有一個混合對策,I,它以概率p(t)采取堅持時間長度為t的對策。如果I是一個ESS對策,那么任何一個純對策t¢,即總是只堅持t¢時間,與I博弈都必須具有相同的贏得(連續(xù)對策情形下的Bishop-Cannings定理)。因此,=常數(shù)A(3.15)上式中的第一個積

33、分項為t¢勝利時的適合度贏得,第二個積分項為t¢失敗時的適合度損失。對它求導數(shù)我們有根據(jù)定義我們知道,所以最終我們可以解出(3.16)現(xiàn)在我們知道,ESS必須根據(jù)這個負指數(shù)概率分布來確定堅持時間。為了確定負指數(shù)分布真正是一個ESS,我們還須證明對于所有的J,當E(J,I)=E(I,I)時有E(I,J)>E(J,J),即滿足條件(3.11)的要求。對于J是純對策的情形可以很容易地證明;Bishop & Cannings (1978)對于J為混合對策的情形也給出了一個嚴格的證明。Parker (1970a,b;1984) 對于牛糞堆上雄蠅為等待雌蠅到來交配所花費的

34、時間問題開展了深入研究工作。Parker表明,隨著時間推移雄蠅陸續(xù)離開,等待時間確實服從負指數(shù)分布,與上面消耗戰(zhàn)理論預(yù)測的結(jié)果是一致的。但目前還不清楚,這種負指數(shù)分布是由于不同個體所等待的時間不同(遺傳多態(tài))還是由于每個個體都是混合對策者(即每個個體等待時間都是可變的)。而且有一點需要特別注意:消耗戰(zhàn)理論是根據(jù)二人博弈建立的,而Parker研究的例子卻是一個多人博弈問題,即一個雄蠅不是只與另一個雄蠅進行成對的對抗(pairwise contest),而是同時與許多其它雄蠅進行多人集體博弈(playing the field;Maynard Smith 1982)。目前理論上還未嚴格證明等待時間

35、為負指數(shù)分布在多人博弈時仍然成立。Parker還記錄了每一只雄蠅所獲得的交配機會,發(fā)現(xiàn)采取不同等待時間的雄蠅大體上都獲得了相同的交配機會。這也與消耗戰(zhàn)理論的預(yù)測相一致。3.5 非對稱博弈以上我們主要分析了對稱博弈問題,即兩個博弈者是完全相同的:它們的回報相同;獲勝幾率至少就它們所知是相同的;而且也沒有任何其它線索可以用來幫助決定采取何種對策。因此,任何一個可行解都必然是對稱Nash平衡,其中兩個博弈者都使用相同的對策,即是說平衡的對策必須是對自己為最佳的應(yīng)答。然而真實世界中大多數(shù)成對的動物爭斗都是非對稱的,即是說爭斗者之間在角色上有所不同:它們可能是一個雄性個體、一個雌性個體;一個較大、另一個

36、較小的雄體;一個領(lǐng)域占有者、一個入侵者,等等。兩個博弈者角色的不同可能會影響爭斗的結(jié)果或者各自的贏得。既使不影響贏得,在博弈開始時博弈者就知道的角色差異常常被用來作為決定采取何種對策的基礎(chǔ),導致出現(xiàn)非對稱的Nash平衡。例如,在鷹-鴿-中庸對策中(表3.2),中庸對策者在作為資源占有者時總是鷹對策者,在作為入侵者時則總是鴿對策者。為了利用上面介紹的對稱博弈方法來分析非對稱博弈問題,我們可以通過引入條件對策的思想而把非對稱博弈對稱化??紤]兩個角色不同的個體,A和B(如占有者/入侵者;雄體/雌體;大個體/小個體等)。我們假定兩個博弈者都知道它們各自的以及對方的角色。再假定A有m個可供挑選的對策;B

37、有n個可供挑選的對策;這些對策可能相同也可能不同。我們用表示角色為A的個體在A采取對策i而對方采取對策j時的贏得值;則為B的贏得值?,F(xiàn)在我們引入總數(shù)為mn個的條件對策,i/j:“在角色A和角色B個體的爭斗中,如果我是A采取對策i;如果我是B采取對策j?!痹趯Σ遡/j的個體與對策k/l的個體博弈中,i/j個體有相同的可能性來扮演角色A或角色B;因此,它的贏得值為(3.17)這個式子定義了一個mn維的贏得矩陣。對于這個博弈,我們可以采取和上面相同的對稱二人博弈方法來加以分析。上述的非對稱博弈是一個完全信息博弈;博弈雙方都知道自己在博弈中的利益和代價所在。完全信息非對稱博弈模型的一個普遍性質(zhì)為,ES

38、S肯定是純對策(Selten 1980)。利用這個結(jié)果,我們能夠很容易地鑒別哪些純對策是ESS。我們只需比較對稱化的贏得矩陣內(nèi)對角線上的項是否比其它同列項大即可。下面我們分析一個具體實例??紤]一個資源占有者和一個入侵者之間的爭斗。一個個體可以根據(jù)它是占有者還是入侵者來選擇是鷹還是鴿。因此這是一個非對稱博弈問題,并且共有四種條件對策:鷹/鷹(H/H);鷹/鴿(H/D);鴿/鷹(D/H);鴿/鴿(D/D)。H/H表示當個體無論是占有者還是入侵者時都是鷹;H/D則表示,當個體是占有者時表現(xiàn)為鷹,是入侵者時表現(xiàn)為鴿;余者類推。表3.2所分析的博弈沒有包括D/H,即反中庸的可能性。贏得矩陣可以表示為表3

39、.6。當V>C時,H/H是唯一的ESS;而當V<C時,H/D和D/H都是ESS。表3.6 具有占有/入侵不對稱性的鷹鴿博弈的對稱化贏得矩陣H/HH/DD/HD/DH/H(V-C)/2(3V-C)/4(3V-C)/4VH/D(V-C)/4V/2(2V-C)/43V/4D/H(V-C)/4(2V-C)/4V/23V/4D/D0V/4V/4V/2中庸對策(H/D)的特點是靠尊重所有權(quán)決定戰(zhàn)斗的勝負;一個可能的例子是Davies(1978)對黃斑眼蝶(Pararge aegeria)爭奪領(lǐng)域的研究。黃斑眼蝶的雄體試圖保衛(wèi)林內(nèi)地面上的光斑,這將使它獲得交配機會。當兩個雄蝶在一塊光斑上相遇時,

40、它們盤旋飛上林冠層進行爭斗,但光斑占有者總能獲勝并回到光斑內(nèi)。反中庸對策(D/H)在V<C時同樣也是ESS,Burgess(1976)所研究的墨西哥群居蜘蛛(Oecobius civitas)可能提供了一個實例。3.6 具有連續(xù)對策的多人博弈到目前為止我們只考慮了二人博弈問題。但在許多情形下,個體之間的斗爭不是成對進行的,而是多人集體的爭斗。事實上,多人集體博弈可能更普遍。所以,我們有必要對多人博弈問題進行詳細分析。因為多人博弈問題往往表現(xiàn)為連續(xù)對策的形式,所以下面的數(shù)學分析也將只考慮連續(xù)對策的多人博弈。令W(A,B)表示在B-對策者組成的種群內(nèi)一個A-對策者的適合度。我們說I是一個ES

41、S,如果對于所有的J¹I都滿足下列條件(參見Maynard Smith 1982):(3.18)其中表示在J占比例為q,I占比例為(1-q)的種群里J對策者的適合度。條件(3.18)是說,對于弱Nash平衡,即W(J,I)=W(I,I),一旦J在種群內(nèi)占有不可忽視的比例時其適合度必須小于I的適合度。條件(3.18)保證了I-對策者種群不會被任何突變對策所侵蝕??紤]一個非常簡單的對捕食者保持警戒的模型(Parker & Hammerstein 1985)。鳥類一起群居覓食;群的大小為n。每個鳥都花一定時間用于警戒,提防捕食者;其它剩余時間則用于覓食。假設(shè)捕食者每天只攻擊一次,而

42、且如果當時沒有一只鳥正在警戒,每次攻擊都捕殺一個個體;如果至少有一只鳥正處于警戒狀態(tài),那么全群所有鳥都會逃脫攻擊。警戒的代價是覓食時間減少。我們假定一個把所有時間中v部分用于警戒的個體,如果它逃過了捕食者攻擊,其適合度為1-v2。如果i個體花在警戒上的時間比例為vi,那么每個體受到捕食者攻擊的幾率為(3.19)前面的括號項乘在一起就是所有個體都沒有警戒,捕食者能成功的概率;除以n表示平均一個個體受到獵食的概率,因為每次捕食者攻擊都只獵殺一個個體。鳥群內(nèi)第i個體的贏得值可以寫為(3.20)即存活概率乘以覓食帶來的適合度?,F(xiàn)在我們可以求出進化穩(wěn)定的警戒時間。如果v*是進化穩(wěn)定的,那么當種群所有成員

43、都采取v*-對策時,任何突變的對策者,u,都不能侵入該種群。我們知道,突變對策者肯定是和其它n-1個v*-對策者組成一個群。所以根據(jù)(3.20)式,這時突變對策者的適合度為(3.21)根據(jù)ESS定義,對任何u¹v*都必須有;這也就意味著,作為u的函數(shù),應(yīng)在u=v*處達到極大值;或者(3.22)(3.23)(3.23)式是保證(3.22)式求得的極值是極大值而不是極小值。上面兩式合在一起保證了v*是Nash平衡。如果(3.23)式的不等式嚴格成立,即(3.24)那么v*是一個嚴格的Nash平衡。對于給定的n值,我們可以容易解出v*,并且它滿足條件(3.24),因而必然是ESS??梢宰C明

44、,v*隨著群的大小增加而減小,即。有兩個因素對出現(xiàn)這種結(jié)果有貢獻;一是群內(nèi)每個個體受到捕食者攻擊的可能性被“稀釋”,即Hamilton(1971)自私的獸群效應(yīng)(selfish-herd effect);另一個是每個個體都可以從其它個體的警戒行為中得到益處。盡管對于大多數(shù)的連續(xù)多人博弈的ESS,條件(3.24)都會滿足,但也有二階導數(shù)等于零的情形(參見4.3.1)。這時我們需要判斷,當突變對策在種群內(nèi)占有一定、不能忽視的比例時,這種突變對策能否被自然選擇所淘汰。除了直接地驗證外,還有一個稍微較弱的判別方法。對于連續(xù)對策模型,我們可以采用一個新的穩(wěn)定性概念。假設(shè)種群對策v稍微地偏離了最佳值v*;

45、如果v*種群是穩(wěn)定的,那么在v種群內(nèi)出現(xiàn)的突變者(u),當它是朝著v*方向變化時將受到正選擇;當它是背離v*的方向時將受到負選擇(淘汰)。這種類型的穩(wěn)定性被稱為連續(xù)穩(wěn)定性(continuous stability; Eshel 1983)??梢宰C明,v*是連續(xù)穩(wěn)定的如果(3.25)這個結(jié)果可以應(yīng)用于任何連續(xù)對策模型。例如,上面的警戒模型滿足這個條件。但是,我們一般只是在弱Nash平衡時才需要判別連續(xù)穩(wěn)定性,所以上面的條件可以簡化為(3.26)為了證明(3.25),令v=v*+e,u=v*+e+d,e和d都是無窮小。因此,當(3.25)式成立時,必須有e和d的正負號不相同,才能有;或者說朝著接近

46、v*方向的突變者能夠侵入v對策種群。這樣Eshel的連續(xù)穩(wěn)定性結(jié)果得證。圖3.1 在缺水條件下, 遺傳上均一的作物群體內(nèi)每個植物對根系生長的資源投入量,x,與總光合產(chǎn)物量,f(x),的關(guān)系。曲線代表的是植株光合產(chǎn)物量,而直線則代表的是根系投入量。二者之間的最大差值在x*點達到;曲線在這點上的切線應(yīng)與直線平行。x*f(x)關(guān)于ESS和進化博弈論,本章就介紹到這里;在下一章我們將廣泛運用ESS概念分析一些具體的生物學問題。在結(jié)束本章之前,我們再介紹ESS概念在農(nóng)業(yè)領(lǐng)域內(nèi)的一次成功應(yīng)用,即作物生長冗余理論(Zhang et al. 1999)??紤]干旱條件下作物植株在根系生長上的資源投入量;用x表示

47、。當種群內(nèi)所有個體采取的根系生長對策都是x時,每個個體結(jié)實的種子量都是(3.27)其中,f(x)為光合產(chǎn)物量;h為收獲指數(shù),即地上生物量中籽粒所占的比例。因為獲得的水分量是生長的限制因子,所以f(x)將隨著x的增加而上升;但是這種增加不可能無限下去,最終在達到某一點后增加根系投入不會帶來光合產(chǎn)物的更進一步增加。使籽粒產(chǎn)量最大的根系分配量,x*,應(yīng)滿足(圖3.1):(3.28)根據(jù)這個結(jié)果我們說,高產(chǎn)作物不應(yīng)該是最大限度地利用土壤水分,因為一個簡單的事實:投入到根系上的生物量不能再被用來進行種子生產(chǎn)。如果通過擴張根系帶來的好處不能平衡為此付出的代價,那么繼續(xù)增加根系投入顯然不可取?,F(xiàn)在讓我們考察

48、在x*-對策者組成的種群內(nèi)一個突變個體y的命運;它的適合度可以寫為:(3.29)顯然(參見圖3.2)突變者的光合產(chǎn)物量滿足下式:不難看出,如果y>x*,突變者可以侵入x*種群;或者說,產(chǎn)量表現(xiàn)最佳的種群在進化上是不穩(wěn)定的。所以,高產(chǎn)作物只能通過人為手段來建立并加以維持。進化穩(wěn)定的根系分配xe應(yīng)該滿足這樣的條件(參見圖3.3)圖3.3 xe為ESS所要求的條件;加黑曲線的含義如左圖。xef(y,xe)f(x)x*圖3.2在x*-種群內(nèi)一個突變體的光合產(chǎn)物量與根系投入量的關(guān)系;圖中用加黑的曲線表示。f(y,x*)f(x)x*,或者,(3.31)進化穩(wěn)定的根系分配xe應(yīng)該是作物在沒有被人們產(chǎn)量

49、育種有意識改變前所處的狀態(tài)?,F(xiàn)代作物的根系仍然有可能位于x*,xe中間的某一點,因為人們并沒有充分認識到作物生長與產(chǎn)量之間的微妙關(guān)系。Zhang et al.(1999)把大于x*的根系投入稱為生長的冗余(growth redundancy)。上面這個模型是以旱農(nóng)作物為例而發(fā)展起來的;同樣,對于水肥條件優(yōu)越的作物也存在著生長冗余,只不過這時冗余是體現(xiàn)在植物的莖桿上罷了。但是,我們也應(yīng)該注意,現(xiàn)代作物產(chǎn)量育種仍然沒有建立在減少生長冗余這種認識的基礎(chǔ)上。雖然總體上講農(nóng)業(yè)科學家并未對生長冗余給予足夠重視,但對提高產(chǎn)量的關(guān)注卻可能促使他們選擇了減少冗余的品種;因此根據(jù)生長冗余理論我們可以預(yù)期:1、現(xiàn)代

50、作物品種的競爭能力低于古老品種;2、旱農(nóng)區(qū)現(xiàn)代品種的根系生長量少于古老品種;實驗結(jié)果初步證明了這兩個預(yù)測(李話、張大勇,1999;張榮等,1999)。參考文獻李話、張大勇, 1999. 半干旱地區(qū)春小麥根系形態(tài)特征與生長冗余的研究. 應(yīng)用生態(tài)學報, 10(1):26-30.張榮, 張大勇, 原保忠,林魁,魏虹 (1999) 半干旱區(qū)春小麥品種產(chǎn)量表現(xiàn)與競爭能力關(guān)系的研究. 植物生態(tài)學報, 23(3):205-210.Axelrod,R. 1984. The Evolution of Cooperation. Basic Books, New York.Axelrod, R. & Dio

51、n, D. 1988. The further evolution of cooperation. Science, 242:1385-1390.Axelrod, R. & Hamilton, W.D. 1981. The evolution of cooperation. Science, 211:1390-1396.Bishop, D.T. & Cannings, C. 1978. A generalized war of attrition. Journal of Theoretical Biology, 70:85-124.Bulmer, M.G. 1994. Theo

52、retical Evolutionary Ecology. Sinauer, Sunderland, Massachusetts.Burgess, J.W. 1976. Social spiders. Scientific American, 234:100-106.Davies, N.B. 1978. Territorial defence in the speckled wood butterfly (Pararge aegeria): The resident always wins. Animal Behaviour, 26:138-147.Ehrlich, P. & Roug

53、hgarden, J. 1987. The Science of Ecology. Macmillan, New York.Eshel, I. 1983. Evolutionary and continuous stability. Journal of Theoretical Biology, 103:99-111.Hamilton, W.D. 1971. Geometry for the selfish herd. Journal of Theoretical Biology, 31:295-311.Hines, W.G.S. 1987. Evolutionary stable strategies: A review of basic theory. Theoretical Population Biology, 31:195-272.Maynard Smith, J. 1974. The theory of games and the evolution of animal conflicts.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論