演化博弈論簡介_第1頁
演化博弈論簡介_第2頁
演化博弈論簡介_第3頁
演化博弈論簡介_第4頁
演化博弈論簡介_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

)cdmC2,20,30,3D3,01,11,1M3,01,12,2顯然,這個博弈有2個納什均衡,分別是(d,d)和(m,m),(m,m)帕累托占優(yōu)于(d,d)。因為(d,d)與(d,m),(m,d)無差異,而(m,m)優(yōu)于(d,m)和(m,d),因此,只有(m,m)是演化穩(wěn)定策略。我們仔細觀察這個支付矩陣,就能看出問題。隨著演化,大家采用的策略最后都穩(wěn)定在m上,采用m即合作的策略成為大家默認的規(guī)則(制度)。這時候,就會有人想鉆空子了(突變),他會想改變策略選擇c。當別人選擇m時,他就獲得更高的收益。對手很快就會發(fā)現(xiàn)這種情況,于是也選擇策略c,但(c,c)不是納什均衡,不穩(wěn)定,最后會收斂到(d,d),我們又回到了分析的起點。這自然是個無限遞歸的過程,Robson用一種“秘密握手”的思想解決這個問題,即人們通過觀察行為,把人分成2組。大家都只和潛在的朋友合作(握手),選擇策略m,而對外人采取策略d。這種握手從支付矩陣里看不出來,是外生的。這條思路就和信息經濟學接起來了。然后,我們就可以講最重要的復制動態(tài)了。我們還是從最著名的“鷹鴿博弈”開始講。支付矩陣如下HawkDoveHawk,V,0Dove0,v,這個博弈的生物學涵義是,一個社會有兩種動物,一種有攻擊性,叫鷹;一種沒有攻擊性,叫鴿。這個博弈的均衡與c,v的數(shù)值大小密切相關。我們先假設,對于某個微觀個體,物種只是由遺傳(gene)決定的,即某種生物生來要么是鷹,要么是鴿,它無法采取混合策略。如果V>C,也就是兩個鷹之間競爭后的預期收益大于0,那么很顯然,唯一的納什均衡就是(H,H),演化穩(wěn)定策略就是(H,H)。長此以往,整個社會最終將只剩下鷹。如果V<C,情況就復雜了,因為(H,H)與(D,D)都不是納什均衡,整個博弈不存在演化穩(wěn)定策略,最終什么情況都可能發(fā)生。我們用微分方程來描述,可以發(fā)現(xiàn)沒有穩(wěn)態(tài)。但我們放松前面那個假定,從宏觀社群角度來看,情況就不同了。如果我們允許混合策略存在,我們可以得到一個混合策略這個混合策略的生物學涵義是,整個社會里有的生物是鷹,的生物是鴿。如果鷹多了,它會因為相互斗爭而兩敗俱傷,從而減少數(shù)量,恢復到均衡狀態(tài)。反之亦如是。描寫人口變化數(shù)量的微分方程就被稱為復制動態(tài)。我們知道,人口變化一方面受上一代種群數(shù)量的影響(即著名的費雪方程),一方面受當期競爭的影響(博弈論)。這里,我們再次碰到了演化經濟學的大問題,演化是基因演化還是文化演化?即個體的特性是先天遺傳決定還是后天學習決定。我舉個小例子吧。人類學家在歐洲發(fā)掘早期智人,發(fā)現(xiàn)兩種骨頭,一種在前,叫尼安德特人;一種在后,叫克里馬隆人。對于這兩種人之間的關系,人類學家提出了2種看法。我們在后期只發(fā)現(xiàn)克里馬隆人,一種可能的解釋當然是尼安德特人全都進化成了克里馬隆人。另一種可能的解釋是,克里馬隆人和尼安德特人沒有任何親緣關系,他們只是后來居上,消滅了尼安德特人。這就分別對應于“文化演化”與“基因演化”。這兩種演化思想的爭論至今仍然是演化理論的核心問題。好了,接著我們就可以講近年來演化博弈論最重要的進展,隨機穩(wěn)定(SS),這是楊(P.Young)和福斯特(Foster)的貢獻,他們都寫過重要的演化博弈論教科書。我們知道,演化穩(wěn)定策略只能抵御初始的沖擊,它保證這個策略比其他策略都占優(yōu)。但在演化博弈過程中,發(fā)生了沖擊,那么演化穩(wěn)定策略就無能為力了。它不能保證必然導向估計的穩(wěn)定點。而我們有了隨機穩(wěn)定策略以后,情況就好得多。我們只要保證每次轉移矩陣不變,不管中間發(fā)生了多少次沖擊,整個博弈都能向均衡點收斂。隨機穩(wěn)定策略被廣泛運用于制度分析中,因為制度變遷的過程正是一個不斷沖擊,不斷相互作用的過程。下面,我們用一個協(xié)調博弈的例子來說明,這個例子來自于卡多里等,被稱為KMR模型(Kandori,Mailath,Rob)。先簡單解釋一下協(xié)調博弈,這類似于圍城戰(zhàn)。例如史可法被清兵把揚州城團團包圍了。他派人殺出城去求來南明救兵。但因為敵人強大,一定要里應外合才能殺退敵軍,任何一方單獨行動都會遭至失敗。當然,這里面有一個信號傳遞的問題,即協(xié)調的過程,而這又和共同知識(commonknowledge)有關。城外的人必須完全知道城內人的策略空間,城內的人也是,相互嵌逃,無窮遞歸。而我們用自明之理代替共同知識,又會遇到認識論的問題,上面已經說過了。我們不看信號傳遞,就簡單地看這個支付矩陣。ABAB我們假設其中a>c,b>d,但是a-c<b-d。更具體一些,a=2,b=1,c=0,d=-100。顯然,(A,A)與(B,B)都是納什均衡,(A,A)是帕累托最優(yōu)的。但(B,B)是風險占優(yōu)策略。我們假設整個社會人口,。其中當且僅當,,。于是整個社會人口的變動這其中,,于是我們就得到Z空間上的一個馬爾可夫鏈我們可以證明馬爾可夫鏈有唯一的均衡,滿足,可以稱之為不變均衡。這個博弈策略,它有穩(wěn)定性質任何,最后,我們給出一個性質但不加證明了,當博弈時間足夠長(即N足夠大時),風險占優(yōu)策略才是唯一的隨機穩(wěn)定策略。 我不應該再講技術性的東西了,我們步入下一個大問題。我用一個大家最熟悉的例子來運用一下復制動態(tài),同時引向第三個關鍵字“互惠”(reciprocity)。金迪斯2001年那篇“互惠性”的論文,被丁丁稱為“社會學第一定理”。我知道大家都很熟悉,就只講一下主要思想,在金迪斯(Gintis)文章里,他假設有兩種人,一種利他的人(雷鋒?),一種自私的經濟人。在每一個生命周期里,自私的人一定能活下去,但利他的人會以小于1的某概率活下去。(注意,這里金迪斯沒把犧牲自己和造福大家必然地聯(lián)系起來,這其中的缺陷值得我們反思。葉老師提出的合作效用就是要彌補這個缺陷)。而人口會以固定的速度繁殖增長,金迪斯假設利他人與利他人的孩子,必然是利他的。自私人與自私人的孩子必然是自私的。利他人與自私人的孩子以0.5的概率分別是利他和自私的,這里只有顯性遺傳。這就是最典型的復制動態(tài)情形,金迪斯把這稱為縱向動態(tài)。如果只有縱向動態(tài),那么最后利他的人必然瀕臨滅絕。這里,金迪斯又引入一個微分方程,一般文獻稱為Mutant(突變),金迪斯稱為水平遺傳-即教育或教化。一部分自私的人會良心發(fā)現(xiàn),變成利他。一部分利他的人受不住誘惑,變成自私的人。這樣,隨著初始參數(shù)的變動,可以得到各種結果。從這里,我們步入最后一個大問題,那就是“互惠”。這條路非常復雜,因為研究目標是活生生的人。我們必須追溯到道金斯,威爾森,一直到現(xiàn)在的Boyd,Richerson,Gintis,Fehr等。葉老師寫過很多這方面的文章,我也有一篇綜述,大家可以參考。我想指出的是,這個領域介于生物學,社會學(包括人類學)與經濟學之間。從現(xiàn)在的發(fā)展程度來看,所謂的行為學是解決這一方向問題的最好工具。我們歸根結底要探究個人的動機(motivation),這又好像是心理學的事情了。心理學是個模糊的學科,行為主義對它有著深遠的影響。社會學中也有一個行為主義學派,代表人物有霍曼斯(Homans),布勞(Blow),大家應該都很熟悉。

另一個我想強調的就是,實驗經濟學對這條互惠思路的研究提供了很多支持。“最后通牒”博弈已經家喻戶曉了。與之相關的實驗還有,公共品博弈驗,效率工資博弈等等。

在給出那么多理論以后,我想從生物學的角度提出9個問題(是澤爾騰在博弈論手冊中提出的),每一個問題自然都與演化博弈理論相關,但都沒有必然的答案,僅供大家思考。問題一:為什么動物競爭時(例如共同獵取一獵物)有時遵循一定的慣例(例如先到先得,例如在誰的地盤上就歸誰),而不都以暴力(身體上的攻擊)解決。這種慣例在什么情況下產生?問題二:沖突是怎么解決的?動物在什么情況下不采用暴力解決沖突?問題三:當個體與整體進行博弈(非對稱)時,沖突的成本收益是否能夠計算?問題四:動物在什么時候停止有成本的攻擊?問題五:動物如何通過行為來交流?(發(fā)送信

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論