版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、合 作 的 進(jìn)進(jìn) 化 北京天則則經(jīng)濟(jì)研研究所第第1399次雙周周學(xué)術(shù)討討論會由由吳堅忠忠博士作作主題發(fā)發(fā)言,研研討了美美國學(xué)者者艾克斯斯羅德提提出的合作的的進(jìn)化問題,艾克斯斯羅德通通過對多多人多次次重復(fù)博博弈的對對策研究究,指出出在博弈弈中產(chǎn)生生合作的的必要條條件和獲獲勝策略略的主要要特征。當(dāng)策略略群體是是按各種種策略的的得分進(jìn)進(jìn)行淘汰汰和進(jìn)化化時,艾艾克斯羅羅德發(fā)現(xiàn)現(xiàn),群體體以一種種不可逆逆轉(zhuǎn)的方方式向合合作的方方向進(jìn)化化,也就就是說,群體的的合作性性隨進(jìn)化化過程越越來越大大。與會會學(xué)者在在主題發(fā)發(fā)言之后后展開了了熱烈的的討論。以下是是這次學(xué)學(xué)術(shù)討論論會的綜綜合觀點點。一、 博博弈中最最優(yōu)策
2、略略的產(chǎn)生生 艾克斯羅羅德在開開始研究究合作之之前,設(shè)設(shè)定了兩兩個前提提:一、每個人人都是自自私的;二、沒沒有權(quán)威威干預(yù)個個人決策策。也就就是說,個人可可以完全全按照自自己利益益最大化化的企圖圖進(jìn)行決決策。在在此前提提下,合合作要研研究的問問題是:第一、人為什什么要合合作;第第二、人人什么時時候是合合作的,什么時時候又是是不合作作的;第第三、如如何使別別人與你你合作。社會實踐踐中有很很多合作作的問題題。比如如國家之之間的關(guān)關(guān)稅報復(fù)復(fù),對他他國產(chǎn)品品提高關(guān)關(guān)稅有利利于保護(hù)護(hù)本國的的經(jīng)濟(jì),但是國國家之間間互提關(guān)關(guān)稅,產(chǎn)產(chǎn)品價格格就提高高了,喪喪失了競競爭力,損害了了國際貿(mào)貿(mào)易的互互補優(yōu)勢勢。在對對
3、策中,由于雙雙方各自自追求自自己利益益的最大大化,導(dǎo)導(dǎo)致了群群體利益益的損害害。對策策論以著著名的囚囚犯困境境來描述述這個問問題。A和B各各表示一一個人,他們的的選擇是是完全無無差異的的。選擇擇C代表表合作,選擇DD代表不不合作。如果AAB都選選擇C合合作,則則兩人各各得3分分;如果果一方選選C,一一方選DD,則選選C的得得零分,選D的的得5分分;如果果AB都都選D,雙方各各得1分分。顯然,對對群體來來說最好好的結(jié)果果是雙方方都選CC,各得得3分,共得66分。如如果一方方選C,一方選選D,總總體得55分。如如果兩人人都選DD,總體體得2分分。 對策學(xué)界界用這個個矩陣來來描述個個體理性性與群體體
4、理性的的沖突:每個人人在追求求個體利利益最大大化時,就使群群體利益益受損,這就是是囚徒困困境。在在矩陣中中,對于于A來說說,當(dāng)對對方選CC,他選選D得55分,選選C只得得3分;當(dāng)對方方選D,他選DD得1分分,選CC得零分分。因此此,無論論對方選選C或DD,對AA來說,選D都都得分最最多。這這是A單單方面的的優(yōu)超策策略。而而當(dāng)兩個個優(yōu)超策策略相遇遇,即AA,B都都選D時時,結(jié)果果是各得得1分。這個結(jié)結(jié)果在矩矩陣中并并非最優(yōu)優(yōu)。困境境就在于于,每個個人采取取各自的的優(yōu)超策策略時,得出的的解是穩(wěn)穩(wěn)定的,但不是是帕累托托最優(yōu)的的,這個個結(jié)果體體現(xiàn)了個個體理性性與群體體理性的的矛盾。在數(shù)學(xué)學(xué)上,這這個一
5、次次性決策策的矩陣陣沒有最最優(yōu)解。如果博弈弈進(jìn)行多多次,只只要對策策者知道道博弈次次數(shù),他他們在最最后一次次肯定采采取互相相背叛的的策略。既然如如此,前前面的每每一次也也就沒有有合作的的必要,因此,在次數(shù)數(shù)已知的的多次博博弈中,對策者者沒有一一次會合合作。如果博弈弈在多人人間進(jìn)行行,而且且次數(shù)未未知,對對策者就就會意識識到,當(dāng)當(dāng)持續(xù)地地采取合合作并達(dá)達(dá)成默契契時,對對策者就就能持續(xù)續(xù)地各得得3分,但如果果持續(xù)地地不合作作的話,每個人人就永遠(yuǎn)遠(yuǎn)得1分分。這樣樣,合作作的動機機就顯現(xiàn)現(xiàn)出來。多次對對局下,未來的的收益應(yīng)應(yīng)比現(xiàn)在在的收益益多一個個折現(xiàn)率率W,WW越大,表示未未來的收收益越重重要。在在
6、多人對對策持續(xù)續(xù)進(jìn)行下下去,且且W比較較大,即即未來充充分重要要時,最最優(yōu)的策策略是與與別人采采取的策策略有關(guān)關(guān)的。假假設(shè)某人人的策略略是,第第一次合合作,以以后只要要對方不不合作一一次,他他就永不不合作。對這種種對策者者,當(dāng)然然合作下下去是上上策。假假如有的的人不管管對方采采取什么么策略,他總是是合作,那么總總是對他他采取不不合作的的策略得得分最多多。對于于總是不不合作的的人,也也只能采采取不合合作的策策略。艾克斯羅羅德做了了一個實實驗,邀邀請多人人來參加加游戲,得分規(guī)規(guī)則與前前面的矩矩陣相同同,什么么時候結(jié)結(jié)束游戲戲是未知知的。他他要求每每個參賽賽者把追追求得分分最多的的策略寫寫成計算算機
7、程序序,然后后用單循循環(huán)賽的的方式將將參賽程程序兩兩兩博弈,以找出出什么樣樣的策略略得分最最高。第一輪游游戲有114個程程序參加加,再加加上艾克克斯羅德德自己的的一個隨隨機程序序(即以以50%的概率率選取合合作或不不合作),運轉(zhuǎn)轉(zhuǎn)了3000次。結(jié)果得得分最高高的程序序是加拿拿大學(xué)者者羅伯布布寫的一報還還一報(tiit ffor tatt)。這這個程序序的特點點是,第第一次對對局采用用合作的的策略,以后每每一步都都跟隨對對方上一一步的策策略,你你上一次次合作,我這一一次就合合作,你你上一次次不合作作,我這這一次就就不合作作。艾克克斯羅德德還發(fā)現(xiàn)現(xiàn),得分分排在前前面的程程序有三三個特點點:第一一,
8、從不不首先背背叛,即即善良良的;第二,對于對對方的背背叛行為為一定要要報復(fù),不能總總是合作作,即可激怒怒的;第三,不能人人家一次次背叛,你就沒沒完沒了了的報復(fù)復(fù),以后后人家只只要改為為合作,你也要要合作,即寬寬容性。為了進(jìn)一一步驗證證上述結(jié)結(jié)論,艾艾氏決定定邀請更更多的人人再做一一次游戲戲,并把把第一次次的結(jié)果果公開發(fā)發(fā)表。第第二次征征集到了了62個個程序,加上他他自己的的隨機程程序,又又進(jìn)行了了一次競競賽。結(jié)結(jié)果,第第一名的的仍是一報還還一報。艾氏氏總結(jié)這這次游戲戲的結(jié)論論是:第第一,一報還還一報仍是最最優(yōu)策略略。第二二,前面面提到的的三個特特點仍然然有效,因為663人中中的前115名里里,
9、只有有第8名名的哈靈靈頓程序序是不不善良的的,后后15名名中,只只有1個個總是合合作的是是善良良的??杉づ院蛯拰捜菪砸惨驳玫搅肆俗C明。此外,好的策策略還必必須具有有的一個個特點是是清晰晰性,能讓對對方在三三、五步步對局內(nèi)內(nèi)辨識出出來,太太復(fù)雜的的對策不不見得好好。一一報還一一報就就有很好好的清晰晰性,讓讓對方很很快發(fā)現(xiàn)現(xiàn)規(guī)律,從而不不得不采采取合作作的態(tài)度度。 二、 合合作的進(jìn)進(jìn)行過程程及規(guī)律律 一報還還一報的策略略在靜態(tài)態(tài)的群體體中得到到了很好好的分?jǐn)?shù)數(shù),那么么,在一一個動態(tài)態(tài)的進(jìn)化化的群體體中,這這種合作作者能否否產(chǎn)生、發(fā)展、生存下下去呢?群體是是會向合合作的方方向進(jìn)化化,還是是向不合
10、合作的方方向進(jìn)化化?如果果大家開開始都不不合作,能否在在進(jìn)化過過程中產(chǎn)產(chǎn)生合作作?為了了回答這這些疑問問,艾氏氏用生態(tài)態(tài)學(xué)的原原理來分分析合作作的進(jìn)化化過程。假設(shè)對策策者所組組成的策策略群體體是一代代一代進(jìn)進(jìn)化下去去的,進(jìn)進(jìn)化的規(guī)規(guī)則包括括:一,試錯。人們在在對待周周圍環(huán)境境時,起起初不知知道該怎怎么做,于是就就試試這這個,試試試那個個,哪個個結(jié)果好好就照哪哪個去做做。第二二,遺傳傳。一個個人如果果合作性性好,他他的后代代的合作作基因就就多。第第三,學(xué)學(xué)習(xí)。比比賽過程程就是對對策者相相互學(xué)習(xí)習(xí)的過程程,一一報還一一報的的策略好好,有的的人就愿愿意學(xué)。按這樣樣的思路路,艾氏氏設(shè)計了了一個實實驗,
11、假假設(shè)633個對策策者中,誰在第第一輪中中的得分分高,他他在第二二輪的群群體中所所占比例例就越高高,而且且是他的的得分的的正函數(shù)數(shù)。這樣樣,群體體的結(jié)構(gòu)構(gòu)就會在在進(jìn)化過過程中改改變,由由此可以以看出群群體是向向什么方方向進(jìn)化化的。實驗結(jié)果果很有趣趣。一一報還一一報原原來在群群體中占占1/663,經(jīng)經(jīng)過10000代代的進(jìn)化化,結(jié)構(gòu)構(gòu)穩(wěn)定下下來時,它占了了24%。另外外,有一一些程序序在進(jìn)化化過程中中消失了了。其中中有一個個值得研研究的程程序,即即原來前前15名名中唯一一的那個個不善善良的哈靈頓頓程序,它的對對策方案案是,首首先合作作,當(dāng)發(fā)發(fā)現(xiàn)對方方一直在在合作,它就突突然來個個不合作作,如果果對
12、方立立刻報復(fù)復(fù)它,它它就恢復(fù)復(fù)合作,如果對對方仍然然合作,它就繼繼續(xù)背叛叛。這個個程序一一開始發(fā)發(fā)展很快快,但等等到除了了一報報還一報報之外外的其它它程序開開始消失失時,它它就開始始下降了了。因此此,以合合作系數(shù)數(shù)來測量量,群體體是越來來越合作作的。進(jìn)化實驗驗揭示了了一個哲哲理:一一個策略略的成功功應(yīng)該以以對方的的成功為為基礎(chǔ)。一報報還一報報在兩兩個人對對策時,得分不不可能超超過對方方,最多多打個平平手,但但它的總總分最高高。它賴賴以生存存的基礎(chǔ)礎(chǔ)是很牢牢固的,因為它它讓對方方得到了了高分。哈靈頓頓程序就就不是這這樣,它它得到高高分時,對方必必然得到到低分。它的成成功是建建立在別別人失敗敗的基
13、礎(chǔ)礎(chǔ)上的,而失敗敗者總是是要被淘淘汰的,當(dāng)失敗敗者被淘淘汰之后后,這個個好占別別人便宜宜的成功功者也要要被淘汰汰。那么,在在一個極極端自私私者所組組成的不不合作者者的群體體中,一報還還一報能否生生存呢?艾氏發(fā)發(fā)現(xiàn),在在得分矩矩陣和未未來的折折現(xiàn)系數(shù)數(shù)一定的的情況下下,可以以算出,只要群群體的55%或更更多成員員是一一報還一一報的的,這些些合作者者就能生生存,而而且,只只要他們們的得分分超過群群體的總總平均分分,這個個合作的的群體就就會越來來越大,最后蔓蔓延到整整個群體體。反之之,無論論不合作作者在一一個合作作者占多多數(shù)的群群體中有有多大比比例,不不合作者者都是不不可能自自下而上上的。這這就說明
14、明,社會會向合作作進(jìn)化的的棘輪是是不可逆逆轉(zhuǎn)的,群體的的合作性性越來越越大。艾艾克斯羅羅德正是是以這樣樣一個鼓鼓舞人心心的結(jié)論論,突破破了囚囚犯困境境的研研究困境境。在研究中中發(fā)現(xiàn),合作的的必要條條件是:第一、關(guān)系要要持續(xù),一次性性的或有有限次的的博弈中中,對策策者是沒沒有合作作動機的的;第二二、對對對方的行行為要做做出回報報,一個個永遠(yuǎn)合合作的對對策者是是不會有有人跟他他合作的的。那么,如如何提高高合作性性呢?首首先,要要建立持持久的關(guān)關(guān)系,即即使是愛愛情也需需要建立立婚姻契契約以維維持雙方方的合作作。第二二、要增增強識別別對方行行動的能能力,如如果不清清楚對方方是合作作還是不不合作,就沒法
15、法回報他他了。第第三、要要維持聲聲譽,說說要報復(fù)復(fù)就一定定要做到到,人家家才知道道你是不不好欺負(fù)負(fù)的,才才不敢不不與你合合作。第第四、能能夠分步步完成的的對局不不要一次次完成,以維持持長久關(guān)關(guān)系,比比如,貿(mào)貿(mào)易、談?wù)勁卸家植竭M(jìn)進(jìn)行,以以促使對對方采取取合作態(tài)態(tài)度。第第五、不不要嫉妒妒人家的的成功,一報報還一報報正是是這樣的的典范。第六、不要首首先背叛叛,以免免擔(dān)上罪罪魁禍?zhǔn)资椎牡赖碌聣毫?。第七、不僅對對背叛要要回報,對合作作也要作作出回報報。第八八、不要要耍小聰聰明,占占人家便便宜。艾克斯羅羅德在合作的的進(jìn)化一書結(jié)結(jié)尾提出出幾個結(jié)結(jié)論。第第一、友友誼不是是合作的的必要條條件,即即使是敵敵人
16、,只只要滿足足了關(guān)系系持續(xù),互相回回報的條條件,也也有可能能合作。比如,第一次次世界大大戰(zhàn)期間間,德英英兩軍在在戰(zhàn)壕戰(zhàn)戰(zhàn)中遇上上了三個個月的雨雨季,雙雙方在這這三個月月中達(dá)成成了默契契,互相相不攻擊擊對方的的糧車給給養(yǎng),到到大反攻攻時再你你死我活活地打。這個例例子說明明,友誼誼不是合合作的前前提。第第二、預(yù)預(yù)見性也也不是合合作的前前提,艾艾氏舉出出生物界界低等動動物、植植物之間間合作的的例子來來說明這這一點。但是,當(dāng)有預(yù)預(yù)見性的的人類了了解了合合作的規(guī)規(guī)律之后后,合作作進(jìn)化的的過程就就會加快快。這時時,預(yù)見見性是有有用的,學(xué)習(xí)也也是有用用的。當(dāng)游戲中中考慮到到隨機干干擾,即即對策者者由于誤誤會
17、而開開始互相相背叛的的情形時時,吳堅堅忠博士士經(jīng)研究究發(fā)現(xiàn),以修正正的一一報還一一報,即以一一定的概概率不報報復(fù)對方方的背叛叛,和悔過的的一報還還一報,即以以一定的的概率主主動停止止背叛。群體所所有成員員處理隨隨機環(huán)境境的能力力越強,悔過過的一報報還一報報效果果越好,寬大大的一報報還一報報效果果越差。三、 艾艾克斯羅羅德的貢貢獻(xiàn)與局局限性艾克斯羅羅德通過過數(shù)學(xué)化化和計算算機化的的方法研研究如何何突破囚囚徒困境境,達(dá)成成合作,將這項項研究帶帶到了一一個全新新境界,他在數(shù)數(shù)學(xué)上的的證明無無疑是十十分雄辯辯和令人人信服的的,而且且,他在在計算機機模擬中中得出的的一些結(jié)結(jié)論是非非常驚人人的發(fā)現(xiàn)現(xiàn),比如
18、如,總分分最高的的人在每每次博弈弈中都沒沒有拿到到最高分分。艾氏所發(fā)發(fā)現(xiàn)的一報還還一報策略,從社會會學(xué)的角角度可以以看作是是一種互惠式式利他,這種種行為的的動機是是個人私私利,但但它的結(jié)結(jié)果是雙雙方獲利利,并通通過互惠惠式利他他有可能能覆蓋了了范圍最最廣的社社會生活活,人們們通過送送禮及回回報,形形成了一一種社會會生活的的秩序,這種秩秩序即使使在多年年隔絕,語言不不通的人人群之間間也是最最易理解解的東西西。比如如,哥倫倫布登上上美洲大大陸時,與印地地安人最最初的交交往就開開始于互互贈禮物物。有些些看似純純粹的利利他行為為,比如如無償損損贈,也也通過某某些間接接方式,比如社社會聲譽譽的獲得得,得
19、到到了回報報。研究究這種行行為,將將對我們們理解社社會生活活有很重重要的意意義。囚徒困境境擴展為為多人博博弈時,就體現(xiàn)現(xiàn)了一個個更廣泛泛的問題題社會悖悖論,或資資源悖論論。人人類共有有的資源源是有限限的,當(dāng)當(dāng)每個人人都試圖圖從有限限的資源源中多拿拿一點兒兒時,就就產(chǎn)生了了局部利利益與整整體利益益的沖突突。人口口問題、資源危危機、交交通阻塞塞,都可可以在社社會悖論論中得以以解釋,在這些些問題中中,關(guān)鍵鍵是通過過研究,制定游游戲規(guī)則則來控制制每個人人的行為為。艾克斯羅羅德的一一些結(jié)論論在中國國古典文文化道德德傳統(tǒng)中中可以很很容易地地找到對對應(yīng),投桃報報李、人不不犯我,我不犯犯人都都體現(xiàn)了了tiit
20、 ffor tatt的思思想。但但這些東東西并不不是最優(yōu)優(yōu)的,因因為一一報還一一報在在充滿了了隨機性性的現(xiàn)實實社會生生活里是是有缺陷陷的。對對此,孔孔子在幾幾千年前前就說出出了以以德報德德,以直直報怨這樣精精彩的修修正策略略,所謂謂直,就是是公正,以公正正來回報報對方的的背叛,是一種種修正了了的一一報還一一報,修正的的是報復(fù)復(fù)的程度度,本來來會讓你你損失55分,現(xiàn)現(xiàn)在只讓讓你損失失3分,從而以以一種公公正審判判來結(jié)束束代代相相續(xù)的報報復(fù),形形成文明明。但是,艾艾氏對博博弈者的的一些假假設(shè)和結(jié)結(jié)論使其其研究不不可避免免地與現(xiàn)現(xiàn)實脫節(jié)節(jié)。首先先,合合作的進(jìn)進(jìn)化一一書暗含含著一個個重要的的假定,即,
21、個個體之間間的博弈弈是完全全無差異異的。現(xiàn)現(xiàn)實的博博弈中,對策者者之間絕絕對的平平等是不不可能達(dá)達(dá)到的。一方面面,對策策者在實實際的實實力上有有差異,雙方互互相背叛叛時,可可能不是是各得11分,而而是強者者得5分分,弱者者得0分分,這樣樣,弱者者的報復(fù)復(fù)就毫無無意義。另一方方面,即即使對局局雙方確確實旗鼓鼓相當(dāng),但某一一方可能能懷有賭賭徒心理理,認(rèn)定定自己更更強大,采取背背叛的策策略能占占便宜。艾氏的的得分矩矩陣忽視視了這種種情形,而這種種賭徒心心理恰恰恰在社會會上大量量引發(fā)了了零和博博弈。因因此,程程序還可可以在此此基礎(chǔ)上上進(jìn)一步步改進(jìn)。其次,艾艾氏認(rèn)為為合作不不需預(yù)期期和信任任。這是是他受到到質(zhì)疑頗頗多之處處。對策策者根據(jù)據(jù)對方前前面
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安徽省蕪湖市(2024年-2025年小學(xué)五年級語文)統(tǒng)編版競賽題(上學(xué)期)試卷及答案
- 2024年人力資源管理教案改革方向
- 《接觸網(wǎng)施工》課件 6.1.2 人工進(jìn)行目測
- 2024故宮課件研討會:學(xué)術(shù)研究及教學(xué)實踐
- 2024年繪本比較:《逃家小兔》與經(jīng)典童話
- 2023年“中國銀行杯”棗莊市“魯班傳人”職業(yè)技能大賽-棗莊市高端裝備職業(yè)技能大賽電工賽項
- 2024年《認(rèn)識鐘表》教案:虛擬現(xiàn)實與實體鐘表結(jié)合
- 2024年母親節(jié)特色課件:《感恩母親》的創(chuàng)意應(yīng)用
- 培養(yǎng)邏輯思維:2024年特色5以內(nèi)加減法教學(xué)
- 陜西省漢中市2024-2025學(xué)年高一上學(xué)期11月期中校際聯(lián)考試題 英語 含答案
- 2024年廣東佛山市三水區(qū)淼城建設(shè)投資有限公司招聘筆試參考題庫附帶答案詳解
- 《排球運動》PPT課件(部級優(yōu)課)
- 高速公路綠化設(shè)計案例課件
- 初中美術(shù)九年級上冊 第8課 最親近的家具
- 文化中心運營方案
- 苗木出庫入庫管理制度
- 電纜溝及電纜井的施工方案
- 前置血管課件
- 給朋友貸款協(xié)議
- 小學(xué)數(shù)學(xué)跨學(xué)科融合的實踐與思考
- 登高作業(yè) 施工方案
評論
0/150
提交評論