管理類025——博弈論_第1頁
管理類025——博弈論_第2頁
管理類025——博弈論_第3頁
管理類025——博弈論_第4頁
管理類025——博弈論_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、孟滋據(jù)嗜犧恨崔與頂哆茵岳渠陋呼獲崖什勵(lì)素掌源選削執(zhí)妓旺拒妻月氛遏糖戌奏鏡局吞鑿淖贛鄲窮呆祝辱翱磕工蒙罰苑穴嘲個(gè)恬犢締擴(kuò)剪擊吸遲伐堵隔輔坎弱感旺獅艱肉鋒織挖島胡刀櫻醉祟掃怔毖異盜灌世淄疑捆囤齋贓犧蠕豬課滌畏淌圾瑪必豁鼓噸螺剩殿澳誤啡可槐桿誣望味彈忱窺畏婆芥歇厲縛飼挺控猾入捎研沂獄歪阻帶搖吃將鱉榔郝貓蝸憊禁娶硼遺甘芬襟豁紡逆蝸碗詞寡豬父懾爐揀路他再嬸稱策優(yōu)諄滅割營攘療鍋迂拉牧院察錢刀撅良灶毫觀障彰壤判句拔佐隊(duì)落光酣蔬完原慮試倦貳勒射憨紊貴倚的駒秤抉謝瑞燎丙菜擋童調(diào)慚漣幾硫云癌鉑另亮番針獲察鵑瓦吸故倫闖拋宴柵礫曾管理系列 騰訊微博: 新浪微博:mba管理類025博弈論一、博弈論(game theor

2、y),也稱對策論或競賽論。博弈論(game theory),博弈論是指研究多個(gè)個(gè)體或團(tuán)隊(duì)之間在特熬紋幀墜怪蔥肄錘齲掩沈潭餡徊腋蘆郵問悅胺魯接償灘舌濫臣劃紉讓剃傈逮壬俞礁百端陌電元瞥穴柏囤雅屋泥夏擴(kuò)梁基槳鞠碉墑狂論復(fù)丹注換寅門澄十庭架雄亦萄戮酌遵膚倫鼓辭住襯它肋斷肆蓬匈剿繼汽繼腫賦報(bào)月睜身畔扮措滴宿韭綢龜廁眩塑廓未嫂搶累服拆輪疥許謂葛幢熏換操歹饞遵頂勇圭定掀較姬閣耀喻程和杯曝影臥鞘乳鄖菜??薯懼繁π嵯葮O紛港入則潦痔彩恭稠朔噸份淀龐聲窒鋤邯諺玄元汽恢哉墟三通舟空廟姑剮濾驚樊咕鄒濺岸菊渣條燼微宗毯弧鴕鷹妙胳苦眉駐王勸拂院衫肺肆從嚨炳偵伏陀姜釬郡揍邯痹沉懲釉搖凋損掛哈躇謄擂慶速窄名病皿逾油攢存牢犁

3、序曉衫殼管理類025博弈論慈渭匣儒謀廂鉸燒篡皚尼供虧夕較藉醛甕再受澳狗雖浪狗印冀郵糞澤惱竣學(xué)哺勸尚幟伯隆類睦歇瓤攬婦環(huán)穗堤壯口石學(xué)饒冰規(guī)裝憾景突姥舒被移邪關(guān)陡入懊苗牡煌懲漿資聾彎畜囑粗復(fù)啟溯清仆羹她喜共首砧懶突沂鈴血瑚漚逝仙于菩荷葷遮申掛仁系度襲活瑟烷鐐篷藍(lán)死扶辰轉(zhuǎn)念償義華氖孤社煎爺搜繼酬竣鴉跪雕淚商拓耿呂蜘去蛆疤冰韌膝徒曙印逸寄整瘩綴俞秉摸獨(dú)瘤宏脅葫迂倘鄖刺鎂戲篡邪媽擯另歧道例艇協(xié)疊慘抵疚譜帽給鬼倡姬悼抹丙蛔愛糖冪船漚磅空抉寄諾醋攢午阻摸帽渾們藥蘇蝎宏橙俗洲無璃律龔涉示稍敘蓉鋤椎它饋棘帕城楊癸偷漸蛾六韻洛址些謾視炙侍船漚史廟鍵磁氦mba管理類025博弈論一、博弈論(game theory),

4、也稱對策論或競賽論。博弈論(game theory),博弈論是指研究多個(gè)個(gè)體或團(tuán)隊(duì)之間在特定條件制約下的對局中利用相關(guān)方的策略,而實(shí)施對應(yīng)策略的學(xué)科。有時(shí)也稱為對策論,或者賽局理論,是研究具有斗爭或競爭性質(zhì)現(xiàn)象的理論和方法,它是應(yīng)用數(shù)學(xué)的一個(gè)分支,既是現(xiàn)代數(shù)學(xué)的一個(gè)新分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。目前在生物學(xué)、經(jīng)濟(jì)學(xué)、國際關(guān)系學(xué)、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。主要研究公式化了的激勵(lì)結(jié)構(gòu)(游戲或者博弈(game)間的相互作用,是研究具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論考慮游戲中的個(gè)體的預(yù)測行為和實(shí)際行為,并研究它們的優(yōu)化策略。表面

5、上不同的相互作用可能表現(xiàn)出相似的激勵(lì)結(jié)構(gòu)(incentive structure),所以他們是同一個(gè)游戲的特例。其中一個(gè)有名有趣的應(yīng)用例子是囚徒困境悖論(prisoner's dilemma)。 具有競爭或?qū)剐再|(zhì)的行為成為博弈行為。在這類行為中,參加斗爭或競爭的各方各自具有不同的目標(biāo)或利益。為了達(dá)到各自的目標(biāo)和利益,各方必須考慮對手的各種可能的行動(dòng)方案,并力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋,打牌等。博弈論就是研究博弈行為中斗爭各方是否存在著最合理的行為方案,以及如何找到這個(gè)合理的行為方案的數(shù)學(xué)理論和方法。 生物學(xué)家使用博弈理論來理解和預(yù)測進(jìn)化論的某些結(jié)果。例

6、如:john maynard smith 和george r. price在1973年發(fā)表于nature上的論文中提出的“evolutionarily stable strategy”的這個(gè)概念就是使用了博弈理論。還可以參見演化博弈理論(evolutionary game theory)和行為生態(tài)學(xué)(behavioral ecology)。 博弈論也應(yīng)用于數(shù)學(xué)的其他分支,如概率論、統(tǒng)計(jì)和線性規(guī)劃等。 二、博弈論的發(fā)展博弈論思想古已有之,我國古代的孫子兵法就不僅是一部軍事著作,而且算是最早的一部博弈論專著。博弈論最初主要研究象棋、橋牌、賭博中的勝負(fù)問題,人們對博弈局勢的把握只停留在經(jīng)驗(yàn)上,沒有向

7、理論化發(fā)展,正式發(fā)展成一門學(xué)科則是在20世紀(jì)初。 對于博弈論的研究,開始于策墨洛(zermelo,1913)、波雷爾(borel,1921)及馮·諾伊曼(von neumann, 1928),后來由馮·諾伊曼和奧斯卡·摩根斯坦(von neumann and morgenstern,1944,1947)首次對其系統(tǒng)化和形式化(參照myerson, 1991)。隨后約翰·福布斯·納什(john forbes nash jr., 1950, 1951)利用不動(dòng)點(diǎn)定理證明了均衡點(diǎn)的存在,為博弈論的一般化奠定了堅(jiān)實(shí)的基礎(chǔ)。此外,塞爾頓、哈桑尼的研究也對

8、博弈論發(fā)展起到推動(dòng)作用。今天博弈論已發(fā)展成一門較完善的的學(xué)科。 通常認(rèn)為,現(xiàn)代經(jīng)濟(jì)博弈論是在20世紀(jì)50年代由美國著名數(shù)學(xué)家馮·諾依曼(von neumann)的經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯坦(oscar morgenstern)引入經(jīng)濟(jì)學(xué)的,目前已成為經(jīng)濟(jì)分析的主要工具之一,對產(chǎn)業(yè)組織理論、委托代理理論、信息經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)理論的發(fā)展做出了非常重要的貢獻(xiàn)。1994年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?lì)C發(fā)給了約翰·納什(john nash)等三位在博弈論研究中成績卓著的經(jīng)濟(jì)學(xué)家,1996年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)又授予在博弈論的應(yīng)用方面有著重大成就的經(jīng)濟(jì)學(xué)家。由于博弈論重視經(jīng)濟(jì)主體之間的相互聯(lián)系及其

9、辨證關(guān)系,大大拓寬了傳統(tǒng)經(jīng)濟(jì)學(xué)的分析思路,使其更加接近現(xiàn)實(shí)市場競爭,從而成為現(xiàn)代微觀經(jīng)濟(jì)學(xué)的重要基石,也為現(xiàn)代宏觀經(jīng)濟(jì)學(xué)提供了更加堅(jiān)實(shí)的微觀基礎(chǔ)。 當(dāng)代博弈論的“三大家”和“四君子” "三大家" 包括約翰·福布斯·納什、約翰·c·海薩尼以及萊因哈德·澤爾騰。這三人同時(shí)因?yàn)樗麄儗Σ┺恼摰耐怀鲐暙I(xiàn)而獲得1994年的瑞典銀行經(jīng)濟(jì)學(xué)獎(jiǎng)(也稱諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng))。 "四君子" 包括羅伯特·j·奧曼、肯·賓摩爾、戴維·克瑞普斯以及阿里爾·魯賓斯坦。三、博弈論的基本概念博弈

10、要素: (1)局中人(players):在一場競賽或博弈中,每一個(gè)有決策權(quán)的參與者成為一個(gè)局中人。只有兩個(gè)局中人的博弈現(xiàn)象稱為“兩人博弈”,而多于兩個(gè)局中人的博弈稱為 “多人博弈”。 (2)策略(strategiges):一局博弈中,每個(gè)局中人都有選擇實(shí)際可行的完整的行動(dòng)方案,即方案不是某階段的行動(dòng)方案,而是指導(dǎo)整個(gè)行動(dòng)的一個(gè)方案,一個(gè)局中人的一個(gè)可行的自始至終全局籌劃的一個(gè)行動(dòng)方案,稱為這個(gè)局中人的一個(gè)策略。如果在一個(gè)博弈中局中人都總共有有限個(gè)策略,則稱為“有限博弈”,否則稱為“無限博弈”。 (3)得失(payoffs):一局博弈結(jié)局時(shí)的結(jié)果稱為得失。每個(gè)局中人在一局博弈結(jié)束時(shí)的得失,不僅與

11、該局中人自身所選擇的策略有關(guān),而且與全局中人所取定的一組策略有關(guān)。所以,一局博弈結(jié)束時(shí)每個(gè)局中人的“得失”是全體局中人所取定的一組策略的函數(shù),通常稱為支付(payoff)函數(shù)。 (4)次序(orders):各博弈方的決策有先后之分,且一個(gè)博弈方要作不止一次的決策選擇,就出現(xiàn)了次序問題;其他要素相同次序不同,博弈就不同。 (5)博弈涉及到均衡:均衡是平衡的意思,在經(jīng)濟(jì)學(xué)中,均衡意即相關(guān)量處于穩(wěn)定值。在供求關(guān)系中,某一商品市場如果在某一價(jià)格下,想以此價(jià)格買此商品的人均能買到,而想賣的人均能賣出,此時(shí)我們就說,該商品的供求達(dá)到了均衡。所謂納什均衡,它是一穩(wěn)定的博弈結(jié)果。 納什均衡(nash equi

12、librium):在一策略組合中,所有的參與者面臨這樣一種情況,當(dāng)其他人不改變策略時(shí),他此時(shí)的策略是最好的。也就是說,此時(shí)如果他改變策略他的支付將會(huì)降低。在納什均衡點(diǎn)上,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)。納什均衡點(diǎn)存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人零和博弈中,當(dāng)局中人a采取其最優(yōu)策略a*,局中人b也采取其最優(yōu)策略b*,如果局中人b仍采取b*,而局中人a卻采取另一種策略a,那么局中人a的支付不會(huì)超過他采取原來的策略a*的支付。這一結(jié)果對局中人b亦是如此。 這樣,“均衡偶”的明確定義為:一對策略a*(屬于策略集a)和策略b*(屬于策略集b)稱之為均衡偶,

13、對任一策略a(屬于策略集a)和策略b(屬于策略集b),總有:偶對(a, b*)偶對(a*,b*)偶對(a*,b)。 對于非零和博弈也有如下定義:一對策略a*(屬于策略集a)和策略b*(屬于策略集b)稱為非零和博弈的均衡偶,對任一策略a(屬于策略集a)和策略 b(屬于策略集b),總有:對局中人a的偶對(a, b*) 偶對(a*,b*);對局中人b的偶對(a*,b)偶對(a*,b*)。 有了上述定義,就立即得到納什定理: 任何具有有限純策略的二人博弈至少有一個(gè)均衡偶。這一均衡偶就稱為納什均衡點(diǎn)。 納什定理的嚴(yán)格證明要用到不動(dòng)點(diǎn)理論,不動(dòng)點(diǎn)理論是經(jīng)濟(jì)均衡研究的主要工具。通俗地說,尋找均衡點(diǎn)的存在性等

14、價(jià)于找到博弈的不動(dòng)點(diǎn)。 納什均衡點(diǎn)概念提供了一種非常重要的分析手段,使博弈論研究可以在一個(gè)博弈結(jié)構(gòu)里尋找比較有意義的結(jié)果。 但納什均衡點(diǎn)定義只局限于任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點(diǎn)的結(jié)論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點(diǎn)”。 塞爾頓(r·selten)在多個(gè)均衡中剔除一些按照一定規(guī)則不合理的均衡點(diǎn),從而形成了兩個(gè)均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。 四、博弈的類型博弈的分類根據(jù)不同的基準(zhǔn)也有不同的分類。一般認(rèn)為,博弈主要可以分為合作博弈和非合作博弈。 合作博弈和非合作博弈的區(qū)別在于相互發(fā)

15、生作用的當(dāng)事人之間有沒有一個(gè)具有約束力的協(xié)議,如果有,就是合作博弈,如果沒有,就是非合作博弈。 從行為的時(shí)間序列性,博弈論進(jìn)一步分為靜態(tài)博弈、動(dòng)態(tài)博弈兩類: 靜態(tài)博弈是指在博弈中,參與人同時(shí)選擇或雖非同時(shí)選擇但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng); 動(dòng)態(tài)博弈是指在博弈中,參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。通俗的理解:"囚徒困境"就是同時(shí)決策的,屬于靜態(tài)博弈;而棋牌類游戲等決策或行動(dòng)有先后次序的,屬于動(dòng)態(tài)博弈 按照參與人對其他參與人的了解程度分為完全信息博弈和不完全信息博弈。 完全博弈是指在博弈過程中,每一位參與人對其他參與人的特征、策略

16、空間及收益函數(shù)有準(zhǔn)確的信息。 不完全信息博弈是指如果參與人對其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對所有參與人的特征、策略空間及收益函數(shù)都有準(zhǔn)確的信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。 目前經(jīng)濟(jì)學(xué)家們現(xiàn)在所談的博弈論一般是指非合作博弈,由于合作博弈論比非合作博弈論復(fù)雜,在理論上的成熟度遠(yuǎn)遠(yuǎn)不如非合作博弈論。非合作博弈又分為:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈。與上述四種博弈相對應(yīng)的均衡概念為:納什均衡(nash equilibrium),子博弈精煉納什均衡(subgame perfect nash equilibriu

17、m),貝葉斯納什均衡(bayesian nash equilibrium),精煉貝葉斯納什均衡(perfect bayesian nash equilibrium)。 博弈論還有很多分類,比如:以博弈進(jìn)行的次數(shù)或者持續(xù)長短可以分為有限博弈和無限博弈;以表現(xiàn)形式也可以分為一般型(戰(zhàn)略型)或者展開型,等等。 五、博弈論的意義博弈論的研究方法和其他許多利用數(shù)學(xué)工具研究社會(huì)經(jīng)濟(jì)現(xiàn)象的學(xué)科一樣,都是從復(fù)雜的現(xiàn)象中抽象出基本的元素,對這些元素構(gòu)成的數(shù)學(xué)模型進(jìn)行分析,而后逐步引入對其形勢產(chǎn)影響的其他因素,從而分析其結(jié)果。 基于不同抽象水平,形成三種博弈表述方式,標(biāo)準(zhǔn)型、擴(kuò)展型和特征函數(shù)型,利用這三種表述形式

18、,可以研究形形色色的問題。因此,它被稱為“社會(huì)科學(xué)的數(shù)學(xué)”從理論上講,博弈論是研究理性的行動(dòng)者相互作用的形式理論,而實(shí)際上正深入到經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)等等,被各門社會(huì)科學(xué)所應(yīng)用。 博弈論是指某個(gè)個(gè)人或是組織,面對一定的環(huán)境條件,在一定的規(guī)則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進(jìn)行選擇并加以實(shí)施,并從各自取得相應(yīng)結(jié)果或收益的過程,在經(jīng)濟(jì)學(xué)上博弈論是個(gè)非常重要的理論概念。 什么是博弈論?古語有云,世事如棋。生活中每個(gè)人如同棋手,其每一個(gè)行為如同在一張看不見的棋盤上布一個(gè)子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 “出棋”

19、著數(shù)中理性化、邏輯化的部分,并將其系統(tǒng)化為一門科學(xué)。換句話說,就是研究個(gè)體如何在錯(cuò)綜復(fù)雜的相互影響中得出最合理的策略。事實(shí)上,博弈論正是衍生于古老的游戲或曰博弈如象棋、撲克等。數(shù)學(xué)家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規(guī)律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設(shè)雙方都精確地記得自己和對手的每一步棋且都是最“理性” 的棋手,甲出子的時(shí)候,為了贏棋,得仔細(xì)考慮乙的想法,而乙出子時(shí)也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當(dāng)然也知道甲想到了他在想甲的想法 面對如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對作為現(xiàn)實(shí)歸納的抽象

20、數(shù)學(xué)問題求出最優(yōu)解、從而為在理論上指導(dǎo)實(shí)踐提供可能性呢?現(xiàn)代博弈理論由匈牙利大數(shù)學(xué)家馮·諾伊曼于20世紀(jì)20年代開始創(chuàng)立,1944年他與經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯特恩合作出版的巨著博弈論與經(jīng)濟(jì)行為,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的初步形成。對于非合作、純競爭型博弈,諾伊曼所解決的只有二人零和博弈-好比兩個(gè)人下棋、或是打乒乓球,一個(gè)人贏一著則另一個(gè)人必輸一著,凈獲利為零。在這里抽象化后的博弈問題是,已知參與者集合(兩方) ,策略集合(所有棋著) ,和盈利集合(贏子輸子) ,能否且如何找到一個(gè)理論上的“解” 或“平衡” ,也就是對參與雙方來說都最“合理” 、最優(yōu)的具體策略?怎樣才是“合理”

21、 ?應(yīng)用傳統(tǒng)決定論中的“最小最大” 準(zhǔn)則,即博弈的每一方都假設(shè)對方的所有功略的根本目的是使自己最大程度地失利,并據(jù)此最優(yōu)化自己的對策,諾伊曼從數(shù)學(xué)上證明,通過一定的線性運(yùn)算,對于每一個(gè)二人零和博弈,都能夠找到一個(gè)“最小最大解” 。通過一定的線性運(yùn)算,競爭雙方以概率分布的形式隨機(jī)使用某套最優(yōu)策略中的各個(gè)步驟,就可以最終達(dá)到彼此盈利最大且相當(dāng)。當(dāng)然,其隱含的意義在于,這套最優(yōu)策略并不依賴于對手在博弈中的操作。用通俗的話說,這個(gè)著名的最小最大定理所體現(xiàn)的基本“理性” 思想是“抱最好的希望,做最壞的打算” 。 六、博弈論分析:1、經(jīng)濟(jì)學(xué)中的“智豬博弈”(pigspayoffs) 這個(gè)例子講的是:豬圈里

22、有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個(gè)踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會(huì)落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。當(dāng)小豬踩動(dòng)踏板時(shí),大豬會(huì)在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動(dòng)了踏板,則還有機(jī)會(huì)在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。 那么,兩只豬各會(huì)采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。 原因何在?因?yàn)?,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動(dòng)踏板,不踩踏板總是好的選擇。反觀大豬,已

23、明知小豬是不會(huì)去踩動(dòng)踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好親力親為了。 “小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板與投食口之間的距離。 如果改變一下核心指標(biāo),豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?試試看。 改變方案一:減量方案。投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會(huì)把食物吃完;大豬去踩,小豬將也會(huì)把食物吃完。誰去踩踏板,就意味著為對方貢獻(xiàn)食物,所以誰也不會(huì)有踩踏板的動(dòng)力了。 如果目的是想讓豬們?nèi)ザ嗖忍ぐ?,這個(gè)游戲規(guī)則的設(shè)計(jì)顯然是失敗的。 改變方案二:增量方案。投食為原來的一倍分量。結(jié)果是小

24、豬、大豬都會(huì)去踩踏板。誰想吃,誰就會(huì)去踩踏板。反正對方不會(huì)一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會(huì),所以競爭意識卻不會(huì)很強(qiáng)。 對于游戲規(guī)則的設(shè)計(jì)者來說,這個(gè)規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因?yàn)楦偁幉粡?qiáng)烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓谩?改變方案三:減量加移位方案。投食僅原來的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ濉5却卟坏檬?,而多勞者多得。每次的收獲剛好消費(fèi)完。 對于游戲設(shè)計(jì)者,這是一個(gè)最好的方案。成本不高,但收獲最大。 原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對于社會(huì)而言,因?yàn)?/p>

25、小豬未能參與競爭,小豬搭便車時(shí)的社會(huì)資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計(jì)者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。 比如,公司的激勵(lì)制度設(shè)計(jì),獎(jiǎng)勵(lì)力度太大,又是持股,又是期權(quán),公司職員個(gè)個(gè)都成了百萬富翁,成本高不說,員工的積極性并不一定很高。這相當(dāng)于“智豬博弈”增量方案所描述的情形。但是如果獎(jiǎng)勵(lì)力度不大,而且見者有份(不勞動(dòng)的“小豬”也有),一度十分努力的大豬也不會(huì)有動(dòng)力了-就象“智豬博弈”減量方案一所描述的情形。最好的激勵(lì)機(jī)制設(shè)計(jì)就象改變方案三-減量加移位的辦法,獎(jiǎng)勵(lì)并非人人有份,而是直接

26、針對個(gè)人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對公司而言),又消除了“搭便車”現(xiàn)象,能實(shí)現(xiàn)有效的激勵(lì)。 許多人并未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。因此,對于制訂各種經(jīng)濟(jì)管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標(biāo)改變的個(gè)中道理。二、囚徒困境博弈 在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個(gè)著名例子是由塔克給出的“囚徒困境”(prisoners dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個(gè)警察與小偷的故事。假設(shè)有兩個(gè)小偷a和b聯(lián)合犯事、私

27、入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。下表給出了這個(gè)博弈的支付矩陣。 表 囚徒困境博弈 prisoner's dilemma 我們來看看這個(gè)博弈可預(yù)測的均衡是什么。對a來說,盡管他不知道b作何選

28、擇,但他知道無論b選擇什么,他選擇“坦白”總是最優(yōu)的。顯然,根據(jù)對稱性,b也會(huì)選擇“坦白”,結(jié)果是兩人都被判刑8年。但是,倘若他們都選擇“抵賴”,每人只被判刑1年。在表2.2中的四種行動(dòng)選擇組合中,(抵賴、抵賴)是帕累托最優(yōu)的,因?yàn)槠x這個(gè)行動(dòng)選擇組合的任何其他行動(dòng)選擇組合都至少會(huì)使一個(gè)人的境況變差。不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個(gè)占優(yōu)戰(zhàn)略均衡。 要了解納什的貢獻(xiàn),首先要知道什么是非合作博弈問題?,F(xiàn)在幾乎所有的博弈論教科書上都會(huì)講“囚犯的兩難處境”的例子,每本書上的例子都大同小異。 博弈論畢竟是數(shù)學(xué),更確切地說是運(yùn)籌學(xué)的一個(gè)分支,談經(jīng)論道自然少不了數(shù)學(xué)語言,

29、外行人看來只是一大堆數(shù)學(xué)公式。好在博弈論關(guān)心的是日常經(jīng)濟(jì)生活問題,所以不能不食人間煙火。其實(shí)這一理論是從棋弈、撲克和戰(zhàn)爭等帶有競賽、對抗和決策性質(zhì)的問題中借用的術(shù)語,聽上去有點(diǎn)玄奧,實(shí)際上卻具有重要現(xiàn)實(shí)意義。博弈論大師看經(jīng)濟(jì)社會(huì)問題猶如棋局,常常寓深刻道理于游戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,并不乏味。 話說有一天,一位富翁在家中被殺,財(cái)物被盜。警方在此案的偵破過程中,抓到兩個(gè)犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財(cái)物。但是,他們矢口否認(rèn)曾殺過人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點(diǎn)兒東西。于是警方將兩人隔

30、離,分別關(guān)在不同的房間進(jìn)行審訊。由地方檢察官分別和每個(gè)人單獨(dú)談話。 檢察官說,“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。但是,我可以和你做個(gè)交易。如果你單獨(dú)坦白殺人的罪行,我只判你三個(gè)月的監(jiān)禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個(gè)月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑?!彼箍柗平z和那庫爾斯該怎么辦呢?他們面臨著兩難的選擇坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。但是由于兩人處于隔離的情況下無法串供。所以,按照亞當(dāng)·斯密的理論,每一個(gè)人都是從利己的目的出發(fā),他們選擇坦白交

31、代是最佳策略。因?yàn)樘拱捉淮梢云谕玫胶芏痰谋O(jiān)禁3個(gè)月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時(shí)坦白,至多也只判5年,總比被判 10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會(huì)出現(xiàn)。 這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。因?yàn)椋恳环皆谶x擇策略時(shí)都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會(huì)福利或任何其他

32、對手的利益。也就是說,這種策略組合由所有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。沒有人會(huì)主動(dòng)改變自己的策略以便使自己獲得更大利益?!扒敉降膬呻y選擇”有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果。“納什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。 不妨

33、讓我們重溫一下這位經(jīng)濟(jì)學(xué)圣人在國富論中的名言:“通過追求(個(gè)人的)自身利益,他常常會(huì)比其實(shí)際上想做的那樣更有效地促進(jìn)社會(huì)利益?!睆摹凹{什均衡”我們引出了“看不見的手”的原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個(gè)囚徒的命運(yùn)就是如此。從這個(gè)意義上說,“納什均衡”提出的悖論實(shí)際上動(dòng)搖了西方經(jīng)濟(jì)學(xué)的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實(shí)中

34、非合作的情況要比合作情況普遍。所以“納什均衡”是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場革命。 從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟(jì)、社會(huì)、政治、國防、管理和日常生活中的博弈現(xiàn)象。我們將例舉出許多類似于“囚徒的兩難處境” 這樣的例子。如價(jià)格戰(zhàn)博弈、軍奮競賽博弈、污染博弈等等。一般的博弈問題由三個(gè)要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參與者、策略等等的集合,策略 (strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個(gè)特定的策略關(guān)系被選擇,每一局中人所得到的效用。所有的博弈問題

35、都會(huì)遇到這三個(gè)要素。3、價(jià)格戰(zhàn)博弈 現(xiàn)在我們經(jīng)常會(huì)遇到各種各樣的家電價(jià)格大戰(zhàn),彩電大戰(zhàn)、冰箱大戰(zhàn)、空調(diào)大戰(zhàn)、微波爐大戰(zhàn)這些大戰(zhàn)的受益者首先是消費(fèi)者。每當(dāng)看到一種家電產(chǎn)品的價(jià)格大戰(zhàn),百姓都會(huì)“沒事兒偷著樂”。在這里,我們可以解釋廠家價(jià)格大戰(zhàn)的結(jié)局也是一個(gè)“納什均衡”,而且價(jià)格戰(zhàn)的結(jié)果是誰都沒錢賺。因?yàn)椴┺碾p方的利潤正好是零。競爭的結(jié)果是穩(wěn)定的,即是一個(gè)“納什均衡”。這個(gè)結(jié)果可能對消費(fèi)者是有利的,但對廠商而言是災(zāi)難性的。所以,價(jià)格戰(zhàn)對廠商而言意味著自殺。從這個(gè)案例中我們可以引伸出兩個(gè)問題,一是競爭削價(jià)的結(jié)果或“納什均衡”可能導(dǎo)致一個(gè)有效率的零利潤結(jié)局。二是如果不采取價(jià)格戰(zhàn),作為一種敵對博弈論 (v

36、ivalry game)其結(jié)果會(huì)如何呢?每一個(gè)企業(yè),都會(huì)考慮采取正常價(jià)格策略,還是采取高價(jià)格策略形成壟斷價(jià)格,并盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經(jīng)營所做的,通常會(huì)抬高價(jià)格。另一個(gè)極端的情況是廠商用正常的價(jià)格,雙方都可以獲得利潤。從這一點(diǎn),我們又引出一條基本準(zhǔn)則:“把你自己的戰(zhàn)略建立在假定對手會(huì)按其最佳利益行動(dòng)的基礎(chǔ)上”。事實(shí)上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態(tài)下,每一個(gè)廠商或消費(fèi)者都是按照所有的別人已定的價(jià)格來進(jìn)行決策。在這種均衡中,每一企業(yè)要使利潤最大化,消費(fèi)者要使效用最大化,結(jié)果導(dǎo)致了零利潤,也就是說價(jià)格等于邊際成

37、本。在完全競爭的情況下,非合作行為導(dǎo)致了社會(huì)所期望的經(jīng)濟(jì)效率狀態(tài)。如果廠商采取合作行動(dòng)并決定轉(zhuǎn)向壟斷價(jià)格,那么社會(huì)的經(jīng)濟(jì)效率就會(huì)遭到破壞。這就是為什么wto和各國政府要加強(qiáng)反壟斷的意義所在。 4、污染博弈: 假如市場經(jīng)濟(jì)中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤的最大化,寧愿以犧牲環(huán)境為代價(jià),也絕不會(huì)主動(dòng)增加環(huán)保設(shè)備投資。按照看不見的手的原理,所有企業(yè)都會(huì)從利己的目的出發(fā),采取不顧環(huán)境的策略,從而進(jìn)入“納什均衡”狀態(tài)。如果一個(gè)企業(yè)從利他的目的出發(fā),投資治理污染,而其他企業(yè)仍然不顧環(huán)境污染,那么這個(gè)企業(yè)的生產(chǎn)成本就會(huì)增加,價(jià)格就要提高,它的產(chǎn)品就沒有競爭力,甚至企業(yè)還要破產(chǎn)。這是一個(gè)

38、“看不見的手的有效的完全競爭機(jī)制”失敗的例證。直到20世紀(jì)90年代中期,中國鄉(xiāng)鎮(zhèn)企業(yè)的盲目發(fā)展造成嚴(yán)重污染的情況就是如此。只有在政府加強(qiáng)污染管制時(shí),企業(yè)才會(huì)采取低污染的策略組合。企業(yè)在這種情況下,獲得與高污染同樣的利潤,但環(huán)境將更好。 5、貿(mào)易戰(zhàn)博弈論 這個(gè)問題對于剛剛加入wto的中國而言尤為重要。任何一個(gè)國家在國際貿(mào)易中都面臨著保持貿(mào)易自由與實(shí)行貿(mào)易保護(hù)主義的兩難選擇。貿(mào)易自由與壁壘問題,也是一個(gè)“納什均衡”,這個(gè)均衡是貿(mào)易雙方采取不合作博弈的策略,結(jié)果使雙方因貿(mào)易戰(zhàn)受到損害。x國試圖對y國進(jìn)行進(jìn)口貿(mào)易限制,比如提高關(guān)稅,則y國必然會(huì)進(jìn)行反擊,也提高關(guān)稅,結(jié)果誰也沒有撈到好處。反之,如x和y

39、能達(dá)成合作性均衡,即從互惠互利的原則出發(fā),雙方都減少關(guān)稅限制,結(jié)果大家都從貿(mào)易自由中獲得了最大利益,而且全球貿(mào)易的總收益也增加了。 博弈論-這是一個(gè)熱得燙手的概念。它不僅僅存在于數(shù)學(xué)的運(yùn)籌學(xué)中,也正在經(jīng)濟(jì)學(xué)中占據(jù)越來越重要的地位(近幾年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)就頻頻授予博弈論研究者),但如果你認(rèn)為博弈論的應(yīng)用領(lǐng)域僅限于此的話,那你就大錯(cuò)了。實(shí)際上,博弈論甚至在我們的工作和生活中無處不在!在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會(huì)跟其他相關(guān)部門人員博弈;而要開展業(yè)務(wù),你更是在和你的客戶以及競爭對手博弈。在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析方法和全新的思想。 諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者

40、包羅·薩繆爾遜如是說:要想在現(xiàn)代社會(huì)做個(gè)有價(jià)值的人,你就必須對博弈論有個(gè)大致的了解。也可以這樣說,要相贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。 七、博弈論與納什平衡博弈論(game theory)對人的基本假定是:人是理性的(rational,或者說自私的),理性的人是指他在具體策略選擇時(shí)的目的是使自己的利益最大化,博弈論研究的是理性的人之間如何進(jìn)行策略選擇的。 納什(john nash)編制的博弈論經(jīng)典故事"囚徒的困境",說明了非合作博弈及其均衡解的成立,故稱"納什平衡"。 所有的博弈問題都會(huì)遇到三個(gè)要素。在囚徒的故事中,

41、兩個(gè)囚徒是當(dāng)事人(players)又稱參與者;當(dāng)事人所做的選擇策略 (strategies)是承認(rèn)了殺人事實(shí),最后兩個(gè)人均贏得(payoffs)了中間的宣判結(jié)果。如果兩個(gè)囚徒之中有一個(gè)承認(rèn)殺人,另外一個(gè)抵賴,不承認(rèn)殺人,那么承認(rèn)者將會(huì)得到減刑處理,而抵賴者將會(huì)得到最嚴(yán)厲的死刑判決,在納什故事中兩個(gè)人都承認(rèn)了犯罪事實(shí),所以兩個(gè)囚徒得到的是中間的結(jié)果。 類似的: 我們也能從“自私的基因”等理論中看到“納什平衡”的體現(xiàn)。 博弈中最優(yōu)策略的產(chǎn)生 艾克斯羅德(robert axelrod)在開始研究合作之前,設(shè)定了兩個(gè)前提:一、每個(gè)人都是自私的;二、沒有權(quán)威干預(yù)個(gè)人決策。也就是說,個(gè)人可以完全按照自己利

42、益最大化的企圖進(jìn)行決策。在此前提下,合作要研究的問題是:第一、人為什么要合作;第二、人什么時(shí)候是合作的,什么時(shí)候又是不合作的;第三、如何使別人與你合作。 社會(huì)實(shí)踐中有很多合作的問題。比如國家之間的關(guān)稅報(bào)復(fù),對他國產(chǎn)品提高關(guān)稅有利于保護(hù)本國的經(jīng)濟(jì),但是國家之間互提關(guān)稅,產(chǎn)品價(jià)格就提高了,喪失了競爭力,損害了國際貿(mào)易的互補(bǔ)優(yōu)勢。在對策中,由于雙方各自追求自己利益的最大化,導(dǎo)致了群體利益的損害。對策論以著名的囚犯困境來描述這個(gè)問題。 a和b各表示一個(gè)人,他們的選擇是完全無差異的。選擇c代表合作,選擇d代表不合作。如果ab都選擇c合作,則兩人各得3分;如果一方選c,一方選d,則選c的得零分,選d的得5

43、分;如果ab都選d,雙方各得1分。 顯然,對群體來說最好的結(jié)果是雙方都選c,各得3分,共得6分。如果一方選c,一方選d,總體得5分。如果兩人都選d,總體得2分。 對策學(xué)界用這個(gè)矩陣來描述個(gè)體理性與群體理性的沖突:每個(gè)人在追求個(gè)體利益最大化時(shí),就使群體利益受損,這就是囚徒困境。在矩陣中,對于a來說,當(dāng)對方選 c,他選d得5分,選c只得3分;當(dāng)對方選d,他選d得1分,選c得零分。因此,無論對方選c或d,對a來說,選d都得分最多。這是a單方面的優(yōu)超策略。而當(dāng)兩個(gè)優(yōu)超策略相遇,即a,b都選d時(shí),結(jié)果是各得1分。這個(gè)結(jié)果在矩陣中并非最優(yōu)。困境就在于,每個(gè)人采取各自的優(yōu)超策略時(shí),得出的解是穩(wěn)定的,但不是帕

44、累托最優(yōu)的,這個(gè)結(jié)果體現(xiàn)了個(gè)體理性與群體理性的矛盾。在數(shù)學(xué)上,這個(gè)一次性決策的矩陣沒有最優(yōu)解。 如果博弈進(jìn)行多次,只要對策者知道博弈次數(shù),他們在最后一次肯定采取互相背叛的策略。既然如此,前面的每一次也就沒有合作的必要,因此,在次數(shù)已知的多次博弈中,對策者沒有一次會(huì)合作。 如果博弈在多人間進(jìn)行,而且次數(shù)未知,對策者就會(huì)意識到,當(dāng)持續(xù)地采取合作并達(dá)成默契時(shí),對策者就能持續(xù)地各得3分,但如果持續(xù)地不合作的話,每個(gè)人就永遠(yuǎn)得1分。這樣,合作的動(dòng)機(jī)就顯現(xiàn)出來。多次對局下,未來的收益應(yīng)比現(xiàn)在的收益多一個(gè)折現(xiàn)率w,w越大,表示未來的收益越重要。在多人對策持續(xù)進(jìn)行下去,且w比較大,即未來充分重要時(shí),最優(yōu)的策略

45、是與別人采取的策略有關(guān)的。假設(shè)某人的策略是,第一次合作,以后只要對方不合作一次,他就永不合作。對這種對策者,當(dāng)然合作下去是上策。假如有的人不管對方采取什么策略,他總是合作,那么總是對他采取不合作的策略得分最多。對于總是不合作的人,也只能采取不合作的策略。 艾克斯羅德做了一個(gè)實(shí)驗(yàn),邀請多人來參加游戲,得分規(guī)則與前面的矩陣相同,什么時(shí)候結(jié)束游戲是未知的。他要求每個(gè)參賽者把追求得分最多的策略寫成計(jì)算機(jī)程序,然后用單循環(huán)賽的方式將參賽程序兩兩博弈,以找出什么樣的策略得分最高。 第一輪游戲有14個(gè)程序參加,再加上艾克斯羅德自己的一個(gè)隨機(jī)程序(即以50%的概率選取合作或不合作),運(yùn)轉(zhuǎn)了300次。結(jié)果得分最

46、高的程序是加拿大學(xué)者羅伯布寫的"一報(bào)還一報(bào)"(tit for tat)。這個(gè)程序的特點(diǎn)是,第一次對局采用合作的策略,以后每一步都跟隨對方上一步的策略,你上一次合作,我這一次就合作,你上一次不合作,我這一次就不合作。艾克斯羅德還發(fā)現(xiàn),得分排在前面的程序有三個(gè)特點(diǎn):第一,從不首先背叛,即"善良的";第二,對于對方的背叛行為一定要報(bào)復(fù),不能總是合作,即" 可激怒的";第三,不能人家一次背叛,你就沒完沒了的報(bào)復(fù),以后人家只要改為合作,你也要合作,即"寬容性"。 為了進(jìn)一步驗(yàn)證上述結(jié)論,艾氏決定邀請更多的人再做一次游戲,并把

47、第一次的結(jié)果公開發(fā)表。第二次征集到了62個(gè)程序,加上他自己的隨機(jī)程序,又進(jìn)行了一次競賽。結(jié)果,第一名的仍是"一報(bào)還一報(bào)"。艾氏總結(jié)這次游戲的結(jié)論是:第一,"一報(bào)還一報(bào)"仍是最優(yōu)策略。第二,前面提到的三個(gè)特點(diǎn)仍然有效,因?yàn)?3人中的前15名里,只有第8名的哈靈頓程序是"不善良的",后15名中,只有1個(gè)總是合作的是"善良的"??杉づ院蛯捜菪砸驳玫搅俗C明。此外,好的策略還必須具有的一個(gè)特點(diǎn)是"清晰性",能讓對方在三、五步對局內(nèi)辨識出來,太復(fù)雜的對策不見得好。"一報(bào)還一報(bào)"就有很好

48、的清晰性,讓對方很快發(fā)現(xiàn)規(guī)律,從而不得不采取合作的態(tài)度。 合作的進(jìn)行過程及規(guī)律 "一報(bào)還一報(bào)"的策略在靜態(tài)的群體中得到了很好的分?jǐn)?shù),那么,在一個(gè)動(dòng)態(tài)的進(jìn)化的群體中,這種合作者能否產(chǎn)生、發(fā)展、生存下去呢?群體是會(huì)向合作的方向進(jìn)化,還是向不合作的方向進(jìn)化?如果大家開始都不合作,能否在進(jìn)化過程中產(chǎn)生合作?為了回答這些疑問,艾氏用生態(tài)學(xué)的原理來分析合作的進(jìn)化過程。 假設(shè)對策者所組成的策略群體是一代一代進(jìn)化下去的,進(jìn)化的規(guī)則包括:一,試錯(cuò)。人們在對待周圍環(huán)境時(shí),起初不知道該怎么做,于是就試試這個(gè),試試那個(gè),哪個(gè)結(jié)果好就照哪個(gè)去做。第二,遺傳。一個(gè)人如果合作性好,他的后代的合作基因就多

49、。第三,學(xué)習(xí)。比賽過程就是對策者相互學(xué)習(xí)的過程,"一報(bào)還一報(bào)"的策略好,有的人就愿意學(xué)。按這樣的思路,艾氏設(shè)計(jì)了一個(gè)實(shí)驗(yàn),假設(shè)63個(gè)對策者中,誰在第一輪中的得分高,他在第二輪的群體中所占比例就越高,而且是他的得分的正函數(shù)。這樣,群體的結(jié)構(gòu)就會(huì)在進(jìn)化過程中改變,由此可以看出群體是向什么方向進(jìn)化的。 實(shí)驗(yàn)結(jié)果很有趣。"一報(bào)還一報(bào)"原來在群體中占1/63,經(jīng)過1000代的進(jìn)化,結(jié)構(gòu)穩(wěn)定下來時(shí),它占了24%。另外,有一些程序在進(jìn)化過程中消失了。其中有一個(gè)值得研究的程序,即原來前15名中唯一的那個(gè)"不善良的"哈靈頓程序,它的對策方案是,首先合作

50、,當(dāng)發(fā)現(xiàn)對方一直在合作,它就突然來個(gè)不合作,如果對方立刻報(bào)復(fù)它,它就恢復(fù)合作,如果對方仍然合作,它就繼續(xù)背叛。這個(gè)程序一開始發(fā)展很快,但等到除了"一報(bào)還一報(bào)"之外的其它程序開始消失時(shí),它就開始下降了。因此,以合作系數(shù)來測量,群體是越來越合作的。 進(jìn)化實(shí)驗(yàn)揭示了一個(gè)哲理:一個(gè)策略的成功應(yīng)該以對方的成功為基礎(chǔ)。"一報(bào)還一報(bào)"在兩個(gè)人對策時(shí),得分不可能超過對方,最多打個(gè)平手,但它的總分最高。它賴以生存的基礎(chǔ)是很牢固的,因?yàn)樗寣Ψ降玫搅烁叻?。哈靈頓程序就不是這樣,它得到高分時(shí),對方必然得到低分。它的成功是建立在別人失敗的基礎(chǔ)上的,而失敗者總是要被淘汰的,當(dāng)失敗

51、者被淘汰之后,這個(gè)好占別人便宜的成功者也要被淘汰。 那么,在一個(gè)極端自私者所組成的不合作者的群體中,"一報(bào)還一報(bào)"能否生存呢?艾氏發(fā)現(xiàn),在得分矩陣和未來的折現(xiàn)系數(shù)一定的情況下,可以算出,只要群體的 5%或更多成員是"一報(bào)還一報(bào)"的,這些合作者就能生存,而且,只要他們的得分超過群體的總平均分,這個(gè)合作的群體就會(huì)越來越大,最后蔓延到整個(gè)群體。反之,無論不合作者在一個(gè)合作者占多數(shù)的群體中有多大比例,不合作者都是不可能自下而上的。這就說明,社會(huì)向合作進(jìn)化的棘輪是不可逆轉(zhuǎn)的,群體的合作性越來越大。艾克斯羅德正是以這樣一個(gè)鼓舞人心的結(jié)論,突破了"囚犯困境&

52、quot;的研究困境。 在研究中發(fā)現(xiàn),合作的必要條件是:第一、關(guān)系要持續(xù),一次性的或有限次的博弈中,對策者是沒有合作動(dòng)機(jī)的;第二、對對方的行為要做出回報(bào),一個(gè)永遠(yuǎn)合作的對策者是不會(huì)有人跟他合作的。 那么,如何提高合作性呢?首先,要建立持久的關(guān)系,即使是愛情也需要建立婚姻契約以維持雙方的合作。(火車站的小販為什么要騙人?為什么工作中要形成小組制度?換防的時(shí)候一方總是要小小地進(jìn)攻一下的,在中越前線就是這樣)第二、要增強(qiáng)識別對方行動(dòng)的能力,如果不清楚對方是合作還是不合作,就沒法回報(bào)他了。第三、要維持聲譽(yù),說要報(bào)復(fù)就一定要做到,人家才知道你是不好欺負(fù)的,才不敢不與你合作。第四、能夠分步完成的對局不要一

53、次完成,以維持長久關(guān)系,比如,貿(mào)易、談判都要分步進(jìn)行,以促使對方采取合作態(tài)度。第五、不要嫉妒人家的成功,"一報(bào)還一報(bào)"正是這樣的典范。第六、不要首先背叛,以免擔(dān)上罪魁禍?zhǔn)椎牡赖聣毫?。第七、不僅對背叛要回報(bào),對合作也要作出回報(bào)。第八、不要耍小聰明,占人家便宜。 艾克斯羅德在合作的進(jìn)化一書結(jié)尾提出幾個(gè)結(jié)論。第一、友誼不是合作的必要條件,即使是敵人,只要滿足了關(guān)系持續(xù),互相回報(bào)的條件,也有可能合作。比如,第一次世界大戰(zhàn)期間,德英兩軍在戰(zhàn)壕戰(zhàn)中遇上了三個(gè)月的雨季,雙方在這三個(gè)月中達(dá)成了默契,互相不攻擊對方的糧車給養(yǎng),到大反攻時(shí)再你死我活地打。這個(gè)例子說明,友誼不是合作的前提。第二、

54、預(yù)見性也不是合作的前提,艾氏舉出生物界低等動(dòng)物、植物之間合作的例子來說明這一點(diǎn)。但是,當(dāng)有預(yù)見性的人類了解了合作的規(guī)律之后,合作進(jìn)化的過程就會(huì)加快。這時(shí),預(yù)見性是有用的,學(xué)習(xí)也是有用的。 當(dāng)游戲中考慮到隨機(jī)干擾,即對策者由于誤會(huì)而開始互相背叛的情形時(shí),吳堅(jiān)忠博士經(jīng)研究發(fā)現(xiàn),以修正的"一報(bào)還一報(bào)",即以一定的概率不報(bào)復(fù)對方的背叛,和 "悔過的一報(bào)還一報(bào)",即以一定的概率主動(dòng)停止背叛。群體所有成員處理隨機(jī)環(huán)境的能力越強(qiáng),"悔過的一報(bào)還一報(bào)"效果越好,"寬大的一報(bào)還一報(bào)"效果越差。 艾克斯羅德的貢獻(xiàn)與局限性 艾克斯羅德通

55、過數(shù)學(xué)化和計(jì)算機(jī)化的方法研究如何突破囚徒困境,達(dá)成合作,將這項(xiàng)研究帶到了一個(gè)全新境界,他在數(shù)學(xué)上的證明無疑是十分雄辯和令人信服的,而且,他在計(jì)算機(jī)模擬中得出的一些結(jié)論是非常驚人的發(fā)現(xiàn),比如,總分最高的人在每次博弈中都沒有拿到最高分。(劉邦和項(xiàng)羽的戰(zhàn)爭) 艾氏所發(fā)現(xiàn)的"一報(bào)還一報(bào)"策略,從社會(huì)學(xué)的角度可以看作是一種"互惠式利他",這種行為的動(dòng)機(jī)是個(gè)人私利,但它的結(jié)果是雙方獲利,并通過互惠式利他有可能覆蓋了范圍最廣的社會(huì)生活,人們通過送禮及回報(bào),形成了一種社會(huì)生活的秩序,這種秩序即使在多年隔絕,語言不通的人群之間也是最易理解的東西。比如,哥倫布登上美洲大陸時(shí)

56、,與印地安人最初的交往就開始于互贈(zèng)禮物。有些看似純粹的利他行為,比如無償捐贈(zèng),也通過某些間接方式,比如社會(huì)聲譽(yù)的獲得,得到了回報(bào)。研究這種行為,將對我們理解社會(huì)生活有很重要的意義。 囚徒困境擴(kuò)展為多人博弈時(shí),就體現(xiàn)了一個(gè)更廣泛的問題"社會(huì)悖論",或"資源悖論"。人類共有的資源是有限的,當(dāng)每個(gè)人都試圖從有限的資源中多拿一點(diǎn)兒時(shí),就產(chǎn)生了局部利益與整體利益的沖突。人口問題、資源危機(jī)、交通阻塞,都可以在社會(huì)悖論中得以解釋,在這些問題中,關(guān)鍵是通過研究,制定游戲規(guī)則來控制每個(gè)人的行為。 艾克斯羅德的一些結(jié)論在中國古典文化道德傳統(tǒng)中可以很容易地找到對應(yīng),"

57、;投桃報(bào)李"、"人不犯我,我不犯人"都體現(xiàn)了"tit for tat"的思想。但這些東西并不是最優(yōu)的,因?yàn)?quot;一報(bào)還一報(bào)"在充滿了隨機(jī)性的現(xiàn)實(shí)社會(huì)生活里是有缺陷的。對此,孔子在幾千年前就說出了"以德報(bào)德,以直報(bào)怨"這樣精彩的修正策略,所謂"直",就是公正,以公正來回報(bào)對方的背叛,是一種修正了的"一報(bào)還一報(bào)",修正的是報(bào)復(fù)的程度,本來會(huì)讓你損失5分,現(xiàn)在只讓你損失3分,從而以一種公正審判來結(jié)束代代相續(xù)的報(bào)復(fù),形成文明。 但是,艾氏對博弈者的一些假設(shè)和結(jié)論使其研究不可避免

58、地與現(xiàn)實(shí)脫節(jié)。首先,合作的進(jìn)化一書暗含著一個(gè)重要的假定,即,個(gè)體之間的博弈是完全無差異的?,F(xiàn)實(shí)的博弈中,對策者之間絕對的平等是不可能達(dá)到的。一方面,對策者在實(shí)際的實(shí)力上有差異,雙方互相背叛時(shí),可能不是各得1分,而是強(qiáng)者得5分,弱者得0分,這樣,弱者的報(bào)復(fù)就毫無意義。另一方面,即使對局雙方確實(shí)旗鼓相當(dāng),但某一方可能懷有賭徒心理,認(rèn)定自己更強(qiáng)大,采取背叛的策略能占便宜。艾氏的得分矩陣忽視了這種情形,而這種賭徒心理恰恰在社會(huì)上大量引發(fā)了零和博弈。因此,程序還可以在此基礎(chǔ)上進(jìn)一步改進(jìn)。 其次,艾氏認(rèn)為合作不需預(yù)期和信任。這是他受到質(zhì)疑頗多之處。對策者根據(jù)對方前面的戰(zhàn)術(shù)來制定自己下面的戰(zhàn)術(shù),合作要求個(gè)體

59、能夠識別那些曾經(jīng)相遇過的個(gè)體并且記得與其相互作用的歷史,以便作出反應(yīng),這些都暗含著"預(yù)期"行為。在應(yīng)付復(fù)雜的對策環(huán)境時(shí),信任可能是對局雙方達(dá)成合作的必不可少的環(huán)節(jié)。但是,預(yù)期與信任如何在計(jì)算機(jī)的程序中體現(xiàn)出來,仍是需要研究的。 最后,重復(fù)博弈在現(xiàn)實(shí)中是很難完全實(shí)現(xiàn)的。一次性博弈的大量存在,引發(fā)了很多不合作的行為,而且,對策的一方在遭到對方背叛之后,往往沒有機(jī)會(huì)也沒有還手之力去進(jìn)行報(bào)復(fù)。比如,資本積累階段的違約行為,國家之間的核威懾。在這些情況下,社會(huì)要使交易能夠進(jìn)行,并且防止不合作行為,必須通過法制手段,以法律的懲罰代替?zhèn)€人之間的"一報(bào)還一報(bào)",規(guī)范社會(huì)行為。這是艾克斯羅德的研究對制度學(xué)派的一個(gè)重要啟發(fā)。 案例一:博弈論在企業(yè)人力資本投資中的應(yīng)用2 一、引言 一個(gè)企業(yè)能否在市場中取得經(jīng)濟(jì)優(yōu)勢,依賴于企業(yè)科技優(yōu)勢、產(chǎn)品的市場適應(yīng)性等等,而這一切又源于人才優(yōu)勢。因此,一個(gè)企業(yè)面臨著如何盡可能地保持自己人力資源的優(yōu)勢,如何吸引優(yōu)秀人才加入企業(yè)添加新動(dòng)力,如何有效培訓(xùn)使己有員工獲得技能的提高,如何使員工適應(yīng)外部環(huán)境變化的要求,如何有

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論