第8章演化博弈論課件

上傳人：x*** IP屬地：貴州上傳時間：2023-01-04 格式：PPT 頁數(shù)：188 大?。?.77MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩183頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第8講有限理性與演化博弈.第8講有限理性與演化博弈.1參考教材:范如國,博弈論,武漢大學(xué)出版社，2011..2博弈論和決策論

博弈論與決策論之間存在多方面的聯(lián)系。首先，從理解和優(yōu)化決策的意義上講，博弈論應(yīng)該被看成是一種決策理論，并且是一種規(guī)范性（prescriptive）決策理論。它不是描述具體的決策過程，而是指出決策的最優(yōu)結(jié)果應(yīng)該是什么。其次，博弈論可以幫助我們理解決策者之間存在相互作用的狀態(tài)。決策論一般處理個人、集體或者組織的決策問題，而不處理決策者之間的相互作用問題。博弈論恰好相反；再次，博弈論的一些分支可以看做是對決策論傳統(tǒng)內(nèi)容的深化。.博弈論和決策論3

博弈論挑戰(zhàn)普通決策理論

有一個賣帽子的人在一棵樹下午睡，等他醒來后，他發(fā)現(xiàn)一群猴子把他所有的帽子拿到了樹稍上。盛怒之下，他取下他自己的帽子然后狠狠地摔在地上。猴子們非常喜歡模仿，因此這些猴子們也紛紛把帽子擲到地下，這個賣帽子的人然后就迅速拾起了這些帽子。過了50年，這個人的孫子也成為一個賣帽子的人，一天他把帽子放在那棵同樣的大樹下，然后打起盹兒來。等他醒來后，他沮喪地發(fā)現(xiàn)猴子們把他所有的帽子都拿到了樹梢。這時候，他想起了他祖父的故事，他就把他自己的帽子擲到地上。但是，奇怪的是，沒有一只猴子模仿他扔掉帽子，只有一只猴子從樹上爬下來，它拾起地上的那只帽子，牢牢抓在手中，并走到這個賣帽者的面前，給了賣帽者一個耳光然后說：“你以為只有你有爺爺么？”

這個故事說明了普通決策理論和博弈論之間的一個重要的區(qū)別。在博弈論看來，對一個玩家來說決策的理性可能依賴于另外一個玩家決策的理性。

博弈論挑戰(zhàn)普通決策理論

第一章

什么是博弈..5要想在現(xiàn)代社會做一個有文化的人，你必須對博弈論有一個大致了解”

——保羅·薩繆爾森.要想在現(xiàn)代社會做一個有文化的人，你必須對博弈論有一個大致6

一.什么是”博弈”

博弈(GameTheory)即一些個人、隊(duì)組或其他組織，面對一定的環(huán)境條件，在一定的規(guī)則下，同時或先后，一次或多次，從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施，各自取得相應(yīng)結(jié)果的過程。.一.什么是”博弈”

博弈(Game7

博弈論的產(chǎn)生背景1990-Present1980-19901950-195119441944,J.von.Neumann和Oskar.Morgenstern奠定了經(jīng)典博弈理論的基礎(chǔ)。1950-1951,J.Nash提出了非合作博弈的納什均衡的概念。二十世紀(jì)八十年代，博弈論成為經(jīng)濟(jì)學(xué)領(lǐng)域當(dāng)中的通用理論工具，例如：分析不同廠商的合作、聯(lián)盟、競爭與沖突；工業(yè)組織的形成；經(jīng)濟(jì)契約的簽訂；拍賣機(jī)制的設(shè)計(jì)；不對稱信息的市場分析等等。.博弈論的產(chǎn)生背景1990-Pres8

博弈論（GameTheory，又名對策論）是一門以數(shù)學(xué)為基礎(chǔ)的、研究對抗沖突中最優(yōu)解決問題的學(xué)科，更確切地說是運(yùn)籌學(xué)的一個分支,開山鼻祖是數(shù)學(xué)家、計(jì)算機(jī)的發(fā)明者馮·諾意曼(Vonneumann)。他是一位出生于匈牙利的天才的數(shù)學(xué)家。他不僅創(chuàng)立了經(jīng)濟(jì)博弈論，而且發(fā)明了計(jì)算機(jī)。

..9

1944年他和普林斯頓經(jīng)濟(jì)學(xué)家摩根斯坦恩（Morgenstern）合寫了一本書，《博弈論和經(jīng)濟(jì)行為》（TheTheoryofGamesandEconomicBehaviour），正式奠定了現(xiàn)代博弈論的基礎(chǔ)，標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的的初步形成。..10博弈論作為一門學(xué)科，是在20世紀(jì)50～60年代發(fā)展起來的。1950和1951年，Nash發(fā)表了兩篇關(guān)于非合作博弈的重要文章，明確提出了NashEquilibrium的概念，揭示了博弈論和經(jīng)濟(jì)均衡之間的關(guān)系，并證明了均衡解的存在,奠定了現(xiàn)代非合作博弈論的基石。到20世紀(jì)70年代，博弈論正式成為主流經(jīng)濟(jì)學(xué)研究的主要方法之一。1994年諾貝爾經(jīng)濟(jì)學(xué)獎同時授予了納什、澤爾騰、海薩尼三位博弈論專家。1996年諾獎授予兩位博弈論與信息經(jīng)濟(jì)學(xué)研究專家莫里斯、維克瑞；2001年諾獎授予阿克洛夫、斯彭斯、斯蒂格利茨，表彰他們在檸檬市場、信號傳遞和信號甄別等非對稱信息理論研究中的開創(chuàng)性貢獻(xiàn)。2005年諾貝爾經(jīng)濟(jì)學(xué)獎又授予了美國經(jīng)濟(jì)學(xué)家托馬斯．謝林（ThomasSchelling）和以色列經(jīng)濟(jì)學(xué)家羅伯特．奧曼（RobertAumann），以表彰他們在合作博弈方面的巨大貢獻(xiàn)。最近十幾年來，博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛地運(yùn)用，在揭示經(jīng)濟(jì)行為相互制約性質(zhì)方面。今天,在現(xiàn)代經(jīng)濟(jì)學(xué)里，博弈論已經(jīng)成為十分標(biāo)準(zhǔn)的分析工具。

.博弈論作為一門學(xué)科，是在20世紀(jì)50～60年代發(fā)11

博弈論從理論到實(shí)踐

美國經(jīng)濟(jì)學(xué)家埃爾文·羅斯(AlvinRoth)與羅伊德·夏普利(LloydShapley)獲得2012年諾貝爾經(jīng)濟(jì)學(xué)獎。瑞典皇家科學(xué)院表示，今年的諾貝爾經(jīng)濟(jì)學(xué)獎得主關(guān)注經(jīng)濟(jì)學(xué)的一個中心問題：如何盡可能適當(dāng)?shù)仄ヅ洳煌袌鲋黧w。比如，學(xué)生必須與學(xué)校相匹配，人體器官的捐獻(xiàn)者必須與需要移植器官的接受者相匹配。這樣的匹配如何盡可能有效地完成？什么樣的方法對什么樣的人群有益？今年的諾貝爾經(jīng)濟(jì)學(xué)獎授予的這兩位學(xué)者，分別從穩(wěn)定匹配的抽象理論和市場制度的實(shí)際設(shè)計(jì)兩個角度，對上述問題作出了自己的回答。因此，這次經(jīng)濟(jì)學(xué)獎中，人成了主體，包括學(xué)校與學(xué)生的關(guān)系，學(xué)校與學(xué)校的關(guān)系，甚至人在婚姻中的關(guān)系。很明顯，“金錢money”在這次的研究中不再是主角，金錢確實(shí)與人息息相關(guān)，但是并非是人類生活的全部。夏普利使用合作博弈方法來研究和對比不同的匹配方法，其關(guān)鍵在于保證配對是穩(wěn)定的。所謂穩(wěn)定，指的是不存在這樣兩個市場主體，它們都更中意于他人，勝過它們當(dāng)前的另一半匹配對象。夏普利和他的同事找到了所謂的GS算法(Gale-Shapley算法)。這種方法能確保匹配穩(wěn)定。.博弈論從理論到實(shí)踐美國12埃爾文·羅斯羅伊德·夏普利.埃爾文·羅斯羅伊德·夏普利.13諾貝爾經(jīng)濟(jì)學(xué)獎緣何六次鐘情博弈論？

從1994年諾貝爾經(jīng)濟(jì)學(xué)獎授予3位博弈論專家開始，共有5屆的諾貝爾經(jīng)濟(jì)學(xué)獎與博弈論的研究有關(guān)，分別為：1994年，普林斯頓大學(xué)約翰·納什；1996年，授予英國劍橋大學(xué)的詹姆斯·莫里斯，隨后2001年、2005年和2007年，又有不同的經(jīng)濟(jì)學(xué)家獲獎，而時隔五年之后，博弈論學(xué)派第六次問鼎，這在諾獎歷史上不多見，那么，博弈論為何受到如此偏愛呢？近十年來，世界經(jīng)濟(jì)運(yùn)行出現(xiàn)了許多超預(yù)期的新變化、新趨勢和新規(guī)律，這不僅讓傳統(tǒng)經(jīng)濟(jì)學(xué)理論和模型失去了應(yīng)有的解釋力，也讓各國決策者在應(yīng)對一系列復(fù)雜問題以及危機(jī)治理方面表現(xiàn)得十分乏力，而博弈論提供了更廣闊的視角和更加科學(xué)的方法。.諾貝爾經(jīng)濟(jì)學(xué)獎緣何六次鐘情博弈論？從1994年諾14

近十年來，世界經(jīng)濟(jì)運(yùn)行出現(xiàn)了許多超預(yù)期的新變化、新趨勢和新規(guī)律，這不僅讓傳統(tǒng)經(jīng)濟(jì)學(xué)理論和模型失去了應(yīng)有的解釋力，也讓各國決策者在應(yīng)對一系列復(fù)雜問題以及危機(jī)治理方面表現(xiàn)得十分乏力，而博弈論提供了更廣闊的視角和更加科學(xué)的方法。目前經(jīng)濟(jì)學(xué)出現(xiàn)了一種范式危機(jī)，即我們看待問題的思想論、方法論、模型論是有問題的。經(jīng)濟(jì)學(xué)建立在這樣一個基礎(chǔ)上，建得越高、模型越完美，得出的結(jié)論可能和事實(shí)真相相差越遠(yuǎn)。正是這樣的錯誤導(dǎo)致了決策者在金融危機(jī)中集體性的誤判。對經(jīng)濟(jì)危機(jī)預(yù)見的屢屢失靈和范式的不斷轉(zhuǎn)換表明，主流宏觀經(jīng)濟(jì)學(xué)以強(qiáng)化微觀基礎(chǔ)提高其預(yù)測性的方法論是錯誤的，存在著嚴(yán)重的理論缺陷和范式危機(jī)。作為新自由主義政策的指導(dǎo)理論，已有的經(jīng)濟(jì)學(xué)理論已經(jīng)難以呈現(xiàn)出經(jīng)濟(jì)世界的真實(shí)面貌，其政策導(dǎo)向是錯誤的，更不能預(yù)見危機(jī)。而博弈論和演化經(jīng)濟(jì)學(xué)讓我們更加關(guān)注微觀，關(guān)注宏觀決策中常常被忽視的“個體”；更加關(guān)注系統(tǒng)變量之間的作用機(jī)制，關(guān)注經(jīng)濟(jì)演變的過程而不是結(jié)果。.近十年來，世界經(jīng)濟(jì)運(yùn)行出現(xiàn)了許多超預(yù)期的新變15..16TheNobelMemorialPrizeinEconomicSciences

2012-AlvinRoth,LloydShapley2007-LeonidHurwicz,EricS.Maskin,RogerB.Myerson2005-RobertJ.Aumann,ThomasC.Schelling2001-GeorgeA.Akerlof,A.MichaelSpence,JosephE.Stiglitz1996-JamesA.Mirrlees,WilliamVickrey1994-JohnC.Harsanyi,JohnF.NashJr.,ReinhardSelten.TheNobelMemorialPrizeinEc17諾貝爾經(jīng)濟(jì)學(xué)獎1994

約翰·海薩尼（JohnC.Harsanyi）美國人(1920-2000)

加利福尼亞大學(xué)柏克萊分校

"fortheirpioneeringanalysisofequilibriainthetheoryofnon-cooperativegames"

約翰·福布斯·納什（JohnF.NashJr.）美國人(1928-)美國普林斯頓高等研究院的博士學(xué)位

萊因哈德·澤爾騰（ReinhardSelten）德國人(1930-)

波恩大學(xué)生于聯(lián)邦德國這三位數(shù)學(xué)家在非合作博弈的均衡分析理論方面做出了開創(chuàng)性德貢獻(xiàn)，對博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。.18諾貝爾經(jīng)濟(jì)學(xué)獎1994約翰·諾貝爾經(jīng)濟(jì)學(xué)獎1996詹姆斯·莫里斯（JamesA.Mirrlees）英國人(1936-)

“fortheirfundamentalcontributionstotheeconomictheoryofincentivesunderasymmetricinformation”威廉·維克瑞（WilliamVickrey）美國人(1914-1996)

在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn)，尤其是不對稱信息條件下的經(jīng)濟(jì)激勵理論。

在信息經(jīng)濟(jì)學(xué)、激勵理論、博弈論等方面都做出了重大貢獻(xiàn)。.19諾貝爾經(jīng)濟(jì)學(xué)獎1996詹姆斯·莫里斯“for諾貝爾經(jīng)濟(jì)學(xué)獎2001

喬治·阿克爾洛夫（GeorgeA.Akerlof）生于1940年，美國加州大學(xué)伯克萊分校教授"fortheiranalysesofmarketswithasymmetricinformation"

邁克爾·斯賓塞

（A.MichaelSpence）生于1943年，美國加州斯坦福大學(xué)教授

約瑟夫·斯蒂格利茨（JosephE.Stiglitz）生于1943年，美國紐約哥倫比亞大學(xué)教授這三位作為不對稱信息市場理論的奠基人被授予諾貝爾經(jīng)濟(jì)學(xué)獎，以表彰他們分別在檸檬品市場等不對稱信息理論研究領(lǐng)域做出的基礎(chǔ)性貢獻(xiàn)。這些貢獻(xiàn)發(fā)展了博弈論的方法體系，拓寬了其經(jīng)濟(jì)解釋范圍。.20諾貝爾經(jīng)濟(jì)學(xué)獎2001喬治·諾貝爾經(jīng)濟(jì)學(xué)獎2002

丹尼爾·卡納曼(DanielKahneman)1934年出生于以色列特拉維夫，美國普林斯頓大學(xué)心理學(xué)和公共事務(wù)教授?！癴orhavingestablishedlaboratoryexperimentsasatoolinempiricaleconomicanalysis,especiallyinthestudyofalternativemarketmechanisms”“forhavingintegratedinsightsfrompsychologicalresearchintoeconomicscience,especiallyconcerninghumanjudgmentanddecision-makingunderuncertainty”

弗農(nóng)·史密斯(VernonL.Smith)1927年出生,美國喬治·梅森大學(xué)經(jīng)濟(jì)學(xué)和法律教授。把心理學(xué)研究和經(jīng)濟(jì)學(xué)研究結(jié)合在一起，特別是與在不確定狀況下的決策制定有關(guān)的研究。建立了用于經(jīng)驗(yàn)經(jīng)濟(jì)分析尤其是可變換市場機(jī)制的工具——實(shí)驗(yàn)室測試方法。.21諾貝爾經(jīng)濟(jì)學(xué)獎2002丹尼爾·卡諾貝爾經(jīng)濟(jì)學(xué)獎2005

羅伯特·約翰·奧曼

(RobertJohnAumann)，1930年生于德國。麻省理工學(xué)院博士。耶路撒冷希伯來大學(xué)教授。"forhavingenhancedourunderstandingofconflictandcooperationthroughgame-theoryanalysis"

托馬斯·克羅姆比·謝林

(ThomasCrombieSchelling)，1921年生于美國。哈佛大學(xué)博士?，F(xiàn)任馬里蘭大學(xué)教授。因在合作博弈論方面的貢獻(xiàn)而共同分享這一殊榮.22諾貝爾經(jīng)濟(jì)學(xué)獎2005"forhaving諾貝爾經(jīng)濟(jì)學(xué)獎2007

羅杰·邁爾森

(RogerB.Myerson)，1951年3月29日生于美國波士頓，美國國籍。1976年獲得哈佛大學(xué)應(yīng)用數(shù)學(xué)博士學(xué)位?！癴orhavinglaidthefoundationsofmechanismdesigntheory”

埃里克·馬斯金

(EricS.Maskin)，1950年出生于美國紐約。1976年獲得哈佛大學(xué)應(yīng)用數(shù)學(xué)博士學(xué)位。1985至2000年任哈佛大學(xué)經(jīng)濟(jì)系教授。2003年出任世界計(jì)量經(jīng)濟(jì)學(xué)會會長,普林斯頓高等研究院社會科學(xué)部主任。

里奧尼德·赫維克茲(LeonidHurwicz)

猶太人,1917年出生于波蘭,第二次世界大戰(zhàn)中來到美國。美國科學(xué)院院士，美國經(jīng)濟(jì)學(xué)會院士，總統(tǒng)獎獲得者，明尼蘇達(dá)大學(xué)校董事會講座教授。.23諾貝爾經(jīng)濟(jì)學(xué)獎2007羅杰·邁爾森“諾貝爾經(jīng)濟(jì)學(xué)獎2012埃爾文·羅斯(AlvinRoth)

羅伊德·夏普利(LloydShapley)

因在合作博弈論方面的貢獻(xiàn)而共同分享這一殊榮.諾貝爾經(jīng)濟(jì)學(xué)獎2012埃爾文·羅斯(AlvinRo24

納什傳奇的經(jīng)歷納什1928年6月13日出生于美國弗吉尼亞西部，從小就表現(xiàn)出非凡的數(shù)學(xué)天分;1948年獲得數(shù)學(xué)碩士學(xué)位;1950年在普林斯頓獲得數(shù)學(xué)博士學(xué)位，博士論文關(guān)于博弈論的研究，在45年后獲得諾貝爾獎1951－1959年，在MIT數(shù)學(xué)中心任教。在1958年底，納什的心智狀態(tài)出現(xiàn)問題。因?yàn)榫穹至寻Y，在1959年丟了MIT的工作。后來妻子Alicia也最終和他離婚，但仍然繼續(xù)幫助他。.納什傳奇的經(jīng)歷納什1928年6月125納什在妻子和普林斯頓朋友和同事的無微不至的關(guān)懷幫助下，和自己的不懈努力下，病情逐漸好轉(zhuǎn)起來。經(jīng)歷了近30年的精神病的折磨，又重新回到了學(xué)術(shù)研究中。1994年，納什和其他兩位博弈論的學(xué)者一起獲得了諾貝爾經(jīng)濟(jì)學(xué)獎。2002年3月24日，當(dāng)74歲的納什拉著妻子Alicia的手走進(jìn)柯達(dá)劇院奧斯卡頒獎現(xiàn)場時,整個劇院爆發(fā)出熱烈的掌聲。.納什在妻子和普林斯頓朋友和同事的無微不至的關(guān)懷幫助下，和自己26

2002年3月24日，第74屆奧斯卡頒獎典禮在好萊塢柯達(dá)劇院隆重開幕。一部名叫《美麗心靈》(abeautifulmind)的影片大出風(fēng)頭，在獲得八項(xiàng)提名后，獨(dú)得最佳影片、最佳導(dǎo)演、最佳改編劇本、最佳女配角四項(xiàng)大獎。美麗

心靈.2002年3月24日，第74屆奧斯卡頒獎典禮在好萊塢柯達(dá)劇27博弈論是人們深刻理解諸如經(jīng)濟(jì)行為和社會問題的基礎(chǔ)?，F(xiàn)在人們所說的博弈論，一般指非合作博弈論。非合作博弈強(qiáng)調(diào)的是個人理性、個人最優(yōu)決策,其結(jié)果可能是有效率的,也可能是無效率的。它的特征是：人們行為相互作用時，行為人不能達(dá)成一個有約束力的協(xié)議。或者說，行為人之間的合約對于簽約人沒有實(shí)質(zhì)性約束力。然而，在各種生活行為中，人與人之間除了競爭關(guān)系，還存在合作關(guān)系，常常是兩種關(guān)系并存，合理的合作能夠給雙方帶來共同利益。這是合作型博弈論研究的范疇。.博弈論是人們深刻理解諸如經(jīng)濟(jì)行為和社會問題的基礎(chǔ)28二.博弈論的基本要素博弈的標(biāo)準(zhǔn)式表達(dá)包括以下八個基本要素:1.博弈的參與者（Players）

2.各博弈方各自可選擇的全部策略（Strategies）或行為（Actions）的集合

3.進(jìn)行博弈的次序（Orders）

4.博弈方的得益（Payoffs）5.博弈行為(action)

6.博弈信息(information)7.結(jié)果（outcome）8.均衡(equilibrium).二.博弈論的基本要素.29博弈中的基本概念：納什均衡在對方策略確定的情況下，每個參與者的策略都是最好的，此時沒有人愿意先改變自己的策略。.30博弈中的基本概念：納什均衡在對方策略確定的情況下，每個參與者對納什均衡的理解

納什均衡:給定其他人的策略，每一個人的策略都是最好的。

自我實(shí)施：給定其他人的策略，每個人的策略都是最有利于自己的。

穩(wěn)定性：給定其他人的策略，沒有一個人會單方面偏離自己的策略。

現(xiàn)實(shí)最可能≠集體最優(yōu)納什均衡表示博弈中最可能現(xiàn)實(shí)的結(jié)果，但這一結(jié)果并不等于實(shí)現(xiàn)了效率的集體最優(yōu)。.對納什均衡的理解納什均衡:給定其他人的策略，每31

一次性博弈:標(biāo)準(zhǔn)式博弈

構(gòu)成標(biāo)準(zhǔn)式博弈的要素有:參與者：參加博弈并做出決策的個體策略：參與者可能采取的行動得益：參與者采取不同策略帶來的利益或損失參與者2參與者1策略ABCa3，22，35，4b2，11，23，3c1，61，44，5.企業(yè)、政府與商業(yè)環(huán)境一次性博弈:標(biāo)準(zhǔn)式博弈構(gòu)成標(biāo)準(zhǔn)式博弈的要素有:參與32結(jié)果:“a”是參與者1對“C”的最優(yōu)反應(yīng).“C”是參與者2對“a”的最優(yōu)反應(yīng).此結(jié)果就是納什均衡:在給定其他參與者策略情況下，沒有一個參與者能通過單方面改變自己的策略而使自己的得益提高，從而沒有人有積極性打破這種均衡參與者2參與者1策略ABCa3，22，35，4b2，11，23，3c1，61，44，5.企業(yè)、政府與商業(yè)環(huán)境結(jié)果:“a”是參與者1對“C”的最優(yōu)反應(yīng).此結(jié)果就是納什33演化博弈論產(chǎn)生的背景經(jīng)典博弈論實(shí)證缺陷方法缺陷假設(shè)缺陷二十世紀(jì)八十年代之后，研究工作圍繞著修正經(jīng)典博弈論中的完全理性假設(shè)展開研究，并試圖為納什均衡的概念尋找動態(tài)結(jié)構(gòu)下的解釋。研究表明：經(jīng)典博弈論在應(yīng)用中遇到困難，主要是存在三種缺陷：假設(shè)缺陷、方法缺陷、實(shí)證缺陷。為了解決經(jīng)典博弈論的以上三種缺陷，從二十世紀(jì)九十年代發(fā)展了演化博弈論的研究工作。.演化博弈論產(chǎn)生的背景經(jīng)典博弈論實(shí)證缺陷方法缺陷假34假設(shè)缺陷：完全理性假設(shè)，即假定參與人完全了解其對手的策略集合以及使用每個策略的概率，同時也了解博弈規(guī)則與收益結(jié)構(gòu)。參與人也具有通過精確計(jì)算推理得到最優(yōu)策略的能力。但現(xiàn)實(shí)中的參與人只具有有限理性(BoundedRationality)。方法缺陷：經(jīng)典博弈論關(guān)注的重點(diǎn)是如何求解博弈的平衡結(jié)構(gòu)，但不能解釋博弈的各參與方是如何通過參與博弈而趨向于這些均衡狀態(tài)的(H.P.Young)。實(shí)證缺陷：多數(shù)解析型博弈論的預(yù)測都是基于理想的假設(shè)和精確的數(shù)學(xué)推導(dǎo)，需要實(shí)證的經(jīng)驗(yàn)規(guī)律來充實(shí)經(jīng)典博弈論(ColinCamerer)。.假設(shè)缺陷：完全理性假設(shè)，即假定參與人完全了解其對手的策略集合35演化博弈研究具有普遍意義的有限理性的參與人：惰性、近視、遺傳、突變、變異。演化博弈不僅關(guān)注博弈的穩(wěn)定結(jié)構(gòu)，還通過引入不同的動態(tài)機(jī)制研究博弈系統(tǒng)的穩(wěn)定結(jié)構(gòu)和演化過程之間的關(guān)系；演化博弈模型可以和個人學(xué)習(xí)機(jī)制相結(jié)合，可以探討微觀層面上參與人的互動和宏觀層面上群體的均衡現(xiàn)象之間的關(guān)系；演化博弈的假設(shè)條件與建模方法更加有利于進(jìn)行模擬實(shí)驗(yàn)來獲得實(shí)證數(shù)據(jù)。.演化博弈研究具有普遍意義的有限理性的參與人：惰性、近視、遺傳36

有限理性和演化博弈演化博弈論是把博弈理論分析和動態(tài)演化過程分析結(jié)合起來的一種理論。在方法論上，它不同于博弈論將重點(diǎn)放在靜態(tài)均衡和比較靜態(tài)均衡上，強(qiáng)調(diào)的是一種動態(tài)的均衡。演化博弈理論源于生物進(jìn)化論，它曾相當(dāng)成功地解釋了生物進(jìn)化過程中的某些現(xiàn)象。

如今，經(jīng)濟(jì)學(xué)家們運(yùn)用演化博弈論分析社會習(xí)慣、規(guī)范、制度或體制形成的影響因素以及解釋其形成過程，也取得了令人矚目的成績。演化博弈論目前成為演化經(jīng)濟(jì)學(xué)的一個重要分析手段，并逐漸發(fā)展成一個經(jīng)濟(jì)學(xué)的新領(lǐng)域。.有限理性和演化博弈演化博弈論是把博378.1有限理性博弈及其分析框架8.2最優(yōu)反應(yīng)動態(tài)8.3復(fù)制動態(tài)和演化穩(wěn)定性：兩人對稱博弈8.4復(fù)制動態(tài)和演化穩(wěn)定性：兩人非對稱博弈.8.1有限理性博弈及其分析框架.38作為一種數(shù)學(xué)分析方法，傳統(tǒng)博弈對參與者的“理性”要求非?？量蹋耗繕?biāo)理性(主觀理性):參與者追求自身利益的最大化(經(jīng)濟(jì)學(xué)理性的內(nèi)涵)過程理性（具有理性的能力）：給定參與者對外部環(huán)境的信念后最大化自己的報(bào)酬，即“前后一致的”做出選擇.可以分為兩個推理步驟：認(rèn)知理性（cognitive）——參與者對相關(guān)環(huán)境可獲得的信息與形成的信念之間的一致性，即參與者具有對相關(guān)環(huán)境形成信念的能力；具體要求：參與者了解博弈的結(jié)構(gòu)和規(guī)則、以及理性的“共同知識”（遞推歸納法的基礎(chǔ)）、作為不完全信息博弈均衡求解基礎(chǔ)的貝葉斯理性（參與者對不確定性事物具有事前概率分布的判斷，在動態(tài)過程中進(jìn)行更新的貝葉斯決策）。8.1有限理性（boundedrationality）

.作為一種數(shù)學(xué)分析方法，傳統(tǒng)博弈對參與者的“理性”要求非?？量?9工具理性（instrumental）——是通過實(shí)踐的途徑確認(rèn)工具（手段）的有用性，從而追求事物的最大功效，為人的某種功利的實(shí)現(xiàn)服務(wù)。又叫“功效理性”或者說“效率理性”。具體要求：參與者具有計(jì)算推理、預(yù)見、記憶、分析判斷的能力（例：求解動態(tài)博弈均衡的遞推歸納法），不會犯錯誤（例：顫抖手均衡要求犯錯誤時仍具有穩(wěn)健性）等。信念采取相應(yīng)策略最大化目標(biāo)相關(guān)環(huán)境認(rèn)知理性工具理性目標(biāo)理性.工具理性（instrumental）——是通過實(shí)踐的途徑確認(rèn)40

傳統(tǒng)博弈理性假設(shè)的局限性在新古典經(jīng)濟(jì)學(xué)和傳統(tǒng)博弈論中都假定，人是追求收益最大化的，并且可以無誤地選擇最優(yōu)反應(yīng)戰(zhàn)略。但很多人認(rèn)識到人的真實(shí)理性是有限的。赫伯特·西蒙研究認(rèn)為，如果人們在某一問題有滿意解時，就不會再去尋找最優(yōu)。在經(jīng)典博弈論中，假設(shè)參與人具有使自己支付最大化的主觀意識與對于對手策略的最優(yōu)反應(yīng)能力，在實(shí)際中，這種假設(shè)可能是不現(xiàn)實(shí)的。譬如在“象棋”中，棋手不可能在每一步都能夠采取最優(yōu)的反應(yīng)行動。因而有必要把參與人的完全理性行為假設(shè)推廣為不完全理性行為的假設(shè)。.傳統(tǒng)博弈理性假設(shè)的局限性在新古典經(jīng)濟(jì)41顯然，經(jīng)典博弈中的完全理性與現(xiàn)實(shí)相差太遠(yuǎn)。眾多人類行為表現(xiàn)出人的理性是有限的，由于受認(rèn)知能力的限制，有限理性的人類通常是根據(jù)習(xí)慣、常規(guī)以及經(jīng)驗(yàn)法則決策，人類不可能如博弈論所描述的那樣，通過復(fù)雜的計(jì)算獲得最佳反應(yīng)策略。但是，人類懂得學(xué)習(xí)，通過學(xué)習(xí)來比較，糾正錯誤，所以說，人類又是理性動物。從某種意義上來說，人類的學(xué)習(xí)和生物的進(jìn)化沒有本質(zhì)區(qū)別，將進(jìn)化論思想引入到博弈論，形成了演化博弈論。.顯然，經(jīng)典博弈中的完全理性與現(xiàn)實(shí)相差太遠(yuǎn)。眾多人42

在演化博弈中，認(rèn)為參與人的選擇行為可以依據(jù)前人的經(jīng)驗(yàn)、學(xué)習(xí)與模仿他人行為、受遺傳因素的決定等，因而演化博弈把具有主觀選擇行為的參與人擴(kuò)展為包括動物、植物在內(nèi)的有機(jī)體，動植物參與者的支付可被了解為某種適應(yīng)程度。

把博弈論的分析與應(yīng)用從研究人類的競爭行為擴(kuò)展為研究有機(jī)體的策略互動關(guān)系，這個領(lǐng)域的開創(chuàng)性工作是由英國生物學(xué)家約翰·梅納德·史密斯（JohnMaynardSmith）和G.R.普里斯（G.R.Price）1973年進(jìn)行的。.在演化博弈中，認(rèn)為參與人的選擇行為可以依據(jù)前人的43

【英】約翰·梅納德·史密斯:演化與博弈論,復(fù)旦大學(xué)出版社，2008

【英】約翰·梅納德·史密斯:演化與博弈論,復(fù)旦大學(xué)出版社，44JohnMaynardSmith(1920—2004)。演化生物學(xué)家，英國Sussex大學(xué)生物學(xué)教授；1982年與Price一起提出了“演化穩(wěn)定策略ESS”均衡概念，成為演化博弈理論的一個基本概念。他發(fā)起設(shè)立了許多獎項(xiàng)，包括歐洲演化生物學(xué)會

(EuropeanSocietyforEvolutionaryBiology)建立的JohnMaynardSmithPrize,面向演化生物學(xué)界杰出的年輕學(xué)者。代表作：（1）

JohnMaynardSmith(1982)EvolutionandtheTheoryofGames(CambridgeUniv.Press,Cambridge).（2）

TheTheoryofEvolution(CambridgeUniversityPress1993）

梅納德·史密斯與演化博弈理論：.JohnMaynardSmith(1920—2004)45MaynardSmith(1982)等研究生物種群競爭現(xiàn)象，構(gòu)造了基本分析框架。每個參與者代表一個種群，隨機(jī)組合匹配，進(jìn)行預(yù)先規(guī)定好收益的要素博弈；少部分參與者的策略產(chǎn)生突變（試錯法）；大部分參與者根據(jù)不同的學(xué)習(xí)規(guī)則進(jìn)行模仿，其中最有效率的參與者經(jīng)選擇過程得以大量復(fù)制.演化主義基于群體行為的均衡判斷標(biāo)準(zhǔn)：當(dāng)不同策略的分布構(gòu)成發(fā)生一個很小的變化后，仍能維持原穩(wěn)定構(gòu)成。含義：擊退那些突變的入侵策略。演化博弈理論成為90年代以來博弈論最為活躍的一個領(lǐng)域之一，并應(yīng)用在經(jīng)濟(jì)社會體制的起源和多樣性、互補(bǔ)性演化研究中。

演化博弈理論的生物學(xué)起源.MaynardSmith(1982)等研究生物種群競爭現(xiàn)象46FollowingthetraditionofJosephA.Schumpeter,itisdesignedtofocusonoriginalresearchwithanevolutionaryconceptionoftheeconomy.Thejournalwillpublisharticleswithastrongemphasisondynamics,changingstructures(includingtechnologies,institutions,beliefsandbehaviours)anddisequilibriumprocesseswithanevolutionaryperspective(innovation,selection,imitation,etc.).Itfavoursinterdisciplinaryanalysisandisdevotedtotheoretical,methodologicalandappliedwork.Editors:H.Hanusch,S.KlepperEmail:helpdesk@link.springer.dePublisher：SpringerBerlin/Heidelberg國際期刊：JournalofEvolutionaryEconomics.FollowingthetraditionofJos478.1有限理性博弈及其分析框架演化博弈理論的分析對象：

社會經(jīng)濟(jì)系統(tǒng)中有限理性的群體參與者通過各種具體的動態(tài)學(xué)習(xí)模仿過程，如何達(dá)到穩(wěn)定的均衡狀態(tài)。演化博弈理論主要解決的問題：（1）構(gòu)建體現(xiàn)不同理性要求的動態(tài)學(xué)習(xí)模型；（2）運(yùn)用穩(wěn)定性理論，分析學(xué)習(xí)調(diào)整過程中均衡的穩(wěn)定性，判斷動態(tài)模型是否收斂到Nash均衡（或者演化穩(wěn)定均衡ESS、演化均衡EE等均衡概念）。.8.1有限理性博弈及其分析框架演化博弈理論的分析對象：.48演化博弈理論群體參與者的“有限理性”表現(xiàn):

慣例行為（inertia）：由于參與者變更策略存在著成本，因此大多數(shù)人按慣例采取行動，被鎖定在已有策略中。（調(diào)整需要時間）

決策上的“近似眼”(myopia)：當(dāng)少部分參與者變更策略時，總是以現(xiàn)有策略狀態(tài)作為已知條件進(jìn)行分析，而不具有預(yù)測能力（由于群體人數(shù)較多，因此無法預(yù)測，也無法影響其他個體的決策）。

試錯法的嘗試行為(trialandexperiments)：少部分具有冒險(xiǎn)精神的參與者并不拘泥于最優(yōu)策略，而是嘗試采取其它各種策略（產(chǎn)生包括生物學(xué)上遺傳變異機(jī)制、社會新生代出現(xiàn)等）。.演化博弈理論群體參與者的“有限理性”表現(xiàn):.49一般的演化博弈模型的建立主要基于兩個方面：選擇(Selection)和突變(Mutation)。選擇是指能夠獲得較高支付的策略在以后將被更多的參與者采用；突變是指部分個體以隨機(jī)的方式選擇不同于群體的策略(可能是能夠獲得高支付的策略，也可能是獲得較低支付的策略)。突變其實(shí)也是一種選擇，但只有好的策略才能生存下來。突變是一種不斷試錯的過程，也是一種學(xué)習(xí)與模仿的過程，這個過程是適應(yīng)性且是不斷改進(jìn)的。不具備這兩個方面的模型不能稱為演化博弈模型。

演化博弈的基本分析過程：.一般的演化博弈模型的建立主要基于兩個方面：選擇(Se50群體（populations）：生物系統(tǒng)或社會經(jīng)濟(jì)系統(tǒng)中存在著許多參與者，可以分為同類群體和不同類群體，k1。每個群體都有自己的行動集合。支付函數(shù)(payofffunction)：某種行動對應(yīng)的收益。對于策略式博弈表示的要素博弈，又稱為適應(yīng)度函數(shù)(fitnessfunction)，與參與者選擇的策略及其當(dāng)前不同策略的比例分布有關(guān)。動態(tài)（dynamics）：反映群體參與者的學(xué)習(xí)、模仿過程，常見模仿者動態(tài)模型；均衡(equilibrium)：反映演化的收斂穩(wěn)定狀態(tài)，包括靜態(tài)的ESS、動態(tài)的EE等概念。

演化博弈理論的基本要素

.51群體（populations）：生物系統(tǒng)或社會經(jīng)濟(jì)系統(tǒng)中存在8.1.1有限理性及其對博弈的影響有限理性博弈方：不滿足完全理性假設(shè)的博弈方；有限理性意味著一般至少有部分博弈方不會采用完全理性博弈的均衡策略；有限理性意味著均衡是不斷調(diào)整和改進(jìn)而不是一次性選擇的結(jié)果，而且即使到達(dá)了均衡也可能再次偏離；有限理性博弈方會在博弈過程中學(xué)習(xí)博弈通過試錯尋找較好的策略。.8.1.1有限理性及其對博弈的影響有限理性博弈方：不滿足完528.1.2有限理性博弈分析框架有限理性博弈有兩種最基本的情況：（1）最優(yōu)反應(yīng)動態(tài)”（BestResponseDynamics）

：有快速學(xué)習(xí)能力的小群體成員的反復(fù)博弈。（2）復(fù)制動態(tài)（replicatordynamics），又叫模仿者動態(tài)：學(xué)習(xí)速度很慢的成員組成的大群體隨機(jī)配對的反復(fù)博弈。這兩種情況很有代表性，尤其是后者，由于它對理性的要求不高，因此對這種情況的分析更能有效幫助我們理解演化博弈的意義。。重要概念：演化穩(wěn)定策略（EvolutionarilyStableStrategies:ESS）.8.1.2有限理性博弈分析框架有限理性博弈有兩種最基本的情538.2最優(yōu)反應(yīng)動態(tài)8.2.1協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型8.2.2古諾調(diào)整過程.8.2最優(yōu)反應(yīng)動態(tài)8.2.1協(xié)調(diào)博弈的有限博弈方.54

最優(yōu)反應(yīng)動態(tài)”（BestResponseDynamics）博弈方能夠?qū)ι弦浑A段的結(jié)果進(jìn)行總結(jié)，對策略進(jìn)行調(diào)整。這種學(xué)習(xí)和調(diào)整策略的方式，就是“最優(yōu)反應(yīng)動態(tài)”（BestResponseDynamics）的思路或者說學(xué)習(xí)調(diào)整機(jī)制。.最優(yōu)反應(yīng)動態(tài)”（BestResponseDynamic55

考慮下列協(xié)調(diào)博弈的快速學(xué)習(xí)模型。這個博弈稱為協(xié)調(diào)博弈（coordinationgame）,有兩個NE：（A,A),(B,B)。后者明顯帕累托優(yōu)于前者。通常的預(yù)測結(jié)果是(B,B)。如果考慮風(fēng)險(xiǎn)因素，那么前者是更好的預(yù)測。由于現(xiàn)實(shí)中的理性是不完全的，因此要在有限理性的基礎(chǔ)上來分析這個模型。局中人2AB局中人1A50，5049，0B0，4960，60

.考慮下列協(xié)調(diào)博弈的快速學(xué)習(xí)模型。這個博弈稱為協(xié)調(diào)博56協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型模型：50，500，4960，6049，0A博弈方2BAB博弈方1協(xié)調(diào)博弈12345.協(xié)調(diào)博弈的有限博弈方快速學(xué)習(xí)模型模型：50，500，496057假設(shè)有5個博弈方分別處在如圖所示的位置上；設(shè)xi(t)為在t時期博弈方i的鄰居中采用A策略鄰居的數(shù)量，該數(shù)量有0、1、2三個可能值。采用B策略鄰居的數(shù)量為2-xi(t)，也有0、1、2三個可能值。則有博弈方i：反應(yīng)、策略調(diào)整規(guī)則推導(dǎo).假設(shè)有5個博弈方分別處在如圖所示的位置上；設(shè)xi58最優(yōu)反應(yīng)動態(tài)模擬：初次博弈1個AABABABABBBAAAAABAAAABAABB.最優(yōu)反應(yīng)動態(tài)模擬：初次博弈1個AABABABABBBAAAA59初次博弈相鄰2個AAAAAAAABAABBBAA.初次博弈相鄰2個AAAAAAAABAABBBAA.60初次博弈相連3個ABAABAAAAAA.初次博弈相連3個ABAABAAAAAA.618.2.2古諾調(diào)整過程一、古諾(Cournot)寡頭模型法國經(jīng)濟(jì)學(xué)家古諾(Cournot)一個半世紀(jì)以前提出的寡頭市場模型是博弈論的經(jīng)典模型設(shè)某市場有兩家企業(yè)生產(chǎn)同類型的產(chǎn)品，企業(yè)商1的產(chǎn)量為q1，企業(yè)商2的產(chǎn)量為q2，則市場總產(chǎn)量為Q=q1+q2。設(shè)市場出清價(jià)格P是關(guān)于市場總產(chǎn)量的函數(shù)P=P（Q）=a-Q。為分析簡單的需要和突出博弈的特征，假設(shè)兩企業(yè)的生產(chǎn)都無固定成本，且單位產(chǎn)量的邊際成本相等，并為常數(shù)c，則兩個企業(yè)分別生產(chǎn)q1和q2單位產(chǎn)量的總成本分別為q1和q2。最后強(qiáng)調(diào)企業(yè)商同時決定各自的產(chǎn)量，即他們在決策之前都不知道另一方的產(chǎn)量。

.8.2.2古諾調(diào)整過程.62

在上述問題構(gòu)成的標(biāo)準(zhǔn)博弈中，博弈方為企業(yè)1和企業(yè)2。兩博弈方的策略空間就是他們可以選擇的產(chǎn)量。假設(shè)產(chǎn)量是連續(xù)可分的，因此兩個企業(yè)都有無限多種可選策略，且產(chǎn)量不可能為負(fù)值。該博弈中兩博弈方的得益是兩企業(yè)各自的利潤，即各自的銷售收益減去各自的成本..在上述問題構(gòu)成的標(biāo)準(zhǔn)博弈中，博弈方為企業(yè)1和企業(yè)2。兩63..64..65最優(yōu)反應(yīng)函數(shù)（BestReactionFunction）

如果上述通過求解極值的方法得到納什均衡解的方法比較抽象，下面我們用圖形法來比較直觀地得到古諾模型的納什均衡解,其借助的主要工具是最優(yōu)反應(yīng)函數(shù)。.最優(yōu)反應(yīng)函數(shù)（BestReactionFunction）66..678.2.2古諾調(diào)整過程古諾模型反應(yīng)函數(shù)1234………博弈方12.51.52.1251.875博弈方231.752.251.9375問題：古諾調(diào)整過程的邏輯是兩寡頭始終假設(shè)對方產(chǎn)量不變，這是不合理的。如果假設(shè)對手對對方過去各期的平均產(chǎn)量做出反映，可能會更加合理一些，這就是復(fù)制動態(tài)機(jī)制。最優(yōu)反應(yīng)動態(tài)模擬收斂條件.8.2.2古諾調(diào)整過程古諾模型反應(yīng)函數(shù)68演化博弈的動態(tài)模型：演化博弈基本的選擇動態(tài)（selectiondynamics）表述為：其中θi(t)表示在t時刻選擇策略i的個體在群體中所占比例；函數(shù)gi(θ)表示某種具體選擇過程，不同學(xué)習(xí)機(jī)制對應(yīng)不同函數(shù)。選擇動態(tài)的基本特征：當(dāng)初始狀態(tài)下沒有人采取某一純策略i時，則永遠(yuǎn)不會被采用；參與者只能模仿那些已經(jīng)存在的策略，即沒有反映出突變機(jī)制。8.3復(fù)制動態(tài)和演化穩(wěn)定性：兩人對稱博弈.演化博弈的動態(tài)模型：8.3復(fù)制動態(tài)和演化穩(wěn)定性：69博弈方策略類型比例動態(tài)變化是演化博弈分析的核心，其關(guān)鍵是動態(tài)變化的速度（方向可以用速度的正負(fù)號來反映）。動態(tài)變化的速度取決于博弈方學(xué)習(xí)模仿的速度。一般情況下，學(xué)習(xí)速度取決于兩個因素：一是模仿對象的數(shù)量大?。梢杂孟鄳?yīng)類型博弈方的比例表示），這關(guān)系到觀察和模仿的難易程度；二是模仿對象的程度程度（可以用模仿對象策略得益超過平均得益的大小來表示），這關(guān)系到判斷差異難易程度和對模仿激勵的大小。.博弈方策略類型比例動態(tài)變化是演化博弈分析的核心，70

8.3演化博弈最常見的動態(tài)模型：復(fù)制動態(tài)1.復(fù)制動態(tài)（replicatordynamics）是最常見的一種動態(tài)過程：2.每一個參與者只代表某一特定的同類群體，其長期堅(jiān)持采用某種純策略si，采用某種策略的群體比例θi的增長率dθi/dt是此策略效用u(si)與群體平均效用差的嚴(yán)格增函數(shù)：

復(fù)制動態(tài)模型具有很好的生物學(xué)解釋基礎(chǔ)；一些學(xué)者對其社會經(jīng)濟(jì)的解釋基礎(chǔ)展開研究，如進(jìn)入退出機(jī)制、隨機(jī)突變和行為模仿等。.8.3演化博弈最常見的動態(tài)模型：復(fù)制動態(tài).71演化穩(wěn)定策略（ESS）的概念：

演化穩(wěn)定策略（ESS，evolutionarystablestrategy）是演化博弈的一個核心概念，其反映了均衡解的穩(wěn)定性狀態(tài)（另一個是模仿者動態(tài)，一種最常用的動態(tài)收斂過程）。ESS定義：對于非常小的正數(shù)ε，所有的σ≠σ*，滿足：

即對于群體中很小比例ε的突變行為σ，采取σ*策略將獲得更高收益，σ*策略即為演化穩(wěn)定策略。.演化穩(wěn)定策略（ESS）的概念：.72演化穩(wěn)定策略具有以下幾個方面的重要性質(zhì)：（1）由演化穩(wěn)定策略組成的策略組合是嚴(yán)格的，對稱的，嚴(yán)格完美的均衡。（2）演化穩(wěn)定策略是靜態(tài)的概念，并不探討均衡是如何獲得，在某些情況下可以從博弈的得益矩陣中直接判斷出演化穩(wěn)定策略。（3）演化穩(wěn)定策略必須是納什均衡，而納什均衡不一定是演化穩(wěn)定策略，嚴(yán)格納什均衡一定是演化穩(wěn)定策略，演化穩(wěn)定策略是納什均衡的一種精煉。（4）如果一對稱的策略組合是均衡策略，那么它是演化穩(wěn)定策略。但逆命題不成立。（5）演化穩(wěn)定策略是離散型的純策略，群體是無限大，而且博弈中的支付直接等同于策略的適應(yīng)度。.演化穩(wěn)定策略具有以下幾個方面的重要性質(zhì)：.73

注：突變策略是群體參與者的策略集合中不同于現(xiàn)有實(shí)施策略的一種策略。其中，策略集合包括所有的純策略和相應(yīng)的混合策略。

ESS定義的涵義：在一個群體處于Nash均衡狀態(tài)(σ*,σ*)下，當(dāng)少數(shù)變異者持有變異策略σ入侵時，侵略將被擊退，原均衡(σ*,σ*)保持不變..注：突變策略是群體參與者的策略集合中不同于現(xiàn)有實(shí)施策略748.3.1簽協(xié)議博弈的復(fù)制動態(tài)和演化穩(wěn)定策略簽協(xié)議博弈：1，10，00，00，0同意博弈方2不同意同意不同意博弈方1假設(shè)群體中采用“同意”比例x則不同策略期望得益和平均得益為：.8.3.1簽協(xié)議博弈的復(fù)制動態(tài)和演化穩(wěn)定策略簽協(xié)議博弈：175博弈方策略類型比例動態(tài)變化是有限理性博弈分析的核心，其關(guān)鍵是動態(tài)變化的速度；以采用“同意”策略類型博弈方的比例為例，其動態(tài)變化速度可用下列微分方程反映：.博弈方策略類型比例動態(tài)變化是有限理性博弈分析的核心，其關(guān)鍵是76動態(tài)微分方程的相位圖dx/dtx010.5穩(wěn)定狀態(tài)、不動點(diǎn)：x*=0,x*=1.動態(tài)微分方程的相位圖dx/dtx010.5.77演化穩(wěn)定策略的檢驗(yàn).演化穩(wěn)定策略的檢驗(yàn).788.3.2一般兩人對稱博弈復(fù)制動態(tài)和演化穩(wěn)定策略一般模型a,ac,bd,db,c策略1博弈方2策略2策略1策略2博弈方1一般2X2對稱博弈演化博弈設(shè)定是在一個大群體的成員中進(jìn)行隨機(jī)配對的反復(fù)博弈。基本模型是兩個博弈方之間的對稱博弈。含義是兩個博弈位置是無差異的。其中abcd可以是任何得益，根據(jù)問題設(shè)定。.8.3.2一般兩人對稱博弈復(fù)制動態(tài)和演化穩(wěn)定策略一般模型a,79復(fù)制動態(tài)分析dx/dtx1x復(fù)制動態(tài)的演化規(guī)則是生物學(xué)中生物特征進(jìn)化規(guī)則設(shè)x為采用策略1的比例復(fù)制動態(tài)相位圖.復(fù)制動態(tài)分析dx/dtx1x復(fù)制動態(tài)的演化規(guī)則是生物學(xué)中生物808.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和演化穩(wěn)定博弈50，500，4960，6049，0策略1博弈方2策略2策略1策略2博弈方1一般2*2對稱博弈dx/dtx111/16復(fù)制動態(tài)演化博弈的結(jié)果常常取決與帶有很大偶然性的初始狀態(tài)。.8.3.3協(xié)調(diào)博弈的復(fù)制動態(tài)和演化穩(wěn)定博弈50，500，481梅納德·史密斯（MaynardSmith）以鷹鴿博弈（hawk-dovegame）開始，成為生物學(xué)討論演化穩(wěn)定性的標(biāo)準(zhǔn)模式。該博弈并不是表述老鷹和鴿子兩種物種的個體之間對抗，而是同一物種中不同行為類型的個體間的競爭關(guān)系：人類作為一個種群，具有鷹派好斗（hawkish）和鴿派柔弱（dovish）的兩面性，如圖所示，爭奪一種資源，其價(jià)值是v。如果鷹進(jìn)攻而鴿默許，前者得到資源后者一無所獲（v，0）。如果雙方都進(jìn)攻或都被動，則各方獲得資源的機(jī)會均等。同時進(jìn)攻，導(dǎo)致雙方受傷，各自的成本為c,c>v,概率是1/2。上述即為單一種群的策略式要素博弈。種群的得益取決于選擇鷹鴿策略分別在群體中所占的比例。8.3.4鷹鴿博弈的復(fù)制動態(tài)和演化穩(wěn)定策略.梅納德·史密斯（MaynardSmith）以鷹鴿博弈（ha82,0,v,v,0鷹博弈方2鴿?jì)楕澆┺姆?鷹鴿博弈伊拉克戰(zhàn)爭期間拉姆斯菲爾德為首的鷹派和鮑威爾為首的鴿派之間的分歧.,0,v,v,0鷹博弈方2鴿?jì)楕澆楕澆┺囊?3復(fù)制動態(tài)方程和相位圖dx/dtx11/6.復(fù)制動態(tài)方程和相位圖dx/dtx11/6.848.3復(fù)制動態(tài)和演化穩(wěn)定性：兩人非對稱博弈8.3.1市場阻入博弈的復(fù)制動態(tài)和演化穩(wěn)定策略8.3.2非對稱鷹鴿博弈的演化分析.8.3復(fù)制動態(tài)和演化穩(wěn)定性：兩人非對稱博弈8.3.1市場阻85如果一個群體中成員之間的地位不一樣，那么博弈方之間進(jìn)行就是非對稱博弈。非對稱博弈是用兩個（或多個）有差別的有限理性博弈方群體的成員，相互之間隨機(jī)配對博弈。以市場阻入博弈為例（如圖4，表6）。12（0，0）（2，2）（1，5）進(jìn)入不進(jìn)打擊容忍2打擊容忍1進(jìn)入0,02,2不進(jìn)1,51,58.3.1市場阻入博弈的復(fù)制動態(tài)和演化穩(wěn)定策略.如果一個群體中成員之間的地位不一樣，那么博弈方之間進(jìn)行就是非86由于是非對稱博弈，問題中實(shí)際上有兩個不同的博弈方，博弈方1是潛在的進(jìn)入者，博弈方2是阻入者，每次博弈實(shí)際都是前一群體的一個成員與后一群體的一個成員進(jìn)行的。分析框架：反復(fù)在兩個群體中各隨機(jī)抽取一個成員配對進(jìn)行。博弈方的學(xué)習(xí)和策略模仿局限在他們所在群體內(nèi)部，策略調(diào)整的機(jī)制仍然是與對稱博弈中相似的復(fù)制動態(tài)。分別對兩個群體成員進(jìn)行復(fù)制動態(tài)和演化穩(wěn)定策略分析。假設(shè)博弈方1中，采用“進(jìn)入”策略的占的比例為x；在博弈方2中，采用“打擊”策略的占的比例為y。.由于是非對稱博弈，問題中實(shí)際上有兩個不同的博弈方，博弈方1是8712進(jìn)入不進(jìn)打擊不打（0，0）（2，2）（1，5）（1）博弈方1的收益計(jì)算（2）博弈方2的收益計(jì)算.12進(jìn)入不進(jìn)打擊不打（0，0）（2，2）（1，5）（1）博弈88博弈方1位置博弈群體復(fù)制動態(tài)相位圖xdx/dt1y>1/2xdx/dt1y<1/2dx/dtx1y=1/2.博弈方1位置博弈群體復(fù)制動態(tài)相位圖xdx/dt1y>1/2x89博弈方2位置博弈群體復(fù)制動態(tài)相位圖xdy/dt1x=0xdy/dt1x=0.博弈方2位置博弈群體復(fù)制動態(tài)相位圖xdy/dt1x=0x908.3.2非對稱鷹鴿博弈的演化分析鷹博弈方1鴿?jì)棽┺姆?鴿.8.3.2非對稱鷹鴿博弈的演化分析鷹博鴿?jì)棽┺姆?鴿.91非對稱鷹鴿博弈博弈方1群體復(fù)制動態(tài)相位圖xdx/dt1y>5/6xdx/dt1y<5/6xdx/dt1y=5/6.非對稱鷹鴿博弈博弈方1群體復(fù)制動態(tài)相位圖xdx/dt1y>592非對稱鷹鴿博弈博弈方2群體復(fù)制動態(tài)相位圖ydy/dt1x>1/6ydy/dt1x<1/6ydy/dt1x=1/6.非對稱鷹鴿博弈博弈方2群體復(fù)制動態(tài)相位圖ydy/dt1x>193青木昌彥《經(jīng)濟(jì)體制變遷的演化分析》、

《比較制度分析》；Fudenberg&Levine，“TheTheoryofLearninginGames”《博弈學(xué)習(xí)理論》；W.Weibull，“EvolutionaryGameTheory”《演化博弈論》理論介紹性的外文文獻(xiàn)：D.Fudenberg,“Oneconomicapplicationsofevolutionarygametheory”JournalofEvolutionaryEconomics,(1998)8:15-43.范如國《博弈論》，武漢大學(xué)出版社，20118.4主要中文翻譯的參考書目.8.4主要中文翻譯的參考書目.94第8講有限理性與演化博弈.第8講有限理性與演化博弈.95參考教材:范如國,博弈論,武漢大學(xué)出版社，2011..96博弈論和決策論

博弈論挑戰(zhàn)普通決策理論

這個故事說明了普通決策理論和博弈論之間的一個重要的區(qū)別。在博弈論看來，對一個玩家來說決策的理性可能依賴于另外一個玩家決策的理性。

博弈論挑戰(zhàn)普通決策理論

第一章

什么是博弈..99要想在現(xiàn)代社會做一個有文化的人，你必須對博弈論有一個大致了解”

——保羅·薩繆爾森.要想在現(xiàn)代社會做一個有文化的人，你必須對博弈論有一個大致100

一.什么是”博弈”

博弈(Game101

..103

1944年他和普林斯頓經(jīng)濟(jì)學(xué)家摩根斯坦恩（Morgenstern）合寫了一本書，《博弈論和經(jīng)濟(jì)行為》（TheTheoryofGamesandEconomicBehaviour），正式奠定了現(xiàn)代博弈論的基礎(chǔ)，標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的的初步形成。..104博弈論作為一門學(xué)科，是在20世紀(jì)50～60年代發(fā)展起來的。1950和1951年，Nash發(fā)表了兩篇關(guān)于非合作博弈的重要文章，明確提出了NashEquilibrium的概念，揭示了博弈論和經(jīng)濟(jì)均衡之間的關(guān)系，并證明了均衡解的存在,奠定了現(xiàn)代非合作博弈論的基石。到20世紀(jì)70年代，博弈論正式成為主流經(jīng)濟(jì)學(xué)研究的主要方法之一。1994年諾貝爾經(jīng)濟(jì)學(xué)獎同時授予了納什、澤爾騰、海薩尼三位博弈論專家。1996年諾獎授予兩位博弈論與信息經(jīng)濟(jì)學(xué)研究專家莫里斯、維克瑞；2001年諾獎授予阿克洛夫、斯彭斯、斯蒂格利茨，表彰他們在檸檬市場、信號傳遞和信號甄別等非對稱信息理論研究中的開創(chuàng)性貢獻(xiàn)。2005年諾貝爾經(jīng)濟(jì)學(xué)獎又授予了美國經(jīng)濟(jì)學(xué)家托馬斯．謝林（ThomasSchelling）和以色列經(jīng)濟(jì)學(xué)家羅伯特．奧曼（RobertAumann），以表彰他們在合作博弈方面的巨大貢獻(xiàn)。最近十幾年來，博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛地運(yùn)用，在揭示經(jīng)濟(jì)行為相互制約性質(zhì)方面。今天,在現(xiàn)代經(jīng)濟(jì)學(xué)里，博弈論已經(jīng)成為十分標(biāo)準(zhǔn)的分析工具。

.博弈論作為一門學(xué)科，是在20世紀(jì)50～60年代發(fā)105

博弈論從理論到實(shí)踐

美國經(jīng)濟(jì)學(xué)家埃爾文·羅斯(AlvinRoth)與羅伊德·夏普利(LloydShapley)獲得2012年諾貝爾經(jīng)濟(jì)學(xué)獎。瑞典皇家科學(xué)院表示，今年的諾貝爾經(jīng)濟(jì)學(xué)獎得主關(guān)注經(jīng)濟(jì)學(xué)的一個中心問題：如何盡可能適當(dāng)?shù)仄ヅ洳煌袌鲋黧w。比如，學(xué)生必須與學(xué)校相匹配，人體器官的捐獻(xiàn)者必須與需要移植器官的接受者相匹配。這樣的匹配如何盡可能有效地完成？什么樣的方法對什么樣的人群有益？今年的諾貝爾經(jīng)濟(jì)學(xué)獎授予的這兩位學(xué)者，分別從穩(wěn)定匹配的抽象理論和市場制度的實(shí)際設(shè)計(jì)兩個角度，對上述問題作出了自己的回答。因此，這次經(jīng)濟(jì)學(xué)獎中，人成了主體，包括學(xué)校與學(xué)生的關(guān)系，學(xué)校與學(xué)校的關(guān)系，甚至人在婚姻中的關(guān)系。很明顯，“金錢money”在這次的研究中不再是主角，金錢確實(shí)與人息息相關(guān)，但是并非是人類生活的全部。夏普利使用合作博弈方法來研究和對比不同的匹配方法，其關(guān)鍵在于保證配對是穩(wěn)定的。所謂穩(wěn)定，指的是不存在這樣兩個市場主體，它們都更中意于他人，勝過它們當(dāng)前的另一半匹配對象。夏普利和他的同事找到了所謂的GS算法(Gale-Shapley算法)。這種方法能確保匹配穩(wěn)定。.博弈論從理論到實(shí)踐美國106埃爾文·羅斯羅伊德·夏普利.埃爾文·羅斯羅伊德·夏普利.107諾貝爾經(jīng)濟(jì)學(xué)獎緣何六次鐘情博弈論？

約翰·海薩尼（JohnC.Harsanyi）美國人(1920-2000)

加利福尼亞大學(xué)柏克萊分校

"fortheirpioneeringanalysisofequilibriainthetheoryofnon-cooperativegames"

約翰·福布斯·納什（JohnF.NashJr.）美國人(1928-)美國普林斯頓高等研究院的博士學(xué)位

萊因哈德·澤爾騰（ReinhardSelten）德國人(1930-)

波恩大學(xué)生于聯(lián)邦德國這三位數(shù)學(xué)家在非合作博弈的均衡分析理論方面做出了開創(chuàng)性德貢獻(xiàn)，對博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。.112諾貝爾經(jīng)濟(jì)學(xué)獎1994約翰·諾貝爾經(jīng)濟(jì)學(xué)獎1996詹姆斯·莫里斯（JamesA.Mirrlees）英國人(1936-)

“fortheirfundamentalcontributionstotheeconomictheoryofincentivesunderasymmetricinformation”威廉·維克瑞（WilliamVickrey）美國人(1914-1996)

在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn)，尤其是不對稱信息條件下的經(jīng)濟(jì)激勵理論。

在信息經(jīng)濟(jì)學(xué)、激勵理論、博弈論等方面都做出了重大貢獻(xiàn)。.113諾貝爾經(jīng)濟(jì)學(xué)獎1996詹姆斯·莫里斯“for諾貝爾經(jīng)濟(jì)學(xué)獎2001

喬治·阿克爾洛夫（GeorgeA.Akerlof）生于1940年，美國加州大學(xué)伯克萊分校教授"fortheiranalysesofmarketswithasymmetricinformation"

邁克爾·斯賓塞

（A.MichaelSpence）生于1943年，美國加州斯坦福大學(xué)教授

約瑟夫·斯蒂格利茨（JosephE.Stiglitz）生于1943年，美國紐約哥倫比亞大學(xué)教授這三位作為不對稱信息市場理論的奠基人被授予諾貝爾經(jīng)濟(jì)學(xué)獎，以表彰他們分別在檸檬品市場等不對稱信息理論研究領(lǐng)域做出的基礎(chǔ)性貢獻(xiàn)。這些貢獻(xiàn)發(fā)展了博弈論的方法體系，拓寬了其經(jīng)濟(jì)解釋范圍。.114諾貝爾經(jīng)濟(jì)學(xué)獎2001喬治·諾貝爾經(jīng)濟(jì)學(xué)獎2002

丹尼爾·卡納曼(Da

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第8章演化博弈論課件

文檔簡介

溫馨提示

最新文檔

評論

第8章演化博弈論課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔