講義管理博弈論_第1頁
講義管理博弈論_第2頁
講義管理博弈論_第3頁
講義管理博弈論_第4頁
講義管理博弈論_第5頁
已閱讀5頁,還剩106頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

管理博弈論

(ManagementGameTheory)第1講博弈論概述及完全信息靜態(tài)博弈主講人:張成科博士廣東工業(yè)大學(xué)經(jīng)濟(jì)與貿(mào)易學(xué)院zhangck@本次講義提綱教材及參考書

本課程的主要內(nèi)容第一章博弈論概述本課程的教學(xué)目的第二章完全信息靜態(tài)博弈教材及參考書教材:張維迎,博弈論與信息經(jīng)濟(jì)學(xué),上海三聯(lián)書店,上海人民出版社.2001.主要參考書:

1.陶長琪主編信息經(jīng)濟(jì)學(xué),經(jīng)濟(jì)科學(xué)出版社.20012.謝識(shí)予,經(jīng)濟(jì)博弈論,復(fù)旦大學(xué)出版社,20013.侯光明,李存金,管理博弈論,北京理工大學(xué)出版社,20054.雷霖,現(xiàn)代企業(yè)經(jīng)營決策-博弈論方法應(yīng)用,清華大學(xué)出版社發(fā)行5.王則柯,新編博弈論平話,出版:中信出版社6.潘天群,博弈生存-社會(huì)現(xiàn)象的博弈論解讀,中央編譯出版社北京圖書發(fā)行7.王國成,企業(yè)治理結(jié)構(gòu)與企業(yè)家選擇-博弈論在企業(yè)組織行為選擇中的應(yīng)用,經(jīng)濟(jì)管理出版社8.姚國慶,21世紀(jì)高等院校經(jīng)濟(jì)學(xué)專業(yè)系列教材-博弈論,南開大學(xué)出9.jeantirole,經(jīng)濟(jì)科學(xué)譯叢-博弈論,中國人民大學(xué)出版社教材及參考書本課程的主要內(nèi)容第一章博弈論概述本課程的教學(xué)目的第二章完全信息靜態(tài)博弈內(nèi)容導(dǎo)航指針課程主要內(nèi)容簡介第一篇非合作博弈理論第一章緒論第二章完全信息靜態(tài)信息博弈-納什均衡第三章完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡第四章不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章不完全信息動(dòng)態(tài)博弈-精練貝葉斯納什均衡第二篇管理博弈論

第六章委托-代理理論(I)

第七章委托-代理理論(II)

第八章管理激勵(lì)與約束機(jī)制設(shè)計(jì)主要內(nèi)容簡介(續(xù))本課程的教學(xué)安排本課程的主要內(nèi)容第一章博弈論概述本課程的教學(xué)目的內(nèi)容導(dǎo)航指針第1章博弈論概述

§1博弈論與經(jīng)濟(jì)管理關(guān)于“博弈論”:博弈論是研究人們?cè)诶嫦嗷ビ绊懙母窬种械牟呗赃x擇問題、是研究多人決策問題的理論。而策略選擇是人們經(jīng)濟(jì)行為的核心內(nèi)容,此外,經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的:即強(qiáng)調(diào)個(gè)人理性,也就是在給定的約束條件下追求效用最大化??梢?,經(jīng)濟(jì)學(xué)和博弈論具有內(nèi)在的聯(lián)系。在經(jīng)濟(jì)學(xué)和博弈論具有的這種天然聯(lián)系的基礎(chǔ)上產(chǎn)生了經(jīng)濟(jì)博弈論。博弈論與經(jīng)濟(jì)管理諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者薩繆爾森有一句話:你可以將一只鸚鵡訓(xùn)練成一個(gè)經(jīng)濟(jì)學(xué)家,因?yàn)樗恍枰獙W(xué)習(xí)兩個(gè)詞:供給和需求。博弈論專家坎多瑞引申說:要成為現(xiàn)代經(jīng)濟(jì)學(xué)家,這只鸚鵡必須再多學(xué)一個(gè)詞,就是“納什均衡”。第1章博弈論概述

§1博弈論與經(jīng)濟(jì)管理將博弈的思想明確地應(yīng)用于經(jīng)濟(jì)領(lǐng)域,始于古諾(Cournot,1838)、伯特蘭德(Bertrand,1883)和艾奇沃斯(Edgeworth,1925)等人關(guān)于兩寡頭的產(chǎn)量和價(jià)格壟斷、產(chǎn)品交易行為的研究,他們通過對(duì)不同的經(jīng)濟(jì)行為方式和案例建立了相應(yīng)的博弈論模型,為經(jīng)濟(jì)博弈論的發(fā)展提供了思想雛形和有益嘗試。近半個(gè)多世紀(jì)以來,博弈論引起了眾多經(jīng)濟(jì)學(xué)家的極大興趣,使得博弈論在經(jīng)濟(jì)學(xué)中的應(yīng)用模型越來越多。大約從20世紀(jì)80年代開始,博弈論逐漸成為主流經(jīng)濟(jì)學(xué)的一部分,甚至可以說成為微觀經(jīng)濟(jì)學(xué)的基礎(chǔ)(張維迎,P8)。第1章博弈論概述

§1博弈論與管理學(xué)博弈論研究的是:給定信息結(jié)構(gòu),什么是可能的均衡結(jié)果?——是方法論導(dǎo)向的。管理博弈論是非對(duì)稱信息博弈論在管理學(xué)上的應(yīng)用。她研究的問題是:給定信息結(jié)構(gòu),什么樣的機(jī)制安排是最有效率的?——是問題導(dǎo)向的。什么是博弈?張維迎關(guān)于博弈論的定義——是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題的,也就是說,當(dāng)一個(gè)主體,好比說一個(gè)人或一個(gè)企業(yè)的選擇受到其他人、其他企業(yè)選擇的影響,而且反過來影響到其他人、其他企業(yè)選擇時(shí)的決策問題和均衡問題。

第1章博弈論概述施錫銓關(guān)于博弈論的定義分析在一群舉止行為頗具策略的理性人之間的相互作用的正規(guī)方法。博弈論關(guān)注的是互相依(interdependence)

每一個(gè)體猜測(cè)其他個(gè)體的選擇是什么?每個(gè)人將采取什么樣的行動(dòng)?(當(dāng)最優(yōu)的行動(dòng)依賴于其他人的所作所為時(shí),這個(gè)問題尤其令人關(guān)注。)

這些行動(dòng)產(chǎn)生什么樣的結(jié)局?對(duì)于整個(gè)群體,這個(gè)結(jié)局好嗎?如果群體不止一次地互相作用,會(huì)有任何差異嗎?如果每一個(gè)體對(duì)群體內(nèi)其他個(gè)體的特性沒有把握,答案將發(fā)生怎樣的變化?博弈論是考慮以下每一項(xiàng)條款的正規(guī)方法:群體——在任何博弈中有不止一個(gè)決策者;每一個(gè)決策者稱為局中人相互作用——任何單個(gè)局中人的行為直接影響到群體內(nèi)至少一個(gè)其他的局中人。策略——單個(gè)局中人在決定自己所取的行動(dòng)時(shí),會(huì)考慮到相互依存性。理性——在考慮到這種相互依存性時(shí),每一個(gè)局中人會(huì)選擇自己的最優(yōu)行動(dòng)。

什么是博弈?●張守一——是研究聰明而又理智的決策者在沖突或合作中的策略選擇理論?!馵美]RogerB.Myerson——博弈論可以被定義為是智能的理性決策者之間沖突與合作的數(shù)學(xué)模型的研究。第1章博弈論概述二、博弈論概述(一).什么是博弈?

博弈論模型是從人類社會(huì)的政治、經(jīng)濟(jì)、軍事等活動(dòng)中抽象出來的一種數(shù)學(xué)模型。在這種模型中首先要有參與人或局中人。參與人通過對(duì)于某些行動(dòng)的選擇行為體現(xiàn)對(duì)于該種活動(dòng)的參與。參與人的活動(dòng)要涉及自己和其他人的利益。這種利益一般不僅與自己的行動(dòng)有關(guān),特別與其他參與人的行動(dòng)選擇有關(guān)。博弈論主要研究參與人在這種理性行動(dòng)中的理性行為以及在所有參與人都采取理性行為的假設(shè)下博弈的最終結(jié)果。博弈論概述博弈論(gametheory,又譯為對(duì)策論)定義:研究決策主體的行為在直接相互作用時(shí),人們?nèi)绾芜M(jìn)行決策、以及這種決策如何達(dá)到均衡。開始于-馮.諾曼(VonNeumann)與摩根斯坦(Morgenstern)在1944年合作的《博弈論與經(jīng)濟(jì)行為》(TheTheoryofGamesandEconomicBehaciour)參與人:兩人及兩人以上;行為:做出決策;行為目標(biāo):收益最大化(或者最小化)環(huán)境條件:目標(biāo)的實(shí)現(xiàn)不僅取決于自己的行為,同時(shí)還取決于其他人的行為,個(gè)人的最優(yōu)選擇是其他人選擇的函數(shù)——策略性的行為。典型例子:高考報(bào)志愿博弈論概述

(一)什么是博弈論博弈論概述

(一)什么是博弈論注意兩點(diǎn):1、是兩個(gè)或兩個(gè)以上參與者之間的對(duì)策論當(dāng)魯濱遜在孤島上遇到了新上島的其他人,則就是博弈問題了!一般優(yōu)化問題與博弈問題的區(qū)別博弈模型與最優(yōu)化模型的本質(zhì)區(qū)別是什么?(靜態(tài))博弈問題:(靜態(tài))最優(yōu)化問題:博弈與優(yōu)化問題的本質(zhì)區(qū)別一美圓拍賣與“光滑斜坡”理論耶魯大學(xué)教授馬丁.舒比克設(shè)計(jì)的“陷阱游戲”:一名拍賣人拿出一張一美圓鈔票,請(qǐng)大家給這張鈔票開價(jià);每次叫價(jià)以10美分為單位,出價(jià)最高者和次高者都要向拍賣人支付相當(dāng)于出價(jià)數(shù)目的費(fèi)用。利用博弈規(guī)則設(shè)計(jì)獲取利益的經(jīng)典博弈模型

教授們?cè)谡n堂實(shí)驗(yàn)上跟毫無疑心的本科生們玩這個(gè)游戲,總是可以賺夠在教工食堂吃一頓午飯的錢。

你打算如何玩這個(gè)游戲?利用博弈規(guī)則設(shè)計(jì)獲取利益的經(jīng)典博弈模型第1章博弈論概述

§2

博弈論的基本概念1、參與人Players:一個(gè)博弈中的決策主體,他們各自的目的是通過選擇行動(dòng)(策略)以最大化自己的目標(biāo)函數(shù)/效用水平/支付函數(shù)。他們可以是自然人或團(tuán)體或法人,如企業(yè)、國家、地區(qū)、社團(tuán)、歐盟、北約等。那些不作決策或雖做決策但不直接承擔(dān)決策后果的被動(dòng)主體不是參與人,而只能當(dāng)做環(huán)境參數(shù)來處理。如指手劃腳的看牌人、看棋人,企業(yè)的顧問等。對(duì)參與人的決策來說,最重要的是必須有可供選擇的行動(dòng)集(策略集)和一個(gè)很好定義的支付函數(shù)。第1章博弈論概述

§2

博弈論的基本概念虛擬參與人(pseudo-player):指“自然”(nature)、“上帝”God,也即決定外生的隨機(jī)變量的概率分布的機(jī)制。“某事在人、成事在天”的“天”;如出遠(yuǎn)門去旅游,可能很開心,也可能很尷尬(生病住醫(yī)院),兩者概率分布90%、10%或98%與2%或其他,由上帝決定。在以后的討論中,我們記參與人為i,參與人集合記為T,即T={1,2,……,i,……,n},即該博弈中共有n個(gè)參與人;為了討論的方便,把某個(gè)參與人i之外的其他參與人稱為的i對(duì)手記為-i;N代表自然。第1章博弈論概述

§2

博弈論的基本概念*注意:博弈理論家一般對(duì)參與人做兩個(gè)基本的假設(shè)——參與人都是個(gè)體理性的和智能的理性的(rational)?1—如果一個(gè)決策者在追逐其目標(biāo)時(shí)能前后一致地做決策,就稱他為rational。RogerB·Myerson(P2)

2—廣義而言指的是一種行為方式,他同在給定條件或約束下最有效地實(shí)現(xiàn)預(yù)期目標(biāo)相關(guān)。第1章博弈論概述

§2

博弈論的基本概念智能的(intelligent)?

當(dāng)我們像博弈論專家那樣分析一個(gè)博弈時(shí),如果參與人知道我們對(duì)此博弈所知道的一切,并能做出我們對(duì)此博弈所能做出的一切推斷,我們就說此博弈的參與人是智能的。RogerB·Myerson(P3)第1章博弈論概述

§2

博弈論的基本概念2、策略(strategies):博弈中有兩種策略概念,一種為純策略(purestrategy),簡稱策略,指參與人在博弈中可以選擇采用的行動(dòng)(ac-tionsormoves)方案,是參與人在給定信息結(jié)構(gòu)的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候的什么情況下采取什么行動(dòng)。因而一個(gè)策略是參與人的一個(gè)“相機(jī)行動(dòng)方案”(contingentActionplan)。如“人不犯我…”、“按第一套方案行動(dòng)、實(shí)施第二套方案…”……,第1章博弈論概述

§2

博弈論的基本概念2、策略的描述記參與人i的一個(gè)策略為si,參與人i在一個(gè)博弈中的全部可供選擇的策略記為Si(策略集strategyset),即si∈Si

。

Si={s1,s2,…si

,…,sn},表示參與人i在該博弈中共有n個(gè)可行的策略。如果n個(gè)參與人每人從自己的Si中選擇一個(gè)策略si,則向量s=(s1,s2,﹍,si,﹍,sn)是一個(gè)策略組合(strategyprofile),參與人i之外的其他參與人的策略組合可記為s-i=(s1,s2,﹍,si-1,si+1,﹍,sn)。例如田忌的某個(gè)策略s田忌=上中下,或中下上,等等;S田忌={上中下,上下中,中上下,中下上,下上中,下中上}第1章博弈論概述

§2

博弈論的基本概念另一種策略概念是在純策略基礎(chǔ)上形成的混合策略(mixedstrategy)概念,參與人i的混合策略pi是他的純策略空間Si上的一種概率分布,表示參與人實(shí)際進(jìn)行決策時(shí)根據(jù)這種概率分布在純策略中隨機(jī)選擇加以實(shí)施。Pi(si)表示Pi分配給純策略si的的概率。如出門要否帶雨傘?天氣預(yù)報(bào)說有時(shí)有雨。猜拳?這是一個(gè)十分玄乎的概念,讓人不容易理解,它是一種不確定,采用這種策略的目的就是讓對(duì)方琢磨不透,實(shí)施時(shí)似乎由一架隨機(jī)機(jī)器在操作。隨機(jī)策略randomizedstrategy

純策略是混合策略的特例?第1章博弈論概述

§2

博弈論的基本概念*注意:

1、策略與行動(dòng)是兩個(gè)不同的概念,策略是行動(dòng)的規(guī)則而不是行動(dòng)本身?;仡櫋胺概c不犯”的問題。在靜態(tài)博弈中,由于參與人同時(shí)行動(dòng),沒有人能掌握他人的之前行動(dòng)的信息,故沒有可針對(duì)的行動(dòng),從而策略的選擇就變成了行動(dòng)的選擇,即策略和行動(dòng)是同一的。行動(dòng)集Aiai

2、作為一種行動(dòng)規(guī)則,策略必須是完備的,就是說,策略要給出參與人在每一種可能想象到的情況下的行動(dòng)選擇,即使參與人并不預(yù)期這種情況會(huì)實(shí)際發(fā)生?!俺笤捳f在前-----”第1章博弈論概述

§2

博弈論的基本概念3、支付(payoffs):參與人從各種策略組合中獲得的收益。收益往往采用效用(utility)概念。它或者是一個(gè)特定策略組合下某個(gè)參與人得到的確定效用水平,或者是期望效用水平。它是策略組合的函數(shù),所以也稱支付函數(shù)(payofffunction),記為ui(s),ui(s)=ui(s1,s2…,si

,…sn-1,sn).第1章博弈論概述

§2

博弈論的基本概念*注意1:博弈的一個(gè)基本特征是一個(gè)參與人的支付不僅取決于自己的策略選擇,而且取決于所有其他參與人的策略選擇;是策略組合的函數(shù)。

2:支付是參與人真正關(guān)心的東西,參與人在博弈中的目標(biāo)就是選擇自己的策略以最大化自己的支付函數(shù)。第1章博弈論概述

§2

博弈論的基本概念一個(gè)博弈中,明確了以上三個(gè)概念,該博弈的基本框架就形成了,故稱為博弈的三個(gè)基本要素。一個(gè)具體博弈界定,還須明確行動(dòng)的順序和有關(guān)的信息。4、行動(dòng)的順序(theorderofplay):博弈中參與人實(shí)施決策活動(dòng)的順序。同時(shí)或有先有后。其他因素不變,但順序不同,參與人的最優(yōu)選擇就不同,博弈的結(jié)果也不同。事實(shí)上,同的順序安排意味著不同的博弈。靜態(tài)博弈和動(dòng)態(tài)博弈。第1章博弈論概述

§2

博弈論的基本概念5、信息(information):指一個(gè)博弈中參與人有關(guān)該博弈的知識(shí),如關(guān)于N的選擇、其他參與人的策略集、支付函數(shù)、行動(dòng)時(shí)間等.博弈論中關(guān)于信息的具體概念有:●信息集(informationset)—主要出現(xiàn)在動(dòng)態(tài)博弈中,可理解為參與人在特定時(shí)刻上對(duì)有關(guān)變量的值的知識(shí);一個(gè)參與人無法準(zhǔn)確知道的變量的全體屬于一個(gè)信息集。買古董。第1章博弈論概述

§2

博弈論的基本概念●完美信息(perfectinformation):指一個(gè)參與人對(duì)其他參與人(包括N)的行動(dòng)選擇有準(zhǔn)確了解的情況,即一個(gè)信息集只包含一個(gè)值。動(dòng)態(tài)博弈的概念。●完全信息(completeinformation):指N不首先行動(dòng)或N的初始行動(dòng)被所有的參與人準(zhǔn)確觀察到的情,即沒有事前的不確定性。完全信息意味著各個(gè)參與人的支付函數(shù)是共同知識(shí)。顯然,不完全(incomplete)信息意味著不完美(imperfect)信息。第1章博弈論概述

§2

博弈論的基本概念●共同知識(shí)(commonknowledge)是與信息有關(guān)的一個(gè)重要概念。如聽過某個(gè)老師的課,學(xué)生認(rèn)識(shí)老師,但老師不一定就記住該學(xué)生,路上碰在一塊了,學(xué)生會(huì)不會(huì)叫老師呢?也許學(xué)生會(huì)以為老師不認(rèn)識(shí)他,打招呼會(huì)把老師弄得莫名其妙。解釋一:共同知識(shí)指“所有參與人知道,所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人知道…”。

解釋二:如果每個(gè)參與人都知道某個(gè)事實(shí),每個(gè)參與人都知道每個(gè)參與人都知道它,如此等等,從而形如“(每個(gè)參與人都知道)k每個(gè)參與人都知道它”的語句對(duì)k=0,1,2,…都是正確的,那我們就稱這個(gè)事實(shí)為參與人中間的共同知識(shí)。第1章博弈論概述

§2

博弈論的基本概念●私人信息(privateinformation):指任何一個(gè)他擁有但不是該博弈中所有參與人共同知識(shí)的信息。由于存在私人信息,便有了信息不對(duì)稱的問題。第1章博弈論概述

§2

小結(jié)博弈論的基本概念包括:參與人:博弈論中選擇行動(dòng)以最大化自己效用的決策主體;行動(dòng):參與人的決策變量戰(zhàn)略:參與人選擇行動(dòng)的規(guī)則信息:參與人在博弈中的知識(shí),特別是有關(guān)其他參與人的特征和行動(dòng)的知識(shí)支付函數(shù):參與人從博弈中獲得的效用水平

結(jié)果:博弈分析真正感興趣的要素的集合均衡:所有參與人的最優(yōu)戰(zhàn)略的組合參與人、行動(dòng)、結(jié)果稱為博弈規(guī)則;博弈分析的目的是使用博弈規(guī)則決定均衡。第1章博弈論概述

§3

博弈論的分類分類是一種深化認(rèn)識(shí)的方法。博弈可以根據(jù)不同的標(biāo)志從不同的角度進(jìn)行多種分類。通過分類我們將對(duì)博弈有進(jìn)一步的了解,同時(shí)對(duì)博弈理論的結(jié)構(gòu)體系有初步的認(rèn)識(shí)。1、按參與人的多少分:單人博弈和多人博弈第1章博弈論概述

§3

博弈論的分類2、按策略空間是否有限分:有限策略博弈和無限策略博弈3、按各策略組合下參與人支付之和情況分:零和博弈、常和博弈和變和博弈。第1章博弈論概述

§3

博弈論的分類4按參與人行動(dòng)的先后順序:靜態(tài)博弈和動(dòng)態(tài)博弈靜態(tài)博弈:參與人同時(shí)選擇行動(dòng)或非同時(shí)行動(dòng)但后行動(dòng)者并不知道前行動(dòng)者采取了什么具體行動(dòng);動(dòng)態(tài)博弈:參與人行動(dòng)有先后順序,且后行動(dòng)者能夠觀察先行動(dòng)者選擇的行動(dòng)。第1章博弈論概述

§3

博弈論的分類參與人對(duì)其他參與人(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)的知識(shí):完全信息博弈和不完全信息博弈。完全信息:每一個(gè)參與人對(duì)所有其他參與人的(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí),否則為不完全信息。第1章博弈論概述

§3

博弈論的分類5、按信息是否完全分:完全信息博弈和不完全信息博弈6、按信息是否完美分(動(dòng)態(tài)博弈):完美信息動(dòng)態(tài)博弈和不完美信息動(dòng)態(tài)博弈第1章博弈論概述

§3

博弈論的分類博弈理論體系的結(jié)構(gòu)框架按下面博弈類型安排:

行動(dòng)順序信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950,1951)完全信息動(dòng)態(tài)博弈子博弈精練納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)不完全信息動(dòng)態(tài)博弈精練貝葉斯納什均衡澤爾騰(1965)Kreps

和Wilson(1982)Fudenberg

和Tirole(1991)第1章博弈論概述

§4

博弈論研究著名學(xué)者因?qū)Σ┺恼撗芯孔鞒鼋艹鲐暙I(xiàn)而獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的經(jīng)濟(jì)學(xué)家:●納什(Nash):Nash-Equilibrium●塞爾藤(Selten):Subgame-PerfectNashE---●海薩尼(Harsanyi):Bayes-NashEquilibrium1994●維克利、莫里斯1996博弈論大師Nash第1章博弈論概述

§4

博弈論研究著名學(xué)者●邁克爾·斯賓斯(Spence):1948年生于美國的新澤西,1972年獲哈佛大學(xué)博士頭銜,現(xiàn)兼任美國哈佛和斯坦福兩所大學(xué)經(jīng)濟(jì)學(xué)教授?!駟讨巍ぐ⒖藸柭宸颍?940年生于美國的紐黑文,1966年獲美國麻省理工學(xué)院博士頭銜,現(xiàn)為美國加利福尼亞大學(xué)經(jīng)濟(jì)學(xué)教授?!窦s瑟夫·斯蒂格利茨,1948年生于美國的印第安納州,1967年獲美國麻省理工學(xué)院博士頭銜,曾任世界銀行的首席經(jīng)濟(jì)學(xué)家,現(xiàn)任美國哥倫比亞大學(xué)經(jīng)濟(jì)學(xué)教授。第1章博弈論概述

§4

博弈論研究著名學(xué)者

2001年三人同獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),分享1000萬瑞典克郎(94.3萬美元)的獎(jiǎng)金。他們“發(fā)展并研究了市場(chǎng)信息不對(duì)稱的問題,揭示了當(dāng)代信息經(jīng)濟(jì)的核心”。阿克爾洛夫是最早發(fā)現(xiàn)信息不對(duì)稱的學(xué)者之一。阿克爾洛夫最大的貢獻(xiàn)是解釋了在發(fā)展中國家里,信貸市場(chǎng)信息的不對(duì)稱導(dǎo)致了這些國家信貸市場(chǎng)的過高利息。此外,阿克爾洛夫還把信息不對(duì)稱運(yùn)用于解釋各種社會(huì)問題,比如因?yàn)樾畔⒉粚?duì)稱,醫(yī)療保險(xiǎn)市場(chǎng)上,老年人、個(gè)體勞動(dòng)者的醫(yī)療保險(xiǎn)利益得不到保障。第1章博弈論概述

典型博弈模型-囚徒困境案例1-囚徒困境-納什均衡

-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴-8大于-100大于-1(坦白,坦白)是納什均衡第1章博弈論概述

典型博弈模型-囚徒困境設(shè)定:(1)每個(gè)局中人都知道博弈規(guī)則和博弈結(jié)果的支付矩陣;(2)每個(gè)局中人都是理性的(個(gè)人理性和個(gè)人最優(yōu)決策);(3)不能“串通”第1章博弈論概述

典型博弈模型-囚徒困境通俗地講:

納什均衡的含義是:給定別人戰(zhàn)略情況下,沒有任何單個(gè)參與人有積極性選擇其他戰(zhàn)略,從而沒有人有積極性打破這種均衡。第1章博弈論概述

典型博弈模型-囚徒困境兩個(gè)寡頭企業(yè)選擇產(chǎn)量的博弈:

如果兩個(gè)企業(yè)聯(lián)合起來形成卡特爾,選擇壟斷利潤最大化的產(chǎn)量,每個(gè)企業(yè)都可以得到更多的利潤。給定對(duì)方遵守協(xié)議的情況下,每個(gè)企業(yè)都想增加產(chǎn)量,結(jié)果是,每個(gè)企業(yè)都只得到納什均衡產(chǎn)量的利潤,它嚴(yán)格小于卡特而產(chǎn)量下的利潤。請(qǐng)舉幾個(gè)囚徒困境的例子第1章博弈論概述

典型博弈模型-囚徒困境同樣的情形發(fā)生在:公共產(chǎn)品的供給美蘇軍備競(jìng)賽經(jīng)濟(jì)改革中小學(xué)生減負(fù)……第1章博弈論概述

典型博弈模型-囚徒困境囚徒困境的性質(zhì):個(gè)人理性和集體理性的矛盾;個(gè)人的“最優(yōu)策略”使整個(gè)“系統(tǒng)”處于不利的狀態(tài)。思考:為什么會(huì)造成囚徒困境是否由于“通訊”問題造成了囚徒困境?“要害”是否在于“利己主義”即“個(gè)人理性”?是否囚徒困境的結(jié)果就一定不利?第1章博弈論概述

典型博弈模型-囚徒困境結(jié)論:人類自私的天性,使他們陷入“囚徒困境”,難以自拔。

解決囚徒困境問題的“出路”“解決個(gè)人理性和集體理性之間沖突的辦法不是否認(rèn)個(gè)人理性,而是設(shè)計(jì)一種機(jī)制,在滿足個(gè)人理性的前提下達(dá)到集體理性”;“一種制度安排,要發(fā)生效力,必須是一種納什均衡。否則,這種制度安排便不能成立”。囚徒困境的效果在不同情況下對(duì)社會(huì)而言可能是“負(fù)面”的,也可能是“正面”的。本課程的教學(xué)安排本課程的主要內(nèi)容博弈論概述本課程的教學(xué)目的內(nèi)容導(dǎo)航指針學(xué)習(xí)本課程的目的

張維迎認(rèn)為:“近幾十年來,經(jīng)濟(jì)學(xué)一直在為其他學(xué)科提供武器,但恐怕沒有任何其他工具比博弈論更有力了”。博弈論可以:引導(dǎo)學(xué)生運(yùn)用書中介紹的理論分析現(xiàn)實(shí)的經(jīng)濟(jì)現(xiàn)象擴(kuò)大學(xué)生的知識(shí)面開闊思路和思維模式博弈論成為目前研究“熱點(diǎn)”一、以博弈論為方法或工具的研究狀況博弈論作為一種研究方法和工具,已經(jīng)在各個(gè)領(lǐng)域得到了廣泛的應(yīng)用,尤其是在經(jīng)濟(jì)學(xué)領(lǐng)域,從1944年Neumann和Morgenstern出版第一本關(guān)于經(jīng)濟(jì)博弈論的著作《TheoryofGameandEconomicBehavior》,到1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予博弈論專家JohnNash、Reinhard

Selten和JohnHarsanyi,奠定了博弈論在經(jīng)濟(jì)學(xué)中的地位。2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)再次授予博弈論專家RobertJ.Aumann和ThomasC.Schelling,由此更引發(fā)了專家學(xué)者對(duì)博弈理論及其應(yīng)用研究的關(guān)注。管理科學(xué)有工程研究熱點(diǎn)之一目前,博弈理論已在經(jīng)濟(jì)學(xué)領(lǐng)域以及管理科學(xué)與工程、控制理論與控制工程等學(xué)科方向得到了廣泛的應(yīng)用。文獻(xiàn)[1]以1994~2004年國內(nèi)外與管理科學(xué)與工程學(xué)科相關(guān)的論文文獻(xiàn)計(jì)量研究表明,“管理博弈論與模型”已經(jīng)成為管理科學(xué)與工程學(xué)科排名第4的“熱點(diǎn)領(lǐng)域”[1]。通過國家自然科學(xué)基金資助項(xiàng)目查詢發(fā)現(xiàn),國內(nèi)學(xué)者針對(duì)理論與實(shí)際問題提出了許多項(xiàng)目研究,取得了豐富的成果。

獲國家自然科學(xué)基金資助項(xiàng)目多通過國家自然科學(xué)基金網(wǎng)站“資助項(xiàng)目”查尋,從2000年到2007年,共資助與博弈論有關(guān)的項(xiàng)目68項(xiàng)!如南京大學(xué)的周晶教授連續(xù)獲得三項(xiàng)資助,最近兩項(xiàng)分別為:“競(jìng)爭(zhēng)環(huán)境下的收益管理博弈模型與決策分析”“基于博弈模型的城市交通供需耦合平衡機(jī)理及控制研究”。國家自然科學(xué)基金資助的部分項(xiàng)目情況(I)首都經(jīng)濟(jì)貿(mào)易大學(xué)的劉黎明教授研究了“財(cái)政體制的博弈分析”;重慶大學(xué)的蒲勇健教授“用博弈論方法研究國企債轉(zhuǎn)股中的互動(dòng)行為和政策效應(yīng)”;武漢大學(xué)的丁煌教授進(jìn)行了“新體制下公共政策的博弈論研究”;南京大學(xué)的肖條軍教授開展了“基于演化博弈理論的企業(yè)行為與組織模式研究”和“需求不確定性環(huán)境下供應(yīng)鏈管理的博弈模型研究”;上海交通大學(xué)的席裕庚教授開展了“基于非合作博弈的多目標(biāo)生產(chǎn)調(diào)度研究”;南京大學(xué)的盛昭瀚教授研究了“基于博弈學(xué)習(xí)理論的企業(yè)組織治理演化理論”;國家自然科學(xué)基金資助的部分項(xiàng)目情況(II)清華大學(xué)的林旭東教授“基于動(dòng)態(tài)博弈研究電子市場(chǎng)價(jià)格演化、信息價(jià)值與效率問題”;北京工業(yè)大學(xué)的李振龍教授研究了“城市交通網(wǎng)絡(luò)擁塞控制的博弈模型及其優(yōu)化”;華中科技大學(xué)的薛明皋教授開展了“R&D聯(lián)盟的期權(quán)博弈理論評(píng)估模型及實(shí)證研究”;東南大學(xué)的陶軍教授開展了“基于博弈理論的非合作網(wǎng)絡(luò)QoS分配中關(guān)鍵技術(shù)的研究”等等。這些研究極大地豐富和發(fā)展了博弈論方法體系、拓展了博弈論的應(yīng)用領(lǐng)域、為社會(huì)經(jīng)濟(jì)發(fā)展作出了應(yīng)有的貢獻(xiàn)。在對(duì)博弈理論的自身發(fā)展和完善研究方面,國內(nèi)外學(xué)者也開展了研究,如:DavidW.K.Yeung和LeonA.Petrosyan研究了“合作隨機(jī)微分博弈(CooperativeStochasticDifferentialGames)[2];A.Cincotti和H.Iida用信息熵思想研究了結(jié)局不確定的博弈模型及其相應(yīng)的博弈均衡策略[3];四川大學(xué)的劉光中教授對(duì)多維博弈理論及其應(yīng)用進(jìn)行了研究;北京交通大學(xué)的修乃華教授進(jìn)行了“廣義非合作博弈的均衡和優(yōu)化算法研究”;武漢大學(xué)的王先甲教授開展了“進(jìn)化博弈中基于粒子群優(yōu)化與擬生滅過程的智能體有限理性進(jìn)化與合作機(jī)制研究”;貴州大學(xué)的向淑文教授對(duì)廣義信息集與若干博弈問題開展了研究等等。我本人所承擔(dān)的廣東省哲學(xué)社科規(guī)劃項(xiàng)目“城市區(qū)域經(jīng)濟(jì)競(jìng)合研究:基于戰(zhàn)略網(wǎng)絡(luò)的城市博弈理論和方法(No.03/04C2—05)”關(guān)鍵詞:博弈論1999—2005/全部數(shù)據(jù)/114

/114

序號(hào)篇名作者刊名年/期1基于委托人-代理人關(guān)系的患者就醫(yī)行為研究張帆上海理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2005/042基于價(jià)格折扣策略的供需協(xié)調(diào)模型楊皎平科技管理研究2005/113托馬斯·謝林對(duì)博弈論的貢獻(xiàn)劉安國經(jīng)濟(jì)學(xué)動(dòng)態(tài)2005/124指向合作與和諧的理論——2005年度諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主學(xué)術(shù)貢獻(xiàn)評(píng)介周鵬經(jīng)濟(jì)學(xué)動(dòng)態(tài)2005/1252005年度諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)新聞公報(bào)劉安國經(jīng)濟(jì)學(xué)動(dòng)態(tài)2005/106經(jīng)營者聲譽(yù)與國有企業(yè)的經(jīng)營績效——一種博弈論的分析視角李軍林經(jīng)濟(jì)學(xué)動(dòng)態(tài)2005/107評(píng)《開放經(jīng)濟(jì)與中國產(chǎn)業(yè)組織研究》黃泰巖經(jīng)濟(jì)學(xué)動(dòng)態(tài)2005/088對(duì)非法煤礦監(jiān)控的博弈分析李新光廣州市經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào)2005/039中央與地方政府基礎(chǔ)設(shè)施投資的博弈分析王麗麗東南大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版)2005/S110夏普利值在產(chǎn)學(xué)研合作利益分配中的應(yīng)用舒尚奇中國市場(chǎng)2005/3911海域使用監(jiān)察的博弈分析李權(quán)昆漁業(yè)經(jīng)濟(jì)研究2005/0112激勵(lì)制度中的聲譽(yù)激勵(lì)陳靜工業(yè)技術(shù)經(jīng)濟(jì)2005/09132005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲獎(jiǎng)?wù)咧饕暙I(xiàn)杜丹嘉興學(xué)院學(xué)報(bào)2005/S214不打非理性的價(jià)格戰(zhàn)梁小民英才2005/12共有記錄2266條

首頁上頁下頁末頁共有記錄2266條

首頁上頁下頁末頁在中國期刊網(wǎng)上用“博弈論”作關(guān)鍵詞的查尋結(jié)果第二章完全信息靜態(tài)信息博弈-納什均衡一博弈的戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復(fù)剔除的占優(yōu)均衡四納什均衡五納什均衡應(yīng)用舉例一博弈的戰(zhàn)略表述案例-房地產(chǎn)開發(fā)項(xiàng)目-假設(shè)有A、B兩家開發(fā)商市場(chǎng)需求:可能大,也可能小投入:1億假定市場(chǎng)上有兩棟樓出售:需求大時(shí),每棟售價(jià)1.4億,需求小時(shí),售價(jià)7千萬;如果市場(chǎng)上只有一棟樓需求大時(shí),可賣1.8億需求小時(shí),可賣1.1億一、博弈的戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述一、博弈的基本概念及戰(zhàn)略表述博弈論的基本概念包括:參與人:博弈論中選擇行動(dòng)以最大化自己效用的決策主體;行動(dòng):參與人的決策變量戰(zhàn)略:參與人選擇行動(dòng)的規(guī)則信息:參與人在博弈中的知識(shí),特別是有關(guān)其他參與人的特征和行動(dòng)的知識(shí)支付函數(shù):參與人從博弈中獲得的效用水平

結(jié)果:博弈分析真正感興趣的要素的集合均衡:所有參與人的最優(yōu)戰(zhàn)略的組合參與人、行動(dòng)、結(jié)果稱為博弈規(guī)則;博弈分析的目的是使用博弈規(guī)則決定均衡。一、博弈的基本概念及戰(zhàn)略表述參與人:博弈論中選擇行動(dòng)以最大化自己效用的決策主體??梢允亲匀蝗?,也可以是團(tuán)體,如企業(yè)、國家甚至由若干國家組成的集團(tuán)(OPEC、歐盟等)。虛擬參與人:“自然”作為虛擬參與人自然:指決定外生的隨機(jī)變量的機(jī)制為分析方便引入,自然作為虛擬參與人沒有自己的支付和目標(biāo)函數(shù)(即所有結(jié)果對(duì)它是無差異的)參與人決策的后果依賴于自然的選擇。在不完全信息博弈中,自然選擇參與人的類型一、博弈的基本概念及戰(zhàn)略表述行動(dòng):參與人在某個(gè)時(shí)點(diǎn)的決策變量Ai表示第i個(gè)參與人的一個(gè)特定行動(dòng)行動(dòng)的順序:行動(dòng)的順序?qū)τ诓┺牡慕Y(jié)果是非常重要的,事實(shí)上,不同的行動(dòng)順序意味著不同的博弈。在博弈論中,一般假設(shè)參與人的行動(dòng)空間和行動(dòng)順序是所有參與人的共同知識(shí)。一、博弈的基本概念及戰(zhàn)略表述信息:參與人在博弈中的知識(shí),特別是有關(guān)其他參與人的特征和行動(dòng)的知識(shí)。如房地產(chǎn)開發(fā)博弈中,如果A不知道市場(chǎng)需求,而B知道,則A的信息集為{大,小},B的信息集為{大}或{小}完美信息:指一個(gè)參與人對(duì)其他參與人(包括“自然”)的行動(dòng)選擇有準(zhǔn)確了解的情況,即每一個(gè)信息集只包含一個(gè)值。完全信息:指自然不首先行動(dòng)或自然的行動(dòng)的初始行動(dòng)所有參與人觀察到的情況。共同知識(shí):指“所有參與人知道所有參與人知道所有參與人知道….”的知識(shí)。一、博弈的基本概念及戰(zhàn)略表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動(dòng)的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動(dòng),是參與人的“相機(jī)行動(dòng)方案”。在靜態(tài)博弈中,戰(zhàn)略和行動(dòng)是相同的。作為一種行動(dòng)規(guī)則,戰(zhàn)略必須是完備的。一、博弈的基本概念及戰(zhàn)略表述支付函數(shù):參與人從博弈中獲得的效用水平,或者指參與人得到的期望效用水平。博弈的基本特征是一個(gè)參與人的支付不僅取決于自己的戰(zhàn)略選擇,而且取決于所有其他參與人的戰(zhàn)略選擇一、博弈的基本概念及戰(zhàn)略表述結(jié)果:博弈分析感興趣的所有東西如均衡戰(zhàn)略組合、均衡行動(dòng)組合、均衡支付組合等。一、博弈的基本概念及戰(zhàn)略表述均衡:所有參與人的最優(yōu)戰(zhàn)略的組合一般記為:一、博弈的基本概念及戰(zhàn)略表述博弈的戰(zhàn)略式表述:一、博弈的基本概念及戰(zhàn)略表述寡頭產(chǎn)量博弈中,企業(yè)是參與人,產(chǎn)量是戰(zhàn)略空間,利潤是支付;戰(zhàn)略式表述博弈為:第2章完全信息靜態(tài)信息博弈-納什均衡一博弈的基本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復(fù)剔除的占優(yōu)均衡四納什均衡五納什均衡應(yīng)用舉例二占優(yōu)戰(zhàn)略均衡案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴-8大于-100大于-1-8大于-100大于-1抵賴是A的嚴(yán)格劣戰(zhàn)略抵賴是B的嚴(yán)格劣戰(zhàn)略二占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略:不論其他人選擇什么戰(zhàn)略,參與人的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略稱為“占優(yōu)戰(zhàn)略”(dominantstrategy)。二占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略均衡定義:在博弈的戰(zhàn)略表達(dá)式中,如果對(duì)于所有的i,Si*是i的占優(yōu)戰(zhàn)略,下列戰(zhàn)略組合稱為占優(yōu)戰(zhàn)略均衡:二占優(yōu)戰(zhàn)略均衡注意:如果所有人都有(嚴(yán)格)占優(yōu)戰(zhàn)略存在,那么占優(yōu)戰(zhàn)略均衡就是可以預(yù)測(cè)的唯一均衡。占優(yōu)戰(zhàn)略只要求每個(gè)參與人是理性的,而不要求每個(gè)參與人知道其他參與人是理性的(也就是說,不要求理性是共同知識(shí))。為什么?二占優(yōu)戰(zhàn)略均衡4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述A嚴(yán)格劣戰(zhàn)略B嚴(yán)格劣戰(zhàn)略

5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈等待是小豬的嚴(yán)格占優(yōu)戰(zhàn)略大豬有無嚴(yán)格占優(yōu)戰(zhàn)略?4大于10大于-1第2章完全信息靜態(tài)信息博弈-納什均衡一博弈的基本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復(fù)剔除的占優(yōu)均衡四納什均衡五納什均衡應(yīng)用舉例三重復(fù)剔除的占優(yōu)均衡重復(fù)剔除嚴(yán)格劣戰(zhàn)略:思路:首先找到某個(gè)參與人的劣戰(zhàn)略(假定存在),把這個(gè)劣戰(zhàn)略剔除掉,重新構(gòu)造一個(gè)不包含已剔除戰(zhàn)略的新的博弈,然后再剔除這個(gè)新的博弈中的某個(gè)參與人的劣戰(zhàn)略,一直重復(fù)這個(gè)過程,直到只剩下唯一的戰(zhàn)略組合為止。這個(gè)唯一剩下的戰(zhàn)略組合就是這個(gè)博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)均衡”。三重復(fù)剔除的占優(yōu)均衡注意:

與占優(yōu)戰(zhàn)略均衡中的占優(yōu)戰(zhàn)略和劣戰(zhàn)略不同,這里的占優(yōu)戰(zhàn)略或劣戰(zhàn)略可能只是相對(duì)于另一個(gè)特定戰(zhàn)略而言。三重復(fù)剔除的占優(yōu)均衡

5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈按是小豬的嚴(yán)格劣戰(zhàn)略-剔除4大于10大于-1“按”是大豬的占優(yōu)戰(zhàn)略,納什均衡:大豬按,小豬等待三重復(fù)剔除的占優(yōu)均衡重復(fù)剔除的占優(yōu)均衡戰(zhàn)略組合稱為重復(fù)剔除的占優(yōu)均衡,如果它是重復(fù)剔除劣戰(zhàn)略后剩下的唯一戰(zhàn)略組合。如果這種唯一戰(zhàn)略組合是存在的,我們就說該博弈是重復(fù)剔除占優(yōu)可解。注意:如果重復(fù)剔除后的戰(zhàn)略組合不唯一,該博弈就不是重復(fù)剔除占優(yōu)可解的。三重復(fù)剔除的占優(yōu)均衡1,01,20,30,1M列先生行先生UDL0,12,0R行:沒有占優(yōu)戰(zhàn)略列:M嚴(yán)格優(yōu)于R剔除R行:L優(yōu)于D列:無占優(yōu)戰(zhàn)略剔除DM優(yōu)于L(U,M)是重復(fù)剔除的占優(yōu)均衡三重復(fù)剔除的占優(yōu)均衡練習(xí):在下列戰(zhàn)略式表達(dá)中,找出重復(fù)剔除的占優(yōu)均衡4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R3三重復(fù)剔除的占優(yōu)均衡注意:1、重復(fù)剔除的占優(yōu)均衡結(jié)果與劣戰(zhàn)略的剔除順序是否有關(guān)取決于剔除的是否是嚴(yán)格劣戰(zhàn)略。2、重復(fù)剔除的占優(yōu)均衡要求每個(gè)參與人是理性的,而且要求“理性”是參與人的共同知識(shí)。即:所有參與人知道所有參與是理性的,所有參與人知道所有參與人知道所有參與是理性的三重復(fù)剔除的占優(yōu)均衡2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除順序:R3、C3、C2、R2使用劣戰(zhàn)略剔除,可以看到(R1,C3)是重復(fù)剔除劣戰(zhàn)略均衡。舉例:三重復(fù)剔除的占優(yōu)均衡2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除順序:C2、R2、C1、R3戰(zhàn)略組合(R1,C3)是重復(fù)剔除劣戰(zhàn)略均衡。兩者不一樣。若使用嚴(yán)格劣戰(zhàn)略剔除,可以看到,(R1,C3)(R1,C1)都兩個(gè)留下的戰(zhàn)略組合,不唯一,因此在這里是不可解的。舉例:三重復(fù)剔除的占優(yōu)均衡盡管許多博弈中重復(fù)剔除的占優(yōu)均衡是一個(gè)合理的預(yù)測(cè),但并不總是如此,尤其是大概支付某些極端值的時(shí)候。8,10-1000,97,66,5參與人B參與人AUDLRU是A的最優(yōu)選擇,但是,只要有1/1000的概率B選R,A就會(huì)選D四納什均衡定義:在有n個(gè)參與人的戰(zhàn)略式表述博弈G={S1,S2,…,Sn;u1,u2,…,un}中,戰(zhàn)略組合s*=(s1*,s2*,…,

sn*)是一個(gè)納什均衡,如果對(duì)于每一個(gè)i,si*是給定其他參與人的選擇s-i*=(s1*,…,si-1*,si+1*,…,sn*)的情況下第i個(gè)人的最優(yōu)戰(zhàn)略,即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論