




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、博弈論與信息經(jīng)濟學(xué)模型講解(Game Theory and Information Economics ) 前言本課程的教學(xué)安排 本課程的主要內(nèi)容博弈論概述本課程的教學(xué)目的講課及考核方式學(xué)科屬性:公共選修課學(xué)時/學(xué)分:30/1 預(yù)修課程:微觀經(jīng)濟學(xué)講課及考核方式講課:課堂講授+討論考試:考勤:10分 討論、作業(yè):30分 答卷:60分 共計:100分 預(yù)期時間安排預(yù)期時間安排:2月21日開始 每周二3-4節(jié) 課時:30學(xué)時 教材及參考書教材:張維迎,博弈論與信息經(jīng)濟學(xué),上海三聯(lián)書店,上海人民出版社.1996.主要參考書: 1.潘天群,博弈生存-社會現(xiàn)象的博弈論解讀,中央編譯出版社北京圖書發(fā)行2雷
2、霖,現(xiàn)代企業(yè)經(jīng)營決策-博弈論方法應(yīng)用,清華大學(xué)出版社發(fā)行3王則柯,新編博弈論平話,出版:中信出版社4白波,博弈游戲,哈爾濱出版社5王國成,企業(yè)治理結(jié)構(gòu)與企業(yè)家選擇-博弈論在企業(yè)組織行為選擇中的應(yīng)用,經(jīng)濟管理出版社6姚國慶,21世紀(jì)高等院校經(jīng)濟學(xué)專業(yè)系列教材-博弈論,南開大學(xué)出7. jean tirole,經(jīng)濟科學(xué)譯叢-博弈論,中國人民大學(xué)出版社前言本課程的教學(xué)安排 本課程的主要內(nèi)容博弈論概述本課程的教學(xué)目的主要內(nèi)容簡介第一章 概述-人生處處皆博弈第一篇 非合作博弈理論第二章 完全信息靜態(tài)信息博弈-納什均衡第三章 完全信息動態(tài)搏弈-子博弈精煉納什均衡第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡第五
3、章 不完全信息動態(tài)博弈-精練貝葉斯納什均衡第二篇 信息經(jīng)濟學(xué) 第六章 委托-代理理論(I) 第七章 委托-代理理論(II) 第八章 逆向選擇與信號傳遞 主要內(nèi)容簡介前言本課程的教學(xué)安排 本課程的主要內(nèi)容博弈論概述本課程的教學(xué)目的主要內(nèi)容簡介第一章 概述-人生處處皆博弈第一篇 非合作博弈理論第二章 完全信息靜態(tài)信息博弈-納什均衡第三章 完全信息動態(tài)搏弈-子博弈精煉納什均衡第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章 不完全信息動態(tài)博弈-精練貝葉斯納什均衡第一章 概述-人生處處皆博弈人生是永不停歇的博弈過程,博弈意略達(dá)到合意的結(jié)果。作為博弈者,最佳策略是最大限度地利用游戲規(guī)則,最大化自己的利益
4、;作為社會最佳策略,是通過規(guī)則使社會整體福利增加。第一章 概述-人生處處皆博弈-定義博弈論(game theory,又譯為對策論,游戲論)定義:研究決策主體的行為在直接相互作用時,人們?nèi)绾芜M(jìn)行決策、以及這種決策如何達(dá)到均衡。開始于-馮.諾曼(Von Neumann)與摩根斯坦(Morgenstern)在1944年合作的博弈論與經(jīng)濟行為(The Theory of Games and Economic Behaciour)第一章 概述-人生處處皆博弈注意兩點:1、是兩個或兩個以上參與者之間的對策論當(dāng)魯濱遜遇到了“星期五”石匠的決策與拳擊手的決策的區(qū)別第一章 概述-人生處處皆博弈2、理性人假設(shè)理性
5、人是指一個很好定義的偏好,在面臨定的約束條件下最大化自己的偏好。 博弈論說起來有些繞嘴,但理解起來很好理解,那就是每個對弈者在決定采取哪種行動時,不但要根據(jù)自身的利益的利益和目的行事,而且要考慮到他的決策行為對其他人可能的影響,通過選擇最佳行動計劃,來尋求收益或效用的最大化。囚徒困境第一章 概述-人生處處皆博弈-囚徒困境 案例1-囚徒困境-納什均衡 -8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴-8大于-100大于-1(坦白,坦白)是納什均衡第一章 概述-人生處處皆博弈-囚徒困境設(shè)定:(1)每個局中人都知道博弈規(guī)則和博弈結(jié)果的支付矩陣;(2)每個局中人都是理性的(個人理
6、性和個人最優(yōu)決策);(3)不能“串通”第一章 概述-人生處處皆博弈-囚徒困境通俗地講: 納什均衡的含義是:給定別人戰(zhàn)略情況下,沒有任何單個參與人有積極性選擇其他戰(zhàn)略,從而沒有人有積極性打破這種均衡。第一章 概述-人生處處皆博弈-囚徒困境 一只河蚌正張開殼曬太陽,不料,飛來了一只鳥,張嘴去啄他的肉,河蚌連忙合起兩張殼,緊緊鉗住鳥的嘴巴,鳥說:“今天不下雨,明天不下雨,就會有死蚌肉。”河蚌說:“今天不放你,名天不放你,就會有死鳥?!闭l也不肯松口,有一個漁夫看見了,便過來把他們一起捉走了。第一章 概述-人生處處皆博弈-囚徒困境兩個寡頭企業(yè)選擇產(chǎn)量的博弈: 如果兩個企業(yè)聯(lián)合起來形成卡特爾,選擇壟斷利潤
7、最大化的產(chǎn)量,每個企業(yè)都可以得到更多的利潤。給定對方遵守協(xié)議的情況下,每個企業(yè)都想增加產(chǎn)量,結(jié)果是,每個企業(yè)都只得到納什均衡產(chǎn)量的利潤,它嚴(yán)格小于卡特而產(chǎn)量下的利潤。請舉幾個囚徒困境的例子第一章 概述-人生處處皆博弈-囚徒困境同樣的情形發(fā)生在:公共產(chǎn)品的供給美蘇軍備競賽經(jīng)濟改革中小學(xué)生減負(fù)第一章 概述-人生處處皆博弈-囚徒困境囚徒困境的性質(zhì):個人理性和集體理性的矛盾;個人的“最優(yōu)策略”使整個“系統(tǒng)”處于不利的狀態(tài)。思考:為什么會造成囚徒困境是否由于“通訊”問題造成了囚徒困境?“要害”是否在于“利己主義”即“個人理性”?是否囚徒困境的結(jié)果就一定不利?第一章 概述-人生處處皆博弈-囚徒困境亞當(dāng)斯密
8、在1776年發(fā)表的經(jīng)典之作原富中認(rèn)為: 我們的晚餐不是來自屠夫、釀酒的商人或面包師傅的仁慈之心,而是因為他們對自己的利益特別關(guān)注。 每個人都會盡其所能,運用自己的資本爭取最大的利益,一般而言,他不會有意圖為公眾服務(wù),也不自知對社會有什么貢獻(xiàn),他關(guān)心的僅僅是自己的安全、自己的利益,但如此一來,他就好象被一只無形的手引領(lǐng),在不知不覺中對社會改進(jìn)盡力而為。第一章 概述-人生處處皆博弈-囚徒困境人類自私的天性,使他們陷入“囚徒困境”,難以自拔。 解決囚徒困境問題的“出路”“解決個人理性和集體理性之間沖突的辦法不是否認(rèn)個人理性,而是設(shè)計一種機制,在滿足個人理性的前提下達(dá)到集體理性”;“一種制度安排,要發(fā)
9、生效力,必須是一種納什均衡。否則,這種制度安排便不能成立”。囚徒困境的效果在不同情況下對社會而言可能是“負(fù)面”的,也可能是“正面”的。第一章 概述-人生處處皆博弈-囚徒困境第一章 概述-人生處處皆博弈-智豬博弈案例2-智豬博弈第一章 概述-人生處處皆博弈-智豬博弈5,14,49,-10,0等待小豬大豬按等待按4大于10大于-1案例2-智豬博弈納什均衡:大豬按,小豬等待各得四個單位(4,4)多勞者不多得第一章 概述-人生處處皆博弈-智豬博弈請舉類似的例子第一章 概述-人生處處皆博弈-智豬博弈 大豬 小豬 博弈股份公司中大股東 小股東 監(jiān)督納什均衡:大股東擔(dān)當(dāng)監(jiān)督經(jīng)理的責(zé)任,小股東搭便車村中的富人
10、 窮人 修路納什均衡:大戶修路改革中得到好處多的 少的 改革股市的大戶 小戶 炒股納什均衡:大戶搜集信息,小戶跟大戶第一章 概述-人生處處皆博弈-性別戰(zhàn)2,10,00,01,2芭蕾女男足球芭蕾足球案例3-性別戰(zhàn)納什均衡: 足球,足球;芭蕾,芭蕾先動優(yōu)勢第一章 概述-人生處處皆博弈-斗雞博弈案例4-斗雞博弈-3,-32,00,20,0退BA進(jìn)退進(jìn)獨木橋納什均衡:A進(jìn),B退;A退,B進(jìn)第一章 概述-人生處處皆博弈-斗雞博弈村子里有兩戶富戶,有兩種可能:一家修,另一家就不修;一家不修,另一家就得修。冷戰(zhàn)期間美蘇搶占地盤:一方搶占一塊地盤,另一方就占另一塊。夫妻吵架,一方厲害,另一方就出去躲躲。注意:
11、在混合戰(zhàn)略納什均衡條件下,也可能兩敗俱傷。第一章 概述-人生處處皆博弈-斗雞博弈案例5-市場進(jìn)入阻撓40,50-10,00,3000,300斗爭在位者進(jìn)入者進(jìn)入不進(jìn)入默許納什均衡:進(jìn)入,默許;不進(jìn)入,斗爭人生是永不停歇的博弈過程,博弈意略達(dá)到合意的結(jié)果。作為博弈者,最佳策略是最大限度地利用游戲規(guī)則,最大化自己的利益;作為社會最佳策略,是通過規(guī)則使社會整體福利增加。第一章 概述-人生處處皆博弈第一章 概述-人生處處皆博弈分析:上述博弈屬于何種類型的博弈?-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴參與人支付函數(shù)均衡行動第一章 概述-人生處處皆博弈-基本概念博弈論的基本概
12、念包括:參與人:博弈論中選擇行動以最大化自己效用的決策主體;行動:參與人的決策變量戰(zhàn)略:參與人選擇行動的規(guī)則信息:參與人在博弈中的知識,特別是有關(guān)其他參與人的特征和行動的知識支付函數(shù):參與人從博弈中獲得的效用水平 結(jié)果:博弈分析真正感興趣的要素的集合均衡:所有參與人的最優(yōu)戰(zhàn)略的組合參與人、行動、結(jié)果稱為博弈規(guī)則;博弈分析的目的是使用博弈規(guī)則決定均衡。第一章 概述-人生處處皆博弈-博弈的劃分博弈的劃分:從參與人行動的先后順序:靜態(tài)博弈和動態(tài)博弈靜態(tài)博弈:參與人同時選擇行動或非同時行動但后行動者并不知道前行動者采取了什么具體行動;動態(tài)博弈:參與人行動有先后順序,且后行動者能夠觀察先行動者選擇的行動
13、。第一章 概述-人生處處皆博弈-博弈的劃分參與人對其他參與人(對手)的特征、戰(zhàn)略空間及支付函數(shù)的知識:完全信息博弈和不完全信息博弈。完全信息:每一個參與人對所有其他參與人的(對手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的 知識,否則為不完全信息。第一章 概述-人生處處皆博弈-基本概念博弈的劃分: 行動順序信息靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950,1951)完全信息動態(tài)博弈子博弈精練納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)不完全信息動態(tài)博弈精練貝葉斯納什均衡澤爾騰(1965)Kreps 和Wilson(1982)Fudenber
14、g 和Tirole(1991)第一章 概述-人生處處皆博弈分析:上述博弈屬于何種類型的博弈?-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴支付函數(shù)行動完全信息靜態(tài)博弈納什均衡納什(1950,1951)囚徒困境第一章 概述-人生處處皆博弈-智豬博弈5,14,49,-10,0等待小豬大豬按等待按4大于10大于-1智豬博弈支付函數(shù)行動囚徒困境完全信息靜態(tài)博弈納什均衡納什(1950,1951)完全信息動態(tài)博弈-子博弈精練納什均衡(舉例)澤爾騰(1965)進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者合作(40,50)斗爭(-10,0)市場進(jìn)入阻撓博弈樹特點:剔除博弈中包含的不可置信威脅;
15、 承諾行動-破釜沉舟給定進(jìn)入者進(jìn)入,剔除(進(jìn)入,斗爭),(進(jìn)入,默許)是唯一的子博弈精練納什均衡-舉例(結(jié)婚-反對)不可置信威脅支付函數(shù)行動不完全信息靜態(tài)博弈-貝葉斯納什均衡海薩尼(1967-1968)100,100-50,00,00,0不接受求愛博弈:品德優(yōu)良者求愛求愛者進(jìn)入不進(jìn)入接受100,100-50,00,00,0斗爭你求愛者進(jìn)入不進(jìn)入默許求愛博弈:品德惡劣者求愛你100 x+(-100)(1-x)=0當(dāng)x大于1/2時,接受求愛對手特征、戰(zhàn)略空間行動不完全信息動態(tài)博弈-精練貝葉斯納什均衡澤爾騰(1965)成語故事:黔之驢-驢虎博弈 老虎通過不斷試探來修正對毛驢的看法,每一步行動都是給定
16、它的信念下最優(yōu)的。最終將毛驢吃掉。對手特征、支付函數(shù)、戰(zhàn)略空間未知行動有先后主要內(nèi)容簡介第一章 概述-人生處處皆博弈第一篇 非合作博弈理論第二章 完全信息靜態(tài)信息博弈-納什均衡第三章 完全信息動態(tài)搏弈-子博弈精煉納什均衡第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章 不完全信息動態(tài)博弈-精練貝葉斯納什均衡第二篇 信息經(jīng)濟學(xué) 第六章 委托-代理理論(I) 第七章 委托-代理理論(II) 第八章 逆向選擇與信號傳遞 主要內(nèi)容簡介前言本課程的教學(xué)安排 本課程的主要內(nèi)容博弈論概述本課程的教學(xué)目的學(xué)習(xí)本課程的目的 張維迎認(rèn)為:“近幾十年來,經(jīng)濟學(xué)一直在為其他學(xué)科提供武器,但恐怕沒有任何其他工具比博弈論
17、更有力了”。博弈論可以:引導(dǎo)學(xué)生運用書中介紹的理論分析現(xiàn)實的經(jīng)濟現(xiàn)象擴大學(xué)生的知識面開闊思路和思維模式歡迎大家選修!博弈論與信息經(jīng)濟學(xué)(Game Theory and Information Economics )張玲玲中國科學(xué)院研究生院管理學(xué)院主要內(nèi)容簡介第一章 概述-人生處處皆博弈第一篇 非合作博弈理論第二章 完全信息靜態(tài)信息博弈-納什均衡第三章 完全信息動態(tài)搏弈-子博弈精煉納什均衡第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章 不完全信息動態(tài)博弈-精練貝葉斯納什均衡第二篇 信息經(jīng)濟學(xué) 第六章 委托-代理理論(I) 第七章 委托-代理理論(II) 第八章 逆向選擇與信號傳遞 主要內(nèi)容簡介
18、第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 納什均衡應(yīng)用舉例一 博弈的基本概念及戰(zhàn)略表述案例- 房地產(chǎn)開發(fā)項目-假設(shè)有A、B兩家開發(fā)商市場需求:可能大,也可能小投入:1億假定市場上有兩棟樓出售:需求大時,每棟售價億,需求小時,售價7千萬;如果市場上只有一棟樓需求大時,可賣億需求小時,可賣億一 、博弈的基本概念及戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)
19、略式表述一 、博弈的基本概念及戰(zhàn)略表述博弈論的基本概念包括:參與人:博弈論中選擇行動以最大化自己效用的決策主體;行動:參與人的決策變量戰(zhàn)略:參與人選擇行動的規(guī)則信息:參與人在博弈中的知識,特別是有關(guān)其他參與人的特征和行動的知識支付函數(shù):參與人從博弈中獲得的效用水平 結(jié)果:博弈分析真正感興趣的要素的集合均衡:所有參與人的最優(yōu)戰(zhàn)略的組合參與人、行動、結(jié)果稱為博弈規(guī)則;博弈分析的目的是使用博弈規(guī)則決定均衡。一 、博弈的基本概念及戰(zhàn)略表述參與人:博弈論中選擇行動以最大化自己效用的決策主體??梢允亲匀蝗?,也可以是團(tuán)體,如企業(yè)、國家甚至由若干國家組成的集團(tuán)(OPEC、歐盟等)。虛擬參與人:“自然”作為虛擬
20、參與人自然:指決定外生的隨機變量的機制為分析方便引入,自然作為虛擬參與人沒有自己的支付和目標(biāo)函數(shù)(即所有結(jié)果對它是無差異的)參與人決策的后果依賴于自然的選擇。在不完全信息博弈中,自然選擇參與人的類型不完全信息靜態(tài)博弈-貝葉斯納什均衡海薩尼(1967-1968)100,100-50,00,00,0不接受求愛博弈:品德優(yōu)良者求愛求愛者進(jìn)入不進(jìn)入接受100,100-50,00,00,0斗爭你求愛者進(jìn)入不進(jìn)入默許求愛博弈:品德惡劣者求愛你100 x+(-100)(1-x)=0當(dāng)x大于1/2時,接受求愛對手特征、戰(zhàn)略空間行動自然選擇參與人的類型一 、博弈的基本概念及戰(zhàn)略表述行動:參與人在某個時點的決策變
21、量Ai表示第i個參與人的一個特定行動行動的順序:行動的順序?qū)τ诓┺牡慕Y(jié)果是非常重要的,事實上,不同的行動順序意味著不同的博弈。在博弈論中,一般假設(shè)參與人的行動空間和行動順序是所有參與人的共同知識。一 、博弈的基本概念及戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述不完全信息動態(tài)博弈-精練貝葉斯納什均衡澤爾騰(1965)成語故事:黔之驢-驢虎博弈 老虎通過不斷試探來修正對毛驢的看法,每一步行動都是給定它的信念下最優(yōu)的。最終將
22、毛驢吃掉。對手特征、支付函數(shù)、戰(zhàn)略空間未知行動有先后一 、博弈的基本概念及戰(zhàn)略表述信息:參與人在博弈中的知識,特別是有關(guān)其他參與人的特征和行動的知識。如房地產(chǎn)開發(fā)博弈中,如果A不知道市場需求,而B知道,則A的信息集為大,小,B的信息集為大或小完美信息:指一個參與人對其他參與人(包括“自然”)的行動選擇有準(zhǔn)確了解的情況,即每一個信息集只包含一個值。完全信息:指自然不首先行動或自然的行動的初始行動所有參與人觀察到的情況。共同知識:指“所有參與人知道所有參與人知道所有參與人知道.”的知識。一 、博弈的基本概念及戰(zhàn)略表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行
23、動,是參與人的“相機行動方案”。在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。作為一種行動規(guī)則,戰(zhàn)略必須是完備的。一 、博弈的基本概念及戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述一 、博弈的基本概念及戰(zhàn)略表述支付函數(shù):參與人從博弈中獲得的效用水平,或者指參與人得到的期望效用水平。博弈的基本特征是一個參與人的支付不僅取決于自己的戰(zhàn)略選擇,而且取決于所有其他參與人的戰(zhàn)略選擇一 、博弈的基本概念及戰(zhàn)略表述4000,40008000,00
24、,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述一 、博弈的基本概念及戰(zhàn)略表述結(jié)果:博弈分析感興趣的所有東西如均衡戰(zhàn)略組合、均衡行動組合、均衡支付組合等。一 、博弈的基本概念及戰(zhàn)略表述均衡:所有參與人的最優(yōu)戰(zhàn)略的組合一般記為:一 、博弈的基本概念及戰(zhàn)略表述博弈的戰(zhàn)略式表述:一 、博弈的基本概念及戰(zhàn)略表述寡頭產(chǎn)量博弈中,企業(yè)是參與人,產(chǎn)量是戰(zhàn)略空間,利潤是支付;戰(zhàn)略式表述博弈為:一 、博弈的基本概念及戰(zhàn)略表述有限博弈1、參與人的個數(shù)是有限的;2、每個參與人可選的戰(zhàn)略
25、是有限的。兩個人有限博弈的戰(zhàn)略表述可以用矩陣形式表述:一 、博弈的基本概念及戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 納什均衡應(yīng)用舉例二 占優(yōu)戰(zhàn)略均衡完全信息靜態(tài)博弈完全信息:每個參與人對所有其他參與人的特征(包括戰(zhàn)略空間、支付函數(shù)等)完全了解靜態(tài):所有參與人同時選擇行動且只選擇一次。同時:只要每個參
26、與人在選擇自己的行動時不知道其他參與人的選擇,就是同時行動博弈分析的目的是預(yù)測均衡結(jié)果二 占優(yōu)戰(zhàn)略均衡 案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴-8大于-100大于-1-8大于-100大于-1抵賴是A的嚴(yán)格劣戰(zhàn)略抵賴是B的嚴(yán)格劣戰(zhàn)略二 占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略:不論其他人選擇什么戰(zhàn)略,參與人的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略稱為“占優(yōu)戰(zhàn)略”(dominant strategy)。二 占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略均衡定義:在博弈的戰(zhàn)略表達(dá)式中,如果對于所有的i,Si*是i的占優(yōu)戰(zhàn)略,下列戰(zhàn)略組合稱為占優(yōu)戰(zhàn)略均衡:二 占優(yōu)戰(zhàn)略均衡注意:如果所有人都有(嚴(yán)格)占優(yōu)戰(zhàn)
27、略存在,那么占優(yōu)戰(zhàn)略均衡就是可以預(yù)測的唯一均衡。占優(yōu)戰(zhàn)略只要求每個參與人是理性的,而不要求每個參與人知道其他參與人是理性的(也就是說,不要求理性是共同知識)。為什么?二 占優(yōu)戰(zhàn)略均衡4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述A嚴(yán)格劣戰(zhàn)略B嚴(yán)格劣戰(zhàn)略 5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈等待是小豬的嚴(yán)格占優(yōu)戰(zhàn)略大豬有無嚴(yán)格占優(yōu)戰(zhàn)略?4大于10大于-1第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概
28、念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 納什均衡應(yīng)用舉例三 重復(fù)剔除的占優(yōu)均衡重復(fù)剔除嚴(yán)格劣戰(zhàn)略:思路:首先找到某個參與人的劣戰(zhàn)略(假定存在),把這個劣戰(zhàn)略剔除掉,重新構(gòu)造一個不包含已剔除戰(zhàn)略的新的博弈,然后再剔除這個新的博弈中的某個參與人的劣戰(zhàn)略,一直重復(fù)這個過程,直到只剩下唯一的戰(zhàn)略組合為止。 這個唯一剩下的戰(zhàn)略組合就是這個博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)均衡”。三 重復(fù)剔除的占優(yōu)均衡注意: 與占優(yōu)戰(zhàn)略均衡中的占優(yōu)戰(zhàn)略和劣戰(zhàn)略不同,這里的占優(yōu)戰(zhàn)略或劣戰(zhàn)略可能只是相對于另一個特定戰(zhàn)略而言。三 重復(fù)剔除的占優(yōu)均衡 5,14,49,-10,0等待小豬大豬按等待按案例2
29、-智豬博弈按是小豬的嚴(yán)格劣戰(zhàn)略-剔除4大于10大于-1“按”是大豬的占優(yōu)戰(zhàn)略,納什均衡:大豬按,小豬等待三 重復(fù)剔除的占優(yōu)均衡重復(fù)剔除的占優(yōu)均衡 戰(zhàn)略組合 稱為重復(fù)剔除的占優(yōu)均衡,如果它是重復(fù)剔除劣戰(zhàn)略后剩下的唯一戰(zhàn)略組合。如果這種唯一戰(zhàn)略組合是存在的,我們就說該博弈是重復(fù)剔除占優(yōu)可解。 注意:如果重復(fù)剔除后的戰(zhàn)略組合不唯一,該博弈就不是重復(fù)剔除占優(yōu)可解的。三 重復(fù)剔除的占優(yōu)均衡1,01,20,30,1M列先生行先生UDL0,12,0R行:沒有占優(yōu)戰(zhàn)略列:M嚴(yán)格優(yōu)于R剔除 R行:L優(yōu)于D列:無占優(yōu)戰(zhàn)略剔除 DM優(yōu)于L(U,M)是重復(fù)剔除的占優(yōu)均衡三 重復(fù)剔除的占優(yōu)均衡練習(xí):在下列戰(zhàn)略式表達(dá)中,
30、找出重復(fù)剔除的占優(yōu)均衡4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R3三 重復(fù)剔除的占優(yōu)均衡注意:1、重復(fù)剔除的占優(yōu)均衡結(jié)果與劣戰(zhàn)略的剔除順序是否有關(guān)取決于剔除的是否是嚴(yán)格劣戰(zhàn)略。2、重復(fù)剔除的占優(yōu)均衡要求每個參與人是理性的,而且要求“理性”是參與人的共同知識。 即:所有參與人知道所有參與是理性的,所有參與人知道所有參與人知道所有參與是理性的三 重復(fù)剔除的占優(yōu)均衡2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除順序:R3、C3、C2、R2,戰(zhàn)略組合(R1,C1) 故一般使用嚴(yán)格劣戰(zhàn)略剔除,可以看到,(R1,C3)
31、 (R1,C1)都是納什均衡,但在這里是不可解的。剔除順序:C2、R2、C1、R3,戰(zhàn)略組合(R1,C3)舉例:三 重復(fù)剔除的占優(yōu)均衡盡管許多博弈中重復(fù)剔除的占優(yōu)均衡是一個合理的預(yù)測,但并不總是如此,尤其是大概支付某些極端值的時候。8,10-1000,97,66,5參與人B參與人AUDLRU是A的最優(yōu)選擇,但是,只要有1/1000的概率B選R,A就會選D房地產(chǎn)開發(fā)中需求小情況4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述斗雞博弈-
32、3,-32,00,20,0退BA進(jìn)退進(jìn)獨木橋納什均衡:A進(jìn),B退;A退,B進(jìn)對于相當(dāng)多的博弈,我們無法運用重復(fù)剔除劣戰(zhàn)略的方法找出均衡解。為了找出這些博弈的均衡解,需要引入納什均衡。第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 納什均衡應(yīng)用舉例四 納什均衡 假設(shè)n個參與人在博弈之前達(dá)成一個協(xié)議,規(guī)定每一個參與人選擇一個特定的戰(zhàn)略,另 代表這個協(xié)議,在沒有外在強制力的情況下,如果沒有任何人有積極性破壞這個協(xié)議,則這個協(xié)議是自動實施的。這個協(xié)議就構(gòu)成了一個納什均衡。四 納什均衡通俗地說,納什均衡的含義就是:給定你的策略,我的
33、策略是最好的策略;給定我的策略,你的策略也是你的最好的策略。即雙方在給定的策略下不愿意調(diào)整自己的策略。四 納什均衡尋找納什均衡0,44,05,34,00,45,33,53,56,6C2R1R2C1C3R3參與人B參與人A(R3,C3)是納什均衡四 納什均衡2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除順序:R3、C3、C2、R2,戰(zhàn)略組合(R1,C1) 故一般使用嚴(yán)格劣戰(zhàn)略剔除,可以看到,(R1,C3) (R1,C1)都是納什均衡,但在這里是不可解的。剔除順序:C2、R2、C1、R3,戰(zhàn)略組合(R1,C3)請用上述劃線法尋找下列納什均衡練習(xí)
34、:找出下列兩隊夫妻的納什均衡2,2-6,00,-60,0死了恩愛夫妻活著死了活著0,06,00,60,0死了妻子相互仇恨夫妻活著死了活著妻子丈夫丈夫四 納什均衡一群賭徒在賭錢,每個人將錢放在自己身邊(每個人都知道自己的錢有多少),忽然吹來一陣風(fēng)將所有的錢都混在一起,使他們無法分辨哪些錢是自己的,納什均衡為他們解決這個問題。四 納什均衡納什均衡與占優(yōu)戰(zhàn)略均衡及重復(fù)剔除的占優(yōu)均衡:(1)每一個占優(yōu)戰(zhàn)略均衡及重復(fù)剔除的占優(yōu)均衡一定是納什均衡,但并非每一個納什均衡都是占優(yōu)戰(zhàn)略均衡或重復(fù)剔除的占優(yōu)均衡;(2)納什均衡一定是在重復(fù)剔除嚴(yán)格劣戰(zhàn)略過程中沒有被剔除掉的戰(zhàn)略組合,但沒有被剔除掉的組合不一定是納什
35、均衡,除非它是唯一的(不適用于嚴(yán)格弱劣戰(zhàn)略的情況)2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除順序:R3、C3、C2、R2,戰(zhàn)略組合(R1,C1) 故一般使用嚴(yán)格劣戰(zhàn)略剔除,可以看到,(R1,C3) (R1,C1)都是納什均衡,但在這里是不可解的。剔除順序:C2、R2、C1、R3,戰(zhàn)略組合(R1,C3)四 納什均衡案例5-市場進(jìn)入阻撓40,50-10,00,3000,300斗爭在位者進(jìn)入者進(jìn)入不進(jìn)入默許納什均衡:進(jìn)入,默許;不進(jìn)入,斗爭四 納什均衡用重復(fù)剔除弱劣戰(zhàn)略的方法找均衡第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略
36、表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 納什均衡應(yīng)用舉例五 納什均衡應(yīng)用舉例諾貝爾經(jīng)濟學(xué)獎獲得者薩繆爾森有一句話:你可以將一只鸚鵡訓(xùn)練成一個經(jīng)濟學(xué)家,因為它只需要學(xué)習(xí)兩個詞:供給和需求。博弈論專家坎多瑞引申說:要成為現(xiàn)代經(jīng)濟學(xué)家,這只鸚鵡必須再多學(xué)一個詞,就是“納什均衡”。五 納什均衡應(yīng)用舉例案例1 庫諾特(Cournot)寡頭競爭模型案例2 公共地的悲劇案例3公共物品的私人供給博弈論與信息經(jīng)濟學(xué)(Game Theory and Information Economics )張玲玲中國科學(xué)院研究生院管理學(xué)院主要內(nèi)容簡介第一章 概述-人生處處皆博弈第一篇 非合作博弈理論第二章
37、完全信息靜態(tài)信息博弈-納什均衡第三章 完全信息動態(tài)搏弈-子博弈精煉納什均衡第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章 不完全信息動態(tài)博弈-精練貝葉斯納什均衡第二篇 信息經(jīng)濟學(xué) 第六章 委托-代理理論(I) 第七章 委托-代理理論(II) 第八章 逆向選擇與信號傳遞 主要內(nèi)容簡介第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 納什均衡應(yīng)用舉例二 占優(yōu)戰(zhàn)略均衡 案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴抵賴是A的嚴(yán)格劣戰(zhàn)略抵賴是B的嚴(yán)格劣戰(zhàn)略二 占優(yōu)戰(zhàn)略均衡囚徒困境是一些非常普
38、遍而有趣情形的抽象,在這些情形中,從個人角度來說,背叛是最好的選擇,但雙方背叛會導(dǎo)致不甚理想的結(jié)果。二 占優(yōu)戰(zhàn)略均衡第二次世界大戰(zhàn)勝利在望,可是為了給自己撈取功勞,一個飛行大隊的指揮官沒完沒了地下達(dá)提高下屬的任務(wù)定額,弄得所有的人都人心惶惶。投彈手尤塞里安不想成為勝利前夕的最后一批犧牲品,千方百計逃避任務(wù)。他的上級問:“假如,我的士兵都象你這樣想,這仗還怎么打?”,可尤塞里安回答到:“那我若不這么想,豈不成了一個大傻瓜?”二 占優(yōu)戰(zhàn)略均衡注意:如果所有人都有(嚴(yán)格)占優(yōu)戰(zhàn)略存在,那么占優(yōu)戰(zhàn)略均衡就是可以預(yù)測的唯一均衡。占優(yōu)戰(zhàn)略只要求每個參與人是理性的,而不要求每個參與人知道其他參與人是理性的(
39、也就是說,不要求理性是共同知識)。為什么?第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 納什均衡應(yīng)用舉例三 重復(fù)剔除的占優(yōu)均衡重復(fù)剔除嚴(yán)格劣戰(zhàn)略:思路:首先找到某個參與人的劣戰(zhàn)略(假定存在),把這個劣戰(zhàn)略剔除掉,重新構(gòu)造一個不包含已剔除戰(zhàn)略的新的博弈,然后再剔除這個新的博弈中的某個參與人的劣戰(zhàn)略,一直重復(fù)這個過程,直到只剩下唯一的戰(zhàn)略組合為止。 這個唯一剩下的戰(zhàn)略組合就是這個博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)均衡”。三 重復(fù)剔除的占優(yōu)均衡 5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈按是小豬的嚴(yán)格劣戰(zhàn)略
40、-剔除4大于10大于-1“按”是大豬的占優(yōu)戰(zhàn)略,納什均衡:大豬按,小豬等待三 重復(fù)剔除的占優(yōu)均衡1,01,20,30,1M列先生行先生UDL0,12,0R行:沒有占優(yōu)戰(zhàn)略列:M嚴(yán)格優(yōu)于R剔除 R行:L優(yōu)于D列:無占優(yōu)戰(zhàn)略剔除 DM優(yōu)于L(U,M)是重復(fù)剔除的占優(yōu)均衡三 重復(fù)剔除的占優(yōu)均衡卑斯麥海之戰(zhàn)卑斯麥海之戰(zhàn)發(fā)生在1943年的南太平洋上,日本海軍上將木村受命將日本陸軍運抵新幾內(nèi)亞,其間要穿越卑斯麥海。而美國上將肯尼欲對日軍運輸船進(jìn)行轟炸,穿越卑斯麥海通往新幾內(nèi)亞的有兩條航線,木村必須從中選一條,而肯尼則必須決定將其飛機派往何處去搜索日軍,如果肯尼將他的飛機派到了錯誤的航線上,他雖可以召回他們
41、,但可供轟炸的天數(shù)將減少。2,-22,-21,-13,-3木村肯尼北南北南第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 納什均衡應(yīng)用舉例四 納什均衡通俗地說,納什均衡的含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你的最好的策略。即雙方在給定的策略下不愿意調(diào)整自己的策略。四 納什均衡美蘇古巴導(dǎo)彈危機冷戰(zhàn)期間美蘇爭霸最嚴(yán)重的一次危機。蘇聯(lián):面臨將導(dǎo)彈撤回國還是堅持部署在古巴的選擇;美國:挑起戰(zhàn)爭還是容忍蘇聯(lián)的了挑釁行為。結(jié)果:蘇聯(lián):將導(dǎo)彈從古巴撤回,做了丟面子的“撤退的雞”,美國:堅持自己的的策略
42、,做了“不退的雞”,但是象征性地從土耳其撤回了一些導(dǎo)彈,給蘇聯(lián)一點面子。獨木橋四 納什均衡尋找納什均衡0,44,05,34,00,45,33,53,56,6C2R1R2C1C3R3參與人B參與人A(R3,C3)是納什均衡不同均衡概念的關(guān)系占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純戰(zhàn)略納什均衡PNE四 納什均衡第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 混合戰(zhàn)略納什均衡六 納什均衡存在性及相關(guān)討論五 混合戰(zhàn)略納什均衡社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作沒有一個戰(zhàn)略組合構(gòu)成納什均衡
43、五 混合戰(zhàn)略納什均衡 1-1, -11, -11, 1-1,反面正面反面正面猜謎游戲兩個兒童各拿一枚硬幣,若同時正面朝上或朝下,A給B 1分錢,若只有一面朝上,B給A 1分錢。零和博弈博弈參與者有輸有贏,但結(jié)果永遠(yuǎn)是0。沒有一個戰(zhàn)略組合構(gòu)成納什均衡五 混合戰(zhàn)略納什均衡警察與小偷銀行酒館警察小偷2萬元1萬元東邊西邊警察與小偷的最優(yōu)策略各是什么?五 混合戰(zhàn)略納什均衡上述博弈的特征是:在這類博弈中,都不存在純納什均衡。參與人的支付取決于其他參與人的戰(zhàn)略;以某種概率分布隨機地選擇不同的行動每個參與人都想猜透對方的戰(zhàn)略,而每個參與人又不愿意讓對方猜透自己的戰(zhàn)略。這種博弈的類型是什么?如何找到均衡?五 混
44、合戰(zhàn)略納什均衡請舉一些這樣的例子:石頭、剪子、布游戲老虎、杠子、雞、蟲子游戲撲克游戲橄欖球賽戰(zhàn)爭中 1-1, -11, -22, 2-2,西邊東邊西邊東邊五 混合戰(zhàn)略納什均衡警察抽簽決定去銀行還是酒館,2/3的機會去銀行,1/3的機會去酒館;同樣,小偷也抽簽決定去銀行還是酒館, 2/3的機會去酒館, 1/3的機會去銀行。五 混合戰(zhàn)略納什均衡社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作設(shè):政府救濟的概率:1/2 ;不救濟的概率:1/2。流浪漢:尋找工作的期望效用:1/22+1/2 1=1.5 流浪的期望效用: 1/23+1/2 0=1.5因此,流浪漢的任何一種
45、戰(zhàn)略都是都是對政府混合戰(zhàn)略的最優(yōu)反應(yīng)五 混合戰(zhàn)略納什均衡社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作設(shè):政府救濟的概率:1/2 ;不救濟的概率:1/2。流浪漢:尋找工作的概率:0. 2;流浪的概率:每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略五 混合戰(zhàn)略納什均衡 1-1, -11, -11, 1-1,反面正面反面正面猜謎游戲兩個小孩的最優(yōu)策略是采取每個策略的可能性均為1/2;每個小孩各取策略的1/2是納什均衡。零和博弈五 混合戰(zhàn)略納什均衡請舉一些這樣的例子:石頭、剪子、布游戲老虎、杠子、雞、蟲子游戲撲克游戲橄欖球賽戰(zhàn)爭中這樣的博弈的均衡是混合戰(zhàn)略納什均衡
46、五 混合戰(zhàn)略納什均衡戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人的“相機行動方案”。純戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在每一個給定的信 息情況下只選擇一種特定的行動,該戰(zhàn)略為 純戰(zhàn)略?;旌蠎?zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在給定信息情況 下以某種概率分布隨機地選擇不同的行動, 則該戰(zhàn)略為混合戰(zhàn)略。五 混合戰(zhàn)略納什均衡混合戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在給定信息情況 下以某種概率分布隨機地選擇不同的行動, 則該戰(zhàn)略為混合戰(zhàn)略。五 混合戰(zhàn)略納什均衡純戰(zhàn)略可以理解為混合戰(zhàn)略的特例,即在諸多戰(zhàn)略中,選該純戰(zhàn)略si的概率為1,選其他純戰(zhàn)略的概率為0。5,14,49,
47、-10,0等待小豬大豬按等待按 1-1, -11, -11, 1-1,反面正面反面正面五 混合戰(zhàn)略納什均衡如何尋找混合戰(zhàn)略納什均衡?支付最大化法支付等值法由于混合戰(zhàn)略伴隨的是支付的不確定性,因此參與人關(guān)心的是其期望效用。最優(yōu)混合戰(zhàn)略:是指使期望效用函數(shù)最大的混合戰(zhàn)略(給定對方的混合戰(zhàn)略)在兩人博弈里,混合戰(zhàn)略納什均衡是兩個參與人的最優(yōu)混合戰(zhàn)略的組合。五 混合戰(zhàn)略納什均衡 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作即:流浪漢以的概率選擇尋找工作,的概率選擇游蕩同樣,可以根據(jù)流浪漢的期望效用函數(shù)找到政府的最優(yōu)混合戰(zhàn)略。?支付最大化法五 混合戰(zhàn)略納什均衡社會福利博弈 23,
48、3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作設(shè):政府救濟的概率:1/2 ;不救濟的概率:1/2。流浪漢:尋找工作的概率:0. 2;流浪的概率:每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略五 混合戰(zhàn)略納什均衡假定最優(yōu)混合戰(zhàn)略存在,給定流浪漢選擇混合戰(zhàn)略(r,1- r),政府選擇純戰(zhàn)略救濟的期望效用為: 3r+(-1)(1-r)=4r-1選擇純戰(zhàn)略不救濟的效用為:-1r+0(1-r)=-r如果一個混合戰(zhàn)略(而不是純戰(zhàn)略)是政府的最優(yōu)選擇,一定意味著政府在救濟與不救濟之間是無差異的。 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作支付等值法五 混合戰(zhàn)略納什均衡社
49、會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作設(shè):政府救濟的概率:1/2 ;不救濟的概率:1/2。流浪漢:尋找工作的概率:0. 2;流浪的概率:每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略五 混合戰(zhàn)略納什均衡對 的解釋:如果流浪漢以找工作的概率小于0.2, 則政府選擇不救濟,如果大于0.2,政府選擇救濟 ,只有當(dāng)概率等于時,政府才會選擇混合戰(zhàn)略或任何純戰(zhàn)略.對 *的解釋如果政府救濟的概率大于0.5,流浪漢的最優(yōu)選擇是流浪,如果政府救濟的概率小于0.5,流浪漢的最優(yōu)選擇是尋找工作.五 混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡的含義:納什均衡要求每個參與人的混合戰(zhàn)略是給
50、定對方的混合戰(zhàn)略下的最優(yōu)選擇。因此在社會福利博弈中, , *是唯一的混合戰(zhàn)略納什均衡。從反面來說,如果政府認(rèn)為流浪漢選擇尋找工作的概率嚴(yán)格小于,那么政府的唯一最優(yōu)選擇是純戰(zhàn)略:不救濟;如果政府以1的概率選擇不救濟,流浪漢的最優(yōu)選擇是尋找工作,這又將導(dǎo)致政府選擇救濟的戰(zhàn)略,流浪漢則選擇游蕩。如此等等。流浪漢尋找工作的概率小于0.2政府概率為1:不救濟流浪漢尋找工作政府救濟五 混合戰(zhàn)略納什均衡 1-1, -11, -11, 1-1,反面正面反面正面用上述方法:求該猜謎游戲的混合戰(zhàn)略納什均衡五 混合戰(zhàn)略納什均衡練習(xí):模型化下述劃拳博弈:兩個老朋友在一起喝酒,每個人有四個純戰(zhàn)略:杠子、老虎、雞和蟲子,
51、輸贏規(guī)則是:杠子降雞,雞吃蟲子,蟲子降杠子,兩人同時出令。如果一個打敗另一個,贏的效用為1,輸?shù)男в脼?1,否則效用為0,寫出這個博弈的支付矩陣,這個博弈有純戰(zhàn)略均衡嗎?計算其混合戰(zhàn)略納什均衡。第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 混合戰(zhàn)略納什均衡六 納什均衡存在性及相關(guān)討論六 納什均衡存在性及相關(guān)討論不同均衡概念的關(guān)系占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純戰(zhàn)略納什均衡PNE混合戰(zhàn)略納什均衡MNE六 納什均衡存在性及相關(guān)討論納什均衡存在性定理:每一個有限博弈至少存在一個納什均衡(純戰(zhàn)略的或混合戰(zhàn)略的)。六 納什
52、均衡存在性及相關(guān)討論一個博弈可能有多個均衡:兩個人分蛋糕;性別戰(zhàn)中的博弈;納什均衡的多重性:博弈論并沒有一個一般的理論證明納什均衡結(jié)果一定能出現(xiàn)2,10,00,01,2芭蕾女男足球芭蕾足球六 納什均衡存在性及相關(guān)討論如何保證均衡出現(xiàn):1、“聚點”均衡:參與人可以使用某些被抽象掉的信息達(dá)到一個“聚點均衡”。兩個人分蛋糕;性別戰(zhàn)中的博弈;兩人同時給對方打 六 納什均衡存在性及相關(guān)討論2、廉價磋商-“協(xié)調(diào)博弈”盡管無法保證磋商會達(dá)成一個協(xié)議,即使達(dá)成協(xié)議也不一定會被遵守,但在一些博弈中,事前磋商確實可以使某些均衡實際上出現(xiàn)。9,90,00,01,1RBAUDL9,90,88,07,7RBAUDL聚點
53、六 納什均衡存在性及相關(guān)討論獵人博弈和帕累托優(yōu)勢:10,100,44,04,4打兔獵人乙獵人甲獵鹿打兔獵鹿有兩個納什均衡:(10,10)與(4,4);可以認(rèn)為:(10,10)比(4,4)有帕累托優(yōu)勢六 納什均衡存在性及相關(guān)討論大流士陰謀推翻波斯王國的故事:當(dāng)時,一群波斯貴族聚在一起決定推翻國王,其間有人提議休會,大流士此時站出來大聲疾呼,說如果休會的話,就一定會有人去國王那里告密,因為如果別人不那么做的話,他自己就會去做,大流士說唯一的辦法就是沖進(jìn)皇宮,殺死國王。這個謀反的故事還提供了關(guān)于協(xié)調(diào)博弈的出路。在殺死國王之后,貴族們想從自己人中推選出一個人當(dāng)國王,他們決定不自相殘殺,而是在佛曉十分到
54、山上去,誰的馬先叫誰就當(dāng)國王。大流士的馬夫在這場隨機的安排中做了手腳,從而成為國王。六 納什均衡存在性及相關(guān)討論3、學(xué)習(xí)過程 假定博弈重復(fù)多次,即使參與人最初難以協(xié)調(diào)行動,在博弈若干次后,某種特定的協(xié)調(diào)模式可能會形成,特別地,假定參與人每一輪根據(jù)其對手以前的“平均”戰(zhàn)略來選擇自己的最優(yōu)戰(zhàn)略,博弈可能收斂于一個納什均衡。納什均衡應(yīng)用舉例諾貝爾經(jīng)濟學(xué)獎獲得者薩繆爾森有一句話:你可以將一只鸚鵡訓(xùn)練成一個經(jīng)濟學(xué)家,因為它只需要學(xué)習(xí)兩個詞:供給和需求。博弈論專家坎多瑞引申說:要成為現(xiàn)代經(jīng)濟學(xué)家,這只鸚鵡必須再多學(xué)一個詞,就是“納什均衡”。納什均衡應(yīng)用舉例案例1 庫諾特(Cournot)寡頭競爭模型案例2
55、 公共地的悲劇案例3公共物品的私人供給博弈論與信息經(jīng)濟學(xué)(Game Theory and Information Economics )張玲玲中國科學(xué)院研究生院管理學(xué)院主要內(nèi)容簡介第一章 概述-人生處處皆博弈第一篇 非合作博弈理論第二章 完全信息靜態(tài)信息博弈-納什均衡第三章 完全信息動態(tài)搏弈-子博弈精煉納什均衡第四章 不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章 不完全信息動態(tài)博弈-精練貝葉斯納什均衡第二篇 信息經(jīng)濟學(xué) 第六章 委托-代理理論(I) 第七章 委托-代理理論(II) 第八章 逆向選擇與信號傳遞 主要內(nèi)容簡介第二章 完全信息靜態(tài)信息博弈-納什均衡一 博弈的基本概念及戰(zhàn)略表述二 占優(yōu)戰(zhàn)略
56、均衡三 重復(fù)剔除的占優(yōu)均衡四 納什均衡五 納什均衡應(yīng)用舉例二 占優(yōu)戰(zhàn)略均衡 案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴抵賴是A的嚴(yán)格劣戰(zhàn)略抵賴是B的嚴(yán)格劣戰(zhàn)略三 重復(fù)剔除的占優(yōu)均衡 5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈按是小豬的嚴(yán)格劣戰(zhàn)略-剔除4大于10大于-1“按”是大豬的占優(yōu)戰(zhàn)略,納什均衡:大豬按,小豬等待四 納什均衡尋找納什均衡0,44,05,34,00,45,33,53,56,6C2R1R2C1C3R3參與人B參與人A(R3,C3)是納什均衡四 納什均衡練習(xí):投票博弈:假定有三個參與人(1,2和3)要在三個項目(A,
57、B和C)中投票選擇一個,三個參與人同時投票,不允許棄權(quán),因此戰(zhàn)略空間為Si=(A,B,C)。得票最多的項目被選中,如果沒有任何項目得到多數(shù)票,項目A被選中,參與人的支付函數(shù)如下: u1(A)=u2(B)=u3(C) u1(B)=u2(C)=u3(A) u1(C)=u2(A)=u3(B) 找出這個博弈中所有的納什均衡。五 混合戰(zhàn)略納什均衡社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作沒有一個戰(zhàn)略組合構(gòu)成納什均衡五 混合戰(zhàn)略納什均衡社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作設(shè):政府救濟的概率:1/2 ;不救濟的概率:1/2。流
58、浪漢:尋找工作的概率:0. 2;流浪的概率:每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略五 混合戰(zhàn)略納什均衡戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人的“相機行動方案”。純戰(zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在每一個給定的信 息情況下只選擇一種特定的行動,該戰(zhàn)略為 純戰(zhàn)略?;旌蠎?zhàn)略:如果一個戰(zhàn)略規(guī)定參與人在給定信息情況 下以某種概率分布隨機地選擇不同的行動, 則該戰(zhàn)略為混合戰(zhàn)略。五 混合戰(zhàn)略納什均衡純戰(zhàn)略可以理解為混合戰(zhàn)略的特例,即在諸多戰(zhàn)略中,選該純戰(zhàn)略si的概率為1,選其他純戰(zhàn)略的概率為0。5,14,49,-10,0等待小豬大豬按等待按 1-
59、1, -11, -11, 1-1,反面正面反面正面五 混合戰(zhàn)略納什均衡 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作即:流浪漢以的概率選擇尋找工作,的概率選擇游蕩同樣,可以根據(jù)流浪漢的期望效用函數(shù)找到政府的最優(yōu)混合戰(zhàn)略。?支付最大化法五 混合戰(zhàn)略納什均衡社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作設(shè):政府救濟的概率:1/2 ;不救濟的概率:1/2。流浪漢:尋找工作的概率:0. 2;流浪的概率:每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略五 混合戰(zhàn)略納什均衡假定最優(yōu)混合戰(zhàn)略存在,給定流浪漢選擇混合戰(zhàn)略(r,1- r),政府選擇純戰(zhàn)略救
60、濟的期望效用為: 3r+(-1)(1-r)=4r-1選擇純戰(zhàn)略不救濟的效用為:-1r+0(1-r)=-r如果一個混合戰(zhàn)略(而不是純戰(zhàn)略)是政府的最優(yōu)選擇,一定意味著政府在救濟與不救濟之間是無差異的。 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作支付等值法五 混合戰(zhàn)略納什均衡社會福利博弈 23, 3-1, 1-1, 00,流浪流浪漢政府救濟不救濟尋找工作設(shè):政府救濟的概率:1/2 ;不救濟的概率:1/2。流浪漢:尋找工作的概率:0. 2;流浪的概率:每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略五 混合戰(zhàn)略納什均衡對 的解釋:如果流浪漢以找工作的概率小于0.2, 則政府選
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞動合同勞務(wù)合同范例
- 公司合并協(xié)議合同范本
- 全職合同范本
- 醫(yī)院物業(yè)招聘合同范本
- 加盟快遞押金合同范本
- 單位電線更換維修合同范本
- 聲學(xué)顧問合同范本
- 單位車棚工程合同范本
- cpvc管購買合同范本
- ul認(rèn)證合同范本
- 高中主題班會 悟哪吒精神做英雄少年-下學(xué)期開學(xué)第一課主題班會課件-高中主題班會課件
- 2025電力物資檢儲配一體化建設(shè)技術(shù)導(dǎo)則
- 新學(xué)期 開學(xué)第一課 主題班會課件
- 民法典合同編講座
- 2024年青島港灣職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫含答案解析
- 廣西壯族自治區(qū)公路發(fā)展中心2025年面向社會公開招聘657名工作人員高頻重點提升(共500題)附帶答案詳解
- 大學(xué)轉(zhuǎn)專業(yè)高等數(shù)學(xué)試卷
- DBJ51-T 198-2022 四川省既有民用建筑結(jié)構(gòu)安全隱患排查技術(shù)標(biāo)準(zhǔn)
- 公司廠區(qū)保潔培訓(xùn)
- 江蘇省招標(biāo)中心有限公司招聘筆試沖刺題2025
- 2024年防盜門銷售合同范本
評論
0/150
提交評論