博弈論與信息經(jīng)濟(jì)學(xué)--全套課件_第1頁
博弈論與信息經(jīng)濟(jì)學(xué)--全套課件_第2頁
博弈論與信息經(jīng)濟(jì)學(xué)--全套課件_第3頁
博弈論與信息經(jīng)濟(jì)學(xué)--全套課件_第4頁
博弈論與信息經(jīng)濟(jì)學(xué)--全套課件_第5頁
已閱讀5頁,還剩303頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、博弈論與信息經(jīng)濟(jì)學(xué)Game Theory and Economics of Information 博弈論基本思想人們?cè)谌粘I钪羞M(jìn)行著博弈,與配偶,朋友,陌生人,老板/員工,教授等。類似的博弈也在商業(yè)活動(dòng)、政治和外交事務(wù)、戰(zhàn)爭(zhēng)中進(jìn)行著在任何一種情況下,人們相互影響以達(dá)成彼此有利的協(xié)議或者解決爭(zhēng)端。博弈論為眾多學(xué)科提供了分析的概念和方法:經(jīng)濟(jì)學(xué)和商學(xué),政治科學(xué),生物學(xué), 心理學(xué)和哲學(xué)。如何在“博弈”中獲勝?日常生活中的博弈(“游戲”)往往指的是諸如賭博和運(yùn)動(dòng)這樣的東西: 賭拋硬幣 百米賽跑 打網(wǎng)球/橄欖球How can you win such games?許多博弈都包含著運(yùn)氣、技術(shù)和策略。策

2、略是為了獲勝所需要的一種智力的技巧。它是對(duì)于如何最好地利用身體(物質(zhì))的技巧的一種算計(jì)。什么是策略博弈?What is a Game of Strategy? 策略思考本質(zhì)上涉及到與他人的相互影響。其他人在同一時(shí)間、對(duì)同一情形也在進(jìn)行類似的思考。 博弈論就是用來分析這樣交互式的決策的。 理性的行為指的是:明白自己的目的和偏好,同時(shí)了解自己行動(dòng)的限制和約束,然后以精心策劃的方式選擇自己的行為,按照自己的標(biāo)準(zhǔn)做到最好。博弈論對(duì)理性的行為又從新的角度賦予其新的含義與其他同樣具有理性的決策者進(jìn)行相互作用。博弈論是關(guān)于相互作用情況下的理性行為的科學(xué)。如何在博弈中獲勝? 真的能在博弈中(總是)獲勝嗎?對(duì)手

3、和你一樣聰明! 許多博弈相當(dāng)復(fù)雜,博弈論并不能提供萬無一失的應(yīng)對(duì)辦法。例1:無謂競(jìng)爭(zhēng)(The GPA Rat Race)你所注冊(cè)的一門課程按照比例來給分:無論卷面分?jǐn)?shù)是多少,只有40的人能夠得優(yōu)秀,40的人能得良好。所有學(xué)生達(dá)成一個(gè)協(xié)議,大家都不要太用功,如何?想法不錯(cuò),但無法實(shí)施!稍加努力即可勝過他人,誘惑大矣。問題是,大家都這么做。這樣一來,所有人的成績都不比大家遵守協(xié)議來得高。而且,大家還付出了更多的功夫。正因?yàn)檫@樣的博弈對(duì)所有參與者存在著或大或小的潛在成本,如何達(dá)成和維護(hù)互利的合作就成為一個(gè)值得探究的重要問題。存在雙贏的博弈嗎?例2:焦點(diǎn)博弈 “We Cant Take the Exa

4、m,Because We Had a Flat Tire”兩個(gè)學(xué)生想要推遲考試,謊稱由于返校途中輪胎漏氣,未能很好地備考。教授分別對(duì)他們提出了問題:“哪個(gè)輪胎漏氣?”如何應(yīng)答?他們本應(yīng)該預(yù)計(jì)到教授的招數(shù),提前準(zhǔn)備好答案。在博弈中,參與者應(yīng)該向前看到未來的行動(dòng),然后通過向后推理,推算出目前的最佳行動(dòng)。如果雙方都沒有準(zhǔn)備,他能夠獨(dú)立地編出一個(gè)相互一致的謊言嗎?例2:焦點(diǎn)博弈 “We Cant Take the Exam,Because We Had a Flat Tire”“乘客側(cè)前輪”看起來是一個(gè)合乎邏輯的選擇。但真正起作用的是你的朋友是否使用同樣的邏輯,或者認(rèn)為這一選擇同樣顯然。并且是否你認(rèn)為

5、這一選擇是否對(duì)他同樣顯然;反之,是否她認(rèn)為這一選擇對(duì)你同樣顯然。以此類推。也就是說,需要的是對(duì)這樣的情況下該選什么的預(yù)期的收斂。這一使得參與者能夠成功合作的共同預(yù)期的策略被稱為焦點(diǎn)。心有靈犀一點(diǎn)通。例2:焦點(diǎn)博弈 “We Cant Take the Exam,Because We Had a Flat Tire”我們無法從所有這樣的博弈的結(jié)構(gòu)中找到一般和本質(zhì)的東西,來保證這樣的收斂。某些博弈中,由于偶然的外因可以對(duì)策略貼標(biāo)簽,或者參與者之間擁有某些共同的知識(shí)體驗(yàn),導(dǎo)致了焦點(diǎn)的存在。沒有某個(gè)這樣的暗示,默契的合作就完全不可能。例3:為什么教授如此苛刻?許多教授強(qiáng)硬地規(guī)定,不進(jìn)行補(bǔ)考,不允許遲交作

6、業(yè)或論文。教授們?yōu)楹稳绱丝量蹋咳绻试S某種遲交,而且教授又不能辨別真?zhèn)危敲磳W(xué)生就總是會(huì)遲交。期限本身就毫無意義了。避免這一“滑梯”通常只有一種辦法,就是“沒有例外”的策略。例3:為什么教授如此苛刻?問題是,一個(gè)好心腸的教授如何維持如此鐵石心腸的承諾?他必須找到某種使拒絕變得強(qiáng)硬和可信的方法。拿行政程序或者學(xué)校政策來做擋箭牌在課程開始時(shí)做出明確和嚴(yán)格的宣布通過幾次嚴(yán)打來獲得“冷面殺手”的聲譽(yù)導(dǎo)論博弈均衡與一般均衡博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者博弈論的基本概念與類型主要參考文獻(xiàn)導(dǎo)論一、博弈均衡與一般均衡 案例:囚犯困境抵賴坦白抵賴-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A與傳統(tǒng)微

7、觀經(jīng)濟(jì)學(xué)的比較一致性利益最大化原則均衡原則不一致人與人之間的關(guān)系-個(gè)人理性導(dǎo)致集體非理性-設(shè)計(jì)協(xié)調(diào)性機(jī)制-滿足個(gè)人理性前提下達(dá)到集體理性信息不完全-委托-代理理論、信號(hào)傳遞與信息篩選模型導(dǎo)論二、博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者美國人約翰-海薩尼(John C. Harsanyi) 和美國人約翰-納什(John F. Nash Jr.)以及德國人萊因哈德-澤爾騰(Reinhard Selten) 獲獎(jiǎng)理由:在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響 。 約翰納什1928年生于美國約翰海薩尼1920年生于美國萊因哈德澤爾騰,1930年

8、生于德國2019年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者英國人詹姆斯莫里斯 (James A. Mirrlees)和美國人威廉-維克瑞(William Vickrey) 獲獎(jiǎng)理由:前者在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn),尤其是不對(duì)稱信息條件下的經(jīng)濟(jì)激勵(lì)理論的論述;后者在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面都做出了重大貢獻(xiàn)。詹姆斯莫里斯1936年生于英國威廉維克瑞,1914-2019,生于美國2019年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者三位美國學(xué)者喬治-阿克爾洛夫(George A. Akerlof)、邁克爾-斯彭斯(A. Michael Spence)和約瑟夫-斯蒂格利茨(Joseph E. Stiglitz) 獲獎(jiǎng)理由:在“

9、對(duì)充滿不對(duì)稱信息市場(chǎng)進(jìn)行分析”領(lǐng)域做出了重要貢獻(xiàn)。 約瑟夫斯蒂格利茨,1943年生于美國的印第安納州,1967年獲美國麻省理工學(xué)院博士頭銜,曾擔(dān)任世界銀行的首席經(jīng)濟(jì)學(xué)家,現(xiàn)任美國哥倫比亞大學(xué)經(jīng)濟(jì)學(xué)教授喬治阿克爾洛夫1940年生于美國的紐黑文,1966年獲美國麻省理工學(xué)院博士頭銜,現(xiàn)為美國加利福尼亞州大學(xué)經(jīng)濟(jì)學(xué)教授。邁克爾斯彭斯1948年生于美國的新澤西,1972年獲美國哈佛大學(xué)博士頭銜,現(xiàn)兼任美國哈佛和斯坦福兩所大學(xué)的教授。2019年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者以羅伯特奧曼色列經(jīng)濟(jì)學(xué)家羅伯特奧曼(Robert J. Aumann)和美國經(jīng)濟(jì)學(xué)家托馬斯謝林(Thomas C. Schelling) 獲獎(jiǎng)

10、原因:“通過博弈論分析加強(qiáng)了我們對(duì)沖突和合作的理解”所作出的貢獻(xiàn)而獲獎(jiǎng)。 羅伯特奧曼 托馬斯謝林導(dǎo)論三、博弈論的基本類型合作博弈與非合作博弈合作博弈(cooperative game) 達(dá)成有約束力的協(xié)議(binding agreement),強(qiáng)調(diào)團(tuán)體理性,強(qiáng)調(diào)效率、公正、公平非合作博弈(non-cooperative game) 強(qiáng)調(diào)個(gè)人理性,其結(jié)果可能有效率,也可能無效率。納什均衡(NE)子博弈完美納什均衡(SPNE)貝氏納什均衡(BNE)完美貝氏納什均衡(PBNE)及序貫均衡(SE)完全信息 不完全信息靜態(tài)動(dòng)態(tài)非合作博弈的基本分類靜態(tài)博弈與動(dòng)態(tài)博弈(static games and dy

11、namic games)同時(shí)決策或者同時(shí)行動(dòng)的博弈屬于靜態(tài)博弈;先后或序貫決策或者行動(dòng)的博弈,屬于動(dòng)態(tài)博弈即使決策或行動(dòng)有先后,但只要局中人在決策時(shí)都還不知道對(duì)手的決策或者行動(dòng)是什么,也算是靜態(tài)博弈完全信息博弈與不完全信息博弈(games of complete information and games of incomplete information)按照大家是否清楚對(duì)局情況下每個(gè)局中人的得益。“各種對(duì)局情況下每個(gè)人的得益是多少” 是所有局中人的共同知識(shí)(common knowledge)。據(jù)“共同知識(shí)”的掌握分為完全信息與不完全信息博弈。完美信息博弈與不完美信息博弈(games wit

12、h perfect information and games with imperfect information)是關(guān)于動(dòng)態(tài)博弈進(jìn)行過程之中面臨決策或者行動(dòng)的參與人對(duì)于博弈進(jìn)行迄今的歷史是否清楚的一種刻劃。如果在博弈進(jìn)行過程中的每一時(shí)刻,面臨決策或者行動(dòng)的參與人,對(duì)于博弈進(jìn)行到這個(gè)時(shí)刻為止所有參與人曾經(jīng)采取的決策或者行動(dòng)完全清楚,則稱為完美信息博弈;否則位不完美信息。零和博弈與非零和博弈(zero-sum game and non-zero-sum game)如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和總是保持為零,這個(gè)博弈就叫零和博弈;相反,如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得

13、益總和不總是保持為零,這個(gè)博弈就叫非零和博弈。零和博弈是利益對(duì)抗程度最高的博弈。常和博弈與非常和博弈(constant-sum game and variable-sum game)如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和總是保持為一個(gè)常數(shù),這個(gè)博弈就叫常和博弈;相反,如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和不總是保持為一個(gè)常數(shù),這個(gè)博弈就叫非常和博弈。常和博弈也是利益對(duì)抗程度最高的博弈。非常和(變和)博弈蘊(yùn)含雙贏或多贏。導(dǎo)論四、主要參考文獻(xiàn)張維迎著,博弈論與信息經(jīng)濟(jì)學(xué),上海三聯(lián)書店、上海人民出版社,2019年版。Roger B. Myerson著:Game Theory(原文

14、版、譯文版),中國經(jīng)濟(jì)出版社,2019年版。王則柯、李杰編著,博弈論教程,中國人民大學(xué)出版社,2019年版。艾里克.拉斯繆森(Eric Rasmusen)著,博弈與信息:博弈論概論,北京大學(xué)出版社,2019年版。因內(nèi)思馬可-斯達(dá)德勒,J.大衛(wèi)佩雷斯-卡斯特里羅著,信息經(jīng)濟(jì)學(xué)引論:激勵(lì)與合約,上海財(cái)經(jīng)大學(xué)出版社,2019年版。施錫銓編著,博弈論上海財(cái)大出版社,2000年版。謝識(shí)予編著,經(jīng)濟(jì)博弈論,復(fù)旦大學(xué)出版社,2019年版。謝識(shí)予主編,經(jīng)濟(jì)博弈論習(xí)題指南,復(fù)旦大學(xué)出版社,2019年版。課程主要內(nèi)容第一章 完全信息靜態(tài)博弈第二章 完全信息動(dòng)態(tài)博弈第三章 不完全信息靜態(tài)博弈第四章 不完全信息動(dòng)態(tài)博

15、弈第五章 委托-代理理論第六章 逆向選擇與信號(hào)傳遞第一章 完全信息靜態(tài)博弈博弈論的基本概念及戰(zhàn)略式表述納什均衡納什均衡應(yīng)用舉例混合戰(zhàn)略納什均衡納什均衡的存在性與多重性第一節(jié) 博弈論的基本概念與戰(zhàn)略式表述博弈論的基本概念與戰(zhàn)略式表述博弈論(game theory)是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問題。博弈的戰(zhàn)略式表述:G=N,(Si)iN,(Ui)iN有三個(gè)基本要素:(1)參與人(players)iN=1,2,n ;(2)戰(zhàn)略(strategies),siSi(戰(zhàn)略空間);(3)支付(payoffs),ui=ui(s-i,si)。 案例1:囚犯困境抵賴坦白抵賴-1

16、,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A均衡與均衡結(jié)果均衡戰(zhàn)略(坦白,坦白)均衡支付(-6,-6)第二節(jié) 納什均衡占優(yōu)戰(zhàn)略均衡重復(fù)剔除的占優(yōu)戰(zhàn)略均衡納什均衡完全信息靜態(tài)博弈的幾點(diǎn)特性 同時(shí)出招,出招一次; 知道博弈結(jié)構(gòu)與游戲規(guī)則(共同知識(shí)); 不管是否溝通過,無法做出有約束力的 承諾(非合作) 一、占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略:不管對(duì)手戰(zhàn)略為何,該參與人可找到一最佳戰(zhàn)略。定義:在博弈G=N,(Si)iN,(Ui)iN中,如果對(duì)所有的參與人i,si*是它的占優(yōu)戰(zhàn)略,那么所有參與人選擇的戰(zhàn)略組合(s1*,sn*)成為該對(duì)策的占優(yōu)戰(zhàn)略均衡。 案例1:囚犯困境抵賴坦白抵賴-1,-1-9,0坦白

17、0,-9-6,-6支付嫌疑人B嫌疑人A“囚犯困境” 的擴(kuò)展兩個(gè)寡頭企業(yè)選擇產(chǎn)量公共產(chǎn)品的供給軍備競(jìng)賽經(jīng)濟(jì)改革 結(jié)論:一種制度安排,要發(fā)生效力。必須是一種納什均衡;否則,制度安排便不能成立。價(jià)格大戰(zhàn)低價(jià)高價(jià)低價(jià)3,36,1高價(jià)1,65,5支付百事可樂可口可樂案例2:智豬博弈 豬圈里圈兩頭豬,一頭大豬,一頭小豬。豬圈的一頭有一個(gè)豬食槽,另一頭安裝一個(gè)按鈕,控制著豬食的供應(yīng)。按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽,但誰按按鈕誰就要付出2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬只能吃1個(gè)單位;若同時(shí)到,大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃6個(gè)單位,小豬吃4個(gè)單位。支付如表。 案例2:

18、智豬博弈按等待按5,14,4等待9,-10,0支付小豬大豬智豬博弈的擴(kuò)展股份公司承擔(dān)監(jiān)督經(jīng)理職能的大股東與小股東股票市場(chǎng)上炒股票的大戶與小戶市場(chǎng)中大企業(yè)與小企業(yè)在研發(fā)、廣告上的博弈公共產(chǎn)品的提供(富戶與窮戶)改革中不同利益分配對(duì)改革的推動(dòng)二、重復(fù)剔除的占優(yōu)戰(zhàn)略均衡絕對(duì)劣勢(shì)戰(zhàn)略:si是一絕對(duì)劣勢(shì)戰(zhàn)略當(dāng)且僅當(dāng)存在另一戰(zhàn)略siSi使得ui(si,s-i) ui(si,s-i) 對(duì)所有s-iS-i均成立。( si 未必是優(yōu)勢(shì)戰(zhàn)略)重復(fù)剔除的占優(yōu)戰(zhàn)略均衡:逐次刪去絕對(duì)劣勢(shì)戰(zhàn)略得到唯一的占優(yōu)戰(zhàn)略。 例:重復(fù)剔除的占優(yōu)戰(zhàn)略均衡2,30,23,41,12,74,5 參與人2 L M R參與人1UD例 重復(fù)剔除

19、的占優(yōu)戰(zhàn)略均衡4,35,16,22,18,43,63,09,62,8 參與人2L M R參與人1UDM例 重復(fù)剔除的占優(yōu)戰(zhàn)略均衡1,01,33,00,20,13,00,22,45,3 參與人2L M R參與人1UDM三、納什均衡定義:指一戰(zhàn)略組合有以下特性:當(dāng)參與人持此戰(zhàn)略后,任一參與人均無誘因偏離這一均衡;s*=(s1*,sn*)=(si*,s-i*)是一納什均衡,當(dāng)且僅當(dāng)對(duì)所有參與人而言,ui (si*,s-i*) ui (si,s-i*)對(duì)所有siSi 均成立。簡單而言,當(dāng)s1*是對(duì)s2*的最適反應(yīng),s2*也是s1*的最適反應(yīng)時(shí),(s1*,s2*)就是二人博弈的納什均衡。命題1:納什均衡

20、在占優(yōu)戰(zhàn)略重復(fù)剔除解法中不會(huì)被剔除命題2:重復(fù)剔除的嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡。例 納什均衡求解0,44,05,34,00,45,33,53,56,6 參與人2L M R參與人1UDM作業(yè)7,76,67,65,75,88,56,65,84,8 乙 左 中 右上中下甲一個(gè)兩人同時(shí)博弈的支付競(jìng)爭(zhēng)如下所示,試求納什均衡。是否存在重復(fù)剔除占優(yōu)戰(zhàn)略均衡?第三節(jié) 納什均衡應(yīng)用舉例古諾(Cournot)寡頭模型沙灘賣冰豪泰林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型公共地的悲劇一、古諾寡頭模型特點(diǎn):存在兩家廠商;同時(shí)行動(dòng)確定產(chǎn)量。通過預(yù)測(cè)另一家廠商的產(chǎn)量來選擇自己的利潤最大化產(chǎn)量,尋求預(yù)測(cè)均衡。廠商1表示為:m

21、ax p(y1+y2e)y1-c(y1),得出y1=f1(y2e),同理得出y2=f2(y1e),稱為反應(yīng)函數(shù),兩條曲線的交點(diǎn)為古諾模型的解。古諾寡頭模型的納什均衡反應(yīng)函數(shù) y1=f1(y2) y2=f2(y1)(y1*,y2*)是該對(duì)策的納什均衡解。y1* y12y11 y10y2*y22y21y1oy2f1(y2)f2(y1)例題:古諾模型的解假設(shè)p=a-(y1+y2),C1=y1c,C2=y2c則根據(jù)利潤最大化的一階條件分別得到反應(yīng)函數(shù)y1=f1(y2)=(a-y2-c)/2,y2=f2(y1)=(a-y1-c)/2,求出均衡產(chǎn)量為(1/3(a-c),1/3(a-c)),為納什均衡,均衡

22、利潤為(1/9(a-c)2,1/9(a-c)2)古諾模型的解:與壟斷市場(chǎng)的比較假設(shè)為一壟斷企業(yè),則有: Max =y(a-y-c), 得到壟斷企業(yè)的最優(yōu)產(chǎn)量 y=1/2(a-c) y1+y2=2/3(a-c) 壟斷利潤為=1/4(a-c)2 2/9(a-c)2寡頭競(jìng)爭(zhēng)的總產(chǎn)量大于壟斷產(chǎn)量的原因在于每個(gè)企業(yè)在選擇自己的最優(yōu)產(chǎn)量時(shí),只考慮對(duì)本企業(yè)利潤的影響,而忽視對(duì)另一個(gè)企業(yè)的外部負(fù)效應(yīng)。寡頭廠商與壟斷廠商的比較 1/3(a-c) 1/2(a-c)1/2(a-c)y1oy2f1(y2)f2(y1)1/3(a-c)0 1二、沙灘賣冰假設(shè)游客沿沙灘0,1間均勻分布,現(xiàn)有兩位賣冰者,他們會(huì)將攤位選在哪個(gè)

23、位置?假設(shè)游客就近購買。生活中還有哪些類似的例子?三、豪泰林模型寡頭企業(yè)競(jìng)爭(zhēng)戰(zhàn)略是價(jià)格伯川德(Bertrand)模型:產(chǎn)品同質(zhì),均衡價(jià)格等于邊際成本,類似于完全競(jìng)爭(zhēng)市場(chǎng)均衡。豪泰林(Hotelling)模型:存在產(chǎn)品差異,均衡價(jià)格不等于邊際成本,壟斷性提高假定長度為1的線性城市,消費(fèi)者均勻分布在0,1區(qū)間內(nèi),分布密度為1;兩個(gè)商店1、2分別位于x=0,x=1,即城市的兩端;消費(fèi)者購買商品的旅行成本與商店的距離成反比,單位距離的成本為t;住在x的消費(fèi)者在兩個(gè)商店之間是無差異的,需求D1=x,D2=1-x,x滿足:p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。0 x 1商店1

24、商店2豪泰林模型:以空間上差異為例豪泰林模型:以空間上差異為例根據(jù)兩個(gè)商店的利潤函數(shù),1=(p1-c)x, 2=(p2-c)(1-x)選擇使利潤最大化的價(jià)格,得到一階條件,求得p1*=p2*=c+t,均衡利潤1=2=t/2旅行成本越高,產(chǎn)品差異越大,均衡價(jià)格從而均衡利潤也越高。原因:隨著旅行成本上升,不同商店出售的產(chǎn)品之間的替代性下降,每個(gè)商店對(duì)附近的消費(fèi)者的壟斷能力加強(qiáng),當(dāng)旅行成本為零時(shí),不同商店的產(chǎn)品之間具有完全的替代性,則為伯川德均衡結(jié)果。四、公共地的悲劇生物學(xué)家和生態(tài)學(xué)家哈丁(Garrett Harden)在科學(xué)(1968年,第162卷)發(fā)表公地的悲劇。考慮一塊對(duì)所有的人都開放的牧場(chǎng),

25、在著的制度下,可以預(yù)期,每一個(gè)放牧的人都會(huì)在公地上放牧盡可能多的牲口。增加一頭牲口既有正效用,也有負(fù)效用。正效用是牲口的銷售收入,增加一頭為+1負(fù)效用使每增加一頭帶來的過度放牧的損失,每一個(gè)放牧著承擔(dān)-1/n放牧者合理的決策是增加牲口,直至馬瘦毛長,公地毀滅。四、公共地的悲劇資源沒有排他性產(chǎn)權(quán):草地放牧、公海捕魚、小煤窯的過度開發(fā);另一類是人們向其中排放廢物的公地。草地放牧:n個(gè)農(nóng)民,每個(gè)擁有羊的數(shù)量為gi,G=gi,v(G)代表每只羊的價(jià)值,與草地上放牧的總數(shù)G相關(guān),飼養(yǎng)量增加到一定程度,隨著數(shù)量繼續(xù)增加,羊的價(jià)值會(huì)下降,即v(G) w(S)-S w(E) w(S)+E-S參與約束:22R(

26、E)-w(E), w(E)-E拒絕接受拒絕接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w(S)-S0參與約束 委托人的選擇11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10-S)接受:0.9*w(20)-E+0.1*w(10)-E

27、0委托:0.9*20-w(20)+0.1*10-w(10)0激勵(lì)相容約束促使代理人努力的激勵(lì)相容約束、參與約束,以及委托人選擇委托的條件參與約束對(duì)于委托人來說,就是要根據(jù)上述兩個(gè)條件,以及 E、S的值,選擇最佳的工資水平w(20)和w(10),或者它們的差額w(20)-w(10)第四節(jié) 重復(fù)博弈和無名氏定理有限次重復(fù)博弈:連鎖店悖論無限次重復(fù)博弈和無名氏定理一、有限次重復(fù)博弈有限次重復(fù)博弈 令G為階段性博弈,G(T)是G重復(fù)T次的重復(fù)博弈(Tl0;工人也可以受雇后不干活,這不需任何勞動(dòng)成本,同時(shí)創(chuàng)造的利潤也是0。假設(shè)公司與工人在工程結(jié)束之前沒有任何工資合同,它只是在雇用期滿后才決定付給每個(gè)工人

28、的工資額w。作業(yè)2如果該建筑公司在未來的10年內(nèi)每年有一項(xiàng)相同的工程,證明:無論公司的利潤貼現(xiàn)因子是多少,唯一的子博弈完美均衡是:在每一項(xiàng)工程中,無論工人是否干活,公司向工人付的工資額w都是0;工人不干活。如果該建筑公司依次有無窮多個(gè)工程,而下一期工人又能看到以前的工資政策。證明:只要充分接近1,每一期工人都努力干獲將是一個(gè)子博弈完美均衡戰(zhàn)略。在所有子博弈完美均衡中,對(duì)公司最有利的是什么樣的均衡?第三章 不完全信息靜態(tài)博弈不完全信息博弈和貝葉斯納什均衡貝葉斯均衡的應(yīng)用舉例貝葉斯博弈與混合戰(zhàn)略均衡機(jī)制設(shè)計(jì)理論與顯示原理第一節(jié) 不完全信息博弈和貝葉斯均衡一、不完全信息博弈完全信息(complete

29、 information) 每個(gè)局中人對(duì)其他局中人的特征(或類型)和支付函數(shù)有準(zhǔn)確的了解;否則,為不完全信息(incomplete information )。完美信息(perfect information) 在博弈過程的任何時(shí)點(diǎn)每個(gè)局中人都能觀察并記憶之前各局中人所選擇的行動(dòng),否則為不完美信息(imperfect information )40,50-10,030,80-10,1000,3000,3000,400 0,400 高成本情況 低成本情況 默許 斗爭(zhēng) 默許 斗爭(zhēng)進(jìn)入不進(jìn)入進(jìn)入者在位者市場(chǎng)進(jìn)入博弈:不完全信息二、海薩尼(Harsanyi)轉(zhuǎn)換在位者存在不同類型,類似于與n個(gè)參與人博

30、弈;海薩尼(1967-1968)提出,引入虛擬參與人自然,自然先決定參與人的特征,不完全信息博弈轉(zhuǎn)換為不完美信息博弈不完全信息意味著至少有一個(gè)人有多個(gè)類型(type),即個(gè)人所擁有的非共同信息,用i表示參與人i的一個(gè)類型,分布函數(shù)p(1,n)為共同知識(shí)。自然進(jìn)入者進(jìn)入者在位者在位者高低不進(jìn)入進(jìn)入不進(jìn)入進(jìn)入合作斗爭(zhēng) 合作斗爭(zhēng)(40,50) (-10,0) (30,80) (-10,100)(0,300)(0,400)p1-p海薩尼轉(zhuǎn)換后的市場(chǎng)進(jìn)入博弈二、海薩尼轉(zhuǎn)換假設(shè)自然N按照一個(gè)先驗(yàn)的分布函數(shù)p(1,n)來選擇各個(gè)局中人的類型,并且假設(shè)這是共同知識(shí)。記-i=(1,i-1,i+1,n)-i局中人

31、i不知道N對(duì)-i的選擇結(jié)果,但由于他知道自己的類型i,它可以利用貝葉斯法則計(jì)算出條件分布函數(shù),對(duì)其他局中人的類型進(jìn)行估計(jì):稱pi(-ii)為局中人i對(duì)別的局中人類型的信念(belief)。在許多場(chǎng)合下,局中人的類型是彼此無關(guān)的,此時(shí)pi(-ii)就簡化為pi(-i)。三、不完全信息靜態(tài)博弈的戰(zhàn)略式表述n人貝葉斯博弈的戰(zhàn)略式表述為: G=N,S,P,U,其中參與人的類型空間為:1, n;條件概率為:p1,pn;類型依存戰(zhàn)略為:S1(1) ,S(n);類型依存支付函數(shù)為:u1(s1,sn; 1), un(s1,sn; n)給定參與人i知道自己的類型ii,條件概率pi=pi(-ii)描述給定自己屬于

32、i的情況下,參與人i有關(guān)其他參與人類型-i-i的不確定性。靜態(tài)貝葉斯博弈的時(shí)間順序自然選擇類型向量=(1,n),其中ii,參與人i觀測(cè)到i,但參與人j只知道pj(-jj),觀測(cè)不到iN個(gè)參與人同時(shí)選擇行動(dòng)s=(s1,sn),其中siSi(j)參與人i得到ui(s1,sn;j)。自然進(jìn)入者進(jìn)入者在位者在位者高低不進(jìn)入進(jìn)入不進(jìn)入進(jìn)入合作斗爭(zhēng) 合作斗爭(zhēng)(40,50) (-10,0) (30,80) (-10,100)(0,300)(0,400)p1-p海薩尼轉(zhuǎn)換后的市場(chǎng)進(jìn)入博弈市場(chǎng)進(jìn)入博弈均衡求解當(dāng)進(jìn)入者選擇進(jìn)入的期望收益大于選擇不進(jìn)入的期望收益時(shí),進(jìn)入者選擇進(jìn)入進(jìn)入的期望收益:p*40+(1-p)

33、*(-10)0,解得:p1/5,進(jìn)入;p1/5時(shí),s1*=進(jìn)入,s2*(高成本)=默許當(dāng)pzj+(1-zj)0=zj,即只有1-zjci,參與人才會(huì)提供。存在一個(gè)分割點(diǎn)(cutoff),使得cic,ci*時(shí),參與人才會(huì)提供。求解ci*:1-ci*=cj*/2,1-cj*=ci*/2,求得ci*=cj*=2/3,即當(dāng)只當(dāng)cic*,參與人i提供。三、一級(jí)密封價(jià)格拍賣(the first-price sealed auction)當(dāng)一件物品對(duì)買者的價(jià)值買者比賣者更清楚時(shí),賣者一般不愿意首先提出價(jià)格,而常常采用拍賣的方式獲得可能的最高價(jià)格。一級(jí)密封價(jià)格拍賣是許多拍賣方式的一種,在這種拍賣中,投標(biāo)人同時(shí)

34、將自己的出價(jià)寫下來轉(zhuǎn)入一個(gè)信封,密封后交給拍賣人,拍賣人打開信封,出價(jià)最高者是贏者,按他的出價(jià)支付價(jià)格,拿走被拍賣的物品。一級(jí)密封價(jià)格拍賣(一)以兩個(gè)人為例 兩個(gè)人對(duì)拍賣品分別有自己的主觀判斷,稱其為對(duì)拍賣品的保留價(jià)格v,假設(shè)兩人都不清楚對(duì)方的保留價(jià)格,只知道對(duì)方的保留價(jià)格為一均勻分布于0,1上的隨機(jī)值。記局中人的最佳叫價(jià)為b(v),由經(jīng)驗(yàn)常識(shí),假設(shè)函數(shù)b(v)嚴(yán)格單增是合適的,在此假設(shè)下,其反函數(shù)存在,記為V(b),反映的是叫價(jià)為b的局中人真實(shí)的保留價(jià)格。一級(jí)密封價(jià)格拍賣(二) 當(dāng)某人叫價(jià)b時(shí),獲勝的概率當(dāng)然是對(duì)方叫價(jià)低于b的概率,或者等價(jià)地說,是對(duì)方的保留價(jià)格低于V(b)的概率由于局中人對(duì)

35、該物品的保留價(jià)格是閉區(qū)間0,1上的均勻分布,這一概率就等于V(b)。所以,一個(gè)具有保留價(jià)格v、叫價(jià)b的競(jìng)價(jià)者的期望支付為: V(b)(v-b)+(1-V(b)0 從而他的目標(biāo)是: max V(b)(v-b) 其一階條件為:V(b)/(v-b)-V(b)=0, 即V(b)/(V(b)-b)-V(b)=0 一級(jí)密封價(jià)格拍賣(三)等價(jià)于:V2(b)/2/=bV(b)/恒等式兩端對(duì)b求不定積分得到:V2(b)/2=bV(b)+c顯然當(dāng)某人對(duì)一個(gè)物品的保留價(jià)格是0時(shí),它最優(yōu)的叫價(jià)也是0,即V(0)=0,將這一初始條件帶入上式可求得c=0。從而V(b)=2b,或b=v/2競(jìng)價(jià)者的最優(yōu)戰(zhàn)略是以自己保留價(jià)格的

36、一半作為叫價(jià)。一級(jí)密封價(jià)格拍賣(四) 如果有n人參與競(jìng)標(biāo),則b=(n-1)v/n,即b隨n的增加而增加,特別地,當(dāng)n時(shí),bv,就是說,投標(biāo)人越多,賣者能得到的價(jià)格就越高;當(dāng)投標(biāo)人趨于無窮時(shí),賣者幾乎得到買者價(jià)值的全部。因此,讓更多的人加入競(jìng)標(biāo)是賣者的利益所在。第三節(jié)貝葉斯均衡與混合戰(zhàn)略均衡貝葉斯均衡與混合戰(zhàn)略有不少人認(rèn)為完全信息博弈中的混合戰(zhàn)略均衡僅僅只是理論上的概念,但在現(xiàn)實(shí)生活中確實(shí)難以理解的。針對(duì)這一點(diǎn),海薩尼(1973)對(duì)混合戰(zhàn)略提出了另一種解釋。其思想是,只要在原來的博弈中加入少許不完全信息因素,得到(單純戰(zhàn)略)貝葉斯均衡就與完全信息下的混合戰(zhàn)略均衡相似。 性別戰(zhàn)2,4+20,0音樂

37、會(huì)1,14+1,2足球音樂會(huì)足球男方女方支付 b/ 1-b/a/0 a(b) p=a/或者p=b/1-a/“性別戰(zhàn)”的重新構(gòu)造完全信息情況下的“性別戰(zhàn)”加上不完全信息,想象兩人還不十分了解,當(dāng)雙方都去看足球賽時(shí)男士得到的支付是4+1,雙方都去聽音樂會(huì)時(shí)女士得到的支付為4+2。兩人知道自己的類型,但不清楚對(duì)方值的大小,只知道對(duì)方的值是均勻地分布在區(qū)間0,上的隨機(jī)變量。如果男士的類型1不小于某一臨界值a,他選擇“足球”,否則選擇“音樂會(huì)”;如果女士的類型2不小于某一臨界值,她選擇“音樂會(huì)”,否則選擇“足球”?!靶詣e戰(zhàn)”求解男士選擇足球的條件: b/(4+1)+(-b)/1b/0+(-b)/2 整理

38、后得到男士選“足球”的充要條件: 1/b-5=a女士選擇“音樂會(huì)”的充要條件是: 2/a-5=b聯(lián)立兩個(gè)條件中的等式,解得 a=b=在上述貝葉斯均衡中,兩個(gè)局中人使用的都是單純戰(zhàn)略,因?yàn)椴恢缹?duì)方的類型,感覺面對(duì)的像是混合戰(zhàn)略的博弈對(duì)手。如果令為0,男士選足球的概率(-a)/趨于4/5。但不完全信息消失時(shí),貝葉斯均衡趨向于完全信息下的混合均衡。 第四節(jié)機(jī)制設(shè)計(jì)原理與顯示原理一、機(jī)制設(shè)計(jì)(mechanism design)機(jī)制設(shè)計(jì)是一種特殊的不完全信息博弈,委托人(principal)選擇設(shè)計(jì)機(jī)制,給代理人足夠的激勵(lì),促使代理人(agent)說實(shí)話(獲取真實(shí)信息),也可以最大化委托人的期望效用。

39、委托人設(shè)計(jì)機(jī)制面臨兩個(gè)約束:(1)參與約束(participation constraint)或稱個(gè)人理性約束(individual rationality constraint):代理人在該機(jī)制下得到的期望效用不小于他在不接受這個(gè)機(jī)制時(shí)得到的最大期望效用。(2)激勵(lì)相容約束(incentive-compatibility constraint):代理人在所設(shè)計(jì)的機(jī)制下必須有積極性選擇委托人希望他選擇的的行動(dòng)。機(jī)制設(shè)計(jì)滿足參與約束的機(jī)制稱為可行機(jī)制,滿足激勵(lì)相容約束的機(jī)制稱為可實(shí)施機(jī)制,滿足兩個(gè)約束條件的機(jī)制稱為可行的可實(shí)施機(jī)制。委托人的目的是選擇一個(gè)可行的可實(shí)施機(jī)制以最大化他的期望效用。典型

40、的機(jī)制設(shè)計(jì)是一個(gè)三階段不完全信息博弈:第一階段:委托人設(shè)計(jì)機(jī)制,即博弈規(guī)則,代理人根據(jù)規(guī)則發(fā)出信號(hào)(message),實(shí)現(xiàn)的信號(hào)決定配置結(jié)果(allocation);第二階段:代理人同時(shí)選擇接受或不接受委托人設(shè)計(jì)的機(jī)制;第三階段:接受機(jī)制的代理人根據(jù)機(jī)制的規(guī)定進(jìn)行博弈。機(jī)制設(shè)計(jì)案例 機(jī)制設(shè)計(jì)的案例有很多:拍賣、壟斷企業(yè)定價(jià)、政府稅收政策的制定、政府對(duì)壟斷企業(yè)的規(guī)制、公共產(chǎn)品的供給、雇主對(duì)雇員職位的安排、保險(xiǎn)公司的收費(fèi)和賠償政策等。機(jī)制設(shè)計(jì)案例分析(一)圣經(jīng)上索羅門國王對(duì)孩子所有權(quán)的判定: 兩個(gè)代理人:A、B 私人信息:孩子對(duì)于A、B兩人的價(jià)值分別為CA,CB 索羅門國王的處置方式:將孩子切成兩

41、半 A、B兩個(gè)人按照所羅門國王設(shè)計(jì)的機(jī)制采取行動(dòng):私人信息配置結(jié)果 存在問題:代理人可以模仿其他人的反應(yīng)。機(jī)制設(shè)計(jì)案例分析(二)King Econ game采取處罰措施:讓A先行動(dòng),如果放棄得0,如果向B挑戰(zhàn)需要付出F。B如果接受A的選擇,放棄孩子則得0,如果不放棄,向A挑戰(zhàn),則需要付出E。A再進(jìn)入下一個(gè)迎接挑戰(zhàn)的循環(huán)。ABA(0,CB)(CA,0)(-F,CB-E)(CA-E-F,-F)Give upAssertAcceptChallege, bide E and A pays FDont matchChallege, match E and B pays FKing Econ gameKi

42、ng Econ game假設(shè)A是孩子的親生母親,則有CACB,B知道她如果要得到孩子,必須付出足夠的E使得A放棄,即有-FCA-E-F,即ECA,則有CBCAE,B的收益為負(fù),即CB-E0,得到均衡A will assert and B will。假設(shè)B是孩子的親生母親,則有CACA-E-F,即ECA,這樣就能找到E,使得CBECA,得到A will give up in the 1st stage。二、顯示原理(revelation principal) 假定以Mi為信號(hào)空間和以ym(.)為配置函數(shù)的機(jī)制的貝葉斯均衡是:*(.)=1*(1),n*(n),i*Mi,i i 那么存在以Mi= I

43、為信號(hào)空間的直接顯示機(jī)制 ,該機(jī)制的貝葉斯均衡是,所有代理人在第二階段接受機(jī)制,在第三階段同時(shí)報(bào)告自己的真實(shí)類型=(1, n)。直接機(jī)制的均衡配置結(jié)果與原機(jī)制的均衡配置結(jié)果相同。 顯示原理顯示原理肯定了對(duì)任何貝葉斯博弈的任何貝葉斯納什均衡,都能設(shè)計(jì)出一種促使各博弈方“揭示”自己真實(shí)類型的直接機(jī)制來實(shí)現(xiàn)它。以暗標(biāo)拍賣為例。設(shè)只有兩個(gè)投標(biāo)人,他們的估價(jià)類型V1,V2都是0,1上的標(biāo)準(zhǔn)分布。說實(shí)話的直接機(jī)制是這樣設(shè)計(jì)的:(1)兩投標(biāo)人同時(shí)聲明V1/,V2/;(2)投標(biāo)人中中標(biāo)的概率為qi=V1/2,中標(biāo)的價(jià)格為pi=V1/。由于Vi0,1,因此Vi/0,1,q1+q21。其中為代定參數(shù),是決定投標(biāo)人

44、都說實(shí)話是否能成為貝葉斯納什均衡的關(guān)鍵。假定兩投標(biāo)人的聲明是線性齊次的,具有:Vi/=aiVi的形式,則投標(biāo)人i聲明Vi/的期望收益為:對(duì)投標(biāo)人i來講,均衡條件是找出ai使期望收益最大其一階條件為ai=/2所謂說實(shí)話,即ai=1,Vi/=Vi因此,當(dāng)=2時(shí),也就是中標(biāo)價(jià)格為中標(biāo)人聲明估價(jià)(也是真實(shí)股價(jià))的一半時(shí),上述直接機(jī)制使得兩投標(biāo)人都講真話是貝葉斯納什均衡顯示原理0,00,1B1,0-1,-1ABA廠商1廠商2支付作業(yè)1請(qǐng)用下面這個(gè)兩市場(chǎng)博弈驗(yàn)證海薩尼關(guān)于混合策略和不完全信息博弈關(guān)系的結(jié)論。v1-1,v2-1v1-1, v2v1,v2-10,0 參與人2 提供 不提供提供不提供參與人1作業(yè)

45、2:公共物品的提供支付如下所示,成本為1,收益為私人信息,分別為v1,v2,其中v1,v2分別均勻分布于0.75,1.75,1,2區(qū)間上,求貝葉斯納什均衡。第四章 不完全信息動(dòng)態(tài)博弈精煉貝葉斯納什均衡信號(hào)傳遞博弈及其應(yīng)用舉例KMRW聲譽(yù)模型第一節(jié)精煉貝葉斯納什均衡一、不完全信息動(dòng)態(tài)博弈特點(diǎn)“自然”首先選擇參與人的類型,參與人自己知道,其他參與人不知道;參與人開始行動(dòng),后行動(dòng)者能觀測(cè)到先行動(dòng)者的行動(dòng),但不能觀測(cè)到先行動(dòng)者的類型;后行動(dòng)者通過觀察先行動(dòng)者所選擇的行動(dòng)來推斷類型或修正對(duì)其類型的先驗(yàn)信念(概率分布),然后選擇自己的最優(yōu)行動(dòng);先行動(dòng)者預(yù)測(cè)到自己的行動(dòng)將被后行動(dòng)者所利用,就會(huì)設(shè)法選擇傳遞對(duì)

46、自己最有利的信息,避免傳遞對(duì)自己不利的信息。二、貝葉斯法則先驗(yàn)概率(prior probability):修正之前的判斷;后驗(yàn)概率(posterior probability):修正之后的判斷貝葉斯法則:假定參與人i有K個(gè)類型,有H個(gè)行動(dòng),用k和sh分別代表一個(gè)特定的類型和戰(zhàn)略,假定i屬于k的先驗(yàn)概率是p(k)0,p(k)=1,i選擇sh的條件概率為p(shk),p(shk)=1。 假如觀測(cè)到i選擇了sh,i屬于類型k的后驗(yàn)概率Prob(ksh)有以下公式存在:貝葉斯法則舉例假定現(xiàn)實(shí)中分為好人(1)和壞人(2)(type),所有的事分為好事(s1)和壞事(s2)(strategy),那么一個(gè)人

47、干好事的概率ps1就等于他是好人的概率p(1)(先驗(yàn)概率)乘以好人干好事的概率p(s11),加上他是壞人的概率p(2)乘以壞人干好事p(s12)的概率,即ps1=p(s11)p(1)+p(s12)p(2)(邊緣概率)。假定觀測(cè)到一個(gè)人干了一件好事,那么這個(gè)人是好人的后驗(yàn)概率為:貝葉斯法則舉例假設(shè)認(rèn)為這個(gè)人是好人的先驗(yàn)概率為1/2,那么在觀測(cè)到他干了好事之后來修正他是好人的先驗(yàn)概率依賴于這件事好到什么程度。假設(shè)這件事非常好,好人一定干,壞人一定不干,則有p(s11)=1, p(s12)=0,那么后驗(yàn)概率Prob(1s1)=(1*1/2)/(1*1/2+0*1/2)=1假設(shè)這是一件非常一般的好事,

48、好人會(huì)干,壞人也會(huì)干,則有p(s11)=1, p(s12)=1,后驗(yàn)概率Prob(1s1)=(1*1/2)/(1*1/2+1*1/2)=1/2假設(shè)介于上述兩種之間,好人肯定會(huì)做,壞人可能做也可能不做,則有p(s11)=1, p(s12)=1/2,后驗(yàn)概率Prob(1s1)=(1*1/2)/(1*1/2+1/2*1/2)=2/3三、精煉貝葉斯均衡(PBNE)PBNE是不完全信息動(dòng)態(tài)均衡的基本均衡概念,是澤爾騰的完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡(SPNE)和海薩尼的不完全信息靜態(tài)博弈貝葉斯均衡(BNE)的結(jié)合。BNE中,參與人的信念是事前給定的,均衡概念沒有規(guī)定參與人如何修正自己的信念。SPNE

49、要求均衡戰(zhàn)略不僅在整個(gè)博弈上構(gòu)成納什均衡,而且要求在每個(gè)子博弈上構(gòu)成納什均衡,剔除了那些包含不可置信威脅的戰(zhàn)略。PBNE要求,給定每一個(gè)參與人有關(guān)其他參與人類型的后驗(yàn)信念,參與人的戰(zhàn)略組合在每一個(gè)后續(xù)博弈(continuation game,每一個(gè)信息集開始的博弈的剩余部分,不同于開始于單結(jié)信息集的子博弈)上構(gòu)成貝葉斯均衡。三、精煉貝葉斯均衡(PBNE)精煉貝葉斯均衡( PBNE )是貝葉斯均衡、子博弈精煉均衡和貝葉斯推斷的結(jié)合。PBNE要求:(1)在每一個(gè)信息集上,決策者必須有一個(gè)定義在屬于該信息集的所有決策結(jié)上的一個(gè)概率分布(信念);(2)給定該信息集上的概率分布和其他參與人的后續(xù)戰(zhàn)略,參

50、與人的行動(dòng)必須是最優(yōu)的;(3)每一個(gè)參與人根據(jù)貝葉斯法則和均衡戰(zhàn)略修正后驗(yàn)概率。精煉貝葉斯均衡的定義精煉貝葉斯均衡是一個(gè)戰(zhàn)略組合s*()=(s1*(1),sn*(n)和一個(gè)后驗(yàn)概率組合 ,滿足:(P)對(duì)于所有的參與人i,在每一個(gè)信息集h,存在 ,或者說,參與人的戰(zhàn)略是序貫理性的,即在每個(gè)參與人的信息集中,給定這個(gè)人的信念以及其他參與人的戰(zhàn)略,他在該信息集中的選擇以及之后的行動(dòng)是他在這些前提下的最優(yōu)行動(dòng)。(B) 是使用貝葉斯法則從先驗(yàn)概率pi(-ii),觀測(cè)到的最優(yōu)戰(zhàn)略s*得到的。精煉貝葉斯均衡定義的闡釋精煉貝葉斯均衡是均衡戰(zhàn)略和均衡信念的結(jié)合: 給定信念 ,戰(zhàn)略s*=(s1*,sn*)是最優(yōu)的

51、;給定戰(zhàn)略s*=(s1*,sn*),信念 是使用貝葉斯法則從均衡戰(zhàn)略和所觀測(cè)到的行動(dòng)得到的。四、精煉貝葉斯均衡求解SPNE的缺點(diǎn):有不完全信息、不完美信息時(shí)無法檢驗(yàn)決策情境。在均衡中加入信念的好處:給定均衡狀態(tài),可檢驗(yàn)每一種情境。求解方法: (1)確定均衡型態(tài)(s1,s2p1,p2) (2)給定信念,選擇均衡123(4,4,4) (1,1,1) (5,5,0) (2,2,2)LRRLDdAa(3,3,0)1-pp例一:有哪些均衡? 哪些均衡有問題?3,3,05,5,04,4,44,4,43,3,02,2,21,1,11,1,1ADADa d a d L R納什均衡(D,a,L)、(A,a,R)

52、123(4,4,4) (1,1,1) (5,5,0) (2,2,2)LRRLDdAa(3,3,0)1-pp檢驗(yàn)納什均衡(D,a,L)、(A,a,R)當(dāng)3選擇L時(shí),2的理性選擇是d,而非a,排除(D,a,L)L: 4P+(1-P)0=4PR: P+(1-P)2=2-PIf: p2/5,3選RPBE:(A,a,R)+p 2/5123(-1,0,1) (3,0,2) (0,3,2) (0,-1,1)udduuudd(0.5,0.5,4)1-pp練習(xí):有哪些均衡? 哪些均衡有問題?-1,0,1-1,0,10,3,20.5,0.5,43,0,23,0,20,-1,10.5,0.5,4ududu d u

53、d u d納什均衡(d,u,u)、(u,u,d)、(u,d,d)123(-1,0,1) (3,0,2) (0,3,2) (0,-1,1)udduuudd(0.5,0.5,4)1-pp檢驗(yàn)(d,u,u)、(u,u,d)、(u,d,d)如果3選d,2的最佳選擇是d,排除(u,u,d)PBE: (u,d,d)+p1/2PBE: (d,u,u)+pu1(m2,s*(m), 1) u1(m2,s*(m), 2)u1(m1,s*(m), 2) 后驗(yàn)概率為:混同均衡(pooling equilibrium)不同類型的發(fā)送者選擇相同的信號(hào),或者說,沒有任何類型選擇與其他類型不同的信號(hào),因此,接收者不修正先驗(yàn)概

54、率。假定mj是均衡戰(zhàn)略,那么: u1(mj,s*(m), 1)u1(m,s*(m), 1) u1(mj,s*(m), 2) u1(m,s*(m), 2)例一:市場(chǎng)進(jìn)入博弈假定有兩個(gè)時(shí)期,市場(chǎng)上一個(gè)壟斷企業(yè)在生產(chǎn),潛在的進(jìn)入者考慮是否進(jìn)入。如果進(jìn)入,兩個(gè)企業(yè)進(jìn)行古諾博弈,否則在位者仍是一個(gè)壟斷者。在位者有兩個(gè)類型,高成本與低成本,其概率分別為q,1-q(先驗(yàn)信念)。進(jìn)入者只有一個(gè)類型,進(jìn)入成本為2。如果進(jìn)入,生產(chǎn)成本函數(shù)與高成本的在位者相同。如果是高成本,單階段最優(yōu)價(jià)格為p=6;如果是低成本,單階段最優(yōu)價(jià)格為p=5。市場(chǎng)進(jìn)入博弈N在位者在位者進(jìn)入者進(jìn)入者高低P=4 P=5 P=6 P=4 P=5

55、 P=6 進(jìn) 不 進(jìn) 不 進(jìn) 不 進(jìn) 不 進(jìn) 不 進(jìn) 不第一階段 (2,0) (2,0) (6,0) (6,0)(7,0)(7,0) (6,0)(6,0)(9,0)(9,0)(8,0)(8,0)第二階段 (3,1) (7,0) (3,1) (7,0)(3,1)(7,0) (5,-1)(9,0)(5,-1)(9,0)(5,-1)(9,0)q1-q市場(chǎng)進(jìn)入博弈求解(一)單階段最優(yōu)壟斷價(jià)格p=6(高成本)或p=5(低成本),不是精煉貝葉斯均衡。如果進(jìn)入者這樣選擇,則后驗(yàn)概率q(6)=1(選擇p=6證明在位者是高成本),q(5)=0(選擇p=5證明在位者是低成本)給定后驗(yàn)概率,當(dāng)觀測(cè)到在位者選擇p=6

56、,進(jìn)入者選擇進(jìn)入,在位者兩期利潤=7+3=10;而如果模仿低成本企業(yè),選擇p=5,則得到兩期利潤=6+7=13。因此p=6不是高成本在位者的最優(yōu)選擇市場(chǎng)進(jìn)入博弈求解(二)假定q1/2,得到混同均衡,兩類在位者選擇相同的價(jià)格給定進(jìn)入者的后驗(yàn)概率和戰(zhàn)略,如果高成本選擇p=6,進(jìn)入者進(jìn)入,u1=7+3=10,如果選擇p=5,進(jìn)入者不進(jìn)入,u1=6+7=13,p=5是高成本的最優(yōu)選擇;如果低成本選擇p=5,u1=9+9=18,大于選擇其他任何價(jià)格時(shí)的利潤,p=5是低成本的最優(yōu)選擇。給定兩類在位者都選擇p=5,進(jìn)入者不能從觀測(cè)到的價(jià)格中得到任何新的信息,即后驗(yàn)概率q=1*q/(1*q+1*(1-q)=q

57、1/2,(式中的1分別為高成本、低成本時(shí)在位者選擇p=5的概率)進(jìn)入的期望利潤q*1+(1-q)*(-1)0,不進(jìn)入的期望利潤為0,因此不進(jìn)入是最優(yōu)的。市場(chǎng)進(jìn)入博弈求解(三)假定q1/2,得到分離均衡,兩類在位者選擇不同價(jià)格如果不同類型在位者選擇相同的價(jià)格,進(jìn)入者得不到新的信息,將選擇進(jìn)入,因?yàn)閝*1+(1-q)*(-1)=2q-10。給定進(jìn)入者一定會(huì)進(jìn)入,在位者的最優(yōu)選擇是p=6(高成本)或p=5(低成本),前面已經(jīng)證明不是一個(gè)均衡。給定進(jìn)入者的后驗(yàn)概率和戰(zhàn)略,低成本在位者選擇p=6(認(rèn)為他是高成本,進(jìn)入),u1=8+5=13;選擇p=5,進(jìn)入者進(jìn)入,u1=9+5=14;選擇p=4,進(jìn)入者不

58、進(jìn)入, u1=6+9=15,最優(yōu)戰(zhàn)略為p=4,進(jìn)入者不進(jìn)入。給定進(jìn)入者的后驗(yàn)概率和戰(zhàn)略,高成本在位者選擇p=4,進(jìn)入者不進(jìn)入,u1=2+7=9;選擇p=5,進(jìn)入者進(jìn)入, u1=6+3=9;選擇p=6,進(jìn)入者進(jìn)入,u1=7+3=10,因此p=6是最優(yōu)的。二、Education game工人:U(e,w;)=w-e/,e為信息,w為工資,為勞動(dòng)者的素質(zhì),其中高生產(chǎn)率者H的概率為P,低生產(chǎn)率者L的概率為1-P,=E雇主:U(w,)=-w,(e):給定教育程度時(shí)能力的概率分布,如果雇主完全競(jìng)爭(zhēng),則工資就等于勞動(dòng)者的期望工作能力,即w(e)=(He)* H+ (Le)* L行動(dòng)順序?yàn)楣と讼冗x擇e,雇主根

59、據(jù)e支付w, PBE為何?Education game的解法(一)均衡定義與分類: (eH,eL,(e)(1)Pooling: eH=eL;(2)Separating: eHeL(3)HybridPooling: eH=eL=eP,, 信念:(HeP) =P, (HeeP)=0 =w(e=eP)=p* H+(1-p)* L H: -ep/H L L: -ep/L L 當(dāng)ep p L( H-L)時(shí)均衡成立。Education game的解法(二)Separating: eH eL,eL=0 信念:(HeH) =1, (HeL)=0, 假設(shè):(HeeHoreL)=0 如果不等式左邊代表e=eH,

60、不等式右邊e=eL=0,則有 H: H-eH/H L(高生產(chǎn)率者選擇eH) L: H-ep/L L (低生產(chǎn)率者選擇eL) 當(dāng)L( H-L) eHH( H-L)時(shí)均衡成立。Education game的解法(三)Hybrid (1) H: eH ; L: eH or eL(eL=0) 當(dāng)pL( H-L) eHL( H-L)時(shí)可成立(2) H: eH or eL (eL=0); L: eL=0 當(dāng)(1-p)H( H-L) eHH( H-L)時(shí)可成立討論:順序的重要性可能有多重均衡如果改成由公司先行動(dòng):只有一個(gè)可能的均衡經(jīng)驗(yàn):擁有信息的人先行動(dòng),均衡多;處于信息劣勢(shì)的一方先行動(dòng),均衡唯一。第三節(jié)K

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論