版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、經(jīng)濟(jì)博弈論基礎(chǔ)Economic Game Theory 第一章緒 論 第一節(jié) 博弈論與經(jīng)濟(jì)學(xué)第二節(jié) 經(jīng)濟(jì)博弈論的產(chǎn)生與發(fā)展第三節(jié) 經(jīng)濟(jì)博弈論內(nèi)容體系 主要內(nèi)容一、博弈論的研究對(duì)象 博弈論是研究在利益相互影響的局勢(shì)中,局中人如何選擇自己的策略才能使自身的收益最大化的均衡問題,是研究聰明而又理智的決策者在沖突或合作中的策略選擇理論。 第一節(jié)、博弈論與經(jīng)濟(jì)學(xué) 1. 從經(jīng)濟(jì)學(xué)的研究對(duì)象來看 傳統(tǒng)觀點(diǎn):經(jīng)濟(jì)學(xué)是研究有限資源的最優(yōu)配置的 一門學(xué)科。物盡其用 現(xiàn)代觀點(diǎn):經(jīng)濟(jì)學(xué)是研究理性人行為的一門學(xué)科。 人盡其才 理性人 合作與沖突 博弈論 從“物盡其用” 到“人盡其才” 二、博弈論與經(jīng)濟(jì)學(xué)的關(guān)系2. 從新
2、古典經(jīng)濟(jì)學(xué)的兩個(gè)假設(shè)來看假設(shè)一:市場(chǎng)是完全競(jìng)爭(zhēng)的;假設(shè)二:市場(chǎng)是完全信息的。 結(jié) 論:市場(chǎng)可以達(dá)到一般均衡,資源配置達(dá)到 Pareto最優(yōu)。兩個(gè)假設(shè)與現(xiàn)實(shí)的背離,引出博弈論。從“一般均衡” 到“博弈均衡” 二、博弈論與經(jīng)濟(jì)學(xué)的關(guān)系3. 從傳統(tǒng)的消費(fèi)理論來看 傳統(tǒng)消費(fèi)理論: 缺陷:沒有考慮消費(fèi)者之間的相互影響問題 經(jīng)濟(jì)學(xué)離不開博弈論 二、博弈論與經(jīng)濟(jì)學(xué)的關(guān)系 在經(jīng)濟(jì)系統(tǒng)中,各經(jīng)濟(jì)實(shí)體都有自己的利益(主要是經(jīng)濟(jì)利益)。利益決定著經(jīng)濟(jì)實(shí)體的經(jīng)濟(jì)行為。而現(xiàn)代經(jīng)濟(jì)博弈論在承認(rèn)各經(jīng)濟(jì)實(shí)體利益的基礎(chǔ)上,更加側(cè)重研究經(jīng)濟(jì)主體行為特征,能夠協(xié)調(diào)它們的利益,更加側(cè)重研究經(jīng)濟(jì)主體(局中人)的行為方案(策略)與其利益
3、得失(支付函數(shù))的關(guān)系,從而推動(dòng)經(jīng)濟(jì)發(fā)展和社會(huì)進(jìn)步。 三、博弈論的作用 博弈論思想源遠(yuǎn)流長(zhǎng),而能作為現(xiàn)代博弈論研究對(duì)象和內(nèi)容的起源的博弈思想和實(shí)踐活動(dòng)而言,則可追溯到2000多年前齊王與田忌賽馬以及孫子兵法中的軍事博弈。 第二節(jié)、經(jīng)濟(jì)博弈論的產(chǎn)生與發(fā)展1838年,Cournot 兩寡頭產(chǎn)量競(jìng)爭(zhēng)模型 Antoine Augustin Cournot, Recherches sur les Principes Mathematiques de la Theorie des Richesses , 1838. English Edition: Researches into the Mathemat
4、ical Principles of the Theory of Wealth, edited by N. Bacon, New York: Macmillan, 1897.古諾.財(cái)富理論的數(shù)學(xué)原理的研究,商務(wù)印書館,1994 一、經(jīng)濟(jì)博弈論的產(chǎn)生1883年,Bertrand兩寡頭價(jià)格競(jìng)爭(zhēng)模型Bertrand, J., Theorie Mathematique de la Richesse Sociale, Journal des Savants, 1883, 499-508. 一、經(jīng)濟(jì)博弈論的產(chǎn)生作為博弈論誕生的標(biāo)志Von Neumann, J. & O. Morgenstern, The
5、Theory of Games and Economic Behavior, Princeton University Press, 1944.馮諾依曼和摩根斯頓:博弈論與經(jīng)濟(jì)行為三聯(lián)書店, 2004.John von Neumann (1903-1957)Oskar Morgenstern (1902-1977)非合作博弈均衡理論John F. Nash: 美國(guó)普林斯頓大學(xué)Reinhard Selten: 德國(guó)波恩大學(xué)John C.Harsanyi: 美國(guó)加州大學(xué)泊克萊分校 1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng) 1、The bargaining problem, Econometrica, 1950
6、, 18: 155162. 2、Equilibrium points in n-person games, Proceedings of the National Academy of Sciences, 1950, 36: 4849. John F. Nash 的代表作 3、Noncooperative games, Doctoral dissertation, 1950. 4、Noncooperative games, Ann. of Math. , 1951, 54: 286295. 5、Two-person cooperative games, Econometrica, 1953,
7、21: 128140. John F. Nash 的代表作 1、Spieltheoretische Behandlung eines Oligopol-modells mit Nachfragetrgheit, Zeitschrift fur die gesamte Staatswissenschaft, 1965, 12: 301324. 2、Re-examination of the perfectness concept for equilibrium points in extensive games, International Journal of Game Theory, 197
8、5, 4: 2555. 3、 The Chain-Store Paradox, Theory and Decision, April 1978, 9: 127129. Reinhard Selten 的代表作 1、 Games with incomplete information played by Bayesian players I II & III, Management Science, 196768,14: 159182, 320334, 486502. 2、Rational Players and Bargaining Equilibrium in Games and Socia
9、l Situations, Cambridge University Press, 1977. 3、Harsanyi, J. And R. Selten, A General Theory of Equilibrium Selection in Games, Cambridge: MIT Press, 1988. John C. Harsanyi 的代表作非對(duì)稱信息下的激勵(lì)機(jī)制設(shè)計(jì)理論James A. Mirrlees: 英國(guó)劍橋大學(xué)William Vickrey: 美國(guó)哥倫比亞大學(xué) 1996年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)逆向選擇:非對(duì)稱信息下的市場(chǎng)交易理論George Akerlof 美國(guó)加州大學(xué)泊克
10、萊分校Michael Spence 美國(guó)斯坦福大學(xué)Joseph E. Stiglitz 美國(guó)哥倫比亞大學(xué) 2001年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)通過博弈論分析而增進(jìn)我們對(duì)沖突和合作的理解Robert J. Aumann 以色列耶路撒冷希伯來大學(xué)理性研究中心Thomas C. Schelling 美國(guó)哈佛大學(xué)肯尼迪政府學(xué)院和馬里蘭大學(xué)經(jīng)濟(jì)學(xué)系暨公共政策學(xué)院 2005年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)機(jī)制設(shè)計(jì)理論 Leonid Hurwicz 美國(guó)明尼蘇達(dá)大學(xué)經(jīng)濟(jì)學(xué)教授 Eric S. Maskin 普林斯頓大學(xué)社會(huì)科學(xué)院高等研究院 Roger B. Myerson 芝加哥大學(xué)經(jīng)濟(jì)系教授 2007年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng) L
11、eonid Hurwicz 生于1917年8月21日 美國(guó)明尼蘇達(dá)大學(xué)經(jīng)濟(jì)學(xué)名譽(yù)教 授,其主要研究領(lǐng)域包括機(jī)制和 機(jī)構(gòu)設(shè)計(jì)以及數(shù)理經(jīng)濟(jì)學(xué)。 2007年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng) Eric S. Maskin 普林斯頓大學(xué)社會(huì)科學(xué)院 高等研究院教授,其經(jīng)濟(jì)學(xué)理論已經(jīng) 在經(jīng)濟(jì)、政治科學(xué)及法律的領(lǐng)域產(chǎn)生 了深遠(yuǎn)影響。目前的研究課題為機(jī)制 設(shè)計(jì)理論,重復(fù)博弈,收入不均衡問 題以及投票理論。 2007年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)Roger B. Myerson 芝加哥大學(xué)經(jīng)濟(jì)系教授,1976年獲得哈佛大學(xué)應(yīng)用數(shù)學(xué)系哲學(xué)博士學(xué)位,其博士論文題為:一種合作博弈理論 (A Theory of Cooperative Game
12、s) 2007年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)博弈論成為主流經(jīng)濟(jì)學(xué)的一部分1. 重視微觀基礎(chǔ)2. 重視人與人之間關(guān)系的研究3. 重視信息在經(jīng)濟(jì)中的作用 二、博弈論對(duì)經(jīng)濟(jì)學(xué)發(fā)展的影響1、Von Neumann體系 標(biāo)準(zhǔn)型 擴(kuò)展型 合作型 第三節(jié)、經(jīng)濟(jì)博弈論內(nèi)容體系 2、合作博弈與非合作博弈 局中人之間是否有具有約束力的協(xié)議,博弈可分為: 合作博弈:有。強(qiáng)調(diào)團(tuán)體理性,效率、公平和公正 非合作博弈:沒有。強(qiáng)調(diào)個(gè)人理性、個(gè)人最優(yōu)選擇,其結(jié)果可能是有效率的,也可能是無效率的。 第三節(jié)、經(jīng)濟(jì)博弈論內(nèi)容體系 (1)從局中人行動(dòng)的時(shí)間順序上,分為:靜態(tài)博弈:局中人同時(shí)行動(dòng),或雖然局中人的行動(dòng)有先有后,但后行動(dòng)者不能夠觀察
13、到先行動(dòng)者的行動(dòng);動(dòng)態(tài)博弈:局中人的行動(dòng)有先有后,且后行動(dòng)者能夠觀察到先行動(dòng)者的行動(dòng)。 非合作博弈可以從兩個(gè)角度進(jìn)行分類(2)從局中人掌握信息的角度,分為:完全信息博弈: 是指局中人對(duì)自己與其他局中人的所有與博弈有關(guān)的事前信息(策略空間、支付函數(shù)等)有充分的了解。(局中人的支付函數(shù)是共同知識(shí))不完全信息博弈 非合作博弈可以從兩個(gè)角度進(jìn)行分類. 四種不同類型的博弈 信息行動(dòng)順序完全信息不完全信息靜態(tài)完全信息靜態(tài)博弈納什均衡Nash (1950,1951)不完全信息靜態(tài)博弈貝葉斯納什均衡Harsanyi (1967-1968)動(dòng)態(tài)完全信息動(dòng)態(tài)博弈子博弈完美納什均衡Selten (1965)不完全信
14、息動(dòng)態(tài)博弈完美貝葉斯納什均衡Selten (1975);Kreps &Wilson (1982)經(jīng)濟(jì)博弈論基礎(chǔ) Economic Game Theory 第二部分非合作博弈理論 第二章 策略型博弈第三章 擴(kuò)展型博弈第四章 貝葉斯博弈第五章 動(dòng)態(tài)貝葉斯博弈 主要內(nèi)容第一節(jié) 策略型博弈的表示第二節(jié) 重復(fù)剔除嚴(yán)格劣策略均衡第三節(jié) 納什均衡第四節(jié) 混合策略納什均衡第五節(jié) 納什均衡的存在性 第二章 策略型博弈 同時(shí)行動(dòng),如何決策 策略型(標(biāo)準(zhǔn)型)表述 適合表示靜態(tài)博弈擴(kuò)展型表述 適合表示動(dòng)態(tài)博弈 博弈有兩種表述方法一、策略型博弈的含義 完全信息靜態(tài)博弈又稱為策略型博弈。完全信息是指局中人對(duì)自己與其他局中
15、人的所有與博弈有關(guān)的事前信息(策略空間、支付函數(shù)等)有充分的了解(局中人的支付函數(shù)是共同知識(shí))。靜態(tài)博弈是指在博弈中,局中人同時(shí)采取行動(dòng),或者局中人的行動(dòng)有先有后,但后行動(dòng)者不能知道先行動(dòng)者的行動(dòng)選擇。 第一節(jié) 策略型博弈的表示 二、策略型博弈的三個(gè)要素: 1、局中人(Players): 1, 2, , n; 2、策略(Strategies): ; 3、支付函數(shù) (Payoff functions)表示為: 第一節(jié) 策略型博弈的表示 1、有限博弈: (1) 博弈中局中人人數(shù)有限; (2) 每個(gè)局中人只有有限個(gè)策略。 2、零和博弈: 博弈中局中人所獲支付之和為零,即一方所得為另一方所失。 三、兩
16、種特殊博弈類型1、局中人:甲,乙2、策 略: 坦白,不坦白3、支付函數(shù)支付矩陣(雙人有限博弈) 每個(gè)位置上第一個(gè)數(shù)字表示局中人1在對(duì)應(yīng)的策略組合中得到的支付,第二個(gè)數(shù)字表示局中人2的相應(yīng)所獲支付。 例2.1 囚徒困境及其策略型表示 (Tucker,1950) 乙 甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2 囚徒困境的支付矩陣 乙 甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,1 例2.2 石頭、剪刀、布的支付矩陣 田忌 齊王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-3
17、1,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3 例2.3 田忌賽馬的支付矩陣 局中人:男,女 策 略:男:看足球,看芭蕾 女:看足球,看芭蕾 支付矩陣:見下一頁(yè) 例2.4 性別大戰(zhàn)(battle of the sexes) 女 男足球芭蕾足球3,21,1芭蕾-1,-12,3 性別大戰(zhàn)的支付矩陣一、基本思想: 如果一個(gè)局中人在任何情況下從某種策略中得到的支付均小于從另一種策略中得到的支付,那么顯然
18、對(duì)他而言,前一種策略劣于后一種策略。 從個(gè)人利益出發(fā),被剔除的策略不會(huì)被局中人采用。從而可以利用剔除嚴(yán)格劣策略的概念來簡(jiǎn)化博弈局勢(shì),可能會(huì)得到博弈的解。第二節(jié) 重復(fù)剔除嚴(yán)格劣策略均衡 ,如果存在 ,對(duì)于所有的都有 且其中至少有一個(gè)為嚴(yán)格不等式 ,則稱 是第i個(gè)局中人的一個(gè)嚴(yán)格劣策略。 二、嚴(yán)格劣策略的定義 1、根據(jù)理性的局中人不會(huì)選擇嚴(yán)格劣策略這一原則,可以通過重復(fù)剔除嚴(yán)格劣策略的方法對(duì)博弈進(jìn)行求解。 2、其方法是:對(duì)每個(gè)局中人尋找嚴(yán)格劣策略,由于它不會(huì)被局中人選擇實(shí)施,所以找到一種后就可以將其從博弈局勢(shì)中剔除,從而得到一種新的縮減后的博弈局勢(shì),對(duì)這種新局勢(shì)重復(fù)上述過程,直到無法找到新的嚴(yán)格劣
19、策略為止。 三、重復(fù)剔除嚴(yán)格劣策略 對(duì)局中人甲而言,無論局中人乙采取何種策略,采用“不坦白”策略得到的支付都小于采用“坦白”策略。局中人甲的“不坦白”策略嚴(yán)格劣于“坦白”策略. “不坦白”策略都是一種嚴(yán)格劣策略,從而可以剔除。博弈中局中人各自從自身利益出發(fā)的理性選擇(博弈均衡解)就是(坦白,坦白)。 四、囚徒困境的解 乙 甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2 例2.1 囚徒困境的支付矩陣 甲:“不坦白”相對(duì)于“坦白”是嚴(yán)格劣策略 乙 甲坦白不坦白坦白-6,-6-1,-8乙:“不坦白”相對(duì)于“坦白”是嚴(yán)格劣策略 乙 甲坦白坦白-6,-6 例2.5 利用重復(fù)剔除嚴(yán)格劣策略
20、求解 乙 甲左中右上1,01,20,1下0,30,12,0乙:“右”相對(duì)于“中”是嚴(yán)格劣策略 乙 甲左中右上1,01,20,1下0,30,12,0甲:“下”相對(duì)于“上”是嚴(yán)格劣策略 乙 甲左中上1,01,2下0,30,1乙:“左”相對(duì)于“中”是嚴(yán)格劣策略 乙 甲左中上1,01,2 重復(fù)剔除嚴(yán)格劣策略均衡是(上,中) 乙 甲中上1,21、每一步剔除需要局中人間相互了解的更進(jìn)一步假定,如果我們把這一過程應(yīng)用到任意多步,需要假定“局中人是理性的”是共同知識(shí)。2、這一方法對(duì)博弈結(jié)果的預(yù)測(cè)經(jīng)常是不準(zhǔn)確的. 五、重復(fù)剔除嚴(yán)格劣策略有兩個(gè)缺陷 乙 甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,
21、-1布1,-1-1,10,1 例2.2 石頭、剪刀、布的支付矩陣 利用重復(fù)剔除嚴(yán)格劣策略無法求解 例2.6 利用重復(fù)剔除嚴(yán)格劣策略無法求解 乙 甲左中右上0,44,05,3中4,00,45,3下3,53,56,6大多數(shù)的博弈局勢(shì)中使用剔除嚴(yán)格劣策略的方法能夠?qū)Σ┺木謩?shì)進(jìn)行簡(jiǎn)化,但可能得不到博弈的均衡解。需要引入非合作博弈理論中的核心概念 納什均衡 (Nash Equilibrium)。 六、注意一、納什均衡的思想 “雙贏” 或 “多贏” 第三節(jié) 納什均衡它是關(guān)于博弈結(jié)局的一致性預(yù)測(cè) 如果所有局中人預(yù)測(cè)一個(gè)特定的納什均衡會(huì)出現(xiàn),那么這種均衡就會(huì)出現(xiàn)。 只有納什均衡才能使每個(gè)局中人均認(rèn)可這種結(jié)局,
22、而且他們均知道其他局中人也認(rèn)可這種結(jié)局。 二、納什均衡的意義 1、博弈的納什均衡是這樣一種最優(yōu)策略組合,是一種你好、我好大家都好的理性結(jié)局,其中每一個(gè)局中人均不能也不想單方面改變自己的策略而增加收益,每個(gè)局中人選擇的策略是對(duì)其他局中人所選策略的最佳反應(yīng)。 三、納什均衡的定義 2、數(shù)學(xué)定義: 在策略型博弈 中,如果對(duì)于每個(gè)局中人i,存在 ,都有 或 則稱策略組合 是此博弈G的一個(gè)納什均衡。 三、納什均衡的定義1、雙人有限博弈:雙劃線法 首先對(duì)局中人2的每一個(gè)策略,局中人1尋找支付最大的策略,在其對(duì)應(yīng)支付下劃線; 然后對(duì)局中人1進(jìn)行相應(yīng)的步驟; 最后,凡是兩個(gè)局中人支付下均被劃線的結(jié)局就是納什均衡
23、。 四、納什均衡的求法用雙劃線法可以求出納什均衡: (坦白,坦白),(-6,-6)意義:揭示個(gè)人理性與集體理性之間的矛盾。 例2.1 囚徒困境的納什均衡 乙 甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2 乙 甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2 乙 甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2 局中人:大豬,小豬 策 略:大豬:按,等待 小豬:按,等待 支付矩陣:見下一頁(yè) 納什均衡:(按,等待) 例2.7 智豬博弈(boxed pigs) 小豬 大豬按等待按5,14,4等待9,-10,0 例2.7 智豬博弈的支付矩陣 小豬 大豬按等
24、待按5,14,4等待9,-10,0 小豬 大豬按等待按5,14,4等待9,-10,0 女 男足球芭蕾足球3,21,1芭蕾-1,-12,3 例2.4 性別大戰(zhàn)博弈的支付矩陣 女 男足球芭蕾足球3,21,1芭蕾-1,-12,3 女 男足球芭蕾足球3,21,1芭蕾-1,-12,3 局中人:甲,乙 策 略:甲:放左手,放右手 乙:猜左手,猜右手 支付矩陣:見下一頁(yè) 沒有納什均衡 例2.8 猜左右手游戲 乙 甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1 乙 甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1 乙 甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,12、連續(xù)性博
25、弈納什均衡的求法 首先求出每個(gè)局中人對(duì)其他局中人策略組合的反應(yīng)函數(shù)即在其他局中人策略組合給定時(shí)極大化自己的支付,得到的最佳反應(yīng)策略表現(xiàn)為其他局中人策略組合的函數(shù); 然后將這些反應(yīng)函數(shù)聯(lián)立求解即得到博弈的納什均衡解。 四、納什均衡的求法 局中人:廠商1,廠商2 策 略:廠商1:選擇產(chǎn)量 廠商2:選擇產(chǎn)量 假 設(shè):價(jià)格 支付函數(shù) (利潤(rùn)函數(shù)) : 例2.9 兩寡頭產(chǎn)量競(jìng)爭(zhēng)Cournot(1838)模型 Cournot 模型求解 反應(yīng)函數(shù): 納什均衡: Cournot 模型求解 假設(shè)兩寡頭可以串謀,共同確定產(chǎn)量Q使總利潤(rùn)最大化,利潤(rùn)函數(shù)為:(Q)=Q(a-Q-c) 總利潤(rùn)最大的產(chǎn)量為: 稱為契約曲線
26、 總利潤(rùn)為: 比較及含義: 兩寡頭產(chǎn)量串謀模型 Q1 廠商2的反應(yīng)曲線 納什均衡 契約曲線 廠商1的反應(yīng)曲線 O Q2 圖1 反應(yīng)曲線、納什均衡與契約曲線局中人:廠商1,廠商2 策 略:廠商1選擇價(jià)格 ;廠商2選擇價(jià)格假 設(shè): 兩寡頭固定成本都為0,邊際成本為常數(shù)c, 消費(fèi)者對(duì)廠商1和2生產(chǎn)產(chǎn)品的需求量分別為: ; 例2.10 兩寡頭價(jià)格競(jìng)爭(zhēng)Bertrand(1883)模型支付(利潤(rùn))函數(shù): 最優(yōu)化的一階條件是: Bertrand(1883)模型及求解 反應(yīng)函數(shù): 納什均衡價(jià)格: Bertrand(1883)模型及求解 在n個(gè)局中人的策略型博弈中, 1、如果重復(fù)剔除嚴(yán)格劣策略剔除掉除策略組合s
27、以外的所有策略,則這一策略組合s為該博弈的唯一的納什均衡。 2、如果策略組合s是一個(gè)納什均衡,那么它就不會(huì)被重復(fù)剔除嚴(yán)格劣策略所剔除。 納什均衡是比重復(fù)剔除嚴(yán)格劣策略更強(qiáng)的解概念。五、納什均衡與重復(fù)剔除嚴(yán)格劣策略均衡 一、舉例說明混合策略納什均衡 例2.8 猜左右手游戲 第四節(jié) 混合策略納什均衡 乙 甲(q)猜左手(1-q)猜右手(p)放左手-1, 11, -1(1-p)放右手1, -1-1, 1 在甲選 ,乙選 這種策略時(shí),他們的期望效用分別為: 混合策略與期望效用甲和乙的目標(biāo)是:最優(yōu)化的一階條件是: 混合策略納什均衡 混合策略納什均衡為: 混合策略納什均衡1、混合策略(mixed Stra
28、tegy) 局中人 i 的一個(gè)混合策略 是在其純策略空間 上的一個(gè)概率分布,其中 是 i 選擇策略 的概率。局中人 i的混合策略空間 是他的所有混合策略構(gòu)成的集合。 純策略可以理解為混合策略的特例。如 等價(jià)于 二、混合策略納什均衡 在混合策略組合 下,局中人 i的期望效用函數(shù)為: 其中 2、期望效用函數(shù) 在策略型博弈 中,如果對(duì)于每個(gè)局中人 i,存在 ,都有 或 則稱 是博弈G的一個(gè)混合策略納什均衡。 3、混合策略納什均衡 奇數(shù)定理 (Wilson 1971) :幾乎所有的有限博弈都有奇數(shù)個(gè)納什均衡。 4、奇數(shù)定理例2.11 社會(huì)保障博弈 局中人:政府和下崗工人 策 略:政 府:救濟(jì),不救濟(jì)
29、下崗工人:找工作,不找工作 支付矩陣為: 三、應(yīng)用舉例 工人 政府找工作不找救濟(jì)3,2-1,3不救濟(jì)-1,10,0 女 男足球芭蕾足球3,21,1芭蕾-1,-1 求出性別大戰(zhàn)博弈的混合策略納什均衡 定理1:(Nash, 1950)每個(gè)有限策略型博弈至少存在一個(gè)納什均衡(純策略的或混合策略的)。 第五節(jié) 納什均衡的存在性 Brouwer不動(dòng)點(diǎn)定理:如果X是非空的有界閉凸集,f(x)是X到自身的連續(xù)映射,那么至少存在一個(gè)xX,使得 f(x)=x,x稱為不動(dòng)點(diǎn)。 Kakutani不動(dòng)點(diǎn)定理:設(shè)f(X)是點(diǎn)集X上的一個(gè)集值映射,如果X是非空的有界閉凸集,并且對(duì)于所有的xX,f(x)是非空的、凸的且上半
30、連續(xù)的,那么至少存在一個(gè)xX,使得 xf(x),x稱為不動(dòng)點(diǎn)。 納什均衡的存在性證明 1、集值映射:對(duì)于集合X上的任何一個(gè)點(diǎn)x,如果f(x)給出唯一的一個(gè)點(diǎn)yY,則f(x)稱為從X到Y(jié)的映射;如果f(x)給出一個(gè)集合f(x)Y,則f(x)稱為從X到Y(jié)的集值映射。 映射是集值映射的特例。 2、上半連續(xù):設(shè)f(x)是X到自身的一個(gè)集值映射,如果對(duì)于所有的xX和包含f(x)的開集V,都存在x的一個(gè)鄰域U,使得對(duì)于所有的xU,有f(x)V,則稱f(x)是上半連續(xù)的。 注:集值映射和上半連續(xù) 定理2:(Debreu, 1952 ; Glicksberg,1952 ; Fan, 1952) 在n人策略型博
31、弈中,如果每個(gè)局中人的純策略空間Si是歐氏空間中的一個(gè)非空的有界閉凸集,支付函數(shù)ui(s)是連續(xù)的且對(duì)si是擬凹的,那么該博弈存在一個(gè)純策略納什均衡。 定理3:(Glicksberg,1952) 在n人策略型博弈中,如果每個(gè)局中人的純策略空間Si是歐氏空間中的一個(gè)非空的有界閉凸集,支付函數(shù)ui(s)是連續(xù)的,那么該博弈存在一個(gè)混合策略納什均衡。 定理1的推廣:從有限到無限經(jīng)濟(jì)博弈論基礎(chǔ)Economic Game Theory 第二部分非合作博弈理論 第二章 策略型博弈第三章 擴(kuò)展型博弈第四章 貝葉斯博弈第五章 動(dòng)態(tài)貝葉斯博弈 主要內(nèi)容第一節(jié) 擴(kuò)展型博弈的表述第二節(jié) 擴(kuò)展型博弈的納什均衡第三節(jié)
32、子博弈完美納什均衡第四節(jié) 重復(fù)博弈 第三章 擴(kuò)展型博弈 行動(dòng)有先有后,如何制勝1、一局博弈可能有不止一個(gè)納什均衡,事實(shí)上,有些博弈可能有無數(shù)個(gè)納什均衡,究竟哪個(gè)納什均衡實(shí)際上會(huì)發(fā)生?不知道。2、納什均衡并不一定導(dǎo)致帕累托最優(yōu)。例如“囚徒困境”意味納什均衡并不導(dǎo)致帕累托最優(yōu),導(dǎo)致了個(gè)人理性與集體理性的矛盾。對(duì)于這樣的問題,納什均衡沒有給出解決的辦法。 一、納什均衡存在的問題3、 納什均衡假定:每個(gè)人將別人的策略視為給定,選擇對(duì)自己最有利的策略,即如果其他局中人不改變策略,任何單個(gè)局中人不能通過單方面改變策略來提高他的效用或收益。這種完全信息的假定不符合實(shí)際情況。 一、納什均衡存在的問題4、在納什
33、均衡中,局中人在選擇自己的策略時(shí),把其他局中人的策略當(dāng)作給定的,不考慮自己的選擇如何影響對(duì)手的策略。這個(gè)假設(shè)在研究靜態(tài)博弈時(shí)是成立的,因?yàn)樵陟o態(tài)博弈下,所有局中人同時(shí)行動(dòng),無暇反應(yīng)。但對(duì)動(dòng)態(tài)博弈而言,這個(gè)假設(shè)就有問題了。當(dāng)一個(gè)人行動(dòng)在先,另一個(gè)人行動(dòng)在后時(shí),后者自然會(huì)根據(jù)前者的選擇而調(diào)整自己的選擇,前者自然會(huì)理性地預(yù)期到這一點(diǎn),所以不可能不考慮自己的選擇對(duì)其對(duì)手的選擇的影響。 一、納什均衡存在的問題5、與第4個(gè)問題相聯(lián)系,由于不考慮自己選擇對(duì)別人選擇的影響,納什均衡允許了不可置信威脅的存在。這就引出了澤爾騰(Selten)的貢獻(xiàn)。 一、納什均衡存在的問題 對(duì)“納什均衡”加以修正提出了“子博弈完
34、美納什均衡”和“顫抖手完美納什均衡”,去剔除那些不合理的納什均衡,提出了“均衡選擇”問題。 二、Selten的貢獻(xiàn)一、擴(kuò)展型博弈的含義 完全信息動(dòng)態(tài)博弈又稱為擴(kuò)展型博弈。擴(kuò)展型博弈是指在完全信息博弈中,局中人的行動(dòng)有先有后,后行動(dòng)者可以觀察到先行動(dòng)者的行動(dòng)。 第一節(jié) 擴(kuò)展型博弈的表述二、擴(kuò)展型博弈的表述 擴(kuò)展型擴(kuò)展的是策略型中的策略,有六個(gè)要素: 1、局中人集合; 2、局中人的行動(dòng)順序; 3、局中人的行動(dòng)空間; 4、局中人的信息集; 5、支付函數(shù); 6、 外生事件的概率分布。 第一節(jié) 擴(kuò)展型博弈的表述1、結(jié)點(diǎn) (nodes)2、枝 (branches):行動(dòng)3、信息集 (information
35、 set): (1)同一個(gè)局中人的一些結(jié)點(diǎn)構(gòu)成的集合; (2)表示博弈到了這個(gè)集合,但不知到了這個(gè)集合的哪一個(gè)結(jié)點(diǎn)上。 三、博弈樹兩家房地產(chǎn)開發(fā)商A、B,考慮是否在同一地段開發(fā)寫字樓,各自面臨的選擇是開發(fā)還是不開發(fā)。房地產(chǎn)市場(chǎng)充滿了風(fēng)險(xiǎn),風(fēng)險(xiǎn)來自市場(chǎng)需求的不確定性:需求可能大,也可能小。該博弈的行動(dòng)順序?yàn)椋海?)開發(fā)商A首先行動(dòng),選擇開發(fā)或者不開發(fā);(2)在A決策后,自然選擇市場(chǎng)需求的大??;(3)開發(fā)商B在觀測(cè)到A的選擇和市場(chǎng)需求后,決定開發(fā)或不開發(fā)。 例3.1 房地產(chǎn)開發(fā)博弈 開發(fā) 不開發(fā) N N 大 小 大 小 B B B B 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 房地產(chǎn)
36、開發(fā)博弈的博弈樹 開發(fā) 不開發(fā) N N 大 小 大 小 B B B B 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 房地產(chǎn)開發(fā)博弈的博弈樹 開發(fā) 不開發(fā) N N 大 小 大 小 B B B B 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 房地產(chǎn)開發(fā)博弈的博弈樹1、完美信息(perfect information)博弈是指博弈中所有信息集都是單點(diǎn)集。在完美信息博弈中,一次只有一個(gè)局中人在行動(dòng),而且他在行動(dòng)時(shí)知道博弈所有以往行動(dòng)的歷史。2、完美回憶(perfect recall)博弈是指沒有局中人會(huì)忘記自己所知道的信息,所有局中人都記得自己以往的行動(dòng)選擇。 四、完美信息博弈
37、與完美回憶博弈一、以房地產(chǎn)開發(fā)博弈為例說明從擴(kuò)展型表述構(gòu)造出策略型表述,從而求出納什均衡。 擴(kuò)展型 擴(kuò)展型博弈納什均衡 博弈 策略型 策略型博弈納什均衡二、局中人的策略是關(guān)于行動(dòng)的一個(gè)完整的計(jì)劃,它明確了在局中人可能會(huì)遇到的各種情況下對(duì)可行行動(dòng)的選擇。 第二節(jié) 擴(kuò)展型博弈的納什均衡例題:房地產(chǎn)開發(fā)博弈 A 開發(fā) 不開發(fā) B B 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)(-3,-3) (1,0) (0,1) (0,0) 第二節(jié) 擴(kuò)展型博弈的納什均衡 三、 擴(kuò)展型博弈的納什均衡 B A(開,開)(開,不)(不,開)(不,不)開發(fā)不開 三、 擴(kuò)展型博弈的納什均衡 B A(開,開)(開,不)(不,開)(不,不)開發(fā)
38、-3, -3-3, -31 , 01, 0不開 0 , 1 0 , 00, 10, 0 三、 擴(kuò)展型博弈的納什均衡 B A(開,開)(開,不)(不,開)(不,不)開發(fā)-3, -3-3, -31 , 01, 0不開 0 , 1 0 , 00, 10, 0 此博弈有三個(gè)納什均衡: (開發(fā),(不開發(fā),開發(fā))) (開發(fā),(不開發(fā),不開發(fā))) (不開發(fā),(開發(fā),開發(fā))) 三、 擴(kuò)展型博弈的納什均衡 1、定義擴(kuò)展型博弈的策略 2、定義擴(kuò)展型博弈的納什均衡 三、 擴(kuò)展型博弈的納什均衡 1、有限擴(kuò)展型博弈:擴(kuò)展型博弈有有限個(gè)信息集,每個(gè)信息集上只有有限個(gè)行動(dòng)。 2、定理:(Zemelo,1913; Kuhn,
39、 1953)完美信息有限擴(kuò)展型博弈存在純策略納什均衡。 四、 有限擴(kuò)展型博弈一、子博弈:稱G1是G的一個(gè)子博弈,如果滿足: 1、子博弈G1是原博弈G的一部分; 2、子博弈G1必須從單結(jié)信息集開始; 3、子博弈G1的信息集和支付向量都繼承自原博弈G 。 第三節(jié) 子博弈完美納什均衡房地產(chǎn)開發(fā)博弈有三個(gè)子博弈,除原博弈外,還有: B B 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) (-3,-3) (1,0)(0,1) (0,0) G1 G2 例3.1 房地產(chǎn)開發(fā)博弈的子博弈二、子博弈完美納什均衡 (Subgame perfect Nash Equilibrium)擴(kuò)展型博弈的一個(gè)策略組合是子博弈完美納什均衡當(dāng)且僅當(dāng)
40、它在每一個(gè)子博弈上都構(gòu)成納什均衡。 第三節(jié) 子博弈完美納什均衡三、子博弈完美納什均衡的求法 1、定義 2、逆向歸納法(Backward Induction) 完美信息有限博弈 第三節(jié) 子博弈完美納什均衡例3.1、房地產(chǎn)開發(fā)博弈的子博弈完美納什均衡: 定義求法 逆向歸納法求法 四、 舉例房地產(chǎn)開發(fā)博弈 A 開發(fā) 不開發(fā) B B 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)(-3,-3) (1,0) (0,1) (0,0) 子博弈完美納什均衡的求法房地產(chǎn)開發(fā)博弈 A 開發(fā) 不開發(fā) B B 不開發(fā) 開發(fā) 不開發(fā) (1,0) (0,1) (0,0) 子博弈完美納什均衡的求法房地產(chǎn)開發(fā)博弈 A 開發(fā) 不開發(fā) B B 不開
41、發(fā) 開發(fā) (1,0) (0,1) 子博弈完美納什均衡的求法房地產(chǎn)開發(fā)博弈 A 開發(fā) 不開發(fā) B B 不開發(fā) 開發(fā) (1,0) (0,1) 子博弈完美納什均衡的求法 局中人:廠商1,廠商2 策 略:廠商1先行動(dòng),選擇產(chǎn)量去q1; 廠商2觀察到q1 后,選擇自己的產(chǎn)量q2. 假 設(shè):價(jià)格 支付(利潤(rùn))函數(shù): 例3.2 兩寡頭產(chǎn)量競(jìng)爭(zhēng)的 Stackelberg (1934)模型 用逆向歸納法求出子博弈完美納什均衡: (1) Stackelberg 模型求解 代入(1)式得: Stackelberg 模型求解子博弈完美納什均衡:與Cournot模型的納什均衡比較: 子博弈完美納什均衡 納什均衡 動(dòng)態(tài)博
42、弈時(shí),廠商2有后動(dòng)優(yōu)勢(shì)。 動(dòng)態(tài)Bertrand模型求解利用逆向歸納法求解出的 子博弈完美納什均衡的 結(jié)果與現(xiàn)實(shí) 存在一定的 差異,受到了一些學(xué)者的批評(píng)。其中最著名的是蜈蚣博弈及其實(shí)驗(yàn)。 五、 逆向歸納法的不足 小寶C 大寶C 小寶C 大寶C 小寶C 大寶C S S S S S S 例3.4 蜈蚣博弈 小寶C 大寶C 小寶C 大寶C 大寶C S S S S S 例3.5 蜈蚣博弈一、重復(fù)博弈:同樣結(jié)構(gòu)的博弈重復(fù)多次。 1、重復(fù)博弈的基本特征: (1)單次博弈之間沒有實(shí)質(zhì)聯(lián)系,即前一階段的博弈不改變其它階段的博弈結(jié)構(gòu); (2)所有局中人能夠觀測(cè)并記憶以往的博弈歷史; (3)局中人的總支付為各階段支
43、付的貼現(xiàn)值之和或者加權(quán)平均值。 第四節(jié) 重復(fù)博弈2、影響重復(fù)博弈均衡結(jié)果的主要因素: (1)博弈重復(fù)的次數(shù); (2)信息的完備性。 一、 重復(fù)博弈1、有限次重復(fù)博弈的子博弈完美納什均衡 以囚徒困境為例 二、 有限次重復(fù)博弈 2、定理:以階段博弈G構(gòu)成的重復(fù)T次(Tei的v(對(duì)每個(gè)i),存在一個(gè)貼現(xiàn)因子1使得對(duì)于所有的, v=(v1,v2,vn)是一個(gè)特定的子博弈完美均衡的支付向量。 三、無限次重復(fù)博弈 無名氏定理的含義:在無限次重復(fù)博弈中,如果局中人有足夠的耐心(即足夠大),那么,任何滿足個(gè)人理性的可行的支付向量都可以通過一個(gè)特定的子博弈完美均衡而實(shí)現(xiàn)。 三、無限次重復(fù)博弈經(jīng)濟(jì)博弈論基礎(chǔ)Eco
44、nomic Game Theory 第二部分非合作博弈理論 第二章 策略型博弈第三章 擴(kuò)展型博弈第四章 貝葉斯博弈第五章 動(dòng)態(tài)貝葉斯博弈 主要內(nèi)容第一節(jié) 貝葉斯博弈及其策略型表示第二節(jié) 貝葉斯納什均衡第三節(jié) 拍賣與招標(biāo)博弈分析第四節(jié) 混合策略納什均衡重新解釋 第四章 貝葉斯博弈 不了解對(duì)手,同時(shí)行動(dòng)時(shí),如何抉擇一、不完全信息與貝葉斯博弈 完全信息:支付函數(shù)是共同知識(shí) 不完全信息:至少有一個(gè)局中人不能確定其他局中人的支付函數(shù) 第一節(jié) 貝葉斯博弈及其策略型表示例4.1 市場(chǎng)進(jìn)入博弈 在位者 高成本情況 低成本情況 默許 斗爭(zhēng) 默許 斗爭(zhēng) 進(jìn)入進(jìn)入者 不進(jìn)入 不完全信息博弈舉例40, 50-10,
45、030, 80-10, 1000, 3000, 300 0, 400 0, 400例4.2 求愛博弈 求愛者 品德好 品德差 求愛 不求愛 求愛 不求愛 接受 你 不接受 不完全信息博弈舉例100,1000, 0-100, 1000, 0 0, -50 0, 0 0, 0 0, 0Harsanyi(1967-68)方法:引入一個(gè)虛擬的局中人“自然”,自然首先選擇局中人的特征,局中人知道自己的特征,其他局中人不知道。 把不完全信息博弈轉(zhuǎn)化為完全但不完美信息博弈。 二、Harsanyi 轉(zhuǎn)換 N 高p 低1-p 進(jìn)入者 進(jìn)入者 不進(jìn)入 進(jìn)入 不進(jìn)入 進(jìn)入(0,300) 在位者 (0,400) 在位
46、者 默許 斗爭(zhēng) 默許 斗爭(zhēng) (40,50) (-10,0) (30,80) (-10,100) Harsanyi 轉(zhuǎn)換后的市場(chǎng)進(jìn)入博弈類型是個(gè)人特征的完備描述,由支付函數(shù)完全決定,等同于支付函數(shù)。 不完全信息表明:至少有一個(gè)局中人有多個(gè)類型。 i局中人 i的類型空間 i局中人 i的一個(gè)類型 1、類型 假定分布函數(shù) 是所有局中人的共同知識(shí)。 從而局中人 i有私人信息 ,即類型為 的局中人 i有關(guān)其他局中人屬于 的條件概率。 2、Harsanyi 假設(shè)1、局中人的類型空間i,i=1, n2、條件概率 3、類型依存策略空間 4、類型依存支付函數(shù) 三、貝葉斯博弈的策略型表示1、自然選擇類型向量 ,局中
47、人 i 觀測(cè)到 i,局中人 j 觀測(cè)不到 i,只知道 ;2、所有局中人同時(shí)選擇行動(dòng) ;3、局中人 i 得到 。假定 和 是共同知識(shí)。 四、貝葉斯博弈的時(shí)間順序局中人 i 的期望效用函數(shù)為: 五、期望效用函數(shù)一、貝葉斯納什均衡的定義:貝葉斯博弈 的純策略組合 是一個(gè)貝葉斯納什均衡,如果對(duì)于每個(gè)局中人 i,有: 第二節(jié) 貝葉斯納什均衡 局中人:廠商1,廠商2 類 型: 策 略:廠商1和 2同時(shí)行動(dòng),選擇產(chǎn)量q1和產(chǎn)量q2 假 設(shè):p = 2 (q1 + q2 ) 支付(利潤(rùn))函數(shù): 例4.3 不完全信息 Cournot 模型從最優(yōu)化的一階條件解出廠商2的反應(yīng)函數(shù)為: ; (1)廠商1不知道廠商2的
48、最優(yōu)反應(yīng)究竟是 還是 ,他的期望利潤(rùn)函數(shù): 解最優(yōu)化的一階條件得廠商1的反應(yīng)函數(shù)為: (2) 例4.3 不完全信息 Cournot 模型均衡意味著兩個(gè)反應(yīng)函數(shù)(1)和(2)同時(shí)成立,解兩個(gè)反應(yīng)函數(shù)得貝葉斯納什均衡為: ; ; 與完全信息下的納什均衡比較: 如果廠商2的成本是 ,廠商1知道,那么納什均衡產(chǎn)量為: , ;如果廠商2的成本是 ,廠商1知道,那么納什均衡產(chǎn)量為: , 。 例4.3 不完全信息 Cournot 模型 ; ; 與完全信息下情況相比,在不完全信息下,低成本廠商2的產(chǎn)量相對(duì)較低,高成本廠商2的產(chǎn)量較高。導(dǎo)致這個(gè)結(jié)果的原因是,當(dāng)廠商1不知道廠商2的成本時(shí),只能生產(chǎn)預(yù)期的最優(yōu)產(chǎn)量,
49、高于完全信息下對(duì)低成本競(jìng)爭(zhēng)對(duì)手時(shí)的產(chǎn)量,低于完全信息下對(duì)高成本競(jìng)爭(zhēng)對(duì)手時(shí)的產(chǎn)量,廠商2對(duì)此作出反應(yīng)。 例4.3 不完全信息 Cournot 模型一、拍賣 1、拍賣是指以公開競(jìng)價(jià)的形式,由拍賣機(jī)構(gòu)在一定的時(shí)間和地點(diǎn),按照一定的章程和規(guī)則,將特定物品或財(cái)產(chǎn)權(quán)利轉(zhuǎn)讓給最高應(yīng)價(jià)者的一種買賣方式。 第三節(jié) 拍賣與招標(biāo)博弈分析 公元前500年左右,古希臘著名歷史學(xué)家希羅多德記載:古巴比倫人用拍賣方式購(gòu)買婦女作為妻子的行為。 古羅馬帝國(guó),拍賣已成為商品買賣的一種普遍形式。 2、拍賣的起源 1、適度規(guī)模的人口,由此形成買賣雙方; 2、剩余產(chǎn)品的出現(xiàn),由此形成拍賣物品; 3、貨幣的存在,由此形成競(jìng)價(jià)付現(xiàn)。 3、
50、拍賣產(chǎn)生的社會(huì)自然條件 (1)揭示價(jià)格 (2)減少代理成本 4、拍賣的作用 “三公一高”原則公平、公正、公開,價(jià)高者得 5、拍賣基本原則英國(guó)倫敦的索思比拍賣行和克里斯蒂拍賣行(藝術(shù)品、古董) 6、世界著名拍賣行 (1)英式拍賣 (2)荷蘭式拍賣 (3)第一價(jià)格密封拍賣 (4)第二價(jià)格密封拍賣 (5)雙方叫價(jià)拍賣 7、拍賣的主要形式(1)一般均衡理論中的拍賣解釋(2)解釋的不足 8、一般均衡理論中的拍賣1、拍賣博弈分析: 第一價(jià)格密封拍賣 第二價(jià)格密封拍賣 第n價(jià)格密封拍賣 雙方叫價(jià)拍賣 二、拍賣與招標(biāo)博弈分析(1)考慮兩個(gè)投標(biāo)人 i=1, 2的情況: vi拍賣物品對(duì)投標(biāo)人 i的價(jià)值 vi 0,
51、1 均勻分布 bi0 投標(biāo)人 i的出價(jià) bi= bi(vi)嚴(yán)格遞增可微函數(shù) 第一價(jià)格密封拍賣博弈分析投標(biāo)人1的期望支付為:由對(duì)稱性,其中 是b*的逆函數(shù)。 第一價(jià)格密封拍賣博弈分析因此投標(biāo)人1的問題是: 最優(yōu)化的一階條件: 第一價(jià)格密封拍賣博弈分析(2)考慮n個(gè)投標(biāo)人的情況: 評(píng)價(jià)為vi的投標(biāo)人 i出價(jià)b,他的期望支付函數(shù)為: 最優(yōu)化的一階條件: 第一價(jià)格密封拍賣博弈分析2、招標(biāo)博弈分析: 第一價(jià)格密封招標(biāo) 第二價(jià)格密封招標(biāo) 第n價(jià)格密封招標(biāo) 二、拍賣與招標(biāo)博弈分析 某單位有一項(xiàng)建設(shè)工程要出包,選擇要價(jià)最低的承包者。讓每個(gè)投標(biāo)者將自己的標(biāo)價(jià)寫下來裝入一個(gè)信封,密封后交給招標(biāo)單位,信封打開后,
52、招標(biāo)單位選擇標(biāo)價(jià)最低者為中標(biāo)者,并按起標(biāo)價(jià)出包。 第一價(jià)格密封招標(biāo)博弈分析 每個(gè)投標(biāo)者的策略是根據(jù)自己的生產(chǎn)成本和對(duì)其他投標(biāo)人的判斷來選擇自己的出價(jià),贏者的支付是他的標(biāo)價(jià)減去他的生產(chǎn)成本,其他投標(biāo)者的支付為零。 報(bào)價(jià)越低,中標(biāo)的可能性就越大;但在給定中標(biāo)的情況下,報(bào)價(jià)越低,利潤(rùn)就越小。 第一價(jià)格密封招標(biāo)博弈分析考慮n個(gè)投標(biāo)人的情況: ci投標(biāo)人i的真實(shí)生產(chǎn)成本 ci 0,1 均勻分布 bi0 投標(biāo)人i的出價(jià) bi= bi(ci)嚴(yán)格遞增可微函數(shù) 第一價(jià)格密封招標(biāo)博弈分析考慮對(duì)稱的均衡出價(jià)策略 , 是 的逆函數(shù) 第一價(jià)格密封招標(biāo)博弈分析成本為c的投標(biāo)人i出價(jià)b,他的期望支付函數(shù)為:最優(yōu)化的一階條
53、件: 均衡情況下, 第一價(jià)格密封招標(biāo)博弈分析 第一價(jià)格密封招標(biāo)博弈分析1、拍賣制度與資源配置效率2、收入等價(jià)定理 三、拍賣制度與資源配置一、混合策略納什均衡的不完全信息解釋Harsanyi (1973) 證明:完全信息靜態(tài)博弈中的混合策略納什均衡可以解釋為不完全信息靜態(tài)博弈中貝葉斯納什均衡的極限。 第四節(jié) 混合策略納什均衡的重新解釋二、混合策略納什均衡的本質(zhì)特征不在于局中人j隨機(jī)地選擇行動(dòng),而在于局中人i不能確定局中人j將選擇什么純策略,這種不確定性可能來自局中人i不知道局中人j的類型。自然是通過選擇局中人的類型而不是選擇硬幣的出正反面制造了不確定性。 第四節(jié) 混合策略納什均衡的重新解釋三、舉
54、例 例4.4:抓錢博弈 乙 甲抓不抓抓-1,-11,0不抓0,10,0 第四節(jié) 混合策略納什均衡的重新解釋轉(zhuǎn)化為不完全信息博弈:1,2 -,+ 均勻分布 乙 甲抓不抓抓-1,-11+1,0不抓0, 1+20,0 例1:抓錢博弈甲:若11*,抓;若11*,不抓。乙:若22*,抓;若22*,不抓。Eu甲(抓)=(-1)P乙(抓)+(1+1)P乙(不抓)Eu甲(不抓)=0P乙(抓)+ 0P乙(不抓)其中: 局中人的純策略由Eu甲(抓)=Eu甲(不抓)及對(duì)稱性1* =2*,解得: 1* =2*=0 甲:若10,抓;若10,不抓。 乙:若20,抓;若20,不抓。 對(duì) i = 1, 2,i0 和i0 的概
55、率各為1/2.當(dāng)0,上述純策略貝葉斯納什均衡就收斂為完全信息博弈的混合策略納什均衡。 均衡情況下的最優(yōu)選擇 例4.5:性別大戰(zhàn)博弈 女 男足球芭蕾足球3,21,1芭蕾-1,-12,3m,w 0, x 均勻分布 轉(zhuǎn)化為不完全信息博弈 女 男足球芭蕾足球3+m ,21,1芭蕾-1,-12,3+w男:若mm*,看足球;若mm*,看芭蕾。女:若ww*,看芭蕾;若ww*,看足球。Eu男(足)=(3+m) P女(足)+ 1 P女(芭)Eu男(芭)=(-1) P女(足)+ 2 P女(芭)其中:P女(芭) =(x- w*)/ x P女(足)=1-(x- w*)/x 局中人的純策略由Eu男(足)=Eu男(芭)及
56、對(duì)稱性m* =w*解得: 男:若mm*,看足球;若mm*,看芭蕾。女:若ww*,看芭蕾;若w3,下列策略組合構(gòu)成一個(gè)完美貝葉斯納什均衡:理性囚徒1在t=1至t=T-2 階段一直選擇“不坦白”,然后在t=T-1和t=T階段選擇“坦白”;囚徒2在t=1至t=T-1階段選擇“不坦白”,然后在 t =T階段選擇“坦白” 。 一、KMRW聲譽(yù)模型將任何一個(gè)囚徒選擇“坦白”的階段成為非合作階段;兩個(gè)囚徒都選擇“不坦白”成為合作階段。結(jié)論:只要p1/3,非合作階段的總數(shù)量等于2,與T無關(guān)。 一、KMRW聲譽(yù)模型在T階段重復(fù)囚徒博弈中,如果每個(gè)囚徒都有p0的概率是非理性的(即只選擇“針鋒相對(duì)”或“冷酷策略”)
57、,如果T足夠大,那么存在一個(gè)T0T,使得下列策略組合構(gòu)成一個(gè)完美貝葉斯納什均衡:所有理性囚徒在tT0 階段選擇不合作(坦白);并且非合作階段的數(shù)量(T-T0)只于p有關(guān)而與T無關(guān)。 KMRW定理 盡管每一個(gè)囚徒選擇合作時(shí)冒者被其他囚徒出賣的風(fēng)險(xiǎn)(從而可能得到一個(gè)較低的現(xiàn)階段支付),但如果他選擇不合作,就暴露了他是非合作型的,從而失去了獲得長(zhǎng)期合作收益的可能(如果對(duì)方是合作型的)。 KMRW定理的直觀解釋如果博弈重復(fù)的次數(shù)足夠多,未來收益的損失就超過短期被出賣的損失,因此在博弈的開始,每個(gè)局中人都想樹立一個(gè)合作形象(使對(duì)方認(rèn)為自己是喜歡合作的),即使他在本性上并不是合作型的;只有在博弈快結(jié)束的時(shí)
58、候,局中人才會(huì)一次性地把自己過去建立的聲譽(yù)利用盡,合作才會(huì)停止(因?yàn)榇藭r(shí),短期收益很大而未來?yè)p失很?。?。 KMRW定理的直觀解釋 大智若愚確實(shí)是智者追求自己利益的最佳方式。 智者即囚徒博弈中的理性囚徒(非合作型),愚者即囚徒博弈中的非理性囚徒(合作型)。 行為方式的KMRW定理解釋 一個(gè)人干好事還是干壞事常常不取決于他是好人還是壞人,而取決于別人認(rèn)為他是好人還是壞人,因?yàn)閴娜艘灿信d趣建立一個(gè)好人的形象以謀取長(zhǎng)遠(yuǎn)利益。 行為方式的KMRW定理解釋 貨幣政策的動(dòng)態(tài)非一致性:政府沒有辦法承諾零通貨膨脹率,結(jié)果是一方面遭受通貨膨脹之苦,另一方面又不能得到產(chǎn)出增加之益。 二、聲譽(yù)模型應(yīng)用:政府的貨幣政策
59、 Barro(1986)和Vickers(1986)利用KMRW聲譽(yù)模型證明:如果公眾有關(guān)政府偏好的信息是不完全的,出于聲譽(yù)方面的考慮,即使政府的任期是有限的(因而博弈重復(fù)的次數(shù)是有限的),政府也可能選擇不制造通貨膨脹。 二、聲譽(yù)模型應(yīng)用:政府的貨幣政策經(jīng)濟(jì)博弈論基礎(chǔ)Economic Game Theory第四部分合作博弈理論 第一節(jié) 合作博弈的基本問題第二節(jié) 合作博弈解第三節(jié) 合作博弈應(yīng)用 第六章 合作博弈 從對(duì)手到合作,如何決策 一、合作博弈的意義 合作博弈的意義表現(xiàn)在它與非合作博弈的差別上。豪爾紹尼(1966)提出,在博弈局勢(shì)中,如果意愿表示(如協(xié)議、承諾、威脅等)具有完全的約束力且可強(qiáng)
60、制執(zhí)行的,則該博弈為合作博弈。如果意愿表示不可強(qiáng)制執(zhí)行,即使局中人之間在博弈之前可以互相交往,則只能是非合作博弈。 第一節(jié) 合作博弈的基本問題在形式上,有一種觀點(diǎn)認(rèn)為:可從如下角度把合作博弈看成是非合作博弈的特殊情形,即把達(dá)成合作的談判過程和執(zhí)行合作協(xié)議的強(qiáng)制過程明確地納入博弈的擴(kuò)展形式,用擴(kuò)展型博弈研究合作博弈,從而將合作博弈理論納入非合作博弈理論體系中。 第一節(jié) 合作博弈的基本問題 非合作博弈的重點(diǎn)在個(gè)體,是每個(gè)局中人該采用什么策略。 合作博弈的重點(diǎn)在群體,何種聯(lián)盟將會(huì)形成,聯(lián)盟中的成員將如何分配他們可以得到的支付。即使可以把所形成的聯(lián)盟看作是一個(gè)利益主體參與博弈,但如何在聯(lián)盟內(nèi)部分配他們
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025【合同范本】機(jī)器零件加工合同樣本
- 2025年ktv承包經(jīng)營(yíng)合同(2篇)
- 廊坊市2024-2025學(xué)年度高三上學(xué)期期末考試語文試卷含答案
- 2025版城市綜合體委托經(jīng)營(yíng)管理公司綜合服務(wù)合同3篇
- 2025年新型農(nóng)業(yè)種植技術(shù)合作承包合同4篇
- 2025年度個(gè)人與企業(yè)間小額消費(fèi)借款合同2篇
- 2025年度木結(jié)構(gòu)橋梁建造木工分包合同規(guī)范4篇
- 2025版教師學(xué)術(shù)指導(dǎo)與咨詢服務(wù)聘用合同書3篇
- 2025年度個(gè)人對(duì)個(gè)人房屋裝修借款合同樣本4篇
- 課題申報(bào)參考:教育、科技、人才一體推進(jìn)視角下的產(chǎn)教融合制度嵌入與協(xié)同治理路徑研究
- 場(chǎng)地委托授權(quán)
- 2024年四川省成都市龍泉驛區(qū)中考數(shù)學(xué)二診試卷(含答案)
- 項(xiàng)目工地春節(jié)放假安排及安全措施
- 印染廠安全培訓(xùn)課件
- 紅色主題研學(xué)課程設(shè)計(jì)
- 胸外科手術(shù)圍手術(shù)期處理
- 裝置自動(dòng)控制的先進(jìn)性說明
- 《企業(yè)管理課件:團(tuán)隊(duì)管理知識(shí)點(diǎn)詳解PPT》
- 移動(dòng)商務(wù)內(nèi)容運(yùn)營(yíng)(吳洪貴)任務(wù)二 軟文的寫作
- 英語詞匯教學(xué)中落實(shí)英語學(xué)科核心素養(yǎng)
- 《插畫設(shè)計(jì)》課程標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論