經(jīng)濟(jì)博弈論綜合概述

上傳人：唐*** IP屬地：天津上傳時(shí)間：2023-05-10 格式：PPT 頁(yè)數(shù)：107 大?。?93KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩102頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

經(jīng)濟(jì)博弈論

主講人：呂廷杰

使用教材與參考書《博弈論》施錫銓著，上海財(cái)經(jīng)大學(xué)出版社《經(jīng)濟(jì)博弈論》謝織予主編，復(fù)旦大學(xué)出版社《博弈論與信息經(jīng)濟(jì)學(xué)》張維迎著，上海三聯(lián)書店、上海人民出版社《博弈論——矛盾沖突分析》羅杰.B.邁爾森著，于寅費(fèi)劍平譯,中國(guó)經(jīng)濟(jì)出版社Game游戲;一定規(guī)則下有勝負(fù)的競(jìng)賽活動(dòng),如:OlympicGameGameTheory=>對(duì)策論,博弈論第一章經(jīng)濟(jì)博弈論概述1.1基本背景簡(jiǎn)介博弈論又稱對(duì)策論（GameTheory），主要研究決策主體的行為發(fā)生直接相互作用的時(shí)候，其決策以及這種決策的均衡問題。奠基石著作《博弈論與經(jīng)濟(jì)行為》(1944)，諾意曼、摩根斯坦《n人博弈的均衡點(diǎn)》(1950)，納什(JohnNash)點(diǎn)評(píng)：社會(huì)科學(xué)研究范式中的一種核心工具——研究社會(huì)科學(xué)的數(shù)學(xué)工具區(qū)別：傳統(tǒng)經(jīng)濟(jì)學(xué)理論市場(chǎng)是一個(gè)無(wú)形的手新凱恩斯學(xué)派則強(qiáng)調(diào)政府有形的手的作用Max生產(chǎn)函數(shù)（決策變量、活勞動(dòng)、物化勞動(dòng)資本等），而與其他企業(yè)無(wú)關(guān)？研究理性的行動(dòng)者(agents)相互作用的理論

所有的科學(xué),只有當(dāng)數(shù)學(xué)應(yīng)用于其中時(shí),才可稱得上是完美的!——卡爾.馬克思博弈論在經(jīng)濟(jì)中的應(yīng)用——經(jīng)濟(jì)博弈論：重點(diǎn)在于研究寡頭市場(chǎng)：研究存在相互外部經(jīng)濟(jì)條件下的個(gè)人選擇問題！博弈論的兩大分支：合作博弈(cooperativegame)與非合作博弈(non-cooperativegame)合作博弈：當(dāng)事人能否達(dá)成一種有約束力的協(xié)議(bindingagreement)——團(tuán)體理性——強(qiáng)調(diào)效率、公正、公平非合作博弈：每個(gè)企業(yè)都選擇自己的最優(yōu)產(chǎn)量（或價(jià)格），其結(jié)果可能是有效率的，也可能是無(wú)效率的。94年獲獎(jiǎng)?wù)叩难芯恐攸c(diǎn)！總之,博弈論在經(jīng)濟(jì)學(xué)中的應(yīng)用側(cè)重于對(duì)競(jìng)爭(zhēng)與沖突分析、市場(chǎng)作用機(jī)制等方面問題的研究，對(duì)這一領(lǐng)域作出杰出貢獻(xiàn)的學(xué)者包括:1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲獎(jiǎng)的三位博弈論專家：納什(Nash)、澤爾藤(Selten)和海薩尼(Harsanyi)。喬治。阿克羅夫麥克爾。斯彭斯約翰·納什約瑟夫。施蒂格里茨大師們的風(fēng)采幾則短信的經(jīng)濟(jì)學(xué)解釋魚說(shuō)：我時(shí)時(shí)刻刻睜開眼睛，就是為了能讓你永遠(yuǎn)在我眼中！水說(shuō)：我時(shí)時(shí)刻刻流淌不息，就是為了能永遠(yuǎn)把你擁抱！！鍋說(shuō)：都快熟了，還這么貧?。?！

一、

約束條件變了，原來(lái)的收益，一下子都變?yōu)槌杀?。生命如果架在鍋上，成本自然也就很高了。一農(nóng)戶在殺雞前的晚上喂雞，不經(jīng)意地說(shuō)：快吃吧，這是你最后一頓！第二日，見雞已躺倒并留遺書：爺已吃老鼠藥，你們別想吃爺了，爺也不是好惹的。

二

當(dāng)你知道了別人的決定之后，就能做出對(duì)自己最有利的決定?！{什均衡理論找點(diǎn)空閑找點(diǎn)時(shí)間背著炸彈到銀行看看警察為你準(zhǔn)備了一副手銬獄長(zhǎng)為你張羅一床毛毯生活的煩惱向記者說(shuō)說(shuō)搶劫的細(xì)節(jié)跟警察談?wù)勅?/p>

你要得到一些東西，就得放棄另一些東西。在經(jīng)濟(jì)學(xué)里，這叫機(jī)會(huì)成本。今夜星光燦爛，你在哪里浪漫，沒事可別亂跑，也別到處放電，我知你已成年，愛慕之心難免，但以你的條件，不能那么隨便，你是純種狼犬，別和笨狗相戀。四殺頭的事有人干，賠本的買賣沒人做。交易的本質(zhì)是不等價(jià)交換，是雙贏。而雙贏的前提是約束下的需要。飛機(jī)上，烏鴉對(duì)乘務(wù)員說(shuō)：給爺來(lái)杯水！豬聽后也學(xué)道：給爺也來(lái)杯水！乘務(wù)員把豬和烏鴉扔出機(jī)艙，烏鴉笑著對(duì)豬說(shuō)：傻了吧？爺會(huì)飛！五

外界因素是一種約束條件，自身能力也是一種約束條件。所以，別人能成功的事，未必自己就能成功。

黑猩猩不小心踩了長(zhǎng)臂猿拉的大便，長(zhǎng)臂猿溫柔細(xì)心地幫她擦洗干凈后他們相愛了，別人問起他們是怎么走到一起的，黑猩猩感慨地說(shuō)：猿糞！都是猿糞那！六路徑依賴在經(jīng)濟(jì)學(xué)里說(shuō)的是，你當(dāng)下的選擇是被你的前一個(gè)選擇決定的，如果你要改變路徑，成本將會(huì)高到你不愿意改變。1.2經(jīng)濟(jì)博弈論與經(jīng)濟(jì)學(xué)學(xué)派之爭(zhēng)新古典經(jīng)濟(jì)學(xué)派（自由市場(chǎng)經(jīng)濟(jì)學(xué)派）：經(jīng)濟(jì)學(xué)研究稀缺資源的有效配置——無(wú)形的手！前提：①足夠多的市場(chǎng)參與者——競(jìng)爭(zhēng)性條件；②參與者之間不存在信息不對(duì)稱——公平條件新凱恩斯學(xué)派：經(jīng)濟(jì)學(xué)是研究人的行為——不利選擇！理性的人：具有偏好，在給定的約束條件下最大限度的實(shí)現(xiàn)自己的偏好。理性人可能利己也可能利他，因此與自私的人不同。需要研究：激勵(lì)相容(incentivecompatible)或自選擇條件(self-selection)雙贏——利己與利他的博弈——相互影響——結(jié)盟策略理性人發(fā)明各種制度來(lái)規(guī)范行為——新制度經(jīng)濟(jì)學(xué)（路徑依賴?yán)碚摰龋纾簝r(jià)格制度價(jià)格制度的缺陷：如何研究學(xué)校、政府等非價(jià)格制度體系中人與人之間的相互作用——經(jīng)濟(jì)博弈論——奠基石關(guān)于中國(guó)的電信的拆分廣電與電信的交叉進(jìn)入全業(yè)務(wù)經(jīng)營(yíng)問題案例1：長(zhǎng)灘模型與公平、有效(1,1)(1,1)(1,1)互聯(lián)互通中的認(rèn)識(shí)誤區(qū)大網(wǎng)、小網(wǎng)成本不同，所以應(yīng)該不對(duì)等結(jié)算！經(jīng)濟(jì)學(xué)的兩個(gè)基本命題：（1）市場(chǎng)力與機(jī)會(huì)損失原則（2）邊際收益遞減原則結(jié)論性命題：平等接入的公平性原則是互聯(lián)互通雙方的利益均衡點(diǎn)滿足互聯(lián)不會(huì)對(duì)運(yùn)營(yíng)商之間在互聯(lián)前的平均每用戶收益相對(duì)關(guān)系產(chǎn)生扭曲影響。案例2：對(duì)于利益主體矛盾的調(diào)解澤爾騰公平獎(jiǎng)勵(lì)組合原則：式中：?jiǎn)栴}1：如果令成本=w；則上式也成立！當(dāng)大網(wǎng)用戶數(shù)為N,小網(wǎng)用戶數(shù)為n時(shí)，取話務(wù)吸引系數(shù)：則：于是有結(jié)算比例問題2：“信產(chǎn)部9號(hào)令”是不公平的！

A網(wǎng)交換機(jī)B網(wǎng)交換機(jī)DDFDDFODFODF互聯(lián)點(diǎn)？因此有互聯(lián)點(diǎn)應(yīng)在大網(wǎng)一側(cè)即：2.1博弈論研究的幾個(gè)要素（1）參與人(局中人)：選擇行動(dòng)以使自己效用最大化的決策主體（理性人），表示為：i=1,2,3,…,n，n為參與人總數(shù)；策略：通常：純策略空間：可以是連續(xù)或間斷的混合策略空間：滿足第二章博弈論基礎(chǔ)行動(dòng)：參與人的決策變量:支付函數(shù)（盈利函數(shù)）：參與人從博弈中獲得的效用水平，是行動(dòng)的函數(shù)戰(zhàn)略：參與人行動(dòng)的規(guī)則信息：參與人在博弈中的知識(shí)，特別是有關(guān)對(duì)手特征和行動(dòng)的知識(shí)對(duì)局：博弈行動(dòng)的集合結(jié)局：博弈的解(均衡對(duì)局)均衡：所有參與人的相對(duì)最優(yōu)戰(zhàn)略或行動(dòng)集合其中參與人、行動(dòng)、結(jié)果統(tǒng)稱為博弈規(guī)則、博弈分析就是使用博弈規(guī)則來(lái)預(yù)測(cè)均衡點(diǎn)。關(guān)于理性人與智能(1)理性人(rational)：若一個(gè)決策者在追求其目標(biāo)時(shí)能前后一致地做決策,我們就稱其為理性的。理性人的行為符合伯努里(1738)和馮·諾依曼/摩根斯坦（1974）的期望效用最大化定理。效用收益效用收益效用收益風(fēng)險(xiǎn)厭惡風(fēng)險(xiǎn)中性風(fēng)險(xiǎn)愛好馮.諾依曼—摩根斯坦效用函數(shù)E[U(x)]UxUxUx決策者從x美元中獲得的效用支付為u(x)=1-e-cx，其中c表示他的風(fēng)險(xiǎn)厭惡指數(shù)(Pratt,1964)智能的(intelligent)：若局中人知道我們對(duì)此博弈所知道的一切（完全信息），并能做出我們對(duì)此局勢(shì)所能做出的一切判斷，則稱此博弈的局中人是智能的。關(guān)于理性人與智能(2)2.2博弈的分類（１）按參與人行動(dòng)的先后順序分類：靜態(tài)博弈：參與人同時(shí)選擇行動(dòng)或非同時(shí),但后者并不知前者采取了什么行動(dòng)；動(dòng)態(tài)博弈：參與人的行動(dòng)有先后順序，且后者能夠觀察到前者所選擇的行動(dòng)。（２）按照參與人對(duì)對(duì)手的特征、戰(zhàn)略空間及支付函數(shù)的知識(shí)劃分：完全信息博弈：不完全信息博弈博弈的分類及其所對(duì)應(yīng)的均衡行動(dòng)順序信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950-51)完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡澤爾藤(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-68)不完全信息動(dòng)態(tài)博弈精煉貝葉斯納什均衡Kreps,Wilson(1982)Fudenberg,Tirole(1991)n=2,S1=S2=(A,B)，對(duì)局（甲，乙）=(A,A),(A,B),(B,A),(B,B)u1(A,A)=2,u1(A,B)=-1,u1(B,A)=-2,u1(B,B)=1,

u2(A,A)=-2,u2(A,B)=1,u2(B,A)=2,u2(B,B)=-1ＣＤA2，-2-1，1B-2，21，-1局中人甲盈利矩陣局中人乙2.3兩人O和博弈的純策略解ABA2-1B-21局中人乙局中人甲mM-1-2Mm21盈利矩陣1求純策略解的最大最小法則與最小最大法則結(jié)局:（甲，乙）*=（B，B）u1*(B,B)=1

u2*(B,B)=-1ABA-21B2-1局中人乙局中人甲Mm12mM-2-1盈利矩陣2結(jié)局:（甲,乙）*=（B，B）u1*(B,B)=1

u2*(B,B)=-12.４二人0和博弈的混合策略解局中人1盈利矩陣1局中人2設(shè)局中人1,2采取行動(dòng)A,B的概率分別為局中人1的混合策略(p1,p2)=(p,1-p)局中人2的混合策略(q1,q2)=(q,1-q)居中人1：采取行動(dòng)A的期望收益為：2q-(1-q)0=>3q-10采取行動(dòng)B的期望收益為：-2q+(1-q)0=>-3q+10居中人2：采取行動(dòng)A的期望收益為：2p-2(1-p)0=>4p-20采取行動(dòng)B的期望收益為：-p+(1-p)0=>-2p+10ABA2-1B-21

居中人1的混合策略

(p1，p2)=(1/2，1/2)

居中人2的混合策略(q1，q2)=(1/3，2/3)混合策略的數(shù)學(xué)表述局中人

i=1,2,3,…,n，的一個(gè)混合策略是其純策略空間上的概率分布，記為：i。n個(gè)局中人的混合策略向量為:=(1

,…,n)稱為混合策略組合或混合策略剖面，其中1

,…,n是統(tǒng)計(jì)獨(dú)立的；局中人i在混合策略剖面上的期望贏利：在上例中：ABA2，-2-1，1B-2，21，-1注解：純策略空間上的概率分布稱為退化分布２.5非O和博弈的累次嚴(yán)優(yōu)法局中人2局中人1LMRU4,35,16,2M2,18,43,6D3,09,62,8局中人2局中人1LMRU456M283D392局中人2局中人1LMRU312M146D068局中人2的策略M稱為其相對(duì)于策略R的“嚴(yán)劣策略”——可以刪除！局中人2局中人1LRU4,36,2M2,13,6D3,02,8局中人2局中人1LRU4,36,2解:(U,L)，(4,3)注解：并非所有的博弈問題都有累次嚴(yán)優(yōu)解！局中人2局中人1LRU46M23D32(1)完全信息靜態(tài)博弈的納什均衡：假設(shè)有n個(gè)人參加博弈，在給定其他人策略的條件下，每個(gè)人選擇自己的相對(duì)最優(yōu)策略（可能依賴于他人的策略或不依賴），所有參與人選擇的策略一起構(gòu)成一個(gè)戰(zhàn)略組合，即為納什均衡。（僵局）注解:Nash均衡策略是指這樣一個(gè)策略組合（或剖面），為了極大化自己的盈利（或效用），每一個(gè)局中人所采取的策略一定應(yīng)該是關(guān)于其他局中人所采取策略的最佳反應(yīng)。因此沒有一個(gè)局中人會(huì)輕率地偏離這個(gè)策略組合（或剖面）而使自己蒙受損失。2.６囚徒困境與納什均衡坦白不坦白坦白-8，-80，-15不坦白-15，0-1，-1囚徒2囚徒1解:(坦白,坦白),(-8,-8)當(dāng)累次嚴(yán)優(yōu)解不存在時(shí)，即局中人采用某策略時(shí)A優(yōu)于B，而采用另一策略時(shí)B優(yōu)于A時(shí)。(2)囚徒困境關(guān)于帕累托最優(yōu)與有效結(jié)局?jǐn)?shù)理經(jīng)濟(jì)學(xué)的Pareto最優(yōu)在博弈論中可以表述為：如果不存在其它的結(jié)局使得某些局中人的效用(或盈利)比這個(gè)結(jié)局的效用好得多，同時(shí)又不會(huì)使其他局中人的效用(或盈利)變的更差，則稱博弈的這個(gè)結(jié)局是有效的。局中人理性行為的結(jié)果可以不是有效的！(3)Nash均衡的求解(下畫線法)LRUa，eb，fDc，gd，h乙甲(U,L)為純策略Nash均衡D相對(duì)于U為嚴(yán)劣策略LRUa，eb，fDc，gd，h沒有劣純策略情況LRUa，eb，fDc，gd，hLRUa，eb，fDc，gd，h多重Nash均衡情況(4)Nash均衡的數(shù)學(xué)表述完全信息靜態(tài)博弈問題中的混合策略剖面*，如果對(duì)所有的局中人i(i=1,2,…,n)均成立：

那么，*被稱為該博弈的Nash均衡；如果*是退化的混合策略（純策略空間上的概率分布稱為退化分布），那么，所得到的是純策略Nash均衡。I兩個(gè)企業(yè)的價(jià)格競(jìng)爭(zhēng)，產(chǎn)量博弈；II公共物品供給：所有人捐獻(xiàn)與友人不捐獻(xiàn)的結(jié)果；III軍備競(jìng)爭(zhēng)結(jié)論：有效的制度安排必須是一種納什均衡(5)Nash均衡的案例第三章完全信息靜態(tài)博弈博弈中的居中人了解各自的贏得函數(shù)、偏好和決策規(guī)則局中人同時(shí)做出決策3.1Nash均衡(續(xù))(1)混合策略Nash均衡的解委托人/代理人問題：代理人的策略空間=（工作，偷懶）=（W，S）代理人工作的代價(jià)為：g，獲得委托人的報(bào)酬為：w，(w>g)代理人工作時(shí)將為委托人增加價(jià)值為v的財(cái)產(chǎn)(v>w)委托人的策略空間=（檢查，不檢查）=（I,，N）檢查所需費(fèi)用為：h(h<w)，于是有：INS0，-hw，-wWw-g，v-w-hw-g，v-w委托人代理人無(wú)純策略Nash均衡！設(shè)代理人偷懶的概率為x，工作的概率為(1-x)；設(shè)委托人檢查的概率為y，不檢查的概率為(1-y)；于是有代理人的期望贏利為：根據(jù)Nash均衡的定義，在給定委托人混合策略2

=（y，1-y）的條件下，尋求x值以使u1

(1,2

)達(dá)到最大。因此，對(duì)上式x求導(dǎo)數(shù)并令其為零，得到：w(1–y)=w–g；因此y=g/w。同理可得：x=h/w

。本問題的混合策略Nash均衡解為：（h/w，1-h/w），（g/w，1-g/w）經(jīng)濟(jì)用途：考察達(dá)到Nash均衡時(shí)委托人的期望贏利為：u2

(1*,2*

)=v(1–x)–w(1–xy)–hy=v(1–h/w)–w他與代理人的生產(chǎn)價(jià)值v、委托人檢查費(fèi)用h、以及委托人付給代理人的工資w有關(guān)。通常生產(chǎn)價(jià)值v和檢查費(fèi)用h可為已知和固定的，因此，求微分可得，若取時(shí)，委托人得平均贏利將達(dá)到極大。于是通常作為委托人與代理人之間簽署合同工資得參考值。(3)解及其討論例：阻撓市場(chǎng)進(jìn)入（entrydeterrance）模型默許斗爭(zhēng)進(jìn)入40，50-10，0不進(jìn)入0，3000，300在位者（現(xiàn)有壟斷企業(yè)）進(jìn)入者純策略Nash均衡點(diǎn)：(不進(jìn)入，斗爭(zhēng))，（進(jìn)入，默許)3.2多重Nash均衡多重模型的求解主要是進(jìn)行結(jié)局的預(yù)測(cè)！又例懦夫博弈問題TWT-1，-12，1W1，20，0Nash均衡結(jié)局為：純策略（T，W）（W，T）混合策略(1/2,1/2)(1/2,1/2)關(guān)于多重Nash均衡的幾點(diǎn)討論澤爾滕1960年提出的“聚集”效應(yīng)設(shè)有一個(gè)游戲：兩個(gè)局中人獨(dú)立地寫出(-1/2,1/2)中任一數(shù)，若兩人所寫數(shù)字相同，則每人獎(jiǎng)勵(lì)100元，否則每人被罰10元。顯然某局中人在策略空間中選擇x(-1/2,1/2)，另一局中人的最佳反映是y=x。也即對(duì)于一切的t

(-1/2,1/2)，(t,t)是Nash均衡。然而，在隨機(jī)情況下(x,y)(xy)發(fā)生的概率要遠(yuǎn)大于(t,t)，但對(duì)于想要贏錢的理性人而言，他們會(huì)更多地選擇(t,t)如果是多人游戲或策略空間為[0，）對(duì)局的情況將更加離散；這時(shí)（0，0）通常成為合理的預(yù)測(cè)結(jié)局。個(gè)別理性、共同理性與雙贏博弈！3.3古諾（Cournot）模型（產(chǎn)量博弈）設(shè)有

2個(gè)廠商（博弈方）；廠商i的產(chǎn)量為qi

，(i=1,2)；決策空間為Qi=[0，]，則2個(gè)廠商的總產(chǎn)量為：已知市場(chǎng)價(jià)格是總產(chǎn)量的減函數(shù)：P=P(Q);因此廠商i的收益為：qi

·P(Q);再假設(shè)廠商生產(chǎn)產(chǎn)品的成本為Ci(qi

)；因此，廠商i的產(chǎn)量為qi

時(shí)的收益為：ui=qi

·P(q1

+q2

)-C(qi)說(shuō)明：(1)本模型可以推廣到2個(gè)以上的廠商；(2)廠商i的收益不僅取決于其自身的產(chǎn)量qi，而且還取決于其他廠商的決策qj，j=1,2,…,n,ji。記廠商1，2的Cournot反應(yīng)函數(shù)分別為：r1:Q2Q1

r2:Q1Q2

求收益函數(shù)的一階導(dǎo)并使之等于零，可以解得反應(yīng)函數(shù)。不加證明地引入Cournot均衡引理：最佳反應(yīng)函數(shù)分別為：他們分別滿足：映射映射Nash均衡q1*,q2*為反應(yīng)函數(shù)兩條曲線的交點(diǎn)！例：已知或取特殊情況C(q1)=c·q1,C(q2)=c·q2其中c為常數(shù)，則反應(yīng)函數(shù)為：易得q1*=q2*

=4–c/3解的分析：Cournot博弈中也存在個(gè)別理性與共同理性的矛盾，即合作策略的處境更好些！上例中，令c=0，此時(shí)的Nash均衡q1*=q2*

=4，且有：u1(4,4)=u2(4,4)=16注意到局中人的盈利函數(shù)為ui(q1,q2

)=qi(12-q1-q2),若取q1=q2

=3，即雙方都限量生產(chǎn)，則有：u1(3,3)=u2(3,3)=36=183.4博川德（Bertrand）模型（價(jià)格博弈）考慮兩個(gè)公司生產(chǎn)不同品牌、不同質(zhì)量與不同包裝的同類商品。如果其價(jià)格選擇分別為p1與p2，對(duì)于公司i(i=1,2)的顧客需求量為qi(pi

,pj)=a–pi+bpj。其中b>0反映公司i的產(chǎn)品對(duì)公司j產(chǎn)品的

替代程度。取特例令固定成本=0，邊際成本為常數(shù)c,c<a。于是，公司i的盈利函數(shù)為：求偏導(dǎo)得及解聯(lián)立方程

得稱之為博弈的Nash均衡或Bertrand均衡說(shuō)明：(1)本模型也可以推廣到2個(gè)以上的廠商；(2)Cournot均衡和Bertrand均衡均基于贏利函數(shù)可微和嚴(yán)凹性從一階條件推出，其他贏利函數(shù)要用更多的數(shù)需工具。法國(guó)經(jīng)濟(jì)學(xué)家古諾（Cournot）一個(gè)半世紀(jì)以前提出的寡頭市場(chǎng)模型是博弈論的經(jīng)典模型這個(gè)模型主要被用來(lái)研究雙寡頭壟斷Duopoly的市場(chǎng)

古諾模型適用于：博弈的雙方實(shí)力均衡、非合作、靜態(tài)博弈問題。3.5關(guān)于Cournot模型的小結(jié)市場(chǎng)單價(jià)P是市場(chǎng)總產(chǎn)量Q的線性函數(shù)我們稱這個(gè)函數(shù)為逆需求函數(shù)。如果假設(shè)兩廠商的生產(chǎn)都無(wú)固定成本且有相同的不變單位成本c≥0，那么，利潤(rùn)與企業(yè)選擇的業(yè)務(wù)指標(biāo)的關(guān)系為：在本博弈中，對(duì)局為納什均衡的充分必要條件是最大值問題

因?yàn)榍笞畲笾档膬蓚€(gè)式子都是各自變量的二次式，且二次項(xiàng)的系數(shù)都小于0，因此、只要能使它們各自對(duì)q1和q2的導(dǎo)數(shù)為0，就一定能實(shí)現(xiàn)它們的最大值。

解之，得，并且這是唯一的一組解。因此

是本博弈唯一的納什均衡策略組合（解）。

結(jié)論：實(shí)力相近的雙寡頭壟斷市場(chǎng)中，二者的業(yè)務(wù)指標(biāo)（用戶數(shù)、產(chǎn)量等）相等為本博弈模型的均衡解

整理得反應(yīng)函數(shù)或稱業(yè)務(wù)指標(biāo)函數(shù)為：第四章完全信息動(dòng)態(tài)博弈動(dòng)態(tài)的囚徒困境問題行動(dòng)的先后產(chǎn)生信用(credibility)問題核心是“承諾”與“威脅”殘局與子博弈均衡——?jiǎng)討B(tài)規(guī)劃——“子博弈完美均衡”完全信息：共同知識(shí)為贏利函數(shù)和純策略空間完美信息（下棋）：除此之外，局中人還掌握在此之前對(duì)局雙方的行動(dòng)過(guò)程和目前所處狀態(tài)。所有局中人都有完美信息的博弈問題稱為“完美信息”博弈問題，否則為不完美信息博弈問題。有限博弈：博弈過(guò)程的階段數(shù)有限。4.1展開型博弈——信息的作用參與人(局中人)：選擇行動(dòng)以使自己效用最大化的決策主體（理性人），表示為：i=1,2,3,…,n，n為參與人總數(shù)；行動(dòng)的順序：誰(shuí)在何時(shí)行動(dòng)策略空間及其選擇：行動(dòng)經(jīng)歷：支付函數(shù)（盈利函數(shù)）：在任何外生事件上的概率。4.2斯坦?fàn)柌瘢⊿tackelberg）寡頭競(jìng)爭(zhēng)模型

斯坦?fàn)柌衲Ｐ徒沂镜氖峭耆畔?dòng)態(tài)條件下的對(duì)策均衡問題。市場(chǎng)廠商的行動(dòng)也是選擇業(yè)務(wù)量或用戶數(shù)，但在斯坦?fàn)柌衲Ｐ椭?，廠商1是領(lǐng)先廠商，首先選擇其業(yè)務(wù)指標(biāo)q1；競(jìng)爭(zhēng)對(duì)手2是尾隨廠商，觀測(cè)到后，選擇自己的業(yè)務(wù)指標(biāo)q2。因此,這又是一個(gè)完美信息動(dòng)態(tài)對(duì)策.。

假定逆需求函數(shù)為，廠商有相同的不變單位成本c≥0，那么，支付（利潤(rùn)）函數(shù)為：

求解這個(gè)博弈問題“子博弈完美納什均衡”的逆推歸納法首先考慮給定q1的情況下，廠商2的最優(yōu)選擇（第2階段）：階段1階段2階段nS0Sn決策階段效應(yīng)決策決策階段效應(yīng)階段效應(yīng)因?yàn)閺S商1預(yù)測(cè)到廠商2將根據(jù)r2(q1)選擇q2，于是，廠商1在第一階段的問題是：

解一階條件得：

將結(jié)果代入廠商2得反應(yīng)函數(shù)得到：實(shí)力相異的雙寡頭壟斷市場(chǎng)中，實(shí)力相對(duì)強(qiáng)的寡頭與實(shí)力相對(duì)弱的寡頭的業(yè)務(wù)指標(biāo)（用戶數(shù)、產(chǎn)量等）比為：2:1為本博弈模型的均衡解。（也即3：7開）4.3動(dòng)態(tài)博弈問題的博弈樹表示方法博弈樹是一個(gè)樹型圖，由節(jié)點(diǎn)和連接節(jié)點(diǎn)的連線（分枝）構(gòu)成；局中人的行動(dòng)順序用各節(jié)點(diǎn)簡(jiǎn)的順序關(guān)系自上而下來(lái)表示；博弈樹中不允許出現(xiàn)“圈”或多個(gè)直接前列節(jié)點(diǎn)情況；沒有后續(xù)節(jié)點(diǎn)的節(jié)點(diǎn)稱為終止節(jié)點(diǎn)，否則稱為決策節(jié)點(diǎn)。122xyz例：阻撓市場(chǎng)進(jìn)入（entrydeterrance）模型默許斗爭(zhēng)進(jìn)入40，50-10，0不進(jìn)入0，3000，300在位者（現(xiàn)有壟斷企業(yè)）B進(jìn)入者AAB(0,300)進(jìn)入(40,50)(-10,0)不進(jìn)入B默許斗爭(zhēng)已知：純策略Nash均衡點(diǎn)(不進(jìn)入，斗爭(zhēng))（進(jìn)入，默許)幾點(diǎn)討論AB(0,300)進(jìn)入(40,50)(-10,0)不進(jìn)入B默許斗爭(zhēng)默許斗爭(zhēng)進(jìn)入40，50-10，0不進(jìn)入0，3000，300AB

A不進(jìn)入是因?yàn)槭艿紹公司斗爭(zhēng)的威脅，并將因此損失10；但這種威脅是不可信的“空洞威脅”，因?yàn)槿鬉真的進(jìn)入，則B的最佳反應(yīng)是默許(得50)，而不是斗爭(zhēng)(得0)；因此，在上述兩個(gè)納什均衡中,只有(進(jìn)入，默許)是合理的。博弈的信息結(jié)構(gòu)任一決策節(jié)點(diǎn)屬于且僅屬于一個(gè)信息集；處于同一信息集中的不同節(jié)點(diǎn)是同一局中人選擇行動(dòng)時(shí)所無(wú)法區(qū)分的。博弈的信息結(jié)構(gòu)用信息集表示，信息集是全部決策節(jié)點(diǎn)的一個(gè)分刈，它滿足：完美信息博弈問題的信息結(jié)構(gòu)AB(0,300)進(jìn)入(40,50)(-10,0)不進(jìn)入B默許斗爭(zhēng)非完美信息博弈問題的信息結(jié)構(gòu)例：假如僅有兩張撲克牌A和2，和兩個(gè)局中人甲和乙，游戲規(guī)則為：開始時(shí)每人壓上1元的注，然后乙隨即抽取一張牌看看是幾，若牌是A則必須告訴甲是A，若是2則可說(shuō)是A也可說(shuō)是2；乙說(shuō)2等于認(rèn)輸，1元輸給甲，若說(shuō)A則不管是否是A乙要再加1元賭注，然后由甲判斷；甲說(shuō)相信則輸?shù)?元，說(shuō)不信則需再壓上1元獲得翻牌機(jī)會(huì)，翻開后是A則乙贏2元，若為2則甲贏2元。乙乙A0.5(-2,2)20.5乙A甲(-1,1)(2,-2)(-1,1)(1,-1)YN2甲ANY信息集I信息集J信息集K信息集L注意：信息集J分刈了信息集K，反之亦然！子博弈是原博弈樹的一個(gè)部分樹，它必須滿足：從一個(gè)決策點(diǎn)開始包含它所有的后續(xù)節(jié)點(diǎn)；開始點(diǎn)所在的信息集中除了這一點(diǎn)外，沒有其他節(jié)點(diǎn)；不分刈任何信息集如果博弈中各局中人的策略所構(gòu)成的一個(gè)策略組合在博弈本身和所有的子博弈中都構(gòu)成了納什均衡，則稱該博弈為子博弈精練納什均衡。4.4子博弈精練納什均衡(澤爾滕)子博弈精練納什均衡的圖解法甲乙(-1,-3)乙(-1,-1)(3,1)(-2,1)(2,3)甲信息集I信息集J信息集K信息集L甲乙乙(-1,-1)(3,1)(-2,1)(2,3)信息集I信息集J信息集K甲(3,1)(2,3)4.5討價(jià)還價(jià)模型（BargainingModel）設(shè)有買方B愿意出最高價(jià)300元購(gòu)買一商品；而賣方S將不接受任何低于200元以下的開價(jià)談判價(jià)與B、S各自保留價(jià)之間的差恰為各人從交易中獲得的贏利，獲利范圍[0,100]B開價(jià)P1(300-P1,P1-200)反開價(jià)P2(300-P2,P2-200)(0,0)BSarara:接受r:拒絕S開價(jià)P2(300-P2,P2-200)反開價(jià)P1(300-P1,P1-200)(0,0)SBararPi

±:吃掉幾乎整塊蛋糕的后動(dòng)者優(yōu)勢(shì)！影響討價(jià)還價(jià)結(jié)果的因素為：誰(shuí)最后開價(jià)開價(jià)的輪次數(shù)（有無(wú)耐心）無(wú)耐心的討價(jià)還價(jià)：考慮足夠多次討價(jià)還價(jià)，例如輪次數(shù)為100，假定在100次的基礎(chǔ)上，每拖延一輪協(xié)議的交易成本將會(huì)使兩個(gè)局中人都縮減從交易成本中所獲益的3%如果S最后開價(jià)，因此第99輪B提出297元的開價(jià)，并相信S會(huì)接受，因?yàn)樵龠M(jìn)行一輪S也只能得到297，這時(shí)B將獲得3元的贏利。輪次SB開價(jià)贏利代價(jià)開價(jià)贏利代價(jià)100300.00100.003.00——0.000.0099——97.000.00297.003.000.0998297.0997.092.91——2.910.0097——94.180.00294.185.820.18……………………………………3——51.800.00251.8048.201.452253.2553.251.60——46.750.001——51.650.00251.6548.351.45Rubinstein-Stahl(R-S)討價(jià)還價(jià)的一般模型設(shè)在輪次2k+1

(k=0,1,2,…)由局中人B提出一個(gè)分配方案(x,1-x)。這里x可以視為一塊蛋糕的百分比；對(duì)此，局中人S可以接受或拒絕。若S接受，則博弈結(jié)束；若S拒絕，則在輪次2k(k=1,2,…)時(shí)提出反建議方案。這時(shí)局中人B可以接受或拒絕。如果在某輪B接受了S的開價(jià)，博弈結(jié)束，否則繼續(xù)。Stahl于1972年研究了有限輪次討價(jià)還價(jià)博弈；Rubinstein于1982年研究了無(wú)限輪次討價(jià)還價(jià)博弈。通常采用折扣因子考慮無(wú)耐心情況。令某局中人再等一輪的代價(jià)是其下一輪分得盈余的百分比，也即其本輪的所得的理性預(yù)期為下輪所得的1-=倍。設(shè)y為其下一輪所得，

y相當(dāng)于y在本輪的貼現(xiàn)值。本博弈問題有大量的Nash均衡，但只有唯一的“子博弈精練納什均衡”[Rubinstein定理]設(shè)局中人S、B關(guān)于一塊蛋糕（盈余）的分配采用交替開價(jià)的辦法進(jìn)行討價(jià)還價(jià)。局中人B首先開價(jià)，開價(jià)次數(shù)沒有限制；兩個(gè)局中人的折扣因子分別為0<B<1和0<S<1；當(dāng)某個(gè)局中人關(guān)于接受或拒絕某開價(jià)確實(shí)感到無(wú)所謂時(shí)，則認(rèn)為該局中人接受此開價(jià)。那么這個(gè)討價(jià)還價(jià)博弈有唯一的子博弈精練納什均衡；局中人B立即提供給S以盈余的S(1-B)/(1-SB)而留給自己(1-S)/(1-SB)S接受此方案。反之亦反。例：當(dāng)S=B=0.03，則先后開價(jià)者分別得0.03和0.97。4.4重復(fù)博弈定義：個(gè)頂一個(gè)博弈G，重復(fù)進(jìn)行T次，并且在每次重復(fù)之前各局中人都能觀察到以前博弈的結(jié)果，這樣的博弈過(guò)程成為G的一個(gè)“T次重復(fù)博弈”，記為G(T)。而G稱為G(T)的原博弈。G(T)中的每次重復(fù)稱為G(T)的一個(gè)階段。常見情況是原博弈G為具有靜態(tài)均衡的博弈，則這時(shí)的重復(fù)博弈就是靜態(tài)博弈的多次重復(fù)進(jìn)行。定理：設(shè)原博弈G有唯一的納什均衡，則對(duì)任意正整數(shù)T，重復(fù)博弈G(T)有唯一的子博弈完美解，即各局中人每個(gè)階段都采用G的納什均衡策略。各博弈方在G(T)中的總收益為在G中收益的T倍，平均每階段收益等于原博弈G中的收益。例：兩次重復(fù)的囚徒困境問題坦白不坦白坦白-8，-80，-15不坦白-15，0-1，-1囚徒2囚徒1采用逆推歸納法，本階段的納什均衡為：（坦白，坦白）（-8，-8）坦白不坦白坦白-16，-16-8，-23不坦白-23，-8-9，-9囚徒2囚徒1在已知雙方第二階段結(jié)局的情況下，本階段的納什均衡為：（坦白，坦白）（-16，-16）第一階段：第二階段：結(jié)論：總是坦白為本問題的子博弈完美均衡第五章不完全信息靜態(tài)博弈例如：招投標(biāo)、拍賣等活動(dòng)5.1Bayes博弈與Bayes均衡非對(duì)稱信息下的Cournot模型已知逆需求函數(shù)為：設(shè)企業(yè)1的成本函數(shù)為：cq1，企業(yè)2是新加入者，他新發(fā)明了一種新技術(shù)，因此成本函數(shù)為：又設(shè)公司2已知自己和公司1的成本函數(shù)，而公司1除了知道自己的成本函數(shù)以外，對(duì)于公司2的成本函數(shù)無(wú)法確定，但了解上述成本結(jié)構(gòu)。上述模型成為典型的信息不對(duì)稱博弈問題求解以與分別表示公司2對(duì)于不同邊際成本所選擇的產(chǎn)量；為公司1的產(chǎn)量選擇如果公司2取高成本CH，則應(yīng)滿足：同理，若公司2取低成本CL，則應(yīng)滿足：于是公司1應(yīng)選擇使期望盈利最大化：上述三個(gè)最優(yōu)化問題的一階解條件為：求解上述聯(lián)立方程可得：當(dāng)CL=CH=c完全信息靜態(tài)納什均衡幾點(diǎn)討論不完全信息情況下Cournot模型的納什均衡與完全信息情況下的解不同；在不完全信息情況下Cournot模型的納什均衡具有產(chǎn)量與成本之間成反比例關(guān)系的特征：本問題的解又蘊(yùn)含了以下關(guān)系：?jiǎn)栴}：是否應(yīng)該選擇新技術(shù)？5.2不完全信息靜態(tài)Bayes博弈的一般表述設(shè)有n個(gè)局中人進(jìn)行靜態(tài)博弈，局中人i的行動(dòng)空間為Ai，（i=1,2,…,n）假設(shè)他有數(shù)個(gè)可能的盈利函數(shù)，不妨設(shè)有兩個(gè)時(shí)，稱局中人i有兩個(gè)類型ti1,ti2；以及類型空間Ti={ti1,ti2}其中類型ti1的概率為p，類型ti2的概率為1-p對(duì)應(yīng)于局中人i的盈利函數(shù)為ui(a1,a2,…,an,tij),(j=1,2)因此上述博弈問題可以表述為:G={A1,A2,…,An;T1,T2,…,Tn;p1,p2,…,pn;u1,u2,…,un}5.3完全但不完美信息動(dòng)態(tài)博弈博弈雙方了解博弈的要素，但至少有一方不了解博弈的過(guò)程不完美信息動(dòng)態(tài)博弈主要被用于研究局中人信息不對(duì)稱的問題（例如二手車交易問題）11122好差不賣賣賣不賣買不買買不買局中人2(買方)不了解的階段以二手車問題為例：當(dāng)賣方?jīng)Q定賣車時(shí)，買方需要作出判斷的是車況的好壞，以及好壞的概率是多少？設(shè)：p(g|s)和p(b|s)分別表示賣方?jīng)Q定賣車時(shí)車況好與壞的概率，為買方的判斷值；又設(shè)：p(g)和p(b)為車況好與壞的經(jīng)驗(yàn)概率；p(s|g)和p(s|b)分別表示車況好與壞的情況下賣方選擇賣與不賣的概率。于是根據(jù)貝葉斯法則：5.4市場(chǎng)的四種類型分析市場(chǎng)完全失?。簼撛诘馁Q(mào)易利益存在，但包括擁有高質(zhì)量產(chǎn)品的所有賣方因擔(dān)心賣不出去而不敢將商品投放市場(chǎng)的情況，或買方擔(dān)心買到次品而不敢購(gòu)買；市場(chǎng)完全成功：擁有高質(zhì)量產(chǎn)品的賣方將商品投放市場(chǎng)，而擁有低質(zhì)量產(chǎn)品的賣方不敢將商品投放市場(chǎng)的情況（將實(shí)現(xiàn)最大貿(mào)易利益）；市場(chǎng)部分成功：不管產(chǎn)品質(zhì)量高低，賣方都將商品投放市場(chǎng)，買方也不管好壞什么商品都買進(jìn)的情況，因可能發(fā)生不良交易，所以會(huì)產(chǎn)生負(fù)的市場(chǎng)效率；市場(chǎng)接近失?。簱碛懈哔|(zhì)量產(chǎn)品的賣方將商品投放市場(chǎng)，而擁有低質(zhì)量產(chǎn)品的賣方將商品部分投放市場(chǎng)的情況。買方以一定的概率選擇買或不買，即買賣雙方都采用混合策略作為對(duì)不完全信息的反應(yīng)。市場(chǎng)的四種類型分析(續(xù))市場(chǎng)完全失?。?、賣方總是選擇不賣,或

2、買方總是選擇不買；

3、p(g|s)=0，p(b|s)=1。市場(chǎng)完全成功：1、賣方在車況好時(shí)賣，不好時(shí)不賣；

2、買方總是選擇買，只要賣方賣；

3、p(g|s)=1，p(b|s)=0。市場(chǎng)部分成功：1、賣方總是選擇賣，不管車況好壞；

2、買方總是選擇買，只要賣方賣；

3、p(g|s)=p(g)，p(b|s)=p(b)

。11122好差不賣賣賣不賣買不買買不買(0,0)(A,V-A)(-C,0)(A-C,W-A)其中：V為車況好時(shí)的效用價(jià)值W為車況差時(shí)的效用價(jià)值A(chǔ)(售價(jià))>C(整修費(fèi))V>A>W設(shè)：V=3000，W=0，A=2000，C=1000，且p(g)=p(b)

=0.5。于是，賣方確定出售時(shí)(純策略情況)，且買方購(gòu)買的期望收益為：pg·(V-A)+pb·(W-A)=0.51000+0.5(-2000)=-500<0二手車問題的純策略解純策略情況下市場(chǎng)必然失??！市場(chǎng)接近失敗：混合策略完美貝葉斯均衡1、賣方在車況好時(shí)以概率1（p(s|g)=1）出售，車況不好時(shí)以0.5的概率（p(s|b)=0.5）出售；2、根據(jù)貝葉斯法則，買方的判斷為：買方的期望收益為（符合序列理性檢驗(yàn)）：車況好時(shí)賣方才賣，而買方以0.5的概率選擇買時(shí)，賣方的期望收益為：0.5A+0.50=0.52000+0.50=1000>0

車況差時(shí)賣方才賣，而買方以0.5的概率選擇買時(shí)，賣方的期望收益為：0.5(A-C)+0.5（-C）=0.51000+0.5（-1000）=0結(jié)論差車的賣方與所有買方參與市場(chǎng)的平均結(jié)果是不盈也不虧；好車的賣方只有一半的機(jī)會(huì)能賣掉車；這說(shuō)明信息不完美情況下市場(chǎng)的效率會(huì)受到很大影響，產(chǎn)生“不利選擇”！問題：如何改善市場(chǎng)效率？5.5海薩尼（Harsanyi）轉(zhuǎn)換現(xiàn)假設(shè)一個(gè)名為“自然”的博弈方0，該博弈方的作用是為其他每個(gè)博弈方抽取他們的類型，抽取的類型構(gòu)成向量t=(t1,t2,…,tn)，其中tiTi，i=1,2,…,n

；“自然”讓每個(gè)博弈方都知道自己的類型，但卻不讓其他博弈方知道；除“自然”以外其他博弈方同時(shí)從各自的行為空間選擇行動(dòng)方案a1,a2,…,an

;除“自然”以外其他博弈方各自取得收益ui=ui(a1,a2,…,an

,ti)因此，這是一個(gè)完全但不完美的動(dòng)態(tài)信息博弈5.6有同時(shí)選擇的完全但不完美動(dòng)態(tài)信息博弈將不完全信息靜態(tài)博弈問題進(jìn)行Harsanyi轉(zhuǎn)換之后，對(duì)類型的判斷在形式上就變成了對(duì)博弈的進(jìn)程，即“自然”的選擇的判斷。通常假設(shè)“自然”以概率分布p1,p2,…,pn,分別選擇t1,t2,…,tn

。在不完全信息Cournot模型中廠商2有CH和CL兩種只有自己才清楚的類型。但如果廠商2只考慮自己是CH類型時(shí)的最佳產(chǎn)量選擇，而沒有作出選擇，則廠商1的就無(wú)法確定。也即在“自然”抽取博弈方的類型ti后，博弈方即使已知自己的類型，但也需要對(duì)每種可能的ti都設(shè)定一種響應(yīng)的行動(dòng)方案第六章不完全信息動(dòng)態(tài)博弈不完全信息動(dòng)態(tài)博弈問題：至少有一個(gè)局中人對(duì)其他某些局中人的收益不清楚。例如：網(wǎng)站拍賣，古玩交易等。不完全信息動(dòng)態(tài)博弈又稱為動(dòng)態(tài)貝葉斯博弈問題。解決不完全信息靜態(tài)博弈的海薩尼轉(zhuǎn)換依然適用于不完全信息動(dòng)態(tài)博弈。轉(zhuǎn)化后的問題稱為非同時(shí)選擇的完全但不完美動(dòng)態(tài)信息博弈。6.1信號(hào)博弈兩個(gè)局中人；局中人各自都只有一次行為；后行動(dòng)的一方（信號(hào)接收方）具有不完全信息，但他可以從先行動(dòng)一方（信號(hào)發(fā)出方）的行動(dòng)中獲得部分信息。因此，先行動(dòng)一方對(duì)后行動(dòng)這而言就像一種反映其收益函數(shù)的信號(hào)，故稱之為“信號(hào)博弈”。轉(zhuǎn)換的過(guò)程：設(shè)有一個(gè)博弈方0先為發(fā)出方按一定的概率從其類型空間中隨即選擇一個(gè)類型，并將該類型告訴發(fā)出方；然后，發(fā)出方在自己的行為空間選擇一個(gè)行為（發(fā)出信號(hào)）；最后是接收方根據(jù)發(fā)出方的行為（發(fā)出的信號(hào)）選擇自己的行為。信號(hào)博弈的模型設(shè)：S表示信號(hào)發(fā)出方，R表示接收方；

T={t1,t2,…,tI}表示S的類型空間，M={m1,m2,…,mJ}表示S的行為空間，或稱信號(hào)空間；

A={a1,a2,…,aK}表示R的行為空間；

US、UR分別表示S和R的收益；又設(shè)博弈方0為S選擇類型的概率分布為：{p(t1),p(t2),…,p(tI)}，則一個(gè)信號(hào)博弈為：博弈方0以概率p(ti)選擇類型ti

，并讓S知道；S

選擇行為mj

(M)；R

看到mj

后選擇ak；S和R

的收益US、UR都取決于ti

，

和ak

。模型的其他條件：p(ti)>0且p(t1)+p(t2)+…+p(tI

)=1；R

雖然不知道S

的類型就是ti

，但是卻知道p(ti)；S所選擇的mj

為ti

的函數(shù)，當(dāng)然也是收益和ak的函數(shù)；在有些問題中，T、M

和A

也可以是連續(xù)空間，而不一定是有限離散空間。6.2信號(hào)博弈的完美貝葉斯均衡接收方R

在觀察到發(fā)出方S的信號(hào)mj

之后，必須作出關(guān)于S

的類型的判斷，即估計(jì)以下條件概率：p(ti|mj)。p(ti|mj)0;p(ti|mj)=1。給定R

的判斷和S的信號(hào)mj

，R

的行為為a*(mj

)必須使R的期望收益最大，即a*(mj

)滿足：給定R的策略a*(mj

)時(shí)，S的選擇m*(ti)

應(yīng)滿足：對(duì)每個(gè)mj

，如果存在ti

使得m*(tj)=

，則R在對(duì)應(yīng)于mj

的信息集處的判斷必然符合S的策略和貝葉斯法則。例一：股權(quán)與債權(quán)置換問題問題的提出：企業(yè)要上一個(gè)新項(xiàng)目，為此需吸引一批資金；但希望投資的外人不能看到該企業(yè)的真實(shí)盈利能力，原因是該企業(yè)原來(lái)盈利能力為內(nèi)部信息，而新項(xiàng)目所創(chuàng)造的利益無(wú)法從整個(gè)企業(yè)的總利潤(rùn)中區(qū)分開來(lái)。那么，如果企業(yè)像投資人提出用一定比例的股權(quán)換取投資，那么，在怎樣的情況下提議會(huì)被接受，而企業(yè)出多少股權(quán)才合適呢？為此，首先假設(shè)企業(yè)的利潤(rùn)有高低兩種可能：=H或=L，H>L>0。又設(shè)新項(xiàng)目所需投資為I，新增收益為B，社會(huì)平均收益率為r，則本博弈問題成立的條件是：B>I(1+r)。建模設(shè)企業(yè)原有利潤(rùn)的高低為隨機(jī)變量，已知：p(=H)=p,p(=L)=1-p

；企業(yè)自己了解，愿出W比例的股權(quán)換取投資I；投資人看到W，但看不到，只知道是高或低的概率，然后選擇接受企業(yè)的提議或拒絕；若投資人拒絕，其收益為I(1+r)，企業(yè)收益為；若投資人接受，其收益為W(+B)，企業(yè)收益為(1-W)(+B)；這是一個(gè)發(fā)出方有兩種類型，接收方有兩種行為的信號(hào)博弈問題；而信號(hào)發(fā)出方的信號(hào)W則是一個(gè)連續(xù)區(qū)間0<W<1。6.3完美貝葉斯均衡解的條件通常情況下投資人會(huì)在看到W后判斷p(H|W)=q的概率，則他只會(huì)在W[qH+(1-q)L+B]I(1+r)時(shí)才會(huì)接受，即：WI(1+r)/[qH+(1-q)L+B]而對(duì)企業(yè)而言，只有當(dāng)(1-W)(+B)，即：WB/(+B)時(shí)才愿意出價(jià)W。于是有：也即例二：勞動(dòng)市場(chǎng)信號(hào)博弈：Spence-1973自然隨機(jī)決定一個(gè)工人的生產(chǎn)能力，有高低兩種可能，分別記為H和L。并且工人生產(chǎn)能力高低的概率p(=H)和p(=L)是公共知識(shí)；工人清楚自己的生產(chǎn)能力屬于高還是低，然后他為自己選擇一個(gè)受教育水平e0；有兩個(gè)廠商都觀察到工人的受教育水平（不是能力），然后同時(shí)提出愿支付給該工人的工資水平；工人接受工資水平較高的一份工作，如果兩個(gè)廠商支付的工資水平相同，則隨機(jī)決定為誰(shuí)工作。用W表示接受工作時(shí)的工資；又設(shè)C(，e)為工人勞動(dòng)的成本，y(，e)為工人的產(chǎn)值。在此博弈中，工人的收益為W-C(，e)；雇到該工人的廠商收益為y(，e)-W，未雇到該工人的廠商收益為0；本博弈中工人受教育的程度為市場(chǎng)信號(hào)，且為三方博弈；由于未雇到該工人的廠商收益為0，因此兩個(gè)廠商的競(jìng)爭(zhēng)必然使其期望收益趨近于0；由于在市場(chǎng)經(jīng)濟(jì)中，上學(xué)年數(shù)與工資之間存在正相關(guān)關(guān)系，因此通常采用上學(xué)年數(shù)作為e的量值，有時(shí)也采用所修課程數(shù)量和成績(jī)、所讀學(xué)校水平等；即使上學(xué)年數(shù)多少對(duì)生產(chǎn)率毫無(wú)影響，工資也會(huì)隨上學(xué)年數(shù)的增加而增加；如果上學(xué)年數(shù)對(duì)生產(chǎn)率有影響，則工資隨上學(xué)年數(shù)的增加幅度肯定超過(guò)更多年數(shù)教育對(duì)生產(chǎn)率的實(shí)際貢獻(xiàn)；建模假設(shè)兩個(gè)廠商同時(shí)作為信號(hào)接收方，并且他們之間的競(jìng)爭(zhēng)會(huì)使其所出工資接近于工人的產(chǎn)值；又設(shè)兩個(gè)廠商在觀察到工人的受教育程度e以后，對(duì)工人的能力有相同的判斷：p(H|e)和p(L|e)=1-p(H|e)。于是，兩個(gè)廠商愿意出的工資率為：當(dāng)不僅工人自己知道其能力，而兩個(gè)廠商也知道時(shí)，這是一個(gè)完全信息博弈問題。廠商所支付的工資水平為：W(e)=y(,e)。因此工人選擇受教育的決策應(yīng)滿足Max[y(,e)-C

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

經(jīng)濟(jì)博弈論綜合概述

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

經(jīng)濟(jì)博弈論綜合概述

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔