經(jīng)濟(jì)博弈論綜合概述_第1頁(yè)
經(jīng)濟(jì)博弈論綜合概述_第2頁(yè)
經(jīng)濟(jì)博弈論綜合概述_第3頁(yè)
經(jīng)濟(jì)博弈論綜合概述_第4頁(yè)
經(jīng)濟(jì)博弈論綜合概述_第5頁(yè)
已閱讀5頁(yè),還剩102頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

經(jīng)濟(jì)博弈論

主講人:呂廷杰

使用教材與參考書《博弈論》施錫銓著,上海財(cái)經(jīng)大學(xué)出版社《經(jīng)濟(jì)博弈論》謝織予主編,復(fù)旦大學(xué)出版社《博弈論與信息經(jīng)濟(jì)學(xué)》張維迎著,上海三聯(lián)書店、上海人民出版社《博弈論——矛盾沖突分析》羅杰.B.邁爾森著,于寅費(fèi)劍平譯,中國(guó)經(jīng)濟(jì)出版社Game游戲;一定規(guī)則下有勝負(fù)的競(jìng)賽活動(dòng),如:OlympicGameGameTheory=>對(duì)策論,博弈論第一章經(jīng)濟(jì)博弈論概述1.1基本背景簡(jiǎn)介博弈論又稱對(duì)策論(GameTheory),主要研究決策主體的行為發(fā)生直接相互作用的時(shí)候,其決策以及這種決策的均衡問題。奠基石著作《博弈論與經(jīng)濟(jì)行為》(1944),諾意曼、摩根斯坦《n人博弈的均衡點(diǎn)》(1950),納什(JohnNash)點(diǎn)評(píng):社會(huì)科學(xué)研究范式中的一種核心工具——研究社會(huì)科學(xué)的數(shù)學(xué)工具區(qū)別:傳統(tǒng)經(jīng)濟(jì)學(xué)理論市場(chǎng)是一個(gè)無(wú)形的手新凱恩斯學(xué)派則強(qiáng)調(diào)政府有形的手的作用Max生產(chǎn)函數(shù)(決策變量、活勞動(dòng)、物化勞動(dòng)資本等),而與其他企業(yè)無(wú)關(guān)?研究理性的行動(dòng)者(agents)相互作用的理論

所有的科學(xué),只有當(dāng)數(shù)學(xué)應(yīng)用于其中時(shí),才可稱得上是完美的!——卡爾.馬克思博弈論在經(jīng)濟(jì)中的應(yīng)用——經(jīng)濟(jì)博弈論:重點(diǎn)在于研究寡頭市場(chǎng):研究存在相互外部經(jīng)濟(jì)條件下的個(gè)人選擇問題!博弈論的兩大分支:合作博弈(cooperativegame)與非合作博弈(non-cooperativegame)合作博弈:當(dāng)事人能否達(dá)成一種有約束力的協(xié)議(bindingagreement)——團(tuán)體理性——強(qiáng)調(diào)效率、公正、公平非合作博弈:每個(gè)企業(yè)都選擇自己的最優(yōu)產(chǎn)量(或價(jià)格),其結(jié)果可能是有效率的,也可能是無(wú)效率的。94年獲獎(jiǎng)?wù)叩难芯恐攸c(diǎn)!總之,博弈論在經(jīng)濟(jì)學(xué)中的應(yīng)用側(cè)重于對(duì)競(jìng)爭(zhēng)與沖突分析、市場(chǎng)作用機(jī)制等方面問題的研究,對(duì)這一領(lǐng)域作出杰出貢獻(xiàn)的學(xué)者包括:1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲獎(jiǎng)的三位博弈論專家:納什(Nash)、澤爾藤(Selten)和海薩尼(Harsanyi)。喬治。阿克羅夫麥克爾。斯彭斯約翰·納什約瑟夫。施蒂格里茨大師們的風(fēng)采幾則短信的經(jīng)濟(jì)學(xué)解釋魚說(shuō):我時(shí)時(shí)刻刻睜開眼睛,就是為了能讓你永遠(yuǎn)在我眼中!水說(shuō):我時(shí)時(shí)刻刻流淌不息,就是為了能永遠(yuǎn)把你擁抱!!鍋說(shuō):都快熟了,還這么貧?。?!

一、

約束條件變了,原來(lái)的收益,一下子都變?yōu)槌杀?。生命如果架在鍋上,成本自然也就很高了。一農(nóng)戶在殺雞前的晚上喂雞,不經(jīng)意地說(shuō):快吃吧,這是你最后一頓!第二日,見雞已躺倒并留遺書:爺已吃老鼠藥,你們別想吃爺了,爺也不是好惹的。

當(dāng)你知道了別人的決定之后,就能做出對(duì)自己最有利的決定?!{什均衡理論找點(diǎn)空閑找點(diǎn)時(shí)間背著炸彈到銀行看看警察為你準(zhǔn)備了一副手銬獄長(zhǎng)為你張羅一床毛毯生活的煩惱向記者說(shuō)說(shuō)搶劫的細(xì)節(jié)跟警察談?wù)勅?/p>

你要得到一些東西,就得放棄另一些東西。在經(jīng)濟(jì)學(xué)里,這叫機(jī)會(huì)成本。今夜星光燦爛,你在哪里浪漫,沒事可別亂跑,也別到處放電,我知你已成年,愛慕之心難免,但以你的條件,不能那么隨便,你是純種狼犬,別和笨狗相戀。四殺頭的事有人干,賠本的買賣沒人做。交易的本質(zhì)是不等價(jià)交換,是雙贏。而雙贏的前提是約束下的需要。飛機(jī)上,烏鴉對(duì)乘務(wù)員說(shuō):給爺來(lái)杯水!豬聽后也學(xué)道:給爺也來(lái)杯水!乘務(wù)員把豬和烏鴉扔出機(jī)艙,烏鴉笑著對(duì)豬說(shuō):傻了吧?爺會(huì)飛!五

外界因素是一種約束條件,自身能力也是一種約束條件。所以,別人能成功的事,未必自己就能成功。

黑猩猩不小心踩了長(zhǎng)臂猿拉的大便,長(zhǎng)臂猿溫柔細(xì)心地幫她擦洗干凈后他們相愛了,別人問起他們是怎么走到一起的,黑猩猩感慨地說(shuō):猿糞!都是猿糞那!六路徑依賴在經(jīng)濟(jì)學(xué)里說(shuō)的是,你當(dāng)下的選擇是被你的前一個(gè)選擇決定的,如果你要改變路徑,成本將會(huì)高到你不愿意改變。1.2經(jīng)濟(jì)博弈論與經(jīng)濟(jì)學(xué)學(xué)派之爭(zhēng)新古典經(jīng)濟(jì)學(xué)派(自由市場(chǎng)經(jīng)濟(jì)學(xué)派):經(jīng)濟(jì)學(xué)研究稀缺資源的有效配置——無(wú)形的手!前提:①足夠多的市場(chǎng)參與者——競(jìng)爭(zhēng)性條件;②參與者之間不存在信息不對(duì)稱——公平條件新凱恩斯學(xué)派:經(jīng)濟(jì)學(xué)是研究人的行為——不利選擇!理性的人:具有偏好,在給定的約束條件下最大限度的實(shí)現(xiàn)自己的偏好。理性人可能利己也可能利他,因此與自私的人不同。需要研究:激勵(lì)相容(incentivecompatible)或自選擇條件(self-selection)雙贏——利己與利他的博弈——相互影響——結(jié)盟策略理性人發(fā)明各種制度來(lái)規(guī)范行為——新制度經(jīng)濟(jì)學(xué)(路徑依賴?yán)碚摰龋纾簝r(jià)格制度價(jià)格制度的缺陷:如何研究學(xué)校、政府等非價(jià)格制度體系中人與人之間的相互作用——經(jīng)濟(jì)博弈論——奠基石關(guān)于中國(guó)的電信的拆分廣電與電信的交叉進(jìn)入全業(yè)務(wù)經(jīng)營(yíng)問題案例1:長(zhǎng)灘模型與公平、有效(1,1)(1,1)(1,1)互聯(lián)互通中的認(rèn)識(shí)誤區(qū)大網(wǎng)、小網(wǎng)成本不同,所以應(yīng)該不對(duì)等結(jié)算!經(jīng)濟(jì)學(xué)的兩個(gè)基本命題:(1)市場(chǎng)力與機(jī)會(huì)損失原則(2)邊際收益遞減原則結(jié)論性命題:平等接入的公平性原則是互聯(lián)互通雙方的利益均衡點(diǎn)滿足互聯(lián)不會(huì)對(duì)運(yùn)營(yíng)商之間在互聯(lián)前的平均每用戶收益相對(duì)關(guān)系產(chǎn)生扭曲影響。案例2:對(duì)于利益主體矛盾的調(diào)解澤爾騰公平獎(jiǎng)勵(lì)組合原則:式中:?jiǎn)栴}1:如果令成本=w;則上式也成立!當(dāng)大網(wǎng)用戶數(shù)為N,小網(wǎng)用戶數(shù)為n時(shí),取話務(wù)吸引系數(shù):則:于是有結(jié)算比例問題2:“信產(chǎn)部9號(hào)令”是不公平的!

A網(wǎng)交換機(jī)B網(wǎng)交換機(jī)DDFDDFODFODF互聯(lián)點(diǎn)?因此有互聯(lián)點(diǎn)應(yīng)在大網(wǎng)一側(cè)即:2.1博弈論研究的幾個(gè)要素(1)參與人(局中人):選擇行動(dòng)以使自己效用最大化的決策主體(理性人),表示為:i=1,2,3,…,n,n為參與人總數(shù);策略:通常:純策略空間:可以是連續(xù)或間斷的混合策略空間:滿足第二章博弈論基礎(chǔ)行動(dòng):參與人的決策變量:支付函數(shù)(盈利函數(shù)):參與人從博弈中獲得的效用水平,是行動(dòng)的函數(shù)戰(zhàn)略:參與人行動(dòng)的規(guī)則信息:參與人在博弈中的知識(shí),特別是有關(guān)對(duì)手特征和行動(dòng)的知識(shí)對(duì)局:博弈行動(dòng)的集合結(jié)局:博弈的解(均衡對(duì)局)均衡:所有參與人的相對(duì)最優(yōu)戰(zhàn)略或行動(dòng)集合其中參與人、行動(dòng)、結(jié)果統(tǒng)稱為博弈規(guī)則、博弈分析就是使用博弈規(guī)則來(lái)預(yù)測(cè)均衡點(diǎn)。關(guān)于理性人與智能(1)理性人(rational):若一個(gè)決策者在追求其目標(biāo)時(shí)能前后一致地做決策,我們就稱其為理性的。理性人的行為符合伯努里(1738)和馮·諾依曼/摩根斯坦(1974)的期望效用最大化定理。效用收益效用收益效用收益風(fēng)險(xiǎn)厭惡風(fēng)險(xiǎn)中性風(fēng)險(xiǎn)愛好馮.諾依曼—摩根斯坦效用函數(shù)E[U(x)]UxUxUx決策者從x美元中獲得的效用支付為u(x)=1-e-cx,其中c表示他的風(fēng)險(xiǎn)厭惡指數(shù)(Pratt,1964)智能的(intelligent):若局中人知道我們對(duì)此博弈所知道的一切(完全信息),并能做出我們對(duì)此局勢(shì)所能做出的一切判斷,則稱此博弈的局中人是智能的。關(guān)于理性人與智能(2)2.2博弈的分類(1)按參與人行動(dòng)的先后順序分類:靜態(tài)博弈:參與人同時(shí)選擇行動(dòng)或非同時(shí),但后者并不知前者采取了什么行動(dòng);動(dòng)態(tài)博弈:參與人的行動(dòng)有先后順序,且后者能夠觀察到前者所選擇的行動(dòng)。(2)按照參與人對(duì)對(duì)手的特征、戰(zhàn)略空間及支付函數(shù)的知識(shí)劃分:完全信息博弈:不完全信息博弈博弈的分類及其所對(duì)應(yīng)的均衡行動(dòng)順序信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950-51)完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡澤爾藤(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-68)不完全信息動(dòng)態(tài)博弈精煉貝葉斯納什均衡Kreps,Wilson(1982)Fudenberg,Tirole(1991)n=2,S1=S2=(A,B),對(duì)局(甲,乙)=(A,A),(A,B),(B,A),(B,B)u1(A,A)=2,u1(A,B)=-1,u1(B,A)=-2,u1(B,B)=1,

u2(A,A)=-2,u2(A,B)=1,u2(B,A)=2,u2(B,B)=-1CDA2,-2-1,1B-2,21,-1局中人甲盈利矩陣局中人乙2.3兩人O和博弈的純策略解ABA2-1B-21局中人乙局中人甲mM-1-2Mm21盈利矩陣1求純策略解的最大最小法則與最小最大法則結(jié)局:(甲,乙)*=(B,B)u1*(B,B)=1

u2*(B,B)=-1ABA-21B2-1局中人乙局中人甲Mm12mM-2-1盈利矩陣2結(jié)局:(甲,乙)*=(B,B)u1*(B,B)=1

u2*(B,B)=-12.4二人0和博弈的混合策略解局中人1盈利矩陣1局中人2設(shè)局中人1,2采取行動(dòng)A,B的概率分別為局中人1的混合策略(p1,p2)=(p,1-p)局中人2的混合策略(q1,q2)=(q,1-q)居中人1:采取行動(dòng)A的期望收益為:2q-(1-q)0=>3q-10采取行動(dòng)B的期望收益為:-2q+(1-q)0=>-3q+10居中人2:采取行動(dòng)A的期望收益為:2p-2(1-p)0=>4p-20采取行動(dòng)B的期望收益為:-p+(1-p)0=>-2p+10ABA2-1B-21

居中人1的混合策略

(p1,p2)=(1/2,1/2)

居中人2的混合策略(q1,q2)=(1/3,2/3)混合策略的數(shù)學(xué)表述局中人

i=1,2,3,…,n,的一個(gè)混合策略是其純策略空間上的概率分布,記為:i。n個(gè)局中人的混合策略向量為:=(1

,2

,…,n)稱為混合策略組合或混合策略剖面,其中1

,2

,…,n是統(tǒng)計(jì)獨(dú)立的;局中人i在混合策略剖面上的期望贏利:在上例中:ABA2,-2-1,1B-2,21,-1注解:純策略空間上的概率分布稱為退化分布2.5非O和博弈的累次嚴(yán)優(yōu)法局中人2局中人1LMRU4,35,16,2M2,18,43,6D3,09,62,8局中人2局中人1LMRU456M283D392局中人2局中人1LMRU312M146D068局中人2的策略M稱為其相對(duì)于策略R的“嚴(yán)劣策略”——可以刪除!局中人2局中人1LRU4,36,2M2,13,6D3,02,8局中人2局中人1LRU4,36,2解:(U,L),(4,3)注解:并非所有的博弈問題都有累次嚴(yán)優(yōu)解!局中人2局中人1LRU46M23D32(1)完全信息靜態(tài)博弈的納什均衡:假設(shè)有n個(gè)人參加博弈,在給定其他人策略的條件下,每個(gè)人選擇自己的相對(duì)最優(yōu)策略(可能依賴于他人的策略或不依賴),所有參與人選擇的策略一起構(gòu)成一個(gè)戰(zhàn)略組合,即為納什均衡。(僵局)注解:Nash均衡策略是指這樣一個(gè)策略組合(或剖面),為了極大化自己的盈利(或效用),每一個(gè)局中人所采取的策略一定應(yīng)該是關(guān)于其他局中人所采取策略的最佳反應(yīng)。因此沒有一個(gè)局中人會(huì)輕率地偏離這個(gè)策略組合(或剖面)而使自己蒙受損失。2.6囚徒困境與納什均衡坦白不坦白坦白-8,-80,-15不坦白-15,0-1,-1囚徒2囚徒1解:(坦白,坦白),(-8,-8)當(dāng)累次嚴(yán)優(yōu)解不存在時(shí),即局中人采用某策略時(shí)A優(yōu)于B,而采用另一策略時(shí)B優(yōu)于A時(shí)。(2)囚徒困境關(guān)于帕累托最優(yōu)與有效結(jié)局?jǐn)?shù)理經(jīng)濟(jì)學(xué)的Pareto最優(yōu)在博弈論中可以表述為:如果不存在其它的結(jié)局使得某些局中人的效用(或盈利)比這個(gè)結(jié)局的效用好得多,同時(shí)又不會(huì)使其他局中人的效用(或盈利)變的更差,則稱博弈的這個(gè)結(jié)局是有效的。局中人理性行為的結(jié)果可以不是有效的!(3)Nash均衡的求解(下畫線法)LRUa,eb,fDc,gd,h乙甲(U,L)為純策略Nash均衡D相對(duì)于U為嚴(yán)劣策略LRUa,eb,fDc,gd,h沒有劣純策略情況LRUa,eb,fDc,gd,hLRUa,eb,fDc,gd,h多重Nash均衡情況(4)Nash均衡的數(shù)學(xué)表述完全信息靜態(tài)博弈問題中的混合策略剖面*,如果對(duì)所有的局中人i(i=1,2,…,n)均成立:

那么,*被稱為該博弈的Nash均衡;如果*是退化的混合策略(純策略空間上的概率分布稱為退化分布),那么,所得到的是純策略Nash均衡。I兩個(gè)企業(yè)的價(jià)格競(jìng)爭(zhēng),產(chǎn)量博弈;II公共物品供給:所有人捐獻(xiàn)與友人不捐獻(xiàn)的結(jié)果;III軍備競(jìng)爭(zhēng)結(jié)論:有效的制度安排必須是一種納什均衡(5)Nash均衡的案例第三章完全信息靜態(tài)博弈博弈中的居中人了解各自的贏得函數(shù)、偏好和決策規(guī)則局中人同時(shí)做出決策3.1Nash均衡(續(xù))(1)混合策略Nash均衡的解委托人/代理人問題:代理人的策略空間=(工作,偷懶)=(W,S)代理人工作的代價(jià)為:g,獲得委托人的報(bào)酬為:w,(w>g)代理人工作時(shí)將為委托人增加價(jià)值為v的財(cái)產(chǎn)(v>w)委托人的策略空間=(檢查,不檢查)=(I,,N)檢查所需費(fèi)用為:h(h<w),于是有:INS0,-hw,-wWw-g,v-w-hw-g,v-w委托人代理人無(wú)純策略Nash均衡!設(shè)代理人偷懶的概率為x,工作的概率為(1-x);設(shè)委托人檢查的概率為y,不檢查的概率為(1-y);于是有代理人的期望贏利為:根據(jù)Nash均衡的定義,在給定委托人混合策略2

=(y,1-y)的條件下,尋求x值以使u1

(1,2

)達(dá)到最大。因此,對(duì)上式x求導(dǎo)數(shù)并令其為零,得到:w(1–y)=w–g;因此y=g/w。同理可得:x=h/w

。本問題的混合策略Nash均衡解為:(h/w,1-h/w),(g/w,1-g/w)經(jīng)濟(jì)用途:考察達(dá)到Nash均衡時(shí)委托人的期望贏利為:u2

(1*,2*

)=v(1–x)–w(1–xy)–hy=v(1–h/w)–w他與代理人的生產(chǎn)價(jià)值v、委托人檢查費(fèi)用h、以及委托人付給代理人的工資w有關(guān)。通常生產(chǎn)價(jià)值v和檢查費(fèi)用h可為已知和固定的,因此,求微分可得,若取時(shí),委托人得平均贏利將達(dá)到極大。于是通常作為委托人與代理人之間簽署合同工資得參考值。(3)解及其討論例:阻撓市場(chǎng)進(jìn)入(entrydeterrance)模型默許斗爭(zhēng)進(jìn)入40,50-10,0不進(jìn)入0,3000,300在位者(現(xiàn)有壟斷企業(yè))進(jìn)入者純策略Nash均衡點(diǎn):(不進(jìn)入,斗爭(zhēng)),(進(jìn)入,默許)3.2多重Nash均衡多重模型的求解主要是進(jìn)行結(jié)局的預(yù)測(cè)!又例懦夫博弈問題TWT-1,-12,1W1,20,0Nash均衡結(jié)局為:純策略(T,W)(W,T)混合策略(1/2,1/2)(1/2,1/2)關(guān)于多重Nash均衡的幾點(diǎn)討論澤爾滕1960年提出的“聚集”效應(yīng)設(shè)有一個(gè)游戲:兩個(gè)局中人獨(dú)立地寫出(-1/2,1/2)中任一數(shù),若兩人所寫數(shù)字相同,則每人獎(jiǎng)勵(lì)100元,否則每人被罰10元。顯然某局中人在策略空間中選擇x(-1/2,1/2),另一局中人的最佳反映是y=x。也即對(duì)于一切的t

(-1/2,1/2),(t,t)是Nash均衡。然而,在隨機(jī)情況下(x,y)(xy)發(fā)生的概率要遠(yuǎn)大于(t,t),但對(duì)于想要贏錢的理性人而言,他們會(huì)更多地選擇(t,t)如果是多人游戲或策略空間為[0,)對(duì)局的情況將更加離散;這時(shí)(0,0)通常成為合理的預(yù)測(cè)結(jié)局。個(gè)別理性、共同理性與雙贏博弈!3.3古諾(Cournot)模型(產(chǎn)量博弈)設(shè)有

2個(gè)廠商(博弈方);廠商i的產(chǎn)量為qi

,(i=1,2);決策空間為Qi=[0,],則2個(gè)廠商的總產(chǎn)量為:已知市場(chǎng)價(jià)格是總產(chǎn)量的減函數(shù):P=P(Q);因此廠商i的收益為:qi

·P(Q);再假設(shè)廠商生產(chǎn)產(chǎn)品的成本為Ci(qi

);因此,廠商i的產(chǎn)量為qi

時(shí)的收益為:ui=qi

·P(q1

+q2

)-C(qi)說(shuō)明:(1)本模型可以推廣到2個(gè)以上的廠商;(2)廠商i的收益不僅取決于其自身的產(chǎn)量qi,而且還取決于其他廠商的決策qj,j=1,2,…,n,ji。記廠商1,2的Cournot反應(yīng)函數(shù)分別為:r1:Q2Q1

r2:Q1Q2

求收益函數(shù)的一階導(dǎo)并使之等于零,可以解得反應(yīng)函數(shù)。不加證明地引入Cournot均衡引理:最佳反應(yīng)函數(shù)分別為:他們分別滿足:映射映射Nash均衡q1*,q2*為反應(yīng)函數(shù)兩條曲線的交點(diǎn)!例:已知或取特殊情況C(q1)=c·q1,C(q2)=c·q2其中c為常數(shù),則反應(yīng)函數(shù)為:易得q1*=q2*

=4–c/3解的分析:Cournot博弈中也存在個(gè)別理性與共同理性的矛盾,即合作策略的處境更好些!上例中,令c=0,此時(shí)的Nash均衡q1*=q2*

=4,且有:u1(4,4)=u2(4,4)=16注意到局中人的盈利函數(shù)為ui(q1,q2

)=qi(12-q1-q2),若取q1=q2

=3,即雙方都限量生產(chǎn),則有:u1(3,3)=u2(3,3)=36=183.4博川德(Bertrand)模型(價(jià)格博弈)考慮兩個(gè)公司生產(chǎn)不同品牌、不同質(zhì)量與不同包裝的同類商品。如果其價(jià)格選擇分別為p1與p2,對(duì)于公司i(i=1,2)的顧客需求量為qi(pi

,pj)=a–pi+bpj。其中b>0反映公司i的產(chǎn)品對(duì)公司j產(chǎn)品的

替代程度。取特例令固定成本=0,邊際成本為常數(shù)c,c<a。于是,公司i的盈利函數(shù)為:求偏導(dǎo)得及解聯(lián)立方程

得稱之為博弈的Nash均衡或Bertrand均衡說(shuō)明:(1)本模型也可以推廣到2個(gè)以上的廠商;(2)Cournot均衡和Bertrand均衡均基于贏利函數(shù)可微和嚴(yán)凹性從一階條件推出,其他贏利函數(shù)要用更多的數(shù)需工具。法國(guó)經(jīng)濟(jì)學(xué)家古諾(Cournot)一個(gè)半世紀(jì)以前提出的寡頭市場(chǎng)模型是博弈論的經(jīng)典模型這個(gè)模型主要被用來(lái)研究雙寡頭壟斷Duopoly的市場(chǎng)

古諾模型適用于:博弈的雙方實(shí)力均衡、非合作、靜態(tài)博弈問題。3.5關(guān)于Cournot模型的小結(jié)市場(chǎng)單價(jià)P是市場(chǎng)總產(chǎn)量Q的線性函數(shù)我們稱這個(gè)函數(shù)為逆需求函數(shù)。如果假設(shè)兩廠商的生產(chǎn)都無(wú)固定成本且有相同的不變單位成本c≥0,那么,利潤(rùn)與企業(yè)選擇的業(yè)務(wù)指標(biāo)的關(guān)系為:在本博弈中,對(duì)局為納什均衡的充分必要條件是最大值問題

因?yàn)榍笞畲笾档膬蓚€(gè)式子都是各自變量的二次式,且二次項(xiàng)的系數(shù)都小于0,因此、只要能使它們各自對(duì)q1和q2的導(dǎo)數(shù)為0,就一定能實(shí)現(xiàn)它們的最大值。

解之,得,并且這是唯一的一組解。因此

是本博弈唯一的納什均衡策略組合(解)。

結(jié)論:實(shí)力相近的雙寡頭壟斷市場(chǎng)中,二者的業(yè)務(wù)指標(biāo)(用戶數(shù)、產(chǎn)量等)相等為本博弈模型的均衡解

整理得反應(yīng)函數(shù)或稱業(yè)務(wù)指標(biāo)函數(shù)為:第四章完全信息動(dòng)態(tài)博弈動(dòng)態(tài)的囚徒困境問題行動(dòng)的先后產(chǎn)生信用(credibility)問題核心是“承諾”與“威脅”殘局與子博弈均衡——?jiǎng)討B(tài)規(guī)劃——“子博弈完美均衡”完全信息:共同知識(shí)為贏利函數(shù)和純策略空間完美信息(下棋):除此之外,局中人還掌握在此之前對(duì)局雙方的行動(dòng)過(guò)程和目前所處狀態(tài)。所有局中人都有完美信息的博弈問題稱為“完美信息”博弈問題,否則為不完美信息博弈問題。有限博弈:博弈過(guò)程的階段數(shù)有限。4.1展開型博弈——信息的作用參與人(局中人):選擇行動(dòng)以使自己效用最大化的決策主體(理性人),表示為:i=1,2,3,…,n,n為參與人總數(shù);行動(dòng)的順序:誰(shuí)在何時(shí)行動(dòng)策略空間及其選擇:行動(dòng)經(jīng)歷:支付函數(shù)(盈利函數(shù)):在任何外生事件上的概率。4.2斯坦?fàn)柌瘢⊿tackelberg)寡頭競(jìng)爭(zhēng)模型

斯坦?fàn)柌衲P徒沂镜氖峭耆畔?dòng)態(tài)條件下的對(duì)策均衡問題。市場(chǎng)廠商的行動(dòng)也是選擇業(yè)務(wù)量或用戶數(shù),但在斯坦?fàn)柌衲P椭?,廠商1是領(lǐng)先廠商,首先選擇其業(yè)務(wù)指標(biāo)q1;競(jìng)爭(zhēng)對(duì)手2是尾隨廠商,觀測(cè)到后,選擇自己的業(yè)務(wù)指標(biāo)q2。因此,這又是一個(gè)完美信息動(dòng)態(tài)對(duì)策.。

假定逆需求函數(shù)為,廠商有相同的不變單位成本c≥0,那么,支付(利潤(rùn))函數(shù)為:

求解這個(gè)博弈問題“子博弈完美納什均衡”的逆推歸納法首先考慮給定q1的情況下,廠商2的最優(yōu)選擇(第2階段):階段1階段2階段nS0Sn決策階段效應(yīng)決策決策階段效應(yīng)階段效應(yīng)因?yàn)閺S商1預(yù)測(cè)到廠商2將根據(jù)r2(q1)選擇q2,于是,廠商1在第一階段的問題是:

解一階條件得:

將結(jié)果代入廠商2得反應(yīng)函數(shù)得到:實(shí)力相異的雙寡頭壟斷市場(chǎng)中,實(shí)力相對(duì)強(qiáng)的寡頭與實(shí)力相對(duì)弱的寡頭的業(yè)務(wù)指標(biāo)(用戶數(shù)、產(chǎn)量等)比為:2:1為本博弈模型的均衡解。(也即3:7開)4.3動(dòng)態(tài)博弈問題的博弈樹表示方法博弈樹是一個(gè)樹型圖,由節(jié)點(diǎn)和連接節(jié)點(diǎn)的連線(分枝)構(gòu)成;局中人的行動(dòng)順序用各節(jié)點(diǎn)簡(jiǎn)的順序關(guān)系自上而下來(lái)表示;博弈樹中不允許出現(xiàn)“圈”或多個(gè)直接前列節(jié)點(diǎn)情況;沒有后續(xù)節(jié)點(diǎn)的節(jié)點(diǎn)稱為終止節(jié)點(diǎn),否則稱為決策節(jié)點(diǎn)。122xyz例:阻撓市場(chǎng)進(jìn)入(entrydeterrance)模型默許斗爭(zhēng)進(jìn)入40,50-10,0不進(jìn)入0,3000,300在位者(現(xiàn)有壟斷企業(yè))B進(jìn)入者AAB(0,300)進(jìn)入(40,50)(-10,0)不進(jìn)入B默許斗爭(zhēng)已知:純策略Nash均衡點(diǎn)(不進(jìn)入,斗爭(zhēng))(進(jìn)入,默許)幾點(diǎn)討論AB(0,300)進(jìn)入(40,50)(-10,0)不進(jìn)入B默許斗爭(zhēng)默許斗爭(zhēng)進(jìn)入40,50-10,0不進(jìn)入0,3000,300AB

A不進(jìn)入是因?yàn)槭艿紹公司斗爭(zhēng)的威脅,并將因此損失10;但這種威脅是不可信的“空洞威脅”,因?yàn)槿鬉真的進(jìn)入,則B的最佳反應(yīng)是默許(得50),而不是斗爭(zhēng)(得0);因此,在上述兩個(gè)納什均衡中,只有(進(jìn)入,默許)是合理的。博弈的信息結(jié)構(gòu)任一決策節(jié)點(diǎn)屬于且僅屬于一個(gè)信息集;處于同一信息集中的不同節(jié)點(diǎn)是同一局中人選擇行動(dòng)時(shí)所無(wú)法區(qū)分的。博弈的信息結(jié)構(gòu)用信息集表示,信息集是全部決策節(jié)點(diǎn)的一個(gè)分刈,它滿足:完美信息博弈問題的信息結(jié)構(gòu)AB(0,300)進(jìn)入(40,50)(-10,0)不進(jìn)入B默許斗爭(zhēng)非完美信息博弈問題的信息結(jié)構(gòu)例:假如僅有兩張撲克牌A和2,和兩個(gè)局中人甲和乙,游戲規(guī)則為:開始時(shí)每人壓上1元的注,然后乙隨即抽取一張牌看看是幾,若牌是A則必須告訴甲是A,若是2則可說(shuō)是A也可說(shuō)是2;乙說(shuō)2等于認(rèn)輸,1元輸給甲,若說(shuō)A則不管是否是A乙要再加1元賭注,然后由甲判斷;甲說(shuō)相信則輸?shù)?元,說(shuō)不信則需再壓上1元獲得翻牌機(jī)會(huì),翻開后是A則乙贏2元,若為2則甲贏2元。乙乙A0.5(-2,2)20.5乙A甲(-1,1)(2,-2)(-1,1)(1,-1)YN2甲ANY信息集I信息集J信息集K信息集L注意:信息集J分刈了信息集K,反之亦然!子博弈是原博弈樹的一個(gè)部分樹,它必須滿足:從一個(gè)決策點(diǎn)開始包含它所有的后續(xù)節(jié)點(diǎn);開始點(diǎn)所在的信息集中除了這一點(diǎn)外,沒有其他節(jié)點(diǎn);不分刈任何信息集如果博弈中各局中人的策略所構(gòu)成的一個(gè)策略組合在博弈本身和所有的子博弈中都構(gòu)成了納什均衡,則稱該博弈為子博弈精練納什均衡。4.4子博弈精練納什均衡(澤爾滕)子博弈精練納什均衡的圖解法甲乙(-1,-3)乙(-1,-1)(3,1)(-2,1)(2,3)甲信息集I信息集J信息集K信息集L甲乙乙(-1,-1)(3,1)(-2,1)(2,3)信息集I信息集J信息集K甲(3,1)(2,3)4.5討價(jià)還價(jià)模型(BargainingModel)設(shè)有買方B愿意出最高價(jià)300元購(gòu)買一商品;而賣方S將不接受任何低于200元以下的開價(jià)談判價(jià)與B、S各自保留價(jià)之間的差恰為各人從交易中獲得的贏利,獲利范圍[0,100]B開價(jià)P1(300-P1,P1-200)反開價(jià)P2(300-P2,P2-200)(0,0)BSarara:接受r:拒絕S開價(jià)P2(300-P2,P2-200)反開價(jià)P1(300-P1,P1-200)(0,0)SBararPi

±:吃掉幾乎整塊蛋糕的后動(dòng)者優(yōu)勢(shì)!影響討價(jià)還價(jià)結(jié)果的因素為:誰(shuí)最后開價(jià)開價(jià)的輪次數(shù)(有無(wú)耐心)無(wú)耐心的討價(jià)還價(jià):考慮足夠多次討價(jià)還價(jià),例如輪次數(shù)為100,假定在100次的基礎(chǔ)上,每拖延一輪協(xié)議的交易成本將會(huì)使兩個(gè)局中人都縮減從交易成本中所獲益的3%如果S最后開價(jià),因此第99輪B提出297元的開價(jià),并相信S會(huì)接受,因?yàn)樵龠M(jìn)行一輪S也只能得到297,這時(shí)B將獲得3元的贏利。輪次SB開價(jià)贏利代價(jià)開價(jià)贏利代價(jià)100300.00100.003.00——0.000.0099——97.000.00297.003.000.0998297.0997.092.91——2.910.0097——94.180.00294.185.820.18……………………………………3——51.800.00251.8048.201.452253.2553.251.60——46.750.001——51.650.00251.6548.351.45Rubinstein-Stahl(R-S)討價(jià)還價(jià)的一般模型設(shè)在輪次2k+1

(k=0,1,2,…)由局中人B提出一個(gè)分配方案(x,1-x)。這里x可以視為一塊蛋糕的百分比;對(duì)此,局中人S可以接受或拒絕。若S接受,則博弈結(jié)束;若S拒絕,則在輪次2k(k=1,2,…)時(shí)提出反建議方案。這時(shí)局中人B可以接受或拒絕。如果在某輪B接受了S的開價(jià),博弈結(jié)束,否則繼續(xù)。Stahl于1972年研究了有限輪次討價(jià)還價(jià)博弈;Rubinstein于1982年研究了無(wú)限輪次討價(jià)還價(jià)博弈。通常采用折扣因子考慮無(wú)耐心情況。令某局中人再等一輪的代價(jià)是其下一輪分得盈余的百分比,也即其本輪的所得的理性預(yù)期為下輪所得的1-=倍。設(shè)y為其下一輪所得,

y相當(dāng)于y在本輪的貼現(xiàn)值。本博弈問題有大量的Nash均衡,但只有唯一的“子博弈精練納什均衡”[Rubinstein定理]設(shè)局中人S、B關(guān)于一塊蛋糕(盈余)的分配采用交替開價(jià)的辦法進(jìn)行討價(jià)還價(jià)。局中人B首先開價(jià),開價(jià)次數(shù)沒有限制;兩個(gè)局中人的折扣因子分別為0<B<1和0<S<1;當(dāng)某個(gè)局中人關(guān)于接受或拒絕某開價(jià)確實(shí)感到無(wú)所謂時(shí),則認(rèn)為該局中人接受此開價(jià)。那么這個(gè)討價(jià)還價(jià)博弈有唯一的子博弈精練納什均衡;局中人B立即提供給S以盈余的S(1-B)/(1-SB)而留給自己(1-S)/(1-SB)S接受此方案。反之亦反。例:當(dāng)S=B=0.03,則先后開價(jià)者分別得0.03和0.97。4.4重復(fù)博弈定義:個(gè)頂一個(gè)博弈G,重復(fù)進(jìn)行T次,并且在每次重復(fù)之前各局中人都能觀察到以前博弈的結(jié)果,這樣的博弈過(guò)程成為G的一個(gè)“T次重復(fù)博弈”,記為G(T)。而G稱為G(T)的原博弈。G(T)中的每次重復(fù)稱為G(T)的一個(gè)階段。常見情況是原博弈G為具有靜態(tài)均衡的博弈,則這時(shí)的重復(fù)博弈就是靜態(tài)博弈的多次重復(fù)進(jìn)行。定理:設(shè)原博弈G有唯一的納什均衡,則對(duì)任意正整數(shù)T,重復(fù)博弈G(T)有唯一的子博弈完美解,即各局中人每個(gè)階段都采用G的納什均衡策略。各博弈方在G(T)中的總收益為在G中收益的T倍,平均每階段收益等于原博弈G中的收益。例:兩次重復(fù)的囚徒困境問題坦白不坦白坦白-8,-80,-15不坦白-15,0-1,-1囚徒2囚徒1采用逆推歸納法,本階段的納什均衡為:(坦白,坦白)(-8,-8)坦白不坦白坦白-16,-16-8,-23不坦白-23,-8-9,-9囚徒2囚徒1在已知雙方第二階段結(jié)局的情況下,本階段的納什均衡為:(坦白,坦白)(-16,-16)第一階段:第二階段:結(jié)論:總是坦白為本問題的子博弈完美均衡第五章不完全信息靜態(tài)博弈例如:招投標(biāo)、拍賣等活動(dòng)5.1Bayes博弈與Bayes均衡非對(duì)稱信息下的Cournot模型已知逆需求函數(shù)為:設(shè)企業(yè)1的成本函數(shù)為:cq1,企業(yè)2是新加入者,他新發(fā)明了一種新技術(shù),因此成本函數(shù)為:又設(shè)公司2已知自己和公司1的成本函數(shù),而公司1除了知道自己的成本函數(shù)以外,對(duì)于公司2的成本函數(shù)無(wú)法確定,但了解上述成本結(jié)構(gòu)。上述模型成為典型的信息不對(duì)稱博弈問題求解以與分別表示公司2對(duì)于不同邊際成本所選擇的產(chǎn)量;為公司1的產(chǎn)量選擇如果公司2取高成本CH,則應(yīng)滿足:同理,若公司2取低成本CL,則應(yīng)滿足:于是公司1應(yīng)選擇使期望盈利最大化:上述三個(gè)最優(yōu)化問題的一階解條件為:求解上述聯(lián)立方程可得:當(dāng)CL=CH=c完全信息靜態(tài)納什均衡幾點(diǎn)討論不完全信息情況下Cournot模型的納什均衡與完全信息情況下的解不同;在不完全信息情況下Cournot模型的納什均衡具有產(chǎn)量與成本之間成反比例關(guān)系的特征:本問題的解又蘊(yùn)含了以下關(guān)系:?jiǎn)栴}:是否應(yīng)該選擇新技術(shù)?5.2不完全信息靜態(tài)Bayes博弈的一般表述設(shè)有n個(gè)局中人進(jìn)行靜態(tài)博弈,局中人i的行動(dòng)空間為Ai,(i=1,2,…,n)假設(shè)他有數(shù)個(gè)可能的盈利函數(shù),不妨設(shè)有兩個(gè)時(shí),稱局中人i有兩個(gè)類型ti1,ti2;以及類型空間Ti={ti1,ti2}其中類型ti1的概率為p,類型ti2的概率為1-p對(duì)應(yīng)于局中人i的盈利函數(shù)為ui(a1,a2,…,an,tij),(j=1,2)因此上述博弈問題可以表述為:G={A1,A2,…,An;T1,T2,…,Tn;p1,p2,…,pn;u1,u2,…,un}5.3完全但不完美信息動(dòng)態(tài)博弈博弈雙方了解博弈的要素,但至少有一方不了解博弈的過(guò)程不完美信息動(dòng)態(tài)博弈主要被用于研究局中人信息不對(duì)稱的問題(例如二手車交易問題)11122好差不賣賣賣不賣買不買買不買局中人2(買方)不了解的階段以二手車問題為例:當(dāng)賣方?jīng)Q定賣車時(shí),買方需要作出判斷的是車況的好壞,以及好壞的概率是多少?設(shè):p(g|s)和p(b|s)分別表示賣方?jīng)Q定賣車時(shí)車況好與壞的概率,為買方的判斷值;又設(shè):p(g)和p(b)為車況好與壞的經(jīng)驗(yàn)概率;p(s|g)和p(s|b)分別表示車況好與壞的情況下賣方選擇賣與不賣的概率。于是根據(jù)貝葉斯法則:5.4市場(chǎng)的四種類型分析市場(chǎng)完全失?。簼撛诘馁Q(mào)易利益存在,但包括擁有高質(zhì)量產(chǎn)品的所有賣方因擔(dān)心賣不出去而不敢將商品投放市場(chǎng)的情況,或買方擔(dān)心買到次品而不敢購(gòu)買;市場(chǎng)完全成功:擁有高質(zhì)量產(chǎn)品的賣方將商品投放市場(chǎng),而擁有低質(zhì)量產(chǎn)品的賣方不敢將商品投放市場(chǎng)的情況(將實(shí)現(xiàn)最大貿(mào)易利益);市場(chǎng)部分成功:不管產(chǎn)品質(zhì)量高低,賣方都將商品投放市場(chǎng),買方也不管好壞什么商品都買進(jìn)的情況,因可能發(fā)生不良交易,所以會(huì)產(chǎn)生負(fù)的市場(chǎng)效率;市場(chǎng)接近失?。簱碛懈哔|(zhì)量產(chǎn)品的賣方將商品投放市場(chǎng),而擁有低質(zhì)量產(chǎn)品的賣方將商品部分投放市場(chǎng)的情況。買方以一定的概率選擇買或不買,即買賣雙方都采用混合策略作為對(duì)不完全信息的反應(yīng)。市場(chǎng)的四種類型分析(續(xù))市場(chǎng)完全失?。?、賣方總是選擇不賣,或

2、買方總是選擇不買;

3、p(g|s)=0,p(b|s)=1。市場(chǎng)完全成功:1、賣方在車況好時(shí)賣,不好時(shí)不賣;

2、買方總是選擇買,只要賣方賣;

3、p(g|s)=1,p(b|s)=0。市場(chǎng)部分成功:1、賣方總是選擇賣,不管車況好壞;

2、買方總是選擇買,只要賣方賣;

3、p(g|s)=p(g),p(b|s)=p(b)

。11122好差不賣賣賣不賣買不買買不買(0,0)(A,V-A)(-C,0)(A-C,W-A)其中:V為車況好時(shí)的效用價(jià)值W為車況差時(shí)的效用價(jià)值A(chǔ)(售價(jià))>C(整修費(fèi))V>A>W設(shè):V=3000,W=0,A=2000,C=1000,且p(g)=p(b)

=0.5。于是,賣方確定出售時(shí)(純策略情況),且買方購(gòu)買的期望收益為:pg·(V-A)+pb·(W-A)=0.51000+0.5(-2000)=-500<0二手車問題的純策略解純策略情況下市場(chǎng)必然失??!市場(chǎng)接近失敗:混合策略完美貝葉斯均衡1、賣方在車況好時(shí)以概率1(p(s|g)=1)出售,車況不好時(shí)以0.5的概率(p(s|b)=0.5)出售;2、根據(jù)貝葉斯法則,買方的判斷為:買方的期望收益為(符合序列理性檢驗(yàn)):車況好時(shí)賣方才賣,而買方以0.5的概率選擇買時(shí),賣方的期望收益為:0.5A+0.50=0.52000+0.50=1000>0

車況差時(shí)賣方才賣,而買方以0.5的概率選擇買時(shí),賣方的期望收益為:0.5(A-C)+0.5(-C)=0.51000+0.5(-1000)=0結(jié)論差車的賣方與所有買方參與市場(chǎng)的平均結(jié)果是不盈也不虧;好車的賣方只有一半的機(jī)會(huì)能賣掉車;這說(shuō)明信息不完美情況下市場(chǎng)的效率會(huì)受到很大影響,產(chǎn)生“不利選擇”!問題:如何改善市場(chǎng)效率?5.5海薩尼(Harsanyi)轉(zhuǎn)換現(xiàn)假設(shè)一個(gè)名為“自然”的博弈方0,該博弈方的作用是為其他每個(gè)博弈方抽取他們的類型,抽取的類型構(gòu)成向量t=(t1,t2,…,tn),其中tiTi,i=1,2,…,n

;“自然”讓每個(gè)博弈方都知道自己的類型,但卻不讓其他博弈方知道;除“自然”以外其他博弈方同時(shí)從各自的行為空間選擇行動(dòng)方案a1,a2,…,an

;除“自然”以外其他博弈方各自取得收益ui=ui(a1,a2,…,an

,ti)因此,這是一個(gè)完全但不完美的動(dòng)態(tài)信息博弈5.6有同時(shí)選擇的完全但不完美動(dòng)態(tài)信息博弈將不完全信息靜態(tài)博弈問題進(jìn)行Harsanyi轉(zhuǎn)換之后,對(duì)類型的判斷在形式上就變成了對(duì)博弈的進(jìn)程,即“自然”的選擇的判斷。通常假設(shè)“自然”以概率分布p1,p2,…,pn,分別選擇t1,t2,…,tn

。在不完全信息Cournot模型中廠商2有CH和CL兩種只有自己才清楚的類型。但如果廠商2只考慮自己是CH類型時(shí)的最佳產(chǎn)量選擇,而沒有作出選擇,則廠商1的就無(wú)法確定。也即在“自然”抽取博弈方的類型ti后,博弈方即使已知自己的類型,但也需要對(duì)每種可能的ti都設(shè)定一種響應(yīng)的行動(dòng)方案第六章不完全信息動(dòng)態(tài)博弈不完全信息動(dòng)態(tài)博弈問題:至少有一個(gè)局中人對(duì)其他某些局中人的收益不清楚。例如:網(wǎng)站拍賣,古玩交易等。不完全信息動(dòng)態(tài)博弈又稱為動(dòng)態(tài)貝葉斯博弈問題。解決不完全信息靜態(tài)博弈的海薩尼轉(zhuǎn)換依然適用于不完全信息動(dòng)態(tài)博弈。轉(zhuǎn)化后的問題稱為非同時(shí)選擇的完全但不完美動(dòng)態(tài)信息博弈。6.1信號(hào)博弈兩個(gè)局中人;局中人各自都只有一次行為;后行動(dòng)的一方(信號(hào)接收方)具有不完全信息,但他可以從先行動(dòng)一方(信號(hào)發(fā)出方)的行動(dòng)中獲得部分信息。因此,先行動(dòng)一方對(duì)后行動(dòng)這而言就像一種反映其收益函數(shù)的信號(hào),故稱之為“信號(hào)博弈”。轉(zhuǎn)換的過(guò)程:設(shè)有一個(gè)博弈方0先為發(fā)出方按一定的概率從其類型空間中隨即選擇一個(gè)類型,并將該類型告訴發(fā)出方;然后,發(fā)出方在自己的行為空間選擇一個(gè)行為(發(fā)出信號(hào));最后是接收方根據(jù)發(fā)出方的行為(發(fā)出的信號(hào))選擇自己的行為。信號(hào)博弈的模型設(shè):S表示信號(hào)發(fā)出方,R表示接收方;

T={t1,t2,…,tI}表示S的類型空間,M={m1,m2,…,mJ}表示S的行為空間,或稱信號(hào)空間;

A={a1,a2,…,aK}表示R的行為空間;

US、UR分別表示S和R的收益;又設(shè)博弈方0為S選擇類型的概率分布為:{p(t1),p(t2),…,p(tI)},則一個(gè)信號(hào)博弈為:博弈方0以概率p(ti)選擇類型ti

,并讓S知道;S

選擇行為mj

(M);R

看到mj

后選擇ak;S和R

的收益US、UR都取決于ti

mj

和ak

。模型的其他條件:p(ti)>0且p(t1)+p(t2)+…+p(tI

)=1;R

雖然不知道S

的類型就是ti

,但是卻知道p(ti);S所選擇的mj

為ti

的函數(shù),當(dāng)然也是收益和ak的函數(shù);在有些問題中,T、M

和A

也可以是連續(xù)空間,而不一定是有限離散空間。6.2信號(hào)博弈的完美貝葉斯均衡接收方R

在觀察到發(fā)出方S的信號(hào)mj

之后,必須作出關(guān)于S

的類型的判斷,即估計(jì)以下條件概率:p(ti|mj)。p(ti|mj)0;p(ti|mj)=1。給定R

的判斷和S的信號(hào)mj

,R

的行為為a*(mj

)必須使R的期望收益最大,即a*(mj

)滿足:給定R的策略a*(mj

)時(shí),S的選擇m*(ti)

應(yīng)滿足:對(duì)每個(gè)mj

M

,如果存在ti

T

使得m*(tj)=

mj

,則R在對(duì)應(yīng)于mj

的信息集處的判斷必然符合S的策略和貝葉斯法則。例一:股權(quán)與債權(quán)置換問題問題的提出:企業(yè)要上一個(gè)新項(xiàng)目,為此需吸引一批資金;但希望投資的外人不能看到該企業(yè)的真實(shí)盈利能力,原因是該企業(yè)原來(lái)盈利能力為內(nèi)部信息,而新項(xiàng)目所創(chuàng)造的利益無(wú)法從整個(gè)企業(yè)的總利潤(rùn)中區(qū)分開來(lái)。那么,如果企業(yè)像投資人提出用一定比例的股權(quán)換取投資,那么,在怎樣的情況下提議會(huì)被接受,而企業(yè)出多少股權(quán)才合適呢?為此,首先假設(shè)企業(yè)的利潤(rùn)有高低兩種可能:=H或=L,H>L>0。又設(shè)新項(xiàng)目所需投資為I,新增收益為B,社會(huì)平均收益率為r,則本博弈問題成立的條件是:B>I(1+r)。建模設(shè)企業(yè)原有利潤(rùn)的高低為隨機(jī)變量,已知:p(=H)=p,p(=L)=1-p

;企業(yè)自己了解,愿出W比例的股權(quán)換取投資I;投資人看到W,但看不到,只知道是高或低的概率,然后選擇接受企業(yè)的提議或拒絕;若投資人拒絕,其收益為I(1+r),企業(yè)收益為;若投資人接受,其收益為W(+B),企業(yè)收益為(1-W)(+B);這是一個(gè)發(fā)出方有兩種類型,接收方有兩種行為的信號(hào)博弈問題;而信號(hào)發(fā)出方的信號(hào)W則是一個(gè)連續(xù)區(qū)間0<W<1。6.3完美貝葉斯均衡解的條件通常情況下投資人會(huì)在看到W后判斷p(H|W)=q的概率,則他只會(huì)在W[qH+(1-q)L+B]I(1+r)時(shí)才會(huì)接受,即:WI(1+r)/[qH+(1-q)L+B]而對(duì)企業(yè)而言,只有當(dāng)(1-W)(+B),即:WB/(+B)時(shí)才愿意出價(jià)W。于是有:也即例二:勞動(dòng)市場(chǎng)信號(hào)博弈:Spence-1973自然隨機(jī)決定一個(gè)工人的生產(chǎn)能力,有高低兩種可能,分別記為H和L。并且工人生產(chǎn)能力高低的概率p(=H)和p(=L)是公共知識(shí);工人清楚自己的生產(chǎn)能力屬于高還是低,然后他為自己選擇一個(gè)受教育水平e0;有兩個(gè)廠商都觀察到工人的受教育水平(不是能力),然后同時(shí)提出愿支付給該工人的工資水平;工人接受工資水平較高的一份工作,如果兩個(gè)廠商支付的工資水平相同,則隨機(jī)決定為誰(shuí)工作。用W表示接受工作時(shí)的工資;又設(shè)C(,e)為工人勞動(dòng)的成本,y(,e)為工人的產(chǎn)值。在此博弈中,工人的收益為W-C(,e);雇到該工人的廠商收益為y(,e)-W,未雇到該工人的廠商收益為0;本博弈中工人受教育的程度為市場(chǎng)信號(hào),且為三方博弈;由于未雇到該工人的廠商收益為0,因此兩個(gè)廠商的競(jìng)爭(zhēng)必然使其期望收益趨近于0;由于在市場(chǎng)經(jīng)濟(jì)中,上學(xué)年數(shù)與工資之間存在正相關(guān)關(guān)系,因此通常采用上學(xué)年數(shù)作為e的量值,有時(shí)也采用所修課程數(shù)量和成績(jī)、所讀學(xué)校水平等;即使上學(xué)年數(shù)多少對(duì)生產(chǎn)率毫無(wú)影響,工資也會(huì)隨上學(xué)年數(shù)的增加而增加;如果上學(xué)年數(shù)對(duì)生產(chǎn)率有影響,則工資隨上學(xué)年數(shù)的增加幅度肯定超過(guò)更多年數(shù)教育對(duì)生產(chǎn)率的實(shí)際貢獻(xiàn);建模假設(shè)兩個(gè)廠商同時(shí)作為信號(hào)接收方,并且他們之間的競(jìng)爭(zhēng)會(huì)使其所出工資接近于工人的產(chǎn)值;又設(shè)兩個(gè)廠商在觀察到工人的受教育程度e以后,對(duì)工人的能力有相同的判斷:p(H|e)和p(L|e)=1-p(H|e)。于是,兩個(gè)廠商愿意出的工資率為:當(dāng)不僅工人自己知道其能力,而兩個(gè)廠商也知道時(shí),這是一個(gè)完全信息博弈問題。廠商所支付的工資水平為:W(e)=y(,e)。因此工人選擇受教育的決策應(yīng)滿足Max[y(,e)-C

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論