博弈論與信息經(jīng)濟(jì)學(xué)講義6_第1頁
博弈論與信息經(jīng)濟(jì)學(xué)講義6_第2頁
博弈論與信息經(jīng)濟(jì)學(xué)講義6_第3頁
博弈論與信息經(jīng)濟(jì)學(xué)講義6_第4頁
博弈論與信息經(jīng)濟(jì)學(xué)講義6_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 擴(kuò)展式表述博弈的納什均衡三 子博弈精練納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題多個(gè)參與人的情況蜈蚣博弈四 重復(fù)博弈和無名氏定理五 應(yīng)用舉例逆向歸納法與子搏弈精練納什均衡的存在問題1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向歸納法要求“所有參與人是理性的”是所有參與人的共同知識。因此,在有多個(gè)參與人或每個(gè)參與人有多次行動(dòng)機(jī)會的情況下,逆向歸納法的結(jié)果可能并非如此。多個(gè)參與人的情況(2,2)如果n

2、很小,逆向歸納法的結(jié)果逆向歸納法與子搏弈精練納什均衡的存在問題如果n很大,結(jié)果又如何呢?1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多個(gè)參與人的情況(2,2)如果n很大 對于參與人1,獲得2單位支付前提是所有n-1個(gè)參與人都選A,否則就要考慮是否應(yīng)該選擇D以保證1的支付。如果給定一個(gè)參與人選擇A的概率是p=1/2,則無限次重復(fù)博弈的納什均衡為: 廠商從生產(chǎn)高質(zhì)量的產(chǎn)品開始,繼續(xù)生產(chǎn)高質(zhì)量的產(chǎn)品,除非曾經(jīng)生產(chǎn)過低質(zhì)量產(chǎn)品,如果上一次生產(chǎn)了低質(zhì)量的產(chǎn)品,之后永遠(yuǎn)生產(chǎn)低質(zhì)量的產(chǎn)品。 第一個(gè)消費(fèi)者選擇購買,只要廠商不曾生產(chǎn)過低質(zhì)量的產(chǎn)品,隨后消費(fèi)者繼續(xù)購買,

3、如果廠商曾件生產(chǎn)過低質(zhì)量的產(chǎn)品,之后消費(fèi)者不再購買。重復(fù)博弈的均衡結(jié)果貼現(xiàn)因子:下一期的一單位支付在這一期的價(jià)值。重復(fù)博弈和無名氏定理參與人不固定時(shí)的重復(fù)博弈1,1-1,20,00,0廠商消費(fèi)者購買不購買高質(zhì)量低質(zhì)量質(zhì)量博弈 廠商:如果生產(chǎn)低質(zhì)量的產(chǎn)品,得到的短期利潤是2,但之后每階段利潤為0,如果總是生產(chǎn)高質(zhì)量的產(chǎn)品,每階段得到1單位利潤,貼現(xiàn)值為1/(1- ) =2,廠商將不會生產(chǎn)低質(zhì)量產(chǎn)品。害怕失掉消費(fèi)者。 消費(fèi)者: =1/2,其只關(guān)心1階段的支付,只有當(dāng)預(yù)期高質(zhì)量時(shí),才會購買。消費(fèi)者預(yù)期不曾生產(chǎn)過低質(zhì)量產(chǎn)品的廠商將繼續(xù)生產(chǎn)高質(zhì)量產(chǎn)品,故選擇購買,反之亦然廠商生產(chǎn)過高質(zhì)量的產(chǎn)品.重復(fù)博弈

4、的均衡結(jié)果 克萊因等認(rèn)為這個(gè)例子可以解釋為什么消費(fèi)者偏好去大商店購買東西而不信賴走街串巷的小商販。 西蒙等用類似博弈解釋雇傭關(guān)系,認(rèn)為,企業(yè)存在的原因之一正式創(chuàng)造一個(gè)“長期的參與人”,這樣一個(gè)參與人由于對未來利益的考慮而更講信用。第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 擴(kuò)展式表述博弈的納什均衡三 子博弈精練納什均衡四 重復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價(jià)的討價(jià)還價(jià)模型囚徒的救贖旅行者困境斯坦克爾伯的寡頭競爭模型企業(yè)1企業(yè)2參與人:企業(yè)1、企業(yè)2;行動(dòng)順序:企業(yè)1先選擇產(chǎn)量q1,企業(yè)2觀測到q1,然后選 擇自己的產(chǎn)量q2。支付: 利潤,利潤是兩個(gè)企業(yè)產(chǎn)

5、量的函數(shù)斯坦克爾伯的寡頭競爭模型qi :第i個(gè)企業(yè)的產(chǎn)量C:代表單位不變成本假定逆需求函數(shù)為:第i個(gè)企業(yè)的利潤函數(shù)為:企業(yè)1企業(yè)2斯坦克爾伯的寡頭競爭模型用你向歸納法求解,首先考慮給定q1的情況下,企業(yè)2的最優(yōu)選擇。企業(yè)2的問題是:最優(yōu)化一階條件意味著:因?yàn)槠髽I(yè)1預(yù)測到企業(yè)2將根據(jù)S2(q1)來選擇q2,企業(yè)1在第1階段的問題是:均衡結(jié)果比較壟斷情況下庫諾特寡頭競爭模型斯坦克爾伯寡頭競爭模型產(chǎn)量A:A:B:B:總產(chǎn)量利潤A:A:B:B:總利潤斯坦克爾伯的寡頭競爭模型從上述計(jì)算可以看出:斯坦克爾伯的均衡總產(chǎn)量大于庫諾特均衡總產(chǎn)量,企業(yè)1的斯坦克爾伯的均衡產(chǎn)量大于庫諾特均衡產(chǎn)量,企業(yè)2的斯坦克爾伯

6、的均衡產(chǎn)量小于庫諾特均衡產(chǎn)量。同樣,企業(yè)1在斯坦克爾伯博弈中的利潤大于在庫諾特博弈中的利潤,企業(yè)2的利潤卻有所下降,這就是所謂的“先動(dòng)優(yōu)勢”。 擁有信息優(yōu)勢可能使參與人處于劣勢。企業(yè)1先行動(dòng)的承諾價(jià)值 :企業(yè)1之所以獲得斯坦克爾伯利潤而不是庫諾特利潤,是因?yàn)樗漠a(chǎn)品一旦生產(chǎn)出來就變成了一種積淀成本,無法改變,從而使企業(yè)2不得不承認(rèn)它的威脅是可置信的。而假如企業(yè)1只是宣布了它將生產(chǎn) ,企業(yè)2是不會相信她的威脅的。第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 擴(kuò)展式表述博弈的納什均衡三 子博弈精練納什均衡四 重復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價(jià)的討價(jià)還價(jià)模型囚

7、徒的救贖旅行者困境輪流出價(jià)的討價(jià)還價(jià)模型分蛋糕的動(dòng)態(tài)博弈游戲規(guī)則:第一輪由第一個(gè)參與人(小鵑)提出條件,第二個(gè)參與人小明可以接受,從而游戲結(jié)束,也可以不接受,則游戲進(jìn)入第二輪;小明提出條件,小鵑可以接受,從而結(jié)束游戲,也可以不接受,從而進(jìn)入第三輪;蛋糕融化呈線性,游戲結(jié)束,蛋糕融化第一種情況:假設(shè)博弈只有一步,小鵑提出分配方案,如果小明同意,兩個(gè)人按照約定分蛋糕,如果小明不同意,兩人什么也得不到。結(jié)果會怎樣?輪流出價(jià)的討價(jià)還價(jià)模型第二種情況:桌上放了一個(gè)冰淇淋蛋糕,但兩輪談判過后,蛋糕將完全融化。博弈結(jié)果如何?第三種情況:桌上的冰淇淋蛋糕在三輪談判后將完全融化,結(jié)果又如何?第四種情況:桌上的冰

8、淇淋蛋糕在四輪談判后將完全融化,或者在五輪談判、六輪,100輪談判后將完全融化,結(jié)果又如何? 博弈的結(jié)果是:假如“輪數(shù)”是偶數(shù),雙方各得一半,假若輪數(shù)是奇數(shù),則小鵑得到(n+1)/2n;小明得到(n-1)/(2n)第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 擴(kuò)展式表述博弈的納什均衡三 子博弈精練納什均衡四 重復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價(jià)的討價(jià)還價(jià)模型囚徒的救贖旅行者困境囚徒的救贖好萊圬大片肖申克的救贖是一部很好看的電影,主要內(nèi)容是一個(gè)被冤屈的囚犯如何憑著堅(jiān)定的信念和聰明才智逃出牢房。我們的“囚犯”也可以通過好的策略合作,擺脫“困境”的詛咒。囚徒的救

9、贖-一報(bào)還一報(bào)一報(bào)還一報(bào)能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。如果重復(fù)博弈多次,就有報(bào)復(fù)的機(jī)會,這種懲罰的規(guī)則是:人家對你怎么做,你就對他怎么做,如果他上次背叛了你,你這次背叛他,如果上次他與你合作,你這次就選擇與他合作。艾克謝羅德認(rèn)為,一報(bào)還一報(bào)體現(xiàn)了這個(gè)策略符合四個(gè)優(yōu)點(diǎn):清晰、善意、報(bào)復(fù)性和寬恕性。這一法則不會引發(fā)作弊,所以是善意的;它不會讓作弊者逍遙法外,所以是報(bào)復(fù)的;它不會長時(shí)間懷恨在心,只要作弊者改正,就愿意恢復(fù)合作,所以是寬恕的。一報(bào)還一報(bào)從自己的不可欺負(fù)性得到好處,還放棄了占他人便宜的可能性囚徒的救贖重復(fù)囚徒困境的幾個(gè)建議:1、不要嫉妒2、不要首先背叛

10、3、對合作和背叛都要給予回報(bào)4、不要耍小聰明第三章 完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡一 博弈擴(kuò)展式表述二 擴(kuò)展式表述博弈的納什均衡三 子博弈精練納什均衡四 重復(fù)博弈五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價(jià)的討價(jià)還價(jià)模型囚徒的救贖旅行者困境旅行者困境-做人不要太精明哈佛大學(xué)巴羅教授:兩個(gè)旅行者從一個(gè)以生產(chǎn)細(xì)瓷花瓶聞名的地方旅行回來,在提取行李的時(shí)候,發(fā)現(xiàn)花瓶被摔壞了,就向航空公司索賠。航空公司知道花瓶的價(jià)格大概雜八、九十元,但不知道他們購買的確切價(jià)格。因此航空公司請兩位旅客在100元以內(nèi)寫出花瓶的價(jià)格,如果兩個(gè)人寫得一樣,就按照寫的數(shù)額賠償,如果不一樣,原則上按照低的價(jià)格賠償,并認(rèn)為該

11、旅客講了真話,獎(jiǎng)勵(lì)2元,而講假話的罰款2元。這個(gè)博弈的最終結(jié)果將是什么?旅行者困境一位富翁的狗在散步時(shí)跑丟了,于是他急匆匆到電視臺發(fā)了一則啟示:有狗丟失,歸還者得酬金1萬元,并附有狗的彩照。一個(gè)乞丐看到廣告后,第二天一大早就報(bào)著狗準(zhǔn)備去領(lǐng)酬金,當(dāng)他經(jīng)過一家大商店的墻體屏幕時(shí),發(fā)現(xiàn)酬金漲到了3萬元,乞丐又折回住處,把狗重新栓在那里,在接下來的幾天里,乞丐從來沒有離開過這只大屏幕,當(dāng)酬金漲到使全市居民感到驚訝時(shí),乞丐返回他的住處,可是那只狗已經(jīng)死了-在這個(gè)世界上,金錢一旦被作為籌碼,就不會再買到任何東西。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)練習(xí):參與人1(丈夫)和參與人2(妻子)

12、必須獨(dú)立決定出門時(shí)是否帶傘。他們知道下雨和不下雨的可能性均為50%,支付函數(shù)為:如果只有一人帶傘,下雨時(shí)帶傘者的效用為-2.5,不帶傘者的效用為-3不下雨時(shí)帶傘的效用為-1,不帶的效用為0;如兩人都不帶傘,下雨時(shí)每人的效用為-5,不下雨時(shí)每人的效用為1;給出下列四種情況下的擴(kuò)展式及戰(zhàn)略式表述:(1)兩人出門前都不知道是否會下雨;并且兩人同時(shí)決定是否帶傘(即每一方在決策時(shí)都不知道對方的決策);(2)兩人在出門前都不知道是否會下雨,但丈夫先決策,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘;(3)丈夫出門前知道是否會下雨,但妻子不知道,但丈夫先決策,妻子后決策;(4),同(3),但妻子先決策,丈夫后決策.作業(yè)強(qiáng)盜分贓(向前展望,倒后推理)有5個(gè)強(qiáng)盜搶得10枚硬幣,在如何分贓上爭論不休,于是他們決定:(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論