第2章納什均衡與一致預(yù)期_第1頁(yè)
第2章納什均衡與一致預(yù)期_第2頁(yè)
第2章納什均衡與一致預(yù)期_第3頁(yè)
第2章納什均衡與一致預(yù)期_第4頁(yè)
第2章納什均衡與一致預(yù)期_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、納什均衡與一致預(yù)期張維迎 教授北京大學(xué)光華管理學(xué)院博弈的基本概念(1) 參與人(players):博弈中決策主體的集合:什么人參與博弈?每個(gè)人是什么角色? 行動(dòng)(actions): 每個(gè)人有些什么樣行動(dòng)可以選擇?在什么時(shí)候行動(dòng)? 信息(information):在博弈中的知識(shí);每個(gè)人知道些什么(包括特征、行動(dòng)等)? 戰(zhàn)略(strategies):行動(dòng)計(jì)劃;每個(gè)人有什么戰(zhàn)略可供選擇?戰(zhàn)略的完備性;博弈的基本概念(2) 支付(payoffs):每個(gè)人在不同戰(zhàn)略組合下得到些什么?依賴于所有參與人的選擇; 均衡(equilibrium):所有參與人最優(yōu)戰(zhàn)略的組合; 結(jié)果(outcomes):我們所感興

2、趣的東西。靜態(tài)博弈 最簡(jiǎn)單的博弈:所有參與人同時(shí)選擇行動(dòng),并且只選擇一次; “同時(shí)”是一個(gè)信息概念,而不一定與日歷上的時(shí)間一致;囚徒困境(prisoners dilemma) 囚徒困境坦白不坦白坦白不坦白8,8 0,1010,01,1無(wú)論對(duì)方如何選擇,每個(gè)人的最優(yōu)選擇:坦白。所以,我們可以預(yù)測(cè),結(jié)果將是(坦白,坦白)占優(yōu)均衡(dominant-strategy equilibrium) 一般來(lái)說(shuō),由于每個(gè)參與人的效用依賴于所有人的選擇,因此每個(gè)人的最優(yōu)選擇(戰(zhàn)略)也依賴于所有其他人的選擇(戰(zhàn)略)。但在上述例子中,一個(gè)人的最優(yōu)選擇并不依賴于他人的選擇。這樣的最優(yōu)戰(zhàn)略,被稱為“占優(yōu)戰(zhàn)略”(domi

3、nant strategy)。由所有參與人的占優(yōu)戰(zhàn)略構(gòu)成的戰(zhàn)略組合被稱為“占優(yōu)均衡”。 占優(yōu)戰(zhàn)略均衡的出現(xiàn)只要求所有人都是理性的,但不要求每個(gè)參與人知道其他參與人是否理性。 囚徒困境博弈有占優(yōu)均衡,所以其結(jié)果很容易預(yù)測(cè)。個(gè)人理性與集體理性的沖突 “囚徒困境”表明個(gè)人理性與集體理性的沖突。 這樣的例子很多:寡頭競(jìng)爭(zhēng),軍備競(jìng)賽,團(tuán)隊(duì)生產(chǎn)中的勞動(dòng)供給,公共產(chǎn)品的供給,等等; 許多的制度就是為解決“囚徒困境”而存在的;公共產(chǎn)品(public goods)提供不提供提供不提供4,4-1,55,-10,0無(wú)論對(duì)方如何選擇,每個(gè)人的最優(yōu)選擇:不提供。所以,我們可以預(yù)測(cè),結(jié)果將是(不提供,不提供)公共產(chǎn)品與稅

4、收制度 比較私人產(chǎn)品與公共產(chǎn)品的不同:使用上排他性; 私人產(chǎn)品是志愿購(gòu)買的,但公共產(chǎn)品可能需要強(qiáng)制購(gòu)買; 稅收制度就是保證公共產(chǎn)品的生產(chǎn),解決公共產(chǎn)品生產(chǎn)上的“囚徒困境”“囚徒困境”的一般表示合作不合作合作不合作T,TS,RR,SP,P滿足:RTPS; (S+R)R-T“智豬博弈”(boxed pigs) 有些博弈沒(méi)有占優(yōu)均衡,但通過(guò)剔除“壞”戰(zhàn)略,我們可以預(yù)測(cè)博弈的結(jié)果。如“智豬博弈”按等待按等待3,12,47,10,0這個(gè)博弈中,大豬的最優(yōu)選擇依賴于小豬的選擇,但小豬的最優(yōu)選擇與大豬的選擇無(wú)關(guān)。如果大豬知道小豬的理性的,大豬將選擇“按”。均衡是“大豬按,小豬等待”。“劣”戰(zhàn)略:無(wú)論對(duì)方選擇

5、什么,如果自己選擇A得到的總是收益小于選擇B得到的收益,A就是相對(duì)于B的劣戰(zhàn)略。重復(fù)剔除占優(yōu)均衡 “重復(fù)剔除嚴(yán)格劣戰(zhàn)略”(iterated elimination of strictly dominated strategy)的思路:首先找出博弈參與人的劣戰(zhàn)略(dominated strategy)(假定存在的話),把這個(gè)劣戰(zhàn)略剔除后,剩下的是一個(gè)不包含已剔除劣戰(zhàn)略的新的博弈;然后在剔除這個(gè)新的博弈中的劣戰(zhàn)略;繼續(xù)這個(gè)過(guò)程,直到?jīng)]有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的,這個(gè)唯一的戰(zhàn)略組合就是“重復(fù)剔除占優(yōu)均衡”(iterated dominance equilibrium)。 如果這樣的解存

6、在,我們說(shuō)該博弈是“重復(fù)剔除占優(yōu)可解的”(iterated dominance solvable).理性共識(shí)(common knowledge of rationality) (1)Zero-order CKR: 每個(gè)人都是理性的,但不知道其他人是否是理性的; (2)first-order CKR: 每個(gè)人是理性的,并且知道其他每個(gè)人也都是理性的,但并不知道其他人是否知道自己是理性的; (3)second-order CKR: (1)+(2)+每個(gè)人知道(2) nth-order CKR: R(b)C(b)R(b)C(b)R is rational, 重復(fù)剔除與理性共識(shí) 重復(fù)剔除不僅要求每個(gè)人

7、是理性的,而且要求每個(gè)人知道其他人是理性的,每個(gè)人知道每個(gè)人知道每個(gè)人是理性的,如此等等,即理性是“共同知識(shí)”(共識(shí))C1C2C3R1R2R310,41, 598,4 9, 90, 399,81,980,100100,98這個(gè)博弈只要求一階理性共識(shí)就可以預(yù)測(cè)均衡結(jié)果。如果把(下左)的第一個(gè)數(shù)字改為11呢?最優(yōu)選擇 這個(gè)博弈只要求一階理性共識(shí)就可以預(yù)測(cè)均衡結(jié)果: 如果R相信C是理性的,R就知道C不會(huì)選擇C3,所以R的最優(yōu)選擇是R1; 如果C相信R是理性的,C就知道R不會(huì)選擇R2,所以C的最優(yōu)選擇是C2。 但要C預(yù)期R不會(huì)選擇R3,需要二階理性共識(shí);要R不預(yù)期C會(huì)選擇C1,需要三階理性共識(shí)。R排除

8、C選擇C1R believes C believes R believes C is rational(C1,C2)R1C2好事變壞事? 在單人決策中,個(gè)人給定選擇在所有情況下的收益都增加,一個(gè)人的狀況不會(huì)變得更壞,但博弈中則不同。上下左右上下左右-1, 32, 10, 23, 41, 34, 10, 23, 4選擇越多,對(duì)理性共識(shí)的要求越高R1R2R3R4C1C2C3C45,100,111,2010,104,01,12,020,03,20,44,350,12,930,920,91 100,90(1)Zero-order CKR: C not choose C4 for C is ration

9、al(2)1st-order CKR: R not choose R4 for R (b) C(3)2nd-order CKR: C not choose C1 for C(b)R(b)C(4)3rd-order CKR: R not choose R1 for R(b)C(b)R(b)C(5)4th-order CKR: C not choose C3 for C(b) R(b)C(b)R(b)C(6)5th-order CKR: R not choose R3 for R(b) C(b) R(b)C(b)R(b)Cso, (R2,C2) is an equilibrium不能用重復(fù)剔除解的

10、博弈 許多博弈沒(méi)有占優(yōu)均衡,也沒(méi)有重復(fù)剔除的占優(yōu)均衡??紤]如下博弈:C1C2C3R1R2R30,44,05,34,00,45,33,53,56,6可理性化的選擇 Rationalizable strategy: 不能被重復(fù)剔除的戰(zhàn)略;或者說(shuō),可以被合理的信念(belief)所支持的行為; 例如:R理性化選擇R1: 如果R(b)C 選擇C2, 如果R(b)C(b)R會(huì)選擇R2; 如果R(b)C(b)R(b)C會(huì)選擇C1; 如果R(b)C(b)R(b)C(b)R會(huì)選擇R1Consistently aligned beliefs (CAB) 考慮(R3,C3):對(duì)方不會(huì)犯預(yù)期錯(cuò)誤:R選擇R3,如果他

11、認(rèn)為C會(huì)選擇C3;C會(huì)選擇C3,如果他認(rèn)為R會(huì)選擇R3。 CAB:每個(gè)人對(duì)別人行為的預(yù)期(信念)是正確的; Harsanyi doctrine: 如果兩個(gè)理性的人具有相同的信息,他們一定會(huì)得出相同的推斷和相同的結(jié)論; Robert Aumann: rational agents cannot agree to disagree.納什均衡與一致預(yù)期 納什均衡:所有參與人的最優(yōu)戰(zhàn)略的組合:給定該戰(zhàn)略中別人的選擇,沒(méi)有人有積極性改變自己的選擇。 一致預(yù)期:基于信念的選擇是合理的;支持選擇的信念是正確的; 預(yù)期的自我實(shí)現(xiàn):如何所有人認(rèn)為這個(gè)結(jié)果會(huì)出現(xiàn),這個(gè)結(jié)果就會(huì)出現(xiàn)。預(yù)期是自我實(shí)現(xiàn)的,預(yù)期不會(huì)錯(cuò)誤。

12、如果你認(rèn)為我預(yù)期你將選擇X,你就真的會(huì)選擇X。哲學(xué)思考 如果參與人事前達(dá)成一個(gè)協(xié)議,在不存在外部強(qiáng)制的情況下,每個(gè)人都有積極性遵守這個(gè)協(xié)議,這個(gè)協(xié)議就是納什均衡。尋找納什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,200納什均衡:舉例 廣告博弈 納什均衡:(做廣告,做廣告)戰(zhàn)略做廣告不做廣告做廣告4,415,1不做廣告1,1510,10企業(yè)1企業(yè)2利用納什均衡尋租 考慮股票市場(chǎng)融資的例子:設(shè)想企業(yè)價(jià)值是100,現(xiàn)在發(fā)行的流通股為100股,每股價(jià)值1元?,F(xiàn)在假定經(jīng)理想籌集100元,投資價(jià)值只有50元。有人買新股嗎? 假定每一股配4股,

13、價(jià)格為0.25元。如果股東不接受配股:原來(lái)一股1元的價(jià)值就變成0.3元(=150/500);如果接受配股,他持有的股票的價(jià)值是1.5元;因?yàn)榕涔傻某杀臼?元,所以他的最優(yōu)選擇是接受配股。所有權(quán)配置與等級(jí)結(jié)構(gòu) 考慮團(tuán)隊(duì)生產(chǎn):讓其中的一個(gè)人變成所有者工作偷懶工作偷懶6,62,20,88,0納什均衡與學(xué)習(xí)過(guò)程R2R1NEq1q2雙寡頭競(jìng)爭(zhēng):Cournot博弈 兩個(gè)企業(yè)同時(shí)選擇產(chǎn)量,價(jià)格由市場(chǎng)決定; 假定需求函數(shù)為其中 為企業(yè)1的產(chǎn)量, 為企業(yè)2的產(chǎn)量 假定成本函數(shù)為: 那么,利潤(rùn)函數(shù)為:)()(21qqaQP1q2qiiiqcqC)()()()()(212222211111cqqaqcqQPqcqq

14、aqcqQPq雙寡頭競(jìng)爭(zhēng)(續(xù)) 企業(yè)最大化利潤(rùn)的一階條件為: 納什均衡產(chǎn)量: 納什均衡利潤(rùn)為22)(22)(12222211qcaqRqqcaqRq321caqqNENE9)(221caNENE壟斷產(chǎn)量和壟斷利潤(rùn) 壟斷企業(yè)的目標(biāo)函數(shù): 壟斷產(chǎn)量: 壟斷利潤(rùn):)()(cQaQQcQQPM2caQM4)(2caM劃拳博弈老虎雞蟲(chóng)杠子老虎雞蟲(chóng)杠子0,01,-10,0-1,1-1,10,01,-10,00,0-1,10,01,-11,-10,0-1,10,0混合戰(zhàn)略納什均衡 有些博弈沒(méi)有“純戰(zhàn)略”納什均衡,但有混合戰(zhàn)略納什均衡,如監(jiān)督博弈。監(jiān)督不監(jiān)督偷懶不偷懶1,11,22,32,2給定工人偷懶,老板的最優(yōu)選擇是監(jiān)督;給定老板監(jiān)督,工人的最優(yōu)選擇是不偷懶;給定工人不偷懶,老板的最優(yōu)選擇是不監(jiān)督;給定老板不監(jiān)督,工人的最優(yōu)選擇是偷懶;如此循環(huán)。納什均衡的存在性問(wèn)題 每一個(gè)有限博弈至少存在一個(gè)納什均衡(純戰(zhàn)略或混合戰(zhàn)略); 如果一個(gè)博弈存在兩個(gè)純戰(zhàn)略納什均

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論