第三章完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡(博弈論及信息經(jīng)濟(jì)學(xué)-中科院, 張玲玲)

上傳人：5*** IP屬地：湖北上傳時(shí)間：2022-05-06 格式：PPT 頁(yè)數(shù)：54 大?。?17KB 積分：30 舉報(bào) 版權(quán)申訴

第三章完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡(博弈論及信息經(jīng)濟(jì)學(xué)-中科院, 張玲玲)_第2頁(yè)

第三章完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡(博弈論及信息經(jīng)濟(jì)學(xué)-中科院, 張玲玲)_第3頁(yè)

第三章完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡(博弈論及信息經(jīng)濟(jì)學(xué)-中科院, 張玲玲)_第4頁(yè)

第三章完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡(博弈論及信息經(jīng)濟(jì)學(xué)-中科院, 張玲玲)_第5頁(yè)

已閱讀5頁(yè)，還剩49頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論與信息經(jīng)濟(jì)學(xué)（Game Theory and Information EconomicsGame Theory and Information Economics )張玲玲中國(guó)科學(xué)院研究生院管理學(xué)院主要內(nèi)容簡(jiǎn)介主要內(nèi)容簡(jiǎn)介第一章概述-人生處處皆博弈n第一篇第一篇非合作博弈理論非合作博弈理論第二章完全信息靜態(tài)信息博弈-納什均衡第三章完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡第四章不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章不完全信息動(dòng)態(tài)博弈-精練貝葉斯納什均衡n第二篇第二篇信息經(jīng)濟(jì)學(xué)信息經(jīng)濟(jì)學(xué) 第六章委托-代理理論（I）第七章委托-代理理論（II）第八章逆向選擇與信號(hào)傳遞主

2、要內(nèi)容簡(jiǎn)介主要內(nèi)容簡(jiǎn)介第三章完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡n一博弈擴(kuò)展式表述n二子博弈精練納什均衡n三應(yīng)用舉例博弈的戰(zhàn)略表述案例- 房地產(chǎn)開(kāi)發(fā)項(xiàng)目-假設(shè)有A、B兩家開(kāi)發(fā)商市場(chǎng)需求：可能大，也可能小投入：1億v假定市場(chǎng)上有兩棟樓出售：需求大時(shí)，每棟售價(jià)1.4億，需求小時(shí)，售價(jià)7千萬(wàn)；v如果市場(chǎng)上只有一棟樓需求大時(shí)，可賣(mài)1.8億需求小時(shí)，可賣(mài)1.1億博弈戰(zhàn)略表述40004000，4000400080008000，0 00 0，800080000 0，0 0不開(kāi)發(fā)開(kāi)發(fā)商A開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)-3000-3000，-3000-300010001000，0 00 0，100010000 0，0

3、 0不開(kāi)發(fā)開(kāi)發(fā)商B開(kāi)發(fā)商A開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)開(kāi)發(fā)商B需求小的情況需求小的情況需求大的情況需求大的情況博弈的戰(zhàn)略式表述一博弈擴(kuò)展式表述n博弈的擴(kuò)展式表述包括三個(gè)要素:參與人集合每個(gè)參與人的戰(zhàn)略集合由戰(zhàn)略組合決定的每個(gè)參與人的支付進(jìn)入者進(jìn)入不進(jìn)入（0，300）在位者市場(chǎng)進(jìn)入阻撓博弈樹(shù)不可置信威脅合作（40，50）斗爭(zhēng)（-10，0）A開(kāi)發(fā)不開(kāi)發(fā)NN大小1/21/2大小1/21/2BBBB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動(dòng)順序參與人的行動(dòng)空間參與人的信息集參與人的支付

4、函數(shù)外生事件的概率分布房地產(chǎn)開(kāi)發(fā)博弈結(jié),決策結(jié)結(jié),終點(diǎn)結(jié)枝結(jié),初始結(jié) 信息集一博弈擴(kuò)展式表述博弈的基本構(gòu)造l結(jié): 包括決策結(jié)和終點(diǎn)結(jié)兩類(lèi);決策結(jié)是參與人行動(dòng)的始點(diǎn),終點(diǎn)結(jié)是決策人行動(dòng)的終點(diǎn).結(jié)滿足傳遞性和非對(duì)稱(chēng)性x之前的所有結(jié)的集合，稱(chēng)為x的前列集P（x），x之后的所有結(jié)的集合稱(chēng)為x的后續(xù)集T（x）。l枝: 枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇.l信息集: 每個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié):1 每個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié);2 該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié).A開(kāi)發(fā)不開(kāi)發(fā)N

5、N大小1/21/2大小1/21/2BBBB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在決策時(shí)不確切地知道自然的選擇; B的決策結(jié)由4個(gè)變?yōu)?個(gè)房地產(chǎn)開(kāi)發(fā)博弈A開(kāi)發(fā)不開(kāi)發(fā)NN大小1/21/2大小1/21/2BBBB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策) 房地產(chǎn)開(kāi)發(fā)博弈一博弈擴(kuò)展式表述n只包含一個(gè)決策結(jié)的信息集稱(chēng)為單結(jié)信息集，如果博弈樹(shù)的所有信息都是單結(jié)的，該博弈稱(chēng)為完美

6、信息博弈。n自然總是假定是單結(jié)的，因?yàn)樽匀辉趨⑴c人決策之后行動(dòng)等價(jià)于自然在參與人之前行動(dòng)但參與人不能觀測(cè)到自然的行動(dòng)。n不同的博弈樹(shù)可以代表相同的博弈，但是有一個(gè)基本規(guī)則：一個(gè)參與人在決策之前知道的事情，必須出現(xiàn)在該參與人決策結(jié)之前。AB坦白抵賴(lài)BBAA坦白抵賴(lài)坦白抵賴(lài)(-8,-8)(0，-10)(-10,0) (-1,-1)坦白抵賴(lài)坦白抵賴(lài)坦白抵賴(lài)(-8,-8)(0，-10) (-10,0)(-1,-1)囚徒困境博弈的擴(kuò)展式表述囚徒困境博弈的擴(kuò)展式表述智豬博弈的擴(kuò)展式表述？5，14，49，-10，0等待小豬大豬按等待按案例2-智豬博弈第三章完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡n一博弈擴(kuò)

7、展式表述n二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問(wèn)題n三應(yīng)用舉例博弈的劃分博弈的劃分：n從參與人行動(dòng)的先后順序：靜態(tài)博弈和動(dòng)態(tài)博弈v靜態(tài)博弈：參與人同時(shí)選擇行動(dòng)或非同時(shí)行動(dòng)但后行動(dòng)者并不知道前行動(dòng)者采取了什么具體行動(dòng)；v動(dòng)態(tài)博弈：參與人行動(dòng)有先后順序，且后行動(dòng)者能夠觀察先行動(dòng)者選擇的行動(dòng)。博弈的劃分n參與人對(duì)其他參與人（對(duì)手）的特征、戰(zhàn)略空間及支付函數(shù)的知識(shí)：完全信息博弈和不完全信息博弈。v完全信息：每一個(gè)參與人對(duì)所有其他參與人的（對(duì)手）的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的

8、知識(shí)，否則為不完全信息。n博弈的劃分：行動(dòng)順序信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什（1950，1951）完全信息動(dòng)態(tài)博弈子博弈精練納什均衡澤爾騰（1965）不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼（1967-1968）不完全信息動(dòng)態(tài)博弈精練貝葉斯納什均衡澤爾騰（1965）Kreps 和Wilson(1982)Fudenberg 和Tirole(1991)完全信息靜態(tài)博弈的特點(diǎn)？占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純戰(zhàn)略納什均衡PNE混合戰(zhàn)略納什均衡MNE完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）n考慮下列問(wèn)題：一個(gè)博弈可能有多個(gè)（甚至無(wú)窮多個(gè)）納什均衡，究

9、竟哪個(gè)更合理？納什均衡假定每一個(gè)參與人在選擇自己的最優(yōu)戰(zhàn)略時(shí)假定所有其他參與人的戰(zhàn)略是給定的，但是如果參與人的行動(dòng)有先有后，后行動(dòng)者的選擇空間依賴(lài)于前行動(dòng)者的選擇，前行動(dòng)者在選擇時(shí)不可能不考慮自己的行動(dòng)對(duì)后行動(dòng)者的影響。子博弈精練納什均衡的一個(gè)重要改進(jìn)是將“合理納什均衡”與“不合理納什均衡”分開(kāi)。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡（舉例）澤爾騰（1965）進(jìn)入者進(jìn)入不進(jìn)入（0，300）在位者合作（40，50）斗爭(zhēng)（-10，0）市場(chǎng)進(jìn)入阻撓博弈樹(shù)特點(diǎn)：剔除博弈中包含的不可置信威脅。承諾行動(dòng)-破釜沉舟-背水一戰(zhàn)v給定進(jìn)入者進(jìn)入，剔除（進(jìn)入，斗爭(zhēng)），（進(jìn)入，默許）是唯一的子博弈精練納什均衡-舉例

10、（結(jié)婚-反對(duì)）不可置信威脅支付函數(shù)行動(dòng)二子博弈精練納什均衡n一個(gè)納什均衡稱(chēng)為精練納什均衡，當(dāng)只當(dāng)參與人的戰(zhàn)略在每個(gè)子博弈中都構(gòu)成納什均衡，也就是說(shuō)，組成精練納什均衡的戰(zhàn)略必須在每一個(gè)子博弈中都是最優(yōu)的。n一個(gè)精練納什均衡首先必須是一個(gè)納什均衡，但納什均衡不一定是精練納什均衡。n承諾行動(dòng)-當(dāng)事人使自己的威脅戰(zhàn)略變得可置信的行動(dòng)。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）n澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除，從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果，簡(jiǎn)單說(shuō)，子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。完全信息動(dòng)態(tài)博

11、弈-子博弈精練納什均衡澤爾騰（1965）曹操與袁紹的倉(cāng)亭之戰(zhàn)，曹操召集將領(lǐng)來(lái)獻(xiàn)破袁之策，程昱獻(xiàn)了十面埋伏之計(jì)，他讓曹操退軍河上，誘袁前來(lái)追擊，到那時(shí)“我軍無(wú)退路，必將死戰(zhàn)，可退袁矣”。曹操采納此計(jì)，令許褚誘袁軍軍至河上，曹軍無(wú)退路，操大呼曰：“前無(wú)去路，諸軍何不死戰(zhàn)！”，眾軍奮力回頭反擊，袁軍大敗。第三章完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡n一博弈擴(kuò)展式表述n二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問(wèn)題n三應(yīng)用舉例戰(zhàn)略的表述戰(zhàn)略：參與人在給定信息集的情況下選擇行動(dòng)

12、的規(guī)則，戰(zhàn)略：參與人在給定信息集的情況下選擇行動(dòng)的規(guī)則，它規(guī)定參與人在什么情況下選擇什么行動(dòng)，是參與人它規(guī)定參與人在什么情況下選擇什么行動(dòng)，是參與人的的“相機(jī)行動(dòng)方案相機(jī)行動(dòng)方案”。個(gè)人選擇的戰(zhàn)略表示第）稱(chēng)為一個(gè)戰(zhàn)略組合，（維向量戰(zhàn)略，個(gè)參與人每人選擇一個(gè)如果戰(zhàn)略集合個(gè)參與人所有可選擇的代表第個(gè)參與人的特定戰(zhàn)略表示第issssssnnisSisiniiii21在靜態(tài)博弈中，戰(zhàn)略和行動(dòng)是相同的。作為一種行動(dòng)規(guī)則，戰(zhàn)略必須是完備的。擴(kuò)展式表述博弈的納什均衡足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx男的策略：足球，芭蕾選擇足球；還是選擇芭蕾。女的策略：（足球，芭

13、蕾），（芭蕾，足球）（芭蕾，芭蕾），（足球，足球）1、追隨策略：他選擇什么，我就選擇什么2、對(duì)抗策略：他選擇什么，我就偏不選什么3、芭蕾策略：不管他選什么，我都選芭蕾；4、足球策略：不管他選什么，我都選足球。策略即：如果他選擇什么，我就怎樣行動(dòng)的相機(jī)行動(dòng)方案。在擴(kuò)展式博弈里，參與人是相機(jī)行事，即“等待”博弈到達(dá)一個(gè)自己的信息集（包含一個(gè)或多個(gè)決策結(jié)后，再采取行動(dòng)方案。o什么是動(dòng)態(tài)博弈？擴(kuò)展式表述博弈的納什均衡n若A先行動(dòng)，B在知道A的行動(dòng)后行動(dòng)，則A有一個(gè)信息集，兩個(gè)可選擇的行動(dòng)，戰(zhàn)略空間為:(:(開(kāi)發(fā)，不開(kāi)發(fā)）開(kāi)發(fā)，不開(kāi)發(fā)）；nB有兩個(gè)信息集，四個(gè)可選擇的行動(dòng)，B有四個(gè)純戰(zhàn)略：開(kāi)發(fā)策略：不論

14、開(kāi)發(fā)策略：不論A A開(kāi)發(fā)不開(kāi)發(fā)，我開(kāi)發(fā)；開(kāi)發(fā)不開(kāi)發(fā)，我開(kāi)發(fā)；追隨策略：追隨策略：A A開(kāi)發(fā)我開(kāi)發(fā)，開(kāi)發(fā)我開(kāi)發(fā)，A A不開(kāi)發(fā)我不開(kāi)發(fā)；不開(kāi)發(fā)我不開(kāi)發(fā)；對(duì)抗策略：對(duì)抗策略：A A開(kāi)發(fā)我不開(kāi)發(fā)，開(kāi)發(fā)我不開(kāi)發(fā)，A A不開(kāi)發(fā)我開(kāi)發(fā)；不開(kāi)發(fā)我開(kāi)發(fā)；不開(kāi)發(fā)策略不論不開(kāi)發(fā)策略不論A A開(kāi)發(fā)不開(kāi)發(fā)我不開(kāi)發(fā)，開(kāi)發(fā)不開(kāi)發(fā)我不開(kāi)發(fā)，n簡(jiǎn)寫(xiě)為：簡(jiǎn)寫(xiě)為：n（開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，不開(kāi)發(fā)），（開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，不開(kāi)發(fā)），（不開(kāi)發(fā)，開(kāi)發(fā)），（不開(kāi)發(fā)，不開(kāi)（不開(kāi)發(fā)，開(kāi)發(fā)），（不開(kāi)發(fā)，不開(kāi)發(fā)），發(fā)），括號(hào)內(nèi)的第一個(gè)元素對(duì)應(yīng)A選擇“開(kāi)發(fā)”時(shí)B的選擇，第二個(gè)元素對(duì)應(yīng)A選擇“不開(kāi)發(fā)”時(shí)B的選擇。A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3

15、,-3)(1，0)（0，1)(0,0)不開(kāi)發(fā)xx什么是參與人什么是參與人的戰(zhàn)略？的戰(zhàn)略？擴(kuò)展式擴(kuò)展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開(kāi)發(fā),開(kāi)發(fā)開(kāi)發(fā),不開(kāi)發(fā)不開(kāi)發(fā), 開(kāi)發(fā)不開(kāi)發(fā),不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)商開(kāi)發(fā)商B B開(kāi)發(fā)商開(kāi)發(fā)商A A戰(zhàn)略式戰(zhàn)略式A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1，0)（0，1)(0,0)不開(kāi)發(fā)xx開(kāi)發(fā),(開(kāi)發(fā),不開(kāi)發(fā))納什均衡與均衡結(jié)果：納什均衡與均衡結(jié)果：存在三個(gè)純戰(zhàn)略納什均衡：存在三個(gè)純戰(zhàn)略納什均衡： ( (不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)），不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)（開(kāi)發(fā), ,

16、（不開(kāi)發(fā)，不開(kāi)發(fā)）（不開(kāi)發(fā)，不開(kāi)發(fā)）兩個(gè)均衡結(jié)果：兩個(gè)均衡結(jié)果：（開(kāi)發(fā)，不開(kāi)發(fā)）（開(kāi)發(fā)，不開(kāi)發(fā)）（不開(kāi)發(fā)，開(kāi)發(fā)）（不開(kāi)發(fā)，開(kāi)發(fā)）注意：均衡不同于均衡結(jié)果注意：均衡不同于均衡結(jié)果擴(kuò)展式擴(kuò)展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開(kāi)發(fā),開(kāi)發(fā)開(kāi)發(fā),不開(kāi)發(fā)不開(kāi)發(fā), 開(kāi)發(fā)不開(kāi)發(fā),不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)商開(kāi)發(fā)商B B開(kāi)發(fā)商開(kāi)發(fā)商A A戰(zhàn)略式戰(zhàn)略式A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1，0)（0，1)(0,0)不開(kāi)發(fā)xx開(kāi)發(fā),(開(kāi)發(fā),不開(kāi)發(fā))路徑路徑在擴(kuò)展式博弈中，所有在擴(kuò)展式博弈中，所有n n個(gè)參與人個(gè)參與人的一個(gè)純戰(zhàn)略組合決定了博弈樹(shù)的一個(gè)純戰(zhàn)略組合決定了博

17、弈樹(shù)上的一個(gè)路徑。上的一個(gè)路徑。（開(kāi)發(fā)，（開(kāi)發(fā)，不開(kāi)發(fā)，開(kāi)發(fā)不開(kāi)發(fā)，開(kāi)發(fā) ）決定）決定了博弈的路徑為了博弈的路徑為A A開(kāi)發(fā)開(kāi)發(fā)B B不不開(kāi)發(fā)開(kāi)發(fā)-（1 1，0 0）（不開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)，開(kāi)發(fā)開(kāi)發(fā)，開(kāi)發(fā) ）決定）決定了路徑：？了路徑：？第三章完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡n一博弈擴(kuò)展式表述n二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問(wèn)題n三應(yīng)用舉例子博弈精煉納什均衡n澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除，從

18、而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果，簡(jiǎn)單說(shuō)，子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。子博弈精煉納什均衡-不可置信威脅n美國(guó)普林斯頓大學(xué)古爾教授在1997年的經(jīng)濟(jì)學(xué)透視里發(fā)表文章，提出一個(gè)例子說(shuō)明威脅的可信性問(wèn)題：n兩兄弟老是為玩具吵架，哥哥老是要搶弟弟的玩具，不耐煩的父親宣布政策：好好去玩，不要吵我，不管你們誰(shuí)向我告狀，我都把你們兩個(gè)關(guān)起來(lái)，關(guān)起來(lái)比沒(méi)有玩具更可怕。現(xiàn)在，哥哥又把弟弟的玩具搶去玩了，弟弟沒(méi)有辦法，只好說(shuō)：快把玩具還我，不然我就要去告訴爸爸。各個(gè)想，你真要告訴爸爸，我是要倒霉的，可是你不告狀不過(guò)沒(méi)有玩具玩，而告了狀卻要被關(guān)禁閉，告狀會(huì)使你的境遇變得更壞，

19、所以你不會(huì)告狀，因此哥哥對(duì)弟弟的警告置之不理。n的確，如果弟弟是會(huì)算計(jì)自己利益的理性人，在這樣的環(huán)境下，還是不告狀的好?？梢?jiàn)，弟弟是理性人，他的告狀威脅是不可置信的。子博弈精練納什均衡A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1，0)（0，1)(0,0)不開(kāi)發(fā)( (不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā), ,（不開(kāi)發(fā)，不開(kāi)發(fā)）（不開(kāi)發(fā)，不開(kāi)發(fā)）如果A選擇開(kāi)發(fā)，B的最優(yōu)選擇是不開(kāi)發(fā)，如果A選擇不開(kāi)發(fā)，B的最優(yōu)選擇是開(kāi)發(fā)，A預(yù)測(cè)到自己的選擇對(duì)B的影響，因此開(kāi)發(fā)是A的最優(yōu)選擇。子博弈精練納什均衡結(jié)果是：A選擇開(kāi)發(fā)，B選擇

20、不開(kāi)發(fā)。xx 對(duì)于對(duì)于( (不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)），不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)），這個(gè)組合之所以構(gòu)成納什均衡，是因這個(gè)組合之所以構(gòu)成納什均衡，是因?yàn)闉锽 B威脅不論威脅不論A A開(kāi)發(fā)還是不開(kāi)發(fā)，他都開(kāi)發(fā)還是不開(kāi)發(fā)，他都將選擇開(kāi)發(fā)，將選擇開(kāi)發(fā)，A A相信了相信了B B的威脅，不開(kāi)的威脅，不開(kāi)發(fā)是最優(yōu)選擇，但是發(fā)是最優(yōu)選擇，但是A A為什么要相信為什么要相信B B的威脅呢？的威脅呢？畢竟，如果畢竟，如果A A真開(kāi)發(fā)，真開(kāi)發(fā)，B B選擇開(kāi)發(fā)選擇開(kāi)發(fā)得得-3-3，不開(kāi)發(fā)得，不開(kāi)發(fā)得0 0，所以，所以B B的最優(yōu)選擇的最優(yōu)選擇是不開(kāi)發(fā)。如果是不開(kāi)發(fā)。如果A A知道知道B B是理性的，是理性的，A A將選擇開(kāi)

21、發(fā)，逼迫將選擇開(kāi)發(fā)，逼迫B B選擇不開(kāi)發(fā)。自選擇不開(kāi)發(fā)。自己得己得1 1，B B得得0 0，即納什均衡，即納什均衡( (不開(kāi)發(fā)，不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)）是不可置信的。因（開(kāi)發(fā)，開(kāi)發(fā)）是不可置信的。因?yàn)樗蕾?lài)于為它依賴(lài)于B B的一個(gè)不可置信的威脅。的一個(gè)不可置信的威脅。同樣：同樣：（不開(kāi)發(fā)，不開(kāi)發(fā)）也是一（不開(kāi)發(fā)，不開(kāi)發(fā)）也是一個(gè)不可置信威脅，納什均衡（開(kāi)發(fā)個(gè)不可置信威脅，納什均衡（開(kāi)發(fā), ,（不（不開(kāi)發(fā)，不開(kāi)發(fā)）是不合理的。開(kāi)發(fā)，不開(kāi)發(fā)）是不合理的。子博弈精練納什均衡n澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除，從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果

22、，簡(jiǎn)單說(shuō)，子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。n什么是子博弈，什么是子博弈精練納什均衡？n有沒(méi)有更好的方法找到子博弈精練納什均衡？完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）n子博弈：是原博弈的一部分，它本身也可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析：（1）子博弈必須從一個(gè)單結(jié)信息點(diǎn)開(kāi)始：只有決策者在原博弈中確切地知道博弈進(jìn)入一個(gè)特定的決策結(jié)時(shí)，該決策結(jié)才能作為一個(gè)子博弈的初始結(jié)。如果信息集包含兩個(gè)以上的決策結(jié)，則這兩個(gè)都不可以作為子博弈的初始結(jié)（見(jiàn)下頁(yè)）。（2）子博弈的信息集和支付向量都直接繼承自原博弈，即當(dāng)x和x在原博弈中屬于同一信息集時(shí)，他們?cè)谧硬┺闹胁艑儆?/p>

23、同一信息集。n習(xí)慣上，任何博弈的本身稱(chēng)為自身的一個(gè)子博弈。A開(kāi)發(fā)不開(kāi)發(fā)XX大小1/21/2大小1/21/2BBBB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 參與人X的信息集不能開(kāi)始一個(gè)子博弈，否則的話，參與人B的信息將被切割。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）不開(kāi)發(fā)A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(1，0)（0，1)(0,0)(-3,-3)xx不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)(1，0)(-3,-3)x開(kāi)發(fā)（0，1)(0,0)x子博弈I子博弈II房地產(chǎn)開(kāi)發(fā)博弈A坦白抵賴(lài)BB坦白抵賴(lài)坦白(-8,-8)(0，-10

24、)(-10,0) (-1,-1)找出房地產(chǎn)開(kāi)發(fā)博弈的子博弈找出房地產(chǎn)開(kāi)發(fā)博弈的子博弈( (不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā), ,（不開(kāi)發(fā)，不開(kāi)發(fā)）（不開(kāi)發(fā)，不開(kāi)發(fā)）完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）n子博弈精練納什均衡：擴(kuò)展式博弈的戰(zhàn)略組合是一個(gè)子博弈精練納什均衡，如果:（1）它是原博弈的納什均衡；（2）它在每一個(gè)子博弈上給出納什均衡。A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(1，0)（0，1)(0,0)(-3,-3)xx房地產(chǎn)開(kāi)發(fā)博弈開(kāi)發(fā)不開(kāi)發(fā)(1，0)(-3,-3)x開(kāi)發(fā)（0，1)(0,0)x子博弈

25、I子博弈II(不開(kāi)發(fā)，（開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，（不開(kāi)發(fā)，開(kāi)發(fā)），（開(kāi)發(fā)，（不開(kāi)發(fā)，不開(kāi)發(fā)）在c上構(gòu)成均衡，在b上不構(gòu)成；在b和c上都構(gòu)成在c上構(gòu)成均衡，在b上不構(gòu)成完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）不開(kāi)發(fā) 判斷下列均衡結(jié)果哪個(gè)構(gòu)成子博弈精練納什均衡？不開(kāi)發(fā)bc完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）n如果一個(gè)博弈有幾個(gè)子博弈，一個(gè)特定的納什均衡決定了原博弈樹(shù)上唯一的一條路徑，這條路徑稱(chēng)為“均衡路徑”，博弈樹(shù)上的其他路徑稱(chēng)為“非均衡路徑”。n納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的；n而構(gòu)成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的，而且在

26、非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈精練納什均衡的實(shí)質(zhì)區(qū)別。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）n戰(zhàn)略是參與人行動(dòng)規(guī)則的完備描述，它要告訴參與人在每一種可預(yù)見(jiàn)的情況下（即每一個(gè)決策結(jié)）上選擇什么行動(dòng)，即使這種情況實(shí)際上沒(méi)有發(fā)生（甚至參與人并不預(yù)期它會(huì)發(fā)生）。n因此，只有當(dāng)一個(gè)戰(zhàn)略規(guī)定的行動(dòng)規(guī)則在所有可能的情況下都是最優(yōu)的，它才是一個(gè)合理的可置信的戰(zhàn)略，子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動(dòng)規(guī)則。第三章完全信息動(dòng)態(tài)搏弈 -子博弈精煉納什均衡n一博弈擴(kuò)展式表述n二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練

27、納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問(wèn)題n三應(yīng)用舉例用逆向歸納法求-子博弈精練納什均衡1UDL（3，1)(0,0)22，2R 給定博弈達(dá)到最后一個(gè)決策結(jié)，該決策結(jié)上行動(dòng)的參與人有一個(gè)最優(yōu)選擇，這個(gè)最優(yōu)選擇即該決策結(jié)開(kāi)始的子博弈的納什均衡倒數(shù)第二個(gè)決策結(jié)，找倒數(shù)第二個(gè)的最優(yōu)選擇，這個(gè)最優(yōu)選擇與我們?cè)诘谝徊秸业降淖顑?yōu)選擇構(gòu)成一個(gè)納什均衡。如此重復(fù)直到初始結(jié)。每一步都得到對(duì)應(yīng)于子博弈的一個(gè)納什均衡，并且根據(jù)定義，該納什均衡一定是該子博弈的子博弈的納什均衡，這個(gè)過(guò)程的最后一步得到整個(gè)博弈的納什均衡完全信息動(dòng)態(tài)博弈-子博弈精練納什

28、均衡澤爾騰（1965）n用逆向歸納法求子博弈精練納什均衡對(duì)于有限完美信息博弈，逆向歸納法求解子博弈精練納什均衡是一個(gè)最簡(jiǎn)便的方法。A開(kāi)發(fā)不開(kāi)發(fā)BB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(1，0)（0，1)(0,0)(-3,-3)xx房地產(chǎn)開(kāi)發(fā)博弈完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）1UDL（1，1)22，0RU（3，0)(0,2)2D 子博弈精練納什均衡（U，U），L）. U和L分別是參與人1和參與人2在非均衡路徑上的選擇。逆向歸納法求解子博弈精練納什均衡的過(guò)程，實(shí)質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過(guò)程：從最后一個(gè)決策結(jié)依次剔除每個(gè)子博弈的劣戰(zhàn)略，最后生存下來(lái)的戰(zhàn)略構(gòu)成精練納什均衡。完全信息動(dòng)態(tài)博弈-子博弈

29、精練納什均衡澤爾騰（1965）n用逆向歸納法求解的子博弈精練納什均衡也要求“所有的參與人是理性的”是共同知識(shí)。n如果博弈由多個(gè)階段組成，則從逆向歸納法得到的均衡可能并不非常令人信服。完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）進(jìn)入者進(jìn)入不進(jìn)入（0，300）在位者市場(chǎng)進(jìn)入阻撓博弈樹(shù)不可置信威脅支付函數(shù)行動(dòng)合作（40，50）斗爭(zhēng)（-10，0）完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡澤爾騰（1965）n練習(xí)練習(xí): :n參與人1（丈夫）和參與人2（妻子）必須獨(dú)立決定出門(mén)時(shí)是否帶傘。他們知道下雨和不下雨的可能性軍委50%，支付函數(shù)為：如果只有一人帶傘，下雨時(shí)帶傘者的效用為-2.5，不帶傘者的效用為-3不下雨時(shí)帶傘的效用為-1,不帶的效用為0;如兩人都不帶傘,下雨時(shí)每人的效用為-5,不下雨時(shí)每人的效用為1;給出下列四種情況下的擴(kuò)展式及戰(zhàn)略式表述:(1)兩人出門(mén)前都不知道是否會(huì)下雨;并且兩人同時(shí)決定是否帶傘(即每一方在決策時(shí)都不知道對(duì)方的決策);(2)兩人在出門(mén)前都不知道是否會(huì)下雨,但丈夫先決策，妻子觀察到丈夫是否帶傘后才決定自己是否帶傘;(3)

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第三章完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡(博弈論及信息經(jīng)濟(jì)學(xué)-中科院, 張玲玲)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第三章 完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡(博弈論及信息經(jīng)濟(jì)學(xué)-中科院, 張玲玲)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第三章完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡(博弈論及信息經(jīng)濟(jì)學(xué)-中科院, 張玲玲)