博弈論與信息經(jīng)濟(jì)學(xué)6-重復(fù)博弈

上傳人：2*** IP屬地：湖北上傳時(shí)間：2023-02-05 格式：PPTX 頁(yè)數(shù)：23 大小：239.23KB 積分：30 舉報(bào) 版權(quán)申訴

博弈論與信息經(jīng)濟(jì)學(xué)6-重復(fù)博弈_第2頁(yè)

博弈論與信息經(jīng)濟(jì)學(xué)6-重復(fù)博弈_第3頁(yè)

博弈論與信息經(jīng)濟(jì)學(xué)6-重復(fù)博弈_第4頁(yè)

博弈論與信息經(jīng)濟(jì)學(xué)6-重復(fù)博弈_第5頁(yè)

已閱讀5頁(yè)，還剩18頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究?！貜?fù)博弈華東理工大學(xué)商學(xué)院E-mail:scqian@QianShichao錢世超不存款存款到期客戶1客戶2（1,1）存款不存款提前不存款客戶1到期提前到期提前客戶2（1,1）（1,1）（1.2,1.2）（0.6,1）（1,0.6）（0.8,0.8）存款GameTheory&InformationEconomics博弈論與信息經(jīng)濟(jì)學(xué)博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。重復(fù)博弈：指同樣結(jié)構(gòu)的博弈重復(fù)多次重復(fù)博弈的特征：前一階段的博弈不改變后一階段的結(jié)構(gòu)；所有參與人都觀測(cè)到博弈過(guò)去的歷史；參與人的總支付是所有階段博弈支付的貼現(xiàn)值之和或加權(quán)平均值。博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。重復(fù)博弈有限次重復(fù)博弈無(wú)限次重復(fù)博弈博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。有限次重復(fù)博弈定義對(duì)給定一個(gè)基本博弈G（靜態(tài)博弈，或動(dòng)態(tài)博弈），重復(fù)進(jìn)行T次G，且每次重復(fù)G之前，各參與人都能觀察到以前參與人的行動(dòng)與博弈結(jié)果，這樣的博弈過(guò)程稱為G的T次重復(fù)博弈，記為G(T)策略：每位參與人在各階段行為選擇形成的鏈策略路徑：各參與人策略交互形成的路徑均衡路徑：雙方策略路徑構(gòu)成均衡子博弈精煉納什均衡形成的路徑是均衡路徑博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。惟一納什均衡博弈的有限次重復(fù)博弈惟一納什均衡博弈純策略均衡博弈混合策略均衡博弈博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。參與人2LM參與人1L1,15,0M0,54,4參與人2LM參與人1L1,15,0M0,54,4參與人2LM參與人1L1,15,0M0,54,4參與人2LR參與人1L1,-1-1,1R-1,11,-1參與人2LR參與人1L1,-1-1,1R-1,11,-1參與人2LR參與人1L1,-1-1,1R-1,11,-1…………逆向遞歸（L,L)（L,L)（L,L)逆向遞歸（0.5,0.5)（0.5,0.5)（0.5,0.5)定理如果基本博弈G有惟一的納什均衡，T為有限，則每一階段各參與人的均衡策略構(gòu)成重復(fù)博弈G(T)的惟一子博弈精煉納什均衡策略。博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。困惑與思考:理論與實(shí)踐直覺(jué)的不一致參與人2LM參與人1L1,15,0M0,54,4參與人2LM參與人1L1,15,0M0,54,4參與人2LM參與人1L1,15,0M0,54,4……是否有合作機(jī)會(huì)？“連鎖店悖論”(Selton,1978)（3,-2）（5,5）不進(jìn)入（10,1）進(jìn)入和平價(jià)格戰(zhàn)企業(yè)B企業(yè)A（3,-2）（5,5）不進(jìn)入（10,1）進(jìn)入和平價(jià)格戰(zhàn)企業(yè)B企業(yè)A（3,-2）（5,5）不進(jìn)入（10,1）進(jìn)入和平價(jià)格戰(zhàn)企業(yè)B企業(yè)A……實(shí)踐中，參與人決策的依據(jù)邏輯是什么？博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。多重納什均衡博弈的有限次重復(fù)博弈LMRL1,15,00,0M0,54,40,0R0,00,03,3LMRL1,15,00,0M0,54,40,0R0,00,03,3LMRL1,15,00,0M0,54,40,0R0,00,03,3……二重純策略納什均衡N次重復(fù)博弈策略：每位參與人有3N個(gè)純策略+混合策略策略路徑：共有3N×3N個(gè)純策略路徑+其它策略路徑定理：雙方的策略路徑使得每一階段的博弈均為納什均衡，該策略路徑必為均衡策略路徑。LMRL1,15,00,0M0,54,40,0R0,00,03,3二重純策略納什均衡2次重復(fù)博弈LMRL4,48,33,3M3,87,73,3R3,33,36,6LMRL2,26,11,1M1,65,51,1R1,11,14,4LMRL1,15,00,0M0,54,40,0R0,00,03,3博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。有限次重復(fù)博弈中的觸發(fā)策略(報(bào)復(fù)機(jī)制)LMRL1,15,00,0M0,54,40,0R0,00,03,3LMRL1,15,00,0M0,54,40,0R0,00,03,3二重純策略納什均衡2次重復(fù)博弈參與人1：第一次選M，如第一次結(jié)果為(M,M)，

則第二次選R；否則第二次選L參與人2：同參與人1考慮雙方策略：LMRL2,26,11,1M1,67,71,1R1,11,14,4其余子博弈精煉均衡：((L,L)，(L,L))((R,R)，(L,L))((M,M)，(R,R))一般結(jié)論：對(duì)于基礎(chǔ)博弈G有多個(gè)納什均衡的G(T),可以存在子博弈精煉解，其中對(duì)每一t<T，t階段的結(jié)果都不是G的納什均衡。博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。廠商市場(chǎng)選擇問(wèn)題：兩次重復(fù)廠商2AB廠商1A3,31,4B4,10,0納什均衡：純策略：(B,A)→(4,1)(A,B)→(1,4)混合策略：(0.5,0.5)→(2,2)兩次重復(fù)：每階段選擇任一納什均衡均可構(gòu)成6種均衡路徑結(jié)果。(4,1)(3,1.5)(2,2)(2.5,2.5)(1.5,3)(1,4)(3,3)階段平均收益廠商1廠商2不可實(shí)現(xiàn)的最佳結(jié)果ABA4,72,8B5,51,4ABA7,45,5B8,24,1ABA5,53,6B6,32,2第二階段:(A,B)第二階段:(B,A)第二階段:(0.5,0.5)第一階段:觸發(fā)策略不可實(shí)現(xiàn)：如果第一階段不是(A,A)，第二階段選B，但(B,B)不是均衡博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。廠商市場(chǎng)選擇問(wèn)題：三次重復(fù)考慮雙方觸發(fā)策略：第一階段選A第二階段如第一階段結(jié)果是(A,A)，選A；如第一階段結(jié)果是(A,B)，選B第三階段選B第一階段選A第二階段選B第三階段如第一階段結(jié)果是(A,A)，選A；如第一階段結(jié)果是(B,A)，選B廠商1廠商2ABA3,31,4B4,10,0ABA3,31,4B4,10,0ABA3,31,4B4,10,0雙方平均收益：廠商1=（3+1+4）/3=8/3；廠商2=8/3如果一方維持策略不變，另一方在不同階段選擇其它行動(dòng)，結(jié)果如何？是否存在其它策略組合，可以獲得帕累托效率？博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。廠商市場(chǎng)選擇問(wèn)題：n+2次重復(fù)考慮雙方觸發(fā)策略：第1階段選A第2~n+1階段如前一階段結(jié)果是(A,A)，選A；如前一階段結(jié)果是(A,B)，選B第n+2階段選B第1階段選A第2~n階段如前一階段結(jié)果是(A,A)，選A；如前一階段結(jié)果是(B,A)，選B第n+1階段選B第n+2階段如n階段結(jié)果是(A,A)，選A；如前一階段結(jié)果是(B,A)，選B廠商1廠商2ABA3,31,4B4,10,0ABA3,31,4B4,10,0ABA3,31,4B4,10,0雙方平均收益=（3n+1+4）/(n+2)=3-1/(n+2)3ABA3,31,4B4,10,0……博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。有限次重復(fù)博弈的無(wú)名氏(民間)定理(4,1)(1,1)(1,4)(3,3)階段平均收益廠商1廠商2不可實(shí)現(xiàn)的最佳結(jié)果(0,0)可實(shí)現(xiàn)收益：所有純策略的凸組合的收益。圖中(0,0)、(1,4)、(3,3)、(4,1)所圍區(qū)域個(gè)體理性收益：博弈方選擇特定策略可獲得的最

低收益之組合w=(w1,w2)=(1,1)定理：若基本博弈有均衡收益組合優(yōu)于w，則所有不小于個(gè)體理性收益的可實(shí)現(xiàn)收益，都可以在重復(fù)博弈中，通過(guò)某個(gè)子博弈精煉納什均衡的極限的平均收益來(lái)實(shí)現(xiàn)或逼近。博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。無(wú)限次重復(fù)博弈定義對(duì)給定一個(gè)基本博弈G，重復(fù)進(jìn)行∞次，參與者以現(xiàn)值為收益(貼現(xiàn)因子均為δ)，且每次重復(fù)G之前，各參與人都能觀察到以前參與人的行動(dòng)與博弈結(jié)果，這樣的博弈過(guò)程稱為G的無(wú)限次重復(fù)博弈，記為G(∞,δ)博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。參與人2LM參與人1L1,15,0M0,54,4參與人2LM參與人1L1,15,0M0,54,4參與人2LM參與人1L1,15,0M0,54,4無(wú)限重復(fù)囚徒困境博弈考慮雙方均采用觸發(fā)策略：第一階段選擇M。如果t階段結(jié)果為(M,M)，

則t+1階段繼續(xù)選擇M，否則永遠(yuǎn)選L(M,M)(M,M)(M,L)或(L,M)(L,L)(L,L)(M,M)…….(M,M)(M,M)…….(M,M)(M,M)…….…….t階段無(wú)限重復(fù)博弈t階段兩種選擇相應(yīng)收益：選擇L:選擇M:保持M策略的條件：即結(jié)論：只要δ足夠大，合作可以成為子博弈精煉納什均衡，實(shí)現(xiàn)帕累托效率博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。無(wú)限次重復(fù)博弈的無(wú)名氏(民間)定理定理：若G是一個(gè)完全相信靜態(tài)博弈，用記G的納什均衡收益，用表示G的任意可實(shí)現(xiàn)收益。如果對(duì)任意博弈方i都成立，而δ足夠接近1，那么無(wú)限次重復(fù)博弈G(∞,δ)中一定存在一個(gè)子博弈精煉納什均衡，各方博弈的平均收益是。(5,0)(1,1)(0,5)(4,4)階段平均收益廠商1廠商2不可實(shí)現(xiàn)的最佳結(jié)果(0,0)博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。兩個(gè)企業(yè)生產(chǎn)同質(zhì)產(chǎn)品，產(chǎn)量分別為q1和q2；市場(chǎng)出清價(jià)格p=8-(q1+q2)；產(chǎn)品邊際成本為2，固定成本為0；兩個(gè)企業(yè)同時(shí)進(jìn)行產(chǎn)量決策，以實(shí)現(xiàn)各自利潤(rùn)最大化。Cournot(1838)模型的無(wú)限次重復(fù)博弈

---維持壟斷產(chǎn)量合作一次性博弈結(jié)果：(2,2)q1q2(0,0)獨(dú)家壟斷結(jié)果：33壟斷價(jià)格線合作t階段兩種選擇相應(yīng)收益：選擇2.25:選擇1.5:保持1.5策略的條件：即考慮雙方均采用觸發(fā)策略：t階段前雙方均選擇。如果t階段結(jié)果為(1.5,1.5)，

則t+1階段繼續(xù)選擇1.5；如果一方偏離1.5而選2.25，則另一

方采取懲罰，永遠(yuǎn)選2。博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。Cournot(1838)模型的無(wú)限次重復(fù)博弈

---一般情況分析(2,2)q1q2(0,0)33壟斷價(jià)格線考慮q1=q2=q狀態(tài)的合作機(jī)會(huì)時(shí)有合作機(jī)會(huì)qπ03211.544.5t階段前雙方均選擇。如果t階段結(jié)果為(q,q)，

則t+1階段繼續(xù)選擇q；如果一方偏離q而選

，則另一方采取懲罰，永遠(yuǎn)選2?？紤]雙方均采用觸發(fā)策略：博弈論與信息經(jīng)濟(jì)學(xué).Copyright?2015ECUST.Allrightsreserved.華東理工大學(xué)版權(quán)所有，翻印必究。t階段兩種選擇相應(yīng)收益：選擇:選擇q:合作條件：qδ03211.50.51結(jié)論：9/17當(dāng)時(shí)，雙方在q=1.5合作并運(yùn)用觸發(fā)策略，可以獲得收益最高的子博弈精煉均衡當(dāng)時(shí)，雙方在

合作并運(yùn)用觸發(fā)策略，可以獲得收益最高的子博弈精煉均衡想想OPEC產(chǎn)量限額問(wèn)題博弈論與信息經(jīng)濟(jì)學(xué).Copyrig

人人文庫(kù)> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論與信息經(jīng)濟(jì)學(xué)6-重復(fù)博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈論與信息經(jīng)濟(jì)學(xué)6-重復(fù)博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔