純策略納什均衡

上傳人：t*** IP屬地：天津上傳時(shí)間：2022-02-14 格式：DOC 頁(yè)數(shù)：9 大?。?1KB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩4頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、純策略納什均衡純策略納什均衡(Pure Strategy Nash Equilibrium )列編輯什么是純策略納什均衡純策略納什均衡是指在一個(gè)純策略組合中，如果給定其他的策略不變，該節(jié)點(diǎn)不會(huì)單方面改變自己的策略，否則不會(huì)使節(jié)點(diǎn)訪問(wèn)代價(jià)變小。編輯存在純策略納什均衡的有限次重復(fù)博弈1如果重復(fù)博弈中有惟一純策略納什均衡，那么我們?cè)趺凑页鏊募儾呗约{什均衡呢？首先看下面囚徒的困境的博弈的例子：-S-5囚徒I iSCl不坦仔囚甚2坦白不坦白園E囚徒的困境的博弈我們現(xiàn)在考慮該博弈重復(fù)兩次的重復(fù)博弈，這可以理解成給囚徒兩次坦白機(jī)會(huì)，最后的得益是兩個(gè)階段博弈中各自得益之和在兩次博弈過(guò)程中，雙方

2、知道第一次博弈的結(jié)果再進(jìn)行二次博弈用逆推歸納法來(lái)分析，先分析第二階段，也就是第二次重復(fù)時(shí)兩博弈方的選擇很明顯，這個(gè)第二階段仍然是兩囚徒之間的一個(gè)囚徒的困境博弈，此時(shí)前一階段的結(jié)果已成為既成事實(shí)，此后又不再有任何的后續(xù)階段，因此實(shí) 現(xiàn)自身當(dāng)前的最大利益是兩博弈方在該階段決策中的惟一原則因此我們不難得出結(jié)論，不管前一次的博弈得到的結(jié)果如何，第二階段的惟一結(jié)果就是原博弈惟一的納什均衡（坦白，坦白），雙方得益（-5 ，-5）現(xiàn)在再回到第一階段，即第一次博弈理性的博弈方在第一階段就對(duì)后一階段的結(jié)局非常清楚，知道第二階段的結(jié)果必然是（坦白，坦白），因此不管第一階段的博弈

3、結(jié)果是什么，雙方在整個(gè)重復(fù)博弈中的最終得益，都將是第一階段的基礎(chǔ)上各加 -5 因此從第一階段的選擇來(lái)看，這個(gè)重復(fù)博弈與圖 l 中得益矩陣表示的一次性博弈實(shí)際上是完全等價(jià)的-10,-10鼻嚴(yán)】3-13-5閃鏈 1不坦Cl閃徒2坦a 不姐口圖2惟-ftses均衡的有限次于是我們可以得出惟一純策略均衡的有限次重復(fù) 博弈的結(jié)果就是重復(fù)原博弈惟一的純策略納什均衡，這就是這種重復(fù)博弈惟一的子博弈完美納什均衡路徑.如果重復(fù)博弈中有多個(gè)純策略納什均衡，設(shè)某一市場(chǎng)有兩個(gè)生產(chǎn)同樣質(zhì)量產(chǎn)品的廠商，他們對(duì)產(chǎn)品的定價(jià)同有高(H)、中(M)、低(L)三種可能設(shè)高價(jià)時(shí)市場(chǎng)總利潤(rùn)為10個(gè)單位，中價(jià)時(shí)市場(chǎng)總利潤(rùn)

4、為6個(gè)單位，低價(jià)時(shí)市場(chǎng)總利潤(rùn)為2個(gè)單位再假設(shè)兩廠商同時(shí)決定價(jià)格，價(jià)格不等時(shí)低價(jià)格者獨(dú)享利潤(rùn)，價(jià)格相等時(shí)雙方平分利潤(rùn)這時(shí)候兩廠商對(duì)價(jià)格的選擇就構(gòu) 成了一個(gè)靜態(tài)博弈問(wèn)題.我們看一個(gè)三價(jià)博弈的重復(fù) 博弈的例子：Hr命M2L廠裔1 H0t60,2 1M 30*2缶02弋h 1S3三價(jià)博弈的置*傅彝顯然，這個(gè)得益矩陣有兩個(gè)純策略納什均衡 (M， M)和(L, L)，我們也可以看出實(shí)際上兩博弈方最大的得益是策略組合(H, H),但是它并不是納什均衡.現(xiàn) 在考慮重復(fù)兩次該博弈，我們采用一種觸發(fā)策略 (Trigger Strategy) ：博弈雙方首先試圖合作，一旦發(fā)覺(jué)對(duì)方不合作也用不合作相報(bào)復(fù)的策

5、略.使得在第一階段采用(H, H)成為子博弈完美納什均衡，其雙方的策略是這樣的：博弈方1:第一次選H如果第一次結(jié)果為(H, H), 則第二次選M,如果第一次結(jié)果為任何其他策略組合，則第二次選擇 L.博弈方 2:同博弈方 1.在上述雙方策略組合下，兩次重復(fù)博弈的路徑一定為第一階段(H, H),第二階段(M, M),這是一個(gè)子博弈完美納什均衡路徑因?yàn)?第二階段是一個(gè)原博弈的納什均衡，因此不可能有哪一方愿意單獨(dú)偏離；其次，第一階段的(H, H)雖然不是原來(lái)的博弈納什均衡，但是如果一方單獨(dú)偏離，采用M能增加1單位得益，這樣的后果卻是第二階段至少要損失 2 單位的得益，因?yàn)殡p方采用的是

6、觸發(fā)策略，即有報(bào)復(fù)機(jī)制的策略，因此合理的選擇是堅(jiān)持 H.這就說(shuō)明了上述策略組合是這個(gè)兩次重復(fù)博弈的子博弈完美納什均衡.從上述的例子我們可以看出，有多個(gè)純策略納什均衡的博弈重復(fù)兩次的子博弈完美納什均衡路徑是，第一階段采用（H, H），第二階段采用原博弈的納什均衡（M, M）.如果這個(gè)重復(fù)博弈重復(fù)三次，或者更多次，結(jié)論也是相似的，仍然用觸發(fā)策略，它的子博弈完美納什均衡路徑為除了最后一次以外，每次都采用（H，H），最后一次采用原博弈的納什均衡（M, M）.編輯存在純策略納什均衡的無(wú)限次重復(fù)博弈1與有限次重復(fù)博弈一樣，無(wú)限次重復(fù)博弈也是基本博弈的簡(jiǎn)單重復(fù)，但是無(wú)限次重復(fù)博弈沒(méi)有最后一

7、次重復(fù)，因此無(wú)限次重復(fù)博弈與有限次有一些不同.任何博弈中博弈方策略選擇的依據(jù)都是得益的大小，這在重復(fù)博弈中仍然是成立的.但是重復(fù)博弈又與一次性博弈有所不同，因?yàn)樵谥貜?fù)博弈中，每一階段都是一個(gè)博弈，并且各博弈方都有得益，因此對(duì)于重復(fù)博弈，我們要計(jì)算的就是博弈結(jié)束時(shí)的一個(gè)總的得益由于前一次博弈和后一次博弈之間會(huì)有損失，因此我們采用一種方法，就是將后一階段的得益折算成當(dāng)前階段得益的（現(xiàn)在值）的貼現(xiàn)系數(shù)a有了貼現(xiàn) 系數(shù)a那么在無(wú)限次重復(fù)博弈中，某博弈方各階段得益為n, n,.,則該博弈方總得益的現(xiàn)在值為：7T = TTj + $72 + 摩碼 + =£護(hù)一1對(duì)于存在惟一純策略

8、納什均衡博弈的無(wú)限次重復(fù) 博弈，我們從下面的例子來(lái)看：博密方2博彈方1 H4,40.5L5t 0h 1存在惟一塊策時(shí)納什均衡博弈的無(wú)限次復(fù)博奔其中博弈方1和博弈方2分別表示兩個(gè)廠商，H 和L分別表示高價(jià)和低價(jià)顯然，該博弈的一次性博弈有惟一的純策略納什均衡（L，L），但是這個(gè)納什均衡并不是最佳策略組合，因?yàn)椴呗越M合（H，H）的得益（4，4）比（1，1）要高的多但是由于（H，H）不是該博弈的納什均衡，所以在一次性博弈中不會(huì)被采用根據(jù)上面的分析，此博弈在有限次重復(fù)博弈并不能實(shí)現(xiàn)潛在的合作利益，兩博弈方在每次重復(fù)中都不會(huì)采用效率較高的（H, H）.為了實(shí)現(xiàn)效率較高的合作利益（H, H）,假

9、設(shè)兩博弈方都采用觸發(fā)策略，也即報(bào)復(fù)性策略：第一階段采用H,在第t階段，如果前t-l階段的結(jié) 果都是（H, H）,則繼續(xù)采用L假設(shè)博弈方1已經(jīng)采用了這種策略，現(xiàn)在我們來(lái)確定博弈方 2在第一階段的最優(yōu)選擇.如果博弈方2采用L,那么在第一階段能得到5,但這樣會(huì)引起博弈方1 一直采用L的報(bào)復(fù)，自己也只能一直米用L,得益將永遠(yuǎn)為1,總得益的現(xiàn) 在值為7T=5+lxtf+lxi +“.=5| 10如果博弈方2采用H則在第一階段他將得4,下一階段又面臨同樣的選擇若記 V為博弈方2在該重復(fù)博弈中每階段都采用最佳選擇的總得益現(xiàn)在值，那么從第二階段開始的無(wú)限次重復(fù)博弈因?yàn)榕c從第一階段開始的只差一階段，因而在無(wú)限次重復(fù)時(shí)可看作相同的，其總得益的現(xiàn)在值折算成第一階段的得益為 dW,因此當(dāng)?shù)谝浑A段的最佳選擇是 H時(shí)，整個(gè)無(wú)限次重復(fù)博弈總得益的現(xiàn)在值為V -歹一貝十?dāng)?卞了或者4 c ,§£ 1因此，當(dāng)7解得'【時(shí)，博弈方2會(huì)采用H策略，否則會(huì)采用L策略也就是說(shuō)當(dāng)1 -4>

人人文庫(kù)> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

純策略納什均衡

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

純策略納什均衡

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔