

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、純策略納什均衡【精選文檔】純策略納什均衡出自 MBA智庫百科(純策略納什均衡(Pure Strategy Nash Equilibrium) 編輯什么是純策略納什均衡純策略納什均衡是指在一個純策略組合中,如果給定其他的策略不變,該節(jié)點不會單方面改變自己的策略,否則不會使節(jié)點訪問代價變小。 編輯存在純策略納什均衡的有限次重復博弈1如果重復博弈中有惟一純策略納什均衡,那么我們怎么找出它的純策略納什均衡呢?首先看下面囚徒的困境的博弈的例子: 我們現在考慮該博弈重復兩次的重復博弈,這可以理解成給囚徒兩次坦白機會,最后的得益是兩個階段博弈中各自得益之和在兩次博弈過程中,雙方知道第一次博弈的結果再進行二次
2、博弈用逆推歸納法來分析,先分析第二階段,也就是第二次重復時兩博弈方的選擇很明顯,這個第二階段仍然是兩囚徒之間的一個囚徒的困境博弈,此時前一階段的結果已成為既成事實,此后又不再有任何的后續(xù)階段,因此實現自身當前的最大利益是兩博弈方在該階段決策中的惟一原則 因此我們不難得出結論,不管前一次的博弈得到的結果如何,第二階段的惟一結果就是原博弈惟一的納什均衡(坦白,坦白),雙方得益(-5,-5) 現在再回到第一階段,即第一次博弈理性的博弈方在第一階段就對后一階段的結局非常清楚,知道第二階段的結果必然是(坦白,坦白),因此不管第一階段的博弈結果是什么,雙方在整個重復博弈中的最終得益,都將是第一階段的基礎上
3、各加5因此從第一階段的選擇來看,這個重復博弈與圖l中得益矩陣表示的一次性博弈實際上是完全等價的 于是我們可以得出惟一純策略均衡的有限次重復博弈的結果就是重復原博弈惟一的純策略納什均衡,這就是這種重復博弈惟一的子博弈完美納什均衡路徑 如果重復博弈中有多個純策略納什均衡,設某一市場有兩個生產同樣質量產品的廠商,他們對產品的定價同有高(H)、中(M)、低(L)三種可能設高價時市場總利潤為10個單位,中價時市場總利潤為6個單位,低價時市場總利潤為2個單位再假設兩廠商同時決定價格,價格不等時低價格者獨享利潤,價格相等時雙方平分利潤這時候兩廠商對價格的選擇就構成了一個靜態(tài)博弈問題我們看一個三價博弈的重復博
4、弈的例子: 顯然,這個得益矩陣有兩個純策略納什均衡(M,M)和(L,L),我們也可以看出實際上兩博弈方最大的得益是策略組合(H,H),但是它并不是納什均衡現在考慮重復兩次該博弈,我們采用一種觸發(fā)策略(Trigger Strategy):博弈雙方首先試圖合作,一旦發(fā)覺對方不合作也用不合作相報復的策略使得在第一階段采用(H,H)成為子博弈完美納什均衡,其雙方的策略是這樣的: 博弈方1:第一次選H;如果第一次結果為(H,H),則第二次選M,如果第一次結果為任何其他策略組合,則第二次選擇L 博弈方2:同博弈方1在上述雙方策略組合下,兩次重復博弈的路徑一定為第一階段(H,H),第二階段(M,M),這是一
5、個子博弈完美納什均衡路徑因為第二階段是一個原博弈的納什均衡,因此不可能有哪一方愿意單獨偏離;其次,第一階段的(H,H)雖然不是原來的博弈納什均衡,但是如果一方單獨偏離,采用M能增加1單位得益,這樣的后果卻是第二階段至少要損失2單位的得益,因為雙方采用的是觸發(fā)策略,即有報復機制的策略,因此合理的選擇是堅持H這就說明了上述策略組合是這個兩次重復博弈的子博弈完美納什均衡 從上述的例子我們可以看出,有多個純策略納什均衡的博弈重復兩次的子博弈完美納什均衡路徑是,第一階段采用(H,H),第二階段采用原博弈的納什均衡(M,M) 如果這個重復博弈重復三次,或者更多次,結論也是相似的,仍然用觸發(fā)策略,它的子博弈
6、完美納什均衡路徑為除了最后一次以外,每次都采用(H,H),最后一次采用原博弈的納什均衡(M,M) 編輯存在純策略納什均衡的無限次重復博弈1與有限次重復博弈一樣,無限次重復博弈也是基本博弈的簡單重復,但是無限次重復博弈沒有最后一次重復,因此無限次重復博弈與有限次有一些不同 任何博弈中博弈方策略選擇的依據都是得益的大小,這在重復博弈中仍然是成立的但是重復博弈又與一次性博弈有所不同,因為在重復博弈中,每一階段都是一個博弈,并且各博弈方都有得益,因此對于重復博弈,我們要計算的就是博弈結束時的一個總的得益由于前一次博弈和后一次博弈之間會有損失,因此我們采用一種方法,就是將后一階段的得益折算成當前階段得益
7、的(現在值)的貼現系數有了貼現系數,那么在無限次重復博弈中,某博弈方各階段得益為1,2,.。.,則該博弈方總得益的現在值為: 對于存在惟一純策略納什均衡博弈的無限次重復博弈,我們從下面的例子來看: 其中博弈方1和博弈方2分別表示兩個廠商,H和L分別表示高價和低價顯然,該博弈的一次性博弈有惟一的純策略納什均衡(L,L),但是這個納什均衡并不是最佳策略組合,因為策略組合(H,H)的得益(4,4)比(1,1)要高的多但是由于(H,H)不是該博弈的納什均衡,所以在一次性博弈中不會被采用根據上面的分析,此博弈在有限次重復博弈并不能實現潛在的合作利益,兩博弈方在每次重復中都不會采用效率較高的(H,H)為了
8、實現效率較高的合作利益(H,H),假設兩博弈方都采用觸發(fā)策略,也即報復性策略:第一階段采用H,在第t階段,如果前t-l階段的結果都是(H,H),則繼續(xù)采用L假設博弈方1已經采用了這種策略,現在我們來確定博弈方2在第一階段的最優(yōu)選擇如果博弈方2采用L,那么在第一階段能得到5,但這樣會引起博弈方1一直采用L的報復,自己也只能一直采用L,得益將永遠為1,總得益的現在值為 如果博弈方2采用H,則在第一階段他將得4,下一階段又面臨同樣的選擇若記V為博弈方2在該重復博弈中每階段都采用最佳選擇的總得益現在值,那么從第二階段開始的無限次重復博弈因為與從第一階段開始的只差一 階段,因而在無限次重復時可看作相同的,其總得益的現在值折算成第一階段的得益為,因此當第一階段的最佳選擇是H時,整個無限次重復博弈總得益的現在值為 或者 因此,當 解得時,博弈方2會采用H策略,否則會采用L策略也就是說當時,博弈方2對博
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 房地產行業(yè)的投資分析
- 商品房以租代售租賃合同
- 高層建筑施工框架節(jié)點連接規(guī)定
- 數字化營銷策略實施作業(yè)指導書
- 歷史文物鑒定保護知識題庫
- 人力資源公司員工保密協議
- 2025年秦皇島貨運資格證模擬考試新題庫
- 國際貿易與實務操作指南
- 設備采購與使用說明文書示例
- 2025年塔城道路運輸從業(yè)資格證考試題和答案
- 考前沖刺攻略課件
- 2024年中煤電力有限公司所屬企業(yè)招聘29人筆試參考題庫附帶答案詳解
- 2024年12月2025中央統(tǒng)戰(zhàn)部直屬事業(yè)單位應屆高校畢業(yè)生公開招聘21人筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 積極心理學視角下高職院校學生心理健康教育路徑研究
- 2024年湖北省煙草專賣局(公司)招聘筆試真題
- 2025中鐵快運股份限公司招聘全日制普通高校畢業(yè)生35人易考易錯模擬試題(共500題)試卷后附參考答案
- 2025年浙江寧波寧興集團有限公司招聘筆試參考題庫含答案解析
- 計算機網絡試題及答案
- 2025年安徽馬鞍山市兩山綠色生態(tài)環(huán)境建設有限公司招聘筆試參考題庫附帶答案詳解
- 人效管理措施
- 四年級下冊勞動《小小快遞站》課件
評論
0/150
提交評論