版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、3 混合策略納什均衡一、案例分析:門衛(wèi)與小偷二、混合策略納什均衡三、多重納什均衡博弈四、多重納什均衡博弈的分析主要內(nèi)容1門衛(wèi)與小偷:有一家公司為了防止盜竊聘請了一名門衛(wèi),但是長期以來卻發(fā)現(xiàn)仍有盜竊案件發(fā)生,公司討論了兩種方案,一是只要有失竊案件,則加重懲罰門衛(wèi),另一方案是,只要抓住小偷,則聯(lián)合公安機關(guān)加重對小偷的懲罰。請分析哪種方法對降低盜竊率有長效作用?V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷一、案例分析2猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方蓋硬幣方正 面反 面(1)不存在前面定義的納什均衡策略組合(2)關(guān)鍵是不能讓對方猜到自己策略二、混合策略納什均
2、衡這類博弈很多,還有哪些例子呢?3行參與人列參與人 混合策略:在博弈 中,博弈方 的策略空間為 ,則博弈方 以概率分布 隨機在其 個可選策略中選擇的“策略”,稱為一個“混合策略”,其中 對 都成立,且4混合策略擴展博弈:博弈方在混合策略的策略空間(概率分布空間)的選擇看作一個博弈,就是原博弈的“混合策略擴展博弈。設(shè)行參與人的策略選擇概率為 ,列參與人的策略選擇概率為則參與人1的期望支付為則參與人2的期望支付為5混合策略納什均衡設(shè) 是 人戰(zhàn)略式博弈 的一個混合策略組合,如果對于所有的 , 對于每一個 都成立,則稱混合策略組合 是這個博弈的一個納什均衡。注意:在納什均衡下,沒有參與人有積極性單獨偏
3、離或改變該策略或策略組合。6例1流浪漢找工作 游蕩0 , 0-1 , 1-1 , 33 , 2政府救濟不救濟假設(shè)政府救濟的概率為 ;流浪漢找工作的概率為 ;則7博弈方1的混合策略博弈方2的混合策略2, 35, 23, 11, 5CDAB博弈方2博弈方1 策略 得益博弈方1 (0.8,0.2) 2.6博弈方2 (0.8,0.2) 2.6例28例3 撲克牌對色游戲B紅 黑-1 , 11 , -11 , -1-1 , 1A紅黑假設(shè)A出紅牌的概率為 ;B出紅牌的概率為 ;則因此A的最佳反應(yīng)函數(shù)為9因此A的最佳反應(yīng)函數(shù)為同理納什均衡是:A和B出紅牌還是出黑牌的概率都是1/2.反應(yīng)函數(shù)法10練習(xí)1:利用反
4、應(yīng)函數(shù)法找出政府與流浪漢博弈的納什均衡流浪漢找工作 游蕩0 , 0-1 , 1-1 , 33 , 2政府救濟不救濟假設(shè)政府救濟的概率為 ;流浪漢找工作的概率為 ;則11納什均衡是:政府以1/2的概率選擇救助,流浪漢以1/5的概率選擇找工作。練習(xí)2:利用反應(yīng)函數(shù)法找出情侶博弈的所有納什均衡麗娟足球 芭蕾1 , 20 , 00 , 02 , 1大海足球芭蕾12例4 (激勵的悖論)有一家公司為了防止盜竊聘請了一名門衛(wèi),但是長期以來卻發(fā)現(xiàn)仍有盜竊案件發(fā)生,公司討論了兩種方案,一是只要有失竊案件,則加重懲罰門衛(wèi),另一方案是,只要抓住小偷,則聯(lián)合公安機關(guān)加重對小偷的懲罰。請分析哪種方法對降低盜竊率有長效作
5、用?V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷假設(shè)小偷選擇偷的概率為 ;守衛(wèi)選擇睡覺的概率為 ;則13V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對守衛(wèi)的處罰:短期中的效果是使守衛(wèi)盡職在長期中并不能使守衛(wèi)更盡職,但會降低盜竊發(fā)生的概率分析得到納什均衡0- D- D守衛(wèi)得益(睡)S小偷偷的概率114V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率,但會使得守衛(wèi)更多的偷懶睡覺0- P- P小偷得益(偷)V守衛(wèi)睡的概率115監(jiān)督博弈的納稅檢查A 為應(yīng)納稅款,C為檢查成本, F是偷稅罰款。假定 C甲離B損失乙離B損失=16對
6、于第一個博弈,甲離A損失乙離A損失4 甲離B損失乙離B損失=9對于第二個博弈,233)聚點均衡利用博弈設(shè)定以外的信息和依據(jù)進行選擇的均衡文化、習(xí)慣或者其他各種特征都可能是聚點均衡的依據(jù)城市博弈(城市分組相同)、時間博弈(報出相同的時間)是聚點均衡的典型例子244)相關(guān)均衡5, 14, 40, 01, 5LR博弈方2UD博弈方1相關(guān)均衡例子三個納什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)結(jié)果都不理想,不如(D,L)??衫镁埸c均衡(天氣,拋硬幣),但仍不理想。相關(guān)裝置:1、各1/3概率A、B、C2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1見A采用
7、U,否則D;博弈方2見C采用R,否則L。相關(guān)均衡要點:1、構(gòu)成納什均衡2、有人忽略不造成問題255)防聯(lián)盟均衡博弈中若有三個及三個以上的局中人,就有可能部分人結(jié)成“聯(lián)盟”,在極大化聯(lián)盟成員利益的同時損害了其他局中人的利益。(U,L,A)、(D,R,B)純策略納什均衡(U,L,A) Pareto優(yōu)于(D,R,B)丙L RU 0,0,10 -5,-5,0D -5,-5,0 1,1,-5乙甲L RU -2,-2,0 -5,-5,0D -5,-5,0 -1,-1,5乙甲AB26L RU 0,0 -5,-5D -5,-5 1,1乙甲(U,L)、(D,R)納什均衡(D,R) Pareto 最優(yōu)均衡(D,R,B)有效地防止了甲乙二人可能的聯(lián)盟,避免了丙的損失。在防聯(lián)盟均衡這一層意義上,(D,R,B)優(yōu)于(U,L,A)。甲與乙組成一個聯(lián)盟與丙博弈,聯(lián)盟的一方互相協(xié)調(diào),盡可能地極大化聯(lián)盟各個成員的贏利。這時甲乙兩人條件博弈的最優(yōu)均衡仍是(D,R)設(shè)(U,L,A)是博弈的預(yù)測解,讓丙固定于A,則甲、乙兩人之間的條件贏得矩陣為27A BL 0,10 -2,0R -5,0 -5,0丙乙從甲 的角度看,不管乙與丙是否結(jié)盟,條件博弈的均衡仍為(L,A),不違背原博弈的均衡(U,L,A)。對博弈的預(yù)測需要從整體出發(fā),防聯(lián)盟均衡應(yīng)全面考慮。 固定任何一個局中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度裝飾裝修工程安裝合同
- 2024年工程材料供應(yīng)與驗收合同
- 公司員工檢討書
- 2024年度新能源發(fā)電設(shè)備采購與銷售合同
- 2024年度W公司環(huán)保服務(wù)合同協(xié)議書
- 2024年建筑公司員工聘用合同
- 2024年度網(wǎng)絡(luò)通訊工程安全文明施工管理協(xié)議
- 2024年大型油田勘探開發(fā)合作合同(海外)
- 2024年度某航空公司飛機采購合同
- 2024年度區(qū)塊鏈應(yīng)用合作協(xié)議
- 暖通工程師面試試題(含答案)
- 行政服務(wù)中心窗口工作人員手冊
- 最新患者用藥情況監(jiān)測
- 試樁施工方案 (完整版)
- ESTIC-AU40使用說明書(中文100版)(共138頁)
- 河北省2012土建定額說明及計算規(guī)則(含定額總說明)解讀
- 中工商計算公式匯總.doc
- 深圳市建筑裝飾工程消耗量標(biāo)準(zhǔn)(第三版)2003
- 《初中英語課堂教學(xué)學(xué)困生轉(zhuǎn)化個案研究》開題報告
- 恒溫箱PLC控制系統(tǒng)畢業(yè)設(shè)計
- 176033山西《裝飾工程預(yù)算定額》定額說明及計算規(guī)則
評論
0/150
提交評論