專題一:零和博弈剖析課件_第1頁
專題一:零和博弈剖析課件_第2頁
專題一:零和博弈剖析課件_第3頁
專題一:零和博弈剖析課件_第4頁
專題一:零和博弈剖析課件_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、專題一:零和博弈2022/7/141Zero-Sum Game內(nèi)容提要零和博弈最小最大方法直線交叉法對(duì)抗性排序零和博弈與非零和博弈(zero-sum game and non-zero-sum game)如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和總是保持為零,這個(gè)博弈就叫零和博弈;相反,如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和不總是保持為零,這個(gè)博弈就叫非零和博弈。零和博弈是利益對(duì)抗程度最高的博弈。零和博弈:擲硬幣-1,11,-1反面1,-1-1,1正面反面正面12支付常和博弈與非常和博弈(constant-sum game and variable-sum game)如果一個(gè)博

2、弈在所有各種對(duì)局下全體參與人之得益總和總是保持為一個(gè)常數(shù),這個(gè)博弈就叫常和博弈;相反,如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和不總是保持為一個(gè)常數(shù),這個(gè)博弈就叫非常和博弈。常和博弈也是利益對(duì)抗程度最高的博弈。常和博弈與歸零博弈設(shè)G是一個(gè)n人常和博弈,那么在G的每種戰(zhàn)略組合下博弈的n個(gè)參與人的支付的總和是一個(gè)常數(shù)。常數(shù)的1/n稱為常和博弈支付的偏零因子。對(duì)于每個(gè)n人常和博弈G,可以從每個(gè)參與人的支付中減去博弈的偏零因子,將G轉(zhuǎn)換為零和博弈G/,把G/叫做常和博弈G的歸零博弈。常和博弈:擲硬幣常和為-1:偏零因子-1/2-1.5,0.50.5,-1.5反面0.5,-1.5-1.5,0.5正

3、面反面正面12支付歸零博弈:支付減去-0.5-1,11,-1反面1,-1-1,1正面反面正面12支付非零和博弈:囚犯困境(蘊(yùn)含雙贏或多贏)抵賴坦白抵賴-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A行局中人的支付-11反面1-1正面反面正面12支付內(nèi)容提要零和博弈最小最大方法直線交叉法對(duì)抗性排序最小最大方法由馮諾依曼提出基本思想: 作為局中人,對(duì)手將采取對(duì)他自己最有利的策略;相應(yīng)的,對(duì)手會(huì)選擇使你獲得盡可能差的支付的策略。 由于零和博弈的特點(diǎn)和性質(zhì),以上思想即為:任何使對(duì)手得到最好結(jié)果的策略,都會(huì)使你獲得最差的結(jié)果。 雙方都具有這樣的理性!最小最大方法的應(yīng)用610下4-3上右左甲乙

4、支付max=10 max=6min=-3min=6最小最大方法:132下41上右左12支付最小最大方法:13,-32,-2下4,-41,-1上右左12支付最小最大方法:234下21上右左12支付最小最大方法:23,-34,-4下2,-21,-1上右左12支付最小最大方法:3531621100 參與人2L M R參與人1UDM最小最大方法:35,-53,-31,-16,-62,-21,-11,-10,00,0 參與人2L M R參與人1UDM最小最大方法:4532643160 參與人2L M R參與人1UDM最小最大方法:45,-53,-32,-26,-64,-43,-31,-16,-60,0

5、參與人2L M R參與人1UDM內(nèi)容提要零和博弈最小最大方法直線交叉法對(duì)抗性排序最小最大方法: 適用于零和博弈的純策略納什均衡擴(kuò)展的最小最大方法(直線交叉方法): 適用于零和博弈的混合策略納什均衡在非零和博弈中,可能存在共同利益。 無純策略納什均衡的零和博弈-11反1-1正反正12支付max=1 max=1min=-1min=-11的選擇-11反(1-p)1-1正(p)反正12支付p-混合 -p+(1-p) p-(1-p)min=-1min=-1min=?1的支付1-101/21-111的p混合策略2正2反參與人1的p-混合策略圖解2的選擇-11反1-1正反(1-q)正(q)12支付max=1

6、 max=1q-混合-q+(1-q)q-(1-q)max=?2的支付1-101/21-112的q混合策略1反1正參與人2的q-混合策略圖解內(nèi)容提要零和博弈最小最大方法直線交叉法對(duì)抗性排序?qū)剐耘判?根據(jù)收益的相關(guān)性進(jìn)行“你死我活”的擲硬幣游戲-1,11,-1反面1,-1-1,1正面反面正面12支付出現(xiàn)“雙贏”可能的價(jià)格大戰(zhàn)低價(jià)高價(jià)低價(jià)3,36,1高價(jià)1,65,5支付百事可樂可口可樂個(gè)體利益與集體利益一致的性別戰(zhàn)博弈1,20,0足球0,02,1時(shí)裝足球時(shí)裝妻子支付 丈夫協(xié)調(diào)博弈廣義的協(xié)調(diào)博弈:包括所有能夠協(xié)調(diào)出雙贏對(duì)局的博弈,如囚徒困境;狹義的協(xié)調(diào)博弈:僅指?jìng)€(gè)體利益與集體利益一致的博弈,對(duì)于參與

7、人而言,合作總比不合作要好。協(xié)調(diào)博弈舉例:胖子進(jìn)門-1,-11,2后走2,1-1,-1先走后走先走張三支付 李四協(xié)調(diào)博弈舉例:交通規(guī)則博弈1,1-1,-1靠左-1,-11,1靠右靠左靠右張三支付 李四對(duì)稱博弈對(duì)稱博弈是指在無角色區(qū)分的參與者之間進(jìn)行的協(xié)調(diào)博弈,它表現(xiàn)在支付函數(shù)的對(duì)稱上,二者的策略集是一樣的。 抑或:通俗說就是代表參與者身份的下標(biāo),在分析中可以省略掉而沒有關(guān)系。對(duì)稱博弈分成三類: 支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)不一致; 支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)一致; 無占優(yōu)性可比的協(xié)調(diào)博弈。 支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)不一致3,32,0獵兔0,24,4獵鹿獵兔獵鹿甲支付 乙 純策略獵鹿是支付占優(yōu)納什均衡、純策略獵兔是風(fēng)險(xiǎn)占優(yōu)納什均衡。 獵兔策略是一個(gè)保險(xiǎn)策略,而獵鹿則是一個(gè)帕累托效率策略但由于策略的不確定性而使它具有較大的風(fēng)險(xiǎn)。 因此,均衡選擇取決于參與人對(duì)風(fēng)險(xiǎn)的態(tài)度。 支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)一致1,10,0右行0,01,1左行右行左行甲支付 乙這種情況博弈雙方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論