專題一：零和博弈剖析課件

上傳人：g*** IP屬地：貴州上傳時(shí)間：2022-07-15 格式：PPT 頁數(shù)：40 大小：2.70MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩35頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、專題一：零和博弈2022/7/141Zero-Sum Game內(nèi)容提要零和博弈最小最大方法直線交叉法對(duì)抗性排序零和博弈與非零和博弈(zero-sum game and non-zero-sum game)如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和總是保持為零，這個(gè)博弈就叫零和博弈；相反，如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和不總是保持為零，這個(gè)博弈就叫非零和博弈。零和博弈是利益對(duì)抗程度最高的博弈。零和博弈：擲硬幣-1，11，-1反面1，-1-1，1正面反面正面12支付常和博弈與非常和博弈(constant-sum game and variable-sum game)如果一個(gè)博

2、弈在所有各種對(duì)局下全體參與人之得益總和總是保持為一個(gè)常數(shù)，這個(gè)博弈就叫常和博弈；相反，如果一個(gè)博弈在所有各種對(duì)局下全體參與人之得益總和不總是保持為一個(gè)常數(shù)，這個(gè)博弈就叫非常和博弈。常和博弈也是利益對(duì)抗程度最高的博弈。常和博弈與歸零博弈設(shè)G是一個(gè)n人常和博弈，那么在G的每種戰(zhàn)略組合下博弈的n個(gè)參與人的支付的總和是一個(gè)常數(shù)。常數(shù)的1/n稱為常和博弈支付的偏零因子。對(duì)于每個(gè)n人常和博弈G，可以從每個(gè)參與人的支付中減去博弈的偏零因子，將G轉(zhuǎn)換為零和博弈G/，把G/叫做常和博弈G的歸零博弈。常和博弈：擲硬幣常和為-1：偏零因子-1/2-1.5，0.50.5，-1.5反面0.5，-1.5-1.5，0.5正

3、面反面正面12支付歸零博弈：支付減去-0.5-1，11，-1反面1，-1-1，1正面反面正面12支付非零和博弈：囚犯困境(蘊(yùn)含雙贏或多贏)抵賴坦白抵賴-1，-1-9，0坦白0，-9-6，-6支付嫌疑人B嫌疑人A行局中人的支付-11反面1-1正面反面正面12支付內(nèi)容提要零和博弈最小最大方法直線交叉法對(duì)抗性排序最小最大方法由馮諾依曼提出基本思想：作為局中人，對(duì)手將采取對(duì)他自己最有利的策略；相應(yīng)的，對(duì)手會(huì)選擇使你獲得盡可能差的支付的策略。由于零和博弈的特點(diǎn)和性質(zhì)，以上思想即為：任何使對(duì)手得到最好結(jié)果的策略，都會(huì)使你獲得最差的結(jié)果。雙方都具有這樣的理性！最小最大方法的應(yīng)用610下4-3上右左甲乙

4、支付max=10 max=6min=-3min=6最小最大方法：132下41上右左12支付最小最大方法：13，-32，-2下4，-41，-1上右左12支付最小最大方法：234下21上右左12支付最小最大方法：23，-34，-4下2，-21，-1上右左12支付最小最大方法：3531621100 參與人2L M R參與人1UDM最小最大方法：35，-53，-31，-16，-62，-21，-11，-10，00，0 參與人2L M R參與人1UDM最小最大方法：4532643160 參與人2L M R參與人1UDM最小最大方法：45，-53，-32，-26，-64，-43，-31，-16，-60，0

5、參與人2L M R參與人1UDM內(nèi)容提要零和博弈最小最大方法直線交叉法對(duì)抗性排序最小最大方法：適用于零和博弈的純策略納什均衡擴(kuò)展的最小最大方法（直線交叉方法）：適用于零和博弈的混合策略納什均衡在非零和博弈中，可能存在共同利益。無純策略納什均衡的零和博弈-11反1-1正反正12支付max=1 max=1min=-1min=-11的選擇-11反（1-p）1-1正（p）反正12支付p-混合 -p+(1-p) p-(1-p)min=-1min=-1min=？1的支付1-101/21-111的p混合策略2正2反參與人1的p-混合策略圖解2的選擇-11反1-1正反(1-q)正(q)12支付max=1

6、 max=1q-混合-q+(1-q)q-(1-q)max=?2的支付1-101/21-112的q混合策略1反1正參與人2的q-混合策略圖解內(nèi)容提要零和博弈最小最大方法直線交叉法對(duì)抗性排序?qū)剐耘判?根據(jù)收益的相關(guān)性進(jìn)行“你死我活”的擲硬幣游戲-1，11，-1反面1，-1-1，1正面反面正面12支付出現(xiàn)“雙贏”可能的價(jià)格大戰(zhàn)低價(jià)高價(jià)低價(jià)3，36，1高價(jià)1，65，5支付百事可樂可口可樂個(gè)體利益與集體利益一致的性別戰(zhàn)博弈1，20，0足球0，02，1時(shí)裝足球時(shí)裝妻子支付丈夫協(xié)調(diào)博弈廣義的協(xié)調(diào)博弈：包括所有能夠協(xié)調(diào)出雙贏對(duì)局的博弈，如囚徒困境；狹義的協(xié)調(diào)博弈：僅指?jìng)€(gè)體利益與集體利益一致的博弈，對(duì)于參與

7、人而言，合作總比不合作要好。協(xié)調(diào)博弈舉例：胖子進(jìn)門-1，-11，2后走2，1-1，-1先走后走先走張三支付李四協(xié)調(diào)博弈舉例：交通規(guī)則博弈1，1-1，-1靠左-1，-11，1靠右靠左靠右張三支付李四對(duì)稱博弈對(duì)稱博弈是指在無角色區(qū)分的參與者之間進(jìn)行的協(xié)調(diào)博弈，它表現(xiàn)在支付函數(shù)的對(duì)稱上，二者的策略集是一樣的。抑或：通俗說就是代表參與者身份的下標(biāo)，在分析中可以省略掉而沒有關(guān)系。對(duì)稱博弈分成三類：支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)不一致；支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)一致；無占優(yōu)性可比的協(xié)調(diào)博弈。支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)不一致3，32，0獵兔0，24，4獵鹿獵兔獵鹿甲支付乙純策略獵鹿是支付占優(yōu)納什均衡、純策略獵兔是風(fēng)險(xiǎn)占優(yōu)納什均衡。獵兔策略是一個(gè)保險(xiǎn)策略，而獵鹿則是一個(gè)帕累托效率策略但由于策略的不確定性而使它具有較大的風(fēng)險(xiǎn)。因此，均衡選擇取決于參與人對(duì)風(fēng)險(xiǎn)的態(tài)度。支付占優(yōu)與風(fēng)險(xiǎn)占優(yōu)一致1，10，0右行0，01，1左行右行左行甲支付乙這種情況博弈雙方

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

專題一：零和博弈剖析課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

專題一：零和博弈剖析課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔