博弈分析方法_第1頁
博弈分析方法_第2頁
博弈分析方法_第3頁
博弈分析方法_第4頁
博弈分析方法_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第4章博弈分析方法4.1博弈的表達(dá)4.1.1博弈的基本式4.1.2博弈的策略式4.1.3博弈的擴(kuò)展式4.2博弈的求解14.1博弈的表達(dá)任何一個(gè)博弈用三個(gè)基本要素來描述:(1)博弈的參與者。用N={1,2,…,n}來表示(2)每一個(gè)參與者的行動(dòng)。用Si={sij}來表示第i個(gè)參與者的第j個(gè)行動(dòng)(3)收益。用收益函數(shù)u(s1,s2,…sn)來表示各參與者的收益。24.1.1博弈的基本式博弈表達(dá)的基本式由參與者集合N、策略集S和收益函數(shù)u三個(gè)要素組成,即G={N,S,u},其中N={1,2,…,n},S={S1,S2,…,Sn},u={u1,u2,…,un}.收益函數(shù)ui:S→R,表示第i位參與者在不同行動(dòng)組合下所得到的收益?;臼揭部蓪憺镚={S1,S2,…,Sn;u1,u2,…,un}或簡寫為G={S,U}3試寫出囚徒困境的基本式(1)參與者集合:囚徒1,囚徒2,N={1,2}(2)策略集:囚徒1S1={坦白,抵賴};囚徒2S2={坦白,抵賴}。策略S11=S21=坦白,S12=S22=抵賴。(3)收益:u1(s11,s21)=-5u1(s11,s22)=0u1(s12,s21)=-8u1(s12,s22)=-1u2(s11,s21)=-5u2(s11,s22)=-8u2(s12,s21)=0u2(s12,s22)=-144.1.2博弈的策略式博弈的基本式可用博弈的策略式(正則式,矩陣表)和擴(kuò)展式(博弈樹,展開型)來表達(dá)。策略式又叫正則型或矩陣表。表中的“行”表示參與者1的策略,“列”表示參與者2的策略,“格”表示對應(yīng)于參與者策略組合的收益。策略式常用于試把囚徒困境用矩陣表表示。5-5,-50,-8-8,0-1,-1囚徒21坦白2抵賴1坦白囚徒12抵賴收益:(甲,乙)64.1.3展開型又叫博弈樹,擴(kuò)展式。根:博弈的出發(fā)節(jié)點(diǎn)枝:從根引出的若干條枝,在每條枝的盡頭是一個(gè)決策節(jié)。決策節(jié)是某個(gè)參與者必須做出決策的位置。從節(jié)點(diǎn)出發(fā)的每一條枝對應(yīng)于局中人的一個(gè)選擇。如果一個(gè)節(jié)點(diǎn)沒有從它那兒發(fā)出枝,則該節(jié)點(diǎn)為終點(diǎn)節(jié)(博弈結(jié)束)例把囚徒困境用博弈樹表示出來。7囚徒2囚徒2囚徒1坦白抵賴坦白抵賴坦白抵賴(-5,-5)(0,-8)(-8,0)(-1,-1)囚徒28例:A、B玩游戲報(bào)數(shù),從1至30,每次報(bào)1個(gè)或2個(gè)數(shù),報(bào)30的輸。試試看,寫出其擴(kuò)展型。9練習(xí)三個(gè)同學(xué)玩“黑白配”,與其他人不同的被淘汰。試寫出其基本式、矩陣式、博弈樹。104.2博弈的求解博弈求解的目的是預(yù)測博弈的均衡結(jié)果4.2.1嚴(yán)格占優(yōu)策略解占優(yōu)策略:如果不管其他參與者選擇什么樣的策略,參與者i的策略si’的收益總優(yōu)于其他策略的收益,則策略si’強(qiáng)優(yōu)于其他策略。該策略稱為嚴(yán)格占優(yōu)策略;如果每一個(gè)參與者都有嚴(yán)格優(yōu)策略,博弈就有一個(gè)占優(yōu)策略解。11尋找所有參與者的嚴(yán)格占優(yōu)策略,由全部嚴(yán)格占優(yōu)策略構(gòu)成的博弈的解即是嚴(yán)格占優(yōu)策略均衡。囚徒困境中,坦白是每一個(gè)參與者的嚴(yán)格占優(yōu)策略,故(坦白,坦白)是占優(yōu)策略解。124.2.2逐步剔除嚴(yán)格劣策略均衡(IEDS)嚴(yán)格劣策略:如果參與者i的策略si’所帶來的收益總少于其他任何策略,則稱si’為嚴(yán)格劣策略。IEDS過程:參與者1知道參與者2是理性的,將不選擇嚴(yán)格劣策略,故先劃去對2來說的嚴(yán)格劣策略;再分析并找出自己的嚴(yán)格劣策略,劃去;…直至找出逐步剔除嚴(yán)格劣策略均衡解。13如果我們通過這樣的過程求得惟一的策略組合,則這個(gè)策略組合為逐步剔除嚴(yán)格劣策略均衡,并稱博弈是逐步剔除嚴(yán)格劣策略可解的。試分析:參與者2左中右上參與者1下收益:(參與者1,參與者2)1,01,20,10,30,12,014參與者2左中右上參與者1下1,01,20,10,30,12,0上參與者1下1,01,20,30,1參與者2左中參與者1上1,01,2參與者2左中參與者1上1,2參與者2中154.2.3逐步剔除弱劣策略弱劣策略:如果參與者i的策略si’所帶來的收益至少少于一個(gè)其他策略si’’,則稱si’為弱劣策略。例:收益:(參與者1,參與者2)參與者2左中右A1參與者1A2A31,01,20,10,30,12,00,30,12,016納什均衡在一個(gè)存在n個(gè)參與者的博弈中,如果一個(gè)策略組合S*,如果保持其他參與者的策略不變,而任意一個(gè)參與者的策略都是最優(yōu)的,則策略組合S*就是納什均衡。試分析囚徒困境,獵鹿博弈,鴿派與鷹派,情侶博弈,博弈的納什均衡。17混合策略納什均衡考慮石頭、剪刀、布的游戲的均衡。184.2.4后退歸納法(逆推法)1,從擴(kuò)展式博弈的終點(diǎn)開始,以找到該博弈的每一個(gè)最后子博弈,然后求出納什均衡,并計(jì)算出相應(yīng)的收益;2,將每一個(gè)最后子博弈的起點(diǎn)變成結(jié)束點(diǎn),將計(jì)算出的每一個(gè)最后子博弈在納什均衡下的收益寫在其下方,得到的新的擴(kuò)展式博弈稱為壓縮的擴(kuò)展式博弈。經(jīng)過一次壓縮,就剔除了最后子博弈。3,重復(fù)第一步和第二步,并重新得到一個(gè)壓縮式博弈和相應(yīng)的納什均衡。一直進(jìn)行到只剩下一個(gè)子博弈為止。在逆推過程中找到的一系列子博弈的納什均衡組合就是該擴(kuò)展式博弈的一個(gè)完美均衡。19小蜈蚣博弈假設(shè)有兩個(gè)參與者1,2。可選行動(dòng)為C-進(jìn)行游戲,D-終止游戲。擴(kuò)展式博弈如下。121212(4,3)(1,5)(3,2)(0,4)(2,1)(-1,3)(1,0)CDDDDDDCCCCC20121212(4,3)(1,5)(3,2)(0,4)(2,1)(-1,3)(1,0)CDDDDDDCCCCC121212(4,3)(1,5)(3,2)(0,4)(2,1)(-1,3)(1,0)CDDDDDDCCCCC√∥(1,5)(3,2)√∥√∥(0,4)√∥(2,1)√∥(-1,3)√∥(1,0)小蜈蚣博弈有唯一的完美均衡:參與者1一開始就選擇D結(jié)束游戲。否則,是參與者2選擇D結(jié)束游戲······。即每一個(gè)參與者都選擇D結(jié)束游戲。21試分析下圖擴(kuò)展式博弈的子博弈完美均衡。(4,0)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論