![運(yùn)籌學(xué)對(duì)策論_第1頁](http://file4.renrendoc.com/view/160c9331d12a623747bdebeccf96d2f2/160c9331d12a623747bdebeccf96d2f21.gif)
![運(yùn)籌學(xué)對(duì)策論_第2頁](http://file4.renrendoc.com/view/160c9331d12a623747bdebeccf96d2f2/160c9331d12a623747bdebeccf96d2f22.gif)
![運(yùn)籌學(xué)對(duì)策論_第3頁](http://file4.renrendoc.com/view/160c9331d12a623747bdebeccf96d2f2/160c9331d12a623747bdebeccf96d2f23.gif)
![運(yùn)籌學(xué)對(duì)策論_第4頁](http://file4.renrendoc.com/view/160c9331d12a623747bdebeccf96d2f2/160c9331d12a623747bdebeccf96d2f24.gif)
![運(yùn)籌學(xué)對(duì)策論_第5頁](http://file4.renrendoc.com/view/160c9331d12a623747bdebeccf96d2f2/160c9331d12a623747bdebeccf96d2f25.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
運(yùn)籌學(xué)對(duì)策論第一頁,共七十四頁,編輯于2023年,星期三11.1引言Introduction第二頁,共七十四頁,編輯于2023年,星期三對(duì)策論(gametheory)亦稱博弈論,是研究具有對(duì)抗或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法,它既是數(shù)學(xué)的一個(gè)分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。對(duì)策論中有一個(gè)重要的概念即對(duì)策行為,對(duì)策行為是指具有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為,在這類行為中,參加斗爭(zhēng)或競(jìng)爭(zhēng)的各方各自具有不同的利益和目標(biāo),各方需考慮對(duì)手的各種可能的行動(dòng)方案,并力圖選擇對(duì)自己最為有利或最為合理的方案
許多游戲具有特征:(1)有一定的規(guī)則(2)有一個(gè)結(jié)果(3)有可供選擇的策略(4)策略與利益相互依存12.1.1對(duì)策論概述12.1引言第三頁,共七十四頁,編輯于2023年,星期三對(duì)策論,不同于日常游戲,它具有理論性,應(yīng)用的范圍也不局限于游戲。對(duì)策是一些個(gè)人、對(duì)組或其它組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后從各自允許的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過程。這些規(guī)則應(yīng)用到經(jīng)濟(jì)、軍事、政治等領(lǐng)域也有類似的特征。例如,市場(chǎng)競(jìng)爭(zhēng)、經(jīng)營(yíng)決策、投資分析、價(jià)格制定、費(fèi)用分?jǐn)偂⒇?cái)政轉(zhuǎn)移支付、投標(biāo)與拍賣、對(duì)抗與追蹤、資源利用、談判、競(jìng)選、戰(zhàn)爭(zhēng)例如,戰(zhàn)國(guó)時(shí)代的田忌賽馬、三國(guó)時(shí)代的曹不興濺墨畫蠅、曹操兵敗華容道、北宋時(shí)期的丁渭挖河修皇宮等都是對(duì)策論成功應(yīng)用的例子。12.1引言第四頁,共七十四頁,編輯于2023年,星期三著名法國(guó)經(jīng)濟(jì)學(xué)家泰勒爾(JeanTirole)說:“正如理性預(yù)期使宏觀經(jīng)濟(jì)學(xué)發(fā)生革命一樣,對(duì)策論廣泛而深遠(yuǎn)地改變了經(jīng)濟(jì)學(xué)家的思維方式”。是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策及這種決策的均衡問題。即它是研究聰明而又理智的決策者在沖突或合作中的策略選擇理論。它將成為當(dāng)代經(jīng)濟(jì)管理學(xué)科的前沿領(lǐng)城。對(duì)策論就是研究對(duì)策行為中斗爭(zhēng)各方是否存在著最合理的行動(dòng)方案,以及如何找到這個(gè)合理方案的數(shù)學(xué)理論和方法。12.1引言第五頁,共七十四頁,編輯于2023年,星期三一個(gè)對(duì)策需要3個(gè)基本要素:(1)局中人(players)(2)策略集(strategies)(3)得益函數(shù)(payoffs)
12.1.2對(duì)策三要素是一個(gè)局勢(shì)策略組全體局勢(shì)的集合S可用各局中人的策略集的迪卡爾集表示12.1引言第六頁,共七十四頁,編輯于2023年,星期三12.1.3對(duì)策的結(jié)構(gòu)和分類12.1引言第七頁,共七十四頁,編輯于2023年,星期三【例12.1】1943年2月,日本統(tǒng)帥山本五十六大將計(jì)劃由南太平洋新不列顛群島的拉包爾出發(fā),3天穿過俾斯麥海,開往新幾內(nèi)亞的萊城,支援困守的日軍。有兩條路線:北線和南線。盟軍統(tǒng)帥麥克阿瑟命令他麾下的太平洋戰(zhàn)區(qū)空軍司令肯尼將軍組織空中打擊。偵察機(jī)重點(diǎn)搜索有兩個(gè)方案:北線和南線。當(dāng)時(shí)未來3天中:北線陰雨,能見度差;南線晴天,能見度佳。日美雙方各自應(yīng)采用哪種方案12.1引言第八頁,共七十四頁,編輯于2023年,星期三北線南線第九頁,共七十四頁,編輯于2023年,星期三日軍盟軍北線()南線()北線()22南線()13【解】局中人:盟軍、日軍;雙方策略:北線、南線,記為:盟軍的贏得矩陣如下:最優(yōu)策略是:,即都選擇北線。日軍艦隊(duì)受到重創(chuàng),但未全殲。雙方選擇的策略是:在最不利中選擇最有利的策略。12.1引言第十頁,共七十四頁,編輯于2023年,星期三囚徒的困境(二人非零和對(duì)策)-5,-50,-10-10,0-1,-1囚徒1囚徒2坦白不坦白坦白不坦白雙方如何采取對(duì)策使結(jié)果對(duì)自己最有利?12.1引言第十一頁,共七十四頁,編輯于2023年,星期三【例12.2】雙寡頭削價(jià)競(jìng)爭(zhēng)(兩個(gè)廠商)100,10020,150150,2070,70亞貿(mào)中南高價(jià)低價(jià)高價(jià)低價(jià)類似地,廣告投資、采用新技術(shù)等方面,廠商之間常常耗資巨大,但不一定有利可圖的爭(zhēng)奪戰(zhàn);對(duì)公共資源的掠奪式使用等問題。我們的目的是如何利用這種困境達(dá)到有利于社會(huì),合理利用和開發(fā)公共資源,保護(hù)環(huán)境。12.1引言第十二頁,共七十四頁,編輯于2023年,星期三多寡頭削價(jià)競(jìng)爭(zhēng)(3個(gè)廠商:亞貿(mào),中南,中北)
)100,100,10020,150,20150,20,20130,130,20亞貿(mào)中南高價(jià)低價(jià)高價(jià)低價(jià)20,20,15020,130,130130,20,13070,70,70亞貿(mào)中南高價(jià)低價(jià)高價(jià)低價(jià)中北采用高價(jià)中北采用低價(jià)12.1引言第十三頁,共七十四頁,編輯于2023年,星期三【例12.3】動(dòng)態(tài)對(duì)策:甲向乙借一萬元錢經(jīng)營(yíng),甲許諾經(jīng)營(yíng)成功后分給乙總利潤(rùn)(4萬)的一半,乙是否借給甲?乙甲借不借乙分不分(2,2)(1,0)打乙不打(0,4)(1,0)(-1,0)有法律保障法律保障不足12.1引言第十四頁,共七十四頁,編輯于2023年,星期三下一節(jié):納什均衡12.1引言第十五頁,共七十四頁,編輯于2023年,星期三12.2納什均衡NashEquilibrium第十六頁,共七十四頁,編輯于2023年,星期三12.2納什均衡Nash對(duì)對(duì)策論的貢獻(xiàn)有:(1)合作對(duì)策中的討價(jià)還價(jià)模型,稱為Nash討價(jià)還價(jià)解;(2)非合作對(duì)策的均衡分析。納什均衡(NashEquilibrium)假定有n個(gè)博弈方參加博弈,在給定其他博弈方策略的條件下,每個(gè)人選擇自己的最優(yōu)策略(個(gè)人最優(yōu)策略可能依賴也可能不依賴他人策略),一起構(gòu)成一個(gè)策略組合(StrategyProfile),而Nash均衡是這樣一種策略組合,由所有參與人的最優(yōu)策略組成,給定別人策略的條件下,沒有任何單個(gè)參與人有積極性選擇其他策略,從而沒有任何人有積極性打破這種均衡,Nash均衡是一種“僵局”:給定別人不動(dòng)的情況下,沒有人有興趣動(dòng)。約翰·納什(JohnF.Nash)
1928年生于美國(guó),1994年獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響12.2.1納什均衡定義第十七頁,共七十四頁,編輯于2023年,星期三另一種解釋:假定所有博弈方事先達(dá)成一項(xiàng)協(xié)議,規(guī)定每個(gè)人的行為規(guī)則,在沒有外在的強(qiáng)制力約束時(shí),當(dāng)事人會(huì)自覺遵守這個(gè)協(xié)議,等于說這個(gè)協(xié)議構(gòu)成一個(gè)納什均衡:假定別人遵守協(xié)議的情況下,沒有人有積極性偏離協(xié)議規(guī)定的自己的行為規(guī)則。換句話說,如果一個(gè)協(xié)議不構(gòu)成納什均衡,它就不可能自動(dòng)實(shí)施,因?yàn)橹辽儆幸粋€(gè)參與人會(huì)違背此協(xié)議,不滿足Nash均衡要求的協(xié)議是沒有意義的。12.2納什均衡第十八頁,共七十四頁,編輯于2023年,星期三用G表示一個(gè)對(duì)策,若一個(gè)對(duì)策中有n個(gè)局中人,則每個(gè)局中人可選策略的集合稱為策略集,分別用S1,S2,…,Sn表示;Sij表示局中人i的第j個(gè)策略,其中j可取有限個(gè)值(有限策略對(duì)策),也可取無限個(gè)值(無限策略對(duì)策);對(duì)策方i的得益則用hi表示;hi是各對(duì)策方策略的多元函數(shù),n個(gè)局中人的對(duì)策G常寫成:【定義12.1】
在對(duì)策G={S1,S2…,Sn;h1,h2…h(huán)n}中,如果由各個(gè)對(duì)策方的各選取一個(gè)策略組成的某個(gè)策略組合(S1*,S2*…,Sn*)中,任一對(duì)策方i的策略Si*,都是對(duì)其余策略方策略的組合(S1*,…,S*i-1,S*i+1…,Sn*)的最佳策略,即hi(S1*,…,S*i-1,Si*,S*i+1…Sn*)≥hi(S1*,…,S*i-1,Sij,S*i+1…,Sn*)對(duì)任意Sij∈Si都成立,則稱(S1*,…,Sn*)為G的一個(gè)純策略“納什均衡”(NashEquilibrium).G={S1,…,Sn;h1,…h(huán)n}12.2納什均衡第十九頁,共七十四頁,編輯于2023年,星期三各選取一個(gè)策略組成的某個(gè)策略組合構(gòu)成一個(gè)局勢(shì),其最優(yōu)局勢(shì)稱為純策略意義下的最優(yōu)局勢(shì).【例12.4】假設(shè)有三個(gè)廠商在同一市場(chǎng)上生產(chǎn)銷售完全相同的產(chǎn)品,它們各自的產(chǎn)量分別用m1、m2和m3表示,再假設(shè)m1、m2和m3只能取1、2、3……等正整數(shù)值.市場(chǎng)出清價(jià)格一定是市場(chǎng)總產(chǎn)量Q=m1+m2+m3的函數(shù),假設(shè)該函數(shù)為:
不妨先假設(shè)三個(gè)廠商開始時(shí)分別生產(chǎn)3單位,9單位和6單位產(chǎn)量,這時(shí)三廠商是否滿意各自的產(chǎn)量,要從利潤(rùn)進(jìn)行分析.由于產(chǎn)量不能超過20,則第i個(gè)廠商的利潤(rùn)函數(shù)為12.2納什均衡第二十頁,共七十四頁,編輯于2023年,星期三可算出在產(chǎn)量組合為(3,9,6)時(shí),市場(chǎng)價(jià)格為2,三廠商的利潤(rùn)分8,16和12,再作其它產(chǎn)量組合時(shí)亦會(huì)有不同的結(jié)果,如表12.2.
表12.2三廠商離散產(chǎn)量結(jié)合對(duì)應(yīng)價(jià)格和利潤(rùn)
m1m2m3pπ1π2π33962618123863924185564202024555525252533311333333633848242412.2納什均衡第二十一頁,共七十四頁,編輯于2023年,星期三【定義12.2】在對(duì)策G={S1,…,Sn;h1,…,hn}中,局中人i的策略集為Si={Si1,…,Sik},則他以概率分布pi=(pi1,…,pik)隨機(jī)在其k個(gè)可選策略中選擇的“策略”稱為一個(gè)混合策略,其中0≤pij≤1對(duì)j=1,…,k都成立,且pi1+…+pik=1.
12.2.2混合策略納什均衡12.2納什均衡第二十二頁,共七十四頁,編輯于2023年,星期三【定義12.3】如果一個(gè)策略G={S1,…,Sn,h1,…,hn}中,參予者i的策略集為Si={Si1,…,Sik},如果由各個(gè)對(duì)策方的策略組成策略集合G*={S1*,S2*,…,Sn*},其中都是對(duì)其余對(duì)策方策略組合的最佳策略,即∏i(S1*,S2*,…,Si-1*,Si*,…Sn*)≥∏i(S1*,S2*,…,Si-1*,Si*,…Sn*)對(duì)任意Sij∈Si都成立,則稱(S1*,…,Sn*)為G的一個(gè)混合策略納什均衡.12.2納什均衡第二十三頁,共七十四頁,編輯于2023年,星期三下一節(jié):反應(yīng)函數(shù)法作業(yè):教材P293T1012.2納什均衡第二十四頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法第二十五頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法當(dāng)?shù)靡媸菍?duì)策的多元連續(xù)函數(shù)時(shí),求出每個(gè)對(duì)策方的反應(yīng)函數(shù),而各個(gè)反應(yīng)函數(shù)的交點(diǎn)就是納什均衡【例12.5】設(shè)A,B兩廠家生產(chǎn)同樣產(chǎn)品,廠商A產(chǎn)量為q1,B產(chǎn)量為q2,市場(chǎng)總產(chǎn)量為Q=q1+q2,市場(chǎng)出清價(jià)格是市場(chǎng)總產(chǎn)量的函數(shù)P=6-Q。設(shè)產(chǎn)品產(chǎn)量的邊際成本相等,C1=C2=2。求解兩廠商的納什均(假設(shè)產(chǎn)量連續(xù)可分)。分析:這是一個(gè)連續(xù)產(chǎn)量的古諾模型,不難看出,該對(duì)策中兩廠商各自的利潤(rùn)分別為各自的銷售收益減去各自成本,即:第二十六頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法作反應(yīng)函數(shù):(0,4)(0,2)(2,0)(4,0)(4/3,4/3)納什均衡:(4/3,4/3)第二十七頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法【例12.6】考慮上述模型的另一種情況即各廠商所選擇的是價(jià)格而不是產(chǎn)量,假設(shè)產(chǎn)量與價(jià)格的函數(shù)關(guān)系為:其它條件不變,邊際成本為C1、C2,試求解其納什均衡。各自的策略空間為兩方的得益就是各自的利潤(rùn)第二十八頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法利用得益函數(shù)在偏導(dǎo)數(shù)為0時(shí)有最大值,各自的反應(yīng)函數(shù)分別為:為該對(duì)策唯一的納什均衡第二十九頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法【例12.7】設(shè)有3個(gè)農(nóng)戶一起放牧羊群,現(xiàn)有一可供大家自由放牧的草地,由于草地面積有限,只能供有限只羊群吃飽,否則就會(huì)影響到羊群的產(chǎn)出,假設(shè)每只羊的產(chǎn)出函數(shù)為成本C=8,且每個(gè)農(nóng)戶在決定自己放牧羊群數(shù)的時(shí)候并不知道其它農(nóng)戶的決策,試求出該決策問題的納什均衡?!窘狻扛鬓r(nóng)戶的得益函數(shù)分別為第三十頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法反應(yīng)函數(shù)因此該對(duì)策的納什均衡為(18,18,18)下一節(jié):有限二人零和對(duì)策
作業(yè):教材P293T9第三十一頁,共七十四頁,編輯于2023年,星期三12.4有限二人零和對(duì)策第三十二頁,共七十四頁,編輯于2023年,星期三矩陣對(duì)策就是二人有限零和對(duì)策。通常矩陣用來表示局中人1的贏得,局中人2的支付。12.4有限二人零和對(duì)策
用Ⅰ、Ⅱ表示兩個(gè)局中人,并設(shè)局中人Ⅰ有m個(gè)純策略,α1,α2,…,αm,局中人Ⅱ有n個(gè)純策略β1,β2,…,βn,則按對(duì)策論的相關(guān)要素定義,局中人Ⅰ、Ⅱ的策略集分別為:第三十三頁,共七十四頁,編輯于2023年,星期三可以算出,局中人Ⅰ、Ⅱ所構(gòu)成的策略組合共有m×n個(gè),記局中人Ⅰ在策略(αi,βj)下的贏得aij,則Ⅰ在每個(gè)策略的贏得構(gòu)成一個(gè)矩陣當(dāng)局中人Ⅰ、Ⅱ的策略集S1,S2及I的贏得矩陣確定后,一個(gè)矩陣對(duì)策就給定了.通常將矩陣對(duì)策記為:
12.4有限二人零和對(duì)策
第三十四頁,共七十四頁,編輯于2023年,星期三12.4.1數(shù)學(xué)定義12.4有限二人零和對(duì)策
稱A為局中人Ⅰ的贏得矩陣(或?yàn)棰虻闹Ц毒仃嚕?,由于?duì)策為零和的,故局中人Ⅱ的贏得矩陣為-A。矩陣對(duì)策記為第三十五頁,共七十四頁,編輯于2023年,星期三成立,,則稱VG為對(duì)策G的值,對(duì)應(yīng)的策略組合
12.4.2純策略矩陣對(duì)策【定義12.4】設(shè)G={S1,S2;A}為矩陣對(duì)策,其中S1={α1,α2,…,αn},S2={β1,β2,…,βn},若等式稱為該對(duì)策的納什均衡.12.4有限二人零和對(duì)策
第三十六頁,共七十四頁,編輯于2023年,星期三【例12.8】求解矩陣對(duì)策,其中則有對(duì)策G的解為:【解】12.4有限二人零和對(duì)策
第三十七頁,共七十四頁,編輯于2023年,星期三【定理12.1】矩陣對(duì)策G={S1,S2;A}在純策略定義下有納什均衡的充要條件是:存在策略組合使得對(duì)一切i=1,…,m,j=1,…,n,均有:
矩陣對(duì)策在純策略意義下有解且VG=ai*j*的充要條件是:ai*j*是A的鞍點(diǎn),在對(duì)策論中,矩陣A的鞍點(diǎn)也稱為對(duì)策的鞍點(diǎn).
12.4有限二人零和對(duì)策
第三十八頁,共七十四頁,編輯于2023年,星期三【定義5】設(shè)f(x,y)為一個(gè)定義在x∈A及y∈B上的實(shí)函數(shù),如果存在x*∈A及y*∈B,使得對(duì)一切x∈A及y∈B有則稱為函數(shù)f的有關(guān)鞍點(diǎn)。矩陣對(duì)策在純策略意義下的解且的充要條件是是A的鞍點(diǎn)。12.4有限二人零和對(duì)策
第三十九頁,共七十四頁,編輯于2023年,星期三【解】直接在贏得表上計(jì)算,有
可知=5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,β2)(α2,β4)為對(duì)策的納什均衡,VG=5.12.4有限二人零和對(duì)策
【例12.9】設(shè)有矩陣對(duì)策G={S1,S2;A},贏得矩陣為求納什均衡第四十頁,共七十四頁,編輯于2023年,星期三【性質(zhì)12.1】無差別性.若和為G的兩個(gè)解,則:【性質(zhì)12.2】可交換性.若和為G的兩個(gè)解,則以上方法也稱“上策均衡法”(Dominant-strategeEqyilibrium)12.4有限二人零和對(duì)策
也是對(duì)策的解.及第四十一頁,共七十四頁,編輯于2023年,星期三【例12.10】
甲、乙兩個(gè)企業(yè)同時(shí)生產(chǎn)一種電子產(chǎn)品(假設(shè)市場(chǎng)上只有這兩家,為一雙寡頭競(jìng)爭(zhēng)局面),兩個(gè)企業(yè)都想通過改革管理獲取更多的銷售份額,甲企業(yè)的策略措施有:(1)降低產(chǎn)品價(jià)格;(2)提高產(chǎn)品質(zhì)量;(3)推出新產(chǎn)品.乙企業(yè)措施為:(1)增加廣告費(fèi)用;(2)增設(shè)網(wǎng)點(diǎn);(3)改進(jìn)產(chǎn)品性能,通過預(yù)測(cè),兩個(gè)企業(yè)市場(chǎng)份額變動(dòng)情況如表12-4所示,試確定最優(yōu)策略.
乙企業(yè)123min甲企業(yè)112-13-1213103335855*max13105*
【解】則對(duì)策最優(yōu)解為VG=5,納什均衡為(α3,β3).甲企業(yè)采用推出新產(chǎn)品策略,乙企業(yè)采用改進(jìn)產(chǎn)品性能策略,結(jié)果甲企業(yè)贏得5%的市場(chǎng)份額.12.4有限二人零和對(duì)策
第四十二頁,共七十四頁,編輯于2023年,星期三12.4.3混合策略矩陣對(duì)策純策略矩陣對(duì)策的滿足納什均衡是滿足局中人Ⅰ有把握的至少贏得是局中人Ⅱ有把握的至多損失即:
當(dāng)V1≠V2時(shí),這時(shí)不存在純策略意義下的納什均衡。
田忌齊王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-312.4有限二人零和對(duì)策
第四十三頁,共七十四頁,編輯于2023年,星期三利用最大最小和最小最大原則,發(fā)現(xiàn)不存在使得成立的點(diǎn).12.4有限二人零和對(duì)策
第四十四頁,共七十四頁,編輯于2023年,星期三例:對(duì)局中人1來說,v1=-2,i*=2,對(duì)局中人2來說,v2=3,j*=1,v1≠v2。沒有鞍點(diǎn)?!径x12.6】設(shè)矩陣對(duì)策,其中記12.4有限二人零和對(duì)策
第四十五頁,共七十四頁,編輯于2023年,星期三則分別稱為局中人Ⅰ、Ⅱ的混合策略集;、分別稱為局中人1、2的混合策略,為一個(gè)混合局勢(shì)。稱為G的混合擴(kuò)充。E是贏得期望值?!径x】當(dāng)時(shí),稱為局中人Ⅰ、Ⅱ在混合策略中的納什均衡。稱為局中人Ⅰ在選取混合策略S*1時(shí)的贏得函數(shù)
【定理12.2】矩陣對(duì)象G={S1,S2;A}在混合策略意義下有解的充要條件是:存在x*∈S1*,y*∈S2*,使(x*,y*)為函數(shù)E(x,y)的一個(gè)鞍點(diǎn),即對(duì)一切x∈S1*,y∈S2*有E(x,y*)≤E(x*,y*)≤E(x*,y)12.4有限二人零和對(duì)策
第四十六頁,共七十四頁,編輯于2023年,星期三【例12.11】考慮矩陣對(duì)策G={S1,S2;A},其中局中人1的贏得期望值:取,滿足試求納什均衡.
【解】純策略納什均衡不存在.設(shè)x=(x1,x2)為局中人Ⅰ的混合策略,y=(y1,y2)為局中人Ⅱ的混合策略,則:12.4有限二人零和對(duì)策
第四十七頁,共七十四頁,編輯于2023年,星期三分別為局中人Ⅰ和Ⅱ的最優(yōu)策略.即該對(duì)策的納什均衡。
12.4.4納什均衡存在定理【定理12.3】設(shè)x*∈S1*,y*∈S2*,則(x*,y*)為對(duì)策G的納什均衡的條件是:對(duì)任意i=1,…,m,j=1,…,n,有E(i,y*)≤E(x*,y*)≤E(x*,j)其中:12.4有限二人零和對(duì)策
第四十八頁,共七十四頁,編輯于2023年,星期三【定理12.4】設(shè)x*∈S1*,y*∈S2*,則(x*,y*)是對(duì)策G的納什均衡的充要條件是:存在數(shù)V,使得x*,y*分別滿足:且V=VG.【定理12.5】對(duì)任一矩陣對(duì)策G={S1,S2;A},一定存在混合策略意義下的納什均衡.12.4有限二人零和對(duì)策
第四十九頁,共七十四頁,編輯于2023年,星期三【定理12.6】設(shè)(x*,y*)為矩陣對(duì)策G的一個(gè)納什均衡,V=VG,則(1)若xi*>0,則
(2)若yi*>0,則
(3)若,則
(4)若,則12.4有限二人零和對(duì)策
例第五十頁,共七十四頁,編輯于2023年,星期三12.4有限二人零和對(duì)策
【定理12.7】設(shè)有兩個(gè)矩陣對(duì)策G1={S1,S2;A},G2={S1,S2;αA}則(1)VG2=αVG1(2)T(G1)=T(G2)其中α>0為一常數(shù),T(G1)、T(G2)為兩個(gè)對(duì)策的解集合第五十一頁,共七十四頁,編輯于2023年,星期三1.優(yōu)超原則法【例12.12】設(shè)贏得矩陣A為:求納什均衡.
【解】第4行優(yōu)于第1行,第3行優(yōu)于第2行,故可劃去第1行和第2行,得到新的贏得矩陣,x1=x2=012.4有限二人零和對(duì)策
12.4.5矩陣對(duì)策求解方法“嚴(yán)格下策反復(fù)消去法”(IteratedEliminationofStrictly
DominatedStrategies)第五十二頁,共七十四頁,編輯于2023年,星期三對(duì)于A1第1列優(yōu)于第3列,第2列優(yōu)于第4列,(1/2)×(第1列)+(1/2)×(第2列)優(yōu)超于第5列,因此去掉第3列,第4列和第5列,y3=y4=y5=0,得到A2:
又由于第1行優(yōu)超于第3行,所以從A2中劃去第3行,x5=0,得到A3,解方程組:該矩陣對(duì)策的納什均衡為:
VG=4.8
12.4有限二人零和對(duì)策
第五十三頁,共七十四頁,編輯于2023年,星期三2.線性方程組法若最優(yōu)策略中和均不為零時(shí),有
12.4有限二人零和對(duì)策
【例12.14】求解矩陣對(duì)策【解】建立方程組求解得:x=(0.525,0.275,0.2),y=(0.2,0.05,0.75);VG=-0.45第五十四頁,共七十四頁,編輯于2023年,星期三3.線性規(guī)劃方法任意矩陣對(duì)策的求解均等價(jià)于一對(duì)互為對(duì)偶的線性規(guī)劃問題,而定理12.4表明,對(duì)策G的解等價(jià)于下面兩個(gè)不等式的解.【定理12.9】設(shè)矩陣對(duì)策的值為v,則:
12.4有限二人零和對(duì)策
第五十五頁,共七十四頁,編輯于2023年,星期三則局中人Ⅰ、Ⅱ的最優(yōu)策略等價(jià)于線性規(guī)劃問題:
12.4有限二人零和對(duì)策
第五十六頁,共七十四頁,編輯于2023年,星期三令有局中人Ⅰ:12.4有限二人零和對(duì)策
第五十七頁,共七十四頁,編輯于2023年,星期三同理,令有局中人Ⅱ:12.4有限二人零和對(duì)策
第五十八頁,共七十四頁,編輯于2023年,星期三【例12.12】利用線性規(guī)劃方法求解贏得矩陣為
的矩陣對(duì)策的納什均衡.【解】此問題可化為兩個(gè)互為對(duì)偶的線性規(guī)劃問題:12.4有限二人零和對(duì)策
第五十九頁,共七十四頁,編輯于2023年,星期三最優(yōu)解:X=(0.1065,0.1448,0.0437),Y=(0.1093,0.1038,0.0819);w=0.29508.利用變換
得到x*=(0.36,0.49,0.15),y*=(0.37,0.35,0.28);v=3.3912.4有限二人零和對(duì)策
第六十頁,共七十四頁,編輯于2023年,星期三下一節(jié):有限二人非零和對(duì)策
12.4有限二人零和對(duì)策
作業(yè):教材P292T3、4、5、6、8第六十一頁,共七十四頁,編輯于2023年,星期三12.5有限二人非零和對(duì)策第六十二頁,共七十四頁,編輯于2023年,星期三12.5有限二人非零和對(duì)策12.5.1數(shù)學(xué)定義【例11.16】市場(chǎng)上有兩企業(yè)生產(chǎn)同樣商品,甲企業(yè)與乙企業(yè)的贏得矩陣分別為矩陣A1和A2合并為雙矩陣依然在混合擴(kuò)充意義下考慮有限二人非零和對(duì)策,記局中人1的混合策略為x,局中人2的混合策略為y,相應(yīng)的策略集記為第六十三頁,共七十四頁,編輯于2023年,星期三12.5有限二人非零和對(duì)策【定義12.8】對(duì)于某個(gè)有限二人非零和對(duì)策,其局中人1的贏得(混合策略下)為局中人2的贏得為第六十四頁,共七十四頁,編輯于2023年,星期三12.5有限二人非零和對(duì)策12.5.2有限二人非零和對(duì)策納什均衡分別是局中人1和2的贏得,,和如果有一對(duì)策略為任意策略,滿足則稱為該對(duì)策的納什均衡,稱為對(duì)策的納什均衡解(或贏得)【定理12.10】(納什定理)任何矩陣對(duì)策及有限二人非零和對(duì)策至少有一個(gè)納什均衡【定義12.9】在有限二人非零和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年倉(cāng)單交易合作伙伴關(guān)系諒解協(xié)議
- 2025年辦公場(chǎng)地續(xù)租合同范本
- 2025年企業(yè)臨時(shí)工合同規(guī)范
- 2025年企業(yè)市場(chǎng)調(diào)查外包服務(wù)綜合合同
- 2025年建筑工程設(shè)計(jì)合作協(xié)議書樣本
- 2025年公共衛(wèi)生服務(wù)策劃與共識(shí)協(xié)議
- 2025年二手車買賣協(xié)議書轉(zhuǎn)讓合同
- 2025年個(gè)體工商戶聯(lián)合協(xié)議范本
- 2025年食品質(zhì)量保障與責(zé)任策劃協(xié)議
- 2025年企業(yè)培訓(xùn)策劃合作協(xié)議標(biāo)準(zhǔn)化指南
- 西安2025年陜西西安音樂學(xué)院專任教師招聘20人筆試歷年參考題庫附帶答案詳解
- 廣西壯族自治區(qū)北海市2024-2025學(xué)年九年級(jí)上學(xué)期1月期末化學(xué)試題(含答案)
- 2025新人教版英語七年級(jí)下單詞表(小學(xué)部分)
- 2025年春季1530安全教育記錄主題
- 川教版2024-2025學(xué)年六年級(jí)下冊(cè)信息技術(shù)全冊(cè)教案
- 2024年新疆(兵團(tuán))公務(wù)員考試《行測(cè)》真題及答案解析
- 紅色喜慶中國(guó)傳統(tǒng)元宵節(jié)英文介紹教育課件
- 《銀行融資知識(shí)》課件
- 新人教版高中數(shù)學(xué)選擇性必修第一冊(cè)全套精品課件
- 中式烹調(diào)技藝PPT課件
- 煤礦企業(yè)治安保衛(wèi)工作的難點(diǎn)及對(duì)策
評(píng)論
0/150
提交評(píng)論