博弈論ch2完全信息靜態(tài)博弈_第1頁
博弈論ch2完全信息靜態(tài)博弈_第2頁
博弈論ch2完全信息靜態(tài)博弈_第3頁
博弈論ch2完全信息靜態(tài)博弈_第4頁
博弈論ch2完全信息靜態(tài)博弈_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章完全信息靜態(tài)博弈

所謂完全信息靜態(tài)博弈即各博弈方同時決策,且所有博弈方對博弈中的各種情況下的得益都完全了解的博弈問題納什均衡無限策略博弈的解和反應(yīng)函數(shù)混合策略納什均衡的存在性博弈模型的表述(標(biāo)準(zhǔn)式擴展式,補充內(nèi)容)3.1市場進入的靜態(tài)博弈B進入不進入A進入–1,–11,0不進入0,10,01.得益矩陣行博弈方列博弈方博弈方1的策略空間策略組合的得益(行博弈方在行策略下的支付,列博弈方在列策略下的支付)列博弈方的策略空間博弈模型的表述(標(biāo)準(zhǔn)式擴展式,補充內(nèi)容)圖3.1市場進入的動態(tài)博弈:A先行動A進入不進入進入不進入進入不進入(–1,–1)(1,0)(0,1)(0,0)BB終點結(jié)策略組合的得益(先行動博弈方相應(yīng)策略下的支付,后行動博弈方相應(yīng)策略下的支付)決策結(jié):博弈方“枝”:一個“行動”擴展式2.1.1上策均衡分析

1上策:在一個博弈問題中,如果不管其他博弈方選擇什么策略,能夠給一博弈方帶來最大得益的策略,稱為這個博弈方的一個上策。2上策均衡:所有博弈方的上策組成的策略組合,稱為上策均衡。上策均衡分析是最基本的博弈分析方法對于一個博弈問題,上策均衡不一定存在.2.1基本分析思路和方法

2.1.2嚴(yán)格下策反復(fù)消去法嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略嚴(yán)格下策反復(fù)消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中嚴(yán)格下策反復(fù)消去法的使用范圍比上策均衡分析寬。對于一個博弈問題,嚴(yán)格下策不一定存在。2.1基本分析思路和方法2.1.3、劃線法1、方法:對于其他博弈方每一種策略或者策略組合,找出自己的最佳策略,并在得益上劃線。2、應(yīng)用例1、得益距陣:

博弈方2左中右

上博弈方1

下只有策略組合(上,中)的雙方策略對于對方策略的最佳策略1,01,30,40,20,12,02.1.3劃線法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭策略之間的相對優(yōu)劣關(guān)系,而不是絕對優(yōu)劣關(guān)系——劃線法。有時,劃線也不能解決博弈的最終問題。2.1.4箭頭法1、方法

考察在每個策略組合處各個博弈方能否通過提高單獨改變自己的策略而增加得益。如果能,用箭頭指示得益增加的方向。例1、得益距陣:博弈方2左中右上博弈方1下

只有策略組合(上,中)的得益數(shù)組處只有指向的箭頭而沒有指出的箭頭,雙方策略對于對方策略的最佳策略1,01,30,10,40,22,02.1.4箭頭法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭與劃線法思路有所不同,但效果與劃線法相同。主要分析行動的選擇過程。穩(wěn)定穩(wěn)定兩個穩(wěn)定結(jié)果無法語言一次博弈的最終結(jié)果2.2.1納什均衡的定義策略空間:博弈方的第個策略:博弈方的得益:博弈:2、納什均衡的定義:對于博弈G={S1,…,Sn;u1,…,un},如果某個策略組合(s1*,…,sn*)中任意博弈方i的策略si*都是對其他博弈方策略組合(s1*,…,si-1*,si+1*,…sn*)的最佳策略,即ui(s1*,…,si-1*,si*,si+1*,…sn*)ui(s1*,…,si-1*,sij,si+1*,…sn*)對于任意sij∈Si都成立,則稱(s1*,…,sn*)為G的一個納什均衡。納什均衡的實質(zhì):通俗地說,納什均衡含義就是:給定你的策略,我的策略是最好的策略;給定我的策略,你的策略也是你最好的策略。即雙方在對方給定的策略下不愿意調(diào)整自己的策略。2.2、納什均衡2.2.2納什均衡的一致預(yù)測性質(zhì)納什均衡的特征:在納什均衡的策略組合中,各個博弈方都不愿意單獨改變策略,具有穩(wěn)定性。納什均衡具有一致預(yù)測性和普遍存在性兩個重要性質(zhì),體現(xiàn)了納什均衡1、一致預(yù)測性:如果所有的博弈方都預(yù)測特定的博弈結(jié)果會出現(xiàn),那么所有博弈方都不會利用該預(yù)測方法或者預(yù)測能力,選擇與預(yù)測結(jié)果不一致的策略。如果沒有一致預(yù)測性質(zhì)的博弈分析,將會出現(xiàn)預(yù)測和行為之間的矛盾,甚至自我否定。2、納什均衡具有一致預(yù)測性。任何非納什均衡都不是具有一致預(yù)測性。2.2.3納什均衡的求解上策均衡一定是納什均衡,但是上策均衡不一定存在劃線法:例:囚徒困境博弈

囚徒2

不坦白坦白

囚不坦白

1坦白

箭頭法例:夫妻之爭博弈

丈夫時裝足球妻時裝子足球

-1,-1

-8,0

0,-8

-5,-52,10,00,01,32.2.4嚴(yán)格下策反復(fù)消去法與納什均衡嚴(yán)格下策:對于某一策略,若則稱為的嚴(yán)格下策。命題2.1在n個博弈方的博弈中,如果嚴(yán)格下策反復(fù)消去法排除了以外的所有策略組合,則一定是G的唯一的納什均衡。命題2.2在n個博弈方的博弈中,如果是G的一個納什均衡,則嚴(yán)格下策反復(fù)消去法一定不會將它消去。小結(jié)納什均衡點是一種局部均衡點,可以有很多個,也可以不存在。來源于策略組合的策略可能有n!個(離散),也可能無窮多個(連續(xù)),那么求解將會十分煩瑣。得益對于任一策略(s1,…,sn),其總得益為各博弈方得益之和那么對于具有多個納什均衡點的博弈,則對應(yīng)的應(yīng)有最優(yōu)納什均衡的概念,而對應(yīng)于最優(yōu)納什均衡的點為全局最優(yōu)點。此處最優(yōu)的含義為穩(wěn)定性而不是得益之和最大。2.3無限策略的解和反應(yīng)函數(shù)古諾的寡頭模型反應(yīng)函數(shù)伯特蘭德的寡頭模型公共資源問題2.3.1古諾的寡頭模型模型:設(shè)一市場有1、2兩個廠商生產(chǎn)同樣的產(chǎn)品。如果廠商1的產(chǎn)量為q1,廠商2的產(chǎn)量為q2,則市場總產(chǎn)量為Q=q1+q2。設(shè)市場出清價格是P=P(Q)=8-Q,生產(chǎn)無固定成本,單位變動成本為2,討論其納什均衡。

分析:1、個體收益最大化博弈方1利潤:博弈方2利潤:

2.3.1古諾的寡頭模型在本博弈中,的納什均衡的充分必要條件是和的最大值問題:第一個對q1求導(dǎo),并將q1*代入,6-q2*-2q1*=0第二個對q2求導(dǎo),并將q2*代入,6-q1*-2q2*=0解得唯一解2、社會收益最大化:假設(shè)總產(chǎn)量為Q,總收益為U=QP(Q)-CQ=Q(8-Q)-2Q=6Q-Q2其最大值為Q*=3,U=9該結(jié)果與納什均衡有較大的差異,這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。廠商14.5,4.55,3.753.75,54,4不突破突破廠商2不突破突破以自身最大利益為目標(biāo):各生產(chǎn)2單位產(chǎn)量,各自得益為4以兩廠商總體利益最大:各生產(chǎn)1.5單位產(chǎn)量,各自得益為4.5兩寡頭間的囚徒困境博弈當(dāng)然不難看出該博弈是一個囚徒困境博弈。2.3.2反應(yīng)函數(shù)

反應(yīng)函數(shù)-每個博弈方針對其他博弈方所有策略的最佳反應(yīng)構(gòu)成的函數(shù)。而各個博弈方反應(yīng)函數(shù)的交點(如果有的話)就是納什均衡。

在上面討論的兩寡頭古諾模型中,對廠商2的任意產(chǎn)量q2,廠商1的最佳對策產(chǎn)量q1,就是使白己在廠商2生產(chǎn)產(chǎn)量q2的情況下利潤最大化的產(chǎn)量,即q1是最大化問題:的解。上式對q1求導(dǎo)并令導(dǎo)數(shù)等于0由此得:2.3.2反應(yīng)函數(shù)-古諾模型

這樣我們得到了對于廠商2的每—個可能的產(chǎn)量,廠商1的最佳對策產(chǎn)量的計算公式,它是廠商2產(chǎn)量的一個連續(xù)函數(shù),我們稱這個連續(xù)函數(shù)為廠商1對廠商2產(chǎn)量的一個“反應(yīng)函數(shù)”(ReactionFunction)。q26363q1

由于這兩個反應(yīng)函數(shù)都是連續(xù)的線性函數(shù),因此可以用坐標(biāo)平面上的兩條直線表示它們,如圖:(2,2)同樣的方法,我們可再求出廠商2對廠商1產(chǎn)量q1的反應(yīng)函數(shù):2.3.2反應(yīng)函數(shù)-古諾模型2.3.2反應(yīng)函數(shù)-古諾模型在古諾模型中廠商1和廠商2的反應(yīng)函數(shù)分別為q2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)60(3,0)(6,0)

從左圖可以看出,當(dāng)一方的選擇為0時,另一方的最佳反應(yīng)為3,這正是我們前面所說過的實現(xiàn)總體最大利益的產(chǎn)量,因為一家產(chǎn)量為零,意味著另一家壟斷市場。當(dāng)一方的產(chǎn)量達到6時,另一方則被迫選擇0,因為實際上堅持生產(chǎn)已無利可圖。

現(xiàn)在我們把反應(yīng)函數(shù)法應(yīng)用到伯特蘭德模型的分析。伯持蘭德1883年提出了另一種形式的寡占模型。這種模型與選擇產(chǎn)量的古諾模型的區(qū)別在于,伯特蘭德模型中各廠商所選擇的是價格而不是產(chǎn)量。我們用簡單的兩寡頭且產(chǎn)品有一定差別的伯特蘭德價格博弈模型進行分析。2.3.3伯特蘭德寡頭模型

上述產(chǎn)品有一定差別是指兩個廠商生產(chǎn)的是同類產(chǎn)品,但在品牌、質(zhì)量和包裝等方面有所不同,因此伯特蘭德模型中廠商的產(chǎn)品之間有很強的替代性.但又不是完全可替代,即價格不同時,價格較高的不會完全銷不出去。當(dāng)廠商1和廠商2價格分別為P1和P2時,它們各自的需求函數(shù)為:和求出兩廠商對對方策略(價格)的反應(yīng)函數(shù)分別為:和

我們直接用反應(yīng)函數(shù)法分析這個博弈。上兩式分別對P1和P2求偏導(dǎo),并令偏導(dǎo)數(shù)為0,由此得:

納什均衡(P1*,P2*)必是兩反應(yīng)函數(shù)的交點,即必須滿足:求解此方程組即可得到納什均衡(P1*,P2*):記:具體地,如果進一步假設(shè)模型中的參數(shù)分別為:

將P1*,P2*代入得益函數(shù)則可進一步得到兩廠商的均衡得益值。則可以得到:P1*=P2*=20,u1*=u2*=324。2.3.3伯特蘭德的寡頭模型模型:兩個廠商生產(chǎn)的是同類產(chǎn)品,但是在品牌、質(zhì)量和包裝上有不同。產(chǎn)品具有替代性,但是不完全替代。在該模型中廠商選擇價格而不是產(chǎn)量廠商1的價格與需求函數(shù):P1,廠商2的價格與需求函數(shù):P2,其中,d1,d2>0為兩廠商產(chǎn)品的替代系數(shù)。假設(shè)兩廠商無固定成本,邊際成本分別為c1和c2。2.3.3伯特蘭德的寡頭模型收益:納什均衡:如果a1=a2=28,b1=b2=1,d1=d2=0.5,c1=c2=2,那么P1*=P2*=20,u1*=u2*=324。與古諾模型一樣,其納什均衡不是協(xié)商、合作得到的最佳結(jié)果,2.3.4公共資源問題公共資源(1)沒有哪個個人、企業(yè)或其他經(jīng)濟組織擁有;(2)大家都可以自由利用,具有這樣兩個特征的自然資源或人類生產(chǎn)的供大眾免費使用的設(shè)施或財貨。比如:地下水、公共道路(沒有限制)等。例設(shè)某村莊有n個農(nóng)戶,一公共草地,可養(yǎng)羊數(shù)為qi(i=1,…,n)為n個農(nóng)戶各自的策略空間,當(dāng)各戶養(yǎng)羊數(shù)為q1,…,qn時,總數(shù)為Q=q1+…+qn,每只羊的產(chǎn)出為羊的總數(shù)Q的減函數(shù)V=V(Q)=V(q1+…+qn),假設(shè)每只羊的成本為c,則農(nóng)戶i養(yǎng)qi只羊的得益為:ui=qiV(Q)-qic2.3.4公共資源問題-實例

設(shè)n=3,V=100-Q=100-(q1+q2+q3),c=4三農(nóng)戶的得益函數(shù)和反應(yīng)函數(shù):u1=q1[100-(q1+q2+q3)]-4q1,q1=R1(q2,q3)=48-0.5q2-0.5q3

u2=q2[100-(q1+q2+q3)]-4q2,q2=R1(q1,q3)=48-0.5q1-0.5q3

u3=q3[100-(q1+q2+q3)]-4q3,q3=R1(q1,q2)=48-0.5q1-0.5q2納什均衡:q1*=q2*=q3*=24,

u1*=u2*=u3*=576然而:最大總體收益:u*=2304Q*=48由此說明,納什均衡的解常常是低效率的,而在現(xiàn)實生活中卻經(jīng)常出現(xiàn)。如果采取最佳策略(集體理性),那么個體的貪婪性將會來破壞這一平衡。2.3.5反應(yīng)函數(shù)的問題和局限性在許多博弈中,博弈方的策略是有限且非連續(xù)時,其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù),無法求得反應(yīng)函數(shù),從而不能通過解方程組的方法求得納什均衡。即使得益函數(shù)可以求導(dǎo),也可能各博弈方的得益函數(shù)比較復(fù)雜,因此各自的反應(yīng)函數(shù)也比較復(fù)雜,并不總能保證各博弈方的反應(yīng)函數(shù)有交點,特別不能保證有唯一的交點。當(dāng)均衡不唯一的情況下,也不一定能找到均衡點2.4混合策略和混合策略納什均衡2.4.1嚴(yán)格競爭博弈和混合策略的引進2.4.2多重均衡博弈和混合策略2.4.3混合策略和嚴(yán)格下策反復(fù)消去法2.4.4混合策略反應(yīng)函數(shù)2.4.1嚴(yán)格競爭博弈和混合策略的引進在前面的例子,如猜硬幣,齊威王田忌賽馬,夫妻之爭等博弈問題不存在納什均衡策略組合,然而這類問題十分常見。例1.若被對手事先知道出現(xiàn)哪一面,肯定輸2.若正面出現(xiàn)的概率為p,負面為1-p,且p>0.5,則猜正面的話贏的幾率就比較大。-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面2.4.1嚴(yán)格競爭博弈和混合策略的引進特點:1.自己的選擇不能讓對手預(yù)先知道2.若重復(fù)多次,則不讓對手發(fā)現(xiàn)其中的規(guī)律。除非有意輸(一種行賄的手段),注意行賄只是一個手段,有意無意間讓對手了解自己的策略或規(guī)律?;旌喜呗?、混合策略博弈和混合策略納什均衡定義:在博弈G={s1,…,sn;u1,…un}中,博弈方i的策略空間為Si={si1,…,sik},則博弈方i以概率分布pi=(pi1,…,pik)隨機選擇其k個可選策略稱為一個“混合策略”,其中0≤pij≤1對j=1,…,k都成立且pi1+…+pik=1。相對于這種以一定概率分布在一些策略中隨機選擇的混合策略,確定性的具體的策略我們稱為“純策略”混合策略的原則:自己的策略選擇不能被另一方預(yù)知或猜到。選擇每種策略的概率一定要恰好使對方無機可乘?;旌喜呗约{什均衡:包含混合策略的策略組合,構(gòu)成納什均衡?;旌喜呗詳U展博弈:博弈方在混合策略的策略空間(概率分布空間)的選擇看作一個博弈,就是原博弈的“混合策略擴展博弈)。三、一個例子博弈方1選A、B的概率:pA,pB;博弈方2選C、D的概率:pC,pD。原則應(yīng)用:博弈方1選A和B的概率pA和pB一定要使博弈方2選C的期望得益和選D的期望得益相等。即pA×

3

+pB×1=pA×

2

+pB×5又由pA+pB=1,可得pA=0.8,pB=0.2,此即博弈方1應(yīng)選的混合策略。同理可得博弈方2的混合策略為pC=0.8,pD=0.2。納什均衡:1(0.8,0.2),2(0.8,0.2)期望得益:u1e=pA.pC.u1(A,C)+pA.pD.u1(A,D)+pB.pC.u1(B,C)+pB.pD.u1(B,D)=2.6u2e=2.6單獨一次博弈的結(jié)果可能是四種狀態(tài)的如何一種,然而多次獨立重復(fù)博弈得到如上的結(jié)果是可能的。

2,35,23,11,5

2CDA1B四、其它應(yīng)用混合策略的方法不僅可以解決不存在純策略納什均衡的博弈問題,同樣可應(yīng)用于存在多個純策略納什均衡的博弈問題。例1夫妻之爭該博弈與上一個博弈的不同之處在于每一方所希望對方知道自己的策略選擇以達到有利于自己的結(jié)果?,F(xiàn)實中,這類問題多通過協(xié)商解決以免兩敗俱傷。在此我們假設(shè)夫妻雙方不可協(xié)商,互不通消息。令pw(時),pw(足)分別表示妻子選擇時裝表演和足球的概率;

ph(時),ph(足)為丈夫選擇時裝表演和足球的概率。同樣的分析方法可得pw(時)=0.75,pw(足)=0.25;ph(時)=1/3,ph(足)=2/3.雙方的期望得益分別為uwe=0.67,uhe=0.75。

丈夫時裝足球妻時裝子足球2,10,00,01,32.齊威王田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田忌齊威王得益矩陣3.小偷和守衛(wèi)博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷一小偷欲偷竊有一守衛(wèi)看守的倉庫,如果小偷偷竊時守衛(wèi)在睡覺,則小偷就能得手,偷得價值為V的臟物;如果小偷偷竊時守衛(wèi)沒有睡覺,則小偷就會被抓住。設(shè)小偷被抓住后要坐牢,負效用為-P,守衛(wèi)睡覺而未遭偷竊則有S的正效用,因睡覺被竊要被解雇,其負效用為-D。而如果小偷不偷則他既無得也無失,守衛(wèi)不睡覺意味著出一份力賺一分錢,他也沒有得失。2.小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對守衛(wèi)的處罰:短期中的效果是使守衛(wèi)真正盡職在長期中并不能使守衛(wèi)更盡職,但會降低盜竊發(fā)生的概率0-D-D’守衛(wèi)得益((睡)SPt小偷偷的概率1Pt*Pt*’守衛(wèi)睡的期望得益S(1-Pt)+(-D)PtPt1-Pt3.小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率,但會是的守衛(wèi)更多的偷懶0-P-P’小偷得益(偷)VPg守衛(wèi)睡的概率1Pg*Pg*’小偷偷的期望得益VPg

+(-P)(1-Pg)Pg1-Pg當(dāng)我們?yōu)闇p少盜竊率,加重對小偷的懲罰時,最終的結(jié)果卻帶來了守衛(wèi)的偷懶,形成了一種政策目標(biāo)和政策結(jié)果之間的意外關(guān)系,這就被稱為“激勵的悖論”。小偷偷東西,保安瀆職。為了避免這種情況,是加重對小偷的懲罰呢,還是加重對保安的懲罰?由此給我們帶來什么啟示?執(zhí)法,監(jiān)督,等等2.4.2多重均衡博弈和混合策略一、夫妻之爭的混合策略納什均衡2,10,00,01,3時裝足球時裝足球丈夫妻子夫妻之爭妻子的混合策略丈夫的混合策略夫妻之爭博弈的混合策略納什均衡策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.75二、制式問題1,30,00,02,2ABAB廠商2廠商1制式問題制式問題混合策略納什均衡AB得益廠商1:0.40.60.664廠商2:0.670.331.296三、市場機會博弈-50,-50100,00,1000,0進不進進不進廠商2廠商1市場機會進不進得益廠商1:2/31/30廠商2:2/31/302.4.3混合策略和嚴(yán)格下策反復(fù)消去法3,10,20,23,31,31,1LRUMD博弈方2博弈方1博弈方2采用純策略L時,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用純策略R時,博弈方1采用混合策略(1/2,1/2,0)的得益納什均衡(M,R),雙方得益為(3,3)2.4.4混合策略反應(yīng)函數(shù)-1,11,-11,-1-1,1正面q反面1-q猜硬幣方正面r反面1-r猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布夫妻之爭博弈2,10,00,01,3時裝足球丈夫時裝足球妻子夫妻之爭rq113/41/3r1-rq1-q(r,1-r):丈夫的混合策略概率分布(q,1-q):妻子的混合策略概率分布2.5納什均衡的存在性允許采取混合策略的情況下,是否每個博弈都有納什均衡?納什定理在一個有n個博弈方的博弈G={s1,…,sn;u1,…un}中,如果n是有限的,且si都是有限集(對i=1,…,n),則該博弈至少存在一個納什均衡,但可能包含混合策略。教材106頁證明。主要根據(jù)是布魯威爾和角谷的不動點定理。納什均衡的普遍存在性正是納什均衡成為非合作博弈分析核心概念的根本原因之一。2.6納什均衡的選擇和分析方法擴展2.6.1多重納什均衡博弈的分析帕累托上策均衡風(fēng)險上策均衡聚點均衡相關(guān)均衡2.6.2共謀和防共謀均衡多人博弈中的共謀問題防共謀均衡2.6.1多重納什均衡博弈的分析

一個博弈中存在的納什均衡不止一個,就是一個多重納什均衡的博弈問題帕累托上策均衡

概念根據(jù)帕累托效率意義上的優(yōu)劣關(guān)系選擇出來的納什均衡,就是帕累托上策均衡。案例:“戰(zhàn)爭與和平”博弈問題(1)帕累托上策均衡:(和平,和平)(2)實際發(fā)生戰(zhàn)爭的原因:包括決策者考慮短期利益、個人或小集團利益更多,決策者確實缺乏理智和理性,或者局部地區(qū)或特定時期戰(zhàn)爭的利益比上述博弈中所假設(shè)的要大。

國家2戰(zhàn)爭和平國戰(zhàn)爭家

1和平-5,-58,-10-10,810,102.6.1多重納什均衡博弈的分析概念

如果所有博弈方在預(yù)計其他博弈方采用兩種納什均衡的策略概率相同時,都偏愛其中某一納什均衡,則該納什均衡就是風(fēng)險上策均衡。風(fēng)險上策均衡案例:獵鹿博弈

(1)(兔子,兔子)是這個獵鹿博弈的一個風(fēng)險上策均衡,精明的博弈方往往會選擇抓兔子而不是抓鹿。(2)博弈方對風(fēng)險上策的選擇傾向,有一種自我強化的機制。博弈方2鹿兔子鹿

兔子5,50,33,03,3博弈方2二、風(fēng)險上策均衡考慮、顧忌博弈方、其他博弈方可能發(fā)生錯誤等時,帕累托上策均衡并不一定是最優(yōu)選擇,需要考慮:風(fēng)險上策均衡。下面就是兩個例子。9,98,00,87,7LR博弈方2UD博弈方1風(fēng)險上策均衡(D,R)5,53,00,33,3鹿兔子獵人2鹿兔子獵人1獵鹿博弈風(fēng)險上策均衡(兔子,兔子)(U,L)是帕累托上策均衡帕累托上策均衡并不是有強制力的法則考慮風(fēng)險因素,(D,R)具有相對優(yōu)勢。稱(D,R)是風(fēng)險上策均衡。2.6.1多重納什均衡博弈的分析聚點均衡

并不是所有無帕累托優(yōu)劣關(guān)系的多重納什均衡博弈中,人們的選擇都沒有規(guī)律性。有時人們也會利用博弈規(guī)則以外的特定信息來做選擇,如博弈方共同的文化背景下的習(xí)慣、規(guī)范等聚點聚點均衡是指在多重納什均衡的博弈中,雙方同時選擇一個聚點構(gòu)成的納什均衡。當(dāng)然聚點均衡首先是納什均衡,是多重納什均衡中比較容易被選擇的納什均衡。經(jīng)典例子城市博弈、夫妻之爭博弈聚點均衡2,10,00,01,3時裝1/3足球2/3丈夫q時裝3/4足球1/4妻子r夫妻之爭可以利用規(guī)則以外的特定信息,如博弈方共同的文化背景中的習(xí)慣或規(guī)范,共同的知識,或者具有特定意義事物的特征,某些特殊的數(shù)量、位置關(guān)系等。例如:報時、城市博弈報時博弈中的“0點”或“12點”這樣策略為該博弈的“聚點”。在多重納什均衡的博弈中,雙方同時選擇一個聚點構(gòu)成的納什均衡稱為聚點均衡。利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡文化、習(xí)慣或者其他各種特征都可能是聚點均衡的依據(jù)城市博弈(城市分組相同)、時間博弈(報出相同的時間)是聚點均衡的典型例子聚點均衡來自謝林的《沖突的策略》,這本博弈論的經(jīng)典之作沒有方程,也沒有數(shù)學(xué)符號。在該書中謝林舉了很多例子。比如其中一個例子:你和其他參與人均從下面一組數(shù)中選擇一個數(shù),并畫上圈:7,100,13,261,99,666。如果你們選擇相同則贏利越多。你會選擇哪個數(shù)呢?謝林發(fā)現(xiàn)選7是最常見的策略,但在一群比較貪婪的人群中,666也有可能成為聚點。如果博弈重復(fù)多次,則過去的歷史常常就規(guī)定了聚點之所在。我所在的學(xué)院每到周一下午就會開會,大家在會議室的座位本來是不固定的,但是每學(xué)期第一次會議大家所坐的位置,基本上會在這個學(xué)期都是他坐的位置,因為每次開會時大家就會習(xí)慣性地坐到上次坐過的位置,這種座位配置也如同產(chǎn)生了聚點一樣。新婚夫妻的家務(wù)分擔(dān)博弈也是如此,在婚姻初期誰做家務(wù)做得多,那就意味著可能這一輩子他/她都會做更多的家務(wù),這也是一個聚點。2.6.1多重納什均衡博弈的分析相關(guān)均衡概念相關(guān)均衡是這樣的一種均衡選擇機制:博弈方主動尋求方法,設(shè)計某種形式的均衡選擇機制,以解決多重納什均衡選擇問題。如:在夫妻之爭博弈中,設(shè)計選擇機制:如果天氣好一起去看足球,否則要求去看時裝表演.存在問題在比較復(fù)雜的、設(shè)定得不是很清楚的現(xiàn)實博弈問題這個中,博弈方是否有能力設(shè)計出一種有足夠的理解和和相互信任的均衡機制,是有一定疑問的。應(yīng)用:如社會經(jīng)濟制度創(chuàng)新方面.相關(guān)均衡5,14,40,01,5LR博弈方2UD博弈方1相關(guān)均衡

兩個純策略納什均衡利益相差很大,很難達成妥協(xié),聚點均衡不適用。進一步發(fā)展,設(shè)計“相關(guān)裝置”,(1)該裝置以相同的可能性(各1/3)發(fā)出A、B、C三種信號;(2)博弈方1只能看到信號是否A,博弈方2只能看到該信號是否C;(3)博弈方1看到A采用U,否則采用D;博弈方2看到C采用R,否則采用L。它排除(U,R),各以1/3的概率出現(xiàn)(U,L)、(U,D)和(D,R),從而使雙方的期望得益為10/3?;旌喜呗约{什均衡[(1/2,1/2),(1/2,1/2)]的期望得益為2.5。均不理想,事前設(shè)計均衡選擇機制。

如拋一匹硬幣,出現(xiàn)正面博弈方1采用U,博弈方2采用L;出現(xiàn)反面博弈方1采用D,博弈方2采用R。

避免(U,R)出現(xiàn),雙方期望得益均為3。

相關(guān)均衡概念由博弈論專家奧曼提出。如果博弈的參與人可以根據(jù)某個共同觀測到的信號選擇行動,就可能出現(xiàn)相關(guān)均衡

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論