博弈論ch2完全信息靜態(tài)博弈

上傳人：2*** IP屬地：湖北上傳時(shí)間：2023-02-05 格式：PPT 頁(yè)數(shù)：65 大?。?92.50KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩60頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章完全信息靜態(tài)博弈

所謂完全信息靜態(tài)博弈即各博弈方同時(shí)決策，且所有博弈方對(duì)博弈中的各種情況下的得益都完全了解的博弈問(wèn)題納什均衡無(wú)限策略博弈的解和反應(yīng)函數(shù)混合策略納什均衡的存在性博弈模型的表述（標(biāo)準(zhǔn)式擴(kuò)展式，補(bǔ)充內(nèi)容）3.1市場(chǎng)進(jìn)入的靜態(tài)博弈B進(jìn)入不進(jìn)入A進(jìn)入–1,–11,0不進(jìn)入0,10,01.得益矩陣行博弈方列博弈方博弈方1的策略空間策略組合的得益（行博弈方在行策略下的支付，列博弈方在列策略下的支付）列博弈方的策略空間博弈模型的表述（標(biāo)準(zhǔn)式擴(kuò)展式，補(bǔ)充內(nèi)容）圖3.1市場(chǎng)進(jìn)入的動(dòng)態(tài)博弈：A先行動(dòng)A進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入進(jìn)入不進(jìn)入(–1,–1)(1,0)(0,1)(0,0)BB終點(diǎn)結(jié)策略組合的得益（先行動(dòng)博弈方相應(yīng)策略下的支付，后行動(dòng)博弈方相應(yīng)策略下的支付）決策結(jié)：博弈方“枝”：一個(gè)“行動(dòng)”擴(kuò)展式2.1.1上策均衡分析

1上策：在一個(gè)博弈問(wèn)題中，如果不管其他博弈方選擇什么策略，能夠給一博弈方帶來(lái)最大得益的策略，稱(chēng)為這個(gè)博弈方的一個(gè)上策。2上策均衡：所有博弈方的上策組成的策略組合，稱(chēng)為上策均衡。上策均衡分析是最基本的博弈分析方法對(duì)于一個(gè)博弈問(wèn)題，上策均衡不一定存在.2.1基本分析思路和方法

2.1.2嚴(yán)格下策反復(fù)消去法嚴(yán)格下策：不管其它博弈方的策略如何變化，給一個(gè)博弈方帶來(lái)的收益總是比另一種策略給他帶來(lái)的收益小的策略嚴(yán)格下策反復(fù)消去：1，01，30，10，40，22，0左中右上下1，01，30，40，2左中1，01，3左中嚴(yán)格下策反復(fù)消去法的使用范圍比上策均衡分析寬。對(duì)于一個(gè)博弈問(wèn)題，嚴(yán)格下策不一定存在。2.1基本分析思路和方法2.1.3、劃線法1、方法：對(duì)于其他博弈方每一種策略或者策略組合，找出自己的最佳策略，并在得益上劃線。2、應(yīng)用例1、得益距陣：

博弈方2左中右

上博弈方1

下只有策略組合（上，中）的雙方策略對(duì)于對(duì)方策略的最佳策略1，01，30，40，20，12，02.1.3劃線法1，01，30，10，40，22，0-5，-50，-8-8，0-1，-1囚徒困境-1，11，-11，-1-1，1猜硬幣2，10，00，01，3夫妻之爭(zhēng)策略之間的相對(duì)優(yōu)劣關(guān)系，而不是絕對(duì)優(yōu)劣關(guān)系——?jiǎng)澗€法。有時(shí)，劃線也不能解決博弈的最終問(wèn)題。2.1.4箭頭法1、方法

考察在每個(gè)策略組合處各個(gè)博弈方能否通過(guò)提高單獨(dú)改變自己的策略而增加得益。如果能，用箭頭指示得益增加的方向。例1、得益距陣：博弈方2左中右上博弈方1下

只有策略組合（上，中）的得益數(shù)組處只有指向的箭頭而沒(méi)有指出的箭頭，雙方策略對(duì)于對(duì)方策略的最佳策略1，01，30，10，40，22，02.1.4箭頭法1，01，30，10，40，22，0-5，-50，-8-8，0-1，-1囚徒困境-1，11，-11，-1-1，1猜硬幣2，10，00，01，3夫妻之爭(zhēng)與劃線法思路有所不同，但效果與劃線法相同。主要分析行動(dòng)的選擇過(guò)程。穩(wěn)定穩(wěn)定兩個(gè)穩(wěn)定結(jié)果無(wú)法語(yǔ)言一次博弈的最終結(jié)果2.2.1納什均衡的定義策略空間：博弈方的第個(gè)策略：博弈方的得益：博弈：2、納什均衡的定義：對(duì)于博弈G={S1,…,Sn;u1,…,un}，如果某個(gè)策略組合(s1*,…,sn*)中任意博弈方i的策略si*都是對(duì)其他博弈方策略組合(s1*,…,si-1*,si+1*,…sn*)的最佳策略，即ui(s1*,…,si-1*,si*,si+1*,…sn*)ui(s1*,…,si-1*,sij,si+1*,…sn*)對(duì)于任意sij∈Si都成立，則稱(chēng)(s1*,…,sn*)為G的一個(gè)納什均衡。納什均衡的實(shí)質(zhì)：通俗地說(shuō)，納什均衡含義就是：給定你的策略，我的策略是最好的策略；給定我的策略，你的策略也是你最好的策略。即雙方在對(duì)方給定的策略下不愿意調(diào)整自己的策略。2.2、納什均衡2.2.2納什均衡的一致預(yù)測(cè)性質(zhì)納什均衡的特征：在納什均衡的策略組合中，各個(gè)博弈方都不愿意單獨(dú)改變策略，具有穩(wěn)定性。納什均衡具有一致預(yù)測(cè)性和普遍存在性兩個(gè)重要性質(zhì),體現(xiàn)了納什均衡1、一致預(yù)測(cè)性：如果所有的博弈方都預(yù)測(cè)特定的博弈結(jié)果會(huì)出現(xiàn)，那么所有博弈方都不會(huì)利用該預(yù)測(cè)方法或者預(yù)測(cè)能力，選擇與預(yù)測(cè)結(jié)果不一致的策略。如果沒(méi)有一致預(yù)測(cè)性質(zhì)的博弈分析，將會(huì)出現(xiàn)預(yù)測(cè)和行為之間的矛盾，甚至自我否定。2、納什均衡具有一致預(yù)測(cè)性。任何非納什均衡都不是具有一致預(yù)測(cè)性。2.2.3納什均衡的求解上策均衡一定是納什均衡,但是上策均衡不一定存在劃線法:例:囚徒困境博弈

囚徒2

不坦白坦白

囚不坦白

徒

1坦白

箭頭法例：夫妻之爭(zhēng)博弈

丈夫時(shí)裝足球妻時(shí)裝子足球

－1，－1

－8，0

0，－8

－5，－5２，1０，00，０１，３2.2.4嚴(yán)格下策反復(fù)消去法與納什均衡嚴(yán)格下策：對(duì)于某一策略，若則稱(chēng)為的嚴(yán)格下策。命題2.1在n個(gè)博弈方的博弈中，如果嚴(yán)格下策反復(fù)消去法排除了以外的所有策略組合，則一定是G的唯一的納什均衡。命題2.2在n個(gè)博弈方的博弈中，如果是G的一個(gè)納什均衡，則嚴(yán)格下策反復(fù)消去法一定不會(huì)將它消去。小結(jié)納什均衡點(diǎn)是一種局部均衡點(diǎn)，可以有很多個(gè)，也可以不存在。來(lái)源于策略組合的策略可能有n！個(gè)（離散），也可能無(wú)窮多個(gè)（連續(xù)），那么求解將會(huì)十分煩瑣。得益對(duì)于任一策略（s1,…,sn），其總得益為各博弈方得益之和那么對(duì)于具有多個(gè)納什均衡點(diǎn)的博弈，則對(duì)應(yīng)的應(yīng)有最優(yōu)納什均衡的概念，而對(duì)應(yīng)于最優(yōu)納什均衡的點(diǎn)為全局最優(yōu)點(diǎn)。此處最優(yōu)的含義為穩(wěn)定性而不是得益之和最大。2.3無(wú)限策略的解和反應(yīng)函數(shù)古諾的寡頭模型反應(yīng)函數(shù)伯特蘭德的寡頭模型公共資源問(wèn)題2.3.1古諾的寡頭模型模型：設(shè)一市場(chǎng)有1、2兩個(gè)廠商生產(chǎn)同樣的產(chǎn)品。如果廠商1的產(chǎn)量為q1,廠商2的產(chǎn)量為q2，則市場(chǎng)總產(chǎn)量為Q=q1+q2。設(shè)市場(chǎng)出清價(jià)格是P=P(Q)=8-Q，生產(chǎn)無(wú)固定成本，單位變動(dòng)成本為2，討論其納什均衡。

分析：1、個(gè)體收益最大化博弈方1利潤(rùn)：博弈方2利潤(rùn)：

2.3.1古諾的寡頭模型在本博弈中，的納什均衡的充分必要條件是和的最大值問(wèn)題：第一個(gè)對(duì)q1求導(dǎo)，并將q1*代入，6-q2*-2q1*=0第二個(gè)對(duì)q2求導(dǎo)，并將q2*代入，6-q1*-2q2*=0解得唯一解2、社會(huì)收益最大化：假設(shè)總產(chǎn)量為Q，總收益為U＝QP（Q）－CQ＝Q（8-Q）－2Q＝6Q－Q2其最大值為Q*=3,U=9該結(jié)果與納什均衡有較大的差異，這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。廠商14.5，4.55，3.753.75，54，4不突破突破廠商2不突破突破以自身最大利益為目標(biāo)：各生產(chǎn)2單位產(chǎn)量，各自得益為4以兩廠商總體利益最大：各生產(chǎn)1.5單位產(chǎn)量，各自得益為4.5兩寡頭間的囚徒困境博弈當(dāng)然不難看出該博弈是一個(gè)囚徒困境博弈。2.3.2反應(yīng)函數(shù)

反應(yīng)函數(shù)－每個(gè)博弈方針對(duì)其他博弈方所有策略的最佳反應(yīng)構(gòu)成的函數(shù)。而各個(gè)博弈方反應(yīng)函數(shù)的交點(diǎn)（如果有的話）就是納什均衡。

在上面討論的兩寡頭古諾模型中，對(duì)廠商2的任意產(chǎn)量q2，廠商1的最佳對(duì)策產(chǎn)量q1，就是使白己在廠商2生產(chǎn)產(chǎn)量q2的情況下利潤(rùn)最大化的產(chǎn)量，即q1是最大化問(wèn)題：的解。上式對(duì)q1求導(dǎo)并令導(dǎo)數(shù)等于0由此得：2.3.2反應(yīng)函數(shù)－古諾模型

這樣我們得到了對(duì)于廠商2的每—個(gè)可能的產(chǎn)量，廠商1的最佳對(duì)策產(chǎn)量的計(jì)算公式，它是廠商2產(chǎn)量的一個(gè)連續(xù)函數(shù)，我們稱(chēng)這個(gè)連續(xù)函數(shù)為廠商1對(duì)廠商2產(chǎn)量的一個(gè)“反應(yīng)函數(shù)”(ReactionFunction)。q26363q1

由于這兩個(gè)反應(yīng)函數(shù)都是連續(xù)的線性函數(shù)，因此可以用坐標(biāo)平面上的兩條直線表示它們,如圖:(2,2)同樣的方法，我們可再求出廠商2對(duì)廠商1產(chǎn)量q1的反應(yīng)函數(shù)：2.3.2反應(yīng)函數(shù)－古諾模型2.3.2反應(yīng)函數(shù)－古諾模型在古諾模型中廠商1和廠商2的反應(yīng)函數(shù)分別為q2q1（0,6）（0，3）R1（q2）R2（q1）（2，2）60（3,0）（6,0）

從左圖可以看出，當(dāng)一方的選擇為0時(shí)，另一方的最佳反應(yīng)為3，這正是我們前面所說(shuō)過(guò)的實(shí)現(xiàn)總體最大利益的產(chǎn)量，因?yàn)橐患耶a(chǎn)量為零，意味著另一家壟斷市場(chǎng)。當(dāng)一方的產(chǎn)量達(dá)到6時(shí)，另一方則被迫選擇0，因?yàn)閷?shí)際上堅(jiān)持生產(chǎn)已無(wú)利可圖。

現(xiàn)在我們把反應(yīng)函數(shù)法應(yīng)用到伯特蘭德模型的分析。伯持蘭德1883年提出了另一種形式的寡占模型。這種模型與選擇產(chǎn)量的古諾模型的區(qū)別在于，伯特蘭德模型中各廠商所選擇的是價(jià)格而不是產(chǎn)量。我們用簡(jiǎn)單的兩寡頭且產(chǎn)品有一定差別的伯特蘭德價(jià)格博弈模型進(jìn)行分析。2.3.3伯特蘭德寡頭模型

上述產(chǎn)品有一定差別是指兩個(gè)廠商生產(chǎn)的是同類(lèi)產(chǎn)品，但在品牌、質(zhì)量和包裝等方面有所不同，因此伯特蘭德模型中廠商的產(chǎn)品之間有很強(qiáng)的替代性．但又不是完全可替代，即價(jià)格不同時(shí)，價(jià)格較高的不會(huì)完全銷(xiāo)不出去。當(dāng)廠商1和廠商2價(jià)格分別為P1和P2時(shí)，它們各自的需求函數(shù)為：和求出兩廠商對(duì)對(duì)方策略(價(jià)格)的反應(yīng)函數(shù)分別為：和

我們直接用反應(yīng)函數(shù)法分析這個(gè)博弈。上兩式分別對(duì)P1和P2求偏導(dǎo)，并令偏導(dǎo)數(shù)為0，由此得：

納什均衡(P1*，P2*)必是兩反應(yīng)函數(shù)的交點(diǎn)，即必須滿足：求解此方程組即可得到納什均衡(P1*，P2*)：記：具體地，如果進(jìn)一步假設(shè)模型中的參數(shù)分別為：

將P1*，P2*代入得益函數(shù)則可進(jìn)一步得到兩廠商的均衡得益值。則可以得到：P1*＝P2*＝20，u1*＝u2*＝324。2.3.3伯特蘭德的寡頭模型模型：兩個(gè)廠商生產(chǎn)的是同類(lèi)產(chǎn)品，但是在品牌、質(zhì)量和包裝上有不同。產(chǎn)品具有替代性，但是不完全替代。在該模型中廠商選擇價(jià)格而不是產(chǎn)量廠商1的價(jià)格與需求函數(shù)：P1，廠商2的價(jià)格與需求函數(shù)：P2，其中，d1，d2>0為兩廠商產(chǎn)品的替代系數(shù)。假設(shè)兩廠商無(wú)固定成本，邊際成本分別為c1和c2。2.3.3伯特蘭德的寡頭模型收益：納什均衡：如果a1=a2=28,b1=b2=1,d1=d2=0.5,c1=c2=2,那么P1*=P2*=20,u1*=u2*=324。與古諾模型一樣，其納什均衡不是協(xié)商、合作得到的最佳結(jié)果，2.3.4公共資源問(wèn)題公共資源（1）沒(méi)有哪個(gè)個(gè)人、企業(yè)或其他經(jīng)濟(jì)組織擁有；（2）大家都可以自由利用，具有這樣兩個(gè)特征的自然資源或人類(lèi)生產(chǎn)的供大眾免費(fèi)使用的設(shè)施或財(cái)貨。比如：地下水、公共道路（沒(méi)有限制）等。例設(shè)某村莊有n個(gè)農(nóng)戶，一公共草地，可養(yǎng)羊數(shù)為qi(i=1,…,n)為n個(gè)農(nóng)戶各自的策略空間，當(dāng)各戶養(yǎng)羊數(shù)為q1,…,qn時(shí)，總數(shù)為Q＝q1＋…＋qn，每只羊的產(chǎn)出為羊的總數(shù)Q的減函數(shù)V＝V(Q)=V(q1＋…＋qn)，假設(shè)每只羊的成本為c，則農(nóng)戶i養(yǎng)qi只羊的得益為：ui=qiV(Q)-qic2.3.4公共資源問(wèn)題－實(shí)例

設(shè)n＝3，V＝100－Q＝100－（q1＋q2＋q3），c＝4三農(nóng)戶的得益函數(shù)和反應(yīng)函數(shù)：u1＝q1[100－(q1＋q2＋q3)]－4q1，q1＝R1(q2,q3)=48-0.5q2-0.5q3

u2＝q2[100－(q1＋q2＋q3)]－4q2，q2＝R1(q1,q3)=48-0.5q1-0.5q3

u3＝q3[100－(q1＋q2＋q3)]－4q3，q3＝R1(q1,q2)=48-0.5q1-0.5q2納什均衡：q1*=q2*=q3*=24,

u1*=u2*=u3*=576然而：最大總體收益：u*=2304Q*=48由此說(shuō)明，納什均衡的解常常是低效率的，而在現(xiàn)實(shí)生活中卻經(jīng)常出現(xiàn)。如果采取最佳策略（集體理性），那么個(gè)體的貪婪性將會(huì)來(lái)破壞這一平衡。2.3.5反應(yīng)函數(shù)的問(wèn)題和局限性在許多博弈中，博弈方的策略是有限且非連續(xù)時(shí)，其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù)，無(wú)法求得反應(yīng)函數(shù)，從而不能通過(guò)解方程組的方法求得納什均衡。即使得益函數(shù)可以求導(dǎo)，也可能各博弈方的得益函數(shù)比較復(fù)雜，因此各自的反應(yīng)函數(shù)也比較復(fù)雜，并不總能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn)，特別不能保證有唯一的交點(diǎn)。當(dāng)均衡不唯一的情況下，也不一定能找到均衡點(diǎn)2.4混合策略和混合策略納什均衡2.4.1嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn)2.4.2多重均衡博弈和混合策略2.4.3混合策略和嚴(yán)格下策反復(fù)消去法2.4.4混合策略反應(yīng)函數(shù)2.4.1嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn)在前面的例子，如猜硬幣，齊威王田忌賽馬，夫妻之爭(zhēng)等博弈問(wèn)題不存在納什均衡策略組合，然而這類(lèi)問(wèn)題十分常見(jiàn)。例1.若被對(duì)手事先知道出現(xiàn)哪一面，肯定輸2.若正面出現(xiàn)的概率為p，負(fù)面為1-p，且p>0.5，則猜正面的話贏的幾率就比較大。-1，11，-11，-1-1，1正面反面猜硬幣方蓋硬幣方正面反面2.4.1嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn)特點(diǎn)：1.自己的選擇不能讓對(duì)手預(yù)先知道2.若重復(fù)多次，則不讓對(duì)手發(fā)現(xiàn)其中的規(guī)律。除非有意輸（一種行賄的手段），注意行賄只是一個(gè)手段，有意無(wú)意間讓對(duì)手了解自己的策略或規(guī)律?；旌喜呗浴⒒旌喜呗圆┺暮突旌喜呗约{什均衡定義：在博弈G={s1,…,sn;u1,…un}中，博弈方i的策略空間為Si={si1,…,sik}，則博弈方i以概率分布pi=(pi1,…,pik)隨機(jī)選擇其k個(gè)可選策略稱(chēng)為一個(gè)“混合策略”，其中0≤pij≤1對(duì)j=1,…,k都成立且pi1+…+pik=1。相對(duì)于這種以一定概率分布在一些策略中隨機(jī)選擇的混合策略，確定性的具體的策略我們稱(chēng)為“純策略”混合策略的原則：自己的策略選擇不能被另一方預(yù)知或猜到。選擇每種策略的概率一定要恰好使對(duì)方無(wú)機(jī)可乘?；旌喜呗约{什均衡：包含混合策略的策略組合，構(gòu)成納什均衡?；旌喜呗詳U(kuò)展博弈：博弈方在混合策略的策略空間（概率分布空間）的選擇看作一個(gè)博弈，就是原博弈的“混合策略擴(kuò)展博弈）。三、一個(gè)例子博弈方1選A、B的概率：pA，pB；博弈方2選C、D的概率：pC，pD。原則應(yīng)用：博弈方1選A和B的概率pA和pB一定要使博弈方2選C的期望得益和選D的期望得益相等。即pA×

＋pB×1＝pA×

＋pB×5又由pA＋pB＝1，可得pA＝0.8，pB＝0.2，此即博弈方1應(yīng)選的混合策略。同理可得博弈方2的混合策略為pC＝0.8,pD＝0.2。納什均衡：1（0.8，0.2），2（0.8，0.2）期望得益：u1e＝pA.pC.u1（A，C）＋pA.pD.u1（A，D）＋pB.pC.u1（B，C）＋pB.pD.u1（B，D）＝2.6u2e＝2.6單獨(dú)一次博弈的結(jié)果可能是四種狀態(tài)的如何一種，然而多次獨(dú)立重復(fù)博弈得到如上的結(jié)果是可能的。

2，35，23，11，5

2CDA1B四、其它應(yīng)用混合策略的方法不僅可以解決不存在純策略納什均衡的博弈問(wèn)題，同樣可應(yīng)用于存在多個(gè)純策略納什均衡的博弈問(wèn)題。例1夫妻之爭(zhēng)該博弈與上一個(gè)博弈的不同之處在于每一方所希望對(duì)方知道自己的策略選擇以達(dá)到有利于自己的結(jié)果?，F(xiàn)實(shí)中，這類(lèi)問(wèn)題多通過(guò)協(xié)商解決以免兩敗俱傷。在此我們假設(shè)夫妻雙方不可協(xié)商，互不通消息。令pw（時(shí)），pw（足）分別表示妻子選擇時(shí)裝表演和足球的概率；

ph（時(shí)），ph（足）為丈夫選擇時(shí)裝表演和足球的概率。同樣的分析方法可得pw（時(shí)）=0.75,pw（足）=0.25;ph（時(shí)）=1/3,ph（足）=2/3.雙方的期望得益分別為uwe＝0.67，uhe＝0.75。

丈夫時(shí)裝足球妻時(shí)裝子足球2，10，00，01，32.齊威王田忌賽馬3，-31，-11，-11，-1-1，11，-11，-13，-31，-11，-11，-1-1，11，-1-1，13，-31，-11，-11，-1-1，11，-11，-13，-31，-11，-11，-11，-11，-1-1，13，-31，-11，-11，-1-1，11，-11，-13，-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田忌齊威王得益矩陣3.小偷和守衛(wèi)博弈V，-D-P，00，S0，0睡不睡偷不偷守衛(wèi)小偷一小偷欲偷竊有一守衛(wèi)看守的倉(cāng)庫(kù)，如果小偷偷竊時(shí)守衛(wèi)在睡覺(jué)，則小偷就能得手，偷得價(jià)值為V的臟物；如果小偷偷竊時(shí)守衛(wèi)沒(méi)有睡覺(jué)，則小偷就會(huì)被抓住。設(shè)小偷被抓住后要坐牢，負(fù)效用為－P，守衛(wèi)睡覺(jué)而未遭偷竊則有S的正效用，因睡覺(jué)被竊要被解雇，其負(fù)效用為－D。而如果小偷不偷則他既無(wú)得也無(wú)失，守衛(wèi)不睡覺(jué)意味著出一份力賺一分錢(qián)，他也沒(méi)有得失。2.小偷和守衛(wèi)的博弈V，-D-P，00，S0，0睡不睡偷不偷守衛(wèi)小偷加重對(duì)守衛(wèi)的處罰：短期中的效果是使守衛(wèi)真正盡職在長(zhǎng)期中并不能使守衛(wèi)更盡職，但會(huì)降低盜竊發(fā)生的概率0-D-D’守衛(wèi)得益((睡)SPt小偷偷的概率1Pt*Pt*’守衛(wèi)睡的期望得益S(1－Pt)＋(－D)PtPt1-Pt3.小偷和守衛(wèi)的博弈V，-D-P，00，S0，0睡不睡偷不偷守衛(wèi)小偷加重對(duì)小偷的處罰：短期內(nèi)能抑制盜竊發(fā)生率長(zhǎng)期并不能降低盜竊發(fā)生率，但會(huì)是的守衛(wèi)更多的偷懶0-P-P’小偷得益(偷)VPg守衛(wèi)睡的概率1Pg*Pg*’小偷偷的期望得益VPg

＋(－P)(1－Pg)Pg1-Pg當(dāng)我們?yōu)闇p少盜竊率，加重對(duì)小偷的懲罰時(shí)，最終的結(jié)果卻帶來(lái)了守衛(wèi)的偷懶，形成了一種政策目標(biāo)和政策結(jié)果之間的意外關(guān)系，這就被稱(chēng)為“激勵(lì)的悖論”。小偷偷東西，保安瀆職。為了避免這種情況，是加重對(duì)小偷的懲罰呢，還是加重對(duì)保安的懲罰？由此給我們帶來(lái)什么啟示？執(zhí)法，監(jiān)督，等等2.4.2多重均衡博弈和混合策略一、夫妻之爭(zhēng)的混合策略納什均衡2，10，00，01，3時(shí)裝足球時(shí)裝足球丈夫妻子夫妻之爭(zhēng)妻子的混合策略丈夫的混合策略夫妻之爭(zhēng)博弈的混合策略納什均衡策略得益博弈方1（0.75，0.25）0.67博弈方2（1/3，2/3）0.75二、制式問(wèn)題1，30，00，02，2ABAB廠商2廠商1制式問(wèn)題制式問(wèn)題混合策略納什均衡AB得益廠商1：0.40.60.664廠商2：0.670.331.296三、市場(chǎng)機(jī)會(huì)博弈-50，-50100，00，1000，0進(jìn)不進(jìn)進(jìn)不進(jìn)廠商2廠商1市場(chǎng)機(jī)會(huì)進(jìn)不進(jìn)得益廠商1：2/31/30廠商2：2/31/302.4.3混合策略和嚴(yán)格下策反復(fù)消去法3，10，20，23，31，31，1LRUMD博弈方2博弈方1博弈方2采用純策略L時(shí)，博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用純策略R時(shí)，博弈方1采用混合策略(1/2,1/2,0)的得益納什均衡（M，R），雙方得益為（3，3）2.4.4混合策略反應(yīng)函數(shù)-1，11，-11，-1-1，1正面q反面1-q猜硬幣方正面r反面1-r猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r)：蓋硬幣方選擇正反面的混合策略概率分布(q,1-q)：猜硬幣方選擇正反面的混合策略概率分布夫妻之爭(zhēng)博弈2，10，00，01，3時(shí)裝足球丈夫時(shí)裝足球妻子夫妻之爭(zhēng)rq113/41/3r1-rq1-q(r,1-r)：丈夫的混合策略概率分布(q,1-q)：妻子的混合策略概率分布2.5納什均衡的存在性允許采取混合策略的情況下，是否每個(gè)博弈都有納什均衡？納什定理在一個(gè)有n個(gè)博弈方的博弈G＝｛s1，…，sn；u1，…un｝中，如果n是有限的，且si都是有限集（對(duì)i＝1，…，n），則該博弈至少存在一個(gè)納什均衡，但可能包含混合策略。教材106頁(yè)證明。主要根據(jù)是布魯威爾和角谷的不動(dòng)點(diǎn)定理。納什均衡的普遍存在性正是納什均衡成為非合作博弈分析核心概念的根本原因之一。2.6納什均衡的選擇和分析方法擴(kuò)展2.6.1多重納什均衡博弈的分析帕累托上策均衡風(fēng)險(xiǎn)上策均衡聚點(diǎn)均衡相關(guān)均衡2.6.2共謀和防共謀均衡多人博弈中的共謀問(wèn)題防共謀均衡2.6.1多重納什均衡博弈的分析

一個(gè)博弈中存在的納什均衡不止一個(gè)，就是一個(gè)多重納什均衡的博弈問(wèn)題帕累托上策均衡

概念根據(jù)帕累托效率意義上的優(yōu)劣關(guān)系選擇出來(lái)的納什均衡，就是帕累托上策均衡。案例：“戰(zhàn)爭(zhēng)與和平”博弈問(wèn)題（1）帕累托上策均衡：（和平，和平）（2）實(shí)際發(fā)生戰(zhàn)爭(zhēng)的原因：包括決策者考慮短期利益、個(gè)人或小集團(tuán)利益更多，決策者確實(shí)缺乏理智和理性，或者局部地區(qū)或特定時(shí)期戰(zhàn)爭(zhēng)的利益比上述博弈中所假設(shè)的要大。

國(guó)家2戰(zhàn)爭(zhēng)和平國(guó)戰(zhàn)爭(zhēng)家

1和平－5，－58，－10－10，810，102.6.1多重納什均衡博弈的分析概念

如果所有博弈方在預(yù)計(jì)其他博弈方采用兩種納什均衡的策略概率相同時(shí)，都偏愛(ài)其中某一納什均衡，則該納什均衡就是風(fēng)險(xiǎn)上策均衡。風(fēng)險(xiǎn)上策均衡案例：獵鹿博弈

（1）（兔子，兔子）是這個(gè)獵鹿博弈的一個(gè)風(fēng)險(xiǎn)上策均衡，精明的博弈方往往會(huì)選擇抓兔子而不是抓鹿。（2）博弈方對(duì)風(fēng)險(xiǎn)上策的選擇傾向，有一種自我強(qiáng)化的機(jī)制。博弈方2鹿兔子鹿

兔子5，50，33，03，3博弈方2二、風(fēng)險(xiǎn)上策均衡考慮、顧忌博弈方、其他博弈方可能發(fā)生錯(cuò)誤等時(shí)，帕累托上策均衡并不一定是最優(yōu)選擇，需要考慮：風(fēng)險(xiǎn)上策均衡。下面就是兩個(gè)例子。9，98，00，87，7LR博弈方2UD博弈方1風(fēng)險(xiǎn)上策均衡（D，R）5，53，00，33，3鹿兔子獵人2鹿兔子獵人1獵鹿博弈風(fēng)險(xiǎn)上策均衡（兔子，兔子）（U,L）是帕累托上策均衡帕累托上策均衡并不是有強(qiáng)制力的法則考慮風(fēng)險(xiǎn)因素，（D，R）具有相對(duì)優(yōu)勢(shì)。稱(chēng)（D，R）是風(fēng)險(xiǎn)上策均衡。2.6.1多重納什均衡博弈的分析聚點(diǎn)均衡

并不是所有無(wú)帕累托優(yōu)劣關(guān)系的多重納什均衡博弈中，人們的選擇都沒(méi)有規(guī)律性。有時(shí)人們也會(huì)利用博弈規(guī)則以外的特定信息來(lái)做選擇，如博弈方共同的文化背景下的習(xí)慣、規(guī)范等聚點(diǎn)聚點(diǎn)均衡是指在多重納什均衡的博弈中，雙方同時(shí)選擇一個(gè)聚點(diǎn)構(gòu)成的納什均衡。當(dāng)然聚點(diǎn)均衡首先是納什均衡，是多重納什均衡中比較容易被選擇的納什均衡。經(jīng)典例子城市博弈、夫妻之爭(zhēng)博弈聚點(diǎn)均衡2，10，00，01，3時(shí)裝1/3足球2/3丈夫q時(shí)裝3/4足球1/4妻子r夫妻之爭(zhēng)可以利用規(guī)則以外的特定信息，如博弈方共同的文化背景中的習(xí)慣或規(guī)范，共同的知識(shí)，或者具有特定意義事物的特征，某些特殊的數(shù)量、位置關(guān)系等。例如：報(bào)時(shí)、城市博弈報(bào)時(shí)博弈中的“0點(diǎn)”或“12點(diǎn)”這樣策略為該博弈的“聚點(diǎn)”。在多重納什均衡的博弈中，雙方同時(shí)選擇一個(gè)聚點(diǎn)構(gòu)成的納什均衡稱(chēng)為聚點(diǎn)均衡。利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡文化、習(xí)慣或者其他各種特征都可能是聚點(diǎn)均衡的依據(jù)城市博弈（城市分組相同）、時(shí)間博弈（報(bào)出相同的時(shí)間）是聚點(diǎn)均衡的典型例子聚點(diǎn)均衡來(lái)自謝林的《沖突的策略》，這本博弈論的經(jīng)典之作沒(méi)有方程，也沒(méi)有數(shù)學(xué)符號(hào)。在該書(shū)中謝林舉了很多例子。比如其中一個(gè)例子：你和其他參與人均從下面一組數(shù)中選擇一個(gè)數(shù)，并畫(huà)上圈：7，100，13，261，99，666。如果你們選擇相同則贏利越多。你會(huì)選擇哪個(gè)數(shù)呢？謝林發(fā)現(xiàn)選7是最常見(jiàn)的策略，但在一群比較貪婪的人群中，666也有可能成為聚點(diǎn)。如果博弈重復(fù)多次，則過(guò)去的歷史常常就規(guī)定了聚點(diǎn)之所在。我所在的學(xué)院每到周一下午就會(huì)開(kāi)會(huì)，大家在會(huì)議室的座位本來(lái)是不固定的，但是每學(xué)期第一次會(huì)議大家所坐的位置，基本上會(huì)在這個(gè)學(xué)期都是他坐的位置，因?yàn)槊看伍_(kāi)會(huì)時(shí)大家就會(huì)習(xí)慣性地坐到上次坐過(guò)的位置，這種座位配置也如同產(chǎn)生了聚點(diǎn)一樣。新婚夫妻的家務(wù)分擔(dān)博弈也是如此，在婚姻初期誰(shuí)做家務(wù)做得多，那就意味著可能這一輩子他/她都會(huì)做更多的家務(wù)，這也是一個(gè)聚點(diǎn)。2.6.1多重納什均衡博弈的分析相關(guān)均衡概念相關(guān)均衡是這樣的一種均衡選擇機(jī)制：博弈方主動(dòng)尋求方法，設(shè)計(jì)某種形式的均衡選擇機(jī)制，以解決多重納什均衡選擇問(wèn)題。如:在夫妻之爭(zhēng)博弈中,設(shè)計(jì)選擇機(jī)制:如果天氣好一起去看足球,否則要求去看時(shí)裝表演.存在問(wèn)題在比較復(fù)雜的、設(shè)定得不是很清楚的現(xiàn)實(shí)博弈問(wèn)題這個(gè)中，博弈方是否有能力設(shè)計(jì)出一種有足夠的理解和和相互信任的均衡機(jī)制，是有一定疑問(wèn)的。應(yīng)用:如社會(huì)經(jīng)濟(jì)制度創(chuàng)新方面.相關(guān)均衡5，14，40，01，5LR博弈方2UD博弈方1相關(guān)均衡

兩個(gè)純策略納什均衡利益相差很大，很難達(dá)成妥協(xié)，聚點(diǎn)均衡不適用。進(jìn)一步發(fā)展，設(shè)計(jì)“相關(guān)裝置”，（1）該裝置以相同的可能性（各1/3）發(fā)出A、B、C三種信號(hào)；（2）博弈方1只能看到信號(hào)是否A，博弈方2只能看到該信號(hào)是否C；（3）博弈方1看到A采用U，否則采用D；博弈方2看到C采用R，否則采用L。它排除（U，R），各以1/3的概率出現(xiàn)（U，L）、（U，D）和（D，R），從而使雙方的期望得益為10/3?；旌喜呗约{什均衡[（1/2，1/2），（1/2，1/2）]的期望得益為2.5。均不理想，事前設(shè)計(jì)均衡選擇機(jī)制。

如拋一匹硬幣，出現(xiàn)正面博弈方1采用U，博弈方2采用L；出現(xiàn)反面博弈方1采用D，博弈方2采用R。

避免（U，R）出現(xiàn)，雙方期望得益均為3。

相關(guān)均衡概念由博弈論專(zhuān)家?jiàn)W曼提出。如果博弈的參與人可以根據(jù)某個(gè)共同觀測(cè)到的信號(hào)選擇行動(dòng)，就可能出現(xiàn)相關(guān)均衡

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈論ch2完全信息靜態(tài)博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈論ch2完全信息靜態(tài)博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔