第二章完全信息靜態(tài)博弈2016 (2)

上傳人：5*** IP屬地：湖北上傳時間：2022-04-11 格式：PPT 頁數(shù)：75 大?。?29.50KB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩70頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、第二章完全信息靜態(tài)博弈本章介紹完全信息靜態(tài)博弈。完全信息靜態(tài)博弈即各博弈方同時決策，且所有博弈方對各方得益都了解的博弈。囚徒的困境、齊威王田忌賽馬、猜硬幣、石頭剪子布、古諾產(chǎn)量決策都屬于這種博弈。完全信息靜態(tài)博弈屬于非合作博弈最基本的類型。本章介紹完全信息靜態(tài)博弈的一般分析方法、納什均衡概念、各種經(jīng)典模型及其應(yīng)用等。本章分六節(jié)2.1基本分析思路和方法2.2納什均衡2.3無限策略博弈分析和反應(yīng)函數(shù)2.4混合策略和混合策略納什均衡2.5納什均衡的存在性2.6納什均衡的選擇和分析方法擴展2.1 基本分析思路和方法2.1.1 上策均衡2.1.2 嚴(yán)格下策反復(fù)消去法2.1.3 劃線法2.1

2、.4 箭頭法2.1.1 上策（優(yōu)勢策略）及均衡上策上策：不管其它博弈方選擇什么策略，一博弈方的某個策略給他帶來的得益始終高于(1)其它的策略，至少不低于(2)其他策略的策略。包括嚴(yán)格上策和弱上策。囚徒的困境中的“坦白”；雙寡頭削價中“低價”。弱上策（弱優(yōu)勢策略） 124 103 122 120 112 111 123 81 132甲上中下乙中右右優(yōu)勢策略均衡（尋找最優(yōu)策略均衡）-5， -50， -8-8， 0-1， -1坦白不坦白坦白不坦白囚徒囚徒 2囚囚徒徒1100，10020，150150，2070，70高價低價高價低價寡頭寡頭2寡寡頭頭1雙寡頭的得益矩陣 2.1.

3、2 嚴(yán)格下策反復(fù)消去法嚴(yán)格下策嚴(yán)格下策：不管其它博弈方的策略如何變化，給一個博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略。嚴(yán)格下策反復(fù)消去：1，01，30，10，40，22，0左中右上下1，01，30，40，2左中1，01，3左中劣勢策略反復(fù)消除法 01 31 10 40 20 02參與人1 上下參與人2 左中右嚴(yán)格下策反復(fù)消除法比上策均衡分析的實用面更大些.2.1.3 劃線法思路思路：找出每一個博弈方針對其他博弈方每種策略或策略組合的最佳對策，然后再找出相互構(gòu)成最佳對策的各博弈方策略組成的策略組合，也就是博弈的納什均衡。劃線法：劃線法：通過在每個博弈方對其他博弈方每個策

4、略或策略組合的最佳對策對應(yīng)的得益下劃線，分析博弈的方法稱為“劃線法”。劃線法以策略之間的相對優(yōu)劣關(guān)系為基礎(chǔ)，因此在分析用得益矩陣表示的博弈問題時具有普遍的實用性。2.1.3 劃線法1， 01， 30， 10， 40， 22， 0-5， -50， -8-8， 0-1， -1囚囚徒徒困困境境-1， 11， -11， -1-1， 1猜猜硬硬幣幣2， 10， 00， 01， 3夫夫妻妻之之爭爭上下左中右均衡：給定一方采用該策略組合中的策略，則另一方也愿意采用該策略組合中的策略，該策略組合具有穩(wěn)定性。2.1.4 箭頭法箭頭法的基本思路思路是對博弈中的每個策略組合進行分析，考察在每個策略組合處各個博

5、弈方能否單獨改變自己的策略而增加得益。如能，則從所分析的策略組合對應(yīng)的得益數(shù)組引一箭頭，到改變策略后策略組合的得益數(shù)組。最后綜合對每個策略組合的分析情況，形成對博弈結(jié)果的判斷。箭頭法：通過反映各博弈方選擇傾向的箭頭，尋找博弈中具有穩(wěn)定性具有穩(wěn)定性的策略組合的方法，就是箭頭法。2.1.4 箭頭法1， 01， 30， 10， 40， 22， 0-5， -50， -8-8， 0-1， -1囚囚徒徒困困境境-1， 11， -11， -1-1， 1猜猜硬硬幣幣2， 10， 00， 01， 3夫夫妻妻之之爭爭箭頭法注意事項v1、應(yīng)用箭頭法，要注意箭尾的數(shù)字一定比肩頭的小。v2、只有在單獨該策略選擇給當(dāng)事人

6、帶來更高的支付的時候，才畫相應(yīng)的箭頭。2.2 納什均衡2.2.1 納什均衡的定義2.2.2 納什均衡的一致預(yù)測性質(zhì)2.2.3 納什均衡與嚴(yán)格下策反復(fù)消去法2.2.1 相對優(yōu)勢策略均衡與納什均衡v相對優(yōu)勢策略均衡：與嚴(yán)格優(yōu)勢策略均衡和弱優(yōu)勢策略均衡不同，參與人的相對優(yōu)勢策略，是在他的對手選定某個策略的條件下他的優(yōu)勢策略。相對優(yōu)勢策略的組合稱為相對優(yōu)勢策略均衡。v策略空間：v博弈方的第個策略：v博弈方的得益：v博弈：nSS ,1ijiSsiu,;,11nnuuSSGiij納什均衡納什均衡：在博弈中，如果由各個博弈方的各一個策略組成的某個策略組合中，任一博弈方的策略，都是對其余博弈方策略

7、的組合的最佳對策，也即對任意都成立，則稱為的一個納什,;,11nnuuSSG),(*niss i),.,(*1*1*1niissss),.,(),.,(*1*1*1*1*1*1niijiiniiiisssssusssssuijiSs),(*nissG納什均衡的說明v1、參與人單獨改變策略不會得到好處的策略組合，(或者說具有相互是對其他各方最優(yōu)對策的策略組合）就叫做納什均衡。v2、納什均衡是策略組合，而不是參與人策略組合下的相應(yīng)的支付。v3、一個策略組合要成為博弈的納什均衡，必須在這個策略組合下所有參與人都沒有單獨改變策略選擇的動機；但要論證一個策略組合不是博弈的納什均衡，只要指出在這

8、個策略組合下有一個博弈參與人有單獨改變策略選擇的動機就足夠了。2.2.2 納什均衡的一致預(yù)測性質(zhì)一致預(yù)測一致預(yù)測：如果所有博弈方都預(yù)測一個特定博弈結(jié)果會出現(xiàn)，所有博弈方都不會利用該預(yù)測或者這種預(yù)測能力選擇與預(yù)測結(jié)果不一致的策略，即沒有哪個博弈方有偏離這個預(yù)測結(jié)果的愿望，因此預(yù)測結(jié)果會成為博弈的最終結(jié)果。 “預(yù)測一致”是指博弈方的實際行為選擇與他們的預(yù)測一致，而不是不同博弈方的預(yù)測結(jié)果相同或無差異。納什均衡一致預(yù)測屬性的論證v1、預(yù)測的結(jié)果是某個納什均衡，則預(yù)測的結(jié)果肯定是實際的結(jié)果。v2、預(yù)測的某個策略組合是博弈結(jié)果，則該策略組合一定是納什均衡。v只有納什均衡才具有一致預(yù)測的性質(zhì)v一致預(yù)測性是

9、納什均衡的本質(zhì)屬性v一致預(yù)測并不意味著一定能準(zhǔn)確預(yù)測，因為有多重均衡。納什均衡的一致預(yù)測性質(zhì)并不能保證各個博弈方的預(yù)測是相同的，相同的預(yù)測是一致預(yù)測的前提而不是結(jié)果。2.2.3 納什均衡與嚴(yán)格下策反復(fù)消去法v上策均衡肯定是納什均衡，但納什均衡不一定是上策均衡v命題命題2.1：在n個博弈方的博弈中，如果嚴(yán)格下策反復(fù)消去法排除了除之外的所有策略組合，那么一定是該博弈的唯一的納什均衡命題命題2.2：在n個博弈方的博弈中中，如果一個策略組合是的一個納什均衡，那么嚴(yán)格下策反復(fù)消去法一定不會將它消去。上述兩個命題保證在進行納什均衡分析之前先通過嚴(yán)格下策反復(fù)消去法簡化博弈是可行的),(*ni

10、ss,;,11nnuuSSG),(*niss),(*niss,;,11nnuuSSGG弱劣勢策略消除法v 600800 00 10000 10000 公明博弈公明要求看不要求看裝修行給看不給看弱劣勢策略消除會遺漏納什均衡作為”最終歸宿”的納什均衡 22 13 20 31 22 23 02 32 22甲ABC 乙 a b c 最后歸宿博弈最后歸宿博弈-下劃線法下劃線法納什均衡是理性博弈的歸宿2.3 無限策略分析和反應(yīng)函數(shù)2.3.1 古諾的寡頭模型2.3.2 反應(yīng)函數(shù)2.3.3 伯特蘭德寡頭模型2.3.4 公共資源問題2.3.5 反應(yīng)函數(shù)的問題和局限性本節(jié)研究具有無限多策略,有連續(xù)策略空間或可

11、以看作有連續(xù)策略空間的博弈模型2.3.1 古諾的寡頭模型基本假設(shè)：產(chǎn)品同質(zhì)兩廠商以產(chǎn)量為決策內(nèi)容212116qqqq221cc222126qqqq求解思路：求解思路：定義法思路：定義法思路：只要兩博弈方的策略組合（q1*,q2*),滿足其中的q1*,q2*相互是對對方的最佳對策，就構(gòu)成一個納什均衡，如果該均衡是唯一的，則它一般也是博弈的結(jié)果。均衡（2，2）收益（4，4）QQPPqqQ8)(21121111112)(8)(qqqqqcQPqu221222222)(8)(qqqqqcQPqu4.5，4.55，3.753.75，54，4不突破突破廠商廠商2不突破突破廠廠商商1以自身最大利益為目標(biāo)

12、：各生產(chǎn)2單位產(chǎn)量，各自得益為4以兩廠商總體利益最大：各生產(chǎn)1.5單位產(chǎn)量，各自得益為4.5兩寡頭市場評價囚徒困境博弈2.3.2 反應(yīng)函數(shù) 古諾模型的納什均衡也可以利用劃線法的思路求解，只是博弈方的對策是無窮的。)6()()6()()6max(max1211222212112121111qqRqqqRqqqqquq 對一個一般的博弈，只要得益是策略的的多元連續(xù)函數(shù)，我們就可以求每個博弈方針對其他博弈方策略的最佳反應(yīng)構(gòu)成的函數(shù)，也就是反應(yīng)函數(shù)，而接觸的各個博弈方反映函數(shù)的交點就是納什均衡。這種利用反映函數(shù)求博弈的納什均衡的方法稱為“反應(yīng)函數(shù)法”。q2q1 圖解動態(tài)收斂過程R1: q1=(6-q2

13、)/2R2: q2=(6-q1)/22.3.3 伯特蘭德寡頭模型v基本假設(shè)：基本假設(shè)：兩廠商、產(chǎn)品有差別兩廠商、產(chǎn)品有差別，消費者對價格不十分敏，消費者對價格不十分敏感，廠商策略空間感，廠商策略空間0，Pmax1， 0，Pmax2122222122211112111),(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP)(21)(21*122222*2*211111*1PdcbabPPdcbabPd1代表產(chǎn)品2對產(chǎn)品1的替代程度。

14、均衡解)(42)(42)(42)(4222212111112121211121212222212111cbaddbbbcbaddbbdPcbaddbbbcbaddbbdP2.3.4 公共資源問題公共草地養(yǎng)羊問題QQVVqqQn100)(1以三農(nóng)戶為例 n=3，c=4cqQVquiii)(核心的內(nèi)容：論證公共資源使用的低效核心的內(nèi)容：論證公共資源使用的低效3321332321221321114)(1004)(1004)(100qqqqquqqqqquqqqqqu323211212148),(qqqqRq313122212148),(qqqqRq212133212148),(qqqqRq17287

15、257624*3*2*1*3*2*1*3*2*1uuuQuuuqqq競爭：個體利益最大化競爭：個體利益最大化480296964)100(2QQQuQQQQQu合作：總體利益最大化合作：總體利益最大化1728576323047224348uQ1、說明非合作博弈的結(jié)果可能是低效率的。2、解釋公地悲劇的原因：每個可以利用公共資源的人都相當(dāng)于面臨著一種囚徒困境：在總體上有加大資源利用的可能時，自己加大利用而其他人不加大利用則自己得利，自己加大而其他人也加大利用時，自己不至于吃虧，所以，加大利用是各博弈方的優(yōu)勢策略，優(yōu)勢策略的均衡導(dǎo)致資源的過渡利用。2.3.5 反應(yīng)函數(shù)的問題和局限性v在許多博弈中，博弈

16、方的策略是有限且非連續(xù)時，其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù)，無法求得反應(yīng)函數(shù)，從而不能通過解方程組的方法求得納什均衡。v即使得益函數(shù)可以求導(dǎo)，也可能各博弈方的得益函數(shù)比較復(fù)雜，因此各自的反應(yīng)函數(shù)也比較復(fù)雜，并不總能保證各博弈方的反應(yīng)函數(shù)有交點，特別不能保證有唯一的交點。2.4 混合策略和混合策略納什均衡2.4.1 嚴(yán)格競爭博弈和混合策略的引進2.4.2 多重均衡博弈和混合策略2.4.3 混合策略和嚴(yán)格下策反復(fù)消去法2.4.4 混合策略反應(yīng)函數(shù)本節(jié)研究不存在納什均衡和存在多重納什均衡的博弈2.4.1 嚴(yán)格競爭博弈和混合策略的引進嚴(yán)格競爭博弈:各博弈方的利益和偏好始終不一致.一、猜硬幣博弈-1， 11，

17、 -11， -1-1， 1正面反面猜硬幣方猜硬幣方蓋蓋硬硬幣幣方方正面反面（1）不存在前面定義的納什均衡策略組合（2）策略的選擇與各方的利益仍然息息相關(guān). (3) 策略選擇的關(guān)鍵:選擇的隨機性, 以及重視策略選擇的概率分布,即不能讓對方猜到自己策略混合博弈的特征v1、在這類博弈中，不存在純策略納什均衡。（純策略：它給每個參與人具體明確了一個非隨機性的行動計劃?；旌喜呗詣t表明，參與人可以按照一定的概率，隨機地從純策略集合中選擇一種純策略作為實際的行動。所以混和策略的均衡結(jié)果不是雙方選擇策略空間中哪個策略，而是以怎樣的概率選擇這些策略。）v2、參與人的收益不僅取決于自己的策略，也取決于

18、其他參與人的策略，而自己與其他參與人以某種概率隨機選擇不同的行為。v3、每個參與人都想猜透對方的策略，而每個參與人又都不想讓對方猜透自己的策略。策略、純策略、混合策略的區(qū)別v策略：參與人在給定信息集的情況下選擇行動計劃。他規(guī)定參與人在什么情況下選擇什么行動，是參與人相機行動的方案。v純策略：如果一個策略規(guī)定參與人在每種給定信息情況下只選擇一種特定的行動，稱為純策略，或簡稱策略。即參與人在策略空間中選取唯一確定的策略。 v混合策略：如果一個策略規(guī)定參與人在每種給定信息的情況下，以某種概率分布隨機選取不同的行動，稱為混合策略。參與人選取的不是策略空間中唯一明確的策略，而是其策略空間上的概率分布。v

19、參與人選取混合策略的原因：主觀上猶豫不決，客觀條件的不確定性，以及策略需要。二、混合策略、混合策略博弈和混合策略納什均衡混合策略混合策略：在博弈中，假設(shè)博弈方的純策略空間為，則博弈方隨機在其個可選策略中選擇的“策略”的概率分布，稱為博弈方i 的 “混合策略”，其中，。混合策略博弈混合策略博弈：博弈方在混合策略的策略空間（概率分布空間）的選擇看作一個博弈，就是原博弈的“混合策略博弈”。 ,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ikpkkikp11混合策略納什均衡v由于混合策略伴隨的是支付的不確定性，所以參與人關(guān)心的是期望效用（期望支付）。

20、博弈方的期望支付是混合策略組合的函數(shù)，記為：，或者v混合策略納什均衡：是博弈方相對最優(yōu)混合策略的組合。相對最優(yōu)策略是指在給定對方混合策略的情況下，使自身期望效用達到最大的混合策略。數(shù)學(xué)表達為：設(shè)是n人策略式博弈的一個混合策略組合。如果對于所有的i=1,2, n,每一個pi都成立，則稱該混合策略組合是這個博弈的一個納什均衡。),(1niiippp),(iiiipp*),()*,(iiiiiiipppp)*,*,*,(*1nipppp三、一個例子該博弈無純策略納什均衡，可用混合策略納什均衡分析2， 35， 23， 11， 5CDAB博弈方博弈方2博博弈弈方方1均衡求解5213BABApppp135

21、2DCDCpppp博弈方1的最優(yōu)混合策略博弈方2的最優(yōu)混合策略均衡策略得益博弈方1 （0.8，0.2） 2.6博弈方2 （0.8，0.2） 2.6用反證法證明混合納什均衡的求解思路v1、不能讓對方知道或猜到自己的選擇，因而必須在決策時利用隨機性。v2、參與方選擇每中策略的概率一定要恰好使對方無機可乘，即讓對方無法通過針對性地傾向某一策略而在博弈中占上風(fēng)。v上例中博弈方1以（0.8,0.2)概率選擇A和B，博弈方2以（0.8,0.2)概率選擇C和D，由于誰都無法通過單獨改變自己隨機選擇的概率分布改善自己的期望得益，因此這個混合策略組合是穩(wěn)定的。是本博弈唯一的納什均衡。四、齊威王田忌賽馬3，-

22、31，-11，-11，-1-1，11，-11，-13，-31，-11，-11，-1-1，11，-1-1，13，-31，-11，-11，-1-1，1 1，-11，-13，-31，-11，-11，-11，-11，-1-1，13，-31，-11，-11，-1-1，11，-11，-13，-3上中下pa上中下pb上中下pc上中下pd上中下pe上中下pf上中下g上中下h上中下i上中下j上中下k上中下l田田忌忌齊齊威威王王得益矩陣齊威王的均衡策略(1/6,1/6,1/6,1/6,1/6,1/6)，田忌的均衡策略(1/6,1/6,1/6,1/6,1/6,1/6)，均衡時期望得益（1，-1）五、小偷和守衛(wèi)的博

23、弈V，-D-P，00，S0，0睡不睡偷不偷守衛(wèi)守衛(wèi)小小偷偷加重對守衛(wèi)的處罰：短期中的效果是使守衛(wèi)真正盡職在長期中并不能使守衛(wèi)更盡職，但會降低盜竊發(fā)生的概略0- D- D守衛(wèi)得益(睡)SPt 小偷偷的概率1V，-D-P，00，S0，0睡不睡偷不偷守衛(wèi)守衛(wèi)小小偷偷加重對小偷的處罰：短期內(nèi)能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率，但會是的守衛(wèi)更多的偷懶0- P- P小偷得益(偷)VPg 守衛(wèi)睡的概率12.4.2 多重均衡博弈和混合策略一、夫妻之爭的混合策略納什均衡2， 10， 00， 01， 3時裝足球時裝足球丈丈夫夫妻妻子子夫妻之爭夫妻之爭v妻子的混合策略妻子的概率選擇要使丈夫的兩種策略預(yù)

24、期收益相等v丈夫的混合策略同上3)(0)(0)(1)(FpCpFpCpwwww1)(0)(0)(2)(FpCpFpCphhhh 妻子的混合策略丈夫的混合策略 v夫妻之爭博弈的混合策略納什均衡v 策略得益v博弈方1 （0.75，0.25） 0.67v博弈方2 （1/3，2/3） 0.75v現(xiàn)實意義：缺乏溝通可能出現(xiàn)最差的結(jié)果?，F(xiàn)實意義：缺乏溝通可能出現(xiàn)最差的結(jié)果。二、制式問題制式問題混合策略納什均衡 A B 得益廠商1： 0.4 0.6 0.664廠商2： 0.67 0.33 1.2961， 30， 00， 02， 2ABAB廠商廠商2廠廠商商1制式問題制式問題現(xiàn)實意義：技術(shù)引進、投資、

25、開發(fā)產(chǎn)品等問題中，具有協(xié)同利益的不同廠商各自為政的行為方式常常會導(dǎo)致低效率（純納什均衡解優(yōu)于混合策略解）。三、市場機會博弈進不進得益廠商1： 2/3 1/3 0廠商2： 2/3 1/3 0-50，-50100，00，1000，0進不進進不進廠商廠商2廠廠商商1市場機會博弈市場機會博弈現(xiàn)實意義：現(xiàn)實意義：1、按照群體行為理解，在新興市場的進入博弈問題中，有2/3廠商會選擇進，1/3廠商會選擇不進。2、純粹的市場競爭并不都是高效率的，如果在市場競爭中結(jié)合一定的協(xié)商機制，（利益補償機制），市場的效率會更高。（該博弈中純納什均衡的整體社會效率高，但現(xiàn)實中這種博弈結(jié)果不是很穩(wěn)定?；旌喜呗跃饨?/p>

26、2.4.3 混合策略和嚴(yán)格下策反復(fù)消去法3， 10， 20， 23， 31， 31， 1LRUMD博弈方博弈方2博博弈弈方方123212111003eu23212111030eu博弈方2采用純策略L時，博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用純策略R時，博弈方1采用混合策略(1/2,1/2,0)的得益混合策略和嚴(yán)格下策反復(fù)消去法v1、任何博弈方都不會采用任何嚴(yán)格下策，不管它們是純策略還是混合策略；（各種策略相互比較消去相對劣勢策略。）v2、嚴(yán)格下策反復(fù)消去法不會消去納什均衡，包括純策略納什均衡和混合納什均衡；v3、如果經(jīng)過反復(fù)消去后留下來的策略組合是唯一的，那么一定是納什均

27、衡。 13 20 20 33博弈方2 L R博弈方1Um假設(shè)的前提：博弈方是風(fēng)險中型的，則E=3/21,如果是風(fēng)險厭惡型的則不一定。均衡解為(M,R)2.4.4 混合策略反應(yīng)函數(shù)法猜硬幣博弈-1， 11， -11， -1-1， 1正面q反面1-q猜硬幣方猜硬幣方正面r反面1-r猜硬幣博弈猜硬幣博弈蓋蓋硬硬幣幣方方反應(yīng)函數(shù)即一博弈方對另一博弈方每種可能的決策內(nèi)容的最佳反應(yīng)決策構(gòu)成的函數(shù)。混合策略反應(yīng)函數(shù)rq111/21/2(r,1-r)：蓋硬幣方選擇正反面的混合策略概率分布(q,1-q)：猜硬幣方選擇正反面的混合策略概率分布)(2rRq )(1qRr 混合策略反應(yīng)函數(shù)：一方對另一方概率分布的

28、反應(yīng)?；旌喜呗苑磻?yīng)函數(shù)：一方對另一方概率分布的反應(yīng)。U1=2r(1-2q)+(2q-1) U2=2q(2r-1)-(2r-1) 0 q1/2r= 0,1 q=1/2 1 q1/2q= 0,1 r=1/2 0 p1/2夫妻之爭博弈2， 10， 00， 01， 3時裝q足球1-q丈夫丈夫時裝r足球1-r妻妻子子夫妻之爭夫妻之爭rq111/33/4(r,1-r)：妻子的混合策略概率分布(q,1-q)：丈夫的混合策略概率分布)(2rRq )(1rRr U1=3r(q-1/3)+(1-q)U2=4q(r-3/4)+(1-r)（r=3/4，q=1/3）（E1=2/3，E2=1/4）2.5 納什均衡的存在性

29、納什定理納什定理：在一個由n個博弈方的博弈中，如果n是有限的，且都是有限集(對 )，則該博弈至少存在一個納什均衡，但可能包含混合策略。v或者說：每一個有限博弈都至少有一個混合策略納什均衡。v教材106頁證明。主要根據(jù)是布魯威爾和角谷的不動點定理。v納什均衡的普遍存在性正是納什均衡成為非合作博弈分析核心概念的根本原因之一。v奇數(shù)定理（wilson,1971)幾乎所有有限博弈都有有限奇數(shù)個納什均衡（包括混合納什均衡）,;,11nnuuSSGiSni, 1混合納什均衡求解方法v1、支付最大化法v2、支付等值法v3、最優(yōu)反應(yīng)函數(shù)法v純策略納什均衡：在純策略的范疇內(nèi)，最優(yōu)反應(yīng)函數(shù)是各博弈方純策略對其

30、各博弈方純策略的反應(yīng)。純策略納什均衡是博弈方反應(yīng)函數(shù)的交叉點。v混合策略納什均衡：在混合策略的范圍內(nèi)，博弈方的決策為選擇概率分布，最優(yōu)反應(yīng)函數(shù)就是一方對另一方概率分布的反應(yīng)。由于純策略也可以理解為混合策略，因此兩者在最優(yōu)反應(yīng)函數(shù)的概念上可以統(tǒng)一。所以混合策略納什均衡也是博弈方反應(yīng)函數(shù)的交叉點。納什均衡應(yīng)用的局限性v1、有許多博弈不存在純納什均衡（混合策略均衡）v2、有些博弈是多重納什均衡（帕累托上策均衡、風(fēng)險上策均衡、聚點均衡、相關(guān)均衡）v3、博弈方是集體理性或有限理性。（顫抖手均衡）2.6 納什均衡的選擇和分析方法擴展2.6.1 多重納什均衡博弈的分析2.6.2 共謀和防共謀均衡2.6.1

31、多重納什均衡博弈的分析v多重納什均衡的最終結(jié)果取決于某種使參與者產(chǎn)生一致性預(yù)測的機制或判斷標(biāo)準(zhǔn)。v一、帕累托上策均衡v二、風(fēng)險上策均衡v三、聚點均衡v四、相關(guān)均衡一、帕累托上策（優(yōu)勢）均衡帕累托優(yōu)勢標(biāo)準(zhǔn) 按照支付大小篩選出來的納什均衡，比其他納什均衡具有帕累托優(yōu)勢。這種按照帕累托標(biāo)準(zhǔn)篩選出來的標(biāo)準(zhǔn)稱為帕累托優(yōu)勢標(biāo)準(zhǔn)。（鷹鴿博弈）這個博弈中有兩個純策略納什均衡，（戰(zhàn)爭，戰(zhàn)爭）和（和平，和平），顯然后者帕累托優(yōu)于前者，所以，（和平，和平）是本博弈的一個帕累托上策均衡。-5， -5-10， 88， -1010， 10戰(zhàn)爭和平國家國家2戰(zhàn)爭和平國國家家1戰(zhàn)爭與和平戰(zhàn)爭與和平帕累托優(yōu)勢均衡v（10，10

32、）比（-5，-5）具有優(yōu)勢是因為不僅總的收益改善，而且每個人的收益得到改善。二、風(fēng)險上策（優(yōu)勢）均衡考慮、顧忌博弈方、其他博弈方可能發(fā)生錯誤等時，帕累托上策均衡并不一定是最優(yōu)選擇，需要考慮：風(fēng)險上策均衡。下面就是兩個例子。9， 9（A)8， 00， 87， 7(B)LR博弈方博弈方2UD博博弈弈方方1風(fēng)險上策均衡（風(fēng)險上策均衡（D，R）5， 53， 00， 33， 3鹿兔子獵人獵人2鹿兔子獵獵人人1獵鹿博弈風(fēng)險上策均衡（兔子，兔子）風(fēng)險上策均衡（兔子，兔子）風(fēng)險優(yōu)勢策略均衡v期望值判別法：在前景不確定的情況下，期望的結(jié)果如何，即各種可能結(jié)果的平均值如何，是非常重要的判別標(biāo)準(zhǔn)。v判別標(biāo)準(zhǔn)：如果所有博弈方在預(yù)計其它博弈方采用兩種納什均衡的策略的概率相同時，都偏愛某一納什均衡，則該納什均衡就是一個風(fēng)險上策均衡。v偏離損失乘積比較法，簡稱偏離損失比較法。甲偏離A損失乙偏離A損失甲偏離B損失乙偏離B損失此時，均衡策略B比均衡策略A具有風(fēng)險優(yōu)勢。即參與人更不愿意偏離B中的均衡。風(fēng)險上策均衡具有自我強化機制。三、聚點均衡-共識均衡v聚點均衡：在多重納什均衡中，雙方同時選

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第二章完全信息靜態(tài)博弈2016 (2)

文檔簡介

溫馨提示

最新文檔

評論

第二章 完全信息靜態(tài)博弈2016 (2)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第二章完全信息靜態(tài)博弈2016 (2)