第二章 完全信息靜態(tài)博弈2016 (2)_第1頁(yè)
第二章 完全信息靜態(tài)博弈2016 (2)_第2頁(yè)
第二章 完全信息靜態(tài)博弈2016 (2)_第3頁(yè)
第二章 完全信息靜態(tài)博弈2016 (2)_第4頁(yè)
第二章 完全信息靜態(tài)博弈2016 (2)_第5頁(yè)
已閱讀5頁(yè),還剩70頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 完全信息靜態(tài)博弈 本章介紹完全信息靜態(tài)博弈。 完全信息靜態(tài)博弈即各博弈方同時(shí)決策,且所有博弈方對(duì)各方得益都了解的博弈。 囚徒的困境、齊威王田忌賽馬、猜硬幣、石頭剪子布、古諾產(chǎn)量決策都屬于這種博弈。 完全信息靜態(tài)博弈屬于非合作博弈最基本的類(lèi)型。 本章介紹完全信息靜態(tài)博弈的一般分析方法、納什均衡概念、各種經(jīng)典模型及其應(yīng)用等。 本章分六節(jié)2.1基本分析思路和方法2.2納什均衡2.3無(wú)限策略博弈分析和反應(yīng)函數(shù)2.4混合策略和混合策略納什均衡2.5納什均衡的存在性2.6納什均衡的選擇和分析方法擴(kuò)展2.1 基本分析思路和方法2.1.1 上策均衡2.1.2 嚴(yán)格下策反復(fù)消去法2.1.3 劃線(xiàn)法2.1

2、.4 箭頭法2.1.1 上策(優(yōu)勢(shì)策略)及均衡 上策上策:不管其它博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來(lái)的得益始終高于(1)其它的策略,至少不低于(2)其他策略的策略。包括嚴(yán)格上策和弱上策。 囚徒的困境中的“坦白”;雙寡頭削價(jià)中“低價(jià)”。 弱上策(弱優(yōu)勢(shì)策略) 124 103 122 120 112 111 123 81 132甲上中下乙 中 右 右優(yōu)勢(shì)策略均衡(尋找最優(yōu)策略均衡)-5, -50, -8-8, 0-1, -1坦 白不坦白坦 白不坦白囚徒囚徒 2囚囚徒徒1100,10020,150150,2070,70高 價(jià)低 價(jià)高 價(jià)低 價(jià)寡頭寡頭2寡寡頭頭1雙寡頭的得益矩陣 2.1.

3、2 嚴(yán)格下策反復(fù)消去法 嚴(yán)格下策嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個(gè)博弈方帶來(lái)的收益總是比另一種策略給他帶來(lái)的收益小的策略。嚴(yán)格下策反復(fù)消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中劣勢(shì)策略反復(fù)消除法 01 31 10 40 20 02參與人1 上 下 參與人2 左 中 右 嚴(yán)格下策反復(fù)消除法比上策均衡分析的實(shí)用面更大些.2.1.3 劃線(xiàn)法思路思路:找出每一個(gè)博弈方針對(duì)其他博弈方每種策略或策略組合的最佳對(duì)策,然后再找出相互構(gòu)成最佳對(duì)策的各博弈方策略組成的策略組合,也就是博弈的納什均衡。劃線(xiàn)法:劃線(xiàn)法:通過(guò)在每個(gè)博弈方對(duì)其他博弈方每個(gè)策

4、略或策略組合的最佳對(duì)策對(duì)應(yīng)的得益下劃線(xiàn),分析博弈的方法稱(chēng)為“劃線(xiàn)法”。劃線(xiàn)法以策略之間的相對(duì)優(yōu)劣關(guān)系為基礎(chǔ),因此在分析用得益矩陣表示的博弈問(wèn)題時(shí)具有普遍的實(shí)用性。2.1.3 劃線(xiàn)法1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬幣幣2, 10, 00, 01, 3夫夫妻妻之之爭(zhēng)爭(zhēng)上下 左 中 右均衡:給定一方采用該策略組合中的策略,則另一方也愿意采用該策略組合中的策略,該策略組合具有穩(wěn)定性。2.1.4 箭頭法箭頭法的基本思路思路是對(duì)博弈中的每個(gè)策略組合進(jìn)行分析,考察在每個(gè)策略組合處各個(gè)博

5、弈方能否單獨(dú)改變自己的策略而增加得益。如能,則從所分析的策略組合對(duì)應(yīng)的得益數(shù)組引一箭頭,到改變策略后策略組合的得益數(shù)組。最后綜合對(duì)每個(gè)策略組合的分析情況,形成對(duì)博弈結(jié)果的判斷。箭頭法:通過(guò)反映各博弈方選擇傾向的箭頭,尋找博弈中具有穩(wěn)定性具有穩(wěn)定性的策略組合的方法,就是箭頭法。2.1.4 箭頭法1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬幣幣2, 10, 00, 01, 3夫夫妻妻之之爭(zhēng)爭(zhēng)箭頭法注意事項(xiàng)v1、應(yīng)用箭頭法,要注意箭尾的數(shù)字一定比肩頭的小。v2、只有在單獨(dú)該策略選擇給當(dāng)事人

6、帶來(lái)更高的支付的時(shí)候,才畫(huà)相應(yīng)的箭頭。2.2 納什均衡2.2.1 納什均衡的定義2.2.2 納什均衡的一致預(yù)測(cè)性質(zhì)2.2.3 納什均衡與嚴(yán)格下策反復(fù)消去法2.2.1 相對(duì)優(yōu)勢(shì)策略均衡與納什均衡v相對(duì)優(yōu)勢(shì)策略均衡:與嚴(yán)格優(yōu)勢(shì)策略均衡和弱優(yōu)勢(shì)策略均衡不同,參與人的相對(duì)優(yōu)勢(shì)策略,是在他的對(duì)手選定某個(gè)策略的條件下他的優(yōu)勢(shì)策略。相對(duì)優(yōu)勢(shì)策略的組合稱(chēng)為相對(duì)優(yōu)勢(shì)策略均衡。v策略空間:v博弈方 的第 個(gè)策略:v博弈方 的得益:v博弈:nSS ,1ijiSsiu,;,11nnuuSSGiij納什均衡納什均衡:在博弈 中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合 中,任一博弈方 的策略,都是對(duì)其余博弈方策略

7、的組合 的最佳對(duì)策,也即 對(duì)任意 都成立,則稱(chēng) 為 的一個(gè)納什,;,11nnuuSSG),(*niss i),.,(*1*1*1niissss),.,(),.,(*1*1*1*1*1*1niijiiniiiisssssusssssuijiSs),(*nissG納什均衡的說(shuō)明v1、參與人單獨(dú)改變策略不會(huì)得到好處的策略組合,(或者說(shuō)具有相互是對(duì)其他各方最優(yōu)對(duì)策的策略組合)就叫做納什均衡。v2、納什均衡是策略組合,而不是參與人策略組合下的相應(yīng)的支付。v3、一個(gè)策略組合要成為博弈的納什均衡,必須在這個(gè)策略組合下所有參與人都沒(méi)有單獨(dú)改變策略選擇的動(dòng)機(jī);但要論證一個(gè)策略組合不是博弈的納什均衡,只要指出在這

8、個(gè)策略組合下有一個(gè)博弈參與人有單獨(dú)改變策略選擇的動(dòng)機(jī)就足夠了。2.2.2 納什均衡的一致預(yù)測(cè)性質(zhì)一致預(yù)測(cè)一致預(yù)測(cè):如果所有博弈方都預(yù)測(cè)一個(gè)特定博弈結(jié)果會(huì)出現(xiàn),所有博弈方都不會(huì)利用該預(yù)測(cè)或者這種預(yù)測(cè)能力選擇與預(yù)測(cè)結(jié)果不一致的策略,即沒(méi)有哪個(gè)博弈方有偏離這個(gè)預(yù)測(cè)結(jié)果的愿望,因此預(yù)測(cè)結(jié)果會(huì)成為博弈的最終結(jié)果。 “預(yù)測(cè)一致”是指博弈方的實(shí)際行為選擇與他們的預(yù)測(cè)一致,而不是不同博弈方的預(yù)測(cè)結(jié)果相同或無(wú)差異。納什均衡一致預(yù)測(cè)屬性的論證v1、預(yù)測(cè)的結(jié)果是某個(gè)納什均衡,則預(yù)測(cè)的結(jié)果肯定是實(shí)際的結(jié)果。v2、預(yù)測(cè)的某個(gè)策略組合是博弈結(jié)果,則該策略組合一定是納什均衡。v只有納什均衡才具有一致預(yù)測(cè)的性質(zhì)v一致預(yù)測(cè)性是

9、納什均衡的本質(zhì)屬性v一致預(yù)測(cè)并不意味著一定能準(zhǔn)確預(yù)測(cè),因?yàn)橛卸嘀鼐?。納什均衡的一致預(yù)測(cè)性質(zhì)并不能保證各個(gè)博弈方的預(yù)測(cè)是相同的,相同的預(yù)測(cè)是一致預(yù)測(cè)的前提而不是結(jié)果。2.2.3 納什均衡與嚴(yán)格下策反復(fù)消去法v上策均衡肯定是納什均衡,但納什均衡不一定是上策均衡v命題命題2.1:在n個(gè)博弈方的博弈 中,如果嚴(yán)格下策反復(fù)消去法排除了除 之外的所有策略組合,那么 一定是該博弈的唯一的納什均衡 命題命題2.2:在n個(gè)博弈方的博弈中 中,如果一個(gè)策略組合 是 的一個(gè)納什均衡,那么嚴(yán)格下策反復(fù)消去法一定不會(huì)將它消去。 上述兩個(gè)命題保證在進(jìn)行納什均衡分析之前先通過(guò)嚴(yán)格下策反復(fù)消去法簡(jiǎn)化博弈是可行的),(*ni

10、ss,;,11nnuuSSG),(*niss),(*niss,;,11nnuuSSGG弱劣勢(shì)策略消除法v 600800 00 10000 10000 公明博弈公明要求看不要求看 裝修行給看 不給看弱劣勢(shì)策略消除會(huì)遺漏納什均衡作為”最終歸宿”的納什均衡 22 13 20 31 22 23 02 32 22甲ABC 乙 a b c 最后歸宿博弈最后歸宿博弈-下劃線(xiàn)法下劃線(xiàn)法納什均衡是理性博弈的歸宿2.3 無(wú)限策略分析和反應(yīng)函數(shù)2.3.1 古諾的寡頭模型2.3.2 反應(yīng)函數(shù)2.3.3 伯特蘭德寡頭模型2.3.4 公共資源問(wèn)題2.3.5 反應(yīng)函數(shù)的問(wèn)題和局限性本節(jié)研究具有無(wú)限多策略,有連續(xù)策略空間或可

11、以看作有連續(xù)策略空間的博弈模型2.3.1 古諾的寡頭模型基本假設(shè): 產(chǎn)品同質(zhì)兩廠(chǎng)商以產(chǎn)量為決策內(nèi)容212116qqqq221cc222126qqqq求解思路:求解思路:定義法思路:定義法思路:只要兩博弈方的策略組合(q1*,q2*),滿(mǎn)足其中的q1*,q2*相互是對(duì)對(duì)方的最佳對(duì)策,就構(gòu)成一個(gè)納什均衡,如果該均衡是唯一的,則它一般也是博弈的結(jié)果。均衡(2,2)收益(4,4)QQPPqqQ8)(21121111112)(8)(qqqqqcQPqu221222222)(8)(qqqqqcQPqu4.5,4.55,3.753.75,54,4不突破突破廠(chǎng)商廠(chǎng)商2不突破 突破廠(chǎng)廠(chǎng)商商1以自身最大利益為目標(biāo)

12、:各生產(chǎn)2單位產(chǎn)量,各自得益為4以?xún)蓮S(chǎng)商總體利益最大:各生產(chǎn)1.5單位產(chǎn)量,各自得益為4.5兩寡頭市場(chǎng)評(píng)價(jià)囚徒困境博弈2.3.2 反應(yīng)函數(shù) 古諾模型的納什均衡也可以利用劃線(xiàn)法的思路求解,只是博弈方的對(duì)策是無(wú)窮的。)6()()6()()6max(max1211222212112121111qqRqqqRqqqqquq 對(duì)一個(gè)一般的博弈,只要得益是策略的的多元連續(xù)函數(shù),我們就可以求每個(gè)博弈方針對(duì)其他博弈方策略的最佳反應(yīng)構(gòu)成的函數(shù),也就是反應(yīng)函數(shù),而接觸的各個(gè)博弈方反映函數(shù)的交點(diǎn)就是納什均衡。這種利用反映函數(shù)求博弈的納什均衡的方法稱(chēng)為“反應(yīng)函數(shù)法”。q2q1 圖解動(dòng)態(tài)收斂過(guò)程R1: q1=(6-q2

13、)/2R2: q2=(6-q1)/22.3.3 伯特蘭德寡頭模型v基本假設(shè):基本假設(shè):兩廠(chǎng)商、產(chǎn)品有差別兩廠(chǎng)商、產(chǎn)品有差別,消費(fèi)者對(duì)價(jià)格不十分敏,消費(fèi)者對(duì)價(jià)格不十分敏感,廠(chǎng)商策略空間感,廠(chǎng)商策略空間0,Pmax1, 0,Pmax2122222122211112111),(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP)(21)(21*122222*2*211111*1PdcbabPPdcbabPd1代表產(chǎn)品2對(duì)產(chǎn)品1的替代程度。

14、均衡解)(42)(42)(42)(4222212111112121211121212222212111cbaddbbbcbaddbbdPcbaddbbbcbaddbbdP2.3.4 公共資源問(wèn)題公共草地養(yǎng)羊問(wèn)題QQVVqqQn100)(1以三農(nóng)戶(hù)為例 n=3,c=4cqQVquiii)(核心的內(nèi)容:論證公共資源使用的低效核心的內(nèi)容:論證公共資源使用的低效3321332321221321114)(1004)(1004)(100qqqqquqqqqquqqqqqu323211212148),(qqqqRq313122212148),(qqqqRq212133212148),(qqqqRq17287

15、257624*3*2*1*3*2*1*3*2*1uuuQuuuqqq競(jìng)爭(zhēng):個(gè)體利益最大化競(jìng)爭(zhēng):個(gè)體利益最大化480296964)100(2QQQuQQQQQu合作:總體利益最大化合作:總體利益最大化1728576323047224348uQ1、說(shuō)明非合作博弈的結(jié)果可能是低效率的。2、解釋公地悲劇的原因:每個(gè)可以利用公共資源的人都相當(dāng)于面臨著一種囚徒困境:在總體上有加大資源利用的可能時(shí),自己加大利用而其他人不加大利用則自己得利,自己加大而其他人也加大利用時(shí),自己不至于吃虧,所以,加大利用是各博弈方的優(yōu)勢(shì)策略,優(yōu)勢(shì)策略的均衡導(dǎo)致資源的過(guò)渡利用。2.3.5 反應(yīng)函數(shù)的問(wèn)題和局限性v在許多博弈中,博弈

16、方的策略是有限且非連續(xù)時(shí),其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù),無(wú)法求得反應(yīng)函數(shù),從而不能通過(guò)解方程組的方法求得納什均衡。v即使得益函數(shù)可以求導(dǎo),也可能各博弈方的得益函數(shù)比較復(fù)雜,因此各自的反應(yīng)函數(shù)也比較復(fù)雜,并不總能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn),特別不能保證有唯一的交點(diǎn)。2.4 混合策略和混合策略納什均衡2.4.1 嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn)2.4.2 多重均衡博弈和混合策略2.4.3 混合策略和嚴(yán)格下策反復(fù)消去法2.4.4 混合策略反應(yīng)函數(shù)本節(jié)研究不存在納什均衡和存在多重納什均衡的博弈2.4.1 嚴(yán)格競(jìng)爭(zhēng)博弈和混合策略的引進(jìn)嚴(yán)格競(jìng)爭(zhēng)博弈:各博弈方的利益和偏好始終不一致.一、猜硬幣博弈-1, 11,

17、 -11, -1-1, 1正 面反 面猜硬幣方猜硬幣方蓋蓋硬硬幣幣方方正 面反 面(1)不存在前面定義的納什均衡策略組合(2)策略的選擇與各方的利益仍然息息相關(guān). (3) 策略選擇的關(guān)鍵:選擇的隨機(jī)性, 以及重視策略選擇的概率分布,即不能讓對(duì)方猜到自己策略 混合博弈的特征v1、在這類(lèi)博弈中,不存在純策略納什均衡。 (純策略:它給每個(gè)參與人具體明確了一個(gè)非隨機(jī)性的行動(dòng)計(jì)劃?;旌喜呗詣t表明,參與人可以按照一定的概率,隨機(jī)地從純策略集合中選擇一種純策略作為實(shí)際的行動(dòng)。所以混和策略的均衡結(jié)果不是雙方選擇策略空間中哪個(gè)策略,而是以怎樣的概率選擇這些策略。)v2、參與人的收益不僅取決于自己的策略,也取決于

18、其他參與人的策略,而自己與其他參與人以某種概率隨機(jī)選擇不同的行為。v3、每個(gè)參與人都想猜透對(duì)方的策略,而每個(gè)參與人又都不想讓對(duì)方猜透自己的策略。策略、純策略、混合策略的區(qū)別v策略:參與人在給定信息集的情況下選擇行動(dòng)計(jì)劃。他規(guī)定參與人在什么情況下選擇什么行動(dòng),是參與人相機(jī)行動(dòng)的方案。v純策略:如果一個(gè)策略規(guī)定參與人在每種給定信息情況下只選擇一種特定的行動(dòng),稱(chēng)為純策略,或簡(jiǎn)稱(chēng)策略。即參與人在策略空間中選取唯一確定的策略。 v混合策略:如果一個(gè)策略規(guī)定參與人在每種給定信息的情況下,以某種概率分布隨機(jī)選取不同的行動(dòng),稱(chēng)為混合策略。參與人選取的不是策略空間中唯一明確的策略,而是其策略空間上的概率分布。v

19、參與人選取混合策略的原因: 主觀(guān)上猶豫不決,客觀(guān)條件的不確定性,以及策略需要。二、混合策略、混合策略博弈 和混合策略納什均衡 混合策略混合策略:在博弈 中,假設(shè)博弈方 的純策略空間為 ,則博弈方 隨機(jī)在其 個(gè)可選策略中選擇的“策略”的概率分布 ,稱(chēng)為博弈方i 的 “混合策略”,其中 , 。 混合策略博弈混合策略博弈:博弈方在混合策略的策略空間(概率分布空間)的選擇看作一個(gè)博弈,就是原博弈的“混合策略博弈”。 ,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ikpkkikp11混合策略納什均衡v由于混合策略伴隨的是支付的不確定性,所以參與人關(guān)心的是期望效用(期望支付)。

20、博弈方的期望支付是混合策略組合的函數(shù),記為:,或者v混合策略納什均衡:是博弈方相對(duì)最優(yōu)混合策略的組合。相對(duì)最優(yōu)策略是指在給定對(duì)方混合策略的情況下,使自身期望效用達(dá)到最大的混合策略。數(shù)學(xué)表達(dá)為:設(shè)是n人策略式博弈的一個(gè)混合策略組合。如果對(duì)于所有的i=1,2, n,每一個(gè)pi都成立,則稱(chēng)該混合策略組合是這個(gè)博弈的一個(gè)納什均衡。),(1niiippp),(iiiipp*),()*,(iiiiiiipppp)*,*,*,(*1nipppp三、一個(gè)例子該博弈無(wú)純策略納什均衡,可用混合策略納什均衡分析2, 35, 23, 11, 5CDAB博弈方博弈方2博博弈弈方方1均衡求解5213BABApppp135

21、2DCDCpppp博弈方1的最優(yōu)混合策略博弈方2的最優(yōu)混合策略 均衡策略 得益博弈方1 (0.8,0.2) 2.6博弈方2 (0.8,0.2) 2.6用反證法證明混合納什均衡的求解思路v1、不能讓對(duì)方知道或猜到自己的選擇,因而必須在決策時(shí)利用隨機(jī)性。v2、參與方選擇每中策略的概率一定要恰好使對(duì)方無(wú)機(jī)可乘,即讓對(duì)方無(wú)法通過(guò)針對(duì)性地傾向某一策略而在博弈中占上風(fēng)。v上例中博弈方1以(0.8,0.2)概率選擇A和B,博弈方2以(0.8,0.2)概率選擇C和D,由于誰(shuí)都無(wú)法通過(guò)單獨(dú)改變自己隨機(jī)選擇的概率分布改善自己的期望得益,因此這個(gè)混合策略組合是穩(wěn)定的。是本博弈唯一的納什均衡。四、齊威王田忌賽馬3,-

22、31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下pa上中下pb上中下pc上中下pd上中下pe上中下pf上中下g上中下h上中下i上中下j上中下k上中下l田田 忌忌齊齊威威王王得益矩陣齊威王的均衡策略(1/6,1/6,1/6,1/6,1/6,1/6),田忌的均衡策略(1/6,1/6,1/6,1/6,1/6,1/6),均衡時(shí)期望得益(1,-1)五、小偷和守衛(wèi)的博

23、弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)守衛(wèi)小小偷偷加重對(duì)守衛(wèi)的處罰:短期中的效果是使守衛(wèi)真正盡職在長(zhǎng)期中并不能使守衛(wèi)更盡職,但會(huì)降低盜竊發(fā)生的概略0- D- D守衛(wèi)得益(睡)SPt 小偷偷的概率1V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)守衛(wèi)小小偷偷加重對(duì)小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率長(zhǎng)期并不能降低盜竊發(fā)生率,但會(huì)是的守衛(wèi)更多的偷懶0- P- P小偷得益(偷)VPg 守衛(wèi)睡的概率12.4.2 多重均衡博弈和混合策略一、夫妻之爭(zhēng)的混合策略納什均衡2, 10, 00, 01, 3時(shí) 裝足 球時(shí)裝足球丈丈 夫夫妻妻子子夫妻之爭(zhēng)夫妻之爭(zhēng)v妻子的混合策略妻子的概率選擇要 使丈夫的兩種策略預(yù)

24、期收益相等v丈夫的混合策略同上3)(0)(0)(1)(FpCpFpCpwwww1)(0)(0)(2)(FpCpFpCphhhh 妻子的混合策略 丈夫的混合策略 v夫妻之爭(zhēng)博弈的混合策略納什均衡v 策略 得益v博弈方1 (0.75,0.25) 0.67v博弈方2 (1/3,2/3) 0.75v現(xiàn)實(shí)意義:缺乏溝通可能出現(xiàn)最差的結(jié)果?,F(xiàn)實(shí)意義:缺乏溝通可能出現(xiàn)最差的結(jié)果。 二、制式問(wèn)題 制式問(wèn)題混合策略納什均衡 A B 得益廠(chǎng)商1: 0.4 0.6 0.664廠(chǎng)商2: 0.67 0.33 1.2961, 30, 00, 02, 2ABAB廠(chǎng)商廠(chǎng)商2廠(chǎng)廠(chǎng)商商1制式問(wèn)題制式問(wèn)題現(xiàn)實(shí)意義:技術(shù)引進(jìn)、投資、

25、開(kāi)發(fā)產(chǎn)品等問(wèn)題中,具有協(xié)同利益的不同廠(chǎng)商各自為政的行為方式常常會(huì)導(dǎo)致低效率(純納什均衡解優(yōu)于混合策略解)。 三、市場(chǎng)機(jī)會(huì)博弈 進(jìn) 不進(jìn) 得益廠(chǎng)商1: 2/3 1/3 0廠(chǎng)商2: 2/3 1/3 0-50,-50100,00,1000,0進(jìn)不 進(jìn)進(jìn)不進(jìn)廠(chǎng)商廠(chǎng)商2廠(chǎng)廠(chǎng)商商1市場(chǎng)機(jī)會(huì)博弈市場(chǎng)機(jī)會(huì)博弈現(xiàn)實(shí)意義:現(xiàn)實(shí)意義:1、按照群體行為理解,在新興市場(chǎng)的進(jìn)入博弈問(wèn)題中,有2/3廠(chǎng)商會(huì)選擇進(jìn),1/3廠(chǎng)商會(huì)選擇不進(jìn)。2、純粹的市場(chǎng)競(jìng)爭(zhēng)并不都是高效率的,如果在市場(chǎng)競(jìng)爭(zhēng)中結(jié)合一定的協(xié)商機(jī)制,(利益補(bǔ)償機(jī)制),市場(chǎng)的效率會(huì)更高。(該博弈中純納什均衡的整體社會(huì)效率高,但現(xiàn)實(shí)中這種博弈結(jié)果不是很穩(wěn)定?;旌喜呗跃饨?/p>

26、2.4.3 混合策略和嚴(yán)格下策反復(fù)消去法3, 10, 20, 23, 31, 31, 1LRUMD博弈方博弈方2博博弈弈方方123212111003eu23212111030eu博弈方2采用純策略L(fǎng)時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用純策略R時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益混合策略和嚴(yán)格下策反復(fù)消去法v1、任何博弈方都不會(huì)采用任何嚴(yán)格下策,不管它們是純策略還是混合策略;(各種策略相互比較消去相對(duì)劣勢(shì)策略。)v2、嚴(yán)格下策反復(fù)消去法不會(huì)消去納什均衡,包括純策略納什均衡和混合納什均衡;v3、如果經(jīng)過(guò)反復(fù)消去后留下來(lái)的策略組合是唯一的,那么一定是納什均

27、衡。 13 20 20 33博弈方2 L R博弈方1Um假設(shè)的前提:博弈方是風(fēng)險(xiǎn)中型的,則E=3/21,如果是風(fēng)險(xiǎn)厭惡型的則不一定。均衡解為(M,R)2.4.4 混合策略反應(yīng)函數(shù)法猜硬幣博弈-1, 11, -11, -1-1, 1正 面q反 面1-q猜硬幣方猜硬幣方正面r反面1-r猜硬幣博弈猜硬幣博弈蓋蓋硬硬幣幣方方反應(yīng)函數(shù)即一博弈方對(duì)另一博弈方每種可能的決策內(nèi)容的最佳反應(yīng)決策構(gòu)成的函數(shù)?;旌喜呗苑磻?yīng)函數(shù)rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布)(2rRq )(1qRr 混合策略反應(yīng)函數(shù):一方對(duì)另一方概率分布的

28、反應(yīng)?;旌喜呗苑磻?yīng)函數(shù):一方對(duì)另一方概率分布的反應(yīng)。U1=2r(1-2q)+(2q-1) U2=2q(2r-1)-(2r-1) 0 q1/2r= 0,1 q=1/2 1 q1/2q= 0,1 r=1/2 0 p1/2夫妻之爭(zhēng)博弈2, 10, 00, 01, 3時(shí)裝q足球1-q丈夫丈夫時(shí)裝r足球1-r妻妻子子夫妻之爭(zhēng)夫妻之爭(zhēng)rq111/33/4(r,1-r):妻子的混合策略概率分布(q,1-q):丈夫的混合策略概率分布)(2rRq )(1rRr U1=3r(q-1/3)+(1-q)U2=4q(r-3/4)+(1-r)(r=3/4,q=1/3)(E1=2/3,E2=1/4)2.5 納什均衡的存在性

29、納什定理納什定理:在一個(gè)由n個(gè)博弈方的博弈 中,如果n是有限的,且 都是有限集(對(duì) ),則該博弈至少存在一個(gè)納什均衡,但可能包含混合策略。v或者說(shuō):每一個(gè)有限博弈都至少有一個(gè)混合策略納什均衡。v教材106頁(yè)證明。主要根據(jù)是布魯威爾和角谷的不動(dòng)點(diǎn)定理。v納什均衡的普遍存在性正是納什均衡成為非合作博弈分析核心概念的根本原因之一。v奇數(shù)定理(wilson,1971)幾乎所有有限博弈都有有限奇數(shù)個(gè)納什均衡(包括混合納什均衡),;,11nnuuSSGiSni, 1混合納什均衡求解方法v1、支付最大化法v2、支付等值法v3、最優(yōu)反應(yīng)函數(shù)法v純策略納什均衡:在純策略的范疇內(nèi),最優(yōu)反應(yīng)函數(shù)是各博弈方純策略對(duì)其

30、各博弈方純策略的反應(yīng)。純策略納什均衡是博弈方反應(yīng)函數(shù)的交叉點(diǎn)。v混合策略納什均衡:在混合策略的范圍內(nèi),博弈方的決策為選擇概率分布,最優(yōu)反應(yīng)函數(shù)就是一方對(duì)另一方概率分布的反應(yīng)。由于純策略也可以理解為混合策略,因此兩者在最優(yōu)反應(yīng)函數(shù)的概念上可以統(tǒng)一。所以混合策略納什均衡也是博弈方反應(yīng)函數(shù)的交叉點(diǎn)。納什均衡應(yīng)用的局限性v1、有許多博弈不存在純納什均衡(混合策略均衡)v2、有些博弈是多重納什均衡(帕累托上策均衡、風(fēng)險(xiǎn)上策均衡、聚點(diǎn)均衡、相關(guān)均衡)v3、博弈方是集體理性或有限理性。(顫抖手均衡)2.6 納什均衡的選擇和分析方法擴(kuò)展2.6.1 多重納什均衡博弈的分析2.6.2 共謀和防共謀均衡2.6.1

31、多重納什均衡博弈的分析v多重納什均衡的最終結(jié)果取決于某種使參與者產(chǎn)生一致性預(yù)測(cè)的機(jī)制或判斷標(biāo)準(zhǔn)。v一、帕累托上策均衡v二、風(fēng)險(xiǎn)上策均衡v三、聚點(diǎn)均衡v四、相關(guān)均衡一、帕累托上策(優(yōu)勢(shì))均衡帕累托優(yōu)勢(shì)標(biāo)準(zhǔn) 按照支付大小篩選出來(lái)的納什均衡,比其他納什均衡具有帕累托優(yōu)勢(shì)。這種按照帕累托標(biāo)準(zhǔn)篩選出來(lái)的標(biāo)準(zhǔn)稱(chēng)為帕累托優(yōu)勢(shì)標(biāo)準(zhǔn)。(鷹鴿博弈)這個(gè)博弈中有兩個(gè)純策略納什均衡,(戰(zhàn)爭(zhēng),戰(zhàn)爭(zhēng))和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個(gè)帕累托上策均衡。-5, -5-10, 88, -1010, 10戰(zhàn)爭(zhēng)和平國(guó)家國(guó)家2戰(zhàn)爭(zhēng)和平國(guó)國(guó)家家1戰(zhàn)爭(zhēng)與和平戰(zhàn)爭(zhēng)與和平帕累托優(yōu)勢(shì)均衡v(10,10

32、)比(-5,-5)具有優(yōu)勢(shì)是因?yàn)椴粌H總的收益改善,而且每個(gè)人的收益得到改善。二、風(fēng)險(xiǎn)上策(優(yōu)勢(shì))均衡 考慮、顧忌博弈方、其他博弈方可能發(fā)生錯(cuò)誤等時(shí),帕累托上策均衡并不一定是最優(yōu)選擇,需要考慮:風(fēng)險(xiǎn)上策均衡。下面就是兩個(gè)例子。9, 9(A)8, 00, 87, 7(B)LR博弈方博弈方2UD博博弈弈方方1風(fēng)險(xiǎn)上策均衡(風(fēng)險(xiǎn)上策均衡(D,R)5, 53, 00, 33, 3鹿兔子獵人獵人2鹿兔子獵獵人人1獵鹿博弈風(fēng)險(xiǎn)上策均衡(兔子,兔子)風(fēng)險(xiǎn)上策均衡(兔子,兔子)風(fēng)險(xiǎn)優(yōu)勢(shì)策略均衡v期望值判別法:在前景不確定的情況下,期望的結(jié)果如何,即各種可能結(jié)果的平均值如何,是非常重要的判別標(biāo)準(zhǔn)。v判別標(biāo)準(zhǔn):如果所有博弈方在預(yù)計(jì)其它博弈方采用兩種納什均衡的策略的概率相同時(shí),都偏愛(ài)某一納什均衡,則該納什均衡就是一個(gè)風(fēng)險(xiǎn)上策均衡。v偏離損失乘積比較法,簡(jiǎn)稱(chēng)偏離損失比較法。 甲偏離A損失乙偏離A損失甲偏離B損失乙偏離B損失 此時(shí),均衡策略B比均衡策略A具有風(fēng)險(xiǎn)優(yōu)勢(shì)。即參與人更不愿意偏離B中的均衡。 風(fēng)險(xiǎn)上策均衡具有自我強(qiáng)化機(jī)制。三、聚點(diǎn)均衡-共識(shí)均衡v聚點(diǎn)均衡:在多重納什均衡中,雙方同時(shí)選

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論