博弈論第4講課件

上傳人：r*** IP屬地：貴州上傳時間：2022-10-11 格式：PPTX 頁數(shù)：69 大小：436.68KB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩64頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、上次內(nèi)容回顧Best Response點球博弈合作博弈納什均衡（一致預測性、selfenforcing）納什定理劃線法箭頭法1上次內(nèi)容回顧Best Response1 納什均衡是一種策略組合，當所有參與人都公開自己的策略后，每個人都滿意自己的選擇；如果偏離納什均衡，沒有人會得到更好的收益。2 納什均衡是一種策略組合，當所有參與人都公開自己的策投資博弈參與人：全體同學策略：不投資、投資10元收益：不投資，收益為0元；如果90%以上，各投資人收益為15元；如果低于90%，各投資人收益為-10元。此博弈的NE是什么？3投資博弈參與人：全體同學3NE（1）都投資（2）都不投資4NE（1）都投資4位

2、置模型（社會學）參與人：說廣東話的，100 000人說上海話的，100 000人策略：選A鎮(zhèn)和B鎮(zhèn)，各容納10萬人收益：如下頁圖。5位置模型（社會學）參與人：說廣東話的，100 000人 66同時選擇，如果超出限額，隨機分配（如，15萬人選A，則選A的人有2/3機會滿足愿望。）。給定初始位置，類型帶狀分布，博弈幾次結(jié)束后，呈隔離狀態(tài)。7同時選擇，如果超出限額，隨機分配（如，15萬人選A，則選A的NE隔離狀態(tài)完全混合全部選一個，然后隨機分配8NE隔離狀態(tài)89按競爭程度劃分的市場類型： A 完全競爭市場 B 寡頭競爭市場 C 獨家壟斷市場卡特爾古諾模型（Cournot Model of Duo

3、poly）9按競爭程度劃分的市場類型：古諾模型（Cournot Mod10市場類型不同，廠商的行為特征不同。A與C型，廠商的決策都是個體優(yōu)化決策。B型，寡頭壟斷競爭的本質(zhì)是博弈。他們的行為既影響自身，又影響對方。盡管兩寡頭由于壟斷能給他們帶來一些共同的利益，但是他們的根本利益并不是完全一致的。10市場類型不同，廠商的行為特征不同。11古諾模型這里考慮連續(xù)形式的古諾模型兩個企業(yè)，分別表示為企業(yè)1、企業(yè)2每個企業(yè)的策略是選擇產(chǎn)量（用qi表示）收益是利潤（用i表示），是兩個企業(yè)產(chǎn)量的函數(shù)，生產(chǎn)成本與產(chǎn)量有關(guān)，用Ci(qi)表示，市場出清價格為P=P(q1+q2)第i個企業(yè)的利潤函數(shù)為：i=qi P(

4、q1+q2) Ci (qi), i=1, 211古諾模型這里考慮連續(xù)形式的古諾模型12（q1*, q2*）是均衡產(chǎn)量意味著：q1*argmax1(q1, q2*)q2*argmax2(q1*, q2)根據(jù)上面兩個式子可以得出反應(yīng)函數(shù)(reaction function)：q1*=R1(q2)q2*=R2(q1)兩個反應(yīng)函數(shù)的交叉點就是納什均衡（q1*, q2*），見圖古諾模型12（q1*, q2*）是均衡產(chǎn)量意味著：古諾模型13q2q1古諾模型的納什均衡NE古諾模型R2R113q2q1古諾模型的納什均衡NE古諾模型R2R114古諾模型實際驗證假定每個企業(yè)具有相同的不變單位成本，即C1(q1)=

5、q1c, C2(q2)=q2c，價格出清函數(shù)取線性形式： P=a-(q1+q2)。根據(jù)q1*argmax1(q1, q2*) = q1P(q1+q2*) C1(q1) q2*argmax2(q1*, q2) = q2P(q1*+q2) C2(q2)通過求一階導數(shù)，得14古諾模型實際驗證15于是可得到反應(yīng)函數(shù)為：古諾模型15于是可得到反應(yīng)函數(shù)為：古諾模型16從而求出古諾模型16從而求出古諾模型17古諾模型進而可以得出每個企業(yè)的納什均衡產(chǎn)量下的利潤，為可以同壟斷企業(yè)的最優(yōu)決策類比17古諾模型進而可以得出每個企業(yè)的納什均衡產(chǎn)量下的利潤，為可18古諾模型壟斷條件下的最優(yōu)產(chǎn)量，可同過計算Q*argmax

6、=Q*(a-Q*-c)求出最優(yōu)的產(chǎn)量值壟斷條件下的最優(yōu)利潤為最優(yōu)納什均衡總產(chǎn)量最優(yōu)納什均衡利潤總和18古諾模型壟斷條件下的最優(yōu)產(chǎn)量，可同過計算壟斷條件下的最優(yōu)19古諾模型古諾模型的啟示寡頭競爭的總產(chǎn)量大于壟斷競爭產(chǎn)量的原因在于每個企業(yè)在選擇自己的最優(yōu)產(chǎn)量時，只考慮對本企業(yè)利潤的影響，而忽視對另一個企業(yè)的外部負效應(yīng)。這是一個典型的囚徒困境從另一個層面我們也了解到為什么國外有反壟斷法，為什么有微軟分拆事件。19古諾模型古諾模型的啟示20豪太林(Hotelling)價格競爭模型古諾模型中，產(chǎn)品是同質(zhì)的（homogenous)；豪泰林模型中，引入了產(chǎn)品的差異性；產(chǎn)品的差異性可以有很多體現(xiàn)形式：如品牌、

7、外觀、功能、空間差別（如房地產(chǎn)）豪泰林模型中，產(chǎn)品的差異通過空間差別來體現(xiàn)豪泰林模型的主要假設(shè)是產(chǎn)品的差異完全是由空間位置的不同而造成的20豪太林(Hotelling)價格競爭模型古諾模型中，產(chǎn)品21豪太林(Hotelling)價格競爭模型模型描述假定有一個長度為1的線性城市，消費者均勻地分布在0,1區(qū)間上。假定有兩個商店，分別位于城市的兩端，商店1在x=0處，商店2在x=1處，出售完全相同的產(chǎn)品每個商店提供單位產(chǎn)品的成本為c，消費者購買商品的旅行成本與離商店的距離成正比，單位距離的成本為t假定消費者有單位需求：要么消費1單位，要么消費0個單位（如住房消費）。消費者從消費中得到的消費者剩余為s

8、。21豪太林(Hotelling)價格競爭模型模型描述22納什均衡分析假定兩個商店同時選擇自己的銷售價格。假定消費者剩余s相對于購買總成本（價格加旅行費用）足夠大從而所有消費者都購買一個單位的產(chǎn)品令pi為商店i的價格，Di ( p1, p2)為需求函數(shù)，i=1, 2豪太林(Hotelling)價格競爭模型22納什均衡分析豪太林(Hotelling)價格競爭模型23豪太林(Hotelling)價格競爭模型如果住在x的消費者在兩個商店之間是無差異的，那么，所有住在x左邊的將都在商店1購買，而住在x右邊的將在商店2購買，需求比例分別是D1=x, D2=1-x。這里的x滿足：p1+tx=p2+t(1-

9、x)解上面兩個式子，可得出需求函數(shù)為23豪太林(Hotelling)價格競爭模型如果住在x的消費24豪太林(Hotelling)價格競爭模型利潤函數(shù)分別為24豪太林(Hotelling)價格競爭模型利潤函數(shù)分別為25豪太林(Hotelling)價格競爭模型通過一階導數(shù)法，可以求出兩個企業(yè)的最優(yōu)價格，為均衡價格下，每個企業(yè)的最優(yōu)利潤為25豪太林(Hotelling)價格競爭模型通過一階導數(shù)法，26可以進一步設(shè)想，若兩個商店為了爭奪顧客源，可以自由選擇商店位置，那么可以計算，納什均衡位置在0,1區(qū)間的中點0.5處，即最終兩個商店匯聚一點；這在一定程度上可以說明，為什么商店通常都聚集在一處的原因。此

10、時可以算出均衡價格和利潤分別是豪太林(Hotelling)價格競爭模型26可以進一步設(shè)想，若兩個商店為了爭奪顧客源，可以自由選擇商27前面介紹的納什均衡分析方法對于相當多一類博弈問題無能為力。石頭剪子布博弈，不存在已經(jīng)定義的各種均衡混合策略的提出27前面介紹的納什均衡分析方法混合策略的提出282829混合策略的提出利用生活經(jīng)驗不難知道，分別以1/3的概率出招是最佳決策這就引出了用概率來確定采用何種策略的方法，這就是混合策略(mixed strategies)概念的由來在此之前所說的策略，實質(zhì)上是以概率1選取某個確定的策略或行動，我們稱之為純策略 (pure strategies)29混合策略的

11、提出利用生活經(jīng)驗不難知道，分別以1/3的概率出A mixed strategy Piis a randomization over is pure strategies.30A mixed strategy Piis a rando31混合策略的提出混合策略的定義：在博弈G=N, Si, ui, iN中，假設(shè)參與人i的純策略構(gòu)成的策略集合為Si=si1, sik，若參與人i以概率分布pi=(pi1, pik) 在其k個可選策略中隨機選擇“策略”，稱這樣的選擇方式為混合策略。這里，0pij 1,對于j=1 , k都成立，且有, pi1+ pik=1純策略可看成特殊的混合策略上述定義是在有限博弈前

12、提下進行的31混合策略的提出混合策略的定義：在博弈G=N, Si, 32混合策略意義下的相關(guān)表述混合策略意義下策略組合的表述x1X1, , xnXn，其中Xi , i =1, , n表示參與人i所有純策略生成的概率空間，xi為參與人i的一個具體混合策略猜硬幣博弈的一個混合策略就可記為（1/2, 1/2）,(1/2, 1/2)32混合策略意義下的相關(guān)表述混合策略意義下策略組合的表述33混合策略若允許每個參與人選擇混合策略，則博弈結(jié)果就是一個關(guān)于純策略組合得來一個風險結(jié)果為研究參與人行為，需要知道各參與人對這些風險結(jié)果的偏好關(guān)系博弈論假定每個參與人的偏好關(guān)系，可用期望收益函數(shù)表示。33混合策略若允

13、許每個參與人選擇混合策略，則博弈結(jié)果就是一個34VNM效用函數(shù)VNM效用函數(shù)理論是20世紀50年代,馮諾依曼和摩根斯坦(Von Neumann and Morgenstern)在公理化假設(shè)的基礎(chǔ)上，運用邏輯和數(shù)學工具，建立了不確定條件下對理性人(rational actor)選擇進行分析的框架。34VNM效用函數(shù)VNM效用函數(shù)理論是20世紀50年代,35VNM效用函數(shù)如果某個隨機變量X以概率Pi取值xi，i=1,2,n，而某人在確定地得到xi時的效用為u(xi)，那么，該隨機變量給他的效用便是： U(X) = P1u(x1) + P2u(x2) + . + Pnu(xn) 表示關(guān)于隨機變量X的

14、期望效用。因此U(X)稱為期望效用函數(shù)，又叫做馮諾依曼摩根斯坦效用函數(shù)（VNM函數(shù)）。 35VNM效用函數(shù)如果某個隨機變量X以概率Pi取值xi，i=36混合策略于是可以定義基于混合策略意義下的博弈策略式表述定義基于(v-N-M效用的)策略式博弈由參與人集合每個參與人有一個（純）策略集合對于每一個參與人來說，由所有參與人純策略組合構(gòu)成的風險結(jié)果空間，存在一個v-N-M效用36混合策略于是可以定義基于混合策略意義下的博弈策略式表述The expected payoff of the mixed strategy Piis a weighted average of the expected pa

15、yoffs of each of the pure strategies in the mix.37The expected payoff of the mix38混合策略意義下的納什均衡定義，對于博弈G= N, Si, ui, iN，基于v-N-M效用的混合策略組合*是一個納什均衡，若對于每一個i, 以及i的任意一個混合策略i，*對應(yīng)的期望支付至少和(i，*-i )的期望支付一樣大38混合策略意義下的納什均衡定義，對于博弈G= N, Si39混合策略意義下的納什均衡換句話說，稱混合策略組合*是一個納什均衡，如果沒有一個參與人通過偏離策略*i 實現(xiàn)支付的增加39混合策略意義下的納什均衡換句話說

16、，稱混合策略組合*是一Mixed Strategy NEA mixed strategy (P1*, P2*, PN*), is a mixed strategy Nash Equilibrium if, for each Player i-that players mixed strategy Pi* is a best response for Player i to the strategies everyone else is picking P-i*40Mixed Strategy NEA mixed strat41一個定理對于N-人靜態(tài)博弈問題，設(shè)混合策略納什均衡對應(yīng)的策略組合為(

17、Xi , X i ) 。對于任意的i ,若最優(yōu)混合策略為Xi= x1,xl，00(不失一般性，假設(shè)前l(fā)個分量嚴格大于0)，記分量xk (k=1, l) 對應(yīng)的純策略sk, 則對于參與人i而言，sk與其他參與人的最優(yōu)混合策略組合X i 形成的局勢的收益值,等于納什均衡混合策略組合 (Xi, X i )的收益值。即ui (sk, X i ) = ui (Xi, X i )成立， k=1, l41一個定理對于N-人靜態(tài)博弈問題，設(shè)混合策略納什均衡對應(yīng)的42定理證明由于(Xi, X i )是納什均衡，因此下式成立ui (sk, Xi ) ui (Xi, Xi ), k=1, l在上式中，不失一般性，

18、假設(shè)ui (s1, Xi ), ui (sl, Xi )中，數(shù)值最小的為ui (s1, Xi )，42定理證明由于(Xi, X i )是納什均衡，因此下式43一個定理假設(shè)ui (s1, Xi ) ui (Xi, X i ) 這與(Xi, X i ) 是納什均衡的前提矛盾因此， ui (s1, Xi ) = ui (sl, Xi ) 43一個定理假設(shè)ui (s1, Xi ) ui (sl44一個定理因此， ui (s1, Xi ) = ui (sl, Xi ) 又 ui (sk, Xi ) ui (Xi, Xi ), k=1, l （ (Xi, Xi ) 是納什均衡）ui (s1, Xi )=m

19、in ui (sk, Xi ), k=1, l 由本張投影的三個表達式，立即得出ui (Xi, Xi ) = ui (sk, Xi ), k=1, l該定理一言以蔽之44一個定理因此， ui (s1, Xi ) = ui (45一個算例簡單博弈，先用劃線法確定參與人1、2針對對手各純策略下的最優(yōu)純策略反應(yīng)。顯然沒有純策略意義下的納什均衡。參與人 2參與人1CDA2, 35, 2B3, 11, 5是否存在混合策略意義下的納什均衡？45一個算例簡單博弈，先用劃線法確定參與人1、2針對對手各純46一個算例設(shè)參與人1分別以pA、pB概率選擇純策略A和B根據(jù)前面介紹的關(guān)于混合策略納什均衡定理參與人1

20、以混合策略(pA、pB)與參與人2的純策略C, D進行博弈時，相應(yīng)支付值相等（為什么？）參與人 2參與人1CDA2, 35, 2B3, 11, 5圖1-12 二人博弈46一個算例設(shè)參與人1分別以pA、pB概率選擇純策略A和B參47一個算例于是有參與人 2參與人1CDA2, 35, 2B3, 11, 5圖1-12 二人博弈又根據(jù)可以求出47一個算例于是有參與人 2參CDA2, 35, 2B348一個算例同理可求出參與人2的最優(yōu)混合策略參與人 2參與人1CDA2, 35, 2B3, 11, 5圖1-12 二人博弈在這樣的混合策略組合下，參與人1相應(yīng)的期望支付值為48一個算例同理可求

21、出參與人2的最優(yōu)混合策略參與人 2參49 一對夫妻要決定去看時裝表演還是看足球賽。有關(guān)純策略及相應(yīng)支付情況如圖1-13所示。圖1-13 性別戰(zhàn)博弈Battle of Sexes 丈夫妻子時裝足球時裝2, 10, 0足球0, 01, 349 一對夫妻要決定去看時裝表演還是看足球賽。有關(guān)純策略及相50Battle of Sexes純策略均衡可通過劃線法計算得出，為(時裝，時裝)，（足球，足球），支付值分別為（2,1）,(1,3)該博弈還有一個混合策略均衡丈夫妻子時裝足球時裝2, 10, 0足球0, 01, 3圖1-13 性別戰(zhàn)50Battle of Sexes純策略均衡可通過劃線法計算5

22、1Battle of Sexes設(shè)pw（C）和pw(F)分別是妻子選擇時裝表演和足球的概率，ph(C)和ph(F)是丈夫選擇時裝表演和足球賽的概率。經(jīng)計算，可得丈夫妻子時裝足球時裝2, 10, 0足球0, 01, 351Battle of Sexes設(shè)pw（C）和pw(F)分52Battle of Sexes當采用上面混合策略時，可以算出丈夫和妻子的收益期望，分別為丈夫妻子時裝足球時裝2, 10, 0足球0, 01, 3圖1-13 性別戰(zhàn)可以看出，該結(jié)果明顯不如夫妻雙方能交流協(xié)商52Battle of Sexes當采用上面混合策略時，可以53性別戰(zhàn)變體1：制式問題電器和電子設(shè)備往往有不

23、同的原理或相關(guān)技術(shù)標準，通常稱為制式圖1-4就是一個2廠商的制式博弈模型該模型存在兩個純策略均衡，以及一個混合策略均衡廠商2廠商1制式1制式2制式11, 30, 0制式20, 02, 2圖1-14 制式問題53性別戰(zhàn)變體1：制式問題電器和電子設(shè)備往往有不同的原理或相54性別戰(zhàn)變體1：制式問題純策略均衡為（制式1，制式1）、（制式2、制式2）混合策略均衡為(0.4, 0.6),(0.67,0.33)相應(yīng)支付值分別為0.664和1.296 廠商2廠商1制式1制式2制式11, 30, 0制式20, 02, 2圖1-14 制式問題54性別戰(zhàn)變體1：制式問題純策略均衡為廠商2廠商55性別戰(zhàn)變體2：市

24、場機會博弈兩個廠商同時發(fā)現(xiàn)一個市場機會，但這個市場容量并不大。如果只有一個廠商進入該市場，能賺到100個單位的利潤，但如果兩個廠商同時進入該市場，則他們不僅賺不到錢，而且要各虧損50單位。如果這兩個廠商事先沒有溝通和協(xié)商。廠商2廠商1進入觀望進入-50, -50100, 0觀望0, 1000, 055性別戰(zhàn)變體2：市場機會博弈兩個廠商同時發(fā)現(xiàn)一個市場機會56性別戰(zhàn)變體2：市場機會博弈本博弈有（進入，不進入）、（不進入，進入）兩個純策略均衡，其中前一個均衡對廠商1有利，第二個均衡對廠商2有利此外，還有一個混合策略均衡，為(2/3, 1/3),(2/3, 1/3)期望支付均為0。廠商2廠

25、商1進入觀望進入-50, -50100, 0觀望0, 1000, 0圖1-15 市場機會56性別戰(zhàn)變體2：市場機會博弈本博弈有（進入，不進入）、（57性別戰(zhàn)變體2：市場機會博弈可以把混合策略(2/3, 1/3),(2/3, 1/3)解釋為：約有2/3比例的廠商選擇進入，1/3比例的廠商選擇不進入廠商2廠商1進入觀望進入-50, -50100, 0觀望0, 1000, 0圖1-15 市場機會57性別戰(zhàn)變體2：市場機會博弈可以把混合策略(2/3, 5822雙矩陣博弈的圖解法雙矩陣的含義以Battle of Sexes為例，介紹22雙矩陣博弈模型的圖解法為便于說明，將Battle of Se

26、xes模型再次復制與此5822雙矩陣博弈的圖解法雙矩陣的含義59一對夫妻要決定去看時裝表演還是看足球賽。有關(guān)純策略及相應(yīng)支付情況如圖1-16所示設(shè)妻子的混合策略為(r,1-r)，丈夫的策略為(q,1-q)。這里的r,q分別表示妻子或丈夫觀看時裝表演的概率為便于分析，將混合策略列于右上角丈夫妻子時裝足球時裝2, 10, 0足球0, 01, 3圖1-16 性別戰(zhàn)(r,1-r), (q,1-q)22雙矩陣博弈的圖解法59一對夫妻要決定去看時裝表演還是看足球賽。有關(guān)純策略及相應(yīng)60若丈夫以q的概率選擇去看時裝表演（以1-q的概率去看足球），則妻子選擇時裝和觀看足球的期望收益分別為丈夫妻子時裝足球時裝2, 10, 0足球0, 01, 3圖1-16 性別戰(zhàn)(r,1-r), (

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論第4講課件

文檔簡介

溫馨提示

最新文檔

評論

博弈論第4講課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔