混合策略納什均衡_第1頁
混合策略納什均衡_第2頁
混合策略納什均衡_第3頁
混合策略納什均衡_第4頁
混合策略納什均衡_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

混合策略納什均衡第1頁,共35頁,2023年,2月20日,星期日第二節(jié)混合策略納什均衡的求解方法二、反應(yīng)對應(yīng)法例:撲克牌對色游戲(p77)無純策略NE給定混合策略p甲=(r,1-r);p乙=(q,1-q)π甲(p甲,p乙)=2r(1-2q)+(2q-1)整理原則:一項(xiàng)含r,一項(xiàng)不含rπ乙(p甲,p乙)=

2q(2r-1)-(2r-1)整理原則:一項(xiàng)含q,一項(xiàng)不含q按照NE的條件,一個策略組合如過是一個NE,那么其中的每一個策略都是參與人針對其他參與人策略組合的最優(yōu)反應(yīng),在純策略NE中,這個“最優(yōu)反應(yīng)”可能是一個具體的純策略(離散情形),也可能是一個反應(yīng)函數(shù)(reactionfunction,如連續(xù)情形、古諾模型)。而在一個混合策略NE中,這個“最優(yōu)反應(yīng)”將是一個概率或很多個概率——被稱為“反應(yīng)對應(yīng)”(reactioncorrespondence)第2頁,共35頁,2023年,2月20日,星期日第二節(jié)混合策略納什均衡的求解方法二、反應(yīng)對應(yīng)法例:撲克牌對色游戲(p77)先看甲的最優(yōu)反應(yīng),記為r*=R(q):觀察π甲(p甲,p乙)=2r(1-2q)+(2q-1)rq01(紅)1(紅)1/21/2r*=R(q)反應(yīng)對應(yīng)曲線第3頁,共35頁,2023年,2月20日,星期日第二節(jié)混合策略納什均衡的求解方法二、反應(yīng)對應(yīng)法例:撲克牌對色游戲(p77)再看乙的最優(yōu)反應(yīng),記為q*=R(r):觀察π乙(p甲,p乙)=

2q(2r-1)-(2r-1)rq01(紅)1(紅)1/21/2q*=R(r)反應(yīng)對應(yīng)曲線第4頁,共35頁,2023年,2月20日,星期日第二節(jié)混合策略納什均衡的求解方法二、反應(yīng)對應(yīng)法例:撲克牌對色游戲(p77)作為NE,各個參與人的反應(yīng)應(yīng)該同時為最優(yōu),只有兩個反應(yīng)對應(yīng)的交點(diǎn)滿足NE:r*=1/2,q*=1/2NE支付為:π甲(p甲,p乙)=2r(1-2q)+(2q-1)=0π乙(p甲,p乙)=

2q(2r-1)-(2r-1)=0rq01(紅)1(紅)1/21/2q*=R(r)r*=R(q)第5頁,共35頁,2023年,2月20日,星期日第二節(jié)混合策略納什均衡的求解方法二、反應(yīng)對應(yīng)法作業(yè):社會福利博弈。使用反應(yīng)對應(yīng)法找到納什均衡。

流浪漢尋找工作游蕩救濟(jì)政府

不救濟(jì)3,2-1,3-1,10,0第6頁,共35頁,2023年,2月20日,星期日第三節(jié)尋找多重納什均衡例:情侶博弈兩個(多個)純策略納什均衡問題:納什均衡找完了嗎?有無混合策略納什均衡?一、支付最大化法給定混合策略p陳明=(r,1-r);p鐘信=(q,1-q)Maxπ陳明(p陳明,p鐘信)=r[3q+(1-q)

]+(1-r)[0+2(1-q)]=r(4q-1)+2(1-q)Maxπ鐘信(p陳明,p鐘信)=q(2r+0)+(1-q)[r+3(1-r)]=q(4r-3)+(3-2r)NE:(r*,q*)=(3/4,1/4)二、反應(yīng)對應(yīng)法rq第7頁,共35頁,2023年,2月20日,星期日第三節(jié)尋找多重納什均衡二、反應(yīng)對應(yīng)法:情侶博弈先看陳明的最優(yōu)反應(yīng),記為r*=R(q):π陳明(p陳明,p鐘信)

=r(4q-1)+2(1-q)rq01(鐘信德語)1(陳明德語)1/4r*=R(q)第8頁,共35頁,2023年,2月20日,星期日第三節(jié)尋找多重納什均衡二、反應(yīng)對應(yīng)法:情侶博弈再看鐘信的最優(yōu)反應(yīng),記為q*=R(r):π鐘信(p陳明,p鐘信)=q(4r-3)+(3-2r)rq01(鐘信德語)1(陳明德語)1/4q*=R(r)3/4第9頁,共35頁,2023年,2月20日,星期日第三節(jié)尋找多重納什均衡二、反應(yīng)對應(yīng)法:情侶博弈反應(yīng)對應(yīng)曲線有三個交點(diǎn):三個NE:r*=0,q*=0純策略(確定性)r*=3/4,q*=1/4混合策略(不確定性)r*=1,q*=1純策略(確定性)rq01(鐘信德語)1(陳明德語)1/43/4r*=R(q)q*=R(r)第10頁,共35頁,2023年,2月20日,星期日第三節(jié)尋找多重納什均衡二、反應(yīng)對應(yīng)法:情侶博弈支付的帕累托優(yōu)勢:初步印象π陳明=r(4q-1)+2(1-q),π鐘信=q(4r-3)+(3-2r)r*=0,q*=0純策略(確定性)

雙方NE支付:π陳明*=3,π鐘信*=2r*=3/4,q*=1/4混合策略(不確定性)雙方NE支付:π陳明*=3/2,π鐘信*=3/2r*=1,q*=1純策略(確定性)雙方NE支付:π陳明*=2,π鐘信*=3純策略納什均衡比混合策略納什均衡具有支付優(yōu)勢,這稱為帕累托優(yōu)勢如果博弈同時存在純策略納什均衡和混合策略納什均衡,前者往往得到優(yōu)先考慮第11頁,共35頁,2023年,2月20日,星期日第三節(jié)尋找多重納什均衡二、反應(yīng)對應(yīng)法:情侶博弈夫妻之爭博弈第12頁,共35頁,2023年,2月20日,星期日第四節(jié)納什均衡的存在性不同均衡概念的關(guān)系優(yōu)勢均衡純策略納什均衡混合策略納什均衡第13頁,共35頁,2023年,2月20日,星期日第四節(jié)納什均衡的存在性問題:是否所有的博弈都存在NE(純的或混合的)?Nash在1950年證明:任何有限博弈,都至少存在一個NE。

納什定理:在一個由n個博弈方的G={S1,…,Sn;u1,…,un}中,如果n是有限的,且Si都是有限集,則該博弈至少存在一個納什均衡,但可能包含混合策略Wilson(1971)證明,幾乎所有有限博弈,都存在有限奇數(shù)個NE,包括純策略NE和混合策略NE。(純策略)納什均衡的存在性定理(Debreu,1952;Glicksberg,1952;Fan,1952):

考慮一個n人策略式博弈,如果每個參與人的純策略空間Si是歐氏空間中的非空、緊(閉而有界)的凸集,支付函數(shù)ui(s)連續(xù)且對si擬凹,則博弈存在一個純策略Nash均衡。第14頁,共35頁,2023年,2月20日,星期日第四節(jié)納什均衡的存在性例:凹但不連續(xù)的支付函數(shù)

二人博弈:策略空間為S1=S2=(0,1)

支付函數(shù):

反應(yīng)對應(yīng):

反應(yīng)對應(yīng)曲線:s2s11/31/3s1=s2=無納什均衡第15頁,共35頁,2023年,2月20日,星期日第四節(jié)納什均衡的存在性問題:是否所有的博弈都存在NE(純的或混合的)?(純策略)納什均衡的存在性定理(Debreu,1952;Glicksberg,1952;Fan,1952):

考慮一個n人策略式博弈,如果每個參與人的純策略空間Si是歐氏空間中的非空、緊(閉而有界)的凸集,支付函數(shù)ui(s)連續(xù)且對si擬凹,則博弈存在一個純策略Nash均衡。(混合策略)納什均衡的存在性定理(Glicksberg,1952):

在n人策略式博弈中,如果每個參與人的純粹策略空間Si是歐氏空間中的非空、緊(閉而有界)的凸集,如果支付函數(shù)ui(s)為連續(xù)函數(shù),那么博弈至少存在一個混合策略Nash均衡.第16頁,共35頁,2023年,2月20日,星期日第五節(jié)多重納什均衡的篩選一個博弈可能有多個均衡,但仍然存在不穩(wěn)定性——你預(yù)測出現(xiàn)這個納什均衡,因而有相應(yīng)選擇,我卻以為會出現(xiàn)另一個,乃有我的選擇,此時的組合可能并不構(gòu)成納什均衡博弈論并沒有一個一般的理論證明納什均衡結(jié)果一定能出現(xiàn)如何保證納什均衡出現(xiàn)?一、帕累托優(yōu)勢標(biāo)準(zhǔn):按照支付大小篩選納什均衡例:獵人博弈第17頁,共35頁,2023年,2月20日,星期日第五節(jié)多重納什均衡的篩選如何保證納什均衡出現(xiàn)?二、風(fēng)險(xiǎn)優(yōu)勢標(biāo)準(zhǔn):風(fēng)險(xiǎn)小的NE優(yōu)先假設(shè)概率,比較期望支付大小例:虛擬博弈兩個納什均衡,哪個更優(yōu)?假設(shè)r=1/2,q=1/2給定q=1/2:甲采用上策略的期望支付為:9/2+0/2=4.5甲采用下策略的期望支付為:8/2+7/2=7.5給定r=1/2:乙采用左策略的期望支付為:9/2+0/2=4.5乙采用右策略的期望支付為:8/2+7/2=7.5期望支付越大,風(fēng)險(xiǎn)越小:甲采用下策略,乙采用右策略選擇的納什均衡為:(下策略,右策略)第18頁,共35頁,2023年,2月20日,星期日第五節(jié)多重納什均衡的篩選如何保證納什均衡出現(xiàn)?二、風(fēng)險(xiǎn)優(yōu)勢標(biāo)準(zhǔn):風(fēng)險(xiǎn)小的NE優(yōu)先風(fēng)險(xiǎn)偏離損失乘積比較法1.甲:單獨(dú)偏離均衡的損失(1)偏離A的損失:6-5=1(2)偏離B的損失:4-0=42.乙:單獨(dú)偏離均衡的損失(1)偏離A的損失:6-5=1(2)偏離B的損失:4-0=43.風(fēng)險(xiǎn)優(yōu)勢標(biāo)準(zhǔn)方法:偏離A的損失VS偏離B的損失1×1<4×44.結(jié)論(1)偏離B的損失更大:16(2)不偏離B選擇的納什均衡偏離損失更大者為:B,即(下策略,右策略)AB第19頁,共35頁,2023年,2月20日,星期日第五節(jié)多重納什均衡的篩選如何保證納什均衡出現(xiàn)?二、風(fēng)險(xiǎn)優(yōu)勢標(biāo)準(zhǔn):風(fēng)險(xiǎn)小的NE優(yōu)先風(fēng)險(xiǎn)偏離損失乘積比較法1.甲:單獨(dú)偏離均衡的損失(1)偏離A的損失:6-5=1(2)偏離B的損失:4-0=42.乙:單獨(dú)偏離均衡的損失(1)偏離A的損失:6-5=1(2)偏離B的損失:4-0=43.風(fēng)險(xiǎn)偏離損失乘積比較法:偏離A的損失VS偏離B的損失1×1<4×44.結(jié)論(1)偏離B的損失更大:16(2)不偏離B選擇的納什均衡偏離損失更大者為:B,即(下策略,右策略)AB第20頁,共35頁,2023年,2月20日,星期日第五節(jié)多重納什均衡的篩選如何保證納什均衡出現(xiàn)?二、風(fēng)險(xiǎn)優(yōu)勢標(biāo)準(zhǔn):風(fēng)險(xiǎn)小的NE優(yōu)先5.風(fēng)險(xiǎn)偏離損失乘積比較法的缺陷:例:假設(shè)M遠(yuǎn)遠(yuǎn)大于m1.甲:單獨(dú)偏離均衡的損失(1)偏離A的損失:(M-m)-M/2=M/2-m(2)偏離B的損失:M-(M-m)=m2.乙:單獨(dú)偏離均衡的損失(1)偏離A的損失:0-0=0(2)偏離B的損失:0-0=0如果使用風(fēng)險(xiǎn)偏離損失乘積比較法:偏離A的損失VS偏離B的損失(M/2-m)×0=m×0一種建議:甲偏離A的損失VS甲偏離B的損失M/2-m>m選擇的納什均衡為:A,即(D,L)AB第21頁,共35頁,2023年,2月20日,星期日第五節(jié)多重納什均衡的篩選如何保證納什均衡出現(xiàn)?二、帕累托優(yōu)勢標(biāo)準(zhǔn)和風(fēng)險(xiǎn)優(yōu)勢標(biāo)準(zhǔn)的關(guān)系如果帕累托優(yōu)勢標(biāo)準(zhǔn)和風(fēng)險(xiǎn)優(yōu)勢標(biāo)準(zhǔn)的選擇沖突?例:帕累托優(yōu)勢標(biāo)準(zhǔn)法:選擇的納什均衡為A風(fēng)險(xiǎn)優(yōu)勢標(biāo)準(zhǔn):1.甲:單獨(dú)偏離均衡的損失(1)偏離A的損失:6-5=1(2)偏離B的損失:4-(-1000)=10042.乙:單獨(dú)偏離均衡的損失(1)偏離A的損失:6-5=1(2)偏離B的損失:4-(-1000)=1004風(fēng)險(xiǎn)偏離損失乘積比較法:偏離A的損失VS偏離B的損失1×1<1004×1004選擇的納什均衡為:B怎么辦?AB第22頁,共35頁,2023年,2月20日,星期日第五節(jié)多重納什均衡的篩選如何保證納什均衡出現(xiàn)?四、聚點(diǎn)均衡如果帕累托優(yōu)勢標(biāo)準(zhǔn)和風(fēng)險(xiǎn)優(yōu)勢標(biāo)準(zhǔn)都無法使用呢?在現(xiàn)實(shí)生活中,參與人可能使用某些被博弈模型抽象掉的信息來達(dá)到一個“聚點(diǎn)(focalpount)”均衡。這些信息可能與社會文化習(xí)慣、參與人過去博弈的歷史等有關(guān)。(Schelling,1960)性別戰(zhàn):某一方的生日;社會地位提名博弈道路交通規(guī)則廉價磋商(Cheaptalk)與協(xié)調(diào)博弈盡管無法保證磋商會達(dá)成一個協(xié)議,即使達(dá)成協(xié)議也不一定會被遵守,但在一些博弈中,事前磋商確實(shí)可以使某些均衡實(shí)際上出現(xiàn)。例:兩人同時給對方打電話第23頁,共35頁,2023年,2月20日,星期日第五節(jié)多重納什均衡的篩選如何保證納什均衡出現(xiàn)?四、聚點(diǎn)均衡廉價磋商(Cheaptalk)盡管無法保證磋商會達(dá)成一個協(xié)議,即使達(dá)成協(xié)議也不一定會被遵守,但在一些博弈中,事前磋商確實(shí)可以使某些均衡實(shí)際上出現(xiàn)。例:虛擬博弈中的事前告知例:兩人同時給對方打電話重復(fù)博弈、學(xué)習(xí)過程與協(xié)調(diào)模式9,90,00,01,1R乙甲UDL9,90,88,07,7R乙甲UDL聚點(diǎn)第24頁,共35頁,2023年,2月20日,星期日第五節(jié)多重納什均衡的篩選如何保證納什均衡出現(xiàn)?四、聚點(diǎn)均衡重復(fù)博弈與協(xié)調(diào)模式假定博弈重復(fù)許多次,即使參與人最初難以協(xié)調(diào)行動,在博弈若干次后,某種特定的協(xié)調(diào)模式可能會形成,特別地,假定參與人每一輪根據(jù)其對手以前的“平均”戰(zhàn)略來選擇自己的最優(yōu)戰(zhàn)略,博弈可能收斂于一個納什均衡。以上情況并不保證必然出現(xiàn)納什均衡第25頁,共35頁,2023年,2月20日,星期日2023年4月12日博弈論第三章第二講多重納什均衡26第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)四、相關(guān)均衡(一)案例:“地域連坐”下的產(chǎn)品質(zhì)量博弈企業(yè)乙好產(chǎn)品差產(chǎn)品好產(chǎn)品企業(yè)甲差產(chǎn)品4,4-8,-2-2,-8-2,-2第26頁,共35頁,2023年,2月20日,星期日2023年4月12日博弈論第三章第二講多重納什均衡27第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)四、相關(guān)均衡(二)相關(guān)均衡參與人主動設(shè)計(jì)某種形式的選擇機(jī)制,形成制度安排,從而確定最終均衡“三鹿”事件出現(xiàn)后,河北省其他食品企業(yè)以后如何做?4,4-8,-2-2,-8-2,-2第27頁,共35頁,2023年,2月20日,星期日2023年4月12日博弈論第三章第二講多重納什均衡28第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(一)案例:抽象的選擇乙左右上甲下

乙左右上甲下0,0,10-5,-5,0-5,-5,01,1,-5丙:A-2,-2,0-5,-5,0-5,-5,0-1,-1,5丙:B第28頁,共35頁,2023年,2月20日,星期日2023年4月12日博弈論第三章第二講多重納什均衡29第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(二)共謀偏離(集體偏離)均衡的激勵1.如果集體偏離(上,左,A)(1)起因:甲、乙集體偏離,選(下,右,A)(2)結(jié)果:甲的支付0→1,乙的支付0→1(3)結(jié)論:甲、乙有集體偏離的動機(jī),(上,左,A)非抗共謀均衡第29頁,共35頁,2023年,2月20日,星期日2023年4月12日博弈論第三章第二講多重納什均衡30第三節(jié)多重納什均衡的選擇標(biāo)準(zhǔn)五、抗共謀均衡(二)共謀偏離(集體偏離)均衡的激勵2.如果集體偏離(下,右,B)(1)若甲、乙集體偏離,選(上,左,B)-1→-2,-1→-2(2)若甲、丙集體偏離,選(上,右,A)-1→-5,5→0(3)若乙、丙集體偏離,選(下,左,A)-1→-5,5→0(4)結(jié)論:缺乏集體偏離的激勵,(下,右,B)為抗共謀均衡第30頁,共35頁,2023年,2月20日,星期日2023年4月12日博弈論第三章第二講多重納什均衡31獵鹿博弈:何為抗共謀均衡?

乙獵鹿打兔獵鹿甲打兔10,100,44,04,4第31頁,共35頁,2023年,2月20日,星期日多人博弈中的共謀問題防共謀均衡:如果一個博弈的米謳歌策略組合滿足下列要求:1、沒有任何單個博弈方的“串通”會改變博弈的結(jié)果,即單獨(dú)改變策略無利可圖2、給定選擇偏離的博弈方又再次偏離

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論