博弈論-混合策略納什均衡_第1頁
博弈論-混合策略納什均衡_第2頁
博弈論-混合策略納什均衡_第3頁
博弈論-混合策略納什均衡_第4頁
博弈論-混合策略納什均衡_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 第三章第三章 混合策略納什均衡混合策略納什均衡 混合策略與期望支付混合策略與期望支付 計(jì)算混合策略納什均衡的三種方法計(jì)算混合策略納什均衡的三種方法 支付最大值法支付最大值法 支付等值法支付等值法 反應(yīng)函數(shù)法反應(yīng)函數(shù)法 多重納什均衡及其甄別多重納什均衡及其甄別 混合博弈在現(xiàn)實(shí)經(jīng)濟(jì)中的運(yùn)用案例混合博弈在現(xiàn)實(shí)經(jīng)濟(jì)中的運(yùn)用案例剪刀、石頭、布的游戲剪刀、石頭、布的游戲 每個同學(xué)跟后面一排對應(yīng)的同學(xué)玩剪刀、石每個同學(xué)跟后面一排對應(yīng)的同學(xué)玩剪刀、石頭、布的游戲頭、布的游戲. 玩二十次玩二十次,將結(jié)果記下來將結(jié)果記下來 贏了十次以上同學(xué)舉起手來贏了十次以上同學(xué)舉起手來 告訴我你有什么秘決告訴我你有什么秘決

2、怎么樣才能贏得多?怎么樣才能贏得多?剪刀、石頭、布的游戲剪刀、石頭、布的游戲 我們知道我們知道 如果博弈只進(jìn)行一次,我們無法明確預(yù)測博如果博弈只進(jìn)行一次,我們無法明確預(yù)測博弈的結(jié)果,不管是哪個博弈方,也不管他們弈的結(jié)果,不管是哪個博弈方,也不管他們的選擇是哪個策略,都不能保證得到較好的的選擇是哪個策略,都不能保證得到較好的結(jié)果。根據(jù)我們上一章所學(xué)的方法,這個博結(jié)果。根據(jù)我們上一章所學(xué)的方法,這個博弈沒有納什均衡。弈沒有納什均衡。 那么是不是意味著這樣的博弈中,你可以隨那么是不是意味著這樣的博弈中,你可以隨意選擇,結(jié)果都一樣呢?意選擇,結(jié)果都一樣呢?剪刀、石頭、布的游戲剪刀、石頭、布的游戲 答案

3、是否定的。答案是否定的。 事實(shí)上,局中人的選擇仍然是很有講究的,事實(shí)上,局中人的選擇仍然是很有講究的,策略選擇的好壞對局中人的利益仍然有很大策略選擇的好壞對局中人的利益仍然有很大的影響。的影響。 在這個零和博弈里,無論雙方采用哪種策略在這個零和博弈里,無論雙方采用哪種策略組合,結(jié)果都是一方輸一方贏,而輸?shù)囊环浇M合,結(jié)果都是一方輸一方贏,而輸?shù)囊环接挚偸强梢酝ㄟ^單獨(dú)改變策略而反輸為贏。又總是可以通過單獨(dú)改變策略而反輸為贏。如果哪個局中人能找到對手方的規(guī)律或者偏如果哪個局中人能找到對手方的規(guī)律或者偏好,他就能猜測到對手的策略而采用針對性好,他就能猜測到對手的策略而采用針對性策略從而保證贏。策略從而

4、保證贏。剪刀、石頭、布的游戲剪刀、石頭、布的游戲 因此,秘決在于因此,秘決在于 自己的策略選擇不能預(yù)先被對手方知道或猜自己的策略選擇不能預(yù)先被對手方知道或猜測到,測到,在該博弈的多次重復(fù)中,博弈方一定在該博弈的多次重復(fù)中,博弈方一定要避免自己的選擇具有規(guī)律性;要避免自己的選擇具有規(guī)律性; 觀察對手方策略選擇是否具有規(guī)律或者偏好觀察對手方策略選擇是否具有規(guī)律或者偏好,預(yù)先猜測對手策略,從而采用針對性策略贏預(yù)先猜測對手策略,從而采用針對性策略贏得這個博弈。得這個博弈。 第三章第三章 混合策略納什均衡混合策略納什均衡 純策略純策略(pure strategies):如果一個策略規(guī):如果一個策略規(guī)定參

5、與人在一個給定的信息情況下只選擇一定參與人在一個給定的信息情況下只選擇一種特定的行動。種特定的行動。 混合策略混合策略(mixed strategies):如果一個策:如果一個策略規(guī)定參與人在給定的信息情況下,以某種略規(guī)定參與人在給定的信息情況下,以某種概率分布隨機(jī)地選擇不同的行動。概率分布隨機(jī)地選擇不同的行動。 在靜態(tài)博弈里,純策略等價于特定的行動,在靜態(tài)博弈里,純策略等價于特定的行動,混合策略是不同行動之間的隨機(jī)選擇?;旌喜呗允遣煌袆又g的隨機(jī)選擇。 期望支付期望支付 與混合策略與混合策略(mixed strategies)相伴隨的一個問相伴隨的一個問題題,是局中人支付的不確定性是局中人

6、支付的不確定性(uncertainty).可用可用期望支付期望支付(expected payoff)來描述來描述有個有個n可可能的取值能的取值X1,X2,Xn ,并且這些取值發(fā)生的概率,并且這些取值發(fā)生的概率分別為分別為p1,p2,pn,那么我們可以將這個數(shù)量指,那么我們可以將這個數(shù)量指標(biāo)的期望值定義為發(fā)生概率作為權(quán)重的所有可能標(biāo)的期望值定義為發(fā)生概率作為權(quán)重的所有可能取值的加權(quán)平均,也就是取值的加權(quán)平均,也就是nnAXpXpXpEU.2211政府和流浪漢的博弈政府和流浪漢的博弈 政府想幫助流浪漢,但前提是后者必須試圖尋政府想幫助流浪漢,但前提是后者必須試圖尋找工作,否則,不予幫助;而流浪漢若

7、知道政找工作,否則,不予幫助;而流浪漢若知道政府采用救濟(jì)策略的話,他就不會尋找工作。他府采用救濟(jì)策略的話,他就不會尋找工作。他們只有在得不到政府救濟(jì)時才會尋找工作。他們只有在得不到政府救濟(jì)時才會尋找工作。他們獲得的支付如圖所示:們獲得的支付如圖所示:(3,2)(-1,3)(-1,1) (0,0)流浪漢流浪漢尋找工作尋找工作 游閑游閑政府政府救濟(jì)救濟(jì)不救濟(jì)不救濟(jì) 思考:政府會采用純策略嗎?流浪漢呢?這思考:政府會采用純策略嗎?流浪漢呢?這個博弈有沒有純策略的納什均衡?個博弈有沒有純策略的納什均衡? 跟你玩剪子石頭布游戲一樣,你會一直跟你玩剪子石頭布游戲一樣,你會一直采用純策略嗎?采用純策略嗎?

8、那么政府和流浪漢最有可能采用什么策略?那么政府和流浪漢最有可能采用什么策略? 使自己的預(yù)期支付最大化。使自己的預(yù)期支付最大化。 若能夠猜的對方的策略,就可以采用針若能夠猜的對方的策略,就可以采用針對性的策略,使自己的支付增加。對性的策略,使自己的支付增加。政府和流浪漢的博弈政府和流浪漢的博弈求解混合策略納什均衡1、假定政府采用混合策略:、假定政府采用混合策略:2、流浪漢的混合策略為:、流浪漢的混合策略為:的概率選擇游閑。的概率選擇尋找工作,即流浪漢以11 ,L的概率選擇不救濟(jì)。的概率選擇救濟(jì),即政府以11 ,G15101113,LGGv對上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件對上述效用函

9、數(shù)求微分,得到政府最優(yōu)化的一階條件為:為:2.0015Gv就是說,從政府的最優(yōu)化條件找到流浪漢混合策略就是說,從政府的最優(yōu)化條件找到流浪漢混合策略流浪漢以流浪漢以0.2的概率選擇尋找工作,的概率選擇尋找工作,0 .8的概率選擇的概率選擇游閑。游閑。解一解一:支付最大化支付最大化那么,政府的期望效用函數(shù)為:那么,政府的期望效用函數(shù)為: 流浪漢的期望效用函數(shù)為:流浪漢的期望效用函數(shù)為:5.0012L 解一解一:支付最大化支付最大化解二解二:支付等值法支付等值法 政府選擇救濟(jì)策略政府選擇救濟(jì)策略 政府選擇不救濟(jì)策略政府選擇不救濟(jì)策略114113, 1Gv期望效用0101,0Gv期望效用如果一個混合策

10、略是流浪漢的最優(yōu)選擇,那一定意味著政府在救濟(jì)與不救濟(jì)之間是無差異的,即:2.0,014,1GGvv 解二解二:支付等值法支付等值法 如果一個混合策略是政府的最優(yōu)選擇,那一定意味著流浪漢在尋找工作與游閑之間是無差異的,即:5 . 0, 031, 1LLvv 如果政府救濟(jì)的概率小于如果政府救濟(jì)的概率小于0.5; 則流浪漢的最優(yōu)選擇是尋找工作;則流浪漢的最優(yōu)選擇是尋找工作; 如果政府救濟(jì)的概率大于如果政府救濟(jì)的概率大于0.5; 則流浪漢的最優(yōu)選擇是游閑等待救濟(jì)。則流浪漢的最優(yōu)選擇是游閑等待救濟(jì)。 如果政府救濟(jì)的概率正好等于如果政府救濟(jì)的概率正好等于0.5; 流浪漢的選擇無差異。流浪漢的選擇無差異。政

11、府和流浪漢的博弈政府和流浪漢的博弈討討 論論 上面的均衡要求每個參與人以特定的概率上面的均衡要求每個參與人以特定的概率選擇純策略。也就是說,一個參與人選擇選擇純策略。也就是說,一個參與人選擇不同策略的概率不是由他自己的支付決定不同策略的概率不是由他自己的支付決定的,而是由他的對手的支付決定的。的,而是由他的對手的支付決定的。 正是由于這個原因,許多人認(rèn)為混合策略正是由于這個原因,許多人認(rèn)為混合策略納什均衡是一個難以令人滿意的概念。納什均衡是一個難以令人滿意的概念。 事實(shí)上,正是因?yàn)樗趲讉€(或全部)策事實(shí)上,正是因?yàn)樗趲讉€(或全部)策略之間是無差異的,他的行為才難以預(yù)測,略之間是無差異的,他

12、的行為才難以預(yù)測,混合策略納什均衡才會存在?;旌喜呗约{什均衡才會存在。討討 論論 盡管混合策略不像純策略那樣直觀,但它確實(shí)是盡管混合策略不像純策略那樣直觀,但它確實(shí)是一些博弈中參與人的合理行為方式。撲克比賽、一些博弈中參與人的合理行為方式。撲克比賽、壘球比賽、劃拳就是這樣的例子,在這一類博弈壘球比賽、劃拳就是這樣的例子,在這一類博弈中,參與比賽的總是隨機(jī)行動以使自己的行為不中,參與比賽的總是隨機(jī)行動以使自己的行為不被對方所預(yù)測。被對方所預(yù)測。 經(jīng)濟(jì)學(xué)上的監(jiān)督博弈也是這樣一個例子。如稅收經(jīng)濟(jì)學(xué)上的監(jiān)督博弈也是這樣一個例子。如稅收檢查、質(zhì)量檢查、懲治犯罪、雇主監(jiān)督雇員等都檢查、質(zhì)量檢查、懲治犯罪、

13、雇主監(jiān)督雇員等都可以看成猜謎博弈。可以看成猜謎博弈。納什均衡的存在性納什定理:納什定理:在一個由在一個由n個博弈方的博弈個博弈方的博弈 中,中,如果如果n是有限的,且是有限的,且 都是有限集都是有限集(對對 ),則該博弈,則該博弈至少存在一個納什均衡,但可能包含混合策略。至少存在一個納什均衡,但可能包含混合策略。 證明過程省略,主要根據(jù)是證明過程省略,主要根據(jù)是布魯威爾和角谷的不動點(diǎn)定理。布魯威爾和角谷的不動點(diǎn)定理。 納什均衡的普遍存在性正是納什均衡成為非合作博弈分析納什均衡的普遍存在性正是納什均衡成為非合作博弈分析核心概念的根本原因之一。核心概念的根本原因之一。,;,11nnuuSSGiSn

14、i, 1撲克牌對色游戲撲克牌對色游戲 甲乙玩撲克牌對色游戲,每人都有紅黑兩張甲乙玩撲克牌對色游戲,每人都有紅黑兩張撲克牌,約定如果出牌顏色一樣,甲輸乙贏,撲克牌,約定如果出牌顏色一樣,甲輸乙贏,如果出牌顏色不一樣,則甲贏乙輸。如果出牌顏色不一樣,則甲贏乙輸。 找到這個博弈的納什均衡。找到這個博弈的納什均衡。-1, 11, -11, -1-1, 1紅黑乙乙甲甲紅黑 反應(yīng)函數(shù)法反應(yīng)函數(shù)法 假設(shè)甲、乙均采用混和策略假設(shè)甲、乙均采用混和策略,隨機(jī)地以隨機(jī)地以p的概率出的概率出紅牌和以紅牌和以(1-p)的概率出黑牌的概率出黑牌,而乙則隨機(jī)地以而乙則隨機(jī)地以q的的概率出紅牌和以概率出紅牌和以(1-q)的概

15、率出黑牌。的概率出黑牌。-1, 11, -11, -1-1, 1紅q黑1-q乙乙甲甲紅p黑1-p) 12()21 (2)1 ()1 ()1()1)(1 ( 1),() 12()21 (2)1 ()1 ( 1)1)(1 ()1(),(ppqqpqpqppqqpUqqpqpqpqppqqpUBA乙的期望支付是這樣甲的期望支付是 反應(yīng)函數(shù)反應(yīng)函數(shù) A的目標(biāo)是期望支付越大越好。我們之所以把的目標(biāo)是期望支付越大越好。我們之所以把A的的期望支付整理成不含期望支付整理成不含p的一項(xiàng)和含的一項(xiàng)和含p的一項(xiàng)這個樣的一項(xiàng)這個樣子,是因?yàn)樽樱且驗(yàn)锳只能選擇只能選擇p而不能而不能q,因此,因此,A能通過能通過選擇選

16、擇p來影響第一項(xiàng),而不能直接影響第二項(xiàng)。來影響第一項(xiàng),而不能直接影響第二項(xiàng)。(1-2q)0即即q1/2時,時,A把把p選擇等于選擇等于1最好;當(dāng)最好;當(dāng)(1-2q)1/2時,時,A把把p選擇等于選擇等于0最好;當(dāng)最好;當(dāng)(1-2q)=0即即q=1/2時,時,A可以在可以在0,1之間隨便之間隨便選擇一個選擇一個p。這樣我們可以得到。這樣我們可以得到A的反應(yīng)函數(shù)是,的反應(yīng)函數(shù)是,同樣道理我們可以得到同樣道理我們可以得到B的反應(yīng)函數(shù)。的反應(yīng)函數(shù)。 0, 如果如果q1/2 1, 如果如果p1/2 p 0,1, 如果如果q=1/2 q 0,1, 如果如果p=1/2 1, 如果如果q1/2 0, 如果如果

17、p1/2 反應(yīng)函數(shù)曲線相應(yīng)方法反應(yīng)函數(shù)曲線相應(yīng)方法pq1/21納什均衡是納什均衡是A和和B都出紅牌或者黑牌的概率是都出紅牌或者黑牌的概率是 一半對一半一半對一半 1/21練習(xí):稅收檢查(監(jiān)督博弈)練習(xí):稅收檢查(監(jiān)督博弈) 設(shè)定設(shè)定a是應(yīng)納稅款;是應(yīng)納稅款;C是檢查成本;是檢查成本;F是罰款,是罰款,假定是假定是Ca+F。看看是否存在純策略納什均衡?。看看是否存在純策略納什均衡?混合策略納什均衡在哪里?混合策略納什均衡在哪里?字母說明字母說明 此博弈不存在純策略納什均衡。此博弈不存在純策略納什均衡。 我們用我們用p代表稅收機(jī)關(guān)檢查的概率;代表稅收機(jī)關(guān)檢查的概率;q代表代表納稅人逃稅的概率。納稅

18、人逃稅的概率。求解:混合戰(zhàn)略納什均衡求解:混合戰(zhàn)略納什均衡之一之一 假定納稅人采用混合策略達(dá)到最優(yōu)選擇時,假定納稅人采用混合策略達(dá)到最優(yōu)選擇時,則則稅收機(jī)關(guān)在檢查和不檢查兩種策略的期稅收機(jī)關(guān)在檢查和不檢查兩種策略的期望收益相等:望收益相等: (a-C+F) q+(a-C)(1- q)=a(1- q) q*=C/(a+F)說明說明 如果納稅人逃稅的概率小于如果納稅人逃稅的概率小于q*, 則則qC/a+F ,稅收機(jī)關(guān)的最優(yōu)選擇是檢查;,稅收機(jī)關(guān)的最優(yōu)選擇是檢查; 如果納稅人逃稅的概率等于如果納稅人逃稅的概率等于q*, 則則q=C/a+F ,稅收機(jī)關(guān)隨機(jī)地選擇檢查或,稅收機(jī)關(guān)隨機(jī)地選擇檢查或不檢查。

19、不檢查。之二之二 假設(shè)采用混合策略是稅務(wù)機(jī)關(guān)的最優(yōu)選擇假設(shè)采用混合策略是稅務(wù)機(jī)關(guān)的最優(yōu)選擇那么給定那么給定p ,納稅人選擇逃稅和不逃稅的期納稅人選擇逃稅和不逃稅的期望收益相等:望收益相等: -(a+F) p +0(1- p)= -a 得得p *=a/(a+F)說說 明明 如果稅收機(jī)關(guān)檢查概率小于如果稅收機(jī)關(guān)檢查概率小于p*, 即即p13c1時,時,A A將增加將增加r,r,如果如果3c13c2/3r2/3時,時,B B增加增加c c將增加收益;當(dāng)將增加收益;當(dāng)r2/3r1/3c1/3,行參與人的最優(yōu)反,行參與人的最優(yōu)反應(yīng)是應(yīng)是r=1r=1。0c1/3r11A的反的反應(yīng)曲線應(yīng)曲線2/3B的反的反

20、應(yīng)曲線應(yīng)曲線三個紅色的點(diǎn)三個紅色的點(diǎn)為納什均衡,為納什均衡,兩個為純策略兩個為純策略均衡。均衡。 多重納什均衡及其甄別多重納什均衡及其甄別 帕累托優(yōu)勢標(biāo)準(zhǔn)帕累托優(yōu)勢標(biāo)準(zhǔn) 風(fēng)險優(yōu)勢標(biāo)準(zhǔn)風(fēng)險優(yōu)勢標(biāo)準(zhǔn) 帕累托優(yōu)勢標(biāo)準(zhǔn)和風(fēng)險優(yōu)勢標(biāo)準(zhǔn)帕累托優(yōu)勢標(biāo)準(zhǔn)和風(fēng)險優(yōu)勢標(biāo)準(zhǔn) 聚點(diǎn)均衡聚點(diǎn)均衡 相關(guān)均衡相關(guān)均衡 抗共謀均衡抗共謀均衡 看看這個博弈有幾個純策略納什均衡看看這個博弈有幾個純策略納什均衡?-5, -5-10, 88, -1010, 10戰(zhàn)爭和平國家國家2戰(zhàn)爭和平國國家家1戰(zhàn)爭與和平博弈戰(zhàn)爭與和平博弈帕累托優(yōu)勢標(biāo)準(zhǔn)帕累托優(yōu)勢標(biāo)準(zhǔn)帕累托優(yōu)勢標(biāo)準(zhǔn)帕累托優(yōu)勢標(biāo)準(zhǔn)這個博弈中有兩個純策略這個博弈中有兩個純策略納什均衡,

21、(戰(zhàn)爭,戰(zhàn)爭)納什均衡,(戰(zhàn)爭,戰(zhàn)爭)和(和平,和平),顯然和(和平,和平),顯然后者帕累托優(yōu)于前者,后者帕累托優(yōu)于前者,所所以,(和平,和平)是本以,(和平,和平)是本博弈的一個按帕累托優(yōu)勢博弈的一個按帕累托優(yōu)勢標(biāo)準(zhǔn)篩選出來的納什均衡。標(biāo)準(zhǔn)篩選出來的納什均衡。-5, -5-10, 88, -1010, 10戰(zhàn)爭和平國家國家2戰(zhàn)爭和平國國家家1戰(zhàn)爭與和平博弈戰(zhàn)爭與和平博弈風(fēng)險優(yōu)勢標(biāo)準(zhǔn)風(fēng)險優(yōu)勢標(biāo)準(zhǔn)若考慮到或者說是顧忌到其他博弈方可能發(fā)生錯誤若考慮到或者說是顧忌到其他博弈方可能發(fā)生錯誤的原因,帕累托上策均衡并不一定是最優(yōu)選擇,還的原因,帕累托上策均衡并不一定是最優(yōu)選擇,還需要比較需要比較風(fēng)險優(yōu)勢風(fēng)

22、險優(yōu)勢。下面就是兩個例子。下面就是兩個例子。9, 98, 00, 87, 7LR博弈方博弈方2UD博博弈弈方方1風(fēng)險上策均衡(風(fēng)險上策均衡(D,R)風(fēng)險優(yōu)勢標(biāo)準(zhǔn)風(fēng)險優(yōu)勢標(biāo)準(zhǔn)從風(fēng)險優(yōu)勢標(biāo)準(zhǔn)衡量,帕累托上策均衡(鹿,鹿)從風(fēng)險優(yōu)勢標(biāo)準(zhǔn)衡量,帕累托上策均衡(鹿,鹿)并是最優(yōu)選擇,因?yàn)橐坏κ址椒噶隋e誤,暈了頭,并是最優(yōu)選擇,因?yàn)橐坏κ址椒噶隋e誤,暈了頭,選擇了鹿的策略時,你的支付就會由選擇了鹿的策略時,你的支付就會由5變成變成0!你會!你會選擇這么高風(fēng)險的策略嗎?而(兔,兔)的策略組選擇這么高風(fēng)險的策略嗎?而(兔,兔)的策略組合,當(dāng)對手方犯了錯誤,暈了頭,選擇了鹿的策略合,當(dāng)對手方犯了錯誤,暈了頭

23、,選擇了鹿的策略時,你的支付還是時,你的支付還是3,并沒有損失!,并沒有損失!5, 53, 00, 33, 3鹿兔獵人獵人2鹿兔獵獵人人1獵鹿博弈獵鹿博弈聚點(diǎn)均衡聚點(diǎn)均衡 聚點(diǎn)均衡是利用博弈設(shè)定以外的信息和依據(jù)選擇聚點(diǎn)均衡是利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡。的均衡。文化、習(xí)慣、心理或者其他各種特征都文化、習(xí)慣、心理或者其他各種特征都可能是聚點(diǎn)均衡的依據(jù)??赡苁蔷埸c(diǎn)均衡的依據(jù)。 城市博弈(城市分組相同)、時間博弈(報出相城市博弈(城市分組相同)、時間博弈(報出相同的時間)是聚點(diǎn)均衡的典型例子。同的時間)是聚點(diǎn)均衡的典型例子。城市博弈:聚點(diǎn)均衡的例子城市博弈:聚點(diǎn)均衡的例子 游戲:請兩個同學(xué)

24、上來將四個城市進(jìn)行分組,分游戲:請兩個同學(xué)上來將四個城市進(jìn)行分組,分成兩組,每組兩個城市。如果分組方法相同,則成兩組,每組兩個城市。如果分組方法相同,則每人平時分加每人平時分加5分。分。城市博弈:聚點(diǎn)均衡的例子城市博弈:聚點(diǎn)均衡的例子 這四個城市是:這四個城市是: 上海、長春、哈爾濱、南京上海、長春、哈爾濱、南京相相 關(guān)關(guān) 均均 衡衡5, 14, 40, 01, 5LR博弈方博弈方2UD博博弈弈方方1相關(guān)均衡例子相關(guān)均衡例子三個納什均衡:無論是三個納什均衡:無論是純策略的納什均衡(純策略的納什均衡(U,L)、()、(D,R);混合策略的);混合策略的納什均衡(納什均衡(1/2,1/2),結(jié)果都

25、不理想,不如),結(jié)果都不理想,不如(U,L)、()、(D,R)、)、(D,L)。)。 利用聚點(diǎn)均衡(天氣,拋硬幣),但仍不理想。利用聚點(diǎn)均衡(天氣,拋硬幣),但仍不理想。相相 關(guān)關(guān) 均均 衡衡相關(guān)裝置:相關(guān)裝置:1、各、各1/3概率概率A、B、C2、博弈方、博弈方1看到是否看到是否A,博弈方,博弈方2看到是否看到是否C3、博弈方、博弈方1見見A采用采用U,否則,否則D;博弈方;博弈方2見見C采用采用R,否則,否則L。相關(guān)均衡要點(diǎn):相關(guān)均衡要點(diǎn):1、構(gòu)成納什均衡、構(gòu)成納什均衡2、有人忽略不會造成問題、有人忽略不會造成問題一、多人博弈中的共謀問題一、多人博弈中的共謀問題這個博弈純策略的納什均衡是什

26、么?這個博弈純策略的納什均衡是什么?0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3B共謀和抗共謀均衡共謀和抗共謀均衡本博弈的純策略納什均衡:(本博弈的純策略納什均衡:(U,L,A)、()、(D,R,B) 前者帕累托優(yōu)于后者。博弈的結(jié)果會是什么呢?前者帕累托優(yōu)于后者。博弈的結(jié)果會是什么呢?(U,L,A)有共謀有共謀 (Coalition)問題:博弈方問題:博弈方1和和2同時偏離。同時偏離。0,0,10-5,-5,0-5,-5,01,1

27、,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3B共謀和抗共謀均衡共謀和抗共謀均衡博弈的結(jié)果會是什么呢?博弈的結(jié)果會是什么呢?(U,L,A)有共謀有共謀 (Coalition)問題:博弈方問題:博弈方1和和2同時偏離。同時偏離。(D,R,B) 是防共謀均衡!是防共謀均衡!0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3B

28、共謀和抗共謀均衡共謀和抗共謀均衡防共謀均衡防共謀均衡 如果一個博弈的某個策略組合滿足下列要求,稱為如果一個博弈的某個策略組合滿足下列要求,稱為“防共謀均衡防共謀均衡” :(1)沒有任何單個博弈方的)沒有任何單個博弈方的“串通串通”會改變博弈的會改變博弈的結(jié)果,即單獨(dú)改變策略無利可圖;結(jié)果,即單獨(dú)改變策略無利可圖;(2)給定選擇偏離的博弈方有再次偏離的自由時,)給定選擇偏離的博弈方有再次偏離的自由時,沒有任何兩個博弈方的串通會改變博弈的結(jié)果;沒有任何兩個博弈方的串通會改變博弈的結(jié)果;(3)依此類推,直到所有博弈方都參加的串通也不)依此類推,直到所有博弈方都參加的串通也不會改變博弈的結(jié)果。會改變博

29、弈的結(jié)果。 前面例子中:(前面例子中:(D,R,B) 是防共謀均衡是防共謀均衡 (U,L,A)不是防共謀均衡)不是防共謀均衡一點(diǎn)說明 存在博弈的納什均衡,并意味參與者一定存在博弈的納什均衡,并意味參與者一定不拒絕這種不拒絕這種納什均衡。納什均衡。 競爭博弈是一種零和博弈,即博弈一方的收益競爭博弈是一種零和博弈,即博弈一方的收益等于另一方的損失。多數(shù)體育競技項(xiàng)目都是零等于另一方的損失。多數(shù)體育競技項(xiàng)目都是零和博弈:一個組的和博弈:一個組的1分等價于另一個組失去一分等價于另一個組失去一分。參與人之間的利益是完全相反的。分。參與人之間的利益是完全相反的。 例如,在一個足球比賽中,前鋒主罰點(diǎn)球,守例如

30、,在一個足球比賽中,前鋒主罰點(diǎn)球,守門員防守。如果守門員撲錯了方向,前鋒得分門員防守。如果守門員撲錯了方向,前鋒得分的可能性大一些。同時,前鋒可能善于踢向某的可能性大一些。同時,前鋒可能善于踢向某一個方向,而守門員可能善于撲向某一個方向。一個方向,而守門員可能善于撲向某一個方向。但雙方都有朝兩個方向的可能。但雙方都有朝兩個方向的可能。 假定如果假定如果前鋒前鋒踢向球門的左方,當(dāng)踢向球門的左方,當(dāng)守門員守門員撲向右方時,撲向右方時,前鋒前鋒將是得分的把握將是得分的把握80% 80% ,當(dāng),當(dāng)守門員守門員撲向左方時,撲向左方時,前前鋒鋒得分的把握得分的把握50%50%。 如果如果前鋒前鋒踢向球門的

31、右方,當(dāng)踢向球門的右方,當(dāng)守門員守門員撲向左方時,撲向左方時,前前鋒鋒得分的把握得分的把握90%90%,當(dāng),當(dāng)守門員守門員撲向右方時,撲向右方時,前鋒前鋒得分得分的把握是的把握是20%20%。注:。注:前鋒前鋒的得分的得分, ,就為就為守門員守門員的失分。的失分。 畫出這個競爭博弈的支付矩陣畫出這個競爭博弈的支付矩陣, ,并求納什均衡并求納什均衡. . 這個博弈的納什均衡有兩種寫法前鋒前鋒守門員守門員左左p右右1-p左左q右右1-q50,-50 80,-8090,-90 20,-20 這個博弈的支付矩陣有兩種寫法前鋒前鋒守門員守門員左左p右右1-p左左q右右1-q50,5080,2090,1020,80納什均衡納什均衡 計(jì)算得前鋒應(yīng)該按概率計(jì)算得前鋒應(yīng)該按概率0.70.7踢向左方,而守門員應(yīng)踢向左方,而守門員應(yīng)該按概率該按概率0.60.6撲向左方。撲向左方。 這些概率使得無論對方采取什么策略,雙方都得到這些概率使得無論對方采取什么策略,雙方都得到相等的收益。即當(dāng)前鋒選擇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論