第二講納什均衡_第1頁
第二講納什均衡_第2頁
第二講納什均衡_第3頁
第二講納什均衡_第4頁
第二講納什均衡_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、經(jīng)典博弈故事之二情侶博弈經(jīng)典博弈故事之二情侶博弈 大海和小麗正在熱戀。難得的周末又到了,安排什么節(jié)目呢?周末晚上,大海和小麗正在熱戀。難得的周末又到了,安排什么節(jié)目呢?周末晚上,中國足球隊(duì)要在世界杯外圍賽中和伊朗隊(duì)做生死之戰(zhàn)。大海是個(gè)超級球迷,國中國足球隊(duì)要在世界杯外圍賽中和伊朗隊(duì)做生死之戰(zhàn)。大海是個(gè)超級球迷,國內(nèi)的甲級聯(lián)賽都不肯放過,何況是不爭氣的國家隊(duì)的生死大戰(zhàn)?也正好是這個(gè)內(nèi)的甲級聯(lián)賽都不肯放過,何況是不爭氣的國家隊(duì)的生死大戰(zhàn)?也正好是這個(gè)周末的晚上,俄羅斯一個(gè)著名芭蕾舞團(tuán)蒞臨該市演出芭蕾舞劇周末的晚上,俄羅斯一個(gè)著名芭蕾舞團(tuán)蒞臨該市演出芭蕾舞劇胡桃夾子胡桃夾子。麗娟最崇尚鋼琴、芭蕾這樣

2、的高雅藝術(shù),對斯拉夫民族的歌唱和芭蕾更是崇拜麗娟最崇尚鋼琴、芭蕾這樣的高雅藝術(shù),對斯拉夫民族的歌唱和芭蕾更是崇拜得五體投地,她怎么肯放過正宗俄羅斯的芭蕾舞劇得五體投地,她怎么肯放過正宗俄羅斯的芭蕾舞劇胡桃夾子胡桃夾子?這么說,一?這么說,一個(gè)在家里看電視直播的足球,一個(gè)去劇院看芭蕾舞演出不就得了?問題在于他個(gè)在家里看電視直播的足球,一個(gè)去劇院看芭蕾舞演出不就得了?問題在于他們是熱戀中的情侶,分開各自度過這難得的周末時(shí)光,才是最不樂意的事情。們是熱戀中的情侶,分開各自度過這難得的周末時(shí)光,才是最不樂意的事情。這樣一來,他們就面臨一場溫情籠罩下的這樣一來,他們就面臨一場溫情籠罩下的“博弈博弈” ”

3、 在情侶博弈中,在情侶博弈中, 我們不妨這樣給大海和小麗的我們不妨這樣給大海和小麗的“滿意程度滿意程度”賦值:如果賦值:如果大海看球讓小麗一個(gè)人去看芭蕾,雙方的滿意程度都為大??辞蜃屝←愐粋€(gè)人去看芭蕾,雙方的滿意程度都為0 0;兩人一起去看足球,;兩人一起去看足球,大海的滿意程度為大海的滿意程度為2 2,小麗的滿意程度為,小麗的滿意程度為1 1;兩人一起去看芭蕾,大海的滿意程;兩人一起去看芭蕾,大海的滿意程度為度為1 1,小麗的滿意程度為,小麗的滿意程度為2 2。應(yīng)該不會(huì)有小麗獨(dú)自看球而大海獨(dú)自去看芭蕾的。應(yīng)該不會(huì)有小麗獨(dú)自看球而大海獨(dú)自去看芭蕾的可能,不過人們還是把它寫出來,設(shè)想因此雙方的滿

4、意程度都是可能,不過人們還是把它寫出來,設(shè)想因此雙方的滿意程度都是1 1。試著用一個(gè)得益矩陣來描述大海和麗娟的情侶博弈試著用一個(gè)得益矩陣來描述大海和麗娟的情侶博弈 情侶博弈的得益矩陣 1 2足球足球芭蕾芭蕾芭蕾芭蕾足球足球 2 1小小 麗麗 大大 海海 00 11靠左走還是靠右走 在一個(gè)沒有交通規(guī)范的農(nóng)村小路騎自行車,你應(yīng)該走在一個(gè)沒有交通規(guī)范的農(nóng)村小路騎自行車,你應(yīng)該走在道路的哪一邊?在道路的哪一邊? 假如別人靠右(左)走,你也假如別人靠右(左)走,你也 靠右(左)走,則不會(huì)靠右(左)走,則不會(huì)相撞;反之,假如別人靠右(左)走,而你卻反其道相撞;反之,假如別人靠右(左)走,而你卻反其道而行之

5、,偏要靠左(右)走,則必然相撞。而行之,偏要靠左(右)走,則必然相撞。 假設(shè)行走順利,每人獲益為假設(shè)行走順利,每人獲益為1,相撞,則獲益為,相撞,則獲益為1, 畫出得益矩陣畫出得益矩陣交通博弈靠左行靠右行靠左行靠右行1,11,1-1,-1-1,-1甲甲乙乙經(jīng)典博弈故事之三智豬博弈經(jīng)典博弈故事之三智豬博弈 籠子里面有兩只豬,一只比較大,一只比較小?;\子很長,一頭籠子里面有兩只豬,一只比較大,一只比較小。籠子很長,一頭有一個(gè)按鈕,另一頭是飼料的出口和食槽。按一下按鈕,將有相當(dāng)有一個(gè)按鈕,另一頭是飼料的出口和食槽。按一下按鈕,將有相當(dāng)于于1010個(gè)單位的豬食進(jìn)槽,但是按按鈕以后跑到食槽所需要付出個(gè)單

6、位的豬食進(jìn)槽,但是按按鈕以后跑到食槽所需要付出“勞勞動(dòng)動(dòng)”,加起來要消耗相當(dāng)于,加起來要消耗相當(dāng)于2 2個(gè)單位的豬食。問題是按鈕和食槽分個(gè)單位的豬食。問題是按鈕和食槽分置籠子的兩端,按按鈕的豬付出勞動(dòng)跑到食槽的時(shí)候,坐享其成的置籠子的兩端,按按鈕的豬付出勞動(dòng)跑到食槽的時(shí)候,坐享其成的另一頭豬早已吃了不少。如果大豬先到,大豬呼啦啦吃到另一頭豬早已吃了不少。如果大豬先到,大豬呼啦啦吃到9 9個(gè)單位,個(gè)單位,小豬只能吃到小豬只能吃到1 1個(gè)單位;如果同時(shí)到達(dá),大豬吃到個(gè)單位;如果同時(shí)到達(dá),大豬吃到7 7個(gè)單位;小豬吃個(gè)單位;小豬吃到到3 3個(gè)單位;如果小豬先到,小豬可以吃到個(gè)單位;如果小豬先到,小豬

7、可以吃到4 4個(gè)單位,而大豬吃到個(gè)單位,而大豬吃到6 6個(gè)單位。個(gè)單位。畫出智豬博弈的得益矩陣畫出智豬博弈的得益矩陣 “智豬博弈”(boxed pigs) 按等待按等待5,14,49,10,0 大豬小 豬經(jīng)典博弈之四獵人博弈 設(shè)想在古代的一個(gè)地方,有兩個(gè)獵人。那時(shí)候,狩獵是人們的設(shè)想在古代的一個(gè)地方,有兩個(gè)獵人。那時(shí)候,狩獵是人們的主要生計(jì)。為了簡單起見,假設(shè)主要的獵物只有兩種:主要生計(jì)。為了簡單起見,假設(shè)主要的獵物只有兩種: 鹿,兔子。鹿,兔子。在古代,人類的狩獵手段還比較落后,弓箭威力也有限。在這樣的在古代,人類的狩獵手段還比較落后,弓箭威力也有限。在這樣的條件下,我們可以進(jìn)一步假設(shè),兩個(gè)

8、獵人一起去獵鹿,才能獵獲一條件下,我們可以進(jìn)一步假設(shè),兩個(gè)獵人一起去獵鹿,才能獵獲一只鹿,如果一個(gè)獵人單兵作戰(zhàn),他只能打到只鹿,如果一個(gè)獵人單兵作戰(zhàn),他只能打到4只兔子。如果他打兔只兔子。如果他打兔子,你去獵鹿,他可以打到子,你去獵鹿,他可以打到4只兔子,而你一無所獲,得只兔子,而你一無所獲,得0。假設(shè)打到一只鹿,兩家平分,每家管假設(shè)打到一只鹿,兩家平分,每家管10天;打到天;打到4只兔子,只能供只兔子,只能供一家吃一家吃4天。天。畫出得益矩陣畫出得益矩陣獵人博弈得益矩陣 10 10 4 0 0 4 4 4甲甲乙乙獵鹿獵鹿打兔打兔獵鹿獵鹿打兔打兔博弈論故事之五高薪養(yǎng)廉 “高薪養(yǎng)廉高薪養(yǎng)廉”是公

9、務(wù)員制度方面的一種理論,我們分是公務(wù)員制度方面的一種理論,我們分析一下析一下“高薪高薪”為什么能養(yǎng)廉?為什么能養(yǎng)廉? 假設(shè)甲乙為一家單位的主任和書記關(guān)系密切的國家公假設(shè)甲乙為一家單位的主任和書記關(guān)系密切的國家公務(wù)員,務(wù)員,7代表現(xiàn)在政府給他們的高薪。如果兩人受賄,代表現(xiàn)在政府給他們的高薪。如果兩人受賄,因?yàn)榇\而一時(shí)不被人發(fā)現(xiàn),他們可以達(dá)到因?yàn)榇\而一時(shí)不被人發(fā)現(xiàn),他們可以達(dá)到9的位置;的位置;而一旦而一旦“東窗事發(fā)東窗事發(fā)”,他就要被撤職查辦,他就要被撤職查辦, 不受賄一不受賄一方得方得8 畫出得益矩陣畫出得益矩陣博弈論故事之五高薪養(yǎng)廉 我們把數(shù)據(jù)改變一下,變成薪水只有2,兩個(gè)串謀,同時(shí)受賄

10、還是得9;一方受賄,一方不受賄,則分別為2,3。 得益矩陣?高薪養(yǎng)廉的得益矩陣 9 9 8 0 0 8 7 7 9 9 3 0 0 3 2 2甲甲受受賄賄不不受受賄賄受賄受賄 不受賄不受賄受受賄賄不不受受賄賄受賄受賄 不受賄不受賄乙乙乙乙甲甲完全信息靜態(tài)博弈 完全信息:各博弈方都完全了解所有博弈方各種情況下完全信息:各博弈方都完全了解所有博弈方各種情況下得益得益 靜態(tài):博弈方是同時(shí)決策的,或者雖然各博弈方?jīng)Q策的靜態(tài):博弈方是同時(shí)決策的,或者雖然各博弈方?jīng)Q策的時(shí)間不一定真正一致,但他們在做決策時(shí)互相不知道其時(shí)間不一定真正一致,但他們在做決策時(shí)互相不知道其他博弈方的策略。他博弈方的策略。 完全信息

11、靜態(tài)博弈:各博弈方同時(shí)決策,且所有博弈方完全信息靜態(tài)博弈:各博弈方同時(shí)決策,且所有博弈方對各方得益都了解的博弈。對各方得益都了解的博弈。 如何求這一類博弈的解呢?博弈的結(jié)果如何?如何求這一類博弈的解呢?博弈的結(jié)果如何?博弈各方最終的策略組合?博弈各方最終的策略組合?上策均衡法上策均衡法 上策均衡:一個(gè)博弈的某個(gè)策略組合中的所有策略都是上策均衡:一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方各自的上策各個(gè)博弈方各自的上策 上策:不管其它博弈方選擇什么策略,一博弈方的某個(gè)策略給上策:不管其它博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來的得益始終高于其它的策略,至少不低于其他策略的策他帶來的得益

12、始終高于其它的策略,至少不低于其他策略的策略略 囚徒的困境中的囚徒的困境中的“坦白坦白”;雙寡頭削價(jià)中;雙寡頭削價(jià)中“低價(jià)低價(jià)”。 上策均衡反應(yīng)了所有方的絕對偏好,因此是非常穩(wěn)定上策均衡反應(yīng)了所有方的絕對偏好,因此是非常穩(wěn)定 ,可以作出最肯定的預(yù)測。可以作出最肯定的預(yù)測。 上策均衡不是普遍存在的,所以該方法失效上策均衡不是普遍存在的,所以該方法失效 失效原因:失效原因: -3, -30, -6-6, 0-1, -1坦 白不坦白坦 白不坦白兩個(gè)罪犯的得益矩陣囚徒囚徒 2囚囚徒徒1 嚴(yán)格下策反復(fù)消去法嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個(gè)博弈方帶來的收益總嚴(yán)格下策:不管其它博弈方的策略如何

13、變化,給一個(gè)博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略是比另一種策略給他帶來的收益小的策略思路:思路: 任何理性的博弈方都不可能選擇嚴(yán)格下策任何理性的博弈方都不可能選擇嚴(yán)格下策 把不可能選擇的嚴(yán)格下策先排除掉排除法,從而留下較好的策略把不可能選擇的嚴(yán)格下策先排除掉排除法,從而留下較好的策略做法:做法: 首先找出某博弈人的嚴(yán)格下策,把這個(gè)嚴(yán)格下策剔除后,剩下的是一首先找出某博弈人的嚴(yán)格下策,把這個(gè)嚴(yán)格下策剔除后,剩下的是一個(gè)不包含已剔除劣策略的新的博弈;然后再剔除這個(gè)新的博弈中的嚴(yán)個(gè)不包含已剔除劣策略的新的博弈;然后再剔除這個(gè)新的博弈中的嚴(yán)格下策;繼續(xù)這個(gè)過程,直到?jīng)]有劣策略存在。如

14、果剩下的策略組合格下策;繼續(xù)這個(gè)過程,直到?jīng)]有劣策略存在。如果剩下的策略組合是唯一的,這個(gè)唯一的策略組合就是嚴(yán)格下策反復(fù)消去法的均衡是唯一的,這個(gè)唯一的策略組合就是嚴(yán)格下策反復(fù)消去法的均衡 嚴(yán)格下策反復(fù)消去法1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中 嚴(yán)格下策反復(fù)消去法 智豬博弈智豬博弈按等待按等待5,14,49,10,0大豬小 豬嚴(yán)格下策反復(fù)消去法 適用面:適用面: 嚴(yán)格下策反復(fù)消去法的適用面比上策均衡要更大些嚴(yán)格下策反復(fù)消去法的適用面比上策均衡要更大些 但也有很多博弈問題沒有嚴(yán)格下策:田忌賽馬、猜硬幣、情但也有很多博弈問題沒有嚴(yán)格下策:田忌賽

15、馬、猜硬幣、情侶博弈、交通博弈、石頭剪刀布、此時(shí),該方法失侶博弈、交通博弈、石頭剪刀布、此時(shí),該方法失效。效。 最大的用處:簡化博弈最大的用處:簡化博弈 失效原因失效原因 不同策略之間沒有絕對的優(yōu)劣,而只存在相對的、有條件的不同策略之間沒有絕對的優(yōu)劣,而只存在相對的、有條件的優(yōu)劣優(yōu)劣劃 線 法思路:思路: 以策略之間的相對優(yōu)劣關(guān)系,而不是絕對優(yōu)劣關(guān)系為基礎(chǔ)以策略之間的相對優(yōu)劣關(guān)系,而不是絕對優(yōu)劣關(guān)系為基礎(chǔ) 先找出自己針對其他博弈方每種策略或策略組合(多人博弈)的最佳對策,先找出自己針對其他博弈方每種策略或策略組合(多人博弈)的最佳對策, 然后在此基礎(chǔ)上,通過對其他博弈方策略選擇的判斷,然后在此

16、基礎(chǔ)上,通過對其他博弈方策略選擇的判斷, 預(yù)測可能的結(jié)果和確預(yù)測可能的結(jié)果和確定自己的最優(yōu)策略定自己的最優(yōu)策略只有,兩方均被劃線的策略組合,才是穩(wěn)定的策略表明給定一方采只有,兩方均被劃線的策略組合,才是穩(wěn)定的策略表明給定一方采用該策略組合中的策略,則另一方也愿意采用該策略組合中的策略,該用該策略組合中的策略,則另一方也愿意采用該策略組合中的策略,該策略組合具有穩(wěn)定性。策略組合具有穩(wěn)定性。但是,許多博弈根本不不存在確定性的結(jié)果,劃線法失效,比如猜硬幣但是,許多博弈根本不不存在確定性的結(jié)果,劃線法失效,比如猜硬幣沒有一個(gè)策略組合是雙方同時(shí)愿意接受的,這樣的博弈根本不可能沒有一個(gè)策略組合是雙方同時(shí)愿

17、意接受的,這樣的博弈根本不可能有可以預(yù)言的博弈結(jié)果有可以預(yù)言的博弈結(jié)果也有時(shí):情侶博弈中,用劃線法有兩個(gè)策略組合同時(shí)下面劃線,這意味也有時(shí):情侶博弈中,用劃線法有兩個(gè)策略組合同時(shí)下面劃線,這意味著兩個(gè)策略組合中的雙方策略都是對對方策略的最佳對策都具有內(nèi)著兩個(gè)策略組合中的雙方策略都是對對方策略的最佳對策都具有內(nèi)在的穩(wěn)定性但具體那一個(gè)會(huì)出現(xiàn),無法確定。在的穩(wěn)定性但具體那一個(gè)會(huì)出現(xiàn),無法確定。 劃線法1, 01, 30, 10, 40, 22, 0-5, -50, -8-8, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬幣幣2, 10, 00, 01, 3情情侶侶博

18、博弈弈課堂習(xí)題 用劃線法求出均衡解C1C2C3R1R2R30,44,05,34,00,45,33,53,56,6箭 頭 法 思路:思路: 對博弈中的每一個(gè)策略組合進(jìn)行分析,考察在每個(gè)策略組合對博弈中的每一個(gè)策略組合進(jìn)行分析,考察在每個(gè)策略組合處各個(gè)博弈方能否通過單獨(dú)改變自己的策略而增加得益處各個(gè)博弈方能否通過單獨(dú)改變自己的策略而增加得益 與劃線法一樣都是基于策略之間的相對優(yōu)劣關(guān)系進(jìn)行分析的,與劃線法一樣都是基于策略之間的相對優(yōu)劣關(guān)系進(jìn)行分析的,所得到的結(jié)果也是一致的。所得到的結(jié)果也是一致的。 如果能,則從所分析的策略組合對應(yīng)的得益數(shù)組引一箭頭,如果能,則從所分析的策略組合對應(yīng)的得益數(shù)組引一箭頭

19、,到改變策略后策略組合對應(yīng)的得益數(shù)組到改變策略后策略組合對應(yīng)的得益數(shù)組 最后,只有指向,沒有離開的策略組合為均衡解穩(wěn)定最后,只有指向,沒有離開的策略組合為均衡解穩(wěn)定沒有人愿意單獨(dú)改變沒有人愿意單獨(dú)改變 箭 頭 法1, 01, 30, 10, 40, 22, 0-3,-30, -6-6, 0-1, -1囚囚徒徒困困境境-1, 11, -11, -1-1, 1猜猜硬硬幣幣2, 10, 00, 01, 3情情侶侶博博弈弈 納什均衡的定義納什均衡:所有參與人的最優(yōu)策略的組合給定該策略中納什均衡:所有參與人的最優(yōu)策略的組合給定該策略中 別人的選擇,沒有人有積極性改變自己的選擇。別人的選擇,沒有人有積極性

20、改變自己的選擇。策略空間:策略空間:博弈方博弈方 的第的第 個(gè)策略:個(gè)策略:博弈方博弈方 的得益:的得益:博弈:博弈:納什均衡:在博弈納什均衡:在博弈 中,如果由各個(gè)博弈中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合方的各一個(gè)策略組成的某個(gè)策略組合 中,任一博弈中,任一博弈方方 的策略,都是對其余博弈方策略的組合的策略,都是對其余博弈方策略的組合 的最佳對策,也即的最佳對策,也即 對任意對任意 都成立,則稱都成立,則稱 為為 的一個(gè)納什的一個(gè)納什均衡均衡nSS ,1ijiSsiu,;,11nnuuSSG,;,11nnuuSSG),(*niss i),.,(*1*1*niiissss),.,

21、(),.,(*1*1*1*1*niijiiiniiiiisssssusssssuijiSs),(*nissGiij 納什均衡的一致預(yù)測性質(zhì)一致預(yù)測:一致預(yù)測: 如果所有博弈方都預(yù)測一個(gè)特定博弈結(jié)果會(huì)出現(xiàn),所有博弈方都不會(huì)如果所有博弈方都預(yù)測一個(gè)特定博弈結(jié)果會(huì)出現(xiàn),所有博弈方都不會(huì)利用該預(yù)測或者這種預(yù)測能力,選擇與預(yù)測結(jié)果不一致的策略,即沒利用該預(yù)測或者這種預(yù)測能力,選擇與預(yù)測結(jié)果不一致的策略,即沒有哪個(gè)博弈方有偏離這個(gè)預(yù)測結(jié)果的愿望,因此預(yù)測結(jié)果會(huì)成為博弈有哪個(gè)博弈方有偏離這個(gè)預(yù)測結(jié)果的愿望,因此預(yù)測結(jié)果會(huì)成為博弈的最終結(jié)果的最終結(jié)果 穩(wěn)定的和自我強(qiáng)制的,所以是真正可預(yù)測的穩(wěn)定的和自我強(qiáng)制的,

22、所以是真正可預(yù)測的 反之,不具有一致預(yù)測性的博弈結(jié)果,則難以避免預(yù)測和行為之間的反之,不具有一致預(yù)測性的博弈結(jié)果,則難以避免預(yù)測和行為之間的矛盾,甚至是自我否定的。矛盾,甚至是自我否定的。只有納什均衡才具有一致預(yù)測的性質(zhì)只有納什均衡才具有一致預(yù)測的性質(zhì)一致預(yù)測性是納什均衡的本質(zhì)屬性一致預(yù)測性是納什均衡的本質(zhì)屬性一致預(yù)測并不意味著一定能準(zhǔn)確預(yù)測,因?yàn)橛卸嘀鼐?,預(yù)測不一一致預(yù)測并不意味著一定能準(zhǔn)確預(yù)測,因?yàn)橛卸嘀鼐?,預(yù)測不一致的可能致的可能尋找納什均衡C1C2C3R1R2R3100,1000,050,10150,01,160,00,3000,0200,200納什均衡:舉例 廣告博弈 納什均衡:

23、(做廣告,做廣告)戰(zhàn)略做廣告不做廣告做廣告4,415,1不做廣告1,1510,10企業(yè)1企業(yè)2上次的作業(yè) 畫出田忌賽馬的得益矩陣 畫出猜硬幣博弈的得益矩陣 畫出石頭、剪子、布的得益矩陣 能否用我們今天的幾種方法得到均衡解? 你覺得它們的最佳應(yīng)對策略是什么? 嚴(yán)格競爭博弈和混合策略的引進(jìn)一、猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方猜硬幣方蓋蓋硬硬幣幣方方正 面反 面(1)不存在前面定義的納什均衡策略組合(2)關(guān)鍵是不能讓對方猜到自己策略保持隨機(jī)性 這類博弈很多,引出混合策略納什均衡概念這類博弈很多,引出混合策略納什均衡概念 混合策略、混合策略博弈 和混合策略納什均衡

24、 混合策略混合策略:在博弈 中,博弈方 的策略空間為 ,則博弈方 以概率分布 隨機(jī)在其 個(gè)可選策略中選擇的“策略”,稱為一個(gè)“混合策略”,其中 對 都成立,且 混合策略擴(kuò)展博弈混合策略擴(kuò)展博弈:博弈方在混合策略的策略空間(概率分布空間)的選擇看作一個(gè)博弈,就是原博弈的“混合策略擴(kuò)展博弈) 混合策略納什均衡混合策略納什均衡:包含混合策略的策略組合,構(gòu)成納什均衡任何博弈一方單獨(dú)改變自己的策略,或者隨機(jī)選擇各個(gè)純策略的概率分布,都不能給自己增加任何利益,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ijpkj, 111ikipp求混合策略納什均衡 思路: 各個(gè)博弈方選擇的純

25、策略的概率分布,要求滿足使對方或其他博弈方采用不同策略的期望收益相同 一個(gè)例子該博弈無純策略納什均衡,可用混合策略納什均衡分析5213BABApppp1352DCDCpppp博弈方1的混合策略博弈方2的混合策略2, 35, 23, 11, 5CDAB博弈方博弈方2博博弈弈方方1 策略 得益博弈方1 (0.8,0.2) 2.6博弈方2 (0.8,0.2) 2.6pA+pB=1; pC+pD=1 齊威王田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,

26、-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田田 忌忌齊齊威威王王得益矩陣PaPbPcPdPePfPg ph pi pj pk pl 多重均衡博弈和混合策略情侶博弈的混合策略納什均衡2, 10, 00, 01, 3時(shí) 裝足 球時(shí)裝足球丈丈 夫夫妻妻子子夫妻之爭夫妻之爭3)1 (00)1 (1rrrr1)1 (00)1 (2pppp妻子的混合策略丈夫的混合策略夫妻之爭博弈的混合策略納什均衡夫妻之爭博弈的混合策略納什均衡 策略 得益妻子 (0.75,0.25) 0.67丈

27、夫 (1/3,2/3) 0.75 制式問題1, 30, 00, 02, 2ABAB廠商廠商2廠廠商商1制式問題制式問題 制式問題混合策略納什均衡 A B 得益廠商1: 0.4 0.6 0.664廠商2: 0.67 0.33 1.296混合策略和嚴(yán)格下策反復(fù)消去法 在包括混合策略的情況下,關(guān)于嚴(yán)格下策反復(fù)在包括混合策略的情況下,關(guān)于嚴(yán)格下策反復(fù)消去法的結(jié)論仍然成立消去法的結(jié)論仍然成立 即任何一方都不會(huì)采用任何嚴(yán)格下策,不管它們是即任何一方都不會(huì)采用任何嚴(yán)格下策,不管它們是純策略還是混合策略純策略還是混合策略 嚴(yán)格下策反復(fù)消去法不會(huì)消去任何納什均衡,包括嚴(yán)格下策反復(fù)消去法不會(huì)消去任何納什均衡,包括

28、純策略和混合策略純策略和混合策略 如果經(jīng)過反復(fù)消去后留下的策略組合是唯一的,那如果經(jīng)過反復(fù)消去后留下的策略組合是唯一的,那么一定是納什均衡么一定是納什均衡 混合策略和嚴(yán)格下策反復(fù)消去法3, 10, 20, 23, 31, 31, 1LRUMD博弈方博弈方2博博弈弈方方123212111003eu23212111030eu博弈方2采用純策略L時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用純策略R時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益 混合策略反應(yīng)函數(shù)混合策略反應(yīng)函數(shù)反應(yīng)函數(shù):一博弈方對另一博弈方每種可能的決策內(nèi)容反應(yīng)函數(shù):一博弈方對另一博弈方每種可能的決策內(nèi)容的最

29、佳反應(yīng)決策構(gòu)成的函數(shù)的最佳反應(yīng)決策構(gòu)成的函數(shù)-1, 11, -11, -1-1, 1正 面反 面猜硬幣方猜硬幣方正面反面猜硬幣博弈猜硬幣博弈蓋蓋硬硬幣幣方方(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布:蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布:猜硬幣方選擇正反面的混合策略概率分布則蓋幣方的期望支付為:蓋幣方的期望支付為:2r(1-2q)+(2q-1)猜幣方的期望支付為:猜幣方的期望支付為:2q(2r-1)-(2r-1)猜硬幣博弈rq111/21/2)(2rRq )(1qRr 蓋幣方的反應(yīng)函數(shù): 0 如果q1/2r=0,1 如果q=1/2

30、1 如果q1/2q=0,1 如果如果r=1/2 0 如果如果r1/2情侶博弈2, 10, 00, 01, 3時(shí)裝足球丈夫丈夫時(shí)裝足球妻妻子子夫妻之爭夫妻之爭rq111/33/4(r,1-r):妻子的混合策略概率分布:妻子的混合策略概率分布(q,1-q):丈夫的混合策略概率分布:丈夫的混合策略概率分布)(2rRq )(1rRr 納什均衡的選擇和分析方法擴(kuò)展 多重納什均衡博弈的分析 共謀和防共謀均衡 多重納什均衡博弈的分析 帕累托上策均衡 風(fēng)險(xiǎn)上策均衡 聚點(diǎn)均衡 相關(guān)均衡一、帕累托上策均衡(鷹鴿博弈)這個(gè)博弈中有兩個(gè)純策略納什均衡,(戰(zhàn)爭,戰(zhàn)爭)和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個(gè)帕累托上策均衡。-5, -5-10, 88, -1010, 10戰(zhàn)爭和平國家國家2戰(zhàn)爭和平國國家家1戰(zhàn)爭與和平戰(zhàn)爭與和平二、風(fēng)險(xiǎn)上策均衡 考慮、顧

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論