第二章完全且完美信息靜態(tài)博弈_第1頁
第二章完全且完美信息靜態(tài)博弈_第2頁
第二章完全且完美信息靜態(tài)博弈_第3頁
第二章完全且完美信息靜態(tài)博弈_第4頁
第二章完全且完美信息靜態(tài)博弈_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章完全且完美信息靜態(tài)博弈2023/9/151第1頁,課件共108頁,創(chuàng)作于2023年2月一、博弈的數學描述2.1基本分析思路和方法

假設一個博弈有n個博弈方,博弈方i的策略集(又稱策略空間)為Si(i=1,2,…,n)

,用sij∈Si表示博弈方i的第j個策略;若si∈Si(i=1,2,…,n),稱s=(s1,s2,…,sn)為一個策略組合;若用s-i=(s1,s2,…,si-1,si+1,…,sn),則s=(si,s-i)。

第2頁,課件共108頁,創(chuàng)作于2023年2月

用ui(s)=ui(s1,s2,…,sn)

(i=1,2,…,n)表示博弈方i在策略組合s=(s1,s2,…,sn)的得益,ui是策略集S1×S2×…×Sn上的多元函數。

定義1:若一個博弈的策略空間為Si,得益函數為:ui(s)=ui(s1,s2,…,sn)(i=1,2,…,n),則該博弈表示為:G={S1,S2,…,Sn;u1,u2,…,un}

。

第3頁,課件共108頁,創(chuàng)作于2023年2月二、上策均衡

定義2:一個博弈G,若對博弈方i及所有s-i都有ui(si′,s-i)>ui(si″,s-i),則稱si′是si″的嚴格上策,si″是si′的嚴格下策。

即:如果不管其他博弈方選擇什么策略,一博弈方的某個策略給他帶來的得益始終高于其他策略,該策略稱為該博弈方的一個“嚴格上策”。第4頁,課件共108頁,創(chuàng)作于2023年2月

定義3:若在博弈G中對每個博弈方i都存在策略si*是其它所有策略的嚴格上策,則稱策略組合s*=(s1*,s2*,…,sn*)是G的上策均衡。

在第一章的“囚徒困境”博弈中,其中(坦白,坦白)就是一個上策均衡。而其它例子都沒有上策均衡。

上策均衡反映了所有博弈方的絕對偏好,因此非常穩(wěn)定,根據上策均衡可以對博弈結果作出最肯定的預測。第5頁,課件共108頁,創(chuàng)作于2023年2月三、嚴格下策反復消去法

在博弈G中博弈方的嚴格下策當然是博弈方實際上不愿選擇的策略,因此可以從博弈方的策略集中去掉。

定義4:若博弈G中每個博弈方都反復去掉嚴格下策后剩下唯一策略組合s*=(s1*,s2*,…,sn*),則稱s*=(s1*,s2*,…,sn*)為G的反復消去嚴格下策均衡。第6頁,課件共108頁,創(chuàng)作于2023年2月

顯然第一章的“智豬博弈”中大豬“按”、小豬“等待”是一個

反復消去嚴格下策均衡。

例1:博弈G如右圖:1,01,30,10,40,22,0博弈方Ⅱ

左中右

求解反復消去嚴格下策均衡的方法稱為嚴格下策反復消去法。博弈方Ⅰ上下第7頁,課件共108頁,創(chuàng)作于2023年2月

解:博弈方Ⅱ的策略“右”是策略“中”的嚴格下策,消去策略“右”后為:0,41,00,21,3左中

博弈方Ⅰ的策略“下”是策略“上”的嚴格下策,消去策略“下”后為:1,01,3左中上

博弈方Ⅱ的策略“左”是策略“中”的嚴格下策,消去策略“左”后為可知(上,中)就是該博弈反復消去嚴格下策均衡。1,01,30,10,40,22,0左中右上下第8頁,課件共108頁,創(chuàng)作于2023年2月

嚴格下策反復消去法中每次消去的必須是嚴格下策,否則會出現(xiàn)一些意想不到的結果。

例2:博弈G如下圖:1,81,62,80,80,80,91,50,80,6博弈方ⅡLMR第9頁,課件共108頁,創(chuàng)作于2023年2月1,81,62,80,80,80,91,50,80,6

解:1)博弈方Ⅱ的策略“L”和“M”都是策略“R”的下策(不是嚴格下策),消去策略“L”和“M”后為:0,90,81,8R

博弈方Ⅰ的策略“S”和“D”都是策略“U”的嚴格下策,消去策略“S”和“D”后剩下唯一策略組合(U,R)。

LMRUSD第10頁,課件共108頁,創(chuàng)作于2023年2月

1,81,62,80,80,80,91,50,80,6

2)博弈方Ⅰ的策略“S”和“D”都是策略“U”的下策(不是嚴格下策),消去策略“S”和“D”后為:博弈方Ⅱ的策略“M”和“R”都是策略“L”的下策(不是嚴格下策),消去策略“M”和“L”后剩下唯一策略組合(U,L)。

LMRUSD1,81,62,8LMRU第11頁,課件共108頁,創(chuàng)作于2023年2月四、劃線法

博弈方的最終目標都是實現(xiàn)自身的最大利益。在具有策略和利益相互依存性的博弈問題中,各個博弈方的得益既取決于自己選擇的策略,還與其他博弈方選擇的策略有關,因此博弈方在決策時必須考慮其他博弈方的存在和策略選擇。

思路:找出自己針對其他博弈方每種策略或策略組合(對多人博弈)的最佳對策,即自己的可選策略中與其他博弈方的策略或策略組合配合,給自己帶來最大得益的策略(這種相對最佳對策總是存在的,不過不一定唯一)。若存在一個策略組合,使得所有博弈方的得益值下都劃了線,則該策略組合就是一個納什均衡。第12頁,課件共108頁,創(chuàng)作于2023年2月

例3:博弈G如右圖:0,41,00,00,20,11,3博弈方Ⅱ

左中右

解:該博弈的納什均衡為(上,中)。博弈方Ⅰ

上下第13頁,課件共108頁,創(chuàng)作于2023年2月

例4:博弈G如下圖:2,81,61,80,80,60,80,81,50,9博弈方Ⅱ

LMR

解:該博弈有兩個納什均衡(U,L)和(U,R)。

U博弈方Ⅰ

S

D第14頁,課件共108頁,創(chuàng)作于2023年2月

例5:博弈G如下圖:-1,1

1,-11,-1-1,1猜硬幣方正面反面蓋硬幣方正面反面

該博弈沒有一個策略組合是雙方同時愿意接受的。沒有純策略納什均衡。第15頁,課件共108頁,創(chuàng)作于2023年2月

例6:博弈G如下圖:2,1

0,0

0,01,3丈夫時裝足球妻子時裝足球

該博弈有兩個策略組合是雙方同時愿意接受的:(時裝,時裝),(足球,足球)。但是,由于具有上述特征的策略組合不是唯一的一個,因此我們也無法確定哪一個會出現(xiàn),對于這種博弈,劃線法顯然也沒有完全解決問題。第16頁,課件共108頁,創(chuàng)作于2023年2月五、箭頭法

箭頭法與劃線法的分析思路不同,但效果與劃線法相同。

考察在每個策略組合處各個博弈方能否通過單獨改變自己的策略而增加得益。如能,則從所分析的策略組合對應的得益數組引一箭頭,到改變策略后策略組合對應的得益數組。若存在一策略組合,其得益數組只有進來的箭頭而沒有出去的箭頭,則該策略組合就是納什均衡。

第17頁,課件共108頁,創(chuàng)作于2023年2月

例7:博弈G如右圖:1,01,30,10,40,20,0博弈方Ⅱ

左中右納什均衡為(上,中)。博弈方Ⅰ上下第18頁,課件共108頁,創(chuàng)作于2023年2月斗雞B進攻退卻-3,-32,00,20,0

例8:斗雞博弈

(進,退)和(退,進)是兩個納什均衡。斗雞A進攻退卻第19頁,課件共108頁,創(chuàng)作于2023年2月

一、納什均衡的定義

定義5:博弈G={S1,S2,…,Sn;u1,u2,…,un}中,若存在策略組合s*=(s1*,s2*,…,sn*),任一博弈方i的策略si*都是對其余博弈方策略組合s-i*=(s1*,s2*,…,si-1*,si+1*,…,sn*)最佳對策,即ui(si*,s-i*)≥ui(si,s-i*)對任意si∈Si都成立,則稱s*=(s1*,s2*,…,sn*)是G的一個納什均衡。2.2納什均衡第20頁,課件共108頁,創(chuàng)作于2023年2月二、納什均衡的一致預測性

一致預測性是指這樣一種性質:如果所有博弈方都預測一個特定的博弈結果會出現(xiàn),那么所有的博弈方都不會利用該預測或者這種預測能力,選擇與預測結果不一致的策略,即沒有哪個博弈方有偏離這個預測結果的愿望,因此這個預測結果最終真會成為博弈的結果。即:如果所有博弈方都預測一個特定的納什均衡會出現(xiàn),那么,沒有人有興趣作不同的選擇。

一致預測性是納什均衡的本質屬性。

一致預測性使納什均衡是穩(wěn)定的和自我強制的。第21頁,課件共108頁,創(chuàng)作于2023年2月三、納什均衡與嚴格下策反復消去法

上策均衡肯定是納什均衡,但反過來納什均衡不一定是上策均衡,因此上策均衡是比納什均衡更強、穩(wěn)定性更高的均衡概念。只是,上策均衡在博弈問題中的普遍性比納什均衡要差得多。第22頁,課件共108頁,創(chuàng)作于2023年2月

命題1:在n個博弈方的博弈G={S1,S2,…,Sn;u1,u2,…,un}中,如果s*=(s1*,s2*,…,sn*)是G的一個納什均衡,那么嚴格下策反復消去法一定不會將它消去。

證:用反證法:設策略組合

(s1*,s2*,…,sn*)是博弈G的一個納什均衡,且博弈方i的策略si*,是該策略組合中第一個由于相對于該博弈方的其他策略是嚴格下策而被消去的策略(也許是在其他某些策略被消去以后)。則必然存在博弈方i的某個策略si/

,該si/在si*被消去的時候還沒有被消去,并且是相對于si*

的嚴格上策,即滿足:第23頁,課件共108頁,創(chuàng)作于2023年2月ui(si/,s-i)>ui(si*,s-i)

…(1)

對任意由其他博弈方此時尚未消去的所有策略構成的策略組合s-i=(s1,…,si-1,si+1,…,sn)都成立。

由于假設si*是納什均衡(s1*,s2*,…,sn*)的各方策略中第一個被消去的,因此其他博弈方的策略s1*,…,si-1*,si+1*,…,sn*,在si*被消去的時候都還沒有被消去,于是對s-i*=(s1*,…,si-1*,si+1*,…,sn*)也必須成立.即:ui(si/,s-i*)>ui(si*,s-i*)

…(2)

第24頁,課件共108頁,創(chuàng)作于2023年2月

這顯然與(s1*,s2*,…,sn*)是納什均衡策略組合的假設相矛盾,因為不等式(2)表明si*不是博弈方i對其他博弈方的策略組合的最佳反應。

該矛盾證明了開頭所作的:納什均衡被嚴格下策反復消去法消去的假設是不可能成立的,這樣命題1就得到了證明。第25頁,課件共108頁,創(chuàng)作于2023年2月

命題2:在n個博弈方的博弈G中,如果嚴格下策反復消去法排除了除s*=(s1*,s2*,…,sn*)之外的所有策略組合,那么s*一定是該博弈惟一的納什均衡。

證:命題2的后半部分即惟一性可由命題1的結論得到證明。下面用反證法證明前半部分:第26頁,課件共108頁,創(chuàng)作于2023年2月

設嚴格下策反復消去法已經消去除了s*=(s1*,s2*,…,sn*)以外的所有策略組合。但s*卻不是一個納什均衡。就是說,至少存在某個博弈方i的某個策略si使得:ui(si,s-i*)>ui(si*,s-i*)

…(1)

但由于s*是經過嚴格下策反復消去法以后留下的惟一策略組合,因此si必然是被嚴格下策反復消去法消去的策略。也就是說,在嚴格下策反復消去過程中的某個階段,必然存在某個當時還沒有被消去的策略si/使得:第27頁,課件共108頁,創(chuàng)作于2023年2月ui(si/,s-i)>ui(si,s-i)

(2)

對由此時尚未被消去的,其他博弈方的策略構成的所有策略組合s-i都成立。

由于s*是本博弈經過嚴格下策反復消去法以后惟一留下的策略組合,因此策略s1*,…,

si-1*,si+1*,…,sn*始終不會被消去,因此也應該滿足(2)式,即:ui(si/,s-i*)>ui(si,s-i*)

…(3)第28頁,課件共108頁,創(chuàng)作于2023年2月

如果si/就是si*,即si*是相對于si的嚴格上策,則(3)式和(1)式相矛盾,從而s*不是納什均衡的假設不能成立。這就證明了命題。

如果si/與si*不同,則si/在嚴格下策反復消去的過程中也必須被消去(要不然s*就不會是留下的惟一的策略組合)。第29頁,課件共108頁,創(chuàng)作于2023年2月

進一步推定在某階段存在si//是相對于si/的嚴格上策,用si//和si/分別代替si/和si時,(2)式和(3)式仍然必須成立,如果si//就是si*

,則與上相同也證明了命題。

否則用si//代替si/重復上述過程。這樣,總會找到某個si(k)就是si*,從而證明在前述假設下必然導致(1)式和(3)式的矛盾,否定前述假設成立的可能性,由此證明了命題2。第30頁,課件共108頁,創(chuàng)作于2023年2月

根據上一節(jié)的分析已經明白,分析完全信息靜態(tài)博弈的關鍵是找出其中的納什均衡。但前面所討論都是可通過策略之間的兩兩比較進行分析的有限策略博弈模型。

在無限策略、連續(xù)策略空間的博弈中,納什均衡的概念同樣適用。我們通過具體模型來說明這種博弈的納什均衡分析方法。2.3無限策略博弈分析和反應函數第31頁,課件共108頁,創(chuàng)作于2023年2月一、古諾(Cournot)模型

古諾模型是研究寡頭壟斷市場的經典模型,在古諾模型中,假設一個市場有兩家生產同一種產品的廠商。如果廠商1的產量為q1,廠商2的產量為q2,則市場總產量為Q=q1十q2。設市場出清價格P(即可以將產品全部賣出去的價格)是市場總產量的函數(即逆需求函數)P=P(Q)=a-Q。再設兩廠商有相同的單位生產成本c1=c2=c,且都沒有固定成本,則該博弈中兩博弈方的得益(即兩廠商各目的利潤)分別為:

第32頁,課件共108頁,創(chuàng)作于2023年2月和

雖然本博弈中兩博弈方都有無限多種可選策略,但根據納什均衡的定義我們知道,納什均衡就是具有相互是最優(yōu)對策性質的各博弈方策略組成的策略組合?!ぁぁ?1)···(2)第33頁,課件共108頁,創(chuàng)作于2023年2月

因此,如果假設策略組合(q1*,q2*)是本博弈的納什均衡,則(q1*,q2*)必須是使得兩博弈方的得益達到最大值,即滿足:}}第34頁,課件共108頁,創(chuàng)作于2023年2月

要求上式的最大值,只需(1)、(2)兩式分別對q1、q2求偏導并令兩個偏導數都等于零,由此可得q1*,q2*應滿足方程組:第35頁,課件共108頁,創(chuàng)作于2023年2月

解之得該方程組唯—的一組解:兩博弈方的均衡得益(利潤)分別為:均衡總產量為:具體地,若設:則:第36頁,課件共108頁,創(chuàng)作于2023年2月

如果想對上述博弈結果作效率評價,可以再從兩廠商總體利益最大化的角度作一次產量選擇,根據已知條件求實現(xiàn)總得益(總利潤)最大的總產量。

設總產量為Q,則總得益為U=PQ-cQ=Q(8-Q)-2Q=6Q-Q2。很容易求得使總得益最大的總產量Q*=3,最大總得益U*=9。第37頁,課件共108頁,創(chuàng)作于2023年2月

將此結果與兩廠商獨立決策,追求自身而不是共同利益最大化時的博弈結果相比,不難發(fā)現(xiàn)此時總產量較小,而總利潤卻較高。

因此從兩廠商的總體來看,根據總體利益最大化確定產量效率更高。換句話說,如果兩廠商更多考慮合作,聯(lián)合起來決定產量,先定出使總利益最大的產量后各自生產一半(1.5,1.5單位),則各自可分享到的利益為4.5,比只考慮自身利益的獨立決策行為得到的利益要高。第38頁,課件共108頁,創(chuàng)作于2023年2月

當然,在獨立決策、缺乏協(xié)調機制的兩個企業(yè)之間,上述合作的結果并不容易實現(xiàn),即使實現(xiàn)了也往往是不穩(wěn)定的。合作難以實現(xiàn)或維持的原因主要是:各生產一半實現(xiàn)最大總利潤產量的產量組合(1.5,1.5)不是該博弈的納什均衡策略組合。第39頁,課件共108頁,創(chuàng)作于2023年2月

也就是說,在這個策略組合下,雙力都可以通過獨自改變(增加)自己的產量而得到更高的利潤,它們都有突破1.5單位產量的沖動。在缺乏由強制作用的協(xié)議等保障手段的情況下,這種沖動注定了維持上述較低水平的產量組合是不可能的,兩廠商早晚都會增產,只有達到納什均衡的產量水平(2,2)時才會穩(wěn)定下來。

因為只有這時候任一廠商單獨改變產量才不利于自己,這實際上也是一種“囚徒困境”,如果將遵守限額還是突破限額作為廠商面臨的選擇,則構成了得益矩陣如下圖的博弈。第40頁,課件共108頁,創(chuàng)作于2023年2月4.5,4.53.75,55,3.754,4廠商2不突破突破當然不難看出該博弈是一個囚徒困境博弈。

上述兩寡頭產量博弈只是古諾模型中比較簡單的一個特例,更一般的古諾模型是包括n個寡頭的寡占市場產量決策。但其分析方法是一樣的。典型例子:石油輸出國組織的限額和突破問題F4廠商1不突破突破第41頁,課件共108頁,創(chuàng)作于2023年2月二、反應函數

古諾模型的納什均衡也可以通過對劃線法思路的推廣來求,劃線法的思路是先找出每個博弈方針對其他博弈方所有策略(或策略組合)的最佳對策,然后再找出相互構成最佳對策的各博弈方策略組成的策略組合,也就是博弈的納什均衡。

在無限策略的古諾博弈模型中這樣的思路實際上也是可行的,只是其他博弈方的策略現(xiàn)在有無限多種,因此各個博弈方的最佳對策也有無限種,它們之間往往構成一種連續(xù)函數關系。第42頁,課件共108頁,創(chuàng)作于2023年2月

在上面討論的兩寡頭古諾模型中,對廠商2的任意產量q2,廠商1的最佳對策產量q1,就是使白己在廠商2生產產量q2的情況下利潤最大化的產量,即q1是最大化問題:的解。上式對q1求導并令導數等于0:由此得:第43頁,課件共108頁,創(chuàng)作于2023年2月

這樣我們得到了對于廠商2的每—個可能的產量,廠商1的最佳對策產量的計算公式,它是廠商2產量的一個連續(xù)函數,我們稱這個連續(xù)函數為廠商1對廠商2產量的一個“反應函數”(ReactionFunction)。同樣的方法,我們可再求出廠商2對廠商1產量q1的反應函數:q26363q1由于這兩個反應函數都是連續(xù)的線性函數,因此可以用坐標平面上的兩條直線表示它們,如圖:(2,2)第44頁,課件共108頁,創(chuàng)作于2023年2月

從圖中可以看出,當一方的產量選擇為0時,另一方的最佳反應為3。這正是實現(xiàn)市場總利潤最大的產量,因為這時候等于由一個廠商壟斷市場,市場總體利潤就是該廠商的利益;當一方的產量達到6時,另一方被迫選擇0,因為這時后者堅持生產已經無利可圖。

在兩個反應函數對應的兩條直線上,只有它們的交點(2,2)代表的產量組合,才是由相互對對方的最佳反應產量構成的。

R1(q2)上的其他所有點(q1,q2)只有q1是對q2的最佳反應,q2

不是對q1的最佳反應,而R2(q1)上的點則剛好相反。第45頁,課件共108頁,創(chuàng)作于2023年2月

根據納什均衡的定義,(2,2)是該古諾模型的納什均衡,并且因為它是惟一的一個,因此應該是該博弈的結果。這個結論與前面直接根據納什均衡定義得到的完全—樣。第46頁,課件共108頁,創(chuàng)作于2023年2月

現(xiàn)在我們把反應函數法應用到伯特蘭德模型的分析。伯持蘭德1883年提出了另一種形式的寡占模型。這種模型與選擇產量的古諾模型的區(qū)別在于,伯特蘭德模型中各廠商所選擇的是價格而不是產量。我們用簡單的兩寡頭且產品有一定差別的伯特蘭德價格博弈模型進行分析。三、伯特蘭德(Bertrand)寡頭模型第47頁,課件共108頁,創(chuàng)作于2023年2月

上述產品有一定差別是指兩個廠商生產的是同類產品,但在品牌、質量和包裝等方面有所不同,因此伯特蘭德模型中廠商的產品之間有很強的替代性。但又不是完全可替代,即價格不同時,價格較高的不會完全銷不出去。當廠商1和廠商2價格分別為P1和P2時,它們各自的需求函數為:和第48頁,課件共108頁,創(chuàng)作于2023年2月

從上式可以看出產品之間是有差別的,其中d1,d2>0即兩廠商產品的替代系數。我們也假設兩廠商無固定成本,假設邊際生產成本分別為c1和c2。兩博弈方的得益函數分別為:

我們直接用反應函數法分析這個博弈。上兩式分別對P1和P2求偏導,并令偏導數為0,由此得:第49頁,課件共108頁,創(chuàng)作于2023年2月很容易求出兩廠商對對方策略(價格)的反應函數分別為和第50頁,課件共108頁,創(chuàng)作于2023年2月

納什均衡(P1*,P2*)必是兩反應函數的交點,即必須滿足:求解此方程組即可得到納什均衡(P1*,P2*):記:第51頁,課件共108頁,創(chuàng)作于2023年2月具體地,如果進一步假設模型中的參數分別為:

將P1*,P2*代入得益函數則可進一步得到兩廠商的均衡得益值。則可以得到:P1*=P2*=20,u1*=u2*=324。第52頁,課件共108頁,創(chuàng)作于2023年2月

值得一提的另外一點是,這種價格決策與古諾模型中的產量決策一樣,其納什均衡也不如各博弈方通過協(xié)商、合作得到的最佳結果,因此也是囚徒困境的一種。

上述模型是伯特蘭德模型較簡單的情況。更一般的情況是有n個寡頭的價格決策,并且產品也可以是無差別的。第53頁,課件共108頁,創(chuàng)作于2023年2月

隨著社會經濟的不斷發(fā)展,我們越來越無法回避公共資源利用、公共設施提供和公共環(huán)境保護等方面的問題。而在這些問題中,也包含了眾多的博弈關系。我們以人們對公共資源利用方面的博弈關系為例來作一些討論。四、公共資源問題第54頁,課件共108頁,創(chuàng)作于2023年2月

在經濟學中,所謂公共資源是指具有(1)沒有哪個個人、企業(yè)或組織擁有所有權;(2)大家都可以自由利用,這樣兩個特征的自然資源或人類生產的供大眾免費使用的設施和財貨。

例如大家都可以開采使用的地下水,可自由放牧的草地,可自由排放廢水的公共河道(假設政府未予限制),以及公共道路、樓道的照明燈等。

由于公共資源有上述兩個特征,因而利用這些資源時不支付任何代價,除非政府將這些資源收歸國有,并對使用者征收資源稅或收取類似的費用。第55頁,課件共108頁,創(chuàng)作于2023年2月

最晚是從休漠1739年開始,政治經濟學者們就己經開始認識到,在人們完全從自利動機出發(fā)自由利用公共資源時,公共資源傾向于被過度利用、低效率使用和浪費,并且過度利用會達到任何利用它們的人都無法得到實際好處的程度。

我們用下面這個公共草地的放牧問題為例來論證這個結論。

設某村莊有n個農戶,該村有一片大家都可以自由放牧羊群的公共草地。出于這片草地的面積有限,因此只能讓不超過某一數量的羊群吃飽,如果在這片草地上放牧羊只的實際數量超過這個限度,則每只羊都無法吃飽,從而每只羊的產出(毛、皮、肉的總價值)就會減少,甚至只能勉強存活或要餓死。第56頁,課件共108頁,創(chuàng)作于2023年2月

假設這些農戶在夏天才到公共草地放羊,而每年春天就要決定養(yǎng)羊的數量,因此可看作各農戶在決定自己的養(yǎng)羊數量時是不知道其他農戶養(yǎng)羊數的,即各農戶決定養(yǎng)羊數的決策是同時作出的。

再假設所有農戶都清楚這片公共草地最多能養(yǎng)多少只羊和在羊只總數的不同水平下每只羊的產出。這就構成了n個農戶之間關于養(yǎng)羊數的一個博弈問題,并且是一個靜態(tài)博弈。

在此博弈中,博弈方就是n個農戶;他們各自的策略空間就是他們可能選擇的養(yǎng)羊數目qi(i=1,2,…,n)的取值范圍。第57頁,課件共108頁,創(chuàng)作于2023年2月

當各農戶養(yǎng)羊數為q1、q2、…、qn時,在公共草地上放牧羊只的總數為Q=q1+q2+

···+qn

,根據前面的介紹,每只羊的產出應是羊群總數Q的減函數V=V(Q)=V(q1,

q2,

…,

qn)。假設購買和照料每只羊的成本對每個農戶都是相同的不變常數c,則農戶i養(yǎng)qi只羊的得益函數為:為了使討論比較簡單和能得到直觀的結論,我們進—步設定下列具體數值。假設n=3,即只有三個農戶,每只羊的產出函數為V=100-Q=100-(q1+q2+q3),而成本c=4。這時,三農戶的得益函數分別為:第58頁,課件共108頁,創(chuàng)作于2023年2月

由于羊的數量不是連續(xù)可分的,因此上述函數不是連續(xù)函數。但我們在技術上也可以把羊的數量看作連續(xù)可分的,因此上述得益函數仍然可當作連續(xù)函數來處理。分別求三農戶各自對其他兩農戶策略(養(yǎng)羊數)的反應函數,得:第59頁,課件共108頁,創(chuàng)作于2023年2月

三個反應函數的交點(q1*,q2*,q3*)就是博弈的納什均衡。我們將q1*,q2*,q3*代入上述應函數,并解此聯(lián)立方程組,即得q1*=q2*=q3*=24,再將其代入三農戶的得益函數,則可得u1*=u2*=u3*=576,此即三農戶獨立同時決定在公共草地放羊數量時所能得到的利益。第60頁,課件共108頁,創(chuàng)作于2023年2月

為了對公共資源的利用效率作出評價,我們同樣也可討論總體利益最大的最佳羊只數量。設在該草地上羊只的總數為Q。則總得益為:

使總得益u最大的養(yǎng)羊數Q*必使總得益函數的導數為0,容易求得:

Q*=48,總得益值u*=2304。該結果比三農戶各自獨自決定自己的養(yǎng)羊數量時三農戶得益的總和1728大了許多。而此時的養(yǎng)羊數Q*=48則比三農戶獨立決策時草地上的羊只總數3×24=72小,因此,三農戶獨立決策時實際上使草地處于過度放牧的情況,浪費了資源,農戶也沒有獲到最好的效益。第61頁,課件共108頁,創(chuàng)作于2023年2月

如果各農戶能將養(yǎng)羊數自覺限制在48/3=16只,則他們都能得到更多的利益。但問題是他們面臨的也是一種囚徒的困境局面,因此很難實現(xiàn)這種理想的合作的結果。這個例子再一次證明了納什均衡,或者說非合作博弈的結果有可能是低效率的。

在本例中,如果利用上述草地資源的農戶數進一步增加,則納什均衡的效率會更低;如允許外來者任意加入利用該公共資源的行列,則所有利用該資源的人的利益很決都會消失,即羊只總數會隨著放牧農戶數的增加而增加到剛好不至于虧損的水平,各農戶將完全不能從在公共草地上養(yǎng)羊得到任何好處,公共資源等于完全被浪費掉。第62頁,課件共108頁,創(chuàng)作于2023年2月

公共資源利用方面常會出現(xiàn)這樣的悲劇,原因是每個可以利用公共資源的人都相當于面臨著一種囚徒的困境;在總體上有加大利用資源可能(至少加大利用者白身還能增加得益)時,自己加大利用而他人不加大利用則自己得利。自己加大利用但其他人也加大利用則自己不至于吃虧,最終是所有人都加大利用資源直至再加大只會減少利益的納什均衡水平,而這個水平肯定比實現(xiàn)資源最佳利用效率,同時也是個人最佳效率的水平要高。F5第63頁,課件共108頁,創(chuàng)作于2023年2月

公共設施問題也是類似的問題。在許多需要人類生產、提供的公共設施的問題上,做搭便車者(FreeRider)總是比做提供者合算。因此許多必需的公共設施,如樓道里的電燈等就總是沒人提供。這些公共資源博弈問題的結果說明了在公共資源的利用、公共設施的提供方面,政府的組織、協(xié)調和制約是非常必要的,這也可以說是政府之所以有必要存在的主要理由之一。第64頁,課件共108頁,創(chuàng)作于2023年2月

現(xiàn)在考慮一般情況:n個農戶養(yǎng)羊數分別為q1、q2、…、qn時,羊只總數為Q=q1+q2+···+qn

,每只羊的產出為v=v(Q)=v(q1,q2,…,qn)。是減函數,我們假定:

每只羊的成本為c,則農戶i的得益函數為:第65頁,課件共108頁,創(chuàng)作于2023年2月

則農戶i的得益最優(yōu)化的一階條件是:

上述一階條件可以作如下解釋:增加一只羊有正負兩方面的效應,正的效應是這只羊本身的價值v,負的效應是這只羊是他之前所有的羊的價值下降(qiv/(Q)<0)。最優(yōu)解滿足邊際收益等于邊際成本的條件。第66頁,課件共108頁,創(chuàng)作于2023年2月又因為:上述n個一階條件得到n個反應函數:第67頁,課件共108頁,創(chuàng)作于2023年2月

即第i個農民的飼養(yǎng)量隨其他農民的飼養(yǎng)量的增加而遞減。所以:第68頁,課件共108頁,創(chuàng)作于2023年2月

反應函數法的概念和思路非常簡單明了,它解決了我們分析一般的具有無限多種策略,有連續(xù)策略空間的博弈模型,因此反應函數法在博弈分析中非常有用。五、反應函數的問題和局限性

但這并不等于說有了反應函數的概念,就可以解決所有博弈的分析,或者分析出所有博弈的最終結果。第69頁,課件共108頁,創(chuàng)作于2023年2月

更進一步,即使我們討論的博弈問題中各博弈方的得益函數可以求導,可以導出各個博弈方的反應函數。也并不意味著反應函數法就一定能完全解決這些博弈。

因為在許多博弈中,博弈方的策略是很有限的而不是很多的,更不是連續(xù)的,博弈方的得益函數并不是連續(xù)的可導函數,所以無法用先求導找出各個博弈方的反應函數,再解聯(lián)立方程組的方法求納什均衡,反應函數法在分析這樣的博弈模型時不能發(fā)揮作用。第70頁,課件共108頁,創(chuàng)作于2023年2月因為在有些博弈問題中,各個博弈方的得益函數比較復雜,因而各自的反應函數也比較復雜,并不總是能夠保證各個博弈方的反應函數有交點,特別是不能保證有惟一的交點。

事實上,后面將反應函數擴展到混合策略時,就很容易出現(xiàn)多重交點反應函數的圖形。第71頁,課件共108頁,創(chuàng)作于2023年2月2.4混合策略和混合策略納什均衡一、嚴格競爭博弈和混合策略的引進二、多重均衡博弈和混合策略三、混合策略和嚴格下策反復消去法四、混合策略反應函數第72頁,課件共108頁,創(chuàng)作于2023年2月一、嚴格競爭博弈和混合策略的引進

(一)猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面(1)不存在前面定義的納什均衡策略組合(2)關鍵是不能讓對方猜到自己策略這類博弈很多,引出混合策略納什均衡概念第73頁,課件共108頁,創(chuàng)作于2023年2月

(二)混合策略、混合策略博弈和混合策略納什均衡

混合策略:在博弈中,博弈方i的策略空間為,則博弈方i以概率分布隨機在其k個可選策略中選擇的“策略”,稱為一個“混合策略”,其中對j=1,···,k都成立,且

第74頁,課件共108頁,創(chuàng)作于2023年2月

混合策略擴展博弈:當把博弈方在混合策略的策略空間(概率分布空間)的選擇看作一個博弈時,就是原博弈的“混合策略擴展博弈”。

混合策略納什均衡:包含混合策略的策略組合構成的納什均衡稱為“混合策略納什均衡”。第75頁,課件共108頁,創(chuàng)作于2023年2月

策略得益博弈方1

(0.8,0.2)2.6博弈方2

(0.8,0.2)2.6

(三)一個例子博弈方1的混合策略博弈方2的混合策略該博弈無純策略納什均衡,可用混合策略納什均衡分析2,35,23,11,5CDAB博弈方2博弈方1第76頁,課件共108頁,創(chuàng)作于2023年2月

(四)齊威王田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1

1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上上下中下中上上中下上下中中上下中下上下上中下中上田忌齊威王得益矩陣第77頁,課件共108頁,創(chuàng)作于2023年2月

該博弈中,齊威王和田忌都以1/6的相同概率隨機選擇各自的六個純策略,構成本博弈唯一的純策略納什均衡。

在上述混合策略下,齊威王的得益為:1/6(3+1+1+1+1-1)=1

田忌的得益為:1/6(1-3-1-1-1-1)=-1

即經過多次進行這樣的賽馬,齊威王平均每次能贏田忌一千斤銅,這是因為齊威王三匹馬的總體實力略勝田忌的三匹馬的緣故。第78頁,課件共108頁,創(chuàng)作于2023年2月

(五)小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對守位的處罰:短期中的效果是使守衛(wèi)真正盡職在長期中并不能使守衛(wèi)更盡職,但會降低盜竊發(fā)生的概率。0-D-D’守衛(wèi)得益(睡)SPt小偷偷的概率1第79頁,課件共108頁,創(chuàng)作于2023年2月V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重對小偷的處罰:短期內能抑制盜竊發(fā)生率,長期并不能降低盜竊發(fā)生率,但會是的守衛(wèi)更多的偷懶。0-P-P’小偷得益(偷)VPg守衛(wèi)睡的概率1第80頁,課件共108頁,創(chuàng)作于2023年2月二、多重均衡博弈和混合策略

(一)夫妻之爭的混合策略納什均衡妻子的混合策略丈夫的混合策略夫妻之爭博弈的混合策略納什均衡

策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.752,10,00,01,3芭蕾足球芭蕾足球丈夫妻子夫妻之爭第81頁,課件共108頁,創(chuàng)作于2023年2月

(二)制式問題1,30,00,02,2ABAB廠商2廠商1制式問題

制式問題混合策略納什均衡

AB得益廠商1:0.40.60.664廠商2:0.670.331.296第82頁,課件共108頁,創(chuàng)作于2023年2月進不進得益廠商1:

2/31/30廠商2:

2/31/30

(三)市場機會博弈-50,-50100,00,1000,0進不進進不進廠商2廠商1市場機會第83頁,課件共108頁,創(chuàng)作于2023年2月三、混合策略和嚴格下策反復消去法3,10,20,23,31,31,1LRUMD博弈方2博弈方1博弈方2采用純策略L時,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用純策略R時,博弈方1采用混合策略(1/2,1/2,0)的得益第84頁,課件共108頁,創(chuàng)作于2023年2月四、混合策略反應函數

在混合策略的范疇內,博弈方的決策內容為選擇概率分布,反應函數就是一方對另一方的概率分布的反應,同樣也是一定的概率分布。第85頁,課件共108頁,創(chuàng)作于2023年2月

猜硬幣博弈-1,11,-11,-1-1,1正面反面猜硬幣方正面反面猜硬幣博弈蓋硬幣方rq111/21/2(r,1-r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布第86頁,課件共108頁,創(chuàng)作于2023年2月

夫妻之爭博弈2,10,00,01,3時裝足球丈夫時裝足球妻子夫妻之爭rq111/33/4(r,1-r):妻子的混合策略概率分布(q,1-q):丈夫的混合策略概率分布第87頁,課件共108頁,創(chuàng)作于2023年2月2.5納什均衡的存在性

一、納什定理

納什在他1950年的經典論文中,首先提出了他自己稱為“均衡點”的納什均衡概念,并且同時證明了在相當廣泛的博弈類型中,混合策略意義上的納什均衡是普遍存在的。這個經典成果可以表述為下述定理:

納什定理(Nash1950):在一個有n個博弈方的博弈G={S1,…Sn;u1,…un}中,如果n是有限的,且Si都是有限集(對n=1,…,n),則該博弈至少存在一個納什均衡,但可能包含混合策略。

用更通俗的語言,這個定理就是說“每一個有限博弈都至少有一個混合策略納什均衡”。第88頁,課件共108頁,創(chuàng)作于2023年2月2.6納什均衡的選擇和分析方法擴展一、多重納什均衡博弈的分析二、共謀和防共謀均衡第89頁,課件共108頁,創(chuàng)作于2023年2月一、多重納什均衡博弈的分析(一)帕累托上策均衡(二)風險上策均衡(三)聚點均衡(四)相關均衡第90頁,課件共108頁,創(chuàng)作于2023年2月(一)帕累托上策均衡(鷹鴿博弈)這個博弈中有兩個純策略納什均衡,(戰(zhàn)爭,戰(zhàn)爭)和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個帕累托上策均衡。-5,-5-10,88,-1010,10戰(zhàn)爭和平國家2戰(zhàn)爭和平國家1戰(zhàn)爭與和平第91頁,課件共108頁,創(chuàng)作于2023年2月(二)風險上策均衡

考慮、顧及其他博弈方可能發(fā)生錯誤等情況時,帕累托上策均衡并不一定是最優(yōu)選擇,需要考慮:風險上策均衡。下面就是兩個例子。9,98,00,87,7LR博弈方2UD博弈方1風險上策均衡(D,R)5,53,00,33,3鹿兔子獵人2鹿兔子獵人1獵鹿博弈風險上策均衡(兔子,兔子)第92頁,課件共108頁,創(chuàng)作于2023年2月(三)聚點均衡

在多重納什均衡的博弈中,雙方同時選擇一個聚點構成的納什均衡簡稱為“聚點均衡”。

利用博弈設定以外的信息和依據選擇的均衡。

文化、習慣或者其他各種特征都可能是聚點均衡的依據。

城市博弈(城市分組相同)、時間博弈(報出相同的時間)是聚點均衡的典型例子。第93頁,課件共108頁,創(chuàng)作于2023年2月(四)相關均衡5,14,40,01,5LR博弈方2UD博弈方1相關均衡例子三個納什均衡:(U,L)、(D,R)和混合策略均衡[(1/2,1/2),(1/2,1/2)]結果都不理想,不如(D,L)??衫脪佊矌?,但仍不理想。相關裝置:1、各1/3概率發(fā)出A、B、C信號2、博弈方1只能看到是否A,博弈方2只能看到是否C3、博弈方1見A采用U,否則D;博弈方2見C采用R,否則L。相關均衡要點:1、構成納什均衡2、有人忽略不造成問題第94頁,課件共108頁,創(chuàng)作于2023年2月(一)多人博弈中的共謀問題本博弈的純策略納什均衡:(U,L,A)、(D,R,B)前者帕累托優(yōu)于后者。博弈的結果會是什么呢?(U,L,A)有共謀(Coalition)問題:博弈方1和2同時偏離。0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方2博弈方1博弈方3—A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方2博弈方1博弈方3—B二、共謀和防共謀均衡第95頁,課件共108頁,創(chuàng)作于2023年2月(二)防共謀均衡

如果一個博弈的某個策略組合滿足下列要求:

1、沒有任何單個博弈方的“串通”會改變博弈的結果,即單獨改變策略無利可圖;

2、給定選擇偏離的博弈方有再次偏離的自由時,沒有任何兩個博弈方的串通會改變博弈的結果;

3、依此類推,直到所有博弈方都參加的串通也不會改變博弈的結果。稱為“防共謀均衡”。前面例子中:(D,R,B)是防共謀均衡(U,L,A)不是防共謀均衡第96頁,課件共108頁,創(chuàng)作于2023年2月

案例一國會對聯(lián)邦儲備局

摘自《策略思維》第97頁,課件共108頁,創(chuàng)作于2023年2月

美國國會和聯(lián)邦儲備局經常在經濟政策上發(fā)生沖突。這兩個機構各自擁有相當獨立的制定經濟政策的權利。制定財政政策(稅收和政府支出)是國會的工作,而制定貨幣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論