版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第四講博弈論概論到目前為止,我們對經(jīng)濟(jì)活動(dòng)的考察沒有考慮人們之間行為的相互影響。其實(shí),現(xiàn)實(shí)中一個(gè)人的行為總是受到其他人行為的影響和制約,人們在追逐自己利益的過程中難免要與他人發(fā)生利益沖突或矛盾。如何克服和解決人們之間的利益沖突?如何才能實(shí)現(xiàn)一種既能讓每個(gè)人都實(shí)現(xiàn)自己的利益,又能讓每個(gè)人都不妨礙和傷害他人利益的互利互惠的和諧局面?博弈論(GameTheory)為解決這些問題提供了一種有力的科學(xué)分析框架。什么是博弈論自20世紀(jì)80年代以來,博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛應(yīng)用,在揭示人們經(jīng)濟(jì)行為的相互影響和相互制約方面取得了重大進(jìn)展。大部分經(jīng)濟(jì)活動(dòng)都可以用博弈論加以解釋,甚至連市場調(diào)節(jié)與宏觀調(diào)控這樣的重大問題都可以看成是特殊的博弈現(xiàn)象,納入到博弈論的范圍加以研究。博弈論的思想方法博大精深,已經(jīng)成為經(jīng)濟(jì)學(xué)的一個(gè)必不可少的組成部分。
Game參與人參與人的策略參與人的支付目標(biāo)函數(shù)規(guī)則下的行動(dòng)(期望)效用例子:田忌賽馬剪刀石頭布古諾斯塔克伯格思考:參與人數(shù)支付相抵策略數(shù)量同時(shí)開始類型博弈論是研究在策略性環(huán)境中如何進(jìn)行策略性決策和采取策略性行動(dòng)的科學(xué)。其中策略性環(huán)境是指每個(gè)人進(jìn)行的決策和采取的行動(dòng)都會(huì)對其他人產(chǎn)生影響。博弈的標(biāo)準(zhǔn)形式博弈的基本要素:局中人(玩家)、策略、收益。局中人的目標(biāo):收益最大化。策略博弈(gameofstrategies):局中人以策略定勝負(fù)。博弈的標(biāo)準(zhǔn)形式(normalformofagame):G=(Xi,
fi)n,其中
n
為局中人總數(shù),
Xi
為局中人
i
的策略集合,S
=X1X2Xn
為G的局勢集合,fi:SR為局中人
i
的收益函數(shù)。局勢:由各局中人的策略組成的n元組
(x1,
x2,,
xn)(其中xiXi)。博弈的分類一般按照博弈的基本要素進(jìn)行分類。按局中人數(shù)分:二人博弈、多人博弈按策略集合分:有限博弈、無限博弈按收益函數(shù)分:常和(零和)博弈、變和博弈按博弈性質(zhì)分:非合作博弈、合作博弈按行動(dòng)次序分:同時(shí)移動(dòng)博弈、先后移動(dòng)博弈(序貫博弈)
以上分類可以結(jié)合起來,形成更仔細(xì)的分類。比如,二人零和有限博弈(矩陣博弈)、多人非合作無限博弈等等。矩陣博弈
博弈是一種普遍的日?,F(xiàn)象。當(dāng)人們工作的時(shí)候,總是會(huì)有意識或潛意識地運(yùn)用博弈論思維。比如,企業(yè)在經(jīng)營決策中總是要考慮競爭對手的反應(yīng),個(gè)人與政府之間又存在著“上有政策,下有對策”的博弈跡象,金融監(jiān)管與金融創(chuàng)新則猶如“貓鼠博弈”。在人們休閑時(shí),博弈又作為消遣性的游戲讓人們從中取得快樂,甚至獲得智慧,例如下棋、玩牌、打麻將等。一般來講,博弈的特征表現(xiàn)為兩個(gè)或兩個(gè)以上具有利益沖突的當(dāng)事人處于一種不相容狀態(tài)中,一方的行動(dòng)取決于對方的行動(dòng),每個(gè)當(dāng)事人的收益都取決于所有當(dāng)事人的行動(dòng)。當(dāng)所有當(dāng)事人都拿定主意作出決策時(shí),博弈的局勢便得以確定。博弈論正是要研究人們之間的這種不相容的行為,它推廣了標(biāo)準(zhǔn)的一人決策理論。博弈論關(guān)注的問題是:在每個(gè)當(dāng)事人的收益都依賴于其他當(dāng)事人的選擇的情況下,追求個(gè)人收益最大化的當(dāng)事人應(yīng)該如何采取行動(dòng)。我們先以最簡單的矩陣博弈為重點(diǎn)來討論這個(gè)問題,建立博弈論的基本思路和分析框架。
因此,甲和乙的二人零和有限博弈G=(X,f;Y,g)可表示為G=(X,Y,f)。特別是當(dāng)策略集合X和Y既定時(shí),可直接用甲的收益矩陣表示這個(gè)博弈G
,并稱作“矩陣博弈
f”。
例
便士匹配
甲和乙在玩一種游戲,每人手中都有一枚硬幣,每人都有兩種選擇:出示硬幣正面、出示硬幣反面。
游戲規(guī)則:甲和乙各自獨(dú)立決定是出示正面還是出示反面。如果都出示正面或都出示反面,那么甲贏1元,乙輸1元;如果一人出示正面,而另一人出示反面,那么甲輸1元,乙贏1元。這個(gè)游戲就是通常所說的便士匹配博弈(MatchingPennies),它類似于小孩子玩的“手心手背”游戲。其標(biāo)準(zhǔn)形式如下:
乙甲出示正面出示反面出示正面1(甲)1(乙)1(甲)1(乙)出示反面1(甲)1(乙)1(甲)1(乙)便士匹配博弈收益表古諾均衡局中人的目標(biāo):選擇合適的策略以使自己的收益(對方的損失)達(dá)到最大,也就是要讓對方的收益(自己的損失)達(dá)到最小。我們來分析局中人的博弈過程以揭示博弈的最優(yōu)解。假定:甲和乙都彼此了解對方的收益矩陣,即雙方都清楚自己的收益就是對方的損失——利益沖突。博弈過程:既然每個(gè)局中人都要根據(jù)對方的行動(dòng)來調(diào)整和確定自己的行動(dòng),那么博弈過程必然是這樣的策略調(diào)整與選擇過程:每個(gè)人都要不斷地在對方選定了策略的情況下來調(diào)整自己的策略以使自己的收益達(dá)到最大。博弈結(jié)局:當(dāng)策略調(diào)整達(dá)到了這樣的局勢
(xh,yk)使得
xh是甲在乙選定yk的情況下的收益最大策略,同時(shí)yk是乙甲在選定xh的情況下的收益最大策略的時(shí)候,局中人雙方的策略調(diào)整得以結(jié)束,博弈的解得以確定,這個(gè)解即所謂的古諾均衡。即古諾均衡局中人的目標(biāo):選擇合適的策略以使自己的收益(對方的損失)達(dá)到最大,也就是要讓對方的收益(自己的損失)達(dá)到最小。假定:甲和乙都彼此了解對方的收益矩陣,即雙方都清楚自己的收益就是對方的損失——利益沖突。博弈過程:既然每個(gè)局中人都要根據(jù)對方的行動(dòng)來調(diào)整和確定自己的行動(dòng),那么博弈過程必然是這樣的策略調(diào)整與選擇過程:每個(gè)人都要不斷地在對方選定了策略的情況下來調(diào)整自己的策略以使自己的收益達(dá)到最大。博弈結(jié)局:當(dāng)策略調(diào)整達(dá)到了這樣的局勢
(xh,yk)使得
xh是甲在乙選定yk的情況下的收益最大策略,同時(shí)yk是乙甲在選定xh的情況下的收益最大策略的時(shí)候,局中人雙方的策略調(diào)整得以結(jié)束,博弈的解得以確定,這個(gè)解即所謂的古諾均衡。即古諾均衡:最小最大原理鞍點(diǎn)定理(最小最大原理)
是矩陣的鞍點(diǎn)(即博弈局勢(xh,yk)是矩陣博弈f的古諾均衡)當(dāng)且僅當(dāng)下述等式成立:
鞍點(diǎn)定理表明,要找到矩陣博弈的古諾均衡(即最優(yōu)解),只需按照如下步驟進(jìn)行:第一,從矩陣各行的最小元中找出最大元,稱為最大最小元;第二,從矩陣各列的最大元中找出最小元,稱為最小最大元;第三,如果最大最小元與最小最大元一致,那么該元素就是矩陣的鞍點(diǎn),代表矩陣博弈的古諾均衡。
乙甲作廣告不作廣告作廣告3030不作廣告2020例2.廣告競爭的古諾均衡單位:萬元古諾均衡:穩(wěn)妥策略與不穩(wěn)定性
最小最大原理指出,只有在收益矩陣的最大最小元與最小最大元一致的情況下,矩陣博弈才有最優(yōu)解。注意,最大最小元和最小最大元總是存在的,但最大最小元與最小最大元未必總是一致。這樣一來,矩陣博弈就可能沒有最優(yōu)解。比如,便士匹配博弈就沒有最優(yōu)解:該博弈的收益矩陣的最大最小元為和,最小最大元為和,結(jié)果最大最小元與最小最大元不一致,從而便士匹配博弈沒有最優(yōu)解。矩陣博弈可能沒有最優(yōu)解的真正原因是什么?
為了分析這個(gè)問題,我們把收益矩陣的最大最小元叫做甲的穩(wěn)妥策略;把收益矩陣的最小最大元叫做乙的穩(wěn)妥策略。矩陣博弈可能沒有最優(yōu)解的原因是穩(wěn)妥策略可能不穩(wěn)定:未必能使策略調(diào)整過程結(jié)束。因此,即使甲和乙都選擇穩(wěn)定策略,也未必能保證博弈達(dá)到古諾均衡。
古諾均衡:混合均衡
古諾均衡未必存在,這不是我們的期望。另外,實(shí)際中,局中人常常希望行動(dòng)隱秘而不被對手覺察。為了解決這兩個(gè)問題,人們提出了混合策略,即設(shè)計(jì)一種連自己都不知道會(huì)采取哪種策略的隨機(jī)策略,對手就更不得而知,從而使得局中人的行動(dòng)變得詭秘。
混合策略(mixedstrategies)
考慮二人有限博弈G=(X,f;Y,g)。X={x1,x2,…,xm}可叫做甲的純策略集合,Y={y1,y2,…,yn}可叫做乙的純策略集合,S=X
Y便為博弈G
的純局勢集合。甲可采取隨機(jī)選擇:以概率pi選擇純策略xi(
i=
1,
2,…,
m),從而可用概率分布p=(p1,p2,…,pm)來表示甲的這一選擇。這種以概率分布表示的策略叫做混合策略,集合叫做甲的混合策略集合。同樣,可給出乙的混合策略集合。集合就叫做博弈G的混合局勢集合。
甲和乙的收益矩陣分別為:。博弈G的混合擴(kuò)充為博弈:定理博弈G=(X,f;Y,g)為常和博弈當(dāng)且僅當(dāng)G
的混合擴(kuò)充為常和博弈。當(dāng)G
是常和博弈時(shí),G
與具有相同的收入常和。
G的混合擴(kuò)充的古諾均衡(最優(yōu)解)叫做G的混合均衡(混合最優(yōu)解)。換句話說,G的混合局勢(p*,q*)叫做的混合均衡(混合最優(yōu)解),是指(p*,q*)滿足如下條件:
定理(混合均衡的存在性)任何矩陣博弈都有混合均衡。例
便士匹配的混合最優(yōu)解
便士匹配博弈中,甲的收益矩陣為f。
尋找便士匹配博弈的混合最優(yōu)解,就是去找出使得。
矩陣博弈混合均衡的存在性以及鞍點(diǎn)定理保證了博弈值V(G)是一個(gè)良好定義的數(shù),并且當(dāng)(p*,q*)是的混合最優(yōu)解時(shí),必有V(G)
=Ef(p*,q*)。博弈值在解釋最優(yōu)解的性質(zhì)以及求解混合最優(yōu)解方面相當(dāng)有用,還可以通過博弈值來證明矩陣博弈G的混合均衡集(混合最優(yōu)解集)具有下述定理所述的特點(diǎn)。博弈值
定理
對于甲和乙的矩陣博弈G=(X,Y,f)來說,T=
T1T2
且混合均衡集
T是空間的非空有界閉凸子集,從而甲的混合最優(yōu)策略集T1是的非空有界閉凸子集,乙的混合最優(yōu)策略集T2是的非空有界閉凸子集。
矩陣博弈僅僅是一類簡單又典型的二人常和博弈,經(jīng)濟(jì)學(xué)中遇到的博弈往往都是變和博弈。矩陣博弈理論之所以重要,是因?yàn)樗鼮檠芯孔兒筒┺奶峁┝撕芎玫姆治鏊悸泛涂蚣堋,F(xiàn)在,我們來在矩陣博弈理論的基礎(chǔ)上建立一般的二人博弈理論。
二人有限博弈例
囚徒難題博弈乙甲合作背叛合作3000300004000背叛4000010001000囚徒難題博弈收益表古諾均衡(納什均衡)二人有限博弈:最小最大原理失效乙甲y1y2x15532x24366博弈GA:古諾均衡與最大最小元不一致乙甲y1y2x15637x24554博弈GB:不存在均衡,但存在最大最小元二人有限博弈:混合策略例
性別之戰(zhàn):性別差異導(dǎo)致效用收益差異定理(混合均衡的存在性)
任何二人有限博弈都有混合均衡??ǚ蛉氵_(dá)話劇足球話劇2100足球0012混合均衡:茹達(dá)和卡夫的預(yù)期收益都為2/3。意味著“男女平等”。
二人無限博弈現(xiàn)在考慮二人無限博弈G=(X,f;Y,g),其中X和Y
分別任意集合,局勢集合S=X
Y
是無限集合。顯然,二人有限博弈的混合擴(kuò)充就是二人無限博弈。二人無限博弈的混合擴(kuò)充依然是二人無限博弈。因此,在無限博弈的情形,無需專門討論混合擴(kuò)充。二人博弈的古諾均衡是滿足如下條件的局勢(x*,
y*):XYRf
(x*,
y*)(x*,
y*)x*y*古諾均衡二人無限博弈:古諾均衡存在性假設(shè)G1甲的策略集合X
是某個(gè)拓?fù)湎蛄靠臻gV1的非空緊凸子集,乙的策略集合Y
也是某個(gè)拓?fù)湎蛄靠臻gV2的非空緊凸子集,從而局勢集合S是拓?fù)湎蛄靠臻gV1V2的非空緊凸子集。假設(shè)G2甲的收益函數(shù)
f
(x,y)連續(xù)且關(guān)于策略變元
x
弱擬凹;乙的收益函數(shù)連續(xù)
g(x,y)且關(guān)于策略變元y
弱擬凹。范格不動(dòng)點(diǎn)定理
設(shè)T是拓?fù)湎蛄靠臻g的非空緊凸子集,F(xiàn):TT是集值映射。如果F上半連續(xù)且對任何xT,F(xiàn)(x)都是非空閉凸集,則F
有不動(dòng)點(diǎn),即(tT)(t=F(t))。定理(古諾均衡的存在性)任何滿足假設(shè)G1和G2的二人無限博弈都有古諾均衡。二人無限博弈:反應(yīng)函數(shù)
當(dāng)乙采取策略y時(shí),甲對乙的這一行動(dòng)的反應(yīng)是要確定甲的相應(yīng)對策x以使收益f
(x,y)在乙選擇y的情況下達(dá)到最大:f
(x,y)=max{
f
(x,y):xX}。這就確定了一個(gè)映射x=
(
y),叫做甲對乙的反應(yīng)函數(shù)。同樣,可以確定乙對甲的反應(yīng)函數(shù)
y=
(
x):g(x,y)=max{g(x,y):yY}。由“x*=
(
y*)&y*=
(
x*)”確定的局勢(x*,y*)的就是博弈G的均衡。
二人無限博弈的一種特殊情況:甲和乙的策略集合X和Y都是實(shí)數(shù)區(qū)間,收益函數(shù)f:XR和g:YR可微。則反應(yīng)函數(shù)由下述方程確定:比如,重復(fù)博弈
雖然我們已經(jīng)對二人博弈的最優(yōu)解作了研究,但讓局中人找到最優(yōu)解卻不是一個(gè)容易的過程,需要反復(fù)實(shí)踐和鍛煉,就好像棋手下棋一樣,需要反復(fù)不斷地下,才能越來越達(dá)到最優(yōu)解??梢?,博弈是可以重復(fù)進(jìn)行的。但到目前為止,我們所研究的博弈都是一次性博弈。因此,有必要研究博弈的重復(fù)。事實(shí)上,當(dāng)博弈可以重復(fù)進(jìn)行的時(shí)候,其最優(yōu)結(jié)局可能會(huì)與一次性博弈的均衡有所差異。下面以囚徒難題博弈為例來說明這個(gè)問題,分兩種情況討論:博弈重復(fù)有限次博弈重復(fù)無限次重復(fù)博弈:有限次重復(fù)
每個(gè)局中人都知道博弈將重復(fù)一個(gè)固定的次數(shù)??紤]最后一次博弈中局中人的推理:每個(gè)人都認(rèn)為他們此時(shí)是在進(jìn)行一次性博弈,這是最后一次行動(dòng),因而古諾均衡的標(biāo)準(zhǔn)邏輯推理得以應(yīng)用,其結(jié)果是局中人雙方選擇“背叛”。再考慮倒數(shù)第二次博弈,這里似乎每個(gè)局中人都重視合作,可以向?qū)Ψ桨l(fā)出“善意”的合作信號,以便能在下一次博弈中繼續(xù)合作。但局中人作為理性人,他清楚地知道最后一次博弈中對方必然背叛,因此他在倒數(shù)第二次博弈中采取合作就沒有優(yōu)勢可言,故要選擇背叛。同樣,在倒數(shù)第三次博弈中,局中人的推理與倒數(shù)第二輪博弈中的推理一樣,結(jié)果在倒數(shù)第三輪博弈中,局中人依然采取背叛。采用這種從后往前的“逆向歸納法(backwardinduction)”,便可知道每次博弈中,局中人雙方都要選擇“背叛”策略??梢?,在有限次重復(fù)博弈中,最優(yōu)的局勢依然是古諾均衡,也就是說,古諾均衡是局中人雙方的短期利益所在。重復(fù)博弈:無限次重復(fù)每個(gè)局中人都知道博弈要無限重復(fù)進(jìn)行下去。此時(shí),每個(gè)局中人的策略都是一個(gè)函數(shù)序列,它表明每個(gè)人在每個(gè)階段策略選擇都是此階段之前的博弈歷史的函數(shù)。這樣,局中人的收益是各階段收益的貼現(xiàn)值之和(向時(shí)刻0貼現(xiàn)):。R:局中人永不背叛的收益;RT:局中人第T次背叛的收益。
只要貼現(xiàn)率r<2,那么RT<R
,即采取背叛無利可圖,還是合作為好。收入的貼現(xiàn)率小于2是平常的,可見通常情況下,只要博弈能夠無限次重復(fù)下去,那么就可實(shí)現(xiàn)“(合作,合作)”的更好結(jié)局,這說明“(合作,合作)”是局中人雙方的長期利益所在。
非合作博弈
二人一次性博弈是典型的非合作博弈,局中人之間沒有串通和勾結(jié),各個(gè)局中人都是獨(dú)立決策和獨(dú)立行動(dòng)。
20世紀(jì)50年代,美國數(shù)學(xué)家納什成功地將這種博弈模式推廣到多人情形,接連發(fā)表了多篇研究論文,為現(xiàn)代博弈論的形成和發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。納什對多人非合作博弈作出了明確界定,提出了多人非合作博弈的納什均衡概念,并證明了納什均衡的存在性。由于納什均衡是對矩陣博弈的古諾均衡概念的推廣,因此人們也常常把納什均衡稱作古諾-納什均衡。納什均衡存在性定理的重要意義在于其結(jié)論可以直接向經(jīng)濟(jì)系統(tǒng)推廣,并且這種推廣是阿羅和德布羅重建瓦爾拉一般均衡理論大廈的關(guān)鍵所在。多人有限非合作博弈
定理(納什定理)
任何n人有限博弈都有(非合作)混合最優(yōu)解。多人連續(xù)博弈
對于多人無限博弈,人們更關(guān)注連續(xù)博弈,即在博弈的局勢集合上賦予了某種拓?fù)浣Y(jié)構(gòu),并且在該拓?fù)浣Y(jié)構(gòu)下各個(gè)局中人的收益函數(shù)都是連續(xù)函數(shù)。連續(xù)性表明:只要局中人行動(dòng)變化不大,局中人收益也就變化不大。
定理x*S是納什均衡
x*
(x*)(即x*為的不動(dòng)點(diǎn))。假設(shè)G1局中人
i
的策略集合Xi是某個(gè)拓?fù)湎蛄靠臻gVi的非空緊凸子集,從而局勢集合S是拓?fù)湎蛄靠臻gV1Vn的非空緊凸子集。假設(shè)G2連續(xù)且關(guān)于策略變元
xi弱擬凹。定理(均衡存在性)
任何滿足假設(shè)G1和G2的n
人非合作博弈都有納什均衡。帶約束條件的納什均衡
假設(shè)G3在受約束的博弈G
=
(Xi,
fi,
Bi)iI中,每個(gè)局中人
i
的約束集映Bi:SXi都是連續(xù)的集值映射,同時(shí)對任何xS,Bi(x)都是Xi的非空閉凸子集,并且Bi(x)與局中人i在局勢x中的策略無關(guān)。帶約束條件的納什均衡存在性定理
任何滿足假設(shè)G1、G2和G3的
n
人非合作博弈都有納什均衡。納什均衡:合作博弈
當(dāng)博弈從二人發(fā)展到多人參與的時(shí)候,局中人就不再像二人博弈那樣只是獨(dú)立行動(dòng),而是可以開展合作,一些局中人聯(lián)合起來對抗另外一些局中人。他們出于某種動(dòng)機(jī)或需要而結(jié)成聯(lián)盟,互通情報(bào)信息,采取一致行動(dòng),以便取得對自己有利的結(jié)果。這種相互配合、彼此協(xié)作、結(jié)成聯(lián)盟的現(xiàn)象就是合作博弈的原型。在合作博弈中,局中人自己的策略選擇已經(jīng)不再是什么重要問題,重要的是聯(lián)盟如何選擇策略,如何采取一致行動(dòng),聯(lián)盟的收入如何向其成員進(jìn)行分配。收入分配問題至關(guān)重要,它決定著局中人能否形成聯(lián)盟,盟外人又是否愿意加入到聯(lián)盟中來?,F(xiàn)在,我們來討論這些問題,建立多人合作博弈的理論。我們將以有限博弈為對象展開討論,至于無限博弈的情形,這里的理論和方法都可以自然地推廣過去。
合作博弈:聯(lián)盟對抗
博弈
G=(Xi,
ui)iI
的局中人集合為
I
=
{1,2,,n}。局中人的合作表現(xiàn)為結(jié)盟,即形成聯(lián)盟,這個(gè)聯(lián)盟就是
I
的子集。定義
博弈
G
中的一個(gè)聯(lián)盟是指局中人集合
I
的一個(gè)子集。對于這個(gè)定義,以下三點(diǎn)值得注意:
通過結(jié)盟,合作博弈可轉(zhuǎn)化為非合作博弈:若A是聯(lián)盟,那么G就成為聯(lián)盟
A
和其余聯(lián)盟
B的非合作博弈。即可把A和B都看成局中人:A
和
B
的策略集合分別為
XA=
iAXi和
XB=
iBXi,局勢集合為X=
iIXi=
XA
XB,局勢
x
=
(x1,,
xn)
=
(xA,
xB),A
和
B
的收益函數(shù)分別為
uA(x)
=
iA
ui(x)和
uB(x)
=
iB
ui(x),于是G
轉(zhuǎn)化為GA=
(XA,
uA;XB,
uB)。如果
A
是聯(lián)盟,那么
B
=
I
–
A
也是聯(lián)盟,稱為聯(lián)盟
A
的余聯(lián)盟。任何聯(lián)盟
A
都把局中人分成兩個(gè)聯(lián)盟:聯(lián)盟
A
和余聯(lián)盟
B。
I
和空集
都是聯(lián)盟且互為余聯(lián)盟。我們把空集
稱為空聯(lián)盟。只含一個(gè)局中人的集合也是聯(lián)盟,叫做單人聯(lián)盟。這是聯(lián)盟的特殊情形,實(shí)際上單人聯(lián)盟并沒有真正的結(jié)盟意義。合作博弈:特征函數(shù)
通過聯(lián)盟A,多人合作博弈G簡化為二人非合作博弈GA
=
(XA,
uA;XB,
uB),由此可引出博弈G的特征函數(shù)V:P
(I
)R:
V(A)是
A的收益函數(shù)uA在鞍點(diǎn)處的值。事實(shí)上,V(A)是二人零和博弈(XA,
uA;XB,
uA)的古諾均衡中局中人
A
的收益。馮·諾伊曼據(jù)此提出了如上的特征函數(shù)概念。特征函數(shù)V(A)具有以下基本性質(zhì):性質(zhì)1對于空聯(lián)盟來說,V()
=
0。(這是因?yàn)?/p>
u
=
0)性質(zhì)2若A,
BP
(I
)
且
AB
=,則V(AB
)
V(A)
+
V(B)。性質(zhì)3當(dāng)G為零和博弈時(shí),V(I
)
=
0
且(AP
(I
))(V(I
–
A)
=
V(A))。如果把性質(zhì)2中的不等式換為等式,即
V(AB
)
=
V(A)
+
V(B)
對一切不相交的聯(lián)盟
A和B都成立,則稱特征函數(shù)V
具有可加性。當(dāng)V具有可加性時(shí),
V(A)
=
iA
V({i})對一切聯(lián)盟
A
成立,
這表明結(jié)盟與不結(jié)盟沒有什么差別,從而博弈中合作沒有什么意義。這種具有可加特征函數(shù)的博弈,稱為非本質(zhì)博弈,人們感興趣的是本質(zhì)博弈。合作博弈:收入分配
特征函數(shù)表示聯(lián)盟總收入,那么這筆收入在聯(lián)盟內(nèi)部如何分配呢?為了研究聯(lián)盟內(nèi)的收入分配問題,首先給出收入分配的含義。
定義
博弈
G
=
(Xi,
ui)n
的收入分配(簡稱分配)是一個(gè)滿足如下條件的n維向量(r1,
r2,,
rn):V(I
)
=
iI
ri且ri
vi=V({i})
(i
=1,2,,n)。定義中的條件
V(I
)
=
iI
ri意味著局中人全體組成統(tǒng)一聯(lián)盟,并從這個(gè)聯(lián)盟中得到收入;vi=V({i})表示局中人單干的收入,即不與其他人結(jié)盟的情況下的收入;條件ri
vi意味著局中人參加聯(lián)盟所得到的收入不低于單干的收入,聯(lián)盟的吸引力就在于參加聯(lián)盟能夠得到更多的收入。向量v
=
(v1,
v2,,
vn)就叫做單干收入向量,根據(jù)特征函數(shù)的性質(zhì)可知,V(I
)
iI
vi。收入分配具有下述一些性質(zhì)。性質(zhì)1向量(r1,
r2,,
rn)
是G
的分配當(dāng)且僅當(dāng)存在向量(a1,
a2,,
an)
0
使得ri=
vi
+
ai(i
=1,2,,n)
且iI
ai=V(I
)
iI
vi。性質(zhì)2
n
人非本質(zhì)博弈的分配只有單干收入向量v
=
(v1,
v2,,
vn)。性質(zhì)3本質(zhì)博弈的分配有無限多個(gè)。合作博弈:核心最優(yōu)解
局中人結(jié)盟是因?yàn)榻Y(jié)盟能夠提高聯(lián)盟成員的收入。因此,對于任何一種收入分配
t
=
(t1,
t2,,
tn),如果存在AP
(I
)
及另一種收入分配r
=
(r1,
r2,,
rn)
使得V(A)
iA
ri
且ri
>
ti對一切
iA
成立,
那么
A中的局中人就會(huì)結(jié)盟一致反對收入分配
t以達(dá)到提高收入的目的,這個(gè)聯(lián)盟
A
就叫做收入分配
t
的反對者聯(lián)盟。一種收入分配只有不存在反對者聯(lián)盟的時(shí)候,才能被所有局中人接受。這種收入分配就是合作博弈的最優(yōu)解——核心最優(yōu)解。由所有核心最優(yōu)解構(gòu)成的集合,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年揚(yáng)州客運(yùn)從業(yè)資格證試題答案
- 2024年呼和浩特客運(yùn)員考試題庫答案
- 2024年承德客運(yùn)資格證考試題目
- 2024年廣東客運(yùn)資格證操作考試
- 吉首大學(xué)《工程制圖實(shí)驗(yàn)》2021-2022學(xué)年第一學(xué)期期末試卷
- 吉林藝術(shù)學(xué)院《素描基礎(chǔ)II》2021-2022學(xué)年第一學(xué)期期末試卷
- 吉林藝術(shù)學(xué)院《電影造型語言》2021-2022學(xué)年期末試卷
- 平地整田承包協(xié)議書范文模板
- 2022年山東省公務(wù)員錄用考試《申論》真題(B類)及答案解析
- 2024年大屏安裝合同簡易協(xié)議書模板
- 國際貿(mào)易理論與實(shí)務(wù)ppt課件(完整版)
- ICU常用的評估工具(疼痛、鎮(zhèn)靜、譫妄)
- 國際酒店前廳管理手冊前臺接待14-01 外幣兌換Foreign Exchange
- 如何利用記賬改善你企業(yè)
- 藥物化學(xué)習(xí)題答案
- 校本課程——中外名著閱讀
- 第2章現(xiàn)金流量與資金的時(shí)間價(jià)值
- 化工企業(yè)承包商安全管理
- 低空飛行基地項(xiàng)目可行性研究報(bào)告寫作參考范文
- 【新版】小學(xué)《安全在我心中》主題班會(huì).ppt課件
- 2018年人教版九年級英語單詞表
評論
0/150
提交評論