博弈論復習題及答案

上傳人：奔*** IP屬地：河北上傳時間：2023-12-26 格式：PDF 頁數(shù)：47 大?。?.09MB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩42頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

囚徒困境說明個人的理性選擇不一定是集體的理性選擇。（V）

子博弈精煉納什均衡不是一個納什均衡。（X）

博弈中知道越多的一方越有利。（X）

納什均衡一定是上策均衡。（X）

上策均衡一定是納什均衡。（J）

在一個博弈中只可能存在一個納什均衡。（X）

在一個博弈中博弈方可以有很多個。（V）

在一個博弈中如果存在多個納什均衡則不存在上策均衡。（J）

在博弈中納什均衡是博弈雙方能獲得的最好結(jié)果。（X）

在博弈中如果某博弈方改變策略后得益增加則另一博弈方得益

減少。（X）

上策均衡是帕累托最優(yōu)的均衡。（X）

因為零和博弈中博弈方之間關(guān)系都是競爭性的、對立的，因此零

和博弈就是非合作博弈。

（X）

在動態(tài)博弈中，因為后行動的博弈方可以先觀察對方行為后再選

擇行為，因此總是有利的。（X）

在博弈中存在著先動優(yōu)勢和后動優(yōu)勢，所以后行動的人不一定總

有利，例如：在斯塔克伯格模型中，企業(yè)就可能具有先動優(yōu)勢。

囚徒的困境博弈中兩個囚徒之所以會處于困境，無法得到較理想

的結(jié)果，是因為兩囚徒都不在乎坐牢時間長短本身，只在乎

不能比對方坐牢的時間更長。

(X)

納什均衡即任一博弈方單獨改變策略都只能得到更小利益的策

略組合。（J）

不存在純戰(zhàn)略納什均衡和存在惟一的純戰(zhàn)略納什均衡，作為原博

弈構(gòu)成的有限次重復博弈，共同特點是重復博弈本質(zhì)上不過是原

博弈的簡單重復，重復博弈的子博弈完美納什均衡就是每次重復

采用原博弈的納什均衡。（J）

多個純戰(zhàn)略納什均衡博弈的有限次重復博弈子博弈完美納什均

衡路徑：兩階段都采用原博弈同一個純戰(zhàn)略納什均衡，或者輪流

采用不同純戰(zhàn)略納什均衡，或者兩次都采用混合戰(zhàn)略納什均衡，

或者混合戰(zhàn)略和純戰(zhàn)略輪流采用。（J）

零和博弈的無限次重復博弈中，所有階段都不可能發(fā)生合作，局

中人會一直重復原博弈的混合戰(zhàn)略納什均衡。（J）（或：零

和博弈的無限次重復博弈中，可能發(fā)生合作，局中人不一定會一

直重復原博弈的混合戰(zhàn)略納什均衡。（X））

根據(jù)參與人行動的先后順序，博弈可以劃分為靜態(tài)博弈（static

game）和動態(tài)博弈（dynamicgame）o

如果階段博弈G有唯一的Nash均衡，那么對任意有限次T,重復博

弈G（T）有唯一的子博弈完美結(jié)局：在每一階段取G的Nash均衡策

略。（J）

四、名詞解釋(每小題3分，共15分)

參與人(player)

指的是博弈中選擇行動以最大化自己效用(收益)的決策主體,

參與人有時也稱局中人，可以是個人，也可以是企業(yè)、國家等

團體；

策略(strategy)

是參與人選擇行動的規(guī)則，如“以牙還牙”是一種策略；

信息(information)

是指參與人在博弈中的知識,尤其是有關(guān)其他參與人的特征和

行動的知識；

支付(payoff)函數(shù)

是參與人從博弈中獲得的效用水平,它是所有參與人策略或行

動的函數(shù)，是每個參與人很關(guān)心的東西；

結(jié)果(outcome)

是指博弈分析者感興趣的要素的集合,常用支付矩陣或收益矩

陣來表示；

均衡(equilibrium)

是所有參與人的最優(yōu)策略或行動的組合。

靜態(tài)博弈

指參與人同時選擇行動或雖非同時但后行動者并不知道先行

動者采取什么樣的行動;

動態(tài)博弈

指參與人的行動有先后順序，且后行動者能夠觀察到先行動者

所選擇的行動。

博弈

就是一些個人、隊組或其他組織，面對一定的環(huán)境條件，在一

定的規(guī)則下，同時或先后，一次或多次，從各自允許選擇的行

為或策略中進行選擇并加以實施，各自取得相應結(jié)果的過程。

零和博弈：

也稱“嚴格競爭博弈”。博弈方之間利益始終對立，偏好通常

不同

變和博弈：

零和博弈和常和博弈以外的所有博弈。合作利益存在，博弈效

率問題的重要性。

完全信息靜態(tài)博弈

即各博弈方同時決策，且所有博弈方對各方得益都了解的博

弈。

上策：

不管其它博弈方選擇什么策略,一博弈方的某個策略給他帶來

的得益始終高于其它的策略，至少不低于其他策略的策略

合作博弈

非合作博弈

零和博弈

常和博弈

變和博弈

上策均衡

納什均衡G={E，……%}

納什均衡：在博弈⑸一心中，如果由各個

博弈方的各一濟篦喝組就的某企第略組合s*S*中，任一

博弈方的策略，都是對其余博弈方策略的組合

的最佳對策，也即

對任意

⑹…s；）

都成立，則稱為的一個納什均衡

（或納什均衡是指這樣一種策略組合，這種策略組合由所有參與

人的最優(yōu)策略組成，即給定別人策略的情況下，沒有任何單個參

與人有積極性選擇其他策略，從而沒有任何參與人有積極性打破

這種均衡。）

完全信息博弈G={￡,…S"；/,…%}

混合篥暗;，祚博弈P,=（P樂樂）博弈方i的

策略窖間為外*.則博弈方以概率分布

隨機在其k個可選策略中選擇的“策略”，稱為一個“混合策

略”，其中

對=LY都成立，且

帕累托上策均衡

風險上策均衡

聚點均衡

重復博弈

指同樣結(jié)構(gòu)的博弈重復多次，其中的每次博弈稱為“階段博

弈”。

階段博弈

重復博弈中的每次博弈稱為“階段博弈”。

貼現(xiàn)因子

下一期的一單位支付在這一期的價值。

觸發(fā)戰(zhàn)略（TriggerStrategy）

首先試探合作，一旦發(fā)現(xiàn)對方不合作，則也用不合作相

報復的戰(zhàn)略。

子博弈精煉納什均衡

（夫妻博弈）一對新婚夫妻為晚上看什么電視節(jié)目爭執(zhí)不下，

丈夫（記為I方）要看足球比賽節(jié)目，而妻子（記為n方）要看

戲曲節(jié)目.他們新婚燕爾，相親相愛，所以若這方面的行動不一

致，則是很傷感情的.因此，這對夫妻間的爭執(zhí)是一次非零和對

二、計算與分析題（每小題15分，共45分）

1、無限次重復博弈與有限重復博弈的區(qū)別:

a.無限次重復博弈沒有結(jié)束重復的確定時間。在有限次

重復博弈中，存在最后一次重復正是破壞重復博弈中

局中人利益和行為的相互制約關(guān)系，使重復博弈無法

實現(xiàn)更高效率均衡的關(guān)鍵問題。

b.無限次重復博弈不能忽視不同時間得益的價值差異和

貼現(xiàn)問題，必須考慮后一期得益的貼現(xiàn)系數(shù)，對局中

人和博弈均衡的分析必須以平均得益或總得益的現(xiàn)值

為根據(jù)。

c.無限次重復博弈與有限次重復博弈的共同點：試圖

“合作”和懲罰“不合作”是實現(xiàn)理想均衡的關(guān)鍵，

是構(gòu)造高效率均衡戰(zhàn)略的核心構(gòu)件。

2、可口可樂與百事可樂（參與者）的價格決策：雙方都可以保

持價格不變或者提高價格（策略）；博弈的目標和得失情況體現(xiàn)

為利潤的多少（收益）；利潤的大小取決于雙方的策略組合（收

益函數(shù)）；博弈有四種策略組合，其結(jié)局是：

（1）如果雙方都不漲價，各得利潤10單位；

（2）如果可口可樂不漲價，百事可樂漲價，可口可樂利潤100,

百事可樂利潤-30；

（3）如果可口可樂漲價，百事可樂不漲價，可口可樂利潤-20,

百事可樂利潤30；

（4）如果雙方都漲價，可口可樂利潤140,百事可樂利潤35；

求納什均衡。

博弈的穩(wěn)定狀態(tài)有兩個：都不漲價或者都漲價（均衡），均衡稱

為博弈的解。

3、豬圈里有一頭大豬和一頭小豬，豬圈的一頭有一個飼料槽，

另一頭裝有控制飼料供應的按鈕。按一下按鈕就會有10個單位

飼料進槽，但誰按誰就要付出2個單位的成本。誰去按按紐則誰

后到；都去按則同時到。若大豬先到，大豬吃到9個單位，小豬

吃到一個單位；若同時到，大豬吃7個單位，小豬吃3個單位；

若小豬先到，大豬吃六個單位，小豬吃4個單位。各種情況組合

扣除成本后的支付矩陣可如下表示（每格第一個數(shù)字是大豬的得

益，第二個數(shù)字是小豬的得益）：

小豬

按等待

大豬按5,14,4

等待9,-10,0

求納什均衡。

在這個例子中，我們可以發(fā)現(xiàn)，大豬選擇按，小豬最好選擇等待,

大豬選擇不按，小豬還是最好選擇等待。即不管大豬選擇按還是

不按，小豬的最佳策略都是等待。也就是說，無論如何，小豬都

只會選擇等待。這樣的情況下，大豬最好選擇是按，因為不按的

話都餓肚子，按的話還可以有4個單位的收益。所以納什均衡是

(大豬按，小豬等待)。

4、根據(jù)兩人博弈的支付矩陣回答問題:

2,30,0

0,04,2

(1)寫出兩人各自的全部策略，并用等價的博弈樹來重新表示

這個博弈(6分)

(2)找出該博弈的全部純策略納什均衡，并判斷均衡的結(jié)果是

否是Pareto有效。

(3)求出該博弈的混合策略納什均衡。(7分)

(1)策略

甲：AB

乙：ab

博弈樹(草圖如下：

⑵PureNE(A,a);(B,b)

都是Pareto有效，僅(B,b)是K-H有效。

(3)MixedNE((2/5,3/5);(2/3,1/3))

5、用反應函數(shù)法求出下列博弈的所有純戰(zhàn)略納什均衡。

參與

人2

abed

A2,33,23,40,3

參與B4,45,20,11,2

人1

C3,14,11,410,2

D3,14,1-1,210,1

解答：

純策略納什均衡為（B,a）與（A,c）

分析過程：設兩個參與人的行動分別為4和

氏如果%=a

playerl的反應函數(shù)4（%）=?民?/"=占

A,如果生=c

C或者D,如果%=d

c,如果q=A

player2的反應函數(shù)0⑷一丁坐=，

C,如果4=C

G如果q=D

交點為（B,a）與（A,c）,因此純策略納什均衡為（B,a）與

(A,c)o

6、(entrydeterrence市場威懾)考慮下面一個動態(tài)博弈：首

先，在一個市場上潛在的進入者選擇是否進入，然后市場上的已

有企業(yè)(在位者)選擇是否與新企業(yè)展開競爭。在位者可能有兩

種類型，溫柔型(左圖)和殘酷型(右圖),回答下面問題。

左圖溫柔型

右圖：殘酷型

(1)找出給定在位者的兩種類型所分別對應的納什均衡，以及

子博弈精煉納什均衡(12分)

(2)已有企業(yè)為溫柔型的概率至少多少時，新企業(yè)才愿意進入

(8分)

(1)溫柔NE(in,accommodate)和(out,fight)oSPNE

為(in,accommodate)

殘酷NE(out,fight).SPNE同理

(2)20〃—10(1-〃)>=0得到p>=l/3

8、博弈方1和博弈方2就如何分10,000元錢進行討價還價。

假設確定了以下規(guī)則：雙方同時提出自己要求的數(shù)額A和B,0

WA,BW10,000o如果A+BW10,000,則兩博弈方的要求得到

滿足，即分別得A和B,但如果A+B>10,000,則該筆錢就沒

收。問該博弈的納什均衡是什么？如果你是其中一個博弈方，你

會選擇什么數(shù)額？為什么？

答十、納什均衡有無數(shù)個。最可能的結(jié)果是（5000,5000）這個

聚點均衡。

9、北方航空公司和新華航空公司分享了從北京到南方冬天度假

勝地的市場。如果它們合作，各獲得500000元的壟斷利潤，但

不受限制的競爭會使每一方的利潤降至60000元。如果一方在價

格決策方面選擇合作而另一方卻選擇降低價格，則合作的廠商獲

利將為零，競爭廠商將獲利900000元。

（1）將這一市場用囚徒困境的博弈加以表示。

（2）解釋為什么均衡結(jié)果可能是兩家公司都選擇競爭性策略。

答：（1）用囚徒困境的博弈表示如下表：

北方航空公司

合作競爭

合作500000,0,900000

新華航空公

500000

司

競爭900000,060000,60000

（2）如果新華航空公司選擇競爭，則北方航空公司也會選

擇競爭（60000>0）；若新華航空公司選擇合作，北方航空公司仍

會選擇競爭（900000>500000）o若北方航空公司選擇競爭，新華

航空公司也將選擇競爭（60000>0）；若北方航空公司選擇合作，

新華航空公司仍會選擇競爭（900000>0）。由于雙方總偏好競爭,

故均衡結(jié)果為兩家公司都選擇競爭性策略，每一家公司所獲利潤

均為600000元。

12、設啤酒市場上有兩家廠商，各自選擇是生產(chǎn)高價啤酒還是低

價啤酒，相應的利潤（單位：

萬元）由下圖的得益矩陣給出：

廠商B

低價高價

低價100,80050,50

廠商A-20,-30900,600

（1）有哪些結(jié)果是納什均衡？

（2）兩廠商合作的結(jié)果是什么？

答（1）（低價，高價），（高價，低價）

（2）（低價，高價）

13、A、B兩企業(yè)利用廣告進行競爭。若A、B兩企業(yè)都做廣告，

在未來銷售中，A企業(yè)可以獲得20萬元利潤，B企業(yè)可獲得8萬

元利潤；若A企業(yè)做廣告，B企業(yè)不做廣告，A企業(yè)可獲得25萬

元利潤，B企業(yè)可獲得2萬元利潤；若A企業(yè)不做廣告，B企業(yè)

做廣告，A企業(yè)可獲得10萬元利潤，B企業(yè)可獲得12萬元利潤;

若A、B兩企業(yè)都不做廣告，A企業(yè)可獲得30萬元利潤，B企業(yè)

可獲得6萬元利潤。

（1）畫出A、B兩企業(yè)的支付矩陣。

（2）求納什均衡。

3.答：（1）由題目中所提供的信息，可畫出A、B兩企業(yè)的

支付矩陣（如下表）。

B企業(yè)

做廣告不做廣告

做廣告20,825,2

A企業(yè)

不做廣告10,1230,6

（2）因為這是一個簡單的完全信息靜態(tài)博弈，對于純策納

什均衡解可運用劃橫線法求解。

如果A廠商做廣告，則B廠商的最優(yōu)選擇是做廣告，因為做

廣告所獲得的利潤8大于不做廣告獲得的利潤2,故在8下面劃

一橫線。如果A廠商不做廣告，則B廠商的最優(yōu)選擇也是做廣告,

因為做廣告獲得的利潤為12,而不做廣告的利潤為6,故在12

下面劃一橫線。

如果B廠商做廣告，則A廠商的最優(yōu)選擇是做廣告，因為做

廣告獲得的利潤20大于不做廣告所獲得的利潤10,故在20下面

劃一橫線。如果B廠商不做廣告，A廠商的最優(yōu)選擇是不做廣告,

因為不做廣告獲得的利潤30大于做廣告所獲得的利潤25,故在

30下面劃一橫線。

在本題中不存在混合策略的納什均衡解，因此，最終的純策

略納什均衡就是A、B兩廠商都做廣告。

15、求出下面博弈的納什均衡（含純策略和混合策略）。

乙

5,00,8

2,64,5

由劃線法易知，該矩陣博弈沒有純策略Nash均衡。

可得如下不等式組

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-l

可得混合策略Nash均衡（0卻，（粉）

16、某產(chǎn)品市場上有兩個廠商，各自都可以選擇高質(zhì)量，還是

低質(zhì)量。相應的利潤由如下得益矩陣給出：

（1）該博弈是否存在納什均衡？如果存在的話，哪些結(jié)果是納什

均衡？

參考答案：

由劃線法可知，該矩陣博弈有兩個純策略Nash均衡，即（低質(zhì)量,

高質(zhì)量），（高質(zhì)量，低質(zhì)量）。

乙企業(yè)

高質(zhì)量低質(zhì)量

高

50,50100,800

質(zhì)900,600-20,-30

量

該矩陣博弈還有一個混合的納什均衡

Q=a+d-b-c=-970,q=d-b=-120,R=-1380,r=-630,可得

1263

X-?7，y-138

因此該問題的混合納什均衡為喏，第，播,來）。

17、甲、乙兩企業(yè)分屬兩個國家，在開發(fā)某種新產(chǎn)品方面有如下

收益矩陣表示的博弈關(guān)系。試求出該博弈的納什均衡。如果乙企

業(yè)所在國政府想保護本國企業(yè)利益，可以采取什么措施？

乙企業(yè)

不開

開發(fā)

發(fā)

甲開

-10,-10100,0

企發(fā)

業(yè)不^

開0,1000,0

發(fā)III

解：用劃線法找出問題的純策略納什均衡點。

--10-10100,0'

0,1000,0

所以可知該問題有兩個純策略納什均衡點（開發(fā),不開發(fā)）和（不

開發(fā),開發(fā)）。

該博弈還有一個混合的納什均衡（（當雜，（當雜）。

如果乙企業(yè)所在國政府對企業(yè)開發(fā)新產(chǎn)品補貼a個單位,則收益

矩陣變?yōu)椋嚎讴Z匕一雷卜要使（不開發(fā),開發(fā)）成為該博弈的唯一

納什均衡點，只需a>10o此時乙企業(yè)的收益為100+ao

18、博弈的收益矩陣如下表:

乙

左右

上a,bc,d

甲

下e,fg,h

（1）如果（上，左）是占優(yōu)策略均衡，則a、b、c、d、e、

f、g、h之間必然滿足哪些關(guān)系？（盡量把所有必要的關(guān)系式都

寫出來）

(2)如果(上，左)是納什均衡，則(1)中的關(guān)系式哪些

必須滿足？

(3)如果(上，左)是占優(yōu)策略均衡，那么它是否必定是

納什均衡？為什么？

(4)在什么情況下，純戰(zhàn)略納什均衡不存在？

答：(1)a>e,c>g,h>dtf>ho本題另外一個思考角度是從

占優(yōu)策略均衡的定義出發(fā)。對乙而言，占優(yōu)策略為?/)>(”,〃)；而

對甲而言，占優(yōu)策略為(a,c)>(e,g)o綜合起來可得到所需結(jié)論。

(2)納什均衡只需滿足：甲選上的策略時，b>d,同時乙選

左的策略時，故本題中納什均衡的條件為：b>dta>eo

(3)占優(yōu)策略均衡一定是納什均衡，因為占優(yōu)策略均衡的

條件包含了納什均衡的條件。

(4)當對每一方來說，任意一種策略組合都不滿足納什均

衡時，純戰(zhàn)略納什均衡就不存在。

19、Smith和John玩數(shù)字匹配游戲，每個人選擇1、2、3,如果

數(shù)字相同，John給Smith3美元，如果不同，Smith給John1

美元。

(1)列出收益矩陣。

(2)如果參與者以1/3的概率選擇每一個數(shù)字，證明該混合

策略存在一個納什均衡，它為多少？

答：(1)此博弈的收益矩陣如下表。該博弈是零和博弈，無

納什均衡。

John

123

13,-3-1,1-1,1

Smith2-1,13,-3-1,1

3-1,1-1,13,-3

(2)Smith選(1/3,1/3,1/3)的混合概率時,

John選1的效用為：U\=gx(-3)+gxl+gxl=-g

John選2的效用為：U2=1xl+lx(-3)+1xl=-1

John選3的效用為：6=gxi+；xi+gx(-3)=-g

類似地，John選(1/3,1/3,1/3)的混合概率時，

Smith選1的效用為：U\=gx3+；x(_l)+gx(-l)=g

Smith選2的效用為：U2=gx(_l)+；x3+gx(T)=g

Smith選3的效用為：i/；=^x(-i)+lx(-i)+lx3=1

因為U\=lh=U3,U[=U'2=U39所以：

上34裊]是納什均衡，策略值分別為John：u=T；Smith：

JJJJJ。J

U=-o

20、假設雙頭壟斷企業(yè)的成本函數(shù)分別為：C,=200],Ci=1QI,市場

需求曲線為0=400—2。9其中，Q=Qi+Q。

(1)求出古諾(Cournot)均衡情況下的產(chǎn)量、價格和利潤,

求出各自的反應和等利潤曲線，并圖示均衡點。

(2)求出斯塔克博格(Stackelberg)均衡情況下的產(chǎn)量、

價格和利潤，并以圖形表示。

(3)說明導致上述兩種均衡結(jié)果差異的原因。

答：(1)對于壟斷企業(yè)1來說：

max[400-2(21+Q2)lQi-20Qi

這是壟斷企業(yè)1的反應函數(shù)。

其等利潤曲線為：m=3802,-2(2,22-2Q,2

對壟斷企業(yè)2來說：

max[400-2(a+。2)]。2-22

=02=50-

這是壟斷企業(yè)2的反應函數(shù)。

其等利潤曲線為：萬2=40022-2QQ-4Q9

在達到均衡時，有：

190-150-^-1,

2,=一1一口=枚尸8。

⑵2122=30

均衡時的價格為：P=400-2x(80+30)=18()

兩壟斷企業(yè)的利潤分別為：

4=380x80-2x80x30-2x802=12800

"2=400x30-2x80x30-4x302=3600

均衡點可圖示為：

(2)當壟斷企業(yè)1為領(lǐng)導者時，企業(yè)2視企業(yè)1的產(chǎn)量為

既定，其反應函數(shù)為:

Qz=5（）-Q"4

則企業(yè)1的問題可簡化為:

max400-2（Q1+50-號）卜-2（XZ

21=280/3

Q2=80/3

均衡時價格為：P=400_*2+與=160

利潤為：辦=39200/39和=25600/9

該均衡可用下圖表示:

企業(yè)2領(lǐng)先時可依此類推。

(3)當企業(yè)1為領(lǐng)先者時，其獲得的利潤要比古諾競爭下多。

而企業(yè)2獲得的利潤較少。這是因為，企業(yè)1先行動時，其能考

慮企業(yè)2的反應，并以此來制定自己的生產(chǎn)計劃，而企業(yè)2只能

被動地接受企業(yè)1的既定產(chǎn)量，計劃自己的產(chǎn)出，這是一種“先

動優(yōu)勢”

21、在一個由三寡頭操縱的壟斷市場中，逆需求函數(shù)為

p=a-qi-q2-q3,這里Qi是企業(yè)i的產(chǎn)量。每一企業(yè)生產(chǎn)的單位成

本為常數(shù)Co三企業(yè)決定各自產(chǎn)量的順序如下：(1)企業(yè)1首先選

擇(2)企業(yè)2和企業(yè)3觀察到5,然后同時分別選擇q2

和q30試解出該博弈的子博弈完美納什均衡。

答：該博弈分為兩個階段，第一階段企業(yè)1選擇產(chǎn)量5,第二階

段企業(yè)2和3觀測到5后，他們之間作一完全信息的靜態(tài)博弈。

我們按照逆向遞歸法對博弈進行求解。

(1)假設企業(yè)1已選定產(chǎn)量5,先進行第二階段的計算。設企

業(yè)2,3的利潤函數(shù)分別為：

-cc

兀2=(a-q!-q2一口3用212

7u3=(a-ql-q2-q3)q2-cq3

由于兩企業(yè)均要追求利潤最大，故對以上兩式分別求一階條件：

——二a—q、-2^2-%-c=0(1)

陽2

^-=a-q,-q2-2q3-c=0(2)

因3

求解(1)、(2)組成的方程組有：

(3)

（2）現(xiàn)進行第一階段的博弈分析：

對與企業(yè)1,其利潤函數(shù)為；

7ii=（a-q1-q2-q3）ql-cq|

將（3）代入可得：

兀產(chǎn)qG.D（4）

式（4）對qi求導：

=a-2q[-c=0

的?41

解得：

q；=；（a-c）（5）

此時，7i；=J（a-c）2

（3）將式（5）代回（3）和（4）有該博弈的子博弈完美納什均

衡：

q；=!（a-c）,q；=q；=：（a-c）

25、某寡頭壟斷市場上有兩個廠商，總成本均為自身產(chǎn)量的20

倍,市場需求函數(shù)為Q=200-Po

求（1）若兩個廠商同時決定產(chǎn)量，產(chǎn)量分別是多少？

（2）若兩個廠商達成協(xié)議壟斷市場，共同安排產(chǎn)量，則各自的

利潤情況如何？

答:（1）分別求反應函數(shù),180-2Ql-Q2=0,180-Ql-2Q2=0,

Ql=Q2=60

(2)200-2Q=20,Q=90,Q1=Q2=45

26、一個工人給一個老板干活，工資標準是100元。工人可以選

擇是否偷懶，老板則選擇是否克扣工資。假設工人不偷懶有相當

于50元的負效用，老板想克扣工資則總有借口扣掉60元工資,

工人不偷懶老板有150元產(chǎn)出，而工人偷懶時老板只有80元產(chǎn)

出，但老板在支付工資之前無法知道實際產(chǎn)出，這些情況雙方都

知道。請問：

(D如果老板完全能夠看出工人是否偷懶，博弈屬于哪種類型？

用得益矩陣或擴展形表示

該博弈并作簡單分析。

(2)如果老板無法看出工人是否偷懶，博弈屬于哪種類型？用

得益矩陣或擴展形表示該博

弈并作簡單分析。

(1)完全信息動態(tài)博弈。

(40,40)(100,-20)(-10.110)(50,50)

博弈結(jié)果應該是工人偷懶，老板克扣。

（2）完全信息靜態(tài)博弈，結(jié)果仍然是工人偷懶，老板克扣。

老板

克扣不克扣

-20,-30900,600

工人

100,80050,50

不偷懶

27、舉一個你在現(xiàn)實生活中遇到的囚犯兩難困境的例子。

答：在校園的人行道交叉路口，無需紅綠燈。現(xiàn)在兩人分別

騎車從東西方向和南北方向通過路口。若同時往前沖，必定相撞,

各自支付為（-2,-2）；若同時停下，都不能按時前進，支付為

（0,0）；若一人前進一人停下，支付為（2,0）或（0,2）。相

應的策略和支付矩陣如下表。

乙

前進停卜

前進-2,~22,0

甲

停卜0,20,0

28、給定兩家釀酒企業(yè)A、B的收益矩陣如下表:

A企業(yè)

白酒啤酒

白酒700,600900,1000

B企業(yè)

啤酒800,900600,800

表中每組數(shù)字前面一個表示B企業(yè)的收益，后一個數(shù)字表示

B企業(yè)的收益。

（1）求出該博弈問題的均衡解，是占優(yōu)策略均衡還是納什

均衡？

（2）存在帕累托改進嗎？如果存在，在什么條件下可以實

現(xiàn)？福利增量是多少？

（3）如何改變上述A、B企業(yè)的收益才能使均衡成為納什均

衡或占優(yōu)策略均衡？如何改變上述A、B企業(yè)的收益才能使該博

弈不存在均衡？

答：（1）有兩個納什均衡，即（啤酒，白酒）、（白酒，啤

酒），都是納什均衡而不是占優(yōu)策略均衡。

（2）顯然，（白酒，啤酒）是最佳均衡，此時雙方均獲得其

最大收益。若均衡解為（啤酒，白酒），則存在帕累托改善的可

能。方法是雙方溝通，共同做出理性選擇，也可由一方向另一方

支付報酬。福利由800+900變?yōu)?00+1000,增量為200。

（3）如將（啤酒，白酒）支付改為（1000,1100）,則（啤

酒，白酒）就成為占優(yōu)策略均衡。比如將（啤酒，白酒）支付改

為（800,500）,將（白酒，啤酒）支付改為（900,500）,則該

博弈就不存在任何占優(yōu)策略均衡或納什均衡。

30、在納稅檢查的博弈中，假設A為應納稅款，C為檢查成本，F(xiàn)

是偷稅罰款，且C<A+F；S為稅務機關(guān)檢查的概率，E為納稅人逃

稅的概率；不存在純戰(zhàn)略納什均衡。

(1)寫出支付矩陣。

(2)分析混合策略納什均衡。

答：(1)該博弈的支付矩陣如下表：

納稅人

逃稅不逃稅

檢查A-C+F,-A-FA-C,-A

稅收機關(guān)

不檢查0,0A,-A

(2)先分析稅收檢查邊際：因為S為稅務機關(guān)檢查的概率,

E為納稅人逃稅的概率。給定E,稅收機關(guān)選擇檢查與否的期望

收益為：

K(\,E)=(A-C+F)E+(A-C)(l-E)=EF+A-C

Xr(O,E)=OxE+A(l-E)+A(l-E)

解K(l,E)=K(0,E),得：E=C/(A+F)o

如果納稅人逃稅概率小于E,稅收機關(guān)的最優(yōu)決策是不檢查,

否則是檢查。

再分析逃稅邊際：給定S,納稅人選擇逃稅與否的期望收益

是:

K(S,1)=(-A-F)S+0x(1-S)=-(A+F)S

K(S,0)=-AS+(-A)(l-S)=-A

解K（S,1）=K（S,O）,得：S=A/（4+F）。即如果稅收機關(guān)檢查的概率小

于S,納稅人的最優(yōu)選擇是逃稅，否則是交稅。

因此，混合納什均衡是（S,E）,即稅收機關(guān)以S的概率查

稅，而納稅人以E的概率逃稅。

31、判斷下列說法正確：

（1）斯塔克博格產(chǎn)量領(lǐng)導者所獲得的利潤的下限是古諾均

衡下它得到的利潤。

（2）由于兩個罪犯只打算犯罪一次，所以被捕后才出現(xiàn)了

不合作的問題即囚徒困境。但如果他們打算重復合伙多次，比如

說20次，那么對策論預測他們將采取彼此合作的態(tài)度，即誰都

不招供。

答：（1）正確。在斯塔克博格模型中，領(lǐng)導者可以根據(jù)跟隨

者的反應曲線來制定自己的最優(yōu)產(chǎn)量。其利潤一定不會小于古諾

均衡下的利潤，否則，領(lǐng)導者將采取古諾博弈中雙方同時行動的

策略而獲得古諾均衡的利潤。

（2）錯誤。只要兩囚犯只打算合作有限次，其最優(yōu)策略均

為招供。比如最后一次合謀，兩小偷被抓住了，因為將來沒有合

作機會了，最優(yōu)策略均為招供。回退到倒數(shù)第二次，既然已經(jīng)知

道下次不會合作，這次為什么要合作呢。依此類推，對于有限次

內(nèi)的任何一次，兩小偷均不可能合作。

32、簡要評論博弈論在微觀經(jīng)濟學運用中的優(yōu)缺點。

答：博弈論是描述和研究行為者之間策略相互依存和相互作

用的一種決策理論。它被廣泛應用于政治、外交、軍事、經(jīng)濟等

研究領(lǐng)域，但在微觀經(jīng)濟學中的應用是最成功的。博弈論的研究

方法和特征與經(jīng)濟學結(jié)合得非常緊密。它強調(diào)個人理性，即在給

定的約束條件下追求效用最大化。但博弈論又比傳統(tǒng)的經(jīng)濟學更

進一步，它研究的不是面臨非人格化的價格參數(shù)下的決策問題，

而是研究效用隨各個主體的行為改變而改變的效用最大化問題。

除了國際貿(mào)易、金融、拍賣等經(jīng)濟領(lǐng)域，博弈論在企業(yè)理論特別

是寡頭競爭研究方法方面做了大量的有益工作。

20世紀80年代以來，博弈論開始出現(xiàn)在西方經(jīng)濟學的教科

書中，都將其作為經(jīng)濟學研究的最新成果與前沿。特別是產(chǎn)業(yè)組

織理論方面的教材，幾乎都是以博弈論為基礎的。博弈論反映了

經(jīng)濟學的研究對象越來越個體化、微觀化；反映了經(jīng)濟學越來越

重視人與人之間關(guān)系與相互作用的研究，特別是協(xié)調(diào)人際的利益

與沖突的最佳制度安排傾向；反映了經(jīng)濟學越來越重視信息，即

接近現(xiàn)實的有關(guān)信息不完全對個人選擇與制度安排及其影響的

傾向。總之，博弈論在經(jīng)濟學中的廣泛應用，大大提高了經(jīng)濟學

對現(xiàn)實的解釋能力。

應該看到，博弈論在微觀經(jīng)濟學運用中還存在許多疑難問

題。它無法提供唯一解，無法完整地探討個人發(fā)展與社會發(fā)展之

間的相互依存關(guān)系。現(xiàn)有的博弈論結(jié)構(gòu)可強有力地證明“合作比

不合作好”這一命題，但無法解釋清楚在現(xiàn)實中沖突與合作之間

的復雜關(guān)系，認為個人組成的集團會采取合作行動以實現(xiàn)他們共

同的利益。實際上，除非一個集團中的人數(shù)很少或者存在強制或

其他某些特殊手段以使個人按照他們的共同利益行事，有理性

的、尋求個人利益最大化的個人不會采取行動以實現(xiàn)共同的利

益。即使他們采取行動實現(xiàn)共同的利益之后都能獲益，他們也仍

然可能不會自愿地采取合作行動以實現(xiàn)共同利益的目標。

33、“囚徒困境”的內(nèi)在根源是什么？舉出現(xiàn)實中囚徒的困境的

具體例子。

答八：內(nèi)在根源是個體之間存在行為和利益相互制約的博弈結(jié)構(gòu)

中，個體理性與集體理性的矛盾。

34、假設古諾的雙寡頭模型中雙寡頭面臨如下一條線性需求曲

線：

P=30-Q

其中Q為兩廠商的總產(chǎn)量，即、=0什€)2。

TR?=PQ|=(30-Q)Q|=30Q-Q”QQ

再假設邊際成本為零，即

MCI=MC2=0

解釋并討論此例的納斯均衡，為什么其均衡是一種囚徒困境。

TR?=PQi=(30-Q)Q|=30Q-Q：-Q,Q2

廠商1的總收益TRi由下式給出：

廠商1的邊際收益MRi為：

MRI=30-2QI-Q2

利用利潤最大化條件MREC尸0,得廠商1的反應函數(shù)

(reactionfunction)或反應曲線為：

Qi=15-0.5Q2(6-1)

同理可得廠商2的反應曲線為：

Q2=15-0.5QI(6-2)

均衡產(chǎn)量水平就是兩反應曲線交點和Q2的值，即方程組6-1

和6-2的解?？梢郧蟮霉胖Z均衡時的均衡產(chǎn)量水平為：Q1=Q2=10O

因此，在本例中，兩個寡頭的總產(chǎn)量Q為Q1+Q2=20,均衡價格

為P=30-Q=10o

剛才我們討論了兩寡頭廠商相互競爭時的均衡產(chǎn)量。現(xiàn)在我們

放松第(6)條不能串謀的假設，假定兩寡頭可以串謀。它們能共

同確定產(chǎn)量以使總利潤最大化。

這時，兩廠商的總收益TR為：

TR=PQ=(30-Q)Q=30Q-Q2

其邊際收益MR為：

MR=30-2Q

根據(jù)利潤最大化條件MR=MC=0,可以求得當Q=15時總利潤最大。

如果兩廠商同意平分利潤，每個寡頭廠商將各生產(chǎn)總產(chǎn)量的一

半,即QLQ2=7.5。其實,任何相加為15的產(chǎn)量Qi和CL的組合都

使總利潤最大化，因此，把。+Q2=15稱為契約曲線，而@=Q2=7.5

是契約曲線上的一個點。

我們還可以求得當價格等于邊際成本時，Qi=Q2=15,各廠商的

利潤為零。

35、兩家電視臺競爭周末黃金時段晚8點到10點的收視率，可選

擇把較好的節(jié)目放在前面還是后面。他們決策的不同組合導致收

電彳月臺1

前面后面

電視前面18,1823,20

視率如下:臺2后面4,2316.16

U）如果兩家是同時決策，有納什均衡嗎?

有（前面，后面）

電視臺1

前山后面

電視前面18,：823,20

臺2后面?4,2.1rd.id

電視臺1

前面后面

電視前面至，1823,20

臺2后面4,2216?16

(2)如果雙方采用規(guī)避風險的策略，均衡的結(jié)果是什么？

此題應用的思想是最大最小收益法：

也就是說，在對手采取策略時，所獲得的最小收益中的最大值。

電視臺1：對方采取前面戰(zhàn)略的最小收益為18

對方采取后面戰(zhàn)略的最小收益為16

固電視臺1會選擇收益為18的戰(zhàn)略一一前面

電視臺2：前面的策略是一個優(yōu)超策略一一前面

策略均衡為(前面，前面)

⑶如果電視臺1先選擇，結(jié)果有什么？若電視臺2先選擇呢？

電視臺2

（4）如果兩家談判合作，電視臺1許諾將好節(jié)目放在前面，這許

諾可信嗎？結(jié)果能是什么？

電視臺1許諾將好節(jié)目放在前面的許諾不可信。

因為電視臺2,前面為占優(yōu)策略，

而在電視臺2,選擇前面的時候，電視臺1選擇后面的收益要大

于前面的收益。

所以，最終結(jié)果為（前面，后面）

36、如果將如下的囚徒困境博弈重復進行無窮次，懲罰機制為觸

發(fā)策略，貼現(xiàn)因子為6。試問8應滿足什么條件，才存在子博

弈完美納什均衡？

坦不坦

X白白

坦白4,40,5

不坦5,01,1

白

參考答案：

由劃線法求得該博弈的純策略納什均衡點為（不坦白，不坦白），

均衡結(jié)果為（1,1）,采用觸發(fā)策略，局中人i的策略組合s的最

好反應支付G（s）=maxR（s_i，Si）=5,Pi（S*）=4,Pi（S）=1o若存在子博弈

SicSj

完美納什均衡，必須滿足：腔附）-吃）導9即只有當貼現(xiàn)因

a（s）”甘）5-14

子Q1/4時，才存在子博弈完美納什均衡。

37、在Bertrand價格博弈中，假定有n個生產(chǎn)企業(yè)，需求函數(shù)為

P=a-Q,其中P是市場價格，Q是n個生產(chǎn)企業(yè)的總供給量。假定博

弈重復無窮多次，每次的價格都立即被觀測到，企業(yè)使用“觸發(fā)

策略”(一旦某個企業(yè)選擇壟斷價格，則執(zhí)行“冷酷策略”)。求

使壟斷價格可以作為完美均衡結(jié)果出現(xiàn)的最低貼現(xiàn)因子5是多

少。并請解釋5與n的關(guān)系。

分析：此題可分解為3個步驟

(1)n個企業(yè)合作，產(chǎn)量總和為壟斷產(chǎn)量，價格為壟斷價格，然

后平分利潤。

(2)其中一個企業(yè)采取欺騙手段降價，那個這家企業(yè)就占有的

全部市場，獲得壟斷利潤

(3)其他企業(yè)觸發(fā)戰(zhàn)略，將價格降到等于邊際成本，所有的企

業(yè)利潤為零。

參考答案：

(1)設每個企業(yè)的邊際成本為c,固定成本為0

P=a-Q

TR=P*Q=(a-Q)*Q

MR=a-2Q

因為：MR=MC

a-2Q=c

則:Q=(a-c)/2

P=(a+c)/2

n=(P-c)*Q=(a-c)2/4

每家企業(yè)的利潤為(a-c)2/4n

(2)假設A企業(yè)自主降價，雖然只是微小的價格調(diào)整，但足以占

領(lǐng)整個市場，獲得所有的壟斷利潤一一(a-c)2/4

(3)其他企業(yè)在下一期采取冷酷策略，使得所有企業(yè)的利潤為0

考慮：

A企業(yè)不降價：(a-c)2/4n,(a-c)2/4n,...

A企業(yè)降價：(a-c)2/4,0,……

使壟斷價格可以作為完美均衡結(jié)果，就要使得不降價的貼現(xiàn)值大

于等于降價的貼現(xiàn)值。

設貼現(xiàn)因子為8

A不降價的貼現(xiàn)值：[(a-c)2/4n][l/(l-8)]

A降價的現(xiàn)值：(a-c)2/4

于是：[(a-c)2/4n][1/(1-于]2(a-c)2/4

解得：521T/n

38、假設某勞動市場為完全競爭市場，其供求函數(shù)如下：

SL：W=120+2LDL：W=360-L

n505

已知某廠商(在完全競爭市場下)的生產(chǎn)函數(shù)為f(L,K)=10LK

(K=100)

且其產(chǎn)品的需求與供給函數(shù)分別為

D:P=60-2qS:P=20+2q

試求（a）該廠商的AQ,MQ及VMR各為多少？

（b）勞動工資為多少?廠商會雇用多少勞動？

由：解得：W=280

由于產(chǎn)品市場為完全競爭市場，且要素市場也為完全競爭市場

所以，滿足：產(chǎn)品市場均衡：P=MR=MC=W/MPL

要素市場均衡：W=AC=MC=VMPL

得到：AC=MC=VMP=280

由：D=S解得:P=40,q=10

廠商追求利潤最大化的情況下：

.0.5

W*=VMPL=P*MPL=P*50/L

L*=[100/2*PW*]=51（取整數(shù)）

論述題（每小題20分，共20分）

解釋“囚犯困境”，并舉商業(yè)案例說明。

囚徒困境是博弈論里最著名的例子之一,幾乎所有的博弈論著

作中都要討論這個例子。這個例子是這樣的：兩囚徒被指控是一

宗罪案的同案犯。他們被分別關(guān)在不同的牢房無法互通信息。各

囚徒都被要求坦白罪行。如果兩囚徒都坦白，各將被判入獄5年;

如果兩人都不坦白，則很難對他們提起刑事訴訟，因而兩囚徒可

以期望被從輕發(fā)落入獄2年；另一方面，如果一個囚徒坦白而另

一個囚徒不坦白，坦白的這個囚徒就只需入獄1年，而不坦白的

囚徒將被判入獄10年。表6-2給出了囚徒困境的策略式表述。

這里，每個囚徒都有兩種策略：坦白或不坦白。表中的數(shù)字分別

代表囚徒甲和乙的得益。(注意，這里的得益是負值。)

表6-2囚徒困境

囚徒乙

坦白不坦

白

囚徒坦白-5,-1,

甲5-10

不坦-10,~2,

白-1-2

在囚徒困境這個模型中，納什均衡就是雙方都坦白，給定甲坦

白的情況下，乙的最優(yōu)策略是坦白；給定乙坦白的情況下，甲的

最優(yōu)策略也是坦白。而且這里雙方都坦白不僅是納什均衡，而且

是一個上策(dominantstrategy)均衡，即不論對方如何選擇，

個人的最優(yōu)選擇是坦白。因為如果乙不坦白，甲坦白的話就被輕

判1年，不坦白的話就判2年，坦白比不坦白要好；如果乙坦白，

甲坦白的話判5年，不坦白的話判10年，所以，坦白仍然比不

坦白要好。這樣，坦白就是甲的上策，當然也是乙的上策。其結(jié)

果是雙方都坦白。這個組合是納什均衡。

寡頭壟斷廠商經(jīng)常發(fā)現(xiàn)它們自己處于一種囚徒的困境。當寡頭

廠商選擇產(chǎn)量時，如果寡頭廠商們聯(lián)合起來形成卡特爾，選擇壟

斷利潤最大化產(chǎn)量，每個廠商都可以得到更多的利潤。但卡特爾

協(xié)定不是一個納什均衡，因為給定雙方遵守協(xié)議的情況下，每個

廠商都想增加生產(chǎn)，結(jié)果是每個廠商都只得到納什均衡產(chǎn)量的利

潤，它遠小于卡特爾產(chǎn)量下的利潤。

解釋“智豬博弈(boxedpigs)”，并舉商業(yè)案例說明。

智豬博弈的例子講的是：豬圈里有一頭大豬和一頭小豬，豬圈

的一頭有一個豬食槽，另一頭安裝一個按扭，控制著豬食的供應。

每按一下按扭會有10個單位的豬食進槽,但誰按按扭誰就要付2

個單位的成本并且晚到豬食槽。若大豬先到豬食槽，大豬吃到9

個單位，小豬只能吃到1個單位；若小豬先到豬食槽，大豬吃到

6個單位，小豬吃4個單位；若同時到，大豬吃到7個單位，小

豬只能吃3個單位。表6-3列出了對應于不同策略組合的得益水

平。例如，表中第一格表示大豬小豬同時按按扭，從而同時走到

豬食槽，大豬吃7個，小豬吃3個，除去2個單位成本，得益分

別為5和1。

表6-3智豬博弈

小豬

按|不按

大豬按5,14,4

不按9,0,0

-1

從表6-3可以看到，對于小豬來說，如果大豬按，它則不按更

好；如果大豬不按，它

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論復習題及答案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔