博弈論-第三章教材課件

上傳人：o*** IP屬地：未知上傳時間：2023-01-11 格式：DOC 頁數(shù)：70 大?。?43KB 積分：6 舉報 版權(quán)申訴

已閱讀5頁，還剩65頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

PAGE第三章納什均衡運用舉例

1、伯川德模型與古諾模型不同，在伯川德(Bertrand,1883)模型中，壟斷廠商選擇的策略不是產(chǎn)量而是價格，其他方面與古諾模型類似。該博弈的基本式G={S,u}如下：（1）參與者：n個寡頭廠商，N={1,2,…,n}。（2）策略空間：策略為價格pi，策略空間為Si=[0,p^]，p^表示一個充分大的價格。實際上假設(shè)價格無窮大也無所謂。（3）偏好和收益函數(shù)。寡頭廠商的收益函數(shù)就是其利潤函數(shù)，即其中D(pi)表示市場需求函數(shù)，m表示選擇最低價格的廠商數(shù)，如果只有廠商i的價格最低，那么m=1。pi>p-i表示pi大于任意一個其他廠商的價格pj，其他類似。我們不妨從簡單的開始，設(shè)n=2，ci(qi)=cqi，D(p)=a–p，當(dāng)p>a時，D(p)=0，a>c。由此可得寡頭廠商i的利潤函數(shù)為。那么伯川德模型的納什均衡是什么呢？可由如下思路得到寡頭廠商i的最優(yōu)反應(yīng)對應(yīng)?？紤]三種情況：如果pj<c，那么可知當(dāng)時，廠商i的利潤為負(fù)數(shù)；而pi>pj時，利潤為0；顯然利潤為0好過利潤為負(fù)。由此得到最優(yōu)反應(yīng)對應(yīng)為Bi(pj)=pi>pj，pj<c。如果pj=c，那么可知當(dāng)pi<pj時，廠商i的利潤為負(fù)數(shù)；而時，利潤為0；顯然利潤為0要好于利潤為負(fù)。由此得到最優(yōu)反應(yīng)對應(yīng)為Bi(pj)=，pj=c。如果pj>c，那么可知pi<pj時，廠商i的利潤函數(shù)為(pi–c)(a–pi)；而pi=pj時，廠商i的利潤函數(shù)為(pi–c)(a–pi)/2；而pi>pj時，利潤為0，顯然這時選擇pi<pj是最優(yōu)策略。由于我們假設(shè)價格是連續(xù)變化的，所以pi可以無限接近pj，因而從數(shù)學(xué)意義上而言，最優(yōu)反應(yīng)對應(yīng)可能是不存在的，即最優(yōu)反應(yīng)對應(yīng)為空集，Bi(pj)=j。當(dāng)pi<pj可知利潤函數(shù)(pi–c)(a–pi)為二次型，因而存在一個pm使得利潤最大（這里先不考慮寡頭廠商j）。我們也可以對其求一階條件，得。由此可知，當(dāng)pj>pm時，廠商i的最優(yōu)策略是pi=pm；當(dāng)時，廠商i的最優(yōu)策略是無窮接近pj，即為空集。那么最優(yōu)反應(yīng)對應(yīng)為?？偨Y(jié)最優(yōu)反應(yīng)對應(yīng)如下：。利用博弈的對稱性，可照葫蘆畫瓢得寡頭廠商j的最優(yōu)反應(yīng)對應(yīng)。兩個寡頭壟斷廠商的最優(yōu)反應(yīng)對應(yīng)如圖3-1所示。ppipjccpmpmBi(pj)Bi(pj)Bj(pi)Bj(pi)圖3-1最優(yōu)反應(yīng)對應(yīng)和納什均衡根據(jù)圖3-1，可知伯川德模型存在唯一的納什均衡(c,c)，即每個寡頭廠商的價格等于單位成本c，利潤為0，這個結(jié)果顯著不同于古諾模型，而是等同于完全競爭?，F(xiàn)在我們考慮n>2的情況，顯然當(dāng)n越來越大時，伯川德的納什均衡會發(fā)生變化，但利潤為0的特性仍然保持不變，即伯川德模型對于廠商數(shù)是中性的。而古諾模型中，均衡產(chǎn)量是n的函數(shù)，即q*=(a–c)/(n+1)，當(dāng)n越來越大時，利潤越來越接近于0，這時古諾模型收斂于伯川德模型。

2、多黨競選又叫豪泰林(Hotelling,1924)模型。為了簡單，我們這里先考慮兩黨制的情況。xx*x*-kx*-k圖3-2選民的偏好是對稱的U假設(shè)：保守主張用0來表示，激進(jìn)主張用1來表示。選民分布在保守主張和激進(jìn)主張之間，我們不妨設(shè)m為[0,1]中的中位數(shù)，即[0,m]區(qū)間與[m,1]區(qū)間上的選民都為半數(shù)。一個簡單的假設(shè)就是選民服從均勻分布。對于任一選民而言，其偏好是選擇越接近自己政治主張的候選人效用越高，即如圖3-2所示。圖3-2中，x*代表選民的政治主張，越接近x*，選民的效用越大。上面我們假設(shè)選民的偏好是對稱的，即偏向保守還是偏向激進(jìn)，其效用減少都一樣。實際上，選民是否均勻分布，偏好是否對稱，對我們的分析來講并不重要。在這種情況下，兩黨就需要確定某種政治主張（實際上就是選擇位置）以最大限度地吸引選民投它的票，誰獲得的選票多誰就獲勝。兩黨爭奪選民的情況可以用圖3-3來說明。00保守1激進(jìn)黨派1黨派2x1x2圖3-3兩黨爭奪選民如果黨派1的政治主張（策略）為x1，它較偏向于保守主張，所以它能獲得保守選民的選票，即得到分布在[0,x1]的選民的支持。由于我們假設(shè)選民分布在[0,1]的區(qū)間，所以它獲得的投票數(shù)可用x1來表示。對于黨派2而言，它的政治主張為x2，較偏向激進(jìn)主張，所以它能獲得激進(jìn)選民的選票，即獲得分布在[x2,1]的選民的支持。他所獲得的投票數(shù)可用1－x2來表示。對于分布在[x1,x2]的選民而言，則被兩個黨派平分，圖3-3中的虛線的左邊為支持黨派1的選民，虛線的右邊為支持黨派2的選民。顯然，在給定黨派1的策略x1，黨派2的策略x2越接近x1，獲得的選民就會越多；對于黨派1同樣存在這樣的情況。那么在這個兩黨競選中納什均衡是什么？該博弈的基本式G={S,u}如下：（1）參與者：黨派1定義為1，黨派2定義為2，N={1,2}。（2）策略空間：黨派1的策略空間為S1=[0,1]，策略；黨派2的策略空間為S2=[0,1]，策略為。（3）偏好和收益函數(shù)：任何一個黨派都希望獲勝，其次希望能夠平分秋色，最差就是競選落敗。由于贏得的選民多即為獲勝，因而兩個黨派的收益實際上是獲得的選民數(shù)的函數(shù)；但選民數(shù)又取決于兩個黨派的政治主張，因而收益函數(shù)最終是兩黨的政治主張的函數(shù)。這里我們不妨設(shè)贏的收益為w，勢均力敵為a，失敗為0。根據(jù)已知條件，黨派1的收益函數(shù)為。根據(jù)上述收益函數(shù)我們就能得到相應(yīng)的最優(yōu)反應(yīng)對應(yīng)。當(dāng)x2<m時，黨派1的最優(yōu)策略x1為大于x2，小于2m–x2之間的任意數(shù)，因為這時黨派1獲得的選民數(shù)超過半數(shù)，能夠贏得選舉。當(dāng)x2=m時，那么黨派1的最優(yōu)策略x1就是等于x2，因為這樣黨派1能夠獲得半數(shù)選民的支持，不至于落敗。當(dāng)x2>m時，黨派1的最優(yōu)策略x1為大于2m–x2，小于x2之間的任意數(shù)，因為這樣能獲得超過半數(shù)選民的支持，從而贏得選舉。最終得到黨派。豪泰林模型顯然是一個對稱模型，因而利用對稱性我們可以很容易地得到黨派2的收益函數(shù)和最優(yōu)反應(yīng)對應(yīng)。黨派2的最優(yōu)反應(yīng)對應(yīng)如下：。圖3-4就形象地反映出了豪泰林模型的納什均衡，該模型不僅是對稱的，而且有對稱的納什均衡。xx1x2mmB1(x2)B2(x1)圖3-4豪泰林模型的最優(yōu)反應(yīng)對應(yīng)與納什均衡多數(shù)選民的選票，將獲得該州的所有代表人團(tuán)票，獲得最多代表人團(tuán)票的人當(dāng)選美國總統(tǒng)。這里我們假設(shè)存在k個州，用v來表示代表人團(tuán)票，v1表示州1的代表人團(tuán)票，v2表示州2的代表人團(tuán)票，依次類推。并且規(guī)定州1的代表人團(tuán)票數(shù)比州2多，州2比州3多，代表人團(tuán)票最少的就為州k，即v1>v2>…>vk?？偨y(tǒng)候選人則選擇一個政治主張，即xi，各州的選民則根據(jù)xi是否離自己的政治主張最近來選擇候選人。如果存在兩個總統(tǒng)候選人，k=2，那么這個博弈的納什均衡是什么？當(dāng)k=3時，納什均衡又是什么？

3、事故賠償法當(dāng)事故發(fā)生后，通常都會涉及到責(zé)任的認(rèn)定，不同的法律規(guī)定顯然會對人們的行為產(chǎn)生影響，從而導(dǎo)致不同的社會結(jié)果。站在社會的角度，當(dāng)然是希望事故發(fā)生后的損失越輕越好。這就引出一個問題，什么樣的法律規(guī)定能夠?qū)е乱粋€更有效率的社會結(jié)果，傳統(tǒng)的經(jīng)濟(jì)學(xué)要回答這個問題顯然是困難的，而這實際上是博弈論一個很自然的運用，并直接促使了法經(jīng)濟(jì)學(xué)的發(fā)展。這里我們構(gòu)建一個簡單的事故賠償法模型：在一場交通事故中，存在兩個當(dāng)事人——傷害人（用1表示）和受害人（用2表示），a定義為當(dāng)事人的小心程度，損失函數(shù)為L(a1,a2)>0，表示當(dāng)事人越小心，那么損失越小，但無論多么小心，一定的損失總是存在的；定義p(a1,a2)為傷害人承當(dāng)損失的比重，1–p(a1,a2)則為受害人承當(dāng)損失的比重，，即當(dāng)事人越小心，承當(dāng)損失的比重越小。為了簡單，我們進(jìn)一步假設(shè)函數(shù)L和函數(shù)p都是性態(tài)良好的。由此可得社會、傷害人和受害人的收益函數(shù)如下：社會的收益函數(shù)max–a1–a2–L(a1,a2)(3-S-1)傷害人的收益函數(shù)max–a1–p(a1,a2)L(a1,a2)(3-S-2)受害人的收益函數(shù)max–a2–(1–p(a1,a2))L(a1,a2)(3-S-3)對(3-S-1)式求一階條件，就能得到社會損失最小的必要條件：a1*和a2*。為了進(jìn)一步簡化，不妨設(shè)，當(dāng)發(fā)生事故時，傷害人要么承當(dāng)全部責(zé)任，要么完全不承擔(dān)責(zé)任，即p要么等于1，要么等于0。在p=1或0的情況下，a1*和a2*不僅使社會損失最小，同樣使得傷害人和受害人的損失最小，即三個收益函數(shù)的最優(yōu)解完全相同。那么不同的法律規(guī)定會導(dǎo)致怎么樣的社會結(jié)果呢？這里我們考慮三種賠償規(guī)定：（1）過錯加過錯(Negligencewithcontributorynegligence)的賠償原則。只有當(dāng)傷害人有過錯，而受害人沒有過錯時，傷害人才承擔(dān)責(zé)任，其他情況下，傷害人都不承擔(dān)責(zé)任。我們不妨設(shè)法律規(guī)定的過錯標(biāo)準(zhǔn)為X1和X2，當(dāng)時，傷害人沒有過錯；當(dāng)時，受害人沒有過錯。因而過錯加過錯的賠償原則就可以表示成如下公式：。（2）純過錯賠償原則。只有在傷害人沒有過錯而受害人有完全過錯的情況下，傷害人才能免責(zé)，否則將承擔(dān)完全責(zé)任。這等價于a1>X1>0，a2=0，（3）絕對責(zé)任(Strictliability)原則。無論如何傷害人都要承擔(dān)責(zé)任，即X1無窮大，而a2=0，為了分析上述不同的法律規(guī)定，我們第一步是將該模型概括為策略式。事故賠償法的策略式博弈G={S,u}：（1）參與者集合：1代表傷害人，2代表受害人，N={1,2}。（2）策略空間：策略為ai，策略空間為Si=，。（3）收益函數(shù)：根據(jù)不同的賠償原則，將會有不同的收益函數(shù)。我們不妨從最簡單的開始。第一種情景：純過錯。不妨規(guī)定X1=a1*，這時傷害人的收益函數(shù)為。受害人的收益函數(shù)為。在這種情況下，傷害人的最優(yōu)反應(yīng)函數(shù)為。如果受害人小心程度a2=0，那么傷害人的最優(yōu)策略就是令a1=a1*；如果受害人的小心程度a2>0，那么傷害人就需要求使得–a1–L(a1,a2)最大的a1#。根據(jù)已知條件可知，在給定a2<a2*的情況下，a1#>a1*，只有當(dāng)a2=a2*的時候，a1#=a1*。原因在于，(a1*,a2*)不僅使社會總損失最小，也使傷害人和受害人的損失最小。可以用圖3-5來加以說明。aa1u1u1(a1,a2*)u1(a1,a2)0a1*a1#圖3-5給定a2<a2*使u1最大的a1對于受害人而言，最優(yōu)反應(yīng)函數(shù)為。這里需要考慮兩種情況。第一種情況：a1<a1*時，受害人最優(yōu)策略為0，而受害人選擇0，傷害人的最優(yōu)策略就為a1*，所以當(dāng)a1<a1*時，不存在均衡。第二種情況：a1=a1*時，受害人的最優(yōu)策略為a2#>0，而受害人選擇a2#，傷害人的最優(yōu)策略就為a1=a1#。由于策略是連續(xù)的，因而當(dāng)a1=a1*時，受害人可以選擇一個無窮接近0，但不等于0的a2#，所以該博弈不存在純納什均衡解。但如果我們假設(shè)a的最小單位為Δ，那么納什均衡就為(a1#,Δ)。顯然，(a1#,Δ)≠(a1*,a2*)，這表明由此形成的均衡結(jié)果并不是社會最優(yōu)的結(jié)果。在中國，交通法規(guī)中的賠償原則類似于純過錯，通常傷害人都需要承擔(dān)一定責(zé)任，只有當(dāng)受害人完全過錯，而傷害人完全沒有過錯時，才可能免責(zé)。接下來我們分析第二種情景：過錯加過錯。從感情上來講，通常人們很難接受過錯加過錯這種原則，因為只有在傷害人完全過錯，并且受害人完全沒有過錯的情況下，才能進(jìn)行賠償。但出乎意料的是，過錯加過錯的賠償原則卻會導(dǎo)致社會福利最大。設(shè)X1=a1*，X2=a*2，那么傷害人和受害人的收益函數(shù)分別為。。接下來所要做的就是尋找每個當(dāng)事人的最優(yōu)反應(yīng)。傷害人的最優(yōu)反應(yīng)函數(shù)為。受害人的最優(yōu)反應(yīng)函數(shù)為。因而存在唯一的納什均衡(a1*,a2*)，而這恰恰就是社會福利最大時所要求的小心度。(a1*,a2*)不僅是社會最優(yōu)解，而且還是傷害人和受害人的最優(yōu)解。對事故法文獻(xiàn)綜述可參閱BenoitandKornhause(2002)。

4、公共地悲劇18世紀(jì)初期，資本主義生產(chǎn)方式在英國得到了確立，并開始迅速發(fā)展。而它的最初動力是紡織品市場需求的日益擴(kuò)大，使得毛紡工業(yè)迅速發(fā)展，紡織機(jī)、蒸汽機(jī)相繼得到運用，直接導(dǎo)致第一次工業(yè)革命。羊毛作為原料，市場需求巨大。但當(dāng)時英國農(nóng)村的土地屬于公社所有，牧場更是如此。在這種情況下，土地公有實際上成為有效生產(chǎn)羊毛的一個重要障礙，最終導(dǎo)致馬克思稱之為的“羊吃人”的圈地運動。1739年，休謨(Hume)在其所寫的一篇文章中指出，公共牧場實際上會導(dǎo)致過度放牧，從而為英國圈地運動的產(chǎn)生提供了一種說明。在經(jīng)濟(jì)學(xué)中，公共地悲劇現(xiàn)在已成為說明私有制存在理由的經(jīng)典模型之一?！肮驳乇瘎　敝v述的是一個村社有個牧民。村社所有的羊群數(shù)就為。買和飼養(yǎng)一只羊的成本為c。每只羊的價值為羊的總頭數(shù)的函數(shù)，即。由于每只羊都需要一定的綠地才能生存，因而村社的牧場所能供養(yǎng)的羊群數(shù)就有一個上限，我們定義為，并假設(shè)當(dāng)所飼養(yǎng)的羊群數(shù)超過牧場所能供養(yǎng)的上限時，每只羊的價值為零（即羊群過多造成牧場退化，由于沒有足夠的飼料，從而引起羊群死亡），即當(dāng)時，；當(dāng)時，。當(dāng)時，，。一階導(dǎo)數(shù)為負(fù)表明隨著羊的數(shù)量增加，羊的價值會下降；二階導(dǎo)數(shù)為負(fù)則表明隨著羊的數(shù)量增加，羊的價值下降是遞增的。如圖3-5所示。GG0vGmaxG*G**v*v**ABGv圖3-5羊的價值以遞增的速度下降我們將公共地悲劇轉(zhuǎn)化為策略式博弈G={S,u}：（1）參與者：定義牧民為1,2,…,n；N={1,2,…,n}。（2）策略空間：牧民的策略為，策略空間Si=，i∈N。（3）收益函數(shù)：當(dāng)其他的牧民所放牧的羊群數(shù)為時，牧民從放牧的羊群所獲得的收益為(3-G-1)每個牧民追求收益最大化，即。對于每一個牧民而言，在給定其他人的策略組合下，應(yīng)當(dāng)使(3-G-1)式最大化。最大化的必要條件（一階條件）為g*i(3-G-2)最大化的充分條件（二階條件）為其中。根據(jù)對稱性，可知(3-G-2)式是每一個牧民的收益最大化的充要條件。根據(jù)納什均衡的定義，g*就是納什均衡解。將代入(3-G-2)式，并將所有牧民的必要條件相加，得(3-G-3)用除(3-G-3)式，得(3-G-4)其中。(3-G-4)式是納什均衡下，所有牧民所養(yǎng)羊之和必須滿足的條件。與私人利益最大化相對立的是社會的收益最大化，即一階條件為(3-G-5)二階條件為G**就是社會的最優(yōu)解。現(xiàn)在我們需要證明的是，即公共地存在過度利用，懷海特(Whitehead,1948)把這種情況稱為“公共地悲劇”。證明用反證法。假設(shè)。因為所以（第1項）又因為，所以所以（第2項）根據(jù)假設(shè)所以（第3項）(3-G-4)(3-G-5)即(3-G-4)式大于(3-G-5)式，這顯然與(3-G-4)和(3-G-5)都等于零相矛盾，所以。表明，從效率的角度來看，圈地運動必然要求實行公共牧場的私有化，并按照羊頭數(shù)的多少來劃分土地專屬權(quán)的大小。歷史的發(fā)展恰恰與上述的理論分析是一致的，由于羊頭數(shù)少的牧民占絕大多數(shù)，因而就出現(xiàn)了被馬克思稱之為“羊吃人”的現(xiàn)象。另外，“公共地悲劇”反映出了極其深刻的哲理——大家都擁有（公地）的自由，卻導(dǎo)致了大家都受損的結(jié)局。這也正是哲學(xué)家懷海特把其稱作為“公共地悲劇”的原因，在懷海特的著作中這樣寫道：“悲劇的實質(zhì)不在于不幸，而在于（這種不幸是由大家共有）這一神圣性（所造成的）”。要避免公共地悲劇的發(fā)生，如果排除私有化的可能性，靠技術(shù)是不可能解決的，它實際上取決于人們崇高的思想境界。在懷海特(Whitehead,A.N.1948)的論文中對“公共地悲劇”有著詳細(xì)的討論，感興趣的同學(xué)可以一讀。

5、爭議仲裁在中國經(jīng)常聽到有關(guān)房屋拆遷爭議的新聞，引起了社會的廣泛關(guān)注。這里我們就利用博弈論，來構(gòu)建一個爭議模型。假定參與爭議的雙方一為政府，一為居民戶，爭議因補(bǔ)償金而起。首先，政府和居民戶同時開出自己希望的賠償金水平，分別用wg和wf表示。如果wg>wf，顯然不存在爭議。如果wg<wf，雙方就存在補(bǔ)償金爭議，并報仲裁機(jī)構(gòu)進(jìn)行仲裁。最后，仲裁機(jī)構(gòu)在兩者之中選擇其一作為結(jié)果。假定仲裁機(jī)構(gòu)本身對補(bǔ)償金有自己認(rèn)為合理的值，用x來表示。在政府和居民戶報價wg和wf之后，仲裁機(jī)構(gòu)只是簡單選擇距x最為接近的要價：如果x<(wg+wf)/2，仲裁者將選擇wg；如果x>(wg+wf)/2則選擇wf；如果x=(wg+wf)/2，則隨機(jī)選擇。仲裁機(jī)構(gòu)的仲裁原則如圖3-6所示。仲裁機(jī)構(gòu)遵循的這個仲裁原則是公共信息。((wg+wf)/2wgwfx<<xwg被選中wf被選中圖3-6可能的仲裁結(jié)果對于x，只有仲裁機(jī)構(gòu)知道，政府和居民戶不知道。但x服從一定的概率分布是公共信息，其積累分布函數(shù)為F(x)，概率密度函數(shù)為f(x)。根據(jù)仲裁原則，如果雙方的要價分別為wg和wf，那么雙方推斷wg被選中的概率為Pr{wg}和wf被選中的概率為Pr{wf}，用數(shù)學(xué)表示出來為：和據(jù)此，期望的補(bǔ)償金水平為這里需要說明的是，選擇小于wg的wf是居民戶的嚴(yán)格劣策略；從政府來說，選擇大于wf的wg是政府的嚴(yán)格劣策略，因而從理論上而言不會出現(xiàn)wg>wf的情況。政府的目標(biāo)是獲得期望補(bǔ)償金水平最小化的仲裁結(jié)果，居民戶則設(shè)法使其最大化。根據(jù)納什均衡的定義，在給定居民戶策略wf的條件下，政府追求支付最小化，即求一階條件為(3-Z-1)在給定政府策略wg*的條件下，居民戶則追求收益的最大化，即求一階條件為(3-Z-2)如果納什均衡為(wg*,wf*)，它一定同時滿足(3-Z-1)和(3-Z-2)式。這意味著(3-Z-1)式和(3-Z-2)式的左邊項相等，因而有(3-Z-3)這意味著政府和居民戶報價的平均值等于仲裁機(jī)構(gòu)x分布的均值，這說明政府和居民戶都努力想與仲裁機(jī)構(gòu)的偏好吻合。因為如果偏離x太遠(yuǎn)，那么對手的報價就越有可能被選中。將(3-Z-3)帶入(3-Z-1)或(3-Z-2)，得(3-Z-4)政府和居民戶報價之差等于仲裁機(jī)構(gòu)x分布的均值點的概率密度函數(shù)的倒數(shù)。上述分析的經(jīng)濟(jì)學(xué)解釋是什么呢？為了更好地理解這一結(jié)果，我們假設(shè)x服從均值為m，方差為σ2的正態(tài)分布（也可以假設(shè)x服從均勻分布等），那么密度函數(shù)為(3-Z-5)根據(jù)(3-Z-3)可得(3-Z-6)將式(3-Z-6)帶入(3-Z-4)，并根據(jù)(3-Z-5)式得(3-Z-7)根據(jù)式(3-Z-6)和(3-Z-7)就能得到納什均衡的要價為(，)這表明雙方的均衡要價以仲裁機(jī)構(gòu)x的期望值m為中心對稱，且要價之差隨雙方對仲裁機(jī)構(gòu)x的不確定性(即σ2)的提高而增大。對這一均衡結(jié)果的直觀解釋非常簡單：一個更為“不合理”的要價(即居民戶更高的要價或政府更低的出價)一旦被仲裁機(jī)構(gòu)選中就會給自己帶來更高的收益，但其被選中的可能性卻會相應(yīng)降低，因而博弈的雙方都需進(jìn)行權(quán)衡。當(dāng)政府和居民戶認(rèn)為仲裁機(jī)構(gòu)x的不確定程度增加(即σ2變大)時，雙方的要價就會更“不合理”，因為—個更“不合理”的要價與仲裁機(jī)構(gòu)的x有較大差別的可能性變小了。相反，如果不確定性較小，雙方都不會開出離x太遠(yuǎn)的報價，因為仲裁機(jī)構(gòu)選擇離m最近的報價的可能性非常大。如果不存在不確定性，雙方則都會開出x的報價。爭議仲裁這個博弈令人吃驚的地方在于：房屋拆遷的補(bǔ)償金實際上與居民戶在拆遷過程中的損失無關(guān)，而是完全取決于仲裁機(jī)關(guān)的偏好。如果仲裁機(jī)關(guān)與政府的偏好一致，那么實際上唯一的均衡就是wg,這就從一定程度上解釋了中國近年來房屋拆遷過程中為什么矛盾突出。

6、合作性談判這里我們考慮一個博弈模型：有一元錢，兩兄弟分，兩兄弟必須同時給出各自認(rèn)為應(yīng)得的份額。不妨假設(shè)兄弟1給出的份額為x1，而兄弟2給出的份額為x2。博弈的規(guī)則是，如果兩兄弟給出的份額為x1+x2>1，那么兩兄弟只能得到0；如果兩兄弟給出的份額之和x1+x2≤1，那么它們各自得到他們提出的份額。這實際上是一個簡單的合作性博弈，合作成功對雙方都有利，而合作失敗則雙方都受損。根據(jù)前面對納什均衡的定義，很容易知道這個合作性博弈存在無窮多個納什均衡。凡是x1,x2≥0，并且x1+x2=1的所有(x1,x2)策略組合都是納什均衡。因為如果給定兄弟1的策略x1，那么兄弟2的最優(yōu)策略為1–x1。因為如果x2>1–x1，那么雙方都只能得到0，顯然這比得到1–x1要差；如果x2<1–x1，顯然也比得到1–x1要差，因此只有x2=1–x1才是兄弟2的最優(yōu)策略。對于兄弟1而言，給定兄弟2的策略x2，兄弟1的最優(yōu)策略為x1=1–x2，分析同理，不再贅述。但在現(xiàn)實生活中，經(jīng)常觀察到的一個現(xiàn)象是，人們在分配利益時往往出現(xiàn)的均衡是平均分配，即兄弟1和兄弟2平均分配，各得1/2元錢。為什么會如此？這就引出了納什最早開創(chuàng)的合作性談判研究。具體講，一個雙人談判問題，是兩個人在所有可能的談判結(jié)果所產(chǎn)生的效用空間里，去協(xié)商選出一個效用組合來。如果談判不成，那么他們將各自得到一個談判破裂的效用。在不同的效用可能及協(xié)商破裂的可能下，怎樣去選出一個公平的談判結(jié)果?定義3.1一個雙人談判問題(Two-personbargainingproblem)，是一個R2里的集合X，以及X中的一個點d，記作(X,d)。其中X代表所有談判可能的結(jié)果下，談判者的所有可能效用的集合。d是談判破裂點（Disagreementpoint），代表當(dāng)他們談判破裂時，各自所得的效用。令Σ是所有談判問題的集合。也就是說，Σ={(X,d)|XR2,dX}。我們假設(shè)X是凸集合(Convexset)和緊集(Compactset)。再假設(shè)存在xX使得xi>di，i=1,2。即假設(shè)X中存在讓兩個人效用都大于談判破裂時的效用，這樣談判才有意義。定義3.2一個談判問題的解，F(xiàn)是一個從Σ映射到R2的函數(shù)。也就是說，對于任意一個(X,d)Σ，F(xiàn)(X,d)是X中的一個點。它代表的意思是，面對(X,d)這樣一個談判問題時，談判者只不過是從中找出一個雙方都接受的效用組合F(X,d)。一個“好”的分配原則（即談判的解），應(yīng)該滿足下列四個公設(shè)：A1效率性(Efficiency)A2尺度不變性(Invariance)A3無關(guān)選擇的獨立性(Independenceofirrelevantalternative)假設(shè)YX，且F(X,d)Y，則F(Y,d)=F(X，d)（見圖3-7）。xx1x2XYF(Y,d)=F(X,d)d圖3-7無關(guān)選擇的獨立性A4對稱性(Symmetry)若(x1,x2)X(x2,x1)X；且d1=d2，那么F1(X,d)=F2(X,d)(見圖3-8)。對稱性實際上是說，如果兩人完全平等（金錢、地位等），那么談判的結(jié)果對于兩人而言必然是一樣的。談判結(jié)果不一樣只可能要么有人是傻瓜，要么雙方的實力不對等。實力不對等則可以用d1≠d2或是不對稱的X表示。xx1x2XF(X,d)d450圖3-8對稱性定理3.1(Nash)上述雙人談判問題中只有一個解滿足公設(shè)A1—A4，那就是F(X,d)=(a)即F(X,d)其實是以(d1,d2)為中心的雙曲線與X的切點(見圖3-9)。xx1x2X(x1-d1)(x2-d2)=udx*圖3-9合作性談判的解我們分兩步來證明定理3.1。首先證明如果F(X,d)=，則F一定滿足公設(shè)A1—A4。(1)已知F(X,d)是上述問題的最大化解?，F(xiàn)在不妨假設(shè)存在一個y>F(X,d)，并且y∈X，那么可知F(X,d)不是上述問題的最大化解，而這與已知條件F(X,d)是上述問題的最大化解相矛盾。(2)設(shè)f=ax+b，a>0。那么x*∈F(f(X),f(d))=argmax(f1(x1)–f1(d1))(f2(x2)–f2(d2))=argmaxa2(F(X,d)，同時x*∈f(F(X,d))=argmaxf[(x1–d1)(x2–d2)]=argmaxaF(X,d)+b。即最優(yōu)分配方案x*不隨效用單位進(jìn)行線性變換而改變。(3)不妨設(shè)x*∈F(X,d)，已知，并且，那么x*一定是集合Y中的解，如果不是那就意味著存在一個y*∈F(Y,d)，有y*>x*，而這意味著x*不會是上述問題的最大化解()。顯然與已知條件矛盾。(4)顯然d1=d2，且X對稱，max(x1–d)(x2–d)x1*=x2*。如果不是，除非d1不等于d2，或是X不是對稱的。其次證明若有任何一個解F滿足公設(shè)A1—A4，那么F一定滿足(a)式。令=。我們要證明如果任一個解F滿足公設(shè)A1—A4，那么F(X,d)=。這里證明用到一個技巧是先將問題標(biāo)準(zhǔn)化。也就是進(jìn)行一個變換，把的坐標(biāo)轉(zhuǎn)換成(1,1)，d的坐標(biāo)轉(zhuǎn)換成(0,0)。令，=1,2。則很容易得出g()=(1,1)，且g(d)=(0,0)。不但如此，原先和X相切于點上的切線，在經(jīng)過變換會成為一條和橫軸成45°，且和X相切于g()點的線（見圖3-10）。由于X是緊致集，因此必然也是。同時，我們可以把g()這一點上的切線延長，劃出一對稱于45°線的等腰三角形△ABC，使得△ABC。我們先把F用在（△ABC,g(d)）這個談判問題上。由于△ABC以45°線對稱，且g1(d)=g2(d)=0，因此由A4可知F(△ABC,g(d))一定在45°線上。再由A1可知F(△ABC,g(d))是45°線上唯一滿足帕雷托效率的點。因此，F(xiàn)(△ABC,g(d))=(1,1)=g()。又由于△ABC，因而F(△ABC,g(d))=g()，因此由A3可知F(,g(d))=F(△ABC,g(d))=(1,1)。再令，也就是讓fi為gi的反函數(shù)，則=，很明顯fi是的線性轉(zhuǎn)換。因此由A2可知F(X,d)=F[f(),f(g(d))]=f(F(,g(d))=f(1,1)=，上式的第二個等式來自A2。因此我們證明了F(X,d)一定等于，而正是滿足(a)式的解。45°45°g(d)=(0,0)g(x*)=(1,1)x1x2g(x)ABC45°圖3-10談判空間的標(biāo)準(zhǔn)化根據(jù)定理3.1可知，分錢博弈雖然有無窮多個納什均衡，但只有唯一一個納什均衡是公平的分配，即兩兄弟各得1/2的錢。我們令d=(0,0)，即如果兩兄弟沒有合作成功，那么他們得到0的收益，那么{x1=1/2,x2=1/2}是(a)式唯一的最大化解。

7、報案我們經(jīng)常能在新聞中看到這樣的報道，一個犯罪嫌疑人在眾目睽睽之下從事犯罪活動，而周圍卻有很多人袖手旁觀。又如，一位兒童落水，同樣有很多人無動于衷。面對這些社會現(xiàn)象，有各種各樣的解釋，這里我們僅從博弈的角度來探討其原因。設(shè)有n個人觀察到一起犯罪活動。每個人都希望能夠通知警察，制止犯罪活動，但是他們都偏好別人打電話（因為打電話報警可能要付出成本，例如，需要付電話費，需要報身份證號等等）。如果沒有人打電話，那么自己打，總要好過受良心的譴責(zé)。具體而言，該博弈的基本式如下：（1）參與者：n個旁觀者，N={1,…,n}。（2）策略空間：Si={C,D}，C代表打電話，D代表不打電話，。（3）偏好：對于第i個參與者，如果別人打電話而自己不打電話，收益為v，如果自己打電話那么收益為v–c>0，如果沒有人打電話，那么收益為0。根據(jù)純納什均衡的定義，容易得到{一個人打電話，而其他人不打電話}是納什均衡，沒有人打電話不是納什均衡，這顯然與現(xiàn)實中觀察到的現(xiàn)象不完全吻合。那么沒有人打電話會不會也是一個納什均衡呢？如果引入混合策略，那么答案是肯定。我們不妨假設(shè)每個人打電話的概率都為1>p>0，那么1–p就是不打電話的概率，因而混合策略為(p,1–p)。根據(jù)前面所學(xué)知識，我們知道如果參與者運用混合策略，那么概率為正的純策略下的期望值都應(yīng)該相等。如果第i個旁觀者打電話，那么他的收益為v–c；如果他不打電話，那么可能出現(xiàn)兩種情況：一種是沒有人打電話，一種是至少有一個其他人打電話，因而其期望值為0×Pr{沒有其他人打電話}+v×Pr{至少有一個其他人打電話}。在均衡條件下必有v–c=0×Pr{沒有其他人打電話}+v×Pr{至少有一個其他人打電話}沒有人打電話的概率實際上等于1減去至少有一個其他人打電話的概率，即Pr{沒有其他人打電話}=1–Pr{至少有一個其他人打電話}將其帶入上式整理后就得v–c=v×(1-Pr{沒有其他人打電話})或c/v=·Pr{沒有其他人打電話}根據(jù)已知條件，Pr{沒有其他人打電話}=(1–p)n–1，由此得p=1–(c/v)1/(n–1)。根據(jù)命題2.7和命題2.8，立知該博弈除了存在n個純納什均衡之外，還存在唯一一個混合納什均衡，即每一個旁觀者都以p=1–(c/v)1/(n–1)的概率打電話，以(c/v)1/(n–1)的概率選擇不打電話。報案這個博弈有意思的地方在于：在混合納什均衡中，確實存在沒有人打電話的情況，而且沒有人打電話的概率隨著旁觀者人數(shù)的增加而增加。這一點通過下列計算就能看出來：Pr{沒有人打電話}=Pr{參與者i沒有打電話}×Pr{其他人沒有打電話}=(1–p)n=(c/v)n/(n-1)。我們對上式求關(guān)于n的一階導(dǎo)數(shù)，得>0即隨著旁觀者的增加，沒有人打電話的概率是增加的，由于至少有一個人打電話的概率等于1減去沒有人打電話的概率，因而旁觀者越多越有可能出現(xiàn)見死不救的情況。為什么會出現(xiàn)這種情況？實際上，如果只存在一個旁觀者，那么打電話的概率為1，但在存在多個旁觀者的情況下，任意一個旁觀者不打電話的概率為(c/v)1/(n–1)。由于c/v小于1，當(dāng)n增加時，不打電話的概率(c/v)1/(n–1)會變大，原因在于旁觀者之間產(chǎn)生了相互依賴的心理，總是寄希望于別人打電話報警。雖然每個人都性本善（v–c>0），但又存在一點點私心(v>v–c)，最終就有可能出現(xiàn)最不幸的結(jié)局。

8、專家診斷當(dāng)人們遇到問題時，通常會征求專家的意見以便解決問題。面對專家的診斷，你可能接受也可能拒絕，原因在于專家有動機(jī)會把小問題說成是大問題以便獲得較高的收益。我們不妨將這種情景模型化。假設(shè)一個消費者在消費某種產(chǎn)品時，產(chǎn)品無法正常工作，這個問題有可能是小問題，也可能是大問題，出現(xiàn)小問題的概率為1>r>0。專家知道這個問題是大問題還是小問題（不存在誤診），但他可以講真話，也可以講假話（把小問題說成是大問題）以獲得更大利益。消費者不能確定是大問題還是小問題，但可以拒絕專家的建議以尋求進(jìn)一步的解決辦法。大問題大修，小問題小修，小修不能解決大問題，但大修卻能解決大問題和小問題。顯然，消費者對于專家小修的建議始終采納，因為小問題大修能使專家獲得更多利益，而小修并不能解決大問題。小問題小修和大問題大修都將使專家獲得正常利潤π，但如果小問題大修那么將使專家獲得π’(>π)的利潤。如果大修，那么消費者支出H，如果小修支出L<H。如果消費者拒絕專家大修的建議，那么在專家說真話的情況下，需要支付更高的代價H’>H；在專家說假話的情況下，需要支付L’，其中H>L’>L。在上述這些假設(shè)下，專家的行動就為誠實和欺騙，而消費者的行動則為接受和拒絕，其博弈的基本式如圖3-11所示。消費者接受(q)拒絕(1-q)專家誠實(p)π，–rL–(1–r)Hrπ，–rL–(1–r)H’欺騙(1-p)rπ’+(1–r)π，–H0，–rL’–(1–r)H’圖3-11專家診斷根據(jù)納什定理可知，該博弈一定存在納什均衡。我們不妨設(shè)專家誠實的概率為p，消費者接受的概率為q。給定消費者的混合策略q，專家概率為正的純策略的期望收益應(yīng)該都相等，即qπ+(1–q)rπ=q(rπ’+(1–r)π)(3-zh-1)即當(dāng)q=π/π’時，專家的混合策略為。當(dāng)q<π/π’時，專家的混合策略為p=1，即始終選擇誠實。當(dāng)q>π/π’時，專家的混合策略為p=0，即始終選擇欺騙。反之，給定專家的混合策略p，那么消費者概率為正的純策略的期望收益同樣應(yīng)該都相等，即–p[rL+(1–r)H]–(1–p)H=–p[rL+(1–r)H’]–(1–p)[rL’+(1–r)H’]整理后得，(3-zh-2)從上式可以看出，當(dāng)H<rL’+(1–r)H’時，p<0，顯然這是不可能的。進(jìn)一步的分析顯示，當(dāng)H<rL’+(1–r)H’，表明消費者如果拒絕，那么實際支出要大于接受專家的建議（盡管專家欺騙），因而消費者只能始終接受專家建議，由于消費者始終接受專家的建議，因而專家的最優(yōu)策略是始終欺騙，即p=0。當(dāng)H>rL’+(1–r)H’時，表明消費者拒絕專家的建議尋求進(jìn)一步的幫助的期望支出要小于始終接受，因而專家的最優(yōu)策略只能是令p>0，即采取一種混合策略，有時講真話，有時講假話，以便消費者摸不清楚。另外，式(3-zh-2)又可寫成，即p<1?？偨Y(jié)上述分析可知，當(dāng)H<rL’+(1–r)H’時，存在唯一一個的純策略納什均衡（欺騙，接受）。當(dāng)H>rL’+(1–r)H’時，則存在唯一一個混合策略納什均衡()。當(dāng)H=rL’+(1–r)H’時，在專家欺騙的情況下，消費者接受或拒絕其收益都一樣，因而納什均衡也為（欺騙，接受）。為了更為形象，我們利用最優(yōu)反應(yīng)函數(shù)來進(jìn)一步驗證上述分析。專家的最優(yōu)反應(yīng)函數(shù)為。而消費者的最優(yōu)反應(yīng)函數(shù)則需要考慮兩種情況。當(dāng)H<rL’+(1–r)H’時，消費者的最優(yōu)反應(yīng)為，如圖3-12所示。qqpq=π/π’B1(q)B2(p)101圖3-12H<rL’+(1–r)H’時的納什均衡當(dāng)H>rL’+(1–r)H’時，消費者的最優(yōu)反應(yīng)函數(shù)為，如圖3-13所示。qq=π/π’qpB1(q)B2(p)101圖3-13當(dāng)H>rL’+(1–r)H’時的納什均衡綜上所述，納什均衡為（欺騙，接受）和(，)。有意思的是消費者的q，它取決于專家的正常利潤和欺騙時的利潤之比，如果兩者的比越大說明正常利潤和欺騙利潤非常接近（表明專家越不值得欺騙），因而消費者接受專家建議的可能性越大。而專家的p則其決于H與rL’+(1–r)H’的接近程度，兩者越接近表明消費者越無所謂，因而專家欺騙的動機(jī)越強(qiáng)烈。

9、連續(xù)行動下的混合策略納什均衡一個有趣的問題是，如果行動為連續(xù)時，存不存在混合策略及其納什均衡。為了回答這個問題，我們不妨從一個簡單的例子開始。例3.1全付拍賣(All-payauction)設(shè)兩個人竟拍100元人民幣，他們的報價為0到100元之間的整數(shù)，單位為分。如果報價為b1>b2，那么參與者1得到10000–b1的收益，而參與者2得到–b2的收益；如果兩人報價一樣b1=b2，那么各得(5000–bi)的收益（i=1,2）。由于人民幣最小的貨幣單位為分，因而存在著10,001種報價。顯然，該博弈不存在純納什均衡。為了證明這一點，我們不妨先設(shè)兩人的報價相等，即b1=b2，那么這是否為納什均衡？答案是否定的。因為如果b1<10000，那么只要參與者2報b2=b1+1，其收益將從5000–b2變?yōu)?0000–b2；如果b1=10000，那么參與者2報b2=0，其收益將從–5000變?yōu)?。所以，b1=b2不可能是納什均衡。其次，如果b1≠b2，不失一般性，設(shè)b1>b2，那么參與者2只要提高報價就可以使其收益由–b2變?yōu)?000–b2（b1=10000）或是10000–b2（b1<10000）。所以，b1≠b2也不可能是納什均衡。綜上所述，全付拍賣不存在純納什均衡。但根據(jù)納什定理，可知該博弈是有限博弈，至少存在一個混合策略納什均衡?，F(xiàn)在我們就來求這個混合策略納什均衡。由于該博弈存在10,001種純策略（以分為單位），所以我們不妨先設(shè)第2個參與者按照1/10001的概率取0到100元人民幣之間的任意整數(shù)，那么根據(jù)命題2.8可知，如果第1個參與者也使用混合策略的話，那么其每一個概率為正的純策略的期望值都應(yīng)該相等，即當(dāng)b1∈{0,1,…,10000}時，Pr{b2<b1}×(10000–b1)+Pr{b2=b1}×(5000–b1)+Pr{b2>b1}×–b1=c其中c為常數(shù)。顯然，Pr{b2<b1}=b1/10001，Pr{b2=b1}=1/10001，而Pr{b2>b1}=1–(b1+1)/10001，我們可以近似地把Pr{b2=b1}看作0（相當(dāng)于連續(xù)隨機(jī)變量），整理上式，得=c這就證明了我們的猜測，當(dāng)參與者2取1到10000的報價的概率都為1/10001時，如果參與者1也使用混合策略，那么參與者1概率為正的純策略期望收益都相等。利用對稱性，對參與者2的分析完全一樣，不再贅述。全付拍賣存在一個對稱混合策略納什均衡——每個參與者以1/10001的概率取1到10001之間的整數(shù)。實際上，全付拍賣博弈中策略的單位為分

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論-第三章教材課件

文檔簡介

溫馨提示

最新文檔

評論

博弈論-第三章教材課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔