中級微觀經(jīng)濟學(xué)第十四講博弈論補充_第1頁
中級微觀經(jīng)濟學(xué)第十四講博弈論補充_第2頁
中級微觀經(jīng)濟學(xué)第十四講博弈論補充_第3頁
中級微觀經(jīng)濟學(xué)第十四講博弈論補充_第4頁
中級微觀經(jīng)濟學(xué)第十四講博弈論補充_第5頁
已閱讀5頁,還剩146頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

博弈論西南財經(jīng)大學(xué)經(jīng)濟學(xué)院袁正副教授Gibbons,《APrimerinGameTheory》(1992)張維迎,《博弈論與信息經(jīng)濟學(xué)》(1995),上海三聯(lián)書店,上海人民出版社謝識予:《經(jīng)濟博弈論》,復(fù)旦大學(xué)出版社參考教材博弈是資源配置的一種方式博弈:策略對抗策略對抗決定資源的配置石頭、剪刀、布抓鬮拍賣什么是博弈博弈就是策略對抗博弈Game,博弈論GameTheory,Game即與策略有關(guān)的游戲、競技游戲:下棋、猜大小、田忌賽馬經(jīng)濟:寡頭產(chǎn)量決策、市場阻入、投標(biāo)拍賣政治、軍事:民進黨和國民黨、中美合作、國際減排協(xié)議、空城計、核競賽。生活:囚徒困境、情侶博弈、斗雞博弈、青蛙與蝎子一個非技術(shù)性定義博弈就是參與人在一定的規(guī)則下,同時或先后,一次或多次,從各自允許選擇的行為或策略中進行選擇并加以實施,各自取得某種結(jié)果的過程。四個核心方面

博弈的參與人各博弈方的策略或行為博弈的次序博弈方的得益博弈的參與人獨立決策、獨立承擔(dān)博弈結(jié)果的個人或組織博弈規(guī)則面前博弈方之間平等博弈方數(shù)量:兩人博弈、三個博弈、多人博弈等。囚徒困境、猜硬幣、田忌賽馬等都是兩人博弈鷸蚌相爭,魚翁得利,是三人博弈參與人的行動或策略策略:博弈參與人可選擇的行動方案不同博弈方的可選策略可以不同,而且可選策略的數(shù)量也可不同每個參與人都有一個策略集。有限博弈:每個博弈方的策略數(shù)都是有限的無限博弈:至少有某些博弈方的策略有無限多個博弈中的得益得益:各博弈方從博弈中所獲得的收益得益對應(yīng)各策略組合,由博弈規(guī)則或博弈事實決定策略互動決定參與人的得益共同行動的結(jié)果:Ui(S1,…,Si,…,Sn)囚徒困境Tucker(1950)是博弈論最經(jīng)典的博弈來自一個法律刑偵或犯罪學(xué)方面的問題,但可以擴展到許多經(jīng)濟問題社會問題,可以揭示一種市場失靈兩個囚徒,關(guān)在兩間不同的屋子,分開審.每個人的策略空間{坦白,不坦白}警方公布規(guī)則,坦白從寬,抗拒從嚴,寬怎么寬,嚴怎么嚴每個人的策略構(gòu)成一個策略組合,共同決定了彼此的收益.支付矩陣-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白囚徒2囚徒1行參與人的得益寫在前面,列參與人的得益寫在后面靜態(tài)博弈的標(biāo)準(zhǔn)式UA(坦白,坦白)=-5UA(坦白,不坦白)=0類似…一個參與人的支付不僅取決于自己的策略,而且取決于其他參與人的策略博弈的過程靜態(tài)博弈:同時選擇策略。參與人在行動順序上并無先后之分任何一方行動時,并不知道其它人的行動。動態(tài)博弈:先后行動。后行動者知道先行動者的行動。在靜態(tài)博弈中,策略與行動不作區(qū)分,策略即行動。囚徒困境每個參與人的策略集是{坦白,不坦白},行動集也是{坦白,不坦白}信息完全信息:每一位參與人對其它所有參與人的類型,策略空間及支付函數(shù)有準(zhǔn)確的知識。否則,就是不完全信息博弈分類完全信息靜態(tài)博弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈經(jīng)濟人假設(shè)人是自利的人是理性計算的,即追求利益最大化博弈論也建立在經(jīng)濟人假設(shè)之上理性共識每個博弈方是理性的我是理性的,你是理性的,我知道你是理性的,你知道我是理性的。我知道你知道我是理性的,你知道我知道你是理性的……所有參與者知道所有參與者知道所有參與者是理性的在理性共識的假設(shè)下,每個參與人的決策目標(biāo)是使自己的利益最大化這是博弈分析的邏輯基礎(chǔ)均衡一種穩(wěn)定狀態(tài)個體行為達到最優(yōu)時,從而缺乏激勵改變目前的行為均衡:個體在一定的約束條件下的最優(yōu)選擇所對應(yīng)的狀態(tài)個體行為從非均衡走向均衡這是理性選擇的結(jié)果完全信息靜態(tài)博弈完全信息:每一位參與人對其它所有參與人的類型,策略空間及支付函數(shù)有準(zhǔn)確的知識。靜態(tài)博弈:所有博弈方同時或可看作同時選擇策略博弈規(guī)則是重要的博弈規(guī)則決定了博弈的進程和支付博弈規(guī)則也是共同知識博弈方的能力和理性完全理性和有限理性完全理性:有完美的分析判斷能力和總會選擇最優(yōu)行為。有限理性:試圖理性,但只是有限的理性。個體理性和集體理性個體理性:個體利益最大化集體理性:追求集體利益最大化囚徒困境博弈的標(biāo)準(zhǔn)式表述

AB坦白抵賴坦白抵賴-1,-1-10,00,-10-8,-8uA(抵賴,坦白)=-10uA(抵賴,抵賴)=-1-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面猜硬幣博弈田忌賽馬(三匹馬,賽三場)3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齊王能否寫出該博弈的標(biāo)準(zhǔn)式石頭、剪子、布0,01,-1-1,1-1,11,-10,01,-1-1,10,0石頭剪子布博弈方2石頭剪子布博弈方10,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方2博弈方1博弈方3——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方2博弈方1博弈方3——B三人博弈的標(biāo)準(zhǔn)式表示

課堂練習(xí)你指揮兩個師的兵力攻城,守敵是三個師,雙方兵力只能整師調(diào)動只有兩條可行的攻城路徑攻城兵力超過守敵,則勝利。少于等于守敵,則失敗。寫出博弈的標(biāo)準(zhǔn)式攻城博弈攻城方的幾種行動策略:a:兩個師攻擊甲路b:兵分兩路,一個師攻甲路,一個師攻乙路c:兩個師攻擊乙路守城方的幾種行動策略:A:三個師守甲路B:兩個師守甲路,一個師守乙路C:一個師守甲路,兩個師守乙路D:三個師守乙路-1,1-1,11,-11,-11,-1-1,1-1,11,-11,-11,-1-1,1-1,1ABCD守軍abc攻城軍隊在一個n人博弈中,n個參與人每人選擇一個策略,n維向量s=(s1,…,si,…,sn)構(gòu)成一個策略組合,其中si是第i個參與人選擇的策略支付:博弈參與人在某一策略組合下所得到的效用水平ui=ui(s1,…,si,…sn)一個參與人的支付不僅取決于自己的策略選擇,而且取決于其他參與人的策略選擇一個博弈的正規(guī)表述一個博弈的正規(guī)表述G=(S1,…,Sn;u1,…un),其中,Si表示第i個參與人可以選擇的策略空間,ui為第i個參與人的支付參與人的決策問題:給定其他參與人的策略,選擇最優(yōu)的策略以使自己的支付最大化博弈分析的目的:預(yù)測博弈的均衡均衡:所有參與人的最優(yōu)戰(zhàn)略組合均衡表示為s*=(s1*,…,sn*)其中si*表示第i個參與人的最優(yōu)戰(zhàn)略對于任意i,Ui(s1*,…,si-1*,si*,si+1*,…sn*)≧Ui(s1*,…,si-1*,si,

si+1*,…sn*)均衡理性的參與者不會選擇劣戰(zhàn)略,會剔除劣策略,選擇占優(yōu)策略如果某個策略組合由所有參與人的占優(yōu)策略組成,那么這策略組合是占優(yōu)策略均衡占優(yōu)策略均衡只要求每個參與人是理性的。占優(yōu)策略均衡在一個博弈G=(S1,…,Sn;u1,…un)中,對于參與人i的任意兩個可行戰(zhàn)略si’和si’’,如果對于任何給定的其他參與人的戰(zhàn)略,i選擇si’的支付要小于(小于等于)其選擇si’’的支付Ui(s1,…,si’

,…sn)<=Ui(s1,…,si’’

,…sn)戰(zhàn)略si’相對于戰(zhàn)略si’’是劣戰(zhàn)略嚴格劣和弱劣之分理性參與人會剔除劣策略(嚴格)劣戰(zhàn)略:B:做廣告不做廣告A:做廣告不做廣告10,515,06,810,2占優(yōu)策略均衡B:做廣告不做廣告A:做廣告不做廣告10,515,06,810,2B:做廣告不做廣告A:做廣告10,515,0(做廣告,做廣告)是本博弈的占優(yōu)策略均衡占優(yōu)策略均衡AB坦白抵賴坦白抵賴-1,-1-10,00,-10-8,-8有沒有占優(yōu)策略均衡?人是理性的找出并剔除劣策略重新構(gòu)造一個不包含已剔除策略的新博弈要求理性共識在新博弈中重復(fù)剔除劣策略若余下唯一策略組合,則稱重復(fù)剔除劣策略可解?!爸貜?fù)剔除劣策略均衡”重復(fù)剔除劣策略均衡智豬博弈豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應(yīng)的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,若大豬先到槽邊,大小豬吃到食物的收益比是9∶1;同時到槽邊,收益比是7∶3;小豬先到槽邊,收益比是6∶4。按鈕等待按鈕5,14,4等待9,-10,0大豬小豬智豬博弈按鈕等待按鈕5,14,4等待9,-10,0大豬小豬智豬博弈等待4,40,0按鈕等待小豬大豬(大豬按鈕,小豬等待)是重復(fù)剔除劣策略均衡經(jīng)濟含義:強勢方積極行事,弱勢方搭便車大豬行動,小豬搭便車大股東,小股東大戶,散戶大企業(yè),小企業(yè)(打廣告)富人,窮人(修路)1,01,20,10,30,12,0上下左中右重復(fù)剔除劣策略剔除嚴格劣策略的先后順序,不會影響均衡結(jié)果如果剔除弱劣,則剔除的先后順序會影響到均衡結(jié)果。2,51,31,50,50,31,40,50,30,6上下左中右鐘按下,右,中,鐘順序剔除中,鐘,左,下1,01,33,00,20,13,00,22,45,3ABC局中人2abc局中人1攻城博弈1,01,30,20,10,22,4AB局中人2abc局中人11,01,30,22,4AB局中人2ac局中人11,32,4B局中人2ac局中人1(C,B)就是一個重復(fù)剔除劣策略均衡800,6000,00,10000,1000AB局中人2ab局中人1把劣勢策略剔除,可以是弱劣勢策略(a,A)是本博弈的占優(yōu)策略均衡(a,A)也可由重復(fù)剔除劣策略得到重復(fù)剔除嚴格劣戰(zhàn)略的缺陷之一:當(dāng)出現(xiàn)弱劣時剔除的順序?qū)⒂绊懽罱K結(jié)果對于同一博弈,但重復(fù)剔除占優(yōu)均衡不一定是唯一的為博弈分析預(yù)測博弈的均衡結(jié)果帶來了困難對于很多博弈無法使用重復(fù)剔除劣戰(zhàn)略的方法找到均衡結(jié)論:有必要發(fā)展新的均衡概念重復(fù)剔除嚴格劣戰(zhàn)略的缺陷之二B:做廣告不做廣告A:做廣告不做廣告10,515,06,818,10納什均衡相對優(yōu)勢策略:相對于其它局中人的策略,選擇一個優(yōu)勢策略劃線法尋找相對優(yōu)勢策略所有局中人的相對優(yōu)勢策略組合,就是納什均衡是一種均衡狀態(tài),沒有任何一方有單獨改變的動機在一個博弈G=(S1,…,Sn;u1,…un)中,如果策略組合(s1*,…,si*,…sn*)滿足,對每一個參與人i,si*是對于其他參與人所選擇戰(zhàn)略(s1*,…,si-1*,si+1*,…sn*)的最優(yōu)反應(yīng)戰(zhàn)略,則稱戰(zhàn)略組合(s1*,…,si*,…sn*)為該博弈的一個Nash均衡(NE)Nash均衡(1950,1951):上述定義可以表述為:對于任意i,Ui(s1*,…,si-1*,si*

,si+1*,…sn*)≧Ui(s1*,…,si-1*,si,

si+1*,…sn*)在其它參與人固守帶星號策略選擇時,參與人i選擇si*

的得益大于其它任何策略或者說,si*為以下優(yōu)化問題的解連續(xù)決策變量情形:納什均衡納什均衡可能不存在,可能唯一,也可能有多個(做廣告,做廣告),(不做廣告,不做廣告)都是納什均衡B:做廣告不做廣告A:做廣告不做廣告10,515,06,818,102,10,0-1,-11,2女生足球賽男生芭蕾舞足球賽芭蕾舞情侶博弈(足球賽,足球賽),(芭蕾舞,芭蕾舞)是本博弈的納什均衡前進后退前進-2,-21,-1后退-1,10,0A雞B雞斗雞博弈斗雞博弈的納什均衡:(A雞前進,B雞后退)(A雞后退,B雞前進)斗雞博弈的納什均衡(兩個):(前進,后退),(后退,前進)從結(jié)果看,不是對手戰(zhàn)勝自己,就是自己戰(zhàn)勝對手美蘇爭霸,搶占地盤夫妻矛盾斗雞博弈按鈕等待按鈕5,14,4等待9,-10,0大豬小豬智豬博弈的納什均衡囚徒困境的納什均衡AB坦白抵賴坦白抵賴-1,-1-10,00,-10-8,-8囚徒困境是一類博弈,具有共同的特征這里,納什均衡對個人來說是理性的,但是個人的理性選擇,卻不符合集體理性個體理性與集體理性相沖突囚徒困境在現(xiàn)實經(jīng)濟生活中普遍存在

價格聯(lián)盟(卡特爾協(xié)定)個體的理性選擇,對于集體來說,是低效的卡特爾協(xié)議經(jīng)常失敗伊拉克:高產(chǎn)量低產(chǎn)量伊朗:高產(chǎn)量低產(chǎn)量400,400600,300300,600500,500B:勾結(jié),30違約,40A:勾結(jié),30違約,401800,18001500,20002000,15001600,1600卡特爾協(xié)議容易瓦解(40,40)納什均衡,勾結(jié)協(xié)議會瓦解軍備競賽蘇聯(lián):核競賽核裁軍美國:核競賽核裁軍2,26,11,64,4核裁軍協(xié)定是不可靠的.香煙廣告博弈

萬寶路廣告不作廣告廣告不作廣告駱駝30億,30億20億40億50億20億,40億,50億,公共資源博弈??松臎Q策鉆兩口井鉆一口井鉆兩口井鉆一口井阿爾科的決策400億400億300億500億600億300億500億600億B:做廣告不做廣告A:做廣告不做廣告10,515,06,820,2一種經(jīng)驗方法尋找納什均衡箭頭法尋找納什均衡囚犯1(-3,-3)(0,-6)(-6,0)(-1,-1)坦白抵賴坦白抵賴囚犯2箭頭從支付小指向支付大,反映博弈人單獨改變策略的激勵。沒有箭頭向外指出的格子代表的策略組合,是納什均衡最小最大方法在零和博弈中,尋找純策略納什均衡的方法,只適合零和博弈出于對人的理性的理解B會采取策略使A的收益最小化B會采取策略使B的收益最大化相反,同理-3,34,-410,-106,-6A:上下B:左右思考參與人A的收益Min=-3Min=6Maxmin=6Max=10Max=6Minmax=6(下,右)就是純策略納什均衡結(jié)果A的Maxmin與B的Minmax相等練習(xí):思考參與人B-3,34,-410,-106,-6A:上下B:左右Min=-10Min=-6Maxmin=-6Max=3Max=-6Minmax=-6Maxmin=Minmax(下,右)就是純策略納什均衡結(jié)果純策略納什均衡不存在1,-1-1,1-1,11,-1A:紅黑B:紅黑Min=-1Min=-1Maxmin=-1Max=1Max=1Minmax=1不相等,純策略納什均衡不存在許多不存在嚴格占優(yōu)策略均衡和重復(fù)剔除嚴格劣策略均衡的博弈,可以存在納什均衡嚴格占優(yōu)策略均衡一定是博弈的唯一納什均衡。反之不然。每一個重復(fù)剔除嚴格劣策略均衡一定是納什均衡,反之不然。納什均衡一定不會被重復(fù)剔除嚴格劣戰(zhàn)略所剔除。Nash均衡的特征之一

NE是博弈參與人相互作用的結(jié)果,從而代表了一種“策略穩(wěn)定”狀態(tài)當(dāng)這種結(jié)果出現(xiàn)后,任何參與人都不可能給定其他參與人的最優(yōu)策略,單方面地改變自己的策略而使自己的支付提高任何參與人無法通過改變策略而得利所有參與人都不愿意單方面改變策略,因為這樣做無利可圖Nash均衡的特征之二

作為博弈參與人的最優(yōu)策略組合的NE是符合經(jīng)濟理性的,因此,參與人會自動實施一個有效的制度或協(xié)議要有效,必須是一個NE.如果一項制度或協(xié)議不是一個NE,即意味著參與人將缺乏積極性遵守這個制度或協(xié)議(或者說無法自動實施)張維迎:不滿足Nash均衡要求的協(xié)議是沒有意義的Nash均衡的特征之三

連續(xù)決策變量情形:納什均衡當(dāng)且僅當(dāng)對任意參與人i寡頭壟斷企業(yè)1和2生產(chǎn)的同質(zhì)產(chǎn)品:q1,q2市場總產(chǎn)量:Q=q1+q2市場價格決定:反需求函數(shù)p=a-Q企業(yè)1和2生產(chǎn)單位產(chǎn)品的邊際成本同為c企業(yè)1(或2)的總成本:cq1(或cq2),其中假設(shè)c<a兩廠商同時決策產(chǎn)量古諾模型給定企業(yè)2的產(chǎn)量q2廠商1的反應(yīng)函數(shù)給定企業(yè)1的產(chǎn)量q1企業(yè)2的反應(yīng)函數(shù)古諾納什均衡當(dāng)企業(yè)1和2的反應(yīng)函數(shù)同時成立(1/3(a-c),1/3(a-c))構(gòu)成Cournot博弈的NE企業(yè)1和2的反應(yīng)曲線的交點q2q1R1(q2)R2(q1)古諾納什均衡企業(yè)1(或2)的利潤(均衡結(jié)果):Π1(q1*,q2*)=1/9(a-c)2寡頭壟斷的市場結(jié)構(gòu)下均衡時總的產(chǎn)出:均衡時總利潤為:古諾均衡時的行業(yè)產(chǎn)量與利潤卡特爾聯(lián)盟合謀壟斷時的情形卡特爾協(xié)議(1/4(a-c),1/4(a-c))是否構(gòu)成NE?練習(xí)寡頭壟斷企業(yè)1和2生產(chǎn)的同質(zhì)產(chǎn)品:q1,q2市場總產(chǎn)量:Q=q1+q2市場價格決定:反需求函數(shù)p=a-Q企業(yè)1和2生產(chǎn)單位產(chǎn)品的邊際成本分別為c1,c2,沒有固定成本。求古諾納什均衡給定企業(yè)2遵守卡特爾協(xié)議規(guī)定的產(chǎn)出水平1/4(a-c)現(xiàn)在考慮企業(yè)1最優(yōu)的產(chǎn)出水平最優(yōu)產(chǎn)量高于卡特爾協(xié)議規(guī)定產(chǎn)量,因此,理性的廠商會有違約的動機而多生產(chǎn)卡特爾協(xié)議容易瓦解一項制度或者協(xié)議要起作用,必須是納什均衡伯特蘭寡頭模型同時決策價格兩個廠商生產(chǎn)同類產(chǎn)品,定價p1,p2邊際成本同為c,若:q1=a-p1+bp2q2=a-p2+bp1公有資源問題N個村民,公有牧地gi:村民放羊的數(shù)量G=g1+g2+…gn每只羊的邊際成本為c每只羊的價值為v(G)G<GMAX,v(G)>0,G≥GMAX,v(G)=0V’(G)<0,v”(G)<0村民i的收益一階條件:N個村民的一階條件加總得:村民單獨決策G為村民個體決策時,全村總羊數(shù)集體決策一階條件:G*為全村集體決策時的總羊數(shù)可證明,G>G*即個體決策時,過度放牧了,個體理性不符合集體理性假設(shè)3個農(nóng)戶,假設(shè)養(yǎng)羊q1,q2,q3V=V(Q)=100-(q1+q2+q3)邊際成本c=4求解納什均衡公地的悲劇一個實例反應(yīng)函數(shù)q1=R(q2,q3)=48-0.5q2-0.5q3q2=R(q1,q3)=48-0.5q1-0.5q3q3=R(q1,q2)=48-0.5q2-0.5q1q1=q2=q3=24U1=U2=U3=576U總=1728總體利益最大化時的養(yǎng)羊數(shù)U=Q(100-Q)-4QQ=48U=2304NE的局限性NE的缺陷之一:NE的多重性NE的缺陷之二:部分NE包含不可置信的戰(zhàn)略NE的缺陷之三:不存在純策略NE性別戰(zhàn)看拳擊y看芭蕾1-y看拳擊x2,10,0看芭蕾1-x0,01,2男生女生兩個純戰(zhàn)略NE:(看拳擊,看拳擊),(看芭蕾,看芭蕾)性別戰(zhàn)博弈與斗雞博弈的共同特征:同時存在多個NENE的缺陷之一:NE的多重性很難預(yù)測實際發(fā)生的NE,從而有悖博弈分析的宗旨市場進入阻撓在位者:默許斗爭進入者:進入不進入40,50-10,00,3000,300(進入,默許)(不進入,斗爭)是兩個納什均衡,但后者是不可置信的。聚點Schelling《沖突的戰(zhàn)略》(1960)聚點(focalpoint):在眾多的NE中實際更可能發(fā)生的NE聚點出現(xiàn)的原因是共同的信念,即共識我認為應(yīng)該這樣,你也相信我會這么認為博弈雙方的一致性預(yù)測聚點解決納什均衡的多重性聚點(focalpoint):在眾多的NE中實際更可能發(fā)生的NE博弈雙方的一致性預(yù)測基于共同的信念,即共識你認為應(yīng)該這樣,我也是這么想的聚點產(chǎn)生的原因這種共識可能來自于社會規(guī)范:大家都這樣做,我也這樣做如文化背景,習(xí)慣,規(guī)范“孔融讓梨”“尊老愛幼”的社會規(guī)范也可能來自特定的信息:如天時,地利,特殊數(shù)量也可能來自彼此的共同理解社會規(guī)范有助于在眾多的均衡中尋找聚點,從而在一定程度上克服了博弈分析出現(xiàn)多重NE的困境剛追上的女朋友在一起,去打開水,誰去?一個蘋果,是小弟弟吃還是大哥哥吃?情侶約會忘記了說地方,一般會去?兩個人報一個時間,如果報的時間相同,則獎勵100元。兩個人報一個見面地點,如果相同,則獎勵100元分組博弈:要求兩個人將上海,長春,哈爾濱,南京分成兩組,分法相同,則獎勵100元靠右行駛:習(xí)俗或規(guī)定打電話,突然斷了,接下來?一方打過去,另一方等待誰打給誰,再打過去誰免費電話,再打過去誰有錢,誰再打過去現(xiàn)在利用上述理論來分析“性別戰(zhàn)”博弈中可能出現(xiàn)的聚點如果活動的那天是女生的生日如果活動場所正好在女生上班的地方附近“男生在追求女生”男生認為應(yīng)該博得女生的歡心,女生也認為男生會這么想帕累托上策均衡(鷹鴿博弈)這個博弈中有兩個純策略納什均衡,(戰(zhàn)爭,戰(zhàn)爭)和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個帕累托上策均衡。-5,-5-10,88,-1010,10戰(zhàn)爭和平國家2戰(zhàn)爭和平國家1戰(zhàn)爭與和平風(fēng)險上策均衡帕累托上策均衡并不一定是最優(yōu)選擇,需要考慮風(fēng)險。9,98,00,87,7LR博弈方2UD博弈方1風(fēng)險上策均衡(D,R)5,53,00,33,3鹿兔子獵人2鹿兔子獵人1風(fēng)險上策均衡(兔子,兔子)獵人博弈不存在純策略納什均衡PlayerBPlayerA(1,2)(0,4)(0,5)(3,2)UDLR如何計算混合策略納什均衡PlayerA(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBB選擇L時,其期望收益為PlayerA(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerB期望支付相等當(dāng)B選擇R時,其期望收益為:PlayerA(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBB選L還是R無差異PlayerA(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerBPlayerA如果A選U,其期望收益為(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerBPlayerA

如果A選D,其期望收益為:(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerBA選U還是D無差異混合策略納什均衡A選擇混合策略(3/5,2/5),B選擇混合策略(3/4,1/4).PlayerBPlayerA(1,2)(0,4)(0,5)(3,2)U,D,L,R,這一混合策略組合就是本博弈的混合策略納什均衡最優(yōu)化方法BALRUD(2,1)(0,0)(0,0)(1,2)r1-rc1-c計算各種策略組合的概率(U,L)概率為:rc(D,L)概率為:(1-r)c(U,R)概率為:r(1-c)(D,R)概率為(1-r)(1-c)參與人A的期望收益LA=2rc+1(1-r)(1-c)LB=rc+2(1-r)(1-c)求解最優(yōu)化L(A)=2rc+1(1-r)(1-c)dL(A)/dr=3c-1=0L(B)=rc+2(1-r)(1-c)dL(B)/dc=3r-2=0c=1/3r=2/3A:(2/3,1/3),B:(1/3,2/3)是本博弈的混合策略納什均衡完全信息動態(tài)博弈參與人先后行動每個參與人對每個參與人的得益具有完全信息博弈樹參與人的行動順序(whentomove,誰在什么時候行動)參與人的信息集(whatknown,每次行動時參與人知道些什么)行動組合(a1,…,ai,…,an)共同行動的結(jié)果:Ui(a1,…,ai,…,an)在完全信息靜態(tài)博弈中,策略與行動不區(qū)分。在動態(tài)博弈中,策略是關(guān)于行動的“相機行動規(guī)劃”

策略互動產(chǎn)生結(jié)果乙不犯犯甲不犯犯犯不犯甲人不犯我,我不犯人請寫出甲的各種策略{犯,犯},{犯,不犯},{不犯,犯},{不犯,不犯}策略組合:(s1,…,si,…,sn)ui=ui(s1,…,si,…sn)一個參與人的支付不僅取決于自己的策略選擇,而且取決于其他參與人的策略選擇Maxui=ui(s1,…,si,…sn)策略組合完美信息動態(tài)博弈開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(-3,-3)(1,0)(0,1)(0,0)ABB均為單結(jié)點信息集,這樣的博弈是完美信息博弈開發(fā)不開發(fā)大小大小ANNBBBB(8,0)(-3,-3)(1,0)(0,8)(0,1)(0,0)(0,0)開發(fā)開發(fā)開發(fā)開發(fā)不開發(fā)不開發(fā)不開發(fā)不開發(fā)B有兩個信息集,每個信息集包含兩個決策結(jié)是為不完美信息動態(tài)博弈開發(fā)不開發(fā)大小大小ANNBBBB(8,0)(-3,-3)(1,0)(0,8)(0,1)(0,0)(0,0)開發(fā)開發(fā)開發(fā)開發(fā)不開發(fā)不開發(fā)不開發(fā)不開發(fā)一個戰(zhàn)略組合它是整個博弈的NE其行動規(guī)則在每一子博弈上也都是NE子博弈精煉納什均衡SPNE:開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(-3,-3)(1,0)(0,1)(0,0)ABB寫出B的策略集(開,開)(開,不開)(不開,開)(不開,不開)開發(fā)-3,-3-3,-31,01,0不開發(fā)0,10,00,10,0A開發(fā)商B房地產(chǎn)開發(fā)博弈的標(biāo)準(zhǔn)式表述(開發(fā),(不開發(fā),開發(fā))),(開發(fā),(不開發(fā),不開發(fā))),(不開發(fā),(開發(fā),開發(fā)))一些NE包含不可置信的戰(zhàn)略開發(fā)博弈的純戰(zhàn)略NE:檢驗三個納什均衡:(開發(fā),(不開發(fā),不開發(fā))),(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)))是否滿足子博弈精煉納什均衡的要求?開發(fā)不開發(fā)(-3,-3)(1,0)B子博弈B1開發(fā)不開發(fā)B(0,1)(0,0)子博弈B2開發(fā)不開發(fā)A逆向歸納法對于有限完美信息動態(tài)博弈,逆向歸納法是求解子博弈精煉納什均衡的最簡便方法.從最后一個子子博弈決策結(jié)開始,找出其最優(yōu)選擇回到倒數(shù)第二個決策結(jié),找出其最優(yōu)選擇直到從初始結(jié)開始的原博弈,找出其最優(yōu)選擇最終得到的NE構(gòu)成SPNESPNE開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)-3,-31,00,10,0ABB(開發(fā),(不開發(fā),開發(fā)))是本博弈的SPNE理性共識青蛙與蝎子

青蛙不背背蝎子咬不咬(-10,5)(5,3)(0,0)蝎子SPNE是(不背,咬)減少參與人的行動空間以“破釜沉舟”為例軍隊的行動空間:(前進,后退)斗雞博弈有兩個NE:(A前進,B后退)或者(A后退,B前進)承諾改變博弈結(jié)果承諾問題:斗雞博弈-2,-21

-1-1,10,0公雞2

:斗不斗公雞1:斗不斗(斗,不斗),(不斗,斗)是兩個純策略納什均衡如果公雞1事先做出某種承諾,顯示非斗不可的決心,那么公雞2最好的策略是走為上策.承諾蝎子承諾不咬青蛙,這種承諾必須是不可撤銷的,而且是可觀察的.或者違背承諾的成本高昂.蝎子同意用絞布封住其嘴巴(改變其行動空間)青蛙可以雇用一個職業(yè)殺手,只要蝎子違背承諾,就干掉蝎子的兒子(改變其支付函數(shù)).青蛙不背背蝎子咬不咬(-10,-5)(5,3)(0,0)蝎子承諾蝎子同意用絞布封住其嘴巴(改變其行動空間)青蛙可以雇用一個職業(yè)殺手,只要蝎子違背承諾,就干掉蝎子的兒子(改變其支付函數(shù)).青蛙不背背蝎子

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論