博弈論教材2013-2_第1頁
博弈論教材2013-2_第2頁
博弈論教材2013-2_第3頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章納什均衡及其應(yīng)用3.1混合策略納什均衡1鷹鴿博弈我們知道老鷹具有攻擊性,而鴿子愛好和平。在原始社會里有兩個(gè)部落,可以做出兩個(gè)行動:一是進(jìn)攻一是和平,分別用鷹和鴿表示。表1鷹鴿博弈甲鷹鴿該博弈的那是均衡為 (鷹,鴿),(鴿,-25,-2514,-9-9,145,5乙鷹鴿?jì)棧?。一些學(xué)者研究發(fā)現(xiàn), 在同一個(gè)地域內(nèi),0.36時(shí),選擇鷹策略;否則選擇鴿策略。使用混合策略-25,-2514,-9-9,145,5鷹p 鴿1-p鷹鴿q1-q和 鴿”的比例為0.36 : 0.64。事實(shí)上,設(shè)鷹鴿比為 z:1 z,可以得出如下結(jié)果:E(e) 25z 14(1 z) 14 39z ;E(d) 9z 5(1 z

2、) 5 14zz0.3625聰明的做法是:當(dāng)鷹鴿比小雨方法分析:第一步:混合策略型表示:甲第二步:計(jì)算期望效用:E甲 p(9 25q) 5 14qE乙 q(25p 9) 5 14p第三步:作出最優(yōu)反應(yīng)函數(shù)1若q90如果p92525p 0,1若q925,q 0,1如果p9250若q9251如果p925第四步:作出反應(yīng)函數(shù)的圖像p92509iq259 Q第五步:根據(jù)交點(diǎn),找出納什均衡:其中(,)是混合策略納什均衡。25 252斗雞博弈我的老家地處安徽最北部,蘇魯豫皖四省交界之處,東北處有條小河。河邊的棉花地里,經(jīng)常有鵪鶉棲息在其間。秋末冬初的農(nóng)閑時(shí)節(jié),小鵪鶉剛好長成。村民結(jié)網(wǎng)捕鵪鶉把玩、 斗鳥兒為

3、樂。每天早晨4點(diǎn)多鐘出發(fā),大約7點(diǎn)鐘回來,雄性的鵪鶉留起來先要整夜整夜的 熬鵪鶉、放在手里把鵪鶉,真正熟練了,才拿出來和別人的相斗。 設(shè)想兩只鵪鶉要在場子里一決雌雄。每只鵪鶉都有兩個(gè)策略: 攻擊或逃跑。由于兩只鵪鶉實(shí)力相當(dāng), 若同時(shí)選擇進(jìn)攻 會兩敗俱傷;若一只進(jìn)攻,一只逃跑,進(jìn)攻者勝利。逃跑的鵪鶉算是玩完了,以后再也沒膽 量進(jìn)場子,主人也不回在把玩它,會用一塊黑布把它的籠子蒙起來,培養(yǎng)成“叫子”,以后 后捕鵪鶉的時(shí)候拎出去吸引同伴。若同時(shí)逃跑不會敗掉,以后還能斗,但是都會挨餓一天。表2-10斗雞博弈猛英雄大將軍3 猜幣博弈(matching pennies )-3,-32,-1-1,2-1,-

4、1攻擊逃跑攻擊逃跑甲、乙兩個(gè)人各持有一枚硬幣,同時(shí)決定顯示正面(數(shù)字)朝上還是反面(國徽或花紋)朝上,若兩人朝上的一面相同甲輸給乙10元錢,若不同,則乙輸給甲 10元錢。表2-1猜幣博弈乙正反-10,1010,-1010,-10-10,10我們觀察表2-1可以發(fā)現(xiàn),甲與乙效用之和為零,這種博弈稱為零和博弈,是你死我活 的博弈,雙方有著激烈的沖突,不存在合作的可能。4足球比賽中的點(diǎn)球大戰(zhàn)守門員左中右射手左-1,10.5,-0.51, -1中0.5,-0.5-1,10.5, -0.5右1, -10.5, -0.5-1,1同學(xué)們,請你找出這個(gè)博弈的納什均衡。是不是發(fā)現(xiàn)沒有純策略納什均衡呢?如果確定性

5、策略無法奏效,就要果斷引入不確定性。它將使兩難問題不再是難題:5流浪漢問題在社會保障體系比較完善的國家,總會或多或少的存在流浪漢的問題。這些依靠政府的失業(yè)救濟(jì)過活的無業(yè)游民,雖然可以成為某些正科口中標(biāo)榜的民主生活的佐證。但是他畢竟是高度發(fā)達(dá)的經(jīng)濟(jì)社會無法根治的一塊牛皮癬。參與人是政府和一個(gè)流浪漢,流浪漢有兩個(gè)選擇:尋找工作和終日游蕩,政府在對流浪漢的管理上也有兩個(gè)策略:救濟(jì)和不救濟(jì)。政府想幫助流浪漢擺脫這種難堪的生活,但前提是后者必須試圖尋找工作,否則幫助失效。但是, 流浪漢可不認(rèn)為這種生活難堪,除非沒有辦法生存,他們不會去尋找工作的。流浪漢找工作 流浪qi-q政救濟(jì)p3,2-1,3府不救濟(jì)1

6、-p-1,10,0請你使用混合策略納什均衡的求法,找出該博弈的納什均衡。6有限博弈的納什均衡存在定理與奇數(shù)定理定理1 一個(gè)有限博弈至少存在一個(gè)納什均衡,一般而言,納什均衡的個(gè)數(shù)是奇數(shù)個(gè)。定理2在n人策略式博弈中,若參與人的純策略空間S是歐式空間上的一個(gè)非空閉集,且是有界的凸集,支付函數(shù)是連續(xù)的,對S是擬凹的,那么存在一個(gè)純策略納什均衡。定理3在n人策略式博弈中,若參與人的純策略空間S在歐式空間上世連續(xù)的,則存在一個(gè)混合策略納什均衡。3.2反應(yīng)函數(shù)法學(xué)一點(diǎn)數(shù)學(xué)極大值與極小值1庫諾特寡頭競爭理論庫諾特(Cournot,1838 )寡頭競爭模型可以說是納什均衡的最早版本,它比納什(Nash,1950

7、)本人的定義早了 100多年。在庫諾特模型里有兩個(gè)參與人,分別稱為企業(yè)1,企業(yè)2;每個(gè)企業(yè)的策略是選擇產(chǎn)量。效用是利潤,它是兩個(gè)企業(yè)產(chǎn)量的函數(shù)。我們用qi 0,表示第i個(gè)企業(yè)的產(chǎn)量。G(qJ代表成本函數(shù),p p(q1 q?)代表逆需求函數(shù)。第i個(gè)企業(yè)的利潤函數(shù)為42)qi pGq2)Ci(qJ,i 1,2。(qz)是納什均衡產(chǎn)量意味著:*argmax*1(q1,q2)qp*q2)cdqj,*q2arg max*2(q1 , q2)*q2 p(q1q2)C2(q2)。求解上述關(guān)系式找出納什均衡的一個(gè)步驟是對每一個(gè)企業(yè)的利潤函數(shù)求一階導(dǎo)數(shù)并令其等于零,即i-P(q q2) qiP(qi q?) c

8、i (qi) 0 qi2p(qi q2) q2 p (qi q?) c? q) 0 q2上述兩個(gè)一階條件分別定義了兩個(gè)反應(yīng)函數(shù),解之可得:q1 R(q2),q; R2(qi)。若兩條曲線僅有唯一交點(diǎn),則該點(diǎn)處取納什均衡圖2-3反應(yīng)函數(shù)交點(diǎn)圖【例2】 考慮庫諾特模型的簡單情況,假定兩個(gè)企業(yè)具有相同的不變單位成本,即Ci(q) qiC,C2(q2) q?c。逆需求函數(shù)取如下的線性形式:p a (q q?)。解:最優(yōu)化的一階條件為:;a (qi q2) qi c 0;1 q2) q2 c 0反應(yīng)函數(shù)為:*a q2 cqiRG)q2*a q c2 qR2G)解之得:qq2a c* I 2。每個(gè)企業(yè)的利

9、潤為i(qi,q2)24)(a c)。39F面將之與壟斷情況作比較,壟斷企業(yè)的問題是:max q(a q c)。容易得出q*a c2q丁 評 c);2豪泰林模型】(a c)2-(a c)2。49假定有一個(gè)長度為i的線性城市,消費(fèi)者均勻地分布在0,i區(qū)間內(nèi),分布密度為假定有兩個(gè)商店,分別位于城市兩端,商店1在x 0,商店2在x 1,出售物質(zhì)性能相同的產(chǎn)品。每個(gè)商店提供單位產(chǎn)品的成本為C。消費(fèi)者購買商品的交通成本與距商店的距離成比例,單位距離的成本為 t。這樣,住在x的消費(fèi)者如果在商店 i采購,需花費(fèi)tx的交通成本,如果在商店2采購需要花費(fèi)t(i x)的成本。假定消費(fèi)者得到的消費(fèi)者剩余為s,且s1

10、個(gè)單位的產(chǎn)品。相對于產(chǎn)品成本和交通成本足夠大,從而每個(gè)消費(fèi)者消費(fèi)者都購買令Pi為商店i的價(jià)格,Di(Pi, P2)為需求函數(shù),i i,2 。如果住在x的消費(fèi)者在兩個(gè)商店之間買商品無差異,那么住在x左邊的都在商店 i購買,住在x右邊的都在x2購買。需求分別為Dix, D21 x。這里,x滿足Pi tx P2 t(i x),綜合需求函數(shù)的定義可得:DiP2 Pi t2tD2PiP2 t2t利潤函數(shù)為:i(Pi,P2) (Pic)U2( P,P2)( P2c)D2扣12t(P2c)( P2Pi t)C)(PiP2 t)商店i選擇自己的價(jià)格 Pi,通過求駐點(diǎn)最大化利潤t) 02 1(Pl 2 p2 C

11、 t) 0 q2 2t* *Pl P2 C t* t12 23公共地悲劇設(shè)某村莊有n個(gè)農(nóng)戶,該村有一塊大家都可以自由放牧羊群的草地。這片草地只能讓不超過一定數(shù)量的羊吃飽。超過這個(gè)限度,則每只羊都無法吃飽,從而降低了每只羊的產(chǎn)出,草地也遭到破壞。假設(shè)這些農(nóng)戶決定養(yǎng)羊數(shù)是同時(shí)決策的,而且農(nóng)戶知道這片草地的最大養(yǎng)羊數(shù)及不同養(yǎng)羊數(shù)下每只羊的產(chǎn)出。這就構(gòu)成了n個(gè)農(nóng)戶的一個(gè)完全信息靜態(tài)博弈問題。此博弈的參與人有n個(gè)農(nóng)戶,其策略空間是各自養(yǎng)羊數(shù)qi, i 1,2,., n。養(yǎng)羊總數(shù)Q qi q2 . qn。每只羊的產(chǎn)出 V(Q)是減函數(shù)。假設(shè)購買和照料每只羊的成本相同,設(shè)為c。則農(nóng)戶i養(yǎng)qi只羊的效用函數(shù)為

12、 q qV (Q) qic。為方便起見,設(shè)n 3,V(Q)100 Q,c 4。則U15(100q1q2q3)4q1U2q2(100q1q2q3)4q2U3q3(100q1q2q3)4q3盡管羊的數(shù)量是整數(shù),我們?nèi)匀豢梢詫⒅暈檫B續(xù)函數(shù),根據(jù)極值的條件得到最優(yōu)解之后圓整。反應(yīng)函數(shù)為:三個(gè)反應(yīng)函數(shù)的交點(diǎn)為:qq2q3只2(亦3)只3(亦2)48如2148評148 RqS)q3)q2)(24,24,24),相應(yīng)的效用為(576,576,576 )。但是,如果q1 q2 q3 16,則效用組合為(768,768,768)。因此納什均衡可能是低效率的,一般而言,公共性質(zhì)的物品,都有類似的結(jié)論,達(dá)到的穩(wěn)定

13、結(jié)果效率較低,稱之為公共地悲劇。3 重復(fù)博弈3.4應(yīng)用1社會福利博弈在這個(gè)博弈里,參與人是政府和一個(gè)流浪漢,流浪漢有兩個(gè)選擇: 尋找工作和終日游蕩,政府在對流浪漢的管理上也有兩個(gè)策略:救濟(jì)和不救濟(jì)。政府想幫助流浪漢擺脫這種難堪的生活,但前提是后者必須試圖尋找工作,否則幫助失效。但是,流浪漢可不認(rèn)為這種生活難堪,除非沒有辦法生存,他們不會去尋找工作的。表4社會福利博弈流浪漢找工作流浪政救濟(jì)3,2-1,3府不救濟(jì)-1,10,02努力困境張三和李四一起做一份工作,他們可以選擇勤奮和偷懶,如果兩人都勤奮工作,會得到一份獎金,每人的效用為 2單位。如果張三勤奮,李四偷懶,張三的效用為0單位,李四的效用為

14、3單位,反之亦然。如果兩人都偷懶,只能得到一份很低的報(bào)酬,效用為0.5單位。于是有下面的支付矩陣:表4努力困境李四勤奮偷懶張勤奮2, 20,3三偷懶3, 00.5, 0.53軍備競賽模型在1950s,美國和前蘇聯(lián)展開了瘋狂的軍備競賽,最終拖垮了蘇聯(lián)的經(jīng)濟(jì)。博弈論對此 有很好的解釋:-1000,-15005000,-,45002000,1500擴(kuò)軍不擴(kuò)軍蘇聯(lián)擴(kuò)軍不擴(kuò)軍表5軍備競賽美 國4市場進(jìn)入阻撓設(shè)想一個(gè)壟斷企業(yè)已在市場在位者”,另一個(gè)企業(yè)虎視眈眈想進(jìn)入進(jìn)入者”。在位者想保持自己的壟斷地位,所以就要阻撓進(jìn)入者進(jìn)入。在這個(gè)博弈中,進(jìn)入者有兩種策略可以選擇:進(jìn)入、不進(jìn)入。在位者也有兩個(gè)策略:默許或

15、斗爭。假定進(jìn)入之前壟斷利潤為 300,進(jìn)入之后寡頭利潤為 100 (各得50),進(jìn)入成本為10。 如果選擇斗爭,成本為 50。表6市場進(jìn)入阻撓進(jìn)入者40,50-10, 00,3000,250進(jìn)入不進(jìn)入在位者默許斗爭其穩(wěn)定狀態(tài)為(進(jìn)入,默許)。這種穩(wěn)定狀態(tài)我們稱之為納什均衡,其特點(diǎn)是單獨(dú)偏離沒有好處。5供電博弈 楊白勞與黃世仁的小品“要債的是孫子,欠債的是大爺”。每個(gè)企業(yè)都只是價(jià)值鏈中的一個(gè)環(huán)節(jié),加入你是供電公司的總經(jīng)理, 在你的供電區(qū)域內(nèi)開張了一家企業(yè),該企業(yè)一年耗電量為 10億千瓦時(shí),算是一個(gè)大客戶。政府核定的店家為0.8元/千瓦時(shí)。你的供電公司為其供電的成本是0.6元 /千瓦時(shí)。你現(xiàn)在要作出的決策是供電還是不供電。如果你供電且能收回店費(fèi),會有2億元的利潤,這是相當(dāng)可觀的。如果店費(fèi)全部不能收回,供電會帶來 6億元的損失。反而不如不供電。電力用戶2, -4-4,20,-0.20,-0.2供電公司 供電不供電繳費(fèi)欠費(fèi)假如我們認(rèn)為,無論是否供電,電力公司的員工共要發(fā)放5000萬元工資1.5, -4-4.5,2-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論