北大微觀經濟學課件博弈論_第1頁
北大微觀經濟學課件博弈論_第2頁
北大微觀經濟學課件博弈論_第3頁
北大微觀經濟學課件博弈論_第4頁
北大微觀經濟學課件博弈論_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、北大微觀經濟學課件博弈論到目前為止,我們對經濟活動的考察沒有考慮人們之間的相互影響。其實,一個人的行為總是受到他人行為的影響。人們在追逐自己利益時,難免要與他人發(fā)生利益沖突或矛盾。?博弈論(game theory)為解決這些問題提供了有力工具。博弈論以人的理性為基本假定,強調策略性一種普遍的行為現象。這種現象的廣闊背景是市場中的競爭與合作。20世紀80年代以來,博弈論在經濟學中得到了廣泛應用,在揭示經濟行為的相互影響和制約方面取得了重大進展。 大部分經濟活動都可以用博弈論加以解釋,甚至連市場調節(jié)與宏觀調控這樣的重大問題,都可看成博弈現象來研究。2豬圈里有一大一小兩頭豬,豬圈一邊裝有踏板,踩一下

2、,遠離踏板的食槽端就會落下食物。若一豬去踩踏板,另一豬就會等在槽邊搶先吃到食物。若小豬去踩,大豬會在小豬跑到食槽前吃光食物;若大豬去踩,大豬還有機會在小豬吃完之前搶吃到食物的一半。這兩頭豬會采取什么這兩頭豬會采取什么策略呢策略呢?答案答案:小豬舒服地等在槽邊,大豬要為爭取殘羹奔忙于踏板和食槽之間。原因:對小豬而言,去踩,吃不到食物;不去踩,反而能吃到一半食物,當然不去踩了。反觀大豬,明知小豬不為,那么自己為之總還是要比不為強。3 智豬故事揭示了大、小企業(yè)的關系。當企業(yè)定位于“大豬”時,應選擇“主動獲得”之優(yōu)勢策略;當定位于“小豬”時,應選擇“等待獲得”,這也是優(yōu)勢策略。比如,研究開發(fā)、為新產品

3、做廣告,這對大企業(yè)值得,對小企業(yè)是得不償失的。完全市場中,作為一個理性企業(yè),最可能的情況是小企業(yè)把精力花在模仿上,或等待大企業(yè)打開市場后出售廉價產品。而大企業(yè)應當以主動的態(tài)度來開拓市場。 智豬故事還給競爭中的弱者以等待為最佳策略的啟發(fā)。博弈中,每一方都想方設法攻擊對方、保護自己,最終取得勝利;同時,對方也是一個與你一樣的理性人,他會這么做嗎?這就需要更高明的智慧。 任何理性企業(yè)都必然會像智豬那樣,總是選擇優(yōu)勢策略。 4從前有兩個饑餓的人從一位智者那里得到了一根魚竿和一簍鮮魚。 得到那簍鮮魚的人在原地把魚煮熟吃完,解決了饑餓問題,可很快又感到肚內空空,最終餓死在空魚簍旁邊。 另外一個得到魚竿的人

4、提著魚竿朝向遙遠的大海走去,當他終于來到海邊的時候,也用盡了最后一點力氣而死去。不久之后,同樣是兩個饑餓的人,也從智者那里得到了一根魚竿和一簍鮮魚。不同的是: 他們一起去尋找大海。每到饑餓的時候,就從魚簍中拿出一條魚吃。 當他們最終來到海邊的時候,這兩個人就拿著那根魚竿開始了捕魚為生的日子!5。比如企業(yè)在決策時,總是會考慮競爭對手的反應;個人與政府之間 “上有政策,下有對策” ;金融監(jiān)管與創(chuàng)新猶如“貓鼠博弈”;博弈還作為消遣游戲,讓人們獲得快樂。當所有當事人都拿定主意作出決策時,博弈的局勢便確定下來。是要。:在每個當事人的收益都依賴于其他當事人的選擇的情況下,追求個人收益最大化的當事人應該如何

5、采取行動?6l 基本要素基本要素:局中人(players)、策略(strategies)、收益(payoffs)局中人局中人以策略策略定勝負,以收益最大化收益最大化為目標。l 標準形式標準形式(normal form):G = (Xi, fi)n,其中 Xi 為局中人 i 的策略集合策略集合, fi : S R 為局中人 i 的收益函數收益函數(i = 1,2,n)。 S = X1 X2 Xn 叫做博弈G 的局勢集合局勢集合。 局勢局勢:策略 n 元組 (x1, x2, xn) ( xiXi,i = 1,2,n)。l博弈的分類博弈的分類:一般按照博弈的基本要素進行分類。l 按人數分:二人博弈二

6、人博弈、多人博弈多人博弈l 按策略分:有限有限(策略策略)博弈博弈、無限無限(策略策略)博弈博弈l 按收益分:常和常和( (零和零和) )博弈博弈、變和博弈變和博弈l 按性質分:非合作博弈非合作博弈、合作博弈合作博弈l 按次序分:同時移動博弈同時移動博弈、先后先后移動博弈移動博弈(序貫博弈序貫博弈):以以上分類方式的結合上分類方式的結合,比如二人零和有限博弈。7 我們先以矩陣博弈矩陣博弈為重點,建立博弈論的基本分析框架。:二人零和有限博弈二人零和有限博弈,這是最簡單的博弈形式。:甲與乙利益沖突,一方的收益就是對方的損失。X =x1, x2, xm;Y =y1, y2, ynS = X Y =(

7、xi, yj): i =1,2,m ; j =1,2,nf : S R;g : S R零和零和:f (xi, yj) + g (xi, yj) = 0 (i =1,2,m ; j = 1,2,n):G = (X, f ; Y, g) = (X,Y, f ) :甲的收益矩陣收益矩陣 f 即可表示矩陣博弈。8局中人的目標局中人的目標:選擇合適的策略以使自己的收益(對方的損失)達到最大,也即讓對方的收益(自己的損失)達到最小。 假定假定:甲和乙彼此了解對方的收益矩陣,雙方都清楚自己的收益就是對方的損失。l 博弈過程博弈過程:每個人都根據對方的行動來確定自己的行動,每個人都不斷地在對方選定了策略的情況

8、下來調整自己的策略以使自己的收益達到最大。l 博弈結局博弈結局:當策略調整達到這樣的局勢 (xh, yk) 使得 xh 是甲在乙選定yk的情況下的收益最大策略,同時yk是乙甲在選定xh的情況下的收益最大策略的時候,雙方策略調整宣告結束,博弈得以確定。此時的局勢(xh, yk)就是古諾均衡古諾均衡(最優(yōu)解最優(yōu)解),即9依據定義,矩陣博弈 f 的古諾均衡古諾均衡正對應于矩陣 f 的鞍點鞍點。n 鞍點定理(最大最小原理最大最小原理) 是矩陣 的鞍點(即局勢(xh, yk)是矩陣博弈 f 的古諾均衡)當且僅當當且僅當下述等式成立:u從矩陣各行的最小元中找出最大元,稱為最大最小元最大最小元;v從矩陣各列

9、的最大元中找出最小元,稱為最小最大元最小最大元;w如果最大最小元最大最小元與與最小最大元最小最大元一致一致,那么該元素就是鞍點,代表矩陣博弈的古諾均衡古諾均衡。 x1y1x2x4x3y3y4y5YXz鞍鞍點點古諾均衡古諾均衡y210 乙乙甲甲作廣告作廣告不作廣告不作廣告作廣告作廣告3030不作廣告不作廣告2020. 廣告競爭:廣告競爭:存在古諾均衡存在古諾均衡單位單位:萬元萬元. 便便士匹配士匹配:沒有古諾均衡沒有古諾均衡 甲、乙獨立決定出示硬幣正或反面。若兩人出示相同,甲贏乙1元;若出示相反,乙贏甲1元。甲的收益表如下:乙乙甲甲出示正面出示正面出示反面出示反面出示正面出示正面11出示反面出示

10、反面1111 只有當收益矩陣的最大最小元與最小最大元一致時,矩陣博弈才有古諾均衡(最優(yōu)解)。最大最小元和最小最大元總存在,但二者未必一致,從而矩陣博弈可能沒有最優(yōu)解。例如,便士匹配博弈沒有最優(yōu)解。l 矩陣博弈可能沒有最優(yōu)解的真正原因是什么?矩陣博弈可能沒有最優(yōu)解的真正原因是什么?穩(wěn)妥策略穩(wěn)妥策略甲的穩(wěn)妥策略甲的穩(wěn)妥策略:甲的收益矩陣的最大最小元;乙的穩(wěn)妥策略乙的穩(wěn)妥策略:甲的收益矩陣的最小最大元。問題的答案問題的答案:原因在于穩(wěn)妥策略可能不穩(wěn)定穩(wěn)妥策略可能不穩(wěn)定。不穩(wěn)定的穩(wěn)妥策略不能使博弈中的策略調整過程結束。即使甲和乙都選擇穩(wěn)妥策略,但若穩(wěn)妥策略不穩(wěn)定,那么博弈就無法達到古諾均衡。12 為了

11、消除古諾均衡未必存在的困惑,人們提出使用混合策略混合策略,即一種連當事人自己都不知道會采取什么行動的策略,對手就更不得而知了,從而使得局中人的行動變得相當詭異??紤]二人有限博弈二人有限博弈G = (X, f ; Y, g): X = x1, x2, xm:甲的純策略集合; Y = y1, y2, yn:乙的純策略集合; S = X Y :博弈 G 的純局勢集合?;旌喜呗曰旌喜呗?mixed strategies):以一定的概率采取一種策略。 甲的混合策略集合: 乙的混合策略集合: G 的混合局勢集合: 甲的預期收益: 乙的預期收益:混合擴充混合擴充:博弈 叫做 G 的混合擴充混合擴充。13n定

12、理 博弈 G = (X, f ; Y, g) 為常和博弈 當且僅當當且僅當 G 的混合擴充 為常和博弈。當G 是常和博弈時,G 與 具有相同的收入常和。因此,矩陣博弈的混合擴充仍為二人零和博弈。l矩陣博弈矩陣博弈 G 的混合均衡的混合均衡:是指 G 的混合擴充 的古諾均衡。即,G的混合局勢( p*,q*)叫做 G 的混合均衡混合均衡(混合最優(yōu)解混合最優(yōu)解)是指( p*,q*)滿足如下條件:n 定理(混合均衡的存在性混合均衡的存在性) 任何矩陣博弈都有混合均衡任何矩陣博弈都有混合均衡。矩陣博弈 f 的混合均衡正對應于函數 Ef 的鞍點。n 鞍點定理(最小最大原理最小最大原理) ( p*, q*)

13、是矩陣博弈G 的混合均衡(即函數 Ef 的鞍點) 當且僅當當且僅當 下述等式成立: 14便士匹配博弈中,甲的收益矩陣為尋找混合均衡,就是去找出 使得 15l 博弈值博弈值: 混合均衡的存在性及鞍點定理,保證了V(G)是良好定義的,并且當( p*,q*)是混合均衡時,V(G) =Ef (p*,q*)。 博弈值在解釋均衡及求解混合均衡方面相當有用。 還可通過V(G) 證明矩陣博弈的混合均衡集的下述特點。 令n定理 對于甲和乙的矩陣博弈G = (X, Y, f )來說,T = T1T2 且混合均衡集 T 是空間 的非空有界閉凸子集,從而甲的混合最優(yōu)策略集T1是 的非空有界閉凸子集,乙的混合最優(yōu)策略集

14、T2 是 的非空有界閉凸子集。 16矩陣博弈僅僅是一類簡單又典型的二人常和博弈,經濟學中遇到的博弈往往都是變和博弈。矩陣博弈理論之所以重要,是因為它為研究變和博弈提供了很好的分析思路和框架。 現在,我們來在矩陣博弈理論的基礎上建立一般的二人博弈理論。 l 二人博弈 : 古諾均衡古諾均衡 二人有限博弈:策略集合 X 和Y 為有限集合。 二人無限博弈:策略集合 X 和 Y 為無限(任意)集合。l 二人博弈的重復:博弈不只進行一次,而是要進行多次。17l 古諾均衡古諾均衡應對 yj 的上策上策 xi( j):當乙采取 yj 時,甲采取 xi( j) 是最好的,即 f i( j) j 是 f 的第 j

15、 列的最大元: 。應對 xi 的上策上策 yj(i):當甲采取 xi 時,甲采取 yj(i) 是最好的,即 g i j(i) 是 g 的第 i 行的最大元: 。甲的上上策上上策 xi*:不論乙采取什么策略,xi*都是甲的上策,即 f 的第i*行最大: 。乙的上上策上上策 yj*:不論甲采取什么策略,yj*都是乙的上策,即 g的第j*列最大: 。l 占優(yōu)解占優(yōu)解(xi*, yj*): xi*是甲的上上策, yj*是乙的上上策。18l 最大最小原理只適用于矩陣博弈,一般的二人有限博弈的求解只能采取通用方法。把局中人甲和乙的收益矩陣寫在同一張表中。圈出甲的收益矩陣各列的最大元。圈出乙的收益矩陣各行的

16、最大元。收益表中同時出現兩個圈的位置即為古諾均衡古諾均衡。如果沒有一個位置出現兩個圈,就說明該博弈的古諾均衡不存在。如果在甲的收益矩陣的某一行上全部帶圈,則就出現了甲的上上策;同樣,若在乙的收益矩陣的某一列上全部帶圈,則就出現了乙的上上策。如果既找到了甲的上上策,又找到了乙的上上策,那么也就找到了博弈的占優(yōu)解占優(yōu)解。否則,博弈沒有占優(yōu)解。19 囚徒難題囚徒難題乙乙甲甲合作背叛合作3304背叛4011古諾均衡古諾均衡上上上上策策上上策上上策智豬博弈智豬博弈小豬小豬大豬大豬去踩踏板 不去踩去踩踏板7355不去踩10000上上策上上策均衡均衡次優(yōu)均衡次優(yōu)均衡剔除剔除乙乙甲甲y1y2y3y4x1121

17、582623141811x21820151611191517x315101849221714x41712131814171920找出下列博弈的古諾均衡找出下列博弈的古諾均衡古諾均衡古諾均衡(x2, y1)(x4, y4)無上上策無上上策20 ,預期收益都為2/3。 G = (X, f ; Y, g)的混合擴充:G 的混合均衡( p*, q*):n 角谷不動點定理 設 T 是有限維歐氏空間的非空有界閉凸子集,F: T T 是集值映射。若 F 上半連續(xù)且對任何xT,F(x)都是非空閉凸集,那么F 必有不動點,即(xT )(xF(x)。n 定理(混合均衡存在性混合均衡存在性) 任何二人有限博弈都有混

18、合均衡??ǚ蚩ǚ蛉氵_茹達話劇足球話劇2100足球0012. :性別差異導致收益差異21n假設G1 X 是拓撲向量空間V1的非空緊凸子集;乙的策略集合Y是 拓撲向量空間V2的非空緊凸子集;故局勢集合 S 是拓撲向量空間V1 V2 的非空緊凸子集。n假設G2 甲的收益函數 f (x,y)連續(xù)且關于策略變元 x 弱擬凹;乙的收益函數g(x,y)連續(xù)且關于策略變元 y 弱擬凹。G = (X, f ; Y, g):X 和Y 為無限集合,S = X Y 。二人有限博弈的混合擴充是二人無限博弈,二人無限博弈的混合擴充依然是二人無限博弈。因此,二人無限博弈是二人博弈的一般情形,無需再討論其混合擴充。l古諾均衡

19、古諾均衡(x*, y*):XYzf (x*, y*)古諾均衡古諾均衡g (x*, y*)x*y*22n 范格不動點定理 設T是拓撲向量空間的非空緊凸子集,集值映射 F : T T 上半連續(xù)且對任何 xT,F(x) 都是非空閉凸集。則 F 有不動點,即(tT)(tF(t)。n 定理(古諾均衡的存在性) 任何滿足假設任何滿足假設G1和和G2的二人無限博弈都有的二人無限博弈都有古諾均衡古諾均衡。l反應函數反應函數 甲對乙的反應甲對乙的反應:當乙采取策略 y時,甲的應對上策上策 x=(y)為:f (x, y) = max f (x, y): xX 。 (y):甲的反應函數反應函數。乙對甲的反應乙對甲的

20、反應:當甲采取策略 x時,乙的應對上策上策 y=(x)為:g(x, y) = max g(x, y ): y Y 。(x):乙的反應函數反應函數。l 古諾均衡古諾均衡(x*, y*):23 比如,一般情形一般情形:找出反應曲線的交點,如右圖所示。特殊情況特殊情況:X 和 Y 都是實數區(qū)間,收益函數 f : XR 和 g : Y R可微。于是,反應函數由下述方程確定:YXx1x2x3x4x5x6x7x8y1y2y3y4y5古古諾諾均均衡衡甲的反應曲線甲的反應曲線乙的反應曲線乙的反應曲線24雖然人們對二人博弈的最優(yōu)解作了深入研究,但讓局中人找到最優(yōu)解卻不是一件容易的事情,需要反復實踐和鍛煉,就好像

21、棋手下棋一樣,需要反復不斷地下,才能越來越接近最優(yōu)解??梢姡┺氖切枰貜瓦M行。但到目前為止,所研究的博弈都是一次性博弈。因此,有必要研究博弈的重復。事實上,當博弈重復進行時,其最優(yōu)結局可能會與一次性博弈的均衡有所差異。下面以囚徒難題博弈囚徒難題博弈為例,來說明重復博弈的最優(yōu)解。我們將分兩種情況討論:l 博弈重復進行有限次博弈重復進行有限次l 博弈重復進行無限次博弈重復進行無限次25每個局中人都知道博弈將重復一個固定的次數。 最后一次博弈中局中人的推理最后一次博弈中局中人的推理:這是最后一次行動,每個人都認為此時是在進行一次性博弈,因而古諾均衡的標準邏輯得以應用,結果局中人雙方選擇“背叛”。倒

22、數第二次博弈倒數第二次博弈:這里似乎每個人都重視合作,可以向對方發(fā)出“善意”的合作信號,以便在下次博弈中繼續(xù)合作。但理性的局中人清楚,最后一次博弈中對方必然背叛。因此他在倒數第二次博弈中選擇合作就沒有優(yōu)勢,故要選擇背叛。倒數第三次博弈倒數第三次博弈:局中人的推理與倒數第二次一樣,結果在倒數第三次博弈中,局中人依然選擇背叛。 l 結局結局:逆向歸納逆向歸納(backward induction)可知,每次博弈中雙方都要“背叛”,有限次重復博弈的最優(yōu)解依然是古諾均衡。n 古諾均衡是局中人雙方的短期利益所在古諾均衡是局中人雙方的短期利益所在。26 每個局中人都知道,博弈要無限重復進行下去。每個局中人

23、的策略都是一個函數序列,表明每個人在每個階段的策略選擇都是此階段之前的博弈歷史的函數。這樣,局中人的收益是各階段收益的貼現值之和(向時刻0貼現): 。R:局中人永不背叛的收益;RT:局中人第T次背叛的收益。 l只要貼現率r 2,就有RT ti)。l核心最優(yōu)解核心最優(yōu)解:是指不存在反對者聯盟的收入分配。只有這種收入分配,才能被所有局中人接受。l G 的核心核心(core) C(G):是指由所有核心最優(yōu)解組成的集合 。l 占優(yōu)分配占優(yōu)分配:對于收入分配 r 和 t, r A t (在聯盟在聯盟 A 中中 r 比比 t 占優(yōu)占優(yōu))是指V(A ) iA ri 且 ri ti 對一切 iA 成立;rt ( r 比比 t 占優(yōu)占優(yōu))是指存在聯盟 A 使得r A t。占優(yōu)關系 A 具有傳遞性,但占優(yōu)關系 不具有傳遞性。 若 r A t 且 A ,則 A I 且 A 不是單人聯盟。 對任何收入分配 r= (r1, r2, rn),rC(G) 當且僅當當且僅當 iA ri V(A)對一切非空聯盟 A 成立。當 G 為零和本質博弈時,C(G) = 。36 迄今為止,我們討論的博弈都具有簡單的動態(tài)結構,即它們是一次性博弈,或者是一次性博弈的重復序列,而且還具有簡單的信息結構,即每個局中人

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論