博弈論與信息經(jīng)濟學完全信息靜態(tài)博弈_第1頁
博弈論與信息經(jīng)濟學完全信息靜態(tài)博弈_第2頁
博弈論與信息經(jīng)濟學完全信息靜態(tài)博弈_第3頁
博弈論與信息經(jīng)濟學完全信息靜態(tài)博弈_第4頁
博弈論與信息經(jīng)濟學完全信息靜態(tài)博弈_第5頁
已閱讀5頁,還剩74頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、博弈論與信息經(jīng)濟學第一章 完全信息靜態(tài)博弈 1838年庫諾特(Cournot)寡頭競爭模型(數(shù)量戰(zhàn)) 1883年伯川德(Bertrand)寡頭競爭模型(價格戰(zhàn)) 1944年馮諾依曼和摩根斯坦發(fā)表博弈論和經(jīng)濟行為 1950年納什(Nash)提出了納什均衡的概念。 1965年澤爾騰(Selten)提出了子博弈精煉納什均衡的概念 19671968年海薩尼(Harsanyi)提出了貝葉斯納什均衡的概念博弈論概述:發(fā)展歷程 19751991年澤爾騰(1975)、Kreps和Wilson(1982)、Fudenberg和Tirole(1991)提出了精煉貝葉斯納什均衡的概念. 1994年納什、海薩尼和澤爾

2、騰獲諾貝爾經(jīng)濟學獎。博弈論概述:發(fā)展歷程1996年維克里,米爾利斯獲諾貝爾經(jīng)濟學獎。2001年阿克爾洛夫、斯彭斯和斯蒂格利茨獲諾貝爾經(jīng)濟學獎。2005年奧曼和謝林諾貝爾經(jīng)濟學獎博弈的分類分類是一種深化認識的方法。博弈可以根據(jù)不同的標志從不同的角度進行多種分類。通過分類我們將對博弈有進一步的了解,同時對博弈理論的結構體系有初步的認識. 按參與人的多少分:二人博弈和多人博弈. 按策略空間是否有限分:有限策略博弈和無限策略博弈. 按各策略組合下參與人支付之和情況分:零和博弈、常和博弈和變和博弈. 按參與人行動的順序分:靜態(tài)博弈和動態(tài)博弈. 按信息是否完全分:完全信息博弈和不完全信息博弈. 按參與者是

3、否能達成具有約束力的協(xié)議分:非合作博弈與合作博弈博弈理論體系的結構框架按下面博弈類型安排:靜態(tài)動態(tài)完全信息完全信息完全信息靜態(tài)博弈動態(tài)博弈不完全信息不完全信息不完全信息靜態(tài)博弈動態(tài)博弈博弈論的基本概念1、囚徒困境 囚徒2 坦白 抵賴 囚 坦白 徒 1 抵賴 1、參與人(局中人)Players:一個博弈中的決策主體,他們各自的目的是通過選擇行動(策略)以最大化自己的目標函數(shù)(效用水平/支付函數(shù))。他們可以是自然人或團體或法人,如企業(yè)、國家、地區(qū)、社團、歐盟、北約等。 虛擬參與人(pseudo-player):指“自然” (nature)、“上帝” God,也即決定外生的隨機變量的概率分布的機制。

4、“某事在人、成事在天”的“天”;如出遠門去旅游,可能很開心,也可能很尷尬(生病住醫(yī)院),兩者概率分布90%、10%或98%與2%或其他,由上帝決定。 在以后的討論中,我們記參與人為i,參與人集合記為,即=1,2, ,i , ,n ,即該博弈中共有n個參與人;為了討論的方便,把某個參與人i之外的其他參與人稱為的i對手記為- i ; N代表自然。 對參與人的決策來說,最重要的是必須有可供選擇的行動集(策略集)和一個很好定義的支付函數(shù)。理性(rational)的兩種定義 1. 如果一個決策者在追逐其目標時能前后一致地做決策,就稱他是理性的。2. 廣義而言指的是一種行為方式,就是在給定的約束條件下追求

5、效用最大化。具體地講,理性大致有以下三項內容:(1)存在一組可供選擇的備選或替代方案;(2)每一種方案均對應著某種特定的預期凈收益或滿足程度或目標實現(xiàn)程度;(3)人們總是選擇那個能夠帶來最大預期凈收益的方案。討論:人真的是理性的嗎?2. 行動(action or moves)行動是參與人在博弈的某個時點的決策變量。一般地,我們用ai表示第i個參與人的一個特定行動,Ai=ai表示可供i選擇的所有行動的集合。在n人博弈中,n個參與人的行動的有序集a=(a1,.,ai,.an)稱為行動組合,其中的第i個元素表示第i個參與人的行動。行動的順序(the order of play)博弈中參與人實施決策活

6、動的順序。同時或有先有后。其他因素不變,但順序不同,參與人的最優(yōu)選擇就不同,博弈的結果也不同。事實上,不同的順序安排意味著不同的博弈。靜態(tài)博弈和動態(tài)博弈。 3. 信息(information)參與人有關該博弈的知識,如關于N的選擇、其他參與人的策略集、支付函數(shù)、行動時間等。信息集(information set)主要出現(xiàn)在動態(tài)博弈中,可理解為參與人在特定時刻上對有關變量的值的知識;一個參與人無法準確知道的變量的全體屬于一個信息集。買古董。完美信息(perfect information)指一個參與人對其他參與人(包括N)的行動選擇有準確了解的情況,即一個信息集只包含一個值。動態(tài)博弈的概念。完全

7、信息(complete information):指N不首先行動或N的初始行動被所有的參與人準確觀察到的情況,即沒有事前的不確定性。完全信息意味著各個參與人的支付函數(shù)是共同知識。 顯然,不完全(incomplete)信息意味著不完美(imperfect)信息。共同知識(common knowledge) 是與信息有關的一個重要概念。共同知識指“所有參與人知道,所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人知道”。在博弈論中,一般假定參與人的行動空間Ai和行動順序是共同知識。一個關于共同知識的小游戲A還是B?兩個人的推理過程:我看到你身上的A,如果我身上是B的話。因為我們倆

8、至少有一個人身上是A,因此你因此判斷自己身上的是A。但是由于你沒有說,因此我可以斷定自己身上是A。臟臉博弈題目:三個學生的臉都是臟的,但是他們各自都看不到自己的臉。老師對他們說,你們中至少有一個人的臉是臟的。三個學生對視一番后無人舉手,隨即又都舉手表明自己的臉是臟的。請問為什么?臟臉博弈的推理過程三個人分別稱為1號,2號,3號1號看到2號和3號的臉是臟的,他就做了以下推理:首先1號假設自己的臉是干凈的,那么2號將會看到一張干凈的臉和一張臟臉。因此(1號知道)2號會想:“如果我(2號)的臉是干凈的,那么3號將會看到兩張干凈的臉,那么他就知道自己的臉是臟的,因此他就會舉手說自己的臉是臟的。但他并沒

9、有舉手,這就表明我(2號)的臉是臟的?!币虼?號就會舉手說自己的臉是臟的。但事實上2號也沒有舉手,這就表明了1號最初的假設(自己的臉是干凈的)是錯誤的。因此1號可以斷定自己的臉是臟的。同理每個人都會做這樣的推理,因此在觀察到?jīng)]有人舉手的情況下,他們都會舉手表明自己的臉是臟的。共同知識以上的推斷不僅要求每個參與人是理性的,還要求每個參與人知道每個參與人是理性的,以及每個參與人知道每個參與人知道每個參與人是理性的,等等。例如在兩個人的例子中,你是理性的,所以如果你看到我身上的B就知道你身上的是A,但正因為我知道你是理性的,所以我才可以站在你的立場上推理。也因為我知道你知道我是理性的,因此我知道你也

10、會站在我的立場上推理。 4. 策略(strategies ):又稱策略,是參與人在給定信息集的情況下的行動規(guī)則,它規(guī)定參與人在什么時候的什么情況下采取什么行動。因而一個策略是參與人的一個“相機行動方案”(contingent action plan)。記參與人i的一個策略為si,參與人i在一個博弈中的全部可供選擇的策略記為Si(策略集strategy set),即si Si , Si =s1 ,s2 , si , sn,表示參與人i 在該博弈中共有n個可行的策略。如果n個參與人每人從自己的Si中選擇一個策略si,則向量s=( s1,s2,si, sn)是一個策略組合(strategy prof

11、ile),參與人i之外的其他參與人的策略組合可記為s-i=( s1,s2,si-1 ,si+1 , sn)。注意: 1. 策略與行動是兩個不同的概念,策略是行動的規(guī)則(告訴參與者在什么情況下應該做什么)而不是行動本身?;仡櫳险绿岬降母赣H和女兒的博弈。 在靜態(tài)博弈中,由于參與人同時行動,沒有人能掌握他人的之前行動的信息,故沒有可針對的行動,從而策略的選擇就變成了行動的選擇,即策略和行動是同一的. 2. 作為一種行動規(guī)則,策略必須是完備的,就是說,策略要給出參與人在每一種可能想象到的情況下的行動選擇,即使參與人并不預期這種情況會實際發(fā)生。5. 支付(payoffs):參與人從各種策略組合中獲得的收

12、益。收益往往采用效用(utility)概念。它或者是一個特定策略組合下某個參與人得到的確定效用水平,或者是期望效用水平。它是策略組合的函數(shù),所以也稱支付函數(shù)(payoff function),記為ui(s),ui(s)= ui(s1, s2, ,si,sn-1,sn). 1. 博弈的一個基本特征是一個參與人的支付不僅取決于自己的策略選擇,而且取決于所有其他參與人的策略選擇;是策略組合的函數(shù)。 2. 支付是參與人真正關心的東西,參與人在博弈中的目標就是選擇自己的策略以最大化自己的支付函數(shù)。注意6. 均衡(equilibrium)均衡是所有參與人的最優(yōu)策略組合。一般記為s*=( s1*,s2*,s

13、i*, sn*)7. 結果(outcome)結果是(博弈達到均衡時)博弈分析者所感興趣的所有東西,包括均衡策略組合,均衡行動組合,均衡支付組合等。博弈的策略式表述策略式表述又稱為標準式表述,包括以下幾方面的內容:1. 博弈的參與人集合=1,2, ,i , ,n 2. 每個參與人的策略空間Si, i=1,2, ,n 3. 每個參與人的支付函數(shù)ui(s1, s2, ,si,sn-1,sn), i=1,2, ,n 策略式表述更適合于靜態(tài)模型,但也可用于動態(tài)模型。博弈的策略式表述 囚徒困境 囚徒2 坦白 抵賴 囚 坦白 徒 1 抵賴G=S1 ,,Sn ;u1, ,un 博弈分析的目的:預測博弈的均衡結

14、果,即給定每個參與人都是理性的是共同知識,什么是每個參與人的最優(yōu)策略?什么是所有參與人的最優(yōu)策略組合?占優(yōu)策略均衡(嚴格)占優(yōu)策略與占優(yōu)策略均衡的定義:見課本。一個參與人的最優(yōu)策略可能并不依賴于其他參與人的策略選擇,就是說,不論其他參與人選擇什么策略,他的最優(yōu)策略都是唯一的,這樣的最優(yōu)策略被稱為“占優(yōu)策略(dominant strategy)”。囚徒困境博弈中的占優(yōu)策略均衡 囚徒困境 囚徒2 坦白 抵賴 囚 坦白 徒 1 抵賴智豬博弈有一頭大豬和一頭小豬住在同一個豬圈里,豬圈的一側放者豬食槽,另一側安裝著一個控制食物供應的按鈕。按一次按鈕,有8個單位的食物進槽,但需承擔2個單位的成本。偌大豬小

15、豬同時到達豬食槽,大豬吃到5個單位的食物,小豬吃到3個單位的食物;若大豬先到,大豬吃7個單位的食物,小豬只能吃到1個單位;若小豬先到,小豬吃到4個單位食物,大豬也吃到4個單位食物。智豬博弈中的占優(yōu)策略 小豬 按 等待 按 3,1 2,4 大豬 等待 7,-1 0,0請列舉“搭便車”的現(xiàn)象沖開水、搞衛(wèi)生;股市上莊家與散戶劣策略和嚴格劣策略令si 和si是參與人i可選擇的兩個策略,如果對于其他參與人任何選擇s-i=(s1,si-1 , si+1 ,,sn),參與人i從si 得到的支付嚴格小于從si得到的支付,即:ui(si , s-i ) ui(si , s-i ), s-i 我們說策略si 嚴格

16、劣于策略si“重復剔除嚴格劣策略(iterated elimination of strictly dominated strategies)”首先,找出某個參與人的嚴格劣策略,并把它從他的策略空間中剔除,重新構造一個已不包含該嚴格劣策略的博弈;其次,剔除新博弈中某個參與人的嚴格劣策略;重復上述過程,直到只剩下唯一的策略組合。這個唯一剩下的策略組合就是博弈的均衡解,稱為“重復剔除的占優(yōu)均衡”。 博弈方2 左 中 右 博弈 上 方 1 下 參與人2 參與人2 左 中 左 中參與 上 參與 上人1 下 人1 消去參與人2 進一步消去 右策略后的博弈 參與人1下策略后的博弈重復剔除的占優(yōu)均衡策略組合

17、s*=(s*1,s*i , ,s*n)稱為重復剔除的占優(yōu)均衡,如果它是重復剔除嚴格劣策略后剩下的唯一的策略組合。策略組合(上,中)是均衡結局,將實現(xiàn)支付(1,2)。第一第二第三思考:占優(yōu)策略均衡、嚴格剔除的占優(yōu)均衡與共同知識的關系。 參與人左中右上 , 4, 0 5, 3參與人中 4, 0 0, 4 5, 3下 3, 5 3, 5 6, 6每個參與人都不存在嚴格劣策略納什均衡有n個參與人的策略式表述為博弈G=S1 ,,Sn ;u1, ,un ,策略組合s*=(s*1,s*i , ,s*n)是一個納什均衡,如果對于每一個i , s*i是給定其他參與人選擇s*-i=(s*1,s*i-1 , s*i

18、+1 ,,s*n)的情況下第i個參與人的最優(yōu)策略,即:ui(s*i , s*-i )ui(si , s*-i ), siSi ,i為了理解納什均衡的哲學含義,讓我們設想n個參與人在博弈之前協(xié)商達成一個協(xié)議,規(guī)定每一個參與人選擇一個特定的策略。我們要問的一個問題是,給定其他參與人都遵守這個協(xié)議,在沒有外在強制的情況下,是否有任何人有積極性不遵守這個協(xié)議?顯然,只有當遵守協(xié)議帶來的效用大于不遵守協(xié)議時的效用,一個人才會遵守這個協(xié)議。如果沒有任何參與人有積極性不遵守這個協(xié)議,我們說這個協(xié)議是可以自動實施的(self-enforcing),這個協(xié)議就構成一個納什均衡;否則,它就不是一個納什均衡。納什均

19、衡是一種策略組合,使得每個參與人的策略是對其他參與人策略的最優(yōu)放應。 納什均衡是博弈將會如何進行的“一致”(consistent)預測,這意指,如果所有參與人預測特定納什均衡會出現(xiàn),那么沒有參與人有動力采用與均衡不同的行動。因此納什均衡(也只有納什均衡)能具有性質使得參與人能預測到它,預測到他們的對手也會預測到它,如此繼續(xù)。與之相反,任何固定的非納什均衡如果出現(xiàn)就意味著至少有一個參與人“犯了錯”,或者是對對手行動的預測上犯了錯,或者是(給定那種預測)在最大化自己的收益時犯了錯。 納什均衡通過了一致預測檢驗并不就使得它們是好的預測,在一些博弈格局中如果認為可以獲得精確預測那會過于輕率,由此我們想

20、提請注意一個事實,博弈的最可能結果實際上取決于比標準式所提供的更多的信息。例如,可能希望知道參與人對于此類博弈具有多少經(jīng)驗,他們是否來自同一種文化因此而分縣分享關于博弈將會如何進行的特定期望,以及如此等等。 (Jean Tirole) P10-11每個參與人都不存在嚴格劣策略(下,右)是NE,將實現(xiàn)支付(6,6) 參與人左中右上 , 4, 0 5, 3參與人中 4, 0 0, 4 5, 3下 3, 5 3, 5 6, 6囚徒招認沉默招認 5, -5 0, -8囚徒沉默 -8, 0 -1 , -1囚徒的困境(沉默,沉默)帕累托優(yōu)于(招認,招認) 有一頭大豬和一頭小豬住在同一個豬圈里,豬圈的一側放

21、者豬食槽,另一側安裝著一個控制食物供應的按鈕。按一次按鈕,有8個單位的食物進槽,但需承擔2個單位的成本。偌大豬小豬同時到達豬食槽,大豬吃到5個單位的食物,小豬吃到3個單位的食物;若大豬先到,大豬吃7個單位的食物,小豬只能吃到1個單位;若小豬先到,小豬吃到4個單位食物,大豬也吃到4個單位食物。練習:智豬博弈(boxed pigs game) 小豬 去按 等待 去按 3,1 2,4 大豬 等待 7,-1 0,0大豬的收益外部化,小豬不勞而獲,免費搭了大豬的便車。小雞博弈(the game of chicken) 設想湯姆和吉米是兩個頑皮的小孩,他們在小伙伴的鼓動下要進行一場關于勇氣的比賽:兩人分別

22、從一條獨木橋的兩端沖向對方,誰退卻誰就是“小雞”。顯然,如果兩個人都向前沖,則兩敗俱傷,設支付水平為-2;如果一個勇進而另一個退卻,則勇進者受到小伙伴的歡呼,退卻者受到嘲諷,設支付分別為4和-1;若兩人同時退卻,則一起受到小伙伴的嘲笑,設支付為0,因為兩人一起受到嘲笑比起一人單獨受到嘲笑要好受些。箭頭法 吉米 退卻 勇進 退卻 湯姆 勇進0,0-1,44,-1-2,-2有兩個均衡。實際會怎樣?混合策略NE定義Definition In the n-player normal-form game G=S1, , Sn; u1, , un, the mixed strategies(p1*,,pn

23、*) are a Nash equilibrium if each players mixed strategy is a best response to the other players mixed strategies: V (pi*,p-i*) V (pi,p-i*) must hold.(二)混合策略NE的求解支付等值法 112 113這種通過使對方選擇各個純策略的期望支付值相等來確定自己的策略空間上的最優(yōu)概率分布的方法被稱為“支付等值法”。支付最大化法 以猜硬幣游戲為例。令蓋硬幣方以r的概率選正面,以1-r的概率選反面,即P蓋=(r,1-r);猜硬幣方以q的概率猜正面,以1-q的

24、概率猜反面,即P猜=(q,1-q),有: V蓋(p蓋, p猜)=r(-1) q+1 (1-q)+(1-r)1 q+(-1) (1-q)= -4qr+2q+2r-1 V猜(p蓋, p猜)=q1r+(-1) (1-r)+(1-q)(-1) r+1 (1-r)=4qr-2q-2r+1解:MaxV蓋(p蓋, p猜)r得:q*=1/2MaxV猜(p蓋, p猜)q得:r*=1/2混合策略NE是蓋方在策略空間正面,反面上以概率分布P蓋*,=(1/2,1/2)進行選擇,猜方也在策略空間正面,反面上以概率p猜*=(1/2,1/2)進行選擇。對混合策略的辯護:*混合策略表示使用不同純策略的大量參與人。 *Hars

25、anyi:混合可以解釋為參與人收益上微小的不可觀測變動的結果。*博弈多次反復進行時參與人實施某一純策略的不確定次數(shù)和時間。*P52 一個參與人實施混合策略的目的是給其他參與人造成不確定性,盡管其他參與人能推測到他選擇某個純策略的概率有多大,但卻不知道他到底會選哪個純策略。為了進一步理解混合策略的實際意義,下面分析“監(jiān)察博弈”(Jean Tirole and Selten)監(jiān)察博弈“監(jiān)察博弈”是“Matching Pennies”的一種流行變種,它可以應用于武器控制、犯罪預防和工人激勵。下圖是這一博弈的簡單版本。一個工人為一個老板工作(參與人);工人可以偷懶或工作、老板可以監(jiān)察或不監(jiān)察(策略集)

26、;工人工作能為老板產(chǎn)生價值為v的產(chǎn)出,但會使自己花費成本g。老板監(jiān)察要花費成本h,但可以提供工人是否偷懶的證據(jù)。工人得到工資w(假設老板不允許根據(jù)觀測產(chǎn)出水平來條件化工資),如果工人被抓住在偷懶,則他得到0(由于有限責任的原因)。兩認同時選擇他們 的策略(特別地,老板在決定是否監(jiān)察工人時不知道工人是否會選擇偷懶)。為了限制要考察的情形數(shù)量,假設gh 0;為了使分析更有趣,還假設w g(否則工作對于工人來說會是一個嚴格劣策略)。 監(jiān)察 不監(jiān)察 偷懶 0,-h w,-w 不偷懶 w-g,v-w-h w-g,v-wP*(偷懶)=h/w,P*(監(jiān)察)=g/w武器核查、工商打假、不定期抽查等等戀人之爭

27、battle of the sexes一對戀人,小娟和大海,在不同的地方上班,兩人都很珍惜周末能夠在一起的時間。某周末,小娟花高價購得兩張芭蕾舞門票,大海也好不容易搞到兩張足球賽門票。小娟從小酷愛芭蕾,大海是個十足的足球迷,怎么辦?顯然如果各自分開過周末,那才是雙方最不樂意的事。 大 海 芭蕾 足球 芭蕾 小娟 足球2,11,20,00,0Battle of the sexes存在兩個純策略NE:(芭蕾,芭蕾)和(足球,足球)。無法形成一致的預期,結果不確定。Schelling(1960)認為,在現(xiàn)實生活中,參與人可能使用某些被博弈模型抽象掉的信息來達到一個“聚點”(focalpoint)均衡

28、。這些信息可能與社會文化習慣、參與人過去博弈的歷史等有關。促成出現(xiàn)的另一種方法是參與人在博弈開始之前進行不花什么成本的“廉價磋商”(cheaptalk).Aumann(1974)證明,如果參與人可以根據(jù)某個共同觀測到的信號進行博弈,就可能出現(xiàn)“相關均衡”(correlatedequilibrium)。如天氣 拋硬幣如果兩個人都很任性,誰也不讓步,誰也不肯讓對方得意又確實離不開對方,那就變成實施混合策略:(小娟)選足球不甘心,選芭蕾又怕大海不樂意。大海也一樣。那么最優(yōu)的概率分布是什么?令小娟策略空間芭蕾,足球上的概率分布為(,),大海策略空間芭蕾,足球上的概率分布為(,),那么:小娟 (-)(1

29、-)=3rq+1-r-q最優(yōu)化q*=1/3V大海=12 (-)(1-)=3rq+2-2q-2r最優(yōu)化r*=2/3所以,混合策略NE是:小娟以2/3的概率選芭蕾,以1/3的概率選足球;大海以1/3的概率選芭蕾,以2/3的概率選足球。其效率是:小娟2/3 = V大海1最差的效率是兩人都為對方著想,又沒有事前溝通,結果小娟去了足球場,而大海去了劇場。(三)混合策略與反應對應 P56回顧Matching Pennies,雙方都會實施混合策略,其NE是r* =q* =(1/2,1/2)。這里,從另一個角度說明這樣的概率分布確實是一個“不動點”。按照NE的條件,一個策略組合如過是一個NE,那么其中的每一個

30、策略都是參與人針對其他參與人策略組合的最優(yōu)反應,在純策略NE中,這個“最優(yōu)反應”可能是一個具體的純策略(如在“Prisoners Dilemma”中),也可能是一個反應函數(shù)(reaction function)(如在“Cournot Model of Duopoly”中)。而在一個混合策略NE中,這個“最優(yōu)反應”將是一個概率或很多個概率被稱為“反應對應”(reaction correspondence)。以Matching Pennies 為例。r蓋方選正面的概率,q猜方猜正面的概率先看蓋方的最優(yōu)反應,記為r*=R(q):當q1/2r*=R(q)=1當q=1/20,1 當q1/20猜方的最優(yōu)反

31、應反應,記為q*=R(r)當r1/2q*=R(r)=0,當r=1/20,1,當r1/21,反應對應與反應函數(shù)的區(qū)別:作為NE,各個參與人的反應應該同時為最優(yōu),那么只要求兩個反應對應的交點,用圖示法:rq01(正面)1(正面)1/21/2r*=R(q)q*=R(r)(四)Existence of Nash Equilibrium問題:是否所有的博弈都存在NE(純的或混合的)?*Nash在1950年證明:任何有限博弈,都至少存在一個NE。Theorem(Nash 1950):In the n-player normal- form game G=S1, , Sn; u1, , un, if n i

32、s finite and Si is finite for every i then there exists at least one Nash equilibrium, possibly involving mixed strategies.Nash theorem 的證明 略Wilson(1971)證明,幾乎所有有限博弈,都存在有限奇數(shù)個NE,包括純策略NE和混合策略NE。Oddness TheoremP63 例證,P67-69 證明Problems1、In the following normal-form game,what strategies survive iterated e

33、limination of strictly dominated strategies ?What are the pure-strategy Nash equilibrium? L C R T 2,0 1,1 4,2 M 3,4 1,2 2,3 B 1,3 0,2 3,0 2、Players 1 and 2 are bargaining over how to split 10 thousand dollars.Both players simultaneously name shares they would like to have,s1 and s2 ,where 0 s1 ,s2 1.If s1+s2 1, then the players receive the shares the

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論