博弈論與信息經(jīng)濟學-2-1納什均衡_第1頁
博弈論與信息經(jīng)濟學-2-1納什均衡_第2頁
博弈論與信息經(jīng)濟學-2-1納什均衡_第3頁
博弈論與信息經(jīng)濟學-2-1納什均衡_第4頁
博弈論與信息經(jīng)濟學-2-1納什均衡_第5頁
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、博弈論與信息經(jīng)濟學第2章 完全但不完美信息靜態(tài)博弈主要內(nèi)容最優(yōu)分散決策:占優(yōu)戰(zhàn)略均衡、重復剔除的占優(yōu)均衡完全信息靜態(tài)博弈解的基本概念納什均衡納什均衡的應用和求解方法舉例庫諾特寡頭競爭模型混合戰(zhàn)略納什均衡聚點均衡和相關均衡博弈分析的基本假設Aumann認為,博弈論是“相互影響的決策理論”。博弈論的目標是分析博弈中參與人相互作用的邏輯,預測博弈的均衡和均衡結果均衡行動及其結果(支付等)。每個參與人都是理性的(rational);每個參與人都知道每個參與人是理性的,理性是參與人的共同知識;每個參與人對博弈結構和信息結構有共同知識。博弈分析就是在這些基本假設下,預測什么是每個參與人的最優(yōu)戰(zhàn)略? 什么是

2、所有參與人的最優(yōu)戰(zhàn)略組合及其結果? 完全但不完美信息完美信息(perfect information)是指一個參與人對其他參與人(包括虛擬參與人“自然”的行動選擇有準確了解的情況,即每一個信息集只包含一個值;不完美信息:這里指的是參與人同時行動,相互不知道各自的行動選擇,存在信息互不對稱,對參與者的戰(zhàn)略選擇具有重要影響。完全信息(complete information)是指自然不首先行動或自然的初始行動被所有參與人準確觀察到,即關于世界狀態(tài)及對手特征沒有事前的不確定性。 靜態(tài)博弈靜態(tài)指的是所有參與人同時選擇行動且只選擇一次,博弈沒有過去的歷史,也不可重復。在這種博弈中,由于每個參與人是在不知

3、其他參與人行動的情況下選擇自己的行動,戰(zhàn)略和行動實際上是一回事。 同時行動是一個信息上,而非日歷上的時間概念:只要每個參與人在選擇自己的行動時不知道其他參與人的選擇,排除了參與者之間的任何溝通,我們就說他們是在同時行動。戰(zhàn)略不確定性在某種意義上,博弈論(關于多個參與者之間相互影響的決策的分析)可以被看做是決策論(關于單一參與者決策的分析)的一般化。在決策問題中,不確定性只來源于“自然”的行動 (隨機步),并且決策者對各種 “隨機步”的可能性有外生的信念(beliefs)。博弈的根本難點在于這樣一種特性:參與者的行動間相互牽連(implication),參與者需要觀察和預料其他參與人的行動,每個

4、決策者對其對手決策的預期是內(nèi)生的,這樣就有了“戰(zhàn)略不確定性。非合作博弈論的基本原理每個參與人都假設其對手正在分析他的戰(zhàn)略,只考慮他們自己的可以覺察得到的利益,不會串謀或合作,也不考慮社會或任何其他方的福利,從而理性地選擇對他們最有利的戰(zhàn)略與行動,通過考慮什么對他自己最有利,選擇他自己的戰(zhàn)略。博弈論的難點在于具體問題具體分析,沒有一個一般的分析模型。Strategic thinkingStrategic thinking is the art of outdoing an adversary, knowing that the adversary is trying to do the same

5、 to you. Avinash Dixit and Barry Nalebuff:Thinking Strategically (1991)最優(yōu)分散決策在有些特殊的情形中,博弈的戰(zhàn)略不確定性可以被忽略,并且可以非常正式地定義參與者的最優(yōu)分散決策。分散決策指的是,對于孤立的(isolated)、完全不考慮其對手如何決策而選擇自己的戰(zhàn)略的參與人來說,只須運用理性的觀點就可以確定參與者的非合作行為。我們可以采用規(guī)范(標準)的決策論方法,分析在這種特殊的博弈情形下,參與者必須如何博弈,找到最優(yōu)的分散決策。最優(yōu)分散決策在這種特殊的非合作博弈中,每個參與者都單獨地選擇其戰(zhàn)略,而完全忽略其他參與者的決策。

6、從單個參與人的角度來看,這種決策無須關于其他參與者決策的任何知識,不考慮戰(zhàn)略不確定性。參與者的決策僅由個人理性決定。如果一個參與者有占優(yōu)戰(zhàn)略,那么他(她)就無須為了推斷其他參與者的戰(zhàn)略而去了解他們的偏好。這種占優(yōu)的觀點導致了“占優(yōu)戰(zhàn)略均衡”(dominant strategy equilibrium)。占優(yōu)原則關于理性的最基本假定是:說參與人是理性的,即不會選擇嚴格劣戰(zhàn)略,就是說參與者總是拋棄那些不占優(yōu)的戰(zhàn)略。如果參與人i的一個戰(zhàn)略優(yōu)于另一個戰(zhàn)略,那么,無論其他參與者的戰(zhàn)略是什么,參與者i選擇占優(yōu)戰(zhàn)略而不是劣戰(zhàn)略總是沒有壞處,有時還有好處。 所以,分散化非合作決策的基本原理是剔除“劣戰(zhàn)略”(d

7、ominated strategy)。重復剔除占優(yōu)然而,如果占優(yōu)戰(zhàn)略均衡不存在,我們就必須對參與者之間相互擁有信息的可能性做出精確的假定。在理性是共同知識的假設下,另一種分散化的行為可以在戰(zhàn)略式表述的博弈中定義:重復剔除占優(yōu) (iterated dominance)?!疤蕹钦純?yōu)戰(zhàn)略”與“參與者決策分散化”是完全一致的。當參與者選擇“非劣”戰(zhàn)略時,無需關于其他參與者行為的任何信息,只需知道其他參與者的戰(zhàn)略集。 占優(yōu)戰(zhàn)略Sherlock Holmes said, whenever you have eliminated the impossible, whatever remains no ma

8、tter how improbable must be the truth.占優(yōu)戰(zhàn)略 一般來說,由于每個參與人的效用(支付)是博弈中所有參與人的戰(zhàn)略的函數(shù),因此每個參與人的最優(yōu)戰(zhàn)略選擇依賴于所有其他參與人的戰(zhàn)略選擇。在一些特殊的博弈中,一個參與人的最優(yōu)戰(zhàn)略可能并不依賴于其他參與人的戰(zhàn)略選擇,就是說,不論其他參與人選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為占優(yōu)戰(zhàn)略(dominant strategy)。上策對應地,其他戰(zhàn)略稱為 “劣戰(zhàn)略”( dominated strategy )下策。 每個嫌疑犯面臨四個可能的后果:獲釋(自己坦白同伙抵賴);被判刑1年(自己抵賴同伙也抵賴);被判

9、刑8年(自己坦白同伙也坦白);被判刑10年(自己抵賴但同伙坦白)。顯然,不論同伙選擇什么戰(zhàn)略,每個囚徒的最優(yōu)戰(zhàn)略是坦白。 兩種戰(zhàn)略間的占優(yōu)關系占優(yōu)戰(zhàn)略“占優(yōu)”的標準由比較支付向量得出。參與人i的戰(zhàn)略siSi優(yōu)于戰(zhàn)略siSi,如果ui(si,s-i)ui(si,s-i),s-iS-i,并且至少對于一個s-iS-i上式取嚴格大于號。 這里s-i = (s1,., si-1,si+1,.,sn),是i之外所有參與人的戰(zhàn)略組合。si稱為相對于si的弱占優(yōu)戰(zhàn)略,si稱為相對于si弱劣戰(zhàn)略。兩種戰(zhàn)略間的占優(yōu)關系劣戰(zhàn)略如果對于每一個s-iS-i上式取嚴格大于號,則si稱為相對于si的嚴格占優(yōu)戰(zhàn)略,si稱為相

10、對于si嚴格劣戰(zhàn)略。定義:戰(zhàn)略si劣于戰(zhàn)略si,如果對于所有的s-i,ui(si,s-i)ui(si,s-i),并且至少對于一個s-i,嚴格小于號成立。si稱為相對于si弱劣戰(zhàn)略,Si稱為相對于si的弱占優(yōu)戰(zhàn)略。如果對于每一個s-i,嚴格小于號成立,si稱為相對于si嚴格劣戰(zhàn)略,Si稱為相對于si的嚴格占優(yōu)戰(zhàn)略。最優(yōu)反應參與人i對其他參與人選擇的戰(zhàn)略si的最優(yōu)反應或最優(yōu)應對是為其產(chǎn)生最大支付的戰(zhàn)略s*i,即i(s*i , si) i(si, si),si s*i如果沒有其他戰(zhàn)略同樣地好,就是嚴格最優(yōu)反應,否則,就是弱最優(yōu)反應。弱占優(yōu)戰(zhàn)略一般地,si*Si稱為參與人i的占優(yōu)戰(zhàn)略,如果對應所有的s

11、iSi和所有的s-iS-i,si*是i的弱占優(yōu)選擇,即ui(si*,s-i)ui(si,s-i),s-iS-i,sisi*對應地,所有的sisi*被稱為si*的劣戰(zhàn)略。嚴格占優(yōu)戰(zhàn)略一般地,si*Si稱為參與人i的嚴格占優(yōu)戰(zhàn)略,如果對于所有的siSi和所有的s-iS-i,si*是i的強占優(yōu)(最優(yōu))選擇,即ui(si*,s-i)ui(si,s-i),s-iS-i,sisi*對應地,所有的sisi*被稱為si*的嚴格劣戰(zhàn)略。弱劣戰(zhàn)略定義:如果對于所有的siSi和所有的對于任意的其他參與人的戰(zhàn)略組合s-i,參與人i從選擇si*得到的支付不大于從選擇任何si得到的支付,即:ui(si*, s-i) ui

12、(si,s-i), sisi* , s-i戰(zhàn)略si*弱劣于他的所有其他戰(zhàn)略,稱為參與人i的劣戰(zhàn)略。嚴格劣戰(zhàn)略定義:如果對于所有的siSi和所有的對于任意的其他參與人的戰(zhàn)略組合s-i,參與人i從選擇si*得到的支付小于從選擇任何si得到的支付,即:ui(si*, s-i) ui(si,s-i), sisi* , s-i戰(zhàn)略si*嚴格劣于他的所有其他戰(zhàn)略,稱為參與人i的嚴格劣戰(zhàn)略。參與者的一個戰(zhàn)略是“劣”的,如果至少存在另一個優(yōu)于它的戰(zhàn)略。占優(yōu)戰(zhàn)略通常,對于比一個劣戰(zhàn)略好的戰(zhàn)略,我們稱之為占優(yōu)戰(zhàn)略,但是,在某些特別的博弈中,有某種戰(zhàn)略比任何其他戰(zhàn)略都好,我們也稱之為“占優(yōu)戰(zhàn)略”實際是嚴格占優(yōu)戰(zhàn)略。

13、戰(zhàn)略s*i是占優(yōu)戰(zhàn)略,如果它是一個參與人對其他參與人選擇的任何戰(zhàn)略的嚴格最優(yōu)反應,即不論他們選擇什么戰(zhàn)略,這個參與人采用s*i獲得的支付最高。用數(shù)學來表示,i(s*i, si) i(si, si),si, si s*i行參與人R列參與人C嚴格占優(yōu)戰(zhàn)略與弱占優(yōu)戰(zhàn)略占優(yōu)戰(zhàn)略均衡如果一個參與者有占優(yōu)戰(zhàn)略,那么他(她)就無須為了推斷其他參與者的戰(zhàn)略而去了解他們的偏好。這種占優(yōu)的觀點導致了“占優(yōu)戰(zhàn)略均衡”(dominant strategy equilibrium)。在博弈的戰(zhàn)略式表述中,如果對于所有的i,si*是i的占優(yōu)戰(zhàn)略,那么,戰(zhàn)略組合s* =(s1*,.,sn*)稱為占優(yōu)戰(zhàn)略均衡。如果占優(yōu)戰(zhàn)略s

14、i*都是嚴格占優(yōu)戰(zhàn)略,則是嚴格占優(yōu)戰(zhàn)略均衡。 占優(yōu)的邏輯規(guī)則 在一個博弈里,如果所有參與人都有占優(yōu)戰(zhàn)略存在,那么,占優(yōu)戰(zhàn)略均衡是可以預測到的唯一的均衡,因為沒有一個理性的參與人會選擇劣戰(zhàn)略。在囚徒困境博弈里,(坦白,坦白)是占優(yōu)戰(zhàn)略均衡; 應該指出的是,占優(yōu)戰(zhàn)略均衡只要求每個參與人是理性的,而并不要求每個參與人知道其他參與人是理性的(也就是說,不要求理性是共同知識),這是因為,不論其他參與人是否是理性的,占優(yōu)戰(zhàn)略總是一個理性參與人的最優(yōu)選擇。 占優(yōu)均衡與帕累托效率囚徒困境反映了一個深刻的問題,即個人理性與集體理性的沖突。如果每個人都選擇抵賴,各判刑1年,顯然比都判刑8年好。但這個帕累托改進做不

15、到,因為它不滿足個人理性要求,(抵賴,抵賴)不是一個均衡。換個角度看,即使兩個囚徒在作案之前建立一個攻守同盟(絕不坦白),這個攻守同盟也沒有用,因為沒有人有積極性遵守協(xié)定。這就是合作博弈與非合作博弈的區(qū)別。重復占優(yōu)均衡 囚徒困境的問題在許多情況下會出現(xiàn),如寡頭競爭、軍備競賽、團隊生產(chǎn)中的勞動供給、公共產(chǎn)品的供給等。 在每個參與人都有占優(yōu)戰(zhàn)略的情況下,占優(yōu)戰(zhàn)略均衡是一個非常合理的預測,但在絕大多數(shù)博弈中,占優(yōu)戰(zhàn)略均衡是不存在的。盡管如此,在有些博弈中,我們?nèi)钥梢詰谜純?yōu)的邏輯規(guī)則找出均衡。 (1):多勞不多得 3, 12, 47, -10, 0智豬博弈(2):多勞反而少得 小豬按等待大豬按等待沒

16、有占優(yōu)戰(zhàn)略均衡 Baldwin & Meese (1979)新產(chǎn)品研發(fā)與模仿理性與剔除劣戰(zhàn)略假定小豬是理性的,小豬肯定不會選擇按的戰(zhàn)略,因為,不論大豬選擇什么戰(zhàn)略,對小豬來說,等待嚴格優(yōu)于按,因而理性的小豬會選擇等待。再假定大豬知道小豬是理性的,那么大豬會正確地預測到小豬會選擇等待,給定這個預測,大豬的最優(yōu)選擇只能是按。這樣,(按,等待)是這個博弈唯一的均衡,即大豬選擇按,小豬選擇等待,支付水平分別為4和4個單位或者2和4個單位。 重復剔除劣戰(zhàn)略 iterated elimination of dominated strategies 首先,找出某個參與人的一個劣戰(zhàn)略(假定存在),把這個劣戰(zhàn)略

17、剔除掉,重新構造一個不包含已剔除戰(zhàn)略的新的博弈;然后,再剔除這個新的博弈中的某個參與人的劣戰(zhàn)略;繼續(xù)這個過程,一直到只剩下一個唯一的戰(zhàn)略組合為止。這個唯一剩下的戰(zhàn)略組合就是這個博弈的均衡解,稱為重復剔除占優(yōu)均衡(iterated dominance equilibrium)。剔除各個參與人的所有弱劣戰(zhàn)略后獲得的戰(zhàn)略組合,可以稱為弱占優(yōu)均衡。重復剔除占優(yōu)均衡重復剔除的占優(yōu)均衡:戰(zhàn)略組合s* = (s1*,.,sn*)稱為重復剔除的占優(yōu)均衡,如果它是重復剔除劣戰(zhàn)略后剩下的唯一的戰(zhàn)略組合。如果這種唯一的戰(zhàn)略組合是存在的,我們說該博弈是重復剔除占優(yōu)可解的(dominance solvable)。如果重

18、復剔除后剩下的戰(zhàn)略組合不唯一,我們說該博弈不是重復剔除占優(yōu)可解的。我們將看到,相當多的博弈是無法使用重復剔除劣戰(zhàn)略的方法找到均衡解的。 均衡結果與剔除順序如果每次剔除的是嚴格劣戰(zhàn)略,均衡結果與剔除的順序無關,原因是,如果戰(zhàn)略si嚴格劣于戰(zhàn)略si對于所有的s-i成立,自然對于一部分s-i也是成立的。然而,如果剔除的是弱劣戰(zhàn)略,均衡結果可能與剔除順序有關。由于這個原因,我們一般使用嚴格劣戰(zhàn)略剔除。用嚴格劣戰(zhàn)略剔除的辦法,下面這個博弈是不可解的。 重復剔除占優(yōu)均衡與理性與占優(yōu)戰(zhàn)略均衡不同,重復剔除的占優(yōu)均衡不僅要求每個參與人是理性的,而且要求理性是參與人的共同知識,即所有參與人知道所有參與人是理性的

19、,所有參與人知道所有參與人知道所有參與人是理性的,如此等等。由于這個原因,盡管在許多博弈中重復剔除的占優(yōu)均衡是一個合理的預測,但情況并非總是如此,特別是當支付取某些極端值的時候。博弈的結果對行為的不確定性是很敏感的,即使只是很小的不確定性。 內(nèi)生不確定性這里我們用到前面指出的博弈分析(多人決策分析或?qū)Σ叻治?與單人決策分析的重要區(qū)別。在單人決策分析里,只有一個決策人,他面臨的唯一不確定性是自然可能的行動,他對自然選擇不同行動的概率有一個固定的、外生的信念。相反,在博弈分析中,有多個決策人,每個決策人有關其他決策人的行為的信念并不是外生的。內(nèi)生不確定性與博弈由于這個區(qū)別,決策論中的許多比較靜態(tài)結

20、論并不能推廣到博弈論(對策論)中。比如說,在單人決策的情況下,如果對應一個給定選擇的所有可能狀態(tài)下的支付同時減少,當事人的效用水平絕不會提高,但這一結論并不適用于博弈情況。 類似的情況也出現(xiàn)在當一個參與人的選擇空間縮小或信息質(zhì)量下降的時候,在單人決策里,選擇空間的縮小或信息質(zhì)量的下降絕不可能是件好事,但在博弈里,卻可能使當事人受益。 納什均衡把理性作為共同知識的要求并不是重復剔除的占優(yōu)均衡的唯一問題。更為嚴重的問題是,對于相當多的博弈,我們無法使用重復剔除劣戰(zhàn)略的辦法找出均衡解。比如說,在房地產(chǎn)開發(fā)博弈中,假定市場是低需求的情況,那么,無論對于A還是B,沒有任何一種戰(zhàn)略優(yōu)于另一種戰(zhàn)略,每一個參

21、與人的最優(yōu)戰(zhàn)略都依賴于另一個參與人的戰(zhàn)略。為了找出這個博弈的均衡解,我們需要引入納什均衡(Nash equilibrium)的概念。納什均衡是完全信息靜態(tài)博弈解的一般概念,不存在占優(yōu)戰(zhàn)略均衡或重復剔除占優(yōu)均衡的博弈,卻存在納什均衡。 房地產(chǎn)開發(fā)-同時進入博弈參與人:房地產(chǎn)開發(fā)商A(你)和B(他)。博弈規(guī)則:同時進入市場-開發(fā)商A和B同時選擇開發(fā)或者不開發(fā)。如果決定開發(fā),必須投入1億元資金;如果決定不開發(fā),資金投入為0。行動結果:如果市場上有兩棟寫字樓出售,需求大時,每棟售價可達1.4億元,需求小時,售價為7000萬元;如果市場上只有一棟寫字樓出售,需求大時售價為1.8億元,需求小時為1.1億元

22、。這樣,有以下8種可能的結果:行動結果矩陣1. 需求大,你開發(fā),他不開發(fā);2. 需求大,你不開發(fā),他開發(fā);3. 需求大,你開發(fā),他也開發(fā);4. 需求大,你不開發(fā),他也不開發(fā);5. 需求小,你開發(fā),他不開發(fā);6. 需求小,你不開發(fā),他開發(fā);7. 需求小,你開發(fā),他也開發(fā);8. 需求小,你不開發(fā),他也不開發(fā)。戰(zhàn)略式支付矩陣1. 需求大,你開發(fā),他不開發(fā)時,你的利潤為8000萬元,他的利潤為0;2. 需求大,你不開發(fā),他開發(fā)時,你的利潤為0,他的利潤為8000萬元;3. 需求大,你開發(fā),他也開發(fā)時,你和他的利潤各為4000萬元;4. 需求大,你不開發(fā),他也不開發(fā)時,你和他的利潤都為0;支付5. 需求

23、小,你開發(fā),他不開發(fā)時,你的利潤為1000萬元,他的利潤為0;6. 需求小,你不開發(fā),他開發(fā)時,你的利潤為0,他的利潤為1000萬元;7. 需求小,你開發(fā),他也開發(fā)時,你和他的利潤各為-3000萬元;8. 需求小,你不開發(fā),他也不開發(fā)時,你和他的利潤都為0。有占優(yōu)戰(zhàn)略無占優(yōu)戰(zhàn)略信息與決策的交互影響在這個例子中,無論你(開發(fā)商A)還是他(開發(fā)商B),在決定是否開發(fā)時,不僅要考慮市場需求的大小(是為決策問題),而且要考慮對方的行動(是為對策問題)。我們假定雙方同時決策,每一方在作出自己的決定時并不知道對方的決定,因而是不完美信息。再假定市場需求對雙方都是已知的(因而是完全信息),那么,如果市場需求

24、大,雙方都會開發(fā),各得利潤4000萬元;如果市場需求小,一方是否開發(fā)依賴于他認為對方是否開發(fā):如果A認為B會開發(fā),A最好不開發(fā),反之亦然。納什均衡的定義定義:有n個參與人的戰(zhàn)略式表述博弈G = S1, ., Sn;u1, ., un,戰(zhàn)略組合s* =(s1*,.,si*,.,sn*)是一個納什均衡,如果對于每一個i,si*是給定其他參與人選擇s-i* = (s1*,.,si-1*, si+1*, .,sn*)的情況下第i個參與人的最優(yōu)戰(zhàn)略,即:ui(si*, s-i*)ui(si, s-i*),siSi,i或者說,戰(zhàn)略組合 s* 是一個納什均衡,如果給定其他參與人不改變其戰(zhàn)略,沒有參與人有動機

25、改變戰(zhàn)略。注意:沒有s-iS-i這個條件。納什均衡的定義用另一種表述方式,si*是下述最大化問題的解:si*arg max ui(s1*,si-1*,si,si+1*,sn*), siSii,i = 1,2,.,n其中,“arg max ui”的意思是“is the argument that maximizes ui”,意即使函數(shù)ui(.)最大化的元素或解。 非納什均衡考慮戰(zhàn)略組合s=(s1,si,sn),說s不是G的一個納什均衡,等價于說至少對于某些i而言,si不是i的最優(yōu)戰(zhàn)略(給定s-i),換言之,至少存在一個siSi,使得ui(si, s-i) ui(si, s-i*)。如果一個納什均

26、衡是強的,沒有任何參與人在均衡戰(zhàn)略與某些其他戰(zhàn)略之間是無差異的;此外,強納什均衡對博弈支付矩陣的小小變化并不敏感。強與弱納什均衡對比之下,在弱納什均衡的情況下,有些參與人可能在均衡戰(zhàn)略與非均衡戰(zhàn)略之間是無差異的。我們或許要問,既然是無差異的,為什么選擇均衡戰(zhàn)略而不選擇其他戰(zhàn)略呢? 正是因為這樣,強納什均衡比弱納什均衡似乎是一個更為可取的概念。然而,在有些博弈中,納什均衡存在,但它不是強納什均衡。如表1.5的博弈,(R1,C1)和(R1,C3)都是納什均衡,但沒有一個是強納什均衡。 納什均衡與占優(yōu)戰(zhàn)略均衡及重復剔除占優(yōu)均衡的關系(1)每一個占優(yōu)戰(zhàn)略均衡、重復剔除的占優(yōu)均衡一定是納什均衡,但并非每

27、一個納什均衡都是占優(yōu)戰(zhàn)略均衡或重復剔除的占優(yōu)均衡。也就是說,構成納什均衡的戰(zhàn)略一定是重復剔除嚴格劣戰(zhàn)略過程中不能被剔除的戰(zhàn)略,就是說,沒有任何一個戰(zhàn)略嚴格優(yōu)于納什均衡戰(zhàn)略。納什均衡與占優(yōu)戰(zhàn)略均衡及重復剔除占優(yōu)均衡的關系在囚徒困境博弈里,(坦白,坦白)是一個占優(yōu)戰(zhàn)略均衡、重復剔除的占優(yōu)均衡,也是一個納什均衡;在智豬博弈中,(按,等待)是一個重復剔除的占優(yōu)均衡,也是一個納什均衡;在表1.9的博弈中,(D,R)是一個納什均衡,但不是一個重復剔除的占優(yōu)均衡(我們無法通過重復剔除劣戰(zhàn)略的辦法找到均衡解),更不是占優(yōu)戰(zhàn)略均衡。 (1):多勞不多得 3, 12, 47, -10, 0智豬博弈(2):多勞反而

28、少得 小豬按等待大豬按等待沒有占優(yōu)戰(zhàn)略均衡 新產(chǎn)品研發(fā)與模仿納什均衡與占優(yōu)戰(zhàn)略均衡及重復剔除占優(yōu)均衡的關系(2)納什均衡一定是在重復剔除嚴格劣戰(zhàn)略過程中沒有被剔除掉的唯一的戰(zhàn)略組合,但不能被剔除的戰(zhàn)略組合不一定是納什均衡。如果一個戰(zhàn)略在重復剔除過程的某個階段嚴格劣于另一個戰(zhàn)略從而被剔除,它不可能是對于其他參與人的均衡戰(zhàn)略的最優(yōu)選擇。在囚徒困境博弈中,(抵賴,抵賴)被剔除了,所以它不可能是一個納什均衡,(坦白,坦白)是一個納什均衡,所以它不可能被剔除;納什均衡與占優(yōu)戰(zhàn)略均衡及重復剔除占優(yōu)均衡的關系在表1.9的博弈中,沒有任何一個戰(zhàn)略嚴格劣于另外一個戰(zhàn)略,因而沒有一個戰(zhàn)略組合能被剔除掉,但(D,R

29、)是一個納什均衡。但是,如果使用弱劣戰(zhàn)略剔除的辦法,均衡結果可能與剔除順序有關,換言之,剔除弱劣戰(zhàn)略可能剔除掉納什均衡。在表1.5的博弈中,(R1,C1)和(R1,C3)都是納什均衡,如果剔除按R3、C3、C2、R2順序進行,(R1,C3)被剔除掉了;另一方面,如果剔除按C2、R2、C1、R3順序進行,(R1,C1)被剔除掉了。市場進入阻撓博弈 有一個壟斷者已在市場上(稱為在位者),另一個企業(yè)虎視耽耽想進入(稱為進入者)。進入者有兩個戰(zhàn)略:進入,不進入,在位者也有兩個戰(zhàn)略:默許,斗爭。假定進入之前的壟斷利潤為300,進入之后寡頭利潤為100,進入成本為10。各種戰(zhàn)略組合下的支付矩陣如表1.10

30、所示。高成本市場進入阻撓博弈這個博弈有兩個納什均衡:(進入,默許)和(不進入,斗爭),其中,(進入,默許)是強納什均衡,(不進入,斗爭)是弱納什均衡。給定進入者進入,在位者的最優(yōu)戰(zhàn)略是默許;給定在位者默許,進入者的最優(yōu)戰(zhàn)略是進入,因而(進入,默許)是一個納什均衡。盡管在進入者不進入時,默許和斗爭對在位者是無差異的,但只有當在位者斗爭時,不進入才是進入者的最優(yōu)戰(zhàn)略,所以,(不進入,斗爭)也是一個納什均衡。市場進入阻撓博弈如果我們想用重復剔除弱劣戰(zhàn)略的方法找到博弈的解,斗爭是在位者的弱劣戰(zhàn)略(50 0, 300 = 300),因而被剔除,(進入,默許)是唯一剩下的沒有被剔除的戰(zhàn)略組合,因而是重復剔

31、除的占優(yōu)均衡;納什均衡(不進入,斗爭)被剔除掉了。這個例子也說明,(弱)納什均衡允許弱劣戰(zhàn)略的存在。 納什均衡的性質(zhì)納什均衡的定義沒有占優(yōu)戰(zhàn)略均衡的條件“ si”,因此納什戰(zhàn)略只需要是其他納什戰(zhàn)略的最優(yōu)反應,不必是所有可能戰(zhàn)略的最優(yōu)反應。納什均衡要求,各參與人的戰(zhàn)略是對于其預測的其對手將要采取的戰(zhàn)略的支付最大化反應,并進一步要求各參與人的預測是正確的。這是大多數(shù)經(jīng)濟分析的起點。納什均衡的性質(zhì)在納什均衡中,所有局中人的期望都得以實現(xiàn),他們選擇的戰(zhàn)略都是最優(yōu)的。在所有各方對其他各方的戰(zhàn)略具有正確預期的情況下,沒有參與人能夠通過單方面選擇其他不同的戰(zhàn)略而改善其自身獲得的結果。納什均衡是參與人將如何博

32、弈(最佳應對)的一致性(consistent)預測:如果所有參與人預測一個特定的納什均衡將會出現(xiàn),那么,沒有人有興趣作不同的選擇。非合作博弈理論的核心問題說納什均衡是一致性預測并不意味著納什均衡一定是一個好的預測。正如我們已經(jīng)看到的,一個非常普遍的現(xiàn)象是一個博弈可能有多個納什均衡,如何預測哪一個納什均衡實際上會出現(xiàn)?因此,非合作博弈理論的核心問題可表述為:假如一個博弈有若干個均衡,理性的參與者究竟應該 (或愿意)選擇其中的哪一個?0, 0-10, 00, -10-8, -8建模者困境列參與人行參與人抵賴坦白抵賴坦白警察沒有證據(jù),甚至不能拘留小偷。有一個弱占優(yōu)均衡,同時是強納什均衡;但還有一個弱納什均衡,卻是一個帕累托占優(yōu)均衡怎么辦?建模者困境的出路?建模者可以細化博弈結構,了解博弈的具體過程;或者采用均衡精煉,對基本解概念附加條件,直到只有一個戰(zhàn)略組合滿足精煉的均衡概念。建模者可以堅持采用強均衡概念,或者剔除弱劣戰(zhàn)略,或者采用重復占優(yōu);或者剔除帕累托劣納什均衡。但是,不要認為弱納什均衡可以被輕

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論