




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第五章第五章 確定信念:納什均衡確定信念:納什均衡 本章重點: 納什均衡定義納什均衡的條件和評價 納什均衡的運用前言: 在此之前我們已經(jīng)學(xué)習(xí)了嚴(yán)格占優(yōu)策略、IESDS和可理性化三種解概念,其中嚴(yán)格占優(yōu)策略的假設(shè)是理性,而IESDS和可理性化的假設(shè)除了理性外還需要理性的共同知識這樣假設(shè)。此外,只要存在嚴(yán)格優(yōu)勢均衡,該均衡必然是IESDS和可理性化過程之后剩下的唯一結(jié)果。但我們應(yīng)該也已察覺到,這些解概念都存在不盡如意之處,在很多博弈中他們都無法取得很好的效果。因此,本章我們將信念和行動結(jié)合在一起,并最終給出博弈論中最為核心、也最為著名的解概念納什均衡。本章主要內(nèi)容 一、純策略納什均衡 納什均衡定義
2、 納什均衡條件 用劃線法尋找納什均衡 納什均衡評價 二、納什均衡的運用 獵鹿博弈 公地悲劇 古諾均衡 貝特蘭德雙寡頭一、純策略納什均衡 納什均衡是信念和行動剖面的一個系統(tǒng),其中每一個參與人都在針對其信念采取最優(yōu)反應(yīng),而除此之外參與人具有的還要是正確的信念。定義納什均衡的另外一種常見的方式則并不涉及信念,而是將它就看成是一個策略剖面,這個策略剖面是每個參與人針對所有其他參與人的策略而選擇的最優(yōu)反應(yīng)。1、納什均衡定義:純策略剖面 是一個納什均衡納什均衡,如果對于所有的 , 是 一個最優(yōu)反應(yīng),也即對于所有的 和所有的 有: 在囚徒困境博弈中,唯一的納什均衡是(F,F(xiàn));在前面我們所討論過的古諾雙寡頭
3、博弈中唯一的納什均衡是( )=(30,30)。 2、嚴(yán)格優(yōu)勢、IESDS、可理性化和納什均衡結(jié)果之間的關(guān)系 考慮一個策略剖面 。如果 具備以下三種情況之一, 一個嚴(yán)格優(yōu)勢策略均衡, IESDS過程之后所剩下的唯一結(jié)果, 唯一的可理性化策略剖面, 那么 就是唯一的納什均衡。3、納什均衡的條件如下: 每個參與人都根據(jù)其信念采取最優(yōu)反應(yīng)。 參與人關(guān)于其對手的信念是正確的。 第一個條件是理性的直接結(jié)果。第二個條件是非常嚴(yán)格的,也是對我們到目前為止所討論條件的一個巨大的飛躍。4、用劃線法尋找矩陣中的純策略納什均衡我們來看以下這一兩人有限博弈的矩陣形式: 不難看出,這個博弈中沒有劣策略,所以嚴(yán)格優(yōu)勢就不適
4、用于這個博弈。出于同樣的原因,IESDS和可理性化會給出一切皆可能發(fā)生的結(jié)論。 首先我們用劃線法來尋找均衡,整個過程可以由下面這三個步驟來極好的得到解釋: 步驟1:對于每一列而言,都是參與人2的策略,可以從中找到對參與人1來說最高的支付項,并在最高支付下畫一條橫線。由此我們可得: 我們可以看到有三個純策略對,其中參與人1都選擇了最優(yōu)反應(yīng):(D,L)、(M,C)和(M,R)。步驟2:對于每一行而言,都是參與人1的策略,可以從中找到對參與人2來說最高的支付項。 參與人2在三個策略對中采取了最優(yōu)反應(yīng):(D,C)、(M,C)和(U,R)。步驟3:如果任意矩陣項既有下劃線又有上劃線,那么它就是一個純策略
5、納什均衡的結(jié)果。我們發(fā)現(xiàn)(M,C)是唯一一個純策略納什均衡它是唯一一個兩個參與人都選擇了最優(yōu)行為的純策略對。5、對納什均衡的評價、對納什均衡的評價 具有廣泛的應(yīng)用范圍,但唯一性得不到很好的保障,也不能保證帕累托最優(yōu)性。五、納五、納什均衡的經(jīng)典運用什均衡的經(jīng)典運用 1、獵人博弈 有兩個獵人,即參與人1和參與人2,他們每人都可以選擇獵鹿(S),這可以提供一頓豐盛而且美味的鹿肉享用,或者選擇打野兔(H)也很美味,但是就不是那么豐盛了。獵鹿是一件很有挑戰(zhàn)性而且也需要相互合作的活動。如果只有一個人獵鹿,勝算幾乎可以忽略,而打野兔是一個人就可以完成的事情,不需要兩個人合作來完成。因此獵鹿對整個社會更有益,
6、但是需要獵人之間彼此“信任”,彼此相信其他人會和自己一起戮力以赴。這個博弈常被稱為是獵鹿博弈獵鹿博弈,可以由下面這個矩陣來描述:容易看到,這個博弈有兩個純策略均衡:(S,S)和(H,H)。不過,從(S,S)中得到的支付帕累托優(yōu)于從(H,H)中得到的支付。那么,為什么(H,H)也會成為一個合理的預(yù)測呢?這的確是納什均衡概念的優(yōu)長所在。如果每一個參與人都預(yù)期到其他人不會一起努力,那么他知道單獨一人出去獵鹿幾乎不可能成事,所以打野兔就會更好。這一信念最終導(dǎo)致個人主義的社會無法通過合作來取得更好的結(jié)果。與之相對照的是,如果參與人期待其他人和他一起合作去獵鹿,那么這一預(yù)期是自實施的,而且會得到一個可稱之
7、為合作社會的結(jié)果。2、公地悲劇公地悲劇 公地悲劇指的是稀缺資源方面的沖突,源自個體自利和公共利益之間的緊張關(guān)系。哈丁舉了一個假想的例子,一群牧民共有一塊牧場,每個牧民都想最大化其收益,盡可能的擴(kuò)大其牲畜規(guī)模。而多增加一頭牲口在給其主人帶來正的效應(yīng)的同時,也會帶來成本,因為多增加的牲畜會降低牧場的整體質(zhì)量,而這一成本卻是由所有其他牧民一起承擔(dān)的。結(jié)果,對于每個牧民來說,個體的激勵是不斷擴(kuò)大其牲畜規(guī)模,最終這一結(jié)局是為每個人都帶來了重大的損失。對于那些受過經(jīng)濟(jì)學(xué)訓(xùn)練的讀者來說,這不過是“搭便車”問題導(dǎo)致扭曲的另一個例子罷了。它也會讓你聯(lián)想起囚徒困境博弈,在其中,由自利動機(jī)驅(qū)動的個體會為整個群體帶來
8、傷害。 假設(shè)這個世界上有n個參與人,比如說企業(yè),它們每一個都在選擇生產(chǎn)多少產(chǎn)量。其生產(chǎn)活動反過來也會消耗我們這個星球上的一部分清潔空氣。清潔空氣的總量等于K,對清潔空氣的任何消耗都會從這一公共資源中得到。每一個參與人i選擇其為生產(chǎn)而必須消耗的清潔空氣的量, ,因此剩下的清潔空氣量為 。消費 給參與人i帶來的收益等于 ,沒有其他人從i的選擇中受益。每一個參與人也都要享受對剩余清潔空氣的消費,這為每個人帶來收益 。因此,從選擇 中參與人i得到的支付等于:這意味著如果我們推導(dǎo)出了所有n個最優(yōu)反應(yīng)對應(yīng),而且它們是函數(shù)(唯一的最優(yōu)反應(yīng)),那么我們就有了一個n個方程的方程組,每一個都表示一個參與人的最優(yōu)反
9、應(yīng)函數(shù),有n個未知數(shù),這正是每一個參與人的選擇。求解這個方程組可以得到一個納什均衡。為了得到參與人i的最優(yōu)反應(yīng)函數(shù)(而且你可以證明它確實是一個函數(shù)),我們可以將參與人支付函數(shù)的一階條件寫下來:這給了我們參與人i的最優(yōu)反應(yīng)函數(shù):因此我們有n個這樣的方程,每個參與人一個方程,如果我們代之以 而不是 ,我們可以得到有n個未知數(shù)的n個方程,然后需要對這個方程組進(jìn)行求解。 我們只對兩參與人情況進(jìn)行求解,令 表示參與人i的最優(yōu)反應(yīng),我們有兩個最優(yōu)反應(yīng)方程: 和 這兩個方程我們把它們畫這兩個方程我們把它們畫在圖在圖5.1中中正如該圖所示,參與人j消費的越多,參與人i打算消費的就越少。特別的,如果參與人2什么
10、都不消費(符合效率的不存在),那么參與人1就會消費 ,而隨著參與人2的消費量朝著K不斷增加,那么參與人1的消費量則會朝向0不斷減少。如果我們對這兩個最優(yōu)反應(yīng)函數(shù)聯(lián)立求解,那么我們會找到唯一的一個納什均衡,這個均衡有兩個參與人,選擇的量為 現(xiàn)在我們可以問這個兩人社會是否可以變得更好這個問題了。每個參與人消費k/2 是太多了還是太少了呢?回答這些問題的正確方式是使用帕累托標(biāo)準(zhǔn):我們能否找到另外一個可以讓每個人都變得更好的消費剖面呢?如果可以,我們就能將那個更好的消費剖面和這個納什均衡相比較。為了找到這樣的剖面,我們可以使用一點小技巧:將所有支付函數(shù)的加和進(jìn)行最大化,這我們可以視為“世界的支付函數(shù)”
11、 。我們不打算就這個方法的使用進(jìn)行道德上的辯護(hù),但這樣做的確是很有用的。 (一般而言,最大化效用函數(shù)之和,或最大化總福利,會帶來帕累托最優(yōu)結(jié)果,但是它并非是唯一的一種方法。) 因此,我們要最大化的函數(shù)是: 這個問題的一階條件是: 和 聯(lián)立求解這兩個方程,可以得到 和 的帕累托最優(yōu)選擇。這兩個方程的唯一解是 ,它的意思是從社會的角度來看,納什均衡中兩個參與人每個人都消耗了過多的清潔空氣。事實上,如果每一個人消耗 而不是 那么對兩個人來說都會更好一些。 這樣,正如哈丁所給出的,讓人們自由選擇可能會使得他們?nèi)巳司硾r更差,而如果這些選擇受到些管制會比較好。當(dāng)然,我們是否能夠相信一個管制者可以掌控局勢是
12、一種反對的理由;如果管制者無法控制局勢,問題就變成了我們?nèi)绾蝺珊ο鄼?quán)取其輕了,而這個問題的答案則非博弈論所能給出。3、古諾雙寡頭讓我們再來回顧一下古諾博弈,其中需求函數(shù)為 ,成本函數(shù)為 ,其中企業(yè)i 。當(dāng)企業(yè)i相信其對手選擇了產(chǎn)量 時,它所面對的最大化問題是:回憶下每個企業(yè)的最優(yōu)反應(yīng)函數(shù),它可以由一階條件給出,因此有:這意味著每個企業(yè)都像下面這樣選擇產(chǎn)量: 和 產(chǎn)量對 是互為最優(yōu)反應(yīng),它必然是一個古諾-納什均衡,當(dāng)我們聯(lián)立求解兩個最優(yōu)反應(yīng)函數(shù)(5.2)時它這個結(jié)果就會給出。圖5.2中給出的最優(yōu)反應(yīng)函數(shù)描述了我們前面求解的那種特殊情況,其中a=100,b=1,而 ,在這種情況下唯一的納什均衡是
13、。值得注意的是,納什均衡與IESDS和可理性化過程后僅剩下的唯一策略是一致的。4、貝特蘭德雙寡頭貝特蘭德雙寡頭古諾模型假設(shè)企業(yè)選擇產(chǎn)量,而市場價格自動調(diào)整以出清需求。然而,我們也可以認(rèn)為企業(yè)經(jīng)常是選擇價格水平,而讓消費者從中做出購買決策,而不是設(shè)定好產(chǎn)量,等待著市場價格來均衡需求。我們現(xiàn)在考慮這樣一個博弈,于其間每個企業(yè)都給為無差別的產(chǎn)品給出一個價格。這種情況曾被約瑟夫貝特蘭德(1883)予以模型化并進(jìn)行分析過。和之前一樣,我們假設(shè)需求由p=100-q給出,成本函數(shù)為 ,企業(yè)i 。顯然,我們可以預(yù)期所有的購買者都會從那個出價最低的企業(yè)那里購買產(chǎn)品。如果價格一樣,那該怎么辦?我們假定如果兩個企業(yè)
14、出價相等,則兩個企業(yè)平分整個市場。 這給出了以下這個標(biāo)準(zhǔn)式博弈: 參與人參與人:N=1,2。 策略集策略集: ,其中 ,而企業(yè)選擇價格 。 支付支付:為了計算支付,我們需要知道每個企業(yè)的產(chǎn)量是多少。給定我們對價格相等時的假設(shè),產(chǎn)量由下式給出: 這反過來意味著支付函數(shù)可以由下式給出: 現(xiàn)在對這個博弈的描述已經(jīng)完成,我們可以嘗試這來計算每個企業(yè)的最優(yōu)反應(yīng)函數(shù)。為了做到這一點,我們從現(xiàn)實角度入手來做一點小小的修正:假設(shè)價格不能是任意非負(fù)的實數(shù),而應(yīng)該限制在某些較小的數(shù)值的增加上,譬如 ,這意味著策略集(價格集)是 。舉個例子,如果我們考慮一分錢為價格增量,那么 ,則策略集就是 。我們很快就會看到當(dāng)這
15、個較少的面值 變得非常小、近乎為零時會發(fā)生什么。 我們可以計算壟斷價格,這個假設(shè)是最大化沒有競爭對手的單個企業(yè)的利潤時的價格。這可以通過最大化下式得到: ,其一階條件為 ,由此得到最優(yōu)價格p=55,其產(chǎn)量為q=45,利潤等于2025美元。 我們現(xiàn)在轉(zhuǎn)過來討論有兩個企業(yè)的雙寡頭情況 A、首先考慮 的情況。很容易可以看出,企業(yè)i可以表現(xiàn)的好像沒有競爭一樣:只需要將價格設(shè)在壟斷價格55的水平上即可得到全部市場份額。至此,我們可以推斷,如果 ,那么企業(yè)i的最優(yōu)反應(yīng)就是將價格設(shè)定在 上。 B、也可以很輕松的看到,在 這種情況下,企業(yè)i的最優(yōu)反應(yīng)是將價格設(shè)得比企業(yè)j更高一點。如果它要價 ,則它可以在低于其
16、成本的價格上賣出正的數(shù)量,反而會使得企業(yè)i損失貨幣。如果它要價 ,則它什么都賣不出去,當(dāng)然也沒有任何損失。 C、現(xiàn)在考慮 。,企業(yè)i可以選擇以下三個選擇項之一:要么設(shè)定價格 而什么也得不到,要么設(shè)定 而平分市場,要么設(shè)定價格 而得到整個市場。并不難得出的結(jié)論是,企業(yè)i希望以低于企業(yè)j的價格來進(jìn)行銷售,從而得到整個市場,這個目標(biāo)可以通過將價格設(shè)定為 。 D、我們可以來探討兩種最終的情況: 和 。 需要考慮的這三個選項是: 或 。 當(dāng) 時,剛好低于企業(yè)j的價格意味著將價格設(shè)定在 上,這給企業(yè)i帶來零利潤,和將價格設(shè)定 在任意的 上是一樣的。這樣一來,最優(yōu)反應(yīng)就是設(shè)定為 ,并以較低的利潤平分市場。
17、最后如果 ,那么任何 的價格選擇都只能使得企業(yè)i獲得零利潤,而設(shè)定 則會帶來損失。因此,任何 的價格都是當(dāng) 時的最優(yōu)反應(yīng)?;?總之,我們可以計算得到: 現(xiàn)在,給定企業(yè)j的最優(yōu)反應(yīng)是對稱的,那么就不難看出存在兩個納什均衡,可以直接從下面這個最優(yōu)反應(yīng)函數(shù)形式中得到:對 的最優(yōu)反應(yīng)是 ,而對 的最優(yōu)反應(yīng)則是 或 。這樣,這兩個納什均衡就是:這一分析所帶來的信息頗具震撼力:一個企業(yè)可能會有壟斷勢力,但是如果我們多加入一個企業(yè)進(jìn)行競爭,而且是在價格上進(jìn)行競爭,那么這個市場就會表現(xiàn)出競爭性的特征如果兩個企業(yè)都選擇價格為10美元,那這個價格正好等于邊際成本!要注意,如果我們加上第三個、第四個企業(yè)進(jìn)去也不會改
18、變這一結(jié)果;價格將會是10美元不變(或者幾乎等同的10.01美元),對所有納什(貝特蘭德)均衡中的企業(yè)來說都是如此。這不和古諾競爭大不一樣,在古諾競爭中只要企業(yè)的數(shù)目不是最夠多,它們就可以獲得一定程度上的市場勢力。 注意:當(dāng) 時,參與人1對于任何他選擇的10和10以上的價格并無差異:如果 他平分市場而無利潤,如果他令 則失去所有市場也沒有利潤。如果參與人2選擇 ,那么 參與人1 任何選擇 和 一起構(gòu)成了一個納什均衡。這是不對的!因為如果 則 就不會是參與人2針對 的最優(yōu)反應(yīng)。則 貝特蘭德博弈的結(jié)果和古諾博弈的結(jié)果比較 在古諾博弈下(產(chǎn)量競爭),唯一的納什均衡是 。計算顯示總產(chǎn)量 ,我們可以得到
19、需求價格p=40,而每一個企業(yè)都可以得到利潤900美元。在貝特蘭德博弈下(價格競爭),這兩個可能出現(xiàn)的納什均衡要么兩個人都選擇定價10美元從而得到零利潤,要么選擇定價10.01美元得到微不足道的一點利潤額(大約0.45美元)。在古諾博弈和貝特蘭德博弈之間存在一個有趣的差別。在古諾博弈中,每個參與人的最優(yōu)反應(yīng)函數(shù)是向下傾斜的。也就是說,參與人j生產(chǎn)的越多,參與人i的最優(yōu)反應(yīng)數(shù)量就越低。然而,在貝特蘭德博弈中,對于邊際成本(在主體例子中是10)和壟斷價格(等于45)之間的價格而言,參與人j設(shè)定的價格越高,參與人i的最優(yōu)反應(yīng)價格越高。這些差異在文獻(xiàn)中業(yè)已受到不少關(guān)注。一個參與人的最優(yōu)反應(yīng)隨著其他人的選擇而遞減的博弈,像古諾博弈,被稱為是策略替代博弈策略替代博弈(games with strategic substitutes)。策略替代博弈的另一個例子是公地悲劇博弈。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車輛轉(zhuǎn)讓與車輛檢測報告及維修保養(yǎng)服務(wù)合同
- 采棉機(jī)作業(yè)與棉花種植項目投資合同
- 電梯低頻噪音維修方案
- 泡水漏水考試題及答案
- 車位產(chǎn)權(quán)明確買賣及車位租賃及維修合同
- 獸醫(yī)門診面試題及答案
- 冷庫搬運服務(wù)外包方案
- 2026版《全品高考》選考復(fù)習(xí)方案生物0419 課時作業(yè)(十八) 減數(shù)分裂與有絲分裂的比較 含答案
- 胸膜腫瘤CT表現(xiàn)與鑒別診斷
- 舞室運營方案模板
- 2025年度分布式光伏項目居間代理服務(wù)合同
- IT系統(tǒng)災(zāi)難恢復(fù)計劃
- 2025年江蘇無錫市屬國有企業(yè)招聘筆試參考題庫含答案解析
- 2025河南省安全員《C證》考試題庫及答案
- DB22T 2137-2014 鐵礦粉中水分含量的快速測定方法
- 《輸血相容性檢測設(shè)備性能驗證技術(shù)規(guī)范》
- 2024年10月自考00896電子商務(wù)概論試題及答案
- 2024魯科版五四制六年級生物上冊全冊知識點(填空版+背誦版)
- 混齡分組教學(xué)活動設(shè)計
- 債權(quán)轉(zhuǎn)讓協(xié)議書范文范本下載電子版
- 代理記賬業(yè)務(wù)內(nèi)部規(guī)范(三篇)
評論
0/150
提交評論