版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
一、子博弈精煉納什均衡
子博弈精煉納什均衡的創(chuàng)立者.——1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲獎(jiǎng)?wù)?、萊茵哈德·澤爾騰。
澤爾騰則在60年代中期將納什均衡概念引入動(dòng)態(tài)分析。在1965年發(fā)表《需求減少條件下寡頭壟斷模型的對(duì)策論描述》一文,提出了“子博弈精煉納什均衡”的概念,又稱“子對(duì)策完美納什均衡”。這一研究對(duì)納什均衡進(jìn)行了第一次改進(jìn),選擇了更具說(shuō)服力的均衡點(diǎn)。海薩尼在60年代末把不完全信息引入博弈分析。
將納什均衡中包含的不可置信的威脅策略剔除出去。它要求參與者的決策在任何時(shí)點(diǎn)上都是最優(yōu)的,決策者要“隨機(jī)應(yīng)變”,“向前看”,而不是固守舊略。
由于剔除了不可置信的威脅,在許多情況下,精煉納什均衡也就縮小了納什均衡的個(gè)數(shù)。這一點(diǎn)對(duì)預(yù)測(cè)分析是非常有意義的。
用動(dòng)態(tài)博弈理論來(lái)討論實(shí)際究竟發(fā)生哪個(gè)納什均衡。
只有當(dāng)參與人的策略在每一個(gè)子博弈中都構(gòu)成納什均衡叫做精煉納什均衡?;蛘哒f(shuō),組成精煉納什均衡的策略必須在每一個(gè)子博弈中都是最優(yōu)的。在動(dòng)態(tài)博弈中,參與人的行動(dòng)有先后順序,后行動(dòng)的參與人在自己行動(dòng)之前就可以觀察到先行動(dòng)者(參與人)的行為,并在此基礎(chǔ)上選擇相應(yīng)的策略。而且,由于先行動(dòng)者擁有后行動(dòng)者可能選擇策略的完全信息,因而先行動(dòng)者在選擇自己的策略時(shí),就可以預(yù)先考慮自己的選擇對(duì)后行動(dòng)者選擇的影響,并采取相應(yīng)的對(duì)策。我們關(guān)于房地產(chǎn)開(kāi)發(fā)的例子,討論子博弈精煉納什均衡。表3-1給出了靜態(tài)條件下雙方參與人的收益情況。表3-1房地產(chǎn)開(kāi)發(fā)博弈(靜態(tài))的收益矩陣
從表3-1可以知道,該博弈有兩個(gè)納什均衡,即(A開(kāi)發(fā),B不開(kāi)發(fā))和(A不開(kāi)發(fā),B開(kāi)發(fā)),我們無(wú)法確定是開(kāi)發(fā)商A選擇開(kāi)發(fā),開(kāi)發(fā)商B選擇不開(kāi)發(fā),還是恰恰相反的結(jié)果。
現(xiàn)在,我們討論動(dòng)態(tài)博弈。假定房地產(chǎn)開(kāi)發(fā)商A是先行動(dòng)者。在行動(dòng)之前,開(kāi)發(fā)商A對(duì)對(duì)手開(kāi)發(fā)商B的策略進(jìn)行了預(yù)測(cè)。在行動(dòng)開(kāi)始之前的A看來(lái),如果不計(jì)得失,B有四種策略可供選擇:策略一:無(wú)論A是否選擇開(kāi)發(fā),B選擇開(kāi)發(fā)。策略二:若A選擇開(kāi)發(fā),B也選擇開(kāi)發(fā);若A選擇不開(kāi)發(fā),B也選擇不開(kāi)發(fā)。策略三:若A選擇開(kāi)發(fā),B就選擇不開(kāi)發(fā);若A選擇不開(kāi)發(fā),B就選擇開(kāi)發(fā)。策略四:無(wú)論A是否選擇開(kāi)發(fā),B都選擇不開(kāi)發(fā)。在表3-1的基礎(chǔ)上,結(jié)合A先行動(dòng),B可能選擇的四種策略,不難得出表3-2。表3-2先行動(dòng)者A對(duì)B預(yù)測(cè)結(jié)果的收益矩陣第一列為策略一收益展示(也就是說(shuō)第一列兩個(gè)收益組合對(duì)應(yīng)策略一),第二列為策略二收益展示,以此類推
由表3-2可以看出,在開(kāi)發(fā)商A先行動(dòng)的情況下,開(kāi)發(fā)商B可供選擇的策略中,策略一只包括了上述兩個(gè)納什均衡中的后一種均衡,即(A不開(kāi)發(fā),B開(kāi)發(fā)),而沒(méi)有包括前一種納什均衡,即(A開(kāi)發(fā),B不開(kāi)發(fā));策略二上述兩種納什均衡都沒(méi)有包括;策略四只包括了上述兩種納什均衡中的前一種均衡,即(A開(kāi)發(fā),B不開(kāi)發(fā)),而未包括后一種納什均衡,即(A不開(kāi)發(fā),B開(kāi)發(fā));只有策略三既包括了上述兩種納什均衡中的前一種均衡,又包括了后一種均衡。也就是說(shuō),如果B選擇策略三,那么,無(wú)論A作出什么選擇,B的回應(yīng)都能達(dá)到納什均衡。反過(guò)來(lái),在給定B會(huì)選擇策略三來(lái)回應(yīng)A的選擇的前提下,開(kāi)發(fā)是A的占優(yōu)選擇。因此,A一定會(huì)選擇開(kāi)發(fā)。
以上的分析,就是子博弈精煉納什均衡解的過(guò)程。策略(A開(kāi)發(fā),B不開(kāi)發(fā))就是上述子博弈精煉納什均衡解。所謂“子博弈”(sub-game)是指它本身可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析,它是原博弈的一部分。例如,在表3-1中,每一行或每一列都是整個(gè)博弈的一個(gè)子博弈。而且,任何博弈本身可被稱為自身的一個(gè)子博弈。只有當(dāng)某一策略組合在每一個(gè)子博弈(包括原博弈)上都構(gòu)成一個(gè)納什均衡,這一策略組合才是子博弈精煉納什均衡解。顯然,如果整個(gè)博弈是惟一的子博弈,納什均衡與子博弈精煉納什均衡是完全相同的。二、重復(fù)博弈
上述子博弈精煉納什均衡有這樣一個(gè)特征,這就是,參與人在前一個(gè)階段的行動(dòng)選擇決定了隨后的子博弈的結(jié)構(gòu)。因此,同樣結(jié)構(gòu)的子博弈只出現(xiàn)一次。在上述房地產(chǎn)開(kāi)發(fā)博弈的例子中,開(kāi)發(fā)商A選擇開(kāi)發(fā)后的子博弈甲不同于開(kāi)發(fā)商A選擇不開(kāi)發(fā)后的子博弈乙,當(dāng)開(kāi)發(fā)商A選擇開(kāi)發(fā)后,子博弈乙就被排除了。這樣的動(dòng)態(tài)博弈稱為“序貫博弈”(sequentialgames)。動(dòng)態(tài)博弈中另一類特殊但非常重要的博弈是所謂的“重復(fù)博弈”(repeatedgames)。顧名思義,重復(fù)博弈是指同樣結(jié)構(gòu)的博弈重復(fù)許多次,其中的每次博弈稱為“階段博弈”(stagegames)
以下我們用一個(gè)產(chǎn)品定價(jià)的例子討論重復(fù)博弈。表3-3給出了一次性完全信息靜態(tài)博弈的收益矩陣。表3-3
產(chǎn)品定價(jià)博弈的收益矩陣
A、B兩個(gè)參與人都有兩種定價(jià)代選擇:定高價(jià)或定低價(jià)。如果兩個(gè)參與人都定低價(jià),則每個(gè)參與人的收益均為20個(gè)單位;如果兩人都定高價(jià),則每人的收益均為30個(gè)單位;如果其中某一參與人定低價(jià),而另一參與人定高價(jià),則定低價(jià)的參與人有占有更多的市場(chǎng)份額獲得40個(gè)單位的收益,定高價(jià)的參與人由于失去一部分市場(chǎng)份額而只獲得10個(gè)單位的收益。顯然,在這個(gè)一次性完全信息靜態(tài)博弈中,兩個(gè)參與人均有占優(yōu)策略,占優(yōu)策略均衡為A、B雙方都定低價(jià)。如果A、B之間的定價(jià)博弈是多次進(jìn)行的,那么,問(wèn)題就不是如此簡(jiǎn)單了。我們先來(lái)分析博弈重復(fù)次數(shù)為無(wú)限次的情況。
如果A、B雙方都選擇合作,都保持定高價(jià),則雙方在每個(gè)階段的收益均為30個(gè)單位,記為(30,30,30,…);如果A、B中有一方(如A)采取投機(jī)行為,在實(shí)際定價(jià)中選擇不與對(duì)方合作,在第一階段就通過(guò)選擇定價(jià)策略使得選擇高價(jià)策略的對(duì)手B受損,則受損的一方B一定會(huì)在第二階段及其以后的定價(jià)中也選擇低價(jià)策略,加以報(bào)復(fù),這樣一來(lái),首先選擇不合作的一方A在個(gè)階段的收益為(40,20,20,…),顯然,其總收益遠(yuǎn)遠(yuǎn)小于合作、維持高價(jià)情況下的總收益。因?yàn)?,首選選擇不合作的一方A,只是在第一階段獲得了“額外”收益,但在以后個(gè)階段的收益將因?yàn)閷?duì)手B的報(bào)復(fù)性選擇而減少,并且,重復(fù)若干此后,首先選擇不合作的一方A將得不償失。在這里,B選擇的策略稱為“冷酷策略”(grimstrategies)。冷酷策略是指重復(fù)博弈中的任何參與人的一次性不合作將引起其他參與人的永遠(yuǎn)不合作,從而導(dǎo)致所有參與人的收益減少。因此,所有參與人具有維持合作的積極性。我們?cè)賮?lái)討論博弈重復(fù)次數(shù)為有限時(shí)的情況。重復(fù)次數(shù)有限博弈與重復(fù)次數(shù)無(wú)限博弈之間的惟一區(qū)別,是所有參與人都可以明確無(wú)誤地了解重復(fù)的次數(shù),即可以準(zhǔn)確地預(yù)測(cè)到最后一個(gè)階段博弈。而在最后階段的博弈中,任何一個(gè)參與人選擇不合作,不會(huì)導(dǎo)致其他參與人的報(bào)復(fù)。因此,所有參與人都會(huì)在最后階段的博弈中選擇自己的占優(yōu)策略,那就是不合作。上例中,在最后階段博弈中選擇低價(jià)是所有參與人的占優(yōu)策略。既然所有參與人都會(huì)在最后階段選擇不合作,那么,在倒數(shù)第二階段博弈中任何參與人也就沒(méi)有必要擔(dān)心由于自己選擇不合作,導(dǎo)致其他參與人在最后階段博弈中的報(bào)復(fù)。因此所有參與人在倒數(shù)第二階段博弈中,也都會(huì)選擇不合作。即在倒數(shù)第二階段博弈中,所有參與人都會(huì)選擇占優(yōu)策略。由此類推,可以得出以下結(jié)論:在階段性博弈存在惟一的納什均衡時(shí),階段博弈的納什均衡解就是重復(fù)次數(shù)有限博弈的唯一子博弈精煉納什均衡解。即重復(fù)次數(shù)有限博弈的每個(gè)階段的均衡解都是一次性博弈的納什均衡解。注意,上述推論成立的前提條件是階段性博弈納什均衡的惟一性。例如,在上例中,每個(gè)階段博弈的收益矩陣都與表3-3完全一致,納什均衡都是每個(gè)參與人選擇低價(jià)。三、動(dòng)態(tài)博弈策略行動(dòng)在動(dòng)態(tài)博弈中,由于參與人的行動(dòng)有先后順序,而參與人行動(dòng)順序直接影響博弈的結(jié)果。因此,參與人為了使其他參與人的選擇對(duì)自己有利,往往會(huì)主動(dòng)采取一些行動(dòng)影響其他參與人對(duì)自己行為的預(yù)期,從而達(dá)到對(duì)自己有利的結(jié)果。參與人所采取的這些行為稱之為“策略行”(strategicmove)。
以下通過(guò)兩個(gè)例子加以說(shuō)明。1、先行優(yōu)勢(shì)(first-moveadvantage)所謂現(xiàn)行優(yōu)勢(shì)是指在博弈中首先作出策略選擇并采取相應(yīng)行動(dòng)的參與人可以獲得更多的利益。在上面提到的性別戰(zhàn)中,存在兩個(gè)納什均衡,即男女雙方一起去看足球賽或一起去逛商店。我們無(wú)法確定結(jié)果到底如何。在這種情況下,如果男方首先采取行動(dòng),在約會(huì)前就買好足球票,就會(huì)對(duì)女方產(chǎn)生影響。女方可能因?yàn)槟蟹降倪@一行動(dòng)表明“男朋友十分想看這場(chǎng)足球比賽”或因“既然已經(jīng)買了票,不看怪可惜”,從而接受雙方一起看足球賽的選擇。2、確信威脅(credible)確信威脅是指博弈的某一參與人通過(guò)承諾某種行動(dòng)改變自己的收益函數(shù),使得其他參與人認(rèn)為自己的威脅確實(shí)可信,從而迫使其他參與人在充分考慮自己的承諾的情況下作出相應(yīng)的選擇。例如,在上述房地產(chǎn)開(kāi)發(fā)博弈中,如果房地產(chǎn)開(kāi)發(fā)商B在房地產(chǎn)開(kāi)始A作出選擇之前就采取行動(dòng),與客戶簽訂合同,規(guī)定B在一定期限內(nèi),向客戶交付一定面積的住房,倘若B不能按時(shí)履約,則總共賠償客戶6個(gè)單位。在有這樣一個(gè)承諾的情況下,上述表3-1和表3-2就相應(yīng)地變成了表3-4和表3-5。表3-4B承諾后的腹地開(kāi)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度玻璃門安裝工程合同示范文本2篇
- 2025年消防設(shè)施設(shè)備維修保養(yǎng)及隱患排查合同3篇
- 二零二五版?zhèn)}儲(chǔ)運(yùn)輸合同服務(wù)質(zhì)量規(guī)范范本3篇
- 二零二五年度購(gòu)房首付退還及條件說(shuō)明合同4篇
- 個(gè)人股權(quán)轉(zhuǎn)讓合同詳細(xì)范文(2024版)
- 二零二五年度煤炭出口業(yè)務(wù)與海上運(yùn)輸安全合同范本4篇
- 2025年涂料工程節(jié)能技術(shù)應(yīng)用合同3篇
- 二零二五版MG動(dòng)畫(huà)教育軟件研發(fā)與授權(quán)合同3篇
- 二零二五年度綠色建筑評(píng)價(jià)體系招標(biāo)合同模板3篇
- 2025年度航空航天鋁合金結(jié)構(gòu)件研發(fā)與制造合同4篇
- 2024質(zhì)量管理理解、評(píng)價(jià)和改進(jìn)組織的質(zhì)量文化指南
- 手指外傷后護(hù)理查房
- 油氣回收相關(guān)理論知識(shí)考試試題及答案
- 我能作業(yè)更細(xì)心(課件)-小學(xué)生主題班會(huì)二年級(jí)
- 2023年湖北省武漢市高考數(shù)學(xué)一模試卷及答案解析
- 城市軌道交通的網(wǎng)絡(luò)安全與數(shù)據(jù)保護(hù)
- 英國(guó)足球文化課件
- 《行政職業(yè)能力測(cè)驗(yàn)》2023年公務(wù)員考試新疆維吾爾新疆生產(chǎn)建設(shè)兵團(tuán)可克達(dá)拉市預(yù)測(cè)試題含解析
- 醫(yī)院投訴案例分析及處理要點(diǎn)
- 燙傷的安全知識(shí)講座
- 工程變更、工程量簽證、結(jié)算以及零星項(xiàng)目預(yù)算程序?qū)嵤┘?xì)則(試行)
評(píng)論
0/150
提交評(píng)論