秋石微觀經(jīng)濟(jì)學(xué)ch11

上傳人：9*** IP屬地：湖北上傳時(shí)間：2023-02-06 格式：PPT 頁數(shù)：100 大小：5.23MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩95頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.界定博弈論的一些基本概念；2.界定優(yōu)勢(shì)策略和納什均衡3.理解囚犯困境的含義及其應(yīng)用；4.推導(dǎo)重復(fù)性博弈的納什均衡；5.推導(dǎo)序列博弈的納什均衡；本章要點(diǎn)2學(xué)完本章，你將能夠

11博弈論基礎(chǔ)?2011WangQiushi2/100

6.理解為什么存在著先動(dòng)優(yōu)勢(shì)；7.理解進(jìn)入威懾的可信性問題8.推導(dǎo)混合策略的納什均衡本章要點(diǎn)3學(xué)完本章，你將能夠

11博弈論基礎(chǔ)?2011WangQiushi3/100博弈就是一種比賽?2011WangQiushi比賽可以比快，也可以比慢4/100博弈論的基本概念博弈論(gametheory)：又稱對(duì)策論，是用于分析策略性行為的一種工具。博弈的分析步驟第一步是尋找到某種有用的方式來描述這場(chǎng)博弈；第二步是尋找某種方式來預(yù)測(cè)結(jié)果。博弈的要素(1)選手；(2)規(guī)則；(3)策略；(4)收益；(5)結(jié)果。?2011WangQiushi5/100“剪子、石頭、布”的博弈該游戲有兩個(gè)選手(players)，即參與此博弈的行為者；每個(gè)選手有三種策略(strategies)可供選擇：1出剪子；2出石頭；3出布。通俗點(diǎn)說，策略就是出招兒。該游戲有個(gè)規(guī)則:如果兩人出了相同的策略(如石頭對(duì)石頭等三種可能性)，雙方為打平；如果兩人出手不一(如石頭對(duì)剪子等六種可能性)，則可決定出勝負(fù)，石頭贏剪子、剪子贏布、布贏石頭(即石頭砸剪子、剪子剪布、布包石頭)。?2011WangQiushi6/100“剪子、石頭、布”的博弈在游戲之前，雙方達(dá)成獎(jiǎng)懲協(xié)議:如贏家賺1元，輸家輸1元；或者贏家不喝酒，而輸家罰酒一杯等等。假如是輸贏1元的協(xié)議，表(11.1)就是這個(gè)游戲的收益表(Payofftable)，把選手的收益狀況用表的形式描述，有時(shí)亦稱收益矩陣(Payoffmatrix)。?2011WangQiushi7/100收益表如果A出石頭，B也出石頭，各自收益均為0；?2011WangQiushi8/100收益表如果A出石頭，B出剪子，A的收益為1，B的收益為(-1)；?2011WangQiushi9/100收益表如果A出石頭，B出布，A的收益為(-1)，而B的收益為1。?2011WangQiushi余此類推10/100博弈論的基本概念一般來說，在每個(gè)小方框內(nèi)，第一個(gè)數(shù)據(jù)為排在左邊的選手A的收益，第二個(gè)數(shù)據(jù)為排在上方的選手B的收益，中間用逗號(hào)隔開，即(A，B)=(0，0)等等。上表是一種常見的用表格描述一場(chǎng)博弈的方法,簡(jiǎn)稱常規(guī)式博弈(normalform)。同時(shí)博弈：要求選手同時(shí)出招的博弈。序列博弈:選手可以分先后時(shí)間出招的博弈。?2011WangQiushi11/100優(yōu)勢(shì)策略假定A、B兩人在玩一個(gè)十分簡(jiǎn)單的博弈,A在紙上可以寫“上”或“下”,B在另外一張紙上可以寫“左”或“右”,其收益矩陣如下表所示。?2011WangQiushi每個(gè)選手都是自我利益極大化者。12/100優(yōu)勢(shì)策略如果B選左，A選上的收益為1，而選下的收益為2，那么，A選下；?2011WangQiushi如果B選右，A在收益0與1之間選擇，A選擇下。13/100優(yōu)勢(shì)策略優(yōu)勢(shì)策略:無論對(duì)方選擇什么策略，該選手總是選擇某種固定的策略，又稱占優(yōu)策略。在本例中，無論B出什么招，A總是選下。因此，選下是A的優(yōu)勢(shì)策略。所謂優(yōu)勢(shì)策略，就是無論你出什么招，我就出這一招。選手B也有優(yōu)勢(shì)策略嗎？?2011WangQiushi14/100優(yōu)勢(shì)策略給定A選上，B選左的收益為1，而選右的收益為2，那么，B選左；?2011WangQiushi如果A選下，B在收益0與1之間選擇，

B選左。15/100優(yōu)勢(shì)策略無論選手A如何選擇，B將始終選擇左。B選擇左是優(yōu)勢(shì)策略。在某個(gè)博弈中,如果每個(gè)選手都有一種優(yōu)勢(shì)策略,那么,兩個(gè)選手的優(yōu)勢(shì)策略組合就是這一博弈的均衡。所謂博弈的均衡就是會(huì)發(fā)生的一種結(jié)局。?2011WangQiushi16/100優(yōu)勢(shì)策略在上例中，(A，B)=(下，左)=(2，1)就是該博弈優(yōu)勢(shì)策略的均衡結(jié)果。?2011WangQiushi17/100優(yōu)勢(shì)策略大學(xué)成功秘訣：不管你如何，我始終把努力學(xué)習(xí)作為我的優(yōu)勢(shì)策略。?2011WangQiushi18/100納什均衡并非所有的博弈都存在優(yōu)勢(shì)策略均衡。?2011WangQiushi在以下改進(jìn)的博弈中，如果B選左，A就選上；如果B選右，A就選下；因此，A沒有優(yōu)勢(shì)策略。？19/100納什均衡同理可以分析，B也沒有優(yōu)勢(shì)策略。?2011WangQiushi？那么該博弈是否存在著均衡呢？20/100納什均衡優(yōu)勢(shì)策略均衡的要求也許太高了點(diǎn)。它要求無論B出什么招,A有一個(gè)優(yōu)勢(shì)策略;而且還要求無論A出什么招,B也有一個(gè)優(yōu)勢(shì)策略。這兩個(gè)優(yōu)勢(shì)策略的組合才構(gòu)成一個(gè)優(yōu)勢(shì)策略均衡。如果給定B的選擇,A的選擇是最佳的;同時(shí)給定A的選擇,B的選擇也是最佳的,那么，A和B的這組最佳選擇的組合就是納什均衡。?2011WangQiushi21/100約翰納什這是以1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主、美國(guó)經(jīng)濟(jì)學(xué)家約翰·納什的名字命名的。瑞典皇家科學(xué)院的公報(bào)稱:“納什由于引入了合作博弈與非合作博弈的區(qū)分,并為非合作博弈創(chuàng)立了一種均衡概念。這種均衡概念現(xiàn)在被命名為‘納什均衡’”?2011WangQiushi22/100約翰·納什納什均衡如果B選左,A的最佳選擇為上;?2011WangQiushi如果B選右,A的最佳選擇為下;如果A選上,B的最佳選擇為左;如果A選下,B的最佳選擇為右。兩箭頭所指就是納什均衡。23/100納什均衡給定B選左,A的最佳選擇為上；給定A選擇上，B的最佳選擇為左

；所以,(上，左)為納什均衡。?2011WangQiushi同理,(下，右)為另一組納什均衡。24/100優(yōu)勢(shì)均衡與納什均衡的聯(lián)系與區(qū)別優(yōu)勢(shì)策略：無論你做什么，我做我最好的；無論我做什么，你做你最好的。納什均衡：給定你的策略，我做我最好的；給定我的策略，你做你最好的。由此可見，優(yōu)勢(shì)策略均衡便是納什均衡的一種特例。通俗地講，如果是優(yōu)勢(shì)策略均衡，就一定是納什均衡；反之，則不然。?2011WangQiushi25/100囚犯困境有兩個(gè)嫌疑犯A和B因合伙偷竊自行車被警方捉拿歸案，且證據(jù)確鑿，可判他們每人各2年的徒刑。如果他倆都承認(rèn)犯有搶劫銀行罪，當(dāng)局就以兩罪并罰，各判10年監(jiān)禁；如果兩嫌疑犯都否認(rèn)犯有搶劫銀行罪，當(dāng)局則以偷自行車罪各判2年刑；如果一方承認(rèn)犯有搶劫銀行罪并提供有效證據(jù)，而另一方拒絕承認(rèn)的話，當(dāng)局以“坦白從寬，抗拒從嚴(yán)”的原則，對(duì)承認(rèn)犯罪者不再追究偷竊自行車罪而釋放，而對(duì)否認(rèn)者三罪并罰（偷自行車、搶劫銀行和不誠(chéng)實(shí)罪)投監(jiān)20年。?2011WangQiushi26/100囚犯困境在這個(gè)游戲中，有兩個(gè)選手：囚犯A和B，每個(gè)選手均有兩種策略。承認(rèn)或否認(rèn)犯有搶劫銀行罪，有可能出現(xiàn)四種結(jié)果，其收益矩陣如表11.4所示。表中第一列，如果A和B同時(shí)承認(rèn)犯罪各坐牢10年；如果A否認(rèn)犯罪，而B承認(rèn)犯罪，A坐牢20年，而B卻可自由，表的第二列依此類推。?2011WangQiushi27/100囚犯困境對(duì)策論的一個(gè)中心問題如果我相信我的對(duì)手是理性的，我如何給定他的行為做出我的一個(gè)最優(yōu)決策，即給定對(duì)手行為，我如何做出最佳選擇。這個(gè)對(duì)策存在著均衡嗎？?2011WangQiushi28/100囚犯困境給定對(duì)方承認(rèn)，你也承認(rèn)；給定對(duì)方否認(rèn)，你承認(rèn)。（承認(rèn)，承認(rèn)）=（-10，-10）就是是優(yōu)勢(shì)策略均衡；于是(承認(rèn)，承認(rèn))也是囚犯困境的納什均衡。?2011WangQiushi29/100囚犯困境為什么把它稱為“囚犯困境”

呢？(承認(rèn)，承認(rèn))=(-10，-10)是納什均衡。如果他們都否認(rèn)犯罪，每人只需坐牢2年，而不是10年。(否認(rèn)，否認(rèn)）是一種帕累托效率，而(承認(rèn)，承認(rèn))一種帕累托非效率。囚犯困境的“困惑”就在于為什么納什均衡并非是帕累托最優(yōu)，而帕累托效率又不是納什均衡的結(jié)果呢？?2011WangQiushi30/100囚犯困境及其應(yīng)用囚犯困境隱含著，合謀也許是一個(gè)更為有效的結(jié)果。囚犯困境是在向看不見手的挑戰(zhàn)。亞當(dāng).斯密的看不見的手理論認(rèn)為，市場(chǎng)經(jīng)濟(jì)中的每個(gè)人都在追求自我利益，但在追求自我利益的過程中同時(shí)也實(shí)現(xiàn)了社會(huì)的公共利益。囚犯困境卻揭示社會(huì)中的每個(gè)人都在追求自我利益，然而，人類社會(huì)的公共利益卻不可能實(shí)現(xiàn)。?2011WangQiushi31/100囚犯困境一種表現(xiàn)?2011WangQiushi32/100你急我急大家急急成一團(tuán)（請(qǐng)對(duì)下聯(lián)）廣告困境做廣告導(dǎo)致需求增加，將激勵(lì)企業(yè)大量做廣告。其一，廣告之后，原本沒使用過本產(chǎn)品的人了解了產(chǎn)品，其中一部分可能購買之；其二，一些在使用其它同類品牌的人可能轉(zhuǎn)換過來消費(fèi)本產(chǎn)品?，F(xiàn)假定有兩家寡頭面臨著兩個(gè)選擇：（大量）做廣告和不（大量）做廣告。在現(xiàn)實(shí)經(jīng)濟(jì)中，他們要選擇做多少廣告的問題。為了簡(jiǎn)化起見，也不失一般性，就假定只有這兩種選擇。?2011WangQiushi33/100可口可樂與百事可樂之爭(zhēng)?2011WangQiushi34/100可口可樂與百事可樂之爭(zhēng)?2011WangQiushi35/100廣告困境之一無論A如何，B始終要做廣告，做廣告是B的優(yōu)勢(shì)策略；同理，做廣告也是A的優(yōu)勢(shì)策略。?2011WangQiushi■因此，(做廣告，做廣告)=(300，300)便成為此博弈的優(yōu)勢(shì)策略均衡，同時(shí)也是納什均衡。36/100廣告困境之二企業(yè)B的優(yōu)勢(shì)策略是做廣告,而企業(yè)A卻沒有優(yōu)勢(shì)策略。如果B做廣告,A最好跟著做廣告;但如果B不做廣告,A最好的策略也是不做廣告。?2011WangQiushi37/100廣告困境因此，(做廣告，做廣告)=(200，300)依然是納什均衡。?2011WangQiushi■但是，(不做廣告，不做廣告)=(500，600)卻是一種帕累托最優(yōu)，但對(duì)這種非合作性博弈就偏偏實(shí)現(xiàn)不了。38/100禁播香煙廣告的法案1971年1月1日,美國(guó)眾議院通過了禁止在電視上播出香煙廣告的法案.但法案的制定者當(dāng)初并不知道它有利于解決香煙廣告困境問題。它使得美國(guó)煙草制造商們花在香煙上的廣告費(fèi)從此法案實(shí)施前一年的3億美元下降到了實(shí)施后一年的6000多萬美元,這其中大部分都轉(zhuǎn)化為煙草行業(yè)的利潤(rùn)了。?2011WangQiushi39/100研發(fā)博弈研發(fā)是指企業(yè)研究新技術(shù)、開發(fā)新產(chǎn)品的活動(dòng)?，F(xiàn)假定有兩個(gè)實(shí)力相當(dāng)?shù)墓杨^在兩大策略中選擇研發(fā)和不研發(fā)，其假定的收益矩陣如表11.7所示。?2011WangQiushi40/100研發(fā)博弈寡頭A和寡頭B都存在著一種優(yōu)勢(shì)策略——研發(fā),所以,(研發(fā),研發(fā))成為本博弈中的納什均衡。其實(shí),雙方達(dá)到合謀都不研發(fā)或者少研發(fā)是一種帕累托改進(jìn)。?2011WangQiushi41/100

產(chǎn)量困境:古諾解

我們?cè)诘?0章介紹古諾模型時(shí)假設(shè)，有兩家寡頭生產(chǎn)同質(zhì)的礦泉水，每家寡頭的邊際成本為零，其共同的市場(chǎng)需求曲線為:

p=120-q■企業(yè)A和企業(yè)B的數(shù)量反應(yīng)函數(shù)分別為:?2011WangQiushi■求解古諾解為：42/100

產(chǎn)量困境:古諾解

如果兩家組成卡特爾，像一個(gè)壟斷者那樣生產(chǎn)，那么,MR=MC=0,平分市場(chǎng)后有：?2011WangQiushi■如果A生產(chǎn)30,但B違約生產(chǎn)40,這樣,p=50,πA=1500,πB

=2000,因此,B有違約的激勵(lì)?！鐾?如果B生產(chǎn)30,但A違約生產(chǎn)40,這樣p=50,πA=2000,πB=1500,因此,A有違約的激勵(lì)。43/100

產(chǎn)量困境:古諾解

把上述情況用利潤(rùn)矩陣描述成下表。?2011WangQiushi44/100

產(chǎn)量困境:古諾解

給定B合作，A違約，給定B違約，A違約；?2011WangQiushi給定A合作，B違約，給定A違約，B違約；45/100

產(chǎn)量困境:古諾解

（違約，違約）=（1600,1600）成為納什均衡。?2011WangQiushi■合謀性壟斷產(chǎn)量(各為30)使得雙方利潤(rùn)都更高（1800,1800），但它不是一種納什均衡。46/100囚犯困境及其應(yīng)用以上幾個(gè)例子都有一個(gè)共同特征:合作性博弈的解優(yōu)越于非合作性博弈，但合作又不是納什均衡。在現(xiàn)實(shí)生活中畢竟有一些(短暫)合作成功的案例。《核武器不擴(kuò)散條件》、《有核國(guó)家不首先使用核武器條約》，甚至《兩國(guó)導(dǎo)彈互不對(duì)準(zhǔn)條約》。在現(xiàn)實(shí)生活中，有些囚犯就是不承認(rèn)犯罪，原因是這些博弈不是玩一次，而是在重復(fù)性地玩。?2011WangQiushi47/100重復(fù)性博弈在現(xiàn)實(shí)生活中,寡頭間關(guān)于彼此產(chǎn)量和價(jià)格的決策遠(yuǎn)不止一次,他們根據(jù)對(duì)手的行為在不斷地調(diào)整自己的產(chǎn)量和價(jià)格。這種不斷調(diào)整其策略并改變收益的博弈被稱為重復(fù)性博弈。當(dāng)囚犯困境的雙方只能進(jìn)行一次性博弈時(shí)，很難進(jìn)行有效的懲罰；而在重復(fù)性博弈時(shí)，有效的懲罰對(duì)方或者威脅對(duì)方就成為可能了。重復(fù)性博弈——擺脫囚犯困境。?2011WangQiushi48/100重復(fù)性博弈20世紀(jì)60年代進(jìn)行的實(shí)驗(yàn)性研究尋找到了一種簡(jiǎn)單的辦法——以牙還牙(tit-for-tat)策略——能夠有效地讓意欲違約者保持克制。以牙還牙策略是指在重復(fù)性博弈過程中某一選手對(duì)對(duì)方在前一期的合作同樣也采取合作的態(tài)度，對(duì)對(duì)方不合作則采取報(bào)復(fù)性的策略。在囚犯困境的重復(fù)性博弈中，大家都清楚地知道，合作的巨大收益提供了合作的正面激勵(lì)，對(duì)方的有效威脅和潛在傷害則提供了合作的負(fù)面激勵(lì)。?2011WangQiushi49/100重復(fù)性博弈：價(jià)格在固定價(jià)格的一次性博弈中，哪怕有約在先，雙方都保持壟斷價(jià)格同時(shí)分享市場(chǎng)需求，最后的均衡為各自采用競(jìng)爭(zhēng)性價(jià)格獲得零經(jīng)濟(jì)利潤(rùn)。但在重復(fù)性博弈中，情況有所不同。雙方知道，如果我降價(jià)，對(duì)方一定會(huì)降價(jià)，可能降得還更慘，對(duì)方要置我于死地而后快；如果我采取合作態(tài)度，對(duì)方很可能也會(huì)合作。為什么我不首先采取合作態(tài)度——把價(jià)格定在壟斷價(jià)格呢？?2011WangQiushi50/100重復(fù)性博弈：日常生活在公交車上，我們很少為素不相識(shí)的乘客買車票，因?yàn)檫@大凡是一次性博弈。而我們很可能為朋友買車票，我們與朋友的交往是重復(fù)性博弈。如果他是個(gè)吝嗇鬼，你可以選擇不與他同車等。在重復(fù)性博弈中，每個(gè)人都比較關(guān)心自己的聲譽(yù)，正是這種聲譽(yù)機(jī)制使得人們大量采取合作性策略。?2011WangQiushi51/100重復(fù)性博弈：軍事合作牙還牙策略在軍事上也有所表現(xiàn)。《有核國(guó)家首先不使用核武器的協(xié)議》到目前為止遵守得很好的原因就是這個(gè)以牙還牙策略。但是，《兩國(guó)導(dǎo)彈互不對(duì)準(zhǔn)協(xié)議》遵循得就會(huì)差一些，兩國(guó)關(guān)系一旦惡化，很有可能都在暗地里違約。?2011WangQiushi52/100重復(fù)性博弈：戰(zhàn)地醫(yī)院以牙還牙策略可以使戰(zhàn)地醫(yī)院享受愛情的浪漫。如果你專門轟炸對(duì)方的戰(zhàn)地醫(yī)院，你自己的醫(yī)院也就處于危險(xiǎn)之中。如果你打我的戰(zhàn)地醫(yī)院，我絕對(duì)要以牙還牙，報(bào)仇雪恨。以上這些對(duì)人類行為的觀察能夠幫助我們更好地認(rèn)識(shí)人類的行為方式。?2011WangQiushi53/100重復(fù)性博弈以牙還牙策略能否成功實(shí)施取決于博弈的次數(shù)。我們將重復(fù)性博弈按次數(shù)分類為有限次重復(fù)性博弈和無限次重復(fù)性博弈。有限次重復(fù)性博弈就是未來博弈的次數(shù)已經(jīng)確定的博弈，也被稱為固定次數(shù)的重復(fù)性博弈。無限次重復(fù)性博弈就是可以無限次數(shù)地、重復(fù)性地玩的一種博弈。?2011WangQiushi54/100有限次重復(fù)性博弈假定我們知道囚犯困境博弈只玩十次，現(xiàn)在就是最后一次，結(jié)果會(huì)如何呢？最后玩的那次博弈就像只玩一次的博弈。因此，兩者的結(jié)果應(yīng)該是相同的。第九輪會(huì)如何呢？我們已知在第十輪雙方都會(huì)承認(rèn)犯罪，為什么在第九輪就要合作呢？同理，第八輪、第七輪……都會(huì)出現(xiàn)只玩一次博弈的納什均衡。只要這一博弈重復(fù)的次數(shù)已知，每一輪的結(jié)果都是原納什均衡的結(jié)果。?2011WangQiushi55/100無限次重復(fù)性博弈以牙還牙策略只有在無限次重復(fù)性博弈中才能有效。歐佩克（OPEC）是一個(gè)合作比較成功的卡特爾組織，其原因之一就是無限次重復(fù)性博弈所隱含的各種懲罰機(jī)制。無限次重復(fù)性博弈所形成的合作均衡解并不是穩(wěn)定的，它較為容易被打破。?2011WangQiushi56/100序列博弈到目前為止所討論的博弈都是兩個(gè)選手要同時(shí)選擇策略。例如，在古諾模型中，兩家企業(yè)同時(shí)決定產(chǎn)量。在序列博弈中，選手們按先后順序進(jìn)行選擇。因此，序列博弈就是選手依次出招的博弈。斯坦伯格模型就是序列博弈的一個(gè)例子，一企業(yè)是領(lǐng)導(dǎo)者，率先決定其產(chǎn)量，另一企業(yè)是跟隨者，相應(yīng)決定其產(chǎn)量。?2011WangQiushi57/100序列博弈經(jīng)過分析,我們知道該博弈有兩個(gè)納什均衡:(上,左)和(下,右)。但是,我們將說明其中的一個(gè)均衡不大合理。?2011WangQiushi58/100擴(kuò)展型博弈圖11.1是表11.9中的博弈的擴(kuò)展型博弈，它有些像樹狀,故被稱為博弈樹。因此,用博弈樹表示的博弈被稱為擴(kuò)展型,用表格所表示的博弈被稱為常規(guī)型。?2011WangQiushi59/100擴(kuò)展型博弈?2011WangQiushi■如何求解擴(kuò)展型博弈的納什均衡呢？■假定A已經(jīng)選擇了上，B一定會(huì)選擇左，收益為（1，9）；■但如果A選擇下，B只好選擇右，收益為（2，1）。60/100擴(kuò)展型博弈?2011WangQiushiA是先動(dòng)者，在信息完備時(shí)，當(dāng)他看到博弈樹端點(diǎn)的收益情況后，他一定會(huì)選擇下。這樣（上，左）就不再是一個(gè)合理的均衡了。從擴(kuò)展型博弈看，（下，右）是唯一的納什均衡。61/100“先動(dòng)優(yōu)勢(shì)”A好開心，他享受到了“先動(dòng)優(yōu)勢(shì)”。一步為先，步步為先。再看看選手B，他有些可憐，他本可享受9，最后只好收益為1。他要看人家的臉色行事。?2011WangQiushi62/100“先動(dòng)優(yōu)勢(shì)”當(dāng)然，他可以向A發(fā)出威脅：如果A選下，他報(bào)復(fù)性地選左，兩人都同歸于盡，各自收益為零。如果A相信B會(huì)實(shí)施威脅，A只好選擇上，這樣，A的收益至少為1，而不是零。但這個(gè)威脅可信嗎？在一次性博弈中，一旦A選擇了下，B就沒辦法了，只有在0和1的收益中進(jìn)行理性選擇，只好有氣無力地選擇右啰。?2011WangQiushi63/100“先動(dòng)優(yōu)勢(shì)”現(xiàn)在我們這樣思考:在此博弈中，如果由于種種原因，B為先動(dòng)者，均衡點(diǎn)又何在呢？它是否證明了所謂“先動(dòng)優(yōu)勢(shì)”？如果上例中的B先動(dòng)，他會(huì)選擇左，然后A沒辦法，只好選擇上。先動(dòng)者得到了9的收益，后動(dòng)時(shí)他只得到1。這就說明了的確存在著所謂的“先動(dòng)優(yōu)勢(shì)”，即在序列博弈中，首先采取策略的選手通常得利更大。?2011WangQiushi64/100先動(dòng)優(yōu)勢(shì)：斯塔克伯格解用前一章學(xué)過的斯塔克伯格模型進(jìn)一步解釋先動(dòng)優(yōu)勢(shì)。需求曲線依然為

p=120-q，假定企業(yè)A為領(lǐng)導(dǎo)者，企業(yè)B為跟隨者，斯塔克伯格解為：q*A=60，q*B=30，p=30，πA=1800，πB=900?，F(xiàn)在以表11.8為基礎(chǔ)，再加上斯塔克伯格解，我們得到下表：?2011WangQiushi65/100先動(dòng)優(yōu)勢(shì)：斯塔克伯格解?2011WangQiushi此博弈是否存在納什均衡呢？如果A選30，B選40；如果A選40，B也選40；如果A選60，B選30。如果B選30，A選40；如果B選40，A也選40；如果B選60，A選30。這樣，兩個(gè)天真的跟隨者的產(chǎn)量（40，40）才是納什均衡。66/100先動(dòng)優(yōu)勢(shì)：斯塔克伯格解現(xiàn)假定A為領(lǐng)導(dǎo)者,B為跟隨者,把表11.10改為擴(kuò)展型的博弈樹。?2011WangQiushi■這三對(duì)策略都是子博弈的均衡。67/100先動(dòng)優(yōu)勢(shì)：斯塔克伯格解哪一個(gè)會(huì)成為整個(gè)博弈的均衡呢?既然我先動(dòng),我選60啦，我的利潤(rùn)最大。?2011WangQiushi■斯塔克爾伯格的解為(A,B)=(60,30)=（1800，900）。68/100幾個(gè)寡頭模型解的比較給定需求函數(shù)p=120-q，MC=0，E點(diǎn)（40，40）為古諾解SA（60，30）為A先動(dòng)的斯塔克伯格解，SB（30，60）為B先動(dòng)的斯塔克伯格解；C點(diǎn)（60，60）為競(jìng)爭(zhēng)性均衡；M點(diǎn)（30，30）為合謀性均衡。?2011WangQiushi69/100

進(jìn)入威懾

在一些寡頭行業(yè)，乃至壟斷行業(yè)中，總是存在著企業(yè)進(jìn)入的可能性。一般來說，誰都希望自己是個(gè)壟斷者。因此，現(xiàn)有壟斷者總是會(huì)采取一些措施威懾新企業(yè)的進(jìn)入。有些威脅是可信的，但也有些威脅是不可信的。潛在進(jìn)入者(定義為A)為先動(dòng)者,它有兩種選擇:進(jìn)入或放棄。現(xiàn)有壟斷者(定義為B)為后動(dòng)者,它有兩種策略:一是降低價(jià)格實(shí)施反擊,二是不反擊。?2011WangQiushi70/100進(jìn)入威懾?2011WangQiushi■如果A不進(jìn)入，B也不反擊，這是事件的起點(diǎn)，A和B的利潤(rùn)分別為0和8，這是最后一行。71/100進(jìn)入威懾?2011WangQiushi■如果A不進(jìn)入，B還要反擊，這是一組沒有實(shí)際意義的策略組合，利潤(rùn)也假定同前，這是倒數(shù)第二行。72/100進(jìn)入威懾?2011WangQiushi■如果A選擇進(jìn)入，B發(fā)出威脅信號(hào)，要以降價(jià)為手段反擊，（A,B）=(-1,4).73/100進(jìn)入威懾?2011WangQiushi■如果A選擇進(jìn)入，B不反擊的收益為6，大于反擊時(shí)的4，它的威脅是不可信的?！鲆虼?，A決定進(jìn)入。最后，均衡解為(A，B)=(進(jìn)入，不反擊)。74/100不可信威脅在現(xiàn)實(shí)生活中，不可信威脅還是比較多見的。比如“老師，你不讓我及格我無臉見朋友我就跳樓”，“你不嫁給我，我就跟你同歸于盡”，“如果你硬要嫁給那臭小子，你就不是我的女兒，我也不是你爹”，“如果你要侵略我的盟國(guó)，我就對(duì)你實(shí)施核打擊”等等。這里所講的“不可信”是在正常狀態(tài)對(duì)收益和成本比較所做出的一種理性判斷。但的確存在著一些非理性的人。這種人的威脅往往是成功的，可信的，這被稱為“非理性的理性”。?2011WangQiushi75/100愛的心語?2011WangQiushi如果你不買那件衣服給我，我就不給你燒飯。76/100可信的威脅在本例中，現(xiàn)有壟斷者如何實(shí)現(xiàn)可信的承諾呢？其中一種辦法就是在潛在進(jìn)入者尚未考慮進(jìn)入之前，就做好了擴(kuò)大生產(chǎn)能力的物資準(zhǔn)備，一旦有潛在進(jìn)入者進(jìn)入，它就可以以更低的平均成本生產(chǎn)更多的產(chǎn)量，為打價(jià)格戰(zhàn)做好了充分的準(zhǔn)備。此時(shí)，利潤(rùn)分配狀況會(huì)發(fā)生實(shí)質(zhì)變化。到時(shí)就別怪我不客氣。?2011WangQiushi77/100可信的威脅?2011WangQiushi78/100可信的威脅這種威脅可信嗎？如果A選擇進(jìn)入，B一定會(huì)選擇反擊。因?yàn)榉磽舻氖找鏋?，大于不反擊的收益2。一旦B反擊，A的利潤(rùn)為（-2）。如果A選擇不進(jìn)入，利潤(rùn)為零。那就不進(jìn)入吧！最后,A選擇放棄進(jìn)入,B威懾成功。生命的機(jī)會(huì)成本為零的人的威脅大多可行嗎？?2011WangQiushi79/100純粹策略在上述博弈中,我們所考察的所有策略都是有特定的策略或行動(dòng)的,例如,進(jìn)入或不進(jìn)入,承認(rèn)或否認(rèn),定價(jià)為3元或?yàn)?元等。這種選手采用特定策略的策略就是純粹策略。讓我們看一個(gè)“手心手背博弈”。?2011WangQiushi80/100手心手背博弈給定A出手心，B的最佳策略是手背；給定A出手背，B的最佳策略是手心。?2011WangQiushi■給定B出手心，A的最佳策略是手心；給定B出手背，A的最佳策略是手背?！鲞@里不存在任何一組策略使得兩人都同時(shí)滿足，因此，沒有納什均衡。（不存在兩個(gè)同時(shí)所指的箭頭）81/100混合策略在純粹策略中，選手要么選手心，要么選手背；而在混合策略中，選手可以50%的概率出手心，50%的概率出手背；或者其他什么概率。這種基于一組選擇的概率對(duì)其結(jié)果進(jìn)行隨機(jī)選擇的策略就是混合策略。盡管從純粹策略而言，手心手背博弈不存在著納什均衡；但從混合策略上講，它是存在著納什均衡的。?2011WangQiushi82/100混合策略如何求解混合策略的納什均衡呢？納什均衡的實(shí)質(zhì)是：它必然是一個(gè)選手對(duì)另外一個(gè)選手最佳策略的一種最佳反應(yīng)。如果是你的最佳策略，但不是我的，這不是納什均衡；如果是我的最佳策略，但不是你的，這也不是納什均衡。只有兩個(gè)同時(shí)為最佳策略才為納什均衡。在選手A看來，如果他選手心的概率幾乎為1，選手B幾乎選手背，但A對(duì)此的最佳反應(yīng)都是選手背，沒有均衡。同理，如果A選手心的概率幾乎為0（即更可能選手背），B的最佳選擇是手心，但A對(duì)此的最佳反應(yīng)又是手心，也沒有均衡。?2011WangQiushi83/100混合策略要使得這一博弈存在均衡的關(guān)鍵是A要選擇出手心的一個(gè)概率p（那么，出手背的概率便為1-p），使得對(duì)手B不會(huì)選擇一個(gè)確定性策略，而是對(duì)幾種選擇無差異。這樣，如果A以p的概率選手心，（1-p）的概率選手背，那么，B選手心的預(yù)期收益（或效用）等于：?2011WangQiushi■同理，B選手背的預(yù)期效用等于：84/100混合策略欲使B對(duì)選手心和手背的預(yù)期效用無差異，就必須使得以上兩式相等，1-2p=2p-1，

p=1/2■即A以1/2的概率各出手心與手背，B在選擇手心手背之間無差異。

如果p>1/2，B從選擇手背中得到更大的效用；

如果p<1/2，B從選擇手心中得到更大的效用。?2011WangQiushi85/100混合策略同理，選手B要選擇出手心的概率q（出手背的概率為1-q），使得A在兩種選擇中無差異。這樣，A選手心的預(yù)期效用UE（手心）要恰好等于選手背的預(yù)期效用UE（手背），即：?2011WangQiushi86/100混合策略即B以1/2的概率各出手心與手背，A在選擇手心和手背之間無差異。如果q>1/2，A從選擇手心中得到更大效用；如果q<1/2，A從選手背中得到更大效用。這樣，（這一策略組合p=1/2，q=1/2）便是混合策略的納什均衡。?2011WangQiushi87/100混合策略一般地說，一個(gè)2人和2種策略的博弈的收益矩陣以及相應(yīng)概率（p，q）可以寫成表11.12。?2011WangQiushi88/100混合策略混合策略的納什均衡必須滿足以下兩個(gè)條件：第一，A選擇S1A的概率為p時(shí)，使得B選擇S1B和S2B無差異：?2011WangQiushi第二，B選擇S1B的概率為q時(shí)，使得A選擇S1A和S2A無差異：89/100混合策略求解出p*和q*便是混合策略的納什均衡。我們?yōu)槭裁匆紤]求解混合策略的納什均衡呢？原因之一就是有些博弈的純粹策略沒有納什均衡，然而，一旦允許玩混合策略，每一個(gè)博弈至少有一個(gè)納什均衡。因此，混合策略對(duì)沒有純粹策略納什均衡的博弈提供了一種解。這個(gè)解是否合理取決于具體的博弈。在上述博弈中，手心手背各隨機(jī)地出，其概率為1/2，你的效用就實(shí)現(xiàn)了極大化。?2011WangQiushi90/100

性別沖突博弈

性別沖突博弈是既有純粹策略納什均衡，又有混合策略納什均衡的一個(gè)例子。丈夫和妻子很想在某一個(gè)周六晚上呆在一起，但對(duì)娛樂的偏好不盡相同。妻子喜歡聽音樂會(huì)，丈夫偏愛看足球賽，同時(shí)這對(duì)新婚夫婦都認(rèn)為在一起的效用比單獨(dú)行動(dòng)的效用更大。?2011WangQiushi91/100

性別沖突博弈

給定妻子看足球賽，丈夫的最佳選擇也是看足球賽，此時(shí)他最幸福，效用最大；給定妻子聽音樂會(huì)，丈夫的最佳選擇也是聽音樂會(huì)，因?yàn)樗憛捯蝗斯陋?dú)地看足球賽。?2011WangQiushi給定丈夫看足球賽，妻子的最佳選擇也是看足球賽（因?yàn)樗憛捯蝗斯陋?dú)地聽音樂會(huì)）；給定丈

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

秋石微觀經(jīng)濟(jì)學(xué)ch11

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

秋石微觀經(jīng)濟(jì)學(xué)ch11

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔