秋石微觀經(jīng)濟(jì)學(xué)ch11_第1頁
秋石微觀經(jīng)濟(jì)學(xué)ch11_第2頁
秋石微觀經(jīng)濟(jì)學(xué)ch11_第3頁
秋石微觀經(jīng)濟(jì)學(xué)ch11_第4頁
秋石微觀經(jīng)濟(jì)學(xué)ch11_第5頁
已閱讀5頁,還剩95頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.界定博弈論的一些基本概念;2.界定優(yōu)勢(shì)策略和納什均衡3.理解囚犯困境的含義及其應(yīng)用;4.推導(dǎo)重復(fù)性博弈的納什均衡;5.推導(dǎo)序列博弈的納什均衡;本章要點(diǎn)2學(xué)完本章,你將能夠

11博弈論基礎(chǔ)?2011WangQiushi2/100

6.理解為什么存在著先動(dòng)優(yōu)勢(shì);7.理解進(jìn)入威懾的可信性問題8.推導(dǎo)混合策略的納什均衡本章要點(diǎn)3學(xué)完本章,你將能夠

11博弈論基礎(chǔ)?2011WangQiushi3/100博弈就是一種比賽?2011WangQiushi比賽可以比快,也可以比慢4/100博弈論的基本概念博弈論(gametheory):又稱對(duì)策論,是用于分析策略性行為的一種工具。博弈的分析步驟第一步是尋找到某種有用的方式來描述這場(chǎng)博弈;第二步是尋找某種方式來預(yù)測(cè)結(jié)果。博弈的要素(1)選手;(2)規(guī)則;(3)策略;(4)收益;(5)結(jié)果。?2011WangQiushi5/100“剪子、石頭、布”的博弈該游戲有兩個(gè)選手(players),即參與此博弈的行為者;每個(gè)選手有三種策略(strategies)可供選擇:1出剪子;2出石頭;3出布。通俗點(diǎn)說,策略就是出招兒。該游戲有個(gè)規(guī)則:如果兩人出了相同的策略(如石頭對(duì)石頭等三種可能性),雙方為打平;如果兩人出手不一(如石頭對(duì)剪子等六種可能性),則可決定出勝負(fù),石頭贏剪子、剪子贏布、布贏石頭(即石頭砸剪子、剪子剪布、布包石頭)。?2011WangQiushi6/100“剪子、石頭、布”的博弈在游戲之前,雙方達(dá)成獎(jiǎng)懲協(xié)議:如贏家賺1元,輸家輸1元;或者贏家不喝酒,而輸家罰酒一杯等等。假如是輸贏1元的協(xié)議,表(11.1)就是這個(gè)游戲的收益表(Payofftable),把選手的收益狀況用表的形式描述,有時(shí)亦稱收益矩陣(Payoffmatrix)。?2011WangQiushi7/100收益表如果A出石頭,B也出石頭,各自收益均為0;?2011WangQiushi8/100收益表如果A出石頭,B出剪子,A的收益為1,B的收益為(-1);?2011WangQiushi9/100收益表如果A出石頭,B出布,A的收益為(-1),而B的收益為1。?2011WangQiushi余此類推10/100博弈論的基本概念一般來說,在每個(gè)小方框內(nèi),第一個(gè)數(shù)據(jù)為排在左邊的選手A的收益,第二個(gè)數(shù)據(jù)為排在上方的選手B的收益,中間用逗號(hào)隔開,即(A,B)=(0,0)等等。上表是一種常見的用表格描述一場(chǎng)博弈的方法,簡(jiǎn)稱常規(guī)式博弈(normalform)。同時(shí)博弈:要求選手同時(shí)出招的博弈。序列博弈:選手可以分先后時(shí)間出招的博弈。?2011WangQiushi11/100優(yōu)勢(shì)策略假定A、B兩人在玩一個(gè)十分簡(jiǎn)單的博弈,A在紙上可以寫“上”或“下”,B在另外一張紙上可以寫“左”或“右”,其收益矩陣如下表所示。?2011WangQiushi每個(gè)選手都是自我利益極大化者。12/100優(yōu)勢(shì)策略如果B選左,A選上的收益為1,而選下的收益為2,那么,A選下;?2011WangQiushi如果B選右,A在收益0與1之間選擇,A選擇下。13/100優(yōu)勢(shì)策略優(yōu)勢(shì)策略:無論對(duì)方選擇什么策略,該選手總是選擇某種固定的策略,又稱占優(yōu)策略。在本例中,無論B出什么招,A總是選下。因此,選下是A的優(yōu)勢(shì)策略。所謂優(yōu)勢(shì)策略,就是無論你出什么招,我就出這一招。選手B也有優(yōu)勢(shì)策略嗎??2011WangQiushi14/100優(yōu)勢(shì)策略給定A選上,B選左的收益為1,而選右的收益為2,那么,B選左;?2011WangQiushi如果A選下,B在收益0與1之間選擇,

B選左。15/100優(yōu)勢(shì)策略無論選手A如何選擇,B將始終選擇左。B選擇左是優(yōu)勢(shì)策略。在某個(gè)博弈中,如果每個(gè)選手都有一種優(yōu)勢(shì)策略,那么,兩個(gè)選手的優(yōu)勢(shì)策略組合就是這一博弈的均衡。所謂博弈的均衡就是會(huì)發(fā)生的一種結(jié)局。?2011WangQiushi16/100優(yōu)勢(shì)策略在上例中,(A,B)=(下,左)=(2,1)就是該博弈優(yōu)勢(shì)策略的均衡結(jié)果。?2011WangQiushi17/100優(yōu)勢(shì)策略大學(xué)成功秘訣:不管你如何,我始終把努力學(xué)習(xí)作為我的優(yōu)勢(shì)策略。?2011WangQiushi18/100納什均衡并非所有的博弈都存在優(yōu)勢(shì)策略均衡。?2011WangQiushi在以下改進(jìn)的博弈中,如果B選左,A就選上;如果B選右,A就選下;因此,A沒有優(yōu)勢(shì)策略。?19/100納什均衡同理可以分析,B也沒有優(yōu)勢(shì)策略。?2011WangQiushi?那么該博弈是否存在著均衡呢?20/100納什均衡優(yōu)勢(shì)策略均衡的要求也許太高了點(diǎn)。它要求無論B出什么招,A有一個(gè)優(yōu)勢(shì)策略;而且還要求無論A出什么招,B也有一個(gè)優(yōu)勢(shì)策略。這兩個(gè)優(yōu)勢(shì)策略的組合才構(gòu)成一個(gè)優(yōu)勢(shì)策略均衡。如果給定B的選擇,A的選擇是最佳的;同時(shí)給定A的選擇,B的選擇也是最佳的,那么,A和B的這組最佳選擇的組合就是納什均衡。?2011WangQiushi21/100約翰納什這是以1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主、美國(guó)經(jīng)濟(jì)學(xué)家約翰·納什的名字命名的。瑞典皇家科學(xué)院的公報(bào)稱:“納什由于引入了合作博弈與非合作博弈的區(qū)分,并為非合作博弈創(chuàng)立了一種均衡概念。這種均衡概念現(xiàn)在被命名為‘納什均衡’”?2011WangQiushi22/100約翰·納什納什均衡如果B選左,A的最佳選擇為上;?2011WangQiushi如果B選右,A的最佳選擇為下;如果A選上,B的最佳選擇為左;如果A選下,B的最佳選擇為右。兩箭頭所指就是納什均衡。23/100納什均衡給定B選左,A的最佳選擇為上;給定A選擇上,B的最佳選擇為左

;所以,(上,左)為納什均衡。?2011WangQiushi同理,(下,右)為另一組納什均衡。24/100優(yōu)勢(shì)均衡與納什均衡的聯(lián)系與區(qū)別優(yōu)勢(shì)策略:無論你做什么,我做我最好的;無論我做什么,你做你最好的。納什均衡:給定你的策略,我做我最好的;給定我的策略,你做你最好的。由此可見,優(yōu)勢(shì)策略均衡便是納什均衡的一種特例。通俗地講,如果是優(yōu)勢(shì)策略均衡,就一定是納什均衡;反之,則不然。?2011WangQiushi25/100囚犯困境有兩個(gè)嫌疑犯A和B因合伙偷竊自行車被警方捉拿歸案,且證據(jù)確鑿,可判他們每人各2年的徒刑。如果他倆都承認(rèn)犯有搶劫銀行罪,當(dāng)局就以兩罪并罰,各判10年監(jiān)禁;如果兩嫌疑犯都否認(rèn)犯有搶劫銀行罪,當(dāng)局則以偷自行車罪各判2年刑;如果一方承認(rèn)犯有搶劫銀行罪并提供有效證據(jù),而另一方拒絕承認(rèn)的話,當(dāng)局以“坦白從寬,抗拒從嚴(yán)”的原則,對(duì)承認(rèn)犯罪者不再追究偷竊自行車罪而釋放,而對(duì)否認(rèn)者三罪并罰(偷自行車、搶劫銀行和不誠(chéng)實(shí)罪)投監(jiān)20年。?2011WangQiushi26/100囚犯困境在這個(gè)游戲中,有兩個(gè)選手:囚犯A和B,每個(gè)選手均有兩種策略。承認(rèn)或否認(rèn)犯有搶劫銀行罪,有可能出現(xiàn)四種結(jié)果,其收益矩陣如表11.4所示。表中第一列,如果A和B同時(shí)承認(rèn)犯罪各坐牢10年;如果A否認(rèn)犯罪,而B承認(rèn)犯罪,A坐牢20年,而B卻可自由,表的第二列依此類推。?2011WangQiushi27/100囚犯困境對(duì)策論的一個(gè)中心問題如果我相信我的對(duì)手是理性的,我如何給定他的行為做出我的一個(gè)最優(yōu)決策,即給定對(duì)手行為,我如何做出最佳選擇。這個(gè)對(duì)策存在著均衡嗎??2011WangQiushi28/100囚犯困境給定對(duì)方承認(rèn),你也承認(rèn);給定對(duì)方否認(rèn),你承認(rèn)。(承認(rèn),承認(rèn))=(-10,-10)就是是優(yōu)勢(shì)策略均衡;于是(承認(rèn),承認(rèn))也是囚犯困境的納什均衡。?2011WangQiushi29/100囚犯困境為什么把它稱為“囚犯困境”

呢?(承認(rèn),承認(rèn))=(-10,-10)是納什均衡。如果他們都否認(rèn)犯罪,每人只需坐牢2年,而不是10年。(否認(rèn),否認(rèn))是一種帕累托效率,而(承認(rèn),承認(rèn))一種帕累托非效率。囚犯困境的“困惑”就在于為什么納什均衡并非是帕累托最優(yōu),而帕累托效率又不是納什均衡的結(jié)果呢??2011WangQiushi30/100囚犯困境及其應(yīng)用囚犯困境隱含著,合謀也許是一個(gè)更為有效的結(jié)果。囚犯困境是在向看不見手的挑戰(zhàn)。亞當(dāng).斯密的看不見的手理論認(rèn)為,市場(chǎng)經(jīng)濟(jì)中的每個(gè)人都在追求自我利益,但在追求自我利益的過程中同時(shí)也實(shí)現(xiàn)了社會(huì)的公共利益。囚犯困境卻揭示社會(huì)中的每個(gè)人都在追求自我利益,然而,人類社會(huì)的公共利益卻不可能實(shí)現(xiàn)。?2011WangQiushi31/100囚犯困境一種表現(xiàn)?2011WangQiushi32/100你急我急大家急急成一團(tuán)(請(qǐng)對(duì)下聯(lián))廣告困境做廣告導(dǎo)致需求增加,將激勵(lì)企業(yè)大量做廣告。其一,廣告之后,原本沒使用過本產(chǎn)品的人了解了產(chǎn)品,其中一部分可能購買之;其二,一些在使用其它同類品牌的人可能轉(zhuǎn)換過來消費(fèi)本產(chǎn)品?,F(xiàn)假定有兩家寡頭面臨著兩個(gè)選擇:(大量)做廣告和不(大量)做廣告。在現(xiàn)實(shí)經(jīng)濟(jì)中,他們要選擇做多少廣告的問題。為了簡(jiǎn)化起見,也不失一般性,就假定只有這兩種選擇。?2011WangQiushi33/100可口可樂與百事可樂之爭(zhēng)?2011WangQiushi34/100可口可樂與百事可樂之爭(zhēng)?2011WangQiushi35/100廣告困境之一無論A如何,B始終要做廣告,做廣告是B的優(yōu)勢(shì)策略;同理,做廣告也是A的優(yōu)勢(shì)策略。?2011WangQiushi■因此,(做廣告,做廣告)=(300,300)便成為此博弈的優(yōu)勢(shì)策略均衡,同時(shí)也是納什均衡。36/100廣告困境之二企業(yè)B的優(yōu)勢(shì)策略是做廣告,而企業(yè)A卻沒有優(yōu)勢(shì)策略。如果B做廣告,A最好跟著做廣告;但如果B不做廣告,A最好的策略也是不做廣告。?2011WangQiushi37/100廣告困境因此,(做廣告,做廣告)=(200,300)依然是納什均衡。?2011WangQiushi■但是,(不做廣告,不做廣告)=(500,600)卻是一種帕累托最優(yōu),但對(duì)這種非合作性博弈就偏偏實(shí)現(xiàn)不了。38/100禁播香煙廣告的法案1971年1月1日,美國(guó)眾議院通過了禁止在電視上播出香煙廣告的法案.但法案的制定者當(dāng)初并不知道它有利于解決香煙廣告困境問題。它使得美國(guó)煙草制造商們花在香煙上的廣告費(fèi)從此法案實(shí)施前一年的3億美元下降到了實(shí)施后一年的6000多萬美元,這其中大部分都轉(zhuǎn)化為煙草行業(yè)的利潤(rùn)了。?2011WangQiushi39/100研發(fā)博弈研發(fā)是指企業(yè)研究新技術(shù)、開發(fā)新產(chǎn)品的活動(dòng)?,F(xiàn)假定有兩個(gè)實(shí)力相當(dāng)?shù)墓杨^在兩大策略中選擇研發(fā)和不研發(fā),其假定的收益矩陣如表11.7所示。?2011WangQiushi40/100研發(fā)博弈寡頭A和寡頭B都存在著一種優(yōu)勢(shì)策略——研發(fā),所以,(研發(fā),研發(fā))成為本博弈中的納什均衡。其實(shí),雙方達(dá)到合謀都不研發(fā)或者少研發(fā)是一種帕累托改進(jìn)。?2011WangQiushi41/100

產(chǎn)量困境:古諾解

我們?cè)诘?0章介紹古諾模型時(shí)假設(shè),有兩家寡頭生產(chǎn)同質(zhì)的礦泉水,每家寡頭的邊際成本為零,其共同的市場(chǎng)需求曲線為:

p=120-q■企業(yè)A和企業(yè)B的數(shù)量反應(yīng)函數(shù)分別為:?2011WangQiushi■求解古諾解為:42/100

產(chǎn)量困境:古諾解

如果兩家組成卡特爾,像一個(gè)壟斷者那樣生產(chǎn),那么,MR=MC=0,平分市場(chǎng)后有:?2011WangQiushi■如果A生產(chǎn)30,但B違約生產(chǎn)40,這樣,p=50,πA=1500,πB

=2000,因此,B有違約的激勵(lì)?!鐾?如果B生產(chǎn)30,但A違約生產(chǎn)40,這樣p=50,πA=2000,πB=1500,因此,A有違約的激勵(lì)。43/100

產(chǎn)量困境:古諾解

把上述情況用利潤(rùn)矩陣描述成下表。?2011WangQiushi44/100

產(chǎn)量困境:古諾解

給定B合作,A違約,給定B違約,A違約;?2011WangQiushi給定A合作,B違約,給定A違約,B違約;45/100

產(chǎn)量困境:古諾解

(違約,違約)=(1600,1600)成為納什均衡。?2011WangQiushi■合謀性壟斷產(chǎn)量(各為30)使得雙方利潤(rùn)都更高(1800,1800),但它不是一種納什均衡。46/100囚犯困境及其應(yīng)用以上幾個(gè)例子都有一個(gè)共同特征:合作性博弈的解優(yōu)越于非合作性博弈,但合作又不是納什均衡。在現(xiàn)實(shí)生活中畢竟有一些(短暫)合作成功的案例。《核武器不擴(kuò)散條件》、《有核國(guó)家不首先使用核武器條約》,甚至《兩國(guó)導(dǎo)彈互不對(duì)準(zhǔn)條約》。在現(xiàn)實(shí)生活中,有些囚犯就是不承認(rèn)犯罪,原因是這些博弈不是玩一次,而是在重復(fù)性地玩。?2011WangQiushi47/100重復(fù)性博弈在現(xiàn)實(shí)生活中,寡頭間關(guān)于彼此產(chǎn)量和價(jià)格的決策遠(yuǎn)不止一次,他們根據(jù)對(duì)手的行為在不斷地調(diào)整自己的產(chǎn)量和價(jià)格。這種不斷調(diào)整其策略并改變收益的博弈被稱為重復(fù)性博弈。當(dāng)囚犯困境的雙方只能進(jìn)行一次性博弈時(shí),很難進(jìn)行有效的懲罰;而在重復(fù)性博弈時(shí),有效的懲罰對(duì)方或者威脅對(duì)方就成為可能了。重復(fù)性博弈——擺脫囚犯困境。?2011WangQiushi48/100重復(fù)性博弈20世紀(jì)60年代進(jìn)行的實(shí)驗(yàn)性研究尋找到了一種簡(jiǎn)單的辦法——以牙還牙(tit-for-tat)策略——能夠有效地讓意欲違約者保持克制。以牙還牙策略是指在重復(fù)性博弈過程中某一選手對(duì)對(duì)方在前一期的合作同樣也采取合作的態(tài)度,對(duì)對(duì)方不合作則采取報(bào)復(fù)性的策略。在囚犯困境的重復(fù)性博弈中,大家都清楚地知道,合作的巨大收益提供了合作的正面激勵(lì),對(duì)方的有效威脅和潛在傷害則提供了合作的負(fù)面激勵(lì)。?2011WangQiushi49/100重復(fù)性博弈:價(jià)格在固定價(jià)格的一次性博弈中,哪怕有約在先,雙方都保持壟斷價(jià)格同時(shí)分享市場(chǎng)需求,最后的均衡為各自采用競(jìng)爭(zhēng)性價(jià)格獲得零經(jīng)濟(jì)利潤(rùn)。但在重復(fù)性博弈中,情況有所不同。雙方知道,如果我降價(jià),對(duì)方一定會(huì)降價(jià),可能降得還更慘,對(duì)方要置我于死地而后快;如果我采取合作態(tài)度,對(duì)方很可能也會(huì)合作。為什么我不首先采取合作態(tài)度——把價(jià)格定在壟斷價(jià)格呢??2011WangQiushi50/100重復(fù)性博弈:日常生活在公交車上,我們很少為素不相識(shí)的乘客買車票,因?yàn)檫@大凡是一次性博弈。而我們很可能為朋友買車票,我們與朋友的交往是重復(fù)性博弈。如果他是個(gè)吝嗇鬼,你可以選擇不與他同車等。在重復(fù)性博弈中,每個(gè)人都比較關(guān)心自己的聲譽(yù),正是這種聲譽(yù)機(jī)制使得人們大量采取合作性策略。?2011WangQiushi51/100重復(fù)性博弈:軍事合作牙還牙策略在軍事上也有所表現(xiàn)。《有核國(guó)家首先不使用核武器的協(xié)議》到目前為止遵守得很好的原因就是這個(gè)以牙還牙策略。但是,《兩國(guó)導(dǎo)彈互不對(duì)準(zhǔn)協(xié)議》遵循得就會(huì)差一些,兩國(guó)關(guān)系一旦惡化,很有可能都在暗地里違約。?2011WangQiushi52/100重復(fù)性博弈:戰(zhàn)地醫(yī)院以牙還牙策略可以使戰(zhàn)地醫(yī)院享受愛情的浪漫。如果你專門轟炸對(duì)方的戰(zhàn)地醫(yī)院,你自己的醫(yī)院也就處于危險(xiǎn)之中。如果你打我的戰(zhàn)地醫(yī)院,我絕對(duì)要以牙還牙,報(bào)仇雪恨。以上這些對(duì)人類行為的觀察能夠幫助我們更好地認(rèn)識(shí)人類的行為方式。?2011WangQiushi53/100重復(fù)性博弈以牙還牙策略能否成功實(shí)施取決于博弈的次數(shù)。我們將重復(fù)性博弈按次數(shù)分類為有限次重復(fù)性博弈和無限次重復(fù)性博弈。有限次重復(fù)性博弈就是未來博弈的次數(shù)已經(jīng)確定的博弈,也被稱為固定次數(shù)的重復(fù)性博弈。無限次重復(fù)性博弈就是可以無限次數(shù)地、重復(fù)性地玩的一種博弈。?2011WangQiushi54/100有限次重復(fù)性博弈假定我們知道囚犯困境博弈只玩十次,現(xiàn)在就是最后一次,結(jié)果會(huì)如何呢?最后玩的那次博弈就像只玩一次的博弈。因此,兩者的結(jié)果應(yīng)該是相同的。第九輪會(huì)如何呢?我們已知在第十輪雙方都會(huì)承認(rèn)犯罪,為什么在第九輪就要合作呢?同理,第八輪、第七輪……都會(huì)出現(xiàn)只玩一次博弈的納什均衡。只要這一博弈重復(fù)的次數(shù)已知,每一輪的結(jié)果都是原納什均衡的結(jié)果。?2011WangQiushi55/100無限次重復(fù)性博弈以牙還牙策略只有在無限次重復(fù)性博弈中才能有效。歐佩克(OPEC)是一個(gè)合作比較成功的卡特爾組織,其原因之一就是無限次重復(fù)性博弈所隱含的各種懲罰機(jī)制。無限次重復(fù)性博弈所形成的合作均衡解并不是穩(wěn)定的,它較為容易被打破。?2011WangQiushi56/100序列博弈到目前為止所討論的博弈都是兩個(gè)選手要同時(shí)選擇策略。例如,在古諾模型中,兩家企業(yè)同時(shí)決定產(chǎn)量。在序列博弈中,選手們按先后順序進(jìn)行選擇。因此,序列博弈就是選手依次出招的博弈。斯坦伯格模型就是序列博弈的一個(gè)例子,一企業(yè)是領(lǐng)導(dǎo)者,率先決定其產(chǎn)量,另一企業(yè)是跟隨者,相應(yīng)決定其產(chǎn)量。?2011WangQiushi57/100序列博弈經(jīng)過分析,我們知道該博弈有兩個(gè)納什均衡:(上,左)和(下,右)。但是,我們將說明其中的一個(gè)均衡不大合理。?2011WangQiushi58/100擴(kuò)展型博弈圖11.1是表11.9中的博弈的擴(kuò)展型博弈,它有些像樹狀,故被稱為博弈樹。因此,用博弈樹表示的博弈被稱為擴(kuò)展型,用表格所表示的博弈被稱為常規(guī)型。?2011WangQiushi59/100擴(kuò)展型博弈?2011WangQiushi■如何求解擴(kuò)展型博弈的納什均衡呢?■假定A已經(jīng)選擇了上,B一定會(huì)選擇左,收益為(1,9);■但如果A選擇下,B只好選擇右,收益為(2,1)。60/100擴(kuò)展型博弈?2011WangQiushiA是先動(dòng)者,在信息完備時(shí),當(dāng)他看到博弈樹端點(diǎn)的收益情況后,他一定會(huì)選擇下。這樣(上,左)就不再是一個(gè)合理的均衡了。從擴(kuò)展型博弈看,(下,右)是唯一的納什均衡。61/100“先動(dòng)優(yōu)勢(shì)”A好開心,他享受到了“先動(dòng)優(yōu)勢(shì)”。一步為先,步步為先。再看看選手B,他有些可憐,他本可享受9,最后只好收益為1。他要看人家的臉色行事。?2011WangQiushi62/100“先動(dòng)優(yōu)勢(shì)”當(dāng)然,他可以向A發(fā)出威脅:如果A選下,他報(bào)復(fù)性地選左,兩人都同歸于盡,各自收益為零。如果A相信B會(huì)實(shí)施威脅,A只好選擇上,這樣,A的收益至少為1,而不是零。但這個(gè)威脅可信嗎?在一次性博弈中,一旦A選擇了下,B就沒辦法了,只有在0和1的收益中進(jìn)行理性選擇,只好有氣無力地選擇右啰。?2011WangQiushi63/100“先動(dòng)優(yōu)勢(shì)”現(xiàn)在我們這樣思考:在此博弈中,如果由于種種原因,B為先動(dòng)者,均衡點(diǎn)又何在呢?它是否證明了所謂“先動(dòng)優(yōu)勢(shì)”?如果上例中的B先動(dòng),他會(huì)選擇左,然后A沒辦法,只好選擇上。先動(dòng)者得到了9的收益,后動(dòng)時(shí)他只得到1。這就說明了的確存在著所謂的“先動(dòng)優(yōu)勢(shì)”,即在序列博弈中,首先采取策略的選手通常得利更大。?2011WangQiushi64/100先動(dòng)優(yōu)勢(shì):斯塔克伯格解用前一章學(xué)過的斯塔克伯格模型進(jìn)一步解釋先動(dòng)優(yōu)勢(shì)。需求曲線依然為

p=120-q,假定企業(yè)A為領(lǐng)導(dǎo)者,企業(yè)B為跟隨者,斯塔克伯格解為:q*A=60,q*B=30,p=30,πA=1800,πB=900?,F(xiàn)在以表11.8為基礎(chǔ),再加上斯塔克伯格解,我們得到下表:?2011WangQiushi65/100先動(dòng)優(yōu)勢(shì):斯塔克伯格解?2011WangQiushi此博弈是否存在納什均衡呢?如果A選30,B選40;如果A選40,B也選40;如果A選60,B選30。如果B選30,A選40;如果B選40,A也選40;如果B選60,A選30。這樣,兩個(gè)天真的跟隨者的產(chǎn)量(40,40)才是納什均衡。66/100先動(dòng)優(yōu)勢(shì):斯塔克伯格解現(xiàn)假定A為領(lǐng)導(dǎo)者,B為跟隨者,把表11.10改為擴(kuò)展型的博弈樹。?2011WangQiushi■這三對(duì)策略都是子博弈的均衡。67/100先動(dòng)優(yōu)勢(shì):斯塔克伯格解哪一個(gè)會(huì)成為整個(gè)博弈的均衡呢?既然我先動(dòng),我選60啦,我的利潤(rùn)最大。?2011WangQiushi■斯塔克爾伯格的解為(A,B)=(60,30)=(1800,900)。68/100幾個(gè)寡頭模型解的比較給定需求函數(shù)p=120-q,MC=0,E點(diǎn)(40,40)為古諾解SA(60,30)為A先動(dòng)的斯塔克伯格解,SB(30,60)為B先動(dòng)的斯塔克伯格解;C點(diǎn)(60,60)為競(jìng)爭(zhēng)性均衡;M點(diǎn)(30,30)為合謀性均衡。?2011WangQiushi69/100

進(jìn)入威懾

在一些寡頭行業(yè),乃至壟斷行業(yè)中,總是存在著企業(yè)進(jìn)入的可能性。一般來說,誰都希望自己是個(gè)壟斷者。因此,現(xiàn)有壟斷者總是會(huì)采取一些措施威懾新企業(yè)的進(jìn)入。有些威脅是可信的,但也有些威脅是不可信的。潛在進(jìn)入者(定義為A)為先動(dòng)者,它有兩種選擇:進(jìn)入或放棄。現(xiàn)有壟斷者(定義為B)為后動(dòng)者,它有兩種策略:一是降低價(jià)格實(shí)施反擊,二是不反擊。?2011WangQiushi70/100進(jìn)入威懾?2011WangQiushi■如果A不進(jìn)入,B也不反擊,這是事件的起點(diǎn),A和B的利潤(rùn)分別為0和8,這是最后一行。71/100進(jìn)入威懾?2011WangQiushi■如果A不進(jìn)入,B還要反擊,這是一組沒有實(shí)際意義的策略組合,利潤(rùn)也假定同前,這是倒數(shù)第二行。72/100進(jìn)入威懾?2011WangQiushi■如果A選擇進(jìn)入,B發(fā)出威脅信號(hào),要以降價(jià)為手段反擊,(A,B)=(-1,4).73/100進(jìn)入威懾?2011WangQiushi■如果A選擇進(jìn)入,B不反擊的收益為6,大于反擊時(shí)的4,它的威脅是不可信的?!鲆虼?,A決定進(jìn)入。最后,均衡解為(A,B)=(進(jìn)入,不反擊)。74/100不可信威脅在現(xiàn)實(shí)生活中,不可信威脅還是比較多見的。比如“老師,你不讓我及格我無臉見朋友我就跳樓”,“你不嫁給我,我就跟你同歸于盡”,“如果你硬要嫁給那臭小子,你就不是我的女兒,我也不是你爹”,“如果你要侵略我的盟國(guó),我就對(duì)你實(shí)施核打擊”等等。這里所講的“不可信”是在正常狀態(tài)對(duì)收益和成本比較所做出的一種理性判斷。但的確存在著一些非理性的人。這種人的威脅往往是成功的,可信的,這被稱為“非理性的理性”。?2011WangQiushi75/100愛的心語?2011WangQiushi如果你不買那件衣服給我,我就不給你燒飯。76/100可信的威脅在本例中,現(xiàn)有壟斷者如何實(shí)現(xiàn)可信的承諾呢?其中一種辦法就是在潛在進(jìn)入者尚未考慮進(jìn)入之前,就做好了擴(kuò)大生產(chǎn)能力的物資準(zhǔn)備,一旦有潛在進(jìn)入者進(jìn)入,它就可以以更低的平均成本生產(chǎn)更多的產(chǎn)量,為打價(jià)格戰(zhàn)做好了充分的準(zhǔn)備。此時(shí),利潤(rùn)分配狀況會(huì)發(fā)生實(shí)質(zhì)變化。到時(shí)就別怪我不客氣。?2011WangQiushi77/100可信的威脅?2011WangQiushi78/100可信的威脅這種威脅可信嗎?如果A選擇進(jìn)入,B一定會(huì)選擇反擊。因?yàn)榉磽舻氖找鏋?,大于不反擊的收益2。一旦B反擊,A的利潤(rùn)為(-2)。如果A選擇不進(jìn)入,利潤(rùn)為零。那就不進(jìn)入吧!最后,A選擇放棄進(jìn)入,B威懾成功。生命的機(jī)會(huì)成本為零的人的威脅大多可行嗎??2011WangQiushi79/100純粹策略在上述博弈中,我們所考察的所有策略都是有特定的策略或行動(dòng)的,例如,進(jìn)入或不進(jìn)入,承認(rèn)或否認(rèn),定價(jià)為3元或?yàn)?元等。這種選手采用特定策略的策略就是純粹策略。讓我們看一個(gè)“手心手背博弈”。?2011WangQiushi80/100手心手背博弈給定A出手心,B的最佳策略是手背;給定A出手背,B的最佳策略是手心。?2011WangQiushi■給定B出手心,A的最佳策略是手心;給定B出手背,A的最佳策略是手背?!鲞@里不存在任何一組策略使得兩人都同時(shí)滿足,因此,沒有納什均衡。(不存在兩個(gè)同時(shí)所指的箭頭)81/100混合策略在純粹策略中,選手要么選手心,要么選手背;而在混合策略中,選手可以50%的概率出手心,50%的概率出手背;或者其他什么概率。這種基于一組選擇的概率對(duì)其結(jié)果進(jìn)行隨機(jī)選擇的策略就是混合策略。盡管從純粹策略而言,手心手背博弈不存在著納什均衡;但從混合策略上講,它是存在著納什均衡的。?2011WangQiushi82/100混合策略如何求解混合策略的納什均衡呢?納什均衡的實(shí)質(zhì)是:它必然是一個(gè)選手對(duì)另外一個(gè)選手最佳策略的一種最佳反應(yīng)。如果是你的最佳策略,但不是我的,這不是納什均衡;如果是我的最佳策略,但不是你的,這也不是納什均衡。只有兩個(gè)同時(shí)為最佳策略才為納什均衡。在選手A看來,如果他選手心的概率幾乎為1,選手B幾乎選手背,但A對(duì)此的最佳反應(yīng)都是選手背,沒有均衡。同理,如果A選手心的概率幾乎為0(即更可能選手背),B的最佳選擇是手心,但A對(duì)此的最佳反應(yīng)又是手心,也沒有均衡。?2011WangQiushi83/100混合策略要使得這一博弈存在均衡的關(guān)鍵是A要選擇出手心的一個(gè)概率p(那么,出手背的概率便為1-p),使得對(duì)手B不會(huì)選擇一個(gè)確定性策略,而是對(duì)幾種選擇無差異。這樣,如果A以p的概率選手心,(1-p)的概率選手背,那么,B選手心的預(yù)期收益(或效用)等于:?2011WangQiushi■同理,B選手背的預(yù)期效用等于:84/100混合策略欲使B對(duì)選手心和手背的預(yù)期效用無差異,就必須使得以上兩式相等,1-2p=2p-1,

p=1/2■即A以1/2的概率各出手心與手背,B在選擇手心手背之間無差異。

如果p>1/2,B從選擇手背中得到更大的效用;

如果p<1/2,B從選擇手心中得到更大的效用。?2011WangQiushi85/100混合策略同理,選手B要選擇出手心的概率q(出手背的概率為1-q),使得A在兩種選擇中無差異。這樣,A選手心的預(yù)期效用UE(手心)要恰好等于選手背的預(yù)期效用UE(手背),即:?2011WangQiushi86/100混合策略即B以1/2的概率各出手心與手背,A在選擇手心和手背之間無差異。如果q>1/2,A從選擇手心中得到更大效用;如果q<1/2,A從選手背中得到更大效用。這樣,(這一策略組合p=1/2,q=1/2)便是混合策略的納什均衡。?2011WangQiushi87/100混合策略一般地說,一個(gè)2人和2種策略的博弈的收益矩陣以及相應(yīng)概率(p,q)可以寫成表11.12。?2011WangQiushi88/100混合策略混合策略的納什均衡必須滿足以下兩個(gè)條件:第一,A選擇S1A的概率為p時(shí),使得B選擇S1B和S2B無差異:?2011WangQiushi第二,B選擇S1B的概率為q時(shí),使得A選擇S1A和S2A無差異:89/100混合策略求解出p*和q*便是混合策略的納什均衡。我們?yōu)槭裁匆紤]求解混合策略的納什均衡呢?原因之一就是有些博弈的純粹策略沒有納什均衡,然而,一旦允許玩混合策略,每一個(gè)博弈至少有一個(gè)納什均衡。因此,混合策略對(duì)沒有純粹策略納什均衡的博弈提供了一種解。這個(gè)解是否合理取決于具體的博弈。在上述博弈中,手心手背各隨機(jī)地出,其概率為1/2,你的效用就實(shí)現(xiàn)了極大化。?2011WangQiushi90/100

性別沖突博弈

性別沖突博弈是既有純粹策略納什均衡,又有混合策略納什均衡的一個(gè)例子。丈夫和妻子很想在某一個(gè)周六晚上呆在一起,但對(duì)娛樂的偏好不盡相同。妻子喜歡聽音樂會(huì),丈夫偏愛看足球賽,同時(shí)這對(duì)新婚夫婦都認(rèn)為在一起的效用比單獨(dú)行動(dòng)的效用更大。?2011WangQiushi91/100

性別沖突博弈

給定妻子看足球賽,丈夫的最佳選擇也是看足球賽,此時(shí)他最幸福,效用最大;給定妻子聽音樂會(huì),丈夫的最佳選擇也是聽音樂會(huì),因?yàn)樗憛捯蝗斯陋?dú)地看足球賽。?2011WangQiushi給定丈夫看足球賽,妻子的最佳選擇也是看足球賽(因?yàn)樗憛捯蝗斯陋?dú)地聽音樂會(huì));給定丈

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論