第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf

上傳人：a*** IP屬地：河南上傳時(shí)間：2020-03-14 格式：PDF 頁數(shù)：18 大?。?02.86KB 積分：18 舉報(bào) 版權(quán)申訴

第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf_第2頁

第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf_第3頁

第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf_第4頁

第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf_第5頁

已閱讀5頁，還剩13頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

28 博弈理論曹乾東南大學(xué) caoqianseu 1 Intermediate Microeconomics A Modern Approach 8th Edition Hal R Varian 范里安中級(jí)微觀經(jīng)濟(jì)學(xué) 現(xiàn)代方法第第第第 8 版版版版完美中文翻譯版第第第第 28 章章章章博弈論博弈論博弈論博弈論含全部習(xí)題詳細(xì)解答含全部習(xí)題詳細(xì)解答含全部習(xí)題詳細(xì)解答含全部習(xí)題詳細(xì)解答曹乾譯東南大學(xué) caoqianseu 28 博弈理論曹乾東南大學(xué) caoqianseu 2 28 博弈理論我們?cè)谏弦徽玛U述的寡頭理論是企業(yè)間策略性互動(dòng)的經(jīng)典經(jīng)濟(jì)理論解釋但這只是冰山一角經(jīng)濟(jì)行為人 agents 的策略性互動(dòng)有多種方式經(jīng)濟(jì)學(xué)家借助博弈理論 game theory 這個(gè)工具已研究了很多種策略性互動(dòng)的行為博弈理論關(guān)注的是策略性互動(dòng)的一般分析人們可使用博弈理論研究室內(nèi)游戲 parlor games 政治協(xié)商和經(jīng)濟(jì)行為一在本章我們將簡(jiǎn)要分析這一迷人的學(xué)科目的是讓你感受一下它是如何運(yùn)行的以及讓你初步知道如何使用博弈理論分析寡頭市場(chǎng)中的經(jīng)濟(jì)行為 28 1 博弈的收益矩陣策略性互動(dòng)可能涉及很多選手和很多策略但是我們僅限于分析兩個(gè)選手之間的博弈而且限于分析策略的數(shù)量有限的情形這樣做的好處是可以用收益矩陣 payoff matrix 描述博弈最好舉例進(jìn)行分析假設(shè)兩人玩一種簡(jiǎn)單的游戲選手 A 在紙上寫出上或下與此同時(shí) 選手 B 獨(dú) 立地寫出左或右在兩人寫好后經(jīng)過分析將他們的收益標(biāo)記于表 28 1 中若 A 選上且 B 選左我們看矩陣的左上角的小方格在該小方格中 A 的收益是第一個(gè)數(shù) B 的收益是第二個(gè)數(shù) 類似地如果 A 選下 B 選右則 A 得到收益為 1 B 得到的收益為 0 表 28 1 一個(gè)博弈的收益矩陣選手 A 有兩個(gè)策略上或下這些策略可以代表類似提高價(jià)格或降低價(jià)格的經(jīng)濟(jì)選擇或者它們可以代表類似宣戰(zhàn) 或不宣戰(zhàn) 的政治選擇博弈的收益矩陣表明了對(duì)于每個(gè)選定的策略組合每個(gè)選手得到的收益一室內(nèi)游戲 parlor games 是指一伙人在室內(nèi) indoors 參與的游戲在維多利亞時(shí)代的英國(guó)和美國(guó) 室內(nèi)游戲在中上流階級(jí)非常盛行譯者注 28 博弈理論曹乾東南大學(xué) caoqianseu 3 這類博弈的結(jié)果是什么樣的表 28 1 表示的這種博弈有一個(gè)很簡(jiǎn)單的解從選手 A 的觀點(diǎn)看選擇下總是比選擇上更好因?yàn)檫x擇下的收益 2 或 1 總是大于選擇上的相應(yīng) 收益 1 或 0 類似地對(duì)于 B 來說選擇左比總是比選擇右更好因?yàn)?2 或 1 相應(yīng)比 1 或 0 大因此我們可以預(yù)期均衡策略是 A 選下 B 選左這種情形下我們得到了一個(gè)占優(yōu)勢(shì)的策略或者簡(jiǎn)稱占優(yōu)策略 dominant strategy 一每個(gè)選手只有唯一一個(gè)最優(yōu)選擇不論對(duì)方怎么改變策略例如不論 B 怎么選擇若 A 選下 A 的收益總是大于選擇上的收益因此 A 自然會(huì)選擇下類似地不論 A 怎么選擇 B 選擇左的收益更高因此這些選擇比其他選擇好這樣我們就得到了一個(gè)占優(yōu)策略均衡解如果在一個(gè)博弈中每個(gè)選手都有一個(gè)占優(yōu)策略我們可以預(yù)測(cè)占優(yōu)策略組合就是該博弈的均衡結(jié)果這是因?yàn)檎純?yōu)策略是指不論對(duì)方如何選擇你選擇的這個(gè)策略都是最優(yōu) 的在這個(gè)例子中我們可以預(yù)期均衡結(jié)果為 A 選下均衡收益為 2 B 選左均衡收益為 1 28 2 納什均衡占優(yōu)策略均衡很好分析可惜占優(yōu)策略均衡不是那么常見例如表 28 2 表示的博弈不存在占優(yōu)策略均衡解在該博弈中 B 選左時(shí) A 的收益為 2 或 0 B 選右時(shí) A 的收益為 0 或 1 這表示 B 選左時(shí) A 會(huì)選上 B 選右時(shí) A 會(huì)選下因此 A 的最優(yōu)選擇取決于他認(rèn)為 B 會(huì)怎么選表 28 1 一個(gè)納什均衡然而也許占優(yōu)策略均衡要求太苛刻因?yàn)樗髮?duì)于 B 的所有所有所有所有選擇 A 的選擇都是最優(yōu)的現(xiàn)在我們不這么要求我們只要求對(duì)于 B 的最優(yōu)最優(yōu)最優(yōu)最優(yōu) 選擇來說 A 的選擇是最優(yōu)的即可因?yàn)槿绻?B 是一個(gè)理性選手他只會(huì)選擇最優(yōu)的策略當(dāng)然 B 的最優(yōu)策略也取決于 A 的選擇一有時(shí)也翻譯為優(yōu)勢(shì)策略在翻譯過程中這兩種譯法我都使用了譯者注 28 博弈理論曹乾東南大學(xué) caoqianseu 4 如果給定 B 的選擇 A 的選擇為最優(yōu) 而且給定 A 的選擇 B 的選擇也為最優(yōu) 那么我們將 A 和 B 此時(shí)選擇的策略稱為一個(gè)納什均衡 Nash equilibrium 一記住當(dāng)每個(gè)選手在選擇自己的策略時(shí) 都不知道對(duì)方選擇哪一個(gè)策略但是他可以猜測(cè)對(duì)方選擇的策略一個(gè)納什均衡可以看成一對(duì)預(yù)期選擇這樣的選擇要能使得一旦對(duì)方的選擇展現(xiàn)后選手都不再改變自己的行為在表 28 2 代表的博弈中策略上左是一個(gè)納什均衡為了證明這一點(diǎn) 先分析 B 的行為假設(shè) A 選擇上那么 B 的最優(yōu)選擇是選擇左這是因?yàn)樗x擇左的收益為 1 而選擇右的收益為 0 再來分析 A 的行為如果 B 選擇左那么 A 的最優(yōu)選擇是選擇上因?yàn)檫x擇上的收益為 2 而選擇下的收益為 0 因此如果 A 選擇上 B 的最優(yōu)選擇是選擇左而如果 B 選擇左那么 A 的最優(yōu)選擇是選擇上這樣我們就得到了一個(gè)納什均衡給定對(duì)方的選擇每個(gè)選手都作出了最優(yōu)選擇納什均衡是上一章介紹的古諾均衡的一般形式在古諾均衡中選擇為產(chǎn)量水平每個(gè)企業(yè)在選擇它的產(chǎn)量水平時(shí) 都假定對(duì)方的選擇是既定的每個(gè)企業(yè)在做選擇時(shí)都假設(shè)對(duì) 方選擇原來的產(chǎn)量也就是說按照以前選擇的策略進(jìn)行生產(chǎn) 在這種情形下它選擇的產(chǎn)量應(yīng) 該使自己的利潤(rùn)最大化給定對(duì)方的行為每個(gè)企業(yè)的利潤(rùn)都實(shí)現(xiàn)了最大化這就是一個(gè)古諾均衡按照納什均衡的定義顯然古諾均衡是一種納什均衡納什均衡的概念有一定的內(nèi)在邏輯不幸地是該均衡也存在一些問題首先一個(gè) 博弈可能有多個(gè)納什均衡事實(shí)上在表 28 2 中選擇下右也是一個(gè)納什均衡你可以按照我們上面介紹的推理方法進(jìn)行分析當(dāng)然下面這種證明方法也可行注意到這個(gè)博弈結(jié)構(gòu)是對(duì)稱的 B 在一種結(jié)果的收益等于 A 在另一結(jié)果中的收益因此我們證明了上左是一個(gè)納什均衡這也意味著我們也證明了下右也是一個(gè)納什均衡表 28 3 不存在純策略納什均衡解的一個(gè)博弈納什均衡概念的第二個(gè)問題是有些博弈不存在我們上面描述的納什均衡解例如考慮一約翰納什是一位美國(guó)數(shù)學(xué)家他在 1951 年提出了這個(gè)博弈理論中的基本概念 1994 年他和另兩外博弈理論學(xué)者共同獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng) 2002 電影美麗心靈大致以納什的生活為藍(lán)本該電影獲得奧斯卡最佳電影獎(jiǎng) 28 博弈理論曹乾東南大學(xué) caoqianseu 5 表 28 3 該博弈不存在我們上面描述的那種納什均衡解如果 A 選擇上則 B 選擇左但是若 B 選擇左則 A 選擇下類似地若 A 選擇下則 B 選擇右但是若 B 選擇右則 A 選擇上 28 3 混合策略然而如果我們擴(kuò)大策略的定義我們可以為表 28 3 的博弈找到一個(gè)新類型的納什均衡解我們?cè)谇懊娴乃悸菲鋵?shí)是一直認(rèn)為每個(gè)選手在選擇策略時(shí)能做到一勞永逸也就是說每個(gè)選手作出選擇后就堅(jiān)持這個(gè)選擇這種情形下每個(gè)選手的策略都為一個(gè)純策略 a pure strategy 另外一種思路是我們?cè)试S選手將他們的策略隨機(jī)化隨機(jī)化隨機(jī)化隨機(jī)化也就是說對(duì)每個(gè)選擇都賦予一個(gè)概率值而且按照這些概率選擇策略例如 A 以概率 50 選擇上以概率 50 選擇下而 B 以概率 50 選擇左以概率 50 選擇右這種情形下每個(gè)選手的策略都為一個(gè)混合策略 a mixed strategy 如果 A 和 B 都采用上述混合策略即每個(gè)選手以相等的概率選擇他的兩個(gè)策略中的一個(gè) 那么收益矩陣每個(gè)小方格中的收益出現(xiàn)的概率都為 1 4 因此 A 的平均收益為 0 B 的平均收益為 1 2 混合策略中的納什均衡是指均衡時(shí) 給定對(duì)方選擇策略的概率每個(gè)選手選擇的含有概率的策略都是最優(yōu)的可以證明對(duì)于本章分析的這類博弈總是至少存在一個(gè)混合策略納什均衡解因?yàn)榛旌?策略的納什均衡解總是存在的也因?yàn)樵摳拍罹哂幸欢ǖ膬?nèi)在合理性所以它成為分析博弈行為的一個(gè)非常流行的工具在表 28 3 的例子中可以證明如果 A 以 3 4 的概率選擇上以 1 4 的概率選擇下而且 B 以 1 2 的概率選擇左以 1 2 的概率選擇右那么這些策略就構(gòu)成了一個(gè)納什均衡例子剪刀石頭和布我們對(duì)混合策略說得已經(jīng)夠多了現(xiàn)在來看一個(gè)重要例子這就是我們都知道的游戲剪刀石頭和布在這個(gè)游戲中每個(gè)選手同時(shí)選擇出示拳頭石頭手掌布或兩個(gè) 手指剪刀游戲的規(guī)則為石頭砸爛剪刀剪刀剪破布布包住石頭在人類歷史上該游戲百玩不厭甚至還有一個(gè)稱為 RPS 協(xié)會(huì)的專業(yè)團(tuán)體專門推廣該游戲它有自己的網(wǎng)站它還提供了 2003 年在加拿大多倫多舉行的錦標(biāo)賽的紀(jì)錄片當(dāng)然博弈論專家認(rèn)識(shí)到這個(gè)游戲中的均衡策略是隨機(jī)選擇這三個(gè)選項(xiàng)中的一種但是人類并不必然擅長(zhǎng)選擇完全隨機(jī)的選項(xiàng) 如果你在某種程度上能預(yù)測(cè)到對(duì)手的選擇你在選擇策略時(shí)將占有一定的優(yōu)勢(shì) 28 博弈理論曹乾東南大學(xué) caoqianseu 6 紐約時(shí)報(bào)記者詹妮弗 8 李曾經(jīng)半開玩笑地說道心理學(xué)是至高無上的在她的文章中她寫道大多數(shù)人在無防備的情況下都有自己偏好的選擇這反映了他們的性格布代表著優(yōu)雅甚至被動(dòng)的選擇因此文學(xué)人士和記者在玩這個(gè)游戲時(shí)一般會(huì)選擇布一經(jīng)濟(jì)學(xué)家在玩這個(gè)游戲時(shí)喜歡出哪一項(xiàng)呢也許是剪刀因?yàn)槲覀兿Ｍ舫鲇绊懭藗?行為的決定因素經(jīng)濟(jì)學(xué)家出剪刀時(shí) 你是否應(yīng)該出石頭呢也許但是我并不總是出剪刀 28 4 囚犯的兩難問題博弈納什均衡解的另外一個(gè)問題是它不必然導(dǎo)致帕累托有效率的結(jié)果例如考慮表 28 4 中的博弈這個(gè)博弈稱為囚犯的兩難或囚犯的困境 prisoner s dilemma 最初這個(gè)模型是這樣的警察將合伙犯罪的兩個(gè)人分別關(guān)押在單獨(dú)的囚房?jī)?nèi) 分別審訊每個(gè)罪犯的選擇為可以選擇認(rèn)罪從而供出來了他的合伙人也可以選擇不認(rèn)罪如果只有一個(gè)罪犯認(rèn)罪那么他可以被釋放而另外一個(gè)罪犯會(huì)受到嚴(yán)懲坐牢 6 個(gè)月如果兩個(gè)罪犯都不認(rèn)罪那么根據(jù)法律每人被監(jiān)禁 1 個(gè)月如果兩個(gè)人都認(rèn)罪那么每個(gè)人被監(jiān)禁 3 個(gè)月這個(gè)博弈的收益矩陣可用表 28 4 表示每個(gè)小方格中的元素表示每個(gè)罪犯對(duì)各種結(jié)果的效用評(píng)價(jià) 為簡(jiǎn)單起見我們用負(fù)數(shù)表示他們的效用這個(gè)效用取決于坐牢期限時(shí)間越長(zhǎng) 效用越小圖 28 4 囚犯的兩難問題我們先來分析 A 的選擇如果 B 選擇否認(rèn) 那么 A 最好的選擇是認(rèn)罪因?yàn)檫@樣 A 就會(huì)被釋放類似地如果 B 選擇認(rèn)罪那么 A 最好的選擇也是認(rèn)罪因?yàn)檫@樣 A 會(huì)被監(jiān)禁 3 個(gè)月而不是 6 個(gè)月因此不論不論不論不論 B 怎么選擇 A 最好的選擇是認(rèn)罪一 Jennifer 8 Lee Rock Paper Scissors High Drama in the Tournament Ring New York Times September 5 2004 以下為譯者注注意該記者的名字中含有數(shù)字 8 據(jù)說她是個(gè)中國(guó)通認(rèn)為 8 這個(gè)數(shù)字很吉利加 8 在名字中讓她的名字很特別 28 博弈理論曹乾東南大學(xué) caoqianseu 7 B 的選擇可以類似推理 B 的最優(yōu)選擇也是認(rèn)罪因此該博弈的唯一納什均衡是兩個(gè) 罪犯都認(rèn)罪事實(shí)上兩個(gè)罪犯都認(rèn)罪不僅是一個(gè)納什均衡而且是一個(gè)占優(yōu)策略均衡因為每個(gè)罪犯的最優(yōu)選擇和對(duì)方的選擇無關(guān) 但是如果他們咬緊牙關(guān)拒不認(rèn)罪那么他們的狀況會(huì)變好如果這兩個(gè)人相信對(duì)方不會(huì)認(rèn)罪對(duì)方的確不會(huì)認(rèn)罪那么這種情形下每個(gè)人的收益均為 1 這會(huì)使得每個(gè)人的狀況變得更好策略否認(rèn) 否認(rèn) 是帕累托有效率的因?yàn)橐巡淮嬖谀苁拐邇蓚€(gè)人的狀況都變好的策略策略認(rèn)罪認(rèn)罪是帕累托無效率的問題在于這兩個(gè)罪犯無法協(xié)調(diào)彼此的行為如果他們彼此信任則他們的狀況都會(huì)變得更好囚犯兩難模型可應(yīng)用于廣泛的經(jīng)濟(jì)和政治現(xiàn)象例如軍備控制問題我們可以將囚犯困境中的策略認(rèn)罪看為使用新導(dǎo)彈將不認(rèn)罪看成不使用導(dǎo)彈注意該情形下表 28 4 表示的收益仍然是合理的如果我的對(duì)手使用導(dǎo)彈我當(dāng)然希望是使用導(dǎo)彈盡管我們雙方最好的策略都是不使用導(dǎo)彈但是如果不能達(dá)成具有約束力的協(xié)議我們雙方都會(huì)使用導(dǎo)彈結(jié)果我們的狀況變差了卡特爾成員欺騙問題也是一個(gè)好例子現(xiàn)在將策略認(rèn)罪看成生產(chǎn)比你的份額更多的產(chǎn) 量將不認(rèn)罪看成堅(jiān)持生產(chǎn)原來的份額如果你認(rèn)為其他的企業(yè)將堅(jiān)持它們各自的份額那么多生產(chǎn)對(duì)你是有利的如果你認(rèn)為其他企業(yè)會(huì)多生產(chǎn) 那么你可能也多生產(chǎn) 囚犯的難題問題讓人們激烈辯論到底怎樣進(jìn)行博弈才是正確的或者更準(zhǔn)確地說參與博弈的合理方式是什么答案似乎取決于你參與的是一次博弈還是無限次的博弈如果博弈只進(jìn)行一次欺騙的策略在囚犯兩難中是指認(rèn)罪的策略將是合理的畢竟不管其他人的策略如何你選擇這種策略都會(huì)讓你的狀況變好而且你無法影響其他人的行為 28 5 重復(fù)博弈在上一節(jié) 選手只相遇一次而且他們也只參與一次囚犯兩難博弈但是如果這些選手重復(fù)進(jìn)行博弈情形將會(huì)有所不同在這種情形下每個(gè)選手都可能想出新的策略如果其他選手在某一輪博弈中選擇的測(cè)策略為背叛那么你可以在下一輪選擇背叛的策略因此你的對(duì)手會(huì)因?yàn)?惡劣的行為而受到懲罰在一個(gè)重復(fù)博弈中每個(gè)選手都有機(jī)會(huì)為自己塑造合作的聲望因此鼓勵(lì)其他選手也這么做這種策略是否可行取決于博弈是進(jìn)行既定既定既定既定的次數(shù) 比如 10 次還是進(jìn)行無限無限無限無限次我們首先分析第一種情形假設(shè)兩個(gè)選手知道博弈將進(jìn)行 10 次該博弈的結(jié)果是什么我們從第 10 輪開始分析這是上述博弈的最后一輪在這種情形下似乎每個(gè)選手都會(huì)選擇占優(yōu)策略即背叛畢竟最后一輪博弈和只進(jìn)行一次的博弈米什么區(qū)別所以我們可以預(yù) 28 博弈理論曹乾東南大學(xué) caoqianseu 8 期這兩種博弈的結(jié)果是一樣的現(xiàn)在分析第 9 輪的結(jié)果我們剛得出結(jié)論即每個(gè)選手都會(huì)在第 10 輪選擇背叛的策略既然這樣他們會(huì)在第 9 輪合作嗎不會(huì) 如果你選擇合作但是對(duì)方可能會(huì)利用你善良的天性從而選擇背叛每個(gè)選手都可以同樣推理因此每個(gè)選手都會(huì)選擇背叛現(xiàn)在考慮第 8 輪如果某個(gè)選手在第 9 輪選擇背叛以此類推如果選手都知道博弈進(jìn) 行的具體次數(shù) 那么每個(gè)選手在每一輪都會(huì)選擇背叛如果無法強(qiáng)制選手在最后一輪合作自然也無法強(qiáng)制選手從第一輪直至最后一輪選擇合作選手相互進(jìn)行合作的原因是希望將來進(jìn)一步合作但是這要求將來還有博弈的機(jī)會(huì) 由于在最后一輪選手們都知道將來不可能再進(jìn)行博弈沒有人會(huì)選擇合作既然這樣他們?yōu)槭裁丛诘箶?shù)第二輪合作嗎或者在倒數(shù)第三輪合作以此類推在囚犯困境博弈中若選手都知道博弈的具體次數(shù) 那么合作解從最后一輪博弈將象多米諾骨牌一樣開始倒塌因此均衡解必然是選手都選擇背叛但是如果博弈將重復(fù)無限次那么你的確的確的確的確可以找到影響對(duì)手行為的方法如果對(duì)手這一次不合作那么下一次你可以拒絕合作只要雙方都非?？粗貙淼氖找?將來不合作的這種威脅足以讓人們選擇帕累托有效率的策略即都選擇合作羅伯特阿克塞羅德 Robert Axelrod 在進(jìn)行了一系列實(shí)驗(yàn)后令人信服地證明了上述結(jié) 論一他懇請(qǐng)博弈論領(lǐng)域的幾十位專家向他提交他們認(rèn)為的囚犯困境的最優(yōu)策略然后他在計(jì)算機(jī)上開展了錦標(biāo)賽讓這些策略互相進(jìn)行比賽在計(jì)算機(jī)上每種策略都要和其他每一種策略競(jìng)爭(zhēng) 計(jì)算機(jī)實(shí)時(shí)記錄博弈收益最終獲勝的策略收益最高的策略竟然是一種最為簡(jiǎn)單的策略這種策略叫做以牙還牙 tit for tat 它的運(yùn)行方式如下在第一輪你合作即選擇不認(rèn)罪的策略在以后的每一輪如果你的對(duì)手在前一輪選擇合作你也選擇合作如果對(duì)方在上一輪選擇背叛你也選擇背叛換句話說每個(gè)人的策略是選擇對(duì)方在上一輪的策略以牙還牙策略收益最高因?yàn)樗鼘?duì)背叛行為立即實(shí)施懲罰措施這種策略也是一種寬恕的策略發(fā)現(xiàn)一次背叛只懲罰一次如果對(duì)方改邪歸正開始合作那么以牙還牙策略將以合作回報(bào)對(duì)方在囚犯困境博弈將進(jìn)行無限次的情形下以牙還牙策略似乎是實(shí)現(xiàn)有效率結(jié)果的一種非常好的機(jī)制一 Robert Axelrod is a political scientist from the University of Michigan For an extended discussion see his book The Evolution of Cooperation New York Basic Books 1984 28 博弈理論曹乾東南大學(xué) caoqianseu 9 28 6 實(shí)施卡特爾在第 27 章我們分析了雙頭壟斷制定價(jià)格的博弈行為在那一章我們斷言如果每個(gè) 壟斷企業(yè)能夠選擇價(jià)格那么均衡結(jié)果將是競(jìng)爭(zhēng)均衡如果每個(gè)企業(yè)認(rèn)為其他企業(yè)會(huì)保持價(jià) 格固定不變那么每個(gè)企業(yè)都會(huì)發(fā)現(xiàn)降價(jià)是有利可圖的這個(gè)結(jié)論只有在下列情形下才不會(huì) 成立每個(gè)企業(yè)的要價(jià)已是最低可能的價(jià)格在 27 章的那個(gè)例子中這個(gè)最低價(jià)格為零因?yàn)槲覀兗僭O(shè)邊際成本為零如果使用本章的術(shù)語表達(dá) 每個(gè)企業(yè)索要零價(jià)格是定價(jià)策略中的一個(gè)納什均衡但在第 27 章我們將其稱為伯特蘭均衡雙頭壟斷的定價(jià)策略博弈和囚犯的兩難博弈具有同樣的收益矩陣的結(jié)構(gòu) 如果每個(gè)企業(yè)索要高價(jià) 那么每個(gè)企業(yè)都能得到更大的利潤(rùn) 這種情形就是它們合謀成卡特爾并且堅(jiān) 持生產(chǎn)壟斷產(chǎn)量但是如果一個(gè)企業(yè)索要高價(jià) 另外一個(gè)企業(yè)稍微降低一點(diǎn)價(jià)格就是值得的因?yàn)檫@樣做可以?shī)Z取其他企業(yè)的市場(chǎng) 因此得到更大的利潤(rùn) 但是如果兩個(gè)企業(yè)都降低講個(gè) 它們最終得到的利潤(rùn)都降低了不論對(duì)方索要什么樣的價(jià)格你稍微降低一點(diǎn)價(jià)格總是有利可圖的當(dāng)然前提是價(jià)格仍大等于邊際成本納什均衡發(fā)生在每個(gè)企業(yè)索要最低可能的價(jià)格然而如果博弈重復(fù)進(jìn)行無限次那么可能還有其它結(jié)果假設(shè)你決定實(shí)施以牙還牙策略如果另外一個(gè)企業(yè)這周降價(jià) 你可以在下周降價(jià) 如果每個(gè)選手知道對(duì)方都會(huì)以牙還牙那么每個(gè)選手都不會(huì)降低價(jià)格因?yàn)檫@樣會(huì)引起價(jià)格大戰(zhàn) 各個(gè)選手的利益都受損因此以牙還牙的潛在威脅能夠使得所有企業(yè)維持高價(jià) 現(xiàn)實(shí)生活中的卡特爾有時(shí)會(huì)使用以牙還牙策略例如聯(lián)合執(zhí)行委員會(huì)是一個(gè)有名的卡特爾它在 1800 年代后期負(fù)責(zé)制定美國(guó)鐵路貨運(yùn)的價(jià)格這個(gè)卡特爾形成于美國(guó)反壟斷法規(guī)生效之前當(dāng)時(shí)它是完全合法的一這個(gè)卡特爾負(fù)責(zé)確定每個(gè)鐵路公司貨運(yùn)的市場(chǎng)份額每個(gè)企業(yè)獨(dú)立制定自己的運(yùn)費(fèi)標(biāo) 準(zhǔn) 該卡特爾記錄每個(gè)鐵路公司的貨運(yùn)數(shù)量然而在 1881 1884 和 1885 年間有些公司認(rèn)為其他成員公司偷偷降價(jià)來增加它們自身的市場(chǎng)份額盡管所有公司事先約定不準(zhǔn)降價(jià) 在這個(gè)時(shí)期經(jīng)常發(fā)生價(jià)格大戰(zhàn) 當(dāng)一個(gè)公司試圖欺騙所有其他公司都會(huì)降低價(jià)格以懲罰背叛者這種以牙還牙策略顯然能夠保證卡特爾穩(wěn)定運(yùn)行一段時(shí)間例子機(jī)票定價(jià)中的以牙還牙策略機(jī)票定價(jià)為以牙還牙行為提供了一個(gè)有趣的例子航空公司經(jīng)常會(huì)提供這種或那種促銷價(jià)格航空業(yè)中的很多研究者認(rèn)為這些促銷價(jià)格是用來向競(jìng)爭(zhēng)對(duì)手發(fā)送信號(hào) 警告它們不要降低重要航線的機(jī)票價(jià)格一 For a detailed analysis see Robert Porter A Study of Cartel Stability the Joint Executive Committee 1880 1886 The Bell Journal of Economics 14 2 Autumn 1983 301 25 28 博弈理論曹乾東南大學(xué) caoqianseu 10 美國(guó)某大型航空公司營(yíng)銷總監(jiān)曾描述個(gè)一個(gè)案例西北航空公司降低了從明尼阿波利斯市 Minneapolis 到西海岸各個(gè)城市的夜間航班的價(jià)格目的在于減少空座率大陸航空公司則認(rèn)為這種做法是在搶奪它的市場(chǎng)份額因此宣布降低所有從明尼阿波利斯市到西北各城市的夜間航班價(jià)格然而大陸航空公司的降價(jià)只進(jìn)行了一兩天后就停止了西北航空將大陸航空這一行為解讀為大陸航空不想?yún)⑴c價(jià)格競(jìng)爭(zhēng) 它的目的在于讓西北航空停止夜間航班降價(jià) 但是西北航空公司決定向大陸航空發(fā)送自己的信號(hào) 它對(duì)從休斯頓到西海岸各個(gè)城市的航班都制定了一套便宜的價(jià)格要知道休斯頓可是大陸航空的總部所在地西北航空傳遞的信號(hào)想表明它的降價(jià)措施是正當(dāng)合理的而大陸航空的反應(yīng)是不恰當(dāng)?shù)?所有這些降價(jià)活動(dòng)持續(xù)時(shí)間都很短這個(gè)特征似乎表明降價(jià)行為的本意在于發(fā)出競(jìng) 爭(zhēng)的信號(hào)而不是爭(zhēng)奪更大的市場(chǎng)份額正如這位總監(jiān)解釋的航空公司并不想提供含有價(jià)格適用期的機(jī)票它們的目的是最終能使競(jìng)爭(zhēng)活躍起來并且展開競(jìng)爭(zhēng) 雙頭壟斷的航空市場(chǎng)上的潛規(guī)則似乎為如果一家公司的機(jī)票價(jià)格高我的機(jī)票價(jià)格也高但是如果對(duì)方降低價(jià)格那么我就會(huì)以牙還牙我也降低價(jià)格換句話說兩個(gè)企業(yè) 都遵守著一條重要原則以其人之道還治其人之身這種報(bào)復(fù)措施使得機(jī)票價(jià)格高昂一 28 7 序貫博弈到目前為止我們分析的博弈都有一個(gè)共同特征選手都是同時(shí)行動(dòng)的但在很多情形下其中一個(gè)選手可以率先行動(dòng) 其他選手再做出反應(yīng) 這樣的博弈叫做序貫博弈 sequential game 比如第 27 章介紹的斯坦科爾伯格模型就是這樣的例子在該模型中一個(gè)選手是領(lǐng)導(dǎo)者另外一個(gè)選手是追隨者下面我們分析這樣的博弈在第一輪選手 A 率先進(jìn)行選擇他可以選擇上或下選手 B 觀察 A 的選擇并相應(yīng)作出選擇左或右的決策該博弈的收益矩陣如表 28 5 所示注意當(dāng)這該博弈以表 28 5 這種形式表示時(shí) 它有兩個(gè)納什均衡解上左和下右然而下面我們將證明其中一個(gè)均衡解是不合理的收益矩陣隱藏了下列事實(shí) 一個(gè) 選手可以再觀測(cè)另外一個(gè)選手選擇之后再進(jìn)行選擇在這種情形下我們有必要用另外一種圖形表示博弈的收益這種圖形能更好地反映該種類型博弈的非對(duì)稱性質(zhì) 圖 28 1 畫出了這個(gè)博弈的展開形 extensive form 展開形是博弈的一種表示方法它能顯示出選擇的先后順序首先 A 必須選擇上或下然后 B 必須決定選擇左還是右一 Facts taken from A Nomani Fare Warning How Airlines Trade Price Plans Wall Street Journal October 9 1990 B1 28 博弈理論曹乾東南大學(xué) caoqianseu 11 但是在 B 做出決策時(shí) 他已經(jīng)知道 A 選擇了哪個(gè)策略表 28 5 一個(gè)序貫博弈的收益矩陣圖 28 1 博弈的展開形式博弈的展開形式博弈的展開形式博弈的展開形式展開形能表示出博弈中選手行動(dòng)的先后順序這種博弈的分析方法是從后樹根向前樹枝追溯假設(shè) A 已近作出了選擇我們處在該博弈樹的一個(gè)分枝上如果 A 選擇上則不管 B 怎么選擇 A 和 B 的收益分別為 1 和 9 即圖中的 1 9 如果 A 選擇下則 B 合理的選擇是選擇右因此收益為 2 1 現(xiàn)在分析 A 的初始選擇如果他選上則結(jié)果為 1 9 因此他得到的收益為 1 但是如果他選擇下則他得到的收益為 2 因此他會(huì)選擇下所以該博弈的均衡解為下右因此 A 的收益為 2 B 的收益為 1 28 博弈理論曹乾東南大學(xué) caoqianseu 12 策略上左不是該序貫博弈的合理均衡解也就是說由于這兩個(gè)選手的行動(dòng)有先后之分這個(gè)策略集不是一個(gè)均衡的確如果 A 選擇上則 B 會(huì)選擇左但 A 不會(huì) 傻到選擇上從 B 的角度來看他相當(dāng)不幸因?yàn)樗罱K得到的收益為 1 而不是 9 他還有什么招數(shù) 可使嗎 B 可以威脅威脅威脅威脅 A 即若 A 選下 B 就選左如果 A 認(rèn)為 B 真會(huì)這么做那么他可能選擇上因?yàn)檫x擇上他的收益為 1 而選擇下若 B 實(shí)施威脅計(jì)劃的收益為 0 但 A 會(huì)相信 B 的威脅嗎畢竟一旦 A 做出了選擇就已無法反悔 B 的收益只能為 0 或 1 他很可能得到 1 除非 B 在某種程度上可以讓 A 相信他一定會(huì)實(shí)施威脅計(jì)劃即使自己利益受損也在所不惜否則他只能得到較小的收益 B 的問題是一旦 A 已經(jīng)做出選擇 A 期望 B 理性行事如果 B 承諾承諾承諾承諾在 A 選擇下時(shí) B 會(huì) 選擇左 B 的狀況會(huì)變好 B 做出承諾的一種方式是讓別人為他做出選擇決策例如 B 可以雇傭律師讓律師警告 A 如果 A 選擇下則 B 必定選擇左如果 A 認(rèn)識(shí)到這種警告的嚴(yán)重性從他的角度看結(jié) 果將大不相同如果他知道 B 對(duì)律師的指示那么他知道如果他選擇下他最終的收益為 0 因此他自然會(huì)選擇上在這種情形下 B 限定限定限定限定了自己的策略從而狀況變得更好 28 8 阻止進(jìn)入的博弈 a game of entry deterrence 我們?cè)诜治鲭p頭壟斷時(shí)假設(shè)行業(yè)中的企業(yè)數(shù)目是固定不變的但在很多情形下新企業(yè)可能會(huì)進(jìn)入該行業(yè) 當(dāng)然行業(yè)中原有的企業(yè)會(huì)想方設(shè)法阻止新企業(yè)進(jìn)入由于原有企業(yè) 已在行業(yè)中他們可以先發(fā)制人因此在阻止競(jìng)爭(zhēng)對(duì)手進(jìn)入的博弈中具有先行選擇策略的優(yōu) 勢(shì) 例如假設(shè)某個(gè)壟斷企業(yè)面對(duì)著另外一個(gè)企業(yè)進(jìn)入行業(yè)的威脅新企業(yè) 進(jìn)入者決定是否進(jìn)入市場(chǎng) 原有企業(yè)決定是否降低價(jià)格作為回應(yīng) 如果新企業(yè)決定不進(jìn)入它得到的收益為 1 原有企業(yè)得到的收益為 9 如果新企業(yè)決定進(jìn)入那么它的收益取決于原有企業(yè)是否與它展開激烈競(jìng)爭(zhēng) 如果企業(yè)進(jìn)行競(jìng)爭(zhēng) 那么我們假設(shè)兩個(gè)選手的最終收益都為 0 另一方面如果原有企業(yè)不進(jìn)行競(jìng) 爭(zhēng) 我們假設(shè)進(jìn)入者得到的收益為 2 原有企業(yè)得到的收益為 1 注意這正好是我們前面研究過的序貫博弈的結(jié)構(gòu) 因此它的結(jié)構(gòu)和圖 28 1 是相同的原有企業(yè)為 B 而潛在進(jìn)入者為 A 策略上為不進(jìn)入策略下為進(jìn)入策略左為競(jìng)爭(zhēng) 策略右為不競(jìng)爭(zhēng) 我們已經(jīng)知道在這個(gè)博弈中均衡結(jié)果是潛在進(jìn)入者進(jìn)入原有企業(yè)不競(jìng)爭(zhēng) 原有企業(yè)的問題是它不可能事先承諾若其他企業(yè)進(jìn)入他就會(huì)進(jìn)行競(jìng)爭(zhēng) 如果其他企業(yè)進(jìn) 入損害已經(jīng)造成原有企業(yè)的理性行為是接受這一事實(shí)并且和平相處然而如果潛在進(jìn)入 28 博弈理論曹乾東南大學(xué) caoqianseu 13 者認(rèn)識(shí)到這一點(diǎn) 他自然會(huì)認(rèn)為 B 的競(jìng)爭(zhēng)威脅只是口號(hào)般的空話然而假設(shè)原有企業(yè)可以購(gòu)買額外的生產(chǎn)能力這樣它就能以目前的邊際成本生產(chǎn)更多的產(chǎn)量當(dāng)然如果它仍然是壟斷者他不希望實(shí)際增加產(chǎn)量因?yàn)樵袎艛喈a(chǎn)量已實(shí)現(xiàn)了利潤(rùn)最大化但是如果其他企業(yè)進(jìn)入原有企業(yè)現(xiàn)在就能生產(chǎn)非常多的產(chǎn)量因此可以與新進(jìn)入者展開激烈的競(jìng)爭(zhēng) 通過投資擴(kuò)大額外產(chǎn)能當(dāng)其他企業(yè)試圖進(jìn)入時(shí) 它就可以降低成本打擊進(jìn)入者假設(shè)如果原有企業(yè)購(gòu)買額外產(chǎn)能而且選擇競(jìng)爭(zhēng)的話那么他的收益為 2 這樣博弈樹 28 1 就變?yōu)榱瞬┺臉?28 2 圖 28 2 阻止進(jìn)入的博弈模型阻止進(jìn)入的博弈模型阻止進(jìn)入的博弈模型阻止進(jìn)入的博弈模型該圖與 28 1 相比收益發(fā)生了變化現(xiàn)在由于增加了生產(chǎn)能力競(jìng)爭(zhēng)的威脅就是可信的如果潛在進(jìn)入者進(jìn)入若原有企業(yè)競(jìng)爭(zhēng)他得到的收益為 2 若不競(jìng)爭(zhēng)他的收益為 1 因此原有企業(yè)自然會(huì)選擇競(jìng)爭(zhēng) 潛在進(jìn)入者如果進(jìn)入得到的收益為 0 如果不進(jìn)入得到的收益為 1 因此他自然會(huì)選擇不進(jìn)入但是這意味著原有企業(yè)仍然是唯一的壟斷者它根本不會(huì)使用額外的生產(chǎn)能力盡管如此壟斷則投資擴(kuò)大產(chǎn)能還是值得的因?yàn)樵谛缕髽I(yè)試圖進(jìn)入市場(chǎng)時(shí) 它能夠做到讓對(duì) 方相信它有能力對(duì)進(jìn)入者進(jìn)行打擊壟斷者投資于過剩產(chǎn)能的目的在于向潛在進(jìn)入者發(fā)送信號(hào) 膽敢進(jìn)入必遭痛擊 28 博弈理論曹乾東南大學(xué) caoqianseu 14 1 博弈的一種表示方法是對(duì)選手的每個(gè)策略賦予相應(yīng)收益 2 一個(gè)占優(yōu)策略均衡是指一組選擇這組選擇具有下列特征不論對(duì)方選擇何種策略每個(gè)選手的選擇的策略都是最優(yōu)的 3 一個(gè)納什均衡是指一組選擇對(duì)于這組選擇給定其它選手的選擇每個(gè)選手的選擇都是最優(yōu)的 4 囚犯的兩難是一種特殊的博弈因?yàn)樵谠摬┺闹?選手選擇的策略導(dǎo)致的是帕累托無效率的結(jié)果而不是帕累托有效率的結(jié)果 5 在序貫博弈中選手選擇的先后順序非常重要在這類博弈中如果某個(gè)選手向其它選手事先承諾他會(huì)沿著既定的路線進(jìn)行博弈那么它將處于有利地位 1 在重復(fù)進(jìn)行的囚犯兩難博弈中如果選手的策略都為以牙還牙假設(shè)某個(gè)選手的本意是合作卻不慎犯錯(cuò) 他背叛了如果在下面回合的博弈中這兩個(gè)選手仍然以牙還牙那么結(jié)果將如何 2 占優(yōu)策略均衡一定是納什均衡嗎納什均衡一定是占優(yōu)策略均衡嗎 3 假設(shè)你的對(duì)手選擇的不是他的納什均衡策略那么你還應(yīng)該繼續(xù)選擇你的納什均衡策略嗎 4 我們知道如果囚犯兩難博弈只進(jìn)行一次那么它的結(jié)果是占優(yōu)策略均衡這一結(jié)果不是帕累托有效率的如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方這樣的行為將影響到該博弈的哪些方面它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎 5 如果兩個(gè)選手都知道他們之間的囚犯兩難博弈將進(jìn)行 100 萬次那么該博弈的占優(yōu)納什均衡策略是什么如果你真得找到兩個(gè)選手進(jìn)行這樣的實(shí)驗(yàn) 而且實(shí)驗(yàn) 100 萬次你能預(yù) 測(cè)出他們會(huì)使用什么策略嗎 6 在教材圖 28 1 表示的序貫博弈中如果選手 B 而不是 A 先進(jìn)行選擇請(qǐng)畫出該新博弈的展開形該博弈的均衡解是什么選手 B 更喜歡自己先選擇還是更喜歡讓 A 先選擇復(fù)習(xí)題復(fù)習(xí)題復(fù)習(xí)題復(fù)習(xí)題總結(jié)總結(jié)總結(jié)總結(jié) 28 博弈理論曹乾東南大學(xué) caoqianseu 15 1 在重復(fù)進(jìn)行的囚犯兩難博弈中在重復(fù)進(jìn)行的囚犯兩難博弈中在重復(fù)進(jìn)行的囚犯兩難博弈中在重復(fù)進(jìn)行的囚犯兩難博弈中如果選手的策略都為以牙還牙如果選手的策略都為以牙還牙如果選手的策略都為以牙還牙如果選手的策略都為以牙還牙假設(shè)某個(gè)選手的本意是合假設(shè)某個(gè)選手的本意是合假設(shè)某個(gè)選手的本意是合假設(shè)某個(gè)選手的本意是合作卻不慎犯錯(cuò)作卻不慎犯錯(cuò)作卻不慎犯錯(cuò)作卻不慎犯錯(cuò) 他背叛了他背叛了他背叛了他背叛了如果在下面回合的博弈中如果在下面回合的博弈中如果在下面回合的博弈中如果在下面回合的博弈中這兩個(gè)選手仍然以牙還牙這兩個(gè)選手仍然以牙還牙這兩個(gè)選手仍然以牙還牙這兩個(gè)選手仍然以牙還牙那么那么那么那么結(jié)果將如何結(jié)果將如何結(jié)果將如何結(jié)果將如何復(fù)習(xí)內(nèi)容囚犯的兩難博弈以牙還牙策略以牙還牙 tit for tat 策略運(yùn)行方式如下在第一輪你合作在以后的每一輪如果你的對(duì)手在前一輪選擇合作你也選擇合作如果對(duì)方在上一輪選擇背叛你也選擇背叛換句話說每個(gè)人的策略是選擇對(duì)方在上一輪的策略以牙還牙策略收益最高因?yàn)樗鼘?duì)背叛行為立即實(shí)施懲罰措施這種策略也是一種寬恕的策略發(fā)現(xiàn)一次背叛只懲罰一次如果對(duì)方改邪歸正開始合作那么以牙還牙策略將以合作回報(bào)對(duì)方在囚犯困境博弈將進(jìn)行無限次的情形下以牙還牙策略似乎是實(shí)現(xiàn)有效率結(jié) 果的一種非常好的機(jī)制參考答案在重復(fù)進(jìn)行的囚犯兩難博弈中以牙還牙策略簡(jiǎn)單地說是指每個(gè)選手選擇對(duì)方在上一輪的策略由題目可知如果某選手 A 不慎背叛即使不是出自其本意但如果 B 無法了解這些信息那么它會(huì)認(rèn)為 A 的行為是真正的背叛按照以牙還牙的邏輯 B 在第二輪中的策略他應(yīng)選擇 A 在上一輪中的策略即選擇背叛這個(gè)信號(hào)會(huì)讓 B 在下一輪中也選擇背叛以此類推選手 A 和 B 不斷地以背叛策略作為對(duì)對(duì)方背叛的反應(yīng) 這個(gè)例子說明如果博弈中某個(gè)選手不慎犯錯(cuò) 他應(yīng)該及時(shí)溝通否則大家將一直背叛到底這樣的結(jié)果顯然不是帕累托有效率的也就是說在這種情形下以牙還牙不再是一個(gè) 很好的策略 2 占優(yōu)策略均衡一定是納什均衡嗎占優(yōu)策略均衡一定是納什均衡嗎占優(yōu)策略均衡一定是納什均衡嗎占優(yōu)策略均衡一定是納什均衡嗎納什均衡一定是占優(yōu)策略均衡嗎納什均衡一定是占優(yōu)策略均衡嗎納什均衡一定是占優(yōu)策略均衡嗎納什均衡一定是占優(yōu)策略均衡嗎復(fù)習(xí)內(nèi)容占優(yōu)策略均衡和納什均衡占優(yōu)策略是指不管對(duì)方選擇哪個(gè)策略你的最優(yōu)選擇是唯一的也就是我們通常所說的以不變應(yīng)萬變這里的不變的策略就是你的占優(yōu)策略如果均衡時(shí)每個(gè)對(duì)手選擇的都是占優(yōu)策略那么該均衡就是占優(yōu)策略均衡復(fù)習(xí)題答案復(fù)習(xí)題答案復(fù)習(xí)題答案復(fù)習(xí)題答案 28 博弈理論曹乾東南大學(xué) caoqianseu 16 納什均衡簡(jiǎn)單地說你的選擇根據(jù)對(duì)手的選擇相應(yīng)調(diào)整在均衡時(shí) 雙方都不會(huì)再改變策略我們通常所說的兵來將擋水來土掩就是納什均衡的例子參考答案占優(yōu)策略均衡一定是納什均衡占優(yōu)策略均衡一定是納什均衡占優(yōu)策略均衡一定是納什均衡占優(yōu)策略均衡一定是納什均衡納什均衡未必是占優(yōu)策略均衡納什均衡未必是占優(yōu)策略均衡納什均衡未必是占優(yōu)策略均衡納什均衡未必是占優(yōu)策略均衡占優(yōu)策略均衡要求對(duì)于 B 的所有所有所有所有選擇 A 的選擇都是最優(yōu)的而納什均衡僅要求對(duì) 于 B 的最優(yōu)最優(yōu)最優(yōu)最優(yōu) 選擇來說 A 的選擇是最優(yōu)的即可由于 A 和 B 的地位是對(duì)稱的你可以類似推理 B 的選擇由此可見占優(yōu)策略均衡是納什均衡的一種因?yàn)槿绻?A 選擇的策略對(duì) B 的所有所有所有所有策略來說都是最優(yōu)的那么顯然 A 選擇的策略對(duì) B 的最優(yōu)最優(yōu)最優(yōu)最優(yōu) 策略來說也是最優(yōu)的納什均衡未必是占優(yōu)策略均衡比如在剪刀石頭布游戲中不存在占優(yōu)策略均衡但存在納什混合策略均衡既然我們已經(jīng)舉出了一個(gè)博弈是納什均衡但不是占優(yōu)策略均衡的例子而且我們又知道占優(yōu)策略均衡一定是納什均衡我們當(dāng)然可以斷言納什均衡未必是占優(yōu)策略均衡 3 假設(shè)你的對(duì)手選擇的不是他的納什均衡策略假設(shè)你的對(duì)手選擇的不是他的納什均衡策略假設(shè)你的對(duì)手選擇的不是他的納什均衡策略假設(shè)你的對(duì)手選擇的不是他的納什均衡策略那么你還應(yīng)該繼續(xù)選擇你的納什均衡策略那么你還應(yīng)該繼續(xù)選擇你的納什均衡策略那么你還應(yīng)該繼續(xù)選擇你的納什均衡策略那么你還應(yīng)該繼續(xù)選擇你的納什均衡策略嗎嗎嗎嗎復(fù)習(xí)內(nèi)容納什均衡策略參考答案你可能但一般不會(huì)繼續(xù)選擇納什均衡策略原因如下納什均衡策略是指對(duì)方采用納什均衡策略時(shí) 你選擇的最優(yōu)策略典型的納什均衡要求雙方的決策是相互依賴的你必須根據(jù)對(duì)手的選擇相應(yīng)出招如果兩個(gè)選手都是理性的那么納什均衡結(jié)果是勢(shì)均力敵的也就是說給定對(duì)方的最優(yōu)選擇你的選擇也是最優(yōu)的比如足球比賽中你若是前鋒在與對(duì)方守門員的博弈中若你和守門員都是理性的那么你們的策略顯然是相互依賴的比如你踢向球門左方守門員的最優(yōu)選擇就是撲向左方我們假設(shè)不管什么原因該守門員總是撲向左方你自然會(huì)選擇踢向右方這個(gè)例子說明如果對(duì)方選擇的不是納什均衡策略那么一般情形下你會(huì)有更好的選擇也就是說你不會(huì)繼續(xù)選擇納什均衡策略但是需要注意由于占優(yōu)策略均衡是一種比較特殊的納什均衡在這種情形下不管對(duì)方怎么選擇你的策略都是不變的因此你會(huì)繼續(xù)選擇你的占優(yōu)策略綜合以上兩種情形可知答案為如果對(duì)方選擇的不是納什均衡策略那么你可能但一般不會(huì)繼續(xù)選擇納什均衡策略 28 博弈理論曹乾東南大學(xué) caoqianseu 17 4 我們知道如果囚犯兩難博弈只進(jìn)行一次我們知道如果囚犯兩難博弈只進(jìn)行一次我們知道如果囚犯兩難博弈只進(jìn)行一次我們知道如果囚犯兩難博弈只進(jìn)行一次那么它的結(jié)果是占優(yōu)策略均衡那么它的結(jié)果是占優(yōu)策略均衡那么它的結(jié)果是占優(yōu)策略均衡那么它的結(jié)果是占優(yōu)策略均衡這一結(jié)果不是帕這一結(jié)果不是帕這一結(jié)果不是帕這一結(jié)果不是帕累托有效率的累托有效率的累托有效率的累托有效率的如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方這樣的行為將影響到該這樣的行為將影響到該這樣的行為將影響到該這樣的行為將影響到該博弈的哪些方面博弈的哪些方面博弈的哪些方面博弈的哪些方面它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎復(fù)習(xí)內(nèi)容囚犯兩難博弈重復(fù)博弈在重復(fù)進(jìn)行的囚犯兩難博弈中每個(gè)選手都可能想出新的策略如果其他選手在某一輪博弈中選擇的測(cè)策略為背叛那么你可以在下一輪選擇背叛的策略因此你的對(duì)手會(huì)因?yàn)?惡劣的行為而受到懲罰在一個(gè)重復(fù)博弈中每個(gè)選手都有機(jī)會(huì)為自己塑造合作的聲望因此鼓勵(lì)其他選手也這么做因此面臨報(bào)復(fù)的威脅時(shí) 參與博弈的選手都會(huì)重新思考和進(jìn)行選擇在這種情形下會(huì)改變博弈的收益從而改變了博弈的結(jié)果在該情形下選手很可能選擇合作因此產(chǎn) 生了帕累托有效率的結(jié)果但是如果這種威脅并不可信那么選手就不會(huì)

人人文庫(kù)> 全部分類> 教育資料 > 考試試卷

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔