第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf_第1頁(yè)
第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf_第2頁(yè)
第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf_第3頁(yè)
第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf_第4頁(yè)
第8版-第八版-ch28-博弈論(含全部習(xí)題解答)-東南大.pdf_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

28 博弈理論 曹乾 東南大學(xué) caoqianseu 1 Intermediate Microeconomics A Modern Approach 8th Edition Hal R Varian 范里安 中級(jí)微觀經(jīng)濟(jì)學(xué) 現(xiàn)代方法 第第第第 8 版版版版 完美中文翻譯版 第第第第 28 章章章章 博弈論博弈論博弈論博弈論 含全部習(xí)題詳細(xì)解答含全部習(xí)題詳細(xì)解答含全部習(xí)題詳細(xì)解答含全部習(xí)題詳細(xì)解答 曹乾 譯 東南大學(xué) caoqianseu 28 博弈理論 曹乾 東南大學(xué) caoqianseu 2 28 博弈理論 我們?cè)谏弦徽玛U述的寡頭理論 是企業(yè)間策略性互動(dòng)的經(jīng)典經(jīng)濟(jì)理論解釋 但這只是冰 山一角 經(jīng)濟(jì)行為人 agents 的策略性互動(dòng)有多種方式 經(jīng)濟(jì)學(xué)家借助博弈理論 game theory 這個(gè)工具已研究了很多種策略性互動(dòng)的行為 博弈理論關(guān)注的是策略性互動(dòng)的一般分析 人 們可使用博弈理論研究室內(nèi)游戲 parlor games 政治協(xié)商和經(jīng)濟(jì)行為 一 在本章 我們將 簡(jiǎn)要分析這一迷人的學(xué)科 目的是讓你感受一下它是如何運(yùn)行的 以及讓你初步知道如何使 用博弈理論分析寡頭市場(chǎng)中的經(jīng)濟(jì)行為 28 1 博弈的收益矩陣 策略性互動(dòng)可能涉及很多選手和很多策略 但是我們僅限于分析兩個(gè)選手之間的博弈 而且限于分析策略的數(shù)量有限的情形 這樣做的好處是可以用收益矩陣 payoff matrix 描 述博弈 最好舉例進(jìn)行分析 假設(shè)兩人玩一種簡(jiǎn)單的游戲 選手 A 在紙上寫(xiě)出 上 或 下 與此同時(shí) 選手 B 獨(dú) 立地寫(xiě)出 左 或 右 在兩人寫(xiě)好后 經(jīng)過(guò)分析 將他們的收益標(biāo)記于表 28 1 中 若 A 選上且 B 選左 我們看矩陣的左上角的小方格 在該小方格中 A 的收益是第一個(gè)數(shù) B 的收益是第二個(gè)數(shù) 類似地 如果 A 選下 B 選右 則 A 得到收益為 1 B 得到的收益為 0 表 28 1 一個(gè)博弈的收益矩陣 選手 A 有兩個(gè)策略 上或下 這些策略可以代表類似 提高價(jià)格 或 降低價(jià)格 的 經(jīng)濟(jì)選擇 或者它們可以代表類似 宣戰(zhàn) 或 不宣戰(zhàn) 的政治選擇 博弈的收益矩陣表明 了對(duì)于每個(gè)選定的策略組合 每個(gè)選手得到的收益 一 室內(nèi)游戲 parlor games 是指一伙人在室內(nèi) indoors 參與的游戲 在維多利亞時(shí)代的英國(guó)和美國(guó) 室內(nèi)游戲在中上流階級(jí)非常盛行 譯者注 28 博弈理論 曹乾 東南大學(xué) caoqianseu 3 這類博弈的結(jié)果是什么樣的 表 28 1 表示的這種博弈 有一個(gè)很簡(jiǎn)單的解 從選手 A 的觀點(diǎn)看 選擇下總是比選擇上更好 因?yàn)檫x擇下的收益 2 或 1 總是大于選擇上的相應(yīng) 收益 1 或 0 類似地 對(duì)于 B 來(lái)說(shuō) 選擇左比總是比選擇右更好 因?yàn)?2 或 1 相應(yīng)比 1 或 0 大 因此 我們可以預(yù)期均衡策略是 A 選下 B 選左 這種情形下 我們得到了一個(gè)占優(yōu)勢(shì)的策略或者簡(jiǎn)稱占優(yōu)策略 dominant strategy 一 每個(gè)選手只有唯一一個(gè)最優(yōu)選擇 不論對(duì)方怎么改變策略 例如 不論 B 怎么選擇 若 A 選下 A 的收益總是大于選擇上的收益 因此 A 自然會(huì)選擇下 類似地 不論 A 怎么選擇 B 選擇左的收益更高 因此 這些選擇比其他選擇好 這樣我們就得到了一個(gè)占優(yōu)策略均衡 解 如果在一個(gè)博弈中 每個(gè)選手都有一個(gè)占優(yōu)策略 我們可以預(yù)測(cè)占優(yōu)策略組合就是該 博弈的均衡結(jié)果 這是因?yàn)檎純?yōu)策略是指 不論對(duì)方如何選擇 你選擇的這個(gè)策略都是最優(yōu) 的 在這個(gè)例子中 我們可以預(yù)期均衡結(jié)果為 A 選下 均衡收益為 2 B 選左 均衡收 益為 1 28 2 納什均衡 占優(yōu)策略均衡很好分析 可惜占優(yōu)策略均衡不是那么常見(jiàn) 例如 表 28 2 表示的博弈 不存在占優(yōu)策略均衡解 在該博弈中 B 選左時(shí) A 的收益為 2 或 0 B 選右時(shí) A 的收益 為 0 或 1 這表示 B 選左時(shí) A 會(huì)選上 B 選右時(shí) A 會(huì)選下 因此 A 的最優(yōu)選擇取決于他 認(rèn)為 B 會(huì)怎么選 表 28 1 一個(gè)納什均衡 然而 也許占優(yōu)策略均衡要求太苛刻 因?yàn)樗髮?duì)于 B 的所有所有所有所有 選擇 A 的選擇都是 最優(yōu)的 現(xiàn)在我們不這么要求 我們只要求對(duì)于 B 的最優(yōu)最優(yōu)最優(yōu)最優(yōu) 選擇來(lái)說(shuō) A 的選擇是最優(yōu)的即 可 因?yàn)槿绻?B 是一個(gè)理性選手 他只會(huì)選擇最優(yōu)的策略 當(dāng)然 B 的最優(yōu)策略也取決于 A 的選擇 一 有時(shí)也翻譯為 優(yōu)勢(shì)策略 在翻譯過(guò)程中 這兩種譯法我都使用了 譯者注 28 博弈理論 曹乾 東南大學(xué) caoqianseu 4 如果給定 B 的選擇 A 的選擇為最優(yōu) 而且給定 A 的選擇 B 的選擇也為最優(yōu) 那么 我們將 A 和 B 此時(shí)選擇的策略稱為一個(gè)納什均衡 Nash equilibrium 一 記住 當(dāng)每個(gè)選 手在選擇自己的策略時(shí) 都不知道對(duì)方選擇哪一個(gè)策略 但是他可以猜測(cè)對(duì)方選擇的策略 一個(gè)納什均衡可以看成一對(duì)預(yù)期選擇 這樣的選擇要能使得一旦對(duì)方的選擇展現(xiàn)后 選手都 不再改變自己的行為 在表 28 2 代表的博弈中 策略 上 左 是一個(gè)納什均衡 為了證明這一點(diǎn) 先分析 B 的行為 假設(shè) A 選擇上 那么 B 的最優(yōu)選擇是選擇左 這是因?yàn)樗x擇左的收益為 1 而選擇右的收益為 0 再來(lái)分析 A 的行為 如果 B 選擇左 那么 A 的最優(yōu)選擇是選擇上 因?yàn)檫x擇上的收益為 2 而選擇下的收益為 0 因此 如果 A 選擇上 B 的最優(yōu)選擇是選擇左 而如果 B 選擇左 那么 A 的最優(yōu)選擇 是選擇上 這樣我們就得到了一個(gè)納什均衡 給定對(duì)方的選擇 每個(gè)選手都作出了最優(yōu)選擇 納什均衡是上一章介紹的古諾均衡的一般形式 在古諾均衡中 選擇為產(chǎn)量水平 每 個(gè)企業(yè)在選擇它的產(chǎn)量水平時(shí) 都假定對(duì)方的選擇是既定的 每個(gè)企業(yè)在做選擇時(shí)都假設(shè)對(duì) 方選擇原來(lái)的產(chǎn)量 也就是說(shuō)按照以前選擇的策略進(jìn)行生產(chǎn) 在這種情形下它選擇的產(chǎn)量應(yīng) 該使自己的利潤(rùn)最大化 給定對(duì)方的行為 每個(gè)企業(yè)的利潤(rùn)都實(shí)現(xiàn)了最大化 這就是一個(gè)古 諾均衡 按照納什均衡的定義 顯然古諾均衡是一種納什均衡 納什均衡的概念有一定的內(nèi)在邏輯 不幸地是 該均衡也存在一些問(wèn)題 首先 一個(gè) 博弈可能有多個(gè)納什均衡 事實(shí)上 在表 28 2 中 選擇 下 右 也是一個(gè)納什均衡 你 可以按照我們上面介紹的推理方法進(jìn)行分析 當(dāng)然下面這種證明方法也可行 注意到這個(gè)博 弈結(jié)構(gòu)是對(duì)稱的 B 在一種結(jié)果的收益 等于 A 在另一結(jié)果中的收益 因此我們證明了 上 左 是一個(gè)納什均衡 這也意味著我們也證明了 下 右 也是一個(gè)納什均衡 表 28 3 不存在 純策略 納什均衡解的一個(gè)博弈 納什均衡概念的第二個(gè)問(wèn)題是有些博弈不存在我們上面描述的納什均衡解 例如 考慮 一 約翰 納什是一位美國(guó)數(shù)學(xué)家 他在 1951 年提出了這個(gè)博弈理論中的基本概念 1994 年他和另兩外博 弈理論學(xué)者共同獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng) 2002 電影 美麗心靈 大致以納什的生活為藍(lán)本 該電影獲得奧 斯卡最佳電影獎(jiǎng) 28 博弈理論 曹乾 東南大學(xué) caoqianseu 5 表 28 3 該博弈不存在我們上面描述的那種納什均衡解 如果 A 選擇上 則 B 選擇左 但 是若 B 選擇左 則 A 選擇下 類似地 若 A 選擇下 則 B 選擇右 但是若 B 選擇右 則 A 選擇上 28 3 混合策略 然而 如果我們擴(kuò)大策略的定義 我們可以為表 28 3 的博弈找到一個(gè)新類型的納什均 衡解 我們?cè)谇懊娴乃悸菲鋵?shí)是一直認(rèn)為 每個(gè)選手在選擇策略時(shí)能做到一勞永逸 也就是 說(shuō) 每個(gè)選手作出選擇后就堅(jiān)持這個(gè)選擇 這種情形下 每個(gè)選手的策略都為一個(gè)純策略 a pure strategy 另外一種思路是我們?cè)试S選手將他們的策略隨機(jī)化隨機(jī)化隨機(jī)化隨機(jī)化 也就是說(shuō)對(duì)每個(gè)選擇都賦予一個(gè)概 率值 而且按照這些概率選擇策略 例如 A 以概率 50 選擇上 以概率 50 選擇下 而 B 以概率 50 選擇左 以概率 50 選擇右 這種情形下 每個(gè)選手的策略都為一個(gè)混合策略 a mixed strategy 如果 A 和 B 都采用上述混合策略 即每個(gè)選手以相等的概率選擇他的兩個(gè)策略中的一 個(gè) 那么收益矩陣每個(gè)小方格中的收益 出現(xiàn)的概率都為 1 4 因此 A 的平均收益為 0 B 的平均收益為 1 2 混合策略中的納什均衡是指 均衡時(shí) 給定對(duì)方選擇策略的概率 每個(gè)選手選擇的含有 概率的策略都是最優(yōu)的 可以證明對(duì)于本章分析的這類博弈 總是至少存在一個(gè)混合策略納什均衡解 因?yàn)榛旌?策略的納什均衡解總是存在的 也因?yàn)樵摳拍罹哂幸欢ǖ膬?nèi)在合理性 所以它成為分析博弈 行為的一個(gè)非常流行的工具 在表 28 3 的例子中 可以證明 如果 A 以 3 4 的概率選擇上 以 1 4 的概率選擇下 而且 B 以 1 2 的概率選擇左 以 1 2 的概率選擇右 那么這些策略就 構(gòu)成了一個(gè)納什均衡 例子 剪刀 石頭和布 我們對(duì)混合策略說(shuō)得已經(jīng)夠多了 現(xiàn)在來(lái)看一個(gè)重要例子 這就是我們都知道的游戲 剪刀石頭和布 在這個(gè)游戲中 每個(gè)選手同時(shí)選擇出示拳頭 石頭 手掌 布 或兩個(gè) 手指 剪刀 游戲的規(guī)則為 石頭砸爛剪刀 剪刀剪破布 布包住石頭 在人類歷史上 該游戲百玩不厭 甚至還有一個(gè)稱為 RPS 協(xié)會(huì)的專業(yè)團(tuán)體 專門推廣 該游戲 它有自己的網(wǎng)站 它還提供了 2003 年在加拿大多倫多舉行的錦標(biāo)賽的紀(jì)錄片 當(dāng)然 博弈論專家認(rèn)識(shí)到這個(gè)游戲中的均衡策略是隨機(jī)選擇這三個(gè)選項(xiàng)中的一種 但 是人類并不必然擅長(zhǎng)選擇完全隨機(jī)的選項(xiàng) 如果你在某種程度上能預(yù)測(cè)到對(duì)手的選擇 你在 選擇策略時(shí)將占有一定的優(yōu)勢(shì) 28 博弈理論 曹乾 東南大學(xué) caoqianseu 6 紐約時(shí)報(bào)記者詹妮弗 8 李 曾經(jīng)半開(kāi)玩笑地說(shuō)道 心理學(xué)是至高無(wú)上的 在她的文章 中 她寫(xiě)道 大多數(shù)人在無(wú)防備的情況下 都有自己偏好的選擇 這反映了他們的性格 布 代表著優(yōu)雅甚至被動(dòng)的選擇 因此文學(xué)人士和記者在玩這個(gè)游戲時(shí)一般會(huì)選擇 布 一 經(jīng)濟(jì)學(xué)家在玩這個(gè)游戲時(shí)喜歡出哪一項(xiàng)呢 也許是剪刀 因?yàn)槲覀兿M舫鲇绊懭藗?行為的決定因素 經(jīng)濟(jì)學(xué)家出剪刀時(shí) 你是否應(yīng)該出石頭呢 也許 但是我并不總是出剪刀 28 4 囚犯的兩難問(wèn)題 博弈納什均衡解的另外一個(gè)問(wèn)題是 它不必然導(dǎo)致帕累托有效率的結(jié)果 例如 考慮 表 28 4 中的博弈 這個(gè)博弈稱為囚犯的兩難 或囚犯的困境 prisoner s dilemma 最初這 個(gè)模型是這樣的 警察將合伙犯罪的兩個(gè)人分別關(guān)押在單獨(dú)的囚房?jī)?nèi) 分別審訊 每個(gè)罪犯 的選擇為 可以選擇認(rèn)罪 從而供出來(lái)了他的合伙人 也可以選擇不認(rèn)罪 如果只有一個(gè)罪 犯認(rèn)罪 那么他可以被釋放 而另外一個(gè)罪犯會(huì)受到嚴(yán)懲 坐牢 6 個(gè)月 如果兩個(gè)罪犯都 不認(rèn)罪 那么根據(jù)法律每人被監(jiān)禁 1 個(gè)月 如果兩個(gè)人都認(rèn)罪 那么每個(gè)人被監(jiān)禁 3 個(gè)月 這個(gè)博弈的收益矩陣可用表 28 4 表示 每個(gè)小方格中的元素表示每個(gè)罪犯對(duì)各種結(jié)果的效 用評(píng)價(jià) 為簡(jiǎn)單起見(jiàn) 我們用負(fù)數(shù)表示他們的效用 這個(gè)效用取決于坐牢期限 時(shí)間越長(zhǎng) 效用越小 圖 28 4 囚犯的兩難問(wèn)題 我們先來(lái)分析 A 的選擇 如果 B 選擇否認(rèn) 那么 A 最好的選擇是認(rèn)罪 因?yàn)檫@樣 A 就 會(huì)被釋放 類似地 如果 B 選擇認(rèn)罪 那么 A 最好的選擇也是認(rèn)罪 因?yàn)檫@樣 A 會(huì)被監(jiān)禁 3 個(gè)月而不是 6 個(gè)月 因此 不論不論不論不論 B 怎么選擇 A 最好的選擇是認(rèn)罪 一 Jennifer 8 Lee Rock Paper Scissors High Drama in the Tournament Ring New York Times September 5 2004 以下為譯者注 注意該記者的名字中含有數(shù)字 8 據(jù)說(shuō)她是個(gè)中國(guó)通 認(rèn)為 8 這個(gè)數(shù)字很吉利 加 8 在名字中讓她的名字很特別 28 博弈理論 曹乾 東南大學(xué) caoqianseu 7 B 的選擇可以類似推理 B 的最優(yōu)選擇也是認(rèn)罪 因此 該博弈的唯一納什均衡是兩個(gè) 罪犯都認(rèn)罪 事實(shí)上 兩個(gè)罪犯都認(rèn)罪不僅是一個(gè)納什均衡 而且是一個(gè)占優(yōu)策略均衡 因 為每個(gè)罪犯的最優(yōu)選擇和對(duì)方的選擇無(wú)關(guān) 但是如果他們咬緊牙關(guān)拒不認(rèn)罪 那么他們的狀況會(huì)變好 如果這兩個(gè)人相信對(duì)方不 會(huì)認(rèn)罪 對(duì)方的確不會(huì)認(rèn)罪 那么這種情形下 每個(gè)人的收益均為 1 這會(huì)使得每個(gè)人的狀 況變得更好 策略 否認(rèn) 否認(rèn) 是帕累托有效率的 因?yàn)橐巡淮嬖谀苁拐邇蓚€(gè)人的狀況都 變好的策略 策略 認(rèn)罪 認(rèn)罪 是帕累托無(wú)效率的 問(wèn)題在于這兩個(gè)罪犯無(wú)法協(xié)調(diào)彼此的行為 如果他們彼此信任 則他們的狀況都會(huì)變 得更好 囚犯兩難模型可應(yīng)用于廣泛的經(jīng)濟(jì)和政治現(xiàn)象 例如軍備控制問(wèn)題 我們可以將囚犯 困境中的策略 認(rèn)罪 看為 使用新導(dǎo)彈 將 不認(rèn)罪 看成 不使用導(dǎo)彈 注意該情形 下表 28 4 表示的收益仍然是合理的 如果我的對(duì)手使用導(dǎo)彈 我當(dāng)然希望是使用導(dǎo)彈 盡 管我們雙方最好的策略都是不使用導(dǎo)彈 但是 如果不能達(dá)成具有約束力的協(xié)議 我們雙方 都會(huì)使用導(dǎo)彈 結(jié)果我們的狀況變差了 卡特爾成員欺騙問(wèn)題也是一個(gè)好例子 現(xiàn)在將策略認(rèn)罪看成 生產(chǎn)比你的份額更多的產(chǎn) 量 將不認(rèn)罪看成 堅(jiān)持生產(chǎn)原來(lái)的份額 如果你認(rèn)為其他的企業(yè)將堅(jiān)持它們各自的份額 那么多生產(chǎn)對(duì)你是有利的 如果你認(rèn)為其他企業(yè)會(huì)多生產(chǎn) 那么你可能也多生產(chǎn) 囚犯的難題問(wèn)題讓人們激烈辯論到底怎樣進(jìn)行博弈才是 正確的 或者 更準(zhǔn)確地說(shuō) 參與博弈的合理方式是什么 答案似乎取決于你參與的是一次博弈還是無(wú)限次的博弈 如果博弈只進(jìn)行一次 欺騙的策略 在囚犯兩難中是指認(rèn)罪的策略 將是合理的 畢竟 不管其他人的策略如何 你選擇這種策略都會(huì)讓你的狀況變好 而且你無(wú)法影響其他人的行 為 28 5 重復(fù)博弈 在上一節(jié) 選手只相遇一次而且他們也只參與一次囚犯兩難博弈 但是 如果這些選手 重復(fù)進(jìn)行博弈 情形將會(huì)有所不同 在這種情形下 每個(gè)選手都可能想出新的策略 如果其 他選手在某一輪博弈中選擇的測(cè)策略為背叛 那么你可以在下一輪選擇背叛的策略 因此 你的對(duì)手會(huì)因?yàn)?惡劣的 行為而 受到懲罰 在一個(gè)重復(fù)博弈中 每個(gè)選手都有機(jī)會(huì)為 自己塑造合作的聲望 因此鼓勵(lì)其他選手也這么做 這種策略是否可行 取決于博弈是進(jìn)行既定既定既定既定 的次數(shù) 比如 10 次 還是進(jìn)行無(wú)限無(wú)限無(wú)限無(wú)限 次 我們首先分析第一種情形 假設(shè)兩個(gè)選手知道博弈將進(jìn)行 10 次 該博弈的結(jié)果是什么 我們從第 10 輪開(kāi)始分析 這是上述博弈的最后一輪 在這種情形下 似乎每個(gè)選手都會(huì)選 擇占優(yōu)策略即背叛 畢竟 最后一輪博弈和只進(jìn)行一次的博弈米什么區(qū)別 所以我們可以預(yù) 28 博弈理論 曹乾 東南大學(xué) caoqianseu 8 期這兩種博弈的結(jié)果是一樣的 現(xiàn)在分析第 9 輪的結(jié)果 我們剛得出結(jié)論即每個(gè)選手都會(huì)在第 10 輪選擇背叛的策略 既然這樣 他們會(huì)在第 9 輪合作嗎 不會(huì) 如果你選擇合作 但是對(duì)方可能會(huì)利用你善良的 天性 從而選擇背叛 每個(gè)選手都可以同樣推理 因此每個(gè)選手都會(huì)選擇背叛 現(xiàn)在考慮第 8 輪 如果某個(gè)選手在第 9 輪選擇背叛 以此類推 如果選手都知道博弈進(jìn) 行的具體次數(shù) 那么每個(gè)選手在每一輪都會(huì)選擇背叛 如果無(wú)法強(qiáng)制選手在最后一輪合作 自然也無(wú)法強(qiáng)制選手從第一輪直至最后一輪選擇合作 選手相互進(jìn)行合作的原因 是希望將來(lái)進(jìn)一步合作 但是這要求將來(lái)還有博弈的機(jī)會(huì) 由于在最后一輪 選手們都知道將來(lái)不可能再進(jìn)行博弈 沒(méi)有人會(huì)選擇合作 既然這樣 他 們?yōu)槭裁丛诘箶?shù)第二輪合作嗎 或者在倒數(shù)第三輪合作 以此類推 在囚犯困境博弈中 若選手都知道博弈的具體次數(shù) 那么合作解從最后一輪博弈將象多米諾骨牌一樣開(kāi)始 倒 塌 因此均衡解必然是選手都選擇背叛 但是如果博弈將重復(fù)無(wú)限次 那么你的確的確的確的確 可以找到影響對(duì)手行為的方法 如果對(duì)手這一 次不合作 那么下一次你可以拒絕合作 只要雙方都非??粗貙?lái)的收益 將來(lái)不合作的這 種威脅足以讓人們選擇帕累托有效率的策略 即都選擇合作 羅伯特 阿克塞羅德 Robert Axelrod 在進(jìn)行了一系列實(shí)驗(yàn)后令人信服地證明了上述結(jié) 論 一 他懇請(qǐng)博弈論領(lǐng)域的幾十位專家 向他提交他們認(rèn)為的囚犯困境的最優(yōu)策略 然后 他在計(jì)算機(jī)上開(kāi)展了 錦標(biāo)賽 讓這些策略互相進(jìn)行比賽 在計(jì)算機(jī)上 每種策略都要和 其他每一種策略競(jìng)爭(zhēng) 計(jì)算機(jī)實(shí)時(shí)記錄博弈收益 最終獲勝的策略 收益最高的策略 竟然是一種最為簡(jiǎn)單的策略 這種策略叫做 以牙還牙 tit for tat 它的運(yùn)行方式如下 在第一輪 你合作 即選擇不認(rèn)罪的策略 在以后的每一輪 如果你的對(duì)手在前一輪選擇合作 你也選擇合作 如果對(duì)方在上一輪選擇 背叛 你也選擇背叛 換句話說(shuō) 每個(gè)人的策略是選擇對(duì)方在上一輪的策略 以牙還牙策略收益最高 因?yàn)樗鼘?duì)背叛行為立即實(shí)施懲罰措施 這種策略也是一種寬 恕的策略 發(fā)現(xiàn)一次背叛 只懲罰一次 如果對(duì)方改邪歸正開(kāi)始合作 那么以牙還牙策略將 以合作回報(bào)對(duì)方 在囚犯困境博弈將進(jìn)行無(wú)限次的情形下 以牙還牙策略似乎是實(shí)現(xiàn)有效率 結(jié)果的一種非常好的機(jī)制 一 Robert Axelrod is a political scientist from the University of Michigan For an extended discussion see his book The Evolution of Cooperation New York Basic Books 1984 28 博弈理論 曹乾 東南大學(xué) caoqianseu 9 28 6 實(shí)施卡特爾 在第 27 章 我們分析了雙頭壟斷制定價(jià)格的博弈行為 在那一章我們斷言 如果每個(gè) 壟斷企業(yè)能夠選擇價(jià)格 那么均衡結(jié)果將是競(jìng)爭(zhēng)均衡 如果每個(gè)企業(yè)認(rèn)為其他企業(yè)會(huì)保持價(jià) 格固定不變 那么每個(gè)企業(yè)都會(huì)發(fā)現(xiàn)降價(jià)是有利可圖的 這個(gè)結(jié)論只有在下列情形下才不會(huì) 成立 每個(gè)企業(yè)的要價(jià)已是最低可能的價(jià)格 在 27 章的那個(gè)例子中 這個(gè)最低價(jià)格為零 因?yàn)槲覀兗僭O(shè)邊際成本為零 如果使用本章的術(shù)語(yǔ)表達(dá) 每個(gè)企業(yè)索要零價(jià)格是定價(jià)策略中 的一個(gè)納什均衡 但在第 27 章我們將其稱為伯特蘭均衡 雙頭壟斷的定價(jià)策略博弈 和囚犯的兩難博弈具有同樣的收益矩陣的結(jié)構(gòu) 如果每個(gè)企 業(yè)索要高價(jià) 那么每個(gè)企業(yè)都能得到更大的利潤(rùn) 這種情形就是它們合謀成卡特爾 并且堅(jiān) 持生產(chǎn)壟斷產(chǎn)量 但是如果一個(gè)企業(yè)索要高價(jià) 另外一個(gè)企業(yè)稍微降低一點(diǎn)價(jià)格就是值得的 因?yàn)檫@樣做可以?shī)Z取其他企業(yè)的市場(chǎng) 因此得到更大的利潤(rùn) 但是 如果兩個(gè)企業(yè)都降低講 個(gè) 它們最終得到的利潤(rùn)都降低了 不論對(duì)方索要什么樣的價(jià)格 你稍微降低一點(diǎn)價(jià)格總是 有利可圖的 當(dāng)然前提是價(jià)格仍大等于邊際成本 納什均衡發(fā)生在每個(gè)企業(yè)索要最低可能的 價(jià)格 然而 如果博弈重復(fù)進(jìn)行無(wú)限次 那么可能還有其它結(jié)果 假設(shè)你決定實(shí)施以牙還牙策 略 如果另外一個(gè)企業(yè)這周降價(jià) 你可以在下周降價(jià) 如果每個(gè)選手知道對(duì)方都會(huì)以牙還牙 那么每個(gè)選手都不會(huì)降低價(jià)格 因?yàn)檫@樣會(huì)引起價(jià)格大戰(zhàn) 各個(gè)選手的利益都受損 因此 以牙還牙的潛在威脅 能夠使得所有企業(yè)維持高價(jià) 現(xiàn)實(shí)生活中的卡特爾有時(shí)會(huì)使用以牙還牙策略 例如 聯(lián)合執(zhí)行委員會(huì)是一個(gè)有名的卡 特爾 它在 1800 年代后期負(fù)責(zé)制定美國(guó)鐵路貨運(yùn)的價(jià)格 這個(gè)卡特爾形成于美國(guó)反壟斷法 規(guī)生效之前 當(dāng)時(shí)它是完全合法的 一 這個(gè)卡特爾負(fù)責(zé)確定每個(gè)鐵路公司貨運(yùn)的市場(chǎng)份額 每個(gè)企業(yè)獨(dú)立制定自己的運(yùn)費(fèi)標(biāo) 準(zhǔn) 該卡特爾記錄每個(gè)鐵路公司的貨運(yùn)數(shù)量 然而 在 1881 1884 和 1885 年間 有些公司 認(rèn)為其他成員公司偷偷降價(jià)來(lái)增加它們自身的市場(chǎng)份額 盡管所有公司事先約定不準(zhǔn)降價(jià) 在這個(gè)時(shí)期 經(jīng)常發(fā)生價(jià)格大戰(zhàn) 當(dāng)一個(gè)公司試圖欺騙 所有其他公司都會(huì)降低價(jià)格以 懲 罰 背叛者 這種以牙還牙策略顯然能夠保證卡特爾穩(wěn)定運(yùn)行一段時(shí)間 例子 機(jī)票定價(jià)中的以牙還牙策略 機(jī)票定價(jià)為以牙還牙行為提供了一個(gè)有趣的例子 航空公司經(jīng)常會(huì)提供這種或那種促 銷價(jià)格 航空業(yè)中的很多研究者認(rèn)為 這些促銷價(jià)格是用來(lái)向競(jìng)爭(zhēng)對(duì)手發(fā)送信號(hào) 警告它們 不要降低重要航線的機(jī)票價(jià)格 一 For a detailed analysis see Robert Porter A Study of Cartel Stability the Joint Executive Committee 1880 1886 The Bell Journal of Economics 14 2 Autumn 1983 301 25 28 博弈理論 曹乾 東南大學(xué) caoqianseu 10 美國(guó)某大型航空公司營(yíng)銷總監(jiān)曾描述個(gè)一個(gè)案例 西北航空公司降低了從明尼阿波利 斯市 Minneapolis 到西海岸各個(gè)城市的夜間航班的價(jià)格 目的在于減少空座率 大陸航空 公司則認(rèn)為這種做法是在搶奪它的市場(chǎng)份額 因此宣布降低所有從明尼阿波利斯市到西北各 城市的夜間航班價(jià)格 然而 大陸航空公司的降價(jià)只進(jìn)行了一兩天后就停止了 西北航空將大陸航空這一行為解讀為 大陸航空不想?yún)⑴c價(jià)格競(jìng)爭(zhēng) 它的目的在于讓 西北航空停止夜間航班降價(jià) 但是西北航空公司決定向大陸航空發(fā)送自己的信號(hào) 它對(duì)從休 斯頓到西海岸各個(gè)城市的航班都制定了一套便宜的價(jià)格 要知道休斯頓可是大陸航空的總部 所在地 西北航空傳遞的信號(hào)想表明 它的降價(jià)措施是正當(dāng)合理的 而大陸航空的反應(yīng)是不 恰當(dāng)?shù)?所有這些降價(jià)活動(dòng)持續(xù)時(shí)間都很短 這個(gè)特征似乎表明 降價(jià)行為的本意在于發(fā)出競(jìng) 爭(zhēng)的信號(hào)而不是爭(zhēng)奪更大的市場(chǎng)份額 正如這位總監(jiān)解釋的 航空公司并不想提供含有價(jià)格 適用期的機(jī)票 它們的目的是最終能使競(jìng)爭(zhēng)活躍起來(lái)并且展開(kāi)競(jìng)爭(zhēng) 雙頭壟斷的航空市場(chǎng)上的潛規(guī)則似乎為 如果一家公司的機(jī)票價(jià)格高 我的機(jī)票價(jià)格 也高 但是如果對(duì)方降低價(jià)格 那么我就會(huì)以牙還牙 我也降低價(jià)格 換句話說(shuō) 兩個(gè)企業(yè) 都 遵守著一條重要原則 以其人之道還治其人之身 這種報(bào)復(fù)措施使得機(jī)票價(jià)格高昂 一 28 7 序貫博弈 到目前為止 我們分析的博弈都有一個(gè)共同特征 選手都是同時(shí)行動(dòng)的 但在很多情形 下 其中一個(gè)選手可以率先行動(dòng) 其他選手再做出反應(yīng) 這樣的博弈叫做序貫博弈 sequential game 比如第 27 章介紹的斯坦科爾伯格模型就是這樣的例子 在該模型中一 個(gè)選手是領(lǐng)導(dǎo)者 另外一個(gè)選手是追隨者 下面我們分析這樣的博弈 在第一輪 選手 A 率先進(jìn)行選擇 他可以選擇上或下 選 手 B 觀察 A 的選擇 并相應(yīng)作出選擇左或右的決策 該博弈的收益矩陣如表 28 5 所示 注意 當(dāng)這該博弈以表 28 5 這種形式表示時(shí) 它有兩個(gè)納什均衡解 上 左 和 下 右 然而 下面我們將證明其中一個(gè)均衡解是不合理的 收益矩陣隱藏了下列事實(shí) 一個(gè) 選手可以再觀測(cè)另外一個(gè)選手選擇之后 再進(jìn)行選擇 在這種情形下 我們有必要用另外一 種圖形表示博弈的收益 這種圖形能更好地反映該種類型博弈的非對(duì)稱性質(zhì) 圖 28 1 畫(huà)出了這個(gè)博弈的展開(kāi)形 extensive form 展開(kāi)形是博弈的一種表示方法 它能顯示出選擇的先后順序 首先 A 必須選擇上或下 然后 B 必須決定選擇左還是右 一 Facts taken from A Nomani Fare Warning How Airlines Trade Price Plans Wall Street Journal October 9 1990 B1 28 博弈理論 曹乾 東南大學(xué) caoqianseu 11 但是在 B 做出決策時(shí) 他已經(jīng)知道 A 選擇了哪個(gè)策略 表 28 5 一個(gè)序貫博弈的收益矩陣 圖 28 1 博弈的展開(kāi)形式博弈的展開(kāi)形式博弈的展開(kāi)形式博弈的展開(kāi)形式 展開(kāi)形能表示出博弈中選手行動(dòng)的先后順序 這種博弈的分析方法是從后 樹(shù)根 向前 樹(shù)枝 追溯 假設(shè) A 已近作出了選擇 我 們處在該博弈樹(shù)的一個(gè)分枝上 如果 A 選擇上 則不管 B 怎么選擇 A 和 B 的收益分別為 1 和 9 即圖中的 1 9 如果 A 選擇下 則 B 合理的選擇是選擇右 因此收益為 2 1 現(xiàn)在分析 A 的初始選擇 如果他選上 則結(jié)果為 1 9 因此他得到的收益為 1 但是 如果他選擇下 則他得到的收益為 2 因此他會(huì)選擇下 所以 該博弈的均衡解為 下 右 因此 A 的收益為 2 B 的收益為 1 28 博弈理論 曹乾 東南大學(xué) caoqianseu 12 策略 上 左 不是該序貫博弈的合理均衡解 也就是說(shuō) 由于這兩個(gè)選手的行動(dòng)有 先后之分 這個(gè)策略集不是一個(gè)均衡 的確 如果 A 選擇上 則 B 會(huì)選擇左 但 A 不會(huì) 傻到選擇上 從 B 的角度來(lái)看 他相當(dāng)不幸 因?yàn)樗罱K得到的收益為 1 而不是 9 他還有什么招數(shù) 可使嗎 B 可以威脅威脅威脅威脅 A 即若 A 選下 B 就選左 如果 A 認(rèn)為 B 真會(huì)這么做 那么他可能選擇上 因?yàn)檫x擇上他的收益為 1 而選擇下 若 B 實(shí)施威脅計(jì)劃 的收益為 0 但 A 會(huì)相信 B 的威脅嗎 畢竟一旦 A 做出了選擇 就已無(wú)法反悔 B 的收益只能為 0 或 1 他很可能得到 1 除非 B 在某種程度上可以讓 A 相信 他一定會(huì)實(shí)施威脅計(jì)劃 即使 自己利益受損也在所不惜 否則他只能得到較小的收益 B 的問(wèn)題是一旦 A 已經(jīng)做出選擇 A 期望 B 理性行事 如果 B 承諾承諾承諾承諾 在 A 選擇下時(shí) B 會(huì) 選擇左 B 的狀況會(huì)變好 B 做出承諾的一種方式是讓別人為他做出選擇決策 例如 B 可以雇傭律師 讓律師警 告 A 如果 A 選擇下則 B 必定選擇左 如果 A 認(rèn)識(shí)到這種警告的嚴(yán)重性 從他的角度看 結(jié) 果將大不相同 如果他知道 B 對(duì)律師的指示 那么他知道如果他選擇下 他最終的收益為 0 因此 他自然會(huì)選擇上 在這種情形下 B 限定限定限定限定 了自己的策略 從而狀況變得更好 28 8 阻止進(jìn)入的博弈 a game of entry deterrence 我們?cè)诜治鲭p頭壟斷時(shí)假設(shè)行業(yè)中的企業(yè)數(shù)目是固定不變的 但在很多情形下 新企 業(yè)可能會(huì)進(jìn)入該行業(yè) 當(dāng)然 行業(yè)中原有的企業(yè)會(huì)想方設(shè)法阻止新企業(yè)進(jìn)入 由于原有企業(yè) 已在行業(yè)中 他們可以先發(fā)制人 因此在阻止競(jìng)爭(zhēng)對(duì)手進(jìn)入的博弈中具有先行選擇策略的優(yōu) 勢(shì) 例如 假設(shè)某個(gè)壟斷企業(yè)面對(duì)著另外一個(gè)企業(yè)進(jìn)入行業(yè)的威脅 新企業(yè) 進(jìn)入者 決 定是否進(jìn)入市場(chǎng) 原有企業(yè)決定是否降低價(jià)格作為回應(yīng) 如果新企業(yè)決定不進(jìn)入 它得到的 收益為 1 原有企業(yè)得到的收益為 9 如果新企業(yè)決定進(jìn)入 那么它的收益取決于原有企業(yè)是否與它展開(kāi)激烈競(jìng)爭(zhēng) 如果企 業(yè)進(jìn)行競(jìng)爭(zhēng) 那么我們假設(shè)兩個(gè)選手的最終收益都為 0 另一方面 如果原有企業(yè)不進(jìn)行競(jìng) 爭(zhēng) 我們假設(shè)進(jìn)入者得到的收益為 2 原有企業(yè)得到的收益為 1 注意 這正好是我們前面研究過(guò)的序貫博弈的結(jié)構(gòu) 因此它的結(jié)構(gòu)和圖 28 1 是相同的 原有企業(yè)為 B 而潛在進(jìn)入者為 A 策略上為不進(jìn)入 策略下為進(jìn)入 策略左為競(jìng)爭(zhēng) 策略 右為不競(jìng)爭(zhēng) 我們已經(jīng)知道 在這個(gè)博弈中 均衡結(jié)果是潛在進(jìn)入者進(jìn)入 原有企業(yè)不競(jìng)爭(zhēng) 原有企業(yè)的問(wèn)題是它不可能事先承諾若其他企業(yè)進(jìn)入他就會(huì)進(jìn)行競(jìng)爭(zhēng) 如果其他企業(yè)進(jìn) 入 損害已經(jīng)造成 原有企業(yè)的理性行為是接受這一事實(shí)并且和平相處 然而如果潛在進(jìn)入 28 博弈理論 曹乾 東南大學(xué) caoqianseu 13 者認(rèn)識(shí)到這一點(diǎn) 他自然會(huì)認(rèn)為 B 的競(jìng)爭(zhēng)威脅只是口號(hào)般的空話 然而假設(shè)原有企業(yè)可以購(gòu)買額外的生產(chǎn)能力 這樣它就能以目前的邊際成本生產(chǎn)更多的 產(chǎn)量 當(dāng)然 如果它仍然是壟斷者 他不希望實(shí)際增加產(chǎn)量 因?yàn)樵袎艛喈a(chǎn)量已實(shí)現(xiàn)了利 潤(rùn)最大化 但是 如果其他企業(yè)進(jìn)入 原有企業(yè)現(xiàn)在就能生產(chǎn)非常多的產(chǎn)量 因此可以與新進(jìn)入 者展開(kāi)激烈的競(jìng)爭(zhēng) 通過(guò)投資擴(kuò)大額外產(chǎn)能 當(dāng)其他企業(yè)試圖進(jìn)入時(shí) 它就可以降低成本打 擊進(jìn)入者 假設(shè)如果原有企業(yè)購(gòu)買額外產(chǎn)能而且選擇競(jìng)爭(zhēng)的話 那么他的收益為 2 這樣博 弈樹(shù) 28 1 就變?yōu)榱瞬┺臉?shù) 28 2 圖 28 2 阻止進(jìn)入的博弈模型阻止進(jìn)入的博弈模型阻止進(jìn)入的博弈模型阻止進(jìn)入的博弈模型 該圖與 28 1 相比 收益發(fā)生了變化 現(xiàn)在 由于增加了生產(chǎn)能力 競(jìng)爭(zhēng)的威脅就是可信的 如果潛在進(jìn)入者進(jìn)入 若原有 企業(yè)競(jìng)爭(zhēng)他得到的收益為 2 若不競(jìng)爭(zhēng)他的收益為 1 因此原有企業(yè)自然會(huì)選擇競(jìng)爭(zhēng) 潛在 進(jìn)入者如果進(jìn)入得到的收益為 0 如果不進(jìn)入得到的收益為 1 因此他自然會(huì)選擇不進(jìn)入 但是 這意味著原有企業(yè)仍然是唯一的壟斷者 它根本不會(huì)使用額外的生產(chǎn)能力 盡 管如此 壟斷則投資擴(kuò)大產(chǎn)能還是值得的 因?yàn)樵谛缕髽I(yè)試圖進(jìn)入市場(chǎng)時(shí) 它能夠做到讓對(duì) 方相信它有能力對(duì)進(jìn)入者進(jìn)行打擊 壟斷者投資于 過(guò)剩 產(chǎn)能的目的 在于向潛在進(jìn)入者 發(fā)送信號(hào) 膽敢進(jìn)入 必遭痛擊 28 博弈理論 曹乾 東南大學(xué) caoqianseu 14 1 博弈的一種表示方法是 對(duì)選手的每個(gè)策略賦予相應(yīng)收益 2 一個(gè)占優(yōu)策略均衡是指一組選擇 這組選擇具有下列特征 不論對(duì)方選擇何種策略 每個(gè)選手的選擇的策略都是最優(yōu)的 3 一個(gè)納什均衡是指一組選擇 對(duì)于這組選擇 給定其它選手的選擇 每個(gè)選手的選擇 都是最優(yōu)的 4 囚犯的兩難是一種特殊的博弈 因?yàn)樵谠摬┺闹?選手選擇的策略導(dǎo)致的是帕累托無(wú) 效率的結(jié)果 而不是帕累托有效率的結(jié)果 5 在序貫博弈中 選手選擇的先后順序非常重要 在這類博弈中 如果某個(gè)選手向其它 選手事先承諾 他會(huì)沿著既定的路線進(jìn)行博弈 那么它將處于有利地位 1 在重復(fù)進(jìn)行的囚犯兩難博弈中 如果選手的策略都為以牙還牙 假設(shè)某個(gè)選手的本意 是合作卻不慎犯錯(cuò) 他背叛了 如果在下面回合的博弈中 這兩個(gè)選手仍然以牙還牙 那 么結(jié)果將如何 2 占優(yōu)策略均衡一定是納什均衡嗎 納什均衡一定是占優(yōu)策略均衡嗎 3 假設(shè)你的對(duì)手選擇的不是他的納什均衡策略 那么你還應(yīng)該繼續(xù)選擇你的納什均衡策 略嗎 4 我們知道如果囚犯兩難博弈只進(jìn)行一次 那么它的結(jié)果是占優(yōu)策略均衡 這一結(jié)果不 是帕累托有效率的 如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方 這樣的行為將影響到 該博弈的哪些方面 它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎 5 如果兩個(gè)選手都知道他們之間的囚犯兩難博弈將進(jìn)行 100 萬(wàn)次 那么該博弈的占優(yōu)納 什均衡策略是什么 如果你真得找到兩個(gè)選手進(jìn)行這樣的實(shí)驗(yàn) 而且實(shí)驗(yàn) 100 萬(wàn)次 你能預(yù) 測(cè)出他們會(huì)使用什么策略嗎 6 在教材圖 28 1 表示的序貫博弈中 如果選手 B 而不是 A 先進(jìn)行選擇 請(qǐng)畫(huà)出該新博 弈的展開(kāi)形 該博弈的均衡解是什么 選手 B 更喜歡自己先選擇還是更喜歡讓 A 先選擇 復(fù)習(xí)題復(fù)習(xí)題復(fù)習(xí)題復(fù)習(xí)題 總結(jié)總結(jié)總結(jié)總結(jié) 28 博弈理論 曹乾 東南大學(xué) caoqianseu 15 1 在重復(fù)進(jìn)行的囚犯兩難博弈中在重復(fù)進(jìn)行的囚犯兩難博弈中在重復(fù)進(jìn)行的囚犯兩難博弈中在重復(fù)進(jìn)行的囚犯兩難博弈中 如果選手的策略都為以牙還牙如果選手的策略都為以牙還牙如果選手的策略都為以牙還牙如果選手的策略都為以牙還牙 假設(shè)某個(gè)選手的本意是合假設(shè)某個(gè)選手的本意是合假設(shè)某個(gè)選手的本意是合假設(shè)某個(gè)選手的本意是合 作卻不慎犯錯(cuò)作卻不慎犯錯(cuò)作卻不慎犯錯(cuò)作卻不慎犯錯(cuò) 他背叛了他背叛了他背叛了他背叛了 如果在下面回合的博弈中如果在下面回合的博弈中如果在下面回合的博弈中如果在下面回合的博弈中 這兩個(gè)選手仍然以牙還牙這兩個(gè)選手仍然以牙還牙這兩個(gè)選手仍然以牙還牙這兩個(gè)選手仍然以牙還牙 那么那么那么那么 結(jié)果將如何結(jié)果將如何結(jié)果將如何結(jié)果將如何 復(fù)習(xí)內(nèi)容 囚犯的兩難博弈 以牙還牙策略 以牙還牙 tit for tat 策略運(yùn)行方式如下 在第一輪 你合作 在以后的每一輪 如果 你的對(duì)手在前一輪選擇合作 你也選擇合作 如果對(duì)方在上一輪選擇背叛 你也選擇背叛 換句話說(shuō) 每個(gè)人的策略是選擇對(duì)方在上一輪的策略 以牙還牙策略收益最高 因?yàn)樗鼘?duì)背叛行為立即實(shí)施懲罰措施 這種策略也是一種寬恕 的策略 發(fā)現(xiàn)一次背叛 只懲罰一次 如果對(duì)方改邪歸正開(kāi)始合作 那么以牙還牙策略將以 合作回報(bào)對(duì)方 在囚犯困境博弈將進(jìn)行無(wú)限次的情形下 以牙還牙策略似乎是實(shí)現(xiàn)有效率結(jié) 果的一種非常好的機(jī)制 參考答案 在重復(fù)進(jìn)行的囚犯兩難博弈中 以牙還牙策略 簡(jiǎn)單地說(shuō)是指 每個(gè)選手選擇對(duì)方在上 一輪的策略 由題目可知 如果某選手 A 不慎背叛 即使不是出自其本意 但如果 B 無(wú)法了解這些 信息 那么它會(huì)認(rèn)為 A 的行為是真正的背叛 按照以牙還牙的邏輯 B 在第二輪中的策略 他應(yīng)選擇 A 在上一輪中的策略 即選擇 背叛 這個(gè)信號(hào)會(huì)讓 B 在下一輪中也選擇背叛 以此類推 選手 A 和 B 不斷地以背叛策略 作為對(duì)對(duì)方背叛的反應(yīng) 這個(gè)例子說(shuō)明 如果博弈中某個(gè)選手不慎犯錯(cuò) 他應(yīng)該及時(shí)溝通 否則大家將一直背叛 到底 這樣的結(jié)果顯然不是帕累托有效率的 也就是說(shuō)在這種情形下 以牙還牙不再是一個(gè) 很好的策略 2 占優(yōu)策略均衡一定是納什均衡嗎占優(yōu)策略均衡一定是納什均衡嗎占優(yōu)策略均衡一定是納什均衡嗎占優(yōu)策略均衡一定是納什均衡嗎 納什均衡一定是占優(yōu)策略均衡嗎納什均衡一定是占優(yōu)策略均衡嗎納什均衡一定是占優(yōu)策略均衡嗎納什均衡一定是占優(yōu)策略均衡嗎 復(fù)習(xí)內(nèi)容 占優(yōu)策略均衡和納什均衡 占優(yōu)策略是指 不管對(duì)方選擇哪個(gè)策略 你的最優(yōu)選擇是唯一的 也就是我們通常所說(shuō) 的 以不變應(yīng)萬(wàn)變 這里的 不變 的策略就是你的占優(yōu)策略 如果均衡時(shí)每個(gè)對(duì)手選擇 的都是占優(yōu)策略 那么該均衡就是占優(yōu)策略均衡 復(fù)習(xí)題答案復(fù)習(xí)題答案復(fù)習(xí)題答案復(fù)習(xí)題答案 28 博弈理論 曹乾 東南大學(xué) caoqianseu 16 納什均衡 簡(jiǎn)單地說(shuō) 你的選擇根據(jù)對(duì)手的選擇相應(yīng)調(diào)整 在均衡時(shí) 雙方都不會(huì)再改 變策略 我們通常所說(shuō)的 兵來(lái)將擋 水來(lái)土掩 就是納什均衡的例子 參考答案 占優(yōu)策略均衡一定是納什均衡占優(yōu)策略均衡一定是納什均衡占優(yōu)策略均衡一定是納什均衡占優(yōu)策略均衡一定是納什均衡 納什均衡未必是占優(yōu)策略均衡納什均衡未必是占優(yōu)策略均衡納什均衡未必是占優(yōu)策略均衡納什均衡未必是占優(yōu)策略均衡 占優(yōu)策略均衡要求對(duì)于 B 的所有所有所有所有 選擇 A 的選擇都是最優(yōu)的 而納什均衡僅要求 對(duì) 于 B 的最優(yōu)最優(yōu)最優(yōu)最優(yōu) 選擇來(lái)說(shuō) A 的選擇是最優(yōu)的即可 由于 A 和 B 的地位是對(duì)稱的 你可以類似 推理 B 的選擇 由此可見(jiàn) 占優(yōu)策略均衡是納什均衡的一種 因?yàn)槿绻?A 選擇的策略對(duì) B 的所有所有所有所有 策略來(lái)說(shuō)都是最優(yōu)的 那么顯然 A 選擇的策略對(duì) B 的最優(yōu)最優(yōu)最優(yōu)最優(yōu) 策略來(lái)說(shuō)也是最優(yōu)的 納什均衡未必是占優(yōu)策略均衡 比如在 剪刀石頭布 游戲中不存在占優(yōu)策略均衡 但 存在納什 混合策略 均衡 既然我們已經(jīng)舉出了一個(gè)博弈是納什均衡但不是占優(yōu)策略均衡 的例子 而且我們又知道占優(yōu)策略均衡一定是納什均衡 我們當(dāng)然可以斷言 納什均衡未必 是占優(yōu)策略均衡 3 假設(shè)你的對(duì)手選擇的不是他的納什均衡策略假設(shè)你的對(duì)手選擇的不是他的納什均衡策略假設(shè)你的對(duì)手選擇的不是他的納什均衡策略假設(shè)你的對(duì)手選擇的不是他的納什均衡策略 那么你還應(yīng)該繼續(xù)選擇你的納什均衡策略那么你還應(yīng)該繼續(xù)選擇你的納什均衡策略那么你還應(yīng)該繼續(xù)選擇你的納什均衡策略那么你還應(yīng)該繼續(xù)選擇你的納什均衡策略 嗎嗎嗎嗎 復(fù)習(xí)內(nèi)容 納什均衡策略 參考答案 你可能但一般不會(huì)繼續(xù)選擇納什均衡策略 原因如下 納什均衡策略是指對(duì)方采用納什均衡策略時(shí) 你選擇的最優(yōu)策略 典型的納什均衡要求 雙方的決策是相互依賴的 你必須根據(jù)對(duì)手的選擇相應(yīng)出招 如果兩個(gè)選手都是理性的 那 么納什均衡結(jié)果是 勢(shì)均力敵的 也就是說(shuō)給定對(duì)方的最優(yōu)選擇 你的選擇也是最優(yōu)的 比如足球比賽中你若是前鋒 在與對(duì)方守門員的博弈中 若你和守門員都是理性的 那 么你們的策略顯然是相互依賴的 比如你踢向球門左方 守門員的最優(yōu)選擇就是撲向左方 我們假設(shè)不管什么原因 該守門員總是撲向左方 你自然會(huì)選擇踢向右方 這個(gè)例子說(shuō)明 如果對(duì)方選擇的不是納什均衡策略 那么一般情形下你會(huì)有更好的選擇 也就是說(shuō)你不會(huì)繼續(xù)選擇納什均衡策略 但是 需要注意 由于占優(yōu)策略均衡是一種比較特殊的納什均衡 在這種情形下 不管 對(duì)方怎么選擇 你的策略都是不變的 因此 你會(huì)繼續(xù)選擇你的占優(yōu)策略 綜合以上兩種情形 可知答案為如果對(duì)方選擇的不是納什均衡策略 那么你可能但一般 不會(huì)繼續(xù)選擇納什均衡策略 28 博弈理論 曹乾 東南大學(xué) caoqianseu 17 4 我們知道如果囚犯兩難博弈只進(jìn)行一次我們知道如果囚犯兩難博弈只進(jìn)行一次我們知道如果囚犯兩難博弈只進(jìn)行一次我們知道如果囚犯兩難博弈只進(jìn)行一次 那么它的結(jié)果是占優(yōu)策略均衡那么它的結(jié)果是占優(yōu)策略均衡那么它的結(jié)果是占優(yōu)策略均衡那么它的結(jié)果是占優(yōu)策略均衡 這一結(jié)果不是帕這一結(jié)果不是帕這一結(jié)果不是帕這一結(jié)果不是帕 累托有效率的累托有效率的累托有效率的累托有效率的 如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方如果兩個(gè)罪犯在刑期結(jié)束即被釋放后會(huì)報(bào)復(fù)對(duì)方 這樣的行為將影響到該這樣的行為將影響到該這樣的行為將影響到該這樣的行為將影響到該 博弈的哪些方面博弈的哪些方面博弈的哪些方面博弈的哪些方面 它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎它能實(shí)現(xiàn)帕累托有效率的結(jié)果嗎 復(fù)習(xí)內(nèi)容 囚犯兩難博弈 重復(fù)博弈 在重復(fù)進(jìn)行的囚犯兩難博弈中 每個(gè)選手都可能想出新的策略 如果其他選手在某一輪 博弈中選擇的測(cè)策略為背叛 那么你可以在下一輪選擇背叛的策略 因此 你的對(duì)手會(huì)因?yàn)?惡劣的 行為而 受到懲罰 在一個(gè)重復(fù)博弈中 每個(gè)選手都有機(jī)會(huì)為自己塑造合作的 聲望 因此鼓勵(lì)其他選手也這么做 因此 面臨報(bào)復(fù)的威脅時(shí) 參與博弈的選手都會(huì)重新思考和進(jìn)行選擇 在這種情形下 會(huì)改變博弈的收益 從而改變了博弈的結(jié)果 在該情形下 選手很可能選擇合作 因此 產(chǎn) 生了帕累托有效率的結(jié)果 但是如果這種威脅并不可信 那么選手就不會(huì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論