




已閱讀5頁,還剩147頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1 博弈論 第二章完全信息靜態(tài)博弈 2 前言 完全信息靜態(tài)博弈 各博弈方同時(shí)決策 且所有博弈方對各方得益都了解的博弈 完全信息靜態(tài)博弈是非合作博弈中最基本的類型 囚徒困境 齊威王田忌賽馬 猜硬幣 石頭剪子布 古諾產(chǎn)量決策都屬于完全信息靜態(tài)博弈 博弈有兩種表述方法 1 策略型表述 適合表示靜態(tài)博弈 2 擴(kuò)展型 博弈樹 表述 適合表示動態(tài)博弈 3 本章主要內(nèi)容 2 1基本分析思路和方法2 2納什均衡2 3無限策略博弈分析和反應(yīng)函數(shù)2 4混合策略和混合策略納什均衡2 5納什均衡的存在性2 6納什均衡的選擇和分析方法擴(kuò)展 4 2 1基本分析思路和方法 2 1 1上策均衡2 1 2嚴(yán)格下策反復(fù)消去法2 1 3劃線法2 1 4箭頭法 5 2 1 1上策均衡 上策 Dominantstrategy 在某個(gè)博弈中 如果不管其他博弈方選擇什么策略 一博弈方的某個(gè)策略給他帶來的得益始終高于其他 所有 策略 至少不低于其他策略 上策均衡 Dominant strategyEquilibrium 如果一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方各自的上策 那么這個(gè)策略組合肯定是所有博弈方都愿意選擇的 必然是該博弈比較穩(wěn)定的結(jié)果 我們稱這樣的策略組合為該博弈的一個(gè)上策均衡 6 2 1 1上策均衡 因?yàn)樯喜呔夥从沉怂胁┺姆降慕^對偏好 因此非常穩(wěn)定 跟據(jù)上策均衡可以對博弈結(jié)果做出最肯定的預(yù)測 進(jìn)行博弈分析時(shí) 首先判斷各個(gè)博弈方是否都有上策 是否存在上策均衡 7 2 1 1上策均衡 例1 囚徒困境對于囚徒1 策略 坦白 的得益向量為 5 0 策略 不坦白 的得益向量為 8 1 顯然 5 0 8 1 所以 坦白 對于囚徒1來說是一個(gè)上策 8 2 1 1上策均衡 同理 對于囚徒2 策略 坦白 的得益向量為 策略不坦白的得益向量為 顯然 所以 坦白 對于囚徒2來說是一個(gè)上策 那么 坦白 坦白 就是該博弈的一個(gè)上策均衡 這種策略的組合是穩(wěn)定的 9 2 1 1上策均衡 例2 市場競爭中典型的囚徒困境現(xiàn)象之一寡頭1 低價(jià) 150 70 高價(jià) 100 20 寡頭2 低價(jià) 150 70 高價(jià) 100 20 低價(jià)均為兩個(gè)博弈者的上策 上策均衡即為 低價(jià) 低價(jià) 10 2 1 1上策均衡 上策均衡不是普遍存在的 需要雙方都存在上策 有些博弈就是不存在上策 如 猜硬幣博弈博弈的參與人都不存在上策 博弈也就不存在所謂的上策均衡 11 2 1 2嚴(yán)格下策反復(fù)消去法 嚴(yán)格下策反復(fù)消去法思路和原理 嚴(yán)格下策 StrictlyDominatedStrategy 不管其他博弈方的策略如何變化 一個(gè)博弈方的某種策略給他帶來的得益 總是比另一種或另一些策略給他帶來的得益要小 則稱前一種策略為相對于后一種或一些策略的一個(gè) 嚴(yán)格下策 嚴(yán)格下策是理性博弈方都不會去選擇的策略 可以消去 對于嚴(yán)格下策的消去過程 可以在同一博弈方的策略空間中反復(fù)運(yùn)用 也可以在各個(gè)博弈方的策略空間上交叉運(yùn)用 只要有就可以消去 不必計(jì)較消去的順序與過程 12 例1 無上策 無上策均衡 用嚴(yán)格下策反復(fù)削去法 博弈方一 2 1 2嚴(yán)格下策反復(fù)消去法 博弈方二 對博弈方二 明顯地 右 的得益向量 1 0 中 的得益向量 3 2 所以博弈方二絕對不會選擇 右 13 2 1 2嚴(yán)格下策反復(fù)消去法 例2 智豬博弈 第一步 博弈描述與假設(shè)有兩頭非常聰明的豬 一大一小 共同生活在一個(gè)豬圈里 豬圈的一端有一個(gè)踏板 踏板連著開放飼料的機(jī)關(guān) 只要踏一下 在豬圈的另外一端的食槽就會出現(xiàn)10個(gè)單位食物 任何一頭豬去踏這個(gè)踏板都會付出相當(dāng)于2個(gè)單位食物的成本 每只豬都可以選擇 踏 或 不踏 踏板 大豬比小豬吃得快 兩頭豬跑得一樣快 食槽 10 大豬 小豬 踏板 14 2 1 2嚴(yán)格下策反復(fù)消去法 第二步 要素分析 1 局中人 大豬 小豬 2 策略集合 均為 踏 不踏 3 行為順序 同時(shí)決策 4 得益 見下頁分析 15 2 1 2嚴(yán)格下策反復(fù)消去法 踏 需要豬跑一個(gè)折返 不踏 的豬只需要在食槽旁等食 情況1 一起跑去踏 一起折返 一起吃 大豬吃8 小豬吃2 情況2 大豬踏 小豬等 大豬踏完往回跑的時(shí)候 小豬趁機(jī)多吃2 大豬只能吃6單位 小豬可以吃4單位 情況3 小豬踏 大豬等 小豬踏完往回跑的時(shí)候 大豬趁機(jī)把10單位的食物都吃了 小豬白跑吃不到食物 情況4 都不踏 都忍著 沒有食物吃 食槽 10 大豬 小豬 踏板 16 2 1 2嚴(yán)格下策反復(fù)消去法 減去2單位 踏 的成本后 兩頭豬在各種情形下的得益 情況一 同時(shí)踏 大豬8 2 6 小豬2 2 0 情況二 大豬踏 小豬等候 大豬6 2 4 小豬4 情況三 小豬踏 大豬等候 大豬10 小豬0 2 2 情況四 都不踏 無食物無成本 大豬0 小豬0 兩頭豬的得益矩陣 見上方 17 2 1 2嚴(yán)格下策反復(fù)消去法 第三步 分析求解最終穩(wěn)定的策略組合為 大豬 踏 小豬 不踏 第四步 結(jié)構(gòu)分析 模型簡單 18 2 1 2嚴(yán)格下策反復(fù)消去法 第五步 啟示 結(jié)論與建議現(xiàn)實(shí)中某些 搭便車 現(xiàn)象的博弈解釋 這種現(xiàn)象 主要是由于局中人對某項(xiàng)事物或工作的效用有很大差異 具有大效用的局中人有時(shí)不得不付出更多的勞動 而對于這項(xiàng)事物或工作持可有可無態(tài)度的局中人往往就 搭便車 其他現(xiàn)象 團(tuán)隊(duì)合作等 問題 如何解決 作業(yè)題1 19 2 1 2嚴(yán)格下策反復(fù)消去法 關(guān)于作業(yè) 請手寫 勿打印 別著急寫 不急著交 等課程基本結(jié)束以后 要前后聯(lián)系課程內(nèi)容 寫出結(jié)論就可以 不必復(fù)雜的公式與推導(dǎo) 不必正規(guī)的陳述 沒有什么格式要求 只需要寫出對這個(gè)問題的看法 自己想到的解決方案 里面用到了那些博弈思想就可以了 20 2 1 2嚴(yán)格下策反復(fù)消去法 練習(xí)一 博弈方1沒有嚴(yán)格下策 從博弈方2開始 博弈的得益結(jié)構(gòu)發(fā)生改變 下策可能就出現(xiàn)了 21 2 1 3劃線法 與上策分析法的情形類似 大部分博弈是不存在嚴(yán)格下策的 雖然與上策均衡分析法相比 嚴(yán)格下策反復(fù)消去法適應(yīng)更多情況 但是仍然不能夠滿足博弈分析的要求 我們需要一種更普遍適用的博弈分析方法 劃線法 22 2 1 3劃線法 劃線法的思路和方法先找出自己針對其他博弈方每種策略或策略組合的最佳策略 即找最佳對策 這種最佳策略可能不唯一 然后在此基礎(chǔ)上 通過對其他博弈方策略選擇的判斷 包括對其他博弈方對自己策略判斷的判斷等 我知道 對方知道我會選擇某個(gè)策略的判斷 預(yù)測可能結(jié)果和確定自己的最優(yōu)策略 23 2 1 3劃線法 例1 24 2 1 3劃線法 例2 囚徒困境 25 2 1 3劃線法 例3 猜硬幣博弈 此博弈不存在確定性結(jié)果 沒有策略組合是雙方同時(shí)愿意接受的 我們不能預(yù)測這個(gè)博弈的結(jié)果 26 例4 夫妻之爭 現(xiàn)實(shí)中的例子 兩人同時(shí)出發(fā)到不同地方匯合 企業(yè)之間關(guān)聯(lián)產(chǎn)品技術(shù)和規(guī)格等方面的合作也是類似博弈 2 1 3劃線法 27 2 1 3劃線法 夫妻之爭有兩個(gè)具有穩(wěn)定性的結(jié)果 哪一個(gè)結(jié)果出現(xiàn)都是合理的 具體選擇哪一個(gè)不得而知 但是 我們可以猜測到 這個(gè)博弈的結(jié)果會受到夫妻在家庭中的實(shí)際地位的影響 如果在家庭中 丈夫是強(qiáng)勢的 那么 最后博弈的結(jié)果很可能是夫婦一起看足球 如果妻子是強(qiáng)勢的 那么很可能夫婦二人一起看時(shí)裝 28 例5 公共資源的過度使用 公共地悲劇 現(xiàn)實(shí)生活中的例子 如免費(fèi)校園網(wǎng)絡(luò)的使用 免費(fèi)道路的使用 解決辦法 消除或減弱公共物品的性質(zhì) 如收費(fèi) 發(fā)許可等 2 1 3劃線法 29 2 1 4箭頭法 箭頭法思路與方法利用策略組合的穩(wěn)定性和局中人的策略選擇 動機(jī) 為思路 對博弈模型的結(jié)果進(jìn)行分析和預(yù)測 30 2 1 4箭頭法 例1 囚徒困境從任意一個(gè)策略組合開始分析 這里從 不坦白 不坦白 這個(gè)策略組合開始 博弈參與人得益的提高是改變策略的動機(jī) 由囚徒1開始分析 31 2 1 4箭頭法 例2 夫妻之爭 32 2 1 4箭頭法 例3 猜硬幣博弈 33 2 1 4箭頭法 例4 公共地的悲劇 34 2 1 4箭頭法 箭頭有進(jìn)無出的策略組合 表明此時(shí)博弈局中人已經(jīng)沒有改變策略的動機(jī) 即博弈方再改變策略已經(jīng)不能帶來得益的提高 因此 箭頭有進(jìn)無出的策略組合是穩(wěn)定的策略組合 箭頭法可以清晰地表明局中人改變行為決策的 動機(jī) 即得益 payoff 的提高 但如果博弈過于復(fù)雜 得益矩陣過于繁瑣 箭頭法的可用性就不強(qiáng)了 35 2 2納什均衡 2 2 1納什均衡的定義2 2 2納什均衡的一致預(yù)測性質(zhì)2 2 3納什均衡與嚴(yán)格下策反復(fù)消去法 36 2 2 1納什均衡的定義 博弈 博弈方的策略空間和得益的一般表示法 G表示一個(gè)博弈 n個(gè)博弈方 S1 S2 Sn表示每個(gè)博弈方的可選策略集合 稱為策略空間 Sij Si表示博弈方i的第j個(gè)策略 博弈方i的得益用ui表示 ui是各博弈方策略的多元函數(shù) n個(gè)博弈方的博弈G S1 S2 Sn u1 u2 un 37 2 2 1納什均衡的定義 納什均衡 NashEquilibrium 定義在博弈中 如果由各個(gè)博弈方的某一個(gè)策略組成的某個(gè)策略組合中 任一博弈方i的策略s i 都是對其余各個(gè)博弈方的組合的最佳對策 也即對任意都成立 則稱為G的一個(gè)納什均衡直白地說 NE就是一組最優(yōu)策略的組合 是每個(gè)參與人都不想改變自身決策的一種策略組合和穩(wěn)定狀態(tài) 38 2 2 2納什均衡的一致預(yù)測性質(zhì) 一致預(yù)測 如果所有博弈方都預(yù)測一個(gè)特定的博弈結(jié)果會出現(xiàn) 那么所有的博弈方都不會利用該預(yù)測或者這種預(yù)測能力來選擇與預(yù)測結(jié)果不一致的策略 簡單說 沒有哪個(gè)博弈方有偏離這個(gè)預(yù)測結(jié)構(gòu)的愿望 因此這個(gè)預(yù)測結(jié)果最終真會成為博弈的結(jié)果 一致 的含義 各博弈方的實(shí)際行為選擇與他們的預(yù)測一致 而不是不同博弈方的預(yù)測相同 無差異 只有納什均衡才具有一致預(yù)測的性質(zhì) 一致預(yù)測性是納什均衡的本質(zhì)屬性 一致預(yù)測并不意味著一定能準(zhǔn)確預(yù)測 因?yàn)橛卸嘀鼐?會有不一致的可能 39 2 2 3納什均衡與嚴(yán)格下策反復(fù)消去法 上策均衡與納什均衡的關(guān)系 上策均衡包含在納什均衡范圍之內(nèi) 上策均衡肯定是納什均衡 納什均衡不一定是上策均衡 上策均衡是比納什均衡更強(qiáng) 穩(wěn)定性更高的均衡概念 首先考察是否存在上策均衡 如不存在上策均衡再尋找納什均衡 劃線法是在可以用得益矩陣表示的博弈中尋找納什均衡的有效方法 40 2 2 3納什均衡與嚴(yán)格下策反復(fù)消去法 納什均衡與嚴(yán)格下策反復(fù)消去法的關(guān)系 命題2 1在n個(gè)博弈方的博弈中 如果嚴(yán)格下策反復(fù)削去法排除了除之外的所有策略組合 那么一定是該博弈的納什均衡 命題2 2在n個(gè)博弈方的博弈中 如果是G的一個(gè)納什均衡 那么嚴(yán)格下策反復(fù)消去法一定不會將它削去 41 2 2 3納什均衡與嚴(yán)格下策反復(fù)消去法 命題2 1和命題2 2保證了嚴(yán)格下策反復(fù)消去法和納什均衡分析之間的相容性 保證了在進(jìn)行納什均衡分析之前先通過嚴(yán)格下策反復(fù)消去法簡化博弈是可行的 42 2 3無限策略博弈分析和反應(yīng)函數(shù) 2 3 1古諾的寡頭模型2 3 2反應(yīng)函數(shù)2 3 3伯特蘭德寡頭模型2 3 4公共資源問題2 3 5反應(yīng)函數(shù)的問題和局限性 43 2 3無限策略博弈分析和反應(yīng)函數(shù) 我們前面所討論的分析和求解博弈模型的方法 劃線法 箭頭法的適用范圍 只是可通過策略之間進(jìn)行兩兩比較分析的有限策略博弈 但是對于無限多種可選策略博弈時(shí)是不適用的 我們需要使用新的方法來尋找這類博弈納什均衡的求法 44 2 3 1古諾的寡頭模型 1838 Cournot 第一步 模型描述與假設(shè) 模型描述 兩個(gè)廠商占領(lǐng)某種產(chǎn)品的市場 形成寡頭壟斷的市場結(jié)構(gòu) 兩寡頭廠商通過決策自己的產(chǎn)量來實(shí)現(xiàn)自身利潤最大化 假設(shè)條件 假定兩個(gè)寡頭廠商生產(chǎn)同質(zhì)產(chǎn)品 兩廠商的產(chǎn)品可完全替代 產(chǎn)量可無限分割 不必取整 1 市場總產(chǎn)量 Q q1 q2 2 市場出清價(jià)格 P P Q 8 Q 3 邊際成本 c1 c2 2 且無固定成本 4 兩廠商同時(shí)決定各自的產(chǎn)量 45 2 3 1古諾的寡頭模型 第二步 博弈模型要素分析 1 博弈方 廠商1 廠商2 2 策略空間 選擇各自產(chǎn)量q1 q2 3 博弈的順序 廠商1和廠商2同時(shí)決策 4 得益 各自的利潤u1 u2 廠商利潤 收益 成本 雙方的得益 利潤 均取決于雙方的策略 產(chǎn)量 46 2 3 1古諾的寡頭模型 第三步 均衡求解 本博弈中的兩博弈方都有無限多種可選策略 因而 無法用得益矩陣表示該博弈 納什均衡的概念還是適用的 即只要兩博弈方的一個(gè)策略組合 q1 q2 滿足其中的q1 和q2 是博弈雙方都沒有動機(jī)改變的策略 從而形成穩(wěn)定狀態(tài) 或互為對方最佳策略的最優(yōu)對策 從而在互相影響的局勢下實(shí)現(xiàn)自身得益最大化 那么這個(gè)策略組合就構(gòu)成一個(gè)納什均衡 理性的博弈方 廠商 將會分別選擇這兩個(gè)產(chǎn)量 47 2 3 1古諾的寡頭模型 如果策略組合是本博弈的納什均衡 那么必須是最大值問題的解 即 是博弈方都沒有動機(jī)改變的策略組合 實(shí)現(xiàn)了在相互影響的情況下 博弈方自身得益最大化 因此該策略組合具有穩(wěn)定性 48 2 3 1古諾的寡頭模型 求兩個(gè)廠商利潤函數(shù)的一階偏導(dǎo)數(shù) 并令兩個(gè)一階偏導(dǎo)數(shù)都為0 可得 即產(chǎn)量組合 2 2 為該博弈的納什均衡 49 2 3 1古諾的寡頭模型 第四步 模型結(jié)構(gòu)分析 古諾寡頭博弈納什均衡狀態(tài)下的市場信息 1 商品總產(chǎn)量 Q q1 q2 2 2 4 2 商品市場出清價(jià)格 P 8 q1 q2 8 4 4 3 雙方各自的利潤 u1 u2 4 4 兩廠商利潤總和 u1 u2 4 4 8 50 2 3 1古諾的寡頭模型 效率分析 個(gè)體理性與集體理性的比較 1 從兩廠商總體利益最大化的角度出發(fā) 則廠商1和廠商2的總利潤 2 總體利潤函數(shù)求對Q的一階偏導(dǎo)數(shù) 并令一階偏導(dǎo)數(shù)為0 51 2 3 1古諾的寡頭模型 共同利益最大化的集體理性 與 兩廠商獨(dú)立決策 追求自身而不是共同利益最大化的個(gè)體理性 的博弈結(jié)果相比 集體理性 的總產(chǎn)量較小 38 也就是說 如果兩廠商更多考慮合作 聯(lián)合起來決定產(chǎn)量 先定出使總利益最大的產(chǎn)量后 各自生產(chǎn)一半 1 5單位 則各自分享的利益為4 5 比只考慮自身利益的獨(dú)立決策行為得到的利益要高 52 2 3 1古諾的寡頭模型 當(dāng)然 在兩個(gè)廠商缺少有力合作機(jī)制的時(shí)候 這種聯(lián)合通常是很難實(shí)現(xiàn)的 即使實(shí)現(xiàn) 常常也是不穩(wěn)定的 因?yàn)槊總€(gè)博弈方都會有破壞這種合作的動機(jī) 從下面的分析我們就可以看到這種現(xiàn)象 53 2 3 1古諾的寡頭模型 兩寡頭間的囚徒困境博弈 1 博弈方 廠商1 廠商2 2 策略 廠商1 突破1 5的平分合作產(chǎn)量 不突破1 5的平分合作產(chǎn)量 廠商2 突破1 5的平分合作產(chǎn)量 不突破1 5的平分合作產(chǎn)量 54 2 3 1古諾的寡頭模型 3 得益情形1 雙方都不突破平分的合作總產(chǎn)量 1 5 平分 9 的總利潤 此時(shí) q1 q2 1 5 u1 u2 4 5 情形2 廠商1私自突破平分合作產(chǎn)量 1 5 達(dá)到自身利益最大化產(chǎn)量 2 廠商2渾然不知 仍然生產(chǎn) 1 5 的平分合作產(chǎn)量 此時(shí) q1 2 q2 1 5 Q 3 5 P 8 Q 8 3 5 4 5u1 4 5 2 2 5 u2 4 5 2 1 5 3 75 55 2 3 1古諾的寡頭模型 情形3 廠商2私自突破平分合作產(chǎn)量 1 5 達(dá)到自身利益最大化產(chǎn)量 2 廠商1渾然不知 仍然生產(chǎn) 1 5 的平分合作產(chǎn)量 此時(shí) q2 2 q1 1 5 Q 3 5 P 8 Q 8 3 5 4 5u2 4 5 2 2 5 u1 4 5 2 1 5 3 75情形4 雙方都突破平分的合作產(chǎn)量1 5 各自生產(chǎn)使自身利益最大化的產(chǎn)量2 此時(shí) q1 q2 2 u1 u2 4 56 2 3 1古諾的寡頭模型 這樣 這個(gè)兩寡頭間的囚徒困境博弈就可以使用如下的博弈矩陣表示 57 2 3 1古諾的寡頭模型 從上面的模型分析我們可以知道 每個(gè)博弈方都有動機(jī)破壞合作的產(chǎn)量 以獲得更高的個(gè)人收益 這將會使總體利益最大化的合作策略組合 不突破 不突破 變得不穩(wěn)定 難以實(shí)現(xiàn) 或即使實(shí)現(xiàn) 也難以維持 古諾模型在現(xiàn)實(shí)經(jīng)濟(jì)中的最好例子之一 如石油輸出國組織的限額和突破問題 58 2 3 2反應(yīng)函數(shù) 古諾模型的納什均衡也可以通過劃線法思路的推廣來分析與求解 劃線法的思路是先找出每個(gè)博弈方針對其他博弈方所有策略 或策略組合 的最佳策略 然后再找出相互構(gòu)成最佳對策的各博弈方策略組成的策略組合 在無限策略的古諾模型中 其他博弈方的策略有無限多種 因此 各個(gè)博弈方的最佳對策也有無限種 它們之間往往構(gòu)成一種連續(xù)函數(shù)關(guān)系 59 2 3 2反應(yīng)函數(shù) 廠商1 對于廠商2的任意產(chǎn)量q2 廠商1的最佳對策q1 就是使自己在廠商2生產(chǎn)q2情況下最大化自身利潤的那個(gè)產(chǎn)量 即q1是最大化問題 的解 廠商2 與廠商1的情形完全相同 廠商2的對策q2是最大化問題 的解 60 2 3 2反應(yīng)函數(shù) 分別對廠商1和廠商2的效用表達(dá)式求廠商決策變量q1 q2的一階偏導(dǎo)數(shù) 并令一階偏導(dǎo)數(shù)為0 得到q1 R q2 和q2 R q1 61 2 3 2反應(yīng)函數(shù) q1 R q2 表示 對于廠商2的每一個(gè)可能的產(chǎn)量 廠商1的最佳對策產(chǎn)量的計(jì)算公式 它是廠商2產(chǎn)量的一個(gè)連續(xù)函數(shù) 我們稱這個(gè)連續(xù)函數(shù)為廠商1對廠商2的一個(gè) 反應(yīng)函數(shù) 同樣 q2 R q1 表示 對于廠商1的每一個(gè)可能的產(chǎn)量 廠商2的最佳對策產(chǎn)量的計(jì)算公式 它是廠商1產(chǎn)量的一個(gè)連續(xù)函數(shù) 我們稱這個(gè)連續(xù)函數(shù)為廠商2對廠商1的一個(gè) 反應(yīng)函數(shù) 所謂 反應(yīng)函數(shù) 簡單地說 就是針對其他博弈參與人策略的一個(gè)最佳的策略函數(shù) 使用的是劃線法的思想 62 2 3 2反應(yīng)函數(shù) 古諾模型的反應(yīng)函數(shù) 3 0 0 3 0 6 6 0 2 2 63 2 3 2反應(yīng)函數(shù) 從上頁的反應(yīng)函數(shù)曲線中我們可以做出如下分析 1 首先分析廠商1的反應(yīng)曲線R1 q2 當(dāng)廠商2選擇0產(chǎn)量時(shí) 即q2 0 廠商1的最佳反應(yīng)為3 即q1 3 這正是實(shí)現(xiàn)市場總利益最大的產(chǎn)量 廠商1獨(dú)自得到市場的總體利益 當(dāng)廠商2的產(chǎn)量達(dá)到6時(shí) 廠商1被迫選擇0產(chǎn)量 因?yàn)榇藭r(shí)廠商1堅(jiān)持生產(chǎn)已經(jīng)無利可圖 2 其次分析廠商2的反應(yīng)曲線R2 q1 與廠商1反應(yīng)曲線分析是完全相同的 64 2 3 2反應(yīng)函數(shù) 3 兩條反應(yīng)函數(shù)曲線的交點(diǎn)是 2 2 是由相互對對方的最佳反應(yīng)產(chǎn)量構(gòu)成的產(chǎn)量組合 是納什均衡 4 2 2 點(diǎn)以外的其他點(diǎn)都僅僅是一方對另一方的最佳反應(yīng) 而不是 相互 的最佳反應(yīng) 這與納什均衡的定義是一致的 65 2 3 3伯特蘭德寡頭模型 1883 背景與假設(shè)伯特蘭德寡頭模型是價(jià)格博弈 古諾寡頭模型是產(chǎn)量博弈 寡頭間生產(chǎn)的產(chǎn)品不同質(zhì) 具有一定的可替代性 因此即使某個(gè)寡頭廠商的產(chǎn)品價(jià)格較高也會有銷售 這里仍只考慮兩寡頭的情形 66 2 3 3伯特蘭德寡頭模型 寡頭1與寡頭2各自的需求函數(shù)為 其中d1 d2 0是兩廠商產(chǎn)品的替代系數(shù) 假設(shè)廠商生產(chǎn)無固定成本 邊際成本為c1 c2 兩廠商同時(shí)決定價(jià)格 67 2 3 3伯特蘭德寡頭模型 博弈要素分析 1 博弈方 廠商1 廠商2 2 策略 廠商1與廠商2決定自身產(chǎn)品的價(jià)格P1 P2 3 順序 同時(shí)決策 4 得益 各自的利潤u1 u2 68 2 3 3伯特蘭德寡頭模型 博弈雙方的得益 69 2 3 3伯特蘭德寡頭模型 從自身效用最大化角度求廠商1和廠商2的反應(yīng)函數(shù)對于廠商1 求如下最大化問題的解 求廠商1利潤函數(shù)對于廠商1的決策變量q1的一階偏導(dǎo)數(shù) 并令其為0 70 2 3 3伯特蘭德寡頭模型 同理 可求得廠商2的反應(yīng)函數(shù)綜上 兩廠商對對方策略 價(jià)格 的反應(yīng)函數(shù) 71 2 3 3伯特蘭德寡頭模型 求解納什均衡即求兩個(gè)反應(yīng)函數(shù)的交點(diǎn) 也就是解方程組 過程略 72 2 3 3伯特蘭德寡頭模型 納什均衡多寡頭情形的納什均衡的求解 技術(shù)上就是求n個(gè)反應(yīng)函數(shù)的交點(diǎn) 實(shí)例 彩電價(jià)格戰(zhàn) 囚徒困境的另一個(gè)實(shí)例 73 2 3 4公共資源問題 公共資源無獨(dú)立所有權(quán) 公眾可以自由利用的自然資源或人類生產(chǎn)的供大眾免費(fèi)使用的設(shè)施 休謨 DavidHume 1739 74 2 3 4公共資源問題 公共草地放牧問題博弈要素分析 1 博弈方 n個(gè)農(nóng)戶 2 策略空間 農(nóng)戶可能選擇的養(yǎng)羊數(shù)qi 3 順序 同時(shí)決策 4 農(nóng)戶的得益 其中V Q 表示羊只的單位產(chǎn)出 c表示農(nóng)戶養(yǎng)殖每只羊的成本 這里假設(shè)c是個(gè)常數(shù) 75 2 3 4公共資源問題 這里一個(gè)重要的假設(shè)就是每只羊的產(chǎn)出是羊只總數(shù)Q的減函數(shù) 這是因?yàn)槿绻蛱?那么牧草等養(yǎng)殖資源不足 就會造成羊的質(zhì)量下降 76 2 3 4公共資源問題 為了使討論比較簡單和能夠得到直觀的結(jié)論 我們假設(shè) 1 農(nóng)戶數(shù) n 3 2 單位羊只養(yǎng)殖成本 c 4 3 單位羊只產(chǎn)出函數(shù) 4 那么3個(gè)博弈方 即3個(gè)農(nóng)戶的得益為 收入 成本 77 2 3 4公共資源問題 使用得益最大化思想分別求出三個(gè)農(nóng)戶各自對其他兩個(gè)農(nóng)戶策略的反應(yīng)函數(shù)農(nóng)戶1 效用函數(shù)對q1求偏導(dǎo)數(shù) 并令偏導(dǎo)數(shù)為0 78 2 3 4公共資源問題 最終三個(gè)反應(yīng)函數(shù)為 三個(gè)反應(yīng)函數(shù)的交點(diǎn)即為納什均衡 79 2 3 4公共資源問題 總體利益最大的情況與個(gè)體理性決策進(jìn)行比較 個(gè)體理性 80 2 3 4公共資源問題 結(jié)論過度放牧 資源浪費(fèi) 農(nóng)戶沒有獲得更好的效益 這也是一類囚徒困境問題 81 2 3 4公共資源問題 這個(gè)例子再一次證明了納什均衡 或者說非合作博弈的結(jié)果可能是低效率的 公共資源悲劇的現(xiàn)實(shí)例子 冬蟲草 和田玉 公共網(wǎng)絡(luò) 公共交通 防護(hù)林的保護(hù) 公共設(shè)施問題 公共設(shè)施搭便車者總是比提供者合算的 公共設(shè)施供給不足 公共資源利用 公共設(shè)施提供 政府的組織 協(xié)調(diào)和制約是非常必要的 82 2 3 5反應(yīng)函數(shù)的問題和局限性 在許多博弈中 博弈方的策略是有限且非連續(xù)時(shí) 其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù) 無法求得反應(yīng)函數(shù) 從而不能通過解方程組的方法求得納什均衡 83 圖b 圖a 2 3 5反應(yīng)函數(shù)的問題和局限性 即使得益函數(shù)可以求導(dǎo) 也可能各博弈方的得益函數(shù)比較復(fù)雜 因此各自的反應(yīng)函數(shù)也比較復(fù)雜 并不總能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn) 圖a 特別是不能保證有唯一的交點(diǎn) 圖b 84 2 4混合策略和混合策略納什均衡 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn)2 4 2多重均衡博弈和混合策略2 4 3混合策略和嚴(yán)格下策反復(fù)消去法2 4 4混合策略反應(yīng)函數(shù) 85 嚴(yán)格競爭博弈 各博弈方的利益和偏好始終不一致 在通常策略上沒有納什均衡的博弈問題猜硬幣博弈純 確定性 策略下 沒有納什均衡 但博弈方仍不能隨意決策 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 86 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 首先 對蓋硬幣方進(jìn)行分析 這個(gè)博弈中各博弈方?jīng)Q策的第一個(gè)原則 自己的策略選擇不能預(yù)先被另一方知道或猜測到 否則 對方就會利用這點(diǎn)來選擇策略 從而在博弈中獲勝 其次 自己選擇策略要避免規(guī)律性 選擇策略如果出現(xiàn)規(guī)律性 比如一次正面 一次反面 一次正面 那么對方也會利用這個(gè)規(guī)律獲勝 更進(jìn)一步 如果蓋硬幣方已經(jīng)使用隨機(jī)策略 隨機(jī)地選擇蓋正面或反面 但總體上出某個(gè)策略的概率更大 那么對方仍然會有機(jī)可乘 87 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 因此 如果蓋硬幣方以1 2的概率隨機(jī)選擇自身的策略 那么對方就無法從選擇策略的偏好中占得任何便宜 也就是說 博弈方必須保證自身策略選擇的隨機(jī)性 以及重視各個(gè)策略的概率分布 以防止其他博弈方猜到自己的策略 或利用自己對策略選擇的偏好獲利 88 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 混合策略 MixedStrategies 一套出招的隨機(jī)概率 在博弈G S1 S2 Sn u1 u2 un 中 博弈方i的策略空間為Si Si1 Sik 則博弈方i以概率分布pi pi1 pik 隨機(jī)在其k個(gè)可選策略中選擇的 策略 稱為 混合策略 其中0 pik 1對j 1 2 k都成立 且pi1 pik 1 純 確定性 策略也可以看作混合策略 即選擇相應(yīng)純策略的概率為1 選擇其余純策略的概率為0的混合策略 混合策略可以看作純策略的擴(kuò)展 如果給一個(gè)博弈的每個(gè)博弈方的純策略空間賦予不同的概率分布 就形成了不同的混合策略 89 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 混合策略擴(kuò)展博弈 純策略空間si1 si2 概率分布Pi1 pi11 pi12 Pi2 pi21 pi22 Pi 新 純策略si1 pi11si1 pi12si2 si2 pi21si1 pi22si2 si 90 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 當(dāng)博弈方在這個(gè) 新產(chǎn)生 的混合策略空間中的選擇看作一個(gè)博弈時(shí) 原博弈的混合策略就成了后面這個(gè)擴(kuò)展出來的博弈的純策略 擴(kuò)展出來的博弈可稱為原博弈的混合策略擴(kuò)展博弈 91 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 混合策略納什均衡博弈從純策略向混合策略擴(kuò)展后 納什均衡的概念仍然是成立的 其實(shí)質(zhì)是沒有改變的 納什均衡意味著任何博弈方單獨(dú)改變自己的策略 或者隨機(jī)選擇各個(gè)純策略的概率分布 都不能給自己增加任何利益 如果確實(shí)是一個(gè)嚴(yán)格意義上的混合策略組合 即未退化為純策略組合 構(gòu)成一個(gè)納什均衡 則稱為一個(gè) 混合策略納什均衡 92 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 博弈方1的混合策略 隨機(jī)選擇A B的概率PA和PB 一定要使博弈方2選C和選D的期望得益相等 即 這樣 博弈方1的策略選擇就不會讓博弈方2有任何 傾向性 博弈方2就不可能通過博弈方1的選擇偏好獲利 博弈方2選擇C和D無差異 博弈方2 博弈方1 93 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 博弈方2的混合策略 隨機(jī)選擇C D的概率PC和PD 一定要使博弈方1選A和選B的期望得益相等 即 這樣的話 博弈方2的策略選擇就不會讓博弈方1有任何 傾向性 94 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 求解混合策略納什均衡 該博弈的混合策略納什均衡為 95 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 博弈方1和博弈方2的期望得益 96 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 綜上所述 該博弈的混合策略納什均衡為 博弈方1在均衡狀態(tài)下的期望得益為2 6 博弈方2在均衡狀態(tài)下的期望得益為2 6 97 齊威王田忌賽馬 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 田忌 齊威王 得益矩陣 PaPbPcPdPePf PgPhPiPjPkPl 98 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 齊威王的混合策略一定要使田忌選g h i j k l的期望得益相等 這樣的話 齊威王的策略選擇就不會讓田忌有任何 傾向性 從而使田忌從中占到便宜 則有 令 99 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 同理 田忌也會選擇使得齊威王各種策略期望收益相等的混合策略 令 解得 令 解得 100 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 在上述混合策略下 齊威王的期望得益為1 田忌的期望得益為 1 即多次進(jìn)行這樣的賽馬 齊威王平均每次能贏田忌一千斤銅 這是因?yàn)辇R威王三匹馬的總體實(shí)力略勝于田忌三匹馬的總體實(shí)力的緣故 101 小偷和守衛(wèi)的博弈 澤爾騰 1996 上海 在純策略下 不存在納什均衡 使用圖解法求混合策略納什均衡 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 守衛(wèi)睡的期望得益S D S 1 pt D pt守衛(wèi)不睡的期望得益 0 pt 0 S 1 pt 0 102 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 首先討論小偷 偷 與 不偷 兩種策略概率的確定 守衛(wèi)得益 睡 小偷偷的概率 S 0 1 D 橫軸表示小偷 偷 的概率Pt 分布在0 1之間 不偷 的概率則為1 Pt 縱軸反映對應(yīng)于小偷 偷 的不同概率 守衛(wèi)選擇 睡 的期望收益 圖中S D連線 S D S 1 pt D pt 當(dāng)小偷 偷 的概率大于pt 時(shí) 守衛(wèi) 睡 的期望得益小于 不睡 的得益0 因此他肯定百分之百選擇 不睡 從而小偷偷一次被抓一次 103 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 當(dāng)小偷 偷 的概率大于pt 時(shí) 守衛(wèi) 睡 的期望得益小于 不睡 的期望得益0 因此他肯定百分之百選擇 不睡 從而小偷 偷 一次被抓一次 當(dāng)小偷 偷 的概率小于pt 時(shí) 守衛(wèi) 睡 的期望得益大于 不睡 的得益0 因此他肯定百分之百選擇 睡 從而小偷偷竊會得益 只要 偷 的概率不大于pt 的概率 小偷都會得益 因此膽子越來越大 會逐漸提高偷竊概率 直到pt 均衡點(diǎn)是pt 偷 1 pt 不偷 此時(shí)守衛(wèi) 睡 與 不睡 的期望收益均為0 104 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 小偷得益 偷 守衛(wèi)睡的概率 0 1 V P P V V pg P 1 pg 其次討論守衛(wèi) 睡 與 不睡 兩種策略概率的確定 當(dāng)守衛(wèi) 睡 的概率大于pg 時(shí) 小偷 偷 的期望得益大于 不偷 的得益0 因此他肯定百分之百選擇 偷 105 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 當(dāng)守衛(wèi) 睡 的概率大于pg 時(shí) 小偷 偷 的期望得益大于 不偷 的期望得益0 因此他肯定百分之百選擇 偷 當(dāng)守衛(wèi) 睡 的概率小于pg 時(shí) 小偷 偷 的期望得益小于 不偷 的期望得益0 因此他肯定百分之百選擇 不偷 只要守衛(wèi) 睡 的概率不大于pg 小偷就不會偷竊 因此守衛(wèi)的膽子越來越大 會逐漸提高 睡 的概率 直到pg 均衡點(diǎn)是pg 睡 1 pg 不睡 此時(shí)小偷 偷 與 不偷 的期望收益均為0 106 激勵(lì)的悖論 守衛(wèi)得益 睡 小偷偷的概率 S 0 1 D D S D S 1 pt D pt 1 加重對守衛(wèi)的處罰 D增加 短期中的效果是使守衛(wèi)真正盡職 睡 的期望收益為負(fù) 守衛(wèi)短期內(nèi)會選擇 不睡 在長期中并不能使守衛(wèi)更盡職 pg 并不會下降 但會降低盜竊發(fā)生的概率 pt 會下降 即加重對守衛(wèi)的處罰不會對守衛(wèi)的工作態(tài)度產(chǎn)生長期影響 反而會間接降低小偷偷竊的概率 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 107 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 激勵(lì)的悖論 小偷得益 偷 守衛(wèi)睡的概率 0 1 V P P P V V pg P 1 pg 2 加重對小偷的處罰 短期內(nèi)能抑制盜竊發(fā)生率 偷 期望收益短期內(nèi)為負(fù)數(shù) 小偷短期內(nèi)會選擇 不偷 長期并不能降低盜竊發(fā)生率 pt 并不會改變 但會使守衛(wèi)更多的偷懶 pg 會上升 108 夫妻之爭的混合策略納什均衡妻子的概率選擇 使丈夫選擇兩種策略的期望得益相同 2 4 2多重均衡博弈和混合策略 109 丈夫的概率選擇 使妻子選擇兩種策略的期望得益相同妻子的期望得益丈夫的期望得益 2 4 2多重均衡博弈和混合策略 110 2 4 2多重均衡博弈和混合策略 我們發(fā)現(xiàn) 在夫妻之爭博弈中 雙方進(jìn)行溝通交流 一方遷就另一方的結(jié)果要比上面分析的混合策略納什均衡結(jié)果要好 因?yàn)橄嗷ミw就的純策略納什均衡最少會使得丈夫或妻子得到1的確定收益 這要大于混合策略均衡時(shí)的期望收益0 75 111 制式問題零配件匹配偏好問題 廠商1偏好 2 2 均衡 而廠商2偏好于 1 3 2 4 2多重均衡博弈和混合策略 112 2 4 2多重均衡博弈和混合策略 混合策略納什均衡為 廠商1 0 4 0 6 期望收益 0 664廠商2 0 67 0 33 期望收益 1 296 相互協(xié)商達(dá)成的純策略的得益也是要大于混合策略均衡下的期望收益 113 市場機(jī)會博弈 過程請同學(xué)們自己完成 2 4 2多重均衡博弈和混合策略 廠商1 2 3 1 3 期望收益 0廠商2 2 3 1 3 期望收益 0 114 2 4 3混合策略和嚴(yán)格下策反復(fù)消去法 在包括混合策略的情況下 嚴(yán)格下策反復(fù)消去法的結(jié)論仍然成立 1 任何博弈方不會采用嚴(yán)格下策 不管它們是純策略還是混合策略 2 嚴(yán)格下策反復(fù)消去法不會消去任何納什均衡 包括純策略納什均衡和混合策略納什均衡 3 如果經(jīng)過反復(fù)消去后留下的策略組合是惟一的 那么一定是納什均衡 115 2 4 3混合策略和嚴(yán)格下策反復(fù)消去法 博弈方2采用純策略L時(shí) 博弈方1用上述混合策略的期望得益為 博弈方2采用純策略R時(shí) 博弈方1用上述混合策略的期望得益為 博弈方2采用混合策略 q 1 q 時(shí) 博弈方1用上述混合策略的期望得益為 博弈方1采取混合策略 以概率 1 2 1 2 0 選擇 U M D 時(shí) 與這個(gè)混合策略相比 D一定是博弈方1的嚴(yán)格下策 116 2 4 3混合策略和嚴(yán)格下策反復(fù)消去法 因此 不管博弈方2采用哪種策略 包括所有可能得純策略和所有混合策略 對應(yīng)q的所有可能值 博弈方1采用 1 2 1 2 0 的期望收益始終為3 2 都要大于采用D策略時(shí)得到的確定性得益1 由于我們假設(shè)博弈方是風(fēng)險(xiǎn)中性的 D相對于混合策略 1 2 1 2 0 是嚴(yán)格下策 117 2 4 3混合策略和嚴(yán)格下策反復(fù)消去法 需要注意的是 并不是包括混合策略以后 博弈中一定會存在可以先行削去的純策略嚴(yán)格下策 如將博弈的得益修改為 D就不再是嚴(yán)格下策 1 3 2 2 沒有嚴(yán)格的優(yōu)劣 118 2 4 4混合策略反應(yīng)函數(shù) 反應(yīng)函數(shù)即一博弈方對另一博弈方每種可能的決策內(nèi)容的最佳反應(yīng)決策構(gòu)成的函數(shù) 在純策略的范疇內(nèi) 反應(yīng)函數(shù)是各博弈方選擇的純策略對其他博弈方純策略的反應(yīng) 在混合策略的范疇內(nèi) 博弈方的決策內(nèi)容為選擇概率分布 反應(yīng)函數(shù)就是一方對另一方的概率分布的反應(yīng) 同樣也是一定的概率分布 119 2 4 4混合策略反應(yīng)函數(shù) 猜硬幣博弈 正反蓋硬幣方 r 1 r 猜硬幣方 q 1 q qU 蓋反 r 1即對方猜正面的概率小 我蓋正面有便宜 所以我傾向于蓋正面 故r 1 我總蓋正面 q 1 2時(shí) U 蓋反 U 蓋正 r任意q 1 2時(shí) U 蓋正 U 蓋反 r 0 r1 2時(shí) U 猜正 U 猜反 q 1 r q 0 1 2 1 r R1 q 1 2 1 q R2 r 對方猜正面的概率 對方蓋正面的概率 混和策略NE蓋 1 2 1 2 猜 1 2 1 2 120 2 4 4混合策略反應(yīng)函數(shù) 夫妻之爭分析妻子 對丈夫的混合策略 q 1 q 的對策分析 1 妻子選擇 宮心計(jì) 的期望收益U C 3q 0 1 q 3q 2 妻子選擇 世界杯 的期望收益U F 0q 1 1 q 1 q因此 當(dāng)q1 4時(shí) r 1 1 r 0 丈夫的分析同妻子 121 2 4 4混合策略反應(yīng)函數(shù) 分析丈夫 對妻子的混合策略 r 1 r 的對策分析 1 丈夫選擇 宮心計(jì) 的期望收益U C 1r 0 1 r r 2 丈夫選擇 世界杯 的期望收益U F 0r 3 1 r 3 3r因此 當(dāng)r3 4時(shí) q 1 1 q 0 122 2 4 4混合策略反應(yīng)函數(shù) 夫妻之爭 宮心計(jì)世界杯妻子 r 1 r 丈夫 q 1 q 妻子 qU C r 0q 1 4時(shí) U F U C r取 0 1 任意值 q 1 4時(shí) U C U F r 1 丈夫 rU C q 0r 3 4時(shí) U F U C q取 0 1 任意值 r 3 4時(shí) U C U F q 1 0 1 4 r 3 4 1 q 1 r R1 q q R2 r 純策略NE1 世界杯 世界杯 純策略NE1 宮心計(jì) 宮心計(jì) 混和策略NE妻 3 4 1 4 丈 1 4 3 4 123 2 5納什均衡的存在性 納什定理 Nash1950 在一個(gè)有n個(gè)博弈方的博弈G S1 Sn u1 un 中 如果n是有限的 其Si都是有限集 對i 1 2 n 則該博弈至少存在一個(gè)納什均衡 但可能包括混合策略納什均衡 每一個(gè)有限博弈都至少有一個(gè)混合策略納什均衡定理證明 不動點(diǎn)定理 納什定理的意義 NE存在的普遍性 一致預(yù)測 成為博弈問題分析方法 124 2 6納什均衡的選擇和分析方法擴(kuò)展 納什均衡是博弈問題最基本的分析概念 是均衡分析概念的基礎(chǔ) 但納什均衡分析并不一定能徹底解決一個(gè)博弈問題 因?yàn)榧{什均衡的存在性不等于惟一性 在許多博弈中納什均衡是不惟一的 而且不同的納什均衡相之間也沒有明顯的優(yōu)劣關(guān)系 從而博弈方的選擇會遇到困難 夫妻之爭博弈就是這樣的一個(gè)典型例子 125 2 6納什均衡的選擇和分析方法擴(kuò)展 即使一個(gè)博弈的幾個(gè)納什均衡之間存在優(yōu)劣關(guān)系 帕累托效率意義上的 也不能保證博弈方一定會選擇較優(yōu)的納什均衡 風(fēng)險(xiǎn) 破壞者 串通 的存在 使得博弈結(jié)果無法用納什均衡加以解釋 因此對有些博弈問題僅僅進(jìn)行納什均衡分析是不夠的 必須在納什均衡分析的基礎(chǔ)上再作進(jìn)一步的深入分析 126 2 6納什均衡的選擇和分析方法擴(kuò)展 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 帕累托上策均衡 風(fēng)險(xiǎn)上策均衡2 6 2聚點(diǎn)和相關(guān)均衡 聚點(diǎn)均衡 相關(guān)均衡2 6 3共謀和防共謀均衡 多人博弈中的共謀問題 防共謀均衡 127 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 帕累托上策均衡 依據(jù)帕累托效率意義上的優(yōu)劣關(guān)系 某一個(gè)納什均衡給所有博弈方帶來的利益都大于其他所有納什均衡會帶來的利益 博弈方選擇的傾向性是一致的 兩個(gè)純策略納什均衡 戰(zhàn)爭 戰(zhàn)爭 和平 和平 在帕累托效率意義上 和平 和平 明顯較好 構(gòu)成一個(gè)帕累托上策均衡 如果兩國的決策者都是理性的 那么兩個(gè)國家之間就不應(yīng)該會發(fā)生戰(zhàn)爭 128 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 風(fēng)險(xiǎn)上策均衡 如果所有博弈方在預(yù)計(jì)其他博弈方采用兩種納什均衡的策略的概率相同時(shí) 都偏愛其中某一納什均衡 則該納什均衡就是一個(gè)風(fēng)險(xiǎn)上策均衡 明顯地 U L 為帕累托上策均衡 但是選擇這個(gè)NE對雙方都有很大風(fēng)險(xiǎn) 一旦對方偏離這個(gè)均衡 那么自身的得益損失是非常大的 相對于這種高風(fēng)險(xiǎn) D R 就有了相對優(yōu)勢 129 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 混合策略納什均衡 混合策略納什均衡是博弈方使得對方行為選擇無差異時(shí) 自身行為的概率分布 博弈方1 令博弈方2選擇L與R無差異博弈方2 令博弈方1選擇U與D無差異 130 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 檢查博弈方的策略偏好 博弈方1的混合策略 PU和PD 與博弈方2策略L與R的偏好性 當(dāng)PU1 8時(shí) 有U L U R 即此時(shí)博弈方2對策略R具有偏好 131 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 檢查博弈方的策略偏好 博弈方2的混合策略 PL和PR 與博弈方1策略U與D的偏好性 當(dāng)PL1 8時(shí) 有U U U D 即博弈方2對策略D具有偏好 132 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 如果博弈方1傾向于策略D的隨機(jī)概率大于12 5 那么博弈方2的R策略相對于帕累托均衡策略L就具有期望得益上的優(yōu)勢 因此博弈方2偏好于R 如果博弈方2傾向于R的隨機(jī)概率大于12 5 那么博弈方1的D策略相對于帕累托均衡策略D就具有期望得益上的優(yōu)勢 因此博弈方1偏好于D 133 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 總結(jié) 偏離的概率要求小于1 8 12 5 才能保證帕累托上策均衡 U L 可以實(shí)現(xiàn) 這比較不保險(xiǎn) 一旦對方偏離帕累托上策均衡的概率大于12 5 如果自己不改變帕累托上策均衡的策略 那么很有可能獲得0收益 風(fēng)險(xiǎn)很大 所以 在收益相差不是很大的情況下 D R 相對于 U L 具有風(fēng)險(xiǎn)上的較大優(yōu)勢 D R 就是一個(gè)風(fēng)險(xiǎn)上策均衡 說白了 一方 不靠譜 使得另一方選擇更加保險(xiǎn)的策略 134 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 獵鹿博弈 詳細(xì)分析如上例 請同學(xué)們自行完成 獵鹿有風(fēng)險(xiǎn)捕兔有保障 其中一種簡單情況 假如另一方選擇獵鹿和抓兔的概率都是1 2 那么 獵鹿 的期望收益僅為2 5 小于抓兔子的確定性收益3 因此 兔子 兔子 就是這個(gè)博弈的一個(gè)風(fēng)險(xiǎn)上策均衡 獵人1獵鹿 獵人2獵鹿 135 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡 博弈方對風(fēng)險(xiǎn)上策均衡的選擇傾向 有一種自我強(qiáng)化的機(jī)制 當(dāng)部分或所有博弈方選擇風(fēng)險(xiǎn)上策均衡的可能性增強(qiáng)時(shí) 都擔(dān)心對方偏離帕累托上策均衡 任一博弈方選擇帕累托上策均衡策略的期望得益都會進(jìn)一步變小 這就使各博弈方更傾向于選擇風(fēng)險(xiǎn)上策均衡 從而形成一種選擇風(fēng)險(xiǎn)上策均衡的正反饋機(jī)制 使其出現(xiàn)的機(jī)會越來越大 合作難 多人合作更難 136 2 6 2聚點(diǎn)和相關(guān)均衡 1 聚點(diǎn)均衡人們的決策選擇受心理 習(xí)慣 文化 環(huán)境等多種因素影響 體現(xiàn)出這些因素的納什均衡 就稱為聚點(diǎn)均衡 137 2 6 2聚點(diǎn)和相關(guān)均衡 例1 報(bào)時(shí)博弈 1 博弈參與人 博弈方1 博弈方2 2 策略 雙方選擇0點(diǎn)到24點(diǎn)的任意時(shí)間報(bào)時(shí) 無限 3 順序 同時(shí) 4 得益 2人報(bào)時(shí)間相同 獲得100元 報(bào)時(shí)不同 獲得0元 選擇整點(diǎn)后 即聚點(diǎn) 雖然不能保證雙方的選擇一致 但至少能大大提高雙方選擇一致的概率 138 2 6 2聚點(diǎn)和相關(guān)均衡 聚點(diǎn)均衡 在多重納什均衡的博弈中 雙方同時(shí)選擇一個(gè)聚點(diǎn)構(gòu)成的納什均衡稱為 聚點(diǎn)均衡 139 2 6 2聚點(diǎn)和相關(guān)均衡 例2 城市博弈上海 南京 長春 哈爾濱 兩人將以上四個(gè)城市分成兩組 如果兩人的分組相同 獲得100元 中國人 通常會 上海 南京 長春 哈爾濱 按南方和北方城市的特征分組 地理常識 產(chǎn)生聚點(diǎn) 140 2 6 2聚點(diǎn)和相關(guān)均衡 聚點(diǎn)均衡首先是納什均衡 是多重納什均衡中比較容易被選擇的納什均衡 聚點(diǎn)均衡是利用博弈規(guī)則以外的特定信息選擇的均衡 文化背景中的習(xí)慣或規(guī)范 共同的知識或者其他各種特征都可能是聚點(diǎn)均衡的依據(jù) 141 2 6 2聚點(diǎn)和相關(guān)均衡 2 相關(guān)均衡人們在現(xiàn)實(shí)中遇到選擇困難時(shí) 特別是在長期中反復(fù)遇到相似的選擇難題時(shí) 通常會通過收集更多的信息 形成特定的機(jī)制和規(guī)則 也就是某種形式的制度安排等主動尋找出路 142 2 6 2聚點(diǎn)和相關(guān)均衡 相關(guān)均衡例子 存在三個(gè)納什均衡 其中 兩個(gè)是純策略均衡 U L D R 一個(gè)是混合策略均衡 1 2 1 2 1 2 1 2 純策略均衡雖然都能使雙方得到6單位的得益總和 但是個(gè)人得益差距很大 很難形成自然妥協(xié) 聚點(diǎn) 不適用 若采用混合策略納什均衡
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物流公司總務(wù)處成本控制計(jì)劃
- 《愛的教育》讀書會
- 九年級語文實(shí)踐教學(xué)活動計(jì)劃2024-2025
- 四年級上冊班主任親子活動計(jì)劃
- 華師大版八年級數(shù)學(xué)下冊校際交流計(jì)劃
- 外研版七年級下英語教學(xué)計(jì)劃的心理健康教育融入
- 新教師年度成長總結(jié)范文
- 醫(yī)院安寧療護(hù)服務(wù)流程與實(shí)施
- ??谱o(hù)士急救技能學(xué)習(xí)心得體會
- 餐飲業(yè)菜品創(chuàng)新與服務(wù)改進(jìn)計(jì)劃
- 青年博物館文創(chuàng)產(chǎn)品消費(fèi)研究:一個(gè)社會實(shí)踐分析視角
- 政策實(shí)施效果評估模型-深度研究
- 2025版學(xué)校學(xué)生食堂餐具清洗消毒服務(wù)合同2篇
- 跟著電影去旅游知到智慧樹章節(jié)測試課后答案2024年秋山東大學(xué)(威海)
- 《有機(jī)硅乳液防水劑》文本及編制說明
- 學(xué)?;饡馁Y金籌集與運(yùn)用策略
- 2021年高考物理試卷(江蘇)(解析卷)
- 調(diào)度室副主任安全生產(chǎn)職責(zé)模版(3篇)
- 2025年中電科太力通信科技限公司招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 《設(shè)備房管理標(biāo)準(zhǔn)》課件
- 2025年內(nèi)蒙古呼倫貝爾農(nóng)墾拉布大林上庫力三河蘇沁農(nóng)牧場有限公司招聘筆試參考題庫附帶答案詳解
評論
0/150
提交評論