完全信息靜態(tài)博弈教學(xué)課件PPT.ppt

上傳人：m*** IP屬地：四川上傳時(shí)間：2020-03-31 格式：PPT 頁數(shù)：152 大?。?.11MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩147頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1 博弈論第二章完全信息靜態(tài)博弈 2 前言完全信息靜態(tài)博弈各博弈方同時(shí)決策且所有博弈方對各方得益都了解的博弈完全信息靜態(tài)博弈是非合作博弈中最基本的類型囚徒困境齊威王田忌賽馬猜硬幣石頭剪子布古諾產(chǎn)量決策都屬于完全信息靜態(tài)博弈博弈有兩種表述方法 1 策略型表述適合表示靜態(tài)博弈 2 擴(kuò)展型博弈樹表述適合表示動態(tài)博弈 3 本章主要內(nèi)容 2 1基本分析思路和方法2 2納什均衡2 3無限策略博弈分析和反應(yīng)函數(shù)2 4混合策略和混合策略納什均衡2 5納什均衡的存在性2 6納什均衡的選擇和分析方法擴(kuò)展 4 2 1基本分析思路和方法 2 1 1上策均衡2 1 2嚴(yán)格下策反復(fù)消去法2 1 3劃線法2 1 4箭頭法 5 2 1 1上策均衡上策 Dominantstrategy 在某個(gè)博弈中如果不管其他博弈方選擇什么策略一博弈方的某個(gè)策略給他帶來的得益始終高于其他所有策略至少不低于其他策略上策均衡 Dominant strategyEquilibrium 如果一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方各自的上策那么這個(gè)策略組合肯定是所有博弈方都愿意選擇的必然是該博弈比較穩(wěn)定的結(jié)果我們稱這樣的策略組合為該博弈的一個(gè)上策均衡 6 2 1 1上策均衡因?yàn)樯喜呔夥从沉怂胁┺姆降慕^對偏好因此非常穩(wěn)定跟據(jù)上策均衡可以對博弈結(jié)果做出最肯定的預(yù)測進(jìn)行博弈分析時(shí) 首先判斷各個(gè)博弈方是否都有上策是否存在上策均衡 7 2 1 1上策均衡例1 囚徒困境對于囚徒1 策略坦白的得益向量為 5 0 策略不坦白的得益向量為 8 1 顯然 5 0 8 1 所以坦白對于囚徒1來說是一個(gè)上策 8 2 1 1上策均衡同理對于囚徒2 策略坦白的得益向量為策略不坦白的得益向量為顯然所以坦白對于囚徒2來說是一個(gè)上策那么坦白坦白就是該博弈的一個(gè)上策均衡這種策略的組合是穩(wěn)定的 9 2 1 1上策均衡例2 市場競爭中典型的囚徒困境現(xiàn)象之一寡頭1 低價(jià) 150 70 高價(jià) 100 20 寡頭2 低價(jià) 150 70 高價(jià) 100 20 低價(jià)均為兩個(gè)博弈者的上策上策均衡即為低價(jià) 低價(jià) 10 2 1 1上策均衡上策均衡不是普遍存在的需要雙方都存在上策有些博弈就是不存在上策如猜硬幣博弈博弈的參與人都不存在上策博弈也就不存在所謂的上策均衡 11 2 1 2嚴(yán)格下策反復(fù)消去法嚴(yán)格下策反復(fù)消去法思路和原理嚴(yán)格下策 StrictlyDominatedStrategy 不管其他博弈方的策略如何變化一個(gè)博弈方的某種策略給他帶來的得益總是比另一種或另一些策略給他帶來的得益要小則稱前一種策略為相對于后一種或一些策略的一個(gè) 嚴(yán)格下策嚴(yán)格下策是理性博弈方都不會去選擇的策略可以消去對于嚴(yán)格下策的消去過程可以在同一博弈方的策略空間中反復(fù)運(yùn)用也可以在各個(gè)博弈方的策略空間上交叉運(yùn)用只要有就可以消去不必計(jì)較消去的順序與過程 12 例1 無上策無上策均衡用嚴(yán)格下策反復(fù)削去法博弈方一 2 1 2嚴(yán)格下策反復(fù)消去法博弈方二對博弈方二明顯地右的得益向量 1 0 中的得益向量 3 2 所以博弈方二絕對不會選擇右 13 2 1 2嚴(yán)格下策反復(fù)消去法例2 智豬博弈第一步博弈描述與假設(shè)有兩頭非常聰明的豬一大一小共同生活在一個(gè)豬圈里豬圈的一端有一個(gè)踏板踏板連著開放飼料的機(jī)關(guān) 只要踏一下在豬圈的另外一端的食槽就會出現(xiàn)10個(gè)單位食物任何一頭豬去踏這個(gè)踏板都會付出相當(dāng)于2個(gè)單位食物的成本每只豬都可以選擇踏或不踏踏板大豬比小豬吃得快兩頭豬跑得一樣快食槽 10 大豬小豬踏板 14 2 1 2嚴(yán)格下策反復(fù)消去法第二步要素分析 1 局中人大豬小豬 2 策略集合均為踏不踏 3 行為順序同時(shí)決策 4 得益見下頁分析 15 2 1 2嚴(yán)格下策反復(fù)消去法踏需要豬跑一個(gè)折返不踏的豬只需要在食槽旁等食情況1 一起跑去踏一起折返一起吃大豬吃8 小豬吃2 情況2 大豬踏小豬等大豬踏完往回跑的時(shí)候小豬趁機(jī)多吃2 大豬只能吃6單位小豬可以吃4單位情況3 小豬踏大豬等小豬踏完往回跑的時(shí)候大豬趁機(jī)把10單位的食物都吃了小豬白跑吃不到食物情況4 都不踏都忍著沒有食物吃食槽 10 大豬小豬踏板 16 2 1 2嚴(yán)格下策反復(fù)消去法減去2單位踏的成本后兩頭豬在各種情形下的得益情況一同時(shí)踏大豬8 2 6 小豬2 2 0 情況二大豬踏小豬等候大豬6 2 4 小豬4 情況三小豬踏大豬等候大豬10 小豬0 2 2 情況四都不踏無食物無成本大豬0 小豬0 兩頭豬的得益矩陣見上方 17 2 1 2嚴(yán)格下策反復(fù)消去法第三步分析求解最終穩(wěn)定的策略組合為大豬踏小豬不踏第四步結(jié)構(gòu)分析模型簡單 18 2 1 2嚴(yán)格下策反復(fù)消去法第五步啟示結(jié)論與建議現(xiàn)實(shí)中某些搭便車現(xiàn)象的博弈解釋這種現(xiàn)象主要是由于局中人對某項(xiàng)事物或工作的效用有很大差異具有大效用的局中人有時(shí)不得不付出更多的勞動而對于這項(xiàng)事物或工作持可有可無態(tài)度的局中人往往就搭便車其他現(xiàn)象團(tuán)隊(duì)合作等問題如何解決作業(yè)題1 19 2 1 2嚴(yán)格下策反復(fù)消去法關(guān)于作業(yè) 請手寫勿打印別著急寫不急著交等課程基本結(jié)束以后要前后聯(lián)系課程內(nèi)容寫出結(jié)論就可以不必復(fù)雜的公式與推導(dǎo) 不必正規(guī)的陳述沒有什么格式要求只需要寫出對這個(gè)問題的看法自己想到的解決方案里面用到了那些博弈思想就可以了 20 2 1 2嚴(yán)格下策反復(fù)消去法練習(xí)一博弈方1沒有嚴(yán)格下策從博弈方2開始博弈的得益結(jié)構(gòu)發(fā)生改變下策可能就出現(xiàn)了 21 2 1 3劃線法與上策分析法的情形類似大部分博弈是不存在嚴(yán)格下策的雖然與上策均衡分析法相比嚴(yán)格下策反復(fù)消去法適應(yīng)更多情況但是仍然不能夠滿足博弈分析的要求我們需要一種更普遍適用的博弈分析方法劃線法 22 2 1 3劃線法劃線法的思路和方法先找出自己針對其他博弈方每種策略或策略組合的最佳策略即找最佳對策這種最佳策略可能不唯一然后在此基礎(chǔ)上通過對其他博弈方策略選擇的判斷包括對其他博弈方對自己策略判斷的判斷等我知道對方知道我會選擇某個(gè)策略的判斷預(yù)測可能結(jié)果和確定自己的最優(yōu)策略 23 2 1 3劃線法例1 24 2 1 3劃線法例2 囚徒困境 25 2 1 3劃線法例3 猜硬幣博弈此博弈不存在確定性結(jié)果沒有策略組合是雙方同時(shí)愿意接受的我們不能預(yù)測這個(gè)博弈的結(jié)果 26 例4 夫妻之爭現(xiàn)實(shí)中的例子兩人同時(shí)出發(fā)到不同地方匯合企業(yè)之間關(guān)聯(lián)產(chǎn)品技術(shù)和規(guī)格等方面的合作也是類似博弈 2 1 3劃線法 27 2 1 3劃線法夫妻之爭有兩個(gè)具有穩(wěn)定性的結(jié)果哪一個(gè)結(jié)果出現(xiàn)都是合理的具體選擇哪一個(gè)不得而知但是我們可以猜測到這個(gè)博弈的結(jié)果會受到夫妻在家庭中的實(shí)際地位的影響如果在家庭中丈夫是強(qiáng)勢的那么最后博弈的結(jié)果很可能是夫婦一起看足球如果妻子是強(qiáng)勢的那么很可能夫婦二人一起看時(shí)裝 28 例5 公共資源的過度使用公共地悲劇現(xiàn)實(shí)生活中的例子如免費(fèi)校園網(wǎng)絡(luò)的使用免費(fèi)道路的使用解決辦法消除或減弱公共物品的性質(zhì) 如收費(fèi) 發(fā)許可等 2 1 3劃線法 29 2 1 4箭頭法箭頭法思路與方法利用策略組合的穩(wěn)定性和局中人的策略選擇動機(jī) 為思路對博弈模型的結(jié)果進(jìn)行分析和預(yù)測 30 2 1 4箭頭法例1 囚徒困境從任意一個(gè)策略組合開始分析這里從不坦白不坦白這個(gè)策略組合開始博弈參與人得益的提高是改變策略的動機(jī) 由囚徒1開始分析 31 2 1 4箭頭法例2 夫妻之爭 32 2 1 4箭頭法例3 猜硬幣博弈 33 2 1 4箭頭法例4 公共地的悲劇 34 2 1 4箭頭法箭頭有進(jìn)無出的策略組合表明此時(shí)博弈局中人已經(jīng)沒有改變策略的動機(jī) 即博弈方再改變策略已經(jīng)不能帶來得益的提高因此箭頭有進(jìn)無出的策略組合是穩(wěn)定的策略組合箭頭法可以清晰地表明局中人改變行為決策的動機(jī) 即得益 payoff 的提高但如果博弈過于復(fù)雜得益矩陣過于繁瑣箭頭法的可用性就不強(qiáng)了 35 2 2納什均衡 2 2 1納什均衡的定義2 2 2納什均衡的一致預(yù)測性質(zhì)2 2 3納什均衡與嚴(yán)格下策反復(fù)消去法 36 2 2 1納什均衡的定義博弈博弈方的策略空間和得益的一般表示法 G表示一個(gè)博弈 n個(gè)博弈方 S1 S2 Sn表示每個(gè)博弈方的可選策略集合稱為策略空間 Sij Si表示博弈方i的第j個(gè)策略博弈方i的得益用ui表示 ui是各博弈方策略的多元函數(shù) n個(gè)博弈方的博弈G S1 S2 Sn u1 u2 un 37 2 2 1納什均衡的定義納什均衡 NashEquilibrium 定義在博弈中如果由各個(gè)博弈方的某一個(gè)策略組成的某個(gè)策略組合中任一博弈方i的策略s i 都是對其余各個(gè)博弈方的組合的最佳對策也即對任意都成立則稱為G的一個(gè)納什均衡直白地說 NE就是一組最優(yōu)策略的組合是每個(gè)參與人都不想改變自身決策的一種策略組合和穩(wěn)定狀態(tài) 38 2 2 2納什均衡的一致預(yù)測性質(zhì) 一致預(yù)測如果所有博弈方都預(yù)測一個(gè)特定的博弈結(jié)果會出現(xiàn) 那么所有的博弈方都不會利用該預(yù)測或者這種預(yù)測能力來選擇與預(yù)測結(jié)果不一致的策略簡單說沒有哪個(gè)博弈方有偏離這個(gè)預(yù)測結(jié)構(gòu)的愿望因此這個(gè)預(yù)測結(jié)果最終真會成為博弈的結(jié)果一致的含義各博弈方的實(shí)際行為選擇與他們的預(yù)測一致而不是不同博弈方的預(yù)測相同無差異只有納什均衡才具有一致預(yù)測的性質(zhì) 一致預(yù)測性是納什均衡的本質(zhì)屬性一致預(yù)測并不意味著一定能準(zhǔn)確預(yù)測因?yàn)橛卸嘀鼐?會有不一致的可能 39 2 2 3納什均衡與嚴(yán)格下策反復(fù)消去法上策均衡與納什均衡的關(guān)系上策均衡包含在納什均衡范圍之內(nèi) 上策均衡肯定是納什均衡納什均衡不一定是上策均衡上策均衡是比納什均衡更強(qiáng) 穩(wěn)定性更高的均衡概念首先考察是否存在上策均衡如不存在上策均衡再尋找納什均衡劃線法是在可以用得益矩陣表示的博弈中尋找納什均衡的有效方法 40 2 2 3納什均衡與嚴(yán)格下策反復(fù)消去法納什均衡與嚴(yán)格下策反復(fù)消去法的關(guān)系命題2 1在n個(gè)博弈方的博弈中如果嚴(yán)格下策反復(fù)削去法排除了除之外的所有策略組合那么一定是該博弈的納什均衡命題2 2在n個(gè)博弈方的博弈中如果是G的一個(gè)納什均衡那么嚴(yán)格下策反復(fù)消去法一定不會將它削去 41 2 2 3納什均衡與嚴(yán)格下策反復(fù)消去法命題2 1和命題2 2保證了嚴(yán)格下策反復(fù)消去法和納什均衡分析之間的相容性保證了在進(jìn)行納什均衡分析之前先通過嚴(yán)格下策反復(fù)消去法簡化博弈是可行的 42 2 3無限策略博弈分析和反應(yīng)函數(shù) 2 3 1古諾的寡頭模型2 3 2反應(yīng)函數(shù)2 3 3伯特蘭德寡頭模型2 3 4公共資源問題2 3 5反應(yīng)函數(shù)的問題和局限性 43 2 3無限策略博弈分析和反應(yīng)函數(shù) 我們前面所討論的分析和求解博弈模型的方法劃線法箭頭法的適用范圍只是可通過策略之間進(jìn)行兩兩比較分析的有限策略博弈但是對于無限多種可選策略博弈時(shí)是不適用的我們需要使用新的方法來尋找這類博弈納什均衡的求法 44 2 3 1古諾的寡頭模型 1838 Cournot 第一步模型描述與假設(shè) 模型描述兩個(gè)廠商占領(lǐng)某種產(chǎn)品的市場形成寡頭壟斷的市場結(jié)構(gòu) 兩寡頭廠商通過決策自己的產(chǎn)量來實(shí)現(xiàn)自身利潤最大化假設(shè)條件假定兩個(gè)寡頭廠商生產(chǎn)同質(zhì)產(chǎn)品兩廠商的產(chǎn)品可完全替代產(chǎn)量可無限分割不必取整 1 市場總產(chǎn)量 Q q1 q2 2 市場出清價(jià)格 P P Q 8 Q 3 邊際成本 c1 c2 2 且無固定成本 4 兩廠商同時(shí)決定各自的產(chǎn)量 45 2 3 1古諾的寡頭模型第二步博弈模型要素分析 1 博弈方廠商1 廠商2 2 策略空間選擇各自產(chǎn)量q1 q2 3 博弈的順序廠商1和廠商2同時(shí)決策 4 得益各自的利潤u1 u2 廠商利潤收益成本雙方的得益利潤均取決于雙方的策略產(chǎn)量 46 2 3 1古諾的寡頭模型第三步均衡求解本博弈中的兩博弈方都有無限多種可選策略因而無法用得益矩陣表示該博弈納什均衡的概念還是適用的即只要兩博弈方的一個(gè)策略組合 q1 q2 滿足其中的q1 和q2 是博弈雙方都沒有動機(jī)改變的策略從而形成穩(wěn)定狀態(tài) 或互為對方最佳策略的最優(yōu)對策從而在互相影響的局勢下實(shí)現(xiàn)自身得益最大化那么這個(gè)策略組合就構(gòu)成一個(gè)納什均衡理性的博弈方廠商將會分別選擇這兩個(gè)產(chǎn)量 47 2 3 1古諾的寡頭模型如果策略組合是本博弈的納什均衡那么必須是最大值問題的解即是博弈方都沒有動機(jī)改變的策略組合實(shí)現(xiàn)了在相互影響的情況下博弈方自身得益最大化因此該策略組合具有穩(wěn)定性 48 2 3 1古諾的寡頭模型求兩個(gè)廠商利潤函數(shù)的一階偏導(dǎo)數(shù) 并令兩個(gè)一階偏導(dǎo)數(shù)都為0 可得即產(chǎn)量組合 2 2 為該博弈的納什均衡 49 2 3 1古諾的寡頭模型第四步模型結(jié)構(gòu)分析古諾寡頭博弈納什均衡狀態(tài)下的市場信息 1 商品總產(chǎn)量 Q q1 q2 2 2 4 2 商品市場出清價(jià)格 P 8 q1 q2 8 4 4 3 雙方各自的利潤 u1 u2 4 4 兩廠商利潤總和 u1 u2 4 4 8 50 2 3 1古諾的寡頭模型效率分析個(gè)體理性與集體理性的比較 1 從兩廠商總體利益最大化的角度出發(fā) 則廠商1和廠商2的總利潤 2 總體利潤函數(shù)求對Q的一階偏導(dǎo)數(shù) 并令一階偏導(dǎo)數(shù)為0 51 2 3 1古諾的寡頭模型共同利益最大化的集體理性與兩廠商獨(dú)立決策追求自身而不是共同利益最大化的個(gè)體理性的博弈結(jié)果相比集體理性的總產(chǎn)量較小 38 也就是說如果兩廠商更多考慮合作聯(lián)合起來決定產(chǎn)量先定出使總利益最大的產(chǎn)量后各自生產(chǎn)一半 1 5單位則各自分享的利益為4 5 比只考慮自身利益的獨(dú)立決策行為得到的利益要高 52 2 3 1古諾的寡頭模型當(dāng)然在兩個(gè)廠商缺少有力合作機(jī)制的時(shí)候這種聯(lián)合通常是很難實(shí)現(xiàn)的即使實(shí)現(xiàn) 常常也是不穩(wěn)定的因?yàn)槊總€(gè)博弈方都會有破壞這種合作的動機(jī) 從下面的分析我們就可以看到這種現(xiàn)象 53 2 3 1古諾的寡頭模型兩寡頭間的囚徒困境博弈 1 博弈方廠商1 廠商2 2 策略廠商1 突破1 5的平分合作產(chǎn)量不突破1 5的平分合作產(chǎn)量廠商2 突破1 5的平分合作產(chǎn)量不突破1 5的平分合作產(chǎn)量 54 2 3 1古諾的寡頭模型 3 得益情形1 雙方都不突破平分的合作總產(chǎn)量 1 5 平分 9 的總利潤此時(shí) q1 q2 1 5 u1 u2 4 5 情形2 廠商1私自突破平分合作產(chǎn)量 1 5 達(dá)到自身利益最大化產(chǎn)量 2 廠商2渾然不知仍然生產(chǎn) 1 5 的平分合作產(chǎn)量此時(shí) q1 2 q2 1 5 Q 3 5 P 8 Q 8 3 5 4 5u1 4 5 2 2 5 u2 4 5 2 1 5 3 75 55 2 3 1古諾的寡頭模型情形3 廠商2私自突破平分合作產(chǎn)量 1 5 達(dá)到自身利益最大化產(chǎn)量 2 廠商1渾然不知仍然生產(chǎn) 1 5 的平分合作產(chǎn)量此時(shí) q2 2 q1 1 5 Q 3 5 P 8 Q 8 3 5 4 5u2 4 5 2 2 5 u1 4 5 2 1 5 3 75情形4 雙方都突破平分的合作產(chǎn)量1 5 各自生產(chǎn)使自身利益最大化的產(chǎn)量2 此時(shí) q1 q2 2 u1 u2 4 56 2 3 1古諾的寡頭模型這樣這個(gè)兩寡頭間的囚徒困境博弈就可以使用如下的博弈矩陣表示 57 2 3 1古諾的寡頭模型從上面的模型分析我們可以知道每個(gè)博弈方都有動機(jī)破壞合作的產(chǎn)量以獲得更高的個(gè)人收益這將會使總體利益最大化的合作策略組合不突破不突破變得不穩(wěn)定難以實(shí)現(xiàn) 或即使實(shí)現(xiàn) 也難以維持古諾模型在現(xiàn)實(shí)經(jīng)濟(jì)中的最好例子之一如石油輸出國組織的限額和突破問題 58 2 3 2反應(yīng)函數(shù) 古諾模型的納什均衡也可以通過劃線法思路的推廣來分析與求解劃線法的思路是先找出每個(gè)博弈方針對其他博弈方所有策略或策略組合的最佳策略然后再找出相互構(gòu)成最佳對策的各博弈方策略組成的策略組合在無限策略的古諾模型中其他博弈方的策略有無限多種因此各個(gè)博弈方的最佳對策也有無限種它們之間往往構(gòu)成一種連續(xù)函數(shù)關(guān)系 59 2 3 2反應(yīng)函數(shù) 廠商1 對于廠商2的任意產(chǎn)量q2 廠商1的最佳對策q1 就是使自己在廠商2生產(chǎn)q2情況下最大化自身利潤的那個(gè)產(chǎn)量即q1是最大化問題的解廠商2 與廠商1的情形完全相同廠商2的對策q2是最大化問題的解 60 2 3 2反應(yīng)函數(shù) 分別對廠商1和廠商2的效用表達(dá)式求廠商決策變量q1 q2的一階偏導(dǎo)數(shù) 并令一階偏導(dǎo)數(shù)為0 得到q1 R q2 和q2 R q1 61 2 3 2反應(yīng)函數(shù) q1 R q2 表示對于廠商2的每一個(gè)可能的產(chǎn)量廠商1的最佳對策產(chǎn)量的計(jì)算公式它是廠商2產(chǎn)量的一個(gè)連續(xù)函數(shù) 我們稱這個(gè)連續(xù)函數(shù)為廠商1對廠商2的一個(gè) 反應(yīng)函數(shù) 同樣 q2 R q1 表示對于廠商1的每一個(gè)可能的產(chǎn)量廠商2的最佳對策產(chǎn)量的計(jì)算公式它是廠商1產(chǎn)量的一個(gè)連續(xù)函數(shù) 我們稱這個(gè)連續(xù)函數(shù)為廠商2對廠商1的一個(gè) 反應(yīng)函數(shù) 所謂反應(yīng)函數(shù) 簡單地說就是針對其他博弈參與人策略的一個(gè)最佳的策略函數(shù) 使用的是劃線法的思想 62 2 3 2反應(yīng)函數(shù) 古諾模型的反應(yīng)函數(shù) 3 0 0 3 0 6 6 0 2 2 63 2 3 2反應(yīng)函數(shù) 從上頁的反應(yīng)函數(shù)曲線中我們可以做出如下分析 1 首先分析廠商1的反應(yīng)曲線R1 q2 當(dāng)廠商2選擇0產(chǎn)量時(shí) 即q2 0 廠商1的最佳反應(yīng)為3 即q1 3 這正是實(shí)現(xiàn)市場總利益最大的產(chǎn)量廠商1獨(dú)自得到市場的總體利益當(dāng)廠商2的產(chǎn)量達(dá)到6時(shí) 廠商1被迫選擇0產(chǎn)量因?yàn)榇藭r(shí)廠商1堅(jiān)持生產(chǎn)已經(jīng)無利可圖 2 其次分析廠商2的反應(yīng)曲線R2 q1 與廠商1反應(yīng)曲線分析是完全相同的 64 2 3 2反應(yīng)函數(shù) 3 兩條反應(yīng)函數(shù)曲線的交點(diǎn)是 2 2 是由相互對對方的最佳反應(yīng)產(chǎn)量構(gòu)成的產(chǎn)量組合是納什均衡 4 2 2 點(diǎn)以外的其他點(diǎn)都僅僅是一方對另一方的最佳反應(yīng) 而不是相互的最佳反應(yīng) 這與納什均衡的定義是一致的 65 2 3 3伯特蘭德寡頭模型 1883 背景與假設(shè)伯特蘭德寡頭模型是價(jià)格博弈古諾寡頭模型是產(chǎn)量博弈寡頭間生產(chǎn)的產(chǎn)品不同質(zhì) 具有一定的可替代性因此即使某個(gè)寡頭廠商的產(chǎn)品價(jià)格較高也會有銷售這里仍只考慮兩寡頭的情形 66 2 3 3伯特蘭德寡頭模型寡頭1與寡頭2各自的需求函數(shù)為其中d1 d2 0是兩廠商產(chǎn)品的替代系數(shù) 假設(shè)廠商生產(chǎn)無固定成本邊際成本為c1 c2 兩廠商同時(shí)決定價(jià)格 67 2 3 3伯特蘭德寡頭模型博弈要素分析 1 博弈方廠商1 廠商2 2 策略廠商1與廠商2決定自身產(chǎn)品的價(jià)格P1 P2 3 順序同時(shí)決策 4 得益各自的利潤u1 u2 68 2 3 3伯特蘭德寡頭模型博弈雙方的得益 69 2 3 3伯特蘭德寡頭模型從自身效用最大化角度求廠商1和廠商2的反應(yīng)函數(shù)對于廠商1 求如下最大化問題的解求廠商1利潤函數(shù)對于廠商1的決策變量q1的一階偏導(dǎo)數(shù) 并令其為0 70 2 3 3伯特蘭德寡頭模型同理可求得廠商2的反應(yīng)函數(shù)綜上兩廠商對對方策略價(jià)格的反應(yīng)函數(shù) 71 2 3 3伯特蘭德寡頭模型求解納什均衡即求兩個(gè)反應(yīng)函數(shù)的交點(diǎn) 也就是解方程組過程略 72 2 3 3伯特蘭德寡頭模型納什均衡多寡頭情形的納什均衡的求解技術(shù)上就是求n個(gè)反應(yīng)函數(shù)的交點(diǎn) 實(shí)例彩電價(jià)格戰(zhàn) 囚徒困境的另一個(gè)實(shí)例 73 2 3 4公共資源問題公共資源無獨(dú)立所有權(quán) 公眾可以自由利用的自然資源或人類生產(chǎn)的供大眾免費(fèi)使用的設(shè)施休謨 DavidHume 1739 74 2 3 4公共資源問題公共草地放牧問題博弈要素分析 1 博弈方 n個(gè)農(nóng)戶 2 策略空間農(nóng)戶可能選擇的養(yǎng)羊數(shù)qi 3 順序同時(shí)決策 4 農(nóng)戶的得益其中V Q 表示羊只的單位產(chǎn)出 c表示農(nóng)戶養(yǎng)殖每只羊的成本這里假設(shè)c是個(gè)常數(shù) 75 2 3 4公共資源問題這里一個(gè)重要的假設(shè)就是每只羊的產(chǎn)出是羊只總數(shù)Q的減函數(shù) 這是因?yàn)槿绻蛱?那么牧草等養(yǎng)殖資源不足就會造成羊的質(zhì)量下降 76 2 3 4公共資源問題為了使討論比較簡單和能夠得到直觀的結(jié)論我們假設(shè) 1 農(nóng)戶數(shù) n 3 2 單位羊只養(yǎng)殖成本 c 4 3 單位羊只產(chǎn)出函數(shù) 4 那么3個(gè)博弈方即3個(gè)農(nóng)戶的得益為收入成本 77 2 3 4公共資源問題使用得益最大化思想分別求出三個(gè)農(nóng)戶各自對其他兩個(gè)農(nóng)戶策略的反應(yīng)函數(shù)農(nóng)戶1 效用函數(shù)對q1求偏導(dǎo)數(shù) 并令偏導(dǎo)數(shù)為0 78 2 3 4公共資源問題最終三個(gè)反應(yīng)函數(shù)為三個(gè)反應(yīng)函數(shù)的交點(diǎn)即為納什均衡 79 2 3 4公共資源問題總體利益最大的情況與個(gè)體理性決策進(jìn)行比較個(gè)體理性 80 2 3 4公共資源問題結(jié)論過度放牧資源浪費(fèi) 農(nóng)戶沒有獲得更好的效益這也是一類囚徒困境問題 81 2 3 4公共資源問題這個(gè)例子再一次證明了納什均衡或者說非合作博弈的結(jié)果可能是低效率的公共資源悲劇的現(xiàn)實(shí)例子冬蟲草和田玉公共網(wǎng)絡(luò) 公共交通防護(hù)林的保護(hù) 公共設(shè)施問題公共設(shè)施搭便車者總是比提供者合算的公共設(shè)施供給不足公共資源利用公共設(shè)施提供政府的組織協(xié)調(diào)和制約是非常必要的 82 2 3 5反應(yīng)函數(shù)的問題和局限性在許多博弈中博弈方的策略是有限且非連續(xù)時(shí) 其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù) 無法求得反應(yīng)函數(shù) 從而不能通過解方程組的方法求得納什均衡 83 圖b 圖a 2 3 5反應(yīng)函數(shù)的問題和局限性即使得益函數(shù)可以求導(dǎo) 也可能各博弈方的得益函數(shù)比較復(fù)雜因此各自的反應(yīng)函數(shù)也比較復(fù)雜并不總能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn) 圖a 特別是不能保證有唯一的交點(diǎn) 圖b 84 2 4混合策略和混合策略納什均衡 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn)2 4 2多重均衡博弈和混合策略2 4 3混合策略和嚴(yán)格下策反復(fù)消去法2 4 4混合策略反應(yīng)函數(shù) 85 嚴(yán)格競爭博弈各博弈方的利益和偏好始終不一致在通常策略上沒有納什均衡的博弈問題猜硬幣博弈純確定性策略下沒有納什均衡但博弈方仍不能隨意決策 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 86 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 首先對蓋硬幣方進(jìn)行分析這個(gè)博弈中各博弈方?jīng)Q策的第一個(gè)原則自己的策略選擇不能預(yù)先被另一方知道或猜測到否則對方就會利用這點(diǎn)來選擇策略從而在博弈中獲勝其次自己選擇策略要避免規(guī)律性選擇策略如果出現(xiàn)規(guī)律性比如一次正面一次反面一次正面那么對方也會利用這個(gè)規(guī)律獲勝更進(jìn)一步如果蓋硬幣方已經(jīng)使用隨機(jī)策略隨機(jī)地選擇蓋正面或反面但總體上出某個(gè)策略的概率更大那么對方仍然會有機(jī)可乘 87 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 因此如果蓋硬幣方以1 2的概率隨機(jī)選擇自身的策略那么對方就無法從選擇策略的偏好中占得任何便宜也就是說博弈方必須保證自身策略選擇的隨機(jī)性以及重視各個(gè)策略的概率分布以防止其他博弈方猜到自己的策略或利用自己對策略選擇的偏好獲利 88 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 混合策略 MixedStrategies 一套出招的隨機(jī)概率在博弈G S1 S2 Sn u1 u2 un 中博弈方i的策略空間為Si Si1 Sik 則博弈方i以概率分布pi pi1 pik 隨機(jī)在其k個(gè)可選策略中選擇的策略稱為混合策略其中0 pik 1對j 1 2 k都成立且pi1 pik 1 純確定性策略也可以看作混合策略即選擇相應(yīng)純策略的概率為1 選擇其余純策略的概率為0的混合策略混合策略可以看作純策略的擴(kuò)展如果給一個(gè)博弈的每個(gè)博弈方的純策略空間賦予不同的概率分布就形成了不同的混合策略 89 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 混合策略擴(kuò)展博弈純策略空間si1 si2 概率分布Pi1 pi11 pi12 Pi2 pi21 pi22 Pi 新純策略si1 pi11si1 pi12si2 si2 pi21si1 pi22si2 si 90 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 當(dāng)博弈方在這個(gè) 新產(chǎn)生的混合策略空間中的選擇看作一個(gè)博弈時(shí) 原博弈的混合策略就成了后面這個(gè)擴(kuò)展出來的博弈的純策略擴(kuò)展出來的博弈可稱為原博弈的混合策略擴(kuò)展博弈 91 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 混合策略納什均衡博弈從純策略向混合策略擴(kuò)展后納什均衡的概念仍然是成立的其實(shí)質(zhì)是沒有改變的納什均衡意味著任何博弈方單獨(dú)改變自己的策略或者隨機(jī)選擇各個(gè)純策略的概率分布都不能給自己增加任何利益如果確實(shí)是一個(gè)嚴(yán)格意義上的混合策略組合即未退化為純策略組合構(gòu)成一個(gè)納什均衡則稱為一個(gè) 混合策略納什均衡 92 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 博弈方1的混合策略隨機(jī)選擇A B的概率PA和PB 一定要使博弈方2選C和選D的期望得益相等即這樣博弈方1的策略選擇就不會讓博弈方2有任何傾向性博弈方2就不可能通過博弈方1的選擇偏好獲利博弈方2選擇C和D無差異博弈方2 博弈方1 93 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 博弈方2的混合策略隨機(jī)選擇C D的概率PC和PD 一定要使博弈方1選A和選B的期望得益相等即這樣的話博弈方2的策略選擇就不會讓博弈方1有任何傾向性 94 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 求解混合策略納什均衡該博弈的混合策略納什均衡為 95 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 博弈方1和博弈方2的期望得益 96 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 綜上所述該博弈的混合策略納什均衡為博弈方1在均衡狀態(tài)下的期望得益為2 6 博弈方2在均衡狀態(tài)下的期望得益為2 6 97 齊威王田忌賽馬 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 田忌齊威王得益矩陣 PaPbPcPdPePf PgPhPiPjPkPl 98 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 齊威王的混合策略一定要使田忌選g h i j k l的期望得益相等這樣的話齊威王的策略選擇就不會讓田忌有任何傾向性從而使田忌從中占到便宜則有令 99 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 同理田忌也會選擇使得齊威王各種策略期望收益相等的混合策略令解得令解得 100 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 在上述混合策略下齊威王的期望得益為1 田忌的期望得益為 1 即多次進(jìn)行這樣的賽馬齊威王平均每次能贏田忌一千斤銅這是因?yàn)辇R威王三匹馬的總體實(shí)力略勝于田忌三匹馬的總體實(shí)力的緣故 101 小偷和守衛(wèi)的博弈澤爾騰 1996 上海在純策略下不存在納什均衡使用圖解法求混合策略納什均衡 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 守衛(wèi)睡的期望得益S D S 1 pt D pt守衛(wèi)不睡的期望得益 0 pt 0 S 1 pt 0 102 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 首先討論小偷偷與不偷兩種策略概率的確定守衛(wèi)得益睡小偷偷的概率 S 0 1 D 橫軸表示小偷偷的概率Pt 分布在0 1之間不偷的概率則為1 Pt 縱軸反映對應(yīng)于小偷偷的不同概率守衛(wèi)選擇睡的期望收益圖中S D連線 S D S 1 pt D pt 當(dāng)小偷偷的概率大于pt 時(shí) 守衛(wèi) 睡的期望得益小于不睡的得益0 因此他肯定百分之百選擇不睡從而小偷偷一次被抓一次 103 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 當(dāng)小偷偷的概率大于pt 時(shí) 守衛(wèi) 睡的期望得益小于不睡的期望得益0 因此他肯定百分之百選擇不睡從而小偷偷一次被抓一次當(dāng)小偷偷的概率小于pt 時(shí) 守衛(wèi) 睡的期望得益大于不睡的得益0 因此他肯定百分之百選擇睡從而小偷偷竊會得益只要偷的概率不大于pt 的概率小偷都會得益因此膽子越來越大會逐漸提高偷竊概率直到pt 均衡點(diǎn)是pt 偷 1 pt 不偷此時(shí)守衛(wèi) 睡與不睡的期望收益均為0 104 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 小偷得益偷守衛(wèi)睡的概率 0 1 V P P V V pg P 1 pg 其次討論守衛(wèi) 睡與不睡兩種策略概率的確定當(dāng)守衛(wèi) 睡的概率大于pg 時(shí) 小偷偷的期望得益大于不偷的得益0 因此他肯定百分之百選擇偷 105 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 當(dāng)守衛(wèi) 睡的概率大于pg 時(shí) 小偷偷的期望得益大于不偷的期望得益0 因此他肯定百分之百選擇偷當(dāng)守衛(wèi) 睡的概率小于pg 時(shí) 小偷偷的期望得益小于不偷的期望得益0 因此他肯定百分之百選擇不偷只要守衛(wèi) 睡的概率不大于pg 小偷就不會偷竊因此守衛(wèi)的膽子越來越大會逐漸提高睡的概率直到pg 均衡點(diǎn)是pg 睡 1 pg 不睡此時(shí)小偷偷與不偷的期望收益均為0 106 激勵(lì)的悖論守衛(wèi)得益睡小偷偷的概率 S 0 1 D D S D S 1 pt D pt 1 加重對守衛(wèi)的處罰 D增加短期中的效果是使守衛(wèi)真正盡職睡的期望收益為負(fù) 守衛(wèi)短期內(nèi)會選擇不睡在長期中并不能使守衛(wèi)更盡職 pg 并不會下降但會降低盜竊發(fā)生的概率 pt 會下降即加重對守衛(wèi)的處罰不會對守衛(wèi)的工作態(tài)度產(chǎn)生長期影響反而會間接降低小偷偷竊的概率 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 107 2 4 1嚴(yán)格競爭博弈和混合策略的引進(jìn) 激勵(lì)的悖論小偷得益偷守衛(wèi)睡的概率 0 1 V P P P V V pg P 1 pg 2 加重對小偷的處罰短期內(nèi)能抑制盜竊發(fā)生率偷期望收益短期內(nèi)為負(fù)數(shù) 小偷短期內(nèi)會選擇不偷長期并不能降低盜竊發(fā)生率 pt 并不會改變但會使守衛(wèi)更多的偷懶 pg 會上升 108 夫妻之爭的混合策略納什均衡妻子的概率選擇使丈夫選擇兩種策略的期望得益相同 2 4 2多重均衡博弈和混合策略 109 丈夫的概率選擇使妻子選擇兩種策略的期望得益相同妻子的期望得益丈夫的期望得益 2 4 2多重均衡博弈和混合策略 110 2 4 2多重均衡博弈和混合策略我們發(fā)現(xiàn) 在夫妻之爭博弈中雙方進(jìn)行溝通交流一方遷就另一方的結(jié)果要比上面分析的混合策略納什均衡結(jié)果要好因?yàn)橄嗷ミw就的純策略納什均衡最少會使得丈夫或妻子得到1的確定收益這要大于混合策略均衡時(shí)的期望收益0 75 111 制式問題零配件匹配偏好問題廠商1偏好 2 2 均衡而廠商2偏好于 1 3 2 4 2多重均衡博弈和混合策略 112 2 4 2多重均衡博弈和混合策略混合策略納什均衡為廠商1 0 4 0 6 期望收益 0 664廠商2 0 67 0 33 期望收益 1 296 相互協(xié)商達(dá)成的純策略的得益也是要大于混合策略均衡下的期望收益 113 市場機(jī)會博弈過程請同學(xué)們自己完成 2 4 2多重均衡博弈和混合策略廠商1 2 3 1 3 期望收益 0廠商2 2 3 1 3 期望收益 0 114 2 4 3混合策略和嚴(yán)格下策反復(fù)消去法在包括混合策略的情況下嚴(yán)格下策反復(fù)消去法的結(jié)論仍然成立 1 任何博弈方不會采用嚴(yán)格下策不管它們是純策略還是混合策略 2 嚴(yán)格下策反復(fù)消去法不會消去任何納什均衡包括純策略納什均衡和混合策略納什均衡 3 如果經(jīng)過反復(fù)消去后留下的策略組合是惟一的那么一定是納什均衡 115 2 4 3混合策略和嚴(yán)格下策反復(fù)消去法博弈方2采用純策略L時(shí) 博弈方1用上述混合策略的期望得益為博弈方2采用純策略R時(shí) 博弈方1用上述混合策略的期望得益為博弈方2采用混合策略 q 1 q 時(shí) 博弈方1用上述混合策略的期望得益為博弈方1采取混合策略以概率 1 2 1 2 0 選擇 U M D 時(shí) 與這個(gè)混合策略相比 D一定是博弈方1的嚴(yán)格下策 116 2 4 3混合策略和嚴(yán)格下策反復(fù)消去法因此不管博弈方2采用哪種策略包括所有可能得純策略和所有混合策略對應(yīng)q的所有可能值博弈方1采用 1 2 1 2 0 的期望收益始終為3 2 都要大于采用D策略時(shí)得到的確定性得益1 由于我們假設(shè)博弈方是風(fēng)險(xiǎn)中性的 D相對于混合策略 1 2 1 2 0 是嚴(yán)格下策 117 2 4 3混合策略和嚴(yán)格下策反復(fù)消去法需要注意的是并不是包括混合策略以后博弈中一定會存在可以先行削去的純策略嚴(yán)格下策如將博弈的得益修改為 D就不再是嚴(yán)格下策 1 3 2 2 沒有嚴(yán)格的優(yōu)劣 118 2 4 4混合策略反應(yīng)函數(shù) 反應(yīng)函數(shù)即一博弈方對另一博弈方每種可能的決策內(nèi)容的最佳反應(yīng)決策構(gòu)成的函數(shù) 在純策略的范疇內(nèi) 反應(yīng)函數(shù)是各博弈方選擇的純策略對其他博弈方純策略的反應(yīng) 在混合策略的范疇內(nèi) 博弈方的決策內(nèi)容為選擇概率分布反應(yīng)函數(shù)就是一方對另一方的概率分布的反應(yīng) 同樣也是一定的概率分布 119 2 4 4混合策略反應(yīng)函數(shù) 猜硬幣博弈正反蓋硬幣方 r 1 r 猜硬幣方 q 1 q qU 蓋反 r 1即對方猜正面的概率小我蓋正面有便宜所以我傾向于蓋正面故r 1 我總蓋正面 q 1 2時(shí) U 蓋反 U 蓋正 r任意q 1 2時(shí) U 蓋正 U 蓋反 r 0 r1 2時(shí) U 猜正 U 猜反 q 1 r q 0 1 2 1 r R1 q 1 2 1 q R2 r 對方猜正面的概率對方蓋正面的概率混和策略NE蓋 1 2 1 2 猜 1 2 1 2 120 2 4 4混合策略反應(yīng)函數(shù) 夫妻之爭分析妻子對丈夫的混合策略 q 1 q 的對策分析 1 妻子選擇宮心計(jì) 的期望收益U C 3q 0 1 q 3q 2 妻子選擇世界杯的期望收益U F 0q 1 1 q 1 q因此當(dāng)q1 4時(shí) r 1 1 r 0 丈夫的分析同妻子 121 2 4 4混合策略反應(yīng)函數(shù) 分析丈夫對妻子的混合策略 r 1 r 的對策分析 1 丈夫選擇宮心計(jì) 的期望收益U C 1r 0 1 r r 2 丈夫選擇世界杯的期望收益U F 0r 3 1 r 3 3r因此當(dāng)r3 4時(shí) q 1 1 q 0 122 2 4 4混合策略反應(yīng)函數(shù) 夫妻之爭宮心計(jì)世界杯妻子 r 1 r 丈夫 q 1 q 妻子 qU C r 0q 1 4時(shí) U F U C r取 0 1 任意值 q 1 4時(shí) U C U F r 1 丈夫 rU C q 0r 3 4時(shí) U F U C q取 0 1 任意值 r 3 4時(shí) U C U F q 1 0 1 4 r 3 4 1 q 1 r R1 q q R2 r 純策略NE1 世界杯世界杯純策略NE1 宮心計(jì) 宮心計(jì) 混和策略NE妻 3 4 1 4 丈 1 4 3 4 123 2 5納什均衡的存在性納什定理 Nash1950 在一個(gè)有n個(gè)博弈方的博弈G S1 Sn u1 un 中如果n是有限的其Si都是有限集對i 1 2 n 則該博弈至少存在一個(gè)納什均衡但可能包括混合策略納什均衡每一個(gè)有限博弈都至少有一個(gè)混合策略納什均衡定理證明不動點(diǎn)定理納什定理的意義 NE存在的普遍性一致預(yù)測成為博弈問題分析方法 124 2 6納什均衡的選擇和分析方法擴(kuò)展納什均衡是博弈問題最基本的分析概念是均衡分析概念的基礎(chǔ) 但納什均衡分析并不一定能徹底解決一個(gè)博弈問題因?yàn)榧{什均衡的存在性不等于惟一性在許多博弈中納什均衡是不惟一的而且不同的納什均衡相之間也沒有明顯的優(yōu)劣關(guān)系從而博弈方的選擇會遇到困難夫妻之爭博弈就是這樣的一個(gè)典型例子 125 2 6納什均衡的選擇和分析方法擴(kuò)展即使一個(gè)博弈的幾個(gè)納什均衡之間存在優(yōu)劣關(guān)系帕累托效率意義上的也不能保證博弈方一定會選擇較優(yōu)的納什均衡風(fēng)險(xiǎn) 破壞者串通的存在使得博弈結(jié)果無法用納什均衡加以解釋因此對有些博弈問題僅僅進(jìn)行納什均衡分析是不夠的必須在納什均衡分析的基礎(chǔ)上再作進(jìn)一步的深入分析 126 2 6納什均衡的選擇和分析方法擴(kuò)展 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡帕累托上策均衡風(fēng)險(xiǎn)上策均衡2 6 2聚點(diǎn)和相關(guān)均衡聚點(diǎn)均衡相關(guān)均衡2 6 3共謀和防共謀均衡多人博弈中的共謀問題防共謀均衡 127 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡帕累托上策均衡依據(jù)帕累托效率意義上的優(yōu)劣關(guān)系某一個(gè)納什均衡給所有博弈方帶來的利益都大于其他所有納什均衡會帶來的利益博弈方選擇的傾向性是一致的兩個(gè)純策略納什均衡戰(zhàn)爭戰(zhàn)爭和平和平在帕累托效率意義上和平和平明顯較好構(gòu)成一個(gè)帕累托上策均衡如果兩國的決策者都是理性的那么兩個(gè)國家之間就不應(yīng)該會發(fā)生戰(zhàn)爭 128 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡風(fēng)險(xiǎn)上策均衡如果所有博弈方在預(yù)計(jì)其他博弈方采用兩種納什均衡的策略的概率相同時(shí) 都偏愛其中某一納什均衡則該納什均衡就是一個(gè)風(fēng)險(xiǎn)上策均衡明顯地 U L 為帕累托上策均衡但是選擇這個(gè)NE對雙方都有很大風(fēng)險(xiǎn) 一旦對方偏離這個(gè)均衡那么自身的得益損失是非常大的相對于這種高風(fēng)險(xiǎn) D R 就有了相對優(yōu)勢 129 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡混合策略納什均衡混合策略納什均衡是博弈方使得對方行為選擇無差異時(shí) 自身行為的概率分布博弈方1 令博弈方2選擇L與R無差異博弈方2 令博弈方1選擇U與D無差異 130 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡檢查博弈方的策略偏好博弈方1的混合策略 PU和PD 與博弈方2策略L與R的偏好性當(dāng)PU1 8時(shí) 有U L U R 即此時(shí)博弈方2對策略R具有偏好 131 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡檢查博弈方的策略偏好博弈方2的混合策略 PL和PR 與博弈方1策略U與D的偏好性當(dāng)PL1 8時(shí) 有U U U D 即博弈方2對策略D具有偏好 132 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡如果博弈方1傾向于策略D的隨機(jī)概率大于12 5 那么博弈方2的R策略相對于帕累托均衡策略L就具有期望得益上的優(yōu)勢因此博弈方2偏好于R 如果博弈方2傾向于R的隨機(jī)概率大于12 5 那么博弈方1的D策略相對于帕累托均衡策略D就具有期望得益上的優(yōu)勢因此博弈方1偏好于D 133 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡總結(jié) 偏離的概率要求小于1 8 12 5 才能保證帕累托上策均衡 U L 可以實(shí)現(xiàn) 這比較不保險(xiǎn) 一旦對方偏離帕累托上策均衡的概率大于12 5 如果自己不改變帕累托上策均衡的策略那么很有可能獲得0收益風(fēng)險(xiǎn)很大所以在收益相差不是很大的情況下 D R 相對于 U L 具有風(fēng)險(xiǎn)上的較大優(yōu)勢 D R 就是一個(gè)風(fēng)險(xiǎn)上策均衡說白了一方不靠譜使得另一方選擇更加保險(xiǎn)的策略 134 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡獵鹿博弈詳細(xì)分析如上例請同學(xué)們自行完成獵鹿有風(fēng)險(xiǎn)捕兔有保障其中一種簡單情況假如另一方選擇獵鹿和抓兔的概率都是1 2 那么獵鹿的期望收益僅為2 5 小于抓兔子的確定性收益3 因此兔子兔子就是這個(gè)博弈的一個(gè)風(fēng)險(xiǎn)上策均衡獵人1獵鹿獵人2獵鹿 135 2 6 1帕累托和風(fēng)險(xiǎn)上策均衡博弈方對風(fēng)險(xiǎn)上策均衡的選擇傾向有一種自我強(qiáng)化的機(jī)制當(dāng)部分或所有博弈方選擇風(fēng)險(xiǎn)上策均衡的可能性增強(qiáng)時(shí) 都擔(dān)心對方偏離帕累托上策均衡任一博弈方選擇帕累托上策均衡策略的期望得益都會進(jìn)一步變小這就使各博弈方更傾向于選擇風(fēng)險(xiǎn)上策均衡從而形成一種選擇風(fēng)險(xiǎn)上策均衡的正反饋機(jī)制使其出現(xiàn)的機(jī)會越來越大合作難多人合作更難 136 2 6 2聚點(diǎn)和相關(guān)均衡 1 聚點(diǎn)均衡人們的決策選擇受心理習(xí)慣文化環(huán)境等多種因素影響體現(xiàn)出這些因素的納什均衡就稱為聚點(diǎn)均衡 137 2 6 2聚點(diǎn)和相關(guān)均衡例1 報(bào)時(shí)博弈 1 博弈參與人博弈方1 博弈方2 2 策略雙方選擇0點(diǎn)到24點(diǎn)的任意時(shí)間報(bào)時(shí) 無限 3 順序同時(shí) 4 得益 2人報(bào)時(shí)間相同獲得100元報(bào)時(shí)不同獲得0元選擇整點(diǎn)后即聚點(diǎn) 雖然不能保證雙方的選擇一致但至少能大大提高雙方選擇一致的概率 138 2 6 2聚點(diǎn)和相關(guān)均衡聚點(diǎn)均衡在多重納什均衡的博弈中雙方同時(shí)選擇一個(gè)聚點(diǎn)構(gòu)成的納什均衡稱為聚點(diǎn)均衡 139 2 6 2聚點(diǎn)和相關(guān)均衡例2 城市博弈上海南京長春哈爾濱兩人將以上四個(gè)城市分成兩組如果兩人的分組相同獲得100元中國人通常會上海南京長春哈爾濱按南方和北方城市的特征分組地理常識產(chǎn)生聚點(diǎn) 140 2 6 2聚點(diǎn)和相關(guān)均衡聚點(diǎn)均衡首先是納什均衡是多重納什均衡中比較容易被選擇的納什均衡聚點(diǎn)均衡是利用博弈規(guī)則以外的特定信息選擇的均衡文化背景中的習(xí)慣或規(guī)范共同的知識或者其他各種特征都可能是聚點(diǎn)均衡的依據(jù) 141 2 6 2聚點(diǎn)和相關(guān)均衡 2 相關(guān)均衡人們在現(xiàn)實(shí)中遇到選擇困難時(shí) 特別是在長期中反復(fù)遇到相似的選擇難題時(shí) 通常會通過收集更多的信息形成特定的機(jī)制和規(guī)則也就是某種形式的制度安排等主動尋找出路 142 2 6 2聚點(diǎn)和相關(guān)均衡相關(guān)均衡例子存在三個(gè)納什均衡其中兩個(gè)是純策略均衡 U L D R 一個(gè)是混合策略均衡 1 2 1 2 1 2 1 2 純策略均衡雖然都能使雙方得到6單位的得益總和但是個(gè)人得益差距很大很難形成自然妥協(xié) 聚點(diǎn) 不適用若采用混合策略納什均衡

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

完全信息靜態(tài)博弈教學(xué)課件PPT.ppt

文檔簡介

溫馨提示

最新文檔

評論

完全信息靜態(tài)博弈教學(xué)課件PPT.ppt

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔