混合策略納什均衡概述_第1頁
混合策略納什均衡概述_第2頁
混合策略納什均衡概述_第3頁
混合策略納什均衡概述_第4頁
混合策略納什均衡概述_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2022年12月28日1社會福利博弈:無納什均衡

流浪漢尋找工作游蕩救濟政府不救濟3,2-1,3-1,10,0你救濟,他就游蕩;你游蕩,他就不救濟2022年12月28日2社會福利博弈的特征不存在納什均衡類似:父母與啃老族回望:另一個不正常的博弈情侶博弈——兩個納什均衡2022年12月28日3思考如何分析“不存在”納什均衡或存在多個納什均衡的博弈?2022年12月28日4第三章混合策略納什均衡第一節(jié)基本概念:混合策略與期望支付2022年12月28日5第一節(jié)混合策略與期望支付一、混合策略(一)案例:小偷與守衛(wèi)的貓鼠博弈守衛(wèi)睡不睡偷小偷不偷8,-2-2,00,80,02022年12月28日6小偷與守衛(wèi)博弈無納什均衡,如何分析?2022年12月28日7第一節(jié)混合策略與期望支付一、混合策略(二)混合策略1.表述參與人按照一定概率,隨機從策略組合中選擇一種策略作為實際行動隨機行動的目的:使自己的行為不被對手預測2022年12月28日8混合策略小偷的混合策略以p的概率偷,(p,1-p)守衛(wèi)的混合策略以q的概率睡(q,1-q)2022年12月28日9第一節(jié)混合策略與期望支付一、混合策略(二)混合策略2.相對概念:純策略每個參與人的非隨機性選擇純粹行動計劃,p=100%,1-p=02022年12月28日10第一節(jié)混合策略與期望支付一、混合策略(二)混合策略3.數(shù)學刻畫給定博弈G={S1,…,Sn;u1,…,un}以及參與人i的純策略Si={si1,…,sik}概率分布pi=(pi1,…,pik)為混合策略其中:0≤pik≤1,∑pik=1,pik=p(sik

)混合策略組合p=(p1,…,pi,…pn)2022年年12月月25日日11第一一節(jié)節(jié)混混合合策策略略與與期期望望支支付付二、、期期望望支支付付(一一))分分析析1.概率率(偷偷,,睡睡))的的概概率率::pq(偷偷,,不不睡睡))的的概概率率::p(1-q)(不不偷偷,,睡睡))的的概概率率::(1-p)q(不不偷偷,,不不睡睡))的的概概率率:(1-p)(1-q)2022年12月25日12第一節(jié)混混合合策略與與期望支支付二、期望望支付(一)分分析2.期望支付付U小偷=8pq+(-2)p(1-q)+0(1-p)q+0(1-p)(1-q)=2p(5q-1)U守衛(wèi)=(-2)pq+0p(1-q)+8(1-p)q+0(1-p)(1-q)=2q(4-5p)2022年12月25日13第一節(jié)混混合合策略與與期望支支付二、期望望支付(二)數(shù)數(shù)學刻畫畫2022年12月25日14第一節(jié)混混合合策略與與期望支支付三、混合合策略納納什均衡衡給定策略略式博弈弈G={S1,…,Sn;u1,…,un}以及混混合策略略組合p*=(p1*,…,pi*,…pn*)對于所有有i和pi∈∑i,∑i——i的混合策策略空間間如果有::πi(pi*,p-i*)≥ππi(pi’,p-i*)則:混合合策略組組合p*=(p1*,…,pi*,…pn*)為G的混合策策略納什什均衡2022年12月25日日15第二節(jié)研研究方法::反應函數(shù)法法——最佳反應函數(shù)數(shù)曲線交叉法法一、案例:麥麥琪的禮物Dela剪發(fā)q保留(1-q)賣表pJim保留(1-p)-2,-22,22,20,02022年12月25日日16二、研究方法法:反應函數(shù)數(shù)法二、期望支付付1.UJim=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2p(1-3q)+2q整理原則:一一項含p,一項不含p2.UDel=(-2)pq+2p(1-q)+2(1-p)q+0(1-p)(1-q)=2q(1-3p)+2p整理原則:一一項含q,一項不含q2022年12月25日日17二、研究方法法:反應函數(shù)數(shù)法三、反應函數(shù)數(shù)1.Jim:Dela剪發(fā)的概率越越小,Jim賣表越好UJim=2p(1-3q)+2q2022年12月25日日18二、研究方法法:反應函數(shù)數(shù)法三、反應函數(shù)數(shù)2.Dela:Jim賣表的概率越越小,Dela剪發(fā)越好UDel=2q(1-3p)+2p2022年12月25日日19二、研究方法法:反應函數(shù)數(shù)法四、反應函數(shù)數(shù)曲線1.交點(1,0)雙方支付為22.交點(0,1)雙方支付為23.交點(1/3,1/3)雙方支付為2/3qp11/31/31互相為對方著著想,期望支支付變小2022年12月25日日20作業(yè)利用反應函數(shù)數(shù)法求解“社會福利博弈弈”是否需要調整整數(shù)據(jù)?可得出有關社社會保障體系系改革的結論論?2022年年12月25日21友軍博弈英國國支持巴頓支支持蒙帥帥支持巴頓美國支持蒙帥4,32,21,13,42022年年12月25日22友軍博弈特特征兩個(多個個)納什均均衡問題:博弈弈的最終結結果?2022年年12月25日23第三章混混合策略略納什均衡衡第三節(jié)多多重納什什均衡的選選擇標準2022年年12月25日24第三節(jié)多多重納什均均衡的選擇擇標準一、帕累托托優(yōu)勢標準準:得益更大(一)案例例:戰(zhàn)爭與與和平C國鷹戰(zhàn)略鴿鴿戰(zhàn)戰(zhàn)略鷹戰(zhàn)略A國鴿戰(zhàn)略-5,-58,-10-10,810,102022年年12月25日25第三節(jié)多多重納什均均衡的選擇擇標準一、帕累托托優(yōu)勢標準準:得益更更大(二)納什什均衡的選選擇標準帕累托優(yōu)勢勢標準按照支付大小篩選納什均均衡-5,-58,-10-10,810,102022年年12月25日26第三節(jié)多重重納什均衡衡的選擇標標準二、風險優(yōu)優(yōu)勢標準::風險更小???(一)案例例:串通作作弊博弈學生乙作弊不不作弊弊作弊學生甲不作弊9,90,88,07,7帕累托優(yōu)勢勢?2022年年12月25日27第三節(jié)多重重納什均衡衡的選擇標標準二、風險優(yōu)優(yōu)勢標準::風險更小?。ǘ┓治鑫觯浩x損損失比較法法1.甲:單獨偏離均均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=79,90,88,07,72022年年12月25日28第三節(jié)多重重納什均衡衡的選擇標標準二、風險優(yōu)優(yōu)勢標準::風險更小?。ǘ┓治鑫觯浩x損損失比較法法2.乙:單獨偏離均均衡的損失(1)偏離“作弊”:9-8=1(2)偏離“不作弊”:7-0=79,90,88,07,72022年年12月25日29第三節(jié)多重重納什均衡衡的選擇標標準二、風險優(yōu)優(yōu)勢標準::風險更小小(二)分析析:偏離損損失比較法法3.偏離損失比比較方法:偏離離“作弊”的損失VS偏離“不作弊”的損失1×1<7×79,90,88,07,72022年年12月25日30第三節(jié)多重重納什均衡衡的選擇標標準二、風險優(yōu)優(yōu)勢標準::風險更小小(二)分析析:偏離損損失比較法法4.結論(1)偏離(不不作弊,不不作弊)的的損失更大大:49(2)不偏離((不作弊,,不作弊))9,90,88,07,72022年年12月月25日日31第三三節(jié)節(jié)多多重重納納什什均均衡衡的的選選擇擇標標準準二、、風風險險優(yōu)優(yōu)勢勢標標準準::風風險險更更小小(三三))納納什什均均衡衡的的選選擇擇標標準準::風風險險優(yōu)優(yōu)勢勢標標準準比較較不不同同納納什什均均衡衡之之間間的的風風險險狀狀況況,,風風險險小小的的納納什什均均衡衡優(yōu)優(yōu)先先9,90,88,07,72022年年12月月25日日32第三三節(jié)節(jié)多多重重納納什什均均衡衡的的選選擇擇標標準準三、、聚聚點點均均衡衡(一一))案案例例::城城市市分分組組博博弈弈參與與人人::甲甲乙乙策略略::把把上上海海、、長長春春、、南南京京、、哈哈爾爾濱濱四四個個城城市市分分成成兩兩組組,,每每組組2個城城市市支付付::甲甲乙乙分分法法相相同同———獎勵勵100元;;甲甲乙乙分分法法不不同同———獎勵勵0元2022年12月25日日33第三節(jié)多重納納什均衡的選選擇標準三、聚點均衡衡(二)聚點均均衡1.標準使用社會文化化習慣、博弈弈歷史等信息息達到均衡1、10、66、8882.實質規(guī)律性2022年12月25日日34第三節(jié)多重納納什均衡的選選擇標準四、相關均衡衡(一)案例::“地域連坐”下的產(chǎn)品質量量博弈企業(yè)乙好產(chǎn)品差差產(chǎn)品好產(chǎn)品企業(yè)甲差產(chǎn)品4,4-8,-2-2,-8-2,-22022年12月25日日35第三節(jié)多重納納什均衡的選選擇標準四、相關均衡衡(二)相關均均衡參與人主動設設計某種形式式的選擇機制制,形成制度度安排,從而而確定最終均均衡“三鹿”事件出現(xiàn)后,,河北省其他他食品企業(yè)以以后如何做??4,4-8,-2-2,-8-2,-22022年12月25日日36第三節(jié)多重納納什均衡的選選擇標準五、抗共謀均均衡(一)案例::抽象的選擇擇乙左右右上甲下乙左右右上甲下0,0,10-5,-5,0-5,-5,01,1,-5丙:A-2,-2,0-5,-5,0-5,-5,0-1,-1,5丙:B2022年12月25日日37第三節(jié)多重納納什均衡的選選擇標準五、抗共謀均均衡(二)共謀偏偏離(集體偏偏離)均衡的的激勵1.如果集體偏離(上,左,A)(1)起因:甲、、乙集體偏離離,選(下,,右,A)(2)結果:甲的的支付0→1,乙的支付0→1(3)結論:甲、、乙有集體偏偏離的動機,,(上,左左,A)非抗共謀均均衡2022年12月25日日38第三節(jié)多重納納什均衡的選選擇標準五、抗共謀均均衡(二)共謀偏偏離(集體偏偏離)均衡的的激勵2.如果集體偏離(下,右,B)(1)若甲、乙集集體偏離,選選(上,左,,B)-1→-2,-1→-2(2)若甲、丙集集體偏離,選選(上,右,,A)-1→-5,5→0(3)若乙、丙集集體偏離,選選(下,左,,A)-1→-5,5→0(4)結論:缺乏乏集體偏離的的激勵,(下,右,B)為抗共謀均衡2022年12月25日日39獵鹿博弈:何何為抗共謀均均衡?乙獵鹿打打兔兔獵鹿甲打兔10,100,44,04,42022年年12月25日日40金無足足赤,,人無無完人人人總是是要犯犯錯誤誤的,,所以以要對對別人人寬容容2022年年12月25日日41經(jīng)得起起考驗驗的納納什均均衡在其他參參與人人選擇擇了錯錯誤策策略的情況況下,,某參參與人人仍能能實現(xiàn)現(xiàn)納什什均衡衡他人不不犯錯錯誤,,你能能實現(xiàn)現(xiàn)最優(yōu)優(yōu);他他人犯犯錯誤誤,你你仍能能實現(xiàn)現(xiàn)最優(yōu)優(yōu)2022年年12月25日日42第三節(jié)節(jié)多重重納什什均衡衡的選選擇標標準六、顫顫抖手手精煉煉均衡衡Trembling-handperfectequilibrium(一))顫抖抖手某一參參與人人的非蓄意意錯誤博弈偏偏離均均衡路路徑的的原因因一個人用手抓東西時,手一顫抖,就可能抓不住他想抓的東西:非蓄意錯誤2022年年12月25日日43第三節(jié)節(jié)多重重納什什均衡衡的選選擇標標準六、顫顫抖手手精煉煉均衡衡(二))顫抖抖手均均衡1.基本思思想給定所有參參與人人均可可能犯犯錯誤誤的情況況下,,如果果某一一策略略組合合仍是是每一一個參參與人人的最最優(yōu)策策略組組合,,則實實現(xiàn)顫顫抖手手均衡衡如何理解?2022年年12月25日日44第三節(jié)節(jié)多重重納什什均衡衡的選選擇標標準六、顫顫抖手手精煉煉均衡衡(二))顫抖抖手均均衡2.定義:m——mistaken人博弈弈中,,對于于每一一個博博弈方方i,存在在嚴格格混合合策略略序列列,,使使下列列條件件得到到滿足足:(1)盡管每每一個個博弈弈方可可能犯犯錯誤誤,但但錯誤誤收斂斂于零零——總有一一天能能成功功2022年年12月25日日45穿針引引線——功夫不不負有有心人人將一條條線穿穿入針針眼,,手在在不停停顫抖抖,不不大可可能一一下子子穿進進去但如果果試的的次數(shù)數(shù)足夠夠大,,總是是能夠夠成功功2022年年12月25日日46第三節(jié)節(jié)多重重納什什均衡衡的選選擇標標準六、顫顫抖手手精煉煉均衡衡(二))顫抖抖手均均衡2.定義::m——mistaken人博弈弈中,,對于于每一一個博博弈方方i,存在在嚴格格混合合策略略序列列,,使使下列列條件件得到到滿足足:(2)對于于任何何可選選擇的的混合合策略略2022年12月25日47穿針引線線——學會寬容容納什均衡衡:每一一個人都都把線穿穿入針眼眼寬容:某某參與人人不能因因為其他他參與人人可能暫暫時無法法把線穿穿進針眼眼而故意意不把線線穿進針針眼寬容是一種美德2022年12月25日48本章作業(yè)業(yè)P143-1461、7、11、19、20、21、22、24、259、靜靜夜夜四四無無鄰鄰,,荒荒居居舊舊業(yè)業(yè)貧貧。。。。12月月-2212月月-22Sunday,December25,202210、雨雨中中黃黃葉葉樹樹,,燈燈下下白白頭頭人人。。。。04:47:0404:47:0404:4712/25/20224:47:04AM11、以以我我獨獨沈沈久久,,愧愧君君相相見見頻頻。。。。12月-2204:47:0404:47Dec-2225-Dec-2212、故人江江海別,,幾度隔隔山川。。。04:47:0404:47:0404:47Sunday,December25,202213、乍見翻翻疑夢,,相悲各各問年。。。12月-2212月-2204:47:0404:47:04December25,202214、他鄉(xiāng)生白發(fā)發(fā),舊國見青青山。。25十二月月20224:47:04上午04:47:0412月-2215、比不了得就就不比,得不不到的就不要要。。。十二月224:47上上午12月-2204:47December25,202216、行動出成成果,工作作出財富。。。2022/12/254:47:0404:47:0425December202217、做前,能能夠環(huán)視四四周;做時時,你只能能或者最好好沿著以腳腳為起點的的射線向前前。。4:47:04上上午4:47上上午04:47:0412月-229、沒沒有有失失敗敗,,只只有有暫暫時時停停止止成成功功?。?。。12月月-2212月月-22Sunday,December25,202210、很很多多事事情情努努力力了了未未必必有有結結果果,,但但是是不不努努力力卻卻什什么么改改變變也也沒沒有有。。。。04:47:0404:47:0404:4712/25/20224:47:04AM11、成成功功就就是是日日復復一一日日那那一一點點點點小小小小努努力力的的積積累累。。。。12月月-2204:47:0404:47Dec-2225-Dec-2212、世間成成事,不不求其絕絕對圓滿滿,留一一份不足足,可得得無限完完美。。。04:47:0404:47:0404:47Sunday,December25,202213、不知香香積寺,,數(shù)里入入云峰。。。12月-2212月-2204:47:0404:47:04December25,202214、意志志堅強強的人人能把把世界界放在在手中中像泥泥塊一一樣任任意揉揉捏。。25十十二二月20224:47:04上上午04:47:0412月月-2215、楚塞三湘湘接,荊門門九派通。。。。十二月224:47上上午12月-2204:47December25,202216、少年十五五二十時,,步行奪得得胡馬騎。。。2022/12/254:47:0404:47:0425December202217、空山新雨雨后,天氣氣晚來秋。。。4:47:04上上午4:47上上午04:47:0412月-229、楊柳散散和風,,青山澹澹吾慮。。。12月-2212月-22Sun

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論