博弈論(對策論)擴展-完全信息靜態(tài)博弈

上傳人：5*** IP屬地：湖北上傳時間：2021-11-22 格式：PPT 頁數(shù)：30 大小：248KB 積分：30 舉報 版權申訴

已閱讀5頁，還剩25頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

1、1博弈論博弈論( (對策論對策論) )擴展擴展完全信息靜態(tài)博弈完全信息靜態(tài)博弈 2參考書1.謝識予，經(jīng)濟博弈論，復旦大學出版社2.施錫荃，博弈論3.張維迎，博弈論與信息經(jīng)濟學，上海人民出版社4.吉本斯，博弈論基礎，中國社會科學出版社3引言：引言：19941994年諾貝爾經(jīng)濟學獎授予了三位博弈論專家年諾貝爾經(jīng)濟學獎授予了三位博弈論專家和和。19961996年諾獎授予兩位博弈論與信息經(jīng)濟學研究專家莫里年諾獎授予兩位博弈論與信息經(jīng)濟學研究專家莫里斯、維克瑞；斯、維克瑞；20012001年諾獎授予阿克洛夫、斯彭斯、斯蒂格利茨，表彰年諾獎授予阿克洛夫、斯彭斯、斯蒂格利茨，表彰他們在檸檬市場、信號傳遞

2、和信號甄別等非對稱信息他們在檸檬市場、信號傳遞和信號甄別等非對稱信息理論研究中的開創(chuàng)性貢獻。理論研究中的開創(chuàng)性貢獻。20052005年諾獎授予年諾獎授予有以色列和美國雙重國籍的羅伯特有以色列和美國雙重國籍的羅伯特奧奧曼和美國人托馬斯曼和美國人托馬斯謝林，以表彰他們在博弈論領域謝林，以表彰他們在博弈論領域作出的貢獻。作出的貢獻。20122012年諾獎授予美國經(jīng)濟學家埃爾文年諾獎授予美國經(jīng)濟學家埃爾文. .羅斯羅斯(Alvin Roth)(Alvin Roth)與羅伊德與羅伊德. .沙普利沙普利(Lloyd(Lloyd Shapley)(Shapley)(穩(wěn)定配置和市場穩(wěn)定配置和市場設計實踐理論設

3、計實踐理論 ) )4博弈的分類博弈的分類根據(jù)參與人的多少，可將博弈分為兩人博弈或多人博弈；根據(jù)參與人是否合作，可將博弈分為合作博弈或非合作博弈；根據(jù)博弈結果的不同，又可分為零和博弈、常和博弈與變和博弈。 51、從行動的先后次序來分，博弈可以分為靜態(tài)博弈和動態(tài)博弈。靜態(tài)博弈指在博弈中，參與人同時選擇行動，或雖非同時但后行動者并不知道前行動者采取了什么具體行動；動態(tài)博弈指的是參與人的行動有先后順序，且后行動者能夠觀察到先行動者所選擇的行動的博弈。 6 2、從參與人對其他參與人的各種特征信息的獲得差異來分，博弈可分為完全信息博弈和不完全信息博弈。完全信息指的是每一個參與人對所有其他參與人

4、的特征，如策略集合及得益函數(shù)都有準確完備的知識；否則就是不完全信息。將上述兩個角度的劃分結合起來，我們就得到四種不同類型的博弈，這就是：完全信息靜態(tài)博弈，完全信息動態(tài)博弈，不完全信息靜態(tài)博弈和不完全信息動態(tài)博弈。7行動次序信息靜態(tài)動態(tài)完全信息納什均衡子博弈精練納什均衡不完全信息貝葉斯均衡精煉貝葉斯均衡博弈的分類和均衡博弈的分類和均衡8完全信息靜態(tài)博弈完全信息靜態(tài)博弈 (一)完全信息靜態(tài)博弈定義所謂完全信息靜態(tài)博弈指的是各博弈方同時決策，或者決策行動雖有先后，但后行動者不知道先行動者的具體行動是什么，且各博弈方對博弈中各種策略組合情況下所有參與人相應的得益都完全了解的博弈。 9納什均衡納什

5、均衡 1、占優(yōu)策略均衡。一般來說，由于每個參與人的得益是博弈中所有參與人的策略的函數(shù)，因此每個參與人的最優(yōu)策略選擇依賴于所有其他參與人的策略選擇。但在一些特殊的博弈中，一個參與人的最優(yōu)策略可能可以不依賴于其他參與人的策略選擇，就是說，不論其他參與人選擇什么策略，他的最優(yōu)策略是唯一的，這樣的最優(yōu)策略被稱為“占優(yōu)策略”。如果一個博弈中，某個參與人有占優(yōu)策略，那么該參與人的其他可選擇策略就被稱為“劣策略”。 10 在一個博弈里在一個博弈里, ,如果所有參與人都有占優(yōu)策略存在，如果所有參與人都有占優(yōu)策略存在，那么占優(yōu)策略均衡是可以預測到的唯一的均衡，那么占優(yōu)策略均衡是可以預測到的唯一的均衡，因為沒

6、有一個理性的參與人會選擇劣策略。所以在囚徒因為沒有一個理性的參與人會選擇劣策略。所以在囚徒困境博弈里，困境博弈里，坦白，坦白坦白，坦白是占優(yōu) 策略均衡。是占優(yōu) 策略均衡。囚徒困境反映了一個深刻的問題囚徒困境反映了一個深刻的問題, ,即個人理性與即個人理性與團體理性的沖突。這給我們一個啟示團體理性的沖突。這給我們一個啟示, ,我們學習博弈論，我們學習博弈論，也許更應該研究的是怎樣設計一種制度也許更應該研究的是怎樣設計一種制度, ,在滿足個人理在滿足個人理性的同時性的同時 , , 去爭取達到去爭取達到 “

7、集體理性集體理性 ” 。11 2 2、嚴格劣策略的重復剔除、嚴格劣策略的重復剔除重復剔除嚴格劣策略”的思路如下：首先找出某個參與人的嚴格劣策略(假定其存在)，把這個劣策略剔除掉，重新構造一個不包含已剔除策略的新的博弈；重復這個過程，一直到只剩下一個唯一的策略組合為止。這個唯一剩下的策略組合就是這個博弈的均衡解，稱為”重復剔除的占優(yōu)均衡”。注意，上述表述中強調(diào)了“唯一”這個詞。也就是說，如果重復剔除后剩下的策略組合不唯一，那么該博弈就不是可通過重復剔除劣策略求解的。 12 3 3納什均衡納什均衡納什均衡是完全信息靜態(tài)博弈解的一般概念，構成納什均衡的策略一定是重復剔除嚴格劣策略過

8、程中不能被剔除的策略，即沒有任何一個策略嚴格優(yōu)于納什均衡策略。當然，逆定理是不存在的。更為重要的是，許多不存在占優(yōu)策略均衡或重復剔除的占優(yōu)策略均衡的博弈,也存在納什均衡。下面，我們給出納什均衡的正式定義。13 納什均衡的正式定義納什均衡的正式定義納什均衡：有n個參與人的戰(zhàn)略式表述博弈GS1，Sn；u1, ，un，戰(zhàn)略組合S*（S1*，Sn*）是一個納什均衡，如果對于每一個i，Si*是給定其他參與人Si*（S1*,，S-1*，Si+1*，Sn*）的情況下第i個參與人的最優(yōu)戰(zhàn)略，即：ui(si*,s-i*)ui(si,s-i*)對任意SiSi,和任意的 I都成立。14 指一組給定對手行為前提下

9、對各指一組給定對手行為前提下對各博弈方存在的最佳選擇；在納什博弈方存在的最佳選擇；在納什均衡狀態(tài)下，只要其它參與者不均衡狀態(tài)下，只要其它參與者不變換策略選擇，任何單個參與者變換策略選擇，任何單個參與者不可能單方面通過變換策略來提不可能單方面通過變換策略來提高他的所獲支付。高他的所獲支付。15古諾的寡頭模型寡頭產(chǎn)量競爭以兩廠商產(chǎn)量競爭為例QQPPqqQ8)(21121111112)(8 )(qqqqqcQPqu212116qqqq221 cc221222222)(8 )(qqqqqcQPqu222126qqqq16古諾模型的反應函數(shù))6()()6()()6max(max1211222212112

10、121111qqRqqqRqqqqquq1q(3,0)(6,0)(0,3)(0,6)2q)(21qR)(12qR古諾模型的反應函數(shù)圖示理性局限和古諾調(diào)整17伯特蘭德（Bortrand）寡頭模型價格競爭寡頭的博弈模型價格競爭寡頭的博弈模型異質產(chǎn)品異質產(chǎn)品122222122211112111),(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP)(21)(21*122222*2*211111*1PdcbabPPdcbabP18公共資源

11、問題公共草地養(yǎng)羊問題QQVVqqQn100)(1以三農(nóng)戶為例 n=3，c=4cqQVquiii)(19323211212148),(qqqqRq313122212148),(qqqqRq212133212148),(qqqqR3*2*1*3*2*1uQuuuqqqQQQQQu)96(4)100(1728576323047224348uQ合作：總體利益最大化合作：總體利益最大化競爭：個體利益最大化競爭：個體利益最大化20納什均衡的多重性納什均衡的多重性在兩人的有限策略博弈中,我們還可以簡單地用劃線法來找出納什均衡在位者進入者默許打擊進入40,50-10,0不進入0,3

12、000,300 從這個例子中我們知道一個博弈可能有多個納什均衡，而具體哪個均衡會實現(xiàn)，納什均衡本身不能給出回答,任何有限博弈都存在至少一個納什均衡，若是無限博弈則不一定。 21多重均衡博弈和混合策略夫妻之爭2， 10， 00， 01， 2時裝足球時裝足球丈丈夫夫妻妻子子夫妻之爭夫妻之爭rq111/32/3(r,1-r)：妻子的混合策略概率分布(q,1-q)：丈夫的混合策略概率分布)(2rRq )(1rRr 兩個純均衡策略，一個混合策略22猜硬幣博弈-1， 11， -11， -1-1， 1正面反面猜硬幣方猜硬幣方正面反面猜硬幣博弈猜硬幣博弈蓋蓋硬硬幣幣方方rq111/21/2(r,1-

13、r)：蓋硬幣方選擇正反面的混合策略概率分布(q,1-q)：猜硬幣方選擇正反面的混合策略概率分布)(2rRq )(1qRr 23納什均衡的存在性納什定理納什定理：在一個由n個博弈方的博弈中，如果n是有限的，且都是有限集(對 )，則該博弈至少存在一個納什均衡，但可能包含混合策略。納什均衡的普遍存在性正是納什均衡成為非合作博弈分析核心概念的根本原因之一。兩人兩策略時，均衡為1個（純或混合）或3個（2純，1混合）,;,11nnuuSSGiSni, 124多重納什均衡博弈的分析兩個以上均衡，確認最優(yōu)均衡的問題，原則：n帕累托上策均衡n風險上策均衡n聚點均衡n相關均衡25一、帕累托上策均衡（鷹鴿博弈）

14、這個博弈中有兩個純策略納什均衡，（戰(zhàn)爭，戰(zhàn)爭）和（和平，和平），顯然后者帕累托優(yōu)于前者，所以，（和平，和平）是本博弈的一個帕累托上策均衡。-5， -5-10， 88， -1010， 10戰(zhàn)爭和平國家國家2戰(zhàn)爭和平國國家家1戰(zhàn)爭與和平戰(zhàn)爭與和平26二、風險上策均衡考慮、顧忌博弈方、其他博弈方可能發(fā)生錯誤等時，帕累托上策均衡并不一定是最優(yōu)選擇，需要考慮：風險上策均衡。下面就是兩個例子。9， 98， 00， 87， 7LR博弈方博弈方2UD博博弈弈方方1風險上策均衡（風險上策均衡（D，R）5， 53， 00， 33， 3鹿兔子獵人獵人2鹿兔子獵獵人人1獵鹿博弈風險上策均衡（兔子，兔子）風險上策均衡

15、（兔子，兔子）27三、聚點均衡n利用博弈設定以外的信息和依據(jù)選擇的均衡n文化、習慣或者其他各種特征都可能是聚點均衡的依據(jù)n城市博弈（城市分組相同）、時間博弈（報出相同的時間）是聚點均衡的典型例子28四、相關均衡5， 14， 40， 01， 5LR博弈方博弈方2UD博博弈弈方方1相關均衡例子相關均衡例子三個納什均衡三個納什均衡：（U，L）、（D，R）和混合策略均衡（1/2，1/2），（1/2，1/2）結果都不理想，不如（D，L）?？衫镁埸c均衡（天氣，拋硬天氣，拋硬幣）幣），但仍不理想。相關裝置：1、各1/3概率A、B、C2、博弈方1看到是否A，博弈方2看到是否C3、博弈方1見A采用U，否則D；博弈方2見C采用R，否則L。29一、多人博弈中的共謀問題本博弈的純策略納什均衡：（U，L，A）、（D，R，B）前者帕累托優(yōu)于后者。博弈的結果會是什么呢？（U，L，A）有共謀 (Coalition)問題：博弈方1和2同時偏離。而（D，R，B）0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3A-2,-2,0-5,-

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論(對策論)擴展-完全信息靜態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評論

博弈論(對策論)擴展-完全信息靜態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評論

相關文檔