完全信息靜態(tài)博弈

上傳人：7*** IP屬地：湖北上傳時間：2022-02-18 格式：DOC 頁數(shù)：15 大?。?9KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩10頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第七講完全信息靜態(tài)博弈即使是在不久以前，好事者仍將經(jīng)濟(jì)計(jì)量學(xué)與博弈論比作日本和阿根廷。在20世紀(jì)40年代晚期，這兩門學(xué)科都有遠(yuǎn)大前程，而這兩個國家也都充滿了希望，準(zhǔn)備高歌猛進(jìn)，對世界產(chǎn)生深遠(yuǎn)的影響。日本和阿根廷經(jīng)濟(jì)隨后發(fā)生了什么已是眾所周知。而對這兩門學(xué)科來說，經(jīng)濟(jì)計(jì)量學(xué)成了經(jīng)濟(jì)學(xué)中必不可少的一部分，博弈論則萎縮成一門子學(xué)科。他只對博弈論專家來說樂趣無窮，卻為整個經(jīng)濟(jì)學(xué)界所遺忘。這些博弈論專家一般都是數(shù)學(xué)家。他們更關(guān)注定義與證明，而非將這一方法運(yùn)用于經(jīng)濟(jì)問題。他們?yōu)樽约旱睦碚撃茉诒姸鄬W(xué)科中運(yùn)用而倍感自豪，但沒有一門學(xué)科將博弈論作為自身不可分割的一部分。但是到了70年代，再將博弈論比作阿根廷

2、就不恰當(dāng)了。正但阿根廷迎回其前獨(dú)裁者胡安.庇隆之時，經(jīng)濟(jì)學(xué)家發(fā)現(xiàn)博弈論與復(fù)雜的經(jīng)濟(jì)問題結(jié)合起來可能會得到的結(jié)果。理論與應(yīng)用方面的創(chuàng)新對于分析非對稱信息和動態(tài)行為尤為有用。在80年代，博弈論迅速成為主流經(jīng)濟(jì)學(xué)的重要組成部分。事實(shí)上，他幾乎吞沒了整個微觀經(jīng)濟(jì)學(xué)，即如同經(jīng)濟(jì)計(jì)量學(xué)吞沒了經(jīng)驗(yàn)經(jīng)濟(jì)學(xué)一樣。博弈論與現(xiàn)代經(jīng)濟(jì)學(xué)傳統(tǒng)經(jīng)濟(jì)學(xué)：新古典范式或阿羅德布魯體系：研究資源的有效配置。在市場完全的假設(shè)下，認(rèn)為市場（價(jià)格）能使資源得到最合理的配置，因而，又稱為價(jià)格理論?，F(xiàn)代經(jīng)濟(jì)學(xué);1980年代以后的經(jīng)濟(jì)學(xué)：研究人的理性行為。在現(xiàn)代經(jīng)濟(jì)學(xué)看來，人的行為至少有兩個特點(diǎn)：信息不完全或不對稱；人的行為相互影響。而傳

3、統(tǒng)經(jīng)濟(jì)學(xué)將人的決策行為概括為約束條件下的最大化。假設(shè)不存在信息行為，而其他人的行為的影響被總結(jié)在環(huán)境參數(shù)。而現(xiàn)代經(jīng)濟(jì)學(xué)進(jìn)一步對人與人的相互影響建模。而目前人們找到的研究人與人之間的相互影響的行為（策略行為）的合適工具就是博弈論。博弈論（game theory）是研究決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡問題的一個分析工具。第一節(jié)博弈論的基本概念例：房地產(chǎn)開發(fā)博弈兩個房地產(chǎn)商A,B準(zhǔn)備在某地段開發(fā)一棟房產(chǎn)，投入資金為1億元。如果市場上有兩棟樓出售，需求大時，每棟樓售價(jià)1.4億元，需求小時每棟樓售價(jià)為0.7億元；如果市場上只有一棟樓出售，需求大時，每棟樓售價(jià)1.8億元，需求小時每

4、棟樓售價(jià)為1.1億元。假定雙方同時決策，每一方?jīng)Q策時不知道對方的決策。如果市場需求已知，如何決策？三、4.2過程，知道所有參與人的占優(yōu)策略組合就是一個占優(yōu)策略組合a、市場需求大時？b、市場需求小時？如果市場需求不知，如何決策？博弈論的基本概念：1、參與人player：指的是一個博弈中的決策主體，其目的是通過選擇行動策略以最大化自己的支付（效用）水平“自然”是虛擬參與人（pseudo-player），他在博弈的特定時點(diǎn)上以特定的概率選擇隨機(jī)行動。例如，自然隨機(jī)選擇市場需求的大小。2、行動:參與人i的行動以ai表示，是他所能做的某一選擇。參與人i的行動集（action set）Aiai，是其可以采

5、取的全部行動的集合。例如：AA=開發(fā)，不開發(fā)，AB=開發(fā)，不開發(fā)一個行動組合（action profile)是一個由博弈中的n個參與人每人選擇一個行動而組成的有序集，a=ai),(i=1,.,n).例：a=(開發(fā)，開發(fā))表示A選擇開發(fā)，B也選擇開發(fā)。行動的順序3、信息：是參與人有關(guān)博弈的知識，如自然的選擇，其他參與人的特征和行動等知識。4、參與人的策略（strategy）si參與人在給定信息集下的行動規(guī)則，他規(guī)定參與人在每一時點(diǎn)選擇何種行動。si表示參與人i的一個特定策略。參與人的策略集（strategy set;strategy space）或策略空間Si=si是其可行策略的集合。策略組合(

6、strategy profile)s(s1,s2,.,sn）是由博弈的n個參與人每人選擇一個策略的集合例：博弈條件為參與人B在不知道市場需求的情況下先行動，A在得知B的行動后再選擇自己的行動。自然大小B B開發(fā) 不開發(fā)A 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)B的策略為：SB=開發(fā)，不開發(fā)，即B的策略是如果市場需求大就開發(fā)，否則不開發(fā)。A的策略是：Sa=（開發(fā)，開發(fā)），（開發(fā)，不開發(fā)），（不開發(fā)，開發(fā)），（不開發(fā)，不開發(fā)）（x,y）x對應(yīng)b開發(fā)時的a的行動，y對應(yīng)b不開發(fā)時a的行動.策略不同于行動。請分析上例中A的行動？策略必須是完備的。比如，上例中如果市場需求大，那么A可以肯定B會開發(fā)，但也必須在策

7、略集中給出B不開發(fā)的情況。這是因一個人的策略會影響另一個人的行動。比如：紅軍對付白軍的策略是：人不犯我，我不犯人；人若犯我，我必犯人。這個策略使白軍不敢犯我。但是策略必須包括人若犯我的情況。否則，就不能保證敵人不犯我。5、支付/收益payoff：是指在一個特定的策略組合下參與人得到的確定效用水平（收益），或指參與人得到的期望效用水平（收益）。u=(u1,u2,.ui,.un)為n個參與人的支付組合payoff profile。參與人i的支付是所有參與人的策略的函數(shù)：ui=ui(s1,.si,.sn)6、一個博弈（分析）的結(jié)果outcome是博弈分析者所感興趣的所有東西，如均衡策略組合，均衡行動

8、組合，均衡支付組合等等，取決于博弈分析者的到底需要什么。7、均衡是所有參與人的最優(yōu)策略的組合：s*=(s1*,.si*,.,sn*)其中si*表示第i個參與人在均衡條件下的最優(yōu)策略：ui(si*,s-i)ui(si',s-i)對任意的si'si*.例：如果兩開發(fā)商同時行動，如果需求大，則均衡是（開發(fā)，開發(fā)）；如果需求小，則存在兩個均衡（開發(fā)，不開發(fā)），（不開發(fā)，開發(fā)）第二節(jié) 策略博弈與占優(yōu)博弈完全信息：根據(jù)博弈的各方參與人是否了解自己和其他參與人在每種結(jié)果（策略組合）下的收益情況，可以將博弈分為完全信息和不完全信息。如果各個博弈參與人都完全了解所有博弈參與人在各種情況下的支付，

9、這種博弈就是完全信息博弈。否則就是不完全信息博弈。例：囚徒困境，每個囚徒對于自己每種策略（抵賴，坦白）的支付都是清楚的。在房地產(chǎn)博弈中，如果參與人對市場需求不了解，那么他們并不能確定他們進(jìn)入或不進(jìn)入策略的支付，因而是不完全信息。靜態(tài)博弈：各個參與人同時決策（不一定是時間上同時決策，只要求每一個參與人在決策之前不知道其他參與人的決策，例如也許對每個囚徒的審訊有前有后，但只要后審訊的囚徒不知道前面囚徒的決策就可以認(rèn)為它們是同時決策的。）一、博弈的策略式表述一般用策略式（strategic form representation）表述法描述靜態(tài)博弈,而用擴(kuò)展式表述（extensive form re

10、presentation）描述動態(tài)博弈。策略式表述一般要給出博弈的參與人，每個參與人的策略集和支付函數(shù)。一個博弈如果1、參與人的個數(shù)是有限的；2、每個參與人的策略也是有限的，則是有限博弈，兩人（有時三人博弈可以用策略式表述）。例：囚徒困境二、占優(yōu)策略均衡分析囚徒困境中的（坦白，坦白）策略組合。如果，不管其他參與人的策略是什么，某個參與人的某個策略都嚴(yán)格優(yōu)于其它策略，并且其他參與人也同樣有一個策略嚴(yán)格由于其它策略并不受其他參與人的影響，那么，所有參與人的占優(yōu)策略組合就是一個占優(yōu)策略均衡。參與人在任何情況下都會選擇這個占優(yōu)策略組合，這樣的占優(yōu)策略組合就稱為占優(yōu)策略均衡（dominant strat

11、egy equilibrium）。如果一個博弈中，每一個參與人都存在占優(yōu)策略，那么均衡一定是占優(yōu)策略均衡。重復(fù)刪除的占優(yōu)均衡例：智豬博弈“重復(fù)剔除劣策略”解題思路：1、找出參與人的劣策略，把這個劣策略剔除掉；2、在剩下的博弈中重復(fù)第一步：剔除劣策略；3、繼續(xù)這個過程，直到只剩下唯一的策略組合為止，這個（均衡）策略組合就是重復(fù)剔除的占優(yōu)策略。2.1.4劃線法例：囚徒困境解題思路：針對對方的每一個策略找出其最優(yōu)的策略，并在其對應(yīng)的支付下劃線；對另一個參與人也是如此。兩個支付下面都劃了線的策略組合就是均衡策略。練習(xí)：1、智豬博弈2、猜硬幣博弈3、性別戰(zhàn)第三節(jié) 納什均衡前面用劃線法求出的具有穩(wěn)定性的均

12、衡策略組合，不管是否唯一，都有一個共同的特點(diǎn)，就是每一個博弈參與人的策略都是其他參與人的策略的最佳對策。具有這種性質(zhì)的均衡策略組合被稱為納什均衡。定義：在博弈G=S1,.,Sn;u1,.,un中，如果策略組合中，任意參與人的策略都是針對其余參與人的策略組合的最佳策略，即：則稱為博弈G的一個納什均衡（Nash Equilibrim）。在納什均衡中由于每一個參與人都選擇的是針對其他參與人的策略的最佳策略，因而每一個參與人都沒有激勵改變其初始決策（策略），因而納什均衡是穩(wěn)定的。性別戰(zhàn)(多重納什均衡)，猜硬幣博弈（不存在納什均衡）。每一個占優(yōu)策略均衡、重復(fù)剔除的占優(yōu)均衡都是納什均衡，第四節(jié) 混合策略與

13、混合策略納什均衡一、混合策略混合策略博弈和混合策略納什均衡分析猜硬幣博弈。蓋硬幣一方必須：1、保證自己的策略選擇不能被猜硬幣一方預(yù)先知道；2、如果博弈多次進(jìn)行，那么蓋硬幣一方的策略必須是無規(guī)律的。3、正面和反面的概率必須是0.5。對于猜硬幣方也是如此。猜硬幣游戲中，兩個參與人的最佳策略都是以0.5的概率選擇正面，0.5的概率選擇反面。這種參與人以一定的概率分布在可選策略中隨機(jī)選擇的決策方式稱為“混合博弈”（mixed strategies），相應(yīng)的前面分析中參與人只選擇特定的策略的博弈稱為“純策略”例：猜硬幣博弈，雙方都以0.5的概率選擇正面和反面時的期望效用函數(shù)：猜硬幣方1：u1(0.5,0

14、.5)=0.5*1*0.5+(-1*0.5)+0.5*(-1*0.5+1*0.5給定對方的混合策略，參與人的最優(yōu)混合策略是使其期望效用函數(shù)最大化的混合策略。所有參與人的最優(yōu)混合策略的組合即混合策略納什均衡。定義混合策略納什均衡：在n個參與人的博弈G=S1,.Sn;u1,.un中，混合策略組合構(gòu)成一個納什均衡，如果對于所有的i1，2.，n下式成立：也就是說，如果一個策略組合使任何一個參與人的策略都是相對于其他參與人的策略的最佳策略，這個策略就構(gòu)成一個納什均衡，不管這個策略是混合策略還是純策略。解混合策略納什均衡的方法：1、最大化支付法：即最大化各個參與人的效用函數(shù)。2、支付相等法：根據(jù)前面分析的

15、猜硬幣博弈中參與人的策略的思路，每個參與人的混合策略都使其余參與人的任何純策略的期望支付相等，因此，解混合策略納什均衡可以令參與人的各個純策略支付相等，構(gòu)成方程組求解。二、社會福利博弈解法1、最大化期望效用函數(shù)法：假定政府的混合策略是，流浪漢的混合策略是：。政府的期望效用函數(shù)為：求導(dǎo)得最優(yōu)化一階條件：同理，最大化流浪漢效用函數(shù)得政府救濟(jì)的概率是：解法二：期望支付相等法假設(shè)流浪漢的混合策略為（r,1-r),政府選擇純策略救濟(jì)的期望支付是：選擇純策略不救濟(jì)的期望支付是：4r-1=-r r*=0.2同理可得政府救濟(jì)的概率為：政府的行動是：流浪漢的行動：畫圖即得反應(yīng)對應(yīng)： r 1 0.2 NE 0 0.5 1 三、多重均衡博弈與混合策略一、性別戰(zhàn)期望支付相等法：妻子的混合策略

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

完全信息靜態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評論

完全信息靜態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔