ch3完全且完美信息動態(tài)博弈

上傳人：g*** IP屬地：廣東上傳時間：2024-04-24 格式：PPT 頁數(shù)：59 大?。?60.50KB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩54頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

ch3完全且完美信息動態(tài)博弈2024/4/232第三章完全且完美信息動態(tài)博弈完全－得益完美－過程動態(tài)－先后請考慮以下問題：（1）是不是信息越多越有利？（2）過程是否重要？（3）動態(tài)博弈與靜態(tài)博弈有哪些異同之處？（4）人們對已經(jīng)過去的博弈是更注重結(jié)果還是更注重過程？其意義何在？2024/4/233本章分六節(jié)3.1動態(tài)博弈的表示法和特點3.2可信性和納什均衡的問題3.3子博弈和子博弈完美納什均衡3.4幾個經(jīng)典動態(tài)博弈模型3.5有同時選擇的動態(tài)博弈模型3.6動態(tài)博弈分析的問題和擴展討論2024/4/2343.1動態(tài)博弈的表示法和特點3.1.1階段和擴展性表示3.1.2動態(tài)博弈的基本特點2024/4/2353.1.1階段和擴展性表示階段：動態(tài)博弈中一個博弈方的一次選擇行為例子：仿冒和反仿冒博弈ABBA不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒注：并不是所有的動態(tài)博弈都可以用擴展形來表示，如下棋。2024/4/2363.1.2動態(tài)博弈的基本特點1.動態(tài)博弈的策略和結(jié)果策略是在整個博弈中所有選擇、行為的計劃結(jié)果是上述“計劃型”策略的策略組合，構(gòu)成一條路徑得益對應每條路徑，而不是對應每步選擇、行為2、與靜態(tài)博弈不同的基本特點1）策略不同。每個博弈方的策略是指在整個博弈過程中在每個階段作出相應選擇和行為的完整計劃。2）結(jié)果不同。博弈的結(jié)果是指每個博弈方的策略組成的策略組合、實現(xiàn)博弈的路徑及各個博弈方的得益。3）地位不對稱7完全信息靜態(tài)博弈模型的表述（回顧）圖3.2市場進入的動態(tài)博弈A進入不進入進入不進入進入不進入(–1,–1)(1,0)(0,1)(0,0)BB擴展式（博弈樹）B進入不進入進入不進入進入不進入(–1,–1)(1,0)(0,1)(0,0)AAB進入不進入A進入–1,–11,0不進入0,10,0標準（戰(zhàn)略）式A先行動B先行動圖3.1市場進入的靜態(tài)博弈完全信息靜態(tài)博弈模型的表述(等價)

動態(tài)博弈的標準式表示圖3.2市場進入的動態(tài)博弈A進入不進入進入不進入進入不進入(–1,–1)(1,0)(0,1)(0,0)BB擴展式（博弈樹）標準（戰(zhàn)略）式A先行動該博弈有三個納什均衡：1.（進入，（不進入，不進入））；2.（不進入，（進入，進入））；3.（進入，（不進入，進入））。博弈的最終結(jié)局應出現(xiàn)哪個均衡，需要分析在三個均衡的合理性。B{進入，進入}{進入，不進入}{不進入，進入}{不進入，不進入}A進入–1,–1–1,–11,01,0不進入0,10,00,10,0『1.含有不可信的承諾』『2.含有不可信的威脅』3.合理的納什均衡完全信息靜態(tài)博弈模型的表述(等價)

靜態(tài)博弈的博弈樹表示圖3.1市場進入的靜態(tài)博弈A進入不進入進入不進入進入不進入(–1,–1)(1,0)(0,1)(0,0)BB擴展式（博弈樹）標準（戰(zhàn)略）式A先行動B決策時不知道A的選擇B進入不進入A進入–1,–11,0不進入0,10,0A進入不進入進入不進入進入不進入(–1,–1)(1,0)(0,1)(0,0)BB2024/4/23103.2可信性和納什均衡的問題3.2.1相機選擇和策略中的可信性問題3.2.2納什均衡的問題3.2.3逆推歸納法2024/4/23113.2可信性和納什均衡的問題在動態(tài)博弈中，由于博弈方策略的實施是一個過程,所以過程十分重要，類似于對未來過程的了解，它本身依賴于其它博弈方的行為。那么就存在一個對其博弈方所可能采取策略的可信性問題。博弈方在博弈過程中存在著改變計劃的情況,這種問題稱為相機選擇問題.可信性：動態(tài)博弈中先行為的博弈方是否應該相信后行為博弈方會采取某種策略或行為。后行為博弈方將來采取對先行為博弈方有利的行為為“許諾”，采取對先行方不利的行為為“威脅”。2024/4/23123.2.1相機選擇和策略中的可信性問題

1.開金礦博弈條件：甲去開采一價值4萬元的金礦，缺1萬元，乙恰好有1萬元可以投資。甲向乙借1萬元可以可開金礦，并“許諾”成功后與對半分成。問題：乙是否該給甲投資？（1，0）投不投分不分（2，2）（0，4）2024/4/23133.2.1相機選擇和策略中的可信性問題

1.開金礦博弈可能性即甲可能成功之后不與乙分錢（分當然好），則乙損失1萬元。由此，乙決策的關(guān)鍵在于他是否相信甲的“許諾”，而結(jié)局取決于甲是否遵守他的“許諾”。接下來乙可采取一些方法以使甲盡可能兌現(xiàn)他的許諾－－打官司。（1，0）投不投分不分（2，2）（0，4）2024/4/23143.2.1相機選擇和策略中的可信性問題

1.開金礦博弈根據(jù)自身利益最大化原則，甲在輪到行為時的唯一選擇是不分，而乙清楚甲的行為準則，則選擇不借。對乙來講，本博弈中甲有一個不可信的肯定不會信守的許諾。怎樣使甲的許諾變?yōu)榭尚诺哪?？關(guān)鍵在于必須增加一些對甲行為的約束。（1，0）投不投分不分（2，2）（0，4）2024/4/23153.2.1相機選擇和策略中的可信性問題

2.法律保障的開金礦博弈

若乙采取法律手段，即打官司保護自己的利益，則博弈進程如下圖所示。

（1，0）乙投不投分不分（2，2）（0，4）不打打（0，4）（1，0）2024/4/23163.2.1相機選擇和策略中的可信性問題

2.法律保障的開金礦博弈

在本博弈中，乙的唯一選擇是打官司，對甲來講，乙打官司的威脅是可信的，是肯定會信守的，他最理智的選擇就是分。即，乙的策略是在第一階段借，如甲在第二階段選擇不分，則第三階段選擇打；甲的策略是如乙在第一階段選擇借，則他在第二階段選擇分。在雙方這樣的策略組合下，本博弈的路徑是（借，分），雙方得益為（2，2），實現(xiàn)有效率的理想的結(jié)果。不投乙甲乙投不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的開金礦博弈2024/4/23173.2.1相機選擇和策略中的可信性問題

3.法律保障不足的開金礦博弈乙甲乙打（2，2）不分分不投投（0，4）（-1，0）不打（1，0）法律保障不足的開金礦博弈

根據(jù)納什均衡的定義可以判斷，乙的策略是第一階段選擇“借”，若第二階段甲選擇“不分”，第三階段選擇“打”，甲的策略是第二階段選擇“分”。實際結(jié)果是：乙在第一階段不會選擇“借”，甲在第二階段也不會選擇“分”，乙在第三階段也不會選擇“打”。結(jié)果相反的原因是第三階段的“打”是不可信的威脅。如果乙的選擇打官司的得益是-1，即所謂贏了官司輸了錢。即法律保障不足的開金礦博弈2024/4/2318乙甲乙打（2，2）不分分不投投（0，4）（-1，0）不打（1，0）法律保障不足的開金礦博弈3.2.1相機選擇和策略中的可信性問題

3.法律保障不足的開金礦博弈

法律制度必須滿足兩方面的要求：一是對人們的正當權(quán)益保護力度足夠大；二是對侵害他人利益者有足夠的震懾作用，否則作用有限甚至完全無效。

乙打官司的威脅不可信，于是甲“分”錢的許諾就不可信。最后結(jié)果乙選擇“不借”2024/4/23193.2.1相機選擇和策略中的可信性問題乙甲乙打（2，2）不分分不投投（0，4）（-1，0）不打（1，0）法律保障不足的開金礦博弈（不可信的威脅；均衡：不借）不投乙甲乙投不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的開金礦博弈（可信的威脅；均衡：（借，分））（1，0）投不投分不分（2，2）（0，4）

結(jié)論：在動態(tài)博弈中，各個博弈方的選擇和博弈結(jié)果，與各個博弈方在各個階段選擇各種行為的可信程度有很大關(guān)系。2024/4/23203.2.1相機選擇和策略中的可信性問題

先來后到博弈

在此博弈中，后進入者博弈方1要決定是否進入市場競爭，而先進入市場的博弈方2有打擊和不打擊兩種選擇。

12進不進打擊不打擊（0，10）（－3，6）（5，5）2024/4/23213.2.1相機選擇和策略中的可信性問題

先來后到博弈

根據(jù)利潤最大化原則，博弈方2的唯一選擇是無情打擊對手，這時博弈方2的打擊的威脅是可信的。了解博弈方2決策原則的博弈方1在第一階段只會選擇不進。該博弈的結(jié)果為（0，10），即先占領市場者獨享利潤。12進不進打擊不打擊（0，10）（－3，6）（5，5）2024/4/23223.2.1相機選擇和策略中的可信性問題

先來后到博弈

當?shù)靡孀兂捎覉D情況以后，博弈方2的打擊的威脅就不再是可信的了。這樣，博弈方1在第一階段的合理選擇當然只有進。博弈的結(jié)果選擇路徑為（進，不打擊），雙方得益為（5，8）。后進者信息多，但利潤不如先進入者。后來者不一定總是從前者利益中分出一部分，而可能創(chuàng)造更大的總利益，而先進入者的損失也不一定很大。12進不進打擊不打擊（0，10）（－3，6）（5，8）2024/4/2323

第三種開金礦博弈中，（不借-不打，不分）和（借-打，分）都是納什均衡。但后者不可信，不可能實現(xiàn)或穩(wěn)定。結(jié)論：納什均衡在動態(tài)博弈可能缺乏穩(wěn)定性，也就是說，在完全信息靜態(tài)博弈中穩(wěn)定的納什均衡，在動態(tài)博弈中可能是不穩(wěn)定的，不能作為預測的基礎。根源：納什均衡本身不能排除博弈方策略中包含的不可信的行為設定，不能解決動態(tài)博弈的相機選擇引起的可信性問題。3.2.2納什均衡的問題乙甲乙打（2，2）不分分不借借（0，4）（-1，0）不打（1，0）法律保障不足的開金礦博弈2024/4/23243.2.3逆推歸納法在動態(tài)博弈中如何求解？動態(tài)博弈的特點是：在采取某一種決策時必須對其后可能進行的子博弈有充分的了解，這樣才能很好的進行博弈并得到合理的結(jié)果（基于理性和可信性，相當于對后博弈行為的合理假設）。由此，對于完全且完美信息的動態(tài)博弈其基本求解方法可由最后階段的子博弈逆推來決定采取合適的策略－逆推歸納法。2024/4/23253.2.3逆推歸納法定義：逆推歸納法就是從動態(tài)博弈的最后一個階段或最后一個子博弈開始，逐步向前倒推以求解動態(tài)博弈的方法。例（1，0）借不借分不分（2，2）（1，0）開金礦（信守）－逆推第一步乙借不借（2，2）（1，0）開金礦（信守）－逆推第二步2024/4/23263.2.3逆推歸納法逆推歸納法是動態(tài)博弈分析最重要、基本的方法。乙不借借（1，0）甲不分分（0，4）（2，2）乙甲乙打（2，2）不分分不借借（0，4）（-1，0）不打（1，0）法律保障不足的開金礦博弈乙不借借（1，0）（0，4）2024/4/23273.3子博弈和子博弈完美納什均衡3.3.1子博弈3.3.2子博弈完美納什均衡2024/4/23283.3.1動態(tài)博弈中的子博弈定義：子博弈即能夠自成一個博弈的某個動態(tài)博弈的從其某個階段開始的后續(xù)階段，它必須有一個初始信息集，且具備進行博弈所需的各種信息。（1，0）乙借不借分不分（2，2）不打打（0，4）（1，0）開金礦（信守）－－子博弈2024/4/23293.3.1動態(tài)博弈中的子博弈注意：原博弈的初始節(jié)點開始的博弈為原博弈本身，不稱它為原博弈的子博弈；第五章將說明在不完美信息博弈中有其它的不作為子博弈的起始信息集的節(jié)點。2024/4/23303.3.2子博弈完美納什均衡在動態(tài)博弈中由于博弈過程是逐步深入的，這一過程由每個階段所采取的策略構(gòu)成，由此引出“路徑”的概念。路徑：從第一階段開始通過每階段一個行為，最后達到博弈結(jié)束的一個終端各博弈方的行為組合。找到了路徑也就找到了一個分階段的策略組合，這一策略組合恰似一個完整的計劃，計劃的最終實現(xiàn)取決于過程中各階段的實現(xiàn)。2024/4/23313.3.2子博弈完美納什均衡

在開金礦案例中，策略組合（借，分）是一個穩(wěn)定的策略組合，因為如果不分，則有乙打官司的威脅，這是雙方都不愿得到的結(jié)果。

“穩(wěn)定”意味著博弈方都不會單獨改變策略，這恰似納什均衡的概念。（1，0）借不借分不分（2，2）（1，0）

開金礦（信守）乙打不打（1，0）（0，4）2024/4/23323.3.2子博弈完美納什均衡由于動態(tài)博弈與靜態(tài)博弈有較大的差異，那么如何才能使靜態(tài)博弈中的納什均衡在動態(tài)博弈中亦有相應的概念發(fā)展？以開金礦為例（注意此例與以前開金礦例子的差異）

2024/4/23333.3.2子博弈完美納什均衡此時打官司對乙亦無好處（此情況在現(xiàn)實中可能出現(xiàn)）。在此情況中，逆推可以得出乙不借，原因在于乙在第三階段打官司的威脅是不可信的。由此導致甲在第二階段分的許諾也變?yōu)椴豢尚?。結(jié)局是，甲開不成金礦，乙保本，甲失去掙錢的機會。（2，2）（－1，0）（1，0）乙借不借分不分不打打（0，4）開金礦2024/4/23343.3.2子博弈完美納什均衡如果按照靜態(tài)博弈的分析方法，則（借，分，打）的策略組合為一個納什均衡，因為任何一方都不會單獨改變策略而降低自己的得益。這與逆推歸納法得到的結(jié)論相矛盾，原因在于路徑（借，分）的納什均衡策略組合包含了一個不可信的威脅，即乙在第三階段會選擇打官司的行為是不可信的。2024/4/23353.3.2子博弈完美納什均衡

由此需要對靜態(tài)博弈中的納什均衡的概念有所調(diào)整，即應滿足：是納什均衡，從而具有策略穩(wěn)定性不能包含任何的不會信守的許諾或威脅

這樣的動態(tài)博弈策略組合稱為子博弈納什均衡。2024/4/23363.3.2子博弈完美納什均衡定義（Selten塞爾頓）：如果動態(tài)博弈中各博弈方的策略在動態(tài)博弈本身和所有子博弈中都構(gòu)成一個納什均衡，則稱該策略組合為一個“子博弈完美納什均衡”。2024/4/23373.3.2子博弈完美納什均衡注意，用逆推歸納法所得到的解應為子博弈完美納什均衡。動態(tài)博弈所應注意的兩點：要求各博弈方的策略對每階段每種可能的情況都設定一個行為方案。其意義在于避免出現(xiàn)不會信守的許諾或威脅，從而使子博弈完美納什均衡可以用。假定所有博弈方都是理性的且不會犯錯誤的。2024/4/23383.3.2子博弈完美納什均衡

與實際情況的差異：后續(xù)可能性太多而無法分析，于是考慮僅知道有限后續(xù)階段的情況？許諾有限非理性，如何考慮？比如假設非理性的次數(shù)小于等于k？下棋…K叉樹算法博弈構(gòu)成的“長短”與穩(wěn)定性，不可預測性等2024/4/23393.4幾個經(jīng)典動態(tài)博弈模型3.4.1寡占的斯塔克博格模型3.4.2勞資博弈3.4.3討價還價博弈3.4.4委托人—代理人理論2024/4/23403.4.1寡占的斯塔克博格模型

（古諾模型在動態(tài)博弈中的體現(xiàn)）模型：設一市場有1、2兩個廠商生產(chǎn)同樣的產(chǎn)品。如果廠商1的產(chǎn)量為q1,廠商2的產(chǎn)量為q2，則市場總產(chǎn)量為Q=q1+q2。設市場出清價格是P=P(Q)=8-Q，生產(chǎn)無固定成本，單位變動成本為2，討論其納什均衡。分析：個體收益最大化博弈方1利潤：博弈方2利潤：

回憶“古諾的寡頭模型”2024/4/2341回憶“古諾的寡頭模型”

在本博弈中，的納什均衡的充分必要條件是和的最大值問題：第一個對q1求導，并將q1*代入，6-q2*-2q1*=0

第二個對q2求導，并將q2*代入，6-q1*-2q2*=0

解得唯一解社會收益最大化：假設總產(chǎn)量為Q，總收益為U＝QP（Q）－CQ

＝Q（8-Q）－2Q＝6Q－Q2

其最大值為Q*=3,U=9

該結(jié)果與納什均衡有較大的差異，這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。3.4.1寡占的斯塔克博格模型

（古諾模型在動態(tài)博弈中的體現(xiàn)）2024/4/23423.4.1寡占的斯塔克博格模型然而，許多實際問題為各廠商進入市場有先后，尤其是廠家有強弱之分，且后一廠商（跟隨者）在決策時是看著前一廠商的選擇的，由此引出斯塔克博格模型。斯塔克博格模型與古諾模型相比，唯一的不同是前者有一個選擇的次序問題，其他如博弈方、策略空間和得益函數(shù)等完全都是相同的。2024/4/23433.4.1寡占的斯塔克博格模型先后選擇產(chǎn)量的產(chǎn)量競爭博弈把古諾模型改為廠商1先選擇，廠商2后選擇，而非同時選擇即可。222126qqqq--=

產(chǎn)量得益廠商13單位4.5廠商21.5單位2.25先行優(yōu)勢2024/4/2344逆推歸納法第二階段：廠商2決策在決策時，廠商1選擇的產(chǎn)量q1已經(jīng)確定了，廠商2知道這一點，因此對廠商2來講，相當于在給定q1的情況下，求使u2最大值的q2。第一階段：廠商1決策廠商1知道廠商2的這種決策思路，于是廠商1的得益函數(shù)轉(zhuǎn)化為求得：3.4.1寡占的斯塔克博格模型2024/4/2345

產(chǎn)量得益廠商13單位4.5廠商21.5單位2.25比較：古諾模型廠商12單位4廠商22單位4比較說明：兩廠商地位不對稱。廠商1具有先行優(yōu)勢，得到較多的利益。同時也說明信息較多并不一定能得到較多的利益3.4.1寡占的斯塔克博格模型2024/4/23463.4.1寡占的斯塔克博格模型以上模型說明：在信息不對稱的博弈中，信息較多的博弈方（如廠商2決策之前已知廠商1的實際選擇，因此他有較多的信息）不一定能得到較多的得益。原因：先行為或信息較少者認為后行為方或知識較多者作為理性的博弈方，不可能為了公平或賭氣而采取任何對雙方不利的行為，從而先發(fā)制人選擇比同靜態(tài)決策時更大的產(chǎn)量而獲得利益和好處。2024/4/23473.5有同時選擇的動態(tài)博弈模型3.5.1標準模型3.5.2間接融資和擠兌風險3.5.3國際競爭和最優(yōu)關(guān)稅3.5.4工資獎金制度2024/4/23483.5.1標準模型博弈中有四個博弈方，分別稱為博弈方1、2、3和4第一階段是博弈方１、2的選擇階段，他們同時在各自的可選策略（行為）集合和中分別選擇和

第二階段是博弈方3、4的選擇階段，他們在看到博弈方1、2的選擇和以后，同時在各自的可選策略（行為）集合和中分別選擇和各博弈方的得益都取決于所有博弈方的策略即博弈方i的得益是各個博弈方所選擇策略的多元函數(shù)2024/4/23493.5.1標準模型及其存在的問題與前面討論的動態(tài)博弈一樣，也是多階段并且在后一階段前，博弈方能看到此前的博弈過程，但在同一個階段有兩個或兩個以上博弈方同時選擇。嚴格而言，這種博弈并不是完美信息的，它們介于完美信息和被完美信息之間?？捎媚嫱品▉砬蠼猓煌氖亲詈箅A段（每一階段）不是單一方求利益最大化，而是由一個博弈結(jié)果來決定的。因而與以往的不有一個的差異，要詳細分析才可以。2024/4/23503.5.2間接融資和擠兌風險下一階段1，11，11，1不存存款客戶2不存存款客戶1第一階段0.8，0.80.6，11，0.61.2，1.2提前到期客戶2提前到期客戶1第二階段

設一家銀行為了給一個企業(yè)貸放一筆20000元的貸款，以20％的年利率吸引客戶的存款。若兩個客戶各有10000元資金，如果他們把資金作為1年期定期存款存入該銀行，那么銀行就可以向企業(yè)貸款；如果兩客戶都不愿行款或只有一個客戶存款，那么銀行就無法結(jié)上述企業(yè)貸款，這時候客戶都能保住自己的本全。2024/4/2351

如果第二階段理想的結(jié)果（到期，到期）納什均衡，結(jié)果如圖。（到期，到期）（存款，存款）0.8，0.80.6，11，0.61.2，1.2提前到期客戶2提前到期客戶1第二階段下一階段1，11，11，1不存存款客戶2不存存款客戶1第一階段1.2，1.2

此時有兩個納什均衡，后一個帕累托優(yōu)于前一個，也是上策均衡和風險上策均衡。3.5.2間接融資和擠兌風險2024/4/2352

如果第二階段不理想的結(jié)果（提前，提前）納什均衡，結(jié)果如圖，

0.8，0.80.6，11，0.61.2，1.2提前到期客戶2提前到期客戶1第二階段下一階段1，11，11，1不存存款客戶2不存存款客戶1第一階段0.8，0.8（提前，提前）（不存，不存）此時，（不存，不存）是納什均衡，也是上策均衡。3.5.2間接融資和擠兌風險2024/4/2353

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

ch3完全且完美信息動態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評論

ch3完全且完美信息動態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔