不完全信息動態(tài)博弈及應用

上傳人：熊*** IP屬地：山東上傳時間：2024-06-11 格式：PPT 頁數(shù)：70 大?。?.54MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩65頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

不完全信息動態(tài)博弈及應用本章主要介紹以下問題：1針對非完全信息動態(tài)博弈模型，我們介紹相應的均衡概念—子博弈精煉貝葉斯均衡的概念。2介紹一個求解有限信號博弈的精煉貝葉斯均衡的方法。3在應用方面，我們介紹了不完全信息動態(tài)博弈在次品市場、就業(yè)市場、企業(yè)投資與資本結(jié)構(gòu)以及囚徒困境問題中的應用。4精煉貝葉斯均衡再精煉6.1子博弈精煉貝葉斯均衡的定義信息不完美的動態(tài)博弈模型一般不能再用子博弈精煉納什均衡來刻畫對于信息不完全的博弈模型，我們可以通過海薩尼轉(zhuǎn)換的方法，把它轉(zhuǎn)化為信息不完美的動態(tài)博弈模型。但對于信息不完美的動態(tài)博弈模型，一般不能再用子博弈精煉什均衡來刻畫它。下例可清楚地說明此點?？紤]圖6-1所示的博弈樹所對應的信息不完美博弈問題。它所對應的策略型博弈的支付矩陣如下：.圖6-1I11

LMI21R.①②②該博弈存在兩個純策略納什均衡：。因該博弈僅有一個子博弈，故它們也都是子博弈精煉納什均衡。但是是個不可置信的均衡。因表明：不論局中人1選擇什么行動，局中人2都將選擇行動。但如果局中人1開始沒有選擇，而是進入到局中人2的信息集合，不論局中人2處于的哪個節(jié)點上，他選擇都比選擇好。因而局中人2不會選擇，從而是不可置信的均衡。這表明了我們不能用子博弈精煉納什均衡來刻畫信息不完美、信息不完全的動態(tài)博弈模型。為了排除類似于這種不可置信的均衡，我們需要提出以下兩個要求：對求解子博弈精煉納什均衡的要求要求1在每一信息集中，應該選擇行動的局中人必須對博弈進行到該信息集中每個節(jié)點的可能性有一個推斷。對于非單點信息集，推斷是該信息集不同節(jié)點上的一個概率分布。而對于單點信息集，在這點上局中人的推斷為1。要求2給定局中人的推斷，局中人的策略必須滿足序貫理性的要求。即在每一信息集中，應該行動的局中人（以及局中人隨后的策略），對于給定的該局中人的推斷，以及其余局中人隨后的策略（其中“隨后的策略”是在達到給定的信息集之后，包括了其后可能發(fā)生的每種情況的完全的行動計劃）必須是最優(yōu)反應。對于圖6-1所示的博弈樹，要求1是說：如果博弈進入了信息集，局中人必須對博弈達到的兩個節(jié)點的可能性有一個推斷，即必須有一個上的概率分布。例如這個概率分布為（），如圖6-2所示。

根據(jù)局中人2的推斷可知，局中人2選的期望支付為，選的期望支付為。因，故局中人2滿足序貫理性的策略行為是當他處于信息集上時，選擇。這樣，在要求1與要求2之下，我們排除了不可置信均衡。要求1僅要求局中人對其信息集內(nèi)的節(jié)點有所推斷，但合理的均衡應建立在合理推斷的基礎上，因而還要提出推斷合理性的要求，為給出推斷合理性要求先介紹以下概念圖6-2p1－pI11

LMI21R①②②定義6.1對于一個給定的擴展式博弈中的均衡，如果博弈按照均衡策略進行時，將以正概率達到某個信息集，則稱此信息集處于均衡路徑上，反之，如果博弈按照給定均衡進行時，肯定不會達到某個信息集，該信息集稱為處于均衡路徑之外的信息集。要求3在處于均衡路徑上的信息集上，推斷由局中人的均衡策略及貝葉斯法則給出。例6-1考慮圖6-3給出的博弈。

圖6-31/4Ba0LR1/32/3V3/4I31DAAD①②③③該博弈的混合策略均衡，其中。這里不關心。按此均衡，該博弈進入信息集的概率為。故是處于均衡路徑上的信息集。當博弈進入信息集時，參與人3對于左節(jié)點的推斷應為，右節(jié)點的推斷為。要求1到要求3包含了子博弈精煉貝葉斯均衡的主要內(nèi)容。不同作者采用了不同的子博弈精煉貝葉斯均衡的定義。但其中全部都包含了要求1到要求3。且大多數(shù)作者還提出以下的要求。要求4在處于均衡路徑之外的信息集上，推斷由貝葉斯法則和局中人在此處可能的均衡策略決定。要求4的必要性例6.2考慮圖6-4所給出的擴展式博弈。

策略組合（）及相應的推斷，滿足要求1-3，是納什均衡，但不是子博弈精煉納什均衡。由，,故，為納什均衡。對于要求1與3的滿足是顯然的，現(xiàn)考慮要求2。A1-pp圖6-4

I31DI21I11①②②

，博弈進入了信息集，參與人3選擇，期望支付為2，選擇，支付為1，故選；，博弈進入了信息集，局中人2選擇L，支付為2，選擇R，支付為1，故選L；，局中人選A，支付為2，選D，支付為1，故選A。從而（）及滿足要求1-3。從節(jié)點2開始的子博弈的支付矩陣為它有唯一的納什均衡（）。因而（）在這個子博弈上的限制（）不是納什均衡。（），沒有構(gòu)成子博弈精煉均衡的原因就在于它不滿足要求4。對于均衡（）而言，信息集處于均衡路徑之外，但推斷與可能的策略組合（）相矛盾。而{（），}滿足要求1-4。它滿足要求1與3是顯然的，現(xiàn)考慮要求2。，參與人3在上選擇，期望支付為2，選擇，期望支付為3，故選；，參與人2在上選擇，期望支付為3，選擇，支付為1，故選；，參與人1在上選，支付為2，選擇，支付為3，故選。我們已經(jīng)說明了{（），}滿足序貫理性的要求。因該博弈對于納什均衡（）而言不存在均衡路徑之外的信息集，因而要求4自動滿足。子博弈精煉貝葉斯納什均衡的定義定義6.2

滿足要求1到要求4的策略組合與推斷稱為不完全信息動態(tài)博弈模型的子博弈精煉貝葉斯納什均衡，簡稱精煉貝葉斯均衡。不完全信息動態(tài)博弈的精煉貝葉斯均衡由參與人的策略組合與信息集上的推斷組成，滿足：1.給定推斷，策略組合為子博弈精練納什均衡。2.給定策略組合，推斷滿足貝葉斯法則。6.2信號傳遞博弈的精煉貝葉斯均衡信號傳遞博弈信號傳遞博弈是不完全信息動態(tài)博弈模型中一類簡單、重要的博弈模型，它在經(jīng)濟管理領域內(nèi)有很多應用。在信號傳遞博弈中，有兩個參與人。參與人1稱為信號發(fā)送者，參與人2稱為信號接收者。參與人1具有私人類型，的概率分布是共同知識。海薩尼轉(zhuǎn)換下的信號傳遞博弈時序如下：(0)自然首先按概率分布選擇參與人1的私人類型，此處是參與人1的類型空間。自然將的值告訴參與人1。參與人2不知值，但了解的概率分布。(1)參與人1在了解到值后，選擇信號，這里表示參與人1的行動空間，稱其為信號空間。(2)參與人2在觀察到參與人1發(fā)出的信號后，形成他對參與人1的私人類型的推斷——后驗概率。即在觀察到行動的條件下，類型的條件概率。然后選擇行動，這里，表示參與人2的行動空間。(3)對于給定的類型，信號，行動，參與人i獲得支付，。在信號傳遞博弈中，信號發(fā)送者的策略是到上的映射：：，。信號接收者的策略是到上的映射：：，。信號傳遞博弈的精煉貝葉斯均衡的要求把6.1節(jié)中對于不完全信息動態(tài)博弈的精煉貝葉斯均衡的要求1-要求3，應用于信號傳遞博弈上，便可得到信號傳遞博弈的精煉貝葉斯均衡的要求。信號要求1

信號接收者觀察到信號發(fā)送者所發(fā)送的信號之后，接收者必須根據(jù)所接收到的信號，對信號發(fā)送者的類型進行推斷，即形成一個后驗概率。信號要求1表明了信號發(fā)送者所發(fā)送的信號將會影響信號接收者對于信號發(fā)送者類型的推斷。信號要求2R

對于信號與推斷，信號接收者采取行，最大化他的期望支付，即

（為優(yōu)化問題的解）。信號要求2R表明了信號接收者的行動與推斷的一致性。信號要求2S

對于，給定信號接收者的策略，信號發(fā)送者選擇信號，最大化自己的支付函數(shù)，即

（為優(yōu)化問題的解）。最后，給定信號發(fā)送者的策略，令表示選擇信號的類型集合，即。若，則對應于信號的信息集就處于均衡路徑上；否則，任何類型都不選擇，其對應的信息集則處于均衡路徑之外。對處于均衡路徑上的信號，把6.1節(jié)中的要求3運用于接收者的推斷，可以得到：信號要求3

對于任意，如果存在,使，則信號接收者在對應于的信息集中持有的推斷必須決定于貝葉斯法則和發(fā)送者的均衡策略。信號要求3說明了信號接收者的推斷要滿足貝葉斯法則，它保證了推斷與信號發(fā)送者行動的一致性。信號傳遞博弈的精煉貝葉斯均衡的定義定義6.3稱信號博弈中滿足信號要求1，2R，2S，及3的策略組合和及推斷為信號傳遞博弈的精煉貝葉斯均衡。我們下面給出一個例子說明信號博弈的定義為什么對均衡路徑之外的信息集推斷不作要求例6.3市場進入博弈參與人1是個潛在的市場進入者，其類型為概率與為的概率均為。參與人1知道后，可選擇：進入與：不進入。如果參與人不進入市場，則博弈結(jié)束。參與人2是個市場在位者，他不知的取值，但了解的概率分布。當他看到參與人1進入市場后，可選擇：合作與：抵制。支付向量如圖6-5的博弈樹所示。

，博弈進入了。在位者看到了進入者進入的行動，并且產(chǎn)生了推斷：。若選擇：合作，期望支付為50，若選擇抵制，期望支付為。因而參與人2選擇合作的充要條件是，或。故當時，。時，。，參與者1已獲知了值，選擇：進入或：不進入。當時，對于，參與人選擇進入的支付為40，選擇不進入的支付為0，故選擇進入。對于，選擇進入的支付為40，選擇不進人支付為0，同樣應選擇進入，故有。I12I11圖6-5①①②②◎這樣，我們得到了該博弈的一個均衡：。它滿足要求1-3。因為不存在均衡路徑之外的信息集上的推斷問題，因而沒有必要對均衡路徑之外的信息集上的推斷作要求。而當時，。對，進入者選擇進入支付為-10，選不進人支付為0；，情況也是這樣，故有。于是，該博弈另一個均衡為。在該均衡下，是均衡路徑之外的信息集，而該均衡對于上的推斷沒有限制作用，因而可以不必對均衡路徑之外的信息集上的推斷作任何要求。而在例6.2中，均衡（）限制了。6.3信號傳遞博弈求解1.分離均衡不同類型的信號發(fā)送者，發(fā)送不同的信號。分離均衡意味著：是類型為的信號發(fā)送者的最優(yōu)選擇，就不是類型為的信號發(fā)送者的最優(yōu)選擇，是類型為的信號發(fā)送者的最優(yōu)選擇，就不是類型為的信號發(fā)送者的最優(yōu)選擇?？捎脭?shù)學表達式表示成如下兩式：信號接收者的推斷滿足：

2.混同均衡不同類型的信號發(fā)送者，選擇相同的信號發(fā)送。這時，信號接收者根據(jù)所接收到的信號，不能修改關于信號發(fā)送者類型的先驗概率。設，為信號發(fā)送者的均衡策略，有：

由定義6.3可見，在信號博弈的精煉貝葉斯均衡中，參與人1的策略依賴于參與人2的策略;而參與人2的策略又依賴于參與人2的對于參與人1的類型的推斷；而還依賴于參與人1的策略。求解純策略意義下信號博弈的步驟(1)求信號接收者的推斷依存的子博弈精煉均衡策略。在博弈第2階段，參與人2觀察到參與人1所發(fā)送的信號，設他對參與人1的類型的推斷為，選擇策略,最大化他的期望支付，即求解最大化問題：解得參與人2的推斷依存的策略。(2)求信號發(fā)送者的推斷依存的子博弈精煉策略。在博弈的第1階段，設類型為的信號發(fā)送者預期到信號接收者的推斷依存的策略，求，最大化自己的支付函數(shù)，即求解最大化問題：解得參與人1的推斷依存的策略。(3)求信號博弈的精煉貝葉斯均衡。利用（1），（2）兩步求得的參與人信念依存的策略及，求出滿足貝葉斯法則的參與人2對于參與人1的類型的推斷，及，，即為信號博弈的貝葉斯均衡。例6.4

本例是克瑞普斯（Kreps,1982）聲譽模型的一個簡化版本?？紤]一個兩期的聲譽模型。，市場上在位企業(yè)可選擇兩個行動，：掠奪，：和解。企業(yè)1的私人類型可?。豪碇牵函偪?。其概率分布是共同知識。，進入者企業(yè)2觀察到企業(yè)1的行動后，選擇：堅持與：退出這兩個行動。記，博弈樹如圖6-6所示。I21I12I11圖6-6I22◎①①②②②在支付向量中。即理智的在位者更偏好于和解的行動，但他更希望成為壟斷者。壟斷利潤為，為貼現(xiàn)因子。下面求該博弈的精煉貝葉斯均衡。，局中人2觀察到企業(yè)1的行動，選擇策略，最大化自己的期望支付當時，企業(yè)2求解最大化問題：當若，顯然，從而得到企業(yè)2推斷依存的策略：

（1）當（2）當，局中人了解到自己的類型，并預期到，選擇策略，最大化自己的支付函數(shù)。（1）當時，對，企業(yè)1預期到，他的最優(yōu)反應行為是求解最大化問題所以對，，。要求推斷，與相矛盾，故此時不會產(chǎn)生精煉貝葉斯均衡。

（2）當時，參與人1預期到，他的最優(yōu)選擇行為是對，求解最大化問題從而的充要條件是。對，有。當或時，，這要求推斷，從而當,時，有混同均衡：而當時，這要求推斷，這時有分離均衡：

6.4信號傳遞博弈的應用6.4.1二手車交易模型二手車交易模型為敘述二手車交易模型，引入以下記號。1.為局中人集合，其中1代表二手車市場的賣主，2代表買主。2.為賣主的類型空間。賣主的私人類型表示賣主所出售的二手車是低質(zhì)量的，表示賣主所出售的二手車是高質(zhì)量的。賣主知道的取值，買主不知道的取值，但知道的概率分布為，。3.是賣主的行動集合即信號空間。分別表示賣主對于二手車的兩種不同的要價，。4.為買主的行動空間。表示不購買的行動，表示購買的行動。5.博弈的時序二手車交易模型的精煉貝葉斯均衡第1階段，賣者了解到的取值后，選擇信號；第2階段，買主觀察到信號，后形成關于類型的推斷：，，用表示高質(zhì)量二手車對于買主的價值，表示低質(zhì)量二手車對于買主的價值，且，表示低質(zhì)量二手車偽裝為高質(zhì)量二手車賣主所需付出的成本。對于給定的，為確定起見，令，，，，，（表明在二手車市場上，低質(zhì)量車容易偽裝成高質(zhì)量車）。兩個局中人的支付函數(shù)（用表示賣主的支付函數(shù)，表示買主的支付函數(shù)）如下：

，，，，，，，，。上述雙價二手車交易博弈樹如圖6-7所示下面求該博弈的精煉貝葉斯均衡。

.當博弈進入，局中人2觀察到價格，形成了對的推斷以及對的推斷。參與人2選擇（購買）的充要條件是：或。故知當時，。當時，。當博弈進入，局中人2觀察到價格，形成了對的推斷，對的推斷。參與人2選擇的充要條件是：。此不等式對任何都成立，故有。圖6-7

1-π01-π1π1◎①①②②②②綜上可得參與人2的推斷依存策略：當時當時，。

.局中人1了解到自己的類型，并預期到，選擇推斷依存的策略，最大化自己的支付函數(shù)。當時,對于，局中人1的行為是求解最大化問題，所以。對于，，所以。故得參與人1推斷依存的策略：，從而得到了混同均衡：。該均衡表明當二手車市場上好車占有時，賣主把所有車都作為好車賣，而買主都購買。當時，對于，。所以。對于，，所以從而可得混同均衡：，6.4.2就業(yè)市場信號博弈就業(yè)市場信號博弈模型的精煉貝葉斯均衡該博弈兩個參與人是求職的工人與雇主。求職者有兩種私人類型：，表示求職者的勞動生產(chǎn)率是；，表示求職者的勞動生產(chǎn)率為，，的概率分布：，是共同知識。由于勞動力市場的競爭性，使得雇主雇傭工人的期望利潤為0。在完全信息下（即兩個參與人都知道的值），雇主以工資雇傭型的工人，以雇傭型的工人。即可給出兩個局中人的帕累托（Pareto）最優(yōu)分配。當是求職者的私人類型時，求職者占有信息優(yōu)勢，雇主只能以雇傭工人，這時的工人就可能退出市場。這就是信息不對稱所造成的逆向選擇問題。為了解決逆向選擇問題，求職者以受教育程度作為信號發(fā)送給雇主，以使雇主能區(qū)別兩類不同的求職者。我們可用信號博弈模型分析這個問題。該模型假設：1教育對求職者的勞動生產(chǎn)率沒有影響，目的是把注意力集中于用教育水平作為求職信號這一問題上來，使分析簡化。2類型為的求職者，受教育程度為需要付出成本。假設，即類型為的求職者受教育水平為的邊際成本大于類型為的受教育水平為的邊際成本。這是該模型的一個關鍵性假設。正是這條假設使求職者的受教育程度具有信號作用，設。該博弈模型的時序如下：1.自然按分布選擇求職者的勞動生產(chǎn)率。2.求職者了解到自己的勞動生產(chǎn)率后，選擇受教育水平。3.雇主觀察到求職者的受教育水平后，形成對于求職者類型的推斷，并向工人提供工資，使雇主的期望利潤為0。4.對給定的和，工人的利潤為就業(yè)市場信號博弈模型的精煉貝葉斯均衡（1）考慮分離均衡.在分離均衡中，設存在一個受教育水平臨界，當時，認為，當時，認為。即當推斷滿足，工資。，工資。當求職者選擇時，求職者利潤為，因而。當求職者選擇時，求職者利潤為，因而。這樣求職者實際上僅有兩種選擇：或。故分離均衡可以表示為：,相應的推斷為

,,工資水平為剩下的問題是決定的數(shù)值。據(jù)上述分析，可以畫出如圖6-8所示的博弈樹。

，在博弈的第2階段，雇主看到求職者所發(fā)出的信號，采用推斷，，并選擇使期望利潤為0的工資政策。時，求職者預期到及其推斷，選擇，最大化利潤。

圖6-8-1001θ=Hθ=Lw=La0e=0w=Hw=H◎①①②②②②當時，的充要條件是。當時,，等同于。故當時，有分離均衡：

,,(2)考慮混同均衡在混同均衡中，雇主的推斷及工資選擇如下：當,,;當,,。。求職者選擇時,利潤為,故。選擇時，利潤為,故。此時博弈樹如圖6-9所示。1-qq01HLe=0w=Lw=Lw=H+(L-H)qw=H+(L-H)q

圖6-9◎①①②②②②問題歸結(jié)為的確定。，求職者預期到及雇主的推斷：，，.選擇，最大化利潤。當時,,

等同于當時，等同于,故有混同均衡：

,,,

，其中。6.4.3企業(yè)投資與資本結(jié)構(gòu)企業(yè)投資與資本結(jié)構(gòu)信號博弈企業(yè)想開發(fā)一個項目，需要一筆資金。該企業(yè)之盈利能力是企業(yè)的私人信息。其概率分布，是共同知識。這里，。企業(yè)向潛在投資者提出一定比例的股份份額以換取投資額。問題是企業(yè)所提出的股份份額多少為宜。上述問題可用信號博弈加以分析。這里企業(yè)被視為信號發(fā)出者，股份份額作為企業(yè)贏利能力的信號。潛在投資者被視為信號接收者，他決定是否接受。用表示新項目的收益，表示投資者的機會利率（投資于其它處的利率）。且設。投資者無法分離利潤與收益。該信號博弈的時序為1.自然以概率分布，選擇企業(yè)的盈利能力（類型）。2.企業(yè)了解到類型后，選擇股份份額。3.潛在投資者看到后，形成對企業(yè)利潤的推斷，并決定是否接受。4.若投資者拒絕，即選擇行動，獲得保留收益，企業(yè)的收益為；若投資者接受，即選擇行動，獲得收益，企業(yè)收益為。企業(yè)投資與資本結(jié)構(gòu)信號博弈的均衡(1)考慮混同均衡設，潛在投資者的推斷為,博弈樹如圖6-10所示。

在第2階段，潛在投資者根據(jù)接收到的信號，形成了對企業(yè)利潤的推斷，，選擇行動，最大化自己的期望利潤，即求解顯然，選擇的充要條件是或故可得到

圖6-101-ppSS◎①①②②在第1階段，企業(yè)可預期到潛在投資者的策略及其推斷，根據(jù)自己的類型求，最大化企業(yè)的收益。當時，考慮若企業(yè)選,使時，他希望投資者能選擇，因而還要滿足，可得當時，考慮。企業(yè)選擇當然希望能被投資者接受，這樣需要滿足條件：，得到從而當滿足時，可得混同均衡：，,,易知，當時，混同均衡存在。（2）考慮分離均衡。企業(yè)策略形如，潛在投資者接收到信號后，對于企業(yè)類型的推斷為，。博弈樹如圖6-11所示。

在博弈的第2階段，潛在投資者收到信號，形成推斷，，選擇行動或，最大化自己的期望支付。

1001a1a0a1a0a0a0a1a1圖6-11◎①①②②②②對于，考慮，易知的充要條件是或。對，考慮，易知的充要條件是或。這樣，可將所在的平面劃分成四個區(qū)域：，，

,對于，有，對于，有，對于，有，對于，有。在博弈的第1階段，企業(yè)預期到潛在投資者的策略及其推斷。根據(jù)自己的類型，選擇行動，最大化自己的期望支付。對于，即，時，`，潛在投資者不會對企業(yè)投資，因而我們不討論這種情況。對于，即當，時，。當，考慮，的充要條件是或。當，考慮，的充要條件為或。故當時，不可能存在分離均衡。對于，即，，當，考慮，的充要條件是或，故有當，考慮，的充要條件是或，這與相矛盾。因而時，也不存在分離均衡。對于，即，，。當，考慮，的充要條件是或。記，故有。當，考慮，的充要條件是或。從而當，時，可得分離均衡：，，，6.4.4信息不完全條件下的囚徒困境問題大量的經(jīng)驗證據(jù)表明，既使在有限次重復的囚徒困境問題中，局中人雙方采取合作的策略的情形也是經(jīng)常發(fā)生的，克雷普斯（Kreps），米爾格羅姆（Milgrom），羅伯茨（Roberts），威爾遜（Wilson）（1982）的KMRW聲譽模型通過將不完全信息引入有限次重復的囚徒困境模型，解開了這個悖論。該模型表明，對于有限次重復的囚徒困境博弈，在一定的條件下，絕大多數(shù)的階段都會出現(xiàn)合作的局面。信息不完全條件下的囚徒困境模型在有限次的囚徒困境博弈中，假設囚徒1有兩種類型：理性的和非理性的，這是囚徒1的私人類型。兩種類型的概率分布：，是兩個局中人的共同知識。設囚徒2是理性的。理性囚徒可以選擇任何策略，而非理性的囚徒僅選擇“針鋒相對”策略。即第1階段選擇行動合作D，而在階段選擇與其對手階段相同的行動。信息不完全有限重復囚徒困境問題時序如下：1.自然首先選擇囚徒1的類型。囚徒1知道自己的類型，囚徒2僅知囚徒1類型的概率分布。2.兩個囚徒進行第1階段博弈，雙方在此階段的選擇結(jié)果是共同知識。3.觀察到第1階段博弈結(jié)果后，進行第2階段博弈，觀察到第2階段博弈結(jié)果后進行第3階段博弈，如此下去，直到進行第階段的博弈。4.兩囚徒的支付是階段博弈支付貼現(xiàn)之和。為簡單，設貼現(xiàn)因子。階段博弈由下列支付矩陣給出。其中。2階段信息不完全條件下的囚徒困境模型首先討論的情況。在第2階段,囚徒2和理性的囚徒1，都會選擇非合作行為。在博弈的第1階段，非理性的囚徒1選擇合作D，理性的囚徒1選擇C。設囚徒2選擇行動X，從而非理性的囚徒1在第2階段也選擇行動X，如表6.1所示。表6.1

非理性囚徒1

理性囚徒1

囚徒2

若，囚徒2的期望支付為若，囚徒2的期望支付為因而囚徒2在第1階段選擇合作D的充要條件是

或，（1）這說明，當局中人1非理性的可能性較大時，即若（1）成立，第1階段給出了合作的行動組合（）。3階段信息不完全條件下的囚徒困境模型當時，仍假設（1）式成立。如果理性囚徒1和囚徒2在第1階段選擇合作，這時，和這兩個階段局中人的行動可在表6.1中取得到。三階段博弈中各階段局中人采取的行為由表6.2給出。下面我們給出第1階段理性囚徒1和囚徒2選擇合作的條件。由表6.2，首先,非理性的囚徒1沒有動機背離表6.3所示的策略，理性囚徒1的收益為，囚徒2的期望收益為。如果理性囚徒1在第1階段選擇非合作，則囚徒1是理性的就成為了共同知識，于是第2，3階段兩個局中人都將選擇非合作。這樣，理性囚徒1第1階段選擇非合作可得到總收益，它要低于上述均衡收益，于是理性囚徒1沒有動機背離表6.2所示的隱含策略。表6.2

非理性囚徒1

理性囚徒1

囚徒2

下面考慮囚徒2是否有背離的動機。如果囚徒2在第1階段選擇非合作

理性的和非理性的囚徒1在第2階段也將選擇在第1階段選非合作后，囚徒2必須決定在第2階段的行動選擇。

如果選擇非合作，則非理性囚徒1第3階段仍選，

這時博弈的情況如表6.3所示。表6.3

非理性囚徒1

理性囚徒1

囚徒2囚徒2從這種背離中獲取期望收益，它小于其均衡收益的條件為。在（1）的條件下，囚徒2不選擇這種背離行動的條件為或（2）另一種情況是，囚徒2的背離行為可以是第1階段選擇非合作，但第2階段選擇合作。這時，非理性囚徒1將在第3階段選擇合作，博弈情況如表6.4所示。表6.4

非理性囚徒1

理性囚徒1

囚徒2

囚徒2的這種背離行為的期望收益為，它小于均衡期望收益的條件為。給定條件（1），囚徒2不選擇這種背離行動的條件是（3）綜上所述，我們已經(jīng)證明了如果條件（1），（2），（3）成立，則表6.2給出了三階段囚徒困境博弈的均衡路徑。

階段的囚徒困境問題對于一般階段的囚徒困境問題，我們可以證明以下結(jié)論成立。結(jié)論對于期重復的囚徒困境博弈，如果階段博弈支付矩陣中元素及非理性囚徒1的概率滿足條件（1）、（2）、（3），則對所有的，都存在下述的合作均衡：理性的囚徒1和囚徒2從博弈開始直到期全部選擇合作，并在期和T期選擇表6.1所示的行動。

6.5精煉貝葉斯均衡再精煉在不完全信息動態(tài)博弈中，可能會出現(xiàn)很多均衡，一個自然的問題是，哪一個均衡更合理、更可能出現(xiàn)。因為博弈分析的目的之一是預測博弈的結(jié)果，博弈論的許多最新發(fā)展就是討論如何通過對非均衡路徑上的后驗概率(推斷)施加一些直觀、合理的限制以改進精煉貝葉斯均衡的概念，從而得到更為合理的均衡結(jié)果。本節(jié)我們介紹克雷普斯（1984）和克雷普斯——曹（1987）的直觀標準。均衡劣信號的定義定義6.4

給定信號博弈的精煉貝葉斯均衡，稱信號為關于類型的均衡劣信號，如果下的信號發(fā)送者的均衡收益大于在下，信號接收者選擇任何行動的收益，即該定義表明，如果對于給定的貝葉斯均衡，關于是均衡劣的信號，那么，當局中人的類型為時，他就不會發(fā)送信號。信號接收者猜測到這點，他在接收到信號時也不會推斷。例6.5考慮由圖6-12所示的信號博弈?？梢则炞C是該信號博弈的一個混同均衡，是的均衡劣信號。因為。

不是的均衡劣信號，因為圖6-12

0.90.1q1-p1-

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

不完全信息動態(tài)博弈及應用

文檔簡介

溫馨提示

最新文檔

評論

不完全信息動態(tài)博弈及應用

文檔簡介

溫馨提示

最新文檔

評論

相關文檔