博弈論全套上課課件ch3 完全信息動態(tài)博弈_第1頁
博弈論全套上課課件ch3 完全信息動態(tài)博弈_第2頁
博弈論全套上課課件ch3 完全信息動態(tài)博弈_第3頁
博弈論全套上課課件ch3 完全信息動態(tài)博弈_第4頁
博弈論全套上課課件ch3 完全信息動態(tài)博弈_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三章完全信息動態(tài)博弈2主要內(nèi)容一、博弈擴展式表述二、逆向歸納法與子博弈精煉納什均衡三、應(yīng)用舉例

3引例-房地產(chǎn)開發(fā)項目假設(shè)有A、B兩家開發(fā)商市場需求:可能大,也可能小投入:1億假定市場上有兩棟樓出售:需求大時,每棟售價1.4億,需求小時,售價7千萬;如果市場上只有一棟樓需求大時,可賣1.8億需求小時,可賣1.1億4博弈戰(zhàn)略式表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況5一、博弈擴展式表述1、博弈的擴展式表述包括的要素:參與人集合參與人行動次序參與人的行動空間參與人的信息集(參與人在作選擇時都知道些什么信息)參與人的支付函數(shù)(作為其所采取行動的函數(shù)的參與人收益)外生事件的概率分布6A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)行動支付圖3.1房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)結(jié),終點枝結(jié),初始結(jié)

信息集7一、博弈擴展式表述結(jié):包括決策結(jié)和終點結(jié)兩類;決策結(jié)是參與人行動的時點,終點結(jié)是博弈行動路徑的終點.結(jié)滿足傳遞性和非對稱性枝:枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個枝代表參與人的一個行動選擇.信息集:每個信息集是決策結(jié)集合的一個子集,該子集包括所有滿足下列條件的決策結(jié):1每個決策結(jié)都是同一個參與人的決策結(jié);2該參與人知道博弈進入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決策結(jié).8A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B在決策時不確切地知道自然的選擇;B的決策結(jié)由4個變?yōu)?個圖3.2房地產(chǎn)開發(fā)博弈9A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的選擇;但不知道A的選擇(或A、B同時決策)

圖3.3房地產(chǎn)開發(fā)博弈102、完美信息博弈只包含一個決策結(jié)的信息集稱為單結(jié)信息集,如果博弈樹的所有信息集都是單結(jié)的,該博弈稱為完美信息博弈。完全且完美信息動態(tài)博弈的特點行動是順序發(fā)生的;下一步行動選擇之前,所有以前的行動都可被觀察到;每一可能的行動組合下參與人的收益都是共同知識。11注意自然總是假定是單結(jié)的,因為自然在參與人決策之后行動等價于自然在參與人之前行動但參與人不能觀測到自然的行動。不同的博弈樹可以代表相同的博弈,但是有一個基本規(guī)則:一個參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。12N大小AA開發(fā)不開發(fā)1/2開發(fā)不開發(fā)1/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)圖3.4房地產(chǎn)開發(fā)博弈13思考:圖3.5與圖3.3是同一個博弈嗎?N大小AA開發(fā)不開發(fā)1/2開發(fā)不開發(fā)1/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)圖3.5房地產(chǎn)開發(fā)博弈14思考:圖3.6與圖3.3是同一個博弈嗎?N大小BB開發(fā)不開發(fā)1/2開發(fā)不開發(fā)1/2AAAA開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)圖3.6房地產(chǎn)開發(fā)博弈15到底哪些擴展式是等價的,仍是一個有待分析的課題。AC1BLRLR2圖3.716抵賴A坦白抵賴BB坦白抵賴坦白(-8,-8)(0,-10)(-10,0)(-1,-1)BAA坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)圖3.7囚徒困境博弈的擴展式表述ab囚徒困境博弈的擴展式表述175,14,49,-10,0等待小豬大豬按等待按智豬博弈的擴展式表述?183、完美記憶博弈gameofperfectrecall所有參與人都不會忘記曾經(jīng)知道過的任何信息,清楚他們前面所選擇的行動。194、擴展式博弈的策略式表述擴展式的解釋:參與人i保持“等待”的狀態(tài),直到知道了hi信息集以后,才決定如何采取行動;在策略式表述中,參與人可以預(yù)先制定一個完全的相機行動計劃。204、擴展式博弈的策略式表述UD(L,L)1UD22LRL(2,1)(0,0)(-1,1)(3,2)R2,12,10,00,0-1,13,2-1,13,2(L,R)(R,L)(R,R)圖3.8擴展式到策略式的轉(zhuǎn)換21二、逆向歸納法與

子博弈精煉納什均衡一個博弈可能有多個(甚至無窮多個)納什均衡,究竟哪個更合理?納什均衡假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動有先有后,后行動者的選擇空間依賴于前行動者的選擇,前行動者在選擇時不可能不考慮自己的行動對后行動者的影響。子博弈精煉納什均衡的一個重要改進是將“合理納什均衡”與“不合理納什均衡”分開。221、子博弈由一個動態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構(gòu)成的,有初始信息集和進行博弈所需要的全部信息,能夠自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個“子博弈”。232、逆向歸納法從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應(yīng)博弈方的行為選擇,一直到第一個階段的分析方法,稱為“逆向歸納法”。1UDL(3,1)(0,0)22,2R圖3.924逆向歸納法這是一個完美信息下的有限期博弈,它的逆向歸納的解為:(D,L)還有其他的納什均衡嗎?(U,R)但是均衡(U,R)是“不可置信”的。253、子博弈精煉納什均衡圖3.101UDA(3,1)(2,-2)2RLB1CDCD(-2,2)(-2,2)(2,-2)(2,2)226子博弈精煉納什均衡如果一個完美信息的動態(tài)博弈中,各博弈方的策略構(gòu)成的一個策略組合,滿足在整個動態(tài)博弈及它的所有子博弈中都構(gòu)成納什均衡,那么這個策略組合稱為該動態(tài)博弈的一個“子博弈精煉納什均衡”。將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果。27子博弈精煉納什均衡完全非完美信息兩階段博弈:1、參與者1和2同時從各自的可行集A1和A2中選擇行動a1和a2,2、參與者3和4觀察到第一階段的結(jié)果,(a1,a2),然后同時從各自的可行集A3和A4中選擇行動a3和a4。3、收益為Ui(a1,a2,a3,a4),i=1,2,3,4。28子博弈精煉納什均衡用逆向歸納思路求解。從博弈的最后階段逆向推導(dǎo)(求解一個子博弈:給定第一階段的結(jié)果,參與者3和4在第二階段同時行動;參與者3和4也可以是參與者1和2,或者不存在2或4)假設(shè)對第一階段博弈每一個可能結(jié)果(a1,a2),其后第二階段博弈有唯一的納什均衡,表示為(a3*(a1,a2),a4*(a1,a2))29子博弈精煉納什均衡如果參與人1和2預(yù)測到參與人3和4在第二階段的行動將由(a3*(a1,a2),a4*(a1,a2))給出,則參與人1和2在第一階段的問題可以用以下的同時行動博弈表示:1、參與人1和2同時從各自的可行集A1和A2中選擇行動a1和a2;2、收益情況為Ui(a1,a2,a3*(a1,a2),a4*(a1,a2)),i=1,2;假設(shè)(a1*,a2*)為以上同時行動博弈唯一的納什均衡,我們稱(a1*,a2*,a3*(a1*,a2*),a4*(a1*,a2*))為這一兩階段博弈的子博弈精煉解。30子博弈精煉納什均衡把博弈樹上所有的“適當(dāng)子博弈”用它的一個納什均衡收益來代替,然后在其簡化的博弈樹上進行逆向歸納。什么是“適當(dāng)子博弈”?子博弈必須從單結(jié)信息集開始;子博弈的信息集和支付向量都直接繼承自原博弈。沒有對任何信息集形成分割。314、承諾行動與子博弈精練納什均衡有些戰(zhàn)略之所以不是精練納什均衡,是因為它包含了不可置信的威脅戰(zhàn)略,如果參與人能在博弈之前采取某種行動改變自己的行動空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會隨之改變.這些改變博弈結(jié)果而采取的措施稱為承諾行動.完全承諾:承諾可以使某項行動完全沒有可能(破釜沉舟).不完全承諾:承諾只是增加了某個行動的成本而不是使該活動完全沒有可能.32承諾行動與子博弈精練納什均衡

曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻破袁之策,程昱獻了十面埋伏之計,他讓曹操退軍河上,誘袁前來追擊,到那時“我軍無退路,必將死戰(zhàn),可退袁矣”。曹操采納此計,令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。33承諾行動與子博弈精練納什均衡

如果在A決策之前,B與某客戶簽定了一個合同,規(guī)定B若不在特定時期內(nèi)開發(fā)若干面積的寫字樓,則將支付違約金3.5,這個合同就是承諾行動.A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(0,1)(0,0)(-3,-3)xx’房地產(chǎn)開發(fā)博弈(1,-3.5)345、對逆向歸納法與子博弈精煉均衡的批評逆向歸納法要求“所有參與人是理性的”是所有參與人的共同知識。當(dāng)參與人非常多時,共同知識的要求往往難以滿足。35三、應(yīng)用1、斯坦克爾伯格Stackelberg寡頭競爭模型企業(yè)1企業(yè)2參與人:企業(yè)1、企業(yè)2;行動順序:企業(yè)1先選擇產(chǎn)量q1,企業(yè)2觀測到q1,然后選擇自己的產(chǎn)量q2。支付:利潤,利潤是兩個企業(yè)產(chǎn)量的函數(shù)36模型假定一個有兩個企業(yè)的行業(yè),它可由每個企業(yè)i(生產(chǎn)qi單位)的成本函數(shù)概括,而成本函數(shù)由下式給出:

TCi(qi)=ciqi,i=1,2,其中,c2,c1≥0,市場需求函數(shù)為

p(Q)=a-bQ,a,b>0,a>ci,其中

Q=q1+q2

支付函數(shù)即利潤函數(shù)

π(q1,q2)=p(q1+q2)qi-TC(qi)

企業(yè)選擇qi∈Ai≡[0,∞),i=1,237回顧古諾模型反應(yīng)函數(shù)q1●的情形381、斯坦克爾伯格寡頭競爭模型第2期的子博弈企業(yè)2反應(yīng)函數(shù)第1期博弈企業(yè)1

求導(dǎo),令其等于零,得到391、斯坦克爾伯格寡頭競爭模型領(lǐng)導(dǎo)者產(chǎn)量跟隨者產(chǎn)量整個行業(yè)401、斯坦克爾伯格寡頭競爭模型序貫行動數(shù)量博弈比靜態(tài)古諾市場結(jié)構(gòu)產(chǎn)生較高的行業(yè)總產(chǎn)量水平與較低的市場價格。計算利潤水平,得到41評論斯坦克爾伯格的均衡總產(chǎn)量大于古諾均衡總產(chǎn)量,企業(yè)1的斯坦克爾伯格的均衡產(chǎn)量大于古諾均衡產(chǎn)量,企業(yè)2的斯坦克爾伯格的均衡產(chǎn)量小于古諾均衡產(chǎn)量。企業(yè)1在斯坦克爾伯格博弈中的利潤大于在古諾博弈中的利潤,企業(yè)2的利潤卻有所下降,這就是所謂的“先動優(yōu)勢”。42評論擁有信息優(yōu)勢可能使參與人處于劣勢。企業(yè)1先行動的承諾價值:企業(yè)1之所以獲得斯坦克爾伯格利潤而不是古諾利潤,是因為它的產(chǎn)品一旦生產(chǎn)出來就變成了一種沉沒成本,無法改變,從而使企業(yè)2不得不承認它的威脅是可置信的。而假如企業(yè)1只是宣布了它將生產(chǎn),企業(yè)2是不會相信她的威脅的。43評論古諾均衡解,q1=(a-c)/3b,q2=(a-c)/3b也是這個問題的納什均衡,但不是子博弈精煉納什均衡,因為不在所有的子博弈上構(gòu)成納什均衡。44完全競爭00完全壟斷1古諾模型2斯坦克爾博格模型1領(lǐng)導(dǎo)者1跟隨者1領(lǐng)導(dǎo)者n-1跟隨者各類市場結(jié)構(gòu)的均衡點比較452、勞資博弈

列昂惕夫模型(Leontief,1946)工會和企業(yè)的博弈。假設(shè):工會壟斷了勞動力的供給,工會決定工資,企業(yè)決定就業(yè)人數(shù);工會首先選擇工資w;企業(yè)觀測到w后選擇雇傭工人數(shù)量,即就業(yè)水平L工會的效用函數(shù)U(w,L),w為工資水平,L為就業(yè)人數(shù)。U(w,L)是w和L的增函數(shù)。46勞資博弈企業(yè)目標:利潤最大化47勞資博弈從第二階段開始,給定w,企業(yè)最大化利潤由于邊際收益遞減,企業(yè)對勞動的需求L*(w)是工資的減函數(shù)48第一階段,工會預(yù)期企業(yè)選擇就業(yè)水平的規(guī)則(策略),則面臨的問題含義:工會方的邊際替代率等于企業(yè)勞動需求曲線的斜率。工會將選擇自己的無差異曲線與企業(yè)勞動需求曲線相切點的工資。子博弈精煉納什均衡的結(jié)果是(w*,L*(w*))49勞資博弈(w*,L*(w*))是低效率的。在該點,企業(yè)的等利潤曲線與工會的無差異曲線是相交而非相切。有效率的解滿足:即企業(yè)的等利潤曲線的斜率等于工會無差異曲線的斜率。50勞資博弈納什討價還價模型51勞資博弈RL0WL廠商的反應(yīng)函數(shù)R(L)斜率為WLW0工會的無差異曲線523、討價還價博弈游戲規(guī)則:第一輪由第一個參與人(小鵑)提出條件,第二個參與人小明可以接受,從而游戲結(jié)束,也可以不接受,則游戲進入第二輪;小明提出條件,小鵑可以接受,從而結(jié)束游戲,也可以不接受,從而進入第三輪;蛋糕融化呈線性,游戲結(jié)束,蛋糕融化……第一種情況:假設(shè)博弈只有一步,小鵑提出分配方案,如果小明同意,兩個人按照約定分蛋糕,如果小明不同意,兩人什么也得不到。結(jié)果會怎樣?533、討價還價博弈第二種情況:桌上放了一個冰淇淋蛋糕,但兩輪談判過后,蛋糕將完全融化。博弈結(jié)果如何?第三種情況:桌上的冰淇淋蛋糕在三輪談判后將完全融化,結(jié)果又如何?第四種情況:桌上的冰淇淋蛋糕在四輪談判后將完全融化,或者在五輪談判、六輪……,100輪談判后將完全融化,結(jié)果又如何?54輪流出價的討價還價模型Rubinstein輪流出價模型問題描述:兩個參與人分割一塊蛋糕,參與人1先出分配方案,參與人2選擇接受或拒絕;如果拒絕,參與人2提出分配方案,參與人1選擇是否接受;依次類推,直到某個參與人的方案被接受。而蛋糕隨著時間的推移會慢慢減?。ㄈ鐣诨谋苛埽?5輪流出價的討價還價模型x表示參與人1的份額,(1-x)表示參與人2的份額和分別是參與人1出價時參與人和參與人2的份額,和分別是參與人2出價時參與人1和參與人2的份額。假定參與人1和參與人2的貼現(xiàn)因子分別為和

56輪流出價的討價還價模型博弈在時期t結(jié)束,t是參與人i的出價階段參與人1的支付的貼現(xiàn)值

:參與人2的支付的貼現(xiàn)值

:T=2時,逆向歸納法t=2,參與人2出價,參與人1不再有出價的機會,即使,參與人1也會接受。參與人2

得到退回到第一步,則參與人1出價

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論