




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第十一講廣延型博弈與反向歸納策略廣延型博弈適合于分析動態(tài)博弈過程,其強調(diào)的重點在行動的時序性,以及參與人決定策略時所擁有的信息集。第一節(jié)廣延型博弈的定義與形式一、廣延型博弈的定義信息完美(perfectinformation),是指每一個參與人在其作決策時,對于以前所發(fā)生的事件具有完全的信息。
第十一講廣延型博弈與反向歸納策略廣延型博弈適合于分析動態(tài)1廣延型博弈構成要素(1)決策點與決策分枝的結構,在初始決策點與最終結局點之間不存在任何閉環(huán)(closedloops);(2)清楚地指明什么決策點屬于哪一個參與人;(3)在自然決策點上選擇的概率是公共知識;(4)參與人作決策時所依據(jù)的信息集;信息集把參與人在某一時刻的所有決策點分成若干類;(5)在博弈的終極點上每一個參與人的收益廣延型博弈構成要素(1)決策點與決策分枝的結構,在初始決策點2二、廣延型博弈的形式廣延型博弈是以“決策樹”或“博弈樹”的形式來表達的。二、廣延型博弈的形式廣延型博弈是以“決策樹”或“博弈樹”的3122(2,0)(2,-1)(1,0)(3,1)LRMNMN122(2,0)(2,-1)(1,0)(3,1)LRMNMN4三、廣延型博弈的規(guī)則第一,初始點沒有一條箭頭指向它;對其他所有箭頭,都只有一條箭頭指向它。第二,如果我們從某一點向初始點返回,我們就不可能再通過迂回的途徑回這一點,我們只能按反向逐次返回原點。
三、廣延型博弈的規(guī)則第一,初始點沒有一條箭頭指向它;對其他5第二節(jié)完美信息廣延(動態(tài))博弈一、特征。(一)決策有先后順序(二)關于博弈進程的信息是不對稱的后決策者擁有更多信息。第二節(jié)完美信息廣延(動態(tài))博弈6(三)具有完美信息:即參與人決策時完全了解之前的博弈過程的信息。(四)動態(tài)博弈至少有兩個階段;階段:參與者在某一時點進行的一次決策。(三)具有完美信息:7二、可信性:先決策者對后決策者行為的信任性。即先決策者是否相信后決策者是否采取有利的(許諾)或不利的(威脅)行為。二、可信性:先決策者對后決策者行為的信任性。8例1:父女博弈。女兒交了一個父親不喜歡的男友,父親威脅說:“你如果不斷絕與他的關系,我與你斷絕關系。”女兒是否相信父親的威脅?這一博弈可如下表示:例1:父女博弈。女兒交了一個父親不喜歡的男友,9女兒父親斷絕交往不交往不斷絕(1,-1)(2,1)(0,1)女兒父親斷絕交往不交往不斷絕(1,-1)(2,1)(0,1)10作為女兒,知道父親斷絕與女兒的關系損失是非常大的,因此,對父親來講,即使女兒不聽話,“斷絕”是下策,應被剔除掉:作為女兒,知道父親斷絕與女兒的關系11女兒父親交往不交往不斷絕(2,1)(0,1)女兒父親交往不交往不斷絕(2,1)(0,1)12聰明的女兒在看到父親的威脅不可信時,一定不會選擇“不交往”女兒父親交往不斷絕(2,1)聰明的女兒在看到父親的威脅不可信時,女兒父親交往不斷絕(2,13父親的威脅是不可信的。因此,所謂不可信的威脅,就是指一旦采取該策略,給他本人帶來的收益并非最大的策略父親的威脅是不可信的。因此,所謂不可信的威脅,14例2:開金礦(二階段):參與人2欲開采一價值4萬元的金礦,但缺乏1萬資金,參與人1恰擁有一萬元資金。參與人2對參與人1說:“如果你把錢借給我,我與你平分開金礦所得?!眳⑴c人1是否應相信2把錢借給他?例2:開金礦(二階段):參與人2欲開采一價值4萬元的金礦,1512分借不借不分(2,2)(0,4)(1,0)12分借不借不分(2,2)(0,4)(1,0)16在參與人借的資金開發(fā)金礦后,平分所得是其下策,故應被剔除:12借不借不分(0,4)(1,0)在參與人借的資金開發(fā)金礦后,12借不借不分(0,4)(1,017這時,“借”成為參與人1的下策,故應被剔除:1不借(1,0)這時,“借”成為參與人1的下策,1不借(1,0)18參與人2的許諾是不可信的。所謂不可信的許諾,就是指一旦采取該策略,給他本人帶來的收益并非最大的策略參與人2的許諾是不可信的。所謂不可信的許諾,19例3:開金礦(三階段)在有完善的法律制度的條件下,參與人1可以在參與人而不信守承諾的情況下選擇與其打官司,這樣就變成了一個三階段博弈。這時參與人1是否應相信2的承諾?例3:開金礦(三階段)在有完善的法律制度的條件下,2012分借不借不分(2,2)(0,4)(1,0)1不打打(1,0)12分借不借不分(2,2)(0,4)(1,0)1不打打(1,2112分借不借不分(2,2)(1,0)1打(1,0)在參與人2不信守承諾的情況下,不打官司是參與人1的下策故應被剔除12分借不借不分(2,2)(1,0)1打(1,0)在參與人222由于參與人1必定會選擇打官司,故不分是參與人2的下策因此被剔除12分借不借(2,2)(1,0)由于參與人1必定會選擇打官司,12分借不借(2,2)(1,023在這種情況下,參與人1知道參與人2必定會其起平分收益,不借則變成了他的下策,剔除之。12分借(2,2)在這種情況下,參與人1知道參與人212分借(2,2)24在法律制度建立后,參與人2的許諾變?yōu)榭尚旁诜山∪珪r,既可保障社會公平,又可提高社會經(jīng)濟活動效率。在法律制度建立后,25所謂可信的許諾(威脅),就是指一旦采取該策略,給他本人帶來的收益一定最大的策略所謂可信的許諾(威脅),26三、子博弈和逆推歸納法
(一)子博弈:從一個博弈的某個階段開始的能夠自成一個博弈的后續(xù)階段。它必須有一個初始信息集,具備進行博弈的需要的各種信息。三、子博弈和逆推歸納法
(一)子博弈:27(二)逆推歸納法:從動態(tài)博弈的最后一個階段或最后一個子博弈開始,逐步倒推以求解動態(tài)博弈的方法。(二)逆推歸納法:從動態(tài)博弈的最后一個階段28四、子博弈精煉納什均衡如果動態(tài)博弈中各參與人的策略在動態(tài)博弈本身和所有子博弈中都構成一個納什均衡,則稱該策略組合為一個子博弈精煉納什均衡。四、子博弈精煉納什均衡如果動態(tài)博弈中各參與人29例4.討價還價博弈(三階段)設兩人就如何分割1萬元進行談判,規(guī)則如下:首先由1提出一個分割比例S1,2可以接受也可以拒絕,如果2拒絕,則提一個分割比例S2,這時1可以接受,也可以拒絕,如果拒絕,則出價S則2必須接受例4.討價還價博弈(三階段)設兩人就如何分割1萬元進行談判,30假設每經(jīng)過一輪要有一定的折扣,折扣因子為。的大小與談判者的耐心,通貨膨脹以及資金的時間價值等有關。假設每經(jīng)過一輪要有一定的折扣,。的大小與談判者的耐心,3112接受出S1不接受出S2(S1,1-S1)(δ2S,δ2(1-S))(δS2,δ(1-S2))1接受不接受出S解:展開表示為12接受出S1不接受出S2(S1,1-S1)(δ2S,δ2(32應用逆推歸納法。第三階段:1出S,2必須接受,因此S=112接受出S1不接受出S2(S1,1-S1)(δ2,0)(δS2,δ(1-S2))1接受不接受出S=1應用逆推歸納法。12接受出S1不接受出S2(S1,1-S1)33第二階段:2知道在第三階段1必出S=1,因此,為了避免這一情況的出現(xiàn),自己出的S2(即1的所得)應滿足:第二階段:2知道在第三階段34這時博弈樹變?yōu)?2接受出S1不接受出S2=δ(S1,1-S1)(δ2,
δ(1-δ))1接受這時博弈樹變?yōu)?2接受出S1不接受出S2=δ(S1,1-S35第一階段,如果1的出價S1滿足1-S1≥δ(1-δ)即S1≤1-δ+δ2則2不會拒絕第一階段,如果1的出價S1滿足36因此,1的最優(yōu)出價S1=1-δ+δ2這時S1=1-δ+δ2>δ2避免進入下一段談判,雙方獲得的收益均達到最大。¥因此,1的最優(yōu)出價3712接受出S1=1-δ+δ2(1-δ+δ2,δ-δ2)最終的博弈路徑(子博弈精煉納什均衡)為12接受出S1=1-δ+δ2(1-δ+δ2,δ-δ2)最終的38例5.求下列四階段動態(tài)博弈的子博弈精煉納什均衡。例5.求下列四階段動態(tài)博弈3912cabd(4,3)(3,6)(5,3)1h(8,5)1efg(2,4)12cabd(4,3)(3,6)(5,3)1h(8,5)1e40第三節(jié)有同時選擇的動態(tài)博弈一、特征:在博弈的某些階段,有多個參與者同時進行決策第三節(jié)有同時選擇的動態(tài)博弈一、特征:4111222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)(2,-2)(-2,2)(-2,2)(2,-2)例1
D
11222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)42當博弈進行到第三階段時,1,2必須同時作了決策,(或者說,每個參與人在決策時,并不知道對方作出了什么選擇)。這樣在第三階段構成了一個策略(靜態(tài))博弈(二人零和博弈)。當博弈進行到第三階段時,1,2必須同時作了決策,43這一策略(靜態(tài))博弈的收益矩陣為:參與人1參與人2LˊRˊDˊ-2,22,-2Vˊ2,-2-2,2這一策略(靜態(tài))博弈的收益矩陣為:參與人2LˊRˊDˊ-244這個策略(靜態(tài))博弈有唯一的一個混合策略納什均衡:((1/2,1/2),(1/2,1/2)),其帶給雙方的期望收益(0,0)這樣這個博弈可以簡化為這個策略(靜態(tài))博弈有唯一的4512VRL(2,2)(3,1)D(0,0)12VRL(2,2)(3,1)D(0,0)46繼續(xù)運用逆推歸納法,易求得子博弈精煉納什均衡為12L(3,1)D繼續(xù)運用逆推歸納法,12L(3,1)D47二、求解方法(一)按逆推歸納法的思路進行求解。(二)對同時選擇構成策略(靜態(tài))博弈的階段,分別應用策略(靜態(tài))博弈求解法求解(三)將求解結果分別代入原博弈簡化,再按逆推歸納法求解。二、求解方法(一)按逆推歸納法的思路進行求解。48例2,銀行擠兌兩客戶在銀行各存100元,銀行將這200元投資于一個長期項目,如果在項目到期前抽回資金,則只能收回140元(記為日期1),如果到期后(日期2)再收回投資,則可回收本利280元。例2,銀行擠兌兩客戶在銀行各存100元,銀行49客戶抽回存款的日期也是這兩種,這一博弈可擴展表示如下:客戶抽回存款的日期也是這兩種,5011222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽不抽不抽(140,100)(100,140)(100,100)(40,100)(100,40)(70,70)11222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽51解:應用逆向歸納法的思想求解。在日期2(即第二階段),兩客戶決策構成了一個策略(靜態(tài))博弈,其正規(guī)型表示如下21抽不抽抽140,140140,100不抽100,140100,100日期2解:應用逆向歸納法的思想求解。21抽不抽抽140,1401452顯然,這一策略(靜態(tài))博弈有唯一的納什均衡為(抽,抽),其收益分別為140,140。將這一結果代入原博弈,可簡化為:顯然,這一策略(靜態(tài))博弈有唯一的5312不抽2抽抽抽不抽(40,100)(100,40)(70,70)(140,140)12不抽2抽抽抽不抽(40,100)(100,40)(70,54它又構成了一個策略(靜態(tài))博弈其正規(guī)型表示如下21抽不抽概率抽70,70100,140P不抽40,100140,1401-P概率r1-r日期1它又構成了一個策略(靜態(tài))博弈21抽不抽概率抽70,701055這一博弈有兩個純策略納什均衡(抽,抽)和(不抽,不抽),還有一個混合策略納什衡,即各以4/7的概率在第1日期抽回資金。
這一博弈有兩個純策略納什均衡56結果分析:1.當信用環(huán)境非常好的情況下,客戶的選擇是在第1日期“不抽”,在第二日期“抽回”,雙方獲利最大(140,140)結果分析:1.當信用環(huán)境非常好的情況下,572.當信用環(huán)境非常不好的情況下,客戶的選擇是在第1日期“抽”,在雙方獲利最小(70,70)2.當信用環(huán)境非常不好的情況下,583.當信用環(huán)境一般的情況下,客戶數(shù)量很大時,將有4/7的客戶在第1日期抽回資金?;蛘哒f,客戶將抽回4/7的資金3.當信用環(huán)境一般的情況下,59例3,關稅與不完全國際競爭設有兩個國家1,2,分別有兩上企業(yè)(分別記為企業(yè)1,企業(yè)2),企業(yè)1,2生產(chǎn)既內(nèi)銷又出口的相互競爭商品,確定國家1,2的關稅策略和企業(yè)1,2的產(chǎn)量策略。例3,關稅與不完全國際競爭60例3,關稅與不完全國際競爭設有兩個國家1,2,分別有兩上企業(yè)(分別記為企業(yè)1,企業(yè)2),企業(yè)1,2生產(chǎn)既內(nèi)銷又出口的相互競爭商品,確定國家1,2的關稅策略和企業(yè)1,2的產(chǎn)量策略。例3,關稅與不完全國際競爭設有兩個國家1,2,分別有兩上企業(yè)61設Qi為國家i的市場商品總量,反需求函數(shù)Pi=a-Qi,企業(yè)i生產(chǎn)hi個單位供內(nèi)銷,ei單位供出口,因此Qi=hi+ej(i≠j)單位成本為常數(shù)C,國家i的關稅率為ti設Qi為國家i的市場商品總量,反需求函數(shù)Pi=a-Qi,企業(yè)62設設首先由兩國政府同時制定關稅率ti,企業(yè)1、2根據(jù)t1,t2同時決定各自內(nèi)銷和出口的產(chǎn)量(h1,e1)和(h2,e2)。設設首先由兩國政府同時制定關稅率ti,63解:企業(yè)以利潤最大化為目標,利潤函數(shù)為解:企業(yè)以利潤最大化為目標,64第十一講廣延型博弈與反向歸納策略65國家以社會福利最大化為目標,包括消費者剩余,本國企業(yè)的利潤和國家關稅三部分,社會福利函數(shù)為:國家以社會福利最大化66第十一講廣延型博弈與反向歸納策略67應用逆時歸納法來分析此博弈先從第二階段開始,可設t1,t2已定,求maxлi的解應用逆時歸納法來分析此博弈68第十一講廣延型博弈與反向歸納策略69第十一講廣延型博弈與反向歸納策略70再回到第一階段兩國之間的博弈。將上述結果分別代入wi得再回到第一階段兩國之間的博弈。71第十一講廣延型博弈與反向歸納策略72即兩國的最佳關稅選擇為將這一結果代入得即兩國的最佳關稅選擇為將這一結果代入得73第十一講廣延型博弈與反向歸納策略廣延型博弈適合于分析動態(tài)博弈過程,其強調(diào)的重點在行動的時序性,以及參與人決定策略時所擁有的信息集。第一節(jié)廣延型博弈的定義與形式一、廣延型博弈的定義信息完美(perfectinformation),是指每一個參與人在其作決策時,對于以前所發(fā)生的事件具有完全的信息。
第十一講廣延型博弈與反向歸納策略廣延型博弈適合于分析動態(tài)74廣延型博弈構成要素(1)決策點與決策分枝的結構,在初始決策點與最終結局點之間不存在任何閉環(huán)(closedloops);(2)清楚地指明什么決策點屬于哪一個參與人;(3)在自然決策點上選擇的概率是公共知識;(4)參與人作決策時所依據(jù)的信息集;信息集把參與人在某一時刻的所有決策點分成若干類;(5)在博弈的終極點上每一個參與人的收益廣延型博弈構成要素(1)決策點與決策分枝的結構,在初始決策點75二、廣延型博弈的形式廣延型博弈是以“決策樹”或“博弈樹”的形式來表達的。二、廣延型博弈的形式廣延型博弈是以“決策樹”或“博弈樹”的76122(2,0)(2,-1)(1,0)(3,1)LRMNMN122(2,0)(2,-1)(1,0)(3,1)LRMNMN77三、廣延型博弈的規(guī)則第一,初始點沒有一條箭頭指向它;對其他所有箭頭,都只有一條箭頭指向它。第二,如果我們從某一點向初始點返回,我們就不可能再通過迂回的途徑回這一點,我們只能按反向逐次返回原點。
三、廣延型博弈的規(guī)則第一,初始點沒有一條箭頭指向它;對其他78第二節(jié)完美信息廣延(動態(tài))博弈一、特征。(一)決策有先后順序(二)關于博弈進程的信息是不對稱的后決策者擁有更多信息。第二節(jié)完美信息廣延(動態(tài))博弈79(三)具有完美信息:即參與人決策時完全了解之前的博弈過程的信息。(四)動態(tài)博弈至少有兩個階段;階段:參與者在某一時點進行的一次決策。(三)具有完美信息:80二、可信性:先決策者對后決策者行為的信任性。即先決策者是否相信后決策者是否采取有利的(許諾)或不利的(威脅)行為。二、可信性:先決策者對后決策者行為的信任性。81例1:父女博弈。女兒交了一個父親不喜歡的男友,父親威脅說:“你如果不斷絕與他的關系,我與你斷絕關系。”女兒是否相信父親的威脅?這一博弈可如下表示:例1:父女博弈。女兒交了一個父親不喜歡的男友,82女兒父親斷絕交往不交往不斷絕(1,-1)(2,1)(0,1)女兒父親斷絕交往不交往不斷絕(1,-1)(2,1)(0,1)83作為女兒,知道父親斷絕與女兒的關系損失是非常大的,因此,對父親來講,即使女兒不聽話,“斷絕”是下策,應被剔除掉:作為女兒,知道父親斷絕與女兒的關系84女兒父親交往不交往不斷絕(2,1)(0,1)女兒父親交往不交往不斷絕(2,1)(0,1)85聰明的女兒在看到父親的威脅不可信時,一定不會選擇“不交往”女兒父親交往不斷絕(2,1)聰明的女兒在看到父親的威脅不可信時,女兒父親交往不斷絕(2,86父親的威脅是不可信的。因此,所謂不可信的威脅,就是指一旦采取該策略,給他本人帶來的收益并非最大的策略父親的威脅是不可信的。因此,所謂不可信的威脅,87例2:開金礦(二階段):參與人2欲開采一價值4萬元的金礦,但缺乏1萬資金,參與人1恰擁有一萬元資金。參與人2對參與人1說:“如果你把錢借給我,我與你平分開金礦所得?!眳⑴c人1是否應相信2把錢借給他?例2:開金礦(二階段):參與人2欲開采一價值4萬元的金礦,8812分借不借不分(2,2)(0,4)(1,0)12分借不借不分(2,2)(0,4)(1,0)89在參與人借的資金開發(fā)金礦后,平分所得是其下策,故應被剔除:12借不借不分(0,4)(1,0)在參與人借的資金開發(fā)金礦后,12借不借不分(0,4)(1,090這時,“借”成為參與人1的下策,故應被剔除:1不借(1,0)這時,“借”成為參與人1的下策,1不借(1,0)91參與人2的許諾是不可信的。所謂不可信的許諾,就是指一旦采取該策略,給他本人帶來的收益并非最大的策略參與人2的許諾是不可信的。所謂不可信的許諾,92例3:開金礦(三階段)在有完善的法律制度的條件下,參與人1可以在參與人而不信守承諾的情況下選擇與其打官司,這樣就變成了一個三階段博弈。這時參與人1是否應相信2的承諾?例3:開金礦(三階段)在有完善的法律制度的條件下,9312分借不借不分(2,2)(0,4)(1,0)1不打打(1,0)12分借不借不分(2,2)(0,4)(1,0)1不打打(1,9412分借不借不分(2,2)(1,0)1打(1,0)在參與人2不信守承諾的情況下,不打官司是參與人1的下策故應被剔除12分借不借不分(2,2)(1,0)1打(1,0)在參與人295由于參與人1必定會選擇打官司,故不分是參與人2的下策因此被剔除12分借不借(2,2)(1,0)由于參與人1必定會選擇打官司,12分借不借(2,2)(1,096在這種情況下,參與人1知道參與人2必定會其起平分收益,不借則變成了他的下策,剔除之。12分借(2,2)在這種情況下,參與人1知道參與人212分借(2,2)97在法律制度建立后,參與人2的許諾變?yōu)榭尚旁诜山∪珪r,既可保障社會公平,又可提高社會經(jīng)濟活動效率。在法律制度建立后,98所謂可信的許諾(威脅),就是指一旦采取該策略,給他本人帶來的收益一定最大的策略所謂可信的許諾(威脅),99三、子博弈和逆推歸納法
(一)子博弈:從一個博弈的某個階段開始的能夠自成一個博弈的后續(xù)階段。它必須有一個初始信息集,具備進行博弈的需要的各種信息。三、子博弈和逆推歸納法
(一)子博弈:100(二)逆推歸納法:從動態(tài)博弈的最后一個階段或最后一個子博弈開始,逐步倒推以求解動態(tài)博弈的方法。(二)逆推歸納法:從動態(tài)博弈的最后一個階段101四、子博弈精煉納什均衡如果動態(tài)博弈中各參與人的策略在動態(tài)博弈本身和所有子博弈中都構成一個納什均衡,則稱該策略組合為一個子博弈精煉納什均衡。四、子博弈精煉納什均衡如果動態(tài)博弈中各參與人102例4.討價還價博弈(三階段)設兩人就如何分割1萬元進行談判,規(guī)則如下:首先由1提出一個分割比例S1,2可以接受也可以拒絕,如果2拒絕,則提一個分割比例S2,這時1可以接受,也可以拒絕,如果拒絕,則出價S則2必須接受例4.討價還價博弈(三階段)設兩人就如何分割1萬元進行談判,103假設每經(jīng)過一輪要有一定的折扣,折扣因子為。的大小與談判者的耐心,通貨膨脹以及資金的時間價值等有關。假設每經(jīng)過一輪要有一定的折扣,。的大小與談判者的耐心,10412接受出S1不接受出S2(S1,1-S1)(δ2S,δ2(1-S))(δS2,δ(1-S2))1接受不接受出S解:展開表示為12接受出S1不接受出S2(S1,1-S1)(δ2S,δ2(105應用逆推歸納法。第三階段:1出S,2必須接受,因此S=112接受出S1不接受出S2(S1,1-S1)(δ2,0)(δS2,δ(1-S2))1接受不接受出S=1應用逆推歸納法。12接受出S1不接受出S2(S1,1-S1)106第二階段:2知道在第三階段1必出S=1,因此,為了避免這一情況的出現(xiàn),自己出的S2(即1的所得)應滿足:第二階段:2知道在第三階段107這時博弈樹變?yōu)?2接受出S1不接受出S2=δ(S1,1-S1)(δ2,
δ(1-δ))1接受這時博弈樹變?yōu)?2接受出S1不接受出S2=δ(S1,1-S108第一階段,如果1的出價S1滿足1-S1≥δ(1-δ)即S1≤1-δ+δ2則2不會拒絕第一階段,如果1的出價S1滿足109因此,1的最優(yōu)出價S1=1-δ+δ2這時S1=1-δ+δ2>δ2避免進入下一段談判,雙方獲得的收益均達到最大。¥因此,1的最優(yōu)出價11012接受出S1=1-δ+δ2(1-δ+δ2,δ-δ2)最終的博弈路徑(子博弈精煉納什均衡)為12接受出S1=1-δ+δ2(1-δ+δ2,δ-δ2)最終的111例5.求下列四階段動態(tài)博弈的子博弈精煉納什均衡。例5.求下列四階段動態(tài)博弈11212cabd(4,3)(3,6)(5,3)1h(8,5)1efg(2,4)12cabd(4,3)(3,6)(5,3)1h(8,5)1e113第三節(jié)有同時選擇的動態(tài)博弈一、特征:在博弈的某些階段,有多個參與者同時進行決策第三節(jié)有同時選擇的動態(tài)博弈一、特征:11411222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)(2,-2)(-2,2)(-2,2)(2,-2)例1
D
11222VRLVˊDˊRˊLˊRˊLˊ(2,2)(3,1)115當博弈進行到第三階段時,1,2必須同時作了決策,(或者說,每個參與人在決策時,并不知道對方作出了什么選擇)。這樣在第三階段構成了一個策略(靜態(tài))博弈(二人零和博弈)。當博弈進行到第三階段時,1,2必須同時作了決策,116這一策略(靜態(tài))博弈的收益矩陣為:參與人1參與人2LˊRˊDˊ-2,22,-2Vˊ2,-2-2,2這一策略(靜態(tài))博弈的收益矩陣為:參與人2LˊRˊDˊ-2117這個策略(靜態(tài))博弈有唯一的一個混合策略納什均衡:((1/2,1/2),(1/2,1/2)),其帶給雙方的期望收益(0,0)這樣這個博弈可以簡化為這個策略(靜態(tài))博弈有唯一的11812VRL(2,2)(3,1)D(0,0)12VRL(2,2)(3,1)D(0,0)119繼續(xù)運用逆推歸納法,易求得子博弈精煉納什均衡為12L(3,1)D繼續(xù)運用逆推歸納法,12L(3,1)D120二、求解方法(一)按逆推歸納法的思路進行求解。(二)對同時選擇構成策略(靜態(tài))博弈的階段,分別應用策略(靜態(tài))博弈求解法求解(三)將求解結果分別代入原博弈簡化,再按逆推歸納法求解。二、求解方法(一)按逆推歸納法的思路進行求解。121例2,銀行擠兌兩客戶在銀行各存100元,銀行將這200元投資于一個長期項目,如果在項目到期前抽回資金,則只能收回140元(記為日期1),如果到期后(日期2)再收回投資,則可回收本利280元。例2,銀行擠兌兩客戶在銀行各存100元,銀行122客戶抽回存款的日期也是這兩種,這一博弈可擴展表示如下:客戶抽回存款的日期也是這兩種,12311222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽不抽不抽(140,100)(100,140)(100,100)(40,100)(100,40)(70,70)11222不抽抽ˊ(140,140)2抽抽抽抽抽不抽不抽不抽124解:應用逆向歸納法的思想求解。在日期2(即第二階段),兩客戶決策構成了一個策略(靜態(tài))博弈,其正規(guī)型表示如下21抽不抽抽140,140140,100不抽100,140100,100日期2解:應用逆向歸納法的思想求解。21抽不抽抽140,14014125顯然,這一策略(靜態(tài))博弈有唯一的納什均衡為(抽,抽),其收益分別為140,140。將這一結果代入原博弈,可簡化為:顯然,這一策略(靜態(tài))博弈有唯一的12612不抽2抽抽抽不抽(40,100)(100,40)(70,70)(140,140)12不抽2抽抽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中考語文一輪復習:應用文 練習題(含答案)
- 電梯清洗抱閘施工方案
- 2025年中考語文寫作復習:備考作文主題《山花爛漫時》演繹張桂梅的“燃燈精神”
- 石材露臺改造施工方案
- 市政防滑路面施工方案
- 2025年法律援助測試題及答案
- 低介電常數(shù)聚酰亞胺
- 4年級下冊英語手抄報1到5單元
- 4-庚氧基-1-丁醇用途
- 鋼塑門施工方案
- JIT標準作業(yè)作業(yè)指導書
- 土壤固化土施工技術導則
- VAR模型Johansen協(xié)整檢驗在eviews中的具體操作步驟及結果解釋
- 冷凍面團項目市場分析
- 混凝土面板堆石壩接縫止水
- 加油站法律法規(guī)符合性評價
- 5外科--丹毒下肢丹毒中醫(yī)診療方案2017年版
- 錨索錨桿計算表格(含下滑力及錨桿錨索受力及伸長值計算)
- 數(shù)學物理方法第十一章PPT課件
- (完整版)漢字偏旁部首名稱表最新(精華版)
- 學位論文:基于Flowmaster的4H發(fā)動機熱管理系統(tǒng)的計算
評論
0/150
提交評論