講義3管理博弈論_第1頁
講義3管理博弈論_第2頁
講義3管理博弈論_第3頁
講義3管理博弈論_第4頁
講義3管理博弈論_第5頁
已閱讀5頁,還剩116頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、管理博弈論(ManagementManagement Game TheoryGame Theory)主講人:張成科 博士廣東工業(yè)大學經(jīng)濟與貿(mào)易學院第第3 3講講 完全信息動態(tài)博弈完全信息動態(tài)博弈第三章 完全信息動態(tài)搏弈 子博弈精煉納什均衡n一 博弈擴展式表述n二 子博弈精練納什均衡n三 應用舉例博弈的戰(zhàn)略表述案例- 房地產(chǎn)開發(fā)項目-假設有A、B兩家開發(fā)商市場需求:可能大,也可能小投入:1億v假定市場上有兩棟樓出售:需求大時,每棟售價1.4億,需求小時,售價7千萬;v如果市場上只有一棟樓需求大時,可賣1.8億需求小時,可賣1.1億博弈戰(zhàn)略表述4 4,4 48 8,0 00 0,8 80 0,0

2、0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3-3,-3-31 1,0 00 0,1 10 0,0 0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求小的情況需求大的情況需求大的情況博弈的戰(zhàn)略式表述 博弈的戰(zhàn)略表述小結n博弈的戰(zhàn)略式表述包括三個要素:參與人集合每個參與人的戰(zhàn)略集合由戰(zhàn)略組合決定的每個參與人的支付一 博弈擴展式表述例:市場進入阻撓博弈設進入成本為10。戰(zhàn)略式表示擴展式表示進入者進入不進入(0,300)在位者市場進入阻撓博弈樹不可置信威脅合作(40,50)斗爭(-10,0)在位方B進入方A默許斗爭進入(40, 50)(-10, 0)不進(0, 300)(0, 300)A開發(fā)不開發(fā)N

3、N大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動順序參與人的行動空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開發(fā)博弈結,決策結結,終點結枝結,初始結 信息集ABBBBNN5 . 0小5 . 0小5 . 0大5 . 0大開不開開開開開不開不開不開不開44,08 ,33 ,00,ABNN5 . 0小5 . 0小5 . 0大5 . 0大開不開開開開開不開不開不開不開44,08,33 ,00,AAA房地產(chǎn)開發(fā)博弈擴展式表示的

4、等價形式一 博弈擴展式表述的基本要素博弈的基本構造l結: 包括決策結和終點結兩類;決策結是參與人行動的始點,終點結是決策人行動的終點.結滿足傳遞性和非對稱性x之前的所有結的集合,稱為x的前列集P(x),x之后的所有結的集合稱為x的后續(xù)集T(x)。l枝: 枝是從一個決策結到它的直接后續(xù)結的連線,每一個枝代表參與人的一個行動選擇.l信息集: 每個信息集是決策結集合的一個子集,該子集包括所有滿足下列條件的決策結:1 每個決策結都是同一個參與人的決策結;2 該參與人知道博弈進入該集合的某個決策結,同時知道自己究竟處于哪一個決策結.A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不

5、開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在決策時不確切地知道自然的選擇; B的決策結由4個變?yōu)?個房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時決策) 房地產(chǎn)開發(fā)博弈一 博弈擴展式表述自然人的決策結總是假定是單結的,因為自然在參與人決策之后行動等價于自然在參與人之前行動但參與人不能觀測到自然的行動。n不同的博弈樹可以代表相同的博

6、弈,但是有一個基本規(guī)則:一個參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結之前。囚徒困境博弈的擴展式表述AB坦白抵賴BBAA坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0) (-1,-1)坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10) (-10,0)(-1,-1)囚徒困境博弈的擴展式表述5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈智豬博弈的擴展式表述?第三章 完全信息動態(tài)搏弈-子博弈精煉納什均衡n一 博弈擴展式表述n二 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏

7、弈精練納什均衡的存在問題n三 應用舉例講解目錄導航澤爾騰(1965)關于完全信息動態(tài)博弈模型直接引用納什均衡的困惑問題n考慮下列問題:一個博弈可能有多個(甚至無窮多個)納什均衡,究竟哪個更合理?納什均衡假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動有先有后,后行動者的選擇空間依賴于前行動者的選擇,前行動者在選擇時不可能不考慮自己的行動對后行動者的影響。子博弈精練納什均衡的一個重要改進是將“合理納什均衡”與“不合理納什均衡”分開。動態(tài)博弈中戰(zhàn)略的表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定

8、參與人在什么情況下選擇什么行動,是參與人它規(guī)定參與人在什么情況下選擇什么行動,是參與人的的“相機行動方案相機行動方案”。12iiiinisiSsinnssssssi表示第 個參與人的特定戰(zhàn)略所有代表第 個參與人所有可選擇的戰(zhàn)略集合如果 個參與人每人選擇一個戰(zhàn)略,維向量( , , , ,)稱為一個戰(zhàn)略組合表示第 個人選擇的戰(zhàn)略在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。作為一種行動規(guī)則,戰(zhàn)略必須是完備的。動態(tài)博弈戰(zhàn)略的表述足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(0,0)(0,0)(2,1)xx男的戰(zhàn)略:足球,芭蕾女方:選擇足球?還是選擇芭蕾?女方戰(zhàn)略:足球,芭蕾,芭蕾,足球芭蕾,芭蕾,足球,足球1、追隨

9、策略:他選擇什么,我就選擇什么2、對抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不管他選什么,我都選芭蕾;4、足球策略:不管他選什么,我都選足球。戰(zhàn)略即:如果他選擇什么,我就怎樣行動的相機行動方案。在擴展式博弈里,參與人是相機行事,即“等待”博弈到達一個自己的信息集(包含一個或多個決策結后,再采取行動方案。o什么是動態(tài)博弈的戰(zhàn)略?房地產(chǎn)博弈擴展式表述中的戰(zhàn)略n若A先行動,B在知道A的行動后行動,則A有一個信息集,兩個可選擇的行動,戰(zhàn)略空間為:(:(開發(fā),不開發(fā))開發(fā),不開發(fā));nB有兩個信息集,四個可選擇的行動,B有四個純戰(zhàn)略:開發(fā)策略:不論開發(fā)策略:不論A A開發(fā)不開發(fā),我開發(fā);開發(fā)不開

10、發(fā),我開發(fā);追隨策略:追隨策略:A A開發(fā)我開發(fā),開發(fā)我開發(fā),A A不開發(fā)我不開發(fā);不開發(fā)我不開發(fā);對抗策略:對抗策略:A A開發(fā)我不開發(fā),開發(fā)我不開發(fā),A A不開發(fā)我開發(fā);不開發(fā)我開發(fā);不開發(fā)策略不開發(fā)策略: :不論不論A A開發(fā)不開發(fā)我不開發(fā)開發(fā)不開發(fā)我不開發(fā). .n簡寫為:簡寫為:n(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開(不開發(fā),開發(fā)),(不開發(fā),不開發(fā)),發(fā)),括號內(nèi)的第一個元素對應A選擇“開發(fā)”時B的選擇,第二個元素對應A選擇“不開發(fā)”時B的選擇。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不

11、開發(fā)xx什么是參與人什么是參與人的戰(zhàn)略?的戰(zhàn)略?擴展式擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商開發(fā)商B B開發(fā)商開發(fā)商A A戰(zhàn)略式戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx納什均衡與均衡結果:納什均衡與均衡結果:存在三個純戰(zhàn)略納什均衡:存在三個純戰(zhàn)略納什均衡: ( (不開發(fā),(開發(fā),開發(fā)),不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā))兩個均衡結果:兩個均衡結果

12、: (A A開發(fā),開發(fā),B B不開發(fā))不開發(fā)) (A A不開發(fā),不開發(fā),B B開發(fā))開發(fā))注意:均衡不同于均衡結果注意:均衡不同于均衡結果擴展式擴展式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx路徑路徑在擴展式博弈中,所有在擴展式博弈中,所有n n個參與人個參與人的一個純戰(zhàn)略組合決定了博弈樹的一個純戰(zhàn)略組合決定了博弈樹上的一個路徑。上的一個路徑。(開發(fā),(開發(fā), 不開發(fā),開發(fā)不開發(fā),開發(fā) )決定)決定了博弈的路徑為了博弈的路徑為A A開發(fā)開發(fā)B B不不開發(fā)開發(fā)-(1 1,0 0)(不開發(fā),(不開發(fā), 開發(fā),開發(fā)開發(fā),開發(fā) )決定)決定了路徑:?了路徑:?

13、房地產(chǎn)開發(fā)博弈的戰(zhàn)略組合路徑完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n戰(zhàn)略是參與人行動規(guī)則的完備描述,它要告訴參與人在每一種可預見的情況下(即每一個決策結)上選擇什么行動,即使這種情況實際上沒有發(fā)生(甚至參與人并不預期它會發(fā)生)。n因此,只有當一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個合理的可置信的戰(zhàn)略,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動規(guī)則。擴展式擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商開發(fā)商B B開發(fā)商開發(fā)商

14、A A戰(zhàn)略式戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx存在三個純戰(zhàn)略納什均衡:存在三個純戰(zhàn)略納什均衡: ( (不開發(fā),(開發(fā),開發(fā)),不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā))哪個納什均衡更合理?哪個納什均衡更合理?開發(fā),(開發(fā),不開發(fā))哪個納什均衡更合理?納什均衡更合理?不可置信的威脅戰(zhàn)略A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)( (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)不開發(fā),(開發(fā),開發(fā)),(開發(fā)

15、,(不開發(fā),開發(fā)),(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā))xx 對于對于( (不開發(fā),(開發(fā),開發(fā)),不開發(fā),(開發(fā),開發(fā)),這個組合之所以構成納什均衡,是因這個組合之所以構成納什均衡,是因為為B B威脅不論威脅不論A A開發(fā)還是不開發(fā),他都開發(fā)還是不開發(fā),他都將選擇開發(fā),將選擇開發(fā),A A相信了相信了B B的威脅,不開的威脅,不開發(fā)是最優(yōu)選擇,但是發(fā)是最優(yōu)選擇,但是A A為什么要相信為什么要相信B B的威脅呢?的威脅呢? 畢竟,如果畢竟,如果A A真開發(fā),真開發(fā),B B選擇開發(fā)選擇開發(fā)得得-3-3,不開發(fā)得,不開發(fā)得0 0,所以,所以B B的最優(yōu)選擇的最優(yōu)選擇是不開發(fā)。如果是不開發(fā)

16、。如果A A知道知道B B是理性的,是理性的,A A將選擇開發(fā),逼迫將選擇開發(fā),逼迫B B選擇不開發(fā)。自選擇不開發(fā)。自己得己得1 1,B B得得0 0,即納什均衡,即納什均衡( (不開發(fā),不開發(fā),(開發(fā),開發(fā))是不可置信的。因(開發(fā),開發(fā))是不可置信的。因為它依賴于為它依賴于B B的一個不可置信的威脅。的一個不可置信的威脅。擴展式擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商開發(fā)商B B開發(fā)商開發(fā)商A A戰(zhàn)略式戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)x

17、x考慮:考慮: 不開發(fā),(開發(fā),開發(fā))不開發(fā),(開發(fā),開發(fā)) 之所以構成之所以構成NashNash均衡,是因為均衡,是因為B B威脅威脅不論不論A A選擇什么,他都將選擇開發(fā)。選擇什么,他都將選擇開發(fā)。若若A A相信,則不開發(fā)是最優(yōu)選擇;相信,則不開發(fā)是最優(yōu)選擇;若給定若給定A A選擇不開發(fā),選擇不開發(fā),B B選擇開發(fā)是選擇開發(fā)是最優(yōu)的。最優(yōu)的。A為什么要相信?為什么要相信?不開發(fā),(開發(fā),開發(fā))戰(zhàn)略組合包含有不可置信的威脅戰(zhàn)略不可置信的威脅戰(zhàn)略擴展式擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商

18、開發(fā)商B B開發(fā)商開發(fā)商A A戰(zhàn)略式戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx考慮:考慮: 開發(fā),(不開發(fā),不開發(fā))開發(fā),(不開發(fā),不開發(fā)) 之所以構成之所以構成NashNash均衡,是因為若均衡,是因為若A A選擇選擇開發(fā),則開發(fā),則B B選擇不開發(fā)是最優(yōu)選擇;若選擇不開發(fā)是最優(yōu)選擇;若給定給定B B選擇不開發(fā),則選擇不開發(fā),則A A選擇開發(fā)是最選擇開發(fā)是最優(yōu)的。優(yōu)的。盡管結果看起來是合理的,但戰(zhàn)略組盡管結果看起來是合理的,但戰(zhàn)略組合包含有不合理的戰(zhàn)略。當合包含有不合理的戰(zhàn)略。當A選擇不開選擇不開發(fā)時,發(fā)時,B為什么還要選擇不開發(fā)?為什么還要選

19、擇不開發(fā)?開發(fā),(不開發(fā),不開發(fā))戰(zhàn)略組合包含有不可置信的戰(zhàn)略不可置信(不合理)的戰(zhàn)略擴展式擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商開發(fā)商B B開發(fā)商開發(fā)商A A戰(zhàn)略式戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx考慮:考慮: 開發(fā),(不開發(fā),開發(fā),(不開發(fā),開發(fā))開發(fā)) 首先,它是首先,它是Nash均衡。均衡。其次,它在每條路徑都是其次,它在每條路徑都是合理的。合理的。開發(fā),(不開發(fā),開發(fā))是唯一合理的戰(zhàn)略組合改進的Nash均衡唯一合理的戰(zhàn)略組合

20、完全信息動態(tài)博弈-子博弈精練納什均衡(舉例)澤爾騰(1965)進入者進入不進入(0,300)在位者合作(40,50)斗爭(-10,0)市場進入阻撓博弈樹特點:剔除博弈中包含的不可置信威脅。 承諾行動-破釜沉舟-背水一戰(zhàn)v給定進入者進入,剔除(進入,斗爭),(進入,默許)是唯一的子博弈精練納什均衡。不可置信威脅支付函數(shù)行動子博弈精煉納什均衡-不可置信威脅例子n美國普林斯頓大學古爾教授在1997年的經(jīng)濟學透視里發(fā)表文章,提出一個例子說明威脅的可信性問題:n兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關起來。關起來比沒有玩

21、具更可怕?,F(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,因此哥哥對弟弟的警告置之不理。n的確,如果弟弟是會算計自己利益的理性人,在這樣的環(huán)境下,還是的確,如果弟弟是會算計自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢?,理性人弟弟的告狀威脅是不可置信的。不告狀的好??梢?,理性人弟弟的告狀威脅是不可置信的。子博弈精煉納什均衡-可置信威脅例子 曹操與袁紹的倉亭之戰(zhàn),曹操召集將領來獻破袁之策,程昱獻了十面埋伏之計,他讓曹

22、操退軍河上,誘袁前來追擊,到那時“我軍無退路,必將死戰(zhàn),可退袁矣”。 曹操采納此計,令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。二 子博弈精練納什均衡n一個納什均衡稱為精練納什均衡,當只當參與人的戰(zhàn)略在每個子博弈中都構成納什均衡,也就是說,組成精練納什均衡的戰(zhàn)略必須在每一個子博弈中都是最優(yōu)的。n一個精練納什均衡首先必須是一個納什均衡,但納什均衡不一定是精練納什均衡。n承諾行動-當事人使自己的威脅戰(zhàn)略變得可置信的行動。澤爾騰通過引入子博弈概念來剔除不可置信戰(zhàn)略n澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均

23、衡中剔除,從而給出動態(tài)博弈的一個合理的預測結果,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。關于子博弈n什么是子博弈?n什么是子博弈精練納什均衡?n有沒有更好的方法找到子博弈精練納什均衡?關于子博弈以及子博弈精練納什均衡n子博弈:是原博弈的一部分,它本身也可以作為一個獨立的博弈進行分析:(1)子博弈必須從一個單結信息點開始:只有決策者在原博弈中確切地知道博弈進入一個特定的決策結時,該決策結才能作為一個子博弈的初始結。如果信息集包含兩個以上的決策結,則這兩個都不可以作為子博弈的初始結(見下頁)。(2)子博弈的信息集和支付向量都直接繼承自原博弈,即當x和x在原博弈中屬

24、于同一信息集時,他們在子博弈中才屬于同一信息集。n習慣上,任何博弈的本身稱為自身的一個子博弈。A開發(fā)不開發(fā)XX大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 參與人X的信息集不能開始一個子博弈,否則的話,參與人B的信息將被切割。子博弈例子1子博弈的例子2不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx不開發(fā)開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II房地產(chǎn)開發(fā)博弈A坦白抵賴BB坦白抵賴坦白(-8,-8)(0

25、,-10)(-10,0) (-1,-1)找出房地產(chǎn)開發(fā)博弈的子博弈找出房地產(chǎn)開發(fā)博弈的子博弈( (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā))子博弈精練納什均衡的定義n子博弈精練納什均衡: 擴展式博弈的戰(zhàn)略組合是一個子博弈精練納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個子博弈上給出納什均衡。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II(不開發(fā),

26、(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))在c上構成均衡,在b上不構成; 在b和c上都構成 在c上構成均衡,在b上不構成不開發(fā) 判斷下列均衡結果哪個構成子博弈精練納什均衡?不開發(fā)bc按定義判斷子博弈精練納什均衡的例子關于子博弈精練納什均衡的有關注意事項n如果一個博弈有幾個子博弈,一個特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”,博弈樹上的其他路徑稱為“非均衡路徑”。n納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結上是最優(yōu)的;n而構成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結上也是最優(yōu)的。這是納什均衡與子博弈精練納

27、什均衡的實質(zhì)區(qū)別。子博弈精練Nash均衡的特點可見,一個戰(zhàn)略組合是子博弈精練Nash均衡,當且僅當它在每一個子博弈上都構成一個Nash均衡。(1) 本身是一個Nash均衡(即整個博弈是唯一子博弈時,但反之不成立);(2) 要求戰(zhàn)略組合不僅在均衡路徑上是最優(yōu)的,而且在非均衡路徑的決策結上也是最優(yōu)的(即此戰(zhàn)略組合要告訴博弈人在每一種可預見的情況下(即使此種情況并沒有發(fā)生或不預期它發(fā)生)的最優(yōu)選擇)。而Nash均衡僅要求在均衡路徑上是最優(yōu)的;(3) 滿足“序貫性原理”:不論過去發(fā)生了什么,博弈人應該在博弈的每一個時點上最優(yōu)化自己的決策;(4) 能排除一般Nash均衡戰(zhàn)略中不可信威脅或承諾,因而是穩(wěn)定

28、的。n一 博弈擴展式表述n二 子博弈精練納什均衡擴展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題n三 應用舉例講解目錄導航用逆向歸納法求-子博弈精練納什均衡1UDL(3,1)(0,0)22,2R 給定博弈達到最后一個決策給定博弈達到最后一個決策結,該決策結上行動的參與人有結,該決策結上行動的參與人有一個最優(yōu)選擇,這個最優(yōu)選擇即一個最優(yōu)選擇,這個最優(yōu)選擇即該決策結開始的子博弈的納什均該決策結開始的子博弈的納什均衡衡 倒數(shù)第二個決策結,找倒數(shù)倒數(shù)第二個決策結,找倒數(shù)第二個的最優(yōu)選擇,這個最優(yōu)選第二個的最優(yōu)

29、選擇,這個最優(yōu)選擇與我們在第一步找到的最優(yōu)選擇與我們在第一步找到的最優(yōu)選擇構成一個納什均衡。擇構成一個納什均衡。 如此重復直到初始結。每一步都得到對應于子博弈的一個納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈的納什均衡,這個過程的最后一步得到整個博弈的納什均衡完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)n用逆向歸納法求子博弈精練納什均衡 對于有限完美信息博弈,逆向歸納法求解子博弈精練納什均衡是一個最簡便的方法。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)開發(fā)博弈逆向歸納法求解例子例 用逆向歸納法求解如下三階段完美信息動態(tài)博弈UD12

30、1UDLR0, 21, 10, 32, 0R12UDL0, 21, 10, 31UD0, 21, 1在階段2博弈人1選U在階段2博弈人2選L博弈人1選U子博弈精練Nash均衡為: LUUS,*完全信息動態(tài)博弈-子博弈精練納什均衡澤爾騰(1965)1UDL(1,1)22,0RU(3,0)(0,2)2D 子博弈精練納什均衡(U,U),L). U和L分別是參與人1和參與人2在非均衡路徑上的選擇。 逆向歸納法求解子博弈精練納什均衡的過程,實質(zhì)上是重復剔除劣戰(zhàn)略的過程:從最后一個決策結依次剔除每個子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構成精練納什均衡。在不完美信息中的應用逆向歸納法的推理思想對不完美信息動態(tài)

31、博弈也適用2, 2博弈人1選DUD121UDLR1, 32, 22, 2R12UDL2, 21, 30, 01UD2, 21, 3簡化為在階段2博弈人2選L22LR LR2, 22, 2博弈人2博弈人1(2, -2) (-2, 2)(-2, 2) (2, -2)UDLR相當于關于逆向歸納法的說明n用逆向歸納法求解的子博弈精練納什均衡也要求“所有的參與人是理性的”是共同知識。n如果博弈由多個階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。逆向歸納法的問題與子搏弈精練納什均衡的存在問題1.逆向歸納法的局限性(1)只能分析明確設定的擴展式博弈問題(要求博弈的順序、規(guī)則和支付情況都非常清楚,并

32、且各博弈人了解博弈結構,相互知道對方了解博弈結構);(2)不能分析比較復雜的有限問題(如下象棋博弈)和復雜的無限博弈問題;(3)對博弈方的理性要求太高。2.子博弈精練Nash均衡存在的問題 (1)多人多階段博弈可能并不非常令人信服;n一 博弈擴展式表述n二 擴展式表述博弈的納什均衡n三 子博弈精練納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題多個參與人的情況蜈蚣博弈n四 重復博弈和無名氏定理n五 應用舉例逆向歸納法與子搏弈精練納什均衡的存在問題逆向歸納法與子搏弈精練納什均衡的存在問題多個參與人理性要求高 逆向歸納法

33、要求“所有參與人是理性的”是所有參與人的共同知識。因此,在有多個參與人有多個參與人或每個參與人有每個參與人有多次行動機會多次行動機會的情況下,逆向歸納法的結果可能并非如此。如果如果n很小,逆向很小,逆向歸納法的結果歸納法的結果1, 1DA21,21DADAnn1,1DA11,11iiDA12i1in2, 2ii1,1理性將受到懷疑的多人多階段動態(tài)博弈問題設有n個博弈人,參與人in或者選擇D結束博弈,各得支付1/i,或者選擇A進入下一個參與人I+1的決策。如果前n-1個參與人都選A而進入?yún)⑴c人n的決策結,參與人n選擇A,則各得支付2,選D則各得支付1/n ,此時不管選A或D,博弈都將結束。逆向歸

34、納法與子搏弈精練納什均衡的存在問題n如果n很大,結果又如何呢?1D(1,1)2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多個參與人的情況多個參與人的情況(2,2)如果如果n很大很大 對于參與人1,獲得2單位支付前提是所有n-1個參與人都選A,否則就要考慮是否應該選擇D以保證1的支付。如果給定一個參與人選擇A的概率是p0時結果為x=12,如果1=2=1(即雙方都有無限的耐心)那么當T=1,3,5,時結果為x=1;當T=2,4,6,時結果為x=0(后動優(yōu)勢)定定 理理 (Rubinstein,1982), 在無限期討價還價博弈在無限期討價還價博弈 中中, 唯一的子博弈完

35、美唯一的子博弈完美Nash均衡的結果是均衡的結果是: x*=(12)/(112)( 如果如果1=2=,x*=1/(1+)無限期討價還價的子博弈完美Nash均衡的結果決定于參與人的貼現(xiàn)因子(耐心程度)證明:T=+,博弈無最后階段,但參與人1出價的任何一個階段開始的子博弈等價于從t=1開始的整個博弈,我們可以應用有限階段逆向歸納法尋找子博弈完美均衡.假定t3,1出價,1能得到的最大份額是M,對1而言t期的M等價于t1期的1M,故2知道在t-1期的任何x21M的出價將被1所接受,因此2出價x2=1M,自得11M;又對2而言t1期的11M等價于t2期的2(11M),故1可在t2期出價x1=12(11M

36、),因為從t2期能得到的最大份額一定與從t期開始的博弈完全相同,故我們有: x1=M=12(11M)解得 M=(12)/112),且結果是唯的.委托委托-代理代理(Principle-Agents)理論理論1.無不確定性的情形無不確定性的情形122(0,0)委托委托 不委托不委托接受接受 拒絕拒絕努力努力 偷懶偷懶(0,0)(12,2) (7,1)2.有不確定性但可監(jiān)督的情形有不確定性但可監(jiān)督的情形12NN2委托委托 不委托不委托接受接受 拒絕拒絕努力努力 偷懶偷懶高產(chǎn)高產(chǎn) 低產(chǎn)低產(chǎn) 高產(chǎn)高產(chǎn) 低產(chǎn)低產(chǎn)0.9 0.1 0.1 0.9(0,0)(0,0)(16,2) (6,2) (18,1) (

37、8,1)銀行擠兌模型銀行擠兌模型:設兩個投資者各具某銀行存款設兩個投資者各具某銀行存款D,銀行將銀行將這兩筆存款用于一長期項目這兩筆存款用于一長期項目,如果在項目到期之前銀如果在項目到期之前銀行被迫抽回資金行被迫抽回資金,僅可挽回僅可挽回2r,其中其中DrD/2,若銀行若銀行同意到期后再收回同意到期后再收回,連本帶利將得到連本帶利將得到2R(RD)。122122Y NY N Y NY N Y N Y N(r,r) (D,2rD) (2rD,D)(R,R) (2RD,D) (D,2RD) (R,R)Y:提取提取; N:不提不提日期日期1為投資到期之前為投資到期之前;日期日期2為之后為之后可信性問

38、題的進一步討論開金礦博弈乙甲不分分借不借22,40,01,甲要開采一價值4萬元的金礦,缺1萬元資金,向乙借。甲向乙承諾:開到金礦后與乙對半分成。此承諾是不可信的,博弈的結果為:乙不借,雙方得益為(1,0)乙威脅:若甲不分,他將打官司。是否可信?結果又如何?乙甲不分分借不借22,40,01,不打打01,乙可信威脅乙甲不分分借不借22,40,01,不打打01,乙不可信威脅開金礦博弈的結論與啟示在一個由都有私心、都更重視自身利益的成員組成的社會中,完善公正的法律制度不但能保障社會的公平,而且還能提高社會經(jīng)濟活動的效率,是實現(xiàn)最有效率的社會分工合作的重要保障。反之,則相反。在動態(tài)博弈分析中,相機選擇現(xiàn)

39、象導致的可信性問題是一個核心問題。2. 靜態(tài)博弈Nash均衡分析應用在動態(tài)博弈中導致的問題1)Nash均衡有可能有多個,究竟哪一個更為合理,沒有一般性結論。2)Nash均衡假定每個博弈人在選擇自己的最優(yōu)戰(zhàn)略時,所有其他博弈人的戰(zhàn)略選擇是給定的,這在靜態(tài)博弈中沒有問題(因同時選擇),但在動態(tài)博弈中就有行為選擇的可信性問題。故必須對Nash均衡的定義加以改進:子博弈精練Nash均衡??尚判詥栴}的進一步討論:要脅訴訟博弈問題例. 要脅訴訟博弈問題原告P決定是否要指控被告D以及被告如何應對訴訟?設指控成本為c0,原告要求被告支付s0。原告P的起訴成本為p(包括律師費用),被告的辯護成本為d;如果起訴到

40、法庭,原告以 的概率贏得x單位的支付。解:先討論何時原告提出指控或不指控?PDscs ,PP0, 0不指控指控拒絕接受s要求起訴不起訴0, cdxcpx,PDscs ,PP0, 0不指控指控拒絕接受s要求(1)當 時,由逆向歸納法知,原博弈簡化為:px D選“拒絕”PP0, 0不指控指控0, cP選“不指控”因此,原告的因此,原告的“起訴起訴”威脅是威脅是不可信的!不可信的!何時可信?只有當 時,才可能“指控”并要挾“起訴”,問題是怎樣才能可信?(2)當 時,原告將指控。 為了認清這點,假定原告在指控前將訴訟費P支付給律師。則原博弈的最后階段為:px pcdx2PPdxpcx,起訴放棄0, p

41、cDPdxpcx,拒絕接受scs ,因為 ,所以P的最優(yōu)選擇為“起訴”;由逆向歸納法推會前一個決策結點的子博弈為:只要則D的最優(yōu)選擇是“接受”賠償要求s,顯然 問題是S=?pcpcxdxssdx即不指控)(否則Ppcs因為只要 ,則原告P將希望私了,因此是私了的賠償區(qū)域。xs,dxxs第三章 完全信息動態(tài)搏弈 -重復博弈n重復博弈的基本概念n有限次重復博弈n無限次重復博弈第三章 完全信息動態(tài)搏弈 -重復博弈n重復博弈要研究的問題? 當博弈只進行一次時,每個參與人只關心一次性支付;但如果博弈重復多次,參與人是否會為了長遠利益而犧牲眼前利益從而選擇不同的均衡戰(zhàn)略? 或者說,將重復進行T次的博弈看成

42、為T階段的完全信息動態(tài)博弈,然后用子博弈精練Nash均衡方法求解,所得到的子博弈精練Nash均衡戰(zhàn)略是否會與單一階段的博弈所規(guī)定的Nash均衡戰(zhàn)略不同?重復博弈n一次動態(tài)博弈也稱為“序貫博弈”。n重復博弈:指同樣結構的博弈重復多次,其中的每次博弈稱為“階段博弈”。如囚徒困境。n重復博弈的特征:1、階段博弈之間沒有“物質(zhì)上”的聯(lián)系,即前一階段的博弈不改變后一階段的結構 ;2、所有參與人都觀測到博弈過去的歷史;3、參與人的總支付是所有階段博弈支付的貼現(xiàn)值之和或加權平均均值。貼現(xiàn)因子: 下一期的一單位支付在這一期的價值。注意:在每個階段,參與人可同時行動,也可不同時行動。重復博弈 因為其他參與人過去

43、的歷史總是可以觀測到的,因此,一個參與人可以使自己在某個階段博弈的選擇依賴于其他參與人過去的行動歷史,因此,參與人在重復博弈中的戰(zhàn)略空間遠遠大于和復雜于每一階段的戰(zhàn)略空間,這意味著,重復博弈可能帶來一些“額外”的均衡結果。 影響重復博弈均衡結果的主要因素是博弈重復的次數(shù)和信息的完備性。 博弈重復的次數(shù)的重要性來源于參與人在短期利益和長遠利益之間的權衡。 信息的完備性:當一個參與人的支付函數(shù)不為其他參與人知道時,該參與人可能有積極性建立一個“好”的聲譽以換取長遠利益。重復博弈的基本概念1 定義及分類定義及分類 所謂重復博弈,是指同樣結構的博弈重復多次。其中的每次博弈稱為一個階段或稱階段博弈。l重

44、復次數(shù)有限時,稱為有限次重復博弈,記為G(T),T為重復進行的次數(shù)。l無限次重復博弈記為l隨機結束重復博弈。一般地,重復博弈就是指在每個周期中,參與人 面對的是同樣的博弈,經(jīng)典的重復博弈是指每 個周期有相同的參與人集合、相同的策略空 間以及相同的得益函數(shù)的重復博弈。( , )G重復博弈的基本概念2 戰(zhàn)略、子博弈和均衡路徑戰(zhàn)略、子博弈和均衡路徑n戰(zhàn)略:是在每個階段(即每次重復),針對每種情況(以前階段的結果)如何行為的完整計劃。n戰(zhàn)略組合:是由每個階段參與人的行為組合串聯(lián)而成。如果原博弈有m種戰(zhàn)略組合,則重復2次則有m2條博弈路徑。因此通常重復博弈的路徑數(shù)是很大的。重復博弈的基本概念3 重復博弈

45、的得益重復博弈的得益由于每個階段即是一次博弈,故參與人根據(jù)哪個得益選擇其行為就成了問題。若根據(jù)當前階段得益選擇,就等于把重復博弈割裂成了一個基本博弈,重復博弈就失去了意義。因此,重復博弈中參與人是根據(jù)整個過程總的得益情況而進行行為選擇的。TttTTuuuuu11322111tttu或為貼現(xiàn)系數(shù)其中r11總得益為:重復博弈的基本概念3 重復博弈的得益重復博弈的得益對無限次重復博弈而言,用貼現(xiàn)系數(shù) 折算現(xiàn)值的方法是必須的,因此也記為,GTu112tttnuuuuu平均得益 :有限次時:u無限次時:11)1 (tttuu一、有限次重復博弈的情形1 兩人零和博弈的有限次重復博弈兩人零和博弈的有限次重復

46、博弈n由于一方的得即為另一方的失,故他們雙方合作的可能性根本不存在,因此重復零和博弈不會創(chuàng)造出新的利益,每個參與人都是重復一次性博弈中的Nash均衡戰(zhàn)略。例如猜硬幣博弈,不管重復多少次,參與人都是以0.5的概率選擇正或反這唯一的混合Nash戰(zhàn)略。n這也可用逆向歸納法證明:略n以上結論可以推廣到非零和或多個博弈方,但博弈方的利益嚴格對立,沒有純戰(zhàn)略Nash均衡的其他嚴格競爭博弈中。一、有限次重復博弈的情形1 唯一純戰(zhàn)略唯一純戰(zhàn)略Nash均衡博弈的有限次重復博弈與連鎖店悖均衡博弈的有限次重復博弈與連鎖店悖n若原博弈的唯一Nash均衡本身是Pareto最佳戰(zhàn)略組合,則顯然有限次重復博弈不會改變參與人

47、的行為方式。n但在原博弈有唯一純戰(zhàn)略Nash均衡,而均衡本身不是Pareto最佳戰(zhàn)略組合的博弈(如囚徒困境博弈等)中,參與人的關系不是對立的、甚至是一致的,此種博弈重復進行多次,結果會怎樣?(1)有限次重復囚徒困境博弈假若重復兩次,即T=2。用逆向歸納法分析:第二階段:此時前一階段的結果已成為既成事實,此后又不再有后續(xù)階段。因此實現(xiàn)自身當前的最大利益是唯一選擇原則,這就成為原博弈,從而結果為(-8,-8)囚徒B囚徒A坦白抵賴坦白(-8, -8) (0, -10)抵賴(-10, 0)(-1, -1)第一階段:即第一次博弈。理性參與人在第一階段就預見第二階段的結果(坦白,坦白)=(-8,-8)。因

48、此,不管第一階段的博弈結果是什么,囚徒B囚徒A坦白抵賴坦白(-16, -16) (-8, -18)抵賴(-18, -8)(-9, -9)雙方在整個重復博弈中的最終得益為第一階段得益的基礎上各加上(-8),即第一階段來看,次重復博弈與右圖所示的一次性博弈等價。此博弈的Nash均衡為(坦白,坦白),即第一階段雙方的選擇與一次性博弈相同。同理可證:T=3,4,n的情形。有限重復博弈簡單地說就是階段博弈實施有限次(T次)。如我們考慮T2??紤]下列博弈:L RU 1,1 5,0D 0,5 4,412一一、有限次重復博弈情形 它有一個Nash 均衡(U,L),假設博弈進行兩次, 兩階段重復博弈中每個參與人

49、的得益相當于 各個階段得益之和(或者平均數(shù)),考慮到貼現(xiàn) 因子,再一次借助于逆向歸納法, 第二階段 唯一的Nash均衡為(U,L),得益向量為(1,1),所 得的貼現(xiàn)值為(,),由此在第一階段相當于 博弈:L R U 1+,1+ 5+,D ,5+ 4+,4+12 該博弈有唯一的Nash均衡(U,L),因此我們得到唯一的子博弈完美Nash均衡:(U,L),(U,L) 定 義 令G=S1,S2,Sn;u1,u2,un,G重復T次, 稱G為T階段博弈,G(T)表示實施了T次的重復 博弈。 在某次階段博弈之前,所有已采取過的前面 階 段的行動都可以觀測到,參與人在G(T) 中的 得益簡單地來自T個階段

50、博弈得益的貼現(xiàn)值之 和。另外G(T)的得 益也可以定義為T個階段博 弈的貼現(xiàn)值的平均,它與貼現(xiàn)值之和僅相差常數(shù)因子1/(1+ + ), 并不影響子博 弈完美的結局。 定定 理理 如果階段博弈G有唯一的Nash均衡,那么對任意有限次重復博弈G(T)有唯一的子博弈精練Nash均衡結局:在 每一階段取G的Nash均衡策略。 2 T有限次重復博弈和無名氏定理n有限次重復博弈連鎖店悖論進入者進入不進入在位者默許斗爭默許(-10,0)(0,300)(0,300)(40,50)xx在位者斗爭 假定同樣的市場上有20個(可以理解為在位者有20個連鎖店),進入者每次進入一個市場,博弈就變成了20次重復博弈。 假

51、定進入者進入第1個市場,在位者應該如何反應呢?有限次重復博弈和無名氏定理n一次博弈的納什均衡是(進入,默許)。n假定博弈共進行20次,結果會如何?n為什么會出現(xiàn)這個結果?n倒推論證法 假定現(xiàn)在是第二十次,結果和一次博弈一樣。第十九次,即倒數(shù)第二次,局中人已經(jīng)很清楚,最后一次博弈對方肯定要實行低價,因此,現(xiàn)在如何對他施行好心都不會在下一次得到好報,所以,理性人的“我”沒有理由實施高價使對方獲益。依次類推。3,36,11,65,5高價企業(yè)乙企業(yè)甲低價高價低價價格大戰(zhàn)中的囚徒困境價格大戰(zhàn)中的囚徒困境 連鎖店悖論連鎖店悖論(Selten)進入者進入者在位者在位者不進入不進入 進入進入默許默許 斗爭斗爭

52、(0,300)(40,50) (-10,0)策略式默許默許 斗爭斗爭進入進入 40,50 -10,0不進入不進入 0,300 0,300在位者在位者進入者進入者Nash均衡為(進入,默許)和(不進入,斗爭)但后者不是子博弈完美。 假定同樣的市場有20個(可以理解為在位者有20個聯(lián)鎖店), 進入者每次進人一個市場,博弈就成了20次的重復博弈。人們也許會猜想,盡管從一個市場看,在位者的最優(yōu)選擇是默許,但因為有20個市場要保護,為了防止進入者進入其他19個市場,應該選擇斗爭,但子博弈完美的結果為進入者在每一市場選擇進入,而在位者總是選擇默許。(5)有多個純戰(zhàn)略Nash均衡博弈的有限次重復博弈觸發(fā)戰(zhàn)略

53、(Trigger Strategy)初探例1 設兩廠商生產(chǎn)同質(zhì)商品,產(chǎn)品定價有高、中、低三種可能。市場總利潤分別為10、6、2個單位。兩廠商同時定價,相同時平分利潤,不同時,低價者獨享利潤。如右圖所示,有兩個純戰(zhàn)略Nash均衡:廠商廠商2廠商1HMLH (5, 5) (0, 6)(0, 2)M (6, 0) (3, 3)(0, 2)L(2, 0) (2, 0)(1, 1)(M,M)=(3,3);(L,L)=(1,1)而(H,H)不是Nash均衡。故一次博弈時效率低下。那么兩次重復博弈情況會如何呢?(H,H)是否會出現(xiàn)?確實存在子博弈精練Nash均衡,使第一階段出現(xiàn)(H,H)。此均衡戰(zhàn)略 如下:

54、廠商1:第一次選H;如第一次結果為(H,H),則第二次選M;如第一 次結果為任何其他戰(zhàn)略組合,則第二次選L. 廠商2:同廠商1。*S 例 三 價 博 弈 的 重 復 博 弈H M LH 5,5 0,6 0,2M 6,0 3,3 0,2L 2,0 2,0 1,1廠商廠商1廠商廠商2其中H表示高價,M表示中價L表示低價。該博弈有兩個Nash均衡: (M,M) 和(L,L)。 策略組合 : ( H,H) 對雙方最有利, 但不是Nash 均衡。兩次重復博弈情況會有變化嗎?12225,5) (0,6) (0,2) (6,6) (3,3) (0,3) (2,0) (2,0) (1,1)H M L H M

55、L H M L兩次重復博弈共有99=81種純策略組合(路徑),這時,子 博弈完美有多個,但重要的是:存在在第一階段取(H,H)的子博弈完美 雙方的策略是這樣的:博弈方1:第一次選H,如果第一次結果為(H,H),則第二次選擇M;如果第一次結果為其它任何組合,則第二次選L。(觸發(fā)策略)博弈方2的策略與博弈方1相同。在雙方的上述策略組合下,兩次重復博弈的路徑一定為第一階段(H,H),第二階段(M,M)。如果上述博弈是進行n次,仍可采用“觸發(fā)策略”實現(xiàn)比較好的結果。觸發(fā)策略在重復博弈的分析中有非常重要的作用,但上例中的觸發(fā)策略也存在可信性的問題,因為參與人在報復對方的偏離時,自己也會受到損失,故也可能

56、是未偏離的一方不計前嫌,在第二階段與對方共同采用M,這對他自己也是有利的。 實際上,觸發(fā)策略中的報復機制的可信性是一個很復雜的問題,會受到相互預期等很多復雜因素的影響。 H M LL 8 ,8 3, 9 3, 5M 9, 3 6, 6 1, 3L 5, 3 5, 3 4, 4 重復兩階段三價博弈的等價博弈:不可重復兩階段三價博弈的等價博弈:不可信報復,最佳選擇為信報復,最佳選擇為(M,M)。兩市場博弈的重復博弈在某些場合其他策略可能比觸發(fā)策略更有效,如兩個廠商同時面臨市場機會A和B,得益如下表:表中得益意味著市場A較大但開發(fā)程度很低,市場B較小但開發(fā)程度高,這個博弈的兩個純策略Nash均衡和一個混合策略的Nash均衡的結果都不很理想。如果該博弈重復兩次雙方會采用什么策略?這時有多種子博弈完美的均衡路徑,但雙方均采用“輪流策略”是比較好的。A 2 BA 3 , 3 1, 41B 4, 1 0, 0廠商廠商2廠商廠商1(1,4)(3,3)(2,2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論