博弈論3 完全且完美信息動態(tài)博弈_第1頁
博弈論3 完全且完美信息動態(tài)博弈_第2頁
博弈論3 完全且完美信息動態(tài)博弈_第3頁
博弈論3 完全且完美信息動態(tài)博弈_第4頁
博弈論3 完全且完美信息動態(tài)博弈_第5頁
已閱讀5頁,還剩154頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第三章第三章 完全且完美信息動態(tài)博弈完全且完美信息動態(tài)博弈所有博弈方都對博弈過程和得益完全了解的所有博弈方都對博弈過程和得益完全了解的完全且完美信息動態(tài)博弈完全且完美信息動態(tài)博弈。這類博弈也是現這類博弈也是現實中常見的基本博弈類型。由于動態(tài)博弈中實中常見的基本博弈類型。由于動態(tài)博弈中博弈方的選擇、行為有先后次序,因此在表博弈方的選擇、行為有先后次序,因此在表示方法、利益關系、分析方法和均衡概念等示方法、利益關系、分析方法和均衡概念等方面,都與靜態(tài)博弈有很大區(qū)別。方面,都與靜態(tài)博弈有很大區(qū)別。3.1 3.1 階段和擴展性表示階段和擴展性表示o階段:動態(tài)博弈中一個博弈方的一次選擇行為階段:動態(tài)博弈

2、中一個博弈方的一次選擇行為o 例例 1 1:仿冒和反仿冒博弈:仿冒和反仿冒博弈模型描述:略模型描述:略擴展式表示:擴展式表示:ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒例例2 2:市場進入阻撓:市場進入阻撓( (動態(tài)博弈動態(tài)博弈) )假設條件假設條件: : 企業(yè)企業(yè)A A、企業(yè)、企業(yè)B B經營同樣產品經營同樣產品 企業(yè)企業(yè)A A已占領市場已占領市場; ;企業(yè)企業(yè)B B想打進該市場想打進該市場 企業(yè)企業(yè)A A完全知道企業(yè)完全知道企業(yè)B B的行為的行為分析:分析: 企業(yè)企業(yè)A A與企業(yè)與企業(yè)B B對市場的占領有先有后,因對市場的占領有先

3、有后,因此該此該博弈又稱為:博弈又稱為:“先來后到先來后到 博弈博弈市場進入阻撓市場進入阻撓博弈的擴展形博弈的擴展形 Cont(0, 10) (-2, 3) (5, 5)打打進進 不進不進 打擊打擊 和平和平企業(yè)企業(yè)B企業(yè)企業(yè)A 圈圈B B與圈與圈A A分別是分別是企業(yè)企業(yè)B B與企業(yè)與企業(yè)A A的的決策結或選擇節(jié)決策結或選擇節(jié)點點 ( (又稱決策信又稱決策信息集或選擇信息息集或選擇信息集集), ), 即兩博弈方即兩博弈方各自輪到選擇各自輪到選擇的位置的位置. . o 博弈樹博弈樹n (1 1)結)結n (2 2)枝)枝n (3 3)信息集)信息集AABAAAB3.13.1.1.1動態(tài)博弈的表

4、示法和特點動態(tài)博弈的表示法和特點動態(tài)博弈動態(tài)博弈 (Dynamic Games)(Dynamic Games)的定義的定義: : 博弈方的策略選擇和行動有先后次序博弈方的策略選擇和行動有先后次序, ,而且后選擇、后行動的博弈方在自己而且后選擇、后行動的博弈方在自己選擇、行動之前選擇、行動之前, ,可以看到其他博弈方可以看到其他博弈方的選擇、行動的選擇、行動, ,甚至還包括自己的選擇、甚至還包括自己的選擇、行動的博弈行動的博弈. . 注:動態(tài)博弈各個博弈方的選擇行動有先后次序,注:動態(tài)博弈各個博弈方的選擇行動有先后次序,每個博弈方的選擇行為會形成依次相連的時間每個博弈方的選擇行為會形成依次相連的

5、時間階段,因此博弈方的一次選擇稱為一個階段,因此博弈方的一次選擇稱為一個“階階段段”。也有可能存在幾個博弈方同時選擇的情。也有可能存在幾個博弈方同時選擇的情況,這些博弈方的一次選擇也構成一個況,這些博弈方的一次選擇也構成一個“階階段段” ” 。一個動態(tài)博弈至少有兩個階段。因此態(tài)博弈又稱一個動態(tài)博弈至少有兩個階段。因此態(tài)博弈又稱為多階段博弈為多階段博弈(Multistage Games)(Multistage Games)3.1.2 3.1.2 動態(tài)博弈的基本特點動態(tài)博弈的基本特點一、動態(tài)博弈的策略一、動態(tài)博弈的策略1 1、完全信息靜態(tài)博弈的策略和結果(略)、完全信息靜態(tài)博弈的策略和結果(略)2

6、 2、動態(tài)博弈的策略特點:、動態(tài)博弈的策略特點:各博弈方的選擇和行為各博弈方的選擇和行為(1 1)行為有先后之分()行為有先后之分(2 2)博弈方要多次選擇且)博弈方要多次選擇且每次選擇有內在聯系,是不能分割的整體。每次選擇有內在聯系,是不能分割的整體。注:各博弈方在整個博弈中輪到選擇的每個階段,注:各博弈方在整個博弈中輪到選擇的每個階段,針對以及由不同博弈方的這種計劃構成的組合。針對以及由不同博弈方的這種計劃構成的組合。這種計劃就是動態(tài)博弈的博弈方的策略這種計劃就是動態(tài)博弈的博弈方的策略Cont.二、動態(tài)博弈的結果二、動態(tài)博弈的結果 指各博弈方在上面類型的策略構成的策略組合指各博弈方在上面類

7、型的策略構成的策略組合下,各博弈方的策略組合形成的一條聯結各個下,各博弈方的策略組合形成的一條聯結各個階段的階段的“路徑路徑”的結果。的結果。三、動態(tài)博弈的非對稱性三、動態(tài)博弈的非對稱性o 先后次序決定動態(tài)博弈必然是非對稱的。先后次序決定動態(tài)博弈必然是非對稱的。o 先選擇、行為的博弈方常常更有利,有先選擇、行為的博弈方常常更有利,有“先行先行優(yōu)勢優(yōu)勢”。3.2 3.2 可信性和納什均衡的問題可信性和納什均衡的問題3.2.1 3.2.1 相機選擇和策略中的可信性問題相機選擇和策略中的可信性問題3.2.2 3.2.2 納什均衡的問題納什均衡的問題3.2.3 3.2.3 逆推歸納法逆推歸納法3.2.

8、1 3.2.1 相機選擇和策略中的可信性問題相機選擇和策略中的可信性問題在實施中,只要符合自己的利益就可以在博弈在實施中,只要符合自己的利益就可以在博弈過程中改變計劃。過程中改變計劃。這種問題稱為這種問題稱為“相機選擇相機選擇”(Contingent play) “相機選擇相機選擇”的存在,使得博弈方在各個階段、的存在,使得博弈方在各個階段、各種情況下會采取行為的各種情況下會采取行為的“可信性可信性”產生懷產生懷疑?疑?一、開金礦博弈一、開金礦博弈I I的擴展形的擴展形模型描述:模型描述: 甲開采一甲開采一價值價值4 4億元的金礦億元的金礦時缺時缺1 1億元資金億元資金, ,乙有乙有1 1億元

9、可億元可投資資金。甲希望乙能投資自投資資金。甲希望乙能投資自己己1 1億億元資金用于開礦,元資金用于開礦,并許諾在采到金子后與乙對半分成并許諾在采到金子后與乙對半分成 問題:問題:乙是否該將錢投資給甲呢?乙是否該將錢投資給甲呢?乙甲(0,4)(2,2)(1,0)不投資投資分不分開金礦博弈二、有法律保障的開金礦博弈二、有法律保障的開金礦博弈II II的擴展形的擴展形 o 確實可信的威脅確實可信的威脅通過法律武器通過法律武器 確實可信的威脅確實可信的威脅 (credible threatcredible threat)是指,博弈的參與人通過是指,博弈的參與人通過某種行動改某種行動改變自己的支付函數

10、,變自己的支付函數,從而使得自己的從而使得自己的威脅顯得可信。參與人為改變博弈結威脅顯得可信。參與人為改變博弈結果而采取的措施稱為果而采取的措施稱為承諾承諾(commitmentcommitment) 不投資乙甲乙投資不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的開金礦博弈分錢打官司都可信乙的完整策略:第一階段乙的完整策略:第一階段選擇選擇“投資投資”,若第二階段甲若第二階段甲選擇選擇“不分不分”,第三階段選擇,第三階段選擇“打打”甲的完整策略:第二階段選擇甲的完整策略:第二階段選擇“分分”。動態(tài)博弈的解。動態(tài)博弈的解。三、法律保障不足的開金礦博弈三、法律保障不足的開金礦博弈

11、IIIIII的擴的擴展形展形 o 不可信的空頭威脅不可信的空頭威脅 乙在第三個階段乙在第三個階段 “打官司打官司”的威脅的威脅 是一種是一種不可信的不可信的 空頭威脅空頭威脅 (incredible (incredible empty threats)empty threats)乙甲乙打(2,2)不分分不投資投資(0,4)(-1,0)不打(1,0)法律保障不足的開金礦博弈分錢打官司都不可信3.2.2 3.2.2 納什均衡的問題納什均衡的問題博弈中(不投資博弈中(不投資- -不打,不打,不分)不分)和(投資和(投資- -打,分)打,分)都是納什均衡。都是納什均衡。但后者不可信,但后者不可信,不可

12、能實現或不可能實現或穩(wěn)定。穩(wěn)定。為什么會出現這種情為什么會出現這種情況呢?況呢?乙甲乙打(2,2)不分分不投資投資(0,4)(-1,0)不打(1,0)法律保障不足的開金礦博弈分錢打官司都不可信o 結論:納什均衡在動態(tài)博弈結論:納什均衡在動態(tài)博弈可能缺乏穩(wěn)定性,也就是說,可能缺乏穩(wěn)定性,也就是說,在完全信息靜態(tài)博弈中穩(wěn)定的納什均衡,在在完全信息靜態(tài)博弈中穩(wěn)定的納什均衡,在動態(tài)博弈中動態(tài)博弈中可能可能是不穩(wěn)定的,不能作為預是不穩(wěn)定的,不能作為預測的基礎。測的基礎。Cont.o 根源:納什均衡本身不能排除博弈方策略根源:納什均衡本身不能排除博弈方策略中包含的不可信的行為設定,不能解決動中包含的不可信

13、的行為設定,不能解決動態(tài)博弈的相機選擇引起的可信性問題態(tài)博弈的相機選擇引起的可信性問題3.2.3 3.2.3 逆推歸納法逆推歸納法定義定義:從動態(tài)博弈的最后:從動態(tài)博弈的最后一個階段博弈一個階段博弈方的行為開始分析,方的行為開始分析,逐步倒推回前一個逐步倒推回前一個階段相應博弈方的行為選擇,階段相應博弈方的行為選擇,一直到第一個階段的分析方法,一直到第一個階段的分析方法,稱為稱為“逆推歸納法逆推歸納法”乙甲(0,4)(2,2)(1,0)不投資投資分不分開金礦博弈邏輯基礎邏輯基礎:動態(tài)博弈中先行為的理性的博:動態(tài)博弈中先行為的理性的博弈方,在前面階段選擇行為時必然會考慮弈方,在前面階段選擇行為時

14、必然會考慮后行為博弈方在后面階段中將會怎樣選擇行為,后行為博弈方在后面階段中將會怎樣選擇行為,只有在博弈方的最后一個階段選擇的,不再只有在博弈方的最后一個階段選擇的,不再有后續(xù)階段牽制的博弈方,才能直接做出明有后續(xù)階段牽制的博弈方,才能直接做出明確選擇。確選擇。注:逆推歸納法是動態(tài)博弈分析最重要、注:逆推歸納法是動態(tài)博弈分析最重要、基本的方法基本的方法。3.3 3.3 子博弈和子博弈完美納什均衡子博弈和子博弈完美納什均衡3.3.1 3.3.1 子博弈子博弈3.3.2 3.3.2 子博弈完美納什均衡子博弈完美納什均衡3.3.1 3.3.1 子博弈子博弈定義定義:由一個動態(tài)博弈第一階段以外的:由一

15、個動態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構成某階段開始的后續(xù)博弈階段構成的,有初始信息集和進行博弈所的,有初始信息集和進行博弈所需要的全部信息,能夠自成一個需要的全部信息,能夠自成一個博弈的原博弈的一部分,稱為原博弈的原博弈的一部分,稱為原動態(tài)博弈的一個動態(tài)博弈的一個“子博弈子博弈”。注注: :(1)(1)并不是任何博弈都有子并不是任何博弈都有子博弈博弈(2)(2)博弈本身不是子博弈博弈本身不是子博弈(3 3)必須有一個明確必須有一個明確的初始的信息集的初始的信息集乙甲不投資投資不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2 3.3.2 子博弈完美納什均衡子博弈完美納什均

16、衡19651965年年seltonselton定義:如果一個完美信息的動態(tài)博弈中,定義:如果一個完美信息的動態(tài)博弈中,各博弈方的策略構成的一個策略組合各博弈方的策略構成的一個策略組合滿足,在整個動態(tài)博弈及它的所有子滿足,在整個動態(tài)博弈及它的所有子博弈中都構成納什均衡,那么這個策博弈中都構成納什均衡,那么這個策略組合稱為該動態(tài)博弈的一個略組合稱為該動態(tài)博弈的一個“子博子博弈完美納什均衡弈完美納什均衡”。o 子博弈完美納什均衡能夠排除均衡策略中子博弈完美納什均衡能夠排除均衡策略中不可信的威脅和承諾,因此是真正穩(wěn)定的。不可信的威脅和承諾,因此是真正穩(wěn)定的。o 逆推歸納法逆推歸納法是求完美信息動態(tài)博弈

17、子博弈是求完美信息動態(tài)博弈子博弈完美納什均衡的基本方法。完美納什均衡的基本方法。3.4 3.4 幾個經典動態(tài)博弈模型幾個經典動態(tài)博弈模型3.4.1 3.4.1 寡占的斯塔克博格寡占的斯塔克博格( (StackelbergStackelberg) )模型模型3.4.2 3.4.2 討價還價博弈討價還價博弈3.4.3 3.4.3 委托委托代理理論代理理論3.4.43.4.4委托委托代理理論(續(xù))代理理論(續(xù))3.4.1 3.4.1 寡占的斯塔克博格寡占的斯塔克博格( (StackelbergStackelberg) ) 模型模型假設市場上有兩個廠商,決策內容是產量,假設市場上有兩個廠商,決策內容是

18、產量,一個是領頭一個是領頭( (leader)leader)企業(yè),一個是跟隨企業(yè),一個是跟隨( (follower)follower)企業(yè)。領頭企業(yè)先選擇自己的企業(yè)。領頭企業(yè)先選擇自己的產量,跟隨企業(yè)根據領頭企業(yè)的產量選擇,產量,跟隨企業(yè)根據領頭企業(yè)的產量選擇,選擇自己的產量。選擇自己的產量。 顯然,他們選擇有先有后,所以是一個顯然,他們選擇有先有后,所以是一個動態(tài)博弈。動態(tài)博弈。斯塔克博格斯塔克博格( (StackelbergStackelberg) )模型模型 假設條件假設條件: :1.1. 在一個寡頭市場上兩企業(yè)生產銷售同質產品在一個寡頭市場上兩企業(yè)生產銷售同質產品, ,市場總產量市場總

19、產量Q Q = =q q1 1+ +q q2 2 , ,企業(yè)企業(yè)1 1是領頭是領頭( (leader)leader)企企業(yè)業(yè), , 企業(yè)企業(yè)2 2是追隨是追隨( (follower)follower)企業(yè)企業(yè). .2. 2. 市場出清價格市場出清價格 P P=8 - =8 - QQ3. 3. 生產無固定成本生產無固定成本, ,邊際成本邊際成本 c c= =c c1 1= =c c2 2=2=24. 4. 二企業(yè)先后決定各自的產量二企業(yè)先后決定各自的產量q q1 10, 0, q q2 2 0 0 問題:問題:兩個企業(yè)應如何決策?兩個企業(yè)應如何決策? 該動態(tài)的寡頭市場產量博弈是一無限策略動態(tài)該動

20、態(tài)的寡頭市場產量博弈是一無限策略動態(tài)博弈博弈StackelbergStackelberg模型分析模型分析企業(yè)企業(yè)1 1的得益的得益( (利潤利潤): ):u u 1 1 ( (q q1 1, , q q2 2) ) = =P Pq q1 1c c1 1q q1 1 = (8- = (8-QQ) ) q q1 1 - 2- 2q q1 1 = 6 = 6 q q1 1- - q q1 1 q q2 2- - q q1 12 2 企業(yè)企業(yè)2 2的得益的得益: :u u 2 2 ( (q q1 1, , q q2 2) ) = = P Pq q2 2 c c2 2q q2 2 = (8-= (8-Q

21、Q) ) q q2 2 - 2- 2q q2 2 = 6 = 6 q q2 2- - q q1 1 q q2 2- - q q2 22 2用逆推歸納法用逆推歸納法 求子博弈完美納什均衡求子博弈完美納什均衡 在第在第2 2個階段個階段, ,企業(yè)企業(yè)2 2是在企業(yè)是在企業(yè)1 1選擇定選擇定q q1 1下求解下求解: :max max q q2 2 u u 2 2 ( (q q1 1, , q q2 2) ) = max = max q q2 2 (6 (6 q q2 2- - q q1 1 q q2 2- - q q2 22 2) ) 一階條件:一階條件: 6- 6- q q1 1 - 2- 2q

22、 q2 2=0=0有有企業(yè)企業(yè)2 2對企業(yè)對企業(yè)1 1產量的反應函數產量的反應函數: :q q2 2= ( 6 - = ( 6 - q q1 1 ) /2 = 3 - ) /2 = 3 - q q1 1 /2 (1)/2 (1)Cont. 將式將式(1)(1)代入企業(yè)代入企業(yè)1 1的的得益函數的的得益函數u u 1 1 ( (q q1 1, , q q2 2) ) = 6 = 6 q q1 1- - q q1 1 q q2 2- -q q1 12 2 =3 =3 q q1 1 q q1 12 2 /2/2 max max q q1 1 (3 (3 q q1 1 q q1 12 2 /2) /2

23、) 一階條件:一階條件: 3 - 3 - q q1 1* *= 0= 0有有 q q1 1* *=3 (=3 (單位單位), ), q q2 2* *=3 - =3 - q q1 1* * /2 = 1.5 (/2 = 1.5 (單位單位), ), 使使 u u 1 1= 4.5 , = 4.5 , u u 2 2 = 2.25= 2.25使市場總產量使市場總產量 Q Q = =q q1 1+ +q q2 2=4.5, =4.5, 得二企業(yè)總得益得二企業(yè)總得益U U = = u u 1 1 + + u u 2 2 =4.5+2.25=6.75=4.5+2.25=6.75模型的均衡解模型的均衡解

24、 StackelbergStackelberg寡頭競爭模型的子博弈完美納什寡頭競爭模型的子博弈完美納什均衡解均衡解: : 企業(yè)企業(yè)1 1在第在第1 1個階段選擇產量個階段選擇產量q q1 1為為3 3 單位單位, , 企業(yè)企業(yè)2 2在第在第2 2個階段選擇產量個階段選擇產量q q2 2為為1.51.5單位單位 產量產量 得益得益廠商廠商1 3單位單位 4.5廠商廠商2 1.5單位單位 2.25先行優(yōu)勢信息的悖論信息的悖論 在在StackelbergStackelberg模型中企業(yè)模型中企業(yè)1 1與與2 2得益得益: :u u1 1= 4.5 = 4.5 u u2 2 = 2.25= 2.25

25、信息不對稱的博弈中信息不對稱的博弈中, ,信息較多的博弈方有可信息較多的博弈方有可能吃虧能吃虧 即是:盡管跟隨企業(yè)看到了領頭企業(yè)的決策,即是:盡管跟隨企業(yè)看到了領頭企業(yè)的決策,掌握了更多的信息,但最終收益反而低。掌握了更多的信息,但最終收益反而低。與與CournotCournot模型的比較模型的比較與與CournotCournot靜態(tài)博弈模型的比較靜態(tài)博弈模型的比較 QQs s=3+1.5=4.5 =3+1.5=4.5 QQc c=2+2=4=2+2=4P Ps s=8 - =8 - QQs s=3.5 =3.5 P Pc c=8 - =8 - QQc c=4 =4 U Us s= = u u

26、s s1 1 + + u us s2 2 =4.5+2.25=6.75=4.5+2.25=6.75 U Uc c= = u uc c1 1 + + u uc c2 2 =4 + 4 = 8=4 + 4 = 8文獻閱讀文獻閱讀 中國中國3G3G時代運營策略分析時代運營策略分析 供應鏈企業(yè)的競爭與合作供應鏈企業(yè)的競爭與合作 電力市場寡頭競爭模型的市場力分析比較電力市場寡頭競爭模型的市場力分析比較3.4.23.4.2討價還價與耐心討價還價與耐心BargainingBargaining問題的普遍性問題的普遍性o 幾乎所有的交易都涉及討價還價:幾乎所有的交易都涉及討價還價:o 買賣雙方之間;買賣雙方之間

27、;o 雇員與顧主之間;雇員與顧主之間;o 合伙人之間;合伙人之間;o 競爭企業(yè)之間競爭企業(yè)之間o 夫妻之間;夫妻之間;o 政治領域之間;政治領域之間;o 中央政府與地方政府;中央政府與地方政府;o 國家之間;國家之間;所有討價還價的共同之處所有討價還價的共同之處o 達成某種協議是當事人的共同利益,但他們之間在達成某種協議是當事人的共同利益,但他們之間在究竟達成哪一個協議的問題上存在利益沖突;協議究竟達成哪一個協議的問題上存在利益沖突;協議的多重行可能阻止任何協議的出現;的多重行可能阻止任何協議的出現;o 典型的典型的“合作與競爭合作與競爭”問題;問題;o 合作意味著存在著帕累托改進,但不同的當

28、事人偏合作意味著存在著帕累托改進,但不同的當事人偏好不同的帕累托狀態(tài)。好不同的帕累托狀態(tài)。o 不同與集體選擇(唯一均衡)和其他多重均衡;不同與集體選擇(唯一均衡)和其他多重均衡;o 不是零和博弈。不是零和博弈。兩種思路兩種思路o 合作博弈思路(合作博弈思路(cooperative game approach)cooperative game approach):參與人聯合作出決定,協議對雙方具有約束力;強參與人聯合作出決定,協議對雙方具有約束力;強調的是集體理性;調的是集體理性;o 非合作博弈思路非合作博弈思路(non-cooperative approach)(non-cooperative

29、 approach):每個參與人獨立決策,協議是一個納什均衡,沒有每個參與人獨立決策,協議是一個納什均衡,沒有約束力;強調的是個人理性;約束力;強調的是個人理性;o 注意:這里注意:這里“合作合作”與與“非合作非合作”指的是指的是“聯合決聯合決策策”(joint action)(joint action)和和“獨立決策獨立決策”(separate (separate action)action)。納什合作解納什合作解o 考慮一個畫家與拍賣商之間的討價還價問題:考慮一個畫家與拍賣商之間的討價還價問題:如果畫家自己出售畫,可得如果畫家自己出售畫,可得10001000元;如果元;如果拍賣商干其他事情

30、(如拍賣別人的畫),收拍賣商干其他事情(如拍賣別人的畫),收入是入是500500元;如果畫家委托拍賣商出售畫,元;如果畫家委托拍賣商出售畫,畫的價格是畫的價格是30003000元。元。o 他們之間如何分配這他們之間如何分配這30003000元?元?o 請同學們給出建議。請同學們給出建議。問題的一般化問題的一般化o 設想兩個人,設想兩個人,A A和和B B,之間要就總價值等于之間要就總價值等于V V的分配問題討價還價;如果他們之間能達成的分配問題討價還價;如果他們之間能達成協議,協議,V V按照協議規(guī)定分配;如果不能達成按照協議規(guī)定分配;如果不能達成協議,協議,A A得到得到a a,B B得到得

31、到b b。(a,b)(a,b)被被稱稱“威脅威脅點點”或非合作狀態(tài)(或非合作狀態(tài)(status quo),status quo),是不能達是不能達成協議是的最好選擇成協議是的最好選擇. .o a+bV; S=V-a-ba+bV; S=V-a-b是合作帶來的剩余是合作帶來的剩余(surplus)(surplus)分配規(guī)則分配規(guī)則o 我們用我們用x x表示表示A A得到的價值,得到的價值,y y表示表示B B得到的得到的價值,假定價值,假定A A和和B B分別從剩余價值分別從剩余價值S S中達到中達到h h和和k k的份額,那么:的份額,那么:o x=a+hx=a+h(V-a-bV-a-b););

32、x-a=hx-a=h(V-a-bV-a-b)o y=b+ky=b+k(V-a-bV-a-b););y-b=ky-b=k(V-a-bV-a-b)hkaxby分配方法之一分配方法之一:納什談判模型o 對對n2的多人談判問題,的多人談判問題,Nash-Harsanyi談判模型為:談判模型為:o 上述模型的解稱作上述模型的解稱作Nash平衡解。平衡解。 , 1max():,1,2,iniixiiiixcST xcin分配方法之二分配方法之二:等效用法等效用法(Kalai,1975) o 對一般的非規(guī)范化談判問題,設威脅點為對一般的非規(guī)范化談判問題,設威脅點為(Xc,Yc),談判集為,談判集為x=g(y

33、),談判集中甲、,談判集中甲、乙兩個談判者的最大效用分別是乙兩個談判者的最大效用分別是Xmax與與Yman,則,則maxmax()()ccccxxxxyyyyxgy協議點為方程組的解協議點為方程組的解 o 示例示例 用等效用法求解圖用等效用法求解圖13.2之(之(b)所示)所示的談判問題的談判問題u2u1B (0.5,0.5)11R1(a)u2u111R2(b)B (0.5,0.5)圖13.2 對公理四的質疑R1AAOOo 用有關數值代入可得用有關數值代入可得o 該方程組的解為該方程組的解為(2/3,1/3),它就是用,它就是用等效用法求得的協議點。等效用法求得的協議點。分配方法之三分配方法之

34、三: 中間中間中間法中間法o略固定談判成本固定談判成本o 談判的另一類成本是固定成本,如勞資談判談判的另一類成本是固定成本,如勞資談判拖延的話,企業(yè)可能要為客戶支付違約金。拖延的話,企業(yè)可能要為客戶支付違約金。o 這類似于蛋糕隨時間而變小。這類似于蛋糕隨時間而變小。談判成本不同談判成本不同o 如果如果A A每次談判成本是每次談判成本是c c,B B每次的談判成本每次的談判成本是是d d;o 如果如果c=dc=d,結果是不確定的;結果是不確定的;o 如果如果cd, Acdcd,B B 將得到整個蛋糕;將得到整個蛋糕;外部機會成本外部機會成本o 固定成本的一種特殊形式是外部機會損失:固定成本的一種

35、特殊形式是外部機會損失:如果談判期間,外部機會就不能利用。如果談判期間,外部機會就不能利用。o 此時,外部機會損失越大,對談判越不利;此時,外部機會損失越大,對談判越不利;o 考慮夫妻離婚談判??紤]夫妻離婚談判。信息與談判信息與談判o 原因是:我們前面假定當事人具有完全信息:原因是:我們前面假定當事人具有完全信息:知道價值知道價值V V和每個人的機會成本或談判砝碼,和每個人的機會成本或談判砝碼,每個人的耐心,談判的時限等等。并且,每每個人的耐心,談判的時限等等。并且,每個人知道每個人知道;每個人知道每個人知個人知道每個人知道;每個人知道每個人知道每個人知道,如此等等。道每個人知道,如此等等。o

36、 但在現實中,談判面臨的最大問題是信息不但在現實中,談判面臨的最大問題是信息不完全。完全。o 價值價值V V,生產成本,談判砝碼(生產成本,談判砝碼(a a,b b),),耐耐心,機會成本;心,機會成本;談判與信息談判與信息o 談判的過程實際上是信息揭示和窺探的過程;談判的過程實際上是信息揭示和窺探的過程;o Screening and SignalingScreening and Signalingo ( (沈陽的砍價公司)沈陽的砍價公司)o 由于信息不對稱,談判的結果并不總是帕累由于信息不對稱,談判的結果并不總是帕累托最優(yōu)的;事實上,許多帕累托改進沒有被托最優(yōu)的;事實上,許多帕累托改進沒有

37、被利用。利用。非合作博弈思路非合作博弈思路o 談判實際上是一個討價還價的過程,一個動談判實際上是一個討價還價的過程,一個動態(tài)博弈;態(tài)博弈;o 用非合作博弈的方法更合理;用非合作博弈的方法更合理;輪流出價談判輪流出價談判o 基本特征:兩人,基本特征:兩人,1 1和和2 2,分一塊錢;,分一塊錢;1 1先出先出價,價,2 2決定接受還是拒絕;如果接受,按照決定接受還是拒絕;如果接受,按照A A提出的方案分配,談判結束;如果提出的方案分配,談判結束;如果2 2拒絕,拒絕,2 2提出方案,提出方案,1 1決定接受還是拒絕;如果接受,決定接受還是拒絕;如果接受,按按2 2的方案分配,談判結束;如果不接受

38、,的方案分配,談判結束;如果不接受,再由再由1 1提出方案;如此等等。提出方案;如此等等。o 博弈有無窮多個納什均衡,但精煉納什均衡博弈有無窮多個納什均衡,但精煉納什均衡可能是唯一的??赡苁俏ㄒ坏?。變量說明變量說明o 我們先考慮沒有固定談判成本的情況;我們先考慮沒有固定談判成本的情況;o 假定假定n x x:1 1得到的份額;得到的份額;n y y:2 2得到的份額;得到的份額;x+y=1x+y=1n s s:1 1的無風險利率;的無風險利率; a=1/ a=1/(1+s1+s):1 1的貼現因子;的貼現因子;n r r:2 2的無風險利率;的無風險利率;n b=1/b=1/(1+r1+r):

39、2 2的貼現因子;的貼現因子;有限期談判有限期談判o 如果只有一次談判:逆向歸納意味著精煉納什如果只有一次談判:逆向歸納意味著精煉納什均衡是:均衡是:x=1x=1,y=0y=0;o 如果允許談判兩次:精煉納什均衡是:如果允許談判兩次:精煉納什均衡是:x=1-bx=1-b,y=by=b;如果貼現率不很大,就有后動優(yōu)勢;如果貼現率不很大,就有后動優(yōu)勢;o 如果談判三次,如果談判三次,PNEPNE是:是:n x=1-b(1-a), y=b(1-a);x=1-b(1-a), y=b(1-a);o 如果談判四次,如果談判四次,PNEPNE是:是:n x=1-b(1-a(1-b), y=b(1-a(1-b

40、) x=1-b(1-a(1-b), y=b(1-a(1-b) 一般結論一般結論o 如果兩人的貼現率都不是很高,也就是對未如果兩人的貼現率都不是很高,也就是對未來有足夠的耐心,談判有來有足夠的耐心,談判有“后動優(yōu)后動優(yōu)勢勢”(last-mover advantage)(last-mover advantage)(在奇數次談在奇數次談判,先動和后動是一個人)判,先動和后動是一個人); ;但這個優(yōu)勢隨但這個優(yōu)勢隨允許談判次數的增加而遞減;允許談判次數的增加而遞減;o 無論如何,一個人對未來越沒有耐心,得到無論如何,一個人對未來越沒有耐心,得到的越少:的越少:無限次談判無限次談判o 沒有最后一次,我們

41、不能用逆向歸納法求解,沒有最后一次,我們不能用逆向歸納法求解,但可以使用類似的思路得到均衡解(但可以使用類似的思路得到均衡解(x x,y y););o 假定在時間假定在時間t3t3時,時,1 1出價,得到出價,得到x x;時間時間t-1t-1時,時,2 2出價,給出價,給1 1為為axax就可以了就可以了,2,2給得到給得到y(tǒng)=1-axy=1-ax;時間時間t-2t-2時,時,1 1出價,給出價,給2 2為為b(1-ax)b(1-ax)就可以了,自己得到就可以了,自己得到x=1-b(1-ax)x=1-b(1-ax)精煉納什均衡解精煉納什均衡解ababyabbx1)1 ( ;11基本結論基本結論

42、o無限次談判具有無限次談判具有“先動優(yōu)勢先動優(yōu)勢”(first-(first-mover advantage);mover advantage);o一個人的耐心越大(貼現率越小),一個人的耐心越大(貼現率越?。?,談判中的優(yōu)勢就越大。談判中的優(yōu)勢就越大。如果如果B B先出價先出價abayabbax11 ;1)1 (3.4.2 3.4.2 討價還價博弈討價還價博弈o 三三回合討價還價博弈回合討價還價博弈Bargaining:Bargaining: 假設有甲乙兩假設有甲乙兩方方就如何分割就如何分割1000010000元進行元進行談判,并且定下規(guī)則:談判,并且定下規(guī)則: 由甲由甲方方先提出一個分割方案

43、,對此,乙先提出一個分割方案,對此,乙方方可以接受也可以接受也可以拒絕可以拒絕; ;如果乙如果乙方方拒絕,則乙拒絕,則乙方方自己提出另一個分自己提出另一個分割方案,讓甲割方案,讓甲方方選擇接受與否。如此循環(huán)。選擇接受與否。如此循環(huán)。 在循環(huán)過程中,只要有任何一方接受對方的方案在循環(huán)過程中,只要有任何一方接受對方的方案, ,博博弈就告結束弈就告結束. .如果方案被拒絕,則被拒絕的方案與以如果方案被拒絕,則被拒絕的方案與以后的討價還價過程不再有關系。后的討價還價過程不再有關系。討價還價博弈討價還價博弈( (ContCont) ) 每次一方提出一個方案和另一方選擇是否接每次一方提出一個方案和另一方選

44、擇是否接受為一個回合。討價還價每多進行一個回合,受為一個回合。討價還價每多進行一個回合,由于談判費用和利息損失等,雙方的得益都由于談判費用和利息損失等,雙方的得益都要打一次折扣,折扣率為要打一次折扣,折扣率為 (0(0 1) 2 2(10000-(10000-S S)= )= 1000010000 2 2- 2 2S S 第一回合:甲的選擇甲乙開始就知道,自己的得益是甲乙開始就知道,自己的得益是 2 2S S,也知也知道乙會在第二回合出價道乙會在第二回合出價S S2 2= = S S ,甲的得益為甲的得益為 2 2S ,S ,乙的得益為乙的得益為 (10000-S(10000-S2 2)= )

45、= 10000 10000 - - 2 2S S。因此甲在第一個回合就給乙因此甲在第一個回合就給乙10000 10000 - - 2 2S S,同時自己所得比同時自己所得比 2 2S S多,就比較理想。多,就比較理想。因此甲希望出價因此甲希望出價S S1 1使得滿足使得滿足10000-S10000-S1 1= = 10000 10000 - - 2 2S S 有有S S1 1= = 10000(1 - 10000(1 - )+ )+ 2 2S S 2 2S S 討價還價博弈的討價還價博弈的均衡解均衡解 三三回合討價還價博弈模型的子博弈完美納什均回合討價還價博弈模型的子博弈完美納什均衡解衡解:

46、: 在甲在甲方第三方第三回合會出回合會出S, S, 且在且在乙方必須接受下乙方必須接受下, ,在第一在第一回合中甲回合中甲方方出價出價: : S S1 1 =10000-10000=10000-10000 + 2 2S S, 乙乙方方接受接受 此時此時, ,甲方得益甲方得益S S1 1 = = 10000-1000010000-10000 + 2 2S S, 乙方得益乙方得益10000- 10000- S S1 1 =10000=10000 - 2 2S S三回合討價還價博弈結果的討論三回合討價還價博弈結果的討論 甲方得益甲方得益S S1 1 = = 10000-1000010000-1000

47、0 + + 2 2S S = 10000-10000 = 10000-10000 + + 2 21000010000 = = 10000(1-10000(1- + + 2 2) ) 乙方得益乙方得益10000- 10000- S S1 1 =10000 =10000 - - 2 2S S益越大甲的得益越小,乙的得越大,時,當益越小甲的得益越大,乙的得越大,時,當5 . 0015 . 03.4.3 3.4.3 委托委托( (Principle)Principle)代理代理( (Agents)Agents)理論理論一、委托一、委托代理關系代理關系o 經濟活動和社會活動中有很多委托人經濟活動和社會活

48、動中有很多委托人代代理人關系,有明顯的,也有隱蔽的。經理和理人關系,有明顯的,也有隱蔽的。經理和員工、店主和店員、客戶和律師、市民和政員工、店主和店員、客戶和律師、市民和政府、基金購買者和基金管理人等都是。府、基金購買者和基金管理人等都是。o 委托人委托人代理人的關鍵特征:不能直接控代理人的關鍵特征:不能直接控制,監(jiān)督不完全,信息不完全,利益相關性制,監(jiān)督不完全,信息不完全,利益相關性o 委托人委托人代理人涉及問題:激勵機制設計、代理人涉及問題:激勵機制設計、機制設計理論,委托合同設計問題等機制設計理論,委托合同設計問題等二、無不確定性的委托人代理人模型R(S)-w(S), w(S)-SR(E

49、)-w(E), w(E)-ER(0),0R(0),0122偷懶努力拒絕接受不委托委托代理人的選擇激勵相容約束: w(E)-E w(S)-S w(E) w(S)+E-S參與約束:22R(E)-w(E), w(E)-E拒絕接受拒絕接受R(0),0R(S)-w(S), w(S)-SR(0),0接受:w(E)-E0接受:w(S)-S0參與約束o 委托人的選擇11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托: R(E)-w(E) R(0)不委托: R(E)-w(E) R(0)不委托: R(S)-w(S) 0不委托: 0.1*20-w

50、(S) +0.9*10-w(S)0不委托:0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10)-S接受:0.9*w(20)-E+0.1*w(10)-E00.1*w(20)-S+0.9*w(10)-S0委托:0.9*20-w(20)+0.1*10-w(10)0 0.1*20-w(20)+0.9*10-w(10)0激勵相容約束促使代理人努力的激勵相容約束、參與約束,以及委托人選擇委托的條件參與約束對于委托人來說,就是要根據上述兩個條件,以及 E、S的值,選擇最佳的工資水平w(20)和w(10),或者它們的差額w(20) -w(10)五、選擇報酬和連續(xù)努力水平的

51、委托人代理人博弈 ( )( ) ( )( ) ( )( )w R eC eUw R eC eUw R eC eU參與約束:委托人當然希望支付的工資越少越好,于是參與約束為:從而:Cont.max()( )max( )max( ): max()( )( )( )ewwew ReC eR ewR ewstw ReC ew R eC eU激勵相容約束:代理人選擇努力希望他的收益越大越好,于是有:而委托人也希望他的收益越大越好:即:綜合上面得到該委托代理模型:應用:店主和店員的問題應用:店主和店員的問題商店的利潤商店的利潤 , 是均值為是均值為0 0的隨機變量的隨機變量店員的負效用店員的負效用 , 是

52、店員的努力是店員的努力機會成本為機會成本為1 1店主采用的報酬計算公式店主采用的報酬計算公式店員的得益店員的得益店員期望得益為店員期望得益為店主的得益為店主的得益為 eR42eC (4)SRe4(4) 4(1)(1)eee 24 eee2(4)ee參與約束:參與約束:激勵相容:激勵相容:店主的得益函數:店主的得益函數:綜上,模型為:綜上,模型為:2(4)1ee 2max(4)eee 22max44:max(4)(4)1eEeestEeeEee cont.假設店員和店主都是風險中性。假設店員和店主都是風險中性。模型變?yōu)槟P妥優(yōu)閷?2)(3)(2)(3)式代入式代入(1)(1)式式: :( ,)

53、2max44(1):2()(2)41eesteee 求解激勵相容約束(參與約束變形)(3)2max814(4) Cont.o(4)(4)式的一階條件:式的一階條件: =1,=1,從而:從而:e=2, =-3.e=2, =-3.So :So :工資合同:工資合同:-3+ -3+ R= R= -3+-3+R R 最有努力水平:最有努力水平: e e* *=2=23.4.4. 3.4.4. 風險規(guī)避代理人確定性等價收風險規(guī)避代理人確定性等價收益的計算益的計算o 代理人追求的不是收益的最大化,而是收益代理人追求的不是收益的最大化,而是收益所帶來的效用的最大化,代理人會在既定的所帶來的效用的最大化,代理

54、人會在既定的約束條件下選擇適當的行動約束條件下選擇適當的行動a a使自己的期望使自己的期望效用最大化。效用最大化。o 現在假定代理人的效用函數為現在假定代理人的效用函數為 ( )rxu xe Conto 對于絕對分險規(guī)避程度對于絕對分險規(guī)避程度 , 。如果代理人喜歡冒險,則效用函數時。如果代理人喜歡冒險,則效用函數時凸函數,凸函數, ;如果代理人是分險中性的,;如果代理人是分險中性的,效用函數是線性的,效用函數是線性的, ;如果是規(guī)避的,;如果是規(guī)避的,效用函數為凹函數,效用函數為凹函數, 。這一函數的一。這一函數的一個重要特征就是可以用值個重要特征就是可以用值 來度量代理人來度量代理人的風險

55、規(guī)避程度。的風險規(guī)避程度。( )( )( )au xR xu x ( )aR xr( )0aR x ( )0aR x ( )0aR x rConto 如果代理人的效用函數的形式為如果代理人的效用函數的形式為 ,其中收益服從均值為其中收益服從均值為 、方差為、方差為 的正的正態(tài)分布,那么:態(tài)分布,那么:( )rxu xe ( )E x( )V x2( )( ) ( )2 ( )21( ( )2( )x E xrV xr E xrxV xEu xeedxeV xConto 定義代理人在不確定條件下的收益的確定性定義代理人在不確定條件下的收益的確定性等值(等值(certainty equivalen

56、tcertainty equivalent)為)為 ,由,由于于 ,所以,所以o 即即 。CE()( ( )u CEE u x( )( )2rV xr E xrCEee 1( )( )2CEE xrV xConto 采取適當的行動使得自己的確定性等值最大采取適當的行動使得自己的確定性等值最大化即化即1maxmax ( )( )2CEE wc arV wc a3.4.53.4.5委托委托-代理理論代理理論( (續(xù)續(xù)) )委托委托-代理問題試圖模型化如下一類問題:一個參代理問題試圖模型化如下一類問題:一個參與人(稱為委托人)想使另一個參與人(稱為代理與人(稱為委托人)想使另一個參與人(稱為代理人)

57、按照委托人的利益選擇行動,但委托人不能直接人)按照委托人的利益選擇行動,但委托人不能直接觀察代理人選擇了什么行動,能觀測到的只是另一些觀察代理人選擇了什么行動,能觀測到的只是另一些變量變量, ,這些變量由代理人的行動和外生的隨機因素共同這些變量由代理人的行動和外生的隨機因素共同決定。決定。 委托人的問題是如何根據這些觀測到的信息來獎懲委托人的問題是如何根據這些觀測到的信息來獎懲代理人,以激勵其選擇對委托人最有利的行動。代理人,以激勵其選擇對委托人最有利的行動。Cont.o 用用A A表示代理人所有可選擇的行動的組合,表示代理人所有可選擇的行動的組合,a Aa A表示代理人的一個特定行動。注意,

58、盡管再許多表示代理人的一個特定行動。注意,盡管再許多模型中模型中a a被簡單地假定為代表工作努力水平的一維被簡單地假定為代表工作努力水平的一維變量,理論上講,行動變量,理論上講,行動a a可以是任何維度的決策向可以是任何維度的決策向量。量。o 比如說,如果比如說,如果a a(a1,a2a1,a2), ,一種可能的解釋是一種可能的解釋是a1a1和和a a分別代表代理人花在分別代表代理人花在“數量數量”和和“質量質量”上的工作時間。不過,在本章中,未來分析的方上的工作時間。不過,在本章中,未來分析的方便,我們假定便,我們假定a a是代表代理人努力水平的一維變量。是代表代理人努力水平的一維變量。 C

59、onto 令令 是不受代理人(和委托人)控制的外生隨機是不受代理人(和委托人)控制的外生隨機變量(稱為變量(稱為“自然狀態(tài)自然狀態(tài)”),),是是 的取值范圍,的取值范圍, 在在上的分布函數和密度函數分別為上的分布函數和密度函數分別為GG( )和和g g( )。)。o 在代理人選擇行動在代理人選擇行動a a后,外生變量后,外生變量 實現。實現。a a和和 共同決定一個可觀測的結果共同決定一個可觀測的結果x x(a a, )和一個)和一個貨幣收入(貨幣收入(“產出產出”) (a a, ),其中),其中 (a a, )的直接所有權屬于委托人。)的直接所有權屬于委托人。 Conto 假定假定 是是a

60、a的嚴格遞增的凹函數(即給定的嚴格遞增的凹函數(即給定 ,代,代理人工作越努力,產出越高,但努力的邊際產理人工作越努力,產出越高,但努力的邊際產出遞減),出遞減), 是是 的嚴格增函數(即較高的的嚴格增函數(即較高的 代代表較有利的自然狀態(tài))。表較有利的自然狀態(tài))。o 委托人的問題是設計一個激勵合同委托人的問題是設計一個激勵合同s s(x x),根),根據觀測到的據觀測到的x x對代理人進行獎懲。要分析的問題對代理人進行獎懲。要分析的問題是是s s(x x)具有什么樣的特征?)具有什么樣的特征?Conto 假定委托人和代理人的假定委托人和代理人的v vN NMM期望效用函數分期望效用函數分別為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論