博弈論與公共政策-之完全信息動(dòng)態(tài)博弈課件_第1頁(yè)
博弈論與公共政策-之完全信息動(dòng)態(tài)博弈課件_第2頁(yè)
博弈論與公共政策-之完全信息動(dòng)態(tài)博弈課件_第3頁(yè)
博弈論與公共政策-之完全信息動(dòng)態(tài)博弈課件_第4頁(yè)
博弈論與公共政策-之完全信息動(dòng)態(tài)博弈課件_第5頁(yè)
已閱讀5頁(yè),還剩54頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論與公共政策北京大學(xué)精品課件博弈論與公共政策北京大學(xué)精品課件完全信息動(dòng)態(tài)博弈完全信息動(dòng)態(tài)博弈主要內(nèi)容一、動(dòng)態(tài)博弈的特例:決策分析二、博弈的擴(kuò)展式表述三、動(dòng)態(tài)博弈的均衡四、子博弈精煉納什均衡五、應(yīng)用舉例六、重復(fù)博弈主要內(nèi)容一、動(dòng)態(tài)博弈的特例:決策分析作為一名管理者,面臨的最基本和最重要的任務(wù)也許就是做決策??墒牵袝r(shí)決策是很困難的,特別是處于不確定環(huán)境中,或者在一個(gè)決策之后還要做進(jìn)一步?jīng)Q策的時(shí)候。有沒有一般的模式或方法可循?決策分析就提供了一種系統(tǒng)而有效的方法,其基本工具是決策樹。 一、動(dòng)態(tài)博弈的特例:決策分析作為一名管理者,面臨的最基本和最重要的任務(wù)也許就是做決策??衫?:合同糾紛甲、乙雙

2、方在簽訂一項(xiàng)合同后,乙方違約。乙方提出和解,愿意賠償7萬(wàn)元。甲方如果上法庭,可望獲得10萬(wàn)元賠償,但要付出2萬(wàn)元的訴訟費(fèi)用。甲方應(yīng)當(dāng)接受和解還是上法庭?例1:合同糾紛甲、乙雙方在簽訂一項(xiàng)合同后,乙方違約。乙方提出決策樹決策樹逆向歸納法從右往左逐步分析。在這個(gè)過(guò)程中: 對(duì)于機(jī)會(huì)結(jié),計(jì)算期望收益,并將相應(yīng)的值寫在該結(jié)下面。 對(duì)于決策結(jié),還是做兩件事:第一,在較劣的決策枝上劃叉;第二,將對(duì)應(yīng)于最優(yōu)決策枝的收益寫在該決策結(jié)下面。 一旦某個(gè)結(jié)點(diǎn)下面標(biāo)了值,在以后進(jìn)一步分析該結(jié)點(diǎn)的父結(jié)點(diǎn)時(shí),就只考慮該結(jié)點(diǎn)的值而不再考慮其右邊的子決策樹。逆向歸納法從右往左逐步分析。在這個(gè)過(guò)程中:例3:交通事故和解談判在一次

3、交通事故中,被告同意賠償4萬(wàn)元以和解。原告如果堅(jiān)持上法庭,需要花1萬(wàn)元的訴訟費(fèi),有可能出現(xiàn)三種結(jié)果:結(jié)果1:得到包括誤工費(fèi)在內(nèi)總額為10萬(wàn)元的賠償,概率為50%;結(jié)果2:僅得到2萬(wàn)元的修車費(fèi)賠償,概率為30%;結(jié)果3:得不到任何賠償,概率為20%。甲方應(yīng)當(dāng)接受和解還是上法庭?例3:交通事故和解談判在一次交通事故中,被告同意賠償4萬(wàn)元以例4:購(gòu)買土地某人打算購(gòu)買土地,現(xiàn)有A、B兩塊地可以選擇。A、B兩塊地的售價(jià)分別為30萬(wàn)元和25萬(wàn)元。這兩塊地看起來(lái)差不多,所以買方起初打算購(gòu)買價(jià)格更便宜的B。但是,買方進(jìn)一步了解得知,B可能存在環(huán)境問(wèn)題,因?yàn)樵摰剡^(guò)去被堆放過(guò)大量垃圾,而A不存在類似問(wèn)題。如果B被

4、危險(xiǎn)垃圾污染,依照法律規(guī)定,買方必須進(jìn)行無(wú)害化處理,成本為20萬(wàn)元。買方估計(jì),B被危險(xiǎn)垃圾污染的概率為50%。例4:購(gòu)買土地某人打算購(gòu)買土地,現(xiàn)有A、B兩塊地可以選擇。A在決定到底買哪塊地之前,買方也可以先請(qǐng)環(huán)保機(jī)構(gòu)進(jìn)行檢測(cè),看到底是否需要進(jìn)行無(wú)害化處理,檢測(cè)費(fèi)為2萬(wàn)元。買方是否需要先請(qǐng)環(huán)保部門監(jiān)測(cè)?還是直接購(gòu)買A或B?在決定到底買哪塊地之前,買方也可以先請(qǐng)環(huán)保機(jī)構(gòu)進(jìn)行檢測(cè),看到首先考慮,買方在開始有幾種選擇?首先考慮,買方在開始有幾種選擇?二、博弈的擴(kuò)展式表述1、博弈的擴(kuò)展式表述 參與者 每個(gè)參與者在何時(shí)行動(dòng) 每次輪到某一參與者行動(dòng)時(shí),可供他選擇的行動(dòng) 每次輪到某一參與者行動(dòng)時(shí),他所了解的信

5、息 對(duì)應(yīng)于參與者可能選擇的每一行動(dòng)組合,各個(gè)參與者的收益二、博弈的擴(kuò)展式表述1、博弈的擴(kuò)展式表述通??梢杂貌┺臉鋪?lái)描述博弈的擴(kuò)展式(請(qǐng)與決策樹比較):通常可以用博弈樹來(lái)描述博弈的擴(kuò)展式(請(qǐng)與決策樹比較):例5 :簡(jiǎn)單訴訟博弈甲、乙雙方在簽訂一項(xiàng)合同后,乙方違約。甲方可以選擇控告,并索賠8000元,但控告需要花3000元訴訟費(fèi);甲方也可以選擇忍受,一切維持現(xiàn)狀。一旦甲方控告并提出索賠,乙方可以提出和解并賠償8000元;乙方也可以選擇上法庭。如果上法庭,甲方將勝訴,乙方將被判賠償9000元,且雙方各需要支出2000元的訴訟費(fèi)。甲方應(yīng)當(dāng)控告還是忍受?例5 :簡(jiǎn)單訴訟博弈甲、乙雙方在簽訂一項(xiàng)合同后,乙

6、方違約。甲博弈樹博弈樹通過(guò)引入機(jī)會(huì)結(jié),我們也可以納入存在不確定性的情況,如下圖:通過(guò)引入機(jī)會(huì)結(jié),我們也可以納入存在不確定性的情況,如下圖:博弈樹博弈樹2、信息集參與者的一個(gè)信息集是指滿足以下兩個(gè)條件的決策結(jié)的集合: 在此信息集中的每一個(gè)結(jié)點(diǎn)都輪到該參與者行動(dòng)。 當(dāng)博弈的進(jìn)行達(dá)到該信息集中的一個(gè)結(jié),應(yīng)該行動(dòng)的參與者并不知道達(dá)到了信息集中的哪一個(gè)結(jié)。2、信息集3、策略參與者的一個(gè)策略是關(guān)于行動(dòng)的一個(gè)完備計(jì)劃,它明確了在參與者可能遇到的每一種情況下對(duì)可行行動(dòng)的選擇。思考:在下面的博弈中,兩個(gè)參與者各自的策略空間分別是什么?3、策略例 6例 64、擴(kuò)展式表述與標(biāo)準(zhǔn)式表述任何博弈都既可用標(biāo)準(zhǔn)式表述,又可

7、用擴(kuò)展式表述。(1)用擴(kuò)展式表述囚徒困境博弈(第1講中的例1)4、擴(kuò)展式表述與標(biāo)準(zhǔn)式表述第1講之例1:囚徒困境囚徒2抵賴招認(rèn)囚徒1抵賴-1,-1-9,0招認(rèn)0,-9-6,-6第1講之例1:囚徒困境囚徒2抵賴招認(rèn)囚徒1抵賴-1,-1-9(2)用標(biāo)準(zhǔn)式表述例6中的博弈(2)用標(biāo)準(zhǔn)式表述例6中的博弈1、利用標(biāo)準(zhǔn)式表述求納什均衡2、在博弈樹上找納什均衡三、動(dòng)態(tài)博弈的均衡1、利用標(biāo)準(zhǔn)式表述求納什均衡三、動(dòng)態(tài)博弈的均衡四、子博弈精煉納什均衡1、可置信的威脅與不可置信的威脅一種威脅所規(guī)定的行動(dòng)在事前看來(lái)是最優(yōu)的,但事后看并不是參與者的最優(yōu)選擇,這種威脅就是不可置信的,含有這種威脅的策略就不是一個(gè)合理的策略。

8、四、子博弈精煉納什均衡1、可置信的威脅與不可置信的威脅例7:臺(tái)灣問(wèn)題例7:臺(tái)灣問(wèn)題2、承諾在博弈論中,所謂承諾是將不可置信的威脅變成可置信的威脅的行動(dòng):威脅不僅是事前最優(yōu)的,也是事后最優(yōu)的。承諾意味著限制自己的自由:選擇少反而對(duì)自己好。比如例7中的臺(tái)灣問(wèn)題:立法還是政府隨機(jī)應(yīng)變?2、承諾3、子博弈擴(kuò)展式博弈中的子博弈是指博弈的一部份,要求: 始于博弈樹中一個(gè)單結(jié)信息集的決策結(jié),但不包括博弈的第一個(gè)決策結(jié); 包含該決策結(jié)之下所有的決策結(jié)和終點(diǎn)結(jié); 沒有分割任何信息集。3、子博弈4、子博弈精煉納什均衡如果參與者的策略組合在每一子博弈中都構(gòu)成納什均衡,則稱該策略組合是子博弈精煉納什均衡。子博弈精煉納

9、什均衡排除了不可置信的威脅。參看例6。4、子博弈精煉納什均衡5、逆向歸納法從最后一個(gè)決策結(jié)開始,找出該子博弈的納什均衡;然后再分析倒數(shù)第二個(gè)決策結(jié),找出相應(yīng)子博弈的納什均衡;如此一直到初始決策結(jié),所有子博弈上的最優(yōu)選擇就構(gòu)成了子博弈精煉納什均衡。5、逆向歸納法例 8121(2,0)(5,0)(4,2)(1,1)UDRLUD例 8121(2,0)(5,0)(4,2)(1,1)UDRL例9: 簡(jiǎn)單訴訟博弈(續(xù))我們將例5中的收益數(shù)字改一下,變?yōu)橄旅娴牟┺模瑫?huì)出現(xiàn)什么結(jié)果?例9: 簡(jiǎn)單訴訟博弈(續(xù))我們將例5中的收益數(shù)字改一下,變?yōu)椴┺臉洳┺臉淅?0:訴訟博弈對(duì)于下面的博弈,如果Y=7千元,原告的最

10、優(yōu)策略是什么?例10:訴訟博弈對(duì)于下面的博弈,如果Y=7千元,原告的最優(yōu)策博弈樹博弈樹例11:訴訟博弈(續(xù))對(duì)于下面的博弈,原告的最優(yōu)策略是什么?例11:訴訟博弈(續(xù))對(duì)于下面的博弈,原告的最優(yōu)策略是什么?博弈樹博弈樹6、均衡、均衡路徑與解一個(gè)均衡是各參與者的策略組合,而策略又是完備的(即針對(duì)所有可能情況的)行動(dòng)計(jì)劃。精煉納什均衡下所經(jīng)過(guò)的決策點(diǎn)和最優(yōu)選擇構(gòu)成的路徑,稱為均衡路徑。其他的路徑是非均衡路徑。一個(gè)解則指一條均衡路徑,即在給定的策略組合下各參與者的實(shí)際行動(dòng)組合。6、均衡、均衡路徑與解例 8121(2,0)(5,0)(4,2)(1,1)UDRLUD例 8121(2,0)(5,0)(4,

11、2)(1,1)UDRL7、逆向歸納法背后的理性假定在例 8 中,均衡結(jié)果依賴于非均衡路徑上的選擇:參與者 1 之所以起初就選擇 U ,是因?yàn)樗A(yù)期如果選擇 D 的話,參與者 2 將選擇 L ;而 2 之所以選擇 L ,是因?yàn)樗A(yù)期如果選擇 R 的話,參與者 1 將選擇 U??墒?,只有在 1 偏離了博弈的逆向歸納解之后才能輪到 2 行動(dòng),而這時(shí) 2 似乎不能認(rèn)為 1 是理性的了,從而 2 未必就會(huì)選 L 。逆向歸納出問(wèn)題了? 7、逆向歸納法背后的理性假定五、應(yīng)用舉例例12:訴訟博弈在例11的訴訟博弈中,被告如何利用承諾以扭轉(zhuǎn)局勢(shì)?五、應(yīng)用舉例例12:訴訟博弈例13:投票問(wèn)題三個(gè)選民(1、2、3)

12、要就三個(gè)備選方案(A、B、C)進(jìn)行投票。議程為,首先就A和B兩個(gè)方案進(jìn)行投票決定優(yōu)勝者,然后在前面的優(yōu)勝者與C之間進(jìn)行投票。各人的偏好順序如下表所示。以上信息為共同知識(shí)。請(qǐng)你分析各人的投票策略,最終哪個(gè)方案被選中呢?例13:投票問(wèn)題第一偏好第二偏好第三偏好選民1ABC選民2BCA選民3CAB第一偏好第二偏好第三偏好選民1ABC選民2BCA選民3CAB例14:斯特爾伯格雙頭壟斷模型例14:斯特爾伯格雙頭壟斷模型例15:國(guó)家之間的關(guān)稅協(xié)定例15:國(guó)家之間的關(guān)稅協(xié)定六、重復(fù)博弈例16:連鎖店問(wèn)題六、重復(fù)博弈例16:連鎖店問(wèn)題如果博弈不是一次性的,而是重復(fù)進(jìn)行的,參與者過(guò)去行動(dòng)的歷史是可以觀察到的,參

13、與者就可以根據(jù)對(duì)手過(guò)去的行動(dòng)來(lái)決定自己的選擇,因而有了更多的可選策略,均衡結(jié)果可能與一次博弈大不相同。重復(fù)博弈理論的最大貢獻(xiàn)是對(duì)人們之間的合作行為提供了理性解釋。如果博弈不是一次性的,而是重復(fù)進(jìn)行的,參與者過(guò)去行動(dòng)的歷史是1、有限次重復(fù)博弈以 G(T) 表示階段博弈 G 重復(fù) T 次的有限次重復(fù)博弈,并且在下一階段博弈開始之前,所有以前博弈的結(jié)果都可被觀測(cè)到。 G(T) 的收益為 T 次階段博弈收益的簡(jiǎn)單相加。1、有限次重復(fù)博弈命題一:如果階段博弈 G 有唯一的納什均衡,則對(duì)任意有限的 T ,重復(fù)博弈 G(T) 有唯一的子博弈精煉解,即 G 的納什均衡結(jié)果在每一階段重復(fù)出現(xiàn)。命題一:命題二:當(dāng)

14、階段博弈 G 為完全信息動(dòng)態(tài)博弈時(shí),只要 G 有唯一的逆向歸納解,那么對(duì)任意有限的 T ,重復(fù)博弈 G(T) 有唯一的子博弈精煉解,其中每一階段的結(jié)果都是 G 的逆向歸納解。命題二:命題三:如果階段博弈 G 是一個(gè)有多個(gè)納什均衡的完全信息靜態(tài)博弈,則重復(fù)博弈 G(T) 可以存在這樣的子博弈精煉解除最后那個(gè)階段外,各個(gè)階段的結(jié)果都不是 G 的納什均衡結(jié)果。命題三:例17:兩階段重復(fù)博弈考慮下表所示的階段博弈重復(fù)兩次,參與者在第二階段開始前可以觀測(cè)到第一階段的結(jié)果。我們可以證明在這一重復(fù)博弈中存在一個(gè)子博弈精煉解,其中第一階段的行動(dòng)組合為(M, M)。 例17:兩階段重復(fù)博弈考慮下表所示的階段博弈

15、重復(fù)兩次,參與者乙LMR甲L1,15,00,0M0,54,40,0R0,00,03,3乙LMR甲L1,15,00,0M0,54,40,0R0,00例18:兩階段重復(fù)博弈乙LMRPQ甲L1, 15, 00, 00, 00, 0M0, 54, 40, 00, 00, 0R0, 00, 03, 30, 00, 0P0, 00, 00, 04, 0.50, 0Q0, 00, 00, 00, 00.5, 4例18:兩階段重復(fù)博弈乙LMRPQ甲L1, 15, 00, 2、無(wú)限次重復(fù)博弈即使階段博弈 G 有唯一的納什均衡,無(wú)限次重復(fù)博弈中也可以存在這樣的子博弈精煉解,其中沒有一個(gè)階段的結(jié)果是 G 的納什均衡結(jié)果。2、無(wú)限次重復(fù)博弈(1)無(wú)限次重復(fù)博弈的定義給定一個(gè)階段博弈G,以G (,)表示相應(yīng)的無(wú)限次重復(fù)博弈,其中 G 將無(wú)限次地重復(fù)進(jìn)行,且參與者的貼現(xiàn)因子都為 。并且在下一次博弈開始之前,所有以前博弈的結(jié)果都可被觀測(cè)到。每個(gè)參與者在 G (,)中的收益都是該參與者在無(wú)限次的階段博弈中所得收益的現(xiàn)值。(1)無(wú)限次重復(fù)博弈的定義(2)階段博弈的保留收益與可行收益 (2)階段博弈的保留收益與可行收益 (3)弗里德曼定理令 G 為一個(gè)有限的完全信息靜態(tài)博弈,以(e1, ,en)表示 G 的一個(gè)納什均衡下的收益,而 (x1, ,xn) 表示 G 的其他任

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論