完全信息動態(tài)博弈_第1頁
完全信息動態(tài)博弈_第2頁
完全信息動態(tài)博弈_第3頁
完全信息動態(tài)博弈_第4頁
完全信息動態(tài)博弈_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、03 完全信息動態(tài)博弈(序貫決策博弈)房地產開發(fā)問題討論分析一 動態(tài)博弈的表示二 納什均衡的可信性問題三 子博弈精煉納什均衡四 先動優(yōu)勢與后動優(yōu)勢主要內容11) 該博弈模型如何表達?2)該博弈中參與人各個策略是什么?(注意策略與單次行動的區(qū)別)3)該博弈的納什均衡是什么?4)這種納什均衡預測該博弈的實際情況是否合理?問題和討論有兩房地產商A和B,都想在某小城開發(fā)房地產,若只有一家開發(fā)則可盈利1億,若兩家都開發(fā)則各虧損3億,A有優(yōu)先選擇權,請問他們?yōu)榱烁髯岳嬖撟龊螞Q策?2房地產開發(fā)博弈模型一 動態(tài)博弈的表示博弈樹(extensive form representation)3 房地產開發(fā)博弈如

2、果進行如下變化:1、該地的房地產需求狀況是不確定的, 假定該博弈的行動順序如下:(1) 開發(fā)商A先行動, 選擇開發(fā)或不開發(fā);(2)在A決策后,“ 自然”選擇需求的大小;(3)開發(fā)商B在觀測到1的決策和市場的需求后, 再決定開發(fā)或不開發(fā)。2、如果B在決策時并不知道自然的選擇3、B在決策時知道自然的選擇,但不知道A的選擇4 1、房 地 產 開 發(fā) 博 弈ANNBBBB 開 發(fā) 不 開 發(fā) 需 求 大 需 求 小 需 求 大 需 求 小 開 發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) 單 位

3、:百萬元52、如果B在決策時并不知道自然的選擇,則ANNBBBB 開 發(fā) 不 開 發(fā) 大(1/2) 小(1/2) 大(1/2) 小(1/2) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)hBhBhA (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)63、B知道自然的選擇,但不知道A的選擇, 博弈樹如下:ANNBBBB開發(fā) 不開發(fā)大 小 大 小開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)(4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0)7動態(tài)博弈包括以下要素:1,參與人集合:i=

4、1,n,另外用N代表虛擬參與人“自然”;2,參與人的行動順序:誰在什么時候行動;3,參與人的行動空間:在每次行動時,參與人有些什么選擇;4,參與人的信息集:每次行動時,參與人知道些什么;5,參與人的支付函數(shù)(收益函數(shù))6,外生事件(即自然的選擇)的概率分布。信息集的理解:當參與人作出他們的行動決策時,他所觀測到 或他所了解到的信息,即他在此時獲得的信息集合8 有了信息集的概念, 展開式表示也可以用來表 示靜態(tài)博弈, 如“囚徒困境 ”博弈可以表 示為:122 坦 白 不 坦 白 坦 白 不 坦 白 坦 白 不 坦 白(-3,-3) (0,-5) (-5,0) (-1,-1)9關于博弈樹的注意事項

5、末端節(jié)點不為任何一個參與人單獨擁有,末端節(jié)點后面的括號里按照一定次序給出所有局中人在這個結果的博弈所得(次序采用首次行動順序原則給出)博弈樹并不要求所有參與人都必須在至少一個非末端節(jié)點上進行決策,允許有參與人沒有決策的機會,此時的支付向量分量的次序要專門說明;博弈樹允許從一個非末端節(jié)點只延伸出一條棱的情況;10乙甲借 不借(錢)分 不分(利益)(1,0)(2,2) (0,4)二、 納什均衡的可信性問題1、開金礦博弈(1)你如果是甲,向乙借錢時說什么?(2)你如果是乙,會借給甲錢嗎?11122TBL R L R(2,2) (4,0) (1,0) (3,1)可以表示為:L RT 2,2 4,0 B

6、 1,0 3,1 參 與 人1 參 與 人22、策略與行動的區(qū)別策略一個完整的行動計劃例12 動態(tài)博弈:122TBL R L R(2,2) (4,0) (1,0) (3,1)參與人2的完整策略有四個不論對方如何,我都選L (L L)不論對方如何,我都選R (R R)對方選T,我選L,對方選B,我選R (L R)對方選T,我選R,對方選B,我選L (R L)例13轉化成博弈矩陣表示:( 開, 開) ( 開, 不) ( 不, 開) ( 不, 不) 開 -3,-3 -3,-3 1,0 1,0 不 0,1 0,0 0,1 0,0 參 與 人B 參 與 人A3、房地產開發(fā)中的可信性問題假設一旦制定了策略

7、則按照此策略進行博弈14博弈矩陣表示:( 開, 開) ( 開, 不) ( 不, 開) ( 不, 不) 開 -3,-3 -3,-3 1,0 1,0 不 0,1 0,0 0,1 0,0 參 與 人B 參 與 人A 由 畫 線 法 可 得 三 個 純 策 略Nash 均 衡:( 不 開 發(fā),( 開 發(fā), 開 發(fā))( 開 發(fā),( 不 開 發(fā), 不 開 發(fā))( 開 發(fā),( 不 開 發(fā), 開 發(fā)) 但中B的策略是不合理的,用開發(fā)進行這個威脅是不可置信的;中B的策略(不開發(fā),不開發(fā))也不合理, 因為若A不開發(fā),B顯然應該開發(fā); 只有是一 個合理的均衡。15可以表示成矩陣形式:LL LR RL RRT 2,2

8、 2,2 4,0 4,0 B 1,0 3,1 1,0 3,1 參 與 人2 參 與 人1122TBL R L R(2,2) (4,0) (1,0) (3,1)練習:問:哪些納什均衡不可信?16如何避免不合理的均衡,直接找到符合預期的合理的納什均衡呢?17三、子博弈精煉納什均衡 subgame perfect Nash equilibrium子博弈定義:由一個動態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構成的,有初始信息集和進行博弈所需要的全部信息,能夠自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個“子博弈”。ABB開不開 不 開 不XXB開 不子博弈1BX開 不子博弈2原博弈18定義:如

9、果在一個動態(tài)博弈中,各參與人的策略構成的一個策略組合滿足:在整個動態(tài)博弈及它的所有子博弈中都構成納什均衡,那么這個策略組合稱為該動態(tài)博弈的一個“子博弈精煉納什均衡”。子博弈精煉納什均衡能夠排除均衡策略中不可信的威脅和承諾,因此是真正穩(wěn)定的。逆向歸納法(倒推法)是求子博弈完美納什均衡的基本方法。子博弈精煉納什均衡19例12(2,2)(3,1) (0,0)U DL RL RU 2,2 2,2D 3,1 0,0 該博弈有兩個Nash 均衡:(U,R)和(D,L)但Nash均衡(U,R)從動態(tài)博弈的觀點來看是不合理的,因為它依賴于參與人2取R這一“空頭威脅”。20逆向歸納法逆向歸納法包括步驟:從博弈樹

10、的終點結出發(fā), 追蹤到緊接著它的前面的結;在步驟中到達的每一個基本結上,通過對該決策結出發(fā)到達的每一個終點結上參與人 得到的得益求最佳行動;在步驟中檢驗過每一個基本決策結中所引起的所有非最優(yōu)枝刪去; 如達到樹根,則中止,否則回到(1) 對每一個參與人,將該參與人在每一個決策結上的最優(yōu)策略一起收集起來就構成了最佳策略。21例1:用逆向歸納法求下列博弈的子博弈精煉Nash 均衡:1221L RA B C DE F(2,0) (1,1) (0,1/2)(3,1) (2,2)h1h1h2h2解為(R,E),(B,D)22練習1:分析房地產開發(fā)博弈的子博弈精煉納什均衡子博弈精煉納什均衡:(開發(fā),(不開發(fā)

11、,開發(fā))23問題描述:五個強盜搶到了100塊金幣,他們通過抓鬮確定了提出方案的順序,五個強盜分別抓到號碼一、二、三、四、五。號碼是他們的發(fā)言順序。先提出方案的強盜,如果按規(guī)則通過,博弈結束,如果沒有獲得通過,就要被喂鯊魚規(guī)則如下:首先,一號強盜提出分配方案,全部強盜(包括一自己)中達半數(shù)通過其方案即實施該方案,博弈結束;否則將一號強盜喂鯊魚;然后二號強盜提出方案,全部強盜(注:此時全部強盜是二、三、四、五,因為一已死去)中過半數(shù)通過其方案即實施該方案,博弈結束;否則將二號強盜喂鯊魚;以此類推兩個假設 (1)強盜首先希望保命 (2)保命前提下希望自己金幣更多練習2:強盜分金問題24倒推法分析:若

12、能輪到5號提方案,則若輪到4號提方案,則則3號可以拉攏5號提出方案2號提出的方案必須考慮拉攏4號1號提出的方案必須考慮拉攏3和5號251、斯坦克博格(Stackelberg)寡頭競爭模型兩企業(yè)先后選擇產量的競爭博弈把古諾模型改為廠商1先選擇,廠商2后選擇,而非同時選擇即可。222126qqqq-=運用逆向歸納法,先分析企業(yè)2的最優(yōu)產量,是企業(yè)1產量的函數(shù)代入企業(yè)1的收益函數(shù)四、連續(xù)支付情形下的動態(tài)博弈26企業(yè)1預測到企業(yè)2將根據(jù) 來選擇產量,則在第一階段,企業(yè)1最大化自己的收益函數(shù),有因此兩企業(yè)收益分別為27古諾模型與斯坦克博格模型的比較靜態(tài)博弈靜態(tài)合作動態(tài)博弈22441.51.54.54.5

13、31.54.52.25453.5先行優(yōu)勢282、 勞資博弈(里昂惕夫模型,1946)涉及到工會與雇主之間的博弈過程工會與雇主各自的收益函數(shù)如何表達?子博弈精煉納什均衡如何分析?自學:教材P124 勞資博弈?29參與人:代表勞方的工會與代表資方的廠商工會決定工資水平,廠商決定雇用多少人工會不只追求高工資,還希望被雇人數(shù)多。不喜歡高工資高失業(yè),也不喜歡低工資低失業(yè)。 勞資博弈(里昂惕夫模型,1946)工會的目標是最大化總效用,假設收益是勞動雇用量的函數(shù)R(L)(邊際效益遞減),再假設只有勞動成本,工廠的利潤函數(shù)為工會方的效用是工資水平和雇用人數(shù)兩者的函數(shù)30博弈順序:工會首先決定工資率,然后廠商根據(jù)工會提出的工資率水平決定雇傭工人的數(shù)量分析:首先求解給定工資率情況下廠商的就業(yè)需求,廠商根據(jù)工資率選擇就業(yè)數(shù)來最大化自己的利潤31因為工會預期企業(yè)將

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論