版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四章序貫決策博弈4-1序貫決策博弈與博弈樹4-2策略與行動4-3序貫博弈的納什均衡4-4倒推法4-5先動優(yōu)勢與后動優(yōu)勢4-6博弈論給自己出難題擴展式表述回顧:戰(zhàn)略式表達參與人集合參與人的戰(zhàn)略集合支付函數(shù)不必考慮博弈的動態(tài)過程,因此,二人有限博弈矩陣表就可以分析4-1序貫決策博弈與博弈樹考慮行動的先后順序和博弈歷史,適用于動態(tài)博弈。在戰(zhàn)略式基礎(chǔ)上要考慮:行動順序?qū)γ看危侩A段)行動知道多少,有什么具體行動可供選擇擴展式表述要素:參與人集合:i=1,2……參與人的行動順序參與人的行動空間:每次行動都有什么選擇參與人的信息集:每次行動時,參與人都知道些什么參與人的支付函數(shù):是所有行動的函數(shù)外生事件(自然選擇)的概率分布博弈的擴展式表述可以用博弈樹來實現(xiàn)博弈樹的特點是直觀清晰,其優(yōu)點是可以體現(xiàn)多人博弈過程舉例:以房地產(chǎn)開發(fā)為例參與人是A、BA先行,然后是自然選擇市場大小,最后B行動自然選擇的概率分布為:市場需求大的概率為1/2,需求小的概率1/2。例子:決策有先后的博弈,稱為序貫決策博弈(序貫博弈)。表述為博弈樹的博弈,也叫做展開型表示的博弈。博弈樹描述了所有局中人可以采取的所有可能的行動以及博弈的所有可能的結(jié)果。博弈樹由節(jié)點(nodes)和棱(edges)組成,節(jié)點又分為決策節(jié)點(decisionnodes)和末端節(jié)點(terminalnodes)。博弈樹以棱把節(jié)點連接起來。決策節(jié)點是局中人作出決策的地方。每個決策節(jié)點都與一個在該決策節(jié)點上進行決策的局中人相對應(yīng)。每棵博弈樹都有一個初始決策節(jié)點,初始決策節(jié)點也叫做博弈樹的根(root),是博弈開始的地方。末端節(jié)點是博弈結(jié)束的地方,一個末端節(jié)點就是博弈的一個(可能的)結(jié)果(outcome)。每一個末端節(jié)點,都與一個支付向量相對應(yīng),這個向量按分量次序排列博弈的所有參與人在這個結(jié)果下的博弈所得。博弈的參與人的數(shù)目,就是支付向量的維數(shù)。首次行動順序原則:序貫博弈各結(jié)果相應(yīng)的支付向量中,按照每個參與人頭一次決策行動出現(xiàn)先后的自然次序排列收益。博弈樹必須說明在每一個決策節(jié)點上相應(yīng)的局中人能夠采取的所有可能的選擇。一些博弈樹可能包含“不做任何決策”的決策節(jié)點。每一個決策節(jié)點都有至少一條棱從它那里出發(fā)往后延伸,但是沒有最大延伸數(shù)量的限制。對于不是根的每個節(jié)點,只能有來自別的節(jié)點的唯一的棱指向它這個節(jié)點。博弈樹并不要求每個局中人必須在至少一個非末端節(jié)點上進行決策。即,可能會出現(xiàn)某些局中人并不在任何一個非末端節(jié)點上進行決策的情形。進入障礙博弈一個壟斷企業(yè)因為他的產(chǎn)品一直可以賣高價賺取每年10億元的利潤。別的企業(yè)為了進入這個壟斷的行業(yè),需要4億元的投資。當別的企業(yè)準備進入的時候,原有企業(yè)必須決策:或“容忍”新的企業(yè)進入,具體表現(xiàn)為他收縮產(chǎn)量以維持高價,這樣他的利潤降為5億元。這時,設(shè)對方的利潤也是5億元,減去4億元進入投資,實得1億。或壟斷企業(yè)展開商戰(zhàn)“抵抗”,就是加大產(chǎn)量,降低價格,力圖把進入者擠出去,這時原來壟斷企業(yè)的利潤降到2億元,即使對方也得2億元,卻不抵投資的4億元,結(jié)果虧損2個億。即使對方不進入,壟斷企業(yè)也可以采取降價威脅的策略。這時候其的利潤下降為4億元。n人序貫博弈的博弈樹的主要特征
對于表達有n個局中人P1,P2,…,Pn參與的一個序貫博弈的博弈樹:在樹的每一個非末端節(jié)點上,都只有一個局中人進行決策;在樹的每一個末端節(jié)點上,都指派了一個n維的“支付”向量p(v)=(p1(v),p2(v),…,p3(v)),這里v是這個末端節(jié)點的相應(yīng)的策略表達.而1,2,…n是博弈參與人首次決策的自然順序。注意幾點:首先,末端節(jié)點并不為任何一個局中人所單獨擁有,末端節(jié)點按照一定次序給出所有局中人在這個結(jié)果的博弈所得,約定采用首次行動順序原則給出這個次序。博弈樹并不要求每個局中人必須在至少一個非末端節(jié)點上進行決策。在一個多人序貫博弈中,可能會出現(xiàn)某些局中人并不在任何一個非末端節(jié)點上進行決策的情形。這些局中人因為沒有行動的機會,實際上并不參與博弈,我們?nèi)匀话阉麄兎Q為博弈的局中人或者參與人,他們實際上是別人的博弈后果的承受者。博弈樹允許從一個非末端節(jié)點只伸延出一個棱的情況,在這種情況下,這個非末端節(jié)點就是一個實際上不做決策的決策節(jié)點。4-2策略與行動策略:參與博弈的各個局中人在進行決策時,可以選擇的方法、做法或經(jīng)濟活動的水平、量值等。行動:局中人在博弈的某個時點上的決策變量。同時決策博弈,每個局中人的策略就是他能夠采取的行動。序貫決策博弈,策略與行動有區(qū)別。序貫決策博弈行動:每一個決策節(jié)點上局中人的決策變量或行動的具體選擇。策略:一個完整的行動計劃,就構(gòu)成局中人在博弈中的一個策略。“進入者”只有一個決策節(jié)點,他有兩個純策略可以選擇:進入和不進入。“壟斷者”有四個可能的純策略:不管你怎樣,我總?cè)萑蹋徊还苣阍鯓?,我總對抗;你進我抗,你不進我忍;你進我忍,你不進我抗。壟斷者的這四個純策略,可以簡單描述為四個行動集,每一個行動集都說明壟斷者在他擁有的兩個決策節(jié)點上相應(yīng)的行動。{容忍,容忍}、{抵抗,抵抗}、{抵抗,容忍}、{容忍,抵抗}。男策略:足球;芭蕾女策略:追隨策略:他選擇什么,我就選擇什么;對抗策略:他選擇什么,我就偏不選什么;芭蕾策略:無論他選什么,我都選我喜歡的芭蕾;足球策略:無論他選什么,我都選他喜歡的足球4-3序貫博弈的納什均衡女方策略:八種可能的策略組合粗線表示法箭頭排除確定法均衡與結(jié)果均衡與結(jié)果是兩個不同的概念:均衡是策略的組合;結(jié)果是行動的組合。例如:情侶序貫博弈,其中一個納什均衡是(足球,{足球,芭蕾}),這是一個策略組合,因為它給每個局中人規(guī)定了在各種可能發(fā)生的情況下應(yīng)當采取的應(yīng)對行動,對于每個局中人來講,它都是一個完整的行動方案。按照上述這個均衡策略組合所導致的博弈結(jié)果是(足球,足球),即,博弈的最終結(jié)局是男女雙方都去看足球。(足球,足球)是行動的組合。同時決策博弈中,由于“策略”選擇等同于“行動”選擇,所以那時候說“均衡”與說“結(jié)果”沒有多少不同。至于符號方面,表示策略組合用圓括號,表示結(jié)果也用圓括號,但表示策略組合的圓括號里面的各項是策略,(理應(yīng))用花括號括住,而表示結(jié)果的圓括號里面的各項是行動,不該用花括號括住。練習策略組合?納什均衡?策略組合策略組合星號簡示法
:(U,{U’,*})2策略組合的節(jié)點表示法:({U/D},{U’/D’,U’’/D’’})8({ab/ac/ad},{ch/ck,dp/de},{bf/bg,em/en})4-4倒推法(逆向推導法)在序貫博弈中,由于均衡與結(jié)果是兩個不同的概念,所以求解納什均衡的虛線排除確定法(或箭頭排除確定法),并不適用于求解序貫博弈的結(jié)果。一般使用倒推法(逆向推導法)求序貫博弈的結(jié)果。一般步驟從序貫博弈的最后一個決策階段開始分析,每一次確定出所分析階段局中人的行動選擇和路徑。然后再確定前一階段決策的局中人的行動選擇和路徑。由于倒推法確定的各個局中人在各階段的選擇,都建立在后續(xù)階段各個局中人理性選擇的基礎(chǔ)上,因而很自然就排除了包含不可置信威脅或承諾的可能性,因此它得到的結(jié)論比較可靠,并且由此確定下來的各個局中人的策略組合,具有較好的穩(wěn)定性。事實上,倒推法是序貫博弈中使用得最普遍的方法,它對于分析完全并且完美信息的序貫博弈非常有用。4-5先動優(yōu)勢與后動優(yōu)勢
局中人先行得益大于后行得益的情況,叫做先動優(yōu)勢?!跋认率譃閺姟?/p>
局中人后行動得益大于先行動得益的情況,叫做后動優(yōu)勢。“后下手也不一定遭殃”:
eg.最優(yōu)的制度;兩商家確定價格甲有后動優(yōu)勢甲有先動優(yōu)勢,乙有后動優(yōu)勢4-6博弈論給自己出難題難題1:100元的分配(公平思想)難題2:抓錢博弈(蜈蚣博弈)難題3:旅行者困境難題1:100元的分配從一個班級里面挑出A、B兩位同學,然后主持人拿出100元,讓A、B兩位同學就如何分配這100元進行一輪討價還價:首先由A提出一個分配方案,比如“我拿75,你拿25”,如果B同意,則按照A所建議的方案在他們之間瓜分這100元。如果B拒絕A的提議,則兩個人都將一文不名。難題2:抓錢博弈(蜈蚣博弈)主持A、B兩人做博弈游戲,決策點上面寫誰就輪到誰決策。一開始,A決策。如果A決策結(jié)束游戲,A得1,B得0;如果A不結(jié)束游戲,就輪到B決策,這時如果B決策結(jié)束游戲,B得2,A得0;如果B不結(jié)束游戲,則又輪到A決策。所以你看,兩人輪流決策,獎賞越來越大,誰決策結(jié)束游戲,誰就得到全部獎賞,而對方什么也得不到。難題3:旅行者困境兩個旅行者從一個以出產(chǎn)細瓷花瓶著名的地方旅行回來,他們都買了一樣價格的花瓶。提
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東理工學院《街舞》2023-2024學年第一學期期末試卷
- 廣東科技學院《薪酬管理》2023-2024學年第一學期期末試卷
- 廣東江門幼兒師范高等??茖W?!毒坝^設(shè)計基礎(chǔ)》2023-2024學年第一學期期末試卷
- 廣東機電職業(yè)技術(shù)學院《精確農(nóng)業(yè)概論》2023-2024學年第一學期期末試卷
- 廣東行政職業(yè)學院《移動通信技術(shù)》2023-2024學年第一學期期末試卷
- 廣東工業(yè)大學《特種材料連接》2023-2024學年第一學期期末試卷
- 廣東工程職業(yè)技術(shù)學院《互聯(lián)網(wǎng)金融產(chǎn)品規(guī)劃與設(shè)計》2023-2024學年第一學期期末試卷
- 廣東第二師范學院《公司理財雙語》2023-2024學年第一學期期末試卷
- 廣東財貿(mào)職業(yè)學院《傳統(tǒng)造像(圓雕)》2023-2024學年第一學期期末試卷
- 小班安全找媽媽課件
- 普外科醫(yī)療組長競聘演講
- 北京市朝陽區(qū)2022-2023學年三年級上學期英語期末試卷
- GB/T 9755-2024合成樹脂乳液墻面涂料
- 嗶哩嗶哩MATES人群資產(chǎn)經(jīng)營白皮書【嗶哩嗶哩】
- 【歷史】第一、二單元測試題2024~2025學年統(tǒng)編版七年級歷史上冊
- 婚姻家庭規(guī)劃
- 認識實習報告(10篇)
- 【MOOC】內(nèi)科護理學-中山大學 中國大學慕課MOOC答案
- 【企業(yè)盈利能力探析的國內(nèi)外文獻綜述2400字】
- 醫(yī)學生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)智慧樹知到期末考試答案2024年
- (正式版)JBT 10437-2024 電線電纜用可交聯(lián)聚乙烯絕緣料
評論
0/150
提交評論