純策略 同時行動博弈_第1頁
純策略 同時行動博弈_第2頁
純策略 同時行動博弈_第3頁
純策略 同時行動博弈_第4頁
純策略 同時行動博弈_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

11第四章純策略同時行動博弈(Ⅰ):離散策略情形小組成員張曼麗吳杰張幸孫玥吳蓉蓉虞玲玉王安東王丹萍22內(nèi)容提要4.1-4.2基本概念張曼麗4.3-4.5兩人參與的同時博弈的分析方法吳蓉蓉4.6-4.8多種類型的同時行動博弈王丹萍、王安東3344.1離散型策略同時行動博弈的描述純策略同時行動博弈(Ⅰ):離散策略情形45同時行動博弈的概念:參與人在同一時間選擇他們各自的行動或者即使不是同時行動,但參與人在分別選擇各自行動時,不清楚其他人所做的和將要做的選擇,那么這樣的博弈也叫同時行動博弈。同時行動博弈的例子:選民投票(同時進(jìn)行的)、商家再決定各自的產(chǎn)品決策時(非同時)。54.1離散型策略同時行動博弈的描述6策略(strategies):一套完整的行動計劃?;旌喜呗?mixedstrategies):隨機選擇的行動。純策略(purestrategies):最初定義的行動。離散型策略:每個參與人只擁有有限個離散型純策略供其選擇。連續(xù)性策略:每個參與人的純策略可以是一個連續(xù)區(qū)域中的任意一個數(shù)。64.1離散型策略同時行動博弈的描述行動博弈表(gametable):博弈的規(guī)范式或策略式。7表4-1博弈表特點:當(dāng)涉及兩個人的決策時博弈表便是二維的。74.1離散型策略同時行動博弈的描述8零和博弈(zero-sum):博弈雙方的利益完全相對。特點:一方個人的支付就是另一個人的支付相反數(shù)。表4-2零和博弈情況下博弈表的形式84.1離散型策略同時行動博弈的描述94.2納什均衡910納什均衡(Nashequilibrium):博弈中的一個策略組合,在其他參與人都堅守這個策略組合中的策略不變的情況下,沒有參與人可以通過改變自己的策略而得到一個更高的支付。均衡(equilibrium):意味著每個參與人所采取的策略都是對于其他人策略的最優(yōu)反應(yīng)。104.2納什均衡同時博弈VS最優(yōu)反應(yīng)是否矛盾?114.2納什均衡如何理解沒有參與人可以通過改變自己的策略使其支付更高?注意:1.納什均衡不要求構(gòu)成均衡的策略嚴(yán)格優(yōu)于其他策略2.納什均衡并不是指所有參與人的支付最優(yōu)需要澄清的誤區(qū):(以上我們提到的,在納什均衡中每個參與人的選擇都是對其他人策略的最優(yōu)反應(yīng))怎么能在不知道其他參與人選擇的情況下,做出反應(yīng)呢?可以進(jìn)行盲目猜測,并且期望這些猜測是有效的;依據(jù)經(jīng)驗和觀察;使用“想其他人之所想”的邏輯。博弈學(xué)家將博弈的參與人都獲得了關(guān)于其他人在同時博弈中選擇的認(rèn)識的這一過程稱之為“信念”。124.2納什均衡13從信念角度理解納什均衡:策略組合有兩個性質(zhì)每個參與人都對其他參與人的策略有正確的信念;給定每個參與人關(guān)于其他參與人策略的信念,自己所選擇的策略式最優(yōu)的。這樣理解納什均衡的優(yōu)點:最優(yōu)反應(yīng)不再具有邏輯上的缺陷。每個參與人都選擇了基于自己業(yè)已形成的關(guān)于其他人行動的信念的最優(yōu)反應(yīng),而不是對沒有觀察到的其他參與人真實行動的最優(yōu)反應(yīng)。134.2納什均衡144.3占優(yōu)策略選擇1415兩個人都存在占有策略的情形對于丈夫和妻子來說,“認(rèn)罪”都是占有策略,因此(認(rèn)罪,認(rèn)罪)這個結(jié)果可以被預(yù)見,且這也是一個納什均衡,因為所有人都選擇了他或她的最優(yōu)策略。16只有一個參與者存在占有策略的情形

在這個博弈中,聯(lián)邦儲備銀行不存在占有策略,國會的選擇很清楚,無論銀行做什么選擇,它選擇“預(yù)算赤字”的支付都將大于選擇“預(yù)算平衡”的支付,所以聯(lián)邦儲備銀行也會考慮到國會將會選擇其占有策略(預(yù)算赤字),并在此信念上做出自己的最優(yōu)策略,即“高利率”。表4-5貨幣政策——財政政策的博弈17重復(fù)剔除劣策略在參與人可選擇策略大于兩個的時候,參與者可以通過剔除劣于占優(yōu)策略的其他某些策略來縮小規(guī)模,求得均衡?!爸貜?fù)剔除劣策略”就是不斷剔除劣策略,知道不能進(jìn)一步剔除為止的過程,如果這個過程只剩下唯一的結(jié)果,則這個博弈就是“占優(yōu)可解”,這個結(jié)果就是納什均衡。18弱的劣策略剔除如上表,對于行而言,“下”弱優(yōu)占于“上”,對于列而言,“右”弱優(yōu)占于“左”,這樣,我們使用占優(yōu)可解時,獲得的納什均衡是(下,右),但是(上,右)和(下,左)也是納什均衡,所以運用若占優(yōu)來剔除某些策略時,要逐格檢查單元格。表4-7弱的劣策略的剔除194.4最優(yōu)反應(yīng)分析1920最優(yōu)反應(yīng)分析:根據(jù)其他人的可選策略來決定自己在別人的決策下的最優(yōu)策略,是一種全面搜索納什均衡的方法。4.4最優(yōu)反應(yīng)分析214.5零和博弈的最大值最小值方法2122Max=10Min=2Min=5.6Min=1Min=-2Max=5.6Max=13在零和博弈中,博弈雙方的利益是完全對立的,對手的最優(yōu)策略對自己則是最不利的,于是參與者會從最糟糕的選擇中選出最好的結(jié)果。基于之一特征,我們使用最小最大值方法來替代最優(yōu)反應(yīng)分析。4.5零和博弈的最大值最小值方法234.6三人參與的博弈234.6三人參與的博弈該博弈的三個參與人Emily,Nina和Talia分別要決定是否為花園的新建作貢獻(xiàn)。若三人同時都作貢獻(xiàn),花園是最大和最美的;若只有兩人作貢獻(xiàn),花園的規(guī)模和美麗程度中等;若僅一人作貢獻(xiàn)花園是最小的且不美麗。純策略納什均衡的分析方法適用于包含任何數(shù)目參與人的同時行動博弈。兩人博弈三人博弈:街心花園博弈很顯然,三者都希望自己能做出盡可能小的貢獻(xiàn)的同時獲得最大的效用,然而她們在選擇是否作貢獻(xiàn)時都不清楚對方的行動,這是一個三人參與的同時行動博弈。4.6三人參與的博弈我們通過兩個頁面來表示街心花園博弈的三維支付表。Talia作貢獻(xiàn)Talia不作貢獻(xiàn)4.6三人參與的博弈1.考察各個參與人是否存在占優(yōu)策略Talia作貢獻(xiàn)

Talia不作貢獻(xiàn)從Emily角度看,論其他人如何選擇,她的最優(yōu)選擇都是不作貢獻(xiàn)。同樣的,Nina和Talia的占優(yōu)策略也是不作貢獻(xiàn)。所以,納什均衡:三人都選擇不作貢獻(xiàn)。4.6三人參與的博弈2.使用逐個單元格檢查的方法例如我們考察支付結(jié)果為(3,3,6)的這一個單元格Talia作貢獻(xiàn)

Talia不作貢獻(xiàn)

Emily和Nina均可以通過單邊改變策略使自己情況變好,從而確定該單元格非納什均衡的結(jié)果。4.6三人參與的博弈3.用最優(yōu)反應(yīng)策略分析Talia作貢獻(xiàn)Talia不作貢獻(xiàn)294.7純策略博弈的多重均衡294.7純策略博弈的多重均衡我們用協(xié)調(diào)博弈來說明有些博弈可能包含多個均衡的情況,其中參與人之間存在某些共同但不完全一致的利益,但由于他們的決策是相互獨立的。要協(xié)調(diào)一致以達(dá)到共同偏好的結(jié)構(gòu)并不容易。現(xiàn)在我們設(shè)想有這樣一件事,兩個大學(xué)生Sally和Harry在圖書館相遇并且聊得非常愉快。待要各自回教室上課時,兩人還意猶未盡,于是相約4:30下課后兩人一起喝咖啡??墒莾扇嘶厝ズ蟀l(fā)現(xiàn)剛剛忘記約定見面的地方,兩個可能的地方——星巴克和本地咖啡店位于相反的地方,所以不能同時去到,兩人因為交換手機號碼而又無法聯(lián)系,他們該怎么選擇呢?OR4.7.1Harry會遇見Sally嗎?完全協(xié)調(diào)博弈采取哪一種行動不重要,重要的是行動要協(xié)調(diào)一致——所以將該博弈稱為完全協(xié)調(diào)博弈。然而,他們能夠行動統(tǒng)一么?4.7.2Harry會遇見Sally嗎?在哪兒遇見?安全博弈假設(shè)他們都更喜歡本地咖啡店,那么我們將他們在本地咖啡店相遇的支付改為2,如下表所示當(dāng)且僅當(dāng)參與人對對方選擇適當(dāng)?shù)男袆泳哂谐浞中判臅r,才能達(dá)到雙方都更偏好的均衡,因此,這個博弈又稱為安全博弈。4.7.3Harry會遇見Sally嗎?在哪兒遇見?性別戰(zhàn)假設(shè)兩個參與人渴望相遇,但他們分別喜歡的是不同的咖啡店。若在星巴克相遇,Harry可以達(dá)到為2的支付,而Sally只能得到為1的支付;若在本地咖啡店會面則相反。我們稱此新的博弈為性別戰(zhàn)。在性別戰(zhàn)中,協(xié)調(diào)失敗的風(fēng)險要更大一些。在兩個納什均衡上,他們的支付是不對稱的,各自對兩個均衡的偏好是有沖突的。表現(xiàn)強硬與表現(xiàn)溫和4.7.4James會遇見Dean嗎?懦夫博弈懦夫博弈也是一個協(xié)調(diào)博弈,但它強調(diào)的是參與人要盡量避免而不是選擇那些一致的行動。懦夫博弈的支付取決于參與人對“壞”結(jié)果的評價和認(rèn)可程度,是車毀人亡更“壞”,還是被認(rèn)為是懦夫更“壞”。下圖的支付結(jié)構(gòu)是對認(rèn)為尊嚴(yán)受損比車毀人亡好一些的情形的刻畫。354.8不存在純策略納什均衡的情形

NoEquilibriumInPureStrategies354.8不存在純策略納什均衡的情形EachofthegamesconsideredsofarhashadatleastoneNashEquilibrium(納什均衡)inpurestrategies(純策略).Unfortunately,notallgamesthatwecomeacrossinthestudyofstrategyandgametheorywillhaveaNashEquilibrium.純策略均衡不存在的情形InthisStrategyGame,whatisimportantisnotwhatplayersshoulddo,butwhatplayersshouldnotdo.Ifoneplayeralwaysengagesinone

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論