博弈論課件4兩人博弈_第1頁
博弈論課件4兩人博弈_第2頁
博弈論課件4兩人博弈_第3頁
博弈論課件4兩人博弈_第4頁
博弈論課件4兩人博弈_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章 完全信息靜態(tài)博弈§2.1 兩人博弈一、兩人博弈的基本模型二、兩人零和博弈三、兩人博弈的占優(yōu)策略均衡

.2023/7/271中南財經政法大學信息學院占優(yōu)策略均衡的實質是—追求最佳!

不是所有博弈都有占優(yōu)策略,哪怕這個博弈只有一個參與者。實際上,優(yōu)勢與其說是一種規(guī)律,不如說是一種例外。雖然出現一個占優(yōu)策略可以大大簡化行動的規(guī)則,但這些規(guī)則卻并不適用于大多數現實生活中的博弈。這時候我們必須用到其他原理。當博弈問題不存在占優(yōu)策略均衡,即博弈雙方都沒有占優(yōu)策略,但有可能有一博弈方有占優(yōu)策略,假如你有一個占優(yōu)策略,你可以選擇采用,并且知道你的對手若是有一個優(yōu)勢策略他也會采納;分析的線條也就非常明朗了。.2023/7/272中南財經政法大學信息學院占優(yōu)策略的情形分析情形一:占優(yōu)均衡存在——雙方都有一個占優(yōu)策略。.2023/7/273中南財經政法大學信息學院情形二:某博弈方有一個優(yōu)勢策略,其他博弈方則沒有

只有一方擁有優(yōu)勢策略的博弈其實也非常簡單。擁有優(yōu)勢策略的一方將采用其優(yōu)勢策略,另一方則針對這個策略采用自己的最佳策略。

.2023/7/274中南財經政法大學信息學院經典案例二——智豬博弈

假設豬圈有一頭大豬,一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著一控制豬食的按鈕,按一下按鈕,10個單位的豬食進槽,但先按按鈕需要付出2個單位的成本。若大豬先到,大豬可吃到9個單位的食物,小豬只能吃到一個單位;若小豬先到,小豬可吃到4個單位,大豬也吃到6個單位;若兩豬同時到,大豬吃到7個單位,小豬吃到3個單位,在這種情況下,你認為對小豬來說最佳選擇是什么?.2023/7/275中南財經政法大學信息學院主動去按按鈕;等大豬去按,如果大豬不去在去按;去按按鈕,然后快速跑向豬食;耐心等待,決不去按按鈕。分析:智豬博弈的盈利矩陣為.2023/7/276中南財經政法大學信息學院

5,14,49,-10,0等待小豬大豬按等待按等待是小豬的嚴格占優(yōu)策略大豬有無嚴格占優(yōu)策略?4大于10大于-1答案是:小豬將舒舒服服地等在食槽邊,而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。.2023/7/277中南財經政法大學信息學院例1股市博弈在股票市場上,大戶是大豬,他們要進行技術分析,收集信息、預測股價走勢,但大量散戶就是小豬。他們不會花成本去進行技術分析,而是跟著大戶的投資策略進行股票買賣,即所謂“散戶跟大戶”的現象。

智豬博弈:對諸多經濟現象的解釋.2023/7/278中南財經政法大學信息學院例2為何股份公司中的大股東才有投票權?

在股份公司中,大股東是大豬,他們要收集信息監(jiān)督經理,因而擁有決定經理任免的投票權,而小股東是小豬,不會直接花精力去監(jiān)督經理,因而沒有投票權。.2023/7/279中南財經政法大學信息學院

例3為什么中小企業(yè)不會花錢去開發(fā)新產品?

在技術創(chuàng)新市場上,大企業(yè)是大豬,它們投入大量資金進行技術創(chuàng)新,開發(fā)新產品,而中小企業(yè)是小豬,不會進行大規(guī)模技術創(chuàng)新,而是等待大企業(yè)的新產品形成新的市場后生產模仿大企業(yè)的新產品的產品去銷售。.2023/7/2710中南財經政法大學信息學院

例4為什么只有大企業(yè)才會花巨額打廣告?

大企業(yè)是大豬,中小企業(yè)是小豬。大企業(yè)投入大量資金為產品打廣告,中小企業(yè)等大企業(yè)的廣告為產品打開銷路形成市場后才生產類似產品進行銷售。

.2023/7/2711中南財經政法大學信息學院結果-大豬行動

“搭便車”現象;公共物品,窮人和富人修路博弈;大股東對管理者的監(jiān)督;天塌下來有高個子頂著。.2023/7/2712中南財經政法大學信息學院對策:解決這一現象的關鍵是加強決策的透明度和民主參與能力,讓每一個員工都有合適的途徑表達自己的觀點。同時要培養(yǎng)員工的團隊意識,盡量減少非正式組織對組織的影響力。以上僅僅是職場中幾個極為常見的博弈小例子??匆豢?,想一想,我們在生活中是不是經常充當了一些“大豬”或“小豬”的角色呢。.2023/7/2713中南財經政法大學信息學院

假如你有一個劣勢策略,你應該避免采用,并且知道你的對手若是有一個劣勢策略他也會規(guī)避。在你沒有優(yōu)勢策略的情況下,你要做的就是:

不能追求最佳,就要避免最差即剔除所有劣勢策略,不予考慮。如此一步一步做下去。.2023/7/2714中南財經政法大學信息學院四、重復剔除的占優(yōu)均衡(嚴劣策略剔除法)“重復剔除嚴格劣策略”(iteratedeliminationofstrictlydominatedstrategy)的思路:首先找出某博弈方的劣策略(dominatedstrategy),把這個劣策略剔除后,剩下的是一個不包含已剔除劣策略的新的博弈;然后在剔除這個新的博弈中的劣策略;繼續(xù)這個過程,直到沒有劣策略存在。如果剩下的策略組合是唯一的,這個唯一的策略組合就是“重復剔除占優(yōu)均衡”(iterateddominanceequilibrium)。如果這樣的解存在,我們說該博弈是“重復剔除占優(yōu)可解的”(iterateddominancesolvable)..2023/7/2715中南財經政法大學信息學院重復剔除嚴格劣策略:思路:首先找到某個博弈方的劣策略(假定存在),把這個劣策略從策略空間剔除掉,重新構造一個不包含已剔除策略的新的博弈,然后再剔除這個新的博弈中的某個博弈方的劣策略,一直重復這個過程,直到只剩下唯一的策略組合為止。這個唯一剩下的策略組合就是這個博弈的均衡解,稱為“重復剔除的占優(yōu)均衡”。.2023/7/2716中南財經政法大學信息學院嚴劣策略剔除法(重復剔除的占優(yōu)均衡)這種剔除法只是一個過程,它是決策雙方通過對各種純策略的優(yōu)劣,逐次保留嚴優(yōu)策略,剔除嚴劣策略,在博弈G中博弈方的嚴劣策當然是博弈方實際上不愿選擇的策略,因此可以從博弈方的策略集中去掉,最終得到一個雙方都認可的博弈策略組合或策略空間。

例1、G={S1,S2,C}中

C為.2023/7/2717中南財經政法大學信息學院分析:博弈方甲各項純策略α1,α2,

α3之盈利向量(4,5,6)(2,8,3)(3,9,2)

顯然α1,α2,

α3之間不存在嚴優(yōu)關系。(連弱優(yōu)關系都不存在)

博弈方乙的各項純策略β1,β2,

β3之盈利向量 顯然β3嚴優(yōu)于β2,因而剔除β2。.2023/7/2718中南財經政法大學信息學院一次嚴劣策略剔除后,原博弈問題為博弈方甲的α1

,α2,α3之盈利向量分別為

(4,6)(2,3)(3,2), 顯然α1

嚴優(yōu)于α2,α3, 因而對博弈方甲可剔除α2,α3。 博弈方乙的新策略β1

,β3之盈利向量分別為

(3,1,0)’與(2,6,8)’

顯然,β1

與β3無嚴優(yōu)關系。.2023/7/2719中南財經政法大學信息學院

二次嚴劣策略剔除后,得新博弈問題二次保持嚴優(yōu)策略后,局中人甲只保留了純策略α1,這時局中人乙也應選擇純策略β1

。例2、用嚴劣策略剔除法分析下面博弈

G={S1,S2,C}.2023/7/2720中南財經政法大學信息學院解:用嚴劣策略剔除法分析的,局中人甲、乙的策略組合為(α1

,β1

)。例3、囚徒困境

C為分析: 甲的嚴優(yōu)策略為“坦白” 乙的嚴優(yōu)策略為“坦白”.2023/7/2721中南財經政法大學信息學院

經典案例一——囚徒困境-8,-80,-15-15,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴-8大于-150大于-1-8大于-150大于-1抵賴是A的嚴格劣戰(zhàn)略抵賴是B的嚴格劣戰(zhàn)略則該博弈有嚴劣策略剔除法的策略組合為(坦白,坦白).2023/7/2722中南財經政法大學信息學院1,01,20,30,1M列先生行先生UDL0,12,0R行:沒有占優(yōu)戰(zhàn)略列:M嚴格優(yōu)于R剔除R行:u優(yōu)于D列:無占優(yōu)戰(zhàn)略剔除DM優(yōu)于L(U,M)是重復剔除的占優(yōu)均衡例4:.2023/7/2723中南財經政法大學信息學院一般定義:若博弈G中每個博弈方都反復去掉嚴劣策略后剩下唯一策略組合s*=(s1*,s2*,…,sn*),則稱s*=(s1*,s2*,…,sn*)為G的嚴劣策略的剔除法求得的均衡。求解嚴劣策略的剔除法的方法成為嚴劣策略反復消去法(結果為——重復剔除的占優(yōu)均衡)。注意一:嚴劣策略反復消去法中每次消去的必須是嚴格劣的策略,否則會出現一些意想不到的結果。.2023/7/2724中南財經政法大學信息學院例5:博弈G如下圖:1,81,62,80,80,80,91,50,80,6博弈方ⅡLMR.2023/7/2725中南財經政法大學信息學院

解:方法1)博弈方Ⅱ的策略“L”和“M”都是策略“R”的下策(是嚴格下策),消去策略“L”和“M”后為:0,90,81,8

R

博弈方Ⅰ的策略“S”和“D”都是策略“U”的嚴格下策,消去策略“S”和“D”后剩下唯一策略組合(U,R)。2,81,61,80,80,60,80,81,50,9.2023/7/2726中南財經政法大學信息學院

方法2)博弈方Ⅰ的策略“S”和“D”都是策略“U”的下策(是嚴格下策),消去策略“S”和“D”后為:1,81,62,8LMRU

博弈方Ⅱ的策略“M”和“R”都是策略“L”的下策(但不是嚴格下策),消去策略“M”和“R”后剩下策略組合(U,L)。同時,策略“L”和“M”都是策略“R”的下策,消去策略“L”和“M”后剩下策略組合(U,R)。

由上例可以看出:如果不是按反復消去嚴格下策,最后將得到不同的策略組合。.2023/7/2727中南財經政法大學信息學院重復剔除的占優(yōu)均衡的理解策略組合稱為重復剔除的占優(yōu)均衡,如果它是重復剔除劣策略后剩下的唯一策略組合。如果這種唯一策略組合是存在的,我們就說該博弈是重復剔除占優(yōu)可解。

注意二:如果重復剔除后的策略組合不唯一,該博弈就不是重復剔除占優(yōu)可解的。.2023/7/2728中南財經政法大學信息學院注意三:1、重復剔除的占優(yōu)均衡結果與劣策略的剔除順序是否有關取決于剔除的是否是嚴格劣策略。2、重復剔除的占優(yōu)均衡要求每個博弈方是理性的,而且要求“理性”是博弈方的共同知識。即:所有博弈方知道所有博弈方是理性的,所有博弈方知道所有博弈方知道所有參與方是理性的。.2023/7/2729中南財經政法大學信息學院2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除順序:R3、C3、C2、R2,得策略組合(R1,C1)

故一般使用(嚴格)劣策略剔除,可以看到,(R1,C3)(R1,C1)雖都是剔除占優(yōu)均衡,但在這里是不可解的。剔除順序:C2、R2、C1、R3,得策略組合(R1,C3)例如:.2023/7/2730中南財經政法大學信息學院3、盡管許多博弈中重復剔除的占優(yōu)均衡是一個合理的預測,但并不總是如此,尤其是大概得益某些極端值的時候。8,10-1000,97,66,5博弈方B博弈方AUDLRU是A的最優(yōu)選擇,但是,只要有1/1000的概率B選R,A就會選D.2023/7/2731中南財經政法大學信息學院應用案例1——如何以弱敵強

在戰(zhàn)爭史上,以弱勝強的例子是很多的。在商業(yè)競爭中,以弱敵強也是經常會遇到的情形。在二戰(zhàn)中的諾曼底登陸戰(zhàn)的謀略策劃中,盟軍就面臨以弱敵強的問題。盟軍有兩個可以選擇的登陸目標地,一是加萊,二是諾曼底。德國守軍在人數上超過了盟軍,并且就軍事進攻而言,在人數相同的情況下,攻方與守方相比會處于不利的情形。.2023/7/2732中南財經政法大學信息學院

下面,將這種情形模型化。有一支軍隊準備進攻一座城市,它有軍力兩個師。守城軍隊有三個師。通往城市有甲、乙兩條道路或方向。兩軍相遇時,人數居多的一方取勝,當兩方人數相等時,守方獲勝。假定軍隊只能整師調動。

.2023/7/2733中南財經政法大學信息學院

攻方戰(zhàn)略:

a=兩個師集中沿甲方向進攻

b=兵分兩路,一個師沿甲方向進攻,另一個師沿乙方向進攻

c=兩個師集中沿乙方向進攻.2023/7/2734中南財經政法大學信息學院

守方戰(zhàn)略:

A=三個師集中守甲方向

B=兩個師守甲方向,一個師守乙方向

C=一個師守甲方向,兩個師守乙方向

D=三個師集中守乙方向.2023/7/2735中南財經政法大學信息學院用“+”、“-”,分別表示勝和敗,見下表

守方

ABCDa

進攻方bc

表1以弱敵強博弈-,+-,++,-+,-+,--,+-,++,-+,-+,--,+-,+.2023/7/2736中南財經政法大學信息學院

用“重復剔除劣策略”分析:進攻方無劣策略,但守方有劣策略,A劣于B,D劣于C,故守方不會采用策略B和C,剔除后的博弈變?yōu)椋?/p>

守方

BCa

進攻方bc

表2守方剔除劣策略后的博弈

-,++,--,+-,++,--,+.2023/7/2737中南財經政法大學信息學院

攻方知道守方不會選A和D,他由此知道博弈變成上圖所示。此時,攻方就有一個劣策略b,他剔除b后得到新的博弈,見下表:守方

進攻方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論