版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
博弈論基本模型什么是博弈活動(dòng)博弈活動(dòng)具有以下特征:1.有人參加。我們把參加的人稱(chēng)為參與人或局中人。2.在每一步,局中人有明確的、可以選擇的行動(dòng)。3.有明確的行動(dòng)順序。4.參與人在選擇行動(dòng)時(shí)有明確的信息。5.活動(dòng)結(jié)束時(shí)有明確的支付規(guī)則。具有上述特征的活動(dòng)稱(chēng)為博弈活動(dòng)。
合作博弈與非合作博弈如果在一項(xiàng)活動(dòng)中,參與人具有合作的意向,而且合作的行為又能得到有力的保障,則稱(chēng)這種博弈活動(dòng)為合作博弈,否則稱(chēng)為非合作博弈。對(duì)于非合作博弈,從模型構(gòu)建的形式上又可分為策略型博弈與擴(kuò)展型博弈。1.1有限擴(kuò)展型博弈模型博弈模型的構(gòu)建應(yīng)用博弈論方法分析研究經(jīng)濟(jì)管理或其它領(lǐng)域中的問(wèn)題,首先要構(gòu)造出博弈模型來(lái),因而需要從大量的博弈活動(dòng)中抽象出博弈模型的基本要素,對(duì)這些要素進(jìn)行嚴(yán)格、準(zhǔn)確的刻畫(huà)后,形成博弈模型。將博弈活動(dòng)構(gòu)造成博弈模型,需要了解以下6個(gè)方面的情況:1.參與人;2.外生事件的概率分布;3.參與人選擇行動(dòng)的次序;4.參與人所能選擇的行動(dòng);5.參與人在選擇行動(dòng)時(shí)所了解的信息。6.參與人的支付。構(gòu)造博弈模型所需要的要素1.局中人集合
,稱(chēng)為局中人或參與人集合。中元素稱(chēng)為參與人或局中人。參與人不專(zhuān)指人,它泛指參與博弈活動(dòng)的政府、企業(yè)、地區(qū)、國(guó)家、個(gè)人……等決策主體。通常用“0”表示虛擬局中人,它的行為是以確定的概率分布進(jìn)行隨機(jī)選擇,表示實(shí)際參與人。2.行動(dòng)集合
稱(chēng)參與人在博弈中所有可能選擇的行動(dòng)構(gòu)成的集合為局中人i的行動(dòng)集合。中的元素稱(chēng)為局中人i的行動(dòng)。局中人的行動(dòng)集合可能是有限集,也可能是無(wú)限集。如果博弈活動(dòng)中每個(gè)局中人的行動(dòng)集合都是有限集,且每個(gè)局中人行動(dòng)的次數(shù)也是有限的,稱(chēng)該博弈為有限博弈。3.博弈樹(shù)對(duì)于有限博弈,可用博弈樹(shù)直觀(guān)地刻畫(huà)它,市場(chǎng)進(jìn)入問(wèn)題的博弈樹(shù)如圖1-1所示。
容許I01①①①②容許抵制②進(jìn)入進(jìn)入不進(jìn)不進(jìn)旺盛疲軟圖1-1市場(chǎng)進(jìn)入博弈樹(shù)II抵制
I抵制4.博弈樹(shù)中終點(diǎn)Z下面的向量稱(chēng)為支付向量,它的第個(gè)分量表示博弈結(jié)束于Z時(shí),局中人i所得的支付。支付可表示參與人的某種收益或損失。本書(shū)中的支付指收益、效用、利潤(rùn)等。正式地,支付向量是終點(diǎn)集合Z到n維向量集合的映射。5.信息集與信息集分割信息集由同一個(gè)局中人、在相同的時(shí)點(diǎn)上的具有相同信息的決策節(jié)點(diǎn)組成。用表示局中人i的第k個(gè)信息集。它滿(mǎn)足(1)(表示空集);(2)從博弈起始點(diǎn)到任一終點(diǎn)的路徑至多與交一點(diǎn)(描寫(xiě)同一信息集中的節(jié)點(diǎn)處于同一時(shí)點(diǎn)上);(3)從中的任一節(jié)點(diǎn)出發(fā),局中人i可能選擇的行動(dòng)集合都相同(因?yàn)榫种腥嗽谕恍畔⒓牟煌?jié)點(diǎn)上具有相同的信息)。在博弈樹(shù)上,將屬于同一信息集的節(jié)點(diǎn)用虛線(xiàn)框在一起。稱(chēng)為局中人的信息集類(lèi)(在數(shù)學(xué)上,稱(chēng)以集合為元素的集合為類(lèi))。稱(chēng)為信息集分割。有限擴(kuò)展型博弈模型的定義定義1.1稱(chēng)為有限擴(kuò)展型博弈模型。其中N為參與人集合,Y為博弈樹(shù),U為支付向量,I為信息集分割,q為外生事件的概率分布。完全信息博弈與不完全信息博弈如果所有的局中人對(duì)構(gòu)成G的元素N,Y,U,I,q都完全了解,稱(chēng)G為完全信息博弈,否則為不完全信息博弈。靜態(tài)博弈與動(dòng)態(tài)博弈如果所有的局中人都同時(shí)選擇行動(dòng),稱(chēng)G為靜態(tài)博弈,否則稱(chēng)G為動(dòng)態(tài)博弈。靜態(tài)博弈更本質(zhì)的特征是所有局中人在選擇行動(dòng)時(shí)不知道對(duì)手選擇了什么行動(dòng)。例1.1考慮按以下步驟進(jìn)行的博弈活動(dòng)。第1步局中人1從字母T,H中選一個(gè);第2步局中人2不知第1步的選擇,再?gòu)腍,T中選一字母;第3步局中人知道1,2兩步的選擇,又從T,H中選一字母;第4步局中人2不知第3步的選擇,但知1,2兩步的選擇,最后從T,H中選一字母,博弈結(jié)束。按照每步選擇的結(jié)果,每個(gè)局中人各得一筆報(bào)酬(略)。該博弈的局中人集合.該博弈的信息集合分別為,其中。②②②①HHHTTT圖1-2①①①①HHTHTHTHTHHTHTHTTHHHTTTT②②②②②②②信息集可以告訴我們以下4點(diǎn)1.在一個(gè)信息集上應(yīng)由哪個(gè)參與人選擇行動(dòng)。2.從一個(gè)信息集出發(fā),局中人可能選擇哪些行動(dòng)。3.局中人在一個(gè)信息集上選擇行動(dòng)時(shí)已知道了哪些信息。4.單點(diǎn)信息集表明相應(yīng)的局中人完全了解博弈從開(kāi)始到該信息集的博弈歷程。完美信息博弈如果G的每個(gè)信息集都是單點(diǎn)信息集。表明博弈的每個(gè)參與人在選擇行動(dòng)時(shí)對(duì)博弈到現(xiàn)在為止的歷程都完全了解,這時(shí)稱(chēng)G為完美信息博弈。擴(kuò)展型博弈不僅能刻畫(huà)動(dòng)態(tài)博弈,也能刻畫(huà)靜態(tài)博弈靜態(tài)擴(kuò)展型博弈的例子例1.2
兩個(gè)參與人同時(shí)從字母T,H中選擇一個(gè),博弈結(jié)束時(shí)兩個(gè)參與人各得一筆支付,該博弈的博弈樹(shù)如圖1-3所示。②②①HHHTTT圖1-3擴(kuò)展型博弈的子博弈擴(kuò)展型博弈的子博弈大體上說(shuō)是原博弈的一部分,但它不能破壞原博弈的信息集。定義1.2設(shè)為一有限擴(kuò)展型博弈,從Y的決策節(jié)點(diǎn)h出發(fā)的子博弈滿(mǎn)足(1)h是G的單點(diǎn)信息集;(2)N;(3)是Y的子樹(shù),它由h及其后的所有節(jié)點(diǎn)與終點(diǎn)構(gòu)成;(4)不能割裂G的信息集;(5)若“自然”仍屬于,則中“自然”的概率分布;(6)設(shè)Z為的終點(diǎn),支付向量。1.2有限擴(kuò)展型博弈的策略策略的定義定義1.3
局中人的策略集合用表示,中的元素稱(chēng)為局中人i的策略。它定義為局中人i的信息集類(lèi)到行動(dòng)集的映射:
策略是信息集的映射,行動(dòng)是映射值。兩者是不同的概念。例1.3
考慮圖1-1所示的擴(kuò)展型博弈的策略。策略表明參與人2在第1個(gè)信息集上選擇行動(dòng),在第2個(gè)信息集上選擇行動(dòng)。其余策略可同樣理解。
容許I01①①◎②容許抵制②進(jìn)入進(jìn)入不進(jìn)不進(jìn)旺盛疲軟圖1-1市場(chǎng)進(jìn)入博弈樹(shù)例1.4考慮例1.1所給出的擴(kuò)展型博弈的策略。
例1.5
考慮例1.2給出的擴(kuò)展型博弈的策略。
在靜態(tài)博弈模型中,局中人策略與行動(dòng)等同。1.3一般擴(kuò)展型博弈模型構(gòu)成一般擴(kuò)展型博弈模型的要素(1)一個(gè)有限的局中人集合:,其中“0”表示虛擬局中人—“自然”,它以確定的概率分布進(jìn)行隨機(jī)選擇。(2)一個(gè)滿(mǎn)足下列三條性質(zhì)的行動(dòng)序列集合H。①H中包含一個(gè)空序列,即;②如果局中人的有限行動(dòng)序列H,則對(duì)正整數(shù),都有
H;③對(duì)于局中人的無(wú)限行動(dòng)序列,若對(duì)任何正整數(shù)都有,則H,否則H。稱(chēng)滿(mǎn)足以上三條性質(zhì)的行動(dòng)序列集合H為歷史集。稱(chēng)歷史集中的元素H為博弈的一段歷史。稱(chēng)一段歷史H為博弈的終點(diǎn),如果它是無(wú)限的()或不存在使H。博弈全體終點(diǎn)構(gòu)成集合記為Z。(3)局中人映射,表示歷史h之后應(yīng)由局中人i選擇行動(dòng)。(4)定義“自然”的行動(dòng)集合上的概率分布為q。(5)信息集分割。對(duì)于每個(gè)局中人,稱(chēng)集合(可為無(wú)窮)為的一個(gè)信息集分割,稱(chēng)為局中人的信息集,如果它滿(mǎn)足性質(zhì)①;②只要與同在內(nèi),則。表示局中人在歷史之后的可能選擇的行動(dòng)集合。③對(duì),中至多有一段歷史與h相交。(6)支付向量支付向量是終點(diǎn)到的映射。其中是當(dāng)博弈結(jié)束于,局中人的支付值。例1.1的一般擴(kuò)展型博弈模型1.局中人集合.2.歷史集合H={,T,H,TT,TH,HT,HH,TTT,TTH,THT,THH,HTT,HTH,HHT,HHH,TTTT,TTTH,TTHT,TTHH,THTT,THTH,THH,THHH,HTTT,HTTH,HTHT,HTHH,HHTT,HHT,HHHT,HHHH}終點(diǎn)集合Z={TTTT,TTTH,TTHT,TTHH,THTT,THTH,THHT,THHH,HTTT,HTTH,HTHT,HTHH,HHTT,HHTH,HHHT,HHHH}3.局中人映射。
,,,4.信息集分割。
其中,,,,.5.支付向量。一般擴(kuò)展型博弈模型的策略和有限擴(kuò)展型模型一樣,一般擴(kuò)展型博弈模型的策略也是定義為信息集類(lèi)到行動(dòng)集的映射。,,(可為)。一般擴(kuò)展型博弈模型的子博弈一般擴(kuò)展型博弈模型的子博弈是從一個(gè)單點(diǎn)信息集引出,由局中人映射所確定的到終點(diǎn)集合的子博弈,子博弈不能割裂原博弈的信息集。1.4策略型博弈模型1.4.1策略型博弈模型的定義定義策略型博弈模型,僅需要局中人、策略、支付這三個(gè)要素。靜態(tài)博弈的策略與行動(dòng)是等同的。策略組合稱(chēng)由每個(gè)局中人的策略所構(gòu)成的向量為一個(gè)策略組合,其中。稱(chēng)n個(gè)局中人的策略集的乘積集合為策略組合集合。支付函數(shù)局中人的支付函數(shù)是定義在策略組合集合S上,取值于實(shí)數(shù)的映射。。局中人i的支付函數(shù)是定義于策略組合集合上,而非i的自身策略集上,表明局中i人的支付不僅與自己的策略有關(guān),也與對(duì)手的策略組合有關(guān),即博弈論中局中人之間的利益是互相制約的。這是博弈論與決策理論的一個(gè)重要區(qū)別。定義1.5
稱(chēng)為一個(gè)策略型博弈模型
例1.6囚徒困境問(wèn)題這個(gè)問(wèn)題可以歸結(jié)為下述靜態(tài)信息完全的博弈模型.其中,局中人集合,1代表罪犯甲,2代表罪犯乙。兩個(gè)局中人具有相同的策略集合:,其中C代表坦白,D代表抗拒的行動(dòng)。對(duì)于策略組合,,兩個(gè)局中人的支付函數(shù)如下:該問(wèn)題對(duì)應(yīng)的擴(kuò)展型博弈模型可用圖1-4示的博弈樹(shù)直觀(guān)給出。
抗拒抗拒抗拒坦白坦白坦白圖1-4①②②1.4.2二人有限策略型博弈模型二人有限策略型博弈模型設(shè)是一個(gè)策略型博弈模型,如果,,,即N是兩個(gè)局中人的集合,都是有限集,稱(chēng)G為二人有限策略型博弈模型。對(duì)于二人有限策略型博弈模型,定義,,.稱(chēng)以下以向量為元素的矩陣為G的支付矩陣。二人有限策略型博弈模型可由支付矩陣完全描述稱(chēng)為參與人1的支付矩陣,
為參與人2的支付矩陣。二人有限策略型博弈G也可稱(chēng)為雙矩陣博弈,記為囚徒困境問(wèn)題是個(gè)二人有限策略型博弈,其支付矩陣為1.4.3重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡定義1.6如果對(duì)于任何策略組合有,則稱(chēng)局中人i的策略嚴(yán)格占優(yōu)策略,或被嚴(yán)格占優(yōu)。在博弈論中,對(duì)于參與人的一個(gè)基本理性假設(shè)是:參與人偏好更高的支付。因而不會(huì)使用被嚴(yán)格占優(yōu)的策略。在上述理性假設(shè)下,我們有理由將被嚴(yán)格占優(yōu)的策略刪除。用剩余的策略組合預(yù)測(cè)博弈的結(jié)果。重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡一個(gè)策略本來(lái)是不被嚴(yán)格占優(yōu)的,但經(jīng)過(guò)一輪刪除被嚴(yán)格占優(yōu)的策略后,它變?yōu)楸粐?yán)格占優(yōu)的策略了,因而我們必須在第2輪中將其刪除。在有限博弈中,這樣的刪除被嚴(yán)格占優(yōu)策略的過(guò)程遲早會(huì)結(jié)束。如果結(jié)束時(shí),僅剩下一個(gè)未被刪除的策略組合,則稱(chēng)為重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡,稱(chēng)該博弈為嚴(yán)格占優(yōu)可解的。我們可用重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡預(yù)測(cè)博弈的結(jié)果。在囚徒困境問(wèn)題中,策略組合是重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡。例1.7伯川德價(jià)格競(jìng)爭(zhēng)假設(shè)雙寡頭壟斷市場(chǎng)中兩個(gè)企業(yè)都可選擇價(jià)格策略高、中、低三種,支付矩陣為該博弈是嚴(yán)格占優(yōu)可解的,策略組合(低,低)為重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡。。并不是每個(gè)策略型博弈都是嚴(yán)格占優(yōu)可解的。例1.8兩個(gè)土地所有者共同擁有一防洪大堤,每個(gè)人分管一段進(jìn)行維護(hù),維護(hù)成本為4。如不維護(hù),洪水造成的損失為10。該博弈的支付矩陣為該博弈不是嚴(yán)格占優(yōu)可解的。對(duì)于不是嚴(yán)格占優(yōu)可解的博弈,將繼續(xù)討論參與人應(yīng)如何選取策略1.5擴(kuò)展型博弈模型轉(zhuǎn)化為策略型博弈模型例1.9
考慮以下動(dòng)態(tài)博弈。第1步,局中人1從{1,2}中選擇一數(shù);第2步,局中人2知道的值。從{1,2}中選;第3步,局中人1知道的值,從{1,2}中選,博弈結(jié)束。對(duì)于給定的()值,局中人2支付給局中人1一筆費(fèi)用:,,,,,,該動(dòng)態(tài)博弈所對(duì)應(yīng)的博弈樹(shù)如圖1-6所示。12122211I15I14I13I122②圖1-6I21I221I112112②①①①①①該動(dòng)態(tài)博弈所對(duì)應(yīng)的博弈樹(shù)如圖1-6所示。12122211I14I13I122圖1-6I211I112112②①①①①①該博弈的局中人集合,為將其轉(zhuǎn)化為策略型博弈,還需要確定出局中人的策略空間及支付函數(shù)或支付矩陣。局中人1的策略空間為}.局中人2的策略空間為該博弈對(duì)應(yīng)的策略型博弈可由如下的支付矩陣給出。該博弈對(duì)應(yīng)的策略型博弈可由如下的支付矩陣給出。
例1.10
考慮如下動(dòng)態(tài)博弈。第1步,局中人1從中選一數(shù);第2步,局中人2知道,從中選;第3步,局中人1不知,也忘記了,從中選,博弈結(jié)束。對(duì)選定的,局中人2支付給局中人1的費(fèi)用與前例相同,該博弈對(duì)應(yīng)的博弈樹(shù)如圖1-7所示。1121222211I12①2圖1-7I21I2211I11①①①①②②該博弈局中人集合為.局中人1的策略集合.局中人1的策略集合.支付矩陣為:從以上兩例中,可以看到策略與行動(dòng)這兩個(gè)概念的明顯的區(qū)別?;靖拍畋菊乱笳莆杖缦禄靖拍詈献鞑┺姆呛献鞑┺挠邢迶U(kuò)展型博弈模型完全信息博弈不完全信息博弈靜態(tài)博弈動(dòng)態(tài)博弈完美信息博弈子博弈策略策略型博弈模型支付矩陣重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡嚴(yán)格占優(yōu)可解博弈小結(jié)本章闡述了博弈論所研究的活動(dòng)具有的特征,并指出博弈論與決策理論區(qū)別。決策理論中一般僅有一個(gè)決策者,他們從個(gè)人效用最大化出發(fā)進(jìn)行決策,而博弈論中有多個(gè)決策主體,這些主體之間是利益相關(guān)的。博弈論主要討論他們之間的策略互動(dòng)關(guān)系。博弈論模型從形式可分為策略型博弈模型與擴(kuò)展型博弈模型。擴(kuò)展型模型完整地刻畫(huà)了一項(xiàng)博弈活動(dòng)。博弈樹(shù)是擴(kuò)展型模型的形象刻畫(huà),但它僅描述了有限的博弈模型。策略型博弈模型的結(jié)構(gòu)簡(jiǎn)單,但它忽略了博弈的時(shí)序與信息,其側(cè)重點(diǎn)在于分析參與人的策略選擇。對(duì)于信息完全靜態(tài)博弈,用策略型博弈刻畫(huà)更為合適。對(duì)信息完全的動(dòng)態(tài)博弈,用擴(kuò)展型博弈模型描述更為合適。策略與行動(dòng)是兩個(gè)容易混淆的概念,其原因是在靜態(tài)博中,策略與行動(dòng)是等同的,而一般教材先介紹靜態(tài)博弈,這可能會(huì)給自學(xué)者造成策略就是行動(dòng)的先入為主的錯(cuò)誤觀(guān)念,這也是本書(shū)先介紹擴(kuò)展型博弈后介紹策略型博弈的一個(gè)主要原因。本章還針對(duì)策略型博弈介紹了求解重復(fù)剔除被嚴(yán)格占優(yōu)均衡的方法。本章重點(diǎn)要求掌握這個(gè)方法以及把已知擴(kuò)展型博弈模型轉(zhuǎn)化為策略型。重點(diǎn)要求能夠區(qū)分策略與行動(dòng)這兩個(gè)概念。為了邏輯上的完整性,我們還在補(bǔ)充節(jié)中介紹了一般擴(kuò)展型博弈。納什均衡2.1納什均衡的定義納什均衡是博弈論中最重要的概念,各種非合作博弈模型的均衡概念都是建立在納什均衡基礎(chǔ)之上的。納什均衡是個(gè)策略組合,它滿(mǎn)足兩個(gè)要求。1.對(duì)每個(gè)局中人,能夠預(yù)期到對(duì)手采用策略組合。2.對(duì)每個(gè)局中人,是他應(yīng)對(duì)的最好的策略。納什均衡的定義定義2.1
設(shè)為一具有完全信息的策略型博弈模型,稱(chēng)策略組合為G的一個(gè)納什均衡。如果對(duì)是在i的對(duì)手策略組合為條件下局中人i的最優(yōu)反應(yīng)策略,即
或?qū)?。如果以上不等式?duì)嚴(yán)格成立,稱(chēng)為G的嚴(yán)格納什均衡。在完全信息靜態(tài)博弈中可用納什均衡預(yù)測(cè)每個(gè)參與人的策略,進(jìn)而預(yù)測(cè)我們所關(guān)心的各種博弈結(jié)果。擴(kuò)展型博弈模型的納什均衡定義為它所對(duì)應(yīng)的策略型博弈的納什均衡。例2.1囚徒困境問(wèn)題在例1.6給出的囚徒困境問(wèn)題中,是惟一的嚴(yán)格納什均衡。策略組合都不是納什均衡。例2.2伯川德(Berchand)均衡設(shè)有生產(chǎn)同質(zhì)產(chǎn)品的兩個(gè)企業(yè),同時(shí)獨(dú)立地確定產(chǎn)品的價(jià)格。已知該產(chǎn)品市場(chǎng)需求函數(shù)為,滿(mǎn)足。這里q代表產(chǎn)量,p代表價(jià)格。兩個(gè)企業(yè)具有相同的單位成本.企業(yè)的利潤(rùn)函數(shù)如下:這里表示兩個(gè)企業(yè)的價(jià)格分別為時(shí),市場(chǎng)對(duì)于企業(yè)的產(chǎn)品的需求量。上述企業(yè)價(jià)格競(jìng)爭(zhēng)問(wèn)題可以歸結(jié)為完全信息靜態(tài)博弈模型其中局中人集合。策略集合表示企業(yè)所有可行價(jià)格構(gòu)成的集合。支付函數(shù)。為求該模型的納什均衡,可先將策略組合集合中的點(diǎn)分為4類(lèi),分別討論它們是否能構(gòu)成納什均衡。第1類(lèi),第2類(lèi),第3類(lèi),第4類(lèi),(1)當(dāng),不是納什均衡。.(2)當(dāng),不是納什均衡。(3)當(dāng),不是納什均衡。(4)當(dāng),是納什均衡。稱(chēng)其為伯川德均衡。例2.3簡(jiǎn)單產(chǎn)品差異化模型考慮由商店構(gòu)成的市場(chǎng),A與B分別銷(xiāo)售不同品牌的商品,進(jìn)行價(jià)格競(jìng)爭(zhēng)。假設(shè)生產(chǎn)的單位成本為零。消費(fèi)者分為兩類(lèi),個(gè)消費(fèi)者偏好于產(chǎn)品A,個(gè)消費(fèi)者偏好于產(chǎn)品B。A,B兩種品牌價(jià)格分別為。設(shè)消費(fèi)者可從A或B處購(gòu)買(mǎi)單位商品。用表示由于購(gòu)買(mǎi)不喜歡的產(chǎn)品所付出的厭惡成本,假設(shè)消費(fèi)者具有如下的效用函數(shù)用表示消費(fèi)者對(duì)于產(chǎn)品A的需求量;表示消費(fèi)者對(duì)于產(chǎn)品B的需求量。則可以證明上述產(chǎn)品的差異化模型不存在納什均衡。納什均衡的不變性由納什均衡的定義知,為納什均衡的充要條件是對(duì)任何參與人支付差,而與這個(gè)差值是多少無(wú)關(guān),由此可導(dǎo)出納什均衡的一個(gè)性質(zhì):納什均衡的不變性命題2.1
設(shè)為已知策略型博弈。(1)納什均衡在支付函數(shù)的正仿射變換下不變。對(duì),令,其中,則G與有相同的納什均衡。(2)納什均衡在支付函數(shù)的局部變換下不變。給定及.令,G與有相同的納什均衡。重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡與納什均衡的關(guān)系命題2.2
若是有限策略型博弈的納什均衡,那么它不會(huì)被重復(fù)剔除被嚴(yán)格占優(yōu)策略的過(guò)程所剔除。命題2.3在有限策略型博弈中,如果是重復(fù)剔除被嚴(yán)格占優(yōu)策略均衡,則它必為納什均衡。2.2 求納什均衡的劃線(xiàn)法劃線(xiàn)法對(duì)于二人有限博弈,,G可由支付矩陣給出。設(shè)為G的納什均衡。即是局中人2對(duì)于的最優(yōu)反應(yīng),是局中人1對(duì)于的最優(yōu)反應(yīng)。G的納什均衡可由以下劃線(xiàn)法求得。1.對(duì)局中人1的每個(gè)策略,尋找局中人2的最優(yōu)反應(yīng)。若最優(yōu)反應(yīng)為,即,則在支付矩陣元素下劃一短線(xiàn)。2.對(duì)局中人2的每個(gè)策略,尋找局中人1的最優(yōu)反應(yīng),若最優(yōu)反應(yīng)為,即,則在元素下劃一短線(xiàn)。3.如果支付矩陣中元素的每個(gè)分量都劃有短線(xiàn),這表明,是關(guān)于的最優(yōu)反應(yīng)。也是關(guān)于的最優(yōu)反應(yīng),故,策略組合為G的納什均衡。例2.4在囚徒困境問(wèn)題中,其支付矩陣為應(yīng)用劃線(xiàn)法,支付矩陣中的元素(-5,-5)下都劃上了短線(xiàn),其所對(duì)應(yīng)的策略組合為納什均衡,且是嚴(yán)格的納什均衡,例2.5
斗雞博弈兩個(gè)人舉著火棍從獨(dú)木橋的兩端走向中央進(jìn)行火拼,每個(gè)人都有兩種戰(zhàn)略:繼續(xù)前進(jìn),或退下陣來(lái)。若兩個(gè)人都繼續(xù)前進(jìn),則兩敗具傷;若一方前進(jìn),另一方退下來(lái),前進(jìn)者勝利,退下來(lái)的丟了面子;若兩人都退下來(lái),兩人都丟面子,支付矩陣如下:用劃線(xiàn)法可得嚴(yán)格納什均衡(退,進(jìn)),(進(jìn),退)。例2.6智豬博弈豬圈里圈著兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有一個(gè)豬食槽,另一邊安裝一個(gè)按鈕,按一下按鈕會(huì)有10個(gè)單位的豬食進(jìn)槽。但誰(shuí)按按鈕就需要付2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬吃到1個(gè)單位;若同時(shí)到,大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃6個(gè)單位,小豬吃4個(gè)單位,支付矩陣如下。嚴(yán)格納什均衡為大豬“按”,小豬“等待”。例2.7在例1.8中的大堤維護(hù)博弈中,支付矩陣為利用劃線(xiàn)法可得納什均衡(維護(hù),維護(hù)),(不維護(hù),不維護(hù))。為了保護(hù)生命財(cái)產(chǎn)的安全,政府可以立法,如果參與人不維護(hù)大堤,需付罰款5,則有支付矩陣這時(shí)該博弈有惟一的納什均衡(維護(hù),維護(hù))。2.3最優(yōu)反應(yīng)映射與納什均衡定義2.2局中人的最優(yōu)反應(yīng)映射局中人i的最優(yōu)反應(yīng)映射是一個(gè)定義于策略組合集合S,取值于策略集的子集的集值映射(映射值為集合的映射稱(chēng)為集值映射),,滿(mǎn)足定義2.2表明,局中人i的最優(yōu)化反應(yīng)映射僅與有關(guān)。反應(yīng)函數(shù)當(dāng)為單點(diǎn)集時(shí),稱(chēng)為局中人i的最優(yōu)反應(yīng)函數(shù),簡(jiǎn)稱(chēng)反應(yīng)函數(shù)。這時(shí)將記為。定義2.3最優(yōu)反應(yīng)映射n個(gè)參與人的最優(yōu)反應(yīng)映射的乘積稱(chēng)為博弈G的最優(yōu)反應(yīng)映射。博弈的最優(yōu)反應(yīng)映射與納什均衡之間的關(guān)系定理2.1為策略型博弈的納什均衡的充要條件是。設(shè)為一集值映射。若,稱(chēng)x為的不動(dòng)點(diǎn)。利用不動(dòng)點(diǎn)概念,定理2.1可以如下敘述。命題2.4
是策略型博弈G的納什均衡的充要條件是是最優(yōu)反應(yīng)映射的不動(dòng)點(diǎn),即。例2.8
在囚徒困境問(wèn)題中,是囚徒困境博弈的惟一納什均衡。例2.9多囚徒困境問(wèn)題將例1.6中兩個(gè)囚徒推廣為個(gè)囚徒,且量刑的規(guī)則為,如果n個(gè)囚徒都抗拒,各判1年;如n個(gè)囚徒都坦白,各判5年;如果n個(gè)囚徒中有的坦白,有的抗拒。坦白者釋放,抗拒者判8年。這說(shuō)明是惟一的納什均衡。例2.9多囚徒困境問(wèn)題將例1.6中兩個(gè)囚徒推廣為個(gè)囚徒,且量刑的規(guī)則為,如果n個(gè)囚徒都抗拒,各判1年;如n個(gè)囚徒都坦白,各判5年;如果n個(gè)囚徒中有的坦白,有的抗拒。坦白者釋放,抗拒者判8年。,這說(shuō)明是惟一的納什均衡。
例2.10設(shè)有n家電視臺(tái)可選擇m部電視劇在某段時(shí)間同時(shí)播放。電視臺(tái)的播放的收益為觀(guān)眾數(shù)的倍。已知偏好于第部電視劇的觀(guān)眾為,且。如果同時(shí)有幾個(gè)電視臺(tái)同時(shí)播放同一部電視劇,則它們均分觀(guān)眾,考慮電視臺(tái)如何播放電視節(jié)目。首先建立策略型博弈模型,其中局中人集合,表示第i家電視臺(tái),策略集合,表示電視臺(tái)i選擇第j部電視劇播放。局中人的支付函數(shù)
且其余電視臺(tái)中還有家播放。。對(duì),且中有個(gè)1。。由知,故有,從而,對(duì),,。可知每家電視臺(tái)同時(shí)播放電視劇1是惟一的納什均衡,該例解釋了n家電視臺(tái)熱播同一部電視劇的實(shí)際情況。例2.11國(guó)際聯(lián)盟博弈為毗鄰某海岸的三個(gè)國(guó)家,他們?cè)谶@個(gè)海岸附近駐扎軍隊(duì)。要想控制整個(gè)海灣,至少需要兩個(gè)國(guó)家聯(lián)合起來(lái)。三國(guó)的兵力部署與相應(yīng)的支付由以下支付矩陣給出
w選擇陸地
w選擇近海支付向量的第1,2,3個(gè)分量分別給出的的支付值。局中人的最優(yōu)反應(yīng)映射為,,,。因s為納什均衡需滿(mǎn)足,故納什均衡僅能存在于策略組合,,,中。
故納什均衡存在于策略組合,,中。,,從而該博弈的納什均衡為,,,相應(yīng)的支付向量為,,。兩國(guó)結(jié)成聯(lián)盟控制海灣將會(huì)出現(xiàn)以下情況。(1)L與S聯(lián)盟,分別將兵力部署于北、東,W將把兵力部署于陸地;(2)L與W聯(lián)盟,分別把兵力部署于北、海,S將把兵力部署于西;(3)S與W聯(lián)盟,分別將兵力部署于東、海,L將把兵力部署于南。盡管三個(gè)國(guó)家都聯(lián)合起來(lái),總支付最大,但他們之間如無(wú)具有約束力的協(xié)議,這種聯(lián)盟是不穩(wěn)定的,因它不是一個(gè)納什均衡。由上例我們可以得出求多人有限策略型博弈的納什均衡的方法,步驟如下:1.對(duì)S中所有的策略組合計(jì)算,如果,則從S剔除,剩余策略組合集合記為。2.對(duì)中所有的策略組合S計(jì)算。如,則從S中剔除,剩余集合記為。3.應(yīng)用類(lèi)似方法n步,如,從中剔除,最后得到。中的策略組合都是納什均衡。特別是對(duì)于三人有限策略博弈模型,我們可給出納什均衡的劃線(xiàn)法。設(shè)參與人的策略集合分別為,,對(duì)
.對(duì)每個(gè),,都可寫(xiě)出一個(gè)以3維向量為元素的m行n列的支付矩陣。劃線(xiàn)法步驟如下1.對(duì)每個(gè)支付矩陣,比較每一行中的元素的第2個(gè)分量,最大者下面劃線(xiàn)。2.對(duì)每個(gè)支付矩陣,比較每一列中的元素的第1個(gè)分量,最大者下面劃線(xiàn)。3.對(duì)于個(gè)支付矩陣的相同行列的元素,比較第3個(gè)分量,最大者下面劃線(xiàn)。例2.12公共物品提供對(duì)于公共物品,提供者與不提供者都享受同樣的效益,且公共物品提供的成本僅與其提供的服務(wù)水平有關(guān),而與享用其效益的人數(shù)無(wú)關(guān)。設(shè)甲、乙、丙三人決定是否提供某項(xiàng)公共物品。1表示提供,0表示不提供。提供者需付出成本。而收益為已被提供的公共物品的數(shù)量,分別就討論該博弈的納什均衡。(1)當(dāng)c=0.5,支付矩陣如下。丙提供:丙不提供:由劃線(xiàn)法知,(1,1,1)是納什均衡。(2)當(dāng)c=1時(shí),支付矩陣為丙提供:丙不提供:
任何一個(gè)策略組合都是納什均衡。(3)c=1.5,支付矩陣為丙提供:丙不提供:(0,0,0)為納什均衡。2.4求納什均衡的反應(yīng)函數(shù)法如果博弈G的n個(gè)局中人的最優(yōu)反應(yīng)映射都是反應(yīng)函數(shù),我們有如下定理。定理2.2為博弈的納什均衡的充要條件是是局中人的n條最優(yōu)反應(yīng)曲線(xiàn),的交點(diǎn)。由定理2.2,可用以下兩步求得納什均衡。1.求出每個(gè)參與人的最優(yōu)反應(yīng)函數(shù),。2.求,的交點(diǎn)。例2.13設(shè)策略型博弈其中,支付函數(shù)為求G的納什均衡。為求,固定,求解優(yōu)化問(wèn)題:可得:為求,固定,求解優(yōu)化問(wèn)題:可得:兩條反應(yīng)曲線(xiàn)的交點(diǎn)為它們給出了G的三個(gè)納什均衡。
例2.14
設(shè)。支付函數(shù)為為求,固定,求解優(yōu)化問(wèn)題可得,。為求,固定,求解優(yōu)化問(wèn)題由上例知兩條最優(yōu)反應(yīng)曲線(xiàn)的交點(diǎn)為納什均衡。例2.15投資問(wèn)題兩個(gè)投資主體中央政府與地方政府都可向基礎(chǔ)設(shè)施與加工工業(yè)兩個(gè)方向投資,記:中央政府對(duì)于基礎(chǔ)設(shè)施的投資水平;:中央政府對(duì)于加工工業(yè)的投資水平;:地方政府對(duì)于基礎(chǔ)設(shè)施的投資水平;:地方政府對(duì)于加工工業(yè)的投資水平。中央政府與地方政府的投資效益為如下的Cobb-Douglas型函數(shù)。參數(shù)。的假設(shè)表明中央政府考慮基礎(chǔ)設(shè)施投資的外部性,而地方政府不考慮這種外部性,即中央政府對(duì)基礎(chǔ)設(shè)施投資有更大的偏好。在這個(gè)投資博弈中,參與人1為中央政府,參與人2為地方政府。中央政府選擇基礎(chǔ)設(shè)施投資水平,加工業(yè)投資水平。地方政府也選擇基礎(chǔ)設(shè)施投資水平與加工業(yè)投資水平。中央政府的問(wèn)題是,對(duì)于固定的地方政府的投資選擇,選擇,在投資預(yù)算約束為中央政府的投資預(yù)算)下求解最優(yōu)化問(wèn)題地方政府的問(wèn)題是固定中央政府的選擇,選擇,在預(yù)算約束下最大化自己的效益。其中為地方政府的投資預(yù)算。首先考慮中央政府問(wèn)題,將代入目標(biāo)函數(shù),將中央政府問(wèn)題簡(jiǎn)化為由1階條件,可得(1)同理,地方政府問(wèn)題可被簡(jiǎn)化為
由1階條件,可得(2)不妨設(shè),對(duì)于,分以下三種情況討論該博弈的納什均衡。1.中央政府最優(yōu)反應(yīng)函數(shù)為地方政府的最優(yōu)反應(yīng)函數(shù)為納什均衡為納什均衡如圖2-1(a)所示。圖2-1(a)2.中央政府最優(yōu)反應(yīng)函數(shù)為地方政府最優(yōu)反應(yīng)函數(shù)為納什均衡為即地方政府投資于加工業(yè),中央政府投資于基礎(chǔ)設(shè)施。納什均衡如圖2-1(b)所示。圖2-1(b)3.中央政府最優(yōu)反應(yīng)函數(shù)為地方政府最優(yōu)反應(yīng)函數(shù)不變。納什均衡為即中央政府把全部資金投資于基礎(chǔ)設(shè)施,地方政府彌補(bǔ)中央政府對(duì)于基礎(chǔ)設(shè)施的投資不足,然后將剩余資金投資于加工業(yè)。納什均衡如圖2-1(c)所示。圖2-1(c)
2.5納什均衡的性質(zhì)定義與假設(shè)條件定義2.4
稱(chēng)為擬凹函數(shù),如果使,則有對(duì)成立。若以上不等式嚴(yán)格成立,則稱(chēng)嚴(yán)格擬凹。注意,如果是單調(diào)函數(shù),則擬凹。若為凹函數(shù),則為擬凹函數(shù)。但為擬凹函數(shù),不一定是凹函數(shù)。在納什均衡的存在性與惟一性的研究中需要以下假設(shè)。假設(shè)1博弈的每個(gè)局中人的策略集合為緊凸集,
指m維實(shí)數(shù)空間,中的緊集指有界閉集。假設(shè)2對(duì)局中人i的支付函數(shù)為連續(xù)函數(shù)。假設(shè)3對(duì),局中人i的支付函數(shù)為的凹函數(shù)。假設(shè)4對(duì),局中人i的支付函數(shù)為的擬凹函數(shù)。假設(shè)5對(duì),局中人i的支付函數(shù)為的嚴(yán)格擬凹函數(shù)。納什均衡存在性定理定理2.3設(shè)策略型博弈G滿(mǎn)足假設(shè)1,2,4,則G至少存在一個(gè)納什均衡。當(dāng)博弈G滿(mǎn)足假設(shè)1,2,3或1,2,5時(shí),G存在納什均衡。為看到假設(shè)5的特殊作用,我們給出以下命題。命題2.5設(shè)為策略型博弈且滿(mǎn)足假設(shè)1,2,5,則局中人的最優(yōu)反應(yīng)映射,恰含有一點(diǎn)。假設(shè)5的重要作用在于局中人的最優(yōu)反應(yīng)映射這個(gè)集值映射轉(zhuǎn)化為局中人的最優(yōu)反應(yīng)函數(shù)。此時(shí)納什均衡的惟一性問(wèn)題在下面的關(guān)于博弈G納什均衡的唯一性的討論種中,假設(shè)局中人的最優(yōu)反應(yīng)映射為反應(yīng)函數(shù)。定義2.5設(shè),x到y(tǒng)的距離被定義為定義2.6壓縮映射設(shè)映射,其中。如果存在正數(shù),使對(duì),,稱(chēng)為壓縮映射??捎靡韵旅}判斷為壓縮映射。命題2.6設(shè)可微,,如果存在,使對(duì)任意x成立,則為壓縮映射。例2.16因,所以為壓縮映射。定理2.4
若策略型博弈滿(mǎn)足假設(shè)1,2,5,且最優(yōu)反應(yīng)映射為壓縮映射。則G有惟一的納什均衡。定義2.7光滑博弈稱(chēng)策略型博弈為光滑博弈,如果下述導(dǎo)數(shù)在策略型組合集合S內(nèi)部上存在且連續(xù)(指S去掉邊界)。定義2.8嚴(yán)格光滑博弈稱(chēng)策略型博弈G為嚴(yán)格光滑博弈,如果G是光滑的,且對(duì)策略組合集合的任何邊界點(diǎn)有上述極限對(duì)于中所有趨于的序列而取。定義2.9設(shè)A為m階方陣,若負(fù)定,稱(chēng)A為擬負(fù)定矩陣。用表示1階條件系統(tǒng)的Jacobian矩陣,即它是由元素構(gòu)成的階方陣。例如
其中。
定理2.5設(shè)G為完全信息靜態(tài)的光滑博弈,滿(mǎn)足假設(shè)1,2,4.表示該博弈的最優(yōu)反應(yīng)映射的Jacobian矩陣,如果它對(duì)擬負(fù)定,且對(duì),,則G有唯一的納什均衡。定理2.6Rosen惟一性定理設(shè)是嚴(yán)格光滑博弈,滿(mǎn)足條件1,2,5。且對(duì)任何擬負(fù)定,則G有惟一的納什均衡。
例2.17設(shè)策略型博弈,其中,,,.而不是負(fù)定矩陣,從而不是擬負(fù)定的。另外,其中不是壓縮映射。故我們不能得到G有惟一的納什均衡的結(jié)論,在例2.13中我們已求出了G的3個(gè)納什均衡。例2.18
設(shè),,,顯然G為嚴(yán)格光滑博弈,且,負(fù)定,從而擬負(fù)定。由定理2.6知,G有惟一的納什均衡。
2.6混合策略下的納什均衡
2.6.1混合策略下的納什均衡例2.19“石頭、剪子÷布”游戲是一個(gè)二人有限策略型博弈,它的支付矩陣為利用劃線(xiàn)法易見(jiàn),納什均衡不存在。為了解決這類(lèi)均衡不存在的問(wèn)題,需要把策略的概念擴(kuò)充為混合策略的概念,進(jìn)而把納什均衡的概念擴(kuò)充為混合策略意義下的納什均衡的概念。而把前面介紹過(guò)的策略與納什均衡分別稱(chēng)為純策略與純策略意義下的納什均衡?;旌喜呗詾榉奖闫鹨?jiàn),針對(duì)二人有限策略型博弈討論這個(gè)問(wèn)題。設(shè)。稱(chēng)上的一個(gè)概率分布為參與人的一個(gè)混合策略,故可分別用
表示兩個(gè)參與人的混合策略集合。為參與人1的混合策略,表示參與人1以概率隨機(jī)選擇純策略。為參與人2的混合策略,表示參與人2以概率隨機(jī)選擇純策略。易知,參與人1的混合策略等同于他的純策略。參與人2的純策略等同于他的純策略。因而混合策略包含了純策略,即混合策略是純策略概念的擴(kuò)充。
稱(chēng)為混合策略組合。對(duì)于混合策略組合,由于參與人隨機(jī)選擇純策略,因而參與人的支付值也是隨機(jī)的,故需用期望支付代替博弈G中的支付函數(shù)。對(duì)于給定的,參與人1的期望支付為參與人2的期望支付為稱(chēng)為G的混合擴(kuò)充。記,,,。分別為參與人1與2的支付矩陣。利用支付矩陣A與B,參與人1與2的期望支付可表示為這里X表示參與人1的混合策略行向量,Y表示參與人2的混合策略列向量。定義2.10
稱(chēng)混合策略組合為的納什均衡或G的混合策略納什均衡,如果,對(duì)任何成立,,對(duì)任何成立。當(dāng)以上兩個(gè)不等式嚴(yán)格成立時(shí),稱(chēng)為G的嚴(yán)格混合策略納什均衡。混合策略意義下的納什均衡的含意仍為:固定是參與人2對(duì)的最優(yōu)反應(yīng),固定是參與人1對(duì)的最優(yōu)反應(yīng)。2.72×2雙矩陣博弈的納什均衡
設(shè)為二人有限博弈,且,這時(shí)兩個(gè)參與人的支付矩陣分別為對(duì)G的支付函數(shù)作正仿射變換,相當(dāng)于對(duì)參與人的支付矩陣每個(gè)元素乘以一個(gè)正數(shù)再加一常數(shù),即其中,,。對(duì)G的支付函數(shù)作局部變換,相當(dāng)于A(yíng)的某一列加一常數(shù)或B的某行加一常數(shù),即可以證明與有相同的混合策略納什均衡。當(dāng)為2階方陣時(shí),對(duì)G的支付函數(shù)進(jìn)行局部變換,可對(duì)A進(jìn)行列變換將A變?yōu)閷?duì)角形。對(duì)B進(jìn)行行變換將B變?yōu)閷?duì)角形。1(1)、(5)成立條件圖形納什均衡2(1)、(6)成立3(1)、(7)成立4(1)、(8)成立5(2)、(5)成立6(2)、(6)成立7(2)、(7)成立8(2)、(8)成立9(3)、(5)成立10(3)、(6)成立11(3)、(7)成立(3)
(1)
(2)
y10x
12(3)、(8)成立13(4)、(5)成立14(4)、(6)成立15(4)、(7)成立16(4)、(8)成立(1)
(2)
(3)
表2.1給出了除之外的雙矩陣的所有納什均衡。這里。例2.20囚徒困境對(duì)于例2.9的囚徒困境問(wèn)題,兩個(gè)局中人的支付矩陣經(jīng)局部變換后均為,由表2.1知,囚徒困境問(wèn)題僅有一個(gè)純策略納什均衡(坦白,坦白)。例2.21斗雞博弈對(duì)于2.10的斗雞博弈問(wèn)題,兩個(gè)參與人的支付矩陣經(jīng)局部變換后均為,。由表2.1知,該博弈有兩個(gè)純策略納什均衡(進(jìn),退)、(退,進(jìn))與一個(gè)混合策略納什均衡。即以的概率退卻,以的概率進(jìn)攻。斗雞博弈表明了參與人在競(jìng)爭(zhēng)中總是采取避免兩敗俱傷的理性行為。例2.22智豬博弈對(duì)例2.11的智豬博弈問(wèn)題,兩個(gè)參與人的支付矩陣經(jīng)局部變換后,分別為
,
。由表2.1知,該博弈僅有一個(gè)純策略納什均衡:大豬按,小豬等待。例2.23交通規(guī)則有的國(guó)家規(guī)定右側(cè)通行,有的國(guó)家規(guī)定左側(cè)通行。如果不作規(guī)定,情況如何?設(shè)兩個(gè)參與人的交通規(guī)則博弈的支付矩陣如下。兩個(gè)參與人的支付矩陣為,經(jīng)局部變換后為以上博弈符合表2.1中第11種情況,,。純策略納什均衡為(左,左,),(右,右),混合策略納什均衡為例2.24狩獵博弈兩個(gè)獵人必須同時(shí)決定是獵鹿還是獵兔。如果兩人均決定獵鹿。他們會(huì)獲得一只鹿,然后平分。如果兩人均決定獵兔,、那么每人可各獲得一只野兔。如果一人決定獵鹿,另一人決定獵兔,獵兔者將獲得一只野兔,而獵鹿者將一無(wú)所獲。對(duì)每個(gè)獵人而言,半只鹿的收益要大于1只野兔的收益,該博弈的支付矩陣為對(duì)支付矩陣作局部變換,可得,因而納什均衡與上例相同:,及混合策略納什均衡這里“獵鹿”體現(xiàn)了參與人在政治、經(jīng)濟(jì)、軍事等活動(dòng)中的合作行為,“獵兔”體現(xiàn)了參與人的不合作行為。例2.25性別戰(zhàn)有一對(duì)情侶,男士喜歡看足球,女士喜歡看歌舞,周末他們兩人可選擇去看足球或看歌舞。支付矩陣為由表2.1的第11種情況,,,該博弈有2個(gè)純策略納什均衡(足球,足球),(歌舞,歌舞)與一個(gè)混合策略納什均衡。性別戰(zhàn)博弈刻畫(huà)了實(shí)際問(wèn)題中參與人合作要優(yōu)于不合作,但合作的收益還有區(qū)別的情形。例2.26公共物品提供在兩個(gè)參與人的公共物品提供博弈中,參與人可從公共物品中收益1,而付出的成本分別為。支付矩陣如下。分別對(duì)兩個(gè)參與人的支付矩陣作局部變換,變換后仍為??傻茫?。。由表2.1知,該博弈的納什均衡為(提供,不提供),(不提供,提供)。及混合策略納什均衡。兩個(gè)純策略納什均衡刻畫(huà)了公共物品提供問(wèn)題中的參與人之間的“搭便車(chē)”行為。例2.27監(jiān)督博弈監(jiān)督博弈概括了諸如稅收檢查、質(zhì)量檢驗(yàn)、腐敗懲治、雇主監(jiān)督雇員等活動(dòng)。以稅收檢查為例,博弈的參與人為稅檢機(jī)關(guān)與納稅人。稅檢機(jī)關(guān)所能選擇的策略是檢查與不檢查,納稅人的選擇是逃稅與不逃稅。支付矩陣如下。
其中為應(yīng)納稅額,為檢查成本,F(xiàn)是罰款,且。對(duì)兩個(gè)參與人的支付矩陣作局部變換后有,,。由表2.1,可得混合策略納什均衡,。均衡時(shí),稅檢機(jī)關(guān)以概率檢查,越大,這個(gè)概率也越大;納稅人以的概率逃稅。檢查成本c越大,應(yīng)納稅款越大,罰款F越大,這個(gè)概率越小。
2.8混合策略納什均衡的有關(guān)結(jié)論更一般的混合策略意義下的納什均衡混合策略設(shè)為一有限策略型博弈模型,其中局中人集合,對(duì)于,純策略集合為,上之一概率分布,,稱(chēng)為局中人i的一個(gè)混合策略。局中人i采用混合策略的含義是局中人i對(duì)純策略進(jìn)行隨機(jī)選擇,以概率選擇純策略,。記,,因而可用表示局中人的所有混合策略構(gòu)成的集合。稱(chēng)為G的混合策略組合。期望支付如果局中人隨機(jī)選擇純策略,則局中人的支付也是隨機(jī)的,因而我們需要用局中人的期望支付描述局中人的選擇行為。給定,局中人i的期望支付為式中,.這樣
,顯然,局中人i的純策略等同于混合策略,因而混合策略集中包含了純策略。稱(chēng)為G的混合擴(kuò)充。定義2.10設(shè)為的一個(gè)混合策略組合,如果對(duì)及,均有(1)稱(chēng)為G的混合策略納什均衡。當(dāng)(1)式對(duì)為嚴(yán)格不等式時(shí),稱(chēng)為G的混合策略嚴(yán)格納什均衡。定理2.7
為的混合策略納什均衡的充要條件:是對(duì),,有
(2)最優(yōu)反應(yīng)映射局中人最優(yōu)反以映射是定義于混合策略集合,取值于的子集的集值映射,,滿(mǎn)足
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度醫(yī)療機(jī)構(gòu)照明燈具安裝服務(wù)合同
- 2024公司年會(huì)員工發(fā)言稿范文(16篇)
- 2024年房地產(chǎn)經(jīng)紀(jì)居間協(xié)議
- DB4113T 067-2024 石榴主要病蟲(chóng)害綠色防控技術(shù)規(guī)程
- 2024乙方甲方電子商務(wù)平臺(tái)咨詢(xún)合同
- 2024年房屋裝修合同法律適用與爭(zhēng)議解決協(xié)議
- 專(zhuān)題17富強(qiáng)與創(chuàng)新(第01期)-2023年中考道德與法治真題分項(xiàng)匯編(原卷版)
- DB4106T 7-2019 養(yǎng)雞場(chǎng)獸藥使用管理規(guī)范
- 2024年農(nóng)業(yè)信息化管理系統(tǒng)與農(nóng)機(jī)設(shè)備集成合同
- 創(chuàng)新小班家長(zhǎng)會(huì)發(fā)言稿怎么寫(xiě)(范本12篇)
- 教務(wù)主任競(jìng)爭(zhēng)上崗面試答辯題(精心整理)
- 對(duì)話(huà)理論與閱讀教學(xué)
- 機(jī)加工安全事故案例演示文稿
- 凱文杜蘭特-英語(yǔ)介紹
- 剖宮產(chǎn)術(shù)后再次妊娠陰道分娩管理的專(zhuān)家共識(shí)
- 最全的俄語(yǔ)教學(xué)課件
- 非招標(biāo)方式采購(gòu)文件示范文本
- 手機(jī)對(duì)青少年的危害
- 改進(jìn)維持性血液透析患者貧血狀況PDCA
- 循證護(hù)理學(xué)(理論部分)智慧樹(shù)知到答案章節(jié)測(cè)試2023年復(fù)旦大學(xué)
- 醫(yī)院開(kāi)展老年友善醫(yī)療機(jī)構(gòu)建設(shè)工作總結(jié)
評(píng)論
0/150
提交評(píng)論