博弈類型及其表述形式_第1頁
博弈類型及其表述形式_第2頁
博弈類型及其表述形式_第3頁
博弈類型及其表述形式_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、博弈類型及其表述形式1博弈的分類博弈模型一般分為合作博弈(cooperative game )和非合作博弈( non- cooperativegame),如圖1.1。合作博弈是以單個(gè)參與者的可能行動(dòng)集合為基本元素,而非合作博弈是以參與人群的可能聯(lián)合行動(dòng)集合為基本元素(Marti n J.Osborne and Ariel Rubi nste in,2000,P2),也就是說,在合作博弈中,博弈中所有參與者都獨(dú)立行動(dòng),不存在有約束力的 合作、聯(lián)合或聯(lián)盟的關(guān)系,而在非合作博弈中,在一些參與者之間存在著有約束力的合作、 聯(lián)合或聯(lián)盟的關(guān)系,并因?yàn)檫@種關(guān)系影響到博弈的結(jié)局。合作博弈強(qiáng)調(diào)的是團(tuán)體理性(co

2、llective rationality)、效率、公正和公平;非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果可能是有效率的,也可能是低效率或無效率的(張維迎,1996,P5)。20世紀(jì)50年代,合作博弈的研究達(dá)到鼎盛期,同時(shí)開始出現(xiàn)對(duì)非合作博弈的研究,此后,博弈 論的研究主流逐步轉(zhuǎn)向在非合作博弈領(lǐng)域。有些人認(rèn)為非合作博弈模型比合作博弈更“基 本”,但有些人認(rèn)為兩者不相上下( Martin J.Osborne and Ariel Rubinstein , 2000, P2)。合作博弈,有時(shí)也叫做聯(lián)盟博弈(coalitional game),一般根據(jù)有無轉(zhuǎn)移支付而分為兩類:可轉(zhuǎn)移支付聯(lián)盟博弈(c

3、oalitio nal game with tran sferable payoff)和不可轉(zhuǎn)移支付聯(lián)盟博弈(coaliti on algame with non-tra nsferablepayoff )??赊D(zhuǎn)移支付也叫有旁支付(side payment ),可轉(zhuǎn)移支付聯(lián)盟博弈假設(shè)博弈中各參與者都用相同的尺度來衡量他 們的贏得,且各聯(lián)盟的贏得可以按任意方式在聯(lián)盟成員中分?jǐn)偅环駝t,就是不可轉(zhuǎn)移支付聯(lián)盟博弈。 可轉(zhuǎn)移支付合作博弈 合作博弈V- 不可轉(zhuǎn)移支付合作博 弈v非合作博弈弈圖1.1 博弈的分類非合作博弈的分類主要從兩個(gè)角度進(jìn)行劃分。一是參與者的行動(dòng)順序。 從這個(gè)角度博弈可以分為靜態(tài)博弈(s

4、tatic game)和動(dòng)態(tài)博弈(dynamic game) o靜態(tài)博弈是指參與者同時(shí) 選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知前行動(dòng)者采取了何種行動(dòng);動(dòng)態(tài)博弈是指參與者的行動(dòng)有先后順序且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。二是參與者掌握的信息水平。從這個(gè)角度,博弈可以分為完全信息博弈和不完全信息博弈。完全信息(complete in formati on )指的是每一個(gè)參與者對(duì)所有其他參與者的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確 的知識(shí);否則就是不完全信息(in complete in formatio n)。綜合上述兩種分類方法,可將非合作博弈分成四類。這四類博弈及其對(duì)應(yīng)的均衡概念, 大致上反映了

5、 20世紀(jì)50年代以來非合作博弈理論的主要進(jìn)展和1994年三位諾貝爾經(jīng)濟(jì)學(xué)將得主的主要貢獻(xiàn),同時(shí)也大致表明了“納什均衡”及其精煉在博弈論發(fā)展中的地位和影響(如表1.1 )。表1.1非合作博弈的分類及對(duì)應(yīng)的均衡概念、主要貢獻(xiàn)者行動(dòng)順序信息靜態(tài)(參與者同時(shí)選擇行動(dòng)或雖非同時(shí)但 后行動(dòng)者并不知前行動(dòng)者采取了何 種行動(dòng))動(dòng)態(tài)(參與者的行動(dòng)有先后順序且后行動(dòng) 者能夠觀察到先行動(dòng)者所選擇的行動(dòng))完全信息 (母參與者對(duì) 所有其他參與 者的特征、戰(zhàn)略 空間及支付函 數(shù)有準(zhǔn)確的知識(shí))完全信息靜態(tài)博弈; 納什均衡;John F.Nash(1950,1951)完全信息動(dòng)態(tài)博弈; 子博弈完美納什均衡;Rein har

6、d Selte n(1965)不完全信息 (母參與者對(duì) 所有其他參與 者的特征、戰(zhàn)略 空間及支付函 數(shù)沒有準(zhǔn)確的 知識(shí))不完全信息靜態(tài)博弈;貝葉斯納什均衡John C.Harsa nyi(1967-1968)不完全信息動(dòng)態(tài)博弈; 完美貝葉斯納什均衡;Rein hard Selte n(1975), D.Kreps and R.Wilso n(1982), D.Fudenberg and J.Tirole(1991)2博弈的表述形式現(xiàn)代博弈理論根據(jù)不同的博弈類型給出了博弈模型的三種基本表達(dá)形式:標(biāo)準(zhǔn)式(normal form )表述、擴(kuò)展式表述( extensive form represent

7、ation)和特征函數(shù)型表述。前兩者主要用于非合作博弈,后者主要用于合作博弈。2.1 標(biāo)準(zhǔn)式表述標(biāo)準(zhǔn)式表述又稱為戰(zhàn)略式表述(strategic form )或矩陣式表述(matrix form )。標(biāo)準(zhǔn)式表述將戰(zhàn)略局勢抽象為三個(gè)基本要素:(a) 博弈的參與者集 N =1,2,,n;(b) 每個(gè)參與者的戰(zhàn)略集S-iN ;因此,一個(gè)標(biāo)準(zhǔn)式表述的博弈可以表示為G =:: N ,Si, Ri.。標(biāo)準(zhǔn)式表述主要用來表示靜態(tài)博弈。標(biāo)準(zhǔn)式博弈也叫做戰(zhàn)略博弈。2.2擴(kuò)展式表述擴(kuò)展式表述在標(biāo)準(zhǔn)式表述的基礎(chǔ)上,擴(kuò)展了描述博弈局勢的要素,比如參與者的行動(dòng) 順序以及外生事件的概率分布等,可以描述更復(fù)雜的博弈局勢,極大

8、地?cái)U(kuò)大了博弈理論所能描述的范圍,一般用來表述動(dòng)態(tài)博弈。擴(kuò)展式表述一般包含六個(gè)要素:(a)博弈的參與者集 N =1,2,n;(b)參與者的行動(dòng)順序(the order of moves ):即什么參與者在什么時(shí)候行動(dòng);(c)參與者的行動(dòng)空間(action set ):在每次行動(dòng)時(shí),參與者有些什么行動(dòng)可供選 擇;(d)參與者的信息集(in formation set ):每次行動(dòng)時(shí),參與者知道些什么;(e)參與者的支付函數(shù):在行動(dòng)結(jié)束時(shí),每個(gè)局中人得到什么;(f )外生事件(即“自然”的選擇)的概率分布。2.3 特征函數(shù)型表述特征函數(shù)型表述主要用來表述聯(lián)盟博弈或合作博弈。令參與者集合為N,則稱N的

9、任意子集S為聯(lián)盟(coalition ),所有聯(lián)盟的全體記為 ?(N)??赊D(zhuǎn)移支付聯(lián)盟博弈包括兩個(gè)要素:(a)有限的參與者集N =1,2,,n;(b) 將N的每個(gè)非空子集 S (即一聯(lián)盟)與某個(gè)實(shí)數(shù) v(S)相聯(lián)系的一個(gè)特征函數(shù)v。因此,可轉(zhuǎn)移支付聯(lián)盟博弈可記為(N, V)。其中特征函數(shù)v是指定義在甲(N)上的一個(gè)實(shí)函數(shù),其中v(S)表示聯(lián)盟S通過協(xié)調(diào)其成員的策略所能保證得到的最大贏得。不可轉(zhuǎn)移支付聯(lián)盟博弈包括四個(gè)要素:(a)有限的參與者集N二1,2,,n;(b)結(jié)果集X;(c) 將N的每個(gè)非空子集 S (即一聯(lián)盟)賦一個(gè)集合 V(S) X的特征函數(shù) V;(d) 對(duì)每個(gè)參與者i N有一個(gè)X上的支付函數(shù)R,X),-i N。因此,不可轉(zhuǎn)移支付聯(lián)盟博弈可記為(N ,V, X , Ri(X )博弈的三種表述形式之差別,主要在于描述信息的多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論