博弈類(lèi)型及其表述形式_第1頁(yè)
博弈類(lèi)型及其表述形式_第2頁(yè)
博弈類(lèi)型及其表述形式_第3頁(yè)
博弈類(lèi)型及其表述形式_第4頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈類(lèi)型及其表述形式1博弈的分類(lèi)博弈模型一般分為合作博弈(cooperative game )和非合作博弈( non- cooperativegame),如圖。合作博弈是以單個(gè)參與者的可能行動(dòng)集合為基本元素,而非合作博弈是以參 與人群的可能聯(lián)合行動(dòng)集合為基本元素(Martin and Ariel Rubinstein , 2000, P2),也就是說(shuō),在合作博弈中,博弈中所有參與者都獨(dú)立行動(dòng),不存在有約束力的合作、聯(lián)合或聯(lián)盟的關(guān)系,而在非合作博弈中,在一些參與者之間存在著有約束力的合作、聯(lián)合或聯(lián)盟的關(guān)系,并因?yàn)檫@種關(guān)系影響到博弈的結(jié)局。合作博弈強(qiáng)調(diào)的是團(tuán)體理性(collectiveration

2、ality )、效率、公正和公平;非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果 可能是有效率的,也可能是低效率或無(wú)效率的(張維迎, 1996, P5)。20世紀(jì)50年代,合 作博弈的研究達(dá)到鼎盛期,同時(shí)開(kāi)始出現(xiàn)對(duì)非合作博弈的研究,此后,博弈論的研究主流逐步轉(zhuǎn)向在非合作博弈領(lǐng)域。有些人認(rèn)為非合作博弈模型比合作博弈更“基本”,但有些人認(rèn)為兩者不相上下(Martin and Ariel Rubinstein , 2000, P2)。合作博弈,有時(shí)也叫做聯(lián)盟博弈( coalitional game ), 一般根據(jù)有無(wú)轉(zhuǎn)移支付而分為 兩類(lèi):可轉(zhuǎn)移支付聯(lián)盟博弈( coalitional game wi

3、th transferable payoff)和不可轉(zhuǎn)移支付聯(lián)盟博弈(coalitional game with non-transferablepayoff )??赊D(zhuǎn)移支付也叫有旁支付(side payment ),可轉(zhuǎn)移支付聯(lián)盟博弈假設(shè)博弈中各參與者都用相同的尺度來(lái)衡量他 們的贏得,聯(lián)各聯(lián)盟的贏得可以按任意方式在聯(lián)盟成員中分?jǐn)偅环駝t,就是不可轉(zhuǎn)移支付聯(lián)盟博弈。可轉(zhuǎn)移支付合作博弈不可轉(zhuǎn)移支付合作博非合作博弈圖博弈的分類(lèi)非合作博弈的分類(lèi)主要從兩個(gè)角度進(jìn)行劃分。一是參與者的行動(dòng)順序。從這個(gè)角度博弈可以分為靜態(tài)博弈(static game和動(dòng)態(tài)博弈(dynamic game。靜態(tài)博弈是指參與者同時(shí)

4、選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知前行動(dòng)者采取了何種行動(dòng);動(dòng)態(tài)博弈是指參與者的行動(dòng)有先后順序且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。二是參與者掌握的信息水平。從這個(gè)角度,博弈可以分為完全信息博弈和不完全信息博弈。完全信息(completeinformation )指的是每一個(gè)參與者對(duì)所有其他參與者的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí);否則就是不完全信息(incomplete information )。綜合上述兩種分類(lèi)方法,可將非合作博弈分成四類(lèi)。這四類(lèi)博弈及其對(duì)應(yīng)的均衡概念,大致上反映了 20世紀(jì)50年代以來(lái)非合作博弈理論的主要進(jìn)展和1994年三位諾貝爾經(jīng)濟(jì)學(xué)將得主的主要貢獻(xiàn),同時(shí)也大致

5、表明了 “納什均衡”及其精煉在博弈論發(fā)展中的地位和影響 (如表)。表 非合作博弈的分類(lèi)及對(duì)應(yīng)的均衡概念、主要貢獻(xiàn)者行動(dòng)順序靜 態(tài)動(dòng)態(tài)信息(參與者同時(shí)選擇行動(dòng)或雖非同時(shí)但(參與者的行動(dòng)有先后順序且后行動(dòng)后行動(dòng)者并不知前行動(dòng)者米取了何者能夠觀察到先行動(dòng)者所選擇的行種行動(dòng))動(dòng))完全信息(母奔與右對(duì)所有其他參與者的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí))完全信息靜態(tài)博弈;納什均衡;John (1950,1951)完全信息動(dòng)態(tài)博弈;子博弈完美納什均衡;Reinhard Selten(1965)不完全信息(母奔與右對(duì)所有其他參與者的特征、戰(zhàn)略空間及支付函數(shù)沒(méi)有準(zhǔn)確的知識(shí))不完全信息靜態(tài)博弈;貝葉斯納什均衡J

6、ohn (1967-1968)不完全信息動(dòng)態(tài)博弈;完美貝葉斯納什均衡;Reinhard Selten(1975),and (1982),and (1991)2博弈的表述形式現(xiàn)代博弈理論根據(jù)不同的博弈類(lèi)型給出了博弈模型的三種基本表達(dá)形式:標(biāo)準(zhǔn)式(normal form)表述、擴(kuò)展式表述( extensive form representation )和特征函數(shù)型表述。前兩者主要用于非合作博弈,后者主要用于合作博弈。標(biāo)準(zhǔn)式表述標(biāo)準(zhǔn)式表述又稱為戰(zhàn)略式表述(strategic form )或矩陣式表述(matrix form )。標(biāo)準(zhǔn)式表述將戰(zhàn)略局勢(shì)抽象為三個(gè)基本要素:(a)博弈的參與者集 N 1,2

7、, ,n;(b)每個(gè)參與者的戰(zhàn)略集Si, i N;(c)每個(gè)參與者的支付函數(shù)集Ri, i N o因此,一個(gè)標(biāo)準(zhǔn)式表述的博弈可以表示為G N,Si, Ri。標(biāo)準(zhǔn)式表述主要用來(lái)表示靜態(tài)博弈。標(biāo)準(zhǔn)式博弈也叫做戰(zhàn)略博弈。擴(kuò)展式表述擴(kuò)展式表述在標(biāo)準(zhǔn)式表述的基礎(chǔ)上,擴(kuò)展了描述博弈局勢(shì)的要素,比如參與者的行動(dòng)順序以及外生事件的概率分布等, 可以描述更復(fù)雜的博弈局勢(shì), 極大地?cái)U(kuò)大了博弈理論所能描述的范圍,一般用來(lái)表述動(dòng)態(tài)博弈。擴(kuò)展式表述一般包含六個(gè)要素:(a)博弈的參與者集N 1,2,n;(b)參與者的行動(dòng)順序(the order of moves ):即什么參與者在什么時(shí)候行動(dòng);( c )參與者的行動(dòng)空間(

8、 action set ) :在每次行動(dòng)時(shí),參與者有些什么行動(dòng)可供選擇;( d )參與者的信息集( information set ) :每次行動(dòng)時(shí),參與者知道些什么;( e )參與者的支付函數(shù):在行動(dòng)結(jié)束時(shí),每個(gè)局中人得到什么;( f )外生事件(即“自然”的選擇)的概率分布。特征函數(shù)型表述特征函數(shù)型表述主要用來(lái)表述聯(lián)盟博弈或合作博弈。令參與者集合為N,則稱N的任意子集 S 為聯(lián)盟 ( coalition ) , 所有聯(lián)盟的全體記為 (N ) 。 可轉(zhuǎn)移支付聯(lián)盟博弈包括兩個(gè)要素:(a)有限的參與者集N 1,2, ,n;(b)將N的每個(gè)非空子集 S (即一聯(lián)盟)與某個(gè)實(shí)數(shù)v(S)相聯(lián)系的一個(gè)特征函數(shù)v。因此,可轉(zhuǎn)移支付聯(lián)盟博弈可記為( N, v) 。其中特征函數(shù)v 是指定義在( N ) 上的一個(gè)實(shí)函數(shù),其中v( S) 表示聯(lián)盟S 通過(guò)協(xié)調(diào)其成員的策略所能保證得到的最大贏得。不可轉(zhuǎn)移支付聯(lián)盟博弈包括四個(gè)要素:(a)有限的參與者集N 1,2, ,n;( b )結(jié)果集X;(c)將N的每個(gè)非空子集 S (即一聯(lián)盟)賦一個(gè)集合V(S) X的特征函數(shù)V;(d)對(duì)每個(gè)參與者i N有一個(gè)X上的支付函數(shù) Ri(X), i N o(N,V,X,Ri(X) 。博弈的三種表述形式之差別,主要在于描述信息的多寡。擴(kuò)展型表述形式包括

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論