博弈論 第6講2013學(xué)習(xí)專(zhuān)業(yè)資料_第1頁(yè)
博弈論 第6講2013學(xué)習(xí)專(zhuān)業(yè)資料_第2頁(yè)
博弈論 第6講2013學(xué)習(xí)專(zhuān)業(yè)資料_第3頁(yè)
博弈論 第6講2013學(xué)習(xí)專(zhuān)業(yè)資料_第4頁(yè)
博弈論 第6講2013學(xué)習(xí)專(zhuān)業(yè)資料_第5頁(yè)
已閱讀5頁(yè),還剩73頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

上次內(nèi)容回顧帕累托占優(yōu)風(fēng)險(xiǎn)占優(yōu)聚點(diǎn)均衡防共謀均衡兩個(gè)拆遷博弈12動(dòng)態(tài)博弈的概念一類(lèi)博弈行為通常需要參與人多步?jīng)Q策才能完成,具有明顯的階段性。博弈的結(jié)局、各參與人的收益由多階段決策結(jié)果確定。各參與人的決策有一定的順序。3

Thekeyfeaturesofadynamicgameofcompleteandperfectinformationarethat(ⅰ)themovesoccurinsequence,(ⅱ)allpreviousmovesareobservedbeforethenextmoveischosen,and(ⅲ)theplayers’payoffsfromeachfeasiblecombinationofmovesarecommonknowledge.4動(dòng)態(tài)博弈的概念由于動(dòng)態(tài)博弈各參與人進(jìn)行決策具有明顯的階段性、行動(dòng)次序性,通常用擴(kuò)展式(extensiveform)表述法描述這些信息。5博弈的擴(kuò)展式表示參與人集合:i=1,…,N。用N表示虛擬參與人“自然”;自然的含義是某些外生的客觀概率分布事件參與人的行動(dòng)順序(theorderofmoves):描述各參與人在什么時(shí)候行動(dòng);參與人的行動(dòng)空間(actionset):在每次行動(dòng)時(shí),參與人可選擇的行動(dòng)集合;6博弈的擴(kuò)展式表示參與人的信息集(informationset):每次行動(dòng)時(shí)參與人知道什么;參與人的收益函數(shù):在行動(dòng)結(jié)束之后,每個(gè)參與人得到些什么。自然選擇的概率分布(假定自然狀態(tài)是共同知識(shí))。對(duì)于有限博弈,博弈樹(shù)是常用的表述方式。7擴(kuò)展式表述簡(jiǎn)例圖2-1就是一個(gè)商品仿冒和反仿冒動(dòng)態(tài)博弈的擴(kuò)展型描述。ABAB制止不仿冒仿冒不制止不仿冒仿冒制止不制止圖2-1仿冒和反仿冒博弈擴(kuò)展型表述(0,10)(-2,5)(2,2)(10,4)(5,5)8擴(kuò)展式表述簡(jiǎn)例圖2-2是包括自然選擇的博弈擴(kuò)展式表述圖2-2房地產(chǎn)開(kāi)發(fā)博弈ANB大(1/2)不開(kāi)發(fā)開(kāi)發(fā)小(1/2)(8,0)(1,0)NBB大(1/2)小(1/2)B(4,4)(-3,-3)(0,8)(0,0)(0,1)(0,0)9博弈樹(shù)若動(dòng)態(tài)博弈是有限博弈,則可用博弈樹(shù)表示該博弈。這里有限的含義是各階段各參與人的行動(dòng)數(shù)目有限博弈的階段數(shù)有限10博弈樹(shù)博弈樹(shù)的基本結(jié)構(gòu)為結(jié)點(diǎn)(nodes)。包括決策結(jié)及終點(diǎn)結(jié)。決策結(jié)是參與人采取行動(dòng)的時(shí)點(diǎn);終點(diǎn)結(jié)是博弈行動(dòng)路徑的終點(diǎn)。枝(branches)。從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇。11節(jié)點(diǎn)nodes決策節(jié)點(diǎn)(decisionnodes)終點(diǎn)節(jié)點(diǎn)(terminalnodes)枝branches:每一條樹(shù)枝代表一個(gè)行動(dòng)信息集informationsets:參與人在決策節(jié)點(diǎn)選擇行動(dòng)時(shí),需要有關(guān)信息;對(duì)此前博弈過(guò)程的一個(gè)全部而明確的認(rèn)識(shí)就構(gòu)成一個(gè)信息集。信息集的定義:12DefinitionAninformationsetforaplayerisacollectionofdecisionnodessatisfying:(ⅰ)theplayerhasthemoveateverynodeintheinformationset,and(ⅱ)whentheplayofthegamereachesanodeintheinformationset,theplayerwiththemovedoesnotknowwhichnodeintheinformationsethas(orhasnot)beenreached.

對(duì)完美信息動(dòng)態(tài)博弈的博弈樹(shù)來(lái)說(shuō),一個(gè)信息集只包含一個(gè)決策結(jié),對(duì)不完美信息動(dòng)態(tài)博弈,則一個(gè)信息集包含多個(gè)決策結(jié)。13博弈樹(shù)信息集:是決策結(jié)集合的一個(gè)子集。將博弈樹(shù)中某一決策者在某一行動(dòng)階段具有相同信息的所有決策結(jié)稱(chēng)為一個(gè)信息集。每個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié)。該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟出于哪一個(gè)決策結(jié)(若該信息集有兩個(gè)或兩個(gè)以上元素)。14completeinformation(i.e.,gamesinwhichtheplayers’payofffunctionsarecommonknowledge).Weanalyzedynamicgamesthathavenotonlycompletebutalsoperfectinformation,bywhichwemeanthatateachmoveinthegametheplayerwiththemoveknowsthefullhistoryoftheplayofthegamethusfar.

151617博弈樹(shù)對(duì)于有限動(dòng)態(tài)博弈,若參與人對(duì)彼此在各決策結(jié)點(diǎn)的行動(dòng)集合,彼此的效用函數(shù),歷史的行動(dòng)有著完全的了解,則稱(chēng)這樣的博弈為完全信息動(dòng)態(tài)博弈。如果博弈樹(shù)的所有信息集都是單元素集,稱(chēng)該博弈為完美信息博弈(gameofperfectinformation)。上述兩個(gè)定義的差別在于對(duì)自然行動(dòng)信息的描述。1819博弈樹(shù)實(shí)例注意,擴(kuò)展式表述也可以用于分析靜態(tài)博弈,如圖2-5的囚徒問(wèn)題。ABB坦白抵賴(lài)坦白抵賴(lài)抵賴(lài)坦白(-5,-5)(0,-8)(-8,0)(-1,-1)圖2-5囚徒問(wèn)題的擴(kuò)展式表述20一些說(shuō)明一般假定博弈滿(mǎn)足“完美回憶”(perfectrecall)要求?!巴昝阑貞洝钡母拍钔昝阑貞浭侵笡](méi)有任何參與人會(huì)忘記自己以前知道的事情,所有參與人都知道自己以前的選擇??梢岳眯畔⒓拍蠲枋鐾昝阑貞洝?1一些說(shuō)明圖2-6描述了不完美回憶現(xiàn)象。圖2-6不具有完美回憶的例子ABLDUBAALRARA不能區(qū)分(D,L)和(D,R)是正常的,因?yàn)閰⑴c人1可能沒(méi)有觀察到B是選擇了L還是選擇了R。但A不能區(qū)分(U,R)和(D,L)則說(shuō)明A忘記了在開(kāi)始博弈時(shí)選擇了U行動(dòng)還是D行動(dòng),因而不具有完美回憶。22一些說(shuō)明現(xiàn)實(shí)中不具完美回憶的一個(gè)例子是撲克比賽。在撲克比賽中,參與人常常忘記別人曾出過(guò)些什么牌。23一些說(shuō)明需要注意的是,若有些動(dòng)態(tài)博弈的階段很多乃至無(wú)限,或者參與人在一個(gè)階段有許多可以選擇的行為,這時(shí)采用博弈樹(shù)表述將變得很困難,或者不可行。如下棋等。此時(shí)應(yīng)用文字描述或用數(shù)學(xué)抽象形式表述。24動(dòng)態(tài)博弈的策略式表述相機(jī)選擇(contingentplay)動(dòng)態(tài)博弈中參與人的策略是各自預(yù)先設(shè)定的,在博弈的各階段,針對(duì)各種情況做出相應(yīng)決策。即“等待”博弈到達(dá)自己的信息集(包含一個(gè)或多個(gè)決策結(jié))后再?zèng)Q定如何行動(dòng)。在策略式表述博弈中,參與人似乎是博弈開(kāi)始之前就制定出了一個(gè)完全的相機(jī)選擇,即“如果……發(fā)生,我將選擇……”。25從擴(kuò)展式表述構(gòu)造戰(zhàn)略式表述假定開(kāi)發(fā)商A先決策,開(kāi)發(fā)商B觀測(cè)到A的選擇后決策。那么博弈的擴(kuò)展式表述如圖2-8表述。ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)圖2-8房地產(chǎn)開(kāi)發(fā)博弈動(dòng)態(tài)博弈的策略式表述26這是一個(gè)完美信息博弈(每個(gè)參與人的信息集是單結(jié)的)。A只有一個(gè)信息集,兩個(gè)可選擇行動(dòng),因而A的行動(dòng)空間也就是A的戰(zhàn)略空間:SA=(開(kāi)發(fā),不開(kāi)發(fā))。ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)圖2-8房地產(chǎn)開(kāi)發(fā)博弈動(dòng)態(tài)博弈的策略式表述27但B有兩個(gè)信息集,每個(gè)信息集上有兩個(gè)可選擇的行動(dòng),因而B(niǎo)有四個(gè)純戰(zhàn)略,分別為A開(kāi)發(fā),我開(kāi)發(fā);A不開(kāi)發(fā),我開(kāi)發(fā);A開(kāi)發(fā),我開(kāi)發(fā),A不開(kāi)發(fā)我不開(kāi)發(fā);A開(kāi)發(fā),我不開(kāi)發(fā),A不開(kāi)發(fā)我開(kāi)發(fā);A開(kāi)發(fā),我不開(kāi)發(fā),A不開(kāi)發(fā)我開(kāi)發(fā)。ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)圖2-8房地產(chǎn)開(kāi)發(fā)博弈動(dòng)態(tài)博弈的策略式表述28若把B的信息集從左到右排列,上述四個(gè)純策略可以簡(jiǎn)單記為{開(kāi)發(fā),開(kāi)發(fā)}{開(kāi)發(fā),不開(kāi)發(fā)}{不開(kāi)發(fā),開(kāi)發(fā)}{不開(kāi)發(fā),不開(kāi)發(fā)}上面四個(gè)純策略含義:當(dāng)A選擇開(kāi)發(fā)時(shí),B選擇大括號(hào)中前面的策略;當(dāng)A選擇不開(kāi)發(fā)時(shí),B選擇大括號(hào)中后面的策略。ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)圖2-8房地產(chǎn)開(kāi)發(fā)博弈動(dòng)態(tài)博弈的策略式表述29B的純策略為{開(kāi)發(fā),開(kāi)發(fā)}{開(kāi)發(fā),不開(kāi)發(fā)}{不開(kāi)發(fā),開(kāi)發(fā)}{不開(kāi)發(fā),不開(kāi)發(fā)}A的純策略為SA=(開(kāi)發(fā),不開(kāi)發(fā))于是可以寫(xiě)成策略式表述形式,為ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)圖2-8房地產(chǎn)開(kāi)發(fā)博弈動(dòng)態(tài)博弈的策略式表述30ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)圖2-8房地產(chǎn)開(kāi)發(fā)博弈開(kāi)發(fā),開(kāi)發(fā)開(kāi)發(fā),不開(kāi)發(fā)不開(kāi)發(fā),開(kāi)發(fā)不開(kāi)發(fā),不開(kāi)發(fā)開(kāi)發(fā)-3,-3-3,-31,01,0不開(kāi)發(fā)0,10,00,10,0表2-1房地產(chǎn)開(kāi)發(fā)博弈:策略式表述動(dòng)態(tài)博弈的策略式表述31該博弈有四個(gè)純戰(zhàn)略納什均衡,分別為(開(kāi)發(fā),{開(kāi)發(fā),不開(kāi)發(fā)})(開(kāi)發(fā),{不開(kāi)發(fā),開(kāi)發(fā)})(開(kāi)發(fā),{不開(kāi)發(fā),不開(kāi)發(fā)})(不開(kāi)發(fā),{開(kāi)發(fā),開(kāi)發(fā)})ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)圖2-8房地產(chǎn)開(kāi)發(fā)博弈開(kāi)發(fā),開(kāi)發(fā)開(kāi)發(fā),不開(kāi)發(fā)不開(kāi)發(fā),開(kāi)發(fā)不開(kāi)發(fā),不開(kāi)發(fā)開(kāi)發(fā)-3,-31,01,01,0不開(kāi)發(fā)0,10,00,10,0表2-1房地產(chǎn)開(kāi)發(fā)博弈:策略式表述動(dòng)態(tài)博弈的策略式表述32在擴(kuò)展式表述博弈中,所有n個(gè)參與人的一個(gè)純戰(zhàn)略組合s=(s1,…,sn)決定了博弈樹(shù)上的一個(gè)路徑。比如(開(kāi)發(fā),{不開(kāi)發(fā),開(kāi)發(fā)})決定了博弈的路徑為A

開(kāi)發(fā)

B不開(kāi)發(fā)(1,0)ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)圖2-8房地產(chǎn)開(kāi)發(fā)博弈開(kāi)發(fā),開(kāi)發(fā)開(kāi)發(fā),不開(kāi)發(fā)不開(kāi)發(fā),開(kāi)發(fā)不開(kāi)發(fā),不開(kāi)發(fā)開(kāi)發(fā)-3,-31,01,01,0不開(kāi)發(fā)0,10,00,10,0表2-1房地產(chǎn)開(kāi)發(fā)博弈:策略式表述動(dòng)態(tài)博弈的策略式表述33(不開(kāi)發(fā),{開(kāi)發(fā),開(kāi)發(fā)})決定了博弈的路徑為A

不開(kāi)發(fā)

B開(kāi)發(fā)(0,1)(開(kāi)發(fā),{不開(kāi)發(fā),開(kāi)發(fā)})決定了博弈的路徑為A

開(kāi)發(fā)

B不開(kāi)發(fā)(1,0)ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)圖2-8房地產(chǎn)開(kāi)發(fā)博弈開(kāi)發(fā),開(kāi)發(fā)開(kāi)發(fā),不開(kāi)發(fā)不開(kāi)發(fā),開(kāi)發(fā)不開(kāi)發(fā),不開(kāi)發(fā)開(kāi)發(fā)-3,-3-3,-31,01,0不開(kāi)發(fā)0,10,00,10,0表2-1房地產(chǎn)開(kāi)發(fā)博弈:戰(zhàn)略式表述動(dòng)態(tài)博弈的策略式表述34動(dòng)態(tài)博弈的策略式表述給出了擴(kuò)展式表述的戰(zhàn)略式表述轉(zhuǎn)換,就可以像靜態(tài)博弈那樣,定義純戰(zhàn)略納什均衡或混合戰(zhàn)略納什均衡。按照VonNeumann觀點(diǎn),將動(dòng)態(tài)博弈模型轉(zhuǎn)化成策略式表述形式后,按照靜態(tài)博弈分析方法,即可處理動(dòng)態(tài)博弈問(wèn)題。近來(lái)研究表明,存在策略式表述相同,但卻有本質(zhì)差別的,不同擴(kuò)展式表述的動(dòng)態(tài)博弈。說(shuō)明上述觀點(diǎn)具有一定的局限性。因此,策略式表述并不能取代擴(kuò)展式表述。35完全信息動(dòng)態(tài)博弈納什

均衡存在性定理如果有限博弈是完美信息博弈,他還有一個(gè)純戰(zhàn)略納什均衡(Zermelo,1913)。通過(guò)一個(gè)簡(jiǎn)單實(shí)例(見(jiàn)圖2-9)說(shuō)明Zermelo定理。DURL(3,1)(0,0)圖2-9逆推法求納什均衡(2,2)AB36逆推歸納法逆推歸納法是求解完美信息動(dòng)態(tài)博弈的經(jīng)典方法。逆推法思路。假設(shè)博弈到了第二階段,參與人B的信息集為{D},選擇L獲利1單位,選擇R獲利0單位,因此B應(yīng)該選擇L;在博弈的第一階段,參與人A選擇U獲利2單位,選擇D獲利狀況取決于參與人B的選擇;DURL(3,1)(0,0)圖2-9逆推法求納什均衡(2,2)AB37但A知道B是理性的,一旦到達(dá)第二階段,B肯定會(huì)選擇L行動(dòng),從而A獲利為3單位,因此,A應(yīng)選擇D。因此,(D,L)是純戰(zhàn)略納什均衡。DURL(3,1)(0,0)圖2-9逆推法求納什均衡(2,2)AB逆推歸納法38如果采用博弈的策略式表述(見(jiàn)表2-2),可得到另一個(gè)納什均衡(U,R)。如果A選擇U,那么B的信息集不能達(dá)到,我們說(shuō)B的信息集不在均衡路徑上(out-of-equilibriumpath)。ABDURL(3,1)(0,0)圖2-9逆推法求納什均衡(2,2)LRU2,22,2D3,10,0表2-2策略式表述與策略式分析比較39此種情況下,B的選擇對(duì)A沒(méi)有什么影響。因此,納什均衡對(duì)一個(gè)參與人在非均衡信息集上的選擇沒(méi)有限制。但是,一個(gè)參與人在非均衡信息集上的戰(zhàn)略可以影響其他參與人在均衡信息集上的選擇。ABDURL(3,1)(0,0)圖2-9逆推法求納什均衡(2,2)LRU2,22,2D3,10,0表2-2策略式表述與策略式分析比較40與策略式分析比較逆向歸納法實(shí)質(zhì)上是重復(fù)剔除劣戰(zhàn)略法在擴(kuò)展式博弈中的應(yīng)用。逆向歸納法不適用于無(wú)限博弈和不完美信息博弈。逆向歸納法剔除了“非理性”的均衡策略…41海盜分贓-逆向歸納案例5個(gè)海盜搶來(lái)了100枚金幣,大家決定分贓的方式是:由海盜一提出一種分配方案,如果同意該方案的人達(dá)到半數(shù),則該提議通過(guò)并實(shí)施;否則,提議人將被扔進(jìn)大海喂鯊魚(yú)。然后由接下來(lái)的海盜繼續(xù)重復(fù)提議過(guò)程。假設(shè)每個(gè)海盜都絕頂聰明,也不相互合作,并且極度自私,那么第一個(gè)海盜該如何提議?42海盜分贓-逆向歸納案例使用逆向歸納法可以求解如下:首先,考慮只剩下最后的海盜五,顯然他會(huì)分給自己100枚,并贊成自己;再回溯到只剩下海盜四和海盜五的決策,海盜四可以分給自己100枚并贊成自己;海盜五被分得0枚,即使反對(duì)也無(wú)用;43海盜分贓-逆向歸納案例回到海盜三,海盜三可以分給海盜五1枚得到海盜五的同意;分給自己99枚,自己也同意;分給海盜四0枚,海盜四反對(duì)但無(wú)用;回到海盜二,海盜二可以分給海盜四1枚得到海盜四同意;分給自己99枚,自己也同意;海盜三、五各分得0枚,他們會(huì)反對(duì)但反對(duì)沒(méi)有用44海盜分贓-逆向歸納案例回到海盜一,他可以分給海盜三、五各1枚,獲得海盜三、五的同意;分給自己98,自己也同意;分給海盜二、四各0枚,他們會(huì)反對(duì)但反對(duì)不起作用。45海盜分贓-逆向歸納案例因此,這個(gè)海盜分贓問(wèn)題的答案是(98,0,1,0,1):海盜一提出分給自己98枚,分給海盜二、四各0枚,分給三、五個(gè)1枚;該提議會(huì)被通過(guò),因?yàn)楹1I一、三、五會(huì)投贊成票。我們可以把這個(gè)逆向決策的過(guò)程用如下矩陣表達(dá)出來(lái)(下圖,其中畫(huà)下劃線的數(shù)字表示海盜對(duì)該方案投了贊成票,未加下劃線對(duì)應(yīng)于反對(duì)票)46海盜分贓-逆向歸納案例海盜分贓逆向推理過(guò)程(全部海盜半數(shù)同意即可通過(guò))分配者分配給各海盜的金幣枚數(shù)海盜一海盜二海盜三海盜四海盜五海盜五100海盜四100

0海盜三99

01海盜二

99

0

1

0海盜一98

01

0147海盜分贓-逆向歸納案例思考:1,如果規(guī)則改為超過(guò)半數(shù)通過(guò),怎么提議?2,如果規(guī)則改為除了提議人之外的海盜超過(guò)半數(shù)通過(guò),怎么提議?48可信性問(wèn)題可信性(credibility)的含義參與人事先宣布的行動(dòng)方案是否在實(shí)際執(zhí)行過(guò)程中也能保持一致?49一個(gè)實(shí)例BA分不借借不分圖2-10開(kāi)金礦博弈(1,0)(2,2)(0,4)A在開(kāi)采價(jià)值4萬(wàn)元的金礦時(shí)缺1萬(wàn)元資金,B正好有1萬(wàn)元資金可以投資。設(shè)想A說(shuō)服B將這1萬(wàn)元資金借給自己用于開(kāi)礦,并許諾在采到金子后與B對(duì)半分成,B是否應(yīng)該將錢(qián)借給A呢?B關(guān)心的是A開(kāi)采到金子后是否會(huì)履行諾言?可信性問(wèn)題50BA分不借借不分圖2-10開(kāi)金礦博弈(1,0)(2,2)(0,4)B的處境是“不借”則資金安全,但得不到利潤(rùn);“借”則面臨A的不守信風(fēng)險(xiǎn)。若根據(jù)“經(jīng)濟(jì)理性”原則,一旦B將錢(qián)借出,A將卷款逃走;因此,B的最優(yōu)策略是“不借”這說(shuō)明,在這樣的博弈結(jié)構(gòu)下,A的承諾是“不可信的”??尚判詥?wèn)題51BA分不借借不分圖2-10開(kāi)金礦博弈(1,0)(2,2)(0,4)因此,雙方最優(yōu)策略為第一階段,B選擇“不借”若博弈到達(dá)第二階段,則A選擇不分。如果引入法律機(jī)制…可信性問(wèn)題52BA分不借借不分圖2-11有法律保障的開(kāi)金礦博弈(1,0)(2,2)(0,4)B(1,0)打不打可信性問(wèn)題圖2-11是有法律保障的開(kāi)金礦博弈問(wèn)題。由該圖可以看出,最終博弈的理性結(jié)果為B借錢(qián)給A,開(kāi)采結(jié)束后,A與B利潤(rùn)平分(用逆序歸納法,自己驗(yàn)證一下)。53可信性問(wèn)題BA分不借借不分圖2-12法律保障不足的開(kāi)金礦博弈(1,0)(2,2)(0,4)B(-1,0)不打打若法律保障不足以使B堅(jiān)持打官司,如圖2-12所示,則與前面分析類(lèi)似,B在第一階段將選擇“不借”,A在第二階段將選擇“不分”(一旦B借款給A的話(huà))。一旦B由于“糊涂”將錢(qián)借給了A,則第三階段將選擇不打官司。54BA分不借借不分圖2-12法律保障不足的開(kāi)金礦博弈(1,0)(2,2)(0,4)B(-1,0)不打打上述分析說(shuō)明,在一個(gè)有私心,重視自身利益的成員組成的社會(huì)里,完善公正的法律制度不但能保證社會(huì)的公平,而且還能提高社會(huì)經(jīng)濟(jì)活動(dòng)的效率??尚判詥?wèn)題55逆向歸納法小結(jié)逆向歸納法求解策略:從動(dòng)態(tài)博弈的最后一個(gè)階段出發(fā),對(duì)該參與人采用經(jīng)濟(jì)理性原則進(jìn)行分析,逐步到推回前一個(gè)階段相應(yīng)參與人的行動(dòng)選擇,一直到第一階段的分析方法。56逆向歸納法小結(jié)由于逆推法確定的各參與人在各階段的行動(dòng)選擇,都是建立在后續(xù)階段各個(gè)參與人理性選擇基礎(chǔ)上的,因此自然排除了包含不可信承諾的可能性。逆向歸納法中的共同知識(shí)。逆推歸納法是完美信息動(dòng)態(tài)博弈分析中使用最普遍的方法。57反國(guó)家分裂法的承諾作用58子博弈完美均衡在動(dòng)態(tài)博弈的戰(zhàn)略式表述中,納什均衡假定每一個(gè)參與人在選擇最優(yōu)戰(zhàn)略時(shí),是基于其他所有參與人戰(zhàn)略選擇給定前提下進(jìn)行的,而沒(méi)有考慮到自己的選擇對(duì)其他參與人的影響,因此,納什均衡具有一定的缺陷性。澤爾騰(Selten)的子博弈完美納什均衡(subgameperfectNashEquilibrium)在一定程度上對(duì)此作出了貢獻(xiàn)。59子博弈完美均衡子博弈概念一個(gè)擴(kuò)展式博弈的子博弈G由一個(gè)決策結(jié)x和所有該決策結(jié)的后續(xù)結(jié)T(x)組成,它滿(mǎn)足下列條件:x是一個(gè)單結(jié)信息集,即h(x)={x};對(duì)于所有的T(x)中的x’,如果x’’與x’同屬于一個(gè)信息集,則x’’也在T(x)中。圖2-13表示了子博弈與原博弈的關(guān)系。需要說(shuō)明的是,G本身是自己的一個(gè)子博弈。60ABB開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)圖2-13博弈和子博弈B開(kāi)發(fā)a)原博弈b)子博弈I不開(kāi)發(fā)不開(kāi)發(fā)B開(kāi)發(fā)c)子博弈II不開(kāi)發(fā)(-3,-3)(1,0)(0,1)(0,0)(-3,-3)(1,0)(0,1)(0,0)61子博弈完美均衡圖2-14的兩個(gè)博弈擴(kuò)展型中,特殊顏色標(biāo)示的部分都不是原博弈的子博弈。ABBLDURL圖2-14構(gòu)不成子博弈的圖形表示(1)a)原博弈R62圖2-15中紅色部分構(gòu)成的圖形不是原博弈的子博弈,因?yàn)閰⑴c人C的信息集被切割。ABBLDURLRClCrlCrlCrlr圖2-15構(gòu)不成子博弈的圖形表示(2)子博弈完美均衡63子博弈完美均衡子博弈完美納什均衡擴(kuò)展式博弈的一個(gè)戰(zhàn)略組合s*=(s1*,…,si*,…,sn*)是一個(gè)子博弈完美納什均衡,如果它是原博弈的納什均衡。它在每一個(gè)子博弈上都是納什均衡。64子博弈完美均衡納什均衡與子博弈精煉納什均衡的關(guān)系前面分析說(shuō)明,一個(gè)特定的納什均衡決定了原博弈樹(shù)上唯一的一條路徑,這條路徑稱(chēng)為“均衡路徑”(equilibriumpath)。相對(duì)該納什均衡,其他路徑稱(chēng)為非均衡路徑(out-of-equilibriumpath)。如圖2-16中的房地產(chǎn)博弈中65子博弈完美均衡博弈的路徑A

不開(kāi)發(fā)

B開(kāi)發(fā)(0,1)是納什均衡(不開(kāi)發(fā),{開(kāi)發(fā),開(kāi)發(fā)})的均衡路徑,相對(duì)此納什均衡,其他路徑為非均衡路徑。納什均衡只要求在均衡路徑的決策結(jié)上是最優(yōu)的。不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(0,1)(0,0)圖2-16房地產(chǎn)開(kāi)發(fā)博弈ABB(-3,-3)(1,0)開(kāi)發(fā)不開(kāi)發(fā)66子博弈完美均衡在每一個(gè)子博弈上給出納什均衡意味著,構(gòu)成子博弈納什均衡的戰(zhàn)略不僅在均衡路徑的決策結(jié)上是最優(yōu)的,同時(shí)在非均衡路徑的決策結(jié)上也是最優(yōu)的。對(duì)于有限完美信息博弈,前面介紹的逆推歸納法得出的納什均衡即是子博弈精煉納什均衡。不開(kāi)發(fā)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)發(fā)(0,1)(0,0)圖2-16房地產(chǎn)開(kāi)發(fā)博弈ABB(-3,-3)(1,0)開(kāi)發(fā)不開(kāi)發(fā)67一些說(shuō)明逆推歸納法實(shí)質(zhì)上是以“所有參與人是理性的”是所有參與人的共同知識(shí)。但對(duì)參與人數(shù)較多且博弈階段數(shù)較多時(shí),上述假設(shè)在實(shí)際中將會(huì)受到懷疑。請(qǐng)看圖2-17的“蜈蚣博弈”

(1,…,1)(1/2,…,1/2)(1/i,…,1/i)(1/n,…,1/n)(2,…,2)……圖2-17蜈蚣博弈DDDD1A2AAA68一些說(shuō)明若使用逆推歸納法,可以預(yù)測(cè)所有參與人都將選擇A。當(dāng)n很大時(shí),上述預(yù)測(cè)很值得懷疑??紤]參與人1...(1,…,1)(1/2,…,1/2)(1/i,…,1/i)(1/n,…,1/n)(2,…,2)……圖2-17蜈蚣博弈DDDD1A2AAA69一些說(shuō)明由此類(lèi)問(wèn)題及其他問(wèn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論