版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
主講人:肖會(huì)敏河南財(cái)經(jīng)學(xué)院經(jīng)濟(jì)博弈論主講人:肖會(huì)敏河南財(cái)經(jīng)學(xué)院經(jīng)濟(jì)博弈論4.3子博弈精煉納什均衡第四章完全信息動(dòng)態(tài)博弈4.2擴(kuò)展型博弈的策略及均衡4.1擴(kuò)展型博弈表述4.4子博弈精煉納什均衡應(yīng)用舉例4.3子博弈精煉納什均衡第四章完全信息動(dòng)態(tài)博弈4.4.1擴(kuò)展型博弈表述在靜態(tài)博弈中,所有參與人同時(shí)行動(dòng)(或行動(dòng)雖有先后,但沒有人在自己行動(dòng)之前觀測(cè)到別人的行動(dòng))。在動(dòng)態(tài)博弈中,參與人的行動(dòng)有先后順序,且后行動(dòng)者在自己行動(dòng)之前能觀測(cè)到先行動(dòng)者的行動(dòng)。擴(kuò)展型表述的引入博弈專家習(xí)慣于用戰(zhàn)略式表述描述和分析靜態(tài)博弈,而用擴(kuò)展式表述(extensiveformrepresentation)來描述和分析動(dòng)態(tài)博弈。4.1擴(kuò)展型博弈表述在靜態(tài)博弈中,所有參與人同時(shí)行動(dòng)(4.1擴(kuò)展型博弈表述擴(kuò)展型表述所“擴(kuò)展”的主要是參與人的戰(zhàn)略空間。戰(zhàn)略式表述簡(jiǎn)單地給出參與人有些什么戰(zhàn)略可以選擇,而擴(kuò)展式表述要給出每個(gè)戰(zhàn)略地動(dòng)態(tài)描述:誰在什么時(shí)候行動(dòng),每次行動(dòng)時(shí)有些什么具體行動(dòng)可供選擇,以及知道些什么。簡(jiǎn)單地說,在擴(kuò)展式表述中,戰(zhàn)略對(duì)應(yīng)于參與人的相機(jī)行動(dòng)規(guī)則(contingentactionplan),即什么情況下選擇什么行動(dòng),而不是簡(jiǎn)單的、與環(huán)境無關(guān)的行動(dòng)選擇。擴(kuò)展型表述的引入4.1擴(kuò)展型博弈表述擴(kuò)展型表述所“擴(kuò)展”的主要是參與人4.1擴(kuò)展型博弈表述參與人集合:,此外,我們將用N代表虛擬參與人“自然”;參與人的行動(dòng)順序(theorderofmoves):誰在什么時(shí)候行動(dòng);參與人的行動(dòng)空間(actionset):在每次行動(dòng)時(shí),參與人有些什么選擇。參與人的信息集(informationset):每次行動(dòng)時(shí),參與人知道些什么;參與人的支付函數(shù):在行動(dòng)結(jié)束之后,每個(gè)參與人得到些什么(支付是所有行動(dòng)的函數(shù));外生事件(即自然的選擇)的概率分布擴(kuò)展型表述的要素4.1擴(kuò)展型博弈表述參與人集合:,4.1擴(kuò)展型博弈表述n個(gè)人有限戰(zhàn)略博弈的擴(kuò)展式表述可以用博弈樹來表示。為了說明這一點(diǎn),我們考慮房地產(chǎn)開發(fā)博弈的例子,我們假定該博弈的行動(dòng)順序如下:開發(fā)商A首先行動(dòng),選擇開發(fā)或不開發(fā);在A決策后,自然選擇市場(chǎng)需求的大??;開發(fā)商B在觀測(cè)到A的決策和市場(chǎng)需求后,決定開發(fā)或不開發(fā)。擴(kuò)展型表述的表示方式4.1擴(kuò)展型博弈表述n個(gè)人有限戰(zhàn)略博弈的擴(kuò)展式表述可4.1擴(kuò)展型博弈表述房地產(chǎn)開發(fā)博弈樹:注意:支付向量的順序與博弈樹上行動(dòng)順序是對(duì)應(yīng)的!4.1擴(kuò)展型博弈表述房地產(chǎn)開發(fā)博弈樹:注意:支付向量的順4.1擴(kuò)展型博弈表述博弈樹基本構(gòu)造:結(jié)(nodes):包括決策結(jié)(decisionnodes)和終點(diǎn)結(jié)(terminalnodes)兩類。決策結(jié)是參與人采取行動(dòng)的時(shí)點(diǎn),終點(diǎn)結(jié)時(shí)博弈行動(dòng)路徑的終點(diǎn)。在上例中,決策結(jié)包括空心圓和所有六個(gè)實(shí)心圓,終點(diǎn)結(jié)包括對(duì)應(yīng)八個(gè)支付向量的點(diǎn)。枝(branches):枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線(有時(shí)用箭頭表述),每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇。比如,在上圖中,開發(fā)商A有兩個(gè)選擇,分別用標(biāo)有“開發(fā)”和“不開發(fā)”的兩個(gè)枝表示。4.1擴(kuò)展型博弈表述博弈樹基本構(gòu)造:結(jié)(nodes):包4.1擴(kuò)展型博弈表述博弈樹基本構(gòu)造:3.信息集(informationset):博弈樹上的所有決策結(jié)分割成不同的信息集。每一個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié):每一個(gè)決策結(jié)都是同一參與人的決策結(jié);該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)。我們引入信息集的目的是描述下列情況:當(dāng)一個(gè)參與人要作出決策時(shí)他可能并不知道“之前”發(fā)生的所有事情。一個(gè)信息集可能包含多個(gè)決策結(jié),也可能只包含一個(gè)決策結(jié)(稱為單結(jié)信息集(singletons))??梢杂锰摼€將屬于同一信息集的兩個(gè)決策結(jié)連起來4.1擴(kuò)展型博弈表述博弈樹基本構(gòu)造:3.信息集(info4.1擴(kuò)展型博弈表述囚徒困境博弈的擴(kuò)展式表述:一般假定博弈滿足“完美回憶”(perfectrecall)的要求。完美回憶指沒有參與人會(huì)忘記自己以前知道的事情,所有參與人都只到自己以前的選擇。4.1擴(kuò)展型博弈表述囚徒困境博弈的擴(kuò)展式表述:4.2擴(kuò)展型博弈的策略與均衡純戰(zhàn)略:同樣的純戰(zhàn)略,既可以解釋為擴(kuò)展式的,也可以解釋為戰(zhàn)略式的。不同之處在于:在擴(kuò)展式表述博弈,參與人式相機(jī)行事,即“等待”博弈到達(dá)自己的信息集(包含一個(gè)或多個(gè)決策結(jié))后再?zèng)Q定如何行動(dòng);在戰(zhàn)略式表述博弈,參與人似乎是在博弈開始之前就制定出了一個(gè)完全的相機(jī)行動(dòng)計(jì)劃,即“如果…發(fā)生,我們將選擇…”。4.2擴(kuò)展型博弈的策略與均衡純戰(zhàn)略:同樣的純戰(zhàn)略,既4.2擴(kuò)展型博弈的策略與均衡如何從擴(kuò)展式表述構(gòu)造戰(zhàn)略式表述為了說明這個(gè)問題,我們考慮房地產(chǎn)開發(fā)博弈的例子4.2擴(kuò)展型博弈的策略與均衡如何從擴(kuò)展式表述構(gòu)造戰(zhàn)略式表4.2擴(kuò)展型博弈的策略與均衡如何從擴(kuò)展式表述構(gòu)造戰(zhàn)略式表述開發(fā)商B(-3,-3)(-3,-3)(1,0)(1,0)(0,1)(0,0)(0,1)(0,0)(開發(fā),開發(fā))(開發(fā),不開發(fā))(不開發(fā),開發(fā))(不開發(fā),不開發(fā))開發(fā)商A開發(fā)不開發(fā)戰(zhàn)略式表述4.2擴(kuò)展型博弈的策略與均衡如何從擴(kuò)展式表述構(gòu)造戰(zhàn)略式表4.2擴(kuò)展型博弈的策略與均衡逆向歸納法:逆向歸納法實(shí)際上是重復(fù)剔除劣戰(zhàn)略方法在擴(kuò)展式博弈中地應(yīng)用。我們從最后一個(gè)決策結(jié)開始往回倒推,每一步剔除在該決策結(jié)上參與人的劣選擇,因此,在均衡路徑,每一個(gè)參與人在每一個(gè)信息集上的選擇都是占優(yōu)選擇。上述逆向歸納法的過程不適用于無限博弈和不完美信息博弈。逆向歸納法也不適用于無限博弈并不意味著無限博弈沒有納什均衡存在。4.2擴(kuò)展型博弈的策略與均衡逆向歸納法:逆向歸納法實(shí)4.3子博弈精煉納什均衡4.3.1引言在納什均衡中,存在一個(gè)很嚴(yán)重的缺陷:納什均衡假定每一個(gè)參與人在選擇自己的最優(yōu)戰(zhàn)略時(shí)假定所有其他參與人的戰(zhàn)略選擇是給定的,就是說,參與人并不考慮自己的選擇對(duì)其他人選擇的影響。本節(jié)將要討論的澤爾騰(Selten)的“子博弈精煉納什均衡”是納什均衡概念的第一個(gè)最重要的改進(jìn),它的目的是把動(dòng)態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”分開。正如納什均衡是完全信息靜態(tài)博弈解的基本概念一樣,子博弈精煉納什均衡是完全信息動(dòng)態(tài)博弈解的基本概念。4.3子博弈精煉納什均衡4.3.1引言在納什均衡中,4.3子博弈精煉納什均衡4.3.1不可置信的存在為了說明上述論點(diǎn),我們考慮上一節(jié)討論過的房地產(chǎn)開發(fā)博弈的例子。4.3子博弈精煉納什均衡4.3.1不可置信的存在為了4.3子博弈精煉納什均衡分析結(jié)果:這個(gè)博弈有三個(gè)納什均衡,分別為:(不開發(fā),『開發(fā),開發(fā)』),(開發(fā),『不開發(fā),開發(fā)』)和(開發(fā),『不開發(fā),不開發(fā)』)用博弈論的語言來說,納什均衡(不開發(fā),『開發(fā),開發(fā)』)是不可置信的(notcredible),因?yàn)樗蕾囉贐的一個(gè)不可置信的威脅戰(zhàn)略;B的戰(zhàn)略是不可置信的,因?yàn)榻o定A選擇開發(fā),B不會(huì)實(shí)施這個(gè)威脅。(開發(fā),『不開發(fā),開發(fā)』)是這個(gè)博弈的唯一子博弈精煉納什均衡。4.3子博弈精煉納什均衡分析結(jié)果:4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡澤爾騰(Selten,1965)引入“子博弈精煉納什均衡”(subgameperfectNashequilibrium)概念的目的是將那些包含不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈結(jié)果的一個(gè)合理預(yù)測(cè)。簡(jiǎn)單地說,子博弈精煉納什均衡要求均衡戰(zhàn)略地行為規(guī)則在每一個(gè)信息集上都是最優(yōu)地。我們首先給出子博弈的概念,粗略的說,子博弈是愿博弈的一部分,它本身可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析。正式地,我們有下述定義:4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡定義:一個(gè)擴(kuò)展式博弈的子博弈G由一個(gè)決策結(jié)x和所有該決策結(jié)的后續(xù)結(jié)(包括終點(diǎn)結(jié))組成,它滿足下列條件:(1)x是一個(gè)單結(jié)信息集,即;(2)對(duì)于所有的,如果,那么解釋:條件(1)說的是一個(gè)子博弈必須從一個(gè)單結(jié)信息集開始。條件(2)說的是,子博弈的信息集和支付向量都直接繼承自原博弈。要求子博弈滿足上述兩個(gè)條件的目的是保證子博弈對(duì)應(yīng)于原博弈中可能出現(xiàn)的情況。4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡定義4.3子博弈精煉納什均衡例如:4.3子博弈精煉納什均衡例如:4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡定義:擴(kuò)展式博弈的戰(zhàn)略組合是一個(gè)子博弈精煉納什均衡,如果(1)它是原博弈的納什均衡;(2)它在每一個(gè)子博弈上給出納什均衡。另外:簡(jiǎn)單地說,一個(gè)戰(zhàn)略組合是子博弈精煉納什均衡,當(dāng)只當(dāng)它在每一個(gè)子博弈(包括原博弈)上都構(gòu)成一個(gè)納什均衡。如果整個(gè)博弈是唯一的子博弈,納什均衡與子博弈精煉納什均衡是相同的;如果有其他子博弈存在,有些納什均衡可能不構(gòu)成子博弈精煉納什均衡。4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡定義4.3子博弈精煉納什均衡4.3子博弈精煉納什均衡4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡這里還需強(qiáng)調(diào)一下上述定義中的“在每一個(gè)子博弈上給出納什均衡”這句話。如果一個(gè)博弈有幾個(gè)子博弈,一個(gè)特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”(equilibriumpath),博弈樹上的其他路徑稱為非均衡路徑(out-of–equilibriumpath)。納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的?!霸诿恳粋€(gè)子博弈上給出納什均衡”意味著,構(gòu)成子博弈精煉納什均衡的戰(zhàn)略不僅在均衡路徑的決策結(jié)上是最優(yōu)的,而且在非均衡路徑的決策結(jié)上也是最優(yōu)的。子博弈精煉納什均衡就是要剔除掉那些只在特定情況下是合理的而在其他情況下并不合理的行動(dòng)規(guī)則。4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡這4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈精煉納什均衡對(duì)于有限完美信息博弈,逆向歸納法是求解子博弈精煉納什均衡的最簡(jiǎn)便方法。因?yàn)橛邢尥昝佬畔⒉┺牡拿恳粋€(gè)決策結(jié)都是一個(gè)單獨(dú)的信息集,每一個(gè)決策結(jié)都開始一個(gè)子博弈。給定博弈到達(dá)最后一個(gè)決策結(jié),該決策結(jié)上行動(dòng)的參與人有一個(gè)最優(yōu)選擇,這個(gè)最優(yōu)選擇就是該決策結(jié)開始的子博弈的納什均衡(如果該決策結(jié)上的最優(yōu)行動(dòng)多于一個(gè),那么我們?cè)试S參與人選擇其中的任何一個(gè);如果最后一個(gè)決策者有多個(gè)決策結(jié),那么每一個(gè)決策結(jié)開始的子博弈都有一個(gè)納什均衡)。然后倒回到倒數(shù)第二個(gè)決策結(jié)(最后決策結(jié)的直接前列結(jié)),找出倒數(shù)第二個(gè)決策者的最優(yōu)選擇(假定最后一個(gè)決策者的選擇是最優(yōu)的),這個(gè)最優(yōu)選擇與我們?cè)诘谝徊秸页龅淖詈鬀Q策者的最優(yōu)選擇構(gòu)成從倒數(shù)第二個(gè)決策結(jié)開始的子博弈的一個(gè)納什均衡。4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈精煉納什均衡3、如此不斷直到初始結(jié),每一步都得到對(duì)應(yīng)子博弈的一個(gè)納什均衡,在這個(gè)過程的最后一步得到的整個(gè)博弈的納什均衡也就是這個(gè)博弈的子博弈精煉納什均衡例如:房地產(chǎn)開發(fā)博弈就是這樣一個(gè)兩階段完美信息博弈。用逆向歸納法求解這個(gè)博弈的精煉均衡的步驟如下:4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈精煉納什均衡在第二階段,B的最優(yōu)行動(dòng)規(guī)則是:{不開發(fā),開發(fā)},即,如果A在第一階段選擇了開發(fā),B在第二階段選擇不開發(fā);如果A在第一階段選擇了不開發(fā),B在第二階段選擇開發(fā)。因?yàn)锳在第一階段預(yù)測(cè)到B在第二階段會(huì)按這個(gè)規(guī)則行動(dòng),A在第一階段的最優(yōu)選擇是開發(fā)。用逆向歸納法得到的精煉均衡是(開發(fā),{不開發(fā),開發(fā)})。4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈精煉納什均衡上述分析表明,用逆向回歸法求解子博弈精煉納什均衡的過程,實(shí)質(zhì)是重復(fù)剔除劣戰(zhàn)略過程在擴(kuò)展式博弈上的擴(kuò)展:從最后一個(gè)決策結(jié)開始依次剔除掉每個(gè)子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精煉納什均衡。根據(jù)定義,逆向歸納法只適用于完美信息博弈。但是,有些非完美信息博弈也可以運(yùn)用逆向歸納法的邏輯求解。4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈4.3子博弈精煉納什均衡4.3.4承諾行動(dòng)與子博弈精煉納什均衡我們已經(jīng)看到,有些納什均衡之所以不是精煉均衡,是因?yàn)樗鼈儼瞬豢芍眯诺耐{戰(zhàn)略。這一點(diǎn)意味著,如果參與人能在博弈之前采取某種措施改變自己的行動(dòng)空間或支付函數(shù),原來不可置信的威脅就可能變得可置信,博弈的精煉均衡就會(huì)相應(yīng)改變。我們將這些為改變博弈結(jié)果而采取的措施稱為“承諾行動(dòng)”(commitment)。在許多情況下,承諾行動(dòng)對(duì)當(dāng)事人是很有價(jià)值的。特別地,有些情況下,一個(gè)參與人可以通過減少自己地選擇機(jī)會(huì)使自己受益,原因在于保證自己不選擇某些行動(dòng)可以改變對(duì)手的選擇4.3子博弈精煉納什均衡4.3.4承諾行動(dòng)與子博弈精煉納4.3子博弈精煉納什均衡4.3.4承諾行動(dòng)與子博弈精煉納什均衡承諾行動(dòng)的一個(gè)古典例子使戰(zhàn)爭(zhēng)中將軍過河將橋炸掉以表示絕不撤退的決心。完全承諾(totalcommitment):橋一旦被炸,撤退就沒有可能(或者說撤退成本為無窮大)。不完全承諾:如果一個(gè)承諾只是增加某個(gè)行動(dòng)的成本而不是使該行動(dòng)完全沒有可能。將承諾行動(dòng)納入模型的一個(gè)方法是明確地將承諾行動(dòng)作為初始階段的“行動(dòng)”包括在博弈中(從而得到一個(gè)新的博弈)。4.3子博弈精煉納什均衡4.3.4承諾行動(dòng)與子博弈精煉納4.3子博弈精煉納什均衡4.3.4承諾行動(dòng)與子博弈精煉納什均衡考慮我們前面討論過的房地產(chǎn)開發(fā)博弈的例子:如果在A決策之前,B與某個(gè)客戶簽訂一個(gè)合同,規(guī)定B在一個(gè)特定的時(shí)刻交付客戶若干面積的寫字樓辦公室,如果B不能履約,將賠償客戶3500萬。這個(gè)合同就是一個(gè)承諾行動(dòng)。有了這個(gè)承諾行動(dòng),B的{開發(fā),開發(fā)}就不再是一個(gè)不可置信的威脅,而是可置信的威脅,因?yàn)榇藭r(shí),不論A是否開發(fā),開發(fā)是B的最優(yōu)選擇(如果A開發(fā),B不開發(fā)時(shí)選擇損失3500萬,開發(fā)時(shí)損失3千萬)。給定A知道B一定會(huì)選擇開發(fā),A的最優(yōu)選擇就是不開發(fā),因此,子博弈精煉納什均衡時(shí)(開發(fā),{不開發(fā),開發(fā)})。注意:3500萬的賠償承諾不僅沒有使B所示什么,反而使B得利1千萬。4.3子博弈精煉納什均衡4.3.4承諾行動(dòng)與子博弈精煉納4.4子博弈精煉納什均衡應(yīng)用舉例斯坦克爾伯格寡頭競(jìng)爭(zhēng)模型工會(huì)與雇主之間的博弈輪流出價(jià)的討價(jià)還價(jià)模型4.4子博弈精煉納什均衡應(yīng)用舉例斯坦克爾伯格寡頭競(jìng)爭(zhēng)模4.4子博弈精煉納什均衡應(yīng)用舉例4.4.1斯坦克爾博格(Stackelberg)寡頭競(jìng)爭(zhēng)模型4.4子博弈精煉納什均衡應(yīng)用舉例4.4.1斯坦克爾博格(4.4子博弈精煉納什均衡應(yīng)用舉例4.4.2工會(huì)與雇主之間的博弈4.4子博弈精煉納什均衡應(yīng)用舉例4.4.2工會(huì)與雇主之間三階段討價(jià)還價(jià)博弈112不接受,出S接受不接受,出S2接受出S1三階段討價(jià)還價(jià)博弈112不接受,出S接受不接受,出S2接受出三階段討價(jià)還價(jià)博弈三回合討價(jià)還價(jià)博弈結(jié)果的討論三階段討價(jià)還價(jià)博弈三回合討價(jià)還價(jià)博弈結(jié)果的討論主講人:肖會(huì)敏河南財(cái)經(jīng)學(xué)院經(jīng)濟(jì)博弈論主講人:肖會(huì)敏河南財(cái)經(jīng)學(xué)院經(jīng)濟(jì)博弈論4.3子博弈精煉納什均衡第四章完全信息動(dòng)態(tài)博弈4.2擴(kuò)展型博弈的策略及均衡4.1擴(kuò)展型博弈表述4.4子博弈精煉納什均衡應(yīng)用舉例4.3子博弈精煉納什均衡第四章完全信息動(dòng)態(tài)博弈4.4.1擴(kuò)展型博弈表述在靜態(tài)博弈中,所有參與人同時(shí)行動(dòng)(或行動(dòng)雖有先后,但沒有人在自己行動(dòng)之前觀測(cè)到別人的行動(dòng))。在動(dòng)態(tài)博弈中,參與人的行動(dòng)有先后順序,且后行動(dòng)者在自己行動(dòng)之前能觀測(cè)到先行動(dòng)者的行動(dòng)。擴(kuò)展型表述的引入博弈專家習(xí)慣于用戰(zhàn)略式表述描述和分析靜態(tài)博弈,而用擴(kuò)展式表述(extensiveformrepresentation)來描述和分析動(dòng)態(tài)博弈。4.1擴(kuò)展型博弈表述在靜態(tài)博弈中,所有參與人同時(shí)行動(dòng)(4.1擴(kuò)展型博弈表述擴(kuò)展型表述所“擴(kuò)展”的主要是參與人的戰(zhàn)略空間。戰(zhàn)略式表述簡(jiǎn)單地給出參與人有些什么戰(zhàn)略可以選擇,而擴(kuò)展式表述要給出每個(gè)戰(zhàn)略地動(dòng)態(tài)描述:誰在什么時(shí)候行動(dòng),每次行動(dòng)時(shí)有些什么具體行動(dòng)可供選擇,以及知道些什么。簡(jiǎn)單地說,在擴(kuò)展式表述中,戰(zhàn)略對(duì)應(yīng)于參與人的相機(jī)行動(dòng)規(guī)則(contingentactionplan),即什么情況下選擇什么行動(dòng),而不是簡(jiǎn)單的、與環(huán)境無關(guān)的行動(dòng)選擇。擴(kuò)展型表述的引入4.1擴(kuò)展型博弈表述擴(kuò)展型表述所“擴(kuò)展”的主要是參與人4.1擴(kuò)展型博弈表述參與人集合:,此外,我們將用N代表虛擬參與人“自然”;參與人的行動(dòng)順序(theorderofmoves):誰在什么時(shí)候行動(dòng);參與人的行動(dòng)空間(actionset):在每次行動(dòng)時(shí),參與人有些什么選擇。參與人的信息集(informationset):每次行動(dòng)時(shí),參與人知道些什么;參與人的支付函數(shù):在行動(dòng)結(jié)束之后,每個(gè)參與人得到些什么(支付是所有行動(dòng)的函數(shù));外生事件(即自然的選擇)的概率分布擴(kuò)展型表述的要素4.1擴(kuò)展型博弈表述參與人集合:,4.1擴(kuò)展型博弈表述n個(gè)人有限戰(zhàn)略博弈的擴(kuò)展式表述可以用博弈樹來表示。為了說明這一點(diǎn),我們考慮房地產(chǎn)開發(fā)博弈的例子,我們假定該博弈的行動(dòng)順序如下:開發(fā)商A首先行動(dòng),選擇開發(fā)或不開發(fā);在A決策后,自然選擇市場(chǎng)需求的大?。婚_發(fā)商B在觀測(cè)到A的決策和市場(chǎng)需求后,決定開發(fā)或不開發(fā)。擴(kuò)展型表述的表示方式4.1擴(kuò)展型博弈表述n個(gè)人有限戰(zhàn)略博弈的擴(kuò)展式表述可4.1擴(kuò)展型博弈表述房地產(chǎn)開發(fā)博弈樹:注意:支付向量的順序與博弈樹上行動(dòng)順序是對(duì)應(yīng)的!4.1擴(kuò)展型博弈表述房地產(chǎn)開發(fā)博弈樹:注意:支付向量的順4.1擴(kuò)展型博弈表述博弈樹基本構(gòu)造:結(jié)(nodes):包括決策結(jié)(decisionnodes)和終點(diǎn)結(jié)(terminalnodes)兩類。決策結(jié)是參與人采取行動(dòng)的時(shí)點(diǎn),終點(diǎn)結(jié)時(shí)博弈行動(dòng)路徑的終點(diǎn)。在上例中,決策結(jié)包括空心圓和所有六個(gè)實(shí)心圓,終點(diǎn)結(jié)包括對(duì)應(yīng)八個(gè)支付向量的點(diǎn)。枝(branches):枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線(有時(shí)用箭頭表述),每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇。比如,在上圖中,開發(fā)商A有兩個(gè)選擇,分別用標(biāo)有“開發(fā)”和“不開發(fā)”的兩個(gè)枝表示。4.1擴(kuò)展型博弈表述博弈樹基本構(gòu)造:結(jié)(nodes):包4.1擴(kuò)展型博弈表述博弈樹基本構(gòu)造:3.信息集(informationset):博弈樹上的所有決策結(jié)分割成不同的信息集。每一個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié):每一個(gè)決策結(jié)都是同一參與人的決策結(jié);該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)。我們引入信息集的目的是描述下列情況:當(dāng)一個(gè)參與人要作出決策時(shí)他可能并不知道“之前”發(fā)生的所有事情。一個(gè)信息集可能包含多個(gè)決策結(jié),也可能只包含一個(gè)決策結(jié)(稱為單結(jié)信息集(singletons))??梢杂锰摼€將屬于同一信息集的兩個(gè)決策結(jié)連起來4.1擴(kuò)展型博弈表述博弈樹基本構(gòu)造:3.信息集(info4.1擴(kuò)展型博弈表述囚徒困境博弈的擴(kuò)展式表述:一般假定博弈滿足“完美回憶”(perfectrecall)的要求。完美回憶指沒有參與人會(huì)忘記自己以前知道的事情,所有參與人都只到自己以前的選擇。4.1擴(kuò)展型博弈表述囚徒困境博弈的擴(kuò)展式表述:4.2擴(kuò)展型博弈的策略與均衡純戰(zhàn)略:同樣的純戰(zhàn)略,既可以解釋為擴(kuò)展式的,也可以解釋為戰(zhàn)略式的。不同之處在于:在擴(kuò)展式表述博弈,參與人式相機(jī)行事,即“等待”博弈到達(dá)自己的信息集(包含一個(gè)或多個(gè)決策結(jié))后再?zèng)Q定如何行動(dòng);在戰(zhàn)略式表述博弈,參與人似乎是在博弈開始之前就制定出了一個(gè)完全的相機(jī)行動(dòng)計(jì)劃,即“如果…發(fā)生,我們將選擇…”。4.2擴(kuò)展型博弈的策略與均衡純戰(zhàn)略:同樣的純戰(zhàn)略,既4.2擴(kuò)展型博弈的策略與均衡如何從擴(kuò)展式表述構(gòu)造戰(zhàn)略式表述為了說明這個(gè)問題,我們考慮房地產(chǎn)開發(fā)博弈的例子4.2擴(kuò)展型博弈的策略與均衡如何從擴(kuò)展式表述構(gòu)造戰(zhàn)略式表4.2擴(kuò)展型博弈的策略與均衡如何從擴(kuò)展式表述構(gòu)造戰(zhàn)略式表述開發(fā)商B(-3,-3)(-3,-3)(1,0)(1,0)(0,1)(0,0)(0,1)(0,0)(開發(fā),開發(fā))(開發(fā),不開發(fā))(不開發(fā),開發(fā))(不開發(fā),不開發(fā))開發(fā)商A開發(fā)不開發(fā)戰(zhàn)略式表述4.2擴(kuò)展型博弈的策略與均衡如何從擴(kuò)展式表述構(gòu)造戰(zhàn)略式表4.2擴(kuò)展型博弈的策略與均衡逆向歸納法:逆向歸納法實(shí)際上是重復(fù)剔除劣戰(zhàn)略方法在擴(kuò)展式博弈中地應(yīng)用。我們從最后一個(gè)決策結(jié)開始往回倒推,每一步剔除在該決策結(jié)上參與人的劣選擇,因此,在均衡路徑,每一個(gè)參與人在每一個(gè)信息集上的選擇都是占優(yōu)選擇。上述逆向歸納法的過程不適用于無限博弈和不完美信息博弈。逆向歸納法也不適用于無限博弈并不意味著無限博弈沒有納什均衡存在。4.2擴(kuò)展型博弈的策略與均衡逆向歸納法:逆向歸納法實(shí)4.3子博弈精煉納什均衡4.3.1引言在納什均衡中,存在一個(gè)很嚴(yán)重的缺陷:納什均衡假定每一個(gè)參與人在選擇自己的最優(yōu)戰(zhàn)略時(shí)假定所有其他參與人的戰(zhàn)略選擇是給定的,就是說,參與人并不考慮自己的選擇對(duì)其他人選擇的影響。本節(jié)將要討論的澤爾騰(Selten)的“子博弈精煉納什均衡”是納什均衡概念的第一個(gè)最重要的改進(jìn),它的目的是把動(dòng)態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”分開。正如納什均衡是完全信息靜態(tài)博弈解的基本概念一樣,子博弈精煉納什均衡是完全信息動(dòng)態(tài)博弈解的基本概念。4.3子博弈精煉納什均衡4.3.1引言在納什均衡中,4.3子博弈精煉納什均衡4.3.1不可置信的存在為了說明上述論點(diǎn),我們考慮上一節(jié)討論過的房地產(chǎn)開發(fā)博弈的例子。4.3子博弈精煉納什均衡4.3.1不可置信的存在為了4.3子博弈精煉納什均衡分析結(jié)果:這個(gè)博弈有三個(gè)納什均衡,分別為:(不開發(fā),『開發(fā),開發(fā)』),(開發(fā),『不開發(fā),開發(fā)』)和(開發(fā),『不開發(fā),不開發(fā)』)用博弈論的語言來說,納什均衡(不開發(fā),『開發(fā),開發(fā)』)是不可置信的(notcredible),因?yàn)樗蕾囉贐的一個(gè)不可置信的威脅戰(zhàn)略;B的戰(zhàn)略是不可置信的,因?yàn)榻o定A選擇開發(fā),B不會(huì)實(shí)施這個(gè)威脅。(開發(fā),『不開發(fā),開發(fā)』)是這個(gè)博弈的唯一子博弈精煉納什均衡。4.3子博弈精煉納什均衡分析結(jié)果:4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡澤爾騰(Selten,1965)引入“子博弈精煉納什均衡”(subgameperfectNashequilibrium)概念的目的是將那些包含不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈結(jié)果的一個(gè)合理預(yù)測(cè)。簡(jiǎn)單地說,子博弈精煉納什均衡要求均衡戰(zhàn)略地行為規(guī)則在每一個(gè)信息集上都是最優(yōu)地。我們首先給出子博弈的概念,粗略的說,子博弈是愿博弈的一部分,它本身可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析。正式地,我們有下述定義:4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡定義:一個(gè)擴(kuò)展式博弈的子博弈G由一個(gè)決策結(jié)x和所有該決策結(jié)的后續(xù)結(jié)(包括終點(diǎn)結(jié))組成,它滿足下列條件:(1)x是一個(gè)單結(jié)信息集,即;(2)對(duì)于所有的,如果,那么解釋:條件(1)說的是一個(gè)子博弈必須從一個(gè)單結(jié)信息集開始。條件(2)說的是,子博弈的信息集和支付向量都直接繼承自原博弈。要求子博弈滿足上述兩個(gè)條件的目的是保證子博弈對(duì)應(yīng)于原博弈中可能出現(xiàn)的情況。4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡定義4.3子博弈精煉納什均衡例如:4.3子博弈精煉納什均衡例如:4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡定義:擴(kuò)展式博弈的戰(zhàn)略組合是一個(gè)子博弈精煉納什均衡,如果(1)它是原博弈的納什均衡;(2)它在每一個(gè)子博弈上給出納什均衡。另外:簡(jiǎn)單地說,一個(gè)戰(zhàn)略組合是子博弈精煉納什均衡,當(dāng)只當(dāng)它在每一個(gè)子博弈(包括原博弈)上都構(gòu)成一個(gè)納什均衡。如果整個(gè)博弈是唯一的子博弈,納什均衡與子博弈精煉納什均衡是相同的;如果有其他子博弈存在,有些納什均衡可能不構(gòu)成子博弈精煉納什均衡。4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡定義4.3子博弈精煉納什均衡4.3子博弈精煉納什均衡4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡這里還需強(qiáng)調(diào)一下上述定義中的“在每一個(gè)子博弈上給出納什均衡”這句話。如果一個(gè)博弈有幾個(gè)子博弈,一個(gè)特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”(equilibriumpath),博弈樹上的其他路徑稱為非均衡路徑(out-of–equilibriumpath)。納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的?!霸诿恳粋€(gè)子博弈上給出納什均衡”意味著,構(gòu)成子博弈精煉納什均衡的戰(zhàn)略不僅在均衡路徑的決策結(jié)上是最優(yōu)的,而且在非均衡路徑的決策結(jié)上也是最優(yōu)的。子博弈精煉納什均衡就是要剔除掉那些只在特定情況下是合理的而在其他情況下并不合理的行動(dòng)規(guī)則。4.3子博弈精煉納什均衡4.3.2子博弈精煉納什均衡這4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈精煉納什均衡對(duì)于有限完美信息博弈,逆向歸納法是求解子博弈精煉納什均衡的最簡(jiǎn)便方法。因?yàn)橛邢尥昝佬畔⒉┺牡拿恳粋€(gè)決策結(jié)都是一個(gè)單獨(dú)的信息集,每一個(gè)決策結(jié)都開始一個(gè)子博弈。給定博弈到達(dá)最后一個(gè)決策結(jié),該決策結(jié)上行動(dòng)的參與人有一個(gè)最優(yōu)選擇,這個(gè)最優(yōu)選擇就是該決策結(jié)開始的子博弈的納什均衡(如果該決策結(jié)上的最優(yōu)行動(dòng)多于一個(gè),那么我們?cè)试S參與人選擇其中的任何一個(gè);如果最后一個(gè)決策者有多個(gè)決策結(jié),那么每一個(gè)決策結(jié)開始的子博弈都有一個(gè)納什均衡)。然后倒回到倒數(shù)第二個(gè)決策結(jié)(最后決策結(jié)的直接前列結(jié)),找出倒數(shù)第二個(gè)決策者的最優(yōu)選擇(假定最后一個(gè)決策者的選擇是最優(yōu)的),這個(gè)最優(yōu)選擇與我們?cè)诘谝徊秸页龅淖詈鬀Q策者的最優(yōu)選擇構(gòu)成從倒數(shù)第二個(gè)決策結(jié)開始的子博弈的一個(gè)納什均衡。4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈精煉納什均衡3、如此不斷直到初始結(jié),每一步都得到對(duì)應(yīng)子博弈的一個(gè)納什均衡,在這個(gè)過程的最后一步得到的整個(gè)博弈的納什均衡也就是這個(gè)博弈的子博弈精煉納什均衡例如:房地產(chǎn)開發(fā)博弈就是這樣一個(gè)兩階段完美信息博弈。用逆向歸納法求解這個(gè)博弈的精煉均衡的步驟如下:4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈精煉納什均衡在第二階段,B的最優(yōu)行動(dòng)規(guī)則是:{不開發(fā),開發(fā)},即,如果A在第一階段選擇了開發(fā),B在第二階段選擇不開發(fā);如果A在第一階段選擇了不開發(fā),B在第二階段選擇開發(fā)。因?yàn)锳在第一階段預(yù)測(cè)到B在第二階段會(huì)按這個(gè)規(guī)則行動(dòng),A在第一階段的最優(yōu)選擇是開發(fā)。用逆向歸納法得到的精煉均衡是(開發(fā),{不開發(fā),開發(fā)})。4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈4.3子博弈精煉納什均衡4.3.3用逆向歸納發(fā)求解子博弈精煉納什均衡上述分析表明,用逆向回歸法求解子博弈精煉納什均衡的過程,實(shí)質(zhì)是重復(fù)剔除劣戰(zhàn)略過程在擴(kuò)展式博弈上的擴(kuò)展:從最后一個(gè)決策結(jié)開始依次剔除掉每個(gè)子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精煉納什均衡。根據(jù)定
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年八年級(jí)語文上冊(cè) 第五單元 第17課《中國石拱橋》教案 新人教版
- 2024-2025學(xué)年高中物理 第一章 分子動(dòng)理論 第1節(jié) 物體是由大量分子組成的教案1 粵教版選修3-3
- 04年文化演藝活動(dòng)組織合同
- 2024年人工智能產(chǎn)品研發(fā)與許可合同
- 2024年工程分包合同詳細(xì)條款及注意事項(xiàng)
- 2024年城市公共交通運(yùn)營合同具體條款及運(yùn)營要求
- 2024年工程履約協(xié)議
- 2024年工程質(zhì)量保證合同模板
- 2024年熱銷用友產(chǎn)品購買協(xié)議
- 2024年企業(yè)品牌管理與市場(chǎng)推廣合同
- DD 2022-1.2 巖心數(shù)字化技術(shù)規(guī)程 第2部分:表面圖像數(shù)字化
- 全國優(yōu)質(zhì)課一等獎(jiǎng)初中物理九年級(jí)《科學(xué)探究:歐姆定律》課件
- 中醫(yī)外科乳房疾病診療規(guī)范診療指南2023版
- 2023-2024年抖音直播行業(yè)現(xiàn)狀及發(fā)展趨勢(shì)研究報(bào)告
- 新課標(biāo)-人教版數(shù)學(xué)六年級(jí)上冊(cè)第五單元《圓》單元教材解讀
- 2022湖北漢江王甫洲水力發(fā)電有限責(zé)任公司招聘試題及答案解析
- 2019新人教必修1unit2Travelling-Around整單元完整教案
- 大學(xué)生辯論賽評(píng)分標(biāo)準(zhǔn)表
- 診所污水污物糞便處理方案及周邊環(huán)境
- 江蘇開放大學(xué)2023年秋《馬克思主義基本原理 060111》形成性考核作業(yè)2-實(shí)踐性環(huán)節(jié)(占過程性考核成績(jī)的30%)參考答案
- 《我是班級(jí)的主人翁》的主題班會(huì)
評(píng)論
0/150
提交評(píng)論