版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
博弈論與信息經(jīng)濟學
1博弈論基礎2009年03月02日主要內(nèi)容何謂博弈?非合作博弈論的基本概念博弈的戰(zhàn)略式與擴展式表述
信息集與信息結(jié)構何謂博弈?從孩提時代,我們就玩游戲,如捉迷藏、大富豪、象棋和網(wǎng)球等。但是,經(jīng)濟學家在談到博弈時,指的是社會和經(jīng)濟相互作用。這些博弈與兒童們玩的游戲的共同之處在于它們都是一種局勢,決策者必須考慮其他人的行動。決策者間的相互依存是博弈的實質(zhì)。何謂博弈?在博弈論中,博弈應理解為明智的、理性的個人或群體間沖突與合作的情形。對于這些明智的、理性的個人或群體來說,他們的目標通常遠比單純地擊敗對手復雜得多。在經(jīng)濟生活中,通常,參與者可以以某些方式相互對抗;在另一些方面,他們也可通力合作達到某一同樣的結(jié)果。比方說,當幾家公司都對制定高價表現(xiàn)出一致的興趣時,他們就能在各自占有的市場份額中獲得富有競爭力的利潤。何謂博弈?博弈作為概念的名詞,是對若干個決策主體在戰(zhàn)略相互依存情形中相互作用的局勢所進行的正式表述。作為表示動作的動詞,是指若干個決策主體在戰(zhàn)略相互依存情形下進行相互作用。博弈意味著各決策主體的福利不僅取決于其自身的行動,也取決于其他決策主體的行動,而且,各決策主體采取的最佳行動依賴于其預期的其他參與者的行動,——即戰(zhàn)略相互作用。何謂博弈?非合作博弈論研究的是,在各主體的最佳選擇依賴于對其對手的選擇的預測的情形中主體的行為。盡管“博弈”一詞的普通用法是象棋和撲克等室內(nèi)游戲,在我們所要研究的典型的博弈類別中,參與人的目標更為復雜,不只是擊敗其他人,他們既有利益競爭,也有共同利益。合作與非合作博弈參與人之間能否合作(串謀、聯(lián)盟)取決于承諾的強度。如果參與人可以達成約束性的承諾或協(xié)議,就是合作博弈;如果不能,就是非合作博弈。博弈的基本要素:博弈結(jié)構博弈描述了為界定博弈我們必須知道的戰(zhàn)略相互作用局勢的6種基本要素,稱為博弈結(jié)構。(i)局中人/參與人:有誰參與博弈?博弈規(guī)則:(ii)行動次序-誰什么時間行動?(iii)行動集合-他們可以采取什么行動?(iv)信息-他們在行動時知道些什么?(v)行動結(jié)果:對于局中人的各種可能的行動組合,產(chǎn)生的實際結(jié)果是什么?(vi)支付或收益:局中人對各種可能的結(jié)果的偏好(即效用函數(shù))是什么?硬幣配對(猜謎)博弈局中人:兩個參與人-兒童A和B;博弈規(guī)則:每個參與人同時亮出一枚硬幣,正面或者背面向上,雙方事先不知道對方的選擇是什么;行動結(jié)果:如果硬幣配對(都是正面或背面向上),局中人A付給局中人B一塊錢;否則,局中人B付給局中人A一塊錢;各局中人對各種可能結(jié)果的偏好是什么?支付/收益
效用
偏好一般地,我們用效用函數(shù)表示局中人的偏好,效用函數(shù)為各種可能的博弈結(jié)果賦予效用水平。通常,我們把參與人的效用函數(shù)說成支付函數(shù),而把效用水平說成支付。
我們假定效用函數(shù)取期望效用的形式,在我們考慮博弈結(jié)果隨機的情形時,可以用參與人的期望效用評價隨機結(jié)果。金錢
支付對于硬幣配對博弈,我們假設各參與人的支付等于其獲得或失去的錢數(shù)。使一個參與人的支付最大化的行動取決于這個參與人預期其對手會采取的行動。零和博弈上面這個例子涉及的是純粹(嚴格)沖突的情形:一個參與人之所得,即另一參與人之所失,這樣的博弈稱為零和博弈。但戰(zhàn)略相互作用的博弈論不限于純粹沖突或者甚至部分沖突的情形。零和與非零和博弈經(jīng)濟學中的博弈,通常,如果一個參與人有所得,另一個參與人不一定有所失。由于經(jīng)濟學主要關心交易產(chǎn)生的收益,因此,毫不奇怪,雙贏的結(jié)果是可能的,即使各參與人都只追求其自身支付的最大化。但是,在某些博弈中,參與人的支付之和總是零。零和與非零和博弈零和博弈是不論參與人選擇何種戰(zhàn)略,所有參與人的支付之和為零的博弈。所有參與人的支付之和不為零的博弈稱為非零和博弈或變和博弈。如果博弈是零和博弈,不論結(jié)果如何,參與人的效用加起來為零。通常,即使支付加起來不為零,只要是某個常量,建模者也稱之為零和博弈。約會博弈參與人:兩個參與人張三和李四;博弈規(guī)則:兩個參與人是分開的,無法聯(lián)系;他們相約在濟南會面,一起吃午飯,但忘了約定地點;每個人都要單獨決定到哪里去(都只能有一種選擇)。行動結(jié)果:如果他們碰到一起,吃午飯時各自都有伴;否則,就只有獨自用餐。支付:他們都認為有另一方作伴的貨幣價值為100元(如果碰到一起,他們的支付都是100元;如果沒有碰到一起,支付都是0)。約會博弈張三李四地點A地點B地點A地點C0,0100,1000,00,0戰(zhàn)略協(xié)調(diào)在這個例子中,兩個參與人的利益是完全一致的,他們面臨的只是一個協(xié)調(diào)問題。然而,各參與人的支付依賴于另一個參與人去哪里。而且,更為重要的是,各參與人的最佳行動取決于他認為另一個參與人會去哪里。所以,即使是協(xié)調(diào)這樣的事情,也會具有戰(zhàn)略特征。博弈論11要素參與人、行動、行動順序、信息、行動結(jié)果、支付、戰(zhàn)略、信念、均衡/解概念、均衡和均衡結(jié)果,稱為博弈論11要素。行動、行動順序、信息3個要素稱為博弈規(guī)則或博弈順序;博弈規(guī)則要把行動和信息按行動順序表示出來。參與人、行動、行動順序、信息、行動結(jié)果、支付6個要素稱為博弈結(jié)構。博弈論11要素信念和戰(zhàn)略是參與人的主觀判斷與選擇。均衡/解概念是博弈論研究的結(jié)果。博弈分析的目的是根據(jù)博弈結(jié)構(以及戰(zhàn)略與信念)和均衡/解概念,預測均衡和均衡結(jié)果。均衡和均衡結(jié)果是博弈分析的結(jié)果。博弈論局中人的相互關系博弈論研究者博弈論學習者博弈參與人博弈結(jié)構+戰(zhàn)略+信念均衡+均衡結(jié)果均衡/解概念博弈分析博弈分析者-建模者博弈論局外人研究學習了解現(xiàn)實生活囚徒博弈的要素分析參與人:囚徒A和囚徒B,分別稱為行參與人和列參與人;行動:兩人都有兩種選擇——坦白或抵賴;行動次序:兩人同時選擇——靜態(tài)博弈;信息:參與人相互不知道各自的選擇;行動結(jié)果:釋放、判8年、判10年、判1年;支付:見支付雙矩陣;囚徒博弈的要素分析信念:雙方都相信對方會選擇坦白;戰(zhàn)略:靜態(tài)博弈,雙方簡單地選擇不同的行動;均衡概念:占優(yōu)均衡、重復剔除占優(yōu)均衡、納什均衡;均衡:參與人都選擇坦白;均衡結(jié)果:各獲得-8的支付。1.參與人(player,局中人)參與人指的是博弈中的決策主體,其目的是通過選擇行動(或戰(zhàn)略)以最大化自己的效用水平,因此符合理性經(jīng)濟人假設。參與人可能是自然人,也可能是團體,如企業(yè)、國家,甚至若干個國家組成的集團(如OPEC、歐盟、北約等)。每個參與人必須有可供選擇的行動和一個很好定義的偏好函數(shù)。一個主體是否是參與人依賴于分析的目的。被動主體如顧客不是參與人,而是環(huán)境參數(shù),他們對價格變化作出可預測的反應,并不想改變?nèi)魏稳说男袨椤?/p>
“自然”(Nature):虛擬參與人(pseudo-player)虛擬參與人以純機械的隨機方式采取行動。自然是一種虛擬參與人,在博弈的特定時間上以特定概率采取隨機行動,是外生的隨機變量的概率分布的決定機制,參與人決策的后果依賴于自然的選擇。在不完全信息博弈中,自然選擇參與人的類型。與一般參與人不同的是,“自然”作為虛擬參與人沒有自己的偏好、支付和目標函數(shù)(即所有結(jié)果對它都是無差異的)。我們一般用i=1,...,n代表參與人,N代表“自然”。自然行動的建模如果參與人知道自然的行動,我們就說自然在參與人行動之前行動。假定有兩個參與人A和B,A先行動,B后行動。如果兩人都知道自然的行動,我們說自然在兩人之前行動;如果只有B知道,我們說自然在A之后B之前行動;如果兩人在決策時都不知道自然的行動,我們說自然在博弈結(jié)束時行動。支付:(新店,老店)干洗店市場進入博弈的擴展式:新店和老店都不知道自然的選擇-市場需求的大小()()()()()()()()自然新店新店老店老店老店老店N干洗店市場進入博弈的擴展式:新店知道但老店不知道自然的選擇-市場需求的大小正常,.7衰退,.3進入不進入進入不進入高價低價高價低價高價低價高價低價(100,100)(-100,-50)(0,300)(0,50)(40,40)(-160,-110)(0,240)(0,-10)2.行動(actionormove)行動是參與人在博弈的某個時點可以作出的選擇,稱為決策變量。一般地,我們用ai表示第i個參與人的一個特定行動,Ai={ai}={a1i,a2i,a3i,......}表示可供參與人i選擇的所有行動的集合(actionset),稱為其行動空間(actionspace)。參與人的行動可能是離散的,也可能是連續(xù)的;可能是有限的,也可能是無限的。行動組合在n人博弈中,n個參與人各選擇一種行動組成的序列a=(a1,...,ai,...,an)稱為行動組合(actionprofile),其中的第i個元素ai是第i個參與人選擇的行動。第i個參與人的最佳行動取決于所有其他參與人的行動。3.行動順序(orderofplay)行動順序或稱博弈次序,對于博弈的結(jié)果是非常重要的。同樣的參與人,同樣的行動集合,如果行動的順序不同,每個參與人的最優(yōu)選擇就不同,博弈的結(jié)果就不同。事實上,不同的行動順序意味著不同的博弈。在動態(tài)博弈中,后行動者可以通過觀察先行動者的行動來獲得信息。在博弈論中,一般假定參與人的行動空間和行動順序是所有參與人的共同知識。4.信息(information)信息是參與人對有關變量的值的知識,特別是有關自然的選擇和其他參與人的特征、偏好、行動選擇、戰(zhàn)略空間及支付函數(shù)等的知識。信息集(informationset)是博弈論中描述參與人信息特征的一個基本概念,我們可以將其理解為參與人在特定時刻對有關變量的值的知識。一個參與人在特定時刻無法準確知道的變量的全體屬于一個信息集。信息集信息集中的元素是參與人認為可能的不同的值,信息集中元素越多,信息越模糊不清;這意味著參與人無法排除這些值;如果只有一個元素,說明他準確地知道某變量的值。
參與人的信息集不僅包括各變量不同的值,而且包括關于過去采取了何種行動的知識,因此,在博弈過程中,參與人的信息集是變化的。5.行動結(jié)果對于參與人的各種可能的行動組合,博弈的實際結(jié)果是什么,也可稱為博弈結(jié)果。6.支付(payoff)參與人i的支付
i(s1,...,sn)表示:(1)自然和所有參與人選擇其戰(zhàn)略從而博弈完成后參與人i獲得的確定效用;或者(2)作為他自己和其他參與人選擇的戰(zhàn)略的函數(shù)而獲得的期望效用。支付是博弈參與人真正關心的東西。我們假定每一個參與人的偏好都可以由一個v-N-M期望效用函數(shù)來代表,他的目標是選擇自己的戰(zhàn)略以最大化其期望(平均)效用函數(shù)。v-N-M是vonNeumannandMorgenstern的縮寫。
支付在博弈論中,“支付”不是支出或付出,而是真實反映了參與人的動機(偏好)的馮.諾伊曼-摩根斯坦效用。如果參與人面對不確定性,對于其不確定的未來支付,參與人將最大化其效用的期望值,我們說這樣的參與人具有馮.諾伊曼-摩根斯坦效用函數(shù),用這個名稱是為了強調(diào)馮.諾伊曼和摩根斯坦對這種行為的嚴格合理性的闡述。所以,馮.諾伊曼-摩根斯坦效用就是期望效用。期望效用或期望支付是支付或效用的概率分布的加權值之和。支付及支付組合令
i為第i個參與人的支付(效用水平),博弈的一個基本特征是一個參與人的支付不僅取決于自己的戰(zhàn)略選擇,而且取決于所有其他參與人的戰(zhàn)略選擇,就是說,
i是所有參與人的戰(zhàn)略選擇的函數(shù):
i=
i(s1,...,si,...,sn)
=(
1,...,
i,...,
n)稱為n個參與人的支付組合(payoffprofile)。如果要模擬現(xiàn)實中的特定情形,琢磨(反復思索;捉摸=猜測,預料)出支付常常是建模中最難的部分。7.戰(zhàn)略(strategy)戰(zhàn)略是參與人制定的依據(jù)每一時刻所擁有的信息即在給定信息集的情況下選擇行動的計劃或規(guī)則,它規(guī)定參與人在什么時候什么情況下選擇什么行動;戰(zhàn)略必須是完備的,即必須針對每一種可能的情況規(guī)定選擇行動的準則,如“人不犯我,我不犯人;人若犯我,我必犯人”。Theenemyadvances,weretreat;Theenemycamps,weharass;Theenemytired,weattack;Theenemyretreats,wepursue.戰(zhàn)略空間和戰(zhàn)略組合一般地,我們用si表示第i個參與人在給定其信息集的情況下的一個特定戰(zhàn)略,Si={si}=={s1i,s2i,s3i,......}代表第i個參與人的所有可選擇的戰(zhàn)略的集合或空間(strategysetorspace)。如果博弈中n個參與人每人選擇一個戰(zhàn)略,組成的n維戰(zhàn)略向量s=(s1,...,si,...,sn)稱為一個戰(zhàn)略組合或局勢(strategyprofile),其中si是第i個參與人選擇的戰(zhàn)略。所有其他參與人的戰(zhàn)略組合在討論均衡概念時,我們需要“所有其他參與人的戰(zhàn)略”的簡便記法,為了把一個特定的參與人的戰(zhàn)略與其他參與人的戰(zhàn)略相區(qū)別,我們將用s-i=(s1,...,si-1,si+1,...,sn)表示除i之外的所有參與人的戰(zhàn)略組成的向量。使用這個記法,例如,s?Smith,是除了參與人Smith外各參與人的戰(zhàn)略組合。信息與戰(zhàn)略因為信息集包含了一個參與人有關其他參與人之前行動的知識,戰(zhàn)略告訴該參與人如何對其他參與人的行動作出反應,因而戰(zhàn)略是參與人的相機行動方案(contingentactionplan)。一個參與人希望選擇的行動常常取決于自然和其他參與人過去的行動,只有在非常少的情況下,我們可以無條件地預測參與人的行動,但是,我們常??梢灶A測參與人如何對外界作出反應。信息與戰(zhàn)略作為參與人選擇行動的規(guī)則,戰(zhàn)略依賴于參與人獲得的信息。在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。這是因為,在靜態(tài)博弈中,所有參與人同時行動,沒有任何人能獲得他人行動的信息,從而,戰(zhàn)略選擇就變成簡單的行動選擇。
戰(zhàn)略的完備性作為一種行動規(guī)則,戰(zhàn)略必須是完備的,參與人的戰(zhàn)略是一套完整的指令,規(guī)定每一種可以想象的情形下選擇什么行動,即使參與人并不預期會達到這種情形。嚴格地說,即使參與人的戰(zhàn)略規(guī)定他在1989年自殺,也應當說明,如果他1990年仍然活著的話,應當采取何種行動。在討論“子博弈精煉”均衡時,這種仔細是非常重要的。戰(zhàn)略的完備性事實上,一種特定的情況是否真的會發(fā)生,往往依賴于參與人的戰(zhàn)略。這一點對于動態(tài)博弈的均衡是非常重要的,戰(zhàn)略選擇往往就是為了避免某種情形的發(fā)生。如,選擇戰(zhàn)爭是為了避免戰(zhàn)爭。即使我們根本就不想打仗,或預期不會發(fā)生戰(zhàn)爭,戰(zhàn)略也要指明一旦發(fā)生戰(zhàn)爭應當如何行動。戰(zhàn)略與行動戰(zhàn)略是選擇行動的規(guī)則,而不是行動本身,戰(zhàn)略要說明什么時候采取什么行動。戰(zhàn)略只是思維的,是不可觀察的;行動是物質(zhì)的,是可觀察的。田忌賽馬比賽規(guī)則:馬按奔跑的速度分為上中下三等,等次不同裝飾不同,各家的馬依等次比賽,三賽二勝。比賽前田忌按照孫臏的主意,第一場,用上等馬鞍將下等馬裝飾起來,冒充上等馬,與齊威王的上等馬比賽;第二場,用上等馬與齊威王的中等馬比賽;第三場,田忌的中等馬和齊威王的下等馬比賽。結(jié)果二比一,田忌贏了齊威王。在雙方條件相當時,對策得當可以戰(zhàn)勝對方;在雙方條件相差很遠時,對策得當也可將損失減低到最低程度。8.信念信念即對某種事件的主觀概率分布。所謂“主觀概率”,就是參與人把頭腦中通常是不清晰的認識利用起來,得到所需要的概率分布。當博弈涉及外生的不確定性事件時,我們假定“自然”以某種概率選擇某個特定事件。海薩尼公理:一般假定,所有參與人對自然的選擇具有相同的先驗概率。根據(jù)觀察到的事件和貝葉斯法則,先驗信念/概率可以修正為后驗信念/概率。先驗信念與后驗信念在決策過程中,確定各種隨機事件的概率是重要的一步。所謂先驗概率,是相對于進一步利用更多的信息所得的概率而言,先驗概率建立在經(jīng)驗基礎之上,絕不是完全離開經(jīng)驗的唯心的東西。如果在有了先驗概率之后,又獲得了新的有用信息,把新的信息利用起來,對原來的概率進行修正,只要新的信息是有價值的,無疑,修正后的概率將會更加符合實際情況。修正后的概率稱為后驗概率,實質(zhì)上,它是以新的信息為條件的條件概率。——黔驢技窮、打草驚蛇、聲東擊西。9.均衡(equilibrium)博弈的均衡是所有參與人選擇的最優(yōu)戰(zhàn)略的組合,一般記為:s*=(s1*,...,si*,...,sn*)其中,si*是第i個參與人在均衡情況下的最優(yōu)戰(zhàn)略,它是i的所有可能的戰(zhàn)略中使
i或期望(E)
i最大化的戰(zhàn)略,稱為均衡戰(zhàn)略。一般來說,由于
i是所有參與人的戰(zhàn)略組合的函數(shù),i的最優(yōu)戰(zhàn)略通常依賴于其他參與人的戰(zhàn)略選擇。
均衡戰(zhàn)略與預測為了預測博弈的結(jié)果,建模者要考慮可能的戰(zhàn)略組合,因為正是不同參與人的戰(zhàn)略相互作用決定什么會發(fā)生。預測會發(fā)生什么,就是選擇一個或多個戰(zhàn)略組合,作為為了最大化其支付而行動的參與人的最為理性的行為。均衡是各參與人為了最大化其個人支付而選擇的戰(zhàn)略的組合,不同于各參與人任意選擇一項戰(zhàn)略可以得到的許多可能的戰(zhàn)略組合。10.均衡結(jié)果
(equilibrium
outcome)博弈的均衡結(jié)果是博弈分析的結(jié)論,是博弈分析者感興趣的所有內(nèi)容。給定均衡,建模者就可以看出所有參與人的均衡戰(zhàn)略組合會產(chǎn)生什么行動組合、支付組合等。均衡和均衡結(jié)果(equilibriumoutcome)是兩個非常容易混淆的概念,當人們說均衡時他們常常是指均衡結(jié)果。盡管在許多情況下,二者的區(qū)別并不很重要,但理解二者的區(qū)別對理解博弈論的一些理論是重要的。
均衡與均衡結(jié)果博弈的均衡結(jié)果是博弈結(jié)束后,建模者從行動、支付和其他任何變量的值中選擇出來的一些有趣的元素。任何特定模型的均衡結(jié)果的界定取決于建模者認為什么變量是有意思的。均衡是均衡戰(zhàn)略的組合,通常,不同戰(zhàn)略組合可導致相同的均衡結(jié)果。一個博弈可能有多個均衡存在。缺乏唯一性是博弈論的一個主要問題。此均衡非彼均衡均衡在博弈論中的用法與經(jīng)濟學的其他領域不同。比如說,在一般均衡理論里,均衡指的是由個人最優(yōu)化行為導致的一組價格與產(chǎn)量,而在博弈論里,這樣一組價格和產(chǎn)量只是均衡結(jié)果而不是均衡本身。就此而言,均衡是指所有主體的最佳買賣規(guī)則(戰(zhàn)略)的組合,均衡價格和產(chǎn)量是這種戰(zhàn)略組合產(chǎn)生的結(jié)果。11.均衡概念或解概念為了找到均衡,建模者必須界定均衡概念,規(guī)定“最優(yōu)戰(zhàn)略”的含義。均衡概念或解概念F:{S1,...,Sn;
1,...,
n}
S*={s1*,s2*,...},是根據(jù)可能的戰(zhàn)略組合和支付函數(shù)定義均衡的規(guī)則。
表示映射規(guī)則。均衡/解概念是博弈分析者判斷博弈的均衡和均衡結(jié)果的規(guī)/準則,即如何對博弈進行求解的邏輯準則。在博弈論里,有各種各樣的均衡概念或解概念,下面定義的占優(yōu)原則是所有均衡概念的共同特征。最佳反應與解概念參與人i對戰(zhàn)略組合s?i的最佳反應或最佳應對或最優(yōu)戰(zhàn)略是為其產(chǎn)生最大支付的戰(zhàn)略s*i,即
i(s*i
,s?i)
i(s’i,s?i),
s’i
s*i,并且至少對一個s’i嚴格不等號成立,稱為占優(yōu)原則。[如果
s-i,上式成立,s*i稱為占優(yōu)戰(zhàn)略(dominantstrategy)。]如果沒有其他戰(zhàn)略同等地好,即上式取嚴格不等號,最優(yōu)反應就是強/嚴格最優(yōu),否則,就是弱最優(yōu)。一個戰(zhàn)略是劣的(dominatedstrategy),如果至少存在另一個優(yōu)于它的戰(zhàn)略。]均衡意味著,對所有的i=1,2,...,n,上式同時成立。約會博弈張三李四地點A地點B地點A地點C0,0100,1000,00,0行參與人R列參與人C占優(yōu)戰(zhàn)略圍魏救趙公元前354年,魏國大將龐涓率兵攻打趙國都城邯鄲,次年,趙國向齊國求援,齊王派大將田忌和軍師孫臏前去救趙。田忌想率兵直奔趙國的都城,與魏軍決一死戰(zhàn)。但是,孫臏建議攻打魏國都城大梁。田忌采納了孫臏的意見,率兵直抵魏國的都城。消息傳出,龐涓退兵,星夜趕回魏國。結(jié)果在桂陵一帶遭到齊軍伏擊,大敗而歸。博弈論基本準則
和基本見解一個參與人要假設對手將理性地即以對其最有利的方式行動,據(jù)此制定自己的戰(zhàn)略。我們說參與人是理性的,就是說他絕不會選擇劣戰(zhàn)略。博弈論的一個重要告誡是非合作均衡對參與人來說可能是無效率的,即其總收益可能不是最大的,甚至可能是最小的。解概念與唯一性只有少數(shù)均衡概念得到人們的廣泛認可,可以用來找到均衡。第一個重要的均衡概念是以占優(yōu)思想為基礎的——占優(yōu)戰(zhàn)略與占優(yōu)戰(zhàn)略均衡。人們認可的解概念并不能保證唯一性,而缺乏唯一性是博弈論的一個主要問題。有時候,博弈根本沒有均衡。沒有均衡意味著,博弈分析者沒有很好的理由認為一個戰(zhàn)略組合比另一個戰(zhàn)略組合更有可能出現(xiàn),或者某個參與人對于某種行動想選擇一個無限的值。博弈的戰(zhàn)略式與擴展式表述如何用戰(zhàn)略式和擴展式表示同時行動博弈和序貫行動博弈?序貫行動與信息-靜態(tài)角度如果說戰(zhàn)略思維的一半是預測其他參與人會做什么,另一半就是弄清他知道什么。同時行動:雖然一個參與人先行動,但另一個參與人不知道他采取了什么行動,所以,參與人沒有機會通過相互觀察了解各自的私人信息。序貫行動與信息-動態(tài)角度如果參與人按順序行動,信息就變得非常重要。事實上,同時行動博弈與序貫行動博弈的重要區(qū)別是,在序貫博弈中,第二個參與人在作出自己的決策前,可以獲得關于第一參與人如何行動的信息。戰(zhàn)略式與結(jié)果矩陣序貫行動博弈在表述方面需要比單次行動博弈更加仔細。在同時行動博弈中,戰(zhàn)略與行動相同,戰(zhàn)略就是簡單地選擇行動,而結(jié)果也比較簡單,雙矩陣表完成了兩項任務:把戰(zhàn)略組合與支付,行動組合與行動結(jié)果聯(lián)系起來。這兩種映射稱為戰(zhàn)略式矩陣和行動結(jié)果矩陣,在更為復雜的博弈中,它們是相互不同的。博弈的戰(zhàn)略式表述在戰(zhàn)略式表述中,所有參與人同時選擇各自的戰(zhàn)略,所有參與人選擇的戰(zhàn)略一起決定每個參與人的支付。戰(zhàn)略式表述首先給出博弈結(jié)構:1.博弈的參與人集合:
i∈Г,Г={1,2,...,n};2.每個參與人的戰(zhàn)略空間:Si,i=1,2,...,n;3.每個參與人的支付函數(shù):
i(s1,...,si,...,sn),i=1,2,...,n。我們將用G={S1,...,Sn;
1,...,
n}代表戰(zhàn)略式表述博弈結(jié)構。其次,戰(zhàn)略式表述給出戰(zhàn)略式矩陣和行動結(jié)果矩陣。雙寡頭產(chǎn)量博弈的戰(zhàn)略式表述在雙寡頭產(chǎn)量博弈里,企業(yè)是參與人,產(chǎn)量是戰(zhàn)略空間,利潤是支付;這個博弈的戰(zhàn)略式表述為:G={q1≥0,q2≥0;π1(q1,q2),π2(q1,q2)}這里qi和πi分別是第i個企業(yè)的產(chǎn)量和利潤。有限博弈
一個博弈被稱為有限博弈(finitegame),如果第一,參與人的個數(shù)是有限的,第二,每個參與人可選擇的戰(zhàn)略是有限的。兩人有限博弈的戰(zhàn)略式表述可以用雙矩陣表來直觀地給出。
協(xié)調(diào)博弈張三李四大小大小-1,-12,2-1,-1
1,1戰(zhàn)略式矩陣說明各種可能的戰(zhàn)略組合產(chǎn)生什么支付;結(jié)果矩陣說明各種可能的行動組合會產(chǎn)生什么結(jié)果。n人博弈的戰(zhàn)略式表述下面的定義用
n表示參與人的數(shù)量,用
k表示結(jié)果向量中變量的個數(shù),用
p表示戰(zhàn)略組合的數(shù)量,用q表示行動組合的數(shù)量。戰(zhàn)略式矩陣(或標準式)包括:1所有可能的戰(zhàn)略組合s1,s2,...,sp.2支付函數(shù),把
si
映射到
n維支付向量
i=(
i1,i2,…,in),i=1,2,...,p.行動結(jié)果矩陣包括:1所有可能的行動組合
a1,a2,...,aq.2行動結(jié)果函數(shù),把
ai
映射到k維行動結(jié)果向量
zi,i=1,2,...,q.跟隨領導者博弈在前面的協(xié)調(diào)博弈的基礎上,在跟隨領導者博弈中,張三先行動,承諾選擇大或小,無論李四選擇大或小。這個博弈說明,增加一點復雜性,戰(zhàn)略式表述就會模糊不清,用處不大。這個新博弈的行動結(jié)果矩陣與協(xié)調(diào)博弈相同,但其戰(zhàn)略式矩陣是不同的,因為李四的戰(zhàn)略不再是單個行動,他的戰(zhàn)略集合有四個元素。跟隨領導者博弈-行動結(jié)果矩陣張三李四大小大小-1,-12,2-1,-1
1,1{(如果張三選擇大,選擇大;如果張三選擇小,選擇大),(如果張三選擇大,選擇大;如果張三選擇小,選擇小),(如果張三選擇大,選擇?。蝗绻麖埲x擇小,選擇大),(如果張三選擇大,選擇?。蝗绻麖埲x擇小,選擇小)}簡記為:{(大|大,大|小),(大|大,小|?。ㄐ大,大|小),(小|大,小|?。﹠李四的戰(zhàn)略集合:跟隨領導者博弈-戰(zhàn)略式矩陣張三大小李四大|大,大|小大|大,小|小小|大,大|小小|大,小|小2,22,2-1,-1-1,-1-1,-11,1-1,-1
1,1如果都有三種行動選擇{大,小,無},李四的戰(zhàn)略有幾個?博弈順序標準式很少用于稍微復雜一點的博弈的建模,建立序貫博弈的模型有一種更為簡便的方法:博弈順序,就跟隨領導者博弈而言,博弈順序是:1張三選擇大或?。?李四選擇大或小。標準式強化了列出所有可能的戰(zhàn)略并比較其支付的思想;但是,博弈順序則給出一種描述博弈的較好方法。擴展式與博弈樹-定義另外兩種描述博弈的方法是擴展式和博弈樹。我們首先定義它們的組成要素。結(jié)點X是博弈中某參與人或自然采取行動的一點,或者博弈結(jié)束;結(jié)點X的后續(xù)結(jié)是如果X達到了,而后博弈中會出現(xiàn)的結(jié)點;結(jié)點X的前列結(jié)是在X達到前必須到達的結(jié)點;擴展式與博弈樹-定義起始結(jié)是沒有前列結(jié)的結(jié)點;終結(jié)點是沒有后續(xù)結(jié)的結(jié)點;分枝是在特定結(jié)點上參與人行動集合中的一個行動;路徑是從起始結(jié)到終結(jié)點的一系列結(jié)點和分枝。這些概念用來定義擴展式和博弈樹。擴展式博弈的擴展式表述包括:1由結(jié)點和分枝組成的結(jié)構,從單個起始結(jié)到終結(jié)點,沒有任何閉環(huán);2哪個結(jié)點屬于哪個參與人的標示;3自然在其結(jié)點用以選擇不同分枝的概率;4各參與人結(jié)點劃分的信息集;5各參與人在每個終結(jié)點的支付。博弈樹博弈樹與擴展式相同,只是第(5)項換成5’
各終結(jié)點的結(jié)果。博弈樹一詞與擴展式相比不太精確。如果結(jié)果定義為支付組合,每個參與人一個支付,那么擴展式與博弈樹是相同的。張三李四1李四2大小大小大?。?,2)(-1,-1)(-1,-1)(1,1)跟隨領導者博弈的擴展式動態(tài)博弈:張三先行動,李四后行動,李四能夠觀察到張三的選擇。支付:(張三,李四)張三李四1李四2大小大小大?。?,1)(-1,-1)(-1,-1)(2,2)協(xié)調(diào)博弈的擴展式靜態(tài)博弈:各參與人在兩種行動中作一次決策,他們同時行動。圖中表示出,張三先行動,但李四不知道他是如何行動的。虛線表示,張三行動后,李四的知識沒有變化。李四只知道博弈到達了由虛線連接的兩個結(jié)點中的某個結(jié)點,但不知道究竟到達了哪個結(jié)點。支付:(張三,李四)年代時間與博弈時間我們談到參與人在博弈中同時行動時,一個重要方面是,在他們行動之前,參與人都無法了解到對方選擇了什么。對于靜態(tài)博弈,只有在影響到博弈的參與人何時掌握信息時,年代時間才是重要的。在動態(tài)博弈中,年代時間的確是重要的,因為要考慮到未來的支付。重要的經(jīng)濟博弈很少在年代時間上完全同時,但是,有許多重要的博弈,在該詞延伸的含義上,參與人“同時”行動。因此,從戰(zhàn)略角度來看,他們同時行動。田忌賽馬比賽規(guī)則:馬按奔跑的速度分為上中下三等,等次不同裝飾不同,各家的馬依等次比賽,三賽二勝。比賽前田忌按照孫臏的主意,第一場,用上等馬鞍將下等馬裝飾起來,冒充上等馬,與齊威王的上等馬比賽;第二場,用上等馬與齊威王的中等馬比賽;第三場,田忌的中等馬和齊威王的下等馬比賽。結(jié)果二比一,田忌贏了齊威王。在雙方條件相當時,對策得當可以戰(zhàn)勝對方;在雙方條件相差很遠時,對策得當也可將損失減低到最低程度。博弈信息論-信息集與信息結(jié)構信息集:如何用擴展式或博弈樹表示一個參與人在博弈的每一時點上擁有信息?完美與不完美信息完全與不完全信息對稱與非對稱信息確定與不確定信息按信息結(jié)構的博弈分類信息集博弈的信息結(jié)構與其行動順序一樣,在戰(zhàn)略式表述中更加模糊。為了使信息更加準確,我們需要技術定義來描述誰在什么時間知道什么。信息集是知識的基本單位,是參與人認為博弈到達了的結(jié)點集合。在博弈的任何特定時點上參與人i的信息集
i是博弈樹上不同結(jié)點的集合,他知道這些結(jié)點可能是實際的結(jié)點,但不能通過直接觀察進行區(qū)分。信息集根據(jù)這樣的定義,參與人
i的信息集是屬于參與人i但在不同路徑上的結(jié)點的集合。這反映了參與人
i知道輪到誰行動,但不知道博弈到達了博弈樹的準確位置。在下圖這個博弈中,S在1984年在結(jié)點
S1
行動,J在1985年或1986年在結(jié)點
J1,J2,J3和
J4
行動。in1985or1986.S知道他自己的行動,但J只知道S是否選擇了行動,博弈到達
J1,J2,或者“其他”結(jié)點。支付:S,J上策中策下策中下策信息集的表示在圖形中表示信息集的一種方法是用虛線把在同一個信息集中的結(jié)點圈起來或連起來。為了避免圖形太亂,通常只把在一個結(jié)點行動的參與人信息集用虛線連起來或圈起來。上圖中的虛線表示,對J來說,J3
和
J4
在同一個信息集中,盡管對S來說它們在不同的信息集中。對信息集的要求一個結(jié)點不能屬于一個參與人的兩個不同的信息集。如果J的一個信息集中的結(jié)點是他行動的結(jié)點,那么,在這個信息集的各個結(jié)點上,J的行動集合必須是相同的,因為他知道他自己的行動集合(但是,根據(jù)他是從J3
還是
J4向前行動,在后面的博弈中,他的行動可能是不同的)。我們還要求,對于一個參與人來說,產(chǎn)生不同支付的終結(jié)點在不同的信息集中。信息集的性質(zhì)根據(jù)以上要求,博弈的信息結(jié)構中不包括參與人通過合理推斷而獲得的但未觀察到的任何信息。信息集也表示出未觀察到的自然行動的效應。在前面的圖中,如果初始行動是由N而不是S做出的,J的信息集以相同的方式來刻畫。信息劃分參與人
i的信息劃分是其信息集的集合,使得1.一個信息集中的所有結(jié)點的前列結(jié)在一個信息集中;2.每一條路徑由信息劃分的一個信息集中的一個結(jié)點表示。信息劃分的性質(zhì)信息劃分表示參與人知道在博弈的某個階段他能夠區(qū)分的不同位置,從而把所有可能的結(jié)點的集合分為子集,稱為信息集。信息劃分指的是博弈的一個階段,不是年代時間。參與人:S,J上策中策下策中下策信息劃分S的信息劃分是({J1},{J2},{J3},{J4})。J的信息劃分是
({J1},{J2},{J3,J4})。有兩種方式可以看出J的信息比S的差。首先,J的一個信息集
{J3,J4}比S的信息集含有更多的元素,因而,其次,他的信息劃分({J1},{J2},{J3,J4})含有較少的元素。信息類別含義完美信息確定信息對稱信息完全信息每一個信息集都是單結(jié)的參與人行動后自然不再行動參與人行動時或在終點結(jié),沒有參與人擁有與其他參與人不同的信息自然不首先行動,或其初始行動被所有參與人觀察到信息類別與含義我們用四種不同的方式對博弈的信息結(jié)構進行分類,所以,一個特定的博弈可能具有完美、確定、對稱和完全信息。完美與不完美信息完美信息(perfectinformation)是指每一個參與人對其他參與人(包括虛擬參與人“自然”的)選擇有準確了解的情況,即每一個信息集只包含一個值;在完美信息博弈中,每一信息集都是單結(jié)的;否則,是不完美信息博弈。完美信息博弈滿足最強的信息要求,在這樣的博弈中,各參與人總是準確地知道他在博弈樹中的位置。沒有同時行動,而且所有參與人都觀察到自然的行動。任何不完全或非對稱信息博弈都是不完美信息博弈。確定性與不確定性博弈確定性博弈是任何參與人行動后沒有自然行動的博弈;否則,就是不確定性博弈。在不確定性博弈中,自然的行動可能或不可能立即向參與人顯示出來。
如果沒有同時行動,確定性博弈可以是完美信息博弈。在這個定義中,唯一奇巧的是確定性博弈允許自然的初始行動。在不完全信息博弈中,自然首先行動,選擇參與人的類型。大多數(shù)建模者不認為這種情形是不確定的。對稱與非對稱信息在對稱信息博弈中,參與人在其選擇行動的結(jié)點或終點結(jié)的信息集至少包含與每一其他參與人的信息集中相同的元素;否則,是非對稱信息博弈。在非對稱信息博弈中,參與人的信息集在與其行為有關的方面是不同的,或者在博弈結(jié)束時是不同的。這樣的博弈具有不完美信息,因為參與人間不同的信息集不可能是單結(jié)的。
非對稱信息的實質(zhì)是某參與人擁有有用的私人信息:其信息劃分不同于并且不比另一參與人的信息劃分差。委托-代理模型如果信息集在博弈結(jié)束時是不同的,博弈具有非對稱信息。即使在終點結(jié)之后沒有參與人采取行動,傳統(tǒng)上,我們也認為這樣的博弈在信息方面是不同的。在委托-代理模型中,委托人先行動,然后是代理人行動,最后是自然行動。代理人知道到其行動,但委托人不知道,即使他可能會推斷出代理人的行動。
要不是由于信息在終點結(jié)仍然是不同的,這會是一個對稱信息博弈。對稱信息對稱信息博弈可以有自然行動或同時行動,但沒有參與人具有信息優(yōu)勢。信息可能會不同的一點是不行動的參與人具有超級信息,因為,比如說,如果兩個參與人同時行動,他知道他自己過去的行動。
根據(jù)定義,這樣的信息對知道的參與人并無幫助,因為不影響其行動(因而,雖不完美但對稱)。完全與不完全信息完全信息(completeinformation)是指自然不首先行動或自然的初始行動被所有參與人準確觀察到或知其概率分布的情況,即沒有事前的不確定性。在不完全信息博弈中,自然首先行動,并且至少一個參與人沒有觀察到;否則,是完全信息博弈。兩類博弈具有完全但不完美信息:同時行動博弈,以及在后面的博弈中,自然有行動,但沒有立即向所有參與人顯示出來。不完全與不完美信息完美信息必為完全信息,不完全信息意味著不完美信息(自然的選擇不可觀察),因為某個參與人的信息集含有多于一個的結(jié)點。但逆定理不成立,完全信息不一定是完美信息,而不完美信息也不必然是不完全信息。不完全與非對稱信息許多不完全信息博弈是非對稱信息博弈,但這兩個概念并不等同。
如果沒有自然的初始行動,但S采取了J未觀察到的行動,在后面的博弈中S又行動,這樣的博弈具有不對稱但完全信息。委托-代理模型就是這樣的例子,代理人知道他工作多努力,但委托人不知道,甚至在終點結(jié)也不知道。不完全但對稱信息博弈也可能有不完全但對稱信息:自然首先行動,但參與人都沒有觀察到。Harris&Holmstrom(1982):自然賦予工人不同的能力,但是工人們年輕時,他們自己和雇主都不知道他們的能力。
隨著時間的流逝,工人的能力成為共同知識,如果工人們是風險回避的,雇主是風險中性的,他們的模型證明,均衡工資將是不變的或不斷上升的。信息分類:撲克牌例子在撲克游戲中,參與人打賭誰的牌最好,排序方法是預先確定的。在下賭注之前,下面的行為規(guī)則如何分類?1.所有的牌都朝上;2.所有的牌都朝下,在下賭注前,參與人自己也不能看自己的牌;3.所有的牌都朝下,參與人可以看自己的牌;信息分類:撲克牌例子4.所有的牌都朝上,但然后各參與人把自己的牌拿起來,并悄悄地扔掉一張;5.所有的牌都朝上,參與人下賭注,然后各參與人收到一張向上的牌;6.所有的牌都朝下,但然后各參與人把自己的牌拿起來,自己不看牌,把牌放在自己的額前,所有其他參與人都能看到牌(印度撲克)。信息分類:撲克牌例子(1)完美,確定
(2)不完全,對稱,確定
(3)不完全,非對稱,確定
(4)完全,非對稱,確定
(5)完美,不確定(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版汽車融資租賃合同示范文本(含電子簽約)3篇
- 2025年度馬戲團專業(yè)演出設備租賃合同3篇
- 二零二五年度地熱資源打井開發(fā)與利用合同3篇
- 二零二五版模具行業(yè)財務顧問服務合同4篇
- 2025年度城市綠化工程苗木及配套設施采購年度合同3篇
- 二零二五年度民間借款合同(含金融消費者權益保護)
- 二零二五年度電子信息技術ICP證年審服務合同4篇
- 2025年保險科技的市場潛力
- 2025年度綠色農(nóng)業(yè)貸款合同4篇
- 課題申報參考:美對華VC脫鉤對中國企業(yè)關鍵核心技術突破的沖擊及間接掛鉤策略研究-共同所有權視角
- 暴發(fā)性心肌炎查房
- 口腔醫(yī)學中的人工智能應用培訓課件
- 工程質(zhì)保金返還審批單
- 【可行性報告】2023年電動自行車項目可行性研究分析報告
- 五月天歌詞全集
- 商品退換貨申請表模板
- 實習單位鑒定表(模板)
- 機械制造技術-成都工業(yè)學院中國大學mooc課后章節(jié)答案期末考試題庫2023年
- 數(shù)字媒體應用技術專業(yè)調(diào)研方案
- 2023年常州市新課結(jié)束考試九年級數(shù)學試卷(含答案)
- 正常分娩 分娩機制 助產(chǎn)學課件
評論
0/150
提交評論