版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
博弈論與信息經濟學
(GameTheoryandInformationEconomics)第3章:完全信息動態(tài)博弈
Chapter3:DynamicGameofCompleteInformation完全信息動態(tài)博弈動態(tài)博弈的擴展式表述完全信息動態(tài)博弈的均衡討價還價博弈納什均衡的問題——不可置信的威脅完全信息動態(tài)博弈的均衡概念——子博弈精煉納什均衡子博弈精煉納什均衡的求解——逆向歸納法子博弈精煉納什均衡舉例動態(tài)博弈〔序貫行動博弈〕動態(tài)博弈(DynamicGames)或序貫行動博弈
Sequential-MoveGames本章討論完美信息下的動態(tài)博弈參與人的行動有先后順序后行動者能夠觀察到先行動者都干了什么——完美信息動態(tài)博弈例:欺負他人可以獲得快樂,你會欺負他人嗎?無論何時完成了行動選擇,參與人都需要料想他們當前的行動會如何影響未來的行動,包括對手的行動和自己的行動。于是,參與人是在計算未來結果的根底上決定他們當前的行動選擇。為了做出最優(yōu)的行動選擇,每個參與人須運用怎樣的互動思維?1動態(tài)博弈的擴展式表述解放初,美國總是尋找時機來侵犯我國。對此,毛主席提出了“人不犯我、我不犯人,人假設犯我、我必犯人”的戰(zhàn)略方針。行動空間:美國“犯我”或“不犯我”,中國“犯人”或“不犯人”行動順序:美國先行動,我國依美國的行動而后動支付:假設美國“犯我”,中國“犯人”,那么支付向量為(-2,-2);假設美國“犯我”,中國“不犯人”,那么支付向量為(2,-4);假設美國“不犯我”,中國“犯人”,那么支付向量為(3,-5);假設美國“不犯我”,中國“犯人”,那么支付向量為(1,1)。完全信息:對對手的支付情況完全清楚美中軍事博弈1動態(tài)博弈的擴展式表述博弈樹〔gametree〕——有限次博弈的擴展式表述犯人犯人不犯人不犯人犯我不犯我美國我國我國(1,1)(3,-5)(2,-4)(-2,-2)決策結:行動時點枝:任意決策結出發(fā)能夠選擇的行動終點結:對應一個博弈結果,支付向量初始結路徑:由不同枝形成的鏈構造出不同路徑,每條路徑都通過有限次行動將你帶到博弈的某個終點。1動態(tài)博弈的擴展式表述例:兩房地產商A、B進行房地產開發(fā)。市場需求大、小的概率各占50%。投入:1億。當市場上有兩棟樓出售時需求大時,每棟售價1.4億,需求小時,售價7千萬;如果市場上只有一棟樓需求大時,可賣1.8億需求小時,可賣1.1億引入一個“自然”的外部參與人,隨機性事件被假定為一個稱為自然的參與人來控制博弈的隨機性特征在博弈樹中如何表述?A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)注意:支付向量的順序與博弈樹上行動順序是對應的!“自然”:虛擬參與人行動順序:A——自然——B在觀察到A的行動和自然的行動后進行決策路徑房地產開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B獲得的信息有限,無法對集合中的結點進行區(qū)分——參與人面臨的信息不完美假設:B在不知道N的選擇的情形下進行決策,如何用博弈樹表示這種信息短缺狀態(tài)?信息集:決策結的子集——表示參與人都知道些什么房地產開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)假設:B知道N的選擇,但不知道A的選擇〔或A、B同時決策〕,如何用博弈樹表示這種信息短缺狀態(tài)?房地產開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)假設:B行動前既不知道N的選擇,也不知道A的選擇,如何用博弈樹表示?房地產開發(fā)博弈1動態(tài)博弈的擴展式表述信息集〔informationset〕是決策結集合的一個子集,該子集包括所有滿足下列條件的決策結:
每一個決策結都是同一參與人的決策結;該參與人知道博弈進入該集合的某個決策結,但不知道自己究竟處于哪一個決策結。單結信息集:只包含一個決策結的信息集完美〔Perfect〕信息:博弈樹的所有信息都是單結的。——博弈中沒有任何參與人同時行動,且后行動者能觀察到先行動者的行動,且所有參與人觀察到N的行動〕靜態(tài)博弈用擴展式表述1動態(tài)博弈的擴展式表述BAA坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)A坦白抵賴BB坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)Q:何為完全信息?囚徒困境博弈練習:丈夫和妻子必須獨立決定出門時是否帶傘。他們知道下雨和不下雨的可能性各為0.5。支付函數如下:如果只有一人帶傘,下雨時帶傘者支付為-2.5,不帶傘者支付為-3;不下雨時帶傘者支付為-1,不帶傘者支付為0;如果兩人都帶傘,下雨時每人效用為-2,不下雨時每人的效用為-1;如果兩人都不帶傘,下雨時每人的效用為-5,不下雨時每人的效用為1。給出四種情況下的博弈樹:1、每人都出門前不知道是否會下雨,而且兩人同時決定是否帶傘;2、兩人出門前都不知道是否會下雨,但丈夫先決策,妻子在觀察到丈夫是否帶傘后才決定自己是否帶傘;3、丈夫出門前知道是否會下雨,妻子不知道,但丈夫先決策,妻子后決策。但是,參與人可以制定一個行動方案,將每個決策結上的選擇都事先規(guī)定好,即使這個決策點實際上不會出現?!呗?動態(tài)博弈中的策略博弈樹中參與人在結點上所選擇的單個行動——一步/招
(move)策略:人不犯我、我不犯人;人假設犯我、我必犯人美國中國犯人犯我不犯我不犯人(0,0)(3,-5)犯人不犯人(2,-4)(-2,-2)中國美中軍事博弈開發(fā)策略:不管A開發(fā)不開發(fā),我開發(fā)——{開發(fā),開發(fā)}追隨策略:A開發(fā)我開發(fā),A不開發(fā)我不開發(fā)——{開發(fā),不開發(fā)};對抗策略:A開發(fā)我不開發(fā),A不開發(fā)我開發(fā)——{不開發(fā),開發(fā)};不開發(fā)策略:不管A開發(fā)不開發(fā)我不開發(fā)〕——{不開發(fā),不開發(fā)};策略空間為:{開發(fā),開發(fā)}、{開發(fā),不開發(fā)}、{不開發(fā),開發(fā)}〔不開發(fā),不開發(fā)}。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’A的策略空間為:〔開發(fā),不開發(fā)〕;B有2個可選擇的行動,但策略空間中的可選策略有?靜態(tài)博弈中策略=行動2動態(tài)博弈中的策略《三國演義》中劉備過江招親3動態(tài)博弈的表述方式比照割耳畫不畫割耳默認默認小孩父親父親(0,0)(-4,-3)(1,-2)(-3,-3){割耳,割耳}{割耳,默認}{默認,割耳}{默認,默認}畫-3,-3-3,-31,01,0不畫-4,-30,0-4,-30,0小孩父親威脅博弈4NE的缺陷——不可置信的威脅{割耳,割耳}{割耳,默認}{默認,割耳}{默認,默認}畫-3,-3-3,-31,-21,-2不畫-4,-30,0-4,-30,0割耳畫不畫割耳默認默認小孩父親父親(0,0)(-4,-3)(1,-2)(-3,-3)三個NE:(不畫,{割耳,默認})(畫,{默認,割耳})(畫,{默認,默認})4NE的缺陷——不可置信的威脅NE(不畫,{割耳,默認}):父親威脅孩子,如果畫,那么就割掉耳朵。孩子相信了威脅,那么最好選擇不畫;如果孩子選擇不畫,那么父親選擇{割耳,默認}是最優(yōu)的。如果孩子足夠理性,會相信父親威脅嗎?一旦孩子選擇了“畫”,父親無疑選擇默認,即策略中事先“規(guī)定”的“你畫我就割你的耳朵”這一行動屆時不會發(fā)生。——父親的威脅是不可置信的(notcredible)。(不畫,{割耳,默認})不會是該博弈合理的均衡。4NE的缺陷——不可置信的威脅動態(tài)中,一個策略是在所有決策結上關于行動選擇的規(guī)定。NE就是參與人之間這種規(guī)定的均衡,但是其中含有一些“不可置信的規(guī)定”。這種規(guī)定會導致一種時機主義行為,即屆時輪到自己行動了,自己會根據當時的情況尋求最優(yōu)的行動,這種最優(yōu)選擇可能違背事先規(guī)定。其他參與人事先知道這一點,會預知到這種時機主義行為,故不會相信含有“不可置信規(guī)定”的策略。4NE的缺陷——不可置信的威脅這些包含了不可置信的策略所構成的NE是不能作為模型預測結果的,必須去除。事前〔exante)和事后(expost):一種戰(zhàn)略所規(guī)定的行動在事前看來是最優(yōu)的,但事后看并不是當事人的最優(yōu)選擇,這種行動就不可置信,該戰(zhàn)略就不是一個合理的戰(zhàn)略。5逆向歸納法一個名叫卡門的少女正在決定是否要吸煙。首先,她必須決定究竟要不要試試。如果她決定一試,她就得在將來再決定是否要繼續(xù)。不抽試著抽繼續(xù)抽卡門-110不抽單人決策結果:試著抽一下但不持續(xù)抽下去。吸煙博弈5逆向歸納法不過,這一分析忽略了吸煙上癮的問題。一旦卡門嘗試過吸煙,她就變成了另外一個人,有不同嗜好,吸煙帶給她不同的感受和收益?!獩Q定是否繼續(xù)吸煙的并不是“今天的卡門”,而是“未來的卡門”?!敖裉炜ㄩT”作出選擇時必須預期到其結果并將這一結果納入基于當前偏好的當前決策的考慮范圍換句話說,與抽煙有關決策不是單人在中性環(huán)境中的決定,而是一種博弈。“今日卡門”和不同偏好的卡門自己,即“未來卡門”間的博弈。5逆向歸納法不抽試著抽今天的卡門0,0繼續(xù)抽-1,11,-1不抽未來的卡門兩個“卡門”如何行事?未來卡門如何行事?考慮到未來卡門的未來行動,今日卡門今日如何行事?不抽試著抽今天的卡門0繼續(xù)抽-1,11,-1不抽未來的卡門5逆向歸納法
逆向歸納法從與終點結直接相連的那些決策結開始分析。通過比較其在相關終點結的支付,可以找出參與人在這個節(jié)點的最優(yōu)選擇。利用博弈終點的選擇來預測前面選擇行動的結果,最后一個決策結前面一個節(jié)點上的選擇就可被確定。然后,依次確定再前面的結點上面的選擇5逆向歸納法網絡詩歌:我站在未來的山坡上回頭看過去和現在如同不再有懸念的平靜湖面所有發(fā)生的一切都是如此清晰和必然通過沿著博弈樹如此的逆向推導,就可以解出整個博弈。沿著貫穿整個博弈樹的剩下的唯一路徑,就知道了當所有參與人在正確預測了所有的未來后果下做出最優(yōu)選擇時,在博弈中發(fā)生了什么。未來卡門這個影子的存在和當今日卡門選擇“試著抽”且給她一個行動時機時,她將選擇“繼續(xù)抽”。今日卡門選擇最優(yōu)策略“不抽”正是受控于此。它的虛構的出現和潛在的策略在決定今日卡門的招術時發(fā)揮了作用。不抽試著抽今天的卡門0繼續(xù)抽-1,11,-1不抽未來的卡門Q:均衡結果中,癮君子未來的卡門根本就不會出現,更沒有時機出招。為何還要規(guī)定未來卡門最優(yōu)策略?[-W(E),-W(E)-E]被舉發(fā)1-P收益[R(E)-W(E),W(E)-E]成功(P)不行賄行賄行賄人受賄不受賄受賄者[R(0),0]不舉發(fā)收益[R(0),0]舉發(fā)[-R(0),0]5逆向歸納法作貢獻不作貢獻Emilya不作貢獻作貢獻Ninac3,3,3作貢獻Tania3,3,4不作貢獻Nina作貢獻不作貢獻bd3,4,3作貢獻Tania1,2,2不作貢獻e4,3,3作貢獻Tania2,1,2不作貢獻f2,2,1作貢獻Tania2,2,2不作貢獻g逆向歸納的結果:Emily不作奉獻,Nina選作奉獻,Tania選作奉獻作貢獻不作貢獻Emilya不作貢獻作貢獻Ninac3,3,3作貢獻Tania3,3,4不作貢獻Nina作貢獻不作貢獻bd3,4,3作貢獻Tania1,2,2不作貢獻e4,3,3作貢獻Tania2,1,2不作貢獻f2,2,1作貢獻Tania2,2,2不作貢獻gTania均衡路徑〔equilibriumpathofplay〕其他路徑為非均衡路徑5逆向歸納法不過,均衡路徑不是均衡的完整表述均衡分析的完整表述是通過說明每個參與者的最優(yōu)策略得到的。在這一博弈中,策略是什么樣子的?它丟掉了大多數的分支和節(jié)點。計算一旦到達這些節(jié)點時需要采取的最優(yōu)行動,是決定最終均衡的重要環(huán)節(jié)。Why?
Emily的策略共2個:C或DNina的策略共4個:CD,CC,DC,DDTania的策略共16個:CCCC,CCCD,……,DDDD5逆向歸納法根據逆向歸納法,策略組合:Emily選擇D,Nina選擇DC,Tania選擇DCCD構成該博弈的均衡。均衡中,Emily獲得最正確結果,因為她可以利用自己第一個行動的時機——先動優(yōu)勢先行優(yōu)勢來自于將自己置于有利位置并迫使其他參與人為此進行調整的能力。是否所有博弈都存在先動優(yōu)勢?順序優(yōu)勢作奉獻不作奉獻g3,4,3作貢獻Tania1,2,2不作貢獻e3,3,3Tania3,3,4d4,3,3Tania2,1,2e2,2,1Tania2,2,2作貢獻不作貢獻Emilya不作貢獻作貢獻Ninac子博弈1子博弈2子博弈3子博弈4子博弈5子博弈6Ninab子博弈:〔subgame〕由原博弈中某個決策結開始的局部構成一個子博弈。逆向歸納法實際上就是從動態(tài)博弈的最后一個子博弈開始,逐步向前倒推以求解動態(tài)博弈的方法。3,4,3作貢獻Tania1,2,2不作貢獻e3,3,3Tania3,3,4d4,3,3Tania2,1,2e2,2,1Tania2,2,2作貢獻不作貢獻Emilya不作貢獻作貢獻Ninac子博弈1子博弈2子博弈3子博弈4子博弈5子博弈6Ninab6子博弈精煉納什均衡子博弈精煉納什均衡(SubgameperfectNashequilibrium,SPNE)〔Selten〕〔1965〕如果在一個完美信息的動態(tài)博弈中,各參與人的策略構成的一個策略組合滿足,在整個動態(tài)博弈及它的所有子博弈中都構成納什均衡,那么這個策略組合稱為該動態(tài)博弈的“子博弈精煉納什均衡”。在完全信息動態(tài)博弈中,逆向歸納法求得的均衡就是子博弈精煉納什均衡。NE:〔不畫,{割,默認}〕NE:〔畫,{默認,割}〕NE:〔畫,{默認,默認}〕不包含不可置信的行動的策略——子博弈精煉納什均衡〔能夠排除保證實際發(fā)生的動態(tài)行為與事前規(guī)定的策略是一致的,因此是真正穩(wěn)定的〕。子博弈Ⅱ割耳默認(1,-2)(-3,-3)子博弈Ⅰ小孩畫不畫父親割耳默認(0,0)(-4,-3)6子博弈精煉納什均衡威脅博弈6子博弈精煉納什均衡例UDLR(2,2)(3,1)(0,0)122,22,23,10,01UDLR2NE〔U,R〕在子博弈上不構成NE;NE〔D,L)在子博弈上構成NE,所以為SPNE;SPNE貫徹了這樣一種思想:不管過去發(fā)生了什么,參與人在每個決策結上都最優(yōu)化自己的決策?!靶蜇?sequential)理性”
NE:(不畫,{割,默認})NE:(畫,{默認,割})SPNE:(畫,{默認,默認})子博弈Ⅱ割耳默認(1,-2)(-3,-3)子博弈Ⅰ小孩畫不畫父親割耳默認(0,0)(-4,-3)6子博弈精煉納什均衡6子博弈精煉納什均衡練習:121〔2,0〕〔5,0〕〔4,2〕〔1,1〕UDRLU’D’均衡為〔{U,U’};L〕,均衡結果為1選擇U。桌子上有一定數量的火柴,兩個人輪流拿火柴,每次可以拿1根或2根,拿到最后1根或2根者勝出,勝者可贏得1塊錢,負者那么輸掉1塊錢。如果你是先行者,應該如何行動?奪寶戰(zhàn)nimgame
乙112乙(1,-1)甲(-1,1)112甲1(-1,1)甲1(-1,1)2211(1,-1)乙乙1乙甲2乙21甲21(-1,1)1甲(1,-1)(1,-1)均衡結果:〔2,2,1〕〔2,1,2〕奪寶戰(zhàn)nimgame甲必勝,因為他始終在開局拿走2根火柴,剩下3根,不管乙拿1或2根,甲都可獲得最后的2根或1根火柴從而獲勝。但是,如果假設初始的火柴根數為30根或100根等等,那么結果如何?仍然用逆向歸納法。假設參與人面臨最后的1或2根,那么必勝;但假設面臨最后的3根,那么必輸;當參與人面臨的是4根或5根,那么他可以拿走1根或2根,使對手面臨3根的局面,那么必勝;如果參與人面臨的是6根火柴,那么無論拿1根還是2根都不能使對手面臨3根火柴的局面,而對手反而可以使他面臨3根火柴的局面,那么對手必勝;假設參與人面臨7根或8根火柴,那么他可使對手面臨6根火柴而對手必輸;假設處于9根,那么將被對手逼迫到6根火柴的位置而自己必輸……奪寶戰(zhàn)nimgame3、6、9、12……等3的整數倍火柴數量下必定是先動者甲輸掉,而4、5、7、8……等非3的整數倍火柴數量下必定是先動者甲贏得。象棋是動態(tài)博弈的典范,因而在技術上服從完全的逆向歸納法分析。所有的出招對其他參與者都是可見的沒有偶然因素〔比照于打牌〕有限次出招然而,象棋確是一個無比復雜的博弈。奪寶戰(zhàn)nimgame完全信息動態(tài)博弈中,如果博弈階段較多,那么畫出博弈樹很困難,不過逆向歸納法仍然是適用的。5個海盜搶到了100顆寶石,每一顆都有一樣的大小和一樣貴重的價值,經過商議,他們決定將寶石這樣分配:
a抽簽決定自己的號碼1,2,3,4,5。
b首先,由1號提出分配方案,然后5人進行表決,如果同意這種方案的人到達半數,就按照1號的提案進行分配,否那么,他將被扔入大海喂鯊魚,然后由接下來的人繼續(xù)重復提議。假設每個海盜都是絕頂聰明,也不互相合作,而且每個都追求最大限度得到金幣寶石1號海盜如何提議?海盜分贓5號海盜:分給自己100枚寶石4號海盜:分給自己100枚寶石并贊成自己;5號海盜被分得0枚,反對無用3號海盜:分給5號海盜1枚并得到5號的同意;分給自己99枚,自己同意;分給4號海盜0枚,4號反對也無用2號海盜:分給4號1枚得到4號的同意;分給自己99枚,自己也同意;3、5號反對無用。1號海盜:分給3、5號海盜各1枚,獲得3、5號的同意;分給自己98枚,自己同意;分給2、4號海盜0枚,他們會反對但不起作用。均衡結果是〔98,0,1,0,1〕海盜分贓總結第一步:描述博弈〔語言〕第二步:畫出博弈樹〔圖形〕第三步:逆向歸納法求解均衡〔圖形〕第四步:說明均衡〔語言〕求解完全信息動態(tài)博弈的四個步驟:7不可置信威脅與承諾默認結婚(-1,1)(0,-2)(1,-1)斷絕父女關系斷絕戀愛關系文君父親不可置信的威脅〔空洞威脅,emptythreat)司馬相如與卓文君的戀愛精煉納什均衡剔除了不可置信的威脅,使得我們可以更合理地對博弈中參與人行為的預測Q:為什么存在不可置信威脅?7不可置信威脅與承諾打擊進入(0,100)(50,50)(-10,30)默認不進入進入者在位者市場進入博弈不可置信的承諾〔空口承諾〕“圣人”孔子,曾經生活在陳國,后來離開成果時途經蒲地,正好遇到公叔氏在蒲地叛亂,蒲地人將孔子扣留,不允許其離開。在孔子請求下,他們提出條件,如孔子不去衛(wèi)國,就放孔子離開??鬃舆€對天發(fā)誓不去衛(wèi)國,于是他們放了孔子,結果一出東門,孔子直奔衛(wèi)國。到未果后,子貢問孔子“誓言可以背叛嗎?”孔子說:“被迫立下的誓言,神靈是不會聽的?!笔ト硕伎梢员撑芽湛诔兄Z,何況凡夫俗子??鬃拥某兄Z7不可置信威脅與承諾長達數十年的矛盾積怨一直難以解決看不到和平的曙光。重要原因之一在于雙方都無法給對方堅實的承諾。巴方“以土地換和平”的承諾就是廉價的。因為,如果以色列從占領的領地上撤走,而巴方仍然可以繼續(xù)從事恐怖活動巴以沖突7不可置信威脅與承諾7不可置信威脅與承諾——在位者事前擴大生產能力:維護費用30萬,但打擊進入者的本錢降低了,扣除維護費用后也可獲得30萬,如果進入者進入而在位者默認,那么在位者利潤為50-30=20萬打擊進入(70,0)(20,50)(30,-10)默認不進入進入者在位者擴大生產能力在位者如何將不可置信的威脅變成可置信的威脅?——承諾市場進入博弈中的承諾行動7不可置信威脅與承諾項羽破釜沉舟對秦軍:最惠條款:生產耐用品的企業(yè)經常被“降價預期”所困擾:如果消費者預期企業(yè)將降價,他們將會等待,結果,企業(yè)只能降價〔如汽車行業(yè)〕其他承諾行動的例子:承諾行動:采取承諾行動過后,實施威脅或承諾符合威脅者或承諾者的利益8子博弈精煉納什均衡:連續(xù)性策略企業(yè)1為領頭企業(yè),首先選擇自己的產量;企業(yè)2為跟隨者,根據企業(yè)1的產量選擇自己的產量222126qqqq--=逆向歸納法求解SPNE結果。第二階段企業(yè)2的問題為一階條件,也就是反響函數為Stackelberg寡頭競爭模型8子博弈精煉納什均衡:連續(xù)性策略與cournot模型中企業(yè)2的反應函數相同企業(yè)1會預測到企業(yè)2的反響,因此第一階段的問題為代入企業(yè)2的反響函數得q1*=3那么q2*=1.5
產量支付廠商13單位4.5廠商21.5單位2.25古諾博弈均衡:廠商12單位4廠商22單位48子博弈精煉納什均衡:連續(xù)性策略比較stackelberg模型和counot模型結果:stackelberg均衡counot均衡為什么?企業(yè)1存在先動優(yōu)勢〔first-moveradvantage〕
產量支付產量支付廠商13單位4.524廠商21.5單位2.2524與cournot模型相比,企業(yè)2擁有信息優(yōu)勢反而對自己不利ab(5,3)12(2,4)1cdfe(4,3)(8,5)(3,6)2gh練習9討價還價〔Bargaining〕博弈討價還價問題的普遍性兒童在共用玩具和做游戲上夫婦在房屋歸屬、養(yǎng)育孩子以及彼此事業(yè)所做調整買賣雙方在價格談判上勞資雙方商議工資國家之間談判自由貿易政策9討價還價〔Bargaining〕博弈所有討價還價問題的共同點:參加談判各方通過達成協議所能夠產生和得到的總收
益應該比他們獨立行動所能得到的個人收益之和要大。談判不是零和博弈。整體大于局部的和,假設不存在超額價值〔“剩余”〕,談判就沒有意義外表看起來是一個零和博弈:當剩余存在時,談判就是為了瓜分它。每個討價還價者都試圖讓自己多得,而留給別人更少。9討價還價〔Bargaining〕博弈但在這背后隱藏著一個危險,如果協議未能達成,沒有人可以得到任何一點剩余?!半p輸”這一不利于雙方的結果,以及雙方都要防止之的愿望,為威脅〔明顯的或隱含的〕創(chuàng)造了可能,這就使得討價還價成為一個策略問題。9討價還價〔Bargaining〕博弈在博弈論產生之前,一對一的談判一般被認為是困難的,而且是永無止境的,相似的情況會產生各不相同的結果。對于為什么一方比另一方多得,理論家不能找到一個有條理的解釋,只好把這一結果歸因于模糊不清的“討價還價能力”的差異上。即使是簡單的納什均衡理論也不能起作用。9討價還價〔Bargaining〕博弈分析討價還價問題的兩種研究思路:一種分析途徑是把討價還價看成合作博弈。這里,各方共同尋找和實施一個解決方案,可能找一個中立的第三方來作為執(zhí)行的仲裁者?!肮餐袆印绷硪环N分析途徑將討價還價作為一個非合作博弈,這里,各方獨立地選擇策略?!蔼毩⑿袆印?討價還價〔Bargaining〕博弈最常見的討價還價方式:輪流出價提議提議談判結束同意AB同意談判結束A提議談判結束B提議談判結束同意同意A和B兩人分1塊錢;A先出價,B決定接受還是拒絕;如果接受,按照A提出的方案分配,談判結束;如果B拒絕,B提出方案,A決定接受還是拒絕;如果接受,按B的方案分配,談判結束;如果不接受,再由A提出方案;如此等等。9討價還價〔Bargaining〕博弈可獲得的剩余隨著每次出價而遞減另一個可能是時間是有價值的,不耐煩在此過程中扮演重要角色,因此拖延越久越沒有價值。序貫博弈,通過逆向歸納法它的精煉NE。但博弈的終點在哪里?為什么出價和還價的過程會停止,或者,更徹底問,為何會輪流出價〔為什么兩位談判者不堅持他們最初的價格,并拒絕改變意見〕輪流出價過程中會有人讓步。讓步的原因:一定是繼續(xù)堅持會造成更大的損失。損失的兩種形式:輪流出價模式一:剩余不斷遞減的情形球迷和黃牛的票價談判某球迷抵達NBA球賽賽場門口,但是沒有門票。他最多愿意付25美元觀看每節(jié)比賽。場外有票販倒賣球票。票販向他提出一個價格,球迷假設不愿意支付此價格那么會轉身到附近酒吧看第一節(jié)球賽。等該節(jié)比賽結束時,他走出酒吧,發(fā)現票販還在那里,于是球迷就會提出另一個價格。假設票販不同意,繼續(xù)回到酒吧;第二節(jié)結束,再走出酒吧,票販會再提出一個價格。倘假設球迷還是無法接受,他會再次回到酒吧,并在第三節(jié)結束時再向票販出價提議提議談判結束同意票販你同意談判結束票販提議談判結束你提議談判結束同意同意觀看球賽的價值會隨著節(jié)數減少而衰減。逆向歸納法預測該談判的結果第三節(jié)結束:球迷知道假設他不買球票,那么票販球票變成廢紙一張,所以即使球迷提出價格非常低,票販也會賣票給他=他幾乎可以免費獲得球票。第二節(jié)結束:票販出價(握有出價主動權),但是他必須考慮到第三節(jié)的情況,且須認清事實——他無法從球迷那里獲得剩余兩節(jié)球賽的完全價值。假設票販出價高于25元〔球迷對第三節(jié)比賽的評價〕,球迷就會拒絕票販的價格,因為球迷知道他可用幾乎0價格觀看第四節(jié)比賽,故票販出價最多25元。第一節(jié)結束:球迷出價,球迷知道假設他現在不買下球票,那么之后票販的期望價格為25元,所以球迷只要出價25元就可以獲得球票。比賽開始前:票販出價,考慮到后面的情況會出價50元〔代表球迷對第一節(jié)25元的評價與對剩余三節(jié)球賽25元的評價〕9討價還價〔Bargaining〕博弈V=100V=75V=50V=25V=001234球迷〔F〕的支付票販(S)的支付00025252550255050SFSF/最優(yōu)出價/0252550====9討價還價〔Bargaining〕博弈設想100g冰淇淋,每個回合融化10g〔假設A先提議〕,那么均衡是什么?如果談判進行2個回合:第二回合B先出價,他將把整個冰淇淋(90g)留給自己;第一回合A先出價,此時為了讓B不反對,A必須給B至少90g,自己得10g。如果談判進行3個回合:第三回合A先出價,他將把整個冰淇淋(80g)留給自己;第二回合B出價,此時為了讓A不反對,B必須給A至少80g,自己得10g;第一回合A出價,此時為了讓B不反對,A必須給B至少10g,自己90g?!睾暇呕睾匣睾希ㄌ嶙h人)甲乙甲乙可分配克數3(甲)4(乙)2(乙)1(甲)6(乙)5(甲)7(甲)8(乙)9(甲)10(乙)50304050604040304020302030102010200505040504040403030302030202010201010010100908070605040302010輪流討價還價博弈的抽象:總價值衰減的情形兩位談判者A和B之間瓜分價值為V的剩余,A首先出價。假設B拒絕此價格,那么剩余就減少x1減少到〔V-x1〕;然后B出價。假設A拒絕,那么剩余就減少x2減少到〔V-x1-x2〕;再由A出價。然后再繼續(xù)出價,一直到最后,假設10個回合博弈就結束,即V-x1-x2…-x10=0。第10回合:只剩下x10,B提出最后價格,他將得到x10。第9回合:剩余x9+x10,A出價:B得到x10,自己得x9。第8回合:剩余x8+x9+x10,B出價:A得到x9,自己得x8+x10。第7回合:剩余x7+x8+x9+x10,A出價:B得到x8+x10,自己得x7+x9。第1回合:A出價:自己得x1+x3+x5+x7+x9,B得到x2+x4+x6+x8+x10。簡單的技巧:假定所有的出價都被拒絕〔實際上不會發(fā)生〕。然后,加總所有被參與人拒絕的價格,所得到的總數就是真正均衡時,另一參與人得到的剩余。如:當B拒絕了A的出價,可獲得的剩余就會減少x1,而x1就會成為博弈均衡時A的可獲得剩余的一局部。9
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《DNA提取與保存》課件
- 上海體育大學《微生物代謝工程》2023-2024學年第一學期期末試卷
- 上海體育大學《航拍技術》2023-2024學年第一學期期末試卷
- 上海師范大學天華學院《溝通技巧》2023-2024學年第一學期期末試卷
- 上海師范大學《數據采集》2023-2024學年第一學期期末試卷
- 醫(yī)院個人述職報告范文
- 課題申報書:高校戰(zhàn)略規(guī)劃實施模式及績效評估研究
- 課題申報書:高校輔導員名師工作室建設有效路徑研究
- 課題申報書:多重風險沖擊下玉米供應鏈韌性治理及安全水平提升策略研究
- 課題申報書:多維信息嵌合視角下居民綠色消費行為形成、擴散與激勵策略研究
- PLC機械手臂搬運加工標準流程控制
- 肅南裕固族民俗文化旅游資源開發(fā)研究
- 食品級塑料材質
- JTG 3432-2024 公路工程集料試驗規(guī)程(正式版)
- 現代小提琴演奏技巧智慧樹知到期末考試答案章節(jié)答案2024年四川音樂學院
- 孫子兵法中的思維智慧智慧樹知到期末考試答案2024年
- 降水的變化與分布課件
- 2024年幼兒園安全知識競賽培訓題題庫及答案
- 班車服務項目服務方案
- 公司法(上海財經大學)智慧樹知到期末考試答案2024年
- 金融數據分析 課件 第2章金融時間序列線性模型
評論
0/150
提交評論