博弈樹與逆向歸納法1

上傳人：l*** IP屬地：天津上傳時間：2022-08-02 格式：DOCX 頁數(shù)：16 大小：96.96KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩11頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、動態(tài)博弈與逆向歸納法假如欺負(fù)他人可以獲得快樂，那你會欺負(fù)他人嗎？大多數(shù)人的回答是不會，原因正如他們所指出的，欺負(fù)他人會擔(dān)心他人的報復(fù)，這抵消了從欺負(fù)他人的行為中所能得到的快樂。這個答案至少表明，你之所以現(xiàn)在沒有欺負(fù)他人，并不因為不想欺負(fù)他人，而是因為你知道欺負(fù)他人會在將來給自己造成麻煩。同樣，當(dāng) 我們面臨一些博弈對局的時候，我們應(yīng)如何采取現(xiàn)在的行動，常常取決于每個行動在將來會產(chǎn)生什么后果，或者說在將來別人將如何反應(yīng)。在前面各章內(nèi)容中，博弈是靜態(tài)的一一或者說是同時行動的。而現(xiàn)實中的博弈常常是動態(tài)的、依序行動的，這就要求我們必須考慮人們在將來對我們的行動反應(yīng)。分析序貫行動博弈的一個重要

2、思路就是：向前展望，向后推理（looking forward and reasoning backward），即面向未來，思考現(xiàn)在，站在未來的立場來確定現(xiàn)在的最優(yōu)行動。本章我們將通過一些例子來說明這一分析思路，其中有些例子很有趣，也很有挑戰(zhàn)性。5-1逆向歸納法1、美中軍事政治博弈我們通過一個簡單的例子來說明序貫博弈的（離散策略的）擴(kuò)展式表達(dá)和逆向歸納法求解方法。這個例子可以稱做美中軍事政治博弈，或者叫“毛澤東的對外軍事政治戰(zhàn)略”。故事模型在我國解放初期，美國一直試圖對我國實施打擊。此時，我國必須對美國采取應(yīng)對之策。就我國對美國可以采取的行動而言，無非是回?fù)艋虿换負(fù)簟Ｓ酶?符合毛澤東

3、的話來說，美國可以“犯我”或“不犯我”，而我們可以“犯人”或 “不犯人”。由此我們可以刻畫出一個動態(tài)博弈：博弈方：美國、中國；行動空間：美國可選擇的行動是“犯我”或“不犯我”；中國的選擇是“犯人”或“不犯人”；行動順序：美國先行動；中國觀察到美國的行動后再選擇自己的行動；贏利：我們這樣假設(shè)贏利狀況（數(shù)字是虛擬的）；如果美國“犯我”，中國“犯人”，惡戰(zhàn)再所難免，則美國虧損2，中國虧損2；如果美國“犯我”，中國“不犯人”，那么中國淪為美國的附庸，喪失國家主權(quán)，則美國獲得2,中國虧損4；如果美國“不犯我”，中國“犯人”，那么就是中國挑起戰(zhàn)事，美國正好有借口糾合國際力量打擊中國，則美國得3,中國

4、虧損5；如果美國“不犯我”，中國“不犯人”，各自和平地發(fā)展經(jīng)濟(jì)，則美國得 1，中國得1。2、博弈樹(2， 2)(2,-4)(3,-5)圖5-1美中軍事政治博弈對于上述動態(tài)博弈，我們可以用博弈樹（game tree）表達(dá)如下（圖5-1）：(1,1)圖5-1的博弈樹是這樣解讀的：美國先選擇“犯我”或“不犯我”然后中國觀察美國的選擇后選擇“犯人”或“不犯人”；最右邊的括號內(nèi)數(shù)字是各種情況下雙方的贏利狀況，前一個數(shù)字代表第一個行動人（美國）的贏利，第二個數(shù) 字代表第二個行動人（中國）的贏利。依此類推，如果有更多的參與人序貫行動，則贏利的排列順序與行動順序一致。3、逆向歸納法究竟什么是圖5-1博弈

5、的均衡呢？在完美信息動態(tài)博弈中，我們要找的均衡實際上是一條路徑，即從第一個行動人決策結(jié)點出發(fā)，一直到某一個終點之間的路徑。所謂均衡路徑就是在每一個決策階段，沒有人會偏離這條路徑。這條路徑所代表的策略均衡被稱做子博弈完美均衡。下面我們介紹如何用逆向歸納法來求解博弈的均衡。逆向歸納的步驟是這樣的：首先，從最后階段行動的參與人決策開始考慮。在圖5-1的博弈中，最后行動的是中國，因此我們先考慮中國怎么決策。在考慮中國的決策時，我們假定美國已經(jīng)選了“犯我”或“不犯我”；如果美國選擇了“犯我”，在圖5-1中可發(fā)現(xiàn)，中國選擇“犯人”會得到-2，選擇“不犯人”會得到-4 ；因此中國必然選擇“犯人”一

6、一我們就在中國 “犯人”的分枝上畫上一個短短的橫線標(biāo)記；如果美國選擇了“不犯我”，從圖5-1中可發(fā)現(xiàn)，中國選擇“犯人”會得到 -5 ,選擇“不犯人”會得到1，因此中國必然選擇“不犯人”一一我們就在中國“不犯人”的分枝上畫上一個短短的橫線標(biāo)記。然后，考慮次后階段行動的人（例子中只有兩個階段，因此實際上就是第一階段行動的人）美國。美國決策時會考慮中國的反應(yīng)，而現(xiàn)在它已預(yù)見到中國將選擇的行動就是兩條劃了雙橫線的分枝。所以，它很容易推出自己面臨的情況是：若選擇“犯我。，則必然導(dǎo)致中國“犯人”，則美國得到-2 ;若選擇“不犯我”，則中國必選擇“不犯人”，則美國得到1 ；結(jié)果美國寧愿選擇“不犯我”

7、。照規(guī)矩，我們在美國“不犯我”的一個分枝上畫上橫線。如果存在一個路徑，其每個分枝都畫上了橫線，那么這條路徑就是均衡路徑。可發(fā)現(xiàn)，在圖5-1的例子中，均衡路徑將是美國選擇“不犯我”，而中國選擇“不犯人”。因此，美中博弈的子博弈完美均衡結(jié)果是：美國不侵犯中國，而中國也不侵犯美國。逆向歸納法對于求解子博弈完美均衡之所以適用，其原因就在于它的解過程很好地體現(xiàn)了子博弈完美均衡的定義:一個策略組合只有在其路既滿足是整個博弈的均衡又滿足該路徑上每一個子博弈的均衡時候，才是子博弈完美均衡。 5-2逆向歸納法的應(yīng)用掌握了逆向歸納方法，現(xiàn)在我們就可以來看一些序貫行動博弈的例子。這些例子既充滿趣味，也

8、是對大家使用逆向歸納技術(shù)的一種訓(xùn)練，同時也可能是一種智力上的測試。1、私奔博弈故事模型在我國漢代，有個青年作家叫司馬相如，有個年輕的寡婦叫卓文君。卓文君的父親喜歡附庸風(fēng)雅，經(jīng)常請一些所謂的才子到家里吟詩作賦，其中就包括司馬相如。日情，并打算結(jié)婚。但是，這門親事遭到文君父親的反對。父親對文君說，你若跟司馬結(jié)婚，那么就將脫離父女關(guān)系?，F(xiàn)在，卓文君應(yīng)該怎樣選擇？是屈從父親，還是跟心上人結(jié)婚？我們可用如下一個博弈（圖5-3）來表示卓文君與她父親的博弈。, 跟司馬結(jié)婚文君| I與司馬默認(rèn)父親斷絕父女關(guān)系（2, 1）（一 1,1）（0,-2）圖5-3私奔博弈斷絕關(guān)系圖5-3的博弈中，卓文君

9、先選擇“與司馬斷絕關(guān)系”或者“結(jié)婚”若與司馬斷絕關(guān)系，則她失去一個心愛的人，得到1的贏利（她父親則得到贏利1，因為他終于如愿以償讓女兒沒能跟司馬結(jié)婚）；若選擇結(jié)婚，則由文君的父親做出反應(yīng)。他可以選擇真的斷絕父女關(guān)系一一這種情況下，文君得到0（因為她雖然跟愛人結(jié)婚得到1，但是卻因此失去了父親得到-1，總計得到0），父親得到是-2 （因為看到文君與司馬結(jié)婚心中不快得到-1，又失去了一個女兒其所得再增加 -1）;當(dāng)然，既然生米煮成了熟飯，父親可以默認(rèn)一一此時文君既得到愛人又沒有失去父親故獲得贏利2,而父親心中不快得到-1，但畢竟沒有失去女兒。使用逆向歸納法不難得到，第二階段父親將選擇默認(rèn)（

10、因為默認(rèn)的贏利為 -1,而斷絕父女關(guān)系的贏利為-2）；給定第二階段父親會默認(rèn)，第一階段文君將選擇結(jié)婚（結(jié)婚贏利為2,與司馬斷絕關(guān)系贏利為一1）。所以，私奔博弈的均衡結(jié)果是，文君選擇結(jié)婚，而文君的父親選擇默認(rèn)。歷史上的故事正是如此。卓文君不顧父親的反對和司馬相如私奔。兩個人在成都靠開酒吧為生。文君的父親不忍女兒受苦，最后還是接納了他們的婚姻。私奔博弈刻畫了一個很重要的道理，那就是有些時候威脅并不可怕，因為那些威脅僅僅是威脅而已。就像父母親反對兒女婚姻時常常擺出一副要斷絕父子（女）關(guān)系的樣子，但一旦木己成舟，他們也只好默認(rèn)，并不會真的跟兒女?dāng)嘟^ 關(guān)系。學(xué)習(xí)了博弈論的人，更容易看出這些威脅

11、是不可置信的。2、海盜分贓再來看一個逆向歸納法的經(jīng)典例子，其原型來自I. Stewart在科學(xué)美國人雜志上的一篇文章兇殘海盜的邏輯。這個例子曾經(jīng)被作為微軟公司招募員工的面試題目，你也可以嘗試著可以在幾分鐘之內(nèi)求解出正確答案。故事模型話說有5個海盜ABCDE搶來了 100枚金幣，大家決定分贓的方式是：依次由海盜ABCD提出一種分配方案，如果同意這種方案的人達(dá)到半數(shù)，那么該提議就通過并付諸實施；若同意這種方案的人未達(dá)半數(shù)，則提議不能通過且提議人將被扔進(jìn)大海喂鯊魚，然后由接下來的海盜繼續(xù)重復(fù)提議過程。假設(shè)每個海盜都絕頂聰明，也不相互合作，并且每個海盜都想盡可能多得到金幣，那么，第一個

12、提議的海盜將怎樣提議既可以使得提議被通過又可以最大限度得到金幣呢？我曾好幾次在學(xué)生中做過調(diào)查，如果他們就是第一個海盜會提出怎么分？答案五花八門，但是大多數(shù)是表示平均分（每人20顆）一一這可能是現(xiàn)實中的情況，公平觀念在博弈中發(fā)揮著作用。但是標(biāo)準(zhǔn)博弈論是研究人們完全理性的情況下極端復(fù)雜的策略互動后果，這里的平均分配并不符合標(biāo)準(zhǔn)博弈論的邏輯。那么答案究竟是什么呢？使用邊向歸納法可以求解如下：首先，考慮只剩下最后的海盜E,顯然他會分給自己100枚并贊成自己。再回溯到只剩下海盜D和海盜E的決策，海盜D可以分給自己100枚并贊成自己；海盜E被分得0枚，即使反對也無用?；氐胶１IC。海盜C可以分給海盜E

13、 1枚金幣得到海盜E的同意；分給自己99枚，自己也同意；分給海盜D。枚，海盜D反對但無用?；氐胶１IB。海盜B可以分給海盜D 1枚得到海盜D同意；分給自己99枚，自己也同意；海盜C、E各分得0枚，他們會反對但反對沒有用?；氐胶１IA。他可以分給海盜C、E各1枚，獲得海盜C、E的同意；分給自己98，自己也同意；分給海盜B、D各0枚，他們會反對但反對不起作用。因此，這個海盜分贓問題的答案是（98, 0，1，0，1）：海盜A提出分給自己98枚，分給海盜B、D各O,分給C、E各1枚，該提議會被通過。因為海盜A、 C、E會投贊成票。我們可以把這個逆向決策的過程用如下矩陣表達(dá)出來（如圖 5-4,其中畫下劃

14、線的數(shù)字表示海盜對該方案投了贊成票，未加下劃線對應(yīng)于反對票）。如果你是海盜A，你會這樣提方案嗎？對于上述海盜分贓問題，我們還可以演化出不同的版本。比如說：（1）如果要求包括提議海盜在內(nèi)的所有海盜過半數(shù)（超過1/2）同意才能使提議通過，那么海盜A應(yīng)該怎么提方案？（2）如果要求提議海盜之外的海盜過半數(shù)同意才能通過，那么海盜A又該怎么提方案？（3）或者海盜的數(shù)目增加到10個、100個，海盜A又怎么提方案？大家可以把這個當(dāng)做練習(xí)題來做一做。圖5-4海盜分贓逆向推理過程(全部海盜半數(shù)同意即可通過)答案：變種問題(1 )中，海盜A提出的分配方案是(97 ,0,1,2,0)或(97 , 0,1

15、,0,2)；變種問題(2)中，海盜A提出的分配方案應(yīng)是(97 ,0,1,1,1)；變種問題(3 )中，大家可嘗試逐漸增加海盜的數(shù)量，將會發(fā)現(xiàn)答案是有規(guī)律可循的。 5-3理性的局限與非理性行為逆向歸納方法是一個非常美妙的思想，但是它對人們的理性要求可能會太高。然而，也可能正因為人們的理性程度是不一樣的，才有了博弈的高下之分。關(guān)于參與人理性不對稱下的博弈理論研究，至今仍是博弈論研究的一個努力方向。按照博弈論大家魯賓斯坦(A.Rubinstein)的說法：“對不同參與人的能力及形勢洞察力的不對稱性建模在將來的研究中將是一個吸引人的挑戰(zhàn)?！?、序貫理性所謂序貫理性，通俗地說就是每個參與人在

16、其每一個行動時點上都將重新優(yōu)化自己的選擇，并且會把自己將來會重新優(yōu)化其選擇這一點也納入當(dāng)前的優(yōu) 化決策當(dāng)中。換句話說，一個具備序貫理性的參與人很清楚自己在每一個需要做出決定的時刻都需要重新對已有的決策進(jìn)行優(yōu)化，而且在做這種優(yōu)化的時候必須把未來需要重新優(yōu)化的這一事實考慮在現(xiàn)有的優(yōu)化決策當(dāng)中。顯然，序貫理性下將不會有“后悔出現(xiàn)”一一因為滿足序貫理性所形成的路徑，無論從后向前看，還是從前向后看，都將是一條最優(yōu)的道路。那么，只憑我們在日常生活的決策中有那么多的“悔不該當(dāng)初”，我們就知道其實人們常常難以達(dá)到序貫理性的要求。為什么人們常常難以達(dá)到序貫理性的要求呢？至少有兩個原因：一是人們的算

17、計能力是有限的；二是人們的理性本身也是有限的(比如感情用事、沖動行事、冒險傾向等)。2、算計能力與策略技巧從秋理論上來說，有限的離散策略，只要其可能的結(jié)果狀態(tài)是有限的，我們就可以通過逆向歸納方法，來求解出均衡路徑上的策略。按照這樣的一個想法，我們在下下象棋、圍棋等時可能就分不出高下。因為，每個人都通過逆向歸納法已經(jīng)知道如何應(yīng)對每一步棋，最后大家可能永遠(yuǎn)只會下成平手。但現(xiàn)實中，下棋的勝負(fù)是很常見的結(jié)果。而且，我們明顯發(fā)現(xiàn)更有經(jīng)驗的棋手顯然更能“老謀深算”，一個新手常常目光短淺、漏洞百出，老手下贏新手是最普遍的結(jié)果。為什么會這樣呢？下棋之所以能分出勝負(fù)，其實就在于對手之間的序貫理性是

18、不一樣的，他們對于局勢的洞察力是不一樣的。有經(jīng)驗的老手，眼光顯然比一個新手強(qiáng)上不止幾百倍。讀者可能會問，下象棋不過32顆棋子，為什么人們的算計能力會如此有限呢？這里實際上涉及到序貫博弈中策略的數(shù)量是成幾何級數(shù)增加的。當(dāng)你下象棋的時候，32顆棋子，第一階段你就至少有32種行動選擇（其實還不止，因為某些棋子可行的步驟不止一種），那么，哪怕是只要求進(jìn)行幾個回合的廝殺，其策略組合都遠(yuǎn)遠(yuǎn)超越了人腦通過逆向歸納來進(jìn)行算計的能力。存在眾多可選行動和行動階段的博弈中，策略組合的數(shù)量之巨大、情況之復(fù)雜似乎會給人一種悲觀的結(jié)論：既然如此，我們還研究博弈論干什么呢？對此我想說的是，這并不悲觀，反而有趣

19、。人與人之間的理性程度的差異造就了勝負(fù) 之分，才使得棋藝對抗如此令人著迷，難道不是這樣嗎？而且新老棋手的棋藝高低，不正是說明了理性程度的提升策略技巧的改善是可以通過學(xué)習(xí)和訓(xùn)練來達(dá)到的嗎？難道這不正是一個應(yīng)該學(xué)習(xí)和研究博弈論的最好理由嗎？此外，還有一個更為樂觀的事實是，由于計算機(jī)技術(shù)的發(fā)展，過去許多以人腦難以完成算計并分析的博弈，現(xiàn)在已經(jīng)可以通過電腦輔助計算來完成。可以想像，隨著人類計算技術(shù)的發(fā)展，人類的算計能力也會迅速得到發(fā)展，并日益可以分析更為復(fù)雜的博弈。3、操縱理性的博弈現(xiàn)實的博弈與標(biāo)準(zhǔn)博弈理論存在差距的另外一個事實是，現(xiàn)實中博弈的參與人很清楚各個參與人的理性程度和對現(xiàn)實的洞察

20、力是有差異的，從而他們完全有可能策略性地使用“理性”。比如，如下的一個博弈（圖5-5）：圖5-5的博弈中，大家使用逆向歸納法很容易發(fā)現(xiàn)，第三階段，甲將選擇 “左”（獲得100）；但是在第二階段乙寧愿選“上”（獲得1）；回到博弈之初，甲將選擇“前”直接結(jié)束博弈（獲得2）。這是標(biāo)準(zhǔn)的逆向歸納解。但是在現(xiàn)實中，這個均衡結(jié)果會出現(xiàn)嗎？很可能不會，尤其是當(dāng)兩個參與人對對方的理性有所質(zhì)疑的時候。比如說，甲可能會想：我如果選“后”，那么即便乙選擇了“上”，我也得到1個單位，只比我選“前”少得到1個；但是，如果他認(rèn)為我是個傻瓜，而要冒一次險選擇“下”（如果甲真是傻瓜，“下”對乙是有誘惑力的，地選擇

21、“右”而使得乙得到100），那么我就賺了。這樣，不管是由于僥幸心理，或是真的使用裝傻策略，甲可能真的會選“后”。同樣，乙看到甲選了“后”，也許乙很高興地認(rèn)為甲是個傻瓜（完全理性的人不會這么選的嘛），那么乙的僥幸心理也被誘導(dǎo)出來了，既然他是傻瓜，那我為什么不冒險選下呢一一這樣，要么我只比選“上”少得到1個單位，但也有可能多得到100-1二99個單位呢。于是乙可能真的會選“下”。正因為乙可能有上述的心理和行為，所以甲在第一階段就更有可能會選擇 “后”。只要乙敢于冒險選“下”，那么甲就可以毫不費力地得到100單位收入了。當(dāng)然，甲選擇“后”是有風(fēng)險的，因為如果乙的理性程度很高，沒有僥幸心理，

22、或者能夠洞悉甲的企圖，那么甲就會“偷雞不成反而蝕把米”。在現(xiàn)實中，這樣的利用對手理性不足的博弈還少見嗎？一點也不！有些博弈高手，就是抓住對手的僥幸心理（完全理性的人是不會有僥幸心理的）故意賣一個破綻，從而誘對方上鉤，大獲其利。故事模型譬如元朝末年朱元璋滅陳友諒就是一個典型的博弈戰(zhàn)例。其時，各地起義軍已混戰(zhàn)多年，最后只剩下了朱元璋、陳友諒等幾支大隊伍。陳友諒為了吞掉朱元璋，勾結(jié)朝廷太尉張士誠，向朱元璋占據(jù)的建康（今江蘇南京）進(jìn)攻。但陳友諒與朱元璋打過多年交道，深知朱元璋足智多謀，手下兵多將廣，故小心翼翼，步步為營，慢慢推進(jìn)。消息傳到建康，朱元璋思謀破敵之策，覺得想滅陳友諒，必

23、須誘敵深入，然后圍殲之。這樣一步步地打消耗戰(zhàn)，久了必會腹背受敵，被陳友諒和張士誠兩面夾擊就危險了。但如何引陳友諒孤軍深入呢？朱元璋想起了黃蓋降曹的赤壁之戰(zhàn)，覺得可以仿效辦理，以誘惑敵人。于是朱找到過去與陳友諒交情甚厚的屬將康茂才，問他是否有把握誘陳友諒來攻?？得耪f：“陳友諒胸無大志，缺乏戰(zhàn)略眼光，急功近利，可以誘其前來。”于是他修書一封，說自己在元璋手下干得很不痛快，出力不少，不得重用，今將軍前來進(jìn)攻，愿投降。并說：自己負(fù)責(zé)防守建康西邊的大橋，是水路攻建康的必經(jīng)之路，若將軍到來，愿獻(xiàn)橋投降。陳友諒雖然擔(dān)心有詐，但認(rèn)為自己力量雄厚，帶大兵前來，即使有詐也不用太擔(dān)心。結(jié)果，他一來就

24、未能回去，被朱元璋所滅。在這個例子中，朱元璋等人就是利用了陳友諒的僥幸心理，故事中的關(guān)鍵詞“可以誘其前來，和“愿獻(xiàn)橋投降”，深刻地說明了朱元璋如何用盡心計試圖利用對方的僥幸心理。當(dāng)然，這種試圖利用對方理性不足而操縱對方的謀略也可能被對方識破而不能得逞。通常，這種策略性運用“理性”的失敗與低估對方的理性有關(guān)。三國演義“東吳招親”的故事中，孫權(quán)和周瑜就是低估了諸葛亮的理性，結(jié)果被諸葛亮將計就計，賠了夫人又折兵?？傊?，“理性”本身可能就是現(xiàn)實中人們進(jìn)行博弈時的一個可操縱策略變量。但是，博弈理論在這一方面并沒有多大的進(jìn)展。下一節(jié)我們還會談到一些非理性博弈，比如非理性的報復(fù)一一我們會發(fā)現(xiàn)“

25、非理性”有時也會給參與人帶來好處。可能正因為如此，物競天擇一一大自然才讓人類在演化中保留了非理性吧。5-4威脅、承諾與報復(fù) 5-41威脅和承諾在博弈中，威脅、承諾與報復(fù)，都是慣用的伎倆，這些內(nèi)容也是本節(jié)要探討的主題。大家會發(fā)現(xiàn)，博弈論思維的確有助于我們洞悉某些局勢中的不可置信的威脅、不可置信的承諾等。1、威脅與空洞威脅在生活中，人們慣用威脅和恐嚇來達(dá)到自己的目的。但是，理性的參與者會發(fā)現(xiàn)某些博弈中威脅是不可置信的，即塞爾頓(Selton，1994年經(jīng)濟(jì)學(xué)諾貝爾獎得主)所謂的“空洞威脅”(empty threat)。威脅不可置信的一個重要原因是：將威脅所聲稱的策略付諸實踐對于威脅者本

26、人來說比實施非威脅聲稱的策略更不利。既然如此，我們就沒有理由相信威脅者會選其威脅所聲稱的策略。比如有一個壟斷市場，唯一的壟斷者獨占市場每年可獲得100萬的利潤。現(xiàn)在有一個新的企業(yè)準(zhǔn)備進(jìn)入這個市場，如果壟斷者對進(jìn)入者采取打擊政策，那么進(jìn)入者就將每年虧損10萬元，同時壟斷者的利潤也下降為30萬元；如果壟斷者對進(jìn)入者實行默認(rèn)政策，那么進(jìn)入者和壟斷者將各自得50萬元利潤?，F(xiàn)在，為了防止進(jìn)入者進(jìn)入，在位的壟斷企業(yè)宣稱：如果進(jìn)入者進(jìn)入，那么它就會選擇打擊政策。但是，如果我們把這個市場進(jìn)入博弈的博弈樹畫出來，再用逆向歸納方法求出均衡路徑，就會發(fā)現(xiàn)這是一個“空洞威脅”。( 10,30)我們會發(fā)現(xiàn)

27、均衡路徑是進(jìn)入者進(jìn)入，而在位者默認(rèn)。在位者的威脅將是不可置信的，因為給定進(jìn)入者真的進(jìn)入了，在位者選擇默認(rèn)而不是打擊將更符合其利益，所以在位者宣稱要實施打擊，也只是說說而已。實際上，在很多時候，威脅都是不可置信的，尤其是口頭的威脅。比如在第4章的“私奔博弈”中，卓文君的父親以脫離父女關(guān)系威脅文君與司馬相如分手也是一個空洞威脅的例子。在家庭里，經(jīng)常出現(xiàn)不可置信的威脅。因為家庭的成員彼此利害相關(guān)，懲罰一個家庭成員也會給懲罰者帶來負(fù)效用，結(jié)果就使得懲罰常常并不是很可信。在公司里，員工常常會策略性地提出加薪，而威脅老板加薪的一個常見版本就是“如果不給我加薪，那我就將離職”。問題是，老板會不

28、會理踩員工的威脅呢？一個顯然的事實是，老板可不像小孩那樣缺乏理性。如果員工并沒有其他的去處，老板就不會理睬員工的加薪要求。只有老板相信員工會離去，并且他覺得多花點錢留住員工是值得的時候，他才會給員工加薪。在師生之間，有時也會存在不可置信的威脅。教師為了讓學(xué)生更加努力學(xué) 習(xí)，有時會故意夸大命題和閱卷的嚴(yán)格程度。但是，學(xué)生很清楚的問題是教師不可能讓大面積的學(xué)生不及格，所以他們就不會理會試題的難度。如果他們預(yù)計 95%的學(xué)生會及格，那么他們就只需要讓自己進(jìn)入那95%就行了，并不會擔(dān)心絕對分?jǐn)?shù)是否會達(dá)到60分。如果教師真的想通過考試壓力來迫使學(xué)生努力學(xué)習(xí)，那么他應(yīng)當(dāng)公布更低的相對及格標(biāo)準(zhǔn)

29、，比如無論考多少分，都只有70%的同學(xué)才算作及格。但是，幾乎沒有老師會這樣公布，因為如果他真的公布了這樣一個過低的相對及格率，那么學(xué)生會向校方投訴教師強(qiáng)行規(guī)定了不合理的及格率。2、通過承諾行動使威脅變得可信為了使威脅變得可信，人們可以采取承諾行動。承諾行動的基本思想是：通過限制自己的某些策略選擇，從而使得其選擇特定策略的宣稱或意圖變得可信?；蛘哒f，承諾行動是局中人通過減少自己在博弈中的可選行動來迫使對手選擇自己所希望的行動。其中的道理在于：既然對方的最優(yōu)反應(yīng)行動依賴于我的行動，那么限制我自己的某些行動實際上也就限制了對方采取某些行動。如果某些承諾行動只是增加了選擇某些行動的成本，

30、而不是使該行動完全不可能被選取，則被稱為不完全承諾。雖然語言也可以作為一種承諾，但我們這里講的承諾行動更注重要落實在 “行動”上。“行勝于言”是博弈論的基本教條。一個人嘴巴上可以說得天花亂墜，而理性的人卻只看他的行動。 5-42現(xiàn)實中的威脅與承諾1、愛的承諾故事模型有一位小伙子在給心愛的姑娘的信中寫道：“愛你愛得如此之深，以至愿為你赴湯蹈火；我是那么地想見到你，任憑艱難險阻也擋不住我的腳步。本周六如不下雨，我一定來找你！”這個女孩子能相信這個男青年的誓言嗎？“我會愛你一生一世”這句話，太容易說了。因此，這樣的承諾，難以置信。那么，如何才可以讓你對她的愛是可以置信的？為了表明你的心跡

31、，你需要付出代價。而且代價越沉重，才能表明你越愛她。不過，這代價并不一定是金錢，因為金錢對于某些人來說也是廉價的。一個百萬富翁為一個女孩子一擲千金，為另一個女孩子則不惜生意代價付出大量時間來陪伴她，你說他更愛哪一個女孩子呢？在高度情感化的領(lǐng)域，人們的博弈依然充滿了理性。為什么婚前要送昂貴的彩禮？為什么要舉行高檔的婚宴？過去，人們習(xí)慣于批評這是講排場，面子風(fēng) 光。而在博弈論看來，這是一種承諾行動。昂貴的彩禮和高檔的婚宴一方面表明了愿意為對方做出犧牲，另一方面實際上也是向外界傳遞了他們把這段感情看得有多重的信號，而排斥了潛在的婚姻競爭者，從而限制了自己的選擇以承諾對愛情的忠貞。或者

32、可以這樣理解，男青年高額下聘，實際上使得其財富減少不可能再去找另外一個婚姻對象，這就是典型的承諾行動了?？赡苡行┤藭毁澩@樣的看法，但是如果我們把婚姻看做是婚姻市場上交易的產(chǎn)品，那么下聘禮與其他產(chǎn)品市場交易中的交納訂金或抵押物在本質(zhì)上其實并無不同，都是承諾而已。同樣的道理，為什么戀人會樂于把彼此介紹給自己的父母親朋？這也是一種承諾。一個人將戀人介紹給自己的父母親朋時，實際上就對自己再選擇其他的婚戀對象做出了限制。這樣的一種放棄潛在婚戀機(jī)會的做法是向?qū)Ψ阶龀隽艘环N感情上的承諾。的確，如果你談了很久的戀人一直拒絕讓你進(jìn)入他的家人和朋友圈子，這只能說明他的感情仍處在游弋不定之中。2、

33、商業(yè)中的承諾商業(yè)界的承諾更多。剛才講到的訂金、抵押物都是常見的承諾行動。先發(fā)制人使市場達(dá)到飽和也是一種承諾行動。為了防止競爭者的進(jìn)入，在位的企業(yè)可以通過過度的投資和生產(chǎn)來占據(jù)市場，盡管這會使得其利潤下降，但是比競爭者進(jìn) 入的狀況要好，那么企業(yè)就可能采取提前使市場飽和的策略來阻止競爭者進(jìn)入。生產(chǎn)耐用消費品的企業(yè)常常推出最惠條款，這也是一種承諾。耐用消費品因其使用時限較長，生產(chǎn)耐用品的企業(yè)會經(jīng)常被“降價預(yù)期”所困擾：如果消費者預(yù)期企業(yè)將降價，他們便會等待，結(jié)果，企業(yè)只能降價。比如國內(nèi)汽車行業(yè)，入世之后大家認(rèn)為汽車必然降價，結(jié)果就持幣待購，汽車就真的只有降價（當(dāng)然，這里只是說汽車價格受到

34、了價格預(yù)期的影響，并不是說降價完全來自預(yù)期。汽車價格下降原因并不止此）。而最惠條款則可以起到承諾的作用：企業(yè)不會降價了。企業(yè)的所有權(quán)也是一種承諾。大家都知道，企業(yè)實際上是資本與勞動締結(jié)的合約。但是為什么企業(yè)中是資本雇用勞動而不是勞動雇用資本呢？一種可行的解釋在于，資本所有者的承諾比勞動力所有者的承諾更值得信賴，更不易采取機(jī)會主義行為。如果非人力資本所有者不能兌現(xiàn)自己的承諾，其他人可以將他的資本拿走，甚至以毀滅相威脅。對比之下，如果人力資本所有者違約，其他人對他實在沒有什么好辦法。常言道“跑得了和尚跑不了廟”，沒廟的和尚誰能信任？而資本所有者投入資本就是修建了一座廟，以此承諾獲取

35、信任。3、聲譽與承諾前面我們一直在表達(dá)一種觀點：僅僅留于口頭的承諾是非常廉價的。現(xiàn)實中卻有一些困境一一沒有什么其他的行動可以使其承諾變得堅實，即使其承諾變得堅實的成本很高。這個時候，建立聲譽將是增強(qiáng)其承諾可信性的好手段。比如綁架事件中，綁匪和人質(zhì)家屬之間的博弈是非常微妙的：綁匪要求拿到贖金才愿意釋放人質(zhì)；對于家屬來說，如果給出贖金能換回人質(zhì)的話是不錯的結(jié) 果，但問題是，家屬如何能相信綁匪拿到贖金后就會釋放人質(zhì)呢？要知道，綁匪們可都是鋌而走險之輩，他們也完全可以在拿到贖金后將人質(zhì)干掉，讓人質(zhì)家屬人財兩空。因此，綁匪們說見錢放人的承諾是很廉價的，難以讓人們產(chǎn)生足夠的信任。既然家屬不相信

36、綁匪，那么是不是可以倒過來解決問題呢？比如，綁匪先釋放人質(zhì)，然后家屬按照承諾將贖金交給綁匪。聰明的你其實馬上也會意識到，家屬支付贖金的口頭承諾是廉價的，綁匪們也不會幼稚得相信人質(zhì)家屬，因為人質(zhì) 家屬在取回人質(zhì)后完全可以不支付贖金，反而報警對付綁匪。正因為綁匪和家屬之間的信任是那么的脆弱，因此撕票的事情在現(xiàn)實中也確實有所發(fā)生。那么如何避免呢？在現(xiàn)實中，職業(yè)綁匪將有動力樹立起遵守諾言的“聲譽”。他們通過這樣的方式告訴人質(zhì)家屬，只要你付錢，我就一定會放人。所以經(jīng)常出現(xiàn)的情況是，一旦遭遇職業(yè)綁匪，家屬將愿意先交錢然后綁匪也會放人。撕票的事件其實常常發(fā) 生于那些非職業(yè)綁匪的身上。這其中的原因，

37、僅僅是因為職業(yè)綁匪要長期從事這個有“錢”圖的職業(yè)，所以他們更看重“江湖規(guī)矩，一諾千金”。用綁匪來討論博弈論，可能會令人不快。但是，現(xiàn)實就是如此，比如一些公司企業(yè)，實際上也就像一個個的綁匪，他們把持在手中的“人質(zhì)”是產(chǎn)品質(zhì)量。消費者好比人質(zhì)的家屬，他們付出錢去買一件產(chǎn)品，但是購買的時候并不知道產(chǎn) 品質(zhì)量的高低（人質(zhì)的死活）。于是理性的消費者會去選擇那些類似于職業(yè)綁匪的公司（有些公司花巨額的金錢宣傳自己的商標(biāo)，實際上就是告訴消費者自己是一個“職業(yè)綁匪”）并跟他們交易，因為這些公司希望從長期的聲譽中獲取好處，它們將不愿意為了目前的一點蠅頭小利而砸掉自己的招牌。 5-43報復(fù)的作用1、報復(fù)

38、能力的重要性故事模型謝林在沖突的戰(zhàn)略中曾提到一個竊賊的故事：一天，一個持槍的竊賊潛入一所房子行竊，房主聽到樓下的響動之后，同樣持槍一步步向樓下走來。于是，危機(jī)和沖突發(fā)生了。不排除一種可能結(jié)果是竊賊成功逃逸，雙方均沒有傷亡和財產(chǎn)損失。但是，也有可能出現(xiàn)這樣的結(jié)果：主人擔(dān)心竊賊會先開搶而率先向竊賊射擊，致使竊賊身亡；另一種可能的結(jié)果是，竊賊擔(dān)心主人會開槍射擊，而首先射殺主人。但是，還有一種通常的形勢是雙方拔槍對峙，互相探測著對方的意圖，誰也沒有先開槍。畢竟，主人只是想趕走竊賊而不是要其性命，只要他相信竊賊不會對他下毒手，那么他就沒有必要把竊賊推上絕路一一要知道，竊賊的行為正好是跟

39、他對主人的意圖判斷聯(lián)系在一起的：如果他發(fā)現(xiàn)主人試圖置其于死地，那么他就會嘗試先置主人于死地；而如果他發(fā)現(xiàn)主人僅僅是想趕走他，那么他一般就并不會想射殺主人，畢竟盜竊未遂的罪名比殺人搶劫罪名要輕得多，何況他可以安全離開呢。即便主人想要竊賊的性命，那么他也必須對自己的槍法充滿自信（確信可以一槍打死竊賊），他才可能表示出射殺竊賊的意圖，否則一旦他表示出這種意圖（即先開槍），那么竊賊也有機(jī)會對主人進(jìn)行報復(fù)性射殺。同樣的邏輯推理過程也適用于竊賊。在這樣的對峙中，除非一方確有把握一招制敵，否則誰也不想先動一一沒有一個人先動，那么危機(jī)就不會升級，這對雙方都是相對較好的結(jié)果。任何一方都很清楚，一

40、旦自己先動而又未能一招制敵，那么隨即就會遭到對方的瘋狂反撲，危機(jī)就此升級。此時不管誰勝誰負(fù)，結(jié)果其實都比大家不動的狀態(tài)要糟糕。在這樣的拔槍對峙中，對槍法自信的一方率先開槍的可能性的確是有的，但這對其本人來說實際上增加了危險，因為對方可能也會因為擔(dān)心他會開槍而率先開槍。相比較而言，如果雙方只是手中持刀，那么對峙就更容易形成，因為誰都明白自己難以一刀令對方斃命，只要一方先揮刀，那么結(jié)果就是雙方都會受傷。還不如在對峙下逐漸緩和，而竊賊慢慢退向門外并逃逸。在這個例子中，對峙的危機(jī)常常并不會演化成血案，原因在于每個局中人都知道對方具有報復(fù)能力，從而誰也不愿去加劇危機(jī)。正因為如此，所以謝林認(rèn)為

41、，在博弈中，報復(fù)能力常常比攻擊能力更重要。因為報復(fù)能力所形成的震懾往往約束了局中人，使其不會去采取攻擊行為來惡化對峙危機(jī)。比如，在幼兒園中，力氣大的小朋友可能會欺負(fù)力氣小的小朋友，但是，如果力氣小的小朋友有一個能力更大的哥哥會在他受欺負(fù)時出來為他出頭，那么力氣大的小朋友實際上就不會去欺負(fù)力氣小的小朋友，因為他知道這樣做無異于找揍。在影視作品中經(jīng)常可以看到借助于報復(fù)能力來增加談判籌碼的情況。比如兩個人，其中叫張三的人掌握著叫李四的人的某些不可告人的秘密證據(jù)，足以令李四終身入獄。然后張三提出一筆交易，若李四給他100萬，他就會銷毀證據(jù)。然而李四在約見張三時常常會設(shè)下圈套，試圖殺人滅口。電影中常見的

人人文庫> 全部分類> 圖紙下載 > 畢業(yè)設(shè)計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈樹與逆向歸納法1

文檔簡介

溫馨提示

最新文檔

評論

博弈樹與逆向歸納法1

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔