博弈與策略思維

上傳人：1*** IP屬地：廣東上傳時(shí)間：2023-10-29 格式：DOCX 頁(yè)數(shù)：5 大?。?3.91KB 積分：12 舉報(bào) 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈與策略思維

正如“游戲”一詞最初指的是，人們?cè)谟螒蛑袘?yīng)該遵循一定的規(guī)則，并根據(jù)自己的行為來(lái)獲勝。這個(gè)過(guò)程涉及到理性參與者在博弈如何合理地選擇策略,因此從一個(gè)更廣泛的角度出發(fā),我們不僅可以用形式化的語(yǔ)言、復(fù)雜的公式推導(dǎo)以及精致的報(bào)償結(jié)構(gòu)來(lái)描述博弈中的策略均衡,還可以通過(guò)分析參與者在博弈過(guò)程中的思考機(jī)制來(lái)研究各類(lèi)博弈問(wèn)題,也就是說(shuō)將復(fù)雜的博弈論轉(zhuǎn)化為策略思維(ThinkingStrategically)的方式。一、游戲中的博弈思想其實(shí),博弈論原本就誕生于一些古老的思維游戲或者對(duì)策思想,我們熟悉的《孫子兵法》《三十六計(jì)》《六韜》等書(shū)籍中就充滿(mǎn)了博弈論的思維。“凡用兵之法,全國(guó)為上,破國(guó)次之;全軍為上,破軍次之……不戰(zhàn)而屈人之兵,善之善者也?！痹缭?000多年前,孫子已經(jīng)提出了在國(guó)家利益沖突中,最佳的策略不是消滅對(duì)方,而是避免兩敗俱傷的局面,以求長(zhǎng)治久安。此外,其他文明中也有關(guān)于博弈思想的記載,例如印度梵文史詩(shī)《摩訶婆羅多》里就有關(guān)于骰子游戲的記錄,《圣經(jīng)》中對(duì)這類(lèi)游戲也有述及。因文化的影響,西方對(duì)賭博并不排斥,許多著名的科學(xué)家、大學(xué)教授———如開(kāi)普勒、伽利略、惠更斯等人都熟悉這些游戲。而西方知識(shí)分子對(duì)賭博游戲的參與使得博弈問(wèn)題成為了他們科學(xué)研究的對(duì)象。近代西方由此出現(xiàn)了賭博數(shù)學(xué),并沿此線(xiàn)路開(kāi)創(chuàng)了概率論,這一理論正是不完全信息博弈理論的基礎(chǔ)。此類(lèi)對(duì)策思維最初主要用來(lái)研究象棋、橋牌、賭博中的勝負(fù)問(wèn)題,人們對(duì)博弈局勢(shì)的把握也只停留在經(jīng)驗(yàn)上,沒(méi)有向理論化發(fā)展。近代對(duì)于博弈論策略思維的科學(xué)化研究,始于策墨洛(Zermelo)、波雷爾(Borel)及馮·諾依曼(Von.Neumann),并不斷取得重大進(jìn)展。今天,經(jīng)濟(jì)學(xué)中許多領(lǐng)域乃至某些經(jīng)濟(jì)理論本身都受到博弈論的巨大影響。同時(shí),人們還運(yùn)用博弈論來(lái)抽象地分析利益沖突問(wèn)題(P4),因此將其應(yīng)用到了國(guó)際關(guān)系、政治學(xué)、軍事戰(zhàn)略等學(xué)科中。一般而言,博弈論的研究側(cè)重于公式化了的激勵(lì)結(jié)構(gòu)間的相互作用,人們運(yùn)用博弈論分析游戲中“弈者”的預(yù)測(cè)行為和實(shí)際行為,并研究它們的策略?xún)?yōu)化(P4-6)。策略思維則是博弈各方在平等的對(duì)局中各自根據(jù)對(duì)方的策略來(lái)變換自己的應(yīng)對(duì)策略、以達(dá)到最后取勝目的的理論。相對(duì)于博弈論,策略思維更加傾向于對(duì)博弈思想的運(yùn)用。在研究國(guó)家外交決策過(guò)程中,策略思維能成為一個(gè)合適的理論框架,這源于如下一個(gè)基本事實(shí):在國(guó)家間行為中,決策者或行為體要作出選擇,但是,這些選擇是否能夠?qū)崿F(xiàn)其預(yù)定的目標(biāo),經(jīng)常依賴(lài)于其他行為體如何做選擇,為此,每個(gè)行為體在作出自身的選擇時(shí)必須把其他行為體的行為考慮在內(nèi)(P93-100)。二、博弈中的策略思維在國(guó)際關(guān)系中,國(guó)家行為體的互動(dòng)往往表現(xiàn)為具有明確目的的對(duì)外政策,政策的制定則是從公認(rèn)的、數(shù)量有限且尚存質(zhì)疑的方案中挑選出導(dǎo)致國(guó)家未來(lái)某種特定狀況的方案的過(guò)程?，F(xiàn)實(shí)主義認(rèn)為這種選取過(guò)程應(yīng)該符合理性選擇模式(RationalChoiceModel),出發(fā)點(diǎn)是國(guó)家中心學(xué)說(shuō)以及國(guó)家利益、自助和無(wú)政府狀態(tài)等觀(guān)念。按照理性選擇模式理論,外交決策都是目標(biāo)明確且十分理智的一些人深思熟慮的結(jié)果,他們系統(tǒng)分析各種可能的政策選擇以實(shí)現(xiàn)國(guó)家的目的(P14-19)。理論上,決策者應(yīng)該考慮在邏輯上成立的所有可能選擇,但在實(shí)踐中,即使是最有智慧的人,他能處理的變量數(shù)目也是有限的。因此在決策中,決策者常常只能處理幾種主觀(guān)上最有可能的選擇并且需要將復(fù)雜問(wèn)題簡(jiǎn)單化以適應(yīng)實(shí)際的決策行為。就算如此,決策者在決策時(shí)也容易忽視對(duì)方的選擇和偏好。而博弈論中的策略思維是對(duì)參與人互動(dòng)規(guī)律的研究,其假設(shè)自利的參與人為理性行為者,在給定的規(guī)則下,他們以預(yù)測(cè)他人行動(dòng)為前提,對(duì)自己的多種行動(dòng)可能獲得的結(jié)果進(jìn)行得失比較,進(jìn)而決定采取何種行動(dòng)、何時(shí)行動(dòng)的策略(P161-164)。運(yùn)用策略思維來(lái)分析和制定外交決策,將強(qiáng)迫決策者考慮對(duì)方的選擇,使決策者的思維更加全面。策略思維用一組假設(shè)在邏輯上將各種選擇聯(lián)系在一起,進(jìn)而通過(guò)邏輯推理的方法預(yù)測(cè)政策結(jié)果,因此從某種意義上講,策略思維就是一種對(duì)思維過(guò)程的科學(xué)化和邏輯化。以博弈論和現(xiàn)實(shí)主義為思想基礎(chǔ)的理性選擇模式被國(guó)際關(guān)系學(xué)界視為研究外交政策的主流理論,影響頗大。但在實(shí)踐中,決策者的理性思維總是被許多因素限制著,可能并不了解實(shí)現(xiàn)目標(biāo)的最佳策略是什么。據(jù)此,郝伯特·西蒙提出了“有限理性”(BoundedRationality)理論,他認(rèn)為人的認(rèn)識(shí)是“意欲合理,但只能有限地做到”,人的理性在不能無(wú)所不知的前提下將是有限的(P3)。在博弈分析中,理性局限是一個(gè)無(wú)法回避的問(wèn)題,不承認(rèn)這個(gè)事實(shí),不討論其對(duì)博弈結(jié)果的影響,策略思維的發(fā)展會(huì)不可避免地遇到各種矛盾和困難,也就很難對(duì)國(guó)際關(guān)系現(xiàn)象作出令人信服的解釋和預(yù)測(cè)。對(duì)此,博弈學(xué)習(xí)理論(TheTheoryofLearninginGames)應(yīng)運(yùn)而生。博弈學(xué)習(xí)理論認(rèn)為,人類(lèi)具有學(xué)習(xí)的能力,通過(guò)學(xué)習(xí)可以使博弈參與人修正其非理性行為,從而取得更好的結(jié)果。在博弈學(xué)習(xí)理論看來(lái),均衡是“并非完全理性的局中人隨著時(shí)間推移尋求最優(yōu)化這一過(guò)程的長(zhǎng)期結(jié)果”(P177),這也就意味著博弈方之間的策略均衡往往是學(xué)習(xí)調(diào)整的結(jié)果而不是一次性選擇的結(jié)果,并且即使達(dá)成的均衡也可能出現(xiàn)再次偏離。其中,“學(xué)習(xí)模型”(LearningModel)體現(xiàn)了參與人的行為隨著博弈的進(jìn)行而調(diào)整的過(guò)程;“進(jìn)化模型”(Evolvtionary)則反映了大量參與人的行為在重復(fù)博弈中會(huì)因?yàn)閷W(xué)習(xí)規(guī)則而在整體上會(huì)呈現(xiàn)“優(yōu)勝劣汰”的規(guī)律。由于存在這兩個(gè)機(jī)制,有限理性的決策者就可以在不斷學(xué)習(xí)進(jìn)步的過(guò)程中逐步達(dá)到理性。當(dāng)然,要求所有類(lèi)型的參與人根據(jù)過(guò)去的觀(guān)察和資料積累,從而準(zhǔn)確地判斷分析并正確地調(diào)整策略并非易事。此時(shí),國(guó)家作為行為主體則具有理性程度高的特征,學(xué)習(xí)速度也會(huì)較快?！皩W(xué)習(xí)”和“進(jìn)化”機(jī)制的引進(jìn)可以完善策略思維對(duì)國(guó)家非理性行為的解釋和分析,從而進(jìn)一步推動(dòng)外交決策的發(fā)展。三、“統(tǒng)一朝鮮”行動(dòng)失敗失敗任何游戲(Game)均具有一定的規(guī)則和技巧,這些規(guī)則和技巧共同構(gòu)成了策略思維的基本法則。想要在博弈游戲中獲勝,國(guó)家就需要考慮如何運(yùn)用策略思維將這些法則最大限度的加以發(fā)揮。策略法則一:尋找博弈的均衡。均衡是策略思維中的重要概念。在托馬斯·謝林看來(lái),均衡可以理解為博弈參與人互相預(yù)期對(duì)方最可能采取什么策略的“聚焦點(diǎn)”(afocalpoint),一種雙方基于共同經(jīng)驗(yàn)、文化或認(rèn)知的默契。均衡是一個(gè)穩(wěn)定的博弈結(jié)果,是所有參與人最優(yōu)策略或行動(dòng)的組合,因此是可以預(yù)測(cè)的。策略思維的核心則是通過(guò)邏輯推理尋找各博弈方合理的策略選擇,以此判斷均衡結(jié)果,其中納什均衡是各方對(duì)博弈結(jié)果的一致性預(yù)測(cè)。一國(guó)在特定情境下具有哪些可選的對(duì)外政策以及這些政策能夠達(dá)到什么效果,這是國(guó)家戰(zhàn)略分析最根本的問(wèn)題之一。一方面,通過(guò)尋找博弈的均衡,可以推測(cè)出國(guó)家行為體間可能的內(nèi)生性行為、理解對(duì)方利益所在以及該政策的限度;另一方面,納什均衡又廣泛存在于世界政治體系中,各國(guó)不得不面對(duì)相互制衡的地緣困境,在他人不改變策略情況下只能維持現(xiàn)有最優(yōu)策略。二戰(zhàn)后,美蘇兩國(guó)在朝鮮半島上形成了比較穩(wěn)定的均衡勢(shì)態(tài):以“三八線(xiàn)”為界,雙方各占一半。這種結(jié)果一定程度上既滿(mǎn)足了蘇聯(lián)獲取遠(yuǎn)東出海口的利益需求,又使美國(guó)推進(jìn)了遏制共產(chǎn)主義的前沿陣地,同時(shí)中國(guó)也能夠避免東北成為冷戰(zhàn)對(duì)抗的最前線(xiàn),可以說(shuō)是當(dāng)時(shí)各方的最佳策略。但1950年6月25日,在蘇聯(lián)的支持下,金日成發(fā)動(dòng)了一場(chǎng)規(guī)模浩大的軍事行動(dòng),意圖統(tǒng)一朝鮮。無(wú)疑,這是美國(guó)人不能容忍的。于是在聯(lián)合國(guó)的名義下,美國(guó)集結(jié)英、法等15國(guó)聯(lián)軍,加入了朝鮮半島的激烈沖突中。然而到1950年10月4日,聯(lián)軍在占領(lǐng)漢城之后,毅然越過(guò)三八線(xiàn),大舉向北進(jìn)攻,同樣試圖統(tǒng)一朝鮮全境。此時(shí),東北三省是中國(guó)最重要的經(jīng)濟(jì)命脈所在地,如果美國(guó)將戰(zhàn)略前沿推到鴨綠江,就等于把中國(guó)七成以上的工業(yè)設(shè)施置于美國(guó)的炮口之下,顯然,中國(guó)不能坐視不理。因此,時(shí)隔半個(gè)月后,中國(guó)軍隊(duì)也跨過(guò)鴨綠江入朝作戰(zhàn)。中國(guó)的“抗美援朝”始于鴨綠江,終于“三八線(xiàn)”,其實(shí)這也是志愿軍后勤補(bǔ)給線(xiàn)能夠延伸的極限,是當(dāng)時(shí)條件下,中國(guó)能夠在朝鮮半島取得的最大限度的勝利。從策略思維的角度來(lái)分析,“統(tǒng)一朝鮮”行動(dòng)失敗的原因在于這個(gè)結(jié)果不是參與各國(guó)能夠接受的均衡解,而各方力量取得平衡的地點(diǎn)就位于北緯38°線(xiàn)附近,即各國(guó)心中能夠接受的“聚焦點(diǎn)”(P164-170)。當(dāng)我們從納什均衡的規(guī)則出發(fā)考察國(guó)家間策略互動(dòng)時(shí),可以發(fā)現(xiàn)對(duì)某個(gè)國(guó)家擴(kuò)張的承認(rèn)與否并不是一種簡(jiǎn)單的、自動(dòng)的行為,而是一種受到牽制、互動(dòng)的行為。博弈意義上的各國(guó)對(duì)某國(guó)占領(lǐng)行徑的默許,實(shí)際上要求的是達(dá)到一個(gè)大國(guó)間的納什均衡,使每個(gè)國(guó)家都沒(méi)有偏離均衡策略組合的動(dòng)機(jī)和能力。而依靠單方力量企圖改變這種地緣格局的做法,也很難取得成功。策略法則二:建立自己的優(yōu)勢(shì)報(bào)償結(jié)構(gòu)。在國(guó)際關(guān)系中,結(jié)構(gòu)可以有兩種不同的使用:在一種情況下,結(jié)構(gòu)表示的是一個(gè)本體的概念,即一個(gè)實(shí)存的對(duì)象、一個(gè)存在的實(shí)體;在另一種情況下,結(jié)構(gòu)代表的是一個(gè)認(rèn)識(shí)工具,人們用它來(lái)感知和分析現(xiàn)實(shí)世界中的現(xiàn)象。博弈論中一般不直接涉及到國(guó)際結(jié)構(gòu)問(wèn)題,其關(guān)注點(diǎn)在于行為體面臨的報(bào)償結(jié)構(gòu)(利益結(jié)構(gòu))以及由此形成的均衡狀態(tài)。但是,如果國(guó)際結(jié)構(gòu)是通過(guò)行為體的互動(dòng)來(lái)形成的,那么策略思維的視角對(duì)于理解和利用國(guó)際結(jié)構(gòu),甚至是建構(gòu)有利于己的博弈規(guī)則就是非常有益的。從眾多博弈模型中不難發(fā)現(xiàn),模型的報(bào)償結(jié)構(gòu)直接影響博弈參與人的行動(dòng)選擇和結(jié)果。國(guó)家制定對(duì)外政策時(shí),由于處于國(guó)際結(jié)構(gòu)的不同位置中,因而常常面臨不得已的抉擇。具有結(jié)構(gòu)優(yōu)勢(shì)的國(guó)家往往能夠占據(jù)博弈的主導(dǎo)權(quán),迫使對(duì)方作出符合自身利益的決策。因此,通過(guò)建立自己的優(yōu)勢(shì)結(jié)構(gòu),可以使自己處于外交決策中的優(yōu)勢(shì)地位,對(duì)保障和拓展國(guó)家利益具有重要作用。也就是說(shuō)無(wú)論對(duì)手采取什么策略,優(yōu)勢(shì)的參與者都能使自己獲得比采取任何其他策略更好的報(bào)償結(jié)果。然而一旦處在某個(gè)劣勢(shì)結(jié)果中,國(guó)家行為體并不是無(wú)所作為的,通過(guò)改變自身的支付水平,有時(shí)也能夠迫使對(duì)方改變策略,提高自己的最終的報(bào)償結(jié)果。例如下列這種情況:博弈參與人通過(guò)改變自己的支付,可以形成有利于己的報(bào)償結(jié)構(gòu),在博弈中爭(zhēng)取到優(yōu)勢(shì)地位。在國(guó)際關(guān)系中,一國(guó)體選擇空間的縮小或信息質(zhì)量的下降(客觀(guān)上造成自身支付降低)或是有意識(shí)地降低自身的支付并不一定是件壞事,在某些情況下反而可能使其受益。這與“破釜沉舟”具有類(lèi)似的道理。在國(guó)際雙邊談判中,有時(shí)候通過(guò)有意識(shí)地將談判空間縮小到對(duì)自己最有利的位置,建立自己的優(yōu)勢(shì)報(bào)償結(jié)構(gòu),反而可以爭(zhēng)取到談判中的主動(dòng)權(quán)。策略法則三:分辨不可置信的威脅。如果策略思維分析的目的在于預(yù)測(cè)博弈中參與人的行為和最終結(jié)果,那么納什均衡多重性的問(wèn)題卻可能導(dǎo)致結(jié)果的不準(zhǔn)確。在靜態(tài)博弈的策略思維中,求解納什均衡的邏輯是參與人在假定其他人的戰(zhàn)略選擇是給定的情況下選擇自己的策略,也就是說(shuō),參與人并不考慮自己的選擇對(duì)其他人選擇的影響。為此,策略思維還需要引入澤爾騰(Selten)“子博弈精煉納什均衡”的概念,即組成精煉納什均衡的戰(zhàn)略必須在每一個(gè)子博弈中都是最優(yōu)的,只有那些不包含不可置信威脅的納什均衡才是精煉納什均衡(P96)。通過(guò)引入這一概念,策略思維將在動(dòng)態(tài)博弈中使可置信的納什均衡與不可置信的分開(kāi),以提高預(yù)測(cè)的準(zhǔn)確性。以朝鮮核試驗(yàn)問(wèn)題為例(暫且不論其他更加深層次的原因),朝美兩國(guó)之間歷次關(guān)于核試驗(yàn)、六方會(huì)談以及對(duì)朝援助方面至少構(gòu)成了如下一個(gè)博弈局面,如圖1。在該博弈情景中,朝鮮占據(jù)了行動(dòng)的主動(dòng)權(quán),具有2個(gè)主要的策略選擇,即選擇以六方會(huì)談為主體的和平談判方式或者以核試驗(yàn)威脅為主的激烈方式來(lái)獲取更多的國(guó)家利益。對(duì)此,美國(guó)也面臨2個(gè)可選的主要策略:通過(guò)制裁等強(qiáng)硬的手段作為回應(yīng)和通過(guò)援助緩解朝鮮半島的緊張局勢(shì)。這是一個(gè)簡(jiǎn)化的二階段完全信息動(dòng)態(tài)模型,括號(hào)內(nèi)表述了朝美兩方從博弈中可能得到的支付,實(shí)際的朝美核博弈當(dāng)然比這更加復(fù)雜,筆者構(gòu)建此模型主要為了說(shuō)明以策略思維分辨不可置信威脅的原理(P73-75)。這個(gè)博弈有一個(gè)純策略納什均衡(核試驗(yàn),援助),朝鮮將贏得2個(gè)單位的支付而美國(guó)贏得1單位支付。這個(gè)均衡是“子博弈完美”的,因?yàn)槊绹?guó)在第二階段的子博弈中,援助才是其利益最大化的策略。再看博弈的另一個(gè)納什均衡(六方會(huì)談,制裁),此時(shí)朝鮮可以得到1單位支付而美國(guó)贏得5單位支付,很明顯,美國(guó)偏好這個(gè)均衡。然而,當(dāng)美國(guó)想方設(shè)法威脅朝鮮自己決意選制裁時(shí),在朝鮮看來(lái),一個(gè)理性的美國(guó)在博弈到達(dá)第二階段時(shí)最終會(huì)選擇援助。因而,均衡(六方會(huì)談,制裁)是不可置信的,子博弈精煉納什均衡(核試驗(yàn),援助)才是朝鮮預(yù)測(cè)的最終結(jié)果。也正是如此,朝鮮才能一再利用核試驗(yàn)問(wèn)題要挾美國(guó)。不可置信的威脅還引出了策略思維中另一個(gè)重要概念,即“承諾行動(dòng)”(Committment)。承諾行動(dòng)是某個(gè)國(guó)家使自己的威脅戰(zhàn)略變得可置信的行動(dòng),一種威脅只有在該國(guó)家若不施行這種威脅就會(huì)遭受更大的損失的時(shí)候才是可置信的。所以說(shuō),承諾行動(dòng)意味著這個(gè)國(guó)家要為自己的“失信”付出成本,盡管這種成本并不一定真的發(fā)生。承諾行動(dòng)會(huì)給博弈中的國(guó)際行為體帶來(lái)很大的好處,因?yàn)橹眯诺耐{將改變博弈的均衡結(jié)果。國(guó)際關(guān)系學(xué)者詹姆斯·費(fèi)倫(JamesFearon)據(jù)此提出了一個(gè)將昂貴信號(hào)方法應(yīng)用于威懾理論的信號(hào)博弈模型,他推測(cè)民主國(guó)家的領(lǐng)導(dǎo)人在危機(jī)中更能發(fā)出可信威脅,因?yàn)槊裰鲊?guó)

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈與策略思維

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

博弈與策略思維

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔