博弈模型.ppt

上傳人：m*** IP屬地：河南上傳時(shí)間：2020-09-11 格式：PPT 頁數(shù)：136 大?。?.23MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩131頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、博弈模型,第一部分、博弈論基本概念,宇宙間處處存在矛盾、沖突、爭斗、合作、共生等現(xiàn)象，這些現(xiàn)象很很早就引起各類學(xué)者的重視。哲學(xué)家們對(duì)此作過深刻討論，毛澤東的矛盾論便是其中的代表。另一方面，數(shù)學(xué)被認(rèn)為是科學(xué)的語言，能否用數(shù)學(xué)語言描述各種帶有矛盾因素的模型或現(xiàn)象？博弈論便是這樣一種處理各類帶有矛盾因素的模型的數(shù)學(xué)工具，現(xiàn)在已被數(shù)學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、軍事學(xué)、生物學(xué)等專家廣泛應(yīng)用于討論各類帶有沖突、矛盾、合作、競爭、進(jìn)化等問題及相關(guān)模型之中。博弈論已成為人們分析復(fù)雜系統(tǒng)與作重大決策時(shí)的有力工具。,一、引言,數(shù)學(xué)歷史悠久，并且不斷發(fā)展前進(jìn)，被稱為“科學(xué)的語言”。在20世紀(jì)前，它最有效的應(yīng)用范圍是天文、物

2、理、力學(xué)等所謂精確的自然科學(xué)。由于概率論與統(tǒng)計(jì)理論的發(fā)展，數(shù)學(xué)又逐漸應(yīng)用于生物學(xué)與社會(huì)科學(xué)，而分析矛盾現(xiàn)象的數(shù)學(xué)方法和理論也是在這一背景下于20世紀(jì)初開始萌芽并逐步發(fā)展起來的，這個(gè)數(shù)學(xué)分枝稱為博弈論（Game Theory）。,數(shù)學(xué)研究的方法是從大量的同類現(xiàn)象中抽象出基本要素，進(jìn)步構(gòu)造出能描述這類現(xiàn)象的模型。許多沖突模型在游戲中就存在，博弈論早期就是由研究國際象棋開始的，所以被命名為Game Theory。人們很快認(rèn)識(shí)到此種理論可用于經(jīng)濟(jì)、政治、軍事等領(lǐng)域，所謂“世事紛爭一棋局”，正說明其中一些道理。1944年馮諾曼（John，Von Neumann）和奧摩根斯特恩（Osker Morgent

3、ern）合著的競賽論與經(jīng)濟(jì)行為（Theory Of GSmes and Economic Behavior）問世，總結(jié)了初期研究成果，奠定了博弈論的基礎(chǔ)。由于該理論主要討論在復(fù)雜的矛盾沖突等活動(dòng)中，局中人（Player）采取何種合理的策略（strategy）而能處于“優(yōu)越”的地位，以便取得較好效益，所以將它譯為博弈論。,博弈論（Game theory）可以被定義為是對(duì)智能的理性決策者之間沖突與合作的數(shù)學(xué)模型的研究。博弈論為分析那些涉及兩個(gè)或更多個(gè)參與者且其決策會(huì)影響相互間的福利的局勢提供了一般的數(shù)學(xué)方法。就此而論，博弈論便為社會(huì)科學(xué)各分支的學(xué)者和實(shí)際的決策者提供了非常重要的視角。博奕理論家所研

4、究的局勢，不僅僅是“游戲(Game)”一詞所不幸表示的消遣活動(dòng)，“沖突分析”或“相互影響的決策理論”或許是描述博弈論更為準(zhǔn)確的術(shù)語。,博弈理論家力圖通過研究定量模型和假設(shè)例子來理解沖突與合作。這些例子可能在很多方面都是脫離現(xiàn)實(shí)的簡化，但與實(shí)際生活中大量更為復(fù)雜的情況相比，這種簡化能使我們更容易看出沖突與合作的一些基本問題。當(dāng)然，這也是任何一個(gè)研究領(lǐng)域都應(yīng)用的分析方法把問題放在忽略掉現(xiàn)實(shí)中不重要的細(xì)枝末節(jié)的一個(gè)簡化模型中加以考慮。因此，即使從未遇到像博弈理論家在研究中明確規(guī)定局中人立場的局勢，研究過這些假設(shè)例子的人們，仍然能夠較好地理解實(shí)際的競爭局勢。,常見的游戲如棋類，兩人對(duì)奕，此兩人便稱為局

5、中人，他們各有一套棋路，或善于用馬，或長于用炮。在每次輪到一方走子時(shí)，他可能有許多走法，這些走法依賴于當(dāng)時(shí)棋局形勢以及棋手想要達(dá)到的目的，以及他慣用的走法，從而形成他走棋的指導(dǎo)思想。對(duì)奕時(shí)指導(dǎo)棋手行動(dòng)的思想便稱為策略。對(duì)局終了可能有三種結(jié)局：甲勝；乙勝；和局。如果用數(shù)量表示各種結(jié)局，例如勝家贏得彩金若干（設(shè)所得彩金由輸家付給，則輸家當(dāng)然失去若干），和局時(shí)都不能取得彩金，此種表示結(jié)局的數(shù)稱為支付（payoff）。局中人、策略、支付是博弈論中常見的基本概念。,有些游戲中并無“機(jī)會(huì)”（chance）因素，而是全憑局中人的技藝。但某些游戲如“橋牌”、“打百分”等，“機(jī)會(huì)”卻有較大作用，分發(fā)到游戲者手中

6、的牌是隨機(jī)的，它們情況要復(fù)雜一些。,游戲并非只有雙方，可以有多方，如三人玩的跳棋便有三個(gè)局中人。一般只有兩個(gè)局中人的稱為兩人博奕（或二人對(duì)策），有二個(gè)局中人的稱為n人博弈。,在博弈論的語言中，一個(gè)博弈（game）指的是涉及到兩個(gè)或更多個(gè)參與人的某個(gè)社會(huì)局勢。博弈所涉及的參與人被稱為局中人（players）。正如前面博弈論的定義所述，博弈理論家一般要對(duì)局中人做兩個(gè)基本的假設(shè)：他們都是理性的和他們都是智能的。這兩個(gè)形容詞在這里都是技術(shù)性術(shù)語，所以需要對(duì)其逐一解釋。,如果一個(gè)決策者在追逐其目標(biāo)時(shí)能前后一致地做決策，我們就稱他是理性的（rational）。在基于決策理論的基本結(jié)論而建立起來的博弈論中，

7、我們假設(shè)每個(gè)局中人的目標(biāo)是追求其個(gè)人期望支付值的最大化，支付則是用某個(gè)效用（Utility）尺度來度量的。理性決策者應(yīng)該按使自己的期望支付最大化的方式去做決策的思想，至少可以追溯到伯努里（Bernoull，1738），但這個(gè)思想在近代被辨明為是正當(dāng)?shù)?，則應(yīng)歸功于馮諾依曼和摩根斯特恩（1947）。借助關(guān)于理性決策者應(yīng)該如何行動(dòng)方面所做的一些非常弱的假設(shè)，他們證明了，對(duì)任一理性的決策者，一定存在某種方式對(duì)他所關(guān)心的各種可能結(jié)果賦予效用數(shù)值，使其總是選擇最大化自己的期望效用。我們稱這一結(jié)論為期望效用最大化定理（expectedutility maximization theorem）。,二、博弈論

8、概述,、博弈論幾個(gè)經(jīng)典的例子、博弈論的基本概念、博弈論與經(jīng)濟(jì)學(xué),、博弈論幾個(gè)經(jīng)典的例子,兩個(gè)共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一個(gè)人招認(rèn)犯罪，否則警方無充分證據(jù)將他們按罪判刑。警方把他們關(guān)入不同的牢室，并對(duì)他們說明不同行動(dòng)帶來的后果。如果兩人都采取沉默的抗拒態(tài)度，因警方證據(jù)不足，兩人將均被判為輕度犯罪入獄1個(gè)月；如果雙方都坦白，根據(jù)案情兩人將被判入獄6個(gè)月；如果一個(gè)招工而另一個(gè)拒不坦白，招認(rèn)者因有主動(dòng)認(rèn)罪立功表現(xiàn)將立即釋放，而另一人將被判入獄9個(gè)月（所犯罪行判6個(gè)月，干擾司法加判3個(gè)月）。,例一囚徒困境,囚徒困境問題可以用圖11所示的雙變量矩陣的形式來描述。,在此博弈中，每個(gè)

9、囚徒有兩種戰(zhàn)略可供選擇：坦白（或招認(rèn)）、不坦白（或沉默）。圖1-1的矩陣中每一個(gè)單元的兩個(gè)數(shù)字表示一組特定的戰(zhàn)略組合下兩個(gè)囚犯的收益（或支付、效用，這里已經(jīng)開始引用經(jīng)濟(jì)學(xué)的術(shù)語了），其中第1個(gè)數(shù)字是囚徒1（習(xí)慣上是位于矩陣橫行上的參與者）的收益，第2個(gè)數(shù)字是囚徒2（位于豎行上的參與者）的收益。如果囚徒1選擇沉默，而囚徒2選擇坦白，那么囚徒1的收益是9（表示判刑9個(gè)月），囚徒2的收益為0（表示馬上釋放）。,博弈論囚徒困境問題提供的解是戰(zhàn)略組合（坦白，坦白）。嚴(yán)格的定義與詳細(xì)的闡述留到第2章討論。這個(gè)戰(zhàn)略組合是個(gè)占優(yōu)戰(zhàn)略組合，因?yàn)闊o論對(duì)方如何選擇，自己的最優(yōu)選擇都是坦白。如果囚徒2不坦白，囚徒1坦

10、白的話他就會(huì)馬上獲釋，不坦白的話還得坐一個(gè)月的牢，所以坦白比不坦白好；如果囚徒2坦白，囚徒1坦白的話要判6個(gè)月，不坦白的話則要判9個(gè)月，這樣對(duì)囚徒1來說，還是坦白比不坦白好。因此坦白是囚徒1的占優(yōu)戰(zhàn)略。同樣的分析表明，坦白也是囚徒2的占優(yōu)戰(zhàn)略。均衡的結(jié)果是每個(gè)囚徒都選擇坦白，各判刑6個(gè)月。,初次接觸博弈論的人，難免會(huì)提出這樣的問題：戰(zhàn)略組合（沉默，沉默），即如果兩個(gè)人都不坦白，各人只判刑一個(gè)月，不是比戰(zhàn)略組合（坦白，坦白）帶來的各判刑6個(gè)月要好嗎？如果經(jīng)濟(jì)學(xué)中的“有效”的術(shù)語，（沉默，沉默）是一個(gè)有效結(jié)局。有效結(jié)局并不是囚徒問題的博弈解，與此相關(guān)的理論問題在第2章里可以找到答案。,與囚徒困境類

11、似的博弈問題在經(jīng)濟(jì)、社會(huì)領(lǐng)域有許許多多的版本，下面再舉幾個(gè)例子。,A,B兩個(gè)公司以高低兩種價(jià)格向市場競相銷售同一種產(chǎn)品。雙方協(xié)定以高價(jià)格壟斷市場，可以使彼此獲得滿意的利潤收益，至少要好于雙方都以低價(jià)格出售產(chǎn)品的情形。但如果某一方堅(jiān)持高價(jià)，而另一方為了獨(dú)占市場卻將產(chǎn)品以低價(jià)格推銷（協(xié)定不受遵守而不受處罰），那么后者將獲高盈利而前者將損失慘重。市場上商品的價(jià)格戰(zhàn)，常常出現(xiàn)的結(jié)局一般是以低價(jià)格銷售商品，消費(fèi)者從中得到好處，這種結(jié)果正是博弈論預(yù)測的合理結(jié)局，你們不妨自己設(shè)計(jì)一個(gè)類似于圖1-1的A,B公司的收益矩陣。,公司產(chǎn)品的供給也是一個(gè)類似囚徒困境的問題。每個(gè)人可供選擇的戰(zhàn)略是：出錢、不出錢。如果大

12、家都出錢興辦公共事業(yè)，所有人的福利都會(huì)增加。問題是，如果我出錢，你不出錢，我得不償失；如果我不出錢你出錢，我就可以占你的便宜。結(jié)果是每個(gè)人的最優(yōu)選擇都是不出錢。,再有個(gè)例子是軍備競賽問題。美蘇冷戰(zhàn)期間，兩個(gè)超級(jí)大國構(gòu)成博弈的兩方，可供選擇的戰(zhàn)略是：擴(kuò)軍（增加軍費(fèi)運(yùn)算）、裁軍（減少軍費(fèi)運(yùn)算）。如果雙方都熱衷于擴(kuò)軍，兩國都要為此付出高額軍費(fèi)（從社會(huì)福利角度來看這是一筆龐大的付收益）;如果雙方都選擇裁軍，則可省下這筆錢；如果一方面裁軍而另一方面進(jìn)行擴(kuò)軍，擴(kuò)軍的一方到時(shí)候就會(huì)以武力相威脅甚至發(fā)動(dòng)戰(zhàn)爭，這是，戰(zhàn)爭勝敗雙方的收益與支付將出現(xiàn)難以估量的差異。我們可以給出一個(gè)假象的雙變量收益矩陣，如圖1-2所

13、示。,博弈論給出軍備競賽問題的是戰(zhàn)略組合(擴(kuò)軍，擴(kuò)軍)，博弈理論預(yù)測雙方都擴(kuò)軍可以達(dá)到對(duì)抗中的相對(duì)穩(wěn)定，這是一個(gè)符合現(xiàn)實(shí)的合理結(jié)局。,例二海灘占位,甲乙兩個(gè)冷飲攤販，他們?cè)谝粋€(gè)直線狀的海灘上，以同樣的價(jià)格、相同的質(zhì)量向均勻分布在海灘上的眾多游客（他們來此享受海水和陽光，進(jìn)行日光浴或游泳活動(dòng)）銷售冷飲。既然是做生意，目的總是希望盡可能多賺點(diǎn)錢，甲乙兩人又是在同一地點(diǎn)做同樣的生意，競爭就是不可避免的事情了。這兩個(gè)冷飲攤販應(yīng)該如何安置自己的攤位，才能相安無事地做各自的生意呢？,假定游客總是到距離自己最近的攤位購買冷飲，這也是合乎常情的。為了敘述方便，不妨將海灘長度標(biāo)準(zhǔn)化為1。按通常的想法，如果海灘

14、左端定為0，甲在1/4處設(shè)攤，乙在3/4處設(shè)攤（見圖13），這樣既方便了顧客，又照顧到甲乙二人各占約一半顧客的生意，可謂公平合理。問題不是簡單的解決了嗎？,事情并不像想象的那么簡單。甲乙二人做同樣的生意，兩人之間就存在競爭，這就構(gòu)成了一個(gè)博弈問題。站在甲的角度考慮，只要手段合法，多攬一點(diǎn)顧客就可以多賺一點(diǎn)錢?；谶@樣的理性想法，甲就會(huì)將自己的攤位向右挪動(dòng)到A點(diǎn)（見圖13）。這時(shí)，從0到M（這里M是A至3/4處的中點(diǎn)）范圍內(nèi)的顧客都會(huì)去買甲的冷飲，甲就從乙的手里挖走一部分顧客，即圖13中陰影所示的1/2到N的那一部分。乙也是一個(gè)理性的生意人，他會(huì)估計(jì)到甲可能作出的動(dòng)作，因此，他也會(huì)將自己的攤位向

15、左邊移動(dòng)。照此下去，最后的結(jié)果是甲乙二人都擠在一起，緊接著，在海灘的中點(diǎn)（1/2處）做冷飲生意。,博弈論對(duì)海灘占位問題的解是甲乙二人均選擇在海灘中點(diǎn)（1/2處）設(shè)攤，而不是原先想象的甲乙分別在1/4和3/4處占位，即使集中在一起營業(yè)會(huì)給海灘兩端的顧客帶來不便。,社會(huì)經(jīng)濟(jì)領(lǐng)域內(nèi)，就有不少與海灘占位博弈類似的現(xiàn)象。比如，在城市商業(yè)網(wǎng)點(diǎn)的布局上，常常會(huì)出現(xiàn)相同行業(yè)的多家商店都擠在一起，形成“電子一條街”、“裝飾城”、“飲食廣場”等。只要把這個(gè)城市想象成東西或南北方向的一個(gè)“海灘”，從博弈論中就不難找到答案。,又如，同一城市的不同航空公司經(jīng)營的飛往同一目的地的航班，常常出現(xiàn)起飛時(shí)刻幾乎相同的現(xiàn)象。,就

16、是在文化娛樂方面，也能運(yùn)用海灘占位的博弈結(jié)論予以解釋。如果把電視中高雅藝術(shù)節(jié)目與較低檔的節(jié)目比作海灘的兩端，那么眾多的電視觀眾就可以看作是散布在海灘上的游客。電視臺(tái)常常將黃金時(shí)段的電視節(jié)目定位在中等檔次，以提高收視率。,例三智豬爭食,豬圈里喂養(yǎng)兩頭豬，一頭大豬，一頭小豬。豬圈的一邊有一個(gè)豬食槽，對(duì)面的一邊裝有控制開關(guān)。只要豬用鼻頭去拱控制開關(guān)，就會(huì)一次有6個(gè)單位的飼料流進(jìn)豬食槽。如果大豬和小豬都不去拱開關(guān)，那么它們都吃不到飼料。如果小豬去拱開關(guān)，那么等它跑到另一邊的豬食槽時(shí)，大豬已將流出的飼料全部都吃光了。如果大豬去拱開關(guān)，那么等它跑到豬食槽旁邊，小豬差不多已吃掉了5個(gè)單位的飼料，結(jié)果大豬只

17、能吃到1個(gè)單位的飼料。如果大豬、小豬一起去拱開關(guān)，再一起跑去吃食，那么大豬可搶到4個(gè)單位的飼料，小豬也只能吃掉2個(gè)單位的飼料。假定每拱一次開關(guān)需要消耗0.5個(gè)單位飼料的能量。大豬和小豬長期在一起進(jìn)食，上面所說的情況（信息、知識(shí)）已為它們所掌握。仿照例一囚徒困境的情形，就可以畫出如圖14所示的雙變量矩陣。,在這個(gè)博弈中，大豬與小豬都有兩種戰(zhàn)略選擇：拱、不拱。在這個(gè)例子中可以發(fā)現(xiàn)，不論大豬選擇拱還是不供，小豬的最優(yōu)選擇總是不拱。這是因?yàn)?，如果大豬去拱開關(guān)，小豬不拱（等在豬食槽旁邊）比拱后再跑回去爭食要?jiǎng)澦悖?1.5）；如果大豬不去拱開關(guān)，小豬不拱頂多都不得食，而去拱就要白白消耗能量，不劃算（0-0

18、.5）。所以，不拱是小豬的占優(yōu)戰(zhàn)略。給定小豬總是選擇不拱，大豬的最優(yōu)選擇總是拱。這樣，智豬爭食問題的博弈論解是戰(zhàn)略組合（拱，不拱）。,智豬爭食模型在社會(huì)經(jīng)濟(jì)領(lǐng)域也可以找到許多實(shí)例。,比如股份公司中就有大股東和小股東之分。股東都有監(jiān)督經(jīng)理的職能，他們從監(jiān)督中得到的收益并不一樣。在監(jiān)督成本相同的情況下，大股東從監(jiān)督中得到的好處顯然多于小股東。通常在股份公司里，總是由大股東擔(dān)當(dāng)監(jiān)督任務(wù)，而小股東則搭大股東的便車。股票市場上也有類似現(xiàn)象。一般大戶總是重視搜集信息，積極進(jìn)行行情分析。對(duì)小戶而言，跟大戶是常見現(xiàn)象。,進(jìn)行產(chǎn)品研究、開發(fā)以及新產(chǎn)品廣告宣傳時(shí)，對(duì)大企業(yè)而言，其資金實(shí)力及可望的收益會(huì)使大企業(yè)有

19、投資的積極性，而小企業(yè)往往會(huì)得不償失。小企業(yè)通常采取與大企業(yè)建立協(xié)作生產(chǎn)或移植部分技術(shù)的做法。,介紹上面三個(gè)博弈論的例子，首先，是讓你們對(duì)博弈論有一個(gè)初步的感性認(rèn)識(shí)。雖然在闡述中也涉及了專業(yè)術(shù)語，諸如理性、有效、戰(zhàn)略、占優(yōu)戰(zhàn)略、博弈解等，但是這些術(shù)語的含義是你們可以接受的。其次，通過這些例子想給你們留下一個(gè)深刻印象：博弈論與社會(huì)經(jīng)濟(jì)等諸多領(lǐng)域的聯(lián)系是如此廣泛、如此密切。下面章節(jié)對(duì)囚徒困境博弈在不同的理論的高度還要進(jìn)行研究和分析，這個(gè)例子還會(huì)在不同地方被引用。,二、博弈論的基本概念,什么是博弈論?簡而言之，博弈論是研究多人謀略和決策問題的理論。要較深入地理解這句話，還需要關(guān)注以下一些問題。首先，

20、一個(gè)博弈問題必須至少有兩個(gè)參與博弈的主體（可能是個(gè)人，也可能是團(tuán)體，如企業(yè)、國家），他們?cè)诓┺倪^程中都有各自的切身利益。由于利益的驅(qū)動(dòng)，他們?cè)谧鞒鲎约旱臎Q策時(shí)，總想使出最好的招數(shù)（最優(yōu)戰(zhàn)略）。,其次，博弈中的各個(gè)主體之間總不可避免地存在著競爭。競爭自然貫穿博弈的全過程，競爭又將博弈的主體緊緊地聯(lián)系在一起，相互依存，相互較量（說得通俗一些就是“鉤心斗角”）。再者，既然主體間要進(jìn)行較量，每一個(gè)博弈主體就不會(huì)閉目塞聽，靠靈機(jī)一動(dòng)想出高招去贏得對(duì)手，而是需要“眼觀六路，耳聽八方”。盡量掌握博弈中對(duì)手的特點(diǎn)和已經(jīng)采取或可能采取的行動(dòng)的知識(shí)和信息。最后，就是博弈主體最為關(guān)心的博弈結(jié)果了。博弈結(jié)果隨主體之間

21、使出招數(shù)（戰(zhàn)略）的不同而不同。博弈結(jié)果通俗的說就是輸贏的大小，博弈論用收益（或效用）來描述博弈的結(jié)果。博弈論就是從理論上進(jìn)行研究和分析，為博弈預(yù)測出一個(gè)理想的結(jié)局。預(yù)測結(jié)局的正確性體現(xiàn)在博弈主體各方面都能自愿選擇理論給他推導(dǎo)出的戰(zhàn)略，并且沒有博弈主體愿意獨(dú)自偏離他依照博弈理論所選定的戰(zhàn)略。可想而知，每個(gè)博弈主體所選戰(zhàn)略一定是針對(duì)其他主體所選戰(zhàn)略的最優(yōu)反應(yīng)。,以上只是對(duì)博弈論粗線條的描述，為了后面對(duì)博弈理論進(jìn)行深入的討論，下面對(duì)博弈論的幾個(gè)重要的基本概念給出明確的定義。,（1）參與者。參與者指的是一個(gè)博弈中的決策主體，通常又稱為參與人或局中人。參與者參加博弈的目的是通過合理選擇自己的行動(dòng)，以期

22、取得最大化自己的收益（或效用）水平。參與者可以是自然人，也可以是企業(yè)、團(tuán)體、國家，甚至是國家組成的集團(tuán)（如歐盟、OPEC等）。對(duì)參與者而言，在博弈過程中，他必須有不同的行動(dòng)可作應(yīng)對(duì)選擇。在博弈的結(jié)局中，他能知道或計(jì)算出各參與者不同的行動(dòng)組合產(chǎn)生的效益（或效用）。1節(jié)中三個(gè)例子的參與者是不言自明的。,在博弈論中，為了分析研究問題的需要，還有一個(gè)虛擬參與者“自然”。這里，“自然”就是指不以博弈參與者的意志為轉(zhuǎn)移的外生事件。“自然”選擇的是外生事件的各種可能現(xiàn)象，并且用概率分布來描述“自然”的選擇肌理。,例四房地產(chǎn)開發(fā)博弈,現(xiàn)有開發(fā)商A（按博弈論說法是參與者1）正在考慮是否要投資開發(fā)一座商住樓。他

23、面臨的行動(dòng)選擇是開發(fā)或不開發(fā)。如果要開發(fā)，就必須投入1億元資金；如果不去開發(fā)，投資就是0。房地產(chǎn)開發(fā)市場總是存在風(fēng)險(xiǎn)的。首先，風(fēng)險(xiǎn)來自市場需求的不確定性，需求可能大，也可能小。其次，風(fēng)險(xiǎn)來源是競爭對(duì)手房地產(chǎn)開發(fā)商B（參與者2）。開發(fā)商B也面臨與開發(fā)商A相同的決策問題。,假定市場上有兩座樓出售，需求大時(shí)，每座售價(jià)可達(dá)1.4億元；需求小時(shí)，售價(jià)為7千萬元。如果市場上只有一座樓出售，需求大時(shí)，售價(jià)高達(dá)1.8億元；需求小時(shí)，也能賣出1.1億元可以用圖1-5所示的雙變量矩陣描述這個(gè)博弈問題。,在這個(gè)例子中，市場需求就是作為虛擬參與者“自然”出現(xiàn)在博弈問題之中?！白匀弧保ㄊ袌鲂枨螅┦且砸欢ǖ母拍畋憩F(xiàn)出不同

24、的狀態(tài)（需求大還是小）。不言而喻，“自然”直接關(guān)系到博弈的決策結(jié)果。這個(gè)例子幾乎涉及到博弈論討論的重要問題的方方面面。相關(guān)的研究分析將在后面有關(guān)章節(jié)闡述。,在博弈論的討論中，一般都是用i=1,2,n 代表參與者，用N代表“自然”。,（2）信息。信息指的是參與者在博弈過程中能了解到和觀察到的知識(shí)。這些知識(shí)包括“自然”的選擇，其他參與者的特征和行動(dòng)等。信息對(duì)參與者是至關(guān)重要的，因?yàn)橐粋€(gè)參與者在每一次進(jìn)行決策之前，必須根據(jù)觀察到的其他參與者的行動(dòng)和了解的有關(guān)情況作出自己的最佳選擇。,由于信息內(nèi)涵的不同，派生出各種有關(guān)信息的概念將博弈論劃分成不同的類型，因此尋求博弈間的方法也不同。本著由淺入深認(rèn)識(shí)事物

25、的規(guī)律，這里不打算把這些概念一股腦兒和盤托出，而是分散到以后的章節(jié)中，逐步予以介紹。這里只就信息有關(guān)的兩個(gè)基本的、重要的概念進(jìn)行討論。,首先，關(guān)于“共同知識(shí)”的概念。一個(gè)博弈問題所涉及的“自然”的不同選擇、參與者的行動(dòng)以及相應(yīng)產(chǎn)生的效用（效果、收益）都是一種知識(shí)（信息）。比如，房地產(chǎn)開發(fā)商博弈問題，市場需求的大小，開發(fā)商A、B是開發(fā)還是不開發(fā)，不同情況下的利潤和虧損，都是知識(shí)。開發(fā)商A、B知道這些知識(shí)也是一種信息，開發(fā)商A知道開發(fā)商B知道這些知識(shí)也是一種信息，如此等等。博弈論所謂的共同知識(shí)指的是“所有參與者知道，所有參與者知道所有參與者知道，所有參與者知道所有參與者知道所有參與者知道”的知識(shí)。

26、可以聯(lián)想到市場需求大小是一種知識(shí)?？赡荛_發(fā)商A、B都知道市場需求有大與小兩種狀態(tài)，但是開發(fā)商A并不知道開發(fā)商B知道市場需求，這時(shí)市場需求就不構(gòu)成共同知識(shí)，而只能說是A與B“共同”享有的知識(shí)。,為了說明共同知識(shí)的重要性，我引用一個(gè)眾所周知的寓言。故事發(fā)生在一個(gè)村莊，村里有100對(duì)已婚夫婦，他們都是地道的邏輯學(xué)家，但也有一些多少有點(diǎn)奇特的社會(huì)風(fēng)俗。每天晚上，村里的男人們都將點(diǎn)起篝火，繞圈圍坐舉行一個(gè)會(huì)議，且每個(gè)人都談?wù)撟约旱钠拮?。在?huì)議開始時(shí)，如果一個(gè)男人有理由認(rèn)為他的妻子對(duì)他總是守貞的，那么他就對(duì)在坐的男人們贊揚(yáng)她的美德。另一方面，如果在當(dāng)前會(huì)議之前的任何時(shí)間，只要他發(fā)現(xiàn)了他妻子不貞的證據(jù)，那他

27、就會(huì)悲鳴慟哭，并祈求神靈嚴(yán)厲地懲罰她。再則，如果一個(gè)妻子曾有不貞，那她和她的情人將會(huì)立即通知村里除她丈夫外所有的男人。所有這些傳統(tǒng)都是村民們的共同知識(shí)。,事實(shí)上，每個(gè)妻子都已對(duì)自己的丈夫不忠。于是，每個(gè)丈夫都知道除自己的妻子外都是不貞的女人，而對(duì)自己的妻子每晚都要贊揚(yáng)。,這種狀況持續(xù)了很多年，直到一個(gè)傳教徒走訪到這個(gè)村莊。他坐在髯火旁參加了一次會(huì)議并聽到每個(gè)男人都贊揚(yáng)自己的妻子之后，他站到丈夫們圍坐的圓中心，大聲地說：“這個(gè)村里有一個(gè)妻子已經(jīng)不貞了?！痹诖撕蟮?9個(gè)晚上丈夫們繼續(xù)開會(huì)并贊揚(yáng)他們的妻子，但在第100個(gè)晚上，他們?nèi)急Q偷哭并祈求嚴(yán)厲地懲罰他們的妻子。,為了理解在這個(gè)寓言中發(fā)生了什

28、么，首先注意到若只有一個(gè)妻子不貞，則因?yàn)椋ㄖ罌]有另外的不貞女人，且若有的話他是知道的）她丈夫能夠立刻知道這個(gè)不貞的女人是他的妻子，所以在傳教徒訪問后的第一天晚上就會(huì)悲鳴慟哭。而且，由歸納法可以證明，對(duì)于1與100之間的任一正整數(shù)，如果恰有個(gè)不貞的妻子，那么在傳教徒訪問后的連續(xù)個(gè)晚上，所有的丈夫仍全都贊揚(yáng)自己的妻子，但在第個(gè)晚上，個(gè)不貞妻子的丈夫會(huì)悲鳴慟哭。于是，在99個(gè)贊揚(yáng)之夜過后的第100個(gè)晚上，每個(gè)丈夫都知道一定有100個(gè)不貞的妻子，包括他自己的妻子在內(nèi)。,現(xiàn)在，讓我們?cè)噯栆幌?，這個(gè)傳教徒告訴了這些丈夫們他們所不知道的什么？每個(gè)丈夫都已經(jīng)知道了99個(gè)不貞的妻子，故這對(duì)任何人來說都不是新聞

29、。但“這個(gè)傳教徒對(duì)所有男人做了一個(gè)聲明”是共同知識(shí)，從而這個(gè)傳教徒所聲明的內(nèi)容，即有一個(gè)不貞的妻子，也就成了所有男人中間的共同知識(shí)。在傳教徒宣告之前，每個(gè)形如“（每個(gè)丈夫知道）有一個(gè)不貞的妻子”的判斷對(duì)于99都是正確的，但對(duì)100就不正確了。例如，若從1到100對(duì)丈夫們編號(hào)，則1已經(jīng)知道2已經(jīng)知道3已經(jīng)知道99已經(jīng)知道100的妻子是不貞的，但1不知道2已經(jīng)知道3已經(jīng)知道99已經(jīng)知道100已經(jīng)知道1的妻子是不貞的。因而，從這個(gè)寓言中引申出的含義是，從一個(gè)共同知識(shí)的事實(shí)推出的結(jié)果與從（例如）只知道每個(gè)人已經(jīng)知道每個(gè)人已經(jīng)知道的一個(gè)事實(shí)推出的結(jié)果可以非常不同。,其次，關(guān)于“完全信息”的概念。完全信息

30、是博弈論非常重要的基本概念，有了上述的共同知識(shí)概念，這里就可以給出完全信息的嚴(yán)格定義。完全信息指的是所有參與者各自選擇的行動(dòng)的不同組合所決定的各參與者的收益對(duì)所有參與者來說是共同知識(shí)。簡單通俗地說，完全信息是指每一個(gè)參與者對(duì)自己以及其他參與者的行動(dòng)，以及各參與者選擇的行動(dòng)組合產(chǎn)生的收益等知識(shí)有完全的了解。,（3）戰(zhàn)略。戰(zhàn)略是參與者如何對(duì)其他參與者的行動(dòng)作出反應(yīng)的行動(dòng)規(guī)則，它規(guī)定參與者在什么時(shí)候該選擇什么行動(dòng)?；蛘哒f。戰(zhàn)略是參與者“相機(jī)行動(dòng)方案”。,戰(zhàn)略是一個(gè)與過程有關(guān)的概念，行動(dòng)是與時(shí)序無關(guān)的動(dòng)作。打個(gè)比方，行動(dòng)好比拳術(shù)中的一招一式，戰(zhàn)略就是一招一式構(gòu)成的套路。,（4）收益。在博弈論中，收益指

31、的是在一個(gè)特定的戰(zhàn)略組合下參與者得到的確定效用或期望效用。效用通常表現(xiàn)為博弈結(jié)果中的輸贏、得失、盈虧。效用必須能用數(shù)值刻畫其大小。收益是博弈參與者真正關(guān)心的問題。,博弈論的一個(gè)基本特征是一個(gè)參與者的收益不僅取決于自己的戰(zhàn)略選擇，而且取決于所有參與者的戰(zhàn)略選擇。或者說，收益是所有參與者各選定一個(gè)戰(zhàn)略形成的戰(zhàn)略組合的函數(shù)。在博弈論中，通常用ui表示參與者i的收益，一個(gè)戰(zhàn)略組合是，每個(gè)參與者的收益可以表示為,均衡是博弈論最重要、最基礎(chǔ)的一個(gè)概念，對(duì)于不同類型、不同條件的博弈問題又形成各種各樣特定的均衡的概念，它們構(gòu)成博弈論五彩繽紛的預(yù)測結(jié)果。各種均衡在社會(huì)經(jīng)濟(jì)等不同的領(lǐng)域都展現(xiàn)出廣闊的應(yīng)用前景。讀

32、者充分、深刻地理解這些均衡概念是非常重要的。,有了上面完全信息的概念，再結(jié)合參與者行動(dòng)的先后次序的界定，就可以對(duì)博弈論的類型作出劃分。如果參與者同時(shí)選擇各自的行動(dòng)，則這類博弈稱為靜態(tài)的。值得注意的是，這里所說的“同時(shí)”具有雙層含義。一種含義就是“同時(shí)”的字面解釋，也就是參與者在同一時(shí)間一起行動(dòng)；另一種含義是參與者行動(dòng)雖然有先后，但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng)。,動(dòng)態(tài)博弈指的是參與者的行動(dòng)有先后順序，并且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。后行動(dòng)者就可以依據(jù)獲得的信息，采取自己認(rèn)為最有力的戰(zhàn)略。憑直觀理解，完全信息總要比不完全信息要好一些，靜態(tài)的情形又要比動(dòng)態(tài)的情形要簡單一些。

33、如果將信息的完全與不完全、狀態(tài)的靜與動(dòng)交叉組合，就構(gòu)成了四種不同類型的博弈。從簡單到復(fù)雜排列，就是完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈不完全信息靜態(tài)博弈不完全信息動(dòng)態(tài)博弈。,3、博弈論研究著名學(xué)者簡介,（1）、計(jì)算機(jī)之父、博弈論創(chuàng)始人馮諾伊曼,約翰馮諾伊曼(John Von Neumann，19031957)，美籍匈牙利人。19211923年在蘇黎世大學(xué)學(xué)習(xí)。很快又在1926年以優(yōu)異的成績獲得了布達(dá)佩斯大學(xué)數(shù)學(xué)博士學(xué)位，此時(shí)馮諾伊曼年僅22歲。馮諾伊曼是20世紀(jì)最優(yōu)秀的數(shù)學(xué)家之一，因1946年發(fā)明電子計(jì)算機(jī)而被西方人譽(yù)為“計(jì)算機(jī)之父”。,19271929年馮諾伊曼相繼在柏林大學(xué)和漢堡大學(xué)擔(dān)任數(shù)學(xué)講

34、師。1930年接受了普林斯頓大學(xué)客座教授的職位，西渡美國，1931年成為該校終身教授。他是美國國家科學(xué)院、秘魯國立自然科學(xué)院和意大利國立林且學(xué)院的院士。馮諾伊曼建立了算子代數(shù)這門新的數(shù)學(xué)分支。在格論、連續(xù)幾何、理論物理、動(dòng)力學(xué)、連續(xù)介質(zhì)力學(xué)、氣象計(jì)算、原子能和經(jīng)濟(jì)學(xué)等領(lǐng)域都做過重要的工作。然而，馮諾伊曼對(duì)人類的最大貢獻(xiàn)是對(duì)計(jì)算機(jī)科學(xué)、計(jì)算機(jī)技術(shù)和數(shù)值分析的開拓性工作。馮諾伊曼于20世紀(jì)20年代開始創(chuàng)立博弈理論，1944年他與經(jīng)濟(jì)學(xué)家奧斯卡摩根斯特恩合作出版的巨著博弈論與經(jīng)濟(jì)行為，標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的初步形成。馮諾伊曼和摩根斯特恩在該書中提出的標(biāo)準(zhǔn)型、擴(kuò)展型和合作型博弈模型解的概念和分析

35、方法，奠定了這門學(xué)科的理論基礎(chǔ)。,（）、博弈論大師納什,納什(John Nash)，1928年6月13日出生于美國弗吉尼亞西部的“布魯菲爾德”(Bluefield)，高中畢業(yè)后進(jìn)入卡內(nèi)基梅隆大學(xué)學(xué)習(xí)化學(xué)工程專業(yè)，由于對(duì)數(shù)學(xué)的喜好和天賦，一年后正式轉(zhuǎn)到數(shù)學(xué)系。在畢業(yè)時(shí)，他取得數(shù)學(xué)學(xué)士和理學(xué)學(xué)士兩個(gè)學(xué)位。 1950年納什22歲時(shí)通過論文答辯獲得普林斯頓大學(xué)的博士學(xué)位。正是這篇天才論文，奠定了他博弈論大師的地位，并為他鋪墊了通向諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的道路。1951年納什又發(fā)表了第二篇題為“非合作博弈”(NonCooperativeGames，Annals of Mathematics1951)的論文。在

36、此之前，他還撰寫了“討價(jià)還價(jià)問題”。1958年財(cái)富雜志把納什評(píng)為新一代天才數(shù)學(xué)家中最出色的人物。也許是天妒英才，正當(dāng)麻省理工學(xué)院準(zhǔn)備提升他為正教授時(shí)，年方30歲的納什得了嚴(yán)重的“妄想型精神分裂癥”，從此他從學(xué)術(shù)界銷聲匿跡，飽受精神病的折磨長達(dá)30多年。,納什的主要貢獻(xiàn)是1950年和1951年發(fā)表的兩篇關(guān)于非合作博弈論的重要論文，他的研究徹底改變了人們對(duì)競爭和市場的看法。1950年納什發(fā)表的“非合作對(duì)策”博士論文提出了與諾伊曼的合作對(duì)策論相對(duì)立的觀點(diǎn)。納什在論文中引入了著名的“納什均衡”理論，對(duì)有混合利益的競爭者之間的對(duì)抗進(jìn)行了數(shù)學(xué)分析。他證明了非合作博弈及其均衡解，并證明了均衡解的存在性，即

37、著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。納什的研究奠定了現(xiàn)代非合作博弈論的基石，他是繼馮諾伊曼之后最偉大的博弈論大師之一，他提出的著名的納什均衡的概念在非合作博弈理論中起著核心作用。后續(xù)的研究者對(duì)博弈論的貢獻(xiàn)，都是建立在這一概念之上的。納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、管理學(xué)、社會(huì)學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅(jiān)實(shí)的理論基礎(chǔ)。,（）、動(dòng)態(tài)博弈理論的開創(chuàng)者澤爾騰,澤爾騰(R.Selten)1930年10月10日出生于德國的布雷斯勞(二戰(zhàn)后，此地歸于波蘭)，19511957年，他在法蘭克福大學(xué)學(xué)習(xí)數(shù)學(xué)。1961年在馬恩法蘭克福大學(xué)獲得了數(shù)學(xué)博士學(xué)位。1967196

38、8年，澤爾騰到加州大學(xué)伯克利分校做客座教授，19691972年在柏林大學(xué)做經(jīng)濟(jì)學(xué)教授，而后在比勒菲爾德大學(xué)工作了12年。1984年澤爾騰離開比勒菲爾德大學(xué)，到波恩大學(xué)從教，致力于實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的研究。,澤爾騰的主要貢獻(xiàn)是在納什均衡的基礎(chǔ)上深入研究了動(dòng)態(tài)博弈問題。澤爾騰通過研究發(fā)現(xiàn)，“納什均衡”概念在實(shí)際應(yīng)用中存在缺陷。納什均衡的缺陷是，一般情況下能夠保證存在性，但不能保證唯一性。大多數(shù)情況下納什均衡有多個(gè)，由此帶來的問題就是，多個(gè)納什均衡中究竟哪一個(gè)才是博弈的理性結(jié)局？澤爾騰認(rèn)為“納什均衡”概念只適用于分析一些靜態(tài)的“重復(fù)性博弈”，而不適用于分析動(dòng)態(tài)博弈問題。他對(duì)“納什均衡”概念進(jìn)行了精心的研究，

39、先后提出了兩個(gè)著名均衡新概念：子博弈完美均衡，顫抖手完美均衡。他采用“逆向歸納法”，在多個(gè)納什均衡中剔除了一些按照一定規(guī)則不合理的均衡點(diǎn)，從而形成了納什均衡的“精煉”概念，在擴(kuò)展型博弈分析方面取得了重大成果。,()、不完全信息博弈理論的奠基者海薩尼,約翰海薩尼(John CHarsanyi)，美國人，由于受到納什成果的影響，從20世紀(jì)50年代開始潛心于博弈論的研究。海薩尼的研究成果非常豐富：(1)在合作博弈論研究上，給出了合作博弈的通解N人議價(jià)模型，建立了一個(gè)合作博弈論的非合作博弈模型；(2)在不完全信息博弈研究上，提出了以類型為基礎(chǔ)的不完全信息博弈建模方法，引入了貝葉斯技術(shù)求解方法，對(duì)混合策

40、略進(jìn)行了重新解釋，提出了基于隨機(jī)變量的變動(dòng)收益博弈模型；(3)在均衡選擇研究上，與澤爾騰合作完成了博弈論均衡選擇的一般理論。約翰海薩尼通過多方面的研究將自己的思想構(gòu)成了一個(gè)完整的體系，他提出的不完全信息博弈思想及貝葉斯納什均衡概念，對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。,(5)、米爾利斯,詹姆斯亞歷山大米爾利斯(J.Y.Morlis)，出生于1936年7月5日蘇格蘭柯庫布里郡明尼加大。1996年10月8日，由于對(duì)不對(duì)稱信息條件下的激勵(lì)經(jīng)濟(jì)理論做出了基礎(chǔ)性貢獻(xiàn)，與威廉維克里分享諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。米爾利斯對(duì)不對(duì)稱信息經(jīng)濟(jì)學(xué)的貢獻(xiàn)包括：在最優(yōu)所得稅機(jī)制設(shè)計(jì)問題上，探討了政府在面臨信息不完全的情況下如何去

41、設(shè)計(jì)出一種“激勵(lì)性相容”的最優(yōu)稅收體制，提出了顯示原則：解決激勵(lì)問題的關(guān)鍵是要通過一種與個(gè)人利益相容的方式，引導(dǎo)所有人如實(shí)表露自己的信息；在最優(yōu)契約設(shè)計(jì)問題上，以“委托人一代理人方法”對(duì)道德危險(xiǎn)問題進(jìn)行了重新闡述，得出的結(jié)論是：為了使代理人有足夠的激勵(lì)去自動(dòng)選擇有利于委托人的行動(dòng)，就必須在合同的設(shè)計(jì)中讓代理人也承擔(dān)一部分結(jié)果不確定的風(fēng)險(xiǎn)；在信號(hào)篩選理論方面，提出了區(qū)分不同信號(hào)的“斯彭斯一米爾利斯條件”。,第二部分、完全信息靜態(tài)博弈,博弈的標(biāo)準(zhǔn)式表述嚴(yán)格占優(yōu)戰(zhàn)略均衡逐步剔除嚴(yán)格戰(zhàn)略均衡納什均衡應(yīng)用舉例混合戰(zhàn)略納什均衡納什均衡的存在性,一、博弈的標(biāo)準(zhǔn)式表述與納什均衡,本章重點(diǎn)介紹完全

42、信息靜態(tài)博弈，它是一種最基本的最簡單的博弈。上一章給出了完全信息和靜態(tài)博弈的概念，這里簡要回顧一下。完全信息指的是博弈的每一個(gè)參與者對(duì)自己以及其他參與者的行動(dòng)空間、收益函數(shù)等知識(shí)是完全了解的。靜態(tài)博弈指的是博弈的參與者同時(shí)選擇各自的行動(dòng)，如果選擇行動(dòng)有先后的話，那么后行動(dòng)者也不知道先行動(dòng)者采取了什么行動(dòng)。博弈論入門的兩個(gè)最基本問題是：如何描述一個(gè)博弈問題和如何求得博弈問題的解。本章對(duì)完全信息靜態(tài)博弈的標(biāo)準(zhǔn)式表述、尋求均衡（博弈預(yù)測的結(jié)果）方法以及納什均衡的有關(guān)定義、理論與方法進(jìn)行討論。,（一）、博弈的標(biāo)準(zhǔn)式表述,（二）、嚴(yán)格占優(yōu)戰(zhàn)略均衡,博弈分析的目的是預(yù)測博弈的均衡結(jié)果。簡言之，就是求解博弈

43、問題。這里需要假定“參與者是理性的”是共同知識(shí)。經(jīng)濟(jì)學(xué)對(duì)理性的描述是，在給定的約束條件下追求效用最大化。參與者在博弈過程中，在每一步斟酌的取舍（選優(yōu)剔劣）時(shí)，都應(yīng)依據(jù)這個(gè)假定行事。一般說來，由于每個(gè)參與者的收益是博弈中所有參與者所選戰(zhàn)略的函數(shù)，因此，每個(gè)參與者的最優(yōu)戰(zhàn)略選擇必須考慮所有其他參與者的戰(zhàn)略選擇。但在一些特殊的博弈中，一個(gè)參與者的最優(yōu)戰(zhàn)略可能不需要考慮其他參與者如何選擇戰(zhàn)略，就是說，不論其他參與者選擇什么戰(zhàn)略，該參與者有唯一一個(gè)最優(yōu)戰(zhàn)略，這個(gè)最優(yōu)戰(zhàn)略稱為嚴(yán)格占優(yōu)戰(zhàn)略。下面給出嚴(yán)格占優(yōu)戰(zhàn)略定義。,顯然，在一個(gè)博弈問題中，如果所有參與者都有一個(gè)嚴(yán)格占優(yōu)戰(zhàn)略，那么每一個(gè)理性的參與者誰也不會(huì)

44、放棄他的嚴(yán)格占優(yōu)戰(zhàn)略。這樣，由全部嚴(yán)格占優(yōu)戰(zhàn)略就構(gòu)成博弈的解嚴(yán)格占優(yōu)戰(zhàn)略均衡。,應(yīng)該指出的是，嚴(yán)格占優(yōu)戰(zhàn)略只要求每個(gè)參與者是理性的，而并不要求每個(gè)參與者知道其他參與者是理性的（即不要求“理性”是共同知識(shí)）。這是因?yàn)?，不論知道與否，嚴(yán)格占優(yōu)戰(zhàn)略總是一個(gè)理性參與者的最佳選擇。,值得注意的是，囚徒困境博弈暴露了個(gè)人理性與團(tuán)體理性的沖突問題。因?yàn)榍敉?與囚徒2都選擇沉默，每人只判刑1個(gè)月，這顯然要比（坦白，坦白）都判刑6個(gè)月有利。（沉默，沉默）不是一個(gè)均衡，因?yàn)樗粷M足個(gè)人理性的要求。換個(gè)角度考慮，即使兩個(gè)囚徒在被捕前訂立了攻守同盟（拒不坦白），這個(gè)同盟也沒有用，因?yàn)闆]有人會(huì)嚴(yán)格遵守同盟協(xié)定（這時(shí)，只

45、要誰一坦白，他就立即獲得釋放）。,（三）、逐步剔除嚴(yán)格劣戰(zhàn)略均衡,尋求博弈問題的解的過程就是參與者選擇戰(zhàn)略的過程。選擇有兩種途徑：選優(yōu)與去劣。上面尋求嚴(yán)格占優(yōu)戰(zhàn)略均衡走的就是選優(yōu)的路子。下面介紹的逐步剔除嚴(yán)格劣戰(zhàn)略尋求均衡走的就是去劣的路子。,研究圖21所示的一個(gè)博弈問題。,這樣一來，參與者1就可以將圖21所示的博弈視同為圖22所示的博弈。,在圖22中，對(duì)參與者1來說，戰(zhàn)略“下”相對(duì)于戰(zhàn)略“上”是嚴(yán)格劣戰(zhàn)略（因?yàn)?1,且01）。于是，如果參與者1是理性的（并且參與者1知道參與者2是理性的，原博弈才能簡化為圖22），那么參與者1就不會(huì)選擇“下”。這時(shí)，如果參與者2知道參與者1是理性的，并且參與者

46、2知道參與者1知道參與者2是理性的（只有這樣，參與者2知道原博弈已被簡化為圖22所示博弈），那么參與者2就可以把“下”從參與者1的戰(zhàn)略空間S1中剔除。,這樣一來，參與者2又可以進(jìn)一步將圖22所示博弈簡化為圖23所示博弈,那么，圖24的博弈有沒有均衡結(jié)果呢？后面我們還會(huì)討論。,另外，嚴(yán)格占優(yōu)戰(zhàn)略均衡和逐步剔除嚴(yán)格劣戰(zhàn)略均衡對(duì)參與者理性的要求是不同的。前者只要每個(gè)參與者是理性的，而后者卻要求理性是參與者的共同知識(shí)。只有在“參與者2是理性的，且參與者1知道參與者2是理性的”條件下，圖21的博弈才能簡化為圖22的情形。一共用了三步剔除得到了結(jié)果。顯然，參與者的戰(zhàn)略空間越大，剔除的步驟就越多，對(duì)共同知識(shí)

47、的要求就越嚴(yán)格。,定義在標(biāo)準(zhǔn)式的博弈中，設(shè)si和si是參與者i的兩個(gè)可行戰(zhàn)略。若下式,類似于運(yùn)用逐步剔除嚴(yán)格劣戰(zhàn)略去尋求一個(gè)均衡結(jié)果，自然想到運(yùn)用逐步剔除劣勢戰(zhàn)略也是求解博弈問題的一種方法。,考察下面圖25所示的博弈問題。,（四）、納什（Nash）均衡,納什均衡是完全信息靜態(tài)博弈的解的一般概念，它是對(duì)非常廣泛博弈問題給出更加嚴(yán)格的結(jié)果。首先，許多不存在嚴(yán)格占優(yōu)戰(zhàn)略均衡或逐步剔除嚴(yán)格劣戰(zhàn)略均衡的博弈，卻存在納什均衡。其次，嚴(yán)格占優(yōu)戰(zhàn)略均衡一定就是博弈問題的惟一的納什均衡。再者納什均衡一定不會(huì)被逐步剔除嚴(yán)格劣戰(zhàn)略所剔除?？梢赃@么說，沒有任何一個(gè)戰(zhàn)略組合嚴(yán)格優(yōu)于納什均衡。為了理解納什均衡的含義，

48、設(shè)想博弈理論對(duì)一個(gè)n個(gè)參與者博弈中的每一個(gè)參與者選定的一個(gè)戰(zhàn)略，預(yù)測的博弈結(jié)果為s*(s1*,si*,sn*)。其中，si*是理論上導(dǎo)出的參與者i的戰(zhàn)略。首先，理論上確定的每個(gè)參與者要選擇的戰(zhàn)略必須是針對(duì)其他參與者選擇戰(zhàn)略的最優(yōu)反應(yīng)。其次，遵循理論結(jié)果產(chǎn)生的效用不會(huì)小于偏離理論結(jié)果時(shí)的效用，也就是沒有參與者愿意單獨(dú)偏離理論給他選定的戰(zhàn)略，這種理論導(dǎo)出的結(jié)果時(shí)一種“戰(zhàn)略相對(duì)穩(wěn)定”狀態(tài)。我們就把這種狀態(tài)稱為一個(gè)納什均衡。,和納什均衡的導(dǎo)出密切相關(guān)的是協(xié)議的理念。對(duì)給定的博弈，如果參與者之間要商定一個(gè)協(xié)議決定博弈如何進(jìn)行，那么一個(gè)有效的協(xié)議中的戰(zhàn)略組織必須是納什均衡的戰(zhàn)略組合，否則至少有一個(gè)參與者會(huì)

49、不遵循該協(xié)議。,運(yùn)用上述定義中不等式（NE）的條件，就可以檢查一個(gè)特定的戰(zhàn)略組合是不是納什均衡。比如，在囚徒困境中，對(duì)參與者1（囚徒1）選s1*坦白，對(duì)參與者2（囚徒2）選s2*坦白。,考察圖24所示的博弈。,從圖26可以看出，一個(gè)單元中只有一個(gè)數(shù)值下面劃了橫線，表明只有一方的戰(zhàn)略上針對(duì)另一方戰(zhàn)略的最優(yōu)反應(yīng)，而另一方的戰(zhàn)略卻表示針對(duì)對(duì)方戰(zhàn)略的最優(yōu)反應(yīng)。因此該單元對(duì)應(yīng)的戰(zhàn)略組合就不是雙方同時(shí)愿意接受的結(jié)果，因而也就構(gòu)不成納什均衡。,通過上面闡述，讀者已經(jīng)接觸了各種博弈均衡的概念和尋求均衡結(jié)果的方法，現(xiàn)在著重分析一下它們之間的關(guān)系。,(1) 每一個(gè)嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡，反之不然。,(2) 每一個(gè)逐步剔除嚴(yán)格占優(yōu)戰(zhàn)略均衡是納什均衡，反之不然。,這里就不作嚴(yán)格的論證了?；仡欀秦i爭食博弈和圖21所示的博弈，對(duì)逐步剔除嚴(yán)格劣戰(zhàn)略過程和劃橫線方法尋求納什均衡的過程的比較，可以領(lǐng)會(huì)上述結(jié)論的含義。反例可以從圖26所示博弈看出。s*(下,右)是納什均衡，但該博弈逐步剔除嚴(yán)格劣戰(zhàn)略卻一步也不能施行。,(3) 如果戰(zhàn)略組合是納什均衡，那么它一定不會(huì)被逐步剔除嚴(yán)格劣戰(zhàn)略剔除。,成立。,在本章的最后，再

人人文庫> 全部分類> 應(yīng)用文書 > 技術(shù)指導(dǎo)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

博弈模型.ppt

文檔簡介

溫馨提示

最新文檔

評(píng)論

博弈模型.ppt

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔