博弈模型.ppt_第1頁
博弈模型.ppt_第2頁
博弈模型.ppt_第3頁
博弈模型.ppt_第4頁
博弈模型.ppt_第5頁
已閱讀5頁,還剩131頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、博弈模型,第一部分、博弈論基本概念,宇宙間處處存在矛盾、沖突、爭斗、合作、共生等現(xiàn)象,這些現(xiàn)象很很早就引起各類學(xué)者的重視。哲學(xué)家們對(duì)此作過深刻討論,毛澤東的矛盾論便是其中的代表。另一方面,數(shù)學(xué)被認(rèn)為是科學(xué)的語言,能否用數(shù)學(xué)語言描述各種帶有矛盾因素的模型或現(xiàn)象?博弈論便是這樣一種處理各類帶有矛盾因素的模型的數(shù)學(xué)工具,現(xiàn)在已被數(shù)學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、軍事學(xué)、生物學(xué)等專家廣泛應(yīng)用于討論各類帶有沖突、矛盾、合作、競爭、進(jìn)化等問題及相關(guān)模型之中。博弈論已成為人們分析復(fù)雜系統(tǒng)與作重大決策時(shí)的有力工具。,一、引言,數(shù)學(xué)歷史悠久,并且不斷發(fā)展前進(jìn),被稱為“科學(xué)的語言”。在20世紀(jì)前,它最有效的應(yīng)用范圍是天文、物

2、理、力學(xué)等所謂精確的自然科學(xué)。由于概率論與統(tǒng)計(jì)理論的發(fā)展,數(shù)學(xué)又逐漸應(yīng)用于生物學(xué)與社會(huì)科學(xué),而分析矛盾現(xiàn)象的數(shù)學(xué)方法和理論也是在這一背景下于20世紀(jì)初開始萌芽并逐步發(fā)展起來的,這個(gè)數(shù)學(xué)分枝稱為博弈論(Game Theory)。,數(shù)學(xué)研究的方法是從大量的同類現(xiàn)象中抽象出基本要素,進(jìn)步構(gòu)造出能描述這類現(xiàn)象的模型。許多沖突模型在游戲中就存在,博弈論早期就是由研究國際象棋開始的,所以被命名為Game Theory。人們很快認(rèn)識(shí)到此種理論可用于經(jīng)濟(jì)、政治、軍事等領(lǐng)域,所謂“世事紛爭一棋局”,正說明其中一些道理。1944年馮諾曼(John,Von Neumann)和奧摩根斯特恩(Osker Morgent

3、ern)合著的競賽論與經(jīng)濟(jì)行為(Theory Of GSmes and Economic Behavior)問世,總結(jié)了初期研究成果,奠定了博弈論的基礎(chǔ)。由于該理論主要討論在復(fù)雜的矛盾沖突等活動(dòng)中,局中人(Player)采取何種合理的策略(strategy)而能處于“優(yōu)越”的地位,以便取得較好效益,所以將它譯為博弈論。,博弈論(Game theory)可以被定義為是對(duì)智能的理性決策者之間沖突與合作的數(shù)學(xué)模型的研究。博弈論為分析那些涉及兩個(gè)或更多個(gè)參與者且其決策會(huì)影響相互間的福利的局勢提供了一般的數(shù)學(xué)方法。就此而論,博弈論便為社會(huì)科學(xué)各分支的學(xué)者和實(shí)際的決策者提供了非常重要的視角。博奕理論家所研

4、究的局勢,不僅僅是“游戲(Game)”一詞所不幸表示的消遣活動(dòng),“沖突分析”或“相互影響的決策理論”或許是描述博弈論更為準(zhǔn)確的術(shù)語。,博弈理論家力圖通過研究定量模型和假設(shè)例子來理解沖突與合作。這些例子可能在很多方面都是脫離現(xiàn)實(shí)的簡化,但與實(shí)際生活中大量更為復(fù)雜的情況相比,這種簡化能使我們更容易看出沖突與合作的一些基本問題。當(dāng)然,這也是任何一個(gè)研究領(lǐng)域都應(yīng)用的分析方法把問題放在忽略掉現(xiàn)實(shí)中不重要的細(xì)枝末節(jié)的一個(gè)簡化模型中加以考慮。因此,即使從未遇到像博弈理論家在研究中明確規(guī)定局中人立場的局勢,研究過這些假設(shè)例子的人們,仍然能夠較好地理解實(shí)際的競爭局勢。,常見的游戲如棋類,兩人對(duì)奕,此兩人便稱為局

5、中人,他們各有一套棋路,或善于用馬,或長于用炮。在每次輪到一方走子時(shí),他可能有許多走法,這些走法依賴于當(dāng)時(shí)棋局形勢以及棋手想要達(dá)到的目的,以及他慣用的走法,從而形成他走棋的指導(dǎo)思想。對(duì)奕時(shí)指導(dǎo)棋手行動(dòng)的思想便稱為策略。對(duì)局終了可能有三種結(jié)局:甲勝;乙勝;和局。如果用數(shù)量表示各種結(jié)局,例如勝家贏得彩金若干(設(shè)所得彩金由輸家付給,則輸家當(dāng)然失去若干),和局時(shí)都不能取得彩金,此種表示結(jié)局的數(shù)稱為支付(payoff)。局中人、策略、支付是博弈論中常見的基本概念。,有些游戲中并無“機(jī)會(huì)”(chance)因素,而是全憑局中人的技藝。但某些游戲如“橋牌”、“打百分”等,“機(jī)會(huì)”卻有較大作用,分發(fā)到游戲者手中

6、的牌是隨機(jī)的,它們情況要復(fù)雜一些。,游戲并非只有雙方,可以有多方,如三人玩的跳棋便有三個(gè)局中人。一般只有兩個(gè)局中人的稱為兩人博奕(或二人對(duì)策),有二個(gè)局中人的稱為n人博弈。,在博弈論的語言中,一個(gè)博弈(game)指的是涉及到兩個(gè)或更多個(gè)參與人的某個(gè)社會(huì)局勢。博弈所涉及的參與人被稱為局中人(players)。正如前面博弈論的定義所述,博弈理論家一般要對(duì)局中人做兩個(gè)基本的假設(shè):他們都是理性的和他們都是智能的。這兩個(gè)形容詞在這里都是技術(shù)性術(shù)語,所以需要對(duì)其逐一解釋。,如果一個(gè)決策者在追逐其目標(biāo)時(shí)能前后一致地做決策,我們就稱他是理性的(rational)。在基于決策理論的基本結(jié)論而建立起來的博弈論中,

7、我們假設(shè)每個(gè)局中人的目標(biāo)是追求其個(gè)人期望支付值的最大化,支付則是用某個(gè)效用(Utility)尺度來度量的。理性決策者應(yīng)該按使自己的期望支付最大化的方式去做決策的思想,至少可以追溯到伯努里(Bernoull,1738),但這個(gè)思想在近代被辨明為是正當(dāng)?shù)?,則應(yīng)歸功于馮諾依曼和摩根斯特恩(1947)。借助關(guān)于理性決策者應(yīng)該如何行動(dòng)方面所做的一些非常弱的假設(shè),他們證明了,對(duì)任一理性的決策者,一定存在某種方式對(duì)他所關(guān)心的各種可能結(jié)果賦予效用數(shù)值,使其總是選擇最大化自己的期望效用。我們稱這一結(jié)論為期望效用最大化定理(expectedutility maximization theorem)。,二、 博弈論

8、概述,、博弈論幾個(gè)經(jīng)典的例子 、博弈論的基本概念 、博弈論與經(jīng)濟(jì)學(xué),、博弈論幾個(gè)經(jīng)典的例子,兩個(gè)共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一個(gè)人招認(rèn)犯罪,否則警方無充分證據(jù)將他們按罪判刑。警方把他們關(guān)入不同的牢室,并對(duì)他們說明不同行動(dòng)帶來的后果。如果兩人都采取沉默的抗拒態(tài)度,因警方證據(jù)不足,兩人將均被判為輕度犯罪入獄1個(gè)月;如果雙方都坦白,根據(jù)案情兩人將被判入獄6個(gè)月;如果一個(gè)招工而另一個(gè)拒不坦白,招認(rèn)者因有主動(dòng)認(rèn)罪立功表現(xiàn)將立即釋放,而另一人將被判入獄9個(gè)月(所犯罪行判6個(gè)月,干擾司法加判3個(gè)月)。,例一 囚徒困境,囚徒困境問題可以用圖11所示的雙變量矩陣的形式來描述。,在此博弈中,每個(gè)

9、囚徒有兩種戰(zhàn)略可供選擇:坦白(或招認(rèn))、不坦白(或沉默)。圖1-1的矩陣中每一個(gè)單元的兩個(gè)數(shù)字表示一組特定的戰(zhàn)略組合下兩個(gè)囚犯的收益(或支付、效用,這里已經(jīng)開始引用經(jīng)濟(jì)學(xué)的術(shù)語了),其中第1個(gè)數(shù)字是囚徒1(習(xí)慣上是位于矩陣橫行上的參與者)的收益,第2個(gè)數(shù)字是囚徒2(位于豎行上的參與者)的收益。如果囚徒1選擇沉默,而囚徒2選擇坦白,那么囚徒1的收益是9(表示判刑9個(gè)月),囚徒2的收益為0(表示馬上釋放)。,博弈論囚徒困境問題提供的解是戰(zhàn)略組合(坦白,坦白)。嚴(yán)格的定義與詳細(xì)的闡述留到第2章討論。這個(gè)戰(zhàn)略組合是個(gè)占優(yōu)戰(zhàn)略組合,因?yàn)闊o論對(duì)方如何選擇,自己的最優(yōu)選擇都是坦白。如果囚徒2不坦白,囚徒1坦

10、白的話他就會(huì)馬上獲釋,不坦白的話還得坐一個(gè)月的牢,所以坦白比不坦白好;如果囚徒2坦白,囚徒1坦白的話要判6個(gè)月,不坦白的話則要判9個(gè)月,這樣對(duì)囚徒1來說,還是坦白比不坦白好。因此坦白是囚徒1的占優(yōu)戰(zhàn)略。同樣的分析表明,坦白也是囚徒2的占優(yōu)戰(zhàn)略。均衡的結(jié)果是每個(gè)囚徒都選擇坦白,各判刑6個(gè)月。,初次接觸博弈論的人,難免會(huì)提出這樣的問題:戰(zhàn)略組合(沉默,沉默),即如果兩個(gè)人都不坦白,各人只判刑一個(gè)月,不是比戰(zhàn)略組合(坦白,坦白)帶來的各判刑6個(gè)月要好嗎?如果經(jīng)濟(jì)學(xué)中的“有效”的術(shù)語,(沉默,沉默)是一個(gè)有效結(jié)局。有效結(jié)局并不是囚徒問題的博弈解,與此相關(guān)的理論問題在第2章里可以找到答案。,與囚徒困境類

11、似的博弈問題在經(jīng)濟(jì)、社會(huì)領(lǐng)域有許許多多的版本,下面再舉幾個(gè)例子。,A,B兩個(gè)公司以高低兩種價(jià)格向市場競相銷售同一種產(chǎn)品。雙方協(xié)定以高價(jià)格壟斷市場,可以使彼此獲得滿意的利潤收益,至少要好于雙方都以低價(jià)格出售產(chǎn)品的情形。但如果某一方堅(jiān)持高價(jià),而另一方為了獨(dú)占市場卻將產(chǎn)品以低價(jià)格推銷(協(xié)定不受遵守而不受處罰),那么后者將獲高盈利而前者將損失慘重。市場上商品的價(jià)格戰(zhàn),常常出現(xiàn)的結(jié)局一般是以低價(jià)格銷售商品,消費(fèi)者從中得到好處,這種結(jié)果正是博弈論預(yù)測的合理結(jié)局,你們不妨自己設(shè)計(jì)一個(gè)類似于圖1-1的A,B公司的收益矩陣。,公司產(chǎn)品的供給也是一個(gè)類似囚徒困境的問題。每個(gè)人可供選擇的戰(zhàn)略是:出錢、不出錢。如果大

12、家都出錢興辦公共事業(yè),所有人的福利都會(huì)增加。問題是,如果我出錢,你不出錢,我得不償失;如果我不出錢你出錢,我就可以占你的便宜。結(jié)果是每個(gè)人的最優(yōu)選擇都是不出錢。,再有個(gè)例子是軍備競賽問題。美蘇冷戰(zhàn)期間,兩個(gè)超級(jí)大國構(gòu)成博弈的兩方,可供選擇的戰(zhàn)略是:擴(kuò)軍(增加軍費(fèi)運(yùn)算)、裁軍(減少軍費(fèi)運(yùn)算)。如果雙方都熱衷于擴(kuò)軍,兩國都要為此付出高額軍費(fèi)(從社會(huì)福利角度來看這是一筆龐大的付收益);如果雙方都選擇裁軍,則可省下這筆錢;如果一方面裁軍而另一方面進(jìn)行擴(kuò)軍,擴(kuò)軍的一方到時(shí)候就會(huì)以武力相威脅甚至發(fā)動(dòng)戰(zhàn)爭,這是,戰(zhàn)爭勝敗雙方的收益與支付將出現(xiàn)難以估量的差異。我們可以給出一個(gè)假象的雙變量收益矩陣,如圖1-2所

13、示。,博弈論給出軍備競賽問題的是戰(zhàn)略組合(擴(kuò)軍,擴(kuò)軍),博弈理論預(yù)測雙方都擴(kuò)軍可以達(dá)到對(duì)抗中的相對(duì)穩(wěn)定,這是一個(gè)符合現(xiàn)實(shí)的合理結(jié)局。,例二 海灘占位,甲乙兩個(gè)冷飲攤販,他們?cè)谝粋€(gè)直線狀的海灘上,以同樣的價(jià)格、相同的質(zhì)量向均勻分布在海灘上的眾多游客(他們來此享受海水和陽光,進(jìn)行日光浴或游泳活動(dòng))銷售冷飲。既然是做生意,目的總是希望盡可能多賺點(diǎn)錢,甲乙兩人又是在同一地點(diǎn)做同樣的生意,競爭就是不可避免的事情了。這兩個(gè)冷飲攤販應(yīng)該如何安置自己的攤位,才能相安無事地做各自的生意呢?,假定游客總是到距離自己最近的攤位購買冷飲,這也是合乎常情的。為了敘述方便,不妨將海灘長度標(biāo)準(zhǔn)化為1。按通常的想法,如果海灘

14、左端定為0,甲在1/4處設(shè)攤,乙在3/4處設(shè)攤(見圖13),這樣既方便了顧客,又照顧到甲乙二人各占約一半顧客的生意,可謂公平合理。問題不是簡單的解決了嗎?,事情并不像想象的那么簡單。甲乙二人做同樣的生意,兩人之間就存在競爭,這就構(gòu)成了一個(gè)博弈問題。站在甲的角度考慮,只要手段合法,多攬一點(diǎn)顧客就可以多賺一點(diǎn)錢?;谶@樣的理性想法,甲就會(huì)將自己的攤位向右挪動(dòng)到A點(diǎn)(見圖13)。這時(shí),從0到M(這里M是A至3/4處的中點(diǎn))范圍內(nèi)的顧客都會(huì)去買甲的冷飲,甲就從乙的手里挖走一部分顧客,即圖13中陰影所示的1/2到N的那一部分。乙也是一個(gè)理性的生意人,他會(huì)估計(jì)到甲可能作出的動(dòng)作,因此,他也會(huì)將自己的攤位向

15、左邊移動(dòng)。照此下去,最后的結(jié)果是甲乙二人都擠在一起,緊接著,在海灘的中點(diǎn)(1/2處)做冷飲生意。,博弈論對(duì)海灘占位問題的解是甲乙二人均選擇在海灘中點(diǎn)(1/2處)設(shè)攤,而不是原先想象的甲乙分別在1/4和3/4處占位,即使集中在一起營業(yè)會(huì)給海灘兩端的顧客帶來不便。,社會(huì)經(jīng)濟(jì)領(lǐng)域內(nèi),就有不少與海灘占位博弈類似的現(xiàn)象。比如,在城市商業(yè)網(wǎng)點(diǎn)的布局上,常常會(huì)出現(xiàn)相同行業(yè)的多家商店都擠在一起,形成“電子一條街”、“裝飾城”、“飲食廣場”等。只要把這個(gè)城市想象成東西或南北方向的一個(gè)“海灘”,從博弈論中就不難找到答案。,又如,同一城市的不同航空公司經(jīng)營的飛往同一目的地的航班,常常出現(xiàn)起飛時(shí)刻幾乎相同的現(xiàn)象。,就

16、是在文化娛樂方面,也能運(yùn)用海灘占位的博弈結(jié)論予以解釋。如果把電視中高雅藝術(shù)節(jié)目與較低檔的節(jié)目比作海灘的兩端,那么眾多的電視觀眾就可以看作是散布在海灘上的游客。電視臺(tái)常常將黃金時(shí)段的電視節(jié)目定位在中等檔次,以提高收視率。,例三 智豬爭食,豬圈里喂養(yǎng)兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有一個(gè)豬食槽,對(duì)面的一邊裝有控制開關(guān)。只要豬用鼻頭去拱控制開關(guān),就會(huì)一次有6個(gè)單位的飼料流進(jìn)豬食槽。如果大豬和小豬都不去拱開關(guān),那么它們都吃不到飼料。如果小豬去拱開關(guān),那么等它跑到另一邊的豬食槽時(shí),大豬已將流出的飼料全部都吃光了。如果大豬去拱開關(guān),那么等它跑到豬食槽旁邊,小豬差不多已吃掉了5個(gè)單位的飼料,結(jié)果大豬只

17、能吃到1個(gè)單位的飼料。如果大豬、小豬一起去拱開關(guān),再一起跑去吃食,那么大豬可搶到4個(gè)單位的飼料,小豬也只能吃掉2個(gè)單位的飼料。假定每拱一次開關(guān)需要消耗0.5個(gè)單位飼料的能量。大豬和小豬長期在一起進(jìn)食,上面所說的情況(信息、知識(shí))已為它們所掌握。仿照例一囚徒困境的情形,就可以畫出如圖14所示的雙變量矩陣。,在這個(gè)博弈中,大豬與小豬都有兩種戰(zhàn)略選擇:拱、不拱。在這個(gè)例子中可以發(fā)現(xiàn),不論大豬選擇拱還是不供,小豬的最優(yōu)選擇總是不拱。這是因?yàn)?,如果大豬去拱開關(guān),小豬不拱(等在豬食槽旁邊)比拱后再跑回去爭食要?jiǎng)澦悖?1.5);如果大豬不去拱開關(guān),小豬不拱頂多都不得食,而去拱就要白白消耗能量,不劃算(0-0

18、.5)。所以,不拱是小豬的占優(yōu)戰(zhàn)略。給定小豬總是選擇不拱,大豬的最優(yōu)選擇總是拱。這樣,智豬爭食問題的博弈論解是戰(zhàn)略組合(拱,不拱)。,智豬爭食模型在社會(huì)經(jīng)濟(jì)領(lǐng)域也可以找到許多實(shí)例。,比如股份公司中就有大股東和小股東之分。股東都有監(jiān)督經(jīng)理的職能,他們從監(jiān)督中得到的收益并不一樣。在監(jiān)督成本相同的情況下,大股東從監(jiān)督中得到的好處顯然多于小股東。通常在股份公司里,總是由大股東擔(dān)當(dāng)監(jiān)督任務(wù),而小股東則搭大股東的便車。 股票市場上也有類似現(xiàn)象。一般大戶總是重視搜集信息,積極進(jìn)行行情分析。對(duì)小戶而言,跟大戶是常見現(xiàn)象。,進(jìn)行產(chǎn)品研究、開發(fā)以及新產(chǎn)品廣告宣傳時(shí),對(duì)大企業(yè)而言,其資金實(shí)力及可望的收益會(huì)使大企業(yè)有

19、投資的積極性,而小企業(yè)往往會(huì)得不償失。小企業(yè)通常采取與大企業(yè)建立協(xié)作生產(chǎn)或移植部分技術(shù)的做法。,介紹上面三個(gè)博弈論的例子,首先,是讓你們對(duì)博弈論有一個(gè)初步的感性認(rèn)識(shí)。雖然在闡述中也涉及了專業(yè)術(shù)語,諸如理性、有效、戰(zhàn)略、占優(yōu)戰(zhàn)略、博弈解等,但是這些術(shù)語的含義是你們可以接受的。其次,通過這些例子想給你們留下一個(gè)深刻印象:博弈論與社會(huì)經(jīng)濟(jì)等諸多領(lǐng)域的聯(lián)系是如此廣泛、如此密切。下面章節(jié)對(duì)囚徒困境博弈在不同的理論的高度還要進(jìn)行研究和分析,這個(gè)例子還會(huì)在不同地方被引用。,二、博弈論的基本概念,什么是博弈論?簡而言之,博弈論是研究多人謀略和決策問題的理論。要較深入地理解這句話,還需要關(guān)注以下一些問題。首先,

20、一個(gè)博弈問題必須至少有兩個(gè)參與博弈的主體(可能是個(gè)人,也可能是團(tuán)體,如企業(yè)、國家),他們?cè)诓┺倪^程中都有各自的切身利益。由于利益的驅(qū)動(dòng),他們?cè)谧鞒鲎约旱臎Q策時(shí),總想使出最好的招數(shù)(最優(yōu)戰(zhàn)略)。,其次,博弈中的各個(gè)主體之間總不可避免地存在著競爭。競爭自然貫穿博弈的全過程,競爭又將博弈的主體緊緊地聯(lián)系在一起,相互依存,相互較量(說得通俗一些就是“鉤心斗角”)。再者,既然主體間要進(jìn)行較量,每一個(gè)博弈主體就不會(huì)閉目塞聽,靠靈機(jī)一動(dòng)想出高招去贏得對(duì)手,而是需要“眼觀六路,耳聽八方”。盡量掌握博弈中對(duì)手的特點(diǎn)和已經(jīng)采取或可能采取的行動(dòng)的知識(shí)和信息。最后,就是博弈主體最為關(guān)心的博弈結(jié)果了。博弈結(jié)果隨主體之間

21、使出招數(shù)(戰(zhàn)略)的不同而不同。博弈結(jié)果通俗的說就是輸贏的大小,博弈論用收益(或效用)來描述博弈的結(jié)果。博弈論就是從理論上進(jìn)行研究和分析,為博弈預(yù)測出一個(gè)理想的結(jié)局。預(yù)測結(jié)局的正確性體現(xiàn)在博弈主體各方面都能自愿選擇理論給他推導(dǎo)出的戰(zhàn)略,并且沒有博弈主體愿意獨(dú)自偏離他依照博弈理論所選定的戰(zhàn)略。可想而知, 每個(gè)博弈主體所選戰(zhàn)略一定是針對(duì)其他主體所選戰(zhàn)略的最優(yōu)反應(yīng)。,以上只是對(duì)博弈論粗線條的描述,為了后面對(duì)博弈理論進(jìn)行深入的討論,下面對(duì)博弈論的幾個(gè)重要的基本概念給出明確的定義。,(1)參與者。參與者指的是一個(gè)博弈中的決策主體,通常又稱為參與人或局中人。參與者參加博弈的目的是通過合理選擇自己的行動(dòng),以期

22、取得最大化自己的收益(或效用)水平。參與者可以是自然人,也可以是企業(yè)、團(tuán)體、國家,甚至是國家組成的集團(tuán)(如歐盟、OPEC等)。對(duì)參與者而言,在博弈過程中,他必須有不同的行動(dòng)可作應(yīng)對(duì)選擇。在博弈的結(jié)局中,他能知道或計(jì)算出各參與者不同的行動(dòng)組合產(chǎn)生的效益(或效用)。1節(jié)中三個(gè)例子的參與者是不言自明的。,在博弈論中,為了分析研究問題的需要,還有一個(gè)虛擬參與者“自然”。這里,“自然”就是指不以博弈參與者的意志為轉(zhuǎn)移的外生事件。“自然”選擇的是外生事件的各種可能現(xiàn)象,并且用概率分布來描述“自然”的選擇肌理。,例四 房地產(chǎn)開發(fā)博弈,現(xiàn)有開發(fā)商A(按博弈論說法是參與者1)正在考慮是否要投資開發(fā)一座商住樓。他

23、面臨的行動(dòng)選擇是開發(fā)或不開發(fā)。如果要開發(fā),就必須投入1億元資金;如果不去開發(fā),投資就是0。房地產(chǎn)開發(fā)市場總是存在風(fēng)險(xiǎn)的。首先,風(fēng)險(xiǎn)來自市場需求的不確定性,需求可能大,也可能小。其次,風(fēng)險(xiǎn)來源是競爭對(duì)手房地產(chǎn)開發(fā)商B(參與者2)。開發(fā)商B也面臨與開發(fā)商A相同的決策問題。,假定市場上有兩座樓出售,需求大時(shí),每座售價(jià)可達(dá)1.4億元;需求小時(shí),售價(jià)為7千萬元。如果市場上只有一座樓出售,需求大時(shí),售價(jià)高達(dá)1.8億元;需求小時(shí),也能賣出1.1億元可以用圖1-5所示的雙變量矩陣描述這個(gè)博弈問題。,在這個(gè)例子中,市場需求就是作為虛擬參與者“自然”出現(xiàn)在博弈問題之中?!白匀弧保ㄊ袌鲂枨螅┦且砸欢ǖ母拍畋憩F(xiàn)出不同

24、的狀態(tài)(需求大還是小)。不言而喻,“自然”直接關(guān)系到博弈的決策結(jié)果。這個(gè)例子幾乎涉及到博弈論討論的重要問題的方方面面。相關(guān)的研究分析將在后面有關(guān)章節(jié)闡述。,在博弈論的討論中,一般都是用i=1,2,n 代表參與者,用N代表“自然”。,(2)信息。信息指的是參與者在博弈過程中能了解到和觀察到的知識(shí)。這些知識(shí)包括“自然”的選擇,其他參與者的特征和行動(dòng)等。信息對(duì)參與者是至關(guān)重要的,因?yàn)橐粋€(gè)參與者在每一次進(jìn)行決策之前,必須根據(jù)觀察到的其他參與者的行動(dòng)和了解的有關(guān)情況作出自己的最佳選擇。,由于信息內(nèi)涵的不同,派生出各種有關(guān)信息的概念將博弈論劃分成不同的類型,因此尋求博弈間的方法也不同。本著由淺入深認(rèn)識(shí)事物

25、的規(guī)律,這里不打算把這些概念一股腦兒和盤托出,而是分散到以后的章節(jié)中,逐步予以介紹。這里只就信息有關(guān)的兩個(gè)基本的、重要的概念進(jìn)行討論。,首先,關(guān)于“共同知識(shí)”的概念。一個(gè)博弈問題所涉及的“自然”的不同選擇、參與者的行動(dòng)以及相應(yīng)產(chǎn)生的效用(效果、收益)都是一種知識(shí)(信息)。比如,房地產(chǎn)開發(fā)商博弈問題,市場需求的大小,開發(fā)商A、B是開發(fā)還是不開發(fā),不同情況下的利潤和虧損,都是知識(shí)。開發(fā)商A、B知道這些知識(shí)也是一種信息,開發(fā)商A知道開發(fā)商B知道這些知識(shí)也是一種信息,如此等等。博弈論所謂的共同知識(shí)指的是“所有參與者知道,所有參與者知道所有參與者知道,所有參與者知道所有參與者知道所有參與者知道”的知識(shí)。

26、可以聯(lián)想到市場需求大小是一種知識(shí)??赡荛_發(fā)商A、B都知道市場需求有大與小兩種狀態(tài),但是開發(fā)商A并不知道開發(fā)商B知道市場需求,這時(shí)市場需求就不構(gòu)成共同知識(shí),而只能說是A與B“共同”享有的知識(shí)。,為了說明共同知識(shí)的重要性,我引用一個(gè)眾所周知的寓言。故事發(fā)生在一個(gè)村莊,村里有100對(duì)已婚夫婦,他們都是地道的邏輯學(xué)家,但也有一些多少有點(diǎn)奇特的社會(huì)風(fēng)俗。每天晚上,村里的男人們都將點(diǎn)起篝火,繞圈圍坐舉行一個(gè)會(huì)議,且每個(gè)人都談?wù)撟约旱钠拮?。在?huì)議開始時(shí),如果一個(gè)男人有理由認(rèn)為他的妻子對(duì)他總是守貞的,那么他就對(duì)在坐的男人們贊揚(yáng)她的美德。另一方面,如果在當(dāng)前會(huì)議之前的任何時(shí)間,只要他發(fā)現(xiàn)了他妻子不貞的證據(jù),那他

27、就會(huì)悲鳴慟哭,并祈求神靈嚴(yán)厲地懲罰她。再則,如果一個(gè)妻子曾有不貞,那她和她的情人將會(huì)立即通知村里除她丈夫外所有的男人。所有這些傳統(tǒng)都是村民們的共同知識(shí)。,事實(shí)上,每個(gè)妻子都已對(duì)自己的丈夫不忠。于是,每個(gè)丈夫都知道除自己的妻子外都是不貞的女人,而對(duì)自己的妻子每晚都要贊揚(yáng)。,這種狀況持續(xù)了很多年,直到一個(gè)傳教徒走訪到這個(gè)村莊。他坐在髯火旁參加了一次會(huì)議并聽到每個(gè)男人都贊揚(yáng)自己的妻子之后,他站到丈夫們圍坐的圓中心,大聲地說:“這個(gè)村里有一個(gè)妻子已經(jīng)不貞了?!痹诖撕蟮?9個(gè)晚上丈夫們繼續(xù)開會(huì)并贊揚(yáng)他們的妻子,但在第100個(gè)晚上,他們?nèi)急Q偷哭并祈求嚴(yán)厲地懲罰他們的妻子。,為了理解在這個(gè)寓言中發(fā)生了什

28、么,首先注意到若只有一個(gè)妻子不貞,則因?yàn)椋ㄖ罌]有另外的不貞女人,且若有的話他是知道的)她丈夫能夠立刻知道這個(gè)不貞的女人是他的妻子,所以在傳教徒訪問后的第一天晚上就會(huì)悲鳴慟哭。而且,由歸納法可以證明,對(duì)于1與100之間的任一正整數(shù),如果恰有個(gè)不貞的妻子,那么在傳教徒訪問后的連續(xù)個(gè)晚上,所有的丈夫仍全都贊揚(yáng)自己的妻子,但在第個(gè)晚上,個(gè)不貞妻子的丈夫會(huì)悲鳴慟哭。于是,在99個(gè)贊揚(yáng)之夜過后的第100個(gè)晚上,每個(gè)丈夫都知道一定有100個(gè)不貞的妻子,包括他自己的妻子在內(nèi)。,現(xiàn)在,讓我們?cè)噯栆幌?,這個(gè)傳教徒告訴了這些丈夫們他們所不知道的什么?每個(gè)丈夫都已經(jīng)知道了99個(gè)不貞的妻子,故這對(duì)任何人來說都不是新聞

29、。但“這個(gè)傳教徒對(duì)所有男人做了一個(gè)聲明”是共同知識(shí),從而這個(gè)傳教徒所聲明的內(nèi)容,即有一個(gè)不貞的妻子,也就成了所有男人中間的共同知識(shí)。在傳教徒宣告之前,每個(gè)形如“(每個(gè)丈夫知道)有一個(gè)不貞的妻子”的判斷對(duì)于99都是正確的,但對(duì)100就不正確了。例如,若從1到100對(duì)丈夫們編號(hào),則1已經(jīng)知道2已經(jīng)知道3已經(jīng)知道99已經(jīng)知道100的妻子是不貞的,但1不知道2已經(jīng)知道3已經(jīng)知道99已經(jīng)知道100已經(jīng)知道1的妻子是不貞的。因而,從這個(gè)寓言中引申出的含義是,從一個(gè)共同知識(shí)的事實(shí)推出的結(jié)果與從(例如)只知道每個(gè)人已經(jīng)知道每個(gè)人已經(jīng)知道的一個(gè)事實(shí)推出的結(jié)果可以非常不同。,其次,關(guān)于“完全信息”的概念。完全信息

30、是博弈論非常重要的基本概念,有了上述的共同知識(shí)概念,這里就可以給出完全信息的嚴(yán)格定義。完全信息指的是所有參與者各自選擇的行動(dòng)的不同組合所決定的各參與者的收益對(duì)所有參與者來說是共同知識(shí)。簡單通俗地說,完全信息是指每一個(gè)參與者對(duì)自己以及其他參與者的行動(dòng),以及各參與者選擇的行動(dòng)組合產(chǎn)生的收益等知識(shí)有完全的了解。,(3)戰(zhàn)略。戰(zhàn)略是參與者如何對(duì)其他參與者的行動(dòng)作出反應(yīng)的行動(dòng)規(guī)則,它規(guī)定參與者在什么時(shí)候該選擇什么行動(dòng)?;蛘哒f。戰(zhàn)略是參與者“相機(jī)行動(dòng)方案”。,戰(zhàn)略是一個(gè)與過程有關(guān)的概念,行動(dòng)是與時(shí)序無關(guān)的動(dòng)作。打個(gè)比方,行動(dòng)好比拳術(shù)中的一招一式,戰(zhàn)略就是一招一式構(gòu)成的套路。,(4)收益。在博弈論中,收益指

31、的是在一個(gè)特定的戰(zhàn)略組合下參與者得到的確定效用或期望效用。效用通常表現(xiàn)為博弈結(jié)果中 的輸贏、得失、盈虧。效用必須能用數(shù)值刻畫其大小。收益是博弈參與者真正關(guān)心的問題。,博弈論的一個(gè)基本特征是一個(gè)參與者的收益不僅取決于自己的戰(zhàn)略選擇,而且取決于所有參與者的戰(zhàn)略選擇。或者說,收益是所有參與者各選定一個(gè)戰(zhàn)略形成的戰(zhàn)略組合的函數(shù)。在博弈論中,通常用ui表示參與者i的收益,一個(gè)戰(zhàn)略組合是,每個(gè)參與者的收益可以表示為,均衡是博弈論最重要、最基礎(chǔ)的一個(gè)概念,對(duì)于不同類型、不同條件的博弈問題又形成各種各樣特定的均衡的概念,它們構(gòu)成博弈論五彩繽紛的預(yù)測結(jié)果。各種均衡在社會(huì)經(jīng)濟(jì)等不同的領(lǐng)域都展現(xiàn)出廣闊的應(yīng)用前景。讀

32、者充分、深刻地理解這些均衡概念是非常重要的。,有了上面完全信息的概念,再結(jié)合參與者行動(dòng)的先后次序的界定,就可以對(duì)博弈論的類型作出劃分。如果參與者同時(shí)選擇各自的行動(dòng),則這類博弈稱為靜態(tài)的。值得注意的是,這里所說的“同時(shí)”具有雙層含義。一種含義就是“同時(shí)”的字面解釋,也就是參與者在同一時(shí)間一起行動(dòng);另一種含義是參與者行動(dòng)雖然有先后,但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng)。,動(dòng)態(tài)博弈指的是參與者的行動(dòng)有先后順序,并且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。后行動(dòng)者就可以依據(jù)獲得的信息,采取自己認(rèn)為最有力的戰(zhàn)略。憑直觀理解,完全信息總要比不完全信息要好一些,靜態(tài)的情形又要比動(dòng)態(tài)的情形要簡單一些。

33、如果將信息的完全與不完全、狀態(tài)的靜與動(dòng)交叉組合,就構(gòu)成了四種不同類型的博弈。從簡單到復(fù)雜排列,就是完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈不完全信息靜態(tài)博弈不完全信息動(dòng)態(tài)博弈。,3、博弈論研究著名學(xué)者簡介,(1)、計(jì)算機(jī)之父、博弈論創(chuàng)始人馮諾伊曼,約翰馮諾伊曼(John Von Neumann,19031957),美籍匈牙利人。19211923年在蘇黎世大學(xué)學(xué)習(xí)。很快又在1926年以優(yōu)異的成績獲得了布達(dá)佩斯大學(xué)數(shù)學(xué)博士學(xué)位,此時(shí)馮諾伊曼年僅22歲。馮諾伊曼是20世紀(jì)最優(yōu)秀的數(shù)學(xué)家之一,因1946年發(fā)明電子計(jì)算機(jī)而被西方人譽(yù)為“計(jì)算機(jī)之父”。,19271929年馮諾伊曼相繼在柏林大學(xué)和漢堡大學(xué)擔(dān)任數(shù)學(xué)講

34、師。1930年接受了普林斯頓大學(xué)客座教授的職位,西渡美國,1931年成為該校終身教授。他是美國國家科學(xué)院、秘魯國立自然科學(xué)院和意大利國立林且學(xué)院的院士。 馮諾伊曼建立了算子代數(shù)這門新的數(shù)學(xué)分支。在格論、連續(xù)幾何、理論物理、動(dòng)力學(xué)、連續(xù)介質(zhì)力學(xué)、氣象計(jì)算、原子能和經(jīng)濟(jì)學(xué)等領(lǐng)域都做過重要的工作。然而,馮諾伊曼對(duì)人類的最大貢獻(xiàn)是對(duì)計(jì)算機(jī)科學(xué)、計(jì)算機(jī)技術(shù)和數(shù)值分析的開拓性工作。 馮諾伊曼于20世紀(jì)20年代開始創(chuàng)立博弈理論,1944年他與經(jīng)濟(jì)學(xué)家奧斯卡摩根斯特恩合作出版的巨著博弈論與經(jīng)濟(jì)行為,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的初步形成。馮諾伊曼和摩根斯特恩在該書中提出的標(biāo)準(zhǔn)型、擴(kuò)展型和合作型博弈模型解的概念和分析

35、方法,奠定了這門學(xué)科的理論基礎(chǔ)。,()、博弈論大師納什,納什(John Nash),1928年6月13日出生于美國弗吉尼亞西部的“布魯菲爾德”(Bluefield),高中畢業(yè)后進(jìn)入卡內(nèi)基梅隆大學(xué)學(xué)習(xí)化學(xué)工程專業(yè), 由于對(duì)數(shù)學(xué)的喜好和天賦,一年后正式轉(zhuǎn)到數(shù)學(xué)系。在畢業(yè)時(shí),他取得數(shù)學(xué)學(xué)士和理學(xué)學(xué)士兩個(gè)學(xué)位。 1950年納什22歲時(shí)通過論文答辯獲得普林斯頓大學(xué)的博士學(xué)位。正是這篇天才論文,奠定了他博弈論大師的地位,并為他鋪墊了通向諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的道路。1951年納什又發(fā)表了第二篇題為“非合作博弈”(NonCooperativeGames,Annals of Mathematics1951)的論文。在

36、此之前,他還撰寫了“討價(jià)還價(jià)問題”。1958年財(cái)富雜志把納什評(píng)為新一代 天才數(shù)學(xué)家中最出色的人物。也許是天妒英才,正當(dāng)麻省理工學(xué)院準(zhǔn)備提升他為正教授時(shí),年方30歲的納什得了嚴(yán)重的“妄想型精神分裂癥”,從此他從學(xué)術(shù)界銷聲匿跡,飽受精神病的折磨長達(dá)30多年。,納什的主要貢獻(xiàn)是1950年和1951年發(fā)表的兩篇關(guān)于非合作博弈論的重要論文,他的研究徹底改變了人們對(duì)競爭和市場的看法。1950年納什發(fā)表的“非合作對(duì)策”博士論文提出了與諾伊曼的合作對(duì)策論相對(duì)立的觀點(diǎn)。納什在論文中引入了著名的“納什均衡”理論,對(duì)有混合利益的競爭者之間的對(duì)抗進(jìn)行了數(shù)學(xué)分析。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即

37、著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。納什的研究奠定了現(xiàn)代非合作博弈論的基石,他是繼馮諾伊曼之后最偉大的博弈論大師之一,他提出的著名的納什均衡的概念在非合作博弈理論中起著核心作用。后續(xù)的研究者對(duì)博弈論的貢獻(xiàn),都是建立在這一概念之上的。納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、管理學(xué)、社會(huì)學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅(jiān)實(shí)的理論基礎(chǔ)。,()、動(dòng)態(tài)博弈理論的開創(chuàng)者澤爾騰,澤爾騰(R.Selten)1930年10月10日出生于德國的布雷斯勞(二戰(zhàn)后,此地歸于波蘭),19511957年,他在法蘭克福大學(xué)學(xué)習(xí)數(shù)學(xué)。1961年在馬恩法蘭克福大學(xué)獲得了數(shù)學(xué)博士學(xué)位。1967196

38、8年,澤爾騰到加州大學(xué)伯克利分校做客座教授,19691972年在柏林大學(xué)做經(jīng)濟(jì)學(xué)教授,而后在比勒菲爾德大學(xué)工作了12年。1984年澤爾騰離開比勒菲爾德大學(xué),到波恩大學(xué)從教,致力于實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的研究。,澤爾騰的主要貢獻(xiàn)是在納什均衡的基礎(chǔ)上深入研究了動(dòng)態(tài)博弈問題。澤爾騰通過研究發(fā)現(xiàn),“納什均衡”概念在實(shí)際應(yīng)用中存在缺陷。納什均衡的缺陷是,一般情況下能夠保證存在性,但不能保證唯一性。大多數(shù)情況下納什均衡有多個(gè),由此帶來的問題就是,多個(gè)納什均衡中究竟哪一個(gè)才是博弈的理性結(jié)局?澤爾騰認(rèn)為“納什均衡”概念只適用于分析一些靜態(tài)的“重復(fù)性博弈”,而不適用于分析動(dòng)態(tài)博弈問題。他對(duì)“納什均衡”概念進(jìn)行了精心的研究,

39、先后提出了兩個(gè)著名均衡新概念:子博弈完美均衡,顫抖手完美均衡。他采用“逆向歸納法”,在多個(gè)納什均衡中剔除了一些按照一定規(guī)則不合理的均衡點(diǎn),從而形成了納什均衡的“精煉”概念,在擴(kuò)展型博弈分析方面取得了重大成果。,()、不完全信息博弈理論的奠基者海薩尼,約翰海薩尼(John CHarsanyi),美國人,由于受到納什成果的影響,從20世紀(jì)50年代開始潛心于博弈論的研究。海薩尼的研究成果非常豐富:(1)在合作博弈論研究上,給出了合作博弈的通解N人議價(jià)模型,建立了一個(gè)合作博弈論的非合作博弈模型;(2)在不完全信息博弈研究上,提出了以類型為基礎(chǔ)的不完全信息博弈建模方法,引入了貝葉斯技術(shù)求解方法,對(duì)混合策

40、略進(jìn)行了重新解釋,提出了基于隨機(jī)變量的變動(dòng)收益博弈模型;(3)在均衡選擇研究上,與澤爾騰合作完成了博弈論均衡選擇的一般理論。 約翰海薩尼通過多方面的研究將自己的思想構(gòu)成了一個(gè)完整的體系,他提出的不完全信息博弈思想及貝葉斯納什均衡概念,對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。,(5)、米爾利斯,詹姆斯亞歷山大米爾利斯(J.Y.Morlis),出生于1936年7月5日蘇格蘭柯庫布里郡明尼加大。1996年10月8日,由于對(duì)不對(duì)稱信息條件下的激勵(lì)經(jīng)濟(jì)理論做出了基礎(chǔ)性貢獻(xiàn),與威廉維克里分享諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。 米爾利斯對(duì)不對(duì)稱信息經(jīng)濟(jì)學(xué)的貢獻(xiàn)包括:在最優(yōu)所得稅機(jī)制設(shè)計(jì)問題上,探討了政府在面臨信息不完全的情況下如何去

41、設(shè)計(jì)出一種“激勵(lì)性相容”的最優(yōu)稅收體制,提出了顯示原則:解決激勵(lì)問題的關(guān)鍵是要通過一種與個(gè)人利益相容的方式,引導(dǎo)所有人如實(shí)表露自己的信息;在最優(yōu)契約設(shè)計(jì)問題上,以“委托人一代理人方法”對(duì)道德危險(xiǎn)問題進(jìn)行了重新闡 述,得出的結(jié)論是:為了使代理人有足夠的激勵(lì)去自動(dòng)選擇有利于委托人的行動(dòng),就必須在合同的設(shè)計(jì)中讓代理人也承擔(dān)一部分結(jié)果不確定的風(fēng)險(xiǎn);在信號(hào)篩選理論方面,提出了區(qū)分 不同信號(hào)的“斯彭斯一米爾利斯條件”。,第二部分、完全信息靜態(tài)博弈,博弈的標(biāo)準(zhǔn)式表述 嚴(yán)格占優(yōu)戰(zhàn)略均衡 逐步剔除嚴(yán)格戰(zhàn)略均衡 納什均衡應(yīng)用舉例 混合戰(zhàn)略納什均衡 納什均衡的存在性,一、博弈的標(biāo)準(zhǔn)式表述與納什均衡,本章重點(diǎn)介紹完全

42、信息靜態(tài)博弈,它是一種最基本的最簡單的博弈。上一章給出了完全信息和靜態(tài)博弈的概念,這里簡要回顧一下。完全信息指的是博弈的每一個(gè)參與者對(duì)自己以及其他參與者的行動(dòng)空間、收益函數(shù)等知識(shí)是完全了解的。靜態(tài)博弈指的是博弈的參與者同時(shí)選擇各自的行動(dòng),如果選擇行動(dòng)有先后的話,那么后行動(dòng)者也不知道先行動(dòng)者采取了什么行動(dòng)。博弈論入門的兩個(gè)最基本問題是:如何描述一個(gè)博弈問題和如何求得博弈問題的解。本章對(duì)完全信息靜態(tài)博弈的標(biāo)準(zhǔn)式表述、尋求均衡(博弈預(yù)測的結(jié)果)方法以及納什均衡的有關(guān)定義、理論與方法進(jìn)行討論。,(一)、博弈的標(biāo)準(zhǔn)式表述,(二)、嚴(yán)格占優(yōu)戰(zhàn)略均衡,博弈分析的目的是預(yù)測博弈的均衡結(jié)果。簡言之,就是求解博弈

43、問題。這里需要假定“參與者是理性的”是共同知識(shí)。經(jīng)濟(jì)學(xué)對(duì)理性的描述是,在給定的約束條件下追求效用最大化。參與者在博弈過程中,在每一步斟酌的取舍(選優(yōu)剔劣)時(shí),都應(yīng)依據(jù)這個(gè)假定行事。一般說來,由于每個(gè)參與者的收益是博弈中所有參與者所選戰(zhàn)略的函數(shù),因此,每個(gè)參與者的最優(yōu)戰(zhàn)略選擇必須考慮所有其他參與者的戰(zhàn)略選擇。但在一些特殊的博弈中,一個(gè)參與者的最優(yōu)戰(zhàn)略可能不需要考慮其他參與者如何選擇戰(zhàn)略,就是說,不論其他參與者選擇什么戰(zhàn)略,該參與者有唯一一個(gè)最優(yōu)戰(zhàn)略,這個(gè)最優(yōu)戰(zhàn)略稱為嚴(yán)格占優(yōu)戰(zhàn)略。下面給出嚴(yán)格占優(yōu)戰(zhàn)略定義。,顯然,在一個(gè)博弈問題中,如果所有參與者都有一個(gè)嚴(yán)格占優(yōu)戰(zhàn)略,那么每一個(gè)理性的參與者誰也不會(huì)

44、放棄他的嚴(yán)格占優(yōu)戰(zhàn)略。這樣,由全部嚴(yán)格占優(yōu)戰(zhàn)略就構(gòu)成博弈的解嚴(yán)格占優(yōu)戰(zhàn)略均衡。,應(yīng)該指出的是,嚴(yán)格占優(yōu)戰(zhàn)略只要求每個(gè)參與者是理性的,而并不要求每個(gè)參與者知道其他參與者是理性的(即不要求“理性”是共同知識(shí))。這是因?yàn)?,不論知道與否,嚴(yán)格占優(yōu)戰(zhàn)略總是一個(gè)理性參與者的最佳選擇。,值得注意的是,囚徒困境博弈暴露了個(gè)人理性與團(tuán)體理性的沖突問題。因?yàn)榍敉?與囚徒2都選擇沉默,每人只判刑1個(gè)月,這顯然要比(坦白,坦白)都判刑6個(gè)月有利。(沉默,沉默)不是一個(gè)均衡,因?yàn)樗粷M足個(gè)人理性的要求。換個(gè)角度考慮,即使兩個(gè)囚徒在被捕前訂立了攻守同盟(拒不坦白),這個(gè)同盟也沒有用,因?yàn)闆]有人會(huì)嚴(yán)格遵守同盟協(xié)定(這時(shí),只

45、要誰一坦白,他就立即獲得釋放)。,(三)、逐步剔除嚴(yán)格劣戰(zhàn)略均衡,尋求博弈問題的解的過程就是參與者選擇戰(zhàn)略的過程。選擇有兩種途徑:選優(yōu)與去劣。上面尋求嚴(yán)格占優(yōu)戰(zhàn)略均衡走的就是選優(yōu)的路子。下面介紹的逐步剔除嚴(yán)格劣戰(zhàn)略尋求均衡走的就是去劣的路子。,研究圖21所示的一個(gè)博弈問題。,這樣一來,參與者1就可以將圖21所示的博弈視同為圖22所示的博弈。,在圖22中,對(duì)參與者1來說,戰(zhàn)略“下”相對(duì)于戰(zhàn)略“上”是嚴(yán)格劣戰(zhàn)略(因?yàn)?1,且01)。于是,如果參與者1是理性的(并且參與者1知道參與者2是理性的,原博弈才能簡化為圖22),那么參與者1就不會(huì)選擇“下”。這時(shí),如果參與者2知道參與者1是理性的,并且參與者

46、2知道參與者1知道參與者2是理性的(只有這樣,參與者2知道原博弈已被簡化為圖22所示博弈),那么參與者2就可以把“下”從參與者1的戰(zhàn)略空間S1中剔除。,這樣一來,參與者2又可以進(jìn)一步將圖22所示博弈簡化為圖23所示博弈,那么,圖24的博弈有沒有均衡結(jié)果呢?后面我們還會(huì)討論。,另外,嚴(yán)格占優(yōu)戰(zhàn)略均衡和逐步剔除嚴(yán)格劣戰(zhàn)略均衡對(duì)參與者理性的要求是不同的。前者只要每個(gè)參與者是理性的,而后者卻要求理性是參與者的共同知識(shí)。只有在“參與者2是理性的,且參與者1知道參與者2是理性的”條件下,圖21的博弈才能簡化為圖22的情形。一共用了三步剔除得到了結(jié)果。顯然,參與者的戰(zhàn)略空間越大,剔除的步驟就越多,對(duì)共同知識(shí)

47、的要求就越嚴(yán)格。,定義 在標(biāo)準(zhǔn)式的博弈中,設(shè)si和si是參與者i的兩個(gè)可行戰(zhàn)略。若下式,類似于運(yùn)用逐步剔除嚴(yán)格劣戰(zhàn)略去尋求一個(gè)均衡結(jié)果,自然想到運(yùn)用逐步剔除劣勢戰(zhàn)略也是求解博弈問題的一種方法。,考察下面圖25所示的博弈問題。,(四)、納什(Nash)均衡,納什均衡是完全信息靜態(tài)博弈的解的一般概念,它是對(duì)非常廣泛博弈問題給出更加嚴(yán)格的結(jié)果。首先,許多不存在嚴(yán)格占優(yōu)戰(zhàn)略均衡或逐步剔除嚴(yán)格劣戰(zhàn)略均衡的博弈,卻存在納什均衡。其次,嚴(yán)格占優(yōu)戰(zhàn)略均衡一定就是博弈問題的惟一的納什均衡。再者納什均衡一定不會(huì)被逐步剔除嚴(yán)格劣戰(zhàn)略所剔除??梢赃@么說,沒有任何一個(gè)戰(zhàn)略組合嚴(yán)格優(yōu)于納什均衡。 為了理解納什均衡的含義,

48、設(shè)想博弈理論對(duì)一個(gè)n個(gè)參與者博弈中的每一個(gè)參與者選定的一個(gè)戰(zhàn)略,預(yù)測的博弈結(jié)果為s*(s1*,si*,sn*)。其中,si*是理論上導(dǎo)出的參與者i的戰(zhàn)略。首先,理論上確定的每個(gè)參與者要選擇的戰(zhàn)略必須是針對(duì)其他參與者選擇戰(zhàn)略的最優(yōu)反應(yīng)。其次,遵循理論結(jié)果產(chǎn)生的效用不會(huì)小于偏離理論結(jié)果時(shí)的效用,也就是沒有參與者愿意單獨(dú)偏離理論給他選定的戰(zhàn)略,這種理論導(dǎo)出的結(jié)果時(shí)一種“戰(zhàn)略相對(duì)穩(wěn)定”狀態(tài)。我們就把這種狀態(tài)稱為一個(gè)納什均衡。,和納什均衡的導(dǎo)出密切相關(guān)的是協(xié)議的理念。對(duì)給定的博弈,如果參與者之間要商定一個(gè)協(xié)議決定博弈如何進(jìn)行,那么一個(gè)有效的協(xié)議中的戰(zhàn)略組織必須是納什均衡的戰(zhàn)略組合,否則至少有一個(gè)參與者會(huì)

49、不遵循該協(xié)議。,運(yùn)用上述定義中不等式(NE)的條件,就可以檢查一個(gè)特定的戰(zhàn)略組合是不是納什均衡。比如,在囚徒困境中,對(duì)參與者1(囚徒1)選s1*坦白,對(duì)參與者2(囚徒2)選s2*坦白。,考察圖24所示的博弈。,從圖26可以看出,一個(gè)單元中只有一個(gè)數(shù)值下面劃了橫線,表明只有一方的戰(zhàn)略上針對(duì)另一方戰(zhàn)略的最優(yōu)反應(yīng),而另一方的戰(zhàn)略卻表示針對(duì)對(duì)方戰(zhàn)略的最優(yōu)反應(yīng)。因此該單元對(duì)應(yīng)的戰(zhàn)略組合就不是雙方同時(shí)愿意接受的結(jié)果,因而也就構(gòu)不成納什均衡。,通過上面闡述,讀者已經(jīng)接觸了各種博弈均衡的概念和尋求均衡結(jié)果的方法,現(xiàn)在著重分析一下它們之間的關(guān)系。,(1) 每一個(gè)嚴(yán)格占優(yōu)戰(zhàn)略均衡一定是納什均衡,反之不然。,(2) 每一個(gè)逐步剔除嚴(yán)格占優(yōu)戰(zhàn)略均衡是納什均衡,反之不然。,這里就不作嚴(yán)格的論證了?;仡欀秦i爭食博弈和圖21所示的博弈,對(duì)逐步剔除嚴(yán)格劣戰(zhàn)略過程和劃橫線方法尋求納什均衡的過程的比較,可以領(lǐng)會(huì)上述結(jié)論的含義。反例可以從圖26所示博弈看出。s*(下,右)是納什均衡,但該博弈逐步剔除嚴(yán)格劣戰(zhàn)略卻一步也不能施行。,(3) 如果戰(zhàn)略組合是納什均衡,那么它一定不會(huì)被逐步剔除嚴(yán)格劣戰(zhàn)略剔除。,成立。,在本章的最后,再

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論