課數(shù)學建模博弈模型課件_第1頁
課數(shù)學建模博弈模型課件_第2頁
課數(shù)學建模博弈模型課件_第3頁
課數(shù)學建模博弈模型課件_第4頁
課數(shù)學建模博弈模型課件_第5頁
已閱讀5頁,還剩127頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

博弈模型第一部分、博弈論基本概念

宇宙間處處存在矛盾、沖突、爭斗、合作、共生等現(xiàn)象,這些現(xiàn)象很很早就引起各類學者的重視。數(shù)學被認為是科學的語言,能否用數(shù)學語言描述各種帶有矛盾因素的模型或現(xiàn)象?博弈論便是這樣一種處理各類帶有矛盾因素的模型的數(shù)學工具,現(xiàn)在已被數(shù)學、經(jīng)濟學、社會學、軍事學、生物學等專家廣泛應用于討論各類帶有沖突、矛盾、合作、競爭、進化等問題及相關模型之中。博弈論已成為人們分析復雜系統(tǒng)與作重大決策時的有力工具。一、引言數(shù)學研究的方法是從大量的同類現(xiàn)象中抽象出基本要素,進步構造出能描述這類現(xiàn)象的模型。許多沖突模型在游戲中就存在,博弈論早期就是由研究國際象棋開始的,所以被命名為GameTheory。人們很快認識到此種理論可用于經(jīng)濟、政治、軍事等領域,所謂“世事紛爭一棋局”,正說明其中一些道理。1944年馮·諾曼(John,VonNeumann)和奧·摩根斯特恩(OskerMor-gentern)合著的《競賽論與經(jīng)濟行為》(TheoryOfGSmesandEconomicBehavior)問世,總結了初期研究成果,奠定了博弈論的基礎。由于該理論主要討論在復雜的矛盾沖突等活動中,局中人(Player)采取何種合理的策略(strategy)而能處于“優(yōu)越”的地位,以便取得較好效益,所以將它譯為博弈論。

博弈論(Gametheory)可以被定義為是對智能的理性決策者之間沖突與合作的數(shù)學模型的研究。博弈論為分析那些涉及兩個或更多個參與者且其決策會影響相互間的福利的局勢提供了一般的數(shù)學方法。就此而論,博弈論便為社會科學各分支的學者和實際的決策者提供了非常重要的視角。博奕理論家所研究的局勢,不僅僅是“游戲(Game)”一詞所不幸表示的消遣活動,“沖突分析”或“相互影響的決策理論”或許是描述博弈論更為準確的術語。常見的游戲如棋類,兩人對奕,此兩人便稱為局中人,他們各有一套棋路,或善于用馬,或長于用炮。在每次輪到一方走子時,他可能有許多走法,這些走法依賴于當時棋局形勢以及棋手想要達到的目的,以及他慣用的走法,從而形成他走棋的指導思想。對奕時指導棋手行動的思想便稱為策略。對局終了可能有三種結局:甲勝;乙勝;和局。如果用數(shù)量表示各種結局,例如勝家贏得彩金若干(設所得彩金由輸家付給,則輸家當然失去若干),和局時都不能取得彩金,此種表示結局的數(shù)稱為支付(payoff)。局中人、策略、支付是博弈論中常見的基本概念。

有些游戲中并無“機會”(chance)因素,而是全憑局中人的技藝。但某些游戲如“橋牌”、“打百分”等,“機會”卻有較大作用,分發(fā)到游戲者手中的牌是隨機的,它們情況要復雜一些。

游戲并非只有雙方,可以有多方,如三人玩的跳棋便有三個局中人。一般只有兩個局中人的稱為兩人博奕(或二人對策),有二個局中人的稱為n人博弈。在博弈論的語言中,一個博弈(game)指的是涉及到兩個或更多個參與人的某個社會局勢。博弈所涉及的參與人被稱為局中人(players)。正如前面博弈論的定義所述,博弈理論家一般要對局中人做兩個基本的假設:他們都是理性的和他們都是智能的。這兩個形容詞在這里都是技術性術語,所以需要對其逐一解釋。1、博弈論幾個經(jīng)典的例子

兩個共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一個人招認犯罪,否則警方無充分證據(jù)將他們按罪判刑。警方把他們關入不同的牢室,并對他們說明不同行動帶來的后果。如果兩人都采取沉默的抗拒態(tài)度,因警方證據(jù)不足,兩人將均被判為輕度犯罪入獄1個月;如果雙方都坦白,根據(jù)案情兩人將被判入獄6個月;如果一個招工而另一個拒不坦白,招認者因有主動認罪立功表現(xiàn)將立即釋放,而另一人將被判入獄9個月(所犯罪行判6個月,干擾司法加判3個月)。例一囚徒困境

囚徒困境問題可以用圖1-1所示的雙變量矩陣的形式來描述。

在此博弈中,每個囚徒有兩種戰(zhàn)略可供選擇:坦白(或招認)、不坦白(或沉默)。圖1-1的矩陣中每一個單元的兩個數(shù)字表示一組特定的戰(zhàn)略組合下兩個囚犯的收益(或支付、效用,這里已經(jīng)開始引用經(jīng)濟學的術語了),其中第1個數(shù)字是囚徒1(習慣上是位于矩陣橫行上的參與者)的收益,第2個數(shù)字是囚徒2(位于豎行上的參與者)的收益。如果囚徒1選擇沉默,而囚徒2選擇坦白,那么囚徒1的收益是-9(表示判刑9個月),囚徒2的收益為0(表示馬上釋放)。

博弈論囚徒困境問題提供的解是戰(zhàn)略組合(坦白,坦白)。嚴格的定義與詳細的闡述留到第2章討論。這個戰(zhàn)略組合是個占優(yōu)戰(zhàn)略組合,因為無論對方如何選擇,自己的最優(yōu)選擇都是坦白。如果囚徒2不坦白,囚徒1坦白的話他就會馬上獲釋,不坦白的話還得坐一個月的牢,所以坦白比不坦白好;如果囚徒2坦白,囚徒1坦白的話要判6個月,不坦白的話則要判9個月,這樣對囚徒1來說,還是坦白比不坦白好。因此坦白是囚徒1的占優(yōu)戰(zhàn)略。同樣的分析表明,坦白也是囚徒2的占優(yōu)戰(zhàn)略。均衡的結果是每個囚徒都選擇坦白,各判刑6個月。

初次接觸博弈論的人,難免會提出這樣的問題:戰(zhàn)略組合(沉默,沉默),即如果兩個人都不坦白,各人只判刑一個月,不是比戰(zhàn)略組合(坦白,坦白)帶來的各判刑6個月要好嗎?如果經(jīng)濟學中的“有效”的術語,(沉默,沉默)是一個有效結局。有效結局并不是囚徒問題的博弈解,與此相關的理論問題在第2章里可以找到答案。

與囚徒困境類似的博弈問題在經(jīng)濟、社會領域有許許多多的版本,下面再舉幾個例子。

A,B兩個公司以高低兩種價格向市場競相銷售同一種產(chǎn)品。雙方協(xié)定以高價格壟斷市場,可以使彼此獲得滿意的利潤收益,至少要好于雙方都以低價格出售產(chǎn)品的情形。但如果某一方堅持高價,而另一方為了獨占市場卻將產(chǎn)品以低價格推銷(協(xié)定不受遵守而不受處罰),那么后者將獲高盈利而前者將損失慘重。市場上商品的價格戰(zhàn),常常出現(xiàn)的結局一般是以低價格銷售商品,消費者從中得到好處,這種結果正是博弈論預測的合理結局,你們不妨自己設計一個類似于圖1-1的A,B公司的收益矩陣。

公司產(chǎn)品的供給也是一個類似囚徒困境的問題。每個人可供選擇的戰(zhàn)略是:出錢、不出錢。如果大家都出錢興辦公共事業(yè),所有人的福利都會增加。問題是,如果我出錢,你不出錢,我得不償失;如果我不出錢你出錢,我就可以占你的便宜。結果是每個人的最優(yōu)選擇都是不出錢。再有個例子是軍備競賽問題。美蘇冷戰(zhàn)期間,兩個超級大國構成博弈的兩方,可供選擇的戰(zhàn)略是:擴軍(增加軍費運算)、裁軍(減少軍費運算)。如果雙方都熱衷于擴軍,兩國都要為此付出高額軍費(從社會福利角度來看這是一筆龐大的付收益);如果雙方都選擇裁軍,則可省下這筆錢;如果一方面裁軍而另一方面進行擴軍,擴軍的一方到時候就會以武力相威脅甚至發(fā)動戰(zhàn)爭,這是,戰(zhàn)爭勝敗雙方的收益與支付將出現(xiàn)難以估量的差異。我們可以給出一個假象的雙變量收益矩陣,如圖1-2所示。

博弈論給出軍備競賽問題的是戰(zhàn)略組合(擴軍,擴軍),博弈理論預測雙方都擴軍可以達到對抗中的相對穩(wěn)定,這是一個符合現(xiàn)實的合理結局。例二

海灘占位

甲乙兩個冷飲攤販,他們在一個直線狀的海灘上,以同樣的價格、相同的質量向均勻分布在海灘上的眾多游客(他們來此享受海水和陽光,進行日光浴或游泳活動)銷售冷飲。既然是做生意,目的總是希望盡可能多賺點錢,甲乙兩人又是在同一地點做同樣的生意,競爭就是不可避免的事情了。這兩個冷飲攤販應該如何安置自己的攤位,才能相安無事地做各自的生意呢?

假定游客總是到距離自己最近的攤位購買冷飲,這也是合乎常情的。為了敘述方便,不妨將海灘長度標準化為1。按通常的想法,如果海灘左端定為0,甲在1/4處設攤,乙在3/4處設攤(見圖1-3),這樣既方便了顧客,又照顧到甲乙二人各占約一半顧客的生意,可謂公平合理。問題不是簡單的解決了嗎?

博弈論對海灘占位問題的解是甲乙二人均選擇在海灘中點(1/2處)設攤,而不是原先想象的甲乙分別在1/4和3/4處占位,即使集中在一起營業(yè)會給海灘兩端的顧客帶來不便。社會經(jīng)濟領域內(nèi),就有不少與海灘占位博弈類似的現(xiàn)象。比如,在城市商業(yè)網(wǎng)點的布局上,常常會出現(xiàn)相同行業(yè)的多家商店都擠在一起,形成“電子一條街”、“裝飾城”、“飲食廣場”等。只要把這個城市想象成東西或南北方向的一個“海灘”,從博弈論中就不難找到答案。又如,同一城市的不同航空公司經(jīng)營的飛往同一目的地的航班,常常出現(xiàn)起飛時刻幾乎相同的現(xiàn)象。

就是在文化娛樂方面,也能運用海灘占位的博弈結論予以解釋。如果把電視中高雅藝術節(jié)目與較低檔的節(jié)目比作海灘的兩端,那么眾多的電視觀眾就可以看作是散布在海灘上的游客。電視臺常常將黃金時段的電視節(jié)目定位在中等檔次,以提高收視率。例三智豬爭食

豬圈里喂養(yǎng)兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有一個豬食槽,對面的一邊裝有控制開關。只要豬用鼻頭去拱控制開關,就會一次有6個單位的飼料流進豬食槽。如果大豬和小豬都不去拱開關,那么它們都吃不到飼料。如果小豬去拱開關,那么等它跑到另一邊的豬食槽時,大豬已將流出的飼料全部都吃光了。如果大豬去拱開關,那么等它跑到豬食槽旁邊,小豬差不多已吃掉了5個單位的飼料,結果大豬只能吃到1個單位的飼料。如果大豬、小豬一起去拱開關,再一起跑去吃食,那么大豬可搶到4個單位的飼料,小豬也只能吃掉2個單位的飼料。假定每拱一次開關需要消耗0.5個單位飼料的能量。大豬和小豬長期在一起進食,上面所說的情況(信息、知識)已為它們所掌握。仿照例一囚徒困境的情形,就可以畫出如圖1-4所示的雙變量矩陣。

在這個博弈中,大豬與小豬都有兩種戰(zhàn)略選擇:拱、不拱。在這個例子中可以發(fā)現(xiàn),不論大豬選擇拱還是不供,小豬的最優(yōu)選擇總是不拱。這是因為,如果大豬去拱開關,小豬不拱(等在豬食槽旁邊)比拱后再跑回去爭食要劃算(5>1.5);如果大豬不去拱開關,小豬不拱頂多都不得食,而去拱就要白白消耗能量,不劃算(0>-0.5)。所以,不拱是小豬的占優(yōu)戰(zhàn)略。給定小豬總是選擇不拱,大豬的最優(yōu)選擇總是拱。這樣,智豬爭食問題的博弈論解是戰(zhàn)略組合(拱,不拱)。智豬爭食模型在社會經(jīng)濟領域也可以找到許多實例。

比如股份公司中就有大股東和小股東之分。股東都有監(jiān)督經(jīng)理的職能,他們從監(jiān)督中得到的收益并不一樣。在監(jiān)督成本相同的情況下,大股東從監(jiān)督中得到的好處顯然多于小股東。通常在股份公司里,總是由大股東擔當監(jiān)督任務,而小股東則搭大股東的便車。股票市場上也有類似現(xiàn)象。一般大戶總是重視搜集信息,積極進行行情分析。對小戶而言,跟大戶是常見現(xiàn)象。

進行產(chǎn)品研究、開發(fā)以及新產(chǎn)品廣告宣傳時,對大企業(yè)而言,其資金實力及可望的收益會使大企業(yè)有投資的積極性,而小企業(yè)往往會得不償失。小企業(yè)通常采取與大企業(yè)建立協(xié)作生產(chǎn)或移植部分技術的做法。

介紹上面三個博弈論的例子,首先,是讓你們對博弈論有一個初步的感性認識。雖然在闡述中也涉及了專業(yè)術語,諸如理性、有效、戰(zhàn)略、占優(yōu)戰(zhàn)略、博弈解等,但是這些術語的含義是你們可以接受的。其次,通過這些例子想給你們留下一個深刻印象:博弈論與社會經(jīng)濟等諸多領域的聯(lián)系是如此廣泛、如此密切。下面章節(jié)對囚徒困境博弈在不同的理論的高度還要進行研究和分析,這個例子還會在不同地方被引用。二、博弈論的基本概念

什么是博弈論?簡而言之,博弈論是研究多人謀略和決策問題的理論。要較深入地理解這句話,還需要關注以下一些問題。首先,一個博弈問題必須至少有兩個參與博弈的主體(可能是個人,也可能是團體,如企業(yè)、國家),他們在博弈過程中都有各自的切身利益。由于利益的驅動,他們在作出自己的決策時,總想使出最好的招數(shù)(最優(yōu)戰(zhàn)略)。

其次,博弈中的各個主體之間總不可避免地存在著競爭。競爭自然貫穿博弈的全過程,競爭又將博弈的主體緊緊地聯(lián)系在一起,相互依存,相互較量(說得通俗一些就是“鉤心斗角”)。再者,既然主體間要進行較量,每一個博弈主體就不會閉目塞聽,靠靈機一動想出高招去贏得對手,而是需要“眼觀六路,耳聽八方”。盡量掌握博弈中對手的特點和已經(jīng)采取或可能采取的行動的知識和信息。最后,就是博弈主體最為關心的博弈結果了。博弈結果隨主體之間使出招數(shù)(戰(zhàn)略)的不同而不同。博弈結果通俗的說就是輸贏的大小,博弈論用收益(或效用)來描述博弈的結果。博弈論就是從理論上進行研究和分析,為博弈預測出一個理想的結局。預測結局的正確性體現(xiàn)在博弈主體各方面都能自愿選擇理論給他推導出的戰(zhàn)略,并且沒有博弈主體愿意獨自偏離他依照博弈理論所選定的戰(zhàn)略??上攵總€博弈主體所選戰(zhàn)略一定是針對其他主體所選戰(zhàn)略的最優(yōu)反應。

以上只是對博弈論粗線條的描述,為了后面對博弈理論進行深入的討論,下面對博弈論的幾個重要的基本概念給出明確的定義。(1)參與者。參與者指的是一個博弈中的決策主體,通常又稱為參與人或局中人。參與者參加博弈的目的是通過合理選擇自己的行動,以期取得最大化自己的收益(或效用)水平。參與者可以是自然人,也可以是企業(yè)、團體、國家,甚至是國家組成的集團(如歐盟、OPEC等)。對參與者而言,在博弈過程中,他必須有不同的行動可作應對選擇。在博弈的結局中,他能知道或計算出各參與者不同的行動組合產(chǎn)生的效益(或效用)。

在博弈論中,為了分析研究問題的需要,還有一個虛擬參與者——“自然”。這里,“自然”就是指不以博弈參與者的意志為轉移的外生事件?!白匀弧边x擇的是外生事件的各種可能現(xiàn)象,并且用概率分布來描述“自然”的選擇肌理。例四房地產(chǎn)開發(fā)博弈

現(xiàn)有開發(fā)商A(按博弈論說法是參與者1)正在考慮是否要投資開發(fā)一座商住樓。他面臨的行動選擇是開發(fā)或不開發(fā)。如果要開發(fā),就必須投入1億元資金;如果不去開發(fā),投資就是0。房地產(chǎn)開發(fā)市場總是存在風險的。首先,風險來自市場需求的不確定性,需求可能大,也可能小。其次,風險來源是競爭對手——房地產(chǎn)開發(fā)商B(參與者2)。開發(fā)商B也面臨與開發(fā)商A相同的決策問題。

假定市場上有兩座樓出售,需求大時,每座售價可達1.4億元;需求小時,售價為7千萬元。如果市場上只有一座樓出售,需求大時,售價高達1.8億元;需求小時,也能賣出1.1億元可以用圖1-5所示的雙變量矩陣描述這個博弈問題。

在這個例子中,市場需求就是作為虛擬參與者“自然”出現(xiàn)在博弈問題之中?!白匀弧保ㄊ袌鲂枨螅┦且砸欢ǖ母拍畋憩F(xiàn)出不同的狀態(tài)(需求大還是?。2谎远?,“自然”直接關系到博弈的決策結果。這個例子幾乎涉及到博弈論討論的重要問題的方方面面。相關的研究分析將在后面有關章節(jié)闡述。

在博弈論的討論中,一般都是用i=1,2,…,n

代表參與者,用N代表“自然”。(2)信息。信息指的是參與者在博弈過程中能了解到和觀察到的知識。這些知識包括“自然”的選擇,其他參與者的特征和行動等。信息對參與者是至關重要的,因為一個參與者在每一次進行決策之前,必須根據(jù)觀察到的其他參與者的行動和了解的有關情況作出自己的最佳選擇。

由于信息內(nèi)涵的不同,派生出各種有關信息的概念將博弈論劃分成不同的類型,因此尋求博弈間的方法也不同。本著由淺入深認識事物的規(guī)律,這里不打算把這些概念一股腦兒和盤托出,而是分散到以后的章節(jié)中,逐步予以介紹。這里只就信息有關的兩個基本的、重要的概念進行討論。

首先,關于“共同知識”的概念。一個博弈問題所涉及的“自然”的不同選擇、參與者的行動以及相應產(chǎn)生的效用(效果、收益)都是一種知識(信息)。比如,房地產(chǎn)開發(fā)商博弈問題,市場需求的大小,開發(fā)商A、B是開發(fā)還是不開發(fā),不同情況下的利潤和虧損,都是知識。開發(fā)商A、B知道這些知識也是一種信息,開發(fā)商A知道開發(fā)商B知道這些知識也是一種信息,如此等等。博弈論所謂的共同知識指的是“所有參與者知道,所有參與者知道所有參與者知道,所有參與者知道所有參與者知道所有參與者知道……”的知識??梢月?lián)想到市場需求大小是一種知識??赡荛_發(fā)商A、B都知道市場需求有大與小兩種狀態(tài),但是開發(fā)商A并不知道開發(fā)商B知道市場需求,這時市場需求就不構成共同知識,而只能說是A與B“共同”享有的知識。

為了說明共同知識的重要性,我引用一個眾所周知的寓言。故事發(fā)生在一個村莊,村里有100對已婚夫婦,他們都是地道的邏輯學家,但也有一些多少有點奇特的社會風俗。每天晚上,村里的男人們都將點起篝火,繞圈圍坐舉行一個會議,且每個人都談論自己的妻子。在會議開始時,如果一個男人有理由認為他的妻子對他總是守貞的,那么他就對在坐的男人們贊揚她的美德。另一方面,如果在當前會議之前的任何時間,只要他發(fā)現(xiàn)了他妻子不貞的證據(jù),那他就會悲鳴慟哭,并祈求神靈嚴厲地懲罰她。再則,如果一個妻子曾有不貞,那她和她的情人將會立即通知村里除她丈夫外所有的男人。所有這些傳統(tǒng)都是村民們的共同知識。

事實上,每個妻子都已對自己的丈夫不忠。于是,每個丈夫都知道除自己的妻子外都是不貞的女人,而對自己的妻子每晚都要贊揚。

這種狀況持續(xù)了很多年,直到一個傳教徒走訪到這個村莊。他坐在髯火旁參加了一次會議并聽到每個男人都贊揚自己的妻子之后,他站到丈夫們圍坐的圓中心,大聲地說:“這個村里有一個妻子已經(jīng)不貞了?!痹诖撕蟮?9個晚上丈夫們繼續(xù)開會并贊揚他們的妻子,但在第100個晚上,他們?nèi)急Q偷哭并祈求嚴厲地懲罰他們的妻子。

為了理解在這個寓言中發(fā)生了什么,首先注意到若只有一個妻子不貞,則因為(知道沒有另外的不貞女人,且若有的話他是知道的)她丈夫能夠立刻知道這個不貞的女人是他的妻子,所以在傳教徒訪問后的第一天晚上就會悲鳴慟哭。而且,由歸納法可以證明,對于1與100之間的任一正整數(shù),如果恰有個不貞的妻子,那么在傳教徒訪問后的連續(xù)個晚上,所有的丈夫仍全都贊揚自己的妻子,但在第個晚上,個不貞妻子的丈夫會悲鳴慟哭。于是,在99個贊揚之夜過后的第100個晚上,每個丈夫都知道一定有100個不貞的妻子,包括他自己的妻子在內(nèi)。

現(xiàn)在,讓我們試問一下,這個傳教徒告訴了這些丈夫們他們所不知道的什么?每個丈夫都已經(jīng)知道了99個不貞的妻子,故這對任何人來說都不是新聞。但“這個傳教徒對所有男人做了一個聲明”是共同知識,從而這個傳教徒所聲明的內(nèi)容,即有一個不貞的妻子,也就成了所有男人中間的共同知識。在傳教徒宣告之前,每個形如“(每個丈夫知道)有一個不貞的妻子”的判斷對于99都是正確的,但對100就不正確了。例如,若從1到100對丈夫們編號,則1已經(jīng)知道2已經(jīng)知道3已經(jīng)知道…99已經(jīng)知道100的妻子是不貞的,但1不知道2已經(jīng)知道3已經(jīng)知道…99已經(jīng)知道100已經(jīng)知道1的妻子是不貞的。因而,從這個寓言中引申出的含義是,從一個共同知識的事實推出的結果與從(例如)只知道每個人已經(jīng)知道每個人已經(jīng)知道的一個事實推出的結果可以非常不同。

其次,關于“完全信息”的概念。完全信息是博弈論非常重要的基本概念,有了上述的共同知識概念,這里就可以給出完全信息的嚴格定義。完全信息指的是所有參與者各自選擇的行動的不同組合所決定的各參與者的收益對所有參與者來說是共同知識。簡單通俗地說,完全信息是指每一個參與者對自己以及其他參與者的行動,以及各參與者選擇的行動組合產(chǎn)生的收益等知識有完全的了解。(3)戰(zhàn)略。戰(zhàn)略是參與者如何對其他參與者的行動作出反應的行動規(guī)則,它規(guī)定參與者在什么時候該選擇什么行動?;蛘哒f。戰(zhàn)略是參與者“相機行動方案”。

戰(zhàn)略是一個與過程有關的概念,行動是與時序無關的動作。打個比方,行動好比拳術中的一招一式,戰(zhàn)略就是一招一式構成的套路。(4)收益。在博弈論中,收益指的是在一個特定的戰(zhàn)略組合下參與者得到的確定效用或期望效用。效用通常表現(xiàn)為博弈結果中的輸贏、得失、盈虧。效用必須能用數(shù)值刻畫其大小。收益是博弈參與者真正關心的問題。

博弈論的一個基本特征是一個參與者的收益不僅取決于自己的戰(zhàn)略選擇,而且取決于所有參與者的戰(zhàn)略選擇?;蛘哒f,收益是所有參與者各選定一個戰(zhàn)略形成的戰(zhàn)略組合的函數(shù)。在博弈論中,通常用ui表示參與者i的收益,一個戰(zhàn)略組合是,每個參與者的收益可以表示為

均衡是博弈論最重要、最基礎的一個概念,對于不同類型、不同條件的博弈問題又形成各種各樣特定的均衡的概念,它們構成博弈論五彩繽紛的預測結果。各種均衡在社會經(jīng)濟等不同的領域都展現(xiàn)出廣闊的應用前景。讀者充分、深刻地理解這些均衡概念是非常重要的。

有了上面完全信息的概念,再結合參與者行動的先后次序的界定,就可以對博弈論的類型作出劃分。如果參與者同時選擇各自的行動,則這類博弈稱為靜態(tài)的。值得注意的是,這里所說的“同時”具有雙層含義。一種含義就是“同時”的字面解釋,也就是參與者在同一時間一起行動;另一種含義是參與者行動雖然有先后,但后行動者并不知道先行動者采取了什么具體行動。

動態(tài)博弈指的是參與者的行動有先后順序,并且后行動者能夠觀察到先行動者所選擇的行動。后行動者就可以依據(jù)獲得的信息,采取自己認為最有力的戰(zhàn)略。憑直觀理解,完全信息總要比不完全信息要好一些,靜態(tài)的情形又要比動態(tài)的情形要簡單一些。如果將信息的完全與不完全、狀態(tài)的靜與動交叉組合,就構成了四種不同類型的博弈。從簡單到復雜排列,就是完全信息靜態(tài)博弈——完全信息動態(tài)博弈——不完全信息靜態(tài)博弈——不完全信息動態(tài)博弈。

3、博弈論研究著名學者簡介(1)、計算機之父、博弈論創(chuàng)始人——馮·諾伊曼約翰·馮·諾伊曼(JohnVonNeumann,1903—1957),美籍匈牙利人。1921—1923年在蘇黎世大學學習。很快又在1926年以優(yōu)異的成績獲得了布達佩斯大學數(shù)學博士學位,此時馮·諾伊曼年僅22歲。馮·諾伊曼是20世紀最優(yōu)秀的數(shù)學家之一,因1946年發(fā)明電子計算機而被西方人譽為“計算機之父”。1927—1929年馮·諾伊曼相繼在柏林大學和漢堡大學擔任數(shù)學講師。1930年接受了普林斯頓大學客座教授的職位,西渡美國,1931年成為該校終身教授。他是美國國家科學院、秘魯國立自然科學院和意大利國立林且學院的院士。馮·諾伊曼建立了算子代數(shù)這門新的數(shù)學分支。在格論、連續(xù)幾何、理論物理、動力學、連續(xù)介質力學、氣象計算、原子能和經(jīng)濟學等領域都做過重要的工作。然而,馮·諾伊曼對人類的最大貢獻是對計算機科學、計算機技術和數(shù)值分析的開拓性工作。馮·諾伊曼于20世紀20年代開始創(chuàng)立博弈理論,1944年他與經(jīng)濟學家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經(jīng)濟行為》,標志著現(xiàn)代系統(tǒng)博弈理論的初步形成。馮·諾伊曼和摩根斯特恩在該書中提出的標準型、擴展型和合作型博弈模型解的概念和分析方法,奠定了這門學科的理論基礎。(2)、博弈論大師——納什

納什(JohnNash),1928年6月13日出生于美國弗吉尼亞西部的“布魯菲爾德”(Bluefield),高中畢業(yè)后進入卡內(nèi)基-梅隆大學學習化學工程專業(yè),由于對數(shù)學的喜好和天賦,一年后正式轉到數(shù)學系。在畢業(yè)時,他取得數(shù)學學士和理學學士兩個學位。1950年納什22歲時通過論文答辯獲得普林斯頓大學的博士學位。正是這篇天才論文,奠定了他博弈論大師的地位,并為他鋪墊了通向諾貝爾經(jīng)濟學獎的道路。1951年納什又發(fā)表了第二篇題為“非合作博弈”(Non—CooperativeGames,AnnalsofMathematics1951)的論文。在此之前,他還撰寫了“討價還價問題”。1958年《財富》雜志把納什評為新一代天才數(shù)學家中最出色的人物。也許是天妒英才,正當麻省理工學院準備提升他為正教授時,年方30歲的納什得了嚴重的“妄想型精神分裂癥”,從此他從學術界銷聲匿跡,飽受精神病的折磨長達30多年。

納什的主要貢獻是1950年和1951年發(fā)表的兩篇關于非合作博弈論的重要論文,他的研究徹底改變了人們對競爭和市場的看法。1950年納什發(fā)表的“非合作對策”博士論文提出了與諾伊曼的合作對策論相對立的觀點。納什在論文中引入了著名的“納什均衡”理論,對有混合利益的競爭者之間的對抗進行了數(shù)學分析。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟均衡的內(nèi)在聯(lián)系。納什的研究奠定了現(xiàn)代非合作博弈論的基石,他是繼馮·諾伊曼之后最偉大的博弈論大師之一,他提出的著名的納什均衡的概念在非合作博弈理論中起著核心作用。后續(xù)的研究者對博弈論的貢獻,都是建立在這一概念之上的。納什均衡的提出和不斷完善為博弈論廣泛應用于經(jīng)濟學、管理學、社會學、政治學、軍事科學等領域奠定了堅實的理論基礎。

(3)、動態(tài)博弈理論的開創(chuàng)者——澤爾騰澤爾騰(R.Selten)1930年10月10日出生于德國的布雷斯勞(二戰(zhàn)后,此地歸于波蘭),1951—1957年,他在法蘭克福大學學習數(shù)學。1961年在馬恩法蘭克福大學獲得了數(shù)學博士學位。1967—1968年,澤爾騰到加州大學伯克利分校做客座教授,1969—1972年在柏林大學做經(jīng)濟學教授,而后在比勒菲爾德大學工作了12年。1984年澤爾騰離開比勒菲爾德大學,到波恩大學從教,致力于實驗經(jīng)濟學的研究。

澤爾騰的主要貢獻是在納什均衡的基礎上深入研究了動態(tài)博弈問題。澤爾騰通過研究發(fā)現(xiàn),“納什均衡”概念在實際應用中存在缺陷。納什均衡的缺陷是,一般情況下能夠保證存在性,但不能保證唯一性。大多數(shù)情況下納什均衡有多個,由此帶來的問題就是,多個納什均衡中究竟哪一個才是博弈的理性結局?澤爾騰認為“納什均衡”概念只適用于分析一些靜態(tài)的“重復性博弈”,而不適用于分析動態(tài)博弈問題。他對“納什均衡”概念進行了精心的研究,先后提出了兩個著名均衡新概念:子博弈完美均衡,顫抖手完美均衡。他采用“逆向歸納法”,在多個納什均衡中剔除了一些按照一定規(guī)則不合理的均衡點,從而形成了納什均衡的“精煉”概念,在擴展型博弈分析方面取得了重大成果。(4)、不完全信息博弈理論的奠基者——海薩尼

約翰·海薩尼(JohnC.Harsanyi),美國人,由于受到納什成果的影響,從20世紀50年代開始潛心于博弈論的研究。海薩尼的研究成果非常豐富:(1)在合作博弈論研究上,給出了合作博弈的通解——N人議價模型,建立了一個合作博弈論的非合作博弈模型;(2)在不完全信息博弈研究上,提出了以類型為基礎的不完全信息博弈建模方法,引入了貝葉斯技術求解方法,對混合策略進行了重新解釋,提出了基于隨機變量的變動收益博弈模型;(3)在均衡選擇研究上,與澤爾騰合作完成了《博弈論均衡選擇的一般理論》。約翰·海薩尼通過多方面的研究將自己的思想構成了一個完整的體系,他提出的不完全信息博弈思想及貝葉斯納什均衡概念,對博弈論和經(jīng)濟學產(chǎn)生了重大影響。(5)、米爾利斯

詹姆斯·亞歷山大·米爾利斯(J.Y.Morlis),出生于1936年7月5日蘇格蘭柯庫布里郡明尼加大。1996年10月8日,由于對不對稱信息條件下的激勵經(jīng)濟理論做出了基礎性貢獻,與威廉·維克里分享諾貝爾經(jīng)濟學獎。米爾利斯對不對稱信息經(jīng)濟學的貢獻包括:在最優(yōu)所得稅機制設計問題上,探討了政府在面臨信息不完全的情況下如何去設計出一種“激勵性相容”的最優(yōu)稅收體制,提出了顯示原則:解決激勵問題的關鍵是要通過一種與個人利益相容的方式,引導所有人如實表露自己的信息;在最優(yōu)契約設計問題上,以“委托人一代理人方法”對道德危險問題進行了重新闡述,得出的結論是:為了使代理人有足夠的激勵去自動選擇有利于委托人的行動,就必須在合同的設計中讓代理人也承擔一部分結果不確定的風險;在信號篩選理論方面,提出了區(qū)分不同信號的“斯彭斯一米爾利斯條件”。第二部分、幾個經(jīng)典博弈模型分析

博弈的標準式表述

嚴格占優(yōu)戰(zhàn)略均衡

逐步剔除嚴格戰(zhàn)略均衡

納什均衡應用舉例

混合戰(zhàn)略納什均衡

納什均衡的存在性

(一)、博弈的標準式表述

一、博弈的標準式表述與納什均衡

(二)、嚴格占優(yōu)戰(zhàn)略均衡

博弈分析的目的是預測博弈的均衡結果。簡言之,就是求解博弈問題。這里需要假定“參與者是理性的”是共同知識。經(jīng)濟學對理性的描述是,在給定的約束條件下追求效用最大化。參與者在博弈過程中,在每一步斟酌的取舍(選優(yōu)剔劣)時,都應依據(jù)這個假定行事。一般說來,由于每個參與者的收益是博弈中所有參與者所選戰(zhàn)略的函數(shù),因此,每個參與者的最優(yōu)戰(zhàn)略選擇必須考慮所有其他參與者的戰(zhàn)略選擇。但在一些特殊的博弈中,一個參與者的最優(yōu)戰(zhàn)略可能不需要考慮其他參與者如何選擇戰(zhàn)略,就是說,不論其他參與者選擇什么戰(zhàn)略,該參與者有唯一一個最優(yōu)戰(zhàn)略,這個最優(yōu)戰(zhàn)略稱為嚴格占優(yōu)戰(zhàn)略。下面給出嚴格占優(yōu)戰(zhàn)略定義。

顯然,在一個博弈問題中,如果所有參與者都有一個嚴格占優(yōu)戰(zhàn)略,那么每一個理性的參與者誰也不會放棄他的嚴格占優(yōu)戰(zhàn)略。這樣,由全部嚴格占優(yōu)戰(zhàn)略就構成博弈的解——嚴格占優(yōu)戰(zhàn)略均衡。

應該指出的是,嚴格占優(yōu)戰(zhàn)略只要求每個參與者是理性的,而并不要求每個參與者知道其他參與者是理性的(即不要求“理性”是共同知識)。這是因為,不論知道與否,嚴格占優(yōu)戰(zhàn)略總是一個理性參與者的最佳選擇。

值得注意的是,囚徒困境博弈暴露了個人理性與團體理性的沖突問題。因為囚徒1與囚徒2都選擇沉默,每人只判刑1個月,這顯然要比(坦白,坦白)都判刑6個月有利。(沉默,沉默)不是一個均衡,因為它不滿足個人理性的要求。換個角度考慮,即使兩個囚徒在被捕前訂立了攻守同盟(拒不坦白),這個同盟也沒有用,因為沒有人會嚴格遵守同盟協(xié)定(這時,只要誰一坦白,他就立即獲得釋放)。

(三)、逐步剔除嚴格劣戰(zhàn)略均衡

尋求博弈問題的解的過程就是參與者選擇戰(zhàn)略的過程。選擇有兩種途徑:選優(yōu)與去劣。上面尋求嚴格占優(yōu)戰(zhàn)略均衡走的就是選優(yōu)的路子。下面介紹的逐步剔除嚴格劣戰(zhàn)略尋求均衡走的就是去劣的路子。

研究圖2-1所示的一個博弈問題。

這樣一來,參與者1就可以將圖2-1所示的博弈視同為圖2-2所示的博弈。

在圖2-2中,對參與者1來說,戰(zhàn)略“下”相對于戰(zhàn)略“上”是嚴格劣戰(zhàn)略(因為0<1,且0<1)。于是,如果參與者1是理性的(并且參與者1知道參與者2是理性的,原博弈才能簡化為圖2-2),那么參與者1就不會選擇“下”。這時,如果參與者2知道參與者1是理性的,并且參與者2知道參與者1知道參與者2是理性的(只有這樣,參與者2知道原博弈已被簡化為圖2-2所示博弈),那么參與者2就可以把“下”從參與者1的戰(zhàn)略空間S1中剔除。

這樣一來,參與者2又可以進一步將圖2-2所示博弈簡化為圖2-3所示博弈

那么,圖2-4的博弈有沒有均衡結果呢?后面我們還會討論。

另外,嚴格占優(yōu)戰(zhàn)略均衡和逐步剔除嚴格劣戰(zhàn)略均衡對參與者理性的要求是不同的。前者只要每個參與者是理性的,而后者卻要求理性是參與者的共同知識。只有在“參與者2是理性的,且參與者1知道參與者2是理性的”條件下,圖2-1的博弈才能簡化為圖2-2的情形。一共用了三步剔除得到了結果。顯然,參與者的戰(zhàn)略空間越大,剔除的步驟就越多,對共同知識的要求就越嚴格。定義在標準式的博弈中,設si'和si″是參與者i的兩個可行戰(zhàn)略。若下式

類似于運用逐步剔除嚴格劣戰(zhàn)略去尋求一個均衡結果,自然想到運用逐步剔除劣勢戰(zhàn)略也是求解博弈問題的一種方法。

考察下面圖2-5所示的博弈問題。

(四)、納什(Nash)均衡

納什均衡是完全信息靜態(tài)博弈的解的一般概念,它是對非常廣泛博弈問題給出更加嚴格的結果。首先,許多不存在嚴格占優(yōu)戰(zhàn)略均衡或逐步剔除嚴格劣戰(zhàn)略均衡的博弈,卻存在納什均衡。其次,嚴格占優(yōu)戰(zhàn)略均衡一定就是博弈問題的惟一的納什均衡。再者納什均衡一定不會被逐步剔除嚴格劣戰(zhàn)略所剔除??梢赃@么說,沒有任何一個戰(zhàn)略組合嚴格優(yōu)于納什均衡。為了理解納什均衡的含義,設想博弈理論對一個n個參與者博弈中的每一個參與者選定的一個戰(zhàn)略,預測的博弈結果為s*=(s1*,…,si*,…,sn*)。其中,si*是理論上導出的參與者i的戰(zhàn)略。首先,理論上確定的每個參與者要選擇的戰(zhàn)略必須是針對其他參與者選擇戰(zhàn)略的最優(yōu)反應。其次,遵循理論結果產(chǎn)生的效用不會小于偏離理論結果時的效用,也就是沒有參與者愿意單獨偏離理論給他選定的戰(zhàn)略,這種理論導出的結果時一種“戰(zhàn)略相對穩(wěn)定”狀態(tài)。我們就把這種狀態(tài)稱為一個納什均衡。

和納什均衡的導出密切相關的是協(xié)議的理念。對給定的博弈,如果參與者之間要商定一個協(xié)議決定博弈如何進行,那么一個有效的協(xié)議中的戰(zhàn)略組織必須是納什均衡的戰(zhàn)略組合,否則至少有一個參與者會不遵循該協(xié)議。

運用上述定義中不等式(NE)的條件,就可以檢查一個特定的戰(zhàn)略組合是不是納什均衡。比如,在囚徒困境中,對參與者1(囚徒1)選s1*=坦白,對參與者2(囚徒2)選s2*=坦白??疾靾D2-4所示的博弈。

從圖2-6可以看出,一個單元中只有一個數(shù)值下面劃了橫線,表明只有一方的戰(zhàn)略上針對另一方戰(zhàn)略的最優(yōu)反應,而另一方的戰(zhàn)略卻表示針對對方戰(zhàn)略的最優(yōu)反應。因此該單元對應的戰(zhàn)略組合就不是雙方同時愿意接受的結果,因而也就構不成納什均衡。

通過上面闡述,讀者已經(jīng)接觸了各種博弈均衡的概念和尋求均衡結果的方法,現(xiàn)在著重分析一下它們之間的關系。

(1)每一個嚴格占優(yōu)戰(zhàn)略均衡一定是納什均衡,反之不然。(2)每一個逐步剔除嚴格占優(yōu)戰(zhàn)略均衡是納什均衡,反之不然。

這里就不作嚴格的論證了?;仡欀秦i爭食博弈和圖2-1所示的博弈,對逐步剔除嚴格劣戰(zhàn)略過程和劃橫線方法尋求納什均衡的過程的比較,可以領會上述結論的含義。反例可以從圖2-6所示博弈看出。s*=(下,右)是納什均衡,但該博弈逐步剔除嚴格劣戰(zhàn)略卻一步也不能施行。(3)如果戰(zhàn)略組合是納什均衡,那么它一定不會被逐步剔除嚴格劣戰(zhàn)略剔除。

成立。這個例子得出的是:(歌劇,歌劇)和(拳擊,拳擊)都是納什均衡。這個博弈既不存在嚴格的占優(yōu)戰(zhàn)略均衡,也不存在逐步剔除嚴格劣戰(zhàn)略均衡。并且對該博弈的兩個納什均衡(歌劇,歌?。┖?拳擊,拳擊)不論實際實施哪一個均衡結果,總有一方感到有點委屈。遇到這樣一類博弈問題,納什均衡用于預測博弈將任何進行的作用就大大減弱了。二、納什均衡應用舉例

本節(jié)集中研究分析經(jīng)濟學中幾個博弈問題,這些也是博弈論的經(jīng)典之作。通過對這些例題的模型的討論,要達到兩個目的:①如何

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論