版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、背景知識:納什博弈論的原理與應(yīng)用1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和 市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納 什均衡。從而揭示了博弈均衡與經(jīng)濟均衡的內(nèi)在聯(lián)系。納什的研究奠定了現(xiàn)代非合作博 弈論的基石,后來的博弈論研究基本上都沿著這條主線展開的。然而,納什天才的發(fā)現(xiàn) 卻遭到馮諾依曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。但是骨子里挑戰(zhàn)權(quán) 威、藐視權(quán)威的本性,使納什堅持了自己的觀點,終成一代大師。要不是30多年的嚴(yán) 重精神病折磨,恐怕他早已站在諾貝爾獎的領(lǐng)獎臺上了,而且也絕不會與其他人分享這一殊榮。納什是一個非
2、常天才的數(shù)學(xué)家,他的主要貢獻(xiàn)是1950至1951年在普林斯頓讀博士 學(xué)位時做出的。然而,他的天才發(fā)現(xiàn)非合作博弈的均衡,即“納什均衡”并不是一帆風(fēng)順的。1948年納什到普林斯頓大學(xué)讀數(shù)學(xué)系的博士。那一年他還不到20歲。當(dāng)時普林斯 頓可謂人杰地靈,大師如云。愛因斯坦、馮諾依曼、列夫謝茨(數(shù)學(xué)系主任)、阿爾伯 特塔克、阿倫佐切奇、哈羅德庫恩、諾爾曼斯蒂恩羅德、埃爾夫??怂?等全都在這里。博弈論主要是由馮諾依曼(19031957)創(chuàng)所立的。他是一位出生于匈 牙利的天才的數(shù)學(xué)家。他不僅創(chuàng)立了經(jīng)濟博弈論,而且發(fā)明了計算機。早在20世紀(jì)初, 塞梅魯(Zermelo)、鮑羅(Borel)和馮諾伊曼已經(jīng)開始研究
3、博弈的準(zhǔn)確的數(shù)學(xué)表達(dá),直 到1939年,馮諾依曼遇到經(jīng)濟學(xué)家奧斯卡摩根斯特恩(Oskar Morgenstern),并與 其合作才使博弈論進(jìn)入經(jīng)濟學(xué)的廣闊領(lǐng)域。1944年他與奧斯卡摩根斯特恩合著的巨作博弈論與經(jīng)濟行為出版,標(biāo)志著現(xiàn) 代系統(tǒng)博弈理論的的初步形成。盡管對具有博弈性質(zhì)的問題的研究可以追溯到19世紀(jì) 甚至更早。例如,1838年古諾(Cournot)簡單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個寡頭的產(chǎn)量與價格壟斷;2000多年前中國著名軍事家孫武的后 代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬于早期博弈論的萌芽,其特點是零星 的,片斷的研究,帶有很大的偶然性,很
4、不系統(tǒng)。馮諾依曼和摩根斯特恩的博弈論 與經(jīng)濟行為一書中提出的標(biāo)準(zhǔn)型、擴展型和合作型博弈模型解的概念和分析方法,奠 定了這門學(xué)科的理論基礎(chǔ)。合作型博弈在20世紀(jì)50年代達(dá)到了巔峰期。然而,諾依曼 的博弈論的局限性也日益暴露出來,由于它過于抽象,使應(yīng)用范圍受到很大限制,在很 長時間里,人們對博弈論的研究知之甚少,只是少數(shù)數(shù)學(xué)家的專利,所以,影響力很有 限。正是在這個時候,非合作博弈“納什均衡”應(yīng)運而生了,它標(biāo)志著博弈論的新時代的開始!納什不是一個按部就班的學(xué)生,他經(jīng)常曠課。據(jù)他的同學(xué)們回憶,他們 根本想不起來曾經(jīng)什么時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至 少上過斯蒂恩羅德的代數(shù)拓
5、撲學(xué)。斯蒂恩羅德恰恰是這門學(xué)科的創(chuàng)立者,可是,沒上幾 次課,納什就認(rèn)定這門課不符合他的口味。于是,又走人了。然而,納什畢竟是一位英 才天縱的非凡人物,他廣泛涉獵數(shù)學(xué)王國的每一個分支,如拓?fù)鋵W(xué)、代數(shù)幾何學(xué)、邏輯 學(xué)、博弈論等等,深深地為之著迷。納什經(jīng)常顯示出他與眾不同的自信和自負(fù),充滿咄 咄逼人的學(xué)術(shù)野心。1950年整個夏天納什都忙于應(yīng)付緊張的考試,他的博弈論研究工作 被迫中斷,他感到這是莫大的浪費。殊不知這種暫時的“放棄”,使原來模糊、雜亂和 無緒的若干念頭,在潛意識的持續(xù)思考下,逐步形成一條清晰的脈絡(luò),突然來了靈感! 這一年的10月,他驟感才思潮涌,夢筆生花。其中一個最耀眼的亮點就是日后被稱
6、之 為“納什均衡”的非合作博弈均衡的概念。納什的主要學(xué)術(shù)貢獻(xiàn)體現(xiàn)在1950年和1951 年的兩篇論文之中(包括一篇博士論文)。1950年他才把自己的研究成果寫成題為“非合 作博弈”的長篇博士論文,1950年11月刊登在美國全國科學(xué)院每月公報上,立即引起 轟動。說起來這全靠師兄戴維蓋爾之功,就在遭到馮諾依曼貶低幾天之后,他遇到 蓋爾,告訴他自己已經(jīng)將馮諾依曼的“最小最大原理(minimax solution)推到非合 作博弈領(lǐng)域,找到了普遍化的方法和均衡點。蓋爾聽得很認(rèn)真,他終于意識到納什的思 路比馮諾伊曼的合作博弈的理論更能反映現(xiàn)實的情況,而對其嚴(yán)密優(yōu)美的數(shù)學(xué)證明極 為贊嘆。蓋爾建議他馬上整理
7、出來發(fā)表,以免被別人捷足先登。納什這個初出茅廬的小 子,根本不知道競爭的險惡,從未想過要這么做。結(jié)果還是蓋爾充當(dāng)了他的“經(jīng)紀(jì)人”, 代為起草致科學(xué)院的短信,系主任列夫謝茨則親自將文稿遞交給科學(xué)院。納什寫的文章 不多,就那么幾篇,但已經(jīng)足夠了,因為都是精品中的精品。這一點也是值得我們深思 的。國內(nèi)提一個教授,要求在“核心的刊物”上發(fā)表多少篇文章。按照這個標(biāo)準(zhǔn)可能納 什還不一定夠資格。1996年諾貝爾經(jīng)濟學(xué)獎得主莫爾里斯當(dāng)牛津大學(xué)艾奇沃思經(jīng)濟學(xué)講座教授時也沒 有發(fā)表過什么文章,特殊的人才,必須有特殊的選拔辦法。納什在上大學(xué)時就開始從事純數(shù)學(xué)的博弈論研究,1948年進(jìn)入普林斯頓大學(xué)后更是 如魚得水。
8、20歲出頭已成為聞名世界的數(shù)學(xué)家。特別是在經(jīng)濟博弈論領(lǐng)域,他做出了劃 時代的貢獻(xiàn),是繼馮諾依曼之后最偉大的博弈論大師之一。他提出的著名的納什均衡 的概念在非合作博弈理論中起著核心的作用。后續(xù)的研究者對博弈論的貢獻(xiàn),都是建立 在這一概念之上的。由于納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟學(xué)、管理 學(xué)、社會學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅實的理論基礎(chǔ)。囚犯的兩難處境大理論中的小故事要了解納什的貢獻(xiàn),首先要知道什么是非合作博弈問題?,F(xiàn)在幾乎所有的博弈論教 科書上都會講“囚犯的兩難處境”的例子,每本書上的例子都大同小異。博弈論畢竟是數(shù)學(xué),更確切地說是運籌學(xué)的一個分支,談經(jīng)論道自然少不了數(shù)學(xué)語
9、言,外行人看來只是一大堆數(shù)學(xué)公式。好在博弈論關(guān)心的是日常經(jīng)濟生活問題,所以不 能不食人間煙火。其實這一理論是從棋弈、撲克和戰(zhàn)爭等帶有競賽、對抗和決策性質(zhì)的 問題中借用的術(shù)語,聽上去有點玄奧,實際上卻具有重要現(xiàn)實意義。博弈論大師看經(jīng)濟 社會問題猶如棋局,常常寓深刻道理于游戲之中。所以,多從我們的日常生活中的凡人 小事入手,以我們身邊的故事做例子,娓娓道來,并不乏味。話說有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和 那庫爾斯,并從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認(rèn)曾殺過人, 辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點兒東西。于
10、是警方將兩人隔離,分別 關(guān)在不同的房間進(jìn)行審訊。由地方檢察官分別和每個人單獨談話。檢察官說,“由于你 們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。但是,我可以和你做個交易。 如果你單獨坦白殺人的罪行,我只判你三個月的監(jiān)禁,但你的同伙要被判十年刑。如果 你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個月的監(jiān)禁。但是,如 果你們兩人都坦白交代,那么,你們都要被判5年刑?!彼箍柗平z和那庫爾斯該怎么 辦呢?他們面臨著兩難的選擇一一坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是 大家都只被判一年。但是由于兩人處于隔離的情況下無法串供。所以,按照亞當(dāng)斯密 的理論,每一個人都是從利己的目的
11、出發(fā),他們選擇坦白交代是最佳策略。因為坦白交 代可以期望得到很短的監(jiān)禁3個月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦 白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應(yīng) 該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以, 兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會出 現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非 合作均衡。因為,每一方在選擇策略時都沒有“共謀”(串供,他們只是選擇對自己最 有利的策略
12、,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所 有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。沒有人會主動改變自己的策略以 便使自己獲得更大利益?!扒敉降膬呻y選擇”有著廣泛而深刻的意義。個人理性與集體 理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個“納什均衡”,也是對所有人 都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長 的刑期。只有當(dāng)他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時 間的監(jiān)禁的結(jié)果。“納什均衡”首先對亞當(dāng)斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟中,每一個人都從利己的目的出發(fā),而最終
13、全社會達(dá)到利 他的效果。不妨讓我們重溫一下這位經(jīng)濟學(xué)圣人在國富論中的名言:“通過追求(個 人的)自身利益,他常常會比其實際上想做的那樣更有效地促進(jìn)社會利益。”從“納什 均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發(fā),結(jié)果損人不利 己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提 出的悖論實際上動搖了西方經(jīng)濟學(xué)的基石。因此,從“納什均衡”中我們還可以悟出一 條真理:合作是有利的“利己策略,。但它必須符合以下黃金律:按照你愿意別人對你 的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿 施于人”。但前提是人所不欲勿施于我。其次,
14、“納什均衡”是一種非合作博弈均衡, 在現(xiàn)實中非合作的情況要比合作情況普遍。所以“納什均衡”是對馮諾依曼和摩根斯 特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場革命。從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟、社會、政治、國 防、管理和日常生活中的博弈現(xiàn)象。我們將例舉出許多類似于“囚徒的兩難處境”這樣 的例子。如價格戰(zhàn)、軍奮競賽、污染等等。一般的博弈問題由三個要素所構(gòu)成:即局中 人(players)又稱當(dāng)事人、參與者、策略等等的集合,策略(strategies)集合以及每一 對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個特定的策略關(guān) 系被選擇,每一局中人所
15、得到的效用。所有的博弈問題都會遇到這三個要素。價格戰(zhàn)博弈:現(xiàn)在我們經(jīng)常會遇到各種各樣的家電價格大戰(zhàn),彩電大戰(zhàn)、冰箱大戰(zhàn)、空調(diào)大戰(zhàn)、 微波爐大戰(zhàn)這些大戰(zhàn)的受益者首先是消費者。每當(dāng)看到一種家電產(chǎn)品的價格大戰(zhàn), 百姓都會“沒事兒偷著樂”。在這里,我們可以解釋廠家價格大戰(zhàn)的結(jié)局也是一個“納 什均衡”,而且價格戰(zhàn)的結(jié)果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結(jié) 果是穩(wěn)定的,即是一個“納什均衡”。這個結(jié)果可能對消費者是有利的,但對廠商而言 是災(zāi)難性的。所以,價格戰(zhàn)對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個 問題,一是競爭削價的結(jié)果或“納什均衡”可能導(dǎo)致一個有效率的零利潤結(jié)局。二是如 果不
16、采取價格戰(zhàn),作為一種敵對博弈論(vivalry game)其結(jié)果會如何呢?每一個企業(yè), 都會考慮采取正常價格策略,還是采取高價格策略形成壟斷價格,并盡力獲取壟斷利潤。 如果壟斷可以形成,則博弈雙方的共同利潤最大。這種情況就是壟斷經(jīng)營所做的,通常 會抬高價格。另一個極端的情況是廠商用正常的價格,雙方都可以獲得利潤。從這一點, 我們又引出一條基本準(zhǔn)則:“把你自己的戰(zhàn)略建立在假定對手會按其最佳利益行動的基 礎(chǔ)上”。事實上,完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀 態(tài)下,每一個廠商或消費者都是按照所有的別人已定的價格來進(jìn)行決策。在這種均衡中, 每一企業(yè)要使利潤最大化,消費者要使效用
17、最大化,結(jié)果導(dǎo)致了零利潤,也就是說價格 等于邊際成本。在完全競爭的情況下,非合作行為導(dǎo)致了社會所期望的經(jīng)濟效率狀態(tài)。 如果廠商采取合作行動并決定轉(zhuǎn)向壟斷價格,那么社會的經(jīng)濟效率就會遭到破壞。這就 是為什么WTO和各國政府要加強反壟斷的意義所在。污染博弈:假如市場經(jīng)濟中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤的最大 化,寧愿以犧牲環(huán)境為代價,也絕不會主動增加環(huán)保設(shè)備投資。按照看不見的手的原理, 所有企業(yè)都會從利己的目的出發(fā),采取不顧環(huán)境的策略,從而進(jìn)入“納什均衡”狀態(tài)。 如果一個企業(yè)從利他的目的出發(fā),投資治理污染,而其他企業(yè)仍然不顧環(huán)境污染,那么 這個企業(yè)的生產(chǎn)成本就會增加,價格就要提高,它的產(chǎn)品就沒有競爭力,甚至企業(yè)還要 破產(chǎn)。這是一個“看不見的手的有效的完全競爭機制”失敗的例證。直到20世紀(jì)90年 代中期,中國鄉(xiāng)鎮(zhèn)企業(yè)的盲目發(fā)展造成嚴(yán)重污染的情況就是如此。只有在政府加強污染 管制時,企業(yè)才會采取低污染的策略組合。企業(yè)在這種情況下,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國貴金屬的回收及加工市場運營現(xiàn)狀及投資前景規(guī)劃研究報告
- 2025-2030年中國蛋品加工市場運營狀況及投資規(guī)劃研究報告
- 2025-2030年中國胎圈鋼絲產(chǎn)業(yè)發(fā)展?fàn)顩r及投資前景規(guī)劃研究報告
- 2025版旅游區(qū)景區(qū)清潔維護服務(wù)租賃合同2篇
- 2025-2030年中國紙制品行業(yè)市場競爭格局展望及投資策略分析報告
- 2025-2030年中國紫蘇行業(yè)現(xiàn)狀調(diào)研及投資前景分析報告
- 2025-2030年中國碳酸氫鈉干滅火劑行業(yè)市場現(xiàn)狀分析及投資前景走勢研究報告
- 2025-2030年中國硫酸軟骨素市場規(guī)模分析及投資前景研究報告
- 2025-2030年中國皮帶輸送機行業(yè)運行態(tài)勢及投資前景規(guī)劃研究報告
- 2025-2030年中國生活用紙行業(yè)前景評估與發(fā)展戰(zhàn)略規(guī)劃研究報告新版
- NGS二代測序培訓(xùn)
- 《材料合成與制備技術(shù)》課程教學(xué)大綱(材料化學(xué)專業(yè))
- 小紅書食用農(nóng)產(chǎn)品承諾書示例
- 釘釘OA辦公系統(tǒng)操作流程培訓(xùn)
- 新生兒科年度護理質(zhì)控總結(jié)
- GB/T 15934-2024電器附件電線組件和互連電線組件
- 《工貿(mào)企業(yè)有限空間作業(yè)安全規(guī)定》知識培訓(xùn)
- 高層次人才座談會發(fā)言稿
- 垃圾清運公司管理制度(人員、車輛、質(zhì)量監(jiān)督、會計管理制度)
- 《建筑工程設(shè)計文件編制深度規(guī)定》(2022年版)
- 營銷人員薪酬考核方案
評論
0/150
提交評論