《完全信息靜態(tài)博弈綜述》2900字_第1頁(yè)
《完全信息靜態(tài)博弈綜述》2900字_第2頁(yè)
《完全信息靜態(tài)博弈綜述》2900字_第3頁(yè)
《完全信息靜態(tài)博弈綜述》2900字_第4頁(yè)
《完全信息靜態(tài)博弈綜述》2900字_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

完全信息靜態(tài)博弈綜述1.1納什均衡納什(JohnForbesNashJr,1928年6月13日—2015年5月23日)是一位著名的美國(guó)數(shù)學(xué)家以及經(jīng)濟(jì)學(xué)家,他不僅僅在博弈論做出了巨大貢獻(xiàn),也在微分幾何以及偏微分方程等領(lǐng)域成就非凡。在他的下半生任教于普林斯頓大學(xué)時(shí),他的博弈理論隨著時(shí)代的發(fā)展在經(jīng)濟(jì)學(xué)中得到了廣泛的應(yīng)用,這也使他獲得了1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2015年,他又因在非線性偏微分方程方面的工作而與路易斯·尼倫貝格(LouisNirenberg)共同獲得了阿貝爾獎(jiǎng)。納什是迄今為止唯一同時(shí)獲得過(guò)諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)和阿貝爾獎(jiǎng)的人。1959年,納什開(kāi)始明顯出現(xiàn)精神病跡象,隨后花了數(shù)年在精神病院接受相關(guān)的精神治療。上世紀(jì)70年代之后,他成功克服病魔。并在在1980年代中期重返學(xué)術(shù)領(lǐng)域。這些傳奇經(jīng)歷后來(lái)成為了《美麗心靈》的原型。對(duì)于博弈論,納什所做出的巨大貢獻(xiàn)主要表現(xiàn)在兩方面:在合作博弈方面,他于1950年發(fā)表的論文

《TheBargainingProblem》中提出了討價(jià)還價(jià)模型;在非合作博弈方面,他貢獻(xiàn)非常巨大。他在1950所發(fā)表的論文《EquilibriumPointsinN-personGame》以及1951年所發(fā)表的論文《Non-cooperativeGames》中明確定義了非合作博弈,也隨之提出了非合作博弈的均衡解,并且使用數(shù)學(xué)方法嚴(yán)格證明了非合作博弈均衡解的存在性。這些巨大的貢獻(xiàn)奠定了非合作博弈的基礎(chǔ),也使得他在論文中所定義的均衡被后世的數(shù)學(xué)家、經(jīng)濟(jì)學(xué)家以及各種運(yùn)用博弈論的學(xué)者稱之為納什均衡(Nashequilibrium)。下面,我們主要介紹納什在非合作博弈相關(guān)的理論,即納什均衡。首先需要介紹的是納什均衡的定義:不妨設(shè)博弈的參與者有n個(gè),在明確其他任意博弈參與者的策略下,每一個(gè)參與者決定出自己的最優(yōu)策略,需要指明的是每個(gè)人的最優(yōu)策略可能與其他參與者的策略相關(guān),也可能與其他參與者的策略無(wú)關(guān),這樣所有參與者所選擇的策略一起構(gòu)成了一個(gè)策略組合(StrategyProfile)。納什均衡指的就是這樣一種策略組合,每一個(gè)參與者都采用的是最優(yōu)策略,即對(duì)于每個(gè)參與者來(lái)說(shuō),如果其他人不主動(dòng)改變自身的策略,他就無(wú)法取得更大受益。換句話說(shuō):沒(méi)有人有積極性改變自己所選擇的策略。1.2納什均衡的例子及應(yīng)用介紹納什均衡,其實(shí)不應(yīng)該避開(kāi)艾爾特.W.塔克所提出的囚徒困境,但考慮篇幅有限,本文主要介紹納什均衡的另外兩個(gè)例子:古諾寡頭博弈模型與豪泰林博弈模型,這兩個(gè)模型都是典型的納什均衡在經(jīng)濟(jì)學(xué)中的應(yīng)用,但又早于納什均衡的提出,則這兩者既可以闡釋納什均衡,又可以揭示博弈論思想萌芽的出現(xiàn)。首先介紹古諾寡頭博弈模型,古諾(AntoineAugustinCournot,1801年8月28日—1877年3月31日)是法國(guó)著名的哲學(xué)家、數(shù)學(xué)家以及經(jīng)濟(jì)學(xué)家。1838年,他出版了不朽的巨作《財(cái)富理論的數(shù)學(xué)原理研究》(ResearchesontheMathematicalPrinciplesoftheTheoryofWealth),在這本書(shū)中,他首次將數(shù)學(xué)公式和符號(hào)應(yīng)用到了實(shí)際的經(jīng)濟(jì)分析中,巧妙地給出了許多數(shù)學(xué)模型。但其超前的思想在當(dāng)時(shí)不為當(dāng)時(shí)的大多數(shù)經(jīng)濟(jì)學(xué)家所接受,甚至還受到批評(píng)。但這不妨礙多年后的今天,古諾的理論被廣泛應(yīng)用,甚至被許多經(jīng)濟(jì)學(xué)家是現(xiàn)代經(jīng)濟(jì)分析的起點(diǎn)。下面我們要介紹的是這本著作中最廣為流傳的模型:古諾寡頭博弈模型。古諾寡頭博弈模型來(lái)源于古諾對(duì)兩個(gè)礦泉水生產(chǎn)企業(yè)的描述,基于如下的假設(shè):(1)企業(yè)數(shù)量大于等于2,所有企業(yè)都生產(chǎn)一樣的產(chǎn)品,即產(chǎn)品沒(méi)有實(shí)質(zhì)性差異。(2)企業(yè)之間不合作,即企業(yè)之間不溝通產(chǎn)量。(3)企業(yè)都具有市場(chǎng)影響力,即每個(gè)企業(yè)的產(chǎn)量多少都會(huì)影響產(chǎn)品的價(jià)格,(4)企業(yè)的數(shù)目是固定的,即不存在新企業(yè)進(jìn)入。(5)企業(yè)在數(shù)量上競(jìng)爭(zhēng)并且同時(shí)選擇數(shù)量。(6)企業(yè)為理性的,追求最大利益。我們討論兩個(gè)企業(yè)的情形:企業(yè)1、企業(yè)2,同時(shí)明確每個(gè)企業(yè)的策略是選擇生產(chǎn)多少數(shù)量的產(chǎn)品;支付是利潤(rùn),是關(guān)于兩個(gè)企業(yè)產(chǎn)量的函數(shù)。首先用表示企業(yè)的生產(chǎn)數(shù)量,其次用表示生產(chǎn)過(guò)程中的成本函數(shù),最后用表示逆需求函數(shù),需要說(shuō)明的是是價(jià)格,表示原需求函數(shù)。則可以得到關(guān)于第個(gè)企業(yè)的利潤(rùn)函數(shù)為:如果用來(lái)表示納什均衡的產(chǎn)量則有:在數(shù)學(xué)上尋找納什均衡的方法之一:求導(dǎo),并找出其一階導(dǎo)數(shù)值為0的點(diǎn):由此可以由上確定兩個(gè)反應(yīng)函數(shù):納什均衡即為的交點(diǎn),如下圖1:圖1從模型的介紹中我們可以清晰感受到古諾寡頭博弈模型中關(guān)于納什均衡的萌芽,其可以說(shuō)得上是納什均衡有記載的最早版本。但遺憾的是古諾的工作被認(rèn)作博弈論理論的先驅(qū)是在1955年才被Shubik發(fā)現(xiàn),就如同《財(cái)富理論的數(shù)學(xué)原理研究》的認(rèn)同來(lái)得遲一樣,古諾對(duì)博弈論的貢獻(xiàn)獲得認(rèn)可也姍姍來(lái)遲。下面開(kāi)始介紹豪泰林(Hotelling)價(jià)格競(jìng)爭(zhēng)模型,豪泰林(HaroldHotelling,1895年9月29日—1973年12月26日)是美國(guó)的數(shù)理統(tǒng)計(jì)學(xué)家和理論經(jīng)濟(jì)學(xué)家。他曾任教于斯坦福大學(xué)、哥倫比亞大學(xué)、北卡羅來(lái)納大學(xué)教堂山分校等大學(xué)。他最杰出的成就是開(kāi)發(fā)主成分分析方法,這種方法被廣泛應(yīng)用于金融、統(tǒng)計(jì)、計(jì)算機(jī)等領(lǐng)域。在去世前一年,因?yàn)槠湟簧诟鱾€(gè)領(lǐng)域杰出的貢獻(xiàn),其被授予了NorthCarolinaAward。本文將介紹的豪泰林價(jià)格競(jìng)爭(zhēng)模型就來(lái)自于他1929的論文《StabilityinCompetition》。豪泰林價(jià)格競(jìng)爭(zhēng)模型是基于如下假設(shè)的:(1)城市為一條長(zhǎng)度為1的線段,所有的居民均勻分布在這條線段上;(2)這條線段的兩端各分布著一家超市;(3)每家超市的商品是同質(zhì)的,成本為;(4)居民購(gòu)買商品的單位旅游成本為;(5)在線段上存在一點(diǎn),兩家超市對(duì)該點(diǎn)上居民無(wú)差異,該點(diǎn)往左的居民會(huì)選擇商店1,往右反之。用與表示超市的商品價(jià)格和可售出商品數(shù)量。我們可以簡(jiǎn)化成如2圖的位置關(guān)系:圖2由假設(shè)(3)有:可解出:則商店分別售出的商品數(shù)量如下:可將兩家商店的利潤(rùn)表示為:如古諾模型處理方法:則可得均衡價(jià)格:這兩個(gè)模型都是納什均衡在經(jīng)濟(jì)學(xué)中應(yīng)用的典型案例,并且都早于納什均衡出現(xiàn),這說(shuō)明了博弈論的出現(xiàn)與發(fā)展,并不是一個(gè)人的奇思妙想,而是來(lái)源于各種案例以及問(wèn)題的積累。1.3相關(guān)均衡在納什均衡中,每個(gè)人都是獨(dú)立行動(dòng)的,但在實(shí)際情況下,博弈策略的選擇可能有相關(guān)性的。比如:參與者1、參與者2兩位參與者,在博弈前一天約定根據(jù)明天的天氣情況來(lái)選擇策略。比如:晴天:參與者1選擇策略1、參與者2選擇策略2;陰天:參與者1選擇策略3、參與者2選擇策略4.這樣通過(guò)天氣的變化,他們之間的選擇就出現(xiàn)相關(guān)了。這就要引出奧曼的相關(guān)均衡來(lái)解決問(wèn)題了。奧曼(Robert

John

Aumann,1930年6月8日-),是一位出生于德國(guó)的猶太人。在二戰(zhàn)期間期間逃亡美國(guó),后在美國(guó)取得數(shù)學(xué)的學(xué)士、碩士、博士學(xué)位,成為了一位數(shù)學(xué)家、經(jīng)濟(jì)學(xué)家,因其在博弈論領(lǐng)域做出的卓越貢獻(xiàn)獲得了2005的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。他一生致力于研究博弈論,在博弈論領(lǐng)域做出過(guò)許多重大成果,如:博弈論中關(guān)于常識(shí)的第一個(gè)純形式的解釋、與勞埃德·沙普利(Lloyd

Shapley)合作研究了Aumann–Shapley值等。但他最廣泛傳播的成果1974年發(fā)表論文《Subjectivityandcorrelationinrandomizedstrategies》中提出的相關(guān)均衡。

在這篇論文中,奧曼證明了如果博弈參與人根據(jù)某個(gè)可以共同觀測(cè)的信號(hào)選擇行動(dòng),就會(huì)出現(xiàn)相關(guān)均衡,相關(guān)均衡可以使所有的博弈者受益。同時(shí)其中更為重要的是,奧曼還證明了在每個(gè)人收到不同但相關(guān)的信號(hào)下,每個(gè)人都可以去獲得更高的效用。為了解釋相關(guān)均衡可以是所有人受益,下面簡(jiǎn)要介紹一個(gè)關(guān)于相關(guān)均衡的例子,假如博弈者1、2的支付矩陣如下:表1易得該博弈有三個(gè)納什

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論