《完全信息靜態(tài)博弈綜述》2900字

上傳人：E*** IP屬地：湖北上傳時(shí)間：2024-12-30 格式：DOCX 頁(yè)數(shù)：6 大小：82.32KB 積分：10.8 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩1頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

完全信息靜態(tài)博弈綜述1.1納什均衡納什（JohnForbesNashJr，1928年6月13日—2015年5月23日）是一位著名的美國(guó)數(shù)學(xué)家以及經(jīng)濟(jì)學(xué)家，他不僅僅在博弈論做出了巨大貢獻(xiàn)，也在微分幾何以及偏微分方程等領(lǐng)域成就非凡。在他的下半生任教于普林斯頓大學(xué)時(shí)，他的博弈理論隨著時(shí)代的發(fā)展在經(jīng)濟(jì)學(xué)中得到了廣泛的應(yīng)用，這也使他獲得了1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2015年，他又因在非線性偏微分方程方面的工作而與路易斯·尼倫貝格（LouisNirenberg）共同獲得了阿貝爾獎(jiǎng)。納什是迄今為止唯一同時(shí)獲得過(guò)諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)和阿貝爾獎(jiǎng)的人。1959年，納什開(kāi)始明顯出現(xiàn)精神病跡象，隨后花了數(shù)年在精神病院接受相關(guān)的精神治療。上世紀(jì)70年代之后，他成功克服病魔。并在在1980年代中期重返學(xué)術(shù)領(lǐng)域。這些傳奇經(jīng)歷后來(lái)成為了《美麗心靈》的原型。對(duì)于博弈論，納什所做出的巨大貢獻(xiàn)主要表現(xiàn)在兩方面：在合作博弈方面，他于1950年發(fā)表的論文

《TheBargainingProblem》中提出了討價(jià)還價(jià)模型；在非合作博弈方面，他貢獻(xiàn)非常巨大。他在1950所發(fā)表的論文《EquilibriumPointsinN-personGame》以及1951年所發(fā)表的論文《Non-cooperativeGames》中明確定義了非合作博弈，也隨之提出了非合作博弈的均衡解，并且使用數(shù)學(xué)方法嚴(yán)格證明了非合作博弈均衡解的存在性。這些巨大的貢獻(xiàn)奠定了非合作博弈的基礎(chǔ)，也使得他在論文中所定義的均衡被后世的數(shù)學(xué)家、經(jīng)濟(jì)學(xué)家以及各種運(yùn)用博弈論的學(xué)者稱之為納什均衡（Nashequilibrium）。下面，我們主要介紹納什在非合作博弈相關(guān)的理論，即納什均衡。首先需要介紹的是納什均衡的定義：不妨設(shè)博弈的參與者有n個(gè)，在明確其他任意博弈參與者的策略下，每一個(gè)參與者決定出自己的最優(yōu)策略，需要指明的是每個(gè)人的最優(yōu)策略可能與其他參與者的策略相關(guān)，也可能與其他參與者的策略無(wú)關(guān)，這樣所有參與者所選擇的策略一起構(gòu)成了一個(gè)策略組合(StrategyProfile)。納什均衡指的就是這樣一種策略組合，每一個(gè)參與者都采用的是最優(yōu)策略，即對(duì)于每個(gè)參與者來(lái)說(shuō)，如果其他人不主動(dòng)改變自身的策略，他就無(wú)法取得更大受益。換句話說(shuō)：沒(méi)有人有積極性改變自己所選擇的策略。1.2納什均衡的例子及應(yīng)用介紹納什均衡，其實(shí)不應(yīng)該避開(kāi)艾爾特.W.塔克所提出的囚徒困境，但考慮篇幅有限，本文主要介紹納什均衡的另外兩個(gè)例子：古諾寡頭博弈模型與豪泰林博弈模型，這兩個(gè)模型都是典型的納什均衡在經(jīng)濟(jì)學(xué)中的應(yīng)用，但又早于納什均衡的提出，則這兩者既可以闡釋納什均衡，又可以揭示博弈論思想萌芽的出現(xiàn)。首先介紹古諾寡頭博弈模型，古諾（AntoineAugustinCournot，1801年8月28日—1877年3月31日）是法國(guó)著名的哲學(xué)家、數(shù)學(xué)家以及經(jīng)濟(jì)學(xué)家。1838年，他出版了不朽的巨作《財(cái)富理論的數(shù)學(xué)原理研究》（ResearchesontheMathematicalPrinciplesoftheTheoryofWealth），在這本書(shū)中，他首次將數(shù)學(xué)公式和符號(hào)應(yīng)用到了實(shí)際的經(jīng)濟(jì)分析中，巧妙地給出了許多數(shù)學(xué)模型。但其超前的思想在當(dāng)時(shí)不為當(dāng)時(shí)的大多數(shù)經(jīng)濟(jì)學(xué)家所接受，甚至還受到批評(píng)。但這不妨礙多年后的今天，古諾的理論被廣泛應(yīng)用，甚至被許多經(jīng)濟(jì)學(xué)家是現(xiàn)代經(jīng)濟(jì)分析的起點(diǎn)。下面我們要介紹的是這本著作中最廣為流傳的模型：古諾寡頭博弈模型。古諾寡頭博弈模型來(lái)源于古諾對(duì)兩個(gè)礦泉水生產(chǎn)企業(yè)的描述，基于如下的假設(shè)：（1）企業(yè)數(shù)量大于等于2，所有企業(yè)都生產(chǎn)一樣的產(chǎn)品，即產(chǎn)品沒(méi)有實(shí)質(zhì)性差異。（2）企業(yè)之間不合作，即企業(yè)之間不溝通產(chǎn)量。（3）企業(yè)都具有市場(chǎng)影響力，即每個(gè)企業(yè)的產(chǎn)量多少都會(huì)影響產(chǎn)品的價(jià)格，（4）企業(yè)的數(shù)目是固定的，即不存在新企業(yè)進(jìn)入。（5）企業(yè)在數(shù)量上競(jìng)爭(zhēng)并且同時(shí)選擇數(shù)量。（6）企業(yè)為理性的，追求最大利益。我們討論兩個(gè)企業(yè)的情形：企業(yè)1、企業(yè)2，同時(shí)明確每個(gè)企業(yè)的策略是選擇生產(chǎn)多少數(shù)量的產(chǎn)品；支付是利潤(rùn)，是關(guān)于兩個(gè)企業(yè)產(chǎn)量的函數(shù)。首先用表示企業(yè)的生產(chǎn)數(shù)量，其次用表示生產(chǎn)過(guò)程中的成本函數(shù)，最后用表示逆需求函數(shù)，需要說(shuō)明的是是價(jià)格，表示原需求函數(shù)。則可以得到關(guān)于第個(gè)企業(yè)的利潤(rùn)函數(shù)為：如果用來(lái)表示納什均衡的產(chǎn)量則有：在數(shù)學(xué)上尋找納什均衡的方法之一：求導(dǎo)，并找出其一階導(dǎo)數(shù)值為0的點(diǎn)：由此可以由上確定兩個(gè)反應(yīng)函數(shù)：納什均衡即為的交點(diǎn)，如下圖1：圖1從模型的介紹中我們可以清晰感受到古諾寡頭博弈模型中關(guān)于納什均衡的萌芽，其可以說(shuō)得上是納什均衡有記載的最早版本。但遺憾的是古諾的工作被認(rèn)作博弈論理論的先驅(qū)是在1955年才被Shubik發(fā)現(xiàn)，就如同《財(cái)富理論的數(shù)學(xué)原理研究》的認(rèn)同來(lái)得遲一樣，古諾對(duì)博弈論的貢獻(xiàn)獲得認(rèn)可也姍姍來(lái)遲。下面開(kāi)始介紹豪泰林（Hotelling）價(jià)格競(jìng)爭(zhēng)模型，豪泰林（HaroldHotelling，1895年9月29日—1973年12月26日）是美國(guó)的數(shù)理統(tǒng)計(jì)學(xué)家和理論經(jīng)濟(jì)學(xué)家。他曾任教于斯坦福大學(xué)、哥倫比亞大學(xué)、北卡羅來(lái)納大學(xué)教堂山分校等大學(xué)。他最杰出的成就是開(kāi)發(fā)主成分分析方法，這種方法被廣泛應(yīng)用于金融、統(tǒng)計(jì)、計(jì)算機(jī)等領(lǐng)域。在去世前一年，因?yàn)槠湟簧诟鱾€(gè)領(lǐng)域杰出的貢獻(xiàn)，其被授予了NorthCarolinaAward。本文將介紹的豪泰林價(jià)格競(jìng)爭(zhēng)模型就來(lái)自于他1929的論文《StabilityinCompetition》。豪泰林價(jià)格競(jìng)爭(zhēng)模型是基于如下假設(shè)的：（1）城市為一條長(zhǎng)度為1的線段，所有的居民均勻分布在這條線段上；（2）這條線段的兩端各分布著一家超市；（3）每家超市的商品是同質(zhì)的，成本為；（4）居民購(gòu)買商品的單位旅游成本為；（5）在線段上存在一點(diǎn)，兩家超市對(duì)該點(diǎn)上居民無(wú)差異，該點(diǎn)往左的居民會(huì)選擇商店1，往右反之。用與表示超市的商品價(jià)格和可售出商品數(shù)量。我們可以簡(jiǎn)化成如2圖的位置關(guān)系：圖2由假設(shè)（3）有：可解出：則商店分別售出的商品數(shù)量如下：可將兩家商店的利潤(rùn)表示為:如古諾模型處理方法：則可得均衡價(jià)格：這兩個(gè)模型都是納什均衡在經(jīng)濟(jì)學(xué)中應(yīng)用的典型案例，并且都早于納什均衡出現(xiàn)，這說(shuō)明了博弈論的出現(xiàn)與發(fā)展，并不是一個(gè)人的奇思妙想，而是來(lái)源于各種案例以及問(wèn)題的積累。1.3相關(guān)均衡在納什均衡中，每個(gè)人都是獨(dú)立行動(dòng)的，但在實(shí)際情況下，博弈策略的選擇可能有相關(guān)性的。比如：參與者1、參與者2兩位參與者，在博弈前一天約定根據(jù)明天的天氣情況來(lái)選擇策略。比如：晴天：參與者1選擇策略1、參與者2選擇策略2；陰天：參與者1選擇策略3、參與者2選擇策略4.這樣通過(guò)天氣的變化，他們之間的選擇就出現(xiàn)相關(guān)了。這就要引出奧曼的相關(guān)均衡來(lái)解決問(wèn)題了。奧曼(Robert

John

Aumann，1930年6月8日-)，是一位出生于德國(guó)的猶太人。在二戰(zhàn)期間期間逃亡美國(guó)，后在美國(guó)取得數(shù)學(xué)的學(xué)士、碩士、博士學(xué)位，成為了一位數(shù)學(xué)家、經(jīng)濟(jì)學(xué)家，因其在博弈論領(lǐng)域做出的卓越貢獻(xiàn)獲得了2005的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。他一生致力于研究博弈論，在博弈論領(lǐng)域做出過(guò)許多重大成果，如：博弈論中關(guān)于常識(shí)的第一個(gè)純形式的解釋、與勞埃德·沙普利（Lloyd

Shapley）合作研究了Aumann–Shapley值等。但他最廣泛傳播的成果1974年發(fā)表論文《Subjectivityandcorrelationinrandomizedstrategies》中提出的相關(guān)均衡。

在這篇論文中，奧曼證明了如果博弈參與人根據(jù)某個(gè)可以共同觀測(cè)的信號(hào)選擇行動(dòng)，就會(huì)出現(xiàn)相關(guān)均衡，相關(guān)均衡可以使所有的博弈者受益。同時(shí)其中更為重要的是，奧曼還證明了在每個(gè)人收到不同但相關(guān)的信號(hào)下，每個(gè)人都可以去獲得更高的效用。為了解釋相關(guān)均衡可以是所有人受益，下面簡(jiǎn)要介紹一個(gè)關(guān)于相關(guān)均衡的例子，假如博弈者1、2的支付矩陣如下：表1易得該博弈有三個(gè)納什

人人文庫(kù)> 全部分類> 行業(yè)資料 > 工業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《完全信息靜態(tài)博弈綜述》2900字

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《完全信息靜態(tài)博弈綜述》2900字

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔