版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第十章博弈論第一節(jié)博弈論概述一、經(jīng)濟(jì)學(xué)與博弈論研究的對象經(jīng)濟(jì)資源的稀缺性選擇與資源配置中心理論價格理論基本假設(shè)前提完全理性完全信息主流經(jīng)濟(jì)學(xué)假設(shè)行為決策人是完全理性的,且具有與最優(yōu)化相關(guān)的所有信息,并能正確地運用這些信息來指導(dǎo)自己的行理論動。在該假定下,經(jīng)濟(jì)學(xué)家們不顧現(xiàn)實世界的紛繁復(fù)雜,致力于對均衡和本質(zhì)規(guī)律的研究。
完全理性與有限理性人的完全理性意味著,人有足夠的信息、知識和計算能力,來確保實現(xiàn)自己的效用最大化。因此,理性假定意味著理性人能夠運用數(shù)學(xué)工具描述人的(最大化)行為。對完全理性人的理解他們有一個很好定義的偏好,并能夠按照即定的偏好進(jìn)行選擇;他們的選擇受到預(yù)算約束;他們努力在約束條件下實現(xiàn)效用最大化。但事實上,現(xiàn)實中的人多數(shù)情況下處于有限理性狀態(tài)
有限理性是指在處理信息、應(yīng)付復(fù)雜情況和尋求理性目標(biāo)中個人的能力是有限的。有限理性人是知識有限、信息有限的個人,在現(xiàn)實中也不是先知先覺、富有遠(yuǎn)見的理性人。他們不可能也不期望在復(fù)雜的環(huán)境中想得太遠(yuǎn)太多。他們不可能預(yù)測到將來發(fā)生的所有可能事件,并且針對它們做出詳細(xì)的行動計劃和分配方案。他們即使能夠預(yù)測和做出計劃的話,也沒有一種人類語言能足夠豐富和準(zhǔn)確地描述它。
完全理性與有限理性完全信息意味著信息是對稱的,充分的,完全信息的人有足夠的信息實現(xiàn)自己最大化行為。但現(xiàn)實的市場并不完全,如買賣雙方的人數(shù)并不足夠的多,信息也是不完備的。有限的人數(shù)意味著人們之間的行為是有直接影響的,所以一個人在決策時必須考慮對方的反應(yīng),而別人的選擇也會影響自己的選擇?,F(xiàn)實生活中信息并不總是完備的,這使得價格機(jī)制并不總是實現(xiàn)合作和解決沖突的最有效安排。博弈論(GameTheory)又稱為對策論或游戲論,是研究決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡問題,即具有相互影響作用的理性行為。博弈論所研究的典型問題是兩個或兩個以上的當(dāng)事人在競爭條件下各自做出決策,使自己的一方得到盡可能有利的結(jié)果。由于經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的,都強調(diào)個人理性,即追求給定條件下效用最大化,因此博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛的應(yīng)用,對寡頭理論、信息經(jīng)濟(jì)學(xué)等方面的發(fā)展做出了重要貢獻(xiàn)。
政策制訂者的決策工具;社會經(jīng)濟(jì)問題的理論分析工具,解釋經(jīng)濟(jì)中許多低效率現(xiàn)象的根源,找出各種經(jīng)濟(jì)問題的制度性、環(huán)境性原因,揭示各種經(jīng)濟(jì)行為和政策的效率意義等。嚴(yán)格的說,博弈論并不是經(jīng)濟(jì)學(xué)的一個分支,它是一種方法,用數(shù)學(xué)的知識來研究當(dāng)理性人的決策相互影響時,他們是如何進(jìn)行決策以獲取最大收益的。其應(yīng)用范圍并不局限于經(jīng)濟(jì)學(xué),還涉及到政治學(xué)、軍事學(xué)、外交學(xué)甚至犯罪學(xué)等多個領(lǐng)域。
博弈論是在1944年由馮·諾依曼和奧·摩根斯坦恩發(fā)表的《博弈論和經(jīng)濟(jì)行為》引入經(jīng)濟(jì)學(xué)的。合作型博弈在20世紀(jì)50年代達(dá)到了巔峰期。
1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。
1994年度的諾貝爾經(jīng)濟(jì)學(xué)獎授予三位從事對策論研究的經(jīng)濟(jì)學(xué)家:納什、澤爾騰、海薩尼。在博弈論的演進(jìn)過程中,以納什、海薩尼、澤爾騰為代表的經(jīng)濟(jì)學(xué)家采用數(shù)學(xué)語言和公理性的方法來進(jìn)行研究,成為博弈論的主流范式。
2005年諾貝爾經(jīng)濟(jì)學(xué)獎授予有以色列和美國雙重國籍的羅伯特·奧曼和美國人托馬斯·謝林,以表彰他們通過博弈理論的分析增強世人對合作與沖突的理解。謝林獨辟蹊徑,開創(chuàng)了非數(shù)學(xué)博弈理論這一新的領(lǐng)域。他認(rèn)為,博弈模型不可能表述雙方或多方之間相互影響,決策主體的期望和行為的決定因素與其說是數(shù)學(xué)的,不如說是創(chuàng)造聲譽、沿襲傳統(tǒng)、建立自信、顯示大度等經(jīng)驗。非數(shù)理博弈理論分析的就是這樣一種狀態(tài)下的社會和經(jīng)濟(jì)行為:行為者本身對其它人的反應(yīng)也作為其他人的期望而影響其行為。他建構(gòu)了一套概念框架來描述這種相互預(yù)期的困境,進(jìn)行了接近現(xiàn)實觀察的分析。
1、根據(jù)博弈方是否合作
合作博弈:博弈方能夠達(dá)成具有約束力的協(xié)議。強調(diào)集體理性,效率,公平。
非合作博弈:博弈方不能達(dá)成具有約束力的協(xié)議。強調(diào)個人理性,結(jié)果可能是有效的,也可能是無效率的?,F(xiàn)代經(jīng)濟(jì)學(xué)中談到博弈論,一般指的是非合作博弈二、博弈論的主要內(nèi)容2、根據(jù)行動的先后順序:靜態(tài)博弈:是指參與人同時行動或不同時行動,但后行動者并不知道先行動者采取了什么具體行動。
動態(tài)博弈:是指參與人行動有先后順序,且后行動者能觀察到先行動者所選擇的行動。
3、根據(jù)參與人掌握的信息完全信息博弈:每一個參與人對所有其他參與人(對手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識。不完全信息博弈:至少部分參與人不完全了解其他參與人的特征、戰(zhàn)略空間及支付函數(shù)的情況,也稱為“不對稱信息博弈”
行動順序
信息靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈完全信息動態(tài)博弈不完全信息不完全信息靜態(tài)博弈不完全信息動態(tài)博弈納什均衡子博弈精煉納什均衡貝葉斯納什均衡精煉貝葉斯納什均衡一個博弈的基本要素包括參與人或游戲者、行動、信息、戰(zhàn)略、收益或支付、結(jié)果、均衡。博弈分析的目的是使用博弈規(guī)則預(yù)測均衡第二節(jié)完全信息靜態(tài)博弈一、博弈的基本要素參與人(players):指的是在博弈中選擇行動以最大化自己效用的決策主體(可能是個人,也可能是團(tuán)體)。
行動(actions):指的是參與人的決策變量。
戰(zhàn)略(strategies):參與人選擇行動的規(guī)則,它告訴參與人在什么時候選擇什么行動。
信息(Information):指的是參與人在博弈中的知識,特別是有關(guān)其它參與人的特征和行動的知識。
支付函數(shù)(players):指的是參與人從博弈中獲得的效用水平,這是參與人真正關(guān)心的東西。
參與人在博弈中的目標(biāo)就是選擇自己的戰(zhàn)略以最大化自己的支付函數(shù)。博弈的一個基本特征是一個參與人的支付不僅取決于自己的戰(zhàn)略選擇,而且取決于所有其他參與人的戰(zhàn)略選擇;是戰(zhàn)略組合的函數(shù)。它是所有參與人戰(zhàn)略的函數(shù)。
均衡:是所有參與人的最優(yōu)戰(zhàn)略或行動的組合。
可以用一個支付矩陣來描述和分析一個博弈。支付矩陣支付矩陣(PayoffMatrix,又稱收益矩陣等)描述一個博弈結(jié)構(gòu)。下面支付矩陣中,兩個參與者A和廠商B各自可以選擇兩種策略,分別用“左右”和“上下”來標(biāo)識;數(shù)字表示雙方在不同策略選擇組合下得到的支付,較大數(shù)字代表較大利益。如A和B分別選擇上和左策略時,左上角方框“1,2”表示它們分別得到的收益;分別選擇策略下和右時,分別得到右下角方框數(shù)字“1,0”代表的支付。1,21,02,10,1左上右下廠商B廠商A
占優(yōu)戰(zhàn)略均衡是指參與人的最優(yōu)戰(zhàn)略不依賴于其他參與人的戰(zhàn)略選擇。不論其他參與人選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是唯一的,這個最優(yōu)戰(zhàn)略被稱為占優(yōu)戰(zhàn)略。在一個博弈中,如果所有參與人都有占優(yōu)戰(zhàn)略,那么所有參與人的占優(yōu)戰(zhàn)略組合便是該博弈的唯一均衡,叫占優(yōu)戰(zhàn)略均衡。二、占優(yōu)戰(zhàn)略均衡-1-1-1000-10-8-8囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境()1701608018020050150100廠商A1020廠商B1020練習(xí):價格競爭策略
三、重復(fù)剔除的占優(yōu)均衡首先找出某一參與人的嚴(yán)格劣戰(zhàn)略,將它剔除掉,重新構(gòu)造一個不包括已剔除戰(zhàn)略的新的博弈,然后繼續(xù)剔除這個新的博弈中某一參與人的嚴(yán)格劣戰(zhàn)略,直到剩下唯一的參與人戰(zhàn)略組合為止。這個唯一剩下的參與人的戰(zhàn)略組合,就是博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)戰(zhàn)略均衡”?!爸秦i博弈”假設(shè)豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應(yīng)的按鈕,按一下按鈕會有8個單位的豬食進(jìn)槽,但是誰按按鈕就會首先付出2個單位的成本,如果兩頭豬一起去按按鈕,同時到達(dá)食槽,大豬吃5個單位,小豬吃3個單位,扣除2個單位成本,其支付組合為(3,1)。其余情況依次類推。007-12431大豬按等待小豬按等待(按,等待)是該博弈的唯一均衡。四、納什均衡納什均衡是指這樣一種均衡狀態(tài),在這一均衡狀態(tài)中,每一個參與人選擇的戰(zhàn)略必須是針對其他參與人選擇戰(zhàn)略的最優(yōu)反映,沒有人愿意獨立放棄他所選擇的戰(zhàn)略。納什均衡要求任何一個參與者在其他參與者的策略選擇給定的條件下,其選擇的策略是最優(yōu)的。在一個納什均衡里,任何一個參與者都不會改變自己的策略,如果其他參與者不改變策略。-1-1-1000-10-8-8囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境占優(yōu)策略均衡是比納什均衡更強的一個博弈均衡概念。占優(yōu)策略均衡要求任何一個參與者對于其他參與者任何策略選擇來說,其最優(yōu)策略都是唯一的。而納什均衡只要求任何一個參與者在其他參與者的策略選擇給定的條件下,其選擇的策略是最優(yōu)的。所以,占優(yōu)策略均衡一定是納什均衡,而納什均衡不一定就是占優(yōu)策略均衡。-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境囚徒困境的啟示個體理性與集體理性的矛盾。一種制度安排或一種體制選擇,要發(fā)生效力,它必須是納什均衡。否則,這種制度安排是不能成立的。性別戰(zhàn)12000021男看足球看電影女看足球看電影納什均衡常常不是唯一的,在這種條件下,納什均衡的存在性并不意味著均衡結(jié)果會出現(xiàn),即使結(jié)果是一個納什均衡,但也是我們無法準(zhǔn)確預(yù)測的;經(jīng)濟(jì)學(xué)家的建議是:可以增加更多的限制條件,如增加參與人的其他信息,使得納什均衡的數(shù)目減少,從而做出預(yù)測。0,66,07,56,0
0,67,55,75,58,8游戲者B
U
VW游戲者AXYZ練習(xí)1:尋找納什均衡?0,01,-1-1,1-1,1
0,01,-11,-1-1,10,0游戲者B
U
VW游戲者AXYZ練習(xí)2:尋找納什均衡?納什均衡納什均衡是博弈的結(jié)局,在該均衡中每個局中人均不能因單方面改變自己的策略選擇而獲益。納什均衡是一個僵局:給定別人不動的情況下,沒有人有興趣動。納什均衡可以理解為一種具有自我強制力的協(xié)議,即這種協(xié)議沒有外加力量保證實施卻使每個參與者都自愿遵守,原因就在背叛協(xié)議無利可圖。第三節(jié)完全信息動態(tài)博弈在完全信息動態(tài)博弈中,博弈各方的行動有先后的順序,且后行動者可以觀察到先行動者的具體行動,而且行動可能不止一次。在這種情況下,每個參與者在選擇策略的時候,不僅需要考慮當(dāng)前的選擇,可能還要考慮當(dāng)前選擇的戰(zhàn)略對于以后的博弈將產(chǎn)生什么影響。03000300-10
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度農(nóng)業(yè)現(xiàn)代化農(nóng)機(jī)租賃服務(wù)合同3篇
- 二零二五年度股東合作打造智能物流網(wǎng)絡(luò)合同3篇
- 二零二五年度環(huán)保材料墻繪施工合同3篇
- 2025年度新型廣告字生產(chǎn)、安裝及售后服務(wù)合同3篇
- 二零二五年度老年健身器材租賃合同2篇
- 2025年度租賃車輛環(huán)保排放檢測與治理合同3篇
- 2025年度公司定制婚禮用花采購服務(wù)合同2篇
- 二零二五年度人工智能醫(yī)療設(shè)備研發(fā)團(tuán)隊勞動合同終止補償協(xié)議2篇
- 2025年度養(yǎng)老院入住與醫(yī)療費用結(jié)算合同2篇
- 二零二五年度口腔診所與口腔材料供應(yīng)商戰(zhàn)略合作合同3篇
- 2024年度陶瓷產(chǎn)品代理銷售與品牌戰(zhàn)略合作協(xié)議3篇
- ISO 56001-2024《創(chuàng)新管理體系-要求》專業(yè)解讀與應(yīng)用實踐指導(dǎo)材料之9:“5領(lǐng)導(dǎo)作用-5.3創(chuàng)新戰(zhàn)略”(雷澤佳編制-2025B0)
- 2024版旅游景區(qū)旅游巴士租賃合同3篇
- LINUX網(wǎng)絡(luò)操作系統(tǒng)知到智慧樹章節(jié)測試課后答案2024年秋湖北交通職業(yè)技術(shù)學(xué)院
- 河北省邯鄲市2023-2024學(xué)年高一上學(xué)期期末質(zhì)量檢測地理試題 附答案
- 2024年7月國家開放大學(xué)法學(xué)本科《知識產(chǎn)權(quán)法》期末考試試題及答案
- 2024年河南省公務(wù)員錄用考試《行測》試題及答案解析
- (2024年)剪映入門教程課件
- 四年級上冊道法知識點匯總
- 南京華興數(shù)控產(chǎn)品說明書
- 第八章 地籍圖測繪
評論
0/150
提交評論