




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、20112012學年第二學期博弈論前沿專題Word版教案第一章 預備知識(1)1 博弈論學科的研究對象:a 博弈論研究沖突與合作b 理性的個體或群體間的沖突與合作c 相互影響的決策理論(羅伯特奧曼Robert J. Aumann)2 博弈論(Game Theory)學科的產(chǎn)生和發(fā)展:(1)作為一門學科始于1944年馮諾伊曼(Von Neumann)和摩根斯坦(O. Morgenstern)的“Theory of Games and Economic Behavior” 一書。(2)50年代初天才數(shù)學家納什(J. Nash)證明了非合作博弈穩(wěn)定解的存在性,納什均衡和一般均衡一起成為經(jīng)濟學兩個基石
2、。(3)澤爾騰(1965)提出求解動態(tài)博弈問題的子博弈均衡概念;(4)海薩尼(Harsanyi,1967)提出求解不完全信息博弈問題的海薩尼轉換,以及對于不完美信息博弈問題的貝葉斯均衡概念;(5)90年代以來博弈論的3個發(fā)展動向:合作博弈理論(cooperate GT)、演化博弈(evolutionary GT)、實驗博弈3 古典經(jīng)濟學中“理性經(jīng)濟人”內涵:(1)“自利”。追求自身利益是根本動機,同時利他。(2)“理性行為”4 西蒙的“有限理性”概念:(1)經(jīng)濟學家西蒙(1976)認為,經(jīng)濟行為人由于:人類認知能力的限制;未來預測不確定性;多樣化的目標追求,最優(yōu)解是根本達不到的,提出了“有限理
3、性”(bounded rationality)(2)具有有限理性的個體決策者,只能進行次優(yōu)選擇-追求較滿意的目標。5 博弈論中“理性”概念的內涵:(1)目標理性(主觀理性):參與者追求自身利益的最大化(經(jīng)濟學理性的內涵)(2)過程理性(具有理性的能力):給定參與者對外部環(huán)境的信念后最大化自己的報酬,即“前后一致的”做出選擇.可以分為兩個推理步驟:a 認知理性(cognitive)參與者對相關環(huán)境可獲得的信息與形成的信念之間的一致性,即參與者具有對相關環(huán)境形成信念的能力;b 工具理性(instrumental)參與者對外部給定的機遇與固定的偏好之間的一致性,即參與者具有從既定的信念推導出采取相應
4、策略的能力。6 貝葉斯決策:(1)先由過去的經(jīng)驗或者專家估計獲得即將發(fā)生事件的事前先驗概率;(2)根據(jù)調查或者試驗得出的條件概率,利用貝葉斯公式,計算事后的后驗概率。第二章 預備知識(2)1 博弈中均衡(納什均衡)的不同理解:(1)觀點1:參與者們采取的最佳應對策略一致同意達到的結果,其具有“可自我實施”(self-inforcement)的特征(即:獨自偏離均衡策略不會帶來更好結果)。該觀點認為,均衡是一種結果。(2)觀點2:博弈均衡,當且僅當每一個參與者對所有參與者的行為有正確的預期。該觀點認為,均衡是一種信念。(3)觀點3:該觀點認為,均衡是一種規(guī)則。在“理性”假設下,該三種定義是等價的
5、。2 選擇(selection)與精練(perfection)(1) 選擇問題:在非合作博弈中,一些威脅和承諾是不可信的,如何選擇那些能夠實現(xiàn)一致預期的均衡結果;(2)精練問題:對于博弈存在多重均衡的情況,如何判斷哪些均衡更有可能實現(xiàn)。3 Nash在其博士論文“Non-cooperative games”(1950年)給出Nash均衡的兩種解釋:(1) 是“理性主義”的、內省的、演繹的傳統(tǒng)解說均衡是通過理性的參與者進行嚴密的邏輯演繹推理得到的,對參與者的理性能力有較高要求(傳統(tǒng)博弈分析)。(2) 是學習的、歸納的、演化的解說當時沒有很好的方法構建數(shù)學模型(國際上90年代興起演化博弈理論)。4
6、合作博弈:參與者之間的協(xié)議是有完全約束力并能夠實施的,即外生給定的。合作博弈研究的主要問題:如何實現(xiàn)有約束力的協(xié)議的參與者之間無沖突的串謀?5 完美信息(perfective information)參與者在選擇行動時了解以前的歷史,并且雙方?jīng)]有同時行動。完備信息(complete information)參與者對博弈的信息是否完全了解,又稱完全信息。當各個要素(參與者、規(guī)則、得益、策略)都是共同知識時,為完備信息。第三章 傳統(tǒng)博弈理論的簡介1 傳統(tǒng)博弈理論的研究思路:參與者“完全理性”假設下,通過推理演繹達到均衡化過程。均衡是瞬間實現(xiàn)的。2 納什均衡(Nash Equilibrium,簡記N
7、E)的理解:參與者可以直接交換信息并一致同意選擇某一策略,雖然這些口頭協(xié)議無法強制實施,但是每個參與者單獨偏離卻不會帶來更大收益,因此該策略組合是自動實施的(self-enforcing)。3 納什均衡的無效率問題:囚徒困境在非合作博弈框架內的解決途徑?博弈重復進行的過程中產(chǎn)生合作行為。其它的一些途徑包括聲譽效應、互惠機制、利他主義行為、空間網(wǎng)絡上的演化博弈等4 無限次重復博弈的分析思路;在無限次重復博弈中,考慮到時間價值,引入貼現(xiàn)系數(shù),這樣總收益將是一個有限數(shù)加以比較。5如何理解無限次重復博弈的無名氏定理(民間定理)?對于原博弈具有唯一NE(如囚徒困境)的無限次重復博弈,可以設計出具有可信威
8、脅的觸發(fā)策略,如果參與者比較看重未來長期合作的收益(貼現(xiàn)系數(shù)足夠大),就可以達成合作結局,擺脫囚徒困境。6 動態(tài)博弈的核心問題:為了影響對方下階段的行動,作出一些威脅或承諾。但這些威脅或承諾是否可信?7 子博弈完美的基本思想:(1)動態(tài)博弈中,一個納什均衡策略的每一個子博弈都是納什均衡,則該均衡策略是子博弈完美納什均衡;(2)其對于雙方理性能力的要求是基于“共同知識”,因此在NE的基礎上(可自我實施的穩(wěn)定均衡),依據(jù)反向歸納法進一步剔除那些不可信的威脅和承諾。(3)由于動態(tài)博弈的核心問題是“可信性”,因此子博弈完美均衡是求解動態(tài)博弈問題的基本均衡概念。8 不完全信息博弈的處理方法:(1)海薩尼
9、轉換(Harsanyis procedure),引入一個神秘的“自然”,其事先決定了參與者的各種可能類型,以及每種類型發(fā)生的概率。注意:每個參與者的真實類型只是他本人的私人信息;但是各種可能的類型和相應概率,卻是共同知識。由此,可將不完備信息轉化為完備但不完美信息。(2)進而,通過貝葉斯決策,可以得到不完美信息下分析方法。9 計算要求:掌握求解靜態(tài)博弈的混合策略均衡;動態(tài)博弈的子博弈完美納什均衡;重復博弈的均衡路徑求解第四章 不完全信息博弈和信息經(jīng)濟學(1):道德風險和激勵理論1 信息經(jīng)濟學的研究對象:以參與者不對稱信息為基本出發(fā)點,分析不對稱信息對效率的損害,以及怎樣設計可能的機制減輕這種損
10、害。2 私人信息(private information):訂立契約或執(zhí)行過程中只有自己知道的信息。其造成了交易雙方的不對稱信息。公共信息(public information):大家都可以觀察到的信息。3 委托人和代理人:交易過程中具有私人信息的一方稱為代理人(agent),處于信息劣勢的一方稱為委托人(contract)。不對稱信息的交易過程即為委托人與代理人簽訂某種契約的過程。4 道德風險(moral hazard):由于委托人無法簡單的要求代理人根據(jù)其利益采取相應的行動,因此代理人根據(jù)自己喜好采取有損委托人利益的行動(又稱為簽訂契約后隱藏行動問題)。其中,一種情況是代理人的行動無法被觀
11、察;另一種情況是觀察到代理人的行動后無法證實違背合同。5 逆向選擇(adverse selection):代理人在交易前謊報自己的真實信息,從而謀取更大利益。由于委托人降低了對代理人水平的預期,造成高質量的代理人退出市場,交易減少,效率下降(又成簽約前的隱藏信息問題)。6 委托代理模型:(1)參與約束(Participation Constraints):代理人接受合同所能獲得的最低效用,應該大于市場的保留效用。(2)激勵相容約束(Incentive-compatibility Constraints):在委托人無法觀察代理人行動時,合同設計必須滿足代理人付出較高水平的努力獲得的效用,大于偷懶
12、的效用。此時代理人的激勵和委托人目標是相容的。各種激勵方案,必須同時滿足代理人的參與約束和激勵相容約束。(3)委托人選擇的最優(yōu)激勵方案,目標使得委托人的期望收益最大化。7 委托代理理論的優(yōu)缺點:(1)優(yōu)點:給定外部環(huán)境下,適用于分析在信息不對稱條件下,哪一種激勵兼容的契約安排能夠成為對環(huán)境和激勵約束的次優(yōu)反應。(2)局限性:一是模型解對技術環(huán)境、參與者目標函數(shù)的參數(shù)、代理人參與約束的外部制度環(huán)境的設定非常敏感;二是適用于特定的由技術唯一決定的制度環(huán)境中,未能考慮政治、文化、慣例等其它因素。第五章 不完全信息博弈和信息經(jīng)濟學(2):逆向選擇和信息甄別1 阿克羅夫(Akerlof)在其1970年發(fā)
13、表的檸檬市場:產(chǎn)品質量的不確定性與市場機制中舉了二手車市場的案例。2 考慮勞動力可以通過接受教育發(fā)送信號的情況,分離均衡概念的涵義:是指均衡狀態(tài)下,不同類型的代理人選擇不同的觀察指標(信號)最優(yōu)水平,從而委托人能夠加以區(qū)分。3 不同信息條件下的效率比較:(1) 完全信息下,企業(yè)不需任何成本,直接觀察到兩種類型的勞動力;(2) 不完全信息下信號發(fā)送達到分離均衡時,企業(yè)也能區(qū)分兩種類型的勞動力,但是高素質勞動力需要付出一定的教育成本,效率損失;4 信息甄別概念:在不完全信息下,委托人設計特定的契約對不同類型的代理人進行篩選。5 計算要求:作圖和計算分析信號發(fā)送的混同均衡和分離均衡臨界值。第六章 不
14、完全信息博弈和信息經(jīng)濟學(3):機制設計理論與顯示原理1 機制設計理論的研究對象:為了達到某種理想的目標,而需要設計什么樣的博弈規(guī)則(機制)來實現(xiàn)?其中所謂最優(yōu)的機制,是從機制設計者角度而言最好的均衡結果。2 設計者的約束條件:(1) 首先,不能有任何強迫(參與約束,或個人理性約束);(2) 其次,參與者只根據(jù)自身利益最大化采取相應行動(激勵相容約束)3 機制設計的過程:(1) 委托人設計一個機制(或契約、激勵方案),即博弈規(guī)則;(2) 代理人接受或拒絕該機制;(3) 接受機制的代理人進行由機制所確定的博弈。4 機制設計的目的:由于不完全信息下的均衡結果存在著福利損失,機制設計理論的一個重要目
15、的:尋求使這種福利損失最小的機制5 顯示原理:任何一個說謊話機制(non-truth-telling)下的潛在交易達到的均衡結果,都可以被一個說真話的機制所取代。顯示原理(revelation principle)能夠大大縮小我們的考察范圍:當代理人擁有私人信息可以說謊時,根據(jù)顯示原理,搜尋最優(yōu)機制的范圍縮小為那些說真話的機制即可。第七章 不完全信息博弈和信息經(jīng)濟學(3):招標和拍賣1拍賣和招標(auction):把出售物品稱為拍賣,把為了發(fā)包一項工程或提供一項服務的交易活動稱為招標,即花錢購買服務。兩者區(qū)別:拍賣品已經(jīng)存在,信息比較完全,因此由出價高者獲得;招標是未完成的工程或服務,涉及到未
16、來的不確定性,除了價格低廉外,還要考慮企業(yè)實施的承諾和企業(yè)信譽等因素。兩者共同點:通常標的物潛在價值都比較大;市場上只有單方向的競爭,即潛在的買主和投標人之間;一般情況下,買主對標的物的估價(保留價格)是私人信息,賣主或招標人不知道。2 獨立私有價值拍賣(individual private value auction):每個參與者都知道自己對拍賣品的估價,但是不知道別人的估價,而且每個買主是相互獨立的(即拍賣時候不相互影響,不勾結)。如藝術品3 公共價值拍賣(common value auction):拍賣品的價值對所有買主都是相同的,但是仍不確定具體數(shù)額。4 根據(jù)拍賣規(guī)則,拍賣的分類:(1
17、)英國式拍賣(English auction):一種升價的公開喊價拍賣,買主不斷的提高競拍價格,直到?jīng)]人愿意出更高價錢為止。具有“說真話”激勵。(2)荷蘭式拍賣(Dutch auction):一種降價的公開喊價拍賣,拍賣主持人先提出一個很高的價格,然后不斷降價,直到有人愿意接受。(3)密封第一價格拍賣(first price sealed bid auction):買主向拍賣人遞交密封的出價,由出價最高者贏得交易,付出所出價格。(4)密封第二價格拍賣:買主向拍賣人遞交密封的出價,由出價最高者贏得交易,但是只需要付出第二高的價格。該拍賣制度為了便于分析拍賣理論,由維克瑞(Vickrey,96諾獎
18、得主)1961年提出,又稱維克瑞拍賣(Vickrey auction)。具有“說真話”激勵。5 實際拍賣設計面臨的一些問題:參與者合謀;進入阻撓和掠奪;保留價格過低等。第八章 討價還價和合作博弈理論1討價還價問題的特點:(1) 各方都面臨共同的結果集合(即包含各種可能的談判方案);(2) 參與者在討價還價過程中不會考慮那些比現(xiàn)狀更糟糕的結果(即使談判失敗,也會維持現(xiàn)狀而不會變得更差);(3) 至少有一個討價還價的結果是各方都有利可圖的。2討價還價問題的納什解法:不考慮具體討價還價過程,現(xiàn)假定有一個裁判者,其效用偏好(即反映了該問題的一種解法)在圖形上表現(xiàn)為無差異曲線: u(s)u1(s)u2(
19、s),該無差異曲線與效用配置集U(B)的切點N即為討價還價問題的納什解。N(B) s arg max u1(s) u1(d)u2(s) u2(d ) 3討價還價問題的解法的基本要求(公理化體系):(1)帕累托最優(yōu):討價還價問題的解不會是嚴格劣勢的結果(2)不相關選擇項的獨立性(3)線性變換無關:討價還價問題的解與效用函數(shù)的線性變換無關(4)對稱性要求:如果討價還價雙方的實力是相同的,那么任何合理的解法應該賦予雙方同樣的效用。4討價還價問題按比例分配的K-S解法(Kalai和Smorodinsky,1975): (1) 首先找出參與者在討價還價問題中所能獲得的各自最大效用;(2) 將“最大效用組
20、合點”與談判破裂點連線,稱為K-S線;(3) 該直線與效用配置集的交點,即為該方案的K-S解。5討價還價問題的“平均主義”解法:K-S線換成了固定的45度線。倫理上考慮,無論初始條件如何,雙方的分配結果絕對平均。6討價還價問題的“效用主義”解法:假設討價還價雙方能夠形成總效用u1(s)u2(s),即將納什解法 的雙曲型無差異曲線換成了直線型。只關心雙方總效用的最大化7 計算要求:掌握NASH解法和K-S解法。第九章 演化博弈理論1演化博弈理論群體參與者的“有限理性”基本假設的內涵:(1)慣例行為(inertia):由于參與者變更策略存在著成本,因此大多數(shù)人按慣例采取行動(2)決策上的“近似眼”(myopia):當少部分參與者變更策略時,總是以現(xiàn)有策略狀態(tài)作為已知條件進行分析,而不具有預測能力(3)試錯法的嘗試行為(trial and experiments):少部分具有冒險精神的參與者并不拘泥于最優(yōu)策略,而是嘗試采取其它各種策略。2 演化博弈理論的分析對象:社會經(jīng)濟系統(tǒng)中有限
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電子測量技術在工業(yè)物聯(lián)網(wǎng)中的應用考核試卷
- 半導體材料特性與制備考核試卷
- 玻璃纖維增強塑料的超聲波焊接技術考核試卷
- 物業(yè)管理與風景區(qū)管理考核試卷
- 以上均為不重復的相關主題名稱考核試卷
- 玻璃制品的微生物污染控制考核試卷
- 洗浴行業(yè)服務品質提升路徑考核試卷
- 真空電子器件的場效應晶體管設計考核試卷
- 電氣機械的建筑與土木工程考核試卷
- 船舶電氣設備管理
- 嚴重過敏反應診斷和臨床管理專家共識(2025年版)解讀
- 國際壓力性損傷-潰瘍預防和治療臨床指南(2025年版)解讀課件
- 2025-2030中國電子支付行業(yè)市場發(fā)展分析及發(fā)展前景與投資戰(zhàn)略研究報告
- 數(shù)學全等三角形課件++2024-2025學年北師大版七年級數(shù)學下冊
- LBT 235-2022綠色食品設施甜櫻桃生產(chǎn)操作規(guī)程
- 英語-北京市朝陽區(qū)2025年高三年級第二學期質量檢測一(朝陽一模)試題和答案
- 編織老師考試試題及答案
- 2025年03月重慶市涪陵區(qū)新妙鎮(zhèn)選聘本土人才1人筆試歷年參考題庫考點剖析附解題思路及答案詳解
- 2025年國家電投集團內蒙古能源有限公司招聘筆試參考題庫含答案解析
- 抖音運營考核試題及答案
- 2025年河南醫(yī)學高等??茖W校單招職業(yè)適應性考試題庫含答案
評論
0/150
提交評論