版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、博弈論導(dǎo)論第1頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二要想在現(xiàn)代社會(huì)做一個(gè)有文化的人,你必須對(duì)博弈論有一個(gè)大致了解。 薩繆爾森第2頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二什么是博弈論?高深莫測(cè)的邏輯推理?下棋的方法?生活中與人較量的策略?數(shù)學(xué)模型?第3頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二博弈論基本思想人們?cè)谌粘I钪羞M(jìn)行著博弈(或稱為戰(zhàn)斗),與配偶,朋友,陌生人,老板/員工,教授等。類似的博弈也在商業(yè)活動(dòng)、政治和外交事務(wù)、戰(zhàn)爭(zhēng)中進(jìn)行著在任何一種情況下,人們相互影響以達(dá)成彼此有利的協(xié)議或者解決爭(zhēng)端。 游戲下棋、猜大小 經(jīng)濟(jì)寡頭產(chǎn)量決策、市場(chǎng)阻入
2、、投標(biāo)拍賣 政治、軍事美國(guó)和伊拉克、以色列和巴勒斯坦博弈論為眾多學(xué)科提供了分析的概念和方法:經(jīng)濟(jì)學(xué)和商學(xué),政治科學(xué),生物學(xué),心理學(xué)和哲學(xué)。第4頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二如何在“博弈”中獲勝?日常生活中的博弈(“游戲”)往往指的是諸如賭博和運(yùn)動(dòng)這樣的東西: 賭拋硬幣 百米賽跑 打網(wǎng)球/乒乓球How can you win such games?許多博弈都包含著運(yùn)氣、技術(shù)和策略。策略是為了獲勝所需要的一種智力的技巧。它是對(duì)于如何最好地利用物體(物質(zhì))的技巧的一種算計(jì).想贏?策略+技術(shù)+運(yùn)氣第5頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二什么是策略博弈?Wh
3、at is a Game of Strategy?策略本質(zhì)上涉及到與他人的相互影響。其他人在同一時(shí)間、對(duì)同一情形也在進(jìn)行類似的思考。博弈論就是用來分析這樣交互式的決策的。理性的行為指的是:明白自己的目的和偏好,同時(shí)了解自己行動(dòng)的限制和約束,然后以精心策劃的方式選擇自己的行為,按照自己的標(biāo)準(zhǔn)做到最好。博弈論對(duì)理性的行為又從新的角度賦予其新的含義與其他同樣具有理性的決策者進(jìn)行相互作用。博弈論是關(guān)于相互作用情況下的理性行為的科學(xué)。第6頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二如何在博弈中獲勝? 真的能在博弈中(總是)獲勝嗎?對(duì)手和你一樣聰明!許多博弈相當(dāng)復(fù)雜,博弈論并不能提供萬無一失的
4、應(yīng)對(duì)辦法。第7頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二你所注冊(cè)的一門課程按照比例來給分:無論卷面分?jǐn)?shù)是多少,只有40的人能夠得優(yōu)秀,40的人能得良好。所有學(xué)生達(dá)成一個(gè)協(xié)議,大家都不要太用功,如何?想法不錯(cuò),但無法實(shí)施!稍加努力即可勝過他人,誘惑大矣。問題是,大家都這么做。這樣一來,所有人的成績(jī)都不比大家遵守協(xié)議來得高。而且,大家還付出了更多的功夫。正因?yàn)檫@樣的博弈對(duì)所有參與者存在著或大或小的潛在成本,如何達(dá)成和維護(hù)互利的合作就成為一個(gè)值得探究的重要問題。存在雙贏的博弈嗎?例1:無謂競(jìng)爭(zhēng)(The GPA Rat Race)第8頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期
5、二例2:焦點(diǎn)博弈 “We Cant Take the Exam, Because We Had a Flat Tire”兩個(gè)學(xué)生想要推遲考試,謊稱由于返校途中輪胎漏氣,未能很好地備考。教授分別對(duì)他們提出了問題:“哪個(gè)輪胎漏氣?”如何應(yīng)答?他們本應(yīng)該預(yù)計(jì)到教授的招數(shù),提前準(zhǔn)備好答案。在博弈中,參與者應(yīng)該向前看到未來的行動(dòng),然后通過向后推理,推算出目前的最佳行動(dòng)。如果雙方都沒有準(zhǔn)備,他能夠獨(dú)立地編出一個(gè)相互一致的謊言嗎?第9頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二例2:焦點(diǎn)博弈 “We Cant Take the Exam, Because We Had a Flat Tire”“
6、乘客側(cè)前輪”看起來是一個(gè)合乎邏輯的選擇。但真正起作用的是你的朋友是否使用同樣的邏輯,或者認(rèn)為這一選擇同樣顯然。并且是否你認(rèn)為這一選擇是否對(duì)他同樣顯然;反之,是否她認(rèn)為這一選擇對(duì)你同樣顯然。以此類推。也就是說,需要的是對(duì)這樣的情況下該選什么的預(yù)期的收斂。這一使得參與者能夠成功合作的共同預(yù)期的策略被稱為焦點(diǎn)。e.g.心有靈犀一點(diǎn)通。第10頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二我們無法從所有這樣的博弈的結(jié)構(gòu)中找到一般和本質(zhì)的東西,來保證這樣的收斂。某些博弈中,由于偶然的外因可以對(duì)策略貼標(biāo)簽,或者參與者之間擁有某些共同的知識(shí)體驗(yàn),導(dǎo)致了焦點(diǎn)的存在。沒有某個(gè)這樣的暗示,默契的合作就完全
7、不可能。例2:焦點(diǎn)博弈 “We Cant Take the Exam, Because We Had a Flat Tire”第11頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二例3:為什么教授如此苛刻?許多教授強(qiáng)硬地規(guī)定,不進(jìn)行補(bǔ)考,不允許遲交作業(yè)或論文。教授們?yōu)楹稳绱丝量蹋咳绻试S某種遲交,而且教授又不能辨別真?zhèn)?,那么學(xué)生就總是會(huì)遲交。期限本身就毫無意義了。避免這一“滑梯”通常只有一種辦法,就是“沒有例外”的策略。第12頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二例3:為什么教授如此苛刻?問題是,一個(gè)好心腸的教授如何維持如此鐵石心腸的承諾?他必須找到某種使拒絕變得強(qiáng)硬
8、和可信的方法。拿行政程序或者學(xué)校政策來做擋箭牌在課程開始時(shí)做出明確和嚴(yán)格的宣布通過幾次嚴(yán)打來獲得“冷面殺手”的聲譽(yù)第13頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二第一章 引論博弈論的提出博弈論的基本概念與類型博弈均衡與一般均衡博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者主要參考文獻(xiàn)案例分析第14頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二引 論一、博弈論的提出第15頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二博弈論歷史沒有公認(rèn)答案對(duì)具有策略依存特點(diǎn)決策問題的研究可上溯到18世紀(jì)初甚至更早博弈論真正的發(fā)展在上世紀(jì)博弈論總體上仍然是發(fā)展中的學(xué)科 博弈論的形成 第16頁(yè),共82
9、頁(yè),2022年,5月20日,3點(diǎn)30分,星期二2000年前我國(guó)古代的“齊威王田忌賽馬”1500年前巴比倫猶太教法典“婚姻合同問題”等。1838年古諾寡頭模型。1883年伯特蘭德寡頭競(jìng)爭(zhēng)模型。 1913年齊默羅象棋博弈定理 、“逆推歸納法”。1921-1927年波雷爾混合策略的第一個(gè)現(xiàn)代表述,有數(shù)種策略兩人博弈的極小化極大解。1928年諾伊曼和摩根斯坦擴(kuò)展形博弈定義,證明有限策略兩人零和博弈有確定結(jié)果。第17頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二1944年馮.諾伊曼和摩根斯坦博弈論和經(jīng)濟(jì)行為 (Theory of Games and Economic Behavior)引進(jìn)擴(kuò)展
10、形(extensive form)表示和正規(guī)形(normal form)或稱策略形(strategy form)、矩陣形(matrix form)表示提出穩(wěn)定集(stable sets)解概念正式提出創(chuàng)造博弈論一般理論的主意給出博弈論研究的一般框架、概念術(shù)語(yǔ)和表述方法第18頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二1、博弈的含義 博弈指的是一種決策,即每一行為主體的利益不僅依賴他自己的行動(dòng)選擇,而且依賴于別人的行動(dòng)選擇,以致他所采取的最好行動(dòng)依賴于其競(jìng)爭(zhēng)對(duì)手將選擇什么行動(dòng)。 博弈論所研究的就是兩個(gè)以上行為主體的互動(dòng)決策及策略均衡。一、博弈論的提出第19頁(yè),共82頁(yè),2022年,5
11、月20日,3點(diǎn)30分,星期二 博弈論(Game Theory) 又稱為對(duì)策論、游戲理論以及策略運(yùn)籌學(xué)。它最早由德國(guó)數(shù)學(xué)家、哲學(xué)家萊布尼茨于1710年提出。 博弈論是研究決策主體行為發(fā)生直接相互作用時(shí)候的決策及謀求這種決策的均衡問題。 第20頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二博弈論可以劃分為合作博弈(cooperative game)和非合作博弈(non-cooperative game)。納什、澤爾騰和海薩尼的貢獻(xiàn)主要是在非合作博弈方面,而且現(xiàn)在經(jīng)濟(jì)學(xué)家談到博弈論,一般指的是非合作博弈,很少指合作博弈。 第21頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 20
12、世紀(jì)50年代可以說是博弈論的巨人出現(xiàn)的年代。合作博弈論在50年代達(dá)到頂峰,同時(shí)非合作博弈論也開始創(chuàng)立。納什在1950年和1951年發(fā)表了兩篇關(guān)于非合作博弈的主要文章。塔克于1950年定義了“囚徒困境”,他們兩個(gè)人的著作基本上奠定了現(xiàn)代非合作博弈論的基石。第22頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 到60年代后又出現(xiàn)了一些重要人物,澤爾騰將納什均衡的概念引入了動(dòng)態(tài)分析,提出了“精煉納什均衡”概念;海薩尼則把不完全信息引入博弈論的研究。然后到80年代出現(xiàn)了幾個(gè)比較有影響的人物,包括克瑞普斯(kreps)和威爾遜(wilson),他們?cè)?982年合作發(fā)表了關(guān)于動(dòng)態(tài)不完全信息博弈的
13、重要文章。第23頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二嚴(yán)格地說,博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支。它是一種方法,應(yīng)用范圍并不局限于經(jīng)濟(jì)學(xué)。在政治學(xué)、軍事學(xué)、外交學(xué)甚至犯罪學(xué)等多個(gè)領(lǐng)域都涉及到博弈論知識(shí)。實(shí)際上,它屬于數(shù)學(xué)知識(shí)。1、博弈論在經(jīng)濟(jì)學(xué)中的應(yīng)用最廣泛、最成功;博弈論的許多成果也是借助于經(jīng)濟(jì)學(xué)的例子來發(fā)展的,特別是在應(yīng)用領(lǐng)域。第24頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二2、經(jīng)濟(jì)學(xué)家對(duì)博弈論的貢獻(xiàn)也越來越大,特別是在動(dòng)態(tài)分析和不完全信息引入博弈論之后。3、最帶根本性意義的原因是經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的,即強(qiáng)調(diào)個(gè)人理性,也就是在給定的約束條件下追求利益
14、最大化。在這一點(diǎn)上,博弈論和經(jīng)濟(jì)學(xué)是完全一樣的。第25頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 博弈論在經(jīng)濟(jì)學(xué)中的絕大多數(shù)應(yīng)用模型都是在70年代中期之后發(fā)展起來的,大體從80年代開始,博弈論逐漸成為主流經(jīng)濟(jì)學(xué)的一部分,甚至可以說成為微觀經(jīng)濟(jì)學(xué)的基礎(chǔ)。博弈論進(jìn)入主流經(jīng)濟(jì)學(xué),反映了經(jīng)濟(jì)學(xué)發(fā)展的以下幾個(gè)趨勢(shì): 第一,經(jīng)濟(jì)學(xué)研究的對(duì)象越來越轉(zhuǎn)向個(gè)體,這正是博弈論研究的范式。 第26頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二第二,經(jīng)濟(jì)學(xué)越來越轉(zhuǎn)向?qū)θ伺c人關(guān)系的研究,特別是對(duì)人與人之間行為的相互影響和作用。 第三,經(jīng)濟(jì)學(xué)越來越重視對(duì)信息的研究,特別是信息不對(duì)稱對(duì)個(gè)人選擇及制度
15、安排的影響。第27頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二二、博弈論的基本要素和分類第28頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 A、局中人(Player) 博弈中的每個(gè)決策者被稱為局中人(也可稱作選手和參與者),在具體的經(jīng)濟(jì)模型中,它們可以是廠商,也可能是消費(fèi)者或任何契約關(guān)系中的人,根據(jù)經(jīng)濟(jì)學(xué)的理性假定,局中人同樣是以利益最大化為目標(biāo)。1、基本要素:參與者、支付和策略第29頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二博弈中的參與人(局中人)獨(dú)立決策、獨(dú)立承擔(dān)博弈結(jié)果的個(gè)人或組織博弈規(guī)則面前局中人之間平等,不因局中人之間權(quán)利、地位的差異而改變。局中
16、人數(shù)量對(duì)博弈結(jié)果和分析有影響。根據(jù)局中人數(shù)量分單人博弈、兩人博弈、多人博弈等。最常見的是兩人博弈,單人博弈是退化的博弈。第30頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 支付是指博弈結(jié)束時(shí)局中人得到的利益。支付有時(shí)以局中人得到的效用來表示,有時(shí)以局中人得到貨幣報(bào)酬來表示。局中人的利益最大化也就是指支付或報(bào)酬最大化。B、支付(Pay off Structure)第31頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二博弈中的得益得益對(duì)應(yīng)博弈的結(jié)果,也就是各博弈方策略的組合。得益是各博弈方追求的根本目標(biāo)及行為和判斷的主要依據(jù)。根據(jù)得益的博弈分類:零和博弈、常和博弈、變和博弈。第
17、32頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 策略(也稱作戰(zhàn)略)是局中人為實(shí)現(xiàn)其目標(biāo)而采取的一系列行動(dòng)或行動(dòng)計(jì)劃,它規(guī)定在何種情況下采取何種行動(dòng)。C、策略(Strategies)第33頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二博弈中的策略 策略有定性定量、簡(jiǎn)單復(fù)雜之分。不同局中人之間不僅可選策略不同,而且可選策略數(shù)量也可不同。有限博弈:每個(gè)博弈方的策略數(shù)都是有限的。無限博弈:至少有某些博弈方的策略有無限多個(gè)。第34頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 (1)雙人博弈和多人博弈 (2)靜態(tài)博弈和動(dòng)態(tài)博弈 (3)零和博弈與非零和博弈 (4)合作博弈
18、與非合作博弈 (5)重復(fù)博弈 (6)完全信息博弈和不完全信息博弈 2、博弈的分類第35頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 根據(jù)局中人數(shù)量分單人博弈、兩人博弈、多人博弈等。最常見的是兩人博弈,單人博弈是退化的博弈。 (1)雙人博弈和多人博弈第36頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二單人博弈:只有一個(gè)局中人的博弈例一:?jiǎn)稳嗣詫m入口AB出口(獎(jiǎng)金M)A,1B,1右左右左M00擴(kuò)展形第37頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二單人博弈:只有一個(gè)局中人的博弈例一:運(yùn)輸路線-7000-16000-10000-10000好天氣(75%)壞天氣(25
19、%)自 然商人水 路陸 路運(yùn)輸路線得益矩陣01-7000-10000-16000-10000運(yùn)輸路線擴(kuò)展形好天氣(75%)壞天氣(25%)單人博弈實(shí)質(zhì)個(gè)體最優(yōu)化問題第38頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二兩人博弈兩人博弈即有兩個(gè)博弈方的博弈。兩人博弈最常見,研究最多,是最基本和有用的博弈類型。囚徒困境、猜硬幣、齊威王田忌賽馬等都是兩人博弈。兩人博弈有多種可能性,博弈方的利益方向可能一致,也可以不一致。第39頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二多人博弈三個(gè)博弈方之間的博弈??赡艽嬖凇捌茐恼摺保浩洳呗赃x擇對(duì)自身的利益并沒有影響,但卻會(huì)對(duì)其他博弈方的利益產(chǎn)生
20、很大的,有時(shí)甚至是決定性的影響。多人博弈的表示有時(shí)與兩人博弈不同,需要多個(gè)得益矩陣,或者只能用描述法。第40頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 從局中人是否同時(shí)行動(dòng)的角度,博弈可以劃分為靜態(tài)博弈和動(dòng)態(tài)博弈。 靜態(tài)博弈:指局中人同時(shí)選擇策略或非同時(shí)選擇策略但不知道對(duì)手采取的具體行動(dòng),并且這種選擇是一次性的,也就是說同時(shí)做出選擇后博弈就出結(jié)果。 田忌賽馬、猜硬幣、古諾模型 即使決策或行動(dòng)有先后,但只要局中人在決策時(shí)都還不知道對(duì)手的決策或者行動(dòng)是什么,也算是靜態(tài)博弈。(2)靜態(tài)博弈和動(dòng)態(tài)博弈(static games and dynamic games)第41頁(yè),共82頁(yè),20
21、22年,5月20日,3點(diǎn)30分,星期二 動(dòng)態(tài)博弈:指局中人行動(dòng)有先后順序的博弈,后行動(dòng)者能觀察到先行動(dòng)者的行動(dòng)。 弈棋、市場(chǎng)進(jìn)入、領(lǐng)導(dǎo)追隨型市場(chǎng)結(jié)構(gòu)日常生活中動(dòng)態(tài)博弈比比皆是,比如購(gòu)物中的砍價(jià)過程就是一個(gè)典型的動(dòng)態(tài)博弈。第42頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 零和博弈:指博弈雙方的支付結(jié)果加起來為零。這意味著雙方的利益在博弈中是相互沖突的。從支付結(jié)果看,除了零和博弈外,還有正和博弈,即雙方的支付結(jié)果加起來為一個(gè)正的常數(shù)。這意味著雙方的利益沖突不再是那么激烈,有可能出現(xiàn)所謂雙贏或共贏局面。至于負(fù)和博弈,如果假定局中人都是理性的,理論上沒有人會(huì)參與這種博弈,盡管現(xiàn)實(shí)中不乏損
22、人不利己的事。 (3)零和博弈與非零和博弈(zero-sum game and non-zero-sum game)第43頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 從參與主體角度,可以把博弈劃分為合作博弈和非合作博弈。 在非合作博弈中,分析的對(duì)象是個(gè)體參加者,考察的是單個(gè)的參與人在具體的博弈規(guī)則以及一定的信息條件約束下,面對(duì)其他人可能的反應(yīng)將如何行動(dòng)。在非合作博弈中,局中人之間通常無法達(dá)成有約束力的協(xié)議進(jìn)行合作,以獲得合作收益。 非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)策略。但結(jié)果可能有效率,也可能無效率。(4)合作博弈與非合作博弈第44頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)3
23、0分,星期二 在合作博弈分析中,分析的對(duì)象經(jīng)常是一個(gè)團(tuán)體,用博弈論的術(shù)語(yǔ)稱之為“聯(lián)盟”。該聯(lián)盟是由參與博弈的若干局中人通過達(dá)成有約束力的協(xié)議形成。合作博弈通常并不涉及具體的博弈規(guī)則,而集中于不同的人結(jié)盟將得到什么。合作博弈強(qiáng)調(diào)的是團(tuán)體理性。 第45頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二非合作博弈更受重視的主要原因1.主導(dǎo)人們行為方式的主要還是個(gè)體理性而不是集體理性?;蛘哒f,競(jìng)爭(zhēng)是一切社會(huì)、經(jīng)濟(jì)關(guān)系的根本基礎(chǔ),不合作是基本的,合作是有條件和暫時(shí)的,因此非合作博弈關(guān)系比合作博弈關(guān)系更普遍。2.搞清了非合作的博弈關(guān)系,合作的博弈關(guān)系就比較容易理解,在證明非合作博弈無效率或低效率的同
24、時(shí),就自然說明了存在著合作的可能性和必要性,因此從某種意義上說非合作博弈理論是合作博弈論的基礎(chǔ)。3.集體理性是更高級(jí)和更復(fù)雜的理性,因此研究合作博弈的難度更大,更難找到分析問題的一般概念和系統(tǒng)力法。第46頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 重復(fù)博弈是動(dòng)態(tài)博弈的一種特殊情況。 無限期重復(fù)博弈 有限期的重復(fù)博弈 (5)重復(fù)博弈第47頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二(6)完全信息博弈與不完全信息博弈(games of complete information and games of incomplete information)按照大家是否清楚對(duì)局情況
25、下每個(gè)局中人的得益?!案鞣N對(duì)局情況下每個(gè)人的得益是多少” 是所有局中人的共同知識(shí)(common knowledge)。據(jù)“共同知識(shí)”的掌握分為完全信息與不完全信息博弈。第48頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二完美信息博弈與不完美信息博弈(games with perfect information and games with imperfect information)是關(guān)于動(dòng)態(tài)博弈進(jìn)行過程之中面臨決策或者行動(dòng)的參與人對(duì)于博弈進(jìn)行迄今的歷史是否清楚的一種刻劃。如果在博弈進(jìn)行過程中的每一時(shí)刻,面臨決策或者行動(dòng)的參與人,對(duì)于博弈進(jìn)行到這個(gè)時(shí)刻為止所有參與人曾經(jīng)采取的決策或者
26、行動(dòng)完全清楚,則稱為完美信息博弈;否則位不完美信息。第49頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 行動(dòng)順序 信息 靜態(tài)博弈 動(dòng)態(tài)博弈 完全信息完全信息靜態(tài)博弈;納什均衡; 代表人物:納什(1950,1951)完全信息動(dòng)態(tài)博弈;子博弈精煉納什均衡;代表人物:澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均衡;代表人物:海薩尼(1967-1968)不完全信息動(dòng)態(tài)博弈;精煉貝葉斯納什均衡;代表人物:澤爾騰(1975);克瑞普斯和威爾遜(1982);弗登伯格和泰勒爾(1991)非合作博弈的基本分類第50頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 3、博弈的表
27、述 在博弈論中,一個(gè)博弈一般可以用兩種不同的方式表述:戰(zhàn)略式表述和擴(kuò)展式表述。 戰(zhàn)略式表述又稱為標(biāo)準(zhǔn)式表述,在這種表述中,每一參與人同時(shí)選擇一個(gè)策略,而所有參與人的策略組合又決定了每個(gè)參與人的支付。第51頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二博弈的戰(zhàn)略式表述:G=N,(Si)iN,(Ui)iN有三個(gè)基本要素:(1)參與人(players)iN=1,2,n ;(2)戰(zhàn)略(strategies),siSi(戰(zhàn)略空間);(3)支付(payoffs),ui=ui(si,s-i)。 在擴(kuò)展式表述中,各參與人先后或重復(fù)選擇各自的策略。 第52頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30
28、分,星期二 對(duì)于不超過三個(gè)局中人的同時(shí)決策博弈,經(jīng)濟(jì)學(xué)上一般用一個(gè)支付矩陣(也稱報(bào)酬矩陣)來描述博弈的3個(gè)基本要素,并運(yùn)用它來分析一個(gè)博弈。第53頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二用同一個(gè)矩陣表示兩個(gè)參與者的得失的做法,來自博弈理論的一位先驅(qū)者托馬斯謝林(2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者)。他曾經(jīng)說過:“假如真有人問我有沒有對(duì)博弈論做出一點(diǎn)貢獻(xiàn),我會(huì)回答有的。若問我是什么,我會(huì)說我發(fā)明了用一個(gè)矩陣反映雙方得失的做法我不認(rèn)為這個(gè)發(fā)明可以申請(qǐng)專利,所以我免費(fèi)奉送,不過,除了我的學(xué)生,幾乎沒有人愿意利用這個(gè)便利?,F(xiàn)在,我也供給各位免費(fèi)使用我發(fā)明的矩陣?!钡?4頁(yè),共82頁(yè),202
29、2年,5月20日,3點(diǎn)30分,星期二 2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者托馬斯謝林 美國(guó)經(jīng)濟(jì)學(xué)家托馬斯-謝林1921年出生于奧克蘭,1951年獲哈佛大學(xué)經(jīng)濟(jì)學(xué)博士學(xué) 位,是馬里蘭大學(xué)經(jīng)濟(jì)學(xué)系和公共政策學(xué)院的教授。 第55頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二乙 石頭 剪刀 布 石頭 剪刀 布甲0 ,0 1 ,-1-1 , 1-1 ,1 0 , 0 1 ,-11 ,-1 -1 , 10 ,0 游戲石頭、剪刀、布乙乙第56頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二三、博弈均衡與一般均衡第57頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二與傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的比較一
30、致性 利益最大化原則 均衡原則不一致 人與人之間的關(guān)系-個(gè)人理性導(dǎo)致集體非理性-設(shè)計(jì)協(xié)調(diào)性機(jī)制-滿足個(gè)人理性前提下達(dá)到集體理性 信息不完全-委托-代理理論、信號(hào)傳遞與信息篩選模型第58頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 經(jīng)濟(jì)學(xué)中,均衡一般指某種穩(wěn)定的狀態(tài)。 博弈論中的均衡是策略均衡,它是指由各個(gè)局中人所使用的策略構(gòu)成的策略組合處于一種穩(wěn)定狀態(tài),在這一狀態(tài)下,各個(gè)局中人都沒有動(dòng)機(jī)來改變自己所選擇的策略。這樣,各人的策略都已給定,不再發(fā)生變化,博弈的結(jié)果必將確定。從而,每一個(gè)局中人從中得到的支付也就確定了。每個(gè)局中人的最優(yōu)決策也就可以確定了??梢姡庖粋€(gè)博弈問題,首先需確定
31、博弈的策略均衡。第59頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二四、博弈論與諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者第60頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者 美國(guó)人約翰-海薩尼(John C. Harsanyi) 和美國(guó)人約翰-納什(John F. Nash Jr.)以及德國(guó)人萊因哈德-澤爾騰(Reinhard Selten) 獲獎(jiǎng)理由:在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。 第61頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二約翰納什1928年生于美國(guó)萊因哈德澤爾騰,1930年生于德國(guó)約翰海薩
32、尼1920年生于美國(guó)1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者第62頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者英國(guó)人詹姆斯莫里斯 (James A. Mirrlees)和美國(guó)人威廉-維克瑞(William Vickrey) 獲獎(jiǎng)理由:前者在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn),尤其是不對(duì)稱信息條件下的經(jīng)濟(jì)激勵(lì)理論的論述;后者在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面都做出了重大貢獻(xiàn)。第63頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二詹姆斯莫里斯1936年生于英國(guó)威廉維克瑞,1914-1996,生于美國(guó)1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者第64頁(yè),共82頁(yè),2022年
33、,5月20日,3點(diǎn)30分,星期二2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者 三位美國(guó)學(xué)者喬治-阿克爾洛夫(George A. Akerlof)、邁克爾-斯彭斯(A. Michael Spence)和約瑟夫-斯蒂格利茨(Joseph E. Stiglitz) 獲獎(jiǎng)理由:在“對(duì)充滿不對(duì)稱信息市場(chǎng)進(jìn)行分析”領(lǐng)域做出了重要貢獻(xiàn)。 第65頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者約瑟夫斯蒂格利茨,1943年生于美國(guó)的印第安納州,1967年獲美國(guó)麻省理工學(xué)院博士頭銜,曾擔(dān)任世界銀行的首席經(jīng)濟(jì)學(xué)家,現(xiàn)任美國(guó)哥倫比亞大學(xué)經(jīng)濟(jì)學(xué)教授喬治阿克爾洛夫1940年生于美國(guó)的紐黑文,196
34、6年獲美國(guó)麻省理工學(xué)院博士頭銜,現(xiàn)為美國(guó)加利福尼亞州大學(xué)經(jīng)濟(jì)學(xué)教授。邁克爾斯彭斯1948年生于美國(guó)的新澤西,1972年獲美國(guó)哈佛大學(xué)博士頭銜,現(xiàn)兼任美國(guó)哈佛和斯坦福兩所大學(xué)的教授。第66頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者以色列經(jīng)濟(jì)學(xué)家羅伯特奧曼(Robert J. Aumann)和美國(guó)經(jīng)濟(jì)學(xué)家托馬斯謝林(Thomas C. Schelling) 獲獎(jiǎng)原因:“通過博弈論分析加強(qiáng)了我們對(duì)沖突和合作的理解”所作出的貢獻(xiàn)而獲獎(jiǎng)。 第67頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二 羅伯特奧曼 托馬斯謝林2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者第68
35、頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二2007年10月15日,瑞典皇家科學(xué)院宣布,將2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予萊昂尼德赫維奇、埃里克馬斯金和羅杰邁爾森3名美國(guó)經(jīng)濟(jì)學(xué)家,以表彰他們?cè)趧?chuàng)立和發(fā)展“機(jī)制設(shè)計(jì)理論”方面所作的貢獻(xiàn)。 這一理論有助于經(jīng)濟(jì)學(xué)家、各國(guó)政府和企業(yè)識(shí)別在哪些情況下市場(chǎng)機(jī)制有效,哪些情況下市場(chǎng)機(jī)制無效。此外,借助“機(jī)制設(shè)計(jì)理論”,人們還可以確定最佳和最有效的資源分配方式。2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者第69頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二萊昂尼德赫維奇 埃里克馬斯金 羅杰邁爾森2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者第70頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二五、主要參考文獻(xiàn)第71頁(yè),共82頁(yè),2022年,5月20日,3點(diǎn)30分,星期二王則柯、李杰編著,博弈論教程,中國(guó)人民大學(xué)出版社,2004年版。張維迎著,博弈論與信息經(jīng)濟(jì)學(xué),上海三聯(lián)書店、上海人民出版社,1996年版。Roger B. Myerson著:Game Theory(原文版、譯文版),中國(guó)經(jīng)濟(jì)出版社,20
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 真石漆施工合同度假酒店外墻裝修
- 醫(yī)院手術(shù)室電工施工合同樣本
- 滑雪場(chǎng)改造合同
- 洗浴中心禮儀服務(wù)合同
- 《距離保護(hù)計(jì)算》課件
- 山西省長(zhǎng)治市(2024年-2025年小學(xué)五年級(jí)語(yǔ)文)人教版期中考試(上學(xué)期)試卷及答案
- 畢業(yè)的實(shí)習(xí)報(bào)告范文集合七篇
- 兒童常見藥安全用藥
- 環(huán)保工作總結(jié)匯編15篇
- 五年級(jí)數(shù)學(xué)(小數(shù)乘法)計(jì)算題專項(xiàng)練習(xí)及答案匯編
- 醫(yī)學(xué)考博閱讀強(qiáng)化3附答案
- 耐壓絕緣測(cè)試報(bào)告
- 野獸派 beast 花店 調(diào)研 設(shè)計(jì)-文檔資料
- 水泵房每日巡視檢查表
- 杭州市區(qū)汽車客運(yùn)站臨時(shí)加班管理規(guī)定
- 墊片沖壓模具設(shè)計(jì)畢業(yè)設(shè)計(jì)論文
- 冷庫(kù)工程特點(diǎn)施工難點(diǎn)分析及對(duì)策
- Python-Django開發(fā)實(shí)戰(zhàn)
- 小學(xué)道法小學(xué)道法1我們的好朋友--第一課時(shí)ppt課件
- 路由和波長(zhǎng)分配PPT課件
- 光伏組件開路電壓測(cè)試記錄
評(píng)論
0/150
提交評(píng)論