博弈論與信息經(jīng)濟(jì)學(xué)(華南農(nóng)業(yè)大學(xué)范文正)_第1頁
博弈論與信息經(jīng)濟(jì)學(xué)(華南農(nóng)業(yè)大學(xué)范文正)_第2頁
博弈論與信息經(jīng)濟(jì)學(xué)(華南農(nóng)業(yè)大學(xué)范文正)_第3頁
博弈論與信息經(jīng)濟(jì)學(xué)(華南農(nóng)業(yè)大學(xué)范文正)_第4頁
博弈論與信息經(jīng)濟(jì)學(xué)(華南農(nóng)業(yè)大學(xué)范文正)_第5頁
已閱讀5頁,還剩105頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、博弈論與信息經(jīng)濟(jì)學(xué)范文正 述關(guān)于博弈論的某些光環(huán) 博弈論很時髦,也有點神秘,誰懂博弈博弈論很時髦,也有點神秘,誰懂博弈論,或在文章中使用博弈方法,似乎很論,或在文章中使用博弈方法,似乎很有面子有面子 Why?因為它以數(shù)學(xué)為基礎(chǔ),似乎不容易因為它以數(shù)學(xué)為基礎(chǔ),似乎不容易學(xué)懂學(xué)懂 它有廣泛的用途,但很直接有效的運用它有廣泛的用途,但很直接有效的運用似乎也不多見似乎也不多見 發(fā)展很快發(fā)展很快這些光環(huán)的一點猜測性說明 它曾經(jīng)很落寞,少數(shù)人自己玩得很高興它曾經(jīng)很落寞,少數(shù)人自己玩得很高興 它它1994獲得諾貝爾獎了,好萊塢居然還拿獲得諾貝爾獎了,好萊塢居然還拿納什的故事拍電影納什的故事拍電影 它來自數(shù)學(xué)

2、,對數(shù)學(xué)不太有感覺的人會覺它來自數(shù)學(xué),對數(shù)學(xué)不太有感覺的人會覺得它很枯燥,而數(shù)學(xué)意識強的人卻覺得它得它很枯燥,而數(shù)學(xué)意識強的人卻覺得它很好玩很好玩 還不夠成熟,因為它還不夠成熟,因為它“重在建設(shè)重在建設(shè)” 我國的博弈論運用還很落后,幾乎看不到我國的博弈論運用還很落后,幾乎看不到高水平的運用高水平的運用博弈論之“數(shù)學(xué)”的特征 只是數(shù)學(xué)思維、數(shù)學(xué)符號只是數(shù)學(xué)思維、數(shù)學(xué)符號,有些符號怪模怪有些符號怪模怪樣樣,甚至不會讀甚至不會讀,但很少有什么艱深的數(shù)學(xué)但很少有什么艱深的數(shù)學(xué) 這里的符號比較麻煩,因為它和代數(shù)中的這里的符號比較麻煩,因為它和代數(shù)中的純粹抽象而無意義的符號不同,在腦子里純粹抽象而無意義的

3、符號不同,在腦子里要時刻記得它們的實際意義要時刻記得它們的實際意義 但要熟悉這種簡捷、抽象的思維方式,記但要熟悉這種簡捷、抽象的思維方式,記住這些符號的代表意義住這些符號的代表意義 所以,一個比較有效的學(xué)習(xí)方法是重復(fù)所以,一個比較有效的學(xué)習(xí)方法是重復(fù)博弈論的開拓之功 “開拓開拓”一般具備什么特征?一般具備什么特征? 從學(xué)理看:新方法,新模式,新領(lǐng)域從學(xué)理看:新方法,新模式,新領(lǐng)域 從功效看:新辦法,新答案從功效看:新辦法,新答案 博弈論兼有之博弈論兼有之 新方法:不同主體之間數(shù)量比較和概率思想的結(jié)合新方法:不同主體之間數(shù)量比較和概率思想的結(jié)合 新模式:經(jīng)驗層次的一些新模式:經(jīng)驗層次的一些“高妙

4、手段高妙手段”具有邏輯剛具有邏輯剛性,并非巧合,如性,并非巧合,如“囚徒困境囚徒困境” 新領(lǐng)域:突破了傳統(tǒng)經(jīng)濟(jì)學(xué)的苛刻假設(shè),而且把觸新領(lǐng)域:突破了傳統(tǒng)經(jīng)濟(jì)學(xué)的苛刻假設(shè),而且把觸角不客氣地伸到政治、管理、系統(tǒng)論等領(lǐng)域角不客氣地伸到政治、管理、系統(tǒng)論等領(lǐng)域博弈論在研究對象之特點上的根本不同 通常的學(xué)問或理論體系都以通常的學(xué)問或理論體系都以“系統(tǒng)內(nèi)系統(tǒng)內(nèi)”為研為研究對象究對象,如果研究多個主體之間的關(guān)系,也須如果研究多個主體之間的關(guān)系,也須納入一個框架之中。每個學(xué)科都有自己的納入一個框架之中。每個學(xué)科都有自己的“整體觀整體觀”顯然,這里有明顯的傳統(tǒng)科學(xué)理顯然,這里有明顯的傳統(tǒng)科學(xué)理性的風(fēng)味。性的風(fēng)味

5、。 博弈論根本不同,它直接研究幾個在邏輯層博弈論根本不同,它直接研究幾個在邏輯層次上并列的主體之間的關(guān)系。看似簡單的方次上并列的主體之間的關(guān)系。看似簡單的方法,其實開創(chuàng)了一個思路。法,其實開創(chuàng)了一個思路。 它之所以不被廣泛應(yīng)用的一個猜測是:人們它之所以不被廣泛應(yīng)用的一個猜測是:人們目前還不熟悉、不適應(yīng)這種多維的思維方式。目前還不熟悉、不適應(yīng)這種多維的思維方式。博弈論在思維方式上的特點 習(xí)見的思維方式:習(xí)見的思維方式: 還原論:整體可無窮拆分為不同級別的個體還原論:整體可無窮拆分為不同級別的個體 目的論:事物的發(fā)展有其目標(biāo)目的論:事物的發(fā)展有其目標(biāo) 其他事物不變其他事物不變 博弈論思維方式博弈論

6、思維方式歷史理性歷史理性 多元化、相對化、歷史化多元化、相對化、歷史化 事物并不存在一種內(nèi)在的、永恒的、抽象的事物并不存在一種內(nèi)在的、永恒的、抽象的“本質(zhì)本質(zhì)”,而,而只有一種在特定歷史框架中的建構(gòu)。只有一種在特定歷史框架中的建構(gòu)。 對傳統(tǒng)經(jīng)濟(jì)學(xué)的啟發(fā)對傳統(tǒng)經(jīng)濟(jì)學(xué)的啟發(fā):將研究對象轉(zhuǎn)向個體,放棄一些沒:將研究對象轉(zhuǎn)向個體,放棄一些沒有微觀基礎(chǔ)的假設(shè),如消費函數(shù)及其投資函數(shù),而在給出有微觀基礎(chǔ)的假設(shè),如消費函數(shù)及其投資函數(shù),而在給出個人的支付函數(shù)及戰(zhàn)略空間的條件下,研究每個人都選擇個人的支付函數(shù)及戰(zhàn)略空間的條件下,研究每個人都選擇其最優(yōu)戰(zhàn)略以最大化個人支付函數(shù)時將發(fā)生什么。其最優(yōu)戰(zhàn)略以最大化個人

7、支付函數(shù)時將發(fā)生什么。博弈論的學(xué)習(xí)特點 很多人對博弈論有所期待,似乎它有很很多人對博弈論有所期待,似乎它有很強的功效。的確,猶如數(shù)學(xué),力量很強,強的功效。的確,猶如數(shù)學(xué),力量很強,無處不在,作用非常廣泛而深刻,但學(xué)無處不在,作用非常廣泛而深刻,但學(xué)習(xí)的時候很枯燥習(xí)的時候很枯燥 因其與數(shù)學(xué)密切相關(guān),關(guān)于博弈論素養(yǎng)因其與數(shù)學(xué)密切相關(guān),關(guān)于博弈論素養(yǎng)的提高要靠自己的學(xué)習(xí)、揣摩和領(lǐng)悟的提高要靠自己的學(xué)習(xí)、揣摩和領(lǐng)悟習(xí)薫悟化習(xí)薫悟化 注重數(shù)學(xué)的嚴(yán)謹(jǐn),注意基本功注重數(shù)學(xué)的嚴(yán)謹(jǐn),注意基本功 得魚忘筌,得意忘形得魚忘筌,得意忘形本課程的閱讀文獻(xiàn) 張維迎博弈論與信息經(jīng)濟(jì)學(xué)為主要教材張維迎博弈論與信息經(jīng)濟(jì)學(xué)為主要

8、教材 通俗讀物:王則柯博弈論平話、白波博通俗讀物:王則柯博弈論平話、白波博弈游戲、潘天群博弈生存弈游戲、潘天群博弈生存 參考書籍:謝識予經(jīng)濟(jì)博弈論、姚國慶參考書籍:謝識予經(jīng)濟(jì)博弈論、姚國慶博弈論博弈論(南開南開),拉斯繆森博弈與信息,拉斯繆森博弈與信息(北大與三聯(lián)北大與三聯(lián))、弗登博格博弈論、弗登博格博弈論(人民大人民大學(xué)學(xué)),信息經(jīng)濟(jì)學(xué),信息經(jīng)濟(jì)學(xué)(湖北湖北) 期刊文章:非常多,關(guān)于博弈論基本問題的文期刊文章:非常多,關(guān)于博弈論基本問題的文章自章自1995陸續(xù)發(fā)表。但我國直接研究博弈論理陸續(xù)發(fā)表。但我國直接研究博弈論理論的文章不多,應(yīng)用博弈論方法的文章非常多,論的文章不多,應(yīng)用博弈論方法的文

9、章非常多,但水平低但水平低0.導(dǎo)論:博弈論與經(jīng)濟(jì)學(xué) 0.10.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)經(jīng)濟(jì)學(xué)的局限以及博弈論對經(jīng)濟(jì)學(xué)的傳統(tǒng)經(jīng)濟(jì)學(xué)的局限以及博弈論對經(jīng)濟(jì)學(xué)的重要影響重要影響 0.20.2基本內(nèi)容的概述基本內(nèi)容的概述非合作博弈的非技術(shù)性概述非合作博弈的非技術(shù)性概述0.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展 傳統(tǒng)經(jīng)濟(jì)學(xué)的假設(shè)及其局限性傳統(tǒng)經(jīng)濟(jì)學(xué)的假設(shè)及其局限性 二基本假設(shè):完全競爭,完美信息二基本假設(shè):完全競爭,完美信息 局限性:交易主體的數(shù)量其實很有限;信息是不對稱的局限性:交易主體的數(shù)量其實很有限;信息是不對稱的一般均衡理論是整個經(jīng)濟(jì)學(xué)的理論基石和道義基礎(chǔ),市場機一般均衡理論是

10、整個經(jīng)濟(jì)學(xué)的理論基石和道義基礎(chǔ),市場機制是完美的,帕累托最優(yōu)成立,平等與效率可以兼顧。然而制是完美的,帕累托最優(yōu)成立,平等與效率可以兼顧。然而在以下情況不成立:在以下情況不成立: 非完全競爭:壟斷越來越普遍非完全競爭:壟斷越來越普遍 外部性:市場不可能把所有的成本收益都計算在內(nèi)外部性:市場不可能把所有的成本收益都計算在內(nèi) 公共產(chǎn)品:市場無非解決公共產(chǎn)品:市場無非解決“搭便車搭便車”問題問題 逆向選擇問題:檸檬市場逆向選擇問題:檸檬市場 道德風(fēng)險問題:為什么市場的交易費用比較高?道德風(fēng)險問題:為什么市場的交易費用比較高? 百年來,經(jīng)濟(jì)學(xué)的主要發(fā)展圍繞以上五方面,如壟斷競爭理百年來,經(jīng)濟(jì)學(xué)的主要發(fā)

11、展圍繞以上五方面,如壟斷競爭理論、產(chǎn)業(yè)組織理論、企業(yè)理論、信息經(jīng)濟(jì)學(xué)、新制度經(jīng)濟(jì)學(xué)、論、產(chǎn)業(yè)組織理論、企業(yè)理論、信息經(jīng)濟(jì)學(xué)、新制度經(jīng)濟(jì)學(xué)、不確定下的決策不確定下的決策(投資理論投資理論),宏觀經(jīng)濟(jì)學(xué)宏觀經(jīng)濟(jì)學(xué)0.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展 傳統(tǒng)微觀經(jīng)濟(jì)學(xué)與博弈論的比較傳統(tǒng)微觀經(jīng)濟(jì)學(xué)與博弈論的比較 傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的個人決策是在給定一個價格參數(shù)和收入傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的個人決策是在給定一個價格參數(shù)和收入的條件下最大化自己的效用,個人的效用與其他人無涉,的條件下最大化自己的效用,個人的效用與其他人無涉,所有其他人的行為都被總結(jié)在所有其他人的行為都被總結(jié)在“價格價格”參數(shù)之中參數(shù)之中 博弈論中,個人效用不

12、僅依賴于自己的選擇,還以來于他博弈論中,個人效用不僅依賴于自己的選擇,還以來于他人的選擇,研究在存在外部經(jīng)濟(jì)條件下的個人選擇問題人的選擇,研究在存在外部經(jīng)濟(jì)條件下的個人選擇問題 事實上事實上,行為主體的數(shù)量通常不多行為主體的數(shù)量通常不多,相互之間存在明顯影響相互之間存在明顯影響 經(jīng)濟(jì)學(xué)對博弈論寄予厚望,認(rèn)為用博弈論可以重寫經(jīng)濟(jì)學(xué)經(jīng)濟(jì)學(xué)對博弈論寄予厚望,認(rèn)為用博弈論可以重寫經(jīng)濟(jì)學(xué)原理原理 博弈論改寫經(jīng)濟(jì)學(xué),從放寬新古典的完全競爭和完全信息博弈論改寫經(jīng)濟(jì)學(xué),從放寬新古典的完全競爭和完全信息兩個條件展開兩個條件展開0.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展 國外經(jīng)濟(jì)學(xué)教科書改寫,加入大量博弈論內(nèi)容國外經(jīng)濟(jì)學(xué)教科

13、書改寫,加入大量博弈論內(nèi)容 博弈論進(jìn)入主流經(jīng)濟(jì)學(xué),反映了:博弈論進(jìn)入主流經(jīng)濟(jì)學(xué),反映了: 經(jīng)濟(jì)學(xué)的研究對象越來越轉(zhuǎn)向個體放棄了有些沒有微經(jīng)濟(jì)學(xué)的研究對象越來越轉(zhuǎn)向個體放棄了有些沒有微觀基礎(chǔ)的假設(shè)觀基礎(chǔ)的假設(shè) 經(jīng)濟(jì)學(xué)的研究對象越來越轉(zhuǎn)向人與人之間行為的相互經(jīng)濟(jì)學(xué)的研究對象越來越轉(zhuǎn)向人與人之間行為的相互影響和作用影響和作用 經(jīng)濟(jì)學(xué)越來越重視對信息的研究經(jīng)濟(jì)學(xué)越來越重視對信息的研究 傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的工具是數(shù)學(xué)傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的工具是數(shù)學(xué)(微積分、線性代數(shù)、微積分、線性代數(shù)、統(tǒng)計學(xué)統(tǒng)計學(xué)),而博弈論是一種新的數(shù)學(xué)。以前只有陸,而博弈論是一種新的數(shù)學(xué)。以前只有陸軍,現(xiàn)在有了空軍,其差異不可以道里計軍,現(xiàn)在

14、有了空軍,其差異不可以道里計0.1博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展 博弈論研究的是:當(dāng)成果無法由個體完全博弈論研究的是:當(dāng)成果無法由個體完全掌握,而結(jié)局須視群體共同決策而定時,掌握,而結(jié)局須視群體共同決策而定時,個人為了取勝,應(yīng)該采取什么策略個人為了取勝,應(yīng)該采取什么策略 博弈論成為通用方法論,經(jīng)濟(jì)學(xué)、政治學(xué)、博弈論成為通用方法論,經(jīng)濟(jì)學(xué)、政治學(xué)、管理、軍事、外交、國際關(guān)系、公共選擇、管理、軍事、外交、國際關(guān)系、公共選擇、犯罪學(xué)犯罪學(xué) “深藍(lán)深藍(lán)”和和“更深的藍(lán)更深的藍(lán)”使用動態(tài)博弈理論使用動態(tài)博弈理論編寫程序,后來戰(zhàn)勝了無敵的卡斯帕羅夫編寫程序,后來戰(zhàn)勝了無敵的卡斯帕羅夫0.2 博弈論要點 著名案例

15、著名案例囚徒困境囚徒困境prisoners dilemma 個人理性最終導(dǎo)致集體理性的缺失個人理性最終導(dǎo)致集體理性的缺失0.2 博弈論要點 博弈:決策主體在互相對抗中,對抗雙方博弈:決策主體在互相對抗中,對抗雙方(或多方或多方)互相依存的一系列策略和行動的互相依存的一系列策略和行動的過程集合過程集合 參與人的利益有沖突參與人的利益有沖突 博弈是一個過程集合博弈是一個過程集合(參與人、策略、行動、參與人、策略、行動、信息等信息等)。把博弈視為集合是思維從具體到抽把博弈視為集合是思維從具體到抽象的重要一步象的重要一步 博弈的一個本質(zhì)特征是策略的相互依存性博弈的一個本質(zhì)特征是策略的相互依存性 博弈論

16、:專門研究博弈如何出現(xiàn)均衡的規(guī)博弈論:專門研究博弈如何出現(xiàn)均衡的規(guī)律的學(xué)問律的學(xué)問0.2 博弈論要點 博弈論的基本概念包括:參與人、行動、信博弈論的基本概念包括:參與人、行動、信息、戰(zhàn)略、支付函數(shù)、結(jié)果、均衡息、戰(zhàn)略、支付函數(shù)、結(jié)果、均衡 其中,參與人、行動、結(jié)果合稱博弈規(guī)則其中,參與人、行動、結(jié)果合稱博弈規(guī)則 博弈有不同的種類:博弈有不同的種類: 從行動順序角度:從行動順序角度: 靜態(tài)博弈靜態(tài)博弈。參與人同時選擇行動參與人同時選擇行動 動態(tài)博弈。參與人的行動有先后順序動態(tài)博弈。參與人的行動有先后順序 從擁有信息角度:從擁有信息角度: 完全信息博弈。每個參與人對所有其他參與人的特征、完全信息博

17、弈。每個參與人對所有其他參與人的特征、戰(zhàn)略空間、支付函數(shù)有準(zhǔn)確的知識戰(zhàn)略空間、支付函數(shù)有準(zhǔn)確的知識 不完全信息博弈。不完全信息博弈。0.2 博弈論要點 將二角度結(jié)合,博弈有四種:將二角度結(jié)合,博弈有四種: 完全信息靜態(tài)博弈完全信息靜態(tài)博弈 完全信息動態(tài)博弈完全信息動態(tài)博弈 不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈 不完全信息動態(tài)博弈不完全信息動態(tài)博弈博弈論模型GP,A,S,I,U 一個博弈需要有五方面內(nèi)容組成:參與人、一個博弈需要有五方面內(nèi)容組成:參與人、行動、信息、結(jié)果行動、信息、結(jié)果 P:為局中人,能夠獨立決策,獨立承擔(dān)責(zé)任為局中人,能夠獨立決策,獨立承擔(dān)責(zé)任的個人或組織,以最終實現(xiàn)自身利益最

18、大化的個人或組織,以最終實現(xiàn)自身利益最大化為目標(biāo)。為目標(biāo)。 A:各局中人的所有可能的策略或行動的集各局中人的所有可能的策略或行動的集合。分為有限博弈和無限博弈合。分為有限博弈和無限博弈,后者表現(xiàn)為連后者表現(xiàn)為連續(xù)對策、重復(fù)博弈和微分對策等。續(xù)對策、重復(fù)博弈和微分對策等。 S:博弈的進(jìn)程或次序。分為靜態(tài)博弈和動態(tài)博弈。博弈的進(jìn)程或次序。分為靜態(tài)博弈和動態(tài)博弈。 I:博弈信息博弈信息,能夠影響最后博弈結(jié)局的所有局中人能夠影響最后博弈結(jié)局的所有局中人的情報。信息在博弈中占重要地位的情報。信息在博弈中占重要地位,博弈的贏得很博弈的贏得很大程度上依賴于信息的準(zhǔn)確度與多寡。如果各方對大程度上依賴于信息的準(zhǔn)

19、確度與多寡。如果各方對各種局勢下所有局中人的得益狀況完全清楚各種局勢下所有局中人的得益狀況完全清楚,稱為稱為完全信息博弈。反之為不完全信息博弈。在動態(tài)博完全信息博弈。反之為不完全信息博弈。在動態(tài)博弈中還有一類信息弈中還有一類信息:輪到行動的博弈方是否完全了輪到行動的博弈方是否完全了解此前對方的行動。如果完全了解則稱之為解此前對方的行動。如果完全了解則稱之為“具有具有完美信息完美信息”的博弈。反之稱為的博弈。反之稱為“不完美信息的動態(tài)不完美信息的動態(tài)博弈博弈”。由于信息不完美。由于信息不完美,博弈的結(jié)果只能是概率博弈的結(jié)果只能是概率期望期望,而不能像完美信息博弈那樣有確定的結(jié)果。而不能像完美信息

20、博弈那樣有確定的結(jié)果。 U:為局中人獲得利益為局中人獲得利益,也是博弈各方追求的最終目也是博弈各方追求的最終目標(biāo)。分為零和博弈和變和博弈。零和博弈中各方利標(biāo)。分為零和博弈和變和博弈。零和博弈中各方利益之間是完全對立的。變和博弈有可能存在合作關(guān)益之間是完全對立的。變和博弈有可能存在合作關(guān)系,爭取雙贏的局面。系,爭取雙贏的局面。0.2.1 完全信息靜態(tài)博弈:納什均衡 設(shè)有兩個人一起玩游戲,每個人都有不同的設(shè)有兩個人一起玩游戲,每個人都有不同的策略,誰都希望自己出策略,誰都希望自己出“高招高招”使自己獲勝使自己獲勝(即尋求效用的最大化即尋求效用的最大化),但獲勝并不完全依,但獲勝并不完全依賴于自己的

21、行為能力,還依賴于對手怎么做。賴于自己的行為能力,還依賴于對手怎么做。 有時,雙方會形成這樣一種狀態(tài):我的最好有時,雙方會形成這樣一種狀態(tài):我的最好策略所依賴的條件就是你的最好策略。換言策略所依賴的條件就是你的最好策略。換言之:如果你那樣做,我這樣最好,而你之:如果你那樣做,我這樣最好,而你“那那樣樣”做恰恰又是你的最佳策略。做恰恰又是你的最佳策略。 通俗地講:如果別人不動,我也不能動通俗地講:如果別人不動,我也不能動0.2.1 完全信息靜態(tài)博弈:納什均衡 假設(shè)假設(shè)n個人參與博弈,給定其他人戰(zhàn)略的條個人參與博弈,給定其他人戰(zhàn)略的條件下,每個人選擇自己的最優(yōu)戰(zhàn)略。納什均件下,每個人選擇自己的最優(yōu)

22、戰(zhàn)略。納什均衡指的是衡指的是“由所有參與人的最優(yōu)戰(zhàn)略組成的由所有參與人的最優(yōu)戰(zhàn)略組成的一個組合一個組合” 幾個人制訂了一個協(xié)議,這幾個人是否能自幾個人制訂了一個協(xié)議,這幾個人是否能自愿遵守?他們會自覺遵守,這個協(xié)議就構(gòu)成愿遵守?他們會自覺遵守,這個協(xié)議就構(gòu)成一個納什均衡。一個納什均衡。 如果一個協(xié)議不構(gòu)成納什均衡,它就不可能如果一個協(xié)議不構(gòu)成納什均衡,它就不可能自動實施,需要外力脅迫,這就無所謂自動實施,需要外力脅迫,這就無所謂“協(xié)協(xié)議議”Nash EquilibriumA Nash equilibrium, named after John Nash, is a set of strateg

23、ies, one for each player, such that no player has incentive動機 to unilaterally單方面change her action. Players are in equilibrium if a change in strategies by any one of them would lead that player to earn獲得 less than if she remained保持 with her current strategy. For games in which players randomize (mix

24、ed strategies), the expected or average payoff must be at least as large as that obtainable能得到的 by any other strategy. 納什均衡,一個策略集合,其中每個參與人沒有動機納什均衡,一個策略集合,其中每個參與人沒有動機去但方面地改變自己的行為。任何一個人改變策略去但方面地改變自己的行為。任何一個人改變策略都會獲得更少,這就是納什均衡。對于隨機化的參都會獲得更少,這就是納什均衡。對于隨機化的參與人,期望或平均支付至少與其他任何策略一樣大與人,期望或平均支付至少與其他任何策略一樣大0.2

25、.1 完全信息靜態(tài)博弈:納什均衡 納什均衡的重要性:任何納什均衡的重要性:任何“合理合理”結(jié)果結(jié)果都要滿足的條件都要滿足的條件當(dāng)某一局中人發(fā)現(xiàn)當(dāng)某一局中人發(fā)現(xiàn)他單方面改變戰(zhàn)略可以獲取更多時,他他單方面改變戰(zhàn)略可以獲取更多時,他會毫不猶豫地改變自己的戰(zhàn)略,博弈自會毫不猶豫地改變自己的戰(zhàn)略,博弈自然就沒有達(dá)到均衡然就沒有達(dá)到均衡 一種制度安排要發(fā)生效力,必須是納什一種制度安排要發(fā)生效力,必須是納什均衡,否則,這種制度安排就沒有效力均衡,否則,這種制度安排就沒有效力0.2.1 完全信息靜態(tài)博弈:納什均衡 囚徒困境的幾個事例:囚徒困境的幾個事例: 價格大戰(zhàn)價格大戰(zhàn) 兩個寡頭企業(yè)選擇產(chǎn)量兩個寡頭企業(yè)選擇

26、產(chǎn)量 公共產(chǎn)品的供給公共產(chǎn)品的供給 軍備競賽軍備競賽 做廣告做廣告 圍觀時踮腳尖圍觀時踮腳尖 應(yīng)試教育應(yīng)試教育 污染。污染。1968年,格雷特年,格雷特哈丁成功地將哈丁成功地將“囚徒的困境囚徒的困境”與資源耗竭結(jié)合起來與資源耗竭結(jié)合起來 , 揭示了生態(tài)環(huán)境問題與囚徒困揭示了生態(tài)環(huán)境問題與囚徒困境的相似之處。境的相似之處。 貿(mào)易自由與壁壘,地方保護(hù)主義貿(mào)易自由與壁壘,地方保護(hù)主義0.2.1 完全信息靜態(tài)博弈:納什均衡 個人理性與集體理性的沖突,各人追求利己行個人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個為而導(dǎo)致的最終結(jié)局是一個“納什均衡納什均衡”,也,也是對所有人都不利的結(jié)局。

27、是對所有人都不利的結(jié)局。 從從“納什均衡納什均衡”引出引出“看不見的手看不見的手” 的一個悖的一個悖論:從利己目的出發(fā),結(jié)果損人不利己。論:從利己目的出發(fā),結(jié)果損人不利己?!凹{納什均衡什均衡”提出的悖論動搖了經(jīng)濟(jì)學(xué)的基石。提出的悖論動搖了經(jīng)濟(jì)學(xué)的基石。 從從“納什均衡納什均衡”還可以悟出:合作是有利的還可以悟出:合作是有利的“利己策略利己策略”,但它必須符合以下黃金律:按,但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是們也按同樣方式行事才行。也就是 “己所不欲己所不欲勿施于人勿施于人”。 占優(yōu)戰(zhàn)略均衡:不

28、論其他人采取什么策略,A之某策略的payoff總是最高,即為“占優(yōu)戰(zhàn)略”(dominant-strategy)。如果一個博弈的某個策略組合中的所有策略都是各方的上策,那么這個策略組合將是所有人都愿意選擇的,必然是比較穩(wěn)定的結(jié)果,這是“占優(yōu)戰(zhàn)略均衡”(dominant-strategy equilibrium)。反映了所有人的絕對偏好,因此十分穩(wěn)定。但這種情況較少見。 劃線法:橫向,如果“列”選中一個策略,在我的最佳策略下劃線;縱向,如果“行”選中一個策略,在我的最佳策略下劃線。某個策略組合中的兩個支付之下都有橫線,此即較為可能的解。如果這種解只有一組,此即上策均衡。(參見謝識予p.61)0.2

29、.1 完全信息靜態(tài)博弈:納什均衡基本分析思路和方法 例例2:圈豬博弈:圈豬博弈(boxed pigs)0.2.1 完全信息靜態(tài)博弈:納什均衡小豬小豬按按 等待等待大豬大豬按按等待等待5,-14,49,-10,0 例例3 3:性別戰(zhàn):性別戰(zhàn)(battle of sexes)女女足球足球 芭蕾芭蕾男男足球足球芭蕾芭蕾2,10,00,01,20.2.1 完全信息靜態(tài)博弈:納什均衡先動優(yōu)勢所形成的“解”形成的機會 例例4:斗雞博弈:斗雞博弈(chicken game)(膽小鬼博弈膽小鬼博弈)0.2.1 完全信息靜態(tài)博弈:納什均衡B進(jìn)進(jìn) 退退A進(jìn)進(jìn)退退-3,-32,00,20,0 例例5:進(jìn)入阻撓:進(jìn)入

30、阻撓(entry deterrance)0.2.1 完全信息靜態(tài)博弈:納什均衡在位者在位者默許默許 斗爭斗爭進(jìn)入者進(jìn)入者進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入40,50-10,00,3000,300 可能存在多個納什均衡,如果某種情況不可能存在多個納什均衡,如果某種情況不可能出現(xiàn)可能出現(xiàn)( (如,不可信的威脅如,不可信的威脅) ),則可剔除,則可剔除之。精煉,縮小了之。精煉,縮小了“解解”的個數(shù)的個數(shù) 如果是動態(tài)博弈,從每一個行動選擇開始如果是動態(tài)博弈,從每一個行動選擇開始到博弈結(jié)束又構(gòu)成一個博弈,即到博弈結(jié)束又構(gòu)成一個博弈,即“子博弈子博弈” 精煉納什均衡:當(dāng)只當(dāng)參與人的戰(zhàn)略在每精煉納什均衡:當(dāng)只當(dāng)參與人的戰(zhàn)

31、略在每一個子博弈中都構(gòu)成納什均衡一個子博弈中都構(gòu)成納什均衡 承諾行動:當(dāng)事人使自己的威脅變得可信承諾行動:當(dāng)事人使自己的威脅變得可信的行動的行動0.2.2 完全信息動態(tài)博弈:子博弈精煉納什均衡 很多時候,參與人并不清楚對手的偏好、戰(zhàn)略很多時候,參與人并不清楚對手的偏好、戰(zhàn)略空間、各種組合下的利潤水平,即,只擁有不空間、各種組合下的利潤水平,即,只擁有不完全信息。每個人知己于必然,知人于或然完全信息。每個人知己于必然,知人于或然 引入一個虛擬的參與人:自然。它選擇了參與引入一個虛擬的參與人:自然。它選擇了參與人的特征類型。人的特征類型。海薩尼轉(zhuǎn)換海薩尼轉(zhuǎn)換。 完全但不完美信息博弈。因為使博弈分析

32、成為完全但不完美信息博弈。因為使博弈分析成為可能,故稱可能,故稱“完全完全”,但所知不確,故,但所知不確,故“不完不完美美” 給定自己的類型和別人的類型的概率分布的情給定自己的類型和別人的類型的概率分布的情況下,每個參與人的期望效用達(dá)到最大。況下,每個參與人的期望效用達(dá)到最大。0.2.3 不完全信息靜態(tài)博弈:貝葉斯-納什均衡貝葉斯統(tǒng)計簡介 經(jīng)典統(tǒng)計學(xué)需要兩種信息:總體和樣本經(jīng)典統(tǒng)計學(xué)需要兩種信息:總體和樣本 貝葉斯統(tǒng)計加入了貝葉斯統(tǒng)計加入了“先驗信息先驗信息”,來源,來源于經(jīng)驗和歷史資料。其統(tǒng)計分布為于經(jīng)驗和歷史資料。其統(tǒng)計分布為“先先驗分布驗分布” Bayes T. R. 17021761。

33、有貝葉斯公式有貝葉斯公式 貝葉斯學(xué)派的基本觀點:任一未知量都貝葉斯學(xué)派的基本觀點:任一未知量都可看作隨機變量,可用一個概率分布去可看作隨機變量,可用一個概率分布去描述它,這個分布稱為描述它,這個分布稱為“先驗分布先驗分布”。任意未知量都有不確定性,因此非常適任意未知量都有不確定性,因此非常適合用概率來表達(dá)合用概率來表達(dá) 后行動者可以通過觀察而增加對先行者的了解,再修正其主觀判斷,并由此選擇自己的行動。先行者知道自己的行為會被他人利用,就會設(shè)法傳遞有利信息。 博弈過程是不僅是參與人選擇行動的過程,還是不斷學(xué)習(xí)的過程。 精煉貝葉斯均衡要求:給定其他參與人類型的信念,參與人的策略在每一個信息集開始的

34、“后續(xù)博弈”上構(gòu)成貝葉斯-納什均衡,而且在所有可能的情況下,參與人要根據(jù)觀察結(jié)果來修正對其他參與人的信念,據(jù)此選擇自己的最優(yōu)化行為。0.2.3 不完全信息動態(tài)博弈:精煉貝葉斯均衡 1.1博弈論的基本概念及戰(zhàn)略式表述博弈論的基本概念及戰(zhàn)略式表述 1.2納什均衡納什均衡 1.3納什均衡應(yīng)用舉例納什均衡應(yīng)用舉例 1.4混合戰(zhàn)略納什均衡混合戰(zhàn)略納什均衡 1.5納什均衡的存在性與多重性納什均衡的存在性與多重性 1 完全信息靜態(tài)博弈1.1博弈論的基本概念及戰(zhàn)略式表述博弈論的基本概念及戰(zhàn)略式表述 1.1.1基本概念基本概念 參與人參與人 i=1,2,n N表示自然表示自然 行動。行動。ai表示第表示第i個參

35、與人的一個特定行動個參與人的一個特定行動 Ai=ai表示可供表示可供i個選擇的所有行動的集合個選擇的所有行動的集合 n人博弈中,人博弈中,n個參與人行動的有序集個參與人行動的有序集a稱為稱為“行動組合行動組合” 信息信息 完美信息:某個信息集只有完美信息:某個信息集只有1個值個值 完全信息:自然不首先行動或其初始行動為所有參與人完全信息:自然不首先行動或其初始行動為所有參與人知道知道 共同知識共同知識1.1博弈論的基本概念及戰(zhàn)略式表述博弈論的基本概念及戰(zhàn)略式表述 1.1.1基本概念基本概念 戰(zhàn)略戰(zhàn)略s:參與人在給定信息集時的行動規(guī)則參與人在給定信息集時的行動規(guī)則 靜態(tài)博弈中,戰(zhàn)略等同于行動靜態(tài)

36、博弈中,戰(zhàn)略等同于行動 戰(zhàn)略必須是完備的戰(zhàn)略必須是完備的 支付支付u。u=ui(s1, ,si, sn) 結(jié)果結(jié)果 均衡均衡s*=(s1*, ,si*, sn*)均衡:一種所有動作的影響都互相抵消,整個均衡:一種所有動作的影響都互相抵消,整個系統(tǒng)處于平穩(wěn)的、均勢的、不變的狀態(tài)系統(tǒng)處于平穩(wěn)的、均勢的、不變的狀態(tài)*),(),(iiiiiiiissssussuui(si*,s-i) ui(si,s-i)si si*是數(shù)理邏輯符號,全稱量詞,是數(shù)理邏輯符號,全稱量詞,讀作讀作“對于全部對于全部”或或“對于每一個對于每一個”Universal quantifier,read for all or for

37、 every1.1博弈論的基本概念及戰(zhàn)略式表述博弈論的基本概念及戰(zhàn)略式表述 1.1.2博弈的戰(zhàn)略式表述博弈的戰(zhàn)略式表述G 博弈的參與人集合博弈的參與人集合 每個人的戰(zhàn)略空間每個人的戰(zhàn)略空間 每個人的支付函數(shù)每個人的支付函數(shù) 如果:參與人個數(shù)有限,每個參與人如果:參與人個數(shù)有限,每個參與人的戰(zhàn)略有限,則為的戰(zhàn)略有限,則為“有限博弈有限博弈” 兩人有限博弈的戰(zhàn)略式表述可以用矩兩人有限博弈的戰(zhàn)略式表述可以用矩陣表示陣表示 納什均衡是完全信息靜態(tài)博弈的一般概念,納什均衡是完全信息靜態(tài)博弈的一般概念,也是也是所有所有其他類型博弈的基本要求其他類型博弈的基本要求 1.2.1占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略均衡 占優(yōu)戰(zhàn)

38、略均衡的定義占優(yōu)戰(zhàn)略均衡的定義p.59 如果所有參與人都有占優(yōu)戰(zhàn)略存在,則占優(yōu)如果所有參與人都有占優(yōu)戰(zhàn)略存在,則占優(yōu)戰(zhàn)略均衡是可以預(yù)測到的惟一的均衡戰(zhàn)略均衡是可以預(yù)測到的惟一的均衡1.2 納什均衡 占優(yōu)戰(zhàn)略均衡是非常合理的預(yù)測,但經(jīng)常占優(yōu)戰(zhàn)略均衡是非常合理的預(yù)測,但經(jīng)常不存在,這才是博弈論真正的用武之地不存在,這才是博弈論真正的用武之地 1.2.2重復(fù)剔除的占優(yōu)戰(zhàn)略均衡重復(fù)剔除的占優(yōu)戰(zhàn)略均衡 智豬博弈中,沒有占優(yōu)戰(zhàn)略均衡智豬博弈中,沒有占優(yōu)戰(zhàn)略均衡 首先找出某個參與人的劣戰(zhàn)略,剔除之,首先找出某個參與人的劣戰(zhàn)略,剔除之,再找,再剔除,直到最后的一個再找,再剔除,直到最后的一個 劣戰(zhàn)略、占優(yōu)戰(zhàn)略

39、的定義劣戰(zhàn)略、占優(yōu)戰(zhàn)略的定義p.62 弱占優(yōu)戰(zhàn)略的定義弱占優(yōu)戰(zhàn)略的定義p.63 重復(fù)剔除的占優(yōu)均衡的定義重復(fù)剔除的占優(yōu)均衡的定義p.631.2 納什均衡 1.2.3納什均衡納什均衡 很多博弈無法使用重復(fù)剔除的方法找很多博弈無法使用重復(fù)剔除的方法找到均衡解到均衡解 定義定義p.69 沒有任何一個戰(zhàn)略嚴(yán)格優(yōu)于納什均衡沒有任何一個戰(zhàn)略嚴(yán)格優(yōu)于納什均衡戰(zhàn)略戰(zhàn)略(嚴(yán)格優(yōu),大于,不包括等于) 強納什均衡強納什均衡p.711.2 納什均衡 1.3.1古諾寡頭競爭模型古諾寡頭競爭模型 兩個寡頭企業(yè),市場總產(chǎn)量為Q=q1+q2。市場出清價格P是市場總產(chǎn)量的函數(shù)P=P(Q)=8-Q。假設(shè)生產(chǎn)無固定成本,且每增加一

40、單位產(chǎn)量的邊際成本c相等=2,則其成本分別為2q1、2q2 ,他們同時選擇產(chǎn)量 利潤:u1=q1(Q)-c1q1=q18-(q1+q2)-2q1=6q1-q1q2-q12 u2=q2(Q)-c2q2=q28-(q1+q2)-2q2=6q2-q1q2-q22 可以尋找納什均衡:只要兩方的一個策略組合(q1*,q2*)相互是對方的最佳對策,就構(gòu)成一個納什均衡,如果再可以證明它是惟一的,則可以預(yù)言博弈的解 可直接根據(jù)定義來尋找1.3 納什均衡應(yīng)用舉例(q1*,q2*)必須是最大值)6(21*2111222*12max)6(max2qqqqqqqqqq解得均衡產(chǎn)量為解得均衡產(chǎn)量為q1*=q2*=2策略

41、組合策略組合(2,2)是惟一的納什均衡是惟一的納什均衡市場最終產(chǎn)量為2+2=4,價格為8-4=4雙方各自利潤2(8-4)-22=4 如果只有一家廠商,總得益U=P(Q)-cQ= Q(8-Q)-2Q=6Q-Q2。其最大產(chǎn)量為6-2Q=0,即Q=3,而得益為9。高于各自產(chǎn)量為2時的總得益8。 1.3.2 Hotelling價格競爭模型價格競爭模型 1.3.3 公共地的悲劇公共地的悲劇 1.3.4 公共物品的私人自愿供給公共物品的私人自愿供給 1.3.5基礎(chǔ)設(shè)施建設(shè):中央政府與地方政基礎(chǔ)設(shè)施建設(shè):中央政府與地方政府之間的博弈府之間的博弈1.3 納什均衡應(yīng)用舉例1.4 混合戰(zhàn)略納什均衡 有些博弈不存在

42、有些博弈不存在( (純策略的純策略的) )納什均衡納什均衡 社會福利博弈之例:不存在納什均衡社會福利博弈之例:不存在納什均衡 猜謎游戲之例:不存在納什均衡猜謎游戲之例:不存在納什均衡B正面正面 反面反面A正面正面反面反面-1,1 1,-11,-1 -1,1流浪漢流浪漢找工作找工作 游蕩游蕩政政府府救濟(jì)救濟(jì)不救濟(jì)不救濟(jì)3,2-1,3-1,10,0 設(shè)流浪漢找工作的概率為設(shè)流浪漢找工作的概率為p,則游蕩為則游蕩為1-p 政府的支付政府的支付: 當(dāng)政府救濟(jì),政府得到當(dāng)政府救濟(jì),政府得到3p-(1-p)=4p-1 當(dāng)政府不救濟(jì),政府得到當(dāng)政府不救濟(jì),政府得到-p+0=-p 流浪漢應(yīng)比較兩種策略:流浪漢

43、應(yīng)比較兩種策略: 4p-1-p,p0.2 或者或者4p-1-p,p3q, q0.51.4 混合戰(zhàn)略納什均衡 純戰(zhàn)略:參與人在每一個給定信息的情況下只純戰(zhàn)略:參與人在每一個給定信息的情況下只選擇一個特定的行動選擇一個特定的行動 混合戰(zhàn)略:參與人在每一個給定信息的情況下混合戰(zhàn)略:參與人在每一個給定信息的情況下以某種概率分布隨機地選擇不同的行動以某種概率分布隨機地選擇不同的行動 純戰(zhàn)略可視為混合戰(zhàn)略的特例純戰(zhàn)略可視為混合戰(zhàn)略的特例 以混合策略為對象,重新定義效用函數(shù),即期以混合策略為對象,重新定義效用函數(shù),即期望效用函數(shù)望效用函數(shù)p101p101 再定義納什均衡再定義納什均衡p102p1021031

44、03 “流浪漢流浪漢”的納什均衡:政府以的納什均衡:政府以0.50.5救濟(jì),流救濟(jì),流浪漢以浪漢以0.20.2找工作找工作1.4 混合戰(zhàn)略納什均衡 一個參與人使用混合策略的好處是給對方造成一個參與人使用混合策略的好處是給對方造成不確定性,渾水摸魚不確定性,渾水摸魚 海薩尼對混合戰(zhàn)略的解釋:混合戰(zhàn)略等價于不海薩尼對混合戰(zhàn)略的解釋:混合戰(zhàn)略等價于不完全信息下的純戰(zhàn)略均衡完全信息下的純戰(zhàn)略均衡 如稅收檢查,檢查則不偷稅,不檢查則偷稅。如稅收檢查,檢查則不偷稅,不檢查則偷稅。但稅務(wù)局檢查有成本,企業(yè)在知道稅務(wù)局可能但稅務(wù)局檢查有成本,企業(yè)在知道稅務(wù)局可能檢查的情況下,偷稅有風(fēng)險。此時,可以根據(jù)檢查的情

45、況下,偷稅有風(fēng)險。此時,可以根據(jù)某些參數(shù)尋找一個混合策略的納什均衡某些參數(shù)尋找一個混合策略的納什均衡 幾乎所有優(yōu)先博弈都有優(yōu)先奇數(shù)個納什均衡。幾乎所有優(yōu)先博弈都有優(yōu)先奇數(shù)個納什均衡。 如果一個博弈有兩個純戰(zhàn)略納什均衡,那么,如果一個博弈有兩個純戰(zhàn)略納什均衡,那么,一定存在第三個混合戰(zhàn)略納什均衡一定存在第三個混合戰(zhàn)略納什均衡1.5 納什均衡的存在性和多重性的討論 納什均衡的存在性納什均衡的存在性 p113圖圖 X本來是一組自變量,每一個自變量都有一些本來是一組自變量,每一個自變量都有一些取值,必然存在一點,使每個人的選擇所形成取值,必然存在一點,使每個人的選擇所形成的結(jié)果等于自己在這一點上所期望

46、的結(jié)果。在的結(jié)果等于自己在這一點上所期望的結(jié)果。在這一個點上,所有人的選擇重合為一個相同的這一個點上,所有人的選擇重合為一個相同的點。點。 需要理解兩點:多個自變量的取值至少在一個需要理解兩點:多個自變量的取值至少在一個點上是重合的;這個點上每個人都沒有偏離自點上是重合的;這個點上每個人都沒有偏離自己的規(guī)律己的規(guī)律(符合自己在此種選擇下的意愿符合自己在此種選擇下的意愿) 如果有人不選擇這一點的取值,則有可能不形如果有人不選擇這一點的取值,則有可能不形成這個點成這個點每個自變量都符合自己的規(guī)律每個自變量都符合自己的規(guī)律1.5 納什均衡的存在性和多重性的討論 納什均衡的多重性納什均衡的多重性 最令

47、人無奈的是可能存在多個納什均衡,仍然最令人無奈的是可能存在多個納什均衡,仍然存在不穩(wěn)定性存在不穩(wěn)定性你預(yù)測出現(xiàn)這個納什均衡,你預(yù)測出現(xiàn)這個納什均衡,因而有相應(yīng)選擇,我卻以為會出現(xiàn)另一個,乃因而有相應(yīng)選擇,我卻以為會出現(xiàn)另一個,乃有我的選擇,此時的組合可能并不構(gòu)成納什均有我的選擇,此時的組合可能并不構(gòu)成納什均衡衡 當(dāng)一個博弈有多個納什均衡時,博弈論并沒有當(dāng)一個博弈有多個納什均衡時,博弈論并沒有一個一般的理論注明納什均衡結(jié)果一定會出現(xiàn)。一個一般的理論注明納什均衡結(jié)果一定會出現(xiàn)。 可以利用外在的信息達(dá)到納什均衡,如性別戰(zhàn)可以利用外在的信息達(dá)到納什均衡,如性別戰(zhàn) Cheap talk也可能促成納什均衡

48、也可能促成納什均衡 重復(fù)博弈也有可能促成納什均衡重復(fù)博弈也有可能促成納什均衡 但以上情況并不保證必然出現(xiàn)納什均衡但以上情況并不保證必然出現(xiàn)納什均衡2 完全信息動態(tài)博弈 不能同時選擇和行動的博弈是動態(tài)博弈Dynamic Games,后行動者可以先觀察別人的行動,自己再選擇 本章討論完全信息下的動態(tài)博弈2.1 博弈的擴展式表述 擴展式表述所擴展式表述所“擴展擴展”的主要是參與人的主要是參與人的戰(zhàn)略空間的戰(zhàn)略空間 戰(zhàn)略式表述簡單地給出參與人有些什么戰(zhàn)略式表述簡單地給出參與人有些什么戰(zhàn)略可以選擇,而擴展式表述要給出每戰(zhàn)略可以選擇,而擴展式表述要給出每個戰(zhàn)略的動態(tài)描述:誰在什么時候行動,個戰(zhàn)略的動態(tài)描述

49、:誰在什么時候行動,每次行動時有些什么具體行動方案可供每次行動時有些什么具體行動方案可供選擇,以及知道些什么選擇,以及知道些什么 此時的戰(zhàn)略:如果你這樣,我將怎樣此時的戰(zhàn)略:如果你這樣,我將怎樣2.1 博弈的擴展式表述 要素:要素:參與人集合參與人集合參與人的行動順序參與人的行動順序參與人的行動空間參與人的行動空間參與人的信息集參與人的信息集參與人的支付函數(shù)參與人的支付函數(shù)外生事件外生事件( (即即“自然自然”的選擇的選擇) )的概率分布的概率分布2.1 博弈的擴展式表述 博弈樹的基本元素:博弈樹的基本元素:結(jié)、枝、信息集結(jié)、枝、信息集需要注意的概念:前列集、后續(xù)集;初始需要注意的概念:前列集

50、、后續(xù)集;初始結(jié)、決策結(jié)、終點結(jié);直接前列結(jié)、直接后結(jié)、決策結(jié)、終點結(jié);直接前列結(jié)、直接后續(xù)結(jié)。以及相應(yīng)的符號續(xù)結(jié)。以及相應(yīng)的符號信息集:某個參與人都知道些什么信息集:某個參與人都知道些什么信息集是用來標(biāo)注某個人知道些什么信息信息集是用來標(biāo)注某個人知道些什么信息的,不同的標(biāo)注表示這個人知道不同的信息的,不同的標(biāo)注表示這個人知道不同的信息p142p1422.1 博弈的擴展式表述 如果博弈樹的所有信息集都是單結(jié)的,如果博弈樹的所有信息集都是單結(jié)的,則稱為則稱為“完美信息博弈完美信息博弈”,沒有任何兩,沒有任何兩個決策結(jié)是用虛線連起來的個決策結(jié)是用虛線連起來的 自然信息集總是假設(shè)為單結(jié)的自然信息集總

51、是假設(shè)為單結(jié)的 博弈樹上是否出現(xiàn)連接不同決策結(jié)的虛博弈樹上是否出現(xiàn)連接不同決策結(jié)的虛線取決于如何劃決策結(jié)的順序線取決于如何劃決策結(jié)的順序p145p145 一個參與人在決策之前所適當(dāng)?shù)氖虑楸匾粋€參與人在決策之前所適當(dāng)?shù)氖虑楸仨毘霈F(xiàn)在該參與人的決策結(jié)之前須出現(xiàn)在該參與人的決策結(jié)之前 有了信息集的概念,擴展式表述也可用有了信息集的概念,擴展式表述也可用來表述靜態(tài)博弈來表述靜態(tài)博弈2.2 擴展式表述博弈的納什均衡需求大,開發(fā)需求大,開發(fā)者者利潤利潤8 8千萬,千萬,不開發(fā)者不開發(fā)者利潤利潤0 0。需求大,需求大,兩者都開發(fā)兩者都開發(fā)利潤各為利潤各為4 4千萬。千萬。需求小,開發(fā)需求小,開發(fā)者者利潤利潤

52、1 1千萬,千萬,不開發(fā)者不開發(fā)者利潤利潤0 0。需求小,需求小,兩者都開發(fā)兩者都開發(fā)利潤各為利潤各為-3-3千萬千萬兩者都兩者都不開發(fā)利潤各為不開發(fā)利潤各為0 0。博弈樹:房地產(chǎn)開發(fā)博弈IA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4博弈樹:不允許的情形博弈樹的結(jié)構(gòu)包括決策結(jié)和終點結(jié)。決策結(jié)是參包括決策結(jié)和終點結(jié)。決策結(jié)是參與人采取行動的時點;終點結(jié)是博與人采取行動的時點;終點結(jié)是博弈行動路徑的終點。弈行動路徑的終點。枝是從一個決

53、策結(jié)到它的直接后續(xù)枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個枝代表參與人的結(jié)的連線,每一個枝代表參與人的一個行動選擇。一個行動選擇。一個信息集是決策結(jié)集合的一個子集一個信息集是決策結(jié)集合的一個子集(信息集信息集是由決策結(jié)構(gòu)成的集合是由決策結(jié)構(gòu)成的集合),該子集包括所有滿,該子集包括所有滿足下列條件的決策結(jié):足下列條件的決策結(jié):(1)每一個決策結(jié)都是同一個參與人的決策結(jié)每一個決策結(jié)都是同一個參與人的決策結(jié)(2)該參與人知道博弈進(jìn)入該集合的某個決策該參與人知道博弈進(jìn)入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決策結(jié)。結(jié),但不知道自己究竟處于哪一個決策結(jié)。信息集:房地產(chǎn)博弈IIA 開發(fā) 不開

54、發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4信息集:房地產(chǎn)博弈IIIA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4信息集:房地產(chǎn)博弈IVN 大 小 開 不開 開 不開開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0)

55、 (0,1) (0,0) B1 B2 A1 A2 A3 A4幾個符號的意義幾個符號的意義 第第i個人的信息集為個人的信息集為Hi,其中某特定信息其中某特定信息集為集為hi,在在hi的情況下會有的情況下會有A(hi)的行動。的行動。他的所有信息集所對應(yīng)的所有行動他的所有信息集所對應(yīng)的所有行動A(hi)的集合為的集合為Ai,表示聚合表示聚合)(iHhihAAiiiiiAHS:第第i個人有信息個人有信息H,乃有行動乃有行動A此時的戰(zhàn)略是此時的戰(zhàn)略是S(而且是純戰(zhàn)略,而且是純戰(zhàn)略,以后用其他字母表示以后用其他字母表示“不純不純”戰(zhàn)略戰(zhàn)略)maps into153頁第二段:“每一個純戰(zhàn)略都是從信息集到行

56、動集的一個映射,Si可以表示為在每一個信息集hi上的行動空間A(hi)的笛卡兒積” 每一個純戰(zhàn)略都是原因現(xiàn)象依某種對應(yīng)關(guān)系所導(dǎo)致的惟一結(jié)果現(xiàn)象 (信息集可視為自變量,行動集可視為因變量) ,純戰(zhàn)略的集合Si就是行動空間A(hi)中各種行動的交叉乘積完美信息博弈&不完美信息博弈 一個信息集可能包含多個決策結(jié),也可能只包含一個決策結(jié)。只包含一個決策結(jié)的信息集稱為單結(jié)信息集;如果博弈樹的所有信息集都是如果博弈樹的所有信息集都是單結(jié)的,該博弈稱為完美信息博弈單結(jié)的,該博弈稱為完美信息博弈(Game of perfect information);否則就是不完美信息博弈。2.3子博弈精煉納什均衡

57、2.3子博弈精煉納什均衡 可信性問題 子博弈和逆向歸納法 子博弈精煉納什均衡應(yīng)用舉例 有同時選擇的兩階段動態(tài)博弈可信性:開金礦博弈 甲在開采一價值甲在開采一價值4 4萬元的金礦時缺萬元的金礦時缺1 1萬元萬元資金,而乙正好有資金,而乙正好有1 1萬元資金可以投資。萬元資金可以投資。甲希望乙能將甲希望乙能將1 1萬元資金借給自己用于開萬元資金借給自己用于開礦,并許諾在采到金子后與乙對半分成,礦,并許諾在采到金子后與乙對半分成,乙是否該將錢借給甲呢?乙是否該將錢借給甲呢? 參見謝識予p128開金礦I無法律的博弈 乙 甲 借 不借 分 不分 (2,2) (0,4) (1,0)開金礦II有法律保障的博

58、弈 乙 甲 借 不借 分 不分 (2,2) 打 不打 (1,0) (0,4) (1,0)l子博弈由一個決策結(jié)子博弈由一個決策結(jié)x和所有該決策結(jié)和所有該決策結(jié)的后續(xù)結(jié)的后續(xù)結(jié)T(x)(包括終點結(jié)包括終點結(jié))組成,它滿足組成,它滿足下列條件:下列條件:l(1)x是一個單結(jié)信息集;是一個單結(jié)信息集;l(2)子博弈不改變原博弈的信息集和支子博弈不改變原博弈的信息集和支付向量付向量子博弈條件條件1 1說的是一個子博弈必需從一個單結(jié)信息集開說的是一個子博弈必需從一個單結(jié)信息集開始。即:始。即:(1)(1)當(dāng)且僅當(dāng)決策者在原博弈中確切地知當(dāng)且僅當(dāng)決策者在原博弈中確切地知道博弈進(jìn)入一個特定的決策結(jié)時,該決策結(jié)

59、才能道博弈進(jìn)入一個特定的決策結(jié)時,該決策結(jié)才能作為一個子博弈的開始。作為一個子博弈的開始。(2)(2)如果一個信息集包含如果一個信息集包含兩個以上決策結(jié),沒有任何一個決策結(jié)可以作為兩個以上決策結(jié),沒有任何一個決策結(jié)可以作為子博弈的初始結(jié)。子博弈的初始結(jié)。A 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4A 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8

60、) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4條件條件2 2說的是,子博弈的信息集和支付說的是,子博弈的信息集和支付向量都直接繼承自原博弈,并不會發(fā)生向量都直接繼承自原博弈,并不會發(fā)生任何變化。任何變化。這意味著子博弈不能分割原博弈的信息這意味著子博弈不能分割原博弈的信息集。集。A 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4逆向歸納法p157開 不開開 不開 開 不開(-3,-3) (1,0) (0,1) (0,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論