博弈與決策導論

上傳人：卓*** IP屬地：廣東上傳時間：2022-09-20 格式：PPT 頁數(shù)：40 大?。?.76MB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩35頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

1、博弈與決策導論第1頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 12課前小問題：博弈論之英雄（美人）救美人（英雄）記背景：有一座城堡，僅有南、北兩個城門可以入內(nèi)，城堡內(nèi)駐扎了三個排的士兵看守城門。事件：你的心上人被關押在城堡內(nèi)，攻入城堡就可營救出他（她）。條件：1、你只擁有兩個排的兵力。 2、通往南北城門各自只有一條道路，去往兩城門的道路不相通（你只能一條道走到底） 3、你方兵力少于或相同于對方時你肯定失?。ㄋ^守易攻難），你方兵力超過對方則能成功破城，兵力調(diào)度只能以排為單位。 4、兩兵相接時就不能再變動兵力布置。問題：你有

2、多大的概率救出你的心上人？第2頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 13教材：經(jīng)濟博弈論（第三版）復旦大學出版社，2007年1月經(jīng)濟博弈論習題指南復旦大學出版社，2003年1月第3頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 14學習要求：任何課程的知識都具有連貫性，所以不要經(jīng)常逃課，更不能讓教材“一塵不染”。聽課時要多作筆記，筆記是知識的框架，教材是對知識的充實。二者缺一不可。對于老師布置的習題，要認真完成，以鞏固所學的知識。學習時要搞清理論

3、，特別要注意結(jié)論成立的條件。第4頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 15課程安排第一章導論第二章完全信息靜態(tài)博弈第三章完全且完美信息動態(tài)博弈第四章重復博弈第五章完全但不完美信息動態(tài)博弈第六章不完全信息靜態(tài)博弈第七章不完全信息動態(tài)博弈第八章有限理性和進化博弈第5頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 16第一章導論本章介紹博弈論的基本概念，包括什么是博弈和博弈論，給出一些經(jīng)典博弈例子。對博弈分類和博弈理論的結(jié)構(gòu)作一些討論

4、，對博弈論的發(fā)展歷史等作簡單介紹。目標是讓讀對博弈論的內(nèi)容和博弈模型有更直觀的概念和印象，本教材的基本內(nèi)容，以及博弈分析的基本思想方法等形成初步的認識，為后面各章展開詳細分析作好鋪墊和準備。第6頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 171.1什么是博弈論一、從游戲到博弈1、Game theory博弈就是策略對抗，或策略有關鍵作用的游戲游戲特征：（1）規(guī)則（2）結(jié)果（3）策略（4）策略與利益相互依存第7頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1

5、82、身邊的博弈例子（1）無謂競爭如果本門課程按比例來給分，無論卷面分數(shù)是多少，只有40%的人能獲得優(yōu)秀，40%的人能獲得良好。學生的反應：所有學生都達成一個協(xié)議：大家都不要太用功，如何？想法不錯，但無法實施。第8頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 19稍加努力就可勝過他人，誘惑太大了問題是：所有人都這么做。結(jié)果：所有人的成績都不比大家遵守協(xié)議來得高；而且，大家還付出了更多的功夫。（囚徒困境）還有其它什么例子？占座/軍備競爭第9頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game T

6、heory-Lecture 1102、身邊的博弈例子（2）兩職員上午開車外出辦事，因處理了些許私人事件而耽誤了下午及時返回公司工作，遂向老板謊稱輪胎漏氣去修理廠修理而耽誤時間。老伴分別向他們提問：“哪個輪胎漏氣了？該如何應答？聚（焦）點（focal point）博弈第10頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1112、身邊的博弈例子（3）為何教授如此嚴厲許多教授強硬規(guī)定：不許補考，不允許遲交作業(yè)或論文教授為何如此苛刻？如果允許某種遲交，而教授又無法辨別真?zhèn)?，則學生總是會遲交。期限本身就沒意義了為避免此現(xiàn)象，只有

7、一種策略：沒有例外的策略第11頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 112問題：一個好心腸的教授如何來維持鐵石心腸的承諾？找到是拒絕變得強硬和可信的方法：拿行政程序或?qū)W校政策做擋箭牌；在課程開始時作出明確和嚴格的宣布；通過嚴打幾次獲得“冷面殺手”的聲譽第12頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1132、身邊的博弈例子（4）“瀕?！鄙嵊阉奚犸嬘盟骟?，需要打開水了。自己親自動手還是寄希望于別人僵持一陣子，有人失去耐心而選擇讓步爭吵膽小鬼博弈

8、（game of chicken)消耗戰(zhàn)（war of attrition)第13頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1142、身邊的博弈例子（5）約會博弈(the dating game)他（她）真的是個好男孩（女孩）嗎？他（她）真心愛我嗎？燕趙晚報上的八卦新聞：女孩在情人節(jié)謊稱被綁架，要男孩往一銀行卡上打5000元。女孩使用的是篩選策略，男孩要么照辦（真心愛她）；要么拒絕（缺乏真心）第14頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 115此

9、類博弈中真正的策略是信息的批露傳遞關于自己好信息的策略稱為“信號”（signals)例子：教育誘使他人采取行動，以可靠顯示其私人信息（好或壞）的策略，稱為“篩選”（screening)例子：數(shù)量折扣第15頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 116二、一個非技術性的定義博弈：一些個人、隊組或其他組織，面對一定的環(huán)境條件，在一定的規(guī)則下，同時或先后，一次或多次，從各自允許選擇的行為或策略中進行選擇并加以實施，各自取得相應結(jié)果的過程。1、博弈的參加者（players)2、各博弈方各自可選擇的全部策略（strategies

10、)或行動(actions)的集合3、進行博弈的次序（orders)4、博弈方的得益（payoffs)第16頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1171.2 幾類經(jīng)典的博弈模型一、囚徒困境1950年圖克提出的，用于研究經(jīng)濟效率問題博弈方：兩小偷（囚徒）策略：坦白、抵賴次序：同時收益：都坦白，各關押5個月；都抵賴，各關押1個月；一方坦白一方抵賴，坦白方釋放，抵賴方關押8個月可以用得益矩陣的方式表示-1 , -1-8 , 0 0 , -8-5 , -5囚徒1囚徒2坦白抵賴坦白抵賴第17頁，共40頁，2022年，5月20日

11、，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1181.2 幾類經(jīng)典的博弈模型得益矩陣表示形式-1 , -1-8 , 0 0 , -8-5 , -5囚徒1囚徒2坦白抵賴坦白抵賴博弈方策略得益囚徒1：坦白囚徒2：坦白第18頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1191.2 幾類經(jīng)典的博弈模型二、賭勝博弈特點：一方所得等于另一方所失，不可能雙贏，屬于零和博弈博弈方：兩玩家：一方蓋，一方猜策略：正面朝上、反面朝上次序：同時收益：對方猜錯贏1元錢，對方猜中輸1元錢；猜中贏1元錢，猜錯輸1元錢

12、-1 , 1 1 , -1 1 , -1-1 , 1蓋方猜方反面朝上正面朝上反面朝上正面朝上不讓對方猜出自己的策略而自己盡可能猜出對方策略第19頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1201.2 幾類經(jīng)典的博弈模型三、產(chǎn)量決策的古諾模型博弈方：n個廠商策略：生產(chǎn)及投放市場的產(chǎn)量（無數(shù)個）次序：同時收益：利潤無法用得益矩陣的方式表示，利用得益函數(shù)方式表述策略和得益的依存關系i=Ri-Ci =P(Q)qi-cqi =P(qi-cqi)第20頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Gam

13、e Theory-Lecture 1211.3 博弈結(jié)構(gòu)和博弈分類研究問題不同博弈模型各異（博弈結(jié)構(gòu)不同一、博弈中的博弈方（players)博弈方：獨立決策、獨立承擔博弈結(jié)果的個人或組織博弈規(guī)則面前博弈方之間平等，不因博弈方之間權(quán)利、地位的差異而改變博弈方數(shù)量對博弈結(jié)果和分析有影響根據(jù)博弈方數(shù)量分單人博弈、兩人博弈、多人博弈等。最常見的是兩人博弈，單人博弈是退化的博弈第21頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 122一、博弈中的博弈方（一）單人博弈一般的最優(yōu)化問題例：商人運貨（價值9萬）水路運費7千，陸路運費1萬

14、，但水路有風險好天氣（概率75%）時可平安抵達，壞天氣（概率25%）時貨物損失10%。如何決策？分析：引入一個博弈方0（自然 nature）博弈方：商人、自然策略：商人：水路/陸路；自然：好天氣/壞天氣次序：同時得益：博弈方0的得益不考慮，僅商人的得益要考慮-7000-16000 -10000-10000商人自然壞天氣（25%）水路陸路好天氣（75%）信息擁有越多決策準確性越高第22頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 123一、博弈中的博弈方（二）兩人博弈兩人博弈即有兩個博弈方的博弈兩人博弈最常見，研究最多，是

15、最基本和有用的博弈類型囚徒困境、猜硬幣、齊威王田忌賽馬等都是兩人博弈兩人博弈有多種可能性，博弈方的利益方向可能一致，也可以不一致 1 ，1 0 ，0 0 ，0 1 ，1女孩男孩西門南門西門南門第23頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 124一、博弈中的博弈方（二）多人博弈三個博弈方之間的博弈可能存在“破壞者”：其策略選擇對自身的利益并沒有影響，但卻會對其他博弈方的利益產(chǎn)生很大的，有時甚至是決定性的影響。多人博弈的表示有時與兩人博弈不同，需要多個得益矩陣，或者只能用描述法第24頁，共40頁，2022年，5月20日，

16、3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1251.3 博弈結(jié)構(gòu)和博弈分類二、博弈中的策略（strategies)策略：博弈中各博弈方的選擇內(nèi)容策略有定性定量、簡單復雜之分不同博弈方之間不僅可選策略不同，而且可選策略數(shù)量也可不同有限博弈：每個博弈方的策略數(shù)都是有限的無限博弈：至少有某些博弈方的策略有無限多個第25頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1261.3 博弈結(jié)構(gòu)和博弈分類三、博弈中的得益（payoffs)得益：各博弈方從博弈中所獲得的利益得益對應博弈的結(jié)果，也就是各博弈方

17、策略的組合得益是各博弈方追求的根本目標及行為和判斷的主要依據(jù)數(shù)量、利潤、收入、量化的效用、社會效益、福利等根據(jù)得益的博弈分類：零和博弈、常和博弈、變和博弈第26頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 127三、博弈中的得益（一）零和博弈：也稱“嚴格競爭博弈”。博弈方之間利益始終對立，偏好通常不同猜硬幣，田忌賽馬，石頭-剪刀-布（二）常和博弈：博弈方之間利益的總和為常數(shù)。博弈方之間的利益是對立的且是競爭關系分配固定數(shù)額的獎金、利潤，遺產(chǎn)官司（三）變和博弈：零和博弈和常和博弈以外的所有博弈。合作利益存在，博弈效率問題的

18、重要性。囚徒困境、產(chǎn)量博弈等第27頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1281.3 博弈結(jié)構(gòu)和博弈分類四、博弈的過程博弈過程：博弈方選擇、行為的次序，包括是否多次重復選擇、行為。博弈過程對博弈結(jié)果也有重要影響。根據(jù)博弈的過程，博弈可分為靜態(tài)博弈、動態(tài)博弈（包含重復博弈）。（一）靜態(tài)博弈：所有博弈方同時或可看作同時選擇策略的博弈田忌賽馬、猜硬幣、古諾模型（二）動態(tài)博弈：各博弈方的選擇和行動又先后次序且后選擇、后行動的博弈方在自己選擇、行動之前可以看到其他博弈方的選擇和行動弈棋、市場進入、領導追隨型市場結(jié)構(gòu)（三）

19、重復博弈：同一個博弈反復進行所構(gòu)成的博弈，提供了實現(xiàn)更有效略博弈結(jié)果的新可能長期客戶、長期合同、信譽問題1、有限次重復博弈2、無限次重復博弈第28頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1291.3 博弈結(jié)構(gòu)和博弈分類五、博弈的信息結(jié)構(gòu)信息差異決策行為差異博弈結(jié)果不同（一）關于得益的信息完全信息（complete information)博弈：各博弈方都完全了解所有博弈方各種情況下的得益不完全信息（incomplete information)博弈：至少部分博弈方不完全了解其他博弈方得益的情況的博弈，也稱為“不對稱信

20、息博弈”（二）關于博弈過程的信息（動態(tài)博弈中）完美信息（perfect information)博弈：每個輪到行為的博弈方對博弈的進程完全了解的博弈不完美信息（inperfect information)博弈：至少某些博弈方在輪到行動時不完全了解此前全部博弈的進程的博弈第29頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1301.3 博弈結(jié)構(gòu)和博弈分類六、博弈方的能力和理性理性能力博弈方的行為邏輯完全理性和有限理性完全理性：有完美的分析判斷能力和不會犯選擇行為的錯誤有限理性：博弈方的判斷選擇能力有缺陷個體理性和集體理性個體理

21、性：一個體利益最大為目標集體理性：追求集體利益最大化合作博弈：允許存在有約束力協(xié)議的博弈非合作博弈：不允許存在有約束力協(xié)議的博弈第30頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1311.3 博弈結(jié)構(gòu)和博弈分類七、博弈的分類（1）合作博弈有限理性完全信息非合作博弈靜態(tài) 不完全信息完全理性完全信息完美信息動態(tài) 不完美信息（重復）不完全信息第31頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 132七、博弈的分類（2）信息時間完全不完全

22、靜態(tài)完全信息靜態(tài)博弈納什均衡（NE)不完全信息靜態(tài)博弈貝葉斯納什均衡（BNE)動態(tài)完全信息動態(tài)博弈子博弈完美納什均衡（SPNE)不完全信息動態(tài)博弈完美貝葉斯納什均衡（PBNE)或序貫均衡（SE)第32頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1331.4博弈論歷史和發(fā)展簡述一、早期研究對具有策略依存特點決策問題的研究可上溯到18世紀初甚至更早博弈論真正的發(fā)展在本世紀，博弈論總體上仍然是發(fā)展中的學科2000年前我國古代的“齊威王田忌賽馬”1838年古諾寡頭模型。1883年伯特蘭德寡頭競爭模型。 1913年齊默羅象棋博弈定理

23、、“逆推歸納法”1921-1927年波雷爾混合策略的第一個現(xiàn)代表述，有數(shù)種策略兩人博弈的極小化極大解 1928年諾伊曼和摩根斯坦擴展形博弈定義，證明有限策略兩人零和博弈有確定結(jié)果第33頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1341.4博弈論歷史和發(fā)展簡述二、博弈論的形成馮.諾伊曼和摩根斯坦博弈論和經(jīng)濟行為Theory of Games and Economic Behavior 1944引進擴展形（extensive form）表示和正規(guī)形（normal form）或稱策略形（strategy form）、矩陣形

24、（matrix form）表示提出穩(wěn)定集（stable sets）解概念正式提出創(chuàng)造博弈論一般理論的主意給出博弈論研究的一般框架、概念術語和表述方法第34頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1351.4博弈論歷史和發(fā)展簡述三、博弈論的成長和發(fā)展1、第一個研究高潮（20世紀40年代末50年代初）1950年納什提出“納什均衡”（Nash equilibrium）概念和證明納什定理，發(fā)展非合作博弈的基礎理論。 1950年Melvin Dresher和Merrill Flood在蘭德公司（美國空軍）“囚徒的困境”（Pris

25、ons dilemma）博弈實驗，（Howard Raiffa）獨立進行這個博弈實驗；1952-1953年期間（L. S. Shapley）和（D. B. Gillies）提出“核”（Core）作為合作博弈的一般解概念Shapley提出了合作博弈的“Shapley值”（Shapley value）概念等。奧曼（R. J. Aumann）“40年代末50年代初是博弈論歷史上令人振奮的時期，原理已經(jīng)破繭而出，正在試飛它們的雙翅，活躍著一批巨人?！钡?5頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1361.4博弈論歷史和發(fā)展簡述

26、三、博弈論的成長和發(fā)展2、迅速發(fā)展期（20世紀50年代后期70年代）1954-1955年提出了“微分博弈”（Differential games）的概念。奧曼則在1959年提出了“強均衡”（Strong equilibrium）的概念?！爸貜筒┺摹保≧epeated games）也是在50年代末開始研究的，這自然引出了關于重復博弈的“民間定理”（Folk theorem）。1960年（Thomas C. Schelling）引進了“焦點”（Focal point）的概念。博弈論在進化生物學（Evolutionary Biology）中的公開應用也是在60年代初出現(xiàn)的。第36頁，共40頁，202

27、2年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 137塞爾騰(Selten)1965提出“子博弈完美納什均衡”(subgame perfect Nash equilibrium)1975年提出的“顫抖手均衡”(Trembling hand perfect equilibrium)海薩尼(Harsanyi)1967-1968三篇構(gòu)造不完全信息博弈理論的系列論文，“貝葉斯納什均衡”(Bayesian Nash equilibrium)。海薩尼1973年提出關于“混合策略”的不完全信息解釋，以及“嚴格納什均衡”(Strict Nash equilibr

28、ium)。70年代“進化博弈論”（Evolutionary game theory）的重要發(fā)展，（John Maynard Smith）1972年引進“進化穩(wěn)定策略”（ Evolutionarily stable strategy，ESS）等。“共同知識”（Common knowledge）的重要性，因為奧曼1976年的文章引起廣泛的重視。第37頁，共40頁，2022年，5月20日，3點28分，星期二河北經(jīng)貿(mào)大學商學院 Game Theory-Lecture 1381.4博弈論歷史和發(fā)展簡述四、博弈論的成熟與主流經(jīng)濟學的融合1、成熟期（20世紀80年代-90年代）1981（Elon Kohlb

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈與決策導論

文檔簡介

溫馨提示

最新文檔

評論

博弈與決策導論

文檔簡介

溫馨提示

最新文檔

評論

相關文檔