運籌學博弈論-課件

上傳人：v*** IP屬地：貴州上傳時間：2023-06-07 格式：PPT 頁數(shù)：63 大小：1.07MB 積分：25 舉報 版權申訴

已閱讀5頁，還剩58頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

第10章博弈論10.1博弈論概述10.2完全信息靜態(tài)博弈2020/12/271第一節(jié)博弈論概述2020/12/272田忌賽馬博弈華容道博弈

一、博弈論的產(chǎn)生和發(fā)展1.博弈在中國2020/12/273從孫子兵法到三十六計從田忌賽馬到孫龐斗智從運籌帷幄到韜光養(yǎng)晦從曹劌論戰(zhàn)到論持久戰(zhàn)2020/12/2742.博弈論的開山之作1943年，馮·諾依曼和摩根斯頓發(fā)表《博弈論和經(jīng)濟行為》的一書，標志著博弈論作為一門獨立科學的開始，也標志著新古典經(jīng)濟學進入了一個新的發(fā)展階段。2020/12/2753.1994年三位獲諾獎的博弈論學者JohnNashJohnHarsanyLeihadenSelten2020/12/2764.1996年諾貝爾經(jīng)濟學獎得主：詹姆斯·莫里斯：主要貢獻：不對稱信息條件下的激勵理論2020/12/2775.2001年諾貝爾經(jīng)濟學獎得主：邁克爾·斯賓塞：在不對稱信息市場分析方面所做出開創(chuàng)性研究。

2020/12/2786.2005年二位獲諾獎的博弈論學者RobertAumannThomasShelling2020/12/27910.1.2博弈及博弈論博弈就是策略對抗，或策略有關鍵作用的游戲博弈Game，博弈論GameTheory，Game即游戲、競技游戲和經(jīng)濟等決策競爭較量的共同特征：規(guī)則、結(jié)果、策略選擇，策略和利益相互依存，策略的關鍵作用游戲——下棋、猜大小經(jīng)濟——寡頭產(chǎn)量決策、市場阻入、投標拍賣政治、軍事——美國和伊拉克、以色列和巴勒斯坦2020/12/2710定義：博弈就是參與人（可能是個人，也可能是團體，如國家、企業(yè)、國際組織等）在一定得規(guī)則下，同時或先或后，一次或多次，從各自允許選擇的行動或戰(zhàn)略中進行選擇并加以實施，而取得相應結(jié)果（支付函數(shù)）的過程。

都有一定的規(guī)則

都有一個結(jié)果

策略至關重要，游戲者不同的策略選擇常會帶來不同的游戲結(jié)果

策略和利益有相互依存性

博弈論：博弈論就是系統(tǒng)研究具有上述特征的博弈問題，尋求各博弈方合理選擇戰(zhàn)略情況下博弈的解，并對這些解進行討論分析的理論。2020/12/2711博弈的分類及對應的均衡概念

2020/12/271210.2完全信息靜態(tài)博弈10.2.1策略型博弈模型及占優(yōu)戰(zhàn)略博弈10.2.2重復剔除的占優(yōu)戰(zhàn)略博弈10.2.3納什均衡2020/12/271310.2.1策略型博弈模型及占優(yōu)戰(zhàn)略博弈非合作博弈模型從模型自身形式上可分為擴展型和策略型兩種，一般用策略型模型描述完全信息靜態(tài)博弈模型。構成策略型博弈模型的三個要素:局中人、策略、支付函數(shù)2020/12/2714參與人或局中人(Players)：獨立決策、獨立承擔博弈結(jié)果的個人或組織博弈規(guī)則面前博弈方之間平等，不因博弈方之間權利、地位的差異而改變博弈方數(shù)量對博弈結(jié)果和分析有影響根據(jù)博弈方數(shù)量分單人博弈、兩人博弈、多人博弈等。最常見的是兩人博弈，單人博弈是退化的博弈2020/12/2715

策略或戰(zhàn)略（strategies）：博弈中各博弈方的選擇內(nèi)容。策略有定性定量、簡單復雜之分不同博弈方之間不僅可選策略不同，而且可選策略數(shù)量也可不同有限博弈：每個博弈方的策略數(shù)都是有限的無限博弈：至少有某些博弈方的策略有無限多個2020/12/2716

支付函數(shù)(Payoffsfunction)：各博弈方從博弈中所獲得的利益。得益對應博弈的結(jié)果，也就是各博弈方策略的組合得益是各博弈方追求的根本目標及行為和判斷的主要依據(jù)根據(jù)得益的博弈分類：零和博弈、常和博弈、變和博弈2020/12/2717例10.1囚徒困境博弈囚徒的困境是圖克（Tucker）1950年提出的該博弈是博弈論最經(jīng)典、著名的博弈該博弈本身講的是一個法律刑偵或犯罪學方面的問題，但可以擴展到許多經(jīng)濟問題，以及各種社會問題，可以揭示市場經(jīng)濟的根本缺陷2020/12/2718基本模型

經(jīng)典的囚徒困境如下：警方逮捕甲、乙兩名嫌疑犯，但沒有足夠證據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯，分別和二人見面，并向雙方提供以下相同的選擇：若一人認罪并作證檢舉對方（相關術語稱“背叛”對方），而對方保持沉默，此人將即時獲釋，沉默者將判監(jiān)8年。若二人都保持沉默（相關術語稱互相“合作”），則二人同樣判監(jiān)1年。若二人都互相檢舉（互相“背叛”），則二人同樣判監(jiān)5年。2020/12/2719囚徒困境-5，-50，-8-8，0-1，-1囚徒A囚徒B坦白抵賴坦白抵賴坦白是A的占優(yōu)戰(zhàn)略坦白是B的占優(yōu)戰(zhàn)略2020/12/2720占優(yōu)策略(上策)均衡占優(yōu)策略(上策)通俗來說是：

“我所做的是不管你做什么我所能做的最好的”

“你所做的是不管我做什么你所能做的最好的”占優(yōu)策略均衡指博弈中的所有參與者的占優(yōu)策略組合所構成的均衡。2020/12/2721囚徒困境（Prisoners’Dilemma）只達到效率很差的個體理性解，沒有實現(xiàn)團體理性解。前者是穩(wěn)定的，是自動實施的；盡管團體理性解對大家都好，但它是不能自動實施的，需要改變條件。提示：該博弈揭示了個體理性與團體理性之間的矛盾?！獜膫€體利益出發(fā)的行為往往不能實現(xiàn)團體的最大利益，同時也揭示了個體理性本身的內(nèi)在矛盾——從個體利益出發(fā)的行為最終也不一定能真正實現(xiàn)個體的最大利益，甚至得到相當差的結(jié)果。2020/12/2722

10.2.2重復剔除的占優(yōu)戰(zhàn)略均衡

首先找出某一博弈參與人的嚴格劣戰(zhàn)略，將它剔除掉，重新構造一個不包括已剔除戰(zhàn)略的新的博弈；然后繼續(xù)剔除這個新的博弈中某一參與人的嚴格劣戰(zhàn)略；重復進行這一過程，直到剩下唯一的參與人戰(zhàn)略組合為止。這個唯一剩下的參與人戰(zhàn)略組合，就是這個博弈的均衡解，稱為“重復剔除的占優(yōu)戰(zhàn)略均衡”(iterateddominanceequilibrium).2020/12/2723智豬博弈：假設豬圈里有兩頭豬，一頭大豬，一頭小豬，豬圈的一端有一個豬食槽，另一端安裝了一個按鈕，控制豬食的供應。按一下按鈕。將有10個單位的豬食進入豬食槽，供兩頭豬食用。兩頭豬面臨選擇的策略有兩個：自己去按按鈕或等待另一頭豬去按按鈕。如果某一頭豬作出自己去按按鈕的選擇，它必須付出如下代價：第一，它需要收益相當于2個單位的成本；第二，由于豬食槽遠離豬食，它將比另一頭豬后到豬食槽，從而減少吃食的數(shù)量。大豬先到：大豬吃到9個單位，小豬吃到1個單位；小豬先到：小豬吃到4個單位，大豬吃到6個單位；同時到達：大豬吃到7個單位，小豬吃到3個單位。智豬博弈（大小豬博弈）2020/12/272425大豬不按按不按按小豬(4,4)(5,1)(9,-1)(0,0)局中人：大豬和小豬行動：按按鈕吃東西2020/12/2725小豬大豬按等待按5，14，4等待9，－10，0小豬的上策2020/12/272627雙方力量不對等時的正確策略力量強：主動出擊力量弱：等待，搭強者的便車。2020/12/272728智豬博弈的應用政治博弈大國是大豬，小國是小豬資本市場大股東是大豬，小股東是小豬企業(yè)創(chuàng)新策略大企業(yè)是大豬，小企業(yè)是小豬2020/12/2728重復剔除的占優(yōu)均衡1，01，20，30，1M列先生行先生UDL0，12，0R行：沒有占優(yōu)策略列：M嚴格優(yōu)于R剔除R行：U優(yōu)于D列：無占優(yōu)策略剔除DM優(yōu)于L（U，M）是重復剔除的占優(yōu)均衡2020/12/2729納什均衡概念是現(xiàn)代博弈論的核心概念。它是以美國數(shù)學家、經(jīng)濟學家納什（Nash）的名字命名的，納什在1950年的一篇論文中提出了納什均衡的概念。10.2.3納什（Nash）均衡2020/12/2730納什均衡(NashEquilibrium)通俗地說，納什均衡的含義就是：給定你的策略，我的策略是最好的策略；給定我的策略，你的策略也是你的最好的策略。即雙方在給定的策略下不愿意調(diào)整自己的策略。2020/12/27311.純戰(zhàn)略Nash均衡策略空間：每個博弈方的全部可選策略的集合博弈方的第個策略：博弈方的得益：博弈：2020/12/2732定義1在博弈中，如果由各個博弈方的各一個策略組成的某個策略組合中，任一博弈方的策略，都是對其余博弈方策略的組合的最佳對策，也即

對任意都成立，則稱為的一個納什均衡（NashEquilibrium）。2020/12/2733定義2：一個Nash均衡是強的（Strict或Strong），如果給定其他局中人的戰(zhàn)略，每一個局中人的最優(yōu)選擇是唯一的。即是說是一個強Nash均衡，當且僅當對于所有的，，有2020/12/27342．求解Nash均衡的方法（1）劃線法思路：先找出自己針對其他博弈方每種策略或策略組合（對多人博弈）的最佳對策，即自己的可選策略中與其他博弈方的策略或策略組合配合，給自己帶來最大得益的策略（這種相對最佳對策總是存在的，不過不一定惟一），然后再此基礎上，通過對其他博弈方策略選擇的判斷，包括對其他博弈方對自己策略判斷的判斷等，預測博弈的可能結(jié)果和確定自己的最優(yōu)策略。2020/12/2735劃線法求解納什均衡例10.2BLMRU3,24,75,1AH6,12,81,1D3,78,910,42020/12/2736（2）反應函數(shù)法例10.3古諾（Cournot）寡頭競爭模型

2020/12/2737古諾寡頭競爭模型（1838）企業(yè)1企業(yè)2參與人：企業(yè)1、企業(yè)2戰(zhàn)略：選擇產(chǎn)量得益：利潤，利潤是兩個企業(yè)產(chǎn)量的函數(shù)2020/12/2738寡頭產(chǎn)量競爭——以兩廠商產(chǎn)量競爭為例2020/12/2739假設策略組合（q1*，q2*）是本博弈的納什均衡，那么max（）

max（

）

q2q1*，q2*只要能使兩式各自對q1，q2的導數(shù)為0，就能實現(xiàn)兩式的最大值，令：a－c－q2*－2q1*＝0

a－c－q1*－2q2*＝0解之，q1*＝q2*＝1/3(a-c)。因此，策略組合（1/3(a-c)，1/3(a-c)）是本博弈唯一的納什均衡。此時每個企業(yè)的利潤為2020/12/2740

產(chǎn)量博弈的古諾模型是一種囚徒困境，無法實現(xiàn)博弈方總體和各個博弈方各自最大利益的結(jié)論，對于市場經(jīng)濟組織、管理，對于產(chǎn)業(yè)組織和社會經(jīng)濟制度的效率判斷，都具有非常重要的意義。說明對市場的管理，政府對市場的調(diào)控和監(jiān)管都是必須的。2020/12/2741（3）混合戰(zhàn)略Nash均衡例10.4社會福利博弈

23，

3-1，1-1，00，流浪流浪漢政府救濟不救濟尋找工作沒有一個策略組合構成納什均衡2020/12/2742

1-1，

-11，-11，1-1，反面正面反面正面猜謎游戲兩個兒童各拿一枚硬幣，若同時正面朝上或朝下，A給B1分錢，若只有一面朝上，B給A1分錢。零和博弈博弈參與者有輸有贏，但結(jié)果永遠是0。沒有一個戰(zhàn)略組合構成納什均衡2020/12/2743警察與小偷銀行酒館警察小偷2萬元1萬元東邊西邊警察與小偷的最優(yōu)策略各是什么？2020/12/2744上述博弈的特征是：在這類博弈中，都不存在純納什均衡。參與人的支付取決于其他參與人的戰(zhàn)略；以某種概率分布隨機地選擇不同的行動每個參與人都想猜透對方的戰(zhàn)略，而每個參與人又不愿意讓對方猜透自己的戰(zhàn)略。這種博弈的類型是什么？如何找到均衡？2020/12/2745請舉一些這樣的例子：石頭、剪子、布游戲老虎、杠子、雞、蟲子游戲撲克游戲橄欖球賽戰(zhàn)爭中2020/12/2746策略：參與人在給定信息集的情況下選擇行動的規(guī)則，它規(guī)定參與人在什么情況下選擇什么行動，是參與人的“相機行動方案”。純策略：如果一個策略規(guī)定參與人在每一個給定的信息情況下只選擇一種特定的行動，該戰(zhàn)略為純策略?；旌喜呗裕喝绻粋€策略規(guī)定參與人在給定信息情況下以某種概率分布隨機地選擇不同的行動，則該策略為混合策略。純策略可以理解為混合策略的特例，即在諸多策略中，選該純策略si的概率為1，選其他純策略的概率為0。2020/12/27472020/12/2748

1-1，

-11，-22，2-2，西邊東邊西邊東邊警察抽簽決定去銀行還是酒館，2/3的機會去銀行，1/3的機會去酒館；同樣，小偷也抽簽決定去銀行還是酒館，2/3的機會去酒館，1/3的機會去銀行。2020/12/2749社會福利博弈

23，

3-1，1-1，00，流浪流浪漢政府救濟不救濟尋找工作設：政府救濟的概率：1/2；不救濟的概率：1/2。流浪漢：尋找工作的期望效用：1/2×2+1/2×1=1.5流浪的期望效用：1/2×3+1/2×0=1.5因此，流浪漢的任何一種戰(zhàn)略都是都是對政府混合戰(zhàn)略的最優(yōu)反應2020/12/2750社會福利博弈

23，

3-1，1-1，00，流浪流浪漢政府救濟不救濟尋找工作設：政府救濟的概率：1/2；不救濟的概率：1/2。流浪漢：尋找工作的概率：0.2；流浪的概率：0.8每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略2020/12/2751

1-1，

-11，-11，1-1，反面正面反面正面猜謎游戲兩個小孩的最優(yōu)策略是采取每個策略的可能性均為1/2；每個小孩各取策略的1/2是納什均衡。零和博弈2020/12/2752猜硬幣博弈-1，11，-11，-1-1，1正面反面猜硬幣方蓋硬幣方正面反面猜硬幣博弈一個非常突出的特點每個局中人都試圖能先猜中對方的策略2020/12/2753猜硬幣博弈——嚴格競爭博弈和混合策略的引進-1，11，-11，-1-1，1正面反面猜硬幣方蓋硬幣方正面反面（1）不存在前面定義的納什均衡策略組合（2）關鍵是不能讓對方猜到自己策略這類博弈很多，引出混合策略納什均衡概念2020/12/2754如何尋找混合策略納什均衡？支付最大化法支付等值法由于混合戰(zhàn)略伴隨的是支付的不確定性，因此參與人關心的是其期望效用。最優(yōu)混合策略：是指使期望效用函數(shù)最大的混合戰(zhàn)略（給定對方的混合戰(zhàn)略）在兩人博弈里，混合策略納什均衡是兩個參與人的最優(yōu)混合策略的組合。2020/12/2755

23，

3-1，1-1，00，流浪流浪漢政府救濟不救濟尋找工作即：流浪漢以0.2的概率選擇尋找工作，0.8的概率選擇游蕩同樣，可以根據(jù)流浪漢的期望效用函數(shù)找到政府的最優(yōu)混合戰(zhàn)略。？？支付最大化法2020/12/2756社會福利博弈

23，

3-1，1-1，00，流浪流浪漢政府救濟不救濟尋找工作設：政府救濟的概率：1/2；不救濟的概率：1/2。流浪漢：尋找工作的概率：0.2；流浪的概率：0.8每個參與人的戰(zhàn)略都是給定對方混合戰(zhàn)略時的最優(yōu)戰(zhàn)略2020/12/2757假定最優(yōu)混合戰(zhàn)略存在，給定流浪漢選擇混合戰(zhàn)略，政府選擇純戰(zhàn)略救

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

運籌學博弈論-課件

文檔簡介

溫馨提示

最新文檔

評論

運籌學博弈論-課件

文檔簡介

溫馨提示

最新文檔

評論

相關文檔