




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
博弈論
theTheoryofGames
1精選ppt課件主要內(nèi)容一、博弈現(xiàn)象及基本概念二、完全信息靜態(tài)博弈三、完全信息動(dòng)態(tài)博弈四、不完全信息靜態(tài)博弈五、不完全信息動(dòng)態(tài)博弈六、不完全信息專題博弈論20092精選ppt課件主要參考書姚國(guó)慶:《博弈論》,高等教育出版社,2007.羅云峰:《博弈論教程》,清華大學(xué)出版社、北京交通大學(xué)出版社。張維迎:《博弈論與信息經(jīng)濟(jì)學(xué)》,上海三聯(lián)書店,上海人民出版社,2004。施錫銓,《博弈論》,上海財(cái)經(jīng)大學(xué)出版社,2002。博弈論20093精選ppt課件張守一,《現(xiàn)代經(jīng)濟(jì)對(duì)策論》,高等教育出版社,1998。錢頌迪,《運(yùn)籌學(xué)》,清華大學(xué)出版社,1996。[美]艾里克.拉斯繆森:《博弈與信息》,北京大學(xué)出版社,2003。[美]弗登博格:《博弈論》,中國(guó)人民大學(xué)出版社,2002。博弈論20094精選ppt課件第一講博弈現(xiàn)象與基本概念1.博弈現(xiàn)象2.博弈概念3.博弈描述4.博弈練習(xí)5.關(guān)于博弈論博弈論20095精選ppt課件1.博弈現(xiàn)象
田忌賽馬:正確的策略可以反敗為勝。囚徒困境:甲乙理性的人是自私自利的;理性選擇不是全局最優(yōu)。博弈論20096精選ppt課件經(jīng)濟(jì)合作:
甲乙誠(chéng)信的價(jià)值;一報(bào)還一報(bào)策略;人類生存環(huán)境啟示。博弈論20097精選ppt課件長(zhǎng)街上的超市(海灘占位模型)*********************01/23/411/4A’O’資源浪費(fèi)還是理性的必然?其它相似情形:旅行社的熱門路線;黃金時(shí)間的電視節(jié)目;總統(tǒng)競(jìng)選。博弈論20098精選ppt課件狩獵與投資狩獵:
兩個(gè)獵人圍住一頭鹿,各卡住兩個(gè)關(guān)口中的一個(gè),齊心協(xié)力即可成功獲得并平分獵物。此時(shí)有一群兔子跑過,任何一人去抓兔子必可成功,但鹿會(huì)跑掉。他們會(huì)堅(jiān)持獵鹿還是去抓兔子?博弈論20099精選ppt課件共同投資:
雙方共同投資一個(gè)大項(xiàng)目,可期望有較大收益。此時(shí)如某方抽出資金去進(jìn)行小項(xiàng)目投資,必可成功獲小利,但會(huì)使共同項(xiàng)目陷入困境,使對(duì)方蒙受損失。投資者會(huì)如何選擇?博弈論200910精選ppt課件旅行者困境
兩個(gè)旅行者花瓶被摔壞,向航空公司索賠。航空公司知道價(jià)格約為八九十元,但不知道確切價(jià)格。于是請(qǐng)兩位旅客在100元以內(nèi)自己寫下花瓶的價(jià)格。
如兩人寫的一樣,就認(rèn)為他們講真話,并按所寫數(shù)額賠償;如果兩人寫的不一樣,就認(rèn)定低者講真話,并照此價(jià)格賠償。同時(shí),對(duì)講真話的旅客獎(jiǎng)勵(lì)2元錢,對(duì)講假話的旅客罰款2元。
理性原則下,他們會(huì)寫多少價(jià)格呢?博弈論200911精選ppt課件什么是博弈:
個(gè)人或團(tuán)體間在依存和對(duì)抗、合作和沖突中的決策問題。博弈論研究博弈過程中的理性行為。2.博弈概念博弈論200912精選ppt課件如何理解理性行為:自身利益最大;持續(xù)地有意圖的行動(dòng);不對(duì)動(dòng)機(jī)妄加猜測(cè);不考慮道德問題;只研究合法問題;盈利函數(shù)有多重標(biāo)準(zhǔn)。博弈論200913精選ppt課件博弈三要素局中人(參與人)players:決策主體;自然人、團(tuán)體或“虛擬局中人”;有可供選擇的策略和明確定義的利益函數(shù);分為兩人和多人博弈論200914精選ppt課件策略(戰(zhàn)略)strategies:采取行動(dòng)的規(guī)則;可以是一次行動(dòng)也可以是一個(gè)行動(dòng)序列;可以是純策略也可以是混合策略;分為有限和無限。支付(盈利函數(shù))payoff:對(duì)應(yīng)于某策略組合的局中人利益或損失;確定的或是期望的;分為零和和非零和。博弈論200915精選ppt課件擴(kuò)展術(shù)語:信息:信息集;
完全信息(complete);完美信息(perfect)。共同知識(shí):雙方可能獲取的相同信息;彼此都能算清楚。博弈結(jié)果:均衡策略組合;均衡行動(dòng)組合。均衡:所有局中人最優(yōu)策略的組合。博弈論200916精選ppt課件博弈的策略型(標(biāo)準(zhǔn)型、正則型)表述:指定n個(gè)局中人,以及他們各自的純策略空間和這些局中人各自的支付(盈利)函數(shù)我們將該博弈表示為:3.博弈描述博弈論200917精選ppt課件例:寡頭競(jìng)爭(zhēng)問題策略型表述多適用于靜態(tài)博弈。另一種表述方式是擴(kuò)展式表述,兩種表述形式幾乎是完全等價(jià)的,但是擴(kuò)展式表述更適合于討論動(dòng)態(tài)博弈。博弈論200918精選ppt課件房地產(chǎn)開發(fā)實(shí)例雙方:A,B策略:開發(fā)投資1億元;不開發(fā),投資0售價(jià):高需:1.4億元(兩棟),1.8億元(一棟);
低需:0.7億元(兩棟),1.1億元(一棟)。博弈論200919精選ppt課件結(jié)果:高需,(開,不開),(0.8,0)高需,(不開,開),(0,0.8)高需,(開,開),(0.4,0.4)高需,(不開,不開),(0,0)低需,(開,不開),(0.1,0)低需,(不開,開),(0,0.1)低需,(開,開),(-0.3,-0.3)低需,(不開,不開),(0,0)博弈論200920精選ppt課件策略型表述:(兩人有限博弈;矩陣形式)AB高需求情況低需求情況?博弈論200921精選ppt課件房地產(chǎn)博弈分析假設(shè):同時(shí)決策;市場(chǎng)需求雙方已知若市場(chǎng)需求大,雙方開發(fā),各得0.4萬元。若市場(chǎng)需求小,依賴于對(duì)方行動(dòng)。若市場(chǎng)不確定,依賴對(duì)市場(chǎng)的判斷及對(duì)方行動(dòng)。例:P=0.5,最壞情況期望盈利500萬元,開發(fā)。P=0.3,對(duì)方開發(fā)概率<31/40時(shí),開發(fā);否則,不開發(fā)。(?)博弈論200922精選ppt課件關(guān)鍵問題:對(duì)自然狀態(tài)的概率估計(jì);不同時(shí)間決策(決策順序);對(duì)對(duì)方先驗(yàn)信息的估計(jì)(即估計(jì)對(duì)方對(duì)信息的掌握程度)?,F(xiàn)實(shí)困難:對(duì)市場(chǎng)了解程度不同;對(duì)對(duì)方了解程度不同;如何向?qū)Ψ桨凳咀约旱男袆?dòng)。博弈論200923精選ppt課件4.博弈練習(xí)游戲一:心靈感應(yīng)兩個(gè)人一組,獨(dú)立寫出1至10之間的任意5個(gè)數(shù)。如果不重復(fù)則得獎(jiǎng);否則受罰。
獲勝的秘訣是什么?博弈論200924精選ppt課件游戲二:海盜逃生
有5個(gè)海盜,即將被處死刑。法官愿意給他們一個(gè)機(jī)會(huì)。從100個(gè)黃豆中隨意抓取,最多可以全抓,最少可以不抓,可以和別人抓的一樣多。抓得最多的和最少的要被處死。
如果你第一個(gè)抓,你抓幾個(gè)?博弈論200925精選ppt課件游戲三:100元怎么分?
你看見兩個(gè)小孩在玩耍,出于好奇,你給他們100元,讓他們猜拳。猜贏者決定怎么分這100元,而輸者如果同意贏者的分配比例,那么他們將各有所得,如果不同意,那么這100元,你將收回。
請(qǐng)你替贏者考慮一下,怎樣分配,贏者既得到最大利益,又能讓輸者也同意呢?博弈論200926精選ppt課件游戲四:一元錢競(jìng)拍
給一元錢鈔票開出你的價(jià)錢,使自己獲益最大或損失最少;每次叫價(jià)以5分錢為單位;開價(jià)最高者得到這一元錢;出價(jià)最高和次高者一并按所開的價(jià)錢支付。
斜坡上的均衡;“騎虎難下”的博弈;“協(xié)和謬誤”博弈論200927精選ppt課件游戲五:強(qiáng)盜分贓
有五個(gè)強(qiáng)盜搶得100枚金幣,在如何分贓問題上爭(zhēng)吵不休。于是他們決定:(1)抽簽決定自己的號(hào)碼(1,2,3,4,5);(2)由1號(hào)提出分配方案,然后5人表決,如果方案超過半數(shù)同意就通過,否則他將被仍進(jìn)大海喂鯊魚;博弈論200928精選ppt課件(3)1號(hào)死后,由2號(hào)提方案,4人表決,當(dāng)且僅當(dāng)超過半數(shù)同意方案通過,否則2號(hào)同樣被仍進(jìn)大;(4)依次類推,直到找到一個(gè)每個(gè)人都接受的方案(當(dāng)然,如果只剩下5號(hào),他當(dāng)然接受一個(gè)人獨(dú)吞的結(jié)果)。
如果你是第一個(gè)強(qiáng)盜,你該如何提出分配方案才能使自己的收益最大化呢?
博弈論200929精選ppt課件5.關(guān)于博弈論博弈分類:合作、非合作:是否存在一個(gè)具有約束力的協(xié)議(bindingagreement)前者強(qiáng)調(diào)團(tuán)體理性(效率、公正、公平)后者強(qiáng)調(diào)個(gè)人理性(最優(yōu)決策,不保證效率)博弈論200930精選ppt課件完全信息與不完全信息:每一個(gè)局中人對(duì)自己及其它局中人是否有完全的了解;包括局中人特征、策略空間、盈利函數(shù)等知識(shí)。動(dòng)態(tài)與靜態(tài):行動(dòng)的先后順序;是否同時(shí)(或不同時(shí)但對(duì)方不知)。博弈論200931精選ppt課件發(fā)展歷史:
1944
VonNeumann&Morgenstern“Thetheoryofgamesandeconomicbehavior”
1950
Nash&1953Shapley“討價(jià)還價(jià)”模型
1950、1951
Nash非合作博弈
1950
TuckerPrisoners’dilemma
1953
Gillies&Shapley合作博弈
1965Selton動(dòng)態(tài)分析;“精煉納什均衡”
1967、1968
Harsanyi“不完全信息”
1994
Nash、Selton、Harsanyi諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)博弈論200932精選ppt課件納什的傳奇人生
1928年出生于一個(gè)電子工程師家庭。17歲進(jìn)入今卡耐基梅隆大學(xué),專攻數(shù)學(xué)。20歲時(shí)進(jìn)入普林斯頓大學(xué)攻讀博士學(xué)位。1949年,21歲的納什寫下論文《多人博弈的均衡點(diǎn)》。1950年以論文《非合作型博弈》獲得數(shù)學(xué)博士學(xué)位。博弈論200933精選ppt課件博弈論200934精選ppt課件
畢業(yè)后先后在蘭德研究所、普林斯頓大學(xué)、MIT工作。1957年他與MIT學(xué)生愛莉西婭結(jié)婚。在而立之年患上了妄想型精神分裂癥,九十年代逐漸恢復(fù)了正常。1994年納什博士獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。
2002年來北京參加
“國(guó)際數(shù)學(xué)家大會(huì)”博弈論200935精選ppt課件博弈論200936精選ppt課件電影“美麗心靈”博弈論200937精選ppt課件博弈論體系博弈論200938精選ppt課件第二講完全信息靜態(tài)博弈1.矩陣博弈2.累次嚴(yán)優(yōu)均衡3.納什均衡4.混合策略納什均衡5.納什均衡的存在性與多重性博弈論200939精選ppt課件1.矩陣博弈什么是矩陣博弈:兩人零和有限策略博弈;可用矩陣形式表述。矩陣元素為局中人A的贏得,亦即B的損失。
例:用矩陣形式表述田忌賽馬博弈(?)博弈論200940精選ppt課件有鞍點(diǎn)情形:存在最優(yōu)純策略例:表中數(shù)據(jù)為I的贏得
博弈哲學(xué):從最壞處考慮,爭(zhēng)取最好結(jié)果博弈論200941精選ppt課件無鞍點(diǎn)情形:最優(yōu)混合策略
例:設(shè)最優(yōu)混合策略:博弈論200942精選ppt課件對(duì)局中人I:博弈論200943精選ppt課件∴I的最優(yōu)混合策略為
同理,II的最優(yōu)混合策略為G=8同理可求局中人II的最優(yōu)混合策略(?)博弈論200944精選ppt課件2.累次嚴(yán)優(yōu)均衡占優(yōu)策略均衡(嚴(yán)格)劣策略:無論對(duì)方如何選擇都更差。占優(yōu)策略:無論對(duì)方如何選擇存在唯一最優(yōu)。占優(yōu)策略均衡:所有局中人占優(yōu)策略的組合。特點(diǎn):只要求每個(gè)人理性,并不要求知道其它人是不是理性。博弈論200945精選ppt課件例:裁軍問題
例:囚徒困境中的(認(rèn)罪,認(rèn)罪)例:房地產(chǎn)投資市場(chǎng)大情況下(開發(fā),開發(fā))博弈論200946精選ppt課件重復(fù)剔除的占優(yōu)均衡
(iteratedelimination)
也稱為累次嚴(yán)優(yōu)均衡。通過重復(fù)剔除劣戰(zhàn)略剩下唯一的戰(zhàn)略組合。如果存在則稱為重復(fù)剔除占優(yōu)可解的。
(dominancesolvable)
特點(diǎn):不僅要求每個(gè)人理性,還要求知道其它人理性。理性是共同知識(shí)。博弈論200947精選ppt課件例:智豬博弈按鈕喂食:一次供應(yīng)量為8,代價(jià)為2。大豬先到7:1;同時(shí)到5:3;小豬先到4:4博弈論200948精選ppt課件分析:小豬有占優(yōu)策略,大豬沒有,所以不存在占優(yōu)均衡;在“理性”為共同知識(shí)的情況下,存在重復(fù)剔除的占優(yōu)均衡,即(大豬按,小豬等)。應(yīng)用:
此為“多勞不多得,少勞不少得”的奇怪情形,是一種有趣的社會(huì)現(xiàn)象。經(jīng)濟(jì)學(xué)中稱為“搭便車現(xiàn)象”博弈論200949精選ppt課件無論局中人I怎樣決策,局中人II與其選取策略M還不如選取策略R。對(duì)于局中人II來說,M是個(gè)劣策略??梢匀サ鬒I的“M”列。
例:博弈論200950精選ppt課件假定II不選M,對(duì)于I來說M和D是劣策略。博弈論200951精選ppt課件故I選擇U。這時(shí),II選擇L而不選R。可以預(yù)測(cè)博弈的合理結(jié)局可能是(U,L)即(4,3)。博弈論200952精選ppt課件嚴(yán)優(yōu)均衡的局限
有時(shí)無法開始累次嚴(yán)優(yōu)的剔除;例:房地產(chǎn)投資中市場(chǎng)小的情況
反常現(xiàn)象:盈利函數(shù)取極端值時(shí);
如果雙方都存在嚴(yán)劣策略,從不同人開始的結(jié)果一致;與混合策略的優(yōu)劣比較。博弈論200953精選ppt課件分析:累次嚴(yán)優(yōu)過程產(chǎn)生了唯一解(U,L)。然而,不管局中人I如何行動(dòng),局中人II取R僅比取L在盈利上差0.5。I選策略U要冒極大的風(fēng)險(xiǎn),策略D比U更加穩(wěn)健。所以,局中人I不會(huì)選U,而是選擇D。穩(wěn)健性。例:博弈論200954精選ppt課件3.納什均衡定義:
有n個(gè)局中人的策略式表述博弈G={S1,…,Sn;u1,…,un},
策略組合s*=(s1*,…,si*,…,sn*)是一個(gè)納什均衡,如果對(duì)于每一個(gè)i,si*是給定其它局中人選擇s-i*=(s1*,…,si-1*,si+1*,…,sn*)的情況下第i個(gè)局中人的最優(yōu)策略,即ui(si*,s-i*)
ui(si,s-i*),
si
Si,
i
博弈論200955精選ppt課件或者用另一種表述方式:si*是下述最大化問題的解:si*
argmaxui(s1*,…,si-1*,si,si+1*,…,sn*),i=1,2,…n。si
Si結(jié)論:最優(yōu)對(duì)任一參與者的任一策略成立;是一種可以自動(dòng)實(shí)施的協(xié)議(self-enforcing)博弈論200956精選ppt課件兩人有限博弈納什均衡的確定
例:用表上作業(yè)法尋找nash均衡博弈論200957精選ppt課件對(duì)納什均衡的理解“一致性”特征:局中人預(yù)測(cè)到均衡;局中人也預(yù)測(cè)到其它人預(yù)測(cè)到均衡;沒有局中人有興趣作不同的選擇。是局中人的一致性預(yù)測(cè);但不一定最好。博弈論200958精選ppt課件與嚴(yán)優(yōu)均衡的關(guān)系:(1)每個(gè)占優(yōu)均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡,反之則不然。(2)納什均衡一定是在重復(fù)剔除嚴(yán)劣策略過程中沒有剔除的策略組合,反之則不然。(3)納什均衡有強(qiáng)弱之分。強(qiáng)納什均衡>;弱納什均衡≥。允許弱劣策略存在。博弈論200959精選ppt課件例:市場(chǎng)進(jìn)入博弈參與人:在位者;進(jìn)入者策略:在位者:默許、斗爭(zhēng);
進(jìn)入者:進(jìn)入、不進(jìn)入。假定:進(jìn)入之前的壟斷利潤(rùn)為300,進(jìn)入之后寡頭利潤(rùn)為100,進(jìn)入成本為10。博弈論200960精選ppt課件納什均衡分析:(進(jìn)入,默許)是強(qiáng)納什均衡,(不進(jìn)入,斗爭(zhēng))是弱納什均衡。博弈論200961精選ppt課件重復(fù)剔除弱劣策略方法:“斗爭(zhēng)”是在位者的弱劣戰(zhàn)略被剔除,(進(jìn)入,默許)是唯一重復(fù)剔除的占優(yōu)均衡;納什均衡(不進(jìn)入,斗爭(zhēng))將被剔除掉。說明(弱)納什均衡允許弱劣戰(zhàn)略存在。博弈論200962精選ppt課件4.納什均衡應(yīng)用舉例(1)
消耗戰(zhàn)(鷹鴿博弈)
兩只老虎為爭(zhēng)奪獵物對(duì)峙。都堅(jiān)持則獵物腐爛;一方放棄則歸另一方;都放棄則都得不到獵物。獵物價(jià)值f,僵持成本為c。
(對(duì)稱博弈與對(duì)稱均衡)博弈論200963精選ppt課件(2)性別戰(zhàn)(協(xié)調(diào)博弈)一對(duì)情侶周末安排,女方喜歡音樂會(huì),男方喜歡足球賽。情侶陪伴看喜歡的為最好,陪情侶看自己不喜歡的為次之,各自看自己喜歡的又次之,各自看不喜歡的最糟糕。博弈論200964精選ppt課件(3)協(xié)同作業(yè)1兩人合作,報(bào)酬相同為v。兩人同時(shí)用力,代價(jià)為cl;只有一人用力,代價(jià)為ch。cl<V<ch博弈論200965精選ppt課件(4)協(xié)同作業(yè)2兩人合作,給定一人的努力水平,另一人的收益隨自己努力水平先增后減。收益函數(shù):
ui(ai)=ai(c+aj-ai),c>0,ai>=0(圖?)最優(yōu)反應(yīng)函數(shù):ai*(aj)=(c+aj)/2聯(lián)立求Nash均衡得:a1=a2=c博弈論200966精選ppt課件(5)Cournot寡頭競(jìng)爭(zhēng)模型
Cournot,1838,完全信息靜態(tài)博弈。
參與人:企業(yè)1和企業(yè)2;企業(yè)策略:選擇產(chǎn)量;支付:利潤(rùn),是兩個(gè)企業(yè)產(chǎn)量的函數(shù)。
博弈論200967精選ppt課件第i個(gè)企業(yè)的產(chǎn)量:成本函數(shù):價(jià)格函數(shù):第i個(gè)企業(yè)的利潤(rùn)函數(shù):博弈論200968精選ppt課件對(duì)每個(gè)企業(yè)的利潤(rùn)函數(shù)求導(dǎo)并令其等于零:分別定義了兩個(gè)反應(yīng)函數(shù):結(jié)論:每個(gè)企業(yè)的最優(yōu)戰(zhàn)略(產(chǎn)量)是另一個(gè)企業(yè)產(chǎn)量的函數(shù)。博弈論200969精選ppt課件兩個(gè)反應(yīng)函數(shù)的交叉點(diǎn)就是納什均衡:
博弈論200970精選ppt課件考慮上述模型的簡(jiǎn)單情況:設(shè),價(jià)格函數(shù)取線性形式:最優(yōu)化的一階條件分別為:博弈論200971精選ppt課件反應(yīng)函數(shù)為:解兩個(gè)反應(yīng)函數(shù),得納什均衡為:每個(gè)企業(yè)的納什均衡利潤(rùn)分別為:博弈論200972精選ppt課件與壟斷情況作比較:壟斷企業(yè)的問題:壟斷企業(yè)的最優(yōu)產(chǎn)量:壟斷利潤(rùn):博弈論200973精選ppt課件結(jié)論:(1)寡頭競(jìng)爭(zhēng)的總產(chǎn)量大于壟斷產(chǎn)量的原因,在于每個(gè)企業(yè)在選擇自己的最優(yōu)產(chǎn)量時(shí),只考慮對(duì)本企業(yè)利潤(rùn)的影響,而忽視對(duì)另一個(gè)企業(yè)的外部負(fù)效應(yīng)。(2)易證明,雙方串謀成立卡特爾是不穩(wěn)定的,雙方都有欺騙的動(dòng)機(jī)。(?)博弈論200974精選ppt課件(6)自學(xué)伯川德模型多黨競(jìng)選;事故賠償法;公共地悲?。粻?zhēng)議仲裁;
合作性談判;報(bào)案;專家診斷;博弈論200975精選ppt課件5.混合策略納什均衡例:社會(huì)福利博弈(父母與懶惰兒子)參與人:政府;一個(gè)流浪漢政府策略:救濟(jì)、不救濟(jì);
流浪漢策略:找工作、流浪博弈論200976精選ppt課件支付矩陣:博弈論200977精選ppt課件假定:政府的混合策略流浪漢的混合策略則政府的期望效用函數(shù)為:
博弈論200978精選ppt課件對(duì)上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件為:
即,流浪漢以0.2的概率選擇尋找工作,0.8的概率選擇流浪。所以,如果,政府將選擇不救濟(jì);如果,政府將選擇救濟(jì);只有當(dāng)時(shí),政府才會(huì)選擇混合策略()或任何純策略。博弈論200979精選ppt課件同理,求解流浪漢的最優(yōu)化問題,即可找出政府的均衡混合戰(zhàn)略。易知(?)納什均衡要求,每個(gè)參與人的混合策略是給定對(duì)方的混合策略下的最優(yōu)選擇。因此,在社會(huì)福利博弈中,是唯一的納什均衡。博弈論200980精選ppt課件例:監(jiān)督博弈參與人:稅收機(jī)關(guān);納稅人稅收機(jī)關(guān)策略:檢查、不檢查;
納稅人策略:逃稅、不逃稅
博弈論200981精選ppt課件支付矩陣:a是應(yīng)納稅款,C是檢查成本,F(xiàn)是罰款;C<a+F。博弈論200982精選ppt課件用θ代表稅收機(jī)關(guān)檢查的概率,γ代表納稅人逃稅的概率。給定γ,稅收機(jī)關(guān)檢查(θ=1)和不檢查(θ=0)的期望收益分別為:
練習(xí):本例與前例解法互換(?)博弈論200983精選ppt課件令,得:,即最優(yōu)的逃稅概率。
同理得。因此混合策略納什均衡是:博弈論200984精選ppt課件討論:應(yīng)納稅款越多逃稅概率越??;與逃稅技術(shù)及檢查成本有關(guān);賄賂的積極性;提高逃稅懲罰可降低逃稅積極性,減少檢查必要性。練習(xí):解析法求前面圖解法例子的最優(yōu)混合策略(?)博弈論200985精選ppt課件6.納什均衡的存在性與多重性納什均衡的存在性定理(納什1950)每一個(gè)有限博弈至少存在一個(gè)納什均衡(純的或混合的)。各均衡間的關(guān)系(下圖)博弈論200986精選ppt課件博弈論200987精選ppt課件納什均衡的多重性:導(dǎo)致局中人一致預(yù)測(cè)困難;例:分蛋糕利用其它信息達(dá)到聚點(diǎn)均衡;例:性別戰(zhàn);賭徒分錢廉價(jià)磋商cheaptalk;協(xié)調(diào)博弈coordinationgame;局中人學(xué)習(xí),重復(fù)博弈中“平均”表現(xiàn)。博弈論200988精選ppt課件博弈論200989精選ppt課件第三講完全信息動(dòng)態(tài)博弈
1.博弈的擴(kuò)展型表述2.擴(kuò)展型博弈的納什均衡3.子博弈精煉納什均衡(完美均衡)4.寡頭競(jìng)爭(zhēng)模型5.工會(huì)與雇主間的博弈6.討價(jià)還價(jià)模型7.重復(fù)博弈博弈論200990精選ppt課件1.博弈的擴(kuò)展型表述extensiveformrepresentation要素:
局中人:誰參加
行動(dòng)順序:什么時(shí)候行動(dòng)
行動(dòng)空間:有什么選擇
信息集:知道些什么
支付函數(shù):能得到什么
自然選擇概率:外生事件如何博弈論200991精選ppt課件博弈樹:n人有限博弈的擴(kuò)展型表述可用博弈樹表示。
例:房地產(chǎn)開發(fā)博弈論200992精選ppt課件博弈樹一般構(gòu)造:
結(jié)-決策結(jié)、終點(diǎn)結(jié);
枝-局中人的行動(dòng)選擇。
信息集-決策時(shí)面臨的可能信息狀態(tài);
由單個(gè)或多個(gè)決策結(jié)組成的集合;用虛線連接同一信息集的結(jié)。
注:應(yīng)用信息集概念,可將博弈樹用來表示靜態(tài)博弈(囚徒困境?)博弈論200993精選ppt課件博弈論200994精選ppt課件博弈論200995精選ppt課件博弈論200996精選ppt課件信息類型完美perfect:每個(gè)信息集都是單結(jié)的。確定certain:自然不在任何一個(gè)參與人行動(dòng)之后行動(dòng)。對(duì)稱symmetric:沒有人在行動(dòng)時(shí)或終點(diǎn)結(jié)處擁有與其它人不同的信息。完全complete:自然不首先行動(dòng)或它的最初行動(dòng)被所有人觀察到。博弈論
博弈論200997精選ppt課件例:撲克牌游戲下注前行為規(guī)則。(1)所有牌洗成面朝上;(完美,確定)(2)所有牌洗成面朝下且不能看自己的牌;
(不完全,對(duì)稱,確定)(3)所有牌洗成面朝下且參與人只能看自己的牌;(不完全,不對(duì)稱,確定)(4)所有牌洗成面朝上,但每個(gè)參與人隨后都可以用手護(hù)住并悄悄丟掉一張牌;
(完全,不對(duì)稱,確定)
博弈論
博弈論200998精選ppt課件(5)所有牌洗成面朝上,然后參與人下注,然后每個(gè)人再得到一張面朝上的牌。
(完美,不確定)(6)所有牌洗成面朝下,然后參與人抓起自己的牌但不看牌,然后把牌舉過頭頂讓其它人看清他的牌。
(不完全,不對(duì)稱,確定)博弈論
博弈論200999精選ppt課件完美信息博弈特征:
沒有同時(shí)行動(dòng);所有后行動(dòng)者確切知道前行動(dòng)者的行動(dòng);所有人觀測(cè)到自然的行動(dòng)。博弈的完美回憶要求perfectrecall
所有人都不忘記以前知道的事情;所有人都不會(huì)忘記自己的選擇。
例:撲克游戲忘記前面所出牌的情形博弈論2009100精選ppt課件2.擴(kuò)展型博弈的納什均衡純策略納什均衡
例:市場(chǎng)小情況下的房地產(chǎn)開發(fā)博弈論2009101精選ppt課件囚徒困境動(dòng)態(tài)情況下的策略型?博弈論2009102精選ppt課件分析:A的純策略:開發(fā)、不開發(fā);2個(gè)B的純策略:共4個(gè)所有局中人的一個(gè)純策略組合決定了博弈樹的一個(gè)路徑。(開發(fā),{不開發(fā),開發(fā)}):A-開發(fā)-B-不開發(fā)-(1,0)(不開發(fā),{開發(fā),開發(fā)}):A-不開發(fā)-B-開發(fā)-(0,1)博弈論2009103精選ppt課件存在三個(gè)純策略納什均衡:
(開發(fā),{不開發(fā),開發(fā)})(開發(fā),{不開發(fā),不開發(fā)})(不開發(fā),{開發(fā),開發(fā)})定理:一個(gè)有限完美信息博弈有一個(gè)純策略納什均衡。博弈論2009104精選ppt課件混合策略納什均衡**:行為策略:信息集上行動(dòng)集合的概率分布
例:博弈論2009105精選ppt課件參與人2純策略:{L,L},{L,R},{R,L},{R,R}行為策略:b2={(1/2,1/2),(1/2,1/2)}(在信息集每一個(gè)結(jié)點(diǎn),局中人2以1/2的概率選擇一種行動(dòng))混合策略:σ2=(σ21,σ22,σ23,σ24)博弈論2009106精選ppt課件在信息集h:選擇L-{L,L},{L,R}選擇R-{R,L},{R,R}在信息集h″:選擇L-{L,L},{R,L}選擇R-{L,R},{R,R}所以有博弈論2009107精選ppt課件解之得:σ2=(1/4,1/4,1/4,1/4)σ2=(1/2,0,0,1/2)σ2=(0,1/2,1/2,0)結(jié)論:一個(gè)行為策略可能對(duì)應(yīng)多個(gè)混合策略;但一個(gè)混合策略只對(duì)應(yīng)一個(gè)行為策略??勺C明:在完美信息博弈中,兩者是等價(jià)的。博弈論2009108精選ppt課件3.子博弈精煉納什均衡(完美均衡)基本思想:
靜態(tài)中假設(shè)其它人策略是給定的動(dòng)態(tài)中前行動(dòng)者要考慮對(duì)后行動(dòng)者的影響區(qū)分納什均衡的合理性
精煉refining
不可置信威脅博弈論2009109精選ppt課件萊茵哈德·澤爾騰ReinhardSelten
1930年出生于德國(guó)1961年獲得法蘭克福大學(xué)數(shù)學(xué)博士學(xué)位1984年后任教于波恩大學(xué)子博弈精煉納什均衡創(chuàng)立者1994年因在“非合作博弈理論中開創(chuàng)性的均衡分析”獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)博弈論2009110精選ppt課件例:(U,R)與(D,L)的區(qū)別?博弈論2009111精選ppt課件例:房地產(chǎn)開發(fā),唯一合理均衡:A:開發(fā),B:{不開發(fā),開發(fā)}博弈論2009112精選ppt課件子博弈:從一個(gè)單結(jié)信息集開始;信息集和支付向量都直接繼承自原博弈;
(不可分割原博弈的信息集)任何博弈本身稱為自身的一個(gè)子博弈。博弈論2009113精選ppt課件前例:包括原博弈,共有三個(gè)子博弈。博弈論2009114精選ppt課件無法再分割,子博弈只有本身一個(gè)。博弈論2009115精選ppt課件在第2局中人處不可分割(會(huì)切割原來的信息集),故此圖只有兩個(gè)子博弈。博弈論2009116精選ppt課件子博弈精煉納什均衡擴(kuò)展型博弈的策略組合s*=(s1*,...,si*,...,sn*)是一個(gè)子博弈精煉納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個(gè)子博弈上給出納什均衡。博弈論2009117精選ppt課件說明:每一個(gè)子博弈(包括原博弈)都構(gòu)成一個(gè)納什均衡;如果有唯一子博弈,則等同于納什均衡;如果存在其它子博弈,則有些納什均衡將不是。前例:兩個(gè)子博弈;(D,L)是精煉均衡,(U,R)不是。前例:房地產(chǎn)投資博弈論2009118精選ppt課件與納什均衡的本質(zhì)區(qū)別:納什均衡只要求均衡策略在均衡路徑(歷史)上的決策結(jié)上是最優(yōu)的;子博弈精煉納什均衡要求在非均衡路徑的決策結(jié)上也是最優(yōu)的。
博弈論2009119精選ppt課件4.逆向歸納法
基本思想
重復(fù)剔除劣策略方法的推廣。在均衡路徑,每一個(gè)局中人在每一個(gè)信息集上的選擇都是占優(yōu)選擇。適用于有限完美信息博弈不適用于無限博弈和不完美信息博弈。博弈論2009120精選ppt課件例:({U,U’},L)博弈論2009121精選ppt課件逆向歸納法的缺陷
在階段多時(shí)失去可靠性。例如:傳口令游戲
對(duì)意外事件的預(yù)測(cè)。Rosenthal19811
A1
2
A2
1
A3
2
A4
1
A5D1D2D3D4D5(1,0)(0,1)(3,0)(2,4)(6,3)(5,5)博弈論2009122精選ppt課件分析:逆向歸納法Di為最優(yōu)選擇;如果1非理性地選擇A1,則2如何選擇?大家均非理性會(huì)有雙贏結(jié)果,是否應(yīng)該冒險(xiǎn)?博弈論2009123精選ppt課件5.承諾行動(dòng)
commitment通過減少自己的選擇機(jī)會(huì)使自己受益。完全承諾與不完全承諾。例:破釜沉舟例:房地產(chǎn)案例
若B與某客戶已簽合同,如不能履約賠償3500萬,則B的{開發(fā),開發(fā)}成為可置信的威脅。子博弈精煉納什均衡為(不開發(fā),{開發(fā),開發(fā)})
博弈論2009124精選ppt課件例:要脅訴訟:原告P,被告D(1)原告決定是否對(duì)被告提出控告,成本為c>0;(2)如果決定控告,原告要求被告支付s>0私了;(3)被告決定是否接受原告的要求;(4)如果被告拒絕,原告決定放棄或是向法庭起訴,原告的起訴成本為p,被告的辯護(hù)成本為d;(5)如果案子到了法庭,原告以
概率贏得x單位的支付.博弈論2009125精選ppt課件提出s博弈論2009126精選ppt課件分析:原告指控條件:
x-p<0,即
x<p原告選擇:{不指控,要求,放棄}被告選擇:{拒絕}均衡:原告不指控博弈論2009127精選ppt課件原告承諾行動(dòng):指控前支付律師費(fèi),則
x-c-p>-c-p。最后選擇:起訴。私了賠償:私了賠償區(qū)域?yàn)閟∈[
x,
x+d]。若討價(jià)還價(jià)能力相同,則賠償為s=
x+d/2。博弈論2009128精選ppt課件原告指控條件:原告總成本為c+p,指控條件為
x+d/2>c+p。被告越大,d越大,被指控可能性就越大。
被告承諾行動(dòng):指控前支付律師費(fèi)y。被告節(jié)省成本
x+d/2-y,律師費(fèi)y<
x+d/2“積淀成本”:局中人為承諾行動(dòng)支付的成本。博弈論2009129精選ppt課件6.應(yīng)用實(shí)例(1)Stackelberg產(chǎn)量競(jìng)爭(zhēng)模型
Stackelberg,1934,完美信息動(dòng)態(tài)博弈。
Leader:q1≥0,follower:觀測(cè)到q1,選擇q2≥0
博弈論2009130精選ppt課件給定q1,企業(yè)2的問題是:
最優(yōu)化:企業(yè)1預(yù)測(cè)到S2(q1),企業(yè)1的問題是:
解:均衡:;均衡結(jié)果:博弈論2009131精選ppt課件比較分析:總產(chǎn)量:各企業(yè)產(chǎn)量及利潤(rùn):博弈論2009132精選ppt課件結(jié)論:先動(dòng)優(yōu)勢(shì)—擁有信息優(yōu)勢(shì)使人處于劣勢(shì)(可以證明:價(jià)格競(jìng)爭(zhēng)有后動(dòng)優(yōu)勢(shì))原因:q1先生產(chǎn)積淀成本若q1只是宣布,未真正實(shí)現(xiàn),則不構(gòu)成威脅,即是cournot模型。博弈論2009133精選ppt課件(2)工會(huì)與雇主間的博弈*
列昂惕夫模型Leontief1946博弈的順序:
工會(huì)首先選擇工資w;企業(yè)觀測(cè)到w后選擇就業(yè)水平L。(工會(huì)決定工資,企業(yè)決定就業(yè)水平。)
因此,這是個(gè)完美信息動(dòng)態(tài)博弈。博弈論2009134精選ppt課件
設(shè)工會(huì)的效用函數(shù)為:U(w,L),
w-工資水平,L-就業(yè)水平,Uw>0,UL>0
設(shè)企業(yè)的利潤(rùn)函數(shù)為:
假定R(L)是嚴(yán)格遞增的上凸函數(shù),即R’>0,R”<0
博弈論2009135精選ppt課件首先求解給定w的情況下,企業(yè)的就業(yè)需求。企業(yè)問題:最優(yōu)化的一階條件是:即邊際收益等于邊際成本。
∵邊際收益是遞減的,∴上述一階條件意味著企業(yè)對(duì)勞動(dòng)的需求是工資的遞減函數(shù)(w↑,L↓)。博弈論2009136精選ppt課件工會(huì)預(yù)測(cè)到上述結(jié)果,工會(huì)在第一階段的問題是:最優(yōu)化的一階條件是:其中,是工會(huì)的邊際替代率;是企業(yè)勞動(dòng)需求曲線的斜率。博弈論2009137精選ppt課件合同曲線工會(huì)的無差異曲線企業(yè)的等利潤(rùn)曲線博弈論2009138精選ppt課件均衡:工會(huì)選擇工資水平使得自己的無差異曲線與企業(yè)的勞動(dòng)需求曲線相切。子博弈精煉納什均衡結(jié)果是非帕累托最優(yōu)。帕累托最優(yōu)合同曲線:即企業(yè)等利潤(rùn)曲線的斜率等于工會(huì)無差異曲線的斜率(相切)。博弈論2009139精選ppt課件模型改進(jìn):納什討價(jià)還價(jià)模型假定工會(huì)和企業(yè)之間就工資和就業(yè)水平同時(shí)進(jìn)行磋商,如果雙方不能達(dá)成協(xié)議,工會(huì)的效用水平和企業(yè)的利潤(rùn)水平都為零;如果雙方達(dá)成協(xié)議,工會(huì)的效用水平為U(w,L),企業(yè)的利潤(rùn)為π(w,L)。納什討價(jià)還價(jià)問題:
博弈論2009140精選ppt課件最優(yōu)解的一階條件是:
整理得:
顯然,這個(gè)解是一個(gè)帕累托最優(yōu)合同。博弈論2009141精選ppt課件(3)討價(jià)還價(jià)模型
不存在耐心問題
例:兩人為買賣一物談判一個(gè)價(jià)格。買者B最高出價(jià)300元,賣者S不接受低于200元的開價(jià)。不存在耐心問題:輪次少,時(shí)間短,不存在時(shí)間價(jià)值。博弈論2009142精選ppt課件B博弈論2009143精選ppt課件特點(diǎn):“后動(dòng)優(yōu)勢(shì)”;“幾乎吃掉整個(gè)蛋糕”另:若由B開價(jià),只進(jìn)行一次,則(200+ε)元成交。決定因素:誰最后開價(jià);開價(jià)輪次數(shù)。博弈論2009144精選ppt課件不耐心的情形例:100輪次。每輪要支付成本。博弈論2009145精選ppt課件耐心相同:50-50;耐心之比:利益之比博弈論2009146精選ppt課件一般模型
Rubinstein-Stahl討價(jià)還價(jià)模型
定理:給定S、B雙方,B第一次開價(jià),次數(shù)無限,貼現(xiàn)因子0<δB<1,0<δS<1,當(dāng)拒絕與接受無所謂,認(rèn)為接受,則存在唯一子博弈完美均衡。(貼現(xiàn)因子=1-耐心成本因子)B首輪開價(jià)博弈論2009147精選ppt課件注:若,則例:若δB=0.97,δS=0.94,
x*=(1-0.94)/(1-0.94
0.97)=0.674;若δB=δS=0.97x*=1/(1+0.97)=0.508結(jié)論:取決于兩個(gè)因素·
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度雙方承諾協(xié)議書:文化產(chǎn)業(yè)投資基金合作協(xié)議范文
- 2025年度商業(yè)地產(chǎn)租賃違約金規(guī)范及違約責(zé)任合同
- 體育場(chǎng)館建設(shè)貸款居間合同
- 2024-2025學(xué)年福建省福州市高一上學(xué)期期中十校聯(lián)考生物試卷
- 2024-2025學(xué)年安徽省卓越縣中聯(lián)盟皖豫名校聯(lián)盟高二上學(xué)期11月期中聯(lián)考生物試卷
- 2025年貴州農(nóng)業(yè)職業(yè)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及答案1套
- 2025年河南工業(yè)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)完整版
- 2025年??诮?jīng)濟(jì)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)必考題
- 未來城市交通與智能電梯的融合研究
- 2025年河南輕工職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)匯編
- GB/T 22560-2008鋼鐵件的氣體氮碳共滲
- GB/T 1265-2003化學(xué)試劑溴化鈉
- 統(tǒng)編版四年級(jí)道德與法治下冊(cè)全冊(cè)課件
- 11-化學(xué)動(dòng)力學(xué)基礎(chǔ)-2-考研試題資料系列
- 醫(yī)院評(píng)審工作臨床科室資料盒目錄(15個(gè)盒子)
- 社區(qū)獲得性肺炎臨床路徑
- 壓力性損傷指南解讀
- 湯姆走丟了 詳細(xì)版課件
- 大學(xué)學(xué)院學(xué)生心理危機(jī)預(yù)防與干預(yù)工作預(yù)案
- 國(guó)有土地上房屋征收與補(bǔ)償條例 課件
- 鐵路建設(shè)項(xiàng)目施工企業(yè)信用評(píng)價(jià)辦法(鐵總建設(shè)〔2018〕124號(hào))
評(píng)論
0/150
提交評(píng)論