版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
博弈論
theTheoryofGames
1精選ppt課件主要內(nèi)容一、博弈現(xiàn)象及基本概念二、完全信息靜態(tài)博弈三、完全信息動態(tài)博弈四、不完全信息靜態(tài)博弈五、不完全信息動態(tài)博弈六、不完全信息專題博弈論20092精選ppt課件主要參考書姚國慶:《博弈論》,高等教育出版社,2007.羅云峰:《博弈論教程》,清華大學(xué)出版社、北京交通大學(xué)出版社。張維迎:《博弈論與信息經(jīng)濟學(xué)》,上海三聯(lián)書店,上海人民出版社,2004。施錫銓,《博弈論》,上海財經(jīng)大學(xué)出版社,2002。博弈論20093精選ppt課件張守一,《現(xiàn)代經(jīng)濟對策論》,高等教育出版社,1998。錢頌迪,《運籌學(xué)》,清華大學(xué)出版社,1996。[美]艾里克.拉斯繆森:《博弈與信息》,北京大學(xué)出版社,2003。[美]弗登博格:《博弈論》,中國人民大學(xué)出版社,2002。博弈論20094精選ppt課件第一講博弈現(xiàn)象與基本概念1.博弈現(xiàn)象2.博弈概念3.博弈描述4.博弈練習(xí)5.關(guān)于博弈論博弈論20095精選ppt課件1.博弈現(xiàn)象
田忌賽馬:正確的策略可以反敗為勝。囚徒困境:甲乙理性的人是自私自利的;理性選擇不是全局最優(yōu)。博弈論20096精選ppt課件經(jīng)濟合作:
甲乙誠信的價值;一報還一報策略;人類生存環(huán)境啟示。博弈論20097精選ppt課件長街上的超市(海灘占位模型)*********************01/23/411/4A’O’資源浪費還是理性的必然?其它相似情形:旅行社的熱門路線;黃金時間的電視節(jié)目;總統(tǒng)競選。博弈論20098精選ppt課件狩獵與投資狩獵:
兩個獵人圍住一頭鹿,各卡住兩個關(guān)口中的一個,齊心協(xié)力即可成功獲得并平分獵物。此時有一群兔子跑過,任何一人去抓兔子必可成功,但鹿會跑掉。他們會堅持獵鹿還是去抓兔子?博弈論20099精選ppt課件共同投資:
雙方共同投資一個大項目,可期望有較大收益。此時如某方抽出資金去進行小項目投資,必可成功獲小利,但會使共同項目陷入困境,使對方蒙受損失。投資者會如何選擇?博弈論200910精選ppt課件旅行者困境
兩個旅行者花瓶被摔壞,向航空公司索賠。航空公司知道價格約為八九十元,但不知道確切價格。于是請兩位旅客在100元以內(nèi)自己寫下花瓶的價格。
如兩人寫的一樣,就認為他們講真話,并按所寫數(shù)額賠償;如果兩人寫的不一樣,就認定低者講真話,并照此價格賠償。同時,對講真話的旅客獎勵2元錢,對講假話的旅客罰款2元。
理性原則下,他們會寫多少價格呢?博弈論200911精選ppt課件什么是博弈:
個人或團體間在依存和對抗、合作和沖突中的決策問題。博弈論研究博弈過程中的理性行為。2.博弈概念博弈論200912精選ppt課件如何理解理性行為:自身利益最大;持續(xù)地有意圖的行動;不對動機妄加猜測;不考慮道德問題;只研究合法問題;盈利函數(shù)有多重標(biāo)準(zhǔn)。博弈論200913精選ppt課件博弈三要素局中人(參與人)players:決策主體;自然人、團體或“虛擬局中人”;有可供選擇的策略和明確定義的利益函數(shù);分為兩人和多人博弈論200914精選ppt課件策略(戰(zhàn)略)strategies:采取行動的規(guī)則;可以是一次行動也可以是一個行動序列;可以是純策略也可以是混合策略;分為有限和無限。支付(盈利函數(shù))payoff:對應(yīng)于某策略組合的局中人利益或損失;確定的或是期望的;分為零和和非零和。博弈論200915精選ppt課件擴展術(shù)語:信息:信息集;
完全信息(complete);完美信息(perfect)。共同知識:雙方可能獲取的相同信息;彼此都能算清楚。博弈結(jié)果:均衡策略組合;均衡行動組合。均衡:所有局中人最優(yōu)策略的組合。博弈論200916精選ppt課件博弈的策略型(標(biāo)準(zhǔn)型、正則型)表述:指定n個局中人,以及他們各自的純策略空間和這些局中人各自的支付(盈利)函數(shù)我們將該博弈表示為:3.博弈描述博弈論200917精選ppt課件例:寡頭競爭問題策略型表述多適用于靜態(tài)博弈。另一種表述方式是擴展式表述,兩種表述形式幾乎是完全等價的,但是擴展式表述更適合于討論動態(tài)博弈。博弈論200918精選ppt課件房地產(chǎn)開發(fā)實例雙方:A,B策略:開發(fā)投資1億元;不開發(fā),投資0售價:高需:1.4億元(兩棟),1.8億元(一棟);
低需:0.7億元(兩棟),1.1億元(一棟)。博弈論200919精選ppt課件結(jié)果:高需,(開,不開),(0.8,0)高需,(不開,開),(0,0.8)高需,(開,開),(0.4,0.4)高需,(不開,不開),(0,0)低需,(開,不開),(0.1,0)低需,(不開,開),(0,0.1)低需,(開,開),(-0.3,-0.3)低需,(不開,不開),(0,0)博弈論200920精選ppt課件策略型表述:(兩人有限博弈;矩陣形式)AB高需求情況低需求情況?博弈論200921精選ppt課件房地產(chǎn)博弈分析假設(shè):同時決策;市場需求雙方已知若市場需求大,雙方開發(fā),各得0.4萬元。若市場需求小,依賴于對方行動。若市場不確定,依賴對市場的判斷及對方行動。例:P=0.5,最壞情況期望盈利500萬元,開發(fā)。P=0.3,對方開發(fā)概率<31/40時,開發(fā);否則,不開發(fā)。(?)博弈論200922精選ppt課件關(guān)鍵問題:對自然狀態(tài)的概率估計;不同時間決策(決策順序);對對方先驗信息的估計(即估計對方對信息的掌握程度)。現(xiàn)實困難:對市場了解程度不同;對對方了解程度不同;如何向?qū)Ψ桨凳咀约旱男袆?。博弈?00923精選ppt課件4.博弈練習(xí)游戲一:心靈感應(yīng)兩個人一組,獨立寫出1至10之間的任意5個數(shù)。如果不重復(fù)則得獎;否則受罰。
獲勝的秘訣是什么?博弈論200924精選ppt課件游戲二:海盜逃生
有5個海盜,即將被處死刑。法官愿意給他們一個機會。從100個黃豆中隨意抓取,最多可以全抓,最少可以不抓,可以和別人抓的一樣多。抓得最多的和最少的要被處死。
如果你第一個抓,你抓幾個?博弈論200925精選ppt課件游戲三:100元怎么分?
你看見兩個小孩在玩耍,出于好奇,你給他們100元,讓他們猜拳。猜贏者決定怎么分這100元,而輸者如果同意贏者的分配比例,那么他們將各有所得,如果不同意,那么這100元,你將收回。
請你替贏者考慮一下,怎樣分配,贏者既得到最大利益,又能讓輸者也同意呢?博弈論200926精選ppt課件游戲四:一元錢競拍
給一元錢鈔票開出你的價錢,使自己獲益最大或損失最少;每次叫價以5分錢為單位;開價最高者得到這一元錢;出價最高和次高者一并按所開的價錢支付。
斜坡上的均衡;“騎虎難下”的博弈;“協(xié)和謬誤”博弈論200927精選ppt課件游戲五:強盜分贓
有五個強盜搶得100枚金幣,在如何分贓問題上爭吵不休。于是他們決定:(1)抽簽決定自己的號碼(1,2,3,4,5);(2)由1號提出分配方案,然后5人表決,如果方案超過半數(shù)同意就通過,否則他將被仍進大海喂鯊魚;博弈論200928精選ppt課件(3)1號死后,由2號提方案,4人表決,當(dāng)且僅當(dāng)超過半數(shù)同意方案通過,否則2號同樣被仍進大;(4)依次類推,直到找到一個每個人都接受的方案(當(dāng)然,如果只剩下5號,他當(dāng)然接受一個人獨吞的結(jié)果)。
如果你是第一個強盜,你該如何提出分配方案才能使自己的收益最大化呢?
博弈論200929精選ppt課件5.關(guān)于博弈論博弈分類:合作、非合作:是否存在一個具有約束力的協(xié)議(bindingagreement)前者強調(diào)團體理性(效率、公正、公平)后者強調(diào)個人理性(最優(yōu)決策,不保證效率)博弈論200930精選ppt課件完全信息與不完全信息:每一個局中人對自己及其它局中人是否有完全的了解;包括局中人特征、策略空間、盈利函數(shù)等知識。動態(tài)與靜態(tài):行動的先后順序;是否同時(或不同時但對方不知)。博弈論200931精選ppt課件發(fā)展歷史:
1944
VonNeumann&Morgenstern“Thetheoryofgamesandeconomicbehavior”
1950
Nash&1953Shapley“討價還價”模型
1950、1951
Nash非合作博弈
1950
TuckerPrisoners’dilemma
1953
Gillies&Shapley合作博弈
1965Selton動態(tài)分析;“精煉納什均衡”
1967、1968
Harsanyi“不完全信息”
1994
Nash、Selton、Harsanyi諾貝爾經(jīng)濟學(xué)獎博弈論200932精選ppt課件納什的傳奇人生
1928年出生于一個電子工程師家庭。17歲進入今卡耐基梅隆大學(xué),專攻數(shù)學(xué)。20歲時進入普林斯頓大學(xué)攻讀博士學(xué)位。1949年,21歲的納什寫下論文《多人博弈的均衡點》。1950年以論文《非合作型博弈》獲得數(shù)學(xué)博士學(xué)位。博弈論200933精選ppt課件博弈論200934精選ppt課件
畢業(yè)后先后在蘭德研究所、普林斯頓大學(xué)、MIT工作。1957年他與MIT學(xué)生愛莉西婭結(jié)婚。在而立之年患上了妄想型精神分裂癥,九十年代逐漸恢復(fù)了正常。1994年納什博士獲諾貝爾經(jīng)濟學(xué)獎。
2002年來北京參加
“國際數(shù)學(xué)家大會”博弈論200935精選ppt課件博弈論200936精選ppt課件電影“美麗心靈”博弈論200937精選ppt課件博弈論體系博弈論200938精選ppt課件第二講完全信息靜態(tài)博弈1.矩陣博弈2.累次嚴(yán)優(yōu)均衡3.納什均衡4.混合策略納什均衡5.納什均衡的存在性與多重性博弈論200939精選ppt課件1.矩陣博弈什么是矩陣博弈:兩人零和有限策略博弈;可用矩陣形式表述。矩陣元素為局中人A的贏得,亦即B的損失。
例:用矩陣形式表述田忌賽馬博弈(?)博弈論200940精選ppt課件有鞍點情形:存在最優(yōu)純策略例:表中數(shù)據(jù)為I的贏得
博弈哲學(xué):從最壞處考慮,爭取最好結(jié)果博弈論200941精選ppt課件無鞍點情形:最優(yōu)混合策略
例:設(shè)最優(yōu)混合策略:博弈論200942精選ppt課件對局中人I:博弈論200943精選ppt課件∴I的最優(yōu)混合策略為
同理,II的最優(yōu)混合策略為G=8同理可求局中人II的最優(yōu)混合策略(?)博弈論200944精選ppt課件2.累次嚴(yán)優(yōu)均衡占優(yōu)策略均衡(嚴(yán)格)劣策略:無論對方如何選擇都更差。占優(yōu)策略:無論對方如何選擇存在唯一最優(yōu)。占優(yōu)策略均衡:所有局中人占優(yōu)策略的組合。特點:只要求每個人理性,并不要求知道其它人是不是理性。博弈論200945精選ppt課件例:裁軍問題
例:囚徒困境中的(認罪,認罪)例:房地產(chǎn)投資市場大情況下(開發(fā),開發(fā))博弈論200946精選ppt課件重復(fù)剔除的占優(yōu)均衡
(iteratedelimination)
也稱為累次嚴(yán)優(yōu)均衡。通過重復(fù)剔除劣戰(zhàn)略剩下唯一的戰(zhàn)略組合。如果存在則稱為重復(fù)剔除占優(yōu)可解的。
(dominancesolvable)
特點:不僅要求每個人理性,還要求知道其它人理性。理性是共同知識。博弈論200947精選ppt課件例:智豬博弈按鈕喂食:一次供應(yīng)量為8,代價為2。大豬先到7:1;同時到5:3;小豬先到4:4博弈論200948精選ppt課件分析:小豬有占優(yōu)策略,大豬沒有,所以不存在占優(yōu)均衡;在“理性”為共同知識的情況下,存在重復(fù)剔除的占優(yōu)均衡,即(大豬按,小豬等)。應(yīng)用:
此為“多勞不多得,少勞不少得”的奇怪情形,是一種有趣的社會現(xiàn)象。經(jīng)濟學(xué)中稱為“搭便車現(xiàn)象”博弈論200949精選ppt課件無論局中人I怎樣決策,局中人II與其選取策略M還不如選取策略R。對于局中人II來說,M是個劣策略??梢匀サ鬒I的“M”列。
例:博弈論200950精選ppt課件假定II不選M,對于I來說M和D是劣策略。博弈論200951精選ppt課件故I選擇U。這時,II選擇L而不選R。可以預(yù)測博弈的合理結(jié)局可能是(U,L)即(4,3)。博弈論200952精選ppt課件嚴(yán)優(yōu)均衡的局限
有時無法開始累次嚴(yán)優(yōu)的剔除;例:房地產(chǎn)投資中市場小的情況
反?,F(xiàn)象:盈利函數(shù)取極端值時;
如果雙方都存在嚴(yán)劣策略,從不同人開始的結(jié)果一致;與混合策略的優(yōu)劣比較。博弈論200953精選ppt課件分析:累次嚴(yán)優(yōu)過程產(chǎn)生了唯一解(U,L)。然而,不管局中人I如何行動,局中人II取R僅比取L在盈利上差0.5。I選策略U要冒極大的風(fēng)險,策略D比U更加穩(wěn)健。所以,局中人I不會選U,而是選擇D。穩(wěn)健性。例:博弈論200954精選ppt課件3.納什均衡定義:
有n個局中人的策略式表述博弈G={S1,…,Sn;u1,…,un},
策略組合s*=(s1*,…,si*,…,sn*)是一個納什均衡,如果對于每一個i,si*是給定其它局中人選擇s-i*=(s1*,…,si-1*,si+1*,…,sn*)的情況下第i個局中人的最優(yōu)策略,即ui(si*,s-i*)
ui(si,s-i*),
si
Si,
i
博弈論200955精選ppt課件或者用另一種表述方式:si*是下述最大化問題的解:si*
argmaxui(s1*,…,si-1*,si,si+1*,…,sn*),i=1,2,…n。si
Si結(jié)論:最優(yōu)對任一參與者的任一策略成立;是一種可以自動實施的協(xié)議(self-enforcing)博弈論200956精選ppt課件兩人有限博弈納什均衡的確定
例:用表上作業(yè)法尋找nash均衡博弈論200957精選ppt課件對納什均衡的理解“一致性”特征:局中人預(yù)測到均衡;局中人也預(yù)測到其它人預(yù)測到均衡;沒有局中人有興趣作不同的選擇。是局中人的一致性預(yù)測;但不一定最好。博弈論200958精選ppt課件與嚴(yán)優(yōu)均衡的關(guān)系:(1)每個占優(yōu)均衡、重復(fù)剔除的占優(yōu)均衡一定是納什均衡,反之則不然。(2)納什均衡一定是在重復(fù)剔除嚴(yán)劣策略過程中沒有剔除的策略組合,反之則不然。(3)納什均衡有強弱之分。強納什均衡>;弱納什均衡≥。允許弱劣策略存在。博弈論200959精選ppt課件例:市場進入博弈參與人:在位者;進入者策略:在位者:默許、斗爭;
進入者:進入、不進入。假定:進入之前的壟斷利潤為300,進入之后寡頭利潤為100,進入成本為10。博弈論200960精選ppt課件納什均衡分析:(進入,默許)是強納什均衡,(不進入,斗爭)是弱納什均衡。博弈論200961精選ppt課件重復(fù)剔除弱劣策略方法:“斗爭”是在位者的弱劣戰(zhàn)略被剔除,(進入,默許)是唯一重復(fù)剔除的占優(yōu)均衡;納什均衡(不進入,斗爭)將被剔除掉。說明(弱)納什均衡允許弱劣戰(zhàn)略存在。博弈論200962精選ppt課件4.納什均衡應(yīng)用舉例(1)
消耗戰(zhàn)(鷹鴿博弈)
兩只老虎為爭奪獵物對峙。都堅持則獵物腐爛;一方放棄則歸另一方;都放棄則都得不到獵物。獵物價值f,僵持成本為c。
(對稱博弈與對稱均衡)博弈論200963精選ppt課件(2)性別戰(zhàn)(協(xié)調(diào)博弈)一對情侶周末安排,女方喜歡音樂會,男方喜歡足球賽。情侶陪伴看喜歡的為最好,陪情侶看自己不喜歡的為次之,各自看自己喜歡的又次之,各自看不喜歡的最糟糕。博弈論200964精選ppt課件(3)協(xié)同作業(yè)1兩人合作,報酬相同為v。兩人同時用力,代價為cl;只有一人用力,代價為ch。cl<V<ch博弈論200965精選ppt課件(4)協(xié)同作業(yè)2兩人合作,給定一人的努力水平,另一人的收益隨自己努力水平先增后減。收益函數(shù):
ui(ai)=ai(c+aj-ai),c>0,ai>=0(圖?)最優(yōu)反應(yīng)函數(shù):ai*(aj)=(c+aj)/2聯(lián)立求Nash均衡得:a1=a2=c博弈論200966精選ppt課件(5)Cournot寡頭競爭模型
Cournot,1838,完全信息靜態(tài)博弈。
參與人:企業(yè)1和企業(yè)2;企業(yè)策略:選擇產(chǎn)量;支付:利潤,是兩個企業(yè)產(chǎn)量的函數(shù)。
博弈論200967精選ppt課件第i個企業(yè)的產(chǎn)量:成本函數(shù):價格函數(shù):第i個企業(yè)的利潤函數(shù):博弈論200968精選ppt課件對每個企業(yè)的利潤函數(shù)求導(dǎo)并令其等于零:分別定義了兩個反應(yīng)函數(shù):結(jié)論:每個企業(yè)的最優(yōu)戰(zhàn)略(產(chǎn)量)是另一個企業(yè)產(chǎn)量的函數(shù)。博弈論200969精選ppt課件兩個反應(yīng)函數(shù)的交叉點就是納什均衡:
博弈論200970精選ppt課件考慮上述模型的簡單情況:設(shè),價格函數(shù)取線性形式:最優(yōu)化的一階條件分別為:博弈論200971精選ppt課件反應(yīng)函數(shù)為:解兩個反應(yīng)函數(shù),得納什均衡為:每個企業(yè)的納什均衡利潤分別為:博弈論200972精選ppt課件與壟斷情況作比較:壟斷企業(yè)的問題:壟斷企業(yè)的最優(yōu)產(chǎn)量:壟斷利潤:博弈論200973精選ppt課件結(jié)論:(1)寡頭競爭的總產(chǎn)量大于壟斷產(chǎn)量的原因,在于每個企業(yè)在選擇自己的最優(yōu)產(chǎn)量時,只考慮對本企業(yè)利潤的影響,而忽視對另一個企業(yè)的外部負效應(yīng)。(2)易證明,雙方串謀成立卡特爾是不穩(wěn)定的,雙方都有欺騙的動機。(?)博弈論200974精選ppt課件(6)自學(xué)伯川德模型多黨競選;事故賠償法;公共地悲劇;爭議仲裁;
合作性談判;報案;專家診斷;博弈論200975精選ppt課件5.混合策略納什均衡例:社會福利博弈(父母與懶惰兒子)參與人:政府;一個流浪漢政府策略:救濟、不救濟;
流浪漢策略:找工作、流浪博弈論200976精選ppt課件支付矩陣:博弈論200977精選ppt課件假定:政府的混合策略流浪漢的混合策略則政府的期望效用函數(shù)為:
博弈論200978精選ppt課件對上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件為:
即,流浪漢以0.2的概率選擇尋找工作,0.8的概率選擇流浪。所以,如果,政府將選擇不救濟;如果,政府將選擇救濟;只有當(dāng)時,政府才會選擇混合策略()或任何純策略。博弈論200979精選ppt課件同理,求解流浪漢的最優(yōu)化問題,即可找出政府的均衡混合戰(zhàn)略。易知(?)納什均衡要求,每個參與人的混合策略是給定對方的混合策略下的最優(yōu)選擇。因此,在社會福利博弈中,是唯一的納什均衡。博弈論200980精選ppt課件例:監(jiān)督博弈參與人:稅收機關(guān);納稅人稅收機關(guān)策略:檢查、不檢查;
納稅人策略:逃稅、不逃稅
博弈論200981精選ppt課件支付矩陣:a是應(yīng)納稅款,C是檢查成本,F(xiàn)是罰款;C<a+F。博弈論200982精選ppt課件用θ代表稅收機關(guān)檢查的概率,γ代表納稅人逃稅的概率。給定γ,稅收機關(guān)檢查(θ=1)和不檢查(θ=0)的期望收益分別為:
練習(xí):本例與前例解法互換(?)博弈論200983精選ppt課件令,得:,即最優(yōu)的逃稅概率。
同理得。因此混合策略納什均衡是:博弈論200984精選ppt課件討論:應(yīng)納稅款越多逃稅概率越??;與逃稅技術(shù)及檢查成本有關(guān);賄賂的積極性;提高逃稅懲罰可降低逃稅積極性,減少檢查必要性。練習(xí):解析法求前面圖解法例子的最優(yōu)混合策略(?)博弈論200985精選ppt課件6.納什均衡的存在性與多重性納什均衡的存在性定理(納什1950)每一個有限博弈至少存在一個納什均衡(純的或混合的)。各均衡間的關(guān)系(下圖)博弈論200986精選ppt課件博弈論200987精選ppt課件納什均衡的多重性:導(dǎo)致局中人一致預(yù)測困難;例:分蛋糕利用其它信息達到聚點均衡;例:性別戰(zhàn);賭徒分錢廉價磋商cheaptalk;協(xié)調(diào)博弈coordinationgame;局中人學(xué)習(xí),重復(fù)博弈中“平均”表現(xiàn)。博弈論200988精選ppt課件博弈論200989精選ppt課件第三講完全信息動態(tài)博弈
1.博弈的擴展型表述2.擴展型博弈的納什均衡3.子博弈精煉納什均衡(完美均衡)4.寡頭競爭模型5.工會與雇主間的博弈6.討價還價模型7.重復(fù)博弈博弈論200990精選ppt課件1.博弈的擴展型表述extensiveformrepresentation要素:
局中人:誰參加
行動順序:什么時候行動
行動空間:有什么選擇
信息集:知道些什么
支付函數(shù):能得到什么
自然選擇概率:外生事件如何博弈論200991精選ppt課件博弈樹:n人有限博弈的擴展型表述可用博弈樹表示。
例:房地產(chǎn)開發(fā)博弈論200992精選ppt課件博弈樹一般構(gòu)造:
結(jié)-決策結(jié)、終點結(jié);
枝-局中人的行動選擇。
信息集-決策時面臨的可能信息狀態(tài);
由單個或多個決策結(jié)組成的集合;用虛線連接同一信息集的結(jié)。
注:應(yīng)用信息集概念,可將博弈樹用來表示靜態(tài)博弈(囚徒困境?)博弈論200993精選ppt課件博弈論200994精選ppt課件博弈論200995精選ppt課件博弈論200996精選ppt課件信息類型完美perfect:每個信息集都是單結(jié)的。確定certain:自然不在任何一個參與人行動之后行動。對稱symmetric:沒有人在行動時或終點結(jié)處擁有與其它人不同的信息。完全complete:自然不首先行動或它的最初行動被所有人觀察到。博弈論
博弈論200997精選ppt課件例:撲克牌游戲下注前行為規(guī)則。(1)所有牌洗成面朝上;(完美,確定)(2)所有牌洗成面朝下且不能看自己的牌;
(不完全,對稱,確定)(3)所有牌洗成面朝下且參與人只能看自己的牌;(不完全,不對稱,確定)(4)所有牌洗成面朝上,但每個參與人隨后都可以用手護住并悄悄丟掉一張牌;
(完全,不對稱,確定)
博弈論
博弈論200998精選ppt課件(5)所有牌洗成面朝上,然后參與人下注,然后每個人再得到一張面朝上的牌。
(完美,不確定)(6)所有牌洗成面朝下,然后參與人抓起自己的牌但不看牌,然后把牌舉過頭頂讓其它人看清他的牌。
(不完全,不對稱,確定)博弈論
博弈論200999精選ppt課件完美信息博弈特征:
沒有同時行動;所有后行動者確切知道前行動者的行動;所有人觀測到自然的行動。博弈的完美回憶要求perfectrecall
所有人都不忘記以前知道的事情;所有人都不會忘記自己的選擇。
例:撲克游戲忘記前面所出牌的情形博弈論2009100精選ppt課件2.擴展型博弈的納什均衡純策略納什均衡
例:市場小情況下的房地產(chǎn)開發(fā)博弈論2009101精選ppt課件囚徒困境動態(tài)情況下的策略型?博弈論2009102精選ppt課件分析:A的純策略:開發(fā)、不開發(fā);2個B的純策略:共4個所有局中人的一個純策略組合決定了博弈樹的一個路徑。(開發(fā),{不開發(fā),開發(fā)}):A-開發(fā)-B-不開發(fā)-(1,0)(不開發(fā),{開發(fā),開發(fā)}):A-不開發(fā)-B-開發(fā)-(0,1)博弈論2009103精選ppt課件存在三個純策略納什均衡:
(開發(fā),{不開發(fā),開發(fā)})(開發(fā),{不開發(fā),不開發(fā)})(不開發(fā),{開發(fā),開發(fā)})定理:一個有限完美信息博弈有一個純策略納什均衡。博弈論2009104精選ppt課件混合策略納什均衡**:行為策略:信息集上行動集合的概率分布
例:博弈論2009105精選ppt課件參與人2純策略:{L,L},{L,R},{R,L},{R,R}行為策略:b2={(1/2,1/2),(1/2,1/2)}(在信息集每一個結(jié)點,局中人2以1/2的概率選擇一種行動)混合策略:σ2=(σ21,σ22,σ23,σ24)博弈論2009106精選ppt課件在信息集h:選擇L-{L,L},{L,R}選擇R-{R,L},{R,R}在信息集h″:選擇L-{L,L},{R,L}選擇R-{L,R},{R,R}所以有博弈論2009107精選ppt課件解之得:σ2=(1/4,1/4,1/4,1/4)σ2=(1/2,0,0,1/2)σ2=(0,1/2,1/2,0)結(jié)論:一個行為策略可能對應(yīng)多個混合策略;但一個混合策略只對應(yīng)一個行為策略。可證明:在完美信息博弈中,兩者是等價的。博弈論2009108精選ppt課件3.子博弈精煉納什均衡(完美均衡)基本思想:
靜態(tài)中假設(shè)其它人策略是給定的動態(tài)中前行動者要考慮對后行動者的影響區(qū)分納什均衡的合理性
精煉refining
不可置信威脅博弈論2009109精選ppt課件萊茵哈德·澤爾騰ReinhardSelten
1930年出生于德國1961年獲得法蘭克福大學(xué)數(shù)學(xué)博士學(xué)位1984年后任教于波恩大學(xué)子博弈精煉納什均衡創(chuàng)立者1994年因在“非合作博弈理論中開創(chuàng)性的均衡分析”獲諾貝爾經(jīng)濟學(xué)獎博弈論2009110精選ppt課件例:(U,R)與(D,L)的區(qū)別?博弈論2009111精選ppt課件例:房地產(chǎn)開發(fā),唯一合理均衡:A:開發(fā),B:{不開發(fā),開發(fā)}博弈論2009112精選ppt課件子博弈:從一個單結(jié)信息集開始;信息集和支付向量都直接繼承自原博弈;
(不可分割原博弈的信息集)任何博弈本身稱為自身的一個子博弈。博弈論2009113精選ppt課件前例:包括原博弈,共有三個子博弈。博弈論2009114精選ppt課件無法再分割,子博弈只有本身一個。博弈論2009115精選ppt課件在第2局中人處不可分割(會切割原來的信息集),故此圖只有兩個子博弈。博弈論2009116精選ppt課件子博弈精煉納什均衡擴展型博弈的策略組合s*=(s1*,...,si*,...,sn*)是一個子博弈精煉納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個子博弈上給出納什均衡。博弈論2009117精選ppt課件說明:每一個子博弈(包括原博弈)都構(gòu)成一個納什均衡;如果有唯一子博弈,則等同于納什均衡;如果存在其它子博弈,則有些納什均衡將不是。前例:兩個子博弈;(D,L)是精煉均衡,(U,R)不是。前例:房地產(chǎn)投資博弈論2009118精選ppt課件與納什均衡的本質(zhì)區(qū)別:納什均衡只要求均衡策略在均衡路徑(歷史)上的決策結(jié)上是最優(yōu)的;子博弈精煉納什均衡要求在非均衡路徑的決策結(jié)上也是最優(yōu)的。
博弈論2009119精選ppt課件4.逆向歸納法
基本思想
重復(fù)剔除劣策略方法的推廣。在均衡路徑,每一個局中人在每一個信息集上的選擇都是占優(yōu)選擇。適用于有限完美信息博弈不適用于無限博弈和不完美信息博弈。博弈論2009120精選ppt課件例:({U,U’},L)博弈論2009121精選ppt課件逆向歸納法的缺陷
在階段多時失去可靠性。例如:傳口令游戲
對意外事件的預(yù)測。Rosenthal19811
A1
2
A2
1
A3
2
A4
1
A5D1D2D3D4D5(1,0)(0,1)(3,0)(2,4)(6,3)(5,5)博弈論2009122精選ppt課件分析:逆向歸納法Di為最優(yōu)選擇;如果1非理性地選擇A1,則2如何選擇?大家均非理性會有雙贏結(jié)果,是否應(yīng)該冒險?博弈論2009123精選ppt課件5.承諾行動
commitment通過減少自己的選擇機會使自己受益。完全承諾與不完全承諾。例:破釜沉舟例:房地產(chǎn)案例
若B與某客戶已簽合同,如不能履約賠償3500萬,則B的{開發(fā),開發(fā)}成為可置信的威脅。子博弈精煉納什均衡為(不開發(fā),{開發(fā),開發(fā)})
博弈論2009124精選ppt課件例:要脅訴訟:原告P,被告D(1)原告決定是否對被告提出控告,成本為c>0;(2)如果決定控告,原告要求被告支付s>0私了;(3)被告決定是否接受原告的要求;(4)如果被告拒絕,原告決定放棄或是向法庭起訴,原告的起訴成本為p,被告的辯護成本為d;(5)如果案子到了法庭,原告以
概率贏得x單位的支付.博弈論2009125精選ppt課件提出s博弈論2009126精選ppt課件分析:原告指控條件:
x-p<0,即
x<p原告選擇:{不指控,要求,放棄}被告選擇:{拒絕}均衡:原告不指控博弈論2009127精選ppt課件原告承諾行動:指控前支付律師費,則
x-c-p>-c-p。最后選擇:起訴。私了賠償:私了賠償區(qū)域為s∈[
x,
x+d]。若討價還價能力相同,則賠償為s=
x+d/2。博弈論2009128精選ppt課件原告指控條件:原告總成本為c+p,指控條件為
x+d/2>c+p。被告越大,d越大,被指控可能性就越大。
被告承諾行動:指控前支付律師費y。被告節(jié)省成本
x+d/2-y,律師費y<
x+d/2“積淀成本”:局中人為承諾行動支付的成本。博弈論2009129精選ppt課件6.應(yīng)用實例(1)Stackelberg產(chǎn)量競爭模型
Stackelberg,1934,完美信息動態(tài)博弈。
Leader:q1≥0,follower:觀測到q1,選擇q2≥0
博弈論2009130精選ppt課件給定q1,企業(yè)2的問題是:
最優(yōu)化:企業(yè)1預(yù)測到S2(q1),企業(yè)1的問題是:
解:均衡:;均衡結(jié)果:博弈論2009131精選ppt課件比較分析:總產(chǎn)量:各企業(yè)產(chǎn)量及利潤:博弈論2009132精選ppt課件結(jié)論:先動優(yōu)勢—擁有信息優(yōu)勢使人處于劣勢(可以證明:價格競爭有后動優(yōu)勢)原因:q1先生產(chǎn)積淀成本若q1只是宣布,未真正實現(xiàn),則不構(gòu)成威脅,即是cournot模型。博弈論2009133精選ppt課件(2)工會與雇主間的博弈*
列昂惕夫模型Leontief1946博弈的順序:
工會首先選擇工資w;企業(yè)觀測到w后選擇就業(yè)水平L。(工會決定工資,企業(yè)決定就業(yè)水平。)
因此,這是個完美信息動態(tài)博弈。博弈論2009134精選ppt課件
設(shè)工會的效用函數(shù)為:U(w,L),
w-工資水平,L-就業(yè)水平,Uw>0,UL>0
設(shè)企業(yè)的利潤函數(shù)為:
假定R(L)是嚴(yán)格遞增的上凸函數(shù),即R’>0,R”<0
博弈論2009135精選ppt課件首先求解給定w的情況下,企業(yè)的就業(yè)需求。企業(yè)問題:最優(yōu)化的一階條件是:即邊際收益等于邊際成本。
∵邊際收益是遞減的,∴上述一階條件意味著企業(yè)對勞動的需求是工資的遞減函數(shù)(w↑,L↓)。博弈論2009136精選ppt課件工會預(yù)測到上述結(jié)果,工會在第一階段的問題是:最優(yōu)化的一階條件是:其中,是工會的邊際替代率;是企業(yè)勞動需求曲線的斜率。博弈論2009137精選ppt課件合同曲線工會的無差異曲線企業(yè)的等利潤曲線博弈論2009138精選ppt課件均衡:工會選擇工資水平使得自己的無差異曲線與企業(yè)的勞動需求曲線相切。子博弈精煉納什均衡結(jié)果是非帕累托最優(yōu)。帕累托最優(yōu)合同曲線:即企業(yè)等利潤曲線的斜率等于工會無差異曲線的斜率(相切)。博弈論2009139精選ppt課件模型改進:納什討價還價模型假定工會和企業(yè)之間就工資和就業(yè)水平同時進行磋商,如果雙方不能達成協(xié)議,工會的效用水平和企業(yè)的利潤水平都為零;如果雙方達成協(xié)議,工會的效用水平為U(w,L),企業(yè)的利潤為π(w,L)。納什討價還價問題:
博弈論2009140精選ppt課件最優(yōu)解的一階條件是:
整理得:
顯然,這個解是一個帕累托最優(yōu)合同。博弈論2009141精選ppt課件(3)討價還價模型
不存在耐心問題
例:兩人為買賣一物談判一個價格。買者B最高出價300元,賣者S不接受低于200元的開價。不存在耐心問題:輪次少,時間短,不存在時間價值。博弈論2009142精選ppt課件B博弈論2009143精選ppt課件特點:“后動優(yōu)勢”;“幾乎吃掉整個蛋糕”另:若由B開價,只進行一次,則(200+ε)元成交。決定因素:誰最后開價;開價輪次數(shù)。博弈論2009144精選ppt課件不耐心的情形例:100輪次。每輪要支付成本。博弈論2009145精選ppt課件耐心相同:50-50;耐心之比:利益之比博弈論2009146精選ppt課件一般模型
Rubinstein-Stahl討價還價模型
定理:給定S、B雙方,B第一次開價,次數(shù)無限,貼現(xiàn)因子0<δB<1,0<δS<1,當(dāng)拒絕與接受無所謂,認為接受,則存在唯一子博弈完美均衡。(貼現(xiàn)因子=1-耐心成本因子)B首輪開價博弈論2009147精選ppt課件注:若,則例:若δB=0.97,δS=0.94,
x*=(1-0.94)/(1-0.94
0.97)=0.674;若δB=δS=0.97x*=1/(1+0.97)=0.508結(jié)論:取決于兩個因素·
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 課程設(shè)計需要啥軟件
- 臨時員工勞動合同范本
- 零星工程維修合同模板
- 礦山開采工程承包合同
- 電子商務(wù)行業(yè)合同
- 農(nóng)業(yè)行業(yè)農(nóng)產(chǎn)品采購合同
- 電子商務(wù)平臺賣家與買家交易保障合同
- 智能家電產(chǎn)品定制生產(chǎn)合同
- 2024年人工智能技術(shù)研究與應(yīng)用合同
- 電子設(shè)備制造訂單合同
- 舞蹈表演專業(yè)人才需求調(diào)研報告
- GB/T 9978.5-2008建筑構(gòu)件耐火試驗方法第5部分:承重水平分隔構(gòu)件的特殊要求
- 上海紐約大學(xué)自主招生面試試題綜合素質(zhì)答案技巧
- 辦公家具項目實施方案、供貨方案
- 2022年物流服務(wù)師職業(yè)技能競賽理論題庫(含答案)
- ?;钒踩僮饕?guī)程
- 連鎖遺傳和遺傳作圖
- DB63∕T 1885-2020 青海省城鎮(zhèn)老舊小區(qū)綜合改造技術(shù)規(guī)程
- 高邊坡施工危險源辨識及分析
- 中海地產(chǎn)設(shè)計管理程序
- 簡譜視唱15942
評論
0/150
提交評論