博弈論教學(xué)講解課件1_第1頁(yè)
博弈論教學(xué)講解課件1_第2頁(yè)
博弈論教學(xué)講解課件1_第3頁(yè)
博弈論教學(xué)講解課件1_第4頁(yè)
博弈論教學(xué)講解課件1_第5頁(yè)
已閱讀5頁(yè),還剩72頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二十八章博弈論初步GameTheory第二十八章博弈論初步GameTheory博弈論博弈論是對(duì)策略互動(dòng)進(jìn)行一般分析的理論。博弈論的英文名稱為gametheory,是研究決策主體的行為發(fā)生直接相互作用的失衡的決策以及這種決策的均衡問題的。博弈論博弈論是對(duì)策略互動(dòng)進(jìn)行一般分析的理論。博弈論的應(yīng)用經(jīng)濟(jì)學(xué):市場(chǎng)往往是不完全的,參與者的行為相互影響,因此,個(gè)人決策時(shí)必須考慮到對(duì)方的反應(yīng)寡頭壟斷卡特爾外部性軍事和政治策略博弈論的應(yīng)用經(jīng)濟(jì)學(xué):市場(chǎng)往往是不完全的,參與者的行為相互影響1994年,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位博弈論專家:納什、澤爾滕和海薩尼。納什,50年代研究非合作博弈澤爾滕,60年代研究動(dòng)態(tài)博弈,提出“精煉納什均衡”概念海薩尼,60年代末將不完全信息引入博弈論的研究。1994年,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位博弈論專家:納什、澤爾滕和一次博弈包含哪些組成部分?一些參與者(players)每一個(gè)參與者的可能策略

(strategies)每個(gè)參與者的每一種可能的策略選擇的收益(payoffs)一次博弈包含哪些組成部分?一些參與者(players)雙人博弈只有兩個(gè)參與者兩個(gè)參與者,兩種策略,四種收益組合雙人博弈只有兩個(gè)參與者雙人博弈舉例參與者A和BA有兩種策略“上”或“下”B的兩種策略為“左”或“右”表格中顯示的是給參與者帶來的四種可能的策略組合的收益,即博弈的收益矩陣(payoffmatrix)。雙人博弈舉例參與者A和B收益矩陣BA收益組合中第一項(xiàng)是A的收益,第二項(xiàng)是B的收益。LRUD(3,9)(0,0)(1,8)(2,1)收益矩陣BA收益組合中第一項(xiàng)是A的收益,第二項(xiàng)是B的收益例如A選擇Up,B選擇Right,那么A的收益是1,B的收益是8。BALRUD(3,9)(0,0)(1,8)(2,1)收益矩陣?yán)鏏選擇Up,B選擇Right,那么A的收益是1PlayerBPlayerALRUD(3,9)(0,0)(1,8)(2,1)收益矩陣而當(dāng)A選擇Down

B選擇Right,那么A的收益是2,B的收益是1。PlayerBPlayerALRUD(3,9)(0,0)PlayerBPlayerA一次博弈對(duì)應(yīng)一個(gè)策略組合例如(U,R),在此第一個(gè)元素是參與者A選擇的策略,第二個(gè)元素是參與者B選擇的策略。LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA一次博弈對(duì)應(yīng)一個(gè)策略組合例如博弈的可能結(jié)果是什么呢?PlayerBPlayerALRUD(3,9)(0,0)(1,8)(2,1)博弈的可能結(jié)果是什么呢?PlayerBPlayerALRPlayerBPlayerA如果B選擇Right,那么A的最優(yōu)反應(yīng)是選擇Down。因?yàn)檫@將使得A的收益從1增加到2。因此(U,R)不是可能的博弈結(jié)果。(U,R)是可能的博弈結(jié)果嗎?LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA如果B選擇Right,那么APlayerBPlayerA如果B選擇Right,A的最優(yōu)反應(yīng)就是選擇Down。如果A選擇Down,B的最優(yōu)選擇就是Right。因此(D,R)是可能的博弈結(jié)果。(D,R)是可能的博弈結(jié)果嗎?LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA如果B選擇Right,A的最PlayerBPlayerA如果A選擇Down,B的最優(yōu)選擇是Right,

因此(D,L)不是可能的博弈結(jié)果。(D,L)是可能的博弈結(jié)果嗎?LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA如果A選擇Down,B的最PlayerBPlayerA如果A選擇Up那么B的最優(yōu)反應(yīng)是Left。如果B選擇Left那么A的最優(yōu)反應(yīng)是Up。因此(U,L)是可能的博弈結(jié)果。(U,L)是可能的博弈結(jié)果嗎?LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA如果A選擇Up那么B的納什均衡如果存在一個(gè)策略組合,其中每一個(gè)參與者的選擇都是他的最優(yōu)選擇,此時(shí)的策略組合就是一個(gè)納什均衡(Nashequilibrium)組合。我們的例子中有兩個(gè)納什均衡策略組合(U,L)和(D,R)。納什均衡如果存在一個(gè)策略組合,其中每一個(gè)參與者的選擇都是他的例子PlayerBPlayerA(U,L)、(D,R)都是博弈的納什均衡策略。但是哪一個(gè)才是最終的解呢?注意:對(duì)于參與雙方而言(U,L)優(yōu)于(D,R)。那么(U,L)是否是唯一的均衡解呢?LRUD(3,9)(0,0)(1,8)(2,1)例子PlayerBPlayerA(U,L)、(D,R囚徒困境

ThePrisoner’sDilemma我們可以考慮著名的囚徒困境模型來檢驗(yàn)最可能的博弈結(jié)果是否一定是帕累托有效的結(jié)果。囚徒困境

ThePrisoner’sDilemma我們可可能的博弈結(jié)果如何?ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC可能的博弈結(jié)果如何?ClydeBonnie(-5,-5)(-如果Bonnie選擇沉默,Clyde的最優(yōu)反應(yīng)是坦白。如果Bonnie選擇坦白,Clyde的最優(yōu)反應(yīng)還是坦白。ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC如果Bonnie選擇沉默,Clyde的最優(yōu)反應(yīng)是坦白。Cly無(wú)論Bonnie采取何種行動(dòng),Clyde的最優(yōu)選擇都是坦白。因此,坦白是Clyde的占優(yōu)策略(dominantstrategy)。ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC無(wú)論Bonnie采取何種行動(dòng),Clyde的最優(yōu)選擇都是坦白。同樣的,無(wú)論Clyde采取那種行動(dòng),Bonnie的最優(yōu)反應(yīng)都是坦白。坦白也是Bonnie的占優(yōu)策略(dominantstrategy)。ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC同樣的,無(wú)論Clyde采取那種行動(dòng),BonnieClydeB唯一的納什均衡組合是(C,C),盡管對(duì)于雙方而言(S,S)能夠帶來更多的收益。所以,唯一的納什均衡解不是最優(yōu)解。ClydeBonnie(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC唯一的納什均衡組合是(C,C),盡管對(duì)于ClydeBonni誰(shuí)先選擇?在前面的兩個(gè)例子中,參與者都是同時(shí)采取行動(dòng)的。這種博弈稱為同時(shí)博弈

(simultaneousplaygames).誰(shuí)先選擇?在前面的兩個(gè)例子中,參與者都是同時(shí)采取行動(dòng)的。但是某些博弈是某個(gè)參與者首先采取行動(dòng),其他參與者后采取行動(dòng)。這類博弈稱為序貫博弈(sequentialplaygames)。首先行動(dòng)的參與者是領(lǐng)導(dǎo)者,第二個(gè)行動(dòng)的參與者是跟隨者。但是某些博弈是某個(gè)參與者首先采取行動(dòng),其他參與者后采取行動(dòng)。序貫博弈舉例有時(shí)博弈不止一個(gè)納什均衡結(jié)果,此時(shí)很難看出哪一種結(jié)果可能發(fā)生。此時(shí)如果博弈行動(dòng)有先后,那么我們就有可能判斷出哪一種結(jié)果更可能出現(xiàn)。序貫博弈舉例有時(shí)博弈不止一個(gè)納什均衡結(jié)果,此時(shí)很難看出哪一種PlayerBPlayerA當(dāng)同時(shí)行動(dòng)時(shí),(U,L)、(D,R)都是納什均衡的策略組合,我們無(wú)法判斷哪一種組合結(jié)果出現(xiàn)的可能性更大。LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA當(dāng)同時(shí)行動(dòng)時(shí),(U,L)、PlayerBPlayerA假如此時(shí)博弈行為是有先后的,例如A先行動(dòng),B跟隨其后行動(dòng),那么我們可以用擴(kuò)展形式(extensiveform)(廣延型博弈)重新描述博弈。LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA假如此時(shí)博弈行為是有先后的,廣延型博弈舉例:完美信息UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA先行動(dòng)。

B后行動(dòng)。廣延型博弈舉例:完美信息UDLLRR(3,9)(1,8)(0UDLLRR(3,9)(1,8)(0,0)(2,1)ABB當(dāng)A選U時(shí),B一定選L,(U,L)是一個(gè)納什均衡策略。首先觀察B的決策廣延型博弈解法:反向歸納法UDLLRR(3,9)(1,8)(0,0)(2,1)ABB當(dāng)UDLLRR(3,9)(1,8)(0,0)(2,1)ABB(U,L)是一個(gè)納什均衡策略組合。(D,R)也是一個(gè)納什均衡策略組合。哪一個(gè)是可能的結(jié)果?首先觀察B的決策UDLLRR(3,9)(1,8)(0,0)(2,1)ABB(UDLLRR(3,9)(1,8)(0,0)(2,1)ABB如果A選擇U,B選擇L;A得到3。如果A選擇D,B選擇R;A得到2。然后觀察A的決策UDLLRR(3,9)(1,8)(0,0)(2,1)ABB如UDLLRR(3,9)(1,8)(0,0)(2,1)ABB因此(U,L)是可能的納什均衡結(jié)果。如果A選擇U,B選擇L;A得到3。如果A選擇D,B選擇R;A得到2。UDLLRR(3,9)(1,8)(0,0)(2,1)ABB因威脅進(jìn)入不進(jìn)入斗爭(zhēng)不斗爭(zhēng)(0,0)(2,1)(1,9)(1,9)進(jìn)入者在位者在位者A先行動(dòng)。

B后行動(dòng)。斗爭(zhēng)不斗爭(zhēng)策略(進(jìn)入,不斗爭(zhēng))是合理的。但此時(shí)原先的在位者只能得到1。他該怎么辦?威脅進(jìn)入不進(jìn)入斗爭(zhēng)不斗爭(zhēng)(0,0)(2,1)(1,9)(1,威脅進(jìn)入不進(jìn)入斗爭(zhēng)不斗爭(zhēng)(0,0)(2,1)(1,9)(1,9)進(jìn)入者在位者在位者A先行動(dòng)。

B后行動(dòng)。斗爭(zhēng)不斗爭(zhēng)威脅進(jìn)入者,只要你進(jìn)入,我一定斗爭(zhēng)。但是,顯然不是一個(gè)可信的威脅。威脅進(jìn)入不進(jìn)入斗爭(zhēng)不斗爭(zhēng)(0,0)(2,1)(1,9)(1,遏制進(jìn)入的博弈:可信的威脅進(jìn)入不進(jìn)入斗爭(zhēng)不斗爭(zhēng)(0,2)(2,1)(1,9)(1,9)進(jìn)入者在位者在位者A先行動(dòng)。

B后行動(dòng)。斗爭(zhēng)不斗爭(zhēng)如果存在備用的生產(chǎn)能力,一旦使用,可以降低生產(chǎn)成本,那么威脅變得可信。遏制進(jìn)入的博弈:可信的威脅進(jìn)入不進(jìn)入斗爭(zhēng)不斗爭(zhēng)(0,2)(2純策略(PureStrategies)PlayerBPlayerA再次回到我們同時(shí)博弈的初始模型。此時(shí)存在兩個(gè)納什均衡結(jié)果——(U,L)和(D,R)。LRUD(3,9)(0,0)(1,8)(2,1)純策略(PureStrategies)PlayerBPlPlayerBPlayerAA要么選擇U要么選擇D,不能選擇兩者的組合。U和D是A的純策略(purestrategies)。LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerAA要么選擇U要么選擇D,不能PlayerBPlayerA同樣的,L和R是B的純策略。LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA同樣的,L和R是B的純策略。PlayerBPlayerA因而,(U,L)和(D,R)是純策略的納什均衡(pure

strategyNashequilibrium)。是否每種博弈必定存在至少一個(gè)純策略的納什均衡呢?LRUD(3,9)(0,0)(1,8)(2,1)PlayerBPlayerA因而,(U,L)和(D,PlayerBPlayerA這個(gè)新的博弈模型是否存在純策略的納什均衡呢?(1,2)(0,4)(0,5)(3,2)UDLRPlayerBPlayerA這個(gè)新的博弈模型是否存在純策PlayerBA(U,L)是納什均衡組合嗎?不是。(U,R)是納什均衡組合嗎?不是。

(D,L)是納什均衡組合嗎?不是。

(D,R)是納什均衡組合嗎?不是。(1,2)(0,4)(0,5)(3,2)UDLRPlayerBA(U,L)是納什均衡組合嗎?(1,2)(0PlayerBPlayerA因此該博弈在純策略中不存在納什均衡結(jié)果。盡管如此,如果是混合策略(mixedstrategies),就會(huì)有納什均衡結(jié)果了。(1,2)(0,4)(0,5)(3,2)UDLRPlayerBPlayerA因此該博弈在純策略中不存在納混合策略

MixedStrategies和A要么選Up要么選Down不同,此時(shí)A可以在一種概率分布狀態(tài)(pU,1-pU)下進(jìn)行選擇。意味著A可以以pU的概率選擇Up,以及以1-pU

的概率選擇Down。概率分布(pU,1-pU)是A的混合策略?;旌喜呗?/p>

MixedStrategies和A要么選Up要么同樣的,B可以在一種概率分布狀態(tài)(pL,1-pL)下進(jìn)行選擇。意味著B可以以pL的概率選擇Left,以及以1-pL

的概率選擇Right。概率分布(pL,1-pL)是B的混合策略。同樣的,B可以在一種概率分布狀態(tài)PlayerA(1,2)(0,4)(0,5)(3,2)UDLRPlayerB該純策略博弈中不存在納什均衡結(jié)果。但如果是混合策略(mixedstrategies),就會(huì)有納什均衡結(jié)果了。

如何計(jì)算?PlayerA(1,2)(0,4)(0,5)(3,2)UDPlayerA(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBPlayerA(1,2)(0,4)(0,5)(3,2)U,PlayerA如果B選擇Left,她的預(yù)期收益是(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBPlayerA如果B選擇Left,她的預(yù)期收益是(1,PlayerA(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerB如果B選擇Left,她的預(yù)期收益是如果B選擇Right,她的預(yù)期收益是PlayerA(1,2)(0,4)(0,5)(3,2)U,PlayerA當(dāng)時(shí),B只可能選擇Left。但是B選Left不存在納什均衡組合。(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBPlayerA當(dāng)PlayerA(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerB當(dāng)時(shí),B只可能選擇Right。但是B選Right不存在納什均衡組合。PlayerA(1,2)(0,4)(0,5)(3,2)U,PlayerA因此無(wú)論B如何行動(dòng)都不存在納什均衡結(jié)果,B在選Left和Right之間無(wú)差異;即(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBPlayerA因此無(wú)論B如何行動(dòng)都不存在納什均衡結(jié)果,BPlayerA因此無(wú)論B如何行動(dòng)都不存在納什均衡結(jié)果,B在選Left和Right之間無(wú)差異;即(1,2)(0,4)(0,5)(3,2)U,pUD,1-pUL,pLR,1-pLPlayerBPlayerA因此無(wú)論B如何行動(dòng)都不存在納什均衡結(jié)果,BPlayerA(1,2)(0,4)(0,5)(3,2)U,D,L,pLR,1-pLPlayerB因此無(wú)論B如何行動(dòng)都不存在納什均衡結(jié)果,B在選Left和Right之間無(wú)差異;即PlayerA(1,2)(0,4)(0,5)(3,2)U,PlayerA(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerBPlayerA(1,2)(0,4)(0,5)(3,2)L,PlayerA如果A選擇Up,他的預(yù)期收益是(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerBPlayerA如果A選擇Up,他的預(yù)期收益是(1,2)(0PlayerA(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerB如果A選擇Up,他的預(yù)期收益是如果A選擇Down,他的預(yù)期收益是PlayerA(1,2)(0,4)(0,5)(3,2)L,PlayerA當(dāng),時(shí),A將只選擇Up。但是,如果僅選up將不存在納什均衡組合。(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerBPlayerA當(dāng),PlayerA(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerB當(dāng),時(shí),A將只選擇Down。但是,此時(shí)也不存在納什均衡組合。PlayerA(1,2)(0,4)(0,5)(3,2)L,PlayerA因此,此時(shí)不存在納什均衡組合,A對(duì)于選擇Up或者Down無(wú)差異,即(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerBPlayerA因此,此時(shí)不存在納什均衡組合,A對(duì)于選擇UpPlayerA(1,2)(0,4)(0,5)(3,2)L,pLR,1-pLU,D,PlayerB因此,此時(shí)不存在納什均衡組合,A對(duì)于選擇Up或者Down無(wú)差異,即PlayerA(1,2)(0,4)(0,5)(3,2)L,PlayerA(1,2)(0,4)(0,5)(3,2)L,R,U,D,PlayerB因此,此時(shí)不存在納什均衡組合,A對(duì)于選擇Up或者Down無(wú)差異,即PlayerA(1,2)(0,4)(0,5)(3,2)L,PlayerBPlayerA所以當(dāng)A選擇混合策略(3/5,2/5),B選擇混合策略(3/4,1/4)時(shí),該博弈存在納什均衡結(jié)果。(1,2)(0,4)(0,5)(3,2)U,D,L,R,PlayerBPlayerA所以當(dāng)A選擇混合策略(3/5PlayerBPlayerA獲得收益組合(1,2)的概率是(1,2)(0,4)(0,5)(3,2)U,D,L,R,9/20PlayerBPlayerA獲得收益組合(1,2)的概率PlayerBPlayerA獲得收益組合(0,4)的概率是(0,4)(0,5)(3,2)U,D,L,R,(1,2)9/203/20PlayerBPlayerA獲得收益組合(0,4)的PlayerBPlayerA獲得收益組合(0,5)的概率是(0,4)(0,5)U,D,L,R,(1,2)9/203/206/20(3,2)PlayerBPlayerA獲得收益組合(0,5)的概率PlayerBPlayerA獲得收益組合(3,2)的概率是(0,4)U,D,L,R,(1,2)9/203/20(0,5)(3,2)6/202/20PlayerBPlayerA獲得收益組合(3,2)的概率PlayerBPlayerA(0,4)U,D,L,R,(1,2)9/203/20(0,5)(3,2)6/202/20PlayerBPlayerA(0,4)U,D,L,R,(PlayerBPlayerAA預(yù)期的納什均衡收益為:(0,4)U,D,L,R,(1,2)9/203/20(0,5)(3,2)6/202/20PlayerBPlayer

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論