混合策略納什均衡 課件_第1頁
混合策略納什均衡 課件_第2頁
混合策略納什均衡 課件_第3頁
混合策略納什均衡 課件_第4頁
混合策略納什均衡 課件_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二章完全信息靜態(tài)信息博弈-納什均衡一博弈的基本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復(fù)剔除的占優(yōu)均衡四納什均衡五混合戰(zhàn)略納什均衡六納什均衡存在性及相關(guān)討論第二章完全信息靜態(tài)信息博弈-納什均衡一博弈的基本概念及戰(zhàn)1五混合策略納什均衡混合策略與期望支付計算混合策略納什均衡的三種方法支付最大值法支付等值法反應(yīng)函數(shù)法多重納什均衡及其甄別混合博弈在現(xiàn)實經(jīng)濟(jì)中的運(yùn)用案例五混合策略納什均衡混合策略與期望支付2五混合策略納什均衡純策略(purestrategies):如果一個策略規(guī)定參與人在一個給定的信息情況下只選擇一種特定的行動?;旌喜呗?mixedstrategies):如果一個策略規(guī)定參與人在給定的信息情況下,以某種概率分布隨機(jī)地選擇不同的行動。在靜態(tài)博弈里,純策略等價于特定的行動,混合策略是不同行動之間的隨機(jī)選擇。五混合策略納什均衡純策略(purestrategies)3§期望支付與混合策略(mixedstrategies)相伴隨的一個問題,是局中人支付的不確定性(uncertainty).可用期望支付(expectedpayoff)來描述——有個n可能的取值X1,X2…,Xn,并且這些取值發(fā)生的概率分別為p1,p2,…,pn,那么我們可以將這個數(shù)量指標(biāo)的期望值定義為發(fā)生概率作為權(quán)重的所有可能取值的加權(quán)平均,也就是§期望支付與混合策略(mixedstrategies4政府和流浪漢的博弈政府想幫助流浪漢,但前提是后者必須試圖尋找工作,否則,不予幫助;而流浪漢若知道政府采用救濟(jì)策略的話,他就不會尋找工作。他們只有在得不到政府救濟(jì)時才會尋找工作。他們獲得的支付如圖所示:(3,2)(-1,3)(-1,1)(0,0)流浪漢尋找工作游閑政府救濟(jì)不救濟(jì)政府和流浪漢的博弈政府想幫助流浪漢,但前提是后者必須試圖尋找5思考:政府會采用純策略嗎?流浪漢呢?這個博弈有沒有純策略的納什均衡?那么政府和流浪漢最有可能采用什么策略?——使自己的預(yù)期支付最大化?!裟軌虿碌膶Ψ降牟呗?,就可以采用針對性的策略,使自己的支付增加。政府和流浪漢的博弈思考:政府會采用純策略嗎?流浪漢呢?這個博弈有沒有純策略的納6求解混合策略納什均衡1、假定政府采用混合策略:2、流浪漢的混合策略為:求解混合策略納什均衡1、假定政府采用混合策略:2、流浪漢的混7解一:支付最大化政府的期望效用函數(shù)為:流浪漢找工作游蕩0,0-1,1-1,33,2政府救濟(jì)不救濟(jì)假設(shè)政府救濟(jì)的概率為;流浪漢找工作的概率為;則解一:支付最大化政府的期望效用函數(shù)為:流浪漢0,0-18對上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件為:就是說,從政府的最優(yōu)化條件找到流浪漢混合策略——流浪漢以0.2的概率選擇尋找工作,0.8的概率選擇游閑。解一:支付最大化對上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件為:9解一:支付最大化流浪漢找工作游蕩0,0-1,1-1,33,2政府救濟(jì)不救濟(jì)假設(shè)政府救濟(jì)的概率為;流浪漢找工作的概率為;則流浪漢的期望效用函數(shù)為:解一:支付最大化流浪漢0,0-1,1-1,3310流浪漢的期望效用函數(shù)為:解一:支付最大化流浪漢的期望效用函數(shù)為:解一:支付最大化11解二:支付等值法政府選擇救濟(jì)策略政府選擇不救濟(jì)策略如果一個混合策略是流浪漢的最優(yōu)選擇,那一定意味著政府在救濟(jì)與不救濟(jì)之間是無差異的,即:解二:支付等值法政府選擇救濟(jì)策略政府選擇不救濟(jì)策略如果一12解二:支付等值法

如果一個混合策略是政府的最優(yōu)選擇,那一定意味著流浪漢在尋找工作與游閑之間是無差異的,即:流浪漢找工作游蕩0,0-1,1-1,33,2政府救濟(jì)不救濟(jì)解二:支付等值法如果一個混合策略是政府的最優(yōu)選擇,那13如果政府救濟(jì)的概率小于0.5;則流浪漢的最優(yōu)選擇是尋找工作;如果政府救濟(jì)的概率大于0.5;則流浪漢的最優(yōu)選擇是游閑等待救濟(jì)。如果政府救濟(jì)的概率正好等于0.5;流浪漢的選擇無差異。政府和流浪漢的博弈如果政府救濟(jì)的概率小于0.5;政府和流浪漢的博弈14討論上面的均衡要求每個參與人以特定的概率選擇純策略。也就是說,一個參與人選擇不同策略的概率不是由他自己的支付決定的,而是由他的對手的支付決定的。正是由于這個原因,許多人認(rèn)為混合策略納什均衡是一個難以令人滿意的概念。事實上,正是因為它在幾個(或全部)策略之間是無差異的,他的行為才難以預(yù)測,混合策略納什均衡才會存在。討論上面的均衡要求每個參與人以特定的概率選擇純策略。也就是15討論盡管混合策略不像純策略那樣直觀,但它確實是一些博弈中參與人的合理行為方式。撲克比賽、壘球比賽、劃拳就是這樣的例子,在這一類博弈中,參與比賽的總是隨機(jī)行動以使自己的行為不被對方所預(yù)測。經(jīng)濟(jì)學(xué)上的監(jiān)督博弈也是這樣一個例子。如稅收檢查、質(zhì)量檢查、懲治犯罪、雇主監(jiān)督雇員等都可以看成猜謎博弈。討論盡管混合策略不像純策略那樣直觀,但它確實是一些博弈中參16§撲克牌對色游戲AB玩撲克牌對色游戲,每人都有紅黑兩張撲克牌,約定如果出牌顏色一樣,A輸B贏,如果出牌顏色不一樣,則A贏B輸。找到這個博弈的納什均衡。-1,11,-11,-1-1,1紅黑BA紅黑§撲克牌對色游戲AB玩撲克牌對色游戲,每人都有紅黑兩張撲克牌17例撲克牌對色游戲B紅黑-1,11,-11,-1-1,1A紅黑假設(shè)A出紅牌的概率為;B出紅牌的概率為;則因此A的最佳反應(yīng)函數(shù)為例撲克牌對色游戲B-1,11,-11,-1-18因此B的最佳反應(yīng)函數(shù)為同理納什均衡是:A和B出紅牌還是出黑牌的概率都是1/2.反應(yīng)函數(shù)法因此B的最佳反應(yīng)函數(shù)為同理納什均衡是:A和B出紅牌還是出黑牌19練習(xí)1:利用反應(yīng)函數(shù)法找出政府與流浪漢博弈的納什均衡流浪漢找工作游蕩0,0-1,1-1,33,2政府救濟(jì)不救濟(jì)假設(shè)政府救濟(jì)的概率為;流浪漢找工作的概率為;則練習(xí)1:利用反應(yīng)函數(shù)法找出政府與流浪漢博弈的納什均衡流浪漢020納什均衡是:政府以1/2的概率選擇救助,流浪漢以1/5的概率選擇找工作。練習(xí)2:利用反應(yīng)函數(shù)法找出情侶博弈的所有納什均衡麗娟足球芭蕾1,20,00,02,1大海足球芭蕾納什均衡是:政府以1/2的概率選擇救助,流浪漢以1/5的概率21激勵的悖論一小偷欲偷有守衛(wèi)看守的倉庫,若小偷去偷時守衛(wèi)睡覺(不負(fù)責(zé)),則小偷偷竊成功(令其價值是V),若守衛(wèi)沒有睡覺(盡職盡責(zé)),則小偷會被抓住坐牢(設(shè)其效用為-A);再假設(shè)守衛(wèi)睡覺而未被偷的效用為S,守衛(wèi)睡覺而被偷則被解雇,其效用為-D。寫出得益矩陣,并分析如果想減少小偷偷東西的現(xiàn)象發(fā)生,如何做效果更好?激勵的悖論一小偷欲偷有守衛(wèi)看守的倉庫,若小偷去偷時守衛(wèi)睡覺(22小偷與守衛(wèi)博弈小偷守衛(wèi)偷p不偷1-p睡q小睡1-qV,-D-A,00,S0,0激勵的悖論小偷與守衛(wèi)博弈守衛(wèi)偷p不偷1-p睡q小睡1-qV,-D-A,23用支付最大化值求出:激勵的悖論用支付最大化值求出:激勵的悖論24用支付最大化值求出:當(dāng)加大對小偷的處罰,守衛(wèi)偷懶的概率會增加當(dāng)加大對守衛(wèi)的處罰,小偷偷東西的概率會減小激勵的悖論用支付最大化值求出:當(dāng)加大對小偷的處罰,守衛(wèi)偷懶的概率會增加25激勵的悖論從道理上講,小偷偷東西是一種犯罪行為,而守恒不負(fù)責(zé)僅是失職行為;從性質(zhì)上講,犯罪的性質(zhì)比失職的性質(zhì)嚴(yán)重得多,理所當(dāng)然應(yīng)該加重對小偷的處罰,但從上面的分析可看出,為了減少偷竊的現(xiàn)象,反而是加重對守衛(wèi)處罰效果更好.這就是激勵的悖論!在社會經(jīng)濟(jì)現(xiàn)象中,存在著許多激勵的悖論的現(xiàn)象,如為了減少考試作弊的現(xiàn)象,應(yīng)加大對監(jiān)考人員失職的處罰其效果更好等等.激勵的悖論對我們制定政策和規(guī)章制度時帶來了有益的思考.激勵的悖論從道理上講,小偷偷東西是一種犯罪行為,而守恒不負(fù)責(zé)26練習(xí):混合策略的納什均衡

下面的博弈是否存在純策略的納什均衡,如果沒有采用混合策略納什均衡分析。試用支付最大化法和支付等值法兩種方法算一算混合策略的納什均衡是多少?通過反應(yīng)曲線,求得混合策略的納什均衡.2,35,23,11,5CDAB博弈方2博弈方1練習(xí):混合策略的納什均衡下面的博弈是否存在純策略的納什27對于博弈方1采用的混合策略,博弈方2的支付無差異對于博弈方2采用的混合策略,博弈方1的支付無差異策略得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6解出PA=0.8,PB=0.2;PC=0.8,PD=0.2對于博弈方1采用的混合策略,博弈方2的支付無差異對于博弈方228不同均衡概念的關(guān)系占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純戰(zhàn)略納什均衡PNE混合戰(zhàn)略納什均衡MNE不同均衡概念的關(guān)系占優(yōu)均衡重復(fù)剔除占優(yōu)均衡純戰(zhàn)略納什均衡混合29監(jiān)督博弈的納稅檢查A為應(yīng)納稅款,C為檢查成本,F(xiàn)是偷稅罰款。假定C<A+F。不存在純戰(zhàn)略納什均衡。請問:如何才能降低納稅人逃稅的可能性A-C+F,-A-FA-C,-A0,0A,-A稅收機(jī)關(guān)檢查不檢查

納稅人逃稅不逃稅課后作業(yè):以“監(jiān)督博弈”為關(guān)鍵詞在學(xué)術(shù)期刊網(wǎng)上查找文獻(xiàn),瀏覽至少三篇論文并精讀一篇,寫下筆記。監(jiān)督博弈的納稅檢查A為應(yīng)納稅款,C為檢查成本,F(xiàn)是偷稅罰30夫妻之爭的混合策略納什均衡看看這個博弈有幾個均衡?2,10,00,01,3時裝足球時裝足球丈夫妻子夫妻之爭夫妻之爭的混合策略納什均衡看看這個博弈有幾個均衡?2,1031存在兩個純策略均衡2,10,00,01,3時裝足球時裝足球丈夫妻子夫妻之爭存在兩個純策略均衡2,10,00,01,3時裝足32還存在混合策略納什均衡2,10,00,01,3時裝C足球F時裝C足球F丈夫妻子夫妻之爭妻子的混合策略丈夫的混合策略夫妻之爭博弈的混合策略納什均衡策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.75還存在混合策略納什均衡2,10,00,01,3時裝33§多重納什均衡及其甄別帕累托優(yōu)勢標(biāo)準(zhǔn)風(fēng)險優(yōu)勢標(biāo)準(zhǔn)帕累托優(yōu)勢標(biāo)準(zhǔn)和風(fēng)險優(yōu)勢標(biāo)準(zhǔn)聚點均衡相關(guān)均衡抗共謀均衡§多重納什均衡及其甄別34看看這個博弈有幾個純策略納什均衡?-5,-5-10,88,-1010,10戰(zhàn)爭和平國家2戰(zhàn)爭和平國家1戰(zhàn)爭與和平博弈帕累托優(yōu)勢標(biāo)準(zhǔn)看看這個博弈有幾個純策略納什均衡?-5,-5-10,8835帕累托優(yōu)勢標(biāo)準(zhǔn)這個博弈中有兩個純策略納什均衡,(戰(zhàn)爭,戰(zhàn)爭)和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個按帕累托優(yōu)勢標(biāo)準(zhǔn)篩選出來的納什均衡。-5,-5-10,88,-1010,10戰(zhàn)爭和平國家2戰(zhàn)爭和平國家1戰(zhàn)爭與和平博弈帕累托優(yōu)勢標(biāo)準(zhǔn)-5,-5-10,88,-1010,136風(fēng)險優(yōu)勢標(biāo)準(zhǔn)若考慮到或者說是顧忌到其他博弈方可能發(fā)生錯誤的原因,帕累托上策均衡并不一定是最優(yōu)選擇,還需要比較風(fēng)險優(yōu)勢。下面就是兩個例子。9,98,00,87,7LR博弈方2UD博弈方1風(fēng)險上策均衡(D,R)風(fēng)險優(yōu)勢標(biāo)準(zhǔn)若考慮到或者說是顧忌到其他博弈方可能發(fā)生錯誤的原37風(fēng)險優(yōu)勢標(biāo)準(zhǔn)從風(fēng)險優(yōu)勢標(biāo)準(zhǔn)衡量,帕累托上策均衡(鹿,鹿)并是最優(yōu)選擇,因為一旦對手方犯了錯誤,暈了頭,選擇了兔的策略時,你的支付就會由5變成0!你會選擇這么高風(fēng)險的策略嗎?而(兔,兔)的策略組合,當(dāng)對手方犯了錯誤,暈了頭,選擇了鹿的策略時,你的支付還是3,并沒有損失!5,53,00,33,3鹿兔獵人2鹿兔獵人1獵鹿博弈風(fēng)險優(yōu)勢標(biāo)準(zhǔn)從風(fēng)險優(yōu)勢標(biāo)準(zhǔn)衡量,帕累托上策均衡(鹿,鹿)并是38聚點均衡聚點均衡是利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡。文化、習(xí)慣、心理或者其他各種特征都可能是聚點均衡的依據(jù)。城市博弈(城市分組相同)、時間博弈(報出相同的時間)是聚點均衡的典型例子。聚點均衡聚點均衡是利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡。文39城市博弈:聚點均衡的例子游戲:請兩個同學(xué)上來將四個城市進(jìn)行分組,分成兩組,每組兩個城市。如果分組方法相同,則每人平時分加5分。城市博弈:聚點均衡的例子游戲:請兩個同學(xué)上來將四個城市進(jìn)行分40城市博弈:聚點均衡的例子這四個城市是:上海、長春、哈爾濱、南京城市博弈:聚點均衡的例子這四個城市是:41相關(guān)均衡5,14,40,01,5LR博弈方2UD博弈方1相關(guān)均衡例子三個納什均衡:無論是純策略的納什均衡(U,L)、(D,R);混合策略的納什均衡(1/2,1/2),結(jié)果都不理想,不如(U,L)、(D,R)、(D,L)。利用聚點均衡(天氣,拋硬幣),但仍不理想。相關(guān)均衡5,14,40,01,5LR博弈方2U42相關(guān)均衡相關(guān)裝置:1、各1/3概率A、B、C2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1見A采用U,否則D;博弈方2見C采用R,否則L。相關(guān)均衡要點:1、構(gòu)成納什均衡2、有人忽略不會造成問題相關(guān)均衡相關(guān)裝置:相關(guān)均衡要點:43一、多人博弈中的共謀問題這個博弈純策略的納什均衡是什么?0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方2博弈方1博弈方3——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方2博弈方1博弈方3——B共謀和抗共謀均衡一、多人博弈中的共謀問題0,0,10-5,-5,0-5,-544本博弈的純策略納什均衡:(U,L,A)、(D,R,B)前者帕累托優(yōu)于后者。博弈的結(jié)果會是什么呢?(U,L,A)有共謀(Coalition)問題:博弈方1和2同時偏離。0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方2博弈方1博弈方3——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方2博弈方1博弈方3——B共謀和抗共謀均衡0,0,10-5,-5,0-5,-5,01,1,-5LRUD45博弈的結(jié)果會是什么呢?(U,L,A)有共謀(Coalition)問題:博弈方1和2同時偏離。(D,R,B)是防共謀均衡!0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方2博弈方1博弈方3——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方2博弈方1博弈方3——B共謀和抗共謀均衡0,0,10-5,-5,0-5,-5,01,1,-5LRUD46防共謀均衡

如果一個博弈的某個策略組合滿足下列要求,稱為“防共謀均衡”:(1)沒有任何單個博弈方的“串通”會改變博弈的結(jié)果,即單獨改變策略無利可圖;(2)給定選擇偏離的博弈方有再次偏離的自由時,沒有任何兩個博弈方的串通會改變博弈的結(jié)果;(3)依此類推,直到所有博弈方都參加的串通也不會改變博弈的結(jié)果。

前面例子中:(D,R,B)是防共謀均衡(U,L,A)不是防共謀均衡防共謀均衡47一點說明存在博弈的納什均衡,并意味參與者一定不拒絕這種納什均衡。一點說明存在博弈的納什均衡,并意味參與者一定不拒絕這種納什均48第二章完全信息靜態(tài)信息博弈-納什均衡一博弈的基本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復(fù)剔除的占優(yōu)均衡四納什均衡五混合戰(zhàn)略納什均衡六納什均衡存在性及相關(guān)討論第二章完全信息靜態(tài)信息博弈-納什均衡一博弈的基本概念及戰(zhàn)49五混合策略納什均衡混合策略與期望支付計算混合策略納什均衡的三種方法支付最大值法支付等值法反應(yīng)函數(shù)法多重納什均衡及其甄別混合博弈在現(xiàn)實經(jīng)濟(jì)中的運(yùn)用案例五混合策略納什均衡混合策略與期望支付50五混合策略納什均衡純策略(purestrategies):如果一個策略規(guī)定參與人在一個給定的信息情況下只選擇一種特定的行動?;旌喜呗?mixedstrategies):如果一個策略規(guī)定參與人在給定的信息情況下,以某種概率分布隨機(jī)地選擇不同的行動。在靜態(tài)博弈里,純策略等價于特定的行動,混合策略是不同行動之間的隨機(jī)選擇。五混合策略納什均衡純策略(purestrategies)51§期望支付與混合策略(mixedstrategies)相伴隨的一個問題,是局中人支付的不確定性(uncertainty).可用期望支付(expectedpayoff)來描述——有個n可能的取值X1,X2…,Xn,并且這些取值發(fā)生的概率分別為p1,p2,…,pn,那么我們可以將這個數(shù)量指標(biāo)的期望值定義為發(fā)生概率作為權(quán)重的所有可能取值的加權(quán)平均,也就是§期望支付與混合策略(mixedstrategies52政府和流浪漢的博弈政府想幫助流浪漢,但前提是后者必須試圖尋找工作,否則,不予幫助;而流浪漢若知道政府采用救濟(jì)策略的話,他就不會尋找工作。他們只有在得不到政府救濟(jì)時才會尋找工作。他們獲得的支付如圖所示:(3,2)(-1,3)(-1,1)(0,0)流浪漢尋找工作游閑政府救濟(jì)不救濟(jì)政府和流浪漢的博弈政府想幫助流浪漢,但前提是后者必須試圖尋找53思考:政府會采用純策略嗎?流浪漢呢?這個博弈有沒有純策略的納什均衡?那么政府和流浪漢最有可能采用什么策略?——使自己的預(yù)期支付最大化?!裟軌虿碌膶Ψ降牟呗?,就可以采用針對性的策略,使自己的支付增加。政府和流浪漢的博弈思考:政府會采用純策略嗎?流浪漢呢?這個博弈有沒有純策略的納54求解混合策略納什均衡1、假定政府采用混合策略:2、流浪漢的混合策略為:求解混合策略納什均衡1、假定政府采用混合策略:2、流浪漢的混55解一:支付最大化政府的期望效用函數(shù)為:流浪漢找工作游蕩0,0-1,1-1,33,2政府救濟(jì)不救濟(jì)假設(shè)政府救濟(jì)的概率為;流浪漢找工作的概率為;則解一:支付最大化政府的期望效用函數(shù)為:流浪漢0,0-156對上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件為:就是說,從政府的最優(yōu)化條件找到流浪漢混合策略——流浪漢以0.2的概率選擇尋找工作,0.8的概率選擇游閑。解一:支付最大化對上述效用函數(shù)求微分,得到政府最優(yōu)化的一階條件為:57解一:支付最大化流浪漢找工作游蕩0,0-1,1-1,33,2政府救濟(jì)不救濟(jì)假設(shè)政府救濟(jì)的概率為;流浪漢找工作的概率為;則流浪漢的期望效用函數(shù)為:解一:支付最大化流浪漢0,0-1,1-1,3358流浪漢的期望效用函數(shù)為:解一:支付最大化流浪漢的期望效用函數(shù)為:解一:支付最大化59解二:支付等值法政府選擇救濟(jì)策略政府選擇不救濟(jì)策略如果一個混合策略是流浪漢的最優(yōu)選擇,那一定意味著政府在救濟(jì)與不救濟(jì)之間是無差異的,即:解二:支付等值法政府選擇救濟(jì)策略政府選擇不救濟(jì)策略如果一60解二:支付等值法

如果一個混合策略是政府的最優(yōu)選擇,那一定意味著流浪漢在尋找工作與游閑之間是無差異的,即:流浪漢找工作游蕩0,0-1,1-1,33,2政府救濟(jì)不救濟(jì)解二:支付等值法如果一個混合策略是政府的最優(yōu)選擇,那61如果政府救濟(jì)的概率小于0.5;則流浪漢的最優(yōu)選擇是尋找工作;如果政府救濟(jì)的概率大于0.5;則流浪漢的最優(yōu)選擇是游閑等待救濟(jì)。如果政府救濟(jì)的概率正好等于0.5;流浪漢的選擇無差異。政府和流浪漢的博弈如果政府救濟(jì)的概率小于0.5;政府和流浪漢的博弈62討論上面的均衡要求每個參與人以特定的概率選擇純策略。也就是說,一個參與人選擇不同策略的概率不是由他自己的支付決定的,而是由他的對手的支付決定的。正是由于這個原因,許多人認(rèn)為混合策略納什均衡是一個難以令人滿意的概念。事實上,正是因為它在幾個(或全部)策略之間是無差異的,他的行為才難以預(yù)測,混合策略納什均衡才會存在。討論上面的均衡要求每個參與人以特定的概率選擇純策略。也就是63討論盡管混合策略不像純策略那樣直觀,但它確實是一些博弈中參與人的合理行為方式。撲克比賽、壘球比賽、劃拳就是這樣的例子,在這一類博弈中,參與比賽的總是隨機(jī)行動以使自己的行為不被對方所預(yù)測。經(jīng)濟(jì)學(xué)上的監(jiān)督博弈也是這樣一個例子。如稅收檢查、質(zhì)量檢查、懲治犯罪、雇主監(jiān)督雇員等都可以看成猜謎博弈。討論盡管混合策略不像純策略那樣直觀,但它確實是一些博弈中參64§撲克牌對色游戲AB玩撲克牌對色游戲,每人都有紅黑兩張撲克牌,約定如果出牌顏色一樣,A輸B贏,如果出牌顏色不一樣,則A贏B輸。找到這個博弈的納什均衡。-1,11,-11,-1-1,1紅黑BA紅黑§撲克牌對色游戲AB玩撲克牌對色游戲,每人都有紅黑兩張撲克牌65例撲克牌對色游戲B紅黑-1,11,-11,-1-1,1A紅黑假設(shè)A出紅牌的概率為;B出紅牌的概率為;則因此A的最佳反應(yīng)函數(shù)為例撲克牌對色游戲B-1,11,-11,-1-66因此B的最佳反應(yīng)函數(shù)為同理納什均衡是:A和B出紅牌還是出黑牌的概率都是1/2.反應(yīng)函數(shù)法因此B的最佳反應(yīng)函數(shù)為同理納什均衡是:A和B出紅牌還是出黑牌67練習(xí)1:利用反應(yīng)函數(shù)法找出政府與流浪漢博弈的納什均衡流浪漢找工作游蕩0,0-1,1-1,33,2政府救濟(jì)不救濟(jì)假設(shè)政府救濟(jì)的概率為;流浪漢找工作的概率為;則練習(xí)1:利用反應(yīng)函數(shù)法找出政府與流浪漢博弈的納什均衡流浪漢068納什均衡是:政府以1/2的概率選擇救助,流浪漢以1/5的概率選擇找工作。練習(xí)2:利用反應(yīng)函數(shù)法找出情侶博弈的所有納什均衡麗娟足球芭蕾1,20,00,02,1大海足球芭蕾納什均衡是:政府以1/2的概率選擇救助,流浪漢以1/5的概率69激勵的悖論一小偷欲偷有守衛(wèi)看守的倉庫,若小偷去偷時守衛(wèi)睡覺(不負(fù)責(zé)),則小偷偷竊成功(令其價值是V),若守衛(wèi)沒有睡覺(盡職盡責(zé)),則小偷會被抓住坐牢(設(shè)其效用為-A);再假設(shè)守衛(wèi)睡覺而未被偷的效用為S,守衛(wèi)睡覺而被偷則被解雇,其效用為-D。寫出得益矩陣,并分析如果想減少小偷偷東西的現(xiàn)象發(fā)生,如何做效果更好?激勵的悖論一小偷欲偷有守衛(wèi)看守的倉庫,若小偷去偷時守衛(wèi)睡覺(70小偷與守衛(wèi)博弈小偷守衛(wèi)偷p不偷1-p睡q小睡1-qV,-D-A,00,S0,0激勵的悖論小偷與守衛(wèi)博弈守衛(wèi)偷p不偷1-p睡q小睡1-qV,-D-A,71用支付最大化值求出:激勵的悖論用支付最大化值求出:激勵的悖論72用支付最大化值求出:當(dāng)加大對小偷的處罰,守衛(wèi)偷懶的概率會增加當(dāng)加大對守衛(wèi)的處罰,小偷偷東西的概率會減小激勵的悖論用支付最大化值求出:當(dāng)加大對小偷的處罰,守衛(wèi)偷懶的概率會增加73激勵的悖論從道理上講,小偷偷東西是一種犯罪行為,而守恒不負(fù)責(zé)僅是失職行為;從性質(zhì)上講,犯罪的性質(zhì)比失職的性質(zhì)嚴(yán)重得多,理所當(dāng)然應(yīng)該加重對小偷的處罰,但從上面的分析可看出,為了減少偷竊的現(xiàn)象,反而是加重對守衛(wèi)處罰效果更好.這就是激勵的悖論!在社會經(jīng)濟(jì)現(xiàn)象中,存在著許多激勵的悖論的現(xiàn)象,如為了減少考試作弊的現(xiàn)象,應(yīng)加大對監(jiān)考人員失職的處罰其效果更好等等.激勵的悖論對我們制定政策和規(guī)章制度時帶來了有益的思考.激勵的悖論從道理上講,小偷偷東西是一種犯罪行為,而守恒不負(fù)責(zé)74練習(xí):混合策略的納什均衡

下面的博弈是否存在純策略的納什均衡,如果沒有采用混合策略納什均衡分析。試用支付最大化法和支付等值法兩種方法算一算混合策略的納什均衡是多少?通過反應(yīng)曲線,求得混合策略的納什均衡.2,35,23,11,5CDAB博弈方2博弈方1練習(xí):混合策略的納什均衡下面的博弈是否存在純策略的納什75對于博弈方1采用的混合策略,博弈方2的支付無差異對于博弈方2采用的混合策略,博弈方1的支付無差異策略得益博弈方1(0.8,0.2)2.6博弈方2(0.8,0.2)2.6解出PA=0.8,PB=0.2;PC=0.8,PD=0.2對于博弈方1采用的混合策略,博弈方2的支付無差異對于博弈方276不同均衡概念的關(guān)系占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純戰(zhàn)略納什均衡PNE混合戰(zhàn)略納什均衡MNE不同均衡概念的關(guān)系占優(yōu)均衡重復(fù)剔除占優(yōu)均衡純戰(zhàn)略納什均衡混合77監(jiān)督博弈的納稅檢查A為應(yīng)納稅款,C為檢查成本,F(xiàn)是偷稅罰款。假定C<A+F。不存在純戰(zhàn)略納什均衡。請問:如何才能降低納稅人逃稅的可能性A-C+F,-A-FA-C,-A0,0A,-A稅收機(jī)關(guān)檢查不檢查

納稅人逃稅不逃稅課后作業(yè):以“監(jiān)督博弈”為關(guān)鍵詞在學(xué)術(shù)期刊網(wǎng)上查找文獻(xiàn),瀏覽至少三篇論文并精讀一篇,寫下筆記。監(jiān)督博弈的納稅檢查A為應(yīng)納稅款,C為檢查成本,F(xiàn)是偷稅罰78夫妻之爭的混合策略納什均衡看看這個博弈有幾個均衡?2,10,00,01,3時裝足球時裝足球丈夫妻子夫妻之爭夫妻之爭的混合策略納什均衡看看這個博弈有幾個均衡?2,1079存在兩個純策略均衡2,10,00,01,3時裝足球時裝足球丈夫妻子夫妻之爭存在兩個純策略均衡2,10,00,01,3時裝足80還存在混合策略納什均衡2,10,00,01,3時裝C足球F時裝C足球F丈夫妻子夫妻之爭妻子的混合策略丈夫的混合策略夫妻之爭博弈的混合策略納什均衡策略得益博弈方1(0.75,0.25)0.67博弈方2(1/3,2/3)0.75還存在混合策略納什均衡2,10,00,01,3時裝81§多重納什均衡及其甄別帕累托優(yōu)勢標(biāo)準(zhǔn)風(fēng)險優(yōu)勢標(biāo)準(zhǔn)帕累托優(yōu)勢標(biāo)準(zhǔn)和風(fēng)險優(yōu)勢標(biāo)準(zhǔn)聚點均衡相關(guān)均衡抗共謀均衡§多重納什均衡及其甄別82看看這個博弈有幾個純策略納什均衡?-5,-5-10,88,-1010,10戰(zhàn)爭和平國家2戰(zhàn)爭和平國家1戰(zhàn)爭與和平博弈帕累托優(yōu)勢標(biāo)準(zhǔn)看看這個博弈有幾個純策略納什均衡?-5,-5-10,8883帕累托優(yōu)勢標(biāo)準(zhǔn)這個博弈中有兩個純策略納什均衡,(戰(zhàn)爭,戰(zhàn)爭)和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個按帕累托優(yōu)勢標(biāo)準(zhǔn)篩選出來的納什均衡。-5,-5-10,88,-1010,10戰(zhàn)爭和平國家2戰(zhàn)爭和平國家1戰(zhàn)爭與和平博弈帕累托優(yōu)勢標(biāo)準(zhǔn)-5,-5-10,88,-1010,184風(fēng)險優(yōu)勢標(biāo)準(zhǔn)若考慮到或者說是顧忌到其他博弈方可能發(fā)生錯誤的原因,帕累托上策均衡并不一定是最優(yōu)選擇,還需要比較風(fēng)險優(yōu)勢。下面就是兩個例子。9,98,00,87,7LR博弈方2UD博弈方1風(fēng)險上策均衡(D,R)風(fēng)險優(yōu)勢標(biāo)準(zhǔn)若考慮到或者說是顧忌到其他博弈方可能發(fā)生錯誤的原85風(fēng)險優(yōu)勢標(biāo)準(zhǔn)從風(fēng)險優(yōu)勢標(biāo)準(zhǔn)衡量,帕累托上策均衡(鹿,鹿)并是最優(yōu)選擇,因為一旦對手方犯了錯誤,暈了頭,選擇了兔的策略時,你的支付就會由5變成0!你會選擇這么高風(fēng)險的策略嗎?而(兔,兔)的策略組合,當(dāng)對手方犯了錯誤,暈了頭,選擇了鹿的策略時,你的支付還是3,并沒有損失!5,53,00,33,3鹿兔獵人2鹿兔獵人1獵鹿博弈風(fēng)險優(yōu)勢標(biāo)準(zhǔn)從風(fēng)險優(yōu)勢標(biāo)準(zhǔn)衡量,帕累托上策均衡(鹿,鹿)并是86聚點均衡聚點均衡是利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡。文化、習(xí)慣、心理或者其他各種特征都可能是聚點均衡的依據(jù)。城市博弈(城市分組相同)、時間博弈(報出相同的時間)是聚點均衡的典型例子。聚點均衡聚點均衡是利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡。文87城市博弈:聚點均衡的例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論