博弈論基礎(chǔ)作業(yè)及答案0001

上傳人：y*** IP屬地：天津上傳時間：2021-06-13 格式：DOC 頁數(shù)：13 大?。?8KB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩8頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、博弈論基礎(chǔ)作業(yè)一、名詞解釋納什均衡占優(yōu)戰(zhàn)略均衡純戰(zhàn)略混合戰(zhàn)略子博弈精煉納什均衡貝葉斯納什均衡精煉貝葉斯納什均衡共同知識見 PPT二、問答題1. 舉出囚徒困境和智豬博弈的現(xiàn)實例子并進(jìn)行分析。囚徒困境的例子：軍備競賽；中小學(xué)生減負(fù)；幾個大企業(yè)之間的爭相殺價等等；以中小學(xué)生減負(fù)為例：在當(dāng)前的高考制度下，給定其他學(xué)校對學(xué)生進(jìn)行減負(fù)，一個學(xué)校最好不減負(fù)，因為這樣做，可以帶來比其他學(xué)校更高的升學(xué)率。給定其他學(xué)校不減負(fù)，這個學(xué)校的最佳應(yīng)對也是不減負(fù)。否則自己的升學(xué)率就比其他學(xué)校低。因此，不論其他學(xué) 校如何選擇，這個學(xué)校的最佳選擇都是不減負(fù)。每個學(xué)校都這樣想，所以每個學(xué)校的最佳選擇都是不減負(fù)，因

2、此學(xué)生的負(fù)擔(dān)越來越重。請用同樣的方法分析其他例子。智豬博弈的例子：大企業(yè)開發(fā)新產(chǎn)品；小企業(yè)模仿；股市中，大戶搜集分析信息，散戶跟隨大戶的操作策略以股市為例：給定散戶搜集資料進(jìn)行分析，大戶的最佳選擇是跟隨。而給定散戶跟隨，大戶的最佳選擇是自己搜集資料進(jìn)行分析。但是不論大戶是選擇分析還是跟隨，散戶的最佳選擇都是跟隨。因此如果大戶和散戶是聰明的，并且大戶知道散戶也是聰明的，那么大戶就會預(yù)見到散戶會跟隨，而給定散戶跟隨，大戶只有自己分析請用同樣的方法分析其他例子。2. 請用博弈論來說明“破釜沉舟”和“窮寇勿追”的道理。破釜沉舟是一個承諾行動。目的是要斷絕自己的退路，讓自己無路可退，讓自己決一死戰(zhàn)變

3、得可以置信。也就是說與敵人對決時，只有決一死戰(zhàn)，這樣才可以取得勝利。否則，如果不破釜沉舟，那么遇到困難時，就很有可能退卻，也就無法取得勝利。窮寇勿追就是要給對方一個退路，由于有退路，對方就不會殊死抵抗。否則，對方退無可退，只有堅決抵抗一條路，因而必然決一死戰(zhàn)。自己也會付出更大的代價。3. 當(dāng)求職者向企業(yè)聲明自己能力強(qiáng)時，企業(yè)未必相信。但如果求職者拿出自己的各種獲獎證書時，卻能在一定程度上傳遞自己能力強(qiáng)的信息。這是為什么？由于口頭聲明幾乎沒有成本，因此即便是能力差的求職者也會向企業(yè)聲明自己能力強(qiáng)。當(dāng)然能力強(qiáng)的人也會聲明自己的能力強(qiáng)。也就是說不同類型的求職者為了贏得職位會做出同樣的聲

4、明。這樣口頭聲明就不能有效的傳遞信息，因此企業(yè)不會輕易相信。而求職者拿出獲獎證書就成了一個信號博弈。由于獲得證書是要付出代價的，但代價卻引人而異。能力強(qiáng)的個人可以相對輕易獲得證書，而能力弱的個人卻很難獲得證書，以至于能力弱的人認(rèn)為化巨大的代價獲得證書，從而獲得企業(yè)的職位是不劃算的，因此干脆就不要獲獎證書。因此獲獎證書就成為個人能力的信號。4. 五個海盜搶得 100 顆鉆石,他們?yōu)榉众E發(fā)生了爭議 ,最后達(dá)成協(xié)議 ,由抓鬮確定出分贓順序，然后按照民主程序進(jìn)行分贓。首先由 1號海盜提出分贓方案 , 五人共同舉手表決。若贊成的占一半以上（不包括一半的情況） ,就按 1號提出的方案分贓

5、, 否則 1 號將被扔到海里喂鯊魚。接著由 2 號提出方案 , 四人共同舉手表決。若贊成的占一半以上（不包括一半的情況），就按2號提出的方案分贓，否則2號將被扔到海里喂鯊魚，依此類推。如果你是 1號海盜，你該提什么樣的方案？說明理由。假設(shè)（1）五個強(qiáng)盜都很聰明，而且大家知道大家很聰明，大家知道大家知道大家很聰明，如此等等。（2）每個海盜都很貪婪，希望獲得盡可能多的鉆石，但是又不想為了鉆石丟掉性命。（3）給定一個方案，只有該方案大于他的備選方案所獲的鉆石時，海盜才選擇贊成。第一個海盜的提議應(yīng)該是：五個海盜分別獲得的鉆石數(shù)目為97, 0，1，0，2,或者97， 0， 1， 2， 0。具體理由自己

6、思考，方法是倒推法。三、計算題1.試計算表1中的戰(zhàn)略式博弈的重復(fù)剔除劣戰(zhàn)略均衡對B而言，戰(zhàn)略M嚴(yán)格劣于1 一個戰(zhàn)略式表述博弈1,23,12,45,67,12,63,12,07,8LMRDR;（因為14, 16,08），因此剔除B的戰(zhàn)略M構(gòu)成新UAM的博弈如下BLRU1,22,4AM5,62,6D3,17,8在新的博弈中,對于A而言，戰(zhàn)略U嚴(yán)格劣于D（因為13,27），因此剔除A的戰(zhàn)略U,構(gòu)成新的博弈如下：5,62,63,17,8LRMAD對于新的博弈中，已經(jīng)沒有嚴(yán)格的劣戰(zhàn)略，因此沒有嚴(yán)格的劣戰(zhàn)略可以剔除。所以該博弈不是重復(fù)剔除嚴(yán)格劣戰(zhàn)略可解的但是存在弱劣戰(zhàn)略。對于B而言，戰(zhàn)略L弱劣于R

7、（因為6=6，18）,因此剔除B的弱劣戰(zhàn)略L,構(gòu)成新的博弈如下：2,6D 7,8在新的博弈中，對于 A而言，戰(zhàn)略M嚴(yán)格劣于D （因為27）,因此剔除A的戰(zhàn)略M 構(gòu)成新的博弈如下:D 7,8A因此，重復(fù)剔除（弱）劣戰(zhàn)略均衡為（D, R）（ps:如果同學(xué)們用劃線的方法求納什均衡，就可以發(fā)現(xiàn)純戰(zhàn)略nash均衡有兩個:（皿丄）和（D,R）但采用剔除弱劣戰(zhàn)略的方法，把其中一個納什均衡剔除掉了）2試給出下述戰(zhàn)略式表述博弈的所有納什均衡。2給定1選擇U,2的最佳選擇是R（因為22），在相應(yīng)位置劃線D （理由自己寫），在相應(yīng)位置劃線2,23,34,41,2LRU1D給定2選擇R, 1的最佳選擇是U （理由自己

8、寫），在相應(yīng)位置劃線找兩個數(shù)字下都劃線的，顯然有兩個純戰(zhàn)略納什均衡：(U，R)和(D，L)據(jù) Wilson 的奇數(shù)定理，可能有一個混合戰(zhàn)略均衡。設(shè)1選U的概率為，那么選D的概率為1設(shè)2選L的概率為，那么選R的概率為1，如果存在混合戰(zhàn)略，那么 2 選戰(zhàn)略 L 和 R 的期望收益應(yīng)該應(yīng)該相等，因此應(yīng)有U L 24(1) U R 32(1)? 自己求解( 2 分)同樣，1選戰(zhàn)略U和D的期望收益應(yīng)該應(yīng)該相等得混合均衡： ?3. 市場里有兩個企業(yè) 1 和 2。每個企業(yè)的成本都為 0。市場的逆需求函數(shù)為 P=16-Q。其中P是市場價格，Q為市場總產(chǎn)量。(1 )求古諾( Cournot )均衡產(chǎn)量和利潤。

9、(2)求斯坦克爾伯格( Stackelberg )均衡產(chǎn)量和利潤。(1)設(shè)兩個企業(yè)的產(chǎn)量分別為q1，q2，有Q q1 q?，因此利潤函數(shù)分別為：利潤最大化的一階條件分別為：因此企業(yè) 1 和企業(yè) 2的反應(yīng)函數(shù)分別為：聯(lián)立，得到 q1 q2?。自己求解（2）設(shè)企業(yè)1先行，企業(yè)2跟進(jìn)。兩個企業(yè)的產(chǎn)量分別為 q , q2，因此利潤函數(shù)分別為:由逆向歸納法，在第二階段，企業(yè) 2在已知企業(yè)1的產(chǎn)量的情況下，最優(yōu)化自己的產(chǎn)量,從而得到企業(yè)2的反應(yīng)函數(shù)：因此企業(yè)2的反應(yīng)函數(shù)為：q22在第一階段，企業(yè)1考慮到企業(yè)2的反應(yīng)，從而自己的利潤函數(shù)為：i （16 qi q2）qi 16q! q；16q q； q,16

10、里）（2 分）2要使企業(yè)1的利潤最大，應(yīng)滿足一階條件：0q1得到q1?。所以q2?。（PS:古諾模型是完全信息靜態(tài)博弈，求的是納什均衡；斯坦伯格模型是完全信息動態(tài)博弈，求的是子博弈精煉納什均衡）4. （ 1）試給出圖1中的完全信息動態(tài)博弈的子博弈精煉均衡和均衡結(jié)果。（2）倘若2 告訴1： 2的戰(zhàn)略是（c,i,j），問此時1的最優(yōu)戰(zhàn)略是什么？（ 3）在（2）中，1和2的戰(zhàn)略組合構(gòu)成一個納什均衡嗎？均衡結(jié)果是什么？（ 4）（3）中的納什均衡不是子博弈精煉的，原因是什么?1ab答:(1,2)(2,1)(3,2)(4,6)(0,2)(6,3)(1)(1,2)li(4,6)(0,2)由逆向歸納

11、法，子博弈精煉均衡為（b,g）,（c,e,l），均衡結(jié)果為（4, 6）(2)若2的戰(zhàn)略為(c,i, j)，則1的最優(yōu)戰(zhàn)略為(b, f)(3)給定2的戰(zhàn)略為(c,i, j) , 1的最優(yōu)戰(zhàn)略為(b, f)；反之，給定1的戰(zhàn)略(b, f)，戰(zhàn)略(c,i,j)是2的一個最優(yōu)戰(zhàn)略。所以它們構(gòu)成一個納什均衡，均衡結(jié)果為(6,3 )。(4)因為2的戰(zhàn)略(c,i, j)中含有不可置信的威脅i，使1在f和g之間不敢選g。當(dāng) 博弈進(jìn)行到2在I與i之間進(jìn)行選擇的時候，2必會選l，給定如此，1選g而不是f，此時 2會選e,這就是子博弈精煉均衡。5、試解出下述不完美信息動態(tài)博弈的精煉貝葉斯均衡。(2,4)(0,1)(3,1)(7,2)T選L的概率為1當(dāng)“ 2”看見“ 1”未選R時，設(shè)他認(rèn)為“ 1”選L的概率為P, P,則“2”選I的期望支付為:“2”選r的期望支付為當(dāng)1 3P 2 P，即P -時，“2”選I，而給定“2”選I，“ 1 ”選L收益為2,選L的4收益為3,選R的收益為1,因此“ 1”會選L。而給定“ 1”選L , “2”認(rèn)為P 0 1 (注411意：P是“ 1”選L的概率)，與P -矛盾。故P -不會有均衡；44當(dāng)1 3P 2 P，即P 1時，“2”選r，給定“2”

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論基礎(chǔ)作業(yè)及答案0001

文檔簡介

溫馨提示

最新文檔

評論

博弈論基礎(chǔ)作業(yè)及答案0001

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔