博弈論基礎(chǔ)作業(yè)及答案0001_第1頁
博弈論基礎(chǔ)作業(yè)及答案0001_第2頁
博弈論基礎(chǔ)作業(yè)及答案0001_第3頁
博弈論基礎(chǔ)作業(yè)及答案0001_第4頁
博弈論基礎(chǔ)作業(yè)及答案0001_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、博弈論基礎(chǔ)作業(yè)一、名詞解釋納什均衡 占優(yōu)戰(zhàn)略均衡 純戰(zhàn)略 混合戰(zhàn)略 子博弈精煉納什均衡貝葉斯納什均衡 精煉貝葉斯納什均衡 共同知識見 PPT二、問答題1. 舉出囚徒困境和智豬博弈的現(xiàn)實例子并進(jìn)行分析。囚徒困境的例子:軍備競賽;中小學(xué)生減負(fù);幾個大企業(yè)之間的爭相殺價等等;以中小學(xué)生減負(fù)為例:在當(dāng)前的高考制度下,給定其他學(xué)校對學(xué)生進(jìn)行減負(fù),一個學(xué)校最好不減負(fù),因為這樣做,可以帶來比其他學(xué)校更高的升學(xué)率。給定其他學(xué)校不減負(fù),這個學(xué)校的最佳應(yīng)對也是不減負(fù)。否則自己的升學(xué)率就比其他學(xué)校低。因此,不論其他學(xué) 校如何選擇,這個學(xué)校的最佳選擇都是不減負(fù)。每個學(xué)校都這樣想,所以每個學(xué)校的最佳 選擇都是不減負(fù),因

2、此學(xué)生的負(fù)擔(dān)越來越重。請用同樣的方法分析其他例子。智豬博弈的例子:大企業(yè)開發(fā)新產(chǎn)品;小企業(yè)模仿;股市中,大戶搜集分析信息,散 戶跟隨大戶的操作策略以股市為例:給定散戶搜集資料進(jìn)行分析,大戶的最佳選擇是跟隨。而給定散戶跟隨,大戶的最佳選擇是自己搜集資料進(jìn)行分析。但是不論大戶是選擇分析還是跟隨,散戶的最佳選擇都是跟隨。因此如果大戶和散戶是聰明的,并且大戶知道散戶也是聰明的,那么大戶就會預(yù)見到散戶會跟隨,而給定散戶跟隨,大戶只有自己分析請用同樣的方法分析其他例子。2. 請用博弈論來說明“破釜沉舟”和“窮寇勿追”的道理。破釜沉舟是一個承諾行動。目的是要斷絕自己的退路,讓自己無路可退,讓自己決一 死戰(zhàn)變

3、得可以置信。也就是說與敵人對決時,只有決一死戰(zhàn),這樣才可以取得勝利。否則, 如果不破釜沉舟,那么遇到困難時,就很有可能退卻,也就無法取得勝利。窮寇勿追就是 要給對方一個退路,由于有退路,對方就不會殊死抵抗。否則,對方退無可退,只有堅決 抵抗一條路,因而必然決一死戰(zhàn)。自己也會付出更大的代價。3. 當(dāng)求職者向企業(yè)聲明自己能力強(qiáng)時,企業(yè)未必相信。但如果求職者拿出自己的各種 獲獎證書時,卻能在一定程度上傳遞自己能力強(qiáng)的信息。這是為什么?由于口頭聲明幾乎沒有成本, 因此即便是能力差的求職者也會向企業(yè)聲明自己能力強(qiáng)。 當(dāng)然能力強(qiáng)的人也會聲明自己的能力強(qiáng)。也就是說不同類型的求職者為了贏得職位會做出 同樣的聲

4、明。這樣口頭聲明就不能有效的傳遞信息,因此企業(yè)不會輕易相信。而求職者拿 出獲獎證書就成了一個信號博弈。由于獲得證書是要付出代價的,但代價卻引人而異。能 力強(qiáng)的個人可以相對輕易獲得證書,而能力弱的個人卻很難獲得證書,以至于能力弱的人 認(rèn)為化巨大的代價獲得證書, 從而獲得企業(yè)的職位是不劃算的, 因此干脆就不要獲獎證書。 因此獲獎證書就成為個人能力的信號。4. 五個海盜搶得 100 顆鉆石,他們?yōu)榉众E發(fā)生了爭議 ,最后達(dá)成協(xié)議 ,由抓鬮確定出分 贓順序,然后按照民主程序進(jìn)行分贓。首先由 1號海盜提出分贓方案 , 五人共同舉手表決。 若贊成的占一半以上(不包括一半的情況) ,就按 1號提出的方案分贓

5、, 否則 1 號將被扔到 海里喂鯊魚。接著由 2 號提出方案 , 四人共同舉手表決。若贊成的占一半以上(不包括一半的情況),就按2號提出的方案分贓,否則2號將被扔到海里喂鯊魚,依此類推。如果你是 1號海盜,你該提什么樣的方案?說明理由。假設(shè)(1)五個強(qiáng)盜都很聰明,而且大家知道大家很聰明,大家知道大家知道大家很聰明,如此等等。(2)每個海盜都很貪婪,希望獲得盡可能多的鉆石,但是又不想為了鉆石丟掉性命。(3)給定一個方案,只有該方案大于他的備選方案所獲的鉆石時,海盜才選擇贊成。第一個海盜的提議應(yīng)該是:五個海盜分別獲得的鉆石數(shù)目為97, 0,1,0,2,或者97, 0, 1, 2, 0。具體理由自己

6、思考,方法是倒推法。三、計算題1.試計算表1中的戰(zhàn)略式博弈的重復(fù)剔除劣戰(zhàn)略均衡對B而言,戰(zhàn)略M嚴(yán)格劣于1 一個戰(zhàn)略式表述博弈1,23,12,45,67,12,63,12,07,8LMRDR;(因為14, 16,08),因此剔除B的戰(zhàn)略M構(gòu)成新UAM的博弈如下BLRU1,22,4AM5,62,6D3,17,8在新的博弈中,對于A而言,戰(zhàn)略U嚴(yán)格劣于D(因為13,27),因此剔除A的戰(zhàn)略U,構(gòu)成新的博弈如下:5,62,63,17,8LRMAD對于新的博弈中,已經(jīng)沒有 嚴(yán)格的劣戰(zhàn)略,因此沒有嚴(yán)格的劣戰(zhàn)略可以剔除。所以該 博弈不是重復(fù)剔除 嚴(yán)格劣戰(zhàn)略可解的但是存在弱劣戰(zhàn)略。對于B而言,戰(zhàn)略L弱劣于R

7、(因為6=6,18),因此剔除B的弱劣戰(zhàn)略L,構(gòu)成新的博弈如下:2,6D 7,8在新的博弈中,對于 A而言,戰(zhàn)略M嚴(yán)格劣于D (因為27),因此剔除A的戰(zhàn)略M 構(gòu)成新的博弈如下:D 7,8A因此,重復(fù)剔除(弱)劣戰(zhàn)略均衡為(D, R)(ps:如果同學(xué)們用劃線的方法求納什均衡,就可以發(fā)現(xiàn)純戰(zhàn)略nash均衡有兩個:(皿丄)和(D,R)但采用剔除弱劣戰(zhàn)略的方法,把其中一個納什均衡剔除掉了)2試給出下述戰(zhàn)略式表述博弈的所有納什均衡。2給定1選擇U,2的最佳選擇是R(因為22),在相應(yīng)位置劃線D (理由自己寫),在相應(yīng)位置劃線2,23,34,41,2LRU1D給定2選擇R, 1的最佳選擇是U (理由自己

8、寫),在相應(yīng)位置劃線找兩個數(shù)字下都劃線的,顯然有兩個純戰(zhàn)略納什均衡:(U,R)和(D,L)據(jù) Wilson 的奇數(shù)定理,可能有一個混合戰(zhàn)略均衡。設(shè)1選U的概率為,那么選D的概率為1設(shè)2選L的概率為,那么選R的概率為1,如果存在混合戰(zhàn)略,那么 2 選戰(zhàn)略 L 和 R 的期望收益應(yīng)該應(yīng)該相等,因此應(yīng)有U L 24(1) U R 32(1)? 自己求解( 2 分)同樣,1選戰(zhàn)略U和D的期望收益應(yīng)該應(yīng)該相等得混合均衡: ?3. 市場里有兩個企業(yè) 1 和 2。每個企業(yè)的成本都為 0。市場的逆需求函數(shù)為 P=16-Q。 其中P是市場價格,Q為市場總產(chǎn)量。(1 )求古諾( Cournot )均衡產(chǎn)量和利潤。

9、(2)求斯坦克爾伯格( Stackelberg )均衡產(chǎn)量和利潤。(1)設(shè)兩個企業(yè)的產(chǎn)量分別為q1,q2,有Q q1 q?,因此利潤函數(shù)分別為:利潤最大化的一階條件分別為:因此企業(yè) 1 和企業(yè) 2的反應(yīng)函數(shù)分別為:聯(lián)立,得到 q1 q2?。自己求解(2)設(shè)企業(yè)1先行,企業(yè)2跟進(jìn)。兩個企業(yè)的產(chǎn)量分別為 q , q2,因此利潤函數(shù)分別為:由逆向歸納法,在第二階段,企業(yè) 2在已知企業(yè)1的產(chǎn)量的情況下,最優(yōu)化自己的產(chǎn)量,從而得到企業(yè)2的反應(yīng)函數(shù):因此企業(yè)2的反應(yīng)函數(shù)為:q22在第一階段,企業(yè)1考慮到企業(yè)2的反應(yīng),從而自己的利潤函數(shù)為:i (16 qi q2)qi 16q! q;16q q; q,16

10、里)(2 分)2要使企業(yè)1的利潤最大,應(yīng)滿足一階條件:0q1得到q1?。所以q2?。(PS:古諾模型是完全信息靜態(tài)博弈,求的是納什均衡;斯坦伯格模型是完全信息動態(tài)博弈,求的是子博弈精煉納什均衡)4. ( 1)試給出圖1中的完全信息動態(tài)博弈的子博弈精煉均衡和均衡結(jié)果。 (2)倘若2 告訴1: 2的戰(zhàn)略是(c,i,j),問此時1的最優(yōu)戰(zhàn)略是什么? ( 3)在(2)中,1和2的戰(zhàn)略 組合構(gòu)成一個納什均衡嗎?均衡結(jié)果是什么? ( 4)(3)中的納什均衡不是子博弈精煉的, 原因是什么?1ab答:(1,2)(2,1)(3,2)(4,6)(0,2)(6,3)(1)(1,2)li(4,6)(0,2)由逆向歸納

11、法,子博弈精煉均衡為(b,g),(c,e,l),均衡結(jié)果為(4, 6)(2)若2的戰(zhàn)略為(c,i, j),則1的最優(yōu)戰(zhàn)略為(b, f)(3)給定2的戰(zhàn)略為(c,i, j) , 1的最優(yōu)戰(zhàn)略為(b, f);反之,給定1的戰(zhàn)略(b, f),戰(zhàn)略(c,i,j)是2的一個最優(yōu)戰(zhàn)略。所以它們構(gòu)成一個納什均衡,均衡結(jié)果為(6,3 )。(4)因為2的戰(zhàn)略(c,i, j)中含有不可置信的威脅i,使1在f和g之間不敢選g。當(dāng) 博弈進(jìn)行到2在I與i之間進(jìn)行選擇的時候,2必會選l,給定如此,1選g而不是f,此時 2會選e,這就是子博弈精煉均衡。5、試解出下述不完美信息動態(tài)博弈的精煉貝葉斯均衡。(2,4)(0,1)(3,1)(7,2)T選L的概率為1當(dāng)“ 2”看見“ 1”未選R時,設(shè)他認(rèn)為“ 1”選L的概率為P, P,則“2”選I的期望支付為:“2”選r的期望支付為當(dāng)1 3P 2 P,即P -時,“2”選I,而給定“2”選I,“ 1 ”選L收益為2,選L的4收益為3,選R的收益為1,因此“ 1”會選L。而給定“ 1”選L , “2”認(rèn)為P 0 1 (注411意:P是“ 1”選L的概率),與P -矛盾。故P -不會有均衡;44當(dāng)1 3P 2 P,即P 1時,“2”選r,給定“2”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論