




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、文檔供參考,可復(fù)制、編制,期待您的好評(píng)與關(guān)注! 111111111111111111博弈論練習(xí)題(四)一、什么是子博弈精煉納什均衡?答:將納什均衡中包含的不可置信的威脅策略剔除出去。它要求參與者的決策在任何時(shí)點(diǎn)上都是最優(yōu)的。由于剔除了不可置信的威脅,在許多情況下,精煉納什均衡也就縮小了納什均衡的個(gè)數(shù)。只有當(dāng)參與人的策略在每一個(gè)子博弈中都構(gòu)成納什均衡叫做精煉納什均衡。或者說,組成精煉納什均衡的策略必須在每一個(gè)子博弈中都是最優(yōu)的。二、參與人的理性問題對(duì)動(dòng)態(tài)博弈分析的影響是否比靜態(tài)博弈的影響更大?為什么?答:正確,博弈論要求個(gè)體具有始終追求自身利益最大化的理性意識(shí)和理性能力的“自我”個(gè)體理性,這是靜
2、態(tài)博弈的范疇。除此之外,還要求相關(guān)的參與者具有層次較高的“交互理性”,要求不同個(gè)體之間在理性和行為方面具有一種“默契”。即,人們的自身利益的最大化不僅取決于自己的選擇,還取決于與之相關(guān)的其他人的選擇與行為,那么為了實(shí)現(xiàn)自己的最大利益,個(gè)體的理性決策就必須考慮他人的理性選擇與行為。作為博弈論的基礎(chǔ),交互理性是其基本的理性要求。博弈論還要求有關(guān)博弈的結(jié)構(gòu)、各個(gè)博弈參與者的得益函數(shù)以及各個(gè)博弈參與者的理性等“知識(shí)”是所有博弈參與者之間的“共同知識(shí)”。也就是,每個(gè)博弈參與者不僅要首先明確自己和其他參與者所有可選的策略,還需知曉各種情況下自己最終的收益或其概率分布,并且每個(gè)博弈參與者都知道各個(gè)參與者掌握
3、這些信息;更為重要的是,每個(gè)博弈參與者都知道所有參與者都是理性的,都知道其他博弈參與者知道所有參與者都是理性的,都知道其他博弈參與者知道其他博弈參與者知道所有博弈參與者都是理性的-。理性的共同知識(shí)假設(shè)是非合作博弈理論的一個(gè)非常重要和關(guān)鍵的假設(shè),是實(shí)現(xiàn)交互理性和理性主義的納什均衡的基本前提,這些,都是動(dòng)態(tài)博弈的范疇。因此說,參與者理性問題對(duì)動(dòng)態(tài)博弈的分析影響更大。三、納什均衡和精煉納什均衡存在哪些問題?答:納什均衡存在的問題:(1)不是所有博弈都存在納什均衡 如純策略就不存在混合策略則一定會(huì)存在納什均衡, 它是通過概率來計(jì)算納什均衡,在這種均衡下,給定其他參與人的策略選擇概率,每個(gè)參與人都可以為
4、自己確定選擇每一種策略的最優(yōu)概率。(2)在論及納什均衡時(shí),我們假設(shè)參與人是完全理性的,而且是假定參與人之間不允許達(dá)成任何協(xié)議的非合作博弈的均衡解。而現(xiàn)實(shí)并非如此。精煉納什均衡存在的問題:有限重復(fù)博弈的子博弈精煉納什均衡有如下定理令G是階段博弈,G(T)是重復(fù)T次的重復(fù)博弈。那么,如果G有唯一的納什均衡,重復(fù)博弈G(T)的唯一子博弈精煉納什均衡結(jié)果是階段博弈G的納什均衡重復(fù)T次。這個(gè)定理成立的條件是單階段納什均衡的“唯一性” ,若納什均衡不是唯一的,上述定理的結(jié)論就不一定成立。四、有限次重復(fù)博弈和無限次重復(fù)博弈有什么區(qū)別?這些區(qū)別對(duì)我們有什么啟發(fā)?答:有限次重復(fù)博弈與無限次重復(fù)博弈都屬于動(dòng)態(tài)博弈
5、,對(duì)于有限次博弈,收益是每次收益的簡單相加,可以采取子博弈納什均衡的方法求解,即逆推法;但無限次博弈卻不能采??; 此外,有限次博弈中博弈的雙方都還是關(guān)注的是自己短期的利益,而無限次博弈中博弈的雙方可能針對(duì)某項(xiàng)事情達(dá)成協(xié)議,達(dá)到共謀,為共同的利益而選擇自己的行動(dòng),達(dá)到整體的最優(yōu),供應(yīng)鏈契約即類似。五、有限次重復(fù)博弈的精煉納什均衡的最后一次重復(fù)必定是第一階段博弈的一個(gè)納什均衡?答:博弈重復(fù)次數(shù)有限,意味著存在所有參與人都可以預(yù)測到的“最后一次”。在最后的階段博弈中,如果某一參與人選擇了自己的占優(yōu)戰(zhàn)略,給其他參與人造成損失,則其他參與人不可能報(bào)復(fù)。所有的參與人都明白這一點(diǎn),因而在最后一次階段博弈中都
6、會(huì)選擇占優(yōu)戰(zhàn)略,換句話說,在給定最后階段所有參與人都會(huì)選擇占優(yōu)戰(zhàn)略的前提下,所有的參與人在倒數(shù)第二階段的博弈中也都會(huì)選擇占優(yōu)戰(zhàn)略。由此從最后的階段開始,逐個(gè)階段進(jìn)行推理,可以得出以下結(jié)論:在階段博弈有唯一的納什均衡時(shí),有限次重復(fù)博弈的唯一子博弈精煉納什均衡結(jié)果,是階段博弈的納什均衡重復(fù)。這就是說,每個(gè)階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果。六、無限次重復(fù)博弈均衡解的得益一定會(huì)優(yōu)于原博弈均衡解的得益嗎?答:不一定。例如:無限次重復(fù)博弈的古諾博弈,此博弈是相同博弈重復(fù)無限次,當(dāng)冷酷戰(zhàn)略是整個(gè)博弈的納什均衡時(shí),當(dāng)然也就是每個(gè)階段的納什均衡。此時(shí),無限次重復(fù)古諾博弈的冷酷戰(zhàn)略已意味著是兩廠商在兩種戰(zhàn)略
7、間進(jìn)行選擇的囚徒困境博弈,一是選擇生產(chǎn)壟斷產(chǎn)量的一半Q/2,另一是選擇生產(chǎn)背叛產(chǎn)量時(shí),冷酷戰(zhàn)略是無限次重復(fù)古諾博弈的一個(gè)子博弈精煉納什均衡。貼現(xiàn)因子較大說明未來的利益較大,對(duì)兩廠商都有較大的吸引力,一般情況下,兩廠商不會(huì)為了短期利益而背叛對(duì)方而失去較大的長遠(yuǎn)利益,即兩廠商都有堅(jiān)持冷酷戰(zhàn)略的積極性。而當(dāng)時(shí),意味著冷酷戰(zhàn)略不再是一個(gè)子博弈精煉納什均衡。貼現(xiàn)因子較小說明未來的利益對(duì)兩廠商都不具有吸引力,選擇背叛才是兩廠商的最優(yōu)選擇。這種條件下,博弈無限次重復(fù)也不能提高一次性博弈的得益。七、觸發(fā)戰(zhàn)略所構(gòu)成的均衡都是子博弈精煉納什均衡嗎?答:“觸發(fā)戰(zhàn)略”是這樣一種戰(zhàn)略首先試探合作,如果對(duì)方合作,則給予獎(jiǎng)
8、勵(lì);如果對(duì)方不合作,則給以懲罰。在原博弈有多個(gè)納什均衡的條件下,在重復(fù)博弈時(shí),通過觸發(fā)戰(zhàn)略提高了雙方的收益。首先,在第二次博弈時(shí)意味著該博弈結(jié)束,而均衡結(jié)果是原博弈的納什均衡,雙方都沒有偏離的意愿;其次,第一次選的策略雖不是原博弈的納什均衡,如果某一方偏離會(huì)增加收益,但這樣會(huì)遭到對(duì)方第二次選另外的策略的懲罰而損失收益,使總得益減少。預(yù)見到這一點(diǎn),只顧眼前不顧長遠(yuǎn)的偏離是得不償失的事,因此雙方會(huì)堅(jiān)持選使總收益最大的策略。所以,觸發(fā)戰(zhàn)略構(gòu)成的均衡都是子博弈精煉納什均衡。八、什么是冷酷戰(zhàn)略?什么是針鋒相對(duì)戰(zhàn)略?什么是最小最大戰(zhàn)略?答:冷酷戰(zhàn)略也稱為觸發(fā)戰(zhàn)略,這種戰(zhàn)略做法是 1、參與人在博弈開始時(shí)均選
9、擇合作; 2、只要對(duì)方一直選擇合作,則繼續(xù)合作下去,但當(dāng)某一時(shí)刻對(duì)方選擇了不合作,則一直永遠(yuǎn)選擇不合作來懲罰對(duì)方的背叛行為。針鋒相對(duì)戰(zhàn)略:參與人在博弈開始時(shí)選擇合作;在時(shí)期t選擇對(duì)方在時(shí)期t-1期所采用的戰(zhàn)略,即如果對(duì)方在t-1期背叛(不合作),則自己在t期也選擇背叛。最小最大戰(zhàn)略:最小最大戰(zhàn)略是指當(dāng)違規(guī)者不采取合作行為而對(duì)他進(jìn)行懲罰時(shí),違規(guī)者可能得到的最嚴(yán)厲的制裁的戰(zhàn)略(相應(yīng)的,違規(guī)者為了減少懲罰對(duì)自己的影響,而使自己得益最大的戰(zhàn)略。練習(xí)題(五)一、若你正在考慮收購一家公司的一萬股股票,賣方的開價(jià)是2元/股。根據(jù)經(jīng)營情況的好壞,該公司股票的價(jià)值對(duì)你來說有1元/股和5元/股兩種可能,但只有賣方
10、知道經(jīng)營的真實(shí)情況,你只知經(jīng)營好、壞的概率各為0.5。如果公司經(jīng)營不好時(shí),賣方做到使你無法識(shí)別真實(shí)情況的“包裝”費(fèi)為5萬元,你是否會(huì)按賣方的價(jià)格買下這些股票?如果“包裝”費(fèi)僅為0.5萬元,你會(huì)如何選擇?答:當(dāng)賣方使買房無法識(shí)別真實(shí)情況的包裝費(fèi)為5萬元時(shí),買方的股票價(jià)值期望值為 E=0.5 ×1-5+0 .5×5=0.5元/股 在這種情況下,無法接受賣方給出的價(jià)格 當(dāng)賣方的包裝費(fèi)為0.5萬元時(shí),買方的股票價(jià)值期望值為 E=0.5 ×1-0.5+0 .5×5=2.75元/股在這種情況下,接受賣方給出的價(jià)格 二、現(xiàn)實(shí)生活中常常是既有部分賣假冒偽劣產(chǎn)品的廠商會(huì)打
11、出“質(zhì)量三包”、“假一罰十”等旗號(hào),也有一些賣假冒偽劣產(chǎn)品的廠商聲明“售出商品概不退換”。問這兩類廠商有什么不同,他們各自戰(zhàn)略的根據(jù)是什么?答:第一類廠商實(shí)行戰(zhàn)略的根據(jù)是:“最大最小戰(zhàn)略”,根據(jù)無限次重復(fù)博弈中的子博弈精煉納什均衡實(shí)際上是參與人相互合作的結(jié)果,要使合作成功,其戰(zhàn)略中必須要有懲罰措施。所謂最小最大戰(zhàn)略是指當(dāng)違規(guī)者不采取合作行為而對(duì)他進(jìn)行懲罰時(shí),違規(guī)者可能得到的最嚴(yán)厲的制裁的戰(zhàn)略。 第二類廠商采取戰(zhàn)略的根據(jù)是:“冷酷戰(zhàn)略”,任何為了短期利益的背叛行為的所得對(duì)長期利益而言都是微不足道的,且會(huì)遭到對(duì)方一直背叛的冷酷打擊,故參與人有積極性為自己建立一個(gè)樂于合作的聲譽(yù),同時(shí)也有積極性懲罰對(duì)
12、方的背叛行為。三、在有兩個(gè)投標(biāo)者的暗標(biāo)拍賣中,投標(biāo)者的估價(jià)獨(dú)立分布于0,1且兩人的估價(jià)相同,則貝葉斯納什均衡是什么?博弈的結(jié)果是什么?如果兩投標(biāo)者知道他們的估價(jià)是相同的,結(jié)果會(huì)發(fā)生什么變化?解:兩個(gè)人投標(biāo)人為i,j,投標(biāo)者i的支付如下:最終解得,拍賣的對(duì)稱貝葉斯均衡戰(zhàn)略為 同理可得,對(duì)投標(biāo)人j也可得到相同的結(jié)論即,在只有兩個(gè)投標(biāo)人時(shí),這個(gè)博弈的貝葉斯均衡是,每個(gè)投標(biāo)人的出價(jià)是其實(shí)際價(jià)值的一半。如果兩個(gè)投標(biāo)者知道他們的估價(jià)相同,即信息是完全的,買者之間的競爭將使賣者得到買者價(jià)值的全部。四、“說實(shí)話”的直接機(jī)制能保證博弈方都按他們的真實(shí)類型行為并獲得理想的結(jié)果。 答:“說實(shí)話的直接機(jī)制”。即如果所
13、設(shè)計(jì)的直接機(jī)制能使得各投標(biāo)人講真話,也就是聲明自己的真實(shí)類型(如對(duì)商品的真實(shí)價(jià)值)是貝葉斯納什均衡,則稱這樣的直接機(jī)制為“說實(shí)話的直接機(jī)制”。也稱為“激勵(lì)相容”或“鼓勵(lì)響應(yīng)”機(jī)制。如果代理人從講真話中得到稍高的效用,則講真話變?yōu)閺?qiáng)均衡。事實(shí)上,如果講真話的效用足夠強(qiáng),則代理問題以及與之相聯(lián)系的成本將會(huì)消失,能保證博弈方都按他們的真實(shí)類型行為并獲得理想的結(jié)果。五、靜態(tài)貝葉斯博弈中之所以博弈方需要針對(duì)自己的所有可能類型設(shè)定行為選擇,是因?yàn)槟軌蛎曰笃渌┺姆?,從而可以獲得對(duì)自己更有利的均衡。答:正確。不完全信息靜態(tài)博弈的靜態(tài)貝葉斯納什均衡實(shí)際上是這樣一種類型依從型戰(zhàn)略組合給定自己的類型和別人類型的概
14、率分布情況下,每個(gè)參與人最大化自己的期望效用。博弈方需要針對(duì)自己的所有可能類型設(shè)定行為選擇,是因?yàn)槟軌蛎曰笃渌┺姆?,從而可以獲得對(duì)自己更有利的均衡六、什么是貝葉斯納什均衡?答:n 人不完全信息靜態(tài)博弈:的純戰(zhàn)戰(zhàn)略貝葉斯納什均衡是一個(gè)類型依存戰(zhàn)略組合,其中每個(gè)參與人i 在給定自己的類型 和其他參與人類型依存戰(zhàn)略 ,的情況下最大化自己的期望效用函數(shù) ,換言之,戰(zhàn)略組合 是一個(gè)貝葉斯納什均衡,如果對(duì)于所有的i, 有 ,貝葉斯納什均衡實(shí)際上是這樣一種類型依從型戰(zhàn)略組合給定自己的類型和別人類型的概率分布情況下,每個(gè)參與人最大化自己的期望效用。七、拍賣(招標(biāo))有哪幾種常用的方式? 答:(1)最高價(jià)格密封
15、出價(jià)拍賣(一級(jí)密封價(jià)格拍賣)(2)次高價(jià)格密封出價(jià)拍賣(維克瑞拍賣)(3)雙方叫價(jià)拍賣(4)最高價(jià)格公開出價(jià)拍賣(英國式拍賣)(5)降價(jià)式拍賣(荷蘭式拍賣)八、機(jī)制設(shè)計(jì)的基本原理是什么?什么是“直接機(jī)制”與“顯示原理”?答:機(jī)制設(shè)計(jì)的基本原理是:選擇一個(gè)博弈規(guī)則,最大化自己的期望效用函數(shù)。直接機(jī)制:所謂直接機(jī)制,就是指代理人(這里的買者)的戰(zhàn)略空間(拍賣中買者的報(bào)價(jià))等同于類型空間(拍賣中買者的價(jià)值)。其意義是只要代理人聲明他們對(duì)拍賣商品的價(jià)值,并不需要他們報(bào)出標(biāo)價(jià),委托人(賣方)會(huì)根據(jù)預(yù)先確定的運(yùn)作機(jī)制(包括一個(gè)隨機(jī)選擇過程)來確定中標(biāo)者和中標(biāo)價(jià)格。顯示原理:顯示原理對(duì)每個(gè)導(dǎo)致可能說謊(即
16、的機(jī)制,其代理人的得益為 ( ),存在著一個(gè)機(jī)制,代理人的得益為 ( )使其對(duì)于每個(gè) (講真話)的代理人得到相同的結(jié)果,這時(shí),代理人將沒有說謊話的積極性。練習(xí)題(六)一、假如某商品的確切價(jià)值是100,這只有賣方知道,你作為買方只知道該商品的價(jià)值標(biāo)準(zhǔn)分布于80,110上。假設(shè)因?yàn)槭欠e壓品或需要回蘢資金,因此賣方對(duì)該商品的主觀價(jià)值評(píng)價(jià)是在客觀價(jià)值上打7折,這一點(diǎn)你也知道。如果交易價(jià)格由賣方提出,你只能選擇是否接受,問該博弈中賣方和買方(你)的合理戰(zhàn)略是什么?答:二、假如在一個(gè)經(jīng)濟(jì)案件中,原告清楚上法庭自己是否會(huì)贏,而且這是原被告的共同知識(shí),而被告不清楚誰會(huì)贏,只知道原告贏的可能性是1/3。再假設(shè)原
17、告贏時(shí)的凈利益為3,被告的凈利益為-4;原告敗訴時(shí)的凈利益為-1,被告的凈利益為0。如果原告在起訴之前可以先要求被告賠償M=1或M=2和解,被告接受就不上法庭,拒絕則上法庭。用擴(kuò)展形表示該博弈,并找出該博弈的均衡。 答:三、什么是精煉貝葉斯均衡?答:精煉貝葉斯均衡是所有參與人戰(zhàn)略和信念的一種結(jié)合。它滿足如下條件:第一,在給定每個(gè)參與人有關(guān)其他參與人類型的信念的條件下,該參與人的戰(zhàn)略選擇是最優(yōu)的。第二,每個(gè)參與人關(guān)于其他參與人所屬類型的信念,但是使用貝葉斯法則從所觀察到的行為中獲得的。四、什么是混同均衡與分離均衡?有什么作用?答:混同均衡:是指在這種均衡中,不同類型的參與人i選擇相同的行動(dòng),這時(shí)
18、,其他參與人無法從觀察到的行動(dòng)中得到的信息來識(shí)別參與人i的類型,也就無法對(duì)先驗(yàn)概率進(jìn)行修正。分離均衡:就是指在這種均衡中,不同類型的參與人i以概率1選擇不同的行動(dòng),也就是說,沒有不同類型的選擇同一種行動(dòng)。行動(dòng)的信息準(zhǔn)確地反映其類型,這樣,其他參與人就可以從觀察到的行動(dòng)中得到的信息來識(shí)別參與人i的類型,也就可以據(jù)此信息對(duì)先驗(yàn)概率進(jìn)行修正。五、精煉貝葉斯均衡再精煉的方法有哪些?答:用于精煉貝葉斯均衡的再精煉方法有:(1)澤爾滕在1975年提出的“顫抖手均衡”(2) 克瑞普斯(Kreps)和威爾遜(Wilson)在1982年提出的“序貫均衡”(3) 梅耶森(Myerson)在1978年提出的“恰當(dāng)均衡”(4) 考爾伯格(Kohlberg)和默頓(Merten)在1986年提出的“穩(wěn)定均衡”六、假設(shè)你是一家證券公司的人事經(jīng)理,需要為公司招聘10名操盤手。若用博弈論和信息經(jīng)濟(jì)學(xué)的思想和原理考慮,你的招聘計(jì)劃中應(yīng)包括哪些要點(diǎn)?答:招聘博弈模型:局中人:招聘方與應(yīng)聘者。 策略選擇:應(yīng)聘者有兩種策略,欺騙或不欺騙;招聘方也有兩種策略,相信或不相信應(yīng)聘者。: 要從兩方面采取措施,防范和規(guī)避招聘風(fēng)險(xiǎn): 1、設(shè)法使應(yīng)聘者采取誠信的態(tài)度。 (1)降低應(yīng)聘者欺騙成
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 一站式購物中心樓層委托管理服務(wù)協(xié)議
- 區(qū)塊鏈服務(wù)器托管與數(shù)據(jù)加密服務(wù)協(xié)議
- 工業(yè)液壓系統(tǒng)濾芯租賃與智能檢測合同
- 同聲傳譯翻譯服務(wù)項(xiàng)目變更補(bǔ)充合同
- 國際會(huì)議同傳耳機(jī)消毒租賃與現(xiàn)場翻譯支持服務(wù)協(xié)議
- 智能家居生態(tài)鏈建設(shè)與合作知識(shí)產(chǎn)權(quán)保護(hù)協(xié)議
- 醫(yī)療器械臨床試驗(yàn)項(xiàng)目風(fēng)險(xiǎn)管理與應(yīng)對(duì)協(xié)議
- 虛擬現(xiàn)實(shí)影視預(yù)演系統(tǒng)租賃與服裝租賃協(xié)議
- DB42-T 2037.1-2023 梨形環(huán)棱螺養(yǎng)殖技術(shù)規(guī)程 第1部分:苗種繁育
- “然”用法總結(jié)模版
- 荷蘭語常用詞匯
- 移動(dòng)通信原理和系統(tǒng)習(xí)題答案
- 《動(dòng)畫素描》第一章 動(dòng)畫素描概述
- 無軌膠輪車運(yùn)行標(biāo)準(zhǔn)作業(yè)流程
- GB/T 12513-2006鑲玻璃構(gòu)件耐火試驗(yàn)方法
- 公路工程施工現(xiàn)場安全檢查手冊(cè)
- 部編版小學(xué)語文六年級(jí)下冊(cè)《采薇》課件(完美)
- 激光跟蹤儀使用手冊(cè)
- 馬家河金礦選礦試驗(yàn)報(bào)告
- “新時(shí)代好少年”推薦表
- 園林綠化工程監(jiān)理實(shí)施細(xì)則(完整版)
評(píng)論
0/150
提交評(píng)論