版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、經(jīng)濟博弈論方法第四部分1第六章 完全信息靜態(tài)博弈博弈的基本概念納什均衡納什均衡應(yīng)用混合策略和混合策略納什均衡2伐木工人的決策和一個將軍的決策有什么不同?木頭沒有反抗。將軍的每一步計劃都會引來抵抗,他必須克服這種抵抗。你!你的對手、競爭者都是聰明有主見的!3社會科學(xué)研究策略性決策制定過程的分支稱為 博弈論。嚴(yán)格講,博弈論不是經(jīng)濟學(xué)的一個分支,它是一種方法,涉及到很多領(lǐng)域:實際上,博弈論是數(shù)學(xué)的一個分支。4策略故事妙手傳奇給貓拴個鈴鐺多管齊下三思而后行5引言博弈論諾貝爾經(jīng)濟學(xué)獎納什(Nash) (1950-1951)澤爾騰(selten) (1965,1975)海薩尼(Harsanyi) (196
2、7-1968)共同獲得1994年諾貝爾經(jīng)濟學(xué)獎6數(shù)學(xué)界的梵高“瘋子天才”納什 7三位大師主要的貢獻 1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟均衡的內(nèi)在聯(lián)系。因為在現(xiàn)實世界中,非合作博弈要比合作博弈普遍得多。 8Selten and Harsanyi澤爾騰(1965)將納什均衡的概念引入了動態(tài)分析,提出了“精煉納什均衡”概念;以及進一步刻畫不完全信息動態(tài)博弈的“完備貝葉斯納什均衡”。而海薩尼則發(fā)展了刻畫不完全信息靜態(tài)博弈的“貝葉斯納什均衡”(196
3、71968)。總之,他倆進一步將納什均衡動態(tài)化,加入了接近實際的不完全信息條件。他們的工作為后人繼續(xù)發(fā)展博弈論,提供了基本思路和模型 。9諾貝爾經(jīng)濟學(xué)獎1968年,瑞典中央銀行成立300周年,是為了紀(jì)念諾貝爾獎獎金提供者,設(shè)立諾貝爾經(jīng)濟學(xué)獎。1969年開始頒發(fā)。10從游戲到博弈游戲的特點:下棋,打牌,賭勝,田徑,球類等等,共同的特點是 策略 策略的好壞決定游戲的結(jié)果游戲的特征:規(guī)則,結(jié)果,策略,策略和利益的依存性11什么是博弈論?博弈論:就是關(guān)于包含相互依存情況中理性行為的研究。相互依存 :通常是指博弈中的任何一個局中人受到其他局中人的行為的影響,反過來,他的行為也影響到其他局中人。 相互依存
4、的另一個方面是局中人可以有某些共同的興趣或利益所在。 “理性行為”的說明:博弈論中的所謂理性,一般不是指道德標(biāo)準(zhǔn)。 12博弈三要素博弈方(局中人)-參與博弈但利益不完全一致者。有二人博弈與多人博弈之分。策略集-每個局中人都會有一系列的策略可選,稱為對應(yīng)于每個局中人的策略集。有限和無限個對策。得益-在每策略組合下每一局中人的得益情況,是選擇策略的標(biāo)準(zhǔn),稱為得益函數(shù)或支付函數(shù)。13博弈的關(guān)鍵 局中人理性地采取或選擇自己的策略行為,在相互制約相互影響的依存關(guān)系中,盡可能的提高自己的利益所得,這樣,博弈論就是關(guān)于包含相互依存情況中理性行為的研究。 相互依存 理性行為14博弈的四種分類情況完全信息靜態(tài)博
5、弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈15博弈的分類及對應(yīng)的均衡靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈;納什均衡;Nash(1950)完全信息動態(tài)博弈;子博弈精煉納什均衡;澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均衡;海薩尼(1967-1968)不完全信息動態(tài)博弈,精煉貝葉斯納什均衡;澤爾騰(1975)Kreps,Wilson(1982),Fudenberg,Tirole(1991)16納什均衡納什均衡的定義納什均衡的一致預(yù)測性納什均衡與嚴(yán)格下策反復(fù)消去法17納什均衡的定義 各博弈方都不愿或不會單獨改變自己策略的策略組合,只要這種策略組合存在且是唯一的,博弈就有絕對
6、確定的解。這種各博弈方都不愿單獨改變策略的策略組合就是博弈論中最重要的一個概念“納什均衡”。18 我們常用G表示一個博弈; 如G有n個博弈方,每個博弈方的全部可選策略的集合我們稱策略空間,分別用 表示; 用 表示博弈方i的第j個策略,其中j可取有限個值(有限策略博弈),也可取無限個值(無限策略博弈);博弈方i的得益則用 表示, 是各博弈方策略的多元函數(shù)。n個博弈方的博弈G常寫成19定義 在博弈 中,如果由各個博弈方的各一個策略組成的某個策略組合 中,任一博弈方i的策略 ,都是對其余博弈方策略的組合 的最佳策略,即 對任意 都成立,則稱 為G 的一個“納什均衡”。 20納什均衡的一致預(yù)測性 如果
7、所有博弈方預(yù)測到一個特定的納什均衡將會出現(xiàn),那么,沒有人有興趣作不同的選擇。 納什均衡的特征:博弈方預(yù)測到均衡,博弈方預(yù)測到其他博弈方預(yù)測到均衡,等等。 一致性預(yù)測,并不意味著納什均衡一定是一個好的預(yù)測。 21納什均衡應(yīng)用 兩個嫌犯受到指控,但除非至少一個招認(rèn),否則警方不能將二人判有罪。警察把二人分別帶到不同的房間,告之后果: 如果二人均不坦白,將被判入獄一年。 如果雙方均坦白,將被判入獄5年。 如果一方坦白,另一方不坦白,坦白一 方立即釋放,另一方判入獄8年。 22囚徒2囚徒1不坦白坦白不坦白1,18, 0坦白0,85,523囚徒困境說明了什么在(坦白、坦白)這個組合中,和都不能通過單方面的
8、改變行動增加自己的收益,于是誰也沒有動力游離這個組合,因此這個組合是納什均衡,也叫非合作均衡。囚徒困境反映了個人理性和集體理性的矛盾。如果和都選擇不坦白,各判刑年,顯然比都選擇坦白各判刑年好得多。當(dāng)然,和可以在被警察抓到之前訂立一個“攻守同盟”,但是這可能不會有用,因為它不構(gòu)成納什均衡,沒有人有積極性遵守這個協(xié)定,顯然最好的策略是雙方都不坦白。 24囚徒困境的意義 “囚徒的兩難選擇”有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與不坦白策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先
9、替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁的結(jié)果。 25雙寡頭削價競爭 寡頭2 高價 低價寡 高價頭2 低價100,10020,150150,2070,7026對經(jīng)典經(jīng)濟學(xué)的沖擊“納什均衡”首先對亞當(dāng)斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。國富論:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益?!?7從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提出的
10、悖論實際上動搖了西方經(jīng)濟學(xué)的基石。 28研究囚徒困境問題的目的 利用這種困境達到有利于社會的目的 政府在經(jīng)濟活動中的組織協(xié)調(diào)工作的必要性 避免囚徒困境29混合策略納什均衡混合策略混合策略博弈混合策略納什均衡混合策略和嚴(yán)格下策反復(fù)消去法30 許多現(xiàn)實中決策問題構(gòu)成的博弈中根本不存在具有穩(wěn)定性的各博弈方都接受的納什均衡策略組合如猜硬幣博弈和齊威王田忌賽馬,而另一些博弈卻有多于一個的納什均衡策略組合,如夫妻之爭博弈。這兩類博弈如果只進行一次,實際結(jié)果如何確實取決于機會和運氣,如果多次獨立反復(fù)進行這些博弈,這樣博弈方?jīng)Q策的好壞就會從平均得益上反映出來,策略運用得當(dāng)平均收益會較理想,至少是不吃虧,否則平
11、均得益就會很差。31概念的引進32 在這種博弈中各博弈方?jīng)Q策的第一個原則:自己的策略選擇千萬不能預(yù)先被另一方偵知或猜到。 這就是說博弈方必須隨機地選擇策略。 其次,在本博弈中,如果蓋硬幣方雖然是隨機決定出正面還是反面,但如果在總體上出正面多于出反面,即出正面的概率大于出反面的概率,則猜硬幣方還是有機可乘。33 設(shè)蓋硬幣方出正面的概率為p,則出反面的概率為1-p出正面多于出反面,即p1-p或p12。在這種情況下,如猜硬幣方全猜正面,則他的期望得益:即平均來講,猜硬幣方一定是贏多輸少。34 雙方都按照上述概率隨機選擇策略,即在本博弈中,博弈方的決策內(nèi)容不是確定性的具體的策略,而是在一些策略中隨機選
12、擇的概率分布,這樣的決策我們稱為“混合策略”。35定義 在博弈 中;博弈方i的策略空間為 ,則博棄方i以概率分布 隨機在其k個可選策略中選擇的“策略”,稱為一個“混合策略”,其中 都成立, 且36 相對于這種以一定概率分布在一些策略中隨機選擇的混合策略,確定性的具體的策略我們稱為“純策略”,而我們原來意義上的納什均衡,即任何博弈方都不愿單獨改變策略的純策略組成的策略組合現(xiàn)在可稱為“純策略納什均衡”。當(dāng)然,純策略也可以看作混合策略的特例。 37 純策略可以看作,選擇相應(yīng)純策略的概率為1,選擇其余純策略的概率為0的混合策略。混合策略可以看作純策略的擴展。38 引進了混合策略的概念以后,我們可將納什
13、均衡的概念擴大到包括混合策略的情況。對各博弈方的一個策略組合,不管它是純策略組成的還是混合策略組成的,只要滿足各博弈方都不會想要單獨偏離它,我們就稱之為一個納什均衡。如果確實是一個嚴(yán)格意義上的混合策略組合構(gòu)成的納什均衡,稱為“混合策略納什均衡”。 39 猜硬幣博弈中兩博弈方都以(1/2,1/2)的概率分布隨機選擇正面和反面的混合策略組合,就是一個混合策略納什均衡。 期望得益: 零和博弈! 40應(yīng)用例子41 本博弈中兩博弈方?jīng)Q策的第一個原則是不能讓對方知道或猜到自己的選擇,因而必須在決策時利用隨機性。第二個原則是他們選擇每種策略的概率一定要恰好使對方無機可乘。42 設(shè)博弈方1選A的概率為pA,選
14、B的概率為pB,博棄方2選C的概率為pC,選D的概率為pD。根據(jù)上述第二個原則,博弈方1選A和B的概率,一定要使博弈方2選C的期望得益和選D的期望得益相等,即: 這是博弈方1的混合策略。 43 同理,博弈方2的混合策略為 博弈方1以(0.8,0.2)的概率隨機選擇A和B,博弈方2以(0.8,0.2)的概率隨機選擇C和D,由于這時誰都無法通過改變自己的混合策略(概率 分布)而改善自己的得益(期望得益)、因此這樣的混合策略組合是穩(wěn)定的,是一個混合策略納什均衡。44 該混合策略納什均衡的期望結(jié)果(即雙方的期望得益)分別為: 45 雖然單獨一次博弈的結(jié)果可能是四組得益中的任何一組但是多次獨立重復(fù)博弈的
15、平均結(jié)果卻應(yīng)該是雙方各得2.6。 46 混合策略和混合策略均衡的概念不僅可用在不存在純策略納什均衡的博弈問題中(這種問題各博弈方之間的利益總是有一定的對立性),在沒有確定性結(jié)果的博弈、即存在多個純策略納什均衡的博弈(這種博弈中博弈方之間的利益有相當(dāng)?shù)囊恢滦?中也可運用。 47第七章 完全信息動態(tài)博弈完全且完美信息動態(tài)博弈子博弈完美納什均衡應(yīng)用舉例48動態(tài)博弈的表示法和特點 階段和表示法動態(tài)博弈的基本特點49階段 動態(tài)博弈中一個博弈方的一次行為稱為一個“階段”。由于每個博弈方在動態(tài)博弈中可能不止一次行為,因此,每個博弈方在一個動態(tài)博弈中就可能有數(shù)個甚至許多個博弈階段。50擴展形表示法51動態(tài)博弈
16、的基本特點動態(tài)博弈的策略 動態(tài)博弈的策略取決于他們整個博弈過程中的行為,因此我們主要討論的是各博弈方在這些動態(tài)博弈中決策的全部內(nèi)容,即各博弈方在每次輪到行為時,針對每種可能的情況如何選擇的完整的行動計劃,我們將這種行動計劃稱為博弈方的“策略”。 劉備過江招親(三個錦囊+親自過江)52動態(tài)博弈的結(jié)果 雙方(或多方)采用的策略組合,實現(xiàn)的博弈路徑和各博弈方的得益。動態(tài)博弈的非對稱性 因為博弈方的選擇行為有先后次序,后行為者可能觀察到前面的選擇行為,各博弈方的地位是不對稱的。53可信性問題 動態(tài)博弈的一個中心問題是“可信性”問題。所謂可信性是指動態(tài)博弈中先行為的博弈方是否該相信后行為的博弈方會采取對
17、自已有利的或不利的行為。因為后行為方將來會采取對先行為方有利的行為相當(dāng)于一種“許諾”,而將來會采取對先行為方不利的行為相當(dāng)于一種“威脅”,因此我們可將可信性分為“許諾的可信性”和“威脅的可信性”。54開金礦博弈55乙如何決策呢? 乙最需要關(guān)心的就是甲采到金子后是否會履行諾言跟自己平分,因為萬一甲采到金子后不但不跟乙平分,而且還賴帳或卷款潛逃,則乙連自己的本錢都收不回來。 關(guān)鍵的是要判斷甲的許諾是否可信! 以自身利益最大化原則,甲必然選擇不分! 乙清楚甲的行為準(zhǔn)則,最好的選擇是不借! 對乙來說,甲的許諾是不可信的! 56增加對甲的約束 加上第三階段,乙的利益受到法律保護,甲的許諾是可信的。57法
18、律保障不足的開金礦博弈乙的第三階段的打官司的威脅是不可信的。乙只有選擇不借!58結(jié)論 從本博弈的分析可以看出,在一個個體都有私心,都只注重自身的利益的社會里,完善公正的法律制度不淡能夠保障社會的公平,還能提高社會經(jīng)濟活動的效率,是實現(xiàn)最有效率的社會分工的重要保障。 可信性是動態(tài)博弈分析的一個中心問題。59打擊的威脅是可信的1選擇不進!60打擊的威脅是不可信的1選擇進!結(jié)果路徑為(進,不打擊)得益(5,8)61子博弈完美納什均衡動態(tài)博弈中的子博弈逆推歸納法子博弈完美納什均衡62動態(tài)博弈中的子博弈虛線框出的部分正是博弈方2在博弈方1選擇進時所面臨的決策問題,它本身構(gòu)成博弈方2的一個單人博弈,我們稱
19、它為原先來后到博弈的一個“子博弈”。6364子博弈定義 由一個動態(tài)博弈第一階段以外的某個階段開始的后續(xù)博弈階段構(gòu)成,它必須有初始信息集,具備進行博弈所需要的各種信息,能夠自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個“子博弈”。65遞推歸納法 從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應(yīng)博弈方的行為選擇,一直到第一個階段的分析方法。 66博弈方2選擇打擊,博弈方選擇不進67應(yīng)用6869 我們用上述兩個簡單的例子演示了逆推歸納法。逆推歸納法可以用于許多動態(tài)博弈的分析求解,除了有些不完美信息動態(tài)博弈以外,是解析動態(tài)博弈的基本方法。70子博弈完美納什均衡 上面用逆推歸納
20、法導(dǎo)出的動態(tài)博弈的結(jié)果是由各階段輪到行 為的博弈方的一種行為依次構(gòu)成的,如在開金礦32中結(jié)果為 (借,分),是由乙在第一階段的借和甲在第二階段的分構(gòu)成。當(dāng)然該博弈本來應(yīng)該有三個階段,但當(dāng)甲在第二階段選擇分時第三階段就沒有必要進行下去了因此結(jié)果中只有兩個階段的行為。71 我們需要的適合動態(tài)博弈的新的均衡概念必須滿足(1)既是納什均衡,從而具有策略穩(wěn)定性,(2)又不能包含任何的不會信守的許諾或威脅。這樣的動態(tài)博弈的策略組合稱為“子博弈完美納什均衡”。72塞爾頓(selten)1965年給出了子博弈完美納什均衡的定義: 如果動態(tài)博弈中各博弈方的策略在動態(tài)博弈本身和所有子博弈中都構(gòu)成一個納什均衡,則稱該策略組合為一個“子博弈完美納什均衡”。73 “子博弈完美納什均衡”是分析動態(tài)博弈,或者說完全且完美信息動
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 會計實習(xí)報告范文集錦八篇
- 中秋節(jié)三年級作文獲獎范文
- 山東xx產(chǎn)業(yè)園基礎(chǔ)設(shè)施項目可行性研究報告
- 國家級產(chǎn)業(yè)園基礎(chǔ)設(shè)施投資估算與資金籌措
- 2024年智能手機移動支付與金融業(yè)務(wù)合作協(xié)議3篇
- 2024年度合同效力爭議訴訟代理委托合同范本3篇
- 2024年水電安裝工程環(huán)保標(biāo)準(zhǔn)與質(zhì)量控制協(xié)議3篇
- 2024年地形測量與地籍調(diào)查合同范本3篇
- 2024年度企業(yè)社會責(zé)任宣傳推廣合作協(xié)議3篇
- 2024年水電運營管理協(xié)議3篇
- 肯德基儲備經(jīng)理面試問題及回答
- 2023年新版烏斯特統(tǒng)計公報即將發(fā)布
- 室外電氣工程施工組織設(shè)計方案
- 污水處理廠安全生產(chǎn)風(fēng)險分級管控體系方案全套資料匯編完整版
- prs7910數(shù)據(jù)網(wǎng)關(guān)機技術(shù)使用說明書
- 高危急性胸痛的快速診斷和誤診病案分析
- 全國英語等級考試三級全真模擬試題三
- 項目采購招標(biāo)方案
- GB/T 40169-2021超高分子量聚乙烯(PE-UHMW)和高密度聚乙烯(PE-HD)模塑板材
- GB/T 31579-2015糧油檢驗芝麻油中芝麻素和芝麻林素的測定高效液相色譜法
- GB/T 16552-2017珠寶玉石名稱
評論
0/150
提交評論