版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1,經(jīng)濟博弈論方法第四部分,2,第六章 完全信息靜態(tài)博弈,博弈的基本概念 納什均衡 納什均衡應用 混合策略和混合策略納什均衡,3,伐木工人的決策和一個將軍的決策有什么不同? 木頭沒有反抗。 將軍的每一步計劃都會引來抵抗,他必須克服這種抵抗。 你!你的對手、競爭者都是聰明有主見的!,4,社會科學研究策略性決策制定過程的分支稱為 博弈論。 嚴格講,博弈論不是經(jīng)濟學的一個分支,它是一種方法,涉及到很多領(lǐng)域: 實際上,博弈論是數(shù)學的一個分支。,5,策略故事,妙手傳奇 給貓拴個鈴鐺 多管齊下 三思而后行,6,引言,博弈論 諾貝爾經(jīng)濟學獎 納什(Nash) (1950-1951) 澤爾騰(selten)
2、(1965,1975) 海薩尼(Harsanyi) (1967-1968) 共同獲得1994年諾貝爾經(jīng)濟學獎,7,數(shù)學界的梵高“瘋子天才”納什,8,三位大師主要的貢獻,1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟均衡的內(nèi)在聯(lián)系。因為在現(xiàn)實世界中,非合作博弈要比合作博弈普遍得多。,9,Selten and Harsanyi,澤爾騰(1965)將納什均衡的概念引入了動態(tài)分析,提出了“精煉納什均衡”概念;以及進一步刻畫不完全信息動態(tài)博弈的“完備貝葉斯納什均
3、衡”。 而海薩尼則發(fā)展了刻畫不完全信息靜態(tài)博弈的“貝葉斯納什均衡”(19671968)??傊麄z進一步將納什均衡動態(tài)化,加入了接近實際的不完全信息條件。他們的工作為后人繼續(xù)發(fā)展博弈論,提供了基本思路和模型 。,10,諾貝爾經(jīng)濟學獎,1968年,瑞典中央銀行成立300周年,是為了紀念諾貝爾獎獎金提供者,設(shè)立諾貝爾經(jīng)濟學獎。 1969年開始頒發(fā)。,11,從游戲到博弈,游戲的特點:下棋,打牌,賭勝,田徑,球類等等,共同的特點是 策略 策略的好壞決定游戲的結(jié)果 游戲的特征:規(guī)則,結(jié)果,策略,策略和利益的依存性,12,什么是博弈論?,博弈論:就是關(guān)于包含相互依存情況中理性行為的研究。 相互依存 :通常
4、是指博弈中的任何一個局中人受到其他局中人的行為的影響,反過來,他的行為也影響到其他局中人。 相互依存的另一個方面是局中人可以有某些共同的興趣或利益所在。 “理性行為”的說明:博弈論中的所謂理性,一般不是指道德標準。,13,博弈三要素,博弈方(局中人)-參與博弈但利益不完全一致者。有二人博弈與多人博弈之分。 策略集-每個局中人都會有一系列的策略可選,稱為對應于每個局中人的策略集。有限和無限個對策。 得益-在每策略組合下每一局中人的得益情況,是選擇策略的標準,稱為得益函數(shù)或支付函數(shù)。,14,博弈的關(guān)鍵,局中人理性地采取或選擇自己的策略行為,在相互制約相互影響的依存關(guān)系中,盡可能的提高自己的利益所得
5、,這樣,博弈論就是關(guān)于包含相互依存情況中理性行為的研究。 相互依存 理性行為,15,博弈的四種分類情況,完全信息靜態(tài)博弈 完全信息動態(tài)博弈 不完全信息靜態(tài)博弈 不完全信息動態(tài)博弈,16,博弈的分類及對應的均衡,17,納什均衡,納什均衡的定義 納什均衡的一致預測性 納什均衡與嚴格下策反復消去法,18,納什均衡的定義,各博弈方都不愿或不會單獨改變自己策略的策略組合,只要這種策略組合存在且是唯一的,博弈就有絕對確定的解。這種各博弈方都不愿單獨改變策略的策略組合就是博弈論中最重要的一個概念“納什均衡”。,19,我們常用G表示一個博弈; 如G有n個博弈方,每個博弈方的全部可選策略的集合我們稱策略空間,分
6、別用 表示; 用 表示博弈方i的第j個策略,其中j可取有限個值(有限策略博弈),也可取無限個值(無限策略博弈);博弈方i的得益則用 表示, 是各博弈方策略的多元函數(shù)。n個博弈方的博弈G常寫成,20,定義,在博弈 中,如果由各個博弈方的各一個策略組成的某個策略組合 中,任一博弈方i的策略 ,都是對其余博弈方策略的組合 的最佳策略,即 對任意 都成立,則稱 為G 的一個“納什均衡”。,21,納什均衡的一致預測性,如果所有博弈方預測到一個特定的納什均衡將會出現(xiàn),那么,沒有人有興趣作不同的選擇。 納什均衡的特征:博弈方預測到均衡,博弈方預測到其他博弈方預測到均衡,等等。 一致性預測,并不意味著納什均衡
7、一定是一個好的預測。,22,納什均衡應用,兩個嫌犯受到指控,但除非至少一個招認,否則警方不能將二人判有罪。警察把二人分別帶到不同的房間,告之后果: 如果二人均不坦白,將被判入獄一年。 如果雙方均坦白,將被判入獄5年。 如果一方坦白,另一方不坦白,坦白一 方立即釋放,另一方判入獄8年。,23,24,囚徒困境說明了什么,在(坦白、坦白)這個組合中,和都不能通過單方面的改變行動增加自己的收益,于是誰也沒有動力游離這個組合,因此這個組合是納什均衡,也叫非合作均衡。 囚徒困境反映了個人理性和集體理性的矛盾。如果和都選擇不坦白,各判刑年,顯然比都選擇坦白各判刑年好得多。當然,和可以在被警察抓到之前訂立一個
8、“攻守同盟”,但是這可能不會有用,因為它不構(gòu)成納什均衡,沒有人有積極性遵守這個協(xié)定,顯然最好的策略是雙方都不坦白。,25,囚徒困境的意義,“囚徒的兩難選擇”有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導致的最終結(jié)局是一個“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與不坦白策略上首先想到自己,這樣他們必然要服長的刑期。只有當他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁的結(jié)果。,26,雙寡頭削價競爭,寡頭2 高價 低價 寡 高價 頭 2 低價,27,對經(jīng)典經(jīng)濟學的沖擊,“納什均衡”首先對亞當斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密
9、的理論,在市場經(jīng)濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。 國富論:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。”,28,從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提出的悖論實際上動搖了西方經(jīng)濟學的基石。,29,研究囚徒困境問題的目的,利用這種困境達到有利于社會的目的 政府在經(jīng)濟活動中的組織協(xié)調(diào)工作的必要性 避免囚徒困境,30,混合策略納什均衡,混合策略 混合策略博弈 混合策略納什均衡 混合策略和嚴格下策反復消去法,31,許
10、多現(xiàn)實中決策問題構(gòu)成的博弈中根本不存在具有穩(wěn)定性的各博弈方都接受的納什均衡策略組合如猜硬幣博弈和齊威王田忌賽馬,而另一些博弈卻有多于一個的納什均衡策略組合,如夫妻之爭博弈。這兩類博弈如果只進行一次,實際結(jié)果如何確實取決于機會和運氣,如果多次獨立反復進行這些博弈,這樣博弈方?jīng)Q策的好壞就會從平均得益上反映出來,策略運用得當平均收益會較理想,至少是不吃虧,否則平均得益就會很差。,32,概念的引進,33,在這種博弈中各博弈方?jīng)Q策的第一個原則:自己的策略選擇千萬不能預先被另一方偵知或猜到。 這就是說博弈方必須隨機地選擇策略。 其次,在本博弈中,如果蓋硬幣方雖然是隨機決定出正面還是反面,但如果在總體上出正
11、面多于出反面,即出正面的概率大于出反面的概率,則猜硬幣方還是有機可乘。,34,設(shè)蓋硬幣方出正面的概率為p,則出反面的概率為1-p出正面多于出反面,即p1-p或p12。在這種情況下,如猜硬幣方全猜正面,則他的期望得益: 即平均來講,猜硬幣方一定是贏多輸少。,35,雙方都按照上述概率隨機選擇策略,即在本博弈中,博弈方的決策內(nèi)容不是確定性的具體的策略,而是在一些策略中隨機選擇的概率分布,這樣的決策我們稱為“混合策略”。,36,定義,在博弈 中;博弈方i的策略空間為 ,則博棄方i以概率分布 隨機在其k個可選策略中選擇的“策略”,稱為一個“混合策略”,其中 都成立, 且,37,相對于這種以一定概率分布在
12、一些策略中隨機選擇的混合策略,確定性的具體的策略我們稱為“純策略”,而我們原來意義上的納什均衡,即任何博弈方都不愿單獨改變策略的純策略組成的策略組合現(xiàn)在可稱為“純策略納什均衡”。當然,純策略也可以看作混合策略的特例。,38,純策略可以看作,選擇相應純策略的概率為1,選擇其余純策略的概率為0的混合策略。混合策略可以看作純策略的擴展。,39,引進了混合策略的概念以后,我們可將納什均衡的概念擴大到包括混合策略的情況。對各博弈方的一個策略組合,不管它是純策略組成的還是混合策略組成的,只要滿足各博弈方都不會想要單獨偏離它,我們就稱之為一個納什均衡。如果確實是一個嚴格意義上的混合策略組合構(gòu)成的納什均衡,稱
13、為“混合策略納什均衡”。,40,猜硬幣博弈中兩博弈方都以(1/2,1/2)的概率分布隨機選擇正面和反面的混合策略組合,就是一個混合策略納什均衡。 期望得益: 零和博弈!,41,應用例子,42,本博弈中兩博弈方?jīng)Q策的第一個原則是不能讓對方知道或猜到自己的選擇,因而必須在決策時利用隨機性。第二個原則是他們選擇每種策略的概率一定要恰好使對方無機可乘。,43,設(shè)博弈方1選A的概率為pA,選B的概率為pB,博棄方2選C的概率為pC,選D的概率為pD。根據(jù)上述第二個原則,博弈方1選A和B的概率,一定要使博弈方2選C的期望得益和選D的期望得益相等,即: 這是博弈方1的混合策略。,44,同理,博弈方2的混合策
14、略為 博弈方1以(0.8,0.2)的概率隨機選擇A和B,博弈方2以(0.8,0.2)的概率隨機選擇C和D,由于這時誰都無法通過改變自己的混合策略(概率 分布)而改善自己的得益(期望得益)、因此這樣的混合策略組合是穩(wěn)定的,是一個混合策略納什均衡。,45,該混合策略納什均衡的期望結(jié)果(即雙方的期望得益)分別為:,46,雖然單獨一次博弈的結(jié)果可能是四組得益中的任何一組但是多次獨立重復博弈的平均結(jié)果卻應該是雙方各得2.6。,47,混合策略和混合策略均衡的概念不僅可用在不存在純策略納什均衡的博弈問題中(這種問題各博弈方之間的利益總是有一定的對立性),在沒有確定性結(jié)果的博弈、即存在多個純策略納什均衡的博弈
15、(這種博弈中博弈方之間的利益有相當?shù)囊恢滦?中也可運用。,48,第七章 完全信息動態(tài)博弈,完全且完美信息動態(tài)博弈 子博弈完美納什均衡 應用舉例,49,動態(tài)博弈的表示法和特點,階段和表示法 動態(tài)博弈的基本特點,50,階段,動態(tài)博弈中一個博弈方的一次行為稱為一個“階段”。由于每個博弈方在動態(tài)博弈中可能不止一次行為,因此,每個博弈方在一個動態(tài)博弈中就可能有數(shù)個甚至許多個博弈階段。,51,擴展形表示法,52,動態(tài)博弈的基本特點,動態(tài)博弈的策略 動態(tài)博弈的策略取決于他們整個博弈過程中的行為,因此我們主要討論的是各博弈方在這些動態(tài)博弈中決策的全部內(nèi)容,即各博弈方在每次輪到行為時,針對每種可能的情況如何選擇
16、的完整的行動計劃,我們將這種行動計劃稱為博弈方的“策略”。 劉備過江招親(三個錦囊+親自過江),53,動態(tài)博弈的結(jié)果 雙方(或多方)采用的策略組合,實現(xiàn)的博弈路徑和各博弈方的得益。 動態(tài)博弈的非對稱性 因為博弈方的選擇行為有先后次序,后行為者可能觀察到前面的選擇行為,各博弈方的地位是不對稱的。,54,可信性問題,動態(tài)博弈的一個中心問題是“可信性”問題。所謂可信性是指動態(tài)博弈中先行為的博弈方是否該相信后行為的博弈方會采取對自已有利的或不利的行為。因為后行為方將來會采取對先行為方有利的行為相當于一種“許諾”,而將來會采取對先行為方不利的行為相當于一種“威脅”,因此我們可將可信性分為“許諾的可信性”
17、和“威脅的可信性”。,55,開金礦博弈,56,乙如何決策呢?,乙最需要關(guān)心的就是甲采到金子后是否會履行諾言跟自己平分,因為萬一甲采到金子后不但不跟乙平分,而且還賴帳或卷款潛逃,則乙連自己的本錢都收不回來。 關(guān)鍵的是要判斷甲的許諾是否可信! 以自身利益最大化原則,甲必然選擇不分! 乙清楚甲的行為準則,最好的選擇是不借! 對乙來說,甲的許諾是不可信的!,57,增加對甲的約束,加上第三階段,乙的利益受到法律保護,甲的許諾是可信的。,58,法律保障不足的開金礦博弈,乙的第三階段的打官司的威脅是不可信的。 乙只有選擇不借!,59,結(jié)論,從本博弈的分析可以看出,在一個個體都有私心,都只注重自身的利益的社會
18、里,完善公正的法律制度不淡能夠保障社會的公平,還能提高社會經(jīng)濟活動的效率,是實現(xiàn)最有效率的社會分工的重要保障。 可信性是動態(tài)博弈分析的一個中心問題。,60,打擊的威脅是可信的,1選擇不進!,61,打擊的威脅是不可信的,1選擇進! 結(jié)果路徑為(進,不打擊) 得益(5,8),62,子博弈完美納什均衡,動態(tài)博弈中的子博弈 逆推歸納法 子博弈完美納什均衡,63,動態(tài)博弈中的子博弈,虛線框出的部分正是博弈方2在博弈方1選擇進時所面臨的決策問題,它本身構(gòu)成博弈方2的一個單人博弈,我們稱它為原先來后到博弈的一個“子博弈”。,64,65,子博弈定義,由一個動態(tài)博弈第一階段以外的某個階段開始的后續(xù)博弈階段構(gòu)成,
19、它必須有初始信息集,具備進行博弈所需要的各種信息,能夠自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個“子博弈”。,66,遞推歸納法,從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應博弈方的行為選擇,一直到第一個階段的分析方法。,67,博弈方2選擇打擊,博弈方選擇不進,68,應用,69,70,我們用上述兩個簡單的例子演示了逆推歸納法。逆推歸納法可以用于許多動態(tài)博弈的分析求解,除了有些不完美信息動態(tài)博弈以外,是解析動態(tài)博弈的基本方法。,71,子博弈完美納什均衡,上面用逆推歸納法導出的動態(tài)博弈的結(jié)果是由各階段輪到行 為的博弈方的一種行為依次構(gòu)成的,如在開金礦32中結(jié)果為 (
20、借,分),是由乙在第一階段的借和甲在第二階段的分構(gòu)成。當然該博弈本來應該有三個階段,但當甲在第二階段選擇分時第三階段就沒有必要進行下去了因此結(jié)果中只有兩個階段的行為。,72,我們需要的適合動態(tài)博弈的新的均衡概念必須滿足(1)既是納什均衡,從而具有策略穩(wěn)定性,(2)又不能包含任何的不會信守的許諾或威脅。這樣的動態(tài)博弈的策略組合稱為“子博弈完美納什均衡”。,73,塞爾頓(selten)1965年給出了子博弈完美納什均衡的定義:,如果動態(tài)博弈中各博弈方的策略在動態(tài)博弈本身和所有子博弈中都構(gòu)成一個納什均衡,則稱該策略組合為一個“子博弈完美納什均衡”。,74,“子博弈完美納什均衡”是分析動態(tài)博弈,或者說完全且完美信息動態(tài)博弈的關(guān)鍵概念。而逆推歸納法正是(至少
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年房地產(chǎn)項目委托工程監(jiān)理服務合同3篇
- 2025年度酒店客房墻面貼壁紙服務合同3篇
- 2025年度離婚后財產(chǎn)分割與子女贍養(yǎng)協(xié)議合同2篇
- 2025年新能源汽車租賃及維護服務合同范本
- 2025年度融資租賃合同標的物租賃終止及提前解約條件3篇
- 2025年建筑項目聯(lián)合開發(fā)合同6篇
- 2025-2030年中國香薰蠟燭市場運行動態(tài)及前景趨勢預測報告
- 2025-2030年中國飛輪儲能行業(yè)市場運行狀況及未來發(fā)展趨勢分析報告
- 2025-2030年中國輪椅行業(yè)市場未來發(fā)展趨勢及前景調(diào)研分析報告
- 期末 (試題) -2024-2025學年人教PEP版(2024)英語三年級上冊
- DB34∕T 4010-2021 水利工程外觀質(zhì)量評定規(guī)程
- 納米復合材料的增韌增能機制
- 圖書館前臺接待工作總結(jié)
- 衛(wèi)生院藥品管理制度
- 神經(jīng)外科進修匯報課件
- 2024老年人靜脈血栓栓塞癥防治中國專家共識(完整版)
- 騰訊營銷師認證考試題庫(附答案)
- 鄰近鐵路營業(yè)線施工安全監(jiān)測技術(shù)規(guī)程 (TB 10314-2021)
- 四年級上冊脫式計算100題及答案
- 資本市場與財務管理
評論
0/150
提交評論