非合作靜態(tài)博弈(new2)_第1頁
非合作靜態(tài)博弈(new2)_第2頁
非合作靜態(tài)博弈(new2)_第3頁
非合作靜態(tài)博弈(new2)_第4頁
非合作靜態(tài)博弈(new2)_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

引例:在一個風雨交加得夜晚,當你開著一輛豪華轎車經(jīng)過一個車站時,正好遇到三個人在焦急地等待公共汽車,一位是生命危在旦夕的老人;一位是曾經(jīng)救過你的命得醫(yī)生,可以說是你的恩人,你做夢都想報答他;還有一位是你一見傾心的異性,如果這次錯過了,你肯定一輩子都會后悔。但你的車卻只能在坐一個人。你到底會讓誰坐上你的車呢?

1知己知彼百戰(zhàn)不殆他的回答是,“把車鑰匙給醫(yī)生,讓他帶著老人去醫(yī)院看病,我留下來陪著一見鐘情的人雨中漫步?!?知己知彼百戰(zhàn)不殆什么是博弈呢?博弈實際上就是如何在現(xiàn)有條件下做出最優(yōu)選擇的一種策略。博弈論也叫做對策論,或稱賽局理論,是研究具有斗爭或競爭性質的現(xiàn)象的理論和方法??梢院唵蔚恼f,博弈論就是運用你的智慧和理性思維,在紛繁的選擇中能夠使你的利益達到最大化的一門科學。3知己知彼百戰(zhàn)不殆知己知彼百戰(zhàn)不殆4博弈分類:

合作、非合作:是否存在一個具有約束力的協(xié)議(bindingagreement)前者強調(diào)團體理性(效率、公正、公平)后者強調(diào)個人理性(最優(yōu)決策,不保證效率)知己知彼百戰(zhàn)不殆5完全信息與不完全信息:每一個局中人對自己及其它局中人是否有完全的了解;包括局中人特征、策略空間、盈利函數(shù)等知識。動態(tài)與靜態(tài):行動的先后順序;是否同時(或不同時但對方不知)。博弈論2014-1知己知彼百戰(zhàn)不殆6

靜態(tài)

動態(tài)

完全信息

完全信息靜態(tài)博弈納什均衡納什(1950,1951)

完全信息動態(tài)博弈子博弈精煉納什均衡澤爾滕(1965)

不完全信息

不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)

不完全信息動態(tài)博弈精煉貝葉斯納什均衡澤爾滕(1975)博弈論體系第二章

非合作博弈本章提要第一節(jié)占優(yōu)策略均衡第二節(jié)納什均衡的應用例子第三節(jié)古諾模型第四節(jié)非零和博弈8知己知彼百戰(zhàn)不殆第1節(jié)占優(yōu)策略與均衡一、嚴格占優(yōu)策略的定義博弈參與者進行策略選擇時,有可能存在某個策略的收益嚴格優(yōu)于其他策略的情況,該策略被稱為嚴格占優(yōu)策略(StrictlyDominantStrategy)。9知己知彼百戰(zhàn)不殆“囚徒困境”博弈與嚴格占優(yōu)策略不管嫌疑人乙選擇何種策略(坦白還是不坦白),嫌疑人甲的最優(yōu)策略都是坦白。在這種情況下,“坦白”是嫌疑人甲的嚴格占優(yōu)策略。不管嫌疑人甲選擇何種策略(坦白還是不坦白),嫌疑人乙的最優(yōu)策略都是坦白。因此“坦白”也是嫌疑人乙的嚴格占優(yōu)策略。嫌疑人乙坦白不坦白嫌疑人甲坦白(5,5)(1,10)不坦白(10,1)(2,2)10知己知彼百戰(zhàn)不殆二通過尋找嚴格占優(yōu)策略求解博弈均衡在尋找博弈均衡時,如果該博弈某參與者存在嚴格占優(yōu)策略,那么在博弈均衡中,該參與者會選擇嚴格占優(yōu)策略,而不會選擇其他策略。因為不管其他參與者選擇何種策略,該參與者選擇嚴格占優(yōu)策略的收益均高于選擇其他策略的收益。因此在博弈均衡中,理性參與者一定會選擇嚴格占優(yōu)策略。11知己知彼百戰(zhàn)不殆定理:

如果每個博弈參與者都存在一個嚴格占優(yōu)策略,那么在博弈中各參與者必然選擇其嚴格占優(yōu)策略。各博弈參與者的嚴格占優(yōu)策略構成博弈均衡12知己知彼百戰(zhàn)不殆占優(yōu)策略均衡:當一個博弈中的每位參與者都選擇了各自的占優(yōu)策略時,相應的博弈結果就是占優(yōu)策略均衡社會兩難博弈從整體利益考慮的解叫做博弈的合作解,一般占優(yōu)策略均衡形成的解都是非合作解,占優(yōu)策略均衡與合作解相悖,稱此類博弈為社會兩難問題解決途徑合約、法規(guī)、協(xié)議或其他手段使參與者們都能履行協(xié)調(diào)后的策略13知己知彼百戰(zhàn)不殆2政府干預煙草廣告博弈中的政府干預的積極作用1996.12.30,我國工商行政管理局禁止利用廣播、電影、電視、報紙等發(fā)布煙草廣告政府管制使廠商從“囚徒困境中”解放出來,說明自由競爭并不是最有效的經(jīng)濟體系,適當?shù)恼苤瓶梢愿行У奶岣呱鐣?jīng)濟和政治效益14B公司做廣告不做廣告A公司做廣告40,40100,20不做廣告20,10080,80知己知彼百戰(zhàn)不殆3努力還是偷懶15乙努力偷懶甲努力(10,10)(2,15)偷懶(15,2)(5,5)要改變合作困境,即改變博弈的均衡,可采取獎勤罰懶措施博弈的標準式知己知彼百戰(zhàn)不殆獎勵16乙努力偷懶甲努力(8,8)(8,0)偷懶(0,8)(0,0)合作博弈的獎賞矩陣乙努力偷懶甲努力(10,10)(2,15)偷懶(15,2)(5,5)乙努力偷懶甲努力(18,18)(10,15)偷懶(15,10)(5,5)知己知彼百戰(zhàn)不殆懲罰17乙努力偷懶甲努力(0,0)(0,-8)偷懶(-8,8)(-8,-8)合作博弈的懲罰矩陣乙努力偷懶甲努力(10,10)(2,15)偷懶(15,2)(5,5)乙努力偷懶甲努力(10,10)(2,7)偷懶(7,10)(-3,-3)知己知彼百戰(zhàn)不殆獎懲使占優(yōu)策略均衡與合作解18乙努力偷懶甲努力(a,a)(d,c)偷懶(c,d)(b,b)設(努力,努力)最大收益為a,(偷懶,偷懶)的最小收益為b,a>b.兩個參與者選擇不同策略時所得的收益分別為c、d(c>d)只要a>c>d>b,占優(yōu)策略均和合作解一致知己知彼百戰(zhàn)不殆一、納什均衡的定義給定其他參與者在博弈均衡時的策略,任何博弈參與者都沒有動機改變自己在博弈均衡時的策略選擇。這樣的均衡被稱為“納什均衡”(NashEquilibrium)。在某些博弈中,并不是所有博弈參與者都存在嚴格占優(yōu)策略均衡第二節(jié)納什均衡19知己知彼百戰(zhàn)不殆博弈論2014-1知己知彼百戰(zhàn)不殆20諾貝爾經(jīng)濟學獎獲得者薩繆爾森有一句話:你可以將一只鸚鵡訓練成一個經(jīng)濟學家,因為它只需要學習兩個詞:供給和需求。博弈論專家坎多瑞引申說:要成為現(xiàn)代經(jīng)濟學家,這只鸚鵡必須再多學一個詞,就是“納什均衡”。1.智豬博弈豬欄里養(yǎng)了兩頭豬,一頭大豬、一頭小豬。在豬圈的一端有一個盛食槽。在豬圈的另一端有一個按壓式開關。開關每被按壓一次,就有固定數(shù)量的食物出現(xiàn)在盛食槽中。大豬和小豬都在思考是否去按壓開關。21知己知彼百戰(zhàn)不殆如果大豬和小豬都去按壓開關,然后兩頭豬從開關處奔向豬圈另一端的盛食槽。由于大豬跑的快,小豬跑得慢,因此大豬會比小豬早到達盛食槽并把盛食槽內(nèi)的食物吃光。小豬付出了按壓開關的勞動卻沒有吃到食物。在此種情況下,大豬的收益為5,小豬的收益為-1。如果大豬去按壓開關,小豬在盛食槽旁等待。那么當大豬按下開關后,盛食槽內(nèi)出現(xiàn)食物,小豬立即開始吃,大豬則需要花一定時間從豬圈一端跑到另一端。當大豬到達盛食槽后,身強力壯的大豬會把小豬擠到一旁,吃光剩余的食物。在這種情況下,大豬得到的收益是4,小豬得到的收益是2。22知己知彼百戰(zhàn)不殆如果小豬去按壓開關,大豬在盛食槽旁等待。那么當小豬按下開關后,大豬開始吃,即使當小豬從開關處跑到盛食槽旁后,大豬仍然會霸占著食物,將食物全部吃光,小豬只能無可奈何地被擠在一旁。在這種情況下,大豬可以不勞而獲,得到的收益為10。小豬徒勞無功,看到大豬不勞而獲,更增加了小豬的郁悶,小豬得到收益-2。如果大豬和小豬都不去按壓開關,則大豬和小豬都無法吃到食物,大豬和小豬均得到收益0。23知己知彼百戰(zhàn)不殆小豬按開關等待大豬按開關(5,-1)(4,2)等待(10,-2)(0,0)“智豬博弈”的支付矩陣24知己知彼百戰(zhàn)不殆2.通過“劃橫線法”求解“智豬博弈”的均衡如果大豬選擇按開關,那么小豬應該如何選擇?理性的小豬會選擇等待。在小豬選擇等待所對應的收益“2”的下方劃一道短橫線。類似可分析其他情況小豬按開關等待大豬按開關(5,-1)(4,2)等待(10,-2)(0,0)25知己知彼百戰(zhàn)不殆博弈論2014-1知己知彼百戰(zhàn)不殆26分析:小豬有占優(yōu)策略,大豬沒有,所以不存在占優(yōu)均衡;

應用:

此為“多勞不多得,少勞不少得”的奇怪情形,是一種有趣的社會現(xiàn)象。經(jīng)濟學中稱為“搭便車現(xiàn)象”

中國在國際事務中的“小豬策略”改變方案改變方案一:減量方案。投食僅原來的一半分量。結果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻食物,所以誰也不會有踩踏板的動力了。

如果目的是想讓豬們?nèi)ザ嗖忍ぐ?,這個游戲規(guī)則的設計顯然是失敗的。

改變方案二:增量方案。投食為原來的一倍分量。結果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當于生活在物質相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強。

對于游戲規(guī)則的設計者來說,這個規(guī)則的成本相當高(每次提供雙份的食物);而且因為競爭不強烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓谩?/p>

改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結果呢,小豬和大豬都在拼命地搶著踩踏板。等待者不得食,而多勞者多得。每次的收獲剛好消費完。

對于游戲設計者,這是一個最好的方案。成本不高,但收獲最大知己知彼百戰(zhàn)不殆27原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對于社會而言,因為小豬未能參與競爭,小豬搭便車時的社會資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設計者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標設置是否合適了。

比如,公司的激勵制度設計,獎勵力度太大,又是持股,又是期權,公司職員個個都成了百萬富翁,成本高不說,員工的積極性并不一定很高。這相當于“智豬博弈”

增量方案所描述的情形。但是如果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵機制設計就象改變方案三----減量加移位的辦法,獎勵并非人人有份,而是直接針對個人(如業(yè)務按比例提成),既節(jié)約了成本(對公司而言),又消除了“搭便車”現(xiàn)象,能實現(xiàn)有效的激勵。

許多人并未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。因此,對于制訂各種經(jīng)濟管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標改變的個中道理。知己知彼百戰(zhàn)不殆28性別博弈對男方而言,如果女方選擇看足球,那么男方會選擇看足球;如果女方選擇聽昆曲,那么男方會選擇聽昆曲。男方不存在嚴格占優(yōu)策略。對女方而言,如果男方選擇看足球,那么女方會選擇看足球;如果男方選擇聽昆曲,那么女方會選擇聽昆曲。女方也不存在嚴格占優(yōu)策略。無法通過尋找嚴格最優(yōu)策略法求解“性別博弈”的均衡解。女方看足球聽昆曲男方看足球(10,2)(-1,-1)聽昆曲(-1,-1)(2,10)二存在多個納什均衡的博弈29知己知彼百戰(zhàn)不殆二存在多個納什均衡的博弈1性別博弈采用“劃橫線法”尋找“性別博弈”的納什均衡(男方看足球、女方看足球)和(男方聽昆曲、女方聽昆曲)都是“性別博弈”的納什均衡。在特定情況下,慣例和傳統(tǒng)能夠提供博弈的多重納什均衡中那個更可能出現(xiàn)女方看足球聽昆曲男方看足球(10,2)(-1,-1)聽昆曲(-1,-1)(2,10)30知己知彼百戰(zhàn)不殆假設在市場中有兩個競爭對手。一個是已經(jīng)在市場中的“在位者”,另一個是企圖進入市場的“潛在進入者”。潛在進入者有兩個可以選擇的策略:進入、不進入。在位者也有兩個可以選擇的策略:斗爭、默許。如果潛在進入者選擇進入,在位者選擇斗爭,那么激烈的市場競爭會使得雙方均虧損,雙方收益均為-10。如果潛在進入者選擇進入,在位者選擇默許,那么雙方在市場中均可獲得收益5。如果潛在進入者選擇不進入,在位者選擇斗爭,那么潛在進入者的收益為0,在位者的收益為20。如果潛在進入者選擇不進入,在位者選擇默許,那么潛在進入者的收益為0,在位者的收益為152.“市場爭奪戰(zhàn)”博弈31知己知彼百戰(zhàn)不殆采用“劃橫線法”尋找“市場爭奪戰(zhàn)”博弈的納什均衡(潛在進入者進入、在位者默許)和(潛在進入者不進入、在位者斗爭)都是“市場爭奪戰(zhàn)”博弈的納什均衡。在位者斗爭默許潛在進入者進入(-10,-10)(5,5)不進入(0,20)(0,15)32知己知彼百戰(zhàn)不殆博弈論2014-1知己知彼百戰(zhàn)不殆33對納什均衡的理解“一致性”特征:局中人預測到均衡;局中人也預測到其它人預測到均衡;沒有局中人有興趣作不同的選擇。是局中人的一致性預測;但不一定最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論