陳元志：博弈論與策略行為(選修課.ppt

上傳人：x*** IP屬地：四川上傳時(shí)間：2019-07-02 格式：PPT 頁(yè)數(shù)：48 大小：2.44MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩43頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

,博弈思維與策略行為,陳元志博士、副教授 Email: 中國(guó)浦東干部學(xué)院,“要想在現(xiàn)代社會(huì)做一個(gè)有文化的人，你必須對(duì)博弈論有一個(gè)大致了解” 保羅薩繆爾森,基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,博弈論導(dǎo)論現(xiàn)代博弈論簡(jiǎn)單發(fā)展史,起源可以追溯到1944年數(shù)學(xué)家馮諾伊曼與經(jīng)濟(jì)學(xué)家摩根斯坦合著的博弈論與經(jīng)濟(jì)行為,博弈論導(dǎo)論博弈論和諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),1994：納什（Nash）、海薩尼（J.Harsanyi）、澤爾騰（R.Selten）,1996莫里斯（James A.Mirrlees）和維克瑞（William Vickrey）,納什的基本貢獻(xiàn)是證明了非合作博弈均衡解及其存在性，建立了作為博弈論基礎(chǔ)的“納什均衡”概念；海薩尼則把不完全信息納入到博弈論方法體系中；澤爾騰的貢獻(xiàn)在于將博弈論由靜態(tài)向動(dòng)態(tài)的擴(kuò)展，建立了“子博弈精練納什均衡”的概念。,這兩位經(jīng)濟(jì)學(xué)家的貢獻(xiàn)集中于運(yùn)用博弈論對(duì)現(xiàn)實(shí)經(jīng)濟(jì)問(wèn)題的解釋。,2001：阿克洛夫（Akerlof）、斯賓塞（Spence）、斯蒂格利茨（Stiglitz）,這三位作為不對(duì)稱信息市場(chǎng)理論的奠基人被授予諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)，以表彰他們分別在檸檬品市場(chǎng)等不對(duì)稱信息理論研究領(lǐng)域做出的基礎(chǔ)性貢獻(xiàn)。這些貢獻(xiàn)發(fā)展了博弈論的方法體系，拓寬了其經(jīng)濟(jì)解釋范圍。,博弈論導(dǎo)論博弈論和諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),2002：弗農(nóng)史密斯（Smith）,2005：奧曼（Aumann）、謝林（Schelling）,貢獻(xiàn)主要在于通過(guò)實(shí)驗(yàn)室實(shí)驗(yàn)來(lái)測(cè)試根據(jù)經(jīng)濟(jì)學(xué)理論而做出預(yù)測(cè)的未知或不確定性。是對(duì)以博弈論為基礎(chǔ)構(gòu)建的理論模型進(jìn)行實(shí)證證偽工作的一大創(chuàng)舉。,他們通過(guò)博弈理論分析增加了世人對(duì)合作與沖突的理解。其理論模型應(yīng)用在解釋社會(huì)中不同性質(zhì)的沖突、貿(mào)易糾紛、價(jià)格之爭(zhēng)以及尋求長(zhǎng)期合作的模式等經(jīng)濟(jì)學(xué)和其他社會(huì)科學(xué)領(lǐng)域。,博弈論導(dǎo)論博弈論和諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),2007：赫維克茲(Leonid Hurwicz)、馬斯金(Eric S.Maskin)、梅爾森(Roger B. Myerson),他們應(yīng)用博弈理論于信息經(jīng)濟(jì)學(xué)領(lǐng)域，提出“機(jī)制設(shè)計(jì)理論”，最早由赫維克茲在1960年提出，并由馬斯金和梅爾森進(jìn)一步發(fā)展，他們的研究有助解釋經(jīng)濟(jì)交易時(shí)的機(jī)制和決策過(guò)程。該理論可應(yīng)用于多方面，包括勞工問(wèn)題談判、拍賣政府債券，以至最新的網(wǎng)上市場(chǎng)。,2009：奧斯特羅姆(Elinor Ostrom)、威廉姆森(Oliver E. Williamson）,奧斯特羅姆在分析公共資源管理問(wèn)題時(shí)發(fā)現(xiàn)，資源使用者常能針對(duì)各類利益沖突開(kāi)發(fā)復(fù)雜的決策和執(zhí)行機(jī)制。她在研究中歸納出良好機(jī)制所具備的特征。威廉姆森則對(duì)市場(chǎng)和以垂直權(quán)力架構(gòu)為特征的企業(yè)展開(kāi)研究，發(fā)現(xiàn)這兩種治理結(jié)構(gòu)在化解利益沖突時(shí)具有不同特征，也各有缺陷。,博弈論導(dǎo)論,標(biāo)準(zhǔn)式博弈與擴(kuò)展式博弈 : 矩陣樹(shù)形,非合作博弈與合作博弈：個(gè)體理性與集體理性的不同,靜態(tài)博弈與動(dòng)態(tài)博弈 : 參與人同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知道前行動(dòng)者采取什么行動(dòng);參與人的行動(dòng)有先后順序，且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng),一次博弈與重復(fù)博弈:基本博弈只進(jìn)行一次;基本博弈重復(fù)進(jìn)行，包括有限重復(fù)和無(wú)限重復(fù),博弈論導(dǎo)論,博弈論的精髓在于基于系統(tǒng)思維基礎(chǔ)上的理性換位思考，即在選擇你的行動(dòng)時(shí)還是考慮你的得益，但是你應(yīng)當(dāng)用他人的得益去推測(cè)他人的行動(dòng)，從而選擇最有利于自己的行動(dòng)。,博弈策略的案例,“上面出政策，下面出票子”的現(xiàn)象股權(quán)分置改革農(nóng)信社改革的注資博弈華為公司與勞動(dòng)合同法阿提哥油輪油污損害賠償案 vs 中石油漏油事件船舶油污損害賠償基金征收和使用管理辦法，每噸持久性油征收0.3元的攤款標(biāo)準(zhǔn)？全球第一能源消費(fèi)國(guó)？（22.52：21.7：21.32）住宅銷售價(jià)格統(tǒng)計(jì)調(diào)查方案（企業(yè)自行填報(bào)VS網(wǎng)簽數(shù)據(jù)）全國(guó)GDP vs 地方GDP 沈陽(yáng)三甲醫(yī)院打擊醫(yī)鬧的新招,基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,囚徒困境,囚徒B,囚徒A,坦白拒不交待,坦白拒不交待,無(wú)期，無(wú)期,死刑，釋放,釋放，死刑,一年，一年,囚徒困境,囚徒困境對(duì)古典經(jīng)濟(jì)學(xué)的沖擊,囚徒B,囚徒A,坦白拒不交待,坦白拒不交待,無(wú)期，無(wú)期,死刑，釋放,釋放，死刑,一年，一年,納什均衡,軍備競(jìng)賽招商引資的政策博弈宏觀調(diào)控的“黃燈”效應(yīng) 應(yīng)試教育與素質(zhì)教育,哈丁公用地的悲劇,設(shè)想一個(gè)向全體公眾開(kāi)放的牧場(chǎng)。不難預(yù)計(jì)，每一個(gè)放牧者一定希望在這片公用土地飼養(yǎng)盡可能多的牲畜這就是悲劇所在加利福尼亞生物學(xué)家加勒特哈丁（Garrett Harding）,太湖藍(lán)藻現(xiàn)象、過(guò)度捕撈、不可再生資源的消耗問(wèn)題廷巴特爾戰(zhàn)風(fēng)沙、建綠洲、保生態(tài)的事跡公用秘書的故事朋友之間AA制公共產(chǎn)品的供給,智豬博弈,豬圈中有一頭大豬一頭小豬，豬圈一端有個(gè)按鈕，每按一下豬圈另一端食槽中會(huì)有10個(gè)單位豬食進(jìn)槽，但按一下會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽，大豬吃到9單位食物，小豬只能吃到1單位；如小豬先到，小豬吃4單位而大豬吃6單位；如果同時(shí)按并同時(shí)到食槽，則大豬吃7單位而小豬吃3單位食物。,小豬,大豬,智豬博弈,豬圈中有一頭大豬一頭小豬，豬圈一端有個(gè)按鈕，每按一下豬圈另一端食槽中會(huì)有10個(gè)單位豬食進(jìn)槽，但按一下會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽，大豬吃到9單位食物，小豬只能吃到1單位；如小豬先到，小豬吃4單位而大豬吃6單位；如果同時(shí)按并同時(shí)到食槽，則大豬吃7單位而小豬吃3單位食物。,小豬,大豬,納什均衡,盡管大家同乘一條船，可一些人是劃船，另一些人只是坐船。瑞士阿爾弗雷德莫勒爾（Alfred Mohler）玩世箴言,策略提示,處于強(qiáng)勢(shì)的參與者為維護(hù)自己利益采取某種決策時(shí)，為其他弱勢(shì)參與者提供了搭便車的機(jī)會(huì) 改革與制度鎖定股市中的機(jī)構(gòu)大戶與散戶新產(chǎn)品研發(fā)與中小企業(yè) 小酒館緊靠大酒店的廣告便車員工的搭便車（先進(jìn)員工vs懈怠員工）大智若愚中的智慧貧困縣的教育撥款,博弈思維與策略行為課間休息,陳元志中國(guó)浦東干部學(xué)院教研部,關(guān)于混合策略的博弈大規(guī)模協(xié)調(diào)博弈的案例,據(jù)美國(guó)僑報(bào)報(bào)道，2010年5月16日晚，赴美僅兩個(gè)月的23歲中國(guó)女留學(xué)生姚宇在皇后區(qū)法拉盛繁忙街區(qū)被一名墨西哥裔男子施暴，并被一根金屬管狠狠敲打頭部至腦死亡。監(jiān)控錄像顯示，該女生在遇襲時(shí)，一旁有人圍觀、路過(guò)，但無(wú)人援手相救。該女生在18日被宣告腦死后，21日征得家人的同意拔除呼吸管，正式宣告死亡。據(jù)了解，報(bào)住艾姆赫斯特92街與35大道的克魯斯為墨西哥裔非法移民，平時(shí)在各工地打雜維持生計(jì)，無(wú)正當(dāng)職業(yè)，也無(wú)犯罪前科。,鬧市受殘害路人視而不見(jiàn)，姚宇案折射冷漠心態(tài),關(guān)于混合策略的博弈大規(guī)模協(xié)調(diào)博弈的案例,吉諾維斯謀殺案市民責(zé)任的博弈 1964年紐約市（皇后區(qū)的Kew花園），一個(gè)叫吉諾維斯的婦女被歹徒殺害，殘忍的襲擊持續(xù)了半個(gè)多小時(shí)，她一直在尖叫，很多人聽(tīng)到了她的尖叫，超過(guò)30人在命案現(xiàn)場(chǎng)，但沒(méi)有人幫助她，也沒(méi)有人報(bào)警。,李四,張三,納什均衡,中國(guó)女留學(xué)生,基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,重復(fù)博弈-廣告博弈,博弈的參與者是：凱洛格和通用面粉策略是廣告活動(dòng) 博弈的類型有：（1）靜態(tài)博弈（同步一次博弈）（2）無(wú)限重復(fù)博弈（3）有限重復(fù)博弈,一次廣告博弈,通用面粉,凱洛格,一次廣告博弈的均衡,納什均衡,通用面粉,凱洛格,劣策略：不管其他參與人采取什么策略，都能導(dǎo)致最低收益的策略理性參與人永遠(yuǎn)不會(huì)選擇劣策略許多博弈中參與者都沒(méi)有占優(yōu)策略，但仍可能通過(guò)劣策略的重復(fù)剔除進(jìn)行分析，這種方法稱劣策略重復(fù)剔除法,如果企業(yè)每年都進(jìn)行這種一次博弈，并且永遠(yuǎn)進(jìn)行下去，這時(shí)參與人可以對(duì)對(duì)手的“欺騙”行為進(jìn)行懲罰或報(bào)復(fù)。在這種情況下，共謀起作用嗎？,密歇根大學(xué)愛(ài)克斯羅德教授的計(jì)算機(jī)模擬他首先邀請(qǐng)全世界的學(xué)者遞交自認(rèn)為最優(yōu)的策略程序，然后將這些策略相互之間交替進(jìn)行不特定次數(shù)的“重復(fù)囚徒博弈”，根據(jù)最終排名來(lái)判定優(yōu)劣。第一輪14個(gè)程序之間的競(jìng)賽結(jié)果顯示，“一報(bào)還一報(bào)” 的簡(jiǎn)單策略獲得第一。之后，又有63位科學(xué)家遞交了改進(jìn)的程序，進(jìn)行第二輪競(jìng)賽，其中包括多個(gè)以“一報(bào)還一報(bào)”策略為基礎(chǔ)的改良品種。令人驚異的是，第二輪比賽的優(yōu)勝者仍然是“一報(bào)還一報(bào)”。觸發(fā)策略 “如果對(duì)手在過(guò)去沒(méi)有做過(guò)廣告，我就不做；一旦對(duì)手作廣告，自此以后，我就用高強(qiáng)度的廣告活動(dòng)來(lái)懲罰他” 事實(shí)上，只要對(duì)手在過(guò)去沒(méi)有過(guò)“欺騙”行為，各個(gè)企業(yè)都會(huì)同意“合作”。因?yàn)槠垓_行為會(huì)引發(fā)以后所有時(shí)期的懲罰,無(wú)限重復(fù)博弈,假設(shè)通用面粉采用了這種觸發(fā)策略，凱洛格的利潤(rùn)是多少呢?,合作 = 12 +12/(1+i) + 12/(1+i)2 + 12/(1+i)3 + = 12 + 12/i,相當(dāng)于每年年底得到￥12的永久年金,欺騙 = 20 +2/(1+i) + 2/(1+i)2 + 2/(1+i)3 + = 20 + 2/i,通用面粉,凱洛格,凱洛格從欺騙行為中獲得的好處:,欺騙 - 合作 = 20 + 2/i - (12 + 12/i) = 8 - 10/i 假設(shè)i = .05 欺騙 - 合作 = 8 - 10/.05 = 8 - 200 = -192 欺騙沒(méi)有好處. 在無(wú)限次重復(fù)博弈中共謀是納什均衡!,通用面粉,凱洛格,策略提示,當(dāng)博弈無(wú)限重復(fù)沒(méi)有確定的“終結(jié)之日”時(shí)，共謀作為納什均衡就能夠維持下去相應(yīng)條件: 有能力監(jiān)督對(duì)手的行動(dòng) 有懲罰叛徒的能力和名聲低利率在未來(lái)進(jìn)行博弈的機(jī)會(huì)多,共謀在現(xiàn)實(shí)世界中的例子,石油輸出國(guó)組織竄貨（共謀合作失敗的例子）,如果博弈有限重復(fù)進(jìn)行，共謀起作用嗎?,有限重復(fù)博弈,假設(shè)廣告博弈被重復(fù)兩次,通用面粉,凱洛格,納什均衡,逆向歸納法,在第二階段，博弈是一次博弈，因此在這最后階段，均衡是高強(qiáng)度的廣告活動(dòng). 由于每個(gè)人都知道第二階段的結(jié)果，因此，第一階段就變成了最后階段. 兩個(gè)企業(yè)在兩個(gè)時(shí)期的均衡策略都是高強(qiáng)度的廣告活動(dòng). 如果博弈重復(fù)已知的有限次數(shù)，同樣的結(jié)果依然成立,有限重復(fù)博弈的例子,59歲現(xiàn)象虛假?gòu)V告火車站和旅游點(diǎn)的商販旅游中的零團(tuán)費(fèi)現(xiàn)象預(yù)算基數(shù)的博弈,預(yù)算基數(shù)的博弈,機(jī)制設(shè)計(jì)的目的：實(shí)話實(shí)說(shuō) 換馬思維引導(dǎo)講實(shí)話上級(jí)確定任務(wù)額：超額獎(jiǎng)勵(lì)；完不成受罰自報(bào)完成任務(wù)數(shù)：低報(bào)罰金；高報(bào)受損聯(lián)合確定預(yù)算基數(shù),基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,合作概念在博弈論中是重要的，然而又多少有些難以捉摸我們需要那種不放棄博弈論的個(gè)人決策論基礎(chǔ)的合作行為模型。 2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主羅杰梅爾森(Roger B. Myerson),合作博弈- 班扎夫權(quán)力指數(shù),班扎夫（John.F.Banzhaf）權(quán)利指數(shù)：“每一個(gè)決策者在決策時(shí)的權(quán)力體現(xiàn)在他形成的獲勝聯(lián)盟中是作為關(guān)鍵加入者。我們把一個(gè)決策者作為關(guān)鍵加入者的個(gè)數(shù)稱之為班扎夫權(quán)力指數(shù)”。,獨(dú)裁的妻子,合作博弈- 班扎夫權(quán)力指數(shù)的應(yīng)用,某股份公司有5個(gè)股東，他們是A、B、C、D、E，各持有20%股份。在公司重大決策上，采用“大多數(shù)原則”。,股份與權(quán)力指數(shù)比：股權(quán)情況1,合作博弈- 班扎夫權(quán)力指數(shù)的應(yīng)用,股東B、C、D、E減持3個(gè)百分點(diǎn)，A增加12個(gè)百分點(diǎn)，此時(shí)A、B、C、D、E持有股份分別為32%、17%、 17%、 17%、 17% 。,股份與權(quán)力指數(shù)比：股權(quán)情況2,合作博弈- 班扎夫權(quán)力指數(shù)的應(yīng)用,股東A要求B、C、D、E繼續(xù)減持1個(gè)百分點(diǎn)，其他股東認(rèn)為A擁有36%的股份，不超過(guò)50%，就同意。此時(shí)A、B、C、D、E持有股份分別為36%、16%、 16%、 16%、 16% 。,股份與權(quán)力指數(shù)比：股權(quán)情況3,策略提示,如果決策者作為“關(guān)鍵加入者”出現(xiàn)，那么他的權(quán)力大，反之則小。決策者成為“關(guān)鍵加入者”的頻率是反映決策者權(quán)力高低的重要指標(biāo) 關(guān)注影響“關(guān)鍵加入者”的因素，某些影響因素的微小變化可能導(dǎo)致權(quán)力指數(shù)的大幅波動(dòng)。,澳大利亞大選：眾議院150個(gè)議席，自由黨國(guó)家黨聯(lián)盟73席，執(zhí)政的工黨72席，剩余5席由綠黨和4個(gè)獨(dú)立小黨瓜分。,綜合應(yīng)用1：選舉投票問(wèn)題,投票規(guī)則:(1)沒(méi)有民主集中的情況投票規(guī)則:(2)民主集中的情況，委員會(huì)主席在票數(shù)相等的情況下，具有決定權(quán),綜合應(yīng)用1：選舉投票問(wèn)題策略型投票,(1)鐘、狄委員都選擇自己最喜歡的方案，那么結(jié)果是高委員可以通過(guò)民主集中，選擇了高方案。 (2)鐘、狄委員預(yù)見(jiàn)到這樣的結(jié)果，他們會(huì)實(shí)行策略性投票 (3)投票的基本原則：對(duì)于每

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

陳元志：博弈論與策略行為(選修課.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

陳元志：博弈論與策略行為(選修課.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔