陳元志:博弈論與策略行為(選修課.ppt_第1頁(yè)
陳元志:博弈論與策略行為(選修課.ppt_第2頁(yè)
陳元志:博弈論與策略行為(選修課.ppt_第3頁(yè)
陳元志:博弈論與策略行為(選修課.ppt_第4頁(yè)
陳元志:博弈論與策略行為(選修課.ppt_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

,博弈思維與策略行為,陳元志 博士、副教授 Email: 中國(guó)浦東干部學(xué)院,“要想在現(xiàn)代社會(huì)做一個(gè)有文化的人,你必須對(duì)博弈論有一個(gè)大致了解” 保羅薩繆爾森,基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,博弈論導(dǎo)論現(xiàn)代博弈論簡(jiǎn)單發(fā)展史,起源可以追溯到1944年數(shù)學(xué)家馮諾伊曼與經(jīng)濟(jì)學(xué)家摩根斯坦合著的博弈論與經(jīng)濟(jì)行為,博弈論導(dǎo)論博弈論和諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),1994:納什(Nash)、海薩尼(J.Harsanyi)、澤爾騰(R.Selten),1996莫里斯(James A.Mirrlees)和維克瑞(William Vickrey),納什的基本貢獻(xiàn)是證明了非合作博弈均衡解及其存在性,建立了作為博弈論基礎(chǔ)的“納什均衡”概念;海薩尼則把不完全信息納入到博弈論方法體系中;澤爾騰的貢獻(xiàn)在于將博弈論由靜態(tài)向動(dòng)態(tài)的擴(kuò)展,建立了“子博弈精練納什均衡”的概念。,這兩位經(jīng)濟(jì)學(xué)家的貢獻(xiàn)集中于運(yùn)用博弈論對(duì)現(xiàn)實(shí)經(jīng)濟(jì)問(wèn)題的解釋。,2001:阿克洛夫(Akerlof)、斯賓塞(Spence)、斯蒂格利茨(Stiglitz),這三位作為不對(duì)稱信息市場(chǎng)理論的奠基人被授予諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),以表彰他們分別在檸檬品市場(chǎng)等不對(duì)稱信息理論研究領(lǐng)域做出的基礎(chǔ)性貢獻(xiàn)。這些貢獻(xiàn)發(fā)展了博弈論的方法體系,拓寬了其經(jīng)濟(jì)解釋范圍。,博弈論導(dǎo)論博弈論和諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),2002:弗農(nóng)史密斯(Smith),2005:奧曼(Aumann)、謝林(Schelling),貢獻(xiàn)主要在于通過(guò)實(shí)驗(yàn)室實(shí)驗(yàn)來(lái)測(cè)試根據(jù)經(jīng)濟(jì)學(xué)理論而做出預(yù)測(cè)的未知或不確定性。是對(duì)以博弈論為基礎(chǔ)構(gòu)建的理論模型進(jìn)行實(shí)證證偽工作的一大創(chuàng)舉。,他們通過(guò)博弈理論分析增加了世人對(duì)合作與沖突的理解。其理論模型應(yīng)用在解釋社會(huì)中不同性質(zhì)的沖突、貿(mào)易糾紛、價(jià)格之爭(zhēng)以及尋求長(zhǎng)期合作的模式等經(jīng)濟(jì)學(xué)和其他社會(huì)科學(xué)領(lǐng)域。,博弈論導(dǎo)論博弈論和諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),2007:赫維克茲(Leonid Hurwicz)、馬斯金(Eric S.Maskin)、梅爾森(Roger B. Myerson),他們應(yīng)用博弈理論于信息經(jīng)濟(jì)學(xué)領(lǐng)域,提出“機(jī)制設(shè)計(jì)理論”,最早由赫維克茲在1960年提出,并由馬斯金和梅爾森進(jìn)一步發(fā)展,他們的研究有助解釋經(jīng)濟(jì)交易時(shí)的機(jī)制和決策過(guò)程。該理論可應(yīng)用于多方面,包括勞工問(wèn)題談判、拍賣政府債券,以至最新的網(wǎng)上市場(chǎng)。,2009:奧斯特羅姆(Elinor Ostrom)、威廉姆森(Oliver E. Williamson),奧斯特羅姆在分析公共資源管理問(wèn)題時(shí)發(fā)現(xiàn),資源使用者常能針對(duì)各類利益沖突開(kāi)發(fā)復(fù)雜的決策和執(zhí)行機(jī)制。她在研究中歸納出良好機(jī)制所具備的特征。威廉姆森則對(duì)市場(chǎng)和以垂直權(quán)力架構(gòu)為特征的企業(yè)展開(kāi)研究,發(fā)現(xiàn)這兩種治理結(jié)構(gòu)在化解利益沖突時(shí)具有不同特征,也各有缺陷。,博弈論導(dǎo)論,標(biāo)準(zhǔn)式博弈與擴(kuò)展式博弈 : 矩陣 樹(shù)形,非合作博弈與合作博弈:個(gè)體理性與集體理性的不同,靜態(tài)博弈與動(dòng)態(tài)博弈 : 參與人同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知道前行動(dòng)者采取什么行動(dòng);參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng),一次博弈與重復(fù)博弈:基本博弈只進(jìn)行一次;基本博弈重復(fù)進(jìn)行,包括有限重復(fù)和無(wú)限重復(fù),博弈論導(dǎo)論,博弈論的精髓在于基于系統(tǒng)思維基礎(chǔ)上的理性換位思考,即在選擇你的行動(dòng)時(shí)還是考慮你的得益,但是你應(yīng)當(dāng)用他人的得益去推測(cè)他人的行動(dòng),從而選擇最有利于自己的行動(dòng)。,博弈策略的案例,“上面出政策,下面出票子”的現(xiàn)象 股權(quán)分置改革 農(nóng)信社改革的注資博弈 華為公司與勞動(dòng)合同法 阿提哥油輪油污損害賠償案 vs 中石油漏油事件 船舶油污損害賠償基金征收和使用管理辦法,每噸持久性油征收0.3元的攤款標(biāo)準(zhǔn)? 全球第一能源消費(fèi)國(guó)?(22.52:21.7:21.32) 住宅銷售價(jià)格統(tǒng)計(jì)調(diào)查方案(企業(yè)自行填報(bào)VS網(wǎng)簽數(shù)據(jù)) 全國(guó)GDP vs 地方GDP 沈陽(yáng)三甲醫(yī)院打擊醫(yī)鬧的新招,基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,囚徒困境,囚徒B,囚徒A,坦白 拒不交待,坦白 拒不交待,無(wú)期,無(wú)期,死刑,釋放,釋放,死刑,一年,一年,囚徒困境,囚徒困境對(duì)古典經(jīng)濟(jì)學(xué)的沖擊,囚徒B,囚徒A,坦白 拒不交待,坦白 拒不交待,無(wú)期,無(wú)期,死刑,釋放,釋放,死刑,一年,一年,納什均衡,軍備競(jìng)賽 招商引資的政策博弈 宏觀調(diào)控的“黃燈”效應(yīng) 應(yīng)試教育與素質(zhì)教育,哈丁公用地的悲劇,設(shè)想一個(gè)向全體公眾開(kāi)放的牧場(chǎng)。不難預(yù)計(jì),每一個(gè)放牧者一定希望在這片公用土地飼養(yǎng)盡可能多的牲畜這就是悲劇所在 加利福尼亞生物學(xué)家加勒特哈丁(Garrett Harding),太湖藍(lán)藻現(xiàn)象、過(guò)度捕撈、不可再生資源的消耗問(wèn)題 廷巴特爾戰(zhàn)風(fēng)沙、建綠洲、保生態(tài)的事跡 公用秘書的故事 朋友之間AA制 公共產(chǎn)品的供給,智豬博弈,豬圈中有一頭大豬一頭小豬,豬圈一端有個(gè)按鈕,每按一下豬圈另一端食槽中會(huì)有10個(gè)單位豬食進(jìn)槽,但按一下會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,大豬吃到9單位食物,小豬只能吃到1單位;如小豬先到,小豬吃4單位而大豬吃6單位;如果同時(shí)按并同時(shí)到食槽,則大豬吃7單位而小豬吃3單位食物。,小豬,大豬,智豬博弈,豬圈中有一頭大豬一頭小豬,豬圈一端有個(gè)按鈕,每按一下豬圈另一端食槽中會(huì)有10個(gè)單位豬食進(jìn)槽,但按一下會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,大豬吃到9單位食物,小豬只能吃到1單位;如小豬先到,小豬吃4單位而大豬吃6單位;如果同時(shí)按并同時(shí)到食槽,則大豬吃7單位而小豬吃3單位食物。,小豬,大豬,納什均衡,盡管大家同乘一條船,可一些人是劃船,另一些人只是坐船。 瑞士 阿爾弗雷德莫勒爾(Alfred Mohler) 玩世箴言,策略提示,處于強(qiáng)勢(shì)的參與者為維護(hù)自己利益采取某種決策時(shí),為其他弱勢(shì)參與者提供了搭便車的機(jī)會(huì) 改革與制度鎖定 股市中的機(jī)構(gòu)大戶與散戶 新產(chǎn)品研發(fā)與中小企業(yè) 小酒館緊靠大酒店的廣告便車 員工的搭便車(先進(jìn)員工vs懈怠員工) 大智若愚中的智慧 貧困縣的教育撥款,博弈思維與策略行為 課間休息,陳元志 中國(guó)浦東干部學(xué)院教研部,關(guān)于混合策略的博弈大規(guī)模協(xié)調(diào)博弈的案例,據(jù)美國(guó)僑報(bào)報(bào)道,2010年5月16日晚,赴美僅兩個(gè)月的23歲中國(guó)女留學(xué)生姚宇在皇后區(qū)法拉盛繁忙街區(qū)被一名墨西哥裔男子施暴,并被一根金屬管狠狠敲打頭部至腦死亡。 監(jiān)控錄像顯示,該女生在遇襲時(shí),一旁有人圍觀、路過(guò),但無(wú)人援手相救。該女生在18日被宣告腦死后,21日征得家人的同意拔除呼吸管,正式宣告死亡。 據(jù)了解,報(bào)住艾姆赫斯特92街與35大道的克魯斯為墨西哥裔非法移民,平時(shí)在各工地打雜維持生計(jì),無(wú)正當(dāng)職業(yè),也無(wú)犯罪前科。,鬧市受殘害路人視而不見(jiàn), 姚宇案折射冷漠心態(tài),關(guān)于混合策略的博弈大規(guī)模協(xié)調(diào)博弈的案例,吉諾維斯謀殺案市民責(zé)任的博弈 1964年紐約市(皇后區(qū)的Kew花園),一個(gè)叫吉諾維斯的婦女被歹徒殺害,殘忍的襲擊持續(xù)了半個(gè)多小時(shí),她一直在尖叫,很多人聽(tīng)到了她的尖叫,超過(guò)30人在命案現(xiàn)場(chǎng),但沒(méi)有人幫助她,也沒(méi)有人報(bào)警。,李四,張三,納什均衡,中國(guó)女留學(xué)生,基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,重復(fù)博弈-廣告博弈,博弈的參與者是:凱洛格和 通用面粉 策略是廣告活動(dòng) 博弈的類型有: (1)靜態(tài)博弈(同步一次博弈) (2)無(wú)限重復(fù)博弈 (3)有限重復(fù)博弈,一次廣告博弈,通用面粉,凱洛格,一次廣告博弈的均衡,納什均衡,通用面粉,凱洛格,劣策略:不管其他參與人采取什么策略,都能導(dǎo)致最低收益的策略 理性參與人永遠(yuǎn)不會(huì)選擇劣策略 許多博弈中參與者都沒(méi)有占優(yōu)策略,但仍可能通過(guò)劣策略的重復(fù)剔除進(jìn)行分析,這種方法稱劣策略重復(fù)剔除法,如果企業(yè)每年都進(jìn)行這種一次博弈,并且永遠(yuǎn)進(jìn)行下去,這時(shí)參與人可以對(duì)對(duì)手的“欺騙”行為進(jìn)行懲罰或報(bào)復(fù)。在這種情況下,共謀起作用嗎?,密歇根大學(xué)愛(ài)克斯羅德教授的計(jì)算機(jī)模擬 他首先邀請(qǐng)全世界的學(xué)者遞交自認(rèn)為最優(yōu)的策略程序,然后將這些策略相互之間交替進(jìn)行不特定次數(shù)的“重復(fù)囚徒博弈”,根據(jù)最終排名來(lái)判定優(yōu)劣。第一輪14個(gè)程序之間的競(jìng)賽結(jié)果顯示,“一報(bào)還一報(bào)” 的簡(jiǎn)單策略獲得第一。之后,又有63位科學(xué)家遞交了改進(jìn)的程序,進(jìn)行第二輪競(jìng)賽,其中包括多個(gè)以“一報(bào)還一報(bào)”策略為基礎(chǔ)的改良品種。令人驚異的是,第二輪比賽的優(yōu)勝者仍然是“一報(bào)還一報(bào)”。 觸發(fā)策略 “如果對(duì)手在過(guò)去沒(méi)有做過(guò)廣告,我就不做;一旦對(duì)手作廣告,自此以后,我就用高強(qiáng)度的廣告活動(dòng)來(lái)懲罰他” 事實(shí)上,只要對(duì)手在過(guò)去沒(méi)有過(guò)“欺騙”行為,各個(gè)企業(yè)都會(huì)同意“合作”。因?yàn)槠垓_行為會(huì)引發(fā)以后所有時(shí)期的懲罰,無(wú)限重復(fù)博弈,假設(shè)通用面粉采用了這種觸發(fā)策略, 凱洛格的利潤(rùn)是多少呢?,合作 = 12 +12/(1+i) + 12/(1+i)2 + 12/(1+i)3 + = 12 + 12/i,相當(dāng)于每年年底得到¥12的永久年金,欺騙 = 20 +2/(1+i) + 2/(1+i)2 + 2/(1+i)3 + = 20 + 2/i,通用面粉,凱洛格,凱洛格從欺騙行為中獲得的好處:,欺騙 - 合作 = 20 + 2/i - (12 + 12/i) = 8 - 10/i 假設(shè)i = .05 欺騙 - 合作 = 8 - 10/.05 = 8 - 200 = -192 欺騙沒(méi)有好處. 在無(wú)限次重復(fù)博弈中共謀是納什均衡!,通用面粉,凱洛格,策略提示,當(dāng)博弈無(wú)限重復(fù)沒(méi)有確定的“終結(jié)之日”時(shí),共謀作為納什均衡就能夠維持下去 相應(yīng)條件: 有能力監(jiān)督對(duì)手的行動(dòng) 有懲罰叛徒的能力和名聲 低利率 在未來(lái)進(jìn)行博弈的機(jī)會(huì)多,共謀在現(xiàn)實(shí)世界中的例子,石油輸出國(guó)組織 竄貨(共謀合作失敗的例子),如果博弈有限重復(fù)進(jìn)行,共謀起作用嗎?,有限重復(fù)博弈,假設(shè)廣告博弈被重復(fù)兩次,通用面粉,凱洛格,納什均衡,逆向歸納法,在第二階段,博弈是一次博弈,因此在這最后階段,均衡是高強(qiáng)度的廣告活動(dòng). 由于每個(gè)人都知道第二階段的結(jié)果,因此,第一階段就變成了最后階段. 兩個(gè)企業(yè)在兩個(gè)時(shí)期的均衡策略都是高強(qiáng)度的廣告活動(dòng). 如果博弈重復(fù)已知的有限次數(shù),同樣的結(jié)果依然成立,有限重復(fù)博弈的例子,59歲現(xiàn)象 虛假?gòu)V告 火車站和旅游點(diǎn)的商販 旅游中的零團(tuán)費(fèi)現(xiàn)象 預(yù)算基數(shù)的博弈,預(yù)算基數(shù)的博弈,機(jī)制設(shè)計(jì)的目的:實(shí)話實(shí)說(shuō) 換馬思維引導(dǎo)講實(shí)話 上級(jí)確定任務(wù)額: 超額獎(jiǎng)勵(lì);完不成受罰 自報(bào)完成任務(wù)數(shù): 低報(bào)罰金;高報(bào)受損 聯(lián)合確定預(yù)算基數(shù),基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,基本框架,靜態(tài)博弈,重復(fù)博弈,動(dòng)態(tài)博弈,博弈論導(dǎo)論,合作博弈,非合作博弈,合作概念在博弈論中是重要的,然而又多少有些難以捉摸我們需要那種不放棄博弈論的個(gè)人決策論基礎(chǔ)的合作行為模型。 2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主 羅杰梅爾森(Roger B. Myerson),合作博弈- 班扎夫權(quán)力指數(shù),班扎夫(John.F.Banzhaf)權(quán)利指數(shù):“每一個(gè)決策者在決策時(shí)的權(quán)力體現(xiàn)在他形成的獲勝聯(lián)盟中是作為關(guān)鍵加入者。我們把一個(gè)決策者作為關(guān)鍵加入者的個(gè)數(shù)稱之為班扎夫權(quán)力指數(shù)”。,獨(dú)裁的妻子,合作博弈- 班扎夫權(quán)力指數(shù)的應(yīng)用,某股份公司有5個(gè)股東,他們是A、B、C、D、E,各持有20%股份。在公司重大決策上,采用“大多數(shù)原則”。,股份與權(quán)力指數(shù)比:股權(quán)情況1,合作博弈- 班扎夫權(quán)力指數(shù)的應(yīng)用,股東B、C、D、E減持3個(gè)百分點(diǎn),A增加12個(gè)百分點(diǎn),此時(shí)A、B、C、D、E持有股份分別為32%、17%、 17%、 17%、 17% 。,股份與權(quán)力指數(shù)比:股權(quán)情況2,合作博弈- 班扎夫權(quán)力指數(shù)的應(yīng)用,股東A要求B、C、D、E繼續(xù)減持1個(gè)百分點(diǎn),其他股東認(rèn)為A擁有36%的股份,不超過(guò)50%,就同意。此時(shí)A、B、C、D、E持有股份分別為36%、16%、 16%、 16%、 16% 。,股份與權(quán)力指數(shù)比:股權(quán)情況3,策略提示,如果決策者作為“關(guān)鍵加入者”出現(xiàn),那么他的權(quán)力大,反之則小。 決策者成為“關(guān)鍵加入者”的頻率是反映決策者權(quán)力高低的重要指標(biāo) 關(guān)注影響“關(guān)鍵加入者”的因素,某些影響因素的微小變化可能導(dǎo)致權(quán)力指數(shù)的大幅波動(dòng)。,澳大利亞大選:眾議院150個(gè)議席,自由黨國(guó)家黨聯(lián)盟73席,執(zhí)政的工黨72席,剩余5席由綠黨和4個(gè)獨(dú)立小黨瓜分。,綜合應(yīng)用1:選舉投票問(wèn)題,投票規(guī)則:(1)沒(méi)有民主集中的情況 投票規(guī)則:(2)民主集中的情況,委員會(huì)主席在票數(shù)相等的情況下,具有決定權(quán),綜合應(yīng)用1:選舉投票問(wèn)題 策略型投票,(1)鐘、狄委員都選擇自己最喜歡的方案,那么結(jié)果是高委員可以通過(guò)民主集中,選擇了高方案。 (2)鐘、狄委員預(yù)見(jiàn)到這樣的結(jié)果,他們會(huì)實(shí)行策略性投票 (3)投票的基本原則:對(duì)于每

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論