博弈論高級管理學講義_第1頁
博弈論高級管理學講義_第2頁
博弈論高級管理學講義_第3頁
博弈論高級管理學講義_第4頁
博弈論高級管理學講義_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

《高級管理學》

第八講博弈論初步12/28/20221SchoolofEconomics&Management,TongjiUniversity1囚徒困境和納什均衡

囚徒困境(prisoners’dilemma)博弈論的著名的例子,納什均衡是博弈論的重要概念。囚徒困境說的是,兩個嫌疑犯作案后被捕,起訴機構(gòu)沒有足夠的證據(jù)證明他們搶劫了銀行。所以,若犯人們不坦白,起訴者只能就非法持有武器罪起訴,判犯人有期徒刑2年。起訴者于是向犯人采取攻心戰(zhàn),說可以“坦白從寬、抗拒從嚴”。如果一人坦白,則坦白者從寬處理,判徒刑1年,抗拒者從嚴處理,判徒刑12年。如果兩人都坦白,每人依法判徒刑10年。兩個囚徒是坦白還是不坦白呢?12/28/20222SchoolofEconomics&Management,TongjiUniversity1.1囚徒困境12/28/20223SchoolofEconomics&Management,TongjiUniversity1.2博弈均衡博弈論假設博弈的參加者都是理性的,即在對手戰(zhàn)略給定的條件下,每個參加者都會選擇適當?shù)膽?zhàn)略來實現(xiàn)自己報酬的最大化(或損失最小化)。問題是博弈的一方不能控制另一方的決策。當參加者甲以最優(yōu)戰(zhàn)略對付乙的某個戰(zhàn)略時,乙會發(fā)現(xiàn)原先的戰(zhàn)略不是對付甲的實際戰(zhàn)略的最佳戰(zhàn)略,因而會改變其戰(zhàn)略。要是乙改變了戰(zhàn)略,參加者甲也要進行相應的改變。這樣的改變行為會否停止?這里借用經(jīng)濟學常用的均衡概念,我們把博弈的穩(wěn)定結(jié)果稱為均衡,博弈的均衡也稱為博弈的解。均衡是指所有的參加者都不想改變戰(zhàn)略的狀態(tài)。

12/28/20224SchoolofEconomics&Management,TongjiUniversity1.3占優(yōu)均衡在一些特殊的博弈中,一個參加者的最優(yōu)戰(zhàn)略可能并不依賴于其他參加者的戰(zhàn)略選擇,也就是說,不論其他參加者選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為“占優(yōu)戰(zhàn)略”(dominantstrategy)。在上述的囚徒困境博弈中,每個囚徒可選擇的戰(zhàn)略有兩種:坦白與不坦白。顯然,不論另外一個囚犯選擇什么戰(zhàn)略,每個囚犯的最優(yōu)戰(zhàn)略都是“坦白”。例如,如果乙選擇坦白,囚犯甲選擇坦白時的報酬為-10,選擇不坦白的報酬為-12,因而坦白比不坦白好;如果乙選擇不坦白,甲坦白的報酬為-1,不坦白的報酬為-2,所以坦白還是比不坦白好。也就是說,“坦白”是囚犯甲的占優(yōu)戰(zhàn)略。由于對稱性,“坦白”也是囚犯乙的占優(yōu)戰(zhàn)略。于是,(坦白,坦白)或(-10,-10)是囚徒困境博弈的占優(yōu)均衡。

12/28/20225SchoolofEconomics&Management,TongjiUniversity個人理性與集體理性甲乙兩人都尋求最好的結(jié)果,而得到的卻是較糟的結(jié)果。這個例子說明,在多人決策的環(huán)境里,個人理性與集體理性經(jīng)常是矛盾的,這種集體利益和個人利益的之間的沖突被稱為“囚徒困境”。

12/28/20226SchoolofEconomics&Management,TongjiUniversity1.4納什均衡納什均衡是這樣一種穩(wěn)定狀態(tài),博弈的任何一方參加者都不會改變其戰(zhàn)略,如果其他參加者都不改變戰(zhàn)略的話。

依定義,任何占優(yōu)戰(zhàn)略均衡必定是納什均衡,但納什均衡卻不一定是占優(yōu)戰(zhàn)略均衡,占優(yōu)戰(zhàn)略均衡是比較強的均衡概念。囚徒困境中的(坦白,坦白)就是納什均衡。經(jīng)濟生活中的眾多集體利益和個人利益的之間的沖突帶來的非帕累托有效狀態(tài)都是納什均衡。12/28/20227SchoolofEconomics&Management,TongjiUniversity納什均衡(嚴格的定義)12/28/20228SchoolofEconomics&Management,TongjiUniversity完全信息靜態(tài)博弈的幾個著名博弈智豬博弈(boxedpigs)豬圈里有兩頭豬,一頭大豬,一頭小豬,豬圈的一頭有個豬食槽,另一頭安裝一個按鈕,控制著豬食的供應。按一下按鈕會有10單位的豬食進槽,但誰按按鈕誰就要付2個單位的成本。若大豬先到,大豬吃到9個單位,小豬只能吃1個單位;若同時到,大豬吃7個單位,小豬吃3個單位;若小豬先到,大豬吃6個單位,小豬吃4個單位。12/28/20229SchoolofEconomics&Management,TongjiUniversity標準型支付矩陣12/28/202210SchoolofEconomics&Management,TongjiUniversity性別戰(zhàn)戰(zhàn)(battleofthesexes)12/21/202211SchoolofEconomics&Management,TongjiUniversity市場進進入阻阻撓博博弈12/21/202212SchoolofEconomics&Management,TongjiUniversity2動態(tài)態(tài)博弈弈靜態(tài)博博弈,,即博博弈各各方同同時行行動,,但是是經(jīng)濟濟生活活中許許多情情形是是動態(tài)態(tài)博弈弈,也也就是是指博博弈參參加者者的行行動有有先后后順序序,又又叫序序貫博博弈。。12/21/202213SchoolofEconomics&Management,TongjiUniversity2.1完完全信息息動態(tài)博博弈的分分類博弈總的的可以分分為完全全信息的的博弈((即博弈弈參加者者的收益益函數(shù)是是共同知知識的博博弈)和和不完全全信息博博弈(博博弈中的的一些參參加者不不知道其其它參加加者的收收益函數(shù)數(shù))。完全信息息動態(tài)博博弈又分為完完全且完完美信息息(completeandperfectinformation)的動態(tài)態(tài)博弈和和完全但但不完美美信息博博弈兩類類。前者者是指在在博弈進進行的每每一步當當中,要要選擇行行動的參參加者都都知道這這一步之之前博弈弈進行的的整個過過程;后后者是指指在博弈弈的某些些階段,,要選擇擇行動的的參加者者并不知知道在這這一步之之前博弈弈進行的的整個過過程12/21/202214SchoolofEconomics&Management,TongjiUniversity2.2子博弈完完美納什什均衡((SPNE)一個子博博弈是全全部博弈弈的一部部分,當當全部博博弈進行行到任何何一個階階段,到到此為止止的進行行過程已已經(jīng)稱為為博弈參參加各方方的共同同知識,,而其后后尚未開開始進行行的部分分就是一一個子博博弈。如如果博弈弈參加者者的戰(zhàn)略略在每一一子博弈弈中都構(gòu)構(gòu)成納什什均衡,,我們稱稱此納什什均衡是是子博弈弈完美納納什均衡衡(subgameperfectNashequilibrium)(Selten,1965)。。所有動態(tài)博弈弈的中心問題題是可信任性性,所以不可可置信的威脅脅被研究較多多,子博弈完完美納什均衡衡(SPNE)是不含不可可置信的威脅脅的。子博弈弈完美納什均均衡可以用逆逆向歸納法((backwards-induction)找出12/21/202215SchoolofEconomics&Management,TongjiUniversity幾種著名的動動態(tài)博弈Stackelbeg模模型Hotelling模型型(地點模型型)12/21/202216SchoolofEconomics&Management,TongjiUniversity3重復博弈:特特殊的動態(tài)博博弈同一博弈重復復多次,稱為為重復博弈((repeatedgame),,其中的的每一次博弈弈稱為“階段段博弈”(stagegame),事實上它它是動態(tài)博弈弈的一種特殊殊情況。它的的均衡狀況可可能與一次性性博弈不同,,被研究最多多的重復博弈弈還是囚徒困困境博弈。12/21/202217SchoolofEconomics&Management,TongjiUniversity例子子:古古諾諾產(chǎn)產(chǎn)量量博博弈弈12/21/202218SchoolofEconomics&Management,TongjiUniversity作為為囚囚徒徒困困境境的的一一個個例例子子,,其其占占優(yōu)優(yōu)戰(zhàn)戰(zhàn)略略均均衡衡的的結(jié)結(jié)局局雙雙方方都都增增加加產(chǎn)產(chǎn)量量,,它它們們的的報報酬酬各各為為900。如如果果它它們們能能合合作作,,共共同同壓壓縮縮產(chǎn)產(chǎn)量量,,則則可可以以實實現(xiàn)現(xiàn)各各自自1000的報報酬酬。。它它們們都都想想合合作作,,但但是是又又怕怕被被欺欺騙騙,,于于是是就就此此陷陷入入““囚囚徒徒困困境境””。。關關鍵鍵是是在在一一次次性性博博弈弈中中,,被被欺欺騙騙之之后后就就無無法法報報復復了了,,當當然然也也無無法法建建立立公公司司的的聲聲譽譽。。重重復復博博弈弈下下的的情情形形就就會會發(fā)發(fā)生生變變化化。。因因為為博博弈弈的的其其它它參參加加者者過過去去行行動動的的歷歷史史是是可可以以觀觀測測得得到到的的,,一一個個參參加加者者可可以以使使自自己己在在某某個個階階段段博博弈弈的的戰(zhàn)戰(zhàn)略略選選擇擇依依賴賴于于其其它它參參加加者者過過去去的的行行動動歷歷史史。。這這樣樣企企業(yè)業(yè)就就可可以以報報復復和和建建立立合合作作的的聲聲譽譽,,合合作作發(fā)發(fā)生生的的原原因因在在于于公公司司的的長長遠遠利利益益。。12/21/202219SchoolofEconomics&Management,TongjiUniversity在重重復復博博弈弈里里,,參參加加者者每每個個階階段段都都得得到到一一定定的的報報酬酬,,長長期期博博弈弈就就要要把把所所有有的的各各期期報報酬酬加加總總起起來來進進行行比比較較。。這這里里引引進進一一個個指指標標::時時間間折折扣扣率率δ,,數(shù)數(shù)值值等等于于明明年年的的一一元元前前相相當當于于今今年年的的金金額額,,δδ也也稱稱為為貼貼現(xiàn)現(xiàn)因因子子。。例例如如,,明明年年的的利利潤潤為為,,折折算算到到現(xiàn)現(xiàn)在在就就是是δδ。。熟熟悉悉財財務務的的同同學學都都知知道道這這是是貨貨幣幣的的時時間間價價值值,,但但是是δδ不不是是貼貼現(xiàn)現(xiàn)率率r,,而而是是1-r,,這這里里不不多多解解釋釋。。還還有有一一點點不不一一樣樣,,貼貼現(xiàn)現(xiàn)率率r更更多多的的是是由由社社會會決決定定的的,,而而時間間折折扣扣率率δ更更多多的的是是博博弈弈參參加加者者的的主主觀觀判判斷斷。。假定定企企業(yè)業(yè)甲甲和和企企業(yè)業(yè)乙乙從從頭頭到到尾尾均均合合作作,,那那么么兩兩家家企企業(yè)業(yè)的的總總報報酬酬為為如果果一一開開始始就就不不合合作作,,那那么么每每個個公公司司的的總總報報酬酬為為12/21/202220SchoolofEconomics&Management,TongjiUniversity9、靜夜四無無鄰,荒居居舊業(yè)貧。。。12月-2212月-22Wednesday,December21,202210、雨中黃葉葉樹,燈下下白頭人。。。18:18:3318:18:3318:1812/21/20226:18:33PM11、以我獨獨沈久,,愧君相相見頻。。。12月-2218:18:3318:18Dec-2221-Dec-2212、故人人江海海別,,幾度度隔山山川。。。18:18:3318:18:3318:18Wednesday,December21,202213、乍見翻疑疑夢,相悲悲各問年。。。12月-2212月-2218:18:3418:18:34December21,202214、他鄉(xiāng)生白白發(fā),舊國國見青山。。。21十二二月20226:18:34下下午18:18:3412月-2215、比不不了得得就不不比,,得不不到的的就不不要。。。。。十二月月226:18下下午午12月月-2218:18December21,202216、行動出出成果,,工作出出財富。。。2022/12/2118:18:3418:18:3421December202217、做前,,能夠環(huán)環(huán)視四周周;做時時,你只只能或者者最好沿沿著以腳腳為起點點的射線線向前。。。6:18:34下午午6:18下午午18:18:3412月-229、沒沒有有失失敗敗,,只只有有暫暫時時停停止止成成功功!!。。12月月-2212月月-22Wednesday,December21,202210、很多多事情情努力力了未未必有有結(jié)果果,但但是不不努力力卻什什么改改變也也沒有有。。。18:18:3418:18:3418:1812/21/20226:18:34PM11、成功功就是是日復復一日日那一一點點點小小小努力力的積積累。。。12月月-2218:18:3418:18Dec-2221-Dec-2212、世間成成事,不不求其絕絕對圓滿滿,留一一份不足足,可得得無限完完美。。。18:18:3418:18:3418:18Wednesday,December21,202213、不知香積積寺,數(shù)里里入云峰。。。12月-2212月-2218:18:3418:18:34December21,202214、意志堅強強的人能把把世界放在在手中像泥泥塊一樣任任意揉捏。。21十二二月20226:18:34下下午18:18:3412月-2215、楚塞塞三湘湘接,,荊門門九派派通。。。。。十二月月226:18下下午午12月月-2218:18December21,202216、少年年十五五二十十時,,步行行奪得得胡馬馬騎。。。2022/12/2118:18:3418:18:3421December202217、空山新雨后后,天氣晚來來秋。。6:18:34下午6:18下下午18:18:341

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論