囚徒困境與納什均衡_第1頁
囚徒困境與納什均衡_第2頁
囚徒困境與納什均衡_第3頁
囚徒困境與納什均衡_第4頁
囚徒困境與納什均衡_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

囚徒困境與納什均衡第一頁,共五十二頁,編輯于2023年,星期五一、經(jīng)典案例——囚徒困境二、現(xiàn)實生活中的“囚徒困境”三、納什均衡與優(yōu)勢策略本章內(nèi)容第二頁,共五十二頁,編輯于2023年,星期五一、經(jīng)典案例——囚徒困境

第三頁,共五十二頁,編輯于2023年,星期五克格勃的小花招在前蘇聯(lián),有一位樂隊指揮在火車上翻看樂譜時,兩名克格勃(KGB,蘇聯(lián)國家安全警察)將他作為間諜逮捕了。他們以為那樂譜是某種密碼,這位樂隊指揮爭辯說那只是柴可夫斯基的小提琴協(xié)奏曲,卻無濟于事。第二天,審問者自鳴得意地走進來說:“我看你還是老實招了吧,我們已經(jīng)抓住了你的朋友柴可夫斯基了,他這會兒正向我們交代呢。你如果再不招就槍斃了你。如果交代了,只判你10年。”第四頁,共五十二頁,編輯于2023年,星期五經(jīng)典案例——囚徒困境兩個嫌疑犯(甲和乙)作案后被警察抓住,隔離審訊;警方的政策是“坦白從寬,抗拒從嚴”:如果兩人都坦白則各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判15年;如果都不坦白則各判1年。這兩個囚犯該怎么辦呢?是選擇互相合作(不坦白)還是互相背叛(坦白)?

1950年,斯擔福大學客座教授、數(shù)學家圖克(Tucker)為了形象地說明博弈過程,構(gòu)造了著名的“囚徒困境”(prisoners’dilemma)模型。第五頁,共五十二頁,編輯于2023年,星期五經(jīng)典案例——囚徒困境(15,0)(0,15)(1,1)乙甲不坦白不坦白坦白坦白(8,8)囚徒困境的收益矩陣第六頁,共五十二頁,編輯于2023年,星期五博弈游戲:囚徒困境請2位同學上來,扮演囚徒困境中的囚徒兩名玩家不得交換意見,同時做出選擇。玩家可以選擇“招”或者“不招”。被判年數(shù)少者獲勝。勝者加4分,其余加2分。乙

(15,0)(0,15)(1,1)甲不招不招招供招供(8,8)第七頁,共五十二頁,編輯于2023年,星期五兩人都作出招供的選擇,是其優(yōu)勢策略,最符合個體理性的選擇。但收益卻未必最大,這就是“困境”。照博弈論的說法,這是本問題惟一的納什均衡點。只有在這一點上,任何一人單方面改變選擇,他只會得到較差的結(jié)果。這一點就是納什均衡(NashEquilibrium)。納什均衡:局中人單獨改變策略不會得到好處的對局策略組合。當博弈達到納什均衡,并不一定是對參與者最有利的結(jié)果,更不意味著是對整個社會最有利的結(jié)果。納什均衡納什第八頁,共五十二頁,編輯于2023年,星期五在“囚徒困境”中表現(xiàn)最好的策略直接取決于對方采用的策略。獨立于對方所用策略之外的最好決策是不存在的。在博弈達到納什均衡時,在外界環(huán)境沒有變化的情況下,倘若各方堅持原有的利益最大化原則并理性面對現(xiàn)實,那么這種均衡狀況就能夠長期保持穩(wěn)定。經(jīng)典案例——囚徒困境納什第九頁,共五十二頁,編輯于2023年,星期五納什均衡納什均衡是一種“不后悔”均衡。張三和李四都想要加薪。假如只有一個員工要求加薪,老板會同意,但如果兩個人都要求加薪,老板就會生氣,并把兩個人統(tǒng)統(tǒng)開除。兩個員工都不要求加薪并不是納什均衡,因為當一方知道另一方?jīng)]有提出加薪要求時,就會后悔自己的選擇。兩個員工都要求加薪也不是納什均衡,因為兩個人事后都會被開除而后悔自己的策略。這場博弈有兩個納什均衡點,張三要求加薪而李四不要求;或李四要求而張三不要求。第十頁,共五十二頁,編輯于2023年,星期五諾貝爾經(jīng)濟學獎得主薩繆爾森:你可以將一只鸚鵡訓練成經(jīng)濟學家,因為它所需要學習的只有兩個詞——供給與需求。納什均衡的思想

博弈論專家坎多瑞引申說:要成為現(xiàn)代經(jīng)濟學家,這只鸚鵡必須再多學一個詞,這個詞就是“納什均衡”。第十一頁,共五十二頁,編輯于2023年,星期五納什均衡的思想“假如經(jīng)濟學家是按照他們撰寫的論文平均每篇的貢獻大小排定座次的話,那么約翰?納什就有極好的理由爭奪頭把交椅?!偃鐒e人每次寫到或說到“納什均衡”,納什就能得到1美元,那么他早就變成大富翁了?!钡峡宋魈亟淌谠?000年6月希臘雅典大學授予約翰·納什榮譽學位典禮上的講話:第十二頁,共五十二頁,編輯于2023年,星期五二、現(xiàn)實生活中的“囚徒困境”第十三頁,共五十二頁,編輯于2023年,星期五“囚徒困境”是一些非常普遍而有趣的情形的簡單抽象。[明]宋濂《宋文憲公全集》記有一個故事:玉寅生與三烏叢臣是朋友,他們曾歃血盟誓:“我輩應自勵,他日入朝為官,絕不趨炎附勢。如有違此誓,請神明懲罰?!睕]多久,他們一起到晉國為官。當時趙宣子是晉王寵臣,各大夫均奔走于他家。玉寅生重申以前的誓言,三烏叢臣也說:“說過的話猶在耳畔,豈敢忘記!”但三烏叢臣后悔當初的誓言,又怕玉寅生知道。于是在一個大清早,雞剛一報曉,他就前去拜望趙宣子。一進門,他忽然看到東邊走廊有個人坐在那里,他走前舉燈一照,那個人原來是玉寅生?,F(xiàn)實生活中的“囚徒困境”第十四頁,共五十二頁,編輯于2023年,星期五現(xiàn)實生活中的“囚徒困境”(升官或落選,升官或落選)(落選,升官)三烏叢臣玉寅生不巴結(jié)巴結(jié)不巴結(jié)巴結(jié)(升官,落選)(升官或落選,升官或落選)取決于誰巴結(jié)得更到位如果巴結(jié)上司會有升官的機會,則其他人也面對同樣的局面。假定兩個人競爭一個官職,則雙方均巴結(jié),則雙方成本高;雙方均不巴結(jié),則雙方成本低。然而“巴結(jié)”是雙方的最佳的策略。第十五頁,共五十二頁,編輯于2023年,星期五囚徒與戰(zhàn)士約瑟夫·海勒《第22條軍規(guī)》的一個故事:第二次世界大戰(zhàn)勝利在望,投彈手尤塞里安不想成為勝利前夕最后一批犧牲者,千方百計逃避執(zhí)行任務(wù)。他的上級軍官問:“可是,假如我方士兵都這么想呢?”可尤塞里安答道:“那我若是不這么想,豈不就成了一個大傻瓜?”第十六頁,共五十二頁,編輯于2023年,星期五1984年,美國聯(lián)邦預算赤字實在太高了。裁減必要的巨額開支在政治上并不可行,因此,大幅增稅應是不可避免的。民主黨總統(tǒng)候選人沃爾特·蒙代爾在競選中提出增稅政策,卻被羅納德·里根打得落花流水,因為里根許諾絕不加稅。

政客的囚徒困境

這就是為什么美國是世界上最富有的國家,卻同時又是最大的債務(wù)國的原因。第十七頁,共五十二頁,編輯于2023年,星期五電信價格競爭的“囚徒困境”第十八頁,共五十二頁,編輯于2023年,星期五學生的囚徒困境數(shù)十道“減負令”難見效中小學生課業(yè)負擔不減反增

僅1985年至2000年的15年里,中央就下達“減負令”49次。減輕中小學生過重負擔喊了20多年,實際情況卻是學生課業(yè)負擔不但沒減下來,反倒呈現(xiàn)出越演越烈之勢,致使學生作業(yè)做到深夜、節(jié)假日仍然上課、業(yè)余時間奔忙于各種補習班等。為什么數(shù)十道“減負令”難見效?

第十九頁,共五十二頁,編輯于2023年,星期五盜版書的“囚徒困境”無論怎么打擊,盜版書仍是屢禁不絕。而一個更加奇怪的現(xiàn)象出現(xiàn)了:一些暢銷書還沒有印刷完畢,其盜版書竟已堂而皇之地走上了書攤———他們一改過去“跟風”的傳統(tǒng),搶在了正版書的前面。而且盜版和正版幾乎沒有什么差別。這種情況下,人們只能得出一個結(jié)論:出版部門出了“內(nèi)奸”??墒?,當這樣的現(xiàn)象一次次出現(xiàn),甚至已經(jīng)成了某種規(guī)律的時候,人們才恍然大悟:原來,是出版者自己在盜自己的版!陳魯豫親手抓盜版書《心相約》第二十頁,共五十二頁,編輯于2023年,星期五國家軍備競賽的“囚徒困境”(搞軍備,搞軍備)是雙方?jīng)Q策的納什均衡第二十一頁,共五十二頁,編輯于2023年,星期五軍事博弈中蘇交惡的年代,雙方都在邊境地區(qū)陳兵百萬,巨大的軍費開支和潛在的戰(zhàn)爭風險對兩國都是重負。納什均衡點(陳兵,陳兵)第二十二頁,共五十二頁,編輯于2023年,星期五博弈游戲4選A的學生將產(chǎn)生總體收益2分,選B不產(chǎn)生總體收益。選A的學生的總分將分給參與游戲的每個學生,但選B的學生可比選A的學生多分1分。請在紙上寫上學號、姓名及選項每個學生均需決定選擇:A:獨立認真地完成作業(yè);B:抄他人的作業(yè)。不參加游戲者扣5分第二十三頁,共五十二頁,編輯于2023年,星期五三、納什均衡與優(yōu)勢策略第二十四頁,共五十二頁,編輯于2023年,星期五位置博弈國美與蘇寧為什么總喜歡貼身撕殺?第二十五頁,共五十二頁,編輯于2023年,星期五位置博弈麥當勞和肯德基為什么總是相鄰設(shè)店?第二十六頁,共五十二頁,編輯于2023年,星期五位置博弈假設(shè)某條路上的顧客流量是均勻分布的,且顧客對麥當勞和肯德基無偏好,而總是樂意惠顧距自己最近的快餐店。1/4麥當勞3/4肯德基1/20A1B在顧客均勻散布的情況下,從資源的最佳配置來看,麥當勞、肯德基應該分別開在1/4、3/4處是最優(yōu),各自擁有1/2的顧客量,同時顧客到快餐店的總距離最短。第二十七頁,共五十二頁,編輯于2023年,星期五位置博弈1/4麥當勞3/4肯德基1/20A1B出于理性考慮,肯德基肯定會想到:如果將店鋪從3/4點處向左移一點,將從麥當勞搶奪走部分顧客。而麥當勞自然也想到從1/4點處向右移動以爭取更多的顧客。不難想象,雙方博弈的結(jié)果將使他們的店鋪設(shè)置在l/2中點附近達到納什均衡狀態(tài),相依為鄰且相安無事地做起快餐生意。這在博弈論中稱為位置博弈。第二十八頁,共五十二頁,編輯于2023年,星期五位置博弈現(xiàn)實生活中,在這條路上,顧客流量不是均勻分布的,那么這個模型是否就沒有用了呢?模型是現(xiàn)實的抽象,讓我們更容易了解現(xiàn)象的本質(zhì)以及分析的思路。在現(xiàn)實應用中,我們可以加入其他約束條件以完善模型。事實上,即使顧客流量不是均勻分布,結(jié)果并沒有改變。11%2%23%9%15%6%2%18%9%5%第二十九頁,共五十二頁,編輯于2023年,星期五位置博弈如果是三家,其位置博弈的結(jié)果又會如何?第三十頁,共五十二頁,編輯于2023年,星期五政黨的位置博弈

兩個政黨要決定自己究竟處于自由-保守意識形態(tài)的哪一個位置假定選民平均分布在整個劃分表的各個區(qū)間,并選舉意識形態(tài)與自己相近的黨派。為使問題具體化,我們把各個政治立場定為從0到100,0代表極自由,而100代表極保守。500100自由保守第三十一頁,共五十二頁,編輯于2023年,星期五政黨的位置博弈在實踐中,兩黨不可能選擇完全一致的立場,但大家都在想方設(shè)法靠近中點。這一現(xiàn)象最早是由哥倫比亞大學經(jīng)濟學家哈羅德·霍特林(HaroldHotelling)在1929年發(fā)現(xiàn)的?;籼亓种赋鼋?jīng)濟和社會事務(wù)存在相似的案例:“我們的城市大得毫無經(jīng)濟效益,其中的商業(yè)區(qū)也太集中。衛(wèi)理公會以及基督教長老會的教堂簡直一模一樣;蘋果酒也是一個味道?!惫_德·霍特林第三十二頁,共五十二頁,編輯于2023年,星期五麥當勞與肯德基產(chǎn)品的位置博弈第三十三頁,共五十二頁,編輯于2023年,星期五新聞大戰(zhàn)與優(yōu)勢策略每個星期,《時代》和《新聞周刊》都會暗自較勁,要做出最引人注目的封面故事。一個富有戲劇性或者饒有趣味的封面,可以吸引站在報攤前的潛在買主的目光。因此,每個星期,《時代》的編輯們一定會舉行閉門會議,選擇下一個封面故事。

《時代》這么做的時候,很清楚此時《新聞周刊》也在關(guān)起門來開會,選擇下一個封面故事。反過來,《新聞周刊》也知道《時代》正在做同樣的事情,而《時代》也知道《新聞周刊》知道這一點……這兩家新聞雜志投入了一場策略博弈。第三十四頁,共五十二頁,編輯于2023年,星期五假定本周有兩個大新聞:一是日本核爆炸;二是老趙訪美。編輯們選擇封面故事的時候,首要考慮的是哪一條新聞更能吸引報攤前的買主(訂戶則無需考慮)。在報攤前的買主當中,假設(shè)30%的人對日本核爆炸感興趣,70%的人對老趙訪美感興趣。買主只會購買封面故事是自己感興趣的新聞的雜志;假如兩本雜志用了同一條新聞做封面故事,那么買主就會平分為兩組,一組買《時代》,另一組買《新聞周刊》。新聞大戰(zhàn)與優(yōu)勢策略第三十五頁,共五十二頁,編輯于2023年,星期五(30,70)(70,30)(15,15)新聞周刊時代日本核爆炸日本核爆炸老趙訪美老趙訪美(35,35)雙方的優(yōu)勢策略:采用老趙訪美做封面新聞大戰(zhàn)與優(yōu)勢策略第三十六頁,共五十二頁,編輯于2023年,星期五在《時代》和《新聞周刊》這個博弈里,雙方都有一個優(yōu)勢策略。各方均有一個優(yōu)勢策略的博弈是最簡單的一種博弈。

有時候,某參與者有一個優(yōu)勢策略,其他參與者則沒有。新聞大戰(zhàn)與優(yōu)勢策略第三十七頁,共五十二頁,編輯于2023年,星期五假設(shè)全體讀者略偏向于選擇《時代》。假如兩個雜志選擇同樣的新聞做封面故事,喜歡這個新聞的潛在買主當中有60%的人選擇《時代》,40%的人選擇《新聞周刊》。

這時兩雜志該如何選擇呢?新聞大戰(zhàn)與優(yōu)勢策略第三十八頁,共五十二頁,編輯于2023年,星期五(30,70)(70,30)(18,12)新聞周刊時代日本核爆炸日本核爆炸老趙訪美老趙訪美(42,28)對于《時代》,老趙訪美仍然是優(yōu)勢策略,但對于《新聞周刊》,其優(yōu)勢策略則變?yōu)槿毡竞吮?。新聞大?zhàn)與優(yōu)勢策略第三十九頁,共五十二頁,編輯于2023年,星期五《時代》有一個優(yōu)勢策略,那一定就是他們的選擇。因此,《新聞周刊》的編輯們可以很有把握地假定《時代》已經(jīng)選了老趙訪美,并據(jù)此選擇自己的最佳策略,即日本核爆炸。

由此可見,只有一方擁有優(yōu)勢策略的博弈其實也非常簡單。擁有優(yōu)勢策略的一方將采用其優(yōu)勢策略,另一方則針對這個策略采用自己的最佳策略。注意:“優(yōu)勢策略”的優(yōu)勢是指你的這個策略對你的其他策略占有優(yōu)勢,而不是對你的對手的策略占有優(yōu)勢。新聞大戰(zhàn)與優(yōu)勢策略第四十頁,共五十二頁,編輯于2023年,星期五優(yōu)勢策略優(yōu)勢策略是指不管對方采取任何策略,這一策略總能夠顯示出優(yōu)勢。但采用優(yōu)勢策略得到的最壞結(jié)果并不一定比采用另外一個策略得到的最佳結(jié)果要好。劣勢策略則是指在博弈中,不論其他參與人采取什么策略,某一參與人可能采取的策略中,對自己嚴格不利的策略。假如你有一個優(yōu)勢策略,你可以選擇采用,并且知道你的對手若是有一個優(yōu)勢策略他也會照辦;同樣,假如你有一個劣勢策略,你應該避免采用,并且知道你的對手若是有一個劣勢策略他也會規(guī)避。不是所有博弈都有優(yōu)勢策略。實際上,優(yōu)勢策略只是博弈論的一種特例。

第四十一頁,共五十二頁,編輯于2023年,星期五如果《時代》和《新聞周刊》爆發(fā)了一場價格戰(zhàn)。

假設(shè)每本雜志的制作成本是l美元,且售價只有兩個可能的價位選擇,分別是2美元或3美元。假設(shè)顧客永遠傾向于選擇價格較低的雜志,且在雜志價格相同的時候兩種雜志各得一半讀者。雜志定價3美元的時候,讀者總數(shù)是500萬;雜志價格降到2美元,讀者總數(shù)將升到800萬。新聞大戰(zhàn)與優(yōu)勢策略第四十二頁,共五十二頁,編輯于2023年,星期五(800,0)(0,800)(400,400)新聞周刊時代2元2元3元3元(500,500)雙方的優(yōu)勢策略:2美元利潤:萬美元新聞大戰(zhàn)與優(yōu)勢策略第四十三頁,共五十二頁,編輯于2023年,星期五假如你有一個劣勢策略,你應該避免采用,并且知道你的對手若是有一個劣勢策略他也會規(guī)避。在你沒有優(yōu)勢策略的情況下,你要做的就是:不能追求最佳,就要避免最差。即剔除所有劣勢策略,不予考慮。如此一步一步做下去。“重復剔除嚴格劣勢策略”(iteratedeliminationofstrictlydominatedstrategy)的思路:首先找出某博弈方的劣勢策略(dominatedstrategy),把這個劣勢策略剔除后,剩下的是一個不包含已剔除劣策略的新的博弈;然后在剔除這個新的博弈中的劣策略;繼續(xù)這個過程,直到?jīng)]有劣策略存在。如果剩下的策略組合是唯一的,這個唯一的策略組合就是“重復剔除占優(yōu)均衡”(iterateddominanceequilibrium)。重復剔除的占優(yōu)均衡第四十四頁,共五十二頁,編輯于2023年,星期五-8,-80,-15-15,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴-8大于-150大于-1-8大于-150大于-1抵賴是A的嚴格劣勢策略抵賴是B的嚴格劣勢策略囚徒困境的占優(yōu)均衡第四十五頁,共五十二頁,編輯于2023年,星期五優(yōu)勢策略的選擇——迭代剔除劣勢策略麥當勞和肯德基的位置博弈——為什么總相鄰設(shè)店?12345678910MKFC不管對手選擇哪里,選2永遠比選1好,因而選1是嚴格劣勢策略。不管對手選擇哪里,選9永遠比選10好,因而選10是嚴格劣勢策略。第四十六頁,共五十二頁,編輯于2023年,星期五1,01,20,30,1M小張老趙UDL0,12,0R老趙:沒有占優(yōu)戰(zhàn)略小張:M嚴格優(yōu)于R 剔除R行:u優(yōu)于D列:無占優(yōu)策略,剔除DM優(yōu)于L(U,M)是重復剔除的占優(yōu)均衡重復剔除的占優(yōu)均衡第四十七頁,共五十二頁,編輯于2023年,星期五一對新婚夫婦想一起回老家過年,然雙方父母家在不同的省份,假如只能到一家父母家過年,夫想一起回夫家,妻想一起回娘家。這對夫妻很恩愛,不想分開過年。你

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論