.博弈論經(jīng)典例子

上傳人：索*** IP屬地：甘肅上傳時間：2020-10-06 格式：DOC 頁數(shù)：11 大小：74.51KB 積分：7.2 舉報 版權(quán)申訴

已閱讀5頁，還剩6頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領

文檔簡介

1、筆記博弈論經(jīng)典例子的思考摘要：博弈論就是關(guān)于在包含相互依存情況中的理性行為的研究，是研究對策現(xiàn)象中各方是否存在最合理的行動方案，以及如何找到合理的行動方案的理論和方法。本文分析思考了博弈論的兩個典型例子，也對博弈價格戰(zhàn)提出了自己的看法，希望能帶給大家一些啟發(fā)。關(guān)鍵詞：納什均衡非合作博弈無限博弈田忌賽馬戰(zhàn)國時期，齊王和大將田忌賽馬，雙方各出三匹馬各賽一局。各方的馬根據(jù)好壞分別稱為上馬、中馬、下馬。田忌的馬比齊王同一級的馬差但比齊王低一級的馬好一些。若用同一級馬比賽，田忌必然連輸三局。每局的賭注為1千金，田忌要輸3千金。田忌的謀士建議田忌在賽前先探聽齊王賽馬的出場次序，然后用自己的下馬對齊王的上

2、馬，用中馬對齊王的下馬，用上馬對齊王的中馬。結(jié)果負一局勝兩局贏得1千金。但若事先并不知道對方馬的出場次序，雙方應取何種策略？雙方采用的賽馬出場次序安排及相應的結(jié)果（齊王贏的千金數(shù)）可由下表所示列出。齊王田忌上中下上下中中上下中下上下中上下上中上中下311111上下中131111中上下113111中下上111311下中上111131下上中111113由圖可知，田忌贏的概率只有六分之一，孫臏只是掌握了齊王的思維定勢僥幸贏了一把，在一把定勝負的時候管用，當試驗的機會增多，田忌就輸了。如果賽馬的規(guī)則發(fā)生變化，每個人要將自己的馬嚴格的劃分等級，上等馬速度必須比中等馬快，中等馬必須比下等馬快，且比賽時同

3、等級的馬才可以比賽的話，那么田忌就只有輸?shù)姆萘?。孫臏只是一時抓住了規(guī)則的某些漏洞耍了些小聰明才取得一盤的勝利，我們只對他的小聰明淡然一笑罷了。博弈根據(jù)不同的游戲規(guī)則會產(chǎn)生與之相適應的策略。囚徒的困境有一天,一位富翁在家中被殺，財物被盜。警方在此案的偵破過程中，抓到兩個犯罪嫌疑人，斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財物。但是，他們矢口否認曾殺過人，辯稱是先發(fā)現(xiàn)富翁被殺，然后只是順手牽羊偷了點兒東西。于是警方將兩人隔離，分別關(guān)在不同的房間進行審訊。由地方檢察官分別和每個人單獨談話：檢察官說，“由于你們的偷盜罪已有確鑿的證據(jù)，所以可以判你們1年刑期。但是，我可以和你做個交易。如

4、果你單獨坦白殺人的罪行，你將無罪釋放，但你的同伙要被判10年刑。如果你拒不坦白，而被同伙檢舉，那么你就將被判10年刑，他無罪釋放。但是，如果你們兩人都坦白交代，那么,你們都要被判8年刑?！彼箍柗平z和那庫爾斯該怎么辦呢?他們面臨著兩難的選擇坦白或抵賴。顯然最好的策略是雙方都抵賴，結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況下無法串供，所以，按照亞當斯密的理論，每一個人都是從利己的目的出發(fā)，他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到無罪釋放，但前提是同伙抵賴，顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此，坦白還有更多的好處。如果對方坦白了而自己抵賴了，那自己

5、就得坐10年牢。太不劃算了!因此，在這種情況下還是應該選擇坦白交代，即使兩人同時坦白，至多也只判8年，總比被判10年好。所以，兩人合理的選擇是坦白，原本對雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局被稱為“納什均衡”，也叫非合作均衡。因為，每一方在選擇策略時都沒有“共謀”(串供)，他們只是選擇對自己最有利的策略，而不考慮社會福利或任何其他對手的利益。也就是說，這種策略組合由所有局中人(也稱當事人、參與者)的最佳策略組合構(gòu)成。沒有人會主動改變自己的策略以便使自己獲得更大利益?！扒敉降膬呻y選擇”有著廣泛而深刻的意義。個人理性與集體理性的沖突

6、，各人追求利己行為而導致的最終結(jié)局是一個“納什均衡”，也是對所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己，這樣他們必然要延長的刑期。只有當他們都首先替對方著想時，或者相互合謀(串供)時，才可以得到最短時問的監(jiān)禁的結(jié)果。有理由相信現(xiàn)實生活當中不是冤家不聚頭。結(jié)果第二次，第三次這兩個囚徒又被抓到一起。有了第一次教訓之后他們會在接下來的審訊里做何選擇呢？這就是有限次重復的囚徒的困境。博弈論里有一種倒推法來解決這個問題。假設這個例子只重復5次，因為在獄中渡過太多的歲月之后他們都老到做不動壞事了。我們先看第 5次他們會怎么選。顯然第5次的面臨的選擇和第1次是一模一樣的，因此沒有理由相信

7、這兩個囚徒會在第5次審訊里合作。如果第5次不合作，為什么他們會在第 4次合作呢？如此倒推，有限次重復的囚徒的困境和一次的結(jié)果沒有任何不同，即雙雙坦白，入獄8年。如果把這種體驗無限延長，或至少是他們倆知道肯定還有這種事，只是不知道什么時候才能停止這種把戲，這就是無限次重復的囚徒的困境，讓我們再來看看這會不會有不同。因為無限博弈不存在最后一次，倒推法不再適用。假設一個人在監(jiān)獄里呆久了會適應這種環(huán)境變得油滑。因此第一個8年最長，后來再進去的8年變得只有象6年一樣長，再后來是4年.。因此這里引入一個表示監(jiān)獄生活適應性指數(shù)的符號&，0&1。這個 &值越大表明對監(jiān)獄生活越難適應，前一個8年和后一個8年差不

8、多一樣漫長。如果&越小則表示這個囚犯對環(huán)境適應很快，后來呆上8年都沒什么感覺了。對于一個經(jīng)常被判8年的人來說，他的受懲罰實際感受的總量是：(-8)+&(-8)+&(-8)+.。易知，如果0&1，則1+&+&+&+.的極限值是1/(1-&)。假設這兩個囚徒選擇這樣一種戰(zhàn)略：最開始選擇抵賴，然后一直選擇抵賴直到另一方選擇了坦白，然后就永遠選擇坦白。這樣的話其中任一個囚徒選擇永遠抵賴的總收益是：(-1)+&(-1)+&(-1)+.=(-1)/1-&。如果其中某一次他選擇了坦白，則那一次他將獲無罪釋放，之后對方將用永遠坦白來懲罰他，他們倆都一直被判8年。因此總收益是：0+&(-8)+& &(-8)+.

9、=(-8&)/(1-&)。如果要使某次坦白對其中一個囚犯有利，顯然需要其中坦白一次這種選擇所帶來的收益(-8&)/(1-&)大于等于一直互相合作抵賴所帶來的總收益(-1)/1-&，也就是&=1/8的情況下(即某人實在認為獄中歲月妙不可言，判得久對他來說無所謂，&值極低)才會有人選擇中途坦白，否則在無限次重復的囚徒的困境當中他們都會選擇一直抵賴以使自己能盡量減少在監(jiān)獄中渡過時光。因此在無限次重復的囚徒的困境中最后的結(jié)果和一次或是有限次完全不同。在很大概率上囚徒會選擇合作而不是各自為戰(zhàn)。也就是說，在長期的雙方關(guān)系中任何短視的行為都是得不償失的。這個結(jié)果可以用來說明為什么我們的傳統(tǒng)文化里強調(diào)人與人的

10、關(guān)系以和為貴。數(shù)千年來中國一直是農(nóng)業(yè)國家，農(nóng)業(yè)人口縛系于土地，鄉(xiāng)間鄰里相對固定。因此人們彼此之間的很多利益沖突可以用無限次重復的囚徒困境來描述。也就是說如果某次利益是通過沖突而不是合作解決，那么失利的一方必然會設法報復，而且這種對立的情緒很有可能在后輩中延續(xù)，也就是無限次被重復，結(jié)果必然是雙方都得不償失。此所謂冤冤相報何時了!我的看法是：現(xiàn)實中囚徒要考慮更多的因素，即使他們合謀決定合作，他們商量好都抵賴，但是真正面對警察的審訊時，他們又會考慮對放是否會出賣自己，他們有可能會繼續(xù)出賣對方。但是人都有報復心理的，如果一方違背了約定，雖然能很快出獄，但是若干年后呢，那位囚徒刑滿釋放后會放過他嗎？考慮

11、到若干年后的情況，兩個囚徒也許會都選擇抵賴。如果懲罰和獎賞的度發(fā)生改變：兩人都坦白的話，則均判刑1年；A坦白B抵賴，則A無罪釋放，B判刑5年；兩人都抵賴的話，則均判刑3個月，這樣的情況下，兩個囚徒會做怎樣的選擇呢？這樣兩個囚徒都選擇坦白的可能性比較大，畢竟一年的時間比較短，不必為了3個月的刑而冒坐牢5年的風險。這里涉及到了風險收益不對稱問題，湖北省的一些官員，明明知道某些問題存在，卻坐視不理，很大的原因就是風險收益不對稱，不治理問題不會太大，治理好了獎勵表彰也不怎么樣，治理差了要受到責怪，于是湖北就有些落后，原因就是湖北的官太聰明了?？傊?，囚徒的困境涉及到的問題眾多，不僅僅是心理與智力的較量，

12、游戲規(guī)則的指定對結(jié)果產(chǎn)生的影響是比較明顯的。而現(xiàn)實中我們要考慮的相關(guān)因素會更多，博弈論只有與我們已經(jīng)掌握的情況充分的結(jié)合才能得出比較滿意的策略。博弈價格戰(zhàn)現(xiàn)在我們經(jīng)常會遇到各種各樣的家電價格大戰(zhàn)，彩電大戰(zhàn)、冰箱大戰(zhàn)、空調(diào)大戰(zhàn)、微波爐大戰(zhàn)這些大戰(zhàn)的受益者首先是消費者。每當看到一種家電產(chǎn)品的價格大戰(zhàn)，百姓都會“沒事兒偷著樂”。在這里，我們可以解釋廠家價格大戰(zhàn)的結(jié)局也是一個“納什均衡”，而且價格戰(zhàn)的結(jié)果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結(jié)果是穩(wěn)定的，即是一個“納什均衡”。這個結(jié)果可能對消費者是有利的，但對廠商而言是災難性的。所以，價格戰(zhàn)對廠商而言意味著自殺。從這個案例中我們可以引伸出兩

13、個問題，一是競爭削價的結(jié)果或“納什均衡”可能導致一個有效率的零利潤結(jié)局。二是如果不采取價格戰(zhàn)，作為一種敵對博弈論其結(jié)果會如何呢?每一個企業(yè)，都會考慮采取正常價格策略，還是采取高價格策略形成壟斷價格，并盡力獲取壟斷利潤、如果壟斷可以形成，則博弈雙方的共同利潤最大。這種情況就是壟斷經(jīng)營所做的，通常會抬高價格。另一個極端的情況是廠商用正常的價格，雙方都可以獲得利潤：從這一點，我們又引出一條基本準則：“把你自己的戰(zhàn)略建立在假定對手會按其最佳利益行動的基礎上”。事實上，完全競爭的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態(tài)下，每一個廠商或消費者都是按照所有的別人已定的價格來進行決策。在這種均衡中

14、,每一企業(yè)要使利潤最大化，消費者要使效用最大化，結(jié)果導致了零利潤，也就是說價格等于邊際成本。在完全競爭的情況下，非合作行為導致了社會所期望的經(jīng)濟效率狀態(tài)。如果廠商采取合作行動并決定轉(zhuǎn)向壟斷價格，那么社會的經(jīng)濟效率就會遭到破壞。這就是為什么WTO和各國政府要加強反壟斷的意義所在。我對博弈價格戰(zhàn)的看法是：各個公司的實力是不一樣的，一些國際上知名的家電廠商，和國內(nèi)廠商一樣采取低價戰(zhàn)略，同樣低價的情況下，老百姓當然愿意選擇國際知名的大公司的產(chǎn)品，因為國際知名大公司的產(chǎn)品有檔次，質(zhì)量也不會比國內(nèi)的差。雖然說廠家都會虧本，但是國際大公司資金雄厚，他虧本幾年甚至十幾年都虧得起，國內(nèi)一些脆弱的公司虧本幾個月或

15、者一年就倒下了，一家家國內(nèi)家電廠商退出后，國際大公司形成壟斷，適當提高價格，不久就會把以前虧損的錢彌補回來，也許還會賺得更多。但是當一些普通品牌家電廠商采取低價策略的時候，一些名牌家電廠商會采取提價的策略，也許一些經(jīng)濟能力差點的消費者會買相對便宜的普通品牌家電，但是有能力買名牌家電的人會覺得名牌家電不降價是因為質(zhì)量好，所以盡管名牌家電提價后仍然獲得了豐厚的利潤，同時在中國這個社會，攀比非常嚴重，人們的思維定勢是便宜沒好貨，在中國，少數(shù)消費者目前處于盲目消費階段，不管多貴的東西都有人買，商家不愁賣不出去，。所以說，商家不管是采取提價還是降價都是可取的，但是要結(jié)合當時的情況，還有就是廠家的目的到底

16、是為了立竿見影還是在幾年后的翻盤。結(jié)語博弈滲透到生活的各個方面，實際情況往往比理論復雜得多，不按常理出牌也許會收到意想不到的效果，只有知己知彼才能做出最正確的決策。參考文獻1、施錫銓著博弈論上海：上海財經(jīng)大學出版社，20002 劉加福新管理博弈學中國紡織出版社，20053 張維迎博弈論與信息經(jīng)濟學上海人民出版社，19964 謝識予經(jīng)濟博弈論石家莊：復旦大學出版社，2002/viewthread.php?tid=105717博弈論是指某個個人或是組織，面對一定的環(huán)境條件，在一定的規(guī)則約束下，依靠所掌握的信息，從各自選擇的行為或是策略進行選擇并加以實施，并從各

17、自取得相應結(jié)果或收益的過程，在經(jīng)濟學上博奕論是個非常重要的理論概念。下面介紹幾個關(guān)于博弈論的例子：1。智豬博弈這個例子講的是：豬圈里有兩頭豬，一頭大豬，一頭小豬。豬圈的一邊有個踏板，每踩一下踏板，在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板，另一只豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時，大豬會在小豬跑到食槽之前剛好吃光所有的食物；若是大豬踩動了踏板，則還有機會在小豬吃完落下的食物之前跑到食槽，爭吃到另一半殘羹。那么，兩只豬各會采取什么策略？答案是：小豬將選擇“搭便車”策略，也就是舒舒服服地等在食槽邊；而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。

18、原因何在？因為，小豬踩踏板將一無所獲，不踩踏板反而能吃上食物。對小豬而言，無論大豬是否踩動踏板，不踩踏板總是好的選擇。反觀大豬，已明知小豬是不會去踩動踏板的，自己親自去踩踏板總比不踩強吧，所以只好親力親為了。 “小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導致的。規(guī)則的核心指標是：每次落下的事物數(shù)量和踏板與投食口之間的距離。如果改變一下核心指標，豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎？試試看。改變方案一：減量方案。投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩，大豬將會把食物吃完；大豬去踩，小豬將也會把食物吃完。誰去踩踏板，就意味著為對方貢獻食物，所以誰也不會有踩

19、踏板的動力了。如果目的是想讓豬們?nèi)ザ嗖忍ぐ?，這個游戲規(guī)則的設計顯然是失敗的。改變方案二：增量方案。投食為原來的一倍分量。結(jié)果是小豬、大豬都會去踩踏板。誰想吃，誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會，所以競爭意識卻不會很強。對于游戲規(guī)則的設計者來說，這個規(guī)則的成本相當高（每次提供雙份的食物）；而且因為競爭不強烈，想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓谩?改變方案三：減量加移位方案。投食僅原來的一半分量，但同時將投食口移到踏板附近。結(jié)果呢，小豬和大豬都在拼命地搶著踩踏板。等待者不得食，而多勞者多得。每次的收獲剛好消費完。對于游戲設計者，這是

20、一個最好的方案。成本不高，但收獲最大。原版的“智豬博弈”故事給了競爭中的弱者（小豬）以等待為最佳策略的啟發(fā)。但是對于社會而言，因為小豬未能參與競爭，小豬搭便車時的社會資源配置的并不是最佳狀態(tài)。為使資源最有效配置，規(guī)則的設計者是不愿看見有人搭便車的，政府如此，公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象，就要看游戲規(guī)則的核心指標設置是否合適了。比如，公司的激勵制度設計，獎勵力度太大，又是持股，又是期權(quán)，公司職員個個都成了百萬富翁，成本高不說，員工的積極性并不一定很高。這相當于“智豬博弈” 增量方案所描述的情形。但是如果獎勵力度不大，而且見者有份（不勞動的“小豬”也有），一度十分努力的大豬也

21、不會有動力了-就象“智豬博弈”減量方案一所描述的情形。最好的激勵機制設計就象改變方案三-減量加移位的辦法，獎勵并非人人有份，而是直接針對個人（如業(yè)務按比例提成），既節(jié)約了成本（對公司而言），又消除了“搭便車”現(xiàn)象，能實現(xiàn)有效的激勵。許多人并未讀過“智豬博弈”的故事，但是卻在自覺地使用小豬的策略。股市上等待莊家抬轎的散戶；等待產(chǎn)業(yè)市場中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資；公司里不創(chuàng)造效益但分享成果的人，等等。因此，對于制訂各種經(jīng)濟管理的游戲規(guī)則的人，必須深諳“智豬博弈”指標改變的個中道理。 2囚徒困境在博弈論中，含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境”（pris

22、oners dilemma）博弈模型。該模型用一種特別的方式為我們講述了一個警察與小偷的故事。假設有兩個小偷A和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進行審訊，對每一個犯罪嫌疑人，警方給出的政策是：如果一個犯罪嫌疑人坦白了罪行，交出了贓物，于是證據(jù)確鑿，兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白，則兩人各被判刑8年；如果另一個犯罪嫌人沒有坦白而是抵賴，則以妨礙公務罪（因已有證據(jù)表明其有罪）再加刑2年，而坦白者有功被減刑8年，立即釋放。如果兩人都抵賴，則警方因證據(jù)不足不能判兩人的偷竊罪，但可以私入民宅的罪名將兩人各判入獄1年。我們來看看這個博弈可預測的均衡是什么

23、。對A來說，盡管他不知道B作何選擇，但他知道無論B選擇什么，他選擇“坦白”總是最優(yōu)的。顯然，根據(jù)對稱性，B也會選擇“坦白”，結(jié)果是兩人都被判刑8年。但是，倘若他們都選擇“抵賴”，每人只被判刑1年。（抵賴、抵賴）是最優(yōu)的，因為偏離這個行動選擇組合的任何其他行動選擇組合都至少會使一個人的境況變差。不難看出，“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略，而（坦白，坦白）是一個占優(yōu)戰(zhàn)略均衡。3笨蝸居Ross和Rachel是一對情侶，暗地里都有過不忠的行為。但他們并不想分開，而是希望能繼續(xù)生活在一起，于是不得不面對一個問題：是否應該向?qū)Ψ教拱鬃约旱牟恢倚袨?？對于Ross來說，他有兩個戰(zhàn)略，“坦白”或者“隱瞞”。如

24、果他向Rachel坦白自己的過錯，Rachel作為“清白”的一方(Ross并不知道Rachel的不忠行為，當Rachel選擇“隱瞞”)將在二人關(guān)系中占據(jù)心理優(yōu)勢，從而使得Ross處于弱勢狀態(tài)。如果他決定隱瞞，則將背負良心上的譴責。這個博弈是對稱的，因此對于Rachel來說同樣存在這樣的兩難抉擇。我們引入經(jīng)濟學的收益概念來衡量博弈中戰(zhàn)略的優(yōu)劣，設收益上限為10分。如果Rachel選擇“隱瞞”而Ross選擇“坦白”的話，Rachel將占據(jù)“我是清白的”的心理優(yōu)勢，從而獲得9的收益，而劣勢一方的Ross的收益只有5。反過來對Ross來說也是一樣。如果兩人都不約而同地選擇“坦白”，雖然彼此都會感到被背

25、叛的痛苦，但是能夠?qū)⑿谋燃旱鼗ハ嘣?，二人的收益都?。如果兩人都選擇“隱瞞”，他們之間感情得以維系的信任基礎已經(jīng)在事實上消失了，對雙方來說都是非常大的損失，收益都只有6。下表列出了四種情況下雙方的收益，Rachel在前。Ross坦白隱瞞Rachel坦白8 , 85 , 9 隱瞞9 , 56 , 6直觀地說，肥皂劇觀眾和經(jīng)濟學家們最愿意看到的結(jié)果自然是雙方都坦承錯誤并互相原諒，這樣可以使這部肥皂劇更加吸引人并且使雙方收益之和最大。但博弈論給出的結(jié)論卻正好相反。從表中可以看出，在Rachel選擇“坦白”的情況下，Ross選擇“隱瞞”的收益大于選擇“坦白”的收益；在Rachel選擇“隱瞞”的情況下

26、，Ross選擇“隱瞞”的收益也大于選擇“坦白”的收益。因此，“隱瞞”對于Ross來說是一個占優(yōu)戰(zhàn)略，無論對方做出什么選擇，這個戰(zhàn)略都可以保證他的收益最大。作為一個理性的人(這是博弈論的基本假設)，Ross必然會選擇“隱瞞”。同樣，Rachel也會選擇“隱瞞”。于是，博弈的結(jié)果就是雙方都選擇“隱瞞”，各得到6收益。這是個穩(wěn)定的納什均衡，雖然結(jié)果出乎意料：博弈雙方都選擇了使自己利益最大化的戰(zhàn)略，卻得到了最差的收益(總收益是四種方案中最低的)。而觀眾所期待的“彼此坦白”的情況下，任何一方都可以通過改變策略而獲得更大的收益，比如Ross由“坦白”轉(zhuǎn)向“隱瞞”可以使自己的收益由8上升到9。因此它是一個

27、不穩(wěn)定解，必須依靠某種外界約束才能存在。我們設想Ross和Rachel之間達成某種形式的協(xié)議，承諾對對方的不忠行為既往不咎。在這個約束條件下“彼此坦白”的解能夠穩(wěn)定存在，這就是合作解。這是個典型的社會兩難問題。各自從自身利益出發(fā)的博弈雙方會自然而然地達到穩(wěn)定的納什均衡，但這往往導致最壞的收益。如果雙方能建立有約束力的協(xié)議，則可以形成合作解，從而獲得最好的收益。/%D0%C7%C6%DA%B0%CB%B5%C4%CE%DA%C1%FA%B2%E8/blog/item/ee05bb119e51f47ccb80c45f.html最近三四十年，經(jīng)濟學經(jīng)歷了一場博弈論

28、革命，就是引入博弈論的概念和方法改造經(jīng)濟學的思維，推進經(jīng)濟學的研究。諾貝爾經(jīng)濟學獎授予包括美國普林斯頓大學的納什博士在內(nèi)的3位博弈論專家，可以看作是一個標志，這自然也激發(fā)了人們了解博弈論的熱情。博弈論作為現(xiàn)代經(jīng)濟學的前沿領域，已成為占據(jù)主流的基本分析工具。博弈論是研究決策主體的行為發(fā)生直接相互作用時的決策以及這種決策的均衡，也就是說，當一個主體的選擇受到其他主體選擇的影響，而且反過來影響到其他主體選擇時的決策問題和均衡問題。一個完整的博弈應當包括五個方面的內(nèi)容：第一，博弈的參加者，即博弈過程中獨立決策、獨立承擔后果的個人和組織；第二，博弈信息，即博弈者所掌握的對選擇策略有幫助的情報資料；第

29、三，博弈方可選擇的全部行為或策略的集合；第四，博弈的次序，即博弈參加者做出策略選擇的先后；第五，博弈方的收益，即各博弈方做出決策選擇后的所得和所失。囚徒困境囚徒困境是博弈論里最經(jīng)典的例子之一。講的是兩個嫌疑犯（和）作案后被警察抓住，隔離審訊；警方的政策是坦白從寬，抗拒從嚴，如果兩人都坦白則各判年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判年；如果都不坦白則因證據(jù)不足各判年。在這個例子里，博弈的參加者就是兩個嫌疑犯和，他們每個人都有兩個策略即坦白和不坦白，判刑的年數(shù)就是他們的支付?？赡艹霈F(xiàn)的四種情況：和均坦白或均不坦白、坦白不坦白或者坦白不坦白，是博弈的結(jié)果。和均坦白是這個博弈的納什

30、均衡。這是因為，假定選擇坦白的話，最好是選擇坦白，因為坦白判年而抵賴卻要判十年；假定選擇抵賴的話，最好還是選擇坦白，因為坦白判不被判刑而抵賴確要被判刑年。即是說，不管坦白或抵賴，的最佳選擇都是坦白。反過來，同樣地，不管是坦白還是抵賴，的最佳選擇也是坦白。結(jié)果，兩個人都選擇了坦白，各判刑年。在（坦白、坦白）這個組合中，和都不能通過單方面的改變行動增加自己的收益，于是誰也沒有動力游離這個組合，因此這個組合是納什均衡。囚徒困境反映了個人理性和集體理性的矛盾。如果和都選擇抵賴，各判刑年，顯然比都選擇坦白各判刑年好得多。當然，和可以在被警察抓到之前訂立一個攻守同盟，但是這可能不會有用，因為它不構(gòu)成納什

31、均衡，沒有人有積極性遵守這個協(xié)定。實證分析：囚犯困境在經(jīng)濟學上有很多應用，也有力地解釋了一些經(jīng)濟現(xiàn)象。一電信價格競爭根據(jù)我國電信業(yè)的實際情況，我們來構(gòu)造電信業(yè)價格戰(zhàn)的博弈模型。假設此博弈的參加者為電信運營商A與B, 他們在電信某一領域展開競爭，一開始的價格都是P0。A（中國電信）是老牌企業(yè)，實力雄厚，占據(jù)了絕大多數(shù)的市場份額；B（中國聯(lián)通）則剛剛成立不久，翅膀還沒有長硬，是政府為了打破壟斷鼓勵競爭而籌建起來的。正因為B是政府扶植起來鼓勵競爭的，所以B得到了政府的一些優(yōu)惠，其中就有B的價格可以比P0低10。這一舉動，還不會對A產(chǎn)生多大的影響，因為A的根基實在是太牢固了。在這樣的市場分配

32、下，A、B可以達到平衡，但由于B在價格方面的優(yōu)勢，市場份額逐步壯大，到了一定程度，對A造成了影響。這時候，A該怎么做？不妨假定： A降價而B維持，則A獲利15，B損失5，整體獲利10； A維持且B也維持，則A獲利5，B獲利10，整體獲利15； A維持而B降價，則A損失10，B獲利15，整體獲利5； A降價且B也降價，則A損失5，B損失5，整體損失10。從A角度看，顯然降價要比維持好，降價至少可以保證比B好，在概率均等的情況下，A降價的收益為15505505，維持的收益為550105025，為了自身利益的最大化，A就不可避免地選擇了降價。從B角度看，效果也一樣，降價同樣比維持好，其降價收益為5

33、，維持收益為25，它也同樣會選擇降價。在這輪博弈中，A、B都將降價作為策略，因此各損失5，整體損失10，整體收益是最差的。這就是此博弈最終所出現(xiàn)的納什均衡。我們構(gòu)造的這一電信業(yè)價格戰(zhàn)博弈模型是典型的囚徒困境現(xiàn)象，各個局部都尋求利益的最大化，而整體利益卻不是最優(yōu)，甚至是最差。許多其他行業(yè)的價格競爭都是典型的囚徒困境現(xiàn)象，如可口可樂公司和百事可樂公司之間的競爭、各大航空公司之間的價格競爭等等。二OPEC組織成員國之間的合作與背叛囚徒困境告訴我們，個人理性和集體理性之間存在矛盾，基于個人理性的正確選擇會降低大家的福利，也就是說，基于個人利益最大化的前提下，帕累托改進得不到進行，帕累托最優(yōu)得不到實

34、現(xiàn)。上述我們在對電信價格競爭的博弈分析中，只是一次性的囚徒困境博弈，因此得到了互相降價的納什均衡。而在現(xiàn)實生活當中，信任與合作很少達到如此兩難的境地，無論在自然界還是在人類社會，合作都是一種隨處可見的現(xiàn)象。比如中東石油輸出國組織（簡稱）的成立，本身就是要限制各石油生產(chǎn)國的產(chǎn)量，以保持石油價格，以便獲取利潤，是合作的產(chǎn)物。OPEC之所以能夠成立，各組織成員國之間之所以能夠合作，是因為囚徒困境如果是一次性博弈(One shot game)的話，基于個人利益最大化，得到納什均衡解，但如果是多次博弈，人們就有了合作的可能性，囚徒困境就有可能破解，合作就有可能達成。連續(xù)的合作有可能成為重復的囚徒困境

35、的均衡解，這也是博弈論上著名的大眾定理(Folk Theorem)的含義。但合作的可能性不是必然性。博弈論的研究表明，要想使合作成為多次博弈的均衡解，博弈的一方（最好是實力更強的一方）必須主動通過可信的承諾(Credible commitment) ，向另一方表示合作的善意，努力把這個善意表達清楚，并傳達出去。如果該困境同時涉及多個對手，則要在博弈對手中形成聲譽，并用心地維護這個聲譽。這里可信的承諾是一個很牽強的翻譯，Credible commitment并不是什么空口諾言，而是實實在在的付出。所以合作是非常困難的。所以OPEC組織經(jīng)常會有成員國不遵守組織的協(xié)定，私自增加石油產(chǎn)量。每個成員

36、國都這樣想，只要他們不增加產(chǎn)量，我增加一點點產(chǎn)量對價格沒什么影響，結(jié)果每個國家都增加產(chǎn)量，造成石油價格下跌，大家的利潤都受到損失。當然，一些產(chǎn)量增加較少的國家損失更多，于是也更加大量生產(chǎn)，造成價格進一步下降-結(jié)果，陷入一個困境：大家都增加產(chǎn)量，價格下跌，大家再增加產(chǎn)量，價格再下跌.。理論上，幾乎所有的卡特爾都會遭到失敗，原因就在于卡特爾的協(xié)定（類似囚犯的攻守同盟）不是一個納什均衡，沒有成員有興趣遵守。那么是不是不可能有卡特爾合作成功了？理論上，如果是無限期的合作，雙方考慮長遠利益，他們的合作是會成功的。但只要是有限次的合作，合作就不會成功。比如合作次，那么在第九次博弈參與人就會采取不合作態(tài)度

37、，因為大家都想趁最后一次機會撈一把，反正以后我也不會跟你合作了。但是大家料到第九次會出現(xiàn)不合作，那么就很可能在第八次就采取不合作的態(tài)度。第八次不合作會使大家在第七次就不合作.一直到，從第一次開始大家都不會采取合作態(tài)度。以上是運用博弈論中的經(jīng)典案例囚徒困境對現(xiàn)實經(jīng)濟生活的一些簡單的理論上的分析，雖然在現(xiàn)實生活當中影響人們決策和態(tài)度的因素很多，但是，博弈論作為現(xiàn)代經(jīng)濟學的前沿領域，始終是一個強有力的分析工具。/1262473.html一個著名的博弈寓言：村莊里的大屠殺在一個偏僻的山里，有一個村莊。這里是女人掌權(quán)，女人對一切事務說了算。村里有100對夫婦。在這個村里已經(jīng)形成了約定俗成的規(guī)定。如果女人發(fā)現(xiàn)自己的丈夫?qū)ψ约翰恢业脑?，就會毫不猶豫地將他殺死，而且就在當天執(zhí)行。當然，她必須有確切的證據(jù)來證明她丈夫不忠。由于這個因素，某個女人發(fā)現(xiàn)某個男人不忠，她不會將之告訴那個不忠男人的妻子。但是，她會告訴其他人的妻子，并且女人們會相互傳遞這一信息，因此最后，一個男人不忠，除了其妻子不知道外，其他女人都知道。而事實上是，村子里的這100對夫婦的男人都不忠，但由于女人不會將她知道的事實告訴不忠男人的妻子，每個女人都不知道自己的男人不忠。因此，該村子一直很穩(wěn)定，而沒有發(fā)生妻子殺死丈夫的行為。村

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

.博弈論經(jīng)典例子

文檔簡介

溫馨提示

最新文檔

評論

.博弈論經(jīng)典例子

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔