博弈論案例分析_第1頁
博弈論案例分析_第2頁
博弈論案例分析_第3頁
博弈論案例分析_第4頁
博弈論案例分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第頁博弈論博弈論(GameTheory),亦名“對策論”、“游戲理論”,屬應(yīng)用數(shù)學(xué)的一個分支,博弈論已經(jīng)成為經(jīng)濟(jì)學(xué)的標(biāo)準(zhǔn)分析工具之一。目前在生物學(xué)、經(jīng)濟(jì)學(xué)、國際關(guān)系、計算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。博弈論主要研究公式化了的激勵結(jié)構(gòu)間的相互作用。是研究具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。也是運(yùn)籌學(xué)的一個重要學(xué)科。博弈論考慮游戲中的個體的預(yù)測行為和實(shí)際行為,并研究它們的優(yōu)化策略。生物學(xué)家使用博弈理論來理解和預(yù)測進(jìn)化論的某些結(jié)果。博弈論是指某個個人或是組織,面對一定的環(huán)境條件,在一定的規(guī)則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進(jìn)行選擇并加以實(shí)施,并從各自取得相應(yīng)結(jié)果或收益的過程,在經(jīng)濟(jì)學(xué)上博奕論是個非常重要的理論概念。什么是博弈論?古語有云,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上布一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們“出棋”招數(shù)中理性化、邏輯化的部分,并將其系統(tǒng)化為一門科學(xué)。換句話說,就是研究個體如何在錯綜復(fù)雜的相互影響中得出最合理的策略。現(xiàn)在,我們就一些例子來討論博弈論相關(guān)內(nèi)容。一、從“囚徒困境”開始在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的“囚徒困境”(prisoners’dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個警察及小偷的故事。假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進(jìn)行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。下表給出了這個博弈的支付矩陣。B坦白B抵賴A坦白–8,–80,–10A抵賴–10,0–1,–1表囚徒困境博弈[Prisoner'sdilemma]我們來看看這個博弈可預(yù)測的均衡是什么。對A來說,盡管他不知道B作何選擇,但他知道無論B選擇什么,他選擇“坦白”總是最優(yōu)的。顯然,根據(jù)對稱性,B也會選擇“坦白”,結(jié)果是兩人都被判刑8年。但是,倘若他們都選擇“抵賴”,每人只被判刑1年。在表2.2中的四種行動選擇組合中,(抵賴、抵賴)是帕累托最優(yōu)的,因為偏離這個行動選擇組合的任何其他行動選擇組合都至少會使一個人的境況變差。不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個占優(yōu)戰(zhàn)略均衡。要了解納什的貢獻(xiàn),首先要知道什么是非合作博弈問題。現(xiàn)在幾乎所有的博弈論教科書上都會講“囚犯的兩難處境”的例子,每本書上的例子都大同小異。話說有一天,一位富翁在家中被殺,財物被盜。警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認(rèn)曾殺過人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點(diǎn)兒東西。于是警方將兩人隔離,分別關(guān)在不同的房間進(jìn)行審訊。由地方檢察官分別和每個人單獨(dú)談話。檢察官說,“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。但是,我可以和你做個交易。如果你單獨(dú)坦白殺人的罪行,我只判你三個月的監(jiān)禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑?!彼箍柗平z和那庫爾斯該怎么辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。但是由于兩人處于隔離的情況下無法串供。所以,按照亞當(dāng)·斯密的理論,每一個人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到很短的監(jiān)禁———3個月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。因為,每一方在選擇策略時都沒有“共謀”(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當(dāng)事人、參及者)的最佳策略組合構(gòu)成。沒有人會主動改變自己的策略以便使自己獲得更大利益?!扒敉降膬呻y選擇”有著廣泛而深刻的意義。個人理性及集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白及抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁的結(jié)果。“納什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟(jì)中,每一個人都從利己的目的出發(fā),而最終全社會達(dá)到利他的效果。從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟(jì)、社會、政治、國防、管理和日常生活中的博弈現(xiàn)象。我們將例舉出許多類似于“囚徒的兩難處境”這樣的例子。如價格戰(zhàn)博弈、軍奮競賽博弈、污染博弈等等。一般的博弈問題由三個要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參及者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個特定的策略關(guān)系被選擇,每一局中人所得到的效用。所有的博弈問題都會遇到這三個要素。二、經(jīng)濟(jì)學(xué)中的“智豬博弈”(Pigs’payoffs)

這個例子講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機(jī)會搶先吃到另一邊落下的食物。當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機(jī)會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。那么,兩只豬各會采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好親力親為了?!靶∝i躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板及投食口之間的距離。如果改變一下核心指標(biāo),豬圈里還會出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?試試看。改變方案一:減量方案。投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方貢獻(xiàn)食物,所以誰也不會有踩踏板的動力了。如果目的是想讓豬們?nèi)ザ嗖忍ぐ澹@個游戲規(guī)則的設(shè)計顯然是失敗的。改變方案二:增量方案。投食為原來的一倍分量。結(jié)果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義”社會,所以競爭意識卻不會很強(qiáng)。對于游戲規(guī)則的設(shè)計者來說,這個規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因為競爭不強(qiáng)烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓?。改變方案三:減量加移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ?。等待者不得食,而多勞者多得。每次的收獲剛好消費(fèi)完。對于游戲設(shè)計者,這是一個最好的方案。成本不高,但收獲最大。原版的“智豬博弈”故事給了競爭中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對于社會而言,因為小豬未能參及競爭,小豬搭便車時的社會資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。比如,公司的激勵制度設(shè)計,獎勵力度太大,又是持股,又是期權(quán),公司職員個個都成了百萬富翁,成本高不說,員工的積極性并不一定很高。這相當(dāng)于“智豬博弈”增量方案所描述的情形。但是如果獎勵力度不大,而且見者有份(不勞動的“小豬”也有),一度十分努力的大豬也不會有動力了就象“智豬博弈”減量方案一所描述的情形。最好的激勵機(jī)制設(shè)計就象改變方案三減量加移位的辦法,獎勵并非人人有份,而是直接針對個人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對公司而言),又消除了“搭便車”現(xiàn)象,能實(shí)現(xiàn)有效的激勵。許多人并未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。因此,對于制訂各種經(jīng)濟(jì)管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標(biāo)改變的個中道理。三、生活中的“占座大戰(zhàn)”大學(xué)生活中,生活也是比較的豐富,其中,吃飯也是很重要的部分,大家一般都是在學(xué)校食堂吃飯,由于大家吃飯的時間比較集中,所以吃飯的時候人數(shù)特別多,食堂座位有限,同學(xué)們也希望在食堂買完飯后不用再找座位,因此很多同學(xué)在買飯之前就用自己的私人物品占座位,為此,食堂也經(jīng)常發(fā)生因為占座位而引起的糾紛。在這里稱為“占座大戰(zhàn)”博弈,就這個博弈問題進(jìn)行討論;現(xiàn)在就這個問題來進(jìn)行一個博弈論的分析,兩個發(fā)生糾紛的人都有兩個選擇,分別是U(沖上去進(jìn)行理論,爭取座位),D(選擇退讓,找其他的座位),若兩人都進(jìn)行理論,爭取座位的話,很有可能就是兩敗俱傷,兩個人也可能因意見不合而進(jìn)而出現(xiàn)打架的現(xiàn)象,而且在食堂這個公共場所,對大家的形象都有著很不好的影響;如果一方選擇退讓,而另外一方則選擇理論,則結(jié)果可能就是一方另找座位,有些損失,一方占領(lǐng)了座位,取得了勝利;還有就是雙方都選擇了退讓,將座位讓給其他人;根據(jù)以上的分析,現(xiàn)在有如下的支付圖:參及人2UDU -2,-2 1,-1參及人1D -1,1 0,0求解過程(箭頭法):參及人2UDU -2,-2 1,-1參及人1D -1,1 0,0現(xiàn)在求解這個博弈問題:由博弈問題的Nash均衡可以知道,在以上的博弈問題中存在著兩個純戰(zhàn)略Nash均衡——(U,D)和(D,U),就是說,在整個的博弈中,兩個人中有一個人退讓,尋找其他的座位,另外一個人進(jìn)行爭論得到座位。對于這個結(jié)果,我們可以這樣認(rèn)識:我們現(xiàn)在認(rèn)為兩個人都是理性的,在一個參及人預(yù)測到另一方將會進(jìn)行理論時,明智的選擇就是退讓,避免更大的損失,而當(dāng)預(yù)測到對方將會選擇退讓時,則進(jìn)行理論,以求得最大的勝利;可以將Nash均衡作為此次“搶座大戰(zhàn)”的一致性預(yù)測,而其它的結(jié)果(U,U)和(D,D)都將不會是一致性預(yù)測,就(U,U)來說,對雙方而言都不是最好的結(jié)果,且受到的損失也會是最大的;再就是(D,D),雙方都進(jìn)行退讓,也是不太可能的,當(dāng)有一方有退讓的跡象,另外一方就可能進(jìn)行理論來求得利益的最大,因此這個結(jié)果也不會是一致性的預(yù)測,不會是一個均衡,必然會偏離的,向著Nash均衡的方向偏移。在上面的這個博弈中,出現(xiàn)了兩個Nash均衡,在一個博弈問題中,如果只存在一個Nash均衡,那么Nash均衡作為一致性的預(yù)測,應(yīng)該說是很有效的。但是,如果像這個“座位大戰(zhàn)”博弈一樣,存在兩個Nash均衡,那么Nash均衡作為博弈解的意義也就相對弱化了。我們不能進(jìn)行預(yù)測,到底是誰進(jìn)行了退讓,是誰進(jìn)行了進(jìn)一步的理論,得到座位;如果兩個人對兩個均衡到底哪一個會出現(xiàn)的預(yù)測不一致就會出現(xiàn)問題,比如說,參及人1預(yù)測博弈的解為自己理論,對方退讓,而參及人2預(yù)測的是對方退讓,自己理論,那么最后出現(xiàn)的真正的結(jié)果將不會是Nash均衡(U,D),也不會是(D,U),而會是損傷最大的非Nash均衡(U,U)。由以上的分析,出現(xiàn)了nash均衡的多重性,我們暫且用Schellling的“焦點(diǎn)效應(yīng)”來解決,將均衡聚焦到一個上,我們分以下情況:(1),兩個參及者之間,有一個是女生,一個是男生,則很有可能是博弈的解偏向女生的一邊,男生讓著女生;(2),兩個參及者之間,有一個是年輕人,一個是相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論