版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第頁(yè)博弈論博弈論(GameTheory),亦名“對(duì)策論”、“游戲理論”,屬應(yīng)用數(shù)學(xué)的一個(gè)分支,博弈論已經(jīng)成為經(jīng)濟(jì)學(xué)的標(biāo)準(zhǔn)分析工具之一。目前在生物學(xué)、經(jīng)濟(jì)學(xué)、國(guó)際關(guān)系、計(jì)算機(jī)科學(xué)、政治學(xué)、軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。博弈論主要研究公式化了的激勵(lì)結(jié)構(gòu)間的相互作用。是研究具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科。博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,并研究它們的優(yōu)化策略。生物學(xué)家使用博弈理論來(lái)理解和預(yù)測(cè)進(jìn)化論的某些結(jié)果。博弈論是指某個(gè)個(gè)人或是組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進(jìn)行選擇并加以實(shí)施,并從各自取得相應(yīng)結(jié)果或收益的過(guò)程,在經(jīng)濟(jì)學(xué)上博奕論是個(gè)非常重要的理論概念。什么是博弈論?古語(yǔ)有云,世事如棋。生活中每個(gè)人如同棋手,其每一個(gè)行為如同在一張看不見(jiàn)的棋盤上布一個(gè)子,精明慎重的棋手們相互揣摩、相互牽制,人人爭(zhēng)贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們“出棋”招數(shù)中理性化、邏輯化的部分,并將其系統(tǒng)化為一門科學(xué)。換句話說(shuō),就是研究個(gè)體如何在錯(cuò)綜復(fù)雜的相互影響中得出最合理的策略?,F(xiàn)在,我們就一些例子來(lái)討論博弈論相關(guān)內(nèi)容。一、從“囚徒困境”開(kāi)始在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個(gè)著名例子是由塔克給出的“囚徒困境”(prisoners’dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個(gè)警察及小偷的故事。假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌人沒(méi)有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。下表給出了這個(gè)博弈的支付矩陣。B坦白B抵賴A坦白–8,–80,–10A抵賴–10,0–1,–1表囚徒困境博弈[Prisoner'sdilemma]我們來(lái)看看這個(gè)博弈可預(yù)測(cè)的均衡是什么。對(duì)A來(lái)說(shuō),盡管他不知道B作何選擇,但他知道無(wú)論B選擇什么,他選擇“坦白”總是最優(yōu)的。顯然,根據(jù)對(duì)稱性,B也會(huì)選擇“坦白”,結(jié)果是兩人都被判刑8年。但是,倘若他們都選擇“抵賴”,每人只被判刑1年。在表2.2中的四種行動(dòng)選擇組合中,(抵賴、抵賴)是帕累托最優(yōu)的,因?yàn)槠x這個(gè)行動(dòng)選擇組合的任何其他行動(dòng)選擇組合都至少會(huì)使一個(gè)人的境況變差。不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個(gè)占優(yōu)戰(zhàn)略均衡。要了解納什的貢獻(xiàn),首先要知道什么是非合作博弈問(wèn)題?,F(xiàn)在幾乎所有的博弈論教科書上都會(huì)講“囚犯的兩難處境”的例子,每本書上的例子都大同小異。話說(shuō)有一天,一位富翁在家中被殺,財(cái)物被盜。警方在此案的偵破過(guò)程中,抓到兩個(gè)犯罪嫌疑人,斯卡爾菲絲和那庫(kù)爾斯,并從他們的住處搜出被害人家中丟失的財(cái)物。但是,他們矢口否認(rèn)曾殺過(guò)人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點(diǎn)兒東西。于是警方將兩人隔離,分別關(guān)在不同的房間進(jìn)行審訊。由地方檢察官分別和每個(gè)人單獨(dú)談話。檢察官說(shuō),“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。但是,我可以和你做個(gè)交易。如果你單獨(dú)坦白殺人的罪行,我只判你三個(gè)月的監(jiān)禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個(gè)月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑?!彼箍柗平z和那庫(kù)爾斯該怎么辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。但是由于兩人處于隔離的情況下無(wú)法串供。所以,按照亞當(dāng)·斯密的理論,每一個(gè)人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。因?yàn)樘拱捉淮梢云谕玫胶芏痰谋O(jiān)禁———3個(gè)月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對(duì)方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時(shí)坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對(duì)雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會(huì)出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。因?yàn)?,每一方在選擇策略時(shí)都沒(méi)有“共謀”(串供),他們只是選擇對(duì)自己最有利的策略,而不考慮社會(huì)福利或任何其他對(duì)手的利益。也就是說(shuō),這種策略組合由所有局中人(也稱當(dāng)事人、參及者)的最佳策略組合構(gòu)成。沒(méi)有人會(huì)主動(dòng)改變自己的策略以便使自己獲得更大利益?!扒敉降膬呻y選擇”有著廣泛而深刻的意義。個(gè)人理性及集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。他們兩人都是在坦白及抵賴策略上首先想到自己,這樣他們必然要服長(zhǎng)的刑期。只有當(dāng)他們都首先替對(duì)方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果?!凹{什均衡”首先對(duì)亞當(dāng)·斯密的“看不見(jiàn)的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見(jiàn)慣的經(jīng)濟(jì)、社會(huì)、政治、國(guó)防、管理和日常生活中的博弈現(xiàn)象。我們將例舉出許多類似于“囚徒的兩難處境”這樣的例子。如價(jià)格戰(zhàn)博弈、軍奮競(jìng)賽博弈、污染博弈等等。一般的博弈問(wèn)題由三個(gè)要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參及者、策略等等的集合,策略(strategies)集合以及每一對(duì)局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個(gè)特定的策略關(guān)系被選擇,每一局中人所得到的效用。所有的博弈問(wèn)題都會(huì)遇到這三個(gè)要素。二、經(jīng)濟(jì)學(xué)中的“智豬博弈”(Pigs’payoffs)
這個(gè)例子講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個(gè)踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會(huì)落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。當(dāng)小豬踩動(dòng)踏板時(shí),大豬會(huì)在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動(dòng)了踏板,則還有機(jī)會(huì)在小豬吃完落下的食物之前跑到食槽,爭(zhēng)吃到另一半殘羹。那么,兩只豬各會(huì)采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。原因何在?因?yàn)?,小豬踩踏板將一無(wú)所獲,不踩踏板反而能吃上食物。對(duì)小豬而言,無(wú)論大豬是否踩動(dòng)踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會(huì)去踩動(dòng)踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好親力親為了。“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板及投食口之間的距離。如果改變一下核心指標(biāo),豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?試試看。改變方案一:減量方案。投食僅原來(lái)的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會(huì)把食物吃完;大豬去踩,小豬將也會(huì)把食物吃完。誰(shuí)去踩踏板,就意味著為對(duì)方貢獻(xiàn)食物,所以誰(shuí)也不會(huì)有踩踏板的動(dòng)力了。如果目的是想讓豬們?nèi)ザ嗖忍ぐ?,這個(gè)游戲規(guī)則的設(shè)計(jì)顯然是失敗的。改變方案二:增量方案。投食為原來(lái)的一倍分量。結(jié)果是小豬、大豬都會(huì)去踩踏板。誰(shuí)想吃,誰(shuí)就會(huì)去踩踏板。反正對(duì)方不會(huì)一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對(duì)豐富的“共產(chǎn)主義”社會(huì),所以競(jìng)爭(zhēng)意識(shí)卻不會(huì)很強(qiáng)。對(duì)于游戲規(guī)則的設(shè)計(jì)者來(lái)說(shuō),這個(gè)規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因?yàn)楦?jìng)爭(zhēng)不強(qiáng)烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓?。改變方案三:減量加移位方案。投食僅原來(lái)的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ?。等待者不得食,而多勞者多得。每次的收獲剛好消費(fèi)完。對(duì)于游戲設(shè)計(jì)者,這是一個(gè)最好的方案。成本不高,但收獲最大。原版的“智豬博弈”故事給了競(jìng)爭(zhēng)中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對(duì)于社會(huì)而言,因?yàn)樾∝i未能參及競(jìng)爭(zhēng),小豬搭便車時(shí)的社會(huì)資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計(jì)者是不愿看見(jiàn)有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。比如,公司的激勵(lì)制度設(shè)計(jì),獎(jiǎng)勵(lì)力度太大,又是持股,又是期權(quán),公司職員個(gè)個(gè)都成了百萬(wàn)富翁,成本高不說(shuō),員工的積極性并不一定很高。這相當(dāng)于“智豬博弈”增量方案所描述的情形。但是如果獎(jiǎng)勵(lì)力度不大,而且見(jiàn)者有份(不勞動(dòng)的“小豬”也有),一度十分努力的大豬也不會(huì)有動(dòng)力了就象“智豬博弈”減量方案一所描述的情形。最好的激勵(lì)機(jī)制設(shè)計(jì)就象改變方案三減量加移位的辦法,獎(jiǎng)勵(lì)并非人人有份,而是直接針對(duì)個(gè)人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對(duì)公司而言),又消除了“搭便車”現(xiàn)象,能實(shí)現(xiàn)有效的激勵(lì)。許多人并未讀過(guò)“智豬博弈”的故事,但是卻在自覺(jué)地使用小豬的策略。股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場(chǎng)中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。因此,對(duì)于制訂各種經(jīng)濟(jì)管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標(biāo)改變的個(gè)中道理。三、生活中的“占座大戰(zhàn)”大學(xué)生活中,生活也是比較的豐富,其中,吃飯也是很重要的部分,大家一般都是在學(xué)校食堂吃飯,由于大家吃飯的時(shí)間比較集中,所以吃飯的時(shí)候人數(shù)特別多,食堂座位有限,同學(xué)們也希望在食堂買完飯后不用再找座位,因此很多同學(xué)在買飯之前就用自己的私人物品占座位,為此,食堂也經(jīng)常發(fā)生因?yàn)檎甲欢鸬募m紛。在這里稱為“占座大戰(zhàn)”博弈,就這個(gè)博弈問(wèn)題進(jìn)行討論;現(xiàn)在就這個(gè)問(wèn)題來(lái)進(jìn)行一個(gè)博弈論的分析,兩個(gè)發(fā)生糾紛的人都有兩個(gè)選擇,分別是U(沖上去進(jìn)行理論,爭(zhēng)取座位),D(選擇退讓,找其他的座位),若兩人都進(jìn)行理論,爭(zhēng)取座位的話,很有可能就是兩敗俱傷,兩個(gè)人也可能因意見(jiàn)不合而進(jìn)而出現(xiàn)打架的現(xiàn)象,而且在食堂這個(gè)公共場(chǎng)所,對(duì)大家的形象都有著很不好的影響;如果一方選擇退讓,而另外一方則選擇理論,則結(jié)果可能就是一方另找座位,有些損失,一方占領(lǐng)了座位,取得了勝利;還有就是雙方都選擇了退讓,將座位讓給其他人;根據(jù)以上的分析,現(xiàn)在有如下的支付圖:參及人2UDU -2,-2 1,-1參及人1D -1,1 0,0求解過(guò)程(箭頭法):參及人2UDU -2,-2 1,-1參及人1D -1,1 0,0現(xiàn)在求解這個(gè)博弈問(wèn)題:由博弈問(wèn)題的Nash均衡可以知道,在以上的博弈問(wèn)題中存在著兩個(gè)純戰(zhàn)略Nash均衡——(U,D)和(D,U),就是說(shuō),在整個(gè)的博弈中,兩個(gè)人中有一個(gè)人退讓,尋找其他的座位,另外一個(gè)人進(jìn)行爭(zhēng)論得到座位。對(duì)于這個(gè)結(jié)果,我們可以這樣認(rèn)識(shí):我們現(xiàn)在認(rèn)為兩個(gè)人都是理性的,在一個(gè)參及人預(yù)測(cè)到另一方將會(huì)進(jìn)行理論時(shí),明智的選擇就是退讓,避免更大的損失,而當(dāng)預(yù)測(cè)到對(duì)方將會(huì)選擇退讓時(shí),則進(jìn)行理論,以求得最大的勝利;可以將Nash均衡作為此次“搶座大戰(zhàn)”的一致性預(yù)測(cè),而其它的結(jié)果(U,U)和(D,D)都將不會(huì)是一致性預(yù)測(cè),就(U,U)來(lái)說(shuō),對(duì)雙方而言都不是最好的結(jié)果,且受到的損失也會(huì)是最大的;再就是(D,D),雙方都進(jìn)行退讓,也是不太可能的,當(dāng)有一方有退讓的跡象,另外一方就可能進(jìn)行理論來(lái)求得利益的最大,因此這個(gè)結(jié)果也不會(huì)是一致性的預(yù)測(cè),不會(huì)是一個(gè)均衡,必然會(huì)偏離的,向著Nash均衡的方向偏移。在上面的這個(gè)博弈中,出現(xiàn)了兩個(gè)Nash均衡,在一個(gè)博弈問(wèn)題中,如果只存在一個(gè)Nash均衡,那么Nash均衡作為一致性的預(yù)測(cè),應(yīng)該說(shuō)是很有效的。但是,如果像這個(gè)“座位大戰(zhàn)”博弈一樣,存在兩個(gè)Nash均衡,那么Nash均衡作為博弈解的意義也就相對(duì)弱化了。我們不能進(jìn)行預(yù)測(cè),到底是誰(shuí)進(jìn)行了退讓,是誰(shuí)進(jìn)行了進(jìn)一步的理論,得到座位;如果兩個(gè)人對(duì)兩個(gè)均衡到底哪一個(gè)會(huì)出現(xiàn)的預(yù)測(cè)不一致就會(huì)出現(xiàn)問(wèn)題,比如說(shuō),參及人1預(yù)測(cè)博弈的解為自己理論,對(duì)方退讓,而參及人2預(yù)測(cè)的是對(duì)方退讓,自己理論,那么最后出現(xiàn)的真正的結(jié)果將不會(huì)是Nash均衡(U,D),也不會(huì)是(D,U),而會(huì)是損傷最大的非Nash均衡(U,U)。由以上的分析,出現(xiàn)了nash均衡的多重性,我們暫且用Schellling的“焦點(diǎn)效應(yīng)”來(lái)解決,將均衡聚焦到一個(gè)上,我們分以下情況:(1),兩個(gè)參及者之間,有一個(gè)是女生,一個(gè)是男生,則很有可能是博弈的解偏向女生的一邊,男生讓著女生;(2),兩個(gè)參及者之間,有一個(gè)是年輕人,一個(gè)是相
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工業(yè)互聯(lián)網(wǎng)安全與管理人才培養(yǎng)方案
- 地下室施工縫留置施工方案
- 地方特色餐飲推廣目視化方案
- 水質(zhì)在線監(jiān)測(cè)與環(huán)境保護(hù)方案
- 光伏電站建設(shè)項(xiàng)目成本控制方案
- 北師大版二年級(jí)數(shù)學(xué)下冊(cè)認(rèn)識(shí)角說(shuō)課稿
- 新能源汽車綜合故障檢修實(shí)訓(xùn)報(bào)告
- 學(xué)校創(chuàng)建文明校園實(shí)施方案
- 機(jī)動(dòng)車駕駛員考試《科目一》試題與參考答案
- 汽車保險(xiǎn)杠模具結(jié)構(gòu)知識(shí)
- 創(chuàng)傷性硬膜下出血個(gè)案護(hù)理
- 【川教版】《生命 生態(tài) 安全》二年級(jí)上冊(cè)第12課 少點(diǎn)兒馬虎 多點(diǎn)兒收獲 課件
- “1+X”證書制度下五年制高職空中乘務(wù)專業(yè)人才培養(yǎng)模式現(xiàn)狀的調(diào)查問(wèn)卷
- 五年級(jí)上冊(cè)小數(shù)乘除練習(xí)300道及答案
- 高考模擬作文“‘情以物遷’與‘不以物喜不以己悲’”導(dǎo)寫+
- 20222023學(xué)年浙江省寧波市鄞州實(shí)驗(yàn)中學(xué)八年級(jí)(上)期中語(yǔ)文試卷(解析)
- 人教版數(shù)學(xué)二年級(jí)下冊(cè)德育滲透教案《統(tǒng)計(jì)》例2教學(xué)設(shè)計(jì)
- 超越指標(biāo):存量時(shí)代降本增效的利器
- 《中小學(xué)書法教育指導(dǎo)綱要》解讀
- 住院醫(yī)師規(guī)范化培訓(xùn)臨床技能核課件
- 工程造價(jià)鑒定十大要點(diǎn)與案例分析
評(píng)論
0/150
提交評(píng)論