




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第十三章博弈論初步目前博弈論發(fā)展的非常深入,這里只是介紹一些初步知識(shí)。在四、五十年代,由馮諾依曼(VonNeumann)、摩根斯坦恩(Morgenstern)把對(duì)策論、運(yùn)籌學(xué)引入經(jīng)濟(jì)學(xué),形成了最早的博弈論。幾時(shí)年來,博弈論在經(jīng)濟(jì)學(xué)中發(fā)揮著越來越大的重要作用,1994年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)就授予三位博弈論學(xué)家:納什(Nash)、澤爾騰(Selten)和海薩尼(Harsanyi)。博弈論的英文是GAMETHEORY,字面的意思是游戲策略,及用類似游戲中解決問題的方法,揭示解決社會(huì)、經(jīng)濟(jì)及其他領(lǐng)域問題的策略、對(duì)策,因此有的還把博弈論譯成對(duì)策論。準(zhǔn)確的說博弈論是在給定的條件下尋求最優(yōu)策略,這里給定的條件包
2、含其他人的策略以及本人的決策對(duì)其他決策主體的影響。策略性活動(dòng)在社會(huì)、經(jīng)濟(jì)、政治生活中大量存在,也可以說,整個(gè)社會(huì)、經(jīng)濟(jì)、政治生活都是博弈行為。因此,博弈論作為一種方法,廣泛的應(yīng)用在經(jīng)濟(jì)、政治、軍事、外交中,只是博弈論在經(jīng)濟(jì)學(xué)中應(yīng)用的最廣泛、最成功。如前面介紹過的古諾均衡、STACKELBERG均衡、CHAMBERLIN均衡、BERTRAND均衡、HOTELLING均衡,都屬于經(jīng)濟(jì)學(xué)中的博弈過程。第一節(jié)基本概念一、博弈論1定義:博弈論是描述、分析多人決策行為的一種決策理論,是多個(gè)經(jīng)濟(jì)主體在相互影響下的多元決策,決策的均衡結(jié)果取決于雙方或多方的決策。如下棋,最后的結(jié)果就是由下棋雙方你來我往輪流做出
3、決策,決策又相互影響、相互作用而得出的結(jié)果。2博弈論與優(yōu)化理論的異同點(diǎn)1)相同點(diǎn):博弈論與優(yōu)化理論都是在給定的條件下,尋求最優(yōu)決策的過程;2)不同點(diǎn):優(yōu)化理論可以看成是單人決策,而博弈理論可以看成是多人決策。在優(yōu)先理論的決策過程中,影響結(jié)果的所有變量都控制在決策者自己手里;而在博弈論的決策過程中,影響結(jié)果的變量是由多個(gè)決策者操縱的。如企業(yè)在追求成本最小化、產(chǎn)量最大化、利潤最大化的過程中總是假定外部條件給定,這實(shí)際上表明是一個(gè)優(yōu)化問題,因?yàn)槌私o定的外部條件外,剩下的因素都有決策者來控制,從而決策者自己就能控制決策的結(jié)果;如果外部條件不是給定的,而是有其他主體參與的過程,這時(shí)的決策過程就變成了一
4、個(gè)博弈過程了,因?yàn)闆Q策的最終結(jié)果不但取決于決策者本身,而且也取決于其他決策者的決策。優(yōu)化過程是一個(gè)確定的過程,而博弈過程是確定性和不確定性的統(tǒng)一。優(yōu)化過程是一個(gè)確定的過程,因?yàn)樽龀鰶Q策后,確定的結(jié)果就出來了。說博弈過程有確定性,是因?yàn)闆Q策各方的決策做出后,每一方的收益就確定了;說博弈過程有不確定性,在于一方做出決策后,影響結(jié)果的變量還有眾多的其他決策者,在不知道其他主體行為的情況下,結(jié)果就不確定。例如:在一次具體的戰(zhàn)斗中,一方是否發(fā)起進(jìn)攻,是一個(gè)決策。如果發(fā)起進(jìn)攻,對(duì)方肯定有所反應(yīng),客觀上講,必然會(huì)有一個(gè)確定的結(jié)果存在,這是確定性的表現(xiàn)。但是最后的結(jié)果如何,取決于對(duì)方如何應(yīng)對(duì),所以在發(fā)起進(jìn)攻時(shí)
5、,并不能知道結(jié)局是怎樣的,這就是不確定性的表現(xiàn)。如果一方發(fā)起進(jìn)攻后,另一方馬上投降,則戰(zhàn)斗結(jié)束;如果對(duì)方進(jìn)行反攻,從理論上來講,結(jié)果取決于雙方實(shí)力以及雙方收益的大小。由此可以看出博弈的廣泛存在,在現(xiàn)實(shí)生活中做出任何決策時(shí),實(shí)際上都受到其他主體決策的影響并對(duì)我們做決策產(chǎn)生一定影響,決策的結(jié)果除了由我們自己決定外還要受到其他決策主體的影響,這實(shí)際上就是一個(gè)博弈過程。二、參與者(PLAYER)參與博弈的利益主體叫做參與者。英文原意為玩主,也有譯成局中人的。在二人博弈中,有兩個(gè)參與者;在三人博弈中,有三個(gè)參與者;在多人博弈中,有多個(gè)參與者。三、策略和策略空間:.策略:在給定條件博弈中,參與者完整的一套
6、行動(dòng)計(jì)劃叫做策略。例如我國古代著名的謀略故事“田忌賽馬”中,國王的賽馬計(jì)劃是:先出上等馬,再出中等馬,最后出下等馬;田忌的賽馬計(jì)劃是:先出下等馬,再出上等馬,最后出中等馬。這里的賽馬計(jì)劃就是一套完整的行動(dòng)計(jì)劃,也就是一個(gè)策略。.策略空間:參與者可以選擇的策略的全體就組成了策略空間。例如在“田忌賽馬”中,共有六種行動(dòng)方案可供選擇:上中下(先出上等馬,再出中等馬,最后出下等馬)、上下中、中上下、中下上、下上中、下中上。決策時(shí)田忌可以選擇其中任何一個(gè)策略,在故事中,因?yàn)閲豕潭ㄟx擇了上中下,所以田忌選擇了下上中,從而贏得了比賽。任何一人策略的改變都將使結(jié)果也隨之改變,比如國王選擇了中下上,而田忌選擇
7、了下上中,則國王將贏得比賽。四、報(bào)酬函數(shù)與報(bào)酬矩陣:.報(bào)酬函數(shù):每一個(gè)參與博弈的參與者,他的收益依附于各個(gè)參與者所出的策略,這種收益與策略的依附關(guān)系就構(gòu)成了報(bào)酬函數(shù)。也就是說,第i個(gè)參與者的收益取決于所有參與者的策略,而不僅僅是自己的策略,表示成數(shù)學(xué)式子就是:Ri=Ri(S1,S2,。Sn)o其中Ri表示第i個(gè)參與者的收益,Si(i=1ooon)表示第i個(gè)參與者所出的策略。.報(bào)酬矩陣:參與博弈的多個(gè)參與者的報(bào)酬可以用一個(gè)矩陣或框圖表示,這樣的矩陣或框圖就叫做報(bào)酬矩陣。例如有甲乙兩個(gè)供貨商組成一個(gè)價(jià)格卡特爾,雙方都有選擇遵守約定價(jià)格或者違反約定價(jià)格的權(quán)利。報(bào)酬矩陣如下圖所示:乙守約違約甲守約8,
8、86,10違約10,67,7圖13-1矩陣中每組數(shù)字中的前一個(gè)數(shù)字表示甲的收益,后一個(gè)數(shù)字表示乙的收益。當(dāng)甲守約時(shí),乙如果守約,收益為8,乙如果違約,收益為10;當(dāng)甲違約時(shí),乙如果守約,收益為6,乙如果違約,收益為7。所以,當(dāng)甲守約時(shí),乙會(huì)選擇違約(108);當(dāng)甲違約時(shí),乙也會(huì)選擇違約(76)反之不管乙如何選擇,甲都會(huì)選擇違約,最終的結(jié)果是雙方都選擇違約。報(bào)酬矩陣改變,就會(huì)影響到雙方的決策。例如雙方的報(bào)酬矩陣變成下圖所示:乙守約違約甲守約12,122,10違約10,2-4,-4圖13-2此時(shí)雙方可能都選擇守約,因?yàn)楫?dāng)甲守約時(shí),乙會(huì)選擇守約(1210);當(dāng)甲違約時(shí),乙也會(huì)選擇守名勺(2-4)。反
9、之不管乙如何選擇,甲都會(huì)選擇守約,最終的結(jié)果是雙方都選擇守約。博弈過程參與者的決策行為要受到博弈規(guī)則的影響,即博弈規(guī)則的變化會(huì)改變報(bào)酬矩陣中的報(bào)酬值。比如在圖13-1中,由于卡特爾中的每一個(gè)供貨商都追求自身利益的最大化,并且沒有措施來保證遵守價(jià)格約定,雙方表面上可能都信誓旦旦的承諾守約,但是實(shí)際中雙方會(huì)違約。如果卡特爾追求整體利益的最大化,并且由于歷史、政治、制度、懲罰等措施來保證遵守價(jià)格約定,雙方就可能和平共處,遵守價(jià)格約定。在歷次中東戰(zhàn)爭中,由于民族宗教原因,OPEC石油的產(chǎn)量和價(jià)格都得到了嚴(yán)格的執(zhí)行。五、均衡及博弈的解:當(dāng)博弈的所有參與者都不想改換策略時(shí)所達(dá)到的穩(wěn)定狀態(tài)叫做均衡,均衡的結(jié)
10、果叫做博弈的解。比如圖13-1中甲乙兩個(gè)供貨商組成的卡特爾。不管甲如何選擇,乙必然選擇違約,同樣不論乙如何選擇,甲必然選擇違約。最終雙方都選擇了違約,并且只要給定的條件不變,雙方就都不會(huì)改變策略,結(jié)果非常穩(wěn)定,達(dá)成均衡。在這個(gè)均衡中,不管甲如何選擇,乙都不會(huì)改變策略,同樣無論乙如何選擇,甲也不會(huì)改變策略,這種均衡就叫做占優(yōu)均衡。這種無論對(duì)方如何決策,自己總是會(huì)選擇的策略叫做占優(yōu)策略,由雙方的占優(yōu)策略所達(dá)成的均衡叫做占優(yōu)均衡。比如,在學(xué)校中,學(xué)生平時(shí)學(xué)習(xí)可能是非常努力也可能是非常懶散;老師可能把考試題出的很難,也可能出的很容易。從博弈論的角度,這里的老師和學(xué)生就構(gòu)成了一個(gè)博弈,雙方的報(bào)酬矩陣如下
11、:老師出考題難易學(xué)生努力90,85100,90學(xué)習(xí)懶散50,6090,70圖13-3由于老師出難題比出容易題要花費(fèi)更多的時(shí)間和精力,所以收益較低,從而無論學(xué)生平時(shí)努力程度如何,老師一定選擇出容易的題;由于學(xué)生只要努力學(xué)習(xí)就會(huì)取得更好的成績,所以無論老師所出考題難度如何,學(xué)生一定會(huì)選擇努力學(xué)習(xí),這同樣構(gòu)成一個(gè)占優(yōu)均衡。經(jīng)常遇到的還有一種均衡,是有條件的均衡叫做納什均衡。簡單的說就是敵變我變、敵不變我亦不變。在后面第二節(jié)中將詳細(xì)介紹納什均衡。作業(yè):改造圖13-3中師生博弈的報(bào)酬函數(shù),構(gòu)造出納什均衡。六、囚犯兩難困境:prisonersdilemma囚犯兩難困境是博弈論中一個(gè)著名的例子,講的是甲乙兩
12、名嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子里受審,雙方不能互通消息,每名嫌疑犯都面臨坦白和不坦白兩種選擇。警察告訴他們:在兩人都坦白的情況下,各判刑10年;在兩人都不坦白的情況下,各判刑3年;在一人坦白另一人不坦白的情況下,坦白的一方會(huì)被從輕處罰,只被判刑1年,不坦白的一方則被重判15年。可以根據(jù)坦白后是否會(huì)受到制裁兩種情況來討論最終的均衡結(jié)果。.坦白后不會(huì)受到制裁時(shí)的情況:此時(shí),雙方收益矩陣如下:乙不坦白坦白甲不坦白-3,-3-15,-1坦白-1,-15-10,-10圖13-4如圖,在乙不坦白的情況下,如果甲坦白,甲會(huì)被從輕處罰,只被判刑1年,乙被重判15年;如果甲也不坦白,由于證據(jù)不足
13、,甲乙都只會(huì)被判刑3年。在乙坦白的情況下,如果甲也坦白,甲乙會(huì)被判刑10年;如果甲不坦白,乙會(huì)被從輕處罰,只被判刑1年,甲則被重判15年??梢?,在乙不坦白的情況下,甲最好是坦白,從而可以被從車5處罰;在乙坦白的情況下,因?yàn)楸慌行?0年總比15年要好,甲最好也是坦白,所以甲會(huì)選擇坦白。同理,無論甲如何選擇,乙的最好選擇也是坦白。結(jié)果雙方都選擇坦白,都被判刑10年??梢?,我國公安機(jī)關(guān)“坦白從寬,抗拒從嚴(yán)”的心理攻勢(shì)在大多數(shù)情況下都是可以奏效的。囚犯兩難困境說明個(gè)人的理性可能導(dǎo)致集體結(jié)果的不妙。在現(xiàn)實(shí)社會(huì)中,人人都追求完美反而可能會(huì)導(dǎo)致社會(huì)變得很糟糕。.坦白后會(huì)受到制裁時(shí)的情況:博弈論的一個(gè)重要思想
14、就是規(guī)則改變報(bào)酬矩陣,改變了報(bào)酬矩陣就會(huì)影響到行為方式。如果犯罪組織有著嚴(yán)格的懲罰制度,任何一個(gè)罪犯坦白后,不論坦白的事情嚴(yán)重與否,犯罪組織一定會(huì)殺人滅口,并且總是能迅速做到。這個(gè)規(guī)則將改變報(bào)酬矩陣,新的報(bào)酬矩陣如下圖所示:乙不坦白坦白甲不坦白-3,-3-15,-8坦白-15-OC-OC圖13-5由于坦白后將被滅口,所以收益將是-8。在乙不坦白的情況下,甲最好是不坦白;在乙坦白的情況下,因?yàn)楸慌行?5年總比死去要好,甲最好也是不坦白,所以甲會(huì)選擇不坦白。同理,無論甲如何選擇,乙的最好選擇也是不坦白。結(jié)果雙方都選擇不坦白,各自被判刑3年。第二節(jié)納什均衡一、舉例假定A、B兩個(gè)企業(yè)都生產(chǎn)白酒,白酒分
15、為高度和低度兩種。報(bào)酬矩陣如圖所示:A企業(yè)高度低度B企業(yè)高度700,600900,1000低度800,900600,800圖13-5A企業(yè)如果選擇了生產(chǎn)高度白酒,那么B企業(yè)會(huì)選擇生產(chǎn)什么呢?因?yàn)?00700,所以B企業(yè)會(huì)選擇生產(chǎn)低度白酒。A企業(yè)如果選擇了生產(chǎn)低度白酒,因?yàn)?00600,那么B企業(yè)會(huì)選擇生產(chǎn)高度白酒。如果B企業(yè)選擇了生產(chǎn)高度白酒,A企業(yè)就會(huì)選擇生產(chǎn)低度白酒。如果B企業(yè)選擇了生產(chǎn)低度白酒,A企業(yè)就會(huì)選擇生產(chǎn)高度白酒。這里,A企業(yè)的決策取決于B企業(yè)的決策,同樣B企業(yè)的決策取決于A企業(yè)的決策。但是A企業(yè)選擇了生產(chǎn)高度白酒以后,只要不變化,B企業(yè)就會(huì)選擇生產(chǎn)低度白酒不變化。反過來也一樣,
16、B企業(yè)如果選擇了生產(chǎn)高度白酒不變化,A企業(yè)就會(huì)選擇生產(chǎn)低度白酒不變化,這實(shí)際上是一個(gè)納什均衡,納什均衡就是在給定別人最優(yōu)的情況下,自己最優(yōu)選擇達(dá)成的均衡。通俗的講,就是給定你的最優(yōu)選擇,我會(huì)選擇能夠使我最優(yōu)的選擇,或者說,我選擇在給定你的選擇的情況下我的最優(yōu)選擇,你選擇了給定我選擇情況下你的最優(yōu)選擇。這種均衡最后到底均衡在哪一點(diǎn),由具體情況決定。在存在帕累托改善的情況下,可能會(huì)達(dá)到帕累托最優(yōu)。在本例中,B企業(yè)選擇了生產(chǎn)高度白酒,A企業(yè)選擇生產(chǎn)低度白酒是一種均衡;B企業(yè)選擇了生產(chǎn)低度白酒,A企業(yè)選擇生產(chǎn)高度白酒也是一種均衡。由于在B企業(yè)選擇生產(chǎn)高度白酒,A企業(yè)選擇生產(chǎn)低度白酒的時(shí)候,A、B兩企業(yè)
17、的收益都比B企業(yè)選擇生產(chǎn)低度白酒,A企業(yè)選擇生產(chǎn)高度白酒時(shí)的收益要高,存在著帕累托改善,因此最后可能會(huì)達(dá)到帕累托最優(yōu),即B企業(yè)選擇生產(chǎn)高度白酒,A企業(yè)選擇生產(chǎn)低度白酒。.數(shù)學(xué)定義:n個(gè)參與者,n2,Si為參與者i的策略定理。Xi是報(bào)酬函數(shù)。如果存在一組策略(S1*,S2*。Sn*)Si*Si使得對(duì)于每一個(gè)PLAYER都有Xi(S1*,S2*。Sn*)Xi(S1*,S2*。Si-1*,Si*,Si+1*,。Sn*。)i=1,2,。n那么(S1*,S2*。Sn*)便是納什均衡。Si是第i個(gè)參與者的策略空間,如果參與者1選擇的策略為S1*,S2選擇的策略為S2*o第n個(gè)參與者的策略為Sn*。S1*,
18、S2*,Sn*為各個(gè)參與者各自策略空間中的一個(gè)策略。Xi(S1*,S2*。Sn*)Xi(S1*,S2*oooSi-1*,Si*,Si+1*,。Sn*o)說明第i個(gè)參與者選擇Si*時(shí)比選擇Si時(shí)的收益都要好或至少不差。換句話講,就是在別人都沒有變化策略的情況下,i如果變化策略,i就要吃虧。這樣Si*就是i的最優(yōu)策略。(S1*,S2*oooSn*)便是納什均衡,即給定別人策略,自己選擇最優(yōu)策略。決策做出后,每一個(gè)參與者都不會(huì)變化,至少是別人不變化,自己就不變化。.納什均衡與占優(yōu)均衡的比較:a占優(yōu)均衡一定是納什均衡,納什均衡不一定是占優(yōu)均衡。b納什均衡是有條件下的占優(yōu)均衡,條件是它的參與者不改變策略
19、。如果其他的參與者改變策略,我就要改變策略。c占優(yōu)均衡比納什均衡更穩(wěn)定。作業(yè)題:在寡頭壟斷市場(chǎng)中,古諾均衡、STACKERBUG、HOTELLING各是什么均衡?是納什均衡還是占優(yōu)均衡?(提示:古諾均衡是納什均衡。).均衡的確定在二人博弈中,可以采用畫圈法來確定均衡。在給定一方的策略后,把自己的最優(yōu)策略畫上一個(gè)圓圈,如果在某一個(gè)框中,兩個(gè)收益值都被畫上圓圈的話,此框所表示的決策就是一個(gè)均衡。上例中,采用畫圈法,會(huì)發(fā)現(xiàn)存在著兩個(gè)均衡。A企業(yè)高度低度B企業(yè)高度700,600(900,C7i000)低度Q8002)C900600,800圖13-5.無帕累托改進(jìn)的例子并不是所有的均衡都會(huì)有帕累托改進(jìn)的
20、機(jī)會(huì)。如下圖所示,有甲乙兩輛汽車同時(shí)經(jīng)過一個(gè)路口,如果兩車都不采取措施的話,將會(huì)發(fā)生碰撞,這時(shí)每輛車面臨著繼續(xù)開和等待兩個(gè)選擇。如果兩個(gè)都選擇繼續(xù)開的話,就會(huì)相撞,收益都為-10。如果甲選擇繼續(xù)開而乙選擇等待,甲收益為1,乙收益為0。反過來,如果乙選擇繼續(xù)開而甲選擇等待,乙收益為1,甲收益為0。如果兩車都選擇等待,甲乙收益都為-1。這時(shí)的均衡有兩個(gè),如果甲選擇繼續(xù)開,乙就會(huì)選擇等待;如果乙選擇繼續(xù)開,甲就會(huì)選擇等待。乙車開等吐,U開例如:01,0:如下瞥所示:0,1-1,-1圖 13-5雙方的收益矩陣如下圖所示:最終均衡在哪一種情況,取決于交通規(guī)則。二、無納什均衡的例子:實(shí)際上,納什均衡也是一
21、種特殊情況,并不是所有的博弈都會(huì)產(chǎn)中,罰點(diǎn)球的時(shí)候,守門員和罰球者也構(gòu)成一個(gè)博弈,雙方的收守門員左中右占八、左-1,111,-1r1,-1球中1,-11-1,1口,-1者右1,-11,-11,1圖13-5假設(shè)罰球者罰球時(shí)可以選擇三個(gè)方向:左中右;守門員也可選擇三個(gè)方向撲球,左中右。當(dāng)罰球者選擇了左的情況下,如果守門員也選擇了左,罰球者將得-1,守門員將得+1;如果守門員選擇了右或者中,罰球者將得+1,守門員將得-1。當(dāng)罰球者選擇了中的情況下,如果守門員也選擇了中,罰球者將得-1,守門員將得+1;如果守門員選擇了右或者左,罰球者將得+1,守門員將得-1當(dāng)罰球者選擇了右的情況下,如果守門員也選擇了
22、右,罰球者將得-1,守門員將得+1;如果守門員選擇了左或者中,罰球者將得+1,守門員將得-1。當(dāng)判斷罰球者將向左罰球的時(shí)候,守門員一定選擇左;當(dāng)判斷罰球者將向中罰球的時(shí)候,守門員一定選擇中;當(dāng)判斷罰球者將向右罰球的時(shí)候,守門員一定選擇右。同樣當(dāng)罰球者判斷守門員將向右撲球時(shí),罰球者將向左或中發(fā)球;當(dāng)罰球者判斷守門員將向右撲球時(shí),罰球者將向右或中發(fā)球;當(dāng)罰球者判斷守門員將向中撲球時(shí),罰球者將向左或右發(fā)球。此時(shí)沒有均衡存在,雙方都只能靠運(yùn)氣。作業(yè):根據(jù)游擊戰(zhàn)的16字方針:“敵進(jìn)我退,敵駐我擾,敵疲我打,敵退我追”,寫出報(bào)酬矩陣,并判斷是否存在均衡。第三節(jié)動(dòng)態(tài)博弈與承諾靜態(tài)博弈與動(dòng)態(tài)博弈靜態(tài)博弈:博弈
23、的參與者同時(shí)作出決策(或者雖然決策有先后,但是沒有人在決策之前看到了其他參與者的決策行為),一旦決策做出之后,就只能等待結(jié)果,對(duì)博弈的發(fā)展再也不能產(chǎn)生任何影響,這種博弈叫做靜態(tài)博弈。日常生活中靜態(tài)博弈的例子很多,我們經(jīng)常所說的無計(jì)可施、無可奈何,就是我所能做的已經(jīng)做完了,不能對(duì)博弈再產(chǎn)生任何影響了,剩下的事情由其他的參與者來做,最后看情況。比如說,學(xué)生參見高考,老師命題和學(xué)生考試雖然有先有后,但互相之間并不能溝通信息和相互影響??忌梅值亩嗌俸蛯?duì)出題水平的評(píng)價(jià),只能等待高考結(jié)束之后才能知道。老師和學(xué)生的決策行為做出之后就再也不能影響博弈,而只能等待最后的結(jié)果。.動(dòng)態(tài)博弈:博弈的參與者相繼行動(dòng),
24、由于后行動(dòng)者能夠看到先行動(dòng)者的決策行為,所以后面的決策要受到以前決策行為的影響,每一個(gè)參與者都要根據(jù)在在決策時(shí)所掌握的全部信息來作出自己的最優(yōu)策略,即每個(gè)人的策略是決策者在決策時(shí)所掌握全部信息的函數(shù)。換句話講,參與者在某一個(gè)階段做出的決策,要受到前邊一系列決策信息的影響,是前邊一系列決策信息的函數(shù)。典型的例子就是下棋,我走一個(gè)當(dāng)頭炮,你走一個(gè)屏風(fēng)馬,我走一步,你走一步,你走一步,我走一步。雙方相繼行動(dòng)。每個(gè)人在每一時(shí)刻的決策都是前邊一系列決策所掌握信息的函數(shù)。到了中間某一階段,比如說一方“將軍”了,這要受到前面一系列雙方?jīng)Q策實(shí)施產(chǎn)生的影響,不是說想什么時(shí)候“將軍”就能什么時(shí)候“將軍”。.動(dòng)態(tài)博
25、弈在一定范圍內(nèi)又是一個(gè)連續(xù)的過程。靜態(tài)博弈經(jīng)常是一次性的行為,決策一旦作出就不能再更改結(jié)果。動(dòng)態(tài)博弈有一個(gè)重復(fù)的性質(zhì),前邊的所有信息影響到后邊的決策,博弈的結(jié)果要經(jīng)過多次博弈之后才能看到,所以是一個(gè)連續(xù)的過程,這就決定了同一參與者在動(dòng)態(tài)博弈時(shí)和靜態(tài)博弈時(shí)表現(xiàn)出不同的行為。如果把為人處世看作一個(gè)博弈過程,我們就會(huì)發(fā)現(xiàn)靜態(tài)博弈和動(dòng)態(tài)博弈的區(qū)別。比如說一個(gè)壞人,他遇到了一個(gè)他從來都沒遇到過的人而且以后再也不會(huì)和他見面的陌生人,他就可能會(huì)變得肆無忌憚,本來的面目暴露無遺,因?yàn)檫@種情況是靜態(tài)博弈,是一錘子買賣。同樣一個(gè)壞人又會(huì)在經(jīng)常打交道的人面前偽裝成好人,因?yàn)檫@種情況是動(dòng)態(tài)博弈,前邊的所有信息會(huì)影響到
26、后邊的決策。為了自己的長遠(yuǎn)利益,他現(xiàn)在必須極力制造一些虛假的信息,讓后邊的決策對(duì)自己更加有利,所以見面時(shí)會(huì)很客氣,表現(xiàn)得很好,以便讓別人后邊的行動(dòng)不要對(duì)自己不客氣。動(dòng)態(tài)博弈的描述:1博弈樹:對(duì)動(dòng)態(tài)博弈的描述,一般是用博弈樹來進(jìn)行。如下圖所示,有兩個(gè)參與者進(jìn)行博弈,圖13-6第一個(gè)參與者用三角形來表示,有兩種選擇,第二個(gè)參與者用圓圈來表示,第一個(gè)參與者選擇的時(shí)候,第二個(gè)參與者也有兩個(gè)選擇。第一個(gè)參與者選擇2的時(shí)候,第二個(gè)參與者有兩個(gè)選擇。.子博弈:由博弈中某一個(gè)階段開始的,以后的博弈叫做一個(gè)子博弈。實(shí)際上,從一個(gè)博弈任何一個(gè)節(jié)點(diǎn)開始一直到博弈結(jié)束都可以看作一個(gè)子博弈。.動(dòng)態(tài)博弈的解:動(dòng)態(tài)博弈的解
27、通??梢杂煞赐品▉斫獬觯窗巡┺臉浼由鲜找嬷?,計(jì)算每一個(gè)子博弈的收益,根據(jù)收益情況進(jìn)行反推,在利益最大化的條件下最后求出均衡狀態(tài)的解。動(dòng)態(tài)博弈比起靜態(tài)博弈來,更加符合現(xiàn)實(shí)經(jīng)濟(jì)生活中的實(shí)際情況,但是隨著參與者的增加,復(fù)雜程度會(huì)以幾何倍數(shù)增長在一個(gè)由兩個(gè)寡頭組成的寡頭壟斷市場(chǎng)上,這兩個(gè)寡頭的競爭行為,往往可以用動(dòng)態(tài)博弈的方法來描述。通常情況下,有一方會(huì)首先投石問路,看對(duì)方是否有合作的意愿,并根據(jù)對(duì)方的反應(yīng)來做出自己下一步的決策,對(duì)方也會(huì)根據(jù)另一方的反應(yīng)做出反應(yīng),從而決策一直進(jìn)行下去。在現(xiàn)實(shí)生活中,經(jīng)常會(huì)聽說父母干預(yù)兒女的婚姻的事情,這實(shí)際上是兒女與父母之間在進(jìn)行博弈。如下圖所示:女兒可以選擇嫁給
28、張三或者不嫁給張三,父母則威脅女兒要是嫁給張三就不給嫁妝,并斷絕父女關(guān)系,另外一種可能當(dāng)然是不斷絕父女關(guān)系。女兒則說如果斷絕父女關(guān)系就要跳樓,另一種選擇是不跳樓。父母則說如果你跳樓了,我們也不會(huì)感到痛苦。雙方都是希望對(duì)方沿著有利于自己的博弈路徑進(jìn)行決策,父母是想通過威脅斷絕父女關(guān)系來迫使女兒不嫁給張三,女兒則是想通過跳樓來迫使父母在自己嫁給張三后不斷絕父女關(guān)系。在這些所說的話沒有實(shí)現(xiàn)之前,都屬于空頭威脅。空頭威脅有可能改變對(duì)手的決策,也可能對(duì)對(duì)手的決策毫無影響??偟膩碚f,動(dòng)態(tài)博弈比靜態(tài)博弈來得更加復(fù)雜,決策起來所要考慮的信息更要多一些,所以駕御信息的復(fù)雜程度也更大一些。三、承諾:COMMITMENT.定義:承諾是一種無法反悔的行為,會(huì)束縛承諾者自己的手腳,結(jié)果無法給自己留有選擇的余地。兩個(gè)企業(yè),一個(gè)生產(chǎn)白酒,一個(gè)生產(chǎn)啤酒。生產(chǎn)白酒的企業(yè)想要生產(chǎn)啤酒,但是不知道生產(chǎn)啤酒的企業(yè)會(huì)做出什么反應(yīng)。如果遇到強(qiáng)有力的反應(yīng),比如啤酒企業(yè)擴(kuò)大產(chǎn)量到每年50萬噸,雙方都將虧損。如果啤酒企業(yè)沒有什么反應(yīng),保持原有規(guī)模不變,白酒企業(yè)將擴(kuò)大市場(chǎng)產(chǎn)生贏利,啤酒企業(yè)市場(chǎng)份額減小,利潤也減小,甚至有可能虧損。用三角代表白酒企業(yè),用圓圈代表啤酒企業(yè)。白酒企業(yè)有兩種選擇,上啤酒生產(chǎn)線或者不上。啤酒企業(yè)也有兩種選擇,擴(kuò)大產(chǎn)量或者保持原有規(guī)模不變。圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 營口市辦公經(jīng)費(fèi)管理辦法
- 藍(lán)城區(qū)投資項(xiàng)目管理辦法
- 西安抗疫網(wǎng)格化管理辦法
- 補(bǔ)辦結(jié)婚證檔案管理辦法
- 西華大學(xué)專升本管理辦法
- 西秀區(qū)經(jīng)營場(chǎng)所管理辦法
- 設(shè)備維修防污染管理辦法
- 試述ABC庫存管理辦法
- 財(cái)務(wù)經(jīng)理人管理辦法心得
- 貴州農(nóng)村敬老院管理辦法
- 部編版九年級(jí)語文上冊(cè)教案
- XX灌縫施工方案
- 2023-2024學(xué)年黑龍江省寧安市初中語文七年級(jí)下冊(cè)期末高分通關(guān)試卷
- GB/T 6075.3-2011機(jī)械振動(dòng)在非旋轉(zhuǎn)部件上測(cè)量評(píng)價(jià)機(jī)器的振動(dòng)第3部分:額定功率大于15 kW額定轉(zhuǎn)速在120 r/min至15 000 r/min之間的在現(xiàn)場(chǎng)測(cè)量的工業(yè)機(jī)器
- GB/T 5594.4-2015電子元器件結(jié)構(gòu)陶瓷材料性能測(cè)試方法第4部分:介電常數(shù)和介質(zhì)損耗角正切值測(cè)試方法
- 預(yù)防保健科護(hù)理質(zhì)量控制考核標(biāo)準(zhǔn)
- 起重作業(yè)吊裝令
- 林州重機(jī)710采煤機(jī)電控箱裝配流程
- 醫(yī)院檢驗(yàn)科實(shí)驗(yàn)室生物安全管理委員會(huì)及工作職責(zé)
- 個(gè)人求職簡歷兩頁 (46)應(yīng)聘履歷參考模板可編輯修改
- 統(tǒng)編版小學(xué)語二升三銜接閱讀專項(xiàng)訓(xùn)練—課外閱讀(二)【含答案】
評(píng)論
0/150
提交評(píng)論