第八章博弈論_第1頁
第八章博弈論_第2頁
第八章博弈論_第3頁
第八章博弈論_第4頁
第八章博弈論_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

管理經(jīng)濟(jì)學(xué)阮建青浙江大學(xué)管理學(xué)院農(nóng)業(yè)經(jīng)濟(jì)管理系OfficeRoom:啟真大樓1307Email:ruanjq@126.com第八章博弈論

提綱:(一)博弈論基本介紹(二)納什均衡概念(三)完全信息靜態(tài)博弈求解(四)完全信息動(dòng)態(tài)博弈求解(五)合作的誘惑例子剪刀、石頭、布下棋囚徒困境(Prisoner’sdilemma)有甲、乙兩名罪犯,政策是坦白從寬、抗拒從嚴(yán)。一人坦白另一抗拒,則坦白者關(guān)1年,抗拒者關(guān)9年;兩人全部抗拒各關(guān)1年;兩人全部坦白各關(guān)5年。結(jié)果如果?坦白(L)抗拒(R)坦白(T)-5-50-9

抗拒(B)-90-1-1罪犯甲罪犯乙(一)博弈論基本介紹1.定義:

博弈論(gametheory),又譯對(duì)策論。研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題。在產(chǎn)業(yè)經(jīng)濟(jì)學(xué)中,許多產(chǎn)業(yè)市場(chǎng)是寡頭斷市場(chǎng)。在分析寡頭壟斷市場(chǎng)中企業(yè)決策行為時(shí),必須把各種決策者之間的策略及其相互作用納入到經(jīng)濟(jì)模型中,這就是博弈分析。2.博弈的組成要素

參與人:決策主體;

行為:參與人的決策變量;策略:參與人選擇其行為的規(guī)制;信息:有關(guān)其他參與人(對(duì)手)的特征和行動(dòng)的知識(shí);收益:參與人從博弈中獲得的利益水平;均衡:所有參與人的最優(yōu)策略或行動(dòng)的組合。例:可口可樂與百事可樂的博弈(1)如果雙方都不漲價(jià),各得利潤10單位;(2)如果可口可樂不漲價(jià),百事可樂漲價(jià),可口可樂利潤100,百事可樂利潤-30;(3)如果可口可樂漲價(jià),百事可樂不漲價(jià),可口可樂利潤-20,百事可樂利潤30;(4)如果雙方都漲價(jià),可口可樂利潤140,百事可樂利潤35;

參與者2百事可樂

參與者1

可口可樂

不漲價(jià)漲價(jià)

不漲價(jià)漲價(jià)10,10100,-30-20,30140,35返回可口可樂與百事可樂的博弈矩陣(1)根據(jù)參與人的多少,分為兩人博弈或多人博弈;(2)根據(jù)參與人是否合作,分為合作博弈或非合作博弈:(3)根據(jù)博弈結(jié)果的不同,又可分為零和博弈、常和博弈與變和博弈。零和博弈。一方的贏必然伴隨著另一方的輸,總和為零。常和博弈。在這種博弈中,各種結(jié)果下的各博弈方得益之和總是等于一個(gè)非零常數(shù)。變和博弈。不同策略組合下各博弈方的得益之和是不同的。

3.分類

(3)從行動(dòng)的先后次序,分為靜態(tài)博弈和動(dòng)態(tài)博弈。靜態(tài)博弈,參與人同時(shí)選擇行動(dòng);動(dòng)態(tài)博弈,參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)的博弈。(4)從信息獲得情況,分為完全信息博弈和不完全信息博弈。完全信息指每一個(gè)參與人對(duì)所有其他參與人的特征,如策略集合及得益函數(shù)都有準(zhǔn)確完備的知識(shí)。根據(jù)(3)、(4)劃分組合得到四類博弈類型:完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動(dòng)態(tài)博弈完全信息靜態(tài)博弈:剪刀、石頭、布完全信息動(dòng)態(tài)博弈:下棋不完全信息靜態(tài)博弈:暗標(biāo)拍賣(密封標(biāo)書、統(tǒng)一時(shí)間公證開標(biāo),各博弈方無法知道其他人的策略)不完全信息動(dòng)態(tài)博弈:黔驢技窮,路遙知馬力,日久見人心(二)納什均衡概念納什均衡(Nashequilibrium):博弈的任何一方不能夠單獨(dú)改變戰(zhàn)略來提高收益的一組戰(zhàn)略被稱為納什均衡(Nashequilibrium)1.占優(yōu)策略均衡在一些博弈中,一個(gè)參與人的最優(yōu)策略可能可以不依賴于其他參與人的策略選擇;不論其他參與人選擇什么策略,他的最優(yōu)策略是唯一的,這樣的最優(yōu)策略被稱為“占優(yōu)策略”。如果一個(gè)博弈中,某個(gè)參與人有占優(yōu)策略,那么該參與人的其他可選擇策略就被稱為“劣策略”。在一個(gè)博弈里,如果所有參與人都有占優(yōu)策略存在,那么占優(yōu)策略均衡是可以預(yù)測(cè)到的唯一的均衡,因?yàn)闆]有一個(gè)理性的參與人會(huì)選擇劣策略。(三)完全信息靜態(tài)博弈求解坦白(L)抗拒(R)坦白(T)-5-50-9

抗拒(B)-90-1-1罪犯甲罪犯乙2、嚴(yán)格劣策略的重復(fù)剔除首先找出某個(gè)參與人的嚴(yán)格劣策略(假定其存在),把這個(gè)劣策略剔除掉,重新構(gòu)造一個(gè)不包含已剔除策略的新的博弈;所謂“嚴(yán)格劣策略”是指:在博弈中,不論其他參與人采取什么策略,某一參與人可能采取的策略中,對(duì)自己嚴(yán)格不利的策略。重復(fù)這個(gè)過程。

一個(gè)博弈可能有多個(gè)納什均衡,而具體哪個(gè)均衡會(huì)實(shí)現(xiàn),納什均衡本身不能給出回答,任何有限博弈都存在至少一個(gè)納什均衡。剪刀、石頭、布的納什均衡是什么?混合策略納什均衡:各以1/3的概率出剪刀、石頭、布

完全信息動(dòng)態(tài)博弈指的是各博弈方先后行動(dòng),后行動(dòng)者知道先行動(dòng)者的具體行動(dòng)是什么且各博弈方對(duì)博弈中各種策略組合情況下所有參與人相應(yīng)的得益都完全了解的博弈。動(dòng)態(tài)博弈中我們把一個(gè)參與人的一次行動(dòng)稱為一個(gè)“階段”,因此一個(gè)動(dòng)態(tài)博弈就會(huì)有多個(gè)甚至無限個(gè)博弈階段。

(四)完全信息動(dòng)態(tài)博弈求解一個(gè)動(dòng)態(tài)博弈的擴(kuò)展式表達(dá)應(yīng)包含以下要素:(1)參與人集合:I=1,…,n;(2)參與人的行動(dòng)順序:誰在什么時(shí)候行動(dòng);(3)參與人的行動(dòng)空間:在每次行動(dòng)時(shí),參與人有些什么行動(dòng)可供選擇;(4)參與人的信息集:每次行動(dòng)時(shí),參與人知道些什么;(5)參與人的得益函數(shù):在博弈結(jié)束后,每個(gè)參與人得到些什么;博弈樹通常用“博弈樹”來表述有限策略動(dòng)態(tài)博弈。①結(jié):結(jié)包括決策結(jié)和終點(diǎn)結(jié)。②枝:博弈樹上,枝是從一個(gè)決策結(jié)到其直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇。在每一個(gè)枝旁標(biāo)注該具體行動(dòng)的代號(hào)。一般地,每個(gè)決策結(jié)下有多個(gè)枝,給出每次行動(dòng)時(shí)參與人的行動(dòng)空間,即此時(shí)有哪些行動(dòng)可供選擇。

不漲價(jià)漲價(jià)參與者1可口可樂10,10100,-30-20,30140,35不漲價(jià)漲價(jià)參與者2百事可樂不漲價(jià)漲價(jià)參與者2百事可樂140,35在動(dòng)態(tài)博弈中,參與人的行動(dòng)有先后順序,后行動(dòng)的參與人在自己行動(dòng)之前就可以觀察到先行動(dòng)者(參與人)的行為,并在此基礎(chǔ)上選擇相應(yīng)的策略。而且,由于先行動(dòng)者擁有后行動(dòng)者可能選擇策略的完全信息,因而先行動(dòng)者在選擇自己的策略時(shí),就可以預(yù)先考慮自己的選擇對(duì)后行動(dòng)者選擇的影響,并采取相應(yīng)的對(duì)策。上述博弈也成為序列博弈

兩個(gè)房地產(chǎn)開發(fā)商的例子從表可以知道,該博弈有兩個(gè)納什均衡,即(A開發(fā),B不開發(fā))和(A不開發(fā),B開發(fā)),我們無法確定是開發(fā)商A選擇開發(fā),開發(fā)商B選擇不開發(fā),還是恰恰相反的結(jié)果。房地產(chǎn)開發(fā)博弈(靜態(tài))的收收益矩陣

兩個(gè)房地產(chǎn)開發(fā)商的例子A先行動(dòng),B后行動(dòng)不開發(fā)開發(fā)A0,00,22,0-4,-4不開發(fā)開發(fā)B不開發(fā)開發(fā)B在序列博弈中,先行者處于有利地位,可得到競(jìng)爭(zhēng)優(yōu)勢(shì)。在序列博弈中,先行者可以用既成事實(shí)獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。在這種情況下,怎樣才能獲得先行優(yōu)勢(shì)呢?理性的廠商都知道先行者優(yōu)勢(shì),并希望讓競(jìng)爭(zhēng)者確信自己一定會(huì)開發(fā),從而放棄開發(fā)。怎樣才能做到這一點(diǎn)呢?威脅、承諾(1)空頭威脅如果廠商的努力不足以使對(duì)手相信自己肯定會(huì)開發(fā),如制造輿論、研究與開發(fā)投入、廣告宣傳等,這種努力稱為空頭威脅。它不能嚇退競(jìng)爭(zhēng)者。(2)承諾和策略性行動(dòng)如果廠商想要嚇退競(jìng)爭(zhēng)者,必須作出一定開發(fā)的承諾,它是一種無法反悔的行動(dòng)。要使對(duì)手確信自己的承諾,必須做到如果不開發(fā),會(huì)導(dǎo)致自己更大的損失。改變競(jìng)爭(zhēng)者對(duì)自己行動(dòng)的預(yù)期,從而迫使競(jìng)爭(zhēng)者選擇對(duì)自己有利的策略,達(dá)到限制對(duì)手的目的。承諾和策略性行動(dòng)是有風(fēng)險(xiǎn)的,其效果在很大程度上取決于參與者對(duì)各自收益函數(shù)的估計(jì)和行為準(zhǔn)則。適當(dāng)?shù)姆抢硇孕袨榈拿暎ㄓ赂?、瘋狂等),將有助與取得先行者優(yōu)勢(shì)。破釜沉舟背水一戰(zhàn)(五)合作的誘惑在類似囚徒的困境這樣的博弈中,存在著通過合作(共謀、勾結(jié)和串通)改善博弈結(jié)果的誘惑,這樣可以是大家的收益都得到改善。1.對(duì)社會(huì)無害的合作,通過某些規(guī)則實(shí)現(xiàn)設(shè)兩輛汽車同時(shí)到達(dá)一個(gè)十字路口,每個(gè)駕駛員都有開和等兩種選擇,博弈結(jié)果如下:

駕駛員1開等

駕駛員2

開等

-8,-84,00,40,02.對(duì)社會(huì)有害的合作,設(shè)法制止囚徒困境中,如果兩個(gè)囚徒形成攻守同盟,則罪犯得到好處,對(duì)社會(huì)不利。例如在寡頭廠商的定價(jià)博弈中,勾結(jié)定高價(jià)對(duì)雙方都有好處,但對(duì)社會(huì)不利,因此

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論