第10章博弈論初步

上傳人：1*** IP屬地：廣東上傳時(shí)間：2024-11-06 格式：PPT 頁(yè)數(shù)：44 大?。?.76MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩39頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章博弈論初步一、博弈論與策略行為二、同時(shí)博弈：純策略均衡三、同時(shí)博弈：混合策略均衡四、序貫均衡第10章博弈論初步

·2池州學(xué)院胡鵬06十一月2024一、博弈論和策略行為博弈論字面的意思是游戲策略,即用類似游戲中解決問題的方法,揭示解決社會(huì)、經(jīng)濟(jì)及其他領(lǐng)域問題的策略、對(duì)策,因此有的還把博弈論譯成對(duì)策論?！疤锛少愸R”的故事；策略性決策和策略性行動(dòng)是指,每個(gè)人要根據(jù)其他人的可能反應(yīng)來決定自己的決策和行動(dòng)。從經(jīng)濟(jì)學(xué)的角度來看，博弈論要解決的問題就是，如果我相信我的競(jìng)爭(zhēng)者是理性的和追求最大利潤(rùn)的，那么在作我自己的利潤(rùn)最大化決策時(shí)，我應(yīng)該如何考慮他們的行為？第10章博弈論初步

·3池州學(xué)院胡鵬06十一月2024博弈的三個(gè)基本要素參與人（Player）:參與博弈的利益主體叫做參與者,或在博弈中進(jìn)行決策的主體。英文原意為玩主,也有譯成局中人的。在任何一個(gè)博弈中,都至少有連個(gè)參與人。策略（Strategy）:是指一項(xiàng)規(guī)則,根據(jù)該規(guī)則,參與人在博弈的每一時(shí)點(diǎn)上選擇如何行動(dòng)。一般情況下,每個(gè)參與人至少應(yīng)該有兩個(gè)可供選擇的策略。支付（Payoff）:所有參與人都選擇了各自的策略且博弈已經(jīng)完成后,參與人獲得的效用（或期望效用）。第10章博弈論初步

·4池州學(xué)院胡鵬06十一月2024名人名言“要想在現(xiàn)代社會(huì)做一個(gè)有文化的人,你必須對(duì)博弈論有一個(gè)大致了解”——保羅·薩繆爾森第10章博弈論初步

·5池州學(xué)院胡鵬06十一月2024現(xiàn)代博弈論發(fā)展簡(jiǎn)史起源可以追溯到1944年數(shù)學(xué)家馮諾伊曼與經(jīng)濟(jì)學(xué)家摩根斯坦合著的《博弈論與經(jīng)濟(jì)行為》1994:納什（Nash）、海薩尼（J.Harsanyi）、澤爾騰（R.Selten）

納什的基本貢獻(xiàn)是證明了非合作博弈均衡解及其存在性,建立了作為博弈論基礎(chǔ)的“納什均衡”概念；海薩尼則把不完全信息納入到博弈論方法體系中；澤爾騰的貢獻(xiàn)在于將博弈論由靜態(tài)向動(dòng)態(tài)的擴(kuò)展,建立了“子博弈精練納什均衡”的概念。第10章博弈論初步

·6池州學(xué)院胡鵬06十一月2024現(xiàn)代博弈論發(fā)展簡(jiǎn)史1996莫里斯（JamesA.Mirrlees）和維克瑞（WilliamVickrey）前者在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn),尤其是不對(duì)稱信息條件下的經(jīng)濟(jì)激勵(lì)理論的論述；后者在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面都做出了重大貢獻(xiàn)。

2001:阿克洛夫（Akerlof）、斯賓塞（Spence）、斯蒂格利茨（Stiglitz）這三位作為不對(duì)稱信息市場(chǎng)理論的奠基人被授予諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)，以表彰他們分別在檸檬品市場(chǎng)等不對(duì)稱信息理論研究領(lǐng)域做出的基礎(chǔ)性貢獻(xiàn)。這些貢獻(xiàn)發(fā)展了博弈論的方法體系，拓寬了其經(jīng)濟(jì)解釋范圍。2005:奧曼（Aumann）、謝林（Schelling）他們通過博弈理論分析增加了世人對(duì)合作與沖突的理解。他們的理論被廣泛應(yīng)用在解釋社會(huì)中不同性質(zhì)的沖突、貿(mào)易糾紛、價(jià)格之爭(zhēng)以及尋求長(zhǎng)期合作的模式等科學(xué)領(lǐng)域。

第10章博弈論初步

·7池州學(xué)院胡鵬06十一月2024二、同時(shí)博弈:純策略均衡同時(shí)博弈:參與人同時(shí)進(jìn)行決策或行動(dòng)的博弈。所謂的“同時(shí)”是指參與人在決策時(shí)不知道其他參與人的決策，不是一定指時(shí)間上的同時(shí)。在一個(gè)博弈中，即使所有參與人的決策在時(shí)間上都不同，但是如果每一個(gè)參與人在決策之前并不知道其他參與人的決策，該博弈仍被看成是“同時(shí)”的。序貫博弈:參與人的決策或行動(dòng)有先有后。換言之，后行動(dòng)者知道先行動(dòng)者的決策或行動(dòng)，如下棋。第10章博弈論初步

·8池州學(xué)院胡鵬06十一月20241.寡頭廠商博弈乙廠商的策略合作不合作甲廠商的策略合作

5，61，5

不合作

7，1

2，3

2.支付矩陣第10章博弈論初步

·9池州學(xué)院胡鵬06十一月20243.條件策略和條件策略組合乙廠商的策略合作不合作甲廠商的策略合作

5，61，5

不合作

7，1

2，3

支付矩陣條件策略:甲廠商在乙廠商選擇合作條件下的最優(yōu)策略即不合作叫做甲廠商的條件優(yōu)勢(shì)策略（相對(duì)優(yōu)勢(shì)策略）。簡(jiǎn)稱條件策略。條件策略組合:與甲廠商這一條件策略相聯(lián)系的策略組合即（不合作，合作）叫做甲廠商的條件優(yōu)勢(shì)策略組合（相對(duì)優(yōu)勢(shì)策略組合），簡(jiǎn)稱條件策略組合。第10章博弈論初步

·10池州學(xué)院胡鵬06十一月20243.條件策略和條件策略組合乙廠商的策略合作不合作甲廠商的策略合作

5，61，5

不合作

7，1

2，3

支付矩陣可見，甲廠商有兩個(gè)條件策略，與此相對(duì)應(yīng)也有兩個(gè)條件策略組合:（不合作，合作）、（不合作，不合作）。同理，乙廠商有兩個(gè)條件策略，與此相對(duì)應(yīng)也有兩個(gè)條件策略組合:（合作，合作）、（不合作，不合作）。第10章博弈論初步

·11池州學(xué)院胡鵬06十一月20244.納什均衡思考：如何讓甲乙廠商同時(shí)都不再有單獨(dú)改變策略的傾向？甲廠商有兩個(gè)條件策略，及兩個(gè)條件策略組合:（不合作，合作）、（不合作，不合作）。乙廠商有兩個(gè)條件策略，及兩個(gè)條件策略組合:（合作，合作）、（不合作，不合作）。乙廠商的策略合作不合作甲廠商的策略合作

5，61，5

不合作

7，1

2，3

支付矩陣第10章博弈論初步

·12池州學(xué)院胡鵬06十一月20244.納什均衡當(dāng)兩個(gè)廠商的條件策略組合恰好相同,從而,兩個(gè)廠商都不再有單獨(dú)改變策略的傾向時(shí),整個(gè)博弈就達(dá)到了均衡。博弈均衡是博弈各方最終選取的策略組合,是博弈的最終結(jié)果,是博弈的解。這種均衡有一個(gè)專門的名稱——納什均衡。所謂納什均衡,是指參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨(dú)改變策略都不會(huì)得到好處。換言之,如果在一個(gè)策略組合中,當(dāng)所有其他人都不改變策略時(shí),沒有人會(huì)改變自己的策略,則該策略則會(huì)就是一個(gè)納什均衡。第10章博弈論初步

·13池州學(xué)院胡鵬06十一月20245.尋找納什均衡的方法——條件策略下劃線法首先,用下劃線來表示甲廠商的條件策略。乙廠商的策略合作不合作甲廠商的策略合作

5，61，5

不合作

7，1

2，3

支付矩陣其次,用下劃線來表示乙廠商的條件策略。最后確定博弈的均衡?！灰业絻蓚€(gè)數(shù)字之下都劃線的單元格即可。與這些單元格相對(duì)應(yīng)的策略組合就是均衡策略組合。第10章博弈論初步

·14池州學(xué)院胡鵬06十一月20245.尋找納什均衡的方法——條件策略下劃線法總結(jié)即為:五步驟劃線法。首先,把整個(gè)支付矩陣分解為甲廠商的支付矩陣和乙廠商的支付矩陣。乙廠商的策略左右甲廠商的策略上

5，61，5

下

7，1

2，3

51甲的支付矩陣=72

65乙的支付矩陣=13第10章博弈論初步

·15池州學(xué)院胡鵬06十一月20245.尋找納什均衡的方法——條件策略下劃線法其次,在甲廠商的支付矩陣中,找出每一列的最大者。

51甲的支付矩陣=72

65乙的支付矩陣=13再次,在乙廠商的支付矩陣中,找出每一行的最大者。再再次,將已經(jīng)畫好線的甲廠商的支付矩陣和乙廠商的支付矩陣中合并起來。

5615合并后的支付矩陣=7123最后,找到兩個(gè)數(shù)字下均劃線的支付組合,該組合所代表的策略組合就是均衡的策略組合。即（不合作,不合作）就是均衡的策略組合。第10章博弈論初步

·16池州學(xué)院胡鵬06十一月20246.納什均衡的存在性、唯一性和最優(yōu)性（1）存在性在同時(shí)博弈中,（純策略）納什均衡既可能存在,也可能不存在。乙廠商的策略左右甲廠商的策略上

4，69，1

下

7，3

2，8

第10章博弈論初步

·17池州學(xué)院胡鵬06十一月20246.納什均衡的存在性、唯一性和最優(yōu)性（2）唯一性在納什均衡存在的條件下,它既可能是唯一的,也可能不唯一。乙廠商的策略左右甲廠商的策略上

5，61，4

下

4，1

2，3

第10章博弈論初步

·18池州學(xué)院胡鵬06十一月20246.納什均衡的存在性、唯一性和最優(yōu)性（3）最優(yōu)性如果納什均衡存在,它既可能是最優(yōu)的,也可能不是最優(yōu)的。乙廠商的策略左右甲廠商的策略上

5，61，4

下

4，1

2，3

第10章博弈論初步

·19池州學(xué)院胡鵬06十一月20247、二人同時(shí)博弈的一般理論參與人B的策略策略1策略2參與人A的策略策略1a11，b11a12，b12

策略2a21，b21

a22，b22

二人同時(shí)博弈的一般模型

a11

a12A的支付矩陣=

a21

a22

b11

b12B的支付矩陣=

b21

b22第10章博弈論初步

·20池州學(xué)院胡鵬06十一月20247、二人同時(shí)博弈的一般理論

a11

a12A的支付矩陣=

a21

a22①a11=a21

、a12=a22；②a11=a21

、a12>a22；

③a11=a21

、a12<a22；④a11>a21

、a12=a22；

⑤a11<a21

、a12=a22；⑥a11>a21

、a12>a22；

⑦a11<a21

、a12<a22；⑧a11>a21

、a12<a22；

⑨a11<a21

、a12>a22；第10章博弈論初步

·21池州學(xué)院胡鵬06十一月20247、二人同時(shí)博弈的一般理論

a11

a12①=

a21

a22

a11

a12②=

a21

a22

a11

a12③=

a21

a22

a11

a12④=

a21

a22

a11

a12⑤=

a21

a22

a11

a12⑥=

a21

a22

a11

a12⑦=

a21

a22

a11

a12⑧=

a21

a22

a11

a12⑨=

a21

a22第10章博弈論初步

·22池州學(xué)院胡鵬06十一月20247、二人同時(shí)博弈的一般理論

b11

b12B的支付矩陣=

b21

b22①b11=b12

、b21=b22；②b11=b12

、b21>b22；

③b11=b12

、b21<b22；④b11>b12

、b21=b22；

⑤b11<b12

、b21=b22；⑥b11>b12

、b21>b22；

⑦b11<b12

、b21<b22；⑧b11>b12

、b21<b22；

⑨b11<b12

、b21>b22；第10章博弈論初步

·23池州學(xué)院胡鵬06十一月20247、二人同時(shí)博弈的一般理論

b11

b12

①=

b21

b22

b11

b12

②=

b21

b22

b11

b12

③=

b21

b22

b11

b12

④=

b21

b22

b11

b12

⑤=

b21

b22

b11

b12

⑥=

b21

b22

b11

b12

⑦=

b21

b22

b11

b12

⑧=

b21

b22

b11

b12

⑨=

b21

b22第10章博弈論初步

·24池州學(xué)院胡鵬06十一月20247、二人同時(shí)博弈的一般理論整個(gè)矩陣的支付矩陣共有9×9=81種可能。在這81種可能的支付矩陣中,如果位于同一處的兩個(gè)數(shù)字（相同下標(biāo)的a與b）均有下劃線,則它們所代表的策略組合就是納什均衡。全部的納什均衡可分為五種類型:第一種是四個(gè)均衡；第二種是三個(gè)均衡；第三種是兩個(gè)均衡；第四種是一個(gè)均衡；第五種是0個(gè)均衡。第10章博弈論初步

·25池州學(xué)院胡鵬06十一月2024三、同時(shí)博弈:混合策略均衡1.不存在純策略均衡時(shí)的混合策略均衡（1）混合策略“石頭、剪刀、布”。思考：如何選擇才能力保不輸？乙廠商的策略q1q2左右甲廠商的策略p1上4，69，1p2下7，32，80≤p1,p2,q1,q2≤1p1+p2=1q1+q2=1廠商原來的策略是純策略,廠商賦予純策略的概率向量叫做混合策略。第10章博弈論初步

·26池州學(xué)院胡鵬06十一月2024（2）混合策略組合甲廠商的混合策略為概率向量（p1，p2）；乙廠商的混合策略為概率向量（q1，q2）；則混合策略組合為:((p1，p2)，(q1，q2))（3）期望支付E甲=p1?q1?4+p1?q2?9+p2?q1?7+p2?q2?2E乙=p1?q1?6+p1?q2?1+p2?q1?3+p2?q2?8由于p1,p2,q1,q2可以在0和1之間任意取值,期望支付組合（E甲,E乙）也有無窮多個(gè)。第10章博弈論初步

·27池州學(xué)院胡鵬06十一月2024（4）條件混合策略E甲=p1?q1?4+p1?q2?9+p2?q1?7+p2?q2?2=4p1

q1+9p1(1-q1)+7(1-p1)

q1+2(1-p1)(1-q1)=7p1-10p1

q1+5q1+2=7p1

(7–10q1)+5q1+2E乙=p1?q1?6+p1?q2?1+p2?q1?3+p2?q2?8=6p1

q1+p1(1-q1)+3(1-p1)

q1+8(1-p1)(1-q1)

=6p1

q1+p1-p1q1+3q1-3p1q1

+8-8q1-8p1

+8p1q1=10p1

q1+8–5q1-7p1=5q1

(2p1-1)-7p1+8條件混合策略即就是具有相對(duì)優(yōu)勢(shì)的混合策略。第10章博弈論初步

·28池州學(xué)院胡鵬06十一月2024（4）條件混合策略E甲=7p1

(7–10q1

)+5q1+2①7–10q1>0,即q1<0.7時(shí),為使E甲達(dá)到最大,應(yīng)該取p1=1；②7–10q1<0,即q1>0.7時(shí),為使E甲達(dá)到最大,應(yīng)該取p1=0；③7–10q1=0,即q1=0.7時(shí),E甲=5q1+2,與p1完全無關(guān)。p1可以取任何值,即有p1=[0,1]。甲廠商的混合策略可以表示為:第10章博弈論初步

·29池州學(xué)院胡鵬06十一月2024（4）條件混合策略E乙=5q1

(2p1-1)-7p1+8①2p1-1>0,即p1>0.5時(shí),為使E乙達(dá)到最大,應(yīng)該取q1=1；②2p1-1<0,即p1<0.5時(shí),為使E乙達(dá)到最大,應(yīng)該取q1=0；③2p1-1=0,即p1=0.5時(shí),E乙=-7p1+8,與q1完全無關(guān)。q1可以取任何值,即有q1=[0,1]。乙廠商的混合策略可以表示為:第10章博弈論初步

·30池州學(xué)院胡鵬06十一月2024（5）混合策略納什均衡0.70.5q1p1011甲廠商的條件混合策略曲線乙廠商的條件混合策略曲線e混合策略納什均衡為:((p1,p2),(q1,q2))=((0.5,0.5),(0.7,0.3))第10章博弈論初步

·31池州學(xué)院胡鵬06十一月20242.存在純策略均衡時(shí)的混合策略均衡乙廠商的策略q1q2合作不合作甲廠商的策略p1合作4，69，1p2不合作7，32，80≤p1,p2,q1,q2≤1p1+p2=1q1+q2=1第10章博弈論初步

·32池州學(xué)院胡鵬06十一月20242.存在純策略均衡時(shí)的混合策略均衡E甲=5p1

q1+p1(1-q1)+7(1-p1)q1

+2(1-p1)(1-q1)

=5p1

q1+p1-p1

q1-7p1

q1+2-2q1-2p1+2p1

=-p1-p1

q1+5q1+2=-p1

(1+q1)+5q1+2E乙=6p1

q1+5p1(1-q1)+(1-p1)q1+3(1-p1)(1-q1)=6p1

q1+5p1-5p1q1+q1-p1

q1+3-3q1-3p1+3p1

=3p1

q1+3–2q1+2p1=

(3p1-2)+2p1+3第10章博弈論初步

·33池州學(xué)院胡鵬06十一月20242.存在純策略均衡時(shí)的混合策略均衡

E甲

=-p1

(1+q1)+5q1+2甲廠商的混合策略可以表示為:p1=00≤q1≤1為使E甲達(dá)到最大,p1越小越好,所以取p1=0；E乙=q1

(3p1-2)+2p1+3①3p1-2>0,即p1>2/3時(shí),為使E乙達(dá)到最大,應(yīng)該取q1=1；②3p1-2<0,即p1<2/3時(shí),為使E乙達(dá)到最大,應(yīng)該取q1=0；③3p1-2=0,即p1=2/3時(shí),q1可以取任何值,即有q1=[0,1]。乙廠商的混合策略可以表示為:第10章博弈論初步

·34池州學(xué)院胡鵬06十一月20242.存在純策略均衡時(shí)的混合策略均衡2/3q1p1011甲廠商的條件混合策略曲線乙廠商的條件混合策略曲線混合策略納什均衡為:((p1,p2),(q1,q2))=((0,1),(0,1))e第10章博弈論初步

·35池州學(xué)院胡鵬06十一月20243.混合博弈的一般理論參與人B的策略q1q2策略1策略2參與人A的策略p1策略1a11，b11a12，b12p2策略2a21，b21a22，b22

0≤p1,p2,q1,q2≤1p1+p2=1q1+q2=1A的全部混合策略可表示為:(p1,p2),0≤p1,p2≤1,p1+p2=1;B的全部混合策略可表示為:(q1,q2),0≤q1,q2≤1,q1+q2=1;A和B的全部混合策略組合可表示為:（(p1,p2),(q1,q2)）0≤p1，p2，q1，q2≤1p1+p2=1q1+q2=1第10章博弈論初步

·36池州學(xué)院胡鵬06十一月20243.混合博弈的一般理論EA=p1q1a11+p1q2a12+p2q1a21+p2q2a22=p1q1a11+p1(1-q1)a12+(1-p1)q1a21+(1-p1)(1-q1)a22=p1(q1(a11–a21)+(1-q1)(a12–a22))+q1(a21–a22)+a22=p1Δa+q1(a21–a22)+a22這里:Δa=q1(a11–a21)+(1-q1)(a12–a22)EB=p1q1b11+p1q2b12+p2q1b21+p2q2b22=p1q1b11+p1(1-q1)b12+(1-p1)q1b21+(1-p1)(1-q1)b22=q1(p1(b11–b12)+(1-p1)(b21–b22))+p1(b12–b22)+b22=q1Δb+p1(b12–b22)+b22這里:Δb=p1(b11–b12)+(1-p1)(b21–b22)第10章博弈論初步

·37池州學(xué)院胡鵬06十一月2024A的條件混合策略①Δa=0,則EA=q1(a21–a22)+a22,與p1無關(guān),p1可以取任何值,即有p1=[0,1]。②Δa>0,為使EA達(dá)到最大,

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第10章博弈論初步

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第10章 博弈論初步

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第10章博弈論初步