博弈論第二章——博弈規(guī)則_第1頁
博弈論第二章——博弈規(guī)則_第2頁
博弈論第二章——博弈規(guī)則_第3頁
博弈論第二章——博弈規(guī)則_第4頁
博弈論第二章——博弈規(guī)則_第5頁
已閱讀5頁,還剩109頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、參考書目參考書目1. 美美阿維納什阿維納什K 迪克西特迪克西特.策略思維策略思維.中國人民大中國人民大學(xué)出版社,學(xué)出版社,20022. 王則柯王則柯. 新編新編博弈論平話博弈論平話. 中信出版社,中信出版社,20033. 謝識予謝識予.經(jīng)濟博弈論經(jīng)濟博弈論(第二版第二版) .復(fù)旦大學(xué)復(fù)旦大學(xué) 出版社,出版社,20024. 美美埃里克埃里克拉斯繆森拉斯繆森.博弈與信息:博弈論概論博弈與信息:博弈論概論.北京大學(xué)出版社,北京大學(xué)出版社,20035.張維迎張維迎.博弈論與信息經(jīng)濟學(xué)博弈論與信息經(jīng)濟學(xué).上海三聯(lián)書店,上海三聯(lián)書店,2004第二章第二章 博弈論基本知識博弈論基本知識2.1 2.1 什么是

2、博弈論什么是博弈論2.2 2.2 博弈的結(jié)構(gòu)和分類博弈的結(jié)構(gòu)和分類2.3 2.3 博弈的表達方式博弈的表達方式2.42.4 幾類經(jīng)典的博弈模型幾類經(jīng)典的博弈模型2.1.1 從游戲到博弈從游戲到博弈2.1.2 一個非技術(shù)性的定義一個非技術(shù)性的定義2.1.3 博弈論模型簡介博弈論模型簡介第一節(jié)第一節(jié) 什么是博弈論什么是博弈論2.1.1 2.1.1 從游戲到博弈從游戲到博弈 “博弈論博弈論”譯自英文譯自英文“Game Theory”,直譯就是,直譯就是“游戲理論游戲理論”。 游戲的共有特征游戲的共有特征 1. 一定的規(guī)則一定的規(guī)則 2. 有一個結(jié)果(且可以折算有一個結(jié)果(且可以折算成數(shù)字)成數(shù)字)

3、3.策略的相互依存性策略的相互依存性 4.策略至關(guān)重要策略至關(guān)重要博弈論博弈論- -無處不在的游戲 “要想在現(xiàn)代社會做一要想在現(xiàn)代社會做一個有文化的人,你必須對個有文化的人,你必須對博弈論有一個大致了解博弈論有一個大致了解”。 保羅保羅薩繆爾森薩繆爾森 年光似鳥翩翩過,世事年光似鳥翩翩過,世事如棋局局新。如棋局局新。 ( (宋宋) )僧志文僧志文 博弈論(博弈論(game theorygame theory):):又稱對策論,是研究相互依又稱對策論,是研究相互依賴、相互影響的決策主體的賴、相互影響的決策主體的理性決策行為理性決策行為以及這些決策以及這些決策的均衡結(jié)果的理論。的均衡結(jié)果的理論。2

4、.1.2 2.1.2 博弈論的博弈論的基本概念基本概念Governing Dynamics博弈論的基本假設(shè)博弈論的基本假設(shè) 人是理性人(人是理性人(rationalrational,也,也說自私人)說自私人): :行動者具有行動者具有推理推理能力能力,在具體策略選擇時的,在具體策略選擇時的目的是使決策者自己的目的是使決策者自己的目標(biāo)目標(biāo)效用最大化效用最大化。2.1.2 2.1.2 博弈論的博弈論的基本概念基本概念通俗地講,博弈論是一種通俗地講,博弈論是一種“游戲理游戲理論論”。其較對博弈為準(zhǔn)確的理解是:其較對博弈為準(zhǔn)確的理解是:一些個人、團隊或其他組織,面對一些個人、團隊或其他組織,面對一定的

5、環(huán)境條件,在一定的規(guī)則約一定的環(huán)境條件,在一定的規(guī)則約束下,依靠所掌握的信息,同時或束下,依靠所掌握的信息,同時或先后,一次或多次,從各自允許選先后,一次或多次,從各自允許選擇的行為或策略進行選擇并加以實擇的行為或策略進行選擇并加以實施,并從中各自取得相應(yīng)結(jié)果或收施,并從中各自取得相應(yīng)結(jié)果或收益的過程。益的過程。博弈論模型可以用七個方面來描述博弈論模型可以用七個方面來描述 GP,A,S,I,U,O,E 2.1.32.1.3博弈論的模型簡介博弈論的模型簡介P(players) P(players):): 為局中人,博弈的為局中人,博弈的參與者,也稱為參與者,也稱為“博弈方博弈方”,局中,局中人以

6、最終實現(xiàn)自身利益最大化為目人以最終實現(xiàn)自身利益最大化為目標(biāo)。標(biāo)。個人個人團體團體雙方雙方多方多方虛擬參與人:虛擬參與人:NatureA(action) A(action) :為各局中人的所有可能的:為各局中人的所有可能的策略或行動的集合。策略或行動的集合。 行動的順序(行動的順序(The order of play) 根據(jù)該集合是有限還是無限進行分類:根據(jù)該集合是有限還是無限進行分類:先動優(yōu)勢先動優(yōu)勢后動優(yōu)勢后動優(yōu)勢S(strategies) S(strategies) :博弈的進程,也是:博弈的進程,也是博弈進行的次序。它規(guī)定什么人在博弈進行的次序。它規(guī)定什么人在什么時候選擇什么行動。因此,

7、戰(zhàn)什么時候選擇什么行動。因此,戰(zhàn)略是參與人的略是參與人的 “相機行動方案相機行動方案” (contingent action plan) 分類:根據(jù)后行動的人是否能夠看分類:根據(jù)后行動的人是否能夠看到先行動人的具體行動到先行動人的具體行動靜態(tài)博弈靜態(tài)博弈動態(tài)博弈動態(tài)博弈行動與策略的區(qū)別?行動與策略的區(qū)別? 行動是指參與者可能有的具體行動行動是指參與者可能有的具體行動 戰(zhàn)略是行動的規(guī)則而不是行動本身戰(zhàn)略是行動的規(guī)則而不是行動本身毛澤東:毛澤東:人不犯我我不犯人人不犯我我不犯人人若犯我我必犯人人若犯我我必犯人敵進我退敵進我退敵退我追敵退我追敵駐我擾敵駐我擾敵疲我打敵疲我打 I(informatio

8、n) I(information) :博弈信息。:博弈信息。指的是指的是參與人在博弈中的知識,特別是有關(guān)參與人在博弈中的知識,特別是有關(guān)其他參與人(對手)的特征和行為的其他參與人(對手)的特征和行為的知識知識 分類:根據(jù)博弈各方對各種局勢下所分類:根據(jù)博弈各方對各種局勢下所有局中人的信息掌握情況分:有局中人的信息掌握情況分:完全信息博弈完全信息博弈不完全信息不完全信息博弈博弈U( utility ) U( utility ):也稱為支付():也稱為支付(pay off).為局中人獲得利益,或者是為局中人獲得利益,或者是指參與人的期望效用水平。也是博指參與人的期望效用水平。也是博弈各方追求的最終

9、目標(biāo)。弈各方追求的最終目標(biāo)。 分類:根據(jù)各方得益的不同情況分類:根據(jù)各方得益的不同情況零和零和博弈博弈變和變和博弈博弈田忌賽馬囚徒困境 Ua(t,t)=-8Ua(t,n)=0 Ua(n,n)=-1 Ua(n,t)=-10 Ub(t,t)=-8Ub(t,n)=-10 Ub(n,n)=-1 Ub(n,t)=0 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10, 0-10, 0-1-1,-1-1嫌疑人嫌疑人a嫌疑人bU(t,t)=0.5*(-8)+ 0.5*(-8)=-8U(t,n)=0.5*0+ 0.5*(-10)=-5U(n,t)=0.

10、5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1 結(jié)果(結(jié)果(outcome) 是指博弈分析者是指博弈分析者感興趣的要素的感興趣的要素的集合。是均衡行集合。是均衡行動的組合。動的組合。 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10, 0-10, 0-1-1,-1-1嫌疑人嫌疑人A嫌疑人BE(equilibrium) 均衡均衡(equilibrium):是所有參與人的最:是所有參與人的最優(yōu)戰(zhàn)略的組合。優(yōu)戰(zhàn)略的組合。 所謂博弈均衡,它是一種所謂博弈均衡,它是一種穩(wěn)定的穩(wěn)定的博弈結(jié)博弈結(jié)果。果

11、。 納什均衡納什均衡(Nash Equilibrium):一策):一策略組合中,所有的參與者面臨這樣的一略組合中,所有的參與者面臨這樣的一種情況:當(dāng)其他人不改變策略時,他此種情況:當(dāng)其他人不改變策略時,他此時的策略是最好的。時的策略是最好的。 謝識予:謝識予:給定你的給定你的 策略,我的策略是最策略,我的策略是最好的的策略,給定我的好的的策略,給定我的 策略,你的策略策略,你的策略也是最好的的策略也是最好的的策略 兩個小偷甲和乙聯(lián)手作案,私入民宅兩個小偷甲和乙聯(lián)手作案,私入民宅被警方逮住但未獲證據(jù)。警方將兩人被警方逮住但未獲證據(jù)。警方將兩人分別置于兩間房間分開審訊,政策是分別置于兩間房間分開審

12、訊,政策是若一人招供但另一人未招,則招者立若一人招供但另一人未招,則招者立即被釋放,未招者判入獄即被釋放,未招者判入獄10年;若二年;若二人都招則兩人各判刑人都招則兩人各判刑8年年;若兩人都不若兩人都不招則未獲證據(jù)但因私入民宅各拘留招則未獲證據(jù)但因私入民宅各拘留1年。年。囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B一個納什均衡點!情侶博弈情侶博弈 足球足球演唱會演唱會足球足球演唱會演唱會王菲李亞鵬兩個納什均衡點!博弈論模型可以用五個方面來描述博弈論模型可以用五個方面來描述 GP,A,S,I,U,O,E描述博弈的最少要素:描述博弈的最少要素:參與人,戰(zhàn)略,支付參與人

13、,戰(zhàn)略,支付。 行動行動和和信息信息是其積木是其積木參與人、行動、結(jié)果參與人、行動、結(jié)果統(tǒng)稱為統(tǒng)稱為“博弈規(guī)則博弈規(guī)則” 博弈分析的目的:是使用博弈規(guī)則預(yù)測博弈分析的目的:是使用博弈規(guī)則預(yù)測均衡均衡2.1.3 2.1.3 博弈論的模型簡介博弈論的模型簡介博弈論模型可以用七個方面來描述博弈論模型可以用七個方面來描述 GP,A,S,I,U,O,E2.2.1 博弈方博弈方2.2.2 博弈的行動過程博弈的行動過程2.2.3 策略策略2.2.4 支付(效用、得益)支付(效用、得益)2.2.5 博弈的信息結(jié)構(gòu)博弈的信息結(jié)構(gòu)2.2.6 博弈方的能力和理性博弈方的能力和理性2.2.7 博弈的分類和理論結(jié)構(gòu)博弈

14、的分類和理論結(jié)構(gòu)第二節(jié)第二節(jié) 博弈論的結(jié)構(gòu)與分類博弈論的結(jié)構(gòu)與分類2.2.1 2.2.1 博弈中的博弈方博弈中的博弈方博弈方(博弈方(player/ players) 博弈中獨立決策、獨立承擔(dān)博弈結(jié)博弈中獨立決策、獨立承擔(dān)博弈結(jié)果的個人或組織稱為博弈方。果的個人或組織稱為博弈方。 1.單人博弈單人博弈 2.雙人博弈雙人博弈 3.多人博弈多人博弈1.單人博弈單人博弈設(shè)有一商人要從設(shè)有一商人要從A地運輸一批貨物,地運輸一批貨物,從從A地到地到B地有水、陸兩條路線,地有水、陸兩條路線,走陸路運輸成本走陸路運輸成本10 000元,而走水元,而走水路運輸成本只要路運輸成本只要7000元。但非常元。但非常

15、危險,出現(xiàn)壞天氣的概率為危險,出現(xiàn)壞天氣的概率為0.25,此時會損失此時會損失10%的貨物。貨物總價的貨物。貨物總價值值90 000元。元。此人怎樣決策?此人怎樣決策? 好天氣好天氣(75%)(75%)壞天氣壞天氣(25%)(25%)水路水路陸路陸路自然商人囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B2.雙人博弈雙人博弈情侶博弈情侶博弈 足球足球演唱會演唱會足球足球演唱會演唱會王菲李亞鵬選修課另一版本選修課另一版本 博弈論博弈論舞蹈舞蹈博弈論博弈論舞蹈舞蹈王菲李亞鵬石頭石頭剪子剪子布布石頭石頭剪子剪子布布石頭石頭0,01,1-1,1剪子剪子-1,10,01,-1布

16、布1,-1-1,10,0博弈方博弈方2 2博博弈弈方方1 1雙人博弈小結(jié)雙人博弈小結(jié)注意二點:注意二點:1. 博弈方之間并非總是對抗的。博弈方之間并非總是對抗的。2. 個人理性決策常不能實現(xiàn)自己的個人理性決策常不能實現(xiàn)自己的 最大利益。最大利益。3、多人博弈、多人博弈三個或三個以上的博弈方參加的博弈。三個或三個以上的博弈方參加的博弈。競爭者競爭者破壞者破壞者競爭者競爭者北京申辦北京申辦2000年奧運會失利年奧運會失利第一輪第一輪第二輪第二輪第三輪第三輪第四輪第四輪北京北京32374043悉尼悉尼28303745曼徹斯特曼徹斯特111111柏林柏林910伊斯坦布伊斯坦布爾爾82.2.2 策略策略

17、有限博弈(有限博弈(finite games) :如:如果博弈中每個博弈方的策略是有果博弈中每個博弈方的策略是有限的,稱為有限博弈。限的,稱為有限博弈。2.無限博弈(無限博弈(infinite games) :如:如果博弈中至少有某些博弈方的策果博弈中至少有某些博弈方的策略是無限多個的,稱為無限博弈。略是無限多個的,稱為無限博弈。 (函數(shù)表示函數(shù)表示)2.2.3 2.2.3 博弈的行動過程博弈的行動過程 1. 靜態(tài)博弈(靜態(tài)博弈(static games):所有博弈方同時所有博弈方同時選擇策略的博弈。選擇策略的博弈。 2 . 動態(tài)博弈(動態(tài)博弈(dynamic games):):各博弈方的各博

18、弈方的選擇和行動有先后次序,而且后選擇的、后行動選擇和行動有先后次序,而且后選擇的、后行動的博弈方,在自己選擇行動方案之前,可以看到的博弈方,在自己選擇行動方案之前,可以看到其他博弈方的選擇和行動。也稱為多階段博弈其他博弈方的選擇和行動。也稱為多階段博弈(multistage games) 3. 重復(fù)博弈(重復(fù)博弈(repeated games):):同一個博弈同一個博弈反復(fù)進行多構(gòu)成的博弈。反復(fù)進行多構(gòu)成的博弈。2.2.4 2.2.4 博弈的支付博弈的支付(效用,得益)(效用,得益)效用的計算方法:將每一個博弈方在效用的計算方法:將每一個博弈方在同一策同一策略結(jié)果中略結(jié)果中的得益相加,算出所

19、有博弈方的的得益相加,算出所有博弈方的得益總和。得益總和。Ua(1,2)= Ua1+Ua2Ub(1,2)= Ub1+Ub2 1. 零和博弈零和博弈: Ua(1,2)= Ub(1,2) =0 2 . 常和博弈常和博弈: Ua(1,2)= Ub(1,2) = m 3. 變和博弈變和博弈: Ua(1,2) Ub(1,2) 兩個人通過猜硬幣的正反賭輸贏,其兩個人通過猜硬幣的正反賭輸贏,其中一人用手蓋住一枚硬幣,有另一方中一人用手蓋住一枚硬幣,有另一方在是正面還是反面朝上。若猜對,則在是正面還是反面朝上。若猜對,則猜著贏猜著贏1元,蓋著輸元,蓋著輸1元;若猜錯,則元;若猜錯,則猜著輸猜著輸1元,蓋著贏元

20、,蓋著贏1元。元。 假設(shè)贏著收益為假設(shè)贏著收益為1,輸者收益為,輸者收益為-1。猜硬幣游戲猜硬幣游戲猜硬幣游戲猜硬幣游戲 正面正面z z反面反面f f正面正面z z-1,1-1,11,-11,-1反面反面f f1 1,-1-1-1,1-1,1猜硬幣方-2 U1z(z,z)=-1U1z(z,f)=1 U1f(f,z)=1 U1f(f,f)=-1 U2z(z,z)=-1U2z(f,z)=1 U2f(z,f)=1 U2f(f,f)=-1Uz= U1z+ U2z=-1+1-1+1=0Uf= U1f+ U2f=1-1+1-1=0蓋硬幣方-1石頭石頭剪子剪子布布石頭石頭剪子剪子布布石頭石頭0,01,1-1

21、,1剪子剪子-1,10,01,-1布布1,-1-1,10,0博弈方博弈方2 2博博弈弈方方1 1周末約會周末約會 足球足球g g演唱會演唱會d d足球足球g g2,12,10,00,0演唱會演唱會d d-1-1,-1-11,21,2王菲b李亞鵬a Uag(g,g)=2Uag(g,d)=0 Uad(d,g)=-1 Uad(d,d)=1 Ubg(g,g)=1Ubg(d,g)=-1 Ubd(g,d)=0 Ubd(d,d)=2UU= Uag+ Ubg=2+0+1-1=2Ud= Uad+ Ubd=-1+1+0+2=2Un= Uan+ Ubn=-1-10-10-1=-22 Uat(t,t)=-8Uat(t

22、,n)=0 Uan(n,t)=-10 Uan(n,n)=-1 Ubt(t,t)=-8Ubt(n,t)=0 Ubn(t,n)=-10 Ubn(n,n)=-1 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10, 0-10, 0-1-1,-1-1嫌疑人嫌疑人b嫌疑人aUt= Uat+ Ubt=-8+0-8+0=-16囚徒困境囚徒困境獎金分配獎金分配 績效高績效高g g 績效低績效低d d績效高績效高g g績效低績效低d d王菲b李亞鵬a Uag(g,g)=5Uag(g,d)=7 Uad(d,g)=3 Uad(d,d)=5 Ubg(g,g)=

23、5Ubg(d,g)=7 Ubd(g,d)=3 Ubd(d,d)=5Ug= Uag+ Ubg=5+7+5+7=24Ud= Uad+ Ubd=3+5+3+5=16Ud= Uad+ Ubd=30+80+30+80=220 Uag(g,g)=50Uag(g,d)=10 Uad(d,g)=80 Uad(d,d)=30 Ubg(g,g)=50Ubg(d,g)=10 Ubd(g,d)=80 Ubd(d,d)=30 高價高價g g低價低價d d高價高價g g5050,505010,8010,80低價低價d d80, 1080, 103030,3030聯(lián)通聯(lián)通b移動aUg= Uag+ Ubg=50+10+50+

24、10=120寡頭定價寡頭定價2.2.5 2.2.5 博弈的信息結(jié)構(gòu)博弈的信息結(jié)構(gòu)1.關(guān)于得益的信息關(guān)于得益的信息 完全信息和不完全信息完全信息和不完全信息(1) 完全信息(完全信息(complete information)是是指在博弈過程中,每一位博弈方對其他博弈指在博弈過程中,每一位博弈方對其他博弈方的特征、策略空間及收益函數(shù)有準(zhǔn)確的信方的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。息。(2)不完全信息()不完全信息(incomplete information): 如果博弈方對其他博弈方的特征、策略空間如果博弈方對其他博弈方的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是及收益函數(shù)信息了

25、解的不夠準(zhǔn)確、或者不是對所有博弈方的特征、策略空間及收益函數(shù)對所有博弈方的特征、策略空間及收益函數(shù)都有準(zhǔn)確的準(zhǔn)確信息,在這種情況下進行的都有準(zhǔn)確的準(zhǔn)確信息,在這種情況下進行的博弈就是不完全信息博弈。也成博弈就是不完全信息博弈。也成不對稱信息不對稱信息或者或者信息不對稱信息不對稱(asymmetric information)2.2.關(guān)于博弈過程的信息關(guān)于博弈過程的信息 完美信息和不完美信息完美信息和不完美信息完美信息(完美信息(perfect informationperfect information): :對對已經(jīng)發(fā)生的的事情有清楚的了解,稱具已經(jīng)發(fā)生的的事情有清楚的了解,稱具有完美信息。

26、否則,稱為有完美信息。否則,稱為不完美信息不完美信息(imperfect informationimperfect information)2.2.6 博弈方的理性與能力博弈方的理性與能力 完全理性與完全理性與有限理性有限理性 個體理性與個體理性與集體理性集體理性 戰(zhàn)爭戰(zhàn)爭和平和平戰(zhàn)爭戰(zhàn)爭-50-50,- -5050100, 0100, 0和平和平0, 1000, 1005050,5050A國國B國國戰(zhàn)爭與和平戰(zhàn)爭與和平2.2.7 博弈的類型1 根據(jù)參與者能否形成約束性的協(xié)議,以便集體行動 (1)合作博弈(cooperative game )研究人們達成合作時如何分配合作得到的收益,即收益分配

27、問題。 (2)非合作博弈( non-cooperative /uncooperative game )研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。 行動次行動次序序信息信息靜態(tài)靜態(tài)動態(tài)動態(tài)完全信完全信息息完全信息靜態(tài)博弈完全信息靜態(tài)博弈納什均衡(納什均衡()完全信息動態(tài)博弈完全信息動態(tài)博弈子博弈精練納什均衡子博弈精練納什均衡()不完全不完全信息信息不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈貝葉斯均衡(貝葉斯均衡(不完全信息動態(tài)博弈不完全信息動態(tài)博弈精煉貝葉斯均衡精煉貝葉斯均衡 2.2.7 博弈的分類博弈的分類 22囚徒困境囚徒困境(prisoners dilemma )

28、 乙的對策乙的對策甲甲的的對對策策合作合作(沉默)(沉默)背叛背叛(認(rèn)罪)(認(rèn)罪)合作合作(沉默)(沉默)(-1,-1)(-10,0)背叛背叛(交代)(交代)(0,-10)(-8,-8)完全信息靜態(tài)博弈完全信息靜態(tài)博弈空城計空城計 進攻進攻后退后退堅持堅持被擒被擒, ,大勝大勝0,0,1010逃脫逃脫, ,無勝無勝5 5,0,0逃跑逃跑被擒被擒, ,大勝大勝0,100,10逃脫逃脫, ,無勝無勝5,05,0諸葛亮諸葛亮司馬懿司馬懿不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈 走大路走大路走小路走小路守大路守大路被擒被擒10,10,0 0逃脫逃脫0 0,10,10守小道守小道逃脫逃脫0,100,10被擒

29、被擒10,010,0諸葛亮(關(guān)羽)諸葛亮(關(guān)羽)曹操曹操不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈曹操敗走華容道曹操敗走華容道相親相親王實甫王實甫張生和崔鶯鶯張生和崔鶯鶯 紅娘紅娘王實甫王實甫. .西廂記西廂記不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈完全信息動態(tài)博弈完全信息動態(tài)博弈黔之驢黔之驢黔驢技窮黔驢技窮 柳宗元柳宗元(唐)(唐)不完全信息不完全信息動態(tài)博弈動態(tài)博弈斗雞博弈斗雞博弈斗雞博弈斗雞博弈(Chicken Game)其實是一種誤譯。其實是一種誤譯。Chicken在美國口語中是在美國口語中是“懦夫懦夫”之意,之意,Chicken Game本應(yīng)譯成本應(yīng)譯成懦夫博弈懦夫博弈。不過這個錯誤并不。不過

30、這個錯誤并不算太嚴(yán)重,非要把算太嚴(yán)重,非要把chicken game叫作斗雞博弈,也不是不可以。叫作斗雞博弈,也不是不可以。試想有兩人狹路相逢,每人有兩個行動選擇:一是退下來,一是進試想有兩人狹路相逢,每人有兩個行動選擇:一是退下來,一是進攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這人就很丟攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這人就很丟面子;如果對方也退下來,雙方則打個平手;如果自己沒退下來,而對面子;如果對方也退下來,雙方則打個平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失?。蝗绻麅扇硕记斑M,那么則兩敗俱方退下來,自己則勝利,對方則失??;如果兩人都前進,

31、那么則兩敗俱傷。因此,對每個人來說,最好的結(jié)果是,對方退下來,而自己不退。傷。因此,對每個人來說,最好的結(jié)果是,對方退下來,而自己不退。贏利矩陣贏利矩陣(payoff matrix)如下:甲如下:甲/乙乙 前進前進 后退后退前進前進 (-2,-2) (1,-1)后退后退 (-1,1) (-1,-1)上表中的數(shù)字的意思是:兩者如果均選擇上表中的數(shù)字的意思是:兩者如果均選擇“前進前進”,結(jié)果是兩敗俱,結(jié)果是兩敗俱傷,兩者均獲得傷,兩者均獲得-2的支付;如果一方的支付;如果一方“前進前進”,另外一方,另外一方“后退后退”,前,前進者獲得進者獲得1的支付,贏得了面子,而后退者獲得的支付,贏得了面子,而

32、后退者獲得-1的支付,輸?shù)袅嗣孀?,的支付,輸?shù)袅嗣孀?,但沒有兩者均但沒有兩者均“前進前進”受到的損失大;兩者均受到的損失大;兩者均“后退后退”,兩者均輸?shù)袅?,兩者均輸?shù)袅嗣孀樱@得面子,獲得-1的支付。當(dāng)然表中的數(shù)字只是相對的值。的支付。當(dāng)然表中的數(shù)字只是相對的值。這個博弈有兩個純策略這個博弈有兩個純策略納什均衡納什均衡:一方前進,另一方后退;或一方:一方前進,另一方后退;或一方后退,另一方前進。但關(guān)鍵是誰進誰退?當(dāng)然,該博弈也存在一個混合后退,另一方前進。但關(guān)鍵是誰進誰退?當(dāng)然,該博弈也存在一個混合策略均衡,即大家隨機的選擇前進或后退。不過相對而言,我們更關(guān)注策略均衡,即大家隨機的選擇前進或

33、后退。不過相對而言,我們更關(guān)注于純策略均衡。一博弈,如果有惟一的納什均衡點,那么這個博弈是可于純策略均衡。一博弈,如果有惟一的納什均衡點,那么這個博弈是可預(yù)測的,即這個納什均衡點就是事先知道的惟一的博弈結(jié)果。但是如果預(yù)測的,即這個納什均衡點就是事先知道的惟一的博弈結(jié)果。但是如果一博弈有多個納什均衡,則要預(yù)測結(jié)果就必須附加另外的有關(guān)博弈的細一博弈有多個納什均衡,則要預(yù)測結(jié)果就必須附加另外的有關(guān)博弈的細節(jié)信息。比如,這里誰進誰退,可能就需要附加額外的細節(jié)信息才能做節(jié)信息。比如,這里誰進誰退,可能就需要附加額外的細節(jié)信息才能做出判斷。出判斷。 斗雞博弈斗雞博弈 斗雞博弈斗雞博弈(Chicken Ga

34、me) 試想有兩人試想有兩人(雞雞)狹路相逢,每人有兩個行狹路相逢,每人有兩個行動選擇:一是退下來,一是進攻。如果一方退動選擇:一是退下來,一是進攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這下來,而對方?jīng)]有退下來,對方獲得勝利,這人就很丟面子;如果對方也退下來,雙方則打人就很丟面子;如果對方也退下來,雙方則打個平手;如果自己沒退下來,而對方退下來,個平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失敗;如果兩人都前進,自己則勝利,對方則失??;如果兩人都前進,那么則兩敗俱傷。假設(shè)兩敗俱傷為那么則兩敗俱傷。假設(shè)兩敗俱傷為-2,贏的一,贏的一方為方為1,輸?shù)囊环綖?,輸?shù)囊环綖?1。

35、請用戰(zhàn)略式和擴展式。請用戰(zhàn)略式和擴展式寫出他們的表達方式。并說明納什均衡點。寫出他們的表達方式。并說明納什均衡點。斗雞博弈斗雞博弈 進進退退進進-2, -2-2, -21, -11, -1退退-1, 1-1, 1-1, -1-1, -1Chicken AChicken B完全信息動態(tài)博弈完全信息動態(tài)博弈行動次序行動次序信息信息靜態(tài)靜態(tài)動態(tài)動態(tài)完全信完全信息息完全信息靜態(tài)博弈完全信息靜態(tài)博弈納什均衡納什均衡()囚徒困境,周末約會囚徒困境,周末約會完全信息動態(tài)博弈完全信息動態(tài)博弈子博弈精練納什均衡子博弈精練納什均衡()田忌賽馬,破釜沉舟,田忌賽馬,破釜沉舟,昭君出塞昭君出塞不完全不完全信息信息不完

36、全信息靜態(tài)博弈不完全信息靜態(tài)博弈貝葉斯均衡貝葉斯均衡(不完全信息動態(tài)博弈不完全信息動態(tài)博弈精煉貝葉斯均衡精煉貝葉斯均衡 2.2.7 博弈的分類和均衡博弈的分類和均衡2.3.1 戰(zhàn)略式表達戰(zhàn)略式表達2.3.2 擴展式表達擴展式表達第三節(jié)第三節(jié) 博弈的表達方式博弈的表達方式2.3.1 戰(zhàn)略式表達戰(zhàn)略式表達 戰(zhàn)略式表達(戰(zhàn)略式表達(strategic representation),又稱標(biāo)準(zhǔn)式表達又稱標(biāo)準(zhǔn)式表達(normal from representation)。更適。更適合靜態(tài)博弈。用合靜態(tài)博弈。用支付矩陣支付矩陣表示。表示。 三個要素:三個要素: 1.博弈的參與人集合博弈的參與人集合 2.每

37、個參與人的戰(zhàn)略空間每個參與人的戰(zhàn)略空間 3.每個參與人的支付函數(shù)(由戰(zhàn)略組合每個參與人的支付函數(shù)(由戰(zhàn)略組合決定)決定)囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B案例:智豬博弈案例:智豬博弈(pigs game) 豬圈中有一頭大豬和一頭小豬,在豬圈的一豬圈中有一頭大豬和一頭小豬,在豬圈的一端設(shè)有一個按鈕,每按一下,位于豬圈另一端端設(shè)有一個按鈕,每按一下,位于豬圈另一端的食槽中就會有的食槽中就會有10單位的豬食進槽,但每按一單位的豬食進槽,但每按一下按鈕會耗去相當(dāng)于下按鈕會耗去相當(dāng)于2單位豬食的成本。如果大單位豬食的成本。如果大豬先到食槽,則大豬吃到豬先到食槽,則

38、大豬吃到9單位食物,小豬僅能單位食物,小豬僅能吃到吃到1單位食物;如果兩豬同時到食槽,則大豬單位食物;如果兩豬同時到食槽,則大豬吃吃7單位,小豬吃單位,小豬吃3單位食物;如果小豬先到,單位食物;如果小豬先到,大豬吃大豬吃6單位而小豬吃單位而小豬吃4單位食物。請用戰(zhàn)略式單位食物。請用戰(zhàn)略式和擴展式寫出他們的表達方式。并說明納什均和擴展式寫出他們的表達方式。并說明納什均衡點衡點智豬博弈智豬博弈 局中人:大豬,小豬局中人:大豬,小豬 策策 略:大豬:按,等待略:大豬:按,等待 小豬:按,等待小豬:按,等待 支付矩陣:支付矩陣:智豬博弈智豬博弈 按按等待等待按按等待等待小豬大豬完全信息靜態(tài)博弈完全信息

39、靜態(tài)博弈案例:田忌賽馬案例:田忌賽馬上中下上中下上下中上下中中上下中上下中下上中下上下上中下上中下中上下中上上中下上中下3,-31,-11,-11,-1- 1,1 1,-1上下中上下中1,-13,-31,-11,-11,-1- 1,1中上下中上下1,-1- 1,1 3,-31,-11,-11,-1中下上中下上- 1,1 1,-11,-13,-31,-11,-1下上中下上中1,-11,-11,-1- 1,1 3,-31,-1下上中下上中1,-11,-1- 1,1 1,-11,-13,-3田忌田忌齊威王齊威王2.3.2 擴展式表達擴展式表達 擴展式表達(擴展式表達(extensive form r

40、epresentation )。更適合動態(tài)博弈。用)。更適合動態(tài)博弈。用博博弈樹弈樹來表示來表示 六個要素:六個要素: 1.博弈的參與人集合博弈的參與人集合 2. 參與人的行動順序參與人的行動順序 3. 參與人的戰(zhàn)略行動空間參與人的戰(zhàn)略行動空間 4. 參與人的信息集參與人的信息集 5.參與人的支付函數(shù)參與人的支付函數(shù) 6.外生事件(即自然選擇)的概率分布)外生事件(即自然選擇)的概率分布)博弈樹的基本建筑材料博弈樹的基本建筑材料1 1.結(jié)(結(jié)(nodes): 2.枝枝(branches): 3.信息集信息集(information sets)博弈樹的基本建筑材料博弈樹的基本建筑材料1 1.結(jié)(

41、結(jié)(nodes): 初始結(jié)(初始結(jié)(begining nodes ) 決策結(jié)(決策結(jié)(decision nodes ) 終點結(jié)(終點結(jié)(terminal nodes ) 博弈從空心圓開始,空心圓表示開始決策,博弈從空心圓開始,空心圓表示開始決策,A選擇后,博弈進入標(biāo)有選擇后,博弈進入標(biāo)有B的實心圓。的實心圓。 初始結(jié)用初始結(jié)用 其他決策結(jié)用其他決策結(jié)用博弈樹的基本建筑材料博弈樹的基本建筑材料2 2.枝枝(branches):是從一個決策結(jié)到:是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,某一個枝代它的直接后續(xù)結(jié)的連線,某一個枝代表參與人的一個行動選擇。表參與人的一個行動選擇。博弈樹的基本建筑材料博弈樹

42、的基本建筑材料2 3.信息集信息集(information sets):某個參與人某個參與人都知道些什么。信息集是用來標(biāo)注某個人都知道些什么。信息集是用來標(biāo)注某個人知道些什么信息的,不同的標(biāo)注表示這個知道些什么信息的,不同的標(biāo)注表示這個人知道不同的信息。人知道不同的信息。博弈樹上的所有決策結(jié)分割成不同的信息集。每博弈樹上的所有決策結(jié)分割成不同的信息集。每一個信息集是決策結(jié)集合的一個子集,該子集一個信息集是決策結(jié)集合的一個子集,該子集包括所有滿足下列條件的決策結(jié)。包括所有滿足下列條件的決策結(jié)。 (1)每一個決策結(jié)都是同一個參與人的決)每一個決策結(jié)都是同一個參與人的決策結(jié)策結(jié) (2)該參與人知道博

43、弈進入該集合的某個該參與人知道博弈進入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決決策結(jié),但不知道自己究竟處于哪一個決策結(jié)策結(jié)2.3.2 擴展式表達擴展式表達坦白坦白坦白不坦白不坦白(-8,-8)(0,-10)不坦白坦白坦白囚徒困境囚徒困境不坦白不坦白(-10,0)(-1,-1)ABB案例案例 案例一:姑娘案例一:姑娘(girl)愛上小伙子,父親愛上小伙子,父親(father)不同意。威脅說,如果分手,)不同意。威脅說,如果分手,我們還是好父女,兩人和好;如果嫁給小我們還是好父女,兩人和好;如果嫁給小伙子,那就一刀兩斷?;镒樱蔷鸵坏秲蓴?。 局中人:姑娘局中人:姑娘(girl) ,父親(,

44、父親(father) 策策 略:略: girl:分手,不分手:分手,不分手 father :和好,不和好:和好,不和好 支付矩陣:支付矩陣:2.3.2 擴展式表達擴展式表達girl不分手不分手和好和好不和好不和好father(2,1)(1,0)father分手分手和好和好父女威脅父女威脅不和好不和好(1,1)(0,0) 和好和好不和好不和好分手分手1, 11, 10,00,0不分不分手手2, 12, 11, 01, 0girlfather 有兩家房地產(chǎn)公司,決定是否開發(fā)房地產(chǎn)。有兩家房地產(chǎn)公司,決定是否開發(fā)房地產(chǎn)。 需求大,開發(fā)需求大,開發(fā)者者利潤利潤8千萬,千萬,不開發(fā)者不開發(fā)者利潤利潤0。

45、 需求大,需求大,兩者都開發(fā)兩者都開發(fā)利潤各為利潤各為4千萬。千萬。 需求小,開發(fā)需求小,開發(fā)者者利潤利潤1千萬,千萬,不開發(fā)者不開發(fā)者利潤利潤0。 需求小,需求小,兩者都開發(fā)兩者都開發(fā)利潤各為利潤各為-3千萬千萬 兩者都兩者都不開發(fā)利潤各為不開發(fā)利潤各為0。博弈樹:房地產(chǎn)開發(fā)博弈I博弈樹:房地產(chǎn)開發(fā)博弈IA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4博弈樹:不允許的情形博弈樹:不允許的情形博弈樹的基本建筑材料博弈樹的基本建筑材料2

46、 3.信息集信息集(information sets):某個參與人某個參與人都知道些什么。信息集是用來標(biāo)注某個人都知道些什么。信息集是用來標(biāo)注某個人知道些什么信息的,不同的標(biāo)注表示這個知道些什么信息的,不同的標(biāo)注表示這個人知道不同的信息。人知道不同的信息。博弈樹上的所有決策結(jié)分割成不同的信息集。每博弈樹上的所有決策結(jié)分割成不同的信息集。每一個信息集是決策結(jié)集合的一個子集,該子集一個信息集是決策結(jié)集合的一個子集,該子集包括所有滿足下列條件的決策結(jié)。包括所有滿足下列條件的決策結(jié)。 (1)每一個決策結(jié)都是同一個參與人的決)每一個決策結(jié)都是同一個參與人的決策結(jié)策結(jié) (2)該參與人知道博弈進入該集合的某

47、個該參與人知道博弈進入該集合的某個決策結(jié),但不知道自己究竟處于哪一個決決策結(jié),但不知道自己究竟處于哪一個決策結(jié)策結(jié)博弈樹:房地產(chǎn)開發(fā)博弈IA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4另一種描述:房地產(chǎn)開發(fā)博弈IN 大(1/2) 小(1/2) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) A A B1 B2 B

48、3 B4信息集:房地產(chǎn)博弈信息集:房地產(chǎn)博弈IIA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4信息集:房地產(chǎn)博弈信息集:房地產(chǎn)博弈IIIA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4第二種描述:房地產(chǎn)開發(fā)博弈IIIN 大(1/2) 小(1/2) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)

49、開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) A A B1 B2 B3 B4第三種描述:房地產(chǎn)博弈房地產(chǎn)博弈IVN 大 小 開 不開 開 不開開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) (0,0) B1 B2 A1 A2 A3 A4囚徒困境囚徒困境 A 坦白坦白 抵賴抵賴 坦白坦白 抵賴抵賴 B B坦白坦白 抵賴抵賴(-8,-8) (0,-10) (-10,0) (-1,-1) B 坦白坦白 抵賴抵賴 坦白坦白

50、 抵賴抵賴 坦白坦白 抵賴抵賴 (-8,-8) (0,-10) (-10,0) (-1,-1)A A囚徒困境囚徒困境 A 坦白坦白 抵賴抵賴 坦白坦白 抵賴抵賴 B B坦白坦白 抵賴抵賴(-8,-8) (0,-10) (-10,0) (-1,-1) B 坦白坦白 抵賴抵賴 坦白坦白 抵賴抵賴 坦白坦白 抵賴抵賴 (-8,-8) (0,-10) (-10,0) (-1,-1)A A2.4.1 靜態(tài)博弈靜態(tài)博弈2.4.2 動態(tài)博弈動態(tài)博弈第四節(jié)第四節(jié) 如何尋找博弈的均衡點如何尋找博弈的均衡點納什均衡納什均衡納什均衡的定義納什均衡的定義 對于一個給定的策略組合,如果各博弈方都對于一個給定的策略組合,

51、如果各博弈方都沒有單獨改變策略組合的意愿,則稱該策略組沒有單獨改變策略組合的意愿,則稱該策略組合為納什均衡合為納什均衡.納什均衡的一致預(yù)測性質(zhì)納什均衡的一致預(yù)測性質(zhì) 各博弈方都能預(yù)測到,并且能預(yù)測到其他博各博弈方都能預(yù)測到,并且能預(yù)測到其他博弈方能預(yù)測到,能預(yù)測到其他博弈方也能預(yù)測弈方能預(yù)測到,能預(yù)測到其他博弈方也能預(yù)測到自己能預(yù)測到到自己能預(yù)測到.完全信息靜態(tài)博弈納什均衡完全信息靜態(tài)博弈納什均衡 各博弈方同時決策,且所有博弈方各博弈方同時決策,且所有博弈方對博弈中的各種情況下的得益都完全了對博弈中的各種情況下的得益都完全了解的博弈問題。解的博弈問題。 1.1.基本分析思路和方法基本分析思路和

52、方法 2.2.納什均衡納什均衡 3.3.無限策略博弈分析無限策略博弈分析1.1.基本分析思路和方法基本分析思路和方法1 優(yōu)勢策略均衡優(yōu)勢策略均衡2 箭頭法箭頭法3 畫線法畫線法4 嚴(yán)格劣勢反復(fù)消去法嚴(yán)格劣勢反復(fù)消去法1 優(yōu)勢策略均衡優(yōu)勢策略均衡 不管其他博弈方選擇什么策略,一博不管其他博弈方選擇什么策略,一博弈方的某個策略給他帶來的得益始終高于弈方的某個策略給他帶來的得益始終高于其他策略,就稱此策略為其他策略,就稱此策略為“優(yōu)勢優(yōu)勢” 一策略組合中的策略都是博弈方的優(yōu)一策略組合中的策略都是博弈方的優(yōu)勢策略,則稱該策略為勢策略,則稱該策略為“優(yōu)勢策略均衡優(yōu)勢策略均衡” 如如“囚徒困境囚徒困境”2

53、 箭頭法箭頭法 思路是:判斷各博弈方能否通過單獨改思路是:判斷各博弈方能否通過單獨改變自己的策略而改善自己的得益,如能,則變自己的策略而改善自己的得益,如能,則引一箭頭。對可能的策略組合都考察過后,引一箭頭。對可能的策略組合都考察過后,根據(jù)箭頭反映的情況來判斷博弈的結(jié)果。根據(jù)箭頭反映的情況來判斷博弈的結(jié)果。犯人A犯人B坦白坦白不坦白不坦白坦白坦白-10,-100,25不坦白不坦白25,01,1 按按等待等待按按5,15,14,44,4等待等待9,-19,-10,00,0小豬大豬 足球足球演唱會演唱會足球足球2 2,1 10 0,0 0演唱會演唱會1 1,1 11 1,2 2王菲李亞鵬 某策略組合只有指向的箭頭,沒有某策略組合只有指向的箭

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論