管理中的博弈分析_第1頁
管理中的博弈分析_第2頁
管理中的博弈分析_第3頁
管理中的博弈分析_第4頁
管理中的博弈分析_第5頁
已閱讀5頁,還剩217頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、課程要求 課程目標(biāo):樹立雙贏的現(xiàn)代經(jīng)營觀念,理解行為相互作用的各種表現(xiàn),掌握分析多利益主體決策的方法,培養(yǎng)認(rèn)識事物本質(zhì)的敏銳視角、提高把握機(jī)會與分寸的能力。 要求認(rèn)真聽課,積極參與案例討論,預(yù)先做好課前的教材與資料閱讀,及時完成課后作業(yè)。教 材:謝識予經(jīng)濟(jì)博弈論,入門,復(fù)旦出版社參考書:弗登博格博弈論,手冊,人民大學(xué)出版社張維迎博弈論與信息經(jīng)濟(jì)學(xué),參考,上海人民出版社吉本斯博弈論基礎(chǔ),簡潔,中國社會科學(xué)出版社奧斯本博弈論教程,深刻,中國社會科學(xué)出版社拉斯繆森博弈與信息,基礎(chǔ),北大出版社麥克米蘭市場演進(jìn)的故事,精彩,中信出版社1.博弈論(game theory)多利益主體的決策理論 什么是博弈論

2、?古語有云,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上布一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 “出棋” 招數(shù)中理性化、邏輯化的部分,并將其系統(tǒng)化為一門科學(xué)。換句話說,就是研究個體如何在錯綜復(fù)雜的相互影響中得出最合理的策略。 博弈研究的是存在外部相互作用條件下的個人選擇問題的理論 不僅需要考慮個人選擇,更應(yīng)考慮別人如何進(jìn)行選擇示例:三人槍擊的最優(yōu)決策示例:三人槍擊問題與三國啟示(80%)(60%)(40%)現(xiàn)代社會是一個錯綜復(fù)雜的組織,可以看成是一個需要在許多層面上行為協(xié)調(diào)的系統(tǒng)。在分工合作的社會里,

3、了解行為相互作用的機(jī)理,研究行為決策的理論對每一個個體都具有重要意義。博弈論在經(jīng)濟(jì)分析的應(yīng)用最成功、最廣泛博弈論在軍事、社會、心理、貿(mào)易、管理等諸多領(lǐng)域有著越來越廣泛的應(yīng)用。2.博弈論的價值(分析工具)“學(xué)而優(yōu)則仕”:高考改革 自古以來,人才選拔一直是提升組織競爭力和維護(hù)長治久安的基礎(chǔ)性工作; 盡管科舉制度備受批判,但不可抹殺其在中華文明傳承中所起的作用; 現(xiàn)代高考制度已經(jīng)歷了學(xué)校自主招生到國家統(tǒng)一考試,再到分省市考試,又回到自主招生考試的循環(huán),其中的利益分析耐人尋味。研究的熱點(diǎn)主題取決于研究的興趣和現(xiàn)實(shí)的需求,受制于以研究工具為基礎(chǔ)的研究能力 博弈分析工具的出現(xiàn)促使經(jīng)濟(jì)與管理的論題:(1)越

4、來越轉(zhuǎn)向個體經(jīng)濟(jì)行為研究(2)越來越轉(zhuǎn)向人與人的關(guān)系的研究(3)越來越重視信息不對稱時,個人選擇、制度安排的研究。3.博弈給社會科學(xué)研究帶來的變化4、博弈論為什么會成為主流的分析工具? 第一,無處不在的利益沖突導(dǎo)致現(xiàn)實(shí)需求 第二,量變到質(zhì)變的工具性突破 第三,人間世態(tài)絕好的解釋能力 第四,定量與定性的有機(jī)結(jié)合 第五,行為、效用和信息等因素的巧妙綜合 第六,促進(jìn)了各學(xué)科之間的融合 第七,推進(jìn)人文學(xué)科的闊步發(fā)展(1)前提假設(shè)的合理性(2)預(yù)測的可靠性(3)多重均衡的擇優(yōu)原則(4)共用知識、共同知識的界定(臟臉博弈)(5)博弈均衡解的穩(wěn)定性(蜈蚣博弈 悖論)d(97,100)(100,100)(1,

5、1)D(0,3)(2,2)(98,98)(99,99)(98,101)BAVABAB5.博弈理論應(yīng)用中的相關(guān)問題(1)前提假設(shè)的合理性理論的價值:抽象和歸納、演繹與推理學(xué)術(shù)訓(xùn)練的意義分析基礎(chǔ):綜述的價值預(yù)測是規(guī)律總結(jié)基礎(chǔ)上對未來的判斷準(zhǔn)確預(yù)測的前提:因素把握準(zhǔn)確程度外在環(huán)境的變化程度趨勢把握的可靠程度(2)預(yù)測的可靠性模型解的應(yīng)用價值解的精度對應(yīng)用的影響多重解的選擇問題(3)多重均衡問題5,10,04,41,5甲U DL 乙R 合作的困境臟臉博弈三人臉上均有墨跡,但自己無法看清自己臉上是否干凈老師問:臉黑的請舉手結(jié)果如何?如果老師提示:你們?nèi)水?dāng)中至少有一人臉是黑的,那么臉黑的請舉手結(jié)果又如何

6、?(4)共用知識、共同知識的界定解的穩(wěn)定性問題:Chaos蜈蚣博弈 悖論多階段博弈的短期利益和長期利益d(97,100)(100,100)(1,1)D(0,3)(2,2)(98,98)(99,99)(98,101)BAVABAB(5)博弈均衡解的穩(wěn)定性第一部分、博弈的基本概念 博弈論的研究方法和其他許多利用數(shù)學(xué)工具研究社會經(jīng)濟(jì)現(xiàn)象的學(xué)科一樣,都是從復(fù)雜的現(xiàn)象中抽象出基本的元素,對這些元素構(gòu)成的數(shù)學(xué)模型進(jìn)行分析,而后逐步引入對其形勢產(chǎn)影響的其他因素,從而分析其結(jié)果?;诓煌瑢ο螅┺男纬扇N表述方式,標(biāo)準(zhǔn)型、擴(kuò)展型和特征函數(shù)型。利用這三種表述形式,可以研究形形色色的問題,因此,它被稱為“社會科學(xué)

7、的數(shù)學(xué)”。 從理論上講,博弈論是研究理性的行動者相互作用時的決策理論,其思想和方法已被經(jīng)濟(jì)學(xué)、政治學(xué)、社會學(xué)等各門社會科學(xué)所應(yīng)用。 1)規(guī)則2)結(jié)果3)策略4)相互作用1、構(gòu)成博弈的共同特征(1) 參與者(2) 博弈方的選擇(方案)(3) 博弈的次序(4) 得益2.構(gòu)成博弈的要素1) 單人博弈確定性決策不確定性決策多目標(biāo)決策群體決策3、博弈中的參與者(Player)2) 雙人博弈 *并非總是對抗 *信息多并不一定得益多 *個體理性并不一定導(dǎo)致群體理性3) 多人博弈: 干擾均衡倫敦奧運(yùn)會申奧得票進(jìn)程數(shù)據(jù)倫敦巴黎馬德里紐約莫斯科22212019155450272532163933314.博弈中的策

8、略(Strategy) 決策是一個策略選擇的過程,關(guān)鍵在于:(1)你有哪些可行選擇;(2)對于選擇策略的條件和最終結(jié)果的判斷;(3)你準(zhǔn)備做出怎樣的選擇。 策略表達(dá)的方式:有限策略用枚舉法 無限策略用表達(dá)式天下熙熙皆為利來,天下攘攘皆為利往優(yōu)化得益是個體決策的目標(biāo),明確得益是博弈分析的基礎(chǔ)既然博弈得益是策略相互作用的結(jié)果,探究得益與博弈策略之間的關(guān)系是博弈分析的核心問題!根據(jù)得益區(qū)分的博弈類型:(1) 零和博弈(2) 常和博弈(3) 變和博弈 5.博弈中的得益(Profit) 博弈中的得益大多是以效用的形式出現(xiàn),效用的測定是博弈分析的前提; 博弈中的得益通常不僅是共同知識,也更多是公用的知識;

9、 博弈中的得益結(jié)構(gòu)影響了博弈的類型,也影響了博弈分析的方法; 即使是不對稱信息的博弈,也需假定博弈的得益是可以預(yù)計和猜測的。博弈特別講究的是決策的次序,它象征著決策者的實(shí)力地位,表明決策者掌握的主動權(quán),代表決策過程中的不同心境。(1) 靜態(tài)博弈(2) 動態(tài)博弈(3) 重復(fù)博弈 (誠信對交易的重要性) 6.博弈中的次序(Order) 不完美信息 結(jié)果已知、進(jìn)程未知 不完全信息7.博弈方的信息(Information)掌握一定量的信息是博弈方計算得失的基本前提,為了提高決策的科學(xué)性,博弈的當(dāng)事者必須清楚地掌握有關(guān)博弈規(guī)則、參與者、類型、決策偏好、方案、進(jìn)程等若干信息。其中尤為重要的是對信息的理解和

10、信息的交換年薪40萬面試題:老師的生日是下面十天中的一天:3.4 3.5 3.8 6.4 6.7 9.1 9.5 12.1 12.2 12.8老師將自己出生的月份告訴給小明,將日子告訴了小強(qiáng)然后老師問兩位愛徒能否推算出自己的生日小明:若我不知,小強(qiáng)肯定也不會知道小強(qiáng):本來我不知,現(xiàn)在我知道了小明:那我也知道了請問老師的生日是哪天?分析:M = 3 6 9 12D = 1 2 4 5 7 8雙方的行為表現(xiàn)和有限的信息交流至關(guān)重要小明的信息明確縮小了討論的范圍而小強(qiáng)的回答則明確作了定位 3.4 3.5 3.8 6.4 6.7 9.1 9.512.1 12.2 12.8第二部分:完全信息靜態(tài)博弈 完

11、全信息靜態(tài)博弈的特征完全信息靜態(tài)博弈的特征同時行動 每個參與者獨(dú)立選擇.完全信息 每個參與者的策略和相應(yīng)收益是共用知識.關(guān)于參與者的假定 完全理性 參與者的目標(biāo)皆為最大化收益 參與者能正確分析和判斷 每個參與者都知道對方是理性的完全信息靜態(tài)博弈的特征同時行動 每個參與者獨(dú)立選擇.完全信息 每個參與者的策略和相應(yīng)收益是共用知識.關(guān)于參與者的假定 完全理性 參與者的目標(biāo)皆為最大化收益 參與者能正確分析和判斷 每個參與者都知道對方是理性的經(jīng)典模型: 囚徒困境兩個同案的犯罪嫌疑人被隔離審訊,但卻沒有足夠證據(jù)指證他們的罪行兩個嫌疑人被告知了以下的政策: 如果沒有人坦白,雙方都將被監(jiān)禁一個月. 如果雙方都

12、坦白,雙方都將被監(jiān)禁六個月. 如果只有一方坦白, 則坦白方將被釋放而被供出一方則會被監(jiān)禁九個月. -1 , -1-9 , 0 0 , -9-6 , -6Prisoner 1Prisoner 2ConfessMumConfessMum經(jīng)典模型:性別戰(zhàn) Chris 和 Pat 需要選擇一個項(xiàng)目共渡周末. 雙方都知道:Chris 偏愛歌劇.Pat 偏愛拳擊. 2 , 1 0 , 0 0 , 0 1 , 2ChrisPatPrize FightOperaPrize FightOpera經(jīng)典模型: 猜硬幣參與者1拋硬幣讓參與者2猜. 雙方采用以下規(guī)則:如果參與者2猜對,則硬幣歸參與者2. 如果參與者2猜

13、錯,則參與者2必須付出一枚硬幣. -1 , 1 1 , -1 1 , -1-1 , 1Player 1Player 2TailHeadTailHead一、博弈的標(biāo)準(zhǔn)式表示 所謂的博弈的標(biāo)準(zhǔn)式通俗的講就是描述式定義: 博弈的標(biāo)準(zhǔn)式表示 博弈的標(biāo)準(zhǔn)式有以下內(nèi)容構(gòu)成:有限參與者集 1, 2, ., n,參與者的策略 S1 S2 . Sn 和得益 u1 u2 . un where ui : S1 S2 . SnR.完全信息靜態(tài)博弈的要素: 參與者的集合 (至少兩人) 每個參與者的策略或行動集合 參與者的得益 Player 1, Player 2, . Player n S1 S2 . Snui(s1,

14、 s2, .sn), 對所有的 s1 S1, s2 S2, . sn Sn.雙人博弈的標(biāo)準(zhǔn)式 收益矩陣表示 兩個參與者: 參與者 1和參與者2 每個參與者均只有有限策略 示例:S1=s11, s12, s13 S2=s21, s22Player 2s21s22Player1s11u1(s11,s21), u2(s11,s21)u1(s11,s22), u2(s11,s22)s12u1(s12,s21), u2(s12,s21)u1(s12,s22), u2(s12,s22)s13u1(s13,s21), u2(s13,s21)u1(s13,s22), u2(s13,s22)囚徒困境的標(biāo)準(zhǔn)式表示

15、:參與者的集合:Prisoner 1, Prisoner 2策略集合: S1 = S2 = Mum, Confess收益函數(shù): u1(M, M)=-1, u1(M, C)=-9, u1(C, M)=0, u1(C, C)=-6;u2(M, M)=-1, u2(M, C)=0, u2(C, M)=-9, u2(C, C)=-6-1 , -1-9 , 0 0 , -9-6 , -6Prisoner 1Prisoner 2ConfessMumConfessMum參與者策略得益性別戰(zhàn)的標(biāo)準(zhǔn)式表示:標(biāo)準(zhǔn)式表示: 參與者集: Chris, Pat (=Player 1, Player 2) 策略集: S1

16、 = S2 = Opera, Prize Fight 收益函數(shù): u1(O, O)=2, u1(O, F)=0, u1(F, O)=0, u1(F, O)=1; u2(O, O)=1, u2(O, F)=0, u2(F, O)=0, u2(F, F)=2 2 , 1 0 , 0 0 , 0 1 , 2ChrisPatPrize FightOperaPrize FightOpera猜硬幣的標(biāo)準(zhǔn)式表示:標(biāo)準(zhǔn)式表示: 參與者集:Player 1, Player 2 策略集: S1 = S2 = Head, Tail 收益函數(shù): u1(H, H)=-1, u1(H, T)=1, u1(T, H)=1,

17、 u1(H, T)=-1; u2(H, H)=1, u2(H, T)=-1, u2(T, H)=-1, u2(T, T)=1-1 , 1 1 , -1 1 , -1-1 , 1Player 1Player 2TailHeadTailHead二、博弈求解 “坦白”對雙方來說總是占優(yōu)策略所謂占優(yōu)策略就是不管對手策略如何,存在某一策略其收益比其他策略的收益都高。-1 , -1-9 , 0 0 , -9-6 , -6Prisoner 1Prisoner 2ConfessMumConfessMumPlayersStrategiesPayoffs(1,0)(1,2)(0,3)(0,1)上下左右(0,1)(

18、2,0)中重復(fù)剔除嚴(yán)格劣戰(zhàn)略 Iterated elimination of strictly dominated strategies: an example 1 , 0 1 , 2 0 , 1 0 , 3 0 , 1 2 , 0Player 1Player 2MiddleUpDownLeft 1 , 0 1 , 2 0 , 3 0 , 1Player 1Player 2MiddleUpDownLeftRight應(yīng)用示例波斯灣美伊的導(dǎo)彈與防御博弈 I點(diǎn)的一艘伊朗艦艇準(zhǔn)備向A點(diǎn)的美國軍艦發(fā)射導(dǎo)彈,導(dǎo)彈可以直行,也可以拐彎, A點(diǎn)的美國軍艦同時發(fā)射兩枚攔截導(dǎo)彈,速度與伊導(dǎo)彈速度相同,燃料只夠飛三

19、格,導(dǎo)彈中途相遇則爆炸,導(dǎo)彈飛行路線可事先設(shè)定,試求美艦的安全策略ABCDEFGHIIFCBIFEBIFEDIFEHIHGDIHEDIHEBIHEFABCFHOOOOOOHABEFOHHHOHHHABEHOHHHOHHHABEDOHHHHHHHADGHOOOHHOOOADEHOHHHOHHHADEFOHHHOHHHADEBHHHHOHHHI1-IFCBI5-IHGDA4-ABEDOHA8-ADEBHO通過重復(fù)消除法,可得到簡化的得益矩陣通過重復(fù)消除法,可得到簡化的得益矩陣Nash均衡 定義: n個參與者的標(biāo)準(zhǔn)式, 博弈G中, 如果戰(zhàn)略組合 S*1 Sn* 滿足對每一個參與者 i,Si*是針對其

20、它 n-1 個參與者所選戰(zhàn)略 S*1Si*1Si*1Sn* 的最優(yōu)反應(yīng)戰(zhàn)略。 即ui ( S*1Si*Sn* ) ui ( S*1SiSn* ) NiSiSi, 稱 S*1Sn* 為博弈的Nash均衡。 三、博弈均衡最佳反應(yīng)函數(shù)求Nash均衡 左中右上(0,4)(4,0)(4,0)中(4,0)(0,4)(5,3)下(3,5)(3,5)(6,6) 劃線法的對應(yīng)規(guī)則是: 參與者1有最優(yōu)法則f:S1 S2 參與者2有最優(yōu)法則g:S2 S1 f(左)= 中 f(中)= 上 f(右)= 下 g(上)= 左 g(中)= 中 g(下)= 右左中右上(0,4)(4,0)(4,0)中(4,0)(0,4)(5,3

21、)下(3,5)(3,5)(6,6)性 質(zhì)1.在n個 參 與 者 的 標(biāo) 準(zhǔn) 式 博 弈G中 , 如 果 重 復(fù) 剔 除 嚴(yán) 格 劣 戰(zhàn) 略剔 除 掉 除 了 S*1Sn* 以 外 的 所 有 策 略 , 則 S*1Sn* 為 該 博 弈 的唯 一 的Nash均 衡 。 性 質(zhì)2.在n 個 參 與 者 的 標(biāo) 準(zhǔn) 式 博 弈G中 , 如 果 S*1Sn* 是 一 個Nash均 衡 , 則 它 不 會 被 重 復(fù) 剔 除 嚴(yán) 格 劣 戰(zhàn) 略 所 剔 除 。 四、博弈應(yīng)用:智豬博弈 一大一小兩頭豬住在一間現(xiàn)代化的居室中,每按動一下按鈕,食槽都會滾出10個蘿卜,食槽與按鈕有一定距離,按者需支付2個單位

22、成本,如果大豬先吃,分配為(9,1),小豬先吃份額(6,4),同時開吃則為(7,3)大豬5,14,49,-10,0按 等待 按等待小豬現(xiàn)實(shí)中的智豬博弈: 石油輸出國組織的勾心斗角 公共設(shè)施建設(shè)和維護(hù)中的“搭便車”現(xiàn)象; 企業(yè)產(chǎn)品開發(fā)和市場開拓的決策問題; 大小股東對企業(yè)的投入與監(jiān)督問題。eg.C ournot duopoly P74 P75 企 業(yè) 1、 2, 生 產(chǎn) 同 質(zhì) 產(chǎn) 品 , 產(chǎn) 量 分 別 為 q1, q2, Q = q1+q2 P(Q )=a-Q ; Ci(qi)=cqi (ca) 參 與 者 : 企 業(yè) 1、 2 策 略 空 間 :,0qi 利 潤 :)(,(caqqqqqj

23、iijii (91(31)(21)(21)(210*2*1*2*1*1*2*2*1cacacacacaqqqqqqqqqjiii Cournot Duopolyeg.最后要價仲裁 二種:一是最后要價仲裁,從雙方要價中選擇一個 二是協(xié)議仲裁 工資:企業(yè) Wj 5763 所以個體理性未必能達(dá)到集體理性,所以政府管制必要 1,11,11,11,11正 r反 1- r正 q2反 1-q五、混合策略均衡此博弈不存在純策略均衡 參與人 1 以概率 r 正;1-r 反 參與人 2 以概率 q 正;1-q 反 使期望效用最大 )1)(1 ()1 ()1 (1qrqrqrrqEU )42() 12(qrq )1

24、)(1 ()1 ()1 (2qrqrqrrqEU 02404221rqEqrEUU2121rq 定義:對標(biāo)準(zhǔn)式博弈 G假設(shè)1SSSikii,那么參與者 i 的一個混合戰(zhàn)略是指其概率分布1,11kjijikiipppp; 監(jiān)督博弈 P109 代理人:工作 w,付出 g,得到效用 w-g, 偷懶 S,付出 0,得到效用 w 委托人:付出工資(wg) 檢查:I 費(fèi)用 h 懲罰扣工資 不檢查:N 費(fèi)用 0 假定代理人工作 委托人得益 v vwg 得益矩陣為: 0,-h w,-w w-g,vw-h w-g,v-w 1 X s 1-X w y I 2 1-y N 監(jiān)督博弈假定代理人(x,1-x), 委托人

25、(y,1-y) )(1)(1 ()()1 ()1 ()(1)(1 ()()1 ()1 (21wvyxhwvyxwyxxyhEgwyxgwyxwyxEUU 0)(1 ()(1 (0)()1 (21wvxhwvxxwxhyEgwywxEUUwhwgxy* 確定最優(yōu)工資,使得委托人期望收益提高 將(x*,y*)代入得wwhvEU)1 (*2 hvhvwwwu*2*21 博弈應(yīng)用:吉蒂謀殺案 紐約的吉蒂在自己的家中,光天化日之下被歹徒殘暴殺害,她的38位鄰居都目睹了這一幕卻無一人報警,社會心理學(xué)家對此大加批判,但經(jīng)濟(jì)學(xué)家拉斯繆森卻給出另外的解釋。鄰居10,010,77,107,7旁觀 r報警 1-r鄰

26、居2旁觀 r報警 1-r 對于每一個局中人,他考慮其他N個參與者的決策,假定每個人的決策獨(dú)立同分布。 10(1-r )=7 r =0.3 lim r =lim (0.3) =1鄰居i0,-10,-7,-7,-旁觀 r報警 1-r其他鄰居無人報警 r有人報警 1-rN-1N-1N-1N-11/N-1NN定理:在 n 個參與者的標(biāo)準(zhǔn)式博弈 G=S1Sn,u1un中如果 n 是有限的且對每個 i,Si是有限的,則博弈存在至少一個 Nash 均衡,均衡可能包含混合戰(zhàn)略。Nash 均衡存在定理 說明:Best-response Correspondence r1(q2) r2(q1) 如果)(),(*1

27、2*2*21*1qrqqrq 存在交點(diǎn))(,*12*2*1qrqq 考察一個動態(tài)的逼近過程: )(1qrqtjiti 產(chǎn)生一個序列:qqqqqqnn2120211101, 向量形式:記)()(),(),(111212121qqrqrqqqttttttf 歸結(jié)為:是否存在)(*qqf,則均衡存在 不動點(diǎn)問題 Nash 均衡的討論 P120 eg.懦夫博弈 -1,-1 2,1 1,2 0,0 1 T W T 2 W 兩個純策略,很難判斷誰最優(yōu),(T,W),(W,T)聚焦原則:focus六、多重均衡的討論六、多重均衡的討論9,90,88,07,71UDL2R風(fēng)險占優(yōu):純策略(9,9),(7,7),風(fēng)

28、險原則,看似(9,9)更好,但要冒很大風(fēng)險pareto最優(yōu):防聯(lián)盟原則:eg,三人博弈 0,0,10 -5,-5,0 -5,-5,0 1,1,-5 甲 U x D 1-x L y 乙 R 1-y -2,-2,0 -5,-5,0 -5,-5,0 -1,-1,5 1 U D L 乙 R z 1-z A B 丙 Nash均衡:(ULA) (DRB) (ULA) pareto最優(yōu)若丙選A,則對于甲、乙:0,0-5,-5-5,-51,1甲UDL乙R則(DR) pareto最優(yōu)若甲、乙聯(lián)手選DR,則丙收益由10到-5,丙損失了15若要丙去選擇,丙會選(DRB),這就是防聯(lián)盟原則相關(guān)均衡 通過外界信號獲得5

29、,10,04,41,5甲U xD1-xL y乙R 1-y純策略均衡為(UL)和(DR) 混合策略:)1)(1 (5)1 (4)1)(1 ()1 (4521yxyxxyEyxyxxyEUU 0021yExEUU2121yx 5 . 25 . 221UUEE (1)擲硬幣 ),(2121 ),反(),正(RDLU 35211213121521),( 33 得益(2)甲、乙分隔兩處,由丙抽 A、B、C,概率均為31 若丙抽到 A,告訴甲 若丙抽到 C,告訴乙 若丙抽到 B,兩個都不告訴 甲:告訴 A,取 U (B,C) ,取 D 乙:告知 C,取 R (A,B) ,取 L 3103103143153

30、121,UUEE 在不同的準(zhǔn)則下,均衡會改變,得益會改變 三個博弈: 純 策 略 均 衡 D LA 扔 硬 幣 若 甲 與 乙 可 以 觀 察 到 正 ( H ) 、 反 ( T) , 丙 看 不 到 甲 : 若 H , 取 U ; 若 T, 取 D 乙 : 若 H , 取 L; 若 T, 取 R 丙 無 論 如 何 均 取 B 取 U L、 D R 的 概 率 為21 丙 取 A , 取 B、 取 C 的 期 望 盈 利 分 別 為23223, 若 丙 可 以 看 到 , 就 不 會 選 B 了 。 乙AB丙0,1,30,0,01,1,11,0,0甲UDLR2,2,20,0,02,2,02,

31、2,2LR0,1,00,0,01,1,01,0,3LRC 分金幣博弈: 5個人分100個金幣,每一枚都是一樣的大小和價值。 規(guī)則如下: 1先是抽簽來決定自己的號碼(1,2,3,4,5) 2接下來首先由抽得1號的人提出分配方案,然后大家5人進(jìn)行表決,“當(dāng)且僅當(dāng)”超過了半數(shù)的人同意時,按照他的提案進(jìn)行分配,否則將被處死。 3如果1號被處死,由2號提出分配方案,然后剩下的這4人進(jìn)行表決,還是“當(dāng)且僅當(dāng)”超過了半數(shù)的人同意時,按照他的提案進(jìn)行分配,否則將被處死。 4以此類推條件:每個人都是極聰明的人,都能很理智的判斷、做出選擇,他們的目標(biāo)都是想得到最多的金幣。問題:第一個人提出怎樣的分配方案才能夠使自

32、己得到最多的金幣?倒推歸納法: 決策可分為五個階段: 最后階段:無論4提什么,5都可否決,(0,100)或可保命; 第三階段:3知道4的立場,應(yīng)該提(99,1,0)方案; 第二階段:無論2提什么方案,3應(yīng)該會反對,但2只要籠絡(luò)4,5即可獲得最大利益,所以應(yīng)提(97,0,2,1); 第一階段:1知道只要爭取到兩個以上的人支持,自己就可以獲得最大利益,故最優(yōu)(97,0,1,0,2)在利益面前,沒有永遠(yuǎn)的對手,也沒有永遠(yuǎn)的朋友挖金礦博弈:甲:有資源 乙:有能力 乙希望甲投錢甲分枝(0,4)不投(1,0)乙投(2,2)不分博弈樹不存在威脅時,甲一定選擇不投結(jié):決策點(diǎn)枝:決策方案路徑:系列決策 增加社會

33、的介入與干涉 法律體系or信用體系甲分枝不投(1,0)乙投(2,2)不分甲訴訟放棄(1,0)(0,4)有申訴的博弈動態(tài)博弈:用博弈的展開式表示包含:(1)局中人的集合 (2)行動的次序 (3) 局中人行動時的策略選擇 (4) 決策時掌握的信息 (5) 盈利和效用博弈樹(Game Tree)規(guī)則:1.每一個結(jié)至多以一個其它結(jié)直接位于它的上方 2.在博弈樹中,沒有一條路徑可以使決策結(jié)與自身相連(即不存在環(huán)) 3.博弈樹必須以初始結(jié) 4.任何一博弈樹正好只有一個初始結(jié)一、動態(tài)博弈的相關(guān)概念一、動態(tài)博弈的相關(guān)概念子博弈:能夠自成一個博弈的某個動態(tài)博弈的部分后續(xù)博弈,它必有一個初始單結(jié),且具備進(jìn)行博弈所

34、需要的信息。逆推歸納法(backward induction):是從動態(tài)博弈的最后一個階段逐步向前倒推以求解動態(tài)博弈的算法。(共同信息,鏈不可太長,否則不可信)子博弈精煉Nash均衡 路徑:從第一階段開始,通過每一個階段一個行為最后到達(dá)博弈結(jié)束的行為組合。如果動態(tài)博弈中各博弈方的策略在動態(tài)博弈本身和所有子博弈中都構(gòu)成一個Nash均衡,則稱該策略組合為“子博弈精煉Nash均衡”(Subject Perfect Nash Equilibrium)。 221上下左右左右(2,1)(0,0)(-1,1)(3,2)S1=上,下S2=(左,左),(左,右),(右,左),(右,右)(0,0)上下(左,左)(

35、左,右)(右,左)(右,右)(2,1)(2,1)(0,0)(-1,1)(3,2)(-1,1)(3,2)二、動態(tài)博弈的標(biāo)準(zhǔn)式221上下左右左右(2,1)(0,0)(-1,1)(3,2)當(dāng)信息不完美,即(不完美信息動態(tài)博弈),用連起來,其本質(zhì)上就是靜態(tài)博弈: (2, 1) (0,0) (-1, 1) (3,2) 左 右 上 下 1 2 不完美信息博弈的標(biāo)準(zhǔn)式博弈 P182 廠商 1 和 2 策略 q1和 q2 P=P(Q)=8-Q Q= q1+q2 c1=c2=2 廠商 1 是市場的主導(dǎo)者, 先決策 q1 第一階段 廠商 2 定 q2 第二階段 解:qqP2*18 )6(2102606)(62)8

36、()(*12*12222121111112*122222*122222qqqqquqqqqcqquqqqqqqqqcqquQPQP 回到第一階段:廠商 1 可認(rèn)定廠商 2 會用上式作決策 Stackelberg 博弈三、動態(tài)博弈應(yīng)用qqP2*18 )6(2102606)(62)8()(*12*12222121111112*122222*122222qqqqquqqqqcqquqqqqqqqqcqquQPQP 回 到 第 一 階 段 : 廠 商 1 可 認(rèn) 定 廠 商 2 會 用 上 式 作 決 策 )6(216611211212111qqqqqqqqu 011qudd25.2,5.45.1,

37、3*2*1*2*1uuqq 若 是 古 諾 ,4,2*2*1*2*1uuqq 博弈 廠商工會的博弈 P197 工會效用 u=u(W,L) W:工資 L:雇傭數(shù) 廠商 WLLRLW)(),( R(L):勞動生產(chǎn)力 第一階段:工會提出 W 水平 第二階段:廠商規(guī)定 L 水平 用逆推歸納法: 廠商:0)(),()(),max0WLLWWLLRLWRL( R(一) R(L)WLL(W)L(二) WWL(W)L WLWUMaxw,0工會:Leontief 廠商-工會博弈 P200 分1萬塊錢 規(guī)則:甲提一個分割比例,乙接受,end 乙不接受乙提新方案Repeat 階段:提方案,對方作選擇 限定:每一階段

38、有折扣10,且限定三個階段 甲甲 甲甲 接 受 ( S1, 1000- S1) 乙乙 出 價 S1 出 價 S2 接 受 ( S1, ( 1000- S1) ) 出 價 S2 ( 2S, 2( 1000- S) ) 談判博弈f0.750. 5乙 考 慮 甲 :SSSS222 甲 考 慮 乙 :SSSS21211000010000)10000(10000 S2)1(10000 最 后 一 階 段 乙 沒 有 否 決 權(quán) , 故 S 10000 )1(10000,10000212SS 均 衡 21)(f 當(dāng)0)(,5.0f 當(dāng)0)(,5.0f 若 雙 方 有 機(jī) 會 討 論 , 則 甲 希 望 越

39、 大 或 越 小 乙 希 望21 若 無 階 段 限 制 P203 假 定 有 結(jié) 果 (S,10000-S) ( 若 雙 方 理 性 ,必 定 會 在 第 1 個 階 段 分 掉 ) 假 設(shè) 是 第 三 階 段 (S,10000-S) 11000010000;110000,100001000010000121SSSS 最后通碟(ultimatum)游戲公平的價值 1982年,德國波恩大學(xué)經(jīng)濟(jì)學(xué)系,46名學(xué)生參加了一項(xiàng)有趣的博弈論實(shí)驗(yàn),每組兩個人分一筆錢,比如說10馬克。其中一個人提出分錢方案,另一人有兩種選擇:接受或拒絕。若是接受,實(shí)驗(yàn)者就按他們所提方案把錢發(fā)給兩人。若是拒絕,錢就被實(shí)驗(yàn)者收

40、回。 為防止交情、一時沖動、事后的社會議論等因素起作用,實(shí)驗(yàn)采取雙盲方式。 按照利益最大化原則,只要錢數(shù)不為零,回應(yīng)者接受比拒絕總有更大的利益,他應(yīng)該選擇接受;那么提議者只需分給對方一點(diǎn)小錢就夠了。此即正統(tǒng)博弈理論所預(yù)測的結(jié)果。 結(jié)果卻與此大異其趣。 首先,大多數(shù)提議者提出的方案都在四六開到五五開之間,其中有四分之一的人提出五五開對半分; 其次,特別不公平的分配提議,幾乎都被回應(yīng)者毫不猶豫地加以拒絕-他們寧愿什么都不要,也不能接受那雖有一點(diǎn)利益然而卻極不公平的分配。 主持實(shí)驗(yàn)的古特(W. Guth)教授等人在論文中指出,很明顯,受試者是依賴其公平觀念而不是利益最大化來決定其行為的。 近二十年里

41、,最后通碟游戲及其變種,成了實(shí)驗(yàn)經(jīng)濟(jì)學(xué)中一個很火的課題,出來了上百篇論文。人們在世界各地,不斷重復(fù)實(shí)驗(yàn),結(jié)果都相當(dāng)一致: 第一、提出較公平分配方案(給對方40%50%)的人,占受試者的4066%,其中又以提出對半分的人居多; 第二、幾乎每次實(shí)驗(yàn),都有2030%的人提出非常不公平的分配方案(分給對方低于30%); 第三、然而,這些極不公平的提議,總是以很高的概率被對方拒絕。 看起來,世界各地的受試者,盡管都有相當(dāng)一部分人不管公平只要利益,但是大多數(shù)人,在實(shí)驗(yàn)中考慮公平原則卻是重于利益考慮的。 公平值多少錢? 第一個質(zhì)疑是:大多數(shù)實(shí)驗(yàn)中,待分配的利益太少,受試者自然滿不在乎了。 天下沒有免費(fèi)午餐,

42、公平感也是有價的。對于許多人來說,只要出的價錢足夠高,或與此相關(guān)的利益足夠大,公平原則就不得不退居第二位。這個論點(diǎn)雖然不美,很殘酷,然而卻是事實(shí)。 維農(nóng)斯密斯教授,籌集了5000美元研究基金,找了五十個受試者,玩每盤100美元的最后通碟游戲。結(jié)果與玩 10美元游戲時候的情形完全相似。提出50對50對半分的人最多。5個人提議給對方30美元,其中兩個被對方拒絕;4個人提議給對方10美元,其中3個人被拒絕。 公平原則仍然支配著大多數(shù)人的行為。 卡麥農(nóng)(Lisa A. Cameron)教授在印尼做的實(shí)驗(yàn),每盤游戲價分別是5000、40,000以及200,000 盧比,后者相當(dāng)與受試者三個月的工資。 實(shí)

43、驗(yàn)的結(jié)果,分配提議仍是以對半開居多,但分給對方份額的平均值,隨著利益的增大而減少,從5000盧比時的47%減少到40000盧比時的43%再減少到200000 盧比時的38%。拒絕率也相應(yīng)從30%減少到10%,然而卻仍然顯著為正。 實(shí)驗(yàn)表明,當(dāng)面臨極不公平的分配時,不少人寧愿犧牲相當(dāng)大的利益,也要堅(jiān)決說“不”! 公平與表現(xiàn) 對這些實(shí)驗(yàn)的第二個批評是:受試者在游戲中表現(xiàn)得公平,可能是不想讓主持人認(rèn)為自己太自私、太貪婪。特別在許多實(shí)驗(yàn)中,受試者是學(xué)生,而實(shí)驗(yàn)者是教授,這個因素就更重要了。 勃爾頓和茲威克(Bolton and Zwick 1996),巧妙設(shè)計了一個實(shí)驗(yàn),用來對比匿名與不匿名的效果。結(jié)

44、果發(fā)現(xiàn),人們在匿名情況下,確實(shí)比非匿名情況下,表現(xiàn)得更為自私。 為了比較,勃爾頓和茲威克還設(shè)計了最后通碟的一個變種 -無報復(fù)博弈: 當(dāng)回應(yīng)者拒絕時,仍然給提議者他所要的錢,但給回應(yīng)者的收入是零。結(jié)果,他們非常驚奇地發(fā)現(xiàn),當(dāng)提議者能夠確認(rèn)自己的不公平提議不受任何報復(fù)性懲罰時,98%的人都按博弈論的純利益預(yù)測行事,毫不顧及公平問題。 同時選擇的兩階段的博弈 國際經(jīng)濟(jì)學(xué)模型 設(shè)有 2 個國家,i1,2 兩個市場 兩個廠商 一個產(chǎn)品 P=P(Qi)=a-Qi,Qi市場上產(chǎn)品的總量 Qi=hi+ej 2 , 1,jiji、 邊際成本 C,企業(yè) i,產(chǎn)量: hi+ej 成本:C(hi+ej) 關(guān)稅:tj,

45、運(yùn)輸成本忽略 企業(yè) i 出口成本:Cei+tjei 國內(nèi)銷售成本:Chi 階段(1)首先兩國政府同時制定關(guān)稅 t1、t2 (2)企業(yè) 1、2 同時決定(h,e1)、(h2,e2) 倒 推 歸 納 法 企 業(yè) i 所 得 :etehePhPijiiijiiiC)( eteheehhehijiiiijijiCaa)()()( 社 會 總 福 利 : Wi 消 費(fèi) 者 剩 余 +本 國 企 業(yè) 利 潤 +關(guān) 稅 etehjiiji)(221 )()(),(max0max0max0,etheeehheehhttijjiijiijijijiiCaeCahehiiii 由 一 階 條 件 :)(21);(

46、21)(21);(21thetheehehjjjjjiijjiCaCaCaCa 2, 1)2(31)(31*iCaCatethjiii )(I 回到第一階段:),(max0ttWjiiti 2, 1),2(319191181),()2()()(2222iCatttCatCatCattWjijiijii 利用一階條件,解得:2, 1),(31*iCati 代入(I)中得:2, 1)(91)(94*iCaCaehii 10X1X2X線性城市均勻分布Hotelling模型:定價 p1、p2 對消費(fèi)者來說,去某家商店的單位成本是 t,t(x-x1) xpuxpuxtSxtS222111)()(2122

47、2211xxPuxxputStS )(2212122121xxppxxuutx xx是企業(yè) 1 的市場份額 xx是企業(yè) 2 的市場份額 )1 (2211xxpp )(I 兩家商店x1、x2賣同種產(chǎn)品S 去掉絕對值優(yōu)化一、 第一階段 雙方定址 二、 第二階段 雙方定價 002211pp)4)(3)2)(32112*22112*1xxxxpxxxxptt 代入)(I)4()2(21)(1821)(1821222121xxxxxxxxtt 回到第一階段:011x x1越往左越好,同理,x2越往右越好 最大差異化 回避競爭 商店定址產(chǎn)品定位 x 表示偏好 三種差異:1.質(zhì)量差異(縱向差異) 公認(rèn)的 2

48、.橫向差異 個人偏好 3.信息差異 Hotelling 是研究橫向差異的經(jīng)典模型 1委托R(E)-W(E),W(E)-E22接受努力R(S)-W(S),W(S)-S偷懶拒絕R(0),0不委托R(0),0四、委托代理問題 委托人(Principle) 代理人(Agents) 利益分配,合作監(jiān)督 機(jī)制,合同(1)無不確定性1)W(E)-E0,W(S)-S0 參與約束(Participation Constraint) 2)W(E)-EW(S)-S 激勵相容約束(Incentive Compatibility Constraint) (2)存在不確定性,但可以監(jiān)督的模型高1委托20-W(E),W(E

49、)-E22接受努力不努力不接受不委托0高產(chǎn)出低產(chǎn)出10-W(E),W(E)-E0低0.920-W(S),W(S)-S10-W(S),W(S)-S參與約束:W(E)-E0,W(S)-S0 0.920-W(E)+0.110-W(E)0 0.120-W(S)+0.910-W(S)0 激勵相容:W(E)-EW(S)-S 高1委托20-W(E),W(E)-E22接受努力不努力不接受不委托0高產(chǎn)出低產(chǎn)出10-W(E),W(E)-E0低0.920-W(S),W(S)-S10-W(S),W(S)-S(0,0)(0,0)(3)存在不確定性,但不可監(jiān)督的模型按產(chǎn)出結(jié)果付工資參與

50、約束:0.9W(20)-E+0.1W(10)-E0 (I) 0.1W(20)-S+0.9W(10)-S0 () 激勵相容:(I) () eg.設(shè)參與者店主 1,店員 2 )()(4)(2eBRAWeCCeeRRe 假定1U 店主的得益:ABeBeBAeWRu)1 ()1 (4)4(41 店員的得益:euBBeACW224 euuBeAEAeBE2214)1 (4 參與約束:1)4(2eeBA 期望凈利益: 142eBeA 即142eBeA 開店合約博弈) 1(4)()(21*euEeeRWeR 20*1*euEded 委托人希望代理人達(dá)到的努力程度 BeBdedeuE2024*2* 31412

51、*ABeABeee代入 RBRAW3 (eg租柜臺) 論語-為政篇-子張學(xué)干祿 子曰:“多聞闕疑,慎言其余,則寡尤;多見闕殆,慎行其余,則寡悔。言寡尤,行寡悔,祿在其中矣。” 子張,姓顓孫名師;干祿,求官;闕,通缺;尤,過失五、重復(fù)博弈五、重復(fù)博弈1.有限次的重復(fù)博弈(1)定義定義:給定一個博弈G,重復(fù)進(jìn)行T次,并且在每次重復(fù)之前,各博弈方都能 觀察到從前的博弈結(jié)果。 這樣的博弈過程稱為G的一個T次重復(fù)博弈,記為G(T),G稱為G(T)的原博弈。(2)例子:重復(fù)一次的囚徒困境 對于原博弈若存在唯一的Nash均衡,則重復(fù)后的子博弈精煉Nash均衡不變。 坦白 不坦白 坦白 不坦白 坦白 坦白不坦

52、白 不坦白 (得益累加法)-5,-5 0,-8-8,0-1,-1-5,-50,-8-8,0-1,-1(3)定理: 設(shè)原博弈G有唯一的純策略Nash均衡,則對任意正整數(shù)T,G(T)有唯一的子博弈精煉Nash均衡,即各博弈方每個階段都采用G的Nash均衡策略。2.兩個純策略均衡的重復(fù)博弈(1)例子: 廠商2 (1,4) A B (3,3) 廠商 1 A (1,1) B (4,1)3,31,44,10,0(2)民間定理 設(shè)原博弈的一次性博弈均衡的數(shù)組w,那么在該博弈的多次重復(fù)博弈中,所有的個體理性得益和可實(shí)現(xiàn)得益都至少有一個子博弈精煉Nash均衡來實(shí)現(xiàn)。規(guī)則指定路徑的均衡(3)例子1重復(fù)三次的情況廠

53、商1:A,若(A,A),則選A, 若(A,B),則 選B。 無條件選B廠商2:選A 無條件選B 若(A,A), A 若(B,A), B ?在此過程中,雙方是否有背離的愿望?(4)另一個例子 2 L M R L 1 M R Nash均衡(L,L)和(R,R)1,15,00,00,54,40,00,00,03,3博弈方1: M,若(M,M),則 R 若其他組合 L博弈方2:同1(M,M)為(4,4),(R,R)為(3,3),所以w=(7/2,7/2)通過疊加: 2 L M R L 1 M R (M,M)變成了純策略Nash均衡2,26,11,11,67,71,11,11,04,4例子的改進(jìn) 有限次

54、重復(fù)博弈可以通過累加的方式將收益放在一個收益矩陣中進(jìn)行分析, 例如 1,15,00,00,00,00,54,40,00,00,00,00,03,30,00,00,00,00,04,1/2 0,00,00,00,00,01/2,4 L M R P Q L M R P Q3.無限次重復(fù)博弈(1)概述 (貼現(xiàn)) r為利率11iiir1110(2)例子:無限次囚徒困境 L R LR1,15,00,54,4觸發(fā)策略:采用R,若t-1個階段為(R,R),則t階段選R;否則選L。合作時, 背離時,141V152V21VV 時,即1514所以當(dāng) 時合作。4/1(3)例:重復(fù)古諾博弈 古諾模型時,壟斷模型時,2

55、1qqQQP 8成本2C221CCqq421CC3mq9m)21,21(mmqq)21,21(mm均分后為:規(guī)則:若否則)21,21(mmqq堅(jiān)持:mq21Cq15 . 4V背離:)25 . 18(max222qqq25. 22dq0625. 5d140625. 515 . 4179當(dāng) 時,即雙方都不會背離(4)例子:有效工資率 廠商決定工資率:w努力工作 e拒絕:個體戶,社會利率接受工人選擇不努力工作 0ww 0 y0,yw若工人努力 y若不努力 以概率p得到y(tǒng)廠商只能看到產(chǎn)量y工人努力:廠商得益 y-w工人不努力:廠商期望得益 p y-w工人努力時得益 w-e工人不努力時得益 w一旦發(fā)現(xiàn)偷

56、懶,得益為0w 觸發(fā)策略:廠商第一階段 第t-1階段,結(jié)果 則繼續(xù) 否則*w),(*yw*w0w工人:若 則接受,否則個體戶0ww 0*ww eeVewV)(*1*ewVe若偷懶y0p1-p1)1 (0*wppVwVSS)1)(1 ()1 ()1 (0*pwpwVS只要 工人就會努力工作SeVV epeww)1 (10*0* wy對于廠商來說(5)例子:消耗戰(zhàn) 離散型 連續(xù)型假定在博弈過程中,雙方都堅(jiān)持一個回合付出1,在每一回合t,選擇停止,不停止,在 至少有一方停止,此前 -1時刻,雙方均未停止?fàn)幎罚?折現(xiàn)tt (I) i 在 先放棄t 11)1 ()(12ttitLVtLVtFtittj1

57、2)()1 ()( (II) 雙方同時停止)()()(21tLtBtB 行為策略:如果其他局中人在t之前尚未停止,則以概率p在t停止,總的概率為tppt 1)1 () 1()1 ()() 1()1 ()()(tLpVtLptLptpFtLt1111)1 (111ttttppVpVp11*連續(xù)化:r11knnkrr)1 ()1 (ktktkr)1 (1rtktkktkekr)1 (limlim在一小時段 中,損耗0)1 (1trterdte把時段分成k段,每段長1/k,k趨近無窮,1/k趨近0t)(tFj)(tLiV極限分布:停止的概率表示參與者在ttGi)(nptGtG)1 ()(1)(*,極

58、限分布一個時段分成k個長度為1/k的小時段,損耗1/k均衡:kVpkpVp111)1 (*)()11 ()111 ()(1VtkVkVkVkVtGVtke負(fù)指數(shù)分布(8)例子:專利競賽 停止意味著放棄,專利價值V若企業(yè)i在t之前沒有退出在t,t+dt之間,花費(fèi)dtCi以概率 取得 一項(xiàng)發(fā)明)(txidtCtVxii)(瞬間利潤rdttdxi假定利率為有學(xué)習(xí)能力, 0)(有所發(fā)現(xiàn)的概率表示企業(yè)若iepdssxii0)(會獲利都有專利,則沒有一家相互獨(dú)立且)(jipp雙方均無所得的概率000)()()()(dssxsxdssxdssxjijieee雙方均無所得的概率000)()()()(dssxs

59、xdssxdssxjijieeetrdssxsxiiideeCVxtLji0)()(0)()(trdssxsxiijdeeCVxtFji0)()(0)()(deeCVxrdssxtiii0)()(博弈思考題演繹歸納法 A New Stone Game 有N堆石子,兩人輪流進(jìn)行操作,每一次為“操作者指定一堆石子,先從中扔掉一部分(至少一顆,可以全部扔掉),然后可以將該堆剩下的石子中的任意多顆任意移到其他未取完的堆中”,操作者無法完成操作時為負(fù)。 問題:參與者應(yīng)如何挑先?如何操作? 倒推歸納法Plus演繹歸納法 演繹歸納法:尋找必勝/敗狀態(tài) 小數(shù)據(jù)推演 = 猜想 = 證明 假定局面進(jìn)展到某種狀態(tài),

60、此時無論當(dāng)局者如何選擇都將得到必勝或者必敗的結(jié)果,稱這種狀態(tài)為必勝/敗態(tài) 簡單點(diǎn)闡述,必敗態(tài)就是“在對方使用最優(yōu)策略時,無論做出什么決策都會導(dǎo)致失敗的局面”,與其相對的局面稱為必勝態(tài)。 值得注意的是在必勝態(tài)下做出錯誤的決策也有可能導(dǎo)致失敗。 此類博弈問題的精髓就是讓對手永遠(yuǎn)面對必敗態(tài)。 必勝/敗態(tài)有著如下性質(zhì): 1、若末狀態(tài)為獲勝則為必勝態(tài),否則末狀態(tài)為必敗態(tài)。 2、一個局面是必勝態(tài)的充要條件是該局面下進(jìn)行某種決策后會成為必敗態(tài)。 3、一個局面是必敗態(tài)的充要條件是該局面無論進(jìn)行何種決策均會成為勝態(tài) 分析: 1)只有一堆時先手必勝。 2)有兩堆時若兩堆相等則后手只用和先手一樣決策即可保證勝利,后

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論