版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)、模型與決策數(shù)據(jù)、模型與決策第九講第九講 博弈論博弈論主講:鄧旭東教授主講:鄧旭東教授教學(xué)內(nèi)容教學(xué)內(nèi)容博弈論的產(chǎn)生和發(fā)展1博弈論的基本概念與博弈的分類(lèi)2博弈論的經(jīng)典模型3Nash均衡解的求解方法4合作博弈5學(xué)習(xí)目標(biāo)學(xué)習(xí)目標(biāo) 了解博弈論的產(chǎn)生和發(fā)展情況了解博弈論的產(chǎn)生和發(fā)展情況 掌握博弈及博弈論的概念、博弈論的分類(lèi)掌握博弈及博弈論的概念、博弈論的分類(lèi) 了解和掌握博弈論的經(jīng)典模型了解和掌握博弈論的經(jīng)典模型 掌握純策略和混合策略掌握純策略和混合策略NashNash均衡解的求解方法均衡解的求解方法 掌握聯(lián)盟博弈及夏普利值的概念,會(huì)求解兩人掌握聯(lián)盟博弈及夏普利值的概念,會(huì)求解兩人聯(lián)盟和三人聯(lián)盟情況下
2、的夏普利值聯(lián)盟和三人聯(lián)盟情況下的夏普利值 培養(yǎng)應(yīng)用博弈論于經(jīng)濟(jì)與管理實(shí)踐的意識(shí)培養(yǎng)應(yīng)用博弈論于經(jīng)濟(jì)與管理實(shí)踐的意識(shí)博弈論、納什均衡及核的概念博弈論、納什均衡及核的概念 博弈論博弈論(Game Theory)(Game Theory)是一門(mén)關(guān)于決策者在對(duì)是一門(mén)關(guān)于決策者在對(duì)決策結(jié)果沒(méi)有完全信息和互動(dòng)條件下做出理性決策決策結(jié)果沒(méi)有完全信息和互動(dòng)條件下做出理性決策的理論。的理論。 所謂所謂“互動(dòng)互動(dòng)”是指這樣一種情況,任何決策者是指這樣一種情況,任何決策者決策的結(jié)果不僅取決于其自身采取的策略,還取決決策的結(jié)果不僅取決于其自身采取的策略,還取決于其他人采取的策略。于其他人采取的策略。 納什均衡指兩人或
3、多人互動(dòng)的結(jié)果:當(dāng)其他人納什均衡指兩人或多人互動(dòng)的結(jié)果:當(dāng)其他人所選策略不變時(shí),沒(méi)有任何人可以通過(guò)單方面改變所選策略不變時(shí),沒(méi)有任何人可以通過(guò)單方面改變其策略而取得更好的結(jié)果。其策略而取得更好的結(jié)果。 核指兩個(gè)或多個(gè)聯(lián)盟互動(dòng)的結(jié)果:當(dāng)其他聯(lián)盟核指兩個(gè)或多個(gè)聯(lián)盟互動(dòng)的結(jié)果:當(dāng)其他聯(lián)盟的策略不變時(shí),沒(méi)有任何聯(lián)盟可以通過(guò)單方面改變的策略不變時(shí),沒(méi)有任何聯(lián)盟可以通過(guò)單方面改變其策略而取得對(duì)該聯(lián)盟所有成員更好的結(jié)果。其策略而取得對(duì)該聯(lián)盟所有成員更好的結(jié)果。一、博弈論的產(chǎn)生和發(fā)展一、博弈論的產(chǎn)生和發(fā)展20世紀(jì)世紀(jì)50年代年代,合作博弈發(fā)展到全盛期,非合作,合作博弈發(fā)展到全盛期,非合作博弈論也開(kāi)始創(chuàng)立;博弈
4、論也開(kāi)始創(chuàng)立;20世紀(jì)世紀(jì)60年代后,非合作博弈得到進(jìn)一步發(fā)展;年代后,非合作博弈得到進(jìn)一步發(fā)展;幾十年來(lái),眾多的博弈論學(xué)者花費(fèi)了無(wú)窮的精力,幾十年來(lái),眾多的博弈論學(xué)者花費(fèi)了無(wú)窮的精力,研究博弈論里博弈的結(jié)構(gòu),發(fā)展納什均衡點(diǎn)的定義研究博弈論里博弈的結(jié)構(gòu),發(fā)展納什均衡點(diǎn)的定義,并探討其實(shí)際應(yīng)用的可能性。,并探討其實(shí)際應(yīng)用的可能性?,F(xiàn)代博弈理論誕生的標(biāo)志:現(xiàn)代博弈理論誕生的標(biāo)志:馮馮諾依曼和摩根斯坦諾依曼和摩根斯坦1944年出版的巨著年出版的巨著博弈論博弈論與經(jīng)濟(jì)行為與經(jīng)濟(jì)行為(The Theory of Games and Economic Behavior)1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng):納什、哈薩
5、尼、澤爾騰年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng):納什、哈薩尼、澤爾騰1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng):莫里斯、維克瑞年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng):莫里斯、維克瑞2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng):阿克爾洛夫、斯彭斯、年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng):阿克爾洛夫、斯彭斯、 斯蒂格利茨斯蒂格利茨2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng):奧曼、謝林年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng):奧曼、謝林博弈論的產(chǎn)生博弈論的產(chǎn)生和發(fā)展博弈論的產(chǎn)生和發(fā)展博弈論的發(fā)展1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng) 19941994年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),授予了三位對(duì)博弈年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),授予了三位對(duì)博弈論做出奠基性貢獻(xiàn)的學(xué)者,他們是美國(guó)普林斯頓大論做出奠基性貢獻(xiàn)的學(xué)者,他們是美國(guó)普林斯頓大學(xué)數(shù)學(xué)系的納什(學(xué)數(shù)學(xué)系的納什(
6、John NashJohn Nash)教授、美國(guó)伯克利)教授、美國(guó)伯克利加州大學(xué)商學(xué)院的哈薩尼(加州大學(xué)商學(xué)院的哈薩尼(John John HarsanyiHarsanyi)教授)教授和德國(guó)波恩大學(xué)經(jīng)濟(jì)學(xué)系的澤爾騰(和德國(guó)波恩大學(xué)經(jīng)濟(jì)學(xué)系的澤爾騰(ReinhardReinhard SeltenSelten)教授。納什對(duì)博弈論的貢獻(xiàn)有兩個(gè)方面)教授。納什對(duì)博弈論的貢獻(xiàn)有兩個(gè)方面:合作博弈理論中的討價(jià)還價(jià)模型,稱(chēng)為納什討價(jià)合作博弈理論中的討價(jià)還價(jià)模型,稱(chēng)為納什討價(jià)還價(jià)解;非合作博弈論方面,這也是他的主要貢還價(jià)解;非合作博弈論方面,這也是他的主要貢獻(xiàn)所在。納什對(duì)非合作博弈論的主要貢獻(xiàn)是他在獻(xiàn)所在。納
7、什對(duì)非合作博弈論的主要貢獻(xiàn)是他在1950年和年和1951年的兩篇論文中在非常一般的意義年的兩篇論文中在非常一般的意義上定義了非合作博弈及其均衡解,并證明了均衡解上定義了非合作博弈及其均衡解,并證明了均衡解的存在,由此奠定了非合作博弈論的基礎(chǔ)。的存在,由此奠定了非合作博弈論的基礎(chǔ)。1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng) 1996 1996年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予了英國(guó)劍橋大學(xué)的詹姆斯年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予了英國(guó)劍橋大學(xué)的詹姆斯莫里莫里斯(斯(James A. James A. MirrleesMirrlees)教授和美國(guó)哥倫比亞大學(xué)的威廉姆)教授和美國(guó)哥倫比亞大學(xué)的威廉姆維克維克瑞(瑞(Will
8、iam William VickreyVickrey)教授,表彰他們對(duì)信息經(jīng)濟(jì)學(xué)的貢獻(xiàn)。這兩)教授,表彰他們對(duì)信息經(jīng)濟(jì)學(xué)的貢獻(xiàn)。這兩位經(jīng)濟(jì)學(xué)家分別在位經(jīng)濟(jì)學(xué)家分別在2020世紀(jì)世紀(jì)6060年代和年代和7070年代揭示了不對(duì)稱(chēng)信息對(duì)交易年代揭示了不對(duì)稱(chēng)信息對(duì)交易所帶來(lái)的影響,并提出了相應(yīng)的對(duì)策。所帶來(lái)的影響,并提出了相應(yīng)的對(duì)策。 信息經(jīng)濟(jì)學(xué)是研究信息不對(duì)稱(chēng)條件下交易關(guān)系和契約安排的理信息經(jīng)濟(jì)學(xué)是研究信息不對(duì)稱(chēng)條件下交易關(guān)系和契約安排的理論。從本質(zhì)上講,信息經(jīng)濟(jì)學(xué)是不對(duì)稱(chēng)博弈論在經(jīng)濟(jì)學(xué)上的應(yīng)用。論。從本質(zhì)上講,信息經(jīng)濟(jì)學(xué)是不對(duì)稱(chēng)博弈論在經(jīng)濟(jì)學(xué)上的應(yīng)用。不對(duì)稱(chēng)信息指的是某些參與人擁有另一些參與人不擁
9、有的信息。不對(duì)稱(chēng)信息指的是某些參與人擁有另一些參與人不擁有的信息。 博弈論是方法論導(dǎo)向的,它研究的是給定信息結(jié)構(gòu)后,尋找最博弈論是方法論導(dǎo)向的,它研究的是給定信息結(jié)構(gòu)后,尋找最可能的均衡結(jié)果;信息經(jīng)濟(jì)學(xué)是以問(wèn)題導(dǎo)向的,它研究的是給定信可能的均衡結(jié)果;信息經(jīng)濟(jì)學(xué)是以問(wèn)題導(dǎo)向的,它研究的是給定信息結(jié)構(gòu)后,進(jìn)行最優(yōu)的契約安排。息結(jié)構(gòu)后,進(jìn)行最優(yōu)的契約安排。 由于信息經(jīng)濟(jì)學(xué)研究什么是不對(duì)稱(chēng)信息情況下的最優(yōu)交易契約由于信息經(jīng)濟(jì)學(xué)研究什么是不對(duì)稱(chēng)信息情況下的最優(yōu)交易契約,故又稱(chēng)為契約理論,或機(jī)制設(shè)計(jì)理論。正因?yàn)樾畔⒉粚?duì)稱(chēng),不同,故又稱(chēng)為契約理論,或機(jī)制設(shè)計(jì)理論。正因?yàn)樾畔⒉粚?duì)稱(chēng),不同的制度安排對(duì)應(yīng)不同的經(jīng)
10、濟(jì)效率,現(xiàn)在經(jīng)常討論的國(guó)有企業(yè)委托人的制度安排對(duì)應(yīng)不同的經(jīng)濟(jì)效率,現(xiàn)在經(jīng)常討論的國(guó)有企業(yè)委托人代理人問(wèn)題、激勵(lì)機(jī)制問(wèn)題、產(chǎn)權(quán)問(wèn)題等,都是信息經(jīng)濟(jì)學(xué)的問(wèn)代理人問(wèn)題、激勵(lì)機(jī)制問(wèn)題、產(chǎn)權(quán)問(wèn)題等,都是信息經(jīng)濟(jì)學(xué)的問(wèn)題。題。2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng) 20012001年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予了三位美國(guó)經(jīng)濟(jì)學(xué)家,他們是伯克利年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予了三位美國(guó)經(jīng)濟(jì)學(xué)家,他們是伯克利加州大學(xué)經(jīng)濟(jì)系的喬治加州大學(xué)經(jīng)濟(jì)系的喬治阿克爾洛夫(阿克爾洛夫(George George AkerlofAkerlof)教授、斯坦福)教授、斯坦福大學(xué)商學(xué)院的邁克爾大學(xué)商學(xué)院的邁克爾斯彭斯(斯彭斯(Michael Sp
11、enceMichael Spence)教授和哥倫比亞大學(xué))教授和哥倫比亞大學(xué)經(jīng)濟(jì)系、商學(xué)院及國(guó)際關(guān)系學(xué)院的約瑟夫經(jīng)濟(jì)系、商學(xué)院及國(guó)際關(guān)系學(xué)院的約瑟夫斯蒂格利茨(斯蒂格利茨(Joseph Joseph StiglitzStiglitz)教授。早在)教授。早在2020世紀(jì)世紀(jì)7070年代,他們就揭示了當(dāng)代信息經(jīng)濟(jì)的核年代,他們就揭示了當(dāng)代信息經(jīng)濟(jì)的核心,認(rèn)為信息是有價(jià)值的。其應(yīng)用價(jià)值對(duì)中國(guó)目前的改革也有著一定的心,認(rèn)為信息是有價(jià)值的。其應(yīng)用價(jià)值對(duì)中國(guó)目前的改革也有著一定的指導(dǎo)意義。指導(dǎo)意義。 19701970年,阿克爾洛夫?qū)鹘y(tǒng)經(jīng)濟(jì)學(xué)理論提出了挑戰(zhàn),他從分析舊車(chē)年,阿克爾洛夫?qū)鹘y(tǒng)經(jīng)濟(jì)學(xué)理論提出了
12、挑戰(zhàn),他從分析舊車(chē)市場(chǎng)入手,發(fā)現(xiàn)在舊車(chē)交易中,賣(mài)者顯然比買(mǎi)者對(duì)車(chē)輛擁有更多的信息市場(chǎng)入手,發(fā)現(xiàn)在舊車(chē)交易中,賣(mài)者顯然比買(mǎi)者對(duì)車(chē)輛擁有更多的信息,而因?yàn)檫@種信息不對(duì)稱(chēng),買(mǎi)車(chē)的人難以完全信任賣(mài)車(chē)人提供的信息,而因?yàn)檫@種信息不對(duì)稱(chēng),買(mǎi)車(chē)的人難以完全信任賣(mài)車(chē)人提供的信息,因而試圖通過(guò)低價(jià)來(lái)彌補(bǔ)其信息上的損失。由于買(mǎi)者出價(jià)過(guò)低,賣(mài)者又因而試圖通過(guò)低價(jià)來(lái)彌補(bǔ)其信息上的損失。由于買(mǎi)者出價(jià)過(guò)低,賣(mài)者又不愿提供好的產(chǎn)品,從而導(dǎo)致次貨的泛濫,其最終的結(jié)果是舊車(chē)市場(chǎng)的不愿提供好的產(chǎn)品,從而導(dǎo)致次貨的泛濫,其最終的結(jié)果是舊車(chē)市場(chǎng)的萎縮。阿克爾洛夫就此得出結(jié)論:市場(chǎng)放開(kāi)并不能解決所有問(wèn)題,信息萎縮。阿克爾洛夫就此得出結(jié)
13、論:市場(chǎng)放開(kāi)并不能解決所有問(wèn)題,信息是有價(jià)值的。斯彭斯則在是有價(jià)值的。斯彭斯則在19731973年通過(guò)剖析人才市場(chǎng)盛行的造假行為,指年通過(guò)剖析人才市場(chǎng)盛行的造假行為,指出人才市場(chǎng)同樣存在用人單位與應(yīng)聘者之間信息不對(duì)稱(chēng)的問(wèn)題,并由此出人才市場(chǎng)同樣存在用人單位與應(yīng)聘者之間信息不對(duì)稱(chēng)的問(wèn)題,并由此造成了人才市場(chǎng)上造成了人才市場(chǎng)上“劣幣劣幣”驅(qū)逐驅(qū)逐“良幣良幣”的現(xiàn)象。斯蒂格利茨則將信息的現(xiàn)象。斯蒂格利茨則將信息不對(duì)稱(chēng)這一理論應(yīng)用到保險(xiǎn)和金融市場(chǎng)。不對(duì)稱(chēng)這一理論應(yīng)用到保險(xiǎn)和金融市場(chǎng)。2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng) 這三個(gè)人從不同領(lǐng)域探討了信息不對(duì)稱(chēng)問(wèn)題,指出市這三個(gè)人從不同領(lǐng)域探討了信息不對(duì)
14、稱(chēng)問(wèn)題,指出市場(chǎng)體制需要完善、設(shè)計(jì),設(shè)計(jì)里有最優(yōu)。這是對(duì)傳統(tǒng)經(jīng)濟(jì)場(chǎng)體制需要完善、設(shè)計(jì),設(shè)計(jì)里有最優(yōu)。這是對(duì)傳統(tǒng)經(jīng)濟(jì)學(xué)的重大突破。學(xué)的重大突破。 Akerlof,G.(1970)”The Market for Lemons: Quality Uncertainty and Market Mechanism”,Quarterly Journal of Economics, 84: 488-599. Spence,M.(1973),),”Job Market Signaling”,Quarterly Journal of Economics,87. Rothschild,M. and Stiglit
15、z,J.(1976),),”Equilibrium in Competitive Insurance Market”, Quarterly Journal of Economics 90:629-49.2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng) 奧曼(奧曼(Robert J. Robert J. AumannAumann)提出了無(wú)限次的重復(fù)博弈的理論,謝林()提出了無(wú)限次的重復(fù)博弈的理論,謝林(Thomas C. SchellingThomas C. Schelling)提出了對(duì)抗?fàn)顟B(tài)下的)提出了對(duì)抗?fàn)顟B(tài)下的“可置信威脅可置信威脅”等概念,深等概念,深刻地分析了行為選擇的條件對(duì)博弈均衡結(jié)果的影響
16、。刻地分析了行為選擇的條件對(duì)博弈均衡結(jié)果的影響。 奧曼率先提出的奧曼率先提出的“重復(fù)博弈重復(fù)博弈”分析,目前成為所有社會(huì)科學(xué)的主流分分析,目前成為所有社會(huì)科學(xué)的主流分支,并已應(yīng)用于政治沖突、灌溉系統(tǒng)、國(guó)際條約乃至公司相互勾結(jié)等各種支,并已應(yīng)用于政治沖突、灌溉系統(tǒng)、國(guó)際條約乃至公司相互勾結(jié)等各種各樣的問(wèn)題。各樣的問(wèn)題。 奧曼對(duì)沖突與合作策略思想的貢獻(xiàn)在于,他運(yùn)用了邏輯學(xué)和數(shù)學(xué)來(lái)理奧曼對(duì)沖突與合作策略思想的貢獻(xiàn)在于,他運(yùn)用了邏輯學(xué)和數(shù)學(xué)來(lái)理解,當(dāng)人們每天都面對(duì)相同對(duì)手或競(jìng)爭(zhēng)者時(shí),他們所能作出的選擇。當(dāng)策解,當(dāng)人們每天都面對(duì)相同對(duì)手或競(jìng)爭(zhēng)者時(shí),他們所能作出的選擇。當(dāng)策略情形大量重復(fù)出現(xiàn)時(shí),即便個(gè)體間
17、有直接的利益沖突,達(dá)成合作的機(jī)率略情形大量重復(fù)出現(xiàn)時(shí),即便個(gè)體間有直接的利益沖突,達(dá)成合作的機(jī)率也會(huì)上升,因?yàn)槊總€(gè)個(gè)體在未來(lái)時(shí)間內(nèi),都會(huì)與另一方反復(fù)打交道。也會(huì)上升,因?yàn)槊總€(gè)個(gè)體在未來(lái)時(shí)間內(nèi),都會(huì)與另一方反復(fù)打交道。 謝林于謝林于2020世紀(jì)世紀(jì)6060年代出版年代出版沖突的策略沖突的策略,著力闡述了在雙方處于僵,著力闡述了在雙方處于僵持時(shí),采取一些策略性手段的重要性。這些手段包括:事先承諾、邊緣政持時(shí),采取一些策略性手段的重要性。這些手段包括:事先承諾、邊緣政策和有威懾力的威脅。例如,通過(guò)限定你自己的選擇范圍,你就可以使對(duì)策和有威懾力的威脅。例如,通過(guò)限定你自己的選擇范圍,你就可以使對(duì)手清楚
18、地知道,你將對(duì)他們的行動(dòng)作出何種反應(yīng)手清楚地知道,你將對(duì)他們的行動(dòng)作出何種反應(yīng)不管他們采取什么行不管他們采取什么行動(dòng),這也就加大了他們作出讓步的可能性。動(dòng),這也就加大了他們作出讓步的可能性。 在地緣政治領(lǐng)域之外,謝林還發(fā)現(xiàn),人通常都是愿意合作的,但當(dāng)他在地緣政治領(lǐng)域之外,謝林還發(fā)現(xiàn),人通常都是愿意合作的,但當(dāng)他們?cè)谝粋€(gè)團(tuán)隊(duì)中完全依理性行事時(shí),則不那么容易合作。們?cè)谝粋€(gè)團(tuán)隊(duì)中完全依理性行事時(shí),則不那么容易合作。二、博弈論的基本概念與博弈的分類(lèi)二、博弈論的基本概念與博弈的分類(lèi) 博弈論的基本概念包括參與人、行動(dòng)、信息、策略、支博弈論的基本概念包括參與人、行動(dòng)、信息、策略、支付、結(jié)果和均衡。其中,參與
19、人、策略和支付是描述一付、結(jié)果和均衡。其中,參與人、策略和支付是描述一個(gè)博弈所需要的最少的要素,而行動(dòng)和信息是其個(gè)博弈所需要的最少的要素,而行動(dòng)和信息是其“積木積木”。參與人、行動(dòng)和結(jié)果統(tǒng)稱(chēng)為。參與人、行動(dòng)和結(jié)果統(tǒng)稱(chēng)為“博弈規(guī)則博弈規(guī)則”。博弈分。博弈分析的目的是使用博弈規(guī)則預(yù)測(cè)均衡。析的目的是使用博弈規(guī)則預(yù)測(cè)均衡。 參與人參與人是指在一個(gè)博弈中能夠選擇自己的行動(dòng)方案是指在一個(gè)博弈中能夠選擇自己的行動(dòng)方案從而使自身的利益最大化的決策主體,即有決策權(quán)的參從而使自身的利益最大化的決策主體,即有決策權(quán)的參加者。個(gè)人或組織團(tuán)體,參與人是理性的。加者。個(gè)人或組織團(tuán)體,參與人是理性的。 行動(dòng)行動(dòng)是參與人在
20、博弈的某個(gè)時(shí)點(diǎn)的決策變量。當(dāng)參是參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。當(dāng)參與人的行動(dòng)存在先后次序時(shí),后行動(dòng)者就可以通過(guò)觀察與人的行動(dòng)存在先后次序時(shí),后行動(dòng)者就可以通過(guò)觀察先行動(dòng)者的行動(dòng)選擇來(lái)獲取信息,再?zèng)Q定行動(dòng)方案。先行動(dòng)者的行動(dòng)選擇來(lái)獲取信息,再?zèng)Q定行動(dòng)方案。 信息信息是參與人有關(guān)博弈的知識(shí),特別是有關(guān)自然狀是參與人有關(guān)博弈的知識(shí),特別是有關(guān)自然狀況、其他參與人的特征、偏好和行動(dòng)等方面的知識(shí)。況、其他參與人的特征、偏好和行動(dòng)等方面的知識(shí)?!袄硇岳硇浴笔枪餐R(shí),各參與人的偏好也可能是共同知識(shí)是共同知識(shí),各參與人的偏好也可能是共同知識(shí)。博弈論的基本概念博弈論的基本概念 策略策略是參與人在給定信息集
21、的情況下的行動(dòng)規(guī)則,是參與人在給定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定了參與人在何時(shí)何種情況下選擇何種行動(dòng),是完它規(guī)定了參與人在何時(shí)何種情況下選擇何種行動(dòng),是完整的行動(dòng)方案。各參與人在各自的策略集中選擇一個(gè)特整的行動(dòng)方案。各參與人在各自的策略集中選擇一個(gè)特定的策略所構(gòu)成的策略組合稱(chēng)為一個(gè)局勢(shì)。定的策略所構(gòu)成的策略組合稱(chēng)為一個(gè)局勢(shì)。 支付支付是指在博弈論中,對(duì)應(yīng)一個(gè)確定的自然狀況,是指在博弈論中,對(duì)應(yīng)一個(gè)確定的自然狀況,參與人各選擇一個(gè)特定的策略所形成的局勢(shì)下參與人得參與人各選擇一個(gè)特定的策略所形成的局勢(shì)下參與人得到的效用。當(dāng)自然狀況不確定或參與人隨機(jī)選擇其策略到的效用。當(dāng)自然狀況不確定或參與人隨機(jī)
22、選擇其策略時(shí),參與人關(guān)心的是期望效用。時(shí),參與人關(guān)心的是期望效用。 結(jié)果結(jié)果是一個(gè)博弈各種可能的最終后果,如各參與人是一個(gè)博弈各種可能的最終后果,如各參與人的最優(yōu)策略、最優(yōu)策略下的效用等。的最優(yōu)策略、最優(yōu)策略下的效用等。 均衡均衡是各參與人最優(yōu)策略所形成的局勢(shì),在該局勢(shì)是各參與人最優(yōu)策略所形成的局勢(shì),在該局勢(shì)下,沒(méi)有參與人愿意選擇其他的策略。下,沒(méi)有參與人愿意選擇其他的策略。博弈的分類(lèi)博弈的分類(lèi) 通過(guò)事前交流協(xié)商達(dá)成有約束力的協(xié)議稱(chēng)為合作。通過(guò)事前交流協(xié)商達(dá)成有約束力的協(xié)議稱(chēng)為合作。 根據(jù)參與人之間是否存在合作,博弈可劃分為合作博弈根據(jù)參與人之間是否存在合作,博弈可劃分為合作博弈和非合作博弈。
23、和非合作博弈。 合作博弈與非合作博弈之間的區(qū)別主要在于人們的行為合作博弈與非合作博弈之間的區(qū)別主要在于人們的行為相互作用時(shí),當(dāng)事人能否達(dá)成一個(gè)具有約束力的協(xié)議。相互作用時(shí),當(dāng)事人能否達(dá)成一個(gè)具有約束力的協(xié)議。如果有,就是合作博弈;反之,則是非合作博弈。如果有,就是合作博弈;反之,則是非合作博弈。 合作博弈強(qiáng)調(diào)的是團(tuán)體理性,強(qiáng)調(diào)的是效率、公正、公合作博弈強(qiáng)調(diào)的是團(tuán)體理性,強(qiáng)調(diào)的是效率、公正、公平;非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策,其平;非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果可能是有效率的,也可能是無(wú)效率的。結(jié)果可能是有效率的,也可能是無(wú)效率的。 根據(jù)參與人行動(dòng)的先后順序,博弈可
24、以劃分為靜態(tài)博弈根據(jù)參與人行動(dòng)的先后順序,博弈可以劃分為靜態(tài)博弈和動(dòng)態(tài)博弈。靜態(tài)博弈指的是博弈中,參與人同時(shí)選擇和動(dòng)態(tài)博弈。靜態(tài)博弈指的是博弈中,參與人同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知道先行動(dòng)者采取了什行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng);動(dòng)態(tài)博弈指的是參與人的行動(dòng)有先后順序么具體行動(dòng);動(dòng)態(tài)博弈指的是參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。博弈的分類(lèi)博弈的分類(lèi)根據(jù)參與人對(duì)博弈的整體環(huán)境(即自然狀況及其他參與人的特征根據(jù)參與人對(duì)博弈的整體環(huán)境(即自然狀況及其他參與人的特征、偏好和策略)是否有全面而準(zhǔn)
25、確的知識(shí),博弈可劃分為完全信、偏好和策略)是否有全面而準(zhǔn)確的知識(shí),博弈可劃分為完全信息博弈和不完全信息博弈。完全信息指的是每一個(gè)參與人對(duì)所有息博弈和不完全信息博弈。完全信息指的是每一個(gè)參與人對(duì)所有其他參與人(對(duì)手)的特征、策略空間及支付函數(shù)有全面而準(zhǔn)確其他參與人(對(duì)手)的特征、策略空間及支付函數(shù)有全面而準(zhǔn)確的知識(shí);否則,就是不完全信息。的知識(shí);否則,就是不完全信息。 行動(dòng)順序行動(dòng)順序信息信息 靜靜 態(tài)態(tài) 動(dòng)動(dòng) 態(tài)態(tài) 完全信息完全信息 完全信息靜態(tài)博弈;完全信息靜態(tài)博弈; 納什均衡;納什均衡; 納什(納什(19501950,19511951) 完全信息動(dòng)態(tài)博弈;完全信息動(dòng)態(tài)博弈; 子博弈精煉納什
26、均衡;子博弈精煉納什均衡; 澤爾騰(澤爾騰(19651965)不完全信息不完全信息 不完全信息靜態(tài)博弈;不完全信息靜態(tài)博弈; 貝葉斯納什均衡;貝葉斯納什均衡; 哈薩尼(哈薩尼(1967-19681967-1968) 不完全信息動(dòng)態(tài)博弈;不完全信息動(dòng)態(tài)博弈; 精煉貝葉斯納什均衡;精煉貝葉斯納什均衡; 澤爾騰(澤爾騰(19751975),), Kreps Kreps和和WilsonWilson(19821982),),F(xiàn)udenbergFudenberg和和TiroleTirole(19911991)博弈的分類(lèi)博弈的分類(lèi) 博弈論的討論基于兩條:博弈論的討論基于兩條:參與人都是理性參與人都是理性的,
27、他的目標(biāo)非常明確,就是使自己的效用達(dá)到的,他的目標(biāo)非常明確,就是使自己的效用達(dá)到最大;博弈論中的例子是簡(jiǎn)單而很不實(shí)際的,最大;博弈論中的例子是簡(jiǎn)單而很不實(shí)際的,但是它比一些具體實(shí)際的復(fù)雜的例子更能揭示實(shí)但是它比一些具體實(shí)際的復(fù)雜的例子更能揭示實(shí)質(zhì),使得很多人即使不去學(xué)習(xí)博弈論的理論,也質(zhì),使得很多人即使不去學(xué)習(xí)博弈論的理論,也能理解這些例子中提出的問(wèn)題和分析的方法,這能理解這些例子中提出的問(wèn)題和分析的方法,這是有指導(dǎo)意義的是有指導(dǎo)意義的。所以我們?cè)趯W(xué)習(xí)博弈論的知識(shí)。所以我們?cè)趯W(xué)習(xí)博弈論的知識(shí)時(shí),要注意這些簡(jiǎn)單而典型的例子,學(xué)習(xí)分析問(wèn)時(shí),要注意這些簡(jiǎn)單而典型的例子,學(xué)習(xí)分析問(wèn)題,提出概念,解決問(wèn)
28、題的過(guò)程。題,提出概念,解決問(wèn)題的過(guò)程。三、博弈論的經(jīng)典模型三、博弈論的經(jīng)典模型博弈的分類(lèi)博弈的分類(lèi) 乙乙 坦白坦白 抵賴(lài)抵賴(lài) 坦白坦白 甲甲 抵賴(lài)抵賴(lài) 有兩個(gè)人因?yàn)樯嫦臃缸锒徊?,被警方分別關(guān)在兩個(gè)房間內(nèi)審訊。有兩個(gè)人因?yàn)樯嫦臃缸锒徊?,被警方分別關(guān)在兩個(gè)房間內(nèi)審訊。他們面臨的情況是:如果兩個(gè)人都坦白罪行,那么將各被判處六年有他們面臨的情況是:如果兩個(gè)人都坦白罪行,那么將各被判處六年有期徒刑;如果一方坦白另一方抵賴(lài),那么坦白者從寬,判處一年徒刑,期徒刑;如果一方坦白另一方抵賴(lài),那么坦白者從寬,判處一年徒刑,抗拒者從嚴(yán),判處八年徒刑;如果兩個(gè)人均抵賴(lài),則各被判處兩年徒抗拒者從嚴(yán),判處八年徒刑;
29、如果兩個(gè)人均抵賴(lài),則各被判處兩年徒刑。刑。 這樣,兩個(gè)囚徒面臨的博弈格局如上圖所示,每個(gè)格子中左邊的這樣,兩個(gè)囚徒面臨的博弈格局如上圖所示,每個(gè)格子中左邊的數(shù)字是甲的支付(盈利或得益),右邊是乙的支付(盈利或得益)。數(shù)字是甲的支付(盈利或得益),右邊是乙的支付(盈利或得益)。1.1.囚徒困境囚徒困境(the prisoners dilemma)-6,-6-1,-8-8,-1-2,-2博弈的分類(lèi)博弈的分類(lèi)劃線法劃線法解囚徒困境解囚徒困境 乙乙 坦白坦白 抵賴(lài)抵賴(lài) 坦白坦白 甲甲 抵賴(lài)抵賴(lài) (坦白,坦白):(坦白,坦白): 嚴(yán)格優(yōu)勢(shì)策略嚴(yán)格優(yōu)勢(shì)策略(抵賴(lài),抵賴(lài)):(抵賴(lài),抵賴(lài)): 嚴(yán)格劣勢(shì)策略嚴(yán)格
30、劣勢(shì)策略 實(shí)例思考:實(shí)例思考: 價(jià)格大戰(zhàn)、廣告大戰(zhàn)、優(yōu)惠大戰(zhàn)價(jià)格大戰(zhàn)、廣告大戰(zhàn)、優(yōu)惠大戰(zhàn) 合作:合作: “ “雙贏對(duì)局雙贏對(duì)局”1.1.囚徒困境囚徒困境(the prisoners dilemma)-6,-6-1,-8-8,-1-2,-2博弈的分類(lèi)博弈的分類(lèi)可口可樂(lè)可口可樂(lè)與與百事可樂(lè)百事可樂(lè)的的價(jià)格大戰(zhàn)價(jià)格大戰(zhàn) (單位:億美元)(單位:億美元) 百事可樂(lè)百事可樂(lè) 低價(jià)低價(jià) 高價(jià)高價(jià) 低價(jià)低價(jià) 可口可樂(lè)可口可樂(lè) 高價(jià)高價(jià)(低價(jià),低價(jià)):(低價(jià),低價(jià)): 嚴(yán)格優(yōu)勢(shì)策略嚴(yán)格優(yōu)勢(shì)策略(高價(jià),高價(jià)):(高價(jià),高價(jià)): 嚴(yán)格劣勢(shì)策略嚴(yán)格劣勢(shì)策略多數(shù)情形是非合作博弈多數(shù)情形是非合作博弈 卡特爾卡特爾 幾個(gè)
31、大企業(yè)聯(lián)手或勾結(jié)形成對(duì)行業(yè)的壟幾個(gè)大企業(yè)聯(lián)手或勾結(jié)形成對(duì)行業(yè)的壟斷,謀求最大利潤(rùn)而結(jié)成的聯(lián)盟。斷,謀求最大利潤(rùn)而結(jié)成的聯(lián)盟。 卡特爾不穩(wěn)定卡特爾不穩(wěn)定。 OPECOPEC石油輸出國(guó)組織石油輸出國(guó)組織 1.1.囚徒困境囚徒困境(the prisoners dilemma)-3,-30,-5-5,0-1,-1博弈的分類(lèi)博弈的分類(lèi)箭頭法箭頭法解囚徒困境解囚徒困境 乙乙 坦白坦白 抵賴(lài)抵賴(lài) 坦白坦白 甲甲 抵賴(lài)抵賴(lài)1.1.囚徒困境囚徒困境(the prisoners dilemma)-6,-6-1,-8-8,-1-2,-2博弈的分類(lèi)博弈的分類(lèi) 納什均衡狀態(tài)是市場(chǎng)力量相互作用的穩(wěn)定的結(jié)局。納什均衡狀態(tài)是
32、市場(chǎng)力量相互作用的穩(wěn)定的結(jié)局。 A A B B 0 1 雜貨鋪定位雜貨鋪定位:設(shè)想有一個(gè)小居民點(diǎn),居民住宅沿著一條公路均勻:設(shè)想有一個(gè)小居民點(diǎn),居民住宅沿著一條公路均勻地排開(kāi)?,F(xiàn)在有兩家雜貨鋪要在這個(gè)小居民點(diǎn)開(kāi)張,他們賣(mài)一樣的東地排開(kāi)。現(xiàn)在有兩家雜貨鋪要在這個(gè)小居民點(diǎn)開(kāi)張,他們賣(mài)一樣的東西,價(jià)格也完全一樣。那么,兩家雜貨店開(kāi)在什么地方好呢?西,價(jià)格也完全一樣。那么,兩家雜貨店開(kāi)在什么地方好呢? 商品一樣,價(jià)格也一樣,居民到哪個(gè)雜貨鋪買(mǎi)東西,就看哪個(gè)雜商品一樣,價(jià)格也一樣,居民到哪個(gè)雜貨鋪買(mǎi)東西,就看哪個(gè)雜貨鋪離自己比較近。在雜貨鋪定位的博弈中,地盤(pán)就是市場(chǎng)份額,地貨鋪離自己比較近。在雜貨鋪定位
33、的博弈中,地盤(pán)就是市場(chǎng)份額,地盤(pán)就是經(jīng)濟(jì)利益。兩個(gè)雜貨鋪在市場(chǎng)競(jìng)爭(zhēng)的位置博弈中,位于左邊的盤(pán)就是經(jīng)濟(jì)利益。兩個(gè)雜貨鋪在市場(chǎng)競(jìng)爭(zhēng)的位置博弈中,位于左邊的要向右靠,位于右邊的要向左擠,最后的結(jié)局,是兩家雜貨鋪緊挨著要向右靠,位于右邊的要向左擠,最后的結(jié)局,是兩家雜貨鋪緊挨著位于中點(diǎn)位于中點(diǎn)1/21/2的位置。這就是納什均衡的位置。因?yàn)檎l(shuí)要是單獨(dú)移開(kāi)的位置。這就是納什均衡的位置。因?yàn)檎l(shuí)要是單獨(dú)移開(kāi)“一點(diǎn)一點(diǎn)”,他就會(huì)喪失,他就會(huì)喪失“半點(diǎn)半點(diǎn)”市場(chǎng)份額。所以誰(shuí)都不想偏離中點(diǎn)的位市場(chǎng)份額。所以誰(shuí)都不想偏離中點(diǎn)的位置。置。2.2.雜貨鋪定位博弈雜貨鋪定位博弈博弈的分類(lèi)博弈的分類(lèi) 海灘占位海灘占位:據(jù)說(shuō)西
34、方發(fā)達(dá)國(guó)家的不少男男女女有日光浴的愛(ài)好,因?yàn)樗欣簱?jù)說(shuō)西方發(fā)達(dá)國(guó)家的不少男男女女有日光浴的愛(ài)好,因?yàn)樗欣谏眢w健康?,F(xiàn)在設(shè)想較長(zhǎng)的海灘上比較均勻地散步著許多日光浴者。太陽(yáng)的照于身體健康?,F(xiàn)在設(shè)想較長(zhǎng)的海灘上比較均勻地散步著許多日光浴者。太陽(yáng)的照射使人們需要補(bǔ)充水分。假如有射使人們需要補(bǔ)充水分。假如有A A與與B B兩個(gè)小販來(lái)到海灘,以同樣的價(jià)格、相同的兩個(gè)小販來(lái)到海灘,以同樣的價(jià)格、相同的質(zhì)量向日光浴者提供同一品牌的礦泉水(或啤酒)。在直線狀的海灘上他們應(yīng)當(dāng)質(zhì)量向日光浴者提供同一品牌的礦泉水(或啤酒)。在直線狀的海灘上他們應(yīng)當(dāng)如何合理地安置自己的攤位呢?如何合理地安置自己的攤位呢? 思考思
35、考:在社會(huì)經(jīng)濟(jì)領(lǐng)域內(nèi),有不少現(xiàn)象與上述雜貨鋪定位、海灘占位有著相:在社會(huì)經(jīng)濟(jì)領(lǐng)域內(nèi),有不少現(xiàn)象與上述雜貨鋪定位、海灘占位有著相似之處,從某種意義上也可以用同樣的邏輯進(jìn)行分析和闡述。似之處,從某種意義上也可以用同樣的邏輯進(jìn)行分析和闡述。 超市在商業(yè)街的布局問(wèn)題超市在商業(yè)街的布局問(wèn)題。如果地段的繁華等其他原因可以認(rèn)為相同的話。如果地段的繁華等其他原因可以認(rèn)為相同的話,那么,只要條件許可,超市的幾乎相依為鄰現(xiàn)象完全可以看作公正的市場(chǎng)競(jìng)爭(zhēng),那么,只要條件許可,超市的幾乎相依為鄰現(xiàn)象完全可以看作公正的市場(chǎng)競(jìng)爭(zhēng)的合理結(jié)果。的合理結(jié)果。 同城航空公司航班起飛時(shí)刻確定問(wèn)題同城航空公司航班起飛時(shí)刻確定問(wèn)題。同一
36、城市的兩家航空公司開(kāi)辟飛往。同一城市的兩家航空公司開(kāi)辟飛往同一目的地的航班,常出現(xiàn)他們各自的起飛時(shí)刻被安排在幾乎同一時(shí)間的現(xiàn)象。同一目的地的航班,常出現(xiàn)他們各自的起飛時(shí)刻被安排在幾乎同一時(shí)間的現(xiàn)象。 電視臺(tái)對(duì)節(jié)目的編排問(wèn)題電視臺(tái)對(duì)節(jié)目的編排問(wèn)題。人們對(duì)電視節(jié)目的喜愛(ài)存在著一定的檔次差異。人們對(duì)電視節(jié)目的喜愛(ài)存在著一定的檔次差異,因此電視臺(tái)對(duì)節(jié)目的編排將直接影響到收視率。設(shè)想如果將高雅藝術(shù)節(jié)目與較,因此電視臺(tái)對(duì)節(jié)目的編排將直接影響到收視率。設(shè)想如果將高雅藝術(shù)節(jié)目與較低檔趣味的節(jié)目比作海灘的兩端,那么觀賞電視節(jié)目的觀眾就相當(dāng)于散步在海灘低檔趣味的節(jié)目比作海灘的兩端,那么觀賞電視節(jié)目的觀眾就相當(dāng)于散
37、步在海灘上的日光浴者。因此不少電視臺(tái)常將黃金播放時(shí)段的文藝節(jié)目定位于中等趣味以上的日光浴者。因此不少電視臺(tái)常將黃金播放時(shí)段的文藝節(jié)目定位于中等趣味以提高自己的收視率。此外,各電視臺(tái)中一些內(nèi)容雖然不同但情調(diào)卻差不多的娛樂(lè)提高自己的收視率。此外,各電視臺(tái)中一些內(nèi)容雖然不同但情調(diào)卻差不多的娛樂(lè)節(jié)目,常在播放時(shí)間上撞車(chē)。節(jié)目,常在播放時(shí)間上撞車(chē)。 海灘占位問(wèn)題在政治學(xué)中也可以找到類(lèi)似的案例海灘占位問(wèn)題在政治學(xué)中也可以找到類(lèi)似的案例。2.2.雜貨鋪定位博弈雜貨鋪定位博弈博弈的分類(lèi)博弈的分類(lèi) 女方女方 足球足球 芭蕾芭蕾 足球足球 男方男方 芭蕾芭蕾 情侶博弈與經(jīng)濟(jì)決策的關(guān)系情侶博弈與經(jīng)濟(jì)決策的關(guān)系 兩個(gè)
38、相鄰的企業(yè)都要解決各自的供水問(wèn)題。如果他們各干各的,成本就會(huì)兩個(gè)相鄰的企業(yè)都要解決各自的供水問(wèn)題。如果他們各干各的,成本就會(huì)比較高,效益就沒(méi)有那么好。如果兩個(gè)企業(yè)聯(lián)合起來(lái)一起投資建設(shè)共用的供水比較高,效益就沒(méi)有那么好。如果兩個(gè)企業(yè)聯(lián)合起來(lái)一起投資建設(shè)共用的供水系統(tǒng),效益就會(huì)比較好。但是在選定合作方案的時(shí)候,由于各種因素,在攜手系統(tǒng),效益就會(huì)比較好。但是在選定合作方案的時(shí)候,由于各種因素,在攜手合作的大前提下,還是可能有小算盤(pán)的考慮。你想這樣,他想那樣,這也是人合作的大前提下,還是可能有小算盤(pán)的考慮。你想這樣,他想那樣,這也是人之常情。這種合作比不合作好,但是在合作的大局下面又不免有小算盤(pán)、不免
39、之常情。這種合作比不合作好,但是在合作的大局下面又不免有小算盤(pán)、不免打小九九的對(duì)局,這就是情侶博弈。打小九九的對(duì)局,這就是情侶博弈。3.3.情侶博弈情侶博弈(Battle of sexes)2,10,0-1,-11,2博弈的分類(lèi)博弈的分類(lèi) 乙乙 獵鹿獵鹿 打兔打兔 獵鹿獵鹿 甲甲 打兔打兔 4 4只兔子管只兔子管4 4天,天,1 1只鹿各管只鹿各管1010天。天。 經(jīng)濟(jì)體制改革:經(jīng)濟(jì)體制改革: 蘇歐蘇歐“振蕩療法振蕩療法”或或“休克療法休克療法”,一步到位,社會(huì)損失大;中國(guó),一步到位,社會(huì)損失大;中國(guó)“漸進(jìn)式改革漸進(jìn)式改革”、“摸著石頭過(guò)河摸著石頭過(guò)河”,社會(huì)損失小,社會(huì)損失小, 體制外體制外
40、 體制內(nèi)體制內(nèi)4.4.獵人博弈和帕累托優(yōu)勢(shì)獵人博弈和帕累托優(yōu)勢(shì)10,100,44,04,4博弈的分類(lèi)博弈的分類(lèi) B B雞雞 進(jìn)進(jìn) 退退 進(jìn)進(jìn) A A雞雞 退退 兩只雞兩只雞A A和和B B過(guò)獨(dú)木橋,雙方都可以選擇進(jìn)退,如果雙方過(guò)獨(dú)木橋,雙方都可以選擇進(jìn)退,如果雙方都選擇進(jìn),則雙方就都成了落湯雞。如果一進(jìn)一退,則有一都選擇進(jìn),則雙方就都成了落湯雞。如果一進(jìn)一退,則有一方可以過(guò)橋,另一方收益為方可以過(guò)橋,另一方收益為0 0。各自的收益如上圖所示。各自的收益如上圖所示。 在這個(gè)博弈問(wèn)題中,一進(jìn)一退是博弈的格局。在這個(gè)博弈問(wèn)題中,一進(jìn)一退是博弈的格局。 5.5.斗雞博弈斗雞博弈-3,-32,00,20
41、,0博弈的分類(lèi)博弈的分類(lèi) 小豬小豬 按按 等等 按按 大豬大豬 等等 豬圈里有一大一小兩頭豬,豬圈的一端有一個(gè)豬食槽,另一端安裝豬圈里有一大一小兩頭豬,豬圈的一端有一個(gè)豬食槽,另一端安裝了一個(gè)控制豬食供應(yīng)的按鈕。按一下按鈕會(huì)有了一個(gè)控制豬食供應(yīng)的按鈕。按一下按鈕會(huì)有1010個(gè)單位的豬食進(jìn)槽,但個(gè)單位的豬食進(jìn)槽,但誰(shuí)按按鈕誰(shuí)就需付出相當(dāng)于誰(shuí)按按鈕誰(shuí)就需付出相當(dāng)于2 2個(gè)單位豬食的成本。個(gè)單位豬食的成本。 大豬先到:大豬先到: 大豬吃大豬吃9 9個(gè),小豬吃個(gè),小豬吃1 1個(gè)個(gè) 同時(shí)到:同時(shí)到: 大豬吃大豬吃7 7個(gè),小豬吃個(gè),小豬吃3 3個(gè)個(gè) 小豬先到:小豬先到: 大豬吃大豬吃6 6個(gè),小豬吃個(gè),
42、小豬吃4 4個(gè)個(gè)6.6.智豬博弈和搭便車(chē)行為智豬博弈和搭便車(chē)行為5,14,49,-10,0博弈的分類(lèi)博弈的分類(lèi) 乙乙 受賄受賄 不受賄不受賄 受賄受賄 甲甲 不受賄不受賄 實(shí)際上許多博弈問(wèn)題就存在多個(gè)實(shí)際上許多博弈問(wèn)題就存在多個(gè)Nash均衡解,這為預(yù)均衡解,這為預(yù)測(cè)帶來(lái)困難,引起測(cè)帶來(lái)困難,引起Nash均衡解的精煉問(wèn)題。均衡解的精煉問(wèn)題。 并且不是任何問(wèn)題都有純策略并且不是任何問(wèn)題都有純策略Nash均衡解。均衡解。7.7.串謀博弈和高薪養(yǎng)廉串謀博弈和高薪養(yǎng)廉9,90,88,07,7博弈的分類(lèi)博弈的分類(lèi) 守衛(wèi)守衛(wèi) 睡睡 不睡不睡 偷偷 小偷小偷 不偷不偷 一小偷欲偷竊有一守衛(wèi)看守的倉(cāng)庫(kù),如果小偷
43、去偷竊時(shí)守衛(wèi)在睡一小偷欲偷竊有一守衛(wèi)看守的倉(cāng)庫(kù),如果小偷去偷竊時(shí)守衛(wèi)在睡覺(jué),則小偷就能得手,假設(shè)小偷得手可得價(jià)值為覺(jué),則小偷就能得手,假設(shè)小偷得手可得價(jià)值為V V的贓物;但如果小的贓物;但如果小偷去偷竊時(shí)守衛(wèi)沒(méi)有睡覺(jué),則小偷就要被抓住,如被抓住則要坐牢,偷去偷竊時(shí)守衛(wèi)沒(méi)有睡覺(jué),則小偷就要被抓住,如被抓住則要坐牢,坐牢的負(fù)效用為坐牢的負(fù)效用為-P(-P(設(shè)其單位與贓物的價(jià)值相同設(shè)其單位與贓物的價(jià)值相同) ),再設(shè)守衛(wèi)睡覺(jué)而未,再設(shè)守衛(wèi)睡覺(jué)而未被偷則有被偷則有S S的正效用;睡覺(jué)遭偷則要被解雇,解雇的負(fù)效用為的正效用;睡覺(jué)遭偷則要被解雇,解雇的負(fù)效用為-D-D,其,其單位與單位與S S的單位相同。
44、如果小偷不偷,則他既無(wú)得也無(wú)失;守衛(wèi)不睡的單位相同。如果小偷不偷,則他既無(wú)得也無(wú)失;守衛(wèi)不睡則出一份力掙一份工資同樣也是既無(wú)得也無(wú)失。則出一份力掙一份工資同樣也是既無(wú)得也無(wú)失。 8.8.小偷與守衛(wèi)的博弈小偷與守衛(wèi)的博弈V,-D-P,00,S0,0圖解方法圖解方法求解求解守衛(wèi)期守衛(wèi)期 小偷期小偷期 望得益望得益 望得益望得益 (睡)(睡)S S (偷)(偷) V Pt* 小偷偷小偷偷 Pg* 守衛(wèi)睡守衛(wèi)睡 0 Pt 1 的概率的概率 0 Pg 1 的概率的概率 D -P D -P (a) (b)圖圖 小偷與守衛(wèi)的混合策略小偷與守衛(wèi)的混合策略8.8.小偷與守衛(wèi)的博弈小偷與守衛(wèi)的博弈代數(shù)方法代數(shù)方法
45、求解求解 設(shè)小偷選擇偷的概率為設(shè)小偷選擇偷的概率為p pt t,則選擇不偷的概率為,則選擇不偷的概率為1-P1-Pt t,那么守衛(wèi),那么守衛(wèi)選擇睡覺(jué)的期望支付為選擇睡覺(jué)的期望支付為E E睡睡=(-D)=(-D)P Pt tS S(1-P(1-Pt t)=S-()=S-(D+S)D+S)P Pt t 守衛(wèi)選擇不睡覺(jué)的期望支付為守衛(wèi)選擇不睡覺(jué)的期望支付為E E不睡不睡=0=0P Pt t0 0(1-P(1-Pt t)=0)=0 要達(dá)到一種均衡狀態(tài),小偷選擇偷與不偷不能讓守衛(wèi)在選擇睡覺(jué)要達(dá)到一種均衡狀態(tài),小偷選擇偷與不偷不能讓守衛(wèi)在選擇睡覺(jué)與不睡覺(jué)之間有明顯的傾向性。因此,必然有與不睡覺(jué)之間有明顯的
46、傾向性。因此,必然有E E睡睡= E= E不睡不睡于是可求得于是可求得 當(dāng)當(dāng)D D不變,而不變,而S S增加時(shí),增加時(shí),P Pt t會(huì)增加;而當(dāng)會(huì)增加;而當(dāng)S S不變,增加不變,增加D D時(shí),時(shí),P Pt t會(huì)降會(huì)降低。由此可見(jiàn),加重對(duì)失職守衛(wèi)的懲罰,在長(zhǎng)期中會(huì)起到抑制盜竊的低。由此可見(jiàn),加重對(duì)失職守衛(wèi)的懲罰,在長(zhǎng)期中會(huì)起到抑制盜竊的作用;當(dāng)對(duì)守衛(wèi)實(shí)施的懲罰不變,而提高其待遇,意味著作用;當(dāng)對(duì)守衛(wèi)實(shí)施的懲罰不變,而提高其待遇,意味著S S的增加,的增加,反而會(huì)使盜竊現(xiàn)象更為嚴(yán)重(反而會(huì)使盜竊現(xiàn)象更為嚴(yán)重(P Pt t增加)。增加)。8.8.小偷與守衛(wèi)的博弈小偷與守衛(wèi)的博弈tSpSD 設(shè)守衛(wèi)選擇
47、睡的概率為設(shè)守衛(wèi)選擇睡的概率為p pg g,則選擇不睡的概率為,則選擇不睡的概率為1-p1-pg g,那么小偷選,那么小偷選擇偷的期望支付為擇偷的期望支付為 小偷選擇不偷的期望支付為小偷選擇不偷的期望支付為 要達(dá)到一種均衡狀態(tài),守衛(wèi)選擇睡與不睡不能讓小偷在選擇偷與不要達(dá)到一種均衡狀態(tài),守衛(wèi)選擇睡與不睡不能讓小偷在選擇偷與不偷之間有明顯的傾向性。因此,必然有偷之間有明顯的傾向性。因此,必然有于是可求得于是可求得 當(dāng)當(dāng)V V不變,而不變,而P P增加時(shí),增加時(shí),p pg g會(huì)增加,由此可見(jiàn),加重對(duì)小偷的懲罰雖會(huì)增加,由此可見(jiàn),加重對(duì)小偷的懲罰雖然在短期中能抑制盜竊,但在長(zhǎng)期中卻只能使守衛(wèi)多睡覺(jué)(然
48、在短期中能抑制盜竊,但在長(zhǎng)期中卻只能使守衛(wèi)多睡覺(jué)(p pg g增加),增加),盜竊的情況卻不會(huì)有什么改善,反而,由于守衛(wèi)選擇睡覺(jué)的概率增加了盜竊的情況卻不會(huì)有什么改善,反而,由于守衛(wèi)選擇睡覺(jué)的概率增加了,小偷選擇偷的概率會(huì)增加,長(zhǎng)期來(lái)看盜竊現(xiàn)象甚至?xí)鼮閲?yán)重。,小偷選擇偷的概率會(huì)增加,長(zhǎng)期來(lái)看盜竊現(xiàn)象甚至?xí)鼮閲?yán)重。 8.8.小偷與守衛(wèi)的博弈小偷與守衛(wèi)的博弈gPpVPEE偷不偷() (1)()gggEVpPpVPpP 偷00 (1)0ggEpp 不睡 蜈蚣博弈模型是蜈蚣博弈模型是RosenthsalRosenthsal在在19811981年提出的,它是動(dòng)態(tài)年提出的,它是動(dòng)態(tài)博弈的例子,其模型稱(chēng)
49、為擴(kuò)展型博弈模型,是用樹(shù)來(lái)對(duì)博弈博弈的例子,其模型稱(chēng)為擴(kuò)展型博弈模型,是用樹(shù)來(lái)對(duì)博弈過(guò)程做結(jié)構(gòu)化處理。過(guò)程做結(jié)構(gòu)化處理。 A A A A A A A A A A A A (100,100)(100,100) D D D D D DD D D D D D (1,1) (0,3) (98,98) (97,100)(99,99) (98,101)(1,1) (0,3) (98,98) (97,100)(99,99) (98,101) 這個(gè)博弈的結(jié)果是(這個(gè)博弈的結(jié)果是(1 1,1 1)。)。 求解過(guò)程要用到逆向歸納法,即從動(dòng)態(tài)博弈的最后一個(gè)求解過(guò)程要用到逆向歸納法,即從動(dòng)態(tài)博弈的最后一個(gè)階段博弈方的
50、行為開(kāi)始分析,逐步倒推回前一個(gè)階段相應(yīng)博階段博弈方的行為開(kāi)始分析,逐步倒推回前一個(gè)階段相應(yīng)博弈方的行為選擇,一直到第一個(gè)階段的分析方法。弈方的行為選擇,一直到第一個(gè)階段的分析方法。9.9.蜈蚣博弈蜈蚣博弈1.1.重復(fù)剔除嚴(yán)格劣勢(shì)策略法重復(fù)剔除嚴(yán)格劣勢(shì)策略法 下面用一個(gè)例子說(shuō)明重復(fù)剔除嚴(yán)格劣勢(shì)策略的求解方法。下面用一個(gè)例子說(shuō)明重復(fù)剔除嚴(yán)格劣勢(shì)策略的求解方法。 博弈方博弈方 左左 中中 右右 上上 博弈方博弈方 下下 首先由上表可知,博弈方首先由上表可知,博弈方與與都沒(méi)有優(yōu)勢(shì)策略,所以不存在優(yōu)都沒(méi)有優(yōu)勢(shì)策略,所以不存在優(yōu)勢(shì)策略均衡解。從博弈方勢(shì)策略均衡解。從博弈方來(lái)看,其上下策略中沒(méi)有哪一個(gè)是嚴(yán)格
51、劣來(lái)看,其上下策略中沒(méi)有哪一個(gè)是嚴(yán)格劣勢(shì)策略,但從博弈方勢(shì)策略,但從博弈方來(lái)看,右策略嚴(yán)格劣于中策略,故可將右策略來(lái)看,右策略嚴(yán)格劣于中策略,故可將右策略剔除。這時(shí)就簡(jiǎn)化為下表表示的博弈。剔除。這時(shí)就簡(jiǎn)化為下表表示的博弈。四、四、NashNash均衡解的求解方法均衡解的求解方法1,01,30,10,40,22,0博弈方博弈方 左左 中中 上上 博弈方博弈方 下下 觀察上表的博弈又可發(fā)現(xiàn),觀察上表的博弈又可發(fā)現(xiàn),“下下”是博弈方是博弈方的嚴(yán)格劣勢(shì)策略,的嚴(yán)格劣勢(shì)策略,因此下策略可剔除,這樣又可得表如下。因此下策略可剔除,這樣又可得表如下。 博弈方博弈方2 2 左左 中中 博弈方博弈方1 1 上上
52、 觀察上表又發(fā)現(xiàn),左是博弈方觀察上表又發(fā)現(xiàn),左是博弈方的嚴(yán)格劣勢(shì)策略,剔除左策略就的嚴(yán)格劣勢(shì)策略,剔除左策略就得博弈的均衡解(上,中)。得博弈的均衡解(上,中)。純策略純策略NashNash均衡解的求解方法均衡解的求解方法1,01,30,40,21.01,3 數(shù)學(xué)上已經(jīng)證明,在數(shù)學(xué)上已經(jīng)證明,在n n人博弈人博弈G=SG=S1 1, ,S Sn n;u;u1 1,u,un n 中中,重復(fù)剔除嚴(yán)格劣勢(shì)策略最后若只剩下唯一的策略對(duì),則此,重復(fù)剔除嚴(yán)格劣勢(shì)策略最后若只剩下唯一的策略對(duì),則此策略對(duì)一定是純策略對(duì)一定是純NashNash均衡解;而且重復(fù)剔除嚴(yán)格劣勢(shì)策略不均衡解;而且重復(fù)剔除嚴(yán)格劣勢(shì)策略不
53、會(huì)消去會(huì)消去NashNash均衡解。由此可見(jiàn),在求均衡解。由此可見(jiàn),在求NashNash均衡解前,先用重均衡解前,先用重復(fù)剔除嚴(yán)格劣勢(shì)策略法,即使常常不能求出復(fù)剔除嚴(yán)格劣勢(shì)策略法,即使常常不能求出NashNash均衡解,也均衡解,也可能簡(jiǎn)化博弈問(wèn)題。可能簡(jiǎn)化博弈問(wèn)題。 重復(fù)剔除嚴(yán)格劣勢(shì)策略與純策略重復(fù)剔除嚴(yán)格劣勢(shì)策略與純策略NashNash均衡解的關(guān)系均衡解的關(guān)系 2.2.劃線法劃線法 下面用同一個(gè)例子來(lái)介紹求解純策略下面用同一個(gè)例子來(lái)介紹求解純策略NashNash均衡解的劃線法。均衡解的劃線法。 博弈方博弈方 左左 中中 右右 上上 博弈方博弈方 下下 博弈方博弈方考慮,若考慮,若方取左策略
54、,自己的最大收益為方取左策略,自己的最大收益為1 1,故在,故在1 1下面劃一條下面劃一條短線;若短線;若方取中策略,自己的最大收益也為方取中策略,自己的最大收益也為1 1,故在第二列數(shù)字,故在第二列數(shù)字1 1下面劃一條下面劃一條短線;若短線;若方取右策略,自己的最大收益為方取右策略,自己的最大收益為2 2,故在,故在2 2下面劃一條短線。博弈方下面劃一條短線。博弈方也作同樣考慮,給數(shù)字也作同樣考慮,給數(shù)字3 3、數(shù)字、數(shù)字4 4下面都劃了短線。最后數(shù)對(duì)下面都劃了短線。最后數(shù)對(duì)1 1,3 3下面都有短下面都有短劃線,對(duì)應(yīng)的策略對(duì)為(上,中),這樣劃線法就求得此博弈的解。劃線,對(duì)應(yīng)的策略對(duì)為(上
55、,中),這樣劃線法就求得此博弈的解。 劃線法的思路是,每個(gè)博弈方找出在其他博弈方每一個(gè)策略或策略組合下劃線法的思路是,每個(gè)博弈方找出在其他博弈方每一個(gè)策略或策略組合下的自己的最佳收益并劃一條線,那么若某組數(shù)都被劃線,就意味著這組數(shù)中的的自己的最佳收益并劃一條線,那么若某組數(shù)都被劃線,就意味著這組數(shù)中的每一個(gè)都是在別人策略固定時(shí)自己的最佳收益,因此誰(shuí)也不愿意單方面改變自每一個(gè)都是在別人策略固定時(shí)自己的最佳收益,因此誰(shuí)也不愿意單方面改變自己的與此最佳收益對(duì)應(yīng)的策略,根據(jù)己的與此最佳收益對(duì)應(yīng)的策略,根據(jù)NashNash均衡解的定義,這時(shí)的策略組合就是均衡解的定義,這時(shí)的策略組合就是NashNash均
56、衡解。均衡解。劃線法劃線法1,01,30,10,40,22,0 3.3.反應(yīng)函數(shù)法反應(yīng)函數(shù)法 實(shí)際上實(shí)際上NashNash均衡解的概念也可推廣到連續(xù)策略、無(wú)限策略的博弈中。這時(shí)均衡解的概念也可推廣到連續(xù)策略、無(wú)限策略的博弈中。這時(shí)常常用反應(yīng)函數(shù)法來(lái)求常常用反應(yīng)函數(shù)法來(lái)求NashNash均衡解。均衡解。 反應(yīng)函數(shù)即一博弈方對(duì)另一博弈方每一可能策略的最佳反應(yīng)策略所構(gòu)成的反應(yīng)函數(shù)即一博弈方對(duì)另一博弈方每一可能策略的最佳反應(yīng)策略所構(gòu)成的函數(shù)。函數(shù)。 例例 設(shè)博弈雙方的策略變量分別為設(shè)博弈雙方的策略變量分別為q q1 1及及q q2 2,q q1 1及及q q2 2都在區(qū)間都在區(qū)間(0(0,20)20)
57、取值,取值,雙方同時(shí)選擇策略。雙方同時(shí)選擇策略。 博弈方博弈方1 1與與2 2的收益函數(shù)分別為的收益函數(shù)分別為u u1 1,u u2 2且且u u1 1=6q=6q1 1-q-q1 1q q2 2-q-q1 12 2u u2 2=6q=6q2 2-q-q1 1q q2 2-q-q2 22 2 博弈方博弈方1 1針對(duì)博弈方針對(duì)博弈方2 2的任一策略的任一策略q q2 2的策略選擇是求最大化問(wèn)題的策略選擇是求最大化問(wèn)題Max uMax u1 1=max(6q=max(6q1 1-q-q1 1q q2 2-q-q1 12 2) ) q q1 1令令u u1 1對(duì)對(duì)q q1 1的導(dǎo)數(shù)等于零,可得的導(dǎo)數(shù)
58、等于零,可得q q1 1=R=R1 1(q(q2 2)=1/2(6-q)=1/2(6-q2 2) )這就是博弈方這就是博弈方1 1對(duì)博弈方對(duì)博弈方2 2任一策略任一策略q q2 2的最佳反應(yīng),即是其反應(yīng)函數(shù)。的最佳反應(yīng),即是其反應(yīng)函數(shù)。 同樣,博弈方同樣,博弈方2 2針對(duì)博弈方針對(duì)博弈方1 1的任一策略的任一策略q q1 1的策略選擇是求解最大化問(wèn)題的策略選擇是求解最大化問(wèn)題Max uMax u2 2=max(6q=max(6q2 2-q-q1 1q q2 2-q-q2 22 2) ) q q2 2博弈方博弈方2 2對(duì)博弈方對(duì)博弈方1 1任一策略任一策略q q1 1的最佳反應(yīng),即反應(yīng)函數(shù)為的最
59、佳反應(yīng),即反應(yīng)函數(shù)為q q2 2=R=R2 2(q(q1 1)=1/2(6-q)=1/2(6-q1 1) ) 顯然可用坐標(biāo)平面的兩條直線表示這兩條反應(yīng)函數(shù),如圖所示。顯然可用坐標(biāo)平面的兩條直線表示這兩條反應(yīng)函數(shù),如圖所示。 反應(yīng)函數(shù)法反應(yīng)函數(shù)法 q q2 2 (0,6) (0,6) R R1 1(q(q2 2) ) (0,3) (0,3) (2,2) (2,2) 2 R 2 R2 2(q(q1 1) ) 0 2 (6,0) 0 2 (6,0) 如圖可得這兩條反應(yīng)函數(shù)直線的交點(diǎn)為如圖可得這兩條反應(yīng)函數(shù)直線的交點(diǎn)為(2(2,2)2),(2(2,2)2)即為即為NashNash均衡解均衡解,因?yàn)檫@是
60、博弈雙方共同的最佳反應(yīng)點(diǎn),因而誰(shuí)也不愿意單方面離開(kāi)這,因?yàn)檫@是博弈雙方共同的最佳反應(yīng)點(diǎn),因而誰(shuí)也不愿意單方面離開(kāi)這一點(diǎn)。當(dāng)然用求解方程組的方法也可求出此問(wèn)題的一點(diǎn)。當(dāng)然用求解方程組的方法也可求出此問(wèn)題的NashNash均衡解。均衡解。反應(yīng)函數(shù)法反應(yīng)函數(shù)法 在沒(méi)有純策略在沒(méi)有純策略NashNash均衡解時(shí),可以尋找混合策略均衡解時(shí),可以尋找混合策略NashNash均衡解。均衡解。 定義定義:對(duì)策略式博弈:對(duì)策略式博弈G=SG=S1 1,S,Sn n;u;u1 1,u,un n ,假設(shè)博弈方,假設(shè)博弈方i i的策略的策略集合為集合為S Si i=s=si1i1,s sikik ,p pikik表示
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 豪雅新樂(lè)學(xué)合同內(nèi)容
- 工程類(lèi)施工合同法條
- 2025年??谪涍\(yùn)資格證考試口訣
- 山東能源設(shè)施建設(shè)合同
- 漁業(yè)設(shè)施個(gè)人承包施工合同
- 節(jié)能建筑招投標(biāo)模板
- 運(yùn)輸合同中裝卸義務(wù)解析
- 電子信息企業(yè)消防管理規(guī)章
- 保利影視基地招投標(biāo)操作指南
- 旅游景點(diǎn)食堂租賃合同
- 2024年專(zhuān)業(yè)技術(shù)人員繼續(xù)教育公需科目-綠色發(fā)展-節(jié)約資源和保護(hù)環(huán)境筆試歷年真題薈萃含答案
- 群眾性活動(dòng)安全管理培訓(xùn)模板
- 《第八課 我的身體》參考課件
- 四川省巴中市2023-2024學(xué)年高二1月期末生物試題【含答案解析】
- 嬰幼兒托育服務(wù)與管理的職業(yè)生涯規(guī)劃職業(yè)目標(biāo)自我分析職業(yè)定位實(shí)施計(jì)劃
- 全科教學(xué)查房糖尿病620課件
- 行政復(fù)議意見(jiàn)書(shū)
- 環(huán)境土壤學(xué)課件
- 《生產(chǎn)安全事故報(bào)告和調(diào)查處理?xiàng)l例》知識(shí)考題及答案
- 看圖猜成語(yǔ)完
- 汽車(chē)尾燈控制電路的設(shè)計(jì)仿真
評(píng)論
0/150
提交評(píng)論