博弈論與納什均衡

上傳人：風(fēng)*** IP屬地：貴州上傳時間：2023-05-15 格式：DOC 頁數(shù)：13 大小：37.50KB 積分：7.2 舉報 版權(quán)申訴

已閱讀5頁，還剩8頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

博弈論與納什均衡博弈論與納什均衡《博弈論與納什均衡理論》姓名張賀祺學(xué)號2023010404專業(yè)政治經(jīng)濟(jì)學(xué)指導(dǎo)老師張秉云摘要博弈論是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題，具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法，也是運(yùn)籌學(xué)的一個重要學(xué)科。博弈論考慮游戲中的個體的預(yù)測行為和實(shí)際行為，并研究它們的優(yōu)化策略。納什均衡指的是這樣一種戰(zhàn)略組合，這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下，沒有人有足夠理由打破這種均衡。納什均衡，從實(shí)質(zhì)上說，是一種非合作博弈狀態(tài)。關(guān)鍵字：博弈論；納什均衡；合作博弈；非合作博弈目錄摘要(2)關(guān)鍵字(2)一、引言(4)二、博弈論與納什均衡的主要內(nèi)容(4)（一）博弈論的主要思想(4)（二）博弈論的分類(5)三、經(jīng)典案例(7)（一）博弈論的經(jīng)典案例(7)（二）納什均衡經(jīng)典案例(7)四、博弈論和納什均衡的重要影響(8)（一）博弈論的重要影響(8)（二）納什均衡的重要影響(8)參考文獻(xiàn)(9)博弈論與納什均衡理論一、引言近代對于博弈論的研究，開始于策墨咯（Zermelo），波雷爾（Borel）及馮·諾伊曼（vonNeumann）。1928年，馮·諾依曼證明了博弈論的基本原理，從而宣告了博弈論的正式誕生。1944年，馮·諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經(jīng)濟(jì)行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟(jì)領(lǐng)域，從而奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950～1951年，約翰·福布斯·納什（JohnForbesNashJr）利用不動點(diǎn)定理證明了均衡點(diǎn)的存在，為博弈論的一般化奠定了堅實(shí)的基礎(chǔ)。納什的開創(chuàng)性論文《n人博弈的均衡點(diǎn)》（1950），《非合作博弈》（1951）等等，給出了納什均衡的概念和均衡存在定理。此外，塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。今天博弈論已發(fā)展成一門較完善的學(xué)科。博弈論（GameTheory）:亦名“對策論”、“賽局理論”，屬應(yīng)用數(shù)學(xué)的一個分支，主要研究公式化了的激勵結(jié)構(gòu)間的相互作用。是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題，具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。也是運(yùn)籌學(xué)的一個重要學(xué)科。博弈論考慮游戲中的個體的預(yù)測行為和實(shí)際行為，并研究它們的優(yōu)化策略。納什均衡：（Nashequilibrium）又稱為非合作博弈均衡，是博弈論的一個重要術(shù)語，以約翰·納什命名。假設(shè)有n人局中人參與博弈，給定其他人策略的條件下，每個局中人選擇自己的最優(yōu)策略（個人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略），從而使自己利益最大化。所有局中人策略構(gòu)成一個策略組合（StrategyProfile）。納什均衡指的是這樣一種戰(zhàn)略組合，這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下，沒有人有足夠理由打破這種均衡。納什均衡，從實(shí)質(zhì)上說，是一種非合作博弈狀態(tài)。二、博弈論與納什均衡的主要內(nèi)容（一）博弈論的主要思想一個完整的博弈應(yīng)當(dāng)包括五個方面的內(nèi)容：第一，博弈的參加者，即博弈過程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個人和組織；第二，博弈信息，即博弈者所掌握的對選擇策略有幫助的情報資料；第三，博弈方可選擇的全部行為或策略的集合；第四，博弈的次序，即博弈參加者做出策略選擇的先后；第五，博弈方的收益，即各博弈方做出決策選擇后的所得和所失。博弈論模型可以用五個方面來描述:G={P,AS,I,U)P：為局中人，博弈的參與者，也稱為博弈方，局中人是能夠獨(dú)立決策，獨(dú)立承擔(dān)責(zé)任的個人或組織，局中人以最終實(shí)現(xiàn)自身利益最大化為目標(biāo)。決策人：在博弈中率先做出決策的一方，這一方往往依據(jù)自身的感受、經(jīng)驗和表面狀態(tài)優(yōu)先采取一種有方向性的行動。對抗者：在博弈二人對局中行動滯后的那個人，與決策人要做出基本反面的決定，并且他的動作是滯后的、默認(rèn)的、被動的，但最終占優(yōu)。他的策略可能依賴于決策人劣勢的策略選擇，因此對抗是唯一占優(yōu)的方式，實(shí)為領(lǐng)導(dǎo)人的階段性終結(jié)行為。局中人（players）：在一場競賽或博弈中，每一個有決策權(quán)的參與者成為一個局中人。只有兩個局中人的博弈現(xiàn)象稱為兩人博弈，而多于兩個局中人的博弈稱為多人博弈。A：為各局中人的所有可能的策略或行動的集合。根據(jù)該集合是有限還是無限，可分為有限博弈和無限博弈，后者表現(xiàn)為連續(xù)對策、重復(fù)博弈和微分對策等。策略(strategy)：一局博弈中，每個局中人都有選擇實(shí)際可行的完整的行動方案，即方案不是某階段的行動方案，而是指導(dǎo)整個行動的一個方案，一個局中人的一個可行的自始至終全局籌劃的一個行動方案，稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略，則稱為“有限博弈”，否則稱為“無限博弈”。S:博弈的進(jìn)程：也是博弈進(jìn)行的次序、局中人同時行動的一次性決策的博弈，稱為靜態(tài)博弈；局中人行動有先后次序，稱為動態(tài)博弈。I:博弈信息，能夠影響最后博弈結(jié)局的所有局中人的情報。信息在博弈中占重要的地位，博弈的贏得很大程度上依賴于信息的準(zhǔn)確度與多寡。得益信息是博弈中的重要信息，如果博弈各方對各種局勢下所有局中人的得益狀況完全清楚，稱之為完全信息博弈。反之為不完全信息博弈。在動態(tài)博弈中還有一類信息：輪到行動的博弈方是否完全了解此前對方的行動。如果完全了解則稱之為具有完美信息的博弈。反之稱為不完美信息的動態(tài)博弈。由于信息不完美，博弈的結(jié)果只能是概率期望,而不能像完美信息博弈那樣有確定的結(jié)果。U:為局中人獲得利益，也是博弈各方追求的最終目標(biāo)。根據(jù)各方得益的不同情況，分為零和博弈與變和博弈。零和博弈中各方利益之間是完全對立的。變和博弈有可能存在合作關(guān)系，爭取雙贏的局面。得失(payoffs)：一局博弈結(jié)局時的結(jié)果稱為得失。每個局中人在一局博弈結(jié)束時的得失，不僅與該局中人自身所選擇的策略有關(guān)，而且與全局中人所取定的一組策略有關(guān)。所以，一局博弈結(jié)束時每個局中人的“得失”是全體局中人所取定的一組策略的函數(shù)，通常稱為支付（payoff）函數(shù)。次序（orders）：各博弈方的決策有先后之分，且一個博弈方要作不止一次的決策選擇，就出現(xiàn)了次序問題；其他要素相同次序不同，博弈就不同。（二）博弈論的分類博弈模型一般分為合作博弈（cooperativegame）和非合作博弈（non-cooperativegame），如圖1.1。合作博弈是以單個參與者的可能行動集合為基本元素，而非合作博弈是以參與人群的可能聯(lián)合行動集合為基本元素（MartinJ.OsborneandArielRubinstein，2000，P2），也就是說，在合作博弈中，博弈中所有參與者都獨(dú)立行動，不存在有約束力的合作、聯(lián)合或聯(lián)盟的關(guān)系，而在非合作博弈中，在一些參與者之間存在著有約束力的合作、聯(lián)合或聯(lián)盟的關(guān)系，并因為這種關(guān)系影響到博弈的結(jié)局。合作博弈強(qiáng)調(diào)的是團(tuán)體理性（collectiverationality）、效率、公正和公平；非合作博弈強(qiáng)調(diào)的是個人理性、個人最優(yōu)決策，其結(jié)果可能是有效率的，也可能是低效率或無效率的（張維迎，1996，P5）。20世紀(jì)50年代，合作博弈的研究達(dá)到鼎盛期，同時開始出現(xiàn)對非合作博弈的研究，此后，博弈論的研究主流逐步轉(zhuǎn)向在非合作博弈領(lǐng)域。有些人認(rèn)為非合作博弈模型比合作博弈更“基本”，但有些人認(rèn)為兩者不相上下（MartinJ.OsborneandArielRubinstein，2000，P2）。合作博弈，有時也叫做聯(lián)盟博弈（coalitionalgame），一般根據(jù)有無轉(zhuǎn)移支付而分為兩類：可轉(zhuǎn)移支付聯(lián)盟博弈（coalitionalgamewithtransferablepayoff）和不可轉(zhuǎn)移支付聯(lián)盟博弈（coalitionalgamewithnon-transferablepayoff）?？赊D(zhuǎn)移支付也叫有旁支付（sidepayment），可轉(zhuǎn)移支付聯(lián)盟博弈假設(shè)博弈中各參與者都用相同的尺度來衡量他們的贏得，且各聯(lián)盟的贏得可以按任意方式在聯(lián)盟成員中分?jǐn)?；否則，就是不可轉(zhuǎn)移支付聯(lián)盟博弈。非合作博弈的分類主要從兩個角度進(jìn)行劃分。一是參與者的行動順序。從這個角度博弈可以分為靜態(tài)博弈（staticgame）和動態(tài)博弈（dynamicgame）。靜態(tài)博弈是指參與者同時選擇行動或雖非同時但后行動者并不知前行動者采取了何種行動；動態(tài)博弈是指參與者的行動有先后順序且后行動者能夠觀察到先行動者所選擇的行動。二是參與者掌握的信息水平。從這個角度，博弈可以分為完全信息博弈和不完全信息博弈。完全信息（completeinformation）指的是每一個參與者對所有其他參與者的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識；否則就是不完全信息（incompleteinformation）。圖1.1博弈的分類綜合上述兩種分類方法，可將非合作博弈分成四類。這四類博弈及其對應(yīng)的均衡概念，大致上反映了20世紀(jì)50年代以來非合作博弈理論的主要進(jìn)展和1994年三位諾貝爾經(jīng)濟(jì)學(xué)將得主的主要貢獻(xiàn)，同時也大致表明了“納什均衡”及其精煉在博弈論發(fā)展中的地位和影響（如表2.1）。表2.1非合作博弈的分類及對應(yīng)的均衡概念、主要貢獻(xiàn)者三、經(jīng)典案例（一）博弈論的經(jīng)典案例智豬博弈（Pigs’payoffs）講的是：豬圈里有兩頭豬，一頭大豬，一頭小豬。豬圈的一邊有個踏板，每踩一下踏板，在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板，另一只豬就有機(jī)會搶先吃到另一邊落下的食物。當(dāng)小豬踩動踏板時，大豬會在小豬跑到食槽之前剛好吃光所有的食物；若是大豬踩動了踏板，則還有機(jī)會在小豬吃完落下的食物之前跑到食槽，爭吃到另一半殘羹。那么，兩只豬各會采取什么策略？答案是：小豬將選擇“搭便車”策略，也就是舒舒服服地等在食槽邊；而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。原因何在？因為，小豬踩踏板將一無所獲，不踩踏板反而能吃上食物。對小豬而言，無論大豬是否踩動踏板，不踩踏板總是好的選擇。反觀大豬，已明知小豬是不會去踩動踏板的，自己親自去踩踏板總比不踩強(qiáng)吧，所以只好親力親為了。槍手博弈：王者的悲哀。三人對槍自決，甲乙丙槍法優(yōu)劣遞減。最后無奈而神奇的結(jié)局，將不取決于同時開槍還是先后開槍，最優(yōu)良的槍手，倒下的概率將最高；而最蹩腳的槍手，存活的希望卻最大。因為沒有人會把威脅最小的槍手列為一號清楚目標(biāo)。在這里，后發(fā)制人的弱勢者將勝出。以弱勝強(qiáng)，絕不是神話。（二）納什均衡經(jīng)典案例和的革命，非合作博弈理論已經(jīng)成為范式的中心……在經(jīng)濟(jì)學(xué)或者與經(jīng)濟(jì)學(xué)原理相關(guān)的金融、會計、營銷和政治科學(xué)等學(xué)科中，現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘消費(fèi)’近期文獻(xiàn)的領(lǐng)域?！奔{什均衡的重要影響可以概括為以下六個方面：（1）改變了經(jīng)濟(jì)學(xué)的體系和結(jié)構(gòu)。非合作博弈論的概念、內(nèi)容、模型和分析工具等，均已滲透到微觀經(jīng)濟(jì)學(xué)、宏觀經(jīng)濟(jì)學(xué)、勞動經(jīng)濟(jì)學(xué)、國際經(jīng)濟(jì)學(xué)、環(huán)境經(jīng)濟(jì)學(xué)等經(jīng)濟(jì)學(xué)科的絕大部分學(xué)科領(lǐng)域，改變了這些學(xué)科領(lǐng)域的內(nèi)容和結(jié)構(gòu)，成為這些學(xué)科領(lǐng)域的基本研究范式和理論分析工具，從而改變了原有經(jīng)濟(jì)學(xué)理論體系中各分支學(xué)科的內(nèi)涵。（2）擴(kuò)展了經(jīng)濟(jì)學(xué)研究經(jīng)濟(jì)問題的范圍。原有經(jīng)濟(jì)學(xué)缺乏將不確定性因素、變動環(huán)境因素以及經(jīng)濟(jì)個體之間的交互作用模式化的有效辦法，因而不能進(jìn)行微觀層次經(jīng)濟(jì)問題的解剖分析。納什均衡及相關(guān)模型分析方法，包括擴(kuò)展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法，為經(jīng)濟(jì)學(xué)家們提供了深入的分析工具。（3）加強(qiáng)了經(jīng)濟(jì)學(xué)研究的深度。納什均衡理論不回避經(jīng)濟(jì)個體之間直接的交互作用，不滿足于對經(jīng)濟(jì)個體之間復(fù)雜經(jīng)濟(jì)關(guān)系的簡單化處理，分析問題時不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律，強(qiáng)調(diào)從微觀個體行為規(guī)律的角度發(fā)現(xiàn)問題的根源，因而可以更深刻準(zhǔn)確地理解和解釋經(jīng)濟(jì)問題。（4）形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問題或經(jīng)濟(jì)關(guān)系，按照經(jīng)典博弈的類型或特征進(jìn)行分類，并根據(jù)相應(yīng)的經(jīng)典博弈的分析方法和模型進(jìn)行研究，將一個領(lǐng)域所取得的經(jīng)驗方便地移植到另一個領(lǐng)域。（5）擴(kuò)大和加強(qiáng)了經(jīng)濟(jì)學(xué)與其他社會科學(xué)、自然科學(xué)的聯(lián)系。納什均衡之所以偉大，就因為它普通，而且普通到幾乎無處不在。納什均衡理論既適用于人類的行為規(guī)律，也適合于人類以外的其他生物的生存、運(yùn)動和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用，使經(jīng)濟(jì)學(xué)與其他社會科學(xué)、自然科學(xué)的聯(lián)系更加緊密，形成了經(jīng)濟(jì)學(xué)與其他學(xué)科相互促進(jìn)的良性循環(huán)。（6）改變了經(jīng)濟(jì)學(xué)的語言和表達(dá)方法。在進(jìn)化博弈論方面相當(dāng)有造詣的坎多利（Kandori，1997）對保羅·薩繆爾森（PaulSamuelson）的名言“你甚至可以使一只鸚鵡變成一個訓(xùn)練有素的經(jīng)濟(jì)學(xué)家，因為它必須學(xué)習(xí)的只有兩個詞，那就是‘供給’和‘需求’”，曾做過一個幽默的引申，他說，“現(xiàn)在這只鸚鵡需要再學(xué)兩個詞，那就是‘納什均衡’”。參考文獻(xiàn)[1]李伯聰，李軍.關(guān)于囚徒困境的幾個問題[J].自然辯證法通訊,2023,(04)[2]丁華,周洋,韓雪峰.“囚徒困境”的引申與啟示[J].職業(yè)時空,2023,(01)[3]馬立強(qiáng).囚徒困境與納什均衡[J].科學(xué)大眾(中學(xué)版),2023，（09）[4]舒尚奇

人人文庫> 全部分類> 教育資料 > 幼兒教育

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論與納什均衡

文檔簡介

溫馨提示

最新文檔

評論

博弈論與納什均衡

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔