博弈論與納什均衡_第1頁
博弈論與納什均衡_第2頁
博弈論與納什均衡_第3頁
博弈論與納什均衡_第4頁
博弈論與納什均衡_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

博弈論與納什均衡博弈論與納什均衡《博弈論與納什均衡理論》姓名張賀祺學號2023010404專業(yè)政治經濟學指導老師張秉云摘要博弈論是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題,具有斗爭或競爭性質現象的數學理論和方法,也是運籌學的一個重要學科。博弈論考慮游戲中的個體的預測行為和實際行為,并研究它們的優(yōu)化策略。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實質上說,是一種非合作博弈狀態(tài)。關鍵字:博弈論;納什均衡;合作博弈;非合作博弈目錄摘要(2)關鍵字(2)一、引言(4)二、博弈論與納什均衡的主要內容(4)(一)博弈論的主要思想(4)(二)博弈論的分類(5)三、經典案例(7)(一)博弈論的經典案例(7)(二)納什均衡經典案例(7)四、博弈論和納什均衡的重要影響(8)(一)博弈論的重要影響(8)(二)納什均衡的重要影響(8)參考文獻(9)博弈論與納什均衡理論一、引言近代對于博弈論的研究,開始于策墨咯(Zermelo),波雷爾(Borel)及馮·諾伊曼(vonNeumann)。1928年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構并將博弈論系統(tǒng)的應用于經濟領域,從而奠定了這一學科的基礎和理論體系。1950~1951年,約翰·福布斯·納什(JohnForbesNashJr)利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎。納什的開創(chuàng)性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。此外,塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。今天博弈論已發(fā)展成一門較完善的學科。博弈論(GameTheory):亦名“對策論”、“賽局理論”,屬應用數學的一個分支,主要研究公式化了的激勵結構間的相互作用。是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題,具有斗爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。博弈論考慮游戲中的個體的預測行為和實際行為,并研究它們的優(yōu)化策略。納什均衡:(Nashequilibrium)又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。假設有n人局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的最優(yōu)策略(個人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己利益最大化。所有局中人策略構成一個策略組合(StrategyProfile)。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實質上說,是一種非合作博弈狀態(tài)。二、博弈論與納什均衡的主要內容(一)博弈論的主要思想一個完整的博弈應當包括五個方面的內容:第一,博弈的參加者,即博弈過程中獨立決策、獨立承擔后果的個人和組織;第二,博弈信息,即博弈者所掌握的對選擇策略有幫助的情報資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。博弈論模型可以用五個方面來描述:G={P,AS,I,U)P:為局中人,博弈的參與者,也稱為博弈方,局中人是能夠獨立決策,獨立承擔責任的個人或組織,局中人以最終實現自身利益最大化為目標。決策人:在博弈中率先做出決策的一方,這一方往往依據自身的感受、經驗和表面狀態(tài)優(yōu)先采取一種有方向性的行動。對抗者:在博弈二人對局中行動滯后的那個人,與決策人要做出基本反面的決定,并且他的動作是滯后的、默認的、被動的,但最終占優(yōu)。他的策略可能依賴于決策人劣勢的策略選擇,因此對抗是唯一占優(yōu)的方式,實為領導人的階段性終結行為。局中人(players):在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為兩人博弈,而多于兩個局中人的博弈稱為多人博弈。A:為各局中人的所有可能的策略或行動的集合。根據該集合是有限還是無限,可分為有限博弈和無限博弈,后者表現為連續(xù)對策、重復博弈和微分對策等。策略(strategy):一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全局籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為“有限博弈”,否則稱為“無限博弈”。S:博弈的進程:也是博弈進行的次序、局中人同時行動的一次性決策的博弈,稱為靜態(tài)博弈;局中人行動有先后次序,稱為動態(tài)博弈。I:博弈信息,能夠影響最后博弈結局的所有局中人的情報。信息在博弈中占重要的地位,博弈的贏得很大程度上依賴于信息的準確度與多寡。得益信息是博弈中的重要信息,如果博弈各方對各種局勢下所有局中人的得益狀況完全清楚,稱之為完全信息博弈。反之為不完全信息博弈。在動態(tài)博弈中還有一類信息:輪到行動的博弈方是否完全了解此前對方的行動。如果完全了解則稱之為具有完美信息的博弈。反之稱為不完美信息的動態(tài)博弈。由于信息不完美,博弈的結果只能是概率期望,而不能像完美信息博弈那樣有確定的結果。U:為局中人獲得利益,也是博弈各方追求的最終目標。根據各方得益的不同情況,分為零和博弈與變和博弈。零和博弈中各方利益之間是完全對立的。變和博弈有可能存在合作關系,爭取雙贏的局面。得失(payoffs):一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全局中人所取定的一組策略有關。所以,一局博弈結束時每個局中人的“得失”是全體局中人所取定的一組策略的函數,通常稱為支付(payoff)函數。次序(orders):各博弈方的決策有先后之分,且一個博弈方要作不止一次的決策選擇,就出現了次序問題;其他要素相同次序不同,博弈就不同。(二)博弈論的分類博弈模型一般分為合作博弈(cooperativegame)和非合作博弈(non-cooperativegame),如圖1.1。合作博弈是以單個參與者的可能行動集合為基本元素,而非合作博弈是以參與人群的可能聯合行動集合為基本元素(MartinJ.OsborneandArielRubinstein,2000,P2),也就是說,在合作博弈中,博弈中所有參與者都獨立行動,不存在有約束力的合作、聯合或聯盟的關系,而在非合作博弈中,在一些參與者之間存在著有約束力的合作、聯合或聯盟的關系,并因為這種關系影響到博弈的結局。合作博弈強調的是團體理性(collectiverationality)、效率、公正和公平;非合作博弈強調的是個人理性、個人最優(yōu)決策,其結果可能是有效率的,也可能是低效率或無效率的(張維迎,1996,P5)。20世紀50年代,合作博弈的研究達到鼎盛期,同時開始出現對非合作博弈的研究,此后,博弈論的研究主流逐步轉向在非合作博弈領域。有些人認為非合作博弈模型比合作博弈更“基本”,但有些人認為兩者不相上下(MartinJ.OsborneandArielRubinstein,2000,P2)。合作博弈,有時也叫做聯盟博弈(coalitionalgame),一般根據有無轉移支付而分為兩類:可轉移支付聯盟博弈(coalitionalgamewithtransferablepayoff)和不可轉移支付聯盟博弈(coalitionalgamewithnon-transferablepayoff)??赊D移支付也叫有旁支付(sidepayment),可轉移支付聯盟博弈假設博弈中各參與者都用相同的尺度來衡量他們的贏得,且各聯盟的贏得可以按任意方式在聯盟成員中分攤;否則,就是不可轉移支付聯盟博弈。非合作博弈的分類主要從兩個角度進行劃分。一是參與者的行動順序。從這個角度博弈可以分為靜態(tài)博弈(staticgame)和動態(tài)博弈(dynamicgame)。靜態(tài)博弈是指參與者同時選擇行動或雖非同時但后行動者并不知前行動者采取了何種行動;動態(tài)博弈是指參與者的行動有先后順序且后行動者能夠觀察到先行動者所選擇的行動。二是參與者掌握的信息水平。從這個角度,博弈可以分為完全信息博弈和不完全信息博弈。完全信息(completeinformation)指的是每一個參與者對所有其他參與者的特征、戰(zhàn)略空間及支付函數有準確的知識;否則就是不完全信息(incompleteinformation)。圖1.1博弈的分類綜合上述兩種分類方法,可將非合作博弈分成四類。這四類博弈及其對應的均衡概念,大致上反映了20世紀50年代以來非合作博弈理論的主要進展和1994年三位諾貝爾經濟學將得主的主要貢獻,同時也大致表明了“納什均衡”及其精煉在博弈論發(fā)展中的地位和影響(如表2.1)。表2.1非合作博弈的分類及對應的均衡概念、主要貢獻者三、經典案例(一)博弈論的經典案例智豬博弈(Pigs’payoffs)講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。那么,兩只豬各會采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。槍手博弈:王者的悲哀。三人對槍自決,甲乙丙槍法優(yōu)劣遞減。最后無奈而神奇的結局,將不取決于同時開槍還是先后開槍,最優(yōu)良的槍手,倒下的概率將最高;而最蹩腳的槍手,存活的希望卻最大。因為沒有人會把威脅最小的槍手列為一號清楚目標。在這里,后發(fā)制人的弱勢者將勝出。以弱勝強,絕不是神話。(二)納什均衡經典案例和的革命,非合作博弈理論已經成為范式的中心……在經濟學或者與經濟學原理相關的金融、會計、營銷和政治科學等學科中,現在人們已經很難找到不懂納什均衡能夠‘消費’近期文獻的領域。”納什均衡的重要影響可以概括為以下六個方面:(1)改變了經濟學的體系和結構。非合作博弈論的概念、內容、模型和分析工具等,均已滲透到微觀經濟學、宏觀經濟學、勞動經濟學、國際經濟學、環(huán)境經濟學等經濟學科的絕大部分學科領域,改變了這些學科領域的內容和結構,成為這些學科領域的基本研究范式和理論分析工具,從而改變了原有經濟學理論體系中各分支學科的內涵。(2)擴展了經濟學研究經濟問題的范圍。原有經濟學缺乏將不確定性因素、變動環(huán)境因素以及經濟個體之間的交互作用模式化的有效辦法,因而不能進行微觀層次經濟問題的解剖分析。納什均衡及相關模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經濟學家們提供了深入的分析工具。(3)加強了經濟學研究的深度。納什均衡理論不回避經濟個體之間直接的交互作用,不滿足于對經濟個體之間復雜經濟關系的簡單化處理,分析問題時不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強調從微觀個體行為規(guī)律的角度發(fā)現問題的根源,因而可以更深刻準確地理解和解釋經濟問題。(4)形成了基于經典博弈的研究范式體系。即可以將各種問題或經濟關系,按照經典博弈的類型或特征進行分類,并根據相應的經典博弈的分析方法和模型進行研究,將一個領域所取得的經驗方便地移植到另一個領域。(5)擴大和加強了經濟學與其他社會科學、自然科學的聯系。納什均衡之所以偉大,就因為它普通,而且普通到幾乎無處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運動和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經濟學與其他社會科學、自然科學的聯系更加緊密,形成了經濟學與其他學科相互促進的良性循環(huán)。(6)改變了經濟學的語言和表達方法。在進化博弈論方面相當有造詣的坎多利(Kandori,1997)對保羅·薩繆爾森(PaulSamuelson)的名言“你甚至可以使一只鸚鵡變成一個訓練有素的經濟學家,因為它必須學習的只有兩個詞,那就是‘供給’和‘需求’”,曾做過一個幽默的引申,他說,“現在這只鸚鵡需要再學兩個詞,那就是‘納什均衡’”。參考文獻[1]李伯聰,李軍.關于囚徒困境的幾個問題[J].自然辯證法通訊,2023,(04)[2]丁華,周洋,韓雪峰.“囚徒困境”的引申與啟示[J].職業(yè)時空,2023,(01)[3]馬立強.囚徒困境與納什均衡[J].科學大眾(中學版),2023,(09)[4]舒尚奇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論