講義管理博弈論_第1頁
講義管理博弈論_第2頁
講義管理博弈論_第3頁
講義管理博弈論_第4頁
講義管理博弈論_第5頁
已閱讀5頁,還剩106頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

管理博弈論

(ManagementGameTheory)第1講博弈論概述及完全信息靜態(tài)博弈主講人:張成科博士廣東工業(yè)大學經濟與貿易學院zhangck@本次講義提綱教材及參考書

本課程的主要內容第一章博弈論概述本課程的教學目的第二章完全信息靜態(tài)博弈教材及參考書教材:張維迎,博弈論與信息經濟學,上海三聯(lián)書店,上海人民出版社.2001.主要參考書:

1.陶長琪主編信息經濟學,經濟科學出版社.20012.謝識予,經濟博弈論,復旦大學出版社,20013.侯光明,李存金,管理博弈論,北京理工大學出版社,20054.雷霖,現代企業(yè)經營決策-博弈論方法應用,清華大學出版社發(fā)行5.王則柯,新編博弈論平話,出版:中信出版社6.潘天群,博弈生存-社會現象的博弈論解讀,中央編譯出版社北京圖書發(fā)行7.王國成,企業(yè)治理結構與企業(yè)家選擇-博弈論在企業(yè)組織行為選擇中的應用,經濟管理出版社8.姚國慶,21世紀高等院校經濟學專業(yè)系列教材-博弈論,南開大學出9.jeantirole,經濟科學譯叢-博弈論,中國人民大學出版社教材及參考書本課程的主要內容第一章博弈論概述本課程的教學目的第二章完全信息靜態(tài)博弈內容導航指針課程主要內容簡介第一篇非合作博弈理論第一章緒論第二章完全信息靜態(tài)信息博弈-納什均衡第三章完全信息動態(tài)搏弈-子博弈精煉納什均衡第四章不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章不完全信息動態(tài)博弈-精練貝葉斯納什均衡第二篇管理博弈論

第六章委托-代理理論(I)

第七章委托-代理理論(II)

第八章管理激勵與約束機制設計主要內容簡介(續(xù))本課程的教學安排本課程的主要內容第一章博弈論概述本課程的教學目的內容導航指針第1章博弈論概述

§1博弈論與經濟管理關于“博弈論”:博弈論是研究人們在利益相互影響的格局中的策略選擇問題、是研究多人決策問題的理論。而策略選擇是人們經濟行為的核心內容,此外,經濟學和博弈論的研究模式是一樣的:即強調個人理性,也就是在給定的約束條件下追求效用最大化??梢姡洕鷮W和博弈論具有內在的聯(lián)系。在經濟學和博弈論具有的這種天然聯(lián)系的基礎上產生了經濟博弈論。博弈論與經濟管理諾貝爾經濟學獎獲得者薩繆爾森有一句話:你可以將一只鸚鵡訓練成一個經濟學家,因為它只需要學習兩個詞:供給和需求。博弈論專家坎多瑞引申說:要成為現代經濟學家,這只鸚鵡必須再多學一個詞,就是“納什均衡”。第1章博弈論概述

§1博弈論與經濟管理將博弈的思想明確地應用于經濟領域,始于古諾(Cournot,1838)、伯特蘭德(Bertrand,1883)和艾奇沃斯(Edgeworth,1925)等人關于兩寡頭的產量和價格壟斷、產品交易行為的研究,他們通過對不同的經濟行為方式和案例建立了相應的博弈論模型,為經濟博弈論的發(fā)展提供了思想雛形和有益嘗試。近半個多世紀以來,博弈論引起了眾多經濟學家的極大興趣,使得博弈論在經濟學中的應用模型越來越多。大約從20世紀80年代開始,博弈論逐漸成為主流經濟學的一部分,甚至可以說成為微觀經濟學的基礎(張維迎,P8)。第1章博弈論概述

§1博弈論與管理學博弈論研究的是:給定信息結構,什么是可能的均衡結果?——是方法論導向的。管理博弈論是非對稱信息博弈論在管理學上的應用。她研究的問題是:給定信息結構,什么樣的機制安排是最有效率的?——是問題導向的。什么是博弈?張維迎關于博弈論的定義——是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題的,也就是說,當一個主體,好比說一個人或一個企業(yè)的選擇受到其他人、其他企業(yè)選擇的影響,而且反過來影響到其他人、其他企業(yè)選擇時的決策問題和均衡問題。

第1章博弈論概述施錫銓關于博弈論的定義分析在一群舉止行為頗具策略的理性人之間的相互作用的正規(guī)方法。博弈論關注的是互相依(interdependence)

每一個體猜測其他個體的選擇是什么?每個人將采取什么樣的行動?(當最優(yōu)的行動依賴于其他人的所作所為時,這個問題尤其令人關注。)

這些行動產生什么樣的結局?對于整個群體,這個結局好嗎?如果群體不止一次地互相作用,會有任何差異嗎?如果每一個體對群體內其他個體的特性沒有把握,答案將發(fā)生怎樣的變化?博弈論是考慮以下每一項條款的正規(guī)方法:群體——在任何博弈中有不止一個決策者;每一個決策者稱為局中人相互作用——任何單個局中人的行為直接影響到群體內至少一個其他的局中人。策略——單個局中人在決定自己所取的行動時,會考慮到相互依存性。理性——在考慮到這種相互依存性時,每一個局中人會選擇自己的最優(yōu)行動。

什么是博弈?●張守一——是研究聰明而又理智的決策者在沖突或合作中的策略選擇理論。●[美]RogerB.Myerson——博弈論可以被定義為是智能的理性決策者之間沖突與合作的數學模型的研究。第1章博弈論概述二、博弈論概述(一).什么是博弈?

博弈論模型是從人類社會的政治、經濟、軍事等活動中抽象出來的一種數學模型。在這種模型中首先要有參與人或局中人。參與人通過對于某些行動的選擇行為體現對于該種活動的參與。參與人的活動要涉及自己和其他人的利益。這種利益一般不僅與自己的行動有關,特別與其他參與人的行動選擇有關。博弈論主要研究參與人在這種理性行動中的理性行為以及在所有參與人都采取理性行為的假設下博弈的最終結果。博弈論概述博弈論(gametheory,又譯為對策論)定義:研究決策主體的行為在直接相互作用時,人們如何進行決策、以及這種決策如何達到均衡。開始于-馮.諾曼(VonNeumann)與摩根斯坦(Morgenstern)在1944年合作的《博弈論與經濟行為》(TheTheoryofGamesandEconomicBehaciour)參與人:兩人及兩人以上;行為:做出決策;行為目標:收益最大化(或者最小化)環(huán)境條件:目標的實現不僅取決于自己的行為,同時還取決于其他人的行為,個人的最優(yōu)選擇是其他人選擇的函數——策略性的行為。典型例子:高考報志愿博弈論概述

(一)什么是博弈論博弈論概述

(一)什么是博弈論注意兩點:1、是兩個或兩個以上參與者之間的對策論當魯濱遜在孤島上遇到了新上島的其他人,則就是博弈問題了!一般優(yōu)化問題與博弈問題的區(qū)別博弈模型與最優(yōu)化模型的本質區(qū)別是什么?(靜態(tài))博弈問題:(靜態(tài))最優(yōu)化問題:博弈與優(yōu)化問題的本質區(qū)別一美圓拍賣與“光滑斜坡”理論耶魯大學教授馬丁.舒比克設計的“陷阱游戲”:一名拍賣人拿出一張一美圓鈔票,請大家給這張鈔票開價;每次叫價以10美分為單位,出價最高者和次高者都要向拍賣人支付相當于出價數目的費用。利用博弈規(guī)則設計獲取利益的經典博弈模型

教授們在課堂實驗上跟毫無疑心的本科生們玩這個游戲,總是可以賺夠在教工食堂吃一頓午飯的錢。

你打算如何玩這個游戲?利用博弈規(guī)則設計獲取利益的經典博弈模型第1章博弈論概述

§2

博弈論的基本概念1、參與人Players:一個博弈中的決策主體,他們各自的目的是通過選擇行動(策略)以最大化自己的目標函數/效用水平/支付函數。他們可以是自然人或團體或法人,如企業(yè)、國家、地區(qū)、社團、歐盟、北約等。那些不作決策或雖做決策但不直接承擔決策后果的被動主體不是參與人,而只能當做環(huán)境參數來處理。如指手劃腳的看牌人、看棋人,企業(yè)的顧問等。對參與人的決策來說,最重要的是必須有可供選擇的行動集(策略集)和一個很好定義的支付函數。第1章博弈論概述

§2

博弈論的基本概念虛擬參與人(pseudo-player):指“自然”(nature)、“上帝”God,也即決定外生的隨機變量的概率分布的機制?!澳呈略谌恕⒊墒略谔臁钡摹疤臁?;如出遠門去旅游,可能很開心,也可能很尷尬(生病住醫(yī)院),兩者概率分布90%、10%或98%與2%或其他,由上帝決定。在以后的討論中,我們記參與人為i,參與人集合記為T,即T={1,2,……,i,……,n},即該博弈中共有n個參與人;為了討論的方便,把某個參與人i之外的其他參與人稱為的i對手記為-i;N代表自然。第1章博弈論概述

§2

博弈論的基本概念*注意:博弈理論家一般對參與人做兩個基本的假設——參與人都是個體理性的和智能的理性的(rational)?1—如果一個決策者在追逐其目標時能前后一致地做決策,就稱他為rational。RogerB·Myerson(P2)

2—廣義而言指的是一種行為方式,他同在給定條件或約束下最有效地實現預期目標相關。第1章博弈論概述

§2

博弈論的基本概念智能的(intelligent)?

當我們像博弈論專家那樣分析一個博弈時,如果參與人知道我們對此博弈所知道的一切,并能做出我們對此博弈所能做出的一切推斷,我們就說此博弈的參與人是智能的。RogerB·Myerson(P3)第1章博弈論概述

§2

博弈論的基本概念2、策略(strategies):博弈中有兩種策略概念,一種為純策略(purestrategy),簡稱策略,指參與人在博弈中可以選擇采用的行動(ac-tionsormoves)方案,是參與人在給定信息結構的情況下的行動規(guī)則,它規(guī)定參與人在什么時候的什么情況下采取什么行動。因而一個策略是參與人的一個“相機行動方案”(contingentActionplan)。如“人不犯我…”、“按第一套方案行動、實施第二套方案…”……,第1章博弈論概述

§2

博弈論的基本概念2、策略的描述記參與人i的一個策略為si,參與人i在一個博弈中的全部可供選擇的策略記為Si(策略集strategyset),即si∈Si

Si={s1,s2,…si

,…,sn},表示參與人i在該博弈中共有n個可行的策略。如果n個參與人每人從自己的Si中選擇一個策略si,則向量s=(s1,s2,﹍,si,﹍,sn)是一個策略組合(strategyprofile),參與人i之外的其他參與人的策略組合可記為s-i=(s1,s2,﹍,si-1,si+1,﹍,sn)。例如田忌的某個策略s田忌=上中下,或中下上,等等;S田忌={上中下,上下中,中上下,中下上,下上中,下中上}第1章博弈論概述

§2

博弈論的基本概念另一種策略概念是在純策略基礎上形成的混合策略(mixedstrategy)概念,參與人i的混合策略pi是他的純策略空間Si上的一種概率分布,表示參與人實際進行決策時根據這種概率分布在純策略中隨機選擇加以實施。Pi(si)表示Pi分配給純策略si的的概率。如出門要否帶雨傘?天氣預報說有時有雨。猜拳?這是一個十分玄乎的概念,讓人不容易理解,它是一種不確定,采用這種策略的目的就是讓對方琢磨不透,實施時似乎由一架隨機機器在操作。隨機策略randomizedstrategy

純策略是混合策略的特例?第1章博弈論概述

§2

博弈論的基本概念*注意:

1、策略與行動是兩個不同的概念,策略是行動的規(guī)則而不是行動本身。回顧“犯與不犯”的問題。在靜態(tài)博弈中,由于參與人同時行動,沒有人能掌握他人的之前行動的信息,故沒有可針對的行動,從而策略的選擇就變成了行動的選擇,即策略和行動是同一的。行動集Aiai

2、作為一種行動規(guī)則,策略必須是完備的,就是說,策略要給出參與人在每一種可能想象到的情況下的行動選擇,即使參與人并不預期這種情況會實際發(fā)生?!俺笤捳f在前-----”第1章博弈論概述

§2

博弈論的基本概念3、支付(payoffs):參與人從各種策略組合中獲得的收益。收益往往采用效用(utility)概念。它或者是一個特定策略組合下某個參與人得到的確定效用水平,或者是期望效用水平。它是策略組合的函數,所以也稱支付函數(payofffunction),記為ui(s),ui(s)=ui(s1,s2…,si

,…sn-1,sn).第1章博弈論概述

§2

博弈論的基本概念*注意1:博弈的一個基本特征是一個參與人的支付不僅取決于自己的策略選擇,而且取決于所有其他參與人的策略選擇;是策略組合的函數。

2:支付是參與人真正關心的東西,參與人在博弈中的目標就是選擇自己的策略以最大化自己的支付函數。第1章博弈論概述

§2

博弈論的基本概念一個博弈中,明確了以上三個概念,該博弈的基本框架就形成了,故稱為博弈的三個基本要素。一個具體博弈界定,還須明確行動的順序和有關的信息。4、行動的順序(theorderofplay):博弈中參與人實施決策活動的順序。同時或有先有后。其他因素不變,但順序不同,參與人的最優(yōu)選擇就不同,博弈的結果也不同。事實上,同的順序安排意味著不同的博弈。靜態(tài)博弈和動態(tài)博弈。第1章博弈論概述

§2

博弈論的基本概念5、信息(information):指一個博弈中參與人有關該博弈的知識,如關于N的選擇、其他參與人的策略集、支付函數、行動時間等.博弈論中關于信息的具體概念有:●信息集(informationset)—主要出現在動態(tài)博弈中,可理解為參與人在特定時刻上對有關變量的值的知識;一個參與人無法準確知道的變量的全體屬于一個信息集。買古董。第1章博弈論概述

§2

博弈論的基本概念●完美信息(perfectinformation):指一個參與人對其他參與人(包括N)的行動選擇有準確了解的情況,即一個信息集只包含一個值。動態(tài)博弈的概念?!裢耆畔ⅲ╟ompleteinformation):指N不首先行動或N的初始行動被所有的參與人準確觀察到的情,即沒有事前的不確定性。完全信息意味著各個參與人的支付函數是共同知識。顯然,不完全(incomplete)信息意味著不完美(imperfect)信息。第1章博弈論概述

§2

博弈論的基本概念●共同知識(commonknowledge)是與信息有關的一個重要概念。如聽過某個老師的課,學生認識老師,但老師不一定就記住該學生,路上碰在一塊了,學生會不會叫老師呢?也許學生會以為老師不認識他,打招呼會把老師弄得莫名其妙。解釋一:共同知識指“所有參與人知道,所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人知道…”。

解釋二:如果每個參與人都知道某個事實,每個參與人都知道每個參與人都知道它,如此等等,從而形如“(每個參與人都知道)k每個參與人都知道它”的語句對k=0,1,2,…都是正確的,那我們就稱這個事實為參與人中間的共同知識。第1章博弈論概述

§2

博弈論的基本概念●私人信息(privateinformation):指任何一個他擁有但不是該博弈中所有參與人共同知識的信息。由于存在私人信息,便有了信息不對稱的問題。第1章博弈論概述

§2

小結博弈論的基本概念包括:參與人:博弈論中選擇行動以最大化自己效用的決策主體;行動:參與人的決策變量戰(zhàn)略:參與人選擇行動的規(guī)則信息:參與人在博弈中的知識,特別是有關其他參與人的特征和行動的知識支付函數:參與人從博弈中獲得的效用水平

結果:博弈分析真正感興趣的要素的集合均衡:所有參與人的最優(yōu)戰(zhàn)略的組合參與人、行動、結果稱為博弈規(guī)則;博弈分析的目的是使用博弈規(guī)則決定均衡。第1章博弈論概述

§3

博弈論的分類分類是一種深化認識的方法。博弈可以根據不同的標志從不同的角度進行多種分類。通過分類我們將對博弈有進一步的了解,同時對博弈理論的結構體系有初步的認識。1、按參與人的多少分:單人博弈和多人博弈第1章博弈論概述

§3

博弈論的分類2、按策略空間是否有限分:有限策略博弈和無限策略博弈3、按各策略組合下參與人支付之和情況分:零和博弈、常和博弈和變和博弈。第1章博弈論概述

§3

博弈論的分類4按參與人行動的先后順序:靜態(tài)博弈和動態(tài)博弈靜態(tài)博弈:參與人同時選擇行動或非同時行動但后行動者并不知道前行動者采取了什么具體行動;動態(tài)博弈:參與人行動有先后順序,且后行動者能夠觀察先行動者選擇的行動。第1章博弈論概述

§3

博弈論的分類參與人對其他參與人(對手)的特征、戰(zhàn)略空間及支付函數的知識:完全信息博弈和不完全信息博弈。完全信息:每一個參與人對所有其他參與人的(對手)的特征、戰(zhàn)略空間及支付函數有準確的知識,否則為不完全信息。第1章博弈論概述

§3

博弈論的分類5、按信息是否完全分:完全信息博弈和不完全信息博弈6、按信息是否完美分(動態(tài)博弈):完美信息動態(tài)博弈和不完美信息動態(tài)博弈第1章博弈論概述

§3

博弈論的分類博弈理論體系的結構框架按下面博弈類型安排:

行動順序信息靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950,1951)完全信息動態(tài)博弈子博弈精練納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)不完全信息動態(tài)博弈精練貝葉斯納什均衡澤爾騰(1965)Kreps

和Wilson(1982)Fudenberg

和Tirole(1991)第1章博弈論概述

§4

博弈論研究著名學者因對博弈論研究作出杰出貢獻而獲諾貝爾經濟學獎的經濟學家:●納什(Nash):Nash-Equilibrium●塞爾藤(Selten):Subgame-PerfectNashE---●海薩尼(Harsanyi):Bayes-NashEquilibrium1994●維克利、莫里斯1996博弈論大師Nash第1章博弈論概述

§4

博弈論研究著名學者●邁克爾·斯賓斯(Spence):1948年生于美國的新澤西,1972年獲哈佛大學博士頭銜,現兼任美國哈佛和斯坦福兩所大學經濟學教授?!駟讨巍ぐ⒖藸柭宸颍?940年生于美國的紐黑文,1966年獲美國麻省理工學院博士頭銜,現為美國加利福尼亞大學經濟學教授?!窦s瑟夫·斯蒂格利茨,1948年生于美國的印第安納州,1967年獲美國麻省理工學院博士頭銜,曾任世界銀行的首席經濟學家,現任美國哥倫比亞大學經濟學教授。第1章博弈論概述

§4

博弈論研究著名學者

2001年三人同獲諾貝爾經濟學獎,分享1000萬瑞典克郎(94.3萬美元)的獎金。他們“發(fā)展并研究了市場信息不對稱的問題,揭示了當代信息經濟的核心”。阿克爾洛夫是最早發(fā)現信息不對稱的學者之一。阿克爾洛夫最大的貢獻是解釋了在發(fā)展中國家里,信貸市場信息的不對稱導致了這些國家信貸市場的過高利息。此外,阿克爾洛夫還把信息不對稱運用于解釋各種社會問題,比如因為信息不對稱,醫(yī)療保險市場上,老年人、個體勞動者的醫(yī)療保險利益得不到保障。第1章博弈論概述

典型博弈模型-囚徒困境案例1-囚徒困境-納什均衡

-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴-8大于-100大于-1(坦白,坦白)是納什均衡第1章博弈論概述

典型博弈模型-囚徒困境設定:(1)每個局中人都知道博弈規(guī)則和博弈結果的支付矩陣;(2)每個局中人都是理性的(個人理性和個人最優(yōu)決策);(3)不能“串通”第1章博弈論概述

典型博弈模型-囚徒困境通俗地講:

納什均衡的含義是:給定別人戰(zhàn)略情況下,沒有任何單個參與人有積極性選擇其他戰(zhàn)略,從而沒有人有積極性打破這種均衡。第1章博弈論概述

典型博弈模型-囚徒困境兩個寡頭企業(yè)選擇產量的博弈:

如果兩個企業(yè)聯(lián)合起來形成卡特爾,選擇壟斷利潤最大化的產量,每個企業(yè)都可以得到更多的利潤。給定對方遵守協(xié)議的情況下,每個企業(yè)都想增加產量,結果是,每個企業(yè)都只得到納什均衡產量的利潤,它嚴格小于卡特而產量下的利潤。請舉幾個囚徒困境的例子第1章博弈論概述

典型博弈模型-囚徒困境同樣的情形發(fā)生在:公共產品的供給美蘇軍備競賽經濟改革中小學生減負……第1章博弈論概述

典型博弈模型-囚徒困境囚徒困境的性質:個人理性和集體理性的矛盾;個人的“最優(yōu)策略”使整個“系統(tǒng)”處于不利的狀態(tài)。思考:為什么會造成囚徒困境是否由于“通訊”問題造成了囚徒困境?“要害”是否在于“利己主義”即“個人理性”?是否囚徒困境的結果就一定不利?第1章博弈論概述

典型博弈模型-囚徒困境結論:人類自私的天性,使他們陷入“囚徒困境”,難以自拔。

解決囚徒困境問題的“出路”“解決個人理性和集體理性之間沖突的辦法不是否認個人理性,而是設計一種機制,在滿足個人理性的前提下達到集體理性”;“一種制度安排,要發(fā)生效力,必須是一種納什均衡。否則,這種制度安排便不能成立”。囚徒困境的效果在不同情況下對社會而言可能是“負面”的,也可能是“正面”的。本課程的教學安排本課程的主要內容博弈論概述本課程的教學目的內容導航指針學習本課程的目的

張維迎認為:“近幾十年來,經濟學一直在為其他學科提供武器,但恐怕沒有任何其他工具比博弈論更有力了”。博弈論可以:引導學生運用書中介紹的理論分析現實的經濟現象擴大學生的知識面開闊思路和思維模式博弈論成為目前研究“熱點”一、以博弈論為方法或工具的研究狀況博弈論作為一種研究方法和工具,已經在各個領域得到了廣泛的應用,尤其是在經濟學領域,從1944年Neumann和Morgenstern出版第一本關于經濟博弈論的著作《TheoryofGameandEconomicBehavior》,到1994年諾貝爾經濟學獎授予博弈論專家JohnNash、Reinhard

Selten和JohnHarsanyi,奠定了博弈論在經濟學中的地位。2005年諾貝爾經濟學獎再次授予博弈論專家RobertJ.Aumann和ThomasC.Schelling,由此更引發(fā)了專家學者對博弈理論及其應用研究的關注。管理科學有工程研究熱點之一目前,博弈理論已在經濟學領域以及管理科學與工程、控制理論與控制工程等學科方向得到了廣泛的應用。文獻[1]以1994~2004年國內外與管理科學與工程學科相關的論文文獻計量研究表明,“管理博弈論與模型”已經成為管理科學與工程學科排名第4的“熱點領域”[1]。通過國家自然科學基金資助項目查詢發(fā)現,國內學者針對理論與實際問題提出了許多項目研究,取得了豐富的成果。

獲國家自然科學基金資助項目多通過國家自然科學基金網站“資助項目”查尋,從2000年到2007年,共資助與博弈論有關的項目68項!如南京大學的周晶教授連續(xù)獲得三項資助,最近兩項分別為:“競爭環(huán)境下的收益管理博弈模型與決策分析”“基于博弈模型的城市交通供需耦合平衡機理及控制研究”。國家自然科學基金資助的部分項目情況(I)首都經濟貿易大學的劉黎明教授研究了“財政體制的博弈分析”;重慶大學的蒲勇健教授“用博弈論方法研究國企債轉股中的互動行為和政策效應”;武漢大學的丁煌教授進行了“新體制下公共政策的博弈論研究”;南京大學的肖條軍教授開展了“基于演化博弈理論的企業(yè)行為與組織模式研究”和“需求不確定性環(huán)境下供應鏈管理的博弈模型研究”;上海交通大學的席裕庚教授開展了“基于非合作博弈的多目標生產調度研究”;南京大學的盛昭瀚教授研究了“基于博弈學習理論的企業(yè)組織治理演化理論”;國家自然科學基金資助的部分項目情況(II)清華大學的林旭東教授“基于動態(tài)博弈研究電子市場價格演化、信息價值與效率問題”;北京工業(yè)大學的李振龍教授研究了“城市交通網絡擁塞控制的博弈模型及其優(yōu)化”;華中科技大學的薛明皋教授開展了“R&D聯(lián)盟的期權博弈理論評估模型及實證研究”;東南大學的陶軍教授開展了“基于博弈理論的非合作網絡QoS分配中關鍵技術的研究”等等。這些研究極大地豐富和發(fā)展了博弈論方法體系、拓展了博弈論的應用領域、為社會經濟發(fā)展作出了應有的貢獻。在對博弈理論的自身發(fā)展和完善研究方面,國內外學者也開展了研究,如:DavidW.K.Yeung和LeonA.Petrosyan研究了“合作隨機微分博弈(CooperativeStochasticDifferentialGames)[2];A.Cincotti和H.Iida用信息熵思想研究了結局不確定的博弈模型及其相應的博弈均衡策略[3];四川大學的劉光中教授對多維博弈理論及其應用進行了研究;北京交通大學的修乃華教授進行了“廣義非合作博弈的均衡和優(yōu)化算法研究”;武漢大學的王先甲教授開展了“進化博弈中基于粒子群優(yōu)化與擬生滅過程的智能體有限理性進化與合作機制研究”;貴州大學的向淑文教授對廣義信息集與若干博弈問題開展了研究等等。我本人所承擔的廣東省哲學社科規(guī)劃項目“城市區(qū)域經濟競合研究:基于戰(zhàn)略網絡的城市博弈理論和方法(No.03/04C2—05)”關鍵詞:博弈論1999—2005/全部數據/114

/114

序號篇名作者刊名年/期1基于委托人-代理人關系的患者就醫(yī)行為研究張帆上海理工大學學報(社會科學版)2005/042基于價格折扣策略的供需協(xié)調模型楊皎平科技管理研究2005/113托馬斯·謝林對博弈論的貢獻劉安國經濟學動態(tài)2005/124指向合作與和諧的理論——2005年度諾貝爾經濟學獎得主學術貢獻評介周鵬經濟學動態(tài)2005/1252005年度諾貝爾經濟學獎新聞公報劉安國經濟學動態(tài)2005/106經營者聲譽與國有企業(yè)的經營績效——一種博弈論的分析視角李軍林經濟學動態(tài)2005/107評《開放經濟與中國產業(yè)組織研究》黃泰巖經濟學動態(tài)2005/088對非法煤礦監(jiān)控的博弈分析李新光廣州市經濟管理干部學院學報2005/039中央與地方政府基礎設施投資的博弈分析王麗麗東南大學學報(哲學社會科學版)2005/S110夏普利值在產學研合作利益分配中的應用舒尚奇中國市場2005/3911海域使用監(jiān)察的博弈分析李權昆漁業(yè)經濟研究2005/0112激勵制度中的聲譽激勵陳靜工業(yè)技術經濟2005/09132005年諾貝爾經濟學獎獲獎者主要貢獻杜丹嘉興學院學報2005/S214不打非理性的價格戰(zhàn)梁小民英才2005/12共有記錄2266條

首頁上頁下頁末頁共有記錄2266條

首頁上頁下頁末頁在中國期刊網上用“博弈論”作關鍵詞的查尋結果第二章完全信息靜態(tài)信息博弈-納什均衡一博弈的戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復剔除的占優(yōu)均衡四納什均衡五納什均衡應用舉例一博弈的戰(zhàn)略表述案例-房地產開發(fā)項目-假設有A、B兩家開發(fā)商市場需求:可能大,也可能小投入:1億假定市場上有兩棟樓出售:需求大時,每棟售價1.4億,需求小時,售價7千萬;如果市場上只有一棟樓需求大時,可賣1.8億需求小時,可賣1.1億一、博弈的戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述一、博弈的基本概念及戰(zhàn)略表述博弈論的基本概念包括:參與人:博弈論中選擇行動以最大化自己效用的決策主體;行動:參與人的決策變量戰(zhàn)略:參與人選擇行動的規(guī)則信息:參與人在博弈中的知識,特別是有關其他參與人的特征和行動的知識支付函數:參與人從博弈中獲得的效用水平

結果:博弈分析真正感興趣的要素的集合均衡:所有參與人的最優(yōu)戰(zhàn)略的組合參與人、行動、結果稱為博弈規(guī)則;博弈分析的目的是使用博弈規(guī)則決定均衡。一、博弈的基本概念及戰(zhàn)略表述參與人:博弈論中選擇行動以最大化自己效用的決策主體??梢允亲匀蝗耍部梢允菆F體,如企業(yè)、國家甚至由若干國家組成的集團(OPEC、歐盟等)。虛擬參與人:“自然”作為虛擬參與人自然:指決定外生的隨機變量的機制為分析方便引入,自然作為虛擬參與人沒有自己的支付和目標函數(即所有結果對它是無差異的)參與人決策的后果依賴于自然的選擇。在不完全信息博弈中,自然選擇參與人的類型一、博弈的基本概念及戰(zhàn)略表述行動:參與人在某個時點的決策變量Ai表示第i個參與人的一個特定行動行動的順序:行動的順序對于博弈的結果是非常重要的,事實上,不同的行動順序意味著不同的博弈。在博弈論中,一般假設參與人的行動空間和行動順序是所有參與人的共同知識。一、博弈的基本概念及戰(zhàn)略表述信息:參與人在博弈中的知識,特別是有關其他參與人的特征和行動的知識。如房地產開發(fā)博弈中,如果A不知道市場需求,而B知道,則A的信息集為{大,小},B的信息集為{大}或{小}完美信息:指一個參與人對其他參與人(包括“自然”)的行動選擇有準確了解的情況,即每一個信息集只包含一個值。完全信息:指自然不首先行動或自然的行動的初始行動所有參與人觀察到的情況。共同知識:指“所有參與人知道所有參與人知道所有參與人知道….”的知識。一、博弈的基本概念及戰(zhàn)略表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人的“相機行動方案”。在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。作為一種行動規(guī)則,戰(zhàn)略必須是完備的。一、博弈的基本概念及戰(zhàn)略表述支付函數:參與人從博弈中獲得的效用水平,或者指參與人得到的期望效用水平。博弈的基本特征是一個參與人的支付不僅取決于自己的戰(zhàn)略選擇,而且取決于所有其他參與人的戰(zhàn)略選擇一、博弈的基本概念及戰(zhàn)略表述結果:博弈分析感興趣的所有東西如均衡戰(zhàn)略組合、均衡行動組合、均衡支付組合等。一、博弈的基本概念及戰(zhàn)略表述均衡:所有參與人的最優(yōu)戰(zhàn)略的組合一般記為:一、博弈的基本概念及戰(zhàn)略表述博弈的戰(zhàn)略式表述:一、博弈的基本概念及戰(zhàn)略表述寡頭產量博弈中,企業(yè)是參與人,產量是戰(zhàn)略空間,利潤是支付;戰(zhàn)略式表述博弈為:第2章完全信息靜態(tài)信息博弈-納什均衡一博弈的基本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復剔除的占優(yōu)均衡四納什均衡五納什均衡應用舉例二占優(yōu)戰(zhàn)略均衡案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴-8大于-100大于-1-8大于-100大于-1抵賴是A的嚴格劣戰(zhàn)略抵賴是B的嚴格劣戰(zhàn)略二占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略:不論其他人選擇什么戰(zhàn)略,參與人的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略稱為“占優(yōu)戰(zhàn)略”(dominantstrategy)。二占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略均衡定義:在博弈的戰(zhàn)略表達式中,如果對于所有的i,Si*是i的占優(yōu)戰(zhàn)略,下列戰(zhàn)略組合稱為占優(yōu)戰(zhàn)略均衡:二占優(yōu)戰(zhàn)略均衡注意:如果所有人都有(嚴格)占優(yōu)戰(zhàn)略存在,那么占優(yōu)戰(zhàn)略均衡就是可以預測的唯一均衡。占優(yōu)戰(zhàn)略只要求每個參與人是理性的,而不要求每個參與人知道其他參與人是理性的(也就是說,不要求理性是共同知識)。為什么?二占優(yōu)戰(zhàn)略均衡4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述A嚴格劣戰(zhàn)略B嚴格劣戰(zhàn)略

5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈等待是小豬的嚴格占優(yōu)戰(zhàn)略大豬有無嚴格占優(yōu)戰(zhàn)略?4大于10大于-1第2章完全信息靜態(tài)信息博弈-納什均衡一博弈的基本概念及戰(zhàn)略表述二占優(yōu)戰(zhàn)略均衡三重復剔除的占優(yōu)均衡四納什均衡五納什均衡應用舉例三重復剔除的占優(yōu)均衡重復剔除嚴格劣戰(zhàn)略:思路:首先找到某個參與人的劣戰(zhàn)略(假定存在),把這個劣戰(zhàn)略剔除掉,重新構造一個不包含已剔除戰(zhàn)略的新的博弈,然后再剔除這個新的博弈中的某個參與人的劣戰(zhàn)略,一直重復這個過程,直到只剩下唯一的戰(zhàn)略組合為止。這個唯一剩下的戰(zhàn)略組合就是這個博弈的均衡解,稱為“重復剔除的占優(yōu)均衡”。三重復剔除的占優(yōu)均衡注意:

與占優(yōu)戰(zhàn)略均衡中的占優(yōu)戰(zhàn)略和劣戰(zhàn)略不同,這里的占優(yōu)戰(zhàn)略或劣戰(zhàn)略可能只是相對于另一個特定戰(zhàn)略而言。三重復剔除的占優(yōu)均衡

5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈按是小豬的嚴格劣戰(zhàn)略-剔除4大于10大于-1“按”是大豬的占優(yōu)戰(zhàn)略,納什均衡:大豬按,小豬等待三重復剔除的占優(yōu)均衡重復剔除的占優(yōu)均衡戰(zhàn)略組合稱為重復剔除的占優(yōu)均衡,如果它是重復剔除劣戰(zhàn)略后剩下的唯一戰(zhàn)略組合。如果這種唯一戰(zhàn)略組合是存在的,我們就說該博弈是重復剔除占優(yōu)可解。注意:如果重復剔除后的戰(zhàn)略組合不唯一,該博弈就不是重復剔除占優(yōu)可解的。三重復剔除的占優(yōu)均衡1,01,20,30,1M列先生行先生UDL0,12,0R行:沒有占優(yōu)戰(zhàn)略列:M嚴格優(yōu)于R剔除R行:L優(yōu)于D列:無占優(yōu)戰(zhàn)略剔除DM優(yōu)于L(U,M)是重復剔除的占優(yōu)均衡三重復剔除的占優(yōu)均衡練習:在下列戰(zhàn)略式表達中,找出重復剔除的占優(yōu)均衡4,35,16,22,18,43,63,09,62,8C2R1R2C1C3R3三重復剔除的占優(yōu)均衡注意:1、重復剔除的占優(yōu)均衡結果與劣戰(zhàn)略的剔除順序是否有關取決于剔除的是否是嚴格劣戰(zhàn)略。2、重復剔除的占優(yōu)均衡要求每個參與人是理性的,而且要求“理性”是參與人的共同知識。即:所有參與人知道所有參與是理性的,所有參與人知道所有參與人知道所有參與是理性的三重復剔除的占優(yōu)均衡2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除順序:R3、C3、C2、R2使用劣戰(zhàn)略剔除,可以看到(R1,C3)是重復剔除劣戰(zhàn)略均衡。舉例:三重復剔除的占優(yōu)均衡2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除順序:C2、R2、C1、R3戰(zhàn)略組合(R1,C3)是重復剔除劣戰(zhàn)略均衡。兩者不一樣。若使用嚴格劣戰(zhàn)略剔除,可以看到,(R1,C3)(R1,C1)都兩個留下的戰(zhàn)略組合,不唯一,因此在這里是不可解的。舉例:三重復剔除的占優(yōu)均衡盡管許多博弈中重復剔除的占優(yōu)均衡是一個合理的預測,但并不總是如此,尤其是大概支付某些極端值的時候。8,10-1000,97,66,5參與人B參與人AUDLRU是A的最優(yōu)選擇,但是,只要有1/1000的概率B選R,A就會選D四納什均衡定義:在有n個參與人的戰(zhàn)略式表述博弈G={S1,S2,…,Sn;u1,u2,…,un}中,戰(zhàn)略組合s*=(s1*,s2*,…,

sn*)是一個納什均衡,如果對于每一個i,si*是給定其他參與人的選擇s-i*=(s1*,…,si-1*,si+1*,…,sn*)的情況下第i個人的最優(yōu)戰(zhàn)略,即

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論