文庫發(fā)布:經(jīng)濟博弈論_第1頁
文庫發(fā)布:經(jīng)濟博弈論_第2頁
文庫發(fā)布:經(jīng)濟博弈論_第3頁
文庫發(fā)布:經(jīng)濟博弈論_第4頁
文庫發(fā)布:經(jīng)濟博弈論_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

經(jīng)濟博弈論

主講人:屠巧平電話-mail:tqp1226@

課程主要內(nèi)容導論完全信息靜態(tài)博弈完全且完美信息動態(tài)博弈重復博弈完全但不完美信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈

第一章導論什么是博弈論幾類經(jīng)典的博弈模型博弈的分類和博弈的結(jié)構(gòu)

博弈論的產(chǎn)生博弈論(theGameTheory)也就是運籌學中的對策論。對策思想最早產(chǎn)生于我國古代。早在兩千多年的春秋時期,孫武在《孫子兵法》中論述的軍事思想和治國策略,就蘊育了豐富和深刻的對策論思想。孫武的后代孫臏,為田忌謀劃,巧勝齊王,這個著名的“田忌賽馬”,就是典型的對策思想的成功運用。

博弈論的產(chǎn)生對策思想明確地應用于經(jīng)濟領(lǐng)域,始于Cournot(1838),Bertrand(1883),Edgeworth(1925)等人關(guān)于寡頭競爭、產(chǎn)量與價格壟斷、產(chǎn)品交易行為的研究。然而,作為一門學科的創(chuàng)立,則是以美國數(shù)學家馮.諾依曼(JohnVonNeumann)和經(jīng)濟學家奧斯卡.摩根斯坦(OskarMorgenstern)合著的《博弈論與經(jīng)濟行為》(TheGameTheoryandEconomicBehavior)(1944)一書出版為標志,他們奠定和形成了這門學科的理論與方法論基礎(chǔ)。

博弈論的產(chǎn)生博弈論是一門內(nèi)容廣泛且復雜的學科,不僅是經(jīng)濟學,政治學、軍事、外交、國際關(guān)系、公共選擇,還有犯罪學等,都涉及到博弈論。實際上,很多人把博弈論看成數(shù)學的一個分支,博弈論的一個重要代表人物---納什(Nash,曾獲1994年諾貝爾經(jīng)濟學獎,該年度的諾貝爾經(jīng)濟學獎授與了三位博弈論專家),在1951年的一篇關(guān)于非合作博弈的奠基性的文章就是發(fā)表在數(shù)學雜志上,而非在經(jīng)濟學雜志上。博弈論領(lǐng)域取得的諾貝爾獎1994年諾貝爾經(jīng)濟學獎授予了三位博弈論專家納什、澤爾騰和海薩尼。1996年諾貝爾獎授予兩位博弈論與信息經(jīng)濟學研究專家莫里斯、維克瑞;2001年諾貝爾獎授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他們在檸檬市場、信號傳遞和信號甄別等非對稱信息理論研究中的開創(chuàng)性貢獻。2005年諾貝爾獎授予有以色列和美國雙重國籍的羅伯特·奧曼和美國人托馬斯·謝林,以表彰他們在博弈論領(lǐng)域作出的貢獻。博弈論與主流經(jīng)濟學從現(xiàn)代的觀點來看,經(jīng)濟學是研究人的決策行為的學問。理性人是指在面臨給定的約束條件下能最大化自己效用的人,不考慮競爭對手的決策。兩個基本假定:1、市場參與人的數(shù)量足夠多,從而市場是競爭性的;2、參與人之間不存在信息不對稱問題(完全競爭、完全信息)。然而在現(xiàn)實生活中,這兩個假設(shè)在許多情況下是不能被滿足。博弈論與主流經(jīng)濟學博弈論進入主流經(jīng)濟學,反映了經(jīng)濟學發(fā)展的幾個趨勢:經(jīng)濟學研究對象越來越轉(zhuǎn)向個體,一切從個人效用函數(shù)及約束條件開始,解約束條件下個人效用最大化問題,而導出行為及結(jié)果;經(jīng)濟學研究對象越來越轉(zhuǎn)向人與人之間關(guān)系的研究。特別是人與人之間行為的相互影響和作用,人們之間的利益沖突與一致,競爭與合作的研究;開始注意到理性人的個人理性行為可能導致集體的非理性。博弈論與主流經(jīng)濟學傳統(tǒng)經(jīng)濟學研究個人行為時,總是假定在給定價格下決策,人們行為之間的相互作用是通過價格來間接完成的,價格可以使個人理性與集體理性達到一致;在解決問題方法上,不像傳統(tǒng)經(jīng)濟學主張政府干預來解決,而是認為解決個人理性與集體理性之間的沖突辦法不是否認個人理性,而是設(shè)計一種機制,在滿足個人理性的前提下達到集體理性。主流經(jīng)濟學越來越重視對信息的研究。

什么是博弈論(GameTheory)博弈論:研究決策主體的行為直接發(fā)生相互作用時候的均衡問題。博弈論既是一種決策理論,也是一種經(jīng)濟分析工具,是在具有相互對抗和反應特征的社會經(jīng)濟環(huán)境中最有效的決策理論和經(jīng)濟分析工具。博弈:一些個人、隊組或其他組織,面對一定的環(huán)境條件,在一定的規(guī)則下、同時或先后,一次或多次,從各自允許選擇的行為或策略中進行選擇并加以實施,各自取得相應結(jié)果的過程。

一個博弈模型必須確定的幾個因素博弈的參與者(Players):即博弈的參與者,他們是博奕的決策主體行為。根據(jù)自己的利益要求決定自己的,記局中人為i,局中人集合為{1,2,…,I},即共有I個局中人。我們將某個局中人以外的其它局中人稱為“i的對手”,記為-i。策略(Strategies):即指每個局中人在對策中可以選擇采用的行動方案,但這個方案必須是一個完整的行動,而不是行動的某一步。每個局中人均有可供選擇的多種策略。一個博弈模型必須確定的幾個因素博弈的次序(Orders)。規(guī)定一個博弈必須規(guī)定其中的次序,次序不同一般就是不同的博弈。博弈方的得益(Payoffs)。是指一局博奕的得失?;蛘哒f是局中人從各種策略組合中獲得的效用,它是策略組合的函數(shù)。

幾類經(jīng)典的博弈模型---囚徒困境囚徒困境(Prisoner′dilemma):假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果兩個犯罪嫌疑人都坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪,各被判刑5年;如果只有一個犯罪嫌疑人坦白,另一個人沒有坦白而是抵賴,則重判8年,而坦白者有功被減刑,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。

囚徒困境博弈囚徒B坦白抵賴囚徒A坦白-8,-80,-10抵賴-10,0-1,-1

囚徒困境博弈的分析在囚徒困境中,考慮囚徒A對他人的最優(yōu)反應。如果給定囚徒B的策略是“坦白”,那么對囚徒A來說,采取“坦白”策略得到的收益是-8,采取“抵賴”策略得到的收益是-10,顯然“坦白”為好;同理,如果給定囚徒B的策略是“抵賴”,對囚徒A來說,“坦白”也比“抵賴”好。因此,囚徒A對囚徒B的最優(yōu)反應是“坦白”。對囚徒B作同樣分析:如果囚徒A的策略是“坦白”,則他采取“坦白”策略為好;如果囚徒A的策略是“抵賴”,他還是采取“坦白”策略好,所以囚徒B對囚徒A的最優(yōu)反應也是“坦白”。兩個最優(yōu)反應形成了一個策略組合(坦白,坦白)。

囚徒困境博弈的分析

(坦白,坦白)表明兩人共同的集體選擇,但是這個選擇是否是理性的?理性選擇是指使收益最大化的選擇。如果兩人都抵賴,各判刑1年,顯然比坦白各判刑8年好。所以,納什均衡(坦白,坦白)并不是一個集體理性選擇。但它卻是個人理性選擇的一個組合。囚徒困境正是反映了一個深刻的問題,這就是個人理性與集體理性的矛盾。囚徒困境博弈的分析一個非集體理性選擇,如策略組合(坦白,坦白),用經(jīng)濟學術(shù)語說,其中存在“帕累托改進”的機會。所謂帕累托改進就是說,它在不使另一部分人的境況變得更壞的前提下,至少能改進一部分人的境況。如果不存在帕累托改進的情況,便達到“帕累托最優(yōu)”。這里,如果兩人都選擇抵賴,兩人的境況都有所改進。所以,(坦白,坦白)不是帕累托最優(yōu)。集體的理性選擇應該是大家都抵賴。但是這個帕累托改進辦不到。為什么?因為我們已經(jīng)驗證,(坦白,坦白)這個策略組合是穩(wěn)定的,不會有人主動去打破這種格局的。囚徒困境博弈的分析

那么,兩個囚徒事先訂好攻守同盟,兩人都采取抵賴的策略,不是可以改善兩人的境遇嗎?但問題是,這個攻守同盟有沒有意義?沒有。原因在于(抵賴,抵賴)這個策略組合不穩(wěn)定,沒有人有積極性去遵守這個同盟。一般地,假設(shè)博弈中的每個局中人事先達成一項協(xié)議,規(guī)定了各自的行為規(guī)則。如果局中人會自覺遵守這個協(xié)議,等于說這個協(xié)議具有約束力:給定別人遵守協(xié)議的情況下,自己的最好選擇就是也遵守協(xié)議。相反,一個協(xié)議不具有約束力,它就不可能自動實施,因為至少有一個局中人會違背這個協(xié)議。所以,不具有約束力的協(xié)議是沒有意義的。以上的分析告訴我們,用經(jīng)濟學的觀點來看,只有由滿足個人理性選擇的策略組合才是穩(wěn)定的。

囚徒困境博弈的啟示囚徒困境對社會是非常理想的結(jié)果;從兩個決策者的立場上則是很不理想的結(jié)果;決策者從各自的最大利益出發(fā)的選擇行為,結(jié)果既沒有實現(xiàn)兩人總體的最大利益,也沒有真正實現(xiàn)個人最大利益;該博弈揭示了個人理性與團體理性之間的矛盾---從個人利益出發(fā)往往不能實現(xiàn)團體最大利益;也解釋了個體理性本身的內(nèi)在矛盾---個體出發(fā)的行為也不一定能真正實現(xiàn)個體的最大利益,甚至得到相當差的結(jié)果。

囚徒困境在經(jīng)濟學上的應用兩個寡頭企業(yè)選擇產(chǎn)量的博弈就是一個囚徒困境問題?;叵胍幌鹿胖Z均衡的含義:古諾均衡是指存在這樣一對產(chǎn)量組合(q1*,q2*),使得:假定企業(yè)2的產(chǎn)量為q2*時,q1*是企業(yè)1的最優(yōu)產(chǎn)量;假定企業(yè)1的產(chǎn)量為q1*時,q2*是企業(yè)2的最優(yōu)產(chǎn)量。產(chǎn)量組合(q1*,q2*)是穩(wěn)定的。囚徒困境在經(jīng)濟學上的應用看兩個寡頭合謀與價格卡特爾的情形,它也存在個人理性與集體理性的沖突。在兩個寡頭合謀條件下的產(chǎn)量與價格決定,是基于兩個寡頭利潤總和的最大化目標,而不是每個企業(yè)自己的利潤最大化。因此這種最大化目標下的產(chǎn)量分配符合兩家企業(yè)的共同利益,卻不是使每家企業(yè)自己的利潤最大化的產(chǎn)量,換言之,并不是每家企業(yè)自己的“最優(yōu)反應”。所以,卡特爾產(chǎn)量分配是不穩(wěn)定的產(chǎn)量組合。正因為此,卡特爾下一定會有違約沖動,卡特爾具有不穩(wěn)定性。

囚徒困境在經(jīng)濟學上的應用

在軍備競賽中,人們年復一年的談判,試圖簽訂一個限制軍備的條約。但是這種條約也存在個人理性與集體理性的沖突。簽訂條約對世界和平有利,但履行條約未必是各國行動的“最優(yōu)反應”:試想,如果我減少軍備開支,而你增加軍費支出,我不是受到威脅了嗎?所以,這種條約不構(gòu)成約束力,各國都有違約的沖動。結(jié)果是各國都大量增加軍費預算,結(jié)果軍備競賽就只好繼續(xù)下去。冷戰(zhàn)時期前蘇聯(lián)和美國之間的軍備競賽就是典型一例,兩國都在導彈上花了幾萬億美元,如果把資源用于民用品生產(chǎn),兩國的社會福利就會變得更好。囚徒困境在經(jīng)濟學上的應用

企業(yè)競爭而產(chǎn)生的廣告資源浪費也是典型例子。如兩家寡頭競爭,經(jīng)理們可選擇策略是“多做廣告”和“少做廣告”,各種策略組合的盈利矩陣如下表:企業(yè)2少做廣告多做廣告企業(yè)1少做廣告30,3010,40多做廣告40,1020,20

智豬博弈智豬博弈(boxedpigs).豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下10個單位的食物,但誰踩就需要付2個單位的成本。如果有一只豬去踩踏板,另一只豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時,大豬會在小豬跑到食槽之前吃到9個單位的食物,小豬吃1個單位的食物;若是大豬踩動了踏板,則大豬吃6個單位,小豬吃4各單位;若同時踩,大豬吃7個單位,小豬吃3各單位。

智豬博弈小豬踩等大豬踩5,14,4等9,-10,0

現(xiàn)實中類似智豬博弈的例子股份公司中大股東與小股東機構(gòu)投資者與散戶大企業(yè)與小企業(yè)公共產(chǎn)品的提供性別戰(zhàn)

一男一女戀愛,有些業(yè)余活動要安排,或者去看足球比賽,或者去看芭蕾舞演出。男的偏好足球,女的則更喜歡芭蕾舞,但他們都寧愿在一起,不愿分開。下表給出收益矩陣:

女足球芭蕾男足球2,10,0芭蕾0,01,2類似性別戰(zhàn)的例子兩家工廠生產(chǎn)的產(chǎn)品可能是互補的,一家為另一家提供零配件,這里有一個標準的選擇問題,由于種種原因,很可能在產(chǎn)品標準的選擇上,生產(chǎn)成品的廠家與生產(chǎn)零配件的廠家之間有沖突。這就需要相互妥協(xié),但妥協(xié)的結(jié)果有兩種可能,或者是生產(chǎn)零配件的廠家適應生產(chǎn)成品的廠家,或者是生產(chǎn)成品的廠家適應于生產(chǎn)零配件的廠家。性別戰(zhàn)在經(jīng)濟學上的應用

一家企業(yè)率先推出一種新產(chǎn)品,其它企業(yè)跟進也是類似性別戰(zhàn)的博弈。把新產(chǎn)品率先推向市場的先動企業(yè)的成功可能性要大一些,跟進者面臨的困難是消費者對先動企業(yè)的品牌有了一定的忠誠度,并在頭腦中有了先動企業(yè)的形象;而且,如果消費者在學習使用先動企業(yè)的新產(chǎn)品時花費了學習時間,往往不愿意再花時間或改動設(shè)備去使用另一家企業(yè)的類似產(chǎn)品。文字處理和數(shù)據(jù)庫軟件就是很好的例子。對一種程序或一種輸入方法已很熟練者,一般不愿意更換,除非后者有很多優(yōu)點。性別戰(zhàn)在經(jīng)濟學上的應用兩個競爭企業(yè)是否推出新產(chǎn)品的得益矩陣。究竟是企業(yè)1還是企業(yè)2贏利,要看是哪一家企業(yè)首先行動。企業(yè)2無新產(chǎn)品推出新產(chǎn)品企業(yè)1無新產(chǎn)品2,2-5,10推出新產(chǎn)品10,-5-7,-7企業(yè)2無新產(chǎn)品推出新產(chǎn)品企業(yè)1無新產(chǎn)品2,2-5,10推出新產(chǎn)品10,-5-7,-7

斗雞博弈

試想有兩人狹路相逢,每人有兩個行動選擇:一是退下來,一是進攻。如果一方退下來,而對方?jīng)]有退下來,對方獲得勝利,這人就很丟面子;如果對方也退下來,雙方則打個平手;如果自己沒退下來,而對方退下來,自己則勝利,對方則失敗;如果兩人都前進,那么則兩敗俱傷。下表給出收益矩陣:乙進退甲進-3,-32,0退0,20,0

類似斗雞博弈的例子戰(zhàn)爭期間搶占地盤警察與游行隊伍夫妻之間的矛盾例:市場進入阻撓(entrydeterrance)

設(shè)想有一家壟斷企業(yè)已在市場上(稱為“在位者”),另一家新企業(yè)虎視眈眈想進入(稱為“進入者”)。在位者想保持自己的壟斷地位,所以就要阻撓進入者的進入。在這個博弈中,進入者有兩種策略可以選擇:進入還是不進入;在位者也有兩種策略:默許還是斗爭。各種策略組合的收益矩陣如下表:

在位者默許斗爭進入者進入40,50-10,0不進入0,3000,300猜硬幣博弈(MatchingPennies)Rockpaperscissors思考題什么是博弈?博弈論主要研究內(nèi)容是什么?囚徒困境的內(nèi)在根源是什么?舉出現(xiàn)實中囚徒困境的具體例子。1.3博弈的分類和博弈的結(jié)構(gòu)博弈的參與者合作與非合作:合作博弈和非合作博弈;博弈參與人的數(shù)目:兩人博弈和多人博弈;博弈的策略:有限博弈和無限博弈;博弈的得益:零和博弈和非零和博弈;博弈的過程:靜態(tài)博弈和動態(tài)博弈;博弈的信息結(jié)構(gòu):完全信息和不完全信息;完美信息和不完美信息;博弈方的能力和理性:完全理性和有限理性。

合作博弈和非合作博弈合作博弈和非合作博弈的區(qū)別主要在于人們的行為相互作用時,當事人能否達成一個具有約束力的協(xié)議,如果有就是合作博弈,沒有就是非合作博弈。合作博弈強調(diào)的是集體理性,強調(diào)的是效率、公正、和公平;非合作博弈強調(diào)的是個人理性,個人最有決策,其結(jié)果可能有效率,也可能無效率。靜態(tài)博弈和動態(tài)博弈靜態(tài)博弈指在博弈中,參與人同時選擇行動,或雖非同時但后行動者并不知道前行動者采取了什么具體行動。如:猜硬幣博弈、古諾模型和投標活動。動態(tài)博弈指的是參與人的行動有先后順序,且后行動者能夠觀察到先行動者所選擇的行動的博弈。如棋弈比賽、商業(yè)大戰(zhàn)、商業(yè)談判、討價還價。完全信息博弈和不完全信息博弈完全信息指的是每一個參與人對所有其他參與人的特征,如策略集合及得益函數(shù)都有準確完備的知識;否則就是不完全信息。如投標、拍賣活動中,由于各博弈方對其他博弈方關(guān)于標的估價很難了解,各方無法得知拍得標的物的真正得益。將上述兩個角度的劃分結(jié)合起來,我們就得到四種不同類型的博弈,這就是:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈和不完全信息動態(tài)博弈。博弈的分類和均衡行動次序信息靜態(tài)動態(tài)完全信息納什均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論