版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
博弈論初步
博弈論初步博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)經(jīng)濟(jì)學(xué)的假設(shè)及其局限性兩個(gè)基本假設(shè):完全競(jìng)爭(zhēng),完美信息局限性:交易主體的數(shù)量其實(shí)很有限;信息是不對(duì)稱的一般均衡理論是整個(gè)經(jīng)濟(jì)學(xué)的理論基石和道義基礎(chǔ),市場(chǎng)機(jī)制是完美的,帕累托最優(yōu)成立,平等與效率可以兼顧。然而在以下情況不成立:非完全競(jìng)爭(zhēng):壟斷越來越普遍外部性:市場(chǎng)不可能把所有的成本收益都計(jì)算在內(nèi)公共產(chǎn)品:市場(chǎng)無非解決“搭便車”問題逆向選擇問題:檸檬市場(chǎng)道德風(fēng)險(xiǎn)問題:為什么市場(chǎng)的交易費(fèi)用比較高?博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)經(jīng)濟(jì)學(xué)的假設(shè)及其局限性博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展博弈論研究的是:在策略性環(huán)境中如何進(jìn)行策略性決策和采取策略性行動(dòng)的科學(xué)。當(dāng)成果無法由個(gè)體完全掌握,而結(jié)局須視群體共同決策而定時(shí),個(gè)人為了取勝,應(yīng)該采取什么策略博弈論成為通用方法論,經(jīng)濟(jì)學(xué)、政治學(xué)、管理、軍事、外交、國(guó)際關(guān)系、公共選擇、犯罪學(xué)博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展博弈論研究的是:在策略性環(huán)境中如何進(jìn)博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)微觀經(jīng)濟(jì)學(xué)與博弈論的比較傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的個(gè)人決策是在給定一個(gè)價(jià)格參數(shù)和收入的條件下最大化自己的效用,個(gè)人的效用與其他人無關(guān),所有其他人的行為都被總結(jié)在“價(jià)格”參數(shù)之中博弈論中,個(gè)人效用不僅依賴于自己的選擇,還以來于他人的選擇,研究在存在外部經(jīng)濟(jì)條件下的個(gè)人選擇問題事實(shí)上,行為主體的數(shù)量通常不多,相互之間存在明顯影響經(jīng)濟(jì)學(xué)對(duì)博弈論寄予厚望,認(rèn)為用博弈論可以重寫經(jīng)濟(jì)學(xué)原理博弈論改寫經(jīng)濟(jì)學(xué),從放寬新古典的完全競(jìng)爭(zhēng)和完全信息兩個(gè)條件展開博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)微觀經(jīng)濟(jì)學(xué)與博弈論的比較博弈論的代表人物及其貢獻(xiàn)1944年,J·馮·諾依曼、O·摩根斯坦恩在《博弈理論與經(jīng)濟(jì)行為》首先提出一些博弈論的概念。1994年,納什、澤爾騰和海薩尼獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。1996年,莫里斯和維克里獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2001年,阿克洛夫、斯蒂格利茨和斯賓塞獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)2005年,奧曼和謝林獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。博弈論的代表人物及其貢獻(xiàn)1944年,J·馮·諾依曼、O·摩根一、什么是博弈論:從“囚徒困境”談起
囚徒困境兩個(gè)小偷甲和乙聯(lián)手作案,私入民宅被警方逮住但未獲證據(jù)。警方將兩人分別置于兩間房間分開審訊,政策是若一人招供但另一人未招,則招者立即被釋放,未招者判入獄10年;若二人都招則兩人各判刑8年;若兩人都不招則未獲證據(jù)但因私入民宅各拘留1年。一、什么是博弈論:從“囚徒困境”談起囚徒困境表1囚徒困境博弈
乙
招不招招甲不招(問題:甲、乙如何選擇?)
-8,-80,-10-10,0-1,-1表1囚徒困境博弈-8,-80,-10-10,0-1,-1
盡管甲不知乙是否招供,但他認(rèn)為自己選“招”最好,因而甲會(huì)選擇“招”,乙也同樣會(huì)選擇“招”,結(jié)果各判8年;但若兩人都不招,結(jié)果是兩人只被判1年,但這種結(jié)果是不會(huì)出現(xiàn)的。我們可以運(yùn)用“剔除劣戰(zhàn)略”的方法來獲得這樣的結(jié)果。
盡管甲不知乙是否招供,但他認(rèn)為自
甲或乙可以作出的選擇被稱為“戰(zhàn)略”,如“招”或“不招”都是戰(zhàn)略。
甲或乙可以作出的選擇被稱為“戰(zhàn)略”,如“思想“囚徒困境”博弈的經(jīng)濟(jì)和社會(huì)意義在于,個(gè)人理性不一定導(dǎo)致集體理性,或者說人人為自己未必導(dǎo)致整體利益。這與市場(chǎng)機(jī)制的思想是不同的。不過,兩者是相輔相成的。思想“囚徒困境”博弈的經(jīng)濟(jì)和社會(huì)意義在于,個(gè)人理性不一定導(dǎo)致囚徒困境的幾個(gè)事例:價(jià)格大戰(zhàn)兩個(gè)寡頭企業(yè)選擇產(chǎn)量軍備競(jìng)賽做廣告圍觀時(shí)踮腳尖應(yīng)試教育貿(mào)易自由與壁壘,地方保護(hù)主義囚徒困境的幾個(gè)事例:博弈論要點(diǎn)博弈:決策主體在互相對(duì)抗中,對(duì)抗雙方(或多方)互相依存的一系列策略和行動(dòng)的過程集合參與人的利益有沖突博弈是一個(gè)過程集合(參與人、策略、行動(dòng)、信息等)。把博弈視為集合是思維從具體到抽象的重要一步博弈的一個(gè)本質(zhì)特征是策略的相互依存性博弈論:專門研究博弈如何出現(xiàn)均衡的規(guī)律的學(xué)問博弈論要點(diǎn)博弈:決策主體在互相對(duì)抗中,對(duì)抗雙方(或多方)互相博弈論要點(diǎn)博弈論的基本概念包括:參與人、參與人的策略、參與人的支付(效用)博弈有不同的種類:從行動(dòng)順序角度:靜態(tài)博弈。參與人同時(shí)選擇行動(dòng)動(dòng)態(tài)博弈。參與人的行動(dòng)有先后順序從擁有信息角度:完全信息博弈。每個(gè)參與人對(duì)所有其他參與人的特征、戰(zhàn)略空間、支付函數(shù)有準(zhǔn)確的知識(shí)不完全信息博弈。博弈論要點(diǎn)博弈論的基本概念包括:參與人、參與人的策略、參與人博弈的分類與對(duì)應(yīng)的均衡概念靜態(tài)博弈:博弈中參與人同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知道前行動(dòng)者采取什么行動(dòng);動(dòng)態(tài)博弈(序貫博弈):參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。完全信息指的是每個(gè)參與人對(duì)所有其他參與人(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí),否則就是不完全信息。博弈的分類與對(duì)應(yīng)的均衡概念靜態(tài)博弈:博弈中參與人同時(shí)選擇行動(dòng)博弈的種類合作博弈與非合作博弈廠商之間的經(jīng)濟(jì)博弈可以是合作的,也可以是非合作的。區(qū)別在于是否存在一個(gè)有約束力的協(xié)議。如果有,就是合作博弈;如果沒有,就是非合作博弈。前者強(qiáng)調(diào)團(tuán)體理性,即效率、公平和公正;后者強(qiáng)調(diào)個(gè)人理性和個(gè)人最優(yōu)決策。博弈的種類合作博弈與非合作博弈
同時(shí)博弈與序貫博弈前者是博弈各方在不了解對(duì)方情況下制定決策;后者是一方看到另一方的行動(dòng)之后再采取行動(dòng)。同時(shí)博弈與序貫博弈一次博弈與重復(fù)博弈博弈行動(dòng)只進(jìn)行一次的是一次博弈;博弈行動(dòng)進(jìn)行多次的是重復(fù)博弈雙人博弈與多人博弈前者只有兩人參加行動(dòng),后者有多人參加行動(dòng)一次博弈與重復(fù)博弈零和博弈與非零和博弈在零和博弈中,一方之所得即為另一方之所失;在非零和博弈中,雙方的得失取決于各自選擇采取的行動(dòng)。零和博弈與非零和博弈二、同時(shí)博弈:純策略博弈同時(shí)博弈與序貫博弈同時(shí)博弈是參與人同時(shí)進(jìn)行決策或行動(dòng)的博弈;所謂同時(shí)或先后主要是看參與人在決策時(shí)是否已經(jīng)知道其他參與人的決策序貫博弈是參與人的決策和行動(dòng)有先有后的博弈。二、同時(shí)博弈:純策略博弈同時(shí)博弈與序貫博弈支付矩陣(也稱報(bào)酬矩陣)被用來描述和分析一個(gè)博弈。支付矩陣(也稱報(bào)酬矩陣)被用來描述和分析一個(gè)博弈。占優(yōu)策略無論其他參與者采取什么策略,某參與者都存在唯一的最優(yōu)策略選擇,這一最優(yōu)策略就是他的占優(yōu)策略。如果某個(gè)參與者具有占優(yōu)策略,那么,無論其他參與者選擇什么策略,該參與者確信自己所選擇的唯一策略都是最優(yōu)的。博弈均衡指博弈中的所有參與者都不想改變自己的策略的一種狀態(tài)。占優(yōu)策略納什均衡是指這樣一種狀態(tài),任何一個(gè)參與者都不會(huì)改變自己的策略,如果其他參與者不改變策略;在該策略組合上,任何參與人單獨(dú)改變策略都不會(huì)得到好處;納什均衡條件策略下劃線法條件策略,參與人給定條件下的相對(duì)優(yōu)勢(shì)策略,如甲廠商在乙廠商選擇合作條件下的條件(優(yōu)勢(shì))策略為不合作。首先用下劃線表示甲廠商的條件策略其次用下劃線表示乙廠商的條件策略最后找到在兩個(gè)數(shù)字之下都畫線的單元格即為博弈的均衡。條件策略下劃線法智豬博弈(boxedpigs)豬圈中有一頭大豬和一頭小豬,在豬圈的一端設(shè)有一個(gè)按鈕,每按一下,位于豬圈另一端的食槽中就會(huì)有10單位的豬食進(jìn)槽,但每按一下按鈕會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,則大豬吃到9單位食物,小豬僅能吃到1單位食物;如果兩豬同時(shí)到食槽,則大豬吃7單位,小豬吃3單位食物;如果小豬先到,大豬吃6單位而小豬吃4單位食物。表4給出這個(gè)博弈的支付矩陣。納什均衡智豬博弈(boxedpigs)納什均衡小豬按等待大豬按等待5,14,49,-10,0小豬按等待大豬按5,14,49,-10小豬的最優(yōu)策略:等待大豬無最優(yōu)策略:即大豬的最優(yōu)策略是依賴于小豬的策略
此時(shí)用重復(fù)剔除嚴(yán)格劣策略的思路找出均衡:小豬的嚴(yán)格劣策略為按,剔除“按”后,小豬只有一種策略等待,大豬仍有兩個(gè)策略,但此時(shí),“等待”已成為大豬的劣策略,剔除,大豬的最優(yōu)策略——按這是一個(gè)“多勞不多得,少勞不少得”的均衡小豬的最優(yōu)策略:等待股市博弈在股票市場(chǎng)上,大戶是大豬,他們要進(jìn)行技術(shù)分析,收集信息、預(yù)測(cè)股價(jià)走勢(shì),但大量散戶就是小豬。他們不會(huì)花成本去進(jìn)行技術(shù)分析,而是跟著大戶的投資戰(zhàn)略進(jìn)行股票買賣,即所謂“散戶跟大戶”的現(xiàn)象。股市博弈為什么中小企業(yè)不會(huì)花錢去開發(fā)新產(chǎn)品?在技術(shù)創(chuàng)新市場(chǎng)上,大企業(yè)是大豬,它們投入大量資金進(jìn)行技術(shù)創(chuàng)新,開發(fā)新產(chǎn)品,而中小企業(yè)是小豬,不會(huì)進(jìn)行大規(guī)模技術(shù)創(chuàng)新,而是等待大企業(yè)的新產(chǎn)品形成新的市場(chǎng)后生產(chǎn),模仿大企業(yè)的新產(chǎn)品的產(chǎn)品去銷售。為什么中小企業(yè)不會(huì)花錢去開發(fā)新產(chǎn)品?三、序貫博弈在序貫博弈中,參與人的決策有先有后,特別是,后行動(dòng)的參與人可以觀察到先行動(dòng)的參與人已經(jīng)采取了的策略。在圖中,有兩個(gè)房地產(chǎn)開發(fā)商A和B分別決定在同一地段上開發(fā)一棟寫字樓。由于市場(chǎng)需求有限,如果他們都開發(fā),則在同一地段會(huì)有兩棟寫字樓,超過了市場(chǎng)對(duì)寫字樓的需求,難以完全出售,空置房太多導(dǎo)致各自虧損1百萬。三、序貫博弈在序貫博弈中,參與人的決策有先有后,特別是,后行
當(dāng)只有一家開發(fā)商在這個(gè)地段開發(fā)一棟寫字樓時(shí),它可以全部售出,賺得利潤(rùn)1百萬。假定A先決策,B在看見A的決策后再?zèng)Q策是否開發(fā)寫字樓。在圖中,用“博弈樹”表示博弈過程。
當(dāng)只有一家開發(fā)商在這個(gè)地段開發(fā)一棟寫房地產(chǎn)開發(fā)博弈A不開發(fā)開發(fā)BB開發(fā)不開發(fā)開發(fā)不開發(fā)(-1,-1)(1,0)(0,1)(0,0)A不開發(fā)開發(fā)BB開發(fā)不開發(fā)開發(fā)不開發(fā)(-1,-1)(1,0)
在其中每一條“路徑”的末端用向量給出A和B的支付,稱為支付向量。下面用“逆向歸納法”可以求解這個(gè)博弈。在B進(jìn)行決策的2個(gè)“決策結(jié)”上,B在左邊的決策結(jié)上選擇“不開發(fā)”;而在右邊的決策結(jié)上選擇“開發(fā)”。即給定A開發(fā),B就不開發(fā);給定A不開發(fā),B就開發(fā)。B應(yīng)避免同時(shí)與A都選擇開發(fā)而蒙受損失。在其中每一條“路徑”的末端用向量給出A和B
在這種情況下,A在自己的決策結(jié)上當(dāng)然選擇“開發(fā)”,因?yàn)樗A(yù)計(jì)當(dāng)自己選擇“開發(fā)”后,B會(huì)選擇“不開發(fā)”,自己就凈賺一百萬。當(dāng)B威脅A說:“不管你是否開發(fā),我都會(huì)在這里開發(fā)寫字樓?!碧热鬉將B的話當(dāng)了真,A就不敢開發(fā),讓B單獨(dú)開發(fā)寫字樓占便宜。但是,B的威脅是“不可置信”的。當(dāng)A不理會(huì)B的威脅而果斷地開發(fā)出一棟寫字樓時(shí),B其實(shí)不會(huì)將事前的威脅付諸實(shí)施。因?yàn)椤白R(shí)時(shí)務(wù)者為俊杰”,在A已開發(fā)的情況下,B的最優(yōu)決策是“不開發(fā)”而不是“開發(fā)”。在這種情況下,A在自己的決策結(jié)上當(dāng)然選擇“開
但是,如果B在向A發(fā)出威脅的同時(shí)又當(dāng)著A的面與第三者C打賭一定要在該地段上開發(fā)出一棟寫字樓,否則輸給C2百萬元。B與C為此簽定合同并加以公證有效。思考:這時(shí)情況又會(huì)發(fā)生什么樣的變化呢?但是,如果B在向A發(fā)出威脅的同時(shí)又情侶博弈丈夫●足球芭蕾●妻子足球芭蕾●足球芭蕾◆(2,1)(0,0)◆◆◆(-1,-1)(1,2)妻子情侶博弈丈夫●足球芭蕾●妻子足球芭蕾●足球芭蕾◆(2,1)(先動(dòng)優(yōu)勢(shì)在夫妻博弈中,有兩個(gè)納什均衡,即(足球,足球)和(芭蕾,芭蕾),前者對(duì)男方更加有利,后者對(duì)女方更加有利,但是由于男方是先行動(dòng)者,通過逆向歸納法得到的最終結(jié)果就是對(duì)男方更加有利的納什均衡。先動(dòng)優(yōu)勢(shì)先行動(dòng)者的得益大于后行動(dòng)者先動(dòng)優(yōu)勢(shì)在夫妻博弈中,有兩個(gè)納什均衡,即(足球,足球)和(芭每天讀點(diǎn)博弈論零和游戲:雙贏和多贏才是正道智豬博弈:做一頭聰明的小豬納什均衡:合作是有利的“利己策略”檸檬理論:逆向選擇的困惑……每天讀點(diǎn)博弈論零和游戲:雙贏和多贏才是正道
博弈論初步
博弈論初步博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)經(jīng)濟(jì)學(xué)的假設(shè)及其局限性兩個(gè)基本假設(shè):完全競(jìng)爭(zhēng),完美信息局限性:交易主體的數(shù)量其實(shí)很有限;信息是不對(duì)稱的一般均衡理論是整個(gè)經(jīng)濟(jì)學(xué)的理論基石和道義基礎(chǔ),市場(chǎng)機(jī)制是完美的,帕累托最優(yōu)成立,平等與效率可以兼顧。然而在以下情況不成立:非完全競(jìng)爭(zhēng):壟斷越來越普遍外部性:市場(chǎng)不可能把所有的成本收益都計(jì)算在內(nèi)公共產(chǎn)品:市場(chǎng)無非解決“搭便車”問題逆向選擇問題:檸檬市場(chǎng)道德風(fēng)險(xiǎn)問題:為什么市場(chǎng)的交易費(fèi)用比較高?博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)經(jīng)濟(jì)學(xué)的假設(shè)及其局限性博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展博弈論研究的是:在策略性環(huán)境中如何進(jìn)行策略性決策和采取策略性行動(dòng)的科學(xué)。當(dāng)成果無法由個(gè)體完全掌握,而結(jié)局須視群體共同決策而定時(shí),個(gè)人為了取勝,應(yīng)該采取什么策略博弈論成為通用方法論,經(jīng)濟(jì)學(xué)、政治學(xué)、管理、軍事、外交、國(guó)際關(guān)系、公共選擇、犯罪學(xué)博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展博弈論研究的是:在策略性環(huán)境中如何進(jìn)博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)微觀經(jīng)濟(jì)學(xué)與博弈論的比較傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的個(gè)人決策是在給定一個(gè)價(jià)格參數(shù)和收入的條件下最大化自己的效用,個(gè)人的效用與其他人無關(guān),所有其他人的行為都被總結(jié)在“價(jià)格”參數(shù)之中博弈論中,個(gè)人效用不僅依賴于自己的選擇,還以來于他人的選擇,研究在存在外部經(jīng)濟(jì)條件下的個(gè)人選擇問題事實(shí)上,行為主體的數(shù)量通常不多,相互之間存在明顯影響經(jīng)濟(jì)學(xué)對(duì)博弈論寄予厚望,認(rèn)為用博弈論可以重寫經(jīng)濟(jì)學(xué)原理博弈論改寫經(jīng)濟(jì)學(xué),從放寬新古典的完全競(jìng)爭(zhēng)和完全信息兩個(gè)條件展開博弈論與主流經(jīng)濟(jì)學(xué)的發(fā)展傳統(tǒng)微觀經(jīng)濟(jì)學(xué)與博弈論的比較博弈論的代表人物及其貢獻(xiàn)1944年,J·馮·諾依曼、O·摩根斯坦恩在《博弈理論與經(jīng)濟(jì)行為》首先提出一些博弈論的概念。1994年,納什、澤爾騰和海薩尼獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。1996年,莫里斯和維克里獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2001年,阿克洛夫、斯蒂格利茨和斯賓塞獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)2005年,奧曼和謝林獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。博弈論的代表人物及其貢獻(xiàn)1944年,J·馮·諾依曼、O·摩根一、什么是博弈論:從“囚徒困境”談起
囚徒困境兩個(gè)小偷甲和乙聯(lián)手作案,私入民宅被警方逮住但未獲證據(jù)。警方將兩人分別置于兩間房間分開審訊,政策是若一人招供但另一人未招,則招者立即被釋放,未招者判入獄10年;若二人都招則兩人各判刑8年;若兩人都不招則未獲證據(jù)但因私入民宅各拘留1年。一、什么是博弈論:從“囚徒困境”談起囚徒困境表1囚徒困境博弈
乙
招不招招甲不招(問題:甲、乙如何選擇?)
-8,-80,-10-10,0-1,-1表1囚徒困境博弈-8,-80,-10-10,0-1,-1
盡管甲不知乙是否招供,但他認(rèn)為自己選“招”最好,因而甲會(huì)選擇“招”,乙也同樣會(huì)選擇“招”,結(jié)果各判8年;但若兩人都不招,結(jié)果是兩人只被判1年,但這種結(jié)果是不會(huì)出現(xiàn)的。我們可以運(yùn)用“剔除劣戰(zhàn)略”的方法來獲得這樣的結(jié)果。
盡管甲不知乙是否招供,但他認(rèn)為自
甲或乙可以作出的選擇被稱為“戰(zhàn)略”,如“招”或“不招”都是戰(zhàn)略。
甲或乙可以作出的選擇被稱為“戰(zhàn)略”,如“思想“囚徒困境”博弈的經(jīng)濟(jì)和社會(huì)意義在于,個(gè)人理性不一定導(dǎo)致集體理性,或者說人人為自己未必導(dǎo)致整體利益。這與市場(chǎng)機(jī)制的思想是不同的。不過,兩者是相輔相成的。思想“囚徒困境”博弈的經(jīng)濟(jì)和社會(huì)意義在于,個(gè)人理性不一定導(dǎo)致囚徒困境的幾個(gè)事例:價(jià)格大戰(zhàn)兩個(gè)寡頭企業(yè)選擇產(chǎn)量軍備競(jìng)賽做廣告圍觀時(shí)踮腳尖應(yīng)試教育貿(mào)易自由與壁壘,地方保護(hù)主義囚徒困境的幾個(gè)事例:博弈論要點(diǎn)博弈:決策主體在互相對(duì)抗中,對(duì)抗雙方(或多方)互相依存的一系列策略和行動(dòng)的過程集合參與人的利益有沖突博弈是一個(gè)過程集合(參與人、策略、行動(dòng)、信息等)。把博弈視為集合是思維從具體到抽象的重要一步博弈的一個(gè)本質(zhì)特征是策略的相互依存性博弈論:專門研究博弈如何出現(xiàn)均衡的規(guī)律的學(xué)問博弈論要點(diǎn)博弈:決策主體在互相對(duì)抗中,對(duì)抗雙方(或多方)互相博弈論要點(diǎn)博弈論的基本概念包括:參與人、參與人的策略、參與人的支付(效用)博弈有不同的種類:從行動(dòng)順序角度:靜態(tài)博弈。參與人同時(shí)選擇行動(dòng)動(dòng)態(tài)博弈。參與人的行動(dòng)有先后順序從擁有信息角度:完全信息博弈。每個(gè)參與人對(duì)所有其他參與人的特征、戰(zhàn)略空間、支付函數(shù)有準(zhǔn)確的知識(shí)不完全信息博弈。博弈論要點(diǎn)博弈論的基本概念包括:參與人、參與人的策略、參與人博弈的分類與對(duì)應(yīng)的均衡概念靜態(tài)博弈:博弈中參與人同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知道前行動(dòng)者采取什么行動(dòng);動(dòng)態(tài)博弈(序貫博弈):參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。完全信息指的是每個(gè)參與人對(duì)所有其他參與人(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí),否則就是不完全信息。博弈的分類與對(duì)應(yīng)的均衡概念靜態(tài)博弈:博弈中參與人同時(shí)選擇行動(dòng)博弈的種類合作博弈與非合作博弈廠商之間的經(jīng)濟(jì)博弈可以是合作的,也可以是非合作的。區(qū)別在于是否存在一個(gè)有約束力的協(xié)議。如果有,就是合作博弈;如果沒有,就是非合作博弈。前者強(qiáng)調(diào)團(tuán)體理性,即效率、公平和公正;后者強(qiáng)調(diào)個(gè)人理性和個(gè)人最優(yōu)決策。博弈的種類合作博弈與非合作博弈
同時(shí)博弈與序貫博弈前者是博弈各方在不了解對(duì)方情況下制定決策;后者是一方看到另一方的行動(dòng)之后再采取行動(dòng)。同時(shí)博弈與序貫博弈一次博弈與重復(fù)博弈博弈行動(dòng)只進(jìn)行一次的是一次博弈;博弈行動(dòng)進(jìn)行多次的是重復(fù)博弈雙人博弈與多人博弈前者只有兩人參加行動(dòng),后者有多人參加行動(dòng)一次博弈與重復(fù)博弈零和博弈與非零和博弈在零和博弈中,一方之所得即為另一方之所失;在非零和博弈中,雙方的得失取決于各自選擇采取的行動(dòng)。零和博弈與非零和博弈二、同時(shí)博弈:純策略博弈同時(shí)博弈與序貫博弈同時(shí)博弈是參與人同時(shí)進(jìn)行決策或行動(dòng)的博弈;所謂同時(shí)或先后主要是看參與人在決策時(shí)是否已經(jīng)知道其他參與人的決策序貫博弈是參與人的決策和行動(dòng)有先有后的博弈。二、同時(shí)博弈:純策略博弈同時(shí)博弈與序貫博弈支付矩陣(也稱報(bào)酬矩陣)被用來描述和分析一個(gè)博弈。支付矩陣(也稱報(bào)酬矩陣)被用來描述和分析一個(gè)博弈。占優(yōu)策略無論其他參與者采取什么策略,某參與者都存在唯一的最優(yōu)策略選擇,這一最優(yōu)策略就是他的占優(yōu)策略。如果某個(gè)參與者具有占優(yōu)策略,那么,無論其他參與者選擇什么策略,該參與者確信自己所選擇的唯一策略都是最優(yōu)的。博弈均衡指博弈中的所有參與者都不想改變自己的策略的一種狀態(tài)。占優(yōu)策略納什均衡是指這樣一種狀態(tài),任何一個(gè)參與者都不會(huì)改變自己的策略,如果其他參與者不改變策略;在該策略組合上,任何參與人單獨(dú)改變策略都不會(huì)得到好處;納什均衡條件策略下劃線法條件策略,參與人給定條件下的相對(duì)優(yōu)勢(shì)策略,如甲廠商在乙廠商選擇合作條件下的條件(優(yōu)勢(shì))策略為不合作。首先用下劃線表示甲廠商的條件策略其次用下劃線表示乙廠商的條件策略最后找到在兩個(gè)數(shù)字之下都畫線的單元格即為博弈的均衡。條件策略下劃線法智豬博弈(boxedpigs)豬圈中有一頭大豬和一頭小豬,在豬圈的一端設(shè)有一個(gè)按鈕,每按一下,位于豬圈另一端的食槽中就會(huì)有10單位的豬食進(jìn)槽,但每按一下按鈕會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,則大豬吃到9單位食物,小豬僅能吃到1單位食物;如果兩豬同時(shí)到食槽,則大豬吃7單位,小豬吃3單位食物;如果小豬先到,大豬吃6單位而小豬吃4單位食物。表4給出這個(gè)博弈的支付矩陣。納什均衡智豬博弈(boxedpigs)納什均衡小豬按等待大豬按等待5,14,49,-10,0小豬按等待大豬按5,14,49,-10小豬的最優(yōu)策略:等待大豬無最優(yōu)策略:即大豬的最優(yōu)策略是依賴于小豬的策略
此時(shí)用重復(fù)剔除嚴(yán)格劣策略的思路找出均衡:小豬的嚴(yán)格劣策略為按,剔除“按”后,小豬只有一種策略等待,大豬仍有兩個(gè)策略,但此時(shí),“等待”已成為大豬的劣策略,剔除,大豬的最優(yōu)策略——按這是一個(gè)“多勞不多得,少勞不少得”的均衡小豬的最優(yōu)策略:等待股市博弈在股票市場(chǎng)上,大戶是大豬,他們要進(jìn)行技術(shù)分析,收集信息、預(yù)測(cè)股價(jià)走勢(shì),但大量散戶就是小豬。他們不會(huì)花成本去進(jìn)行技術(shù)分析,而是跟著大戶的投資戰(zhàn)略進(jìn)行股票買賣,即所謂“散戶跟大戶”的現(xiàn)象。股市博弈為什么中小企業(yè)不會(huì)花錢去開發(fā)新產(chǎn)品?在技術(shù)創(chuàng)新市場(chǎng)上,大企業(yè)是大豬,它們投入大量資金進(jìn)行技術(shù)創(chuàng)新,開發(fā)新產(chǎn)品,而中小企業(yè)是小豬,不會(huì)進(jìn)行大規(guī)模技術(shù)創(chuàng)新,而是等待大企業(yè)的新產(chǎn)品形成新的市場(chǎng)后生產(chǎn),模仿大企業(yè)的新產(chǎn)品的產(chǎn)品去銷售。為什么中小企業(yè)不會(huì)花錢去開發(fā)新產(chǎn)品?三、序貫博弈在序貫博弈中,參與人的決策有先有后,特別是,后行動(dòng)的參與人可以觀察到先行動(dòng)的參與人已經(jīng)采取了的策略。在圖中,有兩個(gè)房地產(chǎn)開發(fā)商A和B分別決定在同一地段上開發(fā)一棟寫字樓。由于市場(chǎng)需求有限,如果他們都開發(fā),則在同一地段會(huì)有兩棟寫字樓,超過了市場(chǎng)對(duì)寫字樓的需求,難以完全出售,空置房太多導(dǎo)致各自虧損1百萬。三、序貫博弈在序貫博弈中,參與人的決策有先有后,特別是,后行
當(dāng)只有一家開發(fā)商在這個(gè)地段開發(fā)一棟寫字樓時(shí),它可以全部售出,賺得利潤(rùn)1百萬。假定A先決策,B在看見A的決策后再?zèng)Q策是否開發(fā)寫字樓。在圖中,用“博弈樹”表示博弈過程。
當(dāng)只有一家開發(fā)商在這個(gè)地段開發(fā)一棟寫房地產(chǎn)開發(fā)博弈A不開發(fā)開發(fā)BB開
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 河南省信陽市淮濱縣2024-2025學(xué)年九年級(jí)上學(xué)期11月期中考試化學(xué)試題
- 廣東省佛山市順德區(qū)德勝學(xué)校2024-2025學(xué)年八年級(jí)上學(xué)期11月期中數(shù)學(xué)試題(含答案)
- 酶標(biāo)記制劑行業(yè)相關(guān)投資計(jì)劃提議范本
- 電磁波吸收材料相關(guān)行業(yè)投資規(guī)劃報(bào)告范本
- 銀釬料行業(yè)相關(guān)投資計(jì)劃提議范本
- 醫(yī)用X射線增強(qiáng)電視系統(tǒng)相關(guān)行業(yè)投資規(guī)劃報(bào)告
- 負(fù)壓封閉引流技術(shù) 課件
- 學(xué)校防空演練方案
- 節(jié)日安全主題班會(huì)
- 通信設(shè)備LTE-FDD無線網(wǎng)絡(luò)新建(增補(bǔ))工程安全生產(chǎn)資料
- 拒絕垃圾食品提高食品安全意識(shí)宣傳課件
- 2024統(tǒng)編版初中八年級(jí)語文上冊(cè)第二單元:大單元整體教學(xué)設(shè)計(jì)
- 天一大聯(lián)考2025屆物理高一上期中質(zhì)量檢測(cè)模擬試題含解析
- 2024年全新七年級(jí)語文上冊(cè)期中試卷及答案(人教版)
- 2024年四川省綿陽市中考英語試題卷(標(biāo)準(zhǔn)含答案)
- 朝鮮族介紹課件
- 用戶運(yùn)營(yíng)指南
- 投幣啟動(dòng)設(shè)備用機(jī)械裝置市場(chǎng)環(huán)境與對(duì)策分析
- 2024年重慶高考化學(xué)試題卷(含答案解析)
- 關(guān)于護(hù)理垂直管理體系的工作方案
- 工業(yè)機(jī)器人編程語言:RAPID(ABB):RAPID編程項(xiàng)目實(shí)戰(zhàn)
評(píng)論
0/150
提交評(píng)論