《博弈論》445頁(yè)中英雙語(yǔ)精品全套課件完整版_第1頁(yè)
《博弈論》445頁(yè)中英雙語(yǔ)精品全套課件完整版_第2頁(yè)
《博弈論》445頁(yè)中英雙語(yǔ)精品全套課件完整版_第3頁(yè)
《博弈論》445頁(yè)中英雙語(yǔ)精品全套課件完整版_第4頁(yè)
《博弈論》445頁(yè)中英雙語(yǔ)精品全套課件完整版_第5頁(yè)
已閱讀5頁(yè),還剩440頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博弈論博弈論Game Theory一、博弈一、博弈GameGame 博弈論博弈論Game TheoryGame Theory前言前言PrefacePreface 參與人:兩人及兩人以上;參與人:兩人及兩人以上; 行為:做出決策;行為:做出決策; 行為目標(biāo):收益最大化行為目標(biāo):收益最大化 環(huán)境條件:目標(biāo)的實(shí)現(xiàn)不僅取決于自己環(huán)境條件:目標(biāo)的實(shí)現(xiàn)不僅取決于自己 的行為,同時(shí)還取決于其他的行為,同時(shí)還取決于其他 人的行為,個(gè)人的最優(yōu)選擇人的行為,個(gè)人的最優(yōu)選擇 是其他人選擇的函數(shù)是其他人選擇的函數(shù) 策略性的行為策略性的行為分錢游戲與運(yùn)輸路線選擇分錢游戲與運(yùn)輸路線選擇博弈博弈Game: 博弈博弈是指代表

2、不同利益主體的決策者,在一是指代表不同利益主體的決策者,在一 定的環(huán)境條件和規(guī)那么下,同時(shí)或先后、一次定的環(huán)境條件和規(guī)那么下,同時(shí)或先后、一次 或?qū)掖螐母髯栽试S選擇的行動(dòng)方案中加以選或?qū)掖螐母髯栽试S選擇的行動(dòng)方案中加以選 擇并實(shí)施,從而取得各自相應(yīng)結(jié)果的活動(dòng)。擇并實(shí)施,從而取得各自相應(yīng)結(jié)果的活動(dòng)。美美Roger B. Myerson一個(gè)博弈指的是涉及到一個(gè)博弈指的是涉及到 兩個(gè)或更多個(gè)參與人的某個(gè)社會(huì)局勢(shì)。兩個(gè)或更多個(gè)參與人的某個(gè)社會(huì)局勢(shì)。英英Adam Smith博弈是個(gè)體參與人從各自的博弈是個(gè)體參與人從各自的 動(dòng)機(jī)出發(fā)生相互作用的一種狀態(tài)。動(dòng)機(jī)出發(fā)生相互作用的一種狀態(tài)。博弈論博弈論Game

3、Theory,對(duì)策論:,對(duì)策論:美美Roger B. Myerson博弈論可以被定義博弈論可以被定義 為是智能的理性決策者之間沖突與合作的為是智能的理性決策者之間沖突與合作的 數(shù)學(xué)模型的研究。數(shù)學(xué)模型的研究。 美美Robert Gibbonsis the study of multi- person decision problems. 張維迎張維迎是研究決策主體的行為發(fā)生直接是研究決策主體的行為發(fā)生直接 相互作用相互作用 時(shí)候的決策以及這種決時(shí)候的決策以及這種決 策的均衡問題的,也就是說,當(dāng)策的均衡問題的,也就是說,當(dāng) 一個(gè)主體,好比說一個(gè)人或一個(gè)主體,好比說一個(gè)人或 一個(gè)一個(gè) 企業(yè)的選擇受

4、到其他人、其他企企業(yè)的選擇受到其他人、其他企 業(yè)選擇的影響,而且反過來影響業(yè)選擇的影響,而且反過來影響 到其他人、其他企業(yè)選擇時(shí)的決到其他人、其他企業(yè)選擇時(shí)的決 策問題和均衡問題。策問題和均衡問題。 張守一張守一是研究聰明而又理智的決策者在是研究聰明而又理智的決策者在 沖突或合作中的策略選擇理論。沖突或合作中的策略選擇理論。教材教材P5 博弈論就是系統(tǒng)研究各種各博弈論就是系統(tǒng)研究各種各 樣博弈中參與人的合理選擇及其樣博弈中參與人的合理選擇及其 均衡的理論。均衡的理論。關(guān)于關(guān)于“經(jīng)濟(jì)博弈論:經(jīng)濟(jì)博弈論: 博弈論是研究人們?cè)诶嫦嗷ビ绊懙母窬植┺恼撌茄芯咳藗冊(cè)诶嫦嗷ビ绊懙母窬种械牟呗赃x擇問題、是

5、研究多人決策問題的理中的策略選擇問題、是研究多人決策問題的理論。而策略選擇是人們經(jīng)濟(jì)行為的核心內(nèi)容,論。而策略選擇是人們經(jīng)濟(jì)行為的核心內(nèi)容,此外,經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的:此外,經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的:即強(qiáng)調(diào)個(gè)人理性,也就是在給定的約束條件下即強(qiáng)調(diào)個(gè)人理性,也就是在給定的約束條件下追求效用最大化??梢?,經(jīng)濟(jì)學(xué)和博弈論具追求效用最大化??梢姡?jīng)濟(jì)學(xué)和博弈論具有內(nèi)在的聯(lián)系。在經(jīng)濟(jì)學(xué)和博弈論具有的這有內(nèi)在的聯(lián)系。在經(jīng)濟(jì)學(xué)和博弈論具有的這種天然聯(lián)系的根底上產(chǎn)生了經(jīng)濟(jì)博弈論。種天然聯(lián)系的根底上產(chǎn)生了經(jīng)濟(jì)博弈論。 將博弈的思想明確地應(yīng)用于經(jīng)濟(jì)領(lǐng)域,始將博弈的思想明確地應(yīng)用于經(jīng)濟(jì)領(lǐng)域,始于

6、古諾于古諾Cournot,1838、伯特蘭德、伯特蘭德Bertrand,1883和艾奇沃斯和艾奇沃斯 Edgeworth,1925等人關(guān)于兩寡頭的產(chǎn)量和等人關(guān)于兩寡頭的產(chǎn)量和價(jià)格壟斷、產(chǎn)品交易行為的研究,他們通過對(duì)價(jià)格壟斷、產(chǎn)品交易行為的研究,他們通過對(duì)不同的經(jīng)濟(jì)行為方式和案例建立了相應(yīng)的博弈不同的經(jīng)濟(jì)行為方式和案例建立了相應(yīng)的博弈論模型,為經(jīng)濟(jì)博弈論的開展提供了思想雛形論模型,為經(jīng)濟(jì)博弈論的開展提供了思想雛形和有益嘗試。近半個(gè)多世紀(jì)以來,博弈論引起和有益嘗試。近半個(gè)多世紀(jì)以來,博弈論引起了眾多經(jīng)濟(jì)學(xué)家的極大興趣,使得博弈論在經(jīng)了眾多經(jīng)濟(jì)學(xué)家的極大興趣,使得博弈論在經(jīng)濟(jì)學(xué)中的應(yīng)用模型越來越多。

7、大約從濟(jì)學(xué)中的應(yīng)用模型越來越多。大約從20世紀(jì)世紀(jì)80年代開始,博弈論逐漸成為主流經(jīng)濟(jì)學(xué)的一局年代開始,博弈論逐漸成為主流經(jīng)濟(jì)學(xué)的一局部,甚至可以說成為微觀經(jīng)濟(jì)學(xué)的根底張維部,甚至可以說成為微觀經(jīng)濟(jì)學(xué)的根底張維迎,迎,P8。 博弈論究竟是一門什么樣的學(xué)科呢?有人博弈論究竟是一門什么樣的學(xué)科呢?有人認(rèn)為是經(jīng)濟(jì)學(xué)的一個(gè)分支,有人認(rèn)為是數(shù)學(xué)的認(rèn)為是經(jīng)濟(jì)學(xué)的一個(gè)分支,有人認(rèn)為是數(shù)學(xué)的一個(gè)分支。我們把它看作是一種方法論,即它一個(gè)分支。我們把它看作是一種方法論,即它提供了一個(gè)觀察問題的新視角、分析問題的新提供了一個(gè)觀察問題的新視角、分析問題的新方法和解決問題的新思路;它的應(yīng)用范圍不僅方法和解決問題的新思路

8、;它的應(yīng)用范圍不僅包括經(jīng)濟(jì)學(xué),像政治學(xué)、軍事、外交、國(guó)際關(guān)包括經(jīng)濟(jì)學(xué),像政治學(xué)、軍事、外交、國(guó)際關(guān)系、公共選擇、犯罪心理分析等都涉及博弈論。系、公共選擇、犯罪心理分析等都涉及博弈論。只不過從應(yīng)用的成果來看,博弈論在經(jīng)濟(jì)學(xué)領(lǐng)只不過從應(yīng)用的成果來看,博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域的應(yīng)用最廣泛、最成功,經(jīng)濟(jì)學(xué)家對(duì)博弈論域的應(yīng)用最廣泛、最成功,經(jīng)濟(jì)學(xué)家對(duì)博弈論的奉獻(xiàn)也特別大,使得博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域的的奉獻(xiàn)也特別大,使得博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域的應(yīng)用無處不在:微觀研究領(lǐng)域有交易機(jī)制的模應(yīng)用無處不在:微觀研究領(lǐng)域有交易機(jī)制的模型如討價(jià)還價(jià)模型和拍賣模型;型如討價(jià)還價(jià)模型和拍賣模型;在中觀經(jīng)濟(jì)研究中,勞動(dòng)力經(jīng)濟(jì)學(xué)和金融理在中

9、觀經(jīng)濟(jì)研究中,勞動(dòng)力經(jīng)濟(jì)學(xué)和金融理論都有關(guān)于企業(yè)要素投入品市場(chǎng)的博弈模型,論都有關(guān)于企業(yè)要素投入品市場(chǎng)的博弈模型,即使在一個(gè)企業(yè)內(nèi)部也存在博弈問題:工人之即使在一個(gè)企業(yè)內(nèi)部也存在博弈問題:工人之間會(huì)為同一個(gè)升遷時(shí)機(jī)勾心斗角,不同部門之間會(huì)為同一個(gè)升遷時(shí)機(jī)勾心斗角,不同部門之間為爭(zhēng)取公司的資金投入相互競(jìng)爭(zhēng);從宏觀角間為爭(zhēng)取公司的資金投入相互競(jìng)爭(zhēng);從宏觀角度看,國(guó)際經(jīng)濟(jì)學(xué)中有關(guān)于國(guó)家間的相互競(jìng)爭(zhēng)度看,國(guó)際經(jīng)濟(jì)學(xué)中有關(guān)于國(guó)家間的相互競(jìng)爭(zhēng)或相互串謀、選擇關(guān)稅或其他貿(mào)易政策的模型;或相互串謀、選擇關(guān)稅或其他貿(mào)易政策的模型;至于產(chǎn)業(yè)組織理論更是大量應(yīng)用博弈論的方法至于產(chǎn)業(yè)組織理論更是大量應(yīng)用博弈論的方法見

10、見Jean Tirole的的?產(chǎn)業(yè)組織理論產(chǎn)業(yè)組織理論?。二、博弈論的產(chǎn)生和開展二、博弈論的產(chǎn)生和開展 博弈思想的根本特征是參與人在追求自己博弈思想的根本特征是參與人在追求自己目標(biāo)的過程中,不僅僅只是考慮自己能怎么目標(biāo)的過程中,不僅僅只是考慮自己能怎么做,還必須要考慮其他參與人會(huì)怎么做;針做,還必須要考慮其他參與人會(huì)怎么做;針對(duì)其他參與人的行為,自己該實(shí)施哪個(gè)可行對(duì)其他參與人的行為,自己該實(shí)施哪個(gè)可行的行動(dòng),才能使自己的目標(biāo)函數(shù)最大化,也的行動(dòng),才能使自己的目標(biāo)函數(shù)最大化,也就是說,在一個(gè)博弈格局中,每個(gè)參與人所就是說,在一個(gè)博弈格局中,每個(gè)參與人所實(shí)施的行動(dòng)都是策略性的行動(dòng)。實(shí)施的行動(dòng)都是策

11、略性的行動(dòng)。 知己知彼,百戰(zhàn)不殆知己知彼,百戰(zhàn)不殆產(chǎn)生與開展產(chǎn)生與開展 教材教材P1-3 ?現(xiàn)代經(jīng)濟(jì)對(duì)策論現(xiàn)代經(jīng)濟(jì)對(duì)策論?P6-7馮馮諾依曼和摩根斯坦諾依曼和摩根斯坦Von.neumann and morgenstern 馮馮 諾依曼是諾依曼是20世紀(jì)偉大的數(shù)學(xué)家之一,后者是德國(guó)人世紀(jì)偉大的數(shù)學(xué)家之一,后者是德國(guó)人1902年生,美國(guó)當(dāng)代杰出經(jīng)濟(jì)學(xué)家。年生,美國(guó)當(dāng)代杰出經(jīng)濟(jì)學(xué)家。 ?The theory of Games and Economic Behaviour?的產(chǎn)的產(chǎn)生:二戰(zhàn)期間,為了有效對(duì)抗法西斯,不僅是軍人,連物生:二戰(zhàn)期間,為了有效對(duì)抗法西斯,不僅是軍人,連物理學(xué)家、數(shù)學(xué)家,甚至經(jīng)

12、濟(jì)學(xué)家都被發(fā)動(dòng)起來,組成理學(xué)家、數(shù)學(xué)家,甚至經(jīng)濟(jì)學(xué)家都被發(fā)動(dòng)起來,組成“運(yùn)運(yùn)籌研究班,共同研究作戰(zhàn)方案,在作戰(zhàn)中數(shù)學(xué)的合理性籌研究班,共同研究作戰(zhàn)方案,在作戰(zhàn)中數(shù)學(xué)的合理性得到了廣泛運(yùn)用,產(chǎn)生了種種理論。博弈論便是其中之一。得到了廣泛運(yùn)用,產(chǎn)生了種種理論。博弈論便是其中之一。二戰(zhàn)結(jié)束后,大局部理論研究都轉(zhuǎn)向其他領(lǐng)域。博弈論那么二戰(zhàn)結(jié)束后,大局部理論研究都轉(zhuǎn)向其他領(lǐng)域。博弈論那么在摩根斯坦的勸說下,與馮合作成就了在摩根斯坦的勸說下,與馮合作成就了?The theory of Games and Economic Behaviour?,即轉(zhuǎn)到了經(jīng)濟(jì)領(lǐng)域。冷,即轉(zhuǎn)到了經(jīng)濟(jì)領(lǐng)域。冷戰(zhàn)期間得到了政府的大

13、力支持,博弈論不僅在經(jīng)濟(jì)領(lǐng)域,戰(zhàn)期間得到了政府的大力支持,博弈論不僅在經(jīng)濟(jì)領(lǐng)域,而后在社會(huì)學(xué)、外交問題軍事問題上都得到了應(yīng)用。而后在社會(huì)學(xué)、外交問題軍事問題上都得到了應(yīng)用。因?qū)Σ┺恼撗芯孔鞒鼋艹龇瞰I(xiàn)而獲諾貝爾經(jīng)濟(jì)因?qū)Σ┺恼撗芯孔鞒鼋艹龇瞰I(xiàn)而獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)的經(jīng)濟(jì)學(xué)家:學(xué)獎(jiǎng)的經(jīng)濟(jì)學(xué)家:納什納什(Nash): Nash-Equilibrium 塞爾藤塞爾藤(Selten):Subgame-Perfect Nash E- 海薩尼海薩尼(Harsanyi) : Bayes-Nash Equilibrium 1994維克利、莫里斯維克利、莫里斯 1996邁克爾邁克爾斯賓斯斯賓斯(Spence): 194

14、8年生于美國(guó)的新年生于美國(guó)的新澤西,澤西,1972年獲哈佛大學(xué)博士頭銜,現(xiàn)兼任美國(guó)年獲哈佛大學(xué)博士頭銜,現(xiàn)兼任美國(guó) 哈佛和斯坦福兩所大學(xué)經(jīng)濟(jì)學(xué)教授。哈佛和斯坦福兩所大學(xué)經(jīng)濟(jì)學(xué)教授。 喬治喬治阿克爾洛夫:阿克爾洛夫:1940年生于美國(guó)的紐黑文,年生于美國(guó)的紐黑文,1966年獲美國(guó)麻省理工學(xué)院博士頭銜,現(xiàn)為美國(guó)年獲美國(guó)麻省理工學(xué)院博士頭銜,現(xiàn)為美國(guó)加利福尼亞大學(xué)經(jīng)濟(jì)學(xué)教授。加利福尼亞大學(xué)經(jīng)濟(jì)學(xué)教授。 約瑟夫約瑟夫斯蒂格利茨,斯蒂格利茨,1948年生于美國(guó)的印年生于美國(guó)的印第安納州,第安納州,1967年獲美國(guó)麻省理工學(xué)院博士年獲美國(guó)麻省理工學(xué)院博士頭銜,曾任世界銀行的首席經(jīng)濟(jì)學(xué)家,現(xiàn)任頭銜,曾任世界

15、銀行的首席經(jīng)濟(jì)學(xué)家,現(xiàn)任美國(guó)哥倫比亞大學(xué)經(jīng)濟(jì)學(xué)教授。美國(guó)哥倫比亞大學(xué)經(jīng)濟(jì)學(xué)教授。 2001年三人同獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),分享年三人同獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),分享1000萬瑞典克郎萬瑞典克郎94.3萬美元的獎(jiǎng)金。瑞典萬美元的獎(jiǎng)金。瑞典皇家科學(xué)院之所以把這崇高的榮譽(yù)給予這三皇家科學(xué)院之所以把這崇高的榮譽(yù)給予這三位經(jīng)濟(jì)學(xué)家,是因?yàn)樗麄冊(cè)诂F(xiàn)代信息經(jīng)濟(jì)學(xué)位經(jīng)濟(jì)學(xué)家,是因?yàn)樗麄冊(cè)诂F(xiàn)代信息經(jīng)濟(jì)學(xué)研究領(lǐng)域作出了突出的奉獻(xiàn),他們研究領(lǐng)域作出了突出的奉獻(xiàn),他們“開展并開展并研究了市場(chǎng)信息不對(duì)稱的問題,揭示了當(dāng)代研究了市場(chǎng)信息不對(duì)稱的問題,揭示了當(dāng)代信息經(jīng)濟(jì)的核心。教材信息經(jīng)濟(jì)的核心。教材P192 阿克爾洛夫是最早發(fā)現(xiàn)信息不

16、對(duì)稱的學(xué)者之阿克爾洛夫是最早發(fā)現(xiàn)信息不對(duì)稱的學(xué)者之一。我們上街購(gòu)物,幾乎處處都能碰上假貨:一。我們上街購(gòu)物,幾乎處處都能碰上假貨:花了上千元買的花了上千元買的“進(jìn)口名牌服裝,原來是國(guó)進(jìn)口名牌服裝,原來是國(guó)產(chǎn)的,只值幾十元;產(chǎn)的,只值幾十元;“真皮皮鞋用的是人造真皮皮鞋用的是人造革的料革的料為什么假貨愈為什么假貨愈 演愈烈?為什么假貨演愈烈?為什么假貨在開展中國(guó)家特別猖獗?阿克爾洛夫答復(fù)說:在開展中國(guó)家特別猖獗?阿克爾洛夫答復(fù)說:“一家商場(chǎng),一般是售貨員比顧客更了解產(chǎn)品一家商場(chǎng),一般是售貨員比顧客更了解產(chǎn)品的質(zhì)量,如果售貨員把這種信息加以壟斷,最的質(zhì)量,如果售貨員把這種信息加以壟斷,最后即使他提

17、供越來越差的產(chǎn)品,顧客也不會(huì)知后即使他提供越來越差的產(chǎn)品,顧客也不會(huì)知道。顧客的利益因而受到損害。只有買錯(cuò),道。顧客的利益因而受到損害。只有買錯(cuò),沒有賣錯(cuò)阿克爾洛夫最大的奉獻(xiàn)是解釋了在沒有賣錯(cuò)阿克爾洛夫最大的奉獻(xiàn)是解釋了在開展中國(guó)家里,信貸市場(chǎng)信息的不對(duì)稱導(dǎo)致了開展中國(guó)家里,信貸市場(chǎng)信息的不對(duì)稱導(dǎo)致了這些國(guó)家信這些國(guó)家信貸市場(chǎng)的過高利息。此外,阿克爾洛夫還把信貸市場(chǎng)的過高利息。此外,阿克爾洛夫還把信息不對(duì)稱運(yùn)用于解釋各種社會(huì)問題,比方因?yàn)樾畔⒉粚?duì)稱運(yùn)用于解釋各種社會(huì)問題,比方因?yàn)樾畔⒉粚?duì)稱,醫(yī)療保險(xiǎn)市場(chǎng)上,老年人、個(gè)體勞動(dòng)息不對(duì)稱,醫(yī)療保險(xiǎn)市場(chǎng)上,老年人、個(gè)體勞動(dòng)者的醫(yī)療保險(xiǎn)利益得不到保障。者

18、的醫(yī)療保險(xiǎn)利益得不到保障。三、根本概念三、根本概念 1、參與人、參與人Players:一個(gè)博弈中的決策主體,一個(gè)博弈中的決策主體,他們各自的目的是通過選擇行動(dòng)策略以最他們各自的目的是通過選擇行動(dòng)策略以最大化自己的目標(biāo)函數(shù)大化自己的目標(biāo)函數(shù)/效用水平效用水平/支付函數(shù)。他們支付函數(shù)。他們可以是自然人或團(tuán)體或法人,如企業(yè)、國(guó)家、可以是自然人或團(tuán)體或法人,如企業(yè)、國(guó)家、地區(qū)、社團(tuán)、歐盟、北約等。地區(qū)、社團(tuán)、歐盟、北約等。 那些不作決策或雖做決策但不直接承擔(dān)決那些不作決策或雖做決策但不直接承擔(dān)決策后果的被動(dòng)主體不是參與人,而只能當(dāng)做環(huán)策后果的被動(dòng)主體不是參與人,而只能當(dāng)做環(huán)境參數(shù)來處理。如指手劃腳的看

19、牌人、看棋人,境參數(shù)來處理。如指手劃腳的看牌人、看棋人,企業(yè)的參謀等。企業(yè)的參謀等。 對(duì)參與人的決策來說,最重要的是必須有對(duì)參與人的決策來說,最重要的是必須有可供選擇的行動(dòng)集策略集和一個(gè)很好定義的可供選擇的行動(dòng)集策略集和一個(gè)很好定義的支付函數(shù)。支付函數(shù)。 虛擬參與人虛擬參與人pseudo-player:指指“自然自然 nature、“上帝上帝 God,也即決定外生的隨機(jī),也即決定外生的隨機(jī)變量的概率分布的機(jī)制。變量的概率分布的機(jī)制?!澳呈略谌?、成事在天某事在人、成事在天的的“天;如出遠(yuǎn)門去旅游,可能很開心,也可能天;如出遠(yuǎn)門去旅游,可能很開心,也可能很為難生病住醫(yī)院,兩者概率分布很為難生病住醫(yī)

20、院,兩者概率分布90%、10%或或98%與與2%或其他,由上帝決定?;蚱渌?,由上帝決定。 在以后的討論中,我們記參與人為在以后的討論中,我們記參與人為i,參與人參與人集合記為集合記為T,即,即T=1,2, , i , ,n ,即該博弈中共有即該博弈中共有n個(gè)參與人;為了討論的方便個(gè)參與人;為了討論的方便,把某個(gè)參與人,把某個(gè)參與人i之外的其他參與人稱為的之外的其他參與人稱為的i對(duì)手對(duì)手記為記為- i ; N代表自然。代表自然。 *注意:注意: 博弈理論家一般對(duì)參與人做兩個(gè)根本的假設(shè)博弈理論家一般對(duì)參與人做兩個(gè)根本的假設(shè)參與人都是理性的和智能的參與人都是理性的和智能的理性的理性的rational

21、? 1如果一個(gè)決策者在追逐其目標(biāo)時(shí)能如果一個(gè)決策者在追逐其目標(biāo)時(shí)能前后一致地做決策,就稱他為前后一致地做決策,就稱他為rational。Roger BMyerson (P2) 2廣義而言指的是一種行為方式,他廣義而言指的是一種行為方式,他同在給定條件或約束下最有效地實(shí)現(xiàn)預(yù)期目同在給定條件或約束下最有效地實(shí)現(xiàn)預(yù)期目標(biāo)相關(guān)。具體地講,理性大致有以下三項(xiàng)標(biāo)相關(guān)。具體地講,理性大致有以下三項(xiàng)內(nèi)容:內(nèi)容:1存在一組可供選擇的備選或替代方存在一組可供選擇的備選或替代方案;案;2每一種方案均對(duì)應(yīng)著某種特定的預(yù)期每一種方案均對(duì)應(yīng)著某種特定的預(yù)期凈收益或滿足程度或目標(biāo)實(shí)現(xiàn)程度;凈收益或滿足程度或目標(biāo)實(shí)現(xiàn)程度;3

22、人們?nèi)藗兛偸沁x擇那個(gè)能夠帶來最大預(yù)期凈收益的方案??偸沁x擇那個(gè)能夠帶來最大預(yù)期凈收益的方案。西蒙,西蒙,1964智能的智能的intelligent? 當(dāng)我們像博弈論專家那樣分析一個(gè)博弈時(shí),當(dāng)我們像博弈論專家那樣分析一個(gè)博弈時(shí),如果參與人知道我們對(duì)此博弈所知道的一切,如果參與人知道我們對(duì)此博弈所知道的一切,并能做出我們對(duì)此博弈所能做出的一切推斷,并能做出我們對(duì)此博弈所能做出的一切推斷,我們就說此博弈的參與人是智能的。我們就說此博弈的參與人是智能的。RogerBMyerson (P3) 2、策略、策略strategies :博弈中有兩種策略概博弈中有兩種策略概念,一種為純策略念,一種為純策略pur

23、e strategy , 簡(jiǎn)稱策略,簡(jiǎn)稱策略,指參與人在博弈中可以選擇采用的行動(dòng)指參與人在博弈中可以選擇采用的行動(dòng)ac- tions or moves方案,是參與人在給定信息結(jié)方案,是參與人在給定信息結(jié)構(gòu)的情況下的行動(dòng)規(guī)那么,它規(guī)定參與人在什么構(gòu)的情況下的行動(dòng)規(guī)那么,它規(guī)定參與人在什么時(shí)候的什么情況下采取什么行動(dòng)。因而一個(gè)策時(shí)候的什么情況下采取什么行動(dòng)。因而一個(gè)策略是參與人的一個(gè)略是參與人的一個(gè)“相機(jī)行動(dòng)方案相機(jī)行動(dòng)方案contingentAction plan。如。如“人不犯我人不犯我、“按第一套按第一套方方案行動(dòng)、實(shí)施第二套方案案行動(dòng)、實(shí)施第二套方案 ,記參與人,記參與人i的一個(gè)策略為的一

24、個(gè)策略為si,參與人,參與人i在一個(gè)博弈中的全部可在一個(gè)博弈中的全部可供選擇的策略記為供選擇的策略記為Si策略集策略集strategy set,即,即si Si , Si =s1 ,s2 , si , sn,表示參與表示參與人人i 在該博弈中共有在該博弈中共有n個(gè)可行的策略。個(gè)可行的策略。如果如果n個(gè)參與人每人從自己的個(gè)參與人每人從自己的Si中選擇一個(gè)策略中選擇一個(gè)策略si,那么向量那么向量s= s1,s2,si, sn是一是一個(gè)個(gè)策略組合策略組合(strategy profile),參與人參與人i之外的其他參之外的其他參與人的策略組合可記為與人的策略組合可記為s-i= s1,s2,si-1

25、,si+1 , sn。 例如田忌的某個(gè)策略例如田忌的某個(gè)策略s田忌田忌=上中下,或中下上,上中下,或中下上,等等;等等;S田忌田忌=上中下,上下中,中上下,中下上上中下,上下中,中上下,中下上,下上中,下中上,下上中,下中上 另一種策略概念是在純策略根底上形成的另一種策略概念是在純策略根底上形成的混合策略混合策略mixed strategy概念,參與人概念,參與人i的的混合策略混合策略pi是他的純策略空間是他的純策略空間Si上的一種概率上的一種概率分布,表示參與人實(shí)際進(jìn)行決策時(shí)根據(jù)這種分布,表示參與人實(shí)際進(jìn)行決策時(shí)根據(jù)這種概率分布在純策略中隨機(jī)選擇加以實(shí)施。概率分布在純策略中隨機(jī)選擇加以實(shí)施。

26、Pi(si)表示表示Pi分配給純策略分配給純策略si的的概率。如出門的的概率。如出門要否帶雨傘?天氣預(yù)報(bào)說有時(shí)有雨。猜拳?要否帶雨傘?天氣預(yù)報(bào)說有時(shí)有雨。猜拳?這是一個(gè)十分玄乎的概念,讓人不容易理解,這是一個(gè)十分玄乎的概念,讓人不容易理解,它是一種不確定,采用這種策略的目的就是它是一種不確定,采用這種策略的目的就是讓對(duì)方琢磨不透,實(shí)施時(shí)似乎由一架隨機(jī)機(jī)讓對(duì)方琢磨不透,實(shí)施時(shí)似乎由一架隨機(jī)機(jī)器在操作。隨機(jī)策略器在操作。隨機(jī)策略randomized strategy 純策略是混合策略的特例?純策略是混合策略的特例?*注意:注意: 1、策略與行動(dòng)是兩個(gè)不同的概念,策略是、策略與行動(dòng)是兩個(gè)不同的概念,

27、策略是行動(dòng)的規(guī)那么而不是行動(dòng)本身?;貞浶袆?dòng)的規(guī)那么而不是行動(dòng)本身?;貞洝胺概c不犯犯與不犯的問題。在靜態(tài)博弈中,由于參與人同時(shí)行動(dòng),的問題。在靜態(tài)博弈中,由于參與人同時(shí)行動(dòng),沒有人能掌握他人的之前行動(dòng)的信息,故沒有沒有人能掌握他人的之前行動(dòng)的信息,故沒有可針對(duì)的行動(dòng),從而策略的選擇就變成了行動(dòng)可針對(duì)的行動(dòng),從而策略的選擇就變成了行動(dòng)的選擇,即策略和行動(dòng)是同一的。的選擇,即策略和行動(dòng)是同一的。 行動(dòng)集行動(dòng)集Ai ai 2、作為一種行動(dòng)規(guī)那么,策略必須是完備的,、作為一種行動(dòng)規(guī)那么,策略必須是完備的,就是說,策略要給出參與人在每一種可能想象就是說,策略要給出參與人在每一種可能想象到的情況下的行動(dòng)選擇

28、,即使參與人并不預(yù)期到的情況下的行動(dòng)選擇,即使參與人并不預(yù)期這種情況會(huì)實(shí)際發(fā)生。這種情況會(huì)實(shí)際發(fā)生?!俺笤捳f在前丑話說在前-3、支付、支付payoffs:參與人從各種策略組合中:參與人從各種策略組合中獲得的收益。收益往往采用效用獲得的收益。收益往往采用效用utility概念。概念。它或者是一個(gè)特定策略組合下某個(gè)參與人得到的它或者是一個(gè)特定策略組合下某個(gè)參與人得到的確定效用水平,或者是期望效用水平。它是策略確定效用水平,或者是期望效用水平。它是策略組合的函數(shù),所以也稱支付函數(shù)組合的函數(shù),所以也稱支付函數(shù)payoff function,記為,記為ui(s),ui(s)= ui(s1, s2 ,si

29、 , sn-1 , sn). 1:博弈的一個(gè)根本特征是一個(gè)參與人:博弈的一個(gè)根本特征是一個(gè)參與人的支付不僅取決于自己的策略選擇,而且取決的支付不僅取決于自己的策略選擇,而且取決于所有其他參與人的策略選擇;是策略組合的于所有其他參與人的策略選擇;是策略組合的函數(shù)。函數(shù)。 2:支付是參與人真正關(guān)心的東西,參與:支付是參與人真正關(guān)心的東西,參與人在博弈中的目標(biāo)就是選擇自己的策略以最大人在博弈中的目標(biāo)就是選擇自己的策略以最大化自己的支付函數(shù)?;约旱闹Ц逗瘮?shù)。*注意注意 一個(gè)博弈中,明確了以上三個(gè)概念,該博一個(gè)博弈中,明確了以上三個(gè)概念,該博弈的根本框架就形成了,故稱為博弈的三個(gè)弈的根本框架就形成了,

30、故稱為博弈的三個(gè)根本要素。一個(gè)具體博弈界定,還須明確行動(dòng)根本要素。一個(gè)具體博弈界定,還須明確行動(dòng)的順序和有關(guān)的信息。的順序和有關(guān)的信息。 4、行動(dòng)的順序、行動(dòng)的順序the order of play:博弈博弈中參與人實(shí)施決策活動(dòng)的順序。同時(shí)或有先有中參與人實(shí)施決策活動(dòng)的順序。同時(shí)或有先有后。其他因素不變,但順序不同,參與人的最后。其他因素不變,但順序不同,參與人的最優(yōu)選擇就不同,博弈的結(jié)果也不同。事實(shí)上,優(yōu)選擇就不同,博弈的結(jié)果也不同。事實(shí)上,不同的順序安排意味著不同的博弈。靜態(tài)博弈不同的順序安排意味著不同的博弈。靜態(tài)博弈和動(dòng)態(tài)博弈。和動(dòng)態(tài)博弈。 5、信息、信息information:指一個(gè)博

31、弈中參:指一個(gè)博弈中參與人有關(guān)該博弈的知識(shí),如關(guān)于與人有關(guān)該博弈的知識(shí),如關(guān)于N的選擇、其的選擇、其他參與人的策略集、支付函數(shù)、行動(dòng)時(shí)間等他參與人的策略集、支付函數(shù)、行動(dòng)時(shí)間等.博弈論中關(guān)于信息的具體概念有:博弈論中關(guān)于信息的具體概念有:信息集信息集information set主要出現(xiàn)在主要出現(xiàn)在動(dòng)態(tài)博弈中,可理解為參與人在特定時(shí)刻上對(duì)動(dòng)態(tài)博弈中,可理解為參與人在特定時(shí)刻上對(duì)有關(guān)變量的值的知識(shí);一個(gè)參與人無法準(zhǔn)確知有關(guān)變量的值的知識(shí);一個(gè)參與人無法準(zhǔn)確知道的變量的全體屬于一個(gè)信息集。買古董。道的變量的全體屬于一個(gè)信息集。買古董。完美信息完美信息perfect information:指一個(gè)參

32、與指一個(gè)參與人對(duì)其他參與人包括人對(duì)其他參與人包括N的行動(dòng)選擇有準(zhǔn)確的行動(dòng)選擇有準(zhǔn)確了解的情況,即一個(gè)信息集只包含一個(gè)值。動(dòng)了解的情況,即一個(gè)信息集只包含一個(gè)值。動(dòng)態(tài)博弈的概念。態(tài)博弈的概念。完全信息完全信息complete information:指:指N不首不首先行動(dòng)或先行動(dòng)或N的初始行動(dòng)被所有的參與人準(zhǔn)確觀察的初始行動(dòng)被所有的參與人準(zhǔn)確觀察到的情況,即沒有事前的不確定性。完全信息到的情況,即沒有事前的不確定性。完全信息意味著各個(gè)參與人的支付函數(shù)是共同知識(shí)。意味著各個(gè)參與人的支付函數(shù)是共同知識(shí)。 顯然,不完全顯然,不完全incomplete信息意味著不信息意味著不完美完美imperfect信

33、息。信息。共同知識(shí)共同知識(shí)common knowledge 是與信息是與信息有關(guān)的一個(gè)重要概念。如聽過某個(gè)老師的課,有關(guān)的一個(gè)重要概念。如聽過某個(gè)老師的課,學(xué)生認(rèn)識(shí)老師,但老師不一定就記住該學(xué)生,學(xué)生認(rèn)識(shí)老師,但老師不一定就記住該學(xué)生,路上碰在一塊了,學(xué)生會(huì)不會(huì)叫老師呢?也許路上碰在一塊了,學(xué)生會(huì)不會(huì)叫老師呢?也許學(xué)生會(huì)以為老師不認(rèn)識(shí)他,打招呼會(huì)把老師弄學(xué)生會(huì)以為老師不認(rèn)識(shí)他,打招呼會(huì)把老師弄得莫名其妙。得莫名其妙。 解釋一:共同知識(shí)指解釋一:共同知識(shí)指“所有參與人知道,所有參與人知道,所有參與人知道所有參與人知道,所有參與人所有參與人知道所有參與人知道,所有參與人知道所有參與人知道所有參與人

34、知道知道所有參與人知道所有參與人知道。 解釋二:如果每個(gè)參與人都知道某個(gè)事實(shí),解釋二:如果每個(gè)參與人都知道某個(gè)事實(shí),每個(gè)參與人都知道每個(gè)參與人都知道它,如此每個(gè)參與人都知道每個(gè)參與人都知道它,如此等等,從而形如等等,從而形如“每個(gè)參與人都知道每個(gè)參與人都知道)k每個(gè)每個(gè)參與人都知道它的語(yǔ)句對(duì)參與人都知道它的語(yǔ)句對(duì)k=0,1,2,都是都是正確的,那我們就稱這個(gè)事實(shí)為參與人中間的正確的,那我們就稱這個(gè)事實(shí)為參與人中間的共同知識(shí)。共同知識(shí)。 解釋三:這是一個(gè)解釋三:這是一個(gè)“由己及人,由人及己由己及人,由人及己的無限推理過程,是的無限推理過程,是k時(shí)的高階知識(shí)時(shí)的高階知識(shí)(每個(gè)人每個(gè)人)k-1。一件

35、事一旦在某個(gè)群體中成為。一件事一旦在某個(gè)群體中成為共同知識(shí),那么從任何一個(gè)個(gè)體出發(fā),他對(duì)這件事共同知識(shí),那么從任何一個(gè)個(gè)體出發(fā),他對(duì)這件事的理解等等都已到達(dá)了完全的統(tǒng)一,不再有任何的理解等等都已到達(dá)了完全的統(tǒng)一,不再有任何層面的不確定性?shī)W曼,層面的不確定性?shī)W曼,1976。 在博弈論中,一般假定參與人的行動(dòng)空間在博弈論中,一般假定參與人的行動(dòng)空間Ai和行動(dòng)順序是共同知識(shí)。和行動(dòng)順序是共同知識(shí)。 *為了說明共同知識(shí)的重要性,引用一個(gè)寓為了說明共同知識(shí)的重要性,引用一個(gè)寓言故事。言故事。 故事發(fā)生在一個(gè)村莊,村里有故事發(fā)生在一個(gè)村莊,村里有100對(duì)夫妻,對(duì)夫妻,他們都是地道的邏輯學(xué)家智能的;村里有他

36、們都是地道的邏輯學(xué)家智能的;村里有一些奇特的風(fēng)俗:每天晚上,村里的男人們都一些奇特的風(fēng)俗:每天晚上,村里的男人們都將點(diǎn)起篝火,繞圈圍坐舉行會(huì)議,議題是談?wù)搶Ⅻc(diǎn)起篝火,繞圈圍坐舉行會(huì)議,議題是談?wù)撟约旱钠拮?。在?huì)議開始時(shí),如果一個(gè)男人有自己的妻子。在會(huì)議開始時(shí),如果一個(gè)男人有理由相信他的妻子對(duì)他總是守貞的,那么他就理由相信他的妻子對(duì)他總是守貞的,那么他就在會(huì)議上當(dāng)眾贊揚(yáng)她的美德。另一方面,如果在會(huì)議上當(dāng)眾贊揚(yáng)她的美德。另一方面,如果在會(huì)議之前的任何時(shí)間,只要他發(fā)現(xiàn)他妻子不在會(huì)議之前的任何時(shí)間,只要他發(fā)現(xiàn)他妻子不貞的證據(jù),那他就會(huì)在會(huì)議上悲鳴怯哭,并企貞的證據(jù),那他就會(huì)在會(huì)議上悲鳴怯哭,并企求神靈

37、嚴(yán)厲地懲罰她。再那么,如果一個(gè)妻子求神靈嚴(yán)厲地懲罰她。再那么,如果一個(gè)妻子曾曾有不貞,那她和她的情人會(huì)立即告知村里除她有不貞,那她和她的情人會(huì)立即告知村里除她丈夫之外所有的已婚男人奇異的傳統(tǒng)風(fēng)俗。丈夫之外所有的已婚男人奇異的傳統(tǒng)風(fēng)俗。所有這些傳統(tǒng)和風(fēng)俗都是村民的共同知識(shí)。所有這些傳統(tǒng)和風(fēng)俗都是村民的共同知識(shí)。 事實(shí)上,每個(gè)妻子都已對(duì)丈夫不忠。于是事實(shí)上,每個(gè)妻子都已對(duì)丈夫不忠。于是每個(gè)丈夫都知道除自己妻子之外其他人的妻子每個(gè)丈夫都知道除自己妻子之外其他人的妻子都是不貞的女子,因而每個(gè)晚上的會(huì)議上每個(gè)都是不貞的女子,因而每個(gè)晚上的會(huì)議上每個(gè)男人都贊美自己的妻子。男人都贊美自己的妻子。 這種狀況持

38、續(xù)了很多年,直到有一天來了這種狀況持續(xù)了很多年,直到有一天來了一位傳教士。傳教士參加了篝火會(huì)議,并聽到一位傳教士。傳教士參加了篝火會(huì)議,并聽到每個(gè)男人都在贊美自己的妻子,他站起來走到每個(gè)男人都在贊美自己的妻子,他站起來走到圍坐圓圈的中心,大聲地提醒說:圍坐圓圈的中心,大聲地提醒說:“這個(gè)村子這個(gè)村子里里有一個(gè)妻子已經(jīng)不貞了。在此后的有一個(gè)妻子已經(jīng)不貞了。在此后的99個(gè)晚上,個(gè)晚上,丈夫們繼續(xù)贊美各自的妻子,但在第丈夫們繼續(xù)贊美各自的妻子,但在第100個(gè)晚個(gè)晚上,他們?nèi)急Q怯哭,并企求神靈嚴(yán)懲自己上,他們?nèi)急Q怯哭,并企求神靈嚴(yán)懲自己的妻子。的妻子。*怎樣理解這個(gè)故事?傳教士究竟告訴了丈夫怎

39、樣理解這個(gè)故事?傳教士究竟告訴了丈夫們他們所不知道的什么?們他們所不知道的什么? 首先注意到假設(shè)只有一個(gè)妻子不貞,她丈首先注意到假設(shè)只有一個(gè)妻子不貞,她丈夫能夠立刻知道這個(gè)不貞的女人就是自己的妻夫能夠立刻知道這個(gè)不貞的女人就是自己的妻子,因?yàn)樗煞蛑罌]有另外的不貞女人,假子,因?yàn)樗煞蛑罌]有另外的不貞女人,假設(shè)有的話他是知道的,所以在傳教士訪問后的設(shè)有的話他是知道的,所以在傳教士訪問后的第一個(gè)晚上這個(gè)丈夫就會(huì)哭;現(xiàn)在他沒有哭,第一個(gè)晚上這個(gè)丈夫就會(huì)哭;現(xiàn)在他沒有哭,那就意味著確實(shí)存在一個(gè)女子不貞,由此,從那就意味著確實(shí)存在一個(gè)女子不貞,由此,從“第一個(gè)晚上沒有男人哭中可推斷出:有兩第一個(gè)晚

40、上沒有男人哭中可推斷出:有兩個(gè)女子已經(jīng)不貞。在傳教士走后的第二晚上,個(gè)女子已經(jīng)不貞。在傳教士走后的第二晚上,既然已推斷出有兩個(gè)女子不貞,而自己只知道既然已推斷出有兩個(gè)女子不貞,而自己只知道一個(gè),那另一個(gè)就是自己的妻子,那這個(gè)丈夫一個(gè),那另一個(gè)就是自己的妻子,那這個(gè)丈夫應(yīng)該在應(yīng)該在“第二個(gè)晚上哭。第二個(gè)晚上第二個(gè)晚上哭。第二個(gè)晚上“這個(gè)這個(gè)丈夫也沒有哭,由此丈夫們推斷出:已有三丈夫也沒有哭,由此丈夫們推斷出:已有三個(gè)女子不貞。個(gè)女子不貞。由歸納法可以證明,對(duì)于由歸納法可以證明,對(duì)于1和和100之間的任意正之間的任意正整數(shù)整數(shù)k,如果恰有,如果恰有k個(gè)妻子不貞,那么在傳教士個(gè)妻子不貞,那么在傳教士

41、走后的連續(xù)走后的連續(xù)k-1個(gè)晚上,所有的丈夫照樣各自稱個(gè)晚上,所有的丈夫照樣各自稱贊自己的妻子,但在第贊自己的妻子,但在第k個(gè)晚上,個(gè)晚上,k個(gè)不貞妻子個(gè)不貞妻子的丈夫會(huì)悲鳴怯哭,于是,在的丈夫會(huì)悲鳴怯哭,于是,在99個(gè)贊揚(yáng)之夜過個(gè)贊揚(yáng)之夜過后的第后的第100個(gè)晚上,每個(gè)丈夫都知道一定有個(gè)晚上,每個(gè)丈夫都知道一定有100個(gè)不貞的妻子。不幸的是包括自己的妻子在內(nèi)!個(gè)不貞的妻子。不幸的是包括自己的妻子在內(nèi)! 傳教士究竟告訴了丈夫們什么?每個(gè)丈夫傳教士究竟告訴了丈夫們什么?每個(gè)丈夫都知道有都知道有99個(gè)不貞的妻子,故傳教士所說的已個(gè)不貞的妻子,故傳教士所說的已經(jīng)有一個(gè)女子不貞的話對(duì)任何人來說都不是什

42、經(jīng)有一個(gè)女子不貞的話對(duì)任何人來說都不是什新聞。但新聞。但“傳教士對(duì)所有傳教士對(duì)所有100個(gè)男人做了一個(gè)聲個(gè)男人做了一個(gè)聲明是明是common knowledge,從而這個(gè)傳教士所,從而這個(gè)傳教士所聲明的內(nèi)容有一個(gè)妻子不貞也就成了聲明的內(nèi)容有一個(gè)妻子不貞也就成了100個(gè)個(gè)男人之間的男人之間的common knowledge。在傳教士宣告。在傳教士宣告之前,每個(gè)形如之前,每個(gè)形如“每個(gè)丈夫知道每個(gè)丈夫知道)k有一個(gè)妻有一個(gè)妻子不貞的判斷對(duì)于子不貞的判斷對(duì)于k99都是正確的,但對(duì)于都是正確的,但對(duì)于K=100就不正確了。例如,假設(shè)從就不正確了。例如,假設(shè)從1到到100對(duì)丈夫?qū)φ煞騻冞M(jìn)行編號(hào),那么們進(jìn)

43、行編號(hào),那么1已經(jīng)知道已經(jīng)知道2已經(jīng)知道已經(jīng)知道3已經(jīng)知已經(jīng)知道道99已經(jīng)知道已經(jīng)知道100的妻子是不貞的,但的妻子是不貞的,但1不知道不知道2已經(jīng)知道已經(jīng)知道3已經(jīng)知道已經(jīng)知道99已經(jīng)知道已經(jīng)知道100已經(jīng)知道已經(jīng)知道1的妻子是不貞的。因而從這個(gè)的妻子是不貞的。因而從這個(gè)寓言中引申出的含義是,從一個(gè)共同知識(shí)的寓言中引申出的含義是,從一個(gè)共同知識(shí)的事實(shí)推出的結(jié)果與從例如只知道每個(gè)人事實(shí)推出的結(jié)果與從例如只知道每個(gè)人已經(jīng)知道每個(gè)人已經(jīng)知道的事實(shí)推出的結(jié)果已經(jīng)知道每個(gè)人已經(jīng)知道的事實(shí)推出的結(jié)果可以非常不同??梢苑浅2煌?。私人信息私人信息private information:指任何一:指任何一個(gè)他

44、擁有但不是該博弈中所有參與人共同知識(shí)的個(gè)他擁有但不是該博弈中所有參與人共同知識(shí)的信息。信息。 由于存在私人信息,便有了信息不對(duì)稱的問由于存在私人信息,便有了信息不對(duì)稱的問題。題。四、博弈的分類四、博弈的分類分類是一種深化認(rèn)識(shí)的方法。博弈可以根分類是一種深化認(rèn)識(shí)的方法。博弈可以根據(jù)不同的標(biāo)志從不同的角度進(jìn)行多種分類。通據(jù)不同的標(biāo)志從不同的角度進(jìn)行多種分類。通過分類我們將對(duì)博弈有進(jìn)一步的了解,同時(shí)對(duì)過分類我們將對(duì)博弈有進(jìn)一步的了解,同時(shí)對(duì)博弈理論的結(jié)構(gòu)體系有初步的認(rèn)識(shí)。教才博弈理論的結(jié)構(gòu)體系有初步的認(rèn)識(shí)。教才14、按參與人的多少分:、按參與人的多少分:?jiǎn)稳瞬┺暮投嗳瞬┺膯稳瞬┺暮投嗳瞬┺?、按策略?/p>

45、間是否有限分:、按策略空間是否有限分:有限策略博弈和無限策略博弈有限策略博弈和無限策略博弈、按各策略組合下參與人支付之和情況分:、按各策略組合下參與人支付之和情況分:零和博弈、常和博弈和變和博弈零和博弈、常和博弈和變和博弈、按參與人行動(dòng)的順序分:、按參與人行動(dòng)的順序分:靜態(tài)博弈和動(dòng)態(tài)博弈靜態(tài)博弈和動(dòng)態(tài)博弈、按信息是否完全分:、按信息是否完全分:完全信息博弈和不完全信息博弈完全信息博弈和不完全信息博弈、按信息是否完美分動(dòng)態(tài)博弈:、按信息是否完美分動(dòng)態(tài)博弈:完美信息動(dòng)態(tài)博弈和不完美信息動(dòng)態(tài)博弈完美信息動(dòng)態(tài)博弈和不完美信息動(dòng)態(tài)博弈博弈理論體系的結(jié)構(gòu)框架按下面博弈類型博弈理論體系的結(jié)構(gòu)框架按下面博弈類

46、型安排:安排:靜態(tài)動(dòng)態(tài)靜態(tài)動(dòng)態(tài)完全信息完全信息完全信息完全信息完全信息完全信息靜態(tài)博弈動(dòng)態(tài)博弈靜態(tài)博弈動(dòng)態(tài)博弈不完全信息不完全信息不完全信息不完全信息不完全信息不完全信息靜態(tài)博弈動(dòng)態(tài)博弈靜態(tài)博弈動(dòng)態(tài)博弈五、本課程安排的特點(diǎn)五、本課程安排的特點(diǎn)目前,博弈論的書籍較多,版本不同,內(nèi)目前,博弈論的書籍較多,版本不同,內(nèi)容結(jié)構(gòu)安排各有千秋,有的詳細(xì),有的簡(jiǎn)練;容結(jié)構(gòu)安排各有千秋,有的詳細(xì),有的簡(jiǎn)練;有的注重純理論的數(shù)學(xué)演繹,有的那么關(guān)注應(yīng)有的注重純理論的數(shù)學(xué)演繹,有的那么關(guān)注應(yīng)用研究,等等。用研究,等等。 This class is designed to introduce game theory

47、to those who will later construct (or at least consume) game-theoretic models in applied fields within economics.The exposition emphasizes the economic applications of the theory at least as mush the pure theory itself, for three reasons. First, the applications help teach the theory ; formal argume

48、nts about abstract games also appear but play a lesser role . Second,the applications illustrate the process of model building the process of translating an informal description of a multi-person decision situation into a formal game-theoretic problem to be analyzed. Third,the variety of application

49、s shows that similar issues arise in different rent areas of economics, and that the same game- theoretic tools can be applied in each setting .In fact ,people who have not studied pure game theory also can understand the competitive situation just by knowing the applications. Chapter 1 完全信息靜態(tài)博弈完全信息

50、靜態(tài)博弈 Static Games of Complete Information In this chapter we consider games of the following simple form: first, the players simultaneously choose actions; then, the players receive payoffs that depend on the combination of actions just chosen. Within the class of such static (or simultaneous-move)

51、games,we restrict attention to games of complete information. That is each players payoff function (the function that determines the players payoff from the combination of actions chosen by the players) is common knowledge among all the players.教材教材P21 一、一、Normal-Form Representation of Games and Nas

52、h Equilibrium (一一)Normal-Form Representation of GamesIn the normal-form representation of a game ,each player simultaneously chooses a strategy, and the combination of strategies chosen by the players determines a payoff for each player. We illustrate the normal-form representation with a classical

53、exampleThe prisoners Dilemma. Two suspects are arrested and charged with a crime. The police lack sufficient evidence to convict the suspects, unless at least one confesses.The police hold the suspects in separate cells and explain the consequences that will follow from the actions they could take.

54、If neither confesses then both will be convicted of a minor offense and sentenced to one year in jail. If both confess then both will be sentenced to jail five years. Finally, if one confesses but the other does not, then the confessor will be released immediately but the other will be sentenced to

55、eight years in jailfive for the crime and a further three for obstructing justice(干擾司法干擾司法)。 囚徒囚徒招認(rèn)沉默招認(rèn)沉默招認(rèn)招認(rèn) 5, -5 0, -8囚徒囚徒沉默沉默 -8, 0 -1 , -1 囚徒的困境囚徒的困境We now turn to the general case. The normal-form representation of a game specifies: (1)the players in the game;(2)the strategies available to eac

56、h player;(3)the payoff received by each player for each combination of strategies that could be chosen by the players. Definition: The normal-form representation of an-n-player game specifies the players strategy spaces S1 , , Sn and their payoff functions u1 , un. We denote this game by G=S1, ,Sn;u

57、1, , un.教材教材22理解完全信息靜態(tài)博弈時(shí)要本卷須知理解完全信息靜態(tài)博弈時(shí)要本卷須知 Although we stated that in a normal-form game the players choose their strategies simultaneously , this does not imply that the parties necessarily act simultaneously :it suffices that each choose his or her action without knowledge of the others choice

58、s, as would be the case “the prisonersdilemma if the prisoners reached decisions at arbitrary times (在任意時(shí)間在任意時(shí)間)while in their separate cells. 2 Here we may recognize complete information as that each player know the payoff functions of the others.(二二)Dominant-Strategy EquilibriumDefinition In the n

59、ormal-form game G=S1, ,Sn; u1, , un,let si and si be feasible strategies for player i (i.e., si and si are members of Si ).Strategy si is strictly dominated by strategy si if for each feasible combination of the others strategies, is payoff from playing si is strictly less than is payoff from playin

60、g si . i.e.: ui(s1, , si-1, si , si+1 , , sn ) ui(s1, , si-1, si“ , si+1 , , sn ) (DS) for each s-i= (s1, , si-1 , si+1 , , sn ) that can be constructed from the other playersstrategySpaces S1, , Si-1, Si+1, Sn. 囚徒囚徒招認(rèn)沉默招認(rèn)沉默招認(rèn)招認(rèn) 5, -5 0, -8囚徒囚徒沉默沉默 -8, 0 -1 , -1 囚徒的困境囚徒的困境策略策略“沉默嚴(yán)格劣于策略沉默嚴(yán)格劣于策略“招認(rèn)招認(rèn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論