




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、11貝葉斯統(tǒng)計(jì)貝葉斯統(tǒng)計(jì)經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)系陳耀輝陳耀輝:CH4Made by cyh陳耀輝陳耀輝:CH4Made by cyh2第四章 決策中的收益、損失與效用n4.1 決策問(wèn)題的三要素n4.2 決策準(zhǔn)則n4.3 先驗(yàn)期望準(zhǔn)則n4.4 損失函數(shù)n4.5 常用損失函數(shù)n4.6 效用函數(shù)34.1 決策問(wèn)題的三要素 決策就是對(duì)一件事要作決定.它與推斷的差別在于是否涉及后果.統(tǒng)計(jì)學(xué)家在作推斷時(shí)是按統(tǒng)計(jì)理論進(jìn)行的,很少考慮結(jié)論在使用后的損失.可決策者在使用推斷結(jié)果時(shí)必需與得失聯(lián)系在一起,能帶來(lái)利潤(rùn)的就會(huì)用,使他遭受損失的就不會(huì)被采用,度量得失的尺度就是損失函數(shù).它是著名的統(tǒng)計(jì)學(xué)家A.Wald(1902-19
2、50)在40年代引入的一個(gè)概念.從實(shí)際歸納出損失函數(shù)是決策的關(guān)鍵. 貝葉斯決策:把損失函數(shù)加入貝葉斯推斷就形成貝葉斯決策論,損失函數(shù)被稱(chēng)為貝葉斯統(tǒng)計(jì)中的第四種信息.一、決策的基本概念一、決策的基本概念4例1 設(shè)甲乙二人進(jìn)行一種游戲,甲手中有三張牌,分別標(biāo)以 .乙手中也有三張牌, 分別標(biāo)以 .游戲的規(guī)則是雙方各自獨(dú)立地出牌,按下表計(jì)算甲的得分與乙的得分.321,321,aaa甲的得分矩陣甲的得分矩陣(乙的失分矩陣乙的失分矩陣)1a2a3a123 3-2014-3-4-12這是一個(gè)典型的雙人博弈(賭博)問(wèn)題.不少實(shí)際問(wèn)題可歸結(jié)為雙人博弈問(wèn)題.把上例中的乙方改為自然或社會(huì),就形成人與自然(或社會(huì))的
3、博弈問(wèn)題.5例2 某農(nóng)作物有兩個(gè)品種:產(chǎn)量高但抗旱能力弱的品種 和抗旱能力強(qiáng)但產(chǎn)量低的品種 .在明年雨量不知的情況下,農(nóng)民應(yīng)選播哪個(gè)品種可使每畝平均收益最大?這是人與自然界的博弈.以明年600mm雨量為界來(lái)區(qū)分雨量充足 和雨量不充足 .寫(xiě)出收益矩陣(單位:元)1a2a121a2a12 1000200-2004006例3 一位投資者有一筆資金要投資.有以下幾個(gè)投資供他選擇:購(gòu)買(mǎi)股票,根據(jù)市場(chǎng)情況,可凈賺5000元,但也可能虧損10000元;:存入銀行,不管市場(chǎng)情況如何總可凈賺1000元.1a2a這位投資者在與金融市場(chǎng)博弈.未來(lái)的金融市場(chǎng)也有二種情況:看漲 與看跌 .可寫(xiě)出投資者的收益矩陣121a
4、2a1250001000-100001000投資者將依據(jù)此收益矩陣決定他的資金投向何方.這種人與自然(或社會(huì))的博弈問(wèn)題稱(chēng)為決策問(wèn)題. 7二、決策問(wèn)題的三要素二、決策問(wèn)題的三要素 1. 狀態(tài)集 ,其中每個(gè)元素 表示自然界(或社會(huì))可能出現(xiàn)的一種狀態(tài),所有可能狀態(tài)的全體組成狀態(tài)集.(如例2中的兩種狀態(tài):雨水充足和雨水不充足) 2. 行動(dòng)集 ,其中a表示人對(duì)自然界可能采取的一個(gè)行動(dòng). 注意注意:一般行動(dòng)集有兩個(gè)以上的行動(dòng)供選擇.若有兩個(gè)行動(dòng)無(wú)論對(duì)自然界的哪一個(gè)狀態(tài)出現(xiàn), 總比 收益高,則 就沒(méi)有存在的必要,可把它從行動(dòng)集中去掉,使留在行動(dòng)集中的行動(dòng)總有可取之處.a1a2a2a83.收益函數(shù) 。函數(shù)
5、值 表示當(dāng)自然界處于狀態(tài) ,而人們選取行動(dòng) 時(shí)所得到的收益大小。),(aQijjiQaQ),(ija 收益函數(shù)的值可正可負(fù),其正表示贏(yíng)利,負(fù)表示虧損,單位常用貨幣單位。收益函數(shù)的建立不是件容易的事,要對(duì)所研究的問(wèn)題有全面的了解才能建立起來(lái)(P125例4)。收益矩陣nmnnmmQQQQQQQQQQ21222211121194.2 決策準(zhǔn)則一、行動(dòng)的容許性二、決策準(zhǔn)則 1.樂(lè)觀(guān)準(zhǔn)則 2.悲觀(guān)準(zhǔn)則 3.折中準(zhǔn)則10一、行動(dòng)的容許性 定義:在給定的決策問(wèn)題中,A 中的行動(dòng)a1稱(chēng)為是容許的。假如在A(yíng) 中不存在滿(mǎn)足如下兩個(gè)條件的行動(dòng)a2,1.對(duì)所有的,有Q(,a2)Q(,a1)2.至少有一個(gè),可使上式不等
6、式嚴(yán)格成立。 假如這樣的a2存在的話(huà),則稱(chēng)a1是非容許的;假如二個(gè)行動(dòng)a1和a2的收益函數(shù)在上處處相等,則稱(chēng)行動(dòng)a1與a2是相等的。11兩點(diǎn)說(shuō)明:1.一般情況下,行動(dòng)集中只存在容許行動(dòng)。2.上面的討論是對(duì)收益函數(shù)而言的,但我們還可以對(duì)支付函數(shù)(或虧損函數(shù)、成本函數(shù))進(jìn)行討論,此時(shí)需要支付函數(shù)(或虧損函數(shù)、成本函數(shù))越少越好。例5(P126)1213二、決策準(zhǔn)則1.樂(lè)觀(guān)準(zhǔn)則 (1)定義:樂(lè)觀(guān)準(zhǔn)則也稱(chēng)“好中求好”決策準(zhǔn)則,或稱(chēng)“最大最大”決策準(zhǔn)則。這種決策準(zhǔn)則就是充分考慮可能出現(xiàn)的最大利益,在各最大利益中選取最大者,將其對(duì)應(yīng)的方案作為最優(yōu)方案。這種決策準(zhǔn)則的客觀(guān)基礎(chǔ)就是所謂的天時(shí)、地利和人和,決策
7、者感到前途樂(lè)觀(guān),有信心取得每一決策方案的最佳結(jié)果。14(2)樂(lè)觀(guān)準(zhǔn)則決策方法的一般步驟:確定各種可行方案;確定決策問(wèn)題將面臨的各種自然狀態(tài);將各種方案在各種自然狀態(tài)下的收益值列于決策矩陣表中(表4-1);求每一方案在各自狀態(tài)下的最大收益值,將其填寫(xiě)在決策矩陣表的最后一列;取 中的最大值 ,所對(duì)應(yīng)的方案為最佳決策方案。maxijQjmaxmaxijaQji15 自然狀態(tài)行動(dòng)方案1 2 na1a2am決 策mnmmnnQQQQQQQQQ212222111211maxmaxijaQjimaxijQj“樂(lè)觀(guān)準(zhǔn)則”決策矩陣表表4-116(3)(3)“樂(lè)觀(guān)準(zhǔn)則樂(lè)觀(guān)準(zhǔn)則”決策方法的應(yīng)用決策方法的應(yīng)用 假設(shè)某
8、一決策問(wèn)題的決策收益矩陣表如下,按樂(lè)觀(guān)準(zhǔn)則選取最優(yōu)方案。8.728.078.258.727.39 8.07 7.198.25 6.96 6.086.13 8.72 7.241 2 3決 策a1a2a3 自然狀態(tài)行動(dòng)方案maxijQjmaxmaxijaQji17假設(shè)某一決策問(wèn)題的決策損失矩陣表如下,按樂(lè)觀(guān)準(zhǔn)則選取最優(yōu)方案。minminijaQji5576611 8 8 5 9 10 7 11 6 12 10 9 7 6 12 101 2 3 4 決 策a1a2a3a4 自然狀態(tài)行動(dòng)方案minijQj182.悲觀(guān)準(zhǔn)則(1)定義:悲觀(guān)準(zhǔn)則又稱(chēng)“小中取大”決策準(zhǔn)則或叫“壞中求好”決策準(zhǔn)則。這種決策準(zhǔn)則
9、的客觀(guān)依據(jù)是決策的系統(tǒng)功能欠佳,形勢(shì)對(duì)決策者不利,所以,決策者沒(méi)有理由希望獲得最理想的結(jié)果。面對(duì)這種情況,決策者必須從每一方案的最壞處著想,從每個(gè)方案的最壞結(jié)果中選擇一個(gè)最佳值,即在所有不利的收益中,選取一個(gè)收益最大的方案作為最優(yōu)決策方案。19(2)悲觀(guān)準(zhǔn)則決策方法的一般步驟: 若決策矩陣為收益矩陣,則先對(duì)每一行動(dòng)選出最小的收益,再在所有選出的最小收益中選取最大值。此最大值對(duì)應(yīng)的行動(dòng)就是悲觀(guān)準(zhǔn)則下的最優(yōu)行動(dòng); 若決策矩陣為損失矩陣,則先對(duì)每一行動(dòng)選出最大的損失,再在所有選出的最大損失中選取最小值。此最小值對(duì)應(yīng)的行動(dòng)就是悲觀(guān)準(zhǔn)則下的最優(yōu)行動(dòng);20(3)(3)“悲觀(guān)準(zhǔn)則悲觀(guān)準(zhǔn)則”決策方法的應(yīng)用決策
10、方法的應(yīng)用假設(shè)某一決策問(wèn)題的決策收益矩陣表如下,按悲觀(guān)準(zhǔn)則選取最優(yōu)方案。7.197.196.086.137.39 8.07 7.198.25 6.96 6.086.13 8.72 7.241 2 3決 策a1a2a3 自然狀態(tài)行動(dòng)方案minijQjminmaxijaQji21假設(shè)某一決策問(wèn)題的決策損失矩陣表如下,按悲觀(guān)準(zhǔn)則選取最優(yōu)方案。101110121211 8 8 5 9 10 7 8 6 12 11 9 7 6 12 111 2 3 4 決 策a1a2a3a4 自然狀態(tài)行動(dòng)方案maxijQjmaxminijaQji223.折中準(zhǔn)則(1)(1)定義定義:折中準(zhǔn)則又稱(chēng)系數(shù)決策準(zhǔn)則,是對(duì)悲觀(guān)準(zhǔn)
11、則和樂(lè)觀(guān)準(zhǔn)則進(jìn)行折中的一種決策準(zhǔn)則. 是一個(gè)依決策者認(rèn)定情況樂(lè)觀(guān)還是悲觀(guān)而定的系數(shù),稱(chēng)為樂(lè)觀(guān)系數(shù).若認(rèn)定情況完全樂(lè)觀(guān),則=1,若認(rèn)定情況完全悲觀(guān),則=0;一般情況下,則01.23(2)(2)折中準(zhǔn)則的基本步驟折中準(zhǔn)則的基本步驟第一步:確定系數(shù)的值;第二步:對(duì)每一行動(dòng)a計(jì)算: ),(min)1 (),(max)(aQaQaH),(maxaQ其中 表示行動(dòng)a的最大收益值, 表示行動(dòng)a的最小收益值),(minaQ第三步:取行動(dòng)a0,使H(a0)達(dá)到最大,即此種a0就是這種準(zhǔn)則下的最優(yōu)行動(dòng).)(max)(0aHaHa A24(3)(3)折中準(zhǔn)則決策方法應(yīng)用案例折中準(zhǔn)則決策方法應(yīng)用案例 某工廠(chǎng)預(yù)備生產(chǎn)一
12、種新型童車(chē),根據(jù)市場(chǎng)需求分析和估計(jì),產(chǎn)品銷(xiāo)路可分為三種狀態(tài):1-銷(xiāo)路好;2-銷(xiāo)路一般;3-銷(xiāo)路差.可供選擇的行動(dòng)方案也有三種:a1,大批量生產(chǎn);a2,中批量生產(chǎn);a3,小批量生產(chǎn).根據(jù)產(chǎn)量多少和銷(xiāo)售情況,工廠(chǎng)的盈利情況也有所不同,可能獲利也可能虧損,將此數(shù)值稱(chēng)為損益值.獲利時(shí)稱(chēng)為收益值,虧損時(shí)稱(chēng)為損失值,用負(fù)號(hào)表示.現(xiàn)調(diào)查得本月的損益值見(jiàn)下表.試用系數(shù)法作出決策.25新型童車(chē)損益值表新型童車(chē)損益值表 自然狀態(tài) 行動(dòng)方案銷(xiāo)路好1銷(xiāo)路一般2銷(xiāo)路差3大批量生產(chǎn)a13023-15中批量生產(chǎn)a225200小批量生產(chǎn)a312121226解:第一步,確定系數(shù)的值=0.6 第二步,計(jì)算H(a) H(a1)=0
13、.6max(30,23,-15) +0.4min(30,23,-15)=12(萬(wàn)元) H(a2)=0.6max(25,20,0) +0.4min(25,20,0)=15(萬(wàn)元) H(a3)=0.6max(12,12,12) +0.4min(12,12,12)=12(萬(wàn)元)第三步,計(jì)算收益中的最大者 H(a0)=max(12,15,12)=15(萬(wàn)元) 所以最佳方案應(yīng)為中批量生產(chǎn),即為a2.274.3 先驗(yàn)期望準(zhǔn)則一、先驗(yàn)期望準(zhǔn)則(1)定義:對(duì)給定的決策問(wèn)題,若在狀態(tài)集上有一個(gè)正常的先驗(yàn)分布(),則收益函數(shù)Q(,)對(duì)()的期望與方差分別稱(chēng)為先驗(yàn)期望收益和收益的先驗(yàn)方差。使先驗(yàn)平均收益達(dá)到最大的行
14、動(dòng)a稱(chēng)為先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng)。若此種最優(yōu)行動(dòng)不止一個(gè),其中先驗(yàn)方差達(dá)到最小的行動(dòng)稱(chēng)為二階矩準(zhǔn)則下的最優(yōu)行動(dòng)。22),(),(),(),()(aQEaQEaQVaraQEaQ)(max)(aQaQAa28幾點(diǎn)說(shuō)明:1.定義中的先驗(yàn)分布只能用正常先驗(yàn)分布,而不能采用廣義先驗(yàn)分布。2.如果在比較先驗(yàn)期望收益的大小時(shí),有兩個(gè)或兩個(gè)以上的行動(dòng)使先驗(yàn)期望收益達(dá)到最大,這時(shí)才需要比較先驗(yàn)方差的大小做出決策。3.使用合理的先驗(yàn)信息,按照先驗(yàn)期望準(zhǔn)則和二階矩準(zhǔn)則進(jìn)行決策,所得結(jié)果更加可信。29(2)案例分析 狀態(tài) 方案較高1一般2較低3a1700250-200a2980-500-800a340090-30例
15、1 某廠(chǎng)準(zhǔn)備開(kāi)發(fā)一種新產(chǎn)品,有三種方案供選擇:a1、a2和a3。預(yù)計(jì)一年后市場(chǎng)對(duì)該種產(chǎn)品的需求量可分為較高、一般和較低。且預(yù)計(jì)一年后市場(chǎng)需求量是高、中、低的主觀(guān)概率為:(1)=0.6,(2)=0.3,(3)=0.1,同時(shí)算得收益矩陣如下。試用先驗(yàn)期望準(zhǔn)則確定最佳行動(dòng)方案。30先驗(yàn)期望準(zhǔn)則和其他準(zhǔn)則的關(guān)系市場(chǎng)需求量1高2中3低悲觀(guān)準(zhǔn)則下1001樂(lè)觀(guān)準(zhǔn)則下2100折中準(zhǔn)則下30.800.2先驗(yàn)期望準(zhǔn)則下0.60.30.131例2 (P125例題4.4)例3 一賣(mài)花姑娘每天從花市按每棵5元購(gòu)進(jìn),而按每棵10元賣(mài)出,當(dāng)天若賣(mài)不完則剩下的花只能當(dāng)垃圾。問(wèn)該姑娘每天購(gòu)進(jìn)多少花?出售量(棵/日)頻數(shù)(日)頻
16、率1440.0815110.2216100.201770.141870.141960.122050.10累計(jì)501.0032二、兩個(gè)性質(zhì)定理4.1 在先驗(yàn)分布不變的情況下,收益函數(shù)的線(xiàn)性變換不會(huì)改變先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng)。定理4.2 設(shè)1為狀態(tài)集的一個(gè)非空子集,假如在1上的收益函數(shù)Q(,a)都加上一個(gè)常數(shù)c,而在上的先驗(yàn)分布不變,則在先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng)不變。例4(P138例題4.11)334.4 損失函數(shù)1.損失函數(shù)的含義 這里的損失函數(shù)不是負(fù)的收益,也不是虧損。例如,某商店一個(gè)月的經(jīng)營(yíng)收益為-1000元,即虧1000元。這是對(duì)成本而言。我們不稱(chēng)為損失,而稱(chēng)其為虧損。我們講的損失是指“
17、該賺而沒(méi)有賺到的錢(qián)”,例如該商店本可以賺2000元,但由于某種原因虧了1000元,那我們說(shuō)該商店損失了3000元。用這種觀(guān)點(diǎn)認(rèn)識(shí)損失對(duì)提高決策意識(shí)是有好處的。 按上述觀(guān)點(diǎn)從收益函數(shù)可以很容易獲得損失函數(shù)。34 例5 某公司購(gòu)進(jìn)某種貨物可分大批、中批和小批三種行動(dòng),記為 。未來(lái)市場(chǎng)需求量可分為高、中、低三種狀態(tài),記為 。三個(gè)行動(dòng)在不同市場(chǎng)的利潤(rùn)如下:321,321,aaa18 . 07 . 22432610Q這是一個(gè)收益矩陣,我們把它改寫(xiě)成損失矩陣如下:08 . 17 . 3201840L由此可見(jiàn),決策者在做決策時(shí),要盡量避免大損失,追求小損失甚至無(wú)損失.352.損失函數(shù)a),(aL構(gòu)成決策問(wèn)題
18、的三要素:由收益函數(shù)容易獲得損失函數(shù) ),(),(max),(aQaQaLAa 例6 某公司購(gòu)進(jìn)一批貨物投放市場(chǎng),若購(gòu)進(jìn)數(shù)量 低于市場(chǎng)需求量 ,每噸可賺15萬(wàn)元, 若購(gòu)進(jìn)數(shù)量 超過(guò)市場(chǎng)需求量 ,超過(guò)部分每噸反而要虧35萬(wàn)元.由此可寫(xiě)出收益函數(shù)aaaaaaQ),(3515,15),(顯然,當(dāng)購(gòu)進(jìn)數(shù)量 等于市場(chǎng)需求量 時(shí),收益達(dá)到最大為15 .則立即可得損失函數(shù):aaaaaaL),(35),(15),(363.損失函數(shù)下的悲觀(guān)準(zhǔn)則第一步,對(duì)每個(gè)行動(dòng) ,選出最大損失值,記為aAaaL),(max第二步,在所有選出的最大損失中再選出最小者 , 則 滿(mǎn)足aa),(max),(maxminaLaLAa則稱(chēng)
19、 為悲觀(guān)準(zhǔn)則下的最優(yōu)行動(dòng).這是一種保守策略.不求零損失,但愿少損失.a37例7 某公司購(gòu)進(jìn)某種貨物可分大批、中批和小批三種行動(dòng),記為 ,未來(lái)市場(chǎng)需求量可分為高、中、低三種狀態(tài),記為 ,三個(gè)行動(dòng)在不同市場(chǎng)的收益矩陣和損失矩陣如下:1a2a3a12318 . 07 . 22432610Q08 . 17 . 3201840L1a2a3a1a2a3a試比較在Q與L下的最優(yōu)行動(dòng)。思考思考:為什么所選行動(dòng)不一樣?38例8 某股票投資者對(duì)金融市場(chǎng)上的兩種資產(chǎn)進(jìn)行投資,其收益矩陣如Q,請(qǐng)幫助作出合適的決策(按悲觀(guān)準(zhǔn)則).212120100002019aaQ21219980001aaL 用Q做決策(按悲觀(guān)準(zhǔn)則)
20、,結(jié)果為a2是最佳行動(dòng),顯然該決策不好。 用L做決策(按悲觀(guān)準(zhǔn)則),結(jié)果為a1。 說(shuō)明這樣一個(gè)道理:用損失函數(shù)做決策要比用收益函數(shù)做決策更合理(P143)。394.損失函數(shù)下的先驗(yàn)期望準(zhǔn)則(1)定義:對(duì)給定的決策問(wèn)題,若在狀態(tài)集上有一個(gè)正常的先驗(yàn)分布(),則損失函數(shù)L(,)對(duì)()的期望與方差分別稱(chēng)為先驗(yàn)期望損失和損失的先驗(yàn)方差。使先驗(yàn)期望損失達(dá)到最小的行動(dòng)a稱(chēng)為先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng)。若此種最優(yōu)行動(dòng)不止一個(gè),其中先驗(yàn)方差達(dá)到最小的行動(dòng)稱(chēng)為二階矩準(zhǔn)則下的最優(yōu)行動(dòng)。22),(),(),(),()(aLEaLEaLVaraLEaL)(min)(aLaLAa40注意事項(xiàng):1.定義中的先驗(yàn)分布只能用正
21、常先驗(yàn)分布,而不能采用廣義先驗(yàn)分布。2.損失的先驗(yàn)方差有著特別的意義: (1)可以作為挑選最優(yōu)行動(dòng)的標(biāo)準(zhǔn)(在平均先驗(yàn)損失相等或者相差不大時(shí)). (2)衡量風(fēng)險(xiǎn)的大小. 3.使用合理的先驗(yàn)信息,按照先驗(yàn)期望準(zhǔn)則和二階矩準(zhǔn)則進(jìn)行決策,所得結(jié)果更加可信。41(2) 例題 例9 若有一決策問(wèn)題如下,試用損失函數(shù)下的先驗(yàn)期望準(zhǔn)則選出最優(yōu)行動(dòng). 例10 P146例題4.181 . 07 . 02 . 008 . 17 . 3201840)(321321aaaL424.5常用損失函數(shù)(1)平方損失函數(shù) 2)(),( aaL2)(),(aaL這是在統(tǒng)計(jì)決策中用得最多的損失函數(shù).(2)線(xiàn)性損失函數(shù) aakaak
22、aL),(),(),(10(3)0-1損失函數(shù) aaaL, 1, 0),(4)多元二次損失函數(shù) piiiiaaL12)(),(43(5)二行動(dòng)線(xiàn)性決策問(wèn)題的損失函數(shù) 定義:若某一決策問(wèn)題只有兩個(gè)行動(dòng)a1,a2,而在每個(gè)行動(dòng)下的收益函數(shù)都是狀態(tài)(連續(xù)或離散)的線(xiàn)性函數(shù),即則稱(chēng)此決策問(wèn)題為二行動(dòng)線(xiàn)性決策問(wèn)題. 下列函數(shù)稱(chēng)為該決策問(wèn)題對(duì)應(yīng)的損失函數(shù)222111,),(aambaambaQ00121210,)()(),(mmbbaL0212102,)()(,0),(mmbbaL44例題11 甲乙兩廠(chǎng)生產(chǎn)同一種產(chǎn)品,其質(zhì)量相同,零售價(jià)也相同,現(xiàn)兩廠(chǎng)都在招聘推銷(xiāo)員,但所付報(bào)酬不同,甲廠(chǎng)每公斤給報(bào)酬3.5元
23、;乙廠(chǎng)每公斤給報(bào)酬3元,還另給每天10元的津貼,應(yīng)聘人如何選擇?收益函數(shù):損失函數(shù): Q Q(,a2) 0 0 Q(,a1)21,310,5 . 3),(aaaaaQ20,020,5 . 010),(1aL20,5 . 01020,0),(2aL454.6效用函數(shù)46博弈論基本知識(shí)博弈論基本知識(shí)n一、太多的疑惑一、太多的疑惑n1.為什么腐敗現(xiàn)象這么猖獗?怎樣懲治才有效?n2.為什么治理假冒偽劣現(xiàn)象如此困難?n3.為什么三個(gè)和尚沒(méi)水吃?n4.為什么長(zhǎng)街上的商店常擠在一塊?n5.為什么各種考試舞弊屢禁不止?n6.老師怎樣促使學(xué)生全面復(fù)習(xí)?n7.為什么老年人投保很困難?n8.為什么總統(tǒng)競(jìng)選人總是花很
24、大氣力推出自己的綱領(lǐng)?47二、什么是博弈論?1.海灘占位問(wèn)題海灘占位問(wèn)題 設(shè)較長(zhǎng)的海灘上比較均勻地散布著許多日光浴者。太陽(yáng)的照射使人們需要補(bǔ)充水分。假如有A與B兩個(gè)小販來(lái)到海灘,以同樣的價(jià)格,相同的質(zhì)量向日光浴者提供同一品牌的礦泉水(或啤酒)。問(wèn)在直線(xiàn)上的海灘上他們?nèi)绾卧O(shè)置自己的攤位?2.狩獵游戲:狩獵游戲: 兩個(gè)獵人圍住了一頭鹿,他們各卡住鹿的可能逃跑的兩個(gè)關(guān)口中的一個(gè)。只要他們齊心協(xié)力,鹿就會(huì)成為他們的獵物。如果此時(shí)周?chē)苓^(guò)一群兔子,兩位獵人中的任何一個(gè)只要去抓兔子一定會(huì)獲得成功,他會(huì)抓到一只兔子,但鹿卻從他把守的關(guān)口逃跑?,F(xiàn)在他們必須同時(shí)作出決定:是獵鹿還是抓兔子?48n以上兩例的共同特
25、點(diǎn)共同特點(diǎn):(1)每個(gè)游戲常有兩個(gè)以上的參與者,他們?cè)谟螒蛑卸加兄约旱那猩砝?,今后我們稱(chēng)他們?yōu)榫种腥恕?2)每個(gè)局中人都有著自己的可行行動(dòng)集供自己選擇,這種選擇毫無(wú)疑問(wèn)地會(huì)影響到其他局中人的切身利益。(3)游戲中的各個(gè)局中人理性地采取或選擇自己的策略行為,使得在這種相互制約、相互影響的依存關(guān)系中,盡可能地提高自己的利益所得。這正是游戲理論的關(guān)鍵所在。博弈博弈:一些個(gè)人、隊(duì)組或其他組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后,一次或多次,從各自允許的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過(guò)程。博弈論博弈論:英文為game theory,是系統(tǒng)研究各種博弈問(wèn)題,尋求博弈方合
26、理的策略和合理選擇策略時(shí)博弈的結(jié)果,并分析結(jié)果的經(jīng)濟(jì)、效率意義的理論和方法。49三、博弈的分類(lèi)1.博弈的三要素: (1)局中人; (2)局中人的策略空間; (3)每個(gè)局中人的盈利函數(shù);2.博弈論的基本概念:局中人、行動(dòng)、信息、戰(zhàn)略、支付函數(shù)、結(jié)果、均衡50局中人:指的是博弈中選擇行動(dòng)以最大化自己效用的決策主體。行動(dòng):是局中人的決策變量。信息:指局中人在博弈中的知識(shí)。戰(zhàn)略:是局中人選擇行動(dòng)的規(guī)則,它告訴局中人在什么時(shí)候選擇什么行動(dòng)。支付函數(shù):是局中人從博弈中獲得的效用水平,它是所有局中人戰(zhàn)略或行動(dòng)的函數(shù),是每個(gè)局中人真正關(guān)心的東西。結(jié)果:是博弈分析者感興趣的要素組合。均衡:是所有局中人的最優(yōu)戰(zhàn)略
27、或行動(dòng)的組合。513.博弈的分類(lèi)從兩個(gè)不同的角度進(jìn)行劃分:(1)從信息(指對(duì)其他局中人的特征、戰(zhàn)略空間及支付函數(shù)的知識(shí))的角度,分為完全信息博弈與不完全信息博弈;(2)從局中人行動(dòng)的先后次序,分為靜態(tài)博弈和動(dòng)態(tài)博弈。 按以上兩種進(jìn)行交叉組合共有4種情形:完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈、不完全信息動(dòng)態(tài)博弈。52靜態(tài)博弈:是指博弈中,局中人同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng)。動(dòng)態(tài)博弈:指的是局中人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀(guān)察到先行動(dòng)者所選擇的行動(dòng)。53博弈的分類(lèi)及對(duì)應(yīng)的均衡概念 行動(dòng)順序 信 息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈;納什均
28、衡;納什(1950,1951)完全信息動(dòng)態(tài)博弈;子博弈精練納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均衡;海薩尼(1967-1968)不完全信息動(dòng)態(tài)博弈;精練貝葉斯納什均衡;澤爾騰(1975)Kreps和Wilson(1982)Fudengberg和Tirole(1991)54四、博弈論的基本模型及應(yīng)用n1.囚徒困境模型(prisoners dilemma)n應(yīng)用:兩個(gè)寡頭企業(yè)選擇產(chǎn)量的博弈、n公共產(chǎn)品的供給、軍備競(jìng)賽、經(jīng)濟(jì)改革n2.智豬博弈模型(boxed pigs)n應(yīng)用:股東監(jiān)督經(jīng)理、股票市場(chǎng)上的小戶(hù)跟大戶(hù)、小企業(yè)模仿大企業(yè)等n3.性別戰(zhàn)(battle of th
29、e sexes)n4.斗雞博弈(chicken game)551.1.囚徒困境模型囚徒困境模型( (prisonerprisoners dilemma)s dilemma) 兩個(gè)嫌疑犯作案后被警察抓住,被分別關(guān)在不同的房間里審訊。警察知道兩人有罪,但缺乏足夠的證據(jù)定罪,除非兩人當(dāng)中至少有一人坦白。警察告訴他們:如果兩人都不承認(rèn),每人判刑一年;如果兩人都坦白,各判刑8年,如果兩人中一人坦白一人抵賴(lài),坦白的無(wú)罪釋放,抵賴(lài)的判刑15年。問(wèn)兩個(gè)囚徒各自的最優(yōu)策略是什么?56(1)結(jié)果的解釋:(坦白,坦白)均衡但不有效 (抵賴(lài),抵賴(lài))有效但不均衡(2)模型反映的深刻問(wèn)題:個(gè)人理性與團(tuán)體理性的矛盾。(3)模型的應(yīng)用:兩個(gè)寡頭企業(yè)選擇產(chǎn)量的博弈、公共產(chǎn)品的供給、軍備競(jìng)賽、經(jīng)濟(jì)改革等。 囚犯B 坦白 抵賴(lài) 囚犯A坦白抵賴(lài)-8,-80,-15-15,0-1,-1572. 2.智豬博弈模型智豬博弈模型( (boxed pigs)boxed pigs) 大豬與小豬喂養(yǎng)在同一個(gè)豬圈中,豬圈的一頭安裝有一杠桿,只要一踩杠桿,豬圈的另一頭固有的食物槽里將會(huì)流出飼料。踩杠桿需要花
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2019-2025年消防設(shè)施操作員之消防設(shè)備高級(jí)技能題庫(kù)練習(xí)試卷B卷附答案
- 2025年度主管護(hù)師考試專(zhuān)項(xiàng)復(fù)習(xí)試題庫(kù)50題及答案(四)
- 生物熒光知識(shí)培訓(xùn)課件
- 紀(jì)錄片美麗的自然教學(xué)教案設(shè)計(jì)
- 工廠(chǎng)生產(chǎn)線(xiàn)產(chǎn)量進(jìn)度表
- 解決方案推廣計(jì)劃
- 西游記唐僧取經(jīng)之旅解讀
- 企業(yè)內(nèi)部信息安全技術(shù)保障服務(wù)合同
- 小紅帽新編故事讀后感
- 技術(shù)創(chuàng)新成果統(tǒng)計(jì)表
- 臨時(shí)工雇傭合同范本2025年度
- (二調(diào))武漢市2025屆高中畢業(yè)生二月調(diào)研考試 地理試卷
- “艾梅乙”感染者消除醫(yī)療歧視制度-
- 2024-2025學(xué)年八年級(jí)地理下冊(cè)第七章《南方地區(qū)》檢測(cè)卷(人教版)
- 森林防火知識(shí)
- 2025年黑龍江林業(yè)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)帶答案
- 第二單元第1課《精彩瞬間》第2課時(shí) 課件-七年級(jí)美術(shù)下冊(cè)(人教版2024)
- 2025年公共營(yíng)養(yǎng)師三級(jí)理論試題及答案
- 小學(xué)語(yǔ)文常見(jiàn)的說(shuō)明方法(四年級(jí)下冊(cè)第二單元)
- 說(shuō)課比賽一等獎(jiǎng)《醫(yī)用化學(xué)》說(shuō)課課件
- 靜設(shè)備安裝課件(PPT 91頁(yè))
評(píng)論
0/150
提交評(píng)論