版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
隨機(jī)決策理論與方法第一頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法隨機(jī)性決策風(fēng)險(xiǎn)性決策(隨機(jī)性決策):指有多種未來狀態(tài)和相應(yīng)后果,但只能得到各種狀態(tài)發(fā)生的概率而難以獲得充分可靠信息的決策問題。特點(diǎn):狀態(tài)的隨機(jī)性;決策結(jié)果的效用特性。決策的已知變量:狀態(tài)空間的概率分布<Θ,P>={<1,p1>,<2,p2>,…,<n,pn>}后果的效用函數(shù)(或損失函數(shù)):u(cij),cij表示采取方案ai時(shí)出現(xiàn)狀態(tài)j的后果解決問題的主要理論方法:概率論與數(shù)理統(tǒng)計(jì)第二頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法隨機(jī)決策理論與方法1、主觀概率2、效用函數(shù)3、決策準(zhǔn)則4、貝葉斯決策分析第三頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—概率的定義古典概率的定義:在相同條件下進(jìn)行了n次試驗(yàn)(隨機(jī)試驗(yàn)),其中事件A發(fā)生的次數(shù)nA稱為事件A發(fā)生的頻數(shù),比值nA/n稱為事件A發(fā)生的頻率,記為fn(A),則古典概率的定義為:p(A)=limn→∞fn(A)Laplace的定義:p(A)=k/n;其中k為事件A所包含的基本事件數(shù),n為基本事件ei的總數(shù)。(基本事件數(shù)有限,每個(gè)基本事件等概率)公理化定義:E是隨機(jī)事件,S是E的樣本空間,對(duì)E的每一事件A,對(duì)應(yīng)有確定的實(shí)數(shù)p(A),若p(A)滿足:①非負(fù)性:p(A)≥0;②規(guī)范性:p(S)=1;③列可加性:對(duì)兩兩不相容事件Ak,有p(∪kAk)=Σkp(Ak)。(Ai∩Aj=Φ,i≠j)第四頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—概率的定義客觀(Objective)概率:上述三種定義的概率是在多次重復(fù)試驗(yàn)(隨機(jī)試驗(yàn))中,隨機(jī)事件A發(fā)生的可能性的大小的度量,稱為客觀概率。主觀(Subjective)概率:在實(shí)際管理決策中,許多事件的發(fā)生概率是無法通過隨機(jī)試驗(yàn)獲得的,或條件不允許,或事件本身不允許。因此需要一種方法來人為設(shè)定事件發(fā)生的概率,稱為主觀概率。主觀概率是人們根據(jù)經(jīng)驗(yàn)、各方面的知識(shí)以及了解到的客觀情況進(jìn)行分析、推理、綜合判斷,對(duì)特定事件發(fā)生的可能性的信念(或意見、看法)的度量(Savage,1954)。第五頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—先驗(yàn)分布與先驗(yàn)假設(shè)先驗(yàn)分布(PriorDistribution):根據(jù)先驗(yàn)信息所確定的概率分布叫先驗(yàn)分布,獲得先驗(yàn)分布是貝葉斯分析的基礎(chǔ)。決策中先驗(yàn)分布的獲得具有高度的主觀性。先驗(yàn)假設(shè):為使先驗(yàn)分布估計(jì)規(guī)范化,需要做一定的假設(shè)。連通性假設(shè):指事件A和事件B發(fā)生的可能性是可比的,即p(A)>p(B),p(A)~p(B),p(A)<p(B)必有一個(gè)成立。傳遞性假設(shè):若對(duì)事件A、B、C,有p(A)>p(B),p(B)>p(C),則p(A)>p(C)。(滿足連通性和傳遞性的二元關(guān)系才能構(gòu)成完全序)部分與全體關(guān)系假設(shè):若事件A是事件B的一部分,則p(B)≥p(A)。第六頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—先驗(yàn)分布估計(jì):比較法比較法1-離散型(對(duì)事件發(fā)生的各種狀態(tài)加以比較確定相對(duì)似然率)某氣象專家對(duì)當(dāng)年的氣候狀況進(jìn)行評(píng)估,認(rèn)為當(dāng)年氣候正常(1)與受災(zāi)的可能性之比約為3:2;如果受災(zāi),則水災(zāi)(2)、旱災(zāi)(3)的可能性相當(dāng)。據(jù)此,我們可推算出當(dāng)年氣候狀況的先驗(yàn)分布:(1)+(2)+(3)=1;(1)/((2)+(3))=3/2;(2)=(3)解得:(1)=0.6,(2)=0.2,(3)=0.2思考:設(shè)某決策問題有n個(gè)狀態(tài),有m個(gè)專家對(duì)各狀態(tài)發(fā)生的可能性進(jìn)行了比較評(píng)估,我們?nèi)绾尉C合利用所有專家的評(píng)估結(jié)果得到最終的先驗(yàn)分布?第七頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—先驗(yàn)分布估計(jì):打賭法打賭法(離散型)設(shè)打賭者(A)的個(gè)人財(cái)產(chǎn)為W。設(shè)事件E發(fā)生時(shí)A獲得收入為p,(0<p<1;p<<W:保證打賭者的效用函數(shù)是線性的),不發(fā)生時(shí)A獲得的收入為1-p。調(diào)整p值使A感覺無論事件E是否發(fā)生,其收入基本相同,即(E)×p=(1-(E))×(1-p)。則事件E發(fā)生的可能性(E)=1-p。第八頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—先驗(yàn)分布估計(jì):直方圖法直方圖法(適合于自然狀態(tài)在實(shí)軸某個(gè)區(qū)間連續(xù)取值)區(qū)間離散化:把的取值范圍劃分為若干子區(qū)間1…n;賦值:估計(jì)每個(gè)區(qū)間的似然率(i),據(jù)此作出直方圖;變換:將直方圖擬合為概率分布函數(shù)F(x)=Σ≤x
()。不足之處:區(qū)間數(shù)n難以確定似然率(i)估計(jì)困難F(x)通常有較大的尾部誤差第九頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—先驗(yàn)分布估計(jì):比較法比較法2-連續(xù)型離散化:同直方圖法比較賦值選擇一個(gè)似然率最大的子區(qū)間k作為基準(zhǔn),設(shè)其相對(duì)似然率為Rk,然后給出其他各區(qū)間i相對(duì)于k的似然率Ri,則(i)=Ri/ΣRi由決策者給出每?jī)蓚€(gè)子區(qū)間似然率的比例關(guān)系:rij=(i)/(j),然后計(jì)算出每個(gè)狀態(tài)i的似然率(i)。變換擬合:同直方圖法思考:(1)如果決策者判斷沒有誤差,即rij*rji=1,rij*rjk=rik,如何求(i)?(2)如果決策者判斷有誤差,則又如何求(i)?第十頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—先驗(yàn)分布估計(jì):分位點(diǎn)法區(qū)間對(duì)分法(分位點(diǎn)法)-連續(xù)型確定事件不可能發(fā)生的臨界狀態(tài)取值(如某地區(qū)人口出生率不可能低于9‰,但也不可能超過18‰);求中位數(shù):當(dāng)狀態(tài)取值為此值時(shí),大于或小于此值的狀態(tài)出現(xiàn)的概率相等(如某地區(qū)人口出生率的中位數(shù)為12.5‰);確定上下四分位點(diǎn);確定八分位點(diǎn)(一般僅取到八分位點(diǎn))。第十一頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法第十二頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—先驗(yàn)分布估計(jì):分布函數(shù)法與給定形式的分布函數(shù)相匹配(最常用也容易濫用)[Matlab工具箱:StatisticsToolbox/ProbabilityDistributions]均勻分布(連續(xù)型):如果隨機(jī)變量落在某個(gè)區(qū)間(a,b)中任意等長(zhǎng)度的子區(qū)間內(nèi)的可能性相等,則它服從均勻分布,均勻分布的概率密度函數(shù)為:[Matlab函數(shù):unifpdf(x,a,b),unifit(DATA)]ab第十三頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—先驗(yàn)分布估計(jì):分布函數(shù)法二項(xiàng)分布:(離散型)每次隨機(jī)試驗(yàn)中事件A出現(xiàn)的概率為p,n次獨(dú)立試驗(yàn)中事件A出現(xiàn)k次的概率服從二項(xiàng)分布:[Matlab函數(shù):binopdf(k,n,p),binofit(k,n)]泊松分布:(離散型)每次隨機(jī)試驗(yàn)中事件A出現(xiàn)的概率為p,n次(n→∞,但n*p=
為常數(shù))獨(dú)立試驗(yàn)中事件A出現(xiàn)k次的概率服從泊松分布:[Matlab函數(shù):poisspdf(k,),poissfit(DATA)]第十四頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法第十五頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法主觀概率—先驗(yàn)分布估計(jì):分布函數(shù)法正態(tài)分布(高斯分布):(連續(xù)型)若連續(xù)型隨機(jī)變量的概率密度函數(shù)為:
則稱隨機(jī)變量服從參數(shù)為、2的正態(tài)分布[Matlab函數(shù):normpdf(x,,),normfit(DATA)]
。參見相關(guān)統(tǒng)計(jì)學(xué)書籍,看看還有哪些分布函數(shù)可供選擇使用?第十六頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法第十七頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法隨機(jī)決策理論與方法1、主觀概率2、效用函數(shù)3、決策準(zhǔn)則4、貝葉斯決策分析第十八頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—問題的引入復(fù)習(xí)信息集:為減少行動(dòng)集、自然狀態(tài)集、后果集的不確定性開展調(diào)查研究所獲得的信息。自然狀態(tài)集:事物所有可能的自然狀態(tài)Θ={1,…,n}行動(dòng)集:決策主體可能采用的所有行動(dòng)集合A={a1,…,am}后果集:決策問題各種可能的后果集合C={cij=c(ai,j)},cij表示決策人采取行動(dòng)ai時(shí)出現(xiàn)自然狀態(tài)j時(shí)的后果。主觀概率是用來量化自然狀態(tài)的隨機(jī)性,那么我們?nèi)绾味攘恳粋€(gè)后果的價(jià)值呢?面臨兩個(gè)難題:后果價(jià)值的量化存在困難(如降價(jià)促銷對(duì)品牌的傷害);即使能夠量化標(biāo)度,但相同標(biāo)度值的價(jià)值因人而異。第十九頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—問題的引入禮品a1抽獎(jiǎng)a21.00.50.52000元5000元0元在各類決策中,常常面臨著這種選擇:風(fēng)險(xiǎn)小但期望收益也?。黄谕找娲蟮L(fēng)險(xiǎn)也大!不同的決策人有不同的選擇,相同的決策人在不同的情境下選擇也不同。那么在決策中如何描述或表達(dá)后果對(duì)決策人的實(shí)際價(jià)值,以便反映決策人心目中對(duì)各種后果的偏好次序呢?第二十頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—效用的定義效用就是偏好的量化值。決策的目標(biāo)就是使期望效用極大化?;靖拍罴胺?hào)嚴(yán)格序>:a>b表示a優(yōu)于b。滿足傳遞性和非對(duì)稱性。無差異~:a~b表示a與b無差異。滿足自反性、對(duì)稱性和傳遞性。弱序≥:a≥b表示a不劣于b。滿足自反性、傳遞性和反對(duì)稱性。展望/前景(prospect)(事態(tài)體):各種后果(n種)及后果出現(xiàn)的概率的組合,記為:Pj=<p1(j),c1;p2(j),c2;…;pn(j),cn>,(j=1,2,…,m;m為行動(dòng)的可能種數(shù))第二十一頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—效用的定義復(fù)合展望:當(dāng)無法確定采取某個(gè)行動(dòng)時(shí),可隨機(jī)選擇一種行動(dòng),設(shè)選擇行動(dòng)aj的概率為qj。則決策的展望就是一種復(fù)合展望,記為P=<q1,P1;q2,P2;…;qm,Pm>。所有展望(包括簡(jiǎn)單展望和復(fù)合展望)構(gòu)成展望空間。效用的定義若展望空間上的實(shí)值函數(shù)u對(duì)于展望空間的任意兩個(gè)展望P1、P2,有P1≥P2
iff
u(P1)≥u(P2),則稱u為效用函數(shù)。第二十二頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—效用的定義效用存在性公理(理性行為公理)連通性:任意兩個(gè)展望的優(yōu)劣都是可比的傳遞性:展望的優(yōu)劣滿足傳遞性復(fù)合保序性:展望的優(yōu)劣關(guān)系是可以復(fù)合的,且復(fù)合不會(huì)破壞原有的優(yōu)劣關(guān)系展望的優(yōu)劣是相對(duì)的,沒有無限優(yōu)的展望,也不存在無限劣的展望。第二十三頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—效用的定義效用的公理化定義:在上述公理系統(tǒng)中,若展望空間上存在實(shí)值函數(shù)u,有:對(duì)展望空間中的任意展望P1、P2,P1>P2
iff
u(P1)>u(P2)u(P1+(1-)P2)=u(P1)+(1-)u(P2)(復(fù)合展望的效用等于展望效用的復(fù)合)對(duì)滿足上述條件的u1,u2,必有u1(Pi)=bu2(Pi)+c,其中b,c∈R1,b>0。(任意兩個(gè)決策人的效用是線性相關(guān)的)第二十四頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—基數(shù)性和序數(shù)性前述定義的效用是一種基數(shù)效用,不僅能夠反映決策者的偏好次序,還能夠反映決策者的偏好強(qiáng)度。但在實(shí)際決策中,有時(shí)只需要偏好次序而不一定需要知道偏好強(qiáng)度就可以決策。此時(shí)只需要序數(shù)效用就可以了。有關(guān)序數(shù)效用的應(yīng)用在多屬性決策中介紹。Hicks對(duì)效用函數(shù)的基數(shù)性和序數(shù)性的比喻:如果知道兩個(gè)人的身高,那么我們可以把高個(gè)兒排在第一位;如果不知道他倆的身高也沒關(guān)系,讓他們比一下就可以了。第二十五頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—效用函數(shù)值的估計(jì)概率當(dāng)量法(VonNeumann,Morgenstern,N-M法):設(shè)決策系統(tǒng)的自然狀態(tài)集Θ={1,…,n}、行動(dòng)集A={a1,…,am}、后果集C={cij=c(ai,j)},最優(yōu)后果為c*=max{cij},最劣后果為c0=min{cij}。則對(duì)于任意后果cij的效用值u(cij),可按以下步驟獲得:設(shè)u(c*)=1,u(c0)=0;建立簡(jiǎn)單展望<p,c*;1-p,c0>,p可調(diào)反復(fù)向決策人提問,改變可調(diào)概率p,使得當(dāng)p=pij時(shí)得到如下的無差異關(guān)系:cij~<pij,c*;1-pij,c0>測(cè)得后果cij的效用值為:
u(cij)=pij*u(c*)+(1-pij)*u(c0)=pij第二十六頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—效用函數(shù)值的估計(jì)確定當(dāng)量法(修正N-M法):設(shè)u(c*)=1,u(c0)=0;建立簡(jiǎn)單展望<p,c*;1-p,c0>,p為0-1間的給定值,如p=0.5反復(fù)向決策人提問,改變cij得到如下的無差異關(guān)系:cij~<p,c*;1-p,c0>測(cè)得后果cij的效用值為:
u(cij)=p*u(c*)+(1-p)*u(c0)=p增益當(dāng)量法:已知u(cij)和u(c0),確定u(c*)的方法損失當(dāng)量法:已知u(cij)和u(c*),確定u(c0)的方法第二十七頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—效用函數(shù)的構(gòu)造(離散型)看球的效用函數(shù)構(gòu)造(不考慮經(jīng)濟(jì)成本)構(gòu)建問題的決策樹,根據(jù)一般偏好,四種后果的優(yōu)劣是C2>C3>C4>C1;令u(C1)=0,u(C2)=1;詢問1:“下雨看電視轉(zhuǎn)播”的后果與“現(xiàn)場(chǎng)看球”時(shí)有多大的概率下雨被淋相當(dāng)?(例如:0.3,則u(C3)=0.7)詢問2:“天晴看電視轉(zhuǎn)播”的后果與“現(xiàn)場(chǎng)看球”時(shí)有多大的概率下雨被淋相當(dāng)?(例如:0.6,則u(C4)=0.4)一致性檢驗(yàn):用C3,C4加上C1(或C2)進(jìn)行校驗(yàn),直至一致性得到滿足?,F(xiàn)場(chǎng)看球a1電視看球a2C4:天晴看電視C3:下雨沒被淋C2:天晴未被淋C1:下雨被淋第二十八頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—效用函數(shù)的構(gòu)造(連續(xù)型)若后果是連續(xù)型,則可通過分析u(c)的若干特征值,求出特征點(diǎn)的效用后再連成光滑曲線。例:試作出每天投入學(xué)習(xí)的時(shí)間t對(duì)應(yīng)的效用曲線。分析特征點(diǎn):u(t=0)=0;u(t>TM)=0(TM=?);狀態(tài)導(dǎo)入期(0~t0),效用增加較慢;狀態(tài)穩(wěn)定期(t0~t1),效用與投入學(xué)習(xí)的時(shí)間基本成比例關(guān)系;效率下降,效用增加期(t1~tm),效用是投入學(xué)習(xí)的時(shí)間的單調(diào)增函數(shù),但增長(zhǎng)率小于狀態(tài)穩(wěn)定期且隨著時(shí)間的增加越來越小,最終達(dá)到零(t=tm),此時(shí)效用達(dá)到最大;當(dāng)投入的學(xué)習(xí)時(shí)間大于tm時(shí),將會(huì)得不償失,學(xué)習(xí)效率急劇降低,效用減少。第二十九頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—效用函數(shù)的構(gòu)造(連續(xù)型)t0t1tmtM024U(t)Umaxt第三十頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—風(fēng)險(xiǎn)與效用風(fēng)險(xiǎn):遇到破壞或損失的機(jī)會(huì)或危險(xiǎn)?!帮L(fēng)險(xiǎn)”:以打魚捕撈為生的漁民們?cè)陂L(zhǎng)期的捕撈實(shí)踐中,深深的體會(huì)到“風(fēng)”給他們帶來的無法預(yù)測(cè)無法確定的危險(xiǎn),他們認(rèn)識(shí)到,在出海捕撈打魚的生活中,“風(fēng)”即意味著“險(xiǎn)”,因此有了“風(fēng)險(xiǎn)”一詞的由來。風(fēng)險(xiǎn)包含兩個(gè)方面的內(nèi)容:一是后果的損失嚴(yán)重程度;二是損失出現(xiàn)的可能性大小。參考:/view/156901.htm第三十一頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—風(fēng)險(xiǎn)與效用風(fēng)險(xiǎn)的度量方差:設(shè)某決策方案a的后果為收益y,y的概率密度函數(shù)為f(y),期望值為E(y),則方差可用來度量風(fēng)險(xiǎn),方差越大風(fēng)險(xiǎn)越大。協(xié)方差:若期望收益為決策人設(shè)定的目標(biāo)收益c,則可用協(xié)方差度量風(fēng)險(xiǎn)。臨界概率:小于目標(biāo)收益的概率。第三十二頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法效用函數(shù)—風(fēng)險(xiǎn)與效用效用與風(fēng)險(xiǎn):效用反映的就是決策人對(duì)風(fēng)險(xiǎn)的一種態(tài)度。U(t)Umax=1C(萬元)風(fēng)險(xiǎn)厭惡型風(fēng)險(xiǎn)中立型風(fēng)險(xiǎn)追求型0.50912.51425風(fēng)險(xiǎn)酬金k第三十三頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法隨機(jī)決策理論與方法1、主觀概率2、效用函數(shù)3、決策準(zhǔn)則4、貝葉斯決策分析第三十四頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法決策準(zhǔn)則—決策問題的表示決策樹表示法決策點(diǎn)機(jī)會(huì)點(diǎn)C1決策枝機(jī)會(huì)枝后果點(diǎn)C2C3C4后果值a1a2(1)(2)(1)(2)第三十五頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法決策準(zhǔn)則—決策問題的表示決策表表示法12
…j…n(j)(1)(2)…(j)…(n)a1c11c12…c1j…c1na2c11c12…c1j…c1n…………………aici1ci2…cij…cin…………………amcm1cm2…cmj…cmn狀態(tài)行動(dòng)后果(效用值、損失值、價(jià)值)第三十六頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法決策準(zhǔn)則—最大可能值準(zhǔn)則決策者決策時(shí)都需要根據(jù)某種準(zhǔn)則來選擇決策方案——決策準(zhǔn)則。準(zhǔn)則不同,決策結(jié)果就可能不同。下面介紹風(fēng)險(xiǎn)型決策中常用的幾種決策準(zhǔn)則。最大可能值準(zhǔn)則:(眾數(shù)原則)j123E(ai)=Σi(j)cij(j)0.20.50.3a17344.1a26.5413.6a36503.7注:后果為損失值此準(zhǔn)則在狀態(tài)出現(xiàn)的概率差距不大時(shí)的決策效果可能很差!第三十七頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法決策準(zhǔn)則—貝葉斯準(zhǔn)則貝葉斯準(zhǔn)則:期望效用最大或期望損失最小。在實(shí)際決策中,一般先確定后果對(duì)決策人的實(shí)際價(jià)值即效用函數(shù)(若是損失則使用負(fù)效用)(稱為伯努利過程),然后再應(yīng)用貝葉斯準(zhǔn)則。j123E(ai)=Σj(j)cij(j)0.20.50.3a17344.1a26.5413.6a36503.7注:后果為損失值第三十八頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法決策準(zhǔn)則—E-V準(zhǔn)則E-V準(zhǔn)則:用期望與方差(度量風(fēng)險(xiǎn))共同判決一個(gè)方案的優(yōu)劣。帕累托優(yōu):若不存在方案al,使得方案ak的期望與風(fēng)險(xiǎn)均劣于al,稱ak為有效方案或帕累托優(yōu)。評(píng)價(jià)函數(shù):fi(E,V)=E(ai)+i2。反映了決策人的風(fēng)險(xiǎn)態(tài)度,>0風(fēng)險(xiǎn)厭惡;=0風(fēng)險(xiǎn)中立(對(duì)應(yīng)于貝葉斯準(zhǔn)則);<0風(fēng)險(xiǎn)追求。j123E(ai)i2=Σj(cij-E(ai))2
(j)(j)0.20.50.3a17344.12.29a26.5413.63.79a36503.75.967第三十九頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法決策準(zhǔn)則—E-V準(zhǔn)則第四十頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法決策準(zhǔn)則—優(yōu)勢(shì)原則在實(shí)際決策中,主觀概率的確定有時(shí)是很困難的,因此可利用優(yōu)勢(shì)原則進(jìn)行決策。給不出準(zhǔn)確的主觀概率;任何兩個(gè)行動(dòng)(方案)之間都不存在絕對(duì)優(yōu);決策方法(以損失函數(shù)為例):列出方案ak最優(yōu)的判別不等式組E(ak)≤E(ai),i=1,…,m求解不等式組的解即得到ak方案最優(yōu)的概率分布判斷這種概率分布是否可能第四十一頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法當(dāng)(1)>0.6時(shí),方案a1最優(yōu);當(dāng)(1)<0.6時(shí)方案a3最優(yōu);方案a2被稱為強(qiáng)劣的(stronglydominated)。決策準(zhǔn)則—優(yōu)勢(shì)原則j12a117a245a351注:后果為損失值第四十二頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法隨機(jī)決策理論與方法1、主觀概率2、效用函數(shù)3、決策準(zhǔn)則4、貝葉斯決策分析第四十三頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯定理?xiàng)l件概率:設(shè)A、B為隨機(jī)試驗(yàn)E中的兩個(gè)事件,在事件A發(fā)生條件下事件B發(fā)生的概率稱為條件概率,記為(B|A),且(B|A)=(AB)/(A)。(A→B)若Aj(j=1,…,n)是樣本空間S中n個(gè)互不相容的事件,且(Aj)>0,(AkAl)=0(k≠l);∪j(Aj)=S。稱Aj是樣本空間的一個(gè)劃分。則對(duì)任一事件B,有:第四十四頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯定理貝葉斯定理:已知(B|Aj)、(Aj)(先驗(yàn)概率)(j=1,…,n),求當(dāng)事件B發(fā)生(隨機(jī)試驗(yàn)的結(jié)果或觀察值)時(shí)Ak發(fā)生的概率(后驗(yàn)概率)。貝葉斯定理在決策分析中的意義:在實(shí)際決策中,我們需要準(zhǔn)確估計(jì)的隨機(jī)變量是未來的自然狀態(tài)Θ,而通過隨機(jī)試驗(yàn)所觀察到的往往是與之相關(guān)的另一個(gè)隨機(jī)變量。例如,疾病診斷往往是通過觀察癥狀如發(fā)燒、咳嗽等來判斷其疾病如感冒、甲流。貝葉斯定理可以幫助我們判斷當(dāng)出現(xiàn)發(fā)燒時(shí)患甲流的概率。第四十五頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯定理例:經(jīng)臨床觀察,患甲流的病人約70%發(fā)燒超過38度,患感冒的病人約40%發(fā)燒超過38度,而肺炎病人中有60%發(fā)燒超過38度。統(tǒng)計(jì)表明當(dāng)前甲流發(fā)病率約0.6‰,感冒0.7‰
,肺炎0.1‰
?,F(xiàn)有一病人發(fā)燒超過38度,請(qǐng)?jiān)\斷該病人最可能患上哪種疾病。解:記發(fā)燒超過38度的事件為X;患甲流、感冒、肺炎分別記為A、B、C。先驗(yàn)概率分別為(A)=0.0006,(B)=0.0007,(C)=0.0001。條件概率分別為(X|A)=0.7;(X|B)=0.4;(X|C)=0.6。則(X)=0.7×0.0006+0.4×0.0007+0.6×0.0001=0.00076(A|X)=0.7×0.0006/0.00076=55.26%(B|X)=0.4×0.0007/0.00076=36.84%(C|X)=0.6×0.0001/0.00076=7.90%第四十六頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析貝葉斯風(fēng)險(xiǎn):當(dāng)決策人通過隨機(jī)試驗(yàn)得到觀察值x后,需要根據(jù)觀察值和某種決策準(zhǔn)則選擇行動(dòng)a,即a=(x)。對(duì)于自然狀態(tài)及其先驗(yàn)概率(),采取策略時(shí)損失函數(shù)l(,(x))對(duì)隨機(jī)試驗(yàn)結(jié)果x和自然狀態(tài)的期望值稱為貝葉斯風(fēng)險(xiǎn),記為r()。r()=E(Ex(l(,(x))))=xl(,(x))p(x|)()貝葉斯規(guī)則(正規(guī)型):若策略空間存在某個(gè)策略*,使得對(duì)于任意其他策略,均有r(*)≤r(),則稱*為貝葉斯規(guī)則或貝葉斯策略。即r(*)=min{r()}第四十七頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析貝葉斯規(guī)則(擴(kuò)展型):在實(shí)際應(yīng)用中,當(dāng)行動(dòng)集、狀態(tài)集、觀察值集中的元素較多時(shí),策略集很大,獲得r()的最小值很困難,因此可對(duì)r()的計(jì)算公式進(jìn)行變換:r()=xl(,(x))p(x|)()=x
l(,(x))p(x|)()若使
l(,(x))p(x|)()達(dá)到極小,r()必然達(dá)到最小又(x)>0,所以可使
l(,(x))p(x|)()/(x)達(dá)到極小后驗(yàn)概率(|x)=p(x|)()/(x),因此r()的極小化問題轉(zhuǎn)變?yōu)榍?/p>
l(,(x))(|x)的極小化問題。第四十八頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析擴(kuò)展型貝葉斯分析過程原始信息:先驗(yàn)分布()追加樣本信息:觀察值x貝葉斯定理:后驗(yàn)概率(|x)求*:計(jì)算r(),找出使后驗(yàn)期望損失最小的第四十九頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析信息的價(jià)值:隨機(jī)試驗(yàn)獲得觀察值x是需要成本的,而觀察值x也可以幫助我們減少?zèng)Q策損失。那么隨機(jī)試驗(yàn)觀察到的信息有多大價(jià)值呢?假設(shè)我們未進(jìn)行任何觀察,那么根據(jù)貝葉斯準(zhǔn)則,最小決策損失期望為:minE(li(,ai))若試驗(yàn)獲得了觀察值x,則最小貝葉斯風(fēng)險(xiǎn)即為最小決策損失:minr()觀察信息的期望價(jià)值為:
minE(li(,ai))-minr()j123E(ai)(j)0.20.50.3a17344.1a26.5413.6a36503.7第五十頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析例:(油井鉆探問題)某公司擁有一塊可能有油的土地,公司或自己開采,或以以下兩種模式出租:①無條件出租,租金1620萬元;②有條件出租,產(chǎn)量在20萬桶或以上時(shí),每桶提成180元;產(chǎn)量不足20萬桶不提成。設(shè)鉆井費(fèi)用為2700萬元,采油設(shè)備費(fèi)900萬元(有油時(shí)),油價(jià)為540元/桶。假設(shè)油產(chǎn)量的可能狀態(tài)及其先驗(yàn)概率分布如表。若決策人風(fēng)險(xiǎn)中立,決策人該選擇什么行動(dòng)?產(chǎn)油量50萬桶20萬桶5萬桶無油j1234(j)0.10.150.250.5第五十一頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析解:公司可采取的行動(dòng)有3種:a1-自己開采;a2-無條件出租;a3-有條件出租。決策表如下(單位:萬元):根據(jù)貝葉斯準(zhǔn)則,方案a1效用最大,故應(yīng)自己鉆井。產(chǎn)油量50萬桶20萬桶5萬桶無油期望效用j1234(j)0.10.150.250.5a1234007200-900-27001845a216201620162016201620a390003600001440第五十二頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析如果通過地質(zhì)勘探可以進(jìn)一步了解該地區(qū)的地質(zhì)結(jié)構(gòu)和產(chǎn)油情況,那么我們又如何決策?假設(shè)勘探成本是432萬元,統(tǒng)計(jì)表明,產(chǎn)油量與地質(zhì)構(gòu)造(共四種類型,用xk表示)間的關(guān)系[p(xk|j)]如下表。產(chǎn)油量50萬桶20萬桶5萬桶無油j1234p(x1|j)7/129/1611/243/16p(x2|j)1/33/161/611/48p(x3|j)1/121/81/413/48p(x4|j)01/81/85/16第五十三頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析解:(1)計(jì)算(xi)=p(xi|j)(j);(2)計(jì)算后驗(yàn)概率,即已知地質(zhì)結(jié)構(gòu)情況下產(chǎn)油狀態(tài)的概率p(j|xi)=(j)*p(xi|j)/(xi),并給出決策表。產(chǎn)油量50萬桶20萬桶5萬桶無油(xi)j1234x10.351p(j|x1)0.1660.2400.3260.267x20.218p(j|x2)0.1530.1290.1910.526x30.225p(j|x3)0.0370.0830.2780.602x40.206p(j|x4)0.0000.0910.1520.758a122968
6768
-1332
-3132
a21188
1188
1188
1188
a38568
3168
-432
-432
第五十四頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析計(jì)算各種地質(zhì)結(jié)構(gòu)下采取不同行動(dòng)的期望效用:所以進(jìn)行地質(zhì)勘探試驗(yàn)的期望收益為:4165.2×0.351+2484×0.218+1188×0.225+1188×0.206=2515.536
地質(zhì)結(jié)構(gòu)行動(dòng)x1x2x3x4(xi)0.3510.2180.2250.206a14165.2
2484
-846
-1962
a21188
1188
1188
1188
a31926
1411.2
201.6
-104.4
第五十五頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法貝葉斯決策分析—貝葉斯分析結(jié)論:如果不打算勘察,則應(yīng)選擇自主鉆井,期望收益為1845萬元;如果選擇勘察,則期望收益為2515.536萬元;因?yàn)?515.536-1845=670.536>0,所以應(yīng)采用勘察策略??辈焖@得的信息的期望價(jià)值是670.536+432=1102.536萬元;如果勘察表明該地區(qū)的地質(zhì)結(jié)構(gòu)是x1或x2類型,則應(yīng)該自己鉆井,期望收益分別為4165.2萬元和2484萬元;如果勘察表明該地區(qū)的地質(zhì)結(jié)構(gòu)是x3或x4類型,則應(yīng)該無條件出租,期望收益均為1188萬元;“有條件出租”策略是強(qiáng)劣的。第五十六頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法期望效用理論的若干思考思考1:效用函數(shù)一定是連續(xù)的嗎?是否存在某種臨界點(diǎn)使得效用函數(shù)是一種分段函數(shù),而在分段函數(shù)內(nèi)滿足效用存在公理?思考2:理性行為公理認(rèn)為合乎理性的決策人在進(jìn)行價(jià)值判斷時(shí)一定能滿足這些公理。(實(shí)際決策中是否存在某種悖論呢?)思考3:期望效用理論在實(shí)際決策中是否總是有效的?第五十七頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法損失厭惡A)假設(shè)你現(xiàn)有1000元。你面臨著兩種選擇:第一種選擇能保證你獲得500元;第二種選擇讓你拋硬幣,正面朝上可以獲得1000元,反面朝上,什么也得不到。你怎么選擇?B)假設(shè)你現(xiàn)有2000元。你面臨著兩種選擇:第一種選擇你將肯定損失500元;第二種選擇讓你拋硬幣,正面朝上可能損失1000元,反面朝上,就什么也不損失。你怎么選擇?解釋(損失厭惡):等量的損失要比等量的獲得帶來更大的影響。第五十八頁,共六十八頁,編輯于2023年,星期二*決策理論與方法-隨機(jī)決策理論與方法顯著性假設(shè)在以色列,每年大約有600人死于交通事故。為此,以色列交通部制定了兩套方案供市民決策,決策方式有兩種:選擇與配對(duì)。結(jié)果:采用選擇法時(shí),68%的人選擇了方案一;采用配對(duì)法時(shí),只有4%的人愿意方案一的支出成本達(dá)到或超過55萬美元。解釋(顯著性假設(shè)):在決策中需要考慮多個(gè)目標(biāo)時(shí),相對(duì)于配對(duì)過程,重要目標(biāo)在選擇過程中被更多地考慮。選擇法預(yù)期死亡人數(shù)成本(萬美元)方案一50055方案二57012配對(duì)法預(yù)期死亡人數(shù)成本(萬美元)方案一500?方案二57012選擇法預(yù)期死亡人數(shù)成本(萬美元)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)殖場(chǎng)抵押借款合同范本
- 樁基礎(chǔ)施工合同范本
- 兩人合作經(jīng)營(yíng)業(yè)務(wù)合同樣本
- 個(gè)人投資合伙合同范本
- 個(gè)人房產(chǎn)抵押借款協(xié)議合同
- 親朋好友合伙購(gòu)房合同范例
- 2025版建筑工程施工總承包合同
- 個(gè)人租房合同格式及模板
- 個(gè)人租賃住宅合同范本解析
- 上海商業(yè)地產(chǎn)租賃合同范本
- DB11∕T 2035-2022 供暖民用建筑室溫?zé)o線采集系統(tǒng)技術(shù)要求
- 《復(fù)旦大學(xué)》課件
- 針灸與按摩綜合療法
- 煤礦井下安全避險(xiǎn)六大系統(tǒng)建設(shè)完善基本規(guī)范
- Photoshop 2022從入門到精通
- T-GDWJ 013-2022 廣東省健康醫(yī)療數(shù)據(jù)安全分類分級(jí)管理技術(shù)規(guī)范
- 校本課程生活中的化學(xué)
- DB43-T 2775-2023 花櫚木播種育苗技術(shù)規(guī)程
- 《我的家族史》課件
- 高空作業(yè)安全方案及應(yīng)急預(yù)案
- 蘇教版科學(xué)2023四年級(jí)下冊(cè)全冊(cè)教案教學(xué)設(shè)計(jì)及反思
評(píng)論
0/150
提交評(píng)論