第11章 統計決策_第1頁
第11章 統計決策_第2頁
第11章 統計決策_第3頁
第11章 統計決策_第4頁
第11章 統計決策_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第11章統計決策11.1統計決策的基本概念11.2完全不確定型決策11.3一般風險型決策11.4貝葉斯決策學習目標

1. 統計決策的基本概念、基本工具和基本步驟;2. 完全不確定決策的基本準則及其使用場合;3. 風險型決策的基本準則及其應用;4. 貝葉斯決策的概念;5. 后驗概率計算與后驗分析;6. 完全信息價值與補充信息價值的概念及其應用11.1統計決策的基本概念一、什么是統計決策二、統計決策的基本步驟三、收益矩陣表什么是統計決策瓦爾德(A.Wald)1950年發(fā)表專著<統計決策函數>廣義:所有利用統計方法和統計信息的決策;狹義:研究非對抗型和不確定型決策問題的科學的定量分析方法。對抗型決策:對策論/博弈論(多個主體)非對抗型決策:決策論/決策分析(一個主體)決策類型:確定型決策、不確定型決策不確定型決策:完全不確定型(對狀態(tài)概率一無所知)風險型決策(對狀態(tài)概率有所了解);統計決策的基本步驟(一)確定決策目標

決策目標是在一定條件制約下,決策者希望達到的結果。反映決策目標的變量,稱為目標變量。(二)擬定備選方案

備選方案是決策者實現目標的各種可能途徑。備選方案中所調控的變量稱為行動變量。所有備選方案的集合稱為行動空間。(三)列出自然狀態(tài)

自然狀態(tài)是指實施行動方案時,可能面臨的客觀條件(天氣的晴雨)。所有可能出現的狀態(tài)的集合稱為狀態(tài)空間,而相應的各種狀態(tài)可能出現的概率的集合稱為狀態(tài)空間的概率分布。(四)選擇“最佳”或“滿意”的方案(五)實施方案收益矩陣表

表11-1收益矩陣表

狀態(tài)θ1θ2…θn概率P1P2…Pn方案A1q11q12…q1nA2q21q22…q2n……………Amqm1qm2…qmn

收益矩陣的元素qij反映在狀態(tài)θj下,采用行動方案Ai得到的收益值。這里所說的收益是廣義收益指標。收益是行動方案和自然狀態(tài)的函數,可用下式表示:

qij=Q(Ai

,θj

)i=1,2,…,m;j=1,2,…n11.2完全不確定型決策

一、完全不確定型決策的準則二、各種準則的特點和適用場合完全不確定型決策的準則

(一)最大的最大收益值準則(樂觀準則)在決策時,先選出各種狀態(tài)下每個方案的最大收益值,然后再從中選擇最大者,并以其相對應的方案作為所要選擇的方案。(二)最大的最小收益值準則(悲觀準則)在決策時,先選出各種狀態(tài)下每個方案的最小收益值,然后再從中選擇最大者,并以其相對應的方案作為所要選擇的方案。(三)最小的最大后悔值準則

后悔值是由于決策失誤而造成的最大可能的收益值與實際收益值之差。方案Ai在狀態(tài)θj下的后悔值,可按下式計算:rij

=max

Q(Ai

,θj

)-qij

≥0

maxQ(Ai

,θj

)是在第j種狀態(tài)下,正確決策有可能得到的最大收益,qij是收益矩陣的元素。決策準則:應在求出后悔矩陣的基礎上,先選出各種狀態(tài)下每個方案的最大后悔值,然后再從中選擇最小者,并以其相對應的方案作為所要選擇的方案。完全不確定型決策的準則(續(xù))

(四)折衷準則根據經驗和判斷確定一個樂觀系數α(0≤α≤1),以α和1-α分別作為最大收益值和最小收益值的權數,計算各方案的期望收益值E(Q(ai))

E(Q(Ai))=αmax{qij

}+(1-α)min{qij

}并以期望收益值最大的方案作為所要選擇的方案。

注意:此時只考慮兩種極端狀態(tài)。

完全不確定型決策的準則(續(xù))

(五)等可能性準則

該準則假定各種狀態(tài)可能出現的概率相同,在此基礎上求各方案收益的期望值,并以期望收益值最大的方案作為所要選擇的方案。P375-37711.111.211.311.411.5完全不確定型決策的準則(續(xù))

各種準則的特點和適用場合

最大的最大收益值準則:一般只有在客觀情況確實很樂觀,或者即使決策失誤,也完全可以承受損失的場合才采用。最大的最小收益值準;適用于對未來的狀態(tài)非常沒有把握,或者難以承受決策失誤損失的場合。最小的最大后悔值準則:適用于不愿放過較大的獲利機會,同時又對可能出現的損失有一定承受力的場合。折衷準則和等可能性準則都是以各種方案的收益的期望值作為選擇方案的標準。折衷準則事實上是假定未來可能發(fā)生的狀態(tài)只有兩種:即最理想狀態(tài)和最不理想狀態(tài)。前者發(fā)生的概率是α,后者發(fā)生的概率是(1-α)。當α=1時,該準則等價于樂觀準則,而當α=0時,該準則等價于悲觀準則。11.3一般風險型決策一、自然狀態(tài)概率分布的估計二、風險型決策的準則三、利用決策樹進行風險型決策自然狀態(tài)概率分布的估計風險型決策不同于完全不確定型決策,它是在估計出狀態(tài)空間的概率分布的基礎上進行決策.

客觀概率是一般意義上的概率,通常是由自然狀態(tài)的歷史資料推算或按照隨機實驗的結果計算出來的。

主觀概率是決策者基于自身的學識和經驗作出的對某一事件發(fā)生可能性的主觀判斷。風險型決策的準則(一)期望值準則(應用最廣)

以各方案收益的期望值的大小為依據,來選擇合適的方案,一般采用期望收益值最大準則。式中,E(Q(Ai))是方案i的收益的期望值,是方案i在j狀態(tài)出現時的收益值;Pj是j狀態(tài)出現的概率。

注意:期望收益,只是平均意義來說,并不是真實的收益.

(二)變異系數準則(離散系數

P38111.6)收益的期望值只反映了一種平均趨勢,還要考慮方差的大小,方差大則風險大。因此在期望值達到一定數額的前提下,以變異系數較低的方案作為所要選擇的方案。方差Var(Ai)和變異系數V的計算公式如下:風險型決策的準則(續(xù))(三)最大可能準則(P38211.7)

在最可能狀態(tài)下,可實現最大收益值的方案為最佳方案。最大可能準則是將風險條件下的決策問題,簡化為確定條件下的決策問題。只有當最可能狀態(tài)的發(fā)生概率明顯大于其他狀態(tài)時,應用該準則才能取得較好效果。(四)滿意準則(P38211.8)

利用這一準則進行決策,首先要給出一個滿意水平。然后,將各種方案在不同狀態(tài)下的收益值與目標值相比較,并以收益值不低于目標值的累積概率最大的方案作為所要選擇的方案。利用該準則的決策結果,與滿意水平的高低有很大關系。風險型決策的準則(續(xù))利用決策樹進行風險型決策決策樹是一種將決策問題模型化的樹形圖。決策樹由決策點、方案枝、機會點、概率枝、結果點組成。利用決策樹對方案進行比較和選擇,一般采用逆向分析法,即從樹形結構的末端的條件結果開始,從后向前逐步分析。決策樹適用于求解復雜的多階段決策問題。圖11-2例11-9的決策樹圖

11.4貝葉斯決策

一、什么是貝葉斯決策二、貝葉斯公式與后驗概率的估計三、先驗分析與后驗分析四、完全信息價值與補充信息價值五、后驗預分析什么是貝葉斯Bayses決策自然狀態(tài)的概率分:先驗概率、后驗概率;

貝葉斯決策,是利用補充信息根據貝葉斯公式來估計后驗概率(修正先驗概率),并在此基礎上對備選方案進行評價的一種決策方法。

利用貝葉斯決策方法,將先驗信息和補充信息結合在一起進行分析判斷,提高了決策的可靠性;同時還可以對信息的價值及是否需要采集新的補充信息作出科學的判斷。貝葉斯公式與后驗概率的估計

設某種狀態(tài)θj的先驗概率為P(θj),通過調查獲得的補充信息為ek,θj給定時ek的條件概率為P(ek|θj),則在給定信息ek的條件下,θj的條件概率即后驗概率可用以下公式計算先驗分析與后驗分析

先驗分析是利用先驗概率進行決策,而后驗分析是利用后驗概率作為選擇與判斷合適方案的依據。很多時候,兩種分析所得的結論是不一致的。后驗分析中不僅利用了先驗信息,還利用了補充信息。因此一般來說,只要補充信息是準確的,后驗分析的結論更為可靠。P38811.11注:先驗分析:前面介紹的準則完全信息價值與補充信息價值

完全信息,是指在對某一問題進行決策時,對于所有可能出現的狀態(tài)都可以提供完全確切的情報。完全信息的價值,可以由掌握完全信息前后,所采取的不同行動方案的收益值的差額來表示。不同狀態(tài)下收益值的差額有所不同,所以用收益值差額的期望值來綜合反映完全信息的價值(EVPI)。其計算公式如下:EVPI是完全信息價值的期望值,maxiQ(Ai,θj

)表示各方案在狀態(tài)θj下的最大收益值,Q(A*,θj

)表示先驗分析中的最佳方案在狀態(tài)θj下的收益值。EVPI越大表明通過收集補充信息使決策效益提高的余地越大。同時,它也代表了為取得該項情報可付出的代價的上限。P38911.12完全信息價值與補充信息價值(續(xù))

補充信息ek的價值VAI的計算公式如下:

VAI(ek)=先驗EVPI-后驗EVPI(ek)先驗EVPI是根據狀態(tài)的先驗概率計算的完全信息價值的期望值,后驗EVPI(ek)是在了解補充信息ek后,利用根據該信息修正的后驗概率計算的完全信息價值的期望值。VAI(ek)的取值與ek有關。為了綜合反映補充信息的價值,還需計算補充信息價值的期望值EVAI。完全信息價值與補充信息價值(續(xù))

EVAI是判斷收集補充信息是否有利的標準。在收集補充信息之前,應將EVAI與收集補充信息的費用加以比較,只有當收集補充信息的費用小于EVAI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論