貝葉斯統(tǒng)計(jì)簡(jiǎn)介_(kāi)第1頁(yè)
貝葉斯統(tǒng)計(jì)簡(jiǎn)介_(kāi)第2頁(yè)
貝葉斯統(tǒng)計(jì)簡(jiǎn)介_(kāi)第3頁(yè)
貝葉斯統(tǒng)計(jì)簡(jiǎn)介_(kāi)第4頁(yè)
貝葉斯統(tǒng)計(jì)簡(jiǎn)介_(kāi)第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PAGEPAGE7拋出一枚硬幣,硬幣落地,現(xiàn)在我不知道結(jié)果如何,問(wèn)是正面朝上還是反面朝上?答案有三個(gè):A正面朝上、B反面朝上、C正面朝上反面朝上的概率各占1/2哪個(gè)正確?經(jīng)典統(tǒng)計(jì)學(xué)里面正確答案能是A或者B,只有在貝葉斯統(tǒng)計(jì)學(xué)里面答案C是才是被允許的一次實(shí)驗(yàn)的結(jié)果在經(jīng)典統(tǒng)計(jì)學(xué)里面被叫做樣本點(diǎn),是確定的。那么為什么在貝葉斯統(tǒng)計(jì)學(xué)里面第三個(gè)的答案的說(shuō)法是正確的呢?關(guān)鍵在于貝葉斯學(xué)派關(guān)于隨機(jī)變量的定義:任何一個(gè)未知量*都可以看做一個(gè)隨機(jī)變量。這也是貝葉斯學(xué)派最基本的觀點(diǎn),只要是未知的量都可以看做隨機(jī)變量。僅僅從這一個(gè)簡(jiǎn)單的例子就已經(jīng)可以看到經(jīng)典統(tǒng)計(jì)學(xué)派與貝葉斯統(tǒng)計(jì)學(xué)派的爭(zhēng)議來(lái)了,其實(shí)兩個(gè)學(xué)派在一些問(wèn)題上的爭(zhēng)論是相當(dāng)深刻而激烈的,當(dāng)然也有相同相通之處,在這里就不便展開(kāi)詳細(xì)的討論了。就我本人還是比較傾向于貝葉斯學(xué)派的。我們?cè)诨氐缴厦娴膯?wèn)題,看答案C正面朝上反面朝上的概率各占1/2,仔細(xì)想想這句話,實(shí)際上我們已經(jīng)給出了未知量(本次實(shí)驗(yàn)結(jié)果)一個(gè)概率分布的描述。要么正面朝上要么反面朝上,概率各占1/2,這個(gè)概率分布被叫做先驗(yàn)分布。先驗(yàn)分布是指根據(jù)先驗(yàn)信息所給出的隨機(jī)變量的分布,這里的先驗(yàn)信息是指在抽樣之前有關(guān)統(tǒng)計(jì)問(wèn)題的一些信息。那么先驗(yàn)分布與經(jīng)典統(tǒng)計(jì)學(xué)里面的概率分布有什么區(qū)別呢?在所要滿足的條件上,如……是一致的,主要區(qū)別在與概率分布得到的途徑上。經(jīng)典統(tǒng)計(jì)學(xué)里概率及其分布的確定來(lái)自大量重復(fù)實(shí)驗(yàn),與頻率密切相關(guān),由大數(shù)定律、中心極限定理這些基本定理做為理論基石而得來(lái)。特別強(qiáng)調(diào)的是經(jīng)典統(tǒng)計(jì)學(xué)的概率分布包含了所有樣本點(diǎn),即所有可能的實(shí)驗(yàn)結(jié)果都要被包含進(jìn)去。這是與貝葉斯統(tǒng)計(jì)學(xué)里的先驗(yàn)分布不同的地方,貝葉斯統(tǒng)計(jì)學(xué)的先驗(yàn)概率分布來(lái)自于過(guò)去的經(jīng)驗(yàn),這里之所以加上”過(guò)去的“三個(gè)字并且對(duì)其強(qiáng)調(diào),是想告訴大家先驗(yàn)分布只考慮已出現(xiàn)的樣本點(diǎn),不是所有的樣本點(diǎn)。并且可以由經(jīng)驗(yàn)而來(lái)不必做大量的重復(fù)實(shí)驗(yàn)。在這一點(diǎn)上克服了經(jīng)典統(tǒng)計(jì)學(xué)的一些局限性,使得我們的研究深入到那些不適宜或不能大量重復(fù)的隨機(jī)現(xiàn)象中來(lái)。當(dāng)然這也使先驗(yàn)分布帶有的主觀性色彩。關(guān)于這一點(diǎn)也是一個(gè)經(jīng)典統(tǒng)計(jì)學(xué)與貝葉斯統(tǒng)計(jì)學(xué)的一個(gè)爭(zhēng)議點(diǎn),有很多深入的問(wèn)題正在探討中。在這里我們就不討論了。若僅僅研究先驗(yàn)分布貝葉斯估計(jì)也就沒(méi)大意思了,與先驗(yàn)分布對(duì)應(yīng)的還有后驗(yàn)分布。我們先來(lái)看一下后驗(yàn)分布的定義,在樣本給定下的條件分布被稱為的后驗(yàn)分布。我們分析一下這句話,首先可以明白后驗(yàn)分布是一個(gè)條件分布,怎樣的條件分布呢,在樣本給定的條件下的條件分布,看來(lái)仍然是需要樣本,在貝葉斯統(tǒng)計(jì)中的樣本又是什么樣子的呢?從貝葉斯觀點(diǎn)看,樣本的產(chǎn)生主要分兩步。首先設(shè)想從先驗(yàn)分布產(chǎn)生一個(gè)樣本,這一步是“老天爺”做的,人們是看不見(jiàn)得,故用“設(shè)想”二字。第二步是從總體分布產(chǎn)生一個(gè)樣本,這個(gè)樣本是具體的,人們能看的到的,此時(shí)樣本發(fā)生的概率與如下聯(lián)合密度函數(shù)成正比這個(gè)聯(lián)合密度函數(shù)綜合了總體信息與樣本信息,常被稱為似然函數(shù),及為.由于是設(shè)想出來(lái)的,他仍然是未知的,它是按先驗(yàn)分布而產(chǎn)生的,要把先驗(yàn)分布進(jìn)行綜合,不能只考慮,而應(yīng)對(duì)的所有可能加以考慮。這樣一來(lái)就有了樣本與參數(shù)的聯(lián)合分布把先驗(yàn)信息,總體信息,樣本信息都綜合進(jìn)去了。我們?cè)谑羌问匠醯雀怕手幸呀?jīng)學(xué)過(guò)貝葉斯公式的事件形式根據(jù)貝葉斯公式我們也可把做如下分解這里是的邊緣分布函數(shù),與無(wú)關(guān),不含有的任何信息。在是離散型隨機(jī)變量時(shí),;在是連續(xù)型隨機(jī)變量時(shí),;這樣我們就可以得到條件分布就是給定樣本下,的條件分布了,也即的后驗(yàn)分布??梢哉f(shuō)后驗(yàn)分布是對(duì)先驗(yàn)分布的調(diào)整,它是集中了總體,樣本和先驗(yàn)等三種信息中有關(guān)的一切信息后的結(jié)果。為了更好的理解后驗(yàn)分布我們來(lái)看一個(gè)例子例1:為提高某產(chǎn)品的質(zhì)量,公司經(jīng)理考慮增加投資來(lái)改進(jìn)生產(chǎn)設(shè)備,預(yù)計(jì)需投資90萬(wàn)元,但從投資效果上看下屬兩個(gè)部門(mén)有兩種意見(jiàn)::改進(jìn)生產(chǎn)設(shè)備后,高質(zhì)量產(chǎn)品可占90%:改進(jìn)生產(chǎn)設(shè)備后,高質(zhì)量產(chǎn)品可占70%經(jīng)理當(dāng)然希望發(fā)生,但根據(jù)兩部門(mén)過(guò)去意見(jiàn)被采納的情況,經(jīng)理認(rèn)為40%第一個(gè)部門(mén)是可信度的,60%第二個(gè)部門(mén)是可信度,即隨機(jī)變量投資結(jié)果過(guò)的先驗(yàn)分布列為:;這是經(jīng)理的主管意見(jiàn),經(jīng)理不想僅用過(guò)去的經(jīng)驗(yàn)來(lái)決策此事,想慎重一些,通過(guò)小規(guī)模實(shí)驗(yàn),觀察其結(jié)果后再定。為此做了一項(xiàng)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果(記為A)如下:A:試制五個(gè)產(chǎn)品,全是高質(zhì)量產(chǎn)品。經(jīng)理很高興,希望通過(guò)這次結(jié)果來(lái)修正他原來(lái)對(duì)和的看法。下面我們分別來(lái)求一下和的后驗(yàn)概率。如今已有了和.還需要條件概率和,這可根據(jù)二項(xiàng)分布算的,;由全概率公式可算的最后由后驗(yàn)分布公式可求得:這表明,紀(jì)理根據(jù)實(shí)驗(yàn)A的信息調(diào)整了自己對(duì)投資結(jié)果的看法,把對(duì)和的信任度由0.4,和0.6分別調(diào)整到了0.7和0.3。后者綜合了經(jīng)理的主觀概率和實(shí)驗(yàn)結(jié)果而獲得,要比主觀概率更具有吸引力,更貼近當(dāng)前實(shí)際。當(dāng)然經(jīng)過(guò)實(shí)驗(yàn)A后經(jīng)理對(duì)投資改進(jìn)質(zhì)量的興趣更大了,但如果為了進(jìn)一步保險(xiǎn)起見(jiàn)可以把這次得到的后驗(yàn)分布列再一次作為先驗(yàn)分布在做實(shí)驗(yàn)驗(yàn)證,結(jié)果將更貼近實(shí)際。從上面這個(gè)例子中我們初步體驗(yàn)到了后驗(yàn)的求法,同時(shí)也能夠看到貝葉斯統(tǒng)計(jì)的實(shí)用性。貝葉斯統(tǒng)計(jì)應(yīng)用最做的是在決策方面,決策就是對(duì)一件事做出決定,它與統(tǒng)計(jì)推斷的區(qū)別在于是否涉及到后果。統(tǒng)計(jì)推斷依統(tǒng)計(jì)理論而進(jìn)行,很少考慮到推斷結(jié)果被使用時(shí)所帶來(lái)的利潤(rùn)或造成的損失,這在決策中恰恰是不能忽略的。度量利損得失的尺度就是收益函數(shù)與損失函數(shù),把收益函數(shù)和損失函數(shù)加入到貝葉斯推斷就形成了貝葉斯決策論。在這里首先明確幾個(gè)概念狀態(tài)集,其中表示自然界(或社會(huì))可能出現(xiàn)的一種狀態(tài),所有可能的狀態(tài)的集合組成狀態(tài)集。行動(dòng)集,其中每一個(gè)元素表示人對(duì)自然界可能采取的一個(gè)行動(dòng)。損失函數(shù),在一個(gè)決策問(wèn)題中假設(shè)狀態(tài)集為,行動(dòng)集為,定義在上的二元函數(shù)稱為損失函數(shù),假如它能表示在自然界(或社會(huì))處于狀態(tài),而人們采取行動(dòng)對(duì)人們引起的(經(jīng)濟(jì)的)損失。決策函數(shù):在給定的貝葉斯決策問(wèn)題中,從樣本空間到行動(dòng)集上的一個(gè)映射稱為該決策問(wèn)題的一個(gè)決策函數(shù)。狀態(tài)集,行動(dòng)集,損失函數(shù)是構(gòu)成一個(gè)決策問(wèn)題必不可少的三個(gè)要素。風(fēng)險(xiǎn)函數(shù):評(píng)價(jià)T的優(yōu)劣標(biāo)準(zhǔn)用平均損失,即稱為T(mén)在處的風(fēng)險(xiǎn)函數(shù)后驗(yàn)風(fēng)險(xiǎn):損失函數(shù)對(duì)后驗(yàn)分布的期望稱為后驗(yàn)風(fēng)險(xiǎn)決策空間:設(shè)隨機(jī)變量X的概率函數(shù)或概率密度函數(shù)為,其中未知。對(duì)參數(shù)采取的所有“行動(dòng)”(估計(jì))組成的集合稱為決策空間,記為A,在一般問(wèn)題中,A是實(shí)數(shù)集且可測(cè)。有了上面的基礎(chǔ),我們就可以討論貝葉斯估計(jì)量了,為了簡(jiǎn)便起見(jiàn),在這里假設(shè)X的分布和的分布均為連續(xù)型。貝葉斯估計(jì)的基本思想就是選擇一個(gè)估計(jì)值,使得平均損失最小,即使最小。我們知道,后驗(yàn)分布是對(duì)先驗(yàn)分布的調(diào)整,在獲得了一組樣本的觀測(cè)值之后,我們用的后驗(yàn)概

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論