概率論與數(shù)理統(tǒng)計第19講

上傳人：a*** IP屬地：湖北上傳時間：2023-02-06 格式：PPT 頁數(shù)：60 大?。?49.50KB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩55頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

7.4正態(tài)總體統(tǒng)計量的分布1經(jīng)常關(guān)心統(tǒng)計量的分布，主要是關(guān)心作為連續(xù)型隨機變量的統(tǒng)計量的分布，也就是概率密度，知道了分布，就可以計算統(tǒng)計量落在給定的區(qū)域的概率，可以進行進一步的研究。就本書的范圍而言，我們重點研究正態(tài)總體X~N(m,s2)的樣本的統(tǒng)計量的分布。

2下面都假設(shè)X1,X2,…,Xn是取自正態(tài)總體X~N(m,s2)的樣本。而研究的方向，是試圖將這n個相互獨立的隨機變量進行一些運算，來得到服從標(biāo)準(zhǔn)正態(tài)分布，c2分布，t分布，F(xiàn)分布的隨機變量，則可作為進一步推導(dǎo)的基礎(chǔ)。

3首先是要對樣本進行各種線性組合。設(shè)有不全為0的n個數(shù)k1,k2,…,kn分別乘上各個樣本相加得到一個新的隨機變量Y,

Y=k1X1+k2X2+…+knXn

則Y被稱為X1,X2,…,Xn的一個線性組合，也服從正態(tài)分布，而且其數(shù)學(xué)期望和方差都可以由總體的均值和方差算出來。因此，Y也就可以進一步做標(biāo)準(zhǔn)化的運算而得到Y(jié)*~N(0,1)。其中的n個數(shù)k1,k2,…,kn也稱之為線性組合的組合系數(shù)。4例如，樣本均值X就是樣本的一個線性組合，

其組合系數(shù)k1=k2=…=kn=1/n。因此可以知道

，將其標(biāo)準(zhǔn)化可得

5因為所有的樣本都相互獨立且服從N(m,s2),因此也都可以標(biāo)準(zhǔn)化成為標(biāo)準(zhǔn)正態(tài)分布的隨機變量，也就是說，令

6而大家知道n個自由度的c2分布的隨機變量可由n個相互獨立的服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量的平方和得到，因此由式(7.28)可知

7根據(jù)式(7.14)，上式還可以用總體偏差平方和寫成

8但是這種情況比較少用到，是因為實際應(yīng)用中，總體的期望m經(jīng)常是不知道的，在這種情況下出于無奈，就將式中的m換成樣本均值

X，從而要研究如式(7.17)所示的樣本偏差平方和W。

將W的表示式中的n個平方項在平方之前的隨機變量記為

9則雖然每一個Yi都是樣本的線性組合，服從正態(tài)分布，易知E(Yi)=0,(i=1,2,…,n)，但是Y1,Y2,…,Yn并不相互獨立，因此

也就無法變換成n個自由度的c2分布的隨機變量。

10以樣本容量n=3為例

X=(X1+X2+X3)/3

則

易證Y1,Y2,Y3不獨立。11但是后來統(tǒng)計學(xué)家們經(jīng)過艱苦努力有了一個令人驚喜的發(fā)現(xiàn)，就是用Y1,Y2,…,Yn線性組合出n-1個正態(tài)分布的隨機變量Z2,Z3,…,Zn，

Zm=km1Y1+km2Y2+…+kmnYn (m=2,…,n)(7.32)

則只要恰當(dāng)?shù)剡x擇上式中的各個組合系數(shù)kij,(i=2,3,…,n,j=1,2,…,n),居然就可以得使得Z2,Z3,…,Zn互不相關(guān)，也就是相互獨立，而且有Zi~N(0,s2),而且還恰好有也就是說，樣本偏差平方和永遠(yuǎn)都可以看作是n-1個相互獨立的服從N(0,s2)的隨機變量的平方和！而上面還故意留出了一個Z1沒有提，統(tǒng)計學(xué)家們還證明了，如果令Z1=X，則Z1和Z2,Z3,…,Zn也相互獨立！這些結(jié)論的證明因為要用到大量的線性代數(shù)知識，所以本書不證。但是上面的敘述可以描述為如下的定理。13定理7.1設(shè)X1,X2,…,Xn是取自總體X~N(m,s2)的樣本，則樣本偏差平方和W與樣本均值X相互獨立，且有

而大多數(shù)統(tǒng)計學(xué)教材通常不提樣本偏差平方和，而用(n-1)S2來表示它，因此上述定理也最經(jīng)常地描述為樣本方差S2與樣本均值X相互獨立，且有

14而現(xiàn)代統(tǒng)計學(xué)經(jīng)常就是以式(7.35)為基礎(chǔ)炮制或者拼湊出各種分布的統(tǒng)計量。

15例如，可以將n個樣本X1,X2,…,Xn分成前n1個和后n2個兩部分，其中n1+n2=n，即為第一部分，也可稱為樣本1，而為第二部分，也可稱為樣本2，這樣樣本1和樣本2都可以統(tǒng)計出自己的樣本均值和樣本方差，分別記為和，則根據(jù)式(7.35)就有16而樣本1和樣本2當(dāng)然是相互獨立的，因此上面兩個服從c2分布的隨機變量也相互獨立，則相加仍然服從c2分布，其自由度也是兩個隨機變量的自由度相加，即

這就又炮制出了一個自由度為n1+n2-2個自由度的c2分布的隨機變量。17這是指的c2分布的隨機變量相加。也可以考慮相除，因為服從F分布的隨機變量有結(jié)構(gòu)

，其中U,V是相互獨立的服從c2分布的

隨機變量，且U的自由度是n1,V的自由度是n2。

18因此利用這個F分布的構(gòu)成，利用式(7.36)的兩個相互獨立的服從c2分布的隨機變量，各自都除以自己的自由度后再相除，就可以得出結(jié)論19再例如，我們知道服從自由度為n的t分布的

隨機變量具有的結(jié)構(gòu)，即只要尋找

到一個服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量放在分子上，再找一個服從自由度為n的c2分布的隨機變量除以自己的自由度再開平方后放在分母上，就可以得到一個自由度為n的服從t分布的隨機變量。20因此我們可以將式(7.27)中的隨機變量

放在分子上，再將式(7.35)的隨

機變量除以自由度n-1再開平方即

放在分母上，就得

也就是說，你只要將式(7.27)左邊的分母上的總體的標(biāo)準(zhǔn)差s換成樣本標(biāo)準(zhǔn)差S，就得到服從n-1個自由度的t分布。22關(guān)于湊出t分布的隨機變量還有一種流行的辦法，就是將上面的分成n1和n2兩個樣本的情況，需要分別計算兩個樣本的樣本均值

,而也服從正態(tài)分布，均值是

0，方差卻是，因此

23這樣又可以為了拼湊服從t分布的隨機變量而將它放在分子上，而分母上就放由式(7.37)表示的n1+n2-2個自由度的服從c2分布的隨機變量除以n1+n2-2再開平方就行。具體式子這里就不寫了。24總之就是以式(7.35)為核心，使得統(tǒng)計學(xué)家們能夠興高采烈地炮制出各種各樣的服從t分布，c2分布，F(xiàn)分布的隨機變量。例如更為復(fù)雜的就是將樣本分成m個子樣本，m>2,那會搞出更加復(fù)雜的一系列統(tǒng)計量的。

25而現(xiàn)在再考慮一下，在經(jīng)歷了這些推導(dǎo)過程后，如果原來的正態(tài)總體突然變成不是正態(tài)總體，而是均值和方差都存在的任何隨機變量，甚至離散型隨機變量這樣的總體，導(dǎo)致所有的樣本也都是同樣的非正態(tài)分布的隨機變量的時候，情況將是怎樣的呢？

Zm=km1Y1+km2Y2+…+kmnYn (m=2,…,n)(7.32)

那就又要看為了推導(dǎo)出式(7.35)的第一步就是式(7.32)，要推導(dǎo)出Z2,Z3,…,Zn因為選取了適當(dāng)?shù)慕M合系數(shù)而變得不相關(guān)，但是要知道線性組合其實都是一些隨機變量相加啊！而且這些被相加的隨機變量的方差不太大也不太小，27

Zm=km1Y1+km2Y2+…+kmnYn (m=2,…,n)(7.32)

因此雖然Z2,Z3,…,Zn最終看都是樣本X1,X2,…,Xn的線性組合且X1,X2,…,Xn也都不服從正態(tài)分布了，甚至是離散型隨機變量，但是由于中心極限定理的作用Z2,Z3,…,Zn都將近似地服從正態(tài)分布，而且最后也是樣本的線性組合因此也近似服從正態(tài)分布了！這么一來它們相互之間的不相關(guān)就近似是相互獨立了！于是后續(xù)的一切結(jié)果也就都成立，28也就是說，當(dāng)總體為正態(tài)變量推導(dǎo)出來的服從一定自由度的c2分布t分布F分布的統(tǒng)計量，在總體變?yōu)榉钦龖B(tài)變量時，仍然能夠近似地還是服從同樣的相應(yīng)的自由度的c2分布t分布F分布的隨機變量！這樣本節(jié)的這些推導(dǎo)辦法就似乎是有萬能的作用了，是可以用在任意分布的隨機變量的總體上了。當(dāng)然，一個前提就是樣本容量必須足夠地多。但是話又說回來，如果樣本容量太少了，則攜帶的關(guān)于總體的信息量本來就不多，則本來就不會產(chǎn)生出什么好的效果的。297.5高概率區(qū)和低概率區(qū)30對于一給定的隨機變量X，設(shè)其概率密度函數(shù)為f(x)，則一般而言，如果X不是服從均勻分布以至于f(x)在一段區(qū)間或者區(qū)域內(nèi)都是一樣的情況，通常f(x)總是在某一些區(qū)間的取值較大，某一些區(qū)間取值較小。

f(x)xO31例如，假設(shè)X~N(0,1)，對X做一次試驗得到一個試驗結(jié)果數(shù)a，將這個數(shù)代入到標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)中，如果這個數(shù)是較為靠近0的數(shù)，例如，0.23，1.12等等，則試驗結(jié)果就落在概率密度函數(shù)的函數(shù)值較大的區(qū)域，我們會認(rèn)為試驗結(jié)果正常。而如果這個數(shù)很大或者很小，比如說，是3.45，或-5.5，等等，將這樣的數(shù)代入到概率密度函數(shù)中將得到很小的值，我們會認(rèn)為試驗結(jié)果不太正常。

3233因此產(chǎn)生出這樣一個概念，就是根據(jù)概率密度函數(shù)來將X取值的區(qū)間(如果X是一元隨機變量)或區(qū)域(如果X是多元隨機變量)分為兩部分，一部分是概率密度函數(shù)取值較大的部分，稱之為高概率區(qū)，另一部分是概率密度函數(shù)取值較小的部分，稱之為低概率區(qū)。

而之所以沒有寫成嚴(yán)格的數(shù)學(xué)定義形式，是因為概率密度函數(shù)值的高低是相對的，例如，方差較小的概率密度函數(shù)值有可能較大，而方差較大的概率密度函數(shù)值有可能較小。

但是這個想法是我們的出發(fā)點。

35尤其是，對于上一節(jié)討論過的服從正態(tài)分布t分布c2分布F分布這四大分布的概率密度函數(shù)，都有一個共性，就是它們都是單峰的，就是說概率密度函數(shù)都是有一個最高峰，向兩邊都是單調(diào)下降的，因此都是高概率區(qū)在中間，低概率區(qū)是在兩邊的。

36因此需要人為地規(guī)定一個低概率的數(shù)值，通常取值定為0.1,0.05,0.025,0.01,0.0001等非常低的概率值，在數(shù)理統(tǒng)計學(xué)中統(tǒng)一將這個數(shù)值用a表示，是希臘字母，通常念為阿爾法，這個低概率數(shù)值被稱作顯著性因子。

37通常還要將這個顯著性因子分為兩部分，就是高端的低概率值和低端的低概率值，一種較為常用的辦法就是一邊一半，高端的低概率值和低端的低概率值都是a/2，這被稱為對稱的高概率區(qū)劃分法，是最常用的。當(dāng)然也還有根據(jù)需要的其他劃分法。

因此相對應(yīng)于低概率的顯著性因子a，相當(dāng)于高概率的概率值1-a也有一個通用的術(shù)語，叫置信概率。

38上一節(jié)介紹了，在獲得總體的樣本之后，統(tǒng)計學(xué)家們可以根據(jù)需要拼湊出服從標(biāo)準(zhǔn)正態(tài)分布，t分布，c2分布，F(xiàn)分布的統(tǒng)計量，而這些統(tǒng)計量及相應(yīng)的觀測值，也都有一些標(biāo)準(zhǔn)的記號。

39如果一個統(tǒng)計量服從標(biāo)準(zhǔn)正態(tài)分布，則將它記為大寫字母U，而它的觀測值，則記為小寫字母u。而標(biāo)準(zhǔn)正態(tài)分布的上a分位點，記作ua，前面已經(jīng)講到過就是P{U>ua}=a。因此，按對稱的高概率區(qū)劃分法，也考慮到標(biāo)準(zhǔn)正態(tài)分布的對稱性，不難得出，顯著性因子為a的高概率區(qū)是

，當(dāng)然，它也可以稱為置信概率為1-a的高概率區(qū)。40aua/2-ua/241將服從t分布的統(tǒng)計量記作T,它的觀測值記為t，n個自由度的t分布的上a分位點記作ta(n),則按對稱的高概率區(qū)劃分法，同樣考慮到t分布的對稱性，顯著性因子為a的高概率區(qū)是

將服從c2分布的統(tǒng)計量還記作c2，甚至對應(yīng)的觀測值也記作c2,而n個自由度的c2分布的上a分位點記作，因此這里注意到記號的不要混淆，就是說，如果看到記號c2后面跟著分布二字，或者跟著一個圓括號里有自由度，這就代表c2分布，而孤零零的一個c2記號代表統(tǒng)計量或者統(tǒng)計量的觀測值，究竟是觀測量還是觀測值要根據(jù)敘述的上下文來定，而c2記號加一個下標(biāo)a，后面又跟著一個圓括號里面是自由度，這代表相應(yīng)自由度的c2分布的上a分位點。43將服從c2分布的統(tǒng)計量還記作c2，甚至對應(yīng)的觀測值也記作c2,而n個自由度的c2分布的上a分位點記作，用這樣的記號，根據(jù)對稱的高概率區(qū)劃分法，自由度為n，顯著性因子為a的高概率區(qū)是44對于服從F分布的統(tǒng)計量記作F,F的觀測值為f，第1,2自由度為n1,n2的F分布的上a分位點記作fa(n1,n2)。則根據(jù)對稱的高概率區(qū)劃分法，兩個自由度為n1,n2,顯著性因子為a的高概率區(qū)是

45練習(xí)：

已知X1,X2,X3相互獨立且服從標(biāo)準(zhǔn)正態(tài)分布,則

服從什么分布?練習(xí)：

已知X1

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

概率論與數(shù)理統(tǒng)計第19講

文檔簡介

溫馨提示

最新文檔

評論

概率論與數(shù)理統(tǒng)計第19講

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔