概率論與數(shù)理統(tǒng)計(jì)第19講_第1頁
概率論與數(shù)理統(tǒng)計(jì)第19講_第2頁
概率論與數(shù)理統(tǒng)計(jì)第19講_第3頁
概率論與數(shù)理統(tǒng)計(jì)第19講_第4頁
概率論與數(shù)理統(tǒng)計(jì)第19講_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、117.4 正態(tài)總體統(tǒng)計(jì)量的分布正態(tài)總體統(tǒng)計(jì)量的分布22經(jīng)常關(guān)心統(tǒng)計(jì)量的分布,主要是關(guān)心作為連續(xù)型隨機(jī)變量的統(tǒng)計(jì)量的分布,也就是概率密度,知道了分布,就可以計(jì)算統(tǒng)計(jì)量落在給定的區(qū)域的概率,可以進(jìn)行進(jìn)一步的研究。就本書的范圍而言,我們重點(diǎn)研究正態(tài)總體XN(m,s2)的樣本的統(tǒng)計(jì)量的分布。33下面都假設(shè)X1,X2,Xn是取自正態(tài)總體XN(m,s2)的樣本。而研究的方向,是試圖將這n個(gè)相互獨(dú)立的隨機(jī)變量進(jìn)行一些運(yùn)算,來得到服從標(biāo)準(zhǔn)正態(tài)分布,c2分布,t分布,F(xiàn)分布的隨機(jī)變量,則可作為進(jìn)一步推導(dǎo)的基礎(chǔ)。44首先是要對(duì)樣本進(jìn)行各種線性組合。設(shè)有不全為0的n個(gè)數(shù)k1,k2,kn分別乘上各個(gè)樣本相加得到一個(gè)

2、新的隨機(jī)變量Y,Y=k1X1+k2X2+knXn則Y被稱為X1,X2,Xn的一個(gè)線性組合線性組合,也服從正態(tài)分布,而且其數(shù)學(xué)期望和方差都可以由總體的均值和方差算出來。因此,Y也就可以進(jìn)一步做標(biāo)準(zhǔn)化的運(yùn)算而得到Y(jié)*N(0,1)。其中的n個(gè)數(shù)k1,k2,kn也稱之為線性組合的組合系數(shù)組合系數(shù)。55例如,樣本均值X 就是樣本的一個(gè)線性組合,其組合系數(shù)k1=k2=kn=1/n。因此可以知道 ,將其標(biāo)準(zhǔn)化可得2XNnsm,2()(0,1)(7.27)XXnNnmmss66因?yàn)樗械臉颖径枷嗷オ?dú)立且服從N(m,s2), 因此也都可以標(biāo)準(zhǔn)化成為標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量,也就是說,令(0,1)(1,2, )(7

3、.28)iiXYNinms77而大家知道n個(gè)自由度的c2分布的隨機(jī)變量可由n個(gè)相互獨(dú)立的服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量的平方和得到,因此由式(7.28)可知(0,1)(1,2, )(7.28)iiXYNinms222211()( )(7.29)nniiiiXYnmcs88根據(jù)式(7.14),上式還可以用總體偏差平方和寫成222211()( )(7.29)nniiiiXYnmcs22( )(7.30)Vncs99但是這種情況比較少用到,是因?yàn)閷?shí)際應(yīng)用中,總體的期望m經(jīng)常是不知道的,在這種情況下出于無奈,就將式中的m換成樣本均值X ,從而要研究如式(7.17)所示的樣本偏差平方和W。將W的表示式中的n

4、個(gè)平方項(xiàng)在平方之前的隨機(jī)變量記為222211()( )(7.29)nniiiiXYnmcs(1,2, )(7.31)iiYXXin21()niiWXX1010則雖然每一個(gè)Yi都是樣本的線性組合,服從正態(tài)分布,易知E(Yi)=0, (i=1,2,n),但是Y1,Y2,Yn并不相互獨(dú)立,因此也就無法變換成n個(gè)自由度的c2分布的隨機(jī)變量。(1,2, )(7.31)iiYXXin21niiWY1111以樣本容量n=3為例X=(X1+X2+X3)/3則易證Y1,Y2,Y3不獨(dú)立。123111123221333123211333211333211333XXXYXXXXXXYXXXYXXX12 但是后來統(tǒng)計(jì)

5、學(xué)家們經(jīng)過艱苦努力有了一個(gè)令人驚喜的發(fā)現(xiàn),就是用Y1,Y2,Yn線性組合出n1個(gè)正態(tài)分布的隨機(jī)變量Z2,Z3,Zn, Zm=km1Y1+km2Y2+kmnYn (m=2,n) (7.32)則只要恰當(dāng)?shù)剡x擇上式中的各個(gè)組合系數(shù)kij, (i=2,3,n, j=1,2,n), 居然就可以得使得Z2,Z3,Zn互不相關(guān),也就是相互獨(dú)立,而且有ZiN(0,s2), 而且還恰好有(1,2, )(7.31)iiYXXin22(7.33)niiWZ1313也就是說,樣本偏差平方和永遠(yuǎn)都可以看作是n1個(gè)相互獨(dú)立的服從N(0,s2)的隨機(jī)變量的平方和!而上面還故意留出了一個(gè)Z1沒有提,統(tǒng)計(jì)學(xué)家們還證明了,如果令

6、Z1=X ,則Z1和Z2,Z3,Zn也相互獨(dú)立!這些結(jié)論的證明因?yàn)橐玫酱罅康木€性代數(shù)知識(shí),所以本書不證。但是上面的敘述可以描述為如下的定理。22(7.33)niiWZ1414定理定理 7.1 設(shè)X1,X2,Xn是取自總體XN(m,s2)的樣本,則樣本偏差平方和W與樣本均值X 相互獨(dú)立,且有而大多數(shù)統(tǒng)計(jì)學(xué)教材通常不提樣本偏差平方和,而用(n1)S2來表示它,因此上述定理也最經(jīng)常地描述為樣本方差S2與樣本均值X 相互獨(dú)立,且有22(1)(7.34)Wncs222(1)(1)(7.35)nSncs1515而現(xiàn)代統(tǒng)計(jì)學(xué)經(jīng)常就是以式(7.35)為基礎(chǔ)炮制或者拼湊出各種分布的統(tǒng)計(jì)量。222(1)(1)(

7、7.35)nSncs1616例如,可以將n個(gè)樣本X1,X2,Xn分成前n1個(gè)和后n2個(gè)兩部分,其中n1+n2=n,即 為第一部分,也可稱為樣本1,而 為第二部分,也可稱為樣本2,這樣樣本1和樣本2都可以統(tǒng)計(jì)出自己的樣本均值和樣本方差,分別記為 和 ,則根據(jù)式(7.35)就有222(1)(1)(7.35)nSncs11,nXX11,nnXX12,X X2212,SS222211221222(1)(1)(1),(1) (7.36)nSnSnnccss1717而樣本1和樣本2當(dāng)然是相互獨(dú)立的,因此上面兩個(gè)服從c2分布的隨機(jī)變量也相互獨(dú)立,則相加仍然服從c2分布,其自由度也是兩個(gè)隨機(jī)變量的自由度相加,

8、即這就又炮制出了一個(gè)自由度為n1+n22個(gè)自由度的c2分布的隨機(jī)變量。222211221222(1)(1)(1),(1) (7.36)nSnSnnccss2221122122(1)(1)(2) (7.37)nSnSnncs1818這是指的c2分布的隨機(jī)變量相加。也可以考慮相除,因?yàn)榉腇分布的隨機(jī)變量有結(jié)構(gòu) ,其中U,V是相互獨(dú)立的服從c2分布的隨機(jī)變量,且U的自由度是n1, V的自由度是n2。222211221222(1)(1)(1),(1) (7.36)nSnSnnccss12/UnVn1919因此利用這個(gè)F分布的構(gòu)成,利用式(7.36)的兩個(gè)相互獨(dú)立的服從c2分布的隨機(jī)變量,各自都除以自

9、己的自由度后再相除,就可以得出結(jié)論222211221222(1)(1)(1),(1) (7.36)nSnSnnccss211222(1,1)(7.38)SF nnS2020再例如,我們知道服從自由度為n的t分布的隨機(jī)變量具有 的結(jié)構(gòu), 即只要尋找到一個(gè)服從標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)變量放在分子上,再找一個(gè)服從自由度為n的c2分布的隨機(jī)變量除以自己的自由度再開平方后放在分母上,就可以得到一個(gè)自由度為n的服從t分布的隨機(jī)變量。/XYn21因此我們可以將式(7.27)中的隨機(jī)變量 放在分子上,再將式(7.35)的隨機(jī)變量 除以自由度n1再開平方即 放在分母上,就得()Xnms22(1)nSs()() (1)

10、(7.39)XnXnt nSSmmssSs2222也就是說,你只要將式(7.27)左邊的分母上的總體的標(biāo)準(zhǔn)差s換成樣本標(biāo)準(zhǔn)差S,就得到服從n1個(gè)自由度的t分布。2()(0,1)(7.27)XXnNnmmss()() (1)(7.39)XnXnt nSSmmss2323關(guān)于湊出t分布的隨機(jī)變量還有一種流行的辦法,就是將上面的分成n1和n2兩個(gè)樣本的情況,需要分別計(jì)算兩個(gè)樣本的樣本均值 , 而 也服從正態(tài)分布,均值是0,方差卻是 ,因此12XX和12XX21211nns1212(0,1)(7.40)11XXNnns2424這樣又可以為了拼湊服從t分布的隨機(jī)變量而將它放在分子上,而分母上就放由式(7

11、.37)表示的n1+n22個(gè)自由度的服從c2分布的隨機(jī)變量除以n1+n22再開平方就行。具體式子這里就不寫了。1212(0,1)(7.40)11XXNnns2525總之就是以式(7.35)為核心,使得統(tǒng)計(jì)學(xué)家們能夠興高采烈地炮制出各種各樣的服從t分布,c2分布,F(xiàn)分布的隨機(jī)變量。例如更為復(fù)雜的就是將樣本分成m個(gè)子樣本,m2, 那會(huì)搞出更加復(fù)雜的一系列統(tǒng)計(jì)量的。222(1)(1)(7.35)nSncs2626而現(xiàn)在再考慮一下,在經(jīng)歷了這些推導(dǎo)過程后,如果原來的正態(tài)總體突然變成不是正態(tài)總體,而是均值和方差都存在的任何隨機(jī)變量,甚至離散型隨機(jī)變量這樣的總體,導(dǎo)致所有的樣本也都是同樣的非正態(tài)分布的隨機(jī)

12、變量的時(shí)候,情況將是怎樣的呢?2727 Zm=km1Y1+km2Y2+kmnYn (m=2,n) (7.32)那就又要看為了推導(dǎo)出式(7.35)的第一步就是式(7.32),要推導(dǎo)出Z2,Z3,Zn因?yàn)檫x取了適當(dāng)?shù)慕M合系數(shù)而變得不相關(guān),但是要知道線性組合其實(shí)都是一些隨機(jī)變量相加??!而且這些被相加的隨機(jī)變量的方差不太大也不太小,222(1)(1)(7.35)nSncs2828 Zm=km1Y1+km2Y2+kmnYn (m=2,n) (7.32)因此雖然Z2,Z3,Zn最終看都是樣本X1,X2,Xn的線性組合且X1,X2,Xn也都不服從正態(tài)分布了,甚至是離散型隨機(jī)變量,但是由于中心極限定理的作用Z

13、2,Z3,Zn都將近似地服從正態(tài)分布,而且最后 也是樣本的線性組合因此也近似服從正態(tài)分布了!這么一來它們相互之間的不相關(guān)就近似是相互獨(dú)立了!于是后續(xù)的一切結(jié)果也就都成立,222(1)(1)(7.35)nSncs1ZX2929也就是說,當(dāng)總體為正態(tài)變量推導(dǎo)出來的服從一定自由度的c2分布t分布F分布的統(tǒng)計(jì)量,在總體變?yōu)榉钦龖B(tài)變量時(shí),仍然能夠近似地還是服從同樣的相應(yīng)的自由度的c2分布t分布F分布的隨機(jī)變量!這樣本節(jié)的這些推導(dǎo)辦法就似乎是有萬能的作用了,是可以用在任意分布的隨機(jī)變量的總體上了。當(dāng)然,一個(gè)前提就是樣本容量必須足夠地多。但是話又說回來,如果樣本容量太少了,則攜帶的關(guān)于總體的信息量本來就不多

14、,則本來就不會(huì)產(chǎn)生出什么好的效果的。30307.5 高概率區(qū)和低概率區(qū)高概率區(qū)和低概率區(qū)3131對(duì)于一給定的隨機(jī)變量X,設(shè)其概率密度函數(shù)為f(x),則一般而言,如果X不是服從均勻分布以至于f(x)在一段區(qū)間或者區(qū)域內(nèi)都是一樣的情況,通常f(x)總是在某一些區(qū)間的取值較大,某一些區(qū)間取值較小。f(x)xO3232例如,假設(shè)XN(0,1),對(duì)X做一次試驗(yàn)得到一個(gè)試驗(yàn)結(jié)果數(shù)a,將這個(gè)數(shù)代入到標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)中,如果這個(gè)數(shù)是較為靠近0的數(shù),例如,0.23,1.12等等,則試驗(yàn)結(jié)果就落在概率密度函數(shù)的函數(shù)值較大的區(qū)域,我們會(huì)認(rèn)為試驗(yàn)結(jié)果正常。而如果這個(gè)數(shù)很大或者很小,比如說,是3.45,或5.

15、5,等等,將這樣的數(shù)代入到概率密度函數(shù)中將得到很小的值,我們會(huì)認(rèn)為試驗(yàn)結(jié)果不太正常。333334因此產(chǎn)生出這樣一個(gè)概念,就是根據(jù)概率密度函數(shù)來將X取值的區(qū)間(如果X是一元隨機(jī)變量)或區(qū)域(如果X是多元隨機(jī)變量)分為兩部分,一部分是概率密度函數(shù)取值較大的部分,稱之為高概率區(qū)高概率區(qū),另一部分是概率密度函數(shù)取值較小的部分,稱之為低概率區(qū)低概率區(qū)。3535而之所以沒有寫成嚴(yán)格的數(shù)學(xué)定義形式,是因?yàn)楦怕拭芏群瘮?shù)值的高低是相對(duì)的,例如,方差較小的概率密度函數(shù)值有可能較大,而方差較大的概率密度函數(shù)值有可能較小。但是這個(gè)想法是我們的出發(fā)點(diǎn)。3636尤其是,對(duì)于上一節(jié)討論過的服從正態(tài)分布t分布c2分布F分布這

16、四大分布的概率密度函數(shù),都有一個(gè)共性,就是它們都是單單峰峰的,就是說概率密度函數(shù)都是有一個(gè)最高峰,向兩邊都是單調(diào)下降的,因此都是高概率區(qū)在中間,低概率區(qū)是在兩邊的。3737因此需要人為地規(guī)定一個(gè)低概率的數(shù)值,通常取值定為0.1, 0.05, 0.025, 0.01, 0.0001等非常低的概率值,在數(shù)理統(tǒng)計(jì)學(xué)中統(tǒng)一將這個(gè)數(shù)值用a表示,是希臘字母,通常念為阿爾法,這個(gè)低概率數(shù)值被稱作顯著性因子顯著性因子。3838通常還要將這個(gè)顯著性因子分為兩部分,就是高端的低概率值和低端的低概率值,一種較為常用的辦法就是一邊一半,高端的低概率值和低端的低概率值都是a/2,這被稱為對(duì)稱的高概率區(qū)劃分法對(duì)稱的高概率

17、區(qū)劃分法,是最常用的。當(dāng)然也還有根據(jù)需要的其他劃分法。因此相對(duì)應(yīng)于低概率的顯著性因子a,相當(dāng)于高概率的概率值1a也有一個(gè)通用的術(shù)語,叫置信概率置信概率。3939上一節(jié)介紹了,在獲得總體的樣本之后,統(tǒng)計(jì)學(xué)家們可以根據(jù)需要拼湊出服從標(biāo)準(zhǔn)正態(tài)分布,t分布,c2分布,F(xiàn)分布的統(tǒng)計(jì)量,而這些統(tǒng)計(jì)量及相應(yīng)的觀測(cè)值,也都有一些標(biāo)準(zhǔn)的記號(hào)。4040如果一個(gè)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布,則將它記為大寫字母U, 而它的觀測(cè)值,則記為小寫字母u。而標(biāo)準(zhǔn)正態(tài)分布的上a分位點(diǎn),記作ua,前面已經(jīng)講到過就是PUua=a。因此,按對(duì)稱的高概率區(qū)劃分法,也考慮到標(biāo)準(zhǔn)正態(tài)分布的對(duì)稱性,不難得出,顯著性因子為a的高概率區(qū)是 ,當(dāng)然,它

18、也可以稱為置信概率為1a的高概率區(qū)。22(,)uuaa4141aua/2ua/242將服從t分布的統(tǒng)計(jì)量記作T, 它的觀測(cè)值記為t,n個(gè)自由度的t分布的上a分位點(diǎn)記作ta(n), 則按對(duì)稱的高概率區(qū)劃分法,同樣考慮到t分布的對(duì)稱性,顯著性因子為a的高概率區(qū)是 22( ),( )tn tnaa4343將服從c2分布的統(tǒng)計(jì)量還記作c2,甚至對(duì)應(yīng)的觀測(cè)值也記作c2, 而n個(gè)自由度的c2分布的上a分位點(diǎn)記作 ,因此這里注意到記號(hào)的不要混淆,就是說,如果看到記號(hào)c2后面跟著分布二字,或者跟著一個(gè)圓括號(hào)里有自由度,這就代表c2分布,而孤零零的一個(gè)c2記號(hào)代表統(tǒng)計(jì)量或者統(tǒng)計(jì)量的觀測(cè)值,究竟是觀測(cè)量還是觀測(cè)值

19、要根據(jù)敘述的上下文來定,而c2記號(hào)加一個(gè)下標(biāo)a,后面又跟著一個(gè)圓括號(hào)里面是自由度,這代表相應(yīng)自由度的c2分布的上a分位點(diǎn)。2( )nac4444將服從c2分布的統(tǒng)計(jì)量還記作c2,甚至對(duì)應(yīng)的觀測(cè)值也記作c2, 而n個(gè)自由度的c2分布的上a分位點(diǎn)記作 ,用這樣的記號(hào),根據(jù)對(duì)稱的高概率區(qū)劃分法,自由度為n,顯著性因子為a的高概率區(qū)是2( )nac1122221( ),( )nnaacc4545對(duì)于服從F分布的統(tǒng)計(jì)量記作F, F的觀測(cè)值為f,第1,2自由度為n1,n2的F分布的上a分位點(diǎn)記作fa(n1,n2)。則根據(jù)對(duì)稱的高概率區(qū)劃分法,兩個(gè)自由度為n1,n2, 顯著性因子為a的高概率區(qū)是 112212121(,),(,)fn nfn naa46練習(xí):已知X1,X2,X3相互獨(dú)立且服從標(biāo)準(zhǔn)正態(tài)分布, 則222123XXX服從什么分布?47練習(xí):已知X1,X2,X3相互獨(dú)立且服從標(biāo)準(zhǔn)正態(tài)分布, 則222123()?D XXX222123

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論