第六章樣本與抽樣分布_第1頁
第六章樣本與抽樣分布_第2頁
第六章樣本與抽樣分布_第3頁
第六章樣本與抽樣分布_第4頁
第六章樣本與抽樣分布_第5頁
已閱讀5頁,還剩42頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第六章樣本與抽樣分布$.1數(shù)理統(tǒng)計的基本概念.數(shù)理統(tǒng)計研究的對象 例:有一批燈泡,要從使用壽命這個 數(shù)量指標來看其質(zhì)量,設(shè)壽命用X表 示。(1) 若規(guī)定壽命低于1000小時的產(chǎn)品 為次品。此問題是求P(X 1000)=F(10000),求 F(x)?(2) 從平均壽命、使用時數(shù)長短差異來看其質(zhì)量,即求E( x)?、D( x)?。要解決二個問題1.試驗設(shè)計抽樣方法。2.數(shù)據(jù)處理或統(tǒng)計推斷。方法具有“從局部推斷總體”的特點。二.總體(母體)和個體1.所研究對象的全體稱為總體,把組 成總體的每一個對象成員(基本單 元)稱為個體。說明:(1)對總體我們關(guān)心的是研究對象的 某一項或某幾項數(shù)量指標(或?qū)傩?/p>

2、 指標)以及他們在整體中的分布。所 以總體是個體的數(shù)量指標的全體。(2)為研究方便將總體與一個R.V X 對應(yīng)(等同)。a總體中不同的數(shù)量指標的全體, 即是R.V.X的全部取值。b. R.V X的分布即是總體的分布 情況。例:一批產(chǎn)品是100個燈泡,經(jīng)測試其壽命是:50個1000小時1100小時1200小時20個30個X100011001200P20/10030/10050/100(設(shè)X表示燈泡的壽命)可知R.V.X的 分布律,就是總體壽命的分布,反之亦然。常稱總體X,若R.VXF(X),有時 也用F( x)表示一個總體。(3)我們對每一個研究對象可能要觀 測兩個或多個數(shù)量指標,則可用多維 隨

3、機向量(X,Y,Z,)去描述總體。2總體的分類有限總體無限總體簡單隨機樣本.1定義61 :從總體中抽得的一部分 個體組成的集合稱為子樣(樣本) 取得的個體叫樣品,樣本中樣品的 個數(shù)稱為樣本容量(也叫樣本量) 每個樣品的測試值叫觀察值。取得子樣的過程叫抽樣。樣本的雙重含義:隨機性:用(X1, X2,Xn) n維隨機向量表 示。Xi表示第i個被抽到的個體,是隨機變量。(i=1,2,n)(2)確定性:(Xi,X2,Xn)表示n個實數(shù),即是每個樣品Xi觀測值Xi(i=1,2,n)。2定義6.2:設(shè)總體為X,若Xi,X2X n相互獨立且與 X同分布,則稱(X 1 ,X 2X n )為來自總體X的容量 為

4、n的簡單隨機樣本(簡稱樣本)。3已知總體的分布寫出子樣的分布 (1)已知總體 XF( X),則樣品XiF( Xi)i=1,2 n 樣本(X i ,X 2 X ”)的聯(lián)合分布為:F(Xi,X2Xn)=P(X、匚 X ,X/ X2X / Xn )=:P(X Xi)=:F( Xi)若總體Xf( X),樣品Xif( Xi) i=1,2n樣本(X 1 ,X 2X n )的聯(lián)合密度是:f( X 1, X 2Xn )= : f( Xi )例:總體XN(2),寫出該總體樣本(X 1 ,X 2X n)的聯(lián)合密度。(2) 若總體X是離散型隨機變量,一般 給出分布律:P(X= x k)= Pk.k=1,2要寫出概率

5、函數(shù) f( x )即f( x )=P(X= x k)= Pkki =1,2 .i = 1,2,., n例:總體X()寫出該總體樣本(Xl,X2,Xn)的聯(lián)合概率函數(shù)例:總體XB(1,p),0 p 1寫出其樣本(X1 ,X2,X)的聯(lián)合概率 函數(shù)。四經(jīng)驗分布函數(shù)與直方圖1.樣本的經(jīng)驗分布函數(shù)定義:設(shè)(X1, X2,Xn)是來自總體X的一組樣本值。將它們按由小到 大排序為:州沖州HiX廠X 2 X i X n對任意的實數(shù)X,定義函數(shù):Fn(x)=0X Xk= 1,2,.n 一 1k屮*Xk 蘭X卄n1xX則稱F n ( X )為總體X的經(jīng)驗分布函 數(shù)。(2)格列文科定理:設(shè)總體X的分布函數(shù)、經(jīng)驗分

6、布函數(shù) 分別為F( x)、Fn ( x),則有:P Lnim Sup|Fn”(x)- F(X)卜 0 =1上式表明,當,概率為1的有 F n(x)均勻地趨于F( x)。2總體的概率密度的估計-直方圖(第一版)p143 例 6.3可以用 SAS 下的 interactive data analysis模塊演示。五統(tǒng)計量與樣本的數(shù)字特征1定義6.3:設(shè)Xi,X2,xn是來自總 體X的容量為n的樣本,g(x 1, x2, xn)是定義在Rn或Rn子集上的普通 函數(shù)。如果g中不含有任何未知量, 則稱g(Xi,X2,X為統(tǒng)計量。2常用的統(tǒng)計量(樣本的數(shù)字特征)定義64:設(shè)Xi,X2,,X是來自總體X的樣

7、本,則稱為樣一 1 nXXin 1匚1n本均值S- Xn - 1 1為樣本方差1,2,3).為樣nM KX iK , Kn 本k階原點矩為樣本k階中心矩3重要性質(zhì)定理6.1:設(shè)總體X不論服從什么分 布,只要其二階矩存在,即E(X戶卩、D(X)= 6 2都存在,則:(1)E( X )=E(X)=卩(2)2CTD( X戶n D(X戶n(3)E(S2)=D(X)=重要恒等2X j XX:nX6.2抽樣分布統(tǒng)計量是樣本的函數(shù),它是一個隨機變量。統(tǒng)計量的分布稱為抽樣分布。一.三個重要分布(一)2分布1.定義6.5 :設(shè)Xi, X2,X n相互獨立,均服從N(0,1),則稱隨機變量2 2 2X1 X2.

8、Xn2分布,記為2(n)。:服從自由度為n2 n ,即:2.定理3.8:2(n)的概率密度為n_i 上2 -2(y,n)=0,其中(x)= ox T -tt e dt定理的說明見P146 頁。3.圖形.分布函數(shù)圖:data Kf;do x=0 to 30 by 0.1 ;y= PROBCHI(x, 8);output ;end ;run ;proc gplot data =kf;plot y*x= 1 ;symbol1 v=none i =join r =1 c=black;run;密度函數(shù)圖:n=1,5,15data kf;do y= 0 to 20 by 0.1 ;zO=(y*(-0.5

9、)*exp(-y/2)/(2* 0.5 * GAMMA( 0.5 )2)/(2*2 .5 * GAMMA(2 .5 )2)/(2*7.5* GAMMA(7.5);z1 = (y*(1.5 )*exp(-y/z2= (y*(6.5)*exp(-y/ output ;end ;run ;proc gplot data =kf;plot z0*y=1 z1*y= 1 z2*y= 1 /overlay ;symboll v=none i =join r =1 c=black;run;求概率:自由度為n=25, PX34.382的概率這樣求。data ;p=PROBCHI( 34.382, 25 );

10、put p=;run ;其它可類推。4.性質(zhì) 若2 2(n),則 E( 2 )=n ,D( 2)=2n 若2(nJ,x:2仇),且它們相互獨立,則2(m 壓)若X/2,Xn相互獨立,均服從N(卩,/),貝9n2x2 = -T (Xj )2 (n)a 1總體X服從參數(shù)為入的指數(shù)分 布;Xl,X2,Xn是來自該總體的樣本. 則:n_2( X i廠 2 n X 2 (2 ni(二).t分布定義6.6:設(shè)Xn(0,1),丫 2(n)且 它們相互獨立,則稱隨機變量 Tn= X陽/n服從自由度為n的t分布, 記為 t(n),即 Tn t(n)。定理3.9: Tn的概率密度為T(t, n)(1OC t45時

11、,t分布與N 0,1接近。(3)當 n2 時,(證略)E(T)=0, D(T)=(三)F分布定義 6.7 :設(shè) V2(m),W2(n),且它們相互獨立,則稱隨機變量F m ,nWn服從第一自由度為m第二自由度為n的F分布,記為F(m,n), 即Fm,n F(m,n)。定理3.10 : Fm,n為服從第一自由度為m,第二自由度為n的F分布的隨機變量,則其密度函數(shù)為11 “ m + n、r ()mm+n2“m“m、21-m、 2八()(y)2 (1y) 2y o m , n n nn(:)(;)n n nF (y,m,n)二2 20y 0圖形:給定m,n可畫出一個密度圖 形密度函數(shù)圖:data f

12、;%macro a(m,n,x);data a;0.01do y= 0 to 2 byF& x=(gamma(&m+&n)/2)*(&m/&n )*(&m/2)*y*(&m/2-1 )/(gamma(&m/2)*gamma(&n/ 2)*( 1 +(&m*y/&n)*(&m+&n)/2);output;end;data F;merge a f; |%me nd a;%a( 10 , 25 , 1);%a(10, 5,2);run ;proc gplot data =f;plot F1*y=1 F2 *y= 1 / overlay ;symbol1 v=none i =join r =1 c=b

13、lack;run;易推知:1若FF(m,n),則;F(n,m)若Xt (n),則X2F(1,n)練習:書上P151有證明。設(shè) xF(n1,n2),證明:1F(n2,n/|)且F(nnj-11 2 F (n2,n1)(注:xF(n,n2)表示x服從自由為 n和n2的F分布,F(xiàn)(片茲)表示F 分布的1-分位數(shù)。如:data;Q_F=FINV(0.95,12,9); put Q_F=;Q_F=FINV(1-0.95,12,9); put Q_F=;Ru n;二.常用概率分布的分位數(shù)定義6.8 : 設(shè)Xf (x),對于給定 的正數(shù)(Ov: A: 二 a f(x)dx =則稱A:為X的上側(cè):分位數(shù),簡稱

14、上 分位數(shù);若X服從某分布,稱A為 某分布的上:分位數(shù)。2 X 2(n)稱滿足PX2 x2(n)p的數(shù)x2(n)為自由度為n的2分布的上:分位數(shù)。查表P248 n 45時注意所以類的統(tǒng)計分析軟件不是這樣定義的,只有一個分位數(shù)(實際上 是下分位數(shù)的定義)書上P147-148頁,data ;q1= CINV(1- 0.005 ,10); put q1=;|q2=CINV(1- 0.01 ,10); put q2=;q3=CINV(1- .1 , 10); put q3=;q4=CINV(1- .1 ,25); put q4=; |run ;q仁25.188179572q2=23.209251159

15、q3=15.987179 仃2q4=34.381587018自由度為n=25, PX34.382的概率。data ;p=PROBCHI( 34.382, 25 ); put p=;run ;其它一些分布分位數(shù)求解如前幾章講過的,對于正態(tài)分布有結(jié)果:SAS的兩種計算公式:data ;p仁PR0BN0RM(1)-PR0BN0RM(-1);put p1=;p2= PROBNORM(2)-PROBNORM(-2);put p2=;p3= PROBNORM(3)-PROBNORM(-3);put p3=;run;p1=0.6826894921p2=0.9544997361p3=0.9973002039d

16、ata ;p1= 2*PROBNORM(1 )-1;putp仁;p2= 2*PROBNORM(2)-1;putp2=;p3= 2*PROBNORM(3)-1;putp3=;run ;p仁0.6826894921p2=0.9544997361p3=0.9973002039也可以驗證數(shù)據(jù),即以1為中心,需 要幾倍的標準差二距離所構(gòu)成的區(qū) 間,其區(qū)間內(nèi)的概率為上述所示。Data;q1二abs(probit(1- 0.6826894921)/ 2);putq1=;q2二abs(probit(1- 0.9544997361)/ 2);putq2=;q3=abs(probit(1- 0.997300203

17、9)/ 2);putq3=;run;q1=0.9999999999q2=2q3=2.9999999959dataq1=probit(1-(1- 0.6826894921)/ 2); putq1=;q2=probit(1-(1- 0.9544997361)/ 2); putq2=;q3=probit(1-(1- 0.9973002039)/ 2); putq3=;run;q仁0.9999999999 q2=2 q3=2.9999999959注意:為中心,概率為 90%,95%98% 99%勺區(qū)間,需要幾倍的標準差:距離。Data;q1二abs(probit( q2二abs(probit( q3=

18、abs(probit( q3=abs(probit(1- 0.9 )/ 2); put q1=;1- 0.95 )/ 2); put q2=;1-0.98 )/ 2); put q3=;1- 0.99 )/ 2); put q3=;run;q1= 1.644853627 q2=1.9599639845 q3=2.326347874 q3=2.5758293035比如,P:1.96 X 1.96=0.95等的結(jié)論也是常用的。幾乎都成常識 了。data ;q1=exp(-1.65 * 2/ 2)/sqrt( 2*( 3.1415926); put q1=;q2=PR0BN0RM(- 1.65 );

19、 put q2=;|aa=q1/q2; put aa=;run ;FINV(p,ndf,ddf) returns a quantile from the F distributionBETAINV(p,a,b)CINV(p,dfv, nc)SAS FUNCTIONS: Qua ntile Fu ncti onsreturns a qua ntile from the beta distributi on retur ns a qua ntile from the chi-squareddistributi onGAMINV(p,a)retur ns a qua ntile from the g

20、amma distributi onPROBIT(p)returns a quantile from the standard normal distributi onTINV(p,dfv, nc)returns a qua ntile from the t distributi on近似可證明:n很大V2x2 N ( 2n 1,1)P( 2x2 - 2 n - 1) u: =變成1=Px22(u 2 n 1)2=x2(n 廠】(u 2n1)2(2)T t(n)稱滿足PTt a (n)二 的數(shù)t a (n)為t(n)上:分位數(shù)。 查表:n45 時,T N (0,1), t a (n ) = U

21、 a。注意:Tt(n)的密度是偶函數(shù)。 稱滿足PT|1 (n)八正數(shù)以n)為2 2分布的雙側(cè):分位數(shù)。易知:以n)查表可得,且2I (n)二2t (n)同樣標準正態(tài)分布有例: n=20的t分布,求其0.1的上分位數(shù),有data ;q=TINV( 1 - 0.1 ,5); put q=; |q=TINV( 1-0.1 ,10); put q=;q=TINV( 1 - 0.1 , 20); put q=;q=TINV( 1 - 0.1 , 50); put q=;q=TINV( 1 - 0.1 , 100 ); put q=; |q=TINV( 1 - 0.1 ,2 00); put q=; |q

22、norm=(probit(1 - 0.1 ); put qnorm二;run ;q=1.4758840488q=1.3721836411q=1.325340707q=1.2987136942q=1.2900747613q=1.285798794qnorm=1.2815515655對于概率:我們看一下當n很大時, t(n)和標準正態(tài)分布的近似性。prob_t=PROBT(1.3, 5); put prob_t=;prob_t=PROBT(1.3, 10); put prob_t=;prob_t=PROBT(1.3, 20); put prob_t=;prob_t=PROBT(1.3, 50);

23、put prob_t=;prob_t=PROBT(1.3, 100); put prob_t=;prob_t=PROBT(1.3, 200); put prob_t=;Prob_n=PROBNORM(1.3);put Prob_n=;Run;(3) 若 FF(m ,n)稱滿足 PFFa (m,n)二的數(shù) Fa (m,n)為F分布的上:分位數(shù)。查表:表中有的可直接查表P250表中沒有的1F (m, n)二Fv: (n, m)二正態(tài)總體的X、S2的分布定理6.2 :(費歇(Fisher)定理) 設(shè)總體 XN(卩,(T 2),Xi,X2,Xn為來自總體X的樣本,其樣本均值和樣 本方差分別記為X和S2。則有(1) X與S相互獨立。(2)2XNC ,)n(n- 1)s2證明見書Pl50隹論1 :N (0,1)例 :總體 X N(0/ 2),問(1 Xi)2 與n 2:Xi - X是否獨立? 2又問(1x) + 1 Xi X服從什麼分 布?X -卩推論 2: 丁=”75-1)/vn定理6.3 :設(shè)有兩個總體: XNC2),其樣本為 Xl,X2,,X n,樣本均值X ,樣本方差2S1總體YNC2, 2),其樣本為 丫1,丫2 丫巾,樣本均值為Y,樣本方差 為s2,且兩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論