十五講樣本及抽分布_第1頁
十五講樣本及抽分布_第2頁
十五講樣本及抽分布_第3頁
十五講樣本及抽分布_第4頁
十五講樣本及抽分布_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1 / 1第六章樣本及抽樣分布概率論和數(shù)理統(tǒng)計都是研 究隨機現(xiàn)象統(tǒng)計規(guī)律性的學(xué)科, 但是它們在研究問題的方法上 乂有其自身的特點.在許多實際 問題中,要想全面地了解所研究 的對象的整體情況往往是不現(xiàn) 實的,只能通過試驗得到它的局 部信息,由于局部和整體是密切 相聯(lián)系的,還是可以利用這局部 信息來推斷整體特性的,這就是 數(shù)理統(tǒng)計方法的基本思想.第十五講樣本及抽樣分布數(shù)理統(tǒng)計討論問題的出發(fā)點是試驗數(shù) 據(jù),它的基本任務(wù)是研究如何對隨機現(xiàn)象進 行觀察或試驗以獲得具有代表性的局部數(shù) 據(jù),以及如何對收集到的局部數(shù)據(jù)進行整理、 分析,并對所研究的對象的整體特性做出盡 可能準確的推測和判斷.數(shù)理統(tǒng)計的內(nèi)容十分

2、豐富,大體上可分 為收集數(shù)據(jù)和統(tǒng)計推斷兩個方面:(1)收集數(shù)據(jù)研究如何對隨機現(xiàn)象進 行觀察或試驗,以便獲得能夠很好地反映整 體情況的局部數(shù)據(jù).其內(nèi)容包括抽樣技術(shù)、 試驗設(shè)計等.(2)統(tǒng)計推斷研究如何對收集到的局 部數(shù)據(jù)進行整理、分析,并對所考察的對象 的整體特性做出盡可能準確可信的推測和判 斷.其內(nèi)容包括參數(shù)估計、假設(shè)檢驗、方差 分析和回歸分析等.統(tǒng)計推斷是數(shù)理統(tǒng)計的 主體.統(tǒng)計推斷問題舉例:某公司要采購一批產(chǎn)品, 每件產(chǎn)品不是合格品就是不合格品,但該批 產(chǎn)品總有一個不合格品率P。由此,若從該 批產(chǎn)品中隨機抽取一件,用X表示該產(chǎn)品是 否合格,不難看出X服從(0-1),但分布中 的參數(shù)P是不知道

3、的。一些問題:(1)P的大小如何;(2) P大概落在什么范 圍內(nèi);(3)能否認為p滿足設(shè)定要求(如 p <0. 05)o1 .隨機樣本總體:試驗全部可能的觀察值(或研究對象的 全體);個體:每一個可能觀察值(或組成總體的每 一個元素);容量:總體中所包含的個體個數(shù);總體中的每一個個體是隨機試驗的一個 觀察值,可理解為它是某一隨機變量X的值, 研究所有個體的觀察值出現(xiàn)的概率,就是研 究隨機變量X的分布問題。因此,一個總體 對應(yīng)于一個隨機變量Xo對一個總體的研究 就是對一個隨機變量X的研究,X的分布函 數(shù)和數(shù)字特征就稱為總體的分布函數(shù)和數(shù)字 特征。今后將不區(qū)分總體與相應(yīng)的隨機變量, 籠統(tǒng)地稱

4、為總體Xo例如,假設(shè)一射擊手的射擊水平穩(wěn)定, 則射擊手的所有射擊成績(從前、現(xiàn)在和未 來)可稱為“總體”,而一次射擊的成績稱為 “個體”。顯然,一次射擊的成績好壞由射擊 手的射擊水平即射擊成績這一隨機變量的分 布決定,而射擊手成績的“總體”服從同一 隨機變量分布。在數(shù)理統(tǒng)計中,人們都是通過從總體中 抽取一部分個體,根據(jù)獲得的數(shù)據(jù)來對總體 的分布得出推斷的。被抽出的部分個體叫做 總體的一個樣本。樣本:從總體中抽取的部分個體; 樣品:樣本中的每個個體;§1隨機樣本當(dāng)總體的容量有限時,稱為 有限總體;否則,稱為無限總體.應(yīng)當(dāng)指出,樣本是具有二重 性的.一方面,抽樣前樣本中的 每個樣品的取值

5、都具有隨機性, 即每個樣品都是隨機變量;另一 方面,抽樣后樣本中的樣品都是 確定的數(shù)值.在理論研究中,我 們把樣本中的每個樣品都看作 隨機變量,總體X的一個容量為 n的樣本通常是用n個隨機變量 (X“X2,X”)來表示,進行一 次具體的抽樣之后得到n個確 定的數(shù)值(為,42,稱為樣本 的一個觀測值,簡稱為樣本值.一般,對有限總體,放回抽 樣所得到的樣本為簡單隨機樣 本,但使用不方便,常用不放回 抽樣代替.而代替的條件是樣本容量:一個樣本中所含樣品的個數(shù)。為對總體分布得出合理的推斷,人們常采用 簡單隨機樣本進行分析。簡單隨機樣本:設(shè)XI,X2,X”是來自總體 x的一個樣本,若,x相互獨立, 且X

6、”X,X”都與X有相同的概率分布, 則稱,X.為總體X的一個簡單隨 機樣本,簡稱樣本。也可以將樣本看稱是一個隨機向量,寫成 (XPX2, -,Xn)o由定義得,若(X,X2,X”)為具有分布函 數(shù)尸的總體X的一個樣本,則xpx2,% 相互獨立,且它們的分布函數(shù)都是尸,所以 (xx”,X”)的聯(lián)合分布函數(shù)為尸”(再,孫,/)=立尸(即乂若X具有概率密度了,則(XrX?,X”) 的概率密度為n/(再”2,一,匕)=1/區(qū))-J-12 .統(tǒng)計量樣本是進行統(tǒng)計推斷的依據(jù)。在應(yīng)用時,往 往不是直接使用樣本本身,而是針對不同的 問題構(gòu)造樣本的適當(dāng)函數(shù),利用這些函數(shù)進 行統(tǒng)計推斷??傮w、樣本、樣本觀察值的關(guān)

7、系:統(tǒng)計是從手中已有的資料一一 樣本觀察值,去推斷總體的情況一一 總體分布。樣本是聯(lián)系兩者的橋梁。 總體分布決定了樣本取值的概率規(guī) 律,也就是樣本取到樣本觀察值的規(guī) 律,因而可以用樣本觀察值去推斷總 體。§ 2抽樣分布因為X,X2,.”Xn都是隨機 變量,而統(tǒng)計量g(Xl,X2,,Xn) 是隨機變量的函數(shù),因此統(tǒng)計 量也是一個隨機變量.設(shè)Xi, X2, . . . , Xn是相應(yīng)于樣 本X,X2,,Xn的樣本值,則稱 g(xn x2,., xa)S g(X|,X2, .» Xn)的觀察值。定義:設(shè)Xhx2,,Xn是來自總體X的一個樣 本,g(Xl,X2,,Xn)是 Xi,X

8、2,.,Xn 的函數(shù),若 g中不含未知參數(shù),則稱g(X,X2,Xn)是一 統(tǒng)計量。特別注意:樣本方差與樣本二階 中心矩是不同的。常用的統(tǒng)計量:設(shè)(X1,X2,X”)是來自總體X的容量為的樣本,稱統(tǒng)計量1 (1)x = iyxf為樣本均值;(2) 52=-£卜-幻2為樣本方差;"1寸Z(X,M)2/-I= £(X/2X* + /)r-1= ±X-2X±Xi + ±X2r-1/-I1-= £x:-r-!=£xr-lS =一£(Xj-引 為樣本標準差;1 (3)4為樣本的k階(原點)矩;(4) Bkf(Xj -

9、田為樣本的k階中心 /-I矩。樣本方差的計算式:s'伐X;耳)-13=1)3.經(jīng)驗分布函數(shù)設(shè)(XX2,X“)是總體F的一個樣本 用S(x)表示X'X2,X.中不大于x的隨機變 量的個數(shù),-8<工<8,定義經(jīng)驗分布函數(shù) Fn(x)為7,(x) = S(x), -CO<X<00.n一般,設(shè)為,,覆是總體F的一個容量1/1為n的樣本值.先將3,與,當(dāng)按自小到大 的次序排列,并重新編號,設(shè)為則經(jīng)驗分布函數(shù)Fn(x)的觀察值為0, W平.n1,若,若X. “XV'%川, 若XN %!).例如(1)設(shè)總體F具有一個樣本值1,23則經(jīng)驗分布函數(shù)F3(x)的觀察

10、值為0,£21,若XV 1,若 1 < x < 2,若2 < x < 3, 若xN 3.設(shè)總體F具有一個樣本值1,12則經(jīng)驗分 布函數(shù)F3(X)的觀察值為0,若x < 1,F3(x)= < 若I<xv2,1,若x > 2. *對于經(jīng)驗分布函數(shù)Fn(X),格里汶科 (Glivenko)在1933年證明了以下的結(jié)果:對 于任一實數(shù)x,當(dāng) f 8時Fn(x)以概率1 一 致收斂于分布函數(shù)F(x),即數(shù)學(xué)上用Sup這個記號表示“上 確界”,即最小上界。Ps lim sup |Fn(x)-F(x)| = 0 = 1n-x-»<x&

11、lt;oc因此,對于任一實數(shù)x,當(dāng)n充分大時,經(jīng)驗 分布函數(shù)的任一個觀察值Fn(X)與總體分布 函數(shù)F(x)只有微小的差別,從而在實際上可 以當(dāng)作F(x)來使用.1/1樣本,則稱統(tǒng)計量/服從自由度為/-I(課間休息)4.統(tǒng)計中常用的三種分布統(tǒng)計量的分布稱為抽樣分布。數(shù)理統(tǒng)計 中常用到如下三個分布:/分布、t分布和F分布。(1)/分布 定義:設(shè)孫占,X”是來自總體N(O,1)的 n的尸分布,記為/ /()的概率密度函數(shù)為:n Xc、.H”x>0-0x«08" |其中:LZx,(:)=、垢 2/分布的性質(zhì): 1)若/2 4伽),則E(/) = ,D(x2) = 2/1,

12、事實上,因為X, N(O,1),則:£(Xz2) = D(XJ = 1,D(X:) = E(X;) E(X:)f=l x4e Lbc-1 = 3-1 = 2而Jri = 1,2,所以:e(/)= e(£x;)= £e(x;)= ;oa2) = o(tx:) = £o(x:) = 2 r-1j-12) /分布的可加性:設(shè)婷/(%),£/(/),且疔與淳相互獨立,貝IJ:+2)。3) X2(n)分布的上。分位數(shù)有表可查。4)當(dāng)n充分大時,近似地有/()x+ J2" -1)其中,%是標準正態(tài)分布的上。分位點。(2),分布定義:設(shè)x n(oj

13、), 丫/伽),且x與y相互獨立,則稱統(tǒng)計量:t = 2L所服從的有分布是自由度為的/分布,記為7 «),/ 、分布又稱為學(xué)生氏(Student)分布。/ ,分布的概率密度函數(shù)為:/i2:r(x, n)= :竽)(1 + 二)-竽一-oo<x<-hx)o,分布的特點(性質(zhì)):1) «X;)關(guān)于K=o對稱"(K")在x=0達最大值,/*;)的X軸為水平漸近線;2)若7«),則心 1 時,E(T) = O;n> 2時.,D(T)=/一;n-23) /(“)分布的上。分位數(shù)有表可查,且I4) limt(x,n) = ,-e 2 ;即->co時,,分3 而布fN(OJ), 一般地,當(dāng) >45時,分布與NQ1)非常接近,上a分位數(shù)可用正態(tài)分布近似。(3)尸分布定義:設(shè)乂/(?),y/(),且x與y相互獨立,則稱統(tǒng)計量產(chǎn)=衛(wèi)”服從自由 Y/n度為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論