第六章樣本及抽樣分布_第1頁
第六章樣本及抽樣分布_第2頁
第六章樣本及抽樣分布_第3頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第六章 樣本及抽樣分布授課對象】理工類本科二年級授課時數(shù)】4 學(xué)時授課方法】課堂講授與提問相結(jié)合基本要求】1、理解總體、個體和樣本的概念;2、了解經(jīng)驗分布函數(shù)和直方圖的作法,知道格林汶科定理;3、理解樣本均值、樣本方差和樣本矩的概念并會計算;4、理解統(tǒng)計量的概念,掌握幾種常用統(tǒng)計量的分布及其結(jié)論;5、理解分位數(shù)的概念,會計算幾種重要分布的分位數(shù)?!颈菊轮攸c】 樣本均值、樣本方差和樣本矩的計算; 抽樣分布 2分 布, t 分布,F(xiàn) 分布;分位數(shù)的理解和計算?!颈菊码y點】 對樣本、統(tǒng)計量及分位數(shù)概念的理解;樣本矩的計算。【授課內(nèi)容及學(xué)時分配】§ 6.0 前 言 前面五章我們研究了概率論的

2、基本內(nèi)容,從中得知:概率論是研究隨機(jī)現(xiàn)象統(tǒng)計規(guī)律性的一門數(shù)學(xué)分支。它是從一個數(shù)學(xué)模型出發(fā)(比如隨機(jī) 變量的分布)去研究它的性質(zhì)和統(tǒng)計規(guī)律性;而我們下面將要研究的數(shù)理 統(tǒng)計,也是研究大量隨機(jī)現(xiàn)象的統(tǒng)計規(guī)律性,并且是應(yīng)用十分廣泛的一門 數(shù)學(xué)分支。所不同的是數(shù)理統(tǒng)計是以概率論為理論基礎(chǔ),利用觀測隨機(jī)現(xiàn) 象所得到的數(shù)據(jù)來選擇、 構(gòu)造數(shù)學(xué)模型 (即研究隨機(jī)現(xiàn)象) 。其研究方法是 歸納法(部分到整體) 。對研究對象的客觀規(guī)律性做出種種合理性的估計、 判斷和預(yù)測,為決策者和決策行動提供理論依據(jù)和建議。數(shù)理統(tǒng)計的內(nèi)容 很豐富,這里我們主要介紹數(shù)理統(tǒng)計的基本概念,重點研究參數(shù)估計和假 設(shè)檢驗。§ 6.

3、1 隨機(jī)樣本一、總體與樣本1. 總體、個體 在數(shù)理統(tǒng)計學(xué)中,我們把所研究的全部元素組成的集合稱為總體;而 把組成總體的每個元素稱為個體。例如: 在研究某批燈泡的平均壽命時, 該批燈泡的全體就組成了總體, 而其中每個燈泡就是個體;在研究我校男大學(xué)生的身高和體重的分布情況時,該校的全體男大學(xué)生組成了總體,而每個男大學(xué)生就是個體。但對于具體問題,由于我們關(guān)心的不是每個個體的種種具體特性,而 僅僅是它的某一項或幾項數(shù)量指標(biāo) X ( 可以是向量 ) 和該數(shù)量指標(biāo) X 在總體 的分布情況。 在上述例子中 X 是表示燈泡的壽命或男大學(xué)生的身高和體重。 在試驗中,抽取了若干個個體就觀察到了 X 的這樣或那樣的

4、數(shù)值,因而這 個數(shù)量指標(biāo) X 是一個隨機(jī)變量(或向量) ,而 X 的分布就完全描寫了總體中 我們所關(guān)心的那個數(shù)量指標(biāo)的分布狀況。由于我們關(guān)心的正是這個數(shù)量指 標(biāo),因此我們以后就把總體和 數(shù)量指標(biāo) X 可能取值的全體組成的集合 等同 起來。定義 1:把研究對象的全體(通常為數(shù)量指標(biāo) X 可能取值的全體組成 的集合)稱為總體;總體中的每個元素稱為個體。我們對總體的研究,就是對相應(yīng)的隨機(jī)變量 X 的分布的研究,所謂總 體的分布也就是數(shù)量指標(biāo) X 的分布,因此, X 的分布函數(shù)和數(shù)字特征分別 稱為總體的分布函數(shù)和數(shù)字特征。今后將不區(qū)分總體與相應(yīng)的隨機(jī)變量, 籠統(tǒng)稱為總體 X 。根據(jù)總體中所包括個體的總

5、數(shù),將總體分為:有限總體 和無限總體。例1:考察一塊試驗田中小麥穗的重量:乂=所有小麥穗重量的全體(無限總體);個體每個麥穗重X對應(yīng)的分布:F(x) P重量 X的麥穗數(shù)總麥穗數(shù)彳(t )21X廠 e 2 dt N(2i2)0 x例2:考察一位射手的射擊情況:X =此射手反復(fù)地?zé)o限次射下去所有射擊結(jié)果全體;每次射擊結(jié)果都是一個個體(對應(yīng)于靶上的一點)個體數(shù)量化x1射中0未中1在總體中的比例p為命中率0在總體中的比例1 p為非命中率總體X由無數(shù)個0,1構(gòu)成,其分布為兩點分布B(1, p)PX 1 p, PX 01 p2.樣本與樣本空間為了對總體的分布進(jìn)行各種研究,就必需對總體進(jìn)行抽樣觀察。抽樣從總

6、體中按照一定的規(guī)則抽出一部分個體的行動。般地,我們都是從總體中抽取一部分個體進(jìn)行觀察,然后根據(jù)觀察所得數(shù)據(jù)來推斷總體的性質(zhì)。按照一定規(guī)則從總體 X 中抽取的一組個體 (X1,X2, ,X n )稱為總體的一個樣本,顯然,樣本為一隨機(jī)向量。為了能更多更好的得到總體的信息,需要進(jìn)行多次重復(fù)、獨立的抽樣 觀察(一般進(jìn)行 n 次),若對抽樣要求 代表性 :每個個體被抽到的機(jī)會一 樣,保證了 Xi,X2, ,Xn的分布相同,與總體一樣。獨立性:Xi,X2, ,Xn相 互獨立。那么,符合“代表性”和“獨立性”要求的樣本(Xi,X2,,Xn)稱為簡單隨機(jī)樣本。易知,對有限總體而言,有放回的隨機(jī)樣本為簡單隨機(jī)

7、樣 本,無放回的抽樣不能保證 Xi,X2, ,Xn的獨立性;但對無限總體而言,無 放回隨機(jī)抽樣也得到簡單隨機(jī)樣本,我們本書則主要研究 簡單隨機(jī)樣本 。對每一次觀察都得到一組數(shù)據(jù)(Xi,X2, ,Xn),由于抽樣是隨機(jī)的,所以觀察值(Xi,X2, ,Xn )也是隨機(jī)的。為此,給出如下定義:定義2:設(shè)總體X的分布函數(shù)為F(x),若Xi,X2, ,Xn是具有同一分布函 數(shù)F(x)的相互獨立的隨機(jī)變量,則稱(Xi,X2, ,Xn)為從總體X中得到的容 量為n的簡單隨機(jī)樣本,簡稱樣本。把它們的觀察值(Xi,X2, ,Xn )稱為樣 本值定義3:把樣本(XiX,Xn)的所有可能取值構(gòu)成的集合稱為樣本空間,

8、顯然一個樣本值(Xi, X2, ,Xn)是樣本空間的一個點。二、樣本的分布:設(shè)總體X的分布函數(shù)為F(x),( Xi,X2, ,Xn )是X的一個樣本,則其聯(lián) n合分布函數(shù)為:F*(Xi,X2,,Xn)=F(Xi)。i 1例3:設(shè)總體XB(1,p), (Xi,X2, Xn)為其一個簡單隨機(jī)樣本,則樣本空間(Xi,X2,,Xn)Xi0,1 ; i 1,2,n,因為 PX XpX(1p)1 X,x 0,1所以樣本的聯(lián)合分布列為:P X1 X1,X2X2,L ,Xn XnPM1X1 P X 2PX.&pX1(1 p)1 X1 .pX2(1p)1 X2 pXn(1p)1 Xn Xi 0,1i 1

9、,2,n§ 6.2分布函數(shù)與概率密度函數(shù)的近似解在概率論中,我們介紹了幾種常用的分布函數(shù)以及它們的性質(zhì),當(dāng)時 我們總假定它們都是先給定的,而在實際中,所遇到的用于描述隨機(jī)現(xiàn)象 的隨機(jī)變量,事先并不知道其分布函數(shù),甚至連其分布類型也一無所知,那么,怎么樣才能確定它的分布函數(shù)F(x)呢?一般地,利用樣本及樣本值,建立一定的概率模型,用由此獲得的概率統(tǒng)計信息來對總體X的F(x)進(jìn)行估計和推斷,這就是:一、經(jīng)驗分布函數(shù)1.定義:設(shè)(Xi,X2, ,Xn)是來自總體X的樣本,用S(x)表示:x R,Xi,X2,L ,Xn中不大于x的隨機(jī)變量的個數(shù),定義經(jīng)驗分布函數(shù)為1Fn(x) S(x) x

10、R。n設(shè)(X1,X2, ,Xn)是樣本的一個觀察值,令這n個數(shù)值由小到大的順序排列后為:X; < x2< X; << X;,對 x R由定義很容易得到經(jīng)驗分布函數(shù)的觀察值:*0X X;kFn (x)xk x xk ; k 1,2, n 1n*1X Xn通常也稱Fn*(X)是總體X的經(jīng)驗分布函數(shù),在不至于混淆的情況下統(tǒng)一用Fn(x)來表示總體X的經(jīng)驗分布函數(shù)。顯然,F(xiàn)n(x)是單調(diào)非降右連續(xù)的跳躍函數(shù)(階梯函數(shù)),在點X xk處有間斷,在每個間斷點的躍度為丄,(k = 1, 2, 3,,n)且0 Fn(x) 1 ,nlim Fn(x) =0, lim Fn(x) = 1,

11、它滿足分布函數(shù)的三個性質(zhì),所以必是一個分布xx函數(shù)。一般地,隨著n的增大,F(xiàn)n(x)越來越接近X的分布函數(shù)F(x),關(guān)于這一 點,格列汶科(Glivenko )在1953年給了理論上的論證,即:2.定理1( Glivenko-Th ):若總體X的分布函數(shù)為f(x),經(jīng)驗分布函數(shù)為 Fn(x),則對x R,有:P lim( sup | Fn(x) F(x) |) 0 1nxFn(x) 一致 F(x)定理表明,F(xiàn)n(x)以概率1 一致收斂于F(x), 即:可以用Fn(x)來近似F(x),這也是利用樣本來估計和判斷總體的基本理論和依據(jù)。例4:某廠從一批熒光燈中抽出10個,測其壽命的數(shù)據(jù)(單位千時)如

12、下:95.5,18.1,13.1, 26.5, 31.7, 33.8, 8.7, 15.0,48.8,48.3求該批熒光燈壽命的經(jīng)驗分布函數(shù)Fn(x)(觀察值)。解:將數(shù)據(jù)由小到大排列得:8.7 , 13.1 , 15.0 , 18.1 , 26.5, 31.7 , 33.8 , 48.8 , 49.3 , 95.5 ,則經(jīng)驗分布函數(shù)為:0X8.70.18.7X13.10.213.1X15.00.315.0X18.10.418.1X26.5Fn(X)0.526.5X31.70.631 .7X33.80.733.8X48.80.848.8X49.30.949.3X95.51X95.5二、利用直方

13、圖求密度函數(shù)的近似解:設(shè)(X1,X2, ,Xn)為來自總體X的一個樣本,其樣本觀察值為 (X1,X2, ,Xn),將該組數(shù)值X1,X2, ,Xn分成I組,可作分點:玄。®©,問(各組 距可以不相等),則各組為:仏,3!,( a-a? , , ( ai 1, ai ,若樣本觀 察值中每個數(shù)值落在各組中的頻數(shù)分別為 m1 , m2, m3,mi,則頻率分 別為:匹,匹旦;以各組為底邊,以相應(yīng)組的頻率除以組距為高,n nn建立I個小矩形,即得總體X的直方圖。由上分析可知:直方圖中每一矩形的面積等于相應(yīng)組的頻率設(shè)總體X的密度函數(shù)為f(x),貝y:總體X (真實值)落在第k組(aki

14、 ,ak的概率為:akf (x) dx。ak 1由Bernoulli大數(shù)定理可知:當(dāng)n很大時,樣本觀察值(單個)落在該區(qū)間的頻率趨近于此概率;即:(aki,ak上矩形的面積接近于f(x)在此區(qū)間上曲邊梯形的面積,當(dāng) n無限增大時,分組組距越來越小,直方圖就 越接近總體X的密度函數(shù)f(x)的圖象。(這與定積分的意義具有同樣的道 理)。§ 6.3 樣本的數(shù)字特征由第三章節(jié)知:隨機(jī)變量的數(shù)字特征,能夠反映隨機(jī)事件的某些重要 的概率特征,從第一節(jié)可知,樣本也是一組隨機(jī)變量(隨機(jī)向量) ,為了詳 細(xì)刻劃樣本觀察值中所包含總體 X的信息及樣本值的分布情況,下面我們 研究樣本的數(shù)字特征。一、樣本均

15、值與樣本方差 (隨機(jī)變量)n定義1,設(shè)(Xi,X2, ,Xn)是來自總體X的一個樣本,稱X - Xi為 n i i樣本均值。1EQ2 22nX nX )nn2 I2 I22S(Xi X) (Xi 2XXi X )n 1 i 1n 1 i 1nX 2)為樣本方差。n1(Xi X)2為樣本標(biāo)準(zhǔn)差。n 1 i i征。樣本均值與樣本方差分別刻劃了 樣本的位置特征及樣本的分散性特二、矩1.總體矩(數(shù)值)設(shè)總體X的分布函數(shù)為F(x),則稱mk E(Xk)(假設(shè)它存在)為總體X的k階原點矩;稱k E(X E(X)k為總體X的k階中心矩。把總體的各階中心矩和原點矩統(tǒng)稱為總體矩表示 總體X的數(shù)字特征。特別地:m1 = E(X) ;2 D(x)是總體X的期望和方差。仿此,下面給出樣本矩的定義:2.樣本矩(r.v)定義2:設(shè)(X1,X2, ,Xn)是來自總體X的一個樣本,則稱nAk - Xik , k=1, 2, 3 ;為樣本的k階原點矩(隨機(jī)變量)n i -nBk - (Xi X)k, k=1, 2, 3;為樣本值的k階中心矩(隨機(jī)變量)。n i -特別地,A X,但b2與Sbk一 (X X)k ; k=1 , 2, 3卻不同

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論