概率論 樣本和抽樣分布_第1頁(yè)
概率論 樣本和抽樣分布_第2頁(yè)
概率論 樣本和抽樣分布_第3頁(yè)
概率論 樣本和抽樣分布_第4頁(yè)
概率論 樣本和抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩82頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Chapter6

樣本和抽樣分布

(SampleandStatisticDistribution

)引例一公司欲采購(gòu)某類產(chǎn)品,假設(shè)該類產(chǎn)品不合格率為P。P的大小決定產(chǎn)品的質(zhì)量,影響公司的經(jīng)濟(jì)效益。P的大小如何P大致落在哪個(gè)范圍

P是否滿足要求數(shù)理統(tǒng)計(jì)的方法

概率論

特點(diǎn):應(yīng)用面廣,分支較多.著名統(tǒng)計(jì)軟件:SAS,SPSS,STAT,S-plus等

數(shù)理統(tǒng)計(jì)

理論基礎(chǔ)實(shí)際應(yīng)用

數(shù)理統(tǒng)計(jì)的任務(wù)就是研究有效地收集、整理、分析所獲得的有限的資料,對(duì)所研究的問題,盡可能地作出精確而可靠的結(jié)論.

在數(shù)理統(tǒng)計(jì)中,不是對(duì)所研究的對(duì)象全體(稱為總體)進(jìn)行觀察,而是抽取其中的部分(稱為樣本)進(jìn)行觀察獲得數(shù)據(jù)(抽樣),并通過這些數(shù)據(jù)對(duì)總體進(jìn)行推斷.數(shù)理統(tǒng)計(jì)方法具有“部分推斷整體”的特征.

——

對(duì)隨機(jī)現(xiàn)象進(jìn)行觀測(cè)、試驗(yàn),以取得有代表性的觀測(cè)值

——

對(duì)已取得的觀測(cè)值進(jìn)行整理、分析,作出推斷、決策,從而找出所研究的對(duì)象的規(guī)律性數(shù)理統(tǒng)計(jì)的分類描述統(tǒng)計(jì)學(xué)推斷統(tǒng)計(jì)學(xué)參數(shù)估計(jì)(第七章)假設(shè)檢驗(yàn)(第八章)回歸分析(第九章)方差分析(第九章)

推斷統(tǒng)計(jì)學(xué)

§6.1隨機(jī)樣本

一個(gè)統(tǒng)計(jì)問題總有它明確的研究對(duì)象.1.總體…研究某批燈泡的質(zhì)量研究對(duì)象的全體稱為總體(母體),2.個(gè)體總體中每個(gè)成員稱為個(gè)體.總體一、總體和樣本

然而在統(tǒng)計(jì)研究中,人們關(guān)心總體僅僅是關(guān)心其每個(gè)個(gè)體的一項(xiàng)(或幾項(xiàng))數(shù)量指標(biāo).這時(shí),每個(gè)個(gè)體具有的數(shù)量指標(biāo)的全體就是總體.某批燈泡的壽命該批燈泡壽命的全體就是總體國(guó)產(chǎn)轎車每公里的耗油量國(guó)產(chǎn)轎車每公里耗油量的全體就是總體

例如:研究某批燈泡的壽命時(shí),關(guān)心的數(shù)量指標(biāo)就是壽命,那么,此總體就可以用隨機(jī)變量X表示,或用其分布函數(shù)F(x)表示.某批燈泡的壽命總體壽命X可用一概率分布來刻劃鑒于此,常用隨機(jī)變量的記號(hào)或用其分布函數(shù)表示總體.如說總體X或總體F(x).F(x)

類似地,在研究某地區(qū)中學(xué)生的營(yíng)養(yǎng)狀況時(shí),若關(guān)心的數(shù)量指標(biāo)是身高和體重,我們用X和Y分別表示身高和體重,那么此總體就可用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù)F(x,y)來表示.

統(tǒng)計(jì)中,總體這個(gè)概念的要旨是:總體就是一個(gè)概率分布.例2:用一把尺子測(cè)量一件物體的長(zhǎng)度。假定

n

次測(cè)量值分別為X1,X2,…,Xn。顯然,在該問題中,我們把測(cè)量值X1,X2,…,Xn看成樣本。但總體是什么呢?

事實(shí)上,這里沒有一個(gè)現(xiàn)實(shí)存在的個(gè)體的集合可以作為上述問題的總體??墒?,我們可以這樣考慮,既然

n

個(gè)測(cè)量值X1,X2,…,Xn是樣本,那么,總體就應(yīng)該理解為一切所有可能的測(cè)量值的全體。又如:為研究某種安眠藥的藥效,讓

n

個(gè)病人同時(shí)服用這種藥,記錄服藥者各自服藥后的睡眠時(shí)間比未服藥時(shí)增加睡眠的小時(shí)數(shù)

X1,X2,…,Xn,則這些數(shù)字就是樣本。

那么,什么是總體呢?

設(shè)想讓某個(gè)地區(qū)(或某國(guó)家,甚至全世界)所有患失眠癥的病人都服用此藥,則他們所增加睡眠的小時(shí)數(shù)之全體就是研究問題的總體。

對(duì)一個(gè)總體,如果用X表示其數(shù)量指標(biāo),那么,X的值對(duì)不同的個(gè)體就取不同的值。因此,如果我們隨機(jī)地抽取個(gè)體,則X的值也就隨著抽取個(gè)體的不同而不同。所以,X是一個(gè)隨機(jī)變量!

既然總體是隨機(jī)變量X,自然就有其概率分布。我們把X的分布稱為總體分布。

總體的特性是由總體分布來刻畫的。因此,常把總體和總體分布視為同義語。.總體分布

為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察試驗(yàn),以獲得有關(guān)總體的信息,這一抽取過程稱為“抽樣”,所抽取的部分個(gè)體稱為樣本.3.樣本從國(guó)產(chǎn)轎車中抽5輛進(jìn)行耗油量試驗(yàn)樣本容量為54.樣本容量

樣本中所包含的個(gè)體數(shù)目稱為樣本容量.

但是,一旦取定一組樣本,得到的是n個(gè)具體的數(shù)(X1,X2,…,Xn),稱為樣本的一次觀察值,簡(jiǎn)稱樣本值

.

樣本是隨機(jī)變量.抽到哪5輛是隨機(jī)的容量為n的樣本可以看作n維隨機(jī)變量.2.獨(dú)立性:

最常用的一種抽樣方法叫作“簡(jiǎn)單隨機(jī)抽樣”:1.隨機(jī)性:二、簡(jiǎn)單隨機(jī)樣本

由簡(jiǎn)單隨機(jī)抽樣得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,它可以用與總體獨(dú)立同分布的n個(gè)相互獨(dú)立的隨機(jī)變量X1,X2,…,Xn表示.

由簡(jiǎn)單隨機(jī)抽樣得到的樣本稱為簡(jiǎn)單隨機(jī)樣本,它可以用與總體獨(dú)立同分布的n個(gè)相互獨(dú)立的隨機(jī)變量X1,X2,…,Xn表示.

簡(jiǎn)單隨機(jī)樣本是應(yīng)用中最常見的情形,今后,當(dāng)說到“X1,X2,…,Xn是取自某總體的樣本”時(shí),若不特別說明,就指簡(jiǎn)單隨機(jī)樣本.若總體的分布函數(shù)為F(x),則其簡(jiǎn)單隨機(jī)樣本的聯(lián)合分布函數(shù)為F(x1)F(x2)…F(xn)設(shè)總體X

的分布函數(shù)為F(x),則樣本若總體X

的概率密度為

f(

x),則樣本的聯(lián)合d.f.為的聯(lián)合分布函數(shù)為三.總體、樣本、樣本值的關(guān)系總體(理論分布)?樣本

樣本值

統(tǒng)計(jì)是從手中已有的資料--樣本值,去推斷總體的情況---總體分布F(x)的性質(zhì).如我們從某班大學(xué)生中抽取10人測(cè)量身高,得到樣本值.小結(jié)研究對(duì)象的全體稱為總體總體中每個(gè)成員稱為個(gè)體抽樣分布

§6.2

由樣本值去推斷總體情況,需要對(duì)樣本值進(jìn)行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來.1.統(tǒng)計(jì)量

這種不含任何未知參數(shù)的樣本的函數(shù)稱為統(tǒng)計(jì)量.它是完全由樣本決定的量.一、統(tǒng)計(jì)量定義請(qǐng)注意:例

是未知參數(shù),若

,

已知,則為統(tǒng)計(jì)量是一樣本,是統(tǒng)計(jì)量,其中則但不是統(tǒng)計(jì)量.2.常用的統(tǒng)計(jì)量為樣本均值為樣本方差為樣本標(biāo)準(zhǔn)差設(shè)是來自總體

X

的容量為

n

的樣本,稱統(tǒng)計(jì)量它反映了總體均值的信息它反映了總體方差的信息為樣本的k階原點(diǎn)矩為樣本的k

階中心矩例如統(tǒng)計(jì)量的觀察值(樣本值)注樣本方差與樣本二階中心矩的不同故推導(dǎo)關(guān)系式1)推導(dǎo)

設(shè)則2)例1

從一批機(jī)器零件毛坯中隨機(jī)地抽取10件,測(cè)得其重量為(單位:公斤):

210,243,185,240,215,228,196,235,200,199求這組樣本值的均值、方差、二階原點(diǎn)矩與二階中心矩.解令例1則例2

在總體中,隨機(jī)抽取一個(gè)容量為36的樣本,求樣本均值落在50.8到53.8之間的概率.解故例2二、抽樣分布

統(tǒng)計(jì)量既然是依賴于樣本的,而后者又是隨機(jī)變量,故統(tǒng)計(jì)量也是隨機(jī)變量,因而就有一定的分布,這個(gè)分布叫做統(tǒng)計(jì)量的“抽樣分布”.

確定統(tǒng)計(jì)量的分布是數(shù)理統(tǒng)計(jì)的基本問題之一

正態(tài)總體是最常見的總體,本節(jié)介紹的幾個(gè)抽樣分布均對(duì)正態(tài)總體而言.復(fù)習(xí):

正態(tài)分布則特別地,則若i.i.d.~若~標(biāo)準(zhǔn)正態(tài)分布的

分位數(shù)分布的上

分位數(shù).若,則稱z

為標(biāo)準(zhǔn)正態(tài)定義正態(tài)分布的雙側(cè)

分位數(shù).若,則稱為標(biāo)準(zhǔn)統(tǒng)計(jì)三大分布記為分布1、定義:設(shè)相互獨(dú)立,都服從正態(tài)分布N(0,1),則稱隨機(jī)變量:

所服從的分布為自由度為

n

的分布.分布是由正態(tài)分布派生出來的一種分布.分布的密度函數(shù)為來定義.其中伽瑪函數(shù)通過積分n=2n=3n=5n=10n=15

例如

分布的性質(zhì)

20.05(10)?n=10性質(zhì)講解:

進(jìn)一步,由中心極限定理可以推出,n充分大時(shí),近似于標(biāo)準(zhǔn)正態(tài)分布N(0,1)。E(X)=n,D(X)=2n.t

分布

(Student分布)定義則稱T服從自由度為n

的T分布.其密度函數(shù)為X,Y相互獨(dú)立,設(shè)t

分布t分布的圖形(紅色的是標(biāo)準(zhǔn)正態(tài)分布)n=1n=20t分布的性質(zhì)1°fn(t)是偶函數(shù),2°T分布的上

分位數(shù)t

與雙側(cè)

分位數(shù)t/2

有表可查.性質(zhì)n=10t

-t

??

t

/2-t

/2??

/2

/2由定義可見,3、F分布~F(n2,n1)定義:

設(shè)U與V相互獨(dú)立,則稱隨機(jī)變量服從自由度為n1及n2的F分布,n1稱為第一自由度,n2稱為第二自由度,記作F~F(n1,n2).m=10,n=4m=10,n=10m=10,n=15m=4,n=10m=10,n=10m=15,n=10F分布的性質(zhì)例如事實(shí)上,故求F

(n,m)?

性質(zhì)例1

證明證例1四、幾個(gè)重要的抽樣分布定理

當(dāng)總體為正態(tài)分布時(shí),教材上給出了幾個(gè)重要的抽樣分布定理.

定理1(樣本均值的分布)設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,則有n取不同值時(shí)樣本均值的分布

定理2(樣本方差的分布)設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有n取不同值時(shí)的分布

定理3

設(shè)X1,X2,…,Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有

定理4(兩總體樣本均值差的分布)

分別是這兩個(gè)樣本的且X與Y獨(dú)立,X1,X2,…,是取自X的樣本,取自Y的樣本,分別是這兩個(gè)樣本的樣本方差,均值,則有Y1,Y2,…,是樣本

定理5(兩總體樣本方差比的分布)

分別是這兩個(gè)樣本的且X與Y獨(dú)立,X1,X2,…,是取自X的樣本,取自Y的樣本,分別是這兩個(gè)樣本的樣本方差,均值,則有Y1,Y2,…,是樣本●樣本均值分布函數(shù)的近似計(jì)算定理1的應(yīng)用總有●樣本均值與

的偏差在一定范圍內(nèi)的概率的近似計(jì)算從上式可以看出:對(duì)給定的

2和給定的c>0,當(dāng)樣本大小n

增大時(shí),上面的概率也隨之增大;n趨于無窮時(shí),上式趨近于1。任給c>0,總有的概率不小于90%,則樣本容量至少取多少?例3設(shè),為使樣本均值大于70解設(shè)樣本容量為

n

,則故令得即所以取例3例4

從正態(tài)總體中,抽取了

n=20的樣本(1)求(2)求解

(1)即例4故(P.386)(2)故例5

設(shè)r.v.X與Y相互獨(dú)立,X~N(0,16),

Y~N(0,9),X1,X2,…,X9

與Y1,Y2,…,Y16

分別是取自X與Y的簡(jiǎn)單隨機(jī)樣本,求統(tǒng)計(jì)量所服從的分布.解例5從而例7

設(shè)

是來自N(,2)的簡(jiǎn)單隨機(jī)樣本,

是樣本均值,則服從自由度為n-1的t分布的隨機(jī)變量為例7故應(yīng)選(B)解第二節(jié)樣本及抽樣分布統(tǒng)計(jì)三大抽樣分布幾個(gè)重要的抽樣分布定理課堂練習(xí)

幾個(gè)常見統(tǒng)計(jì)量樣本平均值它反映了總體均值的信息樣本方差它反映了總體方差的信息樣本標(biāo)準(zhǔn)差它反映了總體k階矩的信息樣本k階原點(diǎn)矩樣本k階中心矩

k=1,2,…它反映了總體k階中心矩的信息請(qǐng)注意:

二、統(tǒng)計(jì)三大抽樣分布記為分布1、定義:

設(shè)相互獨(dú)立,都服從正態(tài)分布N(0,1),則稱隨機(jī)變量:

所服從的分布為自由度為

n

的分布.分布是由正態(tài)分布派生出來的一種分布.

c2

分布請(qǐng)看演示1.

設(shè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論