第5章-樣本及其分布(數(shù)應(yīng))_第1頁
第5章-樣本及其分布(數(shù)應(yīng))_第2頁
第5章-樣本及其分布(數(shù)應(yīng))_第3頁
第5章-樣本及其分布(數(shù)應(yīng))_第4頁
第5章-樣本及其分布(數(shù)應(yīng))_第5頁
已閱讀5頁,還剩52頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五章樣本及其分布機動目錄上頁下頁返回結(jié)束第五章樣本及其分布簡單隨機樣本抽樣分布

5.1簡單隨機樣本研究某批燈泡的質(zhì)量一個統(tǒng)計問題總有它明確的研究對象.研究對象的全體稱為總體(母體),總體中每個成員稱為個體.總體與個體機動目錄上頁下頁返回結(jié)束…總體然而在統(tǒng)計研究中,人們關(guān)心總體僅僅是關(guān)心其每個個體的一項(或幾項)數(shù)量指標和該數(shù)量指標在總體中的分布情況.這時,每個個體具有的數(shù)量指標的全體就是總體.某批燈泡的壽命該批燈泡壽命的全體就是總體國產(chǎn)轎車每公里的耗油量國產(chǎn)轎車每公里耗油量的全體就是總體機動目錄上頁下頁返回結(jié)束由于每個個體的出現(xiàn)是隨機的,所以相應(yīng)的數(shù)量指標的出現(xiàn)也帶有隨機性.從而可以把這種數(shù)量指標看作一個隨機變量,因此隨機變量的分布就是該數(shù)量指標在總體中的分布.這樣,總體就可以用一個隨機變量及其分布來描述.

若用表示總體的個指標,它是一個維隨機變量,其分布函數(shù)是,則稱該總體為具有分布函數(shù)的總體.機動目錄上頁下頁返回結(jié)束

而概率分布正是刻劃這種集體性質(zhì)的適當工具.因此在理論上可以把總體與概率分布等同起來.

從另一方面看,統(tǒng)計的任務(wù),

是根據(jù)從總體中抽取的樣本,去推斷總體的性質(zhì).

由于我們關(guān)心的是總體中的個體的某項指標(如人的身高、體重,燈泡的壽命,汽車的耗油量…),所謂總體的性質(zhì),無非就是這些指標值的集體的性質(zhì).機動目錄上頁下頁返回結(jié)束

例如:

研究某批燈泡的壽命時,關(guān)心的數(shù)量指標就是壽命,那么,此總體就可以用隨機變量X表示,或用其分布函數(shù)F(x)表示.某批燈泡的壽命總體壽命X可用一概率分布來刻劃

鑒于此,常用隨機變量的記號或用其分布函數(shù)表示總體.如說總體X或總體F(x).F(x)機動目錄上頁下頁返回結(jié)束

類似地,在研究某地區(qū)中學(xué)生的營養(yǎng)狀況時,若關(guān)心的數(shù)量指標是身高和體重,我們用X和Y分別表示身高和體重,那么此總體就可用二維隨機變量(X,

Y)或其聯(lián)合分布函數(shù)F(x,

y)來表示.

統(tǒng)計中,總體這個概念的要旨是:

總體就是一個概率分布.機動目錄上頁下頁返回結(jié)束為推斷總體分布及各種特征,按一定規(guī)則從總體中抽取若干個體進行觀察試驗,以獲得有關(guān)總體的信息,這一抽取過程稱為“抽樣”,所抽取的部分個體稱為樣本.

樣本中所包含的個體數(shù)目稱為樣本容量.樣本從國產(chǎn)轎車中抽5輛進行耗油量試驗樣本容量為5機動目錄上頁下頁返回結(jié)束

但是,一旦取定一組樣本,得到的是n個具體的數(shù)(X1,

X2,…,

Xn),稱為樣本的一次觀察值,簡稱樣本值.樣本是隨機變量.抽到哪5輛是隨機的容量為n的樣本可以看作n維隨機變量.機動目錄上頁下頁返回結(jié)束2.獨立性:X1,

X2,

…,

Xn是相互獨立的隨機變量.由于抽樣的目的是為了對總體進行統(tǒng)計推斷,為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法.最常用的一種抽樣方法叫作“簡單隨機抽樣”,它要求抽取的樣本滿足下面兩點:1.代表性:X1,

X2,

…,

Xn中每一個與所考察的總體有相同的分布.機動目錄上頁下頁返回結(jié)束由簡單隨機抽樣得到的樣本稱為簡單隨機樣本,它可以用與總體獨立同分布的n個相互獨立的隨機變量X1,

X2,

…,

Xn表示.簡單隨機樣本是應(yīng)用中最常見的情形,今后,當說到“X1,

X2,

…,

Xn是取自某總體的樣本”時,若不特別說明,就指簡單隨機樣本.機動目錄上頁下頁返回結(jié)束設(shè)總體X的分布為F(x),則其簡單隨機樣本(X1,

X2,

…,

Xn)的聯(lián)合分布函數(shù)為機動目錄上頁下頁返回結(jié)束機動目錄上頁下頁返回結(jié)束當總體X是離散型時,其分布律為樣本的聯(lián)合分布律為當總體X是連續(xù)型時,X~f(x),則樣本的聯(lián)合密度為事實上我們抽樣后得到的資料都是具體的、確定的值.如我們從某班大學(xué)生中抽取10人測量身高,得到10個數(shù),它們是樣本取到的值而不是樣本.我們只能觀察到隨機變量取的值而見不到隨機變量.總體、樣本、樣本值的關(guān)系機動目錄上頁下頁返回結(jié)束總體(理論分布)?樣本樣本值統(tǒng)計是從手中已有的資料--樣本值,去推斷總體的情況---總體分布F(x)的性質(zhì).總體分布決定了樣本取值的概率規(guī)律,也就是樣本取到樣本值的規(guī)律,因而可以由樣本值去推斷總體.樣本是聯(lián)系二者的橋梁機動目錄上頁下頁返回結(jié)束機動目錄上頁下頁返回結(jié)束例設(shè)(X1,

X2,

…,

Xn)為X的一個樣本,求(X1,

X2,

…,

Xn)的密度函數(shù).解(X1,

X2,

…,

Xn)為X的一個樣本,故機動目錄上頁下頁返回結(jié)束例設(shè)某電子產(chǎn)品的壽命X服從指數(shù)分布,密度函數(shù)(X1,

X2,

…,

Xn)為X的一個樣本,求其密度函數(shù).解因為(X1,

X2,

…,

Xn)為X的一個樣本,機動目錄上頁下頁返回結(jié)束解例某商場每天客流量X服從參數(shù)為

的泊松分布,求其樣本(X1,

X2,

…,

Xn)的聯(lián)合分布律.

由樣本值去推斷總體情況,需要對樣本值進行“加工”,這就要構(gòu)造一些樣本的函數(shù),它把樣本中所含的(某一方面)的信息集中起來.

統(tǒng)計量機動目錄上頁下頁返回結(jié)束(X1,

X2,

…,

Xn)g(X1,

X2,

…,

Xn)其中g(shù)(x1,

x2,

…,

xn)是(x1,

x2,

…,

xn)的連續(xù)函數(shù).如果g(X1,

X2,

…,

Xn)中不含有未知參數(shù),稱g(X1,

X2,

…,

Xn)為統(tǒng)計量.(不含未知參數(shù)的樣本的函數(shù))如未知,(X1,

X2,

…,

Xn)為X的一個樣本均為統(tǒng)計量不是統(tǒng)計量均為統(tǒng)計量機動目錄上頁下頁返回結(jié)束若

已知,

未知,(X1,

X2,

…,

X5)為X的一個樣本幾個常見統(tǒng)計量樣本均值樣本方差它反映了總體均值的信息它反映了總體方差的信息機動目錄上頁下頁返回結(jié)束樣本k階原點矩樣本k階中心矩

k=1,

2,

…它反映了總體k階矩的信息它反映了總體k階中心矩的信息機動目錄上頁下頁返回結(jié)束5.2抽樣分布

統(tǒng)計量既然是依賴于樣本的,而后者又是隨機變量,故統(tǒng)計量也是隨機變量,因而就有一定的分布,這個分布叫做統(tǒng)計量的“抽樣分布”.

機動目錄上頁下頁返回結(jié)束

抽樣分布就是通常的隨機變量函數(shù)的分布.

只是強調(diào)這一分布是由一個統(tǒng)計量所產(chǎn)生的.

研究統(tǒng)計量的性質(zhì)和評價一個統(tǒng)計推斷的優(yōu)良性,完全取決于其抽樣分布的性質(zhì).抽樣分布精確抽樣分布漸近分布(小樣本問題中使用)(大樣本問題中使用)機動目錄上頁下頁返回結(jié)束

—分布構(gòu)造

統(tǒng)計量的分布稱為抽樣分布.數(shù)理統(tǒng)計中常用到如下三個分布:

—分布、—分布和—分布.

設(shè),則稱為自由度為的—分布.機動目錄上頁下頁返回結(jié)束

統(tǒng)計三大分布-分布的密度函數(shù)曲線機動目錄上頁下頁返回結(jié)束

卡方分位點設(shè),若對于存在,滿足則稱為分布的上分位點.機動目錄上頁下頁返回結(jié)束卡方分布性質(zhì)機動目錄上頁下頁返回結(jié)束若a.分布可加性獨立,則b.期望與方差若,則例,(X1,

X2,

X3)為X的一個樣本求的分布.解因為(X1,

X2,

X3)為X的一個樣本Xi~N(0,1),i=1,

2,

3則i=1,

2,

3機動目錄上頁下頁返回結(jié)束t

分布構(gòu)造若,與獨立,則稱為自由度為的分布.機動目錄上頁下頁返回結(jié)束的概率密度為機動目錄上頁下頁返回結(jié)束(2)的極限為的密度函數(shù),即機動目錄上頁下頁返回結(jié)束t分布性質(zhì)(1)關(guān)于(縱軸)對稱.

t分布分位點,則稱為的

分位點.設(shè),若對存在,滿足注:機動目錄上頁下頁返回結(jié)束例(X1,

X2,

X3)為X的一個樣本,求的分布.i=1,

2,

3解機動目錄上頁下頁返回結(jié)束機動目錄上頁下頁返回結(jié)束稱為第一自由度為

,

第二自由度為

的分布,其概率密度為若獨立,則機動目錄上頁下頁返回結(jié)束F分布構(gòu)造對于,若存在,滿足,則稱為

分位點.機動目錄上頁下頁返回結(jié)束F分布的分位點注:得證!證明:設(shè),則機動目錄上頁下頁返回結(jié)束定理1(樣本均值的分布)設(shè)X1,

X2,…,

Xn是取自正態(tài)總體的樣本,則有機動目錄上頁下頁返回結(jié)束

抽樣分布定理

n取不同值時樣本均值的分布機動目錄上頁下頁返回結(jié)束

定理2(樣本方差的分布)設(shè)X1,

X2,

…,

Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有機動目錄上頁下頁返回結(jié)束n取不同值時的分布機動目錄上頁下頁返回結(jié)束

定理3設(shè)X1,

X2,

…,

Xn是取自正態(tài)總體的樣本,分別為樣本均值和樣本方差,則有機動目錄上頁下頁返回結(jié)束定理4(兩總體樣本均值差的分布)

分別是這兩個樣本的且X與Y獨立,X1,

X2,

…,是取自X的樣本,取自Y的樣本,分別是這兩個樣本的樣本方差,均值,則有Y1,

Y2,

…,是樣本機動目錄上頁下頁返回結(jié)束機動目錄上頁下頁返回結(jié)束若假設(shè),則其中稱為混合樣本方差.定理5(兩總體樣本方差比的分布)

分別是這兩個樣本的且X與Y獨立,X1,X2,

…,是取自X的樣本,取自Y的樣本,分別是這兩個樣本的樣本方差,均值,則有Y1,

Y2,

…,是樣本機動目錄上頁下頁返回結(jié)束機動目錄上頁下頁返回結(jié)束例設(shè)總體X~N(10,

32),(X1,

X2,

…,

X6)是它的一個樣本,設(shè) ,(1)寫出Z所服從的分布;(2)求P(Z>11).解(X1,

X2,

…,

X6)是X~N(10,

32)的樣本,因此Xi~N(10,

32),且Xi相互獨立,i=1,

2,

…,

6,所以機動目錄上頁下頁返回結(jié)束直方圖基本步驟:

樣本分組、確定組距、確定組限、統(tǒng)計頻率、畫直方圖機動目錄上頁下頁返回結(jié)束為研究某廠工人生產(chǎn)某種產(chǎn)品的能力,隨機調(diào)查了20位工人某天生產(chǎn)的該產(chǎn)品的數(shù)量,數(shù)據(jù)如下:160,196,164,148,170,175,178,166,181,162,161,168,166,162,172,156,170,157,162,154.建立該批數(shù)量的頻數(shù)頻率分布表.過程:(1)確定樣本分組數(shù)k,通常組數(shù)5-10組,組數(shù)主要取決于樣本容量.樣本容量n<=50,組數(shù)5.n>50,組數(shù)增加.本例k=5(2)確定各組組距d各組區(qū)間長度:組距.一般各組組距相同(也可不同)機動目錄上頁下頁返回結(jié)束方便起見,取d=10(3)確定每組組限分組區(qū)間:(147,157],(157,167],(16

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論