抽樣分布與參數(shù)估計_第1頁
抽樣分布與參數(shù)估計_第2頁
抽樣分布與參數(shù)估計_第3頁
抽樣分布與參數(shù)估計_第4頁
抽樣分布與參數(shù)估計_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、4-1第四章第四章 抽樣分布與參數(shù)估計抽樣分布與參數(shù)估計n第一節(jié)第一節(jié) 頻率、概率與概率分布頻率、概率與概率分布n第二節(jié)第二節(jié) 抽樣分布抽樣分布n第三節(jié)第三節(jié) 總體參數(shù)估計總體參數(shù)估計n第四節(jié)第四節(jié) 抽樣設(shè)計抽樣設(shè)計4-2第一節(jié)第一節(jié) 頻率、概率與概率分布頻率、概率與概率分布n一、隨機事件與概率一、隨機事件與概率n(一)隨機試驗與事件(一)隨機試驗與事件n隨機現(xiàn)象的特點是:在條件不變的情況下,一系列隨機現(xiàn)象的特點是:在條件不變的情況下,一系列的試驗或觀測會得到不同的結(jié)果,并且在試驗或觀的試驗或觀測會得到不同的結(jié)果,并且在試驗或觀測前不能預(yù)見何種結(jié)果將出現(xiàn)。對隨機現(xiàn)象的試驗測前不能預(yù)見何種結(jié)果將

2、出現(xiàn)。對隨機現(xiàn)象的試驗或觀測稱為隨機試驗,它必須滿足以下的性質(zhì):或觀測稱為隨機試驗,它必須滿足以下的性質(zhì):n(1)每次試驗的可能結(jié)果不是唯一的;)每次試驗的可能結(jié)果不是唯一的;n(2)每次試驗之前不能確定何種結(jié)果會出現(xiàn);)每次試驗之前不能確定何種結(jié)果會出現(xiàn);n(3)試驗可在相同條件下重復(fù)進行。)試驗可在相同條件下重復(fù)進行。4-3n在隨機試驗中,可能出現(xiàn)也可能不出現(xiàn)的結(jié)在隨機試驗中,可能出現(xiàn)也可能不出現(xiàn)的結(jié)果,稱之為隨機事件,簡稱事件。試驗的結(jié)果,稱之為隨機事件,簡稱事件。試驗的結(jié)果可能是一個簡單事件,也可能是一個復(fù)雜果可能是一個簡單事件,也可能是一個復(fù)雜事件。簡單事件就是不可以再分解的事件,事

3、件。簡單事件就是不可以再分解的事件,又稱為基本事件。復(fù)雜事件是由簡單事件組又稱為基本事件。復(fù)雜事件是由簡單事件組合而成的事件?;臼录€可稱為樣本點,合而成的事件。基本事件還可稱為樣本點,設(shè)試驗有設(shè)試驗有n個基本事件,分別記為個基本事件,分別記為 (i=1,2,,n)。集合。集合=1 ,2 , ,n稱為稱為樣本空間,樣本空間,中的元素就是樣本點。中的元素就是樣本點。i4-4n例:投擲一粒均勻的六面體骰子,出現(xiàn)的點例:投擲一粒均勻的六面體骰子,出現(xiàn)的點數(shù)有可能是數(shù)有可能是1、2、3、4、5、6共六種。這六共六種。這六種結(jié)果是基本結(jié)果,不可以再分解成更簡單種結(jié)果是基本結(jié)果,不可以再分解成更簡單的結(jié)

4、果了,所以的結(jié)果了,所以=1,2,3,4,5,6為該為該試驗的樣本空間。試驗的樣本空間。“出現(xiàn)點數(shù)是奇數(shù)出現(xiàn)點數(shù)是奇數(shù)”這一這一事件就不是簡單事件,它是由基本事件事件就不是簡單事件,它是由基本事件1,3和和5組合而成的。我們通常用大寫字母組合而成的。我們通常用大寫字母A,B,C,來表示隨機事件,例如,設(shè)來表示隨機事件,例如,設(shè)A表示表示“出現(xiàn)點數(shù)是奇數(shù)出現(xiàn)點數(shù)是奇數(shù)”,則,則A=1,3,5;設(shè);設(shè)B表示表示“出現(xiàn)點數(shù)是偶數(shù)出現(xiàn)點數(shù)是偶數(shù)”,則,則B=2,4,6。4-5n(二)概率(二)概率n1. 概率的定義概率的定義n概率就是指隨機事件發(fā)生的可能性,或稱為機率,概率就是指隨機事件發(fā)生的可能性,

5、或稱為機率,是對隨機事件發(fā)生可能性的度量。是對隨機事件發(fā)生可能性的度量。 進行進行n次重復(fù)試次重復(fù)試驗,隨機事件驗,隨機事件A發(fā)生的次數(shù)是發(fā)生的次數(shù)是m次,發(fā)生的頻率是次,發(fā)生的頻率是m/n,當(dāng)試驗的次數(shù),當(dāng)試驗的次數(shù)n很大時,如果頻率在某一數(shù)值很大時,如果頻率在某一數(shù)值p附近擺動,而且隨著試驗次數(shù)附近擺動,而且隨著試驗次數(shù)n的不斷增加,頻率的不斷增加,頻率的擺動幅度越來越小,則稱的擺動幅度越來越小,則稱p為事件為事件A發(fā)生的概率,發(fā)生的概率,記為:記為:P(A)=p。在古典概型場合。在古典概型場合, 即基本事件發(fā)生的即基本事件發(fā)生的概率都一樣的場合概率都一樣的場合: 樣本點總數(shù)包含的樣本點個

6、數(shù)AnmAP樣本點總數(shù)的有利場合數(shù)A4-6n例:設(shè)一個袋子中裝有白球例:設(shè)一個袋子中裝有白球2個,黑球個,黑球3個。個。(1) 從中隨機摸出從中隨機摸出1只球,問剛好是白球的概率有只球,問剛好是白球的概率有多大?多大? (2) 從中隨機摸出從中隨機摸出2只球,一問只球,一問2只球只球都是白球的概率有多大都是白球的概率有多大? 二問二問2只球一白一黑只球一白一黑的概率有多大的概率有多大? 三問三問2只球都是黑球的概率有只球都是黑球的概率有多大多大? n 解:解:(1) 由于摸出的任何由于摸出的任何1只球都形成一個基只球都形成一個基本事件,所以樣本點總數(shù)為本事件,所以樣本點總數(shù)為n=5。用。用A表

7、示摸表示摸出的是白球事件,則出的是白球事件,則A由兩個基本點組成,即由兩個基本點組成,即A=白球,白球白球,白球,有利場合數(shù),有利場合數(shù)m=2。因此,。因此,剛好摸出白球的概率為剛好摸出白球的概率為P(A)=m/n=2/5=0.44-7n (2) 由于摸出由于摸出2只球才成一個基本事件,所以只球才成一個基本事件,所以樣本點總數(shù)為樣本點總數(shù)為 故故nP(A)=P(2只球都是白球只球都是白球)=1/ =1/10nP(B)=P(2只球一白一黑只球一白一黑)=23/10=6/10nP(C)=P(2只球都是黑球只球都是黑球)=3/10nNOTE: P(A+B+C)=125C25C4-8n2. 概率的基本

8、性質(zhì)概率的基本性質(zhì)n性質(zhì)性質(zhì)1 1P(A)0。n性質(zhì)性質(zhì)2 P()=1。n性質(zhì)性質(zhì)3 若事件若事件A與事件與事件B互不相容,即互不相容,即AB=,則則P(AB)=P(A)+P(B)。 n推論推論1 不可能事件的概率為不可能事件的概率為0,即:,即:P()=0。n推論推論2 P( )=1-P(A), 表示表示A的對立事件,即的對立事件,即它們二者必有一事件發(fā)生但又不能同時發(fā)生。它們二者必有一事件發(fā)生但又不能同時發(fā)生。AA4-9n例:袋中裝有例:袋中裝有4只黑球和只黑球和1只白球,每次從袋中隨機只白球,每次從袋中隨機地摸出地摸出1只球,并換入只球,并換入1只黑球。連續(xù)進行,問第三只黑球。連續(xù)進行,

9、問第三次摸到黑球的概率是多少?次摸到黑球的概率是多少? n 解解: 記記A為為“第三次摸到黑球第三次摸到黑球”,則,則 為為“第三次第三次摸到白球摸到白球”。先計算。先計算P( )。n由于袋中只有由于袋中只有1只白球,如果某一次摸到了白球,換只白球,如果某一次摸到了白球,換入了黑球,則袋中只有黑球了。所以相當(dāng)于第一、入了黑球,則袋中只有黑球了。所以相當(dāng)于第一、第二次都是摸到黑球,第三次摸到白球。注意這是第二次都是摸到黑球,第三次摸到白球。注意這是一種有放回的摸球,樣本點總數(shù)為一種有放回的摸球,樣本點總數(shù)為53,有利場合數(shù),有利場合數(shù)是是421。故:。故: P( )= ,n 所以所以 AA125

10、1651432 1251095141132APAPA4-10n3. 事件的獨立性事件的獨立性n定義定義 對事件對事件A與與B,若,若p(AB)=p(B)p(A),則稱它們,則稱它們是統(tǒng)計獨立的,簡稱相互獨立。是統(tǒng)計獨立的,簡稱相互獨立。n例:已知袋中有例:已知袋中有6只紅球只紅球, 4只白球。從袋中有放回地只白球。從袋中有放回地取兩次球取兩次球,每次都取每次都取1球。設(shè)球。設(shè) 表示第表示第i次取到紅球。次取到紅球。那么,那么,n因此,因此, ,也就是說,也就是說,B1,B2相互獨立。從題目條件看,這一結(jié)論是顯然的。相互獨立。從題目條件看,這一結(jié)論是顯然的。iB1263()()105P BP B

11、1221136()3100()3()55P B BP B BP B122111233()() ()() ()55P B BP B B P BP B P B4-11二、隨機變量二、隨機變量n隨機變量隨機變量X是定義在樣本空間是定義在樣本空間 =1,2,n上上的一個函數(shù),這個函數(shù)的取值隨試驗的結(jié)果不同而的一個函數(shù),這個函數(shù)的取值隨試驗的結(jié)果不同而變化。這個函數(shù)還要求滿足條件:對任意的實數(shù)變化。這個函數(shù)還要求滿足條件:對任意的實數(shù)x,Xx是隨機事件。如果隨機變量所有可能的取值是是隨機事件。如果隨機變量所有可能的取值是有限的,或可排成一列的,這種隨機變量稱為離散有限的,或可排成一列的,這種隨機變量稱為

12、離散型隨機變量;另一種情況是隨機變量的取值范圍是型隨機變量;另一種情況是隨機變量的取值范圍是一個區(qū)間或整個數(shù)軸,這種隨機變量稱為連續(xù)型隨一個區(qū)間或整個數(shù)軸,這種隨機變量稱為連續(xù)型隨機變量。機變量。n1. 離散型隨機變量的概率分布離散型隨機變量的概率分布 n設(shè)離散型隨機變量設(shè)離散型隨機變量X的所有可能取值為的所有可能取值為x1, x2,, xn, ,相應(yīng)的概率為,相應(yīng)的概率為p(x1),p(x2),p(xn),。用。用表格統(tǒng)一表示出來是:表格統(tǒng)一表示出來是:4-12X x1 x2 xn P p(x1) p(x2) p(xn) n這稱為離散型隨機變量這稱為離散型隨機變量X的概率分布。的概率分布。n

13、性質(zhì):性質(zhì):(1) 0p(xi)1 (i=1,2, );n(2) n定義定義: 離散型隨機變量離散型隨機變量X的期望值為的期望值為 n n性質(zhì):性質(zhì):n其中其中X1,X2都是隨機變量,都是隨機變量,是任意常數(shù)。是任意常數(shù)。 iixp1 IiixpxXE 2121XEXEXXE4-13n定義定義: 離散型隨機變量離散型隨機變量X的方差為的方差為n方差的平方根方差的平方根稱為標(biāo)準差。稱為標(biāo)準差。n方差方差2或標(biāo)準差或標(biāo)準差反映隨機變量反映隨機變量X相對其期望相對其期望值的值的n離散程度,離散程度,2或或越小越小, 說明期望值的代表性說明期望值的代表性越好;越好;2或或越大,說明期望值的代表性越差。

14、越大,說明期望值的代表性越差。n性質(zhì):對于任意的性質(zhì):對于任意的,D(X)=2 D(X) 成立成立 iiixpxXEXD222)(4-14n貝努里試驗貝努里試驗 與二項分布與二項分布n有時我們只對試驗中某事件有時我們只對試驗中某事件A是否出現(xiàn)感興趣,如是否出現(xiàn)感興趣,如果果A發(fā)生,我們稱發(fā)生,我們稱“成功成功”,否則稱,否則稱“失敗失敗”。像。像這樣只有兩種結(jié)果的試驗稱為貝努里試驗。設(shè)這樣只有兩種結(jié)果的試驗稱為貝努里試驗。設(shè)A出出現(xiàn)的概率為現(xiàn)的概率為p,我們獨立地重復(fù)進行,我們獨立地重復(fù)進行n次貝努里試驗,次貝努里試驗,稱為稱為n重貝努里試驗重貝努里試驗.以以Bk表示表示n重貝努里試驗中事件重

15、貝努里試驗中事件A正好出現(xiàn)正好出現(xiàn)k次這一事件,則次這一事件,則 (k=0,1,2,,n) n該分布稱為二項分布該分布稱為二項分布( q= 1- p ).nNOTE: knkknkqpCBp1)()(000nknknnkkknnkkqpqpCBP4-15n2. 連續(xù)型隨機變量的概率分布連續(xù)型隨機變量的概率分布 n設(shè)設(shè)X是是R.V., x 是一實數(shù)是一實數(shù). 記記nF(x)=P(Xx)。該函數(shù)就是隨機變量。該函數(shù)就是隨機變量X的分布的分布函數(shù)。分布函數(shù)的導(dǎo)數(shù)稱為密度函數(shù),記作函數(shù)。分布函數(shù)的導(dǎo)數(shù)稱為密度函數(shù),記作p(x )。n 性質(zhì)性質(zhì) n(1) p(x)0n(2) n(3) 1d xxpbax

16、xpbXapd)()(a bxP(axb)4-16n定義定義: 連續(xù)型隨機變量連續(xù)型隨機變量X的期望值為的期望值為 n 方差為方差為 n 性質(zhì)性質(zhì): D(X)=2 D(X) xxxpXEd)( xxpxXEXDd)(222 2121XEXEXXE4-17n正態(tài)分布正態(tài)分布 n如果連續(xù)型隨機變量如果連續(xù)型隨機變量X的密度函數(shù)為的密度函數(shù)為 n則稱隨機變量則稱隨機變量X服從均值為服從均值為,方差為,方差為2的正態(tài)分布,的正態(tài)分布,記為記為XN(,2)。 n如果一個正態(tài)分布的如果一個正態(tài)分布的=0,=1,則稱該正態(tài)布為標(biāo),則稱該正態(tài)布為標(biāo)準正態(tài)分布,相應(yīng)的隨機變量稱為標(biāo)準正態(tài)隨機變準正態(tài)分布,相應(yīng)的

17、隨機變量稱為標(biāo)準正態(tài)隨機變量,用量,用Z表示,即表示,即ZN(0,1),相應(yīng)的分布密度函數(shù),相應(yīng)的分布密度函數(shù)為為 xxpx222e21 zzpz22e214-18n一般正態(tài)分布一般正態(tài)分布 與標(biāo)準正態(tài)分布與標(biāo)準正態(tài)分布 的關(guān)系的關(guān)系:n若隨機變量若隨機變量X服從正態(tài)分布服從正態(tài)分布N (,2),則隨機,則隨機n變量變量 Z = 服從標(biāo)準正態(tài)分布,即服從標(biāo)準正態(tài)分布,即ZN(0,1)。X4-19n例:某大學(xué)英語考試成績服從正態(tài)分布,已知平均成績?yōu)槔耗炒髮W(xué)英語考試成績服從正態(tài)分布,已知平均成績?yōu)?0分,標(biāo)準差為分,標(biāo)準差為10分。求該大學(xué)英語成績在分。求該大學(xué)英語成績在6075分的概率。分的概

18、率。)(. ).()( 60 707075 7010101010 50 53286075XpZpXp4-20第二節(jié)第二節(jié) 抽樣分布抽樣分布n一、抽樣的基本概念一、抽樣的基本概念n二、抽樣分布二、抽樣分布n(一)重復(fù)抽樣分布(一)重復(fù)抽樣分布n(二)不重復(fù)抽樣分布(二)不重復(fù)抽樣分布n三、大數(shù)定理與中心極限定理三、大數(shù)定理與中心極限定理4-21一、抽樣的基本概念一、抽樣的基本概念n抽樣涉及的基本概念有:抽樣涉及的基本概念有:n總體與樣本總體與樣本(見第一章見第一章)n樣本容量與樣本個數(shù)樣本容量與樣本個數(shù)n總體參數(shù)與樣本統(tǒng)計量總體參數(shù)與樣本統(tǒng)計量n重復(fù)抽樣與不重復(fù)抽樣重復(fù)抽樣與不重復(fù)抽樣n這些概念

19、是統(tǒng)計學(xué)特有的,體現(xiàn)了統(tǒng)計學(xué)的這些概念是統(tǒng)計學(xué)特有的,體現(xiàn)了統(tǒng)計學(xué)的基本思想與方法?;舅枷肱c方法。4-22總體和樣本(參見第總體和樣本(參見第1章)章)n1.總體:又稱全及總體、母體,指所要研究對總體:又稱全及總體、母體,指所要研究對象的全體,由許多客觀存在的具有某種共同象的全體,由許多客觀存在的具有某種共同性質(zhì)的單位構(gòu)成。總體單位數(shù)用性質(zhì)的單位構(gòu)成??傮w單位數(shù)用 N 表示。表示。n2.樣本:又稱子樣,來自總體,是從總體中按樣本:又稱子樣,來自總體,是從總體中按隨機原則抽選出來的部分,由抽選的單位構(gòu)隨機原則抽選出來的部分,由抽選的單位構(gòu)成。樣本單位數(shù)用成。樣本單位數(shù)用 n 表示。表示。n3.

20、總體是唯一的、確定的,而樣本是不確定的、總體是唯一的、確定的,而樣本是不確定的、可變的、隨機的??勺兊?、隨機的。 4-23樣本容量與樣本個數(shù)樣本容量與樣本個數(shù)n樣本容量:一個樣本中所包含的單位數(shù),用樣本容量:一個樣本中所包含的單位數(shù),用n表示。表示。n樣本個數(shù):又稱樣本可能數(shù)目,指從一個總樣本個數(shù):又稱樣本可能數(shù)目,指從一個總體中所可能抽取的樣本的個數(shù)。對于有限總體中所可能抽取的樣本的個數(shù)。對于有限總體,樣本個數(shù)可以計算出來。樣本個數(shù)的多體,樣本個數(shù)可以計算出來。樣本個數(shù)的多少與抽樣方法有關(guān)。少與抽樣方法有關(guān)。(這個概念只是對有限總這個概念只是對有限總體有意義,對無限總體沒有意義!體有意義,對

21、無限總體沒有意義!)4-24總體參數(shù)和樣本統(tǒng)計量總體參數(shù)和樣本統(tǒng)計量n總體參數(shù):反映總體數(shù)量特征的指標(biāo)。其數(shù)值是唯一的、確定的??傮w參數(shù):反映總體數(shù)量特征的指標(biāo)。其數(shù)值是唯一的、確定的。n樣本統(tǒng)計量:根據(jù)樣本分布計算的指標(biāo)。是隨機變量。樣本統(tǒng)計量:根據(jù)樣本分布計算的指標(biāo)。是隨機變量。平均數(shù)平均數(shù)標(biāo)準差、方差標(biāo)準差、方差成數(shù)成數(shù)參數(shù)參數(shù) 、 2p統(tǒng)計量統(tǒng)計量S、 S2P總體總體樣本樣本X22()1x xsn22()1ffx xs4-25重復(fù)重復(fù)(置置)抽樣與不重復(fù)抽樣與不重復(fù)(置置)抽樣抽樣n重置抽樣與不重置抽樣(各有重置抽樣與不重置抽樣(各有3個特點個特點P90)n重復(fù)抽樣:例如從重復(fù)抽樣:例

22、如從A、B、C、D、E五個字母五個字母中隨機抽取兩個作為樣本。中隨機抽取兩個作為樣本。N=5,n=2n考慮順序時:樣本個數(shù)考慮順序時:樣本個數(shù)=Nn=52=25n不考慮順序時:樣本個數(shù)不考慮順序時:樣本個數(shù)=ABACDEBBCDAECBCDAEDBCDAEEBCDAE-(- )!(- )! !nNnNnCNn1114-26重復(fù)重復(fù)(置置)抽樣與不重復(fù)抽樣與不重復(fù)(置置)抽樣抽樣ABCDEBCDAECBDAEDBCAEEBCDAn)!-(N!NPnNABCDEBCDECDEDEEn)!n!-(N!NCnNn不重復(fù)抽樣:不重復(fù)抽樣:n例如從例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。五

23、個字母中隨機抽取兩個作為樣本。N=5,n=2n考慮順序時:樣本個數(shù)考慮順序時:樣本個數(shù)n不考慮順序時:樣本個數(shù)不考慮順序時:樣本個數(shù)4-27二、抽樣分布二、抽樣分布n抽樣分布的概念:由樣本統(tǒng)計量的全部可能抽樣分布的概念:由樣本統(tǒng)計量的全部可能取值和與之相應(yīng)的概率(頻率)組成的分配取值和與之相應(yīng)的概率(頻率)組成的分配數(shù)列。(主要求出樣本平均數(shù)的期望與方差)數(shù)列。(主要求出樣本平均數(shù)的期望與方差)n包括以下內(nèi)容包括以下內(nèi)容n重置抽樣分布重置抽樣分布n樣本平均數(shù)的分布樣本平均數(shù)的分布n樣本成數(shù)的分布樣本成數(shù)的分布n不重置抽樣分布不重置抽樣分布n樣本平均數(shù)的分布樣本平均數(shù)的分布n樣本成數(shù)的分布樣本成

24、數(shù)的分布4-28重置抽樣分布重置抽樣分布-樣本平均數(shù)的分布樣本平均數(shù)的分布n某班組某班組5個工人的日工個工人的日工資為資為34、38、42、46、50元。元。n = 42n 2 = 32n現(xiàn)用重置抽樣的方法從現(xiàn)用重置抽樣的方法從5人中隨機抽人中隨機抽2個構(gòu)成樣個構(gòu)成樣本。共有本。共有52=25個樣本。個樣本。如右圖。如右圖。4-29n驗證了以下兩個結(jié)論:驗證了以下兩個結(jié)論:n抽樣平均數(shù)的標(biāo)準差反抽樣平均數(shù)的標(biāo)準差反映所有的樣本平均數(shù)與映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用稱為抽樣平均誤差,用 表示。表示。重置抽樣分布重置抽樣分布-樣本平均數(shù)的分布樣

25、本平均數(shù)的分布()()XfE XXf42 元()()()XXfXf22216 元X()E X()nX22Xn4-30重置抽樣分布重置抽樣分布-樣本平均數(shù)的分布樣本平均數(shù)的分布n由概率論知,如果總體是正態(tài)分布的,則樣由概率論知,如果總體是正態(tài)分布的,則樣本平均數(shù)的抽樣分布是如下正態(tài)分布本平均數(shù)的抽樣分布是如下正態(tài)分布n這是一個非常重要的結(jié)論,有廣泛的應(yīng)用。這是一個非常重要的結(jié)論,有廣泛的應(yīng)用。(請參見中心極限定理。)(請參見中心極限定理。)2( ,)Nn4-31重置抽樣分布重置抽樣分布-樣本成數(shù)的分布樣本成數(shù)的分布n總體成數(shù)總體成數(shù)p是指具有某種特征的單位在總體中的比重。成數(shù)是一個特殊平是指具有

26、某種特征的單位在總體中的比重。成數(shù)是一個特殊平均數(shù),設(shè)總體單位總數(shù)目是均數(shù),設(shè)總體單位總數(shù)目是N,總體中有該特征的單位數(shù)是,總體中有該特征的單位數(shù)是N1。設(shè)。設(shè)x是是0、1變量(總體單位有該特征,則變量(總體單位有該特征,則x取取1,否則取,否則取0),則有:),則有:n現(xiàn)從總體中抽出現(xiàn)從總體中抽出n個單位,如果其中有相應(yīng)特征的單位數(shù)是個單位,如果其中有相應(yīng)特征的單位數(shù)是n1,則樣本成,則樣本成數(shù)是:數(shù)是: nP也是一個隨機變量,利用樣本平均數(shù)的分布性質(zhì)結(jié)論,即有:也是一個隨機變量,利用樣本平均數(shù)的分布性質(zhì)結(jié)論,即有:1NpxN1nPn ( )11E PpppppPnnn4-32不重置抽樣分布

27、不重置抽樣分布n樣本均值的分布性質(zhì):樣本均值的分布性質(zhì):n樣本成數(shù)的分布性質(zhì)樣本成數(shù)的分布性質(zhì)2()()1XE XNnXnN ( )11E PpppNnPnN4-33抽樣分布總結(jié)抽樣分布總結(jié)樣本平均數(shù)的分布樣本平均數(shù)的分布樣本成數(shù)的分布樣本成數(shù)的分布重復(fù)抽重復(fù)抽樣樣不重復(fù)不重復(fù)抽樣抽樣()E X()nX 1ppPn()E X( )E Pp2()1NnXnN( )E Pp 11ppNnPnN4-34三、大數(shù)定理與中心極限定理三、大數(shù)定理與中心極限定理n大數(shù)定理大數(shù)定理11lim1niinXnp1limpnmpn當(dāng)樣本容量當(dāng)樣本容量n 充分大時,可以用充分大時,可以用樣本平均估計總體平均。樣本平均

28、估計總體平均。當(dāng)試驗次數(shù)當(dāng)試驗次數(shù)n充分大時,可以用充分大時,可以用頻率代替概率。頻率代替概率。大數(shù)定理的意義:個別現(xiàn)象受偶然因素影響,但是,對大數(shù)定理的意義:個別現(xiàn)象受偶然因素影響,但是,對總體的大量觀察后進行平均,就能使偶然因素的影響相總體的大量觀察后進行平均,就能使偶然因素的影響相互抵消,從而使總體平均數(shù)穩(wěn)定下來,反映出事物變化互抵消,從而使總體平均數(shù)穩(wěn)定下來,反映出事物變化的一般規(guī)律,這就是大數(shù)定理的意義。的一般規(guī)律,這就是大數(shù)定理的意義。4-35中心極限定理中心極限定理 n正態(tài)分布的再生定理正態(tài)分布的再生定理 :相互獨立的兩個正態(tài):相互獨立的兩個正態(tài)隨機變量相加之和仍服從正態(tài)分布。隨

29、機變量相加之和仍服從正態(tài)分布。n中心極限定理:中心極限定理:n大樣本的平均數(shù)近似服從正態(tài)分布。大樣本的平均數(shù)近似服從正態(tài)分布。nNX2,4-36例例1:求樣本平均數(shù)的概率分布:求樣本平均數(shù)的概率分布n設(shè)某公司設(shè)某公司1000名職工的人均年獎金為名職工的人均年獎金為2000元,標(biāo)準差元,標(biāo)準差500元,隨機抽取元,隨機抽取36人作為樣本進行調(diào)查,問樣本的人均年獎金在人作為樣本進行調(diào)查,問樣本的人均年獎金在19002200元之間的概率有元之間的概率有多大?多大?2000,500,36n(19002200)( 1.22.4)PXPZ111900 20001.250036Xzn22200 20002.

30、450036z8768. 02)4 . 2(2)2 . 1 (FF1.22.4(2.4)(1.2)(2.4)2FFF4-37例例2n某地區(qū)職工家庭的人均年收入平均為某地區(qū)職工家庭的人均年收入平均為12000元,標(biāo)準差為元,標(biāo)準差為2000元。若知該地區(qū)家庭的人均年收入服從正態(tài)分布,現(xiàn)采元。若知該地區(qū)家庭的人均年收入服從正態(tài)分布,現(xiàn)采用重復(fù)抽樣從總體中隨機抽取用重復(fù)抽樣從總體中隨機抽取25戶進行調(diào)查,問出現(xiàn)樣本平戶進行調(diào)查,問出現(xiàn)樣本平均數(shù)等于或超過均數(shù)等于或超過12500元的可能性有多大?元的可能性有多大?()nXn20001200020002540025,()()(.)p Xp Zp Z12

31、500 12000125001 254001094. 02)25. 1 (5 . 0F4-38例例3n某商場推銷一種洗發(fā)水。據(jù)統(tǒng)計,本年度購買此種洗發(fā)水的某商場推銷一種洗發(fā)水。據(jù)統(tǒng)計,本年度購買此種洗發(fā)水的有有10萬人,其中萬人,其中6萬是女性。如果按不重復(fù)隨機抽樣方法,萬是女性。如果按不重復(fù)隨機抽樣方法,從購買者中抽出從購買者中抽出100人進行調(diào)查,問樣本中女性比例超過人進行調(diào)查,問樣本中女性比例超過50%的可能性有多大?的可能性有多大?(50%) ?p P(1)0.6 0.4100( )(1)(1)0.00489100100000ppnPnN( )50% 60%2.040.00489P p

32、Pz(50%)(2.04)p Pp Z9793. 05 . 02)04. 2(F660%, ( )(1)10pppp4-39第三節(jié)第三節(jié) 總體參數(shù)估計總體參數(shù)估計n本節(jié)主要內(nèi)容:本節(jié)主要內(nèi)容:n總體參數(shù)估計概述總體參數(shù)估計概述n總體參數(shù)的點估計總體參數(shù)的點估計n參數(shù)區(qū)間估計參數(shù)區(qū)間估計n樣本容量的確定樣本容量的確定4-40一、總體參數(shù)估計概述一、總體參數(shù)估計概述n設(shè)待估計的總體參數(shù)是設(shè)待估計的總體參數(shù)是,用以估計該參數(shù)的統(tǒng)計量是,用以估計該參數(shù)的統(tǒng)計量是 ,抽樣估計的抽樣估計的極限誤差極限誤差是是,即:,即:n極限誤差是根據(jù)研究對象的變異程度和分析任務(wù)的性質(zhì)來確極限誤差是根據(jù)研究對象的變異程度

33、和分析任務(wù)的性質(zhì)來確定的在一定概率下的允許誤差范圍。定的在一定概率下的允許誤差范圍。n參數(shù)估計的兩個要求:參數(shù)估計的兩個要求:n精度:估計誤差的最大范圍,通過極限誤差來反映。顯然,精度:估計誤差的最大范圍,通過極限誤差來反映。顯然,越小,越小,估計的精度要求越高,估計的精度要求越高,越大,估計的精度要求越低。極限誤差的確越大,估計的精度要求越低。極限誤差的確定要以實際需要為基本標(biāo)準。定要以實際需要為基本標(biāo)準。n可靠性:估計正確性的一個概率保證,通常稱為估計的置信度。可靠性:估計正確性的一個概率保證,通常稱為估計的置信度。4-41二、總體參數(shù)的點估計二、總體參數(shù)的點估計n點估計的含義:直接以樣本

34、統(tǒng)計量作為相應(yīng)點估計的含義:直接以樣本統(tǒng)計量作為相應(yīng)總體參數(shù)的估計量??傮w參數(shù)的估計量。1222nXXsPpX4-42優(yōu)良估計量標(biāo)準優(yōu)良估計量標(biāo)準n優(yōu)良估計標(biāo)準:優(yōu)良估計標(biāo)準:n無偏性:要求樣本統(tǒng)計量的平均數(shù)等于被估計的總體參數(shù)本身。無偏性:要求樣本統(tǒng)計量的平均數(shù)等于被估計的總體參數(shù)本身。n一致性:當(dāng)樣本容量充分大時,樣本統(tǒng)計量充分靠近總體參數(shù)本身。一致性:當(dāng)樣本容量充分大時,樣本統(tǒng)計量充分靠近總體參數(shù)本身。n有效性:有效性:的樣本統(tǒng)計量。是估計是總體參數(shù),若即滿足無偏性。,)(E1)(limPn()為任意小的正數(shù)更有效。則稱的無偏估計量,而都是和若12221,21X經(jīng)經(jīng)數(shù)數(shù)學(xué)學(xué)證證明明, 是

35、是 的的無無偏偏、一一致致且且有有效效的的估估計計量量??傮w方差的無偏估計量為樣本方差總體方差的無偏估計量為樣本方差22()1xxSn點估計完全正確的概率通常為點估計完全正確的概率通常為0。因此,我們更多的是考慮用。因此,我們更多的是考慮用樣本統(tǒng)計量去估計總體參數(shù)的范圍樣本統(tǒng)計量去估計總體參數(shù)的范圍 區(qū)間估計。區(qū)間估計。 4-43三、參數(shù)區(qū)間估計三、參數(shù)區(qū)間估計n參數(shù)區(qū)間估計的含義:估計總體參數(shù)的區(qū)間范圍,并給出區(qū)參數(shù)區(qū)間估計的含義:估計總體參數(shù)的區(qū)間范圍,并給出區(qū)間估計成立的概率值。間估計成立的概率值。n其中:其中: 1-(01)稱為置信度;稱為置信度;是區(qū)間估計的顯著性水平,是區(qū)間估計的顯

36、著性水平,其取值大小由實際問題確定,經(jīng)常取其取值大小由實際問題確定,經(jīng)常取1%、5%和和10%。12()1p注間對上式的理解:注間對上式的理解:例如抽取了例如抽取了1000個樣本,根據(jù)每一個樣本均構(gòu)造了一個置信區(qū)間,個樣本,根據(jù)每一個樣本均構(gòu)造了一個置信區(qū)間,這樣,由這樣,由1000個樣本構(gòu)造的總體參數(shù)的個樣本構(gòu)造的總體參數(shù)的1000個置信區(qū)間中,有個置信區(qū)間中,有95%的區(qū)間包含了總體參數(shù)的真值,而的區(qū)間包含了總體參數(shù)的真值,而5%的置信區(qū)間則沒有包含。這里,的置信區(qū)間則沒有包含。這里,95%這個值被稱為置信水平(或置信度)。這個值被稱為置信水平(或置信度)。一般地,將構(gòu)造置區(qū)間的步驟重復(fù)很

37、多次,置信區(qū)間包含總體參數(shù)真值一般地,將構(gòu)造置區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平的次數(shù)所占的比例稱為置信水平。4-44我們用我們用95%的置信水平得到某班學(xué)生考試成績的置信區(qū)間為的置信水平得到某班學(xué)生考試成績的置信區(qū)間為60-80分,如何理解?分,如何理解?錯誤的理解:錯誤的理解:60-80區(qū)間以區(qū)間以95%的概率包含全班同學(xué)平均成績的真值;或以的概率包含全班同學(xué)平均成績的真值;或以95%的概率保證全班同學(xué)平均成績的真值落在的概率保證全班同學(xué)平均成績的真值落在60-80分之間。分之間。正確的理解:如果做了多次抽樣(如正確的理解:如果做了多次抽樣(如100

38、次),大概有次),大概有95次找到的區(qū)間包含真值,次找到的區(qū)間包含真值,有有5次找到的區(qū)間不包括真值。次找到的區(qū)間不包括真值。真值只有一個,一個特定的區(qū)間真值只有一個,一個特定的區(qū)間“總是包含總是包含”或或“絕對不包含絕對不包含”該真值。但是,用該真值。但是,用概率可以知道在多次抽樣得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值。概率可以知道在多次抽樣得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值。如果大家還是不能理解,那你們最好這樣回答有關(guān)區(qū)間估計的結(jié)果:如果大家還是不能理解,那你們最好這樣回答有關(guān)區(qū)間估計的結(jié)果:該班同學(xué)平均成績的置信區(qū)間是該班同學(xué)平均成績的置信區(qū)間是60-80分,置信度為分,

39、置信度為95%。4-45區(qū)間估計的基本要素區(qū)間估計的基本要素n包括:樣本點估計值、抽樣極限誤差、估計的可靠程度包括:樣本點估計值、抽樣極限誤差、估計的可靠程度n樣本點估計值樣本點估計值n抽樣極限誤差:可允許的誤差范圍。抽樣極限誤差:可允許的誤差范圍。n抽樣估計的可靠程度(置信度、概率保證程度)及概率度抽樣估計的可靠程度(置信度、概率保證程度)及概率度n注意:本教材所進行的區(qū)間估計僅指對注意:本教材所進行的區(qū)間估計僅指對總體平均數(shù)或成數(shù)總體平均數(shù)或成數(shù)的區(qū)間估計,的區(qū)間估計,并且在際計算過程中使用下面的式子。式中并且在際計算過程中使用下面的式子。式中是極限誤差。是極限誤差。()1XXXp進一步可

40、以寫成1X稱為置信度(或概率保證程度)稱為概率度(因為它與1- 密切相關(guān)P98)()1,()1pp X 即,1,1,XXXnnXXXX2222當(dāng)服從標(biāo)準正態(tài)分布時,通常記z=簡記為z=請牢記該式.當(dāng)服從t分布時,通常記t,z與t通常也稱為臨界值4-46區(qū)間估計的內(nèi)容區(qū)間估計的內(nèi)容 2 2 已知已知 2 2 未知未知 均均 值值方方 差差比比 例例置置 信信 區(qū)區(qū) 間間4-47平均數(shù)的區(qū)間估計平均數(shù)的區(qū)間估計 n對總體平均數(shù)或成數(shù)的區(qū)間估計時,使用下面的式子對總體平均數(shù)或成數(shù)的區(qū)間估計時,使用下面的式子 (式中式中是極限誤差是極限誤差)n有兩種模式:有兩種模式:n1、根據(jù)置信度、根據(jù)置信度1-,

41、求出極限誤差,求出極限誤差,并指出總體平均數(shù),并指出總體平均數(shù)的估計區(qū)間。的估計區(qū)間。n2、給定極限誤差,求置信度。、給定極限誤差,求置信度。()1p X 4-48n當(dāng)當(dāng)已知時,根據(jù)相關(guān)的抽樣分布定理,已知時,根據(jù)相關(guān)的抽樣分布定理, 服從標(biāo)準正態(tài)分布服從標(biāo)準正態(tài)分布N(0,1)。查正態(tài)分布概率表,。查正態(tài)分布概率表,可得可得 (一般記為一般記為 ),則),則 ,根據(jù)重復(fù)抽樣與不,根據(jù)重復(fù)抽樣與不重復(fù)抽樣的重復(fù)抽樣的 求法的不同,進一步可得總體平均數(shù)的估計區(qū)間:求法的不同,進一步可得總體平均數(shù)的估計區(qū)間:n重復(fù)抽樣時,區(qū)間的上下限為:重復(fù)抽樣時,區(qū)間的上下限為:n不重復(fù)抽樣時,區(qū)間的上下限為:

42、不重復(fù)抽樣時,區(qū)間的上下限為:平均數(shù)區(qū)間估計平均數(shù)區(qū)間估計第第1種模式種模式(求置信區(qū)間求置信區(qū)間)()1p X ()1XXXpXX/X(/)1XF/ 2Xz XnzX212NnNnzX/ 2z/abs(normsinv(1/2)XExcel用函數(shù)求的值,XX 的估計區(qū)間是4-4912/2/X/2)(Xzp1)(1)(XXXzpXpXz/2/?為什么記為4-50平均數(shù)區(qū)間估計平均數(shù)區(qū)間估計第第1種模式種模式(求置信區(qū)間求置信區(qū)間)n若總體方差未知,則在計算若總體方差未知,則在計算 時,使用樣本方差代替總體方差,此時時,使用樣本方差代替總體方差,此時 服從自由度為服從自由度為n-1的的t分布。查

43、分布。查t分布表可得分布表可得 ,并,并記為記為n于是:于是:n重復(fù)抽樣時,區(qū)間的上下限為:重復(fù)抽樣時,區(qū)間的上下限為:n不重復(fù)抽樣時,區(qū)間的上下限為:不重復(fù)抽樣時,區(qū)間的上下限為:XXX/X,12nt,12nSXtn,121nSNnXtNn()1XXXp大樣本時,大樣本時,t分布與標(biāo)準正態(tài)分布與標(biāo)準正態(tài)分布非常接近,可直接從標(biāo)準分布非常接近,可直接從標(biāo)準正態(tài)分布表查臨界值正態(tài)分布表查臨界值,12nt/tinv( ,1)XExceln用函數(shù)求的值4-51例:總體平均數(shù)的區(qū)間估計例:總體平均數(shù)的區(qū)間估計1n對某型號的電子元件進行耐用性能檢查,抽查資料分組如下表,要求估對某型號的電子元件進行耐用性

44、能檢查,抽查資料分組如下表,要求估計該批電子元件的平均耐用時數(shù)的置信區(qū)間(置信度計該批電子元件的平均耐用時數(shù)的置信區(qū)間(置信度95%)。)。1055.5()XfXf小時2()52.17()1XXfSf小時52.175.217()100XSn小時Xz( )0.951.96F zz 1055.5 10.23 1045.27X 所以1055.5 10.23 1065.73X 1045.27 1065.7395%平均耐用時數(shù)在小時間,可靠程度為。1.96 5.21710.23Xz()1()1/XXXpXpSnSnabs(normsinv(1/2)Excelz用函數(shù)求 值t如果查 分布表,則等于1.98

45、4,/Sn注意求時 查的是標(biāo)準正態(tài)分布表4-52XXX的抽樣分布68.27%的樣本的樣本p X ()1pX ()1可以寫成p XX ()1也可以寫成XX11 XX22 XX33 XX44 1) 100%表示有(的區(qū)間包含了表示樣本均值落在表示樣本均值落在區(qū)區(qū)間的概率是間的概率是1-,例,例對總體均值區(qū)間估計的進一步理解對總體均值區(qū)間估計的進一步理解4-53平均數(shù)區(qū)間估計平均數(shù)區(qū)間估計第第2種模式種模式(求置信度求置信度)n給定極限誤差,求置信度給定極限誤差,求置信度()1p X ()()1XXXXpF4-54例:總體平均數(shù)的區(qū)間估計例:總體平均數(shù)的區(qū)間估計2n例:經(jīng)抽樣調(diào)查計算樣本畝產(chǎn)糧食例:

46、經(jīng)抽樣調(diào)查計算樣本畝產(chǎn)糧食600公斤,并求得抽樣平公斤,并求得抽樣平均誤差為均誤差為3公斤,現(xiàn)給定允許極限誤差為公斤,現(xiàn)給定允許極限誤差為6公斤,求置信區(qū)間公斤,求置信區(qū)間包含總體平均畝產(chǎn)的概率,即求置信水平。包含總體平均畝產(chǎn)的概率,即求置信水平。600,3,6XX已知:62,3Xz 簡便解法:%45.95)2()(FzFXXXXp XXp XXpXF ()()()()因為服務(wù)標(biāo)準正態(tài)分布所以上式結(jié)果表明,如果多次反復(fù)抽樣,結(jié)果表明,如果多次反復(fù)抽樣,每次都可以由樣本值確定一個估每次都可以由樣本值確定一個估計區(qū)間,每個區(qū)間或者包含總體計區(qū)間,每個區(qū)間或者包含總體參數(shù)的真值,或者不包含總體參參數(shù)

47、的真值,或者不包含總體參數(shù)的真值,包含真值的區(qū)間占數(shù)的真值,包含真值的區(qū)間占F(z),即每一萬次抽樣,就有即每一萬次抽樣,就有9545個樣本區(qū)間包括總體畝產(chǎn),其余個樣本區(qū)間包括總體畝產(chǎn),其余455個樣本區(qū)間不包括總體平均個樣本區(qū)間不包括總體平均數(shù),即若接受估計區(qū)間的判斷要數(shù),即若接受估計區(qū)間的判斷要冒冒4.55%的機會犯錯誤的風(fēng)險。的機會犯錯誤的風(fēng)險。(2) 95.45%F4-55成數(shù)的區(qū)間估計成數(shù)的區(qū)間估計n由于總體的分布是(由于總體的分布是(0,1)分布,只有在大樣本的)分布,只有在大樣本的情況下,才服從正態(tài)分布??傮w成數(shù)可以看成是一情況下,才服從正態(tài)分布??傮w成數(shù)可以看成是一種特殊的平均

48、數(shù),類似于總體平均數(shù)的區(qū)間估計,種特殊的平均數(shù),類似于總體平均數(shù)的區(qū)間估計,總體成數(shù)的區(qū)間估計的上下限是:總體成數(shù)的區(qū)間估計的上下限是:n注意:在實踐中,由于總體成數(shù)常常未知,這時,注意:在實踐中,由于總體成數(shù)常常未知,這時,抽樣平均誤差公式中的總體成數(shù)用樣本成數(shù)代替。抽樣平均誤差公式中的總體成數(shù)用樣本成數(shù)代替。 n大樣本的條件:大樣本的條件:np5且且n(1-p) 5,由于總體成數(shù),由于總體成數(shù)p通通常未知,可以用樣本成數(shù)來近似判斷。常未知,可以用樣本成數(shù)來近似判斷。2PPz1Pppn11PppNnnN4-56例:總體平均數(shù)的區(qū)間估計例:總體平均數(shù)的區(qū)間估計3n對某型號的電子元件進行耐用性能

49、檢查,抽查資料分組如下表,對某型號的電子元件進行耐用性能檢查,抽查資料分組如下表, 設(shè)該廠的產(chǎn)品設(shè)該廠的產(chǎn)品質(zhì)量檢驗標(biāo)準規(guī)定,元件耐用時數(shù)達到質(zhì)量檢驗標(biāo)準規(guī)定,元件耐用時數(shù)達到1000小時以上為合格品。要求估計該批電小時以上為合格品。要求估計該批電子元件的合格率,置信水平子元件的合格率,置信水平95%。9191%100P(1)(,)(1)2.86%PppnPPn總體成數(shù)未知用樣本成數(shù)代替96. 1%,95)(zzF1.96 2.86% 5.61%Pz 91% 5.6% 85.4%P91% 5.6% 96.6%P。間,可靠性為合格率在%95%6 .96%4 .854-57總體均值區(qū)間估計總結(jié)總體

50、均值區(qū)間估計總結(jié)XXXp ()1p X ()1總體平均數(shù)估計總體平均數(shù)估計區(qū)間的上下限區(qū)間的上下限總體方總體方差已知差已知N(0,1)重復(fù)抽樣重復(fù)抽樣不重復(fù)抽不重復(fù)抽樣樣總體方總體方差未知差未知t(n-1)大樣本時近似服從N(0,1)重復(fù)抽樣重復(fù)抽樣不重復(fù)抽不重復(fù)抽樣樣XX所服從的分布Xn/Sn/1NnNn1SNnNn,12nSXtn,121nSNnXtNnnzX212NnNnzXn 如果是正態(tài)總體如果是正態(tài)總體4-58n 如果不是正態(tài)總體,或分布未知如果不是正態(tài)總體,或分布未知總體方差已知總體方差已知且是大樣本且是大樣本總體方差未知總體方差未知且是大樣本且是大樣本 XXN(0,1)近似服從X

51、XN(0,1)近似服從此時不考慮小樣本情況此時不考慮小樣本情況XnNnNn/1或XSnSNnNn/1或因此,大樣本情況下,直接用因此,大樣本情況下,直接用標(biāo)準正態(tài)分布求置信區(qū)間即可。標(biāo)準正態(tài)分布求置信區(qū)間即可。4-59總體成數(shù)估計區(qū)間估計總結(jié)總體成數(shù)估計區(qū)間估計總結(jié)n總體成數(shù)估計區(qū)間的上下限總體成數(shù)估計區(qū)間的上下限只考慮大樣本情況(請記住大樣本條件)只考慮大樣本情況(請記住大樣本條件)PPPzn21PPNnPznN2114-60對總量指標(biāo)的區(qū)間估計對總量指標(biāo)的區(qū)間估計n在對總體平均數(shù)進行區(qū)間估計的基礎(chǔ)上,可在對總體平均數(shù)進行區(qū)間估計的基礎(chǔ)上,可進一步推斷相應(yīng)的總量指標(biāo),即用總體單位進一步推斷相

52、應(yīng)的總量指標(biāo),即用總體單位總數(shù)總數(shù)N分別乘以總體平均數(shù)的區(qū)間下限和區(qū)間分別乘以總體平均數(shù)的區(qū)間下限和區(qū)間上限,便得到相應(yīng)總量(上限,便得到相應(yīng)總量(N)的區(qū)間范圍。)的區(qū)間范圍。()()xxxxXXN XNN X 4-61例例1n某廠對一批產(chǎn)品的質(zhì)量進行抽樣檢驗,采用重復(fù)抽樣抽取樣品某廠對一批產(chǎn)品的質(zhì)量進行抽樣檢驗,采用重復(fù)抽樣抽取樣品200只,樣只,樣本優(yōu)質(zhì)率為本優(yōu)質(zhì)率為85%,試計算當(dāng)把握程度為,試計算當(dāng)把握程度為90%時優(yōu)質(zhì)品率的區(qū)間范圍。時優(yōu)質(zhì)品率的區(qū)間范圍。.%,.%,即2000 80 852000 89 151617 17834-62例例2n某商場從一批食品(共某商場從一批食品(共

53、800袋)中隨機抽取袋)中隨機抽取40袋(假設(shè)用重復(fù)抽樣),測袋(假設(shè)用重復(fù)抽樣),測得每袋平均重量為得每袋平均重量為791.1克,標(biāo)準差為克,標(biāo)準差為17.136克,要求以克,要求以95%的把握程度,的把握程度,估計這批食品的平均每袋重量以及這批食品總重量的區(qū)間范圍。估計這批食品的平均每袋重量以及這批食品總重量的區(qū)間范圍。800*778.84,800*803.36,即,即623072,642688 4-63三、樣本容量確定三、樣本容量確定n什么是樣本容量確定問題?什么是樣本容量確定問題?( )1XXzzF z ()1XXXp4-64確定樣本容量確定樣本容量n在設(shè)計抽樣時,先確定允許的在設(shè)計抽

54、樣時,先確定允許的誤差范圍誤差范圍和必要的和必要的概率保證程概率保證程度度,然后根據(jù)歷史資料或試點資料確定,然后根據(jù)歷史資料或試點資料確定總體的標(biāo)準差總體的標(biāo)準差,最后,最后來確定樣本容量。來確定樣本容量。估計總體均值估計總體均值時樣本容量的時樣本容量的確定確定重復(fù)抽樣重復(fù)抽樣 不重復(fù)抽樣不重復(fù)抽樣 估計成數(shù)時樣估計成數(shù)時樣本容量的確定本容量的確定重復(fù)抽樣重復(fù)抽樣 不重復(fù)抽樣不重復(fù)抽樣 xzn2xzn2222xNznNz2222222xnzNn 21pzppn2221pNzppnNzpp22222114-65確定樣本容量應(yīng)注意的問題確定樣本容量應(yīng)注意的問題n計算樣本容量時,一般總體的方差與成數(shù)

55、都是未知計算樣本容量時,一般總體的方差與成數(shù)都是未知的,可用有關(guān)資料替代:的,可用有關(guān)資料替代:n一是用歷史資料已有的方差與成數(shù)代替;一是用歷史資料已有的方差與成數(shù)代替;n二是在進行正式抽樣調(diào)查前進行幾次試驗性調(diào)查,用試驗二是在進行正式抽樣調(diào)查前進行幾次試驗性調(diào)查,用試驗中方差的最大值代替總體方差;中方差的最大值代替總體方差;n三是成數(shù)方差在完全缺乏資料的情況下,就用成數(shù)方差的三是成數(shù)方差在完全缺乏資料的情況下,就用成數(shù)方差的最大值最大值0.25代替。代替。n如果進行一次抽樣調(diào)查,同時估計總體均值與成數(shù),如果進行一次抽樣調(diào)查,同時估計總體均值與成數(shù),用上面的公式同時計算出兩個樣本容量,可取一個

56、用上面的公式同時計算出兩個樣本容量,可取一個最大的結(jié)果,同時滿足兩方面的需要。最大的結(jié)果,同時滿足兩方面的需要。n上面的公式計算結(jié)果如果帶小數(shù),這時樣本容量不上面的公式計算結(jié)果如果帶小數(shù),這時樣本容量不按四舍五入法則取整數(shù),取比這個數(shù)大的最小整數(shù)按四舍五入法則取整數(shù),取比這個數(shù)大的最小整數(shù)代替。例如計算得到:代替。例如計算得到:n=56.03,那么,樣本容量取,那么,樣本容量取57,而不是,而不是56。 4-66例:確定樣本容量例:確定樣本容量1n對某批木材進行檢驗,根據(jù)以往經(jīng)驗,木材長度的標(biāo)準差為對某批木材進行檢驗,根據(jù)以往經(jīng)驗,木材長度的標(biāo)準差為0.4米,而合格率為米,而合格率為90%?,F(xiàn)

57、采用重復(fù)抽樣方式,要求在。現(xiàn)采用重復(fù)抽樣方式,要求在95.45%的概率保證程度下,木材平均長度的極限誤差不超過的概率保證程度下,木材平均長度的極限誤差不超過0.08米,抽樣合格率的極限誤差不超過米,抽樣合格率的極限誤差不超過5%,問必要的樣本單,問必要的樣本單位數(shù)應(yīng)該是多少?位數(shù)應(yīng)該是多少?樣本平均數(shù)的單位數(shù).().xzn22222220 41000 08棵樣本成數(shù)的單位數(shù).()().pz ppn222220 9 0 111440 05棵.0 4%p90( ).%F z 95 45.x0 8%p 54-67例:確定樣本容量例:確定樣本容量2n對某批木材進行檢驗,根據(jù)以往經(jīng)驗,木材的合格率為對某

58、批木材進行檢驗,根據(jù)以往經(jīng)驗,木材的合格率為90%、92%、95%?,F(xiàn)采用重復(fù)抽樣方式,要求在?,F(xiàn)采用重復(fù)抽樣方式,要求在95.45%的概率保的概率保證程度下,抽樣合格率的極限誤差不超過證程度下,抽樣合格率的極限誤差不超過5%,問必要的樣,問必要的樣本單位數(shù)應(yīng)該是多少?本單位數(shù)應(yīng)該是多少?樣本成數(shù)的單位數(shù)()xz ppn221.().2220 9 0 11440 05棵4-68第四節(jié)第四節(jié) 抽樣的組織形式抽樣的組織形式n本節(jié)主要內(nèi)容:本節(jié)主要內(nèi)容:n抽樣估計效果的衡量與抽樣組織形式抽樣估計效果的衡量與抽樣組織形式n簡單隨機抽樣簡單隨機抽樣n類型抽樣類型抽樣n整群抽樣整群抽樣n等距抽樣等距抽樣n

59、階段抽樣階段抽樣n不同抽樣組織設(shè)計的比較不同抽樣組織設(shè)計的比較4-69一、抽樣估計效果的衡量與抽樣組織形式一、抽樣估計效果的衡量與抽樣組織形式n抽樣估計效果好壞,關(guān)鍵是抽樣估計效果好壞,關(guān)鍵是抽樣平均誤差抽樣平均誤差的控制。的控制。抽樣平均誤差小,抽樣效果從整體上看就是好的;抽樣平均誤差小,抽樣效果從整體上看就是好的;否則,抽樣效果就不理想。否則,抽樣效果就不理想。n抽樣平均誤差受以下幾方面的因素影響:抽樣平均誤差受以下幾方面的因素影響:n一是總體的變異性,即與總體的標(biāo)準差大小有關(guān)一是總體的變異性,即與總體的標(biāo)準差大小有關(guān)n二是樣本容量二是樣本容量n三是抽樣方法。三是抽樣方法。n四是抽樣的組織

60、形式四是抽樣的組織形式n抽樣的組織形式有如下幾種:抽樣的組織形式有如下幾種:簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣、簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣、階段抽樣階段抽樣 4-70二、簡單隨機抽樣二、簡單隨機抽樣/Xn11XNnnNNnn4-71三、類型抽樣三、類型抽樣n含義:又稱分層抽樣。對總體各單位按一定標(biāo)志加以分組,含義:又稱分層抽樣。對總體各單位按一定標(biāo)志加以分組,然后從每一組中按隨機原則抽取一定單位構(gòu)成樣本。然后從每一組中按隨機原則抽取一定單位構(gòu)成樣本。組,有設(shè)總體分為k按比例取樣,即NnNnNnNnkk2211kNNNN21knnnn2112212211121221,kk

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論