抽樣方法與參數(shù)估計_第1頁
抽樣方法與參數(shù)估計_第2頁
抽樣方法與參數(shù)估計_第3頁
抽樣方法與參數(shù)估計_第4頁
抽樣方法與參數(shù)估計_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第九章

抽樣與參數(shù)估計統(tǒng)計推斷是統(tǒng)計學(xué)研究的重要內(nèi)容。抽樣是進(jìn)行統(tǒng)計推斷的基礎(chǔ)性工作。參數(shù)估計是統(tǒng)計推斷的重要內(nèi)容之一。本章主要內(nèi)容第一節(jié)抽樣與抽樣分布第二節(jié)參數(shù)估計的一般問題第三節(jié)一個總體的參數(shù)區(qū)間估計第四節(jié)兩個總體的參數(shù)區(qū)間估計第五節(jié)樣本容量的確定第一節(jié)抽樣與抽樣分布一、幾個基本概念二、概率抽樣方式三、總體分布、樣本分布、抽樣分布四、一個總體的抽樣分布五、兩個總體的抽樣分布統(tǒng)計推斷的過程樣本總體樣本統(tǒng)計量例如:樣本均值、比例、方差總體均值、比例、方差等統(tǒng)計推斷是在對樣本數(shù)據(jù)進(jìn)行描述的基礎(chǔ)上,對總體的未知數(shù)量特征作出以概率形式表述的推斷。一、幾個基本概念㈠總體、個體、樣本總體是所要研究的事物或現(xiàn)象的全體,也稱全及總體、母體。個體是組成總體的各個基本單位或元素。樣本是從總體中按一定抽樣技術(shù)抽取的若干個體組成的集合體,也稱抽樣總體、子樣。㈡總體容量和樣本容量總體容量是總體全部單位總數(shù),用N表示。樣本容量是一個樣本所包含的單位數(shù),通常用n表示。根據(jù)容量大小樣本有大樣本和小樣本之分,一般當(dāng)n<30時為小樣本,n≥30時為大樣本。㈢總體參數(shù)和統(tǒng)計量總體參數(shù)是根據(jù)總體各單位數(shù)據(jù)計算的量,又稱全及指標(biāo)。常用的有總體均值、總體比例(成數(shù))、總體方差、總體標(biāo)準(zhǔn)差等。統(tǒng)計量是由樣本構(gòu)造出的且隨樣本變化而變化的量,又稱樣本指標(biāo)或抽樣指標(biāo),常用的有樣本均值、樣本比例(成數(shù))、樣本方差、樣本標(biāo)準(zhǔn)差等。在一個總體中,總體參數(shù)是一個確定的量,而樣本統(tǒng)計量因樣本是隨機(jī)抽取的可以有多個,因此統(tǒng)計量的值不是唯一確定的,是個隨機(jī)變量。二、概率抽樣方式抽樣方式按是否根據(jù)已知概率抽選樣本單位(按抽樣的隨機(jī)性)可分為概率抽樣(隨機(jī)抽樣)和非概率抽樣(非隨機(jī)抽樣)。統(tǒng)計推斷主要是概率推斷,下面主要介紹概率抽樣。㈠概率抽樣(隨機(jī)抽樣)方式主要有:簡單隨機(jī)抽樣,分層抽樣,整群抽樣,系統(tǒng)抽樣,多階段抽樣。

(如第二章所述)本課程主要介紹簡單隨機(jī)抽樣條件下統(tǒng)計推斷方法。㈡重置抽樣和不重置抽樣從總體抽取樣本的方法有重置抽樣和不重置抽樣兩種。1.重置抽樣又稱重復(fù)抽樣、有放回抽樣,是每次從總體中抽取一個單位,觀察記錄后又放回,再抽取下一個。因此重復(fù)抽樣的樣本是由n次相互獨立的連續(xù)試驗所組成的,每次實驗在相同條件下進(jìn)行,在整個抽樣過程中總體單位數(shù)始終不變,各單位被抽中的機(jī)會前后相等。若重置抽樣并考慮各單位的排列順序,則樣本的可能數(shù)目為Nn。⒉不重置抽樣又稱不重復(fù)抽樣、無放回抽樣,是每次從總體中抽取一個單位,觀察記錄后不放回,再抽取下一個。因此不重復(fù)抽樣的樣本雖由n次連續(xù)試驗所組成,而實質(zhì)等于一次同時從總體中抽n個單位組成一個樣本,每次實驗不是相互獨立的,在整個抽樣過程中每抽一次總體單位就少一個,各單位被抽中的機(jī)會前后不等,越往后被抽中的機(jī)會越大。若不重復(fù)抽樣也不考慮各單位的順序,則樣本的可能數(shù)目為。在實踐中當(dāng)總體單位數(shù)很大,樣本單位數(shù)相對較小時,可以把不重復(fù)抽樣看成重復(fù)抽樣,這時的計算比較簡單。是總體中各元素的觀察值所形成的頻數(shù)或頻率分布總體分布通常是未知的可以假定它服從某種分布三、總體分布、樣本分布、抽樣分布

㈠總體分布(populationdistribution)總體是一個樣本中各觀察值的頻數(shù)或頻率分布也稱經(jīng)驗分布當(dāng)樣本容量n逐漸增大時,樣本分布逐漸接近總體的分布㈡樣本分布(sampledistribution)樣本是某一樣本統(tǒng)計量的全部可能取值的概率分布?,F(xiàn)實中不可能抽出所有樣本,因此統(tǒng)計量的抽樣分布實際是一種理論概率分布。統(tǒng)計推斷中,常用的理論概率分布:正態(tài)分布、

2分布、t分布和F分布。是樣本統(tǒng)計量的函數(shù)。若樣本是隨機(jī)的,則樣本統(tǒng)計量就是隨機(jī)變量,如樣本均值,樣本比例,樣本方差等為隨機(jī)變量。結(jié)果來自容量相同的所有可能樣本。提供了樣本統(tǒng)計量穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。㈢抽樣分布(samplingdistribution)抽樣分布(samplingdistribution)總體計算樣本統(tǒng)計量例如:樣本均值、比例、方差樣本四、一個總體的抽樣分布㈠樣本均值的抽樣分布㈡樣本比例的抽樣分布㈢抽樣方差的抽樣分布(略)㈠樣本均值的抽樣分布性質(zhì)及特點是容量相同的所有可能樣本的樣本均值的概率分布是一種理論概率分布是推斷總體均值的理論基礎(chǔ)舉例說明樣本均值抽樣分布的形成過程【例】設(shè)一個總體含有4個個體

(總體單位)

,即總體單位數(shù)N=4。各單位標(biāo)志值分別為X1=1、X2=2、X3=3、X4=4

??傮w標(biāo)志值的分布律為:

總體分布14230.1.2.3總體均值和方差P(X)X樣本均值的抽樣分布(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)樣本均值的抽樣分布(例題分析)

計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布。3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5樣本均值的抽樣分布(例題分析)根據(jù)表中數(shù)據(jù)求得

樣本均值的均值為:樣本均值的方差為:比較及結(jié)論:1.樣本均值的均值等于總體均值

2.樣本均值的方差等于總體方差的1/n樣本均值的抽樣分布(例題分析)

=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5xP(X)X

比較總體分布和樣本均值的抽樣分布,可以看出,此例盡管總體為均勻分布,但樣本均值的抽樣分布卻是對稱的鐘型分布。樣本均值抽樣分布的形式與特征

=50

=10X總體分布n=4抽樣分布xn=16P(X)現(xiàn)實中不可能抽出所有樣本,因此實際應(yīng)用的樣本均值抽樣分布是一種理論概率分布。數(shù)理統(tǒng)計理論證明:當(dāng)總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值也服從正態(tài)分布,樣本均值的數(shù)學(xué)期望為總體均值,樣本均值的方差為總體方差的1/n。即

x~N(μ,σ2/n)。若X~N(50,102),則有:當(dāng)n=4,

x~N(50,52);當(dāng)n=16,

x~N(50,2.52)

中心極限定理(centrallimittheorem)當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布當(dāng)總體為非正態(tài)分布時依據(jù)以下中心極限定理。中心極限定理:設(shè)從均值為

,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大(通常n

30)時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布。一個任意分布的總體X中心極限定理(centrallimittheorem)的分布趨于正態(tài)分布的過程抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值分布近似正態(tài)分布樣本均值分布為正態(tài)分布樣本均值分布為非正態(tài)分布樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的數(shù)學(xué)期望與方差

(簡單隨機(jī)樣本)均值的抽樣平均誤差是所有可能的樣本均值的標(biāo)準(zhǔn)差,用于測度所有樣本均值的離散程度,描述以樣本均值推斷總體均值的平均誤差程度。其數(shù)值小于總體標(biāo)準(zhǔn)差。簡單隨機(jī)重置抽樣下計算公式為:比例(proportion)是總體或樣本中具有某種屬性的單位數(shù)與全部單位總數(shù)之比。例如:不同性別的人數(shù)與全部人數(shù)之比合格品(或不合格品)數(shù)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為總體或樣本中具有某種特征的單位數(shù)服從二項分布。㈡樣本比例的抽樣分布樣本比例的抽樣分布是容量相同的所有可能樣本的樣本比例的概率分布當(dāng)樣本容量很大時,樣本比例的抽樣分布可用正態(tài)分布近似是一種理論概率分布是推斷總體比例的理論基礎(chǔ) 樣本比例抽樣分布的性質(zhì)及特點樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的數(shù)學(xué)期望與方差

(簡單隨機(jī)樣本)五、兩個總體的抽樣分布㈠兩個總體的樣本均值之差的抽樣分布㈡兩個總體的樣本比例之差的抽樣分布㈢兩個總體的樣本方差比的抽樣分布(略)若兩個總體都為正態(tài)分布,即

則可以證明,抽自兩個總體的兩個樣本的均值之差的抽樣分布服從正態(tài)分布其分布的數(shù)學(xué)期望為兩個總體均值之差其方差為各自的方差之和 ㈠兩個總體的樣本均值之差的抽樣分布兩個樣本均值之差的抽樣分布

m1s1總體1s2

m2總體2抽取簡單隨機(jī)樣本,樣本容量n1計算x1抽取簡單隨機(jī)樣本,樣本容量n2計算x2計算每一對樣本的x1-x2所有可能樣本的X1-X2m1-m2抽樣分布若兩個總體都服從二項分布,則可以證明,分別從兩個總體中抽取容量為n1和n2的獨立樣本,當(dāng)兩個樣本都為大樣本時,兩個樣本比例之差p1-p2的抽樣分布可用正態(tài)分布來近似其分布的數(shù)學(xué)期望為總體比例之差其方差為各自的方差之和 ㈡兩個總體的樣本比例之差的抽樣分布第二節(jié)參數(shù)估計的一般問題估計量與估計值點估計與區(qū)間估計評價估計量的標(biāo)準(zhǔn)參數(shù)估計在統(tǒng)計方法中的地位參數(shù)估計假設(shè)檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計估計量:用于估計總體參數(shù)的隨機(jī)變量如樣本均值,樣本比例、樣本方差等例如:樣本均值x就是總體均值

的一個估計量總體參數(shù)用

表示,估計量用表示估計值:估計參數(shù)時計算的統(tǒng)計量的具體值如果樣本均值x=80,則80就是

的估計值一、估計量與估計值

(estimator&estimatedvalue)二、點估計與區(qū)間估計用樣本統(tǒng)計量對總體參數(shù)進(jìn)行估計基本方法可分為兩大類:點估計和區(qū)間估計矩估計法最小二乘法最大似然法順序統(tǒng)計量法估計方法點估計區(qū)間估計㈠點估計(pointestimate)又稱定值估計,用樣本統(tǒng)計量的值直接作為總體參數(shù)的估計值例如:用樣本均值直接作為總體均值的估計例:在某城市,隨機(jī)抽取100戶,調(diào)查其家庭收入,用這100戶的平均家庭收入估計該城市所有家庭的平均收入。例如:用樣本比例直接作為總體比例的估計例:某工廠要檢驗其產(chǎn)品的合格率,隨機(jī)抽取了50個產(chǎn)品進(jìn)行檢測,發(fā)現(xiàn)有3個產(chǎn)品不合格,則樣本產(chǎn)品合格率為94%,據(jù)此估計整批產(chǎn)品的合格率為94%。點估計點估計的特點:能明確估計總體參數(shù),但沒有給出估計值接近總體參數(shù)程度的信息,無法知道估計的可靠性。點估計的方法有:矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等(略)。對于同一參數(shù)采用不同方法來估計,可能得到不同的估計量。㈡區(qū)間估計(intervalestimate)在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量的值加減抽樣極限誤差得到根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量。比如,根據(jù)樣本統(tǒng)計量估計某次考試平均分?jǐn)?shù)在75~85之間,估計的可靠程度(置信水平)是95%

樣本統(tǒng)計量

(點估計)置信區(qū)間置信下限置信上限區(qū)間估計的圖示

X95%的樣本

-1.96

x

+1.96

x99%的樣本

-2.58

x

+2.58x90%的樣本

-1.65

x

+1.65

x區(qū)間估計區(qū)間估計有三項要素:估計值,置信區(qū)間,置信概率(又稱置信水平)1-

。置信區(qū)間是由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間,表達(dá)了區(qū)間估計的精確性??梢栽谀撤N程度上確信這個區(qū)間包含總體參數(shù)的真值。Δ為允許誤差或抽樣極限誤差、邊際誤差。置信概率(置信水平)1-

指若將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,其中置信區(qū)間內(nèi)包含總體參數(shù)真值的次數(shù)的比例,表達(dá)了區(qū)間估計的可靠性。

稱為顯著性水平,是總體參數(shù)真值未包含在置信區(qū)間內(nèi)的比例,是參數(shù)估計不準(zhǔn)確的概率。用一個樣本構(gòu)造的區(qū)間是一個特定區(qū)間,無法知道這個區(qū)間是否包含總體參數(shù)的真值,只能希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含總體參數(shù)真值的區(qū)間中的一個。置信區(qū)間與置信水平

均值的抽樣分布(1-

)%區(qū)間包含了

%的區(qū)間未包含

1-aa/2a/2影響區(qū)間寬度的因素以總體均值為例,估計區(qū)間為:可以看出影響區(qū)間寬度的因素:⑴總體數(shù)據(jù)的離散程度,用總體標(biāo)準(zhǔn)差來測度⑵樣本容量n,影響樣本均值的標(biāo)準(zhǔn)差(抽樣平均誤差),即⑶置信水平

(1-

),影響z的大小三、評價估計量的標(biāo)準(zhǔn)

(估計量的優(yōu)良性準(zhǔn)則)用于估計總體參數(shù)的估計量可以有很多,如可以用樣本均值、樣本中位數(shù)作為總體均值的估計量。應(yīng)選擇估計效果最好的估計量進(jìn)行估計。統(tǒng)計學(xué)家給出了評價估計量的標(biāo)準(zhǔn)。1.無偏性(Unbiasedness)2.有效性(Effectiveness)3.一致性(Consistency)1.無偏性(unbiasedness)若估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù),即E(

)=θ,則稱估計量

為θ的滿足無偏性準(zhǔn)則的估計量??梢宰C明,樣本均值x是總體均值μ的一個無偏估計量。P(

)BA無偏有偏θ2.有效性(efficiency)對同一總體參數(shù)的兩個無偏點估計量,有更小標(biāo)準(zhǔn)差的估計量更有效。

AB

的抽樣分布

的抽樣分布P(

)θ3.一致性(consistency)若隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)θ,則稱估計量為總體參數(shù)θ的滿足一致性要求的估計量。AB較小的樣本容量較大的樣本容量P(

)θ第三節(jié)

一個總體的參數(shù)區(qū)間估計一、總體均值的區(qū)間估計二、總體比例的區(qū)間估計三、總體方差的區(qū)間估計(略)一、總體均值的區(qū)間估計㈠總體方差

2

已知時總體均值

的區(qū)間估計㈡總體方差

2

未知時總體均值

的區(qū)間估計㈠總體方差

2已知時總體均值

的區(qū)間估計1.當(dāng)總體為正態(tài)總體時,重復(fù)抽樣簡單隨機(jī)樣本的樣本均值分布為:若總體方差已知,建立置信區(qū)間用Z統(tǒng)計量:(Z稱為概率度)在給定顯著性水平α下,查標(biāo)準(zhǔn)正態(tài)分布表可構(gòu)造一定概率下總體均值μ的置信區(qū)間:也可表示為:總體方差

2已知時總體均值

的區(qū)間估計

2.當(dāng)總體為正態(tài)總體時,不重復(fù)抽樣

簡單隨機(jī)樣本的樣本均值分布為:

當(dāng)N很大時可近似為:若總體方差已知,建立置信區(qū)間用Z統(tǒng)計量,在給定顯著性水平α下,查標(biāo)準(zhǔn)正態(tài)分布表可構(gòu)造一定概率下總體均值μ的置信區(qū)間:式中(1-n/N)為未抽取單位數(shù)占總體單位數(shù)比重,稱為有限總體修正系數(shù),總是小于1。因此不重復(fù)抽樣平均誤差總是小于重復(fù)抽樣平均誤差。當(dāng)n相對于N很小時,(1-n/N)接近于1。因此對于無限總體,不重復(fù)抽樣時也不必用修正系數(shù);對于有限總體,一般當(dāng)n/N≥0.05時采用修正系數(shù),當(dāng)n/N<0.05時則可以省略??傮w方差

2已知時總體均值

的區(qū)間估計3.當(dāng)總體為非正態(tài)總體時,由中心極限定理可以證明,若樣本容量足夠大,樣本均值近似服從正態(tài)分布。經(jīng)驗上n≥30即為樣本容量足夠大。正態(tài)總體方差

2已知總體均值的區(qū)間估計(例題)【例】一家食品生產(chǎn)企業(yè)生產(chǎn)袋裝食品,日產(chǎn)量約8000袋,規(guī)定每袋重量為100克。為對產(chǎn)品質(zhì)量進(jìn)行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%。25袋食品的重量(克)

112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3正態(tài)總體方差

2已知總體均值的區(qū)間估計(例題)解:已知X~N(

,102),n=25,1-=95%,查標(biāo)準(zhǔn)正態(tài)分布表得z

/2=1.96。根據(jù)樣本數(shù)據(jù)計算得:

總體均值

在1-

置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44克~109.28克非正態(tài)總體大樣本總體方差

2已知總體均值的區(qū)間估計(例題)【例】一家保險公司收集到由36投保個人組成的隨機(jī)樣本,得到每個投保人的年齡(周歲)數(shù)據(jù)如下表。試建立投保人平均年齡90%的置信區(qū)間(已知總體標(biāo)準(zhǔn)差為8)。36個投保人年齡的數(shù)據(jù)

233539273644364246433133425345544724342839364440394938344850343945484532非正態(tài)總體大樣本總體方差

2已知總體均值的區(qū)間估計(例題分析)解:總體分布形式未知,但為大樣本,已知n=36,σ=8,1-=90%,查表得z

/2=1.645。根據(jù)樣本數(shù)據(jù)計算得:

總體均值

在1-

置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.31歲~41.69歲課堂練習(xí)一:為了了解某地區(qū)目前居民收入情況,現(xiàn)隨機(jī)抽取50人登記其月收入,得資料如下: 收入(百元)人數(shù)(人)

10以下4 10~2012 20~3021 30~4011 40以上2若該地區(qū)居民收入服從X~N(μ,100)分布,試以95%的置信水平估計目前該地區(qū)居民月收入的可能范圍。課堂練習(xí)一參考答案:解:已知:X~N(

,102),n=50,1-=95%,查表得z

/2=1.96。根據(jù)樣本數(shù)據(jù)計算得:

總體均值

在1-

置信水平下的置信區(qū)間為該地區(qū)居民月收入的置信區(qū)間為2123元~2677元。㈡總體方差

2

未知時總體均值

的區(qū)間估計當(dāng)總體服從正態(tài)分布,總體方差未知時,要用樣本方差代替總體方差來建立置信區(qū)間,這時用t分布統(tǒng)計量:

在給定顯著性水平α下,查t分布表可構(gòu)造一定概率下總體均值μ的置信區(qū)間:t分布

t分布是類似正態(tài)分布的一種對稱分布,通常比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布。Xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)Z正態(tài)總體小樣本總體方差

2未知總體均值的區(qū)間估計(例題)【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測得其使用壽命(小時)如下。試建立該批燈泡平均使用壽命95%的置信區(qū)間16只燈泡使用壽命的數(shù)據(jù)(小時)

1510152014801500145014801510152014801490153015101460146014701470正態(tài)總體小樣本總體方差

2未知總體均值的區(qū)間估計(例題分析)解:已知X~N(

,2),n=16,1-=95%,查t分布表得:t

/2=2.131。根據(jù)樣本數(shù)據(jù)計算得:,

總體均值

在1-

置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8小時~1503.2小時。課堂練習(xí)二:某電池廠生產(chǎn)的某種型號電池,其使用壽命長期服從正態(tài)分布,均值為25小時。為了提高產(chǎn)品競爭能力,該廠家對生產(chǎn)線進(jìn)行了改造,并聲稱產(chǎn)品壽命有所提高?,F(xiàn)隨機(jī)抽取10只電池進(jìn)行測試,得其使用壽命為:(單位:小時)

26,27,28,25,24,23,27,28,25,27。要求以95%的置信水平建立該種電池平均使用壽命的置信區(qū)間。正態(tài)總體大樣本總體方差

2未知總體均值的區(qū)間估計當(dāng)總體為非正態(tài)總體,且總體方差未知時,只要樣本足夠大,一般當(dāng)n≥30時,仍可用上式近似的建立總體均值的置信區(qū)間。一般書后所附t分布表只有n≤45情況下的數(shù)據(jù),因為n很大時,t分布近似于正態(tài)分布。所以當(dāng)n>45時,可查正態(tài)分布表作近似計算。

總體均值區(qū)間估計歸納說明:進(jìn)行區(qū)間估計時,一般有兩種方法:⑴對于一項估計值先提出估計的可靠程度要求,如然后利用概率積分表查出與此概率保證程度相應(yīng)的概率度z或t;再估計總體參數(shù)的置信區(qū)間,如一般抽樣估計,概率保證程度應(yīng)達(dá)到90%~95%,對于特別重大問題,如重要產(chǎn)品的質(zhì)量指標(biāo)或涉及人身安全的指標(biāo)等,為保證估計安全可靠,可提出99%及以上的概率保證要求。正態(tài)分布表中常用的概率及相應(yīng)概率度:

F(zα/2)zα/20.901.6450.951.9600.992.576區(qū)間估計的圖示

X95%的樣本

-1.96

x

+1.96

x99%的樣本

-2.58

x

+2.58x90%的樣本

-1.65

x

+1.65

x⑵對于一項估計值先提出允許誤差范圍(Δ)即估計的準(zhǔn)確性要求,然后求出概率度,如

再查概率積分表中相應(yīng)的概率保證程度F(zα/2)。常用的正態(tài)分布表中的概率度及相應(yīng)的概率:

zα/2F(zα/2)10.682620.954530.9973一般抽樣估計,允許誤差范圍在1~2倍的抽樣平均誤差()之間,即z或t在1~2之間,但對于要避免錯誤判斷的估計,可以把誤差范圍擴(kuò)大到z或t=3,以提高估計的可靠性。例:某鄉(xiāng)水稻面積20000畝,以不重復(fù)抽樣法隨機(jī)抽取400畝實割實測求得樣本平均畝產(chǎn)為645公斤,總體標(biāo)準(zhǔn)差72.6公斤。要求允許誤差不超過7.2公斤,試對該鄉(xiāng)水稻畝產(chǎn)和總產(chǎn)量作估計。解:已知=645,σ=72.6,Δ=7.2,n=400,

N=20000,則±Δ=645±7.2

平均畝產(chǎn)置信區(qū)間為:637.8~652.2公斤總產(chǎn)量置信區(qū)間為:(637.8×20000,652.2×20000)=(12756000,13044000)

根據(jù)查表得F(2)=0.9545,即以95.45%的概率保證該鄉(xiāng)水稻平均畝產(chǎn)在637.8~652.2公斤之間。二、總體比例的區(qū)間估計總體或樣本中具有某種特征的單位數(shù)服從二項分布。重復(fù)抽樣下以簡單隨機(jī)樣本估計總體中具有某種特征的單位數(shù)占總體全部單位數(shù)的比例,用二項分布律進(jìn)行估計??傮w比例的區(qū)間估計根據(jù)中心極限定理,當(dāng)n很大時二項分布近似服從正態(tài)分布。經(jīng)驗上在大樣本下,若np>5,n(1-p)>5,則二項分布可用正態(tài)分布近似求解。因而有

樣本比例分布為:可用Z統(tǒng)計量構(gòu)造總體比例π的置信區(qū)間,即:查標(biāo)準(zhǔn)正態(tài)分布表可得置信區(qū)間:總體比例π未知,可用樣本比例p代替。在1-α置信水平下,總體比例π的置信區(qū)間為:總體比例的區(qū)間估計(例題分析)例:一項廣告活動的跟蹤調(diào)查,在隨機(jī)調(diào)查的400人中,有240人能記起廣告語。試以95%的置信水平估計能記起廣告語的人所占比例的置信區(qū)間。解:已知n=400,p=240/400=0.6,np=240>5,

n(1-p)=160>5,1-α=0.95,查表得Z=1.96,則即以95%的概率保證,估計能記起廣告語的人數(shù)所占比例在55.2%~64.8%之間??傮w比例的區(qū)間估計(例題分析)【例】某城市要估計下崗職工中女性所占的比例,隨機(jī)抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間。解:已知n=100,p=65%,1-=0.95時,查表得z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%

課堂練習(xí)三:某電池廠生產(chǎn)的某種型號電池,其使用壽命的質(zhì)量標(biāo)準(zhǔn)為25小時。為提高產(chǎn)品競爭能力,該廠家對生產(chǎn)線進(jìn)行了改造,現(xiàn)隨機(jī)抽取100只電池進(jìn)行測試,得其使用壽命為:

23小時以下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論