第4章抽樣與參數(shù)估計(jì)_第1頁(yè)
第4章抽樣與參數(shù)估計(jì)_第2頁(yè)
第4章抽樣與參數(shù)估計(jì)_第3頁(yè)
第4章抽樣與參數(shù)估計(jì)_第4頁(yè)
第4章抽樣與參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩95頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

STATISTICS統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)原理統(tǒng)計(jì)學(xué)原理統(tǒng)計(jì)學(xué)原理第4章抽樣與參數(shù)估計(jì)4.1抽樣與抽樣分布4.2參數(shù)估計(jì)的基本方法4.3總體均值的區(qū)間估計(jì)4.4總體比例的的區(qū)間估計(jì)4.5樣本容量的確定學(xué)習(xí)目標(biāo)掌握常用的概率抽樣方法理解抽樣分布的含義理解估計(jì)量與估計(jì)值的概念理解點(diǎn)估計(jì)與區(qū)間估計(jì)的區(qū)別掌握總體均值的區(qū)間估計(jì)方法掌握總體比例的區(qū)間估計(jì)方法掌握樣本容量的確定方法統(tǒng)計(jì)應(yīng)用

一次失敗的民意調(diào)查在1936年的美國(guó)總統(tǒng)選舉前,一份名為L(zhǎng)iteraryDigest

雜志進(jìn)行了一次民意調(diào)查。調(diào)查的焦點(diǎn)是誰(shuí)將成為下一屆總統(tǒng)—是挑戰(zhàn)者,堪薩斯州州長(zhǎng)AlfLandon,還是現(xiàn)任總統(tǒng)FranklinDelanoRoosevelt為了解選民意向,民意調(diào)查專(zhuān)家們根據(jù)電話簿和車(chē)輛登記簿上的名單給一大批人發(fā)了簡(jiǎn)單的調(diào)查表(電話和汽車(chē)在1936年并不像現(xiàn)在那樣普及,但是這些名單比較容易得到)。盡管發(fā)出的調(diào)查表大約有一千萬(wàn)張,但收回的比例并不高。在收回的調(diào)查表中,AlfLandon非常受歡迎。于是該雜志預(yù)測(cè)Landon將贏得選舉。但事實(shí)上是FranklinRoosevelt贏得了這次選舉調(diào)查失敗的主要原因是抽樣框出現(xiàn)了問(wèn)題。在經(jīng)濟(jì)大蕭條時(shí)期由于電話和汽車(chē)并不普及,只是富裕階層才會(huì)擁有,調(diào)查有電話和汽車(chē)的人們,并不能夠反映全體選民的觀點(diǎn)參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)為什么要進(jìn)行抽樣?如何進(jìn)行抽樣?(抽樣的方法)用樣本推斷總體的科學(xué)性是什么?4.1抽樣與抽樣分布4.1.1抽樣方法概述4.1.2概率抽樣方法4.1.3抽樣分布4.1抽樣與抽樣分布4.1.1抽樣方法概述概率抽樣非概率抽樣概率抽樣

(probabilitysampling)也稱(chēng)隨機(jī)抽樣特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來(lái)的當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率概率抽樣

(probabilitysampling)常用的概率抽樣方法:簡(jiǎn)單隨機(jī)抽樣分層抽樣系統(tǒng)抽樣整群抽樣非概率抽樣

(nonprobabilitysampling)1.非概率抽樣是指抽樣時(shí)不遵循隨機(jī)原則,而是從方便、快捷出發(fā)或根據(jù)調(diào)查者主觀判斷有目的地選取樣本。2.特點(diǎn)操作簡(jiǎn)便、時(shí)效快、成本低。但是,理論上不具備由樣本對(duì)總體進(jìn)行推斷的依據(jù)。非概率抽樣

(nonprobabilitysampling)非概率抽樣方法:便捷抽樣判斷抽樣配額抽樣滾雪球抽樣4.1.2概率抽樣方法簡(jiǎn)單隨機(jī)抽樣分層抽樣系統(tǒng)抽樣整群抽樣簡(jiǎn)單隨機(jī)抽樣

(simplerandomsampling)從總體N個(gè)元素中隨機(jī)地抽取n個(gè)元素作為樣本,總體中每個(gè)元素進(jìn)入樣本的概率是相等的。是最基本的抽樣方法,是其它抽樣方法的基礎(chǔ)。簡(jiǎn)單隨機(jī)抽樣的具體方法有擲硬幣法、擲骰子法、抽簽法、隨機(jī)數(shù)表法、計(jì)算機(jī)抽取法等。簡(jiǎn)單隨機(jī)抽樣

(simplerandomsampling)優(yōu)點(diǎn)簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本由于抽取概率相同,計(jì)算抽樣誤差及對(duì)總體參數(shù)進(jìn)行推斷時(shí)比較容易。局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框;或者有的情況下就構(gòu)造不出來(lái)抽樣框。抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒(méi)有利用其它輔助信息以提高估計(jì)的效率(樣本的代表性問(wèn)題)分層抽樣

(stratifiedsampling)也稱(chēng)分類(lèi)抽樣。將抽樣單位按某種特征或某種規(guī)則劃分為不同的層(類(lèi)),然后從不同的層中獨(dú)立、隨機(jī)地抽取一定數(shù)量的元素組成一個(gè)樣本。分層抽樣的具體方式一般有等比例抽樣與非等比例抽樣兩種。分層抽樣

(stratifiedsampling)

分層抽樣實(shí)質(zhì)上是把科學(xué)分組方法和抽樣原理結(jié)合起來(lái)。采用分層抽樣,可以把差異程度較大的總體各單位劃分為性質(zhì)、屬性相近的若干類(lèi)(層),使類(lèi)(層)內(nèi)的各單位差異程度小于類(lèi)(層)之間的差異程度,即類(lèi)(層)內(nèi)方差小于類(lèi)(層)間方差。在不同類(lèi)(層)型中分別抽樣,就能使樣本單位分布更接近總體分布,從而能提高代表性,減少抽樣誤差。分層抽樣

(stratifiedsampling)優(yōu)點(diǎn)第一,分層抽樣除了可以對(duì)總體進(jìn)行估計(jì)外,還可以對(duì)各層的子總體進(jìn)行估計(jì);第二,分層抽樣可以按自然區(qū)域或行政區(qū)域進(jìn)行分層,使抽樣的組織和實(shí)施都比較方便;第三,分層抽樣的樣本分布在各個(gè)層內(nèi),從而使樣本在總體中的分布比較均勻;第四,分層抽樣可以提高估計(jì)的精度。分層抽樣

(stratifiedsampling)局限性及注意事項(xiàng)按一定標(biāo)志進(jìn)行分類(lèi)(層)時(shí),需要詳細(xì)具體的資料,這有一定的難度;類(lèi)(層)的界限必須清楚,不能發(fā)生混淆;分類(lèi)(層)不宜過(guò)多過(guò)細(xì),否則將失去分類(lèi)(層)的特征,不便于在每類(lèi)(層)中抽樣。系統(tǒng)抽樣

(systematicsampling)也稱(chēng)等距抽樣或機(jī)械抽樣先將總體各元素按某種順序排列,并按某種規(guī)則確定一個(gè)隨機(jī)起點(diǎn),然后,每隔一定的間隔抽取一個(gè)元素,直至抽取九個(gè)元素形成一個(gè)樣本。系統(tǒng)抽樣

(systematicsampling)系統(tǒng)抽樣

(systematicsampling)優(yōu)點(diǎn):第一,簡(jiǎn)便易行.當(dāng)抽樣樣本量很大時(shí),有了總體元素的排序,只要確定出抽樣的起點(diǎn)和間隔后,樣本元素也就隨之確定,而且可以利用現(xiàn)有的排列。第二,系統(tǒng)抽樣的樣本在總體中的分布一般也比較均勻,由此抽樣誤差通常要小于簡(jiǎn)單隨機(jī)抽樣.如果掌握了總體的有關(guān)信息,將總體各元素按有掣標(biāo)志排列,就可以提高估計(jì)的精度。系統(tǒng)抽樣

(systematicsampling)局限性:運(yùn)用等距抽樣的前提是要有總體每個(gè)單位的有關(guān)材料,特別是按有關(guān)標(biāo)志排隊(duì)時(shí),往往需要有較為詳細(xì)、具體的相關(guān)資料當(dāng)抽樣間隔和被調(diào)查對(duì)象本身的節(jié)奏性(或循環(huán)周期)重合時(shí),就會(huì)影響調(diào)查的精度。等距抽樣的抽樣誤差計(jì)算較為復(fù)雜。

整群抽樣

(clustersampling)是先將總體按一定標(biāo)準(zhǔn)劃分成群,然后以群為單位按隨機(jī)原則從總體中抽取若干群,最后由被抽中各群中的每一個(gè)單位組成樣本。例如,在對(duì)居民收入情況進(jìn)行調(diào)查時(shí),若以居民小組為群,抽樣時(shí)可先抽取居民小組,再調(diào)查每個(gè)被抽到的居民小組中的每一居民戶(hù)。整群抽樣

(clustersampling)優(yōu)點(diǎn)抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施局限性整群抽樣中樣本只能集中在若干群中,不能均勻地分布在總體的各個(gè)部分,用以推斷總體的準(zhǔn)確性較差。但當(dāng)群體內(nèi)各單位間的差異性大,而群與群之間差異性小時(shí),采用此法可以提高樣本的代表性。本節(jié)小結(jié)對(duì)以上幾種概率抽樣方法的應(yīng)用和選擇,應(yīng)主要考慮這樣幾個(gè)因素:一是對(duì)抽樣誤差大小的要求;二是調(diào)查對(duì)象本身的特點(diǎn);三是人力、物力、經(jīng)費(fèi)和時(shí)間等各種調(diào)查條件的限制。4.1.2抽樣分布統(tǒng)計(jì)量是用來(lái)描述樣本特征的概括性度量,比如樣本均值、比例p、方差σ2等。統(tǒng)計(jì)量是樣本的函數(shù).統(tǒng)計(jì)量是一個(gè)隨機(jī)變量。(由于不同的樣本計(jì)算出來(lái)的統(tǒng)計(jì)量的值是不同的)抽樣分布就是在總體給定,樣本容量給定的情況下,一個(gè)樣本統(tǒng)計(jì)量所有可能取值形成的相對(duì)頻數(shù)分布。抽樣分布

(samplingdistribution)是一種理論分布。(實(shí)際中不可能將所有樣本都抽出來(lái))提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。種類(lèi):樣本均值的抽樣分布,樣本比例的抽樣分布,樣本方差的抽樣分布等。 抽樣分布

(samplingdistribution)容量相同的所有可能樣本的樣本均值的概率分布(相對(duì)頻數(shù)分布)。進(jìn)行推斷總體均值的理論基礎(chǔ) 樣本均值的抽樣分布樣本均值的抽樣分布

(例題分析)【例】假設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為x1=1、x2=2、x3=3、x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))樣本均值的抽樣分布

(例題分析)計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)樣本均值的抽樣分布

(例題分析)

的個(gè)數(shù)取值的概率(相對(duì)頻數(shù)分布)1.011/161.522/162.033/162.544/163.033/163.522/164.011/16樣本均值的分布X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5分布形狀均值(數(shù)學(xué)期望)方差樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25樣本均值分布總體分布14230.1.2.3X1.00.1.2.3P(X)1.53.04.03.52.02.5樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X

的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體X中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過(guò)程抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值非正態(tài)分布樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽樣分布

(數(shù)學(xué)期望與方差)總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

樣本比例的抽樣分布

(比例—proportion)在重復(fù)選取樣本量為n的樣本時(shí),由樣本比例的所有可能取值形成的相對(duì)頻數(shù)分布。當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似。若np≥5和n(1-p)≥5,就可認(rèn)為樣本量足夠大。樣本比例的抽樣分布樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽樣分布

(數(shù)學(xué)期望與方差)統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差,稱(chēng)為統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤,有時(shí)也稱(chēng)為標(biāo)準(zhǔn)誤差。標(biāo)準(zhǔn)誤衡量的是統(tǒng)計(jì)量的離散程度,它測(cè)度了用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的精確程度。當(dāng)計(jì)算標(biāo)準(zhǔn)誤時(shí)涉及的總體參數(shù)未知時(shí),用樣本統(tǒng)計(jì)量代替計(jì)算的標(biāo)準(zhǔn)誤,稱(chēng)為估計(jì)的標(biāo)準(zhǔn)誤,也稱(chēng)估計(jì)標(biāo)準(zhǔn)誤差。統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤4.2.1估計(jì)量與估計(jì)值

4.2.2點(diǎn)估計(jì)與區(qū)間估計(jì)4.2參數(shù)估計(jì)的基本原理4.2.1估計(jì)量與估計(jì)值參數(shù)估計(jì)(parameterestimation)就是用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)估計(jì)量:用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱(chēng)如樣本均值,樣本比例,樣本方差等例如:樣本均值就是總體均值的一個(gè)估計(jì)量參數(shù)用表示,估計(jì)量用表示估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來(lái)的統(tǒng)計(jì)量的具體值如果樣本均值x=80,則80就是的估計(jì)值估計(jì)量與估計(jì)值

(estimator&estimatedvalue)4.2.2點(diǎn)估計(jì)與區(qū)間估計(jì)點(diǎn)估計(jì)

(pointestimate)用樣本的估計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接作為總體均值的估計(jì);用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)無(wú)法給出估計(jì)值接近總體參數(shù)程度的信息由于樣本是隨機(jī)的,抽出一個(gè)具體的樣本得到的估計(jì)值很可能不同于總體真值一個(gè)點(diǎn)估計(jì)量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來(lái)衡量的,這表明一個(gè)具體的點(diǎn)估計(jì)值無(wú)法給出估計(jì)的可靠性的度量區(qū)間估計(jì)

(intervalestimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)估計(jì)區(qū)間,該區(qū)間由樣本統(tǒng)計(jì)量加減估計(jì)誤差而得到根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量比如,某班級(jí)平均分?jǐn)?shù)在75~85之間,置信水平是95%

樣本統(tǒng)計(jì)量

(點(diǎn)估計(jì))置信區(qū)間置信下限置信上限區(qū)間估計(jì)的圖示x95%的樣本-1.96x+1.96x99%的樣本-2.58x+2.58x90%的樣本-1.65x+1.65x區(qū)間估計(jì)的圖示Z01.96-1.96Tm+=sXZX95%2.5%2.5%區(qū)間估計(jì)的圖示(未知)x1.96x95%1.96xx2±x1±x3±1.96x1.96x1.96x估計(jì)誤差估計(jì)誤差區(qū)間估計(jì)

(intervalestimate)從同一總體按同一樣本容量可以抽取很多種樣本組合。由不同的樣本組合得到不同的樣本均值,每個(gè)樣本均值都可加減1.96x構(gòu)成一個(gè)區(qū)間。但這些區(qū)間并不是都能把總體均值包含在內(nèi)。只有在抽樣分布圖中處在陰影區(qū)域的任意一個(gè)樣本均值才能夠構(gòu)造一個(gè)包含總體均值在內(nèi)的區(qū)間。由于所有可能的樣本均值有95%處在陰影區(qū)域內(nèi),故樣本均值加減1.96x所形成的所有區(qū)間中也有95%的區(qū)間會(huì)包括總體均值在內(nèi)。一般地,如果將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,所有可能構(gòu)建的區(qū)間中能夠包含真實(shí)總體參數(shù)的區(qū)間個(gè)數(shù)占所有可能區(qū)間的比例稱(chēng)為置信水平。也稱(chēng)為置信度或置信系數(shù)。(前面的95%就是一個(gè)置信水平)一般來(lái)說(shuō),置信度可以用(1-α)×100%表示,其中α是區(qū)間估計(jì)的顯著性水平,是所有可能構(gòu)建的區(qū)間中不包含真實(shí)總體參數(shù)的區(qū)間個(gè)數(shù)占所有可能區(qū)間的比例。α的取值大小由實(shí)際問(wèn)題確定。經(jīng)常取為0.01,0.05,0.10,相應(yīng)的常用置信水平為99%,95%,90%。置信水平

(confidencelevel)

由樣本估計(jì)量構(gòu)造出的總體參數(shù)在一定置信水平下的估計(jì)區(qū)間統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為置信區(qū)間如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù)的真值,那么,用該方法構(gòu)造的區(qū)間稱(chēng)為置信水平為95%的置信區(qū)間。同樣,其他置信水平的區(qū)間也可以用類(lèi)似的方式進(jìn)行表述置信區(qū)間的表述

(confidenceinterval)總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個(gè)隨機(jī)區(qū)間,它會(huì)因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù)實(shí)際估計(jì)時(shí)往往只抽取一個(gè)樣本,此時(shí)所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間。這個(gè)區(qū)間是特定的,我們只能希望它是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)置信區(qū)間的表述

(confidenceinterval)置信區(qū)間的表述

(95%的置信區(qū)間)從均值為185的總體中抽出n=10的20個(gè)樣本構(gòu)造出的20個(gè)置信區(qū)間我沒(méi)有抓住參數(shù)!點(diǎn)估計(jì)值圖有問(wèn)題,區(qū)間寬度不一致一個(gè)特定的區(qū)間總是“包含”或“絕對(duì)不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問(wèn)題置信水平只是告訴我們?cè)诙啻喂烙?jì)得到的區(qū)間中大概有多少個(gè)區(qū)間包含了參數(shù)的真值,而不是針對(duì)所抽取的這個(gè)樣本所構(gòu)建的區(qū)間而言的置信區(qū)間的表述

(confidenceinterval)4.3.1正態(tài)總體、方差已知或非正態(tài)總體、大樣本

4.2.2正態(tài)總體、方差未知、小樣本4.3總體均值的區(qū)間估計(jì)4.3.1正態(tài)總體、方差已知

或非正態(tài)總體、大樣本總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)1. 假定條件總體服從正態(tài)分布,且方差(2)

已知如果不是正態(tài)分布,可由正態(tài)分布來(lái)近似(n

30)樣本均值的抽樣分布服從正態(tài)分布,進(jìn)行標(biāo)準(zhǔn)化使用正態(tài)分布統(tǒng)計(jì)量z總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)

給定置信度1-,可由標(biāo)準(zhǔn)正態(tài)分布表查得臨界值Z/2(怎么查?)

,即,因?yàn)?,把其帶入上式,并作變換,因此,在置信度1-下,總體均值μ的置信區(qū)間就是,總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)【例4.2】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對(duì)產(chǎn)量質(zhì)量進(jìn)行監(jiān)測(cè),企業(yè)質(zhì)檢部門(mén)經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測(cè)得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10克。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計(jì)算得:。由于是正態(tài)總體,且方差已知??傮w均值在1-置信水平下的置信區(qū)間為該食品平均重量的置信區(qū)間為101.44g~109.28g總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)【例4.3】一家保險(xiǎn)公司收集到由36個(gè)投保人組成的隨機(jī)樣本,得到每個(gè)投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間

36個(gè)投保人年齡的數(shù)據(jù)233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差已知或非正態(tài)總體大樣本)解:已知n=36,1-=90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計(jì)算得:,

總體均值在1-置信水平下的置信區(qū)間為投保人平均年齡的置信區(qū)間為37.37歲~41.63歲總體均值的區(qū)間估計(jì)

(例題分析)【例】ABB公司是一家專(zhuān)營(yíng)體育設(shè)備的公司,為了監(jiān)控公司的服務(wù)質(zhì)量,ABB公司每月都要隨機(jī)的抽取一個(gè)顧客樣本進(jìn)行調(diào)查以了解顧客的滿(mǎn)意度分?jǐn)?shù)(從0到100)。根據(jù)以往的調(diào)查,滿(mǎn)意分?jǐn)?shù)的標(biāo)準(zhǔn)差穩(wěn)定在20分左右。最近一次對(duì)100名顧客的抽樣顯示,滿(mǎn)意分?jǐn)?shù)的樣本均值為82分,試建立總體平均滿(mǎn)意分?jǐn)?shù)的區(qū)間。總體均值的區(qū)間估計(jì)

(例題分析)解:已知置信度為95%,得α=1-95%=0.05。查標(biāo)準(zhǔn)正態(tài)分布表,上側(cè)面積α/2=0.025對(duì)應(yīng)的Z值Z0.025=1.96。1-a=95%a/2=0.025a/2=0.0250+1.96-1.96總體均值的區(qū)間估計(jì)

(例題分析)題中,已知樣本均值x=82,總體標(biāo)準(zhǔn)差亦假定已知,σ=20,樣本容量n=100,于是使用前面的公式,得到:即,(78.08,85.92),總體平均滿(mǎn)意分?jǐn)?shù)95%的置信區(qū)間為78.08分~85.92分。常用的置信水平與臨界值的對(duì)應(yīng)除了95%的置信水平經(jīng)常使用外,也可以根據(jù)需要使用90%,99%等置信水平。我們可以把最經(jīng)常使用的一些置信水平所對(duì)應(yīng)的事先求出來(lái),然后直接使用。(不用再查正態(tài)分布表,直接記住即可)常用的置信水平與臨界值的對(duì)應(yīng)置信水平αα/2Zα/290%95%99%0.100.050.010.050.0250.0051.6451.962.58樣本容量一定,置信水平與置信區(qū)間的關(guān)系

(區(qū)間估計(jì)的可靠度與精度的關(guān)系)樣本容量一定置信水平一定,樣本容量與置信區(qū)間的關(guān)系n=100樣本容量一定n=200200當(dāng)置信水平一定時(shí),置信區(qū)間的寬度隨樣本量的增大而減小。置信水平為95%4.3.2正態(tài)總體、方差未知、小樣本總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差未知、小樣本)1. 假定條件總體服從正態(tài)分布,但方差(2)

未知小樣本(n<30)樣本均值經(jīng)過(guò)標(biāo)準(zhǔn)化后的分布為t分布使用t

分布統(tǒng)計(jì)量t分布

t分布是類(lèi)似正態(tài)分布的一種對(duì)稱(chēng)分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴(lài)于稱(chēng)之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt

分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)z總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差未知、小樣本)總體均值在1-置信水平下的置信區(qū)間為總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差未知、小樣本)【例5.3】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測(cè)得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間16燈泡使用壽命的數(shù)據(jù)1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計(jì)

(正態(tài)總體、方差未知、小樣本)解:已知X~N(,2),n=16,1-=95%,t/2=2.131

根據(jù)樣本數(shù)據(jù)計(jì)算得:,

總體均值在1-置信水平下的置信區(qū)間為該種燈泡平均使用壽命的置信區(qū)間為1476.8h~1503.2h總體均值的區(qū)間估計(jì)

(小結(jié))總體均值的區(qū)間估計(jì)

(小結(jié))樣本容量總體分布σ已知σ未知大樣本正態(tài)非正態(tài)小樣本正態(tài)非正態(tài)增大樣本容量至大樣本

4.4總體比例的區(qū)間估計(jì)總體比例的區(qū)間估計(jì)我們?cè)趯?shí)際工作中時(shí)常會(huì)碰到對(duì)總體比例的估計(jì)問(wèn)題。例如:企業(yè)領(lǐng)導(dǎo)想知道本企業(yè)生產(chǎn)的產(chǎn)品中合格品率是多少?商店經(jīng)理想了解對(duì)他們服務(wù)滿(mǎn)意的顧客在全部顧客中所占的比率等等。想了解某人群中男女的比例是多少?想了解某產(chǎn)品的普及率是多少?民意調(diào)查中支持某候選人的比例是多少?總體比例的區(qū)間估計(jì)

(一個(gè)總體比例)1. 假定條件np(成功次數(shù))和n(1-p

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論