抽樣理論及總體參數(shù)的估計(jì)_第1頁(yè)
抽樣理論及總體參數(shù)的估計(jì)_第2頁(yè)
抽樣理論及總體參數(shù)的估計(jì)_第3頁(yè)
抽樣理論及總體參數(shù)的估計(jì)_第4頁(yè)
抽樣理論及總體參數(shù)的估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩108頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)于抽樣理論及總體參數(shù)的估計(jì)第一頁(yè),共一百一十三頁(yè),2022年,8月28日第一節(jié)隨機(jī)抽樣的基本概念與方法一、隨機(jī)抽樣的基本概念總體(Population)--要研究的事物或現(xiàn)象的總體。個(gè)體(Itemunit)--組成總體的每個(gè)元素(成員)。總體容量(Populationsize)--一個(gè)總體中所含個(gè)體的數(shù)量。樣本(Sample)--從總體中抽取的部分個(gè)體第二頁(yè),共一百一十三頁(yè),2022年,8月28日樣本容量(Samplesize)--樣本中所含個(gè)體的數(shù)量。抽樣(Sampling)--為推斷總體的某些重要特征,需要從總體中按一定抽樣技術(shù)抽取若干個(gè)體的過(guò)程。統(tǒng)計(jì)量(Statistic)--由樣本構(gòu)造,用來(lái)估計(jì)總體參數(shù)的函數(shù)。統(tǒng)計(jì)量是樣本的函數(shù),只依賴于樣本;統(tǒng)計(jì)量不含任何參數(shù)。樣本均值、樣本方差等都是統(tǒng)計(jì)量。第三頁(yè),共一百一十三頁(yè),2022年,8月28日二、隨機(jī)抽樣方法(1)簡(jiǎn)單隨機(jī)抽樣(Simplerandomsampling)完全隨機(jī)地選取樣本,要求有一個(gè)完美的抽樣框或有總體中每一個(gè)個(gè)體的詳盡名單。可以采取抽簽或隨機(jī)數(shù)字表的辦法實(shí)現(xiàn)。(2)分層抽樣(Reducedsampling)先將總體分成不同的“層”,然后,在每一“層”內(nèi)進(jìn)行簡(jiǎn)單隨機(jī)抽樣??煞乐购?jiǎn)單隨機(jī)抽樣造成的樣本構(gòu)成與總體構(gòu)成不成比例的現(xiàn)象。第四頁(yè),共一百一十三頁(yè),2022年,8月28日(3)整群抽樣(ClusterSampling)在整群抽樣中,總體首先被分成稱作群的獨(dú)立的元素組,總體中的每一元素屬于且僅屬于某一群。抽取一個(gè)以群為元素的簡(jiǎn)單隨機(jī)樣本,樣本中的所有元素組成樣本。在理想狀態(tài)下,每一群是整個(gè)總體小范圍內(nèi)的代表。(4)系統(tǒng)抽樣(Systematicsampling)又稱等距抽樣。從前k個(gè)元素中隨機(jī)選一個(gè),然后在樣本框中每隔一定距離抽取一個(gè)。第五頁(yè),共一百一十三頁(yè),2022年,8月28日第二節(jié)抽樣分布一、抽樣分布的基本概念1、總體分布2、樣本分布3、抽樣分布總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布第六頁(yè),共一百一十三頁(yè),2022年,8月28日總體第七頁(yè),共一百一十三頁(yè),2022年,8月28日一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布第八頁(yè),共一百一十三頁(yè),2022年,8月28日樣本第九頁(yè),共一百一十三頁(yè),2022年,8月28日從隨機(jī)變量X中,隨機(jī)抽取n個(gè)樣本元素:x1、x2……xn

則f(x1、x2……xn)的統(tǒng)計(jì)量分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 第十頁(yè),共一百一十三頁(yè),2022年,8月28日第十一頁(yè),共一百一十三頁(yè),2022年,8月28日樣本平均數(shù)的抽樣分布1、樣本均值X分布的含義采用隨機(jī)抽樣的方法,從總體中抽取大小為n的一個(gè)樣本,計(jì)算出它的平均值X1,然后將這些個(gè)體放回總體去,再抽取n個(gè)個(gè)體,又可以計(jì)算出平均值X2,…再將n個(gè)個(gè)體放回去,再抽取n個(gè)個(gè)體,如此可以計(jì)算出無(wú)限個(gè)X,這些樣本均值X所有可能值的概率分布叫均值X的抽樣分布.第十二頁(yè),共一百一十三頁(yè),2022年,8月28日設(shè)X1,X2,…,Xn為某總體中抽取的隨機(jī)樣本,X1,X2,…,Xn為相互獨(dú)立,且與總體有相同分布的隨機(jī)變量.(1)當(dāng)總體為正態(tài)分布N(,2)時(shí),X的抽樣分布仍為正態(tài)分布,當(dāng)n越來(lái)越大時(shí),X的離散程度越來(lái)越小,即用X估計(jì)越準(zhǔn)確。第十三頁(yè),共一百一十三頁(yè),2022年,8月28日(2)當(dāng)總體的分布不是正態(tài)分布時(shí),只要樣本容量n足夠大時(shí),樣本均值的分布總是近似正態(tài)分布,此時(shí)要求總體方差2有限。假定總體均值為,方差為2第十四頁(yè),共一百一十三頁(yè),2022年,8月28日一個(gè)正態(tài)總體X~N(2)的情形方差

2已知,的置信區(qū)間推導(dǎo)由選取樞軸量

第十五頁(yè),共一百一十三頁(yè),2022年,8月28日由確定解得的置信度為的置信區(qū)間為第十六頁(yè),共一百一十三頁(yè),2022年,8月28日方差2未知,的置信區(qū)間

由確定故的置信區(qū)間為推導(dǎo)

選取樞軸量公式(2)第十七頁(yè),共一百一十三頁(yè),2022年,8月28日第三節(jié)總體參數(shù)的估計(jì)概括地說(shuō):經(jīng)常需要對(duì)總體進(jìn)行估計(jì)的兩個(gè)數(shù)字特征是:總體的均值和方差。如果將總體的均值和方差視為數(shù)軸上的兩個(gè)點(diǎn),這種估計(jì)稱為點(diǎn)估計(jì)。如果要求估計(jì)總體的均值或方差將落在某一段數(shù)值區(qū)間,這種估計(jì)稱為區(qū)間估計(jì)。第十八頁(yè),共一百一十三頁(yè),2022年,8月28日第三節(jié)總體參數(shù)的估計(jì)一、點(diǎn)估計(jì)1.點(diǎn)估計(jì)

點(diǎn)估計(jì):當(dāng)總體參數(shù)不清楚時(shí),用一個(gè)特定值(一般用樣本統(tǒng)計(jì)量)對(duì)其進(jìn)行估計(jì),稱為點(diǎn)估計(jì)。第十九頁(yè),共一百一十三頁(yè),2022年,8月28日

用樣本平均數(shù)估計(jì)總體平均數(shù)樣本平均數(shù)是總體均值的良好估計(jì)。公式:第二十頁(yè),共一百一十三頁(yè),2022年,8月28日用樣本方差估計(jì)總體方差

同理,用樣本標(biāo)準(zhǔn)差估計(jì)總體標(biāo)準(zhǔn)差第二十一頁(yè),共一百一十三頁(yè),2022年,8月28日1、

一個(gè)好的樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的要求無(wú)偏性是指如果用多個(gè)樣本的統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值時(shí),有的偏大,有的偏小,而偏差的平均數(shù)為0,這時(shí),這個(gè)統(tǒng)計(jì)量就是無(wú)偏估計(jì)量。一致性是指當(dāng)樣本容量無(wú)限增大時(shí),估計(jì)值應(yīng)能越來(lái)越接近它所估計(jì)的總體參數(shù)。即:當(dāng)N時(shí),X,S2n-12。第二十二頁(yè),共一百一十三頁(yè),2022年,8月28日有效性是指當(dāng)總體參數(shù)的無(wú)偏估計(jì)不止一個(gè)統(tǒng)計(jì)量時(shí),無(wú)偏估計(jì)變異性小者有效性高,變異大者有效性低。充分性是指一個(gè)容量為n的樣本統(tǒng)計(jì)量,是否充分地反映了全部n個(gè)數(shù)據(jù)所反映總體的信息,這就是充分性。第二十三頁(yè),共一百一十三頁(yè),2022年,8月28日二、區(qū)間估計(jì)

區(qū)間估計(jì):是指用數(shù)軸上的一段距離表示未知參數(shù)可能落入的范圍。第二十四頁(yè),共一百一十三頁(yè),2022年,8月28日2、一個(gè)好的樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的要求無(wú)偏性是指如果用多個(gè)樣本的統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)值時(shí),有的偏大,有的偏小,而偏差的平均數(shù)為0,這時(shí),這個(gè)統(tǒng)計(jì)量就是無(wú)偏估計(jì)量。一致性是指當(dāng)樣本容量無(wú)限增大時(shí),估計(jì)值應(yīng)能越來(lái)越接近它所估計(jì)的總體參數(shù)。即:當(dāng)N時(shí),X,S2n-12。第二十五頁(yè),共一百一十三頁(yè),2022年,8月28日有效性是指當(dāng)總體參數(shù)的無(wú)偏估計(jì)不止一個(gè)統(tǒng)計(jì)量時(shí),無(wú)偏估計(jì)變異性小者有效性高,變異大者有效性低。充分性是指一個(gè)容量為n的樣本統(tǒng)計(jì)量,是否充分地反映了全部n個(gè)數(shù)據(jù)所反映總體的信息,這就是充分性。第二十六頁(yè),共一百一十三頁(yè),2022年,8月28日二、區(qū)間估計(jì)第二十七頁(yè),共一百一十三頁(yè),2022年,8月28日1、總體均數(shù)的區(qū)間估計(jì)第二十八頁(yè),共一百一十三頁(yè),2022年,8月28日有關(guān)區(qū)間估計(jì)的幾個(gè)概念

置信區(qū)間:區(qū)間估計(jì)是求所謂置信區(qū)間的方法。置信區(qū)間就是我們?yōu)榱嗽黾訁?shù)被估計(jì)到的信心而在點(diǎn)估計(jì)兩邊設(shè)置的估計(jì)區(qū)間。顯著性水平:用置信區(qū)間來(lái)估計(jì)的不可靠程度。

區(qū)間估計(jì)的任務(wù)是,在點(diǎn)估計(jì)值的兩側(cè)設(shè)置一個(gè)區(qū)間,使得總體參數(shù)被估計(jì)到的概率大大增加??煽啃院途_性(即信度和效度)在區(qū)間估計(jì)中是相互矛盾的兩個(gè)方面。第二十九頁(yè),共一百一十三頁(yè),2022年,8月28日

置信度(水平):用置信區(qū)間估計(jì)的可靠性(把握度)4抽樣平均誤差與概率度

Z

抽樣平均誤差:樣本均值抽樣分布的標(biāo)準(zhǔn)差。反映在參數(shù)周圍抽樣平均值的平均變異程度。越大,樣本均值越分散。

第三十頁(yè),共一百一十三頁(yè),2022年,8月28日顯著性水平、置信水平、概率度之間的關(guān)系:

=0.10時(shí),=0.90,Zα/2=1.65=0.05時(shí),=0.95,Zα/2=1.96=0.01時(shí),=0.99,Zα/2=2.58第三十一頁(yè),共一百一十三頁(yè),2022年,8月28日

從點(diǎn)估計(jì)值開始,向兩側(cè)展開一定倍數(shù)的抽樣平均誤差,并估計(jì)總體參數(shù)很可能就包含在這個(gè)區(qū)間之內(nèi)。第三十二頁(yè),共一百一十三頁(yè),2022年,8月28日設(shè)為待估參數(shù),

是一給定的數(shù),(0<<1).

若能找到統(tǒng)計(jì)量,使則稱為的置信水平為1-的置信區(qū)間或區(qū)間估計(jì).置信下限置信上限置信區(qū)間的定義定義第三十三頁(yè),共一百一十三頁(yè),2022年,8月28日

反映了估計(jì)的可靠度,越小,越可靠.置信區(qū)間的長(zhǎng)度反映了估計(jì)精度越小,1-越大,估計(jì)的可靠度越高,但

確定后,置信區(qū)間的選取方法不唯一,

常選最小的一個(gè).幾點(diǎn)說(shuō)明越小,估計(jì)精度越高.這時(shí),往往增大,因而估計(jì)精度降低.第三十四頁(yè),共一百一十三頁(yè),2022年,8月28日第三十五頁(yè),共一百一十三頁(yè),2022年,8月28日

總體平均值的區(qū)間估計(jì)

(一)基本概念總體均值的區(qū)間估計(jì),置信度,置信區(qū)間:日常用語(yǔ)表達(dá):就是估計(jì)總體均值可能在什么范圍之內(nèi)。精確的數(shù)學(xué)語(yǔ)言表達(dá):總體均值的區(qū)間估計(jì)就是確定總體均值將以特定概率落入其間的數(shù)值界限。這個(gè)特定概率稱為置信度(或稱顯著性水平),用表示,這個(gè)數(shù)值界限稱為置信界限,置信界限上下限之間的區(qū)間,稱為置信區(qū)間。第三十六頁(yè),共一百一十三頁(yè),2022年,8月28日求解步驟(1)根據(jù)實(shí)際樣本的數(shù)據(jù),計(jì)算樣本的平均數(shù)和標(biāo)準(zhǔn)差(2)計(jì)算標(biāo)準(zhǔn)誤

a.總體方差已知(查正態(tài)分布表)

b.總體方差未知(查t分布表)(3)確定置信區(qū)間(或顯著性水平)(4)根據(jù)樣本平均數(shù)的分布,確定查何種統(tǒng)計(jì)表(5)確定并計(jì)算置信區(qū)間(6)解釋總體均數(shù)的置信區(qū)間。

第三十七頁(yè),共一百一十三頁(yè),2022年,8月28日不同情況總體均值的區(qū)間估計(jì)總體分布樣本容量2

已知2未知正態(tài)總體大樣本(n≥30)非正態(tài)總體大樣本(n≥30)第三十八頁(yè),共一百一十三頁(yè),2022年,8月28日σ已知條件下,總體平均數(shù)的區(qū)間估計(jì)(1)當(dāng)總體σ已知,總體呈正態(tài)分布,大樣本(n>30)或小樣本(n≤30)時(shí)(2)當(dāng)總體σ已知,總體雖不呈正態(tài)分布,大樣本(n>30)時(shí),樣本平均數(shù)可以轉(zhuǎn)換成標(biāo)準(zhǔn)記分。兩種類型第三十九頁(yè),共一百一十三頁(yè),2022年,8月28日如果一個(gè)隨機(jī)變量Z服從標(biāo)準(zhǔn)正態(tài)分布(=0,2=1的正態(tài)分布),

那么

P{-1.96<Z<1.96}=0.95P{-2.58<Z<2.58}=0.99第四十頁(yè),共一百一十三頁(yè),2022年,8月28日一個(gè)正態(tài)總體X~N(2)的情形方差

2已知,的置信區(qū)間推導(dǎo)由選取樞軸量公式(一)(1)第四十一頁(yè),共一百一十三頁(yè),2022年,8月28日由確定解得的置信度為的置信區(qū)間為第四十二頁(yè),共一百一十三頁(yè),2022年,8月28日對(duì)總體參數(shù)進(jìn)行區(qū)間估計(jì)的方法:第四十三頁(yè),共一百一十三頁(yè),2022年,8月28日在置信區(qū)間[X-1.96SEx,X+1.96SEx]內(nèi),正確估計(jì)總體均值所在區(qū)間的概率為0.95。但是,做這種區(qū)間估計(jì)不可能保證完全無(wú)誤,估計(jì)錯(cuò)誤的概率大約為0.05。第四十四頁(yè),共一百一十三頁(yè),2022年,8月28日例題例1、從某正態(tài)總體中抽取一個(gè)容量為25的樣本,其平均數(shù)為42。已知總體的標(biāo)準(zhǔn)差為6,試估計(jì)總體平均數(shù)的置信度為0.95和0.99的置信區(qū)間第四十五頁(yè),共一百一十三頁(yè),2022年,8月28日5、例題已知某年某地區(qū)高考數(shù)學(xué)成績(jī)的方差為100,從該地區(qū)隨機(jī)抽得20名考生的數(shù)學(xué)成績(jī)?yōu)椋?5、68、38、56、72、75、47、58、70、63、67、64、60、69、61、66、55、76、68、62,試求該地區(qū)這一年高考數(shù)學(xué)平均分95%和99%的置信區(qū)間。第四十六頁(yè),共一百一十三頁(yè),2022年,8月28日第四十七頁(yè),共一百一十三頁(yè),2022年,8月28日同理,總體平均數(shù)99%置信區(qū)間為:第四十八頁(yè),共一百一十三頁(yè),2022年,8月28日答:該地區(qū)這一年高考數(shù)學(xué)平均分95%和99%的置信區(qū)間分別為58.62至67.38分之間和57.23至68.77分之間。由這些計(jì)算結(jié)果可以看到,置信區(qū)間與可靠度有關(guān),可靠度要求越高,置信區(qū)間就越大,反過(guò)來(lái),置信區(qū)間越大,則可靠度就越高,正確估計(jì)的把握就越大。第四十九頁(yè),共一百一十三頁(yè),2022年,8月28日第五十頁(yè),共一百一十三頁(yè),2022年,8月28日

[例]設(shè)某工廠婦女從事家務(wù)勞動(dòng)服從正態(tài)分布

[,0.662],根據(jù)36人的隨機(jī)抽樣調(diào)查,樣本每天平均從事家務(wù)勞動(dòng)的時(shí)間為2.65小時(shí),求的置信區(qū)間(置信度=0.95)。

[解]按題意,此為大樣本,且總體方差已知,又=36,=2.65,=0.66,=0.95。查表得=1.96,代入公式有=2.65±1.96=2.65±0.22

因此,有95%的把握,該廠婦女的平均從事家務(wù)勞動(dòng)的時(shí)間在2.87~2.43小時(shí)之間。第五十一頁(yè),共一百一十三頁(yè),2022年,8月28日課堂練習(xí)例,某弱智兒童學(xué)校的學(xué)生智力水平低于正常兒童,假設(shè)該校學(xué)生的智商分?jǐn)?shù)遵從正態(tài)分布,抽查10名學(xué)生的智力水平,測(cè)得智商如下:85709081727580827679(1)試估計(jì)該校學(xué)生智商分?jǐn)?shù)的平均值(2)如果知道該校學(xué)生智商分?jǐn)?shù)的方差為25,試找出該校學(xué)生平均智商的置信區(qū)間。第五十二頁(yè),共一百一十三頁(yè),2022年,8月28日課堂練習(xí)已知總體為正態(tài)分布,σ=7.07,從總體中隨機(jī)抽取n1=10和n2=36的兩個(gè)樣本,分別計(jì)算出樣本1的平均數(shù)為78,樣本2的平均數(shù)為79,試問(wèn)總體參數(shù)υ的0.95和0.99置信區(qū)間。思考:兩個(gè)結(jié)果之間有何差異性?第五十三頁(yè),共一百一十三頁(yè),2022年,8月28日課堂練習(xí)某班49人期末考試成績(jī)的平均分為85分,標(biāo)準(zhǔn)差s=6,假設(shè)此項(xiàng)考試能反映學(xué)生的學(xué)習(xí)水平,試推論該班學(xué)生學(xué)習(xí)的真實(shí)成績(jī)分?jǐn)?shù)。第五十四頁(yè),共一百一十三頁(yè),2022年,8月28日σ未知條件下總體平均數(shù)的區(qū)間估計(jì)1.σ未知條件下總體平均數(shù)區(qū)間估計(jì)的基本原理當(dāng)總體σ未知,總體呈正態(tài)分布,大樣本或小樣本時(shí)當(dāng)總體σ未知,總體雖不呈正態(tài)分布,大樣本容量較大(n>30)時(shí),樣本平均數(shù)可以轉(zhuǎn)換成t值。第五十五頁(yè),共一百一十三頁(yè),2022年,8月28日方差2未知,的置信區(qū)間

由確定故的置信區(qū)間為推導(dǎo)

選取樞軸量公式(2)第五十六頁(yè),共一百一十三頁(yè),2022年,8月28日求標(biāo)準(zhǔn)誤

計(jì)算標(biāo)準(zhǔn)誤的公式為:

樣本n<30,查t分布表,原則上,若n>30則仍用正態(tài)分布。第五十七頁(yè),共一百一十三頁(yè),2022年,8月28日平均數(shù)標(biāo)準(zhǔn)誤的估計(jì)量有三種算法:第五十八頁(yè),共一百一十三頁(yè),2022年,8月28日條件為:總體為正態(tài)分布,X~N(,2),當(dāng)總體方差2未知時(shí),求總體平均值的置信區(qū)間步驟:由樣本容量為n的隨機(jī)變量X的值X1,X2,X3,····,Xn求出X,S,自由度df=n-1;求出SEx=S/n-1;確定顯著性水平,查t值分布表,找出臨界值;第五十九頁(yè),共一百一十三頁(yè),2022年,8月28日由于P{

t

}=0.95,將公式t=(X-)/SEx代入上式,得:

P{

(X-)/SEx

}=0.95

整理得:

P{X-·SEx

X+·SEx}=0.95

分別求出:

X-·Sn-1/n和X+·Sn-1/n求出總體平均值的置信區(qū)間:

[X-·SEx,X+·SEx]第六十頁(yè),共一百一十三頁(yè),2022年,8月28日課堂練習(xí)例1:對(duì)某校學(xué)生的智商水平進(jìn)行抽樣測(cè)查,共測(cè)量了20名學(xué)生,所得智商分?jǐn)?shù)如下:90,92,94,95,97,98,99,101,101,102,103,104,105,105,106,110,115,120,88,85。問(wèn)該校學(xué)生平均智商分?jǐn)?shù)在什么范圍內(nèi)?

給出平均數(shù)和標(biāo)準(zhǔn)差:

X=Xi/n=100.5S2n-1

=(Xi-X)2/(n-1)=76第六十一頁(yè),共一百一十三頁(yè),2022年,8月28日總體平均數(shù)95%置信區(qū)間為:總體平均數(shù)99%置信區(qū)間為:第六十二頁(yè),共一百一十三頁(yè),2022年,8月28日課堂練習(xí)某校對(duì)高中一年級(jí)學(xué)生進(jìn)行英語(yǔ)水平測(cè)試,測(cè)試后從中抽取的9個(gè)考生的成績(jī)?yōu)?3、91、62、50、74、68、70、65、85,試對(duì)該年級(jí)考生的該次考試成績(jī)均值作區(qū)間估計(jì)(取α=0.05)第六十三頁(yè),共一百一十三頁(yè),2022年,8月28日第六十四頁(yè),共一百一十三頁(yè),2022年,8月28日2、小樣本,且為正態(tài)總體,總體均值的區(qū)間估計(jì)(用分布)第六十五頁(yè),共一百一十三頁(yè),2022年,8月28日

[例]在一個(gè)正態(tài)總體中抽取一個(gè)容量為25的樣本,其均值為52,標(biāo)準(zhǔn)差為12,求置信水平為95%的總體均值的置信區(qū)間。

[解]根據(jù)題意,總體方差未知,且為小樣本,故用分布統(tǒng)計(jì)量。由95%置信水平查分布表得概率度=(24)=2.064

代入公式得=52±2.064=52±5.06

因此,置信水平95%的總體均值的置信區(qū)間是從46.94到57.06。第六十六頁(yè),共一百一十三頁(yè),2022年,8月28日例如:某年高考結(jié)束后從某地區(qū)隨機(jī)抽取20名考生,計(jì)算得他們數(shù)學(xué)的平均分為63,標(biāo)準(zhǔn)差為8.922,試求該地區(qū)這一年高考數(shù)學(xué)平均分95%和99%的置信區(qū)間。第六十七頁(yè),共一百一十三頁(yè),2022年,8月28日解:總體平均數(shù)95%置信區(qū)間為:第六十八頁(yè),共一百一十三頁(yè),2022年,8月28日同理,總體平均數(shù)99%置信區(qū)間為:答:該地區(qū)這一年高考數(shù)學(xué)平均分95%和99%的置信區(qū)間分別為58.72至67.28分之間和57.14至68.86分之間。第六十九頁(yè),共一百一十三頁(yè),2022年,8月28日3.大樣本的情況:首先看抽樣分布如何,一般是t分布。但由t分布的性質(zhì)可知,當(dāng)樣本容量比較大,自由度在逐漸增大,這時(shí)的t分布已經(jīng)非常接近正態(tài)分布。這時(shí)可把t分布轉(zhuǎn)成標(biāo)準(zhǔn)正態(tài)分布來(lái)作處理。然后再作區(qū)間估計(jì)。這時(shí)臨界值就不用查表獲得。當(dāng)顯著水平定為95%時(shí),就可以把1.96直接代入;同理,99%對(duì)應(yīng)2.58。這時(shí)就得到所求估計(jì)區(qū)間。第七十頁(yè),共一百一十三頁(yè),2022年,8月28日

未知,用代替第七十一頁(yè),共一百一十三頁(yè),2022年,8月28日

[例]從某校隨機(jī)地抽取100名男學(xué)生,測(cè)得平均身高為170厘米,標(biāo)準(zhǔn)差為7.5厘米,試求該校學(xué)生平均身高95%的置信區(qū)間。

[解]按題意,此為大樣本,且總體方差未知,又=100,=170,=7.5,=0.95.查表得=1.96,代入公式有=170±1.96=170±1.47因此,有95%的把握,該校學(xué)生的平均身高在168.5~171.5厘米之間。第七十二頁(yè),共一百一十三頁(yè),2022年,8月28日方差2未知總體服從正態(tài)分布,X~N(,2)用S2代替2,建立區(qū)間估計(jì)統(tǒng)計(jì)量置信區(qū)間為:n足夠大,大于等于30時(shí),也可用正態(tài)分布.第七十三頁(yè),共一百一十三頁(yè),2022年,8月28日從某區(qū)小學(xué)五年級(jí)學(xué)生的數(shù)學(xué)推理測(cè)試成績(jī)中隨機(jī)抽取26個(gè),求得其平均數(shù)為86分,標(biāo)準(zhǔn)差為。已知全區(qū)五年級(jí)學(xué)生的數(shù)學(xué)成績(jī)服從正態(tài)分布,請(qǐng)以0.95置信度估計(jì)該區(qū)五年級(jí)數(shù)學(xué)推理測(cè)試成績(jī)的置信區(qū)間第七十四頁(yè),共一百一十三頁(yè),2022年,8月28日總體比率的區(qū)間估計(jì)第七十五頁(yè),共一百一十三頁(yè),2022年,8月28日某種特征占全部單位的比例p,樣本比例為p,在大樣本下(np>5,nq>5),可將二項(xiàng)分布變換為正態(tài)分布總體比例p的置信區(qū)間:第七十六頁(yè),共一百一十三頁(yè),2022年,8月28日隨機(jī)抽取某校小學(xué)二年級(jí)學(xué)生40名用維克斯勒智力測(cè)試量表測(cè)量它們的智力水平,結(jié)果智商成績(jī)?cè)?15分以上的有25名。試已0.95的可靠性估計(jì)全校二年級(jí)學(xué)生智力測(cè)驗(yàn)分?jǐn)?shù)總體在110分以上者占總體比例的置信區(qū)間。第七十七頁(yè),共一百一十三頁(yè),2022年,8月28日第四節(jié)樣本容量的確定一、基本問(wèn)題第七十八頁(yè),共一百一十三頁(yè),2022年,8月28日確定n十分重要,n過(guò)大,增加費(fèi)用,n過(guò)小誤差增大。n的確定依賴于多大置信度(可靠性),什么樣的精度(多寬的區(qū)間)。1、估計(jì)時(shí)n的確定(總體標(biāo)準(zhǔn)差已知)正態(tài)總體或非正態(tài)總體但大樣本時(shí),置信區(qū)間為(用樣本均值估計(jì)時(shí)允許的最大絕對(duì)誤差)第七十九頁(yè),共一百一十三頁(yè),2022年,8月28日已知某小學(xué)六年級(jí)數(shù)學(xué)成績(jī)的標(biāo)準(zhǔn)差為10分。先從該校隨機(jī)抽取一部分學(xué)生,要求有0.95的把握用這部分學(xué)生的數(shù)學(xué)成績(jī)估計(jì)全校六年級(jí)平均成績(jī)的差異不超過(guò)2分,那么最低抽取多少學(xué)生才能滿足這一要求。第八十頁(yè),共一百一十三頁(yè),2022年,8月28日2、總體標(biāo)準(zhǔn)差未知第八十一頁(yè),共一百一十三頁(yè),2022年,8月28日六年級(jí)學(xué)生英語(yǔ)成績(jī)抽樣調(diào)查,抽取一部分,總體標(biāo)準(zhǔn)差估計(jì)值?,F(xiàn)要了解六年級(jí)學(xué)生英語(yǔ)成績(jī)的平均水平,,在0.99的可靠性下,允許最大誤差為3分,抽取的樣本容量應(yīng)多大。第八十二頁(yè),共一百一十三頁(yè),2022年,8月28日樣本容量n,總體方差2,允許誤差,可靠性系數(shù)Z/2的關(guān)系:(1)總體方差越大,需要的樣本容量越大;反之亦然;(2)允許誤差越大,需要的樣本容量越小,反之亦然;(3)可靠性系數(shù)越大,需要的樣本容量越大,反之亦然.例6.11要使95%置信區(qū)間的允許誤差為5,應(yīng)選取多大的樣本容量?假定總體的標(biāo)準(zhǔn)差為25.例6.12一家廣告公司想估計(jì)某類商店去年所花的平均廣告費(fèi)有多少。經(jīng)驗(yàn)表明,總體方差約為1800000。如置信度取95%,并要使估計(jì)值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?第八十三頁(yè),共一百一十三頁(yè),2022年,8月28日3、估計(jì)總體比例時(shí),樣本容量的確定估計(jì)總體比例時(shí),允許的最大絕對(duì)誤差為第八十四頁(yè),共一百一十三頁(yè),2022年,8月28日已知某市一所初中歷屆中考升學(xué)率為0.25,今年的學(xué)生水平與往年相當(dāng),要估計(jì)今年的升學(xué)率,要求誤差不超過(guò)0.02,可靠性為0.95,至少要抽取多少人進(jìn)行調(diào)查。第八十五頁(yè),共一百一十三頁(yè),2022年,8月28日例6.13一家市場(chǎng)調(diào)研公司想估計(jì)某地區(qū)有彩色電視機(jī)的家庭所占的比例。該公司希望對(duì)p的估計(jì)誤差不超過(guò)0.05,要求的可靠程度為95%,應(yīng)取多大容量的樣本?例6.14一項(xiàng)調(diào)查中,總體比率的計(jì)劃值為0.35,則當(dāng)允許的最大絕對(duì)誤差為0.05時(shí),在求其95%置信區(qū)間時(shí)應(yīng)采用多大的樣本容量。第八十六頁(yè),共一百一十三頁(yè),2022年,8月28日二、方差的區(qū)間估計(jì)利用卡方分布公式1公式2第八十七頁(yè),共一百一十三頁(yè),2022年,8月28日利用2分布估計(jì)總體方差2的置信區(qū)間

(1)利用公式1進(jìn)行計(jì)算已知:2=(n-1)S2n-1/2,置信度為0.05

在橫軸上設(shè)2個(gè)臨界點(diǎn)1和2,使:

P{12

2}=0.95,將上式代入,得:

P{1(n-1)S2n-1/2

2}=0.95

兩邊同除(n-1)S2n-1得:

1/(n-1)S2n-1

1/2

2/(n-1)S2n-1

第八十八頁(yè),共一百一十三頁(yè),2022年,8月28日

得總體方差2的置信區(qū)間:

(n-1)S2n-1

/2

2

(n-1)S2n-1

/1

寫成:

[(n-1)S2n-1

/2,(n-1)S2n-1

/1]

其中:1為2/2,2為21-/2

[(n-1)S2n-1

/2/2,(n-1)S2n-1

/21-/2]

第八十九頁(yè),共一百一十三頁(yè),2022年,8月28日課堂練習(xí)某校高中語(yǔ)文畢業(yè)考試中,隨機(jī)抽取15份,其成績(jī)?nèi)缦拢?5,68,72,89,86,78,91,92,79,83,88,90,85,77,82.試確定語(yǔ)文成績(jī)的方差在什么范圍?(5.36,11.54)第九十頁(yè),共一百一十三頁(yè),2022年,8月28日第九十一頁(yè),共一百一十三頁(yè),2022年,8月28日(2)利用公式2計(jì)算

由分布的性質(zhì),我們知道有因此,對(duì)于給定的置信水平,總體方差的區(qū)間估計(jì)為

第九十二頁(yè),共一百一十三頁(yè),2022年,8月28日

[例]

研究者調(diào)查某社區(qū)居民家庭收入情況,現(xiàn)隨機(jī)抽查了10戶,得到樣本方差為S=200(元2),試以90%的置信水平估計(jì)居民總體家庭收入之方差的置信區(qū)間。

[解]根據(jù)題意,查分布表得==3.325

==16.919代入公式有

≤≤所以該社區(qū)居民收入之方差90%置信水平的置信區(qū)間為118.2∽601.5(元2)。第九十三頁(yè),共一百一十三頁(yè),2022年,8月28日課堂練習(xí)例:根據(jù)30名被試的視反應(yīng)時(shí)的實(shí)驗(yàn)結(jié)果,計(jì)算出視反應(yīng)時(shí)的方差為900毫秒,試估計(jì)當(dāng)置信度為0.05時(shí),總體方差的置信區(qū)間。

第九十四頁(yè),共一百一十三頁(yè),2022年,8月28日三、F分布與二總體方差之比的區(qū)間估計(jì)(一)利用F分布估計(jì)二總體方差之比的置信區(qū)間公式由F分布知:F=S2n1-1/S2n2-1,服從F分布,且df1=n1-1,df2=n2-1。又知樣本方差S2是總體方差的無(wú)偏估計(jì),其之比S2n1-1/S2n2-1是圍繞總體方差之比12/22上下波動(dòng),故二總體方差12=22

二個(gè)樣本的總體方差相等的區(qū)間估計(jì)則用下式:12/22=1

而不用12-22=0第九十五頁(yè),共一百一十三頁(yè),2022年,8月28日由于F分布不是對(duì)稱分布,若F分布右側(cè)一端的概率為:

F=S2n1-1/S2n2-1,

則另一側(cè)的概率可用:

F’=1/F=S2n2-1/S2n1-1第九十六頁(yè),共一百一十三頁(yè),2022年,8月28日1.1222第九十七頁(yè),共一百一十三頁(yè),2022年,8月28日2.12=22第九十八頁(yè),共一百一十三頁(yè),2022年,8月28日二、課堂練習(xí)例:8名男女生在某項(xiàng)心理實(shí)驗(yàn)中所得測(cè)量結(jié)果的方差分別為1.12和4.98。問(wèn)男女生測(cè)量值的總體方差是否相等。第九十九頁(yè),共一百一十三頁(yè),2022年,8月28日樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)小結(jié):1.點(diǎn)估計(jì)用樣本平均數(shù)、方差和標(biāo)準(zhǔn)差估計(jì)總體平均數(shù)、方差和標(biāo)準(zhǔn)差公式:第一百頁(yè),共一百一十三頁(yè),2022年,8月28日2.區(qū)間估計(jì)(1)樣本平均數(shù)對(duì)總體平均數(shù)的區(qū)間估計(jì)A??傮w方差2已知,對(duì)總體平均數(shù)的估計(jì)標(biāo)準(zhǔn)誤:SEx=/nZ值:

Z=(X-)/SEx

求解總體平均值估計(jì)的公式:

P{X-1.96SEx<<X+1.96SEx}=0.95第一百零一頁(yè),共一百一十三頁(yè),2022年,8月28日B??傮w方差2未知時(shí),對(duì)總體平均數(shù)的估計(jì)求標(biāo)準(zhǔn)誤公式:求總體平均值的置信區(qū)間:

[X-·SEx,X+·SEx]其中,查t分布表得出臨界值第一百零二頁(yè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論