版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一、抽樣的基本概念
1.樣本容量與樣本個數(shù)
(1)樣本容量。樣本是從總體中抽出的部分單位的集合,這個集合的大小稱為樣本容量,一般用n表示,它表明一個樣本中所包含的單位數(shù)。一般地,樣本單位數(shù)大于30個的樣本稱為大樣本,小于等于30個的樣本稱為小樣本。(2)樣本個數(shù)。樣本個數(shù)又稱樣本可能數(shù)目,它是指從一個總體中可能抽取多少個樣本。樣本個數(shù)的多少與抽樣方法有關(guān)。第一頁,共93頁。第一頁,共93頁。2.重復(fù)抽樣與不重復(fù)抽樣簡單抽樣的抽樣方法有重復(fù)抽樣與不重復(fù)抽樣。(1)重復(fù)抽樣。重復(fù)抽樣(或重置抽樣)是指從總體中抽出一個樣本單位,記錄其標(biāo)志值后,又將其放回總體中繼續(xù)參加下一輪單位的抽取。重復(fù)抽樣的特點是:第一,n個單位的樣本是由n次試驗的結(jié)果構(gòu)成的。第二,每次試驗是獨立的。第三,每個單位在多次試驗中選中的機會(概率)是相同的。在重復(fù)試驗中,樣本可能的個數(shù)是第二頁,共93頁。第二頁,共93頁。(2)不重復(fù)抽樣。不重復(fù)抽樣亦稱為不重置抽樣,即每次從總體抽取一個單位,登記后不放回原總體,下一次繼續(xù)從總體中余下的單位抽取樣本。其特點是:第一,n個單位的樣本由n次試驗結(jié)果構(gòu)成,但由于每次抽出不重復(fù),所以實質(zhì)上相當(dāng)于從總體中同時抽取n個樣本單位。第二,每次試驗結(jié)果不是獨立的。第三,每個單位在多次(輪)試驗中中選的機會是不等的。不重復(fù)抽樣,如果是考慮順序,其樣本可能個數(shù)為如果不考慮順序,其樣本可能個數(shù)為
第三頁,共93頁。第三頁,共93頁。3.總體參數(shù)與樣本統(tǒng)計量(1)總體參數(shù)??傮w分布的數(shù)量特征就是總體的參數(shù),也是抽樣統(tǒng)計推斷的對象。常見的總體參數(shù)有:總體的均值,總體成數(shù)(比例),總體的方差。都是反映總體分布特征的重要指標(biāo)。(總體參數(shù)是常數(shù),但是未知的,需要估計)
第四頁,共93頁。第四頁,共93頁。(2)樣本統(tǒng)計量。與總體參數(shù)相對應(yīng),是樣本的一個函數(shù),是一個隨機變量。我們利用統(tǒng)計量來估計和推斷總體的有關(guān)參數(shù)。常見的統(tǒng)計量有:第五頁,共93頁。第五頁,共93頁。抽樣分布是樣本統(tǒng)計量的概率分布,是一種理論概率分布某個樣本統(tǒng)計量的抽樣分布是由容量相同的所有可能樣本算出的統(tǒng)計量數(shù)值的相對頻數(shù)分布 二、抽樣分布第六頁,共93頁。第六頁,共93頁。抽樣分布總體計算樣本統(tǒng)計量例如:樣本均值、比例、方差樣本第七頁,共93頁。第七頁,共93頁。樣本均值的抽樣分布形成過程
(例題分析)【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為x1=1、x2=2、x3=3、x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差第八頁,共93頁。第八頁,共93頁。樣本均值的抽樣分布
(例題分析)
現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)第九頁,共93頁。第九頁,共93頁。樣本均值的抽樣分布計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布(縱軸為概率)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.5第十頁,共93頁。第十頁,共93頁。樣本均值的分布與總體分布的比較=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X第十一頁,共93頁。第十一頁,共93頁。(一)樣本平均數(shù)的抽樣分布1.重復(fù)抽樣設(shè)從總體中抽出的樣本為由于是重復(fù)抽樣,每個xi都是從總體中隨機抽出的,都是與總體同分布的隨機變量,并且是相互獨立的。我們設(shè)總體的則樣本平均數(shù)的期望值與方差分別是:
第十二頁,共93頁。第十二頁,共93頁。樣本平均數(shù)的方差是總體方差的1/n,因此,樣本平均數(shù)分布的集中趨勢優(yōu)于總體。由于樣本平均數(shù)能“集中”分布于總體平均數(shù)附近,可以考慮用樣本平均數(shù)來估計總體的平均數(shù)。但是估計時難免有誤差,如果該隨機變量的“集中”程度大,這個誤差的嚴重性就會低一些。因此,用抽樣平均數(shù)的標(biāo)準(zhǔn)差來反映抽樣平均數(shù)與總體平均數(shù)的平均誤差程度,稱為抽樣平均誤差,即:第十三頁,共93頁。第十三頁,共93頁。(例4-7)第十四頁,共93頁。第十四頁,共93頁。影響抽樣誤差的因素樣本容量抽樣方式總體內(nèi)部差異第十五頁,共93頁。第十五頁,共93頁。2.不重置抽樣分布樣本平均數(shù)的抽樣分布(考慮順序)第十六頁,共93頁。第十六頁,共93頁。第十七頁,共93頁。第十七頁,共93頁。第十八頁,共93頁。第十八頁,共93頁。第十九頁,共93頁。第十九頁,共93頁。計算結(jié)果表明:在不重復(fù)抽樣條件下,樣本平均數(shù)分布的中心還是總體的中心;而抽樣平均誤差比重復(fù)抽樣要小。不重復(fù)抽樣的平均誤差比重復(fù)抽樣小的原因是:不重復(fù)抽樣抽出后不放回,排除了“每次抽出的都是極端值”的可能,顯然對降低抽樣誤差有利。數(shù)學(xué)上可以證明,在不重置抽樣條件下,抽樣誤差為:當(dāng)N遠大于n時,修正系數(shù)近似1,這時可以不考慮抽樣方式差異,都按重置抽樣處理。第二十頁,共93頁。第二十頁,共93頁。均值分布的數(shù)學(xué)期望和方差抽樣方法 均值 方差 標(biāo)準(zhǔn)差 (1)從無限總體抽樣和有限總體放回抽樣(2)從有限總體不放回抽樣抽樣誤差抽樣誤差第二十一頁,共93頁。第二十一頁,共93頁。總體成數(shù)P是指具有某種特征的單位在總體中的比重。成數(shù)是一個特殊平均數(shù),設(shè)X是0、1變量,即:總體單位有該特征,則X取1,否則取0,則有:——樣本成數(shù)第二十二頁,共93頁。第二十二頁,共93頁。(例4-8)1.重復(fù)抽樣樣本成數(shù)抽樣分布
(二)樣本成數(shù)的抽樣分布第二十三頁,共93頁。第二十三頁,共93頁。2.不重復(fù)抽樣樣本成數(shù)抽樣分布第二十四頁,共93頁。第二十四頁,共93頁。成數(shù)分布的數(shù)學(xué)期望和方差抽樣方法 均值 方差 標(biāo)準(zhǔn)差 (1)從無限總體抽樣和有限總體放回抽樣(2)從有限總體不放回抽樣根據(jù)中心極限定理,只要樣本足夠大,的分布就近似正態(tài)分布。(np和nq大于5時)抽樣誤差抽樣誤差第二十五頁,共93頁。第二十五頁,共93頁。第四節(jié)大數(shù)定理與中心極限定理一、大數(shù)定理獨立同分布的隨機變量設(shè)它們的平均數(shù)為X,方差為σ,即,則對任意的正數(shù)ε,有:說明當(dāng)n充分大時,獨立同分布的一系列隨機變量,其平均數(shù)與它們共同的期望值之間的偏差,可以有很大的把握被控制在任意給定的范圍之內(nèi)。第二十六頁,共93頁。第二十六頁,共93頁。由于成數(shù)指標(biāo)是一個特殊的平均數(shù),大數(shù)定理對成數(shù)指標(biāo)自然也成立。即:第二十七頁,共93頁。第二十七頁,共93頁。二、中心極限定理根據(jù)正態(tài)分布的再生定理:如果總體服從正態(tài)分布,則總體中所有變量相加后仍服從正態(tài)分布,即樣本平均數(shù)服從正態(tài)分布中心極限定理是解釋非正態(tài)總體的:隨機變量X1,X2…Xn,…相互獨立,且服從同一分布,該分布存在有限的期望和方差:則當(dāng)n趨于無窮大時,算術(shù)平均數(shù)近似服從正態(tài)分布,即:第二十八頁,共93頁。第二十八頁,共93頁。結(jié)論:無論總體服從何種分布,只要它的期望值與方差存在,大樣本的平均數(shù)就近似服從正態(tài)分布。對于成數(shù)指標(biāo)也適用(當(dāng)n>30且np>5、nq>5時,為大樣本)第二十九頁,共93頁。第二十九頁,共93頁。練習(xí)題1.設(shè)總體標(biāo)準(zhǔn)差為20,用重復(fù)抽樣方式從總體中抽取容量為20的樣本,則樣本均值的標(biāo)準(zhǔn)差等于()A.1B.4.47C.20D.5.472.設(shè)總體方差為100,用不重復(fù)抽樣方式從3000個單位中抽取容量為200的樣本,則樣本均值的標(biāo)準(zhǔn)差等于(填空)3.已知從總體中抽取一個樣本容量為10的樣本,樣本均值的方差為55,則總體的方差為()A.5.5B.550C.0.55D.551.B2.0.68323.B第三十頁,共93頁。第三十頁,共93頁。第五章參數(shù)估計第一節(jié)點估計和區(qū)間估計第二節(jié)參數(shù)估計中樣本容量的確定第三節(jié)不同抽樣組織形式下的參數(shù)估計第三十一頁,共93頁。第三十一頁,共93頁。參數(shù)估計在統(tǒng)計方法中的地位參數(shù)估計假設(shè)檢驗統(tǒng)計方法描述統(tǒng)計推斷統(tǒng)計第三十二頁,共93頁。第三十二頁,共93頁。抽樣推斷的過程樣本總體樣本統(tǒng)計量例如:樣本均值、比例、方差總體均值、比例、方差等第三十三頁,共93頁。第三十三頁,共93頁。一、總體參數(shù)估計概述總體參數(shù)估計就是以樣本統(tǒng)計量來估計總體參數(shù)。抽樣推斷應(yīng)滿足以下兩個要求:一是估計的精度要求,二是可靠性要求。設(shè)待估計的總體參數(shù)是θ,用以估計該參數(shù)的統(tǒng)計量是,抽樣估計的極限誤差是Δ,即。Δ越小,估計的精度要求越高第一節(jié)點估計和區(qū)間估計第三十四頁,共93頁。第三十四頁,共93頁??煽啃允浅闃庸烙嫳旧碚_性的一個概率保證,通常稱為估計的置信度。用統(tǒng)計量估計總體參數(shù)值,稱為點估計。點估計完全正確的概率通常為0。因此,我們更多的是考慮用樣本統(tǒng)計量去估計總體參數(shù)的范圍,這就是區(qū)間估計。估計中精度要求與可靠性要求是一對矛盾。第三十五頁,共93頁。第三十五頁,共93頁。參數(shù)估計的方法矩估計法最小二乘法最大似然法順序統(tǒng)計量法估計方法點估計區(qū)間估計常用第三十六頁,共93頁。第三十六頁,共93頁。二、點估計(一)點估計的定義點估計就是根據(jù)總體參數(shù)與樣本統(tǒng)計量之間的內(nèi)在聯(lián)系,直接以樣本統(tǒng)計量作為相應(yīng)總體參數(shù)的估計量,點估計又稱為定值估計。常用的點估計量有:第三十七頁,共93頁。第三十七頁,共93頁。點估計的優(yōu)點是,直接給出了總體參數(shù)的估計值,通過樣本資料就能得到總體參數(shù)的具體數(shù)據(jù)。缺點是,不能提供估計準(zhǔn)確性的信息。因此,我們有必要考慮點估計的優(yōu)良性。點估計優(yōu)良性的三條標(biāo)準(zhǔn)是:無偏性、有效性和一致性。第三十八頁,共93頁。第三十八頁,共93頁。1.無偏性無偏性:估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù),即:P(
)BA無偏有偏第三十九頁,共93頁。第三十九頁,共93頁。樣本平均數(shù)是總體平均數(shù)的一個無偏估計,樣本方差是總體方差的一個無偏估計,樣本成數(shù)是總體成數(shù)的一個無偏估計,即:方差的證明如下:第四十頁,共93頁。第四十頁,共93頁。第四十一頁,共93頁。第四十一頁,共93頁。2.有效性有效性:對于同一總體參數(shù)的兩個無偏點估計量,有更小標(biāo)準(zhǔn)差的估計量更有效
AB的抽樣分布的抽樣分布P(
)第四十二頁,共93頁。第四十二頁,共93頁。3.一致性一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)。用公式表示為:AB較小的樣本容量較大的樣本容量P(
)第四十三頁,共93頁。第四十三頁,共93頁。三、區(qū)間估計(一)區(qū)間估計的含義為了彌補點估計可靠性的不足,需要進行區(qū)間估計所謂區(qū)間估計,就是估計總體參數(shù)的區(qū)間范圍,并要求給出區(qū)間估計成立的概率值,即要求:其中和是兩個統(tǒng)計量(),是總體參數(shù)θ區(qū)間估計的下限與上限,α(0<α<1)是區(qū)間估計的顯著性水平,經(jīng)常取1%、5%和10%;1-α稱為置信度。第四十四頁,共93頁。第四十四頁,共93頁。(二)平均數(shù)的區(qū)間估計均值的區(qū)間估計分兩種情況:1.正態(tài)總體方差已知或非正態(tài)總體方差未知(但大樣本),樣本平均數(shù)的估計使用正態(tài)Z統(tǒng)計量。2.正態(tài)總體、方差未知且是小樣本時,樣本平均數(shù)的估計使用t統(tǒng)計量。第四十五頁,共93頁。第四十五頁,共93頁??傮w方差已知使用正態(tài)統(tǒng)計量:對于給出的顯著性水平α,通過(反)查標(biāo)準(zhǔn)正態(tài)分布表可得到臨界值,滿足:即可求總體平均數(shù)在顯著性水平α下的區(qū)間估計:(查標(biāo)準(zhǔn)正態(tài)分布表)第四十六頁,共93頁。第四十六頁,共93頁。臨界值與置信度1-α,兩者間通過查標(biāo)準(zhǔn)正態(tài)表,可互相確定。如果置信度提高,α就要相應(yīng)地減小,臨界值增大。因此,也稱臨界值為概率度,簡記為z,用來間接衡量區(qū)間估計的概率大小。關(guān)于極限誤差、抽樣平均誤差、概率度三者間的關(guān)系,有如下結(jié)果:或第四十七頁,共93頁。第四十七頁,共93頁。對于給出的置信度1-α,得到置信區(qū)間的公式:
(下頁例)當(dāng)總體方差未知(但大樣本)時,式中的用樣本標(biāo)準(zhǔn)差s代替第四十八頁,共93頁。第四十八頁,共93頁。例1.要估計某地區(qū)內(nèi)居民平均每天的看電視時間。隨機抽取了100名居民進行調(diào)查,樣本數(shù)據(jù)顯示平均每人每天看電視時間是4小時。已知總體的標(biāo)準(zhǔn)差σ=1.5小時。試求:該地區(qū)居民每天看電視的平均時間的置信區(qū)間(置信度是95%)。例2.某燈具廠希望估計一批燈泡的平均壽命?,F(xiàn)隨機地抽取50只燈泡進行測試,其平均壽命是1600小時,樣本方差是2500小時平方。試給出這批燈泡平均壽命的區(qū)間估計。(置信度為90%)第四十九頁,共93頁。第四十九頁,共93頁。2.總體方差未知且是小樣本時假定條件總體服從正態(tài)分布,且方差(2)
未知小樣本(n<=30)使用t分布統(tǒng)計量。均值的區(qū)間估計為:(查t分布表)第五十頁,共93頁。第五十頁,共93頁。例3.設(shè)鋼珠的直徑服從正態(tài)分布,現(xiàn)從一批鋼珠中隨機抽出9個,測量它們的直徑,并求得其樣本的平均值是31.06毫米,樣本標(biāo)準(zhǔn)差是0.25毫米。試以95%的概率保證,估計鋼珠直徑的置信區(qū)間。第五十一頁,共93頁。第五十一頁,共93頁。參數(shù)的區(qū)間估計簡單隨機抽樣待估計參數(shù)已知條件置信區(qū)間正態(tài)總體,σ2已知正態(tài)總體,σ2未知且n<=30非正態(tài)總體,n>30總體均值(μ)σ未知時,用Sσ未知時,用S不重復(fù)抽樣,n>30不重復(fù)抽樣,n<=30第五十二頁,共93頁。第五十二頁,共93頁。(三)成數(shù)指標(biāo)的區(qū)間估計1. 假定條件總體服從二項分布可以由正態(tài)分布來近似使用正態(tài)分布統(tǒng)計量Z3.總體比例在1-置信水平下的置信區(qū)間為(注意:p是樣本成數(shù))第五十三頁,共93頁。第五十三頁,共93頁。總體成數(shù)的區(qū)間估計
(例題分析)【例】某城市想要估計下崗職工中女性所占的比例,隨機抽取了100個下崗職工,其中65人為女性職工。試以95%的置信水平估計該城市下崗職工中女性比例的置信區(qū)間解:已知n=100,p=65%,1-=95%,z/2=1.96該城市下崗職工中女性比例的置信區(qū)間為55.65%~74.35%
第五十四頁,共93頁。第五十四頁,共93頁。簡單隨機抽樣待估計參數(shù)已知條件置信區(qū)間無限總體,np和nq都大于5總體成數(shù)(p)有限總體,不重復(fù)抽樣np和nq都大于5第五十五頁,共93頁。第五十五頁,共93頁。練習(xí)題1.當(dāng)給定顯著性水平時,總體參數(shù)的置信區(qū)間
A.0.95B.0.05C.0.975D.1.962.評價點估計優(yōu)良性的標(biāo)準(zhǔn)主要有()A.準(zhǔn)確性B.有效性C.無偏性D.一致性E.全面性3.置信區(qū)間的大小表達了區(qū)間估計的()A.可靠性B.精度C.可靠概率D.顯著性第五十六頁,共93頁。第五十六頁,共93頁。4.置信概率表達了區(qū)間估計的()A.顯著性B.規(guī)范性C.可靠性D.精度5.置信概率越大,則置信區(qū)間相應(yīng)()A.越小B.越大C.不變D.有效6.設(shè)總體服從正態(tài)分布,其中方差已知,則下列說法正確的是()A.當(dāng)置信度減小時,估計的精度提高B.當(dāng)置信度減小時,估計的精度降低C.當(dāng)顯著性水平減小時,估計的精度降低D.當(dāng)顯著性水平減小時,估計的精度提高E.無論置信度如何變化,估計的精度不變第五十七頁,共93頁。第五十七頁,共93頁。7.某快餐店想要估計每位顧客午餐的平均花費金額,按不重復(fù)抽樣在來快餐店消費的200名顧客中選取了49名顧客組成一個簡單隨機樣本。(1)假定總體標(biāo)準(zhǔn)差為15元,求樣本均值的抽樣平均誤差(2)在95%的置信水平下,求極限誤差(3)如果樣本均值為120元,求總體均值95%的置信區(qū)間第五十八頁,共93頁。第五十八頁,共93頁。答案1.A2.BCD3.B4.C5.B6.AC7.(1)1.87(2)3.665(3)(116.335,123.665)第五十九頁,共93頁。第五十九頁,共93頁。2.某微波爐廠家想要了解微波爐進入居民家庭生活的深度。他們從某地區(qū)已購買了微波爐的居民戶中按重復(fù)抽樣隨機抽取了15戶,每戶一個月中使用微波爐的時間(假定總體服從正態(tài)分布)如下(分鐘):300,450,900,50,700,400,520,600,340,280,380,800,750,550,1100。求:(1)該地區(qū)購買微波爐的居民戶中平均一戶一個月使用微波爐時間的點估計(2)試已95%的置信水平估計平均一戶一個月使用微波爐的時間第六十頁,共93頁。第六十頁,共93頁。解:(1)根據(jù)資料計算得出:所以,平均一戶一個月使用微波爐時間的點估計為:其標(biāo)準(zhǔn)差為:第六十一頁,共93頁。第六十一頁,共93頁。(2)已知總體服從正態(tài)分布,且n=15,應(yīng)用t統(tǒng)計量,1-=95%,=0.05,查表得:,由(1)得:
總體均值在1-置信水平下的置信區(qū)間為即平均一戶一個月使用微波爐的時間的置信區(qū)間為(390.16,692.5)分鐘第六十二頁,共93頁。第六十二頁,共93頁。第二節(jié)參數(shù)估計中樣本量的確定在區(qū)間估計中,過寬的置信區(qū)間往往沒有意義,而過小的區(qū)間,其可靠性又很低。在樣本量一定的條件下,這對矛盾不可調(diào)和。如果想要縮小置信區(qū)間(即提高精度)又不降低可靠性,就要增大樣本量。但樣本量的增加又會受到調(diào)查費用和工作量的限制。所以,應(yīng)找到樣本量與精度以及可靠度的最優(yōu)結(jié)合點。第六十三頁,共93頁。第六十三頁,共93頁。一、估計總體均值時樣本量的確定1.總體方差已知,重復(fù)抽樣:樣本容量n與總體方差、極限誤差、概率度之間的關(guān)系為:與總體方差成正比與極限誤差成反比與概率度成正比第六十四頁,共93頁。第六十四頁,共93頁。2.總體方差已知,不重復(fù)抽樣:第六十五頁,共93頁。第六十五頁,共93頁。二、估計成數(shù)時樣本量的確定1.重復(fù)抽樣:2.不重復(fù)抽樣:第六十六頁,共93頁。第六十六頁,共93頁。樣本數(shù)的確定待估計參數(shù)已知條件樣本數(shù)的確定正態(tài)總體,σ2已知,重復(fù)抽樣總體均值(μ)簡單隨機抽樣有限總體,不重復(fù)抽樣,σ2已知總體成數(shù)(P)服從正態(tài)分布,重復(fù)抽樣有限總體,不放回抽樣第六十七頁,共93頁。第六十七頁,共93頁。三、確定樣本量時應(yīng)注意的問題1.一般總體方差與成數(shù)都是未知的,可用有關(guān)資料替代:一是用歷史資料代替;二是在進行正式抽樣調(diào)查前進行幾次試驗性調(diào)查,用試驗中方差的最大值代替總體方差;三是成數(shù)方差在完全缺乏資料的情況下,就用成數(shù)方差的最大值0.25代替(當(dāng)p=0.5時方差最大)。2.如果一次抽樣調(diào)查,同時估計總體均值與成數(shù),則計算出兩個樣本容量,應(yīng)取其中的最大值。3.計算結(jié)果如果帶小數(shù),不按四舍五入法取整數(shù),而是都進位。取比這個數(shù)大的最小整數(shù)。(下頁例)第六十八頁,共93頁。第六十八頁,共93頁。例1.對某型號電池進行電流強度檢驗,根據(jù)以往正常生產(chǎn)的經(jīng)驗數(shù)據(jù),已知電流強度的標(biāo)準(zhǔn)差為0.4安培,合格率為90%。采用重復(fù)抽樣,需要在95%的概率保證下,抽樣平均電流的誤差范圍不超過0.08安培,抽樣合格率誤差范圍不超過5%,試問應(yīng)抽取多少單位作為樣本?(n=139)第六十九頁,共93頁。第六十九頁,共93頁。例2.對某企業(yè)產(chǎn)品合格率進行抽樣調(diào)查,根據(jù)歷史上進行的兩次調(diào)查資料,合格率分別為90%和80%,這次抽樣調(diào)查誤差不超過4%,概率保證程度為90%,問至少應(yīng)抽出多少產(chǎn)品作為樣本?(n=271)第七十頁,共93頁。第七十頁,共93頁。練習(xí)某超市想要估計每個顧客平均每次購物花費的金額。根據(jù)過去的經(jīng)驗,標(biāo)準(zhǔn)差大約為120元,現(xiàn)要求以95%的置信水平估計每個購物金額的置信區(qū)間,并要求極限誤差不超過20元,應(yīng)抽取多少個顧客作為樣本?(n=139)第七十一頁,共93頁。第七十一頁,共93頁。第三節(jié)不同抽樣組織形式下的參數(shù)估計一、類型抽樣二、整群抽樣三、等距抽樣四、不同抽樣組織設(shè)計的比較第七十二頁,共93頁。第七十二頁,共93頁。一、類型抽樣類型抽樣也稱分層抽樣,它是按一定標(biāo)志對總體各單位進行分類,然后分別從每一類中按隨機原則抽取一定的單位構(gòu)成樣本。例如:調(diào)查我國居民消費狀況,可以從各省份按一定的比例抽取樣本。優(yōu)點(與簡單隨機抽樣相比):1.可以避免樣本全來自某一個或幾個省份所產(chǎn)生的系統(tǒng)偏差,保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,使得抽樣誤差與組間方差無關(guān),從而提高估計的精度;2.組織實施調(diào)查方便;3.既可以對總體參數(shù)進行估計,也可以對各層的目標(biāo)量進行估計。第七十三頁,共93頁。第七十三頁,共93頁??傮wN樣本n均值:平均層內(nèi)方差:估計第七十四頁,共93頁。第七十四頁,共93頁。同樣不重復(fù)抽樣條件下的抽樣平均誤差為:所以,整群重復(fù)抽樣條件下的抽樣平均誤差為:(下例)均值的區(qū)間估計為:或第七十五頁,共93頁。第七十五頁,共93頁。例.假設(shè)某農(nóng)場種植小麥1200畝,根據(jù)其地理條件劃分為三類,按5%的比例重復(fù)抽樣總共抽取60畝進行調(diào)查,結(jié)果如下表所示。試以95%的概率估計農(nóng)場平均畝產(chǎn)量的置信區(qū)間。麥田類型總體面積抽查面積抽樣平均畝產(chǎn)(斤)畝產(chǎn)標(biāo)準(zhǔn)差(斤)甲6003060020乙3601846025丙2401240036合計120060————第七十六頁,共93頁。第七十六頁,共93頁。二、整群抽樣整群抽樣就是將總體各單位分成若干群,然后從其中隨機抽取部分群,對中選的群進行全面調(diào)查的抽樣組織方式。特點:1.整群抽樣只需群的抽樣框,可簡化工作量。2.整群抽樣調(diào)查的地點相對集中,節(jié)省調(diào)查費用,方便實施。3.整群抽樣都是不重復(fù)抽樣。4.缺點是估計的精度較差,抽樣平均誤差只取決于群間方差第七十七頁,共93頁。第七十七頁,共93頁。總體群數(shù)RABCDEFGHIJKLMNOPLHPD樣本群數(shù)r估計均值:群間方差:置信區(qū)間抽樣誤差(下例)第七十八頁,共93頁。第七十八頁,共93頁。例.某水泥廠大量連續(xù)生產(chǎn)100公斤裝水泥,一晝夜產(chǎn)量為14400袋,平均每分鐘產(chǎn)量10袋?,F(xiàn)每隔144分鐘抽取一分鐘的產(chǎn)量(10袋為一群),一晝夜共抽取100袋水泥,結(jié)果如下。試以95%的概率估計每袋水泥重量的區(qū)間。樣本編號各群每袋平均重量樣本編號各群每袋平均重量19869821027100310489641069100510010106(P112)第七十九頁,共93頁。第七十九頁,共93頁。三、等距抽樣等距抽樣又稱機械抽樣或系統(tǒng)抽樣,它是將總體各單位按某一標(biāo)志進行排列,然后按固定的間隔來抽取樣本單位的抽樣組織形式。等距抽樣的間隔大小為k=N/n。優(yōu)點:操作簡便,可提高估計的精度缺點:對估計量方差的估計比較困難(等距抽樣的間隔,應(yīng)避免與現(xiàn)象本身的節(jié)奏性或循環(huán)周期相重合)第八十頁,共93頁。第八十頁,共93頁。等距抽樣樣本平均數(shù):為了方便起見,可以采用簡單隨機抽樣的平均誤差代替等距抽樣平均誤差:
(下例)第八十一頁,共93頁。第八十一頁,共93頁。例.某塊麥地長300米,寬120米,包括120條垅,每垅長300米。現(xiàn)按等距抽樣抽取50個2米長的垅作為樣本進行試驗,數(shù)據(jù)如下。試以95%的概率估計畝產(chǎn)量的置信區(qū)間和這塊麥地總產(chǎn)量的區(qū)間。樣本產(chǎn)量x(公斤)單位數(shù)n0.861.0121.2141.4121.66合計50第八十二頁,共93頁。第八十二頁,共93頁。四、不同抽樣組織設(shè)計的比較1.簡單隨機抽樣是基本抽樣組織方式代表性好的樣本,就是要避免抽樣人員的“主觀”影響,抽取樣本都要滿足“隨機性”任何概率推斷,抽樣設(shè)計時都應(yīng)考慮在某個階段或某個環(huán)節(jié)上遵從隨機性要求,否則的話,樣本的代表性就值得懷疑。第八十三頁,共93頁。第八十三頁,共93頁。2.類型抽樣與整群抽樣比較類型抽樣的平均誤差與組間方差無關(guān),決定于組內(nèi)方差的平均水平;整群抽樣的平均誤差與群內(nèi)方差無關(guān),決定于群間方差大小??傮w方差等于組間方差加上組內(nèi)方差的平均數(shù)。我們由此可推導(dǎo)出減小類型抽樣與整群抽樣平均誤差的方法。第八十四頁,共93頁。第八十四頁,共93頁。練習(xí)1.調(diào)查學(xué)生在校外上網(wǎng)情況,事先將學(xué)生按性別分類,然后從每一類中隨機抽取若干名學(xué)生進行調(diào)查,這稱為()A.等距抽樣B.整群抽樣C.分層抽樣D.簡單隨機抽樣2.以樣本統(tǒng)計量估計總體參數(shù),要求該估計量的數(shù)學(xué)期望等于被估計的總體參數(shù),這一數(shù)學(xué)性質(zhì)稱為()A.一致性B.無偏性C.有效性D.期望性第八十五頁,共93頁。第八十五頁,共93頁。3.用簡單隨機重復(fù)抽樣抽取樣本單位,如果要使抽樣平均誤差降低50%,則樣本容量要擴大到原來的()A.2倍B.3倍C.3.5倍D.4倍4.某工廠連續(xù)性生產(chǎn),為檢查產(chǎn)品質(zhì)量,在24小時中,每隔30分鐘取2分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025西安市家庭居室裝飾裝修工程施工合同
- 2025年度餐飲行業(yè)廚師技藝傳承勞動合同3篇
- 二零二五年度創(chuàng)業(yè)型企業(yè)環(huán)保設(shè)施改造與合規(guī)性評估合同4篇
- 2025年度鮮活易腐物品臨時運輸合同2篇
- 2025珠海市物業(yè)服務(wù)合同范本
- 二零二五年度商場窗簾定期更換與維護服務(wù)合同范本2篇
- 二零二四年度醫(yī)療機構(gòu)臨床急需藥品采購合同3篇
- 2025關(guān)于辦公樓的建設(shè)合同
- 2025年度木材電商平臺供應(yīng)鏈管理采購合同3篇
- 2025年度門窗安裝與建筑節(jié)能改造工程合同4篇
- 春節(jié)聯(lián)歡晚會節(jié)目單課件模板
- 中國高血壓防治指南(2024年修訂版)
- 糖尿病眼病患者血糖管理
- 抖音音樂推廣代運營合同樣本
- 2024年電信綜合部辦公室主任年度述職報告(四篇合集)
- 微機原理與接口技術(shù)考試試題及答案(綜合-必看)
- 濕瘡的中醫(yī)護理常規(guī)課件
- 初中音樂聽課筆記20篇
- NUDD新獨難異 失效模式預(yù)防檢查表
- 內(nèi)蒙古匯能煤電集團有限公司長灘露天煤礦礦山地質(zhì)環(huán)境保護與土地復(fù)墾方案
- 排水干管通球試驗記錄表
評論
0/150
提交評論