抽樣調(diào)查-整群抽樣培訓(xùn)課件(共83頁).ppt_第1頁
抽樣調(diào)查-整群抽樣培訓(xùn)課件(共83頁).ppt_第2頁
抽樣調(diào)查-整群抽樣培訓(xùn)課件(共83頁).ppt_第3頁
抽樣調(diào)查-整群抽樣培訓(xùn)課件(共83頁).ppt_第4頁
抽樣調(diào)查-整群抽樣培訓(xùn)課件(共83頁).ppt_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、返回4.1 整群抽樣一、整群抽樣的定義與特點 1.1.整群抽樣的定義整群抽樣的定義整群抽樣是將整體劃分為若干群整群抽樣是將整體劃分為若干群, ,然后然后 以群為抽樣以群為抽樣單元單元, ,從總體中隨機抽取一部分群,對抽中的群中的所從總體中隨機抽取一部分群,對抽中的群中的所有基本單元進行調(diào)查的一種抽樣技術(shù)。有基本單元進行調(diào)查的一種抽樣技術(shù)。 2.2.整群抽樣的優(yōu)點整群抽樣的優(yōu)點(1 1)抽樣框編制得以簡化)抽樣框編制得以簡化(2 2)實施調(diào)查便利,節(jié)約費用)實施調(diào)查便利,節(jié)約費用 3.3.整群抽樣的缺點整群抽樣的缺點:抽樣誤差較大:抽樣誤差較大。返回二、群的劃分 整群抽樣中的群大致可分為兩類:一

2、類是根據(jù)行政或地域形成的群體,如學(xué)校企業(yè)是根據(jù)行政或地域形成的群體,如學(xué)校企業(yè)和街道,對此采用整群調(diào)查是為了方便調(diào)查,節(jié)和街道,對此采用整群調(diào)查是為了方便調(diào)查,節(jié)約費用。約費用。另一類類群則是調(diào)查人員人為確定的,如將一大塊群則是調(diào)查人員人為確定的,如將一大塊面積劃分若干塊較小面積的群,這時就需要考慮面積劃分若干塊較小面積的群,這時就需要考慮如何劃分群,以使在相同調(diào)查費用下調(diào)查誤差最如何劃分群,以使在相同調(diào)查費用下調(diào)查誤差最小。小。返回 群劃分的一般原則群劃分的一般原則 為了提高精度為了提高精度, ,劃分群時應(yīng)力爭使同一群內(nèi)各單劃分群時應(yīng)力爭使同一群內(nèi)各單元之間的差異盡可能大元之間的差異盡可能大

3、, ,以避免同一群內(nèi)各單元提以避免同一群內(nèi)各單元提供重復(fù)信息供重復(fù)信息. .這個原則與分層抽樣中劃分層的原則這個原則與分層抽樣中劃分層的原則恰好相反恰好相反. .由此看來由此看來, ,整群抽樣和分層抽樣是針對不整群抽樣和分層抽樣是針對不同總體結(jié)構(gòu)而提出的兩種不同抽樣方法同總體結(jié)構(gòu)而提出的兩種不同抽樣方法. .返回三、群的規(guī)模群的規(guī)模是指組成群的單元的數(shù)量。群的規(guī)模大,估計的精度差,但費用省;群的規(guī)模小,估計的精度可以提高但費用增大。實踐中,確定群的規(guī)模涉及多種因數(shù),如群的具體 結(jié)構(gòu)、精度、費用、調(diào)查實施的組織管理等。群的規(guī)模又有兩種情況:一種是總體中的各個群規(guī)模相等;另一種是總體中各個群的規(guī)模

4、不相等。返回四、附號說明總體第 i 群中第 j個單元的指標(biāo)值:ijY樣本第 i 群中第 j個單元的觀測值:ijy總體群(PSU)數(shù):N 樣本群數(shù):n第i個群中的單元(SSU)數(shù)量:iM總體中單元總數(shù):NiiMM10返回總體中第i群的群總值:iMiijiYY1樣本中第i群的群總值:iMiijiyy1總體中第i群的個體均值:MYYii樣本中第i群的群均值:Myyii總體中的群均值:niiNYY1樣本中的群均值:niinyy1返回總體中的個體均值:總體中的個體均值:011MYYijNiMji總體方差總體方差:NiMjijYYMS11202)(11樣本方差:樣本方差:nimjiijniiiyyms11

5、212)(11返回總體群間方差:總體群間方差:NiiMjbYYNSi1212)(11樣本群間方差:樣本群間方差:niimjbyynsi1212)(11返回總體中第總體中第i個群群內(nèi)方差:個群群內(nèi)方差:iMjiiijiMYYS1221)(樣本第樣本第i個群群內(nèi)方差:個群群內(nèi)方差:imjiiijimyys1221)(返回群規(guī)模相等時整群抽樣樣本群內(nèi)方差:niiijMjwyyMns1212)() 1(1群規(guī)模相等時整群抽樣總體群內(nèi)方差:NiMjiijwYYMNS1122)() 1(1返回4.2 等概率整群抽樣 在在N個初級抽樣單元中,第個初級抽樣單元中,第i個初級單元含個初級單元含個二級抽樣單元。對

6、于整群抽樣而言,被抽中的個二級抽樣單元。對于整群抽樣而言,被抽中的群中所有二級單元全部入樣。群中所有二級單元全部入樣。 我們先考慮最簡單的情形:每個群所包含的單我們先考慮最簡單的情形:每個群所包含的單元數(shù)元數(shù)M相等,稱為群規(guī)模相等。(實際問題中只要相等,稱為群規(guī)模相等。(實際問題中只要群規(guī)模接近,也可視為群規(guī)模相等)。群規(guī)模接近,也可視為群規(guī)模相等)。 在群規(guī)模相等的情況下,整群抽樣一般采用簡在群規(guī)模相等的情況下,整群抽樣一般采用簡單隨機抽樣方法抽取群,這時對總體均值的估計單隨機抽樣方法抽取群,這時對總體均值的估計十分簡單。十分簡單。iM返回一、群規(guī)模相等時的估計YniiniMjijynnMy

7、y11111 1、均值估計量、均值估計量 及其方差及其方差 若按簡單隨機抽樣若按簡單隨機抽樣,且群的大小相等且群的大小相等,都等都等于于 M ,則對總體,則對總體 均值的估計為:均值的估計為:y返回定理定理4.14.1 是是 的無偏估計,即的無偏估計,即yYYyE)( 這樣的結(jié)果是顯然的,因為是按簡單隨機這樣的結(jié)果是顯然的,因為是按簡單隨機方法抽取群,所以樣本群均值方法抽取群,所以樣本群均值 是總體群均是總體群均值值 的無偏估計,因而的無偏估計,因而yYYMYyE)(返回證明:因為 , yMy ),()(2yVMyV1)(1)(12NYYnfyVNii所以2121) 1()(1)(bNiiSn

8、MfNMYYnMfyV定理定理4.2 的方差為:NiiYYNnfyV12)(111)(21bSnMfy返回的樣本估計為:定理定理4.3)(yV21)(bsnMfyv由于22bbSs 是的無偏估計,)()(yVyv是因而的無偏估計??傮w總值 YNMY 的估計量為:yNMY 返回總體總值 YNMY 的估計量的方差為:)()()(22yVMNyNMVYV2222)1()()(bSnfMNyvMNYv下面我們看一個整群抽樣的例題下面我們看一個整群抽樣的例題返回【例例4.114.11】 在一次對某中學(xué)在校生零花錢的調(diào)查在一次對某中學(xué)在校生零花錢的調(diào)查中,以宿舍作為群進行整群抽樣,每個宿舍都有中,以宿舍作

9、為群進行整群抽樣,每個宿舍都有M=6M=6名學(xué)生。用簡單隨機抽樣在全部名學(xué)生。用簡單隨機抽樣在全部N=315N=315間宿舍中抽取間宿舍中抽取n=8n=8間宿舍。全部間宿舍。全部4848個學(xué)生上周每人的零花錢個學(xué)生上周每人的零花錢 及及相關(guān)計算數(shù)據(jù)如下表。試估計該學(xué)校學(xué)生平均每周相關(guān)計算數(shù)據(jù)如下表。試估計該學(xué)校學(xué)生平均每周的零花錢的零花錢 ,并給出其,并給出其95%95%置信區(qū)間。置信區(qū)間。ijyY返回158837482668775.0125.629183791111016989.0233.631238994109798095.67299.074991059810712990104.67177

10、.875110991328799124108.50287.50611110011699107105106.3342.27712011511799106120112.8372.5789580631301058693.33527.878個宿舍個宿舍48名學(xué)生每周零花錢支出額名學(xué)生每周零花錢支出額iijyiy2is返回解:解:已知已知故故,0254. 0, 6, 8,315NnfMnN63.926)17.9833.93()17.9875(186)(117.98833.938975122121yynMsynyniibnii返回下面計算估計量方差的估計值:下面計算估計量方差的估計值:34. 481.18

11、)()(81.1863.926680254. 011)(2yvyssnMfyvb于是置信度為于是置信度為95%的置信區(qū)間為的置信區(qū)間為98.171.964.34,也即也即89.66元,元,106.68元】元】返回2 2、整群抽樣效率分析、整群抽樣效率分析 在整群抽樣中,由于在整群抽樣中,由于 估計量的方差主要依賴群間的變異性。因此估計量的方差主要依賴群間的變異性。因此整群抽樣中整群抽樣中 較大,則整群抽樣就會損失精度。較大,則整群抽樣就會損失精度。下面我們用下面我們用方差分析方差分析表來討論這一問題。表來討論這一問題。21)(bSnMfyV22wbSS返回群規(guī)模相等時的整群抽樣 總體方差分析表

12、來源來源自由度自由度平方和平方和均方均方群間群間群內(nèi)群內(nèi)總計總計1)(12211NSSBSYYSSBNbNiMji) 1()() 1(2211MNSSWSYYSSWMNwiNiMji1)(12211NMSSTSYYSSTNMNiMjij返回 我們將整群抽樣與簡單隨機抽樣的效率進行我們將整群抽樣與簡單隨機抽樣的效率進行比較,假設(shè)直接從總體中抽取一個樣本容量為比較,假設(shè)直接從總體中抽取一個樣本容量為nM的簡單隨機樣本,則樣本均值的方差為:的簡單隨機樣本,則樣本均值的方差為: 221)1 ()(SnMfnMSNMnMyVsrs 但如果該整體被等分為但如果該整體被等分為N個規(guī)模為個規(guī)模為M的群,定義的

13、群,定義 為群內(nèi)相關(guān)系數(shù)為群內(nèi)相關(guān)系數(shù),描述同一群內(nèi)成對個體單元之間描述同一群內(nèi)成對個體單元之間的相關(guān)程度的相關(guān)程度,其表達(dá)式為:其表達(dá)式為:返回2)()(YYEYYYYEijikij根據(jù)組合及平均值的計算,根據(jù)組合及平均值的計算, 又可表示為:又可表示為:21) 1)(1()(2SNMMYYYYNiMkjikij返回事實上,前面提到的事實上,前面提到的 可以用群內(nèi)相關(guān)系數(shù)可以用群內(nèi)相關(guān)系數(shù)近似表示:近似表示:)(yVNiiYYNnMfyVMyV1222)(11.1)(1)() 1(1.) 1(1.122MSNMNMnf) 1(1 12MSnMf返回若采用簡單隨機抽樣,直接從總體中抽取nM個個

14、體單元,則y的方差公式為:21)(SnMfyVsrs由此,可以計算等群抽樣的設(shè)計效應(yīng):) 1(1)()(MyVyVdeffSRS這表明,整群抽樣的方差約為簡單隨機抽樣方差的 倍倍) 1(1 M返回整群抽樣估計效應(yīng)與群內(nèi)相關(guān)系數(shù) 關(guān)系密切,若群內(nèi)各單元的值都相等,則群內(nèi)方差02wS此時,1為最大值,Mdeff 即整群抽樣的估計量方差是簡單隨機抽樣估計量方差的倍。若群內(nèi)方差與整體方差相等,即, 01deff整群抽樣與簡單隨機抽樣估計的效應(yīng)相當(dāng)。返回若群內(nèi)方差大于總體方差時,的取值為負(fù),, 1deff此時,整群抽樣的效率高于簡單隨機抽樣。因此,要提高整群抽樣的效率,就要通過分群盡可能降低 值。這一點

15、是通過增大群內(nèi)單元之間的差異實現(xiàn)的。 對于自然形成的群而言,無法通過調(diào)整群內(nèi)單元對于自然形成的群而言,無法通過調(diào)整群內(nèi)單元而控制的而控制的 取值。這時,要想減少抽樣誤差,就只能取值。這時,要想減少抽樣誤差,就只能增大樣本容量。增大樣本容量。返回 另外,群內(nèi)相關(guān)系數(shù) 也可以用群內(nèi)方差 和群間方差 表示,并由樣本統(tǒng)計量 估計:2wS2bS22,bwss2222) 1(wbwbsMsss返回【例【例 4.24.2】 估計例估計例4.14.1中以宿舍為群的群內(nèi)相關(guān)系數(shù)中以宿舍為群的群內(nèi)相關(guān)系數(shù)與設(shè)計效應(yīng)與設(shè)計效應(yīng). .解:解:由例由例4.1已計算出樣本群間方差已計算出樣本群間方差而樣本群內(nèi)方差為:而樣

16、本群內(nèi)方差為:6648.9282bs79.2201)(111)() 1(1122112112niiiMjijniniMjiijwsnyyMnyyMns返回由相關(guān)系數(shù)的估計式有由相關(guān)系數(shù)的估計式有741. 2348256. 0) 16(1) 1(1348256. 0) 1(2222MdeffsMssswbwb 設(shè)計效應(yīng)設(shè)計效應(yīng)2.7412.741表明,在這項調(diào)查中,為達(dá)到表明,在這項調(diào)查中,為達(dá)到同樣的估計精度,整群隨機抽樣的樣本量大約為同樣的估計精度,整群隨機抽樣的樣本量大約為簡單隨機抽樣樣本量的簡單隨機抽樣樣本量的2.742.74倍而此時簡單隨機倍而此時簡單隨機抽樣的樣本量為抽樣的樣本量為:

17、 :1874. 268deffnMnsrs返回采用整群抽樣,如果各群規(guī)模iM不等,情況會復(fù)雜一些.此時,有多種不同的抽樣方法.1、等概抽樣,簡單估計此時,不考慮群規(guī)模不等的影響,抽樣方法與前節(jié)群規(guī)模相等時相同,估計方法也相同,即采用簡單隨機抽樣。對總體均值 的估計為:YnijiijniiiMMynyny11111二、群規(guī)模不等時的估計返回niiyynnfyv12)(11.1)(因為群規(guī)模不等,估計時又未考慮權(quán)數(shù),所以因為群規(guī)模不等,估計時又未考慮權(quán)數(shù),所以估計量估計量 是有偏的。是有偏的。y的方差估計為:的方差估計為:y返回2、等概抽樣,加權(quán)估計基本思路:以群規(guī)模 為權(quán)數(shù),乘以各群iM均值iy

18、,得到群觀察總值iy,再將樣本中n個群的群總和平均。估計公式為:niiniiiMyyMnMnyMy111返回 如果總體群平均規(guī)模 未知,可以用樣本群M平均規(guī)模nMmnii1代替.因此得到總體總值 Y的估計:yMY0式中,NiiMM10為總體中的個體單元總數(shù).總體總值估計量 的方差:Y1)()1 ()(122NYYnfNYVNii返回它的無偏估計為:1)()1 ()(122nyynfNYvNii對均值估計 而言:y1)()1 ()(1)(1220220NYYnMfNYVMYVNii與簡單估計相比,加權(quán)估計的方法考慮了群規(guī)模iM,所以估計量 分別是 的無偏估計.Yy和YY和返回3、等概抽樣,比率估

19、計總體均值采用比率估計的形式為:niiniiMyy11與第三章比率估計的區(qū)別在于,這里的輔助變量可知,它是一個有偏的.當(dāng)樣本群數(shù) n 很大時,其不是 ,而是群的規(guī)模 .從比率估計量的性質(zhì)可iXiM偏倚很小,可以忽略??傮w總值 Y 的比率估計為:niiniiMyMyMY1100返回根據(jù)比率估計量的方差公式,估計量 Yy與的方差分別為:1)(1)(122NMYYMnfyVNiii1)(11222NYYMMnfNiii)()()(2220yVMNyVMYV1)()1 (1222NYYMnfNNiii 與前一種方法相比,在大樣本量情況下,比率估計的精度更高些。返回的樣本估計為:)(yV)(YV的樣本估

20、計為:1)(1)(122nMyyMnfyvNiii)2(1111112222nininiiiiiyMyMyynMnf1)()1 ()(122nyMynfNYvNiii).2(11)1 (1112222nininiiiiiyMyMyynnfN返回4、例題和方法比較【例【例4.34.3】某縣有某縣有3333個鄉(xiāng),共個鄉(xiāng),共726726個村,某一個村,某一年度某作物總種植面積為年度某作物總種植面積為30 52530 525畝?,F(xiàn)采用等畝?,F(xiàn)采用等概抽樣隨機抽取十個鄉(xiāng)進行該種作物的產(chǎn)量調(diào)概抽樣隨機抽取十個鄉(xiāng)進行該種作物的產(chǎn)量調(diào)查(調(diào)查數(shù)據(jù)如下表)。要求利用無偏估計量查(調(diào)查數(shù)據(jù)如下表)。要求利用無偏估

21、計量和比率估計量分別估計全縣總產(chǎn)量,并計算估和比率估計量分別估計全縣總產(chǎn)量,并計算估計量的標(biāo)準(zhǔn)差。計量的標(biāo)準(zhǔn)差。返回樣本鄉(xiāng)編號村莊數(shù)Mi農(nóng)作物總產(chǎn)量yi(萬公斤)種植面積xi(畝)123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882 合計209257.18940-1010個鄉(xiāng)調(diào)查數(shù)據(jù)個鄉(xiāng)調(diào)查數(shù)據(jù)iiiMyy 返回(1 1)無偏估計

22、無偏估計(等概抽樣,簡單估計)(等概抽樣,簡單估計)計算平均每個村的產(chǎn)量為:262. 1103882. 14667. 111niiyny因此,212.916262. 17260yMYniiyynnfMyvMYv122020)() 1(1)1 ()()(=966.19,1 .31)()(YvYs評價:此種方法的估計過程雖不復(fù)雜此種方法的估計過程雖不復(fù)雜, ,但卻是有偏估計但卻是有偏估計.返回(2)無偏估計無偏估計(等概抽樣,加權(quán)估計)43.848)6 .230 .22(10331niiynNY71.2511niiynyniiyynnfNYv1229 .1567)() 1(1)1 ()(6 .39

23、)()(YvYs評價:此種方法雖可獲得無偏估計此種方法雖可獲得無偏估計,但與前種方法相比但與前種方法相比, ,估計量的估計方差沒有改觀估計量的估計方差沒有改觀, ,反而有所增大反而有所增大. .這種方法這種方法適合于適合于 之間差異不大的整群抽樣之間差異不大的整群抽樣. .iy返回(3)以群規(guī)模為輔助變量的比率估計08.893110niiniiMyMYniiiyMynnfNYv1228 .687)() 1(1)1 ()(2 .26)()(YvYs評價:比率估計將群規(guī)模作為輔助變量引入估計比率估計將群規(guī)模作為輔助變量引入估計, ,其估計其估計方差取決于群均值方差取決于群均值 的差異的差異. .

24、的差異比的差異比 的差異要穩(wěn)的差異要穩(wěn)定定, ,所以比率估計比前兩種方法獲得更好的估計效果所以比率估計比前兩種方法獲得更好的估計效果. .iYiYiY返回(4)種植面積為輔助變量的比率估計 已知全縣該作物的種植面積總共有X=30525畝,采用種植面積為輔助變量的估計結(jié)果為:85.87711RXxyXYniiniiniiixRynnfNYv12284.127)() 1(1)1 ()(3 .11)()(YvYs評價:與前面幾種方法相比與前面幾種方法相比, ,估計量的估計誤差最小估計量的估計誤差最小, ,估計效果最好估計效果最好. .究其原因究其原因, ,作物的鄉(xiāng)產(chǎn)量作物的鄉(xiāng)產(chǎn)量 不僅與不僅與該鄉(xiāng)規(guī)

25、模該鄉(xiāng)規(guī)模 有關(guān)有關(guān), ,更與該鄉(xiāng)的種植面積更與該鄉(xiāng)的種植面積 有關(guān)有關(guān). .iyiMix返回【補充補充】 總體比例的估計總體比例的估計一、群規(guī)模相等的估計 與群規(guī)模相等時均值估計的方法相同,因為比例也是均值。即pnyynii1., 0, 1其他具有某種性質(zhì)iyniiniiAnMpnp1111由 P118 的(6.1)式,用有代,iiypiA表示第群中具有某種特征的單元數(shù)。是總體比例P的無偏估計。返回ip為樣本中第 i群具有某特征單元數(shù)的比例;M 為每群中的單元數(shù)。 估計量的方差為:1)(1)(12NPPnfpVNiiniippnnfpv12)() 1(1)()(pV的無偏估計為:返回二、群規(guī)

26、模不等的估計 若群規(guī)模 不等,仍采用簡單隨機抽樣抽取群,則總體比例的估計量為:iMniiniiMAP11 根據(jù)比例估計的性質(zhì),其估計量的方差為:1)(1)(122NPMAMnfpVNiii1)(11222NPPMMnfNiii返回)(pV的估計式為:1)(1)(122npMAMnfpvniii1211112222nMApMpAMnfNininiiiii返回【例6.5】某居民小區(qū)有某居民小區(qū)有415415個居民小組,現(xiàn)采用整群個居民小組,現(xiàn)采用整群等概抽樣,隨機抽取等概抽樣,隨機抽取2525個小組為樣本,調(diào)查中的一項內(nèi)個小組為樣本,調(diào)查中的一項內(nèi)容為估計男、女性別比例,下表資料為樣本中女性的分容

27、為估計男、女性別比例,下表資料為樣本中女性的分布。試用布。試用95%95%的置信度估計該小區(qū)女性比例的致信區(qū)間,的置信度估計該小區(qū)女性比例的致信區(qū)間,并用簡單隨機抽樣方法進行比較。并用簡單隨機抽樣方法進行比較。總體比例總體比例估計例題估計例題返回群(群(i)居民數(shù)居民數(shù)(Mi)女性人數(shù)女性人數(shù)(Ai)群(群(i)居民數(shù)居民數(shù)(Mi)女性人數(shù)女性人數(shù)(Ai)184141052127159434116314531764563185266419537742041852216398322831032237411212430126325831352合計合計151722525個居民小組人數(shù)及女性人口數(shù)個居

28、民小組人數(shù)及女性人口數(shù)返回解解:這是群規(guī)模不等的比例估計這是群規(guī)模不等的比例估計總體比例的估計為:總體比例的估計為:477.01517211niiniiMAp由于總體的由于總體的 未知,用樣本未知,用樣本 替代得替代得Mm)2(111)(111222inininiiiiMApMpAnmnfpv00055. 0125729.12)04. 6(2594. 02返回故置信區(qū)間為:故置信區(qū)間為:046. 0477. 000055. 096. 1477. 0 如果采用簡單隨機抽樣方法,從該小區(qū)中抽取如果采用簡單隨機抽樣方法,從該小區(qū)中抽取151人,假定調(diào)查結(jié)果與上表相同,即其中女性人數(shù)人,假定調(diào)查結(jié)果與

29、上表相同,即其中女性人數(shù)為為72人,抽樣比人,抽樣比f也假定相同,則估計量的估計方差也假定相同,則估計量的估計方差為:為:00156. 0523. 0477. 015094. 011)(pqnfpvsrs返回于是可以計算設(shè)計效應(yīng)于是可以計算設(shè)計效應(yīng)353. 000156. 000055. 0)()(pvpvdeffsrs 這表明,在次項內(nèi)容的調(diào)查中,整群抽樣的估計這表明,在次項內(nèi)容的調(diào)查中,整群抽樣的估計效果明顯地好于簡單隨機抽樣。效果明顯地好于簡單隨機抽樣。返回4.3 等概率兩階段抽樣一、多階段抽樣一、多階段抽樣 前面提到的整群抽樣雖然有很多優(yōu)點,但是由前面提到的整群抽樣雖然有很多優(yōu)點,但是

30、由于群內(nèi)單元通常具有相似性(表現(xiàn)為群內(nèi)相關(guān)系數(shù)于群內(nèi)單元通常具有相似性(表現(xiàn)為群內(nèi)相關(guān)系數(shù)大于零)。尤其是當(dāng)群比較大時,人們自然會想大于零)。尤其是當(dāng)群比較大時,人們自然會想到?jīng)]有必要對群內(nèi)所有單元都進行調(diào)查,而只要對到?jīng)]有必要對群內(nèi)所有單元都進行調(diào)查,而只要對群內(nèi)單元進行再抽樣,對被抽中的單元進行調(diào)查,群內(nèi)單元進行再抽樣,對被抽中的單元進行調(diào)查,這就是兩階段抽樣。同樣的道理,還可以有三階段這就是兩階段抽樣。同樣的道理,還可以有三階段抽樣、四階段抽樣等,我們統(tǒng)稱為抽樣、四階段抽樣等,我們統(tǒng)稱為多階段抽樣多階段抽樣。返回多階段抽樣的優(yōu)點多階段抽樣的優(yōu)點(1)(1)多階段抽樣保持了整群抽樣的樣本比

31、較集中、多階段抽樣保持了整群抽樣的樣本比較集中、 便于調(diào)查、節(jié)約費用等優(yōu)點。同時又避免了對便于調(diào)查、節(jié)約費用等優(yōu)點。同時又避免了對 小單元過多調(diào)查造成的浪費。小單元過多調(diào)查造成的浪費。(2)(2)多階段抽樣不需要編制所有小單元的樣本框。多階段抽樣不需要編制所有小單元的樣本框。 抽取初級單元時,只需要編制初級單元的抽樣抽取初級單元時,只需要編制初級單元的抽樣 框,對被抽中的初級單元,再去編制二級單元框,對被抽中的初級單元,再去編制二級單元 的抽樣框,依此類推。的抽樣框,依此類推。返回 二、抽樣方法與推斷原理二、抽樣方法與推斷原理 多階段抽樣時,每一個階段的抽樣可以相同,也多階段抽樣時,每一個階段

32、的抽樣可以相同,也可以不同。它通常與分層抽樣、整群抽樣、系統(tǒng)抽可以不同。它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣結(jié)合使用。多階段抽樣時,抽樣是分步進行的,樣結(jié)合使用。多階段抽樣時,抽樣是分步進行的,因此,討論估計量的均值及其方差時,需要分階段因此,討論估計量的均值及其方差時,需要分階段進行,這要用到下面的性質(zhì)進行,這要用到下面的性質(zhì)。返回 對于兩階段抽樣,有對于兩階段抽樣,有)()(21EEE)()()(2121VEEVV 式中,式中, 為在固定初級單元時對第二階為在固定初級單元時對第二階抽樣求均值和方差;抽樣求均值和方差; 為對第一階抽樣為對第一階抽樣求均值和方差。求均值和方差。22,VE11,

33、VE證明見教材P148返回 上述性質(zhì)可以推廣到多階段抽樣的情形,例如上述性質(zhì)可以推廣到多階段抽樣的情形,例如對于三階段抽樣,有對于三階段抽樣,有)()(321EEEE)()()()(321321321VEEEVEEEVV返回三、等概率兩階段抽樣的符號說明初級單元和初級單元擁有的二級單元個數(shù):N,M第一階段和第二階段抽樣的樣本量:n ,m 第i個初級單元中的第j個二級單元的觀測值:樣本中第i個初級單元中的第j個二級單元的觀測值:ijYijy返回第一階段和第二階段的抽樣比:MmfNnf21,第i個初 級 單 元 按二級單元的平均 值:mjijiMjijiymyYMY111,1按二級單元的平均值:n

34、iiNiiynyYNY111,1初級單元間的方差:,)(112121YYNSNii2121)(11yynsnii返回初級單元內(nèi)的方差:21122)() 1(1iNiMjijYYMNS21122)() 1(1inimjijyymns由 的表達(dá)式可知,若記22S2122)(11MjiijiYYMS則有NjiSNS122221即 是 的平均值。同理有22S22iS2122)(11mjiijiyymsnjisns122221返回四、初級單元大小相等的二階抽樣第一階段在總體第一階段在總體N N個初級單元中,以簡單隨機個初級單元中,以簡單隨機抽樣抽取抽樣抽取n n個初級單元,第二階段在被抽中的初級個初級單

35、元,第二階段在被抽中的初級單元包含的單元包含的M M個二級單元中,以簡單隨機抽樣抽取個二級單元中,以簡單隨機抽樣抽取m m個二級單元,即最終接受調(diào)查的單元個二級單元,即最終接受調(diào)查的單元。例如:某個新開發(fā)的小區(qū)擁有相同戶型的例如:某個新開發(fā)的小區(qū)擁有相同戶型的1515個個單元的樓盤,居民已經(jīng)陸續(xù)搬入新居,每個單元住單元的樓盤,居民已經(jīng)陸續(xù)搬入新居,每個單元住有有1212戶居民,為調(diào)查居民家庭裝修情況,準(zhǔn)備從戶居民,為調(diào)查居民家庭裝修情況,準(zhǔn)備從180180戶居民戶中抽取戶居民戶中抽取2020戶進行調(diào)查。如下表:戶進行調(diào)查。如下表:返回編號單 元 房 號123456789101112131415

36、一棟一棟A座座一棟一棟B座座一棟一棟C座座二棟二棟A座座二棟二棟B座座二棟二棟C座座三棟三棟A座座三棟三棟B座座三棟三棟C座座四棟四棟A座座四棟四棟B座座四棟四棟C座座五棟五棟A座座五棟五棟B座座五棟五棟C座座 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3

37、 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12 返回 表中紅字為抽中的房號表中紅字為抽中的房號 . . 在這里,初級單元(樓盤)有在這里,初級單元(樓盤)有1515個,每個初個,每個初級單元擁有二級單元(居民戶)級單元擁有二級

38、單元(居民戶)1212個。首先將初個。首先將初級單元從級單元從1 1到到1515編號,在編號,在1515初級單元中隨機抽取初級單元中隨機抽取5 5個單元,分別是個單元,分別是1 1,6 6,9 9,1212,1313號;然后在被號;然后在被抽中的初級單元中,進行第二次抽樣,即分別在抽中的初級單元中,進行第二次抽樣,即分別在抽取的抽取的5 5個樓盤中隨機抽取個樓盤中隨機抽取4 4戶。這就是戶。這就是初級單元初級單元規(guī)模相等的兩階段抽樣。規(guī)模相等的兩階段抽樣。返回規(guī)模相等兩階段抽樣的估計量及其性質(zhì) (1 1)總體均值的估計)總體均值的估計定理4.5 對于初級單元大小相等的二階抽樣,對于初級單元大小

39、相等的二階抽樣, 如果兩個階段都是簡單隨機抽樣,且對每個如果兩個階段都是簡單隨機抽樣,且對每個 初級單元,第二階抽樣是相互獨立進行的,初級單元,第二階抽樣是相互獨立進行的, 則對總體均值則對總體均值 的無偏估計為:的無偏估計為:YnimjijniiynmynyY11111返回總體均值估計量方差為:總體均值估計量方差為:22221111)(SnmfSnfyV 的無偏估計為的無偏估計為:)(yV22221111)(snmfsnfyv.1,11222212222niiNiisnsSNS式中式中返回【例4.4】欲調(diào)查4月份100家企業(yè)的某項指標(biāo),首先從100家企業(yè)中抽取了一個有板有5家樣本企業(yè)的簡單隨

40、機樣本,調(diào)查人員對5家企業(yè)分別在調(diào)查月內(nèi)隨機抽取3天作為調(diào)查日,要求樣本企業(yè)只填寫這3天的流水帳。調(diào)查的結(jié)果如下。樣 本 企 業(yè)第一日第二日第三日12345573851486259416053556450634954要求根據(jù)這些數(shù)據(jù)推算不100家企業(yè)該指標(biāo)的總量,并給出估計的95%置信區(qū)間。返回解 將企業(yè)作為初級單元,將每一天看著二級單元。調(diào)查月內(nèi)擁有30天(即擁有30個二級單元)。 首先在初級單元中抽取一個n=5的簡單隨機樣本再對每個樣本的二級單元分別獨立抽取一個m=3的簡單隨機樣本由題意,N=100,M=30,n=5, m=310. 0303,05. 0100521MmfNnf首先計算樣本

41、初級單元的均值 、方差 :iy22is返回樣 本 企 業(yè)123456043585057133939719iy22is于是得到:6 .53)5750584360(5111niiyny3 .49)(112121yynsnii4 .23112222niisns返回4372. 94 .2335)10. 01 (05. 03 .49505. 01)(yv1608006 .5330100yNMY849348004372. 930100)()(2222yvMNYv0078.921684934800)()(YvYs 置信度為置信度為95%95%的置信區(qū)間為:的置信區(qū)間為:1608001608001.961.9

42、692169216在上面的方差估計式中,第一項是主要的,第二項在上面的方差估計式中,第一項是主要的,第二項要小得多要小得多! !返回五、初級單元規(guī)模不等的二階抽樣 一般而言,初級單元的大小是不相等的,如果按初級單元的大小分層后,層內(nèi)初級單元的大小差別仍很大,則需用本節(jié)介紹的方法來處理二階抽樣的問題。當(dāng)初級單元大小不等時,一般采用不等概抽樣。1、符號說明總體中初級單元個數(shù)及第一階抽取的樣本量:N,n第i個初級單元中二級單元數(shù):iM第i個初級單元中第二階抽樣的樣本量:im第i個初級單元中第j個二級單元的觀測值:ijY樣本中第i個初級單元中第j個二級單元的觀測值:ijy返回第一階和第二階的抽樣比:iiiMmfNnf21;二級單元個數(shù):niiNiimmMM1010,指標(biāo)總和: nimjijNiMjijiiyyYY1111,第i個初級單元指標(biāo)總和:iimjijiMjijiyyYY11,第i個初級單元按二級單元的平均值:iimjijiiiiMjijiimyymyMYYMYii111,1返回按二級單元的平均值:niiNiMjijmyyMYYMYi10110,1初級單元間的方差:,)(112121NiiYYNS,)(112121niiyyns第i個初級單元二級單元間的方差:,)(112122i

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論