等概率整群抽樣和多階段抽樣學(xué)習(xí)教案_第1頁
等概率整群抽樣和多階段抽樣學(xué)習(xí)教案_第2頁
等概率整群抽樣和多階段抽樣學(xué)習(xí)教案_第3頁
等概率整群抽樣和多階段抽樣學(xué)習(xí)教案_第4頁
等概率整群抽樣和多階段抽樣學(xué)習(xí)教案_第5頁
已閱讀5頁,還剩48頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、會計學(xué)1等概率整群抽樣等概率整群抽樣(chu yn)和多階段抽和多階段抽樣樣(chu yn)第一頁,共53頁。第1頁/共53頁第二頁,共53頁。2021-11-293l整群抽樣(整群抽樣(cluster samplingcluster sampling)是將總體劃分為若干群,然后)是將總體劃分為若干群,然后(rnhu)(rnhu)以群(以群(clustercluster)為抽樣單元,從總體中隨機抽取一部分群,對被選群內(nèi)的所有單元進行調(diào)查的一種抽樣技術(shù)。)為抽樣單元,從總體中隨機抽取一部分群,對被選群內(nèi)的所有單元進行調(diào)查的一種抽樣技術(shù)。第2頁/共53頁第三頁,共53頁。2021-11-294l欲

2、估計某高校大學(xué)生擁有手機數(shù)量,大學(xué)共有欲估計某高校大學(xué)生擁有手機數(shù)量,大學(xué)共有4000040000名學(xué)生,名學(xué)生,1000010000個宿舍(每個宿舍個宿舍(每個宿舍4 4名學(xué)生)。名學(xué)生)。l方案方案1 1(簡單隨機抽樣):采用(簡單隨機抽樣):采用(ciyng)(ciyng)簡單隨機抽樣方法抽取簡單隨機抽樣方法抽取400400個學(xué)生;個學(xué)生;l方案方案2 2(整群抽樣):根據(jù)學(xué)生宿舍名錄抽?。ㄕ撼闃樱焊鶕?jù)學(xué)生宿舍名錄抽取100100個宿舍,并調(diào)查被抽宿舍的每一個學(xué)生;個宿舍,并調(diào)查被抽宿舍的每一個學(xué)生;l方案方案3 3(兩階段抽樣):先隨機抽?。▋呻A段抽樣):先隨機抽取400400個宿

3、舍,再在每個被抽中的宿舍中隨機抽取個宿舍,再在每個被抽中的宿舍中隨機抽取1 1個學(xué)生。個學(xué)生。第3頁/共53頁第四頁,共53頁。第4頁/共53頁第五頁,共53頁。第5頁/共53頁第六頁,共53頁。第6頁/共53頁第七頁,共53頁。表表 4.1 第7頁/共53頁第八頁,共53頁。Y1111nMnijiijiYyynMyn11nMijijNyYNMyn第8頁/共53頁第九頁,共53頁。n定理定理(dngl) 4.1(dngl) 4.1: 是是 的無偏估的無偏估計,即計,即n定理定理(dngl) 4.2(dngl) 4.2: 的方差為:的方差為:yY YyEy221111()1NibiffVyYYS

4、nNnM第9頁/共53頁第十頁,共53頁。n定理定理(dngl) 4.3(dngl) 4.3: 的樣本估計為:的樣本估計為:)(yV21)(bsnMfyv)()()()()(2222yvMNYvyVMNyNMVYVyNMY總體總體(zngt)(zngt)總值的估計量及其方差總值的估計量及其方差第10頁/共53頁第十一頁,共53頁?;ㄥX花錢 ,并給出其,并給出其95%的置信的置信區(qū)間。區(qū)間。ijyY第11頁/共53頁第十二頁,共53頁。群內(nèi)相關(guān)系數(shù) 表達式為:上式中的分子(fnz)為:2)()(YYEYYYYEijikij2) 1()(MNMYYYYNMikij上式中的分母(fnm)為:221)

5、(SMNNMNMYYNMij第12頁/共53頁第十三頁,共53頁。故 又可寫為:2) 1)(1()(2SMNMYYYYNMikij第13頁/共53頁第十四頁,共53頁。212222211( )( )11(1)11(1)111NiiYYfV yV yNMnMfNMSMnMNfSMnM 用簡單隨機抽樣方法抽取n個群,每個群內(nèi)的M個單元(dnyun)全部進入樣本,則等群抽樣均值估計量 的方差可用群內(nèi)相關(guān)系數(shù)近似表示y22222) 1)(1() 1(2)(SNMMSNMYYYYYYYYYYNiMjkjikijijNiMjijNii 第14頁/共53頁第十五頁,共53頁。n簡單隨機抽樣的方差公式為n由此

6、可計算(j sun)出等群抽樣的設(shè)計效應(yīng)為21)(SnMfyVsrs) 1(1)()(MyVyVdeffsrs第15頁/共53頁第十六頁,共53頁。 整群抽樣的估計效率(xio l),與群內(nèi)相關(guān)系數(shù) 的關(guān)系密切。 當(dāng) 時,deffM 當(dāng) 時,deff1 當(dāng) 為負(fù)時,deff1 的取值范圍是1 0 1 ,11M群內(nèi)方差(fn ch)為群內(nèi)方差(fn ch)與總體方差(fn ch)相等群間方差為第16頁/共53頁第十七頁,共53頁。群內(nèi)相關(guān)系數(shù)也可由樣本(yngbn)統(tǒng)計量 估計【例4.2】22,bwss2222) 1(wbwbsMsss221()1nbiiMsyyn22111()(1)nMwij

7、iijsyyn M第17頁/共53頁第十八頁,共53頁。當(dāng)群規(guī)模Mi不等時,有不同的抽取方法和估計方法。(1)等概抽樣(chu yn),無偏估計 思路:以群規(guī)模Mi為權(quán)數(shù),乘以各群均值 ,得到(d do)群觀察值總值yi,再將樣本中n個群的群總和平均,求得群總和均值 ,再除以 群平均規(guī)模y1NiiMMNiy第18頁/共53頁第十九頁,共53頁。估計公式為:若 未知,可用樣本(yngbn)群平均規(guī)模代替nMmni1101nniiiiiM yyyNYyynMnMMMNMM第19頁/共53頁第二十頁,共53頁。總體總值Y的估計(gj)為總量估計(gj)的另一公式為0YM y1niiNYyn第20頁/

8、共53頁第二十一頁,共53頁。估計量的方差(fn ch)為它的無偏估計為均值估計 的方差(fn ch)為221()(1)( )1NiiYYNfV YnN221()(1)( )1niiyyNfv Ynny2212200()1(1)( )( )1NiiYYNfV yV YNMM n第21頁/共53頁第二十二頁,共53頁。(2)等概抽樣,比率估計)等概抽樣,比率估計(gj)總體均值估計總體均值估計(gj)為為這里輔助變量不是這里輔助變量不是Xi而是群規(guī)而是群規(guī)模模Mi總體總量估計總體總量估計(gj)為為11niiniiyyM1001niiniiyYM yMM第22頁/共53頁第二十三頁,共53頁。估

9、計量的方差(fn ch)分別是2221122()()11( )11NNiiiiiiYYMMYYffV yNNnMnM22222102221()(1)( )( )( )1()(1) 1NiiiNiiiYYMNfV YM V yN M V ynNMYYNfnN第23頁/共53頁第二十四頁,共53頁。 與 的樣本估計(gj)分別是2222122111()111( )(2)11niinnniiiiiiiiyM yffv yyyMyM ynnnMnM)(yV)(YV2222221111()(1)(1)1( )(2)11niinnniiiiiiiiyM yNfNfv YyyMyM ynnnn若若 未知,可

10、用樣本群平均規(guī)模未知,可用樣本群平均規(guī)模(gum) 代替代替nMmniM第24頁/共53頁第二十五頁,共53頁。 【例4.3】某縣有33個鄉(xiāng),726個村,該年度某種作物總種植面積30525畝,現(xiàn)采用等概抽樣隨機抽出10個鄉(xiāng),要求估計全縣總產(chǎn)量,計算(j sun)抽樣誤差。 調(diào)查資料如下:第25頁/共53頁第二十六頁,共53頁。樣本(yngbn)鄉(xiāng)編號村莊(cnzhung)數(shù) Mi作物(zuw)總產(chǎn)量(鄉(xiāng)) yi(萬公斤)種植面積(鄉(xiāng)) xi(畝)iiiMyy 123456789101518261420282119311722.022.830.221.725.331.226.020.533.82

11、3.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合計 209 257.1 8940 第26頁/共53頁第二十七頁,共53頁。n分別采用(ciyng)幾種方法估計n(1)等概抽樣,無偏估計1133(22.023.6)848.4310125.71niiniiNYynyyn第27頁/共53頁第二十八頁,共53頁。221()(1)( )1567.91niiyyNfv Ynn評價:雖是無偏(w pin)估計量,但方差估計與 之間的差異有關(guān),適合于 之間差異不大的整群抽樣

12、。iyiy( )1567.939.6()s Y 萬公斤第28頁/共53頁第二十九頁,共53頁。(2 ) 等概抽樣等概抽樣(chu yn),比率估計,比率估計11221257.1726893.08209()(1)( )687.81( )687.826.2()niitniiniiiyYMMyM yNfv Ynns Y萬公斤評價:比率估計量將評價:比率估計量將 作為輔助作為輔助(fzh)變量引入估計,其估計變量引入估計,其估計方差取決于群均值方差取決于群均值 的差異。的差異。 的差異比的差異比 的差異要穩(wěn)定,所的差異要穩(wěn)定,所以比率估計比前一種方法獲得更好的估計效果。但比率估計量是以比率估計比前一種

13、方法獲得更好的估計效果。但比率估計量是有偏的,適合有偏的,適合n比較大的情形。比較大的情形。iMiYiYiY第29頁/共53頁第三十頁,共53頁。(3)以種植面積為輔助變量的比率估計)以種植面積為輔助變量的比率估計 已知:種植面積已知:種植面積X30525(畝)(畝) 用種植面積為輔助變量用種植面積為輔助變量評價:和評價:和 相比,相比, 更小,因而更小,因而(yn r)有有 更好的估計效果。更好的估計效果。11221257.130525877.858940()(1)( )127.841( )127.8411.3()niiniiniiiyYXxyRxNfv Ynns Y萬公斤21()niiiy

14、Rx21()niiiyyM第30頁/共53頁第三十一頁,共53頁。什么是多階段抽樣?什么是多階段抽樣? 分多個階段抽到最終分多個階段抽到最終(zu zhn)接受調(diào)查的樣本。接受調(diào)查的樣本。 初級單元(初級單元(PSU)-Primary Sampling Unit 二級單元二級單元 (SSU)-Second-stage Sampling Unit 三級單元(三級單元(TSU)-Third-stage Sampling Unit 最終最終(zu zhn)單元單元 (USU)-Ultimate Sampling Unit第31頁/共53頁第三十二頁,共53頁。四階段抽樣等,我們統(tǒng)稱為多四階段抽樣等,

15、我們統(tǒng)稱為多階段抽樣。階段抽樣。第32頁/共53頁第三十三頁,共53頁。便于調(diào)查,節(jié)省費用便于調(diào)查,節(jié)省費用避免了對小單元的過多調(diào)查造成的浪費避免了對小單元的過多調(diào)查造成的浪費(lngfi);不需要編制所有小單元的抽樣框不需要編制所有小單元的抽樣框多階段抽樣每一個階段的抽樣可以多階段抽樣每一個階段的抽樣可以(ky)相同,也可以相同,也可以(ky)不同,它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣不同,它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣結(jié)合使用。結(jié)合使用。第33頁/共53頁第三十四頁,共53頁。式中, , 表示在固定初級(chj)單元時對第二階段抽樣求均值和方差; , 表示對第一階段抽樣求均值和方差。

16、12( )( )EE E 1212( )( )( )VV EE V 2E1V2V1E第34頁/共53頁第三十五頁,共53頁。證明證明(zhngmng):第35頁/共53頁第三十六頁,共53頁。第36頁/共53頁第三十七頁,共53頁。11111nnmiijiijYyyynnm Y22121211( )ffV ySSnmn第37頁/共53頁第三十八頁,共53頁。的無偏估計為)(yV2221211)1 (1)(snmffsnfyv第38頁/共53頁第三十九頁,共53頁?!纠?.1】欲調(diào)查4月份100家企業(yè)的某項指標(biāo),首先從100家企業(yè)中抽取(chu q)了一個含有5家樣本企業(yè)的簡單隨機樣本,由于填報

17、一個月的數(shù)據(jù)需要每天填寫流水帳,為了減輕樣本企業(yè)的負(fù)擔(dān),調(diào)查人員對這5家企業(yè)分別在調(diào)查月內(nèi)隨機抽取(chu q)3天作為調(diào)查日,要求樣本企業(yè)只填寫這3天的流水帳。調(diào)查的結(jié)果如表4-7(見下圖): 第39頁/共53頁第四十頁,共53頁。樣本企業(yè)樣本企業(yè)第一日第一日第二日第二日第三日第三日1 15757595964642 23838414150503 35151606063634 44848535349495 5626255555454要求根據(jù)這些數(shù)據(jù)推算要求根據(jù)這些數(shù)據(jù)推算100家企業(yè)該指標(biāo)家企業(yè)該指標(biāo)(zhbio)的總值,并給出估計的的總值,并給出估計的95%置信區(qū)間。置信區(qū)間。第40頁/共5

18、3頁第四十一頁,共53頁。230.1030mfM樣本企業(yè)樣本企業(yè)1 1606013132 2434339393 3585839394 45050 7 75 557571919第41頁/共53頁第四十二頁,共53頁。111(6043585057)53.65niiyyn9.36700.07029.4372 849348009216.0078s Yv Y 2222100309.437284934800v YN M v y100 30 53.6160800YNMy160800 1.96 9216置信區(qū)間:置信區(qū)間: 第42頁/共53頁第四十三頁,共53頁。方差估計式中,第一項是主要的,第二項要小得多,

19、這是因為第二項的分母是第一項的方差估計式中,第一項是主要的,第二項要小得多,這是因為第二項的分母是第一項的m m倍,而且它還要乘以小于倍,而且它還要乘以小于1 1的的f1f1。如果第一階的抽樣比。如果第一階的抽樣比f1f1可以忽略,則方差估計式可以簡單為如下的結(jié)果:可以忽略,則方差估計式可以簡單為如下的結(jié)果:這個這個(zh ge)(zh ge)結(jié)果在實際工作中非常有用,因為第二階抽樣采用等距抽樣或某些復(fù)雜抽樣時,方差的無偏估計很難得到,當(dāng)結(jié)果在實際工作中非常有用,因為第二階抽樣采用等距抽樣或某些復(fù)雜抽樣時,方差的無偏估計很難得到,當(dāng)f1f1可以忽略時,只需要初級單元的均值就可以得到方差的估計。從另一方面看,可以忽略時,只需要初級單元的均值就可以得到方差的估計。從另一方面看, f1 f1可以忽略意味著總體中初級單元可以忽略意味著總體中初級單元N N很大而選出的很大而選出的n n很小,結(jié)果勢必增大抽樣誤差。很小,結(jié)果勢必增大抽樣誤差。 221111()1niisv yyynn n第43頁/共53頁第四十四頁,共53頁。n幾種幾種(j zhn)(j zhn)處理方法處理方法n * * 先分層,再抽樣先分層,再抽樣n * * 不等概抽樣不等概抽樣n第44頁/共53頁第四十五頁,共53頁。11nnuiiiiiNNYM yYnn

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論