抽樣調(diào)查-分層隨機(jī)抽樣培訓(xùn)課件(共98頁).ppt_第1頁
抽樣調(diào)查-分層隨機(jī)抽樣培訓(xùn)課件(共98頁).ppt_第2頁
抽樣調(diào)查-分層隨機(jī)抽樣培訓(xùn)課件(共98頁).ppt_第3頁
抽樣調(diào)查-分層隨機(jī)抽樣培訓(xùn)課件(共98頁).ppt_第4頁
抽樣調(diào)查-分層隨機(jī)抽樣培訓(xùn)課件(共98頁).ppt_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、返回3.1 引 言一、定義先將總體 N 個(gè)單元?jiǎng)澐殖?L 個(gè)互不重復(fù)的子總體,每個(gè)子總體稱為層,它們的大小分別為L(zhǎng)NNN,21)(1LhhNN 然后,在每個(gè)層中獨(dú)立地進(jìn)行抽樣,稱為分層抽樣.返回二、作用分層抽樣在實(shí)際工作中應(yīng)用的非常廣泛,主要是因?yàn)樗哂衅渌闃臃椒ㄋ鶝]有的特點(diǎn):1.分層抽樣的抽樣效率較高,也就是說,分層抽樣的估計(jì)精度較高。2.分層抽樣不僅能對(duì)總體指標(biāo)進(jìn)行推算,而且能對(duì)各層指標(biāo)進(jìn)行推算。3.層內(nèi)抽樣方法可以不同,而且便于抽樣工作的組織。返回三、使用場(chǎng)合在對(duì)分層進(jìn)行具體劃分時(shí),通??紤]如下原則:1.層內(nèi)單元具有相同性質(zhì),通常按調(diào)查對(duì)象的不同類型進(jìn)行劃分。2.盡可能使層內(nèi)單元的標(biāo)志

2、值相近,層間單元的差異盡可能大。3.既按類型又按層內(nèi)單元標(biāo)志值相近的原則進(jìn)行多重分層,同時(shí)達(dá)到實(shí)現(xiàn)估計(jì)類值以及提高估計(jì)精度的目的。4.抽樣組織實(shí)施的方便,通常按行政管理機(jī)構(gòu)設(shè)置進(jìn)行分層。返回四、符號(hào)說明我們用下標(biāo)h表示層號(hào)(h=1,2,,L)。關(guān)于第h層的記號(hào)如下:?jiǎn)卧倲?shù):hN樣本單元數(shù):hn第 i個(gè)單元標(biāo)志值(觀察值):hiy返回單元權(quán)數(shù):NNWhhhY總體均值:hNihihYN11第L層總體方差:hNihhihhYYNS122)(11返回抽樣比:hhhNnf 樣本均值:hyhnihihyn11第L層樣本方差:hnihhihhyyns122)(11返回3.2 簡(jiǎn)單估計(jì)量及其性質(zhì)一、總體均值

3、的估計(jì)1.估計(jì)量的定義 總體均值Y的估計(jì):hYLh 1stYhW=LhhhYNN11如果得到的是分層隨機(jī)樣本,則總體均值Y的簡(jiǎn)單估計(jì)為:LhhhLhhhstyNNyWy111返回2.估計(jì)量的性質(zhì)性質(zhì)一 對(duì)于一般的一般的分層抽樣,如果hY是hY的無偏估計(jì)( h=1,2, ,L),則stY是Y的無偏估計(jì)。stY的方差為:V(stY)=)(12LhhhYVW值得注意的是:只要對(duì)各層估計(jì)是無偏的,則對(duì)總體的估計(jì)也是無偏的。 因此,各層可以采用不同的抽樣方法,只要相應(yīng)因此,各層可以采用不同的抽樣方法,只要相應(yīng)的估計(jì)量是無偏的,則對(duì)整體的推算也是無偏的的估計(jì)量是無偏的,則對(duì)整體的推算也是無偏的。返回性質(zhì)一

4、的證明:由于對(duì)每一層有hhYYE)(YNYYNYNNYWYEWYWEYELhhhLhhhLhhhLhhhLhhst1111111)()()(因此返回性質(zhì)二 對(duì)于分層簡(jiǎn)單隨機(jī)抽樣,Ysty是的無偏估計(jì),sty的方差為:LhhhhhLhhhstSnfWyVWyV122121)()(返回性質(zhì)二的證明:若各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,對(duì)每一層有LhhhststhhyVWyVYyEYyE12)()(,)(,)(21)(hhhhSnfyV由第二章性質(zhì)二得212121)()(hhhLhhhLhhstSnfWyVWyV因此返回LhhhhhLhhhstsnfWyvWyv122121)()(性質(zhì)三 對(duì)于分層隨機(jī)抽樣,

5、的無偏估計(jì)為:)(styV返回性質(zhì)三的證明:對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,由第二章性質(zhì)三,得21)(hhhhsnfyv212121)()(hhhLhhhLnhstsnfWyvWyv因此,)(styV的一個(gè)無偏估計(jì)為:返回二、總體總量的估計(jì)1.估計(jì)量的定義 總體總量 Y 的估計(jì)為:LhhstYYNY1如果得到的是分層隨機(jī)樣本,則總體總量 Y 的簡(jiǎn)單估計(jì)為:styNY 2.估計(jì)量的性質(zhì)Y由于Ysty與只差一個(gè)常數(shù),因此,sty與具有相同的性質(zhì)。返回性質(zhì)一 對(duì)于一般的分層隨機(jī)抽樣,如果Y是sty)()()(12LhhstYVYVNYV的無偏估計(jì),則Y是的無偏估計(jì),Y的方差為:)()(1

6、2122LhhhLhhhYVNYVWN性質(zhì)二 對(duì)于分層隨機(jī)抽樣,Y的方差為:)(YV)(12LhhhYVNLhhhhhSnfN1221=返回)(Yv)(12LhhhYvNLhhhhhsnfN1221=性質(zhì)三 對(duì)于分層隨機(jī)抽樣,)(YV的無偏估計(jì)為:【例3.1】 調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出,以居民戶為調(diào)查單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為4層,每層按簡(jiǎn)單隨機(jī)抽樣抽出10戶,調(diào)查獲得如下數(shù)據(jù)(單位:元)估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及估計(jì)的標(biāo)準(zhǔn)差。(數(shù)據(jù)見下表)返回 樣本戶奶制品年消費(fèi)支出樣本戶奶制品年消費(fèi)支出層居民戶總數(shù)樣本戶奶制品年消費(fèi)支出(元)123456789101200104

7、0011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025返回05. 020010,07018. 0285020011111NnfNNW025. 040010,14035. 0285040022222NnfNNW由上表,N=2850,各層的層權(quán)及抽樣比為:0133. 075010,26316. 0285075033333NnfNNW0067. 0150010,52632. 02850150044444NnfNNW),4 , 3 , 2 , 1( ,10h

8、nh返回各層樣本均值及樣本方差為:5.39111111niiyny722.1624)(1121111211yynsnii同理有333.193,24556.8205,165667.2166,105244233222sysysy返回因此,估計(jì)奶制品年消費(fèi)總支出為:2096502415001657501054005 .3920041hhhyNY8241241221039. 51)()(hhhhhhhhsnfNyvWNYv估計(jì)量方差及標(biāo)準(zhǔn)差的樣本估計(jì)23208)()(YvYs返回三、總體比例的估計(jì)1.估計(jì)量的定義總體比例 P 的估計(jì)為:LhhhstpWp12.估計(jì)量的性質(zhì) 如果定義, 0, 1iY第

9、i個(gè)單元具有所考慮的特征;其他。(i=1,2, ,N)則對(duì)總體比例的估計(jì)類似對(duì)總體均值的估計(jì),這時(shí),stpsty與具有同樣的性質(zhì)。返回的無偏估計(jì)(h=1,2, ,L),則性質(zhì)一 對(duì)于一般的分層隨機(jī)抽樣,如果hhPp 是stp是 P 的無偏估計(jì)。stp的方差為:LhhhstpVWpV12)()(性質(zhì)二 對(duì)于分層隨機(jī)抽樣,stp是 P 的無偏估計(jì)。證明:注意到hhhhhhhnQPNnNpV1)(及hhNN1因而stp的方差為:返回LhhhhhhhhLhhhstnQPNnNNNpVWpV121221)(1)()(LhhhhhhhhnQPNnNNN122)(1LhhhhhhnQPfW12)1 (性質(zhì)三

10、 對(duì)于分層隨機(jī)抽樣,stp的無偏估計(jì)為V()LhhhhhhhhLhhhstnqpNnNNNpvWpv1212211)(1)()(LhhhhhhnqpfW121)1 (返回【例3.2】 在例3.1的調(diào)查中,同時(shí)調(diào)查了居民擁有家庭電腦的情況,獲得如下數(shù)據(jù)(單位:臺(tái)),如表3.2。估計(jì)該地區(qū)居民擁有家庭電腦的比例及估計(jì)的標(biāo)準(zhǔn)差。(數(shù)據(jù)見下表)返回 樣本戶擁有家庭電腦情況樣本戶擁有家庭電腦情況層居民戶總數(shù)樣本戶擁有家庭電腦情況12345678910120000010001002400010000001037501100001010415001000000000表3.2返回1 . 0, 4 . 0, 2

11、 . 0, 2 . 04321pppp2 . 0) 1 . 015004 . 07502 . 04002 . 0200(2850114141hhhhhhstpNNpWp005. 0)0099. 015004 . 07500173. 04000169. 0200(28501)(1)(222224122hhhhpvNNpv解:由上表可得該地區(qū)居民擁有家庭電腦比例的估計(jì)為:估計(jì)量的方差為:返回3.3 比率估計(jì)量及其性質(zhì) 將比率估計(jì)的思想和技術(shù)用于分層隨機(jī)樣本時(shí),對(duì)將比率估計(jì)的思想和技術(shù)用于分層隨機(jī)樣本時(shí),對(duì)總體參數(shù)的估計(jì)有兩種途徑:總體參數(shù)的估計(jì)有兩種途徑: 一種是對(duì)每層樣本分別考慮比估計(jì)量,然后對(duì)

12、各層一種是對(duì)每層樣本分別考慮比估計(jì)量,然后對(duì)各層的比估計(jì)量進(jìn)行加權(quán)平均的比估計(jì)量進(jìn)行加權(quán)平均, ,此時(shí)所得的估計(jì)量稱為此時(shí)所得的估計(jì)量稱為分別分別估計(jì)估計(jì)(separate ratio estimator);separate ratio estimator); 另一種是對(duì)比率的分子、分母分別加權(quán)計(jì)算出分層另一種是對(duì)比率的分子、分母分別加權(quán)計(jì)算出分層估計(jì)量,然后用對(duì)應(yīng)的估計(jì)量來構(gòu)造比估計(jì),這樣所得估計(jì)量,然后用對(duì)應(yīng)的估計(jì)量來構(gòu)造比估計(jì),這樣所得的估計(jì)量稱為的估計(jì)量稱為聯(lián)合比估計(jì)聯(lián)合比估計(jì)(combined ratioestimator).combined ratioestimator).返回1.

13、分別比率估計(jì)總體均值Y總體總量Y的分層比率估計(jì)為:hLhhhhLhRhhRsXxyWyWy11總體均值:總體總量:LhRhhLhhhRsRsYXxyyNY11:hW層權(quán)L: 層數(shù)hy的簡(jiǎn)單估計(jì)為hY:hx的簡(jiǎn)單估計(jì)為hX:Rhy為hY的比率估計(jì),RhY為hY比率估計(jì)返回比率估計(jì)量的方差:)2()1 ()(22212xhyhhhxhhyhLhhhRsSSRSRSnfWyV)2()1 ()(22212xhyhhhxhhyhLhhhRsSSRSRSnfNYV式中,hxhyhhhhSSNnf;22分別為第 i層指標(biāo)Y,X的方差及相關(guān)系數(shù). 分別比率估計(jì)量要求每一層的樣本量分別比率估計(jì)量要求每一層的樣本

14、量都比較大都比較大, ,否則否則, ,偏倚可能比較大偏倚可能比較大. .返回2.聯(lián)合比率估計(jì)(combined ratio estimator)總體均值:XRXxyycststRc總體總量:XRXxyYcststRc式中:sty表示Y的無偏估計(jì);stx表示X的無偏估計(jì).均方誤差為:)2()1 ()()(22222yxhxhyhhhRcRcRSSRSnNfNyVyMSE)2()1 ()()(2222yxhxhyhhhRcRcRSSRSnfNYVYMSE返回3.分別比率估計(jì)量與聯(lián)合比率估計(jì)量的比較一般而言,分別比率估計(jì)量的方差小于聯(lián)合比一般而言,分別比率估計(jì)量的方差小于聯(lián)合比率估計(jì)量的方差。但當(dāng)每

15、層的樣本量不太大時(shí),還率估計(jì)量的方差。但當(dāng)每層的樣本量不太大時(shí),還是采用聯(lián)合比率估計(jì)量更可靠些,因?yàn)檫@時(shí)分別比是采用聯(lián)合比率估計(jì)量更可靠些,因?yàn)檫@時(shí)分別比率估計(jì)量的偏倚很大,從而使總的均方誤差增大。率估計(jì)量的偏倚很大,從而使總的均方誤差增大。實(shí)際使用時(shí),如果各層的樣本量都較大,且有實(shí)際使用時(shí),如果各層的樣本量都較大,且有理由認(rèn)為各層的比率理由認(rèn)為各層的比率Rh差異較大,則分別比率估計(jì)差異較大,則分別比率估計(jì)優(yōu)于聯(lián)合比率估計(jì)。當(dāng)各層的樣本量不大,或各層優(yōu)于聯(lián)合比率估計(jì)。當(dāng)各層的樣本量不大,或各層比率比率Rh差異很小,則聯(lián)合比率估計(jì)更好些。差異很小,則聯(lián)合比率估計(jì)更好些。返回【例4.4】 某市某市

16、19961996年對(duì)年對(duì)950950家港口生產(chǎn)單位完成的家港口生產(chǎn)單位完成的吞吐量進(jìn)行了調(diào)查,吞吐量進(jìn)行了調(diào)查,19971997年欲對(duì)全市港口生產(chǎn)單位完年欲對(duì)全市港口生產(chǎn)單位完成的吞吐量進(jìn)行調(diào)查。對(duì)港口生產(chǎn)單位按非國有成的吞吐量進(jìn)行調(diào)查。對(duì)港口生產(chǎn)單位按非國有(h=1)(h=1)和國有(和國有(h=2)h=2)分為兩層,單位數(shù)分別為分為兩層,單位數(shù)分別為800800家和家和150150家,家,分別在兩層中調(diào)查了分別在兩層中調(diào)查了1010家和家和1515家港口生產(chǎn)單位,家港口生產(chǎn)單位,調(diào)查數(shù)據(jù)如下表,試計(jì)算調(diào)查數(shù)據(jù)如下表,試計(jì)算19971997年全市港口生產(chǎn)單位完年全市港口生產(chǎn)單位完成的吞吐量。

17、成的吞吐量。19971997年國有和年國有和非國有企業(yè)調(diào)非國有企業(yè)調(diào)查數(shù)據(jù)如下頁查數(shù)據(jù)如下頁返回ixiyiixiyi19580149553022202102210320335938433604964120117423040051771805600651625325861000880730234977005608332286811001230927221597208231013797103103901147846512817650139191160141160107015735698返回(將上述數(shù)據(jù)計(jì)算的中間結(jié)果列于P77的表中)1.1.按分別比率估計(jì)量估計(jì)按分別比率估計(jì)量估計(jì)68.919389

18、25)2()1 ()(5 .2725362221221yxhhxhhyhLhhhhRShhhRSsRsRsnfNYvXRY返回2.2.按聯(lián)合比率估計(jì)量估計(jì)按聯(lián)合比率估計(jì)量估計(jì)84.86293698)2()1 ()(1 .271956274300279700277310222212yxhxhyhLhhhhRCststRCsRsRsnfNYvXXYY 按聯(lián)合比率估計(jì)量按聯(lián)合比率估計(jì)量估計(jì)比按分別比率估計(jì)估計(jì)比按分別比率估計(jì)量估計(jì)要好一些量估計(jì)要好一些!返回三、分別比率估計(jì)與聯(lián)合比率估計(jì)的比較)(2)()1 ()()(22212xhyhhhxhhLhhhhRSRCSSRRSRRnfWyVyV)(2)

19、()1 (22212xhhxhyhhhxhhLhhhhSRSSRRSRRnfW)(2)()1 (2212xhhxhyhhxhhhLhhhhSRSSSRRRRnfW具體情況分析參看教材P87返回3.4 回歸估計(jì)量及其性質(zhì) 與比估計(jì)相似,將回歸估計(jì)的思想和技術(shù)用于與比估計(jì)相似,將回歸估計(jì)的思想和技術(shù)用于分層隨機(jī)抽樣時(shí),同樣有兩種方法:分層隨機(jī)抽樣時(shí),同樣有兩種方法: 一種是對(duì)每層樣本分別求取回歸估計(jì)量,然后一種是對(duì)每層樣本分別求取回歸估計(jì)量,然后對(duì)各層的回歸估計(jì)量進(jìn)行加權(quán)平均,此時(shí)所得的對(duì)各層的回歸估計(jì)量進(jìn)行加權(quán)平均,此時(shí)所得的估計(jì)量稱為估計(jì)量稱為分別回歸估計(jì)分別回歸估計(jì)(separate reg

20、ression separate regression estimator);estimator); 另一種是對(duì)兩個(gè)變量先分別計(jì)算出分層簡(jiǎn)單估另一種是對(duì)兩個(gè)變量先分別計(jì)算出分層簡(jiǎn)單估計(jì)量然后再對(duì)它們的分層簡(jiǎn)單估計(jì)量來構(gòu)造回歸估計(jì)量然后再對(duì)它們的分層簡(jiǎn)單估計(jì)量來構(gòu)造回歸估計(jì),這時(shí)所得的估計(jì)量稱為計(jì),這時(shí)所得的估計(jì)量稱為聯(lián)合回歸估計(jì)聯(lián)合回歸估計(jì) (combined regression estimator).combined regression estimator).返回1.分別回歸估計(jì)(separate regression estimator)總體均值Y的估計(jì):LhLhhhhhhlrhhlr

21、sxXyWyWy11)(總體總量Y的估計(jì):LhhhhhhlrslrsxXyNyNY1)(返回 當(dāng)各層的回歸系數(shù)為事先給定的常數(shù)時(shí)當(dāng)各層的回歸系數(shù)為事先給定的常數(shù)時(shí), ,分別回歸估計(jì)量是無偏的。分別回歸估計(jì)量是無偏的。其方差為其方差為: :)2()1 ()(2222yxhhxhhyhhhhhlrsSSSnfWyV其中 是第h層的回歸系數(shù)h返回并且當(dāng)LhSSxhyxhh, 2 , 1,2時(shí),)(lrsyV達(dá)到最小,即)1 ()1 ()(2212minhyhLhhhhlrsSnfWyVhnihhihnihhihhihxxxxyyb121)()(通常未知,可用回歸系數(shù)作為的估計(jì):hhbh返回注 意 (

22、1)分別回歸估計(jì)量是有偏的,但當(dāng)每一層的樣本量 都很大時(shí),估計(jì)的偏倚可以忽略,其方差近似為:hn)1 ()1 ()(2212hyhLhhhhlrsSnfWyV(2)這里 是子總體的回歸系數(shù), 是子總體樣本的回歸系數(shù),前者是未知的,后者是可知的。hbh返回方差)(lrsyV的樣本估計(jì)值為:212)1 ()(ehLhhhhlrssnfWyv式中,hnihhihhhihehxxbyyns122)()(21 分別回歸估計(jì)量要求每一層的樣本量都較大分別回歸估計(jì)量要求每一層的樣本量都較大, ,如如果這個(gè)條件得不到滿足果這個(gè)條件得不到滿足, ,則分別回歸估計(jì)量的偏倚則分別回歸估計(jì)量的偏倚可能很大可能很大,

23、,這時(shí)這時(shí), ,采用聯(lián)合回歸估計(jì)量更好些。采用聯(lián)合回歸估計(jì)量更好些。返回2.聯(lián)合回歸估計(jì)(combined regression estimator)總體均值Y的估計(jì):)(ststlrcxXyy總體總量Y的估計(jì):)(ststlrclrcXXYyNY式中,ststxy 和分別為XY和的分層估計(jì)。lrclrcYy及是無偏的,其方差為:)2()1 ()(22222yxhxhyhhhhhlrcSSSnNfNyV)2()1 ()(2222yxhxhyhhhhhlrcSSSnfNYV返回并且,只要取LhhxhhhLhyxhhhcnSfWnSfWB12212)1 ()1 (時(shí),)(lrcyV達(dá)到最小。當(dāng)回歸

24、系數(shù)未知時(shí),取為cB的樣本估計(jì):LhhxhhhLhyxhhhcnsfWnsfWb12212)1 ()1 (這時(shí),聯(lián)合回歸估計(jì)量是有偏的,但當(dāng)樣本量n較大時(shí),估計(jì)的偏倚可以忽略,其方差近似為:返回)2()1 ()(2222yxhcxhcyhhhhhlrcSBSBSnfWyV方差)(lrcyV的樣本估計(jì)為:)2()1 ()(2222yxhcxhcyhhhhhlrcsbsbsnfWyv返回 分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較 當(dāng)回歸系數(shù)設(shè)定時(shí)當(dāng)回歸系數(shù)設(shè)定時(shí), ,分別回歸估計(jì)優(yōu)于分別回歸估計(jì)優(yōu)于聯(lián)合回歸估計(jì);聯(lián)合回歸估計(jì); 當(dāng)回歸系數(shù)由樣本估計(jì)時(shí)當(dāng)回歸系數(shù)由樣本估計(jì)時(shí), ,如果各層的樣如果各層的樣本量

25、不太小本量不太小, ,采用采用分別回歸估計(jì)為宜分別回歸估計(jì)為宜. . 否則,否則,采用聯(lián)合回歸估計(jì)為好!采用聯(lián)合回歸估計(jì)為好! 返回【例4.6】(續(xù)例4.4)利用回歸估計(jì)量估計(jì)該市港口生產(chǎn)單位1997年完成的吞吐量。解:樣本回歸系數(shù):h=1,非國有h=2,國有1.070170.856402hb則按分別回歸估計(jì)量估計(jì):(見P85)30.270556lrsY22.89872469)(lrsYv11.9480)()(lrslrsYvYs返回按聯(lián)合回歸估計(jì)量估計(jì):(見教材P86)4 .271753,0290. 1lrccYb,17.85358332)(lrcYv96.9238)()(lrclrcYvY

26、s 從本題看從本題看, ,聯(lián)合回歸聯(lián)合回歸估計(jì)量比分別回歸估計(jì)估計(jì)量比分別回歸估計(jì)量要優(yōu)一些量要優(yōu)一些! !返回 分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸估計(jì)和聯(lián)合回歸估計(jì)的比較估計(jì)和聯(lián)合回歸估計(jì)的比較 (參看教材P96. 【例3.3】)返回比率估計(jì)與回歸估計(jì)總結(jié):比率估計(jì)與回歸估計(jì)總結(jié): 在分層隨機(jī)抽樣中,當(dāng)有輔助變量信息可以利在分層隨機(jī)抽樣中,當(dāng)有輔助變量信息可以利用時(shí),我們可以采用分別比率估計(jì)、聯(lián)合比率估計(jì)、用時(shí),我們可以采用分別比率估計(jì)、聯(lián)合比率估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)方法。在選用這些分別回歸估計(jì)以及聯(lián)合回歸估計(jì)方法。在選用這些估計(jì)量時(shí),要注意

27、以下幾個(gè)問題:估計(jì)量時(shí),要注意以下幾個(gè)問題: 1 1、比估計(jì)是有偏估計(jì)量,當(dāng)各層樣本量都較大時(shí)、比估計(jì)是有偏估計(jì)量,當(dāng)各層樣本量都較大時(shí)兩種比估計(jì)都近似無偏;當(dāng)某些層的樣本量不夠大,兩種比估計(jì)都近似無偏;當(dāng)某些層的樣本量不夠大,而總樣本量較大時(shí),聯(lián)合比率估計(jì)近似無偏。而總樣本量較大時(shí),聯(lián)合比率估計(jì)近似無偏。返回 2 2、在回歸估計(jì)中,若事先設(shè)定回歸系數(shù),其估計(jì)量、在回歸估計(jì)中,若事先設(shè)定回歸系數(shù),其估計(jì)量無偏;若用樣本回歸系數(shù)作為回歸估計(jì)系數(shù),其估計(jì)無偏;若用樣本回歸系數(shù)作為回歸估計(jì)系數(shù),其估計(jì)量有偏,但在大樣本情況下近似無偏。量有偏,但在大樣本情況下近似無偏。 3 3、當(dāng)主要變量、當(dāng)主要變量

28、Y Y和輔助變量和輔助變量X X高度相關(guān)時(shí),比率估高度相關(guān)時(shí),比率估計(jì)和回歸估計(jì)都是有效的,且能大幅度地提高估計(jì)計(jì)和回歸估計(jì)都是有效的,且能大幅度地提高估計(jì)精度。精度。返回3.3 樣本量在各層的分配對(duì)于分層抽樣,當(dāng)總的樣本量一定時(shí),還需研究各層應(yīng)該分配多少樣本量的問題,因?yàn)閷?duì)總體推算時(shí),估計(jì)量的方差與各層的方差有關(guān),還與各層所分配的樣本量有關(guān)。一、比例分配這里的比例分配指的是按各層單元數(shù)占總體單元數(shù)的比例,也就是按各層的層權(quán)進(jìn)行分配,這時(shí)fNnNnfWNNnnhhhhhh或?qū)τ诜謱映闃樱@時(shí)總體均值Y的估計(jì)是:返回hnihihLhhhLhLhhhhpropynnnynnyWy11111yyny

29、nniiLhnihih11111總體比例 P 的估計(jì)是:Lhhproppnpp11 這是因?yàn)榭傮w中的人一單元,不管它在哪一層,以同樣的概率入樣,因此按比例分配的分層隨機(jī)樣本,估計(jì)量的形式特別簡(jiǎn)單。這種樣本也稱為自加權(quán)的樣本。返回的方差為propy21121)()(hhhLhLhhhhhpropSnfnnWyVWyVLhhhSWnf121的方差為proppLhhhhLhhhhhPROPQPWnfNQPNNnfPV112111)(返回二、最優(yōu)分配1.最優(yōu)分配如果我們考慮簡(jiǎn)單線性費(fèi)用函數(shù),總費(fèi)用LhhhnccC10則最優(yōu)分配是:LhcSNcSNcSWcSWnnLhhhhhhhLhhhhhhhh, 2

30、 , 1,11返回)()11()()(1021210hLhhhhLhhhLhhhstncccSNnWcnccyVLLhcSWnnLhhhhh, 2 , 1, 01222證明:作拉格朗日函數(shù),求條件極值:返回., 2 , 1,/11LhcSNcSNcSWcSWnnLhhhhhhhLhhhhhhhhLhhhhLhhhhhhcSWnncSWn122122,解得:由此得出下面的準(zhǔn)則: 如果某一層單元數(shù)較多,內(nèi)部差異較大,費(fèi)用比較省,則對(duì)這一層的樣本量要多分配些,返回2. Neyman(內(nèi)曼)分配對(duì)于分層隨機(jī)樣本,作為特例,如果每一層的費(fèi)用相同,即cch時(shí),最優(yōu)分配可簡(jiǎn)化為:LhSNsNnSWSWnnL

31、hhhhhLhhhhhh, 2 , 1,11這種分配稱為Neyman分配.這時(shí),)(styV達(dá)到最小。返回【例3.3】續(xù)例3.1如果樣本量仍為 n=40 ,則按比例分配和Neyman分配時(shí),各層的樣本量應(yīng)為多少?(見17)解:按比例分配時(shí),各層的樣本量為:05.214052632. 053.104026316. 061. 54014035. 081. 24007018. 044332211nWnnWnnWnnWn即各層的樣本量分別為 3,6,11,20.返回對(duì)于Neyman分配,根據(jù)前面計(jì)算所得的各層權(quán)數(shù)和方差,得到:8286. 2722.162407018. 011sW5330. 6667.

32、216614035. 022sW8380.23556.820526316. 033sW3181. 7333.19352632. 044sW51775.403181. 78380.235330. 68286. 241hhhsW返回因此,按Neyman分配時(shí),各層應(yīng)分配的樣本量為:.23. 753.2345. 679. 251775.408286. 24043241111nnnsWsWnnhhh即各層的樣本量分別為 3,,.返回【例例3.53.5】某市有甲、乙兩個(gè)地區(qū),現(xiàn)進(jìn)行家庭收入某市有甲、乙兩個(gè)地區(qū),現(xiàn)進(jìn)行家庭收入的調(diào)查。令的調(diào)查。令n=500,n=500,已知甲地區(qū)共有已知甲地區(qū)共有2000

33、020000戶居民,乙地戶居民,乙地區(qū)共有區(qū)共有5000050000戶居民;甲地區(qū)居民和乙地區(qū)居民年收入戶居民;甲地區(qū)居民和乙地區(qū)居民年收入標(biāo)準(zhǔn)差估計(jì)分別為標(biāo)準(zhǔn)差估計(jì)分別為 ;同時(shí)對(duì)甲地和;同時(shí)對(duì)甲地和乙地每戶的平均抽樣費(fèi)用之比為乙地每戶的平均抽樣費(fèi)用之比為2 2:3 3,請(qǐng)分別計(jì)算出,請(qǐng)分別計(jì)算出甲地和乙地進(jìn)行比例分配、一般最優(yōu)分配(考慮費(fèi)用甲地和乙地進(jìn)行比例分配、一般最優(yōu)分配(考慮費(fèi)用因素)以及內(nèi)曼分配(不考慮費(fèi)用因素)的樣本量。因素)以及內(nèi)曼分配(不考慮費(fèi)用因素)的樣本量。2000,250021SS【解解】根據(jù)已知的數(shù)據(jù),通過計(jì)算整理可根據(jù)已知的數(shù)據(jù),通過計(jì)算整理可得下表:得下表:返回h

34、1200000.285725002713.2857505.07632500000.7143200031428.5714823.7861總計(jì)700001.0000-2141.85711328.8624關(guān)于樣本量分配的計(jì)算關(guān)于樣本量分配的計(jì)算hNhWhShchhSWhhhcSW/(1) 比例分配。35714.3577143. 050014386.1422857. 05002211nWnnWn返回(2 2)一般最優(yōu)分配)一般最優(yōu)分配31086.132879.824500/19086.132808.505500/21222222211111hhhhhhcSWcSWnncSWcSWnn返回(3 3)內(nèi)曼

35、分配)內(nèi)曼分配334857.2141571.1428500167857.2141286.714500212222221111hhhhSWSWnnSWSWnn返回結(jié)果比較結(jié)果比較 , 對(duì)比上面三組結(jié)果可以發(fā)現(xiàn)對(duì)比上面三組結(jié)果可以發(fā)現(xiàn): 一般最優(yōu)分配在乙地所抽取的樣本量是最小的。一般最優(yōu)分配在乙地所抽取的樣本量是最小的。這是因?yàn)橐话阕顑?yōu)分配考慮了費(fèi)用問題,在乙地抽樣這是因?yàn)橐话阕顑?yōu)分配考慮了費(fèi)用問題,在乙地抽樣的單位平均費(fèi)用較高,所以最優(yōu)的原則應(yīng)是適當(dāng)增加的單位平均費(fèi)用較高,所以最優(yōu)的原則應(yīng)是適當(dāng)增加甲地的樣本量,減少乙地的樣本量。甲地的樣本量,減少乙地的樣本量。 一般最優(yōu)分配和內(nèi)曼分配在甲地的樣

36、本量都比比一般最優(yōu)分配和內(nèi)曼分配在甲地的樣本量都比比例分配大,這是因?yàn)榧椎乜傮w的方差較大。為了保證例分配大,這是因?yàn)榧椎乜傮w的方差較大。為了保證估計(jì)量方差小,子總體方差大的就要多抽些樣本,否估計(jì)量方差小,子總體方差大的就要多抽些樣本,否則就要少抽樣本。則就要少抽樣本。返回3.某些層要求大于100%抽樣時(shí)的修正hS又比較大,則可能按最優(yōu)分配計(jì)算的這個(gè)層的樣按最優(yōu)分配時(shí),可能抽樣比Nnf 較大,某個(gè)層的本量hn超過hN的情況.若出現(xiàn)這種情況,則對(duì)該層進(jìn)行不100%的抽樣,hhNn 即返回3.4 樣本量的確定(1)一般公式令hhnwn 其中hw已經(jīng)選定,于是當(dāng)方差 V給定時(shí),有2122122121h

37、LhhhhLhhhhLhhhhSNWSnWSnfWVlhhhhLhhhhSWWNSwWn12212211返回NSWVwSWnhhhhh2222得到確定樣本量的一般公式為:得到確定樣本量的一般公式為:LhhhhhLhhSWNVnnwSWVn12021011)/(1令則返回(2 2)若按比例分配)若按比例分配:將將 代入上式可得代入上式可得hhWwhhWwNnnnSWVnhLhh/1100210返回()內(nèi)曼分配:()內(nèi)曼分配:將代入上面兩式可得:將代入上面兩式可得:hLhhhhhSWSWw1/LhhhhLhhSWNVnnSWVn12021011)(1返回()最優(yōu)分配:()最優(yōu)分配:將代入上式可得:

38、將代入上式可得:LhhhhhhhhcSWcSWw1/LhhhLhLhhhhhhhSWNcSWcSWn121111)/()(返回即即22)()(tYrtdVd: d: 絕對(duì)誤差;絕對(duì)誤差; r r:相對(duì)誤差;:相對(duì)誤差;t: : 標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)分位數(shù)分位數(shù); ;這時(shí),樣本量的一般形式可以表示為:這時(shí),樣本量的一般形式可以表示為:如果估計(jì)精度是以誤差限的形式給出如果估計(jì)精度是以誤差限的形式給出返回NSWtYrwSWnhhhhh22222)( 下面將分別給出比例分配、內(nèi)曼分配和最優(yōu)分配時(shí)的樣本量分配形式:返回(1 1)若按比例分配)若按比例分配:將將 代入上式可得代入上式可得h

39、hWwhhWwNSWtYrSWnLhhhLhhh12212)(返回(2)當(dāng)按Neyman分配時(shí),LhhhhhhSWSWw12NSWtYrSWnLhhhLhhh12212)()(返回(3)最優(yōu)分配時(shí):)最優(yōu)分配時(shí):將代入上式可得:將代入上式可得:LhhhhhhhhcSWcSWw1/LhhhLhLhhhhhhhSWNtYrcSWcSWn122111)()/()(返回 例例3.43.4(續(xù)例3.1)如果要求在95%置信度下,相對(duì)誤差不超過10%,則按比例分配和Neyman分配時(shí),總樣本量分別為多少?解:當(dāng)按比例分配時(shí):由前面的計(jì)算結(jié)果,可以得到各層的Whs2h。016.114722.16242850

40、200211211sNNsW096.304667.21662850400221222sNNsW36.2159556.82052850750233233sNNsW754.101333.19328501500244244sNNsW返回22.26792hhsW在95%置信度時(shí),對(duì)應(yīng)的 t =1.96,又5614.732850209650NYyst因此得到086.14)96. 15614.731 . 0()(22tyrVst由此可以得到2 .1900n對(duì)0n進(jìn)行修正,得到修正后的 n 17928502 .19012 .190100Nnnn返回2.最優(yōu)分配需要考慮費(fèi)用時(shí)的情形在最優(yōu)分配時(shí),如果考慮費(fèi)用為

41、簡(jiǎn)單線性函數(shù)LhhhnccC10則由式(3.21)有:LhhhhhhhhcSWcSWw1Lh, 2 , 1當(dāng)方差 V 給定時(shí),代入式(3.24)得到樣本量為:NSWVcSWcSWnhhhhhhhh)/()(返回3.5 分層時(shí)的若干問題1.抽樣效果分析對(duì)于固定樣本量的情況,如果hN1相對(duì)于1可以忽略,則srspropoptVVV式中,srspropoptVVV,分別為分層隨機(jī)抽樣最優(yōu)分配、分層隨機(jī)抽樣按比例分配以及簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單估計(jì)的方差。返回二、層的劃分 既然分層抽樣比簡(jiǎn)單隨機(jī)抽樣效率高,那么如何既然分層抽樣比簡(jiǎn)單隨機(jī)抽樣效率高,那么如何構(gòu)造層,構(gòu)造多少層,才能使分層抽樣發(fā)揮其效率高構(gòu)造層,

42、構(gòu)造多少層,才能使分層抽樣發(fā)揮其效率高的特點(diǎn)呢?的特點(diǎn)呢? 這就涉及最優(yōu)分層和確定層數(shù)的問題。這就涉及最優(yōu)分層和確定層數(shù)的問題。返回(一)最優(yōu)分層iY為了提高抽樣效率,按調(diào)查目標(biāo)量進(jìn)行分層當(dāng)然是最好的,但我們?cè)谡{(diào)查前并不知道 的值,因此分層只能通過與高度相關(guān)的輔助指標(biāo) 來進(jìn)行.(見P56)iYiX返回(二) 層的確定 當(dāng)分層是按自然層或單元類型劃分時(shí),層數(shù)是自然的,但當(dāng)遇到上述運(yùn)用累積平方根法進(jìn)行分層時(shí),就存在層數(shù)問題。 在實(shí)際工作中,層數(shù)一般不超過六層。雖然增加層數(shù)可以提高估計(jì)精度,但在總費(fèi)用一定的條件下增加層數(shù)必然導(dǎo)致降低樣本量,這時(shí)就要考慮增加層數(shù)而降低樣本量在精度上是否合算。返回三、事

43、后分層 我們一般在抽樣之前將總體中的所有單元分好層,但在實(shí)際工作中,有時(shí)沒有層的抽樣框,或總體特別大來不及事先分層等原因.這時(shí)我們又想采用分層抽樣,就可以采用事后分層.返回 事后分層要注意的問題事后分層要注意的問題(1)(1)要求我們可以通過某種途徑知道各要求我們可以通過某種途徑知道各層的層大小或?qū)訖?quán)層的層大小或?qū)訖?quán); ;(2)(2)層權(quán)與實(shí)際情況不能相差太大層權(quán)與實(shí)際情況不能相差太大, ,否則否則不可能提高精度不可能提高精度; ;(3)(3)事后分層的層數(shù)不宜太多事后分層的層數(shù)不宜太多. .返回 事后分層的具體實(shí)施辦法事后分層的具體實(shí)施辦法 先采用簡(jiǎn)單隨機(jī)抽樣的方法從總體中抽取一先采用簡(jiǎn)單隨

44、機(jī)抽樣的方法從總體中抽取一個(gè)樣本量為個(gè)樣本量為n n的樣本,然后對(duì)樣本中的單元按某的樣本,然后對(duì)樣本中的單元按某種特征進(jìn)行分層。種特征進(jìn)行分層。 假設(shè)在容量為假設(shè)在容量為n n的樣本中,落入第的樣本中,落入第h h層的樣本層的樣本單元數(shù)為單元數(shù)為 ,有,有 , 則此時(shí)對(duì)總體均值的事后分層估計(jì)為:則此時(shí)對(duì)總體均值的事后分層估計(jì)為:hmnmLhh1返回21221122111)(111)()1(hNihihhhLhhLhhhhpstmihihLhhhLhhpstYYNSSWNmSWyVymWyWyhh這里,這里, 下標(biāo)下標(biāo)“pst”pst”表示事后分層;表示事后分層; 代表落入第代表落入第h h層的第層的第i i個(gè)個(gè) 樣本單元的指標(biāo)值。樣本單元的指標(biāo)值。hiy返回 理論上理論上, ,只要只要n n充分大,事后分層估計(jì)量是充分大,事后分層估計(jì)量是無偏的。且它的方差有如下性質(zhì):無偏的。且它的方差有如下性質(zhì):LhhhprophLhhhLhhpstpstSWnVSWnSWnfyVEYyE12221221)1 (1)1 (11)()(返回LhhhproppstSWnVyVE122)1 (1)( 由上式可以看出,第一項(xiàng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論