系統(tǒng)抽樣09970_第1頁
系統(tǒng)抽樣09970_第2頁
系統(tǒng)抽樣09970_第3頁
系統(tǒng)抽樣09970_第4頁
系統(tǒng)抽樣09970_第5頁
已閱讀5頁,還剩85頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第八章 系統(tǒng)抽樣n第一節(jié) 概述n第二節(jié) 等概率系統(tǒng)抽樣估計(jì)量n第三節(jié) 不同特征總體的系統(tǒng)抽樣n第四節(jié) 系統(tǒng)抽樣的方差估計(jì)第一節(jié) 概述n一、系統(tǒng)抽樣的定義n二、系統(tǒng)抽樣的實(shí)施方法n三、排序標(biāo)志n四、系統(tǒng)抽樣的特點(diǎn)n五、系統(tǒng)抽樣、整群抽樣與分層抽樣的關(guān)系一、系統(tǒng)抽樣的定義n系統(tǒng)抽樣(Systematic sampling):也稱機(jī)械抽樣,它是將總體中的單元按某種順序排列,在規(guī)定的范圍內(nèi)隨機(jī)抽取起始單元,然后按一套規(guī)則確定其它樣本單元的一種抽樣方法。n上述定義是廣義的,事實(shí)上,總體單元的排列可以是一維的(直線或圓形的),也可以是二維的(平面的);起始單元可以是一個,也可以是一組;對總體單元的抽取可以

2、是等概的也可以是不等概的。n系統(tǒng)抽樣中最簡單的是等間隔抽取,這種系統(tǒng)抽樣又稱為等距抽樣等距抽樣。n等距抽樣的隨機(jī)性是有限制的,因此也被稱為偽隨機(jī)抽樣,但要注意:等距抽樣并未真正喪失隨機(jī)性原則。n例:工業(yè)產(chǎn)品質(zhì)量檢查,每隔2小時抽選一個或若干樣品進(jìn)行檢驗(yàn)。二、系統(tǒng)抽樣的實(shí)施方法n(一)直線等距抽樣n假設(shè):總體N個單元按直線排列,樣本容量為n, 且有N/n=k,k為整數(shù),稱為抽樣間距整數(shù),稱為抽樣間距(sampling interval)。n實(shí)施方法:n1.將總體分為n段,每段k個單元n2.在第一段的k個單元中隨機(jī)抽取一個單元rn3.每隔k個單元抽出一個單元,共抽取n個單元,則被抽中的單元編號分別

3、為: r, r+k, r+2k, r+(n-1)kn例見課本P142n方法評價:n當(dāng)N/n=k為整數(shù)時,總體中每個單元的入樣概率都相等(都等于1/k),從而是一種嚴(yán)格的等概率抽樣。n當(dāng)N/n=k不是整數(shù)時,實(shí)際抽取到的樣本單元數(shù)可能是N/k,也可能是N/k+1,也即與原來設(shè)定的樣本量可能相差1。每個單元的入樣概率也是不相等的。這時等距抽樣有可能產(chǎn)生偏倚。n(二)循環(huán)等距抽樣n為克服直線等距抽樣的上述缺陷,拉希里(Lahiri)提出一種替代方法,稱為循環(huán)(或圓形)等距抽樣。n實(shí)施方法:n1.將總體排成首尾相連的圓形。n2.在1N范圍內(nèi)隨機(jī)抽取整數(shù)r作為起始單元編號。n3.每隔間距k(k為最接近N

4、/n的整數(shù))抽取樣本單元。直到抽足n個單元為止。n評價:對于循環(huán)等距抽樣,即使對于N/n不為整數(shù)的情況,不僅樣本量不會隨起始值而變化,且是嚴(yán)格等概率的。n例:見P143n注意注意:以下為了處理方便,我們假定N總是n的整數(shù)倍。在實(shí)際工作中,若n充分大,則由于N/n非整數(shù)而帶來的影響就充分小,可以忽略不計(jì)。 n(三)不等概系統(tǒng)抽樣法n常用的不等概率系統(tǒng)抽樣是PS系統(tǒng)抽樣n令: 表示總體所有單元大小的總和,n則有入樣概率為:n在實(shí)際中,實(shí)施不等概率抽樣最簡單的方法是代碼法。NiiMM100MMniin實(shí)施方法:n1.先將單元 Mi值累加,取最接近M0/n 的整數(shù)k為抽樣間距。n2.從 1,k中隨機(jī)抽

5、取一個整數(shù)作為起始單元編號。n3.每間隔k抽取樣本單元,則代碼 r, r+k, ,r+(n-1)k 所對應(yīng)的單元即樣本單元.n【例【例7.17.1】設(shè)總體由】設(shè)總體由1010個行政村組成個行政村組成, ,N=10,N=10,每個行政村的人每個行政村的人數(shù)數(shù) M Mi i見下表見下表, ,利用利用PS 系統(tǒng)抽樣抽取系統(tǒng)抽樣抽取 n = 3 n = 3 個行政村個行政村行政村編號行政村編號人數(shù)人數(shù)(Mi)累計(jì)人數(shù)累計(jì)人數(shù)抽中代碼抽中代碼1103103100243253539663142468777235849616731034720512398168140713469146155310317187

6、0解:623,3,1870010nMknMMNii在 1,623中隨機(jī)抽取整數(shù)r,設(shè)r=100,則 r+k=723, r+2k=1346,則對應(yīng)的行政村為1,4,8.注: 對于特別大的單元一般直接作為樣本,然后對剩余的單元組成的總體實(shí)施抽樣.三、排序標(biāo)志n等距抽樣需要有作為排序依據(jù)的輔助標(biāo)志。n排序標(biāo)志各式各樣,可自由選擇,但歸納起來,可分為兩類,即無關(guān)標(biāo)志和有關(guān)標(biāo)志,它們對等距抽樣的作用和相應(yīng)的估計(jì)精度各有不同的影響。 (一)按無關(guān)標(biāo)志排隊(duì) (無序系統(tǒng)抽樣)n即各單元的排列順序與所研究的內(nèi)容無關(guān).n如研究人口的收入狀況時,按身份證號碼、按門牌號碼排序非常方便,一般說來,這些號碼與調(diào)查項(xiàng)目沒有

7、關(guān)系,因此可以認(rèn)為總體單元的次序排列是隨機(jī)的n無關(guān)標(biāo)志排序的等距抽樣也稱無序等距抽樣。n評價:n在無關(guān)標(biāo)志排序的條件下,各單元的位次排定,并不等于各單元的調(diào)查標(biāo)志值也按同一次序排定,雖然是等距抽樣,它與隨機(jī)抽樣在性質(zhì)上并無不同.n故無關(guān)標(biāo)志排序的等距抽樣,實(shí)質(zhì)上相同于簡單隨機(jī)抽樣,二者只是抽樣形式不同而已,完全無損于隨機(jī)原則,它們在估計(jì)精度上也是一致的。 (二)按有關(guān)標(biāo)志排序 n即各單元的排列順序與所研究的內(nèi)容是有關(guān)的, 用來對總體單元規(guī)定排列次序的輔助標(biāo)志,與調(diào)查標(biāo)志具有共同性質(zhì)或密切關(guān)系。n這種排序標(biāo)志,在我國抽樣調(diào)查實(shí)踐中有廣泛應(yīng)用,如農(nóng)產(chǎn)量調(diào)查,以本年平均畝產(chǎn)為調(diào)查變量,以往年已知平均

8、畝產(chǎn)作為排序標(biāo)志。n利用這些輔助標(biāo)志排序,有利于提高等距抽樣的抽樣效果。(三)根據(jù)各單元原有的自然位置進(jìn)行排序n例如:學(xué)生按學(xué)號抽樣,入戶調(diào)查根據(jù)街道門牌號按一定間隔抽取等。n這種自然狀態(tài)的排列有時與調(diào)查標(biāo)志有一定的聯(lián)系,但又不完完一致,這主要是為了抽樣方便。四、系統(tǒng)抽樣的特點(diǎn)n優(yōu)點(diǎn):n1.簡便易行,容易確定樣本單元n等距抽樣簡單明了,快速經(jīng)濟(jì),操作靈活方便,使用面廣,是單階段抽樣中變化最多的一種抽樣技術(shù)。n在某些場合下甚至可以不用抽樣框。例如若要對公路旁的樹木進(jìn)行病蟲害調(diào)查,確定每20棵數(shù)檢查一棵,只要在初始被檢樹確定后,每隔20棵檢查一棵即行,根本不需要在事先對公路旁的所有樹木進(jìn)行編號,或

9、者不需要知道抽樣框即所有樹木的棵數(shù)。n在我國,等距抽樣已成了最主要、最基本的抽樣方式,一些大規(guī)模的抽樣調(diào)查,如農(nóng)產(chǎn)量抽樣調(diào)查、城鄉(xiāng)住戶調(diào)查、人口抽樣調(diào)查、產(chǎn)品質(zhì)量抽樣檢查中都普遍采用了等距抽樣。n2.樣本單元在總體中分布比較均勻樣本單元在總體中分布比較均勻,有有 利于提利于提高估計(jì)精度高估計(jì)精度.n將總體各單元按一定的順序排列后再抽樣,使得樣本單元的分布更加均勻,因而樣本也就更具代表性,比簡單隨機(jī)抽樣更精確 。n缺點(diǎn):n1.如果單元 的排列存在周期性的變化,而抽樣者對此缺乏了解或缺乏處理的經(jīng)驗(yàn),抽取出樣本的代表性就可能很差可能很高。這時要慎重地選擇K。n如:調(diào)查某航空公司每月班機(jī)旅客人數(shù)(淡季

10、、旺如:調(diào)查某航空公司每月班機(jī)旅客人數(shù)(淡季、旺季)季)k=12n2.系統(tǒng)抽樣的方差估計(jì)較復(fù)雜,一般系統(tǒng)抽樣沒有設(shè)計(jì)意義下的無偏估計(jì)量,并且在很多實(shí)際應(yīng)用中所采用的系統(tǒng)抽樣都不是嚴(yán)格的概率抽樣,這就給系統(tǒng)抽樣方差的估計(jì)帶來很大的困難.五、系統(tǒng)抽樣、整群抽樣和分層系統(tǒng)抽樣、整群抽樣和分層抽樣的關(guān)系抽樣的關(guān)系n系統(tǒng)抽樣可以看成是一種特殊的整群抽樣,也可以看成是一種分層抽樣。 n為了看清其中的關(guān)系,我們以一般的等距抽樣為例,將總體中的N(=nk)個單元按k個一組排成表,共有k行n列。n等距抽樣,即將總體個單元排列成k行n 列的矩陣,在從k之間隨機(jī)地產(chǎn)生一個隨機(jī)數(shù)r,則取第r行的全體單元作為樣本 系統(tǒng)

11、抽樣的總體單元系統(tǒng)抽樣的總體單元12jn平均1Y1Yk+1Y(j-1)k+1 Y(n-1)k+12Y2Yk+2Y(j-1)k+2 Y(n-1)k+2rYrYk+rY(j-1)k+rY(n-1)k+rkYkY2kYjkYnk1y2yrykyn如果將表的行看作群,實(shí)際上相當(dāng)于將總體劃分為 k群,系統(tǒng)抽樣相當(dāng)于從這 k個群中隨機(jī)地抽出一個大小為n的群實(shí)行整群抽樣,這是最簡單的整群抽樣.n因此,在討論傳統(tǒng)抽樣的參數(shù)估計(jì)時,很多場合將引用整群抽樣的一些現(xiàn)成結(jié)果.系統(tǒng)抽樣與整群抽樣參數(shù)的對照n如果將表的列看作層,那么系統(tǒng)抽樣又是一種分層抽樣:在每層中抽取一個單元,不過這個單元在每個層中的位置是相同的,因此

12、不是分層隨機(jī)抽樣. 系統(tǒng)抽樣的總體單元按行列重新編號12jn群平均1Y11Y12Y1jY1n2Y21Y22Y2jY2n:rYr1Yr2YrjYrn:KYk1Yk2YkjYkn層平均1Y2YjYnyYkYrY2Y1Y第二節(jié)第二節(jié) 等概率系統(tǒng)抽樣估計(jì)量等概率系統(tǒng)抽樣估計(jì)量n一、符號說明n二、估計(jì)量n三、估計(jì)量方差的不同表示形式一、符號說明 第r行第j列的單元指標(biāo)值:Yrj Yrj=Y(j-1)k+r ,r=1,2,k; j=1,2,n 總體單元數(shù):N 樣本單元數(shù): n 系統(tǒng)樣本平均數(shù): 系統(tǒng)樣本均值估計(jì)量:njrjryny11syy 層均值: , j=1,2,n 總體方差: 系統(tǒng)樣本(群)內(nèi)方差:

13、 jy2S2112)() 1(1krnjrrjwsyyynkS2)()(YyEYyYyErjrurjwsy樣本(群)內(nèi)相關(guān)系數(shù):層內(nèi)方差:211.2)() 1(1njkrjrjwstyyknS同一系統(tǒng)樣本內(nèi)對層均值離差的相關(guān)系數(shù):2.)()(jrjurujrjwstyyEyyyyE二、估計(jì)量設(shè)起始值為r,則相應(yīng)系統(tǒng)樣本的平均數(shù)為:總體均值 的估計(jì)量為:njrjnjrjrYnyny1111Ynjrjrsyynyy11性質(zhì)性質(zhì)1 當(dāng)當(dāng) N=nk 時時,有有 k 個可能樣本個可能樣本: 是無偏估計(jì)量是無偏估計(jì)量. 當(dāng)當(dāng) , 采用直線等距方法時采用直線等距方法時, 是有偏的是有偏的.但但 N和和n均比

14、較大時均比較大時,其偏倚不會很其偏倚不會很大大,可以忽略不計(jì)可以忽略不計(jì).若采用循環(huán)等距抽樣若采用循環(huán)等距抽樣, 是無偏的是無偏的.syyYynkykyEkrnjrjkrrsy11111)(nkN syysyy三、估計(jì)量方差的不同表示形式三、估計(jì)量方差的不同表示形式n如前所述,如果總體單元是按無關(guān)標(biāo)志排列的,則其方差可按簡單隨機(jī)抽樣去做。n若總體單元是按有關(guān)標(biāo)志排列的,則此時的等距抽樣可以看作是整群抽樣或分層抽樣的特例,因此,等距抽樣估計(jì)量的方差可以比照整群抽樣或分層抽樣的方法構(gòu)造,有幾種表示方法。krrsysyYykYyEyV122)(1)()(為方便起見,假定 N= nk,因此系統(tǒng)樣本的平

15、均數(shù) 是總體均值的無偏估計(jì),它的方差按定義為:syy性質(zhì)性質(zhì)2 用樣本用樣本(群群)內(nèi)方差內(nèi)方差 表示系統(tǒng)抽表示系統(tǒng)抽樣估計(jì)量的方差樣估計(jì)量的方差:2wsyS22) 1() 1()(wsysySNnkSNNyV2112)(11krnjrjYyNS式中:為總體方差。2112)() 1(1krnjrrjwsyyynkS為系統(tǒng)樣本(群)內(nèi)方差Ysrsy221)(SnfSNnnNyVsrs如果從總體中直接抽取樣本量為n的簡單隨機(jī)樣本,則總體均值 的估計(jì)量 的方差為:)(1)()(22SSnnyVyVwsysysrs比較等距抽樣方差和簡單隨機(jī)抽樣方差:抽樣法抽樣效果相同系統(tǒng)抽樣法與簡單隨機(jī)等于總體方差時

16、,時,即等距樣本內(nèi)方差當(dāng)抽樣法;簡單隨機(jī)抽樣優(yōu)于系統(tǒng)總體方差時,即等距樣本內(nèi)方差小于當(dāng)機(jī)抽樣;系統(tǒng)抽樣法優(yōu)于簡單隨總體方差時,即等距樣本內(nèi)方差大于當(dāng)222222,SSSSSSwsywsywsy可見:性質(zhì)3系統(tǒng)抽樣可看做一種特殊的整群抽樣,系統(tǒng)抽樣估計(jì)量的方差可以用群內(nèi)相關(guān)系數(shù) 表示:wsysynNNnSyV) 1(1)1()(2)( )() 1)(1(2)()(122YyYySNnYyEYyYyErukrnujrjrjrurjwsywsy式中:可見:系統(tǒng)樣本(群)內(nèi)正相關(guān)正相關(guān)越大,也即系統(tǒng)樣本內(nèi)單元越相似,差別越小,則估計(jì)量的方差越大,這個結(jié)論與上面結(jié)論一致。 性質(zhì)4系統(tǒng)抽樣可看做一種特殊的

17、分層抽樣,系統(tǒng)抽樣的估計(jì)量的方差可以用層內(nèi)方差 和同一等距樣本內(nèi)單元對層均值的相關(guān)系數(shù) 表示:wstSwstwstsynNnNnSyV) 1(1)()(2wst式中:211.2)() 1(1njkrjrjwstyyknS為層內(nèi)方差)(2NnNnSwst恰為比例分配分層隨機(jī)抽樣的方差kiijjyky1.1為第j層的平均值2.)()(jrjurujrjwstyyEyyyyE為同一系統(tǒng)樣本內(nèi)對層均值離差的相關(guān)系數(shù).)( )() 1)(1(2.1.2urukrnujjrjwstyyyySknn比較系統(tǒng)抽樣方差 和比例分配的分層隨機(jī)抽樣方差 ,)(syyV)(styVwststsywststnyVyVN

18、nNnSyV)1(1)()()()(2于分層隨機(jī)抽樣。時,系統(tǒng)抽樣的精度高當(dāng)同;單位的分層隨機(jī)抽樣相各層隨機(jī)抽取一個時,系統(tǒng)抽樣的精度與于分層隨機(jī)抽樣;時,系統(tǒng)抽樣的精度低當(dāng)000wstwstwst可見:【例【例7.27.2】n設(shè)某個總體N=32個單元,總體單元排列顯然有穩(wěn)定上升的趨勢.我們要產(chǎn)生一個樣本量為4的等距樣本,將總體單元排列如下表,k=8,n=4,每一列都是一個等距樣本,共8個等距樣本.n N=32,k=8,n=4等距樣本數(shù)據(jù)層 等距樣本編號層均值123456781113345673.7527881112 14 16 1611.5317 18202024 24 25 27 21.8

19、75427 28303134 34 36 3832.25總數(shù)52 55616574 77 83 88_顯然,層內(nèi)具有正相關(guān),由性質(zhì)4可知,系統(tǒng)抽樣的精度低于分層隨機(jī)抽樣。n層內(nèi)方差與總方差分別為:5 .11)()1(1211.2njkrjrjwstyyknS523.129)(111122krnjrjYyNS452. 9)(1)()(122krrsysyYykYyEyV516. 23243245 .11)()(2NnNnSyVwstst333.2845232.12932432)(2SNnnNyVsrs因此:本例中,分層隨機(jī)抽樣和等距抽樣比簡單隨機(jī)抽樣更有效,而分層隨機(jī)抽樣比等距抽樣更有效。實(shí)際上

20、,將總體單元按大小順序排列的目的就是為了增大系統(tǒng)樣本內(nèi)方差,從而必然提高精度。 【例【例7.37.3】n利用例7.2的數(shù)據(jù),但將第二層和第四層的觀測值次序顛倒,數(shù)據(jù)如下:層 等距樣本編號層均值123456781113345673.75216 1614121188711.5317 18202024 24 25 27 21.875438 36343431 30 28 2732.25總數(shù)72 71716970 67 67 68_202. 0)(1)()(122krrsysyYykYyEyV此時,等距抽樣均值估計(jì)的方差為:516. 23243245 .11)()(2NnNnSyVwstst333.28

21、45232.12932432)(2SNnnNyVsrs而分層隨機(jī)抽樣和簡單隨機(jī)抽樣均值估計(jì)的方差不變:可見:本例中,改變數(shù)據(jù)順序后,等距抽樣比簡單隨機(jī)抽樣和分層隨機(jī)抽樣更有效。n上述例子說明:n相對于分層隨機(jī)抽樣和簡單隨機(jī)抽樣來說,系統(tǒng)抽樣的效率很大程度上取決于總體性質(zhì)。n即使是相同的總體數(shù)據(jù),對于不同的單元排列順序,就有不同的樣本(群)內(nèi)方差和相關(guān)系數(shù),從面系統(tǒng)抽樣估計(jì)量的方差也不同。n因此,要有效地應(yīng)用系統(tǒng)抽樣,必須先了解總體的特征。第三節(jié)第三節(jié) 不同特征總體的系統(tǒng)抽樣不同特征總體的系統(tǒng)抽樣一一.隨機(jī)次序排列的總體隨機(jī)次序排列的總體總體單元按無關(guān)標(biāo)志排列,如居民家計(jì)調(diào)總體單元按無關(guān)標(biāo)志排列

22、,如居民家計(jì)調(diào)查按居民姓氏次序排列的總體單位。查按居民姓氏次序排列的總體單位。 n對于一個有限總體對于一個有限總體,簡單隨機(jī)抽樣的方差是確定簡單隨機(jī)抽樣的方差是確定的的,系統(tǒng)抽樣的方差則取決于單元的排列順序系統(tǒng)抽樣的方差則取決于單元的排列順序.n對于特定的排列,系統(tǒng)抽樣的方差可能比相應(yīng)的對于特定的排列,系統(tǒng)抽樣的方差可能比相應(yīng)的簡單隨機(jī)抽樣的方差大,也可能比它小。簡單隨機(jī)抽樣的方差大,也可能比它小。N個總個總體單元總共有體單元總共有N!種不同的排列,從而有種不同的排列,從而有N!個個系統(tǒng)抽樣的方差。系統(tǒng)抽樣的方差。n但可以證明這但可以證明這N!個系統(tǒng)抽樣方差的平均數(shù)恰好個系統(tǒng)抽樣方差的平均數(shù)恰

23、好等于簡單隨機(jī)抽樣的方差。等于簡單隨機(jī)抽樣的方差。n在這個意義下,我們說當(dāng)總體單元按隨機(jī)順序排在這個意義下,我們說當(dāng)總體單元按隨機(jī)順序排列時,系統(tǒng)抽樣的效果等價于簡單隨機(jī)抽樣。列時,系統(tǒng)抽樣的效果等價于簡單隨機(jī)抽樣。n當(dāng)總體單元按無關(guān)標(biāo)志排列時,可以采用簡單隨機(jī)抽樣的方差作為系統(tǒng)抽樣的方差估計(jì):221)()(SnfSNnnNyVyVsrssyn二. 線性趨勢的總體n(一)線性趨勢的總體n當(dāng)總體按指標(biāo)值從小到大順序列時,由于樣本(群)內(nèi)方差增加而使系統(tǒng)抽樣的精度有顯著的提高。n在實(shí)際問題中,當(dāng)然不可能按指標(biāo)值的大小 排列,但是??梢哉业侥硞€與指標(biāo)值相關(guān)的奕量,若單元按這個變量大小排列,則可收到同

24、樣的效果。n假定單元指標(biāo)Yi值是單元序號 i的線性函數(shù),即Yi=a+bi(i=1,2,N)iiYbaYi)()和(、stsrssyyVyVyV)() 12)(1(61) 1(21112211NNNiYNNiYNiNiiNiNii現(xiàn)比較當(dāng)Y i=i時,有總體均值總體均值總體方差總體方差) 1(21NY) 1(121)(11)(11122122NNYNYNYYNSNiiNii) 1)(1(1212NkSnNnNyVsrs)() 1(121) 1(121)(22knkkNnnNSNnnNyVwst) 1(121)(1)(221kYykyVkrrsy)()(srssystyVyVyV)(二. 對線性趨

25、勢總體的系統(tǒng)抽樣法的改進(jìn)n針對實(shí)踐中經(jīng)常出現(xiàn)的線性趨勢總體,有必要對系統(tǒng)抽樣進(jìn)行改進(jìn),從而提高系統(tǒng)抽樣的精度,使系統(tǒng)抽樣法有可能達(dá)到比分層隨機(jī)抽樣更高的效果。n改進(jìn)的方法有兩類:n一是抽樣方法的改進(jìn),如中心位置抽樣法,對稱系統(tǒng)抽樣法;n二是估計(jì)方法的改進(jìn),如首尾校正法.n n1. 抽樣方法的改進(jìn)n(1)中心位置抽樣法(中位樣本法)n 由麥多Madow(1953) 提出,即初始樣本不是隨機(jī)抽選,而是直接取第一段的 k個單元中處于中間位置的單元.如果K為奇數(shù),以(K+1)/2為起點(diǎn),K為偶數(shù),以K/2或(K+2)/2為起點(diǎn)。 n【例】從【例】從200200名學(xué)生中抽名學(xué)生中抽1010名學(xué)生作為樣名

26、學(xué)生作為樣本本, ,k=N/n=200/10=20, k=N/n=200/10=20, 若起始樣本是若起始樣本是10,10,則其則其余的依次為余的依次為30,50,70.90,110,130,150,170,190.30,50,70.90,110,130,150,170,190.n評價:n優(yōu)點(diǎn):中心位置抽樣法抽到的樣本單元都位于層的中心位置,從而最大限度地減了方差。n缺點(diǎn):當(dāng)總體單元順序和k確定以后,樣本也隨之確定,無隨機(jī)可言,這與概率抽樣的要求相悖。n因此,對一個項(xiàng)目偶爾為之尚可,但若要多次抽樣估計(jì)就不能用這種方法。n(2)對稱(平衡)系統(tǒng)抽樣n 既希望克服中位數(shù)方法的缺乏隨機(jī)性,又希望避免

27、有些系統(tǒng)樣本估計(jì)量過大的偏倚,并希望保留傳統(tǒng)抽樣的特點(diǎn),這三種要求很容易啟發(fā)我們采用一種“對稱系統(tǒng)抽樣法”.n對稱等距抽樣也是針對有序等距抽樣所提出的,其基本思想是使低標(biāo)志值的單元與高標(biāo)志值的單元在樣本中對等出現(xiàn)。從而使樣本的偏差縮小,代表性增強(qiáng)。n由于具體的方法不同,對稱等距抽樣又有幾種類型。A. A. 塞蒂塞蒂SethiSethi對稱系統(tǒng)抽樣對稱系統(tǒng)抽樣(1965):(1965): - - 層內(nèi)對稱系統(tǒng)抽樣層內(nèi)對稱系統(tǒng)抽樣n 設(shè)N=nK,n為偶數(shù)。n 首先:將總體按順序劃分為n/2組(以每一組為層),每組由2k個單元組成。n其次:在第一組中以隨機(jī)方法確定兩個初始單元,方法是在1k范圍內(nèi)產(chǎn)生

28、一個隨機(jī)數(shù)r,則單元r與單元2k-r+1即為起始單元。這兩個單元在層中的位置是對稱的。n 最后,在其余各層中與上述兩個起始單元相同位置的單元都是樣本單元,例如,在第二個抽樣間隔所抽兩個樣本單元號碼為r+2K及2(2k)-r+1,依次類推。n 也就是說n/2對對稱的樣本單元的編號為: 12, 2 , 1 , 0 1) 1(2,2njrkjjkrn【例】上例中【例】上例中, ,N=200,n=10N=200,n=10為偶數(shù):若起為偶數(shù):若起始樣本是始樣本是3,3,則抽取的樣本為則抽取的樣本為n3 3,38,43,78,83,118,123,158,163,198.38,43,78,83,118,1

29、23,158,163,198.n當(dāng)n為奇數(shù)時,式中的j由0變到(n-1)/2-1為止,并且,要加上接近末端的第r+(n-1)K個單元。n=200, n=5, k=40, 則抽取的樣本為:3, 78, 83, 123, 163. 【例】【例】 n實(shí)際中,為便于對稱等距抽樣的實(shí)施,當(dāng)N=nK時,可以將原來由小到大(或由大到小)順序排列的單元按照順逆交替的次序排列在一個表中,這樣,按隨機(jī)起點(diǎn)等距抽樣所抽取的樣本即為對稱等距樣本。n所謂順逆交替是指在單元的排序中,若第一間隔由小到大排序,則第二間隔按由大到小排序,以此類推。 nB.辛方(Singn)對稱系統(tǒng)抽樣(1968):n -總體對稱系統(tǒng)抽樣n仍設(shè)

30、N=nK。當(dāng)n為偶數(shù)時n首先,在1k范圍內(nèi)產(chǎn)生隨機(jī)數(shù)r作為起始單元,同時,另一起始單元為距另一端點(diǎn)距離為r的單元,即編號為N-r+1的單元。這兩個單元相對總體是對稱的。n然后,與第二個抽樣間隔中r+K對稱的是倒數(shù)第二個抽樣間隔的(N-K)-r+1;如此,一直抽到中間兩個抽樣間隔為止。n因此,全部n/2對樣本單元的編號為:12,2 , 1 , 0 1)(,njrjkNjkr 從300名學(xué)生中抽取15位作為樣本,即N=300,n=15,k=300/15=20,設(shè)起始單元數(shù)為,則樣本單元位數(shù)依次是3,298,23,278,43,258,83,218,103,198,123,178,143.【例】【例

31、】 n當(dāng)n為奇數(shù)時,式中的j由0變到(n-1)/2-1為止。然后,再加上中間一個抽樣間隔中的第r+(n-1)K/2個單元。(我國抽樣調(diào)查工作者提出在中間一個抽樣間隔抽取中點(diǎn)處的一個單元。) 2.首尾校正法首尾校正法(兩端修正法 )抽樣方法同隨機(jī)起點(diǎn)等距抽樣時的情形。但在計(jì)算總體均值的估計(jì)量時,通過對首尾兩個單元賦予不同于其他單元的權(quán)數(shù),從而降低對線性趨勢總體的系統(tǒng)抽樣的估計(jì)偏倚()耶茨Yates首尾校正法首尾校正法 條件:條件:nk 方法:方法:對首尾兩個樣本單元賦予不同于其他單元的權(quán)數(shù),采用加權(quán)平均計(jì)算樣本均值,從而提高精度n設(shè)起始樣本單元的編號為r, 則n首樣本單元的權(quán)數(shù)為:n尾樣本單元的

32、權(quán)數(shù)為:n其他n-2個樣本單元的權(quán)數(shù)為:knkrnw) 1(21211knkrnwn) 1( 21211,.,2 , 1,1njnwj首尾校正法修正后的總體均值估計(jì)量:首尾校正法修正后的總體均值估計(jì)量: 當(dāng)當(dāng)i 是是i 的線性函數(shù)時,首尾校正法的的線性函數(shù)時,首尾校正法的均值估計(jì)量是完全無偏的,完全不受初均值估計(jì)量是完全無偏的,完全不受初始值的影響始值的影響njrjjrywy1knbnxnkrbaknrbanxbranxjkrbanywynjnjrjjr) 1()21() 1()()(1101權(quán)數(shù)公式的推導(dǎo)如下:令第一樣本觀測值的權(quán)為:)1 (1xn最末一個樣本觀測值的權(quán)為:)1 (1xn則:

33、為使:) 1(21NbaYyr則可解得:knkrnx) 1(2) 12(n例:若總體單元指標(biāo)值按其順序?yàn)?,3,5,7,9,11,13,15,17,19,21,23,25,27,29,抽取一個n=3的系統(tǒng)樣本,用耶茨首尾校正法估計(jì)總體均值 .解:N=15,n=3,k=5。不妨假設(shè)隨機(jī)抽取的起始值r=1,則樣本觀測值為1,11,21。若不加校正,總體均值的估計(jì)為:11)21111 (311 yysy此估計(jì)值比實(shí)際總體均值 小很多。若采用耶茨的首尾校正法, 的估計(jì)值為:Y15YY156 .33114 . 031522) 152(31 2111522) 152(31 131Yy從而校正后的估計(jì)值完全

34、與估計(jì)目標(biāo)量的真值相等。(2)貝爾豪斯Bellhouse和拉奧Rao(1975)首尾校正法首尾校正法條件:采用循環(huán)等距抽樣法抽樣保證n為常數(shù)然后按照總體單元原有的順序確定首尾單元總體單元原有的順序確定首尾單元,對其賦予不同于其他單元的權(quán)數(shù)nkN 首樣本單元的權(quán)數(shù)為:knNknrnw) 1( 2) 1() 1(211尾樣本單元的權(quán)數(shù)為:其他n-2個樣本單元的權(quán)數(shù)為:knNknrnwn) 1( 2) 1() 1(211,.,2 , 1,1njnwjn如果初始單元編號r 較小,滿足則所有n個樣本單元都不經(jīng)過單元,相應(yīng)的權(quán)數(shù)如下:,) 1(Nknr如果初始單元編號r 較大,滿足 則有樣本單元越過單元,

35、假設(shè)越過單元的樣本單元有個,相應(yīng)的權(quán)數(shù)如下:,) 1(Nknr2n)(22) 1() 1(2121kNnNnNknrnw首樣本單元的權(quán)數(shù)為:尾樣本單元的權(quán)數(shù)為:)(22) 1() 1(212kNnNnNknrnwn其他n-2個樣本單元的權(quán)數(shù)為:1,.,2,1,1njnwj【例【例7.4】總體有】總體有23個單位,擬抽取個單位,擬抽取n=5, 則則與之最近的整數(shù)與之最近的整數(shù)k=5然后在總體中隨機(jī)抽然后在總體中隨機(jī)抽取一個單位作為起點(diǎn),假設(shè)抽中取一個單位作為起點(diǎn),假設(shè)抽中r=19, 樣樣本單元的順序編號分別為:本單元的順序編號分別為:19,1,6,11,16 首樣本單元為首樣本單元為y1,尾單元

36、為尾單元為y19.求相應(yīng)單元的權(quán)數(shù)求相應(yīng)單元的權(quán)數(shù)首樣本單元y1的權(quán)數(shù)為:1222. 0)(22) 1() 1(2121kNnNnNknrnw尾樣本單元的權(quán)數(shù)為:2778. 0)( 22) 1() 1(212kNnNnNknrnwn其他3個樣本單元的權(quán)數(shù)為:0.2解:解:n2=,=23, n=5, k=5, r=19三周期波動的總體三周期波動的總體周期波動是指總體單元指標(biāo)值按其順序呈周期性變周期波動是指總體單元指標(biāo)值按其順序呈周期性變化化n一般對含有周期影響的總體,如果已經(jīng)掌握了其周期結(jié)構(gòu),合理選擇系統(tǒng)抽樣間距k,使樣本包含周期中許多有代表性的指標(biāo)值,可以大縮小估計(jì)量的方差,采用系統(tǒng)抽樣的效果

37、很好,n但對總體的周期結(jié)構(gòu)不了解,則簡單隨機(jī)抽樣與分層隨機(jī)抽樣的效果可能會更好第四節(jié)系統(tǒng)抽樣的方差估計(jì)第四節(jié)系統(tǒng)抽樣的方差估計(jì)n一.等概系統(tǒng)抽樣的方差估計(jì)(一)系統(tǒng)樣本來自隨機(jī)排列總體nisyiyynnNnNsnfv1221)(111(二)系統(tǒng)樣本分層隨機(jī)抽取 如果把系統(tǒng)樣本看成從各層抽取兩個單位的分層隨機(jī)抽樣,可采用下列方法:n1.從第二個樣本單元開始,每個樣本單元與前一個樣本單元組成一對,共n-1對,第 i對樣本單元的方差估計(jì)為 ,因此對n-1個 進(jìn)行平均,再乘以 ,得 的估計(jì):21)(21iiyy21)(21iiyynf1)(syyV211111212)() 1(2)() 1(211ni

38、iiniiiyyNnnnNyynnfv2.設(shè)n為偶數(shù),將樣本單元按順序兩兩分成一組,共n/2組,第i對樣本單元的方差估計(jì)為 ,將這n/2個方差估計(jì)值進(jìn)行平均,再乘以 ,從而得到2122)(21iiyynf121212222121223)()(2121niiiniiiyyNnnNyynnfv(三三)系統(tǒng)樣本來自線性趨勢總體系統(tǒng)樣本來自線性趨勢總體iiebiaY),.2 , 1(Ni 0)(,)(, 0)(22jiiieeEeEeE進(jìn)行Yates首尾校正后:) 1() 1( 212knyyknkryYrrn其抽樣方差無偏估計(jì)為:當(dāng)n 較大時,可忽略.但當(dāng)線性模型存在異方差時, 不再是無偏估計(jì).212212224)2(6)2() 1(2) 12(11niiiinyyyknkrnnkkv)(Yv(四)樣本量為n的系統(tǒng)樣本分成m 個子樣本獨(dú)立抽樣(交叉子樣本法,隨機(jī)組法)n將樣本量為n的系統(tǒng)樣本分成m個子樣本獨(dú)立抽取,每個仍用系統(tǒng)(等距)抽樣,樣本量為 ,抽樣間距為 ,每個子樣本的起始值獨(dú)立抽取。n記第a個子樣本的均值為 ,則總體均值的估計(jì)為: mnn ,mkk maaymY11ay)(YV的一個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論