第四章(整群抽樣)_第1頁
第四章(整群抽樣)_第2頁
第四章(整群抽樣)_第3頁
第四章(整群抽樣)_第4頁
第四章(整群抽樣)_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

抽樣調(diào)查課----整群抽樣單位:浙江財經(jīng)學院數(shù)統(tǒng)學院課程:抽樣調(diào)查課教師:張銳1編輯版pppt整群抽樣一、整群抽樣的基本概念二、群規(guī)模相等條件下的估計三、群規(guī)模不相等條件下的估計2編輯版pppt一、整群抽樣的基本概念問題的提出整群抽樣的定義整群抽樣的特點群的劃分群規(guī)模簡介3編輯版pppt一個新建的居民區(qū)由近百幢居民樓組成,其中住戶總數(shù)達數(shù)千戶。欲用抽樣調(diào)查方法估計該居民區(qū)現(xiàn)有的電話擁有率。

a.一種是用簡單隨機抽樣,抽取一定樣本量的住戶,譬如說共抽取n=250戶進行調(diào)查,然后用簡單估計方法對全居民區(qū)的電話擁有率進行估計。

b.另一種方法是按一定方法抽取一定數(shù)量的居民樓,譬如說15幢或20幢樓,然后對這些樓中的每個住戶都進行調(diào)查,根據(jù)調(diào)查結果來估計整個居民區(qū)的電話擁有率。實際問題的提出:4編輯版pppt

這兩種方法的根本差別是:抽樣單元不同。前者以住戶為抽樣單元,后者則以居民樓為抽樣單元。后一種抽樣方法稱為整群抽樣。

5編輯版ppptDef.1一般地說,如果總體中所有較小的基本單元可以以某種形式組成數(shù)量較少但規(guī)模較大的單元;或反過來說,每個“大”單元都由若干“小”單元組成,稱這些“大”單元為初級(抽樣)單元(primarysamplingunit),“小”單元為次級(抽樣)單元(secondarysamplingunit).Def.2

在總體中,按一定方式抽取n個初級單元,調(diào)查每個被抽中的初級單元中所包含的全部次級單元,這種抽樣方法稱為整群抽樣(clustersampling),也稱集團抽樣。6編輯版pppt定義:整群抽樣是將總體劃分為若干群,然后以群為抽樣單元,從樣本中隨機抽取一部分群,對選中的群的所有基本單元進行調(diào)查的一種抽樣技術。

這里的群(cluster)就是指初級單元,整群抽樣就是指將總體中的小單元整群整群地進行抽群。在前面的例子中,居民樓就是群(初級單元),而住戶則是次級單元,對居民樓的抽樣就是一種對住戶的整群抽樣。整群抽樣的定義7編輯版pppt整群抽樣的特點1)

抽樣框的編制簡單2)

實施便利,節(jié)省費用3)

抽樣誤差相對比較大些發(fā)揮整群抽樣的優(yōu)勢,因為其省時省力,每個單元的平均調(diào)查費用比較少,故可通過增大樣本量的方法彌補精度的損失。8編輯版pppt

劃分群的標準總體方差=群間方差+群內(nèi)方差群內(nèi)方差群間方差

此消彼長整群抽樣是對被抽中的群的群內(nèi)的每個單元進行抽樣,因此群內(nèi)方差的影響很小,主要的誤差是由群間方差影響的。分群的標準:使同一群內(nèi)各單元之間的差異大一些即群內(nèi)方差大些,群與群的差異盡可能的小些,即群間方差小些。9編輯版pppt群的規(guī)模群的規(guī)模指組成群的單元的數(shù)量。群的規(guī)模比較靈活,可大可小,規(guī)模大些,估計的精度差些,但是費用省。規(guī)模小的,估計的精度可以提高但是費用大。費用與精度根據(jù)實際需要而定。10編輯版pppt群規(guī)模相等的整群抽樣一、群規(guī)模相等簡介二、符號說明三、總體均值的估計及性質(zhì)四、估計量方差的估計五、設計效應11編輯版pppt總體中的N個初級單元即群的大小(群內(nèi)次級單元數(shù))都相等的情形。也就是,若總體有N個群時,每個群中所包含的單元數(shù)為M相等時,則稱群規(guī)模相等,在實際問題中,只要群的規(guī)模接近時,也稱為群規(guī)模相等。這時,對群的抽取一般采用簡單隨機抽樣(無放回)。

一、群規(guī)模相等簡介12編輯版pppt二、符號說明13編輯版pppt總體樣本14編輯版pppt三、總體均值的估計及性質(zhì)總體平均值的估計為:性質(zhì)1)的無偏估計建立如下盒子模型證明:15編輯版pppt……在這個新的盒子中有N個小盒子,每個小盒子中含元素(Yij,j=1,2,…,M),它們的平均數(shù)是,而全體的平均數(shù)恰好構成盒子的平均數(shù)。16編輯版pppt我們的模型是從這N個小盒子中隨機無放回地抽取n個,這n個小盒子相應的平均數(shù)為而這n個的平均數(shù)恰好構成樣本平均數(shù),總體均值,樣本均值,故樣本均值是總體均值的無偏估計。(為什么?)……17編輯版pppt?

四、估計量方差的估計18編輯版pppt根據(jù),的一個無偏估計是:在實際問題中,具有某種特性的次級單元在總體中所占的比例P的估計常用整群抽樣,不僅方便而且效率高,在各群大小相等的情況下,利用前面對的討論,推導出對P的估計量及其方差。19編輯版pppt五、設計效應我們已經(jīng)研究了簡單隨機抽樣和較復雜的分層抽樣、不等概率抽樣、整群抽樣,抽樣方法的不同會引起估計量精度的不同。之所以采用比較復雜的抽樣手段,目的無非是提高估計的效果。因此,看一個抽樣方案的效果究竟如何,一個比較好的辦法是將它與簡單隨機抽樣在相同的樣本容量之下對精度作比較——這就是基什(Kish)在1965年提出的設計效應(designeffect,簡記為deff):Deff=(所考慮抽樣設計估計量的方差)/(相同樣本量下簡單隨機抽樣估計量的方差)20編輯版pppt設計效應值愈大,表明它的效率愈低。若deff>1,表明所考慮的抽樣設計的效率不如簡單隨機抽樣;若deff<1,表明該抽樣設計的效率比簡單隨機抽樣高。在整群抽樣中,我們在前面已經(jīng)指出:如何劃分群以及群的大小如何控制對于估計的精度都有影響,這就涉及到設計效應。根據(jù)設計效應的定義,考察在擁有NM個次級單元的總體中抽取容量為nM的簡單隨機樣本,樣本均值的方差為:21編輯版pppt因此,群大小相等的整群抽樣的設計效應為:上面結果意味著:按同樣的樣本量(以次級單元計)整群抽樣的方差約為簡單隨機抽樣的方差的倍。換句話說,為了獲得同樣的精度,整群抽樣的樣本量必須是簡單隨機抽樣的樣本量的倍。22編輯版pppt群內(nèi)相關系數(shù)23編輯版pppt例6.1

在一次對某寄宿中學在校生零花錢的調(diào)查中,以宿舍為群進行整群抽樣。每個宿舍有8名學生。用簡單隨機抽樣在全部510間宿舍中抽取n=12間宿舍。全部96個學生上周每人零花錢及相關數(shù)據(jù)如下。1)

試估計生平均零花錢,并給出其95%的置信區(qū)間;2)

試估計群內(nèi)相關系數(shù)與設計效應。3)如果是簡單隨機抽樣,需要多少樣本?24編輯版pppti

240,187,162,185,206,197,154,173188.0027.19210,192,184,148,186,175,169,180180.5017.98149,168,145,130,170,144,125,167149.7517.32202,187,166,232,205,263,198,210207.8829.17210,285,308,198,264,275,183,231244.2545.20394,256,192,280,267,334,216,289278.5063.87192,121,172,165,152,224,195,241182.7538.77230,205,187,176,212,253,189,240211.5027.48274,208,195,307,264,258,210,309253.1344.52232,187,150,182,175,212,169,222191.1328.29342,294,267,309,258,198,244,286274.7543.70228,294,182,312,267,254,232,298258.3843.52

25編輯版pppt(1)解:已知N=510,n=12,M=8,f=n/N=0.0235故26編輯版pppt于是的置信度為95%的置信區(qū)間為也即27編輯版pppt(2)計算群內(nèi)相關系數(shù)與設計效應解:由前已算出樣本群間方差而群內(nèi)方差為28編輯版pppt29編輯版pppt(3)若令為簡單隨機抽樣的樣本量則即可達到整群抽樣96戶樣本量相同的估計精度30編輯版pppt群規(guī)模不相等的整群抽樣一、等概抽樣,簡單估計二、等概抽樣,加權估計三、等概抽樣,比率估計四、例子31編輯版pppt對總體均值的估計為可以看出,的方差估計為等概抽樣,簡單估計32編輯版pppt此法特點估計量是有偏的操作簡便,易于掌握和使用適用條件,群之間的規(guī)模差異不大時

33編輯版pppt思路:以群規(guī)模Mi為權數(shù),得到群總和yi,進而求得群總和均值,再除以群平均規(guī)模等概抽樣,加權估計34編輯版pppt估計公式為:若未知,可用樣本群平均規(guī)模代替35編輯版pppt總體總量Y的估計為總量估計的另一公式為36編輯版pppt估計量的方差為它的無偏估計為均值估計的方差為37編輯版pppt總體均值估計為這里輔助變量不是Xi而是群規(guī)模Mi總體總量估計為等概抽樣,比率估計38編輯版pppt估計量的方差分別是39編輯版pppt與的樣本估計分別是40編輯版pppt

41編輯版pppt背景:某縣有33個鄉(xiāng),726個村,該年度某種作物總種植面積30525畝,現(xiàn)采用等概抽樣隨機抽出10個鄉(xiāng),要求估計全縣總產(chǎn)量,計算抽樣誤差。調(diào)查資料如下:案例分析

42編輯版pppt樣本鄉(xiāng)編號村莊數(shù)Mi作物總產(chǎn)(鄉(xiāng))yi(萬公斤)種植面積(鄉(xiāng))xi(畝)123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合計209257.18940——43編輯版pppt分別采用幾種方法估計1、等概抽樣,簡單估計44編輯版pppt評價:方法雖簡單,卻是有偏估計45編輯版pppt2、等概抽樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論