整群抽樣很重要的一_第1頁
整群抽樣很重要的一_第2頁
整群抽樣很重要的一_第3頁
整群抽樣很重要的一_第4頁
整群抽樣很重要的一_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

關于整群抽樣很重要的一第1頁,課件共79頁,創(chuàng)作于2023年2月第四章整群抽樣[教學目的]

通過本章的教學,使學生明確整群抽樣的定義與特點;掌握群規(guī)模相等時的估計與群規(guī)模不等時的估計方法;了解總體比例的估計。[重點與難點]

本章的重點是群規(guī)模相等時的估計與群規(guī)模不等時的估計方法;難點是群規(guī)模相等時的估計與群規(guī)模不等時的估計方法。第2頁,課件共79頁,創(chuàng)作于2023年2月本章結構§4.1引言§4.2群規(guī)模相等時的估計3.§4.3群規(guī)模不等時的估計§4.4總體比例的估計第3頁,課件共79頁,創(chuàng)作于2023年2月

假設省教育廳想了解西安中學生的體質狀況,抽樣調查是既省錢又省時的辦法,顯然西安地區(qū)的中學生均是總體的單元,從全體學生中隨機無放回地抽取若干樣本是理想的概率抽樣方法,但是編制全體中學生的抽樣框本身是件麻煩事,況且一個合理的有代表性的樣本一般應該遍布全市,在對如此分散的中學生樣本逐個進行訪問,其工作量之大可想而知。一個方便的方法是在西安地區(qū)按學校抽樣,在抽得的幾所學校中對該校所有中學生進行普遍調查。這就是本章要講述的整群抽樣。第4頁,課件共79頁,創(chuàng)作于2023年2月

若總體可分為N個群(也稱為初級抽樣單元,用PSU表示),每個初級單元包含若干個次級單元(也稱二級抽樣單元,用SSU表示)。按照某種方式從總體中抽取n個初級單元,對這些單元中的所有二級單元全部進行調查。這種抽樣方法稱為整群抽樣。第5頁,課件共79頁,創(chuàng)作于2023年2月黃色為總體藍色為樣本紅色為群白點為基本單元整群抽樣事例:第6頁,課件共79頁,創(chuàng)作于2023年2月§4.1引言一、整群抽樣的定義與特點(一)定義整群抽樣(clustersampling)是將總體劃分為若干群,然后以群(cluster)為抽樣單元,從總體中隨機抽取一部分群,對中選群中的所有基本單元進行調查的一種抽樣技術。第7頁,課件共79頁,創(chuàng)作于2023年2月例如,對某城市居民進行生活水平調查,如果不是從全部城市住戶中直接抽選住戶進行調查,而是從城市全部居民委員會中隨機抽選若干居委會,對被抽中的居委會所有住戶都進行調查,這就是整群抽樣。該城市的每一居委會就是一群。第8頁,課件共79頁,創(chuàng)作于2023年2月再如,對連續(xù)生產(chǎn)的企業(yè),每小時都抽選10分鐘生產(chǎn)的全部產(chǎn)品進行調查。那么,每10分鐘生產(chǎn)的全部產(chǎn)品就是一群。如果一天24小時連續(xù)生產(chǎn),生產(chǎn)的全部產(chǎn)品構成總體,則總體有144群,樣本有24群。第9頁,課件共79頁,創(chuàng)作于2023年2月抽樣過程可以分為以下幾個步驟:總體……R4R3R2R1R130分群R1R4R33R98R110抽樣樣本第10頁,課件共79頁,創(chuàng)作于2023年2月

在實際工作中,整群抽樣方法被廣泛采用。例如,在社會經(jīng)濟調查中的人口調查、家計調查、農林牧業(yè)調查以及工業(yè)產(chǎn)品質量檢驗等等都經(jīng)常采用整群抽樣調查。第11頁,課件共79頁,創(chuàng)作于2023年2月采用整群抽樣調查的原因有二:

其一是在某些情況下,往往由于不適合采用一個個地抽取樣本單位,不得不采用整群抽樣。例如,某些工業(yè)產(chǎn)品的質量檢驗,事實上不能逐個抽取樣本單位來進行,只能在某一時間內,成批地抽取產(chǎn)品來檢驗。第12頁,課件共79頁,創(chuàng)作于2023年2月

其二,即使抽樣調查能夠一個個地取樣,但由于經(jīng)濟的考慮也會選擇整群抽樣。例如,職工家庭生活水平調查中,如果不是以居委會為群進行整群抽樣調查,而是以居民戶為單位抽樣,這些被抽到的居民戶一般分散地居住,必然增加交通費、延長調查時間等。所以出于對工作時間、經(jīng)費等客觀條件的考慮,也得采用整群抽樣調查。采用整群抽樣調查的原因有二:第13頁,課件共79頁,創(chuàng)作于2023年2月(二)整群抽樣的特點1、調查單位比較集中,進行調查比較方便,可以減少調查人員來往于調查單位之間的時間和費用。例如,在進行農村居民戶收入情況調查時,在一個縣抽千分之五的村莊,對其所有居民戶進行調查,明顯地比從全縣直接抽千分之五的農戶進行調查,更便于組織,節(jié)省人力、旅途往返時間及費用。第14頁,課件共79頁,創(chuàng)作于2023年2月(二)整群抽樣的特點2、設計和組織抽樣比較方便。例如,調查農村居民住戶,不必列出農村所有居民住戶的抽樣框,可以利用現(xiàn)成的行政區(qū)域,如縣、鄉(xiāng)、村,將農村劃分為若干群,這給抽樣設計方案帶來很大方便。尤其是對那些無法事先掌握總體單位情況的總體,采用整群抽樣更為合適。第15頁,課件共79頁,創(chuàng)作于2023年2月

然而,整群抽樣由于調查單位只能集中在若干群上,而不能均勻分布在總體的各個部分,因此,它的精度比起簡單隨機抽樣來要低一些。第16頁,課件共79頁,創(chuàng)作于2023年2月

例如,在一個有500個村莊、100000個農戶的縣,抽取1%的農戶就是1000戶,而抽1%的村莊則只有5個村莊,也許抽到的5個村莊農戶多于1000,但由于樣本單位只集中在5個村莊,顯然不如在全縣范圍內簡單隨機抽取1000戶分布均勻,代表性一般要差一些,抽樣誤差較大。第17頁,課件共79頁,創(chuàng)作于2023年2月

當然我們可以通過多抽幾個群來彌補這一缺陷,但最關鍵的一條還是在于總體內群的劃分。為了使整群抽樣的樣本具有一定的代表性,應當使群與群之間盡可能地差異小,而群內單元之間的差異應當大(注意:這一點與分層抽樣中總體內層的劃分有著極大的差別),這意味著每個群均具有足夠的代表性。如果劃分的群相互之間頗多相似之處,那么少量群的抽取足以提供良好的精度。一個總體劃分成多少個群,每個群的規(guī)模大小如何又是一個新問題,通常我們面臨的總體會有自然的初級單元,例如本章開頭所說的各所中學它們互相之間關于學生的體質很相似,但在一個學校里每個學生之間有一定的差異。第18頁,課件共79頁,創(chuàng)作于2023年2月二、群的劃分(一)群的劃分

一類是根據(jù)行政或者是地域形成的群體,如學校、社區(qū)、企業(yè)等;另一類就是調查人員人為的確定的。第19頁,課件共79頁,創(chuàng)作于2023年2月(二)分群的原則:群內差異盡可能大,群間差異盡可能小

當總體劃分為若干個群以后,總體方差可以分為群間方差和群內方差兩個部分,這兩個部分是此消彼長的關系。群間方差大,則群內方差小;反之,群間方差小則群內方差大。由于整群抽樣是對抽中群內所有單元都進行調查,因此影響整群抽樣誤差大小的主要是群間方差??梢姡撼闃邮呛头謱映闃邮轻槍Σ煌傮w結構而提出的兩種不同的抽樣方式。

第20頁,課件共79頁,創(chuàng)作于2023年2月三、群的規(guī)模群的規(guī)模是指組成群的單元的數(shù)量。在整群抽樣中,群的規(guī)模具有相當?shù)撵`活性。群的規(guī)模大,估計的精度差但費用??;群的規(guī)模小,估計的精度比較高但費用大。在實踐中,群的規(guī)模大小,涉及很多因素:結構、精度、費用、調查組織實施、管理等問題。群的規(guī)模又有兩種情況:一是總體中的各個群規(guī)模相等;二是總體中各個群的規(guī)模不等。第21頁,課件共79頁,創(chuàng)作于2023年2月一、符號說明

N:總體群數(shù)(PSU數(shù))

n:樣本群數(shù)

Yij:總體第i群的第j單元數(shù)值

yij:樣本中第i群的第j單元數(shù)值

Mi:第i群規(guī)模(單元個數(shù),即SSU數(shù)量)本節(jié)中,M1=M2

=……=MN

=M

§4.2群規(guī)模大小相等時的估計第22頁,課件共79頁,創(chuàng)作于2023年2月

§4.2群規(guī)模大小相等時的估計M0:總體單位總數(shù)Yi:總體中第i群的總值yi:樣本中第i群的總值Y

:總體總值第23頁,課件共79頁,創(chuàng)作于2023年2月

:總體中第i群的個體均值

:樣本中第i群的個體均值

:總體中的群總值的均值

:樣本中的群總值的均值§4.2群規(guī)模大小相等時的估計第24頁,課件共79頁,創(chuàng)作于2023年2月

:總體中的個體均值(各群Mi

=M

:樣本中的個體均值(總體均值的估計)

§4.2群規(guī)模大小相等時的估計第25頁,課件共79頁,創(chuàng)作于2023年2月

:總體方差

:總體群間方差

:總體群內方差

§4.2群規(guī)模大小相等時的估計第26頁,課件共79頁,創(chuàng)作于2023年2月

:樣本方差

:樣本群間方差

:樣本群內方差

§4.2群規(guī)模大小相等時的估計第27頁,課件共79頁,創(chuàng)作于2023年2月二、估計量1.均值估計量SRS,群規(guī)模相同,均為M,則的估計為:總值估計量

§4.2群規(guī)模大小相等時的估計第28頁,課件共79頁,創(chuàng)作于2023年2月

§4.2群規(guī)模大小相等時的估計2.估計量的性質

性質1:是的無偏估計,即因為是按簡單隨機方法抽取群,所以樣本群均值是總體群均值的無偏估計,因而第29頁,課件共79頁,創(chuàng)作于2023年2月性質2:的方差為

§4.2群規(guī)模大小相等時的估計第30頁,課件共79頁,創(chuàng)作于2023年2月已知,又故

§4.2群規(guī)模大小相等時的估計第31頁,課件共79頁,創(chuàng)作于2023年2月性質3:的樣本估計為因為是的無偏估計,所以是的無偏估計

§4.2群規(guī)模大小相等時的估計第32頁,課件共79頁,創(chuàng)作于2023年2月總體總值據(jù)此,可直接推出其估計量及相應的方差

§4.2群規(guī)模大小相等時的估計第33頁,課件共79頁,創(chuàng)作于2023年2月三、整群抽樣效率分析群內相關系數(shù)表達式為:上式中的分子為(P119)

§4.2群規(guī)模大小相等時的估計第34頁,課件共79頁,創(chuàng)作于2023年2月上式中的分母為:故又可寫為:§4.2群規(guī)模大小相等時的估計第35頁,課件共79頁,創(chuàng)作于2023年2月事實上,的方差可用群內相關系數(shù)近似表示

§4.2群規(guī)模大小相等時的估計第36頁,課件共79頁,創(chuàng)作于2023年2月簡單隨機抽樣的方差公式為由此可計算出等群抽樣的設計效應為

§4.2群規(guī)模大小相等時的估計第37頁,課件共79頁,創(chuàng)作于2023年2月整群抽樣的估計效率,與群內相關系數(shù)的關系密切當=1時,deff=M

當=0時,deff=1

當為負時,deff<1

的取值范圍是群內方差為0群內方差與總體方差相等群間方差為0

§4.2群規(guī)模大小相等時的估計第38頁,課件共79頁,創(chuàng)作于2023年2月群內相關系數(shù)也可由樣本統(tǒng)計量估計例一

§4.2群規(guī)模大小相等時的估計第39頁,課件共79頁,創(chuàng)作于2023年2月當N很大,而M相對于NM很小時,第40頁,課件共79頁,創(chuàng)作于2023年2月i240,187,162,185,206,197,154,173188.0027.19210,192,184,148,186,175,169,180180.5017.98149,168,145,130,170,144,125,167149.7517.32202,187,166,232,205,263,198,210207.8829.17210,285,308,198,264,275,183,231244.2545.20394,256,192,280,267,334,216,289278.5063.87192,121,172,165,152,224,195,241182.7538.77230,205,187,176,212,253,189,240211.5027.48274,208,195,307,264,258,210,309253.1344.52232,187,150,182,175,212,169,222191.1328.29342,294,267,309,258,198,244,286274.7543.70228,294,182,312,267,254,232,298258.3843.52

第41頁,課件共79頁,創(chuàng)作于2023年2月解:已知N=510,n=12,M=8,f=n/N=0.0235故

§4.2群規(guī)模大小相等時的估計第42頁,課件共79頁,創(chuàng)作于2023年2月

§4.2群規(guī)模大小相等時的估計于是的置信度為95%的置信區(qū)間為也即第43頁,課件共79頁,創(chuàng)作于2023年2月例2由例1數(shù)據(jù),計算群內相關系數(shù)與設計效應解:由前已算出樣本群間方差而群內方差為

§4.2群規(guī)模大小相等時的估計第44頁,課件共79頁,創(chuàng)作于2023年2月

§4.2群規(guī)模大小相等時的估計第45頁,課件共79頁,創(chuàng)作于2023年2月若令為簡單隨機抽樣的樣本量則即可達到整群抽樣96戶樣本量相同的估計精度

§4.2群規(guī)模大小相等時的估計第46頁,課件共79頁,創(chuàng)作于2023年2月

§4.3群規(guī)模不等時的估計當群Mi規(guī)模不等時,有不同的抽取方法和估計方法一、等概抽樣,簡單估計對總體均值的估計為可以看出,此公式與上節(jié)(1)式同的方差估計為第47頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計此法特點估計量是有偏的操作簡便,易于掌握和使用適用條件,群之間的規(guī)模差異不大時

第48頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計二、等概抽樣,加權估計思路:以群規(guī)模Mi為權數(shù),得到群總和yi,進而求得群總和均值,再除以群平均規(guī)模第49頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計估計公式為:若未知,可用樣本群平均規(guī)模代替第50頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計總體總量Y的估計為總量估計的另一公式為第51頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計估計量的方差為它的無偏估計為均值估計的方差為第52頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計三、等概抽樣,比率估計總體均值估計為這里輔助變量不是Xi而是群規(guī)模Mi總體總量估計為第53頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計估計量的方差分別是第54頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計

與的樣本估計分別是第55頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計

第56頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計四、與群規(guī)模成比例不等概率抽樣估計按與Mi成比例的PPS抽樣每次第i群入選概率為根據(jù)漢森-赫維茨估計量和是和的無偏估計第57頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計

估計量的方差為第58頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計五、案例分析背景:某縣有33個鄉(xiāng),726個村,該年度某種作物總種植面積30525畝,現(xiàn)采用等概抽樣隨機抽出10個鄉(xiāng),要求估計全縣總產(chǎn)量,計算抽樣誤差。調查資料如下:第59頁,課件共79頁,創(chuàng)作于2023年2月樣本鄉(xiāng)編號村莊數(shù)

Mi作物總產(chǎn)量(鄉(xiāng))

yi(萬公斤)種植面積(鄉(xiāng))

xi(畝)123456789101518261420282119311722.022.830.221.725.331.226.020.533.823.68007801000700880110085080012008301.46671.26671.16151.551.2651.11431.23811.0791.09031.3882合計209257.18940——第60頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計分別采用幾種方法估計1.等概抽樣,簡單估計第61頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計評價:方法雖簡單,卻是有偏估計。第62頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計2.等概抽樣,加權估計第63頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計評價:雖是無偏估計量,但方差估計沒有改觀。第64頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計3.等概抽樣,比率估計評價:有偏,n較大時比較理想。第65頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計4.其它輔助變量的估計已知:種植面積X=30525(畝)用種植面積為輔助變量評價:和相比,更小,因而有更好的估計效果。選擇關系密切的輔助變量。第66頁,課件共79頁,創(chuàng)作于2023年2月例2有下列資料分廠編號職工人數(shù)Mi

累積區(qū)間12345678120045021008602840191039032001-12001201-16501651-37503751-46104611-74507451-93609361-97509751-12950第67頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計n=3,采用PPS抽樣,隨機抽取的3個數(shù)為02011,07972,10281。調查結果如下:第68頁,課件共79頁,創(chuàng)作于2023年2月§4.3群規(guī)模不等時的估計故置信區(qū)間為估計總量

第69頁,課件共79頁,創(chuàng)作于2023年2月§4.4總體比例的估計令ai為第i群中具有某特征的單位數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論