抽樣調查:不等概率抽樣_第1頁
抽樣調查:不等概率抽樣_第2頁
抽樣調查:不等概率抽樣_第3頁
抽樣調查:不等概率抽樣_第4頁
抽樣調查:不等概率抽樣_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

簡單隨機抽樣的特點:總體中每個個體被抽中入樣的概率都相同。對于各單元所處地位幾乎“平等”的總體,這種抽樣原則既公正又方便。不等概率抽樣:但在許多社會經濟活動中并非所有單元地位相同。使得“大”單元入樣概率大,“小”單元入樣概率小,這里的“大”、“小”與我們所關心的調查指標有著密切的關系。第三章不等概抽樣例如,要了解上海地區(qū)鋼鐵企業(yè)的景氣狀況,總體有上鋼一廠、三廠、五廠……等等,再加上寶鋼。由于寶鋼規(guī)模極大,它是否景氣對整個上海地區(qū)鋼鐵工業(yè)起著至關重要的作用。而在抽樣中將它與其它規(guī)模較小的單位處于同等地位就會既不公正又使抽樣推斷結果有較大可能發(fā)生大的偏差?!?.1PPS抽樣PPS抽樣:抽取概率正比于規(guī)模測度?!猄amplingwithProbabilityProportionaltoSize

不等概率抽樣有放回不等概率抽樣(PPS)無放回不等概率抽樣()一、實現方法(1)累積和法或代碼法它適合于N不太大的情形。假定所有的為整數,倘若在實際中存在不是整數的話,則可以乘以一個倍數使其為整數。見下表。單元單元大小代碼數表3—1pps抽樣時各單元的代碼數每次抽樣前,先在整數里面隨機等可能的選取一個整數,設為m,若代碼m屬于第j個單元擁有的代碼數,則第j個單元入樣。整個過程重復n次,得到n個單元入樣(當然存在重復的可能性)構成pps樣本。例3.1

設某總體共有N=8個單元,相應及代碼如表所示123456782/51/22/34/38/53/52/311215204048182030累計12274787135153173203代碼1~1213~2728~4748~8788~135136~153154~173174~203假設第個單元在n次抽樣中被抽中次,則是一個隨機向量,其聯合分布為:這是我們熟悉的多項分布,多項抽樣其名正出于此。(3.1)多項分布(3.1)具有如下性質:倘若單元有一個數值度量其大小,諸如職工人數、工廠產值商店銷售額等,或者感興趣的調查指標在上一次普查時的數據也可以作為其單元大小的一種度量。記為第個單元的“大小”,并記若取n=3,在1~203中隨機有放回地產生3個隨機整數,不妨設為45、89、101,則第3個單元入樣一次,第5個單元入樣2次。(2)最大規(guī)模法或Lahiri(拉希里)方法當N相當大時,累計的將很大,給代碼法的實施帶來很多不方便。Lahiri提出下列方法:令每次抽取1~N中一個隨機整數及1~內一個隨機整數,如果,則第個單元入樣;若,則按前面步驟重抽,顯然,第個單元的入樣與否受到的影響,只有時它才入樣,因此第個單元入樣的概率與的大小成正比,此時m定理3.1.1

在有放回PPS抽樣下,二、估值法PPS抽樣法的估值法的理論依據估計的均方偏差為:證明

考慮隨機變量Z,定理3.1.2

在有放回PPS抽樣下,注:果園序號12345678規(guī)模測度X503065801404420100例

一村莊有8個果園,分別由果樹50,30,65,80,140,44,20,100棵,要調查該村莊水果產量,以正比于果樹棵樹的概率取3個果園作樣本.

如果實地調查得第5、第8、第3號三個果園的產量分別為15,12,7,求該村八個果園的總產量估計.解:這一估計的均方偏差的估計為2、Hansen-Hurwitz(漢森—赫維茨)估計量若是按為入樣概率的多項抽樣而得的樣本數據,它們相應的值自然記為,則對總體總和,Hansen-Hurwitz給出了如下的估計量:且,即是總體總和的無偏估計。的無偏估計為有放回不等概率抽樣:從實施上還是從估計計算以及精度估計都顯得十分方便。但一個單元被抽中兩次以上總會使樣本的代表性打折扣,從而引起抽樣誤差的增加。實際調查工作者一般傾向于使用不放回形式。問題:最簡單的不放回不等概率抽樣方式自然會想到逐一抽樣這在第一次抽樣時不會發(fā)生問題,但在抽第二個樣本時面臨的情況與有放回時大不相同,余下的(N-1)個單元以什么樣的概率參與第二次抽樣就是個問題;再在抽第三個樣本時又面臨新問題。一是抽樣實施的復雜;二是估計量及其方差計算的復雜。在本節(jié)討論:(1)n固定,尤其是n=2時的情形。(2)總體中每個單元的入樣概率嚴格地與其“大小”成比例,即抽樣。§3.2不等概抽樣幾種嚴格的不放回抽樣方法(1)Brewer(布魯爾)抽樣方法(1963)前面已經指出,所謂“嚴格不放回”是指樣本容量n固定,嚴格不放回、的抽樣。僅介紹n=2的情形。1.對這種抽樣,總體中個體單元i的入樣概率為2.設計好第一次抽取的概率,第二次抽取的概率與成正比,使總的入樣概率正比于.特點:(2)Durbin(德賓)方法(1967)1.對這種抽樣,總體中個體單元i的入樣概率為2.第一次抽取的概率與成正比,第二次抽取的概率使總的入樣概率正比于.特點:Durbin方法中的與Brewer方法中的完全一樣這表明兩種不等概率抽樣方法其實是等價的。(3)Sen-Midzuno抽樣方法(4)Horvitz—Thompson(霍維茨—湯普森)HT估計量對于不放回不等概率抽樣,常用HT估計。總體總數Y的無偏估計量為:該估計量的均方偏差為:HT估計的均方偏差的兩個無偏估計量為注:兩估計量均有可能取負值,通過模擬比較,v2較穩(wěn)定且較少取負值?!?.3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論