不等概率抽樣_第1頁
不等概率抽樣_第2頁
不等概率抽樣_第3頁
不等概率抽樣_第4頁
不等概率抽樣_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

會計學(xué)1不等概率抽樣第七章不等概率抽樣§7.1概述§7.2放回不等概率抽樣§7.3不放回不等概率抽樣*第1頁/共30頁§7.1概述一、不等概率抽樣的提出與含義二、不等概率抽樣的使用和優(yōu)點三、不等概率抽樣的分類第2頁/共30頁一、不等概率抽樣的提出與含義前述概率抽樣方式,具有“等概率”的特點?!蚝唵坞S機抽樣下總體中每一個單元的入樣概率均相等◎分層隨機抽樣下,層內(nèi)每一個單元的入樣概率均相等◎特別地,按比例分配的分層隨機抽樣對于總體中每一個單元的入樣概率均相等等概率抽樣的基本出發(fā)點是將總體(或?qū)樱┲械拿恳粋€單元看作是平等的,不“偏向”也不“疏遠”某些特定的單元如果總體單元差異不大,這種方式既簡單也合理第3頁/共30頁

但是如果總體單元相差較大,等概率抽樣效果不一定好◎例如估計昆明市商業(yè)零售總額,大型商場、中型超市和小型商店的差別非常明顯,平等對待顯然不合理對這一情況,處理方式有多種:◎分層抽樣:按規(guī)模分層,大型抽樣比高、小型抽樣比低◎目錄抽樣:少數(shù)大單元普查而大多數(shù)小單元進行抽樣◎不等概率抽樣第4頁/共30頁

不等概率抽樣(samplingwithunequalprobability)是指在抽取樣本之前給總體中的每一個單元賦予一定的入樣概率,從而保證大的(重要的)單元抽到的概率大,而小的(不重要的)的單元抽到的概率小。這里每個單元被賦予的入樣概率通常與某個輔助變量有關(guān)(比如單元規(guī)模等)不等概率抽樣是抽樣理論發(fā)展的產(chǎn)物?!虼硇猿闃樱褐饔^、有意識的抽樣◎等概率的隨機抽樣:每個單元平等◎分層抽樣:不同層不等概率,但層內(nèi)等概率◎不等概率抽樣:單元具有不等地位第5頁/共30頁二、不等概率抽樣的使用和優(yōu)點不等概率抽樣通常用于以下三種情況:◎需要估計總體總量但總體單元規(guī)模相差很大的情況◎抽樣審計◎在不能直接對基本的較小單元抽樣的情形下,與其它抽樣結(jié)合,完成對大的單元的抽樣在上述情形下,不等概率抽樣的主要優(yōu)點是可以大大提高估計的精度,較少抽樣誤差。一個必要的約束條件是對總體的每一個單元,都要已知一個輔助變量用于確定其入樣概率或兩個單元同時入樣的概率第6頁/共30頁三、不等概率抽樣的分類不等概率抽樣有很多,布魯爾與哈尼夫在1983年專著《不等概率抽樣》中曾列舉了50多種方法。不過真正常用的在10種左右這些方法按其實施方法或特性可以分成許多不同的類型◎按抽樣過程中被抽到的單元是否被放回總體而分為放回抽樣和不放回抽樣。常用的是放回抽樣?!虬磫卧娜霕痈怕适欠駠栏竦嘏c單元大小成比例,還有最終楊本量n是固定還是隨機的?!虿环呕氐某闃樱礃颖締卧槿》绞竭€可以分為逐個抽取法、重抽法、系統(tǒng)抽取法等等。第7頁/共30頁§7.2放回不等概率抽樣一、多項抽樣與PPS抽樣二、PPS抽樣的實施三、PPS抽樣的估計第8頁/共30頁一、多項抽樣與PPS抽樣設(shè)總體包含N個單元,對其進行放回抽樣。設(shè)在每次抽樣中,抽到第i個單元的概率為Zi(i=1,2,…,N),獨立進行n次這種抽樣,共抽到n個單元(有可能重復(fù)),則稱這種不等概率抽樣為多項抽樣(multinominalsampling)

特別地,當(dāng)總體中每個單元具有一個說明其“大小”或“規(guī)?!钡亩攘縈i時,則可將每個單元的入樣概率取為:此時每個單元在每次抽樣中的入樣概率與單元大小成比例,稱這種特殊的多項抽樣為與大小成比例的概率抽樣(samplingwithprobabilityproportionaltosize),簡稱PPS抽樣。第9頁/共30頁二、PPS抽樣的實施1、代碼法(累積總和法,漢森-赫維茨法,1943)

設(shè)總體有N個單元,其規(guī)模度量為Mi,不妨設(shè)Mi為整數(shù)(否則可以乘以一個常數(shù)使其成為整數(shù))。記Mi之和為M0,則可以設(shè)置M0個代碼,其中第i個單元相應(yīng)的有Mi個代碼。其代碼的具體范圍可以采用累積方法獲得。具體而言:第1個單元擁有代碼1-M1,第2個單元擁有代碼M1+1-M1+M2,……,第i個單元擁有代碼:

每次抽樣時在整數(shù)1-M0之間產(chǎn)生一個隨機數(shù)m,則代碼m所屬的單元即為抽中單元,如此重復(fù)n次即可獲得n個樣本單元。若有的隨機數(shù)相同或?qū)儆谕粏卧瑒t該單元被重復(fù)抽中第10頁/共30頁2、拉希里法(二次抽取法,Lahiri,印度)

設(shè)總體單元數(shù)為N,單元規(guī)模為Mi,記:◎在1-N范圍內(nèi)產(chǎn)生一個隨機數(shù),設(shè)為j;◎在1-M*范圍內(nèi)的隨機數(shù)m

如果m<=Mj,則第j個單元為被抽中的樣本單元;如果m>Mj,則第j個單元未被抽中。此時需要重復(fù)上述步驟,另行抽取一組【j,m】。直到抽滿n個樣本單元為止。第11頁/共30頁三、PPS抽樣的估計對于放回不等概率抽樣,對于總體總量Y,漢森-赫維茨提出如下估計量(Hansen-Hurwitz,1943):特別地,對PPS抽樣:有:第12頁/共30頁

意義:將Y理解為商店銷售額,度量M理解為商店人數(shù),則:第i個樣本商店的人均銷售額。所有樣本商店的人均銷售額的平均。所有商店的銷售總額第13頁/共30頁※估計量的性質(zhì)漢森-赫維茨估計量是總體總和的無偏估計:

漢森-赫維茨估計量的方差為:

當(dāng)n>1時,這一方差的無偏估計為:第14頁/共30頁證明:設(shè)隨機變量且:則:是n次獨立觀測值yi/zi的樣本平均數(shù)則由數(shù)理統(tǒng)計(放回簡單隨機抽樣),有:第15頁/共30頁而樣本方差:是的無偏估計從而:【例5.4,P169;例5.5,P171】第16頁/共30頁??傮w均值的估計

基于漢森-赫維茨總和估計量基礎(chǔ)上的總體均值的估計量為:

方差估計:

方差:第17頁/共30頁§7.3無放回不等概率抽樣一、包含概率與πPS抽樣二、πPS抽樣的估計三、πPS抽樣的實施第18頁/共30頁一、包含概率與πPS抽樣

放回不等概率抽樣中,每個單元的入樣概率Zi是關(guān)鍵不放回不等概率抽樣中,每個單元被包含到樣本的概率πi及任意兩個單元都包含到樣本的概率πij都起著重要的作用,它們統(tǒng)稱為包含概率(inclusionprobability)設(shè)總體容量為N,樣本量n(固定),包含概率具有以下性質(zhì):◎所有N個單元的入樣概率之和為n,即:※如此可以保證在一次抽樣中可以同時抽出容量為n的一個樣本第19頁/共30頁◎固定第i個單元后,剩余的任意一個單元與其同時出現(xiàn)的概率之和為:◎總體中任意兩個不同單元同時入樣的概率之和為:第20頁/共30頁與放回的PPS抽樣類似,對于不放回不等概率抽樣,最感興趣的仍然是πi與單元大小Mi成比例的情形,即:πi~k*Mi。記單元大小的一個相對度量為:Zi=Mi/M0(注意Zi在此處僅表示一個相對度量,不具有第2節(jié)“入樣概率”的含義)。則有:

即:只要保證第i個單元的入樣概率是其相對規(guī)模度量的n倍,則在不放回的情形下,這一抽樣就是一個與單元大小成比例的不等概率抽樣。稱這種不放回的與單元大小成比例的概率抽樣為πPS抽樣第21頁/共30頁二、πPS抽樣的估計

對于不放回不等概率抽樣,對于總體總量,霍維茨-湯普森(Horvitz-Thompson)提出如下估計量:

特別地,對于πPS抽樣:有:◎這里yi不可重復(fù)第22頁/共30頁※估計量的性質(zhì)霍維茨-湯普森估計量是總體總和的無偏估計:

霍維茨-湯普森估計量的方差為:◎當(dāng)n固定時,這一方差為:第23頁/共30頁

霍維茨-湯普森估計量方差的無偏估計為:◎當(dāng)n固定時,有耶茨-格倫迪-森估計(Yates-Grundy-Sen)也是上述方差的無偏估計:

上述證明參見《抽樣調(diào)查》(倪加勛)P176-177;《抽樣調(diào)查理論與方法》(馮士雍)P195-196第24頁/共30頁二、πPS抽樣的實施

不放回不等概率抽樣的實施非常復(fù)雜,嚴格的πPS抽樣僅討論了n=2的情形,n>2時則多數(shù)屬于非嚴格的πPS抽樣。實際應(yīng)用中,n=2并不是一個十分嚴重的限制。事實上,πPS抽樣常用于對總體分層,在每層中抽取兩個樣本單元的情況。注意前述證明中已經(jīng)指出,只要保證每個單元的入樣概率πi與其相對規(guī)模度量Zi成樣本容量n倍,則抽樣屬于嚴格的πPS抽樣第25頁/共30頁1、布魯爾方法(Brewer)要求:n=2,每個單元的規(guī)模大小比例Zi<1/2,即總體中最大的單元規(guī)模必須小于全部單元規(guī)模的1/2。

抽樣方法:(逐個抽取法)◎第一個單元按與成比例的概率抽取◎第二個單元在剩余N-1個單元中,按與Zj成比例的概率抽取,即第二個單元的抽取概率為:

具體抽取中,每個單元的抽取可使用代碼法完成。此時累計的“Mi”就是上述相應(yīng)概率?!纠?.7,P179】第26頁/共30頁2、德賓方法(Durbin)要求:n=2,每個單元的規(guī)模大小比例Zi<1/2,即總體中最大的單元規(guī)模必須小于全部單元規(guī)模的1/2。

抽樣方法:(逐個抽取法)◎第一個單元按與成比例的概率抽取◎第二個單元在剩余N-1個單元中,按與成比例的概率抽取。

具體抽取中,每個單元的抽取可使用代碼法完成。此時累計的“Mi”就是上述相應(yīng)概率?!纠?.9,P179】第27頁/共30頁3、莫蒂方法(Murthy)

n>2時的一種非嚴格的πPS抽樣方法。

抽樣方法:(逐個抽取法)◎第一個單元按與成比例的概率抽取◎第二個單元在剩余N-1個單元中,按與成比例的概率抽取?!虻谌齻€單元在剩余N-2個單元中,按與每個樣本單元均是按與當(dāng)時未入樣的單元單元大小成比例的概率抽取的。成比例的概率抽取,以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論