




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、5.1 不等概抽樣一、概念與特點前面所學(xué)的簡單隨機抽樣,總體中的每個單元具有同樣的入樣概率,它是等概率抽樣。與等概率抽樣對應(yīng)的另一類方法是不等概抽樣,也就是在抽樣前賦予總體每個單元一個入樣概率.普通而言,每個單元的入樣概率是由該單元在整體中的位置來確定的.因此每個單元的入樣概率能夠是不一樣的. 什么時候運用不等概抽樣?實踐任務(wù)中,假設(shè)遇到下面幾種情況,那么可以思索運用不等概抽樣:1、抽樣單元在總體中所占的位置不一致2、調(diào)查的總體單元與抽樣總體的單元不一致3、改善估計量 不等概抽樣的優(yōu)點:提高估計精度,減少抽樣誤差。.二、不等概抽樣的種類1、放回不等概抽樣首先給整體的每一個單元賦予一個確定的入樣
2、概率通常是不相等的,然后在總體中對每個單元按入樣概率進(jìn)展抽樣,抽取出來的樣本單元記錄后又放回總體,再進(jìn)展下一次的抽樣,很顯然每次抽樣都是獨立的。. 放回不等概抽樣中,最常用的是按照整體單元的規(guī)模大小來確定單元在每次抽樣時的入樣概率,假設(shè)總體中第i個單元的規(guī)模度量為 ,總體的總規(guī)模為 每次抽樣中,第i個單元被抽中的概率用 表示,其中. 這種不等概抽樣稱作放回的與規(guī)模大小成比例的概率抽樣probability proportional to size),簡稱PPS抽樣。實踐問題中,總體單元大小的度量往往不止一個,比如企業(yè)員工數(shù)量、產(chǎn)值、銷售量、利潤等都可以度量企業(yè)規(guī)模的大小。 PPS抽樣的實施主要
3、有兩種方法:代碼法和拉希里L(fēng)ahiri)法,下面我們用一個實例分別引見這兩種方法。.代碼數(shù),將代碼數(shù)累加得到每次抽樣都產(chǎn)生一個1,之間的隨機數(shù),設(shè)為m那么代碼m所對應(yīng)的單元被抽中。假設(shè)不是整數(shù),那么乘以某個倍數(shù)。1代碼法 在PPS抽樣中,賦予每個單元與相等的. 10累計 10代碼123456789100.614.51.513.77.815103.661.161451513778150100366011615116630338153163166772773816715115216616730330438138253153263163266766872772873873.8738_【例5.1】設(shè)某
4、個總體有N=10個單元,相應(yīng)的單元大小 及其代碼數(shù)如下表,我們要在其中產(chǎn)生一個n=3的樣本.先在1,738中產(chǎn)生一個隨機數(shù)為354,再在1,738中產(chǎn)生第二個隨機數(shù)為553,最后產(chǎn)生第三個隨機493。那么它們所對應(yīng)的第5,7,6號單元被抽中。.2拉希里法令 每次抽樣都分別產(chǎn)生一個1,N之間的隨機數(shù) i 及1,之間的隨機數(shù)m假設(shè)那么第i個單元被抽中;否那么,重抽一組( i, m ).在例5.1中,在1,10和1,150中分別產(chǎn)生( i, m ):.(3,121),=15 121, 舍棄,重抽;(8,50),=36 50, 舍棄,重抽;(7,77),=100 77,第7號單元入樣;(5,127),
5、78 127, 舍棄,重抽;(4,77), 77, 第4號單元入樣;(9,60),60 60,第9號單元入樣。因此,第,7, 9號單元被抽中。.2、不放回不等概抽樣每次在總體中對每個單元按入樣概率進(jìn)展抽樣,抽取出來的樣本單元不放回總體,對總體中剩下的單元進(jìn)展下一次抽樣。不放回不等概抽樣的效率比放回時的效率高,但是樣本不獨立會加大抽樣實施、參數(shù)估計及精度計算的難度。.對于不放回不等概抽樣,樣本的抽取可以有以下幾種方法:1逐個抽取法。每次從總體未被抽中的單元中以一定的概率取一個樣本單元。2重抽法。以一定的概率逐個進(jìn)展放回抽樣,假設(shè)抽到反復(fù)單元,那么放棄一切抽到的單元,重新抽取。3全樣本抽取法。對總
6、體每個單元分別按一定概率決議其能否入樣。這種方法的樣本量是隨機的,事先不能確定。4系統(tǒng)抽樣法。將總體單元按某種順序陳列,根據(jù)樣本量確定抽樣間距k,在1,k中產(chǎn)生一個隨機數(shù)。.5.2 放回不等概抽樣一、只抽取一個樣本單元n=1)的不等概抽樣 為了便于了解不等概抽樣的根本思想,我們先看一個總體知,只抽取一個樣本單元的例子。 【例】一個城市有四個超市營業(yè)面積從100平方米到1000平方米不等見下表,我們的目的是經(jīng)過抽取一家超市來估計這四個超市上個月的總營銷量。通常超市面積越大那么銷售量越大,因此,我們選擇的入樣概率與超市的營業(yè)面積成正比。.超市營業(yè)面積(平方米)(萬元)A1001/1611B2002
7、/1620C3003/1624D100010/16245總計16001300四個超市的背景數(shù)據(jù):第i個超市的包含概率, :第i個超市的銷售量. 假設(shè)超市的營業(yè)面積近似正比于超市的銷售額,那么超市A的銷售額就占一切超市銷售額的1/16,因此超市A的銷售額乘以權(quán)重16包含概率的倒數(shù)可以近似地估計一切超市的銷售額。因此,樣本量為1的不等概抽樣的總體總值估計量為:式中.樣本A1/161117615375B2/162016019600C3/162412829584D10/162453928464四個n=1能夠的不等概樣本及其估計量.從上表可以算出:可見不等概抽樣的總體總值估計量是無偏的. 我們用同一個例
8、題將不等概抽樣與簡單隨機抽樣作一比較,以此認(rèn)識不等概抽樣的意義。 與n=1的簡單隨機抽樣相比,簡單隨機抽樣的樣本一切能夠的樣本見下表.樣本A1/4114465536B1/4208048400C1/4249641616D1/4245980462400四個能夠的簡單隨機樣本的數(shù)據(jù)及其估計量.我們來計算簡單隨機抽樣的估計量方差 前面按不等概抽樣的估計量方差為 14248, 是無偏估計,期望為300萬元,但是其方差大于不等概抽樣,這是由于不等概抽樣利用了輔助信息,即與銷售額相關(guān)的超市面積。.二、普通有放回不等概抽樣 對于放回不等概抽取樣本容量為n的樣本,總體總值的估計量為樣本中一切 的平均,我們得到漢
9、森赫維慈(Hansen-Hurwitz)估計 :上式是總體總值的無偏估計.假設(shè)采用的是PPS抽樣,即 ,那么 上面估計量是n個獨立觀測的平均,因此每個單元的總值估計量方差是:.【例5.2】某部門要了解所屬8500家消費企業(yè)當(dāng)月完成的利潤,該部門手頭已有一份上年各企業(yè)完成產(chǎn)量的報告,將其匯總得到所屬企業(yè)上年完成產(chǎn)量為3676萬噸.思索到時間緊,預(yù)備采用抽樣調(diào)查來推算當(dāng)月完成的利潤.根據(jù)閱歷,企業(yè)的產(chǎn)量和利潤相關(guān)性比較強,且企業(yè)的特點是規(guī)模和管理程度差別比較大,通常大企業(yè)的管理程度較高,因此采用與上年產(chǎn)量成比例的PPS抽樣,從所屬企業(yè)中抽出一個樣本量為30的樣本,調(diào)查結(jié)果如下表.不等概抽樣例題.i
10、miyiimiyiimiyi138.2310926106.501900191.510213.7010241115.00864208.008030.7513127.00172128.421367242.85301316.001045229.01384552.0011021412.30220230.7548065.00600153.864600246.00311710.802901615.8023702528.43928482.00430179.00940269.9784298.819921821.00640276.20510樣本單元的有關(guān)數(shù)據(jù)紅色數(shù)字表示被兩次抽到,mi為企業(yè)上年完成的產(chǎn)量,yi
11、為企業(yè)當(dāng)月完成的產(chǎn)量。. 要根據(jù)以上調(diào)查結(jié)果估計該部門所屬企業(yè)當(dāng)月完成的利潤,并給出95%置信度下的相對誤差.假設(shè)要求在一樣條件下相對誤差到達(dá)20%,所需的樣本量應(yīng)該是多少?解:由上述條件知估計當(dāng)月完成的利潤為:.方差及規(guī)范差的估計在置信度為95%時,對應(yīng)的t=1.96, 的相對誤差. 因此,在置信度仍為95%、相對誤差時 ,所需樣本量為:.三、有放回不等概整群抽樣 在群規(guī)模不等的整群抽樣中,假設(shè)群的規(guī)模差別較大,各個群對總體的影響會產(chǎn)生很大差別。這時可以采用不等概方式抽取群。其益處是把群的規(guī)模作為抽取樣本的輔助信息,提高了估計的精度,而且方差估計有比較簡單的方式。下面主要討論以PPS抽樣抽取
12、群的情況。. 每次按 的概率抽取第i個群,由于群內(nèi)的單元全部參與調(diào)查,第i個群的總值為: 根據(jù)上節(jié)講到的漢森赫維茨估計量,PPS整群抽樣的總體總值估計量為:我們知道,這是一個無偏估計。.估計量的方差是:估計量方差的估計為:.【例5.3】 某企業(yè)欲估計上季度每位職工的平均病假天數(shù)。該企業(yè)共有8個分廠工人數(shù)資料見下表,現(xiàn)用不等概整群抽樣擬抽取三個分廠為樣本,并以95%的置信度計算其置信區(qū)間。有關(guān)數(shù)據(jù)及抽樣過程如下:.分廠編號職工人數(shù)累積區(qū)間11200112002450120116503210016513750486037514610528404611745061910745193607390936
13、19750832009751129508個分廠的職工人數(shù)資料.【解】 采用PPS抽樣,利用隨機數(shù)表在數(shù)字 112950之間隨機抽取3個數(shù),分別是02021, 07972和10281,于是3分廠、6分廠和8分廠入選樣本。用 分別表示三個分廠職工的病假天數(shù),調(diào)查結(jié)果為:.同樣可求得估計量方差的估計值為:其95%的置信區(qū)間為:.【評價】 對于群規(guī)模不等的整群抽樣,采用不等概PPS抽樣,可以得到總體目的量的無偏估計,估計量和估計量方差都有比較簡明的方式,估計的效率也比較高,確實是值得優(yōu)先采用的方法。但是此方法運用的條件是:在抽取樣本前,要了解有關(guān)群規(guī)模大小的信息。此外,抽樣過程比等概整群抽樣更為復(fù)雜。
14、.5.3 多階段有放回不等概抽樣一、兩階段有放回不等概抽樣 抽樣方法:對初級單元進(jìn)展抽樣時,先確定每個初級單元的入樣概率。對被抽中的初級單元,再抽取 個二級單元。假設(shè)某個初級單元被抽中多次,那么將這 個二級單元放回,重新抽取 個二級單元。當(dāng)然,這兩個樣本中的二級單元能夠會有反復(fù)。在實踐調(diào)查時,對反復(fù)的二級單元只調(diào)查一次,但計算的時候,應(yīng)該按照被抽中的次數(shù)進(jìn)展反復(fù)計算。.總體總值的估計:先構(gòu)造初級單元總值 的無偏估計 然后利用漢森-赫魏茨估計量對總體總值Y進(jìn)展估計:.特別地 記總體中一切二級單元數(shù)為 ,假設(shè)抽樣時每個初級單元被抽中的概率與其擁有的二級單元數(shù)成比例,即初級單元被抽中的概率為 第二階
15、段對二級單元進(jìn)展簡單隨機抽樣,那么 ,樣本是自加權(quán)的,對總體總值的估計為:. 在實踐調(diào)查中,假設(shè)初級單元大小不相等,人們通常喜歡在第一階段時按放回的與二級單元成比例的PPS抽樣,第二階段抽樣那么進(jìn)展簡單隨機抽樣,且每個初級單元的二級單元樣本都一樣,這樣得到的樣本是自加權(quán)的,估計量的方式非常簡單?!纠?.4 】某小區(qū)擁有10座高層建筑,每座高層建筑擁有的樓層數(shù)如下表高層建筑ABCDEFGHIJ樓層1212161510161018162010座高層建筑的層數(shù). 我們用兩階段抽樣方法抽出10個樓層進(jìn)展調(diào)查,第一階段抽樣為放回的按與每層建筑擁有的樓層成比例的不等概抽取5座建筑,第二階段按簡單隨機抽樣對
16、每座建筑抽取兩個樓層。對10個樓層居民人數(shù)的調(diào)查結(jié)果如下,試對小區(qū)總居民數(shù)進(jìn)展估計,并給出估計的誤差。初級樣本序號12345居民數(shù)18,1215,1819,1316,1016,11被選中的高層建筑序號及10個樓層的居民數(shù).【解】知.二、多階段有放回不等概抽樣 略) 參看教材P174.5.3 不放回不等概抽樣一、PS 抽樣不放回不等概抽樣: 我們知道,假設(shè)采用放回抽樣,對總體參數(shù)的估計及其方差估計比較簡單,但樣本單元中能夠有單元被抽中多次.因此,放回抽樣得到的樣本其代表性比不放回抽樣差.在一樣樣本量的條件下,放回抽樣的估計精度較低. 不放回不等概抽樣是指不放回的與單元大小成比例的概率抽樣.包含概
17、率: 在不放回不等概抽樣中,每個單元入樣的概率 及恣意兩個單元同時入樣的概率 統(tǒng)稱為包含概率.對固定的 n ,包含概率滿足下面等式:.假設(shè)每個單元入樣概率與其大小嚴(yán)厲成比例那么對于固定的 n ,有 這時,我們簡稱這種情形的抽樣為嚴(yán)厲的抽樣。求得,只需在 n=2 時才有一些適用的方法。嚴(yán)厲的抽樣實施起來非常復(fù)雜, 不易.二、赫魏慈湯普森估計量 對于不放回不等概抽樣,其總體總量Y的估計是:赫魏慈湯普森估計:為第i個單元的包含概率.其中.假設(shè)那么的無偏估計,它的方差為:假設(shè) n 固定,那么.【例5.3】假設(shè)有5個居委會,每個居委會的住戶數(shù)X知,但常住居民人數(shù)未知,我們從這5個居委會抽出兩個來估計常住
18、居民的總?cè)藬?shù),調(diào)查數(shù)據(jù)如下表.i住戶數(shù)(X)常住人數(shù)(Y)包含概率( )140011000.822506000.532005000.441002400.2550800.110002520-.上面表中的包含概率為: 從5個居委會中不放回地抽出2個居委會,無論是不放回不等概抽樣還是簡單隨機抽樣,共有10種不同的樣本,我們用這些樣本分別利用霍維茨湯普森估計計算及簡單隨機抽樣簡單估計計算對總量的估計,計算結(jié)果列于下表.樣本1,2257542501,3262540001,4257533501,5217529502,3245027502,4240021002,5200017003,4245018503,5
19、205014504,52000800不同估計量的估計結(jié)果. 從實際上來說, 和 都是無偏的,它們的均值是2520. 本例題的結(jié)果闡明:不放回不等概赫魏慈湯普森估計量比簡單隨機抽樣簡單估計更準(zhǔn)確,其原因是X 和Y 之間有較強的相關(guān)關(guān)系。.三、n不同情況下的嚴(yán)厲抽樣我們在上面提到的嚴(yán)厲抽樣,就是指 n 固定、嚴(yán)厲不放回、包含概率與單元大小成比例。即下面分別引見一種適宜于n=2和n2情形的嚴(yán)厲的 抽樣。1、 的情形在總體中只抽兩個單元,通常用逐個抽取法來保證抽樣是不放回的。我們可以采用幾種不同的抽樣方法。對總體一切的單元,假設(shè)有 就可以采用布魯爾方法。.布魯爾抽樣方法:按與成比例的概率抽取第一個單元
20、,記為j ,按與成比例的概率抽取剩下的N-1個單元中抽取第二個單元.布魯爾方法的包含概率為:. 對于總體總量估計可采用赫魏慈湯普森估計量:【例5.7】對于例5.6,假設(shè)抽樣是按布魯爾方法的,那么其一切能夠樣本的包含概率如下表:.樣本1,225750.348791,326250.265741,425750.124571,521750.060902,324500.091352,424000.040482,520000.019383,424500.029073,520500.013844,520000.00588.我們可以按下述公式總體均值的估計及其方差:.2. n 2的情形普通采用水野法,也是一種
21、逐個抽取方法,它以概率i=1,2,N抽取第一個樣本單元,在剩下的N-1個單元中,不放回等概地抽出n-1個樣本單元。為了保證每個要求每個單元的大小滿足:.四、幾種非嚴(yán)厲抽樣1.耶茨格隆迪逐個抽取法:每次都以與未入樣的單元的成比例的概率抽樣,即以抽取第一個單元,無妨記被抽中的單元為第1個;以在剩下的N-1個單元中抽取第二個樣本單元;無妨記被抽中的單元為第2個;以在剩下的N-2個單元中抽取第二個樣本單元;依此類推,直到抽出 n 個樣本單元。.這種方法顯然不是與單元大小嚴(yán)厲成比例的,但它在不放回不等概抽樣中操作最簡單、想法最自然,因此在實踐中人們經(jīng)常運用。 耶茨格隆迪方法的 不易計算,因此不能用赫魏慈湯普森估計量,我們采用拉奇估計量。 設(shè) 為按抽中順序陳列的樣本單元的目的值,相應(yīng)的Z值為 ,令.那么拉奇估計量為:.【例5.8】總體由 N=10 個單
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 連鎖超市轉(zhuǎn)讓協(xié)議書
- 車位租賃合同協(xié)議書
- 順豐司機合同協(xié)議書
- 金融委托貸款協(xié)議書
- 造價咨詢股東協(xié)議書
- Brand KPIs for second-hand apparel online shops IN LOVE AGAIN in Germany-外文版培訓(xùn)課件(2025.2)
- 長期電力交易協(xié)議書
- 餐具貨物配送協(xié)議書
- 閑置資金托管協(xié)議書
- 餐具專版定制協(xié)議書
- 工業(yè)微波設(shè)備加熱均勻性標(biāo)準(zhǔn)
- 制定創(chuàng)新激勵機制與獎勵政策計劃
- 2019瀘州中考化學(xué)試題及答案
- 五人制足球規(guī)則(教學(xué))
- 學(xué)校食堂“三同三公開”制度實施方案
- 2025年福建福州地鐵集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 人工智能在新聞媒體領(lǐng)域的應(yīng)用
- 【MOOC】儒家倫理-南京大學(xué) 中國大學(xué)慕課MOOC答案
- 銀保部三年規(guī)劃
- 2024治安調(diào)解協(xié)議書樣式
- 零工市場(驛站)運營管理 投標(biāo)方案(技術(shù)方案)
評論
0/150
提交評論