




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、返回5.1 不等概抽樣一、概念與特點前面所學的簡單隨機抽樣,總體中的每個單元前面所學的簡單隨機抽樣,總體中的每個單元具有同樣的入樣概率,它是等概率抽樣。具有同樣的入樣概率,它是等概率抽樣。與等概率抽樣對應的另一類方法是不等概抽樣,與等概率抽樣對應的另一類方法是不等概抽樣,也就是在抽樣前賦予總體每個單元一個入樣概率也就是在抽樣前賦予總體每個單元一個入樣概率.一一般而言般而言,每個單元的入樣概率是由該單元在整體中的每個單元的入樣概率是由該單元在整體中的地位來確定的地位來確定的.因此每個單元的入樣概率可能是不相因此每個單元的入樣概率可能是不相同的同的.返回 什么時候使用不等概抽樣?實際工作中,如果遇
2、到下面幾種情況,則可以實際工作中,如果遇到下面幾種情況,則可以考慮使用不等概抽樣:考慮使用不等概抽樣:1、抽樣單元在總體中所占的地位不一致、抽樣單元在總體中所占的地位不一致2、調(diào)查的總體單元與抽樣總體的單元不一致、調(diào)查的總體單元與抽樣總體的單元不一致3、改善估計量、改善估計量 不等概抽樣的優(yōu)點:提高估計精度提高估計精度, ,減少抽樣誤差減少抽樣誤差。返回二、不等概抽樣的種類1 1、放回不等概抽樣、放回不等概抽樣首先給整體的每一個單元賦予一個確定的首先給整體的每一個單元賦予一個確定的入樣概率(通常是不相等的),然后在總體中入樣概率(通常是不相等的),然后在總體中對每個單元按入樣概率進行抽樣,抽取
3、出來的對每個單元按入樣概率進行抽樣,抽取出來的樣本單元記錄后又放回總體,再進行下一次的樣本單元記錄后又放回總體,再進行下一次的抽樣,很顯然每次抽樣都是獨立的。抽樣,很顯然每次抽樣都是獨立的。返回NiiiiiMMMMZ10 放回不等概抽樣中,最常用的是按照整體單放回不等概抽樣中,最常用的是按照整體單元的規(guī)模大小來確定單元在每次抽樣時的入樣概元的規(guī)模大小來確定單元在每次抽樣時的入樣概率,假設總體中第率,假設總體中第i個單元的規(guī)模度量為個單元的規(guī)模度量為 ,總,總體的總規(guī)模為體的總規(guī)模為 每次抽樣中,第每次抽樣中,第i個單個單元被抽中的概率用元被抽中的概率用 表示,其中表示,其中iMNiiMM10i
4、Z返回 這種不等概抽樣稱作放回的與規(guī)模大小成比這種不等概抽樣稱作放回的與規(guī)模大小成比例的概率抽樣(例的概率抽樣(probability proportional to size),簡稱簡稱PPS抽樣。實際問題中,總體單元大小的度抽樣。實際問題中,總體單元大小的度量往往不止一個,比如企業(yè)員工數(shù)量、產(chǎn)值、銷量往往不止一個,比如企業(yè)員工數(shù)量、產(chǎn)值、銷售量、利潤等都可以度量企業(yè)規(guī)模的大小。售量、利潤等都可以度量企業(yè)規(guī)模的大小。 PPS抽樣的實施主要有兩種方法:抽樣的實施主要有兩種方法:代碼法代碼法和和拉希里拉希里(Lahiri)法,下面我們用一個實例分別介法,下面我們用一個實例分別介紹這兩種方法。紹這
5、兩種方法。返回代碼數(shù),將代碼數(shù)累加得到0M每次抽樣0M都產(chǎn)生一個1,之間的隨機數(shù),設為m則代碼m所對應的單元被抽中。(如果iM不是整數(shù),則乘以某個倍數(shù)。)(1 1)代碼法)代碼法 在PPS抽樣中,賦予每個單元與相等的iM返回 10累計累計 10代碼代碼123456789100.614.51.513.77.815103.661.161451513778150100366011615116630338153163166772773816715115216616730330438138253153263163266766872772873873.8738_iMiMiM【例5.1】設某個總體有N=10
6、個單元,相應的單元大小 及其代碼數(shù)如下表,我們要在其中產(chǎn)生一個n=3的樣本.iM返回先在先在1,7381,738中產(chǎn)生一個隨機數(shù)為中產(chǎn)生一個隨機數(shù)為354,354,再再在在1,7381,738中產(chǎn)生第二個隨機數(shù)為中產(chǎn)生第二個隨機數(shù)為553,553,最后最后產(chǎn)生第三個隨機產(chǎn)生第三個隨機493493。則它們所對應的第。則它們所對應的第5 5,7 7,6 6號單元被抽中。號單元被抽中。返回(2 2)拉希里法)拉希里法,max1iNimM令 每次抽樣都分別產(chǎn)生M一個1,N之間的隨機數(shù) i 及1,之間的隨機數(shù)m如果mMi則第i個單元被抽中;否則,重抽一組( i, m ).在例5.1中,.10,150NM
7、在1,10和1,150中分別產(chǎn)生( i, m ):返回(3,121),3M=15 121, 舍棄,重抽;m(8,50),8M=36 50, 舍棄,重抽;m(7,77),7M=100 77,第7號單元入樣;m(5,127),5M78 127, 舍棄,重抽;m(4,77),4M137 77, 第4號單元入樣;m(9,60),9M60 60,第9號單元入樣。m因此,第因此,第,7, 9,7, 9號單元被抽中。號單元被抽中。返回2 2、不放回不等概抽樣、不放回不等概抽樣每次在總體中對每個單元按入樣概率進行抽樣,每次在總體中對每個單元按入樣概率進行抽樣,抽取出來的樣本單元不放回總體,對總體中剩下的抽取出
8、來的樣本單元不放回總體,對總體中剩下的單元進行下一次抽樣。不放回不等概抽樣的效率比單元進行下一次抽樣。不放回不等概抽樣的效率比放回時的效率高,但是樣本不獨立會加大抽樣實施、放回時的效率高,但是樣本不獨立會加大抽樣實施、參數(shù)估計及精度計算的難度。參數(shù)估計及精度計算的難度。返回對于不放回不等概抽樣,樣本的抽取可以有以下幾對于不放回不等概抽樣,樣本的抽取可以有以下幾種方法:種方法:(1 1)逐個抽取法)逐個抽取法。每次從總體未被抽中的單元中。每次從總體未被抽中的單元中以一定的概率取一個樣本單元。以一定的概率取一個樣本單元。(2 2)重抽法。)重抽法。以一定的概率逐個進行放回抽樣,以一定的概率逐個進行
9、放回抽樣,如果抽到重復單元,則放棄所有抽到的單元,重新抽取。如果抽到重復單元,則放棄所有抽到的單元,重新抽取。(3 3)全樣本抽取法。)全樣本抽取法。對總體每個單元分別按一定對總體每個單元分別按一定概率決定其是否入樣。這種方法的樣本量是隨機的,事概率決定其是否入樣。這種方法的樣本量是隨機的,事先不能確定。先不能確定。(4 4)系統(tǒng)抽樣法)系統(tǒng)抽樣法。將總體單元按某種順序排列,。將總體單元按某種順序排列,根據(jù)樣本量確定抽樣間距根據(jù)樣本量確定抽樣間距k,k,在在11,kk中產(chǎn)生一個隨機數(shù)。中產(chǎn)生一個隨機數(shù)。返回5.2 放回不等概抽樣一、只抽取一個樣本單元(n=1)的不等概抽樣 為了便于了解不等概抽
10、樣的基本思想,我們先看為了便于了解不等概抽樣的基本思想,我們先看一個總體已知,只抽取一個樣本單元的例子。一個總體已知,只抽取一個樣本單元的例子。 【例】一個城市有四個超市營業(yè)面積從【例】一個城市有四個超市營業(yè)面積從100100平方米平方米到到10001000平方米不等(見下表),我們的目標是通過抽平方米不等(見下表),我們的目標是通過抽取一家超市來估計這四個超市上個月的總營銷量。通取一家超市來估計這四個超市上個月的總營銷量。通常超市面積越大則銷售量越大,因此,我們選擇的入常超市面積越大則銷售量越大,因此,我們選擇的入樣概率與超市的營業(yè)面積成正比。樣概率與超市的營業(yè)面積成正比。返回超市營業(yè)面積(
11、平方米)(萬元)A1001/1611B2002/1620C3003/1624D100010/16245總計16001300iZiY四個超市的背景數(shù)據(jù)四個超市的背景數(shù)據(jù)iYiZ:第:第i i個超市的包含概率,個超市的包含概率, :第:第i i個超市的銷售量個超市的銷售量返回 如果超市的營業(yè)面積近似正比于超市的銷售額,如果超市的營業(yè)面積近似正比于超市的銷售額,那么超市那么超市A A的銷售額就占所有超市銷售額的的銷售額就占所有超市銷售額的1/16,1/16,因因此超市此超市A A的銷售額乘以權重的銷售額乘以權重1616(包含概率的倒數(shù))(包含概率的倒數(shù))可以近似地估計所有超市的銷售額。因此,樣本量可
12、以近似地估計所有超市的銷售額。因此,樣本量為為1 1的不等概抽樣的總體總值估計量為:的不等概抽樣的總體總值估計量為:SiiiiSiiZyywYiiZw1式中式中返回樣本樣本A1/161117615375B2/162016019600C3/162412829584D10/162453928464iZiySY2)(YYS四個四個n=1n=1可能的不等概樣本及其估計量可能的不等概樣本及其估計量返回從上表可以算出:萬元)。(3003921610128163160162176161)(SiiYZYE.1424884641610295841631960016215367161)()()(22YYZYYEY
13、VSii可見不等概抽樣的總體總值估計量是無偏的可見不等概抽樣的總體總值估計量是無偏的返回 我們用同一個例題將不等概抽樣與簡單隨機抽樣我們用同一個例題將不等概抽樣與簡單隨機抽樣作一比較,以此認識不等概抽樣的意義。作一比較,以此認識不等概抽樣的意義。 與與n=1n=1的簡單隨機抽樣相比,簡單隨機抽樣的樣本的簡單隨機抽樣相比,簡單隨機抽樣的樣本NZZii41,41所有可能的樣本見下表所有可能的樣本見下表返回樣本樣本A1/4114465536B1/4208048400C1/4249641616D1/4245980462400iZiySRSY2)(YYSRS四個可能的簡單隨機樣本的數(shù)據(jù)及其估計量四個可能
14、的簡單隨機樣本的數(shù)據(jù)及其估計量返回我們來計算簡單隨機抽樣的估計量方差我們來計算簡單隨機抽樣的估計量方差154488)462400416164840065536(41)(SRSYV 前面按不等概抽樣的估計量方差為前面按不等概抽樣的估計量方差為 1424814248, 是無偏估計,期望為是無偏估計,期望為300300萬元,但是其方差萬元,但是其方差大于不等概抽樣,這是因為不等概抽樣利用了輔大于不等概抽樣,這是因為不等概抽樣利用了輔助信息,即與銷售額相關的超市面積。助信息,即與銷售額相關的超市面積。SRSY返回二、一般有放回不等概抽樣niiiHHzynY11 對于放回不等概抽取樣本容量為對于放回不等
15、概抽取樣本容量為n n的樣本,總體總值的樣本,總體總值的估計量為樣本中所有的估計量為樣本中所有 的平均,我們得到漢森的平均,我們得到漢森赫維慈赫維慈(Hansen-Hurwitz)(Hansen-Hurwitz)估計估計 :iiZy /上式是總體總值的無偏估計上式是總體總值的無偏估計返回如果采用的是如果采用的是PPSPPS抽樣,即抽樣,即 ,則,則0MMZiiniiiniiiHHMynMzynY1011 上面估計量是上面估計量是n n個獨立觀測的平均,因此每個個獨立觀測的平均,因此每個單元的總值估計量方差是:單元的總值估計量方差是:21)(YZYZiiNii返回:的方差為HHYNiiiiHHY
16、ZYZnYV12)(1)(:)(的無偏估計為HHYVniHHiiHHYxynnYv12)(111)(niHHiiMYmynnM12020)() 1(返回【例5.2】某部門要了解所屬某部門要了解所屬85008500家生產(chǎn)企業(yè)當月完成家生產(chǎn)企業(yè)當月完成的利潤的利潤, ,該部門手頭已有一份上年各企業(yè)完成產(chǎn)量的報告該部門手頭已有一份上年各企業(yè)完成產(chǎn)量的報告, ,將其匯總得到所屬企業(yè)上年完成產(chǎn)量為將其匯總得到所屬企業(yè)上年完成產(chǎn)量為36763676萬噸萬噸. .考慮考慮到時間緊到時間緊, ,準備采用抽樣調(diào)查來推算當月完成的利潤準備采用抽樣調(diào)查來推算當月完成的利潤. .根根據(jù)經(jīng)驗據(jù)經(jīng)驗, ,企業(yè)的產(chǎn)量和利潤
17、相關性比較強企業(yè)的產(chǎn)量和利潤相關性比較強, ,且企業(yè)的特點且企業(yè)的特點是規(guī)模和管理水平差異比較大是規(guī)模和管理水平差異比較大, ,通常大企業(yè)的管理水平通常大企業(yè)的管理水平較高較高, ,因此采用與上年產(chǎn)量成比例的因此采用與上年產(chǎn)量成比例的PPSPPS抽樣抽樣, ,從所屬企從所屬企業(yè)中抽出一個樣本量為業(yè)中抽出一個樣本量為3030的樣本的樣本, ,調(diào)查結果如下表調(diào)查結果如下表. .不等概抽樣例題不等概抽樣例題返回imiyiimiyiimiyi138.2310926106.501900191.510213.7010241115.00864208.008030.7513127.00172128.42136
18、7242.85301316.001045229.01384552.0011021412.30220230.7548065.00600153.864600246.00311710.802901615.8023702528.43928482.00430179.00940269.9784298.819921821.00640276.20510樣本單元的有關數(shù)據(jù)紅色數(shù)字表示被兩次抽到,紅色數(shù)字表示被兩次抽到,mimi為企業(yè)上年完成的產(chǎn)量,為企業(yè)上年完成的產(chǎn)量,yiyi為企業(yè)當月完成的產(chǎn)量。為企業(yè)當月完成的產(chǎn)量。返回 要根據(jù)以上調(diào)查結果估計該部門所屬企業(yè)當月完成的利潤,并給出95%置信度下的相對誤差.如
19、果要求在相同條件下相對誤差達到20%,所需的樣本量應該是多少?解:由上述條件知由上述條件知3676,300Mn估計當月完成的利潤為:75708710niiiHHmynMY返回174118)()(8 . 53031700514)() 1()(20120HHHHHHniiiHHYvYsMYmynnMYvHHY方差及標準差的估計%4575708717411896. 1)(HHHHYYstr在置信度為在置信度為95%95%時時, ,對應的對應的t=1.96, t=1.96, 的相對誤差的相對誤差HHY返回 因此,在置信度仍為因此,在置信度仍為95%95%、相對誤差時、相對誤差時 ,所需樣本量為:所需樣
20、本量為:%201r15230)2 . 045. 0(22121nrrn返回三、有放回不等概整群抽樣 在群規(guī)模不等的整群抽樣中,如果群的規(guī)模在群規(guī)模不等的整群抽樣中,如果群的規(guī)模差異較大,各個群對總體的影響會產(chǎn)生很大差別。差異較大,各個群對總體的影響會產(chǎn)生很大差別。這時可以采用不等概方式抽取群。其好處是把群這時可以采用不等概方式抽取群。其好處是把群的規(guī)模作為抽取樣本的輔助信息,提高了估計的的規(guī)模作為抽取樣本的輔助信息,提高了估計的精度,而且方差估計有比較簡單的形式。下面主精度,而且方差估計有比較簡單的形式。下面主要討論以要討論以PPS抽樣抽取群的情況。抽樣抽取群的情況。返回 每次按每次按 的概率
21、抽取第的概率抽取第i i個群,由于群內(nèi)的單元全部參與調(diào)查,個群,由于群內(nèi)的單元全部參與調(diào)查,第第i i個群的總值為:個群的總值為:), 2 , 1(0NiMMZii.1iMiijiyy 根據(jù)上節(jié)講到的漢森根據(jù)上節(jié)講到的漢森赫維茨估計量,赫維茨估計量,PPSPPS整群整群抽樣的總體總值估計量為:抽樣的總體總值估計量為:yMMynMZynYniiiniii01011我們知道,這是一個無偏估計。我們知道,這是一個無偏估計。返回估計量的方差是:估計量的方差是:21021)()(1)(YYMnMYZYZnYViNiiiiNii估計量方差的估計為:估計量方差的估計為:212021)() 1()() 1(1
22、)(yynnMYZynnYviniiini返回【例【例5.35.3】 某企業(yè)欲估計上季度每位職工的平均病某企業(yè)欲估計上季度每位職工的平均病假天數(shù)。該企業(yè)共有假天數(shù)。該企業(yè)共有8 8個分廠(工人數(shù)資料見下表),個分廠(工人數(shù)資料見下表),現(xiàn)用不等概整群抽樣擬抽取三個分廠為樣本,并以現(xiàn)用不等概整群抽樣擬抽取三個分廠為樣本,并以95%95%的置信度計算其置信區(qū)間。有關數(shù)據(jù)及抽樣過程的置信度計算其置信區(qū)間。有關數(shù)據(jù)及抽樣過程如下:如下:返回分廠編號分廠編號職工人數(shù)職工人數(shù)累積區(qū)間累積區(qū)間1120011200245012011650321001651375048603751461052840461174
23、506191074519360739093619750832009751129508 8個分廠的職工人數(shù)資料個分廠的職工人數(shù)資料返回【解】 采用采用PPSPPS抽樣,利用隨機數(shù)表在數(shù)字抽樣,利用隨機數(shù)表在數(shù)字 1 11295012950之間隨機抽取之間隨機抽取3 3個數(shù),分別是個數(shù),分別是0201102011, 0797207972和和1028110281,于是,于是3 3分廠、分廠、6 6分廠和分廠和8 8分廠入分廠入選樣本。用選樣本。用 分別表示三個分廠職工分別表示三個分廠職工的病假天數(shù),調(diào)查結果為:的病假天數(shù),調(diào)查結果為:321,yyy.5790,4160,4320321yyy431.
24、2)320097901910416021004320(3111110niiniiiynMynMYy返回同樣可求得估計量方差的估計值為:同樣可求得估計量方差的估計值為:0356. 0)() 1(1)()(2120yynnMYvyvnii其其95%的置信區(qū)間為:的置信區(qū)間為:80. 2 ,06. 237. 043. 20356. 096. 143. 2返回【評價【評價】 對于群規(guī)模不等的整群抽樣,采用不等對于群規(guī)模不等的整群抽樣,采用不等概概PPSPPS抽樣,可以得到總體目標量的無偏估計,估計抽樣,可以得到總體目標量的無偏估計,估計量和估計量方差都有比較簡明的形式,估計的效率量和估計量方差都有比較
25、簡明的形式,估計的效率也比較高,確實是值得優(yōu)先采用的方法。但是此方也比較高,確實是值得優(yōu)先采用的方法。但是此方法使用的條件是:在抽取樣本前,要了解有關群規(guī)法使用的條件是:在抽取樣本前,要了解有關群規(guī)模大小的信息。此外,抽樣過程比等概整群抽樣更模大小的信息。此外,抽樣過程比等概整群抽樣更為復雜。為復雜。返回5.3 多階段有放回不等概抽樣一、兩階段有放回不等概抽樣一、兩階段有放回不等概抽樣 抽樣方法:抽樣方法:對初級單元進行抽樣時,先確定每個對初級單元進行抽樣時,先確定每個初級單元的入樣概率。對被抽中的初級單元,再抽初級單元的入樣概率。對被抽中的初級單元,再抽取取 個二級單元。如果某個初級單元被抽
26、中多次,個二級單元。如果某個初級單元被抽中多次,則將這則將這 個二級單元放回,重新抽取個二級單元放回,重新抽取 個二級單元。個二級單元。當然,這兩個樣本中的二級單元可能會有重復。在當然,這兩個樣本中的二級單元可能會有重復。在實際調(diào)查時,對重復的二級單元只調(diào)查一次,但計實際調(diào)查時,對重復的二級單元只調(diào)查一次,但計算的時候,應該按照被抽中的次數(shù)進行重復計算。算的時候,應該按照被抽中的次數(shù)進行重復計算。imimim返回總體總值的估計總體總值的估計:先構造初級單元總值先構造初級單元總值 的無偏的無偏估計估計 然后利用漢森然后利用漢森-赫魏茨估計量對總體總值赫魏茨估計量對總體總值Y進行估計:進行估計:i
27、YiYniiiHHZYnY11)()(1)(1221NiiiiiNiiHHZYVYZYZnYV21)() 1(1)(HHniiiHHYZYnnYv返回特別地特別地 記總體中所有二級單元數(shù)為記總體中所有二級單元數(shù)為 ,如果抽樣時,如果抽樣時每個初級單元被抽中的概率與其擁有的二級單元數(shù)成每個初級單元被抽中的概率與其擁有的二級單元數(shù)成比例,即初級單元被抽中的概率為比例,即初級單元被抽中的概率為 第二第二階段對二級單元進行簡單隨機抽樣,則階段對二級單元進行簡單隨機抽樣,則 ,樣本,樣本是自加權的,對總體總值的估計為:是自加權的,對總體總值的估計為:0M,/0MMZiimmi2120110100)()
28、1(yynnM)YvynmMynMyMYniiPPSnimjijniiHH返回 在實際調(diào)查中,如果初級單元大小不相等,人們在實際調(diào)查中,如果初級單元大小不相等,人們通常喜歡在第一階段時按放回的與二級單元成比例通常喜歡在第一階段時按放回的與二級單元成比例的的PPS抽樣,第二階段抽樣則進行簡單隨機抽樣,且抽樣,第二階段抽樣則進行簡單隨機抽樣,且每個初級單元的二級單元樣本都相同,這樣得到的樣每個初級單元的二級單元樣本都相同,這樣得到的樣本是自加權的,估計量的形式非常簡單。本是自加權的,估計量的形式非常簡單?!纠?.4 】某小區(qū)擁有某小區(qū)擁有10座高層建筑,每座高層建筑擁座高層建筑,每座高層建筑擁有的
29、樓層數(shù)如下表有的樓層數(shù)如下表高層建筑高層建筑ABCDEFGHIJ樓層樓層1212161510161018162010座高層建筑的層數(shù)返回 我們用兩階段抽樣方法抽出我們用兩階段抽樣方法抽出10個樓層進行調(diào)查,個樓層進行調(diào)查,第一階段抽樣為放回的按與每層建筑擁有的樓層成第一階段抽樣為放回的按與每層建筑擁有的樓層成比例的不等概抽取比例的不等概抽取5座建筑,第二階段按簡單隨機抽座建筑,第二階段按簡單隨機抽樣對每座建筑抽取兩個樓層。對樣對每座建筑抽取兩個樓層。對10個樓層居民人數(shù)個樓層居民人數(shù)的調(diào)查結果如下,試對小區(qū)總居民數(shù)進行估計,并的調(diào)查結果如下,試對小區(qū)總居民數(shù)進行估計,并給出估計的誤差。給出估計
30、的誤差。初級樣本序號初級樣本序號12345居民數(shù)居民數(shù)18,1215,1819,1316,1016,11被選中的高層建筑序號及被選中的高層建筑序號及10個樓層的居民數(shù)個樓層的居民數(shù)返回【解】已知.625.9776)() 1()(8 .141452146214614825145.148,145, 2, 51200110110yynnMYvMYyymnMYyMmnniinimjijnimjij返回二、多階段有放回不等概抽樣 (略) 參看教材P174返回5.3 不放回不等概抽樣一、PS 抽樣不放回不等概抽樣: 我們知道我們知道, ,若采用放回抽樣若采用放回抽樣, ,對總體參數(shù)的估計對總體參數(shù)的估計及
31、其方差估計比較簡單及其方差估計比較簡單, ,但樣本單元中可能有單元但樣本單元中可能有單元被抽中多次被抽中多次. .因此因此, ,放回抽樣得到的樣本其代表性比放回抽樣得到的樣本其代表性比不放回抽樣差不放回抽樣差. .在相同樣本量的條件下在相同樣本量的條件下, ,放回抽樣的放回抽樣的估計精度較低估計精度較低. . 不放回不等概抽樣不放回不等概抽樣是指不放回的與單元大小成是指不放回的與單元大小成比例的概率抽樣比例的概率抽樣. .返回包含概率: 在不放回不等概抽樣中,每個單元入樣的概率 及任意兩個單元同時入樣的概率 統(tǒng)稱為包含概率.iij對固定的 n ,包含概率滿足下面等式:nNii1iNijijn)
32、 1( ) 1(211nnNiNijij返回如果每個單元入樣概率與其大小iM嚴格成比例,0MMZii記則對于固定的 n ,有iinZ 這時,我們簡稱這種情形的抽樣為嚴格的PS抽樣。求得,只有在 n=2 時才有一些實用的方法。嚴格的PS抽樣實施起來非常復雜, 不易ij返回二、赫魏慈湯普森估計量 對于不放回不等概抽樣,其總體總量Y的估計是:赫魏慈湯普森估計:niiiHTyY1i為第i個單元的包含概率.其中返回如果), 2 , 1(0Nii則YYHT是的無偏估計,它的方差為:NiNijjijijiijiNiiiHTyyYYV12121)(如果 n 固定,則21)()(jjiiNiNijijjiHTY
33、YYV返回【例5.3】假設有5個居委會,每個居委會的住戶數(shù)X已知,但常住居民人數(shù)未知,我們從這5個居委會抽出兩個來估計常住居民的總人數(shù),調(diào)查數(shù)據(jù)如下表.i住戶數(shù)(X)常住人數(shù)(Y)包含概率( )140011000.822506000.532005000.441002400.2550800.110002520-i返回上面表中的包含概率為上面表中的包含概率為: :01XXnXXniNiiii 從從5 5個居委會中不放回地抽出個居委會中不放回地抽出2 2個居委會個居委會, ,無論是無論是不放回不等概抽樣還是簡單隨機抽樣不放回不等概抽樣還是簡單隨機抽樣, ,共有共有1010種不同種不同的樣本的樣本,
34、,我們用這些樣本分別利用霍維茨我們用這些樣本分別利用霍維茨湯普森估湯普森估計計算及簡單隨機抽樣簡單估計計算對總量的估計計計算及簡單隨機抽樣簡單估計計算對總量的估計, ,計算結果列于下表計算結果列于下表. .返回樣本1,2257542501,3262540001,4257533501,5217529502,3245027502,4240021002,5200017003,4245018503,5205014504,52000800psYsrsY不同估計量的估計結果返回 從理論上來說從理論上來說, , 和和 都是無偏的都是無偏的, ,它們的它們的均值是均值是2520.2520. 本例題的結果表明:
35、本例題的結果表明:不放回不等概赫魏慈不放回不等概赫魏慈湯湯普森估計量比簡單隨機抽樣簡單估計更精確,其原普森估計量比簡單隨機抽樣簡單估計更精確,其原因是因是X X 和和Y Y 之間有較強的相關關系。之間有較強的相關關系。psYsrsY返回三、n不同情況下的嚴格PS抽樣我們在上面提到的嚴格PS抽樣,就是指 n 固定、嚴格不放回、包含概率i與單元大小成比例。即iinZ下面分別介紹一種適合于n=2和n2情形的嚴格的 抽樣。PS21iZ1 1、 的情形的情形在總體中只抽兩個單元,通常用逐個抽取法來保證抽樣是不放回的。我們可以采用幾種不同的抽樣方法。對總體所有的單元,如果有 就可以采用布魯爾方法。2n返回
36、布魯爾抽樣方法:按與iiiZZZ21)1 (成比例的概率抽取第一個單元,記為j ,按與jiZZ1成比例的概率抽取剩下的N-1個單元中抽取第二個單元.布魯爾方法的包含概率為:iiZ2NiiijijijiijZZZZZZ1)211)(21)(21 ()1 (4返回 對于總體總量估計可采用赫魏慈湯普森估計量:)(21jjiijjiiBZyZyyyY2)()(jjiiijijjiHTygsyyYv【例5.7】對于例5.6,如果抽樣是按布魯爾方法的,則其所有可能樣本的包含概率如下表:返回樣本樣本1,225750.348791,326250.265741,425750.124571,521750.0609
37、02,324500.091352,424000.040482,520000.019383,424500.029073,520500.013844,520000.00588psYij返回我們可以按下述公式總體均值的估計及其方差:ijpspsYYE)(ijpspsYYYV2)()(返回2. n 2的情形一般采用一般采用水野法,水野法,也是一種逐個抽取方法,它以也是一種逐個抽取方法,它以概率概率,1) 1(nNnnNZNnZiii=1,2,N抽取第一個樣本單元抽取第一個樣本單元, ,在剩下的在剩下的N-1N-1個單元中個單元中, ,不放回不放回等概地抽出等概地抽出n-1n-1個樣本單元。為了保證每個個樣本單元。為了保證每個要求每個單元的大小滿足:要求每個單元的大小滿足:0iZ) 1() 1(0NnMnMi返回四、幾種非嚴格PS抽樣1.耶茨格隆迪逐個抽取法:每次都以與未入樣的單元的iZiZ成比例的概率抽樣,即以抽取第一個單元,不妨記被抽中的單元為第1個;11ZZi以在剩下的N-1個單元中抽取第二個樣本單元;不妨記被抽中的單元為第2個;以211ZZZi在剩下的N-2個單元中抽取第二個樣本單元;依此類推,直到抽出 n 個樣本單元。返回這種方法顯然i不是與單元大小嚴格成比例的,但它在不放回不等概抽樣中操作最簡單、想法最自然,因而在實際中人們常常使用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年地暖管項目提案報告模范
- 2025年電工(電工故障排除)職業(yè)技能鑒定實操試卷
- 金融行業(yè)從業(yè)資格及工作經(jīng)歷證明(5篇)
- 賣方的購銷協(xié)議
- 電商平臺用戶行為分析系統(tǒng)
- 2025年保健按摩師(高級技師)職業(yè)技能鑒定典型試題
- 2025年甘油(丙三醇)項目立項申請報告模板
- 商品混凝土供需協(xié)議
- 2025年多媒體應用設計師考試-網(wǎng)頁設計與交互科目試卷
- 二手奢侈品市場2025年交易規(guī)范與消費者信任構建策略研究及市場反饋及優(yōu)化效果評估
- 胸痛課件教學課件
- 福建省福州市(2024年-2025年小學六年級語文)統(tǒng)編版期末考試((上下)學期)試卷及答案
- 教師專業(yè)發(fā)展(西南大學)知到智慧樹章節(jié)答案
- 反恐培訓教材
- 課件巴東三峽教學課件
- 企業(yè)一季一課安全教育內(nèi)容
- GB/T 44543-2024預制混凝土節(jié)段拼裝用環(huán)氧膠粘劑
- 四川涼山歷年中考語文現(xiàn)代文之說明文閱讀7篇(含答案)(2003-2023)
- 建筑工程保證金協(xié)議書范本
- 陜西省咸陽市興平市重點中學2025屆初三生物試題9月摸底考試試題含解析
- 2024-2030年中國液壓機行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
評論
0/150
提交評論