版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第四章分層抽樣
本章要點
本章主要是對分層抽樣理論包括抽樣方式、估計量及其性質(zhì)、樣本量的確定及分配、分層抽樣設(shè)計效果等進(jìn)行系統(tǒng)全面地介紹。具體要求:①正確理解層、分層抽樣以及分層隨機抽樣的涵義,分層抽樣的特點及作用;②掌握分層抽樣的參數(shù)估計量及其性質(zhì);③掌握分層抽樣樣本量的確定方法;④了解分層抽樣的設(shè)計效果;⑤了解分層抽樣其他有關(guān)理論問題,包括層權(quán)偏差、最優(yōu)分配偏差、事后分層等。第一節(jié)抽樣方式
第二節(jié)簡單估計量及其性質(zhì)
第三節(jié)樣本量的分配
第四節(jié)樣本量的確定
第五節(jié)分層抽樣設(shè)計效果分析
第六節(jié)進(jìn)一步討論的問題
第一節(jié)抽樣方式引:1.影響估計精度的因素是?2.簡單隨機抽樣的缺陷?若總體單位之間差異較大,怎么辦?一、分層抽樣與分層隨機抽樣
在抽樣之前,先將總體N個單元劃分成L個互不重復(fù)的子總體,每個子總體稱為層,它們的大小分別為,這L個層構(gòu)成整個總體()。然后,在每個層中分別獨立地進(jìn)行抽樣,這種抽樣就是分層抽樣。如果每層都是簡單隨機抽樣,則稱為分層隨機抽樣。
第一節(jié)抽樣方式注:總體中的每個單位,一定并且只屬于某一層,不能同時屬于兩層或不屬于任何一層分層抽樣得以實施的前提條件準(zhǔn)備好關(guān)于層的抽樣框分層是按照單位的某個特征或指標(biāo)進(jìn)行的二、分層抽樣的特點(一)分層抽樣可以提高參數(shù)估計的精度。(二)分層抽樣不僅能對總體參數(shù)進(jìn)行估計,而且能對各層(子總體)參數(shù)進(jìn)行估計。(三)便于依托行政管理機構(gòu)進(jìn)行組織和實施,同時還可以根據(jù)各層的不同特點采用不同的抽樣方式。(四)分層抽樣樣本在總體中分布更加均勻。三、層的劃分原則(一)層內(nèi)單元具有相同性質(zhì),通常按調(diào)查對象的不同類型進(jìn)行劃分。能夠?qū)γ恳活惖哪繕?biāo)量進(jìn)行估計。(二)盡可能使層內(nèi)單元的標(biāo)志值相近,層間單元的差異盡可能大,從而達(dá)到提高抽樣估計精度的目的。(三)既按類型又按層內(nèi)單元標(biāo)志值相近的原則進(jìn)行多重分層,同時達(dá)到實現(xiàn)估計類值以及提高估計精度的目的。(四)為了抽樣組織實施的方便,通常按行政管理機構(gòu)設(shè)置進(jìn)行分層。例如——對全國范圍汽車運輸?shù)某闃诱{(diào)查調(diào)查目的:不僅要推算全國貨運汽車完成的運量,還要推算不同經(jīng)濟成分貨運汽車完成運量。分層方法:為了組織方便,先將貨運汽車按省分層,由各省交通運輸部門負(fù)責(zé)各省調(diào)查工作。為了滿足子總體推算的需要,各省按照經(jīng)濟成分分層為提高抽樣效率,再按噸位對汽車分層四、符號說明
設(shè)總體分為L層,下標(biāo)h表示層號(h=1,2,…,L)。則關(guān)于第h層的記號如下:第h層總體單元數(shù):(通常已知),且
第h層樣本單元數(shù):,且
第h層總體和樣本第i個單元標(biāo)志值(觀察值):
層權(quán):
第h層抽樣比:
第h層總體均值:
第h層樣本均值:
第h層總體總值:
第h層樣本總值:
第h層總體方差
第h層樣本方差:
第二節(jié)簡單估計量及其性質(zhì)一、總體均值的估計
(一)簡單估計的定義(二)估計量的性質(zhì)二、總體總值的估計
(一)簡單估計的定義(二)估計量的性質(zhì)三、總體比例的估計(一)簡單估計的定義(二)估計量的性質(zhì)在分層抽樣中,對總體均值的估計是通過對各層的的估計,按層權(quán)加權(quán)平均得到的。公式為:
一、總體均值的估計
(一)簡單估計量的定義如果得到的是分層隨機樣本,則總體均值的簡單估計為:
N=100N1=60N2=40n1=5n2=5性質(zhì)l
對于一般的分層抽樣,如果是的無偏估計(h=1,2,…,L),則是的無偏估計。的方差為:
(二)估計量的性質(zhì)
也就是說,在分層抽樣中只要對各層估計是無偏的,則對總體的估計也是無偏的。因此,各層可以采用不同的抽樣方法,只要相應(yīng)的估計量是無偏的,則對總體的推算也是無偏的
性質(zhì)2
對于分層隨機抽樣,是的無偏估計,的方差為:
性質(zhì)3
對于分層隨機抽樣,的一個無偏估計為:
二、總體總量的估計
(一)簡單估計量的定義總體總量Y的估計為:
如果得到的是分層隨機樣本,則總體總量Y的簡單估計為:
性質(zhì)4
對于一般的分層抽樣,如果是的無偏估計,則是Y的無偏估計。的方差為:
(二)估計量的性質(zhì)性質(zhì)5
對于分層隨機抽樣,的方差為:
性質(zhì)6
對于分層隨機抽樣,的一個無偏估計為:
【例4.1】為調(diào)查某地區(qū)住戶的平均家庭成員數(shù),將該地區(qū)分成城市和鄉(xiāng)村2層,每層按簡單隨機抽樣抽取10戶,調(diào)查所獲得的數(shù)據(jù)如表4-1。請估計該地區(qū)住戶的平均家庭成員數(shù)及其95%的置信區(qū)間。
95%的置信區(qū)間為,其中。經(jīng)計算可得:平均家庭成員數(shù)的95%的置信區(qū)間為:(3.24,4.24)
三、總體比例的估計
(一)簡單估計量的含義
記層比例為,層樣本比例,其中與是第h層總體及樣本中具有所考慮特征的單元數(shù),則總體比例P的估計為:
第二節(jié)簡單估計量及其性質(zhì)第二節(jié)簡單估計量及其性質(zhì)
(二)估計量的性質(zhì)
如果定義
則對總體比例的估計類似對總體均值的估計,這時具有同樣的性質(zhì)。
性質(zhì)7
對于一般的分層抽樣,如果是的無偏估計(h=1,2,…,L),則是P的無偏估計。的方差為:
第二節(jié)簡單估計量及其性質(zhì)性質(zhì)8
對于分層隨機抽樣,是P的無偏估計,則:的方差為:
第二節(jié)簡單估計量及其性質(zhì)第二節(jié)簡單估計量及其性質(zhì)性質(zhì)9
對于分層隨機抽樣,的一個無偏估計為:
第二節(jié)簡單估計量及其性質(zhì)【例4.2】對某地區(qū)的居民擁有家庭電腦的情況進(jìn)行調(diào)查,以居民戶為抽樣單元,根據(jù)收入水平將居民戶劃分為四層,每層按簡單隨機抽樣抽取10戶,調(diào)查獲得如下數(shù)據(jù)(單位:臺),如表4-3。估計該地區(qū)居民擁有家庭電腦的比例計估計的標(biāo)準(zhǔn)差。
第二節(jié)簡單估計量及其性質(zhì)解:由上表可得:第二節(jié)簡單估計量及其性質(zhì)因此,該地區(qū)居民擁有家庭電腦比例的估計為:估計量的方差為:第二節(jié)簡單估計量及其性質(zhì)估計量的標(biāo)準(zhǔn)差為:第三節(jié)樣本量的分配
在分層抽樣抽樣中,若總樣本量n一定時,還需研究各層應(yīng)該分配多少樣本量的問題,因為對總體參數(shù)進(jìn)行估計時,估計量的方差不僅與各層的方差有關(guān),還與各層所分配的樣本量有關(guān)。實際工作中有不同的分配方法,既可以按各層單元數(shù)占總體單元數(shù)的比例分配,也可以采用使估計量總方差達(dá)到最小等幾種方法進(jìn)行樣本量的分配一、比例分配比例分配指的是按各層單元數(shù)占總體單元數(shù)的比例進(jìn)行分配,也就是按各層的層權(quán)進(jìn)行分配,即總體比例P的估計是:
對于分層隨機抽樣,這時總體均值的估計值是:
總體中的任一個單元,不管它在哪一層,都以同樣的概率入樣,因此按比例分配的分層隨機樣本,估計量的形式特別簡單。這種樣本也稱為自加權(quán)的樣本。
的方差為:
的方差為:
二、最優(yōu)分配(一)最優(yōu)分配
最優(yōu)分配是指在分層隨機抽樣中,如何將樣本量分配到各層,使得在總費用給定的條件下,估計量的方差達(dá)到最?。换蛟诮o定估計量方差的條件下,使總費用最小,能滿足這個條件的樣本量分配就是最優(yōu)分配。如果我們考慮簡單線性費用函數(shù),總費用則這時的最優(yōu)分配是:
由此得出下面的行為準(zhǔn)則,如果某一層單元數(shù)較多,內(nèi)部差異較大,費用比較省,則對這一層的樣本量要多分配一些。
(二)Neyman(內(nèi)曼)分配對于分層隨機樣本,作為特例,如果每層抽樣的費用相同,即ch=c時,最優(yōu)分配可簡化為
這種分配稱為Neyman分配。這時達(dá)到最小。
這種分配稱為Neyman分配。這時達(dá)到最小。
【例4.3】對某地區(qū)的居民豆制品年消費支出進(jìn)行調(diào)查,以居民戶為抽樣單元,根據(jù)收入水平將居民戶劃分為四層,每層按簡單隨機抽樣抽取10戶,調(diào)查獲得如下數(shù)據(jù)(單位:元),如表4-4。若按比例分配和Neyman分配時,各層的樣本量應(yīng)為多少?解:由上表,
各層的層權(quán)及抽樣比為:
各層樣本均值及方差為:
同理可得:
按比例分配時,各層的樣本量為:
即各層的樣本量分別為3,6,11,22
對于Neyman分配,根據(jù)前面對Wh及Sh的計算結(jié)果,得到:因此,按Neyman分配時,各層應(yīng)分配的樣本量為:
即,各層的樣本量分別為3,7,23,7。
按最優(yōu)分配時,有時抽樣比較大,某個層的又比較大,則可能出現(xiàn)按最優(yōu)分配計算的這個層的樣本量超過的情況。實際工作中,如果第k層出現(xiàn)這種情況,最優(yōu)分配是對這個層進(jìn)行100%抽樣,即取,然后,將剩下的樣本量按最優(yōu)分配各層。
(三)某些層要求大于100%抽樣時的修正第四節(jié)樣本量的確定
令,其中已經(jīng)選定,于是當(dāng)方差V給定時,一、一般公式得到確定樣本量的一般公式為:
如果估計精度是以誤差限的形式給出,則當(dāng)按比例分配時,
實際工作中,n的計算可以分為兩步:先計算然后進(jìn)行修正:
當(dāng)按Neyman分配時,
【例4.4】(續(xù)例4.3)如果要求在95%置信度下,相對誤差不超過10%,則按比例分配和Neyman分配時,總樣本量分別為多少?
解:當(dāng)按比例分配時,由前面的計算結(jié)果,可以得到各層的在95%值信度時,對應(yīng)的t=1.96。又
因此得到:
由此可以得到:
對n0進(jìn)行修正,得到修正后的n:
當(dāng)按Neyman分配時:
二、最優(yōu)分配需要考慮費用時
在最優(yōu)分配時,如果考慮費用為簡單線性費用函數(shù):
則:當(dāng)方差V給定時,得到樣本量為:
而當(dāng)總費用C是給定時,有:
對其求和得到樣本量為:
三、總體參數(shù)為P的情形當(dāng)方差V給定時,如果都比較大,使得則按比例分配時總樣本量為:
按Neyman分配時
計算樣本量之前,需要對Ph作預(yù)估計。
【例4.5】(續(xù)例4.2)如果要求在95%置信度下,絕對誤差不超過5%,則按比例分配和Neyman分配時,總樣本量分別為多少?
解:在置信度95%時,對應(yīng)的t=1.96,而絕對誤差d=5%,因此
按比例分配時:可以得到
調(diào)整后的樣本量為:
按Neyman分配時:
第五節(jié)分層抽樣設(shè)計效果分析
我們將從理論上將分層隨機抽樣與簡單隨機抽樣進(jìn)行效果比較,即在相同樣本量下,比較其估計量的方差大小。為比較分層隨機抽樣與簡單隨機抽樣的精度,我們擬在樣本量為比例分配的形式下討論。
一、分層隨機抽樣與簡單隨機抽樣的比較記簡單隨機抽樣(對均值估計量)的方差為:
比例分配的分層隨機抽樣相應(yīng)估計量的方差為:
根據(jù)總體單元指標(biāo)的平方和分解可得:如果各層Nh都比較大,則:因而:兩邊乘(1-f)/n上式右邊第二項是層間平方和,為非負(fù),因此有:
方差差值為:這表明層平均數(shù)的差異愈大,分層的效果就愈好,若層平均數(shù)都相等,則分層與不分層效果相同。主要針對比例分配與內(nèi)曼分配抽樣效果進(jìn)行比較分析。其中:二、分層隨機抽樣各種樣本量分配方法之間的比較
實際工作中,除非各層的標(biāo)準(zhǔn)差相差很大,人們通常還是喜歡采用按比例分配的方式。結(jié)論:如果各層均值差異越大,則采用按比例分配的方式較好,而當(dāng)各層的標(biāo)準(zhǔn)差相差很大時,則最優(yōu)分配更好。第六節(jié)進(jìn)一步討論的問題一、層權(quán)誤差對估計量的影響在分層抽樣中,我們總是假定層權(quán)。如果未知且不能精確地估計時,將對估計量帶來十分嚴(yán)重的影響。
設(shè)估計的權(quán)重為,因此實際采用的對總體均值的估計是:對于分層隨機抽樣,仍是的無偏估計,但:
因此,不是的無偏估計,且偏倚B為:該偏倚只依賴于的偏差,而與樣本量n無關(guān)。因此,當(dāng)考慮的均方誤差時當(dāng)n增加時,前一項雖然逐漸減少,但第二項保持不變,它不隨著n的增大而減少,因而不再是一個可用的估計量。當(dāng)n超過一定量時,分層估計量的均方誤差就可能超過簡單隨機抽樣的方差。因此,分層獲得的精度上的得益會完全喪失。二、最優(yōu)分配偏差對方差的影響
令是理論最優(yōu)分配的樣本量,而實際分配為,則,估計量的方差分別為:
因此,由于實際分配偏離了理論最優(yōu)分配引起的方差增加為:
根據(jù)最優(yōu)(奈曼)分配公式,知如果忽略有限總體修正系數(shù)fpc,因此,估計量方差的相對增加為:由于,因此上式右邊即是的加權(quán)平均,它的上限是最大相對偏離值的平方。如果最大相對偏離g=50%,則方差最多增加25%;若最大相對偏離g=20%,則方差最多增加4%。所以在一般情形,由于最優(yōu)分配偏差引起的方差增大是相當(dāng)有限的。
三、層數(shù)確定
分層是為了提高抽樣效率,這時就要考慮如何進(jìn)行分層。按調(diào)查目標(biāo)量進(jìn)行分層當(dāng)然是最好的,但我們在調(diào)查之前并不知道的值,因此,分層只能是通過與高度相關(guān)的輔助指標(biāo)來進(jìn)行。當(dāng)輔助指標(biāo)為定型變量時,分層是按自然層或單元類型劃分的,層數(shù)是自然的。但當(dāng)分層變量Xi為連續(xù)性定量變量時,層的劃分則比較困難。常用的一種分層方法是確定層界的快速近似法,它是由戴倫紐斯(Dalenius)與霍捷斯(Hodges)提出的。其做法是將分層變量(例如xi)分布的累積平方根進(jìn)行等分來獲得最優(yōu)分層,因此這種方法也稱為累積平方根法。但當(dāng)遇到運用累積平方根法進(jìn)行分層時,就存在確定層數(shù)的問題。在實際工作中,因為要保證每個層有樣本單元,因此層數(shù)不能超過樣本量,如果要給出估計量方差的無偏估計,則每層至少2個樣本單元,那么層數(shù)不能超過。通過對分層抽樣與簡單隨機抽樣的比較,我們知道前者比后者的精度高。因此人們設(shè)想是否對總體盡可能多地進(jìn)行劃分,使得層內(nèi)差異降低,這時就要涉及層數(shù)增加時估計量方差的下降速度。
首先考慮以目標(biāo)量本身作為分層指標(biāo)。以最簡單的情形為例,Y是區(qū)間d上的均勻分布,則總體方差,樣本量為n的簡單隨機抽樣簡單估計量的方差為將總體分成大小相同的L層,并按比例分配樣本量,即則但在工作中,本身未知,只能通過與高度相關(guān)的輔助指標(biāo)來進(jìn)行。這時估計量的方差可以分為兩部分,一部分與層數(shù)有關(guān),另一部分與層數(shù)無關(guān),用模型表示:即,其中,是方差中受層數(shù)影響的部分,是不受層數(shù)影響的部分。因此,當(dāng)層數(shù)增加到一定的時候,在精度上的收益將非常小。根據(jù)研究,除非Y與X的相關(guān)系數(shù),層數(shù)一般不超過6為宜。四、多目標(biāo)分層的樣本量的確定
從最優(yōu)分配角度來考慮多指標(biāo)情形樣本量的分配方法。本質(zhì)上這些方法都是對不同指標(biāo)最優(yōu)分配結(jié)果的折衷。(一)
最優(yōu)分配平均法在所考慮的所有目標(biāo)中,選取最重要的k個,對每個指標(biāo)j,計算最優(yōu)分配的層樣本量,然后計算它們的平均值:(二)查特吉(Chatterjee)法
考慮實際分配的樣本量對每個目標(biāo)偏離其最優(yōu)分配引起的方差相對增加RVj:取極小化RVj的平均值的,結(jié)果為,(三)耶茨(Yates)法
將每個目標(biāo)估計量的方差看作損失,考慮總的損失函數(shù):
若費用函數(shù)仍是簡單的線性形式:耶茨法的目標(biāo)是極小化根據(jù)柯西-許瓦茲不等式,極小值當(dāng)且僅當(dāng)
時達(dá)到。若令則最優(yōu)分配為:從而:
若令,對于分層抽樣,我們一般在抽樣之前將總體中的所有單元分好層,但在實際工作中,有時沒有層的抽樣框,或總體特別大來不及事先分層,或者幾個變量都適合于分層,要進(jìn)行事先的交叉分層比較困難,并且我們并不需要交叉分層后每個子層的估計,如,需要按年齡分層的結(jié)果,還需要按受教育程度分層的結(jié)果,但并不需要這兩個指標(biāo)的交叉結(jié)果。這時如果想利用分層抽樣的優(yōu)點,可以采用對樣本的事后分層方法。五、事后分層
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)語文經(jīng)典美文馮雷的無欲則剛
- 2023屆新高考新教材化學(xué)人教版一輪訓(xùn)練-專項提能特訓(xùn)(17) 物質(zhì)的分離、提純在工業(yè)流程題中的應(yīng)用
- 玉溪師范學(xué)院《合唱與指揮》2022-2023學(xué)年第一學(xué)期期末試卷
- 玉溪師范學(xué)院《復(fù)變函數(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年硼粉系列合作協(xié)議書
- 2024年石油、化工產(chǎn)品批發(fā)服務(wù)合作協(xié)議書
- 2024貨物運輸合同專業(yè)版范文
- 2023年北京市三十五中初三3月月考語文試卷及答案
- 2024年碾磨谷物及谷物加工品合作協(xié)議書
- 2024房產(chǎn)評估合同范本
- 好書推薦——《三毛流浪記》PPT通用課件
- DM1204-B調(diào)音臺
- 鋁基合金高溫相變儲熱材料
- 干膜介紹及干膜工藝詳解實力干貨
- 《跨文化交際》課程教學(xué)大綱(英語師范專業(yè))
- 在“家庭醫(yī)生簽約服務(wù)”工作推進(jìn)會上的發(fā)言稿
- 火力發(fā)電廠生產(chǎn)過程-ppt課件
- 領(lǐng)導(dǎo)在思想作風(fēng)紀(jì)律總結(jié)大會講話
- 課題初中數(shù)學(xué)作業(yè)優(yōu)化設(shè)計的研究研究報告
- 《固容規(guī)》壓力容器產(chǎn)品質(zhì)量證明書..
評論
0/150
提交評論