平衡半樣本法_第1頁
平衡半樣本法_第2頁
平衡半樣本法_第3頁
平衡半樣本法_第4頁
平衡半樣本法_第5頁
已閱讀5頁,還剩24頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

復(fù)雜樣本的方差估計——平衡半樣本法平衡半樣本法在實(shí)際抽樣調(diào)查中,為了提高效率,常采用每層只抽兩個單元的分層抽樣。這時如果要采用前面介紹的隨機(jī)組方差估計,則因?yàn)閮H僅只有兩個沒有共同單元的隨機(jī)組,將使得方差估計不夠穩(wěn)定。也就是說,由于這兩個隨機(jī)組的取法的偶然性,將會使得方差的估計值起伏比較大。本節(jié)將介紹解決這個問題的平衡半樣本方法(balancedhalf-samplemethod)。半樣本假設(shè)對總體

,采用分層隨機(jī)抽樣,每層有放回地簡單隨機(jī)抽取2個單元,設(shè)yh1和yh2是第h層的樣本觀測值(h=1,2,...,L),則總體均值

的無偏估計為:式中,

為層權(quán);的方差

的標(biāo)準(zhǔn)估計量為:式中,使用隨機(jī)組方法,因每層只抽取2個單元,所以只有2個獨(dú)立的隨機(jī)組(y11,y21,…,yt-1)和(y12,y22,…,yt-2)。此

時的隨機(jī)組估計為:式中,這個估計量計算簡單。但由于僅有一個自由度,其穩(wěn)定性比標(biāo)準(zhǔn)估計量

差。為了既保留隨機(jī)組估計

的簡單性,又能保持標(biāo)準(zhǔn)估計量

的穩(wěn)定性,我們引入半樣本方法,即從每層抽取一個單元形成半樣本,總共可能出現(xiàn)

個半樣本。由于不同半樣本中包含某些共同的單元,所以半樣本之間是彼此相關(guān)的。在這一點(diǎn)上,半樣本方法與隨機(jī)組方法存在本質(zhì)上的不同。平衡半樣本估計個統(tǒng)計量

的平均,即

的無偏估計。然而,當(dāng)層數(shù)L較大時,這個估計量的計算是不可行的。為了簡化計算,一個很自然的想法是選擇一個小的半樣本子集,希望這個半樣本子集盡量保留所有的信息,這樣即可達(dá)到簡化計算的目的,又能保證足夠的精度。假設(shè)這個半樣本子集包含k個半樣本,可以推算出下式:因此,如果所選擇的k個半樣本對所有

(=1,2,…,L)都滿足以下條件:那么,

就正好等于

因此,我們說這k個半樣本完全保留了

個半樣本所包含的關(guān)于

的信息。滿足條件式的k組半樣本成為平衡半樣本。(1)如何確定平衡半樣本呢?PlackettandBurman(1946)給出了k*k階政教矩陣(k為4的倍數(shù),為Hadamard矩陣)的方法。下表給出了4*4階矩陣,其中列表示層,行表示半樣本;在a行第h列的位置+1表示層h的第一個單元被選入第a個半樣本,-1表示層h的第二個單元被選入第a個半樣本。按這種方式定義的半樣本即為平衡半樣本。完全正交平衡半樣本:k的選擇應(yīng)該是大于L的4的最小整數(shù)倍半樣本層12341+1+1+1-12-1+1-1-13-1-1+1-14+1-1-1-1表具有以下性質(zhì),即除了最后一列外,每列之和均為零。也就是說,當(dāng)L<k時(k=4or8),有對一般的k的情形也是如此,即用PlackettandBurman方法構(gòu)造的正交矩陣在L<k時都滿足上式。因此在k>L的條件下,我們有從而(2)這與將所有的

進(jìn)行平均所得的結(jié)果完全一樣。我們稱同時滿足式(1)和式(2)兩個條件的半樣本為完全正交平衡(fullorthogonalbalance)半樣本。

在復(fù)雜分層抽樣方案中,層數(shù)L經(jīng)常很大,即使平衡半樣本方法已經(jīng)減少了半樣本數(shù),但由于k大于等于L的要求,所需計算量仍然龐大。這時可以設(shè)計k組部分平衡半樣本,具體方法如下。假設(shè)有L層,采用k組半樣本,k<L。假設(shè)L可以被k整除,L/k=G,于是L層可分為G群。為敘述方便,假設(shè)L=4,按照平衡半樣本方法,必須k>=4。但這里我們?nèi)=2,則4層分為2群,對包含第1層和第2層的第一群利用2階Hadamard矩陣構(gòu)造正交列,對包含第三層和第四層的第二群用同樣方法,見下表。部分平衡半樣本部分平衡半樣本

半樣本層12341+1+1+1+12+1-1+1-1部分平衡半樣本的方差估計量雖然不如完全平衡半樣本精確,但也是無偏的。BRR用于多階段分層抽樣

假設(shè)總體分為H個層,并且從每層中有放回的以不等概率抽取兩個初級抽樣單元。利用向量

定義半樣本r:如果

則所有在該層的初級抽樣單元1的觀測值屬于半樣本r;如果

則所有在該層的初級抽樣單元2的觀測值屬于半樣本r。對于半樣本r創(chuàng)造一個新的權(quán)重列向量:

現(xiàn)在使用

代替w求半樣本r的估計量。對于全樣本,總體總量y的估計為;對于半樣本r,總體總量y的估計量為

如果,則,并且有

。由所學(xué)知識我們知道可以使用權(quán)重計算經(jīng)驗(yàn)分布函數(shù),這里我們使用半樣本計算經(jīng)驗(yàn)分布函數(shù)。

如果

是總體中位數(shù),則

可能定義為當(dāng)

時y的最小值,這時

可能定義為當(dāng)

時y的最小值。

對于任意統(tǒng)計量,我們定義

BBR也能夠用于估計統(tǒng)計量的協(xié)方差:如果

是目標(biāo)量,則

BRR用于非線性估計對于非線性估計量,一般和是不等的,但多數(shù)調(diào)查實(shí)踐中兩者非常接近

優(yōu)點(diǎn):對于總體總量和分位數(shù)的平滑函數(shù)的方差估計,BRR給出的方差估計近似等于由線性化方法得到的方差估計。與刀切法和自助法相比,BRR的計算量更少。缺點(diǎn):正如前面所定義的一樣,BRR要求每層只有兩個初級抽樣單元的設(shè)計。實(shí)際上,其經(jīng)常通過使用更復(fù)雜的平衡項(xiàng)擴(kuò)展到其他抽樣設(shè)計中。當(dāng)每層總體數(shù)和各層基本抽樣單元數(shù)較小時,BRR在有放回抽樣情況下所得到的方差估計和刀切法、自助法一樣偏大。例題:拒答率調(diào)查為研究被調(diào)查者拒答情況,實(shí)施一項(xiàng)調(diào)查。抽樣方式為分層隨機(jī)抽樣,從三個城區(qū)中各自隨機(jī)抽取兩個居委會,假設(shè)各層權(quán)重相同,調(diào)查結(jié)果見下表。試?yán)闷胶獍霕颖痉ü烙嬀艽鹇?/p>

的方差。城區(qū)居委會(s1)居委會(s2)拒答戶數(shù)(y1)合格調(diào)查戶數(shù)(x1)拒答戶數(shù)(y2)合格調(diào)查戶數(shù)(x2)141150371492401493014833814538150總計119444105447解:由于各權(quán)重相同,拒答率的估計為:用完全平衡半樣本法估計拒答率

的方差,抽取層數(shù)L=3,因?yàn)橐?/p>

,因此取k=4,平衡比一般的確定見表2.取各區(qū)第一個居委會形成第一個半樣本,該半樣本基期余集的拒答率的估計為:取第一區(qū)的第二個居委會,第二區(qū)的第一個居委會以及第三區(qū)的第二個居委會形成第二個半樣本,該半樣本及其余集的拒答率的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論