多目標(biāo)抽樣__迭代方法在多目標(biāo)總體抽樣調(diào)查中的應(yīng)用_第1頁(yè)
多目標(biāo)抽樣__迭代方法在多目標(biāo)總體抽樣調(diào)查中的應(yīng)用_第2頁(yè)
多目標(biāo)抽樣__迭代方法在多目標(biāo)總體抽樣調(diào)查中的應(yīng)用_第3頁(yè)
多目標(biāo)抽樣__迭代方法在多目標(biāo)總體抽樣調(diào)查中的應(yīng)用_第4頁(yè)
多目標(biāo)抽樣__迭代方法在多目標(biāo)總體抽樣調(diào)查中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多目標(biāo)抽樣迭代方法在多目標(biāo)總體抽樣調(diào)查中的應(yīng)用講評(píng) 應(yīng)用統(tǒng)計(jì)陳濤 顧晶晶目 錄 問(wèn)題的提出 迭代方法(Raking)及相關(guān)理論 實(shí)證研究規(guī)模以下工業(yè)抽樣調(diào)查一、問(wèn)題的提出n概念概念 多目標(biāo)變量問(wèn)題,是指用一套樣本估計(jì)多個(gè)目標(biāo)變量的總量、均值、比率和比例等。在實(shí)際中,任何一項(xiàng)調(diào)查都不可能僅僅調(diào)查一個(gè)指標(biāo)(即變量)。解決多目標(biāo)變量問(wèn)題的關(guān)鍵是在抽樣設(shè)計(jì)中選擇合適的輔助變量。 多目標(biāo)總體問(wèn)題,是指要求用一套樣本估計(jì)多組目標(biāo)子總體的總量、均值、比率或比例等估計(jì)量,而且要求滿足一定的精度設(shè)計(jì)要求。 解決多目標(biāo)總體問(wèn)題的總體思路:解決多目標(biāo)總體問(wèn)題的總體思路:在總樣本量被控制在一定數(shù)量的前提下,科學(xué)地進(jìn)行

2、樣本分配,使得各在總樣本量被控制在一定數(shù)量的前提下,科學(xué)地進(jìn)行樣本分配,使得各目標(biāo)總體中有足夠的有效樣本量,從而滿足抽樣精度設(shè)計(jì)要求。目標(biāo)總體中有足夠的有效樣本量,從而滿足抽樣精度設(shè)計(jì)要求。n多目標(biāo)總體問(wèn)題多目標(biāo)總體問(wèn)題比如在規(guī)模以下的工業(yè)抽樣調(diào)查中,全國(guó)規(guī)模以下工業(yè)總體可以分割為31個(gè)?。ㄊ校┳涌傮w,同時(shí)還可以分割成39個(gè)行業(yè)子總體,如果要求31個(gè)省子總體的工業(yè)總產(chǎn)值等指標(biāo)的估計(jì)量控制在一定精度范圍內(nèi)的同時(shí),要求39個(gè)行業(yè)子總體的工業(yè)總產(chǎn)值等指標(biāo)的估計(jì)量也控制在一定精度范圍內(nèi)。二、迭代方法(Raking)及相關(guān)理論n迭代加權(quán)調(diào)整法迭代加權(quán)調(diào)整法 迭代加權(quán)調(diào)整法是利用已知的總體外部輔助信息對(duì)樣

3、本的權(quán)數(shù)進(jìn)行調(diào)整,使樣本的某些變量的邊際分布與已知總體的對(duì)應(yīng)變量的邊際分布一致,以達(dá)到糾正估計(jì)量偏倚或者改善估計(jì)量精度的目的。 一般來(lái)說(shuō),在總體的多個(gè)輔助變量的具體交叉分組分布未知而這些輔助變量的邊際分布已知的情況下,采用迭代方法進(jìn)行權(quán)數(shù)調(diào)整是最佳的選擇。 迭代加權(quán)調(diào)整法能夠確保有回答樣本單位的調(diào)整后權(quán)數(shù)符合已知的每個(gè)外部輔助變量的邊際分布。迭代加權(quán)調(diào)整過(guò)程是運(yùn)用比例相稱運(yùn)算法則進(jìn)行權(quán)數(shù)的反復(fù)調(diào)整過(guò)程。n具體的迭代具體的迭代過(guò)程:過(guò)程:首先,樣本的權(quán)數(shù)被乘上一個(gè)恰當(dāng)?shù)谋嚷适怪系谝粋€(gè)輔助變量的邊際分布;第二步,這些調(diào)整后的權(quán)數(shù)被乘上另一個(gè)比率使之符合第二個(gè)輔助變量的邊際分布;依次類推,當(dāng)樣本

4、調(diào)整后的權(quán)數(shù)被乘上某個(gè)比率使之符合最后一個(gè)輔助變量的邊際分布的時(shí)候,第一次迭代過(guò)程結(jié)束。繼續(xù)執(zhí)行這樣的迭代過(guò)程,直至樣本調(diào)整后的權(quán)數(shù)符合所有輔助變量的邊際分布。 表1表2表3表4表5n用迭代方法進(jìn)行樣本分配用迭代方法進(jìn)行樣本分配 從上面關(guān)于迭代方法在權(quán)數(shù)調(diào)整領(lǐng)域的應(yīng)用的文字?jǐn)⑹龊蛯?shí)例演示可以總結(jié)出一種迭代思想,即當(dāng)已知兩個(gè)或者多個(gè)邊際控制量時(shí),通過(guò)迭代過(guò)程能夠得到兩維或者多維平衡表。在多目標(biāo)總體抽樣中,將測(cè)算出來(lái)的各組子總體樣本量作為邊際控制量(通常作為已知條件),利用迭代思想進(jìn)行樣本量分配,實(shí)際上相當(dāng)于將多目標(biāo)問(wèn)題簡(jiǎn)化成單目標(biāo)問(wèn)題。下面以兩組目標(biāo)子總體為例,闡述用迭代方法解決多目標(biāo)總體問(wèn)題的

5、具體步驟。 測(cè)算樣本量 首先分別測(cè)算各目標(biāo)子總體滿足一定精度設(shè)計(jì)要求的樣本量,然后計(jì)算兩組子總體的樣本量和,選擇樣本量和較大者作為總體樣本量,同時(shí)等比例地?cái)U(kuò)大另一組子總體的樣本量。 例如,測(cè)算得到第一組子總體的樣本量分別為 , 其樣本量和為 ,第二組子總體的樣本量分別為 其樣本量和為 ,假設(shè) ,則以第一組子總體的樣本量和作為總體樣本量,即 ,第一組子總體的樣本量保持不變,即 ,用調(diào)整因子 等比例擴(kuò)大第二組子總體的樣本量,即 。于是, 。 初始樣本分配用迭代方法進(jìn)行初始樣本分配,一般以各交叉分組的單元總數(shù)為初始數(shù)據(jù),以兩組子總體的樣本量為邊際控制量,通過(guò)迭代過(guò)程,得到各交叉分組應(yīng)分配的樣本量,并

6、且使得各子總體的樣本總數(shù)等于邊際控制量,即事先給定的各子總體的樣本量。表6為迭代前的初始數(shù)據(jù)表,。數(shù)據(jù)不一致 有效樣本量問(wèn)題及改善方法有效樣本量問(wèn)題及改善方法用迭代方法進(jìn)行樣本分配的過(guò)程中,只考慮了各個(gè)單元格內(nèi)的單元總數(shù)以及在相關(guān)兩個(gè)子總體中所占的比重,而沒(méi)有考慮各個(gè)交叉分組之間的方差差異,樣本在各交叉分組之間不符合最優(yōu)分配,因此,各組子總體的加權(quán)設(shè)計(jì)效應(yīng)都會(huì)大于1,從而有效樣本量小于設(shè)計(jì)樣本量。在不等比例分層抽樣設(shè)計(jì)中,如果樣本在各層之間不符合最優(yōu)分配(即奈曼分配),會(huì)降低有效樣本量,從而導(dǎo)致估計(jì)量精度損失。我們可以通過(guò)計(jì)算 加權(quán)設(shè)計(jì)效應(yīng)(deff)來(lái)測(cè)算有效樣本量 計(jì)算公式表達(dá): 其中:

7、為第h層的總體單位數(shù); 為總體單位數(shù); 為第h層的樣本數(shù); 為全部樣本量; 為各層單位數(shù)占總體單位數(shù)的比重; 為各層的抽樣比。 于是我們可以將上述公式化簡(jiǎn)為:各層之間的抽樣比越接近,deff值越小,相反,各層之間的抽樣比越懸殊,deff值越大。特殊地,當(dāng)各層的抽樣比相同時(shí),即 ,deff值達(dá)到最小,等于1。有效樣本量等于設(shè)計(jì)樣本量與加權(quán)設(shè)計(jì)效應(yīng)之比,用公式表達(dá)為: 因此,當(dāng)deff= 1時(shí),有效樣本量才等于設(shè)計(jì)樣本量,否則,有效樣本量小于設(shè)計(jì)樣本量。因此,提高有效樣本量的有效途徑是通過(guò)縮小各層抽樣比之間的差距,從而降低加權(quán)設(shè)計(jì)效應(yīng)。三、實(shí)證研究規(guī)模以下工業(yè)抽樣調(diào)查1.樣本分配樣本分配 確定子總

8、體確定子總體 由于有部分行業(yè)的企業(yè)數(shù)特別少,單獨(dú)作為一個(gè)子總體進(jìn)行樣本量測(cè)算和分配,會(huì)導(dǎo)致抽樣效率降低,因此,將6個(gè)特別小的行業(yè)層合并成兩個(gè)行業(yè)組合(具體見(jiàn)文獻(xiàn)) 樣本量確定樣本量確定 首先,確定滿足一定精度要求的各個(gè)省子總體和行業(yè)大類子總體的樣本量,然后,分別將30個(gè)省子總體和35個(gè)行業(yè)大類(組合)子總體的樣本量相加,取兩者中的大者作為全國(guó)規(guī)模以下工業(yè)抽樣調(diào)查的總樣本量,并等比例擴(kuò)大另一組子總體的樣本量。 樣本初次分配樣本初次分配 以每個(gè)“地區(qū)行業(yè)”單元格中的總體企業(yè)數(shù)為初始數(shù)據(jù),以30個(gè)省子總體和35個(gè)行業(yè)子總體的樣本量為兩組邊際控制量,用迭代過(guò)程進(jìn)行分地區(qū)、分行業(yè)的樣本初次分配。 一些特

9、殊情況處理一些特殊情況處理如果某些交叉分組的單元總數(shù)較少,通過(guò)上述迭代過(guò)程,該組應(yīng)分配到的樣本量可能很少(小于2),由于在分層抽樣設(shè)計(jì)中每個(gè)交叉分組至少被分成一層,為了滿足計(jì)算方差的要求,需要對(duì)這些交叉分組進(jìn)行特殊處理。實(shí)踐中,一般將四舍五入前小于1的交叉分組的樣本量賦值為0,將四舍五入前在1和1.5之間的交叉分組的樣本量賦值為2。如果某個(gè)交叉分組中的單元總數(shù)大于0,而應(yīng)分配到的樣本量為0,也就是說(shuō),沒(méi)有樣本來(lái)代表這些總體單元,從而導(dǎo)致樣本代表性不全,因此,需要對(duì)這些交叉分組進(jìn)行特殊處理。在實(shí)踐中,一般是將這些交叉分組與相臨的樣本量大于0的交叉分組進(jìn)行合并。2.有效樣本量及改善有效樣本量及改善

10、由于用迭代方法進(jìn)行樣本分配沒(méi)有考慮各個(gè)交叉分組(30個(gè)省和35個(gè)行業(yè)(組合)之間形成的1050個(gè)交叉分組)之間的方差差異,樣本在各交叉分組之間不符合最優(yōu)分配,因此,各省子總體和各行業(yè)子總體的加權(quán)設(shè)計(jì)效應(yīng)都大于1,從而有效樣本量小于設(shè)計(jì)樣本量。 為了確保實(shí)現(xiàn)各省和各行業(yè)估計(jì)量的精度要求,需要適當(dāng)增加樣本量,以降低加權(quán)設(shè)計(jì)效應(yīng),提高有效樣本量。增加樣本量的原則和方法是,在抽樣比較小的交叉分組內(nèi)適當(dāng)增加樣本,縮小各交叉分組之間的抽樣比差距。對(duì)于某個(gè)省來(lái)說(shuō),就是在抽樣比較小的行業(yè)層內(nèi)增加樣本,縮小各行業(yè)層之間的抽樣比差距。在不斷試算的過(guò)程中,有效樣本量達(dá)到目前的設(shè)計(jì)樣本量即可。由于大部分省在設(shè)計(jì)樣本量基礎(chǔ)上增加了樣本量由于大部分省在設(shè)計(jì)樣本

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論