根據(jù)抽樣設(shè)計(jì)分析數(shù)據(jù)_第1頁(yè)
根據(jù)抽樣設(shè)計(jì)分析數(shù)據(jù)_第2頁(yè)
根據(jù)抽樣設(shè)計(jì)分析數(shù)據(jù)_第3頁(yè)
根據(jù)抽樣設(shè)計(jì)分析數(shù)據(jù)_第4頁(yè)
根據(jù)抽樣設(shè)計(jì)分析數(shù)據(jù)_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、中國(guó)勞動(dòng)力2012:根據(jù)抽樣設(shè)計(jì)分析數(shù)據(jù)一、簡(jiǎn)介本次采用的是分層四階段不等概率抽樣,具體為將中國(guó)(不含自治區(qū)、海南和臺(tái))共 2282 個(gè)區(qū)縣作為初級(jí)抽樣單元(PSU)總體,劃分為 6 大層進(jìn)行抽樣:各階段的抽樣為:第一階段:以區(qū)(地級(jí)市、省會(huì)城市和直轄市的各大城區(qū)和郊區(qū))、縣(包括縣級(jí)市)為初級(jí)抽樣。第二階段:以街道、鄉(xiāng)鎮(zhèn)為二級(jí)抽樣。第三階段:以居民、村民為三級(jí)抽樣。第四階段:以家庭住戶為最終。二、根據(jù)抽樣設(shè)計(jì)分析數(shù)據(jù)的必要性大多數(shù)統(tǒng)計(jì)分析所講述的統(tǒng)計(jì)推論方法都是基于簡(jiǎn)單隨機(jī)抽樣(或者系統(tǒng)隨機(jī)抽樣)的樣本。使用的社會(huì)數(shù)據(jù)在以下面與之不同,因而在分析時(shí)需要進(jìn)行校正。1. 入樣概率的影響大型通常使

2、用不等概率抽樣,導(dǎo)致不同的家庭或人進(jìn)入樣本的概率不同。在本中,由于不同家庭中的勞動(dòng)力數(shù)量不同,對(duì)入樣的勞動(dòng)力,需要加權(quán)以調(diào)整其在家庭中被抽取的概率。即使在抽樣設(shè)計(jì)中按照相等概率抽取家庭,1地區(qū)小省層大省層?xùn)|部、市、市、遼寧省、浙江省、福建江蘇省、山東省、省中部山西省、吉林省、省、江西省、省、廣西省、重慶市河北省、黑龍江、省、湖南省、省西部省、青海省、自治區(qū)、內(nèi)、省、云南省、陜西省不同家庭的實(shí)際入樣概率也會(huì)不同。例如:不同社會(huì)群體對(duì)的應(yīng)答率不同,因此需要給予應(yīng)答率低的群體更大的權(quán)數(shù)以保證樣本的代表性。2. 整群抽樣(cluster sling)的影響出于降低成本的考慮,在大型中通常使用整群抽樣,

3、而不是簡(jiǎn)單隨機(jī)抽樣或者系統(tǒng)隨機(jī)抽樣。例如當(dāng)在抽中了區(qū)縣后,之后抽取街道/鄉(xiāng)鎮(zhèn),居委會(huì)/村委會(huì),以及家庭的時(shí)候是在抽中的區(qū)縣抽取。這樣會(huì)導(dǎo)致一個(gè)后果,即同一個(gè)區(qū)縣里的家庭(或個(gè)人)會(huì)更相似,而會(huì)低估了不同區(qū)縣的家庭(或個(gè)人)之間的差別,于是在進(jìn)行統(tǒng)計(jì)推論時(shí)就會(huì)低估標(biāo)準(zhǔn)誤。因此也需要因應(yīng)整群抽樣的特點(diǎn)進(jìn)行校正。在此需要,雖然整群抽樣會(huì)低估樣本的異質(zhì)性,但分層抽樣能夠在一定程度上對(duì)此進(jìn)行彌補(bǔ)。3. 無(wú)放回抽樣(sling without replacement)的影響大多數(shù)統(tǒng)計(jì)分析講述抽樣設(shè)計(jì)的時(shí)候,都假定樣本是有放回的(slingwith replacement)。換言之,在 100 個(gè)人里隨機(jī)抽

4、取 10 個(gè)人,如果抽中的第一個(gè)人為 A,那么在抽取第二個(gè)人時(shí)會(huì)把 A 放回這總體中,然后再進(jìn)行抽樣,以保證每個(gè)人被抽中的概率不變。在實(shí)際操作中,如果之后抽樣時(shí)再抽中A,由于 A 的信息已經(jīng)知道了,會(huì)忽略 A。但如果不把 A 放回,又會(huì)導(dǎo)致樣本框中后抽中的人的入樣概率會(huì)高于先抽中的人。因此要對(duì)無(wú)放回的抽樣方式導(dǎo)致的結(jié)果進(jìn)行有限總體校正(finite population correction)。三、設(shè)置抽樣設(shè)計(jì)信息:以 Sa為例第一步:設(shè)定抽樣設(shè)計(jì)信息在分析復(fù)雜抽樣數(shù)據(jù)時(shí),需要先通過(guò) svyset 模塊告知 Sa該的抽樣設(shè)計(jì)。如果使用的是家庭數(shù)據(jù),研究者應(yīng)在 Sa 中輸入:svyset nco

5、de pw=wfp, strata(strata) fpcode) | scode上面命令中標(biāo)注為紅色的是提供的跟抽樣設(shè)計(jì)有關(guān)的變量。其中 strata是分層的層變量,ncode 是初級(jí)抽樣(Primary Sling Unit,PSU),scode通過(guò)這 3 個(gè)變量告知是次級(jí)抽樣(Secondary Sling Unit,),2Sa 該數(shù)據(jù)是多階段分層整群抽樣。fpc 表示有限總體校正(Finite PopulationCorrection),調(diào)用的變量是 nncode(注意不是 ncode)。pw 表示抽樣權(quán)數(shù),調(diào)用的變量是 wfp,這個(gè)變量是家庭權(quán)數(shù)變量,如果使用的是勞動(dòng)力數(shù)據(jù),則應(yīng)相應(yīng)

6、改為 wpp,即svyset ncode pw=wpp, strata(strata) fpcode) | scode第二步:通過(guò) svy 調(diào)用設(shè)定的信息進(jìn)行分析用 svyset 設(shè)定抽樣設(shè)計(jì)的信息后,進(jìn)行分析時(shí)必須用 svy 作為前綴才能進(jìn)行調(diào)用。如果沒(méi)有調(diào)用抽樣設(shè)計(jì)信息,分析結(jié)果將會(huì)。下面以勞動(dòng)力數(shù)據(jù)為例介紹 svy 的用法(I1_1 是)。3如果分析的是一個(gè)子樣本,則需要用 svy 的 subpop 選項(xiàng)進(jìn)行設(shè)定。subpop里的變量取值為 1 則為該子樣本,為 0 則不是為該子樣本。例如要計(jì)算的均值(該例中 male 變量取值為 1 是,取值為 0 是女性):如果子樣本是多個(gè)條件的組合

7、,也可以在 subpop 選項(xiàng)里設(shè)定。例如要黨員的均值(I1_6 為政治面貌:1 表示黨員,2 表示計(jì)算黨派,3 表示群眾):4也可以用 over(I1_9_6)按被訪者現(xiàn)在的戶口性質(zhì)(農(nóng)業(yè)/非農(nóng))計(jì)算黨員的均值。5支持 svy 前綴的常用 Sa 命令:估計(jì)平均值svy: svy: svy:svy:mean (注意沒(méi)有 svy: sum 這個(gè)命令)tab reglogit / probit / mlogit / ologit單變量分布或雙變量交互表線性回歸模型其他回歸模型/tobit / poisson / heckman感的研究者也可以在 Sa 里面輸入 helpsvy_estimation 查看其他 svy 估計(jì)命令的用法。11如果你使用的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論