CHFS抽樣方法簡介_第1頁
CHFS抽樣方法簡介_第2頁
CHFS抽樣方法簡介_第3頁
CHFS抽樣方法簡介_第4頁
CHFS抽樣方法簡介_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、中國家雇金融嘀盍中國家雇金融嘀盍Il hijriJi I limwhilrl FlviaiiiKT Surn r)中國家庭金融抽樣方法簡介2013年1月 19日一、調(diào)查樣本框和樣本量為了保證樣本的隨機性和代表性,同時達(dá)到CHFS著眼于研究家庭資產(chǎn)配置、 消費儲蓄等行為的目的,抽樣設(shè)計力求滿足如下四個方面的要求:一是經(jīng)濟(jì)富裕 地區(qū)的樣本比重相對較大;二是城鎮(zhèn)地區(qū)的樣本比重相對較大;三是樣本的地 理分布比較均勻;四是盡可能節(jié)約成本??傮w而言, 本項目的整體抽樣方案采用了分層、三階段與規(guī)模度量成比例(PPS)的抽樣設(shè)計。初級抽樣單元(PSU )為全國除西藏、新疆、內(nèi)蒙和港澳 地區(qū)外的 2585 個市

2、/縣。第二階段抽樣將直接從市/縣中抽取居委會/村委會;最 后在居委會/村委會中抽取住戶。每個階段抽樣的實施都采用了 PPS 抽樣方法, 其權(quán)重為該抽樣單位的人口數(shù)(或戶數(shù))。為控制成本,本項目首輪調(diào)查的戶數(shù) 設(shè)定為 8438 戶。從可操作性以及成本的角度出發(fā),各階段樣本數(shù)設(shè)定如下:首先,根據(jù)城鄉(xiāng) 以及地區(qū)經(jīng)濟(jì)發(fā)展水平,末端抽樣的戶數(shù)(即從每個居委會/村委會抽取的戶數(shù)) 設(shè)定在 2050 戶之間,其平均戶數(shù)約為 25 戶;其次,在每個市/縣中抽取的居 委會/村委會數(shù)量為4最后可以計算得到抽取的市/縣個數(shù)約為8000十(4x25) =80。二、抽樣設(shè)計 總體而言,本項目的整體抽樣方案采用了分層、三

3、階段與規(guī)模度量成比例(PPS)的抽樣設(shè)計。初級抽樣單元(PSU)為全國除西藏、新疆、內(nèi)蒙和港澳 地區(qū)外的 2585 個市/縣。第二階段抽樣將直接從市/縣中抽取居委會/村委會;最 后在居委會/村委會中抽取住戶。每個階段抽樣的實施都采用了 PPS 抽樣方法, 其權(quán)重為該抽樣單位的人口數(shù)(或戶數(shù))。為控制成本,本項目首輪調(diào)查的戶數(shù) 設(shè)定為 80008500 戶。從可操作性角度出發(fā),各階段樣本數(shù)設(shè)定如下:首先,根據(jù)城鄉(xiāng)以及地區(qū)經(jīng) 濟(jì)發(fā)展水平,末端抽樣的戶數(shù)(即從每個居委會 /村委會抽取的戶數(shù))設(shè)定在 2050 戶之間,其平均戶數(shù)約為 25 戶;其次,在每個市/縣中抽取的居委會/村 委會數(shù)量為4;最后可

4、以計算得到抽取的市/縣個數(shù)約為8000十(4x25)=80。第一階段抽樣第一階段抽樣的目標(biāo)是從 2585 個市縣中抽取 80 個市縣。同時,要求80個 市縣的地理分布相對均勻,并且富裕地區(qū)的樣本不能過少。為達(dá)到該目的,我 們將2585個市縣按照人均GDP分成十層,在每個層內(nèi)以市縣人口數(shù)為權(quán)重,采 用 PPS 抽樣抽取 8 個市縣,共抽得 80 個市縣,樣本涵蓋全國 25 個省。表 1 列 出了抽取的80個市縣樣本與總體的人均GDP描述統(tǒng)計??梢钥闯?,樣本與總體 在人均GDP的分布上是非常接近的。表 1 :總體和 80 個市縣樣本人均 GDP 分布人均GDP均值標(biāo)準(zhǔn)差中位數(shù)Q25Q75峰度偏度總

5、體17334.817736.9113707173202633.217.64樣本17809.219336.3113497232211433.520.41注:Q25和Q75分別表示25%和75%的分位數(shù)上述抽樣過程并沒有考慮到抽取出的市縣樣本的地理分布情況。為了評估在 上述抽樣方案下樣本的地理分布情況,我們通過隨機模擬的方式將上述分層PPS 抽樣過程重復(fù)1000次,得到樣本的平均地理分布情況(以東部、中部和西部城 市占樣本總體的比例衡量) 。模擬結(jié)果如表2所示。表 2:總體和樣本的地理分布總體樣本平均(模擬1000次)東部中部西部東部中部西部均值0.3430.2720.3840.3670.3060

6、.327標(biāo)準(zhǔn)差0.0230.0230.023由表2可以看出,在該抽樣方案下,樣本中東部、中部和西部市縣占樣本總體的比例十分穩(wěn)定(其模擬的標(biāo)準(zhǔn)差很?。?,約為 37:30:33。與總體相比,樣本 中東部城市的比例更大。但由于我們的抽樣方案僅要求樣本分布相對均勻,而無 需與總體一致,因此該抽樣方案能滿足第一階段的抽樣要求。在最終抽取出的涵 蓋 25 個省份 80 個市縣的樣本中,東、中、西部省份的比例為 32:27:21 。第二階段抽樣第二階段抽樣的目標(biāo)是從市縣中抽取居委會/村委會樣本。抽樣的關(guān)鍵在合 理分配城鎮(zhèn)樣本和農(nóng)村樣本的比例。由于我國非農(nóng)人口眾多,若按照非農(nóng)人口比 例等比例分配城鄉(xiāng)樣本,則會

7、出現(xiàn)城鎮(zhèn)樣本過少的情況。考慮到 CHFS 項目的研 究主題是居民資產(chǎn)配置等家庭金融行為,必須按一定的原則分配樣本,以達(dá)到多 抽取城鎮(zhèn)樣本的目的。其具體實施方法如下:第一,按照各市縣的非農(nóng)人口比例的分位數(shù),將各市縣分成 5 個組。分組的 依據(jù)是各市縣非農(nóng)人口比重 20%、40%、60%和 80%的分位數(shù)。第二,在非農(nóng)人口比例最大的市縣組中,居委會和村委會分配的樣本比例是 4:0。第三,在非農(nóng)人口比例次大的市縣組中,居委會和村委會分配的樣本比例是 3:1。第四,以此類推,在非農(nóng)人口比例最低的市縣組中,居委會和村委會分配的 樣本比例是 0:4基于上述樣本分配方式,在既定市/縣內(nèi)形成了城鎮(zhèn)和農(nóng)村兩個抽

8、樣框。在 城鎮(zhèn)和農(nóng)村抽樣框內(nèi),其抽取的居委會和村委會樣本數(shù)量是已知的。因此可以分 別按照各居委會(村委會)的居民戶數(shù)進(jìn)行 PPS 抽樣。80 個市縣的城鄉(xiāng)樣本分 配如表3 所示。表3城鄉(xiāng)樣本分配城鎮(zhèn)樣本數(shù)頻數(shù)比重()01518.7511012.2521518.7531518.7542531.25從表 3 可以看出,在我們的城鄉(xiāng)樣本分配方案下,城鎮(zhèn)樣本數(shù)(居委會數(shù)量)為0的市縣個數(shù)為15,占80 個市縣的18.75%;而農(nóng)村樣本數(shù)(村委會數(shù)量)為 零的市縣為 25 個,占 80 個市縣樣本的 31.25%。上述統(tǒng)計數(shù)據(jù)表明該樣本分配 方案達(dá)到了多抽取城市樣本的目的。按照上述方案,在第二階段抽取出

9、的 320 個居委會/村委會中,城鎮(zhèn)樣本與農(nóng)村樣本比例為:181:139。第三階段抽樣第三階段抽樣是CHFS項目的末端抽樣階段。其目的是從給定居委會/村委會 的住戶清單列表中抽取訪問的住戶。在這一階段的抽樣中,農(nóng)村地區(qū)抽取的戶數(shù) 統(tǒng)一設(shè)定為20 戶。而在城市地區(qū),我們收集了各社區(qū)的平均住房價格信息,并 以此作為社區(qū)富裕程度的衡量指標(biāo)。在此基礎(chǔ)上,我們根據(jù)住房價格由高到低將 各社區(qū)分成四個組,在住房價格最高的組分配50 戶樣本;而在住房價格最低的 組分配25個樣本,以達(dá)到進(jìn)一步抽取富裕家庭的目的。各城市社區(qū)的住戶樣本 分配情況如表4 所示。表4:城市社區(qū)戶數(shù)分配分配戶數(shù)社區(qū)數(shù)量社區(qū)百分比()社區(qū)

10、累計百分比()255332.7232.72305232.1064.81352817.2882.10502917.90100.00三、抽樣實施1. 繪制住宅分布圖本項目的末端抽樣建立在繪制住宅分布圖以及制作住戶清單列表的基礎(chǔ)上, 借助“住宅分布地理信息”作為抽樣框來進(jìn)行末端抽樣。末端抽樣框的精度很大 程度上取決于實地繪圖的精度,因此,如何有效的提高繪圖精度成為關(guān)鍵。CHFS的繪圖采用項目組自行研發(fā)的地理信息抽樣系統(tǒng),借助3G(遙感、GPS、 GIS)技術(shù)解決了目標(biāo)區(qū)域空間地理信息的采集問題。借助地理信息研究所提供 的高精度數(shù)字化影像圖和矢量地圖,繪圖員在野外通過電子平板儀加上GPS定位 獲取高精

11、度的測量電子數(shù)據(jù),并直接輸入到計算機系統(tǒng)中,從而獲得高質(zhì)量矢量 底圖??紤]到地圖數(shù)據(jù)的時效性,通過后期實地核查人工修正的方式對空間地理 數(shù)字模型進(jìn)行修正,建立起與現(xiàn)實地理空間對應(yīng)的虛擬地理信息空間。該系統(tǒng)除了使繪圖工作人員能直接在電子地圖上繪制住宅分布圖外,還能儲 存住戶分布信息,并輔助完成末端抽樣工作,從而在最大程度上提高工作效率,減少繪圖和末端抽樣誤差。此外,使用電子地理信息抽樣系統(tǒng)也有利于保存住戶信息資料,為進(jìn)一步深化和改進(jìn)項目的工作奠定了基礎(chǔ)。該部分核心流程如下圖1 所示:圖 1:繪圖核心處理流程2. 末端抽樣末端抽樣基于繪圖工作生成的住戶清單列表采用等距抽樣的方式進(jìn)行。具體 步驟如下

12、:第一,計算抽樣間距,即每隔多少戶抽選一個家庭。抽樣間距的計算公式為: 抽樣間距=住戶清單總戶數(shù)十設(shè)計抽取戶數(shù)(向上取整) 若某社區(qū)共有住戶 100 戶,計劃抽取 30 戶,100/30=3.33。則抽樣間距為 4。第二,確定隨機起點。隨機起點的確定為抽樣開始時,鐘表上分針?biāo)幬恢?的個體數(shù)值。如此時時間為15 時34 分,則隨機起點為4;如此時時間為12:03, 則隨機起點為 3。第三,確定抽中住戶。隨機起點所指示的住戶為第一個被抽中的住戶。在上 述例子中,假定隨機起點為3,則第一個被抽中的住戶是編號為3 的住戶。則其 他被抽中的住戶依次為7, 11, 15, 19,,依次類推,直至抽滿30

13、戶為止。我們的抽樣中對家庭的定義如下:家庭可分為多人家庭和單人家庭兩種情況。 多人家庭由夫妻、父母、子女、兄弟姐妹等構(gòu)成,可以直接訪問;單人家庭又分為幾種情況:沒有其他家人,可以直接訪問;而如果在其他地方有家人,但經(jīng)濟(jì) 獨立,則不算作本地區(qū)的家庭成員。同時,必須至少有一個人是中國國籍,至少 在本地居住 6 個月以上。識別家庭總的原則是滿足下列條件之一:共享收入,共 擔(dān)支出。a12nr嚴(yán)I L a12nr嚴(yán)I L 汗r ftflfcMdJfc由 *橫& 肓d * M/K/qB.life? *, tXH J pr-r* k- 4HPHr ?fiii丄生H山日一l_*_iJliiBttifflWi

14、*ttffiR 左一灶二L fiNi鼠G伴嚴(yán)匸| iiUhij mV, ft j m.Si JAlhf JLJ. 奉q- r 巔| iHJ 時耐 dLLLk曲孑丄圖 2 繪圖員手繪地圖圖 3 繪圖員電子繪圖四、樣本分布與加權(quán)匯總1. 樣本分布在上述抽樣方法下,最終抽取出的涵蓋 25 個省份 80 個市縣的樣本中,東、中、西部省份的比例為32:27:21。城鎮(zhèn)樣本數(shù)(居委會數(shù)量)為0 的市縣個數(shù)為 15,占 80 個市縣的 18.75%;而農(nóng)村樣本數(shù)(村委會數(shù)量)為零的市縣為 25 個, 占 80 個市縣樣本的 31.25%。在第二階段抽取出的 320 個居委會/ 村委會中,城 鎮(zhèn)樣本與農(nóng)村樣本比例為 162:158。圖 4 樣本分布2. 加權(quán)匯總在我們的抽樣設(shè)計下,由于每戶家庭被抽中的概率不同,因此每戶家庭代表 的中國家庭數(shù)量也就不

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論