抽樣設(shè)計的理論與方法_第1頁
抽樣設(shè)計的理論與方法_第2頁
抽樣設(shè)計的理論與方法_第3頁
抽樣設(shè)計的理論與方法_第4頁
抽樣設(shè)計的理論與方法_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1抽樣設(shè)計的理論與方法中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院 楊 軍聯(lián)系方式: 2報告提綱首先簡單介紹調(diào)查的基本概念和主要組成部分,以對抽樣調(diào)查有個總體認識講述抽樣調(diào)查中的抽樣設(shè)計,包括各種抽樣設(shè)計與相應(yīng)的估計方法以及輔助信息的利用,重點是簡單隨機抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多相抽樣參考文獻3一、調(diào)查的主要組成部分調(diào)查概述調(diào)查設(shè)計數(shù)據(jù)的收集方法調(diào)查問卷設(shè)計 抽樣方法抽樣估計樣本量的確定數(shù)據(jù)收集的實施數(shù)據(jù)處理數(shù)據(jù)發(fā)布與數(shù)據(jù)分析4調(diào)查概述調(diào)查指使用明確的概念、方法和程序,以有組織、有條理的方式,從一個總體的部分或所有單元中收集感興趣的指標信息,并將這些信息綜合編輯成有用的簡要形式的所有活動。調(diào)查的

2、重要性。調(diào)查是認識客觀世界的一種手段,通過調(diào)查獲取信息,了解現(xiàn)狀,進行管理決策和預(yù)測。調(diào)查的任務(wù)??茖W(xué)地反映客觀情況,為解決問題、制定政策或策略提供依據(jù),調(diào)查是為決策服務(wù)。調(diào)查設(shè)計調(diào)查前準備調(diào)查的實施調(diào)查的分析與報告5調(diào)查設(shè)計調(diào)查目標的確定調(diào)查方法的選擇抽樣設(shè)計的有關(guān)問題調(diào)查中各種誤差及其控制61、郵寄調(diào)查:被調(diào)查者在沒有訪員協(xié)助下完成問卷。2、人員面訪:由調(diào)查人員協(xié)助完成問卷。3、電話訪問:訪員通過電話協(xié)助被調(diào)查者完成問卷。4、網(wǎng)絡(luò)調(diào)查:調(diào)查者利用網(wǎng)絡(luò)進行調(diào)查。數(shù)據(jù)的收集方法7調(diào)查問卷設(shè)計問卷的作用與設(shè)計原則問卷結(jié)構(gòu)與問題類型問卷設(shè)計的技巧問卷的度量方法8問卷的開發(fā)程序向用戶和調(diào)查對象咨詢參

3、考以前相同主題的問卷草擬問題審議、測試和修改問卷試點調(diào)查和問卷的定稿9抽樣方法什么是抽樣 抽樣是通過抽取總體中的部分單元,收集這些單元的信息,用來 對總體進行推斷的一種手段非概率抽樣 概率抽樣10抽樣估計 抽樣估計的基本原理 加權(quán) 總體均值、比例及總量的簡單估計 輔助信息的使用 調(diào)查估計量的抽樣誤差估計11樣本量的確定影響樣本量的因素: 估計值要求的精度;提供的經(jīng)費能支持多大的樣本;調(diào)查的時間要求;需要和能招聘到多少調(diào)查人員等。12數(shù)據(jù)收集的實施數(shù)據(jù)收集是調(diào)查中收集每一個被抽中的單元個體數(shù)據(jù)的過程。必要的公關(guān)工作調(diào)查前的準備數(shù)據(jù)收集過程調(diào)查過程及調(diào)查質(zhì)量的控制13數(shù)據(jù)處理數(shù)據(jù)處理數(shù)據(jù)處理的簡要

4、過程1、全面核查問卷上的數(shù)據(jù)2、對問卷上的回答進行編碼3、將數(shù)據(jù)錄入計算機4、詳細審核、插補5、進行離群值的檢測6、將數(shù)據(jù)儲存在數(shù)據(jù)庫中14數(shù)據(jù)處理數(shù)據(jù)處理數(shù)據(jù)處理的簡要過程1、全面核查問卷上的數(shù)據(jù)2、對問卷上的回答進行編碼3、將數(shù)據(jù)錄入計算機4、詳細審核、插補5、進行離群值的檢測6、將數(shù)據(jù)儲存在數(shù)據(jù)庫中15數(shù)據(jù)發(fā)布與數(shù)據(jù)分析調(diào)查報告統(tǒng)計表和統(tǒng)計圖數(shù)據(jù)分析保密和泄密控制16抽樣設(shè)計的理論和方法抽樣調(diào)查中的一些基本概念 總體和樣本總體和樣本:總體是指研究對象的全體,它是由研究對象中的單元組成的。總體中單元的數(shù)目稱作總體容量;樣本是指抽樣時按照抽樣的規(guī)則所抽中的那部分單元所組成的集合??傮w抽取樣本

5、推斷總體樣本17研究的目標參數(shù):研究的目標參數(shù): 總體總量、總體均值、總體比例的估計及其相應(yīng)的方差估計入樣概率與抽樣比入樣概率與抽樣比入樣概率是指某個總體單元被選入樣本的概率抽樣比:指樣本量 n 與總體的容量N的比例下面介紹主要抽樣方法與相應(yīng)的估計方法:18(一)簡單隨機抽樣(一)簡單隨機抽樣 定義:設(shè)總體中有N個單元,不加條件從中隨機抽取n個單元為樣本,每個單元都有同樣的概率被抽中的抽樣方法。 總體總量和總體均值 (1) 與 (2) NiiYY1NiiyNNYY1119樣本均值 (3)總體均值和總量的估計 (4) (5) niiyny11niiynyY11niiynNyNY120估計量的方差

6、 (6) 而 (7)估計量的方差估計 (8) (9),1 ()(2fnSyV212)(11NiiYYNS)1 ()(2fnsyv212)(11niiyyns21簡單隨機抽樣的特點簡單隨機抽樣的特點優(yōu)點: (1)比較容易理解和掌握;(2)抽樣框不需要其他輔助信息;(3)理論上比較成熟,有現(xiàn)成的方差估計公式。缺點: (1)沒有利用輔助信息;(2)樣本分散,面訪費用較高;(3)有可能抽到較差的樣本;(4)抽選大樣本比較費時22(二)分層抽樣(二)分層抽樣 定義:在抽樣之前將總體分為同質(zhì)的、互不重疊的若干子總體,也稱為層。然后在每一個層獨立地隨機抽取樣本。 分層抽樣示意圖23首先介紹分層抽樣的的一些符

7、號:用下標h表示層的編號用 分別表示總體和樣本中第h層第i個單元指標值;用 表示h層的層權(quán)用 表示h層的抽樣比分別表示h層(總體)均值與樣本均值;), 2 , 1(LhhihiyY ,NNWhh/hhhNnf/hnihihhNihihnyyNYYhh/,/11) 1/()(),1/()(212212hnihhihhNihhihnyysNYYShh24分別為h層的(層內(nèi))方差和樣本方差下面介紹分層抽樣適用的場合和優(yōu)點1)在調(diào)查中不僅需要對總體進行參數(shù)估計,也需要對層的參數(shù)進行估計。2)使樣本更具代表性。3)便于組織管理和數(shù)據(jù)匯總4)對不同層可以按照不同情況和條件,具體采用不同的抽樣方法。5)分層

8、抽樣可以提高估計量的精度估計量及其性質(zhì)估計量及其性質(zhì)25總體均值的估計 (10)對分層隨機抽樣,有如下簡單估計 (11)總體總和的簡單估計為 (12)無偏性:如果層的估計具有無偏性,分層的總體總量和總體均值的估計具有無偏性。對分層隨機抽樣, 的一個無偏估計為hLhhhLhhstYNNYWY111LhhhLhhhstyNNyWy111hLhhststyNyNY1)(styV26 (13) 分層抽樣的缺點: (1)對抽樣框的要求比較高,必須有分層的輔助信息;(2)收集或編制抽樣框的費用比較高;(3)若調(diào)查變量與分層的變量不相關(guān),效率可能降低;(4)估計值的計算比簡單隨機抽樣復(fù)雜LhhhLhhhhh

9、LhhhhstNsWnsWfnsWyv12122122)1 ()(27比估計和回歸估計利用輔助信息比估計和回歸估計主要是利用輔助變量來提高估計精度比估計及其基本性質(zhì)如果 之間大致呈正比例關(guān)系,采用比估計量對簡單隨機抽樣,總體均值和總量的比估計量為 (14) (15)有時候,調(diào)查的目的是要估計總體 與 的比值:iiXY ,;XxyXxyyR;RRyNXxyXxyYYX28 (16)對它的估計為 (17)基本性質(zhì)對于簡單隨機抽樣,當(dāng)樣本量大時XYXYRxyxyR.1)(1)(;1)()1 ()(;1)(1)(;)(,)(,)(12212212NRXYXxfRVNRXYnfNYVNRXYnfyVRR

10、EYYEYyENiiiNiiiRNiiiRRR29對于實際問題的方差估計,仍用樣本估計,用 (18)估計 。對分層抽樣,比估計有分別比和聯(lián)合比兩種形式?;貧w估計及其基本性質(zhì)回歸估計及其基本性質(zhì)對簡單隨機抽樣,總體均值的回歸估計定義為 (19)若回歸系數(shù)設(shè)定,則回歸估計為無偏估計,且其方差估計可表示為 (20)如回歸系數(shù)為1,稱為差估計量。21)(11niiixRyn21)(11NiiiRXYN),()(XxyxXyylr)2(1)(222yxxylrsssnfyv30如回歸估計量采用樣本回歸系數(shù) (21)則總體均值的回歸估計量為 (22)基本性質(zhì):當(dāng)樣本量較大時,將相應(yīng)的樣本估計量代入上式,得

11、相應(yīng)的樣本估計。對分層抽樣,有相應(yīng)的分別回歸估計和聯(lián)合回歸估計。niiniiixxxxyyb121)()(),()(XxbyxXbyylr)1()1()1 (1)()1()(2/322nOnOSnfyMSEnOYyEylrlr31(三)與單元大小成比例的概率抽樣1、定義:根據(jù)單元的大小不同,入樣概率不同的一種不等概率抽樣。如農(nóng)場的大小不同,其抽選概率可以根據(jù)面積大小成比例,也可以按人數(shù)多少成比例。用英文的字頭簡稱為PPS抽樣。2、優(yōu)缺點:優(yōu)點是當(dāng)研究的變量與單元大小有關(guān)時,由于使用了輔助信息,可以提高抽樣效率。但缺點是對抽樣框需要有高質(zhì)量的抽樣框,成本較高;對于單元大小不相關(guān)的變量就不適用;估

12、計量的抽樣方差估計比較復(fù)雜。32pps抽樣是一種特殊的不等概率抽樣,對放回地不等概率抽樣,介紹Hansen-Hurvitz估計量。若 是按 的入樣概率進行的多項抽樣抽取的樣本指標值,相應(yīng)的 值為 。則總體總和的估計(Hansen-Hurvitz估計)為 (23) 是無偏的,且有方差估計 (24)對不放回地不等概率抽樣,采用Horvitz-Thompson估計量nyyy,21iZiZnzzz,21niiiHHzynY1121)() 1(1)(niHHiiHHYzynnYvniiiHTynY1133(四)整群抽樣 1、定義:由若干個有聯(lián)系的基本單元組成的集合稱為群,抽樣時以群為抽樣單元的抽樣方法就

13、稱為整群抽樣。 整群抽樣示意圖:黃色為總體紅色為群白點為基本單元34整群抽樣的優(yōu)點: (1)能大大減低收集數(shù)據(jù)的費用;(2)當(dāng)總體單元自然形成的群時,容易取得抽樣框,抽樣也更容易;(3)當(dāng)群內(nèi)單元差異大,而不同群之間的差異小時,可以提高效率。缺點: (1)若群內(nèi)個單元有趨同性,效率將會降低;(2)通常無法預(yù)先知道總樣本量,因為不知道群內(nèi)有多少單元;(3)方差估計比簡單隨機抽樣更為復(fù)雜可以綜合利用分層和整群抽樣技術(shù),采取分層整群抽樣,比如人體尺寸調(diào)查,采用分層提高樣本代表性,采用整群抽樣,便于數(shù)據(jù)的收集。35總體(五)多階抽樣(五)多階抽樣 定義:它是由兩個或更多個連續(xù)的階段抽取樣本的方法。 多

14、階抽樣示意圖:第一階樣本最終樣本36優(yōu)點: (1)當(dāng)群具有同質(zhì)性時,多階抽樣的效率高于整群抽樣;(2)樣本的分布比簡單隨機抽樣集中,采用面訪可以節(jié)約時間和費用;(3)不需要整個總體單元的名錄框,只要群的名錄框和抽中群的單元名錄框。缺點: (1)效率不如簡單隨機抽樣;(2)通常不能提前知道最終的樣本量;(3)調(diào)查的組織較整群抽樣復(fù)雜;(4)估計值與抽樣方差的計算較為復(fù)雜。37定義:又稱等距抽樣,對研究的總體按一定的順序排列,每隔一定的間隔抽取一個單元的抽樣方法。 抽選方法:設(shè)總體單元數(shù)為N,要抽n個單元為樣本,先計算抽樣間隔k=N/n,在1到k之間抽取一個隨機起點r,則被抽中單元的順序位置是:r

15、,r+k,r+2k,。當(dāng)N不能被n整除時,采用圓形系統(tǒng)抽樣方法。(六)系統(tǒng)抽樣382、系統(tǒng)抽樣的優(yōu)點(1)沒有抽樣框時可代替簡單隨機抽樣方法簡單;(2)不需要輔助的抽樣框信息;(3)樣本的分布比較好;估計值容易計算。 3、系統(tǒng)抽樣的缺點 (1)若抽樣間隔與總體的某種周期性變化一致,會得一個差的樣本;(2)不使用輔助信息使抽樣效率不高;(3)使用概念框時,不能預(yù)先知道樣本量;(4)沒有一個無偏的方差估計量;(5)當(dāng)N不能被n整除時會得到樣本量不同的樣本。 我們國家的國家統(tǒng)計局的調(diào)查多采用系統(tǒng)抽樣,它便于操作。39定義:在同一個抽樣框內(nèi),先抽一個大樣本,收集基本的信息,然后在這個大樣本中再抽一個子

16、樣本,收集調(diào)查的詳細信息。 多相抽樣示意圖:(七)多相抽樣(七)多相抽樣。第一相樣本第二相樣本。40優(yōu)點:(1)利用了第一相樣本的信息,能顯著提高估計值的精度;(2)適用于某些調(diào)查指標的數(shù)據(jù)收集費用特別高或給被調(diào)查者帶來較重負擔(dān)的情況。缺點: (1)整個調(diào)查的時間要長;(2)調(diào)查費用要比較高;(3)調(diào)查的組織比較復(fù)雜;(4)估計值和抽樣誤差的計算會相當(dāng)復(fù)雜。41主要的抽樣方法,大致就有上述幾種,在實際中采用哪種抽樣設(shè)計,要根據(jù)具體情況,靈活掌握,當(dāng)然也可以組合起來使用。抽樣方案和參數(shù)估計是一體的,所以在抽樣設(shè)計時要考慮到后續(xù)的數(shù)據(jù)處理。42參考書目馮士雍,施錫輇. 抽樣調(diào)查理論、方法與實踐.

17、上??茖W(xué)技術(shù)出版社,1996.馮士雍,倪加勛,鄒國華. 抽樣調(diào)查理論與方法, 中國統(tǒng)計出版,1998.加拿大統(tǒng)計局調(diào)查技能項目組編,中國國家統(tǒng)計局調(diào)查技能項目組譯,馮士雍(審校).調(diào)查技能教程,中國統(tǒng)計出版社, 2002.趙民德,謝邦昌. 探索真相,中國統(tǒng)計出版,2001.胡健穎,孫山澤,抽樣調(diào)查的理論和方法,北京大學(xué)出版社,2000. 柯惠新,丁立宏,市場調(diào)查與分析,中國統(tǒng)計出版社,2000.梁小筠,祝大平.抽樣調(diào)查的方法和原理,華東師范大學(xué)出版社,1994.43我的一些工作:一、可靠性方面1.Dan Yu and Jun yang, Storage reliability evaluati

18、on of complex repairable system, Proceeding of East Asian Symposium on Statistics, 2002.11。2、楊軍,于丹. 一種基于可用度的裝備貯存模型及其應(yīng)用,系統(tǒng)工程理論與實踐,2004.7。3、楊軍,于丹.修如舊模型中貯存系統(tǒng)備件量的計算及其置信區(qū)間,中國科學(xué)院研究生院學(xué)報,2004.10。4、于丹,楊軍.復(fù)雜系統(tǒng)貯存可靠性綜合評估,中國電子學(xué)會論文集可靠性分會第十二屆學(xué)術(shù)年會論文選,2004.10。445、Jun Yang(speaker), Dan Yu. One kind of Composite Repairable Model and its Availability Fiducial Inference,The Joint Meeting of CSPS an

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論