抽樣設(shè)計(jì)的理論與方法講義(共46頁(yè)).ppt_第1頁(yè)
抽樣設(shè)計(jì)的理論與方法講義(共46頁(yè)).ppt_第2頁(yè)
抽樣設(shè)計(jì)的理論與方法講義(共46頁(yè)).ppt_第3頁(yè)
抽樣設(shè)計(jì)的理論與方法講義(共46頁(yè)).ppt_第4頁(yè)
抽樣設(shè)計(jì)的理論與方法講義(共46頁(yè)).ppt_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1抽樣設(shè)計(jì)的理論與方法中國(guó)科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院2報(bào)告提綱首先簡(jiǎn)單介紹調(diào)查的基本概念和主要組成部分,以對(duì)抽樣調(diào)查有個(gè)總體認(rèn)識(shí)講述抽樣調(diào)查中的抽樣設(shè)計(jì),包括各種抽樣設(shè)計(jì)與相應(yīng)的估計(jì)方法以及輔助信息的利用,重點(diǎn)是簡(jiǎn)單隨機(jī)抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多相抽樣參考文獻(xiàn)3一、調(diào)查的主要組成部分調(diào)查概述調(diào)查設(shè)計(jì)數(shù)據(jù)的收集方法調(diào)查問(wèn)卷設(shè)計(jì) 抽樣方法抽樣估計(jì)樣本量的確定數(shù)據(jù)收集的實(shí)施數(shù)據(jù)處理數(shù)據(jù)發(fā)布與數(shù)據(jù)分析4調(diào)查概述調(diào)查指使用明確的概念、方法和程序,以有組織、有條理的方式,從一個(gè)總體的部分或所有單元中收集感興趣的指標(biāo)信息,并將這些信息綜合編輯成有用的簡(jiǎn)要形式的所有活動(dòng)。調(diào)查的重要性。調(diào)查是認(rèn)識(shí)客

2、觀世界的一種手段,通過(guò)調(diào)查獲取信息,了解現(xiàn)狀,進(jìn)行管理決策和預(yù)測(cè)。調(diào)查的任務(wù)。科學(xué)地反映客觀情況,為解決問(wèn)題、制定政策或策略提供依據(jù),調(diào)查是為決策服務(wù)。調(diào)查設(shè)計(jì)調(diào)查前準(zhǔn)備調(diào)查的實(shí)施調(diào)查的分析與報(bào)告5調(diào)查設(shè)計(jì)調(diào)查目標(biāo)的確定調(diào)查方法的選擇抽樣設(shè)計(jì)的有關(guān)問(wèn)題調(diào)查中各種誤差及其控制61、郵寄調(diào)查:被調(diào)查者在沒(méi)有訪員協(xié)助下完成問(wèn)卷。2、人員面訪:由調(diào)查人員協(xié)助完成問(wèn)卷。3、電話訪問(wèn):訪員通過(guò)電話協(xié)助被調(diào)查者完成問(wèn)卷。4、網(wǎng)絡(luò)調(diào)查:調(diào)查者利用網(wǎng)絡(luò)進(jìn)行調(diào)查。數(shù)據(jù)的收集方法7調(diào)查問(wèn)卷設(shè)計(jì)問(wèn)卷的作用與設(shè)計(jì)原則問(wèn)卷結(jié)構(gòu)與問(wèn)題類型問(wèn)卷設(shè)計(jì)的技巧問(wèn)卷的度量方法8問(wèn)卷的開(kāi)發(fā)程序向用戶和調(diào)查對(duì)象咨詢參考以前相同主題的問(wèn)卷

3、草擬問(wèn)題審議、測(cè)試和修改問(wèn)卷試點(diǎn)調(diào)查和問(wèn)卷的定稿9抽樣方法什么是抽樣 抽樣是通過(guò)抽取總體中的部分單元,收集這些單元的信息,用來(lái) 對(duì)總體進(jìn)行推斷的一種手段非概率抽樣 概率抽樣10抽樣估計(jì) 抽樣估計(jì)的基本原理 加權(quán) 總體均值、比例及總量的簡(jiǎn)單估計(jì) 輔助信息的使用 調(diào)查估計(jì)量的抽樣誤差估計(jì)11樣本量的確定影響樣本量的因素: 估計(jì)值要求的精度;提供的經(jīng)費(fèi)能支持多大的樣本;調(diào)查的時(shí)間要求;需要和能招聘到多少調(diào)查人員等。12數(shù)據(jù)收集的實(shí)施數(shù)據(jù)收集是調(diào)查中收集每一個(gè)被抽中的單元個(gè)體數(shù)據(jù)的過(guò)程。必要的公關(guān)工作調(diào)查前的準(zhǔn)備數(shù)據(jù)收集過(guò)程調(diào)查過(guò)程及調(diào)查質(zhì)量的控制13數(shù)據(jù)處理數(shù)據(jù)處理數(shù)據(jù)處理的簡(jiǎn)要過(guò)程1、全面核查問(wèn)卷

4、上的數(shù)據(jù)2、對(duì)問(wèn)卷上的回答進(jìn)行編碼3、將數(shù)據(jù)錄入計(jì)算機(jī)4、詳細(xì)審核、插補(bǔ)5、進(jìn)行離群值的檢測(cè)6、將數(shù)據(jù)儲(chǔ)存在數(shù)據(jù)庫(kù)中14數(shù)據(jù)處理數(shù)據(jù)處理數(shù)據(jù)處理的簡(jiǎn)要過(guò)程1、全面核查問(wèn)卷上的數(shù)據(jù)2、對(duì)問(wèn)卷上的回答進(jìn)行編碼3、將數(shù)據(jù)錄入計(jì)算機(jī)4、詳細(xì)審核、插補(bǔ)5、進(jìn)行離群值的檢測(cè)6、將數(shù)據(jù)儲(chǔ)存在數(shù)據(jù)庫(kù)中15數(shù)據(jù)發(fā)布與數(shù)據(jù)分析調(diào)查報(bào)告統(tǒng)計(jì)表和統(tǒng)計(jì)圖數(shù)據(jù)分析保密和泄密控制16抽樣設(shè)計(jì)的理論和方法抽樣調(diào)查中的一些基本概念 總體和樣本總體和樣本:總體是指研究對(duì)象的全體,它是由研究對(duì)象中的單元組成的??傮w中單元的數(shù)目稱作總體容量;樣本是指抽樣時(shí)按照抽樣的規(guī)則所抽中的那部分單元所組成的集合。總體抽取樣本推斷總體樣本17研究

5、的目標(biāo)參數(shù):研究的目標(biāo)參數(shù): 總體總量、總體均值、總體比例的估計(jì)及其相應(yīng)的方差估計(jì)入樣概率與抽樣比入樣概率與抽樣比入樣概率是指某個(gè)總體單元被選入樣本的概率抽樣比:指樣本量 n 與總體的容量N的比例下面介紹主要抽樣方法與相應(yīng)的估計(jì)方法:18(一)簡(jiǎn)單隨機(jī)抽樣(一)簡(jiǎn)單隨機(jī)抽樣 定義:設(shè)總體中有N個(gè)單元,不加條件從中隨機(jī)抽取n個(gè)單元為樣本,每個(gè)單元都有同樣的概率被抽中的抽樣方法。 總體總量和總體均值 (1) 與 (2) NiiYY1NiiyNNYY1119樣本均值 (3)總體均值和總量的估計(jì) (4) (5) niiyny11niiynyY11niiynNyNY120估計(jì)量的方差 (6) 而 (7)

6、估計(jì)量的方差估計(jì) (8) (9),1 ()(2fnSyV212)(11NiiYYNS)1 ()(2fnsyv212)(11niiyyns21簡(jiǎn)單隨機(jī)抽樣的特點(diǎn)簡(jiǎn)單隨機(jī)抽樣的特點(diǎn)優(yōu)點(diǎn): (1)比較容易理解和掌握;(2)抽樣框不需要其他輔助信息;(3)理論上比較成熟,有現(xiàn)成的方差估計(jì)公式。缺點(diǎn): (1)沒(méi)有利用輔助信息;(2)樣本分散,面訪費(fèi)用較高;(3)有可能抽到較差的樣本;(4)抽選大樣本比較費(fèi)時(shí)22(二)分層抽樣(二)分層抽樣 定義:在抽樣之前將總體分為同質(zhì)的、互不重疊的若干子總體,也稱為層。然后在每一個(gè)層獨(dú)立地隨機(jī)抽取樣本。 分層抽樣示意圖23首先介紹分層抽樣的的一些符號(hào):用下標(biāo)h表示層的

7、編號(hào)用 分別表示總體和樣本中第h層第i個(gè)單元指標(biāo)值;用 表示h層的層權(quán)用 表示h層的抽樣比分別表示h層(總體)均值與樣本均值;), 2 , 1(LhhihiyY ,NNWhh/hhhNnf/hnihihhNihihnyyNYYhh/,/11) 1/()(),1/()(212212hnihhihhNihhihnyysNYYShh24分別為h層的(層內(nèi))方差和樣本方差下面介紹分層抽樣適用的場(chǎng)合和優(yōu)點(diǎn)1)在調(diào)查中不僅需要對(duì)總體進(jìn)行參數(shù)估計(jì),也需要對(duì)層的參數(shù)進(jìn)行估計(jì)。2)使樣本更具代表性。3)便于組織管理和數(shù)據(jù)匯總4)對(duì)不同層可以按照不同情況和條件,具體采用不同的抽樣方法。5)分層抽樣可以提高估計(jì)量的

8、精度估計(jì)量及其性質(zhì)估計(jì)量及其性質(zhì)25總體均值的估計(jì) (10)對(duì)分層隨機(jī)抽樣,有如下簡(jiǎn)單估計(jì) (11)總體總和的簡(jiǎn)單估計(jì)為 (12)無(wú)偏性:如果層的估計(jì)具有無(wú)偏性,分層的總體總量和總體均值的估計(jì)具有無(wú)偏性。對(duì)分層隨機(jī)抽樣, 的一個(gè)無(wú)偏估計(jì)為hLhhhLhhstYNNYWY111LhhhLhhhstyNNyWy111hLhhststyNyNY1)(styV26 (13) 分層抽樣的缺點(diǎn): (1)對(duì)抽樣框的要求比較高,必須有分層的輔助信息;(2)收集或編制抽樣框的費(fèi)用比較高;(3)若調(diào)查變量與分層的變量不相關(guān),效率可能降低;(4)估計(jì)值的計(jì)算比簡(jiǎn)單隨機(jī)抽樣復(fù)雜LhhhLhhhhhLhhhhstNsW

9、nsWfnsWyv12122122)1 ()(27比估計(jì)和回歸估計(jì)利用輔助信息比估計(jì)和回歸估計(jì)主要是利用輔助變量來(lái)提高估計(jì)精度比估計(jì)及其基本性質(zhì)如果 之間大致呈正比例關(guān)系,采用比估計(jì)量對(duì)簡(jiǎn)單隨機(jī)抽樣,總體均值和總量的比估計(jì)量為 (14) (15)有時(shí)候,調(diào)查的目的是要估計(jì)總體 與 的比值:iiXY ,;XxyXxyyR;RRyNXxyXxyYYX28 (16)對(duì)它的估計(jì)為 (17)基本性質(zhì)對(duì)于簡(jiǎn)單隨機(jī)抽樣,當(dāng)樣本量大時(shí)XYXYRxyxyR.1)(1)(;1)()1 ()(;1)(1)(;)(,)(,)(12212212NRXYXxfRVNRXYnfNYVNRXYnfyVRREYYEYyENii

10、iNiiiRNiiiRRR29對(duì)于實(shí)際問(wèn)題的方差估計(jì),仍用樣本估計(jì),用 (18)估計(jì) 。對(duì)分層抽樣,比估計(jì)有分別比和聯(lián)合比兩種形式。回歸估計(jì)及其基本性質(zhì)回歸估計(jì)及其基本性質(zhì)對(duì)簡(jiǎn)單隨機(jī)抽樣,總體均值的回歸估計(jì)定義為 (19)若回歸系數(shù)設(shè)定,則回歸估計(jì)為無(wú)偏估計(jì),且其方差估計(jì)可表示為 (20)如回歸系數(shù)為1,稱為差估計(jì)量。21)(11niiixRyn21)(11NiiiRXYN),()(XxyxXyylr)2(1)(222yxxylrsssnfyv30如回歸估計(jì)量采用樣本回歸系數(shù) (21)則總體均值的回歸估計(jì)量為 (22)基本性質(zhì):當(dāng)樣本量較大時(shí),將相應(yīng)的樣本估計(jì)量代入上式,得相應(yīng)的樣本估計(jì)。對(duì)分

11、層抽樣,有相應(yīng)的分別回歸估計(jì)和聯(lián)合回歸估計(jì)。niiniiixxxxyyb121)()(),()(XxbyxXbyylr)1()1()1 (1)()1()(2/322nOnOSnfyMSEnOYyEylrlr31(三)與單元大小成比例的概率抽樣1、定義:根據(jù)單元的大小不同,入樣概率不同的一種不等概率抽樣。如農(nóng)場(chǎng)的大小不同,其抽選概率可以根據(jù)面積大小成比例,也可以按人數(shù)多少成比例。用英文的字頭簡(jiǎn)稱為PPS抽樣。2、優(yōu)缺點(diǎn):優(yōu)點(diǎn)是當(dāng)研究的變量與單元大小有關(guān)時(shí),由于使用了輔助信息,可以提高抽樣效率。但缺點(diǎn)是對(duì)抽樣框需要有高質(zhì)量的抽樣框,成本較高;對(duì)于單元大小不相關(guān)的變量就不適用;估計(jì)量的抽樣方差估計(jì)比

12、較復(fù)雜。32pps抽樣是一種特殊的不等概率抽樣,對(duì)放回地不等概率抽樣,介紹Hansen-Hurvitz估計(jì)量。若 是按 的入樣概率進(jìn)行的多項(xiàng)抽樣抽取的樣本指標(biāo)值,相應(yīng)的 值為 。則總體總和的估計(jì)(Hansen-Hurvitz估計(jì))為 (23) 是無(wú)偏的,且有方差估計(jì) (24)對(duì)不放回地不等概率抽樣,采用Horvitz-Thompson估計(jì)量nyyy,21iZiZnzzz,21niiiHHzynY1121)() 1(1)(niHHiiHHYzynnYvniiiHTynY1133(四)整群抽樣 1、定義:由若干個(gè)有聯(lián)系的基本單元組成的集合稱為群,抽樣時(shí)以群為抽樣單元的抽樣方法就稱為整群抽樣。 整群

13、抽樣示意圖:黃色為總體紅色為群白點(diǎn)為基本單元34整群抽樣的優(yōu)點(diǎn): (1)能大大減低收集數(shù)據(jù)的費(fèi)用;(2)當(dāng)總體單元自然形成的群時(shí),容易取得抽樣框,抽樣也更容易;(3)當(dāng)群內(nèi)單元差異大,而不同群之間的差異小時(shí),可以提高效率。缺點(diǎn): (1)若群內(nèi)個(gè)單元有趨同性,效率將會(huì)降低;(2)通常無(wú)法預(yù)先知道總樣本量,因?yàn)椴恢廊簝?nèi)有多少單元;(3)方差估計(jì)比簡(jiǎn)單隨機(jī)抽樣更為復(fù)雜可以綜合利用分層和整群抽樣技術(shù),采取分層整群抽樣,比如人體尺寸調(diào)查,采用分層提高樣本代表性,采用整群抽樣,便于數(shù)據(jù)的收集。35總體(五)多階抽樣(五)多階抽樣 定義:它是由兩個(gè)或更多個(gè)連續(xù)的階段抽取樣本的方法。 多階抽樣示意圖:第一階

14、樣本最終樣本36優(yōu)點(diǎn): (1)當(dāng)群具有同質(zhì)性時(shí),多階抽樣的效率高于整群抽樣;(2)樣本的分布比簡(jiǎn)單隨機(jī)抽樣集中,采用面訪可以節(jié)約時(shí)間和費(fèi)用;(3)不需要整個(gè)總體單元的名錄框,只要群的名錄框和抽中群的單元名錄框。缺點(diǎn): (1)效率不如簡(jiǎn)單隨機(jī)抽樣;(2)通常不能提前知道最終的樣本量;(3)調(diào)查的組織較整群抽樣復(fù)雜;(4)估計(jì)值與抽樣方差的計(jì)算較為復(fù)雜。37定義:又稱等距抽樣,對(duì)研究的總體按一定的順序排列,每隔一定的間隔抽取一個(gè)單元的抽樣方法。 抽選方法:設(shè)總體單元數(shù)為N,要抽n個(gè)單元為樣本,先計(jì)算抽樣間隔k=N/n,在1到k之間抽取一個(gè)隨機(jī)起點(diǎn)r,則被抽中單元的順序位置是:r,r+k,r+2k,

15、。當(dāng)N不能被n整除時(shí),采用圓形系統(tǒng)抽樣方法。(六)系統(tǒng)抽樣382、系統(tǒng)抽樣的優(yōu)點(diǎn)(1)沒(méi)有抽樣框時(shí)可代替簡(jiǎn)單隨機(jī)抽樣方法簡(jiǎn)單;(2)不需要輔助的抽樣框信息;(3)樣本的分布比較好;估計(jì)值容易計(jì)算。 3、系統(tǒng)抽樣的缺點(diǎn) (1)若抽樣間隔與總體的某種周期性變化一致,會(huì)得一個(gè)差的樣本;(2)不使用輔助信息使抽樣效率不高;(3)使用概念框時(shí),不能預(yù)先知道樣本量;(4)沒(méi)有一個(gè)無(wú)偏的方差估計(jì)量;(5)當(dāng)N不能被n整除時(shí)會(huì)得到樣本量不同的樣本。 我們國(guó)家的國(guó)家統(tǒng)計(jì)局的調(diào)查多采用系統(tǒng)抽樣,它便于操作。39定義:在同一個(gè)抽樣框內(nèi),先抽一個(gè)大樣本,收集基本的信息,然后在這個(gè)大樣本中再抽一個(gè)子樣本,收集調(diào)查的詳細(xì)

16、信息。 多相抽樣示意圖:(七)多相抽樣(七)多相抽樣。第一相樣本第二相樣本。40優(yōu)點(diǎn):(1)利用了第一相樣本的信息,能顯著提高估計(jì)值的精度;(2)適用于某些調(diào)查指標(biāo)的數(shù)據(jù)收集費(fèi)用特別高或給被調(diào)查者帶來(lái)較重負(fù)擔(dān)的情況。缺點(diǎn): (1)整個(gè)調(diào)查的時(shí)間要長(zhǎng);(2)調(diào)查費(fèi)用要比較高;(3)調(diào)查的組織比較復(fù)雜;(4)估計(jì)值和抽樣誤差的計(jì)算會(huì)相當(dāng)復(fù)雜。41主要的抽樣方法,大致就有上述幾種,在實(shí)際中采用哪種抽樣設(shè)計(jì),要根據(jù)具體情況,靈活掌握,當(dāng)然也可以組合起來(lái)使用。抽樣方案和參數(shù)估計(jì)是一體的,所以在抽樣設(shè)計(jì)時(shí)要考慮到后續(xù)的數(shù)據(jù)處理。42參考書目馮士雍,施錫輇. 抽樣調(diào)查理論、方法與實(shí)踐. 上海科學(xué)技術(shù)出版社,

17、1996.馮士雍,倪加勛,鄒國(guó)華. 抽樣調(diào)查理論與方法, 中國(guó)統(tǒng)計(jì)出版,1998.加拿大統(tǒng)計(jì)局調(diào)查技能項(xiàng)目組編,中國(guó)國(guó)家統(tǒng)計(jì)局調(diào)查技能項(xiàng)目組譯,馮士雍(審校).調(diào)查技能教程,中國(guó)統(tǒng)計(jì)出版社, 2002.趙民德,謝邦昌. 探索真相,中國(guó)統(tǒng)計(jì)出版,2001.胡健穎,孫山澤,抽樣調(diào)查的理論和方法,北京大學(xué)出版社,2000. 柯惠新,丁立宏,市場(chǎng)調(diào)查與分析,中國(guó)統(tǒng)計(jì)出版社,2000.梁小筠,祝大平.抽樣調(diào)查的方法和原理,華東師范大學(xué)出版社,1994.43我的一些工作:一、可靠性方面1.Dan Yu and Jun yang, Storage reliability evaluation of comp

18、lex repairable system, Proceeding of East Asian Symposium on Statistics, 2002.11。2、楊軍,于丹. 一種基于可用度的裝備貯存模型及其應(yīng)用,系統(tǒng)工程理論與實(shí)踐,2004.7。3、楊軍,于丹.修如舊模型中貯存系統(tǒng)備件量的計(jì)算及其置信區(qū)間,中國(guó)科學(xué)院研究生院學(xué)報(bào),2004.10。4、于丹,楊軍.復(fù)雜系統(tǒng)貯存可靠性綜合評(píng)估,中國(guó)電子學(xué)會(huì)論文集可靠性分會(huì)第十二屆學(xué)術(shù)年會(huì)論文選,2004.10。445、Jun Yang(speaker), Dan Yu. One kind of Composite Repairable Model and its Availability Fiducial Inference,The Joint Meeting of CS

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論