抽樣技術(shù)調(diào)查分析師概念_第1頁
抽樣技術(shù)調(diào)查分析師概念_第2頁
抽樣技術(shù)調(diào)查分析師概念_第3頁
抽樣技術(shù)調(diào)查分析師概念_第4頁
抽樣技術(shù)調(diào)查分析師概念_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、目錄第一章 預(yù)備知識(shí)第二章 基本概念第三章 簡單隨機(jī)抽樣第四章 分層隨機(jī)抽樣第五章 不等概率抽樣第六章 多階段抽樣第七章 整群抽樣第八章 系統(tǒng)抽樣第九章 非概率抽樣第一章 預(yù)備知識(shí)作為抽樣技術(shù)的基礎(chǔ)知識(shí)或預(yù)備知識(shí),本章簡要地介紹調(diào)查原理、排列組合、概率統(tǒng)計(jì)等方面的有關(guān)知識(shí)。一、調(diào)查概論調(diào)查的重要性:有利于制定政策、投資決策、科學(xué)研究、機(jī)構(gòu)管理以及司法實(shí)踐等;與此同時(shí),許多學(xué)科的進(jìn)步和發(fā)展也同樣離不開調(diào)查。(一) (一)  調(diào)查本質(zhì)上是一種測(cè)量活動(dòng)測(cè)量活動(dòng)具有6個(gè)要素:測(cè)量主體、測(cè)量客體、測(cè)量對(duì)象、測(cè)量法則、測(cè)量工具、測(cè)量結(jié)果(數(shù)字/符號(hào))。測(cè)量得到的數(shù)據(jù)大體分為三種類型:分類型數(shù)據(jù)、

2、順序型數(shù)據(jù)以及數(shù)值型數(shù)據(jù)。測(cè)量的方法分為:直接測(cè)量和間接測(cè)量。(二) (二)  真值、測(cè)量值與誤差 誤差公理:任何調(diào)查結(jié)果都可能具有誤差,而且誤差始終存在于一切科學(xué)試驗(yàn)和調(diào)查過程中。根據(jù)誤差的來源分類:調(diào)查主體誤差、調(diào)查客體誤差、調(diào)查工具誤差、調(diào)查法則誤差、調(diào)查環(huán)境誤差。 誤差公理:任何調(diào)查結(jié)果都可能具有誤差,而且誤差始終存在于一切科學(xué)試驗(yàn)和調(diào)查過程中。根據(jù)誤差的來源分類:調(diào)查主體誤差、調(diào)查客體誤差、調(diào)查工具誤差、調(diào)查法則誤差、調(diào)查環(huán)境誤差。根據(jù)誤差的性質(zhì)分類:系統(tǒng)誤差、隨機(jī)誤差和粗大誤差。根據(jù)誤差的計(jì)量尺度分類:絕對(duì)誤差和相對(duì)誤差。絕對(duì)誤差、(調(diào)查)估計(jì)值x以及

3、真實(shí)值之間的關(guān)系:x-。相對(duì)誤差r、絕對(duì)誤差以及真實(shí)值之間的關(guān)系:r=/。實(shí)際常用的真值分類:理論真值、約定真值以及相對(duì)真值。 實(shí)際常用的測(cè)量值分類:單次測(cè)量值、算術(shù)平均值、加權(quán)平均值、中位數(shù)和眾數(shù)。 (三) (三)  信度、效度與精度信度表示測(cè)量結(jié)果中的隨機(jī)誤差大小的程度。信度的表示方法:測(cè)量值的方差(或標(biāo)準(zhǔn)差)或者樣本平均數(shù)的方差(或標(biāo)準(zhǔn)差)。 衡量信度的三種方法:再測(cè)信度、復(fù)本信度和折半信度。 衡量信度的三種方法;再測(cè)信度、復(fù)本信度和折半信度。效度表示測(cè)量結(jié)果中的系統(tǒng)誤差大小的程度,是測(cè)量結(jié)果的“有效性” 的反映。效度分類:內(nèi)容效度、準(zhǔn)則

4、效度和結(jié)構(gòu)效度。效度含義:(1)測(cè)量的特征即為研究的目標(biāo)特征;(2)該特征被準(zhǔn)確地測(cè)量。 效度的表示方法:B()=-或者B(E)=E-。 精度是信度與效度的綜合,但它還與信度與效度之外的因素有關(guān)。 精度的表示方法:均方誤差MSE()=V()+ 效度的表示方法:或者。精度表示信度與效度的綜合,但它還與信度與效度之外的因素有關(guān)。精度的表示方法:均方誤差信度、效度與精度之間的關(guān)系:對(duì)于測(cè)量或調(diào)查來說,信度高的效度未必高,反過來效度高的信度未必高,但精度高的信度和效度肯定高。二、排列組合(一) (一)  兩條基本原理加法原理和乘法原理。(二) (二)&

5、#160; 排列排列的分類:選排列與全排列、允許重復(fù)的排列。選排列與全排列之間的關(guān)系:全排列是選排列的一種特殊情形()。選排列與全排列中的元素是互不相同的。允許重復(fù)的排列中的元素可能重復(fù)出現(xiàn)多次。(三) (三)  組合組合與排列的差異:組合只與元素有關(guān),而與元素的順序無關(guān);排列不僅與元素有關(guān),而且與元素的順序有關(guān)。組合的性質(zhì):(1);(2),三、概率統(tǒng)計(jì)中的一些基本問題(一) (一)  大數(shù)定律大數(shù)定律的重要作用:奠定了用樣本來估計(jì)總體的理論基礎(chǔ)。幾種大數(shù)定律:契比雪夫大數(shù)定律、貝努里大數(shù)定律以及辛欽大數(shù)定律。契比雪夫大數(shù)定律證明了當(dāng)無限增加時(shí),個(gè)隨機(jī)變量的算術(shù)平均將會(huì)幾乎

6、變成一個(gè)常數(shù)。貝努里大數(shù)定律證明了隨著試驗(yàn)次數(shù)無限增大,事件發(fā)生的頻率可以無限接近它發(fā)生的概率。貝努里大數(shù)定律是辛欽大數(shù)定律的特殊情況。辛欽大數(shù)定律證明了在無限增大時(shí),樣本均值會(huì)無限接近總體的數(shù)學(xué)期望。(二) (二)  中心極限定理中心極限定理的重要作用:奠定了用樣本估計(jì)量對(duì)總體參數(shù)進(jìn)行區(qū)間估計(jì)的理論基礎(chǔ)。中心極限定理的思想:不論總體服從何種分布,只要方差有限,在觀察值足夠多時(shí),許多估計(jì)量的抽樣分布,就趨向正態(tài)分布。根據(jù)限制條件的不同可以分成:列維林德伯格中心極限定理和李雅普諾夫定理。列維林德伯格中心極限定理要求隨機(jī)變量獨(dú)立且同分布;李雅普諾夫定理僅要求隨機(jī)變量相互獨(dú)立,但無需服從同

7、一分布。(三) (三)  參數(shù)估計(jì)原理參數(shù)估計(jì)分為:點(diǎn)估計(jì)和區(qū)間估計(jì)。點(diǎn)估計(jì)思想:構(gòu)造一個(gè)適當(dāng)?shù)慕y(tǒng)計(jì)量,用它的觀察值來估計(jì)未知參數(shù)。構(gòu)造點(diǎn)估計(jì)量的方法:矩估計(jì)法和極大似然估計(jì)法。衡量估計(jì)量優(yōu)劣的標(biāo)準(zhǔn):無偏性、有效性和一致性。區(qū)間估計(jì)的思想:對(duì)于未知參數(shù),除了求出它的點(diǎn)估計(jì)外,同時(shí)還估計(jì)出一個(gè)范圍,并給出此區(qū)間包含參數(shù)真值的可信程度。第二章 基本概念基本內(nèi)容在學(xué)習(xí)各種抽樣方法之前,先了解一下抽樣調(diào)查中所涉及到的基本概念。一、抽樣調(diào)查與非抽樣調(diào)查調(diào)查分類:(1) (1)      根據(jù)“調(diào)查是否針對(duì)總體的所有單元”進(jìn)行分類:全面調(diào)查和非全

8、面調(diào)查。(2) (2)      根據(jù)“單元是否按照一定的概率入樣”進(jìn)行分類:概率抽樣調(diào)查和非概率抽樣調(diào)查。非全面調(diào)查相對(duì)于全面調(diào)查的優(yōu)點(diǎn):(1)時(shí)間短速度快;(2)費(fèi)用少成本低;(3)調(diào)查結(jié)果比較準(zhǔn)確;(4)應(yīng)用范圍廣泛。概率抽樣的分類:(1) (1)      根據(jù)“單元的入樣概率是否相等”進(jìn)行分類:等概率抽樣和不等概率抽樣。 (2)根據(jù)“具體的抽樣方式”進(jìn)行分類:簡單隨機(jī)抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多階段抽樣等等。 概率抽樣的優(yōu)點(diǎn):(1) (1) &#

9、160;    能夠保證樣本的代表性,避免人為因素的干擾;(2) (2)      用概率抽樣取得的樣本去估計(jì)總體特征時(shí),可以對(duì)由抽樣產(chǎn)生的抽樣誤差進(jìn)行估計(jì)。非概率抽樣的分類: (1)按照“具體的抽樣方式”進(jìn)行分類:判斷抽樣、便利抽樣、自愿樣本、滾雪球抽樣、配額抽樣等。 (2)判斷抽樣包括典型調(diào)查和重點(diǎn)調(diào)查這兩種取樣方式。非概率抽樣的缺點(diǎn):(1) (1)      難以評(píng)價(jià)樣本的代表性。(2) (2)    

10、;  無法估計(jì)抽樣誤差。(3) (3)      偏倚往往較大。二、總體與樣本(一) (一)  總體 總體分為:目標(biāo)總體和實(shí)際總體。目標(biāo)總體是研究目標(biāo)所針對(duì)的總體;實(shí)際總體是實(shí)際調(diào)查時(shí)所針對(duì)的有限的、具體的總體。 總體與個(gè)體:總體是個(gè)體的集合,個(gè)體是構(gòu)成對(duì)應(yīng)總體的單元。一切構(gòu)成總體的個(gè)體或子總體泛稱為總體單元,其中個(gè)體稱為基本單元。基本單元是總體里最小的、不可再分的單元。  (二) (二)  抽樣框與抽樣單元包含所有抽樣單元的總體稱為抽樣框,構(gòu)成抽樣框的單元稱為抽樣單元。抽樣

11、框的形式:名單、手冊(cè)、地圖、數(shù)據(jù)包等等。抽樣框的要求:(1)抽樣框必須是有序的,即抽樣單元必須編號(hào),且根據(jù)某種順序進(jìn)行了排列。(2)抽樣框中包含的抽樣單元?jiǎng)?wù)必要“不重不漏”,否則將出現(xiàn)抽樣框誤差。抽樣單元分級(jí): 初級(jí)單元次級(jí)單元三級(jí)單元四級(jí)單元基本抽樣單元。 (三) (三)  抽樣與樣本樣本是抽樣的結(jié)果從總體全部單元中選出的部分單元,其全體稱為樣本總體,簡稱樣本。樣本由樣本點(diǎn)(抽樣單元)構(gòu)成。根據(jù)樣本抽取方法的不同,可以將抽樣分為全樣本抽取和逐個(gè)抽取。全樣本抽取和逐個(gè)無放回抽取是等價(jià)的。 三、總體特征與估計(jì)量(一) (一)  總體特征 

12、;總體特征與總體的關(guān)系:總體是調(diào)查的客體,而總體特征是總體某個(gè)特征或?qū)傩缘臄?shù)量表現(xiàn) 通常的總體特征有4種:(1)總體總值;(2)總體均值;(3)總體比例;(4)總體比率??傮w總值、總體均值、總體比例三者是統(tǒng)一的,它們都可以用總體均值來表示。(二) (二)  估計(jì)量和估計(jì)方法估計(jì)量是從樣本的個(gè)單元計(jì)算出的對(duì)總體特征的估計(jì)。估計(jì)量是隨機(jī)變量。估計(jì)方法:最常見的估計(jì)方法是簡單線性估計(jì),除此之外,還可以借助于輔助變量。輔助變量必須滿足的兩個(gè)條件:(1)與要估計(jì)的變量高度相關(guān);(2)其總體信息已知。(三) (三)  抽樣分布 抽樣分布:對(duì)一個(gè)固定的總體,在確定的樣

13、本設(shè)計(jì)和樣本量的條件下,估計(jì)量的所有可能取值及其出現(xiàn)概率的序列就是該估計(jì)量的抽樣分布。 抽取的樣本越多,所得到的頻率分布圖就越接近于估計(jì)量的真實(shí)分布抽樣分布。 抽樣分布的漸進(jìn)正態(tài)性:當(dāng)從一個(gè)比較大的總體N中抽取一個(gè)中等容量(30以上)的樣本時(shí),無論總體是何種分布,其樣本均值的抽樣分布都近似于正態(tài)分布。樣本量愈大,其愈接近正態(tài)。 四、誤差與精度抽樣調(diào)查中的誤差有兩類:抽樣誤差和非抽樣誤差。抽樣誤差可以進(jìn)行數(shù)量上的估計(jì),是本節(jié)研究重點(diǎn)。 控制非抽樣誤差的方法:嚴(yán)格調(diào)查程序、規(guī)范調(diào)查步驟、加強(qiáng)人員的培訓(xùn)和管理、合理地設(shè)計(jì)問題和答卷、改進(jìn)測(cè)量方法和工具。

14、0;(一) (一)  均方誤差和偏倚均方誤差是估計(jì)量誤差平方的期望=。偏倚是估計(jì)量的期望與參數(shù)真值之間的差異:。均方誤差、方差及偏倚之間的關(guān)系:=。(二) (二)  置信區(qū)間與誤差限置信區(qū)間:設(shè)為標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)分位數(shù),則置信水平為的近似置信區(qū)間可以寫成:,其中為的標(biāo)準(zhǔn)差,需要利用樣本數(shù)據(jù)進(jìn)行估計(jì)。誤差限可以分為:絕對(duì)誤差限和相對(duì)誤差限。絕對(duì)誤差限和相對(duì)誤差限之間的轉(zhuǎn)換關(guān)系:。(三) (三)  費(fèi)用與效率 調(diào)查的費(fèi)用是一個(gè)與樣本量有關(guān)的函數(shù),最簡單的是線性費(fèi)用函數(shù)。增大樣本量可以提高估計(jì)量的精度,但與此同時(shí)調(diào)查的費(fèi)用也加大了。 效率是指以最小

15、的費(fèi)用達(dá)到要求的精度或者在給定費(fèi)用的情況下達(dá)到最大的精度。五、幾種基本的抽樣方法 簡單隨機(jī)抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多階段抽樣分別適用于不同的場(chǎng)合以及不同的精度要求。在本書后面會(huì)有詳細(xì)介紹。 六、抽樣調(diào)查的具體實(shí)施步驟 實(shí)施步驟:(1)調(diào)查目標(biāo)確定;(2)抽樣框選擇;(3)抽樣設(shè)計(jì);(4)問卷設(shè)計(jì);(5)數(shù)據(jù)收集;(6)數(shù)據(jù)編碼和錄入;(7)審核與插補(bǔ);(8)參數(shù)估計(jì);(9)數(shù)據(jù)分析和調(diào)查結(jié)果的表述;(10)數(shù)據(jù)發(fā)布;(11)文檔。第三章 簡單隨機(jī)抽樣基本內(nèi)容隨機(jī)抽樣分為四種情形:放回有序、放回?zé)o序、不放回有序、不放回?zé)o序。簡單隨機(jī)抽樣分為:不放回簡單隨

16、機(jī)抽樣(SRSWOR)和放回簡單隨機(jī)抽樣(SRSWR)。一、簡單隨機(jī)抽樣理論簡單隨機(jī)抽樣有三個(gè)表述不同但卻等價(jià)的定義(定義3.1至定義3.3)。簡單隨機(jī)抽樣的抽取原則:(1)按隨機(jī)原則取樣;(2)每個(gè)抽樣單元被抽中的概率都是已知的或事先確定的;(3)每個(gè)抽樣單元被抽中的概率都是相等的。主要相關(guān)符號(hào):記號(hào)代表的含義總體中的單位總數(shù)樣本量抽樣比第個(gè)總體單元取值第個(gè)樣本單元取值總體均值樣本均值總體總量樣本總量二、參數(shù)估計(jì)量及其性質(zhì)常見的四個(gè)總體特征:(1)總體均值;(2)總體總值;(3)總體比例;(4)總體比率。(一) (一)  簡單估計(jì)量簡單隨機(jī)樣本的方差是總體方差的無偏估計(jì);簡單隨機(jī)樣

17、本的協(xié)方差是總體協(xié)方差的無偏估計(jì)。(1)總體均值簡單估計(jì)量:,且(無偏性)。估計(jì)量方差:的無偏估計(jì)量:。(2)總體總量簡單估計(jì)量:,且(無偏性)。估計(jì)量方差:的無偏估計(jì)量:。(3)總體比例 1 若總體中第個(gè)單元具有所研究的特征;令= 0 若總體中第個(gè)單元不具有所研究的特征簡單估計(jì)量:,且有(無偏性)。估計(jì)量的方差:的無偏估計(jì)量:。(4)總體比率簡單估計(jì)量:,且較大時(shí),(漸進(jìn)無偏性)。估計(jì)量的方差:當(dāng)較大時(shí),的估計(jì)量:當(dāng)較大時(shí),(二) (二)  比率估計(jì)量輔助變量特點(diǎn):(a)必須與主要變量高度相關(guān);(b)與主要變量之間的相關(guān)關(guān)系整體上相當(dāng)穩(wěn)定;(c)輔助變量的信息質(zhì)量更好,幫忙而不添亂

18、;(d)輔助變量的總體總值必須是已知的,或更容易獲得的。(1)總體均值比率估計(jì)量:,且較大時(shí),(漸進(jìn)無偏性)。估計(jì)量的方差:較大時(shí),的估計(jì)量:。(2)總體總量比率估計(jì)量:,且較大時(shí),(漸進(jìn)無偏性)。估計(jì)量的方差:較大時(shí),的估計(jì)量:。(三) (三)  回歸估計(jì)量輔助變量的特點(diǎn)與比率估計(jì)完全相同。簡單估計(jì)量與比率估計(jì)量都是回歸估計(jì)量的特例:當(dāng)時(shí),;當(dāng)時(shí),?;貧w估計(jì)量:若為常數(shù)(記為),則,的方差。的估計(jì)量為。使達(dá)到最小的,。對(duì)于簡單隨機(jī)抽樣,足夠大時(shí),。倘若待估參數(shù)為總體總量、總體比例或總體比率,可以根據(jù)上面總體均值估計(jì)量的結(jié)論推導(dǎo)出相關(guān)性質(zhì)。三、不同估計(jì)量的精度比較當(dāng)足夠大時(shí),由于非負(fù)

19、,所以回歸估計(jì)的結(jié)果一般好于簡單估計(jì)。當(dāng)不夠大時(shí),比率估計(jì)和回歸估計(jì)先天不足,此時(shí)不能認(rèn)為它們一定好于簡單估計(jì)。四、樣本量的確定影響樣本容量的因素:總體規(guī)模,(目標(biāo))抽樣誤差以及總體方差等等。抽樣誤差通常用置信度和絕對(duì)誤差限度替代:。樣本容量的確定公式:樣本容量的確定步驟:第一步:確定估計(jì)的精度水平;第二步:按照保守(即讓樣本容量寧大勿?。┰瓌t,對(duì)總體方差進(jìn)行預(yù)估;第三步:計(jì)算簡單隨機(jī)抽樣在回答率為100的條件下所需的初始樣本量;第四步:確定抽樣方式,并根據(jù)不同抽樣方式的設(shè)計(jì)效應(yīng)對(duì)樣本容量進(jìn)行調(diào)整;第五步:判定有效回答率,并根據(jù)有效回答率對(duì)樣本容量進(jìn)行再調(diào)整;第六步:在需要得到分組數(shù)據(jù)并對(duì)這些

20、分組數(shù)據(jù)的精度有事先約定或要求時(shí),應(yīng)分別計(jì)算各組所需樣本量,然后經(jīng)各組累計(jì)加總得到總體所需樣本量;第七步:仔細(xì)權(quán)衡費(fèi)用、時(shí)間、調(diào)查機(jī)構(gòu)擁有或可動(dòng)用的各種資源方面的限制,進(jìn)而確定最終的樣本量。預(yù)估的方法:(1)利用先前的調(diào)查結(jié)果和經(jīng)驗(yàn);(2)利用預(yù)調(diào)查或試調(diào)查的結(jié)果;(3)利用同類或相似或有關(guān)的二手?jǐn)?shù)據(jù)的結(jié)果;(4)利用某些理論上的結(jié)論;(5)利用富有經(jīng)驗(yàn)的專家之判斷。五、簡單隨機(jī)抽樣的實(shí)施簡單隨機(jī)抽樣的實(shí)施辦法:抽簽法、使用統(tǒng)計(jì)軟件直接抽取法以及隨機(jī)數(shù)法。產(chǎn)生隨機(jī)數(shù)的幾種方式:(1)使用計(jì)算器;(2)使用計(jì)算機(jī);(3)使用隨機(jī)數(shù)表;(4)使用隨機(jī)數(shù)骰子;(5)使用電子隨機(jī)數(shù)抽樣器。第四章 分層

21、隨機(jī)抽樣基本內(nèi)容引入分層隨機(jī)抽樣的原因:簡單隨機(jī)抽樣不太適合總體單元數(shù)比較大或者總體單元之間差異較大的情形。一、分層隨機(jī)抽樣理論相關(guān)概念:層、分層抽樣以及分層隨機(jī)抽樣。分層隨機(jī)抽樣的適用場(chǎng)合:“層內(nèi)差異小,層間差異大”。分層隨機(jī)抽樣相對(duì)于簡單隨機(jī)抽樣的優(yōu)點(diǎn):(1) (1)      可同時(shí)對(duì)子總體(層)進(jìn)行參數(shù)估計(jì);(2) (2)      便于依托行政管理機(jī)構(gòu)進(jìn)行組織和實(shí)施,同時(shí)還可以根據(jù)各層的不同特點(diǎn)采用不同的抽樣方式;(3) (3)     

22、; 樣本在總體中分布更加均勻;(4) (4)      可以提高參數(shù)估計(jì)的精度。主要相關(guān)符號(hào):記號(hào)代表的含義第層的層權(quán)第層的抽樣比第層第個(gè)總體單元的取值第層第個(gè)樣本單元取值第層的總體均值第層的樣本均值第層的總體總量第層的樣本總量二、參數(shù)估計(jì)量及其性質(zhì)常見的總體特征:(1)總體均值;(2)總體總值;(3)總體比例。注:下面凡是標(biāo)注“*”號(hào)的公式不需記憶,但要求能夠識(shí)別出來。(一) (一)  簡單估計(jì)量各層的樣本方差是該層總體方差的無偏估計(jì);各層的樣本協(xié)方差是該層總體協(xié)方差的無偏估計(jì)。(1)總體均值簡單估計(jì)量:,且(無偏性)。估計(jì)量的方差

23、:的無偏估計(jì)量:。(2)總體總量簡單估計(jì)量:,且(無偏性)。估計(jì)量的方差:的無偏估計(jì)量:。(3)總體比例簡單估計(jì)量:,且(無偏性)。估計(jì)量的方差:(*)的無偏估計(jì)量:(二) (二)  比率估計(jì)量(1)總體均值分別比估計(jì):分別比估計(jì)量:,各層的都較大時(shí),(漸進(jìn)無偏性)。估計(jì)量的方差:(*)的估計(jì)量:(*)聯(lián)合比估計(jì):聯(lián)合比估計(jì)量:,總樣本量較大時(shí),(漸進(jìn)無偏性)。估計(jì)量的方差:(*)的估計(jì)量:(*)(2)總體總量分別比估計(jì):分別比估計(jì)量:,各層的都較大時(shí),(漸進(jìn)無偏性)。估計(jì)量的方差:(*)的估計(jì)量:(*)聯(lián)合比估計(jì):聯(lián)合比估計(jì)量:,總樣本量較大時(shí),(漸進(jìn)無偏性)。估計(jì)量的方差:(*)

24、的估計(jì)量:(*)分別比估計(jì)與聯(lián)合比估計(jì)比較:當(dāng)每層的與是經(jīng)過原點(diǎn)的線性關(guān)系時(shí),。通常情況下,當(dāng)比率估計(jì)有效時(shí),除非,否則有。】選擇分別比估計(jì)還是聯(lián)合比估計(jì)的原則:如果各層都較大,同時(shí)各層的比率之間差異較大,則分別比估計(jì)優(yōu)于聯(lián)合比估計(jì);如果各層不夠大,或者各層的比率之間差異較小,則聯(lián)合比估計(jì)優(yōu)于分別比估計(jì)。(三) (三)  回歸估計(jì)量(1)總體均值分別回歸估計(jì):分別回歸估計(jì)量:各層的回歸系數(shù)事先給定時(shí):(無偏性)。估計(jì)量的方差:(*)的估計(jì)量:(*)當(dāng)時(shí),。各層的回歸系數(shù)不能事先設(shè)定時(shí):的估計(jì)值:當(dāng)各層的都較大時(shí),(漸進(jìn)無偏性)。當(dāng)各層的都較大時(shí),的方差近似為:。的估計(jì)量:(*)聯(lián)合回

25、歸估計(jì):聯(lián)合回歸估計(jì)量:事先給定時(shí):(無偏性)。估計(jì)量的方差:(*)的估計(jì)量:(*)當(dāng)時(shí),。不能事先設(shè)定時(shí):的估計(jì)值:(*)當(dāng)樣本量較大時(shí),(漸進(jìn)無偏性)。當(dāng)樣本量較大時(shí),的方差近似為:。的估計(jì)量:(*)(2)總體總量分別回歸估計(jì):分別回歸估計(jì)量:各層的回歸系數(shù)事先給定時(shí):(無偏性)。估計(jì)量的方差:(*)的估計(jì)量:(*)各層的回歸系數(shù)不能事先設(shè)定時(shí):的估計(jì)值:當(dāng)各層的都較大時(shí),(漸進(jìn)無偏性)。當(dāng)各層的都較大時(shí),的方差近似為:。的估計(jì)量:(*)聯(lián)合回歸估計(jì):聯(lián)合回歸估計(jì)量:事先給定時(shí):(無偏性)。估計(jì)量的方差:(*)的估計(jì)量:(*)不能事先設(shè)定時(shí):的估計(jì)值:(*)當(dāng)樣本量較大時(shí),(漸進(jìn)無偏性)。

26、當(dāng)樣本量較大時(shí),的方差近似為:。的估計(jì)量:(*)分別回歸估計(jì)與聯(lián)合回歸估計(jì)比較:最小方差之間的關(guān)系:,即當(dāng)和均取最優(yōu)值時(shí),分別回歸估計(jì)優(yōu)于聯(lián)合回歸估計(jì)。選擇分別回歸估計(jì)還是聯(lián)合回歸估計(jì)的原則:如果各層的樣本量不太小,而且各層的回歸系數(shù)之間的差異較大,采用分別回歸估計(jì)較為適宜;如果各層的樣本量不大,而且各層的回歸系數(shù)大致相同,采用聯(lián)合回歸估計(jì)較為適宜;如果各層的回歸系數(shù)差別不是太大,而且并不是每層的樣本量都相當(dāng)大,聯(lián)合回歸估計(jì)可能更保險(xiǎn)一些。三、各層樣本量的分配各層樣本量的分配方式:比例分配、最優(yōu)分配和奈曼分配。(一) (一)  比例分配各層樣本量的計(jì)算公式:估計(jì)量:(自加權(quán))估計(jì)量方

27、差:(二) (二)  最優(yōu)分配(費(fèi)用函數(shù)為:)各層樣本量的計(jì)算公式:估計(jì)量:估計(jì)量方差:(三) (三)  奈曼分配各層樣本量的計(jì)算公式:估計(jì)量:估計(jì)量方差:四、總樣本量的確定根據(jù)不同的精度要求以及不同的樣本量分配方式()來確定總樣本量。精度要求為方差上限時(shí):對(duì)于不同的樣本量分配方式,只需對(duì)做相應(yīng)的改變即可。不同精度要求之間的轉(zhuǎn)換關(guān)系:。五、分層隨機(jī)抽樣精度研究最優(yōu)分配、比例分配的分層隨機(jī)抽樣與相同樣本量的簡單隨機(jī)抽樣的精度之間的關(guān)系:下標(biāo)srs代表簡單隨機(jī)抽樣;下標(biāo)prop代表比例分配的分層隨機(jī)抽樣;下標(biāo)opt代表奈曼最優(yōu)分配的分層隨機(jī)抽樣。結(jié)論:當(dāng)各層均值之間的差異愈大,

28、則一般的分層(以比例分配為代表)的效益就愈高;當(dāng)各層的標(biāo)準(zhǔn)差相差較大時(shí),最優(yōu)分配又會(huì)比比例分配有更高的效益;當(dāng)各層的標(biāo)準(zhǔn)差之間的差別不大時(shí),最優(yōu)分配的效果不會(huì)比比例分配的效果好很多。六、分層隨機(jī)抽樣的實(shí)施由于分層隨機(jī)抽樣在各層內(nèi)采取的是簡單隨機(jī)抽樣,因此各層內(nèi)樣本的抽取方法可以參見簡單隨機(jī)抽樣的相關(guān)內(nèi)容。進(jìn)一步的問題是層的劃分及層數(shù)的確定。層的劃分:在實(shí)際項(xiàng)目當(dāng)中,層的劃分通常是按照單元的某個(gè)特征或標(biāo)識(shí)進(jìn)行的。關(guān)于分層界限的確定方法,讀者可以參考有關(guān)抽樣技術(shù)的教材。層數(shù)的確定:一些理論和實(shí)際研究表明,層數(shù)以不超過6為宜。第五章 不等概率抽樣基本內(nèi)容等概率抽樣的特點(diǎn):將總體(或?qū)樱┲械拿總€(gè)單元都

29、看作是平等的,不“偏向”也不“疏遠(yuǎn)”某些特定的單元。等概率抽樣的適用場(chǎng)合:總體單元之間的差異不是很大。不等概率抽樣的特點(diǎn):將總體中每個(gè)單元的入樣概率與其“規(guī)?!贝笮÷?lián)系起來,使得“大單元”被抽到的概率大,“小單元”被抽到的概率小。不等概率抽樣的適用場(chǎng)合:總體單元之間的差異較大。不等概率抽樣的優(yōu)點(diǎn):能夠大大提高抽樣精度,減少抽樣誤差。不等概率抽樣的局限性:必須具有能夠說明單元規(guī)模大小的輔助變量來確定各個(gè)單元的入樣概率或包含概率。不等概率抽樣分類:放回的不等概率抽樣(抽樣)和不放回的不等概率抽樣(抽樣)。一、放回的不等概率抽樣(抽樣)抽樣是放回的與規(guī)模大小成比例的概率抽樣()。放回的不等概率抽樣的

30、缺點(diǎn):個(gè)樣本里可能會(huì)有某個(gè)單元被多次抽中?;痉?hào):符號(hào)含義第個(gè)單元的規(guī)??傮w中所有單元的“大小”之和每次抽到第個(gè)單元的概率總體總量的漢森赫維茨估計(jì)量(一) (一)  樣本抽取方法多項(xiàng)抽樣是最簡單的不等概率抽樣,其實(shí)施方法有兩種:代碼法和拉希里(Lahili)法。(1) (1)代碼法實(shí)施程序(適合于不太大的情形):對(duì)總體的第個(gè)單元賦予個(gè)代碼;在之間產(chǎn)生一個(gè)隨機(jī)整數(shù),如果落在第個(gè)單元所包含的代碼數(shù)里,則第個(gè)單元入樣;如此進(jìn)行次抽取,就構(gòu)成了抽樣的樣本。(2) (2)拉希里(Lahili)法實(shí)施程序(適合于比較大的情形):令;分別產(chǎn)生兩個(gè)隨機(jī)數(shù),一個(gè)隨機(jī)數(shù)產(chǎn)生于中,另一個(gè)隨機(jī)數(shù)產(chǎn)生于中;

31、如果,則第個(gè)單元被抽中;如果,則重新抽??;反復(fù)進(jìn)行和兩項(xiàng)操作,直至抽滿個(gè)樣本為止。(二) (二)  漢森赫維茨(HansenHurwitz)估計(jì)量及其性質(zhì)總體總量的漢森赫維茨(HansenHurwitz)估計(jì)量:抽樣的漢森赫維茨(HansenHurwitz)估計(jì)量:的性質(zhì):(1)無偏性:;(2)方差:;(3)方差的無偏估計(jì)量:二、不放回的不等概率抽樣(抽樣)不放回不等概率抽樣的樣本不獨(dú)立,加大了抽樣實(shí)施、參數(shù)估計(jì)以及精度計(jì)算的難度。抽樣是不放回的與規(guī)模大小成比例的概率抽樣()。嚴(yán)格的抽樣只有當(dāng)時(shí)才有一些簡單的方法適用;當(dāng)時(shí),實(shí)施起來相當(dāng)復(fù)雜。基本符號(hào):符號(hào)含義第個(gè)單元被包含到樣本的概

32、率任意兩個(gè)單元同時(shí)包含到樣本的概率總體總量的霍維茨湯普森估計(jì)量(一) (一)  樣本抽取方法(1)逐個(gè)抽取法;(2)重抽法;(3)系統(tǒng)抽取法;(4)全樣本抽取法。(二) (二)  包含概率和的性質(zhì)(1)(2)(3)(三) (三)  霍維茨湯普森(Horvitz-Thompson)估計(jì)量及其性質(zhì)總體總量的霍維茨湯普森估計(jì)量:的性質(zhì):(1) (1)   若,則;(2) (2)   若,則若固定,則進(jìn)一步有:(3) (3)   若,則的無偏估計(jì)為:若固定,則有另外一個(gè)無偏估計(jì)量,即耶茨(Yates)-格倫迪(G

33、rundy)-森(Sen)估計(jì)量:(四) (四)  n2時(shí)的嚴(yán)格抽樣樣本抽取方法:布魯爾(Brewer)方法和德賓(Durbin)方法。(五) (五)  n > 2時(shí)的嚴(yán)格抽樣樣本抽取方法:水野( Midzuno )方法、布魯爾( Brewer )方法和拉奧( Rao )桑福特( Sampford )方法。第六章 多階段抽樣基本內(nèi)容多階段抽樣在抽樣調(diào)查中的應(yīng)用很廣泛,它使得抽樣在較大總體中進(jìn)行得以實(shí)現(xiàn)。本章重點(diǎn)講述二階段抽樣的概念、實(shí)施方法和估計(jì),目的是使我們基本掌握二階段抽樣的概念和估算方法,進(jìn)而推廣到更多階段的抽樣。本章主要討論的問題有:1.二階段抽樣的定義和特點(diǎn)

34、;2.參數(shù)估計(jì)量及其性質(zhì);3.樣本量的確定;4.三階段及多階段抽樣。一、多階段抽樣的定義和特點(diǎn)二階段抽樣的定義:假設(shè)總體由個(gè)初級(jí)單元組成,每個(gè)初級(jí)單元又由若干個(gè)二級(jí)(次級(jí))單元組成,若在總體中按一定的方法抽取個(gè)初級(jí)單元,對(duì)每個(gè)被抽中的初級(jí)單元再抽取若干二級(jí)單元進(jìn)行調(diào)查,這種抽樣被稱為二階段抽樣(two-stage sampling)。特殊情況:整群抽樣可以看作為多階段抽樣的特殊情形,即最后一階抽樣是100抽樣。特點(diǎn):(1) (1)      保持了一階整群抽樣樣本單元相對(duì)集中的特點(diǎn);(2) (2)    

35、  能夠充分發(fā)揮抽樣的效率,節(jié)省了人力和物力;(3) (3)      抽樣框可以分級(jí)準(zhǔn)備;(4) (4)      各個(gè)階段可以采用不同的抽樣方法。預(yù)備知識(shí):兩階(段)抽樣中,對(duì)于一個(gè)估計(jì)量的均值可表示為;方差可表示為。二、參數(shù)估計(jì)量及其性質(zhì)常見的總體特征:(1)總體均值;(2)總體總值;(3)總體比例。(一)初級(jí)單元大小相等時(shí)的估計(jì)(1)總體均值的估計(jì)總體均值的無偏估計(jì)為;估計(jì)量的方差:;的無偏估計(jì)量為:。(2)總體總值的估計(jì)總體總值的估計(jì)量:;方差的無偏估計(jì)量:。(3)總體比例的

36、估計(jì)總體比例的無偏估計(jì)為:;的方差:;的一個(gè)無偏估計(jì)為:。(二)分層二階段抽樣時(shí)的估計(jì)(1)總體均值的估計(jì)總體均值的分層二階估計(jì)量為:總體均值方差為:方差的無偏估計(jì)為:(2)總體總值的估計(jì)總體總值的估計(jì):總體總值方差為:方差的無偏估計(jì):(三)初級(jí)單元大小不等時(shí)的估計(jì)(1)不等概率(放回的)抽取初級(jí)單元時(shí)的估計(jì)總體總和的無偏估計(jì):總體總和方差:方差的無偏估計(jì)為:1)、自加權(quán)條件:(第二階段是簡單隨機(jī)抽樣)估計(jì)量可簡化為:;方差估計(jì)為2)、對(duì)初級(jí)單元進(jìn)行抽樣估計(jì)量可簡化為:若,則樣本是自加權(quán)的:,方差的無偏估計(jì)為:(2)按簡單隨機(jī)抽樣(不放回)抽取初級(jí)單元1)簡單估計(jì)量總體總和的簡單估計(jì)量:,且為

37、無偏的;總體總和的方差:;方差的無偏估計(jì)為:其中。自加權(quán)條件:第二階(段)抽樣比為一個(gè)常數(shù)時(shí)即,則估計(jì)量可簡化為:2)比率估計(jì)量為了減小方差,可以考慮采用比率估計(jì)量對(duì)總體總和估計(jì),輔助變量即采用初級(jí)單元的規(guī)模。總體總值的估計(jì)量為:近似均方誤差為:均方誤差的估計(jì):(3)按不等概率(不放回)抽樣初級(jí)單元采用不放回不等概抽樣時(shí),包含概率為、,則此時(shí)總體總和的二階估計(jì)可采用霍維茨湯普森(HorvitzThompson)估計(jì)量。總體總和的無偏估計(jì):方差:若是的一個(gè)無偏估計(jì),則方差的一個(gè)無偏估計(jì)為:如果固定,則無偏估計(jì)量:(4)二階段抽樣的總體比例的估計(jì)1)兩階段均采用等概抽樣,用比率估計(jì)的方法總體比例的

38、比率估計(jì)為:,其中總體比例的方差為:方差的無偏估計(jì)為:三、樣本量的確定(一)初級(jí)單元大小相等時(shí)最優(yōu)樣本量m與n的確定在抽取相等數(shù)量的次級(jí)單元的前提下,二階(段)抽樣的方差通常要小于整群抽樣的方差但是大于分層抽樣的方差。在實(shí)際應(yīng)用中,一個(gè)很重要的問題就是如何確定第一階樣本量和第二階樣本量,使估計(jì)量的方差達(dá)到最小,或在給定的方差的條件下,如何使費(fèi)用最省,即如何確定最優(yōu)抽樣比和的問題,就是要考慮費(fèi)用和精度的權(quán)衡問題??紤]最簡單的費(fèi)用函數(shù)線性費(fèi)用函數(shù),根據(jù)柯西施瓦茲(CauchySchawarz)不等式,最終得:,即的最優(yōu)值為:()確定后,根據(jù)給定的或就可以求出,從而確定了最優(yōu)的和。(二)初級(jí)單元大小

39、相等時(shí)分層二階段抽樣的最優(yōu)分配和的最佳選擇,即進(jìn)行分層抽樣時(shí)的最優(yōu)分配。仍考慮最簡單的線性費(fèi)用函數(shù),可得固定使達(dá)到極小或固定使達(dá)到極小的的最優(yōu)值為:()可以看出求最優(yōu)的公式與非分層抽樣中的公式是一致的。四、三階段抽樣及多階抽樣(一)各級(jí)單元大小相等時(shí)的三階段抽樣總體均值的無偏估計(jì):的方差:方差的無偏估計(jì):固定費(fèi)用下使方差達(dá)到最小或在指定精度下(固定方差)使最小的和的最優(yōu)值為:,與確定后即可根據(jù)總費(fèi)用或精度要求求出第一階樣本量。(二)各級(jí)單元大小不等時(shí)的三階段抽樣總體總和的無偏估計(jì)量:總體總和的方差:方差的無偏估計(jì):其中(三)多階段抽樣各級(jí)單元大小相等時(shí),根據(jù)求導(dǎo)三階(段)抽樣的過程及對(duì)比前面的

40、二階(段)抽樣,不難得出更高階抽樣的相應(yīng)結(jié)果,例如四階抽樣中,應(yīng)有:(1),其中:,(2)(3)是的一個(gè)無偏估計(jì)。第七章 整群抽樣基本內(nèi)容前面幾章提到抽取樣本單元時(shí),都是指組成總體的基本單元,即抽樣單元和入樣單元是一致的,而本章則主要討論抽樣單元和入樣單元不一致,即將子總體而非基本單元視為抽樣單元的方法整群抽樣(cluster sampling)來完成調(diào)查任務(wù),目的是使讀者掌握這一調(diào)查方法的特點(diǎn)和具體實(shí)施。重點(diǎn)討論以下幾個(gè)問題:1、整群抽樣的概述;2、參數(shù)估計(jì)量及其性質(zhì)。一、整群抽樣的概述(一)整群抽樣的定義設(shè)總體由個(gè)大單元即初級(jí)單元(primary unit)組成,每個(gè)初級(jí)單元又由若干個(gè)較小

41、的次級(jí)單元或二級(jí)單元(secondary unit)組成。首先從總體中按某種方式(不限于簡單隨機(jī)抽樣方式)抽取n個(gè)初級(jí)單元,然后抽出其中所包含的所有次級(jí)單元,構(gòu)成一個(gè)樣本。這種抽樣稱為整群抽樣(cluster sampling)。簡單來說,整群抽樣有三個(gè)步驟,第一步將總體劃分為若干群(初級(jí)單元),第二步以群為抽樣單元,從總體中抽取一部分群;第三步抽取中選群中的100次級(jí)單元(也自然是100的基本單元)構(gòu)成樣本。(二)整群抽樣的特點(diǎn)1、可以使用簡單的抽樣框。抽樣框的構(gòu)造相比于其他抽樣方法要容易、方便一些。2、實(shí)施調(diào)查便利,節(jié)省費(fèi)用。整群抽樣調(diào)查單元的分布相對(duì)集中,調(diào)查人員能節(jié)省大量來往于調(diào)查單元

42、間的時(shí)間和費(fèi)用。(三)適用場(chǎng)合可能適合整群抽樣的一些實(shí)例總體變量基本單元群或初級(jí)單元某個(gè)城市住戶特征住宅街區(qū)某個(gè)城市購買衣物人住宅機(jī)場(chǎng)旅游信息離開旅客人數(shù)航班高中就業(yè)計(jì)劃學(xué)生班級(jí)農(nóng)村社會(huì)態(tài)度成人村通過橋梁的年交通流量發(fā)車地和到達(dá)地機(jī)動(dòng)車40分鐘間隔城市土地所有者檔案稅務(wù)信息土地所有者分類臺(tái)帳的頁數(shù)健康保險(xiǎn)檔案醫(yī)療數(shù)據(jù)卡片連續(xù)10張卡片為一組 在某些特定場(chǎng)合,整群抽樣具有較高的精度,但是需要注意的是,雖然整群抽樣具有方便經(jīng)濟(jì)的明顯優(yōu)點(diǎn),但在樣本容量一定的情況下,整群抽樣也有抽樣誤差較大、精度較低的嚴(yán)重缺點(diǎn),但可以通過適當(dāng)增大樣本量的方法來得到彌補(bǔ)。二、參數(shù)估計(jì)量及其性質(zhì)常見的總體特征:

43、(1)總體均值;(2)總體總值;(3)總體比例。(一)群規(guī)模相等時(shí)的估計(jì)(1)總體均值的估計(jì)總體均值的簡單估計(jì)量為:,可以證明該估計(jì)是無偏估計(jì)量。方差為:方差的無偏估計(jì):(2)總體總值的估計(jì)總體總值的簡單估計(jì)量為:方差為:方差的無偏估計(jì)為:(3)總體比例的估計(jì)總體比例的估計(jì)量:,且為無偏的??傮w比例的方差:方差的無偏估計(jì):(二)群規(guī)模不等時(shí)的估計(jì)(1)對(duì)群進(jìn)行簡單隨機(jī)抽樣。1)簡單估計(jì)總體均值的簡單估計(jì)為:,有偏的;的方差估計(jì)為:。注意該方法適用于各群的規(guī)模差異不是很大時(shí)的整群抽樣。2)加權(quán)估計(jì)總體總和的估計(jì)為:,且為無偏的;方差為:的無偏估計(jì)為:3)比率估計(jì)考慮對(duì)總體均值采用以群大小為為輔助

44、變量的比率估計(jì)。的比率估計(jì)為:,有偏的,但當(dāng)大時(shí),偏倚很小,可看成是近似無偏的。方差近似為:方差的估計(jì):4)總體比例的估計(jì)總體比例的估計(jì)可采用:方差為:方差的估計(jì)為:(2)對(duì)群進(jìn)行不等概抽樣群的抽取是按與成比例的放回抽樣抽取的。總體總和的估計(jì)采用漢森赫維茨估計(jì)量:,且為無偏??傮w總和的方差為:方差的估計(jì):三、群內(nèi)相關(guān)系數(shù)和設(shè)計(jì)效應(yīng)群內(nèi)相關(guān)系數(shù)(interclass correlation coefficient)表示同一群內(nèi)不同次級(jí)或基本單元的變量值對(duì)總體均值的離差乘積的期望值與總體中所有次級(jí)或基本單元變量值對(duì)總體均值離差平方的期望值之比。整群抽樣的設(shè)計(jì)效應(yīng)為:,可知為了獲得同樣的精度,整群抽

45、樣的樣本量是簡單隨機(jī)抽樣的倍。第八章 系統(tǒng)抽樣基本內(nèi)容在實(shí)際的工作中,系統(tǒng)抽樣是一種被廣泛采用的抽樣方法。系統(tǒng)抽樣比簡單隨機(jī)抽樣易于操作,但是抽樣誤差的估計(jì)比較復(fù)雜,本章主要討論以下幾個(gè)問題:1、概念及實(shí)施方法;2、參數(shù)估計(jì)量及其性質(zhì)。一、系統(tǒng)抽樣的概念及實(shí)施方法(一)定義系統(tǒng)抽樣:設(shè)總體中的個(gè)單元按某種順序(通常是按某種規(guī)律排列,但也可以是隨機(jī)排列的)編號(hào)為。如抽樣程序是首先抽取一個(gè)或一組起始單元的編號(hào),然后按某種確定的規(guī)則選取其它單元的編號(hào),直到滿個(gè)為止,則這種抽樣稱為系統(tǒng)隨機(jī)抽樣,簡稱系統(tǒng)抽樣。等距抽樣:設(shè)總體中的個(gè)單元按某種順序(通常是按某種規(guī)律排列,但也可以是隨機(jī)排列的)編號(hào)為。如抽

46、樣程序是先按簡單隨機(jī)抽樣方式抽取一個(gè)起始單元的編號(hào),然后按照固定的間隔選取其它單元的編號(hào),直到滿個(gè)為止,則這種抽樣稱為等距系統(tǒng)抽樣,簡稱等距抽樣。直線等距抽樣:假設(shè)總體單元數(shù)為,樣本容量為,且總體中的個(gè)單元已按某種確定順序編號(hào)為。如抽樣程序時(shí)先從頭個(gè)單元編號(hào)中隨機(jī)抽出一個(gè)單元編號(hào),然后每隔個(gè)單元編號(hào)抽出一個(gè)單元編號(hào),直到抽出個(gè)單元編號(hào)為止,則這種等距抽樣稱為直線等距抽樣。圓形等距抽樣:假設(shè)總體單元數(shù)為,樣本容量為,總體中的個(gè)單元已按某種確定順序編號(hào)為,如將這些編號(hào)看成首尾相接的一個(gè)環(huán),并從1到中按簡單隨機(jī)抽樣方式抽取一個(gè)單元編號(hào)作為隨機(jī)起點(diǎn),然后每隔抽取一個(gè)單元編號(hào),直到抽滿個(gè)單元為止。則這種

47、等距抽樣稱為圓形等距抽樣 (二)實(shí)施方法直線等距抽樣的具體實(shí)施步驟可以歸納如下:(1) (1)      首先計(jì)算抽樣間距;(2) (2)      將個(gè)單元按某種順序依次編號(hào)為;(3) (3)      從個(gè)單元編號(hào)中隨機(jī)抽出一個(gè)單元編號(hào),假設(shè)為,(4) (4)      每隔個(gè)單元編號(hào)抽出一個(gè)單元編號(hào),直到抽出個(gè)單元。這樣最終抽出的樣本是由以下編號(hào)的單元組成的:。圓形等距抽樣與直線等

48、距抽樣的區(qū)別在于兩個(gè)方面,一是編號(hào)不是直線排列而是環(huán)狀(圓形)排列,二是隨機(jī)起點(diǎn)的選擇范圍由擴(kuò)展到。對(duì)于圓形等距抽樣,可以證明,入樣單元編號(hào)可表示為當(dāng)當(dāng)二、參數(shù)估計(jì)量及其性質(zhì)(一)在等概率情形下:(1)總體均值的估計(jì)的簡單估計(jì):,且當(dāng),是無偏估計(jì)量(2)估計(jì)量方差的表現(xiàn)形式:1)用樣本(群)內(nèi)方差表示的方差為:其中為“系統(tǒng)樣本”(群)內(nèi)方差。2)作為一種特殊的整群抽樣,且群的規(guī)模大小都相等的方差可表示為:,為樣本(群)內(nèi)相關(guān)系數(shù)。3)看作一種特殊的分層抽樣,則的方差可表示為:,為層內(nèi)方差,為同一系統(tǒng)樣本內(nèi)對(duì)層均值離差的相關(guān)系數(shù)。 (3)估計(jì)量方差的近似估計(jì)和改進(jìn)雖然有各種各樣的估計(jì)量

49、方差的理論公式,但難以得到抽樣估計(jì)量方差的無偏估計(jì)卻是系統(tǒng)抽樣的最大缺點(diǎn),下面分別針對(duì)幾種不同總體模型,介紹幾種近似估計(jì)方法。1)隨機(jī)排列情形2)趨勢(shì)排列情形當(dāng)較大時(shí)中括號(hào)里的內(nèi)容可忽略。3)未知排列情形(4)線性排列情形抽樣與估計(jì)的改進(jìn)1)中心位置法2)對(duì)稱(平衡)系統(tǒng)抽樣法3)Singh對(duì)稱系統(tǒng)抽樣4)首尾校正法 (二)不等概率情形總體總值的估計(jì):,且為無偏的;方差為:當(dāng)固定時(shí),則又可表示為:方差的估計(jì)依據(jù)不同處理方法可以得到不同的估計(jì)形式。第九章 非概率抽樣基本內(nèi)容抽樣分為概率抽樣和非概率抽樣,二者在抽樣調(diào)查中都是不可缺少的。本章主要討論非概率抽樣,重點(diǎn)在于討論和介紹若干常用的

50、非概率抽樣方法與概率抽樣方法的對(duì)應(yīng)關(guān)系,并藉此估計(jì)具體的某種非概率抽樣方法的估計(jì)精度,目的是使讀者對(duì)非概率抽樣方法有著一定的認(rèn)識(shí)。本章主要討論下面幾個(gè)問題:1、非概率抽樣的概念、適用場(chǎng)合以及具體的抽樣方法。2、非概率抽樣與概率抽樣的差異性與相似性,3、非概率抽樣中總體特征量的估計(jì)、樣本容量的確定和具體實(shí)施方法。一、非概率抽樣概述(一)非概率抽樣的概念和適用場(chǎng)合非概率抽樣是指抽樣時(shí)不遵循隨機(jī)原則,而是按照研究人員的主觀經(jīng)驗(yàn)或其它條件來抽取樣本的一種抽樣方法,也就是說在抽樣時(shí),總體單元的入樣概率事先未知,入樣與否與研究人員的經(jīng)驗(yàn)和主觀意志有很大關(guān)系。因此,非概率抽樣在應(yīng)用時(shí)更需研究人員具備深厚的背景知識(shí)與相關(guān)經(jīng)驗(yàn)。雖然概率抽樣的結(jié)果明顯優(yōu)于非概率抽樣,然而,由于實(shí)際中的調(diào)查沒有一個(gè)能嚴(yán)格匹配于經(jīng)典教科書的概率抽樣方法,因此實(shí)際應(yīng)用中通常將兩者結(jié)合使用,非概率抽樣是對(duì)概率抽樣的一個(gè)很好的補(bǔ)充。(二)具體的抽樣方法(1)便利抽樣(convenience sampling)又稱就近抽樣、偶遇抽樣(haphazard sampling)、自然抽樣、方便抽樣。具體來說,它是根據(jù)調(diào)查者的方便與否來抽取樣本的一種非概率抽樣方法。(2)判斷抽樣(judgment sampli

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論