第十章-其它抽樣方法技術(shù)課件_第1頁(yè)
第十章-其它抽樣方法技術(shù)課件_第2頁(yè)
第十章-其它抽樣方法技術(shù)課件_第3頁(yè)
第十章-其它抽樣方法技術(shù)課件_第4頁(yè)
第十章-其它抽樣方法技術(shù)課件_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十章其它抽樣方法技術(shù)第十章其它抽樣方法技術(shù)1本章要點(diǎn)本章主要對(duì)樣本輪換、雙重抽樣、隨機(jī)化裝置、交叉子樣本等抽樣技術(shù)原理、方法、特點(diǎn)及應(yīng)用條件進(jìn)行了較為全面的介紹。具體要求:掌握本章所介紹的幾種抽樣技術(shù)的特點(diǎn)及應(yīng)用條件,在抽樣實(shí)際工作中能夠正確運(yùn)用該種技術(shù),提高估計(jì)的精度與效果。本章要點(diǎn)本章主要對(duì)樣本輪換、雙重抽樣、隨機(jī)2第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機(jī)化裝置

第四節(jié)交叉子樣本第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機(jī)化裝置3問(wèn)題提出

時(shí)間序列數(shù)據(jù)以及隨后出現(xiàn)的面板數(shù)據(jù)都是經(jīng)濟(jì)統(tǒng)計(jì)分析和計(jì)量分析中非常重要的數(shù)據(jù)類型。當(dāng)我們?cè)谘芯繎?yīng)該應(yīng)用什么統(tǒng)計(jì)和計(jì)量的方法去分析既定的時(shí)間序列數(shù)據(jù)時(shí),是否考慮過(guò)以下幾個(gè)問(wèn)題?

時(shí)間序列數(shù)據(jù)是如何產(chǎn)生的?

所產(chǎn)生的時(shí)間序列數(shù)據(jù)是否準(zhǔn)確?

如何讓時(shí)間序列數(shù)據(jù)更加準(zhǔn)確?問(wèn)題提出時(shí)間序列數(shù)4

隨著社會(huì)經(jīng)濟(jì)現(xiàn)象的不斷變化和發(fā)展,很多調(diào)查對(duì)象的總體也在不斷變化和發(fā)展。為了能夠及時(shí)反映調(diào)查總體的這種變化和發(fā)展,調(diào)查部門就需要對(duì)同一總體在不同時(shí)間上進(jìn)行連續(xù)性抽樣調(diào)查(SuccessiveSamplingSurvey),并定期公布調(diào)查結(jié)果,形成一系列時(shí)序統(tǒng)計(jì)數(shù)據(jù)。因此,社會(huì)經(jīng)濟(jì)抽樣調(diào)查一般都應(yīng)該是連續(xù)性的定期調(diào)查。

一次性抽樣調(diào)查與截面數(shù)據(jù)

連續(xù)性抽樣調(diào)查與時(shí)間序列數(shù)據(jù)及面板數(shù)據(jù)隨著社會(huì)經(jīng)濟(jì)現(xiàn)象的不斷變化和發(fā)展,很5

抽樣調(diào)查除了對(duì)總體的一次性抽樣以外,很多重要的調(diào)查是隔一段時(shí)間重復(fù)進(jìn)行的,對(duì)于這種經(jīng)常性的抽樣問(wèn)題,就必須重視其樣本輪換問(wèn)題的研究。對(duì)于樣本輪換問(wèn)題,我們至少應(yīng)考慮以下問(wèn)題:每次調(diào)查的樣本如何組成?是采用固定樣本還是采用全新的樣本,或者是部分保留部分替換,即樣本輪換;在估計(jì)后期的總量或均值時(shí),是否需要利用前期的信息來(lái)改進(jìn)現(xiàn)期的估計(jì),以及如何利用;如果采用樣本輪換的方法,如何確定最優(yōu)的保留比例或替換比例。第一節(jié)

樣本輪換

抽樣調(diào)查除了對(duì)總體的一次性抽樣以外,很多重要的調(diào)查是6連續(xù)性抽樣設(shè)計(jì)方法按抽取樣本的不同劃分輪換樣本重復(fù)樣本固定樣本單水平輪換不完全的單水平輪換多水平輪換連續(xù)性抽樣設(shè)計(jì)方法按抽取樣本的不同劃分輪換樣本重復(fù)樣本固定樣7輪換模式應(yīng)用舉例加拿大勞動(dòng)力調(diào)查(LFS)使用6~0單水平輪換模式美國(guó)現(xiàn)時(shí)人口調(diào)查(CPS)使用4~8~4不完全單水平輪換模式美國(guó)消費(fèi)者支出的季度調(diào)查(CEQ)便采用4~0三水平輪換模式中國(guó)城市住戶抽樣調(diào)查中國(guó)規(guī)模以下工業(yè)企業(yè)抽樣調(diào)查中國(guó)農(nóng)產(chǎn)量抽樣調(diào)查輪換模式應(yīng)用舉例加拿大勞動(dòng)力調(diào)查(LFS)使用6~0單8一、樣本輪換的原因如果是單純地估計(jì)現(xiàn)值的情況,當(dāng)然最好每次重新抽取新樣本,這樣必然會(huì)增加費(fèi)用;如果要逐期地與上期比較,則采用固定樣本的方法為好,固定樣本可以消除樣本的因素而只觀察動(dòng)態(tài)的變化。然而,樣本長(zhǎng)期不變,隨著時(shí)間的推移,固定樣本會(huì)顯露它的弊端,既難以反映總體的變化,而且受訪者也會(huì)產(chǎn)生厭煩心理,出現(xiàn)不合作或回答質(zhì)量下降等問(wèn)題,從而影響調(diào)查質(zhì)量。另外,無(wú)論是采用固定樣本還是全新樣本都難以正確地反映總體在各個(gè)不同時(shí)間上的水平及變化,因此,一種廣泛采用的方法是樣本輪換,即每隔一定時(shí)間(一個(gè)月、一季或一年)更換一定比例的單元,保留其余單元。第一節(jié)

樣本輪換

一、樣本輪換的原因第一節(jié)樣本輪換9與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣調(diào)查具有以下特有的優(yōu)勢(shì):

節(jié)省調(diào)查費(fèi)用和調(diào)查資源

在一定程度上減輕被調(diào)查者回答負(fù)擔(dān)

利用前后各期之間的相關(guān)關(guān)系提高估計(jì)精度與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣10我國(guó)1996年新修訂的《統(tǒng)計(jì)法》第十條明確規(guī)定:“統(tǒng)計(jì)調(diào)查應(yīng)當(dāng)以周期性普查為基礎(chǔ),以經(jīng)常性抽樣調(diào)查為主體,以必要的統(tǒng)計(jì)報(bào)表、重點(diǎn)調(diào)查、綜合分析等為補(bǔ)充,搜集、整理基本統(tǒng)計(jì)資料?!币虼?,在今后我國(guó)政府統(tǒng)計(jì)部門開展的統(tǒng)計(jì)調(diào)查制度與方法改革的過(guò)程中,最重要的就是圍繞如何更好地發(fā)揮經(jīng)常性抽樣調(diào)查的主體作用,研究并應(yīng)用更加符合我國(guó)國(guó)情的經(jīng)常性抽樣調(diào)查方法,以此得出更加準(zhǔn)確的統(tǒng)計(jì)數(shù)據(jù),為我國(guó)政府部門、研究機(jī)構(gòu)以及各類企事業(yè)單位等社會(huì)各界服務(wù)。我國(guó)抽樣調(diào)查制度與方法改革的方向我國(guó)1996年新修訂的《統(tǒng)計(jì)法》第十條明確規(guī)定:“統(tǒng)計(jì)調(diào)查應(yīng)11二、樣本輪換的最優(yōu)比例第一個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式抽出樣本量為n的樣本;在第二個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式選出樣本量為nq的舊有樣本點(diǎn)以便替換掉,即保留的樣本量為np,保留樣本的比例為p,同時(shí)獨(dú)立地依有放回簡(jiǎn)單隨機(jī)樣本方式補(bǔ)充新的nq個(gè)新樣本點(diǎn),這里p+q=1,這樣第二個(gè)時(shí)期的樣本量仍舊為n。設(shè):第一節(jié)

樣本輪換

二、樣本輪換的最優(yōu)比例第一節(jié)樣本輪換12為第一個(gè)時(shí)期與第二個(gè)時(shí)期相同的np個(gè)單元在第一個(gè)時(shí)期的均值。為第一個(gè)時(shí)期nq個(gè)單元在第一個(gè)時(shí)期的均值。為np個(gè)單元在第二個(gè)時(shí)期的樣本均值。為nq個(gè)補(bǔ)充單元在第二個(gè)時(shí)期的樣本均值。ρ為和之間的相關(guān)系數(shù)。如果希望估計(jì)第二個(gè)時(shí)期的樣本均值并充分利用第一個(gè)時(shí)期的信息,令該估計(jì)量為,那么它應(yīng)該是充分利用前后期中保留樣本、不保留樣本和后期新補(bǔ)充樣本的加權(quán)平均數(shù)。

第一節(jié)

樣本輪換

為第一個(gè)時(shí)期與第二個(gè)時(shí)期相同的np個(gè)單元在第一13設(shè)我們希望得到的估計(jì)量是兩期估計(jì)量的線性函數(shù),即

=a+b+c+d(10.1)要求估計(jì)其參數(shù)a,b,c,d。因?yàn)镋()=E()=,E()=E()=,所以E()=(a+b)+(c+d)。要使成為的無(wú)偏估計(jì)量,需a+b=0,c+d=1,也即b=-a,d=1-c。代入(10.1),有=a(-)+c+(1-c)

第一節(jié)

樣本輪換

設(shè)我們希望得到的估計(jì)量是兩期估計(jì)量的線性函14第一節(jié)

樣本輪換

該估計(jì)量的方差可以求得為:其中是第一個(gè)時(shí)期的方差,是第二個(gè)時(shí)期的方差。我們要求出a和c,使得達(dá)到最小,就要以上公式分別對(duì)a和c求偏微分并使之等于0,即可求出a和c的最優(yōu)值分別為:第一節(jié)樣本輪換該估計(jì)量的方差可以求得為:其15第一節(jié)

樣本輪換

該估計(jì)量的方差可以求得為:第一節(jié)樣本輪換該估計(jì)量的方差可以求得為:16第一節(jié)

樣本輪換

將其代入公式(10.1),就得到該估計(jì)量的方差為:第一節(jié)樣本輪換將其代入公式(10.1),就得到該估17第一節(jié)

樣本輪換

如果不利用前期信息,只根據(jù)第二期的結(jié)果來(lái)估計(jì)均值,那么:其方差為:第一節(jié)樣本輪換如果不利用前期信息,只根據(jù)第二期的結(jié)果18第一節(jié)

樣本輪換

故利用前期信息后的設(shè)計(jì)效果為:從上式可以看出,當(dāng)ρ的值比較大時(shí),利用上期信息可以較大地提高的效率。表10.1給出了不同的q,ρ值時(shí)的值。第一節(jié)樣本輪換故利用前期信息后的設(shè)計(jì)效果為:19第一節(jié)

樣本輪換

表10.1不同的q,ρ值時(shí)的值第一節(jié)樣本輪換表10.1不同的q,20若對(duì)上式關(guān)于q求偏導(dǎo),并使之等于0,那么便可得到最優(yōu)輪換比:若對(duì)上式關(guān)于q求偏導(dǎo),并使之等于0,那么便可得到最優(yōu)21第一節(jié)

樣本輪換

三、樣本輪換方法(一)

隨機(jī)輪換法

在進(jìn)行輪換時(shí)按確定的輪換單位數(shù)目或比例,從原有樣本中隨機(jī)抽出若干單位不再調(diào)查,而從其余未包括在樣本中的總體單位中抽取同樣數(shù)目的單位來(lái)代替。第一節(jié)樣本輪換三、樣本輪換方法22第一節(jié)

樣本輪換

(二)

等距輪換法

在總體抽樣框中確定出各個(gè)等距抽樣的樣本,在各次的調(diào)查中,按相應(yīng)位置的等距樣本單位進(jìn)行輪換。我國(guó)農(nóng)村住戶調(diào)查就是采用這種輪換方式。(三)

子樣本輪換法從總體中抽出若干套子樣本,每次調(diào)查一定數(shù)量的子樣本,逐次輪換其中的部分子樣本。

第一節(jié)樣本輪換(二)

等23第一節(jié)

樣本輪換

子樣本輪換實(shí)際上就是每次采用交叉子樣本,而交叉子樣本不僅能有效地減少和控制估計(jì)偏差,而且由于每個(gè)交叉子樣本都能代表總體,即使有的子樣本資料搜集不到,我們也可以用其他的子樣本甚至一個(gè)子樣本來(lái)觀察和推斷總體。此外,用交叉子樣本還可以考察非抽樣誤差發(fā)生的程度。因此,一般來(lái)說(shuō),子樣本輪換方法是以上三種樣本輪換方法中最好的。第一節(jié)樣本輪換子樣本輪換實(shí)際上就是每次采用交24第一節(jié)

樣本輪換

五、案例介紹美國(guó)人口現(xiàn)狀調(diào)查(currentpopulationsurvey,CPS)是國(guó)際上最著名的抽樣調(diào)查項(xiàng)目之一,已經(jīng)成為美國(guó)以及許多國(guó)家進(jìn)行居民調(diào)查的參考模型,其實(shí)施是在每個(gè)月包含19號(hào)的那一周進(jìn)行,調(diào)查的問(wèn)題涉及受訪者此前一周內(nèi)的活動(dòng)。調(diào)查氛圍覆蓋全美50個(gè)州和哥倫比亞地區(qū)。CPS采用的就是樣本輪換的方法,即每位受訪者連續(xù)4個(gè)月接受訪問(wèn),然后退出樣本,8個(gè)月后再進(jìn)入樣本,連續(xù)4個(gè)月接受訪問(wèn),最后永久地退出樣本。第一節(jié)樣本輪換五、案例介紹25第一節(jié)

樣本輪換

CPS在1995年7月的抽樣設(shè)計(jì)方案中樣本輪換的特征:

1.在任意一個(gè)月內(nèi),都有1/8的住戶單元第一次接受調(diào)查,1/8的住戶單元第二次接受調(diào)查,依次類推。2.每個(gè)月都由新的樣本組代替從樣本中永久退出的老樣本組。3.每個(gè)月都有一個(gè)樣本組在閑置8個(gè)月后重新接受調(diào)查,以此代替剛剛進(jìn)入閑置期的樣本組。4.通過(guò)輪換設(shè)計(jì),保證每個(gè)樣本單元在2個(gè)年份的4個(gè)相同月份里接受調(diào)查。5.在連續(xù)的2個(gè)月內(nèi),有3/4/的樣本點(diǎn)是相同的;在連續(xù)的2年內(nèi),有1/2的樣本點(diǎn)是相同的。

第一節(jié)樣本輪換CPS在1995年7月的抽樣設(shè)計(jì)方案26

二維平衡單水平輪換模式的輪換過(guò)程

27

二維平衡單水平輪換模式的輪換過(guò)程

28第二節(jié)

雙重抽樣

我們可以先從總體中抽取一個(gè)大的初始樣本,從而獲得總體的輔助信息,然后再?gòu)某跏紭颖净驈目傮w中再抽一個(gè)子樣本,這種方法就是雙重抽樣。

第二節(jié)雙重抽樣我們可以先從總體中抽取一個(gè)大的29第二節(jié)

雙重抽樣

一、定義雙重抽樣,也稱二相抽樣或二重抽樣(two-phasesampling),是指在抽樣時(shí)分兩步抽取樣本。一般情況下,先從總體N中抽取一個(gè)較大的樣本,稱為第一重(相)樣本(thefirstphasesample),對(duì)之進(jìn)行調(diào)查以獲取總體的某些輔助信息,為下一步的抽樣估計(jì)提供條件;然后進(jìn)行第二重抽樣(thesecondphasesampling)。第二重抽樣所抽的樣本n相對(duì)較小,但是第二重抽樣調(diào)查才是主調(diào)查。第二節(jié)雙重抽樣一、定義30第二節(jié)

雙重抽樣

二、雙重抽樣與兩階段抽樣的區(qū)別(一)兩階段抽樣(two-stagesampling)是先從總體N個(gè)單元(初級(jí)單元)中抽出n個(gè)樣本單元,卻并不對(duì)這n個(gè)樣本單元中的所有小單元(二級(jí)單元)都進(jìn)行調(diào)查,而是在其中再抽出若干個(gè)二級(jí)單元進(jìn)行調(diào)查;雙重抽樣則不同,要對(duì)第一重(相)樣本進(jìn)行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信息進(jìn)行排序、分層、抽樣或估計(jì)等。第二節(jié)雙重抽樣二、雙重抽樣與兩階段抽樣的區(qū)別31第二節(jié)

雙重抽樣

(二)兩階段抽樣的第二階段抽樣單元和第一階段抽樣單元往往是不同的;雙重抽樣要有一份最終單元的完整名冊(cè)(總體所有單元的抽樣框),而兩階段抽樣只是需要第一階段單元(初級(jí)單元)名冊(cè),然后在中選的初級(jí)單元中構(gòu)造第二階段抽樣的抽樣框。第二節(jié)雙重抽樣(二)兩階段抽樣的第二階段抽樣單元和32第二節(jié)

雙重抽樣

三、雙重抽樣的作用(一)有助于篩選主調(diào)查對(duì)象(二)節(jié)約調(diào)查費(fèi)用(三)提高抽樣效率(四)可用于研究樣本輪換中的某些問(wèn)題(五)降低無(wú)回答偏倚第二節(jié)雙重抽樣三、雙重抽樣的作用33第二節(jié)

雙重抽樣

四、雙重抽樣的應(yīng)用

(一)為分層的雙重抽樣分層抽樣如果事先無(wú)法知道總體的層權(quán),可以采用雙重抽樣。具體實(shí)施過(guò)程如下:第一步:利用簡(jiǎn)單隨機(jī)抽樣,從總體的N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為;根據(jù)已知的分層標(biāo)志將第一重樣本分層,令,則是總體層權(quán)的無(wú)偏估計(jì)。第二節(jié)雙重抽樣四、雙重抽樣的應(yīng)用34第二節(jié)

雙重抽樣

第二步:利用分層隨機(jī)抽樣,從第一重樣本中抽取出第二重樣本,樣本單元數(shù)為n,第h層樣本單元數(shù)為,。采用雙重分層抽樣,對(duì)總體均值的估計(jì)量為:的方差為:第二節(jié)雙重抽樣第二步:利用分層隨機(jī)抽樣,從第一重樣35第二節(jié)

雙重抽樣

上式可簡(jiǎn)化為:的樣本估計(jì)量為:第二節(jié)雙重抽樣上式可簡(jiǎn)化為:的樣本36第二節(jié)

雙重抽樣

第一步:從總體的N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為;對(duì)于第一重樣本,僅觀測(cè)輔助變量信息,用輔助變量的樣本均值估計(jì)總體均值。(二)為比率估計(jì)的雙重抽樣在實(shí)際工作中,如果輔助變量的信息未知,可以利用雙重抽樣進(jìn)行比率估計(jì)。具體實(shí)施過(guò)程如下:第二節(jié)雙重抽樣第一步:從總體的N個(gè)單元中隨機(jī)抽取第37第二節(jié)

雙重抽樣

雙重抽樣對(duì)總體均值的比率估計(jì):第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元數(shù)為n;對(duì)于第二重樣本,觀測(cè)目標(biāo)變量與輔助變量,并用獲得的和,計(jì)算,構(gòu)造比率估計(jì)。雙重抽樣比率估計(jì)的方差為:第二節(jié)雙重抽樣雙重抽樣對(duì)總體均值的比率估計(jì):38第二節(jié)

雙重抽樣

雙重抽樣比率估計(jì)方差的樣本估計(jì):

第二節(jié)雙重抽樣雙重抽樣比率估計(jì)方差的樣本估計(jì):39第二節(jié)

雙重抽樣

(三)為回歸估計(jì)的二重抽樣與比率估計(jì)相似,在輔助信息未知時(shí)可以采用二重抽樣進(jìn)行回歸估計(jì)。具體實(shí)施過(guò)程如下:第一步:從總體的N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為;對(duì)于第一重樣本,僅觀測(cè)輔助變量信息,用輔助變量的樣本均值估計(jì)其總體均值。第二節(jié)雙重抽樣(三)為回歸估計(jì)的二重抽樣40第二節(jié)

雙重抽樣

第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元數(shù)為n;對(duì)于第二重樣本,觀測(cè)目標(biāo)變量與輔助變量,并計(jì)算、和回歸系數(shù)b,構(gòu)造回歸估計(jì)。雙重抽樣對(duì)總體均值的回歸估計(jì):雙重抽樣回歸估計(jì)的方差為:第二節(jié)雙重抽樣第二步:從第一重樣本中隨機(jī)抽取出第41第二節(jié)

雙重抽樣

式中:為第一重樣本殘差方差,其均值近似等于總體殘差方差:因此雙重抽樣回歸估計(jì)方差的樣本估計(jì):第二節(jié)雙重抽樣式中:為第一重樣本殘差方差,其均值近42第三節(jié)隨機(jī)化裝置一、敏感性問(wèn)題調(diào)查所謂敏感性問(wèn)題(sensitivequestion)是指所調(diào)查的內(nèi)容涉及私人機(jī)密,受訪者不愿或不便于向外界透露的問(wèn)題。對(duì)于這類敏感性問(wèn)題,必須采取經(jīng)過(guò)特別設(shè)計(jì)的裝置與方法,以消除受訪者的顧慮,能夠如實(shí)回答問(wèn)題,避免調(diào)查出現(xiàn)嚴(yán)重偏誤。這種為敏感性問(wèn)題調(diào)查特別設(shè)計(jì)的技術(shù),稱隨機(jī)化回答技術(shù)(RandomizedResponseTechnique)。第三節(jié)隨機(jī)化裝置一、敏感性問(wèn)題調(diào)查43第三節(jié)隨機(jī)化裝置

敏感性問(wèn)題按總體的特征可分為屬性特征和數(shù)量特征問(wèn)題兩類。屬性特征的敏感性問(wèn)題是指受訪者是否具有敏感性問(wèn)題的特征,一般是估計(jì)具有敏感性特征的單位在總體中所占的比例,因此又可稱作敏感性比例問(wèn)題。數(shù)量特征的敏感性問(wèn)題是指受訪者具有敏感性問(wèn)題數(shù)額的多少的特征,一般是估計(jì)敏感性數(shù)額的均值或總和,也可稱作敏感性均值問(wèn)題。第三節(jié)隨機(jī)化裝置敏感性問(wèn)題按總體的特征可分為44二、沃納隨機(jī)化回答模型使用隨機(jī)化回答技術(shù)的第一個(gè)模型是由沃納(S.L.Warner)首先提出的。例如,某大學(xué)欲調(diào)查學(xué)生考試的作弊問(wèn)題,隨機(jī)抽取n個(gè)學(xué)生進(jìn)行調(diào)查,對(duì)每位學(xué)生顯示兩個(gè)相反的問(wèn)題,問(wèn)題可以寫在外形完全相同的m張卡片上,其中m1個(gè)卡片寫上“我曾在考試中作過(guò)弊”,另外m-m1個(gè)卡片寫上“我不曾在考試中作過(guò)弊”。然后把這m個(gè)卡片折疊好,放在一個(gè)盒子里。其中:A問(wèn)題:我曾在考試中作過(guò)弊。B問(wèn)題:我不曾在考試中作過(guò)弊。第三節(jié)隨機(jī)化裝置二、沃納隨機(jī)化回答模型第三節(jié)隨機(jī)化裝置45調(diào)查時(shí)將m種外形完全一致的卡片像洗牌一樣充分混合后,由受訪者依簡(jiǎn)單隨機(jī)抽樣中的抽簽方式隨機(jī)抽取一張卡片,對(duì)照自己的情況回答“是”或“否”,然后放回盒子中。設(shè)卡片A的比例是P,則卡片B的比例就是1-P。由古典概率可知,在大規(guī)模的調(diào)查中,抽中卡片的概率為P(A)=P,抽中卡片的概率為P(B)=1-P。若樣本量為n,回答“是”的人數(shù)為m,則(是)的估計(jì)值為m/n。我們知道,回答“是”的人有兩種情況:一種是抽中了卡片A,而這些人作過(guò)弊;另一種是抽中了卡片B,而這些人沒(méi)有作過(guò)弊。利用全概公式,得:(是)=P(A)·(是|A)+P(B)·(是|B)第三節(jié)隨機(jī)化裝置調(diào)查時(shí)將m種外形完全一致的卡片像洗牌一樣充分混合后,46不管是抽到卡片A還是抽到卡片B,作過(guò)弊的概率是相等的,假設(shè)這一比例為,即(是|A)=,則抽到卡片B,回答“是”的概率為1-,即P(是|B)=1-。代入上述公式,得的一個(gè)估計(jì)滿足:第三節(jié)隨機(jī)化裝置因此當(dāng)時(shí),有:其方差為:不管是抽到卡片A還是抽到卡片B,作過(guò)弊的概率是相等的47的一個(gè)無(wú)偏估計(jì)為:第三節(jié)隨機(jī)化裝置當(dāng)n很大時(shí),的一個(gè)無(wú)偏估計(jì)為:第三節(jié)隨機(jī)化裝置當(dāng)n很大48三、西蒙斯(Simmons)隨機(jī)化回答模型西蒙斯在沃納模型基礎(chǔ)上作了改進(jìn),他將其中一張卡片上的問(wèn)題改為與所調(diào)查的敏感性問(wèn)題完全無(wú)關(guān)的另一個(gè)非敏感性問(wèn)題。因此西蒙斯模型也稱為無(wú)關(guān)問(wèn)題的隨機(jī)化回答模型。

仍假設(shè)敏感性問(wèn)題的卡片比例為P,無(wú)關(guān)問(wèn)題的卡片比例為1-P。對(duì)于敏感性問(wèn)題回答“是”的比例為,是我們所要調(diào)查的比例,對(duì)無(wú)關(guān)問(wèn)題回答“是”的比例要求是已知的,則根據(jù)全概率公式,得:(是)=P+(1-P)第三節(jié)隨機(jī)化裝置三、西蒙斯(Simmons)隨機(jī)化回答模型第三節(jié)隨機(jī)化49當(dāng)樣本量為n,回答“是”的人數(shù)為m,則(是)的估計(jì)值為m/n,因此的估計(jì)值滿足:第三節(jié)隨機(jī)化裝置解此方程得:它的方差為(若忽略fpc):V()的一個(gè)無(wú)偏估計(jì)為:當(dāng)樣本量為n,回答“是”的人數(shù)為m,則(是)的估計(jì)值50【例10.1】某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用西蒙斯模型,對(duì)每個(gè)受訪者準(zhǔn)備了一套同樣的(40張)卡片,卡片A和卡片B各20張,比例各占1/2??ㄆ螦的問(wèn)題是:最近學(xué)期期末考試你有過(guò)作弊行為嗎?卡片上B的問(wèn)題是:你的陽(yáng)歷生日日期為奇數(shù)嗎?第三節(jié)隨機(jī)化裝置【例10.1】某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用51【例10.1】某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用西蒙斯模型,對(duì)每個(gè)受訪者準(zhǔn)備了一套同樣的(40張)卡片,卡片A和卡片B各20張,比例各占1/2??ㄆ螦的問(wèn)題是:最近學(xué)期期末考試你有過(guò)作弊行為嗎?卡片上B的問(wèn)題是:你的陽(yáng)歷生日日期為奇數(shù)嗎?假如對(duì)依簡(jiǎn)單隨機(jī)抽樣方式抽出的400個(gè)人進(jìn)行調(diào)查,在n=400人中總共有m=115人的答案為“是”,試估計(jì)該校大學(xué)生考試作弊的比例并給出90%的置信區(qū)間。第三節(jié)隨機(jī)化裝置【例10.1】某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用52解:n=800,m=135,P=0.5,為生日日期為奇數(shù)的人數(shù)比例。在大規(guī)模調(diào)查的情況下,可以看作生日為奇數(shù)和偶數(shù)的各占一半,因此=0.5。根據(jù)公式得:第三節(jié)隨機(jī)化裝置

=

故的90%置信區(qū)間約為:(0.0751.640.0453),即:=0.002054

解:n=800,m=135,P=0.5,為生日日期53四、隨機(jī)截尾模型現(xiàn)實(shí)中我們也經(jīng)常需要調(diào)查定量的敏感性問(wèn)題,例如調(diào)查銀行存款數(shù)額,學(xué)生考試作弊的平均次數(shù),在職人員的工資外收入等。Greenberg等人針對(duì)這類問(wèn)題提出了幾種隨機(jī)化調(diào)查方法,但是,這些方法都要求受訪者根據(jù)自己的實(shí)際情況回答敏感性問(wèn)題或非敏感性問(wèn)題的具體數(shù)值,給受訪者/受查者造成了一定的困擾。近年來(lái)提出了所謂隨機(jī)截尾模型,把對(duì)于具體數(shù)值的調(diào)查轉(zhuǎn)化為對(duì)于屬性的調(diào)查,避免了直接回答,使得受訪者心理上比較容易接受。第三節(jié)隨機(jī)化裝置四、隨機(jī)截尾模型第三節(jié)隨機(jī)化裝置54設(shè)反映敏感性問(wèn)題的特征量為X,取值范圍是,密度函數(shù)為,X的數(shù)學(xué)期望為,即我們所要估計(jì)的值。又設(shè)Y是一個(gè)服從上的均勻分布的隨機(jī)變量。第三節(jié)隨機(jī)化裝置設(shè)樣本容量為n,得到的調(diào)查數(shù)據(jù)是,I=1,2,…n,即:=

,因此設(shè)反映敏感性問(wèn)題的特征量為X,取值范圍是,55以樣本均值=代替,得到的一個(gè)無(wú)偏估計(jì)為:第三節(jié)隨機(jī)化裝置估計(jì)量的方差為:的一個(gè)估計(jì)為:以樣本均值=代替,得到56五、采用隨機(jī)化回答技術(shù)應(yīng)注意的問(wèn)題第三節(jié)隨機(jī)化裝置(一)注意在受訪者正式抽取并回答問(wèn)題前,清楚介紹這種做法的原理,讓受訪者充分理解這種方法的特點(diǎn),以徹底消除受訪者的顧慮,明白自己究竟回答哪個(gè)問(wèn)題別人是不知道的,使其相信這種設(shè)計(jì)是建立在科學(xué)的基礎(chǔ)上,不是哄騙人的。(二)所提問(wèn)題必須簡(jiǎn)單明了,防止因有歧義而出現(xiàn)理解不同。對(duì)涉及問(wèn)題的解釋必須在抽卡片以前進(jìn)行,否則就暴露了抽到的是哪類卡片,也就失去了隨機(jī)化回答的意義。五、采用隨機(jī)化回答技術(shù)應(yīng)注意的問(wèn)題第三節(jié)隨機(jī)化裝置(一57第三節(jié)隨機(jī)化裝置(三)在應(yīng)用西蒙斯模型時(shí),無(wú)關(guān)問(wèn)題的選擇特別重要,一定要隱蔽性強(qiáng)的,使受訪者在回答無(wú)關(guān)問(wèn)題時(shí)不會(huì)暴露正在回答哪個(gè)問(wèn)題。例如“你是男生嗎?”這類問(wèn)題就很不妥,因?yàn)椴捎秒S機(jī)化回答技術(shù)需要當(dāng)面解釋,受訪者的性別不可能保密,這樣也就失去了無(wú)關(guān)問(wèn)題本來(lái)應(yīng)具有的保護(hù)作用。(四)做好調(diào)查者的培訓(xùn)工作,使他們能夠正確理解隨機(jī)化回答技術(shù)的實(shí)質(zhì)并加以運(yùn)用,這樣才能更好地向受訪者解釋清楚,消除受訪者的顧慮,以對(duì)調(diào)查的問(wèn)題給予正確回答。第三節(jié)隨機(jī)化裝置(三)在應(yīng)用西蒙斯模型時(shí),無(wú)關(guān)問(wèn)題58第四節(jié)交叉子樣本交叉子樣本(Interpenetratingsub-samples)方法最初是由印度著名統(tǒng)計(jì)學(xué)家馬哈拉諾比斯于30年代提出來(lái)的用于大規(guī)模的抽樣調(diào)查,后來(lái)由美國(guó)統(tǒng)計(jì)學(xué)家戴明推廣和發(fā)展,他稱之謂重復(fù)抽樣。它的主要優(yōu)點(diǎn)是便于計(jì)算抽樣標(biāo)準(zhǔn)誤差,即使是復(fù)雜的抽樣設(shè)計(jì)和復(fù)雜的估計(jì)量,也可以很快得到方差的估計(jì)量。它還可以用于發(fā)現(xiàn)偏差,核對(duì)調(diào)查員的調(diào)查質(zhì)量等。第四節(jié)交叉子樣本交叉子樣本(Interpen59第四節(jié)交叉子樣本一、獨(dú)立的交叉子樣本設(shè)總體為N,現(xiàn)欲抽取樣本容量為n的樣本。那么可以利用交叉子樣本的方法,

假設(shè)抽取K個(gè)子樣本,使每個(gè)樣本的容量為m(n=Km),每個(gè)交叉子樣本可以得到總體參數(shù)θ的一個(gè)無(wú)偏估計(jì)量那么交叉子樣本的估計(jì)量及其方差為:(不重復(fù)抽樣)第四節(jié)交叉子樣本一、獨(dú)立的交叉子樣本(不重復(fù)抽樣)60【例10.2】假設(shè)有一小城鎮(zhèn),現(xiàn)欲估計(jì)這一城鎮(zhèn)的房屋數(shù)。該城鎮(zhèn)共有50個(gè)居委會(huì),由于居委會(huì)作為抽樣單位太大,將每個(gè)居委會(huì)劃分為8個(gè)地段,這樣共有400個(gè)地段,擬抽取20%的地段做樣本,所以n=80,現(xiàn)采用K=5獨(dú)立交叉子樣本,每個(gè)交叉子樣本的容量為16。抽樣的方法可用系統(tǒng)抽樣的方法,將總體分成16段(層),每段有25個(gè)地段。抽選時(shí)先在1—25之間用不重復(fù)抽樣方法抽取5個(gè)隨機(jī)數(shù)作為隨機(jī)起點(diǎn)。如表(10.2)中的第一行,它們分別是:18,1,8,23,11。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論