版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
實(shí)用標(biāo)準(zhǔn)文檔文案大全中國人民大學(xué)同等學(xué)力申請碩士學(xué)位課程考試試題
課程代碼:123105
課程名稱:抽樣技術(shù)與方法試題卷號(hào):1名詞解釋非概率抽樣非概率抽樣又稱為非隨機(jī)抽樣,是調(diào)查者根據(jù)自己的方便或主觀判斷抽取樣本的方法,其最主要的特征是抽取樣本時(shí)并不依據(jù)隨機(jī)原則。包含有判斷選樣、方便抽樣、自愿樣本、配額抽樣等。最優(yōu)分配在分層隨機(jī)抽樣中,對于給定的費(fèi)用,使估計(jì)量的方差V(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)達(dá)到最小,或者對于給定的估計(jì)量方差V,使總費(fèi)用達(dá)到最小的各層樣本量的分配,稱為最優(yōu)分配。PPS抽樣是有放回的按規(guī)模大小成比例的概率抽樣。其抽選樣本的方法有代碼法、拉希里方法等。PPS抽樣是按概率比例抽樣,屬于概率抽樣中的一種。是指在多階段抽樣中,尤其是二階段抽樣中,初級(jí)抽樣單位被抽中的機(jī)率取決于其初級(jí)抽樣單位的規(guī)模大小,初級(jí)抽樣單位規(guī)模越大,被抽中的機(jī)會(huì)就越大,初級(jí)抽樣單位規(guī)模越小,被抽中的機(jī)率就越小。就是將總體按一種準(zhǔn)確的標(biāo)準(zhǔn)劃分出容量不等的具有相同標(biāo)志的單位在總體中不同比率分配的樣本量進(jìn)行的抽樣。自加權(quán)樣本指調(diào)查中每個(gè)樣本單元的設(shè)計(jì)權(quán)數(shù)是相同的,也就是說每個(gè)單元最終入樣的概率是相等的。在不考慮非抽樣誤差的情況下,可以認(rèn)為自加權(quán)樣本完全代表總體,因?yàn)槊總€(gè)樣本單元都代表了總體中相同數(shù)目的單元。(此時(shí)可以使用標(biāo)準(zhǔn)統(tǒng)計(jì)方法來進(jìn)行點(diǎn)估計(jì)。此外,自加權(quán)樣本往往方差較小,樣本統(tǒng)計(jì)量更穩(wěn)健)簡述題有人認(rèn)為“抽樣調(diào)查除了調(diào)查誤差以外,還有抽樣誤差,因此抽樣調(diào)查不如全面調(diào)查準(zhǔn)確”,請對此加以評價(jià)。一項(xiàng)調(diào)查的誤差來自多個(gè)方面,抽樣調(diào)查因?yàn)橹徽{(diào)查總體中的一小部分,用部分的調(diào)查結(jié)果推斷總體,所以存在著抽樣誤差,但這只是所有誤差中的一部分。對于抽樣調(diào)查,誤差包括抽樣誤差和非抽樣誤差。有些情況下,全面調(diào)查由于參與的人員眾多、涉及范圍大,因此雖然沒有抽樣誤差,但在數(shù)據(jù)采集和數(shù)據(jù)匯總整理的過程中卻有產(chǎn)生其他誤差的更大可能性,所以調(diào)查規(guī)模并不是越大越好。與全面調(diào)查相比,抽樣調(diào)查的工作量小,這就為使用素質(zhì)較高的工作人員并對他們進(jìn)行深入的培訓(xùn)創(chuàng)造了條件。此外,如果能對調(diào)查過程實(shí)施更為細(xì)致的監(jiān)督、檢查和指導(dǎo),可以使抽樣調(diào)查所得到的數(shù)據(jù)質(zhì)量比同樣的全面調(diào)查數(shù)據(jù)質(zhì)量更高,從而使調(diào)查的總誤差更小。試對分層抽樣中的聯(lián)合比率估計(jì)和分別比率估計(jì)方法進(jìn)行比較。如果每一層都滿足比率估計(jì)量有效的條件,則除非Rh=R,都有分別比率估計(jì)量的方差小于聯(lián)合比率估計(jì)量的方差。但當(dāng)每層的樣本量不太大時(shí),還是采用聯(lián)合比率估計(jì)量更可靠些,因?yàn)檫@時(shí)分別比率估計(jì)量的偏倚很大,從而使總的均方誤差增大。????實(shí)際使用時(shí),如果各層的樣本量都較大,且有理由認(rèn)為各層的比率Rh差異較大,則分別比率估計(jì)優(yōu)于聯(lián)合比率估計(jì)。當(dāng)各層的樣本量不大,或各層比率Rh差異很小,則聯(lián)合比率估計(jì)更好些。此外,聯(lián)合比估計(jì)不像分別比那樣需要已知每層的輔助信息Xh。計(jì)算題某住宅區(qū)調(diào)查居民的用水情況,該區(qū)共有=1000戶,調(diào)查了=100戶,得EQ\*jc2\*hps16\o\ad(\s\up15(_),y)=12.5噸,s2=1252,有40戶用水超過了規(guī)定的標(biāo)準(zhǔn)。要求計(jì)算:(1)該住宅區(qū)總的用水量及95%的置信區(qū)間;(2)若要求估計(jì)的相對誤差不超過10%,應(yīng)抽多少戶作為樣本?(3)以95%的可靠性估計(jì)超過用水標(biāo)準(zhǔn)的戶數(shù);(4)若認(rèn)為估計(jì)用水超標(biāo)戶的置信區(qū)間過寬,要求縮短一半應(yīng)抽多少戶作為樣本?【解】已知N=1000,n=100,f=nN=1001000=0.1,EQ\*jc2\*hps16\o\ad(\s\up15(_),y)=12.5,s2=1252(1)估計(jì)該住宅區(qū)總的用水量Y為:EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)=NEQ\*jc2\*hps16\o\ad(\s\up15(_),y)=1000*12.5=12500噸估計(jì)該住宅區(qū)總的用水量Y的方差和標(biāo)準(zhǔn)差為:V(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=N2v(EQ\*jc2\*hps16\o\ad(\s\up15(_),y))=N21-fns2=10002*1-0.1100*1252=11268000s(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=SQRT(v(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)))=11268000≈3356.7842因此,在95%的置信度下,該住宅總的用水量的置信區(qū)間估計(jì)為:EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)±z0.025s(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=12500±1.96*3356.7842≈12500±6579即,我們可以以95%的把握認(rèn)為該住宅總的用水量在?5921噸~19079噸之間。(2)根據(jù)題意,要求估計(jì)的相對誤差不超過10%,即r≤0.1,假定置信度為95%??根據(jù)公式:n0=z2s2r由于n0N=3.078>0.05,所以需要對n0n=n01+n0若要求估計(jì)的相對誤差不超過10%,應(yīng)抽不少于755戶作為樣本。或:n0=1/(1/N+d2/(zα/22s2))≈755(d=rEQ\*jc2\*hps10\o\ad(\s\up9(_),y)=1.25)(3)令超過用水標(biāo)準(zhǔn)的戶數(shù)為A,樣本中超過用水標(biāo)準(zhǔn)的戶數(shù)為a?=?40,估計(jì)超過用水標(biāo)準(zhǔn)的比例p為:p=a/n=40/100=40%估計(jì)超過用水標(biāo)準(zhǔn)的比例p的方差和標(biāo)準(zhǔn)差為:v(p)=1-fn-1p(1-p)=1-0.1100-1*40%*60%s(p)=v(p)=0.002182≈4.67%在95%的可靠性下,超過用水標(biāo)準(zhǔn)的比例p的估計(jì)區(qū)間為:p±z0.025s(p)=40%±1.96*4.67%因此,我們有95%的把握認(rèn)為,超過用水標(biāo)準(zhǔn)的比例p在30.85%-49.15%之間,超過用水標(biāo)準(zhǔn)的戶數(shù)的點(diǎn)估計(jì)為:1000*40%=400戶,超過用水標(biāo)準(zhǔn)的戶數(shù)在1000*30.85%戶~1000*49.15%戶之間,即309戶~492戶之間?;颍簆±z0.025(1-fn-1p(1-p)(4)若要置信區(qū)間的寬度縮小為原來一半,即要求應(yīng)抽取的戶數(shù)n滿足方程z0.0251-fn-1p(1-p)=1/2*z0.025v(p)≈n=306.25≈306戶。為估計(jì)市區(qū)人均居住面積,按與各區(qū)人數(shù)呈比例的概率從12個(gè)區(qū)中抽了4個(gè)區(qū),經(jīng)調(diào)查的數(shù)據(jù)如下:樣本區(qū)號(hào)區(qū)居住面積(米2)人口數(shù)12835326604746216709964560353183522647098142895058585257試對市區(qū)人均居住面積作點(diǎn)估計(jì)和置信度為95%的區(qū)間估計(jì)?!窘狻吭O(shè)居住面積為Y,人口數(shù)為X,N=12,n=4,f=n/N=1/3。人均居住面積點(diǎn)估計(jì)值為EQ\*jc2\*hps12\o\ad(\s\up11(^),R)=r=14yi14xi=92366062117019≈4sy2=1n-11n(yi-rxi)2=1314(V(EQ\*jc2\*hps10\o\ad(\s\up9(^),R))=V(r)≈1x21-fn1n-11n(yi-rxs(EQ\*jc2\*hps10\o\ad(\s\up9(^),R))=V(r)=0.24215≈0.492因此置信度為95%的區(qū)間估計(jì)為:4.363±1.96*0.492,即(3.3987,5.3273)試題卷號(hào):2名詞解釋概率抽樣也稱隨機(jī)抽樣,是指依據(jù)隨機(jī)原則,按照某種事先設(shè)計(jì)的程序,從總體中抽取部分單元的抽樣方法。(概率抽樣就是使總體中的每一個(gè)單位都有一個(gè)已知的、不為零的概率進(jìn)入樣本的抽樣方法。)具體說來,概率抽樣具有以下幾個(gè)特點(diǎn):(1)按一定的概率以隨機(jī)原則抽取樣本。(2)每個(gè)單元被抽中的概率是已知的,或是可以計(jì)算出來的。(3)當(dāng)用樣本對總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到該樣本(或每個(gè)樣本單元)被抽中的概率。也就是說,估計(jì)量不僅與樣本單元的觀測值有關(guān),也與其入樣概率有關(guān)。概率抽樣最主要的優(yōu)點(diǎn)是,可以依據(jù)調(diào)查結(jié)果計(jì)算抽樣誤差,從而得到對總體目標(biāo)量進(jìn)行推斷的可靠程度。從另一方面講,也可以按照要求的精確度,計(jì)算必要的樣本單元數(shù)目。因此,概率抽樣可以排除調(diào)查者的主觀影響,抽選出較其他方法更具代表性的樣本。事后分層又稱抽樣后分層,是對一個(gè)總體先進(jìn)行簡單隨機(jī)抽樣或系統(tǒng)抽樣,抽取一個(gè)樣本量為n的樣本,然后對樣本中的單元按某些特征進(jìn)行分層并進(jìn)行分層抽樣估計(jì)。πPS抽樣是不放回的與單元大小成比例的概率抽樣(該抽樣方法是在總體抽取樣本時(shí),借助總體單元大小或規(guī)模(Mi)的輔助變量來確定單元入樣概率(Zi)或包含概率(πi,πij)的方法)隨機(jī)化回答在調(diào)查中當(dāng)一個(gè)問題是敏感性的或高度私人機(jī)密性的,則就會(huì)發(fā)生拒絕回答或回避回答的情況。為了獲得對這類問題總體比例進(jìn)行估計(jì)的資料,就需要采用隨機(jī)化的方式來獲取回答信息并進(jìn)行估計(jì)的技術(shù),我們稱之為隨機(jī)化回答。簡述題什么是抽樣框?簡述抽樣框的類型和作用,以及良好抽樣框的標(biāo)志。總體的具體表現(xiàn)是抽樣框。通常,抽樣框是一份包含所有抽樣單元的名單,給每一個(gè)抽樣單元編上一個(gè)號(hào)碼,就可以按一定的隨機(jī)化程序進(jìn)行抽樣。抽樣框又稱“抽樣框架”、“抽樣結(jié)構(gòu)”,是指對可以選擇作為樣本的總體單位列出名冊或排序編號(hào),以確定總體的抽樣范圍和結(jié)構(gòu)。設(shè)計(jì)出了抽樣框后,便可采用抽簽的方式或按照隨機(jī)數(shù)表來抽選必要的單位數(shù)。若沒有抽樣框,則不能計(jì)算樣本單位的概率,從而也就無法進(jìn)行概率選樣。抽樣框有不同類型:名錄框(總體中所有單元實(shí)際的名錄清單,如在校學(xué)生名單、企業(yè)名冊、電話號(hào)碼簿等)、區(qū)域框(其單元由地理區(qū)域構(gòu)成的集合,抽樣總體由這些地理區(qū)域組成)、自然框(把相關(guān)的自然現(xiàn)象概念(如時(shí)間、距離等)作為抽樣框使用)。抽樣框?qū)Τ闃诱{(diào)查具有十分重要的作用。1)首先,抽樣框是代表總體進(jìn)行抽樣的,抽樣框的缺陷會(huì)造成目標(biāo)總體與調(diào)查總體不一致,在估計(jì)中出現(xiàn)偏差;2)其次,抽樣框中的聯(lián)系資料是用來確定總體單元所在的位置和聯(lián)系地址的,如果出現(xiàn)錯(cuò)誤,可能會(huì)產(chǎn)生無法聯(lián)系而造成無回答;3)抽樣框中的輔助資料可以用來進(jìn)行分層等以改進(jìn)抽樣設(shè)計(jì)或改進(jìn)估計(jì)方法,以提高抽樣效率。因此完備的抽樣框是做好抽樣調(diào)查的前提條件。良好抽樣框的標(biāo)志是具有充分的輔助信息、目標(biāo)總體和抽樣總體完全重合,也就是目標(biāo)總體單元和抽樣總體單元完全呈一一對應(yīng)的關(guān)系。具體來講:1)關(guān)聯(lián)性,指抽樣框與目標(biāo)總體的對應(yīng)程度,要求兩者之間盡可能地關(guān)聯(lián);2)準(zhǔn)確性,涵蓋誤差盡可能小,分類是否準(zhǔn)確?聯(lián)系資料是否完整?輔助資料是否齊全等;3)時(shí)效性,抽樣框是否及時(shí)更新;4)最后還可以從建立抽樣框的費(fèi)用進(jìn)行評估。對多階段抽樣中自加權(quán)的有關(guān)問題進(jìn)行論述。由于不等概率抽樣往往不滿足自加權(quán),因此在多階段抽樣中,最后一階按等概率(如SRS等)抽取最終單元(USU),其它階段采用PPS,且各階段樣本量對不同單元都等于常數(shù),則所得樣本是自加權(quán)的。計(jì)算題從某農(nóng)村的200戶中隨機(jī)等概率(無放回)抽取50戶,發(fā)現(xiàn)其中8戶有自行車,這8戶人數(shù)分別為3,5,3,4,7,4,4,5人。根據(jù)這一資料要求:(1)估計(jì)該村具有自行車的戶數(shù)及其估計(jì)精度;(2)估計(jì)該村具有自行車的總?cè)藬?shù)及其估計(jì)精度?!窘狻坑梢阎茫篘=200,n=50,f=n/N=0.25總體中具有自行車戶數(shù)的比例為P(1)這次簡單隨機(jī)抽樣得到的P的估計(jì)值=8/50=0.16,即具有自行車的戶數(shù)估計(jì)值EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)=Np=0.16*200=32.所以總體比例P在95%情況下的置信區(qū)間可以寫為:p±z0.025v(p)其中v(p)=1-fn-1p(1-p)≈0.002057,v(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=v(Np)=N2v(p)=82.28故P的置信區(qū)間:0.16±1.96*0.002057=0.16±0.0889。所以戶數(shù)的置信區(qū)間為:200*(0.16±0.0889)即[14,50](2)有自行車家庭人數(shù)M,則n0=8,EQ\*jc2\*hps10\o\ad(\s\up9(_),m)=1n018mi=4.375,從而具有自行車的總?cè)藬?shù)估計(jì)值為EQ\*jc2\*hps10\o\ad(\s\up9(^),M)=EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)EQ\*jc2\*hps10\o\ad(\s\up9(_),m)=32*4.375=140。s2=1n0-1則V(EQ\*jc2\*hps10\o\ad(\s\up9(_),m))=1-fns2=1-0.258*1.696=0.159,因此V(EQ\*jc2\*hps10\o\ad(\s\up9(^),M))=V(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)EQ\*jc2\*hps10\o\ad(\s\up9(_),m))=EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)2V(EQ\*jc2\*hps10\o\ad(\s\up9(_),m))=322*0.159=162.816s(EQ\*jc2\*hps10\o\ad(\s\up9(^),M))=162.816≈13某城市共有1000家餐館,分為大中小三層,現(xiàn)預(yù)估計(jì)在餐館就餐的人數(shù),采用抽樣調(diào)查,根據(jù)以往資料層NhSh2中3002500小600400大1001000(1)若欲估計(jì)就餐總?cè)藬?shù)的誤差不超過4000人,可靠性為95%,采用最優(yōu)分配應(yīng)抽多少家餐館作為樣本(假設(shè)每層每戶的調(diào)查費(fèi)用相等);(2)若不按比例抽樣在數(shù)據(jù)上比較復(fù)雜,其費(fèi)用相當(dāng)于調(diào)查50家餐館,因此從效益上看改為按比例抽樣是否值得?【解】根據(jù)如上表格按中、小、大依次分層:N1=300,N2=600,N3=100,N=1000,S12=2500,S22=400,S32=1000(1)總?cè)藬?shù)絕對誤差限dy=4000,所以EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st的絕對誤差限為d=dy/N=4.W1=0.3,W2=0.6,W3=0.1考慮每層每戶調(diào)查費(fèi)用相等,所以使用內(nèi)曼分配,從而抽取餐館數(shù):n=(1LWhSh)2d2(即應(yīng)抽取173家餐館作為樣本。(2)如果采用比例分配,則n0=1LWhSh2由于n0-n=207-173=34<50,所以從效益上看改為按比例抽樣更值得。試題卷號(hào):3名詞解釋配額抽樣是將總體中的各單元按一定標(biāo)準(zhǔn)劃分為若干類型,將樣本數(shù)額分配到各類型中,從各類型中抽取樣本的方法則沒有嚴(yán)格限制,一般采用方便抽樣的方法抽取樣本單元。設(shè)計(jì)效應(yīng)為一個(gè)特定的抽樣設(shè)計(jì)(包括抽樣方法以及對總體目標(biāo)量的估計(jì)方法)估計(jì)量的方差與相同樣本量下不放回簡單隨機(jī)抽樣(SRSWOR)的估計(jì)量的方差之比,即Deff=所考慮的抽樣設(shè)計(jì)估計(jì)量的方差/相同樣本量下簡單隨機(jī)抽樣估計(jì)量的方差如果deff?<?1,則所考慮的抽樣設(shè)計(jì)比簡單隨機(jī)抽樣的效率高;反之,如果deff?>?1,則所考慮的抽樣設(shè)計(jì)比比簡單隨機(jī)抽樣的效率低。?deff對復(fù)雜抽樣時(shí)確定樣本量有很大作用,在一定精度條件下,簡單隨機(jī)抽樣所需的樣本量n’比較容易得到,如果可以估計(jì)復(fù)雜抽樣的deff,那么復(fù)雜抽樣所需的樣本量為:?n?=?n’*deff整群抽樣將總體中若干個(gè)基本單元合并為組,這樣的組稱為群。抽樣時(shí)直接抽取群,然后對中選群中的所有基本單元全部實(shí)施調(diào)查,這樣的抽樣方法稱為整群抽樣。沃納模型沃納模型論及總體是簡單的二元總體,即總體中的每個(gè)單元或者屬于A類或者不屬于A類(即基于敏感特征設(shè)立兩個(gè)對立的問題),除此之外,別無他屬。我們向被調(diào)查人員提出兩個(gè)問題,要求其回答“是”或者“不是”,調(diào)查人員并不知道被調(diào)查者回答了哪個(gè)問題,只知道兩個(gè)問題被提出的概率為P和1-P,這樣就可以使被調(diào)查者確信其回答不會(huì)泄露本人隱私。簡述題試述概率抽樣,非概率抽樣各自的特點(diǎn)、作用和局限。概率抽樣也稱隨機(jī)抽樣,是指依據(jù)隨機(jī)原則,按照某種事先設(shè)計(jì)的程序,從總體中抽取部分單元的抽樣方法。概率抽樣包括等概率抽樣(單元之間被抽中的概率相等)與不等概率抽樣兩種。概率抽樣有幾個(gè)特點(diǎn):1)按一定的概率以隨機(jī)原則抽取樣本。2)每個(gè)單元被抽中的概率是已知的,或是可以計(jì)算出來的。3)當(dāng)用樣本對總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到該樣本(或每個(gè)樣本單元)被抽中的概率。估計(jì)量不僅與樣本單元的觀測值有關(guān),也與其入樣概率有關(guān)。概率抽樣的優(yōu)點(diǎn):能得到總體目標(biāo)量的估計(jì)值,并能計(jì)算出每個(gè)估計(jì)值的抽樣誤差,從而得到對總體目標(biāo)量進(jìn)行推斷的可靠程度。另外,也可以按照要求的精確度,計(jì)算必要的樣本單元數(shù)目。這兩大優(yōu)點(diǎn)為調(diào)查方案的評估提供了有力的依據(jù)。與非概率抽樣相比,概率抽樣比較復(fù)雜,對調(diào)查人員的專業(yè)技術(shù)要求高,調(diào)查費(fèi)用較高,但其優(yōu)點(diǎn)是其他調(diào)查方法無可替代的,所以概率抽樣成為抽樣調(diào)查中最主要的方式。非概率抽樣:抽取樣本時(shí)不依據(jù)隨機(jī)原則。常見的非概率抽樣方法有:判斷選樣(由調(diào)查人員人為確定樣本單元)、方便抽樣(例如“攔截式”調(diào)查,比較適合探索性研究)、自愿樣本(比如網(wǎng)上調(diào)查)、配額抽樣(將總體中的各單元按一定標(biāo)準(zhǔn)化分為若干類型,將樣本數(shù)額分配到各類型中,從各類型中抽取樣本的方法則沒有嚴(yán)格限制,一般采用方便抽樣的方法抽取樣本單元)。非概率抽樣的優(yōu)點(diǎn)是操作簡單,不需要抽樣框,經(jīng)濟(jì)、快速,調(diào)查數(shù)據(jù)的處理也容易,所以有廣闊的應(yīng)用空間。非概率抽樣的局限是不能計(jì)算抽樣誤差,不能從概率的意義上控制誤差,樣本數(shù)據(jù)不能對總體情況進(jìn)行推斷。同時(shí)由于抽取樣本時(shí)具有較大的隨意性,從而導(dǎo)致被調(diào)查單元間存在系統(tǒng)性差異。簡述輔助信息在抽樣調(diào)查中的作用。在抽樣調(diào)查中,輔助信息可以用于抽樣的設(shè)計(jì)、目標(biāo)量的估計(jì),還可以用于調(diào)查數(shù)據(jù)的處理。抽樣設(shè)計(jì):在抽樣設(shè)計(jì)階段,許多抽樣方法都需要利用輔助信息。如分層抽樣需要利用輔助信息進(jìn)行分層,把總體各單元按相應(yīng)規(guī)則分到各個(gè)層中。好的分層應(yīng)該做到去定合理的層數(shù)、層界,單元應(yīng)該分別歸屬于哪層,每層樣本量多少等(如不等概抽樣中單元規(guī)模這個(gè)輔助信息)??梢哉f,進(jìn)行任何抽樣設(shè)計(jì)都需要輔助信息,抽樣框是輔助信息集中的體現(xiàn),輔助信息內(nèi)容越多、質(zhì)量越高,就為進(jìn)行良好的抽樣設(shè)計(jì)提供更多更好的素材,具有充分的輔助信息也是良好抽樣框的重要標(biāo)志。(有些輔助信息在抽樣前不知道,事后分層等…)估計(jì):在抽樣估計(jì)階段(即估計(jì)量設(shè)計(jì)階段),可以利用輔助信息改進(jìn)估計(jì)方法,提高估計(jì)的精度,這一點(diǎn)在比率估計(jì)和回歸估計(jì)中表現(xiàn)明顯(舉例,如比率估計(jì)等引入輔助變量x;事后分層等)關(guān)于數(shù)據(jù)調(diào)整:一個(gè)是對入樣單元進(jìn)行權(quán)數(shù)的計(jì)算和調(diào)整;另一個(gè)是利用輔助信息減小調(diào)查中無回答的偏差,提高了估計(jì)的精度。(如調(diào)查中男女比率差異,按性別輔助信息引入分層等)計(jì)算題為了解某小區(qū)住戶的平均月支出(單位:元),在7000戶家庭中按不放回簡單隨機(jī)抽樣抽出200戶進(jìn)行調(diào)查,并得到樣本均值EQ\*jc2\*hps16\o\ad(\s\up15(_),y)=1800,樣本方差s2=640000。(1)試估計(jì)該小區(qū)住戶的平均月支出,并給出95%置信度下的區(qū)間估計(jì)。(2)若要求估計(jì)的相對誤差不超過10%,則需抽出多少戶家庭進(jìn)行調(diào)查?【解】由已知得:N=7000,n=200,EQ\*jc2\*hps10\o\ad(\s\up9(_),y)=1800,s2=640000,s=800,f=n/N≈0.02857(1)該小區(qū)住戶的平均月支出估計(jì)值為Y=EQ\*jc2\*hps10\o\ad(\s\up9(_),y)=1800v(EQ\*jc2\*hps10\o\ad(\s\up9(_),y))=1-fns2=1-0.02857200*640000≈3108.57695%置信度下的區(qū)間估計(jì)為:EQ\*jc2\*hps10\o\ad(\s\up9(_),y)±z0.025v(y)=1800±1.96*3108.576=1800±109.28因此區(qū)間估計(jì)為:[1690.72,1909.28](2)n0=z0.0252*s2/(r2EQ\*jc2\*hps10\o\ad(\s\up9(_),y)2)=1.962×6400000.12×18002=2388381.1123232400則需抽取76戶家庭進(jìn)行調(diào)查。有下列數(shù)據(jù)層WhEQ\*jc2\*hps10\o\ad(\s\up9(_),y)hshph10.353.120.5420.553.93.30.3930.17.811.30.24設(shè)n=1000(1)采用按比例分層抽樣的方法估計(jì)EQ\*jc2\*hps12\o\ad(\s\up11(_),Y)和P并計(jì)算其標(biāo)準(zhǔn)誤;(2)采用奈曼分配的方法估計(jì)EQ\*jc2\*hps12\o\ad(\s\up11(_),Y)和P并計(jì)算標(biāo)準(zhǔn)誤;(3)將按比例分配和奈曼分配與簡單隨機(jī)抽樣相比能提高效率多少?!窘狻浚?)根據(jù)題中已知條件,采用按比例分層抽樣的方法估計(jì)EQ\*jc2\*hps10\o\ad(\s\up9(_),Y)為:Y=EQ\*jc2\*hps10\o\ad(\s\up9(_),y)prop=1LWhyh估計(jì)EQ\*jc2\*hps10\o\ad(\s\up9(_),Y)的方差和標(biāo)準(zhǔn)誤差為 :vprop(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=1-fnSw2=1-fn1LWhSh2≈sprop(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=v(yst)=0.0201585≈估計(jì)P及其方差和標(biāo)準(zhǔn)誤差為:pprop=1LWv(pprop)≈1-fn1LWhps(pprop)=v(pprop)=(2)采用Neyman分配的方法估計(jì)EQ\*jc2\*hps10\o\ad(\s\up9(_),Y)和P的方法和與(1)是一樣的,即Y=EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st=1LWhyhpprop=1LW但是采用Neyman分配估計(jì)EQ\*jc2\*hps10\o\ad(\s\up9(_),Y)和P的方差的方法不同,分別為:v(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=1n(1LWhSh)2-1s(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=v(yst)=0.013286≈0.115265v(pst)≈1n(1LWhphqh)2=1s(pst)=v(pprop)=(3)由于Vsrs(EQ\*jc2\*hps10\o\ad(\s\up9(_),y))=1-fnS2≈11000(1LWh比例分配的設(shè)計(jì)效應(yīng)為deffprop=v(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)prop)/Vsrs(EQ\*jc2\*hps10\o\ad(\s\up9(_),y))=0.02015850.0218914≈0.9208,所以與簡單隨機(jī)抽樣相比比例分配能提高效率1-deffprop=7.92%;內(nèi)曼分配的設(shè)計(jì)效應(yīng)為deffopt=v(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)/Vsrs(EQ\*jc2\*hps10\o\ad(\s\up9(_),y))=0.0132860.0218914≈0.6069,所以與簡單隨機(jī)抽樣相比內(nèi)曼分配能提高效率1-deffopt=39.31%.試題卷號(hào):4名詞解釋目標(biāo)總體和抽樣總體目標(biāo)總體也可簡稱為總體,是指所有研究對象的總體,或者是研究人員希望從中獲取信息的總體,它是研究對象中所有性質(zhì)相同的個(gè)體所組成。抽樣總體是指從中抽取樣本的總體。通常情況下,抽樣總體應(yīng)該與目標(biāo)總體完全一致,但實(shí)踐中兩者不一致的情況卻時(shí)常發(fā)生。分層抽樣也叫類型抽樣法,是將抽樣單元按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本,將各層的樣本結(jié)合起來,對總體的目標(biāo)量進(jìn)行估計(jì)。交叉子樣本在抽樣時(shí),對同一個(gè)總體按照同樣的抽樣方法,獨(dú)立或非獨(dú)立地來進(jìn)行兩個(gè)或兩個(gè)以上樣本的抽取,并使得每個(gè)子樣本對總體參數(shù)都提供一個(gè)有用的估計(jì),則被抽取的子樣本稱為交叉子樣本。交叉子樣本方法最早是由印度統(tǒng)計(jì)學(xué)家馬哈拉諾比斯(P.C.Mahalanobis,1936年)所提出,最初用于總體參數(shù)的估計(jì),以后擴(kuò)大應(yīng)用于抽樣和非抽樣誤差的估計(jì)。逆抽樣方法針對樣本中含有稀少項(xiàng)目很少或沒有(設(shè)比例為P)的情況(調(diào)查產(chǎn)生比較大的偏差),事先根據(jù)調(diào)查精度和成本的要求,制定出樣本中出現(xiàn)稀少項(xiàng)目的單元個(gè)數(shù)為n,然后一個(gè)一個(gè)地隨機(jī)抽取樣本,直到樣本中具有這種屬性的單元個(gè)數(shù)為n為止,然后對樣本容量X的分布及P的估計(jì)的方法。簡述題說明總體方差和估計(jì)量方差各自的作用,以及它們之間的相互關(guān)系??傮w方差是未知的,但是確定存在的。估計(jì)量方差可以由樣本數(shù)據(jù)計(jì)算出來,但只是總體的近似反映,未必等于真實(shí)值。試述隨機(jī)化回答技術(shù)作用、特點(diǎn),談?wù)勀銓﹄S機(jī)化回答技術(shù)的理解。在調(diào)查中當(dāng)一個(gè)問題是敏感性的或高度私人機(jī)密性的,則就會(huì)發(fā)生拒絕回答或回避回答的情況。為了獲得對這類問題總體比例進(jìn)行估計(jì)的資料,就需要采用隨機(jī)化回答技術(shù)。其基本特點(diǎn)是1)被調(diào)查者對所調(diào)查的問題采取隨機(jī)回答的方式,調(diào)查人員無法從被調(diào)查者的回答中得知對方是否具有某種特征。這樣,就可以在一定程度上消除被調(diào)查者的擔(dān)心和顧慮,使他們參與調(diào)查,并提供真實(shí)情況。2)另一方面,調(diào)查人員通過對所有調(diào)查結(jié)果的匯總。利用概率原理進(jìn)行推算,又可以得到總體中具有該特征人數(shù)比例的估計(jì)值,從而實(shí)現(xiàn)調(diào)查的目的。因而,隨機(jī)化回答技術(shù)被認(rèn)為是對敏感性問題進(jìn)行調(diào)查,并對總體的特征比例進(jìn)行數(shù)量推算的有效方法。個(gè)人對隨機(jī)化回答技術(shù)有如下理解:1)從理論上講,隨機(jī)化回答技術(shù)既可以用于訪問調(diào)查,也可以用于郵寄問卷等其他方式的調(diào)查。但是,隨機(jī)化回答問卷的設(shè)計(jì)比其他一般性調(diào)查問卷的設(shè)計(jì)要復(fù)雜。例如,在郵寄問卷調(diào)查中,被調(diào)查者很可能因?yàn)榭床欢畣柧矶恢绾位卮?,在訪問調(diào)查中,調(diào)查人員可以詳細(xì)地向被調(diào)查者說明隨機(jī)化回答技術(shù)的原理,并講解如何回答這種類型的問卷,必要時(shí)還可以進(jìn)行示范,幫助被調(diào)查者理解和掌握。所以,與其他調(diào)查方法相比,訪問調(diào)查在使用隨機(jī)化回答技術(shù)方面有更多的便利條件。2)傳統(tǒng)的隨機(jī)化回答技術(shù)(如Warner)都是針對單變量數(shù)據(jù)的,其主要目的是為了獲得具有敏感特性回答的概率估計(jì)。然而,被調(diào)查者的輔助信息卻在一些情況下格外有用,以至于可以將其與肯定回答相聯(lián)系。Maddala(1983)以及Scheers和Dayton(1988)便將這些帶有輔助信息的解釋變量納入隨機(jī)化回答模型中。其優(yōu)點(diǎn)在于可以減少標(biāo)準(zhǔn)誤差,并可以確立協(xié)變量信息與敏感特性的總體概率之間關(guān)系。傳統(tǒng)的隨機(jī)化回答模型的另一個(gè)主要缺點(diǎn)是只能獲得與總體水平有關(guān)的結(jié)論——總體概率的估計(jì)和相關(guān)置信區(qū)間。這與當(dāng)時(shí)僅對單變量數(shù)據(jù)進(jìn)行相關(guān)與無關(guān)隨機(jī)化回答方法的發(fā)展目的一致,但卻不能滿足于調(diào)查者對單位水平參數(shù)的研究,這也導(dǎo)致無法對一些產(chǎn)生敏感特性的原因進(jìn)行剖析。此外在具體設(shè)計(jì)與操作上應(yīng)該注意:1)要使被調(diào)查者充分理解這種方法的特點(diǎn),特別是一定要讓被調(diào)查者明白,他究竟回答的是哪一個(gè)問題,別人是不知道的,因此在正式抽取并回答問題前,要讓被調(diào)查者作幾次試驗(yàn);2)所提問題必須簡單明了,防止有不同的理解。3)在應(yīng)用西蒙斯模型時(shí),無關(guān)問題的選擇特別重要。一定要隱蔽性強(qiáng)的,即調(diào)查人無從猜測被調(diào)查人對該問題回答的答案。計(jì)算題有下列數(shù)據(jù)層NhShEQ\*jc2\*hps10\o\ad(\s\up9(_),Y)h16023230453101512現(xiàn)令n=40,要求(1)樣本在各層中進(jìn)行的按比例分配;(2)樣本在各層中進(jìn)行的最優(yōu)分配;(3)計(jì)算最優(yōu)分配較按比例分配的得益;(4)計(jì)算按比例分配較簡單隨機(jī)抽樣的得益。【解】由已知得:L=3,n=40,N=1LN(1)由nh=nNh/N=Nhf得n1=0.4*60=24,n2=0.4*30=12,n3=0.4*10=4,Vprop(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=1-fnSw2=1-f(2)由內(nèi)曼分配nh=NhSh1LNhn1=120390*40≈12.30≈n2=120390*40≈12.30≈n3=150390*40≈15.38≈Vopt(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=1n(1LWh140*(0.6*2+0.3*4+0.1*15)2-1100*(0.6*4+0.3*16+0.1*225)=(3)由1,2得最優(yōu)分配較按比例分配的得益為1-Vopt(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)/Vprop(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=1-0.083250.4455≈81.31%(4)由于S2≈1LWhSh2+1LWh(YhVsrs(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=1-fnS2=1-fn1LWhSh2+1-fn1LWh(Y=0.4455+1-0.440*(0.6*1.52+0.3*0.52+0.1*7.52按比例分配較簡單隨機(jī)抽樣的得益為:1-Vprop(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)/Vsrs(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=19.18%要調(diào)查學(xué)生對某課程的興趣問題,設(shè)我們將問題陳述為“我對該課程感興趣”和“我對該課程不感興趣”,對此問題我們采用沃納模型處理,預(yù)先設(shè)定P=4/5,在接受調(diào)查并作出明確回答的320人中(假定被調(diào)查者如實(shí)回答問題),結(jié)果統(tǒng)計(jì)出回答“是”的人數(shù)為156人,請估計(jì)對該課程感興趣學(xué)生比例的置信區(qū)間?!窘狻堪碬arner模型,我們假定(p:卡片A的比例;1-p:卡片B的比例;n:樣本量;n1:回答是的人數(shù);n2:回答否的人數(shù);πA:總體中具有卡片A特征的人數(shù)的比例;)由已知得P=4/5,n=320,則點(diǎn)估計(jì)式:EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A=12P-1(n1n)–(1-P2P-1)=53*156320-15*53=1316πA的方差估計(jì)量:V(EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A)=EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A(1-EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A)/n+P(1-P)n(2P-1)2≈0.000780+0.001389=0.002169從而95%的區(qū)間估計(jì)式為EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A±Z0.0250.002169=EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A±1.96*0.002169=0.4792±0.09128,因此該比例的置信區(qū)間為[0.3879,0.5705]試題卷號(hào):5名詞解釋抽樣框抽樣框又稱“抽樣框架”、“抽樣結(jié)構(gòu)”,是指對可以選擇作為樣本的總體單位列出名冊或排序編號(hào),以確定總體的抽樣范圍和結(jié)構(gòu)。設(shè)計(jì)出了抽樣框后,便可采用抽簽的方式或按照隨機(jī)數(shù)表來抽選必要的單位數(shù)。若沒有抽樣框,則不能計(jì)算樣本單位的概率,從而也就無法進(jìn)行概率選樣。比例分配在分層抽樣中,若每層的樣本量nh都與層的大小Nh成比例,即nhNh=nN或記為fh=f,h系統(tǒng)抽樣將總體中的所有單元(抽樣單元)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)抽取一個(gè)單元作為初始單元,然后按事先規(guī)定好的規(guī)則確定其他樣本單元,這種抽樣方法稱為系統(tǒng)抽樣。(典型的系統(tǒng)抽樣是先從數(shù)字1~k中隨機(jī)抽取一個(gè)數(shù)字r作為初始單元,以后依次取第r+k,r+2k,…單元。)西蒙斯模型是1967年由西蒙斯(Simmons)提出的。其設(shè)計(jì)思想仍是基于沃納的相關(guān)問題隨機(jī)化選答的思想,只是在設(shè)計(jì)中,改用無關(guān)的問題代替了沃納模型中的敏感性問題的對立問題。通常選用與敏感性問題無關(guān)并且容易獲得的樣本特點(diǎn)作為無關(guān)問題進(jìn)行提問(如生日、性別等)。比傳統(tǒng)的‘去敏感化’技術(shù)更具有保密性,因此更容易獲得調(diào)查者的配合,適宜于調(diào)查敏感性程度很高的問題。簡述題什么是樣本量?試對影響樣本量的因素進(jìn)行分析。樣本量又稱“樣本容量”,指一個(gè)樣本的必要抽樣單位數(shù)目。在組織抽樣調(diào)查時(shí),抽樣誤差的大小直接影響樣本指標(biāo)代表性的大小,而必要的樣本單位數(shù)目是保證抽樣誤差不超過某一給定范圍的重要因素之一。(樣本量直接影響抽樣誤差、調(diào)查的費(fèi)用、調(diào)查所需的時(shí)間、調(diào)查訪員的數(shù)量以及其他一些重要的現(xiàn)場操作的限制條件。樣本量過大,會(huì)造成人力、物力和財(cái)力的浪費(fèi);樣本量過小,會(huì)造成抽樣誤差增大,影響抽樣推斷的可靠程度。)因此,在抽樣設(shè)計(jì)時(shí),必須決定樣本單位數(shù)目,因?yàn)檫m當(dāng)?shù)臉颖締挝粩?shù)目是保證樣本指標(biāo)具有充分代表性的基本前提。影響樣本容量的因素:研究目的、個(gè)體變異、檢驗(yàn)水準(zhǔn)、對精確度的要求、(把握度/置信度)等。具體描述為:1)抽樣推斷的可靠程度。要求推斷的可靠程度越高,概率度的數(shù)值越大,抽樣單位數(shù)也就要求多些;反之,則可少抽一些。2)總體標(biāo)志變異程度。方差大,需要多抽一些;方差小,可少抽一些。3)極限誤差的大小。極限誤差大可以少抽些,極限誤差小則應(yīng)多抽些。4)抽樣方法與組織方式。在相同條件下,重復(fù)抽樣需要多抽一些,不重復(fù)抽樣可少抽一些。5)實(shí)際調(diào)查運(yùn)作的限制(人力、物力和財(cái)力的可能條件)??蛻籼峁┑慕?jīng)費(fèi)能支持多大的樣本?調(diào)查持續(xù)的時(shí)間有多長?需要多少訪員?能招聘到的訪員有多少?在確定調(diào)查最終所需的樣本量時(shí),還必須考慮樣本量計(jì)算統(tǒng)計(jì)科普公式?jīng)]有涉及到的這些限制。試述在什么情況下需要采用不等概率抽樣,并舉例說明。不等概抽樣適用于如下情況:抽樣單元在總體中所占的地位不一致。例如,對某市商業(yè)銷售額進(jìn)行調(diào)查時(shí),以商場為抽樣單元。雖然大型或特大型的商場數(shù)量不多,但占總銷售額的份額較大;而小商店數(shù)量多,市場份額卻不大。對于這種情況,將大型商場和小商店同等對待并不合理;另外,由于規(guī)模和管理水平的原因,對大型商場的調(diào)查往往比較容易,可以做得細(xì)致一些,而對小商店的調(diào)查往往比較困難,也沒有必要對占市場份額不大的這部分單元花太大的精力做過多的調(diào)查,因此在調(diào)查時(shí),大型商場應(yīng)該處于更重要的地位。調(diào)查的總體單元與抽樣總體的單元不一致。例如某大型單位準(zhǔn)備對職工家庭情況進(jìn)行調(diào)查,一種自然的辦法是以人事部門的職工花名冊作為抽樣框進(jìn)行抽樣,該單位中的少數(shù)家庭有兩名職工在該單位工作,如果對職工進(jìn)行簡單隨機(jī)抽樣,則雙職工家庭被抽中的概率大,而調(diào)查者希望對家庭進(jìn)行等概率抽樣。除了對抽樣框進(jìn)行整理,將雙職工家庭中的一名成員從抽樣框中剔除,還可以對職工采用不等概抽樣,一種做法是對每名職工記錄其家庭成員在該單元工作的人數(shù),然后對每名職工按與人數(shù)成反比的概率進(jìn)行抽樣。改善估計(jì)量。不等概抽樣可用于對估計(jì)量進(jìn)行改善,例如簡單隨機(jī)抽樣比率估計(jì)量是漸進(jìn)無偏的,要使其成為無偏估計(jì),只要每個(gè)大小為n的樣本被抽中的概率與其輔助變量的和1nx不等概抽樣除了應(yīng)用于上述幾種情況,還廣泛應(yīng)用于整群抽樣、多階段抽樣中初級(jí)單元規(guī)模相差較大的情形。不等概抽樣的優(yōu)點(diǎn)主要是大大提高了估計(jì)精度,但使用它有前提條件,即必須要有說明每個(gè)單元規(guī)模大小的輔助變量來確定每個(gè)單元入樣的概率,這在抽樣設(shè)計(jì)及估計(jì)時(shí)都是必須的。計(jì)算題某住宅區(qū)調(diào)查居民的用水某鎮(zhèn)在2000戶家庭中隨機(jī)抽選36戶家庭調(diào)查生活費(fèi)用支出,以y表示食物支出費(fèi)用,x表示總支出費(fèi)用,得恩格爾系數(shù)(食物支出在總支出中所占的比例),r=EQ\*jc2\*hps16\o\ad(\s\up15(_),y)/EQ\*jc2\*hps16\o\ad(\s\up15(_),x)=41.7%,y與x的樣本變異系數(shù)分別是cy=0.09,cx=0.085,y與x的相關(guān)系數(shù)EQ\*jc2\*hps16\o\ad(\s\up15(^),ρ)=0.79,給定置信度95%,求恩格爾系數(shù)的區(qū)間估計(jì)?!窘狻坑梢阎茫簉=0.417,cy=0.09,cx=0.085,EQ\*jc2\*hps16\o\ad(\s\up15(^),ρ)=0.79,N=2000,n=36,f=n/N=36/2000=0.018V(EQ\*jc2\*hps10\o\ad(\s\up9(^),R))=V(r)≈1-fnr2(cx2從而恩格爾系數(shù)95%置信度的區(qū)間估計(jì)為:r±z0.025V(r)=0.417±1.96*0.00001536即[0.4093,0.5478]試題卷號(hào):6名詞解釋總體參數(shù)描述總體特性的指標(biāo)稱為總體參數(shù),簡稱參數(shù)。總體的均值、方差等都是總體參數(shù)。(總體參數(shù)4種類型總體均值、總體總值、總體比例、總體比率等)內(nèi)曼分配分層隨機(jī)抽樣中,各層中每個(gè)單位費(fèi)用一樣(即Ch=C)時(shí)樣本單位的最優(yōu)分配方法。設(shè)nh為各層的樣本含量,Nh為h層單位總數(shù),Sh為h層標(biāo)準(zhǔn)差,n為樣本總含量(固定),內(nèi)曼(Neyman)1934年證明,當(dāng)nh=nNhSh/hNhSh時(shí),這種分配為最優(yōu)分配即V(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)不等概抽樣不等概率抽樣是指在抽取樣本之前給總體的每一個(gè)單元賦予一定的被抽中概率(最常用的是按總體單元的規(guī)模大小來確定抽選的概率)。不等概率抽樣分為放回與不放回兩種情況。直線等距抽樣假設(shè)總體單元數(shù)為N,樣本容量為n,N=nk,且總體中的N個(gè)單元已按某種確定順序編號(hào)為1,2,…,N。抽樣程序是先從k個(gè)單元編號(hào)中隨機(jī)抽出一個(gè)單元編號(hào),然后每隔k個(gè)單元編號(hào)抽出一個(gè)單元編號(hào),直到抽出n個(gè)單元編號(hào)為止,則這種等距抽樣稱為直線等距抽樣。簡述題什么是不完備抽樣框,列舉各種可能出現(xiàn)的情況以及對抽樣推斷的影響。不完備抽樣框是指抽樣框中包含的單元與目標(biāo)總體的單元不一致,例如屬于調(diào)查對象的單元在抽樣框中不存在,不屬于調(diào)查對象的單元卻出現(xiàn)在抽樣框中。不完善抽樣框還包括這樣的情況,抽樣框中的輔助信息與現(xiàn)實(shí)情況嚴(yán)重偏離,造成樣本抽取的‘誤導(dǎo)’。使用不完善的抽樣框是產(chǎn)生非抽樣誤差的一個(gè)重要原因??赡艿那闆r及影響包含:丟失目標(biāo)總體單元。指抽樣框沒能覆蓋所有總體單元。丟失單元會(huì)造成總量估計(jì)偏低,也會(huì)造成均值(或比例)估計(jì)的偏差。包含非目標(biāo)總體單元。指抽樣框中包含一些本不屬于調(diào)查對象的非目標(biāo)總體單元。包含非目標(biāo)單元使得抽樣總體單元個(gè)數(shù)大于目標(biāo)總體單元個(gè)數(shù),造成總量估計(jì)偏高。復(fù)合聯(lián)結(jié)。指抽樣框中的單元與目標(biāo)總體單元不完全呈一一對應(yīng)關(guān)系,一個(gè)抽樣框單元聯(lián)結(jié)多個(gè)目標(biāo)單元的情形,或一個(gè)目標(biāo)單元聯(lián)結(jié)多個(gè)抽樣框單元。如果復(fù)合聯(lián)結(jié)的情況嚴(yán)重,將會(huì)造成樣本的實(shí)際抽取與設(shè)計(jì)要求發(fā)生偏離,從而對估計(jì)結(jié)果產(chǎn)生影響。不正確的輔助信息。有些抽樣設(shè)計(jì)需要抽樣框提供輔助信息,如分層抽樣、不等概抽樣、比率估計(jì)和回歸估計(jì)等。如果這些輔助信息不完全或不正確,不僅不能提高估計(jì)的效率,有時(shí)反而會(huì)降低估計(jì)的準(zhǔn)確性。試述抽樣調(diào)查中產(chǎn)生偏差的原因以及如何對待這些偏差。抽樣調(diào)查中產(chǎn)生偏差的原因主要有抽樣誤差(隨機(jī)誤差)及非抽樣誤差(或系統(tǒng)性誤差)兩大類。前者是由樣本結(jié)構(gòu)與總體結(jié)構(gòu)的隨機(jī)差異而導(dǎo)致產(chǎn)生的,它雖然不可避免,但可以用公式計(jì)算,其大小可以通過調(diào)整樣本容量或改變抽樣方式加以控制。后者按來源性質(zhì)不同分為三種:抽樣框誤差:即由不完善的抽樣框引起的誤差。首先把握抽樣框誤差的類型,在此基礎(chǔ)上探討減少抽樣框誤差的途徑。對不完善抽樣框進(jìn)行補(bǔ)救大致分為三種類型:第一種利用核查或其它有關(guān)資料,掌握誤差情況,對不完善的抽樣框進(jìn)行調(diào)整,或?qū)Σ煌晟瞥闃涌蛩玫墓烙?jì)量進(jìn)行調(diào)整;第二種是事先制定一些規(guī)則,對發(fā)現(xiàn)的抽樣框問題進(jìn)行現(xiàn)場處理;第三種是使用多個(gè)抽樣框進(jìn)行抽樣。無回答誤差:即由于種種原因沒有從被調(diào)查單元獲得調(diào)查結(jié)果,造成調(diào)查數(shù)據(jù)缺失。可以采用措施有:問卷設(shè)計(jì)具有吸引力,引起被調(diào)查者參與的興趣;充分利用調(diào)查組織者的權(quán)威性和社會(huì)影響力,激發(fā)被調(diào)查者的參與意識(shí);確定準(zhǔn)確的調(diào)查方位;采取有助于消除被調(diào)查者冷漠、擔(dān)心或懷疑的措施(如預(yù)先通知、調(diào)查前解釋說明等);注意調(diào)查人員挑選;做好調(diào)查人員培訓(xùn),增強(qiáng)調(diào)查人員責(zé)任心;注意調(diào)查過程的監(jiān)控;獎(jiǎng)勵(lì)措施;再次調(diào)查;替換被調(diào)查單元。此外,盡量避免敏感問題的調(diào)查,如無法避免,可采用隨機(jī)化回答技術(shù)(如Warner、Simons模型等)。對無回答數(shù)據(jù)采用再抽樣調(diào)查、加權(quán)調(diào)整、相關(guān)推估法、插補(bǔ)調(diào)整等方式進(jìn)行數(shù)據(jù)調(diào)整。計(jì)量誤差:即所獲得的調(diào)查數(shù)據(jù)與其真值之間不一致造成的誤差。減少計(jì)量誤差需要對調(diào)查全過程進(jìn)行質(zhì)量控制。包含有調(diào)查設(shè)計(jì)方面(設(shè)計(jì)出更好的調(diào)查問卷和抽樣程序);現(xiàn)場準(zhǔn)備方面(招聘訪問員、培訓(xùn)訪問員、編寫調(diào)查手冊);調(diào)查結(jié)果審核方面(有效性審核、一致性審核、數(shù)據(jù)分布審核,審核工作可以在搜集數(shù)據(jù)、數(shù)據(jù)搜集完畢后(重點(diǎn)在一致性審核和離群值的檢測)等任何階段進(jìn)行)計(jì)算題從某農(nóng)村的200戶有下列總體分為三層層各單元標(biāo)志值1245568288101414183161616182226令n=10,設(shè)各層中每單元的費(fèi)用相等。(1)按最優(yōu)分配抽取樣本計(jì)算EQ\*jc2\*hps14\o\ad(\s\up13(_),y)st及v(EQ\*jc2\*hps14\o\ad(\s\up13(_),y)st);(2)計(jì)算Deff因子;(3)若達(dá)到以上同樣的精度采用簡單隨機(jī)抽樣的樣本量應(yīng)為多少?【解】由已知得N=18,n=10,L=3,W1,2,3=6/18=1/3,EQ\*jc2\*hps10\o\ad(\s\up9(_),Y)1=5,EQ\*jc2\*hps10\o\ad(\s\up9(_),Y)2=12,EQ\*jc2\*hps10\o\ad(\s\up9(_),Y)3=19,S12=4,S22=16,S32=17.2,f=10/18=0.556(1)由于W相同,所以nk=nSh/1LS從而n1=10*2/10.147≈1.97≈2n2=10*4/10.147≈3.94≈4n3=10*17.2/10.147≈4.08≈4EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st=1LWhYhV(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=1n(1LWhSh)2-1(2)由1得S2=1N-11N(Yi-Deff=Var(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)/((1-f)S2/n)=0.4551×10(1-0.556)×45.53≈0.225(3)設(shè)簡單隨機(jī)抽樣的樣本量為n’,則n=n’.deff,因此n’=n/deff=10/0.225≈44.44即簡單隨機(jī)抽樣的樣本量應(yīng)為44.試題卷號(hào):7名詞解釋統(tǒng)計(jì)量統(tǒng)計(jì)量是統(tǒng)計(jì)理論中用來對數(shù)據(jù)進(jìn)行分析、檢驗(yàn)的變量。統(tǒng)計(jì)量根據(jù)樣本的n個(gè)單元值計(jì)算出一個(gè)量,也叫估計(jì)量,用于對總體參數(shù)的估計(jì)。(與總體參數(shù)相對應(yīng),常用估計(jì)量有均值估計(jì)、總值估計(jì)、比例估計(jì)、比率估計(jì)等)目錄抽樣是全面調(diào)查和抽樣調(diào)查相結(jié)合的一種新型的調(diào)查方法,也可以說是一種特殊的分層抽樣。目錄抽樣是一種對高度偏斜總體(總體次數(shù)分布呈高度偏態(tài)分布,總體內(nèi)部差異較大,由指標(biāo)值較大而數(shù)目較少單位(通常稱為重點(diǎn)單位)和指標(biāo)值較小而數(shù)目較多單位兩部分組成)實(shí)施抽樣調(diào)查的有效方法。目錄抽樣主張按上述兩部分分為兩層,少數(shù)指標(biāo)值較大單位構(gòu)成重點(diǎn)單位層,大量指標(biāo)值較小單位構(gòu)成抽樣調(diào)查層。前者進(jìn)行全面調(diào)查,后者進(jìn)行抽樣調(diào)查,最后綜合使用兩層的調(diào)查結(jié)果給出總體目標(biāo)量的估計(jì)。循環(huán)等距抽樣假設(shè)總體單元數(shù)為N,樣本容量為n,N≠nk,總體中的N個(gè)單元已按某種確定順序編號(hào)為1,2,…,N,如將這些編號(hào)看成首尾相連的一個(gè)環(huán),并從1到N中按簡單隨機(jī)抽樣方式抽取一個(gè)單元編號(hào)作為隨機(jī)起點(diǎn)r,然后每隔k抽取一個(gè)單元編號(hào),直到抽滿n個(gè)單元為止,則這種等距抽樣稱為循環(huán)等距抽樣,又稱圓形等距抽樣。隨機(jī)化回答簡述題介紹簡單隨機(jī)抽樣,包括特點(diǎn),作用和應(yīng)用場合。簡單隨機(jī)抽樣也稱為單純隨機(jī)抽樣、純隨機(jī)抽樣、SRS抽樣,是指從總體N個(gè)單位中任意抽取n個(gè)單位作為樣本,使每個(gè)可能的樣本被抽中的概率相等的一種抽樣方式。簡單隨機(jī)抽樣的特點(diǎn)是:每個(gè)樣本單位被抽中的概率相等,樣本的每個(gè)單位完全獨(dú)立,彼此間無一定的關(guān)聯(lián)性和排斥性。(1)簡單隨機(jī)抽樣要求被抽取的樣本的總體個(gè)數(shù)N是有限的。(2)簡單隨機(jī)樣本數(shù)n小于等于樣本總體的個(gè)數(shù)N。(3)簡單隨機(jī)樣本是從總體中逐個(gè)抽取的。(4)簡單隨機(jī)抽樣是一種不放回的抽樣。(5)系統(tǒng)抽樣的每個(gè)單元入樣的可能性均為n/N。簡單隨機(jī)抽樣具有一定局限性:1、事先要把研究對象編號(hào),比較費(fèi)時(shí)、費(fèi)力。2、總體分布較為分散,會(huì)使抽取的樣本的分布也比較分散,給研究帶來困難3、當(dāng)樣本容量較小時(shí),可能發(fā)生偏向,影響樣本的代表性。4、當(dāng)已知研究對象的某種特征將直接影響研究結(jié)果時(shí),要想對其加以控制,就不能采用簡單隨機(jī)取樣法。簡單隨機(jī)抽樣(Simplerandomsampling)是其它抽樣方法的基礎(chǔ),因?yàn)樗诶碚撋献钊菀滋幚?而且當(dāng)總體單位數(shù)N不太大時(shí),實(shí)施起來并不困難。但在實(shí)際中,若N相當(dāng)大時(shí),簡單隨機(jī)抽樣就不是很容易辦到的。首先它要求有一個(gè)包含全部N個(gè)單位的抽樣框;其次用這種抽樣得到的樣本單位較為分散,調(diào)查不容易實(shí)施。因此,在實(shí)際中直接采用簡單隨機(jī)抽樣的并不多。通常適用于總體個(gè)數(shù)較少的情況。對多階段抽樣中自加權(quán)…計(jì)算題為了解某小區(qū)住戶調(diào)查某條街的居民居住條件,從該街道的100個(gè)居民小組隨機(jī)抽取了8個(gè)居民小組,取得以下數(shù)據(jù)樣本居民小組12345678居民數(shù)4039125237334114房間數(shù)5872269874577648要求:(1)估計(jì)平均每個(gè)居民擁有的房間數(shù)并計(jì)算估計(jì)精度;(2)該條街共有多少房間及其估計(jì)的精度;說明你上述使用的估計(jì)量是有偏的還是無偏的?!窘狻坑梢阎O(shè)房間數(shù)為Y,居民數(shù)為X,n=8,N=100,f=n/N=0.08,EQ\*jc2\*hps10\o\ad(\s\up9(_),x)=33.5,EQ\*jc2\*hps10\o\ad(\s\up9(_),y)=63.625(1)平均每個(gè)居民擁有的房間數(shù)估計(jì)值為EQ\*jc2\*hps12\o\ad(\s\up11(^),R)=r=1nyi1nxi=509/V(EQ\*jc2\*hps12\o\ad(\s\up11(^),R))=V(r)≈1X21-fn1n-11n(從而95%置信度下區(qū)間估計(jì)為1.90±1.96*0.0008208,即[1.844,1.956](2)EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)=NEQ\*jc2\*hps10\o\ad(\s\up9(_),y)=Nn1nyi=12.5*(58+72+26+98+74+57+76+48)=6362.5V(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=N21-fn1n-11n(yi-y)2≈從而95%置信度下區(qū)間估計(jì)為6362.5±1.96*533579.4643,即[4930.79,7794.21]由于使用了有偏(漸進(jìn)無偏)的比率估計(jì),因此上述使用的估計(jì)量是有偏的。試題卷號(hào):8名詞解釋估計(jì)量方差估計(jì)量分布的方差稱為估計(jì)量方差,它是從平均的意義上說明估計(jì)值與待估參數(shù)的差異狀況,這也是我們對抽樣方案進(jìn)行評價(jià)的標(biāo)準(zhǔn)之一。(從這個(gè)意義上說,一個(gè)抽樣設(shè)計(jì)方案比另一個(gè)抽樣方案好,是因?yàn)樗墓烙?jì)量方差小)V(EQ\*jc2\*hps10\o\ad(\s\up9(^),θ))=E[EQ\*jc2\*hps10\o\ad(\s\up9(^),θ)-E(EQ\*jc2\*hps10\o\ad(\s\up9(^),θ))]2(是由于抽樣的隨機(jī)性而產(chǎn)生的一種隨機(jī)性誤差,沒有系統(tǒng)性)層界和層數(shù)在分層抽樣設(shè)計(jì)中,層界為分層的分界點(diǎn),層數(shù)指分層的數(shù)量。分層抽樣的L層由L-1個(gè)層界來確定。聯(lián)合比率估計(jì)是對比率的分子和分母分別加權(quán)計(jì)算出總體均值或總體總量的分層估計(jì)量,然后用對應(yīng)的分層估計(jì)量來構(gòu)造比估計(jì),即先‘加權(quán)’后‘比’,這樣所得的估計(jì)量稱為聯(lián)合比率估計(jì)。多階段抽樣多階段抽樣是先將一個(gè)很大的總體劃分為若干個(gè)子總體,即一階單位,再把一階單位劃分為若干個(gè)更小的單位,稱為二階單位,照此繼續(xù)下去劃分出更小的單位,依次稱為三階單位、四階單位等。然后分別按隨機(jī)原則逐階段抽樣。(抽樣過程分階段進(jìn)行,每個(gè)階段使用的抽樣方法往往不同)簡述題什么是樣本量?…試述二重抽樣的作用、特點(diǎn)和實(shí)踐中需要注意的問題。二重抽樣的主要作用是提高抽樣效率、節(jié)約調(diào)查經(jīng)費(fèi),具體有下列幾個(gè)方面:1)用于從總體所有基本單元中篩選確定出主調(diào)查對象。2)用于經(jīng)常性調(diào)查。3)用于了解陌生總體內(nèi)在結(jié)構(gòu)或分布的大致情況,為抽樣方法和抽樣組織形式的選擇提供依據(jù)。4)為分層抽樣推斷提供層權(quán)資料。5)為比率估計(jì)和回歸估計(jì)提供輔助資料。6)在經(jīng)常性的多項(xiàng)目抽樣調(diào)查中,用于解決不同調(diào)查項(xiàng)目需要不同樣本容量的問題。7)用于研究樣本輪換中的某些問題。8)降低無回答偏倚。二重抽樣的主要特點(diǎn)是先后進(jìn)行兩次抽樣,每次抽取一個(gè)樣本。實(shí)際進(jìn)行時(shí),兩次抽樣也可以同時(shí)進(jìn)行,只是對樣本中大多數(shù)個(gè)體或者單元僅調(diào)查一些簡單的輔助信息,進(jìn)行詳細(xì)調(diào)查的只是這些樣本中的一部分。第一步抽樣通常從總體中抽取一個(gè)比較大的樣本,稱為第一重樣本。對第一重樣本的調(diào)查主要是獲取有關(guān)總體的主要輔助信息,為下一步的第二重抽樣估計(jì)提供條件。第二重抽樣抽取的樣本相對較小,對它的調(diào)查才是主要調(diào)查。通常這個(gè)第二重樣本是從第一重樣本中抽取的。在實(shí)踐中,需要注意:1)在抽取第一重樣本時(shí)需要增加一定的費(fèi)用,只有當(dāng)利用這些信息進(jìn)行分層抽樣,在比率估計(jì)和回歸估計(jì)時(shí)提高精度的得益大于所增加的費(fèi)用時(shí),采用二重抽樣才是合算的;2)二重抽樣與二階段抽樣的區(qū)別在于階段抽樣中下一階段的抽樣不是在本階段的樣本單位中進(jìn)行,而是從已中選的樣本中抽取更次一級(jí)的觀察單位;二重抽樣可用在抽樣框缺乏輔助信息,而又要對總體進(jìn)行分層或篩選部分總體的情況;由于條件的限制不能收集整個(gè)樣本信息時(shí),可用二重抽樣抽取子樣本的方法來收集更詳細(xì)的信息。類似地,此方法也可用于在一項(xiàng)調(diào)查中不同問題的數(shù)據(jù)收集費(fèi)用差異很大的情形。計(jì)算題某地有10萬農(nóng)戶,現(xiàn)采用抽樣調(diào)查來估計(jì)一種重要經(jīng)濟(jì)作物的產(chǎn)量。根據(jù)上一次普查結(jié)果,將全部農(nóng)戶按耕地面積分為7層,有關(guān)結(jié)果如下表:層NhEQ\*jc2\*hps14\o\ad(\s\up13(_),Y)hSh21500000.130.252230000.722.893200003.3472.254530018.0312255150068.85902561207864000078043418900合計(jì)100000EQ\*jc2\*hps14\o\ad(\s\up13(_),Y)=4.1773WhS(1)設(shè)樣本量為3000,將第6層和第7層規(guī)模較大的200戶農(nóng)戶全部收入樣本,從其余5層抽取2800個(gè)農(nóng)戶,要求估計(jì)量方差最小,試求樣本量的分配。(2)目標(biāo)量是總產(chǎn)量,試求其方差估計(jì)量之值?!窘狻坑梢阎茫篘=100000,n=3000,n1~2=200,各層標(biāo)準(zhǔn)差為S1=0.5,S2=1.7,S3=8.5,S4=35,S5=95,S6=200,S7≈137.48由于6-7層200戶全部收入樣本(即實(shí)施普查,該兩層不存在抽樣誤差),所以我們只需要考慮1-5層情況。通過內(nèi)曼分配計(jì)算1-5層的最優(yōu)樣本分配量:EQ\*jc2\*hps10\o\ad(\s\up9(~),n)h=NhSh15NhSh*(n-n6~7),依次求得n1=50000*0.5562100*2800≈125,n2=23000*1.7562100*2800≈195,n3=20000*n4=5300*35562100*2800≈924,n5=1500*95562100*2800從而在如上分配下方差達(dá)到最小為:Vmin(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)st)=1n-n6~7(15WhSh)2-1N≈0.01128-0.002155=0.009125(2)總產(chǎn)量的無偏估計(jì)為v(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)st)=1LNhNh-n某社會(huì)心理學(xué)研究機(jī)構(gòu)要了解有過偷盜行為的人數(shù)比例,考慮到該問題的特殊性,準(zhǔn)備借助敏感性調(diào)查的方法開展,采用西蒙斯模型處理,調(diào)查所用的兩張卡片中問題分別為:卡片A:我曾經(jīng)有過偷盜行為;卡片B:我的身份證號(hào)碼尾號(hào)為奇數(shù)。卡片A、B在卡片總數(shù)中的比例各為1/2,且已知身份證號(hào)碼尾號(hào)為奇數(shù)的人數(shù)比例為1/2。一共調(diào)查了500人,結(jié)果回答“是”的人數(shù)為256,試估計(jì)人群中有過偷盜行為的人數(shù)比例和估計(jì)誤差?!窘狻坑梢阎每ㄆ珹在總數(shù)比例p=0.5,身份證號(hào)碼尾號(hào)為奇數(shù)比例πB=0.5,調(diào)查人數(shù)n=500,回答‘是’的人數(shù)n1=256,由西蒙斯模型點(diǎn)估計(jì)公式得人群中有過偷竊行為的人數(shù)比例為:EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A=(n1n–(1-p)πB)/p=(0.512-0.5*0.5)/0.5=0.524EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A的方差估計(jì)量:V(EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A)=1np2[n1n][1-n1n]=1500*0.25*0.512*0.488從而標(biāo)準(zhǔn)差為S(EQ\*jc2\*hps10\o\ad(\s\up9(^),π)A)=0.001999≈0.04471,在95%置信度下其估計(jì)范圍是:0.524±1.96*0.04471≈0.524±0.08763試題卷號(hào):9名詞解釋偏差偏差是指按照某一抽樣方案反復(fù)進(jìn)行抽樣,估計(jì)值的數(shù)學(xué)期望與待估參數(shù)之間的離差。B(EQ\*jc2\*hps10\o\ad(\s\up9(^),θ))=E(EQ\*jc2\*hps10\o\ad(\s\up9(^),θ))-θ(偏于某個(gè)方向的系統(tǒng)性誤差)比率估計(jì)又稱比估計(jì),用樣本比率作為總體比率(在形式上總是表現(xiàn)為兩個(gè)變量總值或均值之比)的估計(jì)。如:R=r=1nyiPPS抽樣修正直線等距抽樣當(dāng)N≠nk時(shí)(若N很大時(shí),偏差可忽略不計(jì),若偏差不可忽略時(shí),可采用循環(huán)等距或修正直線等距),在1~N中取一隨機(jī)數(shù)r,r/k得商和余數(shù),將余數(shù)i作為起點(diǎn)。余數(shù)為1的概率0.4;余數(shù)為2的概率0.3;余數(shù)為3的概率0.3,則E(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)sy)=0.4(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)1)+0.3(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)2)+0.3(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)3)=EQ\*jc2\*hps10\o\ad(\s\up9(_),Y).簡述題什么是抽樣框…比較二階段抽樣和二重抽樣的異同。二階段抽樣和二重抽樣兩者都是分階段抽樣方法,但是兩者的差異比較明顯:使用目的不同:二階段抽樣一般用于大規(guī)模、抽樣調(diào)查面廣的情況(或總體范圍大,無法直接抽取樣本等);二重抽樣往往在事先沒有總體輔助信息(分層權(quán)重、比率估計(jì)和回歸估計(jì)相關(guān)等)情況下使用。抽樣方式不同:兩階段抽樣首先是從總體N個(gè)單元(初級(jí)單元)中抽出n個(gè)樣本單元,但并不對這n個(gè)樣本單元中的所有小單元(二級(jí)單元)都進(jìn)行調(diào)查,而是在其中再抽出若干個(gè)二級(jí)單元進(jìn)行調(diào)查;二重抽樣則不同,要對第一重樣本進(jìn)行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信息進(jìn)行排序、分層、抽樣或估計(jì)。抽樣框不同:二階段抽樣不需要編制所有群內(nèi)單元的抽樣框。抽取初級(jí)單元時(shí),只需要編制初級(jí)單元的抽樣框,對被抽中的初級(jí)單元,再去編制二級(jí)單元抽樣框,以此類推,每階段只需編制該階段的抽樣框,不同階段抽樣單位往往是不同的;二重抽樣的第二重樣本則往往是第一重樣本的子樣本,兩次抽樣的單位是相同的。也就是說,二重抽樣要有一份最終單位的完整名冊(總體所有單位的抽樣框),而兩階段抽樣只需要第一階段單位名冊(第一階段抽樣框),然后在中選的第一階段單元中構(gòu)造第二階段抽樣的抽樣框。使用方式:二階段抽樣每一階段抽樣可以相同,可以不同,它通常與分層抽樣、整群抽樣、系統(tǒng)抽樣結(jié)合使用。二重抽樣通常與分層抽樣結(jié)合使用。計(jì)算題某城市共有1000家餐館某農(nóng)村共有290塊地,為了估計(jì)種植糧食的面積,采用等距抽樣方法每隔10塊抽取一塊,取得了下列數(shù)據(jù)(糧食播種面積:畝):00.9000.30.10.53.12.82.72.82.62.33.52.43.84.14.96.05.42.32.92.16.38.25.46.56.66.1要求:(1)估計(jì)總的糧食播種面積;(2)用相繼差的方法計(jì)算EQ\*jc2\*hps14\o\ad(\s\up13(^),Y)的相對標(biāo)準(zhǔn)誤;(3)用簡單隨機(jī)抽樣的方法計(jì)算EQ\*jc2\*hps14\o\ad(\s\up13(^),Y)的相對標(biāo)準(zhǔn),與上述結(jié)果進(jìn)行比較分析。【解】由已知得N=290,n=29,k=10,f=n/N=0.1,EQ\*jc2\*hps10\o\ad(\s\up9(_),y)r=1n1nyrj=94.6/29s2=1n-1(yi(1)估計(jì)總的糧食播種面積為:EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)=NEQ\*jc2\*hps10\o\ad(\s\up9(_),y)sy=NEQ\*jc2\*hps10\o\ad(\s\up9(_),y)r=N*1n1nyrj=10*(0+0.9+…+6.6+6.1)=946(2)相繼差方法估計(jì)EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)的方差:V(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=N2V(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)sy)=N21-fn12(n-1)1n-1(yi+1-從而s(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)))=2564.55≈50.64(3)V(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=N21-fns2=N21-fn1從而s(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y)))=491.298≈22.17試題卷號(hào):10名詞解釋無回答偏差是指在調(diào)查中出于各種原因,調(diào)查人員沒能從入選樣本的單元獲得所需要的信息,由于數(shù)據(jù)缺失造成估計(jì)量的偏誤。(這種情況一般發(fā)生在調(diào)查對象為人的時(shí)候)無回答偏差是一種重要的非抽樣誤差,對調(diào)查數(shù)據(jù)的質(zhì)量有重要影響)。分別比率估計(jì)在分層隨機(jī)抽樣中,對每層樣本分別考慮比估計(jì)量,然后對各層的比估計(jì)量進(jìn)行加權(quán)平均,即先‘比’后‘加權(quán)’,此時(shí)所得的估計(jì)量稱為分別比率估計(jì)。對稱等距抽樣對稱等距抽樣是指按選定的有關(guān)標(biāo)志,將總體中的各單位依次排序?yàn)?1?2?3?…?d;?d+1?d+2?d+3?…?2d;……(n-1)d+1?(n-1)d+2?(n-1)d+3?…?nd。其中每d個(gè)單位稱為一個(gè)部分,可將總體共分為n部分,對稱等距抽樣是在總體第一部分抽取第i個(gè)單位,在第二部分抽到第2d-i+1單位,第三部分抽取第2d+i單位,在第四個(gè)部分抽取4d-i+1單位,……。這種隨機(jī)起點(diǎn)對稱等距抽樣可以概括為:在總體奇數(shù)部分抽取第kd+i單位(k=0,2,4,……),在總體偶數(shù)部分抽取第kd-i+1單位(k=2,4,……)。沃納模型簡述題什么是不完備抽樣框…對分層抽樣可以提高估計(jì)效率的原理進(jìn)行論述。分層抽樣可以提高估計(jì)效率,簡述如下:由于每層都進(jìn)行抽樣,這使得樣本在總體中分布更加均勻、更具代表性。如為了了解我國居民的人均年收入水平,倘若采用簡單隨機(jī)抽樣的方法來實(shí)施調(diào)查,對于某些人口數(shù)較少的省市或民族地區(qū),很可能會(huì)出現(xiàn)樣本量過小甚至沒有樣本點(diǎn)的現(xiàn)象。由于抽樣在每一層中獨(dú)立進(jìn)行,所以一則允許各層選擇適合本層的不同抽樣方法;二則可同時(shí)對各自總體(層)進(jìn)行參數(shù)估計(jì),而不僅僅是對整個(gè)總體的參數(shù)進(jìn)行估計(jì)。這在大區(qū)域且依托行政管理機(jī)構(gòu)實(shí)施的調(diào)查里,優(yōu)勢更為明顯。由于各層的總體方差因?qū)觾?nèi)單元之間差異小,其加權(quán)平均肯定小于總體方差,而抽樣精度與此成正比,所以分層抽樣可以提高估計(jì)精度。事實(shí)上,只要準(zhǔn)確選擇分層依據(jù)的指標(biāo),則分層抽樣的精度既高于簡單隨機(jī)抽樣,也高于其他抽樣方式。計(jì)算題有下列數(shù)據(jù)為調(diào)查學(xué)生購書支出,某高校在全校6000名大學(xué)生中按簡單隨機(jī)抽樣抽出78名學(xué)生,調(diào)查了他們最近一個(gè)學(xué)期用于購書支出后,得到EQ\*jc2\*hps16\o\ad(\s\up15(_),y)=102.30元,s2=13712。(1)試估計(jì)該校大學(xué)生最近這一學(xué)期用于購書的總支出,并給出95%的置信區(qū)間;(2)若要求在置信度95%(對應(yīng)的t=1.96)下,估計(jì)的相對誤差不超過10%,則應(yīng)該抽出多少學(xué)生進(jìn)行調(diào)查?【解】由已知得:N=6000,n=78,f=n/N=0.013,EQ\*jc2\*hps10\o\ad(\s\up9(_),y)=102.30,s2=13712(1)總支出的簡單估計(jì)量為EQ\*jc2\*hps10\o\ad(\s\up9(_),Y)=NEQ\*jc2\*hps10\o\ad(\s\up9(_),y)=6000*102.30=613800EQ\*jc2\*hps10\o\ad(\s\up9(^),V)(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=v(NEQ\*jc2\*hps10\o\ad(\s\up9(_),y))=N21-fns2=60002*1-0.01378*13712≈6246343384.615385s(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=6246343384.615385≈79033.81所以總支出95%的置信區(qū)間為:Y±z0.025*s(EQ\*jc2\*hps10\o\ad(\s\up9(^),Y))=613800±79033.81即[534766.19,692833.81](2)n0=s2z0.0252r2y2由于n0/N≈0.084>0.05,所以對其進(jìn)行修正:n=n01+n0N試題卷號(hào):11名詞解釋抽樣誤差是由于抽取樣本的隨機(jī)性造成的樣本值與總體值之間的差異,是隨機(jī)抽樣特有的誤差,只要采用抽樣調(diào)查,抽樣誤差就不可避免。(控制抽樣誤差的根本方法是改變樣本量)目錄抽樣系統(tǒng)樣本內(nèi)相關(guān)系數(shù)樣本相關(guān)系數(shù)是指樣本中變量之間的線性相關(guān)程度。樣本相關(guān)系數(shù)準(zhǔn)確性與很多因素都有關(guān),如抽樣方法,樣本的容量。樣本相關(guān)系數(shù)的計(jì)算公式如下:r(X,Y)=Cov(X,Y)VarXVar(Y)西蒙斯模型簡述題試分析簡單隨機(jī)抽樣條件下影響估計(jì)量精度的因素。估計(jì)量的方差(V(EQ\*jc2\*hps10\o\ad(\s\up9(_),y)))是衡量估計(jì)量精度的度量。影響估計(jì)量方差的因素主要是樣本量(n)、總體大?。∟)和總體方差S2。考慮V(EQ\*jc2\*hps10\o\ad(\s\up9(_),y))=1-fnS2,(其中總體方差S2=1N-11N(Yi-Y)2)),通常N很大時(shí),當(dāng)f<0.05時(shí),可將1-f近似取為簡述比率估計(jì)方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年建筑安全生產(chǎn)月
- 第六講 科學(xué)社會(huì)學(xué)
- 2025屆湖南省長沙縣中考生物考前最后一卷含解析
- 2024年08月黑龍江2024年招商銀行哈爾濱分行校園招考(823)筆試歷年參考題庫附帶答案詳解
- 2024年母線轉(zhuǎn)接器項(xiàng)目可行性研究報(bào)告
- 2024年替芯項(xiàng)目可行性研究報(bào)告
- 2024年抑蛋白酶肽項(xiàng)目可行性研究報(bào)告
- 2025至2031年中國有色線行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2031年中國探究實(shí)驗(yàn)室系統(tǒng)行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024年P(guān)U貼合面料項(xiàng)目可行性研究報(bào)告
- ?;愤\(yùn)輸安全培訓(xùn)裝卸工具與操作要求
- SJG 09-2024 建筑基樁檢測標(biāo)準(zhǔn)
- 數(shù)學(xué)和通信技術(shù)的關(guān)系與應(yīng)用
- 2024智慧城市城市數(shù)字孿生第1部分:技術(shù)參考架構(gòu)
- 2024年學(xué)習(xí)興稅(貨物勞務(wù)條線)考試題庫(帶答案)
- 《壓力性尿失禁》課件
- 20江蘇省蘇州市2023-2024學(xué)年高一上學(xué)期期末學(xué)業(yè)質(zhì)量陽光指標(biāo)調(diào)研歷史試卷
- 國企綜合素質(zhì)測評試題
- 新疆油田歷年投資計(jì)劃書
- 肺功能檢查的操作與結(jié)果解讀
- 松遼盆地南部致密砂巖儲(chǔ)層成因與天然氣聚集模式研究的中期報(bào)告
評論
0/150
提交評論