第17章抽樣調(diào)查_(kāi)第1頁(yè)
第17章抽樣調(diào)查_(kāi)第2頁(yè)
第17章抽樣調(diào)查_(kāi)第3頁(yè)
第17章抽樣調(diào)查_(kāi)第4頁(yè)
第17章抽樣調(diào)查_(kāi)第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第17章 抽樣調(diào)查n抽樣調(diào)查是收集統(tǒng)計(jì)數(shù)據(jù)的重要途徑。n調(diào)查者利用抽取部分樣本來(lái)了解調(diào)查總體各個(gè)部分的情況。n我們將了解抽樣調(diào)查的設(shè)計(jì)、實(shí)施以及對(duì)誤差的衡量等。抽樣調(diào)查術(shù)語(yǔ)n個(gè)體:被采集數(shù)據(jù)的實(shí)體n總體:全部有關(guān)個(gè)體的集合n樣本:總體的一個(gè)子集n目標(biāo)總體:調(diào)查者所要推斷的總體n抽樣總體:實(shí)際從中抽取樣本的總體n抽樣單位:總體中的一個(gè)簡(jiǎn)單個(gè)體或一組個(gè)體n抽樣框:羅列抽樣單位的名冊(cè)調(diào)查種類與抽樣方法n1. 調(diào)查種類n郵寄調(diào)查(設(shè)計(jì)并使用調(diào)查表)n電話調(diào)查(設(shè)計(jì)并使用調(diào)查表)n采訪調(diào)查(設(shè)計(jì)并使用調(diào)查表)n收集資料的其它各種調(diào)查(不使用調(diào)查表)n關(guān)于調(diào)查表的設(shè)計(jì)n關(guān)鍵在于如何將想調(diào)查的問(wèn)題轉(zhuǎn)化為問(wèn)卷

2、上的問(wèn)題。n1. 長(zhǎng)度n2. 問(wèn)題的順序n3. 有關(guān)措辭n2. 抽樣方法n(1)概率抽樣n依據(jù)隨機(jī)性原則從總體中抽取樣本的方式成為概率抽樣n在概率抽樣中,總體的每個(gè)個(gè)體都以一個(gè)已知的非零概率被抽中,這個(gè)概率可以通過(guò)某種隨機(jī)化操作得到,它的值是按照樣本設(shè)計(jì)的要求而定的。n在概率抽樣中,可以計(jì)算取得每個(gè)可能樣本的概率n在概率抽樣中,可以對(duì)由樣本的隨機(jī)性抽取所造成的抽樣誤差進(jìn)行計(jì)量,即能客觀評(píng)價(jià)調(diào)查結(jié)果的精確度。n概率抽樣無(wú)論對(duì)總體反復(fù)進(jìn)行多少次,按相應(yīng)的抽樣方法所計(jì)算的精確度和可靠度,借助于概率法則都可認(rèn)識(shí)并做比較,從而能選擇效果最好的設(shè)計(jì)方案。n常用的概率抽樣方法有:簡(jiǎn)單隨機(jī)抽樣、分層簡(jiǎn)單隨機(jī)抽

3、樣、整群抽樣和系統(tǒng)抽樣。n(2)非概率抽樣n抽取樣本的過(guò)程不是依據(jù)隨機(jī)性原則進(jìn)行的方式成為非概率抽樣n采用非概率抽樣的原因是:在有些條件下無(wú)法有效實(shí)施概率抽樣方案。n在非概率抽樣中,樣本的代表性及樣本被抽取的概率是不清楚的。n非概率抽樣可以得出定量的結(jié)果,但不能判斷這個(gè)結(jié)果的精確性和可靠性。n非概率抽樣受主管因素的影響,其樣本的代表性取決于抽樣者對(duì)總體的認(rèn)識(shí)能力和判斷能力n常用的非概率抽樣有判斷抽樣和方便抽樣n判斷抽樣:根據(jù)個(gè)人主觀意識(shí)來(lái)選擇自己認(rèn)為最能代表總體的抽樣單位的抽樣方法n方便抽樣:將便于得到的單位選進(jìn)樣本的抽樣方式。調(diào)查誤差n在調(diào)查的過(guò)程中可能產(chǎn)生兩類誤差,抽樣誤差和非抽樣誤差。n

4、1.抽樣誤差n它是由樣本得到的點(diǎn)估計(jì)值和總體參數(shù)之差的量值n抽樣誤差僅出現(xiàn)在抽樣調(diào)查中,且不可避免。n可以通過(guò)選擇適當(dāng)?shù)某闃臃椒ɑ虺闃釉O(shè)計(jì)來(lái)控制抽樣誤差。n2. 非抽樣誤差n非抽樣誤差是調(diào)查中出現(xiàn)的除抽樣誤差以外的其它所有誤差n其類型有測(cè)量誤差、選擇誤差、數(shù)據(jù)處理誤差等n非抽樣誤差可以出現(xiàn)在普查中,也可以出現(xiàn)在抽樣誤差中。簡(jiǎn)單隨機(jī)抽樣n1. 定義:從總體中抽出樣本時(shí),能保證每次抽取都是等概率的抽樣方法稱為簡(jiǎn)單隨機(jī)抽樣n2. 調(diào)查步驟:首先建立抽樣框,即抽樣總體中所有個(gè)體的名冊(cè);其次利用隨機(jī)數(shù)表進(jìn)行抽樣(可以保證總體中的每個(gè)個(gè)體都有相同的被抽到的概率)n3.總體均值n在抽樣調(diào)查中,總體的概率分布

5、通常是未知的。n總體均值的點(diǎn)估計(jì) 的抽樣分布性質(zhì)依賴于樣本設(shè)計(jì)。n如果簡(jiǎn)單隨機(jī)樣本是大樣本,則根據(jù)中心極限定理 抽樣分布近似服從正態(tài)分布。xxn如果 的抽樣分布近似服從正態(tài)分布,那么總體均值的估計(jì)區(qū)間為n其中 為 抽樣分布的標(biāo)準(zhǔn)差,也稱為均值的標(biāo)準(zhǔn)誤差。xxxzxzx2/2/xxn從一個(gè)容量為n的有限總體中,抽取一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本n均值標(biāo)準(zhǔn)差的估計(jì)值為:n此時(shí)的總體均值區(qū)間估計(jì)為:n當(dāng)抽樣調(diào)查中,構(gòu)造置信區(qū)間時(shí),通常采用總體均值的近似95%置信區(qū)間:)(nsnnnsxxxszxszx2/2/xxsxsx22n例子:great lakes recreation是一本關(guān)于劃船及垂釣類主題的

6、地區(qū)性雜志。目前有8000家訂戶,從中抽取484戶做為簡(jiǎn)單隨機(jī)樣本,這484戶的年平均收入為30500美元,標(biāo)準(zhǔn)差為7040美元。由此,希望估計(jì)訂閱該雜志訂戶年均收入的95%置信區(qū)間。n由題意得到,n可知n95置信區(qū)間下的雜志訂戶年均收入為:n30500-2310,305002310,即29880,3112030500 x7040s310)4847040(80004848000)(nsnnnsxn4. 總體總值n問(wèn)題:估計(jì)500所學(xué)校的總面積x(總體總值)n若這500所學(xué)校的平均面積為 ,則總體總值為:n由于 未知,我們用 替代,從而有總體總值的點(diǎn)估計(jì)為:n總體總值點(diǎn)估計(jì)的標(biāo)準(zhǔn)誤差為:nx x

7、xnx )(nsnnnnnssxxn總體總值x的近似95%置信區(qū)間:n從這500所學(xué)校抽取容量為50的樣本,得到:n總體總值x的點(diǎn)估計(jì)為:50022000=11000000n95%區(qū)間估計(jì)近似為:xxsxnxsxn224000,22000sx53666011000000)504000(50050500500211000000211000000xsn5.總體比率n總體比率的無(wú)偏估計(jì):n總體比率的標(biāo)準(zhǔn)誤差估計(jì):n總體比率的近似95%置信區(qū)間:p)1)1 ()(nppnnnsppsp2n在上例中,有些學(xué)校使用天然氣取暖,抽取的50所中有35所以天然氣為取暖燃料。n500所學(xué)校使用天然氣比率的點(diǎn)估計(jì)為

8、:35/50=0.7n比率的標(biāo)準(zhǔn)誤差估計(jì):n近似95%的置信區(qū)間為:0621. 0)49307 . 0)(50050500()1)1 ()(.nppnnnsp1242. 07 . 00621027 . 02.pspn6. 樣本容量的確定n(1)估計(jì)總體均值時(shí)的樣本容量確定n令置信區(qū)間為95%n設(shè)b為允許誤差,則n解得:)( )(22nsnnnsbx222)4(sbnnsnn式中的s樣本方差如何確定?一般情形下,我們是通過(guò)抽取實(shí)際樣本才可計(jì)算得到樣本方差。n1. 利用兩步抽樣:用第一步抽樣的樣本計(jì)算 ,然后計(jì)算n,第二步抽樣將單位數(shù)補(bǔ)足到n。n2. 通過(guò)試點(diǎn)調(diào)查或事先檢驗(yàn)估計(jì)n3。利用先前的樣本

9、得到的信息。2s2sn例:調(diào)查大學(xué)畢業(yè)生剛就業(yè)的平均年薪,假設(shè)有5000名畢業(yè)生,誤差不超過(guò)500美元。從去年的相同研究得知s=3000。則需要抽取的樣本容量n為:14097.13930004500500030005000)4(222222sbnnsnn(2)估計(jì)總體總值時(shí)的樣本容量確定n置信度95n例,在上例中,若想估計(jì)5000名畢業(yè)生的全部年薪,允許誤差在2000000美元,問(wèn)抽取多大的樣本容量:2224snbnsn216312153000500042000000300050004222222.snbnsnn(3)估計(jì)總體比率是的樣本容量確定:n置信度95n當(dāng) 不確定時(shí),采用0.5代替。)

10、1 ()4()1 (2ppbnppnnp分層簡(jiǎn)單隨機(jī)抽樣n1. 分層抽樣:先將容量為n的總體分成h組(層),第h層的單位數(shù)為 ,則有,n然后從第h層中抽取容量為 的簡(jiǎn)單隨機(jī)樣本,將所得的h個(gè)樣本聯(lián)合,組成一個(gè)容量為n的樣本hnhnnnn21hnhnnnn21n例:想對(duì)某大學(xué)商學(xué)院畢業(yè)生的初始年薪做一調(diào)查。今年1500名畢業(yè)生的詳情如下:會(huì)計(jì)專業(yè)500名,金融專業(yè)350名,信息系統(tǒng)專業(yè)200名,市場(chǎng)營(yíng)銷專業(yè)300名,經(jīng)營(yíng)管理專業(yè)150名。n選擇180名學(xué)生組成一個(gè)分層簡(jiǎn)單隨機(jī)樣本:會(huì)計(jì)專業(yè)45名,金融專業(yè)40名,信息系統(tǒng)專業(yè)30名,市場(chǎng)營(yíng)銷專業(yè)35名,經(jīng)營(yíng)管理專業(yè)30名。n2.總體均值n點(diǎn)估計(jì):

11、n其中, 第h層的平均數(shù)hhhhhhnkhhnkhkhhhkniixnnxnnnxnxnhh111111)1(11hhhhstxnnx1)(hnihihhxnx11n均值標(biāo)準(zhǔn)誤差的估計(jì):hhhhhhhxnsnnnnsst122)(1hhhhhhhhhhhhhhhhhhhhhhhxnsnnnnnsnnnnnxvarnnxnnvarsst121222212212)(1)(1)(1)(n總體均值的近似95%置信區(qū)間:n上例中,各專業(yè)畢業(yè)生樣本的初始年薪數(shù)據(jù)如下所示:hhhhhhhstxstnsnnnnxsxst122)(122專業(yè)平均年薪層樣本標(biāo)準(zhǔn)差各層樣本容量各層單位總數(shù)會(huì)計(jì)35000200045

12、500金融33500170040350信息系統(tǒng)41500230030200市場(chǎng)營(yíng)銷32000160035300運(yùn)作管理36000225030150ixisinin35017360001500150320001500300415001500200335001500350350001500500stx1388429090376915001)(15001)(12122122hhhhhhhhhhhhhhxnsnnnnsnnnnsst近似95%的置信區(qū)間為:276350171382350172stxstsxn3.總體總值n點(diǎn)估計(jì): 總體總值 的標(biāo)準(zhǔn)誤差:總體總值的近似95%的置信區(qū)間:stxnx xst

13、xxnssstxstxstnsxnsxn22n續(xù)上例,n總收入的點(diǎn)估計(jì):n總收入的近似95%的置信區(qū)間:n(52111500,52939500)52525500350171500x4140005252550013815002525255002stxstnsxnn4.總體比率n點(diǎn)估計(jì):n其中 是第h層的樣本比率。n標(biāo)準(zhǔn)誤差的估計(jì)為:n近似95%的置信區(qū)間為:hhhhstpnnp1hphhhhhhhhpnppnnnnsst12)1)1 ()(1stpstsp2n例:估計(jì)畢業(yè)生的初始年薪不低于36000的比率n總體比率的點(diǎn)估計(jì):3149. 030151500150350150030030291500

14、200403150035045161500500stp0264. 06913.157015001)1)1 ()(1212hhhhhhhhpnppnnnnsst05280314900264023149. 02.stpstspn5. 樣本容量的確定n確定樣本容量分兩個(gè)階段兩個(gè)階段:先確定總樣本容量,然后決定各層應(yīng)分配的抽取單位數(shù);或者先確定每層應(yīng)抽取的樣本的容量,然后合并這些樣本得到總樣本容量。n我們要尋求對(duì)估計(jì)有關(guān)總體參數(shù)提供必要精度的總樣本容量和各層分配量。如果某些層的樣本容量不足以提供層內(nèi)估計(jì)所需的精度,則這些層的樣本容量應(yīng)按需要增加。n本節(jié)給出確定總樣本容量及將它恰當(dāng)?shù)胤峙浣o各層的方法。n

15、分配時(shí)應(yīng)考慮三個(gè)因素:各層的單位數(shù);各層內(nèi)的方差;各層選擇單位的費(fèi)用。n本節(jié)給出對(duì)給定水平能使抽樣成本達(dá)到最小的分配方法。nneyman分配法:n(1)估計(jì)總體均值時(shí)的樣本容量:n(2)估計(jì)總體總值是的樣本容量:hhhhhhhsnsnnn1hhhhhhhhsnbnsnn1222124)()(hhhhhhhhsnbsnn122124)()(b為允許誤差n例:某商家欲對(duì)購(gòu)買甲、乙、丙三種商品的顧客進(jìn)行調(diào)查,以獲得對(duì)今后制作廣告有用的資料。該商家估計(jì)這些顧客的月均收入,允許誤差為100美元。三種商品的顧客共有600名,甲商品顧客100名,乙商品顧客200名,丙商品顧客300名,小規(guī)模調(diào)查估計(jì)每層標(biāo)準(zhǔn)

16、差的結(jié)果為:甲商品顧客收入標(biāo)準(zhǔn)差1300美元,乙商品顧客收入標(biāo)準(zhǔn)差900美元,丙商品顧客收入標(biāo)準(zhǔn)差500美元。n問(wèn)如何抽取樣本容量?n根據(jù)公式得到: 即總的需要抽取162名顧客。n各層的樣本容量分別為:n甲商品顧客抽取46名,n乙商品顧客抽取63名,n丙商品顧客抽取53名。162500300900200130010041006005003009002001300100422222231222312)()()()(hhhhhhsnbnsnn534600005003001621333hhhhsnsnnn46460000130010016231111hhhsnsnnn6346000090020016

17、231222hhhsnsnnnn(3)估計(jì)總體比率時(shí)的樣本容量n總樣本容量:n各層樣本容量:hhhhhhhnnhppnbnppnn12221)1 ()4() )1 (hhhhhhhhhppnppnnn1)1 ()1 (整群抽樣n1.整群抽樣:將總體中的元素分成n組(群),總體中的每元素屬于且只屬于其中一群:抽取時(shí)的抽樣單位不是一個(gè)元素,而是元素的群。n可能作為群的舉例說(shuō)明:總量變量元素群或抽樣單位a市住戶特征寓所街區(qū)b市購(gòu)買衣物人寓所機(jī)場(chǎng)旅游信息離開(kāi)旅客人數(shù)航班高中就業(yè)計(jì)劃學(xué)生班級(jí)鄉(xiāng)村人口社會(huì)態(tài)度成人村過(guò)橋年交通流量發(fā)車地與到達(dá)地機(jī)動(dòng)車40分鐘間隔城市土地所有者檔案稅務(wù)信息土地所有者檔案分類賬

18、的頁(yè)數(shù)健康保險(xiǎn)檔案醫(yī)療數(shù)據(jù)卡片連續(xù)10張卡片為一組n整群抽樣對(duì)選中群內(nèi)的單位實(shí)行全面調(diào)查,其樣本代表性取決于抽中群體對(duì)全部群體的代表性。因此,群體間差異越大,樣本代表性越差,反之,差異越小,則樣本代表性越好。n可見(jiàn),整群抽樣的抽樣誤差取決于群體間差異程度的大小,而不受各群體內(nèi)部差異程度的影響。n2. 單階段整群抽樣與兩階段整群抽樣:n從總體的所有群中抽取若干群組成樣本稱為單階段整群抽樣;n若從總體中抽出若干群,在從每群中抽取一個(gè)簡(jiǎn)單隨機(jī)樣本組成樣本,則稱為兩階段整群抽樣。n例:設(shè)想從一個(gè)城市的總體為n=40000個(gè)寓所分布的a=4000個(gè)街區(qū)中選擇一個(gè)大約n=400的樣本:我們可以選擇一個(gè)40

19、街區(qū)的群樣本來(lái)組成樣本。該抽取方式稱為單階段整群抽樣;也可以以1/50的抽樣比來(lái)抽取街區(qū),以1/2的抽樣比來(lái)抽取寓所,這樣產(chǎn)生一個(gè)每個(gè)街區(qū)為5個(gè)寓所的80個(gè)街區(qū)的樣本。此法稱為兩階段整群抽樣。n3. 整群抽樣的群體形式:n兩種:一是劃分群體,即將所有的個(gè)體人為地劃分為若干群;二是自然形成的群體,即那些客觀存在的、在實(shí)施抽樣調(diào)查之前就已經(jīng)有了的群體。n4.相關(guān)記號(hào):nn總體中的群數(shù);n選入樣本的群的數(shù)目;mi第i群的單位數(shù);m總體中的單位數(shù);每群?jiǎn)挝粩?shù)=m/nn例:事務(wù)所i注冊(cè)會(huì)計(jì)師mi年薪總額xi女注冊(cè)會(huì)計(jì)師ai18384222513508341480417857657296163131271576128417609125775103318809合計(jì)128656035該例中,n=1000,n=10,m=12000,每群的平均單位數(shù)12n5. 總體均值n點(diǎn)估計(jì):n標(biāo)準(zhǔn)誤差估計(jì):n近似95%的置信區(qū)間為:niiniicmxx111)(122nmxxmnnnnsniicixccxcsx2第i群中所有觀察值的總量n例:在會(huì)計(jì)事務(wù)所的調(diào)查中,25.51128656011niiniicmxx378.51281)(12niicimxx1979110378512

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論