版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
市場調(diào)查課程第七章抽樣設(shè)計(一)學(xué)習(xí)目標(biāo)理解抽樣調(diào)查中的特點熟悉抽樣的基本概念了解抽樣設(shè)計的一般流程區(qū)分概率抽樣與非概率抽樣,以及各自的優(yōu)缺點了解常用的幾種概率抽樣方法與非概率抽樣方法理解抽樣誤差(樣本代表性)的概念、測度和計算方法理解樣本容量的影響因素,了解樣本量的計算方法了解網(wǎng)絡(luò)調(diào)查中的抽樣方法
本講內(nèi)容3抽樣調(diào)查的特點01抽樣設(shè)計的流程和內(nèi)容02概率抽樣方式0304非概率抽樣方式05抽樣中的誤差問題06樣本量的確定07網(wǎng)絡(luò)抽樣抽樣調(diào)查的特點01抽樣設(shè)計的流程和內(nèi)容025抽樣調(diào)查的特點抽樣調(diào)查指按照某種原則和程序,從總體中抽取一部分單位,通過對這部分單位進(jìn)行調(diào)查得到的信息,達(dá)到對總體情況的了解,或者對總體的有關(guān)參數(shù)進(jìn)行估計。具有如下特點:節(jié)省費用抽樣調(diào)查只是調(diào)查總體當(dāng)中的一部分單位,涉及面較小,因而可以大大降低調(diào)查費用。調(diào)查周期短時效快全面調(diào)查由于規(guī)模大、耗時多,不能按時提供調(diào)查結(jié)果;抽樣調(diào)查則由于規(guī)模小,接受調(diào)查的單位少,可以在較短時間內(nèi)完成。有助于提高數(shù)據(jù)質(zhì)量抽樣調(diào)查由于調(diào)查工作量小,有條件選擇更精干的調(diào)查員,更嚴(yán)格的技術(shù)培訓(xùn),更先進(jìn)可靠的測試手段,督導(dǎo)人員也更有余力監(jiān)督現(xiàn)場等等方面,從而提高原始數(shù)據(jù)的質(zhì)量6抽樣設(shè)計流程抽樣設(shè)計的流程一般包括以下幾個步驟,這些步驟之間密切聯(lián)系:
定義調(diào)查范圍選擇抽樣框抽樣方法設(shè)計收集數(shù)據(jù)確定樣本量確定估計量抽取樣本圖7-1抽樣設(shè)計的一般流程7抽樣設(shè)計流程①1.定義目標(biāo)總體(調(diào)查范圍)目標(biāo)總體指調(diào)查對象或個體的集合。這些個體擁有調(diào)查人員想要尋找的信息,這些信息將被用于推斷總體特征總體的限定是人為的。在一項具體調(diào)查項目中,調(diào)查對象必須是明確的而不能是模糊的2.選擇抽樣框抽樣框是供抽樣所用的所有調(diào)查單位的名單。在抽樣框中,可對每個單位編上號碼,由此可以按一定隨機(jī)化程序進(jìn)行抽樣常用的形式是名錄框(如企業(yè)名錄、電話簿、人員名冊等),也可是一張地圖或其他適當(dāng)形式抽樣框和目標(biāo)總體不一致時產(chǎn)生的誤差稱為抽樣框誤差,有以下類型:①丟失目標(biāo)總體單位。②包含非目標(biāo)單位。③丟失目標(biāo)單位和包含非目標(biāo)單位共存。④復(fù)合聯(lián)接。⑤輔助信息不正確。對北京市個體商業(yè)進(jìn)行抽樣調(diào)查,則所有北京市個體商業(yè)單位就構(gòu)成目標(biāo)總體欲通過抽樣調(diào)查方式了解北京市小學(xué)生視力狀況,目標(biāo)總體就是北京市所有小學(xué)生例如北京市規(guī)下企業(yè)調(diào)查欲了解企業(yè)的生產(chǎn)經(jīng)營狀況和預(yù)期,目標(biāo)總體是北京市所有規(guī)下企業(yè)法人單位和個體經(jīng)營單位。如果采用企業(yè)名錄庫作為抽樣框,不在名錄庫中的企業(yè)和個體經(jīng)營單位沒有機(jī)會被選入樣本,存在抽樣框誤差,因此該項目采用雙抽樣框設(shè)計,除企業(yè)名錄庫之外,還構(gòu)建了村/居委會抽樣框,用于抽取村/居委會內(nèi)的非目錄企業(yè)和個體單位。8抽樣設(shè)計流程②3.選擇抽樣方法選擇抽樣方法時,最重要的決定是使用概率抽樣還是非概率抽樣。概率抽樣也稱隨機(jī)抽樣,指按照隨機(jī)原則抽取樣本。按每個單位被抽入樣本的機(jī)會是否相同氛圍等概率抽樣、不等概率抽樣非概率抽樣指抽取樣本時并不遵照隨機(jī)原則,而是根據(jù)主觀判斷有目的地挑選,或者是依照方便、快捷的原則抽取4.確定樣本量樣本是總體的一部分,因此與總體一樣,樣本也是一個集合。每個被抽中進(jìn)入樣本的單位稱為入樣單位。樣本中包含的入樣單位的個數(shù)稱為樣本量。一般探索性調(diào)查,尤其是定性調(diào)查的樣本量較小,描述性調(diào)查需要的樣本量較大9抽樣設(shè)計流程③5.確定估計量從樣本采集信息后如何估計總體特征,需要選擇相應(yīng)的估計量對總體參數(shù)進(jìn)行估計??傮w參數(shù)是我們所關(guān)心變量的數(shù)字特征,它是根據(jù)總體中所有單位的數(shù)值計算的樣本估計量根據(jù)樣本中各單位的數(shù)值計算的。常用的樣本統(tǒng)計量有樣本均值、樣本比例、樣本方差等。樣本估計量是樣本的函數(shù),如果樣本是隨機(jī)抽取的,則在大樣本情況下樣本估計量趨于正態(tài)分布。所以我們可以根據(jù)樣本估計量對未知的總體參數(shù)進(jìn)行估計,并計算抽樣誤差。具體抽樣方法下不同的估計量選擇可表示為估計量中樣本單元權(quán)數(shù)設(shè)定。權(quán)數(shù)是以某種數(shù)量形式權(quán)衡被評價事物總體中諸因素相對重要程度的量值。樣本單元權(quán)數(shù)的作用:①在不等概抽樣設(shè)計中,樣本單元入樣概率不同,權(quán)數(shù)不同,可通過樣本對總體進(jìn)行還原;②由于抽樣的隨機(jī)性,樣本結(jié)構(gòu)與總體結(jié)構(gòu)可能產(chǎn)生不一致,可通過樣本單元權(quán)數(shù)調(diào)整樣本結(jié)構(gòu)。例如在對北京市個體商業(yè)進(jìn)行的調(diào)查中,北京市個體商業(yè)的零售額就是一個總體參數(shù)。也可以說總體參數(shù)就是總體指標(biāo)值,它是未知的,是我們通過調(diào)查想要了解的。常見的總體參數(shù)有總體總量、總體均值、總體比例、總體方差等。
10抽樣設(shè)計流程④5.確定估計量從樣本采集信息后如何估計總體特征,需要選擇相應(yīng)的估計量對總體參數(shù)進(jìn)行估計??傮w參數(shù)是我們所關(guān)心變量的數(shù)字特征,它是根據(jù)總體中所有單位的數(shù)值計算的樣本估計量根據(jù)樣本中各單位的數(shù)值計算的。常用的樣本統(tǒng)計量有樣本均值、樣本比例、樣本方差等。樣本估計量是樣本的函數(shù),如果樣本是隨機(jī)抽取的,則在大樣本情況下樣本估計量趨于正態(tài)分布。所以我們可以根據(jù)樣本估計量對未知的總體參數(shù)進(jìn)行估計,并計算抽樣誤差。具體抽樣方法下不同的估計量選擇可表示為估計量中樣本單元權(quán)數(shù)設(shè)定。權(quán)數(shù)是以某種數(shù)量形式權(quán)衡被評價事物總體中諸因素相對重要程度的量值。樣本單元權(quán)數(shù)的作用:①在不等概抽樣設(shè)計中,樣本單元入樣概率不同,權(quán)數(shù)不同,可通過樣本對總體進(jìn)行還原;②由于抽樣的隨機(jī)性,樣本結(jié)構(gòu)與總體結(jié)構(gòu)可能產(chǎn)生不一致,可通過樣本單元權(quán)數(shù)調(diào)整樣本結(jié)構(gòu)。例如在對北京市個體商業(yè)進(jìn)行的調(diào)查中,北京市個體商業(yè)的零售額就是一個總體參數(shù)。也可以說總體參數(shù)就是總體指標(biāo)值,它是未知的,是我們通過調(diào)查想要了解的。常見的總體參數(shù)有總體總量、總體均值、總體比例、總體方差等。
11抽樣方案的內(nèi)容一般包括:第一、確定抽樣調(diào)查的目的、任務(wù)和要求;第二、確定調(diào)查對象的范圍和抽樣單位;第三、確定抽取樣本方法;第四、確定必要的樣本數(shù);第五、對主要抽樣指針的精度提出要求;第六、確定總體目標(biāo)量的估算方法;第七、制訂實施總體方案的辦法和步驟。概率抽樣方式313概率抽樣中有不同的抽樣方法,用樣本統(tǒng)計量估計總體參數(shù)的方法及估計的精確度都與具體抽樣方法有關(guān)。概率抽樣技術(shù)是統(tǒng)計學(xué)中的一個專門分支,本節(jié)只對概率抽樣中幾種最基本的方法予以簡要介紹:
①簡單隨機(jī)抽樣 ②分層抽樣 ③整群抽樣
④系統(tǒng)抽樣 ⑤多階段抽樣概率抽樣方式14簡單隨機(jī)抽樣方法簡單隨機(jī)抽樣是從總體N個單位中隨機(jī)抽取n個單位作為樣本,有放回抽樣和不放回抽樣兩種方法。從總體中隨機(jī)抽出一個樣本單位,記錄觀測結(jié)果后,將其放回總體中去,再抽取第二個…...依此類推,一直到抽滿n個單位為止。采用這種方法單位有被重復(fù)抽中的可能,容易造成信息重疊而影響估計效率,所以較少采用。放回簡單隨機(jī)抽樣不放回簡單隨機(jī)抽樣抽取第一個樣本單位后,將其放置一邊,再從總體N-1個單位中抽取第二個……依此類推,一直到抽滿n個單位為止。采用這種方法,每個單位最多只能被抽中一次,故不會由于樣本單位被重復(fù)抽中而提供重疊信息,因此比放回抽樣有更高的估計效率。15簡單隨機(jī)抽樣方法的優(yōu)劣勢簡單隨機(jī)抽樣是最基本的隨機(jī)抽樣方法,操作簡單,且每個單位入樣的概率是相同的,因而計算抽樣誤差和對總體參數(shù)進(jìn)行推斷都有比較簡單的形式。簡單隨機(jī)抽樣沒有利用抽樣框中更多的輔助信息,所以用樣本統(tǒng)計量估計總體參數(shù)的效率受到影響。由于簡單隨機(jī)抽樣條件下樣本的分布可能非常分散,從而增加了調(diào)查的費用和時間;所以這種抽樣方法是受到條件限制的:①抽樣框中沒有更多可以利用的輔助信息;②調(diào)查對象分布的范圍不廣;③個體之間的差異不大。簡單隨機(jī)抽樣是最基本的隨機(jī)抽樣方法,但樣本分布分散導(dǎo)致其適用情況受到限制。16分層抽樣方法①某學(xué)生宿舍共有6人,其中3名新生(A,B,C),3名老生(D,E,F)?,F(xiàn)欲估計該宿舍平均每人擁有書的數(shù)目。假定他們擁有書的數(shù)目如下表所示:分層抽樣是將總體按一定的原則分成若干個子總體,每個子總體稱為層,抽取樣本時在每個層內(nèi)分別進(jìn)行。分層抽樣的最大好處是可以提高估計的效率。表7-1調(diào)查實施情況表學(xué)生編號擁有書(本)A20B22C24合計66學(xué)生編號擁有書(本)D2E4F6合計12
*接下頁17分層抽樣方法②如果抽樣前掌握有關(guān)信息:如該宿舍住有老生和新生,且知道老生和新生在擁有書的數(shù)目上存在較大差異,則可以采用分層抽樣:表7-1調(diào)查實施情況表學(xué)生編號擁有書(本)A20B22C24合計66學(xué)生編號擁有書(本)D2E4F6合計12
*接上頁圖7-2
兩種抽樣方法的結(jié)果比較除了可以調(diào)查老生、新生擁有書的數(shù)量;還可以估計所有學(xué)生平均擁有書的數(shù)量;也可以分別估計老生、新生各類群體擁有書的數(shù)量。分層抽樣方法③分層抽樣中,對于樣本量如何在各層中進(jìn)行分配有不同的方法。
等比例分配不等比例分配在各層單位數(shù)相差懸殊的情況下,如果按等比例抽樣,總體單位數(shù)少的層所分到的樣本量過小,代表性不足,所以需要在該層適當(dāng)增大樣本量;或者有些層內(nèi)的方差過大,為了提高估計精度,在方差大的層中可以多抽,在方差小的層中可以少抽。18分層抽樣的估計原理是:利用各層樣本對各層的有關(guān)參數(shù)進(jìn)行估計將各層的估計結(jié)果加權(quán)綜合,得到總體的參數(shù)估計。分層抽樣的應(yīng)用條件是,抽樣框中有足夠的輔助信息,能夠?qū)⒖傮w單位按某種標(biāo)準(zhǔn)劃分到各層之中,實現(xiàn)在同一層內(nèi)各單位之間的差異盡可能小,不同層之間各單位的差異盡可能大。19整群抽樣方法①由若干總體單位組成的集合稱為群,總體被分解為群,抽樣直接抽取群,對抽中群中的所有單位都進(jìn)行調(diào)查稱為整群抽樣。實施調(diào)查方便可節(jié)省費用和時間。缺少抽樣框無法進(jìn)行簡單隨機(jī)抽樣。
在總體單位分布很廣的條件下,若采用簡單隨機(jī)抽樣樣本的分布很分散,調(diào)查實施有一定
難度。而當(dāng)群中各單位的分布非常集中時,抽中一個群以后在一個點上可以調(diào)查多個單位,
調(diào)查效率較高。調(diào)查方便缺乏抽樣框
如欲對北京市小學(xué)生的視力狀況進(jìn)行抽樣調(diào)查,但缺少全市小學(xué)生名單的抽樣框。但有全
市小學(xué)的抽樣框,可依據(jù)該抽樣框抽取小學(xué),再從選的小學(xué)中抽取班級,可以把班視為群,再對選中的班的所有學(xué)生進(jìn)行視力測試。20整群抽樣方法②整群抽樣的主要缺點是由于抽取樣本單位比較集中,群內(nèi)各單位之間存在相似性,差異比較??;而群與群之間的差別往往比較大,使得整群抽樣的抽樣誤差比較大。為達(dá)到一定的精度要求,就有必要增大樣本量,例如多抽取一些群進(jìn)行調(diào)查。所以可以看出整群抽樣的估計精度與群的性質(zhì)有關(guān)。但如果群內(nèi)各單位之間存在較大的差異,且群與群的結(jié)構(gòu)相似,整群抽樣反而會提高估計效率。在整群抽樣中,群的規(guī)??梢韵嗟?,也可以不等;抽取群時,可以采用等概率抽樣,也可以采用不等概率抽樣。這些情況構(gòu)成不同的組合,因而對總體參數(shù)有不同的估計形式。估計精度與群的性質(zhì)相關(guān)如欲估計某地區(qū)的男女比例:采用簡單隨機(jī)抽樣,抽取若干人可以得到總體男女比例的估計值;采用整群抽樣,以家庭為群,對抽中家庭中的所有人進(jìn)行統(tǒng)計,也可以得到總體男女比例的估計值。但整群抽樣下群內(nèi)個體之間存在很大差異(有男有女),而群與群之間即各家庭中的性別結(jié)構(gòu)卻十分相似(同樣也是有男有女),在這個背景下,整群抽樣估計男女比例的效率就高于簡單隨機(jī)抽樣。21系統(tǒng)抽樣方法系統(tǒng)抽樣是將總體中的單位按某種順序排列,在規(guī)定的范圍內(nèi)隨機(jī)抽取起始單位,然后按一定的規(guī)則確定其他樣本單位的一種抽樣方法??傮w單位的排列可以是一維的(如直線排列);也可以是二維的(如平面排列);起始單位可以是一個,也可以是一組;對總體單位的抽取可以是等概率的,也可以是不等概率的。
22系統(tǒng)抽樣方法的特點系統(tǒng)抽樣的突出特點是操作簡便。只需要隨機(jī)確定一個(或少數(shù)幾個)起始單位,整個樣本就自然確定了。系統(tǒng)抽樣對抽樣框的要求也比較簡單,只要求總體單位按一定順序排列,因而非常便于某些內(nèi)容的現(xiàn)場調(diào)查。系統(tǒng)抽樣的估計效率與總體單位排列順序有關(guān)。如果排列順序與調(diào)查內(nèi)容沒有聯(lián)系,稱為按無關(guān)標(biāo)識排列,這時系統(tǒng)抽樣估計與簡單隨機(jī)抽樣估計效率相仿,反之,則為按有關(guān)標(biāo)識排列。按有關(guān)標(biāo)識排列的系統(tǒng)抽樣精度比簡單隨機(jī)抽樣的精度高。如欲對某地區(qū)樹木進(jìn)行抽樣,了解病蟲害影響情況,可以將樹木所處的位置視為順序排列,每隔一定間隔,抽取一棵樹;又如欲對某城市汽車尾氣排放情況進(jìn)行調(diào)查,抽樣比為1%,即平均每100輛車中抽一輛,采用系統(tǒng)抽樣,可以將汽車牌號作為一種排列,在1~100中隨機(jī)抽取一個號,譬如53,凡牌號尾數(shù)為53的車輛均作為樣本單位。例如,欲對大學(xué)二年級的學(xué)生進(jìn)行抽樣調(diào)查,了解學(xué)生的平均身高。采用系統(tǒng)抽樣,如果是按學(xué)號排列,學(xué)號與學(xué)生身高沒有關(guān)系,屬于按無關(guān)標(biāo)識排列。如果是按學(xué)生入學(xué)時身高順序排列,則屬按有關(guān)標(biāo)識排列。23系統(tǒng)抽樣方法的局限性系統(tǒng)抽樣也有局限性,從估計方面看,當(dāng)N≠nk時,樣本均值不是總體均值的無偏估計量,雖然當(dāng)N很大,n也較大時,這種偏差很小。更為重要的是,系統(tǒng)抽樣的方差估計比較復(fù)雜,這就給計算抽樣誤差帶來一定困難。采用系統(tǒng)抽樣方法時,特別需要注意研究變量是否存在周期性變化。例如,欲對商場的零售額進(jìn)行抽樣調(diào)查,以每周7天為抽樣間隔。事實上,每周7天中,零售額的情況是不同的,一般規(guī)律是:周末和假日零售額較大,平日較少。若抽中周末為系統(tǒng)樣本的起點,估計結(jié)果會偏高;反之,若抽中平日為起點,估計結(jié)果會偏低。若遇到這種情況就需要調(diào)整抽樣間隔,使處于周期中各個位置的單位都有相同機(jī)會入選樣本,或者改用其他抽樣方法。多階段抽樣方法①多階段抽樣是指在抽樣中不是一次直接從總體中抽取最終樣本,而是經(jīng)過兩個或兩個以上階段才能抽到最終樣本單位??傮w單元初級單元24隨機(jī)抽取若干小總體隨機(jī)抽取若干小總體二階段抽樣三階段抽樣多階段抽樣多個階段隨機(jī)抽取隨機(jī)抽取若干小總體首先從總體中采用隨
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025中國移動廣東分公司春季校園招聘高頻重點提升(共500題)附帶答案詳解
- 2025中國石油蘭州石化分公司高校畢業(yè)生招聘176人(甘肅)高頻重點提升(共500題)附帶答案詳解
- 2025中國電信青海海北分公司招聘高頻重點提升(共500題)附帶答案詳解
- 2025中國電信山東濰坊分公司校園招聘高頻重點提升(共500題)附帶答案詳解
- 2025中國農(nóng)業(yè)科學(xué)院果樹研究所公開招聘14人高頻重點提升(共500題)附帶答案詳解
- 2025中國一汽校園招聘1000+崗位高頻重點提升(共500題)附帶答案詳解
- 2025下半年江蘇省徐州市區(qū)屬事業(yè)單位招聘57人歷年高頻重點提升(共500題)附帶答案詳解
- 2025上海奉賢區(qū)南橋鎮(zhèn)大學(xué)生村官招聘20人歷年高頻重點提升(共500題)附帶答案詳解
- 2025上半年貴州省安順西秀區(qū)事業(yè)單位招聘121人歷年高頻重點提升(共500題)附帶答案詳解
- 2025上半年江蘇省鎮(zhèn)江揚中事業(yè)單位招聘25人歷年高頻重點提升(共500題)附帶答案詳解
- 《水電工程水文設(shè)計規(guī)范》(NB-T 10233-2019)
- 2024年1月電大國家開放大學(xué)期末考試試題及答案:法理學(xué)
- 電纜大和小修危險源辨識和控制措施
- 超市經(jīng)營管理方案
- 開源情報行業(yè)分析
- 機(jī)關(guān)餐飲項目服務(wù)方案(完整版)
- 兒童福利機(jī)構(gòu)服務(wù)與管理規(guī)范
- 公開課教案Unit 3 Reading for Writing人教版(2019)必修第二冊
- 《工裝夾具設(shè)計》課程標(biāo)準(zhǔn)
- 2024年江西生物科技職業(yè)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 柜長管理方案
評論
0/150
提交評論