社會調(diào)查方法- 抽樣_第1頁
社會調(diào)查方法- 抽樣_第2頁
社會調(diào)查方法- 抽樣_第3頁
社會調(diào)查方法- 抽樣_第4頁
社會調(diào)查方法- 抽樣_第5頁
已閱讀5頁,還剩72頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

抽樣使我們能從總體具有代表性的部分樣本中獲取數(shù)據(jù),從而可以得到關于整個總體的有效結(jié)論?!猍英]托尼·普羅科特2021/5/91開篇案例

我們知道,近幾十年來,美國總統(tǒng)大選前夕,總有一些民意測驗機構喜歡對總統(tǒng)選擇投票的結(jié)果進行預測。1936年美國總統(tǒng)選舉前夕,蓋洛普民意測驗所僅僅調(diào)查了3000人,就成功地預測了民主黨人羅斯福將當選為美國的新一任總統(tǒng)。1984年這家民意測驗機構又一次成功地預測了羅納得?里根將以59%比41%的優(yōu)勢戰(zhàn)勝蒙代爾而當選為美國的新一任總統(tǒng)。這一預測結(jié)果與實際投票結(jié)果(59%:41%)相一致。而當時蓋洛普民意測驗所在將近1億美國選民中,調(diào)查的對象還不到2000人。2021/5/92浙江工業(yè)大學案例——2004年美國大選主要民調(diào)樣本數(shù)調(diào)查機構樣本量??怂剐侣?200蓋洛普1573全國廣播公司/《華爾街日報》1014哥倫比亞廣播公司/紐約時報939美國廣播公司/華盛頓郵報939《新聞周刊》8822021/5/93浙江工業(yè)大學51.34%48.31%2004年美國總統(tǒng)大選一周前民調(diào)結(jié)果2021/5/94浙江工業(yè)大學抽樣與我們的生活生活中充滿了抽樣冬泳之前,用腳尖試探一下水溫;做菜時,用勺子舀起一些試試味道濃了還是淡了;在書店挑選一本營銷調(diào)研的書籍,隨手拿起一本,翻看其中幾頁以決定是否購買;體檢時抽一試管的血看看身體血液情況;

……2021/5/95浙江工業(yè)大學為什么需要抽樣?一些實驗本質(zhì)上是破壞性的物理上不具備考察總體所有項目的可能性對總體每一項目逐一考察費用過高對總體每一項目逐一考察相當耗時樣本結(jié)論充分性2021/5/96浙江工業(yè)大學抽樣方法論抽樣過程就是使用少量項目或者總體的一部分得出關于整個總體的結(jié)論樣本(sample)是一個更大的總體的子集或一部分抽樣的目的在于幫助我們對總體的一些未知特征進行估計2021/5/97浙江工業(yè)大學抽樣的有關術語抽樣的基本程序抽樣類型(方法)樣本規(guī)模與抽樣誤差12342021/5/98浙江工業(yè)大學一、抽樣的有關術語1、總體(Population)(此指調(diào)查總體)(在社會調(diào)查中用N表示)

通常與構成的元素共同定義,總體是構成它的所有元素的集合,而元素則是構成總體的基本單位。(1)研究總體:是在理論上明確界定的個體(分析單位)集合體。(是理論上的總體)(2)調(diào)查總體:是研究者實際抽樣樣本的個體(分析單位)的集合體。(是實際操作中的總體)

二者不同:研究總體是我們概念上的,而調(diào)查總體是我們實際抽取樣本的集合。二者關系:調(diào)查總體應當無限趨近直至等于研究總體。如:開展對某省大學生擇業(yè)傾向調(diào)查時,該省所有在校大學生的集合就是研究總體,每個在校大學生就是構成總體的元素。該省所有在冊大學生則構成調(diào)查總體。2、樣本(Sample)(社會調(diào)查中用n表示)

是從調(diào)查總體中按一定方式抽取出來的那一部分代表的集合體。2021/5/99浙江工業(yè)大學3.抽樣(Sampling)

是一種選擇調(diào)查對象的程序與方法,即從總體中選取一部分代表的過程,也即從總體中按一定方式選擇或抽取樣本的過程。

如:從某省總數(shù)為10萬人的大學生總體中按照一定方式抽取出1000名大學生進行調(diào)查,這1000名大學生就是構成總體的一個樣本。(從一個總體中可以抽取出若干個不同的樣本)4.抽樣單位(SamplingUnit)

一次直接的抽樣所使用的基本單位。抽樣單位和構成總體的元素有時相同,有時不同。5.抽樣框(SamplingFrame)

也稱抽樣范圍,指抽取樣本的所有抽樣單位的名單。如:從某所大學全體學生中直接抽取200名學生作為樣本—該校全體學生的名單

從某一所大學所有班級中抽取3個班級作為樣本—該校所有班級的名單2021/5/910浙江工業(yè)大學6.參數(shù)值(Parameter)也稱總體值,是關于總體中某一變量的綜合描述。如:某廠職工的平均收入、平均年齡……7.統(tǒng)計值(Statistic)

也稱樣本值,是關于樣本中某一變量的綜合描述。如:某廠職工中抽取出一部分,得到的平均收入、平均年齡……﹠參數(shù)值與統(tǒng)計值之間的區(qū)別與聯(lián)系:

(1)參數(shù)值是確定不變的、唯一的,并且通常是未知的。

(2)統(tǒng)計值則是變化的,即對于同一個總體來說,不同樣本所得到的統(tǒng)計值常常是有差別的;對于某一個特定的樣本來說,統(tǒng)計值是已知的,是可以通過計算得到的。

(3)聯(lián)系:通過樣本統(tǒng)計值可以推算總體參數(shù)值,從而達到調(diào)查部分以認識總體的目的。這就是抽樣調(diào)查的作用所在。

2021/5/911浙江工業(yè)大學8.抽樣誤差(SamplingError)

是指在用樣本統(tǒng)計值去推估總體參數(shù)值時所存在的偏差。它是由抽樣本身的隨機性引起的,是不可避免的。但是抽樣誤差的大小是控制的。﹠抽樣誤差的意義:是衡量樣本代表性好壞的標準,抽樣誤差越小,說明樣本的代表性越好,反之,則越不好。2021/5/912浙江工業(yè)大學9.置信水平與置信區(qū)間(1)置信水平(ConfidenceLevel)

也稱置信度,指的是總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間內(nèi)的概率。(2)置信區(qū)間(ConfidenceInterval)

是指在一定范圍的置信水平下,樣本統(tǒng)計值與總體參數(shù)值之間的誤差范圍(3)置信水平與置信區(qū)間的關系﹠置信水平反映的是抽樣的可靠性程度,置信區(qū)間反映的是抽樣的精確性程度。﹠在其他條件不變的情況下,置信水平越高,置信區(qū)間越大;置信水平越低,置信區(qū)間越小。對抽樣的可靠性程度要求越高,抽樣的精確性程度將越低;對抽樣的可靠性程度要求越低,則抽樣的精確性程度將越高。2021/5/913浙江工業(yè)大學抽樣的有關術語抽樣的基本程序抽樣類型(方法)樣本規(guī)模與抽樣誤差12342021/5/914浙江工業(yè)大學二、抽樣的基本程序(一)界定總體

即在具體抽樣前,對從中抽取樣本的總體范圍作出明確的界定。﹠為什么要對總體進行界定?

原因之一:是由抽樣調(diào)查的目的決定的,其目的是調(diào)查部分以反映總體。原因之二:界定總體是達到良好的抽樣效果的前提條件。例如:

1936年美國總統(tǒng)大選前《文學文摘》雜志的抽樣

2021/5/915浙江工業(yè)大學思考美國的《文學文摘》是一本1890年—1938年間在美國發(fā)行頗為流行的新聞雜志。1920年、1924、1928、1932年的美國總統(tǒng)大選前都作出了準確的預測。1936,《文學文摘》進行了一次最具雄心的民意測驗活動:選票寄給了從電話簿與車牌登記單中挑選出來的1000萬人。收到了200萬人以上的回應;結(jié)果顯示,有57%人支持共產(chǎn)黨候選人阿爾夫·蘭登,而當時在任的美國總統(tǒng)富蘭克林·羅斯福的支持率為43%。兩個星期以后全民選舉的結(jié)果出來了,羅斯福以歷史上最大的優(yōu)勢61%的得票率獲得第二屆任期。思考:為什么《文學文摘》的預測會失敗?2021/5/916浙江工業(yè)大學(二)選擇抽樣的具體方法,確定抽樣的精確性程度與樣本規(guī)模﹠如何確定抽樣的精確性和樣本規(guī)模(待)(三)制作抽樣框(回顧什么是抽樣框)當采用一次性抽樣時,應依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并對名單按隨機原則進行統(tǒng)一編號,建立起供抽樣使用的抽樣框。﹠例如:我們要在浙江工業(yè)大學進行一項該校學生職業(yè)觀的抽樣調(diào)查。﹠注意:當采取多級抽樣時,則需制作多個抽樣框。﹠例如:為了了解某市小學生的學習情況,需要從全市500所小學中抽取500名小學生調(diào)查。2021/5/917浙江工業(yè)大學﹠準確的抽樣框原則:1、完整性2、不重復性

例如:

在城市居民戶的抽樣中,會經(jīng)常出現(xiàn)一戶有多處住房的情況,這樣很容易把一戶重復列入抽樣框,使得他們在抽樣中的中選概率高于其他居民,相反,許多城市居民居住條件比較差,很多居民同住在一個門牌號中,因此很容易遺漏。兩種情況均違背了隨機抽樣的等概率原則。2021/5/918浙江工業(yè)大學(四)實際抽取樣本

即在前進幾個步驟的基礎上,嚴格按照所選定的抽樣方法,從抽樣框中抽取一個個抽樣單位,構成調(diào)查樣本。(五)評估樣本質(zhì)量

所謂樣本評估,就是對樣本的質(zhì)量、代表性、偏差等進行初步的檢驗和衡量,其目的是防止由于前面步驟中的失誤而使樣本偏差太大,進而導致整個調(diào)查的失誤。﹠評估樣本的基本方法:將可得到的反映總體中某些重要特征及其分布的資料與樣本中的同類指標的資料進行對比。若二者之間的差別很小,則可認為樣本的質(zhì)量較高,代表性較好;反之,若二者之間的差別十分明顯,則表明樣本的質(zhì)量和代表性不可能高。因而需要對前面的抽樣步驟進行檢查、修正,直到抽出質(zhì)量較高、代表性較好的樣本為止。

2021/5/919浙江工業(yè)大學﹠例如:

從我校3000名學生中抽取300名學生作為樣本。同時,我們從學校教務處或?qū)W生處得到下列統(tǒng)計資料:全校男生占學生總數(shù)的53%,女生占47%;本市學生占40%,外省學生占60%。那么,我們可以對抽出的300名學生進行這兩方面分布情況的統(tǒng)計。假定樣本統(tǒng)計得到的結(jié)果是:男生占52%,女生占48%;本市學生占41%,外省學生占59%。兩相對比,可以發(fā)現(xiàn)二者之間的差距很小,這就在一定程度上說明,樣本的質(zhì)量較高,代表性較好,從這樣的樣本中得到的結(jié)果往往能較好地反映和體現(xiàn)總體的情況。2021/5/920浙江工業(yè)大學抽樣的有關術語抽樣的基本程序抽樣類型(方法)樣本規(guī)模與抽樣誤差12342021/5/921浙江工業(yè)大學

三、抽樣類型

﹠根據(jù)調(diào)查總體中每一個個體有無同等的機會入選樣本,可以將抽樣分為概率抽樣與非概率抽樣兩大類。﹠概率抽樣─是依據(jù)概率論的原理,按照等概率原則進行的抽樣,因而它能夠避免抽樣過程中的人為誤差,保證樣本的代表性。此法在社會調(diào)查最常用。﹠非概率抽樣─主要是依據(jù)研究者的主觀意愿、主觀判斷或是否方便等因素來抽取調(diào)查對象,它不考慮抽樣中是否等概率,因而往往產(chǎn)生較大的誤差,難以保證樣本的代表性。此法在社會調(diào)查中用得較少。2021/5/922浙江工業(yè)大學﹠根據(jù)抽取調(diào)查對象的具體方式的不同,又可分將概率抽樣與非概率抽樣分為若干小類,具體分類如下圖所示。簡單隨機系統(tǒng)抽樣概率抽樣分層抽樣整群抽樣抽樣方法多段抽樣

偶遇抽樣非概率抽樣判斷抽樣定額抽樣雪球抽樣

probabilitysample

Non-probabilitysample

sample2021/5/923浙江工業(yè)大學(一)概率抽樣

1、簡單隨機抽樣(SimpleRandomSampling)★概念:它是按等概率原則直接從含有N個個體的總體中抽取n個個體組成樣本(N>n)。其典型就是抽簽?!锓椒ǎ阂皇浅楹?;二是利用隨機數(shù)表來抽樣?!锢秒S機數(shù)表進行抽樣的具體步驟是:(1)先取得一份調(diào)查總體所有個體的名單(即抽樣框);(2)將總體中所有個體一一按順序編號;(3)根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機數(shù)表中選幾位數(shù)碼;(4)以總體規(guī)模為標準,對隨機數(shù)表中的數(shù)碼逐一進行衡量并決定取舍;(5)根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個數(shù);(6)依據(jù)從隨機數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對應的個體。這些個案的集合就構成樣本?!镞m用范圍:總體單位數(shù)目和所需樣本數(shù)目都比較少。例:某總體共6000人,現(xiàn)需要從中抽取300名作為樣本進行調(diào)查,運用隨機數(shù)表法。2021/5/924浙江工業(yè)大學2、系統(tǒng)抽樣(SystematicSampling)★概念:是把總體中的個體進行隨機編號并排序,再計算出某種間隔,然后按這一固定的間隔抽取個體的號碼來組成樣本的方法?!锞唧w步驟:(1)給總體中的每一個個體隨機編上號碼并按號碼排序,即制作抽樣框;(2)計算出抽樣間距,公式為:K=N/n(K—抽樣間隔,N—總體規(guī)模,n—樣本規(guī)模);(3)在最前面的K個個體中,隨機抽取一個個體,并記號其編號(假定為A),作為隨機起點;(4)在抽樣框中,自A開始,每隔K個個體抽取一個個體,即所抽取個體的編號分別為A,A+K,A+2K,.,A+(n-1)K;(5)將這n個個體合起來,就構成了該總體的一個樣本。2021/5/925浙江工業(yè)大學例如:

某學院共有1000名學生,要抽取一個容量為100的大學生樣本,使用系統(tǒng)抽樣的方法如何抽取。課堂練習:

現(xiàn)要對某一產(chǎn)品的口味進行測試,需要從調(diào)查總體的150人中抽取12人進行測試,請使用系統(tǒng)抽樣的方法抽取樣本。?思考:如果總體的個體數(shù)不能被樣本容量整除時,如何處理?2021/5/926浙江工業(yè)大學001011021031…091002012022032092003013023033093004014024034094005015025035095006016026…..096007017027097008018028098009019029099010020030100√√√√√2021/5/927浙江工業(yè)大學★注意:一般不選用系統(tǒng)抽樣方法的情況。(1)在總體的名單中,個體的排列具有次序上的先后和等級上的高低的時候。

(2)在總體名單中,個體的排列上有與抽樣間隔相對應的周期性分布的情況。

★適用范圍:總體數(shù)量不大,個體排列無次序性和周期性。

2021/5/928浙江工業(yè)大學3、分層抽樣(StratifiedSampling)★概念:是先將總體中的所有個體按某種特征或標志劃分為若干類型,然后再在各類型中采用簡單隨機抽樣或系統(tǒng)抽樣的方法抽取一個子樣本,最后將這些子樣本合起來構成總體的一個樣本。其中,N為總體,Ni為子總體,n為樣本,ni為子樣本2021/5/929浙江工業(yè)大學★具體步驟:(1)確定分類標準,如性別、年齡、地區(qū)等。(2)按確定的標準將總體單位分為若干類型。(3)計算各類型單位數(shù)量占總體單位數(shù)量的比重。

設總體單位數(shù)為N,各類型單位數(shù)為Ni,各類型單位數(shù)占總體單位數(shù)的比重為Ri。公式:Ri=Ni/N(4)根據(jù)Ri計算出各類型中應抽取樣本單位的數(shù)量。設各類型的樣本單位數(shù)為ni,所需抽取的樣本總數(shù)為n。公式:ni=n×Ri(5)按簡單隨機抽樣或系統(tǒng)抽樣方法從各類型中按比例抽取樣本。2021/5/930浙江工業(yè)大學分類隨機抽樣總體樣本子群2021/5/931浙江工業(yè)大學★例如:某省1000個鄉(xiāng),其中山區(qū)鄉(xiāng)500個,丘陵鄉(xiāng)300個,平原鄉(xiāng)200個,現(xiàn)在要抽取100個鄉(xiāng)進行調(diào)查,如何運用分層抽樣來抽取樣本?解:設山區(qū)i=1,丘陵i=2,平原i=3R1=N1/N×100%=500/1000×100%=50%R2=N2/N×100%=300/1000×100%=30%R3=N3/N×100%=200/1000×100%=20%

n1=R1×n=50%×100=50n2=R2×n=30%×100=30n3=R3×n=20%×100=20

即從500個山區(qū)鄉(xiāng)中抽取50個,從300個丘陵鄉(xiāng)中抽取30個,從200個平原鄉(xiāng)中抽取20個。其中各階段均使用簡單隨機抽樣的方法進行。2021/5/932浙江工業(yè)大學★課堂練習:

某地共有居民20000戶,其中高收入居民4000戶,中等收入居民12000戶,低收入居民4000戶,現(xiàn)要從中抽取500戶做購買力調(diào)查,如何運用分層抽樣抽取樣本?2021/5/933浙江工業(yè)大學★優(yōu)點:(1)可以在不增加樣本規(guī)模的前提下,降低抽樣誤差,提高抽樣的精度。(2)便于了解總體內(nèi)不同層次的情況,便于對總體中不同層次和類別進行單獨研究,或進行比較?!镒⒁猓海?)分層標準:A.以調(diào)查所要分析和研究的主要變量或相關的變量作為分層標準;B.以保證各層內(nèi)部同質(zhì)性強,各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構的變量作為分層標準;C.以那些已有明顯層次區(qū)分的變量作為分層變量。2021/5/934浙江工業(yè)大學(2)分層比例:A.按比例分層B.不按比例分層——在用樣本資料去推斷總體時,要調(diào)整樣本中各層的比例,使數(shù)據(jù)資料恢復到總體中各層實際的比例結(jié)構。

例如:

某廠有工人600人,按性別分層則有男工500人,女工100人,現(xiàn)要抽取60人作為樣本進行調(diào)查,分別按比例分層和不按比例分層抽樣?!镞m用范圍:總體單位數(shù)量較多,單位之間差異性較大。2021/5/935浙江工業(yè)大學4、整群抽樣(ClusterSampling)

思考:

某高中有8000名學生,分為200個班級,每班有40名學生,現(xiàn)在要從中抽取400名學生調(diào)查本校學生消費情況,問:使用簡單隨機抽樣方法和系統(tǒng)抽樣方法分別如何抽取樣本?除了使用以上方法,還能怎樣抽取樣本?

2021/5/936浙江工業(yè)大學NnN1N2N3N4N5N6N2N6N3★概念:是從總體中隨機抽取一些小群體,然后由所抽出的若干個小群體內(nèi)的所有元素構成調(diào)查的一個樣本。其中,N為總體,Ni為子總體,n為樣本2021/5/937浙江工業(yè)大學劃分子群隨機抽樣2021/5/938浙江工業(yè)大學★整群抽樣與前幾種抽樣方法的最大區(qū)別在于,它的抽樣單位不是單個的個體,而是成群的個體。★具體步驟:1、將總體各單位按一定標準劃分為若干群體。2、以群為單位,從整體中抽取部分群(數(shù)量確定)3、將這些群中的所有個體合起來,形成總體的一個樣本。2021/5/939浙江工業(yè)大學★特點:(1)優(yōu)點:可簡化抽樣的過程,降低調(diào)查中收集資料的費用,同時還能相對地擴大抽樣的應用范圍。(2)缺點:是樣本的分布面不廣,樣本對總體的代表性相對較差。(解釋:在95℅的置信度下,置信區(qū)間為+3℅這一范圍,簡單隨機抽樣500個個體,整群抽樣800個個體。)★整群抽樣的應用范圍較廣,在簡單隨機抽樣與系統(tǒng)抽樣中,都要求有一份總體所有成員的名單,即抽樣框。但在實際調(diào)查過程中,這樣的名單往往難獲得,此時可采用整群抽樣來解決問題?!镞m用范圍:總體規(guī)模較大,各群體之間差異性不大,而群體內(nèi)部個體之間差異性較大。2021/5/940浙江工業(yè)大學★思考:分層抽樣與整群抽樣的適用范圍有何不同?為什么?

當群間同質(zhì)性高,群內(nèi)異質(zhì)性高時,適合于采用整群抽樣的方法當群間異質(zhì)性高,群內(nèi)同質(zhì)性高時,則適于采用分層抽樣的方法2021/5/941浙江工業(yè)大學課堂練習:某中學有4800名學生,分為4個年級,80個班,現(xiàn)在要抽取480名學生進行學生身體健康狀況調(diào)查,運用簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣和整群抽樣的方法分別如何抽取樣本?2021/5/942浙江工業(yè)大學5、多段抽樣(Multi-stagesampling)按抽樣單位的隸屬關系或?qū)哟侮P系,把抽樣分為幾個階段來進行。例如:從全市300所小學抽取300名小學生調(diào)查,可以分為幾個階段來進行?每個階段的抽樣單位分別是什么?優(yōu)點:簡化抽樣過程。缺點:抽樣誤差大。

在同等條件下,減少多段抽樣誤差的方法是:適當增加開頭階段的樣本數(shù)而相對減少后面階段的樣本數(shù)。2021/5/943浙江工業(yè)大學

例如:某地有2.4萬名教師,他們分布在全市10個區(qū)的200所學校里,現(xiàn)在要抽取一個由1200名教師組成的樣本,按照三級抽樣的方法,有以下幾種抽樣方案:

?思考:1、哪一種方案最節(jié)省人力和經(jīng)費?2、哪一種方案得到的樣本精確度最高?3、考慮到實際情況,你在抽樣中會選擇哪種方案?為什么?第一階段第二階段第三階段方案110個區(qū)每個區(qū)抽4所學校每所學校抽30名教師方案210個區(qū)每個區(qū)抽20所學校每所學校抽6名教師方案3從10個區(qū)中抽5個區(qū)每個區(qū)抽12所學校每所學校抽20名教師方案4從10個區(qū)中抽3個區(qū)每個區(qū)抽10所學校每所學校抽40名教師方案5從10個區(qū)中抽1個區(qū)每個區(qū)抽12所學校每所學校抽100名教師2021/5/944浙江工業(yè)大學假設我們的總體是全國所有城市的集合,我們要抽取一個規(guī)模為40個城市的樣本。若按簡單隨機抽樣或系統(tǒng)抽樣的方法,則首先需要弄到一份全國城市的名單,然后根據(jù)隨機數(shù)表或通過計算抽樣間距直接從抽樣框中抽取城市;若按分層抽樣的方法,則可以先按城市規(guī)模將總體分為特大城市、大城市、中等城市和小城市四類,然后分別從每一類中抽取若干城市,并將這些城市合起來構成樣本;如果采用整群抽樣的方法,則可以以省(自治區(qū),直轄市)為抽樣單位,從全國31個?。ㄗ灾螀^(qū)、直轄市)中隨機抽取三至五個省(自治區(qū)、直轄市),再以所抽中的這些省(自治區(qū)、直轄市)中所包含的全部城市的集合作為樣本。幾種抽樣方法的比較2021/5/945浙江工業(yè)大學五種概率抽樣方法的圖示比較簡單隨機抽樣2021/5/946浙江工業(yè)大學五種概率抽樣方法的圖示比較不按比例分層按比例分層2021/5/947浙江工業(yè)大學五種概率抽樣方法的圖示比較整群抽樣2021/5/948浙江工業(yè)大學五種概率抽樣方法的圖示比較系統(tǒng)抽樣2021/5/949浙江工業(yè)大學五種概率抽樣方法的圖示比較多段抽樣2021/5/950浙江工業(yè)大學6、PPS抽樣

當元素的大小不同,或者元素在總體中的地位不同時,我們需要采用不等概率抽樣的方法。比如,從全市幾百家企業(yè)中抽取20家企業(yè)進行調(diào)查時,一個有著數(shù)萬職工的大型企業(yè)與一個只有一二百人的小企業(yè)所占的地位,顯然是很不一樣的。如果此時仍然采用等概率抽樣的方法,則樣本的代表性和精度都會比較差。而如果采用不等概率抽樣的方法,使大的企業(yè)入選樣本的概率大一些,小企業(yè)入選樣本的概率小一些,這樣就可以大大提高估計的精度。

社會研究中最重要、也最常用的一種不等概率抽樣叫做“概率與元素的規(guī)模大小成比例的抽樣”(samplingwithprobabilityproportionatetosize),簡稱PPS抽樣。2021/5/951浙江工業(yè)大學假設要從全市100家企業(yè),總共20萬名職工中,抽取1000名職工進行調(diào)查。已知最大的企業(yè)多達16000名職工,而最小的企業(yè)則只有200名職工。如果我們采取多段抽樣的方法,先從100家企業(yè)中隨機抽取若干家企業(yè),比如說抽取20家;然后再從這20家企業(yè)中分別抽取50名職工(50×20=1000)構成樣本。第一階段:入選概率是相同的,即都為20÷100=20%第二階段:規(guī)模大的企業(yè)中每個職工被抽中的概率則為20%×(50÷16000)=0.0625%;規(guī)模小的企業(yè)中每個職工被抽中的概率為20%×(50÷200)=5%2021/5/952浙江工業(yè)大學采用PPS的方法:先將各個元素(即企業(yè))排列起來,然后寫出它們的規(guī)模、計算它們的規(guī)模在總體規(guī)模中所占的比例;將它們的比例累計起來,并根據(jù)比例的累計數(shù)依次寫出每一元素所對應的選擇號碼范圍,然后采用隨機數(shù)表的方法或系統(tǒng)抽樣的方法選擇號碼,號碼所對應的元素入選第一階段樣本,最后再從所選樣本中進行第二階段抽樣(即從每個被抽中的元素中抽取50名職工)。2021/5/953浙江工業(yè)大學用PPS方法抽取第一階段樣本舉例序號規(guī)模所占比例累計選擇號碼范圍所選號碼入樣元素企業(yè)1企業(yè)2企業(yè)3企業(yè)4企業(yè)5企業(yè)6企業(yè)7企業(yè)8企業(yè)9企業(yè)10…企業(yè)98企業(yè)99企業(yè)10030002000160002001200600080060014004200…40018006001.5%1%8%0.1%0.6%3%0.4%0.3%0.7%2.1%…0.2%0.9%0.3%1.5%2.5%10.5%10.6%11.2%14.2%14.6%14.9%15.6%17.7%…98.8%99.7%100%000-014015-024025-104105106-111112-141142-145146-148149-155156-176…978-987988-996997-999012048、095133148171…995元素1元素2、3元素4元素5元素6…元素202021/5/954浙江工業(yè)大學由于規(guī)模大的企業(yè)其所對應的選擇號碼范圍也大,而選樣號碼范圍大時,被抽中的概率也大(有些特別大的企業(yè)還可能抽到不止一個號碼,比如企業(yè)3就抽到兩個號碼。那么在第二階段抽樣中,就要從企業(yè)3中抽取50×2=100名職工)。由于規(guī)模大的企業(yè)在第一階段抽樣時被抽中的概率大于規(guī)模小的企業(yè),這樣就補償了第二階段抽樣時規(guī)模大的企業(yè)中每個職工被抽中的概率小的情況,使得無論規(guī)模大還是規(guī)模小的企業(yè)中,每個職工總的被抽中的概率都是相等的。所以,這種方法最終抽出的樣本對總體的代表性也大。2021/5/955浙江工業(yè)大學7、戶內(nèi)抽樣戶內(nèi)抽樣的概念

——以家庭為單位時,從入選家庭中抽取一個成年人構成訪談對象的抽樣方法。方法之一:科什選擇法(kish)方法之二:生日法2021/5/956浙江工業(yè)大學科什選擇法具體做法:1、調(diào)查表編號表編號AB1B2CDE1E2F表數(shù)量(N)1/61/121/121/61/61/121/121/62、印制選擇卡,給每個調(diào)查員發(fā)一套(八種)2021/5/957浙江工業(yè)大學Kish選擇表A式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11213141516或以上1F式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11223344556或以上62021/5/958浙江工業(yè)大學3.給抽中家庭每個成年人進行編號并排序。方法是男性在前、年級大的在前。序號年齡和性別特征1最年長的男性2次年長的男性……n最年幼的男性n+1最年長的女性n+2次年長的女性……n+m最年幼的女性序號成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲2021/5/959浙江工業(yè)大學4.根據(jù)調(diào)查表上的編號找出編號相同的那種“選擇表”查出中選個體的序號,進行調(diào)查。序號成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲F

式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號為11223344556或以上62021/5/960浙江工業(yè)大學生日法具體做法:1、隨機確定一年中的某一天為標準日前2、了解所抽中的戶中18歲以上的人口數(shù),以及每人的生日3、計算每人的生日距離標準日期的天數(shù)4、從中選出生日距離標準日期最近或最遠的人作為調(diào)查對象2021/5/961浙江工業(yè)大學(二)非概率抽樣

1.偶遇抽樣(AccidentalorConvenienceSampling)

是指研究者根據(jù)現(xiàn)實情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對象,或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對象2.判斷抽樣(JudgmentalorPurposiveSampling)

是調(diào)查者根據(jù)研究目標和自己的主觀分析來選擇和確定調(diào)查對象的方法(對調(diào)查者的要求比較高)。3.定額抽樣(QuotaSampling)

是按調(diào)查對象的某種屬性或特征將總體中所有個體分成若干類或?qū)?,然后在各層中按比例抽樣。抽樣時不要求遵守隨機原則。2021/5/962浙江工業(yè)大學例如:某高校2000名學生,其中男生60﹪,女生40﹪;文科學生和理科學生各占50﹪,一、二、三、四年級學生分別占40﹪、30﹪、20﹪、10﹪,現(xiàn)用定額抽樣方法依上述三個變數(shù)抽取一個規(guī)模為100的樣本。男生(60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(20人)一二三四一二三四一二三四一二三四129631296386428642表1100個人的定額樣本分布表2021/5/963浙江工業(yè)大學課堂練習某工廠有3000名工人,男工占30℅,女工70℅,30歲以下的60℅,30-40歲的30℅,40歲以上的10℅,問如何采用定額抽樣的方法抽取一個規(guī)模為300人的樣本?2021/5/964浙江工業(yè)大學男工(90人)女工(210人)30歲以下30—40歲40歲以上30歲以下30—40歲40歲以上54人27人9人126人63人21人表2300個人的定額樣本分布表2021/5/965浙江工業(yè)大學4.滾雪球抽樣(SnowballSampling)

是先從幾個適合的個體開始,然后通過他們得到更多的個體,這樣一步步地擴大樣本規(guī)模的抽樣方法。此法常用于去尋找具有相同性質(zhì)的個體,就象滾雪球一樣。(如下圖)AB2021/5/966浙江工業(yè)大學抽樣的有關術語抽樣的基本程序抽樣類型(方法)樣本規(guī)模與抽樣誤差12342021/5/967浙江工業(yè)大學四、樣本規(guī)模(Samplesize)與抽樣誤差(SamplingError)思考并回答下列問題:1、什么是樣本規(guī)模?社會調(diào)查中對樣本規(guī)模有什么要求?2、表4-7說明了一個什么問題?3、影響樣本規(guī)模確定的因素有哪些?4、如果總體為3000時,所需樣本為600,那么在總體為9000時,所需的樣本應為多少?(圖4-8)5、表4-8說明一個什么問題?6、抽樣的精確度與哪兩個因素有關?分別如何影響的?在其他條件一定的情況下,置信度越高,所需要樣本規(guī)模()在其他條件一定的情況下,置信區(qū)間越小,所需要樣本規(guī)模()7、要達到同樣的精確度,在同質(zhì)性程度高和異質(zhì)性程度高的總體中,對樣本的規(guī)模的要求有何不同?8、什么是抽樣誤差?抽樣誤差是否可以避免?調(diào)查和研究中的人為因素(如錄入錯誤、填答錯誤、計算錯誤等)是否屬于抽樣誤差?2021/5/968浙江工業(yè)大學

樣本規(guī)模又稱樣本容量,是指樣本中所含個體的多少。大樣本(n≥30個個體);小樣本(n<30個個體)。大樣本的平均數(shù)的分布接近于正態(tài)分布,可用樣本的資料對總體進行推論。但在社會調(diào)查中,樣本規(guī)模一般不能少于100個

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論