社會(huì)調(diào)查方法抽樣_第1頁
社會(huì)調(diào)查方法抽樣_第2頁
社會(huì)調(diào)查方法抽樣_第3頁
社會(huì)調(diào)查方法抽樣_第4頁
社會(huì)調(diào)查方法抽樣_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

社會(huì)調(diào)查方法抽樣第1頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法開篇案例

我們知道,近幾十年來,美國總統(tǒng)大選前夕,總有一些民意測(cè)驗(yàn)機(jī)構(gòu)喜歡對(duì)總統(tǒng)選擇投票的結(jié)果進(jìn)行預(yù)測(cè)。1936年美國總統(tǒng)選舉前夕,蓋洛普民意測(cè)驗(yàn)所僅僅調(diào)查了3000人,就成功地預(yù)測(cè)了民主黨人羅斯福將當(dāng)選為美國的新一任總統(tǒng)。1984年這家民意測(cè)驗(yàn)機(jī)構(gòu)又一次成功地預(yù)測(cè)了羅納得?里根將以59%比41%的優(yōu)勢(shì)戰(zhàn)勝蒙代爾而當(dāng)選為美國的新一任總統(tǒng)。這一預(yù)測(cè)結(jié)果與實(shí)際投票結(jié)果(59%:41%)相一致。而當(dāng)時(shí)蓋洛普民意測(cè)驗(yàn)所在將近1億美國選民中,調(diào)查的對(duì)象還不到2000人。第2頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法案例——2004年美國大選主要民調(diào)樣本數(shù)調(diào)查機(jī)構(gòu)樣本量??怂剐侣?200蓋洛普1573全國廣播公司/《華爾街日?qǐng)?bào)》1014哥倫比亞廣播公司/紐約時(shí)報(bào)939美國廣播公司/華盛頓郵報(bào)939《新聞周刊》882第3頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法51.34%48.31%2004年美國總統(tǒng)大選一周前民調(diào)結(jié)果第4頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法抽樣與我們的生活生活中充滿了抽樣冬泳之前,用腳尖試探一下水溫;做菜時(shí),用勺子舀起一些試試味道濃了還是淡了;在書店挑選一本營(yíng)銷調(diào)研的書籍,隨手拿起一本,翻看其中幾頁以決定是否購買;體檢時(shí)抽一試管的血看看身體血液情況;

……第5頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法為什么需要抽樣?一些實(shí)驗(yàn)本質(zhì)上是破壞性的物理上不具備考察總體所有項(xiàng)目的可能性對(duì)總體每一項(xiàng)目逐一考察費(fèi)用過高對(duì)總體每一項(xiàng)目逐一考察相當(dāng)耗時(shí)樣本結(jié)論充分性第6頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法抽樣方法論抽樣過程就是使用少量項(xiàng)目或者總體的一部分得出關(guān)于整個(gè)總體的結(jié)論樣本(sample)是一個(gè)更大的總體的子集或一部分抽樣的目的在于幫助我們對(duì)總體的一些未知特征進(jìn)行估計(jì)第7頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法抽樣的有關(guān)術(shù)語抽樣的基本程序抽樣類型(方法)樣本規(guī)模與抽樣誤差1234第8頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法一、抽樣的有關(guān)術(shù)語1、總體(Population)(此指調(diào)查總體)(在社會(huì)調(diào)查中用N表示)通常與構(gòu)成的元素共同定義,總體是構(gòu)成它的所有元素的集合,而元素則是構(gòu)成總體的基本單位。(1)研究總體:是在理論上明確界定的個(gè)體(分析單位)集合體。(是理論上的總體)(2)調(diào)查總體:是研究者實(shí)際抽樣樣本的個(gè)體(分析單位)的集合體。(是實(shí)際操作中的總體)二者不同:研究總體是我們概念上的,而調(diào)查總體是我們實(shí)際抽取樣本的集合。二者關(guān)系:調(diào)查總體應(yīng)當(dāng)無限趨近直至等于研究總體。如:開展對(duì)某省大學(xué)生擇業(yè)傾向調(diào)查時(shí),該省所有在校大學(xué)生的集合就是研究總體,每個(gè)在校大學(xué)生就是構(gòu)成總體的元素。該省所有在冊(cè)大學(xué)生則構(gòu)成調(diào)查總體。2、樣本(Sample)(社會(huì)調(diào)查中用n表示)是從調(diào)查總體中按一定方式抽取出來的那一部分代表的集合體。第9頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法3.抽樣(Sampling)

是一種選擇調(diào)查對(duì)象的程序與方法,即從總體中選取一部分代表的過程,也即從總體中按一定方式選擇或抽取樣本的過程。

如:從某省總數(shù)為10萬人的大學(xué)生總體中按照一定方式抽取出1000名大學(xué)生進(jìn)行調(diào)查,這1000名大學(xué)生就是構(gòu)成總體的一個(gè)樣本。(從一個(gè)總體中可以抽取出若干個(gè)不同的樣本)4.抽樣單位(SamplingUnit)

一次直接的抽樣所使用的基本單位。抽樣單位和構(gòu)成總體的元素有時(shí)相同,有時(shí)不同。5.抽樣框(SamplingFrame)

也稱抽樣范圍,指抽取樣本的所有抽樣單位的名單。如:從某所大學(xué)全體學(xué)生中直接抽取200名學(xué)生作為樣本—該校全體學(xué)生的名單從某一所大學(xué)所有班級(jí)中抽取3個(gè)班級(jí)作為樣本—該校所有班級(jí)的名單第10頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法6.參數(shù)值(Parameter)也稱總體值,是關(guān)于總體中某一變量的綜合描述。如:某廠職工的平均收入、平均年齡……7.統(tǒng)計(jì)值(Statistic)也稱樣本值,是關(guān)于樣本中某一變量的綜合描述。如:某廠職工中抽取出一部分,得到的平均收入、平均年齡……﹠參數(shù)值與統(tǒng)計(jì)值之間的區(qū)別與聯(lián)系:

(1)參數(shù)值是確定不變的、唯一的,并且通常是未知的。

(2)統(tǒng)計(jì)值則是變化的,即對(duì)于同一個(gè)總體來說,不同樣本所得到的統(tǒng)計(jì)值常常是有差別的;對(duì)于某一個(gè)特定的樣本來說,統(tǒng)計(jì)值是已知的,是可以通過計(jì)算得到的。

(3)聯(lián)系:通過樣本統(tǒng)計(jì)值可以推算總體參數(shù)值,從而達(dá)到調(diào)查部分以認(rèn)識(shí)總體的目的。這就是抽樣調(diào)查的作用所在。

第11頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法8.抽樣誤差(SamplingError)是指在用樣本統(tǒng)計(jì)值去推估總體參數(shù)值時(shí)所存在的偏差。它是由抽樣本身的隨機(jī)性引起的,是不可避免的。但是抽樣誤差的大小是控制的。﹠抽樣誤差的意義:是衡量樣本代表性好壞的標(biāo)準(zhǔn),抽樣誤差越小,說明樣本的代表性越好,反之,則越不好。第12頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法9.置信水平與置信區(qū)間(1)置信水平(ConfidenceLevel)也稱置信度,指的是總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)間內(nèi)的概率。(2)置信區(qū)間(ConfidenceInterval)是指在一定范圍的置信水平下,樣本統(tǒng)計(jì)值與總體參數(shù)值之間的誤差范圍(3)置信水平與置信區(qū)間的關(guān)系﹠置信水平反映的是抽樣的可靠性程度,置信區(qū)間反映的是抽樣的精確性程度。﹠在其他條件不變的情況下,置信水平越高,置信區(qū)間越大;置信水平越低,置信區(qū)間越小。對(duì)抽樣的可靠性程度要求越高,抽樣的精確性程度將越低;對(duì)抽樣的可靠性程度要求越低,則抽樣的精確性程度將越高。第13頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法抽樣的有關(guān)術(shù)語抽樣的基本程序抽樣類型(方法)樣本規(guī)模與抽樣誤差1234第14頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法二、抽樣的基本程序(一)界定總體

即在具體抽樣前,對(duì)從中抽取樣本的總體范圍作出明確的界定。﹠為什么要對(duì)總體進(jìn)行界定?

原因之一:是由抽樣調(diào)查的目的決定的,其目的是調(diào)查部分以反映總體。

原因之二:界定總體是達(dá)到良好的抽樣效果的前提條件。例如:1936年美國總統(tǒng)大選前《文學(xué)文摘》雜志的抽樣

第15頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法思考

美國的《文學(xué)文摘》是一本1890年—1938年間在美國發(fā)行頗為流行的新聞雜志。1920年、1924、1928、1932年的美國總統(tǒng)大選前都作出了準(zhǔn)確的預(yù)測(cè)。1936,《文學(xué)文摘》進(jìn)行了一次最具雄心的民意測(cè)驗(yàn)活動(dòng):選票寄給了從電話簿與車牌登記單中挑選出來的1000萬人。收到了200萬人以上的回應(yīng);結(jié)果顯示,有57%人支持共產(chǎn)黨候選人阿爾夫·蘭登,而當(dāng)時(shí)在任的美國總統(tǒng)富蘭克林·羅斯福的支持率為43%。

兩個(gè)星期以后全民選舉的結(jié)果出來了,羅斯福以歷史上最大的優(yōu)勢(shì)61%的得票率獲得第二屆任期。思考:為什么《文學(xué)文摘》的預(yù)測(cè)會(huì)失敗?第16頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法(二)選擇抽樣的具體方法,確定抽樣的精確性程度與樣本規(guī)模﹠如何確定抽樣的精確性和樣本規(guī)模(待)(三)制作抽樣框(回顧什么是抽樣框)當(dāng)采用一次性抽樣時(shí),應(yīng)依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并對(duì)名單按隨機(jī)原則進(jìn)行統(tǒng)一編號(hào),建立起供抽樣使用的抽樣框。﹠例如:我們要在浙江工業(yè)大學(xué)進(jìn)行一項(xiàng)該校學(xué)生職業(yè)觀的抽樣調(diào)查。﹠注意:當(dāng)采取多級(jí)抽樣時(shí),則需制作多個(gè)抽樣框。﹠例如:為了了解某市小學(xué)生的學(xué)習(xí)情況,需要從全市500所小學(xué)中抽取500名小學(xué)生調(diào)查。第17頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法﹠準(zhǔn)確的抽樣框原則:1、完整性2、不重復(fù)性例如:在城市居民戶的抽樣中,會(huì)經(jīng)常出現(xiàn)一戶有多處住房的情況,這樣很容易把一戶重復(fù)列入抽樣框,使得他們?cè)诔闃又械闹羞x概率高于其他居民,相反,許多城市居民居住條件比較差,很多居民同住在一個(gè)門牌號(hào)中,因此很容易遺漏。兩種情況均違背了隨機(jī)抽樣的等概率原則。第18頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法(四)實(shí)際抽取樣本即在前進(jìn)幾個(gè)步驟的基礎(chǔ)上,嚴(yán)格按照所選定的抽樣方法,從抽樣框中抽取一個(gè)個(gè)抽樣單位,構(gòu)成調(diào)查樣本。(五)評(píng)估樣本質(zhì)量所謂樣本評(píng)估,就是對(duì)樣本的質(zhì)量、代表性、偏差等進(jìn)行初步的檢驗(yàn)和衡量,其目的是防止由于前面步驟中的失誤而使樣本偏差太大,進(jìn)而導(dǎo)致整個(gè)調(diào)查的失誤。﹠評(píng)估樣本的基本方法:將可得到的反映總體中某些重要特征及其分布的資料與樣本中的同類指標(biāo)的資料進(jìn)行對(duì)比。若二者之間的差別很小,則可認(rèn)為樣本的質(zhì)量較高,代表性較好;反之,若二者之間的差別十分明顯,則表明樣本的質(zhì)量和代表性不可能高。因而需要對(duì)前面的抽樣步驟進(jìn)行檢查、修正,直到抽出質(zhì)量較高、代表性較好的樣本為止。

第19頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法﹠例如:從我校3000名學(xué)生中抽取300名學(xué)生作為樣本。同時(shí),我們從學(xué)校教務(wù)處或?qū)W生處得到下列統(tǒng)計(jì)資料:全校男生占學(xué)生總數(shù)的53%,女生占47%;本市學(xué)生占40%,外省學(xué)生占60%。那么,我們可以對(duì)抽出的300名學(xué)生進(jìn)行這兩方面分布情況的統(tǒng)計(jì)。假定樣本統(tǒng)計(jì)得到的結(jié)果是:男生占52%,女生占48%;本市學(xué)生占41%,外省學(xué)生占59%。兩相對(duì)比,可以發(fā)現(xiàn)二者之間的差距很小,這就在一定程度上說明,樣本的質(zhì)量較高,代表性較好,從這樣的樣本中得到的結(jié)果往往能較好地反映和體現(xiàn)總體的情況。第20頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法抽樣的有關(guān)術(shù)語抽樣的基本程序抽樣類型(方法)樣本規(guī)模與抽樣誤差1234第21頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法

三、抽樣類型

﹠根據(jù)調(diào)查總體中每一個(gè)個(gè)體有無同等的機(jī)會(huì)入選樣本,可以將抽樣分為概率抽樣與非概率抽樣兩大類。﹠概率抽樣─是依據(jù)概率論的原理,按照等概率原則進(jìn)行的抽樣,因而它能夠避免抽樣過程中的人為誤差,保證樣本的代表性。此法在社會(huì)調(diào)查最常用。﹠非概率抽樣─主要是依據(jù)研究者的主觀意愿、主觀判斷或是否方便等因素來抽取調(diào)查對(duì)象,它不考慮抽樣中是否等概率,因而往往產(chǎn)生較大的誤差,難以保證樣本的代表性。此法在社會(huì)調(diào)查中用得較少。第22頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法﹠根據(jù)抽取調(diào)查對(duì)象的具體方式的不同,又可分將概率抽樣與非概率抽樣分為若干小類,具體分類如下圖所示。

簡(jiǎn)單隨機(jī)

系統(tǒng)抽樣

概率抽樣

分層抽樣

整群抽樣抽樣方法

多段抽樣

偶遇抽樣非概率抽樣

判斷抽樣

定額抽樣

雪球抽樣

probabilitysample

Non-probabilitysample

sample第23頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法(一)概率抽樣

1、簡(jiǎn)單隨機(jī)抽樣(SimpleRandomSampling)★概念:它是按等概率原則直接從含有N個(gè)個(gè)體的總體中抽取n個(gè)個(gè)體組成樣本(N>n)。其典型就是抽簽。★方法:一是抽簽;二是利用隨機(jī)數(shù)表來抽樣?!锢秒S機(jī)數(shù)表進(jìn)行抽樣的具體步驟是:(1)先取得一份調(diào)查總體所有個(gè)體的名單(即抽樣框);(2)將總體中所有個(gè)體一一按順序編號(hào);(3)根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機(jī)數(shù)表中選幾位數(shù)碼;(4)以總體規(guī)模為標(biāo)準(zhǔn),對(duì)隨機(jī)數(shù)表中的數(shù)碼逐一進(jìn)行衡量并決定取舍;(5)根據(jù)樣本規(guī)模的要求選擇出足夠的數(shù)碼個(gè)數(shù);(6)依據(jù)從隨機(jī)數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對(duì)應(yīng)的個(gè)體。這些個(gè)案的集合就構(gòu)成樣本?!镞m用范圍:總體單位數(shù)目和所需樣本數(shù)目都比較少。例:某總體共6000人,現(xiàn)需要從中抽取300名作為樣本進(jìn)行調(diào)查,運(yùn)用隨機(jī)數(shù)表法。第24頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法2、系統(tǒng)抽樣(SystematicSampling)★概念:是把總體中的個(gè)體進(jìn)行隨機(jī)編號(hào)并排序,再計(jì)算出某種間隔,然后按這一固定的間隔抽取個(gè)體的號(hào)碼來組成樣本的方法?!锞唧w步驟:(1)給總體中的每一個(gè)個(gè)體隨機(jī)編上號(hào)碼并按號(hào)碼排序,即制作抽樣框;(2)計(jì)算出抽樣間距,公式為:K=N/n(K—抽樣間隔,N—總體規(guī)模,n—樣本規(guī)模);(3)在最前面的K個(gè)個(gè)體中,隨機(jī)抽取一個(gè)個(gè)體,并記號(hào)其編號(hào)(假定為A),作為隨機(jī)起點(diǎn);(4)在抽樣框中,自A開始,每隔K個(gè)個(gè)體抽取一個(gè)個(gè)體,即所抽取個(gè)體的編號(hào)分別為A,A+K,A+2K,.,A+(n-1)K;(5)將這n個(gè)個(gè)體合起來,就構(gòu)成了該總體的一個(gè)樣本。第25頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法例如:某學(xué)院共有1000名學(xué)生,要抽取一個(gè)容量為100的大學(xué)生樣本,使用系統(tǒng)抽樣的方法如何抽取。課堂練習(xí):現(xiàn)要對(duì)某一產(chǎn)品的口味進(jìn)行測(cè)試,需要從調(diào)查總體的150人中抽取12人進(jìn)行測(cè)試,請(qǐng)使用系統(tǒng)抽樣的方法抽取樣本。?思考:如果總體的個(gè)體數(shù)不能被樣本容量整除時(shí),如何處理?第26頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法001011021031…091002012022032092003013023033093004014024034094005015025035095006016026…..096007017027097008018028098009019029099010020030100√√√√√第27頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法★注意:一般不選用系統(tǒng)抽樣方法的情況。(1)在總體的名單中,個(gè)體的排列具有次序上的先后和等級(jí)上的高低的時(shí)候。

(2)在總體名單中,個(gè)體的排列上有與抽樣間隔相對(duì)應(yīng)的周期性分布的情況。

★適用范圍:總體數(shù)量不大,個(gè)體排列無次序性和周期性。

第28頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法3、分層抽樣(StratifiedSampling)★概念:是先將總體中的所有個(gè)體按某種特征或標(biāo)志劃分為若干類型,然后再在各類型中采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣的方法抽取一個(gè)子樣本,最后將這些子樣本合起來構(gòu)成總體的一個(gè)樣本。其中,N為總體,Ni為子總體,n為樣本,ni為子樣本第29頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法★具體步驟:(1)確定分類標(biāo)準(zhǔn),如性別、年齡、地區(qū)等。(2)按確定的標(biāo)準(zhǔn)將總體單位分為若干類型。(3)計(jì)算各類型單位數(shù)量占總體單位數(shù)量的比重。設(shè)總體單位數(shù)為N,各類型單位數(shù)為Ni,各類型單位數(shù)占總體單位數(shù)的比重為Ri。公式:Ri=Ni/N(4)根據(jù)Ri計(jì)算出各類型中應(yīng)抽取樣本單位的數(shù)量。設(shè)各類型的樣本單位數(shù)為ni,所需抽取的樣本總數(shù)為n。公式:ni=n×Ri(5)按簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣方法從各類型中按比例抽取樣本。第30頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法分類隨機(jī)抽樣總體樣本子群第31頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法★例如:某省1000個(gè)鄉(xiāng),其中山區(qū)鄉(xiāng)500個(gè),丘陵鄉(xiāng)300個(gè),平原鄉(xiāng)200個(gè),現(xiàn)在要抽取100個(gè)鄉(xiāng)進(jìn)行調(diào)查,如何運(yùn)用分層抽樣來抽取樣本?解:設(shè)山區(qū)i=1,丘陵i=2,平原i=3R1=N1/N×100%=500/1000×100%=50%R2=N2/N×100%=300/1000×100%=30%R3=N3/N×100%=200/1000×100%=20%

n1=R1×n=50%×100=50n2=R2×n=30%×100=30n3=R3×n=20%×100=20即從500個(gè)山區(qū)鄉(xiāng)中抽取50個(gè),從300個(gè)丘陵鄉(xiāng)中抽取30個(gè),從200個(gè)平原鄉(xiāng)中抽取20個(gè)。其中各階段均使用簡(jiǎn)單隨機(jī)抽樣的方法進(jìn)行。第32頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法★課堂練習(xí):某地共有居民20000戶,其中高收入居民4000戶,中等收入居民12000戶,低收入居民4000戶,現(xiàn)要從中抽取500戶做購買力調(diào)查,如何運(yùn)用分層抽樣抽取樣本?第33頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法★優(yōu)點(diǎn):(1)可以在不增加樣本規(guī)模的前提下,降低抽樣誤差,提高抽樣的精度。(2)便于了解總體內(nèi)不同層次的情況,便于對(duì)總體中不同層次和類別進(jìn)行單獨(dú)研究,或進(jìn)行比較?!镒⒁猓海?)分層標(biāo)準(zhǔn):A.以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層標(biāo)準(zhǔn);B.以保證各層內(nèi)部同質(zhì)性強(qiáng),各層之間異質(zhì)性強(qiáng)、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層標(biāo)準(zhǔn);C.以那些已有明顯層次區(qū)分的變量作為分層變量。第34頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法(2)分層比例:A.按比例分層B.不按比例分層——在用樣本資料去推斷總體時(shí),要調(diào)整樣本中各層的比例,使數(shù)據(jù)資料恢復(fù)到總體中各層實(shí)際的比例結(jié)構(gòu)。

例如:某廠有工人600人,按性別分層則有男工500人,女工100人,現(xiàn)要抽取60人作為樣本進(jìn)行調(diào)查,分別按比例分層和不按比例分層抽樣?!镞m用范圍:總體單位數(shù)量較多,單位之間差異性較大。第35頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法4、整群抽樣(ClusterSampling)

思考:某高中有8000名學(xué)生,分為200個(gè)班級(jí),每班有40名學(xué)生,現(xiàn)在要從中抽取400名學(xué)生調(diào)查本校學(xué)生消費(fèi)情況,問:使用簡(jiǎn)單隨機(jī)抽樣方法和系統(tǒng)抽樣方法分別如何抽取樣本?除了使用以上方法,還能怎樣抽取樣本?

第36頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法NnN1N2N3N4N5N6N2N6N3★概念:是從總體中隨機(jī)抽取一些小群體,然后由所抽出的若干個(gè)小群體內(nèi)的所有元素構(gòu)成調(diào)查的一個(gè)樣本。其中,N為總體,Ni為子總體,n為樣本第37頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法劃分子群隨機(jī)抽樣第38頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法★整群抽樣與前幾種抽樣方法的最大區(qū)別在于,它的抽樣單位不是單個(gè)的個(gè)體,而是成群的個(gè)體。★具體步驟:1、將總體各單位按一定標(biāo)準(zhǔn)劃分為若干群體。2、以群為單位,從整體中抽取部分群(數(shù)量確定)3、將這些群中的所有個(gè)體合起來,形成總體的一個(gè)樣本。第39頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法★特點(diǎn):(1)優(yōu)點(diǎn):可簡(jiǎn)化抽樣的過程,降低調(diào)查中收集資料的費(fèi)用,同時(shí)還能相對(duì)地?cái)U(kuò)大抽樣的應(yīng)用范圍。(2)缺點(diǎn):是樣本的分布面不廣,樣本對(duì)總體的代表性相對(duì)較差。(解釋:在95℅的置信度下,置信區(qū)間為+3℅這一范圍,簡(jiǎn)單隨機(jī)抽樣500個(gè)個(gè)體,整群抽樣800個(gè)個(gè)體。)★整群抽樣的應(yīng)用范圍較廣,在簡(jiǎn)單隨機(jī)抽樣與系統(tǒng)抽樣中,都要求有一份總體所有成員的名單,即抽樣框。但在實(shí)際調(diào)查過程中,這樣的名單往往難獲得,此時(shí)可采用整群抽樣來解決問題。★適用范圍:總體規(guī)模較大,各群體之間差異性不大,而群體內(nèi)部個(gè)體之間差異性較大。第40頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法★思考:分層抽樣與整群抽樣的適用范圍有何不同?為什么?

當(dāng)群間同質(zhì)性高,群內(nèi)異質(zhì)性高時(shí),適合于采用整群抽樣的方法當(dāng)群間異質(zhì)性高,群內(nèi)同質(zhì)性高時(shí),則適于采用分層抽樣的方法第41頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法課堂練習(xí):

某中學(xué)有4800名學(xué)生,分為4個(gè)年級(jí),80個(gè)班,現(xiàn)在要抽取480名學(xué)生進(jìn)行學(xué)生身體健康狀況調(diào)查,運(yùn)用簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣和整群抽樣的方法分別如何抽取樣本?第42頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法5、多段抽樣(Multi-stagesampling)按抽樣單位的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣分為幾個(gè)階段來進(jìn)行。例如:從全市300所小學(xué)抽取300名小學(xué)生調(diào)查,可以分為幾個(gè)階段來進(jìn)行?每個(gè)階段的抽樣單位分別是什么??jī)?yōu)點(diǎn):簡(jiǎn)化抽樣過程。缺點(diǎn):抽樣誤差大。

在同等條件下,減少多段抽樣誤差的方法是:適當(dāng)增加開頭階段的樣本數(shù)而相對(duì)減少后面階段的樣本數(shù)。第43頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法

例如:某地有2.4萬名教師,他們分布在全市10個(gè)區(qū)的200所學(xué)校里,現(xiàn)在要抽取一個(gè)由1200名教師組成的樣本,按照三級(jí)抽樣的方法,有以下幾種抽樣方案:

?思考:1、哪一種方案最節(jié)省人力和經(jīng)費(fèi)?2、哪一種方案得到的樣本精確度最高?3、考慮到實(shí)際情況,你在抽樣中會(huì)選擇哪種方案?為什么?第一階段第二階段第三階段方案110個(gè)區(qū)每個(gè)區(qū)抽4所學(xué)校每所學(xué)校抽30名教師方案210個(gè)區(qū)每個(gè)區(qū)抽20所學(xué)校每所學(xué)校抽6名教師方案3從10個(gè)區(qū)中抽5個(gè)區(qū)每個(gè)區(qū)抽12所學(xué)校每所學(xué)校抽20名教師方案4從10個(gè)區(qū)中抽3個(gè)區(qū)每個(gè)區(qū)抽10所學(xué)校每所學(xué)校抽40名教師方案5從10個(gè)區(qū)中抽1個(gè)區(qū)每個(gè)區(qū)抽12所學(xué)校每所學(xué)校抽100名教師第44頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法假設(shè)我們的總體是全國所有城市的集合,我們要抽取一個(gè)規(guī)模為40個(gè)城市的樣本。若按簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣的方法,則首先需要弄到一份全國城市的名單,然后根據(jù)隨機(jī)數(shù)表或通過計(jì)算抽樣間距直接從抽樣框中抽取城市;若按分層抽樣的方法,則可以先按城市規(guī)模將總體分為特大城市、大城市、中等城市和小城市四類,然后分別從每一類中抽取若干城市,并將這些城市合起來構(gòu)成樣本;如果采用整群抽樣的方法,則可以以省(自治區(qū),直轄市)為抽樣單位,從全國31個(gè)省(自治區(qū)、直轄市)中隨機(jī)抽取三至五個(gè)省(自治區(qū)、直轄市),再以所抽中的這些省(自治區(qū)、直轄市)中所包含的全部城市的集合作為樣本。幾種抽樣方法的比較第45頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法五種概率抽樣方法的圖示比較簡(jiǎn)單隨機(jī)抽樣第46頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法五種概率抽樣方法的圖示比較不按比例分層按比例分層第47頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法五種概率抽樣方法的圖示比較整群抽樣第48頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法五種概率抽樣方法的圖示比較系統(tǒng)抽樣第49頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法五種概率抽樣方法的圖示比較多段抽樣第50頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法6、PPS抽樣

當(dāng)元素的大小不同,或者元素在總體中的地位不同時(shí),我們需要采用不等概率抽樣的方法。比如,從全市幾百家企業(yè)中抽取20家企業(yè)進(jìn)行調(diào)查時(shí),一個(gè)有著數(shù)萬職工的大型企業(yè)與一個(gè)只有一二百人的小企業(yè)所占的地位,顯然是很不一樣的。如果此時(shí)仍然采用等概率抽樣的方法,則樣本的代表性和精度都會(huì)比較差。而如果采用不等概率抽樣的方法,使大的企業(yè)入選樣本的概率大一些,小企業(yè)入選樣本的概率小一些,這樣就可以大大提高估計(jì)的精度。

社會(huì)研究中最重要、也最常用的一種不等概率抽樣叫做“概率與元素的規(guī)模大小成比例的抽樣”(samplingwithprobabilityproportionatetosize),簡(jiǎn)稱PPS抽樣。第51頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法假設(shè)要從全市100家企業(yè),總共20萬名職工中,抽取1000名職工進(jìn)行調(diào)查。已知最大的企業(yè)多達(dá)16000名職工,而最小的企業(yè)則只有200名職工。如果我們采取多段抽樣的方法,先從100家企業(yè)中隨機(jī)抽取若干家企業(yè),比如說抽取20家;然后再從這20家企業(yè)中分別抽取50名職工(50×20=1000)構(gòu)成樣本。第一階段:入選概率是相同的,即都為20÷100=20%第二階段:規(guī)模大的企業(yè)中每個(gè)職工被抽中的概率則為20%×(50÷16000)=0.0625%;規(guī)模小的企業(yè)中每個(gè)職工被抽中的概率為20%×(50÷200)=5%第52頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法采用PPS的方法:先將各個(gè)元素(即企業(yè))排列起來,然后寫出它們的規(guī)模、計(jì)算它們的規(guī)模在總體規(guī)模中所占的比例;將它們的比例累計(jì)起來,并根據(jù)比例的累計(jì)數(shù)依次寫出每一元素所對(duì)應(yīng)的選擇號(hào)碼范圍,然后采用隨機(jī)數(shù)表的方法或系統(tǒng)抽樣的方法選擇號(hào)碼,號(hào)碼所對(duì)應(yīng)的元素入選第一階段樣本,最后再從所選樣本中進(jìn)行第二階段抽樣(即從每個(gè)被抽中的元素中抽取50名職工)。第53頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法用PPS方法抽取第一階段樣本舉例序號(hào)規(guī)模所占比例累計(jì)選擇號(hào)碼范圍所選號(hào)碼入樣元素企業(yè)1企業(yè)2企業(yè)3企業(yè)4企業(yè)5企業(yè)6企業(yè)7企業(yè)8企業(yè)9企業(yè)10…企業(yè)98企業(yè)99企業(yè)10030002000160002001200600080060014004200…40018006001.5%1%8%0.1%0.6%3%0.4%0.3%0.7%2.1%…0.2%0.9%0.3%1.5%2.5%10.5%10.6%11.2%14.2%14.6%14.9%15.6%17.7%…98.8%99.7%100%000-014015-024025-104105106-111112-141142-145146-148149-155156-176…978-987988-996997-999012048、095133148171…995元素1元素2、3元素4元素5元素6…元素20第54頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法由于規(guī)模大的企業(yè)其所對(duì)應(yīng)的選擇號(hào)碼范圍也大,而選樣號(hào)碼范圍大時(shí),被抽中的概率也大(有些特別大的企業(yè)還可能抽到不止一個(gè)號(hào)碼,比如企業(yè)3就抽到兩個(gè)號(hào)碼。那么在第二階段抽樣中,就要從企業(yè)3中抽取50×2=100名職工)。由于規(guī)模大的企業(yè)在第一階段抽樣時(shí)被抽中的概率大于規(guī)模小的企業(yè),這樣就補(bǔ)償了第二階段抽樣時(shí)規(guī)模大的企業(yè)中每個(gè)職工被抽中的概率小的情況,使得無論規(guī)模大還是規(guī)模小的企業(yè)中,每個(gè)職工總的被抽中的概率都是相等的。所以,這種方法最終抽出的樣本對(duì)總體的代表性也大。第55頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法7、戶內(nèi)抽樣戶內(nèi)抽樣的概念

——以家庭為單位時(shí),從入選家庭中抽取一個(gè)成年人構(gòu)成訪談對(duì)象的抽樣方法。方法之一:科什選擇法(kish)方法之二:生日法第56頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法科什選擇法具體做法:1、調(diào)查表編號(hào)表編號(hào)AB1B2CDE1E2F表數(shù)量(N)1/61/121/121/61/61/121/121/62、印制選擇卡,給每個(gè)調(diào)查員發(fā)一套(八種)第57頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法Kish選擇表A式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為11213141516或以上1F式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為11223344556或以上6第58頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法3.給抽中家庭每個(gè)成年人進(jìn)行編號(hào)并排序。方法是男性在前、年級(jí)大的在前。序號(hào)年齡和性別特征1最年長(zhǎng)的男性2次年長(zhǎng)的男性……n最年幼的男性n+1最年長(zhǎng)的女性n+2次年長(zhǎng)的女性……n+m最年幼的女性序號(hào)成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲第59頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法4.根據(jù)調(diào)查表上的編號(hào)找出編號(hào)相同的那種“選擇表”查出中選個(gè)體的序號(hào),進(jìn)行調(diào)查。序號(hào)成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲F

式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為11223344556或以上6第60頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法生日法具體做法:1、隨機(jī)確定一年中的某一天為標(biāo)準(zhǔn)日前2、了解所抽中的戶中18歲以上的人口數(shù),以及每人的生日3、計(jì)算每人的生日距離標(biāo)準(zhǔn)日期的天數(shù)4、從中選出生日距離標(biāo)準(zhǔn)日期最近或最遠(yuǎn)的人作為調(diào)查對(duì)象第61頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法(二)非概率抽樣

1.偶遇抽樣(AccidentalorConvenienceSampling)是指研究者根據(jù)現(xiàn)實(shí)情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對(duì)象,或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對(duì)象2.判斷抽樣(JudgmentalorPurposiveSampling)

是調(diào)查者根據(jù)研究目標(biāo)和自己的主觀分析來選擇和確定調(diào)查對(duì)象的方法(對(duì)調(diào)查者的要求比較高)。3.定額抽樣(QuotaSampling)

是按調(diào)查對(duì)象的某種屬性或特征將總體中所有個(gè)體分成若干類或?qū)?,然后在各層中按比例抽樣。抽樣時(shí)不要求遵守隨機(jī)原則。第62頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法例如:某高校2000名學(xué)生,其中男生60﹪,女生40﹪;文科學(xué)生和理科學(xué)生各占50﹪,一、二、三、四年級(jí)學(xué)生分別占40﹪、30﹪、20﹪、10﹪,現(xiàn)用定額抽樣方法依上述三個(gè)變數(shù)抽取一個(gè)規(guī)模為100的樣本。男生(60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(20人)一二三四一二三四一二三四一二三四129631296386428642表1100個(gè)人的定額樣本分布表第63頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法課堂練習(xí)某工廠有3000名工人,男工占30℅,女工70℅,30歲以下的60℅,30-40歲的30℅,40歲以上的10℅,問如何采用定額抽樣的方法抽取一個(gè)規(guī)模為300人的樣本?第64頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法男工(90人)女工(210人)30歲以下30—40歲40歲以上30歲以下30—40歲40歲以上54人27人9人126人63人21人表2300個(gè)人的定額樣本分布表第65頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法4.滾雪球抽樣(SnowballSampling)

是先從幾個(gè)適合的個(gè)體開始,然后通過他們得到更多的個(gè)體,這樣一步步地?cái)U(kuò)大樣本規(guī)模的抽樣方法。此法常用于去尋找具有相同性質(zhì)的個(gè)體,就象滾雪球一樣。(如下圖)AB第66頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法抽樣的有關(guān)術(shù)語抽樣的基本程序抽樣類型(方法)樣本規(guī)模與抽樣誤差1234第67頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法四、樣本規(guī)模(Samplesize)與抽樣誤差(SamplingError)思考并回答下列問題:1、什么是樣本規(guī)模?社會(huì)調(diào)查中對(duì)樣本規(guī)模有什么要求?2、表4-7說明了一個(gè)什么問題?3、影響樣本規(guī)模確定的因素有哪些?4、如果總體為3000時(shí),所需樣本為600,那么在總體為9000時(shí),所需的樣本應(yīng)為多少?(圖4-8)5、表4-8說明一個(gè)什么問題?6、抽樣的精確度與哪兩個(gè)因素有關(guān)?分別如何影響的?在其他條件一定的情況下,置信度越高,所需要樣本規(guī)模()在其他條件一定的情況下,置信區(qū)間越小,所需要樣本規(guī)模()7、要達(dá)到同樣的精確度,在同質(zhì)性程度高和異質(zhì)性程度高的總體中,對(duì)樣本的規(guī)模的要求有何不同?8、什么是抽樣誤差?抽樣誤差是否可以避免?調(diào)查和研究中的人為因素(如錄入錯(cuò)誤、填答錯(cuò)誤、計(jì)算錯(cuò)誤等)是否屬于抽樣誤差?第68頁,共77頁,2023年,2月20日,星期一社會(huì)調(diào)查方法

樣本規(guī)模又稱樣本容量,是指樣本中所含個(gè)體的多少。大樣本(n≥30個(gè)個(gè)體);小樣本(n<30個(gè)個(gè)體)。大樣本的平均數(shù)的分布接近于正態(tài)分布,可用樣本的資料對(duì)總體進(jìn)行推論。但在社會(huì)調(diào)查中,樣本規(guī)模一般不能少于100個(gè)個(gè)體。(一)影響樣本規(guī)模確定的因素(正相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論