《社會調(diào)查研究方法》課件第6講抽樣_第1頁
《社會調(diào)查研究方法》課件第6講抽樣_第2頁
《社會調(diào)查研究方法》課件第6講抽樣_第3頁
《社會調(diào)查研究方法》課件第6講抽樣_第4頁
《社會調(diào)查研究方法》課件第6講抽樣_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、不超過2000人就可以對9000萬選民的行為進行預(yù)測!抽樣作為一種從部分到整體、從個別到一般的認識方法,自古有之。但抽樣作為科學的調(diào)查方法,只有很短的歷史。始于1891年挪威的人口調(diào)查。1936年美國總統(tǒng)競選,當時著名的調(diào)查機構(gòu)美國文學文摘采用大樣本調(diào)查(樣本量達200萬人),預(yù)測阿爾夫蘭登將戰(zhàn)勝富蘭克林羅斯福當時無名的蓋洛普通過20003000個樣本的調(diào)查,得出完全相反的結(jié)論。最終羅斯福獲得民眾63支持率成為美國總統(tǒng)。此后,蓋洛普公司在歷屆總統(tǒng)競選的預(yù)測當中都獲得巨大的成功,依據(jù)的都是3000以下樣本的抽樣調(diào)查。第1節(jié) 抽樣的意義與作用 一、抽樣的概念1、總體與元素總體(population

2、):構(gòu)成它的所有元素的集合 元素(element):構(gòu)成總體的最基本單位 2、樣本(sample):從總體中按一定方式抽取出的一部分元素的集合?;蛘哒f,一個樣本就是總體的一個子集。3、抽樣(sampling):從組成某個總體的所有元素的集合中,按一定的方式選擇或抽取一部分元素的過程。 4、抽樣單位(sampling unit):一次直接的抽樣所使用的基本單位。注意:抽樣單位與構(gòu)成總體的元素有時是相同的,有時是不同的。5、抽樣框(sampling frame):一次直接抽樣時總體中所有抽樣單位的名稱,又稱為“抽樣范圍”。 6、參數(shù)值(parameter):關(guān)于總體中某一變量的綜合描述,或者是總體

3、中所有元素的某種特征的綜合數(shù)量表現(xiàn),也稱為總體值。 總體值只有通過對總體中的每個元素都進行調(diào)查或測量才能得到。 7、統(tǒng)計值(statistic):也稱為樣本值,關(guān)于樣本中某一變量的綜合描述,或者是對樣本中所有元素的某種特征的綜合數(shù)量的表現(xiàn)。 樣本值是從樣本的所有元素計算來的,是相應(yīng)總體值的估計量。 從每個樣本中所得到的估計量,都只是總體許多可能的估計量的一個。 抽樣設(shè)計的目標:盡可能使抽出的樣本的估計量接近總體的參數(shù)值。 二、抽樣的作用 由部分認識總體 抽樣的方法受到時間、經(jīng)費、人力等方面的制約,是這幾者之間的平衡。 三、抽樣的類型 1、概率抽樣:依據(jù)概率理論,按照隨機的原則選擇樣本,不帶調(diào)查

4、者的主觀色彩。2、非概率抽樣:依據(jù)研究者的主觀意愿、判斷或是否方便等因素來抽取對象。 第2節(jié) 非概率抽樣方法 一、偶遇抽樣 1、含義:偶遇抽樣(accidental sampling)又稱作方便抽樣或自然抽樣,指研究者根據(jù)現(xiàn)實情況,以自己方便的形式抽取偶然遇到的人作為對象,或者僅僅選擇那些離的最近、最容易找到的人作為對象。2、特點:(1)沒有保證總體中的每一個成員都具有同等的被抽中的概率。(2)不能依據(jù)偶遇抽樣得到的樣本來推論總體。二、判斷抽樣 1、概念:判斷抽樣(judgmental sampling)又稱為立意抽樣(purposive sampling),研究者根據(jù)研究的目標和自己的主觀分

5、析,來選擇和確定研究對象的方法。 2、特點:(1)抽樣標準有較大的主觀性;(2)樣本的代表性難以判斷;(3)多用于總體規(guī)模小、涉及的范圍較窄,或時間、人力等條件有限而難以進行大規(guī)模抽樣。 三、定額抽樣 1、概念:定額抽樣(quota sampling)又稱作配額抽樣,根據(jù)不同特征的成員在總體中所占的比例來選擇抽樣對象的方法。 2、假定:(1)只要類型劃分較細,那么同一類型中的每一個個體都是同質(zhì)的,因而無需采用隨機抽樣。(2)只要類型劃分合理,且分配各類的名額符合總體中各類人員的分布,那么樣本就能準確地反映總體。 3、做法:依據(jù)那些有可能影響研究變量的因素對總體分層,并找出具有不同特征的成員在總

6、體中所占的比例;依據(jù)這種劃分以及各類成員的比例去選擇對象,使樣本中的成員在上述各種因素、各種特征方面的構(gòu)成及在樣本中的比例盡量接近總體。舉例1:課本,p.145 舉例2:夢想調(diào)查的配額說明4、適用范圍:研究的主要目標不是去推斷總體狀況,而主要是為了檢驗理論、解釋關(guān)系或比較不同性質(zhì)的群體。抽樣標準不是代表性,而是合適性。 5、先天缺陷:配額的框架必須十分精確,為了做到這點,必須掌握最新的資料,這是非常困難的。四、雪球抽樣 1、含義:雪球抽樣(snowball sampling)是根據(jù)既有研究對象的建議或其關(guān)系網(wǎng)絡(luò),找出其他研究對象的抽樣方法。 2、具體做法:從總體中少數(shù)成員入手,對他們進行調(diào)查,

7、向他們詢問還知道哪些符合條件的人;再去找那些人并再詢問他們知道的人,由此不斷找到越來越多具有相同性質(zhì)的群體成員。這種方法在定性研究方法中經(jīng)常運用。3、特點:抽樣代表偏誤很大。 第3節(jié) 概率抽樣的原理與程序 一、概率抽樣的基本原理 簡單選取樣本的問題:隨意抽樣的誤差難以避免:個人的偏見;不能把握總體特征。代表性:當選出樣本的各種集合特征大體接近于總體的集合特征時,樣本就具有代表性。抽樣的最終目的是通過對樣本的統(tǒng)計值的描述來準確勾畫總體的面貌。樣本一般都難以絕對完美地代表總體。概率抽樣具有兩項獨特的優(yōu)點:(1)較其他方法更具代表性,能避免各種偏見;(2)更重要的,概率理論使我們能夠估計樣本的精確度

8、和代表性。隨機抽樣(random selection),是概率抽樣過程的核心。在隨機抽樣中,任何元素(對象)都具有同等的、獨立于任何其他事件的被抽中的概率。例如:投擲硬幣、擲骰子等。二、抽樣分布 1、抽樣分布:從總體中不斷抽取樣本時,各種可能出現(xiàn)的樣本統(tǒng)計值的分布情況。 2個樣本,有45個可能的抽樣:選擇更大的樣本:大數(shù)定理:當試驗次數(shù)n足夠大時,n個隨機變量的平均值與單個隨機變量的數(shù)學期望u的差可以任意的小。當樣本容量增大,樣本平均數(shù)的分布會發(fā)生變化,即平均數(shù)的范圍將逐步縮小,相同的平均數(shù)增多,而且,平均數(shù)的分布向總體平均數(shù)集中的趨勢也越發(fā)明顯。中心極限定理:當n足夠大,樣本平均值趨于正態(tài)分

9、布。 當n足夠大(通常假定大于30),無論總體的分布如何,其樣本平均數(shù)所構(gòu)成的分布都趨于正態(tài)分布。 正態(tài)分布曲線:68.26%的樣本平均數(shù)落在+SE之間;90%的樣本平均數(shù)落在+1.65SE之間(p0.10) ;95%的樣本統(tǒng)計值落在+1.96SE內(nèi)(p0.05);99% 的樣本統(tǒng)計值落在+2.58SE內(nèi)(p0.01) ;99.9%的樣本統(tǒng)計值落在+3SE內(nèi)(pn)。 2、方法:(1)號碼抽簽法(2)隨機數(shù)表抽樣第一,取得一份總體所有元素的名單(抽樣框);第二,將總體中的所有元素一一按順序編號;第三,根據(jù)總體規(guī)模是幾位數(shù)來確定從隨機數(shù)表中選幾位數(shù)碼;第四,以總體的規(guī)模為標準,對隨機數(shù)表中的數(shù)碼

10、逐一進行衡量并決定取舍;第五,根據(jù)樣本規(guī)模的要求選出足夠的數(shù)碼個數(shù);第六,依據(jù)從隨機數(shù)表中選出的數(shù)碼,到抽樣框中去找出它所對應(yīng)的元素。練習:假定某公司有員工10000人,如果需要隨機抽取10人作為樣本,請利用隨機數(shù)表,按照從左到右的順序,選出抽取的樣本編號。如果按照從上到下的順序,抽取的樣本編號又是怎樣的呢? 二、系統(tǒng)抽樣 1、概念:系統(tǒng)抽樣(systematic sampling)又稱等距抽樣或機械抽樣。它把總體的單位進行標號排序后,再計算出某種間隔,然后按照這一固定的間隔抽取樣本的號碼來組成樣本的方法。 抽樣間距(sampling interval):兩個被選擇要素間的標準距離。抽樣比率(

11、sampling ratio):被選擇要素與所有總體要素數(shù)量的比率。抽樣比率=樣本大小/總體大小 2、具體步驟:(1)給總體中的每個個體按順序編號,即制定出抽樣框;(2)計算出抽樣間距。K(抽樣間距)=N(總體規(guī)模)/n(樣本規(guī)模)(3)在最前面的K個個體中,采用簡單隨機抽樣的方法抽取一個個體,記下這個個體的編號(假設(shè)所抽取的這個個體編號為A),它稱為隨機起點。(4)在抽樣框中,自A開始,每隔K個個體抽取一個個體,即所抽取個體的編號分別為A,A+K,A+2K,A+(n-1)K(5)將這n個個體結(jié)合起來,就構(gòu)成了該總體的一個樣本。3、優(yōu)點:系統(tǒng)抽樣較之于簡單隨機抽樣,簡便易行,尤其是當總體及樣本

12、的規(guī)模較大時更是如此。4、重要的前提:總體中個體排列的隨機性。個體排列具有某種次序上的先后、等級的高低、周期性的分布,則抽出的樣本會出現(xiàn)偏差。三、分層抽樣1、概念:分層抽樣(stratified sampling)又稱類型抽樣,是先將總體中的所有單位按某種特征或標志(如性別、年齡、職業(yè)或地域等)劃分成若干類型或?qū)哟?,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機抽樣或系統(tǒng)抽樣的辦法抽取一個子樣本,最后將這些子樣本合起來構(gòu)成總體的樣本。適用范圍:適合于總體內(nèi)個人數(shù)目較多,結(jié)構(gòu)較復(fù)雜,內(nèi)部差異較大的情況。 2、分層抽樣的優(yōu)點:(1)在不增加樣本規(guī)模的前提下,降低抽樣誤差,提高抽樣精度。(2)便于了解總體內(nèi)不

13、同層次的情況,以及對總體中的不同層次進行單獨研究或比較。3、分層抽樣的兩種方法:(1)將所有的總體元素按照所作用的分層變量加以分類,成為不同的小團體。然后再從各個小團體中隨機抽出適當數(shù)量的樣本。(2)先將總體進行分類,然后將不同類型的元素入到一個連續(xù)性的列表中。再對整個列表進行一個隨機起始的系統(tǒng)抽樣。4、分層抽樣的注意事項(1)分層的標準:第一,以所分析和研究的主要變量或相關(guān)變量為標準;第二,以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為標準;第三,以那些已有明顯層次區(qū)分的變量為標準。(2)分層的比例:第一,按比例分層。按各種類型或?qū)哟沃械膯挝粩?shù)目同總體數(shù)目間的比例來抽取

14、樣本。好處:確保得到一個與總體結(jié)構(gòu)完全一樣的樣本。第二,不按比例分層。適用對象:總體中有的類型或?qū)哟蔚膯挝惶?;用于對不同層次的子總體進行專門研究或比較,而不用樣本資料來推斷總體的時候。注意:如果用樣本資料來推斷總體,需要對各層的數(shù)據(jù)資料進行加權(quán)處理。5、分層抽樣與配額抽樣的差別(1)目的不同:配額抽樣分層的目的在于抽出一個總體的“模擬物”,注重的是樣本與總體在結(jié)構(gòu)比例上的表面一致性;分層抽樣進行分層,一方面是要提高各層次間的異質(zhì)性與同層中的同質(zhì)性,另一方面是為了照顧到某些比例小的層次,使得所抽樣本的代表性進一步提高。(2)抽樣方法不同:配額抽樣方法是通過主觀的分析來確定和選擇組成這種總體“模

15、擬物”的成員,“按事先規(guī)定的條件,采取偶遇方式,有目的的尋找”;分層抽樣的方法完全依據(jù)概率原則,排除主觀因素,客觀地、等概率地到各層中進行抽樣。練習:據(jù)統(tǒng)計,某高?,F(xiàn)有全日制大學生12000名,男女生比例為3:1;城鄉(xiāng)比例為2:1;文理科比例為1:4。請按照性別、生源地、專業(yè)三個因素抽樣選取1200名某高校大學生。 四、整群抽樣1、概念:整群抽樣(cluster sampling)是從總體中隨機抽取一些小的群體,然后由所抽出來的若干個小群體內(nèi)的所有元素構(gòu)成的樣本。 2、特點:(1)簡化抽樣的過程,降低收集資料的費用。(2)樣本分布面不廣,樣本對總體的代表性相對較差。即盡管整群抽樣的效率很高,但

16、是效率的代價是樣本精確度的降低。3、整群抽樣與分層抽樣的區(qū)別適用對象不同當某個總體是由若干個有著自然界線和區(qū)分的子群(或類別、層次)所組成,不同子群相互間差別很大,而每個子群內(nèi)部差別不大時,適合于分層抽樣的方法。當不同子群相互之間差別不大,而每個子群內(nèi)部的異質(zhì)性程度比較大時,適合于采用整群抽樣的方法。舉例:總體是全國所有城市集合,抽取規(guī)模為40個城市的樣本(隨機抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣)。五、多段抽樣1、概念:多段抽樣(multistage sampling)又稱多級抽樣或分段抽樣,按抽樣元素的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣過程分為幾個階段進行。2、適用范圍:總體規(guī)模特別大、或者總體分布

17、范圍特別廣。3、具體做法:先從總體中隨機抽取若干大群(組),然后再從這幾個大群(組)內(nèi)抽取幾個小群(組),這樣一層層抽下來,直到抽到最基本的抽樣元素為止。4、注意事項:要在類別和個體之間保持平衡,或保持適當?shù)谋壤?舉例:書p137某市共有3萬名教師,分布在全市10個區(qū)的300所學校中。要抽取1200名教師的樣本,按照第一階段抽取所在區(qū)、第二階段抽取學校、第三階段抽取教師的方法,分段抽樣如下:第一階段第二階段第三階段方案1方案2方案3方案4方案5方案6方案7方案8方案9抽10個區(qū)抽2個區(qū)抽10個區(qū)抽8個區(qū)抽5個區(qū)抽4個區(qū)抽3個區(qū)抽2個區(qū)抽1個區(qū)抽4所學校抽20所學校抽20所學校抽15所學校抽1

18、2所學校抽10所學校抽10所學校抽10所學校抽12所學校每所學校抽30名教師每所學校抽30名教師每所學校抽6名教師每所學校抽10名教師每所學校抽20名教師每所學校抽30名教師每所學校抽40名教師每所學校抽60名教師每所學校抽100名教師選擇抽樣方案時需要考慮的因素: (1)各個抽樣階段中的子總體的同質(zhì)性程度原則:樣本相似程度越高的子總體,抽樣規(guī)模應(yīng)小一些;反之,則大一些。 (2)考慮研究者所擁有的人力和經(jīng)費。5、缺點及克服的方法缺點:每級抽樣時都會產(chǎn)生誤差,因此,這種抽樣方法的誤差較大。減小誤差的方法:相對增加開頭階段的樣本數(shù)而適當減少最后階段的樣本數(shù)。 六、補充:地圖法將地圖用格子分割,建議

19、采用5X5格子分割。在分割時候,原則上每個格子一樣大小,盡量使得格子的邊界與自然的道路重合。 第5節(jié) 戶內(nèi)抽樣與PPS抽樣 一、戶內(nèi)抽樣的方法1、概念:戶內(nèi)抽樣(within-household sampling):從所抽中的每戶家庭中抽取一個成年人,以構(gòu)成訪談對象的樣本。 2、方法:Kish選擇法根據(jù)這種方法,每戶家庭中所有的成年人(18歲以上)都具有同等的被選中的機會。 3、具體做法:(1)調(diào)查表一套八種(A,B1,B2,C,D,E1,E2,F(xiàn)),每人一套。A式(占1/6),B1式(占1/12),B2式(占1/12),C式(占1/6),D式(占1/6),E1式(占1/12),E2式(占1/

20、12), F式(占1/6)。(2)對每戶家庭中的成年人進行排序和編號。排序的方法是:男性在前,女性在后;年紀大的在前,年紀小的在后。(3)調(diào)查員按照調(diào)查表上的編號找出編號相同的那種“選擇表”,根據(jù)家庭人口數(shù)目從“選擇表”中查出該選個體的序號,最后對這一序號所對應(yīng)的那個家庭成員進行訪談。練習:假定有一戶家庭,家里有奶奶、爸爸、媽媽、大兒子及其兒媳、小閨女(20歲)、孫子(10歲)。如果進行戶內(nèi)抽樣,請確定八種調(diào)查表中,應(yīng)該分別選擇哪一位作為被訪談對象。 4、實際調(diào)查中的應(yīng)用為了操作起來更為簡便,研究者在實際調(diào)查的過程中通常使用的戶內(nèi)隨機抽人方法是生日法。 具體步驟:(1)隨機確定一年中的某一天為

21、標準日期,為便于計算,通常抽取每個月的第一天,如6月1日,7月1日等。(2)了解所抽中的戶中18歲以上的人口數(shù),以及每個人的生日。(3)計算出每人的生日距離標準日期的天數(shù)。(4)從中選擇生日距離標準日期最近的人作為調(diào)查對象。二、PPS抽樣多段抽樣的前提假設(shè):每一個階段抽樣時,其元素的規(guī)模是相同的。 1、概念:PPS抽樣(Sampling with Probability Proportional to Size),全稱“概率與元素的規(guī)模大小成比例的抽樣”。 目的:以階段性的不等概率換取最終的、總體的等概率。 2、基本原理:(1)每個群按照其規(guī)模(所含元素的數(shù)量)被給予大小不等的抽取概率,大的群

22、具有比小的群更大的概率。(2)從每個抽中的群中抽取同樣多的元素。實質(zhì):兩個階段都是不等概率的,最終平衡了由于群的規(guī)模帶來的概率差異。每一個元素被抽中的概率=所抽取的群數(shù)(群的規(guī)模/總體的規(guī)模)(平均每個群中所要抽取的元素/群的規(guī)模)3、具體做法:(1)將各個元素排列,算出它們在總體中所占比例;(2)將元素的比例累加起來(累積百分比);(3)根據(jù)比例的累計數(shù),確定每一元素所對應(yīng)的選擇號碼范圍(范圍大小等于元素規(guī)模所占的比例);(4)用隨機數(shù)表或系統(tǒng)抽樣的方法,選擇號碼,號碼對應(yīng)的元素進入第一階段樣本;(5)對選中號碼的元素進行第二階段抽樣。練習:某企業(yè)有10000名職工,共分為5個生產(chǎn)車間,各個

23、車間職工數(shù)如下:一車間500名;二車間500名,三車間1500名;四車間2500名,五車間5000名。如果要抽取1000名職工進行調(diào)查,請根據(jù)PPS抽樣方法,抽取樣本。第6節(jié) 樣本規(guī)模與抽樣誤差一、樣本規(guī)模1、概念:樣本規(guī)模(sample size)又稱為樣本容量,指樣本中所含個案的多少。 統(tǒng)計學以30個個案為界,30個個案及以上,是大樣本,30以下小樣本。 無論總體如何分布,其平均數(shù)的抽樣分布接近正態(tài)分布,很多統(tǒng)計學的公式可以應(yīng)用,也可以用樣本資料來推論總體。 社會研究認為樣本規(guī)模不能少于100 2、樣本規(guī)模的確定n=t2*2/e2t是置信度所對應(yīng)的臨界值,為總體的標準差,e為抽樣誤差對于實際采用的多階段復(fù)雜抽樣,還要考慮設(shè)計效應(yīng)deff(經(jīng)驗數(shù)據(jù)為1.8或2,或2.5)。 二、影響樣本規(guī)模確定的因素1、總體的規(guī)模 一定精確度要求下,總體越大,要求樣本規(guī)模越大。一定精確度要求下,總體越大,要求樣本規(guī)模越大;但是,當總體足夠大時,樣本規(guī)模的變化很小。 2、推斷的把握性與精確性 在社會研究中,用置信度和置信區(qū)間來說明樣本規(guī)模與抽樣的可靠性及精確性之間的關(guān)系。 置信度(或置信水平)總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)間中的把握性程度。反映抽樣的可靠性程度。 在其他條件一定的情況下,置信度越高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論