社會調(diào)查研究方法(第五版)課件匯 郝大海 第1-4章 導(dǎo)論 - 題目設(shè)計方法_第1頁
社會調(diào)查研究方法(第五版)課件匯 郝大海 第1-4章 導(dǎo)論 - 題目設(shè)計方法_第2頁
社會調(diào)查研究方法(第五版)課件匯 郝大海 第1-4章 導(dǎo)論 - 題目設(shè)計方法_第3頁
社會調(diào)查研究方法(第五版)課件匯 郝大海 第1-4章 導(dǎo)論 - 題目設(shè)計方法_第4頁
社會調(diào)查研究方法(第五版)課件匯 郝大海 第1-4章 導(dǎo)論 - 題目設(shè)計方法_第5頁
已閱讀5頁,還剩265頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

社會調(diào)查研究方法

(第五版)新編21世紀(jì)社會學(xué)系列教材“十二五”普通高等教育本科國家級規(guī)劃教材北京高等教育精品教材第一章導(dǎo)論1.界定調(diào)查研究方法的三個基本要點(diǎn)是:(1)調(diào)查中的詢問是個科學(xué)測量過程;(2)成功的調(diào)查要選擇有代表性的被訪者;(3)資料的統(tǒng)計分析是完成調(diào)查研究的必要環(huán)節(jié)。2.按執(zhí)行方式,調(diào)查研究可以被劃分為自填問卷、當(dāng)面訪問和電話訪問三種主要形式。3.按應(yīng)用領(lǐng)域,調(diào)查研究可以被劃分為人口調(diào)查、民意調(diào)查、市場調(diào)查、社會問題調(diào)查、居民家計調(diào)查、學(xué)術(shù)性專業(yè)調(diào)查等幾種形式。4.調(diào)查研究的一般過程包括:調(diào)查設(shè)計、實地抽樣、資料搜集、資料處理和撰寫報告等幾個環(huán)節(jié)。5.調(diào)查設(shè)計主要包括三方面內(nèi)容:調(diào)查工作的總體規(guī)劃、抽樣設(shè)計、資料搜集和處理方案。本章要點(diǎn)調(diào)查研究抽樣調(diào)查人口調(diào)查民意調(diào)查市場調(diào)查社會問題調(diào)查居民家計調(diào)查學(xué)術(shù)性專業(yè)調(diào)查調(diào)查設(shè)計實地抽樣資料搜集資料處理基本概念目錄01第一節(jié)調(diào)查研究概述02第二節(jié)調(diào)查研究的分類03第三節(jié)

調(diào)查研究的一般過程調(diào)查研究概述PARTONE從所涉及的內(nèi)容看,本書介紹的調(diào)查方法屬于以上觀點(diǎn)中的后一種,即一種量化的社會研究方法。具體說來,就是通過向被訪者詢問問題來搜集資料,然后對資料進(jìn)行統(tǒng)計分析的社會研究方法。對于調(diào)查方法的定義,可以從以下三點(diǎn)來理解。第一,詢問作為調(diào)查研究的基本要素,是一個科學(xué)測量過程。第二,選取有代表性的被訪者,是調(diào)查研究成功的關(guān)鍵。第三,資料的統(tǒng)計分析是完成調(diào)查研究的必要環(huán)節(jié)。一、調(diào)查研究方法的界定雖然在公元前的古代埃及和中國,就有過以征稅和征兵為目的,進(jìn)行人口調(diào)查的記錄,但是,作為一種社會研究方法,調(diào)查研究肇始于近代的行政統(tǒng)計調(diào)查。17世紀(jì)下半葉,一些學(xué)者和政府官員逐漸意識到,人口、土地和經(jīng)濟(jì)方面的統(tǒng)計數(shù)字,有助于了解基本國情和社會整體狀況,于是出現(xiàn)了德國“國勢學(xué)”和英國“政治算數(shù)”等不同學(xué)派的統(tǒng)計學(xué)。(一)近代調(diào)查研究二、調(diào)查研究發(fā)展簡史在隨后的發(fā)展中,“政治算數(shù)”學(xué)派的統(tǒng)計學(xué)逐漸取得主導(dǎo)地位。這一學(xué)派的代表人物是英國經(jīng)濟(jì)學(xué)家配第,他在《政治算術(shù)》一書中,首次用計量和比較的方法,對英國與法、意、荷等國進(jìn)行了國力的比較研究。在對社會經(jīng)濟(jì)現(xiàn)象進(jìn)行數(shù)量描述和數(shù)量分析比較的過程中,他采用了統(tǒng)計分組、圖表和統(tǒng)計指標(biāo)等一系列比較系統(tǒng)的統(tǒng)計技術(shù)。英國政治算術(shù)學(xué)派的影響擴(kuò)散到了整個歐洲大陸。進(jìn)入18世紀(jì)后,歐洲各國紛紛開展行政統(tǒng)計調(diào)查,并逐漸將調(diào)查制度化。英國、法國都于1801年開始了人口普查,同年,法國還成立了國家統(tǒng)計局。其后,這些舉措被歐洲各國先后效仿。在行政統(tǒng)計調(diào)查得到廣泛應(yīng)用的同時,學(xué)者們對概率論和數(shù)理統(tǒng)計的研究,也進(jìn)一步加深了人們對蘊(yùn)涵于總體數(shù)量特征中的規(guī)律性的認(rèn)識。18世紀(jì),拉普拉斯和高斯對概率論進(jìn)行了開創(chuàng)性的研究。凱特勒秉承“國勢學(xué)”和“政治算數(shù)”的傳統(tǒng),并將概率論引入對社會現(xiàn)象的統(tǒng)計研究,開創(chuàng)了數(shù)理統(tǒng)計研究的先河。19世紀(jì)另一位統(tǒng)計學(xué)家高爾頓也向人們表明,對人類行為的研究可以置于穩(wěn)固的、科學(xué)的根基之上。高爾頓與皮爾遜合作發(fā)明了多種統(tǒng)計方法,包括相關(guān)、標(biāo)準(zhǔn)分?jǐn)?shù)、中位數(shù)等。從18世紀(jì)后半葉至20世紀(jì)初,社會調(diào)查開始被廣泛用于社會事業(yè),特別是用來記錄工業(yè)化所帶來的都市貧窮狀況。其中比較具有代表性的調(diào)查包括:霍華德在18世紀(jì)后半葉有關(guān)英國監(jiān)獄狀況的調(diào)查,以及與歐洲其他國家監(jiān)獄的比較研究,后來出版了《英倫和威爾士的監(jiān)獄情況以及外國監(jiān)獄的初步觀察和報告》一書;勒普萊從1835年起,用了20年時間,先后調(diào)查了英、法、德、匈、俄、土等國大量工人家庭的收支情況,開了家計調(diào)查的先河,并于1855年出版了6卷本的《歐洲工人》。布思從1886年起,歷時18年,對倫敦工人狀況進(jìn)行了長期調(diào)查,調(diào)查結(jié)果被匯集在17卷的《倫敦居民的生活和勞動》(1891-1903)中;凱洛格于1907年主持了匹茲堡調(diào)查,首次采用社區(qū)系統(tǒng)調(diào)查方法,探討都市化的社會結(jié)果,并于1914年出版了調(diào)查結(jié)果《匹茲堡調(diào)查》。以上這些社會調(diào)查的主要目的,是希望通過記錄早期工業(yè)化過程中都市的貧窮、犯罪和居民生活狀況,促進(jìn)社會改革運(yùn)動。這些社會調(diào)查大多是針對某個特定地區(qū)所進(jìn)行的詳細(xì)經(jīng)驗研究,其目的是提供令人印象深刻的社區(qū)日常生活圖像。在調(diào)查中,研究者還大量采用參與觀察、訪談和問卷調(diào)查等實地觀測方法,搜集第一手經(jīng)驗資料,給調(diào)查研究打上了鮮明的經(jīng)驗性社會研究的烙印。但這些調(diào)查大多沒有明確的理論框架,因此調(diào)查結(jié)果很難形成一般的社會理論。另外,在獲取調(diào)查對象時,這些調(diào)查也缺少科學(xué)的抽樣方法。(二)現(xiàn)代調(diào)查研究進(jìn)入20世紀(jì)后,社會調(diào)查與社會理論的結(jié)合,導(dǎo)致研究性調(diào)查的出現(xiàn)。與此同時,隨著小樣本檢驗和抽樣理論的建立,抽樣調(diào)查方法日益完善。而社會統(tǒng)計調(diào)查模式和多變量分析方法的出現(xiàn),標(biāo)志著量化調(diào)查研究方法已成為一項成熟的經(jīng)驗社會研究方法。1897年出版的涂爾干的《自殺論》,通過對歐洲各國自殺統(tǒng)計資料的分析,檢驗了涂爾干關(guān)于自殺原因的各種假設(shè),建立了一套完整的自殺理論。涂爾干的研究首次成功地將經(jīng)驗研究與理論研究結(jié)合在一起,表明在社會研究中,也可以建立類似自然科學(xué)中的那種既可以解釋經(jīng)驗資料,又要接受經(jīng)驗資料檢驗的實證科學(xué)理論。從研究方法看,雖然涂爾干沒有采用一手的經(jīng)驗調(diào)查資料,他做的研究屬于二手資料的分析研究,但他確立的“假設(shè)—經(jīng)驗檢驗—理論總結(jié)”的實證研究程序,為研究性調(diào)查提供了可參考的范例。1.研究性調(diào)查模式的確立早期的研究性調(diào)查多由美國社會學(xué)家完成,這些經(jīng)驗調(diào)查研究一方面延續(xù)了布思的傳統(tǒng),另一方面又接受了涂爾干的研究范式,進(jìn)而將社會調(diào)查與社會理論研究相結(jié)合,使研究性調(diào)查不再僅僅是搜集經(jīng)驗資料,更重要的是服務(wù)于社會理論,檢驗或建立某種社會理論。其中,托馬斯與茲納涅茨基研究了移民問題,他們根據(jù)研究結(jié)果出版了五卷本的《身處歐美的波蘭農(nóng)民》,成為社會學(xué)理論與個案調(diào)查相結(jié)合的經(jīng)典范例之一。受到這種研究取向的刺激,以帕克為核心的“芝加哥學(xué)派”,將城市作為研究主題,對城市貧困、種族關(guān)系、社會特征等一系列問題進(jìn)行了實地研究,開創(chuàng)了“城市生態(tài)學(xué)”的研究領(lǐng)域。此后,林德夫婦進(jìn)行了小城鎮(zhèn)調(diào)查研究,成功地將文化人類學(xué)的社區(qū)研究方法應(yīng)用于現(xiàn)代城市研究。2.抽樣方法的完善抽樣調(diào)查方法的完善,在很大程度上得益于費(fèi)希爾于1928年建立的小樣本檢驗的理論。具體說來,最初的抽樣調(diào)查方法,是1895年由凱爾提出的“代表性調(diào)查”,它指的是一種局部調(diào)查,希望將局部作為總體的縮影來代表總體。凱爾抽樣時,采用的是判斷抽樣,它屬非概率抽樣。抽樣調(diào)查在早期階段,基本上都是采用非概率抽樣。非概率抽樣最大的問題是無法事先估計抽樣誤差的大小,無法根據(jù)樣本情況對總體情況做出正確的推論。美國《文學(xué)摘要》1936年民意調(diào)查的失敗。這份雜志以郵寄明信片的方式進(jìn)行民意調(diào)查,它通常會采用上千萬個調(diào)查單位的樣本,而這些樣本名單則是通過全美雜志訂戶、電話簿和汽車俱樂部會員名單搜集到的。當(dāng)1936年總統(tǒng)大選來臨時,雜志仍以同樣的方式進(jìn)行了民意調(diào)查,并從寄出的1000萬份明信片中,回收了200多萬份。測驗結(jié)果顯示,57%的人支持共和黨候選人蘭登,而民主黨候選人、在任總統(tǒng)羅斯福的支持率為43%。然而,兩星期后的選舉結(jié)果,使雜志的編輯們大跌眼鏡,羅斯福以62%的得票率,獲得連任。該雜志因此聲譽(yù)掃地,不久就關(guān)門大吉了。例子完成概率抽樣必須解決兩個問題,一個是如何選取對象才能保證每一個總體元素單位都有同等被抽選的機(jī)會。蒂皮特通過編制《隨機(jī)數(shù)字表》,解決了隨機(jī)取樣問題。概率抽樣的另一個問題是如何確定樣本與總體的關(guān)系,或者說怎樣保證樣本的代表性。解決這個問題的途徑是,運(yùn)用概率理論來計算樣本與總體之間的差異,究竟在多大程度上是由偶然因素引起的。揭示樣本和總體內(nèi)在聯(lián)系的理論基礎(chǔ)是大數(shù)法則和中心極限定理。以上理論雖然解決了抽樣誤差的計算問題,但解決得并不徹底,因為它們是以大樣本為前提的,即只有在樣本規(guī)模很大時,才能估算抽樣誤差,進(jìn)行統(tǒng)計推斷。在現(xiàn)實生活中,并非所有的樣本都是大樣本,而且在有些情況下,大樣本由于影響因素太多,反倒不容易反映總體情況。英國達(dá)布林啤酒公司的技師戈塞特,為了解決啤酒質(zhì)量的檢驗問題,發(fā)明了小樣本的t檢驗方法。這一結(jié)果后來被費(fèi)希爾從數(shù)學(xué)上進(jìn)行了嚴(yán)格證明,由此確立了抽樣推斷理論。此后,抽樣調(diào)查逐漸成為社會調(diào)查的主要形式。3.問卷與多變量分析技術(shù)的提高首先使用問卷對心理現(xiàn)象進(jìn)行精確測量的是高爾頓,其問卷的內(nèi)容涉及許多被假定與智慧、天賦有關(guān)的環(huán)境因素。在20世紀(jì)的前25年,問卷調(diào)查方法在各種理論研究和應(yīng)用研究領(lǐng)域中逐漸成為相當(dāng)普遍的方法。1918年,為了探明哪些美國士兵可能不適應(yīng)軍人生活的壓力,心理學(xué)家伍德沃斯曾編制了一個由116個項目組成的人格問卷——伍德沃斯個人資料調(diào)查表。繼個人資料調(diào)查表之后,接踵而來的是瑟斯頓和他的同事編制的各種態(tài)度問卷,以及斯特朗編制的男性職業(yè)興趣問卷。早期調(diào)查在分析資料時,基本上限于單變量或雙變量分析。而現(xiàn)代調(diào)查研究中常用的多變量分析方法,則是由斯托弗與拉扎斯菲爾德引入的。第二次世界大戰(zhàn)以后,社會調(diào)查研究的定量化趨勢日趨明顯,出現(xiàn)了越來越多適用于社會調(diào)查的抽樣技術(shù);問卷及其他社會測量方法、訪談程序都在逐漸精細(xì)和標(biāo)準(zhǔn)化;多變量統(tǒng)計分析模型也在不斷豐富,并在更大的范圍內(nèi)得到了應(yīng)用。缺少彈性無法了解被訪者具體的生活情境容易受到人為因素的影響三、調(diào)查研究的局限性調(diào)查研究的分類PARTTWO按調(diào)查對象涉及的范圍分類,可以將量化調(diào)查研究分為普查和抽樣調(diào)查兩種形式。普查指的是對構(gòu)成總體的所有個體無一例外地逐個進(jìn)行調(diào)查。最常見的普查是人口調(diào)查,它也是最早進(jìn)行的量化調(diào)查。一、按調(diào)查對象的范圍分類抽樣調(diào)查,即從所研究的總體中,按一定規(guī)則抽取部分元素進(jìn)行調(diào)查,并根據(jù)調(diào)查結(jié)果,對總體情況進(jìn)行推斷。由于抽樣調(diào)查只詢問目標(biāo)人群中的一部分對象,因此,工作量要比普查少得多,這意味著較少的人力、財力投入,調(diào)查周期也縮短了許多。抽樣調(diào)查得到廣泛應(yīng)用的另一個理由是準(zhǔn)確性較高,只需要少量的工作人員,可以盡量使用那些具有一定專業(yè)素養(yǎng)的工作人員,同時可以對他們進(jìn)行充分的訓(xùn)練,而且可以在實際調(diào)查中對他們進(jìn)行嚴(yán)密的督導(dǎo)檢查,最大限度地控制非抽樣誤差的發(fā)生。探索描述解釋二、按調(diào)查目的分類基本不用問卷形式對總體特征的分布情況進(jìn)行詳細(xì)的描述是希望找出事情發(fā)生的原因自填問卷當(dāng)面訪問電話訪問三、按執(zhí)行方式分類橫剖調(diào)查12縱貫調(diào)查在某個單一固定的時點(diǎn)搜集有關(guān)信息,特別適用于描述性調(diào)查。人口普查是最典型的橫剖調(diào)查。同期群調(diào)查趨勢調(diào)查追蹤調(diào)查四、按時間維度分類民意調(diào)查市場調(diào)查社會問題調(diào)查居民家計調(diào)查學(xué)術(shù)性專業(yè)調(diào)查五、按應(yīng)用領(lǐng)域分類調(diào)查研究的一般過程PARTTHREE資料搜集和處理方案一、調(diào)查設(shè)計調(diào)查工作的總體規(guī)劃以書面形式形成一份計劃書抽樣設(shè)計界定總體的范圍、樣本規(guī)模,然后確定是否需要分階段或者分層次選擇資料搜集方式、設(shè)計調(diào)查問卷、設(shè)計資料處理方案與抽樣方案中的各級抽樣單位取得聯(lián)系訓(xùn)練抽樣人員具體執(zhí)行抽樣工作檢查樣本的正確性二、實地抽樣招募訪問員培訓(xùn)已錄用的訪問員與被訪者取得聯(lián)系進(jìn)行實地訪問對訪問過程和問卷進(jìn)行復(fù)查(一)訪問調(diào)查三、資料搜集四、資料處理利用計算機(jī)處理問卷資料,先得給每個變量的每個相關(guān)類別一個獨(dú)一無二的編碼,然后用計算機(jī)軟件錄入數(shù)據(jù)。最后還要對已錄入的數(shù)據(jù)進(jìn)行清理,并處理缺失數(shù)據(jù),才能最終形成可以進(jìn)行分析的數(shù)據(jù)文件。資料處理中最重要的原則是確保每一個環(huán)節(jié)的正確性,因為這三項工作環(huán)環(huán)相扣,前面的錯誤會影響后面,進(jìn)而影響整個數(shù)據(jù)資料的質(zhì)量。五、撰寫報告一種形式的調(diào)查報告是對調(diào)查數(shù)據(jù)的說明,包括對調(diào)查抽樣、問卷、資料搜集過程、數(shù)據(jù)編碼的說明,以及對數(shù)據(jù)信度和效度的分析結(jié)果、調(diào)查局限性分析。此種形式的報告主要是為數(shù)據(jù)使用者提供的,通常被公布在互聯(lián)網(wǎng)上,供數(shù)據(jù)使用者查閱。另一種形式的報告是向調(diào)查委托方提交的有關(guān)調(diào)查問題的分析報告,包括對研究問題的界定、對相關(guān)文獻(xiàn)的討論、對概念和變量的定義說明,以及對數(shù)據(jù)分析結(jié)果的討論等內(nèi)容,通常是以論文的形式,發(fā)表在學(xué)術(shù)期刊上。復(fù)習(xí)思考題1.如何理解抽樣方法在現(xiàn)代調(diào)查研究方法形成中的關(guān)鍵作用?2.調(diào)查研究方法主要存在哪些局限?3.縱貫調(diào)查包括哪幾種具體形式?4.怎樣完成實地抽樣工作?5.實地訪問中應(yīng)注意哪些問題?參考答案1.如何理解抽樣方法在現(xiàn)代調(diào)查研究方法形成中的關(guān)鍵作用?抽樣方法是現(xiàn)代調(diào)查研究中不可或缺的一部分,它使得研究人員能夠從一個較大的總體中選擇出具有代表性的樣本進(jìn)行研究。這種方法的關(guān)鍵作用在于:提高效率:通過對部分樣本的研究代替對整個總體的全面調(diào)查,節(jié)省了時間和資源。增強(qiáng)可行性:當(dāng)總體規(guī)模過大或分布過廣時,進(jìn)行全面調(diào)查往往是不現(xiàn)實的;抽樣提供了可行的研究途徑。確保代表性:科學(xué)合理的抽樣方法可以保證樣本能準(zhǔn)確反映總體特征,從而提高了研究結(jié)果的可信度和有效性。減少偏差:通過隨機(jī)化等手段,可以最小化樣本選擇過程中的系統(tǒng)性誤差。參考答案2.調(diào)查研究方法主要存在哪些局限?盡管調(diào)查研究是一種廣泛應(yīng)用的方法,但它也存在一些局限:-響應(yīng)偏差:受訪者可能會根據(jù)自己的意愿、社會期望或其他因素提供不真實的回答。-非響應(yīng)偏差:未能獲得所有選定樣本成員的回答可能導(dǎo)致樣本不再具有代表性。-問卷設(shè)計缺陷:問題表述不清、引導(dǎo)性問題或選項設(shè)置不合理都可能影響數(shù)據(jù)質(zhì)量。-時間與成本限制:大型調(diào)查往往需要耗費(fèi)大量的人力物力,并且受到時間窗口的約束。-覆蓋不足:有時難以接觸到某些特定群體或個體,導(dǎo)致這些群體在研究中被低估或忽略。參考答案3.縱貫調(diào)查包括哪幾種具體形式?縱貫調(diào)查(又稱追蹤調(diào)查)通常分為以下幾種形式:-面板調(diào)查(PanelStudy):在同一組對象上重復(fù)進(jìn)行測量,以觀察隨時間的變化情況。-隊列研究(CohortStudy):針對某一特定時期內(nèi)出生或經(jīng)歷共同事件的一群人,在不同時間點(diǎn)上收集信息。-趨勢研究(TrendStudy):不是專注于同一組人,而是關(guān)注某一人群類別在不同時間段內(nèi)的變化趨勢。參考答案4.怎樣完成實地抽樣工作?實地抽樣的步驟一般包括:-定義目標(biāo)總體:明確研究的對象范圍。-選擇抽樣框架:確定包含所有潛在樣本單元的列表或地圖。-決定抽樣單位:如個人、家庭、企業(yè)等。-選擇抽樣方法:例如簡單隨機(jī)抽樣、分層抽樣、整群抽樣或系統(tǒng)抽樣等。-計算樣本量:基于統(tǒng)計學(xué)原理確定所需的最小樣本數(shù)量。-實施抽樣:按照預(yù)定的方案執(zhí)行抽樣過程。-現(xiàn)場調(diào)整:如果遇到實際情況與計劃不符,需靈活調(diào)整但要記錄并解釋變更原因。參考答案5.實地訪問中應(yīng)注意哪些問題?實地訪問需要注意以下幾個方面:-訪問員培訓(xùn):確保訪問員熟悉問卷內(nèi)容和訪問流程,了解如何處理突發(fā)狀況。-受訪者的選?。簢?yán)格按照抽樣名單選擇受訪者,避免主觀選擇。-隱私保護(hù):尊重受訪者的隱私權(quán),確保個人信息的安全。-獲取同意:在開始訪談前應(yīng)向受訪者說明目的,并取得其同意。-保持中立態(tài)度:訪問員不應(yīng)表現(xiàn)出任何傾向性,以免影響受訪者的回答。-記錄準(zhǔn)確性:確保訪談記錄的真實性和完整性,必要時使用錄音設(shè)備輔助記錄。-應(yīng)對拒絕:對于不愿意參與的受訪者,應(yīng)禮貌詢問原因,并記錄相關(guān)信息,以便后續(xù)分析非響應(yīng)偏差。郝大海

著社會調(diào)查研究方法

(第五版)新編21世紀(jì)社會學(xué)系列教材“十二五”普通高等教育本科國家級規(guī)劃教材北京高等教育精品教材第二章抽樣設(shè)計本章要點(diǎn)無論抽樣設(shè)計多么精致,都會產(chǎn)生抽樣誤差,但概率抽樣能夠比較精確地估算出抽樣誤差,從而能根據(jù)樣本推論總體,而非概率抽樣不能估算抽樣誤差,也不能推論總體。常用的非概率抽樣方法包括:方便抽樣、配額抽樣、判斷抽樣和雪球抽樣。抽樣設(shè)計包含以下內(nèi)容:編制抽樣框,選擇抽樣方法,估計抽樣誤差,確定樣本規(guī)模。在確定總體時,真正有操作意義的是確定抽樣框,沒有抽樣框,實際抽樣就無法進(jìn)行。常用的概率抽樣方法包括簡單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣、不等概率抽樣和多階段抽樣等。本章要點(diǎn)于多階段抽樣和整群抽樣中樣本規(guī)模隨機(jī)變動的問題,一般通過保持總抽樣比不變的方法來處理。具體的處理方法包括:分層多階段等概率抽樣和多階段PPS抽樣。影響樣本代表性的誤差分為抽樣誤差和非抽樣誤差兩類,其中抽樣誤差是一種隨機(jī)誤差,是由樣本范圍與總體范圍的差異而引起的誤差。根據(jù)中心極限定理,當(dāng)樣本規(guī)模很大(n>100)時,抽樣分布近似為正態(tài)分布。樣本規(guī)模一方面會影響到樣本的代表性,另一方面則直接影響到調(diào)查成本的大小。在經(jīng)費(fèi)一定的條件下,樣本規(guī)模主要取決于抽樣精度和總體標(biāo)準(zhǔn)差?;靖拍畛闃?/p>

總體

元素

抽樣框

樣本

抽樣設(shè)計

非概率抽樣

方便抽樣

配額抽樣

判斷抽樣

雪球抽樣

目標(biāo)總體

抽樣總體

名單抽樣框

區(qū)域抽樣框

簡單隨機(jī)抽樣

隨機(jī)數(shù)

偽隨機(jī)數(shù)

系統(tǒng)抽樣

等距抽樣

準(zhǔn)隨機(jī)抽樣

抽樣間距

循環(huán)等距抽樣

分層抽樣

分層等距抽樣

整群抽樣

初級抽樣單位

次級抽樣單位

PPS抽樣

規(guī)模測量值

抽樣誤差

標(biāo)準(zhǔn)差

總體標(biāo)準(zhǔn)差

抽樣比

樣本規(guī)模目錄01第一節(jié)

抽樣概述02第二節(jié)

總體與抽樣框03第三節(jié)

概率抽樣04第四節(jié)

抽樣誤差與樣本規(guī)模第一節(jié)

抽樣概述PARTONE抽樣是指根據(jù)某種既定規(guī)則從一個總體中選取一組元素的過程,由此產(chǎn)生的元素集合稱為樣本。也就是說,在抽樣的專業(yè)化表述中,每一個具體的研究對象被稱為元素,全體研究對象被稱為總體,樣本則代表一部分研究對象。一、抽樣的概念第一節(jié)

抽樣概述抽樣方法1.非概率抽樣2.縱貫調(diào)查主要依據(jù)研究者的主觀意愿、判斷是否方便等因素來選取對象無法估算出抽樣誤差主要按照隨機(jī)原則來選取對象,完全不帶研究者的主觀因素能夠比較精確地估算出抽樣誤差方便抽樣又稱偶遇抽樣,是指研究者使用對自己最為便利的方法來選取樣本。這種方法很容易產(chǎn)生系統(tǒng)誤差,樣本代表性很差,因此,在使用時要特別小心??傮w的情況越復(fù)雜,方便抽樣的效果就越差。(一)方便抽樣二、非概率抽樣方法“街頭攔人”調(diào)查首先要根據(jù)某些參數(shù)值,確定不同總體類別中的樣本配額比例,然后按比例在各類別中進(jìn)行方便抽樣。例:抽取一個40人規(guī)模的樣本(二)配額抽樣配額矩陣所依據(jù)的總體參數(shù)值越多,則樣本元素的分類也越細(xì),樣本與總體的結(jié)構(gòu)也越接近。但隨著參數(shù)值的增加,配額矩陣的分布會越來越復(fù)雜,抽取到符合條件的對象也就越來越困難。配額抽樣中經(jīng)常采用的參數(shù)值包括性別、年齡、教育程度、婚姻狀況、收入和職業(yè)類別等。配額抽樣的不足:1.為了不偏離總體,配額矩陣中的數(shù)字必須十分準(zhǔn)確,要做到這一點(diǎn),就必須掌握總體的最新資料,但這并不容易做到。2.抽樣仍由訪問員根據(jù)方便原則執(zhí)行,他們在從某些特定的矩陣格子中選擇樣本時,有很大的隨意性。1.研究者用判斷抽樣來選擇特別能提供信息的獨(dú)特個案3.研究者用判斷抽樣來選取某種特殊的個案類型,以便進(jìn)行深入探究。常用的三種研究場景2.研究者用判斷抽樣來選取難以接近的特殊人群判斷抽樣又稱立意抽樣,是指研究者根據(jù)研究目的或?qū)<遗袛鄟磉x取樣本。在判斷抽樣中,樣本能否滿足研究目的的要求,能否正確反映總體情況,在很大程度上依賴于研究者的主觀判斷,因此,判斷抽樣對研究者個人的研究素質(zhì)有較高的要求。(三)判斷抽樣(四)雪球抽樣雪球抽樣,也稱網(wǎng)絡(luò)抽樣,是一種根據(jù)已有研究對象的介紹,不斷辨識和找出其他研究對象的累積抽樣方法,是一種多階段的技術(shù)。雪球抽樣特別適合用來對成員難以找到的總體進(jìn)行抽樣,也可以用雪球抽樣對具有一定網(wǎng)絡(luò)聯(lián)系的總體進(jìn)行抽樣。編制抽樣框確定樣本規(guī)模估計抽樣誤差選擇抽樣方法三、概率抽樣設(shè)計要點(diǎn)第二節(jié)

總體與抽樣框PARTTWO一、定義總體編制抽樣框工作的第一步是定義總體,只有對總體構(gòu)成及邊界有一個清晰的認(rèn)識,才能最大限度地使抽樣框與總體保持一致??傮w還可以進(jìn)一步被劃分為目標(biāo)總體和抽樣總體。其中,目標(biāo)總體是理論上具有研究者所考察特征的全體總體元素的集合體。由那些有機(jī)會被抽取到的總體元素構(gòu)成的集合體,就是抽樣總體或調(diào)查總體,它是排除了研究總體中的一些特例后的總體。明確分析單位搞清楚調(diào)查研究所關(guān)注的是個人、家庭戶、集體戶,還是其他類型的居住單位總體邊界對總體涉及的地理或行政邊界加以說明調(diào)查對象對調(diào)查對象進(jìn)行必要的說明,包括合格的調(diào)查對象的年齡、居住類型等定義總體二、編制抽樣框一類抽樣框是把抽樣總體中所有能找到的調(diào)查對象名單排列起來,構(gòu)成名單抽樣框。除了名單抽樣框外,還有由區(qū)域或面積構(gòu)成的另一類抽樣框——區(qū)域抽樣框。區(qū)域抽樣框由定義明確的區(qū)域組成,除少數(shù)由純區(qū)域(如農(nóng)田地塊)構(gòu)成的區(qū)域抽樣框外,在大多數(shù)情況下,區(qū)域是由個體單位組成的。純區(qū)域的抽樣單位就是區(qū)域本身,而其他區(qū)域的抽樣單位則是區(qū)域內(nèi)的個體單位。這時可以有兩種抽樣方法:一種是抽出區(qū)域后對其中的所有單位進(jìn)行調(diào)查,即整群抽樣;另一種是抽出區(qū)域后對區(qū)域內(nèi)的單位再抽樣,即多階段抽樣。多階段抽樣經(jīng)常用于抽樣總體較大,編制全體抽樣單位的名單很困難的情況。抽樣框在多大程度上覆蓋了總體是統(tǒng)計中關(guān)注的中心問題。目標(biāo)總體和抽樣總體之間是可能存在差異的,這就產(chǎn)生了抽樣框與目標(biāo)總體匹配的三種情況:被覆蓋的合格單位、未被覆蓋的合格單位,以及被覆蓋的不合格單位。對一個抽樣框而言,考核以下四個要素是衡量其質(zhì)量的重點(diǎn):(1)是否覆蓋不足;(2)是否存在不合格單位;(3)是否重復(fù);(4)是否聚類。抽樣框中的總體元素又被稱為抽樣單位,有時抽樣單位與分析單位是相同的。但較大范圍的多階段抽樣可能有多個層次的抽樣單位。第三節(jié)

概率抽樣PARTTWO一、簡單隨機(jī)抽樣簡單隨機(jī)抽樣,也稱純隨機(jī)抽樣,是嚴(yán)格按照隨機(jī)化原則從含有N個單位的總體中抽取n個單位組成樣本(N>n)在抽樣過程中,總體的每個單位都有同等的機(jī)會入選樣本,而且每個單位的抽取都是相互獨(dú)立的。根據(jù)被抽中的元素是否放回總體,簡單隨機(jī)抽樣又可分為放回簡單隨機(jī)抽樣和不放回簡單隨機(jī)抽樣,在實際抽樣中大多采用不放回抽樣。簡單隨機(jī)抽樣是概率抽樣的最基本形式,其他概率抽樣方法都是在此基礎(chǔ)上派生出來的。常用的簡單隨機(jī)抽樣方法包括抽簽法和隨機(jī)數(shù)法。(一)抽簽法當(dāng)總體數(shù)目不大時,可以采用抽簽法。具體操作方法是:先用均質(zhì)材料做成N個簽,給每個簽編一個號碼,并將這N個簽充分混合。然后一次抽出n個簽;或每次抽取一個但不放回,再抽另一個直至抽到n個簽為止。這抽出的n個簽上的號碼就是入樣的單位號碼。(二)隨機(jī)數(shù)法當(dāng)總體單位很多時,通常采用隨機(jī)數(shù)法。具體來說,可以利用隨機(jī)數(shù)表、隨機(jī)數(shù)骰子、計算機(jī)產(chǎn)生的偽隨機(jī)數(shù)等進(jìn)行抽樣。在幾種操作方式中,最經(jīng)常用到的是隨機(jī)數(shù)表。隨機(jī)數(shù)表是由范圍在00001~99999內(nèi)的5位數(shù)的隨機(jī)數(shù),按行和列排序構(gòu)成的。確定選出的隨機(jī)數(shù)的位數(shù)決定從5位數(shù)組中選擇哪幾位數(shù)字確定在表中選擇數(shù)字的順序確定開始選擇的5位數(shù)組起點(diǎn)處理大于總體規(guī)?;蛑貜?fù)的隨機(jī)數(shù)用隨機(jī)數(shù)表產(chǎn)生隨機(jī)數(shù)除了隨機(jī)數(shù)表,隨機(jī)數(shù)骰子也是一種產(chǎn)生隨機(jī)數(shù)的工具,它是由均勻材料制成的正20面體,每一面上分別標(biāo)有0~9的數(shù)字各2個。使用時,可根據(jù)總體規(guī)模,的位數(shù),決定使用幾枚骰子,并同時規(guī)定好不同顏色骰子所代表的位數(shù)。由于許多統(tǒng)計軟件都有產(chǎn)生隨機(jī)數(shù)的程序,因此利用計算機(jī)產(chǎn)生隨機(jī)數(shù)是一種方便、快捷的方法。但由統(tǒng)計軟件產(chǎn)生的隨機(jī)數(shù)是偽隨機(jī)數(shù),在通常情況下有循環(huán)周期,故一般無法保證其隨機(jī)性。二、系統(tǒng)抽樣實際抽樣中經(jīng)常采用的是系統(tǒng)抽樣,又稱機(jī)械抽樣,即將N個總體單位按一定順序排列,然后先隨機(jī)抽取一個單位作為起始單位,再按某種確定的規(guī)則抽取其他n-1個樣本單位。在系統(tǒng)抽樣中,等間距抽取是最常用的規(guī)則,故系統(tǒng)抽樣經(jīng)常被稱為等距抽樣。由于抽樣使用的是抽樣間距,而不是隨機(jī)數(shù),故等距抽樣是一種準(zhǔn)隨機(jī)抽樣方法。常用的等距抽樣方法包括直線等距抽樣和循環(huán)等距抽樣,二者的區(qū)別在于總體規(guī)模是否為樣本規(guī)模n的整數(shù)倍。(一)整數(shù)抽樣間距當(dāng)N是n的整數(shù)倍,即抽樣間距k=N/n是整數(shù)時,可使用直線等距抽樣。即在算出抽樣間距后,先在1~k范圍內(nèi)抽取一個隨機(jī)數(shù)r作為起點(diǎn),然后每隔k個單位抽出一個單位,直到抽出n個單位。被抽中單位的號碼分別為:r,r+k,……,r+(n-1)k(二)非整數(shù)抽樣間距當(dāng)N不是n的整數(shù)倍,即抽樣間距k=N/n不是整數(shù)時,為了使樣本均值為無偏估計,可以采用以下兩種方法進(jìn)行抽樣。一種方法是循環(huán)等距抽樣,即先將N個總體單位首尾相接排成一個封閉圓,抽樣間距k取最接近N/n的整數(shù),再從1~N中抽取一個隨機(jī)起點(diǎn)作為起始單位,然后每隔k抽取一個單位,直到抽滿n個單位為止。由于隨機(jī)起點(diǎn)是1~N中的任意一個,因此每個總體單位入樣的概率是相等的??傮w單位隨機(jī)排列總體單位線性趨勢排列總體單位周期排列(三)總體單位的排列另一種方法是調(diào)整直線等距抽樣,先將非整數(shù)的抽樣間距k的小數(shù)點(diǎn)后移,使其成為整數(shù)[k],然后在1~[k]之間選定一個整數(shù)的隨機(jī)起點(diǎn)[r];接下來再將[r]的小數(shù)點(diǎn)移回來,成為非整數(shù)的隨機(jī)起點(diǎn)r。由r開始每隔k個單位抽出一個單位,直到抽出n個單位。抽中號碼分別為:r,r+k,…,r+(n-1)k,接下來再將這些號碼的小數(shù)部分略去,便相應(yīng)地得到入樣單位的號碼。三、分層抽樣分層抽樣,也稱類型抽樣,是先將總體N個單位,按某種特征劃分成若干個子總體,即層,然后在每個層中分別獨(dú)立地進(jìn)行抽樣,最后,將抽出的子樣本合起來構(gòu)成總體的樣本。除了具有降低總體異質(zhì)性程度的好處外,分層抽樣還便于對各層指標(biāo)進(jìn)行推算,也有利于抽樣工作的組織。對總體進(jìn)行分層需要考慮以下幾個問題:樣本規(guī)模在各層的分配、層的劃分和分層抽取樣本的方法。(一)樣本規(guī)模在各層的分配最常見的樣本規(guī)模分配方式是按比例分配,即各層的子樣本單位在總樣本中所占的比例,與各層單位在總體中所占的比例完全相同,按比例分配是自加權(quán)的,這時樣本結(jié)構(gòu)與總體結(jié)構(gòu)完全一樣。除了可以按比例分配樣本外,有時分層設(shè)計還有意識地利用非比例分配樣本。非比例分配設(shè)計最常見的目的,一是能對總體中規(guī)模太小的層進(jìn)行比較研究;二是在費(fèi)用一定的情況下,獲得盡可能高的抽樣精度。后一種又被稱為最優(yōu)分配。(二)層的劃分層的劃分涉及以下問題:使用什么樣的分層變量?劃分多少層?理論上,按調(diào)查目標(biāo)變量進(jìn)行分層是最好的,但在調(diào)查之前,目標(biāo)變量的值是不知道的,因此只能根據(jù)與目標(biāo)變量盡可能相關(guān)的輔助變量進(jìn)行分層,常用的輔助變量包括性別、年齡、職業(yè)、受教育程度、收入、地域、民族和宗教等。有時在有多個變量的情況下,還可以采用聚類分析方法進(jìn)行分層。除非層的劃分是按自然層或單位類型進(jìn)行的,如性別、職業(yè)等,否則從理論上講,分層時層的數(shù)量越多越好,因為層越多,就越容易形成層內(nèi)個體的相似性。但在實際抽樣中,層的數(shù)量受到樣本規(guī)模和調(diào)查經(jīng)費(fèi)的限制。(三)分層抽取樣本的方法在分層抽樣中,有兩種常見的樣本抽取方法。一種方法是先將所有總體元素按分層變量進(jìn)行分層,并計算各層在總體中的比例。接著,如果采用等比例分層抽樣,則直接將總體比例視為樣本比例;如果采用不等比例分層抽樣,則需要對樣本比例做一定的調(diào)整。最后,再按確定的樣本比例,用簡單隨機(jī)抽樣或系統(tǒng)抽樣的方法,抽出適量的樣本元素。另一種方法適用于等比例分層抽樣。先將所有總體元素按分層變量進(jìn)行分層,然后將各層的總體元素,一層一層連續(xù)排列,最后,對連續(xù)排列的總體元素進(jìn)行等距抽樣,這種方法被稱為分層等距抽樣。計劃從100名大學(xué)教師中,用分層抽樣的方法,抽取一個包含100名教師的樣本,將職稱設(shè)為分層變量,抽樣結(jié)果如下:例子整群抽樣是先將總體劃分成若干個群(視為初級單位),每個群包含若干個次級單位,然后以一定方式從總體中抽取一部分群,并由中選群中的所有次級單位構(gòu)成總體的樣本。在通常情況下,整群抽樣的抽樣誤差大于簡單隨機(jī)抽樣。四、整群抽樣從群的劃分類型看,經(jīng)常被用到的是那些自然群,即由行政或地域區(qū)劃形成的群,如學(xué)校、企業(yè)、省市或村鎮(zhèn)。另一類群則是調(diào)查人員人為劃定的,如將一大塊面積劃分為若干塊較小面積的群,這時需要考慮如何劃分群才能使在調(diào)查費(fèi)用一定時抽樣誤差最小。群的劃分可以遵循以下原則:群內(nèi)方差盡可能大,群間方差盡可能小,即群內(nèi)各單位的差異盡可能大,群與群之間的差異盡可能小。(一)群的性質(zhì)不等概率抽樣是指在抽樣過程中,總體中的每個抽樣單位有一個被抽中的概率值,這些概率值可能不相等,即不同的總體抽樣單位入樣的可能性是大小不等的。之所以采用不等概率抽樣方法,主要是因為當(dāng)總體抽樣單位之間差異較大時,等概率抽樣可能會增大估計誤差,降低估計精度,從而對抽樣效果產(chǎn)生不良影響。不等概率抽樣分為放回和不放回兩種類型,這里只討論放回類型。五、不等概率抽樣樣本規(guī)模固定,且每個抽樣單位被抽中的概率與單位的大小或規(guī)模成比例的不等概率抽樣,簡稱PPS抽樣。不等概率抽樣的實施有兩種方法。(一)代碼法:代碼法比較適用于總體抽樣單位的規(guī)模,不太大時。(二)拉希里法:當(dāng)總體抽樣單位的規(guī)模,很大時,使用代碼法抽樣會很麻煩,這時可以使用拉希里法。這里“多階段”指的是按總體內(nèi)的層級關(guān)系,把抽樣分成幾個階段來進(jìn)行。最初從總體中抽出的群被稱為初級抽樣單位(PSU),如果PSU的規(guī)模相等,用簡單隨機(jī)抽樣或等距抽樣方法,直接進(jìn)行第二階段的抽樣,這時第二級單位是等概率入樣的,而且樣本規(guī)模是常數(shù)。這個原則也適用于更多階段的抽樣。問題是如果群規(guī)模不等,多階段抽樣也存在與整群抽樣類似的樣本規(guī)模隨機(jī)變動問題。具體處理方法包括:分層多階段等概率抽樣和多階段PPS抽樣。六、多階段抽樣在分層多階段等概率抽樣中,需要先將總體中規(guī)模不等的群按規(guī)模(或重要性)分層,然后在不同階段對不同的層使用不同的抽樣比。以兩階段抽樣為例,假設(shè)將總體分為大群、中群、小群三個層。在第一階段抽群時,大、中、小三個層的抽樣比fa依次遞減;在第二階段抽單位時,大、中、小三個層的抽樣比fb依次遞增。為保證樣本單位等概率入樣,即總的抽樣比f保持不變,可使f=fa×fb保持不變。(一)分層多階段等概率抽樣多階段PPS抽樣的關(guān)鍵是在第一階段抽取PSU時,要先放棄等概率抽樣條件,采用PPS抽樣方法,即賦予規(guī)模不等的群與其規(guī)模(或輔助變量)成比例的入樣概率。這樣一來,規(guī)模大的群以大概率入樣,規(guī)模小的群以小概率入樣。由于抽取PSU的過程是不等概率抽樣,因此如果要保證總抽樣比不變,就需要以一個固定的樣本規(guī)模從抽中的PSU內(nèi)抽取樣本單位。(二)多階段PPS抽樣進(jìn)行PPS抽樣的一個前提條件是在具體抽樣前,要知道各級抽樣單位的規(guī)模??墒窃诔闃忧耙话銦o法確切知道抽樣單位的實際規(guī)模,為了能使用PPS方法,只能代之以各級抽樣單位規(guī)模的估計值M,即規(guī)模測量值。估計值可以從離調(diào)查時點(diǎn)最近的一次普查資料或其他統(tǒng)計資料中查找到。在三階段或更多階段抽樣中,在最后一級抽樣時,也可用實際規(guī)模計算出實際應(yīng)抽取的樣本規(guī)模,問題是如何確定最后一級群實際的規(guī)模。通常抽樣設(shè)計人員不可能走訪所有的最后一級群,因此,利用實際群規(guī)模校正樣本規(guī)模的工作只能由調(diào)查員來完成。在培訓(xùn)調(diào)查員時,就應(yīng)將計算實際樣本規(guī)模的內(nèi)容納入培訓(xùn)計劃。(三)規(guī)模測量值第四節(jié)

抽樣誤差與抽樣規(guī)模PARTTWO根據(jù)中心極限定理,在放回抽樣條件下,如果樣本規(guī)模為n,總體標(biāo)準(zhǔn)差為σ,則樣本平均值M的抽樣分布的標(biāo)準(zhǔn)差,即標(biāo)準(zhǔn)誤差SE為:在樣本規(guī)模很大的情況下,通常可以用樣本的標(biāo)準(zhǔn)差:作為總體標(biāo)準(zhǔn)差的近似值,于是有:(一)放回簡單隨機(jī)抽樣一、簡單隨機(jī)抽樣的抽樣誤差在實際抽樣中,還經(jīng)常用到樣本比例p的標(biāo)準(zhǔn)誤差。在放回抽樣條件下,如果樣本規(guī)模為n,總體比例為P,總體標(biāo)準(zhǔn)差,則樣本比例p的標(biāo)準(zhǔn)誤差為:同樣,由于很難知道總體比例P的數(shù)值,當(dāng)樣本規(guī)模很大時,可以用樣本比例p來代替總體比例P,于是有:在不放回抽樣中,計算標(biāo)準(zhǔn)誤差要在放回抽樣的基礎(chǔ)上,引入一個不放回抽樣效正因子,這時樣本均值和樣本比例的標(biāo)準(zhǔn)誤差分別為:由于在社會調(diào)查中N一般較大,N-1近似等于N,于是有:(二)不放回簡單隨機(jī)抽樣由中心極限定理可知,如果樣本規(guī)模很大(對于正態(tài)分布的總體,一般要求n>30;對于非正態(tài)分布的總體,一般要求n>50;在社會調(diào)查中,由于變量較多,最好能保證n>100),則抽樣分布近似為正態(tài)分布,抽樣分布的均值M就是總體的均值μ。(三)標(biāo)準(zhǔn)誤差的意義上述抽樣分布的特征在統(tǒng)計推論中的意義在于,假定總體均值μ=M,可以推測,從該總體中抽出一個樣本的均值落在M±1.96SE范圍的概率為95%,落在范圍以外的概率為5%(0.05)。社會研究通常認(rèn)為,如果樣本均值以如此大的機(jī)會落在上述范圍內(nèi),有關(guān)總體均值的假設(shè)就是正確的。在社會調(diào)查中經(jīng)常會用到以下數(shù)值:樣本規(guī)模又稱樣本容量,是指樣本中所包含元素的數(shù)量。樣本規(guī)模一方面會影響到樣本的代表性,另一方面則直接影響到調(diào)查成本的大小。太小的樣本其代表性可能較差,但太大的樣本又會增加不必要的成本。因此,在實際抽樣中,選擇合適的樣本規(guī)模是非常重要的。二、簡單隨機(jī)抽樣的樣本規(guī)模如果先不考慮經(jīng)費(fèi)問題,那么樣本規(guī)模主要取決于抽樣精度和總體標(biāo)準(zhǔn)差。一般說來,抽樣希望達(dá)到的精確度越高,總體的異質(zhì)性程度越顯著,所需的樣本規(guī)模就越大。首先,抽樣精度是指抽樣中希望達(dá)到的精確度,其實就是能夠容忍的抽樣誤差e。抽樣誤差是樣本統(tǒng)計量與總體參數(shù)值之間的偏差,而偏差是由樣本與總體不一致造成的。(一)影響樣本規(guī)模的因素一般說來,總體較小,增大抽樣比率,對抽樣精度會有較大的改善。但有研究表明,對于較大的總體,在給定精度的條件下,總體規(guī)模與樣本規(guī)模之間,是一種如下圖所顯示的非線性關(guān)系,樣本增大速度遠(yuǎn)遠(yuǎn)低于總體增大速度。其次,總體標(biāo)準(zhǔn)差σ是反映總體元素間異質(zhì)性程度的指標(biāo)。一般說來,在給定抽樣精度后,總體異質(zhì)性程度越小,所需樣本規(guī)模也越小,反之亦然。這是因為異質(zhì)性越小,總體參數(shù)的分布越集中,波動性越小,大小相同的樣本的代表性就越好。反過來,異質(zhì)性越高,參數(shù)分布越分散,波動性越大,大小相同的樣本的代表性就越差。假設(shè)研究目的是求出某個變量(X)在總體中的均值μ=M。從一個隨機(jī)樣本(n)計算出來的均值(X)與總體均值(M)的差就是允許誤差e,即:又假定總體標(biāo)準(zhǔn)差為σ,則在置信度給定時,置信區(qū)間為:在放回抽樣中:樣本規(guī)模為:(二)樣本規(guī)模的估算在不放回抽樣中:樣本規(guī)模為:估計總體比例或百分比p,只要相應(yīng)地將σ2換成p(1-p)就行了。如果推測總體比例或百分比p有困難,可采用保守估計p=0.5,這樣即可獲得所需的最小樣本數(shù)。這時在不放回抽樣中有:根據(jù)這個公式,可以計算出在最大容許誤差條件下所需的最小樣本規(guī)模。復(fù)習(xí)思考題1.為什么要進(jìn)行抽樣?2.為什么說“街頭攔人”不是隨機(jī)抽樣?3.判斷抽樣比較適合用于哪些場合?4.目標(biāo)總體與抽樣總體之間有哪些差異?5.在簡單隨機(jī)抽樣中,有哪幾種方法可以產(chǎn)生隨機(jī)數(shù)?彼此之間有何差異?6.為什么說等距抽樣是一種準(zhǔn)隨機(jī)抽樣方法?復(fù)習(xí)思考題7.為什么系統(tǒng)抽樣的代表性與總體單位的排列順序有關(guān)?8.為什么在分層抽樣中,對各層的樣本規(guī)模要進(jìn)行非比例分配?9.在分層抽樣中,層的數(shù)目受到哪些因素的限制?10.群的劃分原則與分層原則有什么不同之處?11.PPS抽樣是如何保證大小不等的群中的元素以相等概率入樣的?12.總體規(guī)模與樣本規(guī)模之間是一種什么關(guān)系?參考答案1.為什么要進(jìn)行抽樣?抽樣是為了從研究對象的總體中選取一部分作為樣本,通過分析這部分來推斷整個總體的情況。這樣做可以節(jié)省時間、成本和資源,并且在很多情況下是唯一可行的研究方法。2.為什么說“街頭攔人”不是隨機(jī)抽樣?“街頭攔人”通常不具備隨機(jī)性,因為選擇誰被攔下可能受到位置、時間、攔人者的偏好等因素的影響,這會導(dǎo)致某些人群比其他人更有可能被選中,因此不能代表總體。參考答案3.判斷抽樣比較適合用于哪些場合?判斷抽樣(或稱目的抽樣)適用于需要專家根據(jù)特定標(biāo)準(zhǔn)挑選樣本的情況,比如當(dāng)研究者對研究主題有深入了解時,或者當(dāng)目標(biāo)總體較小且易于訪問時。4.目標(biāo)總體與抽樣總體之間有哪些差異?目標(biāo)總體是指研究者想要了解的所有元素的集合,而抽樣總體是從中抽取樣本的實際元素集合。兩者之間的差異可能是由于無法接觸所有目標(biāo)總體成員、定義上的差異或其他限制條件造成的。參考答案5.在簡單隨機(jī)抽樣中,有哪幾種方法可以產(chǎn)生隨機(jī)數(shù)?彼此之間有何差異?手動方法:如抽簽、擲骰子。隨機(jī)數(shù)表:預(yù)先生成的一系列數(shù)字。計算機(jī)生成:使用軟件算法生成偽隨機(jī)數(shù)。

這些方法的主要區(qū)別在于便利性和產(chǎn)生的隨機(jī)數(shù)的質(zhì)量,計算機(jī)生成的方法通常更快捷但依賴于算法的質(zhì)量。參考答案6.為什么說等距抽樣是一種準(zhǔn)隨機(jī)抽樣方法?等距抽樣是在確定了起點(diǎn)后,按照固定的間隔(例如每隔N個單位)選擇樣本。雖然它看起來具有一定的規(guī)律性,但如果起點(diǎn)是隨機(jī)選擇的,則可以認(rèn)為它接近于隨機(jī)抽樣。7.為什么系統(tǒng)抽樣的代表性與總體單位的排列順序有關(guān)?如果總體中的單位以某種模式排序,那么系統(tǒng)抽樣可能會無意中捕捉到這個模式,導(dǎo)致樣本不具代表性。例如,如果總體按周期性變化排序,那么固定間隔可能會重復(fù)相同類型的單元。參考答案8.為什么在分層抽樣中,對各層的樣本規(guī)模要進(jìn)行非比例分配?有時為了確保小規(guī)模但重要的層有足夠的代表性,研究者可能會選擇非比例分配,即給予一些層相對更多的樣本量,即使它們在總體中的比例較小。9.在分層抽樣中,層的數(shù)目受到哪些因素的限制?層的數(shù)量受限于可用資源、數(shù)據(jù)的可獲得性、統(tǒng)計效率以及層內(nèi)變異的程度。過多的層數(shù)會增加復(fù)雜性和成本,而過少則可能無法充分捕捉總體內(nèi)的多樣性。參考答案10.群的劃分原則與分層原則有什么不同之處?分層是基于共同特征將總體分為互斥且詳盡的子集;群的劃分則是將相鄰或相關(guān)的單元組合在一起,通常是為了簡化抽樣過程,而非為了提高樣本的代表性。11.PPS抽樣是如何保證大小不等的群中的元素以相等概率入樣的?PPS(ProbabilityProportionaltoSize)抽樣中,群被選中的概率與其規(guī)模成正比,但在選定群之后,每個元素被抽中的概率被調(diào)整為相等,通常是通過二次抽樣實現(xiàn)的。參考答案12.總體規(guī)模與樣本規(guī)模之間是一種什么關(guān)系?總體規(guī)模和樣本規(guī)模之間的關(guān)系取決于所需估計的精度、總體的異質(zhì)性程度以及可用資源。一般而言,較大的樣本能提供更精確的估計,但在一定程度上,樣本大小的增加對精度的提升效果遞減。此外,對于非常大的總體,相對較小的樣本也能夠給出可靠的估計。郝大海

著社會調(diào)查研究方法

(第五版)新編21世紀(jì)社會學(xué)系列教材“十二五”普通高等教育本科國家級規(guī)劃教材北京高等教育精品教材第三章

抽樣實務(wù)及問題1.在實踐中,分層多階段區(qū)域抽樣是應(yīng)用范圍比較廣泛的多階段抽樣方法。2.按戶籍資料進(jìn)行區(qū)域抽樣的步驟包括:計算總的抽樣比,確定各級抽樣單位和計劃樣本規(guī)模,對PSU分層并確定層內(nèi)計劃樣本規(guī)模,在層內(nèi)抽取PSU,在PSU內(nèi)抽取次級抽樣單位。3.按居住地地圖法抽樣的步驟包括:選定繪制地圖的區(qū)域,獲取或制作參考底圖,繪制地圖(或選取現(xiàn)有地圖),制作住戶清單列表,抽取樣本。4.隨機(jī)數(shù)字撥號技術(shù)的優(yōu)點(diǎn)就是在抽樣時,不一定要具備一個描述完整的抽樣框;而它的缺點(diǎn)則是會遺漏未裝電話的家戶單位。本章要點(diǎn)5.隨機(jī)數(shù)字撥號抽樣的步驟包括:搜集電話局編碼,確定電話局編碼的線路數(shù)量,確認(rèn)無效號碼的范圍,隨機(jī)確定將要撥打的電話號碼。6.抽樣框誤差產(chǎn)生的原因包括以下幾種類型:(1)抽樣框丟失了本該列入的目標(biāo)總體單元;(2)抽樣框包含了不應(yīng)該列入的目標(biāo)總體單元;(3)抽樣框與目標(biāo)總體存在著復(fù)合連接。7.無應(yīng)答誤差產(chǎn)生的原因包括以下幾種類型:(1)地址不準(zhǔn)確找不到被抽中的被訪者;(2)被訪者訪問時不在家;(3)被訪者拒絕接受訪問。本章要點(diǎn)區(qū)域抽樣Kish戶內(nèi)抽樣表抽樣頁地圖法抽樣隨機(jī)數(shù)字撥號電話號碼字冠“種子”號碼非抽樣誤差抽樣框誤差樣本輪換率無應(yīng)答誤差基本概念目錄01第一節(jié)區(qū)域抽樣02第二節(jié)隨機(jī)數(shù)字撥號抽樣03第三節(jié)

非抽樣誤差區(qū)域抽樣PARTONE多階段抽樣能以多種形式實施,但在實踐中,分層多階段區(qū)域抽樣是應(yīng)用范圍比較廣泛的多階段抽樣方法。只要能以區(qū)域劃分總體,就能夠采用多階段區(qū)域抽樣,例如,利用街區(qū)劃分一個城市,利用各級行政單位劃分一個國家。以下是一個按行政區(qū)劃和戶籍資料,利用PPS方法進(jìn)行分層多階段區(qū)域抽樣的實例。一、按戶籍資料PPS抽樣假設(shè)某省一個調(diào)查研究中心計劃進(jìn)行一次全省范圍的抽樣調(diào)查,希望利用調(diào)查數(shù)據(jù)進(jìn)行社會結(jié)構(gòu)變遷研究。根據(jù)最近的普查,該省共有家庭戶17699115戶,計劃用PPS方法從中抽取4000戶作為樣本,步驟如下。(一)計算總的抽樣比即在全省范圍內(nèi)從每4425戶中抽取一戶。設(shè)此次抽樣為4級抽樣,各級抽樣單位依次為3縣(PSU)、鄉(xiāng)、村、戶。計劃在全省共抽取40個縣,每個縣抽取2個鄉(xiāng),每個鄉(xiāng)抽取2個村,每個村計劃抽取25戶,即a=40,b=2,c=2,d=25,b×c×d=100(每個縣計劃抽取100戶),由此產(chǎn)生類似下表的結(jié)果:(二)確定各級抽樣單位和計劃樣本規(guī)模由于該省社會經(jīng)濟(jì)發(fā)展水平由南至北逐漸下降,故結(jié)合各縣的地理位置,由南至北將所有PSU劃分為四個層。假設(shè)某一層的規(guī)模為1.35851戶,采用按比例分配樣本,因此層抽樣比fa等于總抽樣比fb層內(nèi)計劃樣本規(guī)??捎蒮b=f求出:1935851×0.000226=437.5(戶)(三)對PSU分層和確定層內(nèi)計劃樣本規(guī)模按此方式進(jìn)行分層后,各層內(nèi)子樣本規(guī)模不一定是100的整數(shù)倍,即不同層的PSU內(nèi)的子樣本規(guī)模并不一定是完全相等的,而是大致為100戶。在這種情況下,可取層內(nèi)PSU數(shù)目a5值,使每個內(nèi)子樣本規(guī)模接近100即可。這樣,在此層可取a5=4,則此層的每個PSU內(nèi)計劃子樣本戶數(shù)為109.4戶,同樣可以得出鄉(xiāng)、村的子樣本數(shù)目。(三)對PSU分層和確定層內(nèi)計劃樣本規(guī)模第一,從普查資料或其他資料取得PSU的規(guī)模測量值Mhα,將層內(nèi)PSU排列起來。第二,按層內(nèi)PSU的排列順序,將規(guī)模測量值Mhα累加。第三,首先,采用系統(tǒng)抽樣,先計算抽樣間距然后,在1~k范圍內(nèi)抽取一個隨機(jī)數(shù)r作為起點(diǎn),設(shè)從隨機(jī)數(shù)表中查得一個8位數(shù)字26804292,則r=268042.92。最后,抽出ah個PSU,抽中號碼分別為:r,r+k,……,r+(ah-1)k(四)在層內(nèi)抽取PSU第二、三級抽樣分別用PPS方法,從每個樣本縣中抽選出b=2個樣本鄉(xiāng),從每個樣本鄉(xiāng)中抽選出c=2個樣本村,抽取方法與上述抽取PSU的步驟類似。第四級抽樣,從每個樣本村內(nèi)抽取樣本戶。計劃樣本戶數(shù)為d*,這里d*=27.35(戶)。這樣,第四級抽樣的抽樣比為d*/Mhαβγ,其中Mhαβγ為第α縣內(nèi)第β鄉(xiāng)的第γ村的規(guī)模測量值。第四級抽樣的期望樣本戶數(shù)由該抽樣比乘實際村規(guī)模(戶數(shù))得到,即d=(d*/Mhαβγ)×Nhαβγ。設(shè)某樣本村的規(guī)模測量值為Mhαβγ=374(戶),而調(diào)查時的實際規(guī)模測量值Nhαβγ=397(戶),則從該村實際應(yīng)抽戶數(shù)為。抽戶可按線性系統(tǒng)抽樣進(jìn)行,即先算出抽樣間距,然后將戶名單隨機(jī)排列進(jìn)行等距抽取。(五)在PSU內(nèi)抽次級抽樣單位(六)對PPS抽樣過程的說明第一,在確定各級抽樣單位數(shù)目時,需要考慮兩方面的因素。一方面,需要考慮各階段抽樣總體的異質(zhì)性程度。另一方面,要考慮所擁有的人力和經(jīng)費(fèi)。第二,除了例子中列出的分層方法外,還可以使用另一種分層方法,即將總體4個PSU劃分為a/2個大小相近似的層,每層抽取兩個PSU,這種分層方法由于劃分得較細(xì),因此可以較大地降低總體異質(zhì)性程度。(六)對PPS抽樣過程的說明第三,可能有些抽樣單位的規(guī)模會大于抽樣間距。有兩種處理方法:一種方法是將該抽樣單位與其他抽樣單位同樣看待,如果它被選中兩次,就將其視為兩個抽樣單位,從中抽取兩倍的次一級抽樣單位。另一種方法是將所有大于抽樣間距的單位挑出來,單獨(dú)組成一個層;在該層內(nèi)用總抽樣比求出該層樣本規(guī)模,然后直接抽取次一級單位。第四,可能有些最后一級群的規(guī)模測度值小于計劃從中抽取的樣本數(shù)。解決這個問題的方法是事先規(guī)定村的Mhαβγ下限為2d*或3d*,不要以d*為下限。二、從住戶中抽取被訪者一般說來,多階段抽樣設(shè)計的最后一級抽樣單位往往是居民住戶,但所抽到的居民住戶大多是由多名成員構(gòu)成的。在實際調(diào)查中,通常需要從這些成員中按一定規(guī)則抽取一位成年人作為調(diào)查對象,這就是所謂的戶內(nèi)抽樣??刹捎枚喾N方法進(jìn)行戶內(nèi)抽樣,這里介紹當(dāng)前抽樣調(diào)查中比較常用的Kish表抽樣方法。Kish表抽樣方法是通過附在問卷的第一頁上的一份抽樣頁來進(jìn)行的,抽樣頁內(nèi)包括被訪住戶的地址、住戶家庭成員情況登錄表和抽樣表等項內(nèi)容。訪問員在住戶同意被采訪后,即可以通過以下步驟來抽取被訪者。(一)填寫住戶成員情況訪問員先要詢問住戶成員的基本情況,包括性別、年齡和與戶主的關(guān)系。之后,將成員進(jìn)行排序并對符合被訪問條件的成員編號,然后依次填入住戶家庭成員情況登錄表中。排序遵循的原則是:男性在前,女性在后;年齡大的在前,年齡小的在后。例如,某項調(diào)查將調(diào)查對象的年齡限定為16~69歲。某住戶共有7位成員:戶主、妻子、戶主的父親、戶主的母親、兒子、大女兒和小女兒。其基本情況如表所示:例子(二)根據(jù)抽樣表抽取被訪者每份問卷抽樣頁中的抽樣表包括以下內(nèi)容:抽樣表的編號、住戶中成年成員數(shù)目和抽取成年住戶成員的號碼。其中抽樣表的編號分為A1、B1、B2、C、D、E1、E2和F等8種,即共有8種抽樣表。每種抽樣表占抽樣表總數(shù)的比例分別為:1/6、1/12、1/12、1/6、1/6、1/12、1/12和1/6。每一份問卷的抽樣都有一種抽樣表,問卷也因此被分為8類。問卷抽樣頁上的抽樣表格式使用Kish表抽樣方法的關(guān)鍵是一定要事先將訪問地址和抽樣表種類分配給問卷,盡量不要讓訪問員根據(jù)地址決定抽樣表的種類,這樣很容易產(chǎn)生誤差。另外,要注意在A類、B類和C類抽樣表中一般容易抽中較小編號,而被分配給這些抽樣表的地址,主要是男性被訪者,因此,晚上訪問比較合適,特別是在農(nóng)村調(diào)查更是如此。相反,訪問員可利用白天時間訪問分配給D類、E類和F類抽樣表的地址。最后提醒訪問員應(yīng)將住戶所有成員的情況,盡可能完全準(zhǔn)確地填入住戶家庭成員情況登錄表。三、按居住地地圖法抽樣在調(diào)查中最重要的是獲得抽樣框,但是我國正處于轉(zhuǎn)型期,利用村委會和居委會戶籍資料進(jìn)行抽樣困難重重;而村委會和居委會的常住人口登記又非常不完備,無法充當(dāng)抽樣框。較為可靠的方法是利用村(居)委會中的住宅進(jìn)行抽樣。由于我國尚未建立起完備的門牌地址系統(tǒng),因此地圖法更加實用,即可以直接從居住地抽取居民戶。具體做法是:深入村(居)委會的實地,用地圖法繪制出村委會和居委會的所有建筑物,并進(jìn)一步列舉出建筑物中的所有住宅,以此作為抽樣框來抽取家庭。(一)選定繪制地圖的區(qū)域在實際調(diào)查中,如果進(jìn)行調(diào)查的行政區(qū)域較大,實際抽樣需要分階段進(jìn)行。例如,CGSS是全國調(diào)查,采取四級多階段抽樣,初級抽樣單位是城區(qū)、縣,第二級抽樣單位是村/居委會,第三級抽樣單位是家庭戶,第四級抽樣單位是個人。其中,初級和第二級抽樣按PPS方法依據(jù)行政統(tǒng)計資料抽取,第四級抽樣按戶內(nèi)抽樣方法抽取,地圖法針對的是第三級抽樣,即針對村/居委會所轄地域繪制抽樣地圖。采用地圖法抽樣的最終目的是保證每一個抽樣單位(村/居委會)里的所有家庭戶都能進(jìn)入調(diào)查的抽樣框。(二)獲取或制作參考底圖在選定相應(yīng)區(qū)域后,需設(shè)法提前與被抽樣的村/居委會的主要負(fù)責(zé)人取得聯(lián)系,獲取該村/居委會已有的地圖作為參考底圖。在無法獲得上述地圖作為底圖的情況下,調(diào)查員在熟悉調(diào)查區(qū)域的基本情況及地形后,可以自行繪制底圖。具體步驟如下:一是明確調(diào)查區(qū)域行政邊界范圍;二是繪制出調(diào)查區(qū)域建筑物的分布情況,包括道路、地貌、建筑物的類型和分布,并做好標(biāo)記;三是從村/居委會的西北角開始,按順時針方向,繪出含有以上信息的參考底圖。本階段的注意事項包括:首先,參考底圖不能直接當(dāng)成調(diào)查地圖來用,其作用僅僅是幫助繪圖員從整體上把握要繪制的村/居委會的整體情況和繪圖比例。其次,有時為了明確調(diào)查區(qū)域的邊界或便于在調(diào)查時清晰地找到相關(guān)的住宅建筑物,可以繪出樣本區(qū)域外的標(biāo)志性建筑物或地貌,以便調(diào)查員找尋調(diào)查對象所在位置。最后,在繪制參考底圖時,如果遇到山區(qū),不用邊走邊繪制底圖,只需從小山丘上畫出俯視全貌即可。確保社區(qū)內(nèi)的所有住宅建筑物都進(jìn)入調(diào)查者地圖12控制好繪圖比例,使調(diào)查地圖和實際盡量一致解決方案:右手原則,即以該村/居委會的西北角為起點(diǎn)邊走邊繪制地圖,可防止遺漏。解決方案:盡可能在一張紙上完成調(diào)查地圖的繪制(三)繪制地圖(或選取現(xiàn)有地圖)采用地圖法抽樣的最終目的是保證每一個抽樣單元(村/居委會)里的所有居民戶都有相同的機(jī)會被抽中。因此,在繪制地圖時要注意建筑物的實際居住情況。在實際繪圖過程中,繪圖員需要實地核實,根據(jù)情況在繪圖紙上進(jìn)行繪制與標(biāo)示。如果使用既有地圖作為調(diào)查地圖,需要選出地圖上的坐標(biāo)點(diǎn)。先在選定的地圖上繪制二維網(wǎng)格,然后從地圖上按照某種概率規(guī)則抽取出一些二維坐標(biāo)點(diǎn)。在地圖上確定坐標(biāo)點(diǎn)后,還需要再到戶外對這些坐標(biāo)點(diǎn)進(jìn)行實地考察,并根據(jù)真實的地貌狀況,按照一定的規(guī)則,進(jìn)行適當(dāng)?shù)男拚詮浹a(bǔ)地圖過時導(dǎo)致的偏差。選擇地圖要考慮地圖出版的時間和地圖的比例尺。(四)制作住戶清單列表在地圖抽樣方法中,完整的住戶清單列表就構(gòu)成了調(diào)查的抽樣框。繪制調(diào)查地圖和制作住戶清單列表并抽樣,是地圖抽樣法的兩項核心工作。它們實際上是同時進(jìn)行的。住戶清單列表一般包括兩大部分:住戶清單列表封面和住戶清單。住戶清單列表封面主要包括總住戶數(shù)、總住宅數(shù)、住宅類樓房數(shù)量、住宅類平房數(shù)量、抽取樣本數(shù)量。采用系統(tǒng)抽樣時需要填寫抽樣距離。如果采用隨機(jī)抽樣,則不用填寫抽樣距離。1.住戶清單列表封面制作2.住戶清單列表制作住戶清單列表由若干張村/居委會住戶清單及抽樣名單組成。住戶清單列表必須保持三個一致。這三個一致還可以作為檢查抽樣員工作是否準(zhǔn)確的標(biāo)準(zhǔn)。(1)“封面”的總住宅數(shù)與“表單”中標(biāo)出的最后一個序號要一致;(2)在“表單”中,單個建筑物的“樓層住宅數(shù)量”之和與該建筑物總住宅數(shù)要一致;(3)在“表單”中,“樓層住戶數(shù)量”與“住戶編號”要一致。抽樣環(huán)節(jié)的主要工作是:根據(jù)地圖及住戶清單列表抽取調(diào)查樣本;核實抽中的住戶;替換增補(bǔ)樣本。1.抽取樣本抽取樣本可以用隨機(jī)抽樣法,也可以用整群抽樣法或系統(tǒng)抽樣法。首先可以采用隨機(jī)抽樣法。抽取的對象為該樓某一住戶所在的坐標(biāo)點(diǎn)所對應(yīng)的“樣本戶”。其次,除了對坐標(biāo)點(diǎn)對應(yīng)的每一“戶”進(jìn)行調(diào)查外,還可以采用整群抽樣,這時各坐標(biāo)點(diǎn)所對應(yīng)的戶被稱為群的首戶。從首戶開始,按門牌號碼自然排列順序,將相鄰的若干戶一同列為一個群。最后,也可以使用系統(tǒng)抽樣法。這需要計算抽樣距離等相關(guān)數(shù)據(jù)??紤]到實際住戶規(guī)模的差異性,地圖抽樣法多采用隨機(jī)抽樣法。(五)抽取樣本2.核實和替換樣本對被抽中的住戶,要進(jìn)一步核實其是否用于民住,是否都有家庭戶常住。如果有人常住,則判斷為有效住戶,進(jìn)一步獲取戶主的姓名、住戶門牌號碼即可。對于沒有門牌號碼的住戶,則要在備注欄中標(biāo)注找到該住戶的幫助性信息。如果被抽中的住戶為空戶(無人居住),或用作非居住用途,則要加以替換補(bǔ)足。對于用來替換的樣本,也一定要進(jìn)一步核實和補(bǔ)全信息。(一)訓(xùn)練訪問員(二)訪問員實地調(diào)查(三)質(zhì)量控制四、調(diào)查實施隨機(jī)數(shù)字撥號抽樣PARTTWO隨機(jī)數(shù)字撥號是一組概率抽樣的技術(shù)。它最大的優(yōu)點(diǎn)就是在抽樣時,不一定要具備一個描述完整的抽樣框;而它最大的缺點(diǎn)則是會遺漏未裝電話的家戶單位。另外,隨機(jī)數(shù)字撥號既可采用簡單隨機(jī)數(shù)字撥號抽樣法,也可使用多階段隨機(jī)數(shù)字撥號抽樣法。(一)搜集電話局編碼(二)確定電話局編碼的線路數(shù)量(三)確認(rèn)無效號碼的范圍一、搜集相關(guān)信息二、隨機(jī)數(shù)字撥號的技術(shù)在搜集到相關(guān)的電話號碼信息后,便可以利用一些隨機(jī)數(shù)字技術(shù),進(jìn)行隨機(jī)數(shù)字撥號抽樣了。這些技術(shù)包括隨機(jī)數(shù)表、數(shù)字添加技術(shù)和電腦輔助電話訪談方法。另外,還可以采用二階段隨機(jī)數(shù)字撥號方法,來減少簡單隨機(jī)數(shù)字撥號中無效電話號碼的數(shù)量。(一)隨機(jī)數(shù)表利用隨機(jī)數(shù)表,以人工方式進(jìn)行簡單隨機(jī)數(shù)字撥號抽樣,是隨機(jī)數(shù)字撥號最基本的技術(shù)。具體做法是,在確定電話局編碼的基礎(chǔ)上,先利用隨機(jī)數(shù)表生成一系列隨機(jī)數(shù),并將隨機(jī)數(shù)字加在電話局編碼后面,形成一系列將要撥出的電話號碼。通常有必要抽出比預(yù)期樣本規(guī)模多一些的電話號碼,因為,用這種方法抽出的電話號碼經(jīng)常是無效的。在抽出一定號碼后,讓訪問員實際撥打號碼,如果被撥打的號碼不是一個正在被使用的家用電話號碼,就將其過濾掉,再接著撥打另一個被隨機(jī)抽中的電話號碼。繼續(xù)這個過程直至產(chǎn)生足夠多的有效電話號碼為止。(二)數(shù)字添加技術(shù)在已有的電話號碼的基礎(chǔ)上,還可利用數(shù)字添加技術(shù)來產(chǎn)生新的電話號碼。具體做法是先從電話號碼簿中抽取一些“種子”(seed)號碼,然后將某個(也可以是兩個或三個)定數(shù)或隨機(jī)數(shù),添加在每個“種子”號碼上?!巴霞?”就是一種數(shù)字添加技術(shù)。另外,也可以加11或其他數(shù)字,來產(chǎn)生新號碼。在使用添加技術(shù)時,需要特別注意如果電話公司在分配未登錄電話號碼時,將它們集中于某個特定的后四位號碼范圍內(nèi)的話,就可能導(dǎo)致這種數(shù)字添加技術(shù)產(chǎn)生嚴(yán)重偏差。(三)電腦輔助電話訪談隨機(jī)數(shù)字撥號也可由電腦來完成,這時隨機(jī)電話號碼是由計算機(jī)程序產(chǎn)生的。需要說明的是,無論是人工撥號方法還是電腦輔助電話訪談,都需要事先搜集一份抽樣區(qū)域內(nèi)的電話局編碼。二者的不同之處在于,在電腦輔助電話訪談中,可以將有關(guān)電話局編碼線路數(shù)量和無效號碼范圍的信息,直接編入產(chǎn)生隨機(jī)號碼的程序。二者之間另一項重要的區(qū)別是,在電腦輔助電話訪談的情況下,可以一次只產(chǎn)生一個電話號碼,供訪談人員進(jìn)行撥號訪談使用。再有,在利用電腦或隨機(jī)數(shù)表產(chǎn)生隨機(jī)數(shù)字時,有可能會在同一組電話局編碼中產(chǎn)生重復(fù)的隨機(jī)數(shù)字,在采用人工撥號方式產(chǎn)生樣本時,很難核對出這種重復(fù)的號碼,但借助電腦可以輕而易舉地查出重復(fù)的號碼。(四)二階段隨機(jī)數(shù)字撥號除通過事先確定無效號碼范圍外,二階段隨機(jī)數(shù)字撥號也是有效減少無效號碼的抽樣方式,尤其是當(dāng)抽樣區(qū)域過于龐大時,這種方法更加有效。但這種方法帶來便利性與有效性的代價便是會略為增加該項調(diào)查的抽樣誤差。下面以一項電話訪問為例子,具體介紹二階段隨機(jī)數(shù)字撥號抽樣的具體實施方法。(1)取得涵蓋抽樣區(qū)域所有家用電話的電話局編碼的目錄。(2)利用簡單隨機(jī)數(shù)字撥號的原則,在抽樣區(qū)域內(nèi)確定一個相對較小的家用電話號碼群體,作為第二階段中的“種子”號碼,通??沙槿?0~100個。與此同時,還要根據(jù)可聯(lián)系上的電話號碼的比例,抽選一些備用的“種子”號碼。例如,若抽取了100個“種子”號碼,可聯(lián)系上的電話號碼比例為25%,則需要準(zhǔn)備400個“種子”號碼。(3)讓所有的訪談人員撥打這400個“種子”號碼,以判定哪些是可以聯(lián)系上的家用電話,預(yù)計約有100個號碼可以成功。(4)第一階段確定的100個左右“種子”號碼,代表了抽樣區(qū)域內(nèi)所有家用電話的一個簡單隨機(jī)樣本。如果計劃樣本規(guī)模為1100個住戶,那么在第二階段中每個“種子”號碼必須派生出11次電話訪談。第二階段的抽樣還可通過以下過程來完成。假設(shè)某個選定的“種子”號碼為6864-5347,如果它不是一個正在被使用的家用電話號碼,就接著撥打6864范圍內(nèi)下一組被隨機(jī)抽中的電話號碼。如果6864-5347是正在被使用的家用電話號碼,就撥打在6864-5300到6864-5399之間的100個號碼中另外的號碼(這100個號碼被稱為群)。這些被撥打的號碼叫“第二級號碼”,第二級號碼的個數(shù)取決于想要的樣本規(guī)模。這里我們假定將要撥打的是11個第二級號碼。如果11個第二級號碼中沒有一個號碼正在被使用,那就接著撥打這100個號碼中的其他號碼,直到最后撥到11個正在被使用的第二級號碼為止。在上述步驟完成后,再針對其他的“種子”號碼,繼續(xù)這個過程。非抽樣誤差PARTTHREE一、抽樣框誤差在抽樣設(shè)計中,由于抽樣框不完備引起的非抽樣誤差,通常被稱為抽樣框誤差。在實際抽樣中,造成抽樣框誤差的原因是多方面的,包括目標(biāo)總體單元丟失或增添、抽樣框與目標(biāo)總體存在復(fù)合連接等。大量流動人口產(chǎn)生的抽樣框誤差,就是由于目標(biāo)總體單元丟失。而追蹤調(diào)查中的樣本輪換,如果處理不當(dāng),也可能會由于目標(biāo)總體單元丟失或增添,而出現(xiàn)抽樣框誤差。(一)誤差類型及消除辦法首先,抽樣框丟失了本該被列入的目標(biāo)總體單元,即在編制抽樣框時,沒有將所有總體單元都編進(jìn)抽樣框。解決總體單元丟失的辦法之一是在編制抽樣框時,事先針對丟失單元確定一些入樣規(guī)則,這樣一旦發(fā)現(xiàn)并找到丟失單元,便按照入樣規(guī)則將其與抽樣框單元連接起來。另一個解決總體單元丟失的辦法是使用多個抽樣框,也就是針對不同的總體對象,編制不同的抽樣框進(jìn)行抽樣。其次,抽樣框包含了不應(yīng)該列入的目標(biāo)總體單元,即在編制抽樣框時,將一些本來不符合調(diào)查條件的單元編進(jìn)了抽樣框。相對于單元丟失而言,發(fā)現(xiàn)非目標(biāo)總體單元要容易一些,因此可以在編制抽樣框時通過一定程序?qū)⒉环蠗l件的單元篩選出去。最后,抽樣框與目標(biāo)總體存在著復(fù)合連接,即抽樣框中的單元與抽樣總體中的單元不是一一對應(yīng)的關(guān)系,一個抽樣框中的單元可能與多個總體單元相連接,或反過來,一個總體單元連接多個抽樣框中的單元。解決復(fù)合連接的方法是指定樣本框單元與總體單元唯一連接的規(guī)則。(二)流動人口的抽樣解決由流動人口引起的抽樣框缺失問題的第一步是想辦法獲得流動人口的資料。從流動人口的管理現(xiàn)狀看,目前流動人口分兩塊管理,一塊是集體戶管理,另一塊是居委會登記暫住人口。集體戶的管理資料由公安局掌握,人口的平均年齡、受教育程度等變量都是可以知道的。流動人口的集體戶抽樣具體操作步驟如下:首先,從市公安局拿到有關(guān)的流動人口資料,包括:(1)全市流動人口集體戶的總數(shù),以及這些集體戶所包括的流動人口總數(shù);(2)全市管轄流動人口集體戶的派出所數(shù)目;(3)每個派出所管轄的流動人口集體戶數(shù)、每個集體戶的流動人口數(shù)。其次,確定管轄流動人口的派出所為初級抽樣單位(PSU),使用PPS方法抽出集體戶。最后,在每個被抽中的集體戶中用等距抽樣的方法,抽取流動人員樣本。流動人口除集體戶外,相當(dāng)一部分屬于暫住人口,他們中的絕大多數(shù)(以白領(lǐng)階層居多)不住集體戶,而是租用別人家的房屋居住。這些人是在居委會登記的暫住人口,辦理了暫住證。在實際抽樣中,暫住人口的抽樣問題是通過按照門牌號碼抽樣的方法解決的。這里暫住人口的概念是相對于擁有常住戶口的居民而言的,是戶籍制度的產(chǎn)物。除了以上對集體戶和暫住人口的具體抽樣外,由于兩塊抽樣所依據(jù)的是不同的抽樣框,需要解決如何將兩塊抽樣得到的樣本合并在一起的問題。從理論上講,概率抽樣首先應(yīng)做到的是保證樣本中的所有單位有相等的概率被抽中。另外,由于使用了兩個抽樣框,因此必須處理抽樣框之間的樣本重疊問題。解決流動人口抽樣除了采用上面的按集體戶和門牌號碼抽樣外,分層調(diào)查并進(jìn)行加權(quán)抽樣和區(qū)域抽樣也是可行的解決方案。(三)追蹤調(diào)查中的樣本輪換追蹤調(diào)查通常需要確定一個相對固定的樣本,然后根據(jù)研究需要,連續(xù)追蹤調(diào)查這個樣本中的個體,這些個體至少被調(diào)查兩次。不過固定樣本存在著個體的“消失”或“出生”問題,而樣本量的減少或增加會降低估計量的精度。除了可以對仍留在固定樣本中的個體進(jìn)行加權(quán)處理外,解決固定樣本由于調(diào)查對象失去耐心、不配合而產(chǎn)生的個體“消失”問題,辦法是建立輪換子樣本系統(tǒng)。也就是在抽取固定樣本的同時,將其按隨機(jī)原則相應(yīng)地劃分為幾個子樣本,一旦調(diào)查進(jìn)程到了重新調(diào)查的時間上限,就輪換掉最老的子樣本,換上其他新的子樣本。在樣本輪換中首先要確定樣本輪換率,即在實行樣本輪換時新引入調(diào)查期的樣本單元數(shù)量占樣本總量的比例。其次還要確定樣本輪換時間,即實行兩次樣本輪換的間隔時間。二、無應(yīng)答誤差無應(yīng)答誤差是在抽樣設(shè)計中,由于各種原因沒能夠?qū)Ρ怀槌龅臉颖締挝辉L問成功,從而沒有獲得有關(guān)這些單位的信息,進(jìn)而由于數(shù)據(jù)缺失產(chǎn)生的估計偏差。無應(yīng)答可按其性質(zhì)分為無意無應(yīng)答和有意無應(yīng)答,前者為隨機(jī)誤差,后者則為系統(tǒng)誤差,比較起來后者產(chǎn)生的偏差更為嚴(yán)重。整個數(shù)據(jù)搜集過程都有可能產(chǎn)生無應(yīng)答誤差。(一)地址不準(zhǔn)確及解決辦法當(dāng)前地址不準(zhǔn)確主要是由大多數(shù)城市普遍存在的人戶分離現(xiàn)象——本人實際住所與戶籍所在地相分離——引起的。產(chǎn)生城市中人戶分離現(xiàn)象的直接原因有以下幾點(diǎn)。首先,住房動遷;其次,多處居所;最后,“空巢”現(xiàn)象。解決“找不到”式無應(yīng)答誤差的一個有效辦法是按門牌號碼抽樣。(二)訪問時不在家及解決辦法由于調(diào)查對象“訪問時不在家”而產(chǎn)生的無應(yīng)答誤差主要是由訪問員的主觀原因引起的。一種有效的解決辦法是加大入戶抽樣的監(jiān)控力度,具體監(jiān)控方法有以下幾條。首先,入戶抽樣與入戶調(diào)查相分離。在具體操作中可設(shè)法事先將戶內(nèi)調(diào)查對象抽出來,并將地址印在問卷上,然后再派調(diào)查員入戶調(diào)查。如果調(diào)查員入戶后,事先選定的調(diào)查對象不在家,需要更換樣本,需要對性別和年齡進(jìn)行控制。其次,保證20%的回訪率。具體操作要求調(diào)查員在做調(diào)查的時候,必須盡量地把電話號碼等聯(lián)系方式要到,然后從已調(diào)查過的調(diào)查對象中隨機(jī)抽出20%進(jìn)行回訪。(三)拒訪及解決辦法“拒訪”的發(fā)生一方面可能由于調(diào)查對象生病或太忙沒時間等客觀原因,另一方面也可能由于調(diào)查對象對調(diào)查不感興趣或出于安全考慮等主觀原因。從當(dāng)前各種拒訪類型的發(fā)生情況看,拒絕訪問員入戶是比較突出的情況。解決此類“拒訪”的有效解決辦法就是動員政府資源。解決拒訪問題除爭取政府支持外,另一種應(yīng)對辦法是應(yīng)針對戶一級抽樣單位擴(kuò)大樣本量。最后,對于調(diào)查中調(diào)查對象由于不愿回答某些問題,或由于訪問員的原因而拒訪的情況,解決辦法一方面是提高問題的質(zhì)量,合理安排問題的順序,特別是將那些容易引起拒訪的隱私性、敏感性問題盡量放在后面,另一方面則是注意提高訪問員的素質(zhì)。三、無應(yīng)答替換應(yīng)答率也被稱為回答率或調(diào)查回收率。在抽樣調(diào)查中,“應(yīng)答率是評估收集的資

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論