版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、社會調(diào)查研究方法延時符延時符目 錄 第一節(jié)抽樣理論基礎(chǔ) 第二節(jié)隨 機 抽 樣 第三節(jié)非隨機抽樣 第四節(jié)抽樣誤差和樣本規(guī)模第九章社會調(diào)查研究的抽樣設(shè)計延時符第九章社會調(diào)查研究的抽樣設(shè)計 學(xué)習(xí)目標了解抽樣調(diào)查的含義、特點和意義。熟悉抽樣的程序。掌握簡單隨機抽樣、分層抽樣、系統(tǒng)抽樣、整群抽樣和多階段抽樣等隨機抽樣的組織方式。掌握方便抽樣、判斷抽樣、配額抽樣和滾雪球抽樣等非隨機抽樣的組織方式。熟悉抽樣誤差的含義、影響抽樣誤差的因素。掌握抽樣平均誤差的概念和計算。熟悉樣本規(guī)模的含義及影響樣本規(guī)模的因素。掌握確定樣本規(guī)模的計算方法。延時符我國的社會保障統(tǒng)計調(diào)查主要依靠統(tǒng)計報表制度來獲得有關(guān)數(shù)據(jù)。一般認為,
2、社會保障統(tǒng)計指標體系可以包括社會保障業(yè)務(wù)統(tǒng)計指標、社會保障基金支出風(fēng)險因素統(tǒng)計指標以及社會保障效果評價指標三大類指標。雖然統(tǒng)計報表制度對社會保障機構(gòu)業(yè)務(wù)核算資料的統(tǒng)計匯總是有效的,可以在最短的時間內(nèi),以最快捷和最規(guī)范的方式得到每一決策層面所需要的數(shù)據(jù)信息。但統(tǒng)計報表制度也存在著局限性。案例導(dǎo)入我國社會保障領(lǐng)域能否開展抽樣調(diào)查第九章社會調(diào)查研究的抽樣設(shè)計延時符首先,社會保障基金支出風(fēng)險因素的統(tǒng)計調(diào)查對象范圍極為廣泛,若采用統(tǒng)計報表的全面調(diào)查方式則要求各級機構(gòu)配備足夠的人員、設(shè)備與經(jīng)費;由于經(jīng)濟活躍造成調(diào)查對象流動性大,對其進行逐一調(diào)查是不現(xiàn)實的;而且統(tǒng)計報表制度無法收集社會保障主觀評價指標的相關(guān)
3、數(shù)據(jù)。其次,統(tǒng)計報表制度的靈活性差,表式變動周期很長,難于適應(yīng)社會保障理論的發(fā)展,從而使得統(tǒng)計報表制度涵蓋的資料很不全面。再者統(tǒng)計報表制度的信息流程經(jīng)歷環(huán)節(jié)多,被人為因素干擾和加工出錯的可能性很大,其原始數(shù)據(jù)往往因為基層統(tǒng)計工作人員的素質(zhì)不高、對社會保障有關(guān)指標的內(nèi)涵和外延的把握不準,而導(dǎo)致其質(zhì)量難以保證。第九章社會調(diào)查研究的抽樣設(shè)計延時符鑒于上述統(tǒng)計報表制度的局限性,在對社會保障基金支出風(fēng)險因素統(tǒng)計指標和主觀評價指標的調(diào)查中使用抽樣調(diào)查技術(shù)是十分必要的。抽樣調(diào)查比全面調(diào)查更節(jié)約人力和費用、縮短了調(diào)查周期,可獲得許多全面調(diào)查所無法獲得的信息,經(jīng)過科學(xué)設(shè)計、精心組織的抽樣調(diào)查可以取得精確度很高的
4、結(jié)果;另外,統(tǒng)計部門采用抽樣調(diào)查方法,還可減少搜集報表資料的中間環(huán)節(jié),從而有利于消除統(tǒng)計誤差和人為干擾現(xiàn)象,并可以檢驗報表數(shù)據(jù)的準確性。第九章社會調(diào)查研究的抽樣設(shè)計延時符抽樣調(diào)查的前提條件是有可以利用的抽樣框。而我國現(xiàn)有的統(tǒng)計調(diào)查體系,如工農(nóng)業(yè)普查、人口普查及社會保障統(tǒng)計報表制度為開展調(diào)查提供了眾多基礎(chǔ)單位的資料,便于建立社會保障抽樣調(diào)查的抽樣框;同時還為其提供了各種分組資料和輔助信息,對提高抽樣估計精度有很大的幫助。因此,在社會保障統(tǒng)計調(diào)查領(lǐng)域采用抽樣調(diào)查技術(shù)是可行的。有學(xué)者還提出了具體的抽樣方案:在社會保障抽樣調(diào)查中可以結(jié)合使用多階段抽樣、整群抽樣及分層抽樣技術(shù)。第九章社會調(diào)查研究的抽樣設(shè)
5、計延時符與社會保障領(lǐng)域的統(tǒng)計調(diào)查工作者一樣,在很多情形下,社會調(diào)查研究者希望對某一社會現(xiàn)象的總體進行描述和研究,如果對這些總體中的每個個體進行調(diào)查,雖然是最為全面的,但卻是不現(xiàn)實的。因此,調(diào)查研究者只需要調(diào)查總體中的一部分單位就能夠把握總體的情況就成為一種經(jīng)濟而有效的調(diào)查手段。經(jīng)過長期的探索和實踐,社會調(diào)查研究者充分地借助了在概率論和數(shù)理統(tǒng)計基礎(chǔ)上發(fā)展起來的抽樣理論和方法,使自己的研究能適應(yīng)當(dāng)代社會高異質(zhì)性、高變動性、高流動性的現(xiàn)實。本章將對抽樣的理論基礎(chǔ)、隨機抽樣、非隨機抽樣、抽樣誤差和樣本規(guī)模的確定進行詳細介紹。第九章社會調(diào)查研究的抽樣設(shè)計延時符第一節(jié)抽樣理論基礎(chǔ) 抽樣調(diào)查的含義與特點 一
6、、抽樣調(diào)查的含義可以有廣義和狹義兩種理解。按照廣義的理解,凡是抽取一部分單位進行觀察,并根據(jù)觀察結(jié)果來推斷全體的都是抽樣調(diào)查。廣義的抽樣調(diào)查可分為非隨機抽樣和隨機抽樣兩種。非隨機抽樣就是由調(diào)查研究者根據(jù)自己的認識和判斷,選取若干個有代表性的單位,根據(jù)這些單位進行觀察的結(jié)果來推斷全體,如民意測驗等。延時符第一節(jié)抽樣理論基礎(chǔ)隨機抽樣則是根據(jù)大數(shù)定律的要求,在抽取調(diào)查單位時,保證總體中各個單位都有同等的機會被抽中。由于推斷統(tǒng)計的理論和方法完全是建立在隨機抽樣的基礎(chǔ)上的,所以一般所講的抽樣調(diào)查大多數(shù)是指這種隨機抽樣,即狹義的抽樣調(diào)查。嚴格意義上的抽樣調(diào)查就是:按照隨機原則從總體中抽取一部分單位進行觀察
7、,并運用數(shù)理統(tǒng)計的原理,以被抽取的那部分單位的數(shù)量特征為代表,對總體做出數(shù)量上的推斷分析。與普查等其他統(tǒng)計調(diào)查方法相比,抽樣調(diào)查的特點體現(xiàn)在以下4個方面:延時符第一節(jié)抽樣理論基礎(chǔ) 1.抽樣調(diào)查按隨機原則抽取調(diào)查單位所謂隨機原則就是在抽樣時完全不受人的主觀意志的影響,排除主觀意識的干擾,使總體中的每個單位或每個抽樣單位都有相等的機會被抽中。抽樣時只有遵循隨機原則,才能保證樣本與總體有相似的結(jié)構(gòu),或者說有相似的分布,從而使樣本能較好地代表總體,對估計的精確度和可靠程度進行數(shù)理推斷。按隨機原則抽樣是抽樣調(diào)查科學(xué)性的先決條件,也是其與其他非全面調(diào)查(如重點調(diào)查和典型調(diào)查)的主要區(qū)別之一。延時符第一節(jié)抽
8、樣理論基礎(chǔ) 2.抽樣調(diào)查用部分單位的指標數(shù)值推斷和估計總體指標數(shù)值抽樣調(diào)查是一種非全面調(diào)查,但其目的在于推斷總體,即以樣本數(shù)據(jù)估計總體數(shù)量特征,從而達到對總體的認識。這與其他統(tǒng)計調(diào)查明顯不同:普查也可以認識總體,但它是全面調(diào)查,調(diào)查總體包含所有的單位。重點調(diào)查和典型調(diào)查雖然是非全面調(diào)查,但由于抽樣并非按照隨機原則,樣本對總體缺少代表性,因此它們一般不能用來推斷總體。相比之下,抽樣調(diào)查既能有非全面調(diào)查省時、省力、快捷的優(yōu)點,又能滿足對總體全面情況認識的要求。延時符第一節(jié)抽樣理論基礎(chǔ) 3.抽樣調(diào)查的誤差可以事先計算并加以控制在抽樣調(diào)查中,用樣本指標去估計相應(yīng)的總體指標是有誤差的,這一點與其他的非全
9、面調(diào)查并沒有什么區(qū)別。抽樣調(diào)查的結(jié)果必然存在抽樣誤差,這是由抽樣方法本身所決定的。但不同的是,抽樣調(diào)查的誤差可以事先計算出來,并且可以通過擴充樣本容量、采用更適當(dāng)?shù)某闃咏M織方式等一系列措施來控制其誤差范圍,同時還可以保證抽樣調(diào)查的結(jié)果達到所要求的可靠程度,這是任何其他估算方法所辦不到的。延時符第一節(jié)抽樣理論基礎(chǔ) 4.抽樣調(diào)查的結(jié)果可能比全面調(diào)查更準確理解這一特點必須從統(tǒng)計誤差的來源說起。統(tǒng)計誤差是指統(tǒng)計調(diào)查的資料結(jié)果與客觀實際數(shù)量之間的差別。統(tǒng)計誤差有兩個來源:一是登記誤差;二是代表性誤差。所謂登記誤差是指在調(diào)查登記、匯總計算過程中發(fā)生的誤差,這種誤差是應(yīng)該設(shè)法避免的。所謂代表性誤差是指用部分
10、單位的統(tǒng)計數(shù)字為代表,去推斷總體的全面數(shù)字時所產(chǎn)生的誤差,只要是非全面的調(diào)查,這種誤差就一定會發(fā)生,不可避免。延時符第一節(jié)抽樣理論基礎(chǔ)進一步說,代表性誤差又分為兩類:一類是系統(tǒng)性誤差;另一類是隨機誤差。系統(tǒng)性誤差,即由于違反抽樣調(diào)查的隨機原則而產(chǎn)生的代表性誤差,如在抽選樣本單位時帶有主觀色彩而產(chǎn)生的系統(tǒng)性的偏差。系統(tǒng)性誤差可以通過嚴格遵循隨機的原則抽選樣本單位得以消除。隨機誤差則是由于抽樣的隨機性或偶然性產(chǎn)生的代表性誤差,這是抽樣調(diào)查本身所固有的、無法避免的誤差。雖然隨機誤差無法消除,但可利用數(shù)理統(tǒng)計的原理精確地計算,并通過抽樣設(shè)計程序加以控制。延時符第一節(jié)抽樣理論基礎(chǔ) 全面調(diào)查只可能有登記誤
11、差而沒有代表性誤差。抽樣調(diào)查則兩種誤差全可能存在。但是,當(dāng)全面調(diào)查的登記誤差大于抽樣調(diào)查的登記誤差和代表性誤差之和時,抽樣調(diào)查的結(jié)果反而比全面調(diào)查更準確。延時符第一節(jié)抽樣理論基礎(chǔ) 抽樣調(diào)查的意義 二、在現(xiàn)代社會中,由于人們越來越講究科學(xué),越來越講究定量,抽樣調(diào)查的作用也就越來越顯著。從其適用性來看,抽樣調(diào)查的意義主要反映在以下5點:延時符第一節(jié)抽樣理論基礎(chǔ) 1.抽樣調(diào)查在某些情況下可替代全面調(diào)查有些總體從理論上講可以進行全面調(diào)查,但實際上辦不到或不必要,這時可以采用抽樣調(diào)查。例如,要開展民意調(diào)查就不大可能進行普遍調(diào)查,只能根據(jù)定的抽樣方式隨機抽取一部分人進行抽樣調(diào)查,來推論和說明該地區(qū)群眾對實
12、施某一政策的態(tài)度。對于同質(zhì)性較強、差異不大的研究總體,沒有必要進行普遍調(diào)查就能了解全面情況時,可以采取抽樣調(diào)查。延時符第一節(jié)抽樣理論基礎(chǔ)當(dāng)人力、財力、物力和時間等不允許開展全面調(diào)查,但又要了解總體的一般情況,且允許誤差可以放寬時,就應(yīng)當(dāng)開展抽樣調(diào)查。現(xiàn)在許多研究課題由于人力、物力和財力有限,要在較大范圍內(nèi)開展普遍調(diào)查是有難處的。例如,某地為加強環(huán)境保護,加強水質(zhì)監(jiān)測,考察該地區(qū)河水中某種污染物質(zhì)是否超標。顯然對該地區(qū)的河水進行全部檢驗是不可能的,只能從河水中按照一定地點定時取樣檢驗,根據(jù)檢驗結(jié)果推斷整個地區(qū)河水中污染物是否超標。延時符第一節(jié)抽樣理論基礎(chǔ) 1984年11月,羅納德里根以59%比4
13、1%的優(yōu)勢當(dāng)選為美國新一任總統(tǒng)。在正式投票選舉的前夕,一些政治民意測驗機構(gòu)就已經(jīng)根據(jù)他們抽樣的結(jié)果預(yù)言了里根的勝利。表9-1就是美國的一些全國性的民意測驗機構(gòu)在當(dāng)年10月底和11月初所做出的預(yù)測結(jié)果。經(jīng)典案例美國總統(tǒng)選舉中的民意測驗延時符第一節(jié)抽樣理論基礎(chǔ)從表9-1中可以看出,盡管各種民意測驗的結(jié)果并不相同,但是,它們都正確地預(yù)言了誰將獲勝,其預(yù)言的結(jié)果基本上都緊緊圍繞在實際投票結(jié)果的周圍。難以想象的是,在將近1億的美國選民中,它的調(diào)查對象還不到2 000人。這就是抽樣所具有的力量和效率。延時符第一節(jié)抽樣理論基礎(chǔ) 2.抽樣調(diào)查可以對全面調(diào)查的資料進行驗證和修正由于全面調(diào)查面廣、量大,容易受多種
14、主觀和客觀因素的影響,在調(diào)查登記和匯總整理過程中容易發(fā)生差錯。所以特別是在進行各種普查以后,都有必要通過抽樣調(diào)查進行復(fù)查,對普查資料的可靠性、精確性做出正確的估計,對普查總數(shù)進行修正,以便得出更為精確、更接近實際的數(shù)字。有的普遍調(diào)查需要花費較多的人力、物力、財力,通常要若干年才能進行一次。但是在上一次普遍調(diào)查完成后而下一次普遍調(diào)查尚未開展的期間內(nèi),許多資料就會變得陳舊,這時,就需要通過抽樣調(diào)查進行補充和修正。延時符第一節(jié)抽樣理論基礎(chǔ) 3.抽樣調(diào)查可以解決破壞性試驗的問題有些事物在測量或試驗時有破壞性,因而不可能進行全面調(diào)查。例如,燈泡耐用時間試驗,電視機抗震能力試驗,罐頭食品的衛(wèi)生檢查,人體白
15、細胞數(shù)量的化驗等,都是有破壞性的,不可能進行全面調(diào)查,而只能使用抽樣調(diào)查的方法。又如,某水泥廠加強產(chǎn)品質(zhì)量控制和管理,需考察水泥標號是否達到規(guī)定標準,其方法是將水泥做成試塊進行耐壓試驗。由于這種試驗是一種破壞性試驗,顯然不能把全部水泥都做成試塊,只能從全部水泥中抽取一部分進行試驗。延時符第一節(jié)抽樣理論基礎(chǔ) 4.抽樣調(diào)查可以用于工業(yè)生產(chǎn)過程中的質(zhì)量控制抽樣調(diào)查不但廣泛用于生產(chǎn)結(jié)果的核算和估計,而且也有效地應(yīng)用于對成批或大量連續(xù)生產(chǎn)的工業(yè)產(chǎn)品在生產(chǎn)過程中進行質(zhì)量控制,檢查生產(chǎn)過程是否正常,及時提供有關(guān)信息,便于采取措施,預(yù)防廢品的發(fā)生。延時符第一節(jié)抽樣理論基礎(chǔ) 5.抽樣調(diào)查可以用來對某種總體的假設(shè)
16、進行檢驗利用推斷統(tǒng)計的原理,可以對某些總體的假設(shè)進行檢驗,來判別這種假設(shè)的真?zhèn)危詻Q定行動的取舍。例如,新教學(xué)法的采用、新工藝和新技術(shù)的改革、新醫(yī)療方法的使用等是否收到明顯的效果,須對未知的或不完全知道的總體做出一些假設(shè),然后利用抽樣調(diào)查的方法根據(jù)實驗數(shù)據(jù)對所做的假設(shè)進行檢驗,最終做出判斷。延時符第一節(jié)抽樣理論基礎(chǔ)總之,抽樣調(diào)查是一種科學(xué)實用的方法,目前它越來越多地應(yīng)用于社會經(jīng)濟現(xiàn)象數(shù)量方面的研究。隨著抽樣理論的發(fā)展、抽樣技術(shù)的完善、社會調(diào)查研究人員的業(yè)務(wù)水平的提高,抽樣調(diào)查在社會經(jīng)濟統(tǒng)計中的應(yīng)用將會更加普及。雖然抽樣調(diào)查具有上述重要的作用,但是抽樣調(diào)查也有其自身的短處。例如,它只能提供說明整
17、個總體情況的統(tǒng)計資料,而不能提供說明總體各部分狀況的詳細的統(tǒng)計資料,另外,抽樣調(diào)查也很難提供各種詳細分類的統(tǒng)計資料。因此,抽樣調(diào)查和全面調(diào)查是不能互相代替的,它們在認識上的作用是相輔相成的。延時符第一節(jié)抽樣理論基礎(chǔ) 抽樣的程序 三、抽樣的程序分為定義總體、制定抽樣框、選定抽樣方法、確定樣本規(guī)模、制訂抽樣計劃、選擇樣本單位6個步驟,如圖9-1所示。圖9-1 抽樣程序延時符第一節(jié)抽樣理論基礎(chǔ) (一)定義總體總體(population)也稱全及總體,是指由具有某種特定性質(zhì)的許多個別事物組成的整體,也就是所要調(diào)查研究的現(xiàn)象的全體。組成總體的每個個別事物叫總體單位,總體單位數(shù)通常用N表示。例如,某高校有
18、兩萬名在校學(xué)生,現(xiàn)對該校的所有在校學(xué)生進行一次抽樣調(diào)查,則該高校的兩萬名學(xué)生就構(gòu)成這次調(diào)查的總體。再如,要研究某城市國有企業(yè)中層管理退休人員的生活水平,則該城市國有企業(yè)的全部中層管理退休人員就構(gòu)成了調(diào)查的總體。延時符第一節(jié)抽樣理論基礎(chǔ)界定總體就是在具體抽樣前對從中抽取樣本的總體的范圍與界限做出明確的界定。這是由抽樣調(diào)查的目的所決定的。因為抽樣調(diào)查雖然只對總體中的一部分對象實施調(diào)查,但其目的卻是要描述和認識總體的狀況和特征,發(fā)現(xiàn)總體中存在的規(guī)律性,因此必須事先明確總體的范圍。另外,這樣做也是達到良好的抽樣效果的前提條件。如果不清楚明確地界定總體的范圍與界限.那么即使采用嚴格的抽樣方法,也可能只會
19、抽出對總體嚴重缺乏代表性的樣本來。延時符第一節(jié)抽樣理論基礎(chǔ) (二)制定抽樣框這一步驟的任務(wù)就是依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并通過對名單進行統(tǒng)一編號來建立起供抽樣使用的抽樣框。當(dāng)調(diào)查目標確定后,所要研究的對象(總體)也就隨之確定了;確定了總體,理論上的抽樣范圍也就被確定下來。但是,實際進行抽樣的總體范圍與目標總體有時是不一致的。延時符第一節(jié)抽樣理論基礎(chǔ)例如,要對某超市的顧客滿意度進行調(diào)查研究,總體就是該超市的所有顧客。可是,要想找到這個超市的所有顧客并從中抽樣在現(xiàn)實工作中卻很難做到,有時甚至是不可能完成的任務(wù)。所以,有了總體,還必須明確實際進行抽樣的總體范圍和抽樣單
20、位,這就需要編制一個抽樣框。抽樣框(sampling frame)又稱抽樣結(jié)構(gòu),是包括全部抽樣單位的名單框架,也就是對可以選擇作為樣本的總體單位列出名冊或排序編號,以確定總體的抽樣范圍和結(jié)構(gòu)。抽樣框會直接影響到抽樣的隨機性和抽樣調(diào)查的效果。延時符第一節(jié)抽樣理論基礎(chǔ) 1.名錄抽樣框名錄抽樣框,即列出全部總體單位的名錄一覽表。名錄抽樣框可取自各種不同的來源。各級政府機構(gòu)因各自的管理目的都保存一些名錄,它們是設(shè)計抽樣框最有效的資料來源。這類名錄抽樣框有:生命統(tǒng)計登記,即總體中所有關(guān)于出生和死亡的記錄(由當(dāng)?shù)毓簿质占?;商業(yè)注冊,即所有正在經(jīng)營的公司及企業(yè)的名錄(由工商行政管理部門收集);使用各種行
21、政來源構(gòu)造抽樣框時必須考慮成本、覆蓋范圍、更新速度、信息來源的穩(wěn)定性、定義、質(zhì)量、合法且正式的關(guān)系、文檔保存等因素。延時符第一節(jié)抽樣理論基礎(chǔ) 2.區(qū)域抽樣框區(qū)域抽樣框,即按地理位置將總體范圍劃分為若干小區(qū)域,以小區(qū)域為抽樣單位。下列兩種情況適合采用區(qū)域抽樣框:一是調(diào)查具有地理性質(zhì);二是沒有合適的名錄抽樣框,需要借助區(qū)域抽樣框來構(gòu)造名錄抽樣框。例如,某項調(diào)查需在某個城市抽取住戶,但沒有該城市最新的住戶名錄。此時,統(tǒng)計調(diào)查機構(gòu)可以用區(qū)域抽樣框抽取地理區(qū)域,如街區(qū),然后由調(diào)查者列出每個被抽中街區(qū)中的全部住戶名單。這種方法將對住戶的抽樣集中于數(shù)量有限的區(qū)域,從而可以較為經(jīng)濟地進行調(diào)查。延時符第一節(jié)抽樣
22、理論基礎(chǔ) 3.時間表抽樣框時間表抽樣框,即將全部總體單位按時間順序排列,把總體的時間過程分為若干小的時間單位,以此時間單位為抽樣單位。例如,對流水線上連續(xù)24小時生產(chǎn)的產(chǎn)品進行質(zhì)量抽查時,以每10分鐘為一個抽樣單位,可將全部產(chǎn)品分為144個抽樣單位并按時間順序排列。設(shè)計出了抽樣框后,便可根據(jù)一定的抽樣方法來抽選必要數(shù)目的樣本單位。若沒有抽樣框,則不能計算樣本單位入樣的概率,從而也就無法進行概率選樣。延時符第一節(jié)抽樣理論基礎(chǔ)在抽樣框中,應(yīng)該包括下列項目中的一部分或全部項目:識別資料,用來識別抽樣框中某個單元的項目,如姓名、身份證號等;聯(lián)系資料,用來尋找某一單元的項目,如電話號碼;分類資料,用于分
23、類抽選的項目,如性別;維護資料,某項調(diào)查研究需重復(fù)進行時所要求的項目,如附加的資料、變更的資料;連接資料,將抽樣框中的單位與其他最新數(shù)據(jù)來源連接起來、對抽樣框進行更新的項目,如年份。前兩個項目是進行抽樣調(diào)查所必需的,后三個項目則有助于提高調(diào)查的效率和質(zhì)量。延時符第一節(jié)抽樣理論基礎(chǔ) (三)選定抽樣方法對于各種不同研究目的、不同調(diào)查范圍、不同調(diào)查對象和不同客觀條件的社會調(diào)查研究來說,所適用的抽樣方法也不一樣。這就需要在具體實施抽樣之前,依據(jù)研究的目的要求、各種抽樣方法的優(yōu)、缺點及其他有關(guān)因素來決定具體抽樣方法的選取。抽樣方法有很多,概括而言,主要是在3個方面進行選擇:隨機與非隨機抽樣;具體的抽樣組
24、織方式;重復(fù)抽樣與不重復(fù)抽樣。延時符第一節(jié)抽樣理論基礎(chǔ) 1.隨機抽樣和非隨機抽樣如前所述,隨機抽樣是指按照隨機原則從總體中抽取部分單位作為樣本的抽樣方法。其特點是:總體中的每一個單位都有已知的概率或可能性入樣;每一個被抽中入樣的單位都是在沒有人為因素的作用下根據(jù)隨機原則選定的。非隨機抽樣則是指不按照隨機原則抽取樣本單位的方法。其特點為簡單、靈活、省費用,但可能會存在較嚴重的選擇誤差。因為調(diào)查者在選擇樣本單位時有較大的靈活性,所以他們往往避難就易,比如傾向于選擇那些看起來比較容易接觸的人,這樣就會使調(diào)查研究結(jié)果存在較大的偏差。延時符第一節(jié)抽樣理論基礎(chǔ)(1)收集信息的目的。(2)對抽樣誤差的容忍度
25、。(3)總體單位之間的變異程度。延時符第一節(jié)抽樣理論基礎(chǔ) 2.具體的抽樣組織方式隨機抽樣和非隨機抽樣各自又有多種具體的抽樣組織方式。如圖9-2所示,隨機抽樣的主要組織方式有簡單隨機抽樣、分層抽樣、系統(tǒng)抽樣、整群抽樣和多階段抽樣;非隨機抽樣的主要組織方式有方便抽樣、判斷抽樣、配額抽樣和滾雪球抽樣。圖9-2 主要的抽樣方法延時符第一節(jié)抽樣理論基礎(chǔ) 3.重復(fù)抽樣與不重復(fù)抽樣所謂重復(fù)抽樣(又稱放回抽樣)是指從總體中隨機抽選一個樣本單位以后,登記完畢再把它放回去,下一次仍從全及總體中抽選。每次都從N個總體單位中抽選,同一單位有多次重復(fù)中選的可能。所謂不重復(fù)抽樣(又稱不放回抽樣)是指從總體中隨機抽選一個樣
26、本單位后,不再放回去,下次抽選是從剩下的總體單位中隨機抽取。每個總體單位只有被抽中一次的可能,不會被重復(fù)抽選出來。經(jīng)過連續(xù)n次不重復(fù)抽選單位構(gòu)成樣本,實質(zhì)上相當(dāng)于一次性同時從總體中抽中n個單位構(gòu)成樣本。在實際抽樣中大多采用不重復(fù)抽樣。延時符第一節(jié)抽樣理論基礎(chǔ)樣本單位被抽選的概率受到重復(fù)抽樣和不重復(fù)抽樣的影響。不僅如此,重復(fù)抽樣和不重復(fù)抽樣條件下抽樣誤差的大小及抽樣平均誤差的計算公式也是不同的。在其他條件一樣的情況下,不重復(fù)抽樣的抽樣誤差比重復(fù)抽樣的小。延時符第一節(jié)抽樣理論基礎(chǔ) (四)確定樣本規(guī)模樣本規(guī)模又稱為樣本容量(簡稱樣本量),是指樣本中包含樣本單位的數(shù)目。應(yīng)用非隨機抽樣,樣本容量的大小由
27、研究人員根據(jù)經(jīng)驗和主觀判斷決定;應(yīng)用隨機抽樣,樣本容量的大小則要使用數(shù)理統(tǒng)計的方法根據(jù)決策對于信息準確性和可靠程度的要求計算得出。本章第四節(jié)將專門講解隨機抽樣時影響樣本規(guī)模大小的主要因素及確定樣本規(guī)模的計算問題。延時符第一節(jié)抽樣理論基礎(chǔ) (五)制訂抽樣計劃抽樣計劃需要詳細說明如何做出和執(zhí)行抽樣的每一項決定。除了逐個說明前面四個步驟的有關(guān)問題外,還要對抽樣的具體實施步驟加以規(guī)定和說明。例如,當(dāng)進行人員訪問的問卷調(diào)查時,如果調(diào)查對象不在家該怎么辦?能否找人替代?如果能,替代者應(yīng)該具有什么特性?如果不能,是否需要再訪?如果需要再訪,什么時間比較合適?對于這一類問題,抽樣計劃都應(yīng)該給予具體規(guī)定。制定抽
28、樣計劃時,要盡量設(shè)想到可能出現(xiàn)的各種特殊情況,統(tǒng)一規(guī)定解決問題的辦法,這樣可以使調(diào)查研究人員有據(jù)可依,減少抽樣誤差。延時符第一節(jié)抽樣理論基礎(chǔ) (六)選擇樣本單位這是抽樣程序的最后一步,這一步完全由調(diào)查者完成。選擇樣本單位的工作量很大,所需費用最多,會遇到許多特殊情況,對于人員訪問的問卷調(diào)查更是如此。雖然抽樣計劃對樣本單位的選擇做了細節(jié)上的規(guī)定,但調(diào)查者并非總是按照計劃執(zhí)行的。他們有時圖方便或出于其他方面的考慮,可能會擅自改變計劃,從而給調(diào)查結(jié)果帶來誤差。能否取得真實可靠的數(shù)據(jù),很大程度上取決于這一步的工作質(zhì)量。延時符第一節(jié)抽樣理論基礎(chǔ)一般情況下,樣本的抽出并非抽樣過程的結(jié)束。抽樣程序?qū)嶋H上還應(yīng)
29、包括樣本抽出后對樣本進行的評估工作。所謂樣本評估,就是對樣本的質(zhì)量、代表性、偏差等進行初步的檢驗和衡量,其目的是防止由于樣本的偏差過大而導(dǎo)致的失誤。評估樣本的基本方法是將可得到的反映總體中某些重要特征及其分布的資料與樣本中的同類指標的資料進行對比,若兩者之間的差別很小,則可認為樣本的質(zhì)量較高、代表性較大,反之,若兩者之間的差別十分明顯,那么樣本的質(zhì)量和代表性就一定不會很高。延時符第一節(jié)抽樣理論基礎(chǔ)例如,如果我們從一所有20 000名學(xué)生的大學(xué)中抽取1 000名學(xué)生作為樣本,同時,我們從學(xué)校有關(guān)部門得到下列統(tǒng)計資料:全校男生占學(xué)生總數(shù)67%,女生占33%;本省學(xué)生占學(xué)生總數(shù)74%,外省學(xué)生占26
30、%。那么,我們可以對抽出的1 000名學(xué)生進行這兩方面情況的統(tǒng)計。假定樣本得到的結(jié)果為:男生占69%,女生占31%;本省學(xué)生占73%,外省學(xué)生占27%。兩相對比,不難發(fā)現(xiàn)兩者之間的差距很小,它在一定程度上說明樣本的質(zhì)量和代表性較高。從這樣的樣本中得到的結(jié)果就能較好地反映和體現(xiàn)總體的情況。當(dāng)然,用來進行對比的指標越多越好,各種指標對比的結(jié)果越接近越好。延時符第二節(jié)隨 機 抽 樣 作為抽樣調(diào)查的一種主要抽樣方法,隨機抽樣常用的抽樣組織方式有簡單隨機抽樣、分層抽樣、系統(tǒng)抽樣、整群抽樣和多階段抽樣。延時符第二節(jié)隨 機 抽 樣 簡單隨機抽樣 一、簡單隨機抽樣(simple random sampling
31、)也稱為純隨機抽樣,是對總體不做任何分類、分層、分群或排隊處理,而是完全按照隨機的原則,從總體中抽出若干個體組成一個隨機樣本的抽樣方式。簡單隨機抽樣需要保證總體的每個單位都有同等的機會入選樣本,而且每個單位的抽取都是相互獨立的。簡單隨機抽樣是最基本的抽樣方式,其他各種抽樣方式都是以簡單隨機抽樣為基礎(chǔ)產(chǎn)生的。簡單隨機抽樣分為重復(fù)抽樣和不重復(fù)抽樣兩種方式。在實施簡單隨機抽樣時,通常采用的方法是抽簽法和隨機數(shù)表法。延時符第二節(jié)隨 機 抽 樣 1.抽簽法抽簽法是為所有的總體單位編制簽號,并把簽號寫在紙片(或球)上,摻和均勻后從中抽選,如暗箱摸球開獎等。當(dāng)總體數(shù)目N不大時,可以采用抽簽法。具體操作方法是
32、先用均質(zhì)材料做成N個簽,給每個簽編一個號碼,將這N個簽充分混合,然后一次抽出n個簽;或者每次抽取一個但不放回,再抽另一個直至抽滿n個簽為止。這抽出的n個簽上的號碼就是入樣的單位號碼。延時符第二節(jié)隨 機 抽 樣 2.隨機數(shù)表法雖然抽簽法非常簡單,但當(dāng)N很大時,編制簽號的工作量也很大,而且這些簽也很難混合均勻,這時最常用的方法是利用隨機數(shù)表。隨機數(shù)表是由09的數(shù)字組成的表,表中的數(shù)字是隨機抽取的,排列的順序也是隨機的。下圖是隨機數(shù)表的一部分(見圖9-3)。圖9-3 隨機數(shù)表(部分)延時符第二節(jié)隨 機 抽 樣【例9-1】延時符第二節(jié)隨 機 抽 樣(2)決定從每個數(shù)組中選擇哪幾位數(shù)字。要從隨機數(shù)表的數(shù)
33、組中產(chǎn)生3位數(shù),可以有以下幾種情況:選擇從左到右的前3位數(shù)字;選擇中間的3位數(shù)字;選擇從左到右的后3位數(shù)字。這里的關(guān)鍵是要預(yù)先約定好規(guī)則,然后一直按此規(guī)則行事。本例從方便考慮,選擇數(shù)組從左到右的前3位數(shù)字。(3)確定在表中選擇數(shù)字的順序。選擇數(shù)字時遵循的順序可以隨意確定,如可以順著每一列自上而下或自下而上;也可以順著每一行從左到右或從右到左;還可以順著對角線方向。例如,本例選擇順著每一列自上而下的選取方式,一列選完后,從右邊的一列繼續(xù)自上而下選??;一頁選完后,從下一頁的第一個列繼續(xù)自上而下選取,直到選夠隨機數(shù)為止。延時符第二節(jié)隨 機 抽 樣(4)確定開始選擇的數(shù)組起點??梢蚤]上眼睛用筆隨意在隨
34、機數(shù)表上戳一下,戳中的那個數(shù)組就是開始的數(shù)組。例如,本例隨意戳中的數(shù)組是圖9-3中隨機數(shù)表第2列第3行的5650267107,從左到右前3位數(shù)為565,這樣編號為565的人就被選入樣本了。(5)處理大于總體規(guī)?;蛑貜?fù)的隨機數(shù)。按自上而下的順序,會選到969,但由于總體一共是900人,故編號沒有969,一個簡單的處理辦法是跳過(舍去)這個數(shù),接著選取下一個隨機數(shù)385;再往下選,號碼分別為495,572,169選完第一頁后,接著從第二頁繼續(xù)選,一直選夠80個為止。如果在選擇過程中碰巧選中了兩個相同的隨機數(shù),則應(yīng)跳過(舍去)第二次選中的數(shù)。延時符第二節(jié)隨 機 抽 樣由于許多統(tǒng)計軟件都有產(chǎn)生隨機數(shù)的
35、程序,因此利用計算機產(chǎn)生隨機數(shù)是一種方便、快捷的方法。但必須指出的是,由統(tǒng)計軟件產(chǎn)生的隨機數(shù)是偽隨機數(shù),在通常情況下有循環(huán)周期,故一般無法保證其隨機性。盡管有些統(tǒng)計軟件產(chǎn)生的偽隨機數(shù)有較長的循環(huán)周期,但為了保證抽樣的隨機性,在有條件的情況下,最好還是使用隨機數(shù)表或隨機數(shù)骰子來產(chǎn)生隨機數(shù)。延時符第二節(jié)隨 機 抽 樣從理論上來說,簡單隨機抽樣符合抽樣調(diào)查的隨機原則,有關(guān)抽樣調(diào)查的基本原則和方法,都是在簡單隨機抽樣的基礎(chǔ)上建立的,它是抽樣調(diào)查的基本形式。但在實際應(yīng)用中卻有一定的局限性。例如,當(dāng)全及總體的編號量N極大時,就要事先對每個單位一一加以編號,這是幾乎不可能完成的。特別是對于正在連續(xù)大量生產(chǎn)的
36、工業(yè)產(chǎn)品進行質(zhì)量抽查時,就無法對全部產(chǎn)品進行編號抽樣?;谝陨显颍话阍谌翱傮w單位數(shù)并不太大,而且總體單位之間差異較小的情況下,簡單隨機抽樣方式才變得簡便易行。延時符第二節(jié)隨 機 抽 樣 分層抽樣 二、分層抽樣(stratified sampling)又稱類型抽樣,它是先將總體中的所有單位按某種特征或標志(如性別、年齡、職業(yè)或地域等)劃分成若干類型或?qū)哟?,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機抽樣或系統(tǒng)抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。例如,在某地區(qū)高科技企業(yè)中抽取樣本時,可以先把總體中的各高科技企業(yè)按年銷售額分為高、中、低三大類;然后采用簡單隨機抽樣或系統(tǒng)抽
37、樣的方法,分別從這三大類的企業(yè)中抽取子樣本;最后將這三個子樣本合起來構(gòu)成全體高科技企業(yè)的樣本。在實際運用分層抽樣的方法時,需要考慮以下2個方面的問題:延時符第二節(jié)隨 機 抽 樣 1.分層的標準同一個總體可以按照不同的標準進行分層。在實際抽樣中,通常采用的標準有以下3條:(1)以所要分析和研究的主要變量或相關(guān)的變量作為分層的標準。比如,要研究居民的消費狀況和消費趨向,可以以居民家庭人均收入作為分層標準;又如,要了解不同職業(yè)的人員對社會經(jīng)濟改革的看法,就可以以人們的職業(yè)作為分層的標準。延時符第二節(jié)隨 機 抽 樣(2)以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。例如
38、,在工廠對職工進行調(diào)查,可以以工作性質(zhì)作為分層標準,將全廠職工分為干部、工人、技術(shù)人員、勤雜人員等幾類來進行抽樣。(3)以那些已有明顯層次區(qū)分的變量作為分層變量。例如,性別、年齡、文化程度、職業(yè)等經(jīng)常被用作分層的標準。又如學(xué)生按年級、專業(yè)、學(xué)校類型分層,城市按人口規(guī)模分層等。延時符第二節(jié)隨 機 抽 樣 2.分層的比例分層抽樣中有按比例和不按比例分層抽樣兩種方法。按比例分層抽樣是指按各種類型或?qū)哟沃械膯挝粩?shù)目同總體單位總數(shù)間的比例來抽取子樣本的方法。例如,某廠有工人500人,按性別分層后,有男工400人、女工100人。兩類工人人數(shù)與總體人數(shù)的比例分別為0.8與0.2。因此,若要抽取一個40人的樣
39、本,就要按照各性別的人數(shù)占總?cè)藬?shù)的比例分別從400名男工中隨機抽取32人,從100名女工中隨機抽取8人。這樣,樣本中男、女工人之比才與總體中男女工人之比完全相同。延時符第二節(jié)隨 機 抽 樣【例9-2】延時符第二節(jié)隨 機 抽 樣采取按比例分層抽樣的方法,可以確保得到一個與總體結(jié)構(gòu)完全一樣的樣本。但是在有些情況下,又不宜采用這種方法。例如,有時總體中有的類型或?qū)哟蔚膯挝粩?shù)目太少,若以按比例分層抽樣的方法抽樣,則有的層次在樣本中的單位數(shù)太少,影響樣本的代表性,這時往往要采取不按比例分層抽樣的方法,即在單位數(shù)較少的類型或?qū)哟沃卸喑橐恍鴱膯挝粩?shù)較多的類型或?qū)哟沃猩俪橐恍?。再如,有的類型方差小,而有?/p>
40、類型方差大,可在方差大的類型中多抽一些,方差小的類型中少抽一些。延時符第二節(jié)隨 機 抽 樣分層抽樣的一個優(yōu)點就是在不增加樣本規(guī)模的前提下降低抽樣誤差,提高抽樣的精度??傮w的同質(zhì)性程度越高,樣本就越容易反映和代表總體的特征和面貌;而總體的異質(zhì)性程度越高,樣本對總體的反映和代表就越困難,對抽樣的要求也越高。采用分層抽樣的最基本目的,正在于把異質(zhì)性較強的總體分成一個個同質(zhì)性較強的子總體,以便提高抽樣的效率,達到更好的抽樣效果。延時符第二節(jié)隨 機 抽 樣換言之,通過分層,使得各層內(nèi)總體單位之間的變異程度變小,從而使各個層內(nèi)的方差變?。ū瓤傮w的方差要小)。因此,在樣本規(guī)模相同時,分層抽樣的抽樣誤差往往比
41、簡單隨機抽樣的抽樣誤差要小。分層抽樣方法的另一個優(yōu)點是非常便于調(diào)查者了解總體內(nèi)不同層次的情況,以及對總體中不同的層次進行單獨研究或進行比較。延時符第二節(jié)隨 機 抽 樣 系統(tǒng)抽樣 三、系統(tǒng)抽樣是實際抽樣中經(jīng)常采用的一種方式。系統(tǒng)抽樣(systematic sampling)又稱機械抽樣,即將N個總體單位按一定順序排列,然后先隨機抽取一個單位作為起始單位,再按某種確定的規(guī)則抽取其他n-1個樣本單位。系統(tǒng)抽樣是獨立于簡單隨機抽樣的另一種隨機抽樣方法,其效果與簡單隨機抽樣相近,但操作起來卻容易得多。在系統(tǒng)抽樣中,等間距抽取是最常用的方法,故系統(tǒng)抽樣經(jīng)常被稱為等距抽樣。常用的等距抽樣方法包括直線等距抽樣
42、和循環(huán)等距抽樣,二者的區(qū)別在于總體規(guī)模N是否為樣本規(guī)模n的整數(shù)倍。延時符第二節(jié)隨 機 抽 樣 (一)整數(shù)抽樣間距的系統(tǒng)抽樣當(dāng)N是n的整數(shù)倍,即抽樣間距k=Nn是整數(shù)時,可使用直線等距抽樣,即在算出抽樣間距后,先在1k范圍內(nèi)抽取一個隨機數(shù)r作為起點,然后每隔k個單位抽出一個單位,直到抽出n個單位。抽中單位的號碼分別為不難看出,直線等距抽樣實際上是將N個單位排列成n行k列的矩陣,再從1k列之間隨機地產(chǎn)生一個隨機數(shù)r,則取第r列的全體單位作為樣本。這時每一列被選中的概率是相等的,因此總體中每個單位入樣的概率也是相等的。延時符第二節(jié)隨 機 抽 樣 (二)非整數(shù)抽樣間距的系統(tǒng)抽樣當(dāng)N不是n的整數(shù)倍,即抽
43、樣間距k=Nn不是整數(shù)時,不難看出,這時上述矩陣有些列有n個單位,有些列不足n個單位,若再利用直線等距抽樣就無法保證每個總體單位以相等的概率入樣,為了使樣本均值為無偏估計,可以采用以下2種方法進行抽樣:延時符第二節(jié)隨 機 抽 樣 1.循環(huán)等距抽樣使用循環(huán)等距抽樣,即先將N個總體單位首尾相接排成一個封閉圓,抽樣間距k取最接近Nn的整數(shù),再從1N中隨機抽取一個隨機起點作為起始單位,然后每隔k抽取一個單位,直到抽滿n個單位為止。由于隨機起點是1N中的任意一個,因此每個總體單位入樣的概率是相等的。延時符第二節(jié)隨 機 抽 樣 2.調(diào)整直線等距抽樣使用調(diào)整直線等距抽樣,要先將非整數(shù)的抽樣間距k的小數(shù)點后移
44、1位,使其成為整數(shù)k,然后在10k之間選定一個整數(shù)的隨機起點r;接下來再將r的小數(shù)點移回來,成為非整數(shù)的隨機起點r。由r開始每隔k個單位抽出一個單位,直到抽出n個單位。抽中號碼分別為:r,rk,r(n1)k,接下來再將這些號碼的小數(shù)部分略去,便相應(yīng)地得到入樣單位的號碼。延時符第二節(jié)隨 機 抽 樣 (三)總體單位的排列一般說來,以簡單隨機抽樣為基礎(chǔ)的概率抽樣,在抽取樣本之前都需要對總體單位進行編號,如果總體單位很多,則工作量較大。而使用系統(tǒng)抽樣則無須對總體單位編號,所需要的只是將總體單位按順序排列。不過并非所有的排列順序都能滿足系統(tǒng)抽樣的要求。例如,當(dāng)單位的排列存在周期性的變化時,樣本的代表性就
45、可能很差。與系統(tǒng)抽樣有關(guān)的單位排列大致有以下3種情況:延時符第二節(jié)隨 機 抽 樣 1.總體單位隨機排列按無關(guān)標志排隊即可使總體單位隨機排列。所謂無關(guān)標志排隊就是排隊的標志與所研究的變量沒有直接關(guān)系。例如,調(diào)查個人收入,總體單位是按姓氏筆畫排列的,收入與姓氏筆畫通常是沒有必然聯(lián)系的,這種按照無關(guān)標志排列的總體單位,可以視為是隨機排列的。這種總體單位按隨機順序排列的系統(tǒng)抽樣稱為無序系統(tǒng)抽樣,其效果等價于簡單隨機抽樣。延時符第二節(jié)隨 機 抽 樣 2.總體單位線性趨勢排列總體單位線性趨勢排列,即總體單位按有關(guān)標志排隊。所謂有關(guān)標志排隊就是排隊的標志與所研究的變量線性相關(guān)。例如,調(diào)查家庭消費情況時,家庭
46、是按總收入多少排列的,通常消費與收入是相關(guān)的,故該總體的各個單位是按線性趨勢排列的。對于線性趨勢總體進行系統(tǒng)抽樣稱為有序系統(tǒng)抽樣,其效果優(yōu)于簡單隨機抽樣,但不如分層抽樣效果好。因為分層抽樣在n個層中的抽樣是隨機的,避免了系統(tǒng)抽樣在n次抽樣中單位偏大或偏小的弊病。延時符第二節(jié)隨 機 抽 樣 3.總體單位周期排列總體單位周期排列,即總體單位變量值按其順序呈周期性變化。對于周期排列的總體,系統(tǒng)抽樣的估計效果與抽樣間距及單位變量值的變化周期有關(guān)。當(dāng)抽樣間距等于周期倍數(shù)時,抽到的任意一個樣本單位都有相同的取值,相當(dāng)于從總體中隨機抽取了一個單位,這時樣本的代表性最差。當(dāng)抽樣間距等于半周期倍數(shù)時,大部分情況
47、下,樣本會依次重復(fù)取兩個高低不等的值,系統(tǒng)抽樣會得到無偏的均值估計,樣本的代表性會有所改善。延時符第二節(jié)隨 機 抽 樣而抽樣間距如果不等于周期倍數(shù)或半周期倍數(shù),那么在掌握了總體周期結(jié)構(gòu)的基礎(chǔ)上,選擇合適的抽樣間距,就可以抽到周期排列總體中的大部分變量值,得到代表性較好的樣本。不過如果對總體的周期結(jié)構(gòu)沒有把握時,要么重新排列總體,打亂總體排列的周期性;要么最好放棄系統(tǒng)抽樣,改用簡單隨機抽樣和分層隨機抽樣。延時符第二節(jié)隨 機 抽 樣 整群抽樣 四、整群抽樣(cluster sampling)也叫集團抽樣,它是將總體全部單位分為若干部分(每一部分稱為一個群體,簡稱群),然后按隨機原則從中抽取一部分群
48、體,抽中群體的所有單位構(gòu)成樣本。整群抽樣對抽中群體內(nèi)的所有單位進行全面調(diào)查,而未抽中群體的單位一概不進行調(diào)查。例如,居民家計調(diào)查或人口抽樣調(diào)查常常以一個城市(或街道)的所有住戶或所有人口為一群,并對抽中的住戶或人口進行全面調(diào)查。又如,要從某天8小時內(nèi)生產(chǎn)的產(chǎn)品中抽取1/12進行質(zhì)量檢查,可按5分鐘內(nèi)生產(chǎn)的產(chǎn)品為一群,將全天產(chǎn)品分為96群,再從中隨機抽1/12進行調(diào)查。延時符第二節(jié)隨 機 抽 樣前幾種抽樣的組織方式都是從總體中逐個地抽取調(diào)查單位的,而整群抽樣則是整群地抽取樣本單位。所以,整群抽樣只需對各群體進行編號,而不需要對各總體單位編號,這就大大簡化了抽樣組織工作。并且,由于樣本單位比較集中
49、,便于集中力量去調(diào)查,也利于組織和管理??傊撼闃邮且环N簡單、方便又節(jié)省人力、物力、財力和時間的抽樣組織方式,在實踐中應(yīng)用十分廣泛。延時符第二節(jié)隨 機 抽 樣但也應(yīng)注意到,因為整群抽樣對選中的群內(nèi)的單位實行全面調(diào)查,其樣本的代表性取決于抽中群體對全部群體的代表性。顯然,群體之間的差異越大,樣本代表性越差;反之,群體之間的差異越小,樣本代表性越好。假設(shè)各群體之間沒有差異(即各個群體的內(nèi)部結(jié)構(gòu)完全相同),則樣本必然能夠完全代表總體,即抽樣誤差為0??梢?,整群抽樣的抽樣誤差取決于群體間差異程度的大小,而不受各群體內(nèi)部差異程度的影響。一般而言,在其他條件相同的情況下,整群抽樣的誤差大于簡單隨機抽樣
50、的抽樣誤差。延時符第二節(jié)隨 機 抽 樣整群抽樣對群體的劃分可以是人為的,也可以是自然形成的。例如,高校中學(xué)生分成班級、企業(yè)職工分成班組、企業(yè)生產(chǎn)的產(chǎn)品進行分裝等。自然形成的群體則往往大小不等,如按地區(qū)、街道等劃分居民群體等。當(dāng)群體大小相等或接近時,樣本群體的抽取和參數(shù)估計都比較簡單,當(dāng)群體大小懸殊時,宜采用與群體規(guī)模成比例的不等概率的抽樣方法來抽取樣本群體,其參數(shù)估計的公式也會有所不同。因此,為了方便起見,劃分群體時應(yīng)使各群體所含的總體單位數(shù)盡可能接近或相等。延時符第二節(jié)隨 機 抽 樣 多階段抽樣 五、在整群抽樣中,如果被抽中的群內(nèi)含有太多的次級單元,則對所有抽中的群進行普查工作量就太大了。特
51、別是當(dāng)群內(nèi)次級單元彼此差異不大時,就沒有必要全部調(diào)查。這時可以考慮對被抽到的群中的次級單元再進行一次抽樣,然后對第二次抽到的單元進行調(diào)查,這就是二階段抽樣(two stage sampling)。依此類推,如果不斷地對抽到的單元進行再次抽樣,就會形成三階段、四階段乃至更多階段的抽樣。延時符第二節(jié)隨 機 抽 樣在多階段抽樣中,最初從總體中抽出的群被稱為初級抽樣單位(primary sampling unit,PSU),如果PSU的規(guī)模相等,用簡單隨機抽樣或等距抽樣方法直接進行第二階段的抽樣,這時第二級單位是等概率入樣的,而且樣本規(guī)模是常數(shù)。這個原則也適用于更多階段的抽樣。延時符第二節(jié)隨 機 抽
52、樣問題是如果群的規(guī)模不等,多階段抽樣也存在與整群抽樣類似的樣本規(guī)模隨機變動問題。多階段抽樣樣本中規(guī)模隨機變動的問題很大程度上是由于要保持抽樣的等概率條件,即保持總抽樣比不變產(chǎn)生的。如果不考慮等概率條件,則可以使樣本規(guī)模保持不變。也就是說,要么保持樣本的等概率條件,接受一個規(guī)模不確定的樣本;要么保持樣本規(guī)模不變,放棄樣本等概率條件。由于不等概率樣本需要進行復(fù)雜的加權(quán)處理,故實踐中用得更多的是前一種方式,即保持總抽樣比不變。具體處理方法包括分層多階段等概率抽樣和PPS抽樣。延時符第二節(jié)隨 機 抽 樣 1.分層多階段等概率抽樣在分層多階段等概率抽樣中,需要先將總體中規(guī)模不等的群按規(guī)模(或重要性)分層
53、,然后在不同階段對不同的層使用不同的抽樣比。以兩階段抽樣為例,假設(shè)將總體分為大群、中群、小群三個層。第一階段抽群時,大、中、小三個層的抽樣比fa依次遞減;第二階段抽單位時,大、中、小三個層的抽樣比fb依次遞增。為保證樣本單位等概率入樣,即總的抽樣比f保持不變,可使f=fafb保持不變,則可以進行如表9-2所示的樣本設(shè)計。延時符第二節(jié)隨 機 抽 樣這里fa=1意味著該層中的所有群都入選。例如,在全國抽樣中可將北京、上海、天津、重慶這四個直轄市構(gòu)成一個層,設(shè)定抽樣比為1,即讓這幾個城市直接入樣。fb=1意味著在這個群內(nèi)的所有單位都入樣。不難看出,只要保持各階段抽樣比的積為常數(shù),各階段抽樣比就會有很
54、大的變動余地,而且還可以擴展到三階段以上的抽樣。延時符第二節(jié)隨 機 抽 樣 2. PPS抽樣在PPS抽樣中,第一階段抽樣即抽取PSU的階段,要先放棄等概率抽樣條件,采用概率與規(guī)模成比例(probability proportional to size,PPS)的抽樣方法,即賦予規(guī)模不等的群與其規(guī)模成比例的入樣概率。這樣一來,規(guī)模大的群以大概率入樣,規(guī)模小的群以小概率入樣。因為如果抽取的單位規(guī)模對每個PSU都一樣,那么單位入樣的概率就會與群的規(guī)模成反比。這樣就可以大概率抽取群,小概率抽取樣本單位,一大一小相互抵消,保證了總體單位抽取的等概率性。與此同時,由于不論PSU大小,都抽取固定規(guī)模的樣本單
55、位,于是也控制了樣本規(guī)模的變動。延時符第二節(jié)隨 機 抽 樣延時符第二節(jié)隨 機 抽 樣【例9-3】延時符第二節(jié)隨 機 抽 樣解:(1)計算各居委會所轄家庭數(shù)量占街道家庭總數(shù)的比例并計算累積比例;根據(jù)比例的累計數(shù)依次寫出每一居委會所對應(yīng)的選擇號碼范圍(該范圍的大小等于各居委會規(guī)模所占比例);然后采用隨機數(shù)表的方法選擇號碼,號碼所對應(yīng)的居委會入選第一階段樣本,如表9-4所示。延時符第二節(jié)隨 機 抽 樣(2)在每個被抽中的元素(即居委會)中各隨機抽取100戶家庭組成調(diào)查樣本。延時符第三節(jié)非隨機抽樣在社會調(diào)查研究中,有時采用非隨機抽樣的辦法來抽取樣本。非隨機抽樣不是按照概率均等的原則,而是根據(jù)人們的主觀
56、經(jīng)驗或其他條件來抽取樣本的。因此,其樣本的代表性往往較小,誤差有時相當(dāng)大,而且這種誤差又無法估計。在大規(guī)模的正式研究中,一般很少用非隨機抽樣。只是在探索性調(diào)查中常常使用非隨機抽樣的方法。常用的非隨機抽樣有方便抽樣、判斷抽樣、配額抽樣和滾雪球抽樣。延時符第三節(jié)非隨機抽樣 方便抽樣 一、方便抽樣又稱任意抽樣,是指社會調(diào)查研究人員從工作方便出發(fā),在調(diào)查對象范圍內(nèi)隨意抽選一定數(shù)量的樣本進行調(diào)查。例如,調(diào)查者要對年輕的北京市民的消費傾向做調(diào)查,就可直接選擇同學(xué)或朋友作為訪問對象,立即開展調(diào)查,迅速獲得調(diào)查研究分析所要的資料。這種方法簡便易行,可及時獲得所需資料,節(jié)約時間和費用。方便抽樣有2種常用方法街頭
57、攔人法和空間抽樣法。延時符第三節(jié)非隨機抽樣 1.街頭攔人法使用街頭攔人法時,調(diào)查研究者可在街上或路口任意找某個行人,將他(她)作為調(diào)查對象進行調(diào)查。例如,為了調(diào)查某市的公共交通情況,調(diào)查研究者可在街上尋找過往行人詢問他們對公共交通的看法和態(tài)度。又比如一些調(diào)查者就某些商業(yè)主題在步行街上請行人填寫某種問卷等。延時符第三節(jié)非隨機抽樣 2.空間抽樣法空間抽樣法是對某一聚集的人群從空間的不同方向和角度對他們進行抽樣調(diào)查。例如,在醫(yī)院內(nèi)向顧客詢問對醫(yī)院服務(wù)質(zhì)量的意見,在勞務(wù)市場調(diào)查外來人員務(wù)工情況,在火車站候車室向候車旅客詢問對高鐵服務(wù)的看法等。方便抽樣技術(shù)適用于非正式的探索性調(diào)查,或調(diào)查前的準備工作。一
58、般在調(diào)查總體中每一個體都是同質(zhì)時,才能采用此類方法。但是,實踐中并非所有總體中每一個體都是相同的,所以其抽取的樣本沒有足夠的代表性,抽樣結(jié)果偏差較大。正因為如此,在正式研究時很少采用方便抽樣。延時符第三節(jié)非隨機抽樣 判斷抽樣 二、判斷抽樣是指根據(jù)調(diào)查研究者的主觀判斷進行抽樣,或由該領(lǐng)域內(nèi)有經(jīng)驗的專家選定樣本。判斷抽樣通常有以下2種具體操作辦法:延時符第三節(jié)非隨機抽樣 1.專家判斷由專家判斷選擇樣本單位,一般采用平均型(在調(diào)查總體中挑選代表平均水平的單位作為抽樣對象)或多數(shù)型(在調(diào)查總體中挑選占多數(shù)的單位作為抽樣對象)進行抽樣,從而代表總體進行研究。延時符第三節(jié)非隨機抽樣 2.統(tǒng)計判斷統(tǒng)計判斷是
59、指利用調(diào)查總體的全面統(tǒng)計資料,按照一定的標準選擇樣本的方式。判斷抽樣的優(yōu)點是簡便易行,根據(jù)調(diào)查者的需要來選擇樣本,可充分發(fā)揮調(diào)查者的經(jīng)驗與判斷能力,尤其當(dāng)調(diào)查者對研究總體的情況比較熟悉時,這種方法比較方便、有效。但如果調(diào)查者對研究總體不熟悉,主觀判斷往往容易出現(xiàn)偏差,則樣本的代表性降低,會出現(xiàn)較大的抽樣誤差。延時符第三節(jié)非隨機抽樣 配額抽樣 三、配額抽樣是非隨機抽樣中最流行的一種,配額抽樣類似隨機抽樣中的分層抽樣,它也是首先將總體中的所有單位按一定的標志分為若干類(組),然后在每個類(組)中選取樣本單位的方法。所不同的是,配額抽樣不遵循分層抽樣中的隨機性原則,而是用方便抽樣或判斷抽樣的方法主觀
60、地確定對象分配比例。采用配額抽樣,事先要對總體中所有單位按其屬性、特征分為若干類型。這些屬性、特征稱為控制特征,如調(diào)查對象的姓名、年齡、收入、職業(yè)、文化程度等。然后,按照各個控制特征分配樣本數(shù)額。按照配額的要求不同,配額抽樣可分為獨立控制配額抽樣和交叉控制配額抽樣兩種。延時符第三節(jié)非隨機抽樣 1.獨立控制配額抽樣獨立控制配額抽樣是根據(jù)調(diào)查總體的不同特性,對具有某個特性的調(diào)查樣本分別規(guī)定單獨分配數(shù)額,而不規(guī)定必須同時具有兩種或兩種以上特性的樣本數(shù)額。因此,調(diào)查者就有比較大的自由去選擇總體中的單位。假設(shè)某市進行居民對社區(qū)醫(yī)療需求狀況的調(diào)查,確定樣本量為200名,選擇居民月收入、年齡、性別三個標準分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年車位產(chǎn)權(quán)買賣協(xié)議格式
- 2024年防水施工勞務(wù)協(xié)議規(guī)范化文件
- 2024新疆企業(yè)勞動協(xié)議規(guī)范化樣本
- 2024受托代理事務(wù)協(xié)議樣本
- 2024年專業(yè)運營車輛租賃協(xié)議模板
- DB11∕T 1514-2018 低效果園改造技術(shù)規(guī)范
- 單位廣告策劃與制作服務(wù)協(xié)議范例
- 2024年公司文秘職務(wù)聘用協(xié)議模板
- 2024年企業(yè)員工全日制勞動協(xié)議模板
- 文書模板-《廠房光伏租賃合同》
- VFA的測定方法及標準曲線
- 石灰石粉倉安裝方案
- 重大件船舶概況及集裝箱岸吊的綁扎
- 危大工程管理概述
- 火電廠工藝流程簡介
- 專利管理辦法
- 網(wǎng)絡(luò)環(huán)境下小學(xué)數(shù)學(xué)探究教學(xué)方法分析
- 七年數(shù)學(xué)有理數(shù)培優(yōu)專題(共5頁)
- 往事依依2 (2)
- 初一生活二三事作文
- 課題3 復(fù)卷機控制系統(tǒng)
評論
0/150
提交評論