抽樣調(diào)查內(nèi)容總結(jié)及習(xí)題_第1頁(yè)
抽樣調(diào)查內(nèi)容總結(jié)及習(xí)題_第2頁(yè)
抽樣調(diào)查內(nèi)容總結(jié)及習(xí)題_第3頁(yè)
抽樣調(diào)查內(nèi)容總結(jié)及習(xí)題_第4頁(yè)
抽樣調(diào)查內(nèi)容總結(jié)及習(xí)題_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第一章 緒論一、 概述全面調(diào)查:是針對(duì)總體的每一個(gè)單元都進(jìn)行信息搜集的調(diào)查,又稱(chēng)為普查。普查的前提是下面條件至少有一滿(mǎn)足:(1)要了解的總體信息內(nèi)容相對(duì)比較簡(jiǎn)單,比較容易調(diào)查;(2)要了解的總體內(nèi)容十分重要;(3)不僅要了解總體的信息,還要了解總體的許多分組分類(lèi)的信息;(4)調(diào)查主體有足夠的資金力量和動(dòng)員力量。抽樣調(diào)查:就是按照一定的程序和方法,從總體中根據(jù)隨機(jī)原則抽取一部分單元組成樣本,通過(guò)對(duì)樣本的調(diào)查,獲得樣本資料,計(jì)算出有關(guān)的樣本指標(biāo)(統(tǒng)計(jì)量),依一整套專(zhuān)門(mén)的方法對(duì)相應(yīng)的總體指標(biāo)(參數(shù))作出估計(jì)和推算,并有效控制抽樣誤差的一種統(tǒng)計(jì)方法。抽樣調(diào)查的作用其一,抽樣調(diào)查能夠解決全面調(diào)查所無(wú)法解

2、決的現(xiàn)象的調(diào)查問(wèn)題。在實(shí)際工作中,對(duì)某些現(xiàn)象常??赡芤环矫嫘枰私馄淙媲闆r,另一方面又由于現(xiàn)象自身的特性決定了無(wú)法通過(guò)全面調(diào)查獲取資料。此時(shí),只有使用抽樣調(diào)查。該類(lèi)現(xiàn)象主要有:(1)產(chǎn)品質(zhì)量的破壞性檢驗(yàn)。如輪胎的里程壽命試驗(yàn),青磚的抗折耐壓試驗(yàn),炮彈的殺傷力試驗(yàn),彈簧的抗拉強(qiáng)度試驗(yàn)等等。(2)無(wú)限總體的調(diào)查:無(wú)限總體因其所包含的總體單位數(shù)目是無(wú)限多個(gè),故無(wú)法一一計(jì)量。如宇宙空間的星球數(shù)目、人體的細(xì)胞數(shù)目等等。(3)包括未來(lái)時(shí)序的總體,如生產(chǎn)過(guò)程穩(wěn)定性的檢查等。其二,抽樣調(diào)查適用于對(duì)理論上可以作全面調(diào)查,而實(shí)際上又難以組織全面調(diào)查的現(xiàn)象進(jìn)行調(diào)查。有些現(xiàn)象雖屬于有限總體,但由于其總體范圍過(guò)大,單

3、位數(shù)目過(guò)多且過(guò)于分散,事實(shí)上不可能作全面調(diào)查,如森林的木材蓄積量調(diào)查,大量連續(xù)作業(yè)的某些產(chǎn)品質(zhì)量的非破壞性檢驗(yàn),水稻的個(gè)粒重檢驗(yàn)等等。還有些現(xiàn)象由于受時(shí)間或其他條件的制約,不能組織全面調(diào)查,如戰(zhàn)備物資調(diào)查,自然災(zāi)害造成損失情況的調(diào)查等等。其三,抽樣調(diào)查對(duì)于時(shí)效性要求較高、同時(shí)又可以不作全面調(diào)查的現(xiàn)象的調(diào)查有著特殊的作用。如前所述,抽樣調(diào)查具有費(fèi)用低、速度快、精度高的特點(diǎn),這使得它比其它非全面調(diào)查能更有效地滿(mǎn)足各有關(guān)方面的需要。其四,抽樣調(diào)查的結(jié)果可被用來(lái)檢驗(yàn)和修正全面調(diào)查結(jié)果。任何調(diào)查都可能存在誤差,全面調(diào)查也不例外。而且由于全面調(diào)查涉及面廣、工作量大、參加人員多、匯總傳遞環(huán)節(jié)多、調(diào)查結(jié)果容易

4、出現(xiàn)差錯(cuò)。但是,其差錯(cuò)到底有多大,全面調(diào)查自身無(wú)法回答這一問(wèn)題。因此,可在全面調(diào)查之后再進(jìn)行一次抽樣調(diào)查,根據(jù)抽樣調(diào)查結(jié)果對(duì)全面調(diào)查結(jié)果進(jìn)行檢查和修正,從而提高全面調(diào)查的質(zhì)量。其五,抽樣調(diào)查可對(duì)工業(yè)生產(chǎn)過(guò)程的穩(wěn)定性進(jìn)行監(jiān)測(cè),從而實(shí)現(xiàn)質(zhì)量控制。在工業(yè)產(chǎn)品成批或大量連續(xù)生產(chǎn)過(guò)程中,利用抽樣調(diào)查方法對(duì)產(chǎn)品的質(zhì)量進(jìn)行動(dòng)態(tài)檢測(cè),及時(shí)提供有關(guān)信息,變事后監(jiān)督為事中控制,并通過(guò)編制質(zhì)量控制圖開(kāi)展監(jiān)控,是世界上許多國(guó)家廣泛采用的工業(yè)產(chǎn)品質(zhì)量控制系統(tǒng)。這一應(yīng)用不僅對(duì)于生產(chǎn)過(guò)程的控制意義重大,而且也為進(jìn)一步推廣抽樣調(diào)查,乃至于整個(gè)統(tǒng)計(jì)方法的應(yīng)用,提供了成功的范例,積累了可貴的經(jīng)驗(yàn),并產(chǎn)生了深遠(yuǎn)的影響。本書(shū)第十三章

5、討論了有關(guān)這方面的內(nèi)容。其六,利用抽樣調(diào)查方法還可以對(duì)總體的某些假設(shè)進(jìn)行檢驗(yàn),以判斷這些假設(shè)的真?zhèn)?,為管理決策提供依據(jù)。例如:一種新藥在對(duì)某患者使用后效果不錯(cuò),這是否意味著這種新藥的療效就一定顯著呢?單憑此還不能做出結(jié)論。因?yàn)榀熜?duì)于每個(gè)人常會(huì)受到一些隨機(jī)因素的影響而呈現(xiàn)出一定的不確定性。因此,最好利用抽樣調(diào)查結(jié)果,對(duì)這種藥物的療效是否存在顯著性的統(tǒng)計(jì)差異進(jìn)行檢驗(yàn),以確定其療效狀況,并據(jù)此作出是否推廣使用該藥的決策。利用抽樣調(diào)查方法研究人們未來(lái)的行動(dòng)決策,這是抽樣方法應(yīng)用上的又一重要突破。按抽選樣本的具體原則不同,可以分為概率抽樣和非概率抽樣。概率抽樣 :按照一定概率從構(gòu)成總體的所有單元中隨機(jī)

6、選擇一部分單元進(jìn)入樣本的抽樣方法。概率抽樣有如下特點(diǎn):(1)能夠表明一個(gè)確定的樣本包含哪些單元(2)每個(gè)單元被抽中的概率是已知的,或是可以計(jì)算出來(lái)的(3)以隨機(jī)原則抽取(4)從樣本數(shù)據(jù)估計(jì)總體特征時(shí),需要考慮該樣本被抽中的概率概率抽樣按其組織方式不同,可分成:簡(jiǎn)單隨機(jī)抽樣;分層抽樣;整群抽樣;等距抽樣;多階抽樣;二重抽樣等不同類(lèi)型。有些時(shí)候,概率抽樣在實(shí)際中難以實(shí)現(xiàn),如從海水中抽樣,通常只限于一部分;從運(yùn)煤貨車(chē)中抽樣,一般是從頂部進(jìn)行等。此時(shí),只能采用非概率抽樣。 非概率抽樣也就是非隨機(jī)抽樣,在抽樣過(guò)程中不完全按隨機(jī)原則進(jìn)行,帶有一定的主觀隨意性,所以無(wú)法估計(jì)抽樣誤差,也不能控制抽樣誤差。用非

7、概率抽樣取得的樣本叫做非隨機(jī)樣本。非概率抽樣:指樣本不是按一定的概率抽取,而是由抽樣者主觀抽出或由受訪(fǎng)者自愿進(jìn)入樣本的抽樣方法。非概率抽樣主要包括:隨意抽樣:按抽樣者的方便,隨意地抽取樣本。定額抽樣:依一定的標(biāo)志將總體分成若干層,并按各層在總體中所占的比例分配樣本總量在各層的數(shù)額,以抽到各層所需定額為止。定額抽樣是美國(guó)的蓋洛普(G.H.Gallup)創(chuàng)立的,它是非概率抽樣中比較科學(xué)的一種抽樣方式。判斷抽樣:抽樣者依照自己的經(jīng)驗(yàn)抽取具有平均水平的典型單位作為樣本,因此也叫做典型抽樣。滾雪球抽樣:先從總體中找出少數(shù)個(gè)體,通過(guò)這些個(gè)體了解其它個(gè)體,再由已了解到的個(gè)體去發(fā)現(xiàn)更多的個(gè)體,以此類(lèi)推,了解到

8、的個(gè)體越來(lái)越多,最后接近于總體。隨機(jī)原則就是在抽選調(diào)查單位的過(guò)程中,完全排除人為的主觀因素的干擾,以保證使現(xiàn)象總體中的每一個(gè)個(gè)體都有一定的可能性被選中。換句話(huà)講,哪些單元能夠被選作調(diào)查單位純屬偶然因素的影響所致。這里需說(shuō)明幾點(diǎn):隨機(jī)并非“隨意”。隨機(jī)是有嚴(yán)格的科學(xué)含義的,可用概率來(lái)描述,而“隨便”仍帶有人為的或主觀的因素,它不是一個(gè)科學(xué)的概念;隨機(jī)原則不等于等概率原則;隨機(jī)原則一般要求總體中每個(gè)單元均有一個(gè)非零的概率被抽中;抽樣概率對(duì)總體參數(shù)的估計(jì)有影響。按隨機(jī)原則抽樣的意義:按隨機(jī)原則抽樣可以保證被抽中的單元在總體中均勻分布,不致出現(xiàn)系統(tǒng)性、傾向性偏差;在隨機(jī)原則下,當(dāng)抽樣數(shù)目達(dá)到足夠多時(shí),

9、樣本就會(huì)遵從大數(shù)定律而呈正態(tài)分布,樣本單位的標(biāo)志值才具有代表性,其平均值才會(huì)接近總體平均值;按隨機(jī)原則抽樣,才可能實(shí)現(xiàn)計(jì)算和控制抽樣誤差的目的。因此,隨機(jī)原則是抽樣調(diào)查所必須遵循的基本原則。抽樣調(diào)查作為一種非全面調(diào)查方法,具有一系列特點(diǎn) 首先,按隨機(jī)原則抽選調(diào)查單位是抽樣調(diào)查的一大特色。同屬非全面調(diào)查的典型調(diào)查和重點(diǎn)調(diào)查,在調(diào)查單位的具體選定過(guò)程中,都程度不同地受到了調(diào)查組織者的主觀意識(shí)的影響,因而帶有一定的隨意性,由此使得典型調(diào)查和重點(diǎn)調(diào)查的科學(xué)性受到影響。而抽樣調(diào)查按隨機(jī)原則抽選調(diào)查單位,則完全排除了主觀意識(shí)的干擾,使調(diào)查單位的選擇建立在較為客觀的基礎(chǔ)之上,從而確立了它的科學(xué)性。因此,按隨

10、機(jī)原則抽樣既是抽樣調(diào)查的特色所在,同時(shí)又是其取得成功的基本保證。其次,可以用樣本資料推斷總體資料是抽樣調(diào)查的又一基本特征。由前面的分析可知,用樣本推斷總體是抽樣調(diào)查的一個(gè)重要階段,實(shí)質(zhì)上這也是進(jìn)行抽樣調(diào)查的最終目的之所在。能夠用樣本資料推斷總體資料的重要意義在于,我們可以通過(guò)對(duì)部分單位的調(diào)查,以少量的投入,即可取得以前只能用普查才能取得的同樣的效果,得到所希望了解的現(xiàn)象總體的全面資料,從而節(jié)約大量的調(diào)查費(fèi)用,這也是抽樣調(diào)查得以廣泛應(yīng)用的重要原因之一。其三,抽樣調(diào)查的速度快、周期短、精度高。由于只調(diào)查一部分單位的情況,因此其調(diào)查登記及匯總處理的工作量較之全面調(diào)查要小得多,所需時(shí)間也大大縮短,這為

11、調(diào)查速度的加快創(chuàng)造了十分有利的條件,由此調(diào)查的時(shí)效性得以加強(qiáng)。同時(shí),在調(diào)查單位減少后,由于工作量相應(yīng)地減少,則可以較嚴(yán)格地挑選和培訓(xùn)調(diào)查員,調(diào)查和數(shù)據(jù)處理的質(zhì)量比較容易控制,因此可能取得更準(zhǔn)確的結(jié)果。所以,更能滿(mǎn)足統(tǒng)計(jì)調(diào)查的及時(shí)性和準(zhǔn)確性要求。其四,在抽樣推斷之前可以計(jì)算和控制抽樣誤差。隨著抽樣推斷理論的不斷發(fā)展,誤差分布理論日趨成熟,與此同時(shí),抽樣誤差計(jì)算和控制的方法也逐步得以完善,而且關(guān)于抽樣調(diào)查的誤差問(wèn)題的討論也擴(kuò)展到了對(duì)具有更為廣泛意義的非抽樣誤差的深入研究。這是抽樣調(diào)查的又一重要特色。其五,抽樣技術(shù)靈活多樣。在過(guò)去短短的幾十年時(shí)間里,抽樣調(diào)查在其理論飛速發(fā)展的同時(shí),抽樣技術(shù)也得到了長(zhǎng)

12、足的發(fā)展,至今已形成了較為完整的抽樣技術(shù)體系。各種不同的抽樣技術(shù)可以分別適用于不同現(xiàn)象的抽樣過(guò)程,也可在同一現(xiàn)象的抽樣中結(jié)合運(yùn)用,從而保證獲得最好的抽樣效果。其六,抽樣調(diào)查的應(yīng)用十分廣泛。無(wú)論是對(duì)社會(huì)現(xiàn)象的調(diào)查、還是經(jīng)濟(jì)問(wèn)題的研究,或者是自然現(xiàn)象的了解,都可以使用抽樣調(diào)查方法??梢院敛豢鋸埖刂v,凡是可以運(yùn)用全面調(diào)查的場(chǎng)合,都可以使用抽樣調(diào)查,凡不能使用全面調(diào)查的場(chǎng)合,一般也能利用抽樣調(diào)查方法進(jìn)行調(diào)查研究。抽樣調(diào)查方案的設(shè)計(jì)抽樣調(diào)查是一項(xiàng)理論性和方法性都很強(qiáng)的統(tǒng)計(jì)工作,因此必須精心設(shè)計(jì),認(rèn)真組織,以確保調(diào)查工作的質(zhì)量和時(shí)效性。在抽樣調(diào)查方案的設(shè)計(jì)中,一般應(yīng)遵循以下兩條基本原則:其一,保證抽樣的隨

13、機(jī)性原則。 其二,保證實(shí)現(xiàn)最大的抽樣效果原則。即在一定的調(diào)查費(fèi)用條件下使抽樣誤差最?。ǖ葍r(jià)于使估計(jì)精度最高),或在給定的精度要求下使調(diào)查費(fèi)用最省。此外,一個(gè)好的抽樣調(diào)查方案還必須服從目的性和實(shí)踐性的要求。前者強(qiáng)調(diào)無(wú)論是抽樣還是估計(jì)推斷的設(shè)計(jì),都要緊緊圍繞研究的目的;后者是指所設(shè)計(jì)的方案要能夠在實(shí)踐中得到切實(shí)的執(zhí)行。抽樣調(diào)查方案應(yīng)具有以下幾個(gè)部分:第一,有關(guān)抽樣調(diào)查要求方面的內(nèi)容設(shè)計(jì)。一是要明確調(diào)查目的,即通過(guò)抽樣調(diào)查要解決什么問(wèn)題,并且要將調(diào)查目的進(jìn)一步具體化為所要進(jìn)行推斷的各種變量。這樣,才能恰當(dāng)?shù)卮_定調(diào)查方案的其他內(nèi)容。二是要明確調(diào)查對(duì)象和調(diào)查單位,即確定什么是總體,什么是總體單位,也就是

14、在什么范圍內(nèi)進(jìn)行抽樣調(diào)查,以什么為基本單位進(jìn)行調(diào)查以取得數(shù)據(jù)資料。這是搞好抽樣調(diào)查的基礎(chǔ)。三是要明確規(guī)定對(duì)于主要目標(biāo)量的抽樣推斷精度要求或者誤差控制要求。它既是對(duì)抽樣調(diào)查工作的基本要求,同時(shí)也是衡量抽樣調(diào)查工作質(zhì)量好壞的標(biāo)準(zhǔn)。第二,有關(guān)抽樣推斷工作方面的內(nèi)容設(shè)計(jì)。具體包括:確定抽樣框。在抽樣調(diào)查中,抽樣框是否合適,對(duì)于所抽樣本的代表性影響很大。因此,抽樣前要盡可能多地收集和利用與調(diào)查變量相關(guān)的各種資料,編制出符合實(shí)際情況的抽樣框。確定抽樣的組織方式及方法。不同的抽樣方法、不同的抽樣方式有著各自不同的特點(diǎn)和適應(yīng)性,因此,要根據(jù)所要研究現(xiàn)象的基本特點(diǎn)合理地加以選擇,以求獲得最好的抽樣效果。確定樣本

15、容量的大小,這是抽樣設(shè)計(jì)的主要內(nèi)容之一。樣本容量的確定要綜合考慮兩方面的因素:一是調(diào)查費(fèi)用的多少,它通常限制了所能調(diào)查的最多單元數(shù)目;二是精度要求的高低,它通常是規(guī)定了所必須調(diào)查的最少單元數(shù)目。確定數(shù)據(jù)處理方式。包括數(shù)據(jù)整理方法、整理技術(shù)、資料審核檢驗(yàn)方法等。確定推斷方式。在取得了樣本資料后,運(yùn)用什么樣的方式來(lái)推斷總體資料,如何計(jì)算并控制誤差等就成了關(guān)鍵問(wèn)題,應(yīng)依照調(diào)查研究的具體目的及所選用抽樣方式的特點(diǎn),結(jié)合現(xiàn)象總體的情況加以選擇。第三,有關(guān)調(diào)查內(nèi)容方面的設(shè)計(jì)。調(diào)查內(nèi)容就是所要調(diào)查的項(xiàng)目或問(wèn)題,它是抽樣調(diào)查方案的核心所在。確定選擇哪些項(xiàng)目進(jìn)行調(diào)查,對(duì)于能否圓滿(mǎn)地實(shí)現(xiàn)調(diào)查目的是至關(guān)重要的,具體

16、內(nèi)容在后面有關(guān)章節(jié)做系統(tǒng)介紹。第四,有關(guān)組織工作方面的內(nèi)容設(shè)計(jì)。包括:調(diào)查人員、組織領(lǐng)導(dǎo)機(jī)構(gòu)的確定以及調(diào)查費(fèi)用的籌措等。調(diào)查人員的培訓(xùn)。要使調(diào)查人員在明確調(diào)查目的、熟悉調(diào)查項(xiàng)目的基礎(chǔ)上,根據(jù)分工去掌握有關(guān)的抽樣技術(shù)、現(xiàn)場(chǎng)調(diào)查方法、編碼、審核、數(shù)據(jù)錄入?yún)R總等基本技能。確定搜集資料的具體方法和調(diào)查問(wèn)卷的回收方法等。制定控制回答質(zhì)量,減少回答誤差的方案。二、基本概念總體也叫母體,它是所要認(rèn)識(shí)對(duì)象的全體,是具有同一性質(zhì)的許多單位的集合。組成總體的每個(gè)個(gè)體叫做單位(或單元)。在抽樣以前,必須根據(jù)實(shí)際情況把總體劃分成若干個(gè)互不重疊并且能組合成總體的部分,每個(gè)部分稱(chēng)為一個(gè)抽樣單元,不論總體是否有限,總體中的

17、抽樣單元數(shù)一定是有限的,而且是已知的,因此說(shuō)抽樣調(diào)查的總體總是有限的。抽樣框與抽樣單元:抽樣框是實(shí)際總體的映射總體,其單元滿(mǎn)足:“與實(shí)際總體的每個(gè)單元存在確定的對(duì)應(yīng)關(guān)系,即對(duì)于其每個(gè)單元,憑借這種對(duì)應(yīng)關(guān)系可在實(shí)際總體中找到特定的一個(gè)或一些單元”。構(gòu)成抽樣框的單元稱(chēng)為抽樣單元抽樣框就是一個(gè)目錄性清單 : (1)抽樣框必須是有序的,即抽樣單元(目錄項(xiàng))必須編號(hào),且根據(jù)某種順序排列;(2)抽樣框中包含的單元?jiǎng)?wù)必“不重不漏”。抽樣單元還可以分級(jí)??傮w可以分成若干較大的抽樣單元初級(jí)單元,初級(jí)單元可再分為若干較小的單元,稱(chēng)為次級(jí)單元。如此下去,可定義三級(jí)和四級(jí)單元等。抽樣與樣本: 從總體中隨機(jī)選取部分單元

18、的活動(dòng)稱(chēng)為抽樣;樣本是由從總體中所抽選出來(lái)的若干個(gè)抽樣單元組成的集合體。樣本是總體的縮影,是總體的代表。抽樣的效果好不好,依賴(lài)于樣本對(duì)總體是否有充分的代表性。樣本的代表性愈強(qiáng),用樣本指標(biāo)對(duì)總體全面特征的推斷就愈精確,即推斷的誤差就愈小;反之,如果樣本的代表性愈弱,推斷的誤差就愈大,推斷結(jié)果就愈不可靠。如何增強(qiáng)樣本的代表性,使其能達(dá)到估計(jì)或推斷的預(yù)期效果,就必須分析影響樣本代表性的因素,以便加強(qiáng)控制。一般情況下,影響樣本代表性的因素有以下幾個(gè)方面:(1)總體標(biāo)志值分布的離散程度。若總體標(biāo)志值的分布很集中,即平均離散程度(標(biāo)準(zhǔn)差)很小,從中任抽部分單元做樣本,樣本特征很近似于總體特征,樣本的代表性

19、就強(qiáng);反之,如果標(biāo)志值的分布很分散,即平均離散程度很大,從中抽取樣本單元的隨機(jī)波動(dòng)也很大,必將影響樣本的代表性。(2)抽樣單元數(shù)的多少(或稱(chēng)樣本容量的大小)。抽樣單元數(shù)的多少,影響樣本對(duì)總體的代表性。一般說(shuō)來(lái),樣本容量以大為好,但要根據(jù)實(shí)際情況,以掌握適度為宜,要在保證一定可靠程度的情況下,盡可能滿(mǎn)足及時(shí)性和經(jīng)濟(jì)性的要求,取得好的效益。(3)抽樣方法。抽樣方法一般分為放回抽樣和不放回抽樣。放回抽樣也叫重置抽樣,或重復(fù)抽樣。它是在總體N個(gè)單元中隨機(jī)抽取n個(gè)單元時(shí),每次抽取一個(gè)單元進(jìn)行記錄后又放回原來(lái)的總體,參加下一個(gè)單元的抽取,即下一個(gè)單元仍然在原來(lái)的全部抽樣單元中抽取,依此類(lèi)推,直到抽足所需單

20、元數(shù)為止,因而同一個(gè)抽樣單元有被重復(fù)抽中的可能。不放回抽樣也叫不重置抽樣,或不重復(fù)抽樣。它是在每次抽取一個(gè)新的單元之前,將已抽中的單元不再放回原來(lái)的總體,下一個(gè)單元的抽取在剩余的抽樣單元中進(jìn)行,依次類(lèi)推,直到抽足所需單元數(shù)為止,因而每個(gè)抽樣單元最多只能被抽中一次,不可能重復(fù)被抽中。放回抽樣與不放回抽樣相比,不放回抽樣的樣本代表性?xún)?yōu)于放回抽樣。因?yàn)榉呕爻闃又?,有些單位有被重?fù)抽取的可能,從而使樣本單元數(shù)在總體中的散布面縮小,樣本的代表性減弱,故在實(shí)際工作中常采用不放回抽樣。 誤差就是調(diào)查結(jié)果與現(xiàn)象的實(shí)際結(jié)果之間的偏差,它幾乎在所有的統(tǒng)計(jì)調(diào)查中都或大或小的存在著。在抽樣調(diào)查中,按照形成原因的不同,

21、一般可將誤差分成抽樣誤差和非抽樣誤差兩大類(lèi)。抽樣誤差是用樣本統(tǒng)計(jì)量推斷總體參數(shù)時(shí)的誤差,它屬于一種代表性誤差。抽樣調(diào)查是用樣本來(lái)估計(jì)總體,對(duì)任何一種抽樣方案,可能的樣本會(huì)有許多,而實(shí)際抽到的只是其中的一個(gè)樣本,在概率抽樣中,哪個(gè)樣本會(huì)被抽到完全是隨機(jī)的,抽到的樣本不同,則對(duì)總體的估計(jì)就可能不同,這就是抽樣誤差產(chǎn)生的根本原因。因此,在抽樣調(diào)查中抽樣誤差是不可避免的。但同非抽樣誤差不同的是,抽樣誤差可以計(jì)算,并且可以被控制在任意小的范圍內(nèi)。抽樣誤差通常會(huì)隨樣本量的大小而增減。在某些情形下,抽樣誤差與樣本量大小的平方根成反比關(guān)系,即在開(kāi)始階段抽樣誤差隨樣本量的增加而迅速減少,但在一定階段后,這種趨勢(shì)

22、便趨于穩(wěn)定。這表明,在經(jīng)過(guò)一定階段后,再努力減少抽樣誤差通常是不合算的。所以過(guò)了這個(gè)階段只要稍微降低一點(diǎn)精度,就可以省下可觀的費(fèi)用。普查的目的不過(guò)是想使抽樣誤差降低為零,要是允許存在誤差,當(dāng)然就值得用抽樣調(diào)查。另外,影響抽樣誤差的因素還有:所研究現(xiàn)象總體變異程度的大小,一般而言,總體變異程度越大,則抽樣誤差可能越大;抽樣的方式方法,如放回抽樣的誤差大于不放回抽樣,各種不同的抽樣組織方式也常會(huì)有不同的抽樣誤差。在實(shí)際工作中,樣本量和抽樣方式方法的影響是可以控制的,總體變異程度雖不可以控制,但卻可通過(guò)設(shè)計(jì)一些復(fù)雜的抽樣技術(shù)而將其影響加以控制。非抽樣誤差不是由于抽樣引起的。它又包括調(diào)查誤差、無(wú)回答誤

23、差、抽樣框誤差以及登記性誤差。它在各種統(tǒng)計(jì)調(diào)查中都可能會(huì)存在。調(diào)查誤差是調(diào)查所得的觀測(cè)值與被調(diào)查單元真值不一致所造成的誤差。造成這類(lèi)誤差的原因可能是測(cè)量手段(或儀器)不完善,也可能是被調(diào)查者記憶不準(zhǔn)確,或?qū)λ{(diào)查內(nèi)容缺乏全面了解或不愿意如實(shí)回答等。無(wú)回答誤差是因樣本中的一部分單元或一部分項(xiàng)目的資料沒(méi)有調(diào)查到,致使實(shí)際樣本較設(shè)計(jì)樣本縮小而引起的誤差。因此,從內(nèi)容上看,可以分為單元無(wú)回答和項(xiàng)目無(wú)回答。其產(chǎn)生原因有被調(diào)查者拒絕回答問(wèn)題,或者正好缺乏所需要的信息,或者找不到被抽中的單元等。抽樣框誤差是由于抽樣框不完善所造所的誤差。抽樣框不完善具體表現(xiàn)為存在著抽樣單元的重復(fù)或遺漏,這會(huì)破壞抽樣的隨機(jī)性。

24、登記性誤差是在觀測(cè)數(shù)據(jù)的填寫(xiě)、計(jì)算機(jī)數(shù)據(jù)錄入、傳輸、計(jì)算等環(huán)節(jié)的差錯(cuò)引起的誤差。非抽樣誤差的控制,須經(jīng)過(guò)改進(jìn)抽查表的設(shè)計(jì)或測(cè)試方式,嚴(yán)密組織調(diào)查,提高調(diào)查員的素質(zhì),以及加強(qiáng)調(diào)查整理等各環(huán)節(jié)的質(zhì)量檢查監(jiān)督,或設(shè)計(jì)特殊調(diào)查方式進(jìn)行處理,才能見(jiàn)效。設(shè)為總體的某個(gè)待估參數(shù),是通過(guò)樣本資料計(jì)算而得到的關(guān)于的估計(jì)量。MSE()=E(-)2稱(chēng)為估計(jì)量的均方誤差。由于未知,所以在通常情況下,MSE()仍然是未知的。但MSE()可以分解成:MSE()=E(-)2=E-E()+E()-2=E-E()2+EE()-2+2E()-E-E()=E-E()2+E()-2式中第一項(xiàng)是估計(jì)量的方差,記作V()。V()的平方根

25、稱(chēng)為估計(jì)量的標(biāo)準(zhǔn)誤差或標(biāo)準(zhǔn)差,記作S()。S()與E()之比稱(chēng)為估計(jì)量的變異系數(shù),記為C()。式中第二項(xiàng)是估計(jì)量的偏倚B()的平方(即B()=E()-)。一般情況下,均方誤差說(shuō)明了估計(jì)量的準(zhǔn)確性,而估計(jì)量的方差則表明了其估計(jì)結(jié)果的精確性。通常將精確度定義為估計(jì)量方差的倒數(shù),而將準(zhǔn)確度定義為估計(jì)量均方誤差的倒數(shù)。當(dāng)偏倚B()為零時(shí),稱(chēng)為的無(wú)偏估計(jì)量。此時(shí),的方差就等于它的均方誤差,即V()=MSE()如果隨樣本容量n的增大趨近于,則稱(chēng)為的一致估計(jì)。需要說(shuō)明的是:上面所給出的V()的計(jì)算公式仍然屬于一個(gè)理論公式或叫作定義公式,在實(shí)際中是無(wú)法直接應(yīng)用的。因此,實(shí)際中計(jì)算V()是依據(jù)調(diào)查變量的總體方差

26、2進(jìn)行的,當(dāng)2未知時(shí),一般用樣本方差s2代替,以對(duì)V()做出估計(jì)。有偏的估計(jì)并非都是不可用的,有時(shí)有偏估計(jì)量在某些方面反而比無(wú)偏估計(jì)量更好。有研究認(rèn)為,在實(shí)踐中當(dāng)偏倚小于標(biāo)準(zhǔn)誤的十分之一時(shí),偏倚對(duì)估計(jì)量準(zhǔn)確度的影響可以忽略不計(jì)。三、習(xí)題(一) 填空題1. 無(wú)回答誤差從內(nèi)容上看,可以分為 和 。2. 對(duì)于放回抽樣和不放回抽樣而言,在實(shí)際的抽樣調(diào)查工作中,一般都采用 抽樣。3. 抽樣誤差是抽取樣本的 造成的樣本值與總體值之間的平均差異。4. 抽樣誤差越小,說(shuō)明用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行估計(jì)時(shí)的精度越 。5.概率抽樣的五種方式為: 、 、整群抽樣、系統(tǒng)抽樣、多階段抽樣。6. 抽樣調(diào)查中常需估計(jì)的總體

27、參數(shù)有:總體總量、 、總體比例和 等。7. 偏倚為零的估計(jì)量,滿(mǎn)足 ,稱(chēng)為 。8.(二)單項(xiàng)選擇題1.下列說(shuō)法正確的是-( )。 A目標(biāo)總體和抽樣總體是一致的 B抽樣框是抽樣總體的互不重疊且有限的部分 C完全抽樣框是抽樣總體的具體表現(xiàn),是一份有關(guān)所有抽樣單位的一本名冊(cè) D如果隨著樣本容量的增大,偏度B與均方誤同時(shí)變小,而且偏差比標(biāo)準(zhǔn)誤差變小的更快,則估計(jì)量是可用的2. 以下關(guān)于概率抽樣,說(shuō)法不正確的是( )。 A按隨機(jī)原則抽樣 B入樣概率已知或者是可以計(jì)算出來(lái) C各單元的入樣概率是非負(fù)的 D估計(jì)量與入樣概率有關(guān)3. 抽取樣本單位時(shí)應(yīng)遵循的原則是( )。 A最大化原則 B平均化原則 C最優(yōu)化原則

28、 D隨機(jī)原則4. 樣本容量的大小與( )有關(guān)。 A總體方差 B抽樣費(fèi)用 C抽樣方式和方法 D以上各因素5. 非抽樣誤差的大小不會(huì)受到以下哪個(gè)因素的影響( )。 A樣本容量 B無(wú)回答率 C抽樣框不完善 D登記錯(cuò)誤6. 調(diào)查單元雖接受了調(diào)查,但問(wèn)卷中的某個(gè)或某些項(xiàng)目沒(méi)有填寫(xiě),這種無(wú)回答必然是( )。 A單元無(wú)回答 B項(xiàng)目無(wú)回答 C有意無(wú)回答 D無(wú)意無(wú)回答7. 抽樣誤差是指( )。 A系統(tǒng)性代表性誤差 B 偶然性代表性誤差 C登記性誤差 D 各種因素造成的全部誤差(三)簡(jiǎn)答題1. 什么是非抽樣誤差?與抽樣誤差相比,它有哪些基本特點(diǎn)?2. 什么是抽樣框誤差?它有哪些主要類(lèi)型?3. 確定樣本量時(shí)主要考慮

29、哪些影響因素?與樣本量大致呈什么樣的關(guān)系?4. 非抽樣誤差主要有那些來(lái)源?5. 討論以下所列情況是否屬于概率抽樣,并說(shuō)明理由:1.從一個(gè)包含有100只兔子的實(shí)驗(yàn)室大籠子里抓10只兔子做實(shí)驗(yàn)。研究人員不經(jīng)任何挑選抓到哪只就算那一只,抓滿(mǎn)10只為止。2.將籠中的100只兔子編上1100號(hào),任意列出10個(gè)不重復(fù)的數(shù)字(為1100之間的整數(shù)),以相應(yīng)的兔子作為抽中作試驗(yàn)的樣本;6. 某刊物對(duì)其讀者進(jìn)行調(diào)查,調(diào)查表隨刊物送到讀者手中,對(duì)寄回的調(diào)查表進(jìn)行分析。試問(wèn)這是不是一項(xiàng)抽樣調(diào)查?樣本抽取是不是屬于概率抽樣?為什么?7. 結(jié)合習(xí)題1.1與1.2的討論,根據(jù)你的理解什么是概率抽樣?什么是非概率抽樣?它們

30、各有什么優(yōu)點(diǎn)?8. 抽樣的隨機(jī)原則及其意義;9. 抽樣調(diào)查的特點(diǎn)。10. 試說(shuō)明以下術(shù)語(yǔ)或概念之間的關(guān)系與區(qū)別;1.均方誤差、方差與偏倚;2.方差、標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤;3.無(wú)偏估計(jì)、相合估計(jì)量;4.絕對(duì)誤差限、置信限(置信區(qū)間)與置信度。11. 影響抽樣誤差大小的因素有哪些?(做簡(jiǎn)要解釋?zhuān)┑诙?簡(jiǎn)單隨機(jī)抽樣一、概述(一)定義簡(jiǎn)單隨機(jī)抽樣也叫作純隨機(jī)抽樣。其概念可有兩種等價(jià)的定義方法:定義之一:簡(jiǎn)單隨機(jī)抽樣就是從總體N個(gè)抽樣單元中,一次抽取n個(gè)單元時(shí),使全部可能的種不同的樣本被抽到的概率均相等,即都等于1/A。按簡(jiǎn)單隨機(jī)抽樣,抽到的樣本稱(chēng)為簡(jiǎn)單隨機(jī)樣本。定義之二:簡(jiǎn)單隨機(jī)抽樣是從總體的N個(gè)抽樣單元

31、中,每次抽取一個(gè)單元時(shí),使每一個(gè)單元都有相等的概率被抽中,連續(xù)抽n次,以抽中的n個(gè)單元組成簡(jiǎn)單隨機(jī)樣本。由于定義二無(wú)需列舉全部可能的樣本,故比較便于組織實(shí)施。但按這個(gè)定義進(jìn)行抽樣時(shí),仍然需要掌握一個(gè)可以賴(lài)以實(shí)施抽樣的抽樣框。(二)簡(jiǎn)單隨機(jī)抽樣的具體實(shí)施方法常用的有抽簽法和隨機(jī)數(shù)法兩種。1. 抽簽法抽簽法是先對(duì)總體N個(gè)抽樣單元分別編上1到N的號(hào)碼,再制作與之相對(duì)應(yīng)的N個(gè)號(hào)簽并充分搖勻后,從中隨機(jī)地抽取n個(gè)號(hào)簽(可以是一次抽取n個(gè)號(hào)簽,也可以一次抽一個(gè)號(hào)簽,連續(xù)抽n次),與抽中號(hào)簽號(hào)碼相同的n個(gè)單元即為抽中的單元,由其組成簡(jiǎn)單隨機(jī)樣本。抽簽法在技術(shù)上十分簡(jiǎn)單,但在實(shí)際應(yīng)用中,對(duì)總體各單元編號(hào)并制作

32、號(hào)簽的工作量可能會(huì)很繁重,尤其是當(dāng)總體容量比較大時(shí),抽簽法并不是很方便,而且也往往難以保證做到等概率。因此,實(shí)際工作中常常使用隨機(jī)數(shù)法。2.隨機(jī)數(shù)法隨機(jī)數(shù)法就是利用隨機(jī)數(shù)表、隨機(jī)數(shù)骰子或計(jì)算機(jī)產(chǎn)生的隨機(jī)數(shù)進(jìn)行抽樣。由于計(jì)算機(jī)產(chǎn)生的隨機(jī)數(shù)實(shí)際上是偽隨機(jī)數(shù),不是真正的隨機(jī)數(shù),特別是直接采用一般現(xiàn)成程序時(shí),產(chǎn)生的隨機(jī)數(shù)往往不能保證其隨機(jī)性。因此,一般使用隨機(jī)數(shù)表,或用隨機(jī)數(shù)骰子產(chǎn)生的隨機(jī)數(shù),特別在n比較大時(shí)。(三)簡(jiǎn)單隨機(jī)抽樣的方法評(píng)估簡(jiǎn)單隨機(jī)抽樣對(duì)總體不加任何限制,等概率地從總體中直接抽取樣本,是最簡(jiǎn)單、最單純的抽樣技術(shù),它具有計(jì)算簡(jiǎn)便的優(yōu)點(diǎn),是研究其它復(fù)雜抽樣技術(shù)的基礎(chǔ),也是比較各種抽樣技術(shù)之間

33、估計(jì)效率的標(biāo)準(zhǔn),同時(shí),從理論上講簡(jiǎn)單隨機(jī)抽樣在各種抽樣技術(shù)中是貫徹隨機(jī)原則最好的一種,并且數(shù)學(xué)性質(zhì)很簡(jiǎn)單,是等概率抽樣的特殊類(lèi)型。另一方面,因?yàn)槭堑雀怕食槿颖荆砸罂傮w在所研究的主要標(biāo)志上同質(zhì)性或齊性(共性)較好,也即總體要比較均勻;要求樣本容量要比較大,以保證樣本對(duì)總體具有充分的代表性。但是,在社會(huì)經(jīng)濟(jì)現(xiàn)象中,這種均勻總體是很少見(jiàn)的。因此,實(shí)際工作中很少單純使用簡(jiǎn)單隨機(jī)抽樣方法。再者,因?yàn)橹苯訌目傮w中抽取樣本,未能充分利用關(guān)于總體的各種其它已知信息,以有效地提高樣本的代表性,并進(jìn)而提高抽樣的估計(jì)效率。此外,簡(jiǎn)單隨機(jī)抽樣要求在抽樣前編制出抽樣框,并對(duì)每一個(gè)總體抽樣單元進(jìn)行編號(hào),而且當(dāng)總體

34、抽樣單元的分布比較分散時(shí),樣本也可能會(huì)比較分散,這些都會(huì)給簡(jiǎn)單隨機(jī)抽樣方法的運(yùn)用造成許多的不便,甚至在某些情況下干脆無(wú)法使用。因此,在此基礎(chǔ)上研究其它抽樣技術(shù)顯得更加重要。二、總體參數(shù)的估計(jì)雖然抽樣的目的各種各樣,但通常人們的興趣都集中于總體的四項(xiàng)指標(biāo):均值;總量Y;成數(shù)(比例)P;兩總值或均值的比率R。在抽取一個(gè)簡(jiǎn)單隨機(jī)樣本,并進(jìn)行調(diào)查以后,如何估計(jì)總體的均值、總量及比例呢?估計(jì)結(jié)果的誤差又如何確定呢?(一) 在簡(jiǎn)單隨機(jī)抽樣下總體參數(shù)的估計(jì)量1.總體均值的簡(jiǎn)單估計(jì)量為:樣本均值是總體均值的無(wú)偏估計(jì),即2. 總體總量的簡(jiǎn)單估計(jì)量為其中N/n也稱(chēng)作膨脹因子。3. 總體比例的簡(jiǎn)單估計(jì)量抽樣調(diào)查中,

35、經(jīng)常需估計(jì)總體中具有某種特性的單元總數(shù)及其在總體中所占的比例(即成數(shù))。設(shè)總體中的N個(gè)抽樣單元按其是否具有某種特性可分成D和兩類(lèi),D類(lèi)具有某種特性,類(lèi)不具有某種特性。D類(lèi)有N1個(gè)單元,類(lèi)有N0個(gè)單元總體比例的簡(jiǎn)單估計(jì)量為:總體中具有D類(lèi)屬性的單位總數(shù)的估計(jì)量為:(二)估計(jì)量的方差總體方差:1. 其中,f為抽樣比,1-f為有限總體不重復(fù)抽樣校正系數(shù),記為fpc。2. 又因?yàn)樵谘芯靠傮w成數(shù)時(shí)3. 總體比例估計(jì)量的方差為總體中具有某種屬性單元總數(shù)估計(jì)量的方差為 (三)方差估計(jì)量可以證明樣本方差為總體方差的無(wú)偏估計(jì)量,即,所以,當(dāng)總體方差未知時(shí),可用樣本方差來(lái)代替,由此可得出估計(jì)量的方差的估計(jì)量分別為

36、, 而且與分別是與的無(wú)偏估計(jì)。的無(wú)偏估計(jì)量為的無(wú)偏估計(jì)量為三、樣本容量的確定抽樣誤差是抽樣調(diào)查所固有的,雖然不能消除,但卻可以控制。影響抽樣誤差的因素有許多,樣本容量的多少是其中最重要的影響因素之一。樣本容量越大,樣本對(duì)總體的代表性就可能愈強(qiáng),抽樣誤差就越小,抽樣估計(jì)的精度也就越高。而在實(shí)際的抽樣調(diào)查工作中,顯然不可能無(wú)限制地增大樣本容量,以追求對(duì)總體參數(shù)的估計(jì)達(dá)到盡可能高的精度,因?yàn)闃颖救萘坑?,抽樣調(diào)查所需花費(fèi)的費(fèi)用就愈多,調(diào)查的時(shí)間也愈長(zhǎng),接近于全面調(diào)查,則就失去了抽樣調(diào)查的意義和作用。反過(guò)來(lái),如果抽樣數(shù)目過(guò)少,費(fèi)用和時(shí)間的花費(fèi)固然也少,較易得到滿(mǎn)足,但在估計(jì)精度上,常不能達(dá)到規(guī)定的最低

37、限度之要求,因此滿(mǎn)足不了分析研究的需要。所以,在確定樣本容量時(shí),必須在估計(jì)的精度要求和可供調(diào)查使用的費(fèi)用之間進(jìn)行權(quán)衡,使在費(fèi)用一定的條件下精度達(dá)到最高,或在精度要求得到保證的前提下使費(fèi)用最省。通常將在這一原則指導(dǎo)下所確定的樣本容量稱(chēng)之為必要樣本容量,它是在最大限度地滿(mǎn)足規(guī)定精度要求以及盡可能節(jié)約調(diào)查費(fèi)用的前提下,所應(yīng)該抽取到的最少的樣本容量。以后各種抽樣組織方式所討論的樣本容量均是指必要樣本容量。(一)依規(guī)定精度來(lái)定1、關(guān)于精度的不同提法估計(jì)精度是抽樣誤差(估計(jì)量的方差)的倒數(shù),所以,在一定的可靠程度的要求下,給出估計(jì)精度,也就等于給出了估計(jì)中允許誤差的大小。通常,對(duì)于估計(jì)量的精度可以有不同的

38、提法或表示方法。提法之一:以置信度1-,允許總體參數(shù)的估計(jì)量的最大絕對(duì)誤差為,即提法之二:以置信度1-,允許總體參數(shù)的估計(jì)量的最大相對(duì)誤差為r,即因?yàn)樽畲蠼^對(duì)誤差可以通過(guò)估計(jì)量的方差表示,即最大相對(duì)誤差可以通過(guò)估計(jì)量的變異系數(shù)表示,即提法之三:以置信度1-,允許總體參數(shù)的估計(jì)量的最大方差不超過(guò)V,即 提法之四:以置信度1-,允許總體參數(shù)的估計(jì)量的最大變異系數(shù)不超過(guò)C,即估計(jì)總體均值時(shí)樣本量(Sample Size)的確定(I)要求估計(jì)量方差的上限為:,(II)要求估計(jì)量的絕對(duì)誤差限為:(III)要求估計(jì)量的相對(duì)誤差限為:(2)總體參數(shù)為P時(shí)樣本量(Sample Size)的確定(I)要求估計(jì)量

39、方差的上限為:(II)要求估計(jì)量的絕對(duì)誤差限為:(III)要求估計(jì)量的相對(duì)誤差限為:(二)依調(diào)查費(fèi)用來(lái)定 設(shè)C表示抽樣調(diào)查工作的總費(fèi)用,可大致分為兩個(gè)構(gòu)成部分:一部分為固定費(fèi)用,用C0表示,不管調(diào)查單位數(shù)的多少,這部分費(fèi)用都要花費(fèi),主要包括組織領(lǐng)導(dǎo)、宣傳、設(shè)計(jì)等費(fèi)用。一部分為可變費(fèi)用,用C1表示,它是每調(diào)查一個(gè)單位平均要花的費(fèi)用,其費(fèi)用的大小隨調(diào)查單元數(shù)的多少變動(dòng),如調(diào)查表的印刷、調(diào)查的差旅費(fèi)等。這樣C= C0+ C1n在上述公式中,當(dāng)某項(xiàng)抽樣調(diào)查工作所能得到的總費(fèi)用一定,且C0和C1依其他有關(guān)資料也大致可以確定時(shí),就可推算出必要的抽樣單元數(shù)目(三)在精度和費(fèi)用間謀求平衡依費(fèi)用確定抽樣數(shù)目后,

40、可進(jìn)行實(shí)地抽樣調(diào)查,計(jì)算其樣本指標(biāo)和抽樣方差,進(jìn)一步估算其估計(jì)精度,考察其滿(mǎn)足允許誤差范圍和可信程度的要求程度,以及根據(jù)精度和費(fèi)用分別確定的抽樣數(shù)目的符合程度,謀求精度和費(fèi)用間的平衡。一般情況下,若依精度要求確定的n,同依費(fèi)用限制確定的n相比較,若前者小于后者,則以前者為準(zhǔn),而節(jié)省費(fèi)用。若前者大于后者,則在費(fèi)用不能再增加,以及精度要求不能再放寬時(shí),只能暫時(shí)放棄該調(diào)查;在費(fèi)用不能再增加,而精度要求能做適當(dāng)讓步時(shí),則調(diào)整精度要求。四、習(xí)題(一)填空題1. 抽樣比是指 ,用 表示。2. 簡(jiǎn)單隨機(jī)抽樣的抽樣誤差等于 。3. 從大小為N的總體中依簡(jiǎn)單隨機(jī)抽樣從中抽取某一大小為n的樣本時(shí),總體單元被選入樣

41、本的概率是 。4. 簡(jiǎn)單隨機(jī)抽樣的樣本抽取方法有抽簽法、 法、 法和計(jì)算機(jī)模擬法。(二)計(jì)算與應(yīng)用題1. 某居民區(qū)共有10000戶(hù),現(xiàn)用抽樣調(diào)查的方法估計(jì)該區(qū)居民的用水量。采用簡(jiǎn)單隨機(jī)抽樣抽選了100戶(hù),得=12.5,s2=1252。估計(jì)該居民區(qū)的總用水量95%的置信區(qū)間。若要求估計(jì)的相對(duì)誤差不超過(guò)20%,試問(wèn)應(yīng)抽多少戶(hù)做樣本?2. 某鎮(zhèn)有3250名職工,為調(diào)查該鎮(zhèn)職工的收入情況,用簡(jiǎn)單隨機(jī)抽樣方法從中抽取30名進(jìn)行調(diào)查,調(diào)查結(jié)果顯示:這30名職工的平均收入為672.33元,標(biāo)準(zhǔn)差為24.86元,試求該鎮(zhèn)職工的平均收入的95%置信區(qū)間。3. 為調(diào)查某市郊區(qū)10000戶(hù)農(nóng)民家庭中擁有電腦的比例,

42、隨機(jī)抽取了其中500戶(hù),結(jié)果有110戶(hù)有電腦。 要求:(1) 試以95%的可靠性估計(jì)該市郊區(qū)農(nóng)民家庭擁有電腦的比例; (2)根據(jù)上面結(jié)果,估計(jì)擁有電腦的總戶(hù)數(shù); (3)若要求抽樣允許誤差不超過(guò)0.02,至少應(yīng)抽取多少戶(hù)?4. 某調(diào)查公司受一消費(fèi)品生產(chǎn)公司的委托,想在某一地區(qū)進(jìn)行一項(xiàng)民意測(cè)驗(yàn),了解消費(fèi)者中喜歡該公司消費(fèi)品的人占多大比例,要求允許絕對(duì)誤差不超過(guò)0.1,調(diào)查估計(jì)值的置信水平為95%,預(yù)計(jì)的回答率為65%,試問(wèn)此次調(diào)查的樣本量應(yīng)取多少才能滿(mǎn)足需要?5.欲調(diào)查我校大一學(xué)生平均每月生活費(fèi)支出情況,采用簡(jiǎn)單隨機(jī)抽樣抽出35名學(xué)生,他們每月的生活費(fèi)支出平均為285元,計(jì)算得到的樣本方差為73,

43、試計(jì)算我校一年級(jí)學(xué)生平均每月生活費(fèi)的支出額標(biāo)準(zhǔn)差、變異系數(shù)、置信區(qū)間(置信水平為95%)。 6. 某工廠欲制定工作定額,估計(jì)所需平均操作時(shí)間,從全廠98名從事該項(xiàng)作業(yè)的工人中隨機(jī)抽選8人,其操作時(shí)間分別為4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(單位:分),試以95%的置信度估計(jì)該項(xiàng)作業(yè)平均所需時(shí)間的置信區(qū)間(有限總體修正系數(shù)可忽略)。7. 從某百貨商店的3000張發(fā)貨票中隨機(jī)抽取300張來(lái)估計(jì)家用電器銷(xiāo)售額,發(fā)現(xiàn)其中有200張是銷(xiāo)售家用電器的,這200張發(fā)貨票的總金額是48956元,其離差平方和為12698499。若置信度是95%,試估計(jì)這3000張發(fā)貨票中家用電器銷(xiāo)售

44、額的置信區(qū)間。8. 從一疊單據(jù)中用簡(jiǎn)單隨機(jī)抽樣方法抽取了250張,發(fā)現(xiàn)其中有50張單據(jù)出現(xiàn)錯(cuò)誤,試以95%的置信度估計(jì)這批單據(jù)中有錯(cuò)誤的比例。若已知這批單據(jù)共1000張,你的結(jié)論有何變化?若要求估計(jì)的絕對(duì)誤差不超過(guò)1%,則至少抽取多少?gòu)垎螕?jù)作樣本?第三章 分層隨機(jī)抽樣一、概述(一)定義分層抽樣也叫做類(lèi)型抽樣,它是實(shí)際工作中最常用的抽樣技術(shù)之一。分層抽樣是在抽樣之前,先將總體按一定標(biāo)志劃分為若干個(gè)層(組),后在各層內(nèi)分別獨(dú)立地進(jìn)行抽樣。由此所抽得的樣本稱(chēng)之為分層樣本。各層所抽的樣本也是互相獨(dú)立的。如果每層中的抽樣都是簡(jiǎn)單隨機(jī)的,則這種抽樣就叫做分層隨機(jī)抽樣。由此所得到的樣本稱(chēng)做分層隨機(jī)樣本。進(jìn)行

45、分層抽樣時(shí)應(yīng)注意:層內(nèi)抽樣設(shè)計(jì)的選擇;分層變量的選擇;各層樣本量的分配;層數(shù);層的分界。 (二)同簡(jiǎn)單隨機(jī)抽樣相比,分層抽樣具有以下特點(diǎn)(優(yōu)點(diǎn)):分層抽樣能夠充分地利用關(guān)于總體的各種已知信息進(jìn)行分層,因此抽樣的效果一般比簡(jiǎn)單隨機(jī)抽樣要好。 在分層抽樣中,總體的方差一般可以分解為層間方差和層內(nèi)方差兩部分。由于分層抽樣的誤差只與層內(nèi)差異有關(guān),而與層間差異無(wú)關(guān),因此,分層抽樣可以提高估計(jì)量的精度。由于分層抽樣是在每層內(nèi)獨(dú)立地進(jìn)行抽樣,因此,使得分層樣本能夠比簡(jiǎn)單隨機(jī)樣本更加均勻地分布于總體之內(nèi),所以其代表性也更好些。分層抽樣的隨機(jī)性具體體現(xiàn)在層內(nèi)各單元的抽取過(guò)程之中,也即在各層內(nèi)部的每一個(gè)單元都有相

46、同的機(jī)會(huì)被抽中,而在層與層之間則是相互獨(dú)立的。 分層抽樣中除了可以推斷總體參數(shù)外,還可以推斷各不同層的數(shù)量特征,并進(jìn)一步作對(duì)比分析,從而滿(mǎn)足不同方面的需要,也能幫助人們對(duì)總體作更全面、更深入的了解。 分層抽樣調(diào)查實(shí)施中的組織管理及數(shù)據(jù)收集和匯總處理可以分別在各層內(nèi)獨(dú)立地進(jìn)行,因此較之簡(jiǎn)單隨機(jī)抽樣更方便。分層抽樣中,由于各層的抽樣相互獨(dú)立,互不影響,且各層間可能有顯著的不同,因此,對(duì)不同層可以按照具體情況和條件分別采用不同的抽樣和估計(jì)方法進(jìn)行處理,從而提高估計(jì)的精確度。(三)在滿(mǎn)足下述條件時(shí),分層在精度上會(huì)有很大的得益:總體是由一些大小差異很大的單元組成的,按照盡可能使層內(nèi)單元的指標(biāo)值相近,層間

47、單元的差異盡可能大的原則對(duì)其進(jìn)行分層;分層后,每層所包含的總體單元數(shù)應(yīng)是可知的,也即分層后各層的權(quán)重是確知的或可以精確估計(jì)的;要調(diào)查的主要變量(標(biāo)志)與單元的大小是密切相關(guān)的;對(duì)單元的大小有很好的測(cè)量資料可用于分層,也即分層變量容易確定。(四)分層原則:總體中的每一個(gè)單元一定屬于并且只屬于某一個(gè)層,而不可能同時(shí)屬于兩個(gè)層或不屬于任何一個(gè)層。1.估計(jì):層內(nèi)單元具有相同性質(zhì),通常按調(diào)查對(duì)象的不同類(lèi)型進(jìn)行劃分。2.精度:盡可能使層內(nèi)單元的指標(biāo)值相近,層間單元的差異盡可能大,從而達(dá)到提高抽樣估計(jì)精度的目的。3.估計(jì)和精度:既按類(lèi)型、又按層內(nèi)單元指標(biāo)值相近的原則進(jìn)行多重分層,同時(shí)達(dá)到實(shí)現(xiàn)估計(jì)類(lèi)值以及提高

48、估計(jì)精度的目的。4.實(shí)施:抽樣組織實(shí)施的方便,通常按行政管理機(jī)構(gòu)設(shè)置進(jìn)行分層。二、總體參數(shù)的估計(jì)(一)有關(guān)符號(hào)的涵義在分層抽樣中,我們用各種符號(hào)來(lái)區(qū)別各種不同情況,熟悉了這些符號(hào)所代表的確切內(nèi)涵,對(duì)于我們系統(tǒng)地掌握抽樣推斷的一系列方法是十分重要的。因此,這里先集中對(duì)各有關(guān)符號(hào)的涵義作一解釋?zhuān)槐硎痉謱拥膶訑?shù);h表示層的編號(hào)(h,,);表示總體容量;表示第h層的總體容量;表示第h層的層權(quán),是已知的或要事先確定;n表示樣本容量;n表示第h層的樣本容量;fn表示第h層的抽樣比;表示第h層每i個(gè)單元的觀測(cè)值;為總體總量;=為樣本總量;=為總體均值;=為第h層的總體總量;為第h層的總體均值;=為第h層的樣

49、本均值;為樣本均值;為第h層的總體方差;為第h層的樣本方差;為總體成數(shù);為第h層的總體成數(shù);為第h層的樣本成數(shù);(1-)為第h層的總體方差;(1-)為第h層的樣本方差。(二)估計(jì)量、總體均值的估計(jì)量在分層抽樣中,總體均值的估計(jì)量一般用表示,它是各層總體均值的估計(jì)量按層權(quán)的加權(quán)平均,即在分層隨機(jī)抽樣中,是的無(wú)偏估計(jì)量,即=,因此,是的無(wú)偏估計(jì)量。、總體總和的估計(jì)量有了總體均值的估計(jì)量,就可推出總體總和的估計(jì)量、總體比例P的估計(jì)量總體比例(成數(shù))的估計(jì)量為:,是的無(wú)偏估計(jì)量。(三)估計(jì)量的方差、總體均值估計(jì)量的方差對(duì)于一般的分層抽樣,由于各層的抽樣是相互獨(dú)立的,諸也相互獨(dú)立,因此總體均值估計(jì)量的方

50、差是 對(duì)于分層隨機(jī)抽樣,則有:=可見(jiàn),在分層抽樣中,總體均值估計(jì)量的方差只與各層內(nèi)的方差有關(guān),而同層間方差無(wú)關(guān)。而總體方差又是由層內(nèi)方差與層間方差兩部分構(gòu)成的。所以,估計(jì)量的方差小于總體方差。、總體總和估計(jì)量的方差有了總體均值估計(jì)量的方差,就可推導(dǎo)出總體總和估計(jì)量的方差:對(duì)于分層隨機(jī)抽樣,則有:、總體比例估計(jì)量的方差估計(jì)總體比例,當(dāng)充分大時(shí),有:對(duì)于分層隨機(jī)抽樣,則有: (四)方差的估計(jì)量=, 與分別是與無(wú)偏估計(jì)。=是的無(wú)偏估計(jì)。三、總樣本量的分配(一)總樣本量在各層間的分配在分層抽樣中,一個(gè)重要的問(wèn)題是總的樣本量如何在各層之間進(jìn)行分配。通??紤]:精度和費(fèi)用問(wèn)題。即如何分配才能在費(fèi)用一定時(shí)使總

51、的精度和各層估計(jì)精度最高?數(shù)據(jù)處理問(wèn)題。即如何分配才能使調(diào)查數(shù)據(jù)的處理工作更加簡(jiǎn)潔,也使估計(jì)量及其方差的確定形式更為簡(jiǎn)單明了?各層的容量大小問(wèn)題。結(jié)合上述考慮,總樣本量在各層間分配時(shí)可采用如下方法:1. 比例分配在分層抽樣中,若各層的抽樣比都相同,即fh=f,則稱(chēng)總樣本量為按比例分配。此時(shí) 所以,因此,。(應(yīng)取整)比例分配時(shí),總體中任一單元的入樣概率都相等,都為f=n/N。由此所得到的樣本稱(chēng)為是自加權(quán)的或等加權(quán)的。在這種情況下, (為常數(shù))即或?yàn)樗袠颖咀罨締卧^測(cè)值總和的一個(gè)常數(shù)倍。這樣的估計(jì)量稱(chēng)為自加權(quán)的。對(duì)于比例分配的分層隨機(jī)抽樣,其均值估計(jì)量的方差可以有以下比較簡(jiǎn)單的形式:當(dāng)估計(jì)比例

52、P時(shí),同樣有: 2. 最優(yōu)分配()一般情形在分層隨機(jī)抽樣中,在給定的費(fèi)用條件下,使估計(jì)量的方差達(dá)到最小,或在精度要求(常用方差表示)一定條件下,使總費(fèi)用最小的各層樣本量的分配稱(chēng)為最優(yōu)分配。= (應(yīng)取整)()特殊情形內(nèi)曼分配如果各層內(nèi)每個(gè)單元的平均抽樣費(fèi)用相等,也即時(shí),最優(yōu)分配簡(jiǎn)化為: = (應(yīng)取整)在內(nèi)曼分配時(shí),估計(jì)量所能達(dá)到的最小方差為: ()某些層需要超過(guò)100%抽樣時(shí)的修正若抽樣比較大,而個(gè)別層的也很大,則按最優(yōu)分配,一些層的有可能超過(guò)(即1)。這時(shí),可以對(duì)這些極端層進(jìn)行100%抽樣。然后將剩下的其余的層可用的樣本量再按最優(yōu)分配法在其它各層間重新進(jìn)行分配。以?xún)?nèi)曼分配為例,其具體步驟如下:

53、 假定:,則令。對(duì)部分作內(nèi)曼分配: 此時(shí),若所有的(h2)則分配合理。否則,若有:,則,,對(duì)部分再作內(nèi)曼分配:.若所有 (h3),則分配合理。否則再重復(fù)上述過(guò)程,直到所有的為止。()估計(jì)p時(shí)的最優(yōu)分配)一般情形)特殊情形內(nèi)曼分配四、總樣本量的確定、估計(jì)總體均值的情形設(shè)允許估計(jì)量的最大方差為,對(duì)某種已確定的樣本量分配原則,有:,代入總體均值估計(jì)量的方差的計(jì)算公式,則有:,于是對(duì)給定的:.當(dāng)比例分配)時(shí):=當(dāng) (內(nèi)曼分配)時(shí):當(dāng)各層抽樣費(fèi)用不同,而總費(fèi)用給定時(shí):.、估計(jì)總體總和的情形同樣的道理,可得出對(duì)給定的分配形式()有:.當(dāng)比例分配時(shí),當(dāng)內(nèi)曼分配時(shí),、估計(jì)總體比例的情形若較大,則,此時(shí)可進(jìn)一步

54、求出估計(jì)P時(shí)對(duì)給定的分配形式()有:.五、分層與提高精度分層抽樣的目的主要是為了提高抽樣估計(jì)的精度,而且分層抽樣的效果如前所述一般也優(yōu)于簡(jiǎn)單隨機(jī)抽樣,因此,在實(shí)際中得到廣泛應(yīng)用。 (一)分層隨機(jī)抽樣與簡(jiǎn)單隨機(jī)抽樣的精度比較設(shè)為簡(jiǎn)單隨機(jī)抽樣的方差;為按比例分配的分層隨機(jī)抽樣的方差;為最優(yōu)分配的分層隨機(jī)抽樣的方差。,又+所以又因?yàn)槠渲校菏堑募訖?quán)平均值,所以 (二)設(shè)計(jì)效應(yīng)抽樣方案不同,估計(jì)量的精度也會(huì)不同?;灿?965年提出了一個(gè)衡量抽樣方案效果的量,稱(chēng)為設(shè)計(jì)效應(yīng),記作Deff。Deff=設(shè)計(jì)效應(yīng)的主要作用有兩個(gè):評(píng)估比較復(fù)雜的抽樣方案的效率和確定樣本量。從Deff的定義可以看出:簡(jiǎn)單隨機(jī)抽樣是

55、衡量其它復(fù)雜抽樣技術(shù)效果的標(biāo)準(zhǔn)。若Deff1,表明這種復(fù)雜抽樣的精度比簡(jiǎn)單隨機(jī)抽樣的高,即抽樣誤差比簡(jiǎn)單隨機(jī)抽樣的小。(三)抽樣后分層分層抽樣須先分層再抽樣。如果在抽樣前分層有困難,也可以在抽樣后分層。但前提條件是每層的大小必須已知,而且是準(zhǔn)確的。事后分層是先在總體中抽一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本,再依樣本中單元的某些特征進(jìn)行分層,用估計(jì),其中,是樣本中落入第h層的單元數(shù),若落入某些層的樣本單元數(shù)為0,可將層加以合并,使0。是落入第h層的樣本的均值。形式上與相同,但是隨機(jī)變量,也具有隨機(jī)性??梢宰C明:式中第一項(xiàng)是按比例分配的分層隨機(jī)抽樣的方差,第二項(xiàng)表示因未按比例分配而引起的方差的增量。當(dāng)落在每

56、層的樣本單位數(shù)較大(如大于20),也即n充分大時(shí)第二項(xiàng)就很小,因此,用這個(gè)方法幾乎與按比例分配的分層隨機(jī)抽樣具有同樣的精度。在許多實(shí)際問(wèn)題的研究中,常常需要按不同標(biāo)準(zhǔn)分類(lèi)的統(tǒng)計(jì)數(shù)字。若采用事先的多重分層方法,困難很大,而且實(shí)際上也不一定需要每個(gè)子層的估計(jì),于是可用事后分層的方式,以獲得按各種分類(lèi)的事后分層估計(jì)量。另一方面,從原則上講,事后分層也可用于某種事先分層、但嚴(yán)格比例分層的樣本,因?yàn)檫@種樣本與簡(jiǎn)單隨機(jī)樣本一樣是自加權(quán)的。由此可見(jiàn),事后分層技術(shù)具有重要的實(shí)際意義。六、習(xí)題(一)填空題1. 分層隨機(jī)抽樣的內(nèi)曼最優(yōu)分配法考慮的因素主要有 和 兩個(gè)。2. 在樣本量相同的條件下,分層隨機(jī)抽樣最優(yōu)分

57、配、分層隨機(jī)抽樣按比例分配以及簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單估計(jì)的方差的大小關(guān)系為 。3. 在分層抽樣中,層內(nèi)的差異越 ,估計(jì)誤差越小。4. 對(duì)于分層抽樣,在給定費(fèi)用下估計(jì)量的方差達(dá)到最小,或者對(duì)于給定的估計(jì)量方差使得總費(fèi)用達(dá)到最小的樣本量分配稱(chēng)為 。5. 分層抽樣的基本原則是 。6. 分層抽樣中層權(quán)是 。7. 分層隨機(jī)抽樣中,對(duì)總體的均值進(jìn)行估計(jì)時(shí),其抽樣誤差是 ,對(duì)總體的總量進(jìn)行估計(jì)時(shí),其抽樣誤差是 。8. 分層抽樣在對(duì)各層分配樣本量時(shí),可以采用不同的分配方法,各種方法所考慮的因素不同。最優(yōu)分配時(shí)主要考慮的因素是 、 。(二)單項(xiàng)選擇題1. 分層抽樣設(shè)計(jì)效應(yīng)滿(mǎn)足( ) A. B. C. D. 2. 為達(dá)

58、到提高抽樣估計(jì)精度的目的,則分層抽樣時(shí)劃分層應(yīng)滿(mǎn)足( )的原則A. 層內(nèi)差異小,層間差異大 B. 層間差異小,層內(nèi)差異大C. 層間差異小 D. 層內(nèi)差異大3. 關(guān)于分層抽樣,下面表達(dá)式中錯(cuò)誤的是( ) A. B. C. D. 4. 最優(yōu)分配()、比例分配()的分層隨機(jī)抽樣與相同樣本量的簡(jiǎn)單隨機(jī)抽樣()的精度之間的關(guān)系式為( )A. B. C. D. 5. 下面哪種樣本量分配屬于一般最優(yōu)分配?A. B. C. D. 6. 與其他樣本單元在各層的分配方法相比,內(nèi)曼最優(yōu)分配分層抽樣可以達(dá)到的效果是( )。A方差最小 B費(fèi)用最省 C自加權(quán)樣本 D實(shí)施最方便(三)簡(jiǎn)答題1. 簡(jiǎn)述同簡(jiǎn)單隨機(jī)抽樣相比,分層

59、抽樣具有哪些優(yōu)點(diǎn)。2. 簡(jiǎn)述在滿(mǎn)足哪些條件時(shí),分層抽樣在精度上會(huì)有很大的得益。3. 對(duì)于分層抽樣,怎樣分層能提高精度?為什么?4. 什么是分層隨機(jī)抽樣?分層的原則有哪些?5. 在分層抽樣中,樣本容量在各層的分配方法有比例分配、內(nèi)曼最優(yōu)分配、一般最優(yōu)分配三種方法。試分別寫(xiě)出它們的公式,并比較。(四)計(jì)算題1. 一公司希望估計(jì)某一個(gè)月內(nèi)由于事故引起的工時(shí)損失。因工人、技術(shù)人員及行政管理人員的事故率不同,因而采用分層抽樣。已知下列資料:工人技術(shù)人員行政管理人員若樣本量n=30,試用你乃曼分配確定各層的樣本量。2. 上題中若實(shí)際調(diào)查了18個(gè)工人,10個(gè)技術(shù)人員,2個(gè)行政人員,其中損失的工時(shí)數(shù)如下:工人

60、技術(shù)人員行政管理人員8,24,0,0,16,32,6,0,16,7,4,4,9,5,8,18,2,04,5,0,24,8,12,3,2,1,81,8試估計(jì)總的工時(shí)損失數(shù)并給出它的置信度為95%的置信區(qū)間。3 某市商業(yè)局對(duì)全市各商店某種電器的年銷(xiāo)售量做抽樣調(diào)查,按市區(qū)、近郊、遠(yuǎn)郊分為三層,已知總體各層單元數(shù)依次為N1=800,N2=400,N3=300,根據(jù)以往資料知其各層銷(xiāo)售量的標(biāo)準(zhǔn)差為S1=100元,S2=50元,S3=70元,在市區(qū)、近郊、遠(yuǎn)郊調(diào)查每個(gè)樣本單元的費(fèi)用分別為c1=16元,c2=25元,c3=49元,假定總的抽樣比為10%,試求樣本單元數(shù)在各層的最優(yōu)分配。4. 調(diào)查某個(gè)地區(qū)的養(yǎng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論