《應用統(tǒng)計學(第三版)》課件第10章 抽樣統(tǒng)計_第1頁
《應用統(tǒng)計學(第三版)》課件第10章 抽樣統(tǒng)計_第2頁
《應用統(tǒng)計學(第三版)》課件第10章 抽樣統(tǒng)計_第3頁
《應用統(tǒng)計學(第三版)》課件第10章 抽樣統(tǒng)計_第4頁
《應用統(tǒng)計學(第三版)》課件第10章 抽樣統(tǒng)計_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第10章抽樣統(tǒng)計

本章主要闡述參數(shù)估計的基本概念、抽樣分布、抽樣的組織方式和抽樣設計的基本問題。其中抽樣組織方式主要有簡單隨機抽樣、類型抽樣、等距抽樣、整群抽樣、目錄抽樣、二重抽樣、多階段抽樣等。其核心是怎樣根據(jù)隨機樣本對總體參數(shù)作出科學的推斷。10.1抽樣統(tǒng)計的基本概念抽樣統(tǒng)計又叫參數(shù)估計,是指根據(jù)統(tǒng)計研究的任務和要求,從被研究總體中抽出部分單位進行調(diào)查,然后根據(jù)這一部分單位所求得的樣本指標推斷總體指標的統(tǒng)計方法。10.1.1總體與樣本

總體:又稱全及總體,即被研究現(xiàn)象的全體,亦具有大量性、同質(zhì)性和差異性的許多個別事物的集合體??傮w單位數(shù)通常用N表示。樣本:根據(jù)隨機原則從總體中抽出來的部分個體單位組成的集合體。樣本中包含的單位個數(shù)記作n,又稱樣本容量,n/N稱為抽樣比例。10.1.2參數(shù)和統(tǒng)計量參數(shù):總體的數(shù)量特征即總體指標。在抽樣時總體指標往往是未知的,是需要進行推斷的。總體指標通常有總體平均值(期望值),記作或μ,總體方差或標準差,記作,總體比率,記作P。統(tǒng)計量:樣本的數(shù)量特征即樣本指標。統(tǒng)計量隨著樣本的不同而不同,因而是個隨機變量。統(tǒng)計量通常有樣本均值,樣本方差S2,樣本標準差S

,樣本比例p。

總體分布:總體中某一隨機變量的不同取值及其相應的頻率或概率組成的分布。抽樣分布:從總體中抽出的所有可能的樣本統(tǒng)計量及其相應的概率構成的分布。10.1.3重復抽樣與不重復抽樣

重復抽樣:每抽出一個總體單位進行調(diào)查登記以后,放回去,混合均勻,再抽下一個,直到抽滿n個為止。抽樣時前面已抽到過的總體單位,在以后的抽取中可能重復抽到。不重復抽樣:每次抽出一個總體單位進行調(diào)查登記以后,不再放回,抽樣時前面已抽到過的總體單位,以后不會再被抽到。

抽樣方法不同,所有可能抽到的樣本個數(shù)(M)不相同:1.重復抽樣條件下:2.不重復抽樣條件下:10.1.4抽樣誤差與抽樣標準誤差抽樣誤差是指在遵守隨機原則條件下,樣本指標與總體指標的差異,它是一種偶然性的代表性誤差。不包括系統(tǒng)性代表性誤差和登記性誤差。抽樣標準誤差:是指所有可能的樣本平均數(shù)(或樣本比率)對總體平均數(shù)(或總體比率)的標準差。抽樣標準誤差的平方稱為抽樣方差。依定義有:樣本平均數(shù)的抽樣標準誤差:

樣本比率的抽樣標準誤差:

上述定義公式可用來解釋抽樣誤差的實質(zhì),但不能實際應用,因為可能的樣本個數(shù)太多,而且總體平均數(shù)或總體比率是未知的,是需要推斷的。一般來說,影響抽樣誤差大小的因素有四個:1.樣本容量n。樣本容量越大,抽樣誤差就越小,大到n=N時,抽樣誤差等于0;2.總體標準差σ??傮w標準差越大,抽樣誤差就越大;3.抽樣方法的影響。不重復抽樣可以避免極端樣本出現(xiàn),故抽樣誤差比重復抽樣誤差??;4.抽樣方式的影響。抽樣方式不同,抽樣誤差也就不同10.1.5點估計與區(qū)間估計參數(shù)估計是指用樣本統(tǒng)計量來估計總體參數(shù)。用取值區(qū)間表現(xiàn)的稱為區(qū)間估計。1.點估計:用點值表現(xiàn)估計結果。點估計也叫定值估計,當樣本容量足夠大時,可直接用樣本平均數(shù)代替總體平均數(shù),用樣本比率代替總體比率,并據(jù)此計算有關總量指標,就是點估計。

點估計的優(yōu)點是簡單方便,缺點是無法知道估計的準確程度有多大,誤差可能有多大。衡量一個樣本統(tǒng)計量是否是總體參數(shù)的優(yōu)良估計量的準則為:(1)無偏性。要求樣本統(tǒng)計量的數(shù)學期望值等于被估計參數(shù)的本身。(2)一致性。要求樣本容量n充分大,樣本統(tǒng)計量能靠近被估計參數(shù)的本身。(3)有效性。要求樣本統(tǒng)計量的方差比其他估計量的方差小。2.區(qū)間估計:用取值區(qū)間表現(xiàn)估計結果。區(qū)間估計是用樣本統(tǒng)計量和抽樣標準誤差構成的區(qū)間來估計總體參數(shù),并用一定的概率來保證總體參數(shù)落在所估計的區(qū)間內(nèi)。例如,總體服從正態(tài)分布,樣本容量n>30,則總體平均數(shù)μ的置信區(qū)間為:

即:

其中:Z為標準正態(tài)分布的一定置信概率條件下的概率保證程度(置信度)。△稱為極限誤差,即,為置信區(qū)間下限;為置信區(qū)間上限。稱為抽樣標準誤差,是抽樣方差的平方根。

10.2簡單隨機抽樣

10.2.1簡單隨機抽樣的方法簡單隨機抽樣又稱純隨機抽樣,是指從總體的全部單位中按隨機原則直接抽取n個單位組成樣本進行調(diào)查。簡單隨機抽樣只適用于總體單位數(shù)不多,總體單位標志變異度較小的情形。具體做法有以下三種:

1.信手抽取法。

2.抽簽法。

3.隨機數(shù)表法。

10.2.2簡單隨機抽樣標準誤差10.2.3總體平均數(shù)的估計需要指出的是,在參數(shù)估計時,總體方差往往是不知道的,則可用以往的、類似的、估計的總體方差代替,亦可用樣本方差代替總體方差,只要樣本容量n足夠大(大樣本),仍可用z分布來估計總體平均數(shù)的置信區(qū)間。由于抽樣標準誤差只有總體標準差的1/,在大樣本條件下,樣本方差與總體方差的差異對抽樣標準誤差的影響不大,因而,用樣本方差代替總體方差是一種常用的方法?!纠?0.3】2.小樣本(n<30)的總體平均數(shù)的估計【例10.4】10.2.4兩個總體平均數(shù)之差的區(qū)間估計

【例10.5】1.總體比率的區(qū)間估計若樣本容量n>30,而np和n(1—p)均大于5時,由樣本比率的抽樣分布可知,樣本比率p的抽樣分布也是服從于正態(tài)分布的。因此,可根據(jù)標準正態(tài)分布用樣本比率估計未知的總體比率P,估計公式為:

在實際抽樣時,由于總體比率P常常是未知數(shù),總體方差P(1—P)也難獲知。由點估計理論可知,當樣本容量足夠大時,樣本比率是總體比率的最佳估計量,因此,可用樣本比率p代替上述公式中的總體比率P.【例10.7】2.兩個總體比率之差的估計設兩個總體的比率分別為和,從兩個總體中各抽取一個樣本,樣本容量分別為和。當(1-)和(1-)皆大于5時,兩個樣本比率之差-近似服從正態(tài)分布,因而可用標準正態(tài)分布估計兩個總體比率之差(-)的置信區(qū)間。當總體比率未知時,樣本容量很大時,可用樣本比率代替總體比率進行區(qū)間估計。估計公式為【例10.8】10.2.6簡單隨機抽樣的必要抽樣數(shù)目在設計抽樣調(diào)查方案時,必須確定一個適當?shù)臉颖救萘浚葷M足抽樣推斷結果的準確度的要求,又能滿足節(jié)省工作量和費用的要求。一般來說,確定樣本容量應考慮以下幾個因素:1.總體方差,樣本容量與總體方差成正比。2.極限誤差△。要求極限誤差小,估計的精度高,要求樣本容量應大一些。3.概率度Z。要求置信概率高或把握程度大,樣本容量應大一些。4.抽樣方法。

重復抽樣的樣本容量應大一些;不重復抽樣的樣本容量可小一些。

樣本容量的計算公式,可根據(jù)抽樣極限誤差的公式推導出:(1)抽樣比例n/N較大時(大于5%)時,應采用不重復抽樣公式計算必要的樣本容量。否則,無論采用重復抽樣還是不重復抽樣時,均可用重復抽樣公式計算樣本容量n,可簡化計算,且誤差很小。(2)當總體方差或總體比率P未知時,可用樣本方差(或樣本比率),或歷史的類似的總體方差(或總體比率)代替。計算總體比率估計所需的樣本容量時,亦可直接用P(1-P)的最大值0.25代替。(3)在同一抽樣調(diào)查中,總體均值與總體比率推斷需要兼顧時,用以上公式計算的樣本容量一般不相等,應采用較大的那個樣本容量。10.3分層抽樣10.3.1分層抽樣的意義分層抽樣是先將總體按有關標志分組,然后再從每組中按隨機原則抽取樣本。在每個組中抽取的調(diào)查單位數(shù)目,可按相同比例(n/N)抽取,也可按不同比例抽取。通常按相同比例抽取,稱做等比例分層抽樣。數(shù)理統(tǒng)計證明,對總體進行分層后,總體方差可以分解為層內(nèi)方差和層間方差兩部分,在分層抽樣時,抽樣誤差只和層內(nèi)方差有關,而與層間方差無關。因此,只要擴大層間方差而縮小層內(nèi)方差,就可以提高抽樣的精確度。

10.3.2分層抽樣的抽樣標準誤差由于分層抽樣條件下,層間方差不會引起抽樣誤差,因此,可以各組層內(nèi)方差的加權平均數(shù)代替總體方差以計算抽樣標準誤差。1.總體平均數(shù)估計的抽樣標準誤差設ni、、為樣本各組的單位數(shù)、平均數(shù)、方差、Ni為總體各組的單位數(shù),則:

(1)總體平均數(shù)點估計:(2)層內(nèi)方差平均數(shù):(3)總體平均數(shù)的抽樣標準誤差:

(重復抽樣)(不重復抽樣)2.總體比率估計的抽樣標準誤差設P為總體比率,Pi為樣本各組的比率,則:

(1)總體比率估計

(2)層內(nèi)方差的加權平均數(shù):(3)總體比率估計的抽樣標準誤差(重復抽樣)(不重復抽樣)10.3.3分層抽樣的樣本容量若分層抽樣中,各層均采用重復抽樣,則:

若分層抽樣中,各層均采用不重復抽樣,則:樣本容量n確定之后,各層應抽取的樣本單位數(shù)ni,可采用等比例進行分配:10.4等距抽樣10.4.1

等距抽樣的概念與方法等距抽樣是將總體各單位按一定順序排列,然后每隔N/n個總體單位抽取一個樣本單位組成樣本進行調(diào)查。等距抽樣能使樣本十分均勻地分布在總體中,從而能增加樣本的代表性,減少抽樣誤差,提高抽樣效率。

1.等距抽樣的排序方法(1)按無關標志排隊。即總體單位排列的順序和所要研究的標志是無關的。稱為無序系統(tǒng)抽樣。一般認為,為無序系統(tǒng)抽樣比簡單純隨機抽樣誤差小。(2)按有關標志排隊。即總體單位排列的順序與所要研究的標志是有直接關系的。稱為有序系統(tǒng)抽樣。一般認為有序系統(tǒng)抽樣比分層抽樣誤差更小。2.等距抽樣的方法當總體單位的順序排列之后,可選用下列方法進行等距抽樣:(1)隨機起點等距抽樣。(2)半距起點等距隨機抽樣。用中點法抽取樣本。(3)隨機起點對稱等距抽樣??傻窒虮苊獬闃又械南到y(tǒng)誤差。(4)循環(huán)等距抽樣。10.4.2等距抽樣標準誤差的測定1.無序系統(tǒng)抽樣,采用單純不重復隨機抽樣的公式計算抽樣標準誤差:當總體方差或p(1—p)未知,樣本為大樣本時,可用樣本方差代替。2.采用有序系統(tǒng)抽樣。通常把有序系統(tǒng)抽樣看作是一種特殊的分層抽樣,即把相鄰若干段抽出的樣本單位合并為一組,然后計算各組組內(nèi)方差及平均數(shù),采用等比類型抽樣標準誤差公式計算抽樣標準誤差。

10.4.3等距抽樣樣本容量的確定1.無序系統(tǒng)抽樣的樣本容量。采用簡單隨機抽樣的公式確定樣本容量。由于等距抽樣一般都是不重復抽樣,故應用下列公式確定樣本容量:2.有序系統(tǒng)抽樣的樣本容量的確定,采用分層抽樣的樣本容量公式確定樣本容量n。

10.5整群抽樣

10.5.1整群抽樣的概念整群抽樣是將總體按某一標志分組后形成的每個群視為單位進行隨機抽樣,然后對抽中的每個群進行全面調(diào)查。

整群抽樣的特點是先分群,后抽群作為樣本單位,在抽中的群內(nèi)實行全面調(diào)查。10.5.2整群抽樣標準誤差的測定整群抽樣對群內(nèi)的總體單位實行全面調(diào)查,因而群內(nèi)方差并不引起抽樣誤差,因而,只需以群間方差代替總體方差計算整群抽樣標準誤差,當總體的群間方差未知時,可用樣本群間方差代替。

設總體共分為R群,每群內(nèi)有M個總體單位,樣本容量為r群,各群平均數(shù)為,為群間方差,則有下列計算公式:1.總體均值估計:均值的群間方差:2.總體比率估計:

比率的群間方差:3.整群抽樣標準誤差:

如果為等群抽樣,m1=m2=m3……,則公式中的mi可略去,母項則為r群。10.5.3整群抽樣的樣本容量確定整群抽樣一般是不重復抽樣,故按不重復抽樣計算必要的抽樣群數(shù)γ:其中為群間方差,可根據(jù)以往的資料確定。10.6目錄抽樣10.6.1目錄抽樣的概念

目錄抽樣通常用于企業(yè)調(diào)查,首先編制一份企業(yè)目錄(稱為抽樣框),目錄中一般包括企業(yè)名稱、從業(yè)人數(shù)、產(chǎn)值、產(chǎn)量、利潤等以往的資料。然后,考慮總體分布是否呈偏斜狀態(tài)分布,如果呈極偏斜狀態(tài)分布,則將其中的大中型企業(yè)單列出來作全面調(diào)查,對剩余的為數(shù)眾多的小型企業(yè)實行抽樣調(diào)查。因此,目錄抽樣是全面調(diào)查與抽樣調(diào)查的有機結合。目錄抽樣可以減少抽樣誤差,提高抽樣估計的精確度。10.6.2目錄抽樣的參數(shù)估計目錄抽樣的參數(shù)估計通常是對總體的某一總量指標作出推斷,設Y為總體的總量指標,可分解為兩部分:其中:Y1是全面調(diào)查部分,

Y2是抽樣部分,在抽樣部分中,若采用不重復簡單隨機抽樣,總量指標的抽樣標準誤差為:

10.6.3目錄抽樣中的樣本容量在目標抽樣必須把全部企業(yè)構成的總體劃分普查部分(N1)和抽樣部分(N2)兩部分。而這兩部分的劃分涉及到企業(yè)規(guī)模大小的分界問題。在經(jīng)費固定、費用最低,并具有最大精確度的要求下,如何劃分企業(yè)規(guī)模大小的界線,就是要尋找一個最優(yōu)的切割點。最優(yōu)的切割點是樣本容量與抽樣方差等因素的一個函數(shù),通常利用估計量的相對標準誤差來尋找。一般來說,相對標準誤差在一定范圍內(nèi)將隨著切割點的下降而下降,但超過某一范圍后又會上升,這就可以找出一定樣本量的某一抽樣方案的最小相對標準誤差,以此作為最佳切割點。如果認為相對標準誤差太高,則又可增加樣本量,反之,如果認為太低可減少樣本量。10.7二重抽樣10.7.1二重抽樣的意義二重抽樣是指在抽樣時分兩次抽取樣本,先從總體N中抽取一個較大的初始樣本,以以樣本搜集某個項目的資料,作為進一步抽取第二次樣本的基礎。第一次抽取的較大樣本稱為第一重樣本,再從中抽取的第二次樣本稱為第二重樣本,其目的在于搜集較為具體的資料。由于樣本是分兩次抽取的,故稱作二重抽樣。

二重抽樣主要用于大規(guī)模多項目的調(diào)查。第一重樣本主要對差異較大的項目或精度要求比較高的項目先進行調(diào)查,用于估計、判斷總體的結構、重要指標或掌握輔助指標的有關信息。第二重樣本主要用于對差異較小的項目進行調(diào)查和對總體有關分類指標進行估計推斷。二重抽樣一般有兩種:1.第二重樣本在總體中隨機抽取。即第一、第二重樣本均從總體中隨機抽取,因而第二重樣本不受第一重樣本的影響,二者相互獨立。2.第二重樣本在第一重樣本中抽取。第二重樣本完全落于第一重樣本之中,受第一重樣本的制約,二者不是相互獨立的。為節(jié)省人力、物力和費用,常采用此類二重抽樣法。10.7.2二重抽樣的參數(shù)估計1.比估計的二重抽樣總體均值估計:

總體均值抽樣標準誤差:若第二重樣本從總體中抽取,則:其中:

2.二重分層抽樣如果總體N個單位沒有進行分層,每層的單位數(shù)Ni和比重都是未知的,是不能直接進行分層抽樣的。為此可采用二重分層抽樣。首先,從總體中隨機抽取樣本容量為的第一重樣本,通過某一變量(x)的調(diào)查數(shù)據(jù)對第一重樣本的各個單位進行分層,以計算各層樣本的權數(shù)。然后,再采用等比例分層抽樣法從第一重樣本中抽取樣本容量為n的樣本,借以搜集研究變量y的數(shù)據(jù),據(jù)以推斷總體的均值。即:

總體均值的抽樣標準誤差為:

10.8二階段抽樣

10.8.1二階段抽樣的概念二階段抽樣是在抽取樣本時分兩個階段來進行:第一階段是從總體中用隨機抽樣的方法抽取若干個群體,稱為初級單位。第二階段是從初級單位中再隨機抽取若干樣本單位,又稱基本單位或最終單位。最后,根據(jù)所抽的基本單位組成的樣本進行調(diào)查,用取得的樣本資料來推斷總體。如果在二階段抽樣之后,又繼續(xù)在被抽中的二階單位中進行第三次、第四次隨機抽樣,就形成了三階抽樣、四階抽樣。二階和二階以上的抽樣都叫做多階抽樣。多階段抽樣有利于大規(guī)模大范圍的抽樣調(diào)查的組織與實施,能在一定程度上滿足各級管理部門對調(diào)查資料的需求,有利于減少抽樣誤差,提高抽樣估計的精確度。10.8.2二階段抽樣標準誤差的測定二階段抽樣標準誤差的測定,需要考慮兩部分的抽樣誤差:一是初級單位(群)之間的差異和抽取的初級單位的抽樣數(shù)目n所決定的抽樣誤差。二是第二階段抽樣的基本單位之間的平均方差

和全部基本單位所決定的抽樣誤差。

由于一般采用不重復抽樣,故二階段抽樣標準差測定的基本公式為:

其中:R為總體的群數(shù),r為抽選的群數(shù);M為總體各群的相等的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論