統(tǒng)計(jì)學(xué):第六章抽樣與抽樣分布_第1頁
統(tǒng)計(jì)學(xué):第六章抽樣與抽樣分布_第2頁
統(tǒng)計(jì)學(xué):第六章抽樣與抽樣分布_第3頁
統(tǒng)計(jì)學(xué):第六章抽樣與抽樣分布_第4頁
統(tǒng)計(jì)學(xué):第六章抽樣與抽樣分布_第5頁
已閱讀5頁,還剩80頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院主講:岳志春yuezhichun@163.com統(tǒng)計(jì)學(xué)2/1/20231河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第六章抽樣與抽樣分布

本章內(nèi)容:抽樣與抽樣分布是推斷統(tǒng)計(jì)學(xué)中的最基本內(nèi)容。學(xué)習(xí)本章了解抽樣的概率抽樣方法;理解抽樣分布的概念和形式;掌握樣本平均數(shù)、樣本比例的抽樣分布;了解抽樣組織方式及其抽樣分布。重點(diǎn)是樣本平均數(shù)、樣本比例的抽樣分布。2/1/20232河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第六章抽樣與抽樣分布

本章分三節(jié):第一節(jié)抽樣的基本概念第二節(jié)抽樣分布第三節(jié)抽樣組織方式及其抽樣分布2/1/20233河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第一節(jié)抽樣的基本概念本節(jié)需要把握四個問題:一、總體與樣本;二、抽樣方法;三、抽樣框;四、抽樣誤差。2/1/20234河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院一、總體與樣本把握兩個問題:1、總體和總體參數(shù);2、樣本和樣本統(tǒng)計(jì)量。2/1/20235河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、總體與總體參數(shù)(1)總體:指根據(jù)研究目的確定的所要研究的同類事物的全體,是所要說明其數(shù)量特征的研究對象。按所研究標(biāo)志性質(zhì)不同,分為變量總體和屬性總體,分別研究總體的數(shù)量特征和品質(zhì)特征。構(gòu)成總體的個別事物(基本單元)就是總體單位,也稱個體??傮w單位的總數(shù)稱為總體容量,記作N。2/1/20236河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、總體與總體參數(shù)(2)總體參數(shù):指抽樣估計(jì)中用來反映總體數(shù)量特征的指標(biāo)。研究目的確定后,總體確定,總體參數(shù)存在但未知,需要估計(jì)。A、變量總體中各單位可以直接用數(shù)量表示,設(shè)各單位變量值為:X1,

X2,…XN,則總體參數(shù)有均值,標(biāo)準(zhǔn)差或方差以及總體標(biāo)志總量,即我們研究變量X值的全體,X的取值有一定分布,為一個隨機(jī)變量。

2/1/20237河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院(2)總體參數(shù):B、對于屬性總體,各單位不能用數(shù)值來表示,但可以計(jì)算總體成數(shù),如前面所學(xué)P=N1/N,Q=N0/N,P+Q=1,則總體參數(shù)有均值,標(biāo)準(zhǔn)差或方差以及具有某一屬性的單位總數(shù),即:

1、總體與總體參數(shù)2/1/20238河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、樣本和樣本統(tǒng)計(jì)量

(1)樣本:是從總體中抽出的部分單位的集合,樣本所包含的總體單位個數(shù)稱為樣本容量,一般用n表示。把n≥30的樣本稱為大樣本,n﹤30的樣本稱為小樣本。對于既定總體,由于抽取樣本的方式方法不同,樣本容量可大可小,樣本不確定。樣本的內(nèi)部構(gòu)成與總體內(nèi)部構(gòu)成總有一定差異,即樣本不能完全代表總體,用樣本估計(jì)總體總存在代表性誤差。

樣本個數(shù):又稱樣本可能數(shù)目,它是指從一個總體中可能抽取多少個樣本。樣本個數(shù)的多少與抽樣方法有關(guān)。2/1/20239河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、樣本和樣本統(tǒng)計(jì)量

(2)樣本統(tǒng)計(jì)量:又稱樣本指標(biāo)或估計(jì)量,它是根據(jù)樣本資料計(jì)算的、用以估計(jì)和推斷相應(yīng)總體參數(shù)的綜合指標(biāo),常用的有:2/1/202310河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院二、抽樣方法把握以下問題:1、概率抽樣與非概率抽樣;2、重復(fù)抽樣與不重復(fù)抽樣。2/1/202311河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

(1)概率抽樣:又稱隨機(jī)抽樣,指按隨機(jī)原則抽取樣本。

隨機(jī)原則:就是排除主觀意愿的干擾,使總體的每一個單位都有一定的概率被抽選為樣本單位,每個單位能否入樣是隨機(jī)的。

概率抽樣的基本組織方式有:簡單隨機(jī)抽樣、分層抽樣、等距抽樣和整群抽樣。

1、概率抽樣與非概率抽樣2/1/202312河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、概率抽樣與非概率抽樣(2)概率抽樣的特點(diǎn):A、避免主觀選樣帶來的傾向性誤差(系統(tǒng)偏差),使樣本資料能夠估計(jì)、推斷總體的數(shù)量特征;B、因?yàn)槌闃咏⒃诟怕屎蛿?shù)理統(tǒng)計(jì)基礎(chǔ)上,可以計(jì)算和控制抽樣誤差,能說明估計(jì)結(jié)果的可靠程度。實(shí)際中,在不可能或不必要全面調(diào)查時,常用概率抽樣推斷總體,還可以修正或補(bǔ)充全面調(diào)查的結(jié)果。2/1/202313河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、概率抽樣與非概率抽樣

(3)非概率抽樣:又稱非隨機(jī)抽樣,指從研究目的出發(fā),根據(jù)研究者的經(jīng)驗(yàn)或判斷,從總體中有意識抽取若干個單位構(gòu)成樣本。有重點(diǎn)調(diào)查、典型調(diào)查、配額抽樣、方便抽樣等。

配額抽樣:指抽選一群特定數(shù)目的滿足特定條件的被調(diào)查者的抽樣方法,這群被調(diào)查者已知對此研究主題有用,配額通常是年齡、收入、職業(yè)等,使用配額抽樣有助于降低非概率抽樣方法的偏差。

2/1/202314河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、概率抽樣與非概率抽樣

(4)非概率抽樣:

適用于:了解總體大致情況,總結(jié)經(jīng)驗(yàn)教訓(xùn),進(jìn)行大規(guī)模調(diào)查前的試點(diǎn)等,有其優(yōu)越性。

缺點(diǎn):受主觀影響易產(chǎn)生傾向性誤差;不能計(jì)算、控制誤差,無法說明調(diào)查結(jié)果的可靠程度。抽樣一般都是指概率抽樣。2/1/202315河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、重復(fù)抽樣和非重復(fù)抽樣(1)重復(fù)抽樣:又稱重置抽樣,是指從總體中抽出一個樣本單位,記錄其標(biāo)志值后,又將其放回總體中繼續(xù)參加下一輪單位的抽取。特點(diǎn)是:第一,n個單位的樣本是由n次試驗(yàn)的結(jié)果構(gòu)成的。第二,每次試驗(yàn)是獨(dú)立的,即其試驗(yàn)的結(jié)果與前次、后次的結(jié)果無關(guān)。第三,每次試驗(yàn)是在相同條件下進(jìn)行的,每個單位在多次試驗(yàn)中選中的機(jī)會(概率)是相同的。在重復(fù)試驗(yàn)中,樣本可能的個數(shù)是,N為總體單位數(shù),n為樣本容量。2/1/202316河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、重復(fù)抽樣和非重復(fù)抽樣

(2)非重復(fù)抽樣:又稱為不重置抽樣,即每次從總體抽取一個單位,登記后不放回原總體,不參加下一輪抽樣。下一次繼續(xù)從總體中余下的單位抽取樣本。特點(diǎn)是:第一,n個單位的樣本由n

次試驗(yàn)結(jié)果構(gòu)成,但由于每次抽出不重復(fù),所以實(shí)質(zhì)上相當(dāng)于從總體中同時抽取n個樣本單位。第二,每次試驗(yàn)結(jié)果不是獨(dú)立的,上次中選情況影響下次抽選結(jié)果。第三,每個單位在多次(輪)試驗(yàn)中中選的機(jī)會是不等的。不重復(fù)抽樣,如果是考慮順序,其樣本可能個數(shù)為;如果不考慮順序,其樣本可能個數(shù)為。2/1/202317河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院三、抽樣框把握以下問題:1、概念;2、抽樣框的形式;3、對抽樣框的要求。2/1/202318河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、概念抽樣框:指包括全部抽樣單位的名單框架。調(diào)查目的確定后,總體隨之確定,總體又叫目標(biāo)總體,即理論上的抽樣范圍,與實(shí)際抽樣的總體范圍有時不一致。此外抽樣單位可以是個總體單位,也可以是若干總體單位的集合。如某省進(jìn)行農(nóng)戶收支調(diào)查,目標(biāo)總體是全省所有農(nóng)戶,抽樣單位可以是每個農(nóng)戶,也可以是每個鄉(xiāng)或村。所以,有目標(biāo)總體后還必須明確實(shí)際進(jìn)行抽樣的總體范圍和抽樣單位。2/1/202319河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、抽樣框的形式

(1)名單抽樣框:列出全部總體單位的名錄一覽表,如職工名單、企業(yè)名單等。

(2)區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小區(qū)域,以小區(qū)域?yàn)槌闃訂挝?。如某市居民住房調(diào)查,將全市居民戶劃分為若干街道或片區(qū)。

(3)時間表抽樣框:將總體全部單位按時間順序排列,把總體的時間過程分為若干小的時間單位,以時間單位作為抽樣單位。如對流水線上24小時內(nèi)生產(chǎn)的產(chǎn)品進(jìn)行質(zhì)量抽檢。2/1/202320河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

3、對抽樣框的要求(1)應(yīng)與目標(biāo)總體一致,即包括全部總體單位,不重不漏,否則破壞隨機(jī)原則。例如,對某市居民進(jìn)行抽查,以電話號碼本為抽樣框不科學(xué)。(2)盡可能利用與所研究變量高度相關(guān)的輔助變量的信息,設(shè)計(jì)最佳的抽樣組織方式和抽樣估計(jì)方法。2/1/202321河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院四、抽樣誤差把握以下問題:1、調(diào)查誤差概念及其分類;2、實(shí)際抽樣誤差;3、抽樣平均誤差;4、抽樣極限誤差。2/1/202322河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、調(diào)查誤差概念及其分類(1)統(tǒng)計(jì)調(diào)查的誤差:指調(diào)查結(jié)果與總體真值間的差異。

(2)分為登記性誤差和代表性誤差:

A、登記性誤差:指在調(diào)查和匯總過程中由于觀察、測量、登記、計(jì)算等方面的差錯或被調(diào)查者提供虛假資料造成的誤差。它是任何一種統(tǒng)計(jì)調(diào)查都可能產(chǎn)生的,可以避免。2/1/202323河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、調(diào)查誤差概念及其分類

(2)分為登記性誤差和代表性誤差:B、代表性誤差:指用樣本指標(biāo)推斷總體指標(biāo)時,由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)的不一致,樣本不能完全代表總體而產(chǎn)生的誤差。代表性誤差又分為系統(tǒng)誤差和隨機(jī)誤差:a、系統(tǒng)誤差又稱偏差,指非隨機(jī)因素引起的樣本代表性不足產(chǎn)生的誤差,可以避免;b、隨機(jī)誤差,又稱偶然性誤差、抽樣誤差,隨機(jī)因素引起的代表性誤差,不可避免,但可以計(jì)算并加以控制。2/1/202324河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、實(shí)際抽樣誤差(1)實(shí)際抽樣誤差指某一具體樣本的樣本估計(jì)值與總體參數(shù)的真實(shí)值之間的離差。實(shí)際中,總體參數(shù)未知,誤差無法計(jì)算。平均數(shù)的誤差:成數(shù)的誤差:p-P2/1/202325河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、實(shí)際抽樣誤差(2)由于樣本隨機(jī)抽取,估計(jì)量是隨樣本不同而不同的隨機(jī)變量,所以實(shí)際抽樣誤差是隨機(jī)變量,可正可負(fù),可大可小。就某個既定的抽樣方案,樣本估計(jì)量所有可能值有一定的分布規(guī)律,它們與總體參數(shù)的離差即抽樣誤差也有一定的規(guī)律。實(shí)際中真正計(jì)算、控制的誤差并不是該誤差。2/1/202326河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、抽樣平均誤差(1)它是反映抽樣誤差一般水平的指標(biāo)。常用樣本估計(jì)量的標(biāo)準(zhǔn)差反映所有可能樣本估計(jì)量與其中心的平均離散程度,即抽樣平均數(shù)或抽樣成數(shù)的標(biāo)準(zhǔn)差,公式為:則抽樣平均數(shù)、抽樣成數(shù)的標(biāo)準(zhǔn)差分別為:2/1/202327河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、抽樣平均誤差(2)又因?yàn)?,則上式變?yōu)榉从乘锌赡軜颖镜墓烙?jì)值與總體參數(shù)的平均差異程度,即抽樣平均誤差,可以衡量樣本對總體的代表性大小,它越小則統(tǒng)計(jì)量的分布就越集中在總體參數(shù)的附近。抽樣平均數(shù)、抽樣成數(shù)的標(biāo)準(zhǔn)差變?yōu)椋毫硪粋€概念是抽樣方差為抽樣平均誤差的平方。2/1/202328河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院4、抽樣極限誤差(1)它是指一定概率下樣本指標(biāo)與總體參數(shù)間抽樣誤差的可能范圍,又稱允許誤差。因?yàn)榭傮w參數(shù)確定,統(tǒng)計(jì)量圍繞其左右變動,用統(tǒng)計(jì)量與總體參數(shù)之差的絕對值表示誤差的可能范圍。公式表示:在一定概率下:平均數(shù)、比例的抽樣極限誤差,在一定概率下,2/1/202329河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院4、抽樣極限誤差(2)抽樣極限誤差是抽樣誤差的可能范圍而非完全肯定范圍,可能范圍大小與這一估計(jì)的可能性大小即概率緊密聯(lián)系,這個概率被稱為置信度或可信程度、把握程度、概率保證程度等,表示為,其他條件不變的情況下,抽樣極限誤差越大,置信度越大。2/1/202330河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院4、抽樣極限誤差(3)相關(guān)概念:抽樣誤差率=(抽樣極限誤差/估計(jì)量)×100%,抽樣估計(jì)精度=100%-抽樣誤差率估計(jì)精度與置信度矛盾。其他條件不變下,提高估計(jì)置信度,增大允許誤差,使精度降低;反之,提高精度會降低置信度。實(shí)際中根據(jù)具體情況,可先確定置信度再求極限誤差或先確定極限誤差再求相應(yīng)的把握程度。2/1/202331河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

第二節(jié)抽樣分布本節(jié)只討論重復(fù)的簡單隨機(jī)抽樣,所得容量為n的樣本(x1,x2…

xn)稱為簡單隨機(jī)樣本,它滿足兩個條件:x1,x2…

xn相互獨(dú)立;每個xi(i=1,2,…,n)都與總體X同分布。把握以下問題:一、抽樣分布的概念;二、抽樣平均數(shù)的抽樣分布;三、樣本比例的抽樣分布;四、不重復(fù)抽樣的修正系數(shù)。2/1/202332河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院一、抽樣分布的概念把握以下問題:1、抽樣分布的概念;2、尋求抽樣分布的方法。2/1/202333河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、抽樣分布的概念(1)它是指樣本統(tǒng)計(jì)量的概率分布。每個隨機(jī)變量都有其概率分布,樣本統(tǒng)計(jì)量是隨機(jī)變量,有若干可能取值,每個取值有一定的可能性即概率,從而形成統(tǒng)計(jì)量的概率分布。樣本統(tǒng)計(jì)量是由n個隨機(jī)變量構(gòu)成的樣本函數(shù),抽樣分布屬于隨機(jī)變量函數(shù)的分布。2/1/202334河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、抽樣分布的概念(2)例如,總體有N個單位,隨機(jī)抽取n個單位進(jìn)行調(diào)查,可抽取個樣本,得個不盡相同的樣本平均數(shù),將樣本平均數(shù)全部可能取值及其出現(xiàn)的概率依序排列得到樣本平均數(shù)的概率分布即平均數(shù)的抽樣分布。同理得到比例的抽樣分布、樣本標(biāo)準(zhǔn)差的抽樣分布。對于抽樣分布,同樣可以計(jì)算其均值和方差(或標(biāo)準(zhǔn)差)等數(shù)字特征反映該分布的集中、離散趨勢。2/1/202335河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、抽樣分布的概念(3)抽樣分布反映樣本統(tǒng)計(jì)量的分布特征,是抽樣推斷的重要依據(jù),根據(jù)其分布規(guī)律,可以揭示樣本指標(biāo)與總體參數(shù)間的關(guān)系,估計(jì)抽樣誤差,說明抽樣推斷的可靠程度。2/1/202336河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、尋求抽樣分布的方法有精確方法和大樣本方法,形成精確和漸近抽樣分布。(1)當(dāng)總體分布類型已知,對任一自然數(shù)n能導(dǎo)出統(tǒng)計(jì)量的分布的明顯表達(dá)式,稱為精確方法,所得分布為精確分布。當(dāng)n較小時特別有用,又稱小樣本方法,大多是在正態(tài)總體條件下得到的。2/1/202337河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、尋求抽樣分布的方法(2)大多數(shù)場合,精確分布很難求出或表達(dá)式復(fù)雜,借助極限定理,尋求n無限增大時統(tǒng)計(jì)量的極限分布,用極限分布當(dāng)作所求抽樣分布的近似,稱為大樣本方法,這種極限分布稱為漸近分布。在抽樣推斷中,許多場合下統(tǒng)計(jì)量服從正態(tài)分布或以正態(tài)分布為漸近分布,此外還有分布、

t分布、F分布等精確抽樣分布。2/1/202338河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院二、抽樣平均數(shù)的抽樣分布

把握以下問題:1、總體方差已知時,樣本平均數(shù)的抽樣分布;2、總體方差未知時,樣本平均數(shù)的抽樣分布。2/1/202339河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(1)定理1:設(shè)總體是一個簡單隨機(jī)樣本,則樣本平均數(shù)證明:因?yàn)榭傮w是其一個簡單隨機(jī)樣本,所以相互獨(dú)立且都服從,由概率論知,相互獨(dú)立的正態(tài)隨機(jī)變量和服從正態(tài)分布,其線性函數(shù)也服從正態(tài)分布。2/1/202340河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(1)定理1的證明:而且,所以,將樣本平均數(shù)標(biāo)準(zhǔn)化,有:2/1/202341河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(2)定理2:若總體平均數(shù)和方差有限,當(dāng)樣本容量n充分大時,無論總體形式如何,樣本平均數(shù)近似服從正態(tài)分布(3)由定理知,樣本平均數(shù)是以總體平均數(shù)為分布中心,且n愈大,樣本平均數(shù)的離散程度愈小,抽樣誤差愈小。由此得出抽樣平均數(shù)的標(biāo)準(zhǔn)差即抽樣平均誤差的公式為:實(shí)際計(jì)算中,總體標(biāo)準(zhǔn)差未知,可用以前的標(biāo)準(zhǔn)差代替;大樣本下,用樣本標(biāo)準(zhǔn)差代替。2/1/202342河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(4)由公式(6.6)知,影響抽樣平均誤差的因素:A、總體方差或標(biāo)準(zhǔn)差,即總體各單位變量值的差異程度;B、樣本容量,容量越大,誤差越小;C、抽樣方法(重復(fù)、不重復(fù)抽樣)和抽樣組織方式(分層抽樣、等距抽樣等)。2/1/202343河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、總體方差未知時,樣本平均數(shù)的抽樣分布(小樣本)定理3:設(shè)總體是一個簡單隨機(jī)樣本,樣本均值為,樣本標(biāo)準(zhǔn)差為S,則統(tǒng)計(jì)量2/1/202344河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

三、樣本比例的抽樣分布把握以下問題:1、總體比例與樣本比例;2、樣本比例的抽樣分布。2/1/202345河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、總體比例與樣本比例總體中具有某種特征的單位占全部單位的比例稱作總體比例,記做P;樣本中具有此種特征的單位占全部樣本單位的比例稱作樣本比例,記做p。實(shí)際中如產(chǎn)品的合格率、某電視節(jié)目的收視率等。2/1/202346河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、樣本比例的抽樣分布(1)X服從二項(xiàng)分布,且有E(X)=nP,V(X)=nP(1-P),當(dāng)從總體中抽出一個容量為n的樣本時,樣本中具有某種特征的單位數(shù)x服從二項(xiàng)分布,即x~B(n,p),因而樣本比例p=x/n也服從二項(xiàng)分布,且有:2/1/202347河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、樣本比例的抽樣分布(2)根據(jù)中心極限定理,當(dāng)二項(xiàng)分布趨于正態(tài)分布,大樣本下,若nP、n(1-P)皆大于5,樣本比例近似服從正態(tài)分布:p~N(P,P(1-P)/n)),則比例的抽樣平均誤差為:實(shí)際中,用以前的總體比例或樣本比例

p代替。2/1/202348河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

四、不重復(fù)抽樣的修正系數(shù)1、與重復(fù)抽樣比,由于樣本單位不重復(fù),樣本單位很可能在總體中更均勻的分布,從而樣本結(jié)構(gòu)更能與總體結(jié)構(gòu)近似,因此不重復(fù)抽樣所得樣本對總體的代表性更大,抽樣誤差較小。前面所講的抽樣分布和抽樣平均誤差公式都是就重復(fù)抽樣而言。

2/1/202349河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院四、不重復(fù)抽樣的修正系數(shù)2、不重復(fù)抽樣的抽樣平均誤差為:其中稱為不重復(fù)抽樣的修正系數(shù),N很大時,其他條件相同下,不重復(fù)抽樣誤差小于重復(fù)抽樣。當(dāng)N很大而n很小時,系數(shù)接近1,二者相差不大。因此,無限總體都可以用重復(fù)抽樣的平均誤差公式度量抽樣誤差;有限總體當(dāng)抽樣比例很小時(一般小于5%),也常用重復(fù)抽樣公式計(jì)算。2/1/202350河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院第三節(jié)抽樣組織方式及其抽樣分布把握以下問題:一、簡單隨機(jī)抽樣;二、分層抽樣;三、等距抽樣;四、整群抽樣;五、抽樣組織方式的選擇。2/1/202351河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院一、簡單隨機(jī)抽樣它是最基本的抽樣組織方式,常用方法有抽簽法、利用隨機(jī)數(shù)表取數(shù)法和電子計(jì)算機(jī)取數(shù)法。它隊(duì)對總體單位不進(jìn)行任何劃分或排隊(duì),完全隨機(jī)地直接從總體中抽取樣本單位,使每個單位都有完全均等的機(jī)會被抽中,故又稱純隨機(jī)抽樣。它只對總體單位進(jìn)行編號。這樣估計(jì)的效率低,進(jìn)行大規(guī)模抽樣調(diào)查時,工作不易展開。2/1/202352河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院二、分層抽樣及其抽樣估計(jì)把握以下問題:1、分層抽樣的概念及特點(diǎn);2、等比例分層抽樣方式;3、抽樣平均誤差的計(jì)算;4、例6-1。2/1/202353河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、分層抽樣的概念及特點(diǎn)(1)也稱類型抽樣,它是按一定標(biāo)志對總體各單位進(jìn)行分類(或?qū)?、子總體),然后分別從每一類中按隨機(jī)原則抽取一定的單位構(gòu)成樣本。例如,抽樣調(diào)查一個城市居民收入分配狀況,如果歷史資料反映了該城市居民的貧富結(jié)構(gòu):高收入者、中等收入者與低收入者的比例結(jié)構(gòu),我們可以按此結(jié)構(gòu)分類分別從高收入者、中等收入者與低收入者中按一定的比例抽取樣本。2/1/202354河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院1、分層抽樣的概念及特點(diǎn)(2)特點(diǎn):類型抽樣是統(tǒng)計(jì)分組與抽樣原理的結(jié)合,可以提高樣本的代表性;不僅可以用樣本推斷總體,還可以推斷子總體指標(biāo)。前提是對總體的結(jié)構(gòu)有著一定的了解,為了充分利用這些信息,提高估計(jì)的精確性,對總體按確定標(biāo)志進(jìn)行分類,保證抽出的樣本與總體盡可能保持相似的結(jié)構(gòu)。2/1/202355河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、等比例分層抽樣方式分層抽樣可分為等比例和不等比例分層抽樣,實(shí)際中采用等比例分層抽樣。(1)設(shè)總體由N個單位組成,按對總體的認(rèn)識,把總體分為k組,使得:然后相應(yīng)從各組中分別按隨機(jī)方式抽出個單位組成樣本。設(shè)樣本容量為n,它滿足:2/1/202356河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、等比例分層抽樣方式(2)比例抽樣方式就是從每一類抽取時要求兩者間保持合適的比例,也就是保持各組樣本單位數(shù)與總體同組單位數(shù)之比,等于樣本容量與總體單位數(shù)之比,即所以各組的樣本單位數(shù)應(yīng)為:

2/1/202357河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、抽樣平均誤差的計(jì)算和區(qū)間估計(jì)(1)步驟:設(shè)樣本是:樣本抽出來后:第一步:計(jì)算各組平均數(shù)第二步:將各組平均數(shù)以各組單位數(shù)或各樣本組單位數(shù)為權(quán)數(shù),進(jìn)行加權(quán)平均,求出樣本平均數(shù)2/1/202358河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、抽樣平均誤差的計(jì)算和區(qū)間估計(jì)(1)步驟:第三步:計(jì)算分層抽樣的抽樣平均誤差,第i組的組內(nèi)標(biāo)準(zhǔn)差為第i組的抽樣平均誤差為:即為的方差,表示從第i組中抽樣計(jì)算平均數(shù)的方差,樣本平均數(shù)的方差為,樣本平均數(shù)的抽樣平均誤差為記表示組(層)內(nèi)方差平均數(shù)。2/1/202359河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

3、抽樣平均誤差的計(jì)算和區(qū)間估計(jì)(1)步驟:同樣可計(jì)算在不重復(fù)抽樣條件下的抽樣平均誤差為:2/1/202360河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

3、抽樣平均誤差的計(jì)算(2)分析:在分組下,總方差=組內(nèi)方差平均數(shù)+組間方差,通過比較,分層抽樣的抽樣平均誤差小于簡單隨機(jī)抽樣的抽樣誤差。對于給定的總體,總體方差一定,劃分層時應(yīng)盡量增大層間差異,縮小層內(nèi)差異。因?yàn)閷觾?nèi)差異越小。分層抽樣的抽樣平均誤差越小,參數(shù)估計(jì)的效率越高。2/1/202361河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院例6-1某地區(qū)對居民在一年內(nèi)用于某類消費(fèi)的支出進(jìn)行等比例分層抽樣,結(jié)果見表,要求計(jì)算該地區(qū)平均每戶支出的抽樣平均誤差和抽樣極限誤差。

調(diào)查戶數(shù)平均支出(元)

方差城鎮(zhèn)403502209農(nóng)村

8026029162/1/202362河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院4、例6-1解:樣本平均數(shù)是:層內(nèi)方差平均數(shù):

抽樣平均誤差:抽樣極限誤差:2/1/202363河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院三、等距抽樣把握以下問題:1、等距抽樣的概念和特點(diǎn);2、無關(guān)標(biāo)志排隊(duì)等距抽樣;3、有關(guān)標(biāo)志排隊(duì)等距抽樣。2/1/202364河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、等距抽樣的概念和特點(diǎn)(1)又稱機(jī)械抽樣或系統(tǒng)抽樣,它是將總體各單位按某一標(biāo)志進(jìn)行排隊(duì),計(jì)算出抽樣間隔,并在第一個抽樣間隔內(nèi)確定一個抽樣起點(diǎn),再按固定的順序和間隔來抽取樣本單位的抽樣組織形式。根據(jù)需要抽取的樣本單位數(shù)n和總體的單位數(shù)N,可以計(jì)算出等距抽樣的間隔大小:K=N/n

,再從第一至第K個單位的范圍內(nèi)確定抽樣起點(diǎn),之后每隔K個單位抽取一個樣本單位。2/1/202365河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、等距抽樣的概念和特點(diǎn)(2)優(yōu)越性:提高樣本單位分布的均勻性,樣本代表性強(qiáng),一般工作易開展,實(shí)際應(yīng)用廣泛。但等距抽樣在排隊(duì)后,抽樣起點(diǎn)一確定,整個樣本就確定了。其隨機(jī)性體現(xiàn)在排隊(duì)和抽樣起點(diǎn)的確定上。按排隊(duì)標(biāo)志與調(diào)查內(nèi)容的關(guān)系,等距抽樣分為無關(guān)標(biāo)志、有關(guān)標(biāo)志排隊(duì)等距抽樣,二者抽樣起點(diǎn)確定方式、抽樣效果不同。2/1/202366河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、無關(guān)標(biāo)志排隊(duì)等距抽樣

(1)它是指等距抽樣據(jù)以排隊(duì)的標(biāo)志與調(diào)查內(nèi)容沒有直接關(guān)系。例如,城市居民家計(jì)調(diào)查時,將居民按其居住的街道門牌號碼排隊(duì);產(chǎn)品質(zhì)量檢查按產(chǎn)品生產(chǎn)的時間先后順序排隊(duì),每個一定時間或每生產(chǎn)一定數(shù)量的產(chǎn)品抽取一單位產(chǎn)品。2/1/202367河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院2、無關(guān)標(biāo)志排隊(duì)等距抽樣(2)抽樣起點(diǎn)的確定:從所要調(diào)查的標(biāo)志看,總體單位的排序仍是隨機(jī)的,抽樣起點(diǎn)r可以隨機(jī)確定,即1≤r≤K,遵循隨機(jī)原則,避免系統(tǒng)偏差。(3)無關(guān)標(biāo)志排隊(duì)等距抽樣的效果接近于簡單隨機(jī)抽樣的效果,其抽樣誤差通常按簡單隨機(jī)抽樣的抽樣誤差公式近似計(jì)算。2/1/202368河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

3、有關(guān)標(biāo)志排隊(duì)等距抽樣

(1)它是指排隊(duì)標(biāo)志與調(diào)查內(nèi)容有關(guān),例如職工家計(jì)調(diào)查按職工工資水平排隊(duì)。(2)在排隊(duì)后,從所調(diào)查變量看,總體單位也大致呈順序排列,其抽樣起點(diǎn)不宜隨機(jī)確定。否則,若第一個間隔內(nèi)隨機(jī)抽取一個標(biāo)志值較?。ɑ虼螅┑膯挝蛔髌瘘c(diǎn),整個樣本會出現(xiàn)偏低(或高)的系統(tǒng)偏差。2/1/202369河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、有關(guān)標(biāo)志排隊(duì)等距抽樣

(3)半距起點(diǎn)等距抽樣(中心系統(tǒng)抽樣):以第一個抽樣距離的一半為抽樣起點(diǎn)(r=k/2)并每間隔k個單位抽一個單位。這樣樣本單位是處于每個抽樣距離(組)中點(diǎn)的總體單位。因單位變量值大致呈順序排列,所以這些單位變量值能代表所在間距內(nèi)的一般水平,由此樣本代表性較高。但這種取樣限制抽樣的隨機(jī)性,且只能抽取出一個樣本。2/1/202370河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

3、有關(guān)標(biāo)志排隊(duì)等距抽樣

(4)對稱等距抽樣:在第一個間距內(nèi)隨機(jī)確定起點(diǎn)r(1≤r≤k),然后以組界[k,2k,…,(n-1)k]為對稱點(diǎn)兩兩對稱地抽取樣本單位,看書上圖,知第一組內(nèi)r偏小,但第二組內(nèi)樣本單位(2k-r)偏大;反之,第二組內(nèi)r偏大,則第二個樣本單位偏小,這樣整體看,樣本有較好的代表性,又保證抽樣的隨機(jī)性,根據(jù)排隊(duì)結(jié)果可以抽出k個樣本2/1/202371河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院3、有關(guān)標(biāo)志排隊(duì)等距抽樣(5)有關(guān)標(biāo)志排隊(duì)等距抽樣相當(dāng)于分層較多(將總體分為同等大小的n個層)而每層只抽取一個調(diào)查單位的分層抽樣,所以抽樣效果類似于分層抽樣,抽樣誤差一般按分層抽樣的誤差公式近似計(jì)算。2/1/202372河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院四、整群抽樣把握以下問題:1、整群抽樣的概念和特點(diǎn);2、整群抽樣的抽樣平均誤差;3、例6-2。2/1/202373河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、整群抽樣的概念和特點(diǎn)(1)整群抽樣又稱集團(tuán)抽樣,就是將總體各單位分成若干群,然后從其中隨機(jī)抽取部分群,對中選的群進(jìn)行全面調(diào)查的抽樣組織方式。例如居民家計(jì)調(diào)查,以一個鄉(xiāng)(或街道)的所有住戶或所有人口為一群,對抽中的鄉(xiāng)或街道的住戶或人口進(jìn)行全面調(diào)查。2/1/202374河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

1、整群抽樣的概念和特點(diǎn)(2)這種方式是整群的抽取樣本單位,只需對各群編號,簡化工作,抽樣單位集中,便于集中調(diào)查,簡單方便又節(jié)省人力、物力、財(cái)力和時間,應(yīng)用廣泛。但抽樣單位集中,抽樣單位在總體中分布不夠均勻。在其他條件相同下,其樣本代表性可能較差,要適當(dāng)多抽一些樣本單位。2/1/202375河北工程大學(xué)經(jīng)濟(jì)管理學(xué)院

2、整群抽樣的抽樣平均誤差

(1)整群抽樣的代表性取決于抽中群之間的差異,差異大,代表性差。因此其誤差與群間差異有關(guān),與群內(nèi)差異無關(guān)。(2)設(shè)總體的全部N個單位被劃分為R群,每群含有M個單位?,F(xiàn)在從總體R群中隨機(jī)抽出r群組成樣本,對中選的群中的所有單位進(jìn)行全面調(diào)查。群的平均數(shù)是:樣本均值是:2/1/202376

2、整群抽樣的抽樣平均誤差(2)從上式可以看出,整群抽樣實(shí)質(zhì)上是以群代替總體單位,以群平均數(shù)代替總體單位標(biāo)志值之后的簡單隨機(jī)抽樣。群間方差是:或者由樣本數(shù)據(jù)估計(jì):因此,樣本平均數(shù)的抽樣平均誤差是:上式中出現(xiàn)修正系數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論