抽樣和抽樣分布PPT_第1頁
抽樣和抽樣分布PPT_第2頁
抽樣和抽樣分布PPT_第3頁
抽樣和抽樣分布PPT_第4頁
抽樣和抽樣分布PPT_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于抽樣與抽樣分布PPT第一張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.20221河北工程大學(xué)經(jīng)濟管理學(xué)院第六章 抽樣與抽樣分布 本章內(nèi)容:抽樣與抽樣分布是推斷統(tǒng)計學(xué)中的最基本內(nèi)容。學(xué)習(xí)本章了解抽樣的概率抽樣方法;理解抽樣分布的概念和形式;掌握樣本平均數(shù)、樣本比例的抽樣分布;了解抽樣組織方式及其抽樣分布。重點是樣本平均數(shù)、樣本比例的抽樣分布。第二張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.20222河北工程大學(xué)經(jīng)濟管理學(xué)院 第六章 抽樣與抽樣分布 本章分三節(jié):第一節(jié) 抽樣的基本概念第二節(jié) 抽樣分布第三節(jié) 抽樣組織方式及其抽樣分布 第三張,PPT共八十四頁,創(chuàng)作于2022年6

2、月02.08.20223河北工程大學(xué)經(jīng)濟管理學(xué)院第一節(jié) 抽樣的基本概念本節(jié)需要把握四個問題:一、總體與樣本;二、抽樣方法;三、抽樣框;四、抽樣誤差。第四張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.20224河北工程大學(xué)經(jīng)濟管理學(xué)院一、總體與樣本把握兩個問題:1、總體和總體參數(shù);2、樣本和樣本統(tǒng)計量。第五張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.20225河北工程大學(xué)經(jīng)濟管理學(xué)院 1、總體與總體參數(shù)(1)總體:指根據(jù)研究目的確定的所要研究的同類事物的全體,是所要說明其數(shù)量特征的研究對象。按所研究標(biāo)志性質(zhì)不同,分為變量總體和屬性總體,分別研究總體的數(shù)量特征和品質(zhì)特征。 構(gòu)成總

3、體的個別事物(基本單元)就是總體單位,也稱個體??傮w單位的總數(shù)稱為總體容量,記作N。第六張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.20226河北工程大學(xué)經(jīng)濟管理學(xué)院 1、總體與總體參數(shù)(2)總體參數(shù):指抽樣估計中用來反映總體數(shù)量特征的指標(biāo)。研究目的確定后,總體確定,總體參數(shù)存在但未知,需要估計。A、變量總體中各單位可以直接用數(shù)量表示,設(shè)各單位變量值為:X1, X2, XN,則總體參數(shù)有均值,標(biāo)準(zhǔn)差或方差以及總體標(biāo)志總量,即我們研究變量X值的全體,X的取值有一定分布,為一個隨機變量。 第七張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.20227河北工程大學(xué)經(jīng)濟管理學(xué)院(2)總

4、體參數(shù):B、對于屬性總體,各單位不能用數(shù)值來表示,但可以計算總體成數(shù),如前面所學(xué)P=N1/ N,Q=N0/N,P+Q=1,則總體參數(shù)有均值,標(biāo)準(zhǔn)差或方差以及具有某一屬性的單位總數(shù),即: 1、總體與總體參數(shù)第八張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.20228河北工程大學(xué)經(jīng)濟管理學(xué)院 2、樣本和樣本統(tǒng)計量 (1)樣本:是從總體中抽出的部分單位的集合,樣本所包含的總體單位個數(shù)稱為樣本容量,一般用n表示。把n30的樣本稱為大樣本, n30的樣本稱為小樣本。對于既定總體,由于抽取樣本的方式方法不同,樣本容量可大可小,樣本不確定。樣本的內(nèi)部構(gòu)成與總體內(nèi)部構(gòu)成總有一定差異,即樣本不能完全代表

5、總體,用樣本估計總體總存在代表性誤差。 樣本個數(shù):又稱樣本可能數(shù)目,它是指從一個總體中可能抽取多少個樣本。樣本個數(shù)的多少與抽樣方法有關(guān)。 第九張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.20229河北工程大學(xué)經(jīng)濟管理學(xué)院 2、樣本和樣本統(tǒng)計量 (2)樣本統(tǒng)計量:又稱樣本指標(biāo)或估計量,它是根據(jù)樣本資料計算的、用以估計和推斷相應(yīng)總體參數(shù)的綜合指標(biāo),常用的有:第十張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202210河北工程大學(xué)經(jīng)濟管理學(xué)院二、抽樣方法把握以下問題:1、概率抽樣與非概率抽樣;2、重復(fù)抽樣與不重復(fù)抽樣。第十一張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.2

6、02211河北工程大學(xué)經(jīng)濟管理學(xué)院 (1)概率抽樣:又稱隨機抽樣,指按隨機原則抽取樣本。 隨機原則:就是排除主觀意愿的干擾,使總體的每一個單位都有一定的概率被抽選為樣本單位,每個單位能否入樣是隨機的。 概率抽樣的基本組織方式有:簡單隨機抽樣、分層抽樣、等距抽樣和整群抽樣。 1、概率抽樣與非概率抽樣第十二張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202212河北工程大學(xué)經(jīng)濟管理學(xué)院 1、概率抽樣與非概率抽樣(2)概率抽樣的特點:A、避免主觀選樣帶來的傾向性誤差(系統(tǒng)偏差),使樣本資料能夠估計、推斷總體的數(shù)量特征;B、因為抽樣建立在概率和數(shù)理統(tǒng)計基礎(chǔ)上,可以計算和控制抽樣誤差,能說明估

7、計結(jié)果的可靠程度。實際中,在不可能或不必要全面調(diào)查時,常用概率抽樣推斷總體,還可以修正或補充全面調(diào)查的結(jié)果。第十三張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202213河北工程大學(xué)經(jīng)濟管理學(xué)院 1、概率抽樣與非概率抽樣 (3)非概率抽樣:又稱非隨機抽樣,指從研究目的出發(fā),根據(jù)研究者的經(jīng)驗或判斷,從總體中有意識抽取若干個單位構(gòu)成樣本。有重點調(diào)查、典型調(diào)查、配額抽樣、方便抽樣等 。 配額抽樣:指抽選一群特定數(shù)目的滿足特定條件的被調(diào)查者的抽樣方法,這群被調(diào)查者已知對此研究主題有用,配額通常是年齡、收入、職業(yè)等,使用配額抽樣有助于降低非概率抽樣方法的偏差。 第十四張,PPT共八十四頁,創(chuàng)作

8、于2022年6月02.08.202214河北工程大學(xué)經(jīng)濟管理學(xué)院1、概率抽樣與非概率抽樣 (4)非概率抽樣: 適用于:了解總體大致情況,總結(jié)經(jīng)驗教訓(xùn),進(jìn)行大規(guī)模調(diào)查前的試點等,有其優(yōu)越性。 缺點:受主觀影響易產(chǎn)生傾向性誤差;不能計算、控制誤差,無法說明調(diào)查結(jié)果的可靠程度。抽樣一般都是指概率抽樣。第十五張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202215河北工程大學(xué)經(jīng)濟管理學(xué)院2、重復(fù)抽樣和非重復(fù)抽樣(1)重復(fù)抽樣:又稱重置抽樣,是指從總體中抽出一個樣本單位,記錄其標(biāo)志值后,又將其放回總體中繼續(xù)參加下一輪單位的抽取。特點是:第一,n個單位的樣本是由n次試驗的結(jié)果構(gòu)成的。第二,每次試

9、驗是獨立的,即其試驗的結(jié)果與前次、后次的結(jié)果無關(guān)。第三,每次試驗是在相同條件下進(jìn)行的,每個單位在多次試驗中選中的機會(概率)是相同的。在重復(fù)試驗中,樣本可能的個數(shù)是 ,N為總體單位數(shù),n為樣本容量。第十六張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202216河北工程大學(xué)經(jīng)濟管理學(xué)院2、重復(fù)抽樣和非重復(fù)抽樣 (2)非重復(fù)抽樣:又稱為不重置抽樣,即每次從總體抽取一個單位,登記后不放回原總體,不參加下一輪抽樣。下一次繼續(xù)從總體中余下的單位抽取樣本。特點是:第一,n個單位的樣本由 n 次試驗結(jié)果構(gòu)成,但由于每次抽出不重復(fù),所以實質(zhì)上相當(dāng)于從總體中同時抽取n個樣本單位。第二,每次試驗結(jié)果不是

10、獨立的,上次中選情況影響下次抽選結(jié)果。第三,每個單位在多次(輪)試驗中中選的機會是不等的。不重復(fù)抽樣,如果是考慮順序,其樣本可能個數(shù)為 ;如果不考慮順序,其樣本可能個數(shù)為 。第十七張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202217河北工程大學(xué)經(jīng)濟管理學(xué)院三、抽樣框把握以下問題:1、概念;2、抽樣框的形式;3、對抽樣框的要求。第十八張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202218河北工程大學(xué)經(jīng)濟管理學(xué)院1、概念抽樣框:指包括全部抽樣單位的名單框架。調(diào)查目的確定后,總體隨之確定,總體又叫目標(biāo)總體,即理論上的抽樣范圍,與實際抽樣的總體范圍有時不一致。此外抽樣單位可以

11、是個總體單位,也可以是若干總體單位的集合。如某省進(jìn)行農(nóng)戶收支調(diào)查,目標(biāo)總體是全省所有農(nóng)戶,抽樣單位可以是每個農(nóng)戶,也可以是每個鄉(xiāng)或村。所以,有目標(biāo)總體后還必須明確實際進(jìn)行抽樣的總體范圍和抽樣單位。第十九張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202219河北工程大學(xué)經(jīng)濟管理學(xué)院2、抽樣框的形式 (1)名單抽樣框:列出全部總體單位的名錄一覽表,如職工名單、企業(yè)名單等。 (2)區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小區(qū)域,以小區(qū)域為抽樣單位。如某市居民住房調(diào)查,將全市居民戶劃分為若干街道或片區(qū)。 (3)時間表抽樣框:將總體全部單位按時間順序排列,把總體的時間過程分為若干小的時間單

12、位,以時間單位作為抽樣單位。如對流水線上24小時內(nèi)生產(chǎn)的產(chǎn)品進(jìn)行質(zhì)量抽檢。第二十張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202220河北工程大學(xué)經(jīng)濟管理學(xué)院 3、對抽樣框的要求(1)應(yīng)與目標(biāo)總體一致,即包括全部總體單位,不重不漏,否則破壞隨機原則。例如,對某市居民進(jìn)行抽查,以電話號碼本為抽樣框不科學(xué)。(2)盡可能利用與所研究變量高度相關(guān)的輔助變量的信息,設(shè)計最佳的抽樣組織方式和抽樣估計方法。第二十一張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202221河北工程大學(xué)經(jīng)濟管理學(xué)院四、抽樣誤差把握以下問題:1、調(diào)查誤差概念及其分類;2、實際抽樣誤差;3、抽樣平均誤差;4、抽

13、樣極限誤差。第二十二張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202222河北工程大學(xué)經(jīng)濟管理學(xué)院1、調(diào)查誤差概念及其分類 (1)統(tǒng)計調(diào)查的誤差:指調(diào)查結(jié)果與總體真值間的差異。 (2)分為登記性誤差和代表性誤差: A、登記性誤差:指在調(diào)查和匯總過程中由于觀察、測量、登記、計算等方面的差錯或被調(diào)查者提供虛假資料造成的誤差。它是任何一種統(tǒng)計調(diào)查都可能產(chǎn)生的,可以避免。第二十三張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202223河北工程大學(xué)經(jīng)濟管理學(xué)院1、調(diào)查誤差概念及其分類 (2)分為登記性誤差和代表性誤差:B、代表性誤差 :指用樣本指標(biāo)推斷總體指標(biāo)時,由于樣本結(jié)構(gòu)與總體

14、結(jié)構(gòu)的不一致,樣本不能完全代表總體而產(chǎn)生的誤差。代表性誤差又分為系統(tǒng)誤差和隨機誤差:a、系統(tǒng)誤差又稱偏差,指非隨機因素引起的樣本代表性不足產(chǎn)生的誤差,可以避免;b、隨機誤差,又稱偶然性誤差、抽樣誤差,隨機因素引起的代表性誤差,不可避免,但可以計算并加以控制。第二十四張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202224河北工程大學(xué)經(jīng)濟管理學(xué)院2、實際抽樣誤差(1)實際抽樣誤差指某一具體樣本的樣本估計值 與總體參數(shù) 的真實值之間的離差 。實際中,總體參數(shù) 未知,誤差無法計算。平均數(shù)的誤差:成數(shù)的誤差:p-P第二十五張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202225河北

15、工程大學(xué)經(jīng)濟管理學(xué)院2、實際抽樣誤差(2)由于樣本隨機抽取,估計量是隨樣本不同而不同的隨機變量,所以實際抽樣誤差是隨機變量,可正可負(fù),可大可小。就某個既定的抽樣方案,樣本估計量所有可能值有一定的分布規(guī)律,它們與總體參數(shù)的離差即抽樣誤差也有一定的規(guī)律。實際中真正計算、控制的誤差并不是該誤差。第二十六張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202226河北工程大學(xué)經(jīng)濟管理學(xué)院3、抽樣平均誤差(1)它是反映抽樣誤差一般水平的指標(biāo)。常用樣本估計量的標(biāo)準(zhǔn)差反映所有可能樣本估計量與其中心的平均離散程度,即抽樣平均數(shù)或抽樣成數(shù)的標(biāo)準(zhǔn)差,公式為:則抽樣平均數(shù)、抽樣成數(shù)的標(biāo)準(zhǔn)差分別為:第二十七張,

16、PPT共八十四頁,創(chuàng)作于2022年6月02.08.202227河北工程大學(xué)經(jīng)濟管理學(xué)院3、抽樣平均誤差(2)又因為 ,則上式變?yōu)榉从乘锌赡軜颖镜墓烙嬛蹬c總體參數(shù)的平均差異程度,即抽樣平均誤差,可以衡量樣本對總體的代表性大小,它越小則統(tǒng)計量的分布就越集中在總體參數(shù)的附近。抽樣平均數(shù)、抽樣成數(shù)的標(biāo)準(zhǔn)差變?yōu)椋毫硪粋€概念是抽樣方差 為抽樣平均誤差的平方。第二十八張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202228河北工程大學(xué)經(jīng)濟管理學(xué)院4、抽樣極限誤差(1)它是指一定概率下樣本指標(biāo)與總體參數(shù)間抽樣誤差的可能范圍,又稱允許誤差。因為總體參數(shù)確定,統(tǒng)計量圍繞其左右變動,用統(tǒng)計量與總體參數(shù)之

17、差的絕對值表示誤差的可能范圍。公式表示:在一定概率下:平均數(shù)、比例的抽樣極限誤差,在一定概率下,第二十九張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202229河北工程大學(xué)經(jīng)濟管理學(xué)院4、抽樣極限誤差(2)抽樣極限誤差是抽樣誤差的可能范圍而非完全肯定范圍,可能范圍大小與這一估計的可能性大小即概率緊密聯(lián)系,這個概率被稱為置信度或可信程度、把握程度、概率保證程度等,表示為 ,其他條件不變的情況下,抽樣極限誤差越大,置信度越大。第三十張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202230河北工程大學(xué)經(jīng)濟管理學(xué)院4、抽樣極限誤差(3)相關(guān)概念:抽樣誤差率=(抽樣極限誤差/估計量)

18、 100%,抽樣估計精度=100%-抽樣誤差率估計精度與置信度矛盾。其他條件不變下,提高估計置信度,增大允許誤差,使精度降低;反之,提高精度會降低置信度。實際中根據(jù)具體情況,可先確定置信度再求極限誤差或先確定極限誤差再求相應(yīng)的把握程度。第三十一張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202231河北工程大學(xué)經(jīng)濟管理學(xué)院 第二節(jié) 抽樣分布本節(jié)只討論重復(fù)的簡單隨機抽樣,所得容量為n的樣本(x1, x2 xn)稱為簡單隨機樣本,它滿足兩個條件: x1, x2 xn相互獨立;每個xi(i=1,2,n)都與總體X同分布。把握以下問題:一、抽樣分布的概念;二、抽樣平均數(shù)的抽樣分布;三、樣本比

19、例的抽樣分布;四、不重復(fù)抽樣的修正系數(shù)。第三十二張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202232河北工程大學(xué)經(jīng)濟管理學(xué)院一、抽樣分布的概念把握以下問題:1、抽樣分布的概念;2、尋求抽樣分布的方法。第三十三張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202233河北工程大學(xué)經(jīng)濟管理學(xué)院1、抽樣分布的概念(1)它是指樣本統(tǒng)計量的概率分布。每個隨機變量都有其概率分布,樣本統(tǒng)計量是隨機變量,有若干可能取值,每個取值有一定的可能性即概率,從而形成統(tǒng)計量的概率分布。樣本統(tǒng)計量是由n個隨機變量構(gòu)成的樣本函數(shù),抽樣分布屬于隨機變量函數(shù)的分布。第三十四張,PPT共八十四頁,創(chuàng)作于20

20、22年6月02.08.202234河北工程大學(xué)經(jīng)濟管理學(xué)院1、抽樣分布的概念(2)例如,總體有N個單位,隨機抽取n個單位進(jìn)行調(diào)查,可抽取 個樣本,得 個不盡相同的樣本平均數(shù),將樣本平均數(shù)全部可能取值及其出現(xiàn)的概率依序排列得到樣本平均數(shù)的概率分布即平均數(shù)的抽樣分布。同理得到比例的抽樣分布、樣本標(biāo)準(zhǔn)差的抽樣分布。對于抽樣分布,同樣可以計算其均值和方差(或標(biāo)準(zhǔn)差)等數(shù)字特征反映該分布的集中、離散趨勢。第三十五張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202235河北工程大學(xué)經(jīng)濟管理學(xué)院 1、抽樣分布的概念(3)抽樣分布反映樣本統(tǒng)計量的分布特征,是抽樣推斷的重要依據(jù),根據(jù)其分布規(guī)律,可以揭

21、示樣本指標(biāo)與總體參數(shù)間的關(guān)系,估計抽樣誤差,說明抽樣推斷的可靠程度。第三十六張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202236河北工程大學(xué)經(jīng)濟管理學(xué)院 2、尋求抽樣分布的方法有精確方法和大樣本方法,形成精確和漸近抽樣分布。(1)當(dāng)總體分布類型已知,對任一自然數(shù)n能導(dǎo)出統(tǒng)計量 的分布的明顯表達(dá)式,稱為精確方法,所得分布為精確分布。當(dāng)n較小時特別有用,又稱小樣本方法,大多是在正態(tài)總體條件下得到的。第三十七張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202237河北工程大學(xué)經(jīng)濟管理學(xué)院 2、尋求抽樣分布的方法(2)大多數(shù)場合,精確分布很難求出或表達(dá)式復(fù)雜,借助極限定理,尋求

22、n無限增大時統(tǒng)計量的極限分布,用極限分布當(dāng)作所求抽樣分布的近似,稱為大樣本方法,這種極限分布稱為漸近分布。在抽樣推斷中,許多場合下統(tǒng)計量服從正態(tài)分布或以正態(tài)分布為漸近分布,此外還有 分布、 t分布、 F分布等精確抽樣分布。第三十八張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202238河北工程大學(xué)經(jīng)濟管理學(xué)院二、抽樣平均數(shù)的抽樣分布 把握以下問題:1、總體方差已知時,樣本平均數(shù)的抽樣分布;2、總體方差未知時,樣本平均數(shù)的抽樣分布。第三十九張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202239河北工程大學(xué)經(jīng)濟管理學(xué)院 1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(1)

23、定理1:設(shè)總體 是一個簡單隨機樣本,則樣本平均數(shù)證明:因為總體 是其一個簡單隨機樣本,所以 相互獨立且都服從 ,由概率論知,相互獨立的正態(tài)隨機變量和服從正態(tài)分布,其線性函數(shù)也服從正態(tài)分布。第四十張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202240河北工程大學(xué)經(jīng)濟管理學(xué)院 1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(1)定理1的證明:而且,所以, 將樣本平均數(shù)標(biāo)準(zhǔn)化,有:第四十一張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202241河北工程大學(xué)經(jīng)濟管理學(xué)院1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(2)定理2:若總體平均數(shù) 和方差 有限,當(dāng)樣本容量n充分

24、大時,無論總體形式如何,樣本平均數(shù) 近似服從正態(tài)分布(3)由定理知,樣本平均數(shù)是以總體平均數(shù)為分布中心,且n愈大,樣本平均數(shù)的離散程度愈小,抽樣誤差愈小。由此得出抽樣平均數(shù)的標(biāo)準(zhǔn)差即抽樣平均誤差的公式為:實際計算中,總體標(biāo)準(zhǔn)差未知,可用以前的標(biāo)準(zhǔn)差代替;大樣本下,用樣本標(biāo)準(zhǔn)差代替。第四十二張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202242河北工程大學(xué)經(jīng)濟管理學(xué)院1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(4)由公式(6.6)知,影響抽樣平均誤差的因素:A、總體方差或標(biāo)準(zhǔn)差,即總體各單位變量值的差異程度;B、樣本容量,容量越大,誤差越??;C、抽樣方法(重復(fù)、不重復(fù)抽樣)和

25、抽樣組織方式(分層抽樣、等距抽樣等)。第四十三張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202243河北工程大學(xué)經(jīng)濟管理學(xué)院2、總體方差未知時,樣本平均數(shù)的抽樣分布(小樣本)定理3:設(shè)總體 是一個簡單隨機樣本,樣本均值為 ,樣本標(biāo)準(zhǔn)差為S,則統(tǒng)計量第四十四張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202244河北工程大學(xué)經(jīng)濟管理學(xué)院 三、樣本比例的抽樣分布把握以下問題:1、總體比例與樣本比例;2、樣本比例的抽樣分布。第四十五張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202245河北工程大學(xué)經(jīng)濟管理學(xué)院 1、總體比例與樣本比例總體中具有某種特征的單位占全部單位

26、的比例稱作總體比例,記做P;樣本中具有此種特征的單位占全部樣本單位的比例稱作樣本比例,記做p。實際中如產(chǎn)品的合格率、某電視節(jié)目的收視率等。第四十六張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202246河北工程大學(xué)經(jīng)濟管理學(xué)院 2、樣本比例的抽樣分布(1)X服從二項分布,且有E(X)=nP,V(X)=nP(1-P),當(dāng)從總體中抽出一個容量為n的樣本時,樣本中具有某種特征的單位數(shù)x服從二項分布,即xB(n,p),因而樣本比例p=x/n也服從二項分布,且有:第四十七張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202247河北工程大學(xué)經(jīng)濟管理學(xué)院 2、樣本比例的抽樣分布(2)根據(jù)

27、中心極限定理,當(dāng)二項分布趨于正態(tài)分布,大樣本下,若nP、n(1-P)皆大于5,樣本比例近似服從正態(tài)分布:pN(P,P(1-P)/n),則比例的抽樣平均誤差為:實際中,用以前的總體比例或樣本比例 p 代替。第四十八張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202248河北工程大學(xué)經(jīng)濟管理學(xué)院 四、不重復(fù)抽樣的修正系數(shù)1、與重復(fù)抽樣比,由于樣本單位不重復(fù),樣本單位很可能在總體中更均勻的分布,從而樣本結(jié)構(gòu)更能與總體結(jié)構(gòu)近似,因此不重復(fù)抽樣所得樣本對總體的代表性更大,抽樣誤差較小。前面所講的抽樣分布和抽樣平均誤差公式都是就重復(fù)抽樣而言。 第四十九張,PPT共八十四頁,創(chuàng)作于2022年6月0

28、2.08.202249河北工程大學(xué)經(jīng)濟管理學(xué)院四、不重復(fù)抽樣的修正系數(shù)2、不重復(fù)抽樣的抽樣平均誤差為:其中 稱為不重復(fù)抽樣的修正系數(shù),N很大時, 其他條件相同下,不重復(fù)抽樣誤差小于重復(fù)抽樣。當(dāng)N很大而n很小時,系數(shù)接近1,二者相差不大。因此,無限總體都可以用重復(fù)抽樣的平均誤差公式度量抽樣誤差;有限總體當(dāng)抽樣比例很小時(一般小于5%),也常用重復(fù)抽樣公式計算。第五十張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202250河北工程大學(xué)經(jīng)濟管理學(xué)院第三節(jié) 抽樣組織方式及其抽樣分布把握以下問題:一、簡單隨機抽樣;二、分層抽樣;三、等距抽樣;四、整群抽樣;五、抽樣組織方式的選擇。第五十一張,P

29、PT共八十四頁,創(chuàng)作于2022年6月02.08.202251河北工程大學(xué)經(jīng)濟管理學(xué)院一、簡單隨機抽樣它是最基本的抽樣組織方式,常用方法有抽簽法、利用隨機數(shù)表取數(shù)法和電子計算機取數(shù)法。它隊對總體單位不進(jìn)行任何劃分或排隊,完全隨機地直接從總體中抽取樣本單位,使每個單位都有完全均等的機會被抽中,故又稱純隨機抽樣。它只對總體單位進(jìn)行編號。這樣估計的效率低,進(jìn)行大規(guī)模抽樣調(diào)查時,工作不易展開。第五十二張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202252河北工程大學(xué)經(jīng)濟管理學(xué)院二、分層抽樣及其抽樣估計把握以下問題:1、分層抽樣的概念及特點;2、等比例分層抽樣方式;3、抽樣平均誤差的計算;4、

30、例6-1。第五十三張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202253河北工程大學(xué)經(jīng)濟管理學(xué)院1、分層抽樣的概念及特點(1)也稱類型抽樣,它是按一定標(biāo)志對總體各單位進(jìn)行分類(或?qū)?、子總體),然后分別從每一類中按隨機原則抽取一定的單位構(gòu)成樣本。例如,抽樣調(diào)查一個城市居民收入分配狀況,如果歷史資料反映了該城市居民的貧富結(jié)構(gòu):高收入者、中等收入者與低收入者的比例結(jié)構(gòu),我們可以按此結(jié)構(gòu)分類分別從高收入者、中等收入者與低收入者中按一定的比例抽取樣本。第五十四張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202254河北工程大學(xué)經(jīng)濟管理學(xué)院1、分層抽樣的概念及特點(2)特點:類型抽樣

31、是統(tǒng)計分組與抽樣原理的結(jié)合,可以提高樣本的代表性;不僅可以用樣本推斷總體,還可以推斷子總體指標(biāo)。前提是對總體的結(jié)構(gòu)有著一定的了解,為了充分利用這些信息,提高估計的精確性,對總體按確定標(biāo)志進(jìn)行分類,保證抽出的樣本與總體盡可能保持相似的結(jié)構(gòu)。第五十五張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202255河北工程大學(xué)經(jīng)濟管理學(xué)院 2、等比例分層抽樣方式分層抽樣可分為等比例和不等比例分層抽樣,實際中采用等比例分層抽樣。(1)設(shè)總體由N個單位組成,按對總體的認(rèn)識,把總體分為k組,使得:然后相應(yīng)從各組中分別按隨機方式抽出個單位組成樣本。設(shè)樣本容量為n,它滿足:第五十六張,PPT共八十四頁,創(chuàng)作

32、于2022年6月02.08.202256河北工程大學(xué)經(jīng)濟管理學(xué)院 2、等比例分層抽樣方式(2)比例抽樣方式就是從每一類 抽取 時要求兩者間保持合適的比例,也就是保持各組樣本單位數(shù)與總體同組單位數(shù)之比,等于樣本容量與總體單位數(shù)之比,即所以各組的樣本單位數(shù)應(yīng)為: 第五十七張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202257河北工程大學(xué)經(jīng)濟管理學(xué)院3、抽樣平均誤差的計算和區(qū)間估計(1)步驟:設(shè)樣本是: 樣本抽出來后:第一步:計算各組平均數(shù)第二步:將各組平均數(shù)以各組單位數(shù)或各樣本組單位數(shù)為權(quán)數(shù),進(jìn)行加權(quán)平均,求出樣本平均數(shù)第五十八張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.20

33、2258河北工程大學(xué)經(jīng)濟管理學(xué)院3、抽樣平均誤差的計算和區(qū)間估計(1)步驟:第三步:計算分層抽樣的抽樣平均誤差,第i組的組內(nèi)標(biāo)準(zhǔn)差為第i組 的抽樣平均誤差為:即為 的方差 ,表示從第i組中抽樣計算平均數(shù)的方差 ,樣本平均數(shù) 的方差為 ,樣本平均數(shù)的抽樣平均誤差為記 表示組(層)內(nèi)方差平均數(shù)。第五十九張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202259河北工程大學(xué)經(jīng)濟管理學(xué)院 3、抽樣平均誤差的計算和區(qū)間估計(1)步驟:同樣可計算在不重復(fù)抽樣條件下的抽樣平均誤差為: 第六十張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202260河北工程大學(xué)經(jīng)濟管理學(xué)院 3、抽樣平均誤差的

34、計算(2)分析:在分組下,總方差=組內(nèi)方差平均數(shù)+組間方差,通過比較,分層抽樣的抽樣平均誤差小于簡單隨機抽樣的抽樣誤差。對于給定的總體,總體方差一定,劃分層時應(yīng)盡量增大層間差異,縮小層內(nèi)差異。因為層內(nèi)差異越小。分層抽樣的抽樣平均誤差越小,參數(shù)估計的效率越高。第六十一張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202261河北工程大學(xué)經(jīng)濟管理學(xué)院例6-1某地區(qū)對居民在一年內(nèi)用于某類消費的支出進(jìn)行等比例分層抽樣,結(jié)果見表,要求計算該地區(qū)平均每戶支出的抽樣平均誤差和抽樣極限誤差。 調(diào)查戶數(shù)平均支出(元) 方差 城鎮(zhèn) 40 350 2209 農(nóng)村 80 260 2916第六十二張,PPT共八

35、十四頁,創(chuàng)作于2022年6月02.08.202262河北工程大學(xué)經(jīng)濟管理學(xué)院4、例6-1解:樣本平均數(shù)是:層內(nèi)方差平均數(shù): 抽樣平均誤差:抽樣極限誤差:第六十三張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202263河北工程大學(xué)經(jīng)濟管理學(xué)院三、等距抽樣把握以下問題:1、等距抽樣的概念和特點;2、無關(guān)標(biāo)志排隊等距抽樣;3、有關(guān)標(biāo)志排隊等距抽樣。第六十四張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202264河北工程大學(xué)經(jīng)濟管理學(xué)院 1、等距抽樣的概念和特點(1)又稱機械抽樣或系統(tǒng)抽樣,它是將總體各單位按某一標(biāo)志進(jìn)行排隊,計算出抽樣間隔,并在第一個抽樣間隔內(nèi)確定一個抽樣起點,再

36、按固定的順序和間隔來抽取樣本單位的抽樣組織形式。根據(jù)需要抽取的樣本單位數(shù)n和總體的單位數(shù)N,可以計算出等距抽樣的間隔大?。篕=N/n ,再從第一至第K個單位的范圍內(nèi)確定抽樣起點,之后每隔K個單位抽取一個樣本單位。第六十五張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202265河北工程大學(xué)經(jīng)濟管理學(xué)院 1、等距抽樣的概念和特點(2)優(yōu)越性:提高樣本單位分布的均勻性,樣本代表性強,一般工作易開展,實際應(yīng)用廣泛。但等距抽樣在排隊后,抽樣起點一確定,整個樣本就確定了。其隨機性體現(xiàn)在排隊和抽樣起點的確定上。按排隊標(biāo)志與調(diào)查內(nèi)容的關(guān)系,等距抽樣分為無關(guān)標(biāo)志、有關(guān)標(biāo)志排隊等距抽樣,二者抽樣起點確定

37、方式、抽樣效果不同。第六十六張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202266河北工程大學(xué)經(jīng)濟管理學(xué)院 2、無關(guān)標(biāo)志排隊等距抽樣 (1)它是指等距抽樣據(jù)以排隊的標(biāo)志與調(diào)查內(nèi)容沒有直接關(guān)系。例如,城市居民家計調(diào)查時,將居民按其居住的街道門牌號碼排隊;產(chǎn)品質(zhì)量檢查按產(chǎn)品生產(chǎn)的時間先后順序排隊,每個一定時間或每生產(chǎn)一定數(shù)量的產(chǎn)品抽取一單位產(chǎn)品。第六十七張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202267河北工程大學(xué)經(jīng)濟管理學(xué)院2、無關(guān)標(biāo)志排隊等距抽樣(2)抽樣起點的確定:從所要調(diào)查的標(biāo)志看,總體單位的排序仍是隨機的,抽樣起點r可以隨機確定,即1r K,遵循隨機原則,避免

38、系統(tǒng)偏差。(3)無關(guān)標(biāo)志排隊等距抽樣的效果接近于簡單隨機抽樣的效果,其抽樣誤差通常按簡單隨機抽樣的抽樣誤差公式近似計算。第六十八張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202268河北工程大學(xué)經(jīng)濟管理學(xué)院 3、有關(guān)標(biāo)志排隊等距抽樣 (1)它是指排隊標(biāo)志與調(diào)查內(nèi)容有關(guān),例如職工家計調(diào)查按職工工資水平排隊。(2)在排隊后,從所調(diào)查變量看,總體單位也大致呈順序排列,其抽樣起點不宜隨機確定。否則,若第一個間隔內(nèi)隨機抽取一個標(biāo)志值較小(或大)的單位作起點,整個樣本會出現(xiàn)偏低(或高)的系統(tǒng)偏差。第六十九張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202269河北工程大學(xué)經(jīng)濟管理學(xué)院

39、3、有關(guān)標(biāo)志排隊等距抽樣 (3)半距起點等距抽樣(中心系統(tǒng)抽樣):以第一個抽樣距離的一半為抽樣起點(r=k/2)并每間隔k個單位抽一個單位。這樣樣本單位是處于每個抽樣距離(組)中點的總體單位。因單位變量值大致呈順序排列,所以這些單位變量值能代表所在間距內(nèi)的一般水平,由此樣本代表性較高。但這種取樣限制抽樣的隨機性,且只能抽取出一個樣本。第七十張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202270河北工程大學(xué)經(jīng)濟管理學(xué)院 3、有關(guān)標(biāo)志排隊等距抽樣 (4)對稱等距抽樣:在第一個間距內(nèi)隨機確定起點r( 1r k),然后以組界k,2k,(n-1)k為對稱點兩兩對稱地抽取樣本單位,看書上圖,知

40、第一組內(nèi)r偏小,但第二組內(nèi)樣本單位(2k-r)偏大;反之,第二組內(nèi)r偏大,則第二個樣本單位偏小,這樣整體看,樣本有較好的代表性,又保證抽樣的隨機性,根據(jù)排隊結(jié)果可以抽出k個樣本第七十一張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202271河北工程大學(xué)經(jīng)濟管理學(xué)院3、有關(guān)標(biāo)志排隊等距抽樣(5)有關(guān)標(biāo)志排隊等距抽樣相當(dāng)于分層較多(將總體分為同等大小的n個層)而每層只抽取一個調(diào)查單位的分層抽樣,所以抽樣效果類似于分層抽樣,抽樣誤差一般按分層抽樣的誤差公式近似計算。第七十二張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202272河北工程大學(xué)經(jīng)濟管理學(xué)院四、整群抽樣把握以下問題:1

41、、整群抽樣的概念和特點;2、整群抽樣的抽樣平均誤差;3、例6-2。第七十三張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202273河北工程大學(xué)經(jīng)濟管理學(xué)院 1、整群抽樣的概念和特點(1)整群抽樣又稱集團(tuán)抽樣,就是將總體各單位分成若干群,然后從其中隨機抽取部分群,對中選的群進(jìn)行全面調(diào)查的抽樣組織方式。例如居民家計調(diào)查,以一個鄉(xiāng)(或街道)的所有住戶或所有人口為一群,對抽中的鄉(xiāng)或街道的住戶或人口進(jìn)行全面調(diào)查。第七十四張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202274河北工程大學(xué)經(jīng)濟管理學(xué)院 1、整群抽樣的概念和特點(2)這種方式是整群的抽取樣本單位,只需對各群編號,簡化工作

42、,抽樣單位集中,便于集中調(diào)查,簡單方便又節(jié)省人力、物力、財力和時間,應(yīng)用廣泛。但抽樣單位集中,抽樣單位在總體中分布不夠均勻。在其他條件相同下,其樣本代表性可能較差,要適當(dāng)多抽一些樣本單位。第七十五張,PPT共八十四頁,創(chuàng)作于2022年6月02.08.202275河北工程大學(xué)經(jīng)濟管理學(xué)院 2、整群抽樣的抽樣平均誤差 (1)整群抽樣的代表性取決于抽中群之間的差異,差異大,代表性差。因此其誤差與群間差異有關(guān),與群內(nèi)差異無關(guān)。(2)設(shè)總體的全部N個單位被劃分為R群,每群含有M個單位?,F(xiàn)在從總體R群中隨機抽出r群組成樣本,對中選的群中的所有單位進(jìn)行全面調(diào)查。群的平均數(shù)是: 樣本均值是:第七十六張,PPT

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論