抽樣調(diào)查培訓(xùn)教程課件_第1頁
抽樣調(diào)查培訓(xùn)教程課件_第2頁
抽樣調(diào)查培訓(xùn)教程課件_第3頁
抽樣調(diào)查培訓(xùn)教程課件_第4頁
抽樣調(diào)查培訓(xùn)教程課件_第5頁
已閱讀5頁,還剩199頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章抽樣調(diào)查

第七章抽樣調(diào)查1第七章抽樣調(diào)查§7.1總體和樣本

§7.2抽樣調(diào)查的數(shù)理基礎(chǔ)

§7.3總體參數(shù)估計§7.4抽樣設(shè)計§7.5統(tǒng)計假設(shè)檢驗第七章抽樣調(diào)查§7.1總體和樣本2第一節(jié)總體和樣本一、抽樣調(diào)查概述抽樣調(diào)查是一種科學(xué)的非全面調(diào)查。它是按照隨機(jī)原則從調(diào)查對象的總體中抽取部分單位進(jìn)行調(diào)查,并根據(jù)這部分單位的調(diào)查結(jié)果推斷總體的數(shù)量特征。抽樣調(diào)查第一節(jié)總體和樣本一、抽樣調(diào)查概述抽樣調(diào)查是一種科學(xué)的非全3抽樣調(diào)查的特點(diǎn)隨機(jī)抽取樣本單位;用部分信息推斷總體數(shù)量特征;抽樣推斷具有一定的概率保證程度

;抽樣誤差可以事先計算并控制。 抽樣調(diào)查的特點(diǎn)隨機(jī)抽取樣本單位;4作用應(yīng)用經(jīng)濟(jì)性:節(jié)省人力、物力、財力和時間時效性:可用較短的時間搜集到所需資料適應(yīng)性:適用于各領(lǐng)域,各種問題的調(diào)查準(zhǔn)確性:受人為干擾的可能性較小,調(diào)查資料的準(zhǔn)確性較高能解決全面調(diào)查無法或難以解決的問題可以補(bǔ)充和訂正全面調(diào)查的結(jié)果應(yīng)用于生產(chǎn)過程上產(chǎn)品質(zhì)量的檢查和控制作用應(yīng)用經(jīng)濟(jì)性:節(jié)省人力、物力、財力和時間能解決全面調(diào)查無法5二、有關(guān)抽樣的幾個基本概念全及總體和樣本總體1、全及總體全及總體又稱總體或母體,是指研究對象的全體,它是由許多個性質(zhì)相同的調(diào)查單位組成的,總體單位數(shù)通常用N表示

。

例如:全部職工、全部學(xué)生、全部產(chǎn)品二、有關(guān)抽樣的幾個基本概念全及總體和樣本總體1、全及總體例如62、抽樣框抽樣框是指用以代表總體,并從中抽選樣本的一個框架,抽樣框的主要形式有三種:①名單抽樣框②區(qū)域抽樣框③時間表抽樣框

對于抽樣調(diào)查來說,樣本的代表性如何,抽樣調(diào)查最終推算的估計值真實性如何,首先取決于抽樣框的質(zhì)量。抽樣框在抽樣調(diào)查中處于基礎(chǔ)地位,是抽樣調(diào)查必不可少的部分,其對于推斷總體具有相當(dāng)大的影響。全及總體和樣本總體2、抽樣框?qū)τ诔闃诱{(diào)查來說,樣本的代表性如何73、樣本總體樣本總體,又叫子樣,簡稱樣本。它是從全及總體中隨機(jī)抽取出來,用來代表全及總體的那部分單位構(gòu)成的總體。樣本總體的單位數(shù)用小寫字母n表示,稱為樣本容量。從某個城市職工家庭中隨機(jī)抽取1000戶進(jìn)行調(diào)查,則這1000戶組成的小總體即為樣本,樣本容量n=1000。例如:全及總體和樣本總體3、樣本總體從某個城市職工家庭中隨機(jī)抽取1000戶進(jìn)行調(diào)查,8對于給定的研究對象,全及總體是唯一確定的,而樣本總體不是唯一的,它是隨機(jī)的。4、抽樣比抽樣比是指在抽選樣本時,所抽取的樣本單位數(shù)n與總體單位數(shù)N之比。一般地講,n≥30為大樣本,n<30為小樣本。研究社會經(jīng)濟(jì)現(xiàn)象時,通常采用大樣本進(jìn)行抽樣調(diào)查。全及總體和樣本總體對于給定的研究對象,全及總體是唯一確定的,而樣本總體不是唯一9二、有關(guān)抽樣的幾個基本概念總體指標(biāo)和樣本指標(biāo)1、總體指標(biāo)總體指標(biāo)是根據(jù)全及總體所有單位的標(biāo)志值計算出來的,反映總體的數(shù)量特征。為與樣本指標(biāo)區(qū)分,用大寫字母表示總體指標(biāo)。包括:總體平均數(shù)總體成數(shù)總體方差總體標(biāo)準(zhǔn)差二、有關(guān)抽樣的幾個基本概念總體指標(biāo)和樣本指標(biāo)1、總體指標(biāo)包括10總體指標(biāo)和樣本指標(biāo)2、樣本指標(biāo)樣本指標(biāo)又稱抽樣指標(biāo),它是根據(jù)樣本總體計算的統(tǒng)計指標(biāo),反映樣本總體的數(shù)量特征,樣本指標(biāo)用小寫字母表示。

包括:樣本平均數(shù)樣本成數(shù)樣本方差樣本標(biāo)準(zhǔn)差總體指標(biāo)和樣本指標(biāo)2、樣本指標(biāo)包括:樣本平均數(shù)11二、有關(guān)抽樣的幾個基本概念抽樣方法和樣本可能數(shù)目1、重復(fù)抽樣重復(fù)抽樣也叫重置抽樣,是指每次抽取一個單位記錄其標(biāo)志表現(xiàn)后又放回,重新參加下一次的抽選。全及總體單位數(shù)始終保持不變,每個總體單位都有被重復(fù)抽中的可能。

重復(fù)抽樣通常要考慮單位排列順序,其樣本可能數(shù)目為二、有關(guān)抽樣的幾個基本概念抽樣方法和樣本可能數(shù)目1、重復(fù)抽樣12抽樣方法和樣本可能數(shù)目2、不重復(fù)抽樣不重復(fù)抽樣也叫不重置抽樣,是指每次從總體中抽取一個單位記錄其標(biāo)志表現(xiàn)后不再放回,從剩余的單位中抽取下一個單位。全及總體單位數(shù)在不斷減少,每個總體單位不可能被重復(fù)抽中。不重復(fù)抽樣通常不考慮樣本單位排列順序,其樣本可能數(shù)目為抽樣方法和樣本可能數(shù)目2、不重復(fù)抽樣不重復(fù)抽樣通常不考13第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)抽樣調(diào)查數(shù)理基礎(chǔ)抽樣分布大數(shù)定律正態(tài)分布中心極限定理第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)抽樣調(diào)查抽樣分布大數(shù)定律正態(tài)分布14抽樣分布的形成過程總體計算樣本統(tǒng)計量如:樣本均值、成數(shù)、方差樣本樣本統(tǒng)計量的概率分布抽樣分布的形成過程總體計算樣本統(tǒng)計量樣本樣本統(tǒng)計量的概率分布15大數(shù)定律第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)在對某一現(xiàn)象觀察過程中,由大量相互獨(dú)立的隨機(jī)變量構(gòu)成的總體,由于受偶然因素的影響,每次所得到的結(jié)果不同,但經(jīng)過大量觀察并加以綜合平均后,消除了偶然因素引起的差異,而接近于總體的平均值,使現(xiàn)象總體某一方面的規(guī)律在數(shù)量上、質(zhì)量上顯示出來。例如:拋硬幣實驗通常以平均數(shù)或成數(shù)的形式表現(xiàn)大第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)在對某一現(xiàn)象觀察過程161.獨(dú)立同分布大數(shù)定律獨(dú)立同分布的隨機(jī)變量:,設(shè)它們的平均數(shù)為,方差為,則對任意小的正數(shù)ε,有:2.貝努力大數(shù)定律設(shè)m是n次獨(dú)立隨機(jī)試驗中事件A發(fā)生的次數(shù),p是事件A發(fā)生的概率,則對于任意小的正數(shù)ε,有1.獨(dú)立同分布大數(shù)定律獨(dú)立同分布的隨機(jī)變量:17

大數(shù)定理從理論上揭示了樣本和總體之間的內(nèi)在聯(lián)系,即隨著抽樣單位數(shù)n的增大,樣本平均數(shù)有接近總體平均數(shù)的趨勢,樣本成數(shù)有接近總體成數(shù)的趨勢。注意:第一、抽樣必須遵循隨機(jī)原則。第二、抽樣必須遵循大量原則。大數(shù)定理從理論上揭示了樣本和總體之間的內(nèi)在18正態(tài)分布例如:人類的身高、產(chǎn)品的壽命、加工零件的尺寸等。正態(tài)分布基本指這樣的分布:在總體平均數(shù)及其附近,總體單位數(shù)最多;相反地,越遠(yuǎn)離總體平均數(shù),總體單位數(shù)越少。也就是說,越接近總體平均數(shù)的變量值出現(xiàn)的次數(shù)越多,概率也就越大;反之,越遠(yuǎn)離總體平均數(shù)的變量值出現(xiàn)的次數(shù)就越少,概率也就越小。第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)正例如:人類的身高、產(chǎn)品的壽命、加工零件的尺寸等。19正態(tài)分布的特征1、正態(tài)分布是鐘型對稱分布,對稱線為總體平均數(shù),整個曲線下的面積等于1??傮w平均數(shù)將分布曲線截為兩段互為鏡像的曲線,兩段曲線下的面積相等,各為1/2。正態(tài)分布的特征1、正態(tài)分布是鐘型對稱分布,對稱線為總體平均數(shù)202、在總體平均數(shù)處,正態(tài)分布的概率密度最大,當(dāng)遠(yuǎn)離總體平均數(shù)時,概率密度的值隨著距離的增加而遞減。X

f(x)

2、在總體平均數(shù)處,正態(tài)分布的概率密度最大,當(dāng)遠(yuǎn)離總體平均數(shù)213、在距離總體平均數(shù)一個標(biāo)準(zhǔn)差的位置上,即時,曲線有兩個拐點(diǎn)。

3、在距離總體平均數(shù)一個標(biāo)準(zhǔn)差的位置上,即224、正態(tài)分布的位置及形狀由總體平均數(shù)和總體標(biāo)準(zhǔn)差決定,總體平均數(shù)決定正態(tài)分布中心的位置;4、正態(tài)分布的位置及形狀由總體平均數(shù)和總體標(biāo)準(zhǔn)差決定,總體平234、總體標(biāo)準(zhǔn)差決定正態(tài)分布的寬窄的形狀。04、總體標(biāo)準(zhǔn)差決定正態(tài)分布的寬窄的形狀。024當(dāng)被抽樣總體服從正態(tài)分布時,樣本平均數(shù)的抽樣分布具有下列重要性質(zhì):樣本平均數(shù)的分布仍然是正態(tài)分布;樣本平均數(shù)分布的平均值等于總體平均數(shù);樣本平均數(shù)分布的方差等于總體方差除以樣本容量。

當(dāng)被抽樣總體服從正態(tài)分布時,樣本平均數(shù)的抽樣分布具有下列重要25中心極限定理第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)從具有任意分布形式的總體中抽出一個容量是n的樣本,如果總體的平均數(shù)是,方差是,則當(dāng)n充分大時,樣本平均數(shù)趨于正態(tài)分布。樣本平均數(shù)所服從的正態(tài)分布的中心仍是,標(biāo)準(zhǔn)差是抽樣平均誤差。當(dāng)樣本容量很大時,樣本成數(shù)近似地服從正態(tài)分布,分布中心為總體成數(shù)中第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)從具有任意分布形式的總體中抽出26第三節(jié)總體參數(shù)估計一、參數(shù)估計的優(yōu)良標(biāo)準(zhǔn)1、無偏性無偏性是指樣本指標(biāo)的平均數(shù)等于被估計的總體指標(biāo)數(shù)值。這時稱樣本指標(biāo)是總體指標(biāo)的無偏估計量,否則就是有偏估計量。根據(jù)中心極限定理,當(dāng)樣本容量n很大時,樣本平均數(shù)等于總體平均數(shù),樣本成數(shù)的平均數(shù)等于總體成數(shù),因此樣本平均數(shù)和樣本成數(shù)是總體平均數(shù)和成數(shù)的無偏估計量。第三節(jié)總體參數(shù)估計一、參數(shù)估計的優(yōu)良標(biāo)準(zhǔn)1、無偏性272、有效性有效性是指樣本指標(biāo)的標(biāo)準(zhǔn)差越小,越有效??傮w指標(biāo)的無偏估計量往往不止一個,采用的標(biāo)準(zhǔn)在于選擇有效的樣本指標(biāo)??傮w平均數(shù)的無偏估計量

樣本平均數(shù)

樣本中位數(shù)

樣本眾數(shù)

標(biāo)準(zhǔn)差最小理論證明,樣本平均數(shù)和樣本成數(shù)均滿足有效性。2、有效性總體平均數(shù)樣本平均數(shù)樣本中位數(shù)樣本眾數(shù)標(biāo)準(zhǔn)差283、一致性一致性是指隨著樣本容量n的增大,樣本指標(biāo)與被估計的總體指標(biāo)的偏差越來越小。根據(jù)大數(shù)定律,隨著樣本容量n的增加,樣本平均數(shù)(樣本成數(shù))有接近于總體平均數(shù)(總體成數(shù))的趨勢。因此,樣本平均數(shù)(樣本成數(shù))是總體平均數(shù)(總體成數(shù))的一致估計量。3、一致性根據(jù)大數(shù)定律,隨著樣本容量n的增加,樣本平均294、充分性在計算樣本指標(biāo)時,若能把包含在樣本中有關(guān)總體的信息完全提取出來,那么該樣本指標(biāo)就是總體指標(biāo)的充分估計量。即在計算樣本指標(biāo)時,盡量使樣本中含有的總體信息損失得少一些,損失越少,說明越充分。

樣本平均數(shù)和樣本成數(shù)均滿足以上四個標(biāo)準(zhǔn),因此,可以用樣本平均數(shù)估計總體平均數(shù),用樣本成數(shù)估計總體成數(shù)。4、充分性樣本平均數(shù)和樣本成數(shù)均滿足以上四個30第三節(jié)總體參數(shù)估計二、抽樣誤差1.抽樣誤差的概念抽樣調(diào)查過程中的誤差根據(jù)其來源大體上可以歸納為兩類:一類是登記性誤差,另一類是代表性誤差。在調(diào)查時對樣本各單位觀察、測量、登記過程中出線的差錯及匯總樣本、計算樣本指標(biāo)等工作產(chǎn)生的誤差。第三節(jié)總體參數(shù)估計二、抽樣誤差1.抽樣誤差的概念31代表性誤差是指用樣本指標(biāo)推斷相應(yīng)的總體指標(biāo)時,因樣本結(jié)構(gòu)與總體結(jié)構(gòu)不同,致使樣本不能完全代表總體而產(chǎn)生的誤差。包括系統(tǒng)誤差和隨機(jī)誤差。是由于抽樣調(diào)查時沒有按照隨機(jī)原則,而是人為的、有意地抽取樣本所產(chǎn)生的誤差,也叫偏差。例如:對某鄉(xiāng)稻田產(chǎn)量進(jìn)行抽樣調(diào)查,調(diào)查人員抽取樣本時有意多抽產(chǎn)量高(或低)的稻田代表性誤差是指用樣本指標(biāo)推斷相應(yīng)的總體指標(biāo)時,因樣本結(jié)構(gòu)與總32隨機(jī)誤差即通常所說的抽樣誤差。是指由于隨機(jī)抽樣引起的樣本結(jié)構(gòu)不同于總體而產(chǎn)生的樣本估計值與總體參數(shù)真值之間的離差。登記性誤差和系統(tǒng)誤差是人為的,在抽樣調(diào)查的過程中應(yīng)盡量避免;而抽樣誤差(隨機(jī)誤差)是抽樣調(diào)查固有的,不可避免,但可以事先計算并加以控制。隨機(jī)誤差即通常所說的抽樣誤差。是指由于隨機(jī)抽樣引起的樣本結(jié)構(gòu)332.影響抽樣誤差的因素總體變異度抽樣誤差與總體方差或標(biāo)準(zhǔn)差成正比樣本容量抽樣誤差與樣本容量成反比抽樣方法不重復(fù)抽樣的誤差小于重復(fù)抽樣的誤差抽樣組織方式2.影響抽樣誤差的因素總體變異度343.抽樣平均誤差所有可能樣本的估計值與所要估計參數(shù)離差的平均數(shù)。表明樣本平均數(shù)(或成數(shù))與總體平均數(shù)(或成數(shù))的平均誤差程度。理論公式:

抽樣平均誤差實質(zhì)是樣本估計量即樣本平均數(shù)(或成數(shù))的標(biāo)準(zhǔn)差(M為樣本個數(shù))3.抽樣平均誤差所有可能樣本的估計值與所要估計參數(shù)離差的平35式中:為平均數(shù)的抽樣平均誤差;為總體方差;為樣本容量;為總體單位數(shù)。①樣本平均數(shù)的抽樣平均誤差3.抽樣平均誤差重復(fù)抽樣不重復(fù)抽樣式中:為平均數(shù)的抽樣平均誤差;①樣本平均數(shù)的抽樣平均誤36式中:為成數(shù)的抽樣平均誤差;為總體成數(shù);為是非標(biāo)志的方差;為樣本容量;為總體單位數(shù)。②樣本成數(shù)的抽樣平均誤差3.抽樣平均誤差重復(fù)抽樣不重復(fù)抽樣式中:為成數(shù)的抽樣平均誤差;②樣本成數(shù)的抽樣平均誤差3373.抽樣平均誤差③不重復(fù)抽樣的修正系數(shù)在實際抽樣調(diào)查時,總體單位數(shù)N往往很大,(N-1)近似的等于N,所以修正系數(shù)可以轉(zhuǎn)化為:3.抽樣平均誤差③不重復(fù)抽樣的修正系數(shù)在實際抽樣調(diào)查時,總38對于無限總體或N很大時,或當(dāng)抽樣比很小時,有,則重復(fù)抽樣和不重復(fù)抽樣的抽樣平均誤差幾乎相等。實際工作中,經(jīng)常采用不重復(fù)抽樣方法進(jìn)行抽樣,而采用重復(fù)抽樣的抽樣誤差公式計算抽樣誤差,以簡化計算。3.抽樣平均誤差③不重復(fù)抽樣的修正系數(shù)對于無限總體或N很大時,或當(dāng)抽樣比3.抽樣平均39【例】欲了解某村2800戶農(nóng)民的年收入情況,隨機(jī)抽取140戶調(diào)查,平均每戶年收入為5965元,標(biāo)準(zhǔn)差為104.8元,試求抽樣平均誤差。解:若采取重復(fù)抽樣方法,則有已知條件缺少總體標(biāo)準(zhǔn)差,用樣本標(biāo)準(zhǔn)差代替,則

若采取不重復(fù)抽樣方法,則有【例】欲了解某村2800戶農(nóng)民的年收入情況,隨機(jī)抽取14404.抽樣極限誤差在一次抽樣中允許的最大誤差范圍稱為抽樣極限誤差。是變動的樣本指標(biāo)與唯一確定的但又是未知的總體指標(biāo)之間的離差可能范圍。

樣本指標(biāo)在總體指標(biāo)的附近變動,抽樣誤差范圍是以總體平均數(shù)(或成數(shù))為中心的兩個⊿距離。4.抽樣極限誤差在一次抽樣中允許的最大誤差范圍稱為41概率度抽樣極限誤差通常需要以抽樣平均誤差為標(biāo)準(zhǔn)單位來加以衡量,把抽樣極限誤差除以相應(yīng)的抽樣平均誤差,表明抽樣極限誤差是抽樣平均誤差的多少倍,這個倍數(shù)稱為概率度,用字母Z表示。概率度抽樣極限誤差通常需要以抽樣平均誤差為標(biāo)準(zhǔn)單位來加以衡量42抽樣極限誤差的理解

z值越大,允許的誤差范圍越大,樣本指標(biāo)落在以總體指標(biāo)為中心的兩個⊿距離的可能性(概率)越大。

z值越大,總體指標(biāo)落在以樣本指標(biāo)為中心的兩個⊿距離的可能性(概率)越大。抽樣極限誤差的理解z值越大,允許的誤差范圍越大43對于一定的概率度z就有對應(yīng)的概率P。

常用的有以下五對

概率度z與概率P的對應(yīng)關(guān)系概率度z概率P11.64596230.68270.90.950.95450.9973

抽樣極限誤差的實質(zhì),就是在一定的概率保證程度要求下,估計量誤差的可能范圍。對于一定的概率度z就有對應(yīng)的概率P。常用的有以下五對概率44第三節(jié)總體參數(shù)估計三、抽樣估計的置信度置信度抽樣估計時總體參數(shù)落在某個區(qū)間的概率保證程度稱為抽樣估計的置信度。用P或表示。抽樣估計的置信度和抽樣極限誤差有著密切聯(lián)系。當(dāng)抽樣極限誤差范圍增大時,抽樣估計的置信度也隨之有規(guī)律地增大,抽樣估計的精確程度則隨之有規(guī)律地降低,反之亦然。

第三節(jié)總體參數(shù)估計三、抽樣估計的置信度置信度抽樣估計時總45第三節(jié)總體參數(shù)估計四、參數(shù)估計的方法點(diǎn)估計以樣本指標(biāo)的計算結(jié)果作為總體參數(shù)估計的結(jié)果,即用樣本指標(biāo)值直接作為全及總體指標(biāo)的代表值。即用去估計,用去估計。優(yōu)點(diǎn):簡單、具體,能給出一個明確的值缺點(diǎn):沒有考慮抽樣誤差,不能給出推斷結(jié)果的把握程度??稍趯傮w指標(biāo)準(zhǔn)確性要求不高時使用。

第三節(jié)總體參數(shù)估計四、參數(shù)估計的方法點(diǎn)估計以樣本指標(biāo)的計46區(qū)間估計根據(jù)樣本估計量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范圍。即用去估計的可能范圍,用去估計的可能范圍。

對總體平均數(shù)的區(qū)間估計為對總體成數(shù)的區(qū)間估計為若給定的置信度,則區(qū)間估計根據(jù)樣本估計量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范471.估計值2.估計值的可能誤差范圍3.與誤差范圍相對應(yīng)的概率保證程度置信區(qū)間從某企業(yè)職工中抽取10%進(jìn)行調(diào)查,計算樣本平均工資為1600元,則以95%的可靠性估計該廠全體職工平均工資的可能范圍在1500元到1700元之間例如:區(qū)間估計就是估計總體指標(biāo)的置信區(qū)間區(qū)間估計的三項基本要素:置信區(qū)間從某企業(yè)職工中抽取10%進(jìn)行調(diào)查,計算樣本48實際工作中,往往首先提出估計的可靠性要求,即概率保證程度,以此確定概率度z,并與抽樣平均誤差想乘,求出抽樣極限誤差,以此確定置信區(qū)間三項基本要素的關(guān)系實際工作中,往往首先提出估計的可靠性要求,即概率保證程度,以49第三節(jié)總體參數(shù)估計五、總體平均數(shù)估計1.大樣本的總體平均數(shù)估計①計算樣本平均數(shù)②搜集總體方差的經(jīng)驗數(shù)據(jù),或計算樣本方差,即第三節(jié)總體參數(shù)估計五、總體平均數(shù)估計1.大樣本的總體平均501.大樣本的總體平均數(shù)估計③計算抽樣平均誤差重復(fù)抽樣時

不重復(fù)抽樣時

④計算抽樣極限誤差⑤確定總體平均數(shù)的置信區(qū)間1.大樣本的總體平均數(shù)估計③計算抽樣平均誤差重復(fù)抽樣時不重51【例】某企業(yè)生產(chǎn)A產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,樣本人均產(chǎn)量為35件,產(chǎn)量的樣本標(biāo)準(zhǔn)差為4.5件。請以95.45%的置信度估計該日人均產(chǎn)量的置信區(qū)間。解:已知,①計算抽樣平均誤差【例】某企業(yè)生產(chǎn)A產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣52②計算抽樣極限誤差由,查正態(tài)概率表得③確定置信區(qū)間故以95.45%的置信度斷言,該日人均產(chǎn)量在34.15~35.85件之間。②計算抽樣極限誤差由,查正態(tài)概53【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,要求在95﹪的概率保證程度下,估計該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量。按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計—100【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽54解:①計算樣本平均數(shù)②計算抽樣本方差解:①計算樣本平均數(shù)②計算抽樣本方差55③計算抽樣平均誤差④計算抽樣極限誤差由,查正態(tài)概率表得③計算抽樣平均誤差④計算抽樣極限誤差由56⑤確定置信區(qū)間該企業(yè)工人日平均產(chǎn)量的置信區(qū)間為該企業(yè)工人日總產(chǎn)量的置信區(qū)間為總體總量的置信區(qū)間⑤確定置信區(qū)間該企業(yè)工人日平均產(chǎn)量的置信區(qū)間為該企業(yè)工人日總57【例】某鄉(xiāng)水稻總面積20000畝,以不重復(fù)抽樣方法從中隨機(jī)抽取400畝,實割實測求得樣本平均畝產(chǎn)645公斤,標(biāo)準(zhǔn)差72.6公斤。要求極限誤差不超過7.2公斤,試求該鄉(xiāng)水稻的畝產(chǎn)和總產(chǎn)量的估計區(qū)間,并確定估計的可靠程度。解:已知該鄉(xiāng)水稻平均畝差的置信區(qū)間為該鄉(xiāng)水稻總產(chǎn)量的置信區(qū)間為【例】某鄉(xiāng)水稻總面積20000畝,以不重復(fù)抽樣方法從中隨機(jī)抽58計算抽樣平均誤差由可知計算概率度即估計的可靠程度為95.45%計算抽樣平均誤差計算概率度即估計的可靠程度為95.45%592、小樣本的總體平均數(shù)估計若,當(dāng)方差未知,時,簡單隨機(jī)樣本的平均數(shù)服從自由度的分布,即第三節(jié)總體參數(shù)估計五、總體平均數(shù)估計2、小樣本的總體平均數(shù)估計第三節(jié)總體參數(shù)估計五、總體平均60【例】某商場從一批袋裝食品中隨機(jī)抽取10袋,測得每袋重量(單位:克)分別為789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估計這批食品平均每袋重量的區(qū)間范圍。

解:①計算樣本平均數(shù)【例】某商場從一批袋裝食品中隨機(jī)抽取10袋,測得每袋重量(單61②計算樣本方差③計算抽樣平均誤差②計算樣本方差③計算抽樣平均誤差62④計算抽樣極限誤差由,查t分布表得⑤確定置信區(qū)間④計算抽樣極限誤差由63第三節(jié)總體參數(shù)估計六、總體成數(shù)估計①計算樣本成數(shù)②搜集總體方差的經(jīng)驗數(shù)據(jù),或計算樣本方差③計算抽樣平均誤差重復(fù)抽樣時

不重復(fù)抽樣時

第三節(jié)總體參數(shù)估計六、總體成數(shù)估計①計算樣本成數(shù)②搜集總64④計算抽樣極限誤差⑤確定總體成數(shù)的置信區(qū)間總體總量的置信區(qū)間六、總體成數(shù)估計④計算抽樣極限誤差⑤確定總體成數(shù)的置信區(qū)間總體總量的置信區(qū)間65【例】某廠對一批產(chǎn)品的質(zhì)量進(jìn)行抽樣檢驗,隨機(jī)抽取樣品100只,調(diào)查得樣本優(yōu)質(zhì)品率為80%,試計算當(dāng)把握程度為90%時該批產(chǎn)品優(yōu)質(zhì)品率的區(qū)間范圍。①計算抽樣平均誤差解:②計算抽樣極限誤差由,查正態(tài)概率表得③確定置信區(qū)間【例】某廠對一批產(chǎn)品的質(zhì)量進(jìn)行抽樣檢驗,隨機(jī)抽取樣品100只66【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,若日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務(wù),要求在95﹪的概率保證程度下,估計該廠全部工人中完成定額的工人比重及完成定額的工人總數(shù)。按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計—100完成定額的人數(shù)【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽67解:已知則樣本成數(shù)計算抽樣平均誤差解:已知則樣本成數(shù)計算抽樣平均誤差68計算抽樣極限誤差由,查正態(tài)概率表得則全部工人中完成定額的人數(shù)比重的置信區(qū)間為完成定額的工人總數(shù)的置信區(qū)間為計算抽樣極限誤差由,查正態(tài)概率表69第四節(jié)抽樣設(shè)計一、抽樣設(shè)計的原則影響抽樣設(shè)計的因素1.樣本具有充分代表性2.合適的樣本容量3.抽樣組織形式4.抽樣調(diào)查的費(fèi)用原則:第一、保證實現(xiàn)抽樣的隨機(jī)性原則。第二、保證實現(xiàn)最大的抽樣效果原則。第四節(jié)抽樣設(shè)計一、抽樣設(shè)計的原則影響抽樣1.樣本具有充分70第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計1、簡單隨機(jī)抽樣也稱純隨機(jī)抽樣,它是按照隨機(jī)原則直接從全及總體N個單位中抽取容量為n個單位的樣本。適用于均勻總體。取樣方法直接抽取法抽簽法隨機(jī)數(shù)表法第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計1、簡單隨機(jī)抽樣取樣方法直71簡單隨機(jī)抽樣樣本容量的確定1、估計平均數(shù)的樣本容量重復(fù)抽樣時

不重復(fù)抽樣時

當(dāng)N很大時簡單隨機(jī)抽樣樣本容量的確定1、估計平均數(shù)的樣本容量重復(fù)抽樣時72【例】某食品廠要檢驗本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品?解:已知則在重復(fù)抽樣條件下則在不重復(fù)抽樣條件下【例】某食品廠要檢驗本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)732、估計成數(shù)的樣本容量

當(dāng)N很大時重復(fù)抽樣時

不重復(fù)抽樣時

2、估計成數(shù)的樣本容量當(dāng)N很大時重復(fù)抽樣時不重復(fù)抽樣時74【例】某批產(chǎn)品的歷史數(shù)據(jù)顯示,平均重量為65.85千克,合格率為98%,方差為5.456,現(xiàn)準(zhǔn)備對這批產(chǎn)品進(jìn)行簡單隨機(jī)抽樣檢查,要求可靠程度達(dá)到99.73%,誤差范圍不超過0.9千克。試問檢查平均重量與合格率各需要抽多少樣本單位?解:已知【例】某批產(chǎn)品的歷史數(shù)據(jù)顯示,平均重量為65.85千克,合格75【例】某企業(yè)對一批產(chǎn)品進(jìn)行質(zhì)量檢驗,這批產(chǎn)品的總數(shù)為5000件,過去幾次同類調(diào)查所得的產(chǎn)品合格率分別為93%、95%和96%,要求在95.45﹪的概率保證程度下,合格率的誤差范圍不超過3%,應(yīng)抽查多少件產(chǎn)品?

【分析】為保證推斷的把握程度,應(yīng)從過去的合格率資料中選方差最大者,即解:已知【例】某企業(yè)對一批產(chǎn)品進(jìn)行質(zhì)量檢驗,這批產(chǎn)品的總數(shù)為500076確定樣本容量的注意事項1、對同一總體既需要進(jìn)行平均數(shù)推斷,又需要進(jìn)行比率推斷時,按各自要求可能確定二個必要抽樣數(shù)目,為了兼顧二者的共同要求,通常采用其中較大的n值作為統(tǒng)一的抽樣單位數(shù)。

2、在抽樣推斷的實際操作中,一般按重復(fù)抽樣的公式確定必要抽樣數(shù)目,按不重復(fù)抽樣的方法來具體抽選調(diào)查單位,最后又按重復(fù)抽樣的平均誤差公式來計算抽樣平均誤差進(jìn)行推斷。以便使推斷的把握程度更大。

確定樣本容量的注意事項1、對同一總體既需要進(jìn)行平均數(shù)推斷,又77根據(jù)以往調(diào)查的經(jīng)驗數(shù)據(jù)(取較大者)采用試點(diǎn)調(diào)查以樣本方差來代替根據(jù)總體的分布及其數(shù)學(xué)性質(zhì)加以推算比率的方差可以用最大值來代替3、總體方差近似值的取值方法確定樣本容量的注意事項3、總體方差近似值的取值方法確定樣本容量的注意事項78第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計2、分層抽樣又叫分類抽樣或類型抽樣。它是按與調(diào)查目的有關(guān)的某個主要標(biāo)志將總體劃分為若干層(或類),然后從各層中按隨機(jī)原則分別抽取一定數(shù)目的單位構(gòu)成樣本。

特點(diǎn):通過劃類分層,增大了各類型中單位間的共同性,容易抽出具有代表性的調(diào)查樣本。適用于總體情況復(fù)雜、各單位之間差異較大、單位較多的情況。第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計2、分層抽樣特點(diǎn):通過劃類79等比例分層抽樣不考慮各組標(biāo)志變異程度,從各組當(dāng)中按同一比例抽取樣本單位不等比例分層抽樣按各組標(biāo)志變異程度大小來確定抽樣單位數(shù)的多少,標(biāo)志變異度大的類型組多抽一些,變異度小的少抽一些,不規(guī)定統(tǒng)一的抽樣比分層抽樣的分類實際工作中,由于事先很難了解各組標(biāo)志變異程度,因此多采用等比例分層抽樣方法等比例分層抽樣分層抽樣的分類實際工作中,由于事先很難了解各組80分層抽樣的樣本指標(biāo)和抽樣平均誤差1.樣本指標(biāo)樣本平均數(shù)

式中:為樣本各組平均數(shù);為樣本各組成數(shù);為樣本各組單位數(shù)。樣本成數(shù)

分層抽樣的樣本指標(biāo)和抽樣平均誤差1.樣本指標(biāo)樣本平均數(shù)式81分層抽樣的樣本指標(biāo)和抽樣平均誤差2.抽樣平均誤差樣本平均數(shù)的抽樣平均誤差重復(fù)抽樣

不重復(fù)抽樣

式中:為總體各組組內(nèi)方差的平均值分層抽樣的樣本指標(biāo)和抽樣平均誤差2.抽樣平均誤差樣本平均數(shù)的82分層抽樣的樣本指標(biāo)和抽樣平均誤差2.抽樣平均誤差樣本成數(shù)的抽樣平均誤差重復(fù)抽樣

不重復(fù)抽樣

式中:為總體各組是非標(biāo)志方差的平均數(shù)分層抽樣的樣本指標(biāo)和抽樣平均誤差2.抽樣平均誤差樣本成數(shù)的抽83在分層抽樣方式下,因為是每組都抽取樣本單位,所以對于各組來說,可以看成全面調(diào)查,沒有抽樣誤差。因此分層抽樣方式下,組間方差不影響抽樣誤差,只有各組組內(nèi)方差影響抽樣誤差。

由抽樣平均誤差公式和上式可知,對于給定的總體,方差(即總方差)是一定的,劃分層時應(yīng)盡量增大層間差異,縮小層內(nèi)差異。這是分層抽樣法成功的關(guān)鍵。在分層抽樣方式下,因為是每組都抽取樣本單位,所以對于84【例】將某地區(qū)住戶按城市,農(nóng)村分為兩組,采用不重復(fù)抽樣抽取1000戶,調(diào)查電話擁有率,資料如表所示。試以95.45%的可能性估計該地區(qū)住戶電話擁有率。某地區(qū)住戶有限電視擁有率抽樣調(diào)查表住戶類型抽樣戶數(shù)有限電視擁有率城市農(nóng)村60070070%20%【例】將某地區(qū)住戶按城市,農(nóng)村分為兩組,采用不重復(fù)抽樣抽取185解:計算樣本成數(shù)計算樣本方差解:計算樣本成數(shù)計算樣本方差86計算抽樣平均誤差計算抽樣極限誤差由F(z)=95.45%,得z=2確定置信區(qū)間計算抽樣平均誤差計算抽樣極限誤差由F(z)=95.45%,得87分層抽樣樣本容量的確定1、估計平均數(shù)的樣本容量重復(fù)抽樣時

不重復(fù)抽樣時

2、估計成數(shù)的樣本容量重復(fù)抽樣時

不重復(fù)抽樣時

分層抽樣樣本容量的確定1、估計平均數(shù)的樣本容量重復(fù)抽樣時不88第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計3、等距抽樣等距抽樣又叫機(jī)械抽樣或系統(tǒng)抽樣。它是先將總體單位按某一標(biāo)志排隊,然后按固定的順序和間隔來抽取樣本單位。

特點(diǎn):抽取方式簡單、容易實施,抽出的單位在總體中是均勻分布的,樣本代表性較大,抽樣誤差較小。均為不重復(fù)抽樣。實際工作中應(yīng)用較多,如我國城鄉(xiāng)居民收支調(diào)查等第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計3、等距抽樣特點(diǎn):抽取方式89等距抽樣的實施步驟按照某種順序給總體中個體排列編號,然后從某個隨機(jī)位置開始每隔一定號數(shù)抽取一個個體,直至抽夠。抽樣間隔=總體單位數(shù)/樣本單位數(shù)

例如:要從500件產(chǎn)品中抽取10件,則間隔為50

等距抽樣按照排隊時所依據(jù)的標(biāo)志不同,可分為按無關(guān)標(biāo)志排隊和按有關(guān)標(biāo)志排隊。按無關(guān)標(biāo)志排隊,其抽樣效果相當(dāng)于簡單隨機(jī)抽樣;按有關(guān)標(biāo)志排隊,其抽樣效果相當(dāng)于分層抽樣。等距抽樣的實施步驟按照某種順序給總體中個體排列編號,然后從某90第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計4、整群抽樣將研究對象的總體劃分為若干群,然后按隨機(jī)原則從中成群地抽取樣本單位,對抽中的群進(jìn)行全面調(diào)查的一種抽樣方法。特點(diǎn):調(diào)查單位比較集中,調(diào)查方便,但調(diào)查單位在總體中的分布不均勻,其樣本代表性較差。均為不重復(fù)抽樣。在群間差異性不大或者不適宜單個地抽選調(diào)查樣本的情況下,可采用這種方式。第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計4、整群抽樣特點(diǎn):調(diào)查單位91整群抽樣的樣本指標(biāo)和抽樣平均誤差1.樣本指標(biāo)樣本平均數(shù)

式中:為樣本各群平均數(shù);為樣本各群成數(shù);為樣本群數(shù)。樣本成數(shù)

整群抽樣的樣本指標(biāo)和抽樣平均誤差1.樣本指標(biāo)樣本平均數(shù)式92分層抽樣的樣本指標(biāo)和抽樣平均誤差2.抽樣平均誤差式中:為總體群數(shù);為總體平均數(shù)或成數(shù)的群間方差。估計平均數(shù)時

估計成數(shù)時

分層抽樣的樣本指標(biāo)和抽樣平均誤差2.抽樣平均誤差式中:93【例】對某機(jī)床連續(xù)加工的零件,在白天12小時內(nèi),每小時檢查最后10分鐘產(chǎn)生的全部零件,測得資料如表所示。試以95%的可靠性估計白天生產(chǎn)的全部零件的平均長度和合格率。對某機(jī)床加工零件抽樣調(diào)查表樣本群123456789101112平均長度(mm)合格率(%)209521942090198920882092219020912085208619902194【例】對某機(jī)床連續(xù)加工的零件,在白天12小時內(nèi),每小時檢查最94解:計算樣本成數(shù)(1)估計總體平均數(shù)計算樣本方差解:計算樣本成數(shù)(1)估計總體平均數(shù)計算樣本方差95計算抽樣平均誤差計算抽樣極限誤差由F(z)=95.45%,得z=1.96確定置信區(qū)間計算抽樣平均誤差計算抽樣極限誤差由F(z)=95.45%,得96計算樣本成數(shù)(2)估計總體成數(shù)計算樣本方差計算樣本成數(shù)(2)估計總體成數(shù)計算樣本方差97計算抽樣平均誤差計算抽樣極限誤差由F(z)=95.45%,得z=1.96確定置信區(qū)間計算抽樣平均誤差計算抽樣極限誤差由F(z)=95.45%,得98準(zhǔn)確性檢查是以抽樣方案要求的允許誤差為標(biāo)準(zhǔn),用已掌握的資料檢查其在一定概率保證程度下,實際的極限誤差是否超過了允許誤差的要求,即要求極限誤差小于或等于允許誤差。代表性檢查是將抽樣方案中的樣本指標(biāo),與過去已掌握的總體相應(yīng)指標(biāo)進(jìn)行對比,視其比率是否合乎要求。通常這一比率不得超過3%~5%,否則即表示代表性不足。抽樣方案的檢查準(zhǔn)確性檢查抽樣方案的檢查99結(jié)束THANKS結(jié)束THANKS100謝謝1月-2300:12:5900:1200:121月-231月-2300:1200:1200:12:591月-231月-2300:12:592023/1/10:12:59謝謝12月-2201:34:2801:3401:3412演講完畢,謝謝觀看!演講完畢,謝謝觀看!第七章抽樣調(diào)查

第七章抽樣調(diào)查103第七章抽樣調(diào)查§7.1總體和樣本

§7.2抽樣調(diào)查的數(shù)理基礎(chǔ)

§7.3總體參數(shù)估計§7.4抽樣設(shè)計§7.5統(tǒng)計假設(shè)檢驗第七章抽樣調(diào)查§7.1總體和樣本104第一節(jié)總體和樣本一、抽樣調(diào)查概述抽樣調(diào)查是一種科學(xué)的非全面調(diào)查。它是按照隨機(jī)原則從調(diào)查對象的總體中抽取部分單位進(jìn)行調(diào)查,并根據(jù)這部分單位的調(diào)查結(jié)果推斷總體的數(shù)量特征。抽樣調(diào)查第一節(jié)總體和樣本一、抽樣調(diào)查概述抽樣調(diào)查是一種科學(xué)的非全105抽樣調(diào)查的特點(diǎn)隨機(jī)抽取樣本單位;用部分信息推斷總體數(shù)量特征;抽樣推斷具有一定的概率保證程度

;抽樣誤差可以事先計算并控制。 抽樣調(diào)查的特點(diǎn)隨機(jī)抽取樣本單位;106作用應(yīng)用經(jīng)濟(jì)性:節(jié)省人力、物力、財力和時間時效性:可用較短的時間搜集到所需資料適應(yīng)性:適用于各領(lǐng)域,各種問題的調(diào)查準(zhǔn)確性:受人為干擾的可能性較小,調(diào)查資料的準(zhǔn)確性較高能解決全面調(diào)查無法或難以解決的問題可以補(bǔ)充和訂正全面調(diào)查的結(jié)果應(yīng)用于生產(chǎn)過程上產(chǎn)品質(zhì)量的檢查和控制作用應(yīng)用經(jīng)濟(jì)性:節(jié)省人力、物力、財力和時間能解決全面調(diào)查無法107二、有關(guān)抽樣的幾個基本概念全及總體和樣本總體1、全及總體全及總體又稱總體或母體,是指研究對象的全體,它是由許多個性質(zhì)相同的調(diào)查單位組成的,總體單位數(shù)通常用N表示

。

例如:全部職工、全部學(xué)生、全部產(chǎn)品二、有關(guān)抽樣的幾個基本概念全及總體和樣本總體1、全及總體例如1082、抽樣框抽樣框是指用以代表總體,并從中抽選樣本的一個框架,抽樣框的主要形式有三種:①名單抽樣框②區(qū)域抽樣框③時間表抽樣框

對于抽樣調(diào)查來說,樣本的代表性如何,抽樣調(diào)查最終推算的估計值真實性如何,首先取決于抽樣框的質(zhì)量。抽樣框在抽樣調(diào)查中處于基礎(chǔ)地位,是抽樣調(diào)查必不可少的部分,其對于推斷總體具有相當(dāng)大的影響。全及總體和樣本總體2、抽樣框?qū)τ诔闃诱{(diào)查來說,樣本的代表性如何1093、樣本總體樣本總體,又叫子樣,簡稱樣本。它是從全及總體中隨機(jī)抽取出來,用來代表全及總體的那部分單位構(gòu)成的總體。樣本總體的單位數(shù)用小寫字母n表示,稱為樣本容量。從某個城市職工家庭中隨機(jī)抽取1000戶進(jìn)行調(diào)查,則這1000戶組成的小總體即為樣本,樣本容量n=1000。例如:全及總體和樣本總體3、樣本總體從某個城市職工家庭中隨機(jī)抽取1000戶進(jìn)行調(diào)查,110對于給定的研究對象,全及總體是唯一確定的,而樣本總體不是唯一的,它是隨機(jī)的。4、抽樣比抽樣比是指在抽選樣本時,所抽取的樣本單位數(shù)n與總體單位數(shù)N之比。一般地講,n≥30為大樣本,n<30為小樣本。研究社會經(jīng)濟(jì)現(xiàn)象時,通常采用大樣本進(jìn)行抽樣調(diào)查。全及總體和樣本總體對于給定的研究對象,全及總體是唯一確定的,而樣本總體不是唯一111二、有關(guān)抽樣的幾個基本概念總體指標(biāo)和樣本指標(biāo)1、總體指標(biāo)總體指標(biāo)是根據(jù)全及總體所有單位的標(biāo)志值計算出來的,反映總體的數(shù)量特征。為與樣本指標(biāo)區(qū)分,用大寫字母表示總體指標(biāo)。包括:總體平均數(shù)總體成數(shù)總體方差總體標(biāo)準(zhǔn)差二、有關(guān)抽樣的幾個基本概念總體指標(biāo)和樣本指標(biāo)1、總體指標(biāo)包括112總體指標(biāo)和樣本指標(biāo)2、樣本指標(biāo)樣本指標(biāo)又稱抽樣指標(biāo),它是根據(jù)樣本總體計算的統(tǒng)計指標(biāo),反映樣本總體的數(shù)量特征,樣本指標(biāo)用小寫字母表示。

包括:樣本平均數(shù)樣本成數(shù)樣本方差樣本標(biāo)準(zhǔn)差總體指標(biāo)和樣本指標(biāo)2、樣本指標(biāo)包括:樣本平均數(shù)113二、有關(guān)抽樣的幾個基本概念抽樣方法和樣本可能數(shù)目1、重復(fù)抽樣重復(fù)抽樣也叫重置抽樣,是指每次抽取一個單位記錄其標(biāo)志表現(xiàn)后又放回,重新參加下一次的抽選。全及總體單位數(shù)始終保持不變,每個總體單位都有被重復(fù)抽中的可能。

重復(fù)抽樣通常要考慮單位排列順序,其樣本可能數(shù)目為二、有關(guān)抽樣的幾個基本概念抽樣方法和樣本可能數(shù)目1、重復(fù)抽樣114抽樣方法和樣本可能數(shù)目2、不重復(fù)抽樣不重復(fù)抽樣也叫不重置抽樣,是指每次從總體中抽取一個單位記錄其標(biāo)志表現(xiàn)后不再放回,從剩余的單位中抽取下一個單位。全及總體單位數(shù)在不斷減少,每個總體單位不可能被重復(fù)抽中。不重復(fù)抽樣通常不考慮樣本單位排列順序,其樣本可能數(shù)目為抽樣方法和樣本可能數(shù)目2、不重復(fù)抽樣不重復(fù)抽樣通常不考115第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)抽樣調(diào)查數(shù)理基礎(chǔ)抽樣分布大數(shù)定律正態(tài)分布中心極限定理第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)抽樣調(diào)查抽樣分布大數(shù)定律正態(tài)分布116抽樣分布的形成過程總體計算樣本統(tǒng)計量如:樣本均值、成數(shù)、方差樣本樣本統(tǒng)計量的概率分布抽樣分布的形成過程總體計算樣本統(tǒng)計量樣本樣本統(tǒng)計量的概率分布117大數(shù)定律第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)在對某一現(xiàn)象觀察過程中,由大量相互獨(dú)立的隨機(jī)變量構(gòu)成的總體,由于受偶然因素的影響,每次所得到的結(jié)果不同,但經(jīng)過大量觀察并加以綜合平均后,消除了偶然因素引起的差異,而接近于總體的平均值,使現(xiàn)象總體某一方面的規(guī)律在數(shù)量上、質(zhì)量上顯示出來。例如:拋硬幣實驗通常以平均數(shù)或成數(shù)的形式表現(xiàn)大第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)在對某一現(xiàn)象觀察過程1181.獨(dú)立同分布大數(shù)定律獨(dú)立同分布的隨機(jī)變量:,設(shè)它們的平均數(shù)為,方差為,則對任意小的正數(shù)ε,有:2.貝努力大數(shù)定律設(shè)m是n次獨(dú)立隨機(jī)試驗中事件A發(fā)生的次數(shù),p是事件A發(fā)生的概率,則對于任意小的正數(shù)ε,有1.獨(dú)立同分布大數(shù)定律獨(dú)立同分布的隨機(jī)變量:119

大數(shù)定理從理論上揭示了樣本和總體之間的內(nèi)在聯(lián)系,即隨著抽樣單位數(shù)n的增大,樣本平均數(shù)有接近總體平均數(shù)的趨勢,樣本成數(shù)有接近總體成數(shù)的趨勢。注意:第一、抽樣必須遵循隨機(jī)原則。第二、抽樣必須遵循大量原則。大數(shù)定理從理論上揭示了樣本和總體之間的內(nèi)在120正態(tài)分布例如:人類的身高、產(chǎn)品的壽命、加工零件的尺寸等。正態(tài)分布基本指這樣的分布:在總體平均數(shù)及其附近,總體單位數(shù)最多;相反地,越遠(yuǎn)離總體平均數(shù),總體單位數(shù)越少。也就是說,越接近總體平均數(shù)的變量值出現(xiàn)的次數(shù)越多,概率也就越大;反之,越遠(yuǎn)離總體平均數(shù)的變量值出現(xiàn)的次數(shù)就越少,概率也就越小。第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)正例如:人類的身高、產(chǎn)品的壽命、加工零件的尺寸等。121正態(tài)分布的特征1、正態(tài)分布是鐘型對稱分布,對稱線為總體平均數(shù),整個曲線下的面積等于1。總體平均數(shù)將分布曲線截為兩段互為鏡像的曲線,兩段曲線下的面積相等,各為1/2。正態(tài)分布的特征1、正態(tài)分布是鐘型對稱分布,對稱線為總體平均數(shù)1222、在總體平均數(shù)處,正態(tài)分布的概率密度最大,當(dāng)遠(yuǎn)離總體平均數(shù)時,概率密度的值隨著距離的增加而遞減。X

f(x)

2、在總體平均數(shù)處,正態(tài)分布的概率密度最大,當(dāng)遠(yuǎn)離總體平均數(shù)1233、在距離總體平均數(shù)一個標(biāo)準(zhǔn)差的位置上,即時,曲線有兩個拐點(diǎn)。

3、在距離總體平均數(shù)一個標(biāo)準(zhǔn)差的位置上,即1244、正態(tài)分布的位置及形狀由總體平均數(shù)和總體標(biāo)準(zhǔn)差決定,總體平均數(shù)決定正態(tài)分布中心的位置;4、正態(tài)分布的位置及形狀由總體平均數(shù)和總體標(biāo)準(zhǔn)差決定,總體平1254、總體標(biāo)準(zhǔn)差決定正態(tài)分布的寬窄的形狀。04、總體標(biāo)準(zhǔn)差決定正態(tài)分布的寬窄的形狀。0126當(dāng)被抽樣總體服從正態(tài)分布時,樣本平均數(shù)的抽樣分布具有下列重要性質(zhì):樣本平均數(shù)的分布仍然是正態(tài)分布;樣本平均數(shù)分布的平均值等于總體平均數(shù);樣本平均數(shù)分布的方差等于總體方差除以樣本容量。

當(dāng)被抽樣總體服從正態(tài)分布時,樣本平均數(shù)的抽樣分布具有下列重要127中心極限定理第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)從具有任意分布形式的總體中抽出一個容量是n的樣本,如果總體的平均數(shù)是,方差是,則當(dāng)n充分大時,樣本平均數(shù)趨于正態(tài)分布。樣本平均數(shù)所服從的正態(tài)分布的中心仍是,標(biāo)準(zhǔn)差是抽樣平均誤差。當(dāng)樣本容量很大時,樣本成數(shù)近似地服從正態(tài)分布,分布中心為總體成數(shù)中第二節(jié)抽樣調(diào)查的數(shù)理基礎(chǔ)從具有任意分布形式的總體中抽出128第三節(jié)總體參數(shù)估計一、參數(shù)估計的優(yōu)良標(biāo)準(zhǔn)1、無偏性無偏性是指樣本指標(biāo)的平均數(shù)等于被估計的總體指標(biāo)數(shù)值。這時稱樣本指標(biāo)是總體指標(biāo)的無偏估計量,否則就是有偏估計量。根據(jù)中心極限定理,當(dāng)樣本容量n很大時,樣本平均數(shù)等于總體平均數(shù),樣本成數(shù)的平均數(shù)等于總體成數(shù),因此樣本平均數(shù)和樣本成數(shù)是總體平均數(shù)和成數(shù)的無偏估計量。第三節(jié)總體參數(shù)估計一、參數(shù)估計的優(yōu)良標(biāo)準(zhǔn)1、無偏性1292、有效性有效性是指樣本指標(biāo)的標(biāo)準(zhǔn)差越小,越有效??傮w指標(biāo)的無偏估計量往往不止一個,采用的標(biāo)準(zhǔn)在于選擇有效的樣本指標(biāo)。總體平均數(shù)的無偏估計量

樣本平均數(shù)

樣本中位數(shù)

樣本眾數(shù)

標(biāo)準(zhǔn)差最小理論證明,樣本平均數(shù)和樣本成數(shù)均滿足有效性。2、有效性總體平均數(shù)樣本平均數(shù)樣本中位數(shù)樣本眾數(shù)標(biāo)準(zhǔn)差1303、一致性一致性是指隨著樣本容量n的增大,樣本指標(biāo)與被估計的總體指標(biāo)的偏差越來越小。根據(jù)大數(shù)定律,隨著樣本容量n的增加,樣本平均數(shù)(樣本成數(shù))有接近于總體平均數(shù)(總體成數(shù))的趨勢。因此,樣本平均數(shù)(樣本成數(shù))是總體平均數(shù)(總體成數(shù))的一致估計量。3、一致性根據(jù)大數(shù)定律,隨著樣本容量n的增加,樣本平均1314、充分性在計算樣本指標(biāo)時,若能把包含在樣本中有關(guān)總體的信息完全提取出來,那么該樣本指標(biāo)就是總體指標(biāo)的充分估計量。即在計算樣本指標(biāo)時,盡量使樣本中含有的總體信息損失得少一些,損失越少,說明越充分。

樣本平均數(shù)和樣本成數(shù)均滿足以上四個標(biāo)準(zhǔn),因此,可以用樣本平均數(shù)估計總體平均數(shù),用樣本成數(shù)估計總體成數(shù)。4、充分性樣本平均數(shù)和樣本成數(shù)均滿足以上四個132第三節(jié)總體參數(shù)估計二、抽樣誤差1.抽樣誤差的概念抽樣調(diào)查過程中的誤差根據(jù)其來源大體上可以歸納為兩類:一類是登記性誤差,另一類是代表性誤差。在調(diào)查時對樣本各單位觀察、測量、登記過程中出線的差錯及匯總樣本、計算樣本指標(biāo)等工作產(chǎn)生的誤差。第三節(jié)總體參數(shù)估計二、抽樣誤差1.抽樣誤差的概念133代表性誤差是指用樣本指標(biāo)推斷相應(yīng)的總體指標(biāo)時,因樣本結(jié)構(gòu)與總體結(jié)構(gòu)不同,致使樣本不能完全代表總體而產(chǎn)生的誤差。包括系統(tǒng)誤差和隨機(jī)誤差。是由于抽樣調(diào)查時沒有按照隨機(jī)原則,而是人為的、有意地抽取樣本所產(chǎn)生的誤差,也叫偏差。例如:對某鄉(xiāng)稻田產(chǎn)量進(jìn)行抽樣調(diào)查,調(diào)查人員抽取樣本時有意多抽產(chǎn)量高(或低)的稻田代表性誤差是指用樣本指標(biāo)推斷相應(yīng)的總體指標(biāo)時,因樣本結(jié)構(gòu)與總134隨機(jī)誤差即通常所說的抽樣誤差。是指由于隨機(jī)抽樣引起的樣本結(jié)構(gòu)不同于總體而產(chǎn)生的樣本估計值與總體參數(shù)真值之間的離差。登記性誤差和系統(tǒng)誤差是人為的,在抽樣調(diào)查的過程中應(yīng)盡量避免;而抽樣誤差(隨機(jī)誤差)是抽樣調(diào)查固有的,不可避免,但可以事先計算并加以控制。隨機(jī)誤差即通常所說的抽樣誤差。是指由于隨機(jī)抽樣引起的樣本結(jié)構(gòu)1352.影響抽樣誤差的因素總體變異度抽樣誤差與總體方差或標(biāo)準(zhǔn)差成正比樣本容量抽樣誤差與樣本容量成反比抽樣方法不重復(fù)抽樣的誤差小于重復(fù)抽樣的誤差抽樣組織方式2.影響抽樣誤差的因素總體變異度1363.抽樣平均誤差所有可能樣本的估計值與所要估計參數(shù)離差的平均數(shù)。表明樣本平均數(shù)(或成數(shù))與總體平均數(shù)(或成數(shù))的平均誤差程度。理論公式:

抽樣平均誤差實質(zhì)是樣本估計量即樣本平均數(shù)(或成數(shù))的標(biāo)準(zhǔn)差(M為樣本個數(shù))3.抽樣平均誤差所有可能樣本的估計值與所要估計參數(shù)離差的平137式中:為平均數(shù)的抽樣平均誤差;為總體方差;為樣本容量;為總體單位數(shù)。①樣本平均數(shù)的抽樣平均誤差3.抽樣平均誤差重復(fù)抽樣不重復(fù)抽樣式中:為平均數(shù)的抽樣平均誤差;①樣本平均數(shù)的抽樣平均誤138式中:為成數(shù)的抽樣平均誤差;為總體成數(shù);為是非標(biāo)志的方差;為樣本容量;為總體單位數(shù)。②樣本成數(shù)的抽樣平均誤差3.抽樣平均誤差重復(fù)抽樣不重復(fù)抽樣式中:為成數(shù)的抽樣平均誤差;②樣本成數(shù)的抽樣平均誤差31393.抽樣平均誤差③不重復(fù)抽樣的修正系數(shù)在實際抽樣調(diào)查時,總體單位數(shù)N往往很大,(N-1)近似的等于N,所以修正系數(shù)可以轉(zhuǎn)化為:3.抽樣平均誤差③不重復(fù)抽樣的修正系數(shù)在實際抽樣調(diào)查時,總140對于無限總體或N很大時,或當(dāng)抽樣比很小時,有,則重復(fù)抽樣和不重復(fù)抽樣的抽樣平均誤差幾乎相等。實際工作中,經(jīng)常采用不重復(fù)抽樣方法進(jìn)行抽樣,而采用重復(fù)抽樣的抽樣誤差公式計算抽樣誤差,以簡化計算。3.抽樣平均誤差③不重復(fù)抽樣的修正系數(shù)對于無限總體或N很大時,或當(dāng)抽樣比3.抽樣平均141【例】欲了解某村2800戶農(nóng)民的年收入情況,隨機(jī)抽取140戶調(diào)查,平均每戶年收入為5965元,標(biāo)準(zhǔn)差為104.8元,試求抽樣平均誤差。解:若采取重復(fù)抽樣方法,則有已知條件缺少總體標(biāo)準(zhǔn)差,用樣本標(biāo)準(zhǔn)差代替,則

若采取不重復(fù)抽樣方法,則有【例】欲了解某村2800戶農(nóng)民的年收入情況,隨機(jī)抽取141424.抽樣極限誤差在一次抽樣中允許的最大誤差范圍稱為抽樣極限誤差。是變動的樣本指標(biāo)與唯一確定的但又是未知的總體指標(biāo)之間的離差可能范圍。

樣本指標(biāo)在總體指標(biāo)的附近變動,抽樣誤差范圍是以總體平均數(shù)(或成數(shù))為中心的兩個⊿距離。4.抽樣極限誤差在一次抽樣中允許的最大誤差范圍稱為143概率度抽樣極限誤差通常需要以抽樣平均誤差為標(biāo)準(zhǔn)單位來加以衡量,把抽樣極限誤差除以相應(yīng)的抽樣平均誤差,表明抽樣極限誤差是抽樣平均誤差的多少倍,這個倍數(shù)稱為概率度,用字母Z表示。概率度抽樣極限誤差通常需要以抽樣平均誤差為標(biāo)準(zhǔn)單位來加以衡量144抽樣極限誤差的理解

z值越大,允許的誤差范圍越大,樣本指標(biāo)落在以總體指標(biāo)為中心的兩個⊿距離的可能性(概率)越大。

z值越大,總體指標(biāo)落在以樣本指標(biāo)為中心的兩個⊿距離的可能性(概率)越大。抽樣極限誤差的理解z值越大,允許的誤差范圍越大145對于一定的概率度z就有對應(yīng)的概率P。

常用的有以下五對

概率度z與概率P的對應(yīng)關(guān)系概率度z概率P11.64596230.68270.90.950.95450.9973

抽樣極限誤差的實質(zhì),就是在一定的概率保證程度要求下,估計量誤差的可能范圍。對于一定的概率度z就有對應(yīng)的概率P。常用的有以下五對概率146第三節(jié)總體參數(shù)估計三、抽樣估計的置信度置信度抽樣估計時總體參數(shù)落在某個區(qū)間的概率保證程度稱為抽樣估計的置信度。用P或表示。抽樣估計的置信度和抽樣極限誤差有著密切聯(lián)系。當(dāng)抽樣極限誤差范圍增大時,抽樣估計的置信度也隨之有規(guī)律地增大,抽樣估計的精確程度則隨之有規(guī)律地降低,反之亦然。

第三節(jié)總體參數(shù)估計三、抽樣估計的置信度置信度抽樣估計時總147第三節(jié)總體參數(shù)估計四、參數(shù)估計的方法點(diǎn)估計以樣本指標(biāo)的計算結(jié)果作為總體參數(shù)估計的結(jié)果,即用樣本指標(biāo)值直接作為全及總體指標(biāo)的代表值。即用去估計,用去估計。優(yōu)點(diǎn):簡單、具體,能給出一個明確的值缺點(diǎn):沒有考慮抽樣誤差,不能給出推斷結(jié)果的把握程度??稍趯傮w指標(biāo)準(zhǔn)確性要求不高時使用。

第三節(jié)總體參數(shù)估計四、參數(shù)估計的方法點(diǎn)估計以樣本指標(biāo)的計148區(qū)間估計根據(jù)樣本估計量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范圍。即用去估計的可能范圍,用去估計的可能范圍。

對總體平均數(shù)的區(qū)間估計為對總體成數(shù)的區(qū)間估計為若給定的置信度,則區(qū)間估計根據(jù)樣本估計量以一定可靠程度推斷總體參數(shù)所在的區(qū)間范1491.估計值2.估計值的可能誤差范圍3.與誤差范圍相對應(yīng)的概率保證程度置信區(qū)間從某企業(yè)職工中抽取10%進(jìn)行調(diào)查,計算樣本平均工資為1600元,則以95%的可靠性估計該廠全體職工平均工資的可能范圍在1500元到1700元之間例如:區(qū)間估計就是估計總體指標(biāo)的置信區(qū)間區(qū)間估計的三項基本要素:置信區(qū)間從某企業(yè)職工中抽取10%進(jìn)行調(diào)查,計算樣本150實際工作中,往往首先提出估計的可靠性要求,即概率保證程度,以此確定概率度z,并與抽樣平均誤差想乘,求出抽樣極限誤差,以此確定置信區(qū)間三項基本要素的關(guān)系實際工作中,往往首先提出估計的可靠性要求,即概率保證程度,以151第三節(jié)總體參數(shù)估計五、總體平均數(shù)估計1.大樣本的總體平均數(shù)估計①計算樣本平均數(shù)②搜集總體方差的經(jīng)驗數(shù)據(jù),或計算樣本方差,即第三節(jié)總體參數(shù)估計五、總體平均數(shù)估計1.大樣本的總體平均1521.大樣本的總體平均數(shù)估計③計算抽樣平均誤差重復(fù)抽樣時

不重復(fù)抽樣時

④計算抽樣極限誤差⑤確定總體平均數(shù)的置信區(qū)間1.大樣本的總體平均數(shù)估計③計算抽樣平均誤差重復(fù)抽樣時不重153【例】某企業(yè)生產(chǎn)A產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,樣本人均產(chǎn)量為35件,產(chǎn)量的樣本標(biāo)準(zhǔn)差為4.5件。請以95.45%的置信度估計該日人均產(chǎn)量的置信區(qū)間。解:已知,①計算抽樣平均誤差【例】某企業(yè)生產(chǎn)A產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣154②計算抽樣極限誤差由,查正態(tài)概率表得③確定置信區(qū)間故以95.45%的置信度斷言,該日人均產(chǎn)量在34.15~35.85件之間。②計算抽樣極限誤差由,查正態(tài)概155【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,要求在95﹪的概率保證程度下,估計該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量。按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計—100【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽156解:①計算樣本平均數(shù)②計算抽樣本方差解:①計算樣本平均數(shù)②計算抽樣本方差157③計算抽樣平均誤差④計算抽樣極限誤差由,查正態(tài)概率表得③計算抽樣平均誤差④計算抽樣極限誤差由158⑤確定置信區(qū)間該企業(yè)工人日平均產(chǎn)量的置信區(qū)間為該企業(yè)工人日總產(chǎn)量的置信區(qū)間為總體總量的置信區(qū)間⑤確定置信區(qū)間該企業(yè)工人日平均產(chǎn)量的置信區(qū)間為該企業(yè)工人日總159【例】某鄉(xiāng)水稻總面積20000畝,以不重復(fù)抽樣方法從中隨機(jī)抽取400畝,實割實測求得樣本平均畝產(chǎn)645公斤,標(biāo)準(zhǔn)差72.6公斤。要求極限誤差不超過7.2公斤,試求該鄉(xiāng)水稻的畝產(chǎn)和總產(chǎn)量的估計區(qū)間,并確定估計的可靠程度。解:已知該鄉(xiāng)水稻平均畝差的置信區(qū)間為該鄉(xiāng)水稻總產(chǎn)量的置信區(qū)間為【例】某鄉(xiāng)水稻總面積20000畝,以不重復(fù)抽樣方法從中隨機(jī)抽160計算抽樣平均誤差由可知計算概率度即估計的可靠程度為95.45%計算抽樣平均誤差計算概率度即估計的可靠程度為95.45%1612、小樣本的總體平均數(shù)估計若,當(dāng)方差未知,時,簡單隨機(jī)樣本的平均數(shù)服從自由度的分布,即第三節(jié)總體參數(shù)估計五、總體平均數(shù)估計2、小樣本的總體平均數(shù)估計第三節(jié)總體參數(shù)估計五、總體平均162【例】某商場從一批袋裝食品中隨機(jī)抽取10袋,測得每袋重量(單位:克)分別為789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估計這批食品平均每袋重量的區(qū)間范圍。

解:①計算樣本平均數(shù)【例】某商場從一批袋裝食品中隨機(jī)抽取10袋,測得每袋重量(單163②計算樣本方差③計算抽樣平均誤差②計算樣本方差③計算抽樣平均誤差164④計算抽樣極限誤差由,查t分布表得⑤確定置信區(qū)間④計算抽樣極限誤差由165第三節(jié)總體參數(shù)估計六、總體成數(shù)估計①計算樣本成數(shù)②搜集總體方差的經(jīng)驗數(shù)據(jù),或計算樣本方差③計算抽樣平均誤差重復(fù)抽樣時

不重復(fù)抽樣時

第三節(jié)總體參數(shù)估計六、總體成數(shù)估計①計算樣本成數(shù)②搜集總166④計算抽樣極限誤差⑤確定總體成數(shù)的置信區(qū)間總體總量的置信區(qū)間六、總體成數(shù)估計④計算抽樣極限誤差⑤確定總體成數(shù)的置信區(qū)間總體總量的置信區(qū)間167【例】某廠對一批產(chǎn)品的質(zhì)量進(jìn)行抽樣檢驗,隨機(jī)抽取樣品100只,調(diào)查得樣本優(yōu)質(zhì)品率為80%,試計算當(dāng)把握程度為90%時該批產(chǎn)品優(yōu)質(zhì)品率的區(qū)間范圍。①計算抽樣平均誤差解:②計算抽樣極限誤差由,查正態(tài)概率表得③確定置信區(qū)間【例】某廠對一批產(chǎn)品的質(zhì)量進(jìn)行抽樣檢驗,隨機(jī)抽取樣品100只168【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,若日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務(wù),要求在95﹪的概率保證程度下,估計該廠全部工人中完成定額的工人比重及完成定額的工人總數(shù)。按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計—100完成定額的人數(shù)【例】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽169解:已知則樣本成數(shù)計算抽樣平均誤差解:已知則樣本成數(shù)計算抽樣平均誤差170計算抽樣極限誤差由,查正態(tài)概率表得則全部工人中完成定額的人數(shù)比重的置信區(qū)間為完成定額的工人總數(shù)的置信區(qū)間為計算抽樣極限誤差由,查正態(tài)概率表171第四節(jié)抽樣設(shè)計一、抽樣設(shè)計的原則影響抽樣設(shè)計的因素1.樣本具有充分代表性2.合適的樣本容量3.抽樣組織形式4.抽樣調(diào)查的費(fèi)用原則:第一、保證實現(xiàn)抽樣的隨機(jī)性原則。第二、保證實現(xiàn)最大的抽樣效果原則。第四節(jié)抽樣設(shè)計一、抽樣設(shè)計的原則影響抽樣1.樣本具有充分172第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計1、簡單隨機(jī)抽樣也稱純隨機(jī)抽樣,它是按照隨機(jī)原則直接從全及總體N個單位中抽取容量為n個單位的樣本。適用于均勻總體。取樣方法直接抽取法抽簽法隨機(jī)數(shù)表法第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計1、簡單隨機(jī)抽樣取樣方法直173簡單隨機(jī)抽樣樣本容量的確定1、估計平均數(shù)的樣本容量重復(fù)抽樣時

不重復(fù)抽樣時

當(dāng)N很大時簡單隨機(jī)抽樣樣本容量的確定1、估計平均數(shù)的樣本容量重復(fù)抽樣時174【例】某食品廠要檢驗本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品?解:已知則在重復(fù)抽樣條件下則在不重復(fù)抽樣條件下【例】某食品廠要檢驗本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)1752、估計成數(shù)的樣本容量

當(dāng)N很大時重復(fù)抽樣時

不重復(fù)抽樣時

2、估計成數(shù)的樣本容量當(dāng)N很大時重復(fù)抽樣時不重復(fù)抽樣時176【例】某批產(chǎn)品的歷史數(shù)據(jù)顯示,平均重量為65.85千克,合格率為98%,方差為5.456,現(xiàn)準(zhǔn)備對這批產(chǎn)品進(jìn)行簡單隨機(jī)抽樣檢查,要求可靠程度達(dá)到99.73%,誤差范圍不超過0.9千克。試問檢查平均重量與合格率各需要抽多少樣本單位?解:已知【例】某批產(chǎn)品的歷史數(shù)據(jù)顯示,平均重量為65.85千克,合格177【例】某企業(yè)對一批產(chǎn)品進(jìn)行質(zhì)量檢驗,這批產(chǎn)品的總數(shù)為5000件,過去幾次同類調(diào)查所得的產(chǎn)品合格率分別為93%、95%和96%,要求在95.45﹪的概率保證程度下,合格率的誤差范圍不超過3%,應(yīng)抽查多少件產(chǎn)品?

【分析】為保證推斷的把握程度,應(yīng)從過去的合格率資料中選方差最大者,即解:已知【例】某企業(yè)對一批產(chǎn)品進(jìn)行質(zhì)量檢驗,這批產(chǎn)品的總數(shù)為5000178確定樣本容量的注意事項1、對同一總體既需要進(jìn)行平均數(shù)推斷,又需要進(jìn)行比率推斷時,按各自要求可能確定二個必要抽樣數(shù)目,為了兼顧二者的共同要求,通常采用其中較大的n值作為統(tǒng)一的抽樣單位數(shù)。

2、在抽樣推斷的實際操作中,一般按重復(fù)抽樣的公式確定必要抽樣數(shù)目,按不重復(fù)抽樣的方法來具體抽選調(diào)查單位,最后又按重復(fù)抽樣的平均誤差公式來計算抽樣平均誤差進(jìn)行推斷。以便使推斷的把握程度更大。

確定樣本容量的注意事項1、對同一總體既需要進(jìn)行平均數(shù)推斷,又179根據(jù)以往調(diào)查的經(jīng)驗數(shù)據(jù)(取較大者)采用試點(diǎn)調(diào)查以樣本方差來代替根據(jù)總體的分布及其數(shù)學(xué)性質(zhì)加以推算比率的方差可以用最大值來代替3、總體方差近似值的取值方法確定樣本容量的注意事項3、總體方差近似值的取值方法確定樣本容量的注意事項180第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計2、分層抽樣又叫分類抽樣或類型抽樣。它是按與調(diào)查目的有關(guān)的某個主要標(biāo)志將總體劃分為若干層(或類),然后從各層中按隨機(jī)原則分別抽取一定數(shù)目的單位構(gòu)成樣本。

特點(diǎn):通過劃類分層,增大了各類型中單位間的共同性,容易抽出具有代表性的調(diào)查樣本。適用于總體情況復(fù)雜、各單位之間差異較大、單位較多的情況。第四節(jié)抽樣設(shè)計二、抽樣組織設(shè)計2、分層抽樣特點(diǎn):通過劃類181等比例分層抽樣不考慮各組標(biāo)志變異程度,從各組當(dāng)中按同一比例抽取樣本單位不等比例分層抽樣按各組標(biāo)志變異程度大小來確

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論