




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第五章第五章 參數(shù)估計(jì)參數(shù)估計(jì)第一節(jié)第一節(jié) 參數(shù)估計(jì)基本方法參數(shù)估計(jì)基本方法第二節(jié)第二節(jié) 總體均值和總體比例的區(qū)間估計(jì)總體均值和總體比例的區(qū)間估計(jì)第一節(jié)參數(shù)估計(jì)的基本方法第一節(jié)參數(shù)估計(jì)的基本方法v推斷統(tǒng)計(jì)就是根據(jù)抽樣分布的原理進(jìn)行的。推斷統(tǒng)計(jì)就是根據(jù)抽樣分布的原理進(jìn)行的。v推斷統(tǒng)計(jì)分為兩大類:推斷統(tǒng)計(jì)分為兩大類:v參數(shù)估計(jì):參數(shù)估計(jì):根據(jù)一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來估計(jì)總體根據(jù)一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來估計(jì)總體之參數(shù)值是多少。先看樣本情況,再推總體情況。之參數(shù)值是多少。先看樣本情況,再推總體情況。v假設(shè)檢驗(yàn):假設(shè)檢驗(yàn):首先假設(shè)總體的情況是怎樣的,然后以首先假設(shè)總體的情況是怎樣的,然后以一個(gè)隨機(jī)樣本的統(tǒng)計(jì)
2、值來檢驗(yàn)這個(gè)假設(shè)是否正確一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來檢驗(yàn)這個(gè)假設(shè)是否正確。第一節(jié)參數(shù)估計(jì)的基本方法第一節(jié)參數(shù)估計(jì)的基本方法v只要采用隨機(jī)抽樣法,就可根據(jù)抽樣分布,以樣本只要采用隨機(jī)抽樣法,就可根據(jù)抽樣分布,以樣本統(tǒng)計(jì)值來推測(cè)總體情況。統(tǒng)計(jì)值來推測(cè)總體情況。即根據(jù)一個(gè)隨機(jī)樣本的統(tǒng)即根據(jù)一個(gè)隨機(jī)樣本的統(tǒng)計(jì)值來估計(jì)總體參數(shù)是多少。計(jì)值來估計(jì)總體參數(shù)是多少。 參數(shù)估計(jì)方法:參數(shù)估計(jì)方法:1.1.點(diǎn)估計(jì):以一個(gè)最適當(dāng)?shù)臉颖窘y(tǒng)計(jì)值來代表總體點(diǎn)估計(jì):以一個(gè)最適當(dāng)?shù)臉颖窘y(tǒng)計(jì)值來代表總體的參數(shù)值;的參數(shù)值;2.2.區(qū)間估計(jì):以一個(gè)區(qū)間去估計(jì)總體參數(shù)值區(qū)間估計(jì):以一個(gè)區(qū)間去估計(jì)總體參數(shù)值;一、點(diǎn)估計(jì)一、點(diǎn)估計(jì)從總體中抽
3、取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對(duì)總體的未從總體中抽取一個(gè)樣本,根據(jù)該樣本的統(tǒng)計(jì)量對(duì)總體的未知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì),用于估計(jì)總體某一參數(shù)的知參數(shù)作出一個(gè)數(shù)值點(diǎn)的估計(jì),用于估計(jì)總體某一參數(shù)的隨機(jī)變量;隨機(jī)變量;例如例如: : 用樣本均值作為總體未知均值的估計(jì)值就是一用樣本均值作為總體未知均值的估計(jì)值就是一 個(gè)個(gè)點(diǎn)估計(jì)。點(diǎn)估計(jì)。樣本越大,抽樣方法越嚴(yán)謹(jǐn),點(diǎn)估計(jì)越可信樣本越大,抽樣方法越嚴(yán)謹(jǐn),點(diǎn)估計(jì)越可信。點(diǎn)估計(jì)的缺陷點(diǎn)估計(jì)的缺陷 抽樣誤差總是難免的。抽樣誤差總是難免的。 點(diǎn)估計(jì)沒給出估計(jì)值接近總體未知點(diǎn)估計(jì)沒給出估計(jì)值接近總體未知參數(shù)程度的信息,即估計(jì)的可信程度很參數(shù)程度的信息,即估計(jì)的可信程度
4、很難確定。難確定。二、區(qū)間估計(jì)二、區(qū)間估計(jì)1.1.根據(jù)一個(gè)樣本的觀察值給出總體參數(shù)的估計(jì)范圍根據(jù)一個(gè)樣本的觀察值給出總體參數(shù)的估計(jì)范圍2.2.給出總體參數(shù)落在這一區(qū)間的概率給出總體參數(shù)落在這一區(qū)間的概率3.3.例如例如: : 總體均值落在總體均值落在50705070之間,可信度為之間,可信度為 95%95%1.1.總體未知參數(shù)落在某區(qū)間內(nèi)的概率總體未知參數(shù)落在某區(qū)間內(nèi)的概率2.2.表示為表示為 (1 - 100100為為顯著性水平顯著性水平,是總體參數(shù),是總體參數(shù)未在未在區(qū)間內(nèi)的概率區(qū)間內(nèi)的概率3.3.常用的可信度值有常用的可信度值有 99%, 95%99%, 95%;相應(yīng);相應(yīng)的的 為為0.
5、010.01,0.050.05??尚哦龋ㄖ眯潘剑┛尚哦龋ㄖ眯潘剑?正態(tài)分布落在總體均值某一區(qū)間正態(tài)分布落在總體均值某一區(qū)間內(nèi)的樣本內(nèi)的樣本XX總體均值的間距估計(jì)總體均值的間距估計(jì)假定條件假定條件總體服從正態(tài)分布總體服從正態(tài)分布, ,且總體方差(且總體方差( )已知已知如果不是正態(tài)分布,可以由正態(tài)分布來近似如果不是正態(tài)分布,可以由正態(tài)分布來近似 ( (n n 30)30)均值的間距估計(jì)均值的間距估計(jì)v可用下面公式計(jì)算可用下面公式計(jì)算可信間距可信間距:v當(dāng)可信度為當(dāng)可信度為9999時(shí),時(shí),Z Z取取2.582.58v間距的大小與可信度成正比間距的大小與可信度成正比v不難理解:在估計(jì)時(shí)所用不難理
6、解:在估計(jì)時(shí)所用 的間距如果很小,錯(cuò)誤的間距如果很小,錯(cuò)誤的機(jī)會(huì)當(dāng)然較大,可信度自然較低。的機(jī)會(huì)當(dāng)然較大,可信度自然較低。v應(yīng)用間距估計(jì)法時(shí),可以選用任意的可應(yīng)用間距估計(jì)法時(shí),可以選用任意的可信度,但一般用信度,但一般用9595或或9999??傮w均值的間距估計(jì)總體均值的間距估計(jì)某行業(yè)職工日工資收入服從正態(tài)分布,從該行業(yè)職工中隨機(jī)抽某行業(yè)職工日工資收入服從正態(tài)分布,從該行業(yè)職工中隨機(jī)抽取人,測(cè)得其平均日工資收入為取人,測(cè)得其平均日工資收入為21.4 21.4 元。已知總體標(biāo)準(zhǔn)元。已知總體標(biāo)準(zhǔn)差差 =0.15=0.15元,試估計(jì)建立該行業(yè)職工日均收入的置信區(qū)間元,試估計(jì)建立該行業(yè)職工日均收入的置信
7、區(qū)間,給定置信水平為,給定置信水平為0.950.95。v均值抽樣分布的標(biāo)準(zhǔn)差,稱為均值的標(biāo)準(zhǔn)誤:計(jì)算均值抽樣分布的標(biāo)準(zhǔn)差,稱為均值的標(biāo)準(zhǔn)誤:計(jì)算方法是用總體的標(biāo)準(zhǔn)差除以樣本大小方法是用總體的標(biāo)準(zhǔn)差除以樣本大小(n)(n)的的平方的的平方根。根。v然而,總體的標(biāo)準(zhǔn)差很難知道,如果樣本相當(dāng)大,然而,總體的標(biāo)準(zhǔn)差很難知道,如果樣本相當(dāng)大,通常以樣本的標(biāo)準(zhǔn)差通常以樣本的標(biāo)準(zhǔn)差 S S 作為總體的標(biāo)準(zhǔn)差作為總體的標(biāo)準(zhǔn)差。但。但是,這種做法有將實(shí)際的標(biāo)準(zhǔn)誤估計(jì)得稍偏。因?yàn)槭?,這種做法有將實(shí)際的標(biāo)準(zhǔn)誤估計(jì)得稍偏。因?yàn)闃颖緲?biāo)準(zhǔn)差傾向稍小于總體標(biāo)準(zhǔn)差。為彌補(bǔ)這個(gè)差樣本標(biāo)準(zhǔn)差傾向稍小于總體標(biāo)準(zhǔn)差。為彌補(bǔ)這個(gè)差異,
8、在計(jì)算樣本標(biāo)準(zhǔn)差時(shí),除以異,在計(jì)算樣本標(biāo)準(zhǔn)差時(shí),除以n-1n-1而不是而不是n n。這樣。這樣就可以得到總體方差和標(biāo)準(zhǔn)差的無偏估計(jì)。就可以得到總體方差和標(biāo)準(zhǔn)差的無偏估計(jì)。v此處的此處的“n-1”稱為稱為“自由度自由度”。 第一,自由度的產(chǎn)生是與抽樣分布聯(lián)系在一起的第一,自由度的產(chǎn)生是與抽樣分布聯(lián)系在一起的。因?yàn)閺目傮w中抽取樣本,因而我們需要計(jì)算樣。因?yàn)閺目傮w中抽取樣本,因而我們需要計(jì)算樣本的本的“統(tǒng)計(jì)量統(tǒng)計(jì)量”,“統(tǒng)計(jì)量統(tǒng)計(jì)量”是研究者通過調(diào)查是研究者通過調(diào)查樣本數(shù)據(jù)人為地計(jì)算出來的,而樣本數(shù)據(jù)人為地計(jì)算出來的,而“參數(shù)參數(shù)”是被調(diào)是被調(diào)查者的總體所客觀存在的,這是兩者的區(qū)別。在查者的總體所客
9、觀存在的,這是兩者的區(qū)別。在統(tǒng)計(jì)學(xué)的理論層面上,要求統(tǒng)計(jì)量是參數(shù)的無偏統(tǒng)計(jì)學(xué)的理論層面上,要求統(tǒng)計(jì)量是參數(shù)的無偏估計(jì),認(rèn)為兩者是相等的。在實(shí)際研究中,由于估計(jì),認(rèn)為兩者是相等的。在實(shí)際研究中,由于抽樣的誤差可能導(dǎo)致兩者的不相等,但對(duì)于這種抽樣的誤差可能導(dǎo)致兩者的不相等,但對(duì)于這種情況,研究者是無法知道的,否則就沒有抽樣的情況,研究者是無法知道的,否則就沒有抽樣的必要了。在理論假設(shè)下,統(tǒng)計(jì)量和參數(shù)一樣被看必要了。在理論假設(shè)下,統(tǒng)計(jì)量和參數(shù)一樣被看作是客觀的、確定性的。作是客觀的、確定性的。 第二,既然在理論上統(tǒng)計(jì)量被要求是確定的第二,既然在理論上統(tǒng)計(jì)量被要求是確定的,那么在實(shí)際層面上計(jì)算統(tǒng)計(jì)量的
10、那組數(shù),那么在實(shí)際層面上計(jì)算統(tǒng)計(jì)量的那組數(shù)據(jù)就不是完全自由的。這一點(diǎn)很重要,因據(jù)就不是完全自由的。這一點(diǎn)很重要,因?yàn)闉椤白杂啥茸杂啥取敝兄小白杂勺杂伞钡暮x就是相對(duì)的含義就是相對(duì)這個(gè)這個(gè)“確定確定”而言的。正是統(tǒng)計(jì)量的這個(gè)而言的。正是統(tǒng)計(jì)量的這個(gè)“確定性確定性”限制了與之相關(guān)的一組數(shù)據(jù)的限制了與之相關(guān)的一組數(shù)據(jù)的“自由度自由度”,也就是說,一組數(shù)據(jù)不是可,也就是說,一組數(shù)據(jù)不是可以完全自由取值的,它必須支持以完全自由取值的,它必須支持“統(tǒng)計(jì)量統(tǒng)計(jì)量與總體參數(shù)相等與總體參數(shù)相等”的理論假設(shè)。這就是的理論假設(shè)。這就是“自由度自由度”存在的理由。存在的理由。 研究者對(duì)某一社區(qū)內(nèi)居民家庭的收入狀況進(jìn)行
11、調(diào)研究者對(duì)某一社區(qū)內(nèi)居民家庭的收入狀況進(jìn)行調(diào)查,該社區(qū)共有查,該社區(qū)共有10001000戶,采取隨機(jī)抽取的方式戶,采取隨機(jī)抽取的方式對(duì)對(duì)100100戶進(jìn)行了調(diào)查。在這個(gè)例子中,總體戶進(jìn)行了調(diào)查。在這個(gè)例子中,總體10001000戶的收入的平均數(shù)是總體參數(shù),是客觀的戶的收入的平均數(shù)是總體參數(shù),是客觀的、確定的,盡管研究者不知道。通過隨機(jī)抽樣、確定的,盡管研究者不知道。通過隨機(jī)抽樣和入戶問卷調(diào)查,研究者獲得了和入戶問卷調(diào)查,研究者獲得了100100戶的收入戶的收入數(shù)據(jù)。運(yùn)用這組數(shù)據(jù)可以算出樣本的平均數(shù),數(shù)據(jù)。運(yùn)用這組數(shù)據(jù)可以算出樣本的平均數(shù),它是統(tǒng)計(jì)量。由于在理論上要求統(tǒng)計(jì)量與參數(shù)它是統(tǒng)計(jì)量。由于
12、在理論上要求統(tǒng)計(jì)量與參數(shù)相等。當(dāng)相等。當(dāng)9999個(gè)數(shù)據(jù)被選擇以后,第個(gè)數(shù)據(jù)被選擇以后,第100100個(gè)數(shù)據(jù)個(gè)數(shù)據(jù)就是確定的,所以,這組數(shù)據(jù)在求平均數(shù)這統(tǒng)就是確定的,所以,這組數(shù)據(jù)在求平均數(shù)這統(tǒng)計(jì)量時(shí)的自由度就是計(jì)量時(shí)的自由度就是:k=100-1=99:k=100-1=99。t t分布分布v以均值標(biāo)準(zhǔn)誤的估計(jì)以均值標(biāo)準(zhǔn)誤的估計(jì) 作為分母計(jì)算的值作為分母計(jì)算的值,不完全符合,不完全符合Z Z分布或者說標(biāo)準(zhǔn)正態(tài)分布,我分布或者說標(biāo)準(zhǔn)正態(tài)分布,我們給這個(gè)分布起個(gè)名字,叫做們給這個(gè)分布起個(gè)名字,叫做t t分布。分布。vt t值符合值符合t t分布。分布。n-1n-1被稱作自由度,自由度不被稱作自由度,自
13、由度不同同t t分布的形狀有差異。隨著樣本規(guī)模增大,分布的形狀有差異。隨著樣本規(guī)模增大,也就是自由度的增大,也就是自由度的增大,t t分布會(huì)變得更加近似分布會(huì)變得更加近似于標(biāo)準(zhǔn)正態(tài)分布。于標(biāo)準(zhǔn)正態(tài)分布??傮w均值的間距估計(jì)總體均值的間距估計(jì)v例題:例題:v我們欲了解某地區(qū)家庭用于請(qǐng)客送禮的每月我們欲了解某地區(qū)家庭用于請(qǐng)客送禮的每月平均支出(平均支出( )情況)情況, ,現(xiàn)從該地區(qū)抽取一個(gè)現(xiàn)從該地區(qū)抽取一個(gè)樣本是:樣本是:n n226226戶,戶, 4343元,元,S S10.510.5。則可信度為則可信度為9595的間距估計(jì)值為?的間距估計(jì)值為?v 41.63 M44.3741.63 M44.3
14、7v當(dāng)可信度為當(dāng)可信度為9999時(shí)的間距估計(jì)值是多少?時(shí)的間距估計(jì)值是多少?影響可信間距寬度的因素:影響可信間距寬度的因素:數(shù)據(jù)的離散程度,用數(shù)據(jù)的離散程度,用 來測(cè)度來測(cè)度;樣本容量樣本容量n n;置信水平置信水平 (1 - ) ,影響影響 Z Z 的取值。的取值。算例算例1 1v某大學(xué)從該校學(xué)生中隨機(jī)抽取某大學(xué)從該校學(xué)生中隨機(jī)抽取100100人,調(diào)查到人,調(diào)查到他們平均每天參加體育鍛煉的時(shí)間為他們平均每天參加體育鍛煉的時(shí)間為2626分鐘。分鐘。試以試以9595的置信水平估計(jì)該大學(xué)全體學(xué)生平的置信水平估計(jì)該大學(xué)全體學(xué)生平均每天參加體育鍛煉的時(shí)間(已知總體方差均每天參加體育鍛煉的時(shí)間(已知總體
15、方差為為3636分鐘)分鐘)算例算例2 2從一個(gè)正態(tài)總體中抽取一個(gè)隨機(jī)樣本,從一個(gè)正態(tài)總體中抽取一個(gè)隨機(jī)樣本, n n = 25 = 25 ,其均值,其均值 x = 50 ,標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 s s = 8 = 8。 建立總體均值建立總體均值m m 的的95%95%的置信區(qū)間。的置信區(qū)間。我們可以我們可以9595的概率保證總體均值在的概率保證總體均值在46.6946.6953.30 53.30 之間之間四、總體比例的間距估計(jì)四、總體比例的間距估計(jì)v我們要估計(jì)某城鎮(zhèn)有多少家庭是不和睦的?,F(xiàn)我們要估計(jì)某城鎮(zhèn)有多少家庭是不和睦的?,F(xiàn)一個(gè)隨機(jī)樣本(一個(gè)隨機(jī)樣本(n n100100)中知道有)中知道有20.
16、0%20.0%的家庭的家庭不和,請(qǐng)估計(jì)該城鎮(zhèn)總體家庭不和睦情況。要不和,請(qǐng)估計(jì)該城鎮(zhèn)總體家庭不和睦情況。要求置信度是求置信度是9595。v估計(jì)總體的比例或百分率,其邏輯基本上估計(jì)總體的比例或百分率,其邏輯基本上與估計(jì)均值的相同。如果樣本頗大,百分與估計(jì)均值的相同。如果樣本頗大,百分率(或比例)的抽樣分布會(huì)近似正態(tài)分布率(或比例)的抽樣分布會(huì)近似正態(tài)分布,各個(gè)樣本的百分率都對(duì)稱地散布于總體,各個(gè)樣本的百分率都對(duì)稱地散布于總體百分率的兩旁。其標(biāo)準(zhǔn)誤差是:百分率的兩旁。其標(biāo)準(zhǔn)誤差是:v其中其中P是總體的比例(即百分率)。由于是總體的比例(即百分率)。由于難以知道難以知道P的數(shù)值,的數(shù)值,樣本相當(dāng)大時(shí)
17、,樣本樣本相當(dāng)大時(shí),樣本中的比例中的比例 可以代替總體中的比例可以代替總體中的比例 P P。v總體比例區(qū)間估計(jì)總體比例區(qū)間估計(jì):總體比例的間距估計(jì)總體比例的間距估計(jì)v我們要估計(jì)某城鎮(zhèn)有多少家庭是不和睦的。我們要估計(jì)某城鎮(zhèn)有多少家庭是不和睦的?,F(xiàn)一個(gè)隨機(jī)樣本(現(xiàn)一個(gè)隨機(jī)樣本(n n100100)中知道有)中知道有20.0%20.0%的家庭不和,請(qǐng)估計(jì)該城鎮(zhèn)總體家的家庭不和,請(qǐng)估計(jì)該城鎮(zhèn)總體家庭不和睦情況。要求置信度是庭不和睦情況。要求置信度是9595。v0.122P 0.278總體比例的間距估計(jì)總體比例的間距估計(jì)v上面的方法,是在上面的方法,是在SpSp公式中以樣本公式中以樣本 值代替值代替總體
18、總體 P P 值。如果樣本相當(dāng)大,這個(gè)方法是可值。如果樣本相當(dāng)大,這個(gè)方法是可以的。另一個(gè)較為保守的做法,是以以的。另一個(gè)較為保守的做法,是以P P0.500.50代入代入SESE公式,使公式,使SESE達(dá)到最大值,再將達(dá)到最大值,再將SESE值代值代入可信間距公式就獲得最大的間距,以之來入可信間距公式就獲得最大的間距,以之來估計(jì)參數(shù)值最安全。估計(jì)參數(shù)值最安全。v如上述家庭不和睦的例子:如上述家庭不和睦的例子:v 0.071P0.329算例算例3 3某企業(yè)在一項(xiàng)關(guān)于職工流動(dòng)原因的研究中,從該某企業(yè)在一項(xiàng)關(guān)于職工流動(dòng)原因的研究中,從該企業(yè)前職工的總體中隨機(jī)選取了企業(yè)前職工的總體中隨機(jī)選取了200
19、200人組成一人組成一個(gè)樣本。在對(duì)其進(jìn)行訪問時(shí),有個(gè)樣本。在對(duì)其進(jìn)行訪問時(shí),有140140人說他們?nèi)苏f他們離開該企業(yè)是由于同管理人員不能融洽相處。離開該企業(yè)是由于同管理人員不能融洽相處。試估計(jì)由于這種原因而離開該企業(yè)的人員的比試估計(jì)由于這種原因而離開該企業(yè)的人員的比例(例(95%95%的置信度)。的置信度)。我們可以我們可以9595的概率保證該企業(yè)職工由于同管理的概率保證該企業(yè)職工由于同管理人 員 不 能 融 洽 相 處 而 離 開 的 比 例 在人 員 不 能 融 洽 相 處 而 離 開 的 比 例 在63.6%76.4%63.6%76.4%之間之間第三節(jié)第三節(jié) 決定樣本的大小決定樣本的大小
20、v樣本越大越好樣本越大越好v在能夠付出的研究代價(jià)的限度內(nèi),選取最大在能夠付出的研究代價(jià)的限度內(nèi),選取最大的樣本。的樣本。v除此之外的兩個(gè)標(biāo)準(zhǔn):除此之外的兩個(gè)標(biāo)準(zhǔn):v1 1、我們?cè)敢馊萑潭嗌馘e(cuò)誤、我們?cè)敢馊萑潭嗌馘e(cuò)誤v2 2、所研究的個(gè)案之間的相互差異有多大、所研究的個(gè)案之間的相互差異有多大均值間距估計(jì)樣本大小的決定均值間距估計(jì)樣本大小的決定v某變量某變量X X總體均值為總體均值為 ,一個(gè)隨機(jī)抽取樣本,一個(gè)隨機(jī)抽取樣本的均值為的均值為v抽樣均值與總體均值的差就是錯(cuò)誤抽樣均值與總體均值的差就是錯(cuò)誤e e,如果用,如果用絕對(duì)值表示如下:絕對(duì)值表示如下:ve=| - |e=| - |均值間距估計(jì)樣本大
21、小的決定均值間距估計(jì)樣本大小的決定v假定我們知道總體的標(biāo)準(zhǔn)差假定我們知道總體的標(biāo)準(zhǔn)差的數(shù)值,則在估計(jì)總的數(shù)值,則在估計(jì)總體的均值時(shí),體的均值時(shí),9595的可信度間距為:的可信度間距為: 均值間距估計(jì)樣本大小的決定均值間距估計(jì)樣本大小的決定v在上述公式中,容忍錯(cuò)誤的大小可以隨研究的需在上述公式中,容忍錯(cuò)誤的大小可以隨研究的需要來決定,但標(biāo)準(zhǔn)差要來決定,但標(biāo)準(zhǔn)差的值卻難以確定,原則上的值卻難以確定,原則上用總體的標(biāo)準(zhǔn)差,如果不知道,只有參考前人的用總體的標(biāo)準(zhǔn)差,如果不知道,只有參考前人的研究或自己進(jìn)行試點(diǎn)研究,依據(jù)這些研究計(jì)算出研究或自己進(jìn)行試點(diǎn)研究,依據(jù)這些研究計(jì)算出來的標(biāo)準(zhǔn)差數(shù)值,盡可能猜想總
22、體的標(biāo)準(zhǔn)差是多來的標(biāo)準(zhǔn)差數(shù)值,盡可能猜想總體的標(biāo)準(zhǔn)差是多少。少。v這項(xiàng)猜想工作不容易,準(zhǔn)確性也有疑問。所以社這項(xiàng)猜想工作不容易,準(zhǔn)確性也有疑問。所以社會(huì)學(xué)研究多不用此公式來決定樣本的大小,但以會(huì)學(xué)研究多不用此公式來決定樣本的大小,但以之作參考只用是可以的。之作參考只用是可以的。算例算例4 4v我們想調(diào)查某地區(qū)工人的平均工資,根據(jù)前人我們想調(diào)查某地區(qū)工人的平均工資,根據(jù)前人研究,該地區(qū)工人工資變量的標(biāo)準(zhǔn)差大約是研究,該地區(qū)工人工資變量的標(biāo)準(zhǔn)差大約是1515元,我們希望樣本均值與總體均值的差距最好元,我們希望樣本均值與總體均值的差距最好不要多過不要多過3 3元。應(yīng)該抽取多少名工人來研究?元。應(yīng)該抽
23、取多少名工人來研究?v如果置信度為如果置信度為95%95%vn=(1.96/e)2 =(1.96153)2 96v如果可信度為如果可信度為99,則則vn= (2.58/e)2 166比例間距估計(jì)樣本大小的決定比例間距估計(jì)樣本大小的決定v原理與均值間距估計(jì)樣本大小的決定一樣。原理與均值間距估計(jì)樣本大小的決定一樣。v例:研究某地區(qū)工人有多少是滿意目前的工例:研究某地區(qū)工人有多少是滿意目前的工作環(huán)境的,根據(jù)前人研究大概有作環(huán)境的,根據(jù)前人研究大概有6060的工人的工人滿意目前的工作環(huán)境,要求本研究的可信度滿意目前的工作環(huán)境,要求本研究的可信度為為9595,而且樣本比例與總體比例的差異不,而且樣本比例
24、與總體比例的差異不大于大于5 5,要抽取多少名工人來研究?,要抽取多少名工人來研究?ve= 1.96(SE)v2 P(1-P)v計(jì)算結(jié)果,當(dāng)可信度為計(jì)算結(jié)果,當(dāng)可信度為95時(shí),時(shí),vn=(1.96)2 (0.60)(1-0.60)/(0.05)2 369v當(dāng)可信度為當(dāng)可信度為99時(shí),時(shí),vn=(2.58)2 (0.60)(1-0.60)/(0.05)2=639v可見,要求的可信度越高,樣本要越大??梢?,要求的可信度越高,樣本要越大。v上面的公式要求我們推測(cè)總體上面的公式要求我們推測(cè)總體P P值。如果有困值。如果有困難,可改用比較保守的方法,就是上一節(jié)所難,可改用比較保守的方法,就是上一節(jié)所講的
25、,以講的,以P P0.500.50代入公式中,得到一個(gè)更大代入公式中,得到一個(gè)更大的樣本。的樣本。v如上面例題,如上面例題,9595的可信度:的可信度:vn=(1.96)2 (0.50)(1-0.50)/(0.05)2 v =384決定樣本大小要注意的問題決定樣本大小要注意的問題v一、以統(tǒng)計(jì)公式來推斷樣本的大小,最大的一、以統(tǒng)計(jì)公式來推斷樣本的大小,最大的困難是要先推測(cè)若干總體參數(shù)值,如標(biāo)準(zhǔn)差、困難是要先推測(cè)若干總體參數(shù)值,如標(biāo)準(zhǔn)差、比例等。倘若我們的推測(cè)犯錯(cuò)誤,決定的樣比例等。倘若我們的推測(cè)犯錯(cuò)誤,決定的樣本大小就有問題。較為適當(dāng)?shù)淖龇ㄊ牵环奖敬笮【陀袉栴}。較為適當(dāng)?shù)淖龇ㄊ牵环矫鎱⒖冀y(tǒng)計(jì)
26、公式算得的結(jié)果,另一方面看能面參考統(tǒng)計(jì)公式算得的結(jié)果,另一方面看能夠付得起多少研究代價(jià),然后決定樣本的大夠付得起多少研究代價(jià),然后決定樣本的大小。例如根據(jù)公式推測(cè)小。例如根據(jù)公式推測(cè)n n369369,如果研究經(jīng),如果研究經(jīng)費(fèi)許可,可以決定樣本的大小為費(fèi)許可,可以決定樣本的大小為400400,甚至,甚至500500。決策時(shí),寧多勿少。決策時(shí),寧多勿少。決定樣本大小要注意的問題決定樣本大小要注意的問題v二、每一項(xiàng)調(diào)查研究都包括多個(gè)變量,我們二、每一項(xiàng)調(diào)查研究都包括多個(gè)變量,我們應(yīng)該根據(jù)哪一個(gè)變量來計(jì)算樣本的大小呢?應(yīng)該根據(jù)哪一個(gè)變量來計(jì)算樣本的大小呢?同樣是前述工人的例子,如果根據(jù)工資變量,同樣
27、是前述工人的例子,如果根據(jù)工資變量,n n9696,如果根據(jù)滿意工作環(huán)境變量,則,如果根據(jù)滿意工作環(huán)境變量,則n n369369。因此,大部分的社會(huì)學(xué)研究是難于應(yīng)用。因此,大部分的社會(huì)學(xué)研究是難于應(yīng)用統(tǒng)計(jì)公式的。如果一定要應(yīng)用公式來決定樣統(tǒng)計(jì)公式的。如果一定要應(yīng)用公式來決定樣本的大小,通常以樣本中最重要的變量作為本的大小,通常以樣本中最重要的變量作為準(zhǔn)則,而且只是作為參考用。準(zhǔn)則,而且只是作為參考用。決定樣本大小要注意的問題決定樣本大小要注意的問題v三、決定樣本的大小,還要考慮日后采用的三、決定樣本的大小,還要考慮日后采用的資料分析方法。如果計(jì)劃采用多變量分析法資料分析方法。如果計(jì)劃采用多變量分析法或每個(gè)變量的分類都很精細(xì),就要選用一個(gè)或每個(gè)變量的分類都很精細(xì),就要選用一個(gè)較大的樣本,才能提供足夠的分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度車輛抵押給個(gè)人質(zhì)押貸款合同:豪華轎車使用權(quán)協(xié)議
- 2025年度特種車輛拖車與吊裝作業(yè)服務(wù)合同
- 二零二五年度旅游居間協(xié)議合同服務(wù)項(xiàng)目解析
- 二零二五年度泳池安全知識(shí)培訓(xùn)免責(zé)協(xié)議
- 二零二五年度空調(diào)銷售與節(jié)能改造升級(jí)合同
- 二零二五年度餐飲管理公司員工培訓(xùn)與用工合同
- 高速公路排水溝施工合同(2025年度)包含臨時(shí)道路修復(fù)服務(wù)
- 2025年度銷售人員商業(yè)秘密保護(hù)及保密補(bǔ)償協(xié)議
- 二零二五年度傳媒行業(yè)勞動(dòng)合同終止及競業(yè)限制協(xié)議范本
- 2025年度道路養(yǎng)護(hù)承包合同解除書
- 2025年江蘇揚(yáng)州市儀征市眾鑫建設(shè)開發(fā)有限公司招聘筆試參考題庫附帶答案詳解
- 部編高教版2023·職業(yè)模塊 中職語文 2.《寧夏閩寧鎮(zhèn):昔日干沙灘今日金沙灘》 課件
- 安全環(huán)保職業(yè)健康法律法規(guī)清單2024年
- 2023年高考語文全國乙卷《長出一地的好蕎麥》解析
- (完整PPT)半導(dǎo)體物理與器件物理課件
- 大音希聲話古韻——古琴曲《流水》課件
- 浮針療法之頸椎病的治療ppt課件
- 金蝶K3 Cloud 產(chǎn)品安裝指南
- VISIO圖標(biāo)大全(完整版)
- 醫(yī)療、預(yù)防、保健機(jī)構(gòu)醫(yī)師聘用證明表(共1頁)
- 清鈴撳針介紹
評(píng)論
0/150
提交評(píng)論