統(tǒng)計(jì)學(xué)基礎(chǔ)第八章_第1頁
統(tǒng)計(jì)學(xué)基礎(chǔ)第八章_第2頁
統(tǒng)計(jì)學(xué)基礎(chǔ)第八章_第3頁
統(tǒng)計(jì)學(xué)基礎(chǔ)第八章_第4頁
統(tǒng)計(jì)學(xué)基礎(chǔ)第八章_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第八章參數(shù)估計(jì)第一節(jié)參數(shù)估計(jì)的一般問題第二節(jié)單總體參數(shù)的區(qū)間估計(jì)第三節(jié)樣本容量的確定本章內(nèi)容第一節(jié)參數(shù)估計(jì)的一般問題參數(shù)估計(jì)在統(tǒng)計(jì)方法中的地位參數(shù)估計(jì)假設(shè)檢驗(yàn)統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)

一、抽樣推斷(一)抽樣推斷的概念:按照隨機(jī)性原則,從研究對象中抽取一部分進(jìn)行觀察,并根據(jù)所得到的觀察數(shù)據(jù),對研究對象的數(shù)量特征做出具有一定可靠程度的估計(jì)和推斷,以達(dá)到認(rèn)識總體的一種統(tǒng)計(jì)方法。

(二)抽樣推斷的特點(diǎn):

1.樣本資料對總體的數(shù)量特征作出具有一定可靠性。

2.按照隨機(jī)性原則從全部總體中抽取樣本單位。

3.抽樣推斷必然會產(chǎn)生抽樣誤差。

二、參數(shù)估計(jì)的一般問題(一)參數(shù)估計(jì)(parameterestimation)就是用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)。估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量如樣本均值、樣本比率、樣本方差等樣本均值就是總體均值的一個估計(jì)量參數(shù)用表示,估計(jì)量用表示估計(jì)值:估計(jì)參數(shù)時計(jì)算出來的統(tǒng)計(jì)量的具體值如果樣本均值

x=5600,則5600就是總體均值的估計(jì)值

表8-2樣本統(tǒng)計(jì)量和總體參數(shù)符號對應(yīng)關(guān)系

(二)點(diǎn)估計(jì)與區(qū)間估計(jì)

1.點(diǎn)估計(jì)根據(jù)樣本統(tǒng)計(jì)量直接估計(jì)出總體參數(shù)θ的值,稱為參數(shù)的點(diǎn)估計(jì)。常用的方法有兩種:矩估計(jì)法和極大似然估計(jì)法。

2.區(qū)間估計(jì)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個范圍。圖8-1給出了區(qū)間估計(jì)的示意圖:

圖8-1區(qū)間估計(jì)的圖示

3.在區(qū)間估計(jì)中,由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間,稱為置信區(qū)間,其中區(qū)間的最小值稱為置信下限,最大值稱為置信上限。

4.置信水平:如果將構(gòu)造置信區(qū)間的步驟重復(fù)多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比率。

5.比較常用的置信水平及正態(tài)分布曲線下的右側(cè)面積為時的值(即臨界值Zα/2)。表8-3常用置信水平的值

圖8-3重復(fù)構(gòu)造出置信水平95%,的20個置信區(qū)間

點(diǎn)估計(jì)值三、評估估計(jì)量的標(biāo)準(zhǔn)

無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。P(

)BA無偏有偏圖8-4有偏和無偏估計(jì)量的例子

一致性:隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)。AB較小的樣本容量較大的樣本容量P(

)圖8-5兩個不同容量樣本統(tǒng)計(jì)量的抽樣分布

有效性:對同一總體參數(shù)的兩個無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效。AB

的抽樣分布

的抽樣分布P(

)圖8-6兩個無偏點(diǎn)估計(jì)量的抽樣分布第二節(jié)單總體參數(shù)的區(qū)間估計(jì)一、總體均值的區(qū)間估計(jì)(一)大樣本的估計(jì)方法

1.樣本均值經(jīng)過標(biāo)準(zhǔn)化以后的隨機(jī)變量則服從正態(tài)分布,

2.總體均值

所在(1-α)置信水平下的置信區(qū)間為:

稱為置信下限,

稱為置信上限。

例1:一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進(jìn)行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進(jìn)行抽檢,以分析每袋重量是否符合要求?,F(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如表8-3所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標(biāo)準(zhǔn)差為10g。試估計(jì)該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%。表8-325袋食品的重量

單位:g即該批食品平均重量95%的置信區(qū)間為101.44~109.28g。利用Excel來計(jì)算置信區(qū)間

1.將樣本數(shù)據(jù)輸入Excel工作表中A1︰E5

2.計(jì)算樣本均值。點(diǎn)擊粘貼函數(shù)“fx”,選擇“統(tǒng)計(jì)”下的“AVERAGE”函數(shù)。在出現(xiàn)的“函數(shù)參數(shù)”對話框中,“Number1”一欄填入樣本數(shù)據(jù)所在區(qū)域A1︰E5,然后“確定”,在輸出區(qū)域內(nèi)(本例放置在F1)得結(jié)果105.36,此即樣本均值。

3.計(jì)算樣本標(biāo)準(zhǔn)差,選擇的函數(shù)為“統(tǒng)計(jì)”下的“STDEV”函數(shù)。本例放在G1,得結(jié)果9.6545。

4.計(jì)算允許誤差。選擇“統(tǒng)計(jì)”下的“CONFIDENCE”函數(shù),在出現(xiàn)的“函數(shù)參數(shù)”對話框中,“Alpha”一欄填入顯著性水平“0.05”,“Standard_dev”一欄填入總體標(biāo)準(zhǔn)差“G1”(大樣本情況下,可用樣本標(biāo)準(zhǔn)差代替),“Size”一欄填入樣本容量“25”,然后“確定”,在輸出區(qū)域內(nèi)得允許誤差“3.784490”(取近似值3.78)。

5.置信下限為105.36-3.78=101.58,置信上限為105.36+3.78=109.14,即置信區(qū)間為(101.58,109.14)g。

(二)小樣本的估計(jì)方法總體方差σ2未知,而且是在小樣本的情況下,則需要用樣本方差S2代替σ2,這時樣本均值經(jīng)過標(biāo)準(zhǔn)化以后的隨機(jī)變量則服從自由度為(n-1)的t分布,即:t分布是類似正態(tài)分布的一種對稱分布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布,如圖8-7和圖8-8所示:

圖8-7t分布與標(biāo)準(zhǔn)正態(tài)分布的比較圖8-8不同自由度的t分布

總體均值

在1-

置信水平下的置信區(qū)間為:式中:tα/2是自由度為n-1時,t分布中上側(cè)面積為α/2時的臨界值,該值可通過t分布表查得。利用Excel中的TINV統(tǒng)計(jì)函數(shù)計(jì)算t分布臨界值t分布臨界值可通過Excel中的TINV統(tǒng)計(jì)函數(shù)來計(jì)算。點(diǎn)擊粘貼函數(shù)“fx”,選擇“統(tǒng)計(jì)”下的“TINV”函數(shù)。在對話框中,“Probability”一欄填入顯著性水平(本例為0.05),“Deg_freedom”填入自由度(本例為15),然后“確定”。得結(jié)果“2.13145”,此即t分布的臨界值。例2:已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機(jī)抽取16只,測得其使用壽命如表8-5所示。建立該批燈泡平均使用壽命95%的置信區(qū)間。表8-516只燈泡使用壽命數(shù)據(jù)單位:h解:根據(jù)樣本數(shù)據(jù),計(jì)算樣本均值=1490h,樣本方差S=24.77h根據(jù)α=0.05查t分布表得(n-1)=t0.025(15)=2.131于是,平均使用壽命的置信區(qū)間為:即全部燈泡的平均使用壽命,在置信水平1-α=0.95下的置信區(qū)間為(1476.8,1503.2)h??偨Y(jié):表8-6總體均值的區(qū)間估計(jì)二、總體比例的區(qū)間估計(jì)1.樣本比例經(jīng)標(biāo)準(zhǔn)化后的隨機(jī)變量則服從正態(tài)分布,即:2.總體比例

在1-

置信水平下的置信區(qū)間為:

式中,1-α稱為置信水平;是標(biāo)準(zhǔn)正態(tài)分布上側(cè)面積為α/2時的臨界值;是估計(jì)總體比例時的允許誤差。例3:為了解某城市家庭電腦的普及情況,隨機(jī)抽取了100戶家庭,其中有60戶有電腦。試以95%的置信水平估計(jì)該城市家庭中擁有電腦比例的置信區(qū)間。解:已知n=100,n1=60,則樣本比例為:p=60%由于1-

=95%,查標(biāo)準(zhǔn)正態(tài)分布表可知,Zα/2=1.96。于是即該城市家庭中,擁有電腦的比例在置信水平95%下的置信區(qū)間為:(50.396%,69.604%)。

三、總體方差的區(qū)間估計(jì)總體方差在(1-α)置信水平下的置信區(qū)間為:例4:一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,現(xiàn)從某天生產(chǎn)的一批食品中隨機(jī)抽取了25袋,測得每袋重量如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布。以95%的置信水平建立該種食品重量方差的置信區(qū)間。表8-725袋食品重量解:根據(jù)樣本數(shù)據(jù)計(jì)算樣本方差:S2=93.21;已知n=25,1-

=95%,查χ2分布表可得臨界值為:

總體方差

2置信水平為95%的置信區(qū)間為:

即:總體方差的置信區(qū)間為(56.83,180.39)。相應(yīng)地,企業(yè)生產(chǎn)的食品總體重量標(biāo)準(zhǔn)差的的置信區(qū)間為7.54g~13.43g。第三節(jié)樣本容量的確定一、估計(jì)總體均值時樣本容量的確定

一旦確定了置信水平(1-α),Zα/2的值就確定了,對于給定的的值和總體標(biāo)準(zhǔn)差σ,就可以確定任一希望的允許誤差所需要的樣本容量。令E代表所希望達(dá)到的允許誤差,即:由此可以推到出確定樣本容量的公式如下:例5:擁有MBA學(xué)位的研究生年薪的標(biāo)準(zhǔn)差大約為4000元,假定想要估計(jì)年薪95%的置信區(qū)間,希望允許誤差為10000元,應(yīng)抽取多大的樣本容量?解:已知

=4000,E=1000,1-

=95%,Zα/2=1.96,所以,應(yīng)抽取的樣本容量為:即應(yīng)抽取62人作為樣本。二、估計(jì)總體比例時樣本容量的確定

一旦確定了置信水平(1-α),Zα/2的值就確定了。由于總體比例的值是固定的,所以允許誤差由樣本容量來確定,樣本容量越大允許誤差就越小。估計(jì)的精度就越好。因此,對于給定的的值,就可以確定任一希望的允許誤差所需要的樣本容量。令E代表所希望達(dá)到的允許誤差,即:

由此可以推導(dǎo)出重復(fù)抽樣和無限總體抽樣條件確定樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論