醫(yī)藥統(tǒng)計學(xué) 第六章 參數(shù)估計_第1頁
醫(yī)藥統(tǒng)計學(xué) 第六章 參數(shù)估計_第2頁
醫(yī)藥統(tǒng)計學(xué) 第六章 參數(shù)估計_第3頁
醫(yī)藥統(tǒng)計學(xué) 第六章 參數(shù)估計_第4頁
醫(yī)藥統(tǒng)計學(xué) 第六章 參數(shù)估計_第5頁
已閱讀5頁,還剩61頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第六章參數(shù)估計參數(shù)的點估計

正態(tài)總體參數(shù)的區(qū)間估計二項分布和泊松分布參數(shù)的區(qū)間估計學(xué)習(xí)目的和要求

掌握點估計和區(qū)間估計的概念和基本思想;正態(tài)總體參數(shù)的區(qū)間估計;

熟悉二項分布總體率的區(qū)間估計;了解泊松分布的區(qū)間估計等。

1、數(shù)理統(tǒng)計學(xué)的基本原理和方法:

統(tǒng)計描述:定量數(shù)據(jù)和定性數(shù)據(jù)的描述性指標(biāo)、常用統(tǒng)計圖表;

常見的理論分布及其應(yīng)用:正態(tài)分布、u、t、F、二項分布、Poisson分布等;

統(tǒng)計推斷:包括總體參數(shù)的估計(總體均數(shù)、總體率和總體平均數(shù)等的估計)、假設(shè)檢驗(t、u、χ2、秩和檢驗、方差分析等)、回歸與相關(guān)、多元線性回歸與logistic回歸;統(tǒng)計設(shè)計的原理與方法:試驗設(shè)計調(diào)查設(shè)計2、參數(shù)估計(parameterestimation):用樣本觀測值估計總體中的未知參數(shù)θ,即用樣本統(tǒng)計量來估計總體參數(shù)。估計量(estimator):用來估計總體參數(shù)的樣本統(tǒng)計量。3、參數(shù)估計方法:

點估計(pointestimation):用某統(tǒng)計量的觀測值直接作為總體未知參數(shù)θ的估計值;區(qū)間估計(intervalestimation):按一定的概率(可信度

1-α),用兩個統(tǒng)計量的觀測值來估計未知總體參數(shù)θ的

可能所在范圍(或稱可信區(qū)間)的估計方法。第一節(jié)參數(shù)的點估計1、定義:設(shè)是來自總體X的樣本,()是相應(yīng)的一組樣本觀測值,是總體的未知參數(shù),現(xiàn)構(gòu)造一個適當(dāng)?shù)慕y(tǒng)計量,用它的觀測值()直接來估計未知參數(shù),則稱為參數(shù)的估計量;稱()為參數(shù)的估計值。這種估計稱為點估計。

(估計量是一隨機(jī)變量,將估計量與估計值均稱為

的估計,簡記為:)

2、優(yōu)點:簡單易行;缺點:未考慮抽樣誤差,而抽樣誤差在抽樣研究中是客觀存在的、不可避免的,會隨不同的樣本對總體參數(shù)作出不同的點估計。同一估計量,可得不同的估計值

eg:

用隨機(jī)抽取的100名7歲健康男孩的身高值,計算的樣本均值作為浙江省2006年所有7歲健康男孩的平均身高值,即總體均值。第二節(jié)正態(tài)總體參數(shù)的區(qū)間估計一、區(qū)間估計的概念

(一)抽樣誤差(samplingerror):在實際工作中,由于總體中各觀察對象之間存在著個體變異,且隨機(jī)抽取的樣本又只是總體中的一部分,因此計算的樣本統(tǒng)計量,不一定恰好等于相應(yīng)的總體參數(shù);這種誤差也反映在樣本統(tǒng)計量之間的差異。1.概念:由于個體變異的存在,在抽樣研究中產(chǎn)生的樣本統(tǒng)計量與相應(yīng)的總體參數(shù)間的差異,以及來自同一總體的若干樣本的統(tǒng)計量之間存在的差別。

2.種類:在抽樣研究中抽樣誤差是不可避免的,根據(jù)資料的性質(zhì)和指標(biāo)種類的不同,抽樣誤差有多種。均數(shù)的抽樣誤差:樣本均數(shù)與總體均數(shù)之間的差別、樣本均數(shù)與樣本均數(shù)之間的差別,、

eg:

從某地7歲男童中隨機(jī)抽取110名,測得平均身高為119.95cm,該樣本均數(shù)不一定等于該地7歲男童身高的總體均數(shù)。

率的抽樣誤差:樣本率與總體率之間的差別,樣本率與與樣本率之間的差別,、

eg:

某縣為血吸蟲病流行區(qū),從該縣人群中隨機(jī)抽取400人,測得的血吸蟲感染人數(shù)為60人,感染率為15%,該樣本率不一定等于該地人群的總體感染率。③方差、相關(guān)系數(shù)、回歸系數(shù)的抽樣誤差等。(二)區(qū)間估計的基本思想:在一定可信度(概率/可靠程度)的前提下,估計總體的未知參數(shù)可能的所在范圍。1、雙側(cè)區(qū)間估計的定義:設(shè)θ為總體的未知參數(shù),若由樣本確定的兩個統(tǒng)計量和,且<,對于預(yù)先給定的α(),若滿足P{

<θ<

}=1-α

則稱:隨機(jī)區(qū)間(,)為θ的雙側(cè)()

的置信區(qū)間(confidenceinterval,CI)或稱可信區(qū)間,即估計量,是一統(tǒng)計量;、是由樣本構(gòu)造的函數(shù),不含有未知參數(shù);

()或100()%為置信度(confidencelevel)、可信度、置信水平;置信下限/左端點置信上限/右端點

一旦樣本有觀察值,則稱相應(yīng)的

為置信區(qū)間的觀察值。2、單側(cè)區(qū)間估計的定義:(1)若有統(tǒng)計量,使得則稱:為的單側(cè)()%置信區(qū)間;為的單側(cè)置信上限。(2)若有統(tǒng)計量,使得則稱:為的單側(cè)置信區(qū)間;為的單側(cè)置信下限。2、優(yōu)點:在隨機(jī)抽取樣本后,考慮抽樣誤差存在的情況下,估計未知總體參數(shù)θ的可能范圍,較為準(zhǔn)確可靠。3、意義:統(tǒng)計學(xué)上通常用95%(或99%)置信區(qū)間(可信區(qū)間)表示總體參數(shù)有95%(或99%)的概率在某一范圍內(nèi)。

eg:μ的95%置信區(qū)間,表示該區(qū)間包括μ的概率為95%,即μ在該范圍內(nèi)的可能性是95%,估計正確的可能性為95%,錯誤的風(fēng)險率為5%,為小概率事件,故在一次估計中,幾乎不可能發(fā)生錯誤。

即從總體中作隨機(jī)抽樣,每個樣本可以算得一個可信區(qū)間。

95%可信區(qū)間意味著:如果進(jìn)行100次抽樣,則可算得100個可信區(qū)間,其中,平均有95次估計正確,即包含總體參數(shù),而只有5次不包含總體參數(shù),即估計錯誤的只有5次。由于5%是小概率事件,實際發(fā)生的可能性很小,當(dāng)然這種估計方法會有5%犯錯誤的風(fēng)險。4、兩大要素:準(zhǔn)確度(accuracy)——反映在置信度的大小,即包含μ

的概率大小。愈接近1,愈好。精密度(precision)——反映在區(qū)間的長度,愈小愈好。

在樣本含量確定的情況下,二者是矛盾的,若只管提高置信度,會把區(qū)間變得很長,故不宜認(rèn)為99%可信區(qū)間比95%可信區(qū)間好,需要兼顧準(zhǔn)確度和精密度。一般來說95%可信區(qū)間更為常用。

已證明,以雙側(cè)對稱區(qū)間估計方法所估計的區(qū)間長度最短,即在相同的條件()下,以雙側(cè)各估計的區(qū)間的精度最高。在可信度確定的情況下,增加樣本容量,可減少區(qū)間長度(減少和),提高精密度。

[精密度↑→可信區(qū)間窄→抽樣誤差↓;可信度↑→

u或

t↑→區(qū)間寬→精密度↓]二、正態(tài)總體均值的區(qū)間估計

大數(shù)定律:當(dāng)樣本容量較大時,多數(shù)隨機(jī)現(xiàn)象的分布均服從正態(tài)分布。設(shè)()為來自正態(tài)總體N(,σ2)的一個樣本,、S2分別是樣本均值和樣本方差,是總體的未知參數(shù)。(一)單正態(tài)總體的的置信區(qū)間的估計:1、已知:(1)公式:按正態(tài)分布原理計算,

~N(0,1)由標(biāo)準(zhǔn)正態(tài)分布可知,正態(tài)曲線下有()的u值在之間,即:

P{≤}=P(≤u

≤)=P(≤≤)=

移項后整理得,總體均數(shù)μ的()可信區(qū)間為:

查附表(2)舉例:

設(shè)()為來自正態(tài)總體N(

,σ2)的一個樣本,是樣本均值,σ2已知。求的95%的置信區(qū)間。解:因為:

~N(0,1)則:

P(-1.96≤u≤+1.96)=0.95

P(-1.96≤≤+1.96)=0.95

移項后整理得,總體均數(shù)μ的95%可信區(qū)間為()

2、未知:1)未知,但n足夠大(n≥30)時:按u分布的近似原理計算,因為自由度越大,t分布越逼近u分布,

~N(0,1)由標(biāo)準(zhǔn)正態(tài)分布可知,正態(tài)曲線下有()的u值在之間,即:

P{≤}=P(≤u

≤)=P(≤≤)=移項后整理得,總體均數(shù)μ的()可信區(qū)間為:

舉例:

eg1:總體均數(shù)μ的95%可信區(qū)間為(總體方差未知且大樣本):

(,)

2)未知且n小時:按t分布的原理計算,因為對樣本均值的u轉(zhuǎn)換變?yōu)閠轉(zhuǎn)換~t(n-1)由t分布可知,某自由度的t曲線下有()的t值在±之間,即:

P{≤}=P(≤t

≤)=P(≤≤)=

移項后整理得,總體均數(shù)μ的()可信區(qū)間為:

舉例:

eg1:總體均數(shù)μ的90%可信區(qū)間為(總體方差未知且小樣本):(,)

eg2:對某種材料的強度只有下限的要求?,F(xiàn)已知該材料的強度X~N(,σ2),但、σ2均未知。今進(jìn)行5次測試,得樣本均值和樣本方差為

=1160kg/cm2,S=99.75kg/cm2?,F(xiàn)求的0.99的單側(cè)置信區(qū)間()。解:由

~t(n-1)P(t

>)=查表,得

=3.7469

所以,

==992.8kg/cm2

則:

的0.99的單側(cè)置信區(qū)間()kg/cm2。課堂練習(xí)1、對某人群隨機(jī)抽取20人,用某批號的結(jié)核菌素作皮試,平均浸潤直徑為10.9cm,標(biāo)準(zhǔn)差為3.86cm。問:這批結(jié)核菌素在該人群中使用時,皮試的平均浸潤直徑的95%可信區(qū)間是多少?[參考答案:(9.1,12.7)cm)]

2、某車間生產(chǎn)滾珠,從長期實踐中知道,滾珠直徑X服從正態(tài)分布,從某天生產(chǎn)的產(chǎn)品中隨機(jī)抽取6個,量得直徑如下(單位:mm):14.7,15.0,14.9,14.8,15.2,15.1,求的0.90雙側(cè)置信區(qū)間和0.99雙側(cè)置信區(qū)間。

[參考答案:

]三、正態(tài)總體方差的區(qū)間估計

設(shè)()為來自正態(tài)總體N(,σ2)的一個樣本,、σ2是總體的未知參數(shù),S2是樣本方差,求總體方差σ2

的置信區(qū)間:(一)若未知:求方差σ2的置信區(qū)間,一般與無關(guān),故通常未知按分布的原理計算,因為在未知時:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論