第五章參數(shù)估計(jì)基礎(chǔ)_第1頁(yè)
第五章參數(shù)估計(jì)基礎(chǔ)_第2頁(yè)
第五章參數(shù)估計(jì)基礎(chǔ)_第3頁(yè)
第五章參數(shù)估計(jì)基礎(chǔ)_第4頁(yè)
第五章參數(shù)估計(jì)基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

衛(wèi)生統(tǒng)計(jì)學(xué)鄒延峰流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系第五章

參數(shù)估計(jì)參數(shù)估計(jì):

就是用樣本指標(biāo)(統(tǒng)計(jì)量)來估計(jì)總體指標(biāo)(參數(shù))Question某市2000年隨機(jī)測(cè)量了90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm,,試估計(jì)該地19歲健康男大學(xué)生的身高可能的范圍。用某種儀器檢查已確診的乳腺癌患者94例,檢出率為78.3%。估計(jì)該儀器乳腺癌總體檢出率的可能范圍。講課提綱抽樣分布和抽樣誤差t分布總體均數(shù)和概率的估計(jì)

第一節(jié)抽樣分布與抽樣誤差用樣本信息來推斷相應(yīng)總體的特征,這一過程稱為統(tǒng)計(jì)推斷。統(tǒng)計(jì)推斷包括兩方面的內(nèi)容:參數(shù)估計(jì)和假設(shè)檢驗(yàn)抽樣誤差:由個(gè)體變異產(chǎn)生的、由于抽樣而造成的樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量及樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差。無傾向性,不可避免。一、樣本均數(shù)的抽樣分布與抽樣誤差

均數(shù)的抽樣誤差:用于表示均數(shù)抽樣誤差的指標(biāo)稱樣本均數(shù)的標(biāo)準(zhǔn)誤。抽樣實(shí)驗(yàn)一:假定從13歲女學(xué)生身高總體均數(shù)標(biāo)準(zhǔn)差的正態(tài)總體中進(jìn)行隨機(jī)抽樣。

樣本均數(shù)的抽樣分布特點(diǎn):

1

各樣本均數(shù)未必等于總體均數(shù)

2

樣本均數(shù)之間存在差異

3

樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù),中間多,兩邊少,左右基本對(duì)稱,也服從正態(tài)分布

4

樣本均數(shù)的變異較之原變量大大縮小抽樣實(shí)驗(yàn)二:非正態(tài)總體樣本均數(shù)的抽樣實(shí)驗(yàn)(實(shí)驗(yàn)5-2)

圖5-1(a)是一個(gè)正偏峰的分布,用電腦從中隨機(jī)抽取樣本含量分別為5,10,30和50的樣本各1000次,計(jì)算樣本均數(shù)并繪制4個(gè)直方圖N=5N=10N=30N=50

1)從正態(tài)總體N(μ,σ2)中,隨機(jī)抽取例數(shù)為n的多個(gè)樣本,樣本均數(shù)服從正態(tài)分布;即使是從偏態(tài)總體中隨機(jī)抽樣,當(dāng)n足夠大時(shí)(如n>50),也近似正態(tài)分布。2)從均數(shù)為μ,標(biāo)準(zhǔn)差為σ的正態(tài)或偏態(tài)總體中抽取例數(shù)為n的樣本,樣本均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤為。

標(biāo)準(zhǔn)誤的大小與σ的大小成正比,與n成反比,而σ為定值,說明可以通過增加樣本例數(shù)來減少標(biāo)準(zhǔn)誤,以降低抽樣誤差。σ未知,用樣本標(biāo)準(zhǔn)差S來估計(jì)總體標(biāo)準(zhǔn)差σ。用來表示均數(shù)抽樣誤差的大小。(標(biāo)準(zhǔn)誤的理論值)(標(biāo)準(zhǔn)誤的估計(jì)值)

例5-12000年某研究所隨機(jī)調(diào)查某地健康成年男子27人,得到血紅蛋白的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計(jì)該樣本均數(shù)的抽樣誤差。二、樣本頻率的抽樣分布與抽樣誤差

表示頻率的抽樣誤差大小的指標(biāo)叫頻率的標(biāo)準(zhǔn)誤。π:總體率,n:樣本例數(shù)。

當(dāng)π未知時(shí),公式為:

:率的標(biāo)準(zhǔn)誤的估計(jì)值,p:樣本率。

據(jù)數(shù)理統(tǒng)計(jì)的原理,率的標(biāo)準(zhǔn)誤用表示

例5-2某市隨機(jī)調(diào)查了50歲以上的中老年婦女776人,其中患有骨質(zhì)疏松癥者322人,患病率為41.5%,試計(jì)算該樣本頻率的抽樣誤差。

一、t分布的概念在統(tǒng)計(jì)應(yīng)用中,可以把任何一個(gè)均數(shù)為μ,標(biāo)準(zhǔn)差為σ的正態(tài)分布N(μ,σ2)轉(zhuǎn)變?yōu)棣?0,σ=1的標(biāo)準(zhǔn)正態(tài)分布,即將正態(tài)變量值X用來代替。第二節(jié)t分布也服從正態(tài)分布,服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)服從ν=n-1的t分布t分布曲線特點(diǎn):

1)t分布曲線是單峰分布,它以0為中心,左右對(duì)稱。

2)t分布的形狀與樣本例數(shù)n有關(guān)。自由度越小,則越大,t值越分散,曲線的峰部越矮,尾部翹的越高。

3)當(dāng)n→∞時(shí),則S逼近σ,t分布逼近標(biāo)準(zhǔn)正態(tài)分布。t分布不是一條曲線,而是一簇曲線。二、t分布的圖形和t分布表υ=∞(標(biāo)準(zhǔn)正態(tài)分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3圖5-3不同自由度下的t分布圖正確使用t界值表!t分布

統(tǒng)計(jì)學(xué)家將t分布曲線下的尾部面積(即概率P)與橫軸t值間的關(guān)系編制了不同自由度下的t界值表(附表2)。

t界值表:橫標(biāo)目為自由度,縱標(biāo)目為概率P。

t臨界值:表中數(shù)字表示當(dāng)和P確定時(shí),對(duì)應(yīng)的值。

單側(cè)概率(one-tailedprobability):用t,υ表示雙側(cè)概率(two-tailedprobability):用t/2,υ表示t分布例如,當(dāng)=16,單側(cè)概率P=0.05時(shí),由表中查得單側(cè)t0.05,16=1.746;而當(dāng)=16,雙側(cè)概率P=0.05時(shí),由表中查得雙側(cè)t0.05/2,16=2.120。按t分布的規(guī)律,理論上有 單側(cè):P(t

t0.05,16)=0.05和P(t

t0.05,16)=0.05雙側(cè):P(t

t0.05/2,16)+P(t

t0.05/2,16)=0.05t分布更一般的表示方法如圖5-4(a)和(b)中陰影部分所示為:?jiǎn)蝹?cè):P(t

t,

)=和P(t

t,

)=雙側(cè):P(t

t/2,

)+P(t

t/2,

)=t分布從t界值表中或表的右上角圖列亦可看出:①在相同自由度時(shí),│t│值越大,概率P越小;②而在相同t值時(shí),雙側(cè)概率P為單側(cè)概率P的兩倍,即t0.10/2,16=t0.05,16=1.746。

一、參數(shù)估計(jì)的方法第三節(jié)總體均數(shù)及總體概率的估計(jì)參數(shù)估計(jì)點(diǎn)估計(jì)(pointestimation)區(qū)間估計(jì)(intervalestimation)1.點(diǎn)估計(jì):

用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值。

例如于2000年測(cè)得某地27例健康成年男性血紅蛋白量的樣本均數(shù)為125g/L,試估計(jì)其總體均數(shù)。2.區(qū)間估計(jì):按預(yù)先給定的概率(1-α)估計(jì)總體參數(shù)的可能范圍,該范圍就稱為總體參數(shù)的1-α置信區(qū)間(confidenceinterval,CI)。預(yù)先給定的概率(1-α)稱為置信度,常取95%或99%。如無特別說明,一般取雙側(cè)95%。

可信區(qū)間由兩個(gè)數(shù)值即置信限構(gòu)成,其中最小值稱為下限,最大值稱為上限。嚴(yán)格講,可信區(qū)間不包括上下限兩個(gè)端點(diǎn)值。二、置信區(qū)間的計(jì)算方法通式:(雙側(cè))(一)總體均數(shù)置信區(qū)間的計(jì)算

(1)σ已知,按標(biāo)準(zhǔn)正態(tài)分布原理計(jì)算由z分布,標(biāo)準(zhǔn)正態(tài)曲線下有95%的z值在±1.96之間。95%的雙側(cè)置信區(qū)間:99%的雙側(cè)置信區(qū)間:

Zа/2為標(biāo)準(zhǔn)正態(tài)變量,Zа/2相當(dāng)于按ν=∞時(shí)及P取α,由附表2查的的t界值。通式:(雙側(cè))(2)σ未知但樣本例數(shù)n足夠大(n>50)時(shí)

由t分布可知,自由度越大,t分布越逼近標(biāo)準(zhǔn)正態(tài)分布,此時(shí)t曲線下有95%的t值約在±1.96之間,即95%的雙側(cè)置信區(qū)間:99%的雙側(cè)置信區(qū)間:例5-4某市2000年隨機(jī)測(cè)量了90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm,,試估計(jì)該地19歲健康男大學(xué)生的身高的95%置信區(qū)間。該市19歲健康男大學(xué)生的身高的95%置信區(qū)間(171.3,173.1)cm(3)σ未知且樣本例數(shù)n較小時(shí),按t分布原理,此時(shí)某自由度的t曲線下有95%的t值約在±t0.05(ν)之間,

通式:95%的雙側(cè)置信區(qū)間:99%的雙側(cè)置信區(qū)間:tа/2,ν是按自由度ν=n-1,由附表2查得的t值。例5-3已知某地27例健康成年男性血紅蛋白量的均數(shù)為,標(biāo)準(zhǔn)差S=15g/L,試問該地健康成年男性血紅蛋白量的95%和99%置信區(qū)間。

本例n=27,S=1595%CI:99%CI:

置信區(qū)間的兩個(gè)要素:

準(zhǔn)確度:反映置信度1-α的大小,即區(qū)間包含總體均數(shù)的概率大小。精度:反映區(qū)間的長(zhǎng)度。在置信區(qū)間確定的情況下,增加樣本例數(shù),會(huì)減小tа,ν

和,可減少區(qū)間長(zhǎng)度,提高精度。1.正態(tài)近似法當(dāng)樣本含量足夠大,且p和1-p不太小,則樣本率的分布近似正態(tài)分布。公式為:

P為樣本率,為率的標(biāo)準(zhǔn)誤的估計(jì)值,

(二)總體概率的置信區(qū)間

例5-7用某種儀器檢查已確診的乳腺癌患者94例,檢出率為78.3%。估計(jì)該儀器乳腺癌總體檢出率的95%置信區(qū)間。分析:本例樣本例數(shù)較大,且樣本率p不太小,可用正態(tài)近似法:2.查表法

當(dāng)n較小,如n≤50,特別是p和1-p接近0或1時(shí)。

例5-5某醫(yī)院對(duì)39名前列腺癌患者實(shí)施開放手術(shù)治療,術(shù)后有合并癥者2人,試估計(jì)該手術(shù)合并癥發(fā)生概率的95%置信區(qū)間。

例5-6某醫(yī)生用某藥物治療31例腦血管梗塞患者,其中25例患者治療有效,試求該藥物治療腦血管梗塞有效概率的95%置信區(qū)間。注意:附表6僅列出X≤n/2的95%置信區(qū)間。小結(jié)掌握:參數(shù)估計(jì)的概念,均數(shù)標(biāo)準(zhǔn)誤的計(jì)算方法,總體均數(shù)可信區(qū)間計(jì)算方法,標(biāo)準(zhǔn)誤的意義及應(yīng)用。熟悉:t分布的特征,t界值。了解:樣本統(tǒng)計(jì)量的分布規(guī)律,率的標(biāo)準(zhǔn)誤的計(jì)算方法,總體率可信區(qū)間計(jì)算方法。均數(shù)置信區(qū)間與參考值范圍的區(qū)別意義:

前者為絕大多數(shù)人某項(xiàng)指標(biāo)的數(shù)值范圍,后者為按一定的概率估計(jì)總體參數(shù)所在的范圍

計(jì)算:

置信區(qū)間用標(biāo)準(zhǔn)誤,參考值范圍用標(biāo)準(zhǔn)差應(yīng)用:前者供判斷觀察對(duì)象某項(xiàng)指標(biāo)是否正常時(shí)參考,后者估計(jì)未知總體均數(shù)所在范圍思考!標(biāo)準(zhǔn)差與均數(shù)的標(biāo)準(zhǔn)誤的區(qū)別

1)概念(意義)不同:標(biāo)準(zhǔn)差是描述樣本中個(gè)體值間的變異程度;標(biāo)準(zhǔn)誤是描述樣本均數(shù)抽樣誤差大小的指標(biāo)

2)

記法和計(jì)算不同:略3)

用途不同:標(biāo)準(zhǔn)差常用于估計(jì)正常值范圍,計(jì)算變異系數(shù)等;標(biāo)準(zhǔn)誤常用于估計(jì)參數(shù)的可信區(qū)間,進(jìn)行假設(shè)檢驗(yàn)4)控制方法不同:標(biāo)準(zhǔn)差趨向穩(wěn)定,不能用統(tǒng)計(jì)方法控制。而標(biāo)準(zhǔn)誤隨例數(shù)的增大而減小思考!

1)二者均為變異指標(biāo),如果把總體中各樣本均數(shù)看成一個(gè)變量,則標(biāo)準(zhǔn)誤可稱為樣本均數(shù)的標(biāo)準(zhǔn)差

2)當(dāng)樣本含量不變時(shí),均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比

3)兩者均可與均數(shù)結(jié)合運(yùn)用,但描述的內(nèi)容各不相同

標(biāo)準(zhǔn)差與均數(shù)的標(biāo)準(zhǔn)誤的聯(lián)系:

1.某地1992年隨機(jī)抽取100名健康女性,算得其血清總蛋白含量的均數(shù)為74g/L,標(biāo)準(zhǔn)差為4g/L,則其95%的參考值范圍為()。A.7444 B.741.964 C.742.584D.742.58410E.741.964102.關(guān)于以0為中心的t分布,錯(cuò)誤的是()。A.t分布圖是一簇曲線 B.t分布圖是單峰分布C.當(dāng)時(shí),tuD.t分布圖以0為中心,左右對(duì)稱

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論