第五章參數(shù)估計(jì)基礎(chǔ)(7版1)

上傳人：小*** IP屬地：境外上傳時(shí)間：2023-10-15 格式：PPT 頁(yè)數(shù)：41 大?。?.16MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩36頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章參數(shù)估計(jì)基礎(chǔ)寧夏醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系郭忠琴2014.31學(xué)習(xí)要點(diǎn)一、抽樣分布與抽樣誤差

掌握標(biāo)準(zhǔn)誤的概念和計(jì)算二、t分布

掌握t分布的圖形特征及t值表的使用三、總體均數(shù)及總體概率的估計(jì)

掌握置信區(qū)間的計(jì)算方法、決定置信區(qū)間優(yōu)劣的兩個(gè)要素。2第一節(jié)抽樣分布與抽樣誤差統(tǒng)計(jì)分析：統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷（statisticalinference）——從總體中隨機(jī)抽取一個(gè)樣本，通過(guò)樣本信息了解總體特征或參數(shù)，這種方法叫統(tǒng)計(jì)推斷。統(tǒng)計(jì)推斷：參數(shù)估計(jì)和假設(shè)檢驗(yàn)參數(shù)估計(jì)（estimationofparameter）

——樣本指標(biāo)值（統(tǒng)計(jì)量）估計(jì)總體指標(biāo)值（參數(shù)）的過(guò)程。3第一節(jié)抽樣分布與抽樣誤差

參數(shù)估計(jì)：點(diǎn)值估計(jì)和區(qū)間估計(jì)點(diǎn)值估計(jì)（Pointestimation

）：就是用相應(yīng)樣本統(tǒng)計(jì)量直接作為其總體參數(shù)的估計(jì)值。區(qū)間估計(jì)（ConfidenceintervalCI）：按預(yù)先給定的概率(1-α)估計(jì)總體參數(shù)的可能范圍，該范圍就稱為總體參數(shù)的1－α置信區(qū)間。

4第一節(jié)抽樣分布與抽樣誤差熟悉總體與樣本、統(tǒng)計(jì)量與參數(shù)、誤差與抽樣誤差誤差：泛指測(cè)得值與真值之差，樣本指標(biāo)與總體指標(biāo)之差。誤差按其產(chǎn)生的原因與性質(zhì)分為兩大類（系統(tǒng)誤差和偶然誤差）。抽樣誤差：由個(gè)體變異產(chǎn)生的、由于抽樣而造成的樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量及樣本統(tǒng)計(jì)量與總體參數(shù)之間的差異稱為抽樣誤差。無(wú)傾向性，不可避免。5第一節(jié)抽樣分布與抽樣誤差均數(shù)的抽樣誤差：由個(gè)體變異產(chǎn)生的、由于抽樣而造成的樣本均數(shù)與樣本均數(shù)及樣本均數(shù)與總體均數(shù)之間的差異稱為均數(shù)的抽樣誤差。用于表示均數(shù)抽樣誤差的指標(biāo)叫樣本均數(shù)的標(biāo)準(zhǔn)差，也稱樣本均數(shù)的標(biāo)準(zhǔn)誤。一、樣本均數(shù)的抽樣分布與抽樣誤差6抽樣實(shí)驗(yàn)：假定從13歲女學(xué)生身高總體均數(shù)，總體標(biāo)準(zhǔn)差的正態(tài)總體中進(jìn)行隨機(jī)抽樣。

7抽樣實(shí)驗(yàn)：假定從13歲女學(xué)生身高總體均數(shù)，總體標(biāo)準(zhǔn)差的正態(tài)總體中進(jìn)行隨機(jī)抽樣。

8樣本均數(shù)的分布特點(diǎn)：

1.各樣本均數(shù)未必等于總體均數(shù)；

2.樣本均數(shù)之間存在差異；

3.樣本均數(shù)的分布很有規(guī)律，圍繞著總體均數(shù)，中間多，兩邊少，左右基本對(duì)稱，也服從正態(tài)分布。

4.樣本均數(shù)的變異較之原變量的變異大大縮小。第一節(jié)抽樣分布與抽樣誤差910第一節(jié)抽樣分布與抽樣誤差11121）從正態(tài)總體N(μ,σ2)中，隨機(jī)抽取例數(shù)為n的多個(gè)樣本，樣本均數(shù)服從正態(tài)分布；即使是從偏態(tài)總體中隨機(jī)抽樣，當(dāng)n足夠大時(shí)(如n＞50)，也近似正態(tài)分布。數(shù)理統(tǒng)計(jì)推理和中心極限定理表明：2）從均數(shù)為μ，標(biāo)準(zhǔn)差為σ的正態(tài)或偏態(tài)總體中抽取例數(shù)為n的樣本，樣本均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤。第一節(jié)抽樣分布與抽樣誤差13身高組段頻數(shù)組中值fxfx2

152.6～1152.9153.2～4153.5153.8～4154.1154.4～22154.7155.0～25155.3155.6～21155.9156.2～17156.5156.8～3157.1157.4～2157.7158.0～1158.3合計(jì)100表8-2100個(gè)樣本均數(shù)的頻數(shù)表與標(biāo)準(zhǔn)誤的計(jì)算表第一節(jié)抽樣分布與抽樣誤差14標(biāo)準(zhǔn)誤的大小與σ的大小成正比，與n的平方根成反比，而σ為定值，說(shuō)明可以通過(guò)增加樣本例數(shù)來(lái)減少標(biāo)準(zhǔn)誤，以降低抽樣誤差。σ未知，用樣本標(biāo)準(zhǔn)差S來(lái)估計(jì)總體標(biāo)準(zhǔn)差σ。用來(lái)表示均數(shù)抽樣誤差的大小。（標(biāo)準(zhǔn)誤的理論值）（標(biāo)準(zhǔn)誤的估計(jì)值）15

例5-12000年某研究所隨機(jī)調(diào)查某地健康成年男子27人，得到血紅蛋白的均數(shù)為125g/L，標(biāo)準(zhǔn)差為15g/L。試估計(jì)該樣本均數(shù)的抽樣誤差。第一節(jié)抽樣分布與抽樣誤差16二、樣本頻率的抽樣分布與抽樣誤差從同一總體中隨機(jī)抽出觀察單位相等的多個(gè)樣本，樣本率與總體率及各樣本率之間都存在差異，這種差異是由于抽樣引起的，稱為頻率的抽樣誤差。表示頻率的抽樣誤差大小的指標(biāo)叫頻率的標(biāo)準(zhǔn)誤。第一節(jié)抽樣分布與抽樣誤差17π：總體率，n：樣本例數(shù)。當(dāng)π未知時(shí)，pπ（當(dāng)樣本含量足夠大，且p和1-p不太小）公式為:

：率的標(biāo)準(zhǔn)誤的估計(jì)值，p：樣本率。據(jù)數(shù)理統(tǒng)計(jì)的原理，率的標(biāo)準(zhǔn)誤用表示第一節(jié)抽樣分布與抽樣誤差18

例5-2某市隨機(jī)調(diào)查了50歲以上的中老年婦女776人，其中患有骨質(zhì)疏松癥者322人，患病率為41.5%，試計(jì)算該樣本頻率的抽樣誤差。第一節(jié)抽樣分布與抽樣誤差19一、t分布的概念在統(tǒng)計(jì)應(yīng)用中，可以把任何一個(gè)均數(shù)為μ，標(biāo)準(zhǔn)差為σ的正態(tài)分布N(μ,σ2)轉(zhuǎn)變?yōu)棣?0,σ=1的標(biāo)準(zhǔn)正態(tài)分布，即將正態(tài)變量值X用來(lái)代替。第二節(jié)t分布也服從正態(tài)分布，服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)服從ν=n-1的t分布20第二節(jié)t分布21t分布曲線特點(diǎn)：

1）t分布曲線是單峰分布，它以0為中心，左右對(duì)稱。

2）t分布的形狀與樣本例數(shù)n有關(guān)。自由度越小，則越大，t值越分散，曲線的峰部越矮，尾部翹的越高。

3)當(dāng)n→∞時(shí)，則S逼近σ，t分布逼近標(biāo)準(zhǔn)正態(tài)分布。t分布不是一條曲線，而是一簇曲線。二、t分布的圖形和t分布表第二節(jié)t分布2223與單側(cè)概率相對(duì)應(yīng)的t值用表示，與雙側(cè)概率相對(duì)應(yīng)的t值用表示。由于t分布是以0為中心的對(duì)稱分布，表中只列出了正值，故查表時(shí)，不管t值正負(fù)只用絕對(duì)值表示。正確使用t界值表！第二節(jié)t分布24

一、參數(shù)估計(jì)的概念統(tǒng)計(jì)推斷包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。參數(shù)估計(jì)就是用樣本指標(biāo)（統(tǒng)計(jì)量）來(lái)估計(jì)總體指標(biāo)（參數(shù)）。第三節(jié)總體均數(shù)及總體概率的估計(jì)參數(shù)估計(jì)點(diǎn)估計(jì)(pointestimation)區(qū)間估計(jì)(intervalestimation)二、置信區(qū)間的計(jì)算（一）總體均數(shù)的置信區(qū)間25，即認(rèn)為2000年該地所有健康成年男性血紅蛋白量的總體均數(shù)為125g/L。1.點(diǎn)估計(jì)：

用樣本統(tǒng)計(jì)量直接作為總體參數(shù)的估計(jì)值。

例如于2000年測(cè)得某地27例健康成年男性血紅蛋白量的樣本均數(shù)為125g/L，試估計(jì)其總體均數(shù)。同理，例5-2中776名50歲以上的中老年婦女骨質(zhì)疏松癥的樣本患病率作為總體患病率的點(diǎn)值估計(jì)值，即認(rèn)為該市所有50歲以上的中老年婦女骨質(zhì)疏松癥的總體患病率約為41.5%。

第三節(jié)總體均數(shù)及總體概率的估計(jì)262.區(qū)間估計(jì)：按預(yù)先給定的概率(1－α)估計(jì)總體參數(shù)的可能范圍，該范圍就稱為總體參數(shù)的1－α置信區(qū)間(confidenceintervalCI)。預(yù)先給定的概率(1－α)稱為置信度，常取95%或99%。如無(wú)特別說(shuō)明，一般取雙側(cè)95%?？尚艆^(qū)間由兩個(gè)數(shù)值即置信限構(gòu)成，其中最小值稱為下限，最大值稱為上限。嚴(yán)格講，可信區(qū)間不包括上下限兩個(gè)端點(diǎn)值。第三節(jié)總體均數(shù)及總體概率的估計(jì)27通式：（雙側(cè)）（二）、置信區(qū)間的計(jì)算

（1）σ已知，按標(biāo)準(zhǔn)正態(tài)分布原理計(jì)算由z分布，標(biāo)準(zhǔn)正態(tài)曲線下有95%的z值在±1.96之間。95%的雙側(cè)置信區(qū)間：99%的雙側(cè)置信區(qū)間：Zа/2為標(biāo)準(zhǔn)正態(tài)變量，Zа/2相當(dāng)于按ν=∞時(shí)及P取α，由附表2查的的t界值。

28通式：（雙側(cè)）（2）σ未知但樣本例數(shù)n足夠大（n＞50）時(shí)

由t分布可知，自由度越大，t分布越逼近標(biāo)準(zhǔn)正態(tài)分布，此時(shí)t曲線下有95%的t值約在±1.96之間，即95%的雙側(cè)置信區(qū)間：99%的雙側(cè)置信區(qū)間：第三節(jié)總體均數(shù)及總體概率的估計(jì)29例5-4某市2000年隨機(jī)測(cè)量了90名19歲健康男大學(xué)生的身高，其均數(shù)為172.2cm，標(biāo)準(zhǔn)差為4.5cm,，試估計(jì)該地19歲健康男大

人人文庫(kù)> 全部分類> 專業(yè)文獻(xiàn) > 醫(yī)學(xué)資料

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第五章參數(shù)估計(jì)基礎(chǔ)(7版1)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第五章參數(shù)估計(jì)基礎(chǔ)(7版1)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔