流行病預(yù)防學(xué)-預(yù)防統(tǒng)計(jì)學(xué)-ppt課件_第1頁
流行病預(yù)防學(xué)-預(yù)防統(tǒng)計(jì)學(xué)-ppt課件_第2頁
流行病預(yù)防學(xué)-預(yù)防統(tǒng)計(jì)學(xué)-ppt課件_第3頁
流行病預(yù)防學(xué)-預(yù)防統(tǒng)計(jì)學(xué)-ppt課件_第4頁
流行病預(yù)防學(xué)-預(yù)防統(tǒng)計(jì)學(xué)-ppt課件_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、主講人主講人 劉欣劉欣流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室 第二節(jié)第二節(jié) 正態(tài)分布及應(yīng)用正態(tài)分布及應(yīng)用 正態(tài)曲線以均數(shù)為中心,左右對稱。正態(tài)曲線以均數(shù)為中心,左右對稱。 正態(tài)曲線的高峰位于均數(shù)所在處。正態(tài)曲線的高峰位于均數(shù)所在處。 正態(tài)分布具有正態(tài)分布具有均值與均值與標(biāo)準(zhǔn)差兩個(gè)參數(shù)。標(biāo)準(zhǔn)差兩個(gè)參數(shù)。 確定正態(tài)曲線的中心位置。確定正態(tài)曲線的中心位置。越大,曲越大,曲 線沿橫軸越向右移動(dòng);反之越向左移動(dòng)。線沿橫軸越向右移動(dòng);反之越向左移動(dòng)。 確定曲線的形狀。確定曲線的形狀。越大,曲線越扁平;越大,曲線越扁平; 越小,曲線越尖峭。一般用越小,曲線越尖峭。一般用N(,2)表示表示 均數(shù)為均

2、數(shù)為,方差為,方差為2的正態(tài)分布。的正態(tài)分布。 正態(tài)曲線下面積分布有一定規(guī)律。正態(tài)曲線下面積分布有一定規(guī)律。 二、二、 正態(tài)分布的特征正態(tài)分布的特征(-1 , +1 ): 68.27%(-1.96, +1.96 ):95.00%(-2.58, +2.58 ):99.00% 理論上,正態(tài)曲線下理論上,正態(tài)曲線下1.961.96和和2.582.58的區(qū)間的面積分別各占總面積的的區(qū)間的面積分別各占總面積的95%95%及及99%99%。圖。圖示見下圖。示見下圖。四、標(biāo)準(zhǔn)正態(tài)分布四、標(biāo)準(zhǔn)正態(tài)分布 正態(tài)分布有兩個(gè)不固定的參數(shù)正態(tài)分布有兩個(gè)不固定的參數(shù)與與,為了,為了應(yīng)用方便,可采取變量變換,使二者都為常數(shù)

3、,應(yīng)用方便,可采取變量變換,使二者都為常數(shù),即即= 0= 0,= 1= 1。其變換為。其變換為: :xu 此變換可把此變換可把N(,2)N(,2)轉(zhuǎn)化為轉(zhuǎn)化為= 0= 0,= 1= 1的的正態(tài)分布正態(tài)分布N(0,1)N(0,1),稱為標(biāo)準(zhǔn)正態(tài)分布,稱為標(biāo)準(zhǔn)正態(tài)分布standard standard normal distributionnormal distribution)。)。 三、正態(tài)分布的應(yīng)用三、正態(tài)分布的應(yīng)用 制定參考值范圍制定參考值范圍 參考值范圍參考值范圍reference ranges)reference ranges)又被稱為正又被稱為正常值范圍,是指絕大多數(shù)正常人的解剖、生

4、理、生常值范圍,是指絕大多數(shù)正常人的解剖、生理、生化等各種數(shù)據(jù)的波動(dòng)范圍?;雀鞣N數(shù)據(jù)的波動(dòng)范圍。 (一參考值范圍的概念(一參考值范圍的概念(二參考值范圍估計(jì)的基本步驟(二參考值范圍估計(jì)的基本步驟 從正常人的總體中進(jìn)行隨機(jī)抽樣。從正常人的總體中進(jìn)行隨機(jī)抽樣。 對選定的正常人進(jìn)行準(zhǔn)確測量。對選定的正常人進(jìn)行準(zhǔn)確測量。 確定取單側(cè)范圍還是雙側(cè)范圍。確定取單側(cè)范圍還是雙側(cè)范圍。 選擇適當(dāng)?shù)陌俜址秶?。選擇適當(dāng)?shù)陌俜址秶?根據(jù)資料的分布類型選用恰當(dāng)?shù)墓烙?jì)方法。根據(jù)資料的分布類型選用恰當(dāng)?shù)墓烙?jì)方法。 (三參考值范圍的估計(jì)方法(三參考值范圍的估計(jì)方法 根據(jù)資料的分布類型可選擇正態(tài)分布法或百根據(jù)資料的分布類

5、型可選擇正態(tài)分布法或百分位數(shù)法計(jì)算參考值范圍。分位數(shù)法計(jì)算參考值范圍。 1. 1. 正態(tài)分布法正態(tài)分布法 適用于正態(tài)分布或近似正態(tài)適用于正態(tài)分布或近似正態(tài)分布的資料。計(jì)算公式為:分布的資料。計(jì)算公式為:SuX 例例 某地調(diào)查正常成年男子某地調(diào)查正常成年男子144144人的紅細(xì)胞數(shù)人的紅細(xì)胞數(shù)( (近似正近似正態(tài) 分 布態(tài) 分 布 ) ) , 得 均 數(shù) 為, 得 均 數(shù) 為 5 5 . 3 25 5 . 3 2 1 0 1 2 / L1 0 1 2 / L , 標(biāo) 準(zhǔn) 差 為, 標(biāo) 準(zhǔn) 差 為0.440.441012/L1012/L。試估計(jì)該地成年男子紅細(xì)胞數(shù)的。試估計(jì)該地成年男子紅細(xì)胞數(shù)的9

6、5%95%醫(yī)學(xué)醫(yī)學(xué)參考值范圍。參考值范圍。 因紅細(xì)胞數(shù)過多或過少均為異常,故應(yīng)求雙側(cè)因紅細(xì)胞數(shù)過多或過少均為異常,故應(yīng)求雙側(cè)范圍。范圍。 資料近似正態(tài)分布,用正態(tài)分布法計(jì)算如下:資料近似正態(tài)分布,用正態(tài)分布法計(jì)算如下:下限為:下限為:)/10(52.5444. 096. 138.551205. 0LSuX上限為:上限為:)/10(24.5644. 096. 138.551205. 0LSuX該地成年男子紅細(xì)胞數(shù)的該地成年男子紅細(xì)胞數(shù)的95%醫(yī)學(xué)參考值范圍為醫(yī)學(xué)參考值范圍為54.52,56.24)。)。 2. 2. 百分位數(shù)法百分位數(shù)法 常用于偏態(tài)分布資料。以常用于偏態(tài)分布資料。以95%95%范

7、圍為例,其計(jì)算公式為:范圍為例,其計(jì)算公式為:雙側(cè):雙側(cè):),(5 .975 . 2PP單側(cè):單側(cè):5P95P或或 一、均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤 1、均數(shù)的抽樣誤差 樣本均數(shù)與總體均數(shù)之差異或各樣本 均數(shù)之差異,稱為均數(shù)的抽樣誤差。中心極限定理的直觀表述見下圖中心極限定理的直觀表述見下圖),(2Nxx總體1Xx2x3x1xi-2xi-1x4xi. . .樣本樣本1 1n樣本樣本2 2樣本樣本j j. . . 2XjX. .X總體總體),(2nNXnn 2、 標(biāo)準(zhǔn)誤standard error):反映均數(shù)抽樣誤差大小的指標(biāo)是樣本均數(shù)的標(biāo)準(zhǔn)差,簡稱標(biāo)準(zhǔn)誤,記作 或 。xxSnSSx 二、二、t t

8、分分 布布 0圖2 t 分布曲線 t t分布曲線形態(tài)類似正態(tài)分布曲線。分布曲線形態(tài)類似正態(tài)分布曲線。(一)(一) t t 分布的特征分布的特征 t分布曲線以分布曲線以0為中心,左右對稱。為中心,左右對稱。 t分布具有一個(gè)參數(shù)分布具有一個(gè)參數(shù)(稱自由度,稱自由度,=n-1)。 越小,曲線越扁平;越小,曲線越扁平;越大,曲線越接近越大,曲線越接近 標(biāo)準(zhǔn)正態(tài)分布;當(dāng)標(biāo)準(zhǔn)正態(tài)分布;當(dāng) 時(shí),時(shí),t 分布趨近于分布趨近于 標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布。 t分布是一簇曲線。不同分布是一簇曲線。不同的的t分布曲線見圖分布曲線見圖3。 t分布曲線下面積分布有一定規(guī)律。分布曲線下面積分布有一定規(guī)律。 = (標(biāo)準(zhǔn)正態(tài)

9、曲線)= 4= 1f(t)圖3 自由度分別為1、4、的t分布曲線(二)(二) t t 分布曲線下面積分布規(guī)律即分布曲線下面積分布規(guī)律即t t界值表界值表) t 界值常記為界值常記為 。其中。其中為自由度,為自由度,為概率為概率。其意義為:。其意義為:,t 單側(cè)概率:單側(cè)概率:P(t-t,)=P(t-t,)=或或P(tt,)=P(tt,)= 雙側(cè)概率:雙側(cè)概率:P(t-t,)+P(tt,)=P(t-t,)+P(tt,)= 對于雙側(cè)概率意義的圖形直觀表達(dá)見下圖對于雙側(cè)概率意義的圖形直觀表達(dá)見下圖4 4。,t,t22圖4 t 分布曲線下面積分布示意 四、總體均數(shù)置信區(qū)間估計(jì)四、總體均數(shù)置信區(qū)間估計(jì)統(tǒng)

10、計(jì)推斷統(tǒng)計(jì)推斷參數(shù)估計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)點(diǎn)估計(jì)點(diǎn)估計(jì)(point estimation)(point estimation)區(qū)間估計(jì)區(qū)間估計(jì)(interval estimation)(interval estimation) 概念:根據(jù)樣本均數(shù),按給定的概率計(jì)算出總體均數(shù)概念:根據(jù)樣本均數(shù),按給定的概率計(jì)算出總體均數(shù)很可能在的一個(gè)數(shù)值范圍,這個(gè)范圍稱為總體均數(shù)很可能在的一個(gè)數(shù)值范圍,這個(gè)范圍稱為總體均數(shù)的可信區(qū)間的可信區(qū)間(confidence interval, CI)。 方法:方法:(1) u分布法分布法(2) t分布法分布法(1 1u u 分布法分布法公式公式應(yīng)用條件應(yīng)用條件例題例

11、題(xus x,xu s x) 即xus x)未知,但未知,但n n足夠大或足夠大或已知已知(2 2t t分布法分布法公式公式應(yīng)用條件應(yīng)用條件例題例題(x ts x,xt s x) 即xts x)未知,且未知,且n n較小較小區(qū)間估計(jì)的準(zhǔn)確度:說對的可能性大小,區(qū)間估計(jì)的準(zhǔn)確度:說對的可能性大小, 用用 (1- (1-) ) 來衡量。來衡量。99%99%的可信區(qū)間好于的可信區(qū)間好于95%95%的可信區(qū)間的可信區(qū)間n, S n, S 一定時(shí))一定時(shí)) 。區(qū)間估計(jì)的精確度:指區(qū)間范圍的寬窄,區(qū)間估計(jì)的精確度:指區(qū)間范圍的寬窄,范圍越寬精確度越差。范圍越寬精確度越差。99%99%的可信區(qū)間差的可信區(qū)

12、間差于于95%95%的可信區(qū)間的可信區(qū)間n, S n, S 一定時(shí))一定時(shí)) 。 四、假設(shè)檢驗(yàn)的基本思想和步驟四、假設(shè)檢驗(yàn)的基本思想和步驟 例例 根據(jù)大量調(diào)查,已知正常成年男子脈搏均數(shù)為根據(jù)大量調(diào)查,已知正常成年男子脈搏均數(shù)為7272次次/ /分。某醫(yī)生在一山區(qū)隨機(jī)抽查了分。某醫(yī)生在一山區(qū)隨機(jī)抽查了2525名健康成年男子,名健康成年男子,求得其脈搏均數(shù)為求得其脈搏均數(shù)為74.274.2次次/ /分,標(biāo)準(zhǔn)差為分,標(biāo)準(zhǔn)差為6.06.0次次/ /分。能否分。能否據(jù)此認(rèn)為該山區(qū)成年男子脈搏均數(shù)高于一般成年男子脈搏據(jù)此認(rèn)為該山區(qū)成年男子脈搏均數(shù)高于一般成年男子脈搏均數(shù)?均數(shù)? 在本例中,山區(qū)成年男子脈搏

13、均數(shù)用在本例中,山區(qū)成年男子脈搏均數(shù)用山表示山表示,一般成年男子脈搏均數(shù)用,一般成年男子脈搏均數(shù)用00表示。表示。0=72次次/分分一般總體一般總體山山= ?山區(qū)總體山區(qū)總體n=25分次分次/0 . 6/2 .74SX 這里這里山與山與00的關(guān)系只能有兩種:的關(guān)系只能有兩種: 山山0 山山0山山0山山0 這里根據(jù)專業(yè)知識這里根據(jù)專業(yè)知識山山00的關(guān)系中只能是的關(guān)系中只能是 山山0 0 。造成二種情況的原因有:。造成二種情況的原因有: 山山0 (同一總體)(同一總體) 抽樣誤差抽樣誤差 山山0 (不同總體)(不同總體) 本質(zhì)不同本質(zhì)不同 假設(shè)檢驗(yàn)的基本步驟如下:假設(shè)檢驗(yàn)的基本步驟如下:1 1、建

14、立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn)、建立檢驗(yàn)假設(shè)和確定檢驗(yàn)水準(zhǔn) 檢驗(yàn)假設(shè)有兩種:檢驗(yàn)假設(shè)有兩種: 檢驗(yàn)假設(shè)檢驗(yàn)假設(shè)(hypothesis under test)又稱零又稱零/原原假設(shè)假設(shè)(null hypothesis)。用。用H0表示。假定通常表示。假定通常為:某兩個(gè)或多個(gè)總體參數(shù)相等,或某為:某兩個(gè)或多個(gè)總體參數(shù)相等,或某兩個(gè)總體參數(shù)之差等于兩個(gè)總體參數(shù)之差等于0,或某資料服從某一,或某資料服從某一特定分布正態(tài)分布、特定分布正態(tài)分布、Poisson分布等。本分布等。本例則為:例則為:H0: 山山0 。 單雙側(cè)的選擇在檢驗(yàn)之前由專業(yè)知識確定。單雙側(cè)的選擇在檢驗(yàn)之前由專業(yè)知識確定。 備擇假設(shè)備擇假設(shè)(a

15、lternative hypothesis)又稱對立又稱對立假設(shè)。用假設(shè)。用H1表示。表示。H1與與H0對立。對立。H1的內(nèi)容可的內(nèi)容可反映出檢驗(yàn)的單雙側(cè)。本例為:反映出檢驗(yàn)的單雙側(cè)。本例為:H1: 山山0 即為單側(cè)檢驗(yàn)即為單側(cè)檢驗(yàn)(one-sided test)或單尾檢驗(yàn)或單尾檢驗(yàn)(one-tailed test)。若。若H1: 山山0 則為雙側(cè)檢驗(yàn)則為雙側(cè)檢驗(yàn)(two-sided test)或雙尾檢驗(yàn)或雙尾檢驗(yàn)(two-tailed test)。 檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)(size of a test)是假設(shè)檢驗(yàn)作判斷是假設(shè)檢驗(yàn)作判斷結(jié)論的標(biāo)準(zhǔn),是預(yù)先確定的概率值,常常取結(jié)論的標(biāo)準(zhǔn),是預(yù)先確定的概

16、率值,常常取小概率事件標(biāo)準(zhǔn)。用小概率事件標(biāo)準(zhǔn)。用表示。也為表示。也為I型錯(cuò)誤型錯(cuò)誤 的概率大小的概率大小( (詳后詳后) )。實(shí)際工作中,。實(shí)際工作中,常取常取0.050.05。2 2、選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量、選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量 應(yīng)根據(jù)變量或資料的類型、分析的目的、設(shè)應(yīng)根據(jù)變量或資料的類型、分析的目的、設(shè)計(jì)的方案、檢驗(yàn)方法的適用條件等選擇檢驗(yàn)方法。計(jì)的方案、檢驗(yàn)方法的適用條件等選擇檢驗(yàn)方法。 檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量(test statistic)(test statistic)是在是在H0H0假設(shè)的條假設(shè)的條件件下由統(tǒng)計(jì)學(xué)家推導(dǎo)出的可由樣本指標(biāo)計(jì)算出來用下由統(tǒng)計(jì)學(xué)家推導(dǎo)出的可由樣

17、本指標(biāo)計(jì)算出來用于推斷結(jié)論的數(shù)值。于推斷結(jié)論的數(shù)值。 檢驗(yàn)方法常用檢驗(yàn)統(tǒng)計(jì)量的名稱命名。如檢驗(yàn)方法常用檢驗(yàn)統(tǒng)計(jì)量的名稱命名。如t t檢檢驗(yàn)中的驗(yàn)中的t t統(tǒng)計(jì)量、統(tǒng)計(jì)量、 u u檢驗(yàn)中的檢驗(yàn)中的u u統(tǒng)計(jì)量、統(tǒng)計(jì)量、 2 2檢驗(yàn)中檢驗(yàn)中的的22統(tǒng)計(jì)量等。統(tǒng)計(jì)量等。3 3、確定、確定P P值和作出推斷結(jié)論值和作出推斷結(jié)論 P P值的統(tǒng)計(jì)學(xué)含義是指從值的統(tǒng)計(jì)學(xué)含義是指從H0H0規(guī)定的總體隨機(jī)規(guī)定的總體隨機(jī)抽得等于及大于或等于及小于現(xiàn)有樣本獲得抽得等于及大于或等于及小于現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量的概率。的檢驗(yàn)統(tǒng)計(jì)量的概率。 通俗地講,通俗地講,P P值就代表了值就代表了H0H0成立與否的概率。成立與否

18、的概率。 將將P P值與檢驗(yàn)水準(zhǔn)值與檢驗(yàn)水準(zhǔn)進(jìn)行比較得出推斷結(jié)進(jìn)行比較得出推斷結(jié)論。論。推斷結(jié)論應(yīng)包含統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論兩部分。推斷結(jié)論應(yīng)包含統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論兩部分。 若若P P ,則按,則按檢驗(yàn)水準(zhǔn)拒絕檢驗(yàn)水準(zhǔn)拒絕H0H0,有,有統(tǒng)計(jì)學(xué)意義統(tǒng)計(jì)結(jié)論),可認(rèn)為統(tǒng)計(jì)學(xué)意義統(tǒng)計(jì)結(jié)論),可認(rèn)為不同或不不同或不等專業(yè)結(jié)論)。等專業(yè)結(jié)論)。 若若P P ,則按,則按檢驗(yàn)水準(zhǔn)尚不拒絕檢驗(yàn)水準(zhǔn)尚不拒絕H0H0,無,無統(tǒng)計(jì)學(xué)意義,還不能認(rèn)為統(tǒng)計(jì)學(xué)意義,還不能認(rèn)為不同或不等。不同或不等。 下面通過例下面通過例10.1710.17具體介紹假設(shè)檢驗(yàn)的過程:具體介紹假設(shè)檢驗(yàn)的過程:H0: 山山0H1: 山山0單側(cè),

19、單側(cè),= 0.05833. 1250 . 6722 .7400nSXSXtX =24 =24,查單側(cè),查單側(cè)t,= t0.05,24=1.711t,= t0.05,24=1.711,今,今求得求得 t =1.833 t =1.8331.7111.711, P P0.050.05,按,按=0.05=0.05水準(zhǔn)拒水準(zhǔn)拒絕絕 H0 H0,有統(tǒng)計(jì)學(xué)意義??烧J(rèn)為該山區(qū)成年男子脈,有統(tǒng)計(jì)學(xué)意義??烧J(rèn)為該山區(qū)成年男子脈 搏數(shù)高于一般成年男子脈搏數(shù)。搏數(shù)高于一般成年男子脈搏數(shù)。 上述例題屬于單樣本上述例題屬于單樣本t t檢驗(yàn),其假設(shè)檢驗(yàn)檢驗(yàn),其假設(shè)檢驗(yàn)的推斷結(jié)果是依據(jù)的推斷結(jié)果是依據(jù)t t分布的原理作出的。為了理解分布的原理作出的。為了理解其推斷過程的原理,通過直觀的示意圖見附圖其推斷過程的原理,通過直觀的示意圖見附圖表達(dá)上述例題假設(shè)檢驗(yàn)的過程。表達(dá)上述例題假設(shè)檢驗(yàn)的過程。)(t=24H0: 山山0單側(cè)單側(cè)t,= t0.05,24t,= t0.05,24=0.051.711接受域接受域山山0拒絕域拒絕域山山0t=1.833P=0.05 第四節(jié)第四節(jié) t 檢驗(yàn)和檢驗(yàn)和u 檢驗(yàn)檢驗(yàn) t t 檢驗(yàn)檢驗(yàn)(t-test,(t-test,亦稱亦稱Students t-test)St

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論