第二章-正態(tài)分布課件_第1頁(yè)
第二章-正態(tài)分布課件_第2頁(yè)
第二章-正態(tài)分布課件_第3頁(yè)
第二章-正態(tài)分布課件_第4頁(yè)
第二章-正態(tài)分布課件_第5頁(yè)
已閱讀5頁(yè),還剩60頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、醫(yī)學(xué)統(tǒng)計(jì)方法 Medical Statistics第 二 章數(shù)值變量資料的統(tǒng)計(jì)描述公共衛(wèi)生學(xué)系 田玉慧復(fù)習(xí)總體與樣本平均數(shù)與標(biāo)準(zhǔn)差各種平均數(shù)的應(yīng)用條件離散指標(biāo)標(biāo)準(zhǔn)差的應(yīng)用一、正態(tài)分布的概念和特征二、正態(tài)分布曲線下面積分布規(guī)律三、標(biāo)準(zhǔn)正態(tài)分布四、正態(tài)分布的應(yīng)用(一)制定醫(yī)學(xué)參考值范圍(二)正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)(三)質(zhì)量控制9.正態(tài)分布及其應(yīng)用一、正態(tài)分布(normal distribution)圖2-4 頻數(shù)分布與正態(tài)分布曲線示意圖f(X)一、正態(tài)分布(normal distribution) 正態(tài)分布是數(shù)理統(tǒng)計(jì)學(xué)中最重要的理論分布。醫(yī)學(xué)中許多現(xiàn)象如身高、體重、血壓、紅細(xì)胞數(shù)等的頻數(shù)

2、分布服從正態(tài)分布,或近似于正態(tài)分布,或經(jīng)過數(shù)據(jù)轉(zhuǎn)換可使其符合正態(tài)分布。即使是偏態(tài)分布的資料,當(dāng)樣本量很大時(shí),也可以近似地用正態(tài)分布來處理。 一、正態(tài)分布(normal distribution) 正態(tài)分布以均數(shù)所在處頻數(shù)最多,兩側(cè)逐漸減少,但永不為零,左右完全對(duì)稱。其圖形為近似鐘形。 正態(tài)分布的表示方法為N(,2)。其中為均數(shù),是正態(tài)分布的位置參數(shù);2是方差,反映了正態(tài)分布的形態(tài)。有了這兩個(gè)參數(shù),即可繪制出正態(tài)分布的圖形。 一、正態(tài)分布(normal distribution) 如果以總頻數(shù)為1,當(dāng)變量值為x時(shí)的頻數(shù)可用下式求得: 一、正態(tài)分布(normal distribution) 例 設(shè)

3、某地成年男性身高的均數(shù)為170cm,標(biāo)準(zhǔn)差為7cm,成年女性身高的均數(shù)為165cm,標(biāo)準(zhǔn)差為5cm,均符合正態(tài)分布。試?yán)L制頻數(shù)分布圖并比較二者的異同。 按上式計(jì)算x取不同值時(shí)的理論頻數(shù),結(jié)果見下表。 正態(tài)分布頻數(shù)計(jì)算表 男性 女性 x f(x) x f(x) 1461501541581621661701741781821861901940.0001600.0009620.0041810.0131120.0296610.0484070.0569920.0484070.0296610.0131120.0041810.0009620.000160147150153156159162165168171

4、1741771801830.0001220.0008860.0044790.0157900.0388370.0666450.0797880.0666450.0388370.0157900.0044790.0008860.000122一、正態(tài)分布(normal distribution)將表中頻數(shù)繪制成頻數(shù)分布圖 圖2-5 正態(tài)分布參數(shù)位置變化示意圖實(shí)例例1:中國(guó)成年人平均身高()男性=1.7米,女性=1.59米例2:正常人平均舒張壓值 =80(mmhg) 高血壓病平均舒張壓值 =100 (mmhg )圖2-6 正態(tài)分布變異度不同變化示意圖一、正態(tài)分布(normal distribution)

5、男女身高的頻數(shù)分布圖形的比較: 1.共同點(diǎn): 男女在不同身高的頻數(shù)分布均為完全對(duì)稱的鐘形分布,以均數(shù)所在處頻數(shù)最多,兩側(cè)逐漸減少。 2.不同點(diǎn): 位置不同,男性身高的均數(shù)大于女性,故圖形靠右; 高低不同,男性身高的方差大于女性,故變量值更分散,圖形更低平。 醫(yī)學(xué)上腦血管疾病的問題臨床發(fā)現(xiàn)腦中風(fēng)病人在腦血流圖(CBF)指標(biāo)偏低,正常人的CBF平均為75,標(biāo)準(zhǔn)差為17,如CBF低于40,認(rèn)為有中風(fēng)的危險(xiǎn)。如用CBF低于40為界限,問一個(gè)腦血流圖正常(無中風(fēng))被錯(cuò)誤診斷中風(fēng)的概率為多少?求:p(x40)的概率。二、正態(tài)分布曲線下的面積 如果以曲線下的總面積為1,則從-至x的面積可用下列積分公式求得:

6、 按上式求得的F(x)即當(dāng)隨機(jī)變量X取值范圍為-x時(shí)所對(duì)應(yīng)的正態(tài)曲線下的面積占總面積的比例,F(xiàn)(x)實(shí)際上反映了隨機(jī)變量X取值范圍為-x的概率大小,因此,稱該正態(tài)分布為隨機(jī)變量X的概率分布。 二、正態(tài)分布曲線下的面積 例 設(shè)某地成年男性身高的均數(shù)為170cm,標(biāo)準(zhǔn)差為7cm,假設(shè)該地共有成年男性10 000人,求該地身高不超過160cm者有多少人?又該地身高在160cm180cm之間者共有多少人? 正態(tài)分布曲線下面積的計(jì)算 二、正態(tài)分布曲線下的面積即:身高不超過160cm的人數(shù)為:10 0000.0764=764(人)身高在160cm180cm之間的人數(shù)為:10 000(0.9236-0.07

7、64)= 10 0000.8472= 8 472(人) 三、標(biāo)準(zhǔn)正態(tài)分布 由于不同隨機(jī)變量的概率分布不同,要求得隨機(jī)變量X取值范圍為-至x的概率需要經(jīng)過繁瑣的計(jì)算,從而給實(shí)際應(yīng)用帶來困難。 如果將任一正態(tài)分布轉(zhuǎn)化為同一個(gè)分布,則使問題大大簡(jiǎn)化。不同正態(tài)分布的差別在于其均數(shù)和標(biāo)準(zhǔn)差不同,如果把原來的隨機(jī)變量值用相對(duì)數(shù)值表示,就可以解決這一問題。 三、標(biāo)準(zhǔn)正態(tài)分布 將各變量值的離均差與標(biāo)準(zhǔn)差比較,即離均差是標(biāo)準(zhǔn)差的多少倍,此值稱標(biāo)準(zhǔn)單位(u),即該變量值在平均數(shù)之上或之下多少個(gè)標(biāo)準(zhǔn)差。 例如,如果某成年男性的身高為177cm,則離均差=177-170=7(cm),恰好等于標(biāo)準(zhǔn)差,其標(biāo)準(zhǔn)單位值為1,

8、即超過均數(shù)1個(gè)標(biāo)準(zhǔn)差。又如某成年男性的身高為156cm,其標(biāo)準(zhǔn)單位值為-2,即低于均數(shù)2個(gè)標(biāo)準(zhǔn)差。 三、標(biāo)準(zhǔn)正態(tài)分布 對(duì)于任一正態(tài)分布N(,2)作下列u變換: 則u值的分布為均數(shù)為0,標(biāo)準(zhǔn)差為1的正態(tài)分布,即標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution)。 由于正態(tài)分布以均數(shù)所在處頻數(shù)最多,兩側(cè)逐漸減少,左右完全對(duì)稱,故u值的均數(shù)為0。又由于以原變量值的標(biāo)準(zhǔn)差為單位,故u值的標(biāo)準(zhǔn)差為1 三、標(biāo)準(zhǔn)正態(tài)分布 u值的分布圖形為近似鐘形。如果以總頻數(shù)為1,不同u值時(shí)的頻數(shù)(相當(dāng)于概率)可用下式求得: 如果以曲線下的總面積為1,則從-至u的面積可用下列積分公式求得: 標(biāo)準(zhǔn)正態(tài)分

9、布u 值所對(duì)應(yīng)的概率和曲線下的面積 三、標(biāo)準(zhǔn)正態(tài)分布 由于標(biāo)準(zhǔn)正態(tài)分布只有唯一的1條曲線,我們可以把從-至u取不同值時(shí)所對(duì)應(yīng)的曲線的面積求出,列成表格(見表9-8 標(biāo)準(zhǔn)正態(tài)分布曲線下的面積),這樣我們就不需要面積的積分公式,避免了繁瑣的計(jì)算過程,從而能夠比較輕松地解決正態(tài)分布的問題。 三、標(biāo)準(zhǔn)正態(tài)分布 例 設(shè)某地成年男性身高的均數(shù)為170cm,標(biāo)準(zhǔn)差為7cm,假設(shè)該地共有成年男性10 000人,求該地身高不超過160cm者有多少人?又該地身高在160cm180cm之間者共有多少人? 對(duì)于本例的問題,采用標(biāo)準(zhǔn)正態(tài)分布來解決就簡(jiǎn)單多了。 首先,計(jì)算x1=160cm和x2=180cm時(shí)的u值:標(biāo)準(zhǔn)正

10、態(tài)分布曲線下面積的計(jì)算 三、標(biāo)準(zhǔn)正態(tài)分布查表9-8(標(biāo)準(zhǔn)正態(tài)分布曲線下的面積)得:(-1.43)=0.0764身高不超過160cm的人數(shù)=10 0000.0764=764(人)由于標(biāo)準(zhǔn)正態(tài)分布左右完全對(duì)稱,因此:(u)=1-(-u)(1.43)=1-0.0764=0.9236從u1至u2所對(duì)應(yīng)的曲線下的面積=1-2(-u) 故身高在160cm180cm之間的人數(shù)為: 10 000(1-20.0764)=8472(人) 正態(tài)分布的特征正態(tài)曲線在橫軸上方,且以均數(shù)所在處最高;越遠(yuǎn)離中心,曲線越接近X軸,曲線下的面積越小。正態(tài)分布以均數(shù)為中心,左右對(duì)稱;X取值范圍為-X, X離越遠(yuǎn), f(X)越小,

11、但不會(huì)等于0。 正態(tài)分布的特征正態(tài)分布有兩個(gè)參數(shù): (位置參數(shù)):決定曲線在X軸上的位置(見圖3-3)。 (變異參數(shù)):決定曲線的形態(tài)(見圖3-4)。 正態(tài)分布的特征正態(tài)分布曲線下的面積有一定規(guī)律 (見圖3-2)。 占95%的面積,即包含95% 的變量值占99%的面積,即包含99% 的變量值占68.27%的面積,即包含68.27%的變量值u= ( -1.96,1.96)區(qū)間內(nèi)面積同理:u=(-2.58,2.58)區(qū)間的面積為0.99例3:如規(guī)定尾部面積各為5%時(shí),其對(duì)應(yīng)的u值為多少? 解: u=1.65u0.05/2=1.96 (雙側(cè)) u0.01/2=2.58(雙側(cè))u0.05=1.64 (

12、單側(cè)) u0.01=2.33(單側(cè))統(tǒng)計(jì)中常用尾部面積為的u值,記 ,稱為u界值。表2-7 u界值表變量值分布 單側(cè) 雙側(cè)范圍(%) u值 u值80 0.84 1.2890 1.28 1.6495 1.64 1.9699 2.33 2.58變量值分布的范圍表達(dá)X占的百分比(%)68.2795.0099.00 任意正態(tài)分布變量值(X)理論上分布規(guī)律醫(yī)學(xué)常用的三個(gè)X 分布范圍及u界值(1)X值分布范圍四、正態(tài)分布的應(yīng)用(一)估計(jì)頻數(shù)分布(二)制定參考值范圍(三)質(zhì)量控制(四)正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)四、正態(tài)分布的應(yīng)用(三)利用正態(tài)分布進(jìn)行質(zhì)量控制 由于隨機(jī)測(cè)量誤差的分布符合以0為中心的正態(tài)

13、分布,假如對(duì)同一份樣品采用同樣的方法多次重復(fù)測(cè)定同一個(gè)指標(biāo),則所有測(cè)量值的分布符合以真實(shí)值為中心的正態(tài)分布。實(shí)驗(yàn)室檢測(cè)質(zhì)量控制 在實(shí)驗(yàn)室檢測(cè)質(zhì)量控制中,通常以 作為上下警戒值,以 作為上下控制值。這里2s和3s分別作為1.96s和2.58s的近似值。如果某個(gè)測(cè)量值超出了警戒值,該值與真實(shí)值之差僅由隨機(jī)測(cè)量誤差所致的可能性小于5%,這時(shí)需要對(duì)儀器、試劑等進(jìn)行檢查和校正,以消除可能導(dǎo)致系統(tǒng)誤差的因素。如果某個(gè)測(cè)量值超出了控制線,該值與真實(shí)值之差僅由隨機(jī)測(cè)量誤差所致的可能性小于1%(具體地說是0.26%),可以認(rèn)為存在系統(tǒng)誤差,該測(cè)量值應(yīng)當(dāng)舍棄。 實(shí)驗(yàn)室檢測(cè)質(zhì)量控制質(zhì)量控制圖 (示意) 實(shí)驗(yàn)室檢測(cè)質(zhì)

14、量控制 臨床實(shí)驗(yàn)室檢測(cè)的質(zhì)量控制也可以采用正常值均數(shù)質(zhì)控圖來進(jìn)行。以血糖測(cè)定為例,根據(jù)大量正常血糖測(cè)量值計(jì)算得: =5.10 mmol/L,s =0.51 mmol/L,并繪制質(zhì)控圖。然后,在每天工作結(jié)束時(shí),從當(dāng)天測(cè)量結(jié)果在正常范圍內(nèi)的測(cè)量值中連續(xù)抄錄510個(gè)值并計(jì)算均數(shù),觀察該均數(shù)是否超出警戒線或控制線。 實(shí)驗(yàn)室檢測(cè)質(zhì)量控制血糖測(cè)定的正常值均數(shù)質(zhì)控圖 四、正態(tài)分布的應(yīng)用(四)正態(tài)分布是許多統(tǒng)計(jì)方法的理論基礎(chǔ)1.其它一些分布在一定條件下也可以按正態(tài)分布做近似計(jì)算。如二項(xiàng)分布、泊松分布的極限形式就是正態(tài)分布。2.統(tǒng)計(jì)學(xué)中一些分布就是由正態(tài)分布推導(dǎo)出的,如統(tǒng)計(jì)學(xué)中常用的三大分布2分布、t 分布、F

15、分布等。3.許多資料都可經(jīng)過轉(zhuǎn)換成近似正態(tài)分布10、正常值范圍 一、正常值的意義和制定步驟 正常參考值范圍(normal reference ranges)是指正常人群中一些解剖、生理、生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)的正常波動(dòng)范圍 。 個(gè)體差異 生理變異二、醫(yī)學(xué)參考值制定時(shí)注意問題1.確定診斷指標(biāo)為“定性”或“定量”2.計(jì)量數(shù)據(jù)要確定其分布(正態(tài)或偏態(tài))3.計(jì)量資料考慮制定單側(cè)診斷界值還是雙側(cè)診斷界值4.有足夠的樣本例數(shù)(一般不低于100例) 1.從正常人總體中隨機(jī)抽樣 這里的“正常人”并非是指沒有任何疾病的人,只要排除那些對(duì)所研究指標(biāo)有影響的疾病或有關(guān)因素的人即可。例如,制定血壓正常值范圍

16、時(shí),應(yīng)將高血壓病人及相關(guān)疾病的患者排除于研究對(duì)象之外,同時(shí),研究對(duì)象在研究期間內(nèi)不能有對(duì)血壓有影響的因素,如情緒激動(dòng)、大量運(yùn)動(dòng)等,也不能服用對(duì)血壓有影響的藥物。 另外,樣本量要足夠,每個(gè)人群組在100例以上。2.控制測(cè)量誤差 測(cè)量方法、儀器、試劑、精密度、操作熟練程度等應(yīng)統(tǒng)一。 一般應(yīng)選用測(cè)量結(jié)果準(zhǔn)確、可靠,并能為大多數(shù)醫(yī)療單位采用的檢測(cè)儀器或方法。3.明確所研究指標(biāo)的總體分布:(1)是否正態(tài)分布:正態(tài)檢驗(yàn)(2)是否通過數(shù)據(jù)轉(zhuǎn)換后成為近似正態(tài)分布(3)是否需要分組制定參考值范圍,如男女紅細(xì)胞分布不同,(4)再考慮其它方法:偏態(tài)時(shí),用百分位數(shù)4.確定采用單側(cè)界值還是雙側(cè)界值 如果該指標(biāo)升高或降低

17、均有病理學(xué)意義,則需要制定雙側(cè)界值,如紅細(xì)胞數(shù)、白細(xì)胞數(shù)等; 如果該指標(biāo)升高時(shí)有病理學(xué)意義,而降低時(shí)無意義,只需要制定一個(gè)正常值上限,如尿鉛值; 如果該指標(biāo)降低時(shí)有病理學(xué)意義,而升高時(shí)無意義,只需要制定一個(gè)正常值下限,如肺活量。 5.選定適當(dāng)?shù)陌俜纸缦?即確定發(fā)生錯(cuò)誤的概率()。一般取=0.05,即95%正常值范圍,該范圍將包含95%的正常觀察值,也就是說有5%的正常觀察值將被排除于該范圍之外。 如果臨床上要求盡量減少誤診,則應(yīng)取較高的百分界限,如95%或99%;如果臨床上要求盡量減少漏診,則應(yīng)取較低的百分界限,如90%或80%。三、正常值范圍的正態(tài)分布法 如果所研究指標(biāo)的總體分布符合正態(tài)分布

18、或近似于正態(tài)分布,可根據(jù)正態(tài)分布曲線下的面積分布規(guī)律,計(jì)算包含95%的觀察值范圍,即為95%正常值范圍。計(jì)算公式為:三、正常值范圍的正態(tài)分布法 表3-3 正態(tài)分布法計(jì)算醫(yī)學(xué)參考值范圍百分范圍(%)單側(cè)雙側(cè)下限上限下限上限9599如果所研究指標(biāo)的總體分布符合正態(tài)分布或近似于正態(tài)分布,可根據(jù)正態(tài)分布曲線下的面積分布規(guī)律,單雙側(cè)正常值范圍示意圖 例 已知健康人群中血糖含量的頻數(shù)分布近似于正態(tài)分布,今測(cè)定某地健康成人500名,得血糖均數(shù)為5.10 mmol/L,標(biāo)準(zhǔn)差為0.51 mmol /L,試估計(jì)該地健康成人血糖含量95%正常值范圍。 本例需計(jì)算雙側(cè)正常值范圍:上限: = 5.10+1.960.51=4.10(mmol/L)下限: = 5.10-1.960.51=6.10(mmol/L)即估計(jì)該地健康成人血糖含量95%正常值范圍為: 4.106.10 mmol/L。 正常值范圍的估計(jì)方法對(duì)數(shù)正態(tài)分布法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論