衛(wèi)生統(tǒng)計學(xué)-緒論課件

上傳人：小*** IP屬地：江蘇上傳時間：2022-09-19 格式：PPT 頁數(shù)：100 大?。?.73MB 積分：40 舉報 版權(quán)申訴

已閱讀5頁，還剩95頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、衛(wèi)生統(tǒng)計學(xué)劉金輝寶坻區(qū)疾病預(yù)防控制中心第一章緒論統(tǒng)計學(xué)概念：統(tǒng)計學(xué)是處理數(shù)據(jù)中變異性的科學(xué)與藝術(shù)，內(nèi)容包括數(shù)據(jù)的收集、分析、解釋和表達(dá)，目的是求得可靠的結(jié)果。以往教材中概念：是研究數(shù)據(jù)的收集、整理、分析和推斷的一門科學(xué)。第一節(jié) 概述根據(jù)研究領(lǐng)域和研究對象的不同，統(tǒng)計學(xué)又分為：數(shù)理統(tǒng)計、經(jīng)濟(jì)統(tǒng)計、生物統(tǒng)計、衛(wèi)生統(tǒng)計、醫(yī)學(xué)統(tǒng)計醫(yī)學(xué)統(tǒng)計學(xué)（medical statistics）：用統(tǒng)計學(xué)的原理和方法研究醫(yī)學(xué)中的問題。衛(wèi)生統(tǒng)計學(xué)（health statistics）：與醫(yī)學(xué)統(tǒng)計學(xué)基本相同，但更側(cè)重于社會、人群的衛(wèi)生問題。采用統(tǒng)計學(xué)方法，發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。變異是個體間

2、存在的差異，是絕對的，是社會和生物醫(yī)學(xué)中的普遍現(xiàn)象。變異使得實驗或觀察的結(jié)果具有不確定性，如每個人的身高、體重、血壓等各有不同。為什么要學(xué)習(xí)統(tǒng)計學(xué)？2. 用統(tǒng)計學(xué)思維方式考慮有關(guān)醫(yī)學(xué)研究中的問題 “陽性”結(jié)果是否是虛假聯(lián)系？某感冒藥治療1周后，治愈率為90%，能否說該感冒藥十分有效？ “陰性”結(jié)果是否是樣本含量不足？有人曾對發(fā)表在Lancet, N Engl J Med，JAMA等著名醫(yī)學(xué)雜志上的71篇陰性結(jié)果的論文作過分析，發(fā)現(xiàn)其中有62篇（ 93%）可能是由于樣本含量不足造成的假陰性。3. 保證你的研究論文能通過統(tǒng)計學(xué)審查據(jù)國外6080年代對不同醫(yī)學(xué)雜志發(fā)表論文的調(diào)查，有統(tǒng)計錯誤

3、的論文的百分比最高達(dá)72%，最低也有20%。國內(nèi)1984年對中華醫(yī)學(xué)雜志、中華內(nèi)科雜志、中華外科雜志、中華婦產(chǎn)科雜志、中華兒科雜志595篇論文的調(diào)查結(jié)果，相對數(shù)誤用為11.2%，抽樣方法誤用15.9%，統(tǒng)計圖表誤用11.7%。某研究者1996年對4586篇論文統(tǒng)計（中華醫(yī)學(xué)會系列雜志僅占6.9%），數(shù)據(jù)分析方法誤用達(dá)55.7%。第二節(jié) 醫(yī)學(xué)統(tǒng)計工作內(nèi)容及資料類型一、原始統(tǒng)計數(shù)據(jù)的來源：常規(guī)保存數(shù)據(jù)醫(yī)院信息系統(tǒng)（HIS）、統(tǒng)計報表等2. 現(xiàn)場調(diào)查記錄3. 實驗記錄4. 其他一、研究設(shè)計二、搜集資料三、整理資料四、分析資料五、結(jié)果表達(dá)二、統(tǒng)計工作的內(nèi)容設(shè)計的內(nèi)容包括資料的收集、整理和分析全過程

4、的設(shè)想和安排。常有：1.調(diào)查設(shè)計（survey design）對研究對象不施加任何干預(yù)，通常建立隨機抽樣（random sampling）方案。2.實驗設(shè)計（experiment design）對研究對象施加干預(yù)，如動物實驗研究、臨床試驗，通常建立隨機分組（random allocation）方案。（一）、研究設(shè)計（二）、收集資料收集資料要遵循完整、準(zhǔn)確、及時三個原則。衛(wèi)生工作中統(tǒng)計資料主要來源于三個方面： 1.統(tǒng)計報表：由國家統(tǒng)一設(shè)計，要求醫(yī)療衛(wèi)生機構(gòu) 定期逐級上報。如傳染病防治法。 2.經(jīng)常性工作記錄：如經(jīng)常性衛(wèi)生監(jiān)測記錄等。 3.專題調(diào)查和實驗：我們常把前兩個來源稱經(jīng)常性資料，后者

5、稱為一時性資料。（三）、整理資料目的是將搜集到的原始資料系統(tǒng)化、條理化，便于進(jìn)一步計算與分析。編碼，將數(shù)據(jù)輸入計算機糾錯改錯、補漏等（五）、結(jié)果表達(dá)使用的統(tǒng)計學(xué)方法使用的統(tǒng)計學(xué)軟件（SAS、SPSS）假設(shè)檢驗的統(tǒng)計量、P值等結(jié)論三、資料的類型: 只有認(rèn)識了數(shù)據(jù)的特點，才能正確地選用統(tǒng)計分析方法基本概念：變量及變量值研究者對每個觀察單位的某項特征進(jìn)行觀察和測量，這種特征稱為變量，變量的測得值叫變量值（也叫觀察值），全部變量值的集合也稱為資料。按變量值的性質(zhì)可將資料分為：計量資料計數(shù)資料等級分組資料1.計量資料（定量資料、數(shù)值變量）定義：通過度量衡的方法，測量每一個觀察單位的某項研究

6、指標(biāo)的量的大小，得到的一系列數(shù)據(jù)資料。例如：體重與身高特點：表現(xiàn)為數(shù)值大小有度量衡單位多為連續(xù)性資料 (通過測量得到)定義：將全體觀測單位按照某種性質(zhì)或特征分組，然后再分別清點各組觀察單位的個數(shù)。特點：沒有度量衡單位多為間斷性資料（通過枚舉或記數(shù)得來）可分為二項與多項定性資料2. 定性資料（分類資料、分類變量）定義：介于計量資料和計數(shù)資料之間的一種資料，通過半定量方法測量得到。特點：每一個觀察單位沒有確切值各組之間有性質(zhì)上的差別或程度上的不同。示例：檢查尿蛋白，觀察單位是每一份尿標(biāo)本，按結(jié)果等級不同可分為、、等。3. 等級分組資料（有序變量）三類數(shù)據(jù)間的關(guān)系例：一

7、組2040歲成年人的血壓（變量）以12kPa為界分為正常與異常兩組，統(tǒng)計每組例數(shù) 8 低血壓 8 正常血壓 12 輕度高血壓 15 中度高血壓 17 重度高血壓定量數(shù)據(jù)等級數(shù)據(jù)定性數(shù)據(jù)三類數(shù)據(jù)的編碼與計算(1) 例：一組2040歲成年人的血壓以12kPa為界分為正常（0）與異常（1）兩組，統(tǒng)計每組例數(shù) 單純隨機抽樣系統(tǒng)抽樣分層抽樣（2）增加樣本量n ；（3）選擇變異程度較小的研究指標(biāo)。減少抽樣誤差的方法:頻率：樣本的實際發(fā)生率稱為頻率。設(shè)在相同條件下，獨立重復(fù)進(jìn)行n次試驗，事件A出現(xiàn)m次，則事件A出現(xiàn)的頻率為f = m /n。概率：隨機事件發(fā)生的可能性大小，用大寫的P 表示；取值0，

8、1。 5、頻率與概率必然事件 P = 1隨機事件 0 P 1不可能事件 P = 0 統(tǒng)計學(xué)上把P 0.05（5）或P 0.01（1）稱為小概率事件(習(xí)慣) ，認(rèn)為不大可能發(fā)生。CertainImpossible0.501通常我們把經(jīng)常遇到的事件分為三種類型:頻率與概率間的關(guān)系： 1. 樣本頻率總是圍繞概率上下波動； 2. 樣本含量n越大，波動幅度越小，頻率越接近概率。6、參數(shù)與統(tǒng)計量（parameter and statistic）參數(shù)：總體的統(tǒng)計指標(biāo)，如總體均數(shù)、總體標(biāo)準(zhǔn)差，分別用希臘字母記為、。固定的常數(shù) 總體樣本抽取部分觀察單位統(tǒng)計量參數(shù) 推斷inference統(tǒng)計量：樣本

9、的統(tǒng)計指標(biāo)，如樣本均數(shù)、標(biāo)準(zhǔn)差，采用拉丁字母分別記為。參數(shù)附近波動的隨機變量。第二章集中趨勢的統(tǒng)計描述主要內(nèi)容2.1 頻數(shù)分布2.2 平均數(shù) 第一節(jié) 頻數(shù)分布表9-1 2002年某市150名正常成年男子的尿酸濃度（mol/L） 142.3 148.8 142.7 144.4 144.7 145.1 143.3 154.2 152.3 142.7 156.6 137.9 143.9 141.2 139.3 145.8 142.2 137.9 141.2 150.6 142.7 151.3 142.4 141.5 141.9 147.9 125.9 139.9 148.9 154.9 1

10、45.7 140.8 139.6 148.8 147.8 146.7 132.7 149.7 154.0 158.2 138.2 149.8 151.1 140.1 140.5 143.4 152.9 147.5 147.7 162.6 141.6 143.6 144.0 150.6 138.9 150.8 147.9 136.9 146.5 130.6 142.5 149.0 145.4 139.5 148.9 144.5 141.8 148.1 145.4 134.6 130.5 145.2 146.2 146.4 142.4 137.1 141.4 144.0 129.4 142.8 1

11、32.1 141.8 143.3 143.8 134.7 147.1 140.9 137.4 142.5 146.6 135.5 146.8 156.3 150.0 147.3 142.9 141.4 134.7 138.5 146.6 134.5 135.1 141.9 142.1 138.1 134.9 146.7 138.5 139.6 139.2 148.8 150.3 140.7 143.5 140.2 143.6 138.7 138.9 143.5 139.9 134.4 133.1 145.9 139.2 137.4 142.3 160.9 137.7 142.9 126.8 頻

12、數(shù)分布及其制作對某個隨機事件進(jìn)行重復(fù)觀察，其中某變量值出現(xiàn)的次數(shù)被稱作頻數(shù)。當(dāng)匯總大量的原始數(shù)據(jù)時，把數(shù)據(jù)按類型分組，其中每個組的數(shù)據(jù)個數(shù)，稱為該組的頻數(shù)。頻數(shù)表是用于反映各組及其相對應(yīng)的組頻數(shù)之間的關(guān)系。頻數(shù)表的制作步驟如下,以例2.1為例： 1. 計算極差R(最大值和最小值的差值) 本例中R=5.95-3.82=2.13 (1012/L ) 2. 決定組數(shù)(10-15組,最常用10-12組) 3. 計算組距i (等于極差與組數(shù)的比值,取整數(shù)和取偶數(shù)的原則) 本例中i=2.13/10=0.213 1012/L ，取整數(shù)等于0.2 1012/L 寫組段(第一組段應(yīng)包含最小值,最后一組

13、段包含最大值,每個組段為前閉后開區(qū)間,最后一個組段為閉區(qū)間。也應(yīng)遵循取整數(shù)和偶數(shù)的原則) 本例中第一組段應(yīng)包含最小值3.82，取3.80為第一組段的下限，寫為前閉后開區(qū)間，3.80。最后一組段應(yīng)包括最大值,寫為閉區(qū)間5.806.00。5. 列表劃記(組段和頻數(shù)是頻數(shù)表的基本要素)表2-2 某地140名正常男子紅細(xì)胞數(shù)的頻數(shù)表（ 1012/ L）圖 2-1 140名正常男子紅細(xì)胞數(shù)頻數(shù)分布的直方圖對頻數(shù)表和圖的觀察，可以看出兩個重要特征： 1.集中趨勢：平均水平,向中間集中,中等數(shù)據(jù)的人數(shù)最多。 2.離散趨勢：變異水平,即隨著紅細(xì)胞數(shù)測量值逐漸變大或變小，人數(shù)越來越少,向兩端分散。頻數(shù)表的主要

14、用途1.作為陳述資料的形式,可以替代繁雜的原始資料，便于進(jìn)一步分析2.便于觀察數(shù)據(jù)的分布類型3.便于發(fā)現(xiàn)資料中某些遠(yuǎn)離群體的特大或特小的可疑值4.當(dāng)樣本含量比較大時,可用各組段的頻率作為概率的估計值5. 計算集中趨勢指標(biāo)與離散趨勢指標(biāo)數(shù)據(jù)的分布類型對稱分布和不對稱分布正態(tài)分布：圖形中間的直條最高，高峰在中央，兩邊對稱或基本對稱地減少。偏態(tài)分布：若高峰不在中央，而位于一側(cè)。若高峰位于左側(cè)，稱正偏態(tài)分布，如高峰位于右側(cè)，稱負(fù)偏態(tài)分布。對數(shù)據(jù)的描述指標(biāo)也分為兩類：描述集中趨勢或平均水平的指標(biāo)。2. 描述離散趨勢或變異水平的指標(biāo)。第二節(jié) 平均數(shù)常用幾種平均值：1.算術(shù)均數(shù)2.幾何均數(shù)3.中位數(shù) 集

15、中趨勢常用平均值來描述。平均值是一組數(shù)據(jù)的典型或有代表性的值。由于這樣典型的值趨向于落在根據(jù)數(shù)據(jù)大小排列的數(shù)據(jù)的中心，因此可以用于度量集中位置（位置指標(biāo)）算術(shù)平均數(shù)（簡稱為均數(shù)）一、定義：一組已知性質(zhì)相同的數(shù)值之和除以數(shù)值個數(shù)所得的商。以（總體）（樣本）表示。二、特征：（X- ）=0 估計誤差之和為0。三、適用資料類型： 1.描述正態(tài)分布和近似正態(tài)分布資料集中趨勢的最好指標(biāo)。 2. 適用于大多數(shù)正常人的生理、生化指標(biāo)。四、計算方法： 1.直接法 2.加權(quán)法直接法適用條件：當(dāng)觀察例數(shù)不多時，或觀察例數(shù)雖然很多，但有計算機及統(tǒng)計軟件，宜選擇直接法。式（2-1）例2.1

16、見書P10 加權(quán)法適用條件：當(dāng)無原始數(shù)據(jù)或觀察例數(shù)很多又缺乏計算機及統(tǒng)計軟件時，若用直接法很容易出錯，可以用加權(quán)法處理。式（2-2）利用表2-2資料，用加權(quán)法計算140名正常男子紅細(xì)胞數(shù)濃度的均數(shù)，計算見表1表1 某地140名正常男子紅細(xì)胞數(shù)均數(shù)和標(biāo)準(zhǔn)差（ 1012/ L ）加權(quán)法計算用表加權(quán)法計算的結(jié)果根據(jù)表1得： =669.80/140=4.78（ 1012/ L ）而將該資料輸入計算機用統(tǒng)計軟件和直接法計算，得到均數(shù)為4.77 (1012/ L) 。由此可見，加權(quán)法得到的均數(shù)是近似值，但這種算法的近似程度很好。算術(shù)平均數(shù)有如下特征：（1）對于以定量化測量所得的計量數(shù)據(jù)存在唯一的均

17、數(shù)。（2）樣本均數(shù)具有抽樣的穩(wěn)定性與對總體均數(shù)的可估性特征；能方便地作進(jìn)一步計算分析。（3）均數(shù)對極值特別敏感，極大值或極小值通常將均數(shù)拉向自己。（4）每個變量值到均數(shù)距離的和為零。（5）每個變量值到均數(shù)距離的平方和為最小。幾何均數(shù)一、定義：將n個觀察值x的乘積再開n次方所得的根，用G表示。二、適用條件： 1、當(dāng)一組觀察值不呈正態(tài)分布、且其差距較大時，用均數(shù)表示其平均水平會受少數(shù)特大或特小值影響； 2、原始數(shù)據(jù)分布不對稱，觀察值呈倍數(shù)關(guān)系或近似倍數(shù)關(guān)系，經(jīng)對數(shù)變換后呈正態(tài)分布的資料，又稱對數(shù)正態(tài)分布資料。 3、免疫學(xué)或微生物學(xué)領(lǐng)域中的某些指標(biāo)，如抗體滴度、藥物的平均效價等。直接法適用條

18、件：當(dāng)觀察例數(shù)不多時，宜選擇直接法。式（2-3）例2.2見書P11 加權(quán)法適用條件：當(dāng)觀察例數(shù)較多或無原始數(shù)據(jù)，僅有頻數(shù)表資料時，宜選擇加權(quán)法。式（2-4）例2.3 見書P11 表2-3 胎盤浸液鉤端螺旋體菌苗接種兩個月后血清IgG抗體滴度的計算用表G=lg-1(698.9792/326)=139該地326名農(nóng)民胎盤浸液鉤端螺旋體菌苗接種兩個月后血清IgG抗體的平均滴度為：1：139 幾何均數(shù)的特征：（1）變量x服從對數(shù)正態(tài)分布，即表示變量log(x)服從正態(tài)分布。幾何均數(shù)用以描述一群服從對數(shù)正態(tài)分布的測量值在對數(shù)量值上的集中性特征與平均水平。（2）變量x在取對數(shù)后的log(x)

19、具有算術(shù)均數(shù)的所有特征。中位數(shù)（Median）和百分位數(shù) 一、定義：中位數(shù)是把一組觀察值，按大小順序排列，位置居中的那個數(shù)值。中位數(shù)是一個位置指標(biāo)，它將所有觀察值分為兩個相同的部分，各占除中位數(shù)以外的觀察值的百分之五十。用M表示。百分位數(shù)也是一個位置指標(biāo)，先把一組數(shù)據(jù)從小到大排列，將數(shù)據(jù)中的所有觀察值看成一個整體，即100%。則百分位數(shù)將自身以外的觀察值分成了兩個部分，其中有x%的觀察值比它小，而（100-x）%的個體具有比它大的觀察值。中位數(shù)就是一個特殊的百分位數(shù)，即50。中位數(shù)和百分位數(shù) 二、適用資料：偏態(tài)分布的資料開口資料分布未明的資料某些毒物指標(biāo)，如血鉛，發(fā)汞值；某

20、些傳染病或食物中毒的潛伏期；生存時間等中位數(shù)和百分位數(shù) 三、計算方法：直接法：適用于有原始數(shù)據(jù)；樣本例數(shù)不太多；容易將原始數(shù)據(jù)排序。頻數(shù)表法Take Median for example (n=odd number)100%X1 X2 X3 X4 X5 X6 X7X4Median(P50)50%(100-50)%=50%結(jié)論：Median=X4中位數(shù)的計算公式直接法：當(dāng)n=奇數(shù)時，中位數(shù)即為第（n+1）/2位的數(shù)值例1見書P12Take Median for example (n=even number)100% X1 X2 X3 X4 X5 X6 X7 X8Median(P5

21、0)50%(100-50)%=50%結(jié)論：Median=1/2(X4+X5)X4 X5中位數(shù)的計算公式直接法：當(dāng)n=偶數(shù)時，中位數(shù)并非直接對應(yīng)某一數(shù)值，而是在兩個數(shù)值之間，于是，取與中點位置相鄰的兩個變量值的算術(shù)平均數(shù)為中位數(shù)。例1見書12Px的含義100%X1 X2 X3 X4 Xn-2 Xn-1 Xn(100-X)%結(jié)論：Pxis a limit value or position indexX%PX 頻數(shù)表法適用于：無原始數(shù)據(jù)，只有頻數(shù)表提供的信息；原始數(shù)據(jù)太多，排序比較麻煩此計算公式的前提條件為：假設(shè)觀察值在每個組段內(nèi)是均勻分布的。表2 健康男子血清鉛的濃度組距為5 （mol/L）血清鉛水平頻數(shù) 累計頻數(shù) 累計頻率（mol/L） 0 18 18 0.0796 5 51 69 0.3053 10 43 106 0.4690 15 36 142 0.6283 20 30 172 0.7611 25 26 198 0.8761 30 14 212 0.9381 35 6 218 0.9646 40 3 221 0.9779 45 3 224 0.9912 50 1 225 0.9956 55 0 225 0.9956 60 1 226 1.0000PX所在組段的下限PX所在組段的頻數(shù)PX所在組段的組距PX所在組段前一組段的累計頻

人人文庫> 全部分類> 行業(yè)資料 > 醫(yī)學(xué)制藥

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

衛(wèi)生統(tǒng)計學(xué)-緒論課件

文檔簡介

溫馨提示

最新文檔

評論

衛(wèi)生統(tǒng)計學(xué)-緒論課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔