版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、衛(wèi)生統(tǒng)計學(xué)劉金輝寶坻區(qū)疾病預(yù)防控制中心 第一章 緒 論統(tǒng)計學(xué)概念:統(tǒng)計學(xué)是處理數(shù)據(jù)中變異性的科學(xué)與 藝術(shù),內(nèi)容包括數(shù)據(jù)的收集 、 分析、 解釋和表達(dá),目的是求得可靠的結(jié)果。 以往教材中概念:是研究數(shù)據(jù)的收集、整 理、分析和推斷的一門科學(xué)。第一節(jié) 概述 根據(jù)研究領(lǐng)域和研究對象的不同,統(tǒng)計學(xué)又分為:數(shù)理統(tǒng)計、經(jīng)濟(jì)統(tǒng)計、生物統(tǒng)計、衛(wèi)生統(tǒng)計、醫(yī)學(xué)統(tǒng)計醫(yī)學(xué)統(tǒng)計學(xué)(medical statistics):用統(tǒng)計學(xué)的原理和方法研究醫(yī)學(xué)中的問題。衛(wèi)生統(tǒng)計學(xué)(health statistics):與醫(yī)學(xué)統(tǒng)計學(xué)基本相同,但更側(cè)重于社會、人群的衛(wèi)生問題。 采用統(tǒng)計學(xué)方法,發(fā)現(xiàn)不確定現(xiàn)象背后隱藏的規(guī)律。 變異是個體間
2、存在的差異,是絕對的,是社會和生物醫(yī)學(xué)中的普遍現(xiàn)象。 變異使得實驗或觀察的結(jié)果具有不確定性,如每個人的身高、體重、血壓等各有不同。 為什么要學(xué)習(xí)統(tǒng)計學(xué)?2. 用統(tǒng)計學(xué)思維方式考慮有關(guān)醫(yī)學(xué)研究中的問題 “陽性”結(jié)果是否是虛假聯(lián)系? 某感冒藥治療1周后,治愈率為90%,能否說該感冒藥十分有效? “陰性”結(jié)果是否是樣本含量不足? 有人曾對發(fā)表在Lancet, N Engl J Med,JAMA等著名醫(yī)學(xué)雜志上的71篇陰性結(jié)果的論文作過分析,發(fā)現(xiàn)其中有62篇( 93%)可能是由于樣本含量不足造成的假陰性。3. 保證你的研究論文能通過統(tǒng)計學(xué)審查 據(jù)國外6080年代對不同醫(yī)學(xué)雜志發(fā)表論文的調(diào)查,有統(tǒng)計錯誤
3、的論文的百分比最高達(dá)72%,最低也有20%。國內(nèi)1984年對中華醫(yī)學(xué)雜志、中華內(nèi)科雜志、中華外科雜志、中華婦產(chǎn)科雜志、中華兒科雜志595篇論文的調(diào)查結(jié)果,相對數(shù)誤用為11.2%,抽樣方法誤用15.9%,統(tǒng)計圖表誤用11.7%。某研究者1996年對4586篇論文統(tǒng)計(中華醫(yī)學(xué)會系列雜志僅占6.9%),數(shù)據(jù)分析方法誤用達(dá)55.7%。第二節(jié) 醫(yī)學(xué)統(tǒng)計工作內(nèi)容及資料類型一、原始統(tǒng)計數(shù)據(jù)的來源:常規(guī)保存數(shù)據(jù)醫(yī)院信息系統(tǒng)(HIS)、統(tǒng)計報表等2. 現(xiàn)場調(diào)查記錄3. 實驗記錄4. 其他 一、研究設(shè)計二、搜集資料三、整理資料四、分析資料五、結(jié)果表達(dá)二、統(tǒng)計工作的內(nèi)容 設(shè)計的內(nèi)容包括資料的收集、整理和分析全過程
4、的設(shè)想和安排。常有:1.調(diào)查設(shè)計(survey design)對研究對象不施加任何干預(yù),通常建立隨機抽樣(random sampling)方案。2.實驗設(shè)計(experiment design)對研究對象施加干預(yù),如動物實驗研究、臨床試驗,通常建立隨機分組(random allocation)方案。(一)、研究設(shè)計 (二)、收集資料 收集資料要遵循完整、準(zhǔn)確、及時三個原則。 衛(wèi)生工作中統(tǒng)計資料主要來源于三個方面: 1.統(tǒng)計報表:由國家統(tǒng)一設(shè)計,要求醫(yī)療衛(wèi)生機構(gòu) 定期逐級上報。如傳染病防治法。 2.經(jīng)常性工作記錄:如經(jīng)常性衛(wèi)生監(jiān)測記錄等。 3.專題調(diào)查和實驗:我們常把前兩個來源稱經(jīng)常性資料,后者
5、稱為一時性資料。(三)、整理資料 目的是將搜集到的原始資料系統(tǒng)化、條理化,便于進(jìn)一步計算與分析。編碼,將數(shù)據(jù)輸入計算機糾錯改錯、補漏等(五)、結(jié)果表達(dá)使用的統(tǒng)計學(xué)方法使用的統(tǒng)計學(xué)軟件(SAS、SPSS)假設(shè)檢驗的統(tǒng)計量、P值等結(jié)論三、資料的類型: 只有認(rèn)識了數(shù)據(jù)的特點,才 能正確地選用統(tǒng)計分析方法 基本概念:變量及變量值 研究者對每個觀察單位的某項特征進(jìn)行觀察和測量,這種特征稱為變量,變量的測得值叫變量值(也叫觀察值),全部變量值的集合也稱為資料。按變量值的性質(zhì)可將資料分為: 計量資料 計數(shù)資料 等級分組資料1.計量資料(定量資料、數(shù)值變量)定義:通過度量衡的方法,測量每一個觀察單位的某項研究
6、指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。例如:體重與身高特點:表現(xiàn)為數(shù)值大小 有度量衡單位 多為連續(xù)性資料 (通過測量得到)定義:將全體觀測單位按照某種性質(zhì)或特征 分組,然后再分別清點各組觀察單位 的個數(shù)。特點:沒有度量衡單位 多為間斷性資料 (通過枚舉或記數(shù)得來)可分為二項與多項定性資料2. 定性資料(分類資料、分類變量)定義: 介于計量資料和計數(shù)資料之間的一種資 料,通過半定量方法測量得到。特點: 每一個觀察單位沒有確切值 各組之間有性質(zhì)上的差別或程度上的不 同。示例: 檢查尿蛋白,觀察單位是每一份尿標(biāo)本, 按結(jié)果等級不同可分為、 、等。3. 等級分組資料(有序變量)三類數(shù)據(jù)間的關(guān)系 例:一
7、組2040歲成年人的血壓(變量)以12kPa為界分為正常與異常兩組,統(tǒng)計每組例數(shù) 8 低血壓 8 正常血壓 12 輕度高血壓 15 中度高血壓 17 重度高血壓定量數(shù)據(jù)等級數(shù)據(jù)定性數(shù)據(jù)三類數(shù)據(jù)的編碼與計算(1) 例:一組2040歲成年人的血壓以12kPa為界分為正常(0)與異常(1)兩組,統(tǒng)計每組例數(shù) 單純隨機抽樣系統(tǒng)抽樣分層抽樣(2) 增加樣本量n ;(3)選擇變異程度較小的研究指標(biāo)。減少抽樣誤差的方法:頻率:樣本的實際發(fā)生率稱為頻率。設(shè)在相 同條件下,獨立重復(fù)進(jìn)行n次試驗, 事件A出現(xiàn)m次,則事件A出現(xiàn)的頻率 為f = m /n。概率:隨機事件發(fā)生的可能性大小,用大寫 的P 表示;取值0,
8、1。 5、頻率與概率 必然事件 P = 1隨機事件 0 P 1不可能事件 P = 0 統(tǒng)計學(xué)上把P 0.05(5)或P 0.01(1)稱為小概率事件(習(xí)慣) ,認(rèn)為不大可能發(fā)生。CertainImpossible0.501通常我們把經(jīng)常遇到的事件分為三種類型:頻率與概率間的關(guān)系: 1. 樣本頻率總是圍繞概率上下波動; 2. 樣本含量n越大,波動幅度越小,頻 率越接近概率。6、 參數(shù)與統(tǒng)計量 (parameter and statistic)參數(shù):總體的統(tǒng)計指標(biāo),如總體均數(shù)、總體標(biāo)準(zhǔn)差,分別用希臘字母記為、。固定的常數(shù) 總體樣本抽取部分觀察單位 統(tǒng)計量 參 數(shù) 推斷inference統(tǒng)計量:樣本
9、的統(tǒng)計指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉丁字母分別記為 。 參數(shù)附近波動的隨機變量 。第二章 集中趨勢的統(tǒng)計描述主要內(nèi)容2.1 頻數(shù)分布2.2 平均數(shù) 第一節(jié) 頻數(shù)分布 表9-1 2002年某市150名正常成年男子的尿酸濃度(mol/L) 142.3 148.8 142.7 144.4 144.7 145.1 143.3 154.2 152.3 142.7 156.6 137.9 143.9 141.2 139.3 145.8 142.2 137.9 141.2 150.6 142.7 151.3 142.4 141.5 141.9 147.9 125.9 139.9 148.9 154.9 1
10、45.7 140.8 139.6 148.8 147.8 146.7 132.7 149.7 154.0 158.2 138.2 149.8 151.1 140.1 140.5 143.4 152.9 147.5 147.7 162.6 141.6 143.6 144.0 150.6 138.9 150.8 147.9 136.9 146.5 130.6 142.5 149.0 145.4 139.5 148.9 144.5 141.8 148.1 145.4 134.6 130.5 145.2 146.2 146.4 142.4 137.1 141.4 144.0 129.4 142.8 1
11、32.1 141.8 143.3 143.8 134.7 147.1 140.9 137.4 142.5 146.6 135.5 146.8 156.3 150.0 147.3 142.9 141.4 134.7 138.5 146.6 134.5 135.1 141.9 142.1 138.1 134.9 146.7 138.5 139.6 139.2 148.8 150.3 140.7 143.5 140.2 143.6 138.7 138.9 143.5 139.9 134.4 133.1 145.9 139.2 137.4 142.3 160.9 137.7 142.9 126.8 頻
12、數(shù)分布及其制作 對某個隨機事件進(jìn)行重復(fù)觀察,其中某變量值出現(xiàn)的次數(shù)被稱作頻數(shù)。 當(dāng)匯總大量的原始數(shù)據(jù)時,把數(shù)據(jù)按類型分組,其中每個組的數(shù)據(jù)個數(shù),稱為該組的頻數(shù)。 頻數(shù)表是用于反映各組及其相對應(yīng)的組頻數(shù)之間的關(guān)系。頻數(shù)表的制作步驟如下,以例2.1為例: 1. 計算極差R(最大值和最小值的差值) 本例中R=5.95-3.82=2.13 (1012/L ) 2. 決定組數(shù)(10-15組,最常用10-12組) 3. 計算組距i (等于極差與組數(shù)的比值,取 整數(shù)和取偶數(shù)的原則) 本例中i=2.13/10=0.213 1012/L ,取整數(shù)等 于0.2 1012/L 寫組段(第一組段應(yīng)包含最小值,最后一組
13、段包含最大值,每個組段為前閉后開區(qū)間,最后一個組段為閉區(qū)間。也應(yīng)遵循取整數(shù)和偶數(shù)的原則) 本例中第一組段應(yīng)包含最小值3.82,取3.80為第一組段的下限,寫為前閉后開區(qū)間,3.80。最后一組段應(yīng)包括最大值,寫為閉區(qū)間5.806.00。5. 列表劃記(組段和頻數(shù)是頻數(shù)表的基本要素)表2-2 某地140名正常男子紅細(xì)胞數(shù)的頻數(shù)表( 1012/ L)圖 2-1 140名正常男子紅細(xì)胞數(shù)頻數(shù)分布的直方圖 對頻數(shù)表和圖的觀察,可以看出兩個重要特征: 1.集中趨勢:平均水平,向中間集中,中等數(shù)據(jù)的人數(shù)最多。 2.離散趨勢:變異水平,即隨著紅細(xì)胞數(shù)測量值逐漸變大或變小,人數(shù)越來越少,向兩端分散。頻數(shù)表的主要
14、用途1.作為陳述資料的形式,可以替代繁雜的原始資料,便于進(jìn)一步分析2.便于觀察數(shù)據(jù)的分布類型3.便于發(fā)現(xiàn)資料中某些遠(yuǎn)離群體的特大或特小的可疑值4.當(dāng)樣本含量比較大時,可用各組段的頻率作為概率的估計值5. 計算集中趨勢指標(biāo)與離散趨勢指標(biāo)數(shù)據(jù)的分布類型對稱分布和不對稱分布正態(tài)分布:圖形中間的直條最高,高峰在中央,兩邊對稱或基本對稱地減少。偏態(tài)分布:若高峰不在中央,而位于一側(cè)。若高峰位于左側(cè),稱正偏態(tài)分布,如高峰位于右側(cè),稱負(fù)偏態(tài)分布。 對數(shù)據(jù)的描述指標(biāo)也分為兩類:描述集中趨勢或 平均水平的指標(biāo)。2. 描述離散趨勢或變異水平的指標(biāo)。第二節(jié) 平均數(shù)常用幾種平均值:1.算術(shù)均數(shù)2.幾何均數(shù)3.中位數(shù) 集
15、中趨勢常用平均值來描述。平均值是一組數(shù)據(jù)的典型或有代表性的值。由于這樣典型的值趨向于落在根據(jù)數(shù)據(jù)大小排列的數(shù)據(jù)的中心,因此可以用于度量集中位置(位置指標(biāo)) 算術(shù)平均數(shù)(簡稱為均數(shù)) 一、定義: 一組已知性質(zhì)相同的數(shù)值之和除以數(shù)值個數(shù)所得的商。以 (總體) (樣本)表示。 二、特征: (X- )=0 估計誤差之和為0。 三、適用資料類型: 1.描述正態(tài)分布和近似正態(tài)分布資料集中 趨勢的最好指標(biāo)。 2. 適用于大多數(shù)正常人的生理、生化指標(biāo)。 四、計算方法: 1.直接法 2.加權(quán)法 直接法 適用條件: 當(dāng)觀察例數(shù)不多時,或觀察例數(shù)雖然很多,但有計算機及統(tǒng)計軟件,宜選擇直接法。 式(2-1) 例2.1
16、 見書P10 加權(quán)法 適用條件:當(dāng)無原始數(shù)據(jù)或觀察例數(shù)很多又缺乏計算機及統(tǒng)計軟件時,若用直接法很容易出錯,可以用加權(quán)法處理。 式(2-2) 利用表2-2資料,用加權(quán)法計算140名正常男子紅細(xì)胞數(shù)濃度的均數(shù),計算見表1表1 某地140名正常男子紅細(xì)胞數(shù)均數(shù)和標(biāo)準(zhǔn)差( 1012/ L )加權(quán)法計算用表加權(quán)法計算的結(jié)果根據(jù)表1得: =669.80/140=4.78( 1012/ L )而將該資料輸入計算機用統(tǒng)計軟件和直接法計算,得到均數(shù)為4.77 (1012/ L) 。由此可見,加權(quán)法得到的均數(shù)是近似值,但這種算法的近似程度很好。算術(shù)平均數(shù)有如下特征:(1)對于以定量化測量所得的計量數(shù)據(jù)存在唯一的均
17、數(shù)。(2)樣本均數(shù)具有抽樣的穩(wěn)定性與對總體均數(shù)的可估性特征;能方便地作進(jìn)一步計算分析。(3)均數(shù)對極值特別敏感,極大值或極小值通常將均數(shù)拉向自己。(4)每個變量值到均數(shù)距離的和為零。(5)每個變量值到均數(shù)距離的平方和為最小。 幾何均數(shù)一、定義: 將n個觀察值x的乘積再開n次方所得的根,用G表示。二、適用條件: 1、當(dāng)一組觀察值不呈正態(tài)分布、且其差距較大時,用均數(shù)表示其平均水平會受少數(shù)特大或特小值影響; 2、原始數(shù)據(jù)分布不對稱,觀察值呈倍數(shù)關(guān)系或近似倍數(shù)關(guān)系,經(jīng)對數(shù)變換后呈正態(tài)分布的資料,又稱對數(shù)正態(tài)分布資料。 3、免疫學(xué)或微生物學(xué)領(lǐng)域中的某些指標(biāo),如抗體滴度、藥物的平均效價等。 直接法 適用條
18、件: 當(dāng)觀察例數(shù)不多時,宜選擇直接法。 式(2-3) 例2.2見書P11 加權(quán)法適用條件: 當(dāng)觀察例數(shù)較多或無原始數(shù)據(jù),僅有頻數(shù)表資料時,宜選擇加權(quán)法。 式(2-4)例2.3 見書P11 表2-3 胎盤浸液鉤端螺旋體菌苗接種兩個月后血清IgG抗體滴度的計算用表G=lg-1(698.9792/326)=139該地326名農(nóng)民胎盤浸液鉤端螺旋體菌苗接種兩個月后血清IgG抗體的平均滴度為:1:139 幾何均數(shù)的特征: (1)變量x服從對數(shù)正態(tài)分布,即表示變量log(x)服從正態(tài)分布。幾何均數(shù)用以描述一群服從對數(shù)正態(tài)分布的測量值在對數(shù)量值上的集中性特征與平均水平。 (2)變量x在取對數(shù)后的log(x)
19、具有算術(shù)均數(shù)的所有特征。中位數(shù)(Median)和百分位數(shù) 一、定義: 中位數(shù)是把一組觀察值,按大小順序排列,位置居中的那個數(shù)值。 中位數(shù)是一個位置指標(biāo),它將所有觀察值分為兩個相同的部分,各占除中位數(shù)以外的觀察值的百分之五十。用M表示。 百分位數(shù)也是一個位置指標(biāo),先把一組數(shù)據(jù)從小到大排列, 將數(shù)據(jù)中的所有觀察值看成一個整體,即100%。則百分位數(shù)將自身以外的觀察值分成了兩個部分,其中有x%的觀察值比它小,而(100-x)%的個體具有比它大的觀察值。 中位數(shù)就是一個特殊的百分位數(shù),即50。 中位數(shù)和百分位數(shù) 二、適用資料: 偏態(tài)分布的資料 開口資料 分布未明的資料 某些毒物指標(biāo),如血鉛,發(fā)汞值;某
20、些 傳染病或食物中毒的潛伏期;生存時間等中位數(shù)和百分位數(shù) 三、計算方法: 直接法:適用于有原始數(shù)據(jù); 樣本 例數(shù)不太多; 容易將原始數(shù)據(jù)排序。 頻數(shù)表法Take Median for example (n=odd number)100%X1 X2 X3 X4 X5 X6 X7X4Median(P50)50%(100-50)%=50%結(jié)論:Median=X4中位數(shù)的計算公式直接法: 當(dāng)n=奇數(shù)時,中位數(shù)即為第(n+1)/2位的數(shù)值 例1見書P12Take Median for example (n=even number)100% X1 X2 X3 X4 X5 X6 X7 X8Median(P5
21、0)50%(100-50)%=50%結(jié)論:Median=1/2(X4+X5)X4 X5中位數(shù)的計算公式直接法:當(dāng)n=偶數(shù)時,中位數(shù)并非直接對應(yīng)某一數(shù)值,而是在兩個數(shù)值之間,于是,取與中點位置相鄰的兩個變量值的算術(shù)平均數(shù)為中位數(shù)。 例1見書12Px的含義100%X1 X2 X3 X4 Xn-2 Xn-1 Xn(100-X)%結(jié)論:Pxis a limit value or position indexX%PX 頻數(shù)表法 適用于: 無原始數(shù)據(jù),只有頻數(shù)表提供的信息; 原始數(shù)據(jù)太多,排序比較麻煩此計算公式的前提條件為: 假設(shè)觀察值在每個組段內(nèi)是均勻分布的。 表2 健康男子血清鉛的濃度 組距為5 (mol/L) 血清鉛水平 頻數(shù) 累計頻數(shù) 累計頻率 (mol/L) 0 18 18 0.0796 5 51 69 0.3053 10 43 106 0.4690 15 36 142 0.6283 20 30 172 0.7611 25 26 198 0.8761 30 14 212 0.9381 35 6 218 0.9646 40 3 221 0.9779 45 3 224 0.9912 50 1 225 0.9956 55 0 225 0.9956 60 1 226 1.0000PX所在組段的下限PX所在組段的頻數(shù)PX所在組段的組距PX所在組段前一組段的累計頻
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年具有獨立功能電氣設(shè)備及裝置項目申請報告
- 玻璃氮氣作用機理研究報告
- 汴京燈籠民俗研究報告
- 氨吸收式制冷課程設(shè)計
- 比爾蓋茨的研究報告
- 比亞迪經(jīng)營狀況研究報告
- 比亞迪公司研究報告
- 殯儀館征地方案
- 案例分析強化課程設(shè)計
- 戰(zhàn)隊明星合同范本
- 消防管道支架工程量計算表
- 企業(yè)外包業(yè)務(wù)安全生產(chǎn)專項檢查表(全面)1管理學(xué)資料
- 《咕咚來了》課件PPT
- 05-SMT-DOE實驗結(jié)案報告
- 輸尿管結(jié)石護(hù)理查房課件
- 西學(xué)中試題答案在后(已排版)
- 皮膚牽引護(hù)理技術(shù)操作流程及評分標(biāo)準(zhǔn)
- 醫(yī)患溝通特殊問題處理課件
- 小學(xué)數(shù)學(xué)說課課件
- 劍橋英語PET真題校園版
- Python程序設(shè)計分支結(jié)構(gòu)
評論
0/150
提交評論