衛(wèi)生統(tǒng)計(jì)學(xué)第7版--課件第二章-定量的統(tǒng)計(jì)描述_第1頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)第7版--課件第二章-定量的統(tǒng)計(jì)描述_第2頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)第7版--課件第二章-定量的統(tǒng)計(jì)描述_第3頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)第7版--課件第二章-定量的統(tǒng)計(jì)描述_第4頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)第7版--課件第二章-定量的統(tǒng)計(jì)描述_第5頁(yè)
已閱讀5頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章 定量資料的統(tǒng)計(jì)描述2022/7/241 學(xué)習(xí)要求 了解:應(yīng)用SAS程序編制頻率表的方法和means、univariate過(guò)程對(duì)定量資料的描述。 熟悉:定量資料頻率表的編制方法和用途。 掌握:算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)的計(jì)算方法和使用條件;四分位間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)的計(jì)算方法和使用條件。 2022/7/242 統(tǒng)計(jì)描述是用統(tǒng)計(jì)圖表、統(tǒng)計(jì)指標(biāo)來(lái)描述資料的分布規(guī)律及其數(shù)量特征的。 第一節(jié) 頻率分布表與頻率分布圖 醫(yī)學(xué)研究資料變量值的個(gè)數(shù)較多時(shí),對(duì)個(gè)變量值出現(xiàn)的頻數(shù)或頻率列表即為頻數(shù)分布表或頻率分布表(frequency distribution table),簡(jiǎn)稱頻數(shù)表或頻率表。 2

2、022/7/243 一、離散型定量變量的頻率分布 例2-1 1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料,編制頻率表。 表2-1 1998年某地96名孕婦產(chǎn)前檢查次數(shù)頻率分布檢查次數(shù)(1)頻數(shù)(2)頻率(%)(3)累計(jì)頻數(shù)(4)累計(jì)頻率(%)(5)0123455 4 71113262312 4.2 7.311.513.527.124.012.5 4112235618496 4.211.522.936.563.587.5 100.0合計(jì)961002022/7/244 圖2-1 1998年某地96名孕婦產(chǎn)前檢查次數(shù)頻率分布 離散型定量變量的頻率分布圖可用直條圖表達(dá),以等寬直條的高度表示各組頻率的多少

3、2022/7/245二、連續(xù)型定量變量的頻率分布 例2-2 抽樣調(diào)查某地120名1835歲健康男性居民血清鐵含量(mmo/L),數(shù)據(jù)如下。試編制血清鐵含量的頻率分布表。2022/7/246頻率表的編制步驟如下: 1. 計(jì)算極差 (range, R),亦稱全距,即最大值與最小值之差。本例最大值為29.64,最小值為7.42,故R=29.64-7.42=22.22 (mmo/L)。 2. 確定組段數(shù)與組距(class interval) 組段數(shù)一般取10組左右。組距用i表示,組距=極差/組段數(shù),本例擬分10組,i=22.22/10=2.22,一般取靠近的整數(shù)作為組距,本例取i2。 3. 確定各組段

4、的上、下限 每個(gè)組段的起點(diǎn)稱為組段的下限,終點(diǎn)稱為組段的上限。第一組段要包括最小值,其下限取小于或等于最小值的整數(shù),本例取6最為第一組段的下限(也可取7),最后一個(gè)組段要包括最大值。注意各組段不能重合,每組段只寫(xiě)出下限,如6,8,最后一個(gè)組段可包括其上限值,如本例2830。 4. 列表 清點(diǎn)各組的頻數(shù),計(jì)算頻率、累積頻率數(shù)和累計(jì)頻率。 2022/7/247組段(1)頻數(shù)(2)頻率(%)(3)累計(jì)頻數(shù)(4)累計(jì)頻率(%)(5)6810121416 18 20 22 24 26 2830 1 3 6 81220271812 8 4 1 0.83 2.50 5.00 6.6710.0016.6722

5、.5015.0010.00 6.67 3.33 0.83 1 4 10 18 30 50 77 95107115119120 0.83 3.33 8.33 15.00 25.00 41.67 64.17 79.17 89.17 95.83 99.17100.00合計(jì)120100.00表2-2 120名正常成年男子血清鐵含量(mmo/L)頻率分布2022/7/248圖2-2 120名健康成年男子血清鐵含量(mol/L)分布2022/7/2492-2 120名健康成年男子血清鐵含量(mmo/L)分布2022/7/2410三、頻率分布表(圖)的用途 1.揭示資料的分布類型 2022/7/2411 正

6、偏態(tài)(右偏態(tài)) 負(fù)偏態(tài)(左偏態(tài)) 2.觀察資料的集中趨勢(shì)和離散趨勢(shì) 3.便于發(fā)現(xiàn)某些特大或特小的可疑值 4.便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和作統(tǒng)計(jì)處理2022/7/2412第二節(jié) 描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo) 醫(yī)學(xué)定量資料中,描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)主要有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。一、算術(shù)均數(shù)(arithmetic mean) 簡(jiǎn)稱均數(shù)。均數(shù)適用于對(duì)稱分布或近似對(duì)稱分布的資料。習(xí)慣上以希臘字母 表示總體均數(shù)(population mean),以表示樣本均數(shù) (sample mean)。常用計(jì)算方法有直接法和頻率表法(亦稱加權(quán)法)。2022/7/24131.直接法 例2-3 測(cè)得8至正常大白鼠血清總酸性磷酸酶

7、(TACP)含量 (U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。 本例(U/L)2022/7/2414 2.頻率表法 當(dāng)變量值的個(gè)數(shù)較多時(shí),在編制頻率表的基礎(chǔ)上,應(yīng)用加權(quán)法計(jì)算均數(shù)的近似值。 公式中,f 為各組段的頻數(shù),X0為各組段的組中值, X0=(組段上限+組段下限)/2。 例2-4 (mmo/L)如用直接法計(jì)算, =18.61(mmo/L)2022/7/2415 表2-3 頻數(shù)表法計(jì)算均數(shù)組段(1)組中值(X0)(2)頻數(shù)(f)(3)fX0(4)=(2)(3) 6 8 10 12 14 16 18 20 22 24 26 28

8、 30 7 911131517192123252729 1 3 6 81220271812 8 4 1 7 27 66104180340513378276200108 29合計(jì) 120 22282022/7/2416二、幾何均數(shù)(geometric mean,) 幾何均數(shù)使用于原始變量不呈對(duì)稱分布,但對(duì)變量經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料,又稱對(duì)數(shù)正態(tài)分布資料。常見(jiàn)于正偏態(tài)分布資料,如抗體滴度,某些傳染病的潛伏期,細(xì)菌計(jì)數(shù)等。計(jì)算公式亦可用直接法和頻數(shù)表法。 1.直接法 對(duì)數(shù)的形式為 2022/7/2417 例2-5 7名慢性遷延型肝炎患者的HBsAg滴度資料為: 1:16,1:32,1:32,1

9、:64,1:64,1:128,1:512。試計(jì)算其幾何均數(shù)。 本例先求平均滴度的倒數(shù)7名慢性遷延型肝炎患者的HBsAg滴度幾何均數(shù)為1:64。2022/7/2418 2.頻率表法:當(dāng)資料中相同變量值的個(gè)數(shù)f(即頻數(shù))較多時(shí),可通過(guò)頻率表法計(jì)算幾何均數(shù),公式為 表2-4 52例慢性肝炎患者的 HBsAg滴度資料抗體滴度頻數(shù)(f)滴度倒數(shù)(X)logXflogX1:161:321:641:1281:2561:5122711131271632641282565121.204121.505151.806182.107212.408242.709272.4082410.5360519.8679827.3

10、937328.8988818.96489合計(jì)52108.069772022/7/2419本例f lgX= 108.06977 , f=52,代入公式得 52例慢性肝炎患者的 HBsAg滴度的幾何均數(shù)為1:119.75 計(jì)算幾何均數(shù)應(yīng)注意:變量值中不能有0;不能同時(shí)有正值和負(fù)值;若全是負(fù)值,計(jì)算時(shí)可先把負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。2022/7/2420滴度倒數(shù)XlgX頻數(shù) f20.3010440.6021780.903115161.204120321.505116641.806271282.107232022/7/24212022/7/24222022/7/2423三、中位數(shù)及百分位數(shù) 1.

11、中位數(shù)(median , M) 將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)。在全部變量值中,大于和小于中位數(shù)的變量值的個(gè)數(shù)相等。 用中位數(shù)表示平均水平主要適用于:變量值中出現(xiàn)個(gè)別特小或特大的數(shù)值;資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè);變量值分布一端或兩端無(wú)確定數(shù)值,只有小于或大于某個(gè)數(shù)值;資料的分布不清。2022/7/2424 (1)直接法 當(dāng)例數(shù)較少時(shí),先將變量值由小到大順序排列,再按以下公式計(jì)算。n為奇數(shù)時(shí) n為偶數(shù)時(shí) 式中X的下標(biāo)為變量值的位置。2022/7/2425 例2-7 某藥廠觀察9只小鼠口服高山紅景天醇提物后在乏氧條件下的生存時(shí)間(min)如下:49.

12、1,60.8,63.3,63.6,63.6,65.6,65.8,68.9,69.0。試求其中位數(shù)。 本例n=9,為奇數(shù)如果n=10例,生存時(shí)間為69.6,則中位數(shù)為2022/7/2426 (2)頻率表法 當(dāng)例數(shù)較多時(shí),先將變量值從小到大編制頻率表,并分別計(jì)算累計(jì)頻數(shù)和累計(jì)頻率(見(jiàn)表2-5)。先從累計(jì)頻率找出M所在的組段,然后按下式計(jì)算。 式中L為中位數(shù)所在組段的下限,i為該組段的組距,fm為該組段的頻數(shù),fL為小于L的各組段累計(jì)頻數(shù)。 例2-8 50例鏈球菌咽頰炎患者的潛伏期(小時(shí))如表2-5,試計(jì)算潛伏期的中位數(shù)。2022/7/2427表2-5 50例鏈球菌咽頰炎患者的潛伏期(小時(shí))的頻率分

13、布表 組段組中值(X0)頻數(shù)(f)累計(jì)頻數(shù)累計(jì)頻率(%)122436486072849610812018304254667890102114 1 71111 7 5 4 2 2 1 819303742464850 2 16 38 60 74 84 92 96100合計(jì)-50-本例從累計(jì)頻率看,M位于48組段,即L=48,i=12,fm=11, fL=19,(小時(shí))2022/7/2428fLMfm2022/7/2429 1.百分位數(shù) 百分位數(shù)(percentile,P)是一種位置指標(biāo),以Px表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小到大按順序排列,理論上有x%的變量值比Px小,有(

14、100 x)%的變量值比Px大。故P50分位數(shù)也就是中位數(shù),即P50=M 。百分位數(shù)的計(jì)算公式為 式中L為Px所在組段的下限,i為該組段的組距,fx為該組段的頻數(shù),fL為小于L的各組段累計(jì)頻數(shù)。2022/7/2430 如 試求表2-5資料中百分位數(shù)P25、P75 。 由表2-5累計(jì)頻數(shù)欄可見(jiàn)P25在“36”組段,L=36,i=12, fx=11, fL=8,代入公式得(小時(shí)) 同理可知 P75在“72”組段,L=72,i=12, fx=5, fL=74,代入公式得(小時(shí)) 百分位數(shù)的使用條件同中位數(shù)一樣。主要用途為:描述一組資料在某百分位置上的水平;用于確定正常值范圍;計(jì)算四分位數(shù)間距。 20

15、22/7/2431四、眾數(shù)( mode) 一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)值,叫眾數(shù)。眾數(shù)在頻率分布表中是頻數(shù)最多的那一組的組中值,有時(shí)眾數(shù)在一組數(shù)中有好幾個(gè)或者沒(méi)有眾數(shù)。 例如:1,2,3,3,4的眾數(shù)是3 ;1,2,2,3,3,4的眾數(shù)是2和3;1,2,3,4,5沒(méi)有眾數(shù);表2-5眾數(shù)為42和54。 2022/7/2432第三節(jié) 描述離散趨勢(shì)的統(tǒng)計(jì)指標(biāo) 例2-10 是觀察三組數(shù)據(jù)的離散狀況。A組:26,28,30,32,34;B組:24,27,30,33,36;C組:26,29,30,31,34。三組均數(shù)都是30。 A組 . . . . . B組 . . . . . C組 . . . . . 常

16、用的離散指標(biāo)有: 極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù),最常用的指標(biāo)為標(biāo)準(zhǔn)差。 2022/7/2433一、極差和四分位數(shù)間距 1.極差 極差(range,R)亦稱全距,即一組變量值中最大值與最小值之差。R值大,離散度就大;R值小,離散度就小。 A組: R=34-26=8 B組:R=36-24=12 C組:R=34-26=8 極差的特點(diǎn)是計(jì)算簡(jiǎn)單,但只考慮最大值和最小值,容易受個(gè)別極端值的影響,且不能反映組內(nèi)其他變量值的離散情況。另外,當(dāng)調(diào)查例數(shù)增多時(shí),遇到較大或較小變量值的機(jī)會(huì)就大,極差就可能增大。2022/7/2434 2.四分位數(shù)間距(quartile interval,Q) 極差的

17、不穩(wěn)定主要受兩端值的影響,如將兩端數(shù)據(jù)各去掉一部分,這樣所得的數(shù)據(jù)就比較穩(wěn)定了。例如兩端各去掉25,取中間50的數(shù)據(jù)的極差,這樣可先計(jì)算P25和P75,求出P75與P25之差,即為四分位數(shù)間距。 Q= P75P25 P75又稱為上四分位數(shù)(upper quartile ); P25又稱為下四分位數(shù)(lower quartile )。2022/7/2435 例2-12 試計(jì)算表2-5中 50例鏈球菌咽頰炎患者的潛伏期(小時(shí))的四分位間距。 已知P75=73.20小時(shí),P25=40.91小時(shí),代入公式得 Q=73.2040.91=32.29(小時(shí)) 由以上的結(jié)果可以看出:鏈球菌咽頰炎患者的潛伏期在

18、40.9173.20小時(shí)之間,其四分位數(shù)間距為32.29小時(shí)。 四分位數(shù)間距可用于各種分布資料,特別是偏態(tài)分布資料,經(jīng)常把中位數(shù)和四分位間結(jié)合起來(lái)描述資料的集中趨勢(shì)和離散趨勢(shì)。2022/7/2436二、方差和標(biāo)準(zhǔn)差 方差(variance)和標(biāo)準(zhǔn)差(standard deviation)是描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料離散趨勢(shì)(變異程度)的常用指標(biāo)。 1.方差 總體方差用 表示,樣本方差用S2表示。2022/7/2437 式中: n-1是自由度(degree of freedom),用希臘小寫(xiě)字母表示。它描述了當(dāng) 不變的情況下,n個(gè)變量值(X)中能自由變動(dòng)的變量值的個(gè)數(shù)。用n-

19、1作分母,S2可作為 的無(wú)偏估計(jì)。 對(duì)于頻率表資料如例2-10三組數(shù)據(jù)其方差為2022/7/2438 2.標(biāo)準(zhǔn)差 標(biāo)準(zhǔn)差為方差的開(kāi)方根,它與原始變量值單位相同??傮w標(biāo)準(zhǔn)差用 表示 ,樣本標(biāo)準(zhǔn)差用S表示。 總體標(biāo)準(zhǔn)差計(jì)算公式為 樣本標(biāo)準(zhǔn)差計(jì)算公式為 2022/7/2439 對(duì)于頻率表資料例 2-14 計(jì)算例2-2數(shù)據(jù)的標(biāo)準(zhǔn)差。 已算得fX0=2228, n=f=120, =43640(mol/L) 對(duì)于正態(tài)分布資料,研究報(bào)告中經(jīng)常用 的形式來(lái)描述資料的集中趨勢(shì)和離散趨勢(shì)。2022/7/2440三、變異系數(shù)(coefficient of variation, CV) 當(dāng)兩組或多組變量值的單位不同或

20、均數(shù)相差較大時(shí),不能或不宜用兩個(gè)或多個(gè)標(biāo)準(zhǔn)差的大小來(lái)比較其離散程度的大小。此時(shí)可用變異系數(shù)反映變量值的相對(duì)離散程度。樣本變異系數(shù)CV的計(jì)算公式 由上式可以看出:變異系數(shù)為無(wú)量綱單位,可以比較不同單位指標(biāo)間的變異度;變異系數(shù)消除了均數(shù)的大小對(duì)標(biāo)準(zhǔn)差的影響,所以可以比較兩均數(shù)相差較大時(shí)指標(biāo)間的變異度。2022/7/2441 例2.14 1985年通過(guò)十省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為8.42kg,標(biāo)準(zhǔn)差為0.98kg,身高均數(shù)為72.4cm,標(biāo)準(zhǔn)差為3.0cm。試計(jì)算周歲女童身高與均數(shù)變異系數(shù)。身高 體重 周歲女童體重的變異程度比身高的變異程度大。 2022/7/2442 第四節(jié) 描述分布

21、形態(tài)的統(tǒng)計(jì)指標(biāo) 1.偏度系數(shù)(coefficient of skewness ,SKEW) 偏度系數(shù)(G1)按照以下公式計(jì)算G1=0為正態(tài)分布;G10為正偏態(tài)分布;G10負(fù)偏態(tài)G1M0,為尖峭峰;G2 |t| = |M| = |S| .0001 Tests for Normality Test -Statistic- -p Value- Shapiro-Wilk (W檢驗(yàn)) W 0.992187 Pr D 0.1500 Cramer-von Mises W-Sq 0.060468 Pr W-Sq 0.2500 Anderson-Darling A-Sq 0.343631 Pr A-Sq 0.25002022/7/2460Quantiles (Definition 5) Quantile Estimate 100% Max 29.640 99% 27.900 95% 25.180 90% 24.135 75% Q3 21.570 50% Median 18.985 25% Q1 16.020 10% 12.660 5% 10.975 1% 8.400 0% Min 7.4202022/7/2461 Extreme Observations -Lowest- -Highest- Value Obs Value Obs 7.42

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論