醫(yī)學統(tǒng)計學之集中趨勢的統(tǒng)計描述課件_第1頁
醫(yī)學統(tǒng)計學之集中趨勢的統(tǒng)計描述課件_第2頁
醫(yī)學統(tǒng)計學之集中趨勢的統(tǒng)計描述課件_第3頁
醫(yī)學統(tǒng)計學之集中趨勢的統(tǒng)計描述課件_第4頁
醫(yī)學統(tǒng)計學之集中趨勢的統(tǒng)計描述課件_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Outline頻數表和頻數圖頻數表和頻數圖的信息數值變量資料的統(tǒng)計描述描述集中位置的指標描述離散趨勢的指標正確應用分類變量資料的統(tǒng)計描述總結Outline頻數表和頻數圖1例1:亂七八糟的原始數據某地140名成年男子紅細胞計數(1012個/升)資料如下4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76例1:亂七八糟的原始數據某地140名成年男子紅細胞計數(102頻數分布表和頻數分布圖原因:由于個體變異的存在,醫(yī)學研究中某指標在各個體上的觀察結果不是恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布(distribution)。現(xiàn)狀:醫(yī)學研究得到的原始數據(rawdata)往往是龐大的、混亂的。解決:頻數分布表的基本思想:將原始數據按照一定的標準劃分為若干各組,合計各組的頻數,得到頻數分布表;在將頻數表繪制成頻數分布圖。頻數分布表和頻數分布圖原因:由于個體變異的存在,醫(yī)學研究中某3頻數分布表的制作步驟計算極差(R)

R=max-min=5.95-3.82=2.13(1012個/升)組數:8~15組距:i=R/組數=2.13/10=0.213≈0.2(1012個/升)組段:含義:含下限不含上限。第一組段下限≤min

最后一組上限>max劃記:計算頻數頻數分布表的制作步驟4100名成年男子紅細胞計數頻數表100名成年男子紅細胞計數頻數表5100名成年男子紅細胞計數頻數圖圖1140名成年男性的血紅細胞計數的頻數分布

100名成年男子紅細胞計數頻數圖圖1140名成年男性6頻數分布所提供的信息頻數分布圖用以表示數據的分布規(guī)律。觀察有無可疑值??疾旆植嫉念愋汀ΨQ分布非對稱分布(偏態(tài)分布)考察分布的特征集中位置(CentralTendency)離散趨勢(TendencyofDispersion)頻數分布所提供的信息頻數分布圖用以表示數據的分布規(guī)律。7289只近視眼Lasik術后1月裸眼視力Frequencynv0.000.100.200.300.400.500.600.700.800.901.001.101.200.0071.00289只近視眼Lasik術后1月裸眼視力Frequencyn8偏態(tài),正偏態(tài)和負偏態(tài)分布不對稱者稱為偏態(tài)分布。偏態(tài)分布又分為正偏分布和負偏分布。正偏分布是指分布的長尾在峰的右側,又稱右偏分布負偏分布是指分布的長尾在峰的左側,又稱左偏分布。常見偏態(tài)分布偏態(tài),正偏態(tài)和負偏態(tài)分布不對稱者稱為偏態(tài)分布。9120名7歲男童身高的頻數分布圖124132140148156164010203040人數身高(cm)120名7歲男童身高的頻數分布圖1241321401481510239人發(fā)汞含量的頻數分布70

3

5

7

9

11

13

15

17

19

21

10

20

30

40

50

60

0

1

發(fā)汞含量(mol/kg)人數239人發(fā)汞含量的頻數分布703579111311某市892名老年人生存質量自評分頻數分布

0

10

20

30

40

50

60

70

80

90

100

100

200

300

0

400

自評分人數某市892名老年人生存質量自評分頻數分布01020312102名黑色素瘤患者的生存時間頻數分布

0

5

10

15

20

25

30

35

40

45

0

10203040

生存時間(月)人數102名黑色素瘤患者的生存時間頻數分布05101513某地某年10000例死亡者年齡分布0102030405060708001000200030004000死亡年齡(歲)人數某地某年10000例死亡者年齡分布01020304050614偏態(tài)分布1:老年人生存質量自評分0

10

20

30

40

50

60

70

80

90

100

100

200

300

0

400

自評分人數偏態(tài)分布1:老年人生存質量自評分01020304015偏態(tài)分布2:

黑色素瘤患者的生存時間0

5

10

15

20

25

30

35

40

45

0

10203040

生存時間(月)人數偏態(tài)分布2:黑色素瘤患者的生存時間0510152016集中位置和離散趨勢124132140148156164010203040人數身高(cm)集中位置和離散趨勢124132140148156164010172.2描述集中位置的指標平均數(Average)算術均數(Mean)幾何均數(GeometricMean)中位數(Median)百分位數(Percentile)2.2描述集中位置的指標平均數(Average)算術均數18描述集中位置的指標:算術均數算術均數(arithmeticmean,mean,μ)

定義:

使用條件

單峰對稱分布、正態(tài)分布的資料描述集中位置的指標:算術均數算術均數(arithmetic19加權均數(weightedmean)

加權均數(weightedmean)20加權法計算實例(例2.1)100名成年男性血紅細胞均數計算表加權法計算實例(例2.1)100名成年男性血紅細胞均數計算表21描述集中位置的指標:幾何均數幾何均數(geometricmean,G)定義使用條件呈倍數關系變化或對數正態(tài)分布常用描述集中位置的指標:幾何均數幾何均數(geometricm22幾何均數計算實例1:10,1:20,1:40,1:80,1:160幾何均數計算實例1:10,1:20,1:40,123描述集中位置的指標:中位數中位數(median,M)

定義:將一組數據按從小到大的順序排列,位置居中的數即是中位數。使用條件:偏態(tài)分布資料、開口資料、分布不明計算描述集中位置的指標:中位數中位數(median,M)24中位數計算實例9例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.5

M=4.810例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.516.3

M=(4.8+5.6)/2=5.2

中位數計算實例9例正常人的發(fā)汞值:25中位數例對于某項風險較高的新手術術后的生存時間進行跟蹤,共調查了7人,6人死亡之前分別生存了5天、6天、10天、16天、25天、29天,還有一人術后30天隨訪時仍存活。本資料屬于“開口”資料。本例數據已經按從小到大的升序排列,n=7,為奇數,其中位數為16天。中位數例對于某項風險較高的新手術術后的生存時間進行跟蹤,共調26描述集中位置的指標:百分位數百分位數(percentile)X%

PX(100-X)%50%分位數就是中位數25%,75%分位數稱四分位數(quartile)

描述集中位置的指標:百分位數百分位數(percentile)27某地630名正常女性血清甘油三酯含量(ug/dl)甘油三酯頻數累積頻數累積頻率

10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合計630--某地630名正常女性血清甘油三酯含量(ug/dl)甘油三酯2813016081M?13016081M?29醫(yī)學統(tǒng)計學之集中趨勢的統(tǒng)計描述課件30平均數應用的注意事項同質的資料計算平均數才有意義根據資料分布的特征選用適當的平均數均數:單峰對稱分布的資料幾何均數:等比資料、滴度資料、正偏態(tài)資料中位數:理論上可用于任何分布資料,但當資料適合計算均數或幾何均數時,不宜用中位數。(偏態(tài)分布、分布不明資料、有不確定值的資料)平均數應用的注意事項同質的資料計算平均數才有意義31平均數應用的注意事項計算幾何均數時:變量值中不能有0

同一組變量值不能同時存在正、負值若變量值全為負值,可先將負號除去,算出結果后再冠以負號樣本含量較少時不宜計算靠近兩端的百分位數平均數要與變異指標結合使用平均數應用的注意事項計算幾何均數時:32例:只用平均數描述資料的弊病甲組2629303134均數30kg乙組2427303336均數30kg丙組2628303234均數30kg丙乙甲三組兒童體重的離散程度例:只用平均數描述資料的弊病甲組26293033描述離散趨勢的指標變異度極差(Range)四分位數間距(interquartilerange)方差(Variance)標準差(StandardDeviation)變異系數(

coefficientofvariation)描述離散趨勢的指標變異度極差(Range)四分位數間距(in34描述離散趨勢的指標:極差全距(range),極差

R=max-min意義:??優(yōu)點:簡單明了缺點:不靈敏:只考慮了最大、最小值

不穩(wěn)定:抽樣誤差大描述離散趨勢的指標:極差全距(range),極差35描述離散趨勢的指標:四分位數間距四分位數間距(inter-quartilerange)QU-QL=

P75-P25適用于偏態(tài)分布的資料離散程度指標描述偏態(tài)分布的資料的集中趨勢??描述離散趨勢的指標:四分位數間距四分位數間距(inter-q36離均差離均差之和?離均差平方和離均差平方和與觀察值的個數即樣本含量(n)有關離均差離均差平方和與觀察值的個數即樣本含量(n)有關37描述離散趨勢的指標:方差方差(variance)

方差缺點?描述離散趨勢的指標:方差方差(variance)38描述離散趨勢的指標:標準差標準差(standarddeviation,sd)

n-1:自由度(degreeoffreedom)描述離散趨勢的指標:標準差標準差(standarddevi39甲組2629303134乙組2427303336丙組2628303234

極差方差標準差甲組8 8.50 2.92乙組1222.50 4.74丙組8 10.00 3.16甲組2629303140標準差是描述變量值變異程度的指標。標準差大變異程度大均數的代表性差標準差小變異程度小均數的代表性好用途1表示變異程度的大小2計算標準誤、變異系數3估計正常值范圍標準差的意義標準差是描述變量值變異程度的指標。用途標準差的意義41描述離散趨勢的指標:變異系數變異系數(coefficientofvariation,CV)排除了平均水平的影響,并取消了單位。因此變異系數常用于:比較度量衡單位不同的兩組或多組資料的變異度比較均數相差懸殊的兩組或多組資料的變異度。描述離散趨勢的指標:變異系數變異系數(coefficient42不同指標間變異度的比較例2.7不同指標間變異度的比較例2.743某地年齡兒童身高(cm)的變異年齡組人數均數標準差變異系數(%)1~2月10056.32.13.75~6月12066.52.23.33~3.5歲30096.13.13.25~5.5歲400107.83.33.1某地年齡兒童身高(cm)的變異年齡組人數均數標準差變異系數(44正確應用(1)算數均數:適用于單峰對稱分布資料;幾何均數:適合于作對數變換后單峰對稱分布資料;中位數和百分位數:適用于任何分布的資料;中位數和百分位數在樣本含量較少時不穩(wěn)定,越靠兩端越不穩(wěn)定;中位數在抗極端值的影響方面,比均數具有較好的穩(wěn)定性,但不如均數精確。因此,當資料適合計算均數或幾何均數時,不宜用中位數表示其平均水平。不同質的資料應考慮分別計算平均數。正確應用(1)算數均數:適用于單峰對稱分布資料;45正確應用(2)極差不穩(wěn)定,不靈敏標準差的基本內容是離均差,它顯示一組變量值與其均數的間距,故標準差直接地、總結地、平均地描述了變量值的離散程度。在同質的前提下,標準差大表示變量值的離散程度大,即變量值的分布分散、不整齊、波動較大;反之,標準差小表示變量值的離散程度小,即變量值的分布集中、整齊、波動較小。變異系數派生于標準差,其應用價值在于排除了平均水平的影響,并消除了單位。正確應用(2)極差不穩(wěn)定,不靈敏46總結:每個觀察指標均有其特定的變異規(guī)律;描述變異:圖形描述統(tǒng)計量描述平均數:均數、幾何均數、中位數變異度:標準差、四分位數間距、變異系數、極差不同分布的指標,用不同的統(tǒng)計量描述;用平均數與變異度共同描述??偨Y:每個觀察指標均有其特定的變異規(guī)律;47ThankUThankU48Outline頻數表和頻數圖頻數表和頻數圖的信息數值變量資料的統(tǒng)計描述描述集中位置的指標描述離散趨勢的指標正確應用分類變量資料的統(tǒng)計描述總結Outline頻數表和頻數圖49例1:亂七八糟的原始數據某地140名成年男子紅細胞計數(1012個/升)資料如下4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76例1:亂七八糟的原始數據某地140名成年男子紅細胞計數(1050頻數分布表和頻數分布圖原因:由于個體變異的存在,醫(yī)學研究中某指標在各個體上的觀察結果不是恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布(distribution)?,F(xiàn)狀:醫(yī)學研究得到的原始數據(rawdata)往往是龐大的、混亂的。解決:頻數分布表的基本思想:將原始數據按照一定的標準劃分為若干各組,合計各組的頻數,得到頻數分布表;在將頻數表繪制成頻數分布圖。頻數分布表和頻數分布圖原因:由于個體變異的存在,醫(yī)學研究中某51頻數分布表的制作步驟計算極差(R)

R=max-min=5.95-3.82=2.13(1012個/升)組數:8~15組距:i=R/組數=2.13/10=0.213≈0.2(1012個/升)組段:含義:含下限不含上限。第一組段下限≤min

最后一組上限>max劃記:計算頻數頻數分布表的制作步驟52100名成年男子紅細胞計數頻數表100名成年男子紅細胞計數頻數表53100名成年男子紅細胞計數頻數圖圖1140名成年男性的血紅細胞計數的頻數分布

100名成年男子紅細胞計數頻數圖圖1140名成年男性54頻數分布所提供的信息頻數分布圖用以表示數據的分布規(guī)律。觀察有無可疑值??疾旆植嫉念愋?。對稱分布非對稱分布(偏態(tài)分布)考察分布的特征集中位置(CentralTendency)離散趨勢(TendencyofDispersion)頻數分布所提供的信息頻數分布圖用以表示數據的分布規(guī)律。55289只近視眼Lasik術后1月裸眼視力Frequencynv0.000.100.200.300.400.500.600.700.800.901.001.101.200.0071.00289只近視眼Lasik術后1月裸眼視力Frequencyn56偏態(tài),正偏態(tài)和負偏態(tài)分布不對稱者稱為偏態(tài)分布。偏態(tài)分布又分為正偏分布和負偏分布。正偏分布是指分布的長尾在峰的右側,又稱右偏分布負偏分布是指分布的長尾在峰的左側,又稱左偏分布。常見偏態(tài)分布偏態(tài),正偏態(tài)和負偏態(tài)分布不對稱者稱為偏態(tài)分布。57120名7歲男童身高的頻數分布圖124132140148156164010203040人數身高(cm)120名7歲男童身高的頻數分布圖1241321401481558239人發(fā)汞含量的頻數分布70

3

5

7

9

11

13

15

17

19

21

10

20

30

40

50

60

0

1

發(fā)汞含量(mol/kg)人數239人發(fā)汞含量的頻數分布703579111359某市892名老年人生存質量自評分頻數分布

0

10

20

30

40

50

60

70

80

90

100

100

200

300

0

400

自評分人數某市892名老年人生存質量自評分頻數分布01020360102名黑色素瘤患者的生存時間頻數分布

0

5

10

15

20

25

30

35

40

45

0

10203040

生存時間(月)人數102名黑色素瘤患者的生存時間頻數分布05101561某地某年10000例死亡者年齡分布0102030405060708001000200030004000死亡年齡(歲)人數某地某年10000例死亡者年齡分布01020304050662偏態(tài)分布1:老年人生存質量自評分0

10

20

30

40

50

60

70

80

90

100

100

200

300

0

400

自評分人數偏態(tài)分布1:老年人生存質量自評分01020304063偏態(tài)分布2:

黑色素瘤患者的生存時間0

5

10

15

20

25

30

35

40

45

0

10203040

生存時間(月)人數偏態(tài)分布2:黑色素瘤患者的生存時間0510152064集中位置和離散趨勢124132140148156164010203040人數身高(cm)集中位置和離散趨勢124132140148156164010652.2描述集中位置的指標平均數(Average)算術均數(Mean)幾何均數(GeometricMean)中位數(Median)百分位數(Percentile)2.2描述集中位置的指標平均數(Average)算術均數66描述集中位置的指標:算術均數算術均數(arithmeticmean,mean,μ)

定義:

使用條件

單峰對稱分布、正態(tài)分布的資料描述集中位置的指標:算術均數算術均數(arithmetic67加權均數(weightedmean)

加權均數(weightedmean)68加權法計算實例(例2.1)100名成年男性血紅細胞均數計算表加權法計算實例(例2.1)100名成年男性血紅細胞均數計算表69描述集中位置的指標:幾何均數幾何均數(geometricmean,G)定義使用條件呈倍數關系變化或對數正態(tài)分布常用描述集中位置的指標:幾何均數幾何均數(geometricm70幾何均數計算實例1:10,1:20,1:40,1:80,1:160幾何均數計算實例1:10,1:20,1:40,171描述集中位置的指標:中位數中位數(median,M)

定義:將一組數據按從小到大的順序排列,位置居中的數即是中位數。使用條件:偏態(tài)分布資料、開口資料、分布不明計算描述集中位置的指標:中位數中位數(median,M)72中位數計算實例9例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.5

M=4.810例正常人的發(fā)汞值:

1.1,1.83.54.24.85.65.97.110.516.3

M=(4.8+5.6)/2=5.2

中位數計算實例9例正常人的發(fā)汞值:73中位數例對于某項風險較高的新手術術后的生存時間進行跟蹤,共調查了7人,6人死亡之前分別生存了5天、6天、10天、16天、25天、29天,還有一人術后30天隨訪時仍存活。本資料屬于“開口”資料。本例數據已經按從小到大的升序排列,n=7,為奇數,其中位數為16天。中位數例對于某項風險較高的新手術術后的生存時間進行跟蹤,共調74描述集中位置的指標:百分位數百分位數(percentile)X%

PX(100-X)%50%分位數就是中位數25%,75%分位數稱四分位數(quartile)

描述集中位置的指標:百分位數百分位數(percentile)75某地630名正常女性血清甘油三酯含量(ug/dl)甘油三酯頻數累積頻數累積頻率

10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合計630--某地630名正常女性血清甘油三酯含量(ug/dl)甘油三酯7613016081M?13016081M?77醫(yī)學統(tǒng)計學之集中趨勢的統(tǒng)計描述課件78平均數應用的注意事項同質的資料計算平均數才有意義根據資料分布的特征選用適當的平均數均數:單峰對稱分布的資料幾何均數:等比資料、滴度資料、正偏態(tài)資料中位數:理論上可用于任何分布資料,但當資料適合計算均數或幾何均數時,不宜用中位數。(偏態(tài)分布、分布不明資料、有不確定值的資料)平均數應用的注意事項同質的資料計算平均數才有意義79平均數應用的注意事項計算幾何均數時:變量值中不能有0

同一組變量值不能同時存在正、負值若變量值全為負值,可先將負號除去,算出結果后再冠以負號樣本含量較少時不宜計算靠近兩端的百分位數平均數要與變異指標結合使用平均數應用的注意事項計算幾何均數時:80例:只用平均數描述資料的弊病甲組2629303134均數30kg乙組2427303336均數30kg丙組2628303234均數30kg丙乙甲三組兒童體重的離散程度例:只用平均數描述資料的弊病甲組26293081描述離散趨勢的指標變異度極差(Range)四分位數間距(interquartilerange)方差(Variance)標準差(StandardDeviation)變異系數(

coefficientofvariation)描述離散趨勢的指標變異度極差(Range)四分位數間距(in82描述離散趨勢的指標:極差全距(range),極差

R=max-min意義:??優(yōu)點:簡單明了缺點:不靈敏:只考慮了最大、最小值

不穩(wěn)定:抽樣誤差大描述離散趨勢的指標:極差全距(range),極差83描述離散趨勢的指標:四分位數間距四分位數間距(inter-quartilerange)QU-QL=

P75-P25適用于偏態(tài)分布的資料離散程度指標描述偏態(tài)分布的資料的集中趨勢??描述離散趨勢的指標:四分位數間距四分位數間距(inter-q84離均差離均差之和?離均差平方和離均差平方和與觀察值的個數即樣本含量(n)有關離均差離均差平方和與觀察值的個數即樣本含量(n)有關85描述離散趨勢的指標:方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論