衛(wèi)生統(tǒng)計(jì)學(xué)-潘海燕-衛(wèi)統(tǒng)4-定量資料的統(tǒng)計(jì)描述-課件_第1頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)-潘海燕-衛(wèi)統(tǒng)4-定量資料的統(tǒng)計(jì)描述-課件_第2頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)-潘海燕-衛(wèi)統(tǒng)4-定量資料的統(tǒng)計(jì)描述-課件_第3頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)-潘海燕-衛(wèi)統(tǒng)4-定量資料的統(tǒng)計(jì)描述-課件_第4頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)-潘海燕-衛(wèi)統(tǒng)4-定量資料的統(tǒng)計(jì)描述-課件_第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)圖表1定量資料2【例【例4-1】2019年某市120名10歲男孩的身高(cm)資料如下。135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141.5 151.1132.5 138.7 149.6

2、146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 141.8134.5 139.4 142.9 147.5

3、 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5 定量資料3【問(wèn)題【問(wèn)題4-1】 該組數(shù)據(jù)為何種類(lèi)型資料?該組數(shù)據(jù)為何種類(lèi)型資料?如何描述如何描述10歲男孩身高的數(shù)量特征?歲男孩身高的數(shù)量特征?定量資料4本章主要內(nèi)容本章主要內(nèi)容頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 集中趨勢(shì)的描述集中趨勢(shì)的描述 離散趨勢(shì)的描述離散趨勢(shì)的描述正態(tài)分布及其應(yīng)用正態(tài)分布

4、及其應(yīng)用定量資料5第一節(jié)第一節(jié) 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖定量資料6 表達(dá)變量取值及其不同取值頻數(shù)分布情況的統(tǒng)表達(dá)變量取值及其不同取值頻數(shù)分布情況的統(tǒng)計(jì)表稱為頻數(shù)分布表,簡(jiǎn)稱頻數(shù)表(計(jì)表稱為頻數(shù)分布表,簡(jiǎn)稱頻數(shù)表(frequency table)。)。 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 頻數(shù)表頻數(shù)表定量資料7 頻數(shù)表的編制頻數(shù)表的編制 求極差(求極差(range) 找出一組觀察值中的最大值與最小值,其找出一組觀察值中的最大值與最小值,其差值即為極差(或全距),用差值即為極差(或全距),用R表示。表示。 如例如例4-1中中:R=155.4-130.2=25.2。 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 定量

5、資料82. 確定組數(shù)和組距(確定組數(shù)和組距(i) 根據(jù)樣本含量的大小及研究目的確定組數(shù);根據(jù)樣本含量的大小及研究目的確定組數(shù);一般設(shè)一般設(shè)815個(gè)組。個(gè)組。例例4-1:i=25.2/10=2.52,取整數(shù),取整數(shù)2做組距。做組距。 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 定量資料93. 確定組段確定組段 即確定每一組的起點(diǎn)(下限)和終點(diǎn)(上限)即確定每一組的起點(diǎn)(下限)和終點(diǎn)(上限) 。 起點(diǎn)稱為下限起點(diǎn)稱為下限(lower limit)終點(diǎn)稱為上限終點(diǎn)稱為上限(upper limit) 上限上限= =下限下限+ +組距組距 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 定量資料104. 歸組計(jì)數(shù),整理成表歸組計(jì)數(shù),整

6、理成表 確定組段界限后,采用計(jì)算機(jī)或用劃記法將確定組段界限后,采用計(jì)算機(jī)或用劃記法將各原始數(shù)據(jù)歸入各組匯總,得出各組段的觀各原始數(shù)據(jù)歸入各組匯總,得出各組段的觀察例數(shù),也就是頻數(shù)察例數(shù),也就是頻數(shù) 。 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 定量資料11表表4-1 2019年某市年某市120名名10歲男孩身高(歲男孩身高(cm)的頻數(shù)表)的頻數(shù)表身高身高(1)頻數(shù)頻數(shù)(2)頻率(頻率(%)(3)累計(jì)頻數(shù)累計(jì)頻數(shù)(4)累計(jì)頻率(累計(jì)頻率(%)(5)130132134136138140142144146148150152154156 1 3 4 8121721201410 6 3 1 0.8 2.5 3.3

7、 6.710.014.217.516.711.78.35.02.50.8 1 4 8 16 28 45 66 86100110116119120 0.8 3.3 6.713.323.337.555.071.783.391.796.799.2100.0合計(jì)合計(jì) 120 100.0 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 定量資料12 頻數(shù)表的用途頻數(shù)表的用途 揭示資料的頻數(shù)分布特征和頻數(shù)分布類(lèi)型揭示資料的頻數(shù)分布特征和頻數(shù)分布類(lèi)型 頻數(shù)分布的特征:頻數(shù)分布的特征: 集中趨勢(shì)(集中趨勢(shì)(central tendency) 離散趨勢(shì)(離散趨勢(shì)(dispersion) 頻數(shù)分布的類(lèi)型:頻數(shù)分布的類(lèi)型: 對(duì)稱分布

8、對(duì)稱分布 偏態(tài)分布偏態(tài)分布 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 定量資料13肌紅蛋白47.545.042.540.037.535.032.530.027.525.022.520.017.515.012.510.07.55.02.50.0人數(shù)121086420Std. Dev = 10.75 Mean = 27.1N = 91.00血清總膽固醇(mmol/L)5.755.505.255.004.754.504.254.003.753.503.253.002.752.502.2520100抗體滴度1250.01000.0750.0500.0250.00.03020100頻 數(shù)頻 數(shù)頻 數(shù)圖圖1 1011

9、 101名正常女子血清總膽固醇的頻數(shù)分布名正常女子血清總膽固醇的頻數(shù)分布圖2 69例RA患者血清EBV-VCA-IgG 抗體滴度的頻數(shù)分布圖3 101名正常人血清肌紅蛋白的頻數(shù)分布血清肌紅蛋白(g/ml)正(右)偏態(tài)正(右)偏態(tài)負(fù)(左)偏態(tài)負(fù)(左)偏態(tài)對(duì)稱分布對(duì)稱分布定量資料142.便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)處理便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)處理 可利用頻數(shù)表計(jì)算百分位數(shù)、中位數(shù)、標(biāo)準(zhǔn)差等可利用頻數(shù)表計(jì)算百分位數(shù)、中位數(shù)、標(biāo)準(zhǔn)差等 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 3. 便于發(fā)現(xiàn)某些特大或特小的可疑值。便于發(fā)現(xiàn)某些特大或特小的可疑值。定量資料15 頻數(shù)圖(頻數(shù)圖(graph of frequency)是以

10、變量值為橫)是以變量值為橫坐標(biāo)、頻數(shù)(頻率)為縱坐標(biāo)(不等距分組時(shí)以坐標(biāo)、頻數(shù)(頻率)為縱坐標(biāo)(不等距分組時(shí)以頻率頻率/組距組距=頻率密度為縱坐標(biāo)),以每個(gè)等寬的頻率密度為縱坐標(biāo)),以每個(gè)等寬的距形面積表示每組的頻數(shù)(或頻率)。距形面積表示每組的頻數(shù)(或頻率)。 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 頻數(shù)圖頻數(shù)圖定量資料16連續(xù)型定量資料:頻數(shù)圖中各距形是相連續(xù)型定量資料:頻數(shù)圖中各距形是相連的,又稱連的,又稱直方圖直方圖(histogram););離散型定量資料:頻數(shù)圖中各距形是間離散型定量資料:頻數(shù)圖中各距形是間隔的,又稱隔的,又稱直條圖直條圖(bar graph)。)。 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻

11、數(shù)圖 定量資料17圖4-1 2019年某市120名10歲男孩身高的頻數(shù)圖 頻數(shù)表和頻數(shù)圖頻數(shù)表和頻數(shù)圖 定量資料18第二節(jié)第二節(jié) 集中趨勢(shì)的描述集中趨勢(shì)的描述定量資料19定量資料集中趨勢(shì)的描述,常用平均數(shù)(定量資料集中趨勢(shì)的描述,常用平均數(shù)(average)表達(dá)一組同質(zhì)定量數(shù)據(jù)的平均水平或集中位置。表達(dá)一組同質(zhì)定量數(shù)據(jù)的平均水平或集中位置。 集中趨勢(shì)的描述集中趨勢(shì)的描述 算術(shù)均數(shù)算術(shù)均數(shù) 幾何均數(shù)幾何均數(shù) 中位數(shù)中位數(shù) 眾數(shù)眾數(shù) 調(diào)和均數(shù)調(diào)和均數(shù)定量資料20u又稱均數(shù)(又稱均數(shù)(mean),是用一組觀察值相),是用一組觀察值相加除以觀察值的個(gè)數(shù)所得。樣本均數(shù)用加除以觀察值的個(gè)數(shù)所得。樣本均數(shù)用

12、 ,總體均數(shù)用,總體均數(shù)用 。 算術(shù)均數(shù)(算術(shù)均數(shù)(arithmetic mean) x 集中趨勢(shì)的描述集中趨勢(shì)的描述 定量資料211. 計(jì)算方法計(jì)算方法直接法:樣本含量較少直接法:樣本含量較少 加權(quán)法:相同觀察值較多或頻數(shù)表資料加權(quán)法:相同觀察值較多或頻數(shù)表資料12nxxxxxnn1 12212iikkkif xf xf xf xxffff 集中趨勢(shì)的描述集中趨勢(shì)的描述 定量資料22【例【例4-2】 某醫(yī)生測(cè)量了某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮(名腦出血患者的血尿素氮(mmol/L)分別是:分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試,試計(jì)

13、算該組數(shù)據(jù)的均數(shù)。計(jì)算該組數(shù)據(jù)的均數(shù)。 集中趨勢(shì)的描述集中趨勢(shì)的描述 )/(3 . 7106 . 69 . 67 . 64 . 7Lmmolnxx定量資料23ifiif x【例【例4-3】根據(jù)表】根據(jù)表4-1資料,用加權(quán)法求120名10歲男孩身高的均數(shù)。身高(1)頻數(shù)fi(2)組中值xi(3)fixi(4)130132134136138140142144146148150152154156 1 3 48121721201410 6 3 1131133135137139141143145147149151153155 131 399 5401096166823973003290020581490

14、906459155合計(jì)120( )17202( )表表4-2 2019年某市年某市120名名10歲男孩身高(歲男孩身高(cm)的均數(shù)計(jì)算表)的均數(shù)計(jì)算表 集中趨勢(shì)的描述集中趨勢(shì)的描述 定量資料24121 131 3 133 4 1351 155 17202143.35 cm120i iikf xxffff 2. 應(yīng)用應(yīng)用 均數(shù)適用于均數(shù)適用于對(duì)稱分布對(duì)稱分布特別是特別是正態(tài)分布正態(tài)分布資料。資料。 集中趨勢(shì)的描述集中趨勢(shì)的描述 定量資料25u是是n個(gè)觀察值乘積的個(gè)觀察值乘積的n次方根,又稱倍數(shù)次方根,又稱倍數(shù)均數(shù),用均數(shù),用G表示表示 。 幾何均數(shù)(幾何均數(shù)(geometric mean) 集

15、中趨勢(shì)的描述集中趨勢(shì)的描述 定量資料261. 計(jì)算方法計(jì)算方法直接法:樣本含量較少直接法:樣本含量較少 加權(quán)法:相同觀察值較多或頻數(shù)表資料加權(quán)法:相同觀察值較多或頻數(shù)表資料 集中趨勢(shì)的描述集中趨勢(shì)的描述 1112lglglglglg ()lg ()nxxxxGnn11112212lglglglglg (lg ()iikkkifxfxfxfxGffff定量資料27 【例【例4-4】 某實(shí)驗(yàn)室測(cè)得某實(shí)驗(yàn)室測(cè)得7人血清中某種抗體的人血清中某種抗體的滴度分別為滴度分別為1/4,1/8,1/16,1/32,1/64,1/128,1/256,試求平均滴度。試求平均滴度。 集中趨勢(shì)的描述集中趨勢(shì)的描述 11

16、1lg4 lg8lg25610.5361lg () lg () lg 1.5052 3277G 定量資料28 集中趨勢(shì)的描述集中趨勢(shì)的描述 ifixlgixlgiifxiflgiifx【例【例4-6】50名麻疹易感兒接種麻疹疫苗后,測(cè)得血凝名麻疹易感兒接種麻疹疫苗后,測(cè)得血凝抑制抗體滴度資料見(jiàn)表抑制抗體滴度資料見(jiàn)表4-3,求抗體的平均滴度。,求抗體的平均滴度。86.9977抗體滴度抗體滴度(1)頻數(shù)頻數(shù) (2)滴度倒數(shù)滴度倒數(shù)(3)(4)(5)1/41/8 1/16 1/32 1/64 1/128 1/2561361013107 4 8 16 32 641282560.60210.90311.

17、20411.50511.80622.10722.4082 0.6021 2.7093 7.224615.505123.480621.072016.8574合計(jì)合計(jì)50表表4-3 50名麻疹易感兒血凝抑制抗體滴度名麻疹易感兒血凝抑制抗體滴度定量資料29 集中趨勢(shì)的描述集中趨勢(shì)的描述 1111 lg43 lg87 lg25686.9977lg (lg ()lg 1.7399541 3750G 50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為1/54。 定量資料302. 應(yīng)用及注意事項(xiàng)應(yīng)用及注意事項(xiàng)幾何均數(shù)適用幾何均數(shù)適用 對(duì)數(shù)正態(tài)分布對(duì)數(shù)正態(tài)分布 等比級(jí)數(shù)資料等比級(jí)數(shù)資料觀察值中不能有觀察值

18、中不能有0 實(shí)驗(yàn)設(shè)計(jì)的基本要素實(shí)驗(yàn)設(shè)計(jì)的基本要素 定量資料31 中位數(shù)與百分位數(shù)中位數(shù)與百分位數(shù) 集中趨勢(shì)的描述集中趨勢(shì)的描述 【例【例4-7】200名食物中毒患者潛伏期資料如表名食物中毒患者潛伏期資料如表4-4, 研究人員據(jù)此采用加權(quán)法計(jì)算均數(shù)得平均潛伏期研究人員據(jù)此采用加權(quán)法計(jì)算均數(shù)得平均潛伏期 為為27小時(shí)。小時(shí)。 (1)該組數(shù)據(jù)在分布上有何特點(diǎn)?該組數(shù)據(jù)在分布上有何特點(diǎn)? (2)用均數(shù)描述該資料的平均水平是否用均數(shù)描述該資料的平均水平是否合適?合適? 定量資料32 集中趨勢(shì)的描述集中趨勢(shì)的描述 表表4-4 200名食物中毒患者的潛伏期名食物中毒患者的潛伏期潛伏期(小時(shí))潛伏期(小時(shí))(

19、1)頻數(shù)頻數(shù)(2)累計(jì)頻數(shù)累計(jì)頻數(shù)(3)累計(jì)頻率(累計(jì)頻率(%)(4)=(3)/n030 3015.0127110150.5244914974.5362817889.0481419296.060 719999.57284 1200 100.0合計(jì)合計(jì) 200定量資料33u中位數(shù)(中位數(shù)(median):):將一組觀察值由小將一組觀察值由小到大排序后,居于中間位置的數(shù)值即為中到大排序后,居于中間位置的數(shù)值即為中位數(shù)位數(shù) ,用,用 表示。表示。M 中位數(shù)是一種位置平均數(shù),它將全部數(shù)據(jù)排列中位數(shù)是一種位置平均數(shù),它將全部數(shù)據(jù)排列成的有序數(shù)列平均分為兩部分,小于和大于中成的有序數(shù)列平均分為兩部分,小于

20、和大于中位數(shù)的觀察值個(gè)數(shù)相等,各占位數(shù)的觀察值個(gè)數(shù)相等,各占50%。 集中趨勢(shì)的描述集中趨勢(shì)的描述 定量資料341. 中位數(shù)的計(jì)算中位數(shù)的計(jì)算(1)直接法:觀察值個(gè)數(shù)較少)直接法:觀察值個(gè)數(shù)較少 集中趨勢(shì)的描述集中趨勢(shì)的描述 (1)2nMx1221()2nnMxx定量資料35 【例【例4-8】某實(shí)驗(yàn)師對(duì)】某實(shí)驗(yàn)師對(duì)10只小白鼠染毒后觀察各小鼠的生只小白鼠染毒后觀察各小鼠的生存時(shí)間(分鐘),得數(shù)據(jù)為:存時(shí)間(分鐘),得數(shù)據(jù)為:35,60,62,63,63,65,66,68,69,69,試計(jì)算小白鼠的平均生存時(shí)間。,試計(jì)算小白鼠的平均生存時(shí)間。 集中趨勢(shì)的描述集中趨勢(shì)的描述 61265nxx122

21、11()(6365)6422nnMxx6352 xxn定量資料36(2)頻數(shù)表法)頻數(shù)表法 :頻數(shù)表資料:頻數(shù)表資料LM 中位數(shù)所在組段下限中位數(shù)所在組段下限 Mf Lfi組距組距 中位數(shù)所在組段的頻數(shù)中位數(shù)所在組段的頻數(shù) 中位數(shù)所在組段前一組的累計(jì)頻數(shù)中位數(shù)所在組段前一組的累計(jì)頻數(shù))2(LMMfnfiLM定量資料37 集中趨勢(shì)的描述集中趨勢(shì)的描述 求:下表求:下表200名食物中毒患者的平均潛伏期名食物中毒患者的平均潛伏期潛伏期(小時(shí))潛伏期(小時(shí))(1)頻數(shù)頻數(shù)(2)累計(jì)頻數(shù)累計(jì)頻數(shù)(3)累計(jì)頻率(累計(jì)頻率(%)(4)=(3)/n030 3015.0127110150.5244914974.

22、5362817889.0481419296.060 719999.57284 1200 100.0合計(jì)合計(jì) 200定量資料38 集中趨勢(shì)的描述集中趨勢(shì)的描述 (小時(shí)) 8 .23)302200(711212)2(LMMfnfiLM定量資料39u百分位數(shù)(百分位數(shù)(percentile):):是指將一組觀是指將一組觀察值由小到大排序后,將其平均分成察值由小到大排序后,將其平均分成100等份,對(duì)應(yīng)于每一分割位置上的數(shù)值就稱等份,對(duì)應(yīng)于每一分割位置上的數(shù)值就稱為一個(gè)百分位數(shù),用為一個(gè)百分位數(shù),用 表示表示 。 集中趨勢(shì)的描述集中趨勢(shì)的描述 xP定量資料40 是一種位置指標(biāo),一個(gè)百分位數(shù)將一組觀是一種

23、位置指標(biāo),一個(gè)百分位數(shù)將一組觀察值分為兩部分,理論上有察值分為兩部分,理論上有x%的觀察值比它小,的觀察值比它小,有(有(100-x)%的觀察值比它大。的觀察值比它大。 集中趨勢(shì)的描述集中趨勢(shì)的描述 xP(%)xLxiPLn xff定量資料41【例【例4-10】根據(jù)表】根據(jù)表4-4,計(jì)算,計(jì)算P25、P75。 集中趨勢(shì)的描述集中趨勢(shì)的描述 38.15)30%25200(711212)%(25LxfxnfiLP0 .36)150%75200(281236)%(75LxfxnfiLP定量資料422. 中位數(shù)與百分位數(shù)的應(yīng)用中位數(shù)與百分位數(shù)的應(yīng)用中中 位位 數(shù):數(shù): 偏態(tài)分布資料偏態(tài)分布資料 一端或

24、兩端無(wú)確切值一端或兩端無(wú)確切值 總體分布不明總體分布不明百分位數(shù):百分位數(shù):非正態(tài)分布資料非正態(tài)分布資料 集中趨勢(shì)的描述集中趨勢(shì)的描述 定量資料43第三節(jié)第三節(jié) 離散趨勢(shì)的描述離散趨勢(shì)的描述 定量資料44 【例【例4-11】分別觀察兩組各分別觀察兩組各9只動(dòng)物的每日進(jìn)只動(dòng)物的每日進(jìn)食量(食量(mg/g),結(jié)果如下:),結(jié)果如下: A組組 24 25 26 27 28 29 30 31 32 B組組 20 21 22 23 24 25 26 27 64兩組動(dòng)物每日進(jìn)食量的平均數(shù),均為兩組動(dòng)物每日進(jìn)食量的平均數(shù),均為28mg/g。 定量資料45離散趨勢(shì)是頻數(shù)分布的另一特征,反映離散趨勢(shì)是頻數(shù)分布的

25、另一特征,反映了觀察值之間的變異情況,只有將了觀察值之間的變異情況,只有將集中集中趨勢(shì)趨勢(shì)與與離散趨勢(shì)離散趨勢(shì)結(jié)合起來(lái)描述才能全面結(jié)合起來(lái)描述才能全面反映定量資料的數(shù)量特征。反映定量資料的數(shù)量特征。 定量資料46描述離散描述離散趨勢(shì)指標(biāo)趨勢(shì)指標(biāo) 極差極差 四分位間距四分位間距 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 變異系數(shù)變異系數(shù)定量資料47極差(極差(range,R):亦稱全距,是一組同質(zhì)觀):亦稱全距,是一組同質(zhì)觀察值中最大值(察值中最大值( )與最小值()與最小值( )之差。)之差。 極極 差差 概念概念maxxminxmaxmin Rxx定量資料48只考慮最大值與最小值之差異,不能只考慮最大值與最小值之差異,

26、不能 反映組內(nèi)其它觀察值的變異度反映組內(nèi)其它觀察值的變異度樣本含量越大,極差可能越大樣本含量越大,極差可能越大 極極 差差 不足之處不足之處定量資料49四分位數(shù)間距(四分位數(shù)間距(inter-quartile range,Q):):為上四分位數(shù)為上四分位數(shù)QU(即(即P75)與下四分位數(shù))與下四分位數(shù)QL (即(即P25)之差。)之差。 四分位數(shù)間距四分位數(shù)間距 概念概念 ULQQQ定量資料50 【例【例4-12】根據(jù)例】根據(jù)例4-7資料,計(jì)算四分位數(shù)間距。資料,計(jì)算四分位數(shù)間距。 小時(shí)小時(shí) 小時(shí)小時(shí) 四分位數(shù)間距:四分位數(shù)間距: (小時(shí))(小時(shí)) 38.1525 PQL00.3675 PQU

27、62.20LUQQQ定量資料51每個(gè)觀察值每個(gè)觀察值x與與 間的變異稱為離均差間的變異稱為離均差由于由于變異程度用離均差平方和反應(yīng)變異程度用離均差平方和反應(yīng) 方方 差差 0 x2x考慮觀察值個(gè)數(shù)考慮觀察值個(gè)數(shù)N N的影響的影響 22()xN定量資料52在實(shí)際工作中在實(shí)際工作中 方方 差差 22()1xxSnn-1稱為自由度稱為自由度( degree of freedom)方差適用:方差適用:描述對(duì)稱分布特別是正態(tài)分布資料的離散程度。描述對(duì)稱分布特別是正態(tài)分布資料的離散程度。 定量資料53方差的度量單位是原度量單位的平方方差的度量單位是原度量單位的平方 方差開(kāi)方后即與原數(shù)據(jù)的度量單位相同,這就是

28、方差開(kāi)方后即與原數(shù)據(jù)的度量單位相同,這就是標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standard deviation) 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 2()xN定量資料54在實(shí)際工作中在實(shí)際工作中 n-1稱為自由度稱為自由度( degree of freedom)標(biāo)準(zhǔn)差適用:標(biāo)準(zhǔn)差適用:描述對(duì)稱分布特別是正態(tài)分布資料的離散程度。描述對(duì)稱分布特別是正態(tài)分布資料的離散程度。 2()1xxSn 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 定量資料55數(shù)學(xué)上可以證明 222()()xxxSSlxxxn22()1xxnSn22()1iiiiiif xf xfSf 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 定量資料56【例【例4-13】 某醫(yī)生測(cè)量了某醫(yī)生測(cè)量了10名腦出血患者的血尿素氮名腦出血患者的

29、血尿素氮(mmol/L)分別是:)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計(jì)算該組數(shù)據(jù)的標(biāo)準(zhǔn)差。,試計(jì)算該組數(shù)據(jù)的標(biāo)準(zhǔn)差。2222222()(7.46.76.96.6 ) (7.4 6.7 6.96.6) /100.61(mmol/L)110 1xxnSn 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 定量資料57身高身高(1)頻數(shù)頻數(shù)(2)頻率(頻率(%)(3)累計(jì)頻數(shù)累計(jì)頻數(shù)(4)累計(jì)頻率(累計(jì)頻率(%)(5)130132134136138140142144146148150152154156 1 3 4 8121721201410 6 3 1 0.8 2.5 3.3 6

30、.710.014.217.516.711.78.35.02.50.8 1 4 8 16 28 45 66 86100110116119120 0.8 3.3 6.713.323.337.555.071.783.391.796.799.2100.0合計(jì)合計(jì) 120 100.0【例【例4-14】根據(jù)下表資料,計(jì)算】根據(jù)下表資料,計(jì)算120名名10歲男孩身高的標(biāo)準(zhǔn)差。歲男孩身高的標(biāo)準(zhǔn)差。 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 定量資料58222()(17202)24686321204.79(cm)1120 1iiiiiif xf xfSf 標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差 定量資料59 【例【例4-15】某醫(yī)院預(yù)防保健科,對(duì)一組】某醫(yī)院預(yù)防保

31、健科,對(duì)一組5歲男孩進(jìn)歲男孩進(jìn)行體檢,測(cè)量身高、體重等指標(biāo)。得身高均數(shù)與行體檢,測(cè)量身高、體重等指標(biāo)。得身高均數(shù)與標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為115.8 cm和和4.5 cm,體重均數(shù)與標(biāo)準(zhǔn)差為,體重均數(shù)與標(biāo)準(zhǔn)差為20.2kg和和0.56 kg,得出結(jié)論:身高的變異程度比,得出結(jié)論:身高的變異程度比體重大。體重大。 變異系數(shù)變異系數(shù) 上述結(jié)論是否正確?上述結(jié)論是否正確? 定量資料60變異系數(shù)(變異系數(shù)(coefficient of variation,簡(jiǎn)記為簡(jiǎn)記為CV):):是一組觀察值的標(biāo)準(zhǔn)差與其均數(shù)的比值,是一組觀察值的標(biāo)準(zhǔn)差與其均數(shù)的比值, 概念概念 變異系數(shù)變異系數(shù) 100%SCVx 度量衡單位不

32、同的資料度量衡單位不同的資料 單位相同但均數(shù)相差懸殊的兩組或多組資料單位相同但均數(shù)相差懸殊的兩組或多組資料 適用于適用于定量資料61 變異系數(shù)變異系數(shù) 根據(jù)例根據(jù)例4-15資料分別計(jì)算身高與體重的變異系數(shù)。資料分別計(jì)算身高與體重的變異系數(shù)。身高:身高:4.5100%100%3.89%115.8SCVx體重:體重: 0.56100%100%2.77%20.2SCVx定量資料62描述數(shù)值變量資料集中趨勢(shì)的指標(biāo)描述數(shù)值變量資料集中趨勢(shì)的指標(biāo)定量資料63描述數(shù)值變量資料離散趨勢(shì)的指標(biāo)描述數(shù)值變量資料離散趨勢(shì)的指標(biāo)定量資料64第四節(jié)第四節(jié) 正態(tài)分布及其應(yīng)用正態(tài)分布及其應(yīng)用定量資料65 正態(tài)分布的概念與特

33、征正態(tài)分布的概念與特征 圖圖4-1 120名名10歲男孩身高資料的頻數(shù)圖歲男孩身高資料的頻數(shù)圖 定量資料66 正態(tài)分布的概念與特征正態(tài)分布的概念與特征 定量資料67正態(tài)分布(正態(tài)分布(normal distribution)稱為高斯分)稱為高斯分布(布(Gauss distribution),如果連續(xù)型隨機(jī)),如果連續(xù)型隨機(jī)變量變量X的概率密度函數(shù)為:的概率密度函數(shù)為: 概念概念 正態(tài)分布的概念與特征正態(tài)分布的概念與特征 則稱隨機(jī)變量則稱隨機(jī)變量X服從參數(shù)為服從參數(shù)為 和和 的正態(tài)分布,的正態(tài)分布,記作:記作: 22()21( )2xf xex ,XN 定量資料68正態(tài)曲線(正態(tài)曲線(norm

34、al curve)在橫軸上方均數(shù))在橫軸上方均數(shù)處最高;并以均數(shù)為中心,左右對(duì)稱;兩端處最高;并以均數(shù)為中心,左右對(duì)稱;兩端與橫軸永不相交,呈鐘形的曲線。與橫軸永不相交,呈鐘形的曲線。 正態(tài)分布特征正態(tài)分布特征 正態(tài)分布的概念與特征正態(tài)分布的概念與特征 正態(tài)曲線正態(tài)曲線定量資料69正態(tài)分布有兩個(gè)參數(shù),即位置參數(shù)正態(tài)分布有兩個(gè)參數(shù),即位置參數(shù) 和形狀和形狀參數(shù)參數(shù) 正態(tài)分布的概念與特征正態(tài)分布的概念與特征 -6-5-4-3-2-10123456321123位置參數(shù)定量資料70-3-2-10123332121形態(tài)參數(shù) 正態(tài)分布的概念與特征正態(tài)分布的概念與特征 定量資料71 正態(tài)分布的概念與特征正態(tài)

35、分布的概念與特征 正態(tài)曲線下面積的分布有一定的規(guī)律。正態(tài)曲線下面積的分布有一定的規(guī)律。 正態(tài)曲線與橫軸之間的面積恒等于正態(tài)曲線與橫軸之間的面積恒等于1或或100%;對(duì)稱分布,對(duì)稱軸兩側(cè)的面積各為對(duì)稱分布,對(duì)稱軸兩側(cè)的面積各為50;在在 區(qū)間的面積為區(qū)間的面積為68.27 在在 區(qū)間的面積為區(qū)間的面積為95.00 在在 區(qū)間的面積為區(qū)間的面積為99.00 ,1.96 ,1.96 2.58 ,2.58 定量資料72 正態(tài)分布的概念與特征正態(tài)分布的概念與特征 -2.58 -1.96 - + +1.96 +2.58 68.27% 95.00% 99.00% -3-2-10123定量資料73思考:能否編

36、制正態(tài)曲線下面積的分布表,然思考:能否編制正態(tài)曲線下面積的分布表,然 后通過(guò)查表來(lái)確定某區(qū)間對(duì)應(yīng)的面積呢?后通過(guò)查表來(lái)確定某區(qū)間對(duì)應(yīng)的面積呢? 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布 統(tǒng)計(jì)學(xué)家發(fā)現(xiàn),可以使所有的正態(tài)分布轉(zhuǎn)化為統(tǒng)統(tǒng)計(jì)學(xué)家發(fā)現(xiàn),可以使所有的正態(tài)分布轉(zhuǎn)化為統(tǒng)一的一的 的正態(tài)分布,該正態(tài)分布稱為的正態(tài)分布,該正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution)。)。 01定量資料74 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布 這種變換稱為標(biāo)準(zhǔn)化變換或這種變換稱為標(biāo)準(zhǔn)化變換或Z變換。若變換。若X服從正服從正態(tài)分布態(tài)分布 ,則,則Z就服從就服從 。 ,N 0,1NXZ01定量

37、資料75標(biāo)準(zhǔn)正態(tài)分布曲線下面積分布規(guī)律定量資料76 【例【例4-18】 已知某地已知某地2019年年18歲男大學(xué)生身高的歲男大學(xué)生身高的均數(shù)均數(shù) cm,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差 cm,且,且18歲歲男大學(xué)生的身高服從正態(tài)分布。問(wèn)該地男大學(xué)生的身高服從正態(tài)分布。問(wèn)該地18歲男大歲男大學(xué)生中身高在學(xué)生中身高在166.8 cm及其以下者占多大的比例?及其以下者占多大的比例? 標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布 173.503.42先將先將x轉(zhuǎn)換為轉(zhuǎn)換為z ()/(166.8 173.5)/3.421.96zx 查附表查附表3 3 表的左側(cè)找表的左側(cè)找-1.9,表的上方找,表的上方找0.06,相交處為,相交處為0.025

38、 定量資料77 【例【例4-19】某地】某地2019年抽樣調(diào)查了年抽樣調(diào)查了100名名18歲男大學(xué)歲男大學(xué)生身高,算得均數(shù)為生身高,算得均數(shù)為172.70cm,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為4.01cm。 正態(tài)分布的應(yīng)用正態(tài)分布的應(yīng)用 估計(jì)正態(tài)分布資料的頻數(shù)分布估計(jì)正態(tài)分布資料的頻數(shù)分布 【問(wèn)題】【問(wèn)題】該地該地18歲男大學(xué)生中身高在歲男大學(xué)生中身高在162.35cm183.05cm范范圍內(nèi)者所占的比例是多少?圍內(nèi)者所占的比例是多少?定量資料78查附表查附表3, 左側(cè)的面積為左側(cè)的面積為0.005,由正態(tài)分布曲,由正態(tài)分布曲線的對(duì)稱性可知,線的對(duì)稱性可知, 右側(cè)的面積也為右側(cè)的面積也為0.005,又,又由

39、正態(tài)分布曲線下的總面積為由正態(tài)分布曲線下的總面積為1,可得,可得-2.58與與2.58之間之間的面積為的面積為1-20.005=0.99=99% 。11()/(162.35 172.0)/4.012.58zxxS 22()/(183.05 172.7)/4.012.58zxxS58. 22Z58. 21Z定量資料79 正態(tài)分布的應(yīng)用正態(tài)分布的應(yīng)用 制定醫(yī)學(xué)參考值范圍制定醫(yī)學(xué)參考值范圍 醫(yī)學(xué)參考值范圍:亦稱正常值范圍,指絕大多醫(yī)學(xué)參考值范圍:亦稱正常值范圍,指絕大多數(shù)數(shù)“正常人正常人”的解剖、生理、生化等指標(biāo)的波的解剖、生理、生化等指標(biāo)的波動(dòng)范圍。動(dòng)范圍。 所謂所謂“正常人正常人”不是指絕對(duì)的不是指絕對(duì)的“健康人健康人”,而,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論