第四章定量資料的統(tǒng)計(jì)描述_第1頁
第四章定量資料的統(tǒng)計(jì)描述_第2頁
第四章定量資料的統(tǒng)計(jì)描述_第3頁
第四章定量資料的統(tǒng)計(jì)描述_第4頁
第四章定量資料的統(tǒng)計(jì)描述_第5頁
已閱讀5頁,還剩69頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1變量變量類型類型定量變量定量變量定性變量定性變量無序分類無序分類有序分類有序分類:如血清反應(yīng)如血清反應(yīng),治療效果等治療效果等二項(xiàng)分類二項(xiàng)分類:如生死如生死,有效無效等有效無效等多項(xiàng)分類多項(xiàng)分類:如血型如血型,職業(yè)特征等職業(yè)特征等連續(xù)型變量連續(xù)型變量:如如:身高身高,體重體重離散型變量離散型變量:如子女?dāng)?shù)如子女?dāng)?shù),脈搏數(shù)脈搏數(shù)2資料辨認(rèn)病例號病例號年齡年齡身高身高血型血型心電圖心電圖尿尿WBC產(chǎn)前檢產(chǎn)前檢查次數(shù)查次數(shù)職業(yè)職業(yè)1351.65A正常正常0教師教師2441.74B正常正常3工人工人3261.80O正常正常2職員職員4251.61AB正常正常1農(nóng)民農(nóng)民5411.71A異常異常+5工人工

2、人6451.58B正常正常+6工人工人7501.60O異常異常+3干部干部8281.76AB正常正常+2干部干部9311.62O正常正常3軍人軍人3n統(tǒng)計(jì)分析的內(nèi)容統(tǒng)計(jì)分析的內(nèi)容統(tǒng)計(jì)描述統(tǒng)計(jì)描述:是用統(tǒng)計(jì)表、統(tǒng)計(jì)圖、統(tǒng)計(jì)指標(biāo):是用統(tǒng)計(jì)表、統(tǒng)計(jì)圖、統(tǒng)計(jì)指標(biāo)來描述資料的分布規(guī)律及其數(shù)量特征。來描述資料的分布規(guī)律及其數(shù)量特征。 把握資料的基本特征把握資料的基本特征; 為統(tǒng)計(jì)推斷打下基礎(chǔ)為統(tǒng)計(jì)推斷打下基礎(chǔ)。 統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷:在醫(yī)學(xué)科學(xué)研究中通常應(yīng)用抽樣:在醫(yī)學(xué)科學(xué)研究中通常應(yīng)用抽樣研究的方法,即對總體中隨機(jī)抽取的部分觀研究的方法,即對總體中隨機(jī)抽取的部分觀察單位察單位(樣本樣本)進(jìn)行研究,然后用樣本

3、信息推進(jìn)行研究,然后用樣本信息推斷總體特征,即統(tǒng)計(jì)推斷。斷總體特征,即統(tǒng)計(jì)推斷。4 第四章定量資料的統(tǒng)計(jì)分析 第一節(jié)第一節(jié) 頻數(shù)分布表和頻數(shù)分布圖頻數(shù)分布表和頻數(shù)分布圖第二節(jié)第二節(jié) 集中趨勢的統(tǒng)計(jì)描述集中趨勢的統(tǒng)計(jì)描述第三節(jié)第三節(jié) 離散趨勢的統(tǒng)計(jì)描述離散趨勢的統(tǒng)計(jì)描述第四節(jié)第四節(jié) 正態(tài)分布及其應(yīng)用正態(tài)分布及其應(yīng)用本章內(nèi)容本章內(nèi)容6第一節(jié)第一節(jié) 頻數(shù)分布表和頻數(shù)分布表和 頻數(shù)分布圖頻數(shù)分布圖一、頻數(shù)分布表一、頻數(shù)分布表二、頻數(shù)分布圖二、頻數(shù)分布圖7一、頻數(shù)分布表一、頻數(shù)分布表對一個(gè)隨機(jī)現(xiàn)象進(jìn)行重復(fù)觀察,其中對一個(gè)隨機(jī)現(xiàn)象進(jìn)行重復(fù)觀察,其中某變量值(隨機(jī)事件)出現(xiàn)的次數(shù)被稱作某變量值(隨機(jī)事件)出

4、現(xiàn)的次數(shù)被稱作頻數(shù)頻數(shù)(frequencyfrequency)。)。把變量值及相對應(yīng)的頻數(shù)列成表格即頻數(shù)把變量值及相對應(yīng)的頻數(shù)列成表格即頻數(shù)分布表分布表, ,簡稱簡稱頻數(shù)表頻數(shù)表(frequency tablefrequency table)。)。 8連續(xù)性變量的頻數(shù)表的編制連續(xù)性變量的頻數(shù)表的編制例例4.2 在某市在某市2005年進(jìn)行的小學(xué)生體質(zhì)評價(jià)研究中,年進(jìn)行的小學(xué)生體質(zhì)評價(jià)研究中,測定了測定了120名名9歲男孩的肺活量歲男孩的肺活量(L),資料如下,根,資料如下,根據(jù)該資料制作頻數(shù)表。據(jù)該資料制作頻數(shù)表。 1.706 1.326 1.632 1.876 2.161 1.684 1.53

5、3 1.175 1.867 1.676 2.091 1.847 1.213 1.277 0.989 2.235 1.665 1.289 1.724 1.548 1.608 1.890 1.733 1.796 1.203 1.736 1.450 1.633 1.555 1.352 1.291 1.796 1.647 1.415 1.873 0.996 1.936 1.526 1.424 1.589 1.670 1.056 1.969 1.481 2.406 2.123 1.988 1.512 1.030 1.886 1.930 1.725 1.374 1.654 1.663 1.438 1.64

6、5 1.214 1.184 1.735 你能看出資料有什么規(guī)律?你能看出資料有什么規(guī)律?9編制步驟:編制步驟: 確定全距(確定全距(range) 全部觀察值中最大值與最小值之差,用符號全部觀察值中最大值與最小值之差,用符號R表示。表示。又稱又稱極差極差。本例極差:。本例極差: R = 2.406-0.980 = 1.417(L )。1.706 1.326 1.632 1.876 2.161 1.684 1.533 1.175 1.867 1.676 2.091 1.847 1.213 1.277 0.989 2.235 1.665 1.289 1.724 1.548 1.608 1.890 1

7、.733 1.796 1.203 1.736 1.450 1.633 1.555 1.352 1.291 1.796 1.647 1.415 1.873 0.996 1.936 1.526 1.424 1.589 1.670 1.056 1.969 1.481 2.406 2.123 1.988 1.512 1.030 1.886 1.930 1.725 1.374 1.654 1.663 1.438 1.645 1.214 1.184 1.735 R = 2.406-0.980 = 1.417(L ) 劃分組段劃分組段 確定確定組數(shù)組數(shù):觀察單位及其全距定:觀察單位及其全距定:本例本例11確

8、定確定組距組距:等距分組,組距:等距分組,組距R/組數(shù)。組數(shù)。本例本例i = R=1.417/11=0.1290.130確定確定各組段上下限各組段上下限:每組段的起點(diǎn)稱為該組的下限:每組段的起點(diǎn)稱為該組的下限(low limit),終點(diǎn)稱為終點(diǎn)稱為上限上限(upper limit)。第一組段必須包含最小值。第一組段必須包含最小值。最后一個(gè)組段最后一個(gè)組段上限必須包上限必須包含最大值含最大值。 統(tǒng)計(jì)各組頻數(shù)統(tǒng)計(jì)各組頻數(shù)采用計(jì)算機(jī)或手工劃記匯總,得到各組段采用計(jì)算機(jī)或手工劃記匯總,得到各組段相應(yīng)的頻數(shù)。相應(yīng)的頻數(shù)。11根據(jù)這些數(shù)據(jù)編制成的頻數(shù)表能顯示出這組數(shù)據(jù)分布的特征根據(jù)這些數(shù)據(jù)編制成的頻數(shù)表能

9、顯示出這組數(shù)據(jù)分布的特征12二、頻數(shù)分布圖二、頻數(shù)分布圖 以觀測變量為橫軸,頻數(shù)以觀測變量為橫軸,頻數(shù)(或頻率或頻率)為縱軸所為縱軸所作的直方圖,稱為頻數(shù)分布圖。橫軸依次以等距作的直方圖,稱為頻數(shù)分布圖。橫軸依次以等距標(biāo)出各組段的起點(diǎn),在各組段上方分別繪制標(biāo)出各組段的起點(diǎn),在各組段上方分別繪制寬度寬度等于組距、高度等于相應(yīng)頻數(shù)等于組距、高度等于相應(yīng)頻數(shù)的長方形。的長方形。 用途與頻數(shù)表類似,但用途與頻數(shù)表類似,但更直觀、形象。更直觀、形象。13圖圖4.1 20054.1 2005年某市年某市120120名名9 9歲男孩肺活量頻數(shù)分布?xì)q男孩肺活量頻數(shù)分布 141)頻數(shù)分布特征)頻數(shù)分布特征n集

10、中 趨 勢集 中 趨 勢 ( c e n t r a l tendency)一組數(shù)據(jù)向某一組數(shù)據(jù)向某一個(gè)位置聚集或集中的一個(gè)位置聚集或集中的傾向。例如本例,肺活傾向。例如本例,肺活量有大有小,但中等居量有大有小,但中等居多,此為集中趨勢。多,此為集中趨勢。n離散程度離散程度(dispersion):一組數(shù)據(jù)的分散性或變一組數(shù)據(jù)的分散性或變異度。離異度。離“中心中心”位置位置越遠(yuǎn),頻數(shù)越小;即少越遠(yuǎn),頻數(shù)越??;即少數(shù)人具有較大或較小的數(shù)人具有較大或較小的肺活量,表現(xiàn)了肺活量肺活量,表現(xiàn)了肺活量分布的離散趨勢。分布的離散趨勢。15n集中趨勢集中趨勢:高峰組段的位置:高峰組段的位置n離散趨勢離散趨勢

11、:觀察值的分布范圍:觀察值的分布范圍162)頻數(shù)分布的類型頻數(shù)分布的類型對稱分布:集中位置在正中,左右兩側(cè)大體對稱。對稱分布:集中位置在正中,左右兩側(cè)大體對稱。偏態(tài)分布:集中位置偏向一側(cè),頻數(shù)分布不對稱。偏態(tài)分布:集中位置偏向一側(cè),頻數(shù)分布不對稱。 正偏態(tài)分布正偏態(tài)分布* 分布類型不同,采用的統(tǒng)計(jì)方法不同分布類型不同,采用的統(tǒng)計(jì)方法不同負(fù)偏態(tài)分布負(fù)偏態(tài)分布負(fù)偏態(tài)分布負(fù)偏態(tài)分布圖12-1 160名正常成年女子的血清甘油三酯的頻數(shù)分布圖05101520250.50 0.70 0.90 1.10 1.30 1.50 1.70 1.90血清甘油三酯(mmol/L)頻數(shù)頻數(shù)分布高峰(集頻數(shù)分布高峰(集中

12、位置)位于中部、中位置)位于中部、兩邊低、左右對稱。兩邊低、左右對稱。1.1.對稱分布:對稱分布:實(shí)例實(shí)例1819是否為對稱分布?20圖圖4.2 20044.2 2004年我國麻疹患者的年齡分布年我國麻疹患者的年齡分布 2.2.正偏態(tài)分布:正偏態(tài)分布:集中位置偏向數(shù)值小集中位置偏向數(shù)值小的一側(cè),高峰偏于左的一側(cè),高峰偏于左側(cè),長尾向右延伸。側(cè),長尾向右延伸。21轉(zhuǎn)氨酶含量 人 數(shù) 12 2 15 9 18 14 21 23 24 19 27 14 30 11 33 9 36 7 39 4 4245 3 表表4-2 115名正常成年女子血清轉(zhuǎn)氨酶名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布)

13、含量分布 22圖圖4.3 4.3 某市某市219219名乳腺癌患者術(shù)后康復(fù)期生存質(zhì)量評分的分布名乳腺癌患者術(shù)后康復(fù)期生存質(zhì)量評分的分布 頻頻數(shù)數(shù)評分評分集中位置偏向數(shù)值大集中位置偏向數(shù)值大的一側(cè),高峰偏于右的一側(cè),高峰偏于右側(cè),長尾向左延伸。側(cè),長尾向左延伸。3.3.負(fù)偏態(tài)分布:負(fù)偏態(tài)分布:23肌 紅 蛋 白 含 量 人 數(shù) 0 2 5 3 10 7 15 9 20 10 25 22 30 23 35 14 40 9 45 50 2 表表4-3 101名正常人的血清肌紅蛋白含量分布名正常人的血清肌紅蛋白含量分布g/mL24(三)頻數(shù)分布表和頻數(shù)分布圖的用途(三)頻數(shù)分布表和頻數(shù)分布圖的用途1.

14、反映頻數(shù)分布的兩個(gè)重要特征;反映頻數(shù)分布的兩個(gè)重要特征;集中趨勢集中趨勢:變量值的中心數(shù)值或中心位置所在。變量值的中心數(shù)值或中心位置所在。離散趨勢離散趨勢:變量值圍繞中心數(shù)值或中心位置的分布情況。變量值圍繞中心數(shù)值或中心位置的分布情況。2.揭示資料的分布類型;揭示資料的分布類型; 對稱分布:頻數(shù)分布高峰位于中部;對稱分布:頻數(shù)分布高峰位于中部; 偏態(tài)分布:高峰偏于一側(cè)。偏態(tài)分布:高峰偏于一側(cè)。3.便于發(fā)現(xiàn)某些特大或特小的可疑值;便于發(fā)現(xiàn)某些特大或特小的可疑值;4.便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析處理。便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析處理。25n 4便于進(jìn)一步做統(tǒng)計(jì)分析和處理便于進(jìn)一步做統(tǒng)計(jì)分析和處理2

15、6第二節(jié)、第二節(jié)、集中趨勢的描述集中趨勢的描述 描述一組同質(zhì)觀察值的平均水平或中描述一組同質(zhì)觀察值的平均水平或中心位置的常用的指標(biāo)有心位置的常用的指標(biāo)有算術(shù)均數(shù)算術(shù)均數(shù)、幾幾何均數(shù)何均數(shù)、中位數(shù)中位數(shù)等。等。271 1、算術(shù)均數(shù)、算術(shù)均數(shù),mean,meann適用條件:單峰對稱分布,特別是正態(tài)或近適用條件:單峰對稱分布,特別是正態(tài)或近似正態(tài)分布的定量資料。似正態(tài)分布的定量資料。n符號:符號: 表示樣本均數(shù),希臘字母表示樣本均數(shù),希臘字母 表示表示總體均數(shù)??傮w均數(shù)。X28計(jì)算方法:計(jì)算方法:n(1)直接法)直接法(小樣本(小樣本) nXnXXXXn 2129n如:如: 7名正常女子血清總膽固醇

16、(名正常女子血清總膽固醇(mmol/L)分)分別為:別為:4.21,3.32,5.35,4.17,4.14,3.58,4.34。試計(jì)算其平均數(shù)。試計(jì)算其平均數(shù)。)/(16. 4734. 4.32. 321. 4.21LmmolnXnXXXXnn例例4.3:例:例4.2 某市某市2005年年120名名9歲男孩的肺活量歲男孩的肺活量(L)的平均數(shù)的平均數(shù))(672. 1.21LnXnXXXXn30(2)頻數(shù)表法)頻數(shù)表法(加權(quán)法(加權(quán)法) Xf Xf Xf XffffXfkkk112212 當(dāng)觀察值個(gè)數(shù)較多時(shí),可先把原始資料分組,當(dāng)觀察值個(gè)數(shù)較多時(shí),可先把原始資料分組,列出頻數(shù)表,計(jì)算均數(shù)時(shí)將各組

17、頻數(shù)乘以相應(yīng)組列出頻數(shù)表,計(jì)算均數(shù)時(shí)將各組頻數(shù)乘以相應(yīng)組的組中值,逐個(gè)相加求和,除以總例數(shù)。的組中值,逐個(gè)相加求和,除以總例數(shù)。X1, X2, , Xk:頻數(shù)表資料中各組段的頻數(shù)表資料中各組段的組中值組中值;f1, f2, , fk:相應(yīng)組段的相應(yīng)組段的頻數(shù)頻數(shù)。31表4.2 120名9歲男孩肺活量均數(shù)的計(jì)算肺活量組段 (1)頻數(shù)f (2)組中值x (3) fx(4)=(2)(3)0.98051.0455.2251.11051.1755.8751.24071.3109.1701.370141.43520.091.500191.56529.735.)(673.14.5345.24.045.15L

18、fXfXiii)(672. 1.21LnXnXXXXn32 均數(shù)的應(yīng)用范圍及條件均數(shù)的應(yīng)用范圍及條件:1.均數(shù)反映一組同質(zhì)觀察值的平均水平,并可作均數(shù)反映一組同質(zhì)觀察值的平均水平,并可作為樣本的代表值與其他樣本進(jìn)行比較。為樣本的代表值與其他樣本進(jìn)行比較。2.均數(shù)適用于單峰對稱分布,尤其是正態(tài)分布資均數(shù)適用于單峰對稱分布,尤其是正態(tài)分布資料,這時(shí)均數(shù)位于分布的中央,能反映觀察值料,這時(shí)均數(shù)位于分布的中央,能反映觀察值的集中趨勢,即其平均水平。也可用于近似正的集中趨勢,即其平均水平。也可用于近似正態(tài)分布。態(tài)分布。33n適用于數(shù)據(jù)適用于數(shù)據(jù)經(jīng)過對數(shù)變換后呈正態(tài)分布的資料經(jīng)過對數(shù)變換后呈正態(tài)分布的資料

19、,也可用于觀察值之間呈倍數(shù)或近似倍數(shù)變化也可用于觀察值之間呈倍數(shù)或近似倍數(shù)變化(等比關(guān)系)的資料。(等比關(guān)系)的資料。n如醫(yī)學(xué)實(shí)驗(yàn)中的抗體滴度;食品中農(nóng)藥含量;如醫(yī)學(xué)實(shí)驗(yàn)中的抗體滴度;食品中農(nóng)藥含量;疾病的潛伏期等。疾病的潛伏期等。n計(jì)算方法有:直接法和頻數(shù)表法。計(jì)算方法有:直接法和頻數(shù)表法。2 2、幾何均數(shù),、幾何均數(shù),geometric meangeometric mean,G G34直接法直接法nlgXlgnlgXlgXlgXlgXXXG1n111nn21n由原始變量值直接計(jì)算幾何均數(shù)。由原始變量值直接計(jì)算幾何均數(shù)。n設(shè)變量值為設(shè)變量值為X1, X2 Xn,幾何均數(shù),幾何均數(shù)G為:為:3

20、5n例例 有有5份血清的滴度為份血清的滴度為1:4,1:8,1:16,1:32,1:64,求平均滴度?,求平均滴度? n n該該5份血清的平均滴度為份血清的平均滴度為1:16。 16)2041. 1 (lg)564lg.8lg4lg(lg)lg(lg111nXG362.2.頻數(shù)表法頻數(shù)表法( (加權(quán)法加權(quán)法) )n當(dāng)資料中出現(xiàn)相同觀察值的個(gè)數(shù)較多時(shí),或資料當(dāng)資料中出現(xiàn)相同觀察值的個(gè)數(shù)較多時(shí),或資料為頻數(shù)表資料,則用加權(quán)法計(jì)算幾何均數(shù)。為頻數(shù)表資料,則用加權(quán)法計(jì)算幾何均數(shù)。n變量及頻數(shù)如下變量及頻數(shù)如下:nX1,X2, Xkn f1 , f2, fkn 則幾何平均數(shù)則幾何平均數(shù)G為為: )(12

21、1221kkffffkffXXXG 37應(yīng)用注意事項(xiàng):應(yīng)用注意事項(xiàng):n適用資料:適用資料:經(jīng)對數(shù)變換后呈正態(tài)或近經(jīng)對數(shù)變換后呈正態(tài)或近似正態(tài)分布的資料;似正態(tài)分布的資料;用于等比資料;用于等比資料;n注意:注意: 根據(jù)對數(shù)的性質(zhì):零與負(fù)數(shù)沒有對數(shù)根據(jù)對數(shù)的性質(zhì):零與負(fù)數(shù)沒有對數(shù)1)變量值不能有)變量值不能有0;2)變量值不能同時(shí)有正值與負(fù)值。)變量值不能同時(shí)有正值與負(fù)值。38一組觀察值從小到大排列,位次居中的觀一組觀察值從小到大排列,位次居中的觀察值即中位數(shù),是一個(gè)位置指標(biāo)。察值即中位數(shù),是一個(gè)位置指標(biāo)。符號:符號:P50 或或M3.3.中位數(shù)中位數(shù)(median) 39中位數(shù)計(jì)算方法中位數(shù)計(jì)

22、算方法直接法:直接法:將觀察值由小到大排列,按下式將觀察值由小到大排列,按下式計(jì)算。計(jì)算。 21nXM,n 為為奇奇數(shù)數(shù)時(shí)時(shí)2XXM,n12n2n 為為偶偶數(shù)數(shù)時(shí)時(shí)40n例某病患者例某病患者9名,其發(fā)病的潛伏期(天)為:名,其發(fā)病的潛伏期(天)為:3,4,4,5,6,7,7,9,11 ,求中位數(shù)。,求中位數(shù)。n本例本例n=9,為奇數(shù),按式(,為奇數(shù),按式(4.6)得:)得:n (天)(天)n若在該例基礎(chǔ)上再繼續(xù)觀察,在又發(fā)現(xiàn)若在該例基礎(chǔ)上再繼續(xù)觀察,在又發(fā)現(xiàn)1例患者例患者11 天,則天,則n=10,為偶數(shù),按式(,為偶數(shù),按式(4.7)得:)得:n (X5+X6)/2=(6+7)/2=6.5(

23、天)(天) 652)1(XXMn)(21122nnXXM41(2)頻數(shù)表法)頻數(shù)表法nL為為P50所在下限;所在下限;i 為該組的組距;為該組的組距;fM 為該組頻為該組頻數(shù);數(shù); 為比該組段略小的組段的累計(jì)頻數(shù)。為比該組段略小的組段的累計(jì)頻數(shù)。Lf)%50(LMMfnfiLM42%X(100)%XXP 百分位數(shù)示意圖百分位數(shù)示意圖附:百分位數(shù)(附:百分位數(shù)(percentile):P P2525P P7575位置參數(shù)位置參數(shù)43公式:(%)XXXLXiPLnXff XL: 第X百 分 位 數(shù) 所 在 組 段 下 限 Lf : 小 于XL各 組 段 的 累 計(jì) 頻 數(shù) Xi: 第X百 分 位

24、數(shù) 所 在 組 段 組 距 n: 為 總 例 數(shù) 44P251.37+0.13x(120 x25%17)/141.49P751.76+0.13x(120 x75%79)/151.86P50 1.63+0.13x(120 x50%50)/291.6745n計(jì)算累計(jì)頻數(shù)和累計(jì)頻率計(jì)算累計(jì)頻數(shù)和累計(jì)頻率(%);n確定確定M所在組段;所在組段;n根據(jù)公式計(jì)算。根據(jù)公式計(jì)算。計(jì)算步驟計(jì)算步驟46評分評分頻數(shù)頻數(shù)累計(jì)頻數(shù)累計(jì)頻數(shù)累計(jì)頻率累計(jì)頻率(%)頻率范圍頻率范圍 0220.9100.9130241.830.921.8340373.201.843.205011188.223.218.2260304821

25、.928.2321.92706311150.6821.9350.68806017178.0850.6978.089010048219100.0078.09100.0表表4.4 219名乳腺癌患者康復(fù)期生存質(zhì)量評分名乳腺癌患者康復(fù)期生存質(zhì)量評分例例4.8 為研究乳癌患者術(shù)后康復(fù)期生存質(zhì)量,某醫(yī)院對為研究乳癌患者術(shù)后康復(fù)期生存質(zhì)量,某醫(yī)院對219名術(shù)后名術(shù)后康復(fù)期乳癌患者進(jìn)行了生存質(zhì)量測定,結(jié)果如表康復(fù)期乳癌患者進(jìn)行了生存質(zhì)量測定,結(jié)果如表4.4,求平均評分。,求平均評分。nM=70+10/63(21950%-48 )=79.76(分分) 47平均數(shù)應(yīng)用的注意事項(xiàng)平均數(shù)應(yīng)用的注意事項(xiàng)p 同質(zhì)同質(zhì)的

26、資料計(jì)算平均數(shù)才有意義的資料計(jì)算平均數(shù)才有意義p 根據(jù)根據(jù)資料的分布類型資料的分布類型選用適當(dāng)?shù)钠骄鶖?shù)選用適當(dāng)?shù)钠骄鶖?shù)均數(shù):單峰對稱分布的資料,特別是正態(tài)分布均數(shù):單峰對稱分布的資料,特別是正態(tài)分布幾何均數(shù):等比級數(shù)資料、對數(shù)正態(tài)分布資料幾何均數(shù):等比級數(shù)資料、對數(shù)正態(tài)分布資料中位數(shù):理論上可用于任何分布資料,但中位數(shù):理論上可用于任何分布資料,但當(dāng)資料適當(dāng)資料適合計(jì)算均數(shù)或幾何均數(shù)時(shí),不宜用中位數(shù)。合計(jì)算均數(shù)或幾何均數(shù)時(shí),不宜用中位數(shù)。 (偏態(tài)分布、分布不明資料、有不確定值的資料)(偏態(tài)分布、分布不明資料、有不確定值的資料)48第三節(jié)、離散程度的描述第三節(jié)、離散程度的描述集中趨勢是數(shù)據(jù)分布的

27、一個(gè)重要特集中趨勢是數(shù)據(jù)分布的一個(gè)重要特征,但單有集中趨勢指標(biāo)還不能很好地征,但單有集中趨勢指標(biāo)還不能很好地描述數(shù)據(jù)的分布規(guī)律。描述數(shù)據(jù)的分布規(guī)律。而且還要看數(shù)據(jù)而且還要看數(shù)據(jù)的變異散程度的變異散程度 。盤編號盤編號 甲甲乙乙丙丙124604904953 35005005004 45405105055 5560520510合計(jì)合計(jì)250025002500250025002500均數(shù)均數(shù)500500500500500500 例:采甲、乙、丙三人的耳垂血,然后進(jìn)行紅細(xì)胞計(jì)例:采甲、乙、丙三人的耳垂血,然后進(jìn)行紅細(xì)胞計(jì)數(shù),每人數(shù)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤,得結(jié)果如下(萬個(gè)計(jì)數(shù)盤,

28、得結(jié)果如下(萬/mm3)甲乙丙50離散程度:離散程度: 反映一群變量值的變異程度或反映一群變量值的變異程度或參差不齊參差不齊的程度。的程度。離散程度大,均數(shù)的代表性差,離散程度大,均數(shù)的代表性差,離散程度小,均數(shù)的代表性好離散程度小,均數(shù)的代表性好。51常用的指標(biāo)常用的指標(biāo)(1)極差()極差(range)(2)四分位數(shù)間距()四分位數(shù)間距(quartile interval) (3)方差和標(biāo)準(zhǔn)差()方差和標(biāo)準(zhǔn)差(variance and standard deviation)(4)變異系數(shù)()變異系數(shù)(coefficient of variation)521 1、極差、極差/ /全距,全距,r

29、angerangen R = X max - X minn優(yōu)點(diǎn):優(yōu)點(diǎn):簡單明了簡單明了n缺點(diǎn):缺點(diǎn):n1)只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀)只考慮最大值與最小值之差異,不能反映組內(nèi)其它觀察值的變異度察值的變異度n2)樣本含量越大,抽到較大或較小觀察值的可能性越大,)樣本含量越大,抽到較大或較小觀察值的可能性越大,則全距可能越大,因此樣本含量懸殊時(shí)不宜用全距。則全距可能越大,因此樣本含量懸殊時(shí)不宜用全距。 532 2、四分位數(shù)間距,、四分位數(shù)間距,inter-quartile rangeinter-quartile range 常用于描述偏態(tài)分布資料、兩端無確切值或分布常用于描述偏

30、態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。不明確資料的離散程度。 1)百分位數(shù))百分位數(shù)(percentile):是指將觀察值從小到:是指將觀察值從小到大排列后處于第大排列后處于第x百分位置上的數(shù)值,亦是位置百分位置上的數(shù)值,亦是位置指標(biāo),用指標(biāo),用 Px 表示。表示。Px 表示將全部觀察值分為兩表示將全部觀察值分為兩部分,有部分,有 x % 的的觀察值比觀察值比 Px 小,有小,有 (100 x) % 的觀察值比的觀察值比 Px 大。大。P50 即中位數(shù)。即中位數(shù)。54n2)四分位數(shù))四分位數(shù)(quartile, Q):特定的百分位數(shù),把一:特定的百分位數(shù),把一組觀察值分為四等份。

31、組觀察值分為四等份。下四分位數(shù):下四分位數(shù): QL = P25上四分位數(shù)為:上四分位數(shù)為:QU = P75四分位數(shù)間距:四分位數(shù)間距:QUQL小小大大P0 P25 P50 P75 P100M55表表4.4 219名乳腺癌患者康復(fù)期生存質(zhì)量評分名乳腺癌患者康復(fù)期生存質(zhì)量評分P75=QU=80+10/60(21975%-111)=88.88(分(分)Q= QUQL =88.88-71.07=17.81P25=QL=70+10/63(21925%- 48) =71.07(分(分)例例4.13評分評分頻數(shù)頻數(shù)累計(jì)頻數(shù)累計(jì)頻數(shù)累計(jì)頻率累計(jì)頻率(%)頻率范圍頻率范圍 0220.9100.9130241.8

32、30.921.8340373.201.843.205011188.223.218.2260304821.928.2321.92706311150.6821.9350.68806017178.0850.6978.089010048219100.0078.09100.00nM=70+10/63(21950%-48 )=79.76(分分) 56n四分位數(shù)間距四分位數(shù)間距越大,變量值的變異程度或離越大,變量值的變異程度或離散程度越大;散程度越大;n四分位四分位數(shù)數(shù)間距比極差穩(wěn)定,但仍未考慮每個(gè)間距比極差穩(wěn)定,但仍未考慮每個(gè)觀察值的變異;觀察值的變異;n四分位數(shù)間距常用于描述偏態(tài)分布資料、兩四分位數(shù)間距

33、常用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。端無確切值或分布不明確資料的離散程度。57例例4.2 在某市在某市2005年進(jìn)行的小學(xué)生體質(zhì)評價(jià)研究中,年進(jìn)行的小學(xué)生體質(zhì)評價(jià)研究中,測定了測定了120名名9歲男孩的肺活量歲男孩的肺活量(L),資料如下,根,資料如下,根據(jù)該資料制作頻數(shù)表。據(jù)該資料制作頻數(shù)表。 1.706 1.326 1.632 1.876 2.161 1.684 1.533 1.175 1.867 1.676 2.091 1.847 1.213 1.277 0.989 2.235 1.665 1.289 1.724 1.548 1.608 1.890 1.733

34、 1.796 1.203 1.736 1.450 1.633 1.555 1.352 1.291 1.796 1.647 1.415 1.873 0.996 1.936 1.526 1.424 1.589 1.670 1.056 1.969 1.481 2.406 2.123 1.988 1.512 1.030 1.886 1.930 1.725 1.374 1.654 1.663 1.438 1.645 1.214 1.184 1.735 P251.37+0.13x(120 x25%17)/141.49P751.76+0.13x(120 x75%79)/151.86R = 2.406-0.9

35、80 = 1.417(L )四分位數(shù)間距四分位數(shù)間距=0.37(L) =0.37(L) R = 2.406-0.980 = 1.417(L )四分位數(shù)間距四分位數(shù)間距=0.37(L) =0.37(L) 58為了衡量每個(gè)變量值的變異,先選擇一個(gè)數(shù)為了衡量每個(gè)變量值的變異,先選擇一個(gè)數(shù)值作為比較標(biāo)準(zhǔn);誰合適呢?均數(shù)最有代表性。值作為比較標(biāo)準(zhǔn);誰合適呢?均數(shù)最有代表性。甲乙丙59.方差和標(biāo)準(zhǔn)差n為了全面考慮每個(gè)觀察值的變異情況,克服為了全面考慮每個(gè)觀察值的變異情況,克服全距和四分位數(shù)間距的缺點(diǎn),引入了全距和四分位數(shù)間距的缺點(diǎn),引入了“方差方差”60()方差,()方差,variancevariance

36、n衡量每個(gè)觀察值相對均數(shù)的偏差,構(gòu)造出綜合描述資料衡量每個(gè)觀察值相對均數(shù)的偏差,構(gòu)造出綜合描述資料離散程度的指標(biāo)。離散程度的指標(biāo)。n方差說明觀察值的變異程度,方差越大,觀察值方差說明觀察值的變異程度,方差越大,觀察值得變異程度較大,反之,觀察值得變異程度較小。得變異程度較大,反之,觀察值得變異程度較小。2261n在實(shí)際工作中,總體均數(shù)在實(shí)際工作中,總體均數(shù)往往是未知的,故只能用樣本往往是未知的,故只能用樣本均數(shù)均數(shù) 作為總體均數(shù)作為總體均數(shù)的估計(jì)值,用樣本例數(shù)的估計(jì)值,用樣本例數(shù)n代替代替N,這,這樣計(jì)算的結(jié)果通常比實(shí)際的樣計(jì)算的結(jié)果通常比實(shí)際的2低。英國統(tǒng)計(jì)學(xué)家提出用低。英國統(tǒng)計(jì)學(xué)家提出用n

37、-1代替代替n來校正,這就是樣本方差來校正,這就是樣本方差s2 。n式中的式中的n-1稱為自由度(稱為自由度( degree of freedom)是統(tǒng)計(jì)學(xué))是統(tǒng)計(jì)學(xué)中的一個(gè)常用術(shù)語,用中的一個(gè)常用術(shù)語,用表示。表示。 221)(22nXXS221)(22nXXS2262自由度自由度例:有一個(gè)例:有一個(gè)4個(gè)數(shù)據(jù)的樣本,個(gè)數(shù)據(jù)的樣本, 在自由取值在自由取值4、2、5三個(gè)數(shù)據(jù)后,第三個(gè)數(shù)據(jù)后,第四個(gè)數(shù)據(jù)只能是四個(gè)數(shù)據(jù)只能是95x 63()標(biāo)準(zhǔn)差,standard deviationn因方差的度量單位是原度量單位的平方,因方差的度量單位是原度量單位的平方,故將方差開方,恢復(fù)成原度量單位,得總故將方差

38、開方,恢復(fù)成原度量單位,得總體標(biāo)準(zhǔn)差體標(biāo)準(zhǔn)差。n標(biāo)準(zhǔn)差大,表示觀察值的變異度大;標(biāo)準(zhǔn)差大,表示觀察值的變異度大;n標(biāo)準(zhǔn)差小,表示觀察值的變異度小標(biāo)準(zhǔn)差小,表示觀察值的變異度小 。NX2)(641)(2nXXs樣本標(biāo)準(zhǔn)差(樣本標(biāo)準(zhǔn)差(s):):NX2)(65例4-11 三組同齡男孩的身高值(cm) 甲組:90 95 100 105 110 100cmX甲 乙組:96 98 100 102 104 100cmX乙 丙組:96 99 100 101 104 100cmX丙 甲組: 2(500)5025057.91(cm)5 1S同理得:乙組:3.16(cm)S ,丙組:2.92(cm)S 。 66標(biāo)

39、準(zhǔn)差的意義標(biāo)準(zhǔn)差的意義說明資料的離散趨勢說明資料的離散趨勢(或變異程度或變異程度),標(biāo)準(zhǔn)差的,標(biāo)準(zhǔn)差的值越大,說明變異程度越大,均數(shù)的代表性值越大,說明變異程度越大,均數(shù)的代表性越差越差; .。 標(biāo)準(zhǔn)差與原始數(shù)據(jù)的單位一致,在科技標(biāo)準(zhǔn)差與原始數(shù)據(jù)的單位一致,在科技論文報(bào)告中,均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時(shí)用來論文報(bào)告中,均數(shù)與標(biāo)準(zhǔn)差經(jīng)常被同時(shí)用來描述資料的集中趨勢與離散趨勢。描述資料的集中趨勢與離散趨勢。67例例4.17,某年某市城區(qū),某年某市城區(qū)120名名5歲女孩身高均數(shù)為歲女孩身高均數(shù)為110.15(cm),標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為5.86(cm);體重均數(shù)為;體重均數(shù)為17.71(kg),標(biāo)準(zhǔn)差為,標(biāo)

40、準(zhǔn)差為1.44(kg),比較其離散程度。,比較其離散程度。 身高身高 體重體重 %100XSCV4.變異系數(shù)變異系數(shù)(coefficient of variation,CV)(1)意義:)意義:標(biāo)準(zhǔn)差與均數(shù)之比,用百分?jǐn)?shù)表標(biāo)準(zhǔn)差與均數(shù)之比,用百分?jǐn)?shù)表示。變異系數(shù)是相對數(shù),沒有單位。示。變異系數(shù)是相對數(shù),沒有單位。(2 2)適用條件:)適用條件:觀察指標(biāo)單位不同,如身高、體重;觀察指標(biāo)單位不同,如身高、體重; 同單位資料,但均數(shù)相差懸殊。同單位資料,但均數(shù)相差懸殊。(3 3)公式:)公式:69例例4.17,某年某市城區(qū),某年某市城區(qū)120名名5歲女孩身高均數(shù)為歲女孩身高均數(shù)為110.15(cm),標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為5.86(cm);體重均數(shù)為;體重均數(shù)為17.71(kg

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論