計(jì)量資料統(tǒng)計(jì)1描述驕陽書苑_第1頁
計(jì)量資料統(tǒng)計(jì)1描述驕陽書苑_第2頁
計(jì)量資料統(tǒng)計(jì)1描述驕陽書苑_第3頁
計(jì)量資料統(tǒng)計(jì)1描述驕陽書苑_第4頁
計(jì)量資料統(tǒng)計(jì)1描述驕陽書苑_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章第三章 數(shù)值變量資料的數(shù)值變量資料的 統(tǒng)計(jì)描述統(tǒng)計(jì)描述1培訓(xùn)類別 第一節(jié)第一節(jié) 數(shù)值變量資料的頻數(shù)表數(shù)值變量資料的頻數(shù)表 頻數(shù)就是觀察值的個(gè)數(shù)。頻數(shù)分布頻數(shù)就是觀察值的個(gè)數(shù)。頻數(shù)分布就是觀察值在其取值范圍內(nèi)分布的情況。就是觀察值在其取值范圍內(nèi)分布的情況。要了解數(shù)值變量資料的分布規(guī)律,當(dāng)觀要了解數(shù)值變量資料的分布規(guī)律,當(dāng)觀察單位較多時(shí),可編制頻數(shù)分布表察單位較多時(shí),可編制頻數(shù)分布表(簡稱簡稱頻數(shù)表頻數(shù)表)和繪制直方圖。和繪制直方圖。 2培訓(xùn)類別一、頻數(shù)表(一、頻數(shù)表(frequency table)的編制)的編制1、找出觀察值中的最大值(max)、最小值(min)和極差(r) r=maxm

2、in2、確定組段數(shù)(即組數(shù))、組距: 頻數(shù)表一般設(shè) 8 15個(gè)組段。 組距(class interval) = r / 組段數(shù)。往往取近似值。3、確定組段,列表劃記: 每個(gè)組段的起點(diǎn)稱下限,終點(diǎn)稱上限。 第一組段要包括最小值,最后一個(gè)組段要包括最大值。 各組段從本組段的“下限”開始,不包括本組段的“上限”,最末一組段應(yīng)同時(shí)寫出其上下限。3培訓(xùn)類別例 2.1 某市1982年110名7歲男童的身高(cm)資料112.4 117.2 122.7 123.0 113.0 108.2 118.2 108.2 118.9 118.1123.5 118.3 120.3 116.2 114.7 119.7 1

3、14.8 119.6 113.2 120.0119.7 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5119.8 122.9 128.0 121.5 126.1 117.7 124.1 129.3 121.8 112.7120.2 120.8 126.6 120.0 130.5 120.0 121.5 114.3 124.1 117.2124.4 116.4 119.0 117.1 114.9 129.1 118.4 113.2 116.0 120.4112.3 114.9 124.4 112.2 125.2 116.3 125.8

4、121.0 115.4 121.2117.9 120.1 118.4 122.8 120.1 112.4 118.5 113.0 120.8 114.8123.8 119.1 122.8 120.7 117.4 126.2 122.1 125.2 118.0 120.7116.3 125.1 120.5 114.3 123.1 122.4 110.3 119.3 125.0 111.5116.8 125.6 123.2 119.5 120.5 127.1 120.6 132.5 116.3 130.84培訓(xùn)類別2.1 110名7歲男童身高(cm)頻數(shù)表身 高 組 段 劃 記 頻 數(shù) 頻 率 (

5、 % ) 累 計(jì) 頻 數(shù) 累 計(jì) 頻 率( % ) 108 1 0.91 1 0.91 110 3 2.72 4 3.64 112 9 8.18 13 11.82 114 9 8.18 22 20.00 116 15 13.64 37 33.64 118 18 16.36 55 50.00 120 21 19.09 76 69.09 122 14 12.73 90 81.82 124 10 9.09 100 90.91 126 4 3.64 104 94.54 128 3 2.72 107 97.27 130 2 1.82 109 99.09 132134 0.91 110 100.00 合

6、計(jì) 1 110 本本 例例 , r=24.3(cm) , i=24.3/10 = 2.43 , 近近 似似 取取 2 。 5培訓(xùn)類別二、頻數(shù)分布的兩個(gè)特征二、頻數(shù)分布的兩個(gè)特征 從頻數(shù)表可以看出頻數(shù)分布的兩個(gè)重要特征: 集中趨勢(集中趨勢(central tendency):身高向中央部分集中,以中等身高者居多,是為集中趨勢。 離散趨勢離散趨勢(tendency of dispersion):從中央部分到兩側(cè)頻數(shù)分布逐漸減少,是為離散趨勢。 集中和離散趨勢是頻數(shù)分布的兩個(gè)重要側(cè)面,其可較全面地分析所研究的事物。6培訓(xùn)類別三、頻數(shù)分布的類型:三、頻數(shù)分布的類型: 對稱分布:對稱分布:集中位置在正

7、中左右兩側(cè)頻數(shù)分布大體對稱,如正態(tài)分布正態(tài)分布。 偏態(tài)分布:偏態(tài)分布:集中位置偏向一側(cè),頻數(shù)分布不對稱。 正偏態(tài)分布正偏態(tài)分布 負(fù)偏態(tài)分布負(fù)偏態(tài)分布 不同類型的分布,應(yīng)采用相應(yīng)的統(tǒng)計(jì)分析方法。7培訓(xùn)類別四、頻數(shù)表的用途:四、頻數(shù)表的用途:1、揭示資料的分布特征和分布類型。2、便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析處理。3、便于發(fā)現(xiàn)某些錯(cuò)誤。8培訓(xùn)類別第二節(jié)第二節(jié) 集中趨勢的描述集中趨勢的描述 平均數(shù)(average)是用于描述一組同質(zhì)的定量變量值集中趨勢的一系列指標(biāo),它反映一組變量值的平均水平。醫(yī)學(xué)研究中常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。9培訓(xùn)類別一、算術(shù)均數(shù)(簡稱均數(shù)一、算術(shù)均數(shù)(簡稱均數(shù)me

8、an)總體均數(shù)記作記作 ,樣本均數(shù)記作記作 。該指標(biāo)適用于對稱分布,尤其是正態(tài)或近似正態(tài)分布的資料。x10培訓(xùn)類別計(jì)算方法:l 直接法:當(dāng)觀察單位的個(gè)數(shù)不多時(shí)可直接計(jì)算。公式為: l 加權(quán)法:當(dāng)資料中相同觀察值的個(gè)數(shù)較多時(shí),可將相同觀察值的個(gè)數(shù),即頻數(shù)f,乘以該觀察值x,以代替相同觀察值逐個(gè)相加。 加權(quán)法用于頻數(shù)表資料時(shí),式中,f為組段頻數(shù),x為組中值,組中值 = 。nxnxxxxn21fffffxfxfxfxmmm2122112組段上限組段下限11培訓(xùn)類別例 2.2 對表2.1資料用加權(quán)法求平均身高 計(jì)算方法如下: 表 2.2 110名7歲男童身高均數(shù)的計(jì)算(加權(quán)法)95.119110131

9、9412311331131211131091x 身高組段 (1) 頻數(shù),f (2) 組中值,x (3) fx (4)=(2) (3) 108 1 109 109 110 3 111 333 112 9 113 1017 114 9 115 1035 116 15 117 1755 118 18 119 2142 120 21 121 2541 122 14 123 1722 124 10 125 1250 126 4 127 508 128 3 129 397 130 2 131 262 132134 1 133 133 合計(jì) 110 13194 12培訓(xùn)類別二、幾何均數(shù)(二、幾何均數(shù)(geo

10、metric mean) 記作記作g。 該指標(biāo)適用于: 變量值呈等比級(jí)數(shù)關(guān)系的資料,如血清抗體滴度的資料; 對數(shù)正態(tài)分布的資料,即某些偏態(tài)分布的資料,當(dāng)將變量值取對數(shù)后又呈現(xiàn)正態(tài)分布的資料。13培訓(xùn)類別計(jì)算方法l 直接法:當(dāng)觀察單位的個(gè)數(shù)不多時(shí)可直接計(jì)算。公式為:l 加權(quán)法:當(dāng)資料中相同觀察值的個(gè)數(shù)較多時(shí),如頻數(shù)表資料,可用下式計(jì)算: nxlgglg1fxflgglg114培訓(xùn)類別 例2.4 40名麻疹易感兒接種麻疹疫苗后一個(gè)月,血凝抑制抗體滴度見表2.3 第(1)、(2)欄,求平均滴度。表2.3 平均滴度的計(jì)算 lgg = 72.2471 /40 =1.8064 g = lg-1 1.806

11、4 = 64 即平均抗體滴度為1:64抗體滴度 ( 1) 人數(shù),f ( 2) 滴度倒數(shù),x ( 3) lgx ( 4) flgx ( 5)= ( 2)( 4) 1: 4 1 4 0.6021 0.6021 1: 8 5 8 0.9031 4.5155 1: 16 6 16 1.2041 7.2246 1: 32 2 32 1.5051 3.0102 1: 64 7 64 1.8062 12.6434 1: 128 10 128 2.1072 21.0720 1: 256 4 256 2.4082 9.6328 1: 512 5 512 2.7093 13.5465 合 計(jì) 40 72.2471

12、 fxflgglg115培訓(xùn)類別計(jì)算幾何均數(shù)應(yīng)注意的問題 數(shù)據(jù)中不能有零; 數(shù)據(jù)中不能同時(shí)有正值和負(fù)值;但若均為負(fù)值時(shí),可先去掉負(fù)號(hào)進(jìn)行計(jì)算,再在計(jì)算結(jié)果上加上負(fù)號(hào)。16培訓(xùn)類別三、中位數(shù)三、中位數(shù)(median)和百分位數(shù)和百分位數(shù)(percentile) 中位數(shù)中位數(shù)(median):將一組觀察值由小到大順序排列,位次居中的變量值即為中位數(shù)。記作記作m。 中位數(shù)適用于: 明顯偏態(tài)分布; 總體分布型不明的資料; 開放型數(shù)據(jù)。17培訓(xùn)類別中位數(shù)的計(jì)算方法 l直接法 :先將觀察值按大小順序排列,再按下式計(jì)算: n為奇數(shù)時(shí) n為偶數(shù)時(shí) l頻數(shù)表法:當(dāng)觀察值的個(gè)數(shù)較多時(shí),可先將資料整理為頻數(shù)表,再按

13、下式計(jì)算: 式中,l 為中位數(shù)所在組段的下限; i為頻數(shù)表中的組距; f 為中位數(shù)所在組段的頻數(shù); 為中位數(shù)所在組段以前的累積頻數(shù)。lflfnfilm221nxm12221nnxxm18培訓(xùn)類別例2.5 151例慢性胃炎患者住院時(shí)間如表2.4,求其平均住院天數(shù)。 表2.4 151例慢性胃炎患者住院時(shí)間的頻數(shù)分布平均住院天數(shù)為16.53天。住院天數(shù) 0 15 30 45 60 75 90 105115 頻 數(shù) 70 54 16 5 4 1 0 1 ) d (53.16702151541515m19培訓(xùn)類別百分位數(shù)(百分位數(shù)(percentile):以px表示 一個(gè)百分位數(shù)px將總體或樣本的全部觀

14、察值分成兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大,故百分位數(shù)是一個(gè)界值,也是分布數(shù)列的百等份分割值,p50分位數(shù)也就是中位數(shù),因此,中位數(shù)是一個(gè)特定的百分位數(shù)。20培訓(xùn)類別百分位數(shù)計(jì)算方法計(jì)算公式: px = l + i/fx ( nx% - fl )式中,l為px所在組段的下限; i為頻數(shù)表中的組距; fx為px所在組段的頻數(shù); fl為px所在組段以前的累積頻數(shù)。21培訓(xùn)類別 例2.6 某市大氣中so2的日平均濃度(g/m3)見表2.5第(1)、(2)欄,分別求第25、75、95百分位數(shù)和中位數(shù)。 表2.5 某市大氣中so2日平均濃度的百分位數(shù)和中位數(shù)計(jì)算濃度(g

15、/m3) (1) 天數(shù),f (2) 累計(jì)頻數(shù) (3) 累計(jì)頻率 (4) 25 39 39 10.8 50 67 106 29.5 75 64 170 47.1 100 63 233 64.5 125 45 278 77.0 150 30 308 85.3 175 17 325 90.0 200 9 334 92.5 225 7 341 94.5 250 6 347 96.1 275 5 352 97.5 300 3 355 98.3 325 6 361 100.0 合計(jì) 361 22培訓(xùn)類別計(jì)算累計(jì)頻數(shù)及累計(jì)頻率,見第(3)、(4)欄; p25 = 50 + 25/67(361 25% - 3

16、9) = 69.12 p75 = 125 + 25/45(361 75% - 233) = 145.97 p95 = 250 + 25/6(361 95% - 341) = 258.12 p50=m = 100 + 25/63(361/2 170) = 104.1723培訓(xùn)類別四、平均數(shù)指標(biāo)的正確應(yīng)用四、平均數(shù)指標(biāo)的正確應(yīng)用 上述各平均數(shù)指標(biāo),均有其相應(yīng)的適用條件,應(yīng)依據(jù)資料分布類型和數(shù)據(jù)情況正確選用。一般情況下可通過對同一資料中幾個(gè)指標(biāo)間的關(guān)系,粗略判斷資料的分布類型: 對稱分布,尤其是正態(tài)分布資料中,均數(shù)與中位數(shù)相接近(即 )。 偏態(tài)分布時(shí),均數(shù)與中位數(shù)相差較大。對某一偏態(tài)分布資料,若其中

17、位數(shù)與幾何均數(shù)接近(即 ),則說明此資料為對數(shù)正態(tài)分布資料。 總之,對稱分布(尤其正態(tài)或近似正態(tài)分)資料應(yīng)首選均數(shù);對數(shù)正態(tài)分布資料應(yīng)首選幾何均數(shù);其它分布情況則使用中位數(shù)。xm gm24培訓(xùn)類別第三節(jié)第三節(jié) 離散程度的描述離散程度的描述 集中趨勢和離散趨勢是頻數(shù)分布的兩個(gè)重要特征,要把兩者結(jié)合起來才能全面地認(rèn)識(shí)事物。 25培訓(xùn)類別離散趨勢分析實(shí)例 例2.7 三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢與離散趨勢。 甲組 26 28 30 32 34 甲= 30 kg 乙組 24 27 30 33 36 乙= 30 kg 丙組 26 29 30 31 34 丙= 30 kg 三組數(shù)

18、據(jù)的集中位置都是30 kg 。但三組數(shù)據(jù)的離散程度不同,這在分析資料時(shí)不能不加以考慮。說明離散程度的指標(biāo)有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)等,其中方差、標(biāo)準(zhǔn)差最為常用。xxx26培訓(xùn)類別一、極差(亦稱全距一、極差(亦稱全距range) 它反映一組觀察值的波動(dòng)范圍,記作記作r 。 該指標(biāo)適用于任何分布類型的資料。但因其只受兩側(cè)極端值的影響,故反映一組觀察值的變異程度時(shí)較粗糙。27培訓(xùn)類別二、四分位數(shù)間距(二、四分位數(shù)間距(quartile) 四分位數(shù)間距(quartile)記作q 。 公式表達(dá)為:公式表達(dá)為: q = qu - ql 式中,qu為上四分位數(shù),即p75; ql為下四分位數(shù)

19、,即p25。 四分位數(shù)間距可看成中間一半觀察值的極差四分位數(shù)間距可看成中間一半觀察值的極差。它和極差類似,數(shù)值越大說明變異度越大。 如例2.6中,p25 = 69.12(g/m3),p75 = 145.97(g/m3),故其四分位間距為 q = qu - ql = 145.97 69.12 = 76.85(g/m3) 該指標(biāo)的適用條件同中位數(shù),而且通常與中位數(shù)(亦稱第50百分位數(shù))結(jié)合,全面描述偏態(tài)及不明分布資料的特征。應(yīng)用時(shí)需注意:當(dāng)樣本含量不夠大時(shí),該指標(biāo)不夠穩(wěn)定,故不宜選用。28培訓(xùn)類別三、方差(三、方差(variance)總體方差記作2,樣本方差記作s2。計(jì)算公式為: 該指標(biāo)常在方差分析中應(yīng)用。nx221222nnxxs29培訓(xùn)類別四、標(biāo)準(zhǔn)差(四、標(biāo)準(zhǔn)差(standard deviation) 將方差開平方即為標(biāo)準(zhǔn)差,總體標(biāo)準(zhǔn)差記作記作 ,樣本標(biāo)準(zhǔn)差記作記作s。標(biāo)準(zhǔn)差的適用條件與均數(shù)相同,而且通常與均數(shù)結(jié)合全面描述正態(tài)或近似正態(tài)分布資料的特征。 標(biāo)準(zhǔn)差越大,說明變量值越分散,即變異度越大;反之,則說明變量值越集中,即變異度越小,此時(shí)樣本均數(shù)對該組變量值的代表性就越好。30培訓(xùn)類別樣本標(biāo)準(zhǔn)差的計(jì)算 直接法: 求例2.7中甲、丙兩組數(shù)據(jù)的標(biāo)準(zhǔn)差: 甲組 n = 5, x =26+28+30+32+34 = 150 x

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論