計(jì)量資料統(tǒng)計(jì)1描述驕陽書苑

上傳人：活*** IP屬地：寧夏上傳時(shí)間：2021-10-29 格式：PPT 頁數(shù)：34 大小：836KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩29頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章第三章數(shù)值變量資料的數(shù)值變量資料的統(tǒng)計(jì)描述統(tǒng)計(jì)描述1培訓(xùn)類別第一節(jié)第一節(jié) 數(shù)值變量資料的頻數(shù)表數(shù)值變量資料的頻數(shù)表頻數(shù)就是觀察值的個(gè)數(shù)。頻數(shù)分布頻數(shù)就是觀察值的個(gè)數(shù)。頻數(shù)分布就是觀察值在其取值范圍內(nèi)分布的情況。就是觀察值在其取值范圍內(nèi)分布的情況。要了解數(shù)值變量資料的分布規(guī)律，當(dāng)觀要了解數(shù)值變量資料的分布規(guī)律，當(dāng)觀察單位較多時(shí)，可編制頻數(shù)分布表察單位較多時(shí)，可編制頻數(shù)分布表(簡稱簡稱頻數(shù)表頻數(shù)表)和繪制直方圖。和繪制直方圖。 2培訓(xùn)類別一、頻數(shù)表（一、頻數(shù)表（frequency table）的編制）的編制1、找出觀察值中的最大值(max)、最小值(min)和極差(r) r=maxm

2、in2、確定組段數(shù)（即組數(shù)）、組距：頻數(shù)表一般設(shè) 8 15個(gè)組段。組距(class interval) = r / 組段數(shù)。往往取近似值。3、確定組段，列表劃記：每個(gè)組段的起點(diǎn)稱下限，終點(diǎn)稱上限。第一組段要包括最小值，最后一個(gè)組段要包括最大值。各組段從本組段的“下限”開始，不包括本組段的“上限”，最末一組段應(yīng)同時(shí)寫出其上下限。3培訓(xùn)類別例 2.1 某市1982年110名7歲男童的身高（cm）資料112.4 117.2 122.7 123.0 113.0 108.2 118.2 108.2 118.9 118.1123.5 118.3 120.3 116.2 114.7 119.7 1

3、14.8 119.6 113.2 120.0119.7 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5119.8 122.9 128.0 121.5 126.1 117.7 124.1 129.3 121.8 112.7120.2 120.8 126.6 120.0 130.5 120.0 121.5 114.3 124.1 117.2124.4 116.4 119.0 117.1 114.9 129.1 118.4 113.2 116.0 120.4112.3 114.9 124.4 112.2 125.2 116.3 125.8

4、121.0 115.4 121.2117.9 120.1 118.4 122.8 120.1 112.4 118.5 113.0 120.8 114.8123.8 119.1 122.8 120.7 117.4 126.2 122.1 125.2 118.0 120.7116.3 125.1 120.5 114.3 123.1 122.4 110.3 119.3 125.0 111.5116.8 125.6 123.2 119.5 120.5 127.1 120.6 132.5 116.3 130.84培訓(xùn)類別2.1 110名7歲男童身高（cm）頻數(shù)表身高組段劃記頻數(shù) 頻率（

5、 % ）累計(jì) 頻數(shù) 累計(jì) 頻率（ % ） 108 1 0.91 1 0.91 110 3 2.72 4 3.64 112 9 8.18 13 11.82 114 9 8.18 22 20.00 116 15 13.64 37 33.64 118 18 16.36 55 50.00 120 21 19.09 76 69.09 122 14 12.73 90 81.82 124 10 9.09 100 90.91 126 4 3.64 104 94.54 128 3 2.72 107 97.27 130 2 1.82 109 99.09 132134 0.91 110 100.00 合

6、計(jì) 1 110 本本例例， r=24.3(cm) ， i=24.3/10 = 2.43 ，近近似似取取 2 。 5培訓(xùn)類別二、頻數(shù)分布的兩個(gè)特征二、頻數(shù)分布的兩個(gè)特征從頻數(shù)表可以看出頻數(shù)分布的兩個(gè)重要特征：集中趨勢（集中趨勢（central tendency)：身高向中央部分集中，以中等身高者居多，是為集中趨勢。離散趨勢離散趨勢(tendency of dispersion):從中央部分到兩側(cè)頻數(shù)分布逐漸減少，是為離散趨勢。集中和離散趨勢是頻數(shù)分布的兩個(gè)重要側(cè)面，其可較全面地分析所研究的事物。6培訓(xùn)類別三、頻數(shù)分布的類型：三、頻數(shù)分布的類型：對稱分布：對稱分布：集中位置在正

7、中左右兩側(cè)頻數(shù)分布大體對稱，如正態(tài)分布正態(tài)分布。偏態(tài)分布：偏態(tài)分布：集中位置偏向一側(cè)，頻數(shù)分布不對稱。正偏態(tài)分布正偏態(tài)分布負(fù)偏態(tài)分布負(fù)偏態(tài)分布不同類型的分布，應(yīng)采用相應(yīng)的統(tǒng)計(jì)分析方法。7培訓(xùn)類別四、頻數(shù)表的用途：四、頻數(shù)表的用途：1、揭示資料的分布特征和分布類型。2、便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析處理。3、便于發(fā)現(xiàn)某些錯(cuò)誤。8培訓(xùn)類別第二節(jié)第二節(jié) 集中趨勢的描述集中趨勢的描述平均數(shù)（average）是用于描述一組同質(zhì)的定量變量值集中趨勢的一系列指標(biāo)，它反映一組變量值的平均水平。醫(yī)學(xué)研究中常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。9培訓(xùn)類別一、算術(shù)均數(shù)（簡稱均數(shù)一、算術(shù)均數(shù)（簡稱均數(shù)me

8、an）總體均數(shù)記作記作，樣本均數(shù)記作記作。該指標(biāo)適用于對稱分布，尤其是正態(tài)或近似正態(tài)分布的資料。x10培訓(xùn)類別計(jì)算方法：l 直接法：當(dāng)觀察單位的個(gè)數(shù)不多時(shí)可直接計(jì)算。公式為： l 加權(quán)法：當(dāng)資料中相同觀察值的個(gè)數(shù)較多時(shí)，可將相同觀察值的個(gè)數(shù)，即頻數(shù)f，乘以該觀察值x，以代替相同觀察值逐個(gè)相加。加權(quán)法用于頻數(shù)表資料時(shí)，式中，f為組段頻數(shù)，x為組中值，組中值 = 。nxnxxxxn21fffffxfxfxfxmmm2122112組段上限組段下限11培訓(xùn)類別例 2.2 對表2.1資料用加權(quán)法求平均身高計(jì)算方法如下：表 2.2 110名7歲男童身高均數(shù)的計(jì)算（加權(quán)法）95.119110131

9、9412311331131211131091x 身高組段（1）頻數(shù)，f （2）組中值，x （3） fx （4）=（2）（3） 108 1 109 109 110 3 111 333 112 9 113 1017 114 9 115 1035 116 15 117 1755 118 18 119 2142 120 21 121 2541 122 14 123 1722 124 10 125 1250 126 4 127 508 128 3 129 397 130 2 131 262 132134 1 133 133 合計(jì) 110 13194 12培訓(xùn)類別二、幾何均數(shù)（二、幾何均數(shù)（geo

10、metric mean）記作記作g。該指標(biāo)適用于：變量值呈等比級(jí)數(shù)關(guān)系的資料，如血清抗體滴度的資料；對數(shù)正態(tài)分布的資料，即某些偏態(tài)分布的資料，當(dāng)將變量值取對數(shù)后又呈現(xiàn)正態(tài)分布的資料。13培訓(xùn)類別計(jì)算方法l 直接法：當(dāng)觀察單位的個(gè)數(shù)不多時(shí)可直接計(jì)算。公式為：l 加權(quán)法：當(dāng)資料中相同觀察值的個(gè)數(shù)較多時(shí)，如頻數(shù)表資料，可用下式計(jì)算： nxlgglg1fxflgglg114培訓(xùn)類別例2.4 40名麻疹易感兒接種麻疹疫苗后一個(gè)月，血凝抑制抗體滴度見表2.3 第（1）、（2）欄，求平均滴度。表2.3 平均滴度的計(jì)算 lgg = 72.2471 /40 =1.8064 g = lg-1 1.806

11、4 = 64 即平均抗體滴度為1：64抗體滴度（ 1）人數(shù)，f （ 2）滴度倒數(shù)，x （ 3） lgx （ 4） flgx （ 5）= （ 2）（ 4） 1： 4 1 4 0.6021 0.6021 1： 8 5 8 0.9031 4.5155 1： 16 6 16 1.2041 7.2246 1： 32 2 32 1.5051 3.0102 1： 64 7 64 1.8062 12.6434 1： 128 10 128 2.1072 21.0720 1： 256 4 256 2.4082 9.6328 1： 512 5 512 2.7093 13.5465 合計(jì) 40 72.2471

12、 fxflgglg115培訓(xùn)類別計(jì)算幾何均數(shù)應(yīng)注意的問題數(shù)據(jù)中不能有零；數(shù)據(jù)中不能同時(shí)有正值和負(fù)值；但若均為負(fù)值時(shí)，可先去掉負(fù)號(hào)進(jìn)行計(jì)算，再在計(jì)算結(jié)果上加上負(fù)號(hào)。16培訓(xùn)類別三、中位數(shù)三、中位數(shù)(median)和百分位數(shù)和百分位數(shù)（percentile）中位數(shù)中位數(shù)(median)：將一組觀察值由小到大順序排列，位次居中的變量值即為中位數(shù)。記作記作m。中位數(shù)適用于：明顯偏態(tài)分布；總體分布型不明的資料；開放型數(shù)據(jù)。17培訓(xùn)類別中位數(shù)的計(jì)算方法 l直接法：先將觀察值按大小順序排列，再按下式計(jì)算： n為奇數(shù)時(shí) n為偶數(shù)時(shí) l頻數(shù)表法：當(dāng)觀察值的個(gè)數(shù)較多時(shí)，可先將資料整理為頻數(shù)表，再按

13、下式計(jì)算：式中，l 為中位數(shù)所在組段的下限； i為頻數(shù)表中的組距； f 為中位數(shù)所在組段的頻數(shù)；為中位數(shù)所在組段以前的累積頻數(shù)。lflfnfilm221nxm12221nnxxm18培訓(xùn)類別例2.5 151例慢性胃炎患者住院時(shí)間如表2.4，求其平均住院天數(shù)。表2.4 151例慢性胃炎患者住院時(shí)間的頻數(shù)分布平均住院天數(shù)為16.53天。住院天數(shù) 0 15 30 45 60 75 90 105115 頻數(shù) 70 54 16 5 4 1 0 1 ) d (53.16702151541515m19培訓(xùn)類別百分位數(shù)（百分位數(shù)（percentile）：以px表示一個(gè)百分位數(shù)px將總體或樣本的全部觀

14、察值分成兩部分，理論上有x%的觀察值比它小，有（100-x）%的觀察值比它大，故百分位數(shù)是一個(gè)界值，也是分布數(shù)列的百等份分割值，p50分位數(shù)也就是中位數(shù)，因此，中位數(shù)是一個(gè)特定的百分位數(shù)。20培訓(xùn)類別百分位數(shù)計(jì)算方法計(jì)算公式： px = l + i/fx ( nx% - fl )式中，l為px所在組段的下限； i為頻數(shù)表中的組距； fx為px所在組段的頻數(shù)； fl為px所在組段以前的累積頻數(shù)。21培訓(xùn)類別例2.6 某市大氣中so2的日平均濃度（g/m3）見表2.5第（1）、（2）欄，分別求第25、75、95百分位數(shù)和中位數(shù)。表2.5 某市大氣中so2日平均濃度的百分位數(shù)和中位數(shù)計(jì)算濃度（g

15、/m3）（1）天數(shù)，f （2）累計(jì)頻數(shù) （3）累計(jì)頻率（4） 25 39 39 10.8 50 67 106 29.5 75 64 170 47.1 100 63 233 64.5 125 45 278 77.0 150 30 308 85.3 175 17 325 90.0 200 9 334 92.5 225 7 341 94.5 250 6 347 96.1 275 5 352 97.5 300 3 355 98.3 325 6 361 100.0 合計(jì) 361 22培訓(xùn)類別計(jì)算累計(jì)頻數(shù)及累計(jì)頻率，見第（3）、（4）欄; p25 = 50 + 25/67（361 25% - 3

16、9） = 69.12 p75 = 125 + 25/45（361 75% - 233） = 145.97 p95 = 250 + 25/6（361 95% - 341） = 258.12 p50=m = 100 + 25/63（361/2 170） = 104.1723培訓(xùn)類別四、平均數(shù)指標(biāo)的正確應(yīng)用四、平均數(shù)指標(biāo)的正確應(yīng)用上述各平均數(shù)指標(biāo)，均有其相應(yīng)的適用條件，應(yīng)依據(jù)資料分布類型和數(shù)據(jù)情況正確選用。一般情況下可通過對同一資料中幾個(gè)指標(biāo)間的關(guān)系，粗略判斷資料的分布類型：對稱分布，尤其是正態(tài)分布資料中，均數(shù)與中位數(shù)相接近（即）。偏態(tài)分布時(shí)，均數(shù)與中位數(shù)相差較大。對某一偏態(tài)分布資料，若其中

17、位數(shù)與幾何均數(shù)接近（即），則說明此資料為對數(shù)正態(tài)分布資料。總之，對稱分布（尤其正態(tài)或近似正態(tài)分）資料應(yīng)首選均數(shù)；對數(shù)正態(tài)分布資料應(yīng)首選幾何均數(shù)；其它分布情況則使用中位數(shù)。xm gm24培訓(xùn)類別第三節(jié)第三節(jié) 離散程度的描述離散程度的描述集中趨勢和離散趨勢是頻數(shù)分布的兩個(gè)重要特征，要把兩者結(jié)合起來才能全面地認(rèn)識(shí)事物。 25培訓(xùn)類別離散趨勢分析實(shí)例例2.7 三組同性別、同年齡兒童的體重（kg）如下，分析其集中趨勢與離散趨勢。甲組 26 28 30 32 34 甲= 30 kg 乙組 24 27 30 33 36 乙= 30 kg 丙組 26 29 30 31 34 丙= 30 kg 三組數(shù)

18、據(jù)的集中位置都是30 kg 。但三組數(shù)據(jù)的離散程度不同，這在分析資料時(shí)不能不加以考慮。說明離散程度的指標(biāo)有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)等，其中方差、標(biāo)準(zhǔn)差最為常用。xxx26培訓(xùn)類別一、極差（亦稱全距一、極差（亦稱全距range）它反映一組觀察值的波動(dòng)范圍，記作記作r 。該指標(biāo)適用于任何分布類型的資料。但因其只受兩側(cè)極端值的影響，故反映一組觀察值的變異程度時(shí)較粗糙。27培訓(xùn)類別二、四分位數(shù)間距（二、四分位數(shù)間距（quartile）四分位數(shù)間距（quartile）記作q 。公式表達(dá)為：公式表達(dá)為： q = qu - ql 式中，qu為上四分位數(shù)，即p75； ql為下四分位數(shù)

19、，即p25。四分位數(shù)間距可看成中間一半觀察值的極差四分位數(shù)間距可看成中間一半觀察值的極差。它和極差類似，數(shù)值越大說明變異度越大。如例2.6中，p25 = 69.12（g/m3），p75 = 145.97（g/m3），故其四分位間距為 q = qu - ql = 145.97 69.12 = 76.85（g/m3）該指標(biāo)的適用條件同中位數(shù)，而且通常與中位數(shù)（亦稱第50百分位數(shù)）結(jié)合，全面描述偏態(tài)及不明分布資料的特征。應(yīng)用時(shí)需注意：當(dāng)樣本含量不夠大時(shí)，該指標(biāo)不夠穩(wěn)定，故不宜選用。28培訓(xùn)類別三、方差（三、方差（variance）總體方差記作2，樣本方差記作s2。計(jì)算公式為：該指標(biāo)常在方差分析中應(yīng)用。nx221222nnxxs29培訓(xùn)類別四、標(biāo)準(zhǔn)差（四、標(biāo)準(zhǔn)差（standard deviation）將方差開平方即為標(biāo)準(zhǔn)差，總體標(biāo)準(zhǔn)差記作記作，樣本標(biāo)準(zhǔn)差記作記作s。標(biāo)準(zhǔn)差的適用條件與均數(shù)相同，而且通常與均數(shù)結(jié)合全面描述正態(tài)或近似正態(tài)分布資料的特征。標(biāo)準(zhǔn)差越大，說明變量值越分散，即變異度越大；反之，則說明變量值越集中，即變異度越小，此時(shí)樣本均數(shù)對該組變量值的代表性就越好。30培訓(xùn)類別樣本標(biāo)準(zhǔn)差的計(jì)算直接法：求例2.7中甲、丙兩組數(shù)據(jù)的標(biāo)準(zhǔn)差：甲組 n = 5， x =26+28+30+32+34 = 150 x

人人文庫> 全部分類> 行業(yè)資料 > 農(nóng)林牧漁

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

計(jì)量資料統(tǒng)計(jì)1描述驕陽書苑

文檔簡介

溫馨提示

最新文檔

評(píng)論

計(jì)量資料統(tǒng)計(jì)1描述驕陽書苑

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔