數(shù)值變量的統(tǒng)計(jì)描述_第1頁
數(shù)值變量的統(tǒng)計(jì)描述_第2頁
數(shù)值變量的統(tǒng)計(jì)描述_第3頁
數(shù)值變量的統(tǒng)計(jì)描述_第4頁
數(shù)值變量的統(tǒng)計(jì)描述_第5頁
已閱讀5頁,還剩59頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

數(shù)值變量資料的統(tǒng)計(jì)描述

主要內(nèi)容

頻數(shù)表與頻數(shù)分布集中趨勢指標(biāo)離散趨勢指標(biāo)正態(tài)分布和醫(yī)學(xué)參考值范圍步驟:

(1)

求全距:(極差)R=maxx-minx(2)

定組段數(shù)與組距:50~100個(gè)數(shù),分7~10組;數(shù)據(jù)多時(shí),可分5~20組。(3)

劃組段:以一個(gè)稍小于或等于最小值的整數(shù)作為第一個(gè)組段的起點(diǎn)數(shù)據(jù)。i=R/k

下限:每個(gè)組段的起點(diǎn)(最小值)。

上限:每個(gè)組段的終點(diǎn)(近似最大值)。

注:最后一個(gè)組段應(yīng)同時(shí)寫出上限和下限來。

(4)

繪制整理表“下限≤x<上限”在頻數(shù)表中列出全部組限、中值。劃計(jì),計(jì)算各組的頻數(shù)和頻率。注:各組段的頻數(shù)之和應(yīng)等于總的觀察例數(shù)。

①兩端的組段應(yīng)分別包含最小值或最大值;②盡量取較整齊的數(shù)值作為組段的端點(diǎn),便于對(duì)數(shù)據(jù)進(jìn)行表述;③組距以相等為宜。表1-2“三尺三”株高測量結(jié)果155153159155150159157159151152159158153153144156150157160150150150160156160155160151157155159161156141156145156153158161157149153153155162154152162155161159161156162151152154157162158155153151157156153147158155148163156163154158152163158154164155156158164148164154157165158166154154157167157159170158R=170-141=29i=29/10≈3cm

表1-3“三尺三”株高頻數(shù)(率)表組限中值頻數(shù)計(jì)算頻數(shù)頻率141~142.5—10.01144~145.5Τ20.02147~148.540.04150~151.5正正下130.13153~154.5正正正正正240.23156~157.5正正正正正一260.28159~160.5正正正一160.15162~163.5正正100.10165~166.5下30.03168~170169.5—10.01總計(jì)1001.00表7-1160名正常成年女子的血清甘油三酯(mmol/L)編號(hào)血清甘油三脂編號(hào)血清甘油三脂10.51……20.521531.6530.591541.6640.611551.6750.611561.6760.621571.6970.631581.780.641591.71……1601.77

組段(1)

劃記(2)

頻數(shù),f(3)

組中值,X(4)fX(5)=(3)×(4)0.5~

30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5512.401.6~正81.6514.851.7~1.8

合計(jì)

31.755.25160182.30表7.2160名成年女子的血清甘油三酯含量劃記表

表1-3

某地140名成年男性紅細(xì)胞數(shù)(1012/L)4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.935.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.935.054.404.145.014.375.244.604.714.824.945.054.794.524.644.374.874.604.724.835.334.684.804.154.654.764.884.613.974.084.584.314.054.165.045.154.504.624.734.474.584.704.814.554.284.784.514.634.364.484.595.095.205.325.054.414.524.644.754.494.224.715.214.944.685.174.915.024.76I=R/k=(5.95-3.82)/10≈0.21

表1-4某地140名成年男性紅細(xì)胞數(shù)得頻數(shù)表紅細(xì)胞數(shù)(1012/L)劃計(jì)組中值頻數(shù)頻率(%)3.80~?3.9021.44.00~正—4.1064.34.20~正正—4.30117.94.40~正正正正正4.502517.94.60~正正正正正正?4.703222.94.80~正正正正正?4.902719.35.00~正正正?5.101712.15.20~正正F5.30139.35.40~正5.5042.95.60~?5.7021.45.80~一5.9010.7研究頻數(shù)(率)分布的意義代替繁復(fù)的原始資料,便于進(jìn)一步分析。便于觀察數(shù)據(jù)的分布類型。便于發(fā)現(xiàn)資料中某些遠(yuǎn)離群體的特大或特小的可疑值。當(dāng)樣本含量比較大時(shí),可用各組段的頻率作為概率的估計(jì)值。2.頻數(shù)分布的兩個(gè)特征①集中趨勢(centraltendency):變量值集中位置。本例在組段“1.1~”。

——平均水平指標(biāo)②離散趨勢(tendencyofdispersion):變量值圍繞集中位置的分布情況。本例0.9~1.4,共有90人,占56%;離“中心”位置越遠(yuǎn),頻數(shù)越?。磺覈@“中心”左右對(duì)稱。

——變異水平指標(biāo)

正態(tài)分布頻對(duì)稱分布數(shù)t分布分布正偏態(tài):高峰偏向左側(cè)類偏態(tài)分布型(非對(duì)稱分布)負(fù)偏態(tài):高峰偏向右側(cè)3.頻數(shù)分布類型某地區(qū)130名正常成年男子紅細(xì)胞數(shù)(1012/L)的頻數(shù)分布

紅細(xì)胞數(shù) 劃記 頻數(shù)

3.70~ || 2 3.90~ |||| 4 4.10~ 正|||| 9 4.30~ 正正正| 16 4.50~ 正正正正|| 22 4.70~ 正正正正正 25 4.90~ 正正正正| 21 5.10~ 正正正|| 17 5.30~ 正|||| 9 5.50~ |||| 4 5.70~5.90 | 1

合計(jì) —— 130*對(duì)稱分布(正態(tài)分布)

﹡偏態(tài)分布

正偏態(tài)分布238名正常人發(fā)汞值(μg/g)發(fā)汞值 頻數(shù) 累計(jì)頻數(shù) 累計(jì)頻率(%)(1) (2) (3) (4)=(3)/2380.3~ 20 20 8.40.7~ 66 86 36.11.1~ 60 146 61.31.5~ 48 194 81.51.9~ 18 212 89.12.3~ 16 228 95.82.7~ 6 234 98.33.1~ 1 235 98.73.5~ 0 235 98.73.9~ 3 238 100.0負(fù)偏態(tài)分布某地某年惡性腫瘤死亡數(shù)年齡組(歲)死亡人數(shù)累計(jì)頻數(shù)累計(jì)頻率(%)

0~ 550.4210~ 12171.4120~ 15322.6630~ 761088.9840~ 18929724.6950~ 23453144.1460~ 38691776.2370~ 2861203100.00

第一節(jié)集中趨勢指標(biāo)集中趨勢指標(biāo):用于描述一組同質(zhì)數(shù)值變量資料的平均水平或中心位置的指標(biāo)??偡Q為平均數(shù),是統(tǒng)計(jì)中應(yīng)用最廣泛、最重要的一個(gè)指標(biāo)體系。常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)。一、算術(shù)均數(shù)(arithmeticmean)簡稱均數(shù)(mean)。常用表示樣本均數(shù),希臘字母表示總體均數(shù)。適用范圍:對(duì)稱分布,特別是正態(tài)或近似正態(tài)分布的數(shù)值變量資料。

計(jì)算方法

(1)直接法:適用小樣本

(2)加權(quán)法:適用大樣本Σ為求和符號(hào),讀成sigma

組段(1)

劃記(2)

頻數(shù),f(3)

組中值,X(4)fX(5)=(3)×(4)0.5~

30.551.650.6~正90.655.850.7~正正120.759.000.8~正正130.8511.050.9~正正正170.9516.151.0~正正正181.0518.901.1~正正正正201.1523.001.2~正正正181.2522.501.3~正正正171.3522.951.4~正正131.4518.851.5~正91.5513.951.6~正81.6513.201.7~1.8

合計(jì)

31.755.25160182.30均數(shù)=182.3/160=1.14mffm142.51142.5145.52291148.54594151.5131969.5154.5243708157.5264095160.5162568163.5101635166.53499.5169.51169.5和10015672=15672/100=156.72均數(shù)110名20歲健康男大學(xué)生身高(cm)均數(shù)計(jì)算表(簡捷法)組段組中值頻數(shù)(f)縮簡值fxfx2(x)=X-X0/i162~1631-5-525164~1654-4-1664166~1679-3-2781168~16913-2-2652170~17119-1-1919172~X0=~1751611616176~177821632178~179832472180~181341248182~184183251050

用G表示適用范圍

1.頻數(shù)分布呈正偏態(tài),經(jīng)對(duì)數(shù)變換后服從正態(tài)分布(對(duì)數(shù)正態(tài)分布)的資料;

2.等比數(shù)列資料。

二、幾何均數(shù)(geometricmean)

計(jì)算方法(1)直接法——小樣本(2)加權(quán)法——大樣本

實(shí)例分析例1.3有6份血清的抗體效價(jià)的倒數(shù)為10,20,40,80,80,160。求其平均效價(jià)。例1.4測得5個(gè)人的血清滴度的倒數(shù)分別為2,4,8,8,32,求平均滴度。幾何均數(shù)的應(yīng)用須注意常用于等比資料,或者對(duì)數(shù)正態(tài)分布資料。觀察值不能有“0”。觀察值不能同時(shí)有正、有負(fù),若全為負(fù)值,先將負(fù)號(hào)去掉,得出結(jié)果后加上負(fù)號(hào)。同一組資料求得的幾何均數(shù)小于均數(shù)。三、中位數(shù)(median)中位數(shù)是一組由小到大排列的觀察值中位次居中的數(shù)值,用M表示。反映一組觀察值在位次上的平均水平。適用范圍:適用各種類型的資料,尤其以下情況:

1.資料分布呈明顯偏態(tài);

2.資料一端或兩端存在不確定數(shù)值(開口資料或無界資料);

3.資料分布不明。

計(jì)算方法直接法——小樣本頻數(shù)表法——大樣本

1.編制頻數(shù)分布表

2.計(jì)算累計(jì)頻數(shù)和累計(jì)頻率

3.代入中位數(shù)計(jì)算公式

例:某藥廠觀察9只小鼠口服高山紅景天醇提物(RSAE)后在乏氧條件下的生存時(shí)間(分鐘)如下:

49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0

n為奇數(shù),M=63.6(cm)表1-5某地630名正常女性血清甘油三酯含量的頻數(shù)表甘油三酯頻數(shù)累計(jì)頻數(shù)累計(jì)頻率10~27274.340~16919631.170~16736357.6M100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合計(jì)630M=70+30/167(6300.5-196)=91.4(mg/dl)四、百分位數(shù)(percentile)

百分位數(shù)是一個(gè)位置指標(biāo),用表示。將n個(gè)觀察值由小到大依次排列,將全部觀察值分為兩部分,理論上x%的觀察值比它小,(100-x)%的觀察值比它大。表示第50百分位數(shù),即第50%等份所對(duì)應(yīng)的觀察值。也就是中位數(shù)。描述一組偏態(tài)分布資料在某百分位置上的水平。用于計(jì)算四分位數(shù)間距和確定醫(yī)學(xué)參考值范圍。

計(jì)算公式:P25=40+30/169(630×0.25-27)=63.2(mg/dl)P75=130+30/81(630×0.75-457)=135.7(mg/dl)P90=160+30/42(630×0.90-538)=180.7(mg/dl)P95=190+30/42(630×0.95-580)=203.2(mg/dl)醫(yī)學(xué)95%的參考值:P97.5-P2.5青少年生長發(fā)育:P5、P25、P75

、P95表1-6164個(gè)沙門氏菌食物中毒病例潛伏期的頻數(shù)表潛伏期(h)頻數(shù)累計(jì)頻數(shù)累計(jì)頻率2~202012.29~193923.816~407948.223~2310262.230~2212475.637~1413884.144~1114990.951~1815795.758~215997.065~416399.472~1164100.0合計(jì)164M=23+7/23(1640.5-79)=23.91(h)

幾種平均數(shù)的適用范圍

平均數(shù)適用范圍

算術(shù)均數(shù)對(duì)稱分布,尤其是正態(tài)分布或近似正態(tài)分布資料

幾何均數(shù)(1)等比數(shù)列資料(2)頻數(shù)分布呈正偏態(tài)分布,經(jīng)對(duì)數(shù)變化后服從正態(tài)分布(稱對(duì)數(shù)正態(tài)分布)

中位數(shù)(1)資料分布呈明顯偏態(tài)(2)分布的一端或兩端無確定數(shù)值(稱無界資料或開口資料)(3)資料類型分布不明第二節(jié)離散趨勢指標(biāo)集中趨勢指標(biāo):用于描述一組同質(zhì)數(shù)值變量資料的平均水平或中心位置的指標(biāo)。離散趨勢指標(biāo):描述一組同質(zhì)數(shù)值變量數(shù)據(jù)離散程度的指標(biāo)。集中趨勢和離散程度是數(shù)值變量資料的頻數(shù)分布的兩個(gè)主要特征。應(yīng)結(jié)合起來分析。

常用的離散程度指標(biāo)

1.極差/全距(Range)

2.四分位數(shù)間距(Quartilerange)

3.方差(Variance)

標(biāo)準(zhǔn)差(StandardDeviation)

4.變異系數(shù)(CoefficientofVariation)

例2-10三組同齡男孩的身高值(cm)

R甲組909510010511010020乙組96981001021041008丙組96991001011041008

三組同齡男孩的身高值(cm)分布身高值作為變異指標(biāo)比極差穩(wěn)定。常用于表示偏態(tài)分布資料的變異。例(表1-5):Q=P75%-P25%=135.7-63.2=72.5(mg/dl)頻數(shù)潛伏期表2-5資料118名鏈球菌咽喉炎患者潛伏期3、方差(variance)方差

——所有觀察值的離均差平方和的均值。包括總體方差和樣本方差,分別表示總體或樣本資料的平均離散情況。定義公式:自由度(degreeoffreedom)——隨機(jī)變量自由取值的個(gè)數(shù)??傮w方差樣本方差標(biāo)準(zhǔn)差(standarddeviation)因方差的度量單位是原度量單位的平方,故將方差開方,恢復(fù)成原度量單位,得總體標(biāo)準(zhǔn)差和樣本標(biāo)準(zhǔn)差。定義公式:總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差的計(jì)算公式:直接法(n?。杭訖?quán)法(n大

):例2-10甲組5名同齡男孩的身高值(cm)XX2908100959025100100001051102511012100表2-1101名正常女子血清膽固醇值組段(X)

頻數(shù)(f)fXfx22.30~2.4512.456.002.60~2.7538.2522.692.90~3.05618.3055.823.20~3.3583.50~3.65173.80~3.95204.10~4.25174.40~4.55124.70~4.8595.00~5.1555.30~5.4525.6-5.95.751統(tǒng)計(jì)描述:某地101名正常女子血清膽固醇值平均為4.06(mmol/L),標(biāo)準(zhǔn)差為0.654(mmol/L)例2-10三組同齡男孩的身高值(cm)

RS甲組9095100105110100207.91乙組969810010210410083.16丙組969910010110410082.92標(biāo)準(zhǔn)差的意義:反映一組變量值平均相差的水平,單位相同時(shí),S越小,表示數(shù)據(jù)的變異程度越小,同時(shí)表示該組均數(shù)的代表性越大。mffmfm2142.51142.5145.52291148.54594151.5131969.5154.5243708157.5264095160.5162568163.5101635166.53499.5169.51169.5和10015672=15672/100=156.72均數(shù)S=4、變異系數(shù)

coefficientofvariation(CV)公式:應(yīng)用:1.比較度量衡單位不同資料的變異程度2.比較均數(shù)相差懸殊資料的變異程度1.單位不同時(shí)組間變異程度的比較。

某地7歲年齡組男童身高與體重

指標(biāo)SCV(%)身高(cm)。123.104.713.83體重(kg)22.292.2610.14結(jié)論:7歲年齡組男童身高與體重值指標(biāo)比較,體重指標(biāo)的變異大于身高指標(biāo)。

某地不同年齡組男童身高(cm)年齡組SCV%1-2月56.32.13.735-6月66.52.23.313-3.5歲96.13.13.225-5.5歲107.83.33.06結(jié)論:隨著年齡增加,身高的變異變小。

2.比較組單位相同,但均數(shù)相差懸殊的組間變異程度比較例1.3I120±5.0CV=0.042II70±4.0CV=0.057

表1120名正常成年男子血清鐵含量的頻數(shù)分布表

6~8~10~12~14~16~18~20~22~24~26~28~30

合計(jì)一上正一正上正正丅正正正正正正正正正丅正正正上正正丅正上止一13681220271812841組段劃記頻數(shù)120

圖中橫軸為血清鐵含量,縱軸為頻率密度,直條面積等于相應(yīng)組段的頻率。?例2利用表2-2的頻數(shù)表求血清鐵含量的中位數(shù)。

組段頻數(shù)累計(jì)頻數(shù)累計(jì)頻率

6~8~10~12~14~16~18~20~22~2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論