第2章-計量資料的統(tǒng)計描述_第1頁
第2章-計量資料的統(tǒng)計描述_第2頁
第2章-計量資料的統(tǒng)計描述_第3頁
第2章-計量資料的統(tǒng)計描述_第4頁
第2章-計量資料的統(tǒng)計描述_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二章計量資料的統(tǒng)計描述一、頻數(shù)分布(Distributionoffrenquency)表與頻數(shù)分布圖

頻數(shù)(Frequency):

在一批樣本中相同情形出現(xiàn)的次數(shù)。

頻數(shù)表/圖(Frequencytable/graph):常用于描述定量資料的分布規(guī)律。

——頻數(shù)分布表的編制

﹡找全距 R=最大值-最小值﹡定組距 i=全距/組數(shù)(8-15組)﹡寫組段 第一組組段包括最小值 最后一組組段包括最大值﹡劃記 各組段的觀察單位數(shù)(頻數(shù))同一組用“組中值”為代表值。編制連續(xù)型頻數(shù)表,用直方圖顯示分布。

編制連續(xù)型變量頻數(shù)分布圖時要注意:1.等距分組時,頻數(shù)分布圖以橫軸表示觀察量,以縱軸表示頻數(shù)(或頻率)。2.不等距分組時,橫軸表示觀察量,縱軸是每個橫軸的頻數(shù)(如不等距年齡分組)。

——頻數(shù)分布的特征描述

﹡集中趨勢:變量值集中分布的位置﹡離散趨勢:變量值圍繞集中位置的分布情況

——頻數(shù)分布的類型

﹡對稱分布:正態(tài)分布

﹡偏態(tài)分布:正偏態(tài),負(fù)偏態(tài)某地區(qū)130名正常成年男子紅細(xì)胞數(shù)(1012/L)的頻數(shù)分布

紅細(xì)胞數(shù) 劃記 頻數(shù)3.70~ || 2 3.90~ |||| 4 4.10~ 正|||| 9 4.30~ 正正正| 16 4.50~ 正正正正|| 22 4.70~ 正正正正正 25 4.90~ 正正正正| 21 5.10~ 正正正|| 17 5.30~ 正|||| 9 5.50~ |||| 4 5.70~5.90 | 1

合計 —— 130*對稱分布(正態(tài)分布)

﹡偏態(tài)分布

正偏態(tài)分布238名正常人發(fā)汞值(μg/g)發(fā)汞值 頻數(shù) 累計頻數(shù) 累計頻率(%)(1) (2) (3) (4)=(3)/2380.3~ 20 20 8.40.7~ 66 86 36.11.1~ 60 146 61.31.5~ 48 194 81.51.9~ 18 212 89.12.3~ 16 228 95.82.7~ 6 234 98.33.1~ 1 235 98.73.5~ 0 235 98.73.9~ 3 238 100.0負(fù)偏態(tài)分布某地某年惡性腫瘤死亡數(shù)年齡組(歲)死亡人數(shù)累計頻數(shù)累計頻率(%)0~ 550.4210~ 12171.4120~ 15322.6630~ 761088.9840~ 18929724.6950~ 23453144.1460~ 38691776.2370~ 2861203100.00

頻數(shù)表的用途

1、觀察分布類型;2、顯示分布特征;3、發(fā)現(xiàn)異常值;4、便于統(tǒng)計描述。二、集中趨勢(Centraltendency)指標(biāo) 均數(shù) 常用平均數(shù) 幾何均數(shù) 中位數(shù)

平均數(shù)(average)常用于描述一組變量值的集中趨勢,是反映同質(zhì)資料的平均水平或集中位置的特征值。

——常用平均數(shù)1.算術(shù)均數(shù)(均數(shù),mean)﹡表示符號 總體均數(shù)(μ) 樣本均數(shù)(

)﹡應(yīng)用 對稱分布資料,尤其是正態(tài)分布資料﹡計算方法

x1+x2+……+xn∑x 直接法x== n n f1x1+f2x2+……+fkxk∑fx 加權(quán)法x= = f1+f2+……+fk ∑f某地140名成年男子紅細(xì)胞數(shù)(×1012/L)的頻數(shù)分布表

紅細(xì)胞數(shù)組中值(X)頻數(shù)(f)fX3.80~ 3.9027.84.00~4.10624.64.20~ 4.301147.34.40~ 4.5025112.54.60~ 4.7032150.44.80~ 4.9027132.35.00~ 5.101786.75.20~ 5.301368.95.40~ 5.50422.05.60~ 5.70211.45.80~6.005.9015.9 合計 —140(∑f)669.8(∑fx)X=∑fx∑f=669.8140=

4.78(×1012/L)均數(shù)的兩個重要特征:

1、離均差之和為0:2、離均差平方之和>0:*∑(x–x)=0*∑(x–x)2<∑(x–a)2(a≠x)

——常用平均數(shù)2.幾何均數(shù)(geometricmean)﹡表示符號:(G)﹡應(yīng)用:變量值呈倍數(shù)關(guān)系,對數(shù)正態(tài)分布資料﹡計算方法: 直接法 G=n√x1·x2…xn lgx1+lgx2+…+lgxn

∑lgx G=lg–1 =lg–1 nn

f1lgx1+f2lgx2+…+fklgxk

∑flgx加權(quán)法 G=lg–1 =lg–1

∑f∑f例:5人血清效價為1:10、1:100、1:10001:10000、1:100000,其平均效價是多少?X=∑xn10+100+………+1000005==22222G=lg–1lgx1+lgx2+…+lgxn

n〔〕=lg–1∑lgxn=lg–1

1+2+3+4+55〔〕=lg–13

=10001:1000正確錯誤滴度例數(shù)(f)滴度倒數(shù)(x)lgxflgx1:403401.6024.811:8022801.90341.871:160171602.20437.471:32093202.50522.551:64006402.8060.001:1280112803.1073.11合計∑52——109.79麻疹患者恢復(fù)期血清麻疹病毒特異性熒光抗體滴度=129.21:129Lg–1

∑flgx∑f〔〕=Lg–1

109.7952〔〕G=——常用平均數(shù)3.中位數(shù)(median)﹡表示符號:(M) 偏態(tài)分布資料﹡應(yīng)用 變量值分布一端或兩端無確定數(shù)值 分布不明資料﹡計算方法

直接用變量值計算 M=Xn+1(n為奇數(shù)時)

2

1 或 M= Xn+Xn(n為偶數(shù)時) 222+1用頻數(shù)表法計算L

中位數(shù)所在組組段的下限iM中位數(shù)所在組組段的組距fM中位數(shù)所在組的頻數(shù)fL中位數(shù)所在組前一組的累計頻數(shù)M=L

+(-fL)iMfMn2某地630名正常女性血清甘油三酯(㎎/dl)含量甘油三酯頻數(shù)累積頻數(shù)累計頻率(%)10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合計630——M=L

+(-fL)iMfMn2=70+30/167×(630/2-196)=91.4㎎/dl百分位數(shù)描述觀察序列在百分位置的水平,是分布的百分界值,可用于確定醫(yī)學(xué)參考值范圍,適用于任何分布。

ix Px=L+ (n·x%-fL) fx附:百分位數(shù)Percentile,Px

描述變量值序列在某百分位位置的水平,多個百分位數(shù)結(jié)合可更全面地描述變量值的分布特征。L

Px所在組組段的下限ix

Px

所在組組段的組距fx

Px所在組的頻數(shù)fLPx所在組前一組的累計頻數(shù)某地630名正常女性血清甘油三酯(㎎/dl)含量甘油三酯頻數(shù)累積頻數(shù)累計頻率(%)10~27274.340~16919631.170~16736357.6100~9445772.5130~8153885.4160~4258092.1190~2860896.5220~1462298.7250~462699.4280~362999.8310~1630100.0合計630——=190+30/28×(630×95%-580)=209.8

ix Px=L+ (n·x%-fL) fx㎎/dl常用平均數(shù)的對比

名稱

意義

應(yīng)用場合

均數(shù)平均數(shù)量水平應(yīng)用甚廣,適用于對稱分布,尤其是正態(tài)分布幾何均數(shù)平均增(減)倍數(shù)

等比資料;對數(shù)正態(tài)分布中位數(shù)位次居中的觀察值水平偏態(tài)分布;分布不明;分布末端無確定值。三、離散趨勢(tendencyofdispersion)

描述變量值的離散趨勢用變異指標(biāo)

全距(極差)

四分位數(shù)間距常用變異指標(biāo)方差

標(biāo)準(zhǔn)差

變異系數(shù)

百分位數(shù)法離均差法——常用變異指標(biāo)

1.全距(range,R)﹡R=最大值—最小值﹡反映變量值的變異范圍﹡各種類型資料都可應(yīng)用,但不穩(wěn)定,僅粗略說明變量值的變動范圍。

(常作參考資料)

——常用變異指標(biāo)

2.方差(Variance)和 標(biāo)準(zhǔn)差(Standarddeviation)

﹡定義公式 ∑(X—μ)2 ∑(X—μ)2

σ2= σ= N N ∑(X—X)2 ∑(X—X)2S2= S= n—1n—1

為總體標(biāo)準(zhǔn)差s為樣本標(biāo)準(zhǔn)差

﹡應(yīng)用公式

∑X2—(∑X)2/n直接法 S=

√ n—1

∑fX2—(∑fX)2/∑f

加權(quán)法 S=

√ ∑f—1∑X2-(∑X)2/nn-1√S=5人收縮血壓測定結(jié)果(mmHg):162145178142186∑X=813∑X2=133317√=133317–(813)2/55–1

=19.49mmHg某地140名成年男子紅細(xì)胞數(shù)(×1012/L)的頻數(shù)分布表

紅細(xì)胞數(shù)組中值(X)頻數(shù)(f)fXfX23.80~ 3.9027.830.424.00~4.10624.6100.864.20~ 4.301147.3203.394.40~ 4.5025112.5506.254.60~ 4.7032150.4706.884.80~ 4.9027132.3648.275.00~ 5.101786.7442.175.20~ 5.301368.9365.175.40~ 5.50422.0121.005.60~ 5.70211.464.985.80~6.005.9015.95.90 合計(∑) —140669.8

3224.20∑fX2-(∑fX)2/nn-1√S=√=3224.20–(669.8)2/n140-1=0.38

﹡標(biāo)準(zhǔn)差用途: 1.表示同質(zhì)變量值的離散程度,用于兩組變量值比較時,要求其性質(zhì)相同,均數(shù)相差不大.2.與均數(shù)結(jié)合,表示均數(shù)的代表性(x±s),同時描述正態(tài)分布特征3.與均數(shù)結(jié)合,計算變異系數(shù)4.與樣本含量(n)結(jié)合,計算標(biāo)準(zhǔn)誤-﹡用途:1)比較多組單位不同資料的變異度 2)比較多組均數(shù)相差較大資料的變度——常用變異指標(biāo)3.變異系數(shù)(Coefficientofvariation,CV)﹡定義 CV(%)=×100%SX例1:比較7歲男孩身高與體重的變異程度身高:X1=123.10cmS1=4.71cm

體重:X2=22.29kgS2=2.26kgCV(%)=×100%SXCV1=4.71/123.10×100%=3.83%CV2=2.26/22.29×100%=10.14%■

例2:某地不同年齡兒童身高(cm)的變異程度年齡組人數(shù)X1~6月10056.35~6月12066.53~3.5歲30096.15~5.5歲400107.8S2.12.23.13.3CV(%)3.73.33.23.14.四分位數(shù)間距(Quartile,Q)

﹡四分位數(shù)間距為特定的百分位數(shù),可看作為中間1/2變量值的全距

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論