版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第二講定量資料的統(tǒng)計描述
楊土保教授博士中南大學公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學系2010-03-12第2講定量資料的統(tǒng)計描述主要內(nèi)容頻數(shù)分布表和頻數(shù)分布圖集中位置的描述離散程度的描述正態(tài)分布及其應(yīng)用第2講定量資料的統(tǒng)計描述頻數(shù)與頻數(shù)分布頻數(shù)與頻數(shù)分布頻數(shù):某個測量值的個(例)數(shù)。頻數(shù)分布表(frequencydistributiontable):又稱頻數(shù)表。是將原始數(shù)據(jù)值適當分組后得到各組的頻數(shù),如表4-1頻數(shù)分布表。適用樣本量較大的資料進行統(tǒng)計描述的常用方法。通過頻數(shù)表可以顯示數(shù)據(jù)分布的范圍與形態(tài)。可用手工和計算機軟件(如SAS、SPSS等)方便制作頻數(shù)表。第2講定量資料的統(tǒng)計描述
頻數(shù)分布表(frequencytable)
用途:用于描述資料的分布特征
頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù)。資料類型組段頻數(shù)計數(shù)和等級觀察結(jié)果的所有分類相同類別出現(xiàn)的次數(shù)計量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計第2講定量資料的統(tǒng)計描述表4-3某地150名正常成年男子紅細胞數(shù)(1012/L)
編號紅細胞數(shù)編號紅細胞數(shù)13.98……24.541434.6734.741445.4045.131455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.19第2講定量資料的統(tǒng)計描述1.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個組,為方便計,組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=2.09/10=0.209≈0.2。第2講定量資料的統(tǒng)計描述(3)列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。第2講定量資料的統(tǒng)計描述
組段(1)
頻數(shù),f(2)
組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9
合計15.85.8150719.8第2講定量資料的統(tǒng)計描述頻數(shù)與頻數(shù)分布離散型定量變量的頻數(shù)表
某市2005年進行學生體質(zhì)評價,抽樣調(diào)查了102名高中男生引體向上完成次數(shù)的情況,根據(jù)該資料制作頻數(shù)表。本次調(diào)查資料“引體向上完成次數(shù)”是離散型定量變量,所以按變量的取值(次數(shù))為單位分組,再列出各組的頻數(shù),如表4.1的第(1),(2)欄,就能得到相應(yīng)的頻數(shù)表。將各組的頻數(shù)除以總頻數(shù)所得的值稱為頻率,見第(3)欄。某組的累計頻數(shù)是該組與前面各組頻數(shù)之和,見第(4)欄。顯然,第一組的累計頻數(shù)等于其頻數(shù),最后一組的累計頻數(shù)等于總例數(shù);累計頻數(shù)除以總頻數(shù)所得的值稱為累計頻率,見第(5)欄。
第2講定量資料的統(tǒng)計描述頻數(shù)與頻數(shù)分布表4.12005年某市102名高中男生引體向上完成次數(shù)的頻數(shù)分布完成次數(shù)
頻數(shù)f頻率(%)累計頻數(shù)累計頻率(%)(1)(2)(3)(4)(5)232.9432.94376.86109.8041615.692625.4953332.355957.8462423.538381.3771413.739795.10843.9210199.02910.98102100.00合計102100.00——第2講定量資料的統(tǒng)計描述頻數(shù)與頻數(shù)分布例4.2
在某市2005年進行的小學生體質(zhì)評價研究中,測定了120名9歲男孩的肺活量(L),資料如下,根據(jù)該資料制作頻數(shù)表。1.7061.3261.6321.8762.1611.6841.5331.1751.8671.6762.0911.8471.2131.2770.9892.2351.6651.2891.7241.5481.6081.8901.7331.7961.2031.7361.4501.6331.5551.3521.8321.4441.7371.4591.4501.7821.5551.6341.5082.3431.5091.7451.9531.7441.6951.7071.9011.8251.5972.3381.7081.7111.8561.6441.7161.9781.5341.9001.5951.6461.9051.6101.6141.4222.3012.1271.3481.3171.0621.8301.9801.5701.4951.8642.1702.0001.7051.8631.4242.0222.0681.5761.8331.6592.2121.3992.1281.5431.5621.3821.2911.7961.6471.4151.8730.9961.9361.5261.4241.5891.6701.0561.9691.4812.4062.1231.9881.5121.0301.8861.9301.7251.3741.6541.6631.4381.6451.2141.1841.735連續(xù)型定量變量的頻數(shù)表第2講定量資料的統(tǒng)計描述頻數(shù)與頻數(shù)分布手工編制表4.2步驟。(1)計算全距(range,R),也稱為極差
(2)確定組段數(shù)與組距:組段數(shù)一般可在10~15之間選擇。一般當觀察值的個數(shù)n
在50以下時可分5到8組,n在50以上時可分9到15組,實際運用時應(yīng)根據(jù)分析的要求,靈活確定組數(shù)。本例n為120,擬分11組。組距=上限-下限=R/(預(yù)計的組段數(shù))。本例如果預(yù)計取11個組段,則組距長度可取0.130。兩端的組段應(yīng)分別包含最小值或最大值;(3)列表做出如表4.2的表格,將選好的組段順序地列在(1)列。按照“下限≤x<上限”的原則確定每一例數(shù)據(jù)x應(yīng)歸屬的組段。第2講定量資料的統(tǒng)計描述表4.2
2005年某市120名9歲男孩肺活量(L)頻數(shù)分布組段頻數(shù)(f)頻率(%)累計頻數(shù)累計頻率(%)(1)(2)(3)(4)(5)0.980~54.1754.171.110~54.17108.331.240~75.831714.171.370~1411.673125.831.500~1915.835041.671.630~2924.177965.831.760~1512.509478.331.890~1210.0010688.332.020~65.0011293.332.150~43.3311696.672.280~2.41043.33120100.00合計120100.00——表4.22005年某市120名9歲男孩肺活量(L)頻數(shù)分布第2講定量資料的統(tǒng)計描述頻數(shù)與頻數(shù)分布頻數(shù)分布圖:在表4.2的基礎(chǔ)上,可以繪制出圖4.1,稱為直方圖(頻率直方圖)。橫軸:男孩的肺活量縱軸:頻率密度,即頻率/組距(直條面積等于相應(yīng)組段的頻率)。在組距相等時,直方圖中矩形直條的高度與相應(yīng)組段的頻率成正比。第2講定量資料的統(tǒng)計描述頻數(shù)與頻數(shù)分布圖4.12005年某市120名9歲男孩肺活量頻數(shù)分布
第2講定量資料的統(tǒng)計描述頻數(shù)與頻數(shù)分布對稱分布:頻數(shù)最多的組段在中央,圖4.1正偏峰分布:峰向左側(cè)偏移的分布,右側(cè)的組段數(shù)多于左側(cè),為右偏峰分布。圖4.2負偏峰分布:峰向右側(cè)偏移的分布,左側(cè)的組段數(shù)多于右側(cè),稱為左偏峰分布。圖4.3第2講定量資料的統(tǒng)計描述圖4.22004年我國麻疹患者的年齡分布
圖4.3
某市219名乳腺癌患者術(shù)后康復(fù)期生存質(zhì)量評分的分布
第2講定量資料的統(tǒng)計描述第2講定量資料的統(tǒng)計描述頻數(shù)分布表和頻數(shù)分布圖的主要用途1.揭示頻數(shù)分布的特征
兩個重要特征:集中趨勢(centraltendency)和離散趨勢(dispersiontendency)。集中趨勢是指一組數(shù)據(jù)向某一個位置聚集或集中的傾向,離散程度則反映的是一組數(shù)據(jù)的分散性或變異度2.揭示頻數(shù)分布的類型
兩種類型:對稱型和不對稱型偏態(tài)分布:正偏態(tài)(positiveskew),負偏態(tài)(negativeskew),
用頻數(shù)分布表和頻數(shù)分布圖揭示頻數(shù)分布的類型和特征,便于選用適當?shù)慕y(tǒng)計方法。
4.便于進一步做統(tǒng)計分析和處理3.便于發(fā)現(xiàn)一些特大或特小的可疑值*第2講定量資料的統(tǒng)計描述第2講定量資料的統(tǒng)計描述計量資料的常用統(tǒng)計指標集中位置(centraltendency)的描述
平均數(shù)(average)是描述定量變量集中位置的特征值,用來說明數(shù)據(jù)的平均水平,它反映了一組資料的“一般”、“大多數(shù)”、“平?!钡惹闆r。平均數(shù)是一類統(tǒng)計指標的統(tǒng)稱,在醫(yī)學領(lǐng)域中常用的平均數(shù)有算術(shù)均數(shù)(arithmeticmean)
、幾何均數(shù)(geometricmean)和中位數(shù)(median)
算術(shù)均數(shù):適合描述對稱分布資料的集中位置(也稱為平均水平)。其計算公式為
第2講定量資料的統(tǒng)計描述計量資料的常用統(tǒng)計指標1)直接計算法:計算公式為
式中X1,X2和Xn為所有觀察值,n為樣本含量,∑(希臘字母,讀作sigma)為求和的符號。例4.3利用例4.2的120名9歲男孩的肺活量資料,用直接法計算平均肺活量。
第2講定量資料的統(tǒng)計描述計量資料的常用統(tǒng)計指標測得8只正常大鼠血清總酸性磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。算術(shù)均數(shù)=(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8=3.9075(U/L)第2講定量資料的統(tǒng)計描述計量資料的常用統(tǒng)計指標2)加權(quán)頻數(shù)表法:計算公式為加權(quán)均數(shù)直接法均數(shù)=1.672(L)f為權(quán)數(shù)第2講定量資料的統(tǒng)計描述均數(shù)的特性各觀察值與均數(shù)之差(離均差)的總和等于零。
各觀察值的離均差平方和最小。均數(shù)的應(yīng)用1.均數(shù)反映一組同質(zhì)觀察值的平均水平。2.均數(shù)適用于單峰對稱分布資料,特別是正態(tài)分布或近似正態(tài)分布的資料。
3.均數(shù)可用來描述正態(tài)分布的特征第2講定量資料的統(tǒng)計描述計量資料的常用統(tǒng)計指標幾何均數(shù)(geometricmean,G)
適用于觀察值變化范圍跨越多個數(shù)量級的資料。醫(yī)學研究中的某些資料如血清抗體滴度、細菌計數(shù)、體內(nèi)某些微量元素含量等,其特點是原始觀察值呈正偏態(tài)分布,但經(jīng)過對數(shù)變換后呈正態(tài)或近似正態(tài)分布,或者其觀察值數(shù)值相差極大甚至達到不同數(shù)量級,此時若計算均數(shù)則不能正確描述其集中位置,宜采用幾何均數(shù)(geometricmean)
。其計算公式為
第2講定量資料的統(tǒng)計描述幾何均數(shù)幾何均數(shù):變量對數(shù)值的算術(shù)均數(shù)的反對數(shù)。
第2講定量資料的統(tǒng)計描述幾何均數(shù)的適用條件與實例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料
例血清的抗體效價滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)第2講定量資料的統(tǒng)計描述2006年某市衛(wèi)生監(jiān)督所對33家商場空氣中的細菌密度(個/m3)進行了監(jiān)測,資料如下,試求其平均密度。109051282645119722028527216228741376945962564483013881106326724016453973715510710878015654598267713257413313112226664354124922629488
第2講定量資料的統(tǒng)計描述頻數(shù)表資料的幾何均數(shù)抗體滴度⑴
人數(shù),f⑵
滴度倒數(shù),X⑶lgX⑷
f·lgX⑸1:4
1:81:161:32┇1:512
合計1562┇540481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471例4-5:幾何均數(shù)=反對數(shù)(72.2471/40)=64.00第2講定量資料的統(tǒng)計描述幾何均數(shù)的應(yīng)用1.幾何均數(shù)常用于變量值間呈倍數(shù)關(guān)系的偏態(tài)分布資料,特別是變量經(jīng)過對數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料。2.因為0不能取對數(shù),所以數(shù)據(jù)中若有0則不宜直接使用幾何均數(shù),此時可將所有觀察值加上一個常數(shù)k,使,計算出結(jié)果后再還原,即。
3.觀察值若同時有正、負值,可將所有觀察值加上一個常數(shù)k,使,計算出結(jié)果后再還原,即。觀察值若全是負值,計算時可先將負號去掉,得出結(jié)果后再加上負號。
第2講定量資料的統(tǒng)計描述中位數(shù)(median)
意義:中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。符號:Md
適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。
第2講定量資料的統(tǒng)計描述中位數(shù)計算公式與實例
先將觀察值按從小到大順序排列,再按以下公式計算:特點:僅僅利用了中間的1~2個數(shù)據(jù)p51,例4-6:5人潛伏期:2,3,5,8,20第2講定量資料的統(tǒng)計描述例
為研究燃煤型砷中毒患者體內(nèi)砷負荷狀況,某醫(yī)學院對17名燃煤型砷中毒患者進行了發(fā)砷含量測定,結(jié)果為:1.61、1.91、2.24、2.24、2.30、2.60、2.84、3.15、3.33、3.75、3.75、3.75、3.81、4.42、6.42、6.42、14.76,試求其平均含量。
例7在前述17名燃煤型砷中毒患者發(fā)砷含量的基礎(chǔ)上,又測得1名燃煤型砷中毒患者的發(fā)砷含量為15.39,求這18名燃煤型砷中毒患者發(fā)砷含量的中位數(shù)。
第2講定量資料的統(tǒng)計描述百分位數(shù)法計算中位數(shù):頻數(shù)表資料百分位數(shù)的計算公式為
式中LX、iX和fX分別為第百分位數(shù)所在組段的下限、組距和頻數(shù),∑fL為小于各組段的累計頻數(shù),LX為總例數(shù)。即為中位數(shù)的計算公式第2講定量資料的統(tǒng)計描述頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md第2講定量資料的統(tǒng)計描述例
為研究乳腺癌患者術(shù)后康復(fù)期生存質(zhì)量的狀況,某醫(yī)院對219名術(shù)后康復(fù)期乳腺癌患者進行了生存質(zhì)量測定,結(jié)果如表4.4,求平均評分。評分頻數(shù)累計頻數(shù)累計頻率(%)0~220.9130~241.8340~373.2050~11188.2260~304821.9270~6311150.6880~6017178.0890~10048219100.00第2講定量資料的統(tǒng)計描述中位數(shù)的應(yīng)用1.中位數(shù)可用于各種分布的資料,在正態(tài)分布資料中,中位數(shù)等于均數(shù),在對數(shù)正態(tài)分布資料中,中位數(shù)等于幾何均數(shù)。
2.中位數(shù)不受極端值的影響,因此,實際工作中主要用于不對稱分布類型的資料、兩端無確切值或分布不明確的資料。
第2講定量資料的統(tǒng)計描述均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時:均數(shù)=中位數(shù)正偏態(tài)分布時:均數(shù)>中位數(shù)負偏態(tài)分布時:均數(shù)<中位數(shù)第2講定量資料的統(tǒng)計描述計量資料的常用統(tǒng)計指標
眾數(shù)(mode):原指總體中出現(xiàn)機會最高的數(shù)值。樣本眾數(shù)則是在樣本中出現(xiàn)次數(shù)最多的數(shù)值。
調(diào)和均數(shù)(harmonicmean,H):先求原始數(shù)據(jù)倒數(shù)的算術(shù)均數(shù)。該算術(shù)均數(shù)的倒數(shù)便稱為原數(shù)據(jù)的調(diào)和均數(shù)。第2講定量資料的統(tǒng)計描述計量資料的常用統(tǒng)計指標其計算公式為例接受某種處理的5只小鼠生存時間(分鐘)分別為49.1、60.8、63.3、63.6和63.6,試計算其調(diào)和均數(shù)。
第2講定量資料的統(tǒng)計描述小結(jié):
集中趨勢的描述——平均數(shù)
平均數(shù):描述一組變量值的集中位置或平均水平的指標體系。
不同的分布使用不同的指標
(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料幾何均數(shù):對數(shù)正態(tài)分布或等比級數(shù)資料中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)第2講定量資料的統(tǒng)計描述描述離散趨勢的特征數(shù)
(變異(variation)指標)
反映數(shù)據(jù)的離散度(Dispersion
)。即個體觀察值的變異程度。常用的指標有:
1.極差(Range)
(全距)
2.百分位數(shù)與四分位數(shù)間距
PercentileandQuartilerange
3.方差
Variance
4.標準差StandardDeviation
5.變異系數(shù)
CoefficientofVariation
第2講定量資料的統(tǒng)計描述計量資料的常用統(tǒng)計指標離散程度的描述
例某醫(yī)學院用自編生存質(zhì)量量表測得三組同年齡、同性別中年知識分子的軀體功能維度得分,資料如下:甲組
88910111212乙組
56810121415丙組
125101518193組的例數(shù)都是7例,均數(shù)和中位數(shù)都是10分,但憑直觀就可以發(fā)現(xiàn)三組數(shù)據(jù)變異的程度是不相同的,這在分析資料時須加以考慮。
第2講定量資料的統(tǒng)計描述
盤編號甲乙丙14404804902460490495350050050045405105055560520510合計250025002500均數(shù)500500500
例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細胞計數(shù),每人數(shù)5個計數(shù)盤,得結(jié)果如下(萬/mm3)甲乙丙第2講定量資料的統(tǒng)計描述極差(Range)(全距)
1204020符號:R意義:反映全部變量值的變動范圍。
優(yōu)點:簡便,如說明傳染病、食物中毒的最長、最短潛伏期等。
缺點:1.只利用了兩個極端值
2.n大,R也會大
3.不穩(wěn)定適用范圍:任何計量資料;是參考變異指標第2講定量資料的統(tǒng)計描述計量資料的常用統(tǒng)計指標
極差是最簡單但又較粗略的變異指標,可用于各種分布的資料,但它只涉及兩個極端值,沒有利用全部數(shù)據(jù)的信息,不能反映組內(nèi)其他觀察值的變異。同時由于樣本含量較大時抽到極大值或極小值的可能性較大,也可能較大,故極差一般常用于描述單峰對稱分布小樣本資料的離散程度,或用于初步了解資料的變異程度;當樣本含量相差較大時,不宜用極差來比較資料的離散程度。
例4.10計算例4.9中三組中年知識分子軀體功能維度得分的極差:甲組
12-8=4乙組
15-5=10丙組
19-1=18
甲組數(shù)據(jù)離散程度最小,丙組數(shù)據(jù)離散程度最大,乙組居中。
第2講定量資料的統(tǒng)計描述百分位數(shù)與四分位數(shù)間距
Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對應(yīng)的值。記為Px。四分位間距:
(定義:P53)Q=P75-P25
四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px第2講定量資料的統(tǒng)計描述頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)Px第2講定量資料的統(tǒng)計描述P25=6+6x[(145x25%-17)/46]=8.51(h)P75=18+6x[(145x75%-101)/32]=19.45(h)Q=19.45-8.51=10.94(h)
潛伏期/h
(1)
頻數(shù),f(2)
累計頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48
合計2145145四分位數(shù)間距常用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度
第2講定量資料的統(tǒng)計描述百分位數(shù)的應(yīng)用確定醫(yī)學參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個體的測量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征第2講定量資料的統(tǒng)計描述定量變量的特征數(shù)3.方差方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水平。離均差:每一個變量值與均數(shù)的差值,離均差平方和(sumofsquares):離均差平方后相加得到的值方差:離均差平方和除以得到的值總體方差用表示第2講定量資料的統(tǒng)計描述第2講定量資料的統(tǒng)計描述樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計證明,n代替N后,計算出的樣本方差對總體方差的估計偏小。對于樣本資料,對離均差平方和取平均時分母用n-1代替n。分母為n-1,稱為自由度(能自由取值的變量的個數(shù))。第2講定量資料的統(tǒng)計描述標準差
標準差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。第2講定量資料的統(tǒng)計描述加權(quán)法
用于頻數(shù)表資料
例4.16
用加權(quán)法計算2005年某市120名9歲男孩肺活量的標準差,由表4.2資料計算組中值X
標準差是描述單峰對稱分布資料離散程度最常用的指標。標準差大,表示觀察值之間變異程度大,即一組觀察值的分布較分散;標準差小,表示觀察值之間變異程度小,即一組觀察值的分布較集中。對于經(jīng)對數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料,應(yīng)將原始觀察值取對數(shù)值后計算幾何標準差。
第2講定量資料的統(tǒng)計描述標準差的計算盤編號甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計250025002500標準差50.9915.817.91第2講定量資料的統(tǒng)計描述方差=(3476.48-719.82/150)/(150-1)=0.1503標準差=0.39(1012/L)(例4-12)
組段(1)
頻數(shù),f(2)
組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9
合計15.85.8150719.8第2講定量資料的統(tǒng)計描述5.變異系數(shù)(coefficientofvariation)符號:CV適用條件:①觀察指標單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)
標準差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%
意義:挑選指標時變異系數(shù)越小,指標越好。P56例4-13第2講定量資料的統(tǒng)計描述1.比較計量單位不同的幾組資料的離散程度例4.17某年某市城區(qū)120名5歲女孩身高均數(shù)為110.10cm,標準差為5.90cm;體重均數(shù)為17.71kg,標準差為1.44kg,比較身高與體重的離散程度。身高體重第2講定量資料的統(tǒng)計描述2.比較均數(shù)相差懸殊的幾組資料的離散程度例4.18某年某市城區(qū)120名5歲女孩體重均數(shù)為17.71kg,標準差為1.44kg,同年該地120名5個月女孩體重均數(shù)為7.37kg,標準差為0.77kg,比較其離散程度。
5歲女孩體重
5個月女孩體重第2講定量資料的統(tǒng)計描述變異指標小結(jié)1.極差較粗,適合于任何分布2.標準差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標和變異指標分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標準差;
偏態(tài)分布:中位數(shù)、四分位半間距第2講定量資料的統(tǒng)計描述分布形態(tài)特征數(shù)描述分布形態(tài)的統(tǒng)計量:偏度系數(shù)與峰度系數(shù)。偏度系數(shù)
(coefficientofskewness,SKEW):理論上總體偏度系數(shù)為0時,分布是對稱的;取正值時,分布為負偏峰;取負值時分布為正偏峰。樣本偏度系數(shù)計算公式:
第2講定量資料的統(tǒng)計描述峰度系數(shù)(coefficientofkurtosis,KURT)
理論上,正態(tài)分布的總體峰度系數(shù)為0;取負值時,其分布較正態(tài)分布的峰平闊;取正值時,其分布較正態(tài)分布的峰尖峭。樣本峰度系數(shù)第2講定量資料的統(tǒng)計描述
1.正態(tài)分布的概念和特征如果隨機變量的分布服從概率密度函數(shù)正態(tài)分布及其應(yīng)用第2講定量資料的統(tǒng)計描述2.正態(tài)分布的圖形
正態(tài)分布曲線呈對稱的鐘形,在均數(shù)處最高,兩側(cè)不斷降低,逐漸與橫軸接近,但不會與橫軸相交,即以橫軸為漸近線。(3)正態(tài)分布有兩個參數(shù),即位置參數(shù)m和形態(tài)參數(shù)s。若固定s,改變m值,曲線沿著X軸平行移動,其形狀不變?nèi)艄潭╩,s越小,曲線越陡峭;反之,s越大,曲線越平坦
第2講定量資料的統(tǒng)計描述圖4.4概率密度曲線示意圖
第2講定量資料的統(tǒng)計描述圖4.5不同和的正態(tài)分布示意圖
第2講定量資料的統(tǒng)計描述圖4.5-1
正態(tài)分布形態(tài)變換示意圖
第2講定量資料的統(tǒng)計描述(4)正態(tài)曲線下的面積分布有一定的規(guī)律。第2講定量資料的統(tǒng)計描述①X軸與正態(tài)曲線所夾面積恒等于1或100%;
④區(qū)間的面積為99.00%。見圖4.6
第2講定量資料的統(tǒng)計描述圖4.6正態(tài)曲線面積分布示意圖
第2講定量資料的統(tǒng)計描述標準正態(tài)分布
正態(tài)分布是一個分布族,對應(yīng)于不同的參數(shù)m和s會產(chǎn)生不同位置、不同形狀的正態(tài)分布。
為了應(yīng)用方便,令
:
XZms-=
若X服從正態(tài)分布,經(jīng)此變換后,則Z就服從均數(shù)為0,標準差為1的正態(tài)分布N(0,1),稱為標準正態(tài)分布(standardnormaldistribution)或Z分布,
第2講定量資料的統(tǒng)計描述圖4.7查表法求標準正態(tài)曲線下面積示意圖第2講定量資料的統(tǒng)計描述例4.19已知,,求標準正態(tài)曲線下范圍內(nèi)的面積。查附表2,得范圍內(nèi)面積,范圍內(nèi)面積,因此范圍內(nèi)的面積為
第2講定量資料的統(tǒng)計描述正態(tài)分布的應(yīng)用估計總體變量值的頻率分布
例4.21已知120名9歲男孩的肺活量,,欲估計該市肺活量介于1.200~1.500L范圍內(nèi)的9歲男孩的比例。
估計該市肺活量在1.200~1.500L范圍內(nèi)的9歲男孩的比例為22.39%。
第2講定量資料的統(tǒng)計描述
制定醫(yī)學參考值范圍參考值是具有明確背景資料的參考人群某項指標的測定值,醫(yī)學參考值范圍(medicalreferencerange)指包括絕大多數(shù)正常人的人體形態(tài)、功能和代謝產(chǎn)物等各種生理及生化指標觀察值的波動范圍,一般在臨床上用作判定正常和異常的參考標準第2講定量資料的統(tǒng)計描述制定醫(yī)學參考值范圍的步驟和注意事項如下:確定觀察對象和抽取足夠的觀察單位
制定醫(yī)學參考值范圍中的所謂“正常人”不是指機體器官組織和功能都完全健康的人,而是指排除了影響所研究變量的疾病和有關(guān)因素的同質(zhì)人群。一般要求每組應(yīng)在100例以上,如果影響研究變量的因素較復(fù)雜,數(shù)據(jù)變異度大,還應(yīng)適當增加樣本含量。
測定方法應(yīng)統(tǒng)一、準確
決定是否分組制定參考值范圍
確定取雙側(cè)或單側(cè)參考值范圍范圍
選定適當?shù)陌俜纸缦?/p>
第2講定量資料的統(tǒng)計描述
醫(yī)學參考值范圍涉及到采用單側(cè)界值還是雙側(cè)界值的問題,這通常依據(jù)醫(yī)學專業(yè)知識而定。
雙側(cè)
:血清總膽固醇無論過低或過高均屬異常白細胞數(shù)無論過低或過高均屬異常單側(cè)
:血清轉(zhuǎn)氨酶僅過高異常肺活量僅過低異常
第2講定量資料的統(tǒng)計描述
醫(yī)學參考值范圍有、、等,最常用的為。計算醫(yī)學參考值范圍的常用方法:正態(tài)分布法百分位數(shù)法第2講定量資料的統(tǒng)計描述二、方法1、正態(tài)分布法:許多生物醫(yī)學數(shù)據(jù)服從或近似服從正態(tài)分布,如同年齡同性別兒童的身高值、體重值,同性別健康成人的紅細胞數(shù)等;有些醫(yī)學資料雖然呈偏態(tài)分布,但若能通過適當?shù)淖兞孔儞Q轉(zhuǎn)換為正態(tài)分布,也可采用正態(tài)分布法制定參考值范圍。適用:正態(tài)分布資料第2講定量資料的統(tǒng)計描述
表4.5參考值范圍的制定%正態(tài)分布法
百分位數(shù)法雙側(cè)單側(cè)
雙側(cè)單側(cè)只有下限只有上限
只有下限只有上限95
P2.5~P97.5P5P9599
P0.5~P99.5P1P99第2講定量資料的統(tǒng)計描述第2講定量資料的統(tǒng)計描述例4.22某地調(diào)查正常成年男子200人的紅細胞數(shù),,
,試估計該地正常成年男子紅細胞數(shù)的95%參考值范圍。
因紅細胞數(shù)過多或過少均屬異常,故按雙側(cè)估計該地正常成年男子紅細胞數(shù)的95%參考值范圍為:
該地正常成年男子紅細胞數(shù)的95%參考值范圍為54.52×1012/L~56.00×1012/L。
第2講定量資料的統(tǒng)計描述百分位數(shù)法適用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)車輛使用費用管理樣本
- 建筑環(huán)保凈化施工協(xié)議
- 時裝秀現(xiàn)場燈具租賃協(xié)議
- 地方戲劇制片人聘用協(xié)議
- 醫(yī)療工程監(jiān)理人員聘用合同
- 醫(yī)院熱水供應(yīng)項目招標方案
- 電力設(shè)施白蟻防治工程維護合同
- 智能商場監(jiān)控安裝合同
- 智能礦業(yè)系統(tǒng)安裝工程合同
- 生物科技實驗室租賃合同
- 工作崗位存在的危險因素及防范措施
- 文物與博物館學專業(yè)大學生職業(yè)生涯規(guī)劃書
- 惡劣天氣下的道路交通管制和疏導(dǎo)方案
- vsd負壓吸引術(shù)護理查房
- 有多少粘貼畫教學設(shè)計朱菊芬
- 學會合理消費
- 紫羅蘭永恒花園
- 高三一本“臨界生”動員會課件
- 家長會課件:四年級家長會語文老師課件
- 食堂驗收記錄表
- 23秋國家開放大學《EXCEL在財務(wù)中的應(yīng)用》形考作業(yè)1-4參考答案
評論
0/150
提交評論