第2章-定量數(shù)據(jù)的統(tǒng)計(jì)描述_第1頁
第2章-定量數(shù)據(jù)的統(tǒng)計(jì)描述_第2頁
第2章-定量數(shù)據(jù)的統(tǒng)計(jì)描述_第3頁
第2章-定量數(shù)據(jù)的統(tǒng)計(jì)描述_第4頁
第2章-定量數(shù)據(jù)的統(tǒng)計(jì)描述_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

定量數(shù)據(jù)的統(tǒng)計(jì)描述深大醫(yī)學(xué)部

周穎

香港大學(xué)醫(yī)學(xué)博士后

2016.9.14醫(yī)學(xué)統(tǒng)計(jì)學(xué)第一節(jié)頻數(shù)分布【例】抽樣調(diào)查某地120名18~35歲健康男性居民血清鐵含量(μmol/L),試編制此血清鐵資料的頻數(shù)分布表。7.428.6523.0221.621.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52表120名健康男性居民血清鐵含量頻數(shù)分布表頻數(shù)表(frequencytable)的編制a、計(jì)算全距(range,R):是一組數(shù)據(jù)的最大值與最小值之差。R=Max-Minb、確定組數(shù)與組距

樣本量在100例左右,組數(shù)選擇8~15之間,一般取10組左右。

組距≈全距/組數(shù)c、確定組限

第一組段必須包括最小值,最后一組段必須包括最大值。

最后一組段包括最大值,且一般情況下應(yīng)包含該組段上限,其余各組段區(qū)間左閉右開。d、計(jì)算各組段頻數(shù)(frequency):即計(jì)算各組段內(nèi)觀察值的個(gè)數(shù)。e、計(jì)算各組段頻率(percent):即計(jì)算各組段頻數(shù)與總觀察值個(gè)數(shù)之比,用百分?jǐn)?shù)表示。f、計(jì)算累計(jì)頻數(shù)(cumulativefrequency)和累計(jì)頻率(cumulativepercent):累計(jì)頻數(shù)是由上至下將頻數(shù)累加;累計(jì)頻率是由上至下將頻率累加。

頻數(shù)表(frequencytable)的編制頻數(shù)分布的目的和用途目的:了解數(shù)據(jù)的分布范圍、集中位置以及分布形態(tài)等特征,以便根據(jù)資料分布情況選擇合適的統(tǒng)計(jì)方法。用途:①作為陳述資料的形式;②便于觀察數(shù)據(jù)的分布類型;③便于發(fā)現(xiàn)數(shù)據(jù)中特大或特小的可疑值;④當(dāng)樣本量大時(shí),可用各組段的頻率作為概率的估計(jì)值。圖120名健康男性居民血清鐵含量頻數(shù)分布圖【例】抽樣調(diào)查某地120名18~35歲健康男性居民血清鐵含量(μmol/L),試編制此血清鐵資料的頻數(shù)分布表。直方圖(histogram)直方圖,是以垂直條段代表頻數(shù)分布的一種圖形。

頻數(shù),由縱軸標(biāo)度組限,由橫軸標(biāo)度組距,條段的寬度直方圖(histogram)對(duì)稱分布

(symmetricdistribution)偏態(tài)分布(skeweddistribution)右偏態(tài)分布

(right-skeweddistribution)左偏態(tài)分布

(left-skeweddistribution)第二節(jié)

集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)平均數(shù)(average),是描述一組觀察值集中位置或平均水平的統(tǒng)計(jì)指標(biāo),常作為一組數(shù)據(jù)的代表值用于分析和進(jìn)行組間的比較。常用的有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)等。概述1、直接法n為樣本量,

X為個(gè)體觀察值。【例】測(cè)得8只正常大鼠血清總酸性磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。算術(shù)均數(shù)算術(shù)均數(shù)【例】120名健康男性居民血清鐵含量的頻數(shù)分布表,試求其算術(shù)均數(shù)。f為組段的頻數(shù),n為總頻數(shù),X為組段的組中值。

X=(組段上限+組段下限)/22、加權(quán)法(頻數(shù)表法)f為組段的頻數(shù),n為總頻數(shù),X為組段的組中值。

X=(組段上限+組段下限)/2算術(shù)均數(shù)【例】120名健康男性居民血清鐵含量的頻數(shù)分布表,試求其算術(shù)均數(shù)。算術(shù)均數(shù)算術(shù)均數(shù)(arithmeticmean),等于一個(gè)變量所有觀察值的和除以觀察值個(gè)數(shù)??傮w均數(shù)用希臘字母μ表示,樣本均數(shù)用符號(hào)表示。算術(shù)均數(shù)適用于對(duì)稱分布的資料,如分布均勻的小樣本數(shù)據(jù)或近似正態(tài)分布的大樣本數(shù)據(jù)。算術(shù)均數(shù)用了到每個(gè)觀察值!易受極端值的影響,并且受極大值的影響大于受極小值的影響。幾何均數(shù)醫(yī)學(xué)研究中有一類特殊資料按照倍數(shù)關(guān)系變化,比如細(xì)菌計(jì)數(shù),抗體滴度。幾何均數(shù)適用于取對(duì)數(shù)后近似呈對(duì)稱分布的資料,尤其是右偏態(tài)分布數(shù)據(jù)。醫(yī)學(xué)研究中常用于比例數(shù)據(jù)?!纠?2例慢性肝炎患者的HBsAg滴度數(shù)據(jù)表,試求其幾何均數(shù)。幾何均數(shù)幾何均數(shù)(geometricmean,G),等于一個(gè)變量所有n個(gè)觀察值的乘積的n次方根。

【注】計(jì)算幾何均數(shù)的觀察值不能小于或等于0,因?yàn)闊o法求對(duì)數(shù)。幾何均數(shù)1、直接法:【例】某醫(yī)院測(cè)得10個(gè)某種傳染病人的白細(xì)胞計(jì)數(shù)(×103),測(cè)定值為:11,9,35,5,9,8,3,10,12,8。計(jì)算這10個(gè)觀察值的幾何均數(shù)。常用于血清學(xué)和微生物學(xué)中!幾何均數(shù)2、加權(quán)法(頻數(shù)表法)【例】52例慢性肝炎患者的HBsAg滴度數(shù)據(jù)表,試求其幾何均數(shù)。f為組段的頻數(shù),

X為組段的組中值,

n為總頻數(shù)。中位數(shù)中位數(shù)(median,M),是在按大小順序排列的變量的所有觀察值中,位于正中間的一個(gè)或兩個(gè)數(shù)值。中位數(shù)的確定取決于它在數(shù)據(jù)序列中的位置,因此對(duì)極端值不敏感。當(dāng)數(shù)據(jù)呈偏態(tài)分布、或頻數(shù)分布兩端無確定數(shù)值,均宜采用中位數(shù)描述集中趨勢(shì)。

中位數(shù)n為奇數(shù)時(shí),M=X(n+1)/2

n為偶數(shù)時(shí),M=(Xn/2+Xn/2+1)/21、直接法【例】某藥廠觀察9只小鼠口服高山紅景天醇提物(RSAE)后在乏氧條件下的生存時(shí)間(分鐘)為:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。試求其中位數(shù)?!纠?01名正常人血清肌紅蛋白含量(μg/ml)的頻數(shù)分布表。試求其中位數(shù)。①M(fèi)=X(101+1)/2=X51;

②根據(jù)累計(jì)頻數(shù),X51位于組段[35,40)③按公式,M=35+[(0.5×101-42)/23]×52、頻數(shù)表計(jì)算法L、iM、fM分別為M所在組段的下限、組距和頻數(shù),n為總頻數(shù),fL為所在組段之前各組段的累計(jì)頻數(shù)。中位數(shù)百分位數(shù)百分位數(shù)(percentile),是一個(gè)位置指標(biāo),它將一組變量值排列后劃分為若干相等部分的分割點(diǎn)數(shù)值。用Px表示,X用百分?jǐn)?shù)表示。

表示在按照升序排列的數(shù)據(jù)中,其左側(cè)(≤Px)的觀察值個(gè)數(shù)在整個(gè)樣本中所占百分比為X%,其右側(cè)(≥Px)的觀察值個(gè)數(shù)在整個(gè)樣本中所占百分比為(100-X)%。L、i、fx分別為所在組段的下限、組距和頻數(shù),n為總頻數(shù),∑fL為所在組段之前各組段的累計(jì)頻數(shù)?!纠?01名正常人血清肌紅蛋白含量(μg/ml)的頻數(shù)分布表。試求其百分位數(shù)P25%

、P50%

、P75%

。百分位數(shù)百分位數(shù)

百分位數(shù)不論資料分布類型均可計(jì)算,在實(shí)際工作中常用于確定醫(yī)學(xué)參考值范圍(P2.5~P97.5);在假設(shè)檢驗(yàn)中用作拒絕或不拒絕檢驗(yàn)假設(shè)的界值。百分位數(shù)并非由全部觀察值綜合計(jì)算得來,因此,它不如均數(shù)和標(biāo)準(zhǔn)差精確;然而中間部分的百分位數(shù)因不受資料中個(gè)別極端數(shù)據(jù)的影響,具有較好的穩(wěn)定性。小結(jié)指標(biāo)意義適用場(chǎng)合均數(shù)個(gè)體的平均值對(duì)稱分布,特別是正態(tài)分布資料。幾何均數(shù)平均倍數(shù)取對(duì)數(shù)后對(duì)稱分布。中位數(shù)位次居中的觀察值①非對(duì)稱分布;②半定量資料;③末端無確切數(shù)值;④分布不明。第三節(jié)

變異程度的統(tǒng)計(jì)指標(biāo)兩人五天高血壓甲162145178142186Mean=162.6乙164160163159166Mean=162.4甲和乙均數(shù)差不多,是不是以為著他兩情況差不多?概述兩人五天高血壓甲162145178142186Mean=162.6乙164160163159166Mean=162.4波動(dòng)大變異指標(biāo)越大,觀察值之間差異愈大,說明變異程度越大;反之亦然。常用的有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。概述變異指標(biāo)又稱離散指標(biāo),用以描述一組計(jì)量資料各觀察值之間參差不齊的程度。變異指標(biāo)越大,觀察值之間差異愈大,說明變異程度越大;反之亦然。常用的有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。概述極差極差(range,R),等于一個(gè)變量所有觀察值中最大值與最小值之間的差值。R=Max-Min兩人五天高血壓甲162145178142186Mean=162.6乙164160163159166Mean=162.4R甲=186-142=44R乙=166-159=7極差缺點(diǎn):①?zèng)]有利用觀察值的全部信息,不能反映其它數(shù)據(jù)的離散度;②各樣本含量大小懸殊時(shí),不宜比較其極差;③極差的抽樣誤差也較大,所以不夠穩(wěn)定,抽到很大值?極差僅適用于對(duì)未知分布的小樣本資料作粗略的分析。四分位數(shù)間距四分位

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論