第10章 數(shù)值變量資料的統(tǒng)計(jì)描述課件_第1頁
第10章 數(shù)值變量資料的統(tǒng)計(jì)描述課件_第2頁
第10章 數(shù)值變量資料的統(tǒng)計(jì)描述課件_第3頁
第10章 數(shù)值變量資料的統(tǒng)計(jì)描述課件_第4頁
第10章 數(shù)值變量資料的統(tǒng)計(jì)描述課件_第5頁
已閱讀5頁,還剩110頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十章數(shù)值變量資料的統(tǒng)計(jì)描述公共衛(wèi)生學(xué)院大理學(xué)院2011級護(hù)理學(xué)本科教學(xué)2024/11/11第10章-數(shù)值變量資料的統(tǒng)計(jì)描述第一節(jié)數(shù)值變量資料的統(tǒng)計(jì)描述

數(shù)值變量資料進(jìn)行統(tǒng)計(jì)描述需要根據(jù)資料的分布類型選擇合適的統(tǒng)計(jì)指標(biāo),因此首先要通過頻數(shù)分布表或分布圖了解資料的分布特征。一、頻數(shù)分布表及其制作

2024/11/12第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例10.1某地區(qū)2002年55~58歲健康成人的空腹血糖(mmol/L)測定值如下,試編制頻數(shù)表和觀察頻數(shù)分布情況。5.175.564.864.874.745.245.514.464.964.824.905.305.225.584.484.804.64.025.165.364.344.244.644.274.254.444.464.624.874.344.905.254.774.855.074.164.664.704.203.954.094.644.335.214.614.985.244.604.254.785.003.604.114.614.084.784.264.444.384.44.794.764.924.604.785.034.354.184.684.654.574.274.994.214.894.714.724.414.384.064.794.964.834.454.514.274.504.315.055.595.085.163.744.365.364.645.094.574.464.564.395.244.614.214.964.344.454.864.504.904.454.494.424.684.565.384.344.464.164.984.294.834.273.683.853.864.564.564.555.165.155.162024/11/13第10章-數(shù)值變量資料的統(tǒng)計(jì)描述頻數(shù)表的編制步驟:(1)求極差(range):即最大值與最小值之差,又稱為全距。

R=5.59–3.60=1.99(mol/L)(2)確定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定分組組數(shù)。相鄰兩組段下限值之差稱組距,組距=極差/組數(shù),為方便計(jì),組距為極差的十分之一,再略加調(diào)整。

1.99/10=0.199≈0.2

(mol/L)(3)列出組段:第一組段的下限必須包含最小值,最后一個組段上限必須大于或等于最大值。3.6~3.8~……5.2~5.4~5.6(4)列表劃記:用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。2024/11/14第10章-數(shù)值變量資料的統(tǒng)計(jì)描述表10-1某地區(qū)2002年55~58歲健康成人的空腹血糖(mmol/L)測定值的頻數(shù)分布表血糖(mol/L)組段組中值(xi)頻數(shù)(f)累計(jì)頻數(shù)(Σf)頻率(%)累計(jì)頻率(%)3.60~3.70332.272.273.80~3.90362.274.554.00~4.108146.0610.614.20~4.30233717.4228.034.40~4.50246118.1846.214.60~4.70258618.9465.154.80~4.902010615.1580.305.00~5.10121189.0989.395.20~5.30101287.5896.97

5.40~5.605.5041323.03100.00合計(jì)132100.002024/11/15第10章-數(shù)值變量資料的統(tǒng)計(jì)描述血糖(mol/L)人數(shù)圖10-1某地區(qū)2002年55~58歲健康成人的空腹血糖(mmol/L)

測定值的頻數(shù)分布圖二、頻數(shù)分布圖2024/11/16第10章-數(shù)值變量資料的統(tǒng)計(jì)描述三、頻數(shù)表和頻數(shù)分布圖的應(yīng)用1.觀察有無可疑值2.便于進(jìn)一步計(jì)算指標(biāo)并進(jìn)行統(tǒng)計(jì)分析3.揭示分布的類型(對稱分布、偏態(tài)分布)4.揭示分布的特征2024/11/17第10章-數(shù)值變量資料的統(tǒng)計(jì)描述二.描述集中趨勢的指標(biāo)統(tǒng)計(jì)上使用平均數(shù)(average)這一指標(biāo)體系來描述一組變量值的集中趨勢或平均水平。常用的平均數(shù)有:算術(shù)均數(shù)(均數(shù))(mean)幾何均數(shù)(geometricmean)中位數(shù)(median)百分位數(shù)(percentile)

2024/11/18第10章-數(shù)值變量資料的統(tǒng)計(jì)描述一、算術(shù)均數(shù)算術(shù)均數(shù):簡稱均數(shù)(mean)定義:是一組變量值之和除以變量值個數(shù)所得的商。均數(shù)適用于資料呈正態(tài)分布(或近似正態(tài)或?qū)ΨQ分布)資料??傮w均數(shù):μ

樣本均數(shù):x2024/11/19第10章-數(shù)值變量資料的統(tǒng)計(jì)描述1、計(jì)算方法(1)直接計(jì)算法公式:例10.2

有9名健康成人的空腹膽固醇測定值(mol/L)為:5.61,3.96,3.67,4.99,4.24,5.06,5.20,4.79,5.93求算術(shù)平均數(shù)。x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9=4.83(mol/L)2024/11/110第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例10.1某地區(qū)2002年55~58歲健康成人的空腹血糖(mmol/L)測定值如下,試編制頻數(shù)表和觀察頻數(shù)分布情況。5.175.564.864.874.745.245.514.464.964.824.905.305.225.584.484.804.64.025.165.364.344.244.644.274.254.444.464.624.874.344.905.254.774.855.074.164.664.704.23.954.094.644.335.214.614.985.244.604.254.785.003.604.114.614.084.784.264.444.384.44.794.764.924.604.785.034.354.184.684.654.574.274.994.214.894.714.724.414.384.064.794.964.834.454.514.274.504.315.055.595.085.163.744.365.364.645.094.574.464.564.395.244.614.214.964.344.454.864.504.904.454.494.424.684.565.384.344.464.164.984.294.834.273.683.853.864.564.564.555.165.155.16x=(5.17+5.56+……+5.15+5.16)/132=4.648(mol/L)2024/11/111第10章-數(shù)值變量資料的統(tǒng)計(jì)描述(2)加權(quán)法(利用頻數(shù)表)公式:k:頻數(shù)表的組段數(shù)

f:頻數(shù)

:組中值,其中i=1,2,……k。2024/11/112第10章-數(shù)值變量資料的統(tǒng)計(jì)描述表10-1某地區(qū)2002年55~58歲健康成人的空腹血糖(mmol/L)測定值的頻數(shù)分布表血糖(mol/L)組段頻數(shù)()組中值()

3.60~33.7011.1041.073.80~33.9011.7045.634.00~84.1032.80134.484.20~234.3098.90425.274.40~244.50108.00486.004.60~254.70117.50552.254.80~204.9098.00480.205.00~125.1061.20312.125.20~105.3053.00280.90

5.40~5.6045.5022.00121.00合計(jì)132614.202878.92x=614.2/132=4.653(mol/L)2024/11/113第10章-數(shù)值變量資料的統(tǒng)計(jì)描述二、幾何均數(shù)(geometricmean)定義:用G表示,是將n個觀察值x的乘積再開n次方的方根(或各觀察值x對數(shù)值均值的反對數(shù))。其適用條件是:①當(dāng)一組觀察值為非對稱分布且其差距較大時,用均數(shù)表示其平均水平會受少數(shù)特大或特小值影響;②數(shù)值按大小順序排列后,各觀察值呈倍數(shù)關(guān)系或近似倍數(shù)關(guān)系。

2024/11/114第10章-數(shù)值變量資料的統(tǒng)計(jì)描述幾何均數(shù)計(jì)算公式:幾何均數(shù):變量對數(shù)值的算術(shù)均數(shù)的反對數(shù)。

計(jì)算幾何均數(shù)的觀察值應(yīng)大于零

2024/11/115第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例10.3

有7份血清的抗體效價(jià)分別為1:2,1:4,1:8,1:16,1:32,1:64,1:128,求平均抗體效價(jià)。2024/11/116第10章-數(shù)值變量資料的統(tǒng)計(jì)描述(2)加權(quán)法(當(dāng)觀察例數(shù)多時采用)

公式:2024/11/117第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例10.4有60人的血清抗體效價(jià),分別為:7人1:5,11人1:10,22人1:20,12人1:40,8人1:80,求平均抗體效價(jià)。50人的血清平均抗體效價(jià)為1:20.705。2024/11/118第10章-數(shù)值變量資料的統(tǒng)計(jì)描述計(jì)算幾何均數(shù)應(yīng)該注意的事項(xiàng)變量值中不能有0或負(fù)數(shù),因?yàn)?和負(fù)數(shù)不能取對數(shù)。不能同時有正有負(fù)。若全部是負(fù)值,計(jì)算時可先把負(fù)號去掉,得出結(jié)果后,再加上負(fù)號。2024/11/119第10章-數(shù)值變量資料的統(tǒng)計(jì)描述三、

中位數(shù)與百分位數(shù)(一)中位數(shù)(median)

定義:用符號M表示,中位數(shù)是把一組觀察值,按大小順序排列,位置居中的數(shù)值(n為奇數(shù))或位置居中的兩個數(shù)值的均值(n為偶數(shù))。其適用情況有:①當(dāng)資料呈明顯的偏態(tài)分布;②資料一端或兩端無確定數(shù)值(如大于或小于某數(shù)值);③資料的分布情況不清楚。

2024/11/120第10章-數(shù)值變量資料的統(tǒng)計(jì)描述計(jì)算公式:n為奇數(shù)時n為偶數(shù)時2024/11/121第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例10.57名正常人的血壓(舒張壓)

測定值(mmHg)為:72,75,76,77,81,82,86,求中位數(shù)。從小到大排列:72,75,76,77,81,82,86若又觀察了一個人的血壓,為87(mmHg),此時M=(77+81)/2=79(mmHg)2024/11/122第10章-數(shù)值變量資料的統(tǒng)計(jì)描述頻數(shù)表資料的中位數(shù)(P157公式8.5)下限值L上限值Ui;fm中位數(shù)M2024/11/123第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例10.1頻數(shù)表中位數(shù)的計(jì)算血糖(mol/L)組段組中值()頻數(shù)(f)累計(jì)頻數(shù)(Σf)頻率(%)累計(jì)頻率(%)3.60~3.70332.272.273.80~3.90362.274.554.00~4.108146.0610.614.20~4.30233717.4228.034.40~4.50246118.1846.214.60~4.70258618.9465.154.80~4.902010615.1580.305.00~5.10121189.0989.395.20~5.30101287.5896.97

5.40~5.605.5041323.03100.00合計(jì)132(Σfi)100.004.60+(0.20/25)*[132/2-61]=4.642024/11/124第10章-數(shù)值變量資料的統(tǒng)計(jì)描述

百分位數(shù)示意圖(二)百分位數(shù)(percentile)把一組數(shù)據(jù)從小到大排列,分成100等份,各等份含1%的觀察值,分割界限上的數(shù)值就是百分位數(shù)。中位數(shù)是第50百分位數(shù),用P50表示。2024/11/125第10章-數(shù)值變量資料的統(tǒng)計(jì)描述Trunc()取整函數(shù)

設(shè)有X個原始數(shù)據(jù)從小到大排列,第X百分位數(shù)的計(jì)算公式為:1.直接計(jì)算法當(dāng)為帶有小數(shù)位時:當(dāng)為整數(shù)時:2024/11/126第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例對某醫(yī)院細(xì)菌性痢疾治愈者的住院天數(shù)統(tǒng)計(jì),120名患者的住院天數(shù)從小到大排列如下,試求第5百分位數(shù)和第99百分位數(shù)。,為整數(shù):患者編號:住院天數(shù):(1)n=120,2024/11/127第10章-數(shù)值變量資料的統(tǒng)計(jì)描述帶有小數(shù)

(2)故取整trunc(118.8)=1182024/11/128第10章-數(shù)值變量資料的統(tǒng)計(jì)描述2.頻數(shù)表法

公式:

2024/11/129第10章-數(shù)值變量資料的統(tǒng)計(jì)描述當(dāng)時,公式(8.5)即為中位數(shù)的計(jì)算公式:2024/11/130第10章-數(shù)值變量資料的統(tǒng)計(jì)描述

例10.1試分別求例10.1頻數(shù)表的第25、第75百分位數(shù)。P25=4.20+0.20x[(132x25%-14)/23]=4.365P75=4.80+0.20x[(132x75%-86)/20]=4.930血糖(mol/L)組段組中值(xi)頻數(shù)(f)累計(jì)頻數(shù)(Σf)頻率(%)累計(jì)頻率(%)3.60~3.70332.272.273.80~3.90362.274.554.00~4.108146.0610.614.20~4.30233717.4228.034.40~4.50246118.1846.214.60~4.70258618.9465.154.80~4.902010615.1580.305.00~5.10121189.0989.395.20~5.30101287.5896.97

5.40~5.605.5041323.03100.00合計(jì)132(Σfi)100.002024/11/131第10章-數(shù)值變量資料的統(tǒng)計(jì)描述三種平均數(shù)的特點(diǎn)算術(shù)均數(shù):通常被認(rèn)為是最佳集中趨勢的度量值。如果資料觀察值含有少數(shù)極端數(shù)值(相對的說特大或特小值)或資料呈偏態(tài)分布,算術(shù)均數(shù)就變得不穩(wěn)定而失去代表性。

正態(tài)分布幾何均數(shù)一般只適宜于等比級數(shù)資料。對于這類資料,用幾何均數(shù)反映集中趨勢比算術(shù)均數(shù)或中位數(shù)更合適。中位數(shù)不受其前后其他數(shù)值(特別是極端值)的影響。但如果數(shù)據(jù)呈明顯不同且差異很大,這時中位數(shù)可能不適宜作為集中趨勢的度量值了。

偏態(tài)分布2024/11/132第10章-數(shù)值變量資料的統(tǒng)計(jì)描述反映集中趨勢的指標(biāo)(平均數(shù)),表示一組觀察值的平均水及集中特性,并可作為總體的一個代表值加以應(yīng)用。但是它沒有表達(dá)其所代表的總體中各個個體之間的差異。統(tǒng)計(jì)學(xué)中把個體間的差異稱為變異性(variation)。所謂變異性是指在同質(zhì)條件下的觀察單位,其同一標(biāo)志的數(shù)據(jù)間的差異性。用以描述一組數(shù)值變量資料觀察值之間參差不齊的程度,即離散程度或變異度的指標(biāo),稱為離散指標(biāo)或變異指標(biāo)。三描述離散趨勢的描述2024/11/133第10章-數(shù)值變量資料的統(tǒng)計(jì)描述盤編號甲乙丙15605205102540510505350050050044604904955440480490合計(jì)250025002500均數(shù)500500500例10.6:設(shè)甲、乙、丙三人,采每人的耳垂血,然后作紅細(xì)胞計(jì)數(shù),每人數(shù)5個計(jì)數(shù)盤,得結(jié)果如下(萬/mm3)甲乙丙2024/11/134第10章-數(shù)值變量資料的統(tǒng)計(jì)描述常用統(tǒng)計(jì)指標(biāo):全距(range)四分位數(shù)間距(quartileinterval)方差和標(biāo)準(zhǔn)差(variance&standarddeviation)變異系數(shù)(CVcoefficientofvariation)2024/11/135第10章-數(shù)值變量資料的統(tǒng)計(jì)描述全距,用R表示:即一組變量值最大值與最小值之差,亦稱極差。對于書中例8.1數(shù)據(jù),有簡單,但僅利用了兩端點(diǎn)值,穩(wěn)定性差。一、全距(Range)R=5.59–3.60=1.99(mol/L)R越大,變異度越大;R越小,變異度越小。2024/11/136第10章-數(shù)值變量資料的統(tǒng)計(jì)描述二、四分位數(shù)間距(quartilerange)

四分位數(shù)間距,用Q表示,若將一組資料分為四等份,上四分位數(shù)和下四分位數(shù)之差就是Q:

Q=下四分位數(shù):上四分位數(shù):比全距穩(wěn)定;可用于一端或兩端無確切數(shù)值的偏態(tài)資料。未考慮每一個觀察值。2024/11/137第10章-數(shù)值變量資料的統(tǒng)計(jì)描述全距和四分位數(shù)間距都未全面考慮觀察值的變異情況,為了克服該缺點(diǎn),需計(jì)算總體中每個觀察值x與總體均數(shù)

的差值(x-

),稱為離均差。由于∑(x-

)=0,不能反映變異的大小,而用離均差平方和∑(x-

)2(sumofdeviationfrommean)反映。同時還要考慮到觀察值個數(shù)N的影響,用其均數(shù),即得到總體的方差,用

2表示。公式為:三、方差與標(biāo)準(zhǔn)差2024/11/138第10章-數(shù)值變量資料的統(tǒng)計(jì)描述

1.

方差(variance)是離均差平方和的均數(shù),反映一組數(shù)據(jù)的平均離散水平。由于在實(shí)際工作中,往往得到的樣本資料,總體均數(shù)

是未知的,所以只能用樣本均數(shù)作為

的估計(jì)值,即用

代替

,用樣本例數(shù)n代替N。但按公式計(jì)算的結(jié)果通常比實(shí)際的

低。所以用n-1來代替n進(jìn)行校正。得到樣本方差

離均差平方和SS總體方差樣本方差自由度2024/11/139第10章-數(shù)值變量資料的統(tǒng)計(jì)描述2.標(biāo)準(zhǔn)差(standarddeviation)方差可以比較全面地反映變量值的變異情況,但其方差的單位是原單位的平方,故引入標(biāo)準(zhǔn)差的概念。標(biāo)準(zhǔn)差:將方差開平方,恢復(fù)成原度量單位,得到總體的標(biāo)準(zhǔn)差

和樣本標(biāo)準(zhǔn)差S。2024/11/140第10章-數(shù)值變量資料的統(tǒng)計(jì)描述樣本標(biāo)準(zhǔn)差用表示,其度量單位與均數(shù)一致,所以最常用。離均差平方和SS3.總體標(biāo)準(zhǔn)差用σ表示公式:公式:2024/11/141第10章-數(shù)值變量資料的統(tǒng)計(jì)描述

標(biāo)準(zhǔn)差的公式還可以寫成:利用頻數(shù)表計(jì)算標(biāo)準(zhǔn)差的公式為:2024/11/142第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例

對以下數(shù)據(jù):75,76,72,69,66,72,57,68,71,72,用直接法計(jì)算標(biāo)準(zhǔn)差。2024/11/143第10章-數(shù)值變量資料的統(tǒng)計(jì)描述血糖(mol/L)組段頻數(shù)()組中值()

3.60~33.7011.1041.073.80~33.9011.7045.634.00~84.1032.80134.484.20~234.3098.90425.274.40~244.50108.00486.004.60~254.70117.50552.254.80~204.9098.00480.205.00~125.1061.20312.125.20~105.3053.00280.90

5.40~5.6045.5022.00121.00合計(jì)132614.202878.92例10-利用表10-2中的數(shù)據(jù)和頻數(shù)表法計(jì)算標(biāo)準(zhǔn)差。2024/11/144第10章-數(shù)值變量資料的統(tǒng)計(jì)描述四、變異系數(shù)變異系數(shù)(coefficientofvariation,CV)常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。2024/11/145第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例10.7:某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71cm;體重均數(shù)為22.29kg,標(biāo)準(zhǔn)差為2.26kg,比較其變異度?

2024/11/146第10章-數(shù)值變量資料的統(tǒng)計(jì)描述小結(jié):正態(tài)分布偏態(tài)分布集中趨勢算術(shù)平均數(shù)(幾何平均數(shù))中位數(shù)離散趨勢標(biāo)準(zhǔn)差、變異系數(shù)四分位間距2024/11/147第10章-數(shù)值變量資料的統(tǒng)計(jì)描述第二節(jié)正態(tài)分布和參考值范圍2024/11/148第10章-數(shù)值變量資料的統(tǒng)計(jì)描述一、正態(tài)分布的概念和特征當(dāng)X服從正態(tài)分布記作X~N(μ,σ2)其中μ為總體均數(shù),σ2為總體方差2024/11/149第10章-數(shù)值變量資料的統(tǒng)計(jì)描述二、標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示,即u值的均數(shù)為0,標(biāo)準(zhǔn)差為1。

標(biāo)準(zhǔn)正態(tài)變換

2024/11/150第10章-數(shù)值變量資料的統(tǒng)計(jì)描述正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布2024/11/151第10章-數(shù)值變量資料的統(tǒng)計(jì)描述正態(tài)分布的特征⑤正態(tài)分布的面積分布有一定的規(guī)律性,總面積=1。①正態(tài)分布是一單峰分布,高峰位置在均數(shù)X=

處;總體中位數(shù)亦為。②正態(tài)分布以均數(shù)為中心,左右完全對稱;③正態(tài)分布取決于兩個參數(shù),即均數(shù)與標(biāo)準(zhǔn)差(

),標(biāo)準(zhǔn)正態(tài)分布的均數(shù)和標(biāo)準(zhǔn)差分別為0和1;

為位置參數(shù),

為形態(tài)參數(shù);④有些指標(biāo)不服從正態(tài)分布,但通過適當(dāng)?shù)淖儞Q后服從正態(tài)分布;2024/11/152第10章-數(shù)值變量資料的統(tǒng)計(jì)描述2024/11/153第10章-數(shù)值變量資料的統(tǒng)計(jì)描述正態(tài)曲線下面積的分布規(guī)律(累積)分布函數(shù):2024/11/154第10章-數(shù)值變量資料的統(tǒng)計(jì)描述圖

正態(tài)曲線面積分布示意圖

2024/11/155第10章-數(shù)值變量資料的統(tǒng)計(jì)描述正態(tài)分布的應(yīng)用估計(jì)頻數(shù)分布制定參考值范圍質(zhì)量控制統(tǒng)計(jì)分析方法的基礎(chǔ)第10章-數(shù)值變量資料的統(tǒng)計(jì)描述估計(jì)頻數(shù)分布Z=(2500-3200)/350=-2查附表一得:φ(-2)=0.0288第10章-數(shù)值變量資料的統(tǒng)計(jì)描述醫(yī)學(xué)參考值是指正常人的各種生理、生化數(shù)據(jù),組織或排泄物中各種成分的含量。正常人測定值的波動范圍,稱為參考值范圍。參考值范圍在診斷方面可用于劃分正常或異常。參考值范圍(referenceranges)2024/11/158第10章-數(shù)值變量資料的統(tǒng)計(jì)描述1、正態(tài)分布法2、百分位數(shù)法計(jì)算醫(yī)學(xué)參考值范圍的常用方法:2024/11/159第10章-數(shù)值變量資料的統(tǒng)計(jì)描述公式(正態(tài)分布):雙側(cè)參考值范圍:X±uS單側(cè)參考值范圍:>X-uS(下限值)或<X+uS(上限值)其中X為均數(shù),S為標(biāo)準(zhǔn)差,u值可由附表1(249)查。2024/11/160第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例:10利用例1某地55~58歲健康成人的血糖值,求95%的參考值范圍。正態(tài)分布法x=4.653,S=0.401雙側(cè)95%的參考值范圍:

x±1.96S=4.653±1.96*0.401=(3.87~5.44)某地55~58歲健康成人的血糖值95%的參考值范圍為3.87~5.44(mol/L)2024/11/161第10章-數(shù)值變量資料的統(tǒng)計(jì)描述一、抽樣誤差和標(biāo)準(zhǔn)誤

第三節(jié)均數(shù)的抽樣誤差與總體均數(shù)的估計(jì)第10章-數(shù)值變量資料的統(tǒng)計(jì)描述

例如,從總體均數(shù)μ為4.83×/L、標(biāo)準(zhǔn)差

0.52×/L的正態(tài)分布總體N(4.83,0.522)中,隨機(jī)抽取10人為一個樣本(n=10),并計(jì)算該樣本的均數(shù)、標(biāo)準(zhǔn)差。如此重復(fù)抽取100次(g=100),可得到100份樣本,可得到100對均數(shù)和標(biāo)準(zhǔn)差S。正態(tài)總體μ=4.83σ=0.521.4.58,0.382.4.90,0.453.4.76,0.49┆99.4.87,0.59100.4.79,0.39S第10章-數(shù)值變量資料的統(tǒng)計(jì)描述

抽樣誤差

samplingerror:由于抽樣而引起的差異。產(chǎn)生的基本條件為:抽樣及個體變異。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述圖

隨機(jī)抽樣所得100個樣本均數(shù)的分布第10章-數(shù)值變量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)誤(standarderror,SE)概念:樣本均數(shù)的標(biāo)準(zhǔn)差,可用于衡量抽樣誤差的大小。σ未知σ已知第10章-數(shù)值變量資料的統(tǒng)計(jì)描述計(jì)算了100個樣本的標(biāo)準(zhǔn)差S,由此可計(jì)算樣本的標(biāo)準(zhǔn)誤大小。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述100個樣本均數(shù)的抽樣分布特點(diǎn):②100個樣本均數(shù)中,各樣本均數(shù)間存在差異,但各樣本均數(shù)在總體均數(shù)周圍波動。③樣本均數(shù)的分布曲線為中間高,兩邊低,左右對稱,近似服從正態(tài)分布。①第10章-數(shù)值變量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)誤的特點(diǎn):

當(dāng)樣本例數(shù)n一定時,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差呈正比;當(dāng)標(biāo)準(zhǔn)差一定時,標(biāo)準(zhǔn)誤與樣本含量n的平方根呈反比。通過增加樣本含量n來降低抽樣誤差。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述n=5n=103個抽樣實(shí)驗(yàn)結(jié)果圖示第10章-數(shù)值變量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)誤的用途衡量抽樣誤差的大??;估計(jì)總體均數(shù)的置信區(qū)間;用于假設(shè)檢驗(yàn)。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差的區(qū)別與聯(lián)系區(qū)別:

標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)差定義反映抽樣誤差反映個體變異用途總體均數(shù)可信區(qū)間醫(yī)學(xué)參考值范圍進(jìn)行統(tǒng)計(jì)學(xué)檢驗(yàn)計(jì)算標(biāo)準(zhǔn)誤、CV聯(lián)系:當(dāng)n一定時標(biāo)準(zhǔn)差大,標(biāo)準(zhǔn)誤也大第10章-數(shù)值變量資料的統(tǒng)計(jì)描述抽樣實(shí)驗(yàn)小結(jié)

樣本的均數(shù)圍繞總體均數(shù)上下波動。均數(shù)的標(biāo)準(zhǔn)差即標(biāo)準(zhǔn)誤樣本均數(shù)的標(biāo)準(zhǔn)誤(StandardError)

計(jì)算公式為:樣本標(biāo)準(zhǔn)差/

從正態(tài)總體N(μ,σ2)中抽取樣本,獲得均數(shù)的分布仍近似呈正態(tài)分布N(μ,σ2/n)。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述二、

t分布(t-distribution)隨機(jī)變量XN(m,s2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)u變換第10章-數(shù)值變量資料的統(tǒng)計(jì)描述均數(shù)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-1第10章-數(shù)值變量資料的統(tǒng)計(jì)描述圖

不同自由度下的t分布圖第10章-數(shù)值變量資料的統(tǒng)計(jì)描述t分布的特征

①以0為中心,左右對稱的單峰分布;②t分布曲線是一簇曲線,其形態(tài)變化與自由度的大小有關(guān)。自由度越小,則t值越分散,曲線越低平;自由度逐漸增大時,t分布逐漸逼近u分布(標(biāo)準(zhǔn)正態(tài)分布);當(dāng)趨于∞時,t分布即為u分布。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述附表2t界值表

第10章-數(shù)值變量資料的統(tǒng)計(jì)描述參數(shù)的估計(jì)點(diǎn)估計(jì):由樣本統(tǒng)計(jì)量直接估計(jì)總體參數(shù)區(qū)間估計(jì):在一定置信度(Confidencelevel)下,估計(jì)總體參數(shù)可能存在的范圍二、參數(shù)估計(jì)第10章-數(shù)值變量資料的統(tǒng)計(jì)描述估計(jì)正確的概率(1

)稱為可信度或置信度(confidencelevel),常取95%或99%。置信區(qū)間(confidenceinterval,CI)是根據(jù)一定的置信度估計(jì)得到的區(qū)間??傮w均數(shù)的95%置信區(qū)間的涵義是指:從理論上來說,做100次抽樣,可算得100個置信區(qū)間,平均有95個置信區(qū)間包括總體均數(shù),只有5個置信區(qū)間不包括總體均數(shù)。(一)置信區(qū)間的有關(guān)概念第10章-數(shù)值變量資料的統(tǒng)計(jì)描述(二)總體均數(shù)置信區(qū)間的計(jì)算s未知,且n較小,按t分布s已知,或s未知但n足夠大,按u分布第10章-數(shù)值變量資料的統(tǒng)計(jì)描述第10章-數(shù)值變量資料的統(tǒng)計(jì)描述第10章-數(shù)值變量資料的統(tǒng)計(jì)描述u0.05/2=1.962.σ未知但n較大時,按u分布計(jì)算總體均數(shù)的可信區(qū)間。雙側(cè)1-α可信區(qū)間為:3.σ已知時,總體均數(shù)雙側(cè)1-α可信區(qū)間為:u0.05/2=1.96=第10章-數(shù)值變量資料的統(tǒng)計(jì)描述(一)假設(shè)檢驗(yàn)的基本思想—利用反證法的思想假設(shè)檢驗(yàn)的基本思想和步驟

利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì)量,最后獲得P值來判斷。當(dāng)P小于或等于預(yù)先規(guī)定的概率值α,就是小概率事件。根據(jù)小概率事件的原理:小概率事件在一次抽樣中發(fā)生的可能性很小,如果他發(fā)生了,則有理由懷疑原假設(shè)H0,認(rèn)為其對立面H1成立,該結(jié)論可能犯大小為α的錯誤。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例

某地抽樣調(diào)查了26名男性管理人員的空腹血糖,均數(shù)為4.84mol/L,標(biāo)準(zhǔn)差為0.85mol/L。已知大量調(diào)查的一般健康成年男性空腹靜脈血糖的均數(shù)為4.70mol/L。試問能否認(rèn)為該地健康男性管理人員的空腹血糖的均值與一般正常健康成年男性的的均值不同?第10章-數(shù)值變量資料的統(tǒng)計(jì)描述差異的原因:

(1)由于抽樣誤差造成的.(實(shí)際上,但由于抽樣誤差不能很好代表)(2)該地男性管理人員的空腹血糖與一般健康成年男性空腹靜脈血糖()

第10章-數(shù)值變量資料的統(tǒng)計(jì)描述

假設(shè)檢驗(yàn)的目的就是判斷差異的原因:

求出由抽樣誤差造成此差異的可能性(概率P)有多大!若P

較大(P>0.05),認(rèn)為是由于抽樣誤差造成的。原因(1),實(shí)際上若P

較小(P≤0.05),認(rèn)為不是由于抽樣誤差造成的。原因(2),實(shí)際上>第10章-數(shù)值變量資料的統(tǒng)計(jì)描述(二)假設(shè)檢驗(yàn)的基本步驟1.建立假設(shè),確定檢驗(yàn)水準(zhǔn)2.選定檢驗(yàn)統(tǒng)計(jì)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.確定P值,作出推斷結(jié)論第10章-數(shù)值變量資料的統(tǒng)計(jì)描述1、建立假設(shè),確定檢驗(yàn)水準(zhǔn)H0:(無效假設(shè))μ=μ0H1:(備擇假設(shè))μ>μ0

μ≠μ0)檢驗(yàn)水準(zhǔn)的意義及確定單、雙側(cè)檢驗(yàn)的選擇:(1)根據(jù)專業(yè)知識事先不知道會出現(xiàn)什么結(jié)果雙側(cè)事先知道只能出現(xiàn)某種結(jié)果單側(cè)(2)問題的提法*通常用雙側(cè)(除非有充足的理由選用單側(cè)之外,一般選用保守的雙側(cè)較穩(wěn)妥)第10章-數(shù)值變量資料的統(tǒng)計(jì)描述2、選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量3、確定P值,作出推斷結(jié)論P(yáng)值:在H0成立的情況下,獲得比現(xiàn)有統(tǒng)計(jì)量更極端的概率。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述

(推斷的結(jié)論=統(tǒng)計(jì)結(jié)論+專業(yè)結(jié)論)

P>0.05,按檢驗(yàn)水準(zhǔn),不拒絕H0,差異無統(tǒng)計(jì)學(xué)意義(差異無顯著性),還不能認(rèn)為……不同或不等。

P≤0.05

,按檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,差異有統(tǒng)計(jì)學(xué)意義(差異有顯著性)

,可以認(rèn)為……不同或不等。

P≤0.01,按檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,差異有高度統(tǒng)計(jì)學(xué)意義(差異有高度顯著性)

,可以認(rèn)為……不同或不等。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述

確定P值:(用求出的t值與查表查出的t

值比較)查t

值表:

(t

越大,P

越小)(1)求出t=1.833,P>0.05(2)求出t=4.18,

P<0.01(3)求出t=2.96,0.01<P<0.05(簡寫為P<0.05)(4)求出t=3.25,P=0.01Pt0.050.013.2502.2621.833P>0.054.18P<0.01P<0.052.96第10章-數(shù)值變量資料的統(tǒng)計(jì)描述第三節(jié)t檢驗(yàn)和u檢驗(yàn)t檢驗(yàn)應(yīng)用條件:

①當(dāng)n<100時,要求樣本取自正態(tài)分布的總體,總體標(biāo)準(zhǔn)差未知;②兩小樣本均數(shù)比較時,要求兩樣本總體方差相等(σ12=σ22)。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述一、樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn)(即:樣本均數(shù)代表的未知總體均數(shù)μ和已知總體均數(shù)μ0的比較)第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例已知一般無肝腎疾患的健康人群尿素氮均值為4.882(mol/L)。16名脂肪肝患者的尿素氮(mol/L)的測定值為5.74,5.75,4.26,6.24,5.36,8.68,6.47,5.24,4.13,11.8,5.57,5.61,4.37,4.59,5.18,6.96。問脂肪肝患者尿素氮測定值的均數(shù)是否高于健康人?第10章-數(shù)值變量資料的統(tǒng)計(jì)描述(1)建立假設(shè)、確定檢驗(yàn)水準(zhǔn)H0:μ=μ0即脂肪肝患者尿素氮測定值的均值與健康人相等H1:μ>μ0

即脂肪肝患者尿素氮測定值的均值高于一般健康人第10章-數(shù)值變量資料的統(tǒng)計(jì)描述(2)選定檢驗(yàn)方法,計(jì)算檢驗(yàn)統(tǒng)計(jì)量n=16<100,故選用t檢驗(yàn)。已知第10章-數(shù)值變量資料的統(tǒng)計(jì)描述(3)確定P值,作出推斷結(jié)論

查t界值表

為單側(cè)檢驗(yàn)Pt0.050.012.6021.725P<0.0252.32P<0.05,按檢驗(yàn)水準(zhǔn),拒絕H0

,接受H1,認(rèn)為脂肪肝患者尿素氮測定值的均數(shù)高于健康人。0.0252.131第10章-數(shù)值變量資料的統(tǒng)計(jì)描述二、配對設(shè)計(jì)的均數(shù)比較常見的配對設(shè)計(jì)主要有以下情形:①自身比較:同一受試對象處理前后或不同部位測定值的比較。(目的是判斷此處理有無作用)②同一受試對象(或樣品)分別接受兩種不同的處理。(目的是比較不同方法之間的差異)③成對設(shè)計(jì):將條件近似的觀察對象兩兩配成對子,對子中的兩個個體分別給予不同的處理。(目的是比較不同方法之間的差異)第10章-數(shù)值變量資料的統(tǒng)計(jì)描述配對t檢驗(yàn)的基本原理:

假設(shè)兩種處理的效應(yīng)相同,即μ1=μ2

,則μ1-μ2=0,即可看成是差值的樣本均數(shù)所代表的未知總體均數(shù)μd與已知總體均數(shù)μ0=0的比較,此時,我們可套用前述t檢驗(yàn)的公式。第10章-數(shù)值變量資料的統(tǒng)計(jì)描述例

應(yīng)用某藥治療8例高膽固醇患者,觀察治療前后血漿膽固醇變化情況,如表9-1,問該藥是否對患者治療前后血漿膽固醇變化有影響?表9-1用某藥治療前后血漿膽固醇變化情況病人編號血漿膽固醇(mmol/L)差值dd2治療前治療后⑴⑵⑶⑷=⑵-⑶110.106.693.4111.6326.785.401.833.35313.22

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論