第二章 數(shù)值變量的描述_第1頁
第二章 數(shù)值變量的描述_第2頁
第二章 數(shù)值變量的描述_第3頁
第二章 數(shù)值變量的描述_第4頁
第二章 數(shù)值變量的描述_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章計量資料的統(tǒng)計描述第一節(jié)頻數(shù)分布第二節(jié)集中趨勢的描述第三節(jié) 離散趨勢的描述第四節(jié)正態(tài)分布第五節(jié)醫(yī)學參考值范圍的制定第一節(jié)頻數(shù)分布

一、頻數(shù)分布表(frequencytable)

例2-1某醫(yī)院用隨機抽樣方法檢查了138名成年女子的紅細胞數(shù),其測量結(jié)果如下,試編制頻數(shù)分布表。(1)求極差(range):即最大值與最小值之差,又稱為全距。R=5.46–3.07=2.39(2)決定分組組數(shù)、組距:根據(jù)研究目的和樣本含量n確定分組組數(shù),通常分為10~15個組。組距=極差/組數(shù),為方便計,組距為極差的十分之一,再略加調(diào)整。i=2.39/12=0.199≈0.2(3)列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值。(4)劃記計數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。頻數(shù)表的編制步驟表2-1138名成年女子的紅細胞數(shù)的頻數(shù)分布表N=∑f二、頻數(shù)分布圖138名成年女子的紅細胞數(shù)的頻數(shù)分布圖三、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類型(對稱分布、偏態(tài)分布)

(1)對稱分布:若各組段的頻數(shù)以中心位置左右兩側(cè)大體對稱,就認為該資料是對稱分布是否為對稱分布?是否為對稱分布?(2)偏態(tài)分布:

1)右偏態(tài)分布(正偏態(tài)分布):右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。

表2-3115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布

2)左偏態(tài)分布(負偏態(tài)分布):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。

表2-4101名正常人的血清肌紅蛋白含量分布2.描述頻數(shù)分布的特征表2-1數(shù)據(jù)的頻數(shù)分布特征:①數(shù)據(jù)變異(離散)的范圍在57~84(次/分)②數(shù)據(jù)集中(平均)的組段在68~73(次/分)之間,尤以組段的人數(shù)71~(次/分)最多。且上下組段的頻數(shù)分布基本對稱。3.便于發(fā)現(xiàn)一些特大或特小的可疑值4.便于進一步做統(tǒng)計分析和處理第二節(jié)集中趨勢的描述

統(tǒng)計上使用平均數(shù)(average)這一指標體系來描述一組變量值的集中位置或平均水平。常用的平均數(shù)有:算術(shù)均數(shù)(均數(shù))(mean)幾何均數(shù)(geometricmean)中位數(shù)(median)與百分位數(shù)(percentile)眾數(shù)(mode)

一、算術(shù)均數(shù)算術(shù)均數(shù):簡稱均數(shù)(mean)

可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征值。1、計算方法(1)直接計算法

公式:舉例:試計算4,4,4,6,6,8,8,8,10的均數(shù)?例2-1某醫(yī)院用隨機抽樣方法檢查了138名成年女子的紅細胞數(shù),其測量結(jié)果如下,試編制頻數(shù)分布表。(2)加權(quán)法(利用頻數(shù)表):公式:k:頻數(shù)表的組段數(shù),f:頻數(shù),X:組中值。表2-1138名成年女子的紅細胞數(shù)的頻數(shù)分布表2、應(yīng)用均數(shù)適用于對稱分布,特別是正態(tài)分布資料。二、幾何均數(shù)(geometricmean)

可用于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布或正態(tài)分布的變量值在數(shù)量上的平均水平。幾何均數(shù)(geometricmean)幾何均數(shù):變量對數(shù)值的算術(shù)均數(shù)的反對數(shù)。

其他對數(shù)(如自然對數(shù))變換獲得相同的幾何均數(shù)例2-4某地5例微絲蚴血癥患者治療7年后用間接熒光抗體試驗測得其抗體滴度倒數(shù)分別為10,20,40,40,160,求幾何均數(shù)。(2)加權(quán)法公式:例2-52、應(yīng)用:適用于成等比數(shù)列的資料,特別是服從對數(shù)正態(tài)分布資料。三、

中位數(shù)與百分位數(shù)11個大鼠存活天數(shù):4,10,7,50,3,15,2,9,13,>60,>60平均存活天數(shù)?(一)中位數(shù)(median)是將每個變量值從小到大排列,位置居于中間的那個變量值。

計算公式:

n為奇數(shù)時

n為偶數(shù)時

例2-67名病人患某病的潛伏期分別為2,3,4,5,6,9,16天,求其中位數(shù)。例2-78名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時,求其中位數(shù)。頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)M例2-10表2-6118名鏈球菌咽喉炎患者的潛伏期應(yīng)用1、各種分布類型的資料2、特別適合大樣本偏態(tài)分布資料或者一端或兩端無確切數(shù)值的資料。

百分位數(shù)示意圖(二)百分位數(shù)(percentile)頻數(shù)表法

公式:

當時,公式(2-9)即為中位數(shù)的計算公式例2-10表2-6118名鏈球菌咽喉炎患者的潛伏期眾數(shù)(mode)眾數(shù)是一組觀察值中出現(xiàn)頻率最高的那個觀察值;若為分組資料,眾數(shù)則是出現(xiàn)頻率最高的那個組段的組中值。適用于大樣本;較粗糙。例有16例高血壓病人的發(fā)病年齡(歲)為:42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62,試求眾數(shù)。正態(tài)分布時:均數(shù)=中位數(shù)=眾數(shù)

正偏態(tài)分布時:均數(shù)>中位數(shù)>眾數(shù)

負偏態(tài)分布時:均數(shù)<中位數(shù)<眾數(shù)設(shè)有甲、乙、丙三名醫(yī)生,分別對相同的5份血樣進行紅細胞計數(shù)(萬/mm3),甲得出了560、540、500、460、440,乙得出了520、510、500、490、480,丙得出了510、505、500、495、490,見下圖2,三名醫(yī)生的計數(shù)結(jié)果得到的均數(shù)均為500,5個數(shù)值之和均為2500。第三節(jié)離散趨勢的描述甲醫(yī)生得出的5個觀察值間的差異(離散程度)較大,而丙醫(yī)生得出的5個觀察值間的差異(離散程度)較小。常用統(tǒng)計指標:極差、四分位數(shù)間距、方差、標準差和變異系數(shù)。一、極差(Range)極差,用R表示:即一組變量值最大值與最小值之差。對于書中例2-1數(shù)據(jù),有簡單,但僅利用了兩端點值,穩(wěn)定性差。R=5.46–3.07=2.39二、四分位數(shù)間距

(quartilerange)

四分位數(shù)間距,用Q表示:下四分位數(shù):上四分位數(shù):118名鏈球菌咽喉炎患者的潛伏期的四分位數(shù)間距三、方差與標準差1.方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水平。

總體方差

樣本方差

離均差平方和SS

2、總體標準差用σ表示公式:樣本標準差用表示,其度量單位與均數(shù)一致,所以最常用。公式:離均差平方和SS

標準差的公式還可以寫成:利用頻數(shù)表計算標準差的公式為甲醫(yī)生,的5份血樣進行紅細胞計數(shù)560、540、500、460、440,其標準差為50.99(萬/mm3)同理,乙醫(yī)生5份血樣進行紅細胞計數(shù)其標準差為31.14(萬/mm3),丙醫(yī)生5份血樣進行紅細胞計數(shù)其標準差為7.91(萬/mm3),例2-14計算表2-1中138名成年女子的紅細胞數(shù)的標準差。(1)直接計算法:表2-1138名成年女子的紅細胞數(shù)的頻數(shù)分布表(2)頻數(shù)表法:標準差的意義和用途說明資料的離散趨勢(或變異程度),標準差的值越大,說明變異程度越大,均數(shù)的代表性越差;...。標準差與原始數(shù)據(jù)的單位一致,在科技論文報告中,均數(shù)與標準差經(jīng)常被同時用來描述資料的集中趨勢與離散趨勢。用于計算變異系數(shù)用于計算標準誤(見第四章)結(jié)合均值與正態(tài)分布的規(guī)律,估計參考值的范圍(見第五節(jié))。四、變異系數(shù)變異系數(shù)(coefficientofvariation,CV)常用于比較度量單位不同或均數(shù)相差懸殊的兩組(或多組)資料的變異程度。某地7歲男孩身高的均數(shù)為123.10cm,標準差為4.71;體重均數(shù)為22.59kg,標準差為2.26kg,比較其變異度?身高體重第四節(jié)正態(tài)分布正態(tài)曲線(normalcurve)的發(fā)現(xiàn)

deMoivre(1667-1754),publishedin1733

Laplace(1749-1827)

Gauss(1777-1855)正態(tài)分布:又稱高斯分布(Gaussiandistribution)

一、正態(tài)分布的概念和特征

1.正態(tài)分布曲線的數(shù)學表達式(概率密度函數(shù),probabilitydensityfunction,pdf

)

2.正態(tài)分布的特征正態(tài)曲線下面積分布有一定的規(guī)律,總面積=1。累積面積可通過對概率密度函數(shù)f(X)積分求得(累積)分布函數(shù):圖2-7正態(tài)曲線面積分布示意圖

二、標準正態(tài)分布見P695,u~N(0,12)1.u值是原變量值(x)離均數(shù)差的相對值(標準化得分)。2.不同總體的μ、σ不同,但x值的u值可以相同。3.在相同的u值情況下,其u值對應(yīng)曲線下的面積(概率)相同。標準正態(tài)變量的特征:例2-15138名成年女子的紅細胞數(shù)的均數(shù)、標準差分別為:4.23與0.45;問在正態(tài)分布假定下,試估計該醫(yī)院所抽查成年女子的紅細胞數(shù):①在4.00以下者占成年女子總?cè)藬?shù)的百分比;②在4.00~5.00之間者占成年女子總?cè)藬?shù)的百分比;③在5.00以上者占成年女子總?cè)藬?shù)的百分比。①在4.00以下者占成年女子總?cè)藬?shù)的百分比查附表1:Φ(-0.51)=0.3050,故在4.00以下者占成年女子總?cè)藬?shù)的30.50%③在5.00以上者占成年女子總?cè)藬?shù)的百分比。查附表1:Φ(-1.71)=0.0436,故在5.00以上者占成年女子總?cè)藬?shù)的4.36%②在4.00~5.00之間者占成年女子總?cè)藬?shù)的百分比100%-(4.36%+30.50%)=65.14%

正態(tài)分布

標準正態(tài)分布-0.511.71一、基本概念第五節(jié)醫(yī)學參考值范圍的制定1.意義:醫(yī)學參考值(referencevalue)是指包括絕大多數(shù)正常人的人體形態(tài)、機能和代謝產(chǎn)物等各種生理及生化指標常數(shù),也稱正常值。由于存在個體差異,生物醫(yī)學數(shù)據(jù)并非常數(shù)而是在一定范圍內(nèi)波動,故采用醫(yī)學參考值范圍作為判定正常和異常的參考標準,但不是“金標準”。2.單、雙側(cè)問題,常依據(jù)醫(yī)學專業(yè)知識而定

雙側(cè):如:血清總膽固醇、血液白細胞數(shù)無論過低或過高均屬異常單側(cè)上限:如:血清轉(zhuǎn)氨酶、體內(nèi)有毒物質(zhì)過高異常(越低越好,<P95)單側(cè)下限:如:肺活量過低異常(越高越好,>P5)

3.有90%、95%、99%等醫(yī)學參考值范圍,最常用的是95%。計算醫(yī)學參考值范圍的常用方法:1、正態(tài)分布法2、百分位數(shù)法二、正態(tài)分布法公式:單側(cè)下限單側(cè)上限Z利用例2-1資料求正常成年女子的紅細胞數(shù)的95%參考值范圍。圖2-1顯示資料近似服從正態(tài)分布,因紅細胞數(shù)過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論