醫(yī)學統(tǒng)計學方法_第1頁
醫(yī)學統(tǒng)計學方法_第2頁
醫(yī)學統(tǒng)計學方法_第3頁
醫(yī)學統(tǒng)計學方法_第4頁
醫(yī)學統(tǒng)計學方法_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第三篇醫(yī)學統(tǒng)計學方法StatisticalMethodsinMedicine1第九章數(shù)值變量資料的統(tǒng)計分析第一節(jié)數(shù)值型資料的統(tǒng)計描述第二節(jié)正態(tài)分布和參考值范圍的估計第三節(jié)數(shù)值型資料的統(tǒng)計推斷第四節(jié)t檢驗和u檢驗第五節(jié)方差分析2

terminologystatisticaldescription統(tǒng)計描述statisticalinference統(tǒng)計推斷parameterestimation參數(shù)估計Frequencydistribution頻數(shù)分布frequencytable頻數(shù)表arithmeticMean,average算術(shù)平均值standarddeviation標準差variance方差range極差,全距,范圍geometricmean幾何平均值median中位數(shù)normaldistribution正態(tài)分布referencerange參考值范圍3統(tǒng)計分析包括統(tǒng)計描述和統(tǒng)計推斷兩大部分。統(tǒng)計描述(statisticaldescription)是用統(tǒng)計指標、統(tǒng)計表和統(tǒng)計圖描述資料的分析規(guī)律及其數(shù)量特征;統(tǒng)計推斷(statisticalinference)包括總體參數(shù)估計和假設檢驗兩個內(nèi)容。參數(shù)估計:是用樣本統(tǒng)計量估計總體參數(shù)所在范圍。假設檢驗:是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征所作的假設是否成立。

4第一節(jié)數(shù)值型變量資料的統(tǒng)計描述例9.12002年某市150名20~29歲正常男子的尿酸濃度(μmol/L),資料見表9-1。如何進行統(tǒng)計描述?5362.6359.7285.9300.2333.6334.0288.8338.5341.9344.63375298.3364.2367.1338.1316.9332.7324.0282.6369.8398.7338.7308.9392.1368.7352.6378.2346.1278.6318.3323.2322.6382.1322.6309.6352.0372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8358.8405.9362.7316.3338.7402.6379.4329.6354.6331.4349.6419.5324.6329.8357.8312.0313.6338.7328.6291.3329.7361.8392.4414.9319.7327.6395.8358.9289.4366.2387.4298.4408.7389.8362.5354.9352.7316.6348.9348.7401.6334.6308.9367.0345.6401.6357.1304.6338.5388.2355.8329.4321.1320.4313.5339.8409.4387.4378.5392.0352.7376.2388.4344.6308.6347.0428.7369.1311.4376.3349.4289.2366.8371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.4357.5348.5346.8406.6357.6338.7341.6349.8289.4366.2357.5298.4336.8387.5342.3366.7387.6332.7324.0表9-12002年某市150名20~29歲正常男子的尿酸濃度(μmol/L)6統(tǒng)計描述的內(nèi)容:一、制頻數(shù)(分布)表(表9-2)和頻數(shù)分布圖(圖9-1)

頻數(shù)表的用途(1)揭示資料的分布特征和分布類型(2)便于發(fā)現(xiàn)某些特大或特小的可疑值(3)便于進一步計算統(tǒng)計指標和統(tǒng)計分析處理二、計算統(tǒng)計指標(1)計算平均值—代表一組資料的平均水平;(2)計算標準差---反映資料的離散程度。三、繪制統(tǒng)計表和統(tǒng)計圖7一、編制頻數(shù)分布表:制表步驟:(1)求極差或全距(range):R=Xmax-Xmin本例,R=428.7-278.6=150.1(μmol/L)。(2)決定組數(shù)、組段數(shù)和劃分組距(classinterval):根據(jù)樣本含量的多少確定組數(shù),一般設8~15組。組段數(shù)=取整(極差/組數(shù))。本例:組段數(shù)=取整(150.1/10)=15.0115劃分組距:每組段的起點和終點分別稱為下界和上界。組距:本組內(nèi)的上界和下界之差。組段的劃分270~285~300~315~330~345~360~375~390~405~420~43512345678910118(3)列頻數(shù)表:按上述組段序列制成表的形式,采用劃記法或計算機將原始數(shù)據(jù)匯總,得出各組段中所包含的觀察例數(shù),即為頻數(shù),如表9-2的第(2)欄。將各組段及其相應的頻數(shù)列成表格,即為頻數(shù)表(frequencytable),如表9-2。所繪的圖形見圖9-1。表9-22002年某市150名20~29歲正常男子的尿酸濃度的頻數(shù)分布尿酸濃度(μmol/L)頻數(shù)頻率(%)270~21.33285~96.00300~117.33315~2214.67330~2416.00345~2718.00360~2013.33375~1510.00390~117.33405~85.33420~43510.67合計150100.009資料的分布類型:對稱分布或正態(tài)分布;2.偏態(tài)分布:高峰在左側(cè)或右側(cè);3.不規(guī)則分布:分布很散,無明顯高峰10二、計算平均值—代表平均資料的平均水平1.平均值的種類:(一)算術(shù)均值(arithmeticmean,average):常用表示樣本均值,希臘字母μ表示總體均值。適用于對稱分布的數(shù)值型變量資料。其計算方法有:①直接法:χi

(I=1,2,…,n)為第i個觀察對象的觀察值②加權(quán)法:χi

為第i組的組中值,fi

為第i組的例數(shù):11表9-2分組資料加權(quán)法計算平均值及標準差用表尿酸濃度(μmol/L)組中值(xi)頻數(shù)(fi)fi×xifi×xi2270~277.52555.0154012.5285~292.592632.5770006.3300~307.5113382.51040119.0315~322.5227095.02288138.0330~337.5248100.02733750.0345~352.5279517.53354919.0360~367.5207350.02701125.0375~382.5155737.52194594.0390~397.5114372.51738069.0405~412.583300.01361250.0420~435427.51427.5182756.3合計15052470.018518738.012(二)幾何均值(geometricmean,G)適用條件:等比級數(shù)資料.原始觀察值呈偏態(tài)分布、但數(shù)據(jù)經(jīng)過對數(shù)變換后呈正態(tài)分布或近似正態(tài)分布的資料。如醫(yī)學實踐中某些疾病的潛伏期、抗體滴度、平均效價等。其計算方法有:①直接法:χi

為第i個觀察對象的觀察值②加權(quán)法:χi

為第i組的組中值(或觀察值),fi

為第i組例數(shù):13抗體滴度(i)人數(shù)fi滴度倒數(shù)Xilg10(Xi)fi×lg10(Xi)(1)(2)(3)(4)(5)=(2)×(4)1:2.532.50.39791.19371:5.075.00.69904.89301:10.01410.01.000014.00001:20.0620.01.30107.80621:40.0440.01.60216.4084合計3434.3013表9-4某地34名兒童接種麻疹疫苗后血清血凝抑制抗體滴度血清血凝抑制抗體的幾何平均滴度為1:10.206。X=(2.5×3+5.0×7+10.0×14+20.0×6+40.0×4)/34=13.6(算術(shù)平均滴度為1:13.6)14(三)中位數(shù)(median,M):將觀察值按大小排序后,位次居中的觀察值。M=X(P=50%)在全部觀察值中小于M的觀察值個數(shù)與大于M的觀察值個數(shù)相等。由于M不受個別特小或特大觀察值的影響,適用于分布不規(guī)則或分散度很高的資料.3個觀察值:1,3,5.M=3;4個觀察值:1,3,5,7.M=4.①直接法:設n

為觀察值的個數(shù),有公式(9-5)及(9-6)②頻數(shù)表法:χi

為第i組的組中值(或觀察值),fi

為第i組例數(shù):L:中位數(shù)組段下限值,ΣfL:小于L的累計頻數(shù),i:中位數(shù)組距.15尿鉛值(mmol/L)人數(shù)f累計頻數(shù)Σf累計頻率(%)(1)(2)(3)(4)=(3)/n0~27278.7725~548126.3050~9517657.1475~5523175.00100~3927087.66125~2129194.48150~1230398.38175~5308100.00合計308表9-5308名6歲以下兒童尿鉛值的頻數(shù)分布(中位數(shù)計算)L:中位數(shù)組段下限值,ΣfL:小于L的累計頻數(shù),i:中位數(shù)組距,f50%:中位數(shù)組頻數(shù).L=50,ΣfL=81,i=25f50%=9516三、計算標準差---反映資料的離散程度。數(shù)值變量數(shù)據(jù)的頻數(shù)分布有集中趨勢和離散程度兩個主要特征,只有兩者相結(jié)合,才能全面地認識事物。反映資料的離散程度的統(tǒng)計量(統(tǒng)計指標)有:(一)全距(range)或極差:R=Xmax-Xmin全距是一組觀察值中最大值與最小值之差。(二)四分位數(shù)間距(quartileinterval):Q=X75%—X25%,Q包括了全部觀察值中間的一半.(三)方差(variance)和標準差(standarddeviation)17例有3組同齡男孩的體重(㎏)測量值如下,其平均體重都是30(㎏),試分析其離散程度。分組觀察值(㎏)全距RQS甲組262830323430843.16乙組2427303336301264.74丙組262930313430822.92丙組*****乙組*****甲組*****體重232425262728293031323334353637(㎏)18標準差的簡化計算方法:數(shù)學上可證明:故標準差的計算公式又可寫成:直接法:X為觀察值加權(quán)法:Xi為組中值

表9-3尿酸濃度(μmol/L)分組資料加權(quán)法計算平均數(shù)及標準差用表n=∑fi=150∑(fi×xi)=52470.0∑(fi×xi2)=18518738.019標準差的應用:(1)表示觀察值的變異程度(離散程度):在兩組(或幾組)資料均數(shù)相近、度量單位相同的條件下,標準差大,表示觀察值的變異度大,即各觀察值離均數(shù)較遠,均數(shù)的代表性較差。(2)結(jié)合均數(shù)描述正態(tài)分布的特征和估計醫(yī)學參考值范圍。(3)結(jié)合樣本含量n計算標準誤。20四分位數(shù)間距的計算(interquartilerange,Q):中位數(shù)計算公式:25%位數(shù)計算公式:75%位數(shù)計算公式尿鉛值(mmol/L)人數(shù)f累計頻數(shù)Σf累計頻率(%)(1)(2)(3)(4)=(3)/n0~27278.7725~548126.3050~9517657.1475~5523175.00100~3927087.66125~2129194.48150~1230398.38175~5308100.00合計30821四分位數(shù)間距(interquartilerange,Q)計算公式:Q=X75%–X25%X0%X25%X50%X75%X100%|Q|048.1569.21100.0175~X1…Xn22描述性統(tǒng)計量歸納反映資料的集中趨勢的指標反映資料的離散情況指標適用的資料類型1.算術(shù)平均數(shù)方差及標準差對稱分布,特別是正態(tài)或近似正態(tài)分布資料。2.幾何平均數(shù)幾何標準差適用于對數(shù)正態(tài)或近似對數(shù)正態(tài)分布資料3.中位數(shù)四分位數(shù)間距或百分位數(shù)分布不規(guī)則的資料,分散程度大的資料23變異系數(shù)(coefficientofvariation,CV):若比較度量單位不同或均數(shù)相差懸殊的兩組(或幾組)觀察值的變異度,則需用變異系數(shù)為相互比較的指標。不屬于描述性統(tǒng)計指標,是一個比較用的統(tǒng)計指標。從變異系數(shù)比較,體重的變異程度大于身高的變異程度。變異系數(shù)的特點:描述的是相對離散程度,沒有單位。適用于:(1)比較單位不同的多組資料的變異度。(2)比較均數(shù)相差懸殊的多組資料的變異度。例9-10某地25歲男子100人的調(diào)查結(jié)果如下:問題:哪一個指標的變異度大些?24第二節(jié)正態(tài)分布和醫(yī)學參考值范圍一、正態(tài)分布(normaldistribution)25表9-2尿酸濃度的頻數(shù)分布尿酸濃度(μmol/L)頻數(shù)270~2285~9300~11315~22330~24345~27360~20375~15390~11405~8420~4351合計150圖9-2頻數(shù)分布逐漸向正態(tài)分布接近26(一)正態(tài)分布的圖形可以設想,如果觀察例數(shù)逐漸增多,組段數(shù)也不斷增多,就會形成一條光滑曲線[圖9-2(3)]。稱為正態(tài)分布曲線。這條正態(tài)分布曲線的特點為:①高峰位于中央均數(shù)所在處、兩側(cè)逐漸降低;②左右對稱;

③曲線在無窮遠處與橫軸相交。把服從正態(tài)分布的變量表示為:X~N(μ,σ2)正態(tài)分布曲線由兩個參數(shù)確定:①平均數(shù)μ,稱位置參數(shù),決定平均數(shù)所在的位置;②方差σ2,稱形狀參數(shù),決

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論