




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章數(shù)值變量資料的統(tǒng)計分析
DescriptiveStatistics計量資料的統(tǒng)計描述
統(tǒng)計描述統(tǒng)計分析統(tǒng)計推斷2024/12/62計量資料的統(tǒng)計描述【例7-1】某地用隨機抽樣的方法對130名健康成年男性紅細胞數(shù)進行了檢測,資料如表1,請描述男性紅細胞的情況。2024/12/63計量資料的統(tǒng)計描述表1某地130名正常成年男子紅細胞數(shù)(1012/L)3.79*4.575.194.864.284.675.374.984.455.88*4.535.164.844.154.665.314.974.434.774.785.14.834.114.635.284.944.44.745.675.054.813.984.615.234.94.354.75.465.034.493.894.575.214.874.294.675.384.984.464.784.545.164.854.174.665.324.974.434.775.075.134.834.134.645.294.954.424.745.694.534.814.014.625.264.914.364.735.495.044.783.944.575.234.94.314.685.394.994.485.084.545.174.864.274.665.364.984.434.774.535.154.844.134.645.294.964.424.755.694.84.824.14.625.264.934.394.745.615.045.13.984.585.234.94.334.685.454.494.82024/12/64計量資料的統(tǒng)計描述問題??表1的130個數(shù)據,無論多認真審視,也說不清這些人紅細胞的情況怎樣、特征如何。你應該如何著手整理,整理的目的是什么?結合學過的知識,你認為用什么方式描述這份資料能讓人對資料內容一目了然?統(tǒng)計描述就是解決此問題的方法,即用統(tǒng)計表、統(tǒng)計圖和統(tǒng)計指標來描述樣本數(shù)據的特征2024/12/65計量資料的統(tǒng)計描述第一節(jié)計量資料的統(tǒng)計描述頻數(shù)表與頻數(shù)分布平均指標(算術均數(shù)、幾何均數(shù)、中位數(shù)、眾數(shù))變異指標(極差、百分位數(shù)與四分位間距、方差、標準差、變異系數(shù))2024/12/66計量資料的統(tǒng)計描述一、頻數(shù)表與頻數(shù)分布
(frequencytableandfrequencydistribution)
頻數(shù)(frequency):變量值出現(xiàn)的次數(shù),即例數(shù)
頻數(shù)表(frequencydistributiontable):反映變量值與頻數(shù)之間關系的統(tǒng)計表2024/12/67計量資料的統(tǒng)計描述表1某地130名正常成年男子紅細胞數(shù)(1012/L)3.79*4.575.194.864.284.675.374.984.455.88*4.535.164.844.154.665.314.974.434.774.785.14.834.114.635.284.944.44.745.675.054.813.984.615.234.94.354.75.465.034.493.894.575.214.874.294.675.384.984.464.784.545.164.854.174.665.324.974.434.775.075.134.834.134.645.294.954.424.745.694.534.814.014.625.264.914.364.735.495.044.783.944.575.234.94.314.685.394.994.485.084.545.174.864.274.665.364.984.434.774.535.154.844.134.645.294.964.424.755.694.84.824.14.625.264.934.394.745.615.045.13.984.585.234.94.334.685.454.494.82024/12/68計量資料的統(tǒng)計描述1.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09(1012/L)。(2)決定組數(shù)、組段和組距:根據研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個組,為方便計,組距參考極差的十分之一,再略加調整。本例i=R/10=2.09/10=0.209≈0.2。(3)列出組段:第一組段的下限略小于最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計數(shù):用劃記法將所有數(shù)據歸納到各組段,得到各組段的頻數(shù)。2024/12/69計量資料的統(tǒng)計描述622.8130合計5.85.81–5.7~5.922.45.645.5~48.65.49正5.3~88.45.217正正正5.1~1055.021正正正正–4.9~1204.825正正正正正4.7~101.24.622正正正正4.5~70.44.416正正正–4.3~37.84.29正4.1~16.04.043.9~7.23.82
3.7~fX(5)=(3)×(4)
組中值,X(4)
頻數(shù),f(3)
劃記(2)
組段(1)表2某地130名正常成年男子紅細胞數(shù)頻數(shù)分布2024/12/610計量資料的統(tǒng)計描述2024/12/611計量資料的統(tǒng)計描述2.頻數(shù)表的分布特征①集中趨勢(centraltendency):變量值集中位置。本例在組段“4.7~4.9”。
——平均水平指標②離散趨勢(tendencyofdispersion):變量值圍繞集中位置的分布情況。本例4.3~5.1,共有101人,占77.7%;離“中心”位置越遠,頻數(shù)越??;且圍繞“中心”左右對稱?!儺愃街笜?024/12/612計量資料的統(tǒng)計描述二、平均指標總稱為平均數(shù)(average)反映了資料的集中趨勢(centraltendency
)。常用的有:
1.算術均數(shù)(arithmeticmean),簡稱均數(shù)(mean)
2.幾何均數(shù)(geometricmean)
3.中位數(shù)
(median)
2024/12/613計量資料的統(tǒng)計描述1.均數(shù)(mean)Σ為求和符號,讀成sigma適用條件:資料呈正態(tài)或近似正態(tài)。(1)直接法(2)加權法(頻數(shù)表法)基本思想:以組中值代表組內的變量值(近似法),簡化計算2024/12/614計量資料的統(tǒng)計描述紅細胞數(shù)(1)組中值X(2)頻數(shù)f(3)fXi(4)=(2)(3)fXi2(5)=(2)(4)3.70~3.8027.6028.883.90~4.00416.0064.004.10~4.20937.80158.764.30~4.401670.40309.764.50~4.6022101.20465.224.70~4.8025120.00576.004.90~5.0021105.00525.005.10~5.201788.40459.685.30~5.40948.60262.445.50~5.60422.40125.445.70~5.905.8015.8033.64合計-130623.03009.12表2某地區(qū)130名正常成年男子紅細胞數(shù)(1012/L)的均數(shù)和標準差的加權計算均數(shù)=623.0/130=4.7942024/12/615計量資料的統(tǒng)計描述2.幾何均數(shù)(geometricmean)幾何均數(shù):變量對數(shù)值的算術均數(shù)的反對數(shù)。2024/12/616計量資料的統(tǒng)計描述幾何均數(shù)的適用條件與實例適用條件:呈倍數(shù)關系的等比資料或對數(shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料
血清的抗體效價滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)2024/12/617計量資料的統(tǒng)計描述頻數(shù)表資料的幾何均數(shù)抗體滴度⑴
人數(shù),f⑵
滴度倒數(shù),X⑶lgX⑷
f·lgX⑸1:2.5
1:101:401:1601:640
合計141822126722.510.040.0160.0640.00.39791.00001.60212.20412.80625.570618.000035.246226.449216.8372102.10322024/12/618計量資料的統(tǒng)計描述3.中位數(shù)(median)
百分位數(shù)(percentile)中位數(shù):一組觀察值按大小順序排列,位置居中的那個數(shù)值稱為中位數(shù),記為M。百分位數(shù):一組數(shù)據從小到大排列,并分成100等份,第x等份之分割位置的數(shù)值稱為第x百分位數(shù),記為Px
例如:x=50,記為P50,讀作“第五十百分位數(shù)”(即中位數(shù))2024/12/619計量資料的統(tǒng)計描述
適用情形:適用于任意分布,常用于
:
①偏態(tài)分布(如發(fā)汞、尿鉛);
②一端或兩端無確定數(shù)值;
③分布情況不明。2024/12/620計量資料的統(tǒng)計描述
常用百分位數(shù):P50,P25,P75,,P5,P95,P2.5,P97.5怎樣求解中位數(shù)和百分位數(shù)?2024/12/621計量資料的統(tǒng)計描述(1)中位數(shù)計算公式與實例
先將觀察值按從小到大順序排列,再按以下公式計算:特點:僅僅利用了中間的1~2個數(shù)據2024/12/622計量資料的統(tǒng)計描述例題某患病者5人的潛伏期分別為2,3,4,5,3天,求其中位數(shù)?若再加一名患者,其潛伏期為9天,又如何計算?2024/12/623計量資料的統(tǒng)計描述(2)中位數(shù)和百分位數(shù)的頻數(shù)表法:
L為百分位數(shù)對應組段的下限值,i為該組段的組距,fx為該組段頻數(shù),
fL為前一組累計頻數(shù)2024/12/624計量資料的統(tǒng)計描述紅細胞數(shù)(1)頻數(shù)f(3)累計頻數(shù)(4)累計百分率(5)3.70~221.5(0.0~1.5)3.90~464.6(1.5-4.6)4.10~91511.5(4.6-11.5)4.30~163123.8(11.5-23.8)4.50~225340.8(23.8-40.8)4.70~257860.0(40.8-60.0)4.90~219976.2(60.0-76.2)5.10~1711689.2(76.2-89.2)5.30~912596.2(89.2-96.2)5.50~412999.2(96.2-99.2)5.70~5.901130100(99.2-100.0)合計130--表2某地區(qū)130名正常成年男子紅細胞數(shù)(1012/L)中位數(shù)的加權計算中位數(shù)=4.7+0.2x[(130x50%-53)/25]=4.7962024/12/625計量資料的統(tǒng)計描述例題某校70例急性食物中毒患者潛伏期見下表,求急性食物中毒的平均潛伏期?該資料能否計算均數(shù)、幾何均數(shù),為什么?2024/12/626計量資料的統(tǒng)計描述潛伏期(天)人數(shù)累計頻數(shù)累計頻率%0~11~72~323~114~115~46~27~18~1合計702024/12/627計量資料的統(tǒng)計描述均數(shù)、中位數(shù)的關系正態(tài)分布時:均數(shù)=中位數(shù)正偏態(tài)分布時:均數(shù)>中位數(shù)負偏態(tài)分布時:均數(shù)<中位數(shù)2024/12/628計量資料的統(tǒng)計描述三、變異(variation)指標
反映數(shù)據的離散度(Dispersion
)。即個體觀察值的變異程度。常用的指標有:
1.極差(Range)
(全距)
2.百分位數(shù)與四分位數(shù)間距(PercentileandQuartilerange)
3.方差
(Variance)
4.標準差(StandardDeviation)
5.變異系數(shù)(CoefficientofVariation)
2024/12/629計量資料的統(tǒng)計描述盤編號甲乙丙14404804902460490495350050050045405105055560520510合計250025002500均數(shù)500500500
例:設甲、乙、丙三人,采每人的耳垂血,然后紅細胞計數(shù),每人數(shù)5個計數(shù)盤,得結果如下(萬/mm3)甲乙丙2024/12/630計量資料的統(tǒng)計描述1.極差(Range)(全距)優(yōu)點:簡便缺點:1.只利用了兩個極端值2.n大,R也會大3.不穩(wěn)定12040202024/12/631計量資料的統(tǒng)計描述2.百分位數(shù)與四分位數(shù)間距
Percentileandquartilerange百分位數(shù):數(shù)據從小到大排列;在百分尺度下,所占百分比對應的值。記為Px。四分位間距:QR=P75-P25四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px2024/12/632計量資料的統(tǒng)計描述(2)中位數(shù)和百分位數(shù)的頻數(shù)表法:
L為百分位數(shù)對應組段的下限值,i為該組段的組距,fx為該組段頻數(shù),
fL為前一組累計頻數(shù)2024/12/633計量資料的統(tǒng)計描述紅細胞數(shù)(1)頻數(shù)f(3)累計頻數(shù)(4)累計百分率(5)3.70~221.5(0.0~1.5)3.90~464.6(1.5-4.6)4.10~91511.5(4.6-11.5)4.30~163123.8(11.5-23.8)4.50~225340.8(23.8-40.8)4.70~257860.0(40.8-60.0)4.90~219976.2(60.0-76.2)5.10~1711689.2(76.2-89.2)5.30~912596.2(89.2-96.2)5.50~412999.2(96.2-99.2)5.70~5.901130100(99.2-100.0)合計130--表2某地區(qū)130名正常成年男子紅細胞數(shù)(1012/L)中位數(shù)的加權計算P25=4.5+0.2x[(130x25%-31)/22]=4.51P75=4.9+0.2x[(130x75%-78)/21]=5.09QR=5.09-4.51=0.582024/12/634計量資料的統(tǒng)計描述潛伏期(天)人數(shù)累計頻數(shù)累計頻率%0~11~72~323~114~115~46~27~18~1合計702024/12/635計量資料的統(tǒng)計描述百分位數(shù)的應用確定醫(yī)學參考值范圍
(referencerange)
如95%參考值范圍=P97.5-P2.5;表示有95%正常個體的測量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征2024/12/636計量資料的統(tǒng)計描述3.方差
方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據的平均離散情況。2024/12/637計量資料的統(tǒng)計描述4.標準差
標準差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。2024/12/638計量資料的統(tǒng)計描述標準差的計算盤編號甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計250025002500標準差50.9915.817.912024/12/639計量資料的統(tǒng)計描述紅細胞數(shù)(1)組中值X(2)頻數(shù)f(3)fiXi(4)=(2)(3)fiXi2(5)=(2)(4)3.70~3.8027.6028.883.90~4.00416.0064.004.10~4.20937.80158.764.30~4.401670.40309.764.50~4.6022101.20465.524.70~4.8025120.00576.004.90~5.0021105.00525.005.10~5.201788.40459.685.30~5.40948.60262.445.50~5.60422.40125.445.70~5.905.8015.8033.64合計-130623.03009.12表2某地區(qū)130名正常成年男子紅細胞數(shù)(1012/L)的均數(shù)和標準差的加權計算2024/12/640計量資料的統(tǒng)計描述5.變異系數(shù)(coefficientofvariation,CV)適用條件:①觀察指標單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)
標準差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%2024/12/641計量資料的統(tǒng)計描述【例】
某地40名7歲兒童身高均數(shù)為121.48cm,標準差為4.65cm;體重均數(shù)為22.18kg,標準差2.35kg。試比較其身高和體重的變異程度。身高CV=3.83%,體重CV=10.60%2024/12/642計量資料
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 借款合同范本號
- 2025年高純白銀行業(yè)深度研究分析報告-20241226-212310
- 2024-2030年中國食物垃圾處理器行業(yè)市場調查研究及投資前景展望報告
- 女裝線上銷售渠道發(fā)展趨勢
- 2024-2030年中國家庭財富管理行業(yè)發(fā)展?jié)摿︻A測及投資戰(zhàn)略研究報告
- 地塊平整項目背景與意義
- 變配電擴容施工技術方案
- 醫(yī)院周轉房可行性研究報告
- 中國漏電斷路器行業(yè)發(fā)展前景及行業(yè)投資策略研究報告
- 兼職物業(yè)合同范本
- 企業(yè)承包經營合同范本
- 2025年01月公安部第三研究所公開招聘人民警察筆試筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 光纜線路施工安全協(xié)議書范本
- 《我國國有企業(yè)股權融資效率實證研究》相關概念及國內外文獻綜述2600字
- 2025-2030全球鋰電池用隔膜行業(yè)調研及趨勢分析報告
- 2025年湖南交通職業(yè)技術學院高職單招職業(yè)適應性測試近5年??及鎱⒖碱}庫含答案解析
- 成本合約規(guī)劃培訓
- 交通法規(guī)教育課件
- 小學校長任期五年工作目標(2024年-2029年)
- 2022-2024年浙江中考英語試題匯編:閱讀理解(說明文)教師版
- 第1課 中國古代政治制度的形成與發(fā)展 課件-歷史統(tǒng)編版(2019)選擇性必修1國家制度與社會治理
評論
0/150
提交評論