《衛(wèi)生統(tǒng)計學》第二章 定量資料的統(tǒng)計描述一_第1頁
《衛(wèi)生統(tǒng)計學》第二章 定量資料的統(tǒng)計描述一_第2頁
《衛(wèi)生統(tǒng)計學》第二章 定量資料的統(tǒng)計描述一_第3頁
《衛(wèi)生統(tǒng)計學》第二章 定量資料的統(tǒng)計描述一_第4頁
《衛(wèi)生統(tǒng)計學》第二章 定量資料的統(tǒng)計描述一_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

定量資料的統(tǒng)計描述之一

頻率分布表與頻率分布圖

集中趨勢的描述4/6/2023.頻率分布表:即對各變量值出現的頻率列表。用來描述定量資料的頻數分布,反映觀察值的分布類型及分布特征。頻率分布圖4/6/2023.離散型定量變量的頻率分布頻率表的編制:直接清點各變量值及相同變量值出現的頻率列表即可。如:例2-1,即可列成表2-1的形式其頻率分布圖如圖2-1的形式4/6/2023.頻數表表1.某地140名正常男子紅細胞數的頻數表紅細胞數(1012/L)劃記組中值頻數頻率(%)3.80~3.9021.44.00~4.1064.34.20~4.30117.9...5.80~6.005.9010.7連續(xù)型定量變量的頻率分布4/6/2023.

頻率分布表的編制:

☆找最大值、最小值,求極差

☆按極差大小決定組段數、組段、組距一般設10-15個組段常用極差的1/10取整作組距要求:第一組段包括最小值最后一個組段包括最大值每個組段的起點稱"下限"(lowlimit)終點稱"上限"(upperlimit)對于連續(xù)性資料,各組段從下限開始,不包括本組段上限?!钅┮粋€組段應同時寫出其下限和上限。

☆列表劃記,求頻數(f)

4/6/2023.例:某地40例中年健康男子血清總膽固醇值(mmol/L)測定結果如下:4.773.376.143.953.564.234.314.714.564.375.396.305.217.225.543.395.185.774.795.125.205.104.704.744.384.896.255.324.504.633.614.444.473.403.91

2.704.604.095.965.481)編制頻率分布表并繪制分布圖2)估計其頻率分布的類型3)計算均數、標準差S、變異系數CV4)計算中位數M,并與比較。

4/6/2023.表2某地40例健康成年男子血清膽固醇值的頻數表組段劃記頻數2.70~13.20~43.70~44.20~104.70~95.20~65.70~36.20~26.70~07.20~7.701合計404/6/2023.頻率分布表(圖)的用途:作為陳述資料的形式,反映資料的分布類型;對稱分布偏態(tài)分布正偏態(tài)負偏態(tài)描述分布的兩個特征:集中趨勢、離散趨勢便于發(fā)現可疑值,及時查正;便于以后的計算指標及統(tǒng)計分析;當樣本含量較大時,可用頻率作為概率的估計值。直方圖:P14圖2-2,圖2-3,

更直觀的反映頻數分布的類型。4/6/2023.集中趨勢的描述平均數(average)是描述一組觀察值的集中位置或平均水平的統(tǒng)計指標常作為一組數據的代表值用于分析和組間比較常用的有:算術均數、幾何均數、中位數4/6/2023.1.算術均數(arithmeticmean)簡稱均數總體均數用μ表示樣本均數用

表示反映一組觀察值在數量上的平均水平

4/6/2023.(1)計算方法

★直接法:

式中,希臘字母Σ(讀作sigma)表示求和;X1,X2,…,Xn為各觀察值;

n為樣本含量,即觀察值的個數。4/6/2023.★頻率表法:頻率表資料或相同觀察值較多時

式中,X0與f分別為頻數表資料中各組段的組中值和相應組段的頻數(或相同觀察值與其對應的頻數)。

4/6/2023.(2)均數的兩個重要特性·各離均差的總和等于零·離均差的平方和小于各觀察值X與任何數a(而a≠均數)之差的平方和即均數是一組觀察值最理想的代表值(3)均數的應用:最適用于對稱分布,特別是正態(tài)分布資料不適于偏態(tài)分布資料4/6/2023.2.幾何均數(geometricmean)G用于等比(或明顯偏態(tài))資料集中趨勢的描述,反映其平均增減倍數。4/6/2023.(1)計算方法·直接法或

·頻率表法:相同觀察值的個數較多時4/6/2023.(2)應用于:·等比資料如抗體的平均滴度、平均發(fā)展速度人口的幾何增長(增長速度);或用于對數正態(tài)分布資料。**注意·觀察值不能有零·觀察值不能同時有正值和負值同一組資料幾何均數小于均數4/6/2023.3.中位數中位數(median,M)是將一組觀察值從小到大排列,位次居中的觀察值。百分位數(percentile),位置指標,Px,將總體或樣本的全部觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大。P50分位數即是中位數

4/6/2023.(1)計算方法**1)直接由原始數據計算中位數先按大小排序n為奇數時

n為偶數時式中下標、、為有序數列的位次。、、為相應位次的觀察值。4/6/2023.2)用頻數表計算M和Px步驟:①按所分組段,由小到大計算累計頻數和累計頻率;②按下式求M、Px

式中fx為Px所在組段頻數i為該組段的組距L為其下限∑fL為小于L各組段的累計頻數4/6/2023.(2)中位數和百分位數的應用:

1)中位數常用于描述偏態(tài)分布資料的集中位置,反映位次居中的觀察值的水平。只受居中變量值波動的影響?!鄬δ┒藷o確定數據的分布,不能直接求均數和幾何均數時,可求中位數。在對稱分布資料中,中位數與均數在理論上數值是相同的。2)百分位數用于描述樣本或總體觀察值序列在某百分位位置的水平。最常用的是P50、P5、P95等4/6/2023.3)百分位數常用于確定醫(yī)學參考值范圍(正常值范圍),習慣上是確定只包括95%(或90%、99%等)的人的界值。雙側參考值范圍P2.5~P97.5(如血壓、心率)單側參考值范圍P95或P5(如尿鉛/汞、血鉛)可用于任何分布的資料,特別是非特定分布的資料如非正態(tài)分布資料。4)一般,分布中部的百分位數相對穩(wěn)定,代表性好,而兩端的只在n足夠大時才較穩(wěn)定,∴當樣本例數n不夠多時,不宜取太近兩端的百分位數。

4/6/2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論