第十四章數值變量統(tǒng)計描述_第1頁
第十四章數值變量統(tǒng)計描述_第2頁
第十四章數值變量統(tǒng)計描述_第3頁
第十四章數值變量統(tǒng)計描述_第4頁
第十四章數值變量統(tǒng)計描述_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第十四章數值變量的統(tǒng)計描述

蔡泳頻數表的編制方法1.找全距:Range=Max-Min2.劃分組段(1)確定組數:8~15組,一般取10組(2)確定組距:組距(i)=全距/組段數(3)確定各組段的上下限:各組的起點為下限,終點為上限。要求:(1)第一組含最小值(2)最后組含最大值3.歸納計數:劃計法4.計算頻率與累計頻率集中趨勢

集中趨勢:表示數據的中心位置。集中趨勢的指標:

平均數是一組統(tǒng)計指標,常用的有算術均數、幾何均數及中位數等。平均數平均數是表示一組同質計量資料的集中趨勢或平均水平的統(tǒng)計指標,是計量資料中非常重要的一個指標體系。醫(yī)學研究中常用的平均數有算術均數、幾何均數及中位數三種。這個平均數是廣義的,而日常人們所說的平均數是狹義的算術均數。

(一)算術均數(mean)算術均數簡稱均數。用于說明一組觀測值的趨中位置或平均水平。均數用于對稱分布、正態(tài)或近似正態(tài)分布的資料。x表示變量X的樣本均數,

(希臘字母)表示總體均數。常用的計算方法是直接法和加權法。

直接法當樣本含量較小時,可選用此法。有n個觀察值,分別為X1,X2,……Xn,均數的計算公式為:

式中,Σ是求和的符號。例題例14-110名12歲男孩身高(cm)分別為125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.0,122.5,140.0。求平均數。

加權法1.列出頻數表

2.計算組中值

組中值X,計算方法是將本組下限和下組下限相加除以2。3.用加權法計算均數:式中f為各組的頻數,x為各組的組中值。

(二)幾何均數(geometricmean)

幾何均數適用于對數正態(tài)分布的資料,例如抗體的平均滴度和平均效價。幾何均數用G表示。

例:5人的抗體滴度為:1:10,1:100,1:1000,1:10000,1:100000直接法直接法:樣本含量較小時,選用此法。有n個觀察值X1,X2,…Xn,幾何均數的計算公式為:一般采用對數形式計算:式中l(wèi)g為取常用對數的符號,lg-1為反對數。

例題6份血清抗體滴度為:1:2,1:4,1:8,1:8,1:16,1:32,求平均數。

幾何平均滴度為1:8加權法加權法:當樣本含量較大時,可將資料整理成頻數表,用下式計算:例題[例1-4]某地102名健康人的鉤端螺旋體血清抗體滴度如表1-2,計算平均滴度。

102名健康人的鉤端螺旋體血清滴度的幾何平均滴度為1:464表14-1102名健康人的鉤端螺旋體

血清抗體平均滴度的計算

抗體滴度人數f滴度倒數XlgX

flgX

(1)(2)(3)(4)(5)=(2)(4)1:10071002.00014.0001:200192002.30143.7191:400344002.60288.4681:800298002.90384.1871:16001316003.20441.652合計102272.206(三)中位數(median)

將一組觀察值從小到大按順序排列,位次居中的觀察值就稱中位數。中位數適用于任何一種分布的計量數據,一般多用于描述偏態(tài)分布或數據一端無界資料的集中趨勢。中位數用M表示。

直接法樣本含量較小時,可根據下式計算:

n為奇數時n為偶數時上式中n為一組觀察值的總個數,、及均為下標,表示有序數列中觀察值的位次。

頻數表法樣本含量較大時用此法

L為本組(中位數所在組)下限,i為本組組距,f為本組頻數,ΣfL為上一組的累計頻數。本組位置可根據累計頻數的數值來判斷。當某一組的累計頻數首先超過n/2時或累計頻率首先超過50%時,即定為本組。

例題[例1-6]調查某地107名正常人尿鉛含量(mg/L)結果列于下表,計算中位數:

本例,第3組的累計頻數為65,超過n/2=53.5,即第3組為本組。

(四)百分位數(percentile)

百分位數是一種位置指標,用PX表示。百分位數是一個有序數列百等分的分割值。第50百分位數(P50)也就是中位數,中位數是一個特定的百分位數。計算百分位數的計算公式為:

計算百分位數一般需計算累計頻率(%),為各組段累計頻數除以總例數n。

離散趨勢的統(tǒng)計描述

計量數據的頻數分布有兩個重要特征:集中趨勢和離散趨勢。必須指出,要把兩者結合起來才能全面地反映數據頻數分布的基本特征。

[例1-8]兩組計量數據如下,分析其分布特征。

甲組98,99,100,101,102

乙組80,90,100,110,120描述離散趨勢的常用指標有全距、四分位間距、方差和標準差等。一、全距(range)亦稱極差,用R表示,是一組觀察值中最大值與最小值之差,反映個體差異的范圍。全距大,說明變異度大;反之,說明變異度小。

如例1-8中甲組全距為4,乙組全距為40,表明乙組變異度大。但全距易受個別數據的影響,穩(wěn)定性較差,抽樣誤差較大,而且還受n大小的影響,一般n越大,全距越大。

二、四分位間距

(inter-quartilerange)四分位間距是兩個特定的百分位數之差,即第75百分數P75(上四分位數QU)和第25百分位數P25(下四分位數QL)之差,用Q表示,適用于任何分布的計量資料,尤其適用于偏態(tài)分布的資料.

四分位間距比全距穩(wěn)定,但仍然未考慮到每個觀察值的變異。

Q=QU-QL

三、平均偏差與離均差平方和平均偏差(meandifference):每個觀測值與均數之差的絕對值相加,然后取平均。離均差平方和:為了避免使用絕對值,采用取平方的方法。離均差平方和=四、方差(variance)為了消除觀察值的總個數N的影響,將除以N,這就是總體方差,用σ2表示。對于樣本資料,在對離均差平方和取平均時分母用n-1代替n。五、標準差(standarddeviation)

方差的單位是原度量單位(如kg)的平方,把總體方差開平方,這就是總體標準差,度量單位與原始觀察值一致,即

對于樣本資料,樣本標準差的計算公式為:可改寫為:上式n-1稱為自由度。例題[例1-9]對例1-8的數據計算標準差

甲組:n=5,ΣX=98+99+100+101+102=500ΣX2=982+992+1002+1012+1022=50010

標準差應用

表示觀察值的變異程度

在兩組(或幾組)均數相近、單位相同的條件下,標準差大,表示變量值的變異度大,均數的代表性較差;反之,標準差小,表示變量組變異度小,數據多集中在均數周圍,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論