衛(wèi)生統(tǒng)計學專題四:定量資料的統(tǒng)計描述_第1頁
衛(wèi)生統(tǒng)計學專題四:定量資料的統(tǒng)計描述_第2頁
衛(wèi)生統(tǒng)計學專題四:定量資料的統(tǒng)計描述_第3頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、專題四 定量資料的統(tǒng)計描述一、頻數(shù)表與頻數(shù)圖頻數(shù)表:表達變量取值及其不同取值頻數(shù)分布情況的統(tǒng)計表。頻數(shù)表的編制連續(xù)型定量資料的頻數(shù)表求極差(全距):r=xmax-xmin確定組數(shù)和組距:根據(jù)樣本含量的大小及研究目的確定組數(shù),一般設(shè)為815組。用r除以組數(shù)得到的商,取與此接近較為整齊的數(shù)值作為組距,組距即為各組的上、下限之差。注:各組的組距可以相等,可以不等,一般多采用等距分組。確定組段:即確定每一組的起點和終點(下限與上限)注:第一組段包括全部觀察值中的最小值,最末組段包含全部觀察值中的最大值;各組段包含的數(shù)值范圍是大于等于下限,小于上限;頻數(shù)表中除最末組同時寫出下限和上限外,其余各組均只寫出

2、下限;歸組計數(shù)整理成表;離散型定量資料的頻數(shù)表的編制:將變量值及其對應(yīng)的頻數(shù)列出即可。頻數(shù)表的用途揭示資料的頻數(shù)分布特征和頻數(shù)分布類型:分布特征:集中趨勢、離散趨勢,對于定量資料可從兩個方面去描述其分布特征。分布類型:對稱分布,即高峰位中,兩側(cè)對稱。偏態(tài)分布,高峰偏于一側(cè),偏向數(shù)值小的一側(cè),稱為正偏態(tài)分布;偏向數(shù)值大的一側(cè),為負偏態(tài)分布。便于發(fā)現(xiàn)某些特大或特小的可疑值;便于進一步計算指標和統(tǒng)計處理。頻數(shù)圖:更直觀、形象。以變量值為橫坐標,以頻數(shù)為縱坐標(等距分組時可以頻率為縱坐標,不等距分組時以頻率/組距=頻率密度作為縱坐標),即每個等寬長方形面積表示每組頻數(shù)(或頻率)。注:連續(xù)型定量資料,其

3、頻數(shù)圖中各長方形是相連的,又稱為直方圖;離散型定量資料,其頻數(shù)圖中各長方形是間隔的,又稱為直條圖。二、集中趨勢的描述對于定量資料集中趨勢的描述常用平均數(shù),平均數(shù)表達了一組同質(zhì)定量數(shù)據(jù)的平均水平或集中位置。算術(shù)平均數(shù)(均數(shù))幾何均數(shù)(倍數(shù)均數(shù))符號(樣本),(總體)g計算方法(直接法)(加權(quán)法)k為組段數(shù),xk為各組段相應(yīng)頻數(shù)。(直接法,用于樣本含量較少時)g=lg-1=lg-1(加權(quán)法,用于觀察值較多,或資料已編成頻數(shù)表時)g=lg-1=lg-1應(yīng)用應(yīng)用于對稱分布,特別是正態(tài)分布資料集中趨勢的描述。對數(shù)對稱(含對數(shù)正態(tài)分布),即數(shù)據(jù)經(jīng)對數(shù)變換后呈對稱分布或正態(tài)分布的資料。等比級數(shù)資料,即觀察值

4、之間呈倍數(shù)或近似倍數(shù)變化的資料,如抗體滴度、抗體效價。說明計算幾何均數(shù)時,觀察值中不能有0,因為0不能取對數(shù),此時可以加上1個很小的數(shù),算后再減去該數(shù)值即可。觀察值不能同時有正有負。續(xù)表中位數(shù)百分位數(shù)符號mpx計算方法觀察個數(shù)為奇時,m=x觀察個數(shù)為偶時,(直接法)m=(頻數(shù)表法)m=l+l為頻數(shù)表中m所在組段的下限,i為m所在組段的組距,fm為m所在組段的頻數(shù),fl為小于l的各組段累積頻數(shù)。px=l+其中l(wèi)為px所在組段下限,i為組距,fx為px所在組段頻數(shù),fl為小于l的各組段的累積頻數(shù)。應(yīng)用適用于描述偏態(tài)分布資料、一端或兩端無確切值的資料及總體分布不確定資料的集中趨勢用于描述一組數(shù)據(jù)某一

5、百分位置的水平,多個百分位數(shù)結(jié)合應(yīng)用,可全面描述一組觀察值的分布特征;用于確定非正態(tài)分布資料的醫(yī)學參考值范圍。說明將觀察值由小到大排序后,居于中間位置的數(shù)值。在全部觀察中,小于和大宇中位數(shù)的觀察值個數(shù)相等。px是指將觀察值由小到大排序后,將其平均分為100份,對于每一分割位置上的數(shù)值即為一個百分數(shù)。四分位數(shù):p25(ql)、p50(中位數(shù))、p75(qu);應(yīng)用百分位數(shù)時,樣本含量要足夠大,否則不宜取太靠近兩端的百分位數(shù)。三、離散趨勢的描述離散趨勢,反映了觀察值之間的變異情況。極差四分位數(shù)間距方差符號rq2(總體),s2(樣本)計算方法r=q=qu-ql=p75-p252=離均差平方和/n=

6、(x-n)2n s2= (x-)2 (n-1為自由度) n-1應(yīng)用僅用于初步了解資料的變異程度,概括地描述全部數(shù)據(jù)所在范圍。描述偏態(tài)分布以及分布的一端或兩端無確切數(shù)值資料的離散程度。描述對稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的離散程度。說明r大,反映了全部觀察值所在范圍的變異程度大,數(shù)據(jù)較為分散;r小,反映了全部觀察值所在范圍的變異程度小,數(shù)據(jù)較為集中;不能反映組內(nèi)其他觀察值的變異程度。不受兩端極大值或極小值影響,較全距穩(wěn)定,但仍不能概括所有觀察值的變異情況。相同指標,方差越大,說明數(shù)據(jù)圍繞均屬分布越分散,變異程度越大;反之,方差越小,說明數(shù)據(jù)圍繞均屬分布越集中,變異程度越小;續(xù)表標準差變

7、異系數(shù)符號(總體),s(樣本)cv計算方法=s=(直接法)s=(加權(quán)法)cv=100%應(yīng)用描述對稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的離散程度。常用于比較度量單位不同或單位相同均數(shù)相差懸殊的兩組或多組資料的變異程度。說明表示每個觀察值與均數(shù)之間距離(絕對距離)的平均水平。沒有單位,是一種相對變異指標四、正態(tài)分布及其應(yīng)用正態(tài)分布的概念 如果連續(xù)型隨機變量x的概率密度函數(shù)為f(x)=,-x;則稱隨機變量x服從參數(shù)為和的正態(tài)分布,記作xn(,)。式子中為圓周率,e為自然對數(shù)的底,為總體均數(shù),為總體標準差,x為正態(tài)變量。正態(tài)分布的特征正態(tài)曲線:橫軸上方均數(shù)處最高,向兩側(cè)下降,并以均數(shù)為中心,左右對

8、稱,但兩端與橫軸永不相交,呈鐘型曲線。正態(tài)分布有兩個參數(shù),即均數(shù)和標準差。 為位置均數(shù),固定不變時,越大,曲線沿橫軸越向右;反之,越小,曲線沿橫軸越向左。 為形狀均數(shù),固定不變時,越大,曲線越平闊;越小,曲線越尖峭。正態(tài)曲線下面積的分布有一定的規(guī)律。 正態(tài)曲線下一定區(qū)間內(nèi)的面積代表了取值于相應(yīng)區(qū)間內(nèi)的觀察值個數(shù)在全部觀察值總數(shù)中所占的比例(頻率),或者是觀察值落在該區(qū)間內(nèi)的概率。無論和取何值,正態(tài)曲線下面積分布規(guī)律有:正態(tài)曲線與橫軸之間的面積恒等于1或100%正態(tài)分布為對稱分布,其對稱軸兩側(cè)面積各為50%區(qū)間(-,+)的面積為68.27%;區(qū)間(-1.96,+1.96)的面積為95.00%;區(qū)

9、間(-2.58,+2.58)的面積為99。00%;標準正態(tài)分布(教材圖4-4,正態(tài)分布于標準正態(tài)分布曲線)由總體時z=,由樣本估計時z=若x服從正態(tài)分布n(,),則z服從n(0,1)。在區(qū)間(-z,+z)內(nèi),若求一般正態(tài)分布曲線下某區(qū)間內(nèi)面積,則需先進行z變換,然后借助標準正態(tài)分布表(教材附表3)求得。正態(tài)分布的應(yīng)用估計正態(tài)分布或近似正態(tài)分布資料的頻數(shù)分布 舉例:求在某值及其以下者所占比例、求在某范圍內(nèi)者所占比例、求大于等于某值者所占比例。制定醫(yī)學參考值范圍(正常值范圍)制定醫(yī)學參考值范圍時:確定一批樣本含量足夠大的“正常人”;根據(jù)研究目的和使用要求選定適當?shù)陌俜纸缰?,常?5%;根據(jù)專業(yè)知識確定單側(cè)或雙側(cè)界值;根據(jù)資料分布特點,選用恰當?shù)挠嬎惴椒?。制定醫(yī)學參考值范圍的常用方法有:正態(tài)分布法(適用于正態(tài)分布或近似正態(tài)分布的資料) 雙側(cè)界值:z/2s 單側(cè)上界:+ zs或單側(cè)下界:- zsz和z/2為標準正態(tài)分布在給定小概率(如=0.05)時相應(yīng)的單側(cè)界值或雙側(cè)界值。z表示zz或z-z的概率為,只考慮單側(cè)尾部的概率分布。z/2表示zz/2和zz/2的概率為,同時考慮兩側(cè)尾部的概率分布。常用z值表參考值范圍單側(cè)雙側(cè)800.8421.28290

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論