標準正態(tài)分布示意圖課件_第1頁
標準正態(tài)分布示意圖課件_第2頁
標準正態(tài)分布示意圖課件_第3頁
標準正態(tài)分布示意圖課件_第4頁
標準正態(tài)分布示意圖課件_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

定量資料的統(tǒng)計描述分析

統(tǒng)計描述統(tǒng)計推斷

統(tǒng)計分析定量資料的統(tǒng)計描述分析統(tǒng)計描述統(tǒng)計推斷統(tǒng)

第一節(jié)頻數(shù)分布表與頻數(shù)分布圖一、頻數(shù)表的制備(一)頻數(shù)表的編制1、計算極差(range)R=最大值-最小值2、確定組距

I=R/組數(shù),組數(shù)=10153、劃分組段每個組段應有一個起始值作為組下限;第一組段應包括最小值,最后組段應包括最大值。4、歸納計數(shù)

第一節(jié)頻數(shù)分布表與頻數(shù)分布圖一、頻數(shù)表的制備

某年某市120名12歲健康男孩身高(cm)測量資料142.3156.6142.7145.7138.2141.6142.5130.5132.1135.5134.5148.8134.4148.8137.9151.3140.8149.8143.6149.0145.2141.8146.8135.1150.3133.1142.7143.9142.4139.6151.1144.0145.4146.2143.3156.3141.9140.7145.9144.4141.2141.5148.8140.1150.6139.5146.4143.8150.0142.1143.5139.2144.7139.3141.9147.8140.5138.9148.9142.4134.7147.3138.1140.2137.4145.1145.8147.9146.7143.4150.8144.5137.1147.1142.9134.9143.6142.3143.3140.2125.9132.7152.9147.9141.8141.4140.9141.4146.7138.7160.9154.2137.9139.9149.7147.5136.9148.1144.0137.4134.7138.5138.9137.7138.5139.6143.5142.9146.5145.4129.4142.5141.2148.9154.0147.7152.3146.6139.2139.9R=160.9–125.9=35I=R/10=35/10=3.5,取整I=4.0

某年某市120名12歲健康男孩身高(cm)頻數(shù)分布表組段組中值 頻數(shù)? ?x

(1) (2)(3)(4)=(2)(3)125 127 1 127129 131 4 524133 135 9 1215137 139 28 3829141 143 35 5005145 147 27 3969149 151 11 1661153 155 4 620157161 159 1 159合計 — 120(?) 17172(

?x)

某年某市120名12歲健康男孩身高(cm)頻數(shù)分布表

(二)頻數(shù)分布的類型1、對稱分布2、偏態(tài)分布對稱分布正偏態(tài)分布負偏態(tài)分布(二)頻數(shù)分布的類型對稱分布正偏態(tài)分布負偏態(tài)分布

(三)頻數(shù)分布表的用途1、揭示資料的分布類型2、頻數(shù)分布的重要特征——集中趨勢(centraltendency)——離散趨勢(tendencyofdispersion)3、便于發(fā)現(xiàn)某些特大或特小的可疑值(三)頻數(shù)分布表的用途

二、連續(xù)型變量的頻數(shù)分布圖(一)等距分組二、連續(xù)型變量的頻數(shù)分布圖

×年×市流行性乙型腦炎患者的年齡分布(二)不等距分組

×年×市流行性乙型腦炎患者的年齡分布

第二節(jié)集中趨勢的描述

平均數(shù)(averageindex):用以描述同質計量資料頻數(shù)分布的集中趨勢,反映一組變量值的平均水平,是一組變量值的代表值。

第二節(jié)集中趨勢的描述

一、算術均數(shù):簡稱均數(shù)。用于描述對稱分布(特別是呈正態(tài)分布)的變量值的平均水平??傮w均數(shù)用希臘字母

表示,樣本均數(shù)用X表示。計算方法:

直接法:x=

x/n,用于變量值個數(shù)不多時例如:現(xiàn)測得8名健康人血液一小時末紅細胞沉降率(血沉)各為:4、7、5、3、10、9、6和7mm/hr。試求其血沉均數(shù)。x=

x/n=(4+7+5+3+10+9+6+7)/8=6.4(mm/hr)

加權法:x=

x/

=

x/n,當變量值個數(shù)較多或變量值為頻數(shù)表資料時例如,某市某年120名12歲健康男孩身高的均數(shù)X=

x/

=

x/n=17172/120=143.10(cm)一、算術均數(shù):簡稱均數(shù)。用于描述對稱分布(特別是呈正

某年某市120名12歲健康男孩身高(cm)頻數(shù)分布表組段組中值 頻數(shù)? ?x

(1) (2)(3)(4)=(2)(3)125 127 1 127129 131 4 524133 135 9 1215137 139 28 3829141 143 35 5005145 147 27 3969149 151 11 1661153 155 4 620157161 159 1 159合計 — 120(?) 17172(

?x)

X=

x/

=

x/n=17172/120=143.10(cm)

某年某市120名12歲健康男孩身高(cm)頻數(shù)二、幾何均數(shù):用G表示。用于描述變量值呈等比數(shù)列,或呈對數(shù)正態(tài)分布或近似對數(shù)正態(tài)分布資料。直接法:G=n

x1x2

x3

xn,G=lg-1(

lgx/n)例如,某地在研究人群中流行性感冒抗體水平的調查中,測得12名兒童的血清對某型病毒之血凝抑制效價的倒數(shù)各為5、5、5、5、5、5、5、10、10、10、20、40,試計算平均血凝抑制效價。X=(5+5+5+5+5+5+5+10+10+10+20+40)/12=10.42G=12

57

103

20

40=7.94二、幾何均數(shù):用G表示。用于描述變量值呈等比數(shù)列,或呈對lgG=lg(12

57

103

20

40)=lg(57

103

20

40)1/12=1/12(7lg5+3lg10+lg20+lg40)=0.89966為簡化計算,可兩邊取對數(shù)G=lg-1(lgG)=lg-10.89966=7.94

加權法:G=lg-1(

lgx/

),當變量值個數(shù)較多或變量值為頻數(shù)表資料時G=12

57

103

20

40=7.94lgG=lg(12571032040)=lg(5

三、中位數(shù)和百分位數(shù):中位數(shù)是一組從小到大順序排列的變量值,位于正中間位置的數(shù)值,亦稱為位置平均數(shù),代號為M。多用于描述偏態(tài)分布資料,或分布不明資料,或一端或兩端無確定數(shù)值的開口資料的集中趨勢。百分位數(shù)代號為PX,是一種位置指標。PX:1,2,3,4,5,6,7,8,9,10,…n100等分P50=

M

三、中位數(shù)和百分位數(shù):中位數(shù)是一組從小到大順序排列小樣本資料中位數(shù)計算方法(直接法):

當例數(shù)n為奇數(shù)時

M=X(n+1)/2

當例數(shù)n為偶數(shù)時

M=[X(n/2)+X(n/2+1)]/2例如,7名某病潛伏期各為1、2、2、3、3、5、15,求其平均潛伏期。X=(1+2+2+3+3+5+15)/7=4.4(天)M=X(n+1/2)=3(天)小樣本資料中位數(shù)計算方法(直接法):

1、離散型變量2、連續(xù)型變量中位數(shù)和百分位數(shù)計算方法(頻數(shù)表法):

PX=L+i(n

x%-

L)/

mL:百分位數(shù)所在組組下限i:百分位數(shù)所在組組距

L:百分位數(shù)所在組上一個組段的累計頻數(shù)

m:百分位數(shù)所在組頻數(shù)

M=L+i(n/2-

L)/

mL:中位數(shù)所在組組下限i:中位數(shù)所在組組距

L:中位數(shù)所在組上一個組段的累計頻數(shù)

m:中位數(shù)所在組頻數(shù)1、離散型變量

238名正常人發(fā)汞的中位數(shù)計算發(fā)汞值 頻數(shù)(?) 累計頻數(shù)(?L)0.3~ 20 200.7~ 66 861.1~ 60 1461.5~ 48 1.9~ 18 2.3~ 16 2.7~ 63.1~ 13.5~ 03.9~ 3 M=1.1+0.4(238/2–86)/60=1.32(g/g)

238名正常人發(fā)汞的中位數(shù)計算

三種常用平均數(shù)平均數(shù) 適用資料 計算方法算術均數(shù) 變量值呈對稱分布 直接法(未分組資料(X) 加權法(分組資料)

幾何均數(shù)等比級資料, 直接法(未分組資料) (G)對數(shù)正態(tài)分布 加權法(分組資料)

中位數(shù) 呈偏態(tài)分布,直接法(未分組資料)(M) 分布不清分布一端無確定值頻數(shù)表法(分組資料)三種常用平均數(shù)第三節(jié)離散程度的指標變異指標:又稱離散指標,用以描述一組同質變量值之間參差不齊的程度,即離散程度(degreeofdispersion)或變異度(degreeofvariation)。例如,兩組新生兒,各有5例,平均出生體重都是3.4公斤甲組2.82.93.43.94.0乙組3.03.23.43.63.8甲的變異程度>乙組第三節(jié)離散程度的指標(一)全距:R(range),亦稱極差。即一組變量值中最大值與最小值之差。R甲=4.0-2.8=1.2R乙=3.8-3.0=0.8優(yōu)點:簡單明了缺點:僅考慮了資料的最大值與最小值,不能反應組內其它數(shù)據的變異程度。一、極差和四分位間距一、極差和四分位間距

(二)四分位間距(inter-quartilerange)1、百分位數(shù)2、四分位數(shù):下四分位數(shù)(QL):P25上四分位數(shù)(QU):P753、四分位間距

QU-QL(二)四分位間距(inter-quartilerang二、方差與標準差:是最常用來衡量變量值間離散程度的變異指標??傮w方差

2,標準差代號

,樣本方差S2,標準差代號S。x-

離均差

x-

離均差之和如對稱則會出現(xiàn)x-

=0

(x-

)2

離均差平方和與變異度及個數(shù)有關(x-

)2/n即方差(variance),總體方差用

2表示

2=

(x-

)2/n數(shù)理統(tǒng)計研究結果,

(x-x)2/n<

(x-

)2/n,因此,s2=

(x-x)2/(n-1),缺點是將單位也進行了平方

=n-1,稱為自由度。二、方差與標準差:是最常用來衡量變量值間離散程度的變異指標

x

2–(x)2/nfx2–(fx)2/fxS=

(x-x)2/(n-1)= = n–1

fx–1

運用:1、用來描述正態(tài)分布資料的變異程度。

2、當資料呈正態(tài)或近似正態(tài)資料時往往將均數(shù)與標準差同時寫出:X

S,表示均數(shù)的代表性。

3、計算變異系數(shù)

4、用標準差估計變量值的頻數(shù)分布

5、用標準差計算標準誤標準正態(tài)分布示意圖課件某年某市120名12歲健康男孩身高(cm)頻數(shù)分布表組段組中值頻數(shù)??xfx2

(1)(2)(3)(4)=(2)(3)(5)=(2)(4)

125127 1127 16129129 131 4524 68644133 135 91215 164025137 139 283829 540988141 143 355005 715715145 147 273969 583443149 151 111661 250811153 155 4620 96100157161159 1159 25181合計 12017172 2461136

(?)(

?x)(

?x2)

2461136-(17172)2/120s=

120-1

某年某市120名12歲健康男孩身高(cm)頻數(shù)分布表三、變異系數(shù):又稱離散系數(shù)。代號為CV。

SCV=100%x

運用:1、比較均數(shù)相差懸殊的幾組資料的變異程度;

2、比較度量衡單位不同的幾組資料的變異程度;例如,某地20歲男子160人,身高均數(shù)為166.06cm,標準差4.95cm;體重均數(shù)53.72kg,標準差4.96kg,試比較身高與體重的變異程度。身高:CV=(4.95/166.06)×100%=2.98%體重:CV=(4.96/53.72)×100%=9.23%三、變異系數(shù):又稱離散系數(shù)。代號為CV。正態(tài)分布及其應用一、正態(tài)分布(normaldistribution):是醫(yī)學和生物學中最常見的總體頻數(shù)分布,以均數(shù)為中心,兩側逐漸下降并對稱,兩端永遠不與橫軸相交。

為了應用方便,常對變量X作u=(X-

)/

變換,使

=0,

=1,則正態(tài)分布轉換為標準正態(tài)分布(或稱U分布),用N(0,1)表示。

正態(tài)分布及其應用

特征:1、均數(shù)處最高;2、以均數(shù)為中心,左右對稱;3、有兩個參數(shù):

;正態(tài)分布用N(

,

)表示

特征:

正態(tài)分布曲線

正態(tài)分布曲線正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下的面積分布有一定規(guī)律:變量值范圍正態(tài)曲線下面積(變量值出現(xiàn)的概率)

1.0

68.27%

1.96

95.00%(警界線)

2.58

99.00%(控制線)面積分布規(guī)律的通式

Z

正態(tài)曲線下面積的分布規(guī)律(68.27%)

(95.00%)1.96(99.00%)2.58正態(tài)曲線面積分布規(guī)律

X

(68.27%)X二、標準正態(tài)分布Z

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論