醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)描述_第1頁
醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)描述_第2頁
醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)描述_第3頁
醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)描述_第4頁
醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)描述_第5頁
已閱讀5頁,還剩121頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一、數(shù)值變量資料的統(tǒng)計描述——頻數(shù)表的編制方法

﹡找全距(R) R=最大值—最小值

﹡定組距(i) i=全距/組數(shù)

﹡寫組段 第一組組段包括最小值 最后一組組段包括最大值

﹡劃記 各組段的觀察單位數(shù)即各組段的頻數(shù)第1頁/共125頁第一頁,共126頁?!l數(shù)分布的特征

﹡集中趨勢 變量值集中分布的位 置

﹡離散趨勢 變量值圍繞集中位置 的分布情況——頻數(shù)分布的類型

﹡對稱分布(見表、圖)第2頁/共125頁第二頁,共126頁。某地區(qū)130名正常成年男子紅細(xì)胞數(shù)(1012/L)的頻數(shù)分布紅細(xì)胞數(shù) 劃記 頻數(shù)

(1) (2) (3) 3.70~ || 2 3.90~ |||| 4 4.10~ 正|||| 9 4.30~ 正正正| 16 4.50~ 正正正正|| 22 4.70~ 正正正正正 25 4.90~ 正正正正| 21 5.10~ 正正正|| 17 5.30~ 正|||| 9 5.50~ |||| 4 5.70~5.90 | 1

合計 —— 130第3頁/共125頁第三頁,共126頁。﹡偏態(tài)分布

正偏態(tài)分布238名正常人發(fā)汞值(μg/g)的中位數(shù)和百分位數(shù)的頻數(shù)表計算發(fā)汞值 頻數(shù) 累計頻數(shù) 累計頻率(%)(1) (2) (3) (4)=(3)/2380.3~ 20 20 8.40.7~ 66 86 36.11.1~ 60 146 61.31.5~ 48 194 81.51.9~ 18 212 89.12.3~ 16 228 95.82.7~ 6 234 98.33.1~ 1 235 98.73.5~ 0 235 98.73.9~4.3 3 238 100.0第4頁/共125頁第四頁,共126頁。負(fù)偏態(tài)分布某些青年惡性腫瘤死亡率的年齡分布 年齡組 惡性腫瘤死亡率1/10萬

0~ 0.5 10~ 12 20~ 15 30~ 76 40~ 189 50~ 234 60~ 386 70~ 286

第5頁/共125頁第五頁,共126頁。二、集中趨勢(Centraltendency)的描述平均數(shù)(average)常用于描述一組變量值的集中趨勢,是反映同質(zhì)資料的平均水平或集中位置的特征值。 均數(shù) 常用平均數(shù) 幾何均數(shù) 中位數(shù)第6頁/共125頁第六頁,共126頁。常用平均數(shù)——均數(shù)(算術(shù)均數(shù))(mean)﹡表示符號 總體均數(shù)(μ)

樣本均數(shù)(χ)﹡應(yīng)用 對稱分布資料,尤其是正態(tài)分布資料﹡計算方法

χ1+χ2+……+χn∑χ

直接法χ== n n f1χ1+f2χ2+……+fkχk∑fχ

加權(quán)法χ= = f1+f2+……+fk n第7頁/共125頁第七頁,共126頁。常用平均數(shù)——幾何均數(shù)(geometricmean)﹡表示符號 (G)﹡應(yīng)用 變量值呈倍數(shù)關(guān)系,對數(shù)正態(tài)分布資料﹡計算方法 直接法 G=n√x1·x2…xn lgx1+lgx2+…+lgxn

∑lgx加權(quán)法 G=lg–1 =lg–1 nn

f1lgx1+f2lgx2+…+fklgxk

∑flgx G=lg–1 =lg–1 nn第8頁/共125頁第八頁,共126頁。常用平均數(shù)——中位數(shù)(median)﹡表示符號 (M)

偏態(tài)分布資料﹡應(yīng)用 變量值分布一端或兩端無確定數(shù)值 分布不明資料﹡計算方法

直接用變量值計算 M=Xn+1(n為奇數(shù)時)

2

1

或 M= Xn+Xn+1(n為偶數(shù)時) 222第9頁/共125頁第九頁,共126頁。 i n用頻數(shù)表計算 M=L+ (—∑fL) fx2附:百分位數(shù)(Percentile,Px)

描述變量值序列在某百分位位置的水平,多個百分位數(shù)結(jié)合可更全面地描述變量值的分布特征。

i Px=L+ (n·x%—∑fL) fx第10頁/共125頁第十頁,共126頁。三、離散趨勢(fendencyofdispersion)

描述變量值的離散趨勢用變異指標(biāo) 全距 常用變異指標(biāo) 標(biāo)準(zhǔn)差 變異系數(shù) 四分位數(shù)間距第11頁/共125頁第十一頁,共126頁。常用變異指標(biāo)——全距(range,簡記為R) ﹡反映變量值的變異范圍

﹡R=最大值—最小值

﹡各種類型資料都可應(yīng)用,但只作 參考資料第12頁/共125頁第十二頁,共126頁。常用變異指標(biāo)——方差(variance)和 標(biāo)準(zhǔn)差(standarddeviation)﹡定義公式 ∑(χ—μ)2 ∑(χ—μ)2

σ2= σ= N √N ∑(χ—χ)2 ∑(χ—χ)2S2= S= n—1√n—1第13頁/共125頁第十三頁,共126頁。﹡應(yīng)用公式

∑χ2—(∑χ)2/n直接法 S=

√ n—1

∑fχ2—(∑f

χ)2/n加權(quán)法 S=

√ n—1第14頁/共125頁第十四頁,共126頁?!讲詈蜆?biāo)準(zhǔn)差

﹡用途

1.表示變量值的離散程度,用于兩組 變量值比較時,要求其性質(zhì)相同, 均數(shù)相差不大

2.與均數(shù)結(jié)合,表示均數(shù)的代表性

(χ±s)第15頁/共125頁第十五頁,共126頁。常用變異指標(biāo)——變異系數(shù)(coefficientofvariation, 簡記為CV) ﹡定義:CV=s/χ×100% ﹡用途:比較兩組或多組單位不同 或均數(shù)相差較大資料的變 異程度第16頁/共125頁第十六頁,共126頁。常用變異指標(biāo)——四分位數(shù)間距(quartile,簡記為Q)﹡四分位數(shù)間距為特定的百分位數(shù),可看作為中間1/2變量值的全距

Q=Qu—QL Qu=P75(上四分位數(shù)) QL=P25(下四分位數(shù))

﹡用途:用于表示偏態(tài)分布資料的變異程度,常與中位數(shù)配合使用第17頁/共125頁第十七頁,共126頁。

正態(tài)分布及其應(yīng)用——正態(tài)分布的概念和特征

﹡正態(tài)分布是以均數(shù)為中心呈對稱的鐘型分布

﹡正態(tài)分布的特征有:

1)正態(tài)分布曲線在均數(shù)處最高

2)正態(tài)分布以均數(shù)為中心,左右對稱且逐漸減少

3)正態(tài)分布曲線的兩個參數(shù)μ和σ,記作N(μ,σ) 4)正態(tài)曲線下的面積為1(或100%)第18頁/共125頁第十八頁,共126頁。正態(tài)分布第19頁/共125頁第十九頁,共126頁。正態(tài)分布正態(tài)分布函數(shù)第20頁/共125頁第二十頁,共126頁。正態(tài)曲線下的面積分布規(guī)律:

μ±1σ 占正態(tài)曲線下面積的68.27%μ±1.96σ 占正態(tài)曲線下面積的95.00%μ±2.58σ 占正態(tài)曲線下面積的99.00%

若樣本含量較大(n>100),則上式μ可用χ代替,σ用s代替。則上式可寫為:

χ±1S 占正態(tài)曲線下面積的68.27%χ±1.96S 占正態(tài)曲線下面積的95.00%χ±2.58S 占正態(tài)曲線下面積的99.00%第21頁/共125頁第二十一頁,共126頁?!獦?biāo)準(zhǔn)正態(tài)分布

﹡標(biāo)準(zhǔn)正態(tài)分布為服從均數(shù)為0,標(biāo)準(zhǔn)差為1,即N(0,1)的正態(tài)分布

其轉(zhuǎn)換公式為:u=χ--μ/σ﹡標(biāo)準(zhǔn)正態(tài)曲線的面積分布規(guī)律: -1<u<+1 占總面積的68.27% -1.96<u<+1.96 占總面積的95.00% -2.58<u<+2.58 占總面積的99.00%第22頁/共125頁第二十二頁,共126頁。標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)函數(shù)其中Z=(X-μ)/σ

第23頁/共125頁第二十三頁,共126頁。

標(biāo)準(zhǔn)正態(tài)分布第24頁/共125頁第二十四頁,共126頁。——正態(tài)分布的應(yīng)用與臨床參考值的確定

﹡正態(tài)曲線面積分布規(guī)律可用于估計醫(yī)學(xué)臨床參考值與質(zhì)量控制

﹡臨床參考值的確定方法1)正態(tài)分布法:用于正態(tài)分布的資料雙側(cè)參考值 χ±UαS

單側(cè)參考值 >χ--UαS

或<χ+UαS 第25頁/共125頁第二十五頁,共126頁。2)百分位數(shù)法:用于偏態(tài)分布資料雙側(cè)參考值(α=0.05) P2.5~P97.5

單側(cè)參考值(α=0.05) >P5

或<P95第26頁/共125頁第二十六頁,共126頁。常用統(tǒng)計指標(biāo)集中趨勢算術(shù)平均數(shù)中位數(shù)幾何平均數(shù)離散趨勢全距平均差方差與標(biāo)準(zhǔn)差第27頁/共125頁第二十七頁,共126頁。1.集中趨勢集中趨勢(measuresofcentraltendency)是代表一組數(shù)據(jù)典型水平或集中趨勢的量。它能反映頻數(shù)分布中大量數(shù)據(jù)向某一點集中的情況。集中趨勢包括算術(shù)平均數(shù)、加權(quán)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)、中位數(shù)、眾數(shù)等。第28頁/共125頁第二十八頁,共126頁。算術(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticmean)是所有觀察值的總和除以總頻數(shù)所得之商,簡稱為平均數(shù)或均數(shù)。第29頁/共125頁第二十九頁,共126頁。算術(shù)平均數(shù)的優(yōu)點反應(yīng)靈敏;嚴(yán)密確定,簡明易懂,計算方便;適合代數(shù)運算;受抽樣變動的影響較??;樣本算術(shù)平均數(shù)是總體平均數(shù)的最好估計值第30頁/共125頁第三十頁,共126頁。算術(shù)平均數(shù)的缺點易受兩極端數(shù)值(極大或極小)的影響;某村農(nóng)戶收入狀況

120,127,130,131,132,132,135,136,137,139,140,145,146,149,153,158,160,320,400平均數(shù)=162.63一組數(shù)據(jù)中某個數(shù)值的大小不夠確切時就無法計算其算術(shù)平均數(shù)。第31頁/共125頁第三十一頁,共126頁。中位數(shù)中位數(shù)(median)是位于依一定順序排列的一組數(shù)據(jù)中央位置的數(shù)值,在這一數(shù)值上、下各有一半頻數(shù)分布著。中位數(shù)的原始數(shù)值計算方法:

121415151718202324:17

12141515171820232425:17.5中位數(shù)的應(yīng)用及其優(yōu)缺點第32頁/共125頁第三十二頁,共126頁。中位數(shù)的應(yīng)用及其優(yōu)缺點中位數(shù)雖然也具備一個良好的集中量所應(yīng)具備的某些條件,例如比較嚴(yán)格確定、簡明易懂,計算簡便,受抽樣變動影響較小,但是它不適合進(jìn)一步的代數(shù)運算。它適用于以下幾種情況:一組數(shù)據(jù)中有特大或特小兩極端數(shù)值時;一組數(shù)據(jù)中有個別數(shù)據(jù)不確切時;資料屬于等級性質(zhì)時。第33頁/共125頁第三十三頁,共126頁。幾何平均數(shù)幾何平均數(shù)(geometricmean)是N個數(shù)值連乘積的N次方根。計算公式為

當(dāng)一個數(shù)列的后一個數(shù)據(jù)是以前一個數(shù)據(jù)為基礎(chǔ)成比例增長時,要用幾何平均數(shù)求其平均增長率。第34頁/共125頁第三十四頁,共126頁。2.離散趨勢離散趨勢:用于表示數(shù)據(jù)的變異程度或離散程度。常用的差異量有全距、平均差、方差、標(biāo)準(zhǔn)差和變異系數(shù)等。第35頁/共125頁第三十五頁,共126頁。全距全距(range)指一組數(shù)據(jù)中最大值與最小值之差。優(yōu)點:概念清楚,意義明確,計算簡單;缺點:容易受極端數(shù)值的影響,反應(yīng)不靈敏。第36頁/共125頁第三十六頁,共126頁。平均差平均差(averagedeviation)就是每一個數(shù)據(jù)與該組數(shù)據(jù)的中位數(shù)(或算術(shù)平均數(shù))離差的絕對值的算術(shù)平均數(shù)。計算公式:第37頁/共125頁第三十七頁,共126頁。方差和標(biāo)準(zhǔn)差方差(variance)指離差平方的算術(shù)平均數(shù)定義公式和計算公式:第38頁/共125頁第三十八頁,共126頁。標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standarddeviation)是指離差平方和平均后的方根。即方差的平方根。定義公式和計算公式:第39頁/共125頁第三十九頁,共126頁。樣本的方差與標(biāo)準(zhǔn)差樣本的方差樣本的標(biāo)準(zhǔn)差第40頁/共125頁第四十頁,共126頁。變異系數(shù)變異系數(shù)(coefficientofvariation):標(biāo)準(zhǔn)差與其算術(shù)平均數(shù)的百分比。其計算公式為用途:兩種單位不同單位相同而兩個平均數(shù)相差較大的資料。第41頁/共125頁第四十一頁,共126頁。位置量**百分位數(shù)(percentile)--頻數(shù)分布中相對于某個特定百分點的原始分?jǐn)?shù),它表明在分布中低于該分?jǐn)?shù)的個案占總頻數(shù)的百分比。

中位數(shù)與四分位數(shù)(quartile)百分等級(percentilerank)--頻數(shù)分布中低于特定原始分?jǐn)?shù)的頻數(shù)百分比。第42頁/共125頁第四十二頁,共126頁。ContentFrequencedistributionDescriptionofcentraltendencyMeasuresofdispersionNormaldestributionRangeofreferencevalue第43頁/共125頁第四十三頁,共126頁。實際例子1一、頻數(shù)分布一、頻數(shù)分布表(frequencytable):例1從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇()的測量結(jié)果如下,試編制頻數(shù)分布表。第44頁/共125頁第四十四頁,共126頁。第45頁/共125頁第四十五頁,共126頁。

編制步驟如下:1.求極差:

極差(range)也稱全距,即最大值和最小值之差,記作R。本例:。第46頁/共125頁第四十六頁,共126頁。

2.確定組距(i):組段數(shù)通常取組10-15組本例組距

3.寫組段:組下限(L):每個組段的起點組上限(U):每個組段的終點

第47頁/共125頁第四十七頁,共126頁。

組段

2.30~

2.60~

2.90~

3.20~

…5.60~5.902.30~2.60~第48頁/共125頁第四十八頁,共126頁。

4.分組段劃記并統(tǒng)計頻數(shù)第49頁/共125頁第四十九頁,共126頁。

2.30~2.60~頻數(shù)表:由各組段及其頻數(shù)所構(gòu)成的統(tǒng)計表。第50頁/共125頁第五十頁,共126頁。二、頻數(shù)分布圖第51頁/共125頁第五十一頁,共126頁。三、頻數(shù)表和頻數(shù)分布圖用途

1.描述頻數(shù)分布的類型(1)對稱分布:若各組段的頻數(shù)以頻數(shù)最多組段為中心左右兩側(cè)大體對稱,就認(rèn)為該資料是對稱分布第52頁/共125頁第五十二頁,共126頁。

(2)偏態(tài)分布:1)右偏態(tài)分布(skewedtotherightdistribution)也稱正偏態(tài)分布(positiveskewnessdistribution):右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾第53頁/共125頁第五十三頁,共126頁。

2)左偏態(tài)分布(skewedtotheleftdistribution)也稱負(fù)偏態(tài)分布(negativeskewnessdistribution):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾第54頁/共125頁第五十四頁,共126頁。

2.描述頻數(shù)分布的特征①變異的范圍在2.30~5.90②有明顯的統(tǒng)計分布規(guī)律,數(shù)據(jù)主要集中在3.50~4.70之間,尤以組段的人數(shù)3.80~4.10最多,且上下組段數(shù)的頻數(shù)分布基本對稱。第55頁/共125頁第五十五頁,共126頁。

3.便于發(fā)現(xiàn)一些特大或特小的可疑值

4.便于進(jìn)一步做統(tǒng)計分析和處理第56頁/共125頁第五十六頁,共126頁。實際例子2

集中趨勢的描述

統(tǒng)計上使用平均數(shù)(average)這一指標(biāo)體系來描述一組變量值的集中位置或平均水平。常用的平均數(shù)有:

算術(shù)均數(shù)幾何均數(shù)中位數(shù)第57頁/共125頁第五十七頁,共126頁。一、算術(shù)均數(shù)算術(shù)均數(shù):簡稱均數(shù)(mean)可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平或者說是集中位置的特征值。第58頁/共125頁第五十八頁,共126頁。1、計算方法(1)直接計算法公式:第59頁/共125頁第五十九頁,共126頁。例2-2用直接法計算例2-1某單位101名正常成年女子的血清總膽固醇的均數(shù)。

第60頁/共125頁第六十頁,共126頁。

第61頁/共125頁第六十一頁,共126頁。

(2)加權(quán)法:公式:計算4,4,4,6,6,8,8,8,10的均數(shù)?第62頁/共125頁第六十二頁,共126頁。

例2-3利用表2-1計算101名正常成年女子的血總膽固醇的均數(shù)。

第63頁/共125頁第六十三頁,共126頁。

式中k表示頻數(shù)表的組段數(shù),及分別表示各組段的頻數(shù)和組中值,如表2-1第1個組段的組中值為,余類推(見表2-1的第(3)欄)。在這里,頻數(shù)起到了“權(quán)”(weight)的作用,即某個組段頻數(shù)多,權(quán)數(shù)就大,其組中值對均數(shù)的影響也大;反之,影響則小第64頁/共125頁第六十四頁,共126頁。

第65頁/共125頁第六十五頁,共126頁。2、應(yīng)用

適用于對稱分布,特別是正態(tài)分布資料。第66頁/共125頁第六十六頁,共126頁。二、

幾何均數(shù)

幾何均數(shù)(geometricmean):可用于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的變量值在數(shù)量上的平均水平。1、計算方法(1)、直接計算法公式:或第67頁/共125頁第六十七頁,共126頁。例2-4某地5例微絲蚴血癥患者治療七年后用間接熒光抗體試驗測得其抗體滴度倒數(shù)分別為,10,20,40,40,160,求幾何均數(shù)。

第68頁/共125頁第六十八頁,共126頁。(2)加權(quán)法公式:第69頁/共125頁第六十九頁,共126頁。例2-569例類風(fēng)濕關(guān)節(jié)炎(RA)患者血清EBV-VCA-lgG抗體滴度的分布見表2-4第(1)、(2)欄,求其平均抗體滴度。

第70頁/共125頁第七十頁,共126頁。

故例類風(fēng)濕關(guān)節(jié)炎患者血清EBV-VCA-lgG抗體的平均滴度為:1:150.6。第71頁/共125頁第七十一頁,共126頁。

2、應(yīng)用:

適用于成等比級數(shù)的資料,特別是對數(shù)正態(tài)分布資料。第72頁/共125頁第七十二頁,共126頁。三、

中位數(shù)與百分位數(shù)

(一)中位數(shù)中位數(shù)(median):是將變量值從小到大排列,位置居于中間的那個變量值。例:1,3,7,5,>100

中位數(shù)為多少?第73頁/共125頁第七十三頁,共126頁。計算公式:n為奇數(shù)時

n為偶數(shù)時第74頁/共125頁第七十四頁,共126頁。例2-67名病人患某病的潛伏期分別為2,3,4,5,6,9,16天,求其中位數(shù)。

本例n=7,為奇數(shù)例2-78名患者食物中毒的潛伏期分別為1,2,2,3,5,8,15,24小時,求其中位數(shù)。本例n=8,為偶數(shù)第75頁/共125頁第七十五頁,共126頁。應(yīng)用

適用于:1、各種分布類型的資料

2、特別是偏態(tài)分布資料和開囗資料(一端或兩端無確切數(shù)值的資料)。第76頁/共125頁第七十六頁,共126頁。(二)百分位數(shù)

百分位數(shù)(percentile)是一種位置指標(biāo),用來表示。一個百分位數(shù)將全部變量值分為兩部分,在不包含的全部變量值中有的變量值比它小,變量值比它大。第77頁/共125頁第七十七頁,共126頁。1.直接計算法

設(shè)有x個原始數(shù)據(jù)從小到大排列,第x百分位數(shù)的計算公式為:當(dāng)為帶有小數(shù)位時:

當(dāng)為整數(shù)時:第78頁/共125頁第七十八頁,共126頁。例2-9對某醫(yī)院細(xì)菌性痢疾治愈者的住院天數(shù)統(tǒng)計,名患者的住院天數(shù)從小到大的排列如下,試求第5百分位數(shù)和第99百分位數(shù)。

患者:住院天數(shù):

n=120,120X5%=6,為整數(shù):

第79頁/共125頁第七十九頁,共126頁。例2-9對某醫(yī)院細(xì)菌性痢疾治愈者的住院天數(shù)統(tǒng)計,118名患者的住院天數(shù)從小到大的排列如下,試求第5百分位數(shù)和第99百分位數(shù)。

患者:住院天數(shù):,帶有小數(shù),取整后trunc(118.8)=118第80頁/共125頁第八十頁,共126頁。2.頻數(shù)表法公式:式中XL、Xi和Xf分別為第X百分位數(shù)所在組段的下限、組距和頻數(shù),LfS為小于XL各組段的累計頻數(shù),n

為總例數(shù)。

第81頁/共125頁第八十一頁,共126頁。

第82頁/共125頁第八十二頁,共126頁。例2-10某地118名鏈球菌咽喉炎患者的潛伏期頻數(shù)表見表2-5第(1)、(2)欄,試分別求中位數(shù)及第25、第75百分位數(shù)。

第83頁/共125頁第八十三頁,共126頁。

第84頁/共125頁第八十四頁,共126頁。實際例子3

離散趨勢的描述例2-11三組同齡男孩的身高值(cm)第85頁/共125頁第八十五頁,共126頁。

常用統(tǒng)計指標(biāo):

極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。

一、

極差極差,用R表示:即一組變量值最大值與最小值之差。第86頁/共125頁第八十六頁,共126頁。二、四分位數(shù)間距四分位數(shù)間距,用QR表示:QR=下四分位數(shù):上四分位數(shù):第87頁/共125頁第八十七頁,共126頁。

例2-12續(xù)例2-10。已知P25=39.2,P75=67.7,計算118名鏈球菌咽喉炎患者潛伏期的四分位數(shù)間距。

(天)請回答:四分位數(shù)間距可以看成大小在中間的一半變量值的全距(R)。

第88頁/共125頁第八十八頁,共126頁。

四分位數(shù)間距可以看成一半變量值的極差。第89頁/共125頁第八十九頁,共126頁。三、方差與標(biāo)準(zhǔn)差

1、方差(variance)也稱均方差(meansquaredeviation),反映一組數(shù)據(jù)的平均離散水平。

樣本方差用表示第90頁/共125頁第九十頁,共126頁。

2、公式:樣本標(biāo)準(zhǔn)差用表示公式:第91頁/共125頁第九十一頁,共126頁。

標(biāo)準(zhǔn)差的公式還可以寫成:利用頻數(shù)表計算標(biāo)準(zhǔn)差的公式為第92頁/共125頁第九十二頁,共126頁。例2-12續(xù)例2-10,計算三組資料的標(biāo)準(zhǔn)差。

甲組:第93頁/共125頁第九十三頁,共126頁。

第94頁/共125頁第九十四頁,共126頁。四、

變異系數(shù)

變異系數(shù)(coefficientofvariation)記為CV,多用于觀察指標(biāo)單位不同時,如身高與體重的變異程度的比較;或均數(shù)相差較大時,如兒童身高與成人身高變異程度的比較。

第95頁/共125頁第九十五頁,共126頁。

某地7歲男孩身高的均數(shù)為123.10cm,標(biāo)準(zhǔn)差為4.71;體重均數(shù)為22.59kg,標(biāo)準(zhǔn)差為2.26kg,

比較其變異度?

(觀察指標(biāo)單位不同)第96頁/共125頁第九十六頁,共126頁。均數(shù)相差較大時:第97頁/共125頁第九十七頁,共126頁。實際例子4正態(tài)分布第98頁/共125頁第九十八頁,共126頁。正態(tài)分布:又稱為Gauss分布(Gaussiandistribution)。

設(shè)想當(dāng)原始數(shù)據(jù)的頻數(shù)分布圖的觀察人數(shù)逐漸增加且組段不斷分細(xì)時,圖2-4中的直條就不斷變窄,其頂端則逐漸接近于一條光滑的曲線。這條曲線形態(tài)呈鐘形,兩頭低、中間高,左右對稱,近似于數(shù)學(xué)上的正態(tài)分布。在處理資料時,我們就把它看成是正態(tài)分布。第99頁/共125頁第九十九頁,共126頁。一、正態(tài)分布的概念和特征

1.正態(tài)分布曲線的數(shù)學(xué)函數(shù)表達(dá)式如果隨機(jī)變量的分布服從概率密度函數(shù)第100頁/共125頁第一百頁,共126頁。2.正態(tài)分布的特征

第101頁/共125頁第一百零一頁,共126頁。第102頁/共125頁第一百零二頁,共126頁。第103頁/共125頁第一百零三頁,共126頁。(4)正態(tài)曲線下的面積分布有一定的規(guī)律。對公式(2-17)積分:第104頁/共125頁第一百零四頁,共126頁。第105頁/共125頁第一百零五頁,共126頁。第106頁/共125頁第一百零六頁,共126頁。正態(tài)分布是一個分布族,對應(yīng)于不同的參數(shù)m和s會產(chǎn)生不同位置、不同形狀的正態(tài)分布。

第107頁/共125頁第一百零七頁,共126頁。第108頁/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論