醫(yī)學(xué)統(tǒng)計學(xué)定量資料的統(tǒng)計描述課件_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)定量資料的統(tǒng)計描述課件_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)定量資料的統(tǒng)計描述課件_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)定量資料的統(tǒng)計描述課件_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)定量資料的統(tǒng)計描述課件_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

定量資料的統(tǒng)計描述1一二請在這里輸入您的主要敘述內(nèi)容整體概述三請在這里輸入您的主要敘述內(nèi)容請在這里輸入您的主要敘述內(nèi)容2引子:變量統(tǒng)計學(xué)

醫(yī)學(xué)統(tǒng)計學(xué)

研究方法定性資料定量資料統(tǒng)計描述統(tǒng)計推斷隨機(jī)性現(xiàn)象概率論數(shù)理統(tǒng)計3例2-2抽樣調(diào)查某地120名18~35歲健康男性居民血清鐵含量(μmol/L),數(shù)據(jù)如下:7.428.6523.0221.6121.3121.46

9.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.524目的:提取該組男性居民血清鐵的分布信息。問題1.該組男性血清鐵是怎樣分布的?問題2.血清鐵主要集中在哪個范圍?頻數(shù)表頻數(shù)分布圖問題4.變異情況?最高?最低?問題3.該組男性血清鐵的平均水平?離散趨勢集中趨勢5統(tǒng)計描述:從數(shù)據(jù)資料中獲取信息最基本的方法把握資料基本的特征為統(tǒng)計分析打下基礎(chǔ)頻率表與頻率分布圖描述性統(tǒng)計指標(biāo)統(tǒng)計表與統(tǒng)計圖包括集中趨勢的描述離散趨勢的描述6第一節(jié)頻率分布表與頻率分布圖7頻數(shù)(frequency):指在一個抽樣資料中,某變量值出現(xiàn)的次數(shù)。(一)離散型定量變量的頻率分布:例2-11998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,78頻率分布表(frequencydistributiontable):

將當(dāng)變量值的個數(shù)較多時,對各變量出現(xiàn)的頻率列表即為頻率分布表,簡稱頻率表。頻率是表示頻數(shù)出現(xiàn)機(jī)率的指標(biāo),可用百分?jǐn)?shù)或小數(shù)表示,頻率的和為100%或1。

.頻數(shù)表作用:簡化數(shù)據(jù),方便閱讀;顯示數(shù)據(jù)的分布類型和分布特征。910頻率直條圖(frequencydistributionfigure)

:根據(jù)頻數(shù)分布表,以變量值為橫坐標(biāo),頻數(shù)為縱坐標(biāo),繪制的直方圖。圖2-1某地96名婦女產(chǎn)前檢查次數(shù)頻率分布頻率(%)產(chǎn)前檢驗(yàn)次數(shù)11例2-2抽樣調(diào)查某地120名18~35歲健康男性居民血清鐵含量(μmol/L),數(shù)據(jù)如下:7.428.6523.0221.6121.3121.46

9.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.5212求全距列表劃記步驟:寫組段定組距137.428.6523.0221.6121.3121.46

9.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52⒈求全距(Range,簡記R):是一組資料中最大值(Xmax)與最小值(Xmin)之差,亦稱極差。R=Xmax-Xmin=29.64–7.42=22.22(μmol/L

)142.定組距:將全距分為若干段,稱為組段。每個組段有其上限和下限,上限和下限之差

為組距,用小寫i表示。原則:(1)“組段”數(shù)一般為10個左右,;

(2)一般用等距分組;

(3)“組距”一般為R/10取整。本例題:組距(i)=全距/預(yù)分組段=22.22

/10=2.22≈2153.寫組段:即確定各組段的上、下限。原則:(1)第一組段要包括Xmin,最末組段包括

Xmax;(2)每組段均用下限值加

“~

”表示,最終組段同時注明上下限。

注:各組段連續(xù)但不能重疊,每一組段均為半開半閉區(qū)間。0164.

列表劃記:用劃記的方法整理原始資料,清點(diǎn)各組段內(nèi)的數(shù)據(jù)頻數(shù)。組段劃記頻率(1)(2)6~

18~310~正612~正814~正正1216~正正正正2018~正正正正正2720~正正正1822~正正1224~正826~428~301合計120表2-2120名正常成年男子血清鐵含量(μmol/L

)頻數(shù)17另:用計算各組段的頻率、累計頻數(shù)和累計頻率。18頻率直方圖(frequencydistributionfigure)

:圖2-2120例健康成年男子血清鐵含量(μmol/L

)的頻率分布圖791113151719212325272919頻率密度圖

:以變量值為橫坐標(biāo),以頻率與組距的比值為縱坐標(biāo)作出的直方圖。1.由于該直方圖的縱軸表示在每個組段內(nèi)單位長度所占有的頻率,相當(dāng)于頻率密度,因此將此圖稱為頻率密度圖。

面積=頻率由于頻率總和為100%或1,故該曲線下橫軸面積為100%或1。

.7

911131517192123252729圖2-2120例健康成年男子血清鐵含量(μmol/L

)的頻率密度分布圖20(三)頻率分布表/圖的用途:1.揭示資料的分布類型7

911131517192123252729圖2-2120例健康成年男子血清鐵含量(μmol/L

)的頻率密度分布圖對稱分布21頻數(shù)分布偏峰分布正偏負(fù)偏集中部位在中部,兩端漸少,左右兩側(cè)的基本對稱,為對稱(正態(tài))分布。

對稱分布集中部位偏于較小值一側(cè)(左側(cè)),較大值方向漸減少,為正偏峰分布。集中部位偏于較大值一側(cè)(右側(cè)),較小值方向漸減少,為負(fù)偏峰分布。222.描述資料的分布特征離散趨勢(tendencyofdispersion)集中趨勢與離散趨勢結(jié)合能全面反映頻數(shù)的分布特征集中趨勢(centraltendency)

7911131517192123252729分布特征234.樣本含量足夠大時,以頻率作為概率的估計值。3.便于發(fā)現(xiàn)某些特大或特小的可疑值。5.作為陳述資料的形式。

圖3.1某市101名8歲男童身高(cm)的頻數(shù)分布身高(cm)頻數(shù)24第二節(jié)描述集中趨勢的統(tǒng)計指標(biāo)25算術(shù)均數(shù)幾何均數(shù)中位數(shù)集中趨勢:用于描述一組計量資料的集中位置,說明這種變量值大小的平均水平,常用平均數(shù)(average)表示。

注意:1.同質(zhì)的事物或現(xiàn)象才能求平均數(shù)平均數(shù)單峰對稱分布(正態(tài)分布)對數(shù)正態(tài)分布偏態(tài)分布

2.應(yīng)根據(jù)資料分布狀態(tài)選用適當(dāng)?shù)木鶖?shù)。26(一)算術(shù)平均數(shù)(arithmeticmean)●簡稱:均數(shù)(mean)●使用條件:數(shù)據(jù)分布比較均勻呈正態(tài)分布或近似正態(tài)分布?!駱颖揪鶖?shù)用符號:X

表示●總體均數(shù)用符號:μ表示●計算方法有兩種:直接法(小樣本)和加權(quán)法(大樣本)27舉例:某地10名18歲健康男大學(xué)生身高為(cm):168.7,178.4,170.0,170.4,172.1,167.6,172.4,170.7,177.3,169.7求平均身高?10X)(171.7cm=7169.4178.168.7+++=答:28(1)直接法:方法:將觀察值X1、X2、X3、……、Xn直接相加,再除以觀察值的個數(shù)n。公式:適用范圍:小樣本資料,n<3029例2-2抽樣調(diào)查某地120名18~35歲健康男性居民血清鐵含量(μmol/L),求平均數(shù):7.428.6523.0221.6121.3121.46

9.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.5230(2)頻率表法(加權(quán)法):計算各組段的組中值xi、fxi和Σfx答:(μmol/L)31頻率表法:方法:計算各組段的組中值xi、Σfxi,后除以總頻數(shù)Σf。公式:適用范圍:樣本含量較大的數(shù)據(jù)集。32算術(shù)平均數(shù)的適用范圍:

它適用描述一組性質(zhì)相同的、單峰、且對稱分布的(特別是正態(tài)分布的),且觀察值之間差異不大的定量資料,此時均數(shù)最能反映分布的集中趨勢,位于分布的中心。

33練習(xí):求120例正常人血漿125I-T3樹脂攝取比值的均數(shù)34答:(一)編制頻數(shù)分布表:全距(R)=Xmax-Xmin=1.24

–0.78=0.461.求全距(R):擬分10組2.定組距(i):組距(i)=全距/預(yù)分組段=0.46

/10≈0.053.定組段:0.75組距0.05,故各組段依次為:最末組段包括最大值1.240.90~0.95~1.00~1.05~1.10~1.15~1.20~1.25第一組包括最小值:0.780.80~0.85~353.劃表列記:36(二)用加權(quán)法計算均值:均值:37舉例:設(shè)有5份血清樣品,滴度分別為:

1:1,1:10,1:100,1:1000,1:10000

求其平均滴度。幾何均數(shù)38(二)幾何均數(shù)(geometricmean,G)●

概念:對一組觀察值,先進(jìn)行對數(shù)變換,按算術(shù)均數(shù)計算方法求其對數(shù)值的均數(shù),該均數(shù)的反對數(shù)值即幾何均數(shù)(G)?!袷褂脳l件:用于原始數(shù)據(jù)分布呈偏態(tài)分布,等比資料(倍數(shù)變化)或?qū)?shù)正態(tài)分布資料的平均數(shù)的計算?!癖硎痉枺篏●計算方法:直接法和加權(quán)法39(1)直接法:方法:將n個觀察值(X1,X2,X3,……Xn)直接相乘再開n次方。公式:適用范圍:小樣本資料用對數(shù)形式表示為:40舉例:設(shè)有5份血清樣品,滴度分別為:

1:1,1:10,1:100,1:1000,1:10000

求其平均滴度。答:G=或G=lg-1((lg1+lg10+lg100+lg1000+lg10000)/5)=lg-1((0+1+2+3+4)/5)=lg-12=100即:平均滴度為1:100;較好地代表了觀察值的平均水平。

41(2)頻率表法:公式:適用范圍:大樣本含量的分組資料或頻數(shù)表資料。G=lg-1

(ΣflgX/Σf)42答:即52例慢性肝炎患者的HBsAg滴度的幾何均數(shù)為1:119.75。例2-652例慢性肝炎患者的HBsAg滴度數(shù)據(jù)如下表示,試計算滴度的平均數(shù)。43計算幾何均數(shù)(G)注意事項:(1)觀察值不能為0;(2)觀察值不能同時有正有負(fù);(3)同一組資料求得的幾何均數(shù)小于算術(shù)均數(shù)。44練習(xí)題:1.有8份血清的抗體效價分別為:

1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640

求平均抗體效價。2.有50人的血清抗體效價,分別為:

5人1:10,9人1:20,20人1:40,10人1:80,6人1:160

求平均抗體效價。45解答:1.有8份血清的抗體效價分別為:

1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640

求平均抗體效價。答:將各抗體效價的倒數(shù)代入公式:所以血清的抗體平均為1:56.5746解答:2.有50人的血清抗體效價,分別為:

5人1:10,9人1:20,20人1:40,10人1:80,6人1:160

求平均抗體效價。答:將各抗體效價的倒數(shù)代入公式:所以該50人的血清抗體效價為1:41.7047123456789“中位數(shù)”的概念48P50=M

050100小大P0

P50P100中位數(shù)49(三)中位數(shù)(Median,M)●概念:將原始觀察值從小到大排序后,位次居中的那個數(shù)叫中位數(shù),用M表示?!袷褂脳l件:適用于任何分布的定量資料,特別是偏態(tài)分布、末端分布有特大特小值或無法確定、甚至分布不清的資料?!癖硎痉枺篗●計算方法:直接法和加權(quán)法50(1)直接法:由原始數(shù)據(jù)計算中位數(shù)M=X當(dāng)n為奇數(shù)時:當(dāng)n為偶數(shù)時:n+12n2+1M=(X+X

)n212舉例:有7個人的血壓(收縮壓mmHg)測定值為:120,123,125,127,128,130,132求中位數(shù)

?

排序后取中間,即M=X=127(mmHg)答:()27+151練習(xí):1.某病患者9名,發(fā)病潛伏期分別為順序

2、3、3、3、4、5、6、9、16d,求中位數(shù)。2.某病患者8名,發(fā)病潛伏期從小到大排分別為

5、6、8、9、11、11、13、16d,

求平均潛伏期。52答案:53(2)用頻數(shù)表法計算中位數(shù)Px百分位數(shù)(Percentile,Px):一個數(shù)值,它將原始觀察值分成兩部分,理論上有x%的值小于Px,另有1-x%的觀察值大于Px,故它是一個位置指標(biāo)。P50=Mx%1-x%54Px

所在組段的組距Px

所在組段的下限Px

所在組段的頻數(shù)

FL為小于

L

的各組段累計頻數(shù)百分位數(shù)(Px

)計算公式:55例2-8:50例鏈球菌咽峽炎患者的潛伏期(小時)如下表示,試計算潛伏期的中位數(shù)、P5、P95。答:即:該組潛伏期資料的中位數(shù)是54.55小時。563.

同樣方法,可求P5、P95

:57練習(xí):求238名正常人發(fā)汞值的中位數(shù)M和百分位數(shù)P25、P7558M(P50)=1.1+(238/2-86)=1.32(μg/g)0.460P25=0.7+(238×25%-20)=0.94(μg/g)0.466P75=0.7+(238×75%-146)=1.77(μg/g)0.448答案:59中位數(shù)的特點(diǎn)及應(yīng)用:特點(diǎn):中位數(shù)是一位置指標(biāo),它對信息資料的利用率較低,故準(zhǔn)確度不算術(shù)均數(shù)、幾何均數(shù)。.應(yīng)用:1.適用于任何分類類型的資料。2.常但更常用于描述:偏峰分布資料分布的一端或兩端無確定值的資料分布不清資料

.60例2-11998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料:眾數(shù)61(四)眾數(shù)(Mode)●概念:

總體眾數(shù)指在總體中出現(xiàn)機(jī)會最高的數(shù)值。樣本眾數(shù)指在樣本中出現(xiàn)次數(shù)最多的數(shù)值。62偏峰分布正態(tài)分布問:算術(shù)均數(shù)、中位數(shù)及眾數(shù)在以下分布中的大小關(guān)系?63第三節(jié)描述離散趨勢的統(tǒng)計指標(biāo)64舉例:有三組數(shù)據(jù)A組:26,28,30,32,34B組:24,27,30,33,36C組:26,29,30,31,34

集中C組:A組:B組:RA=8RB=12RC=

8

變異度65

說明集中趨勢是數(shù)據(jù)分布的一個重要特征,但單有集中趨勢指標(biāo)還不能很好地描述數(shù)據(jù)的分布規(guī)律。而且還要看數(shù)據(jù)的變異程度。觀察值的離散趨勢離散程度大說明均數(shù)代表性差離散程度小說明均數(shù)代表性好66離散趨勢:用于描述一組數(shù)值變量觀察值之間參差不齊的程度,即變異程度。包括極差(Range,

R)四分位數(shù)間距(Quartile,

Q)方差(Variance,)標(biāo)準(zhǔn)差(Standarddeviation,S2)變異系數(shù)(Coefficientofvariation,CV)67(一)極差(Range,簡稱R)●計算:R=最大值-最小值=Xmax-Xmin

●意義:反映觀察值的全范圍?!駰l件:對各種分布類型資料都適用。●優(yōu)點(diǎn):計算簡單,方便使用?!袢秉c(diǎn):只利用最大值和最小值的信息,不能反映其它觀察值的變異情況。●建議:與其他離散指標(biāo)共同使用。682.樣本例數(shù)越多,抽到極大值和極小值的可能性越大,故樣本例數(shù)懸殊時不易比較極差。極差的缺點(diǎn):1.R只考慮最大值和最小值之差,不能反映組內(nèi)其它觀察值的變異度。3.即使樣本例數(shù)不變,極差的抽樣誤差亦較大,即不夠穩(wěn)定。乙:甲:69四分位數(shù)間距(Quartilerange,用Q表示)小大1255075100P1

P25

P50

P75

P100QLQU下四分位數(shù)

上四分位數(shù)QU–

QL=四分位數(shù)間距70(二)四分位數(shù)間距(Quartile,簡稱Q)●計算:Q=QU-QL=P75-P25●意義:中間一半觀察值的極差?!駰l件:對各種分布類型的資料都適用,但常用于偏峰分布資料。●優(yōu)點(diǎn):類似R值但比其穩(wěn)定?!袢秉c(diǎn):仍未考慮資料中每個觀察值的變異度。●建議:與其他離散指標(biāo)共同使用。71例2-8:50例鏈球菌咽峽炎患者的潛伏期(小時)如下表示,試計算潛伏期的四分位數(shù)間距。P25P75四分位數(shù)間距Q=QU

QL=P75-P25722.求P25、P75

:1.求P25、P75

:Q=P75-P25=73.20-40.91=32.29(小時)73(三)方差(Variance,簡稱)公式及來源:極差和四分位間距未考慮全部觀察值的變異度全面地考慮每個變量值的離散情況為了衡量每個變量值的變異;先選擇一個數(shù)值作為比較標(biāo)準(zhǔn);誰合適呢?均數(shù)最有代表性。74應(yīng)考慮總體中每個變量值x與總體均數(shù)μ之差;x-μ稱為離均差。為解決這個問題,給每項離均差平方后再相加,稱離均差平方和,

即∑(x-μ)2,可表示為SS或Lxx。但每個變量值與均數(shù)相減所得差值有正有負(fù),有,這樣就不能反映變異的大小。75甲:2628303234證明:∑(x-μ)2≠0∑(x-μ)2稱為離均差平方和,又可表示為SS或Lxx:Lxx=∑(x-μ)2=∑x2-(∑x)2/N76∑(x-μ)2的大小,除與變異度有關(guān)外,還與觀察值的個數(shù)(N)有關(guān)。為在N不等時進(jìn)行比較,∑(x-μ)2還要除以N,所得值在就稱為方差,又稱均方差(meansquaredeviation),用Var(X)用σ2表示:總體方差:以樣本均數(shù)代表μ,用樣本例數(shù)n代表總體例數(shù)N,所得方差稱樣本方差,用S2表示。nXXS?-=22)(n-1XXS?-=22)(公式調(diào)整77

(n-1)稱為自由度(degreeoffreedom

),用希臘字母υ[nju:]表示,表示隨機(jī)變量能夠自由取值的個數(shù)。

分析:

如有一組四個(n=4)數(shù)據(jù)的樣本,受到X=5的條件限制,在自由確定4、2、5三個數(shù)據(jù)后,第四個數(shù)據(jù)只能是9,否則X≠5。因而這里的自由度=n-1=4-1=3。

自由度υ=n-限制條件的個數(shù)78

方差:分總體方差,樣本方差S2●計算:●意義:克服了R值和Q值的不足,考慮了每個變量值的離散情況并消除了N的影響。●優(yōu)點(diǎn):全面地考慮每個變量值的離散情況●缺點(diǎn):其單位是原度量單位的平方??傮w方差樣本方差79(四)標(biāo)準(zhǔn)差(Standarddeviation,SD或S)方差的單位是原度量單位的平方,不便使用。將方差公式展開,并開方,即得到另一個重要的離散趨勢的指標(biāo),即標(biāo)準(zhǔn)差,簡寫為S。公式來源:總體標(biāo)準(zhǔn)差:1()2--=?nXXs樣本標(biāo)準(zhǔn)差:80標(biāo)準(zhǔn)差的計算:利用(a-b)2展開原理⑴直接法:⑵頻數(shù)表法:81舉例分別求A、B、C三組數(shù)據(jù)的標(biāo)準(zhǔn)差:

A組:26,28,30,32,34B組:24,27,30,33,36C組:26,29,30,31,34答:①先求出ΣX和ΣX2,再代入公式計算:(1)直接法:用于小樣本資料最大次之最小82(2)頻數(shù)表法:用于大樣本資料或頻數(shù)表資料例2-2求120名18~35歲健康男性居民血清鐵含量的標(biāo)準(zhǔn)差:答:83

(五)變異系數(shù):簡稱CV●概念:是同一組資料的標(biāo)準(zhǔn)差與均數(shù)之比,又叫變異度或離散系數(shù)?!裼嬎悖骸駥?shí)際含義:標(biāo)準(zhǔn)差相對于同組均數(shù)的百分比?!駜?yōu)點(diǎn):CV消除了度量衡單位,用于比較1.單位不同的多組資料的變異度。2.均數(shù)相差懸殊的多組資料的變異度。84答:通過變異系數(shù)的計算身高體重說明其體重的變異度大于身高的,即身高比體重穩(wěn)定。例2-15:某1985年通過十省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為8.42kg,標(biāo)準(zhǔn)差為0.98kg;身高的均數(shù)為72.4cm,標(biāo)準(zhǔn)差3.0cm;試問其體重、身高的哪個指標(biāo)更穩(wěn)定些?85例2:試分析下組資料變異程度的變化趨勢附表某地不同年齡兒童身高(cm)的變異度分析:1.兒童身高的標(biāo)準(zhǔn)差隨著年齡的增大而增大。2.但不同年齡兒童身高的均數(shù)相差較大,也在隨著年齡的增大而增大。3.從變異系數(shù)的角度,6歲以下兒童隨年齡增加其身高的變異度逐漸減小。86第四節(jié)描述分布形態(tài)的統(tǒng)計指標(biāo)87頻數(shù)分布偏峰分布正偏負(fù)偏集中部位在中部,兩端漸少,左右兩側(cè)的基本對稱,為對稱(正態(tài))分布。

對稱分布集中部位偏于較小值一側(cè)(左側(cè)),較大值方向漸減少,為正偏峰分布。集中部位偏于較大值一側(cè)(右側(cè)),較小值方向漸減少,為負(fù)偏峰分布。88(一)偏度系數(shù)(coefficientofskewness,SKEW)意義:SKEW=0時SKEW取正值時SKEW取負(fù)值時正偏峰分布對稱分布負(fù)偏峰分布89(二)峰度系數(shù)(coefficientofkurtosis,SURT)意義:SURT=0時SKEW取正值時SKEW取負(fù)值時較正態(tài)峰尖峭正態(tài)分布較正態(tài)峰平闊90小結(jié)⒈為描述定量變量的分布規(guī)律,可將觀察值編制頻數(shù)表,繪制頻數(shù)分布圖,要描述資料的分布特征(集中趨勢及離散趨勢)和分布類型。常用平均數(shù)意義適用資料算術(shù)均數(shù)平均數(shù)量水平對稱分布,特別正態(tài)分布資料幾何均數(shù)平均增減倍數(shù)①對數(shù)正態(tài)分布;②等比級數(shù)據(jù)資料中位數(shù)位次居中的觀察值水平任何分布的資料,特別適用于①偏峰分布;②分布末端無確定值;③分布不清的資料⒉集中趨勢描述的主要指標(biāo)是平均數(shù)。常用平均數(shù)及其適用資料913.描述頻數(shù)分布離散程度的指標(biāo)有:①極差與四分位數(shù)間距,后者較穩(wěn)定,但均不能綜合反映個觀察值的變異程度,適用于各種分布類型的資料,但更常用于描述偏峰分布資料。②方差和標(biāo)準(zhǔn)差最常用,對正態(tài)分布尤重要。③變異系數(shù),可用于多組資料間單位不同或均數(shù)相差較大時,變異度的比較。注意:

變異指標(biāo)的大小這與平均指標(biāo)值的大小無關(guān)。924.平均指標(biāo)和變異指標(biāo)相結(jié)合,能對各種分布的資料作很好的描述。5.常用描述資料分布形

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論