醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二講計(jì)量資料統(tǒng)計(jì)描述_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二講計(jì)量資料統(tǒng)計(jì)描述_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二講計(jì)量資料統(tǒng)計(jì)描述_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二講計(jì)量資料統(tǒng)計(jì)描述_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第二講計(jì)量資料統(tǒng)計(jì)描述_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章統(tǒng)計(jì)工作基本步驟:設(shè)計(jì)—收集—整理—分析(按資料類型)

﹡整理資料---制作頻數(shù)表﹡分析資料統(tǒng)計(jì)描述:指標(biāo)、圖表統(tǒng)計(jì)推斷:參數(shù)估計(jì)、假設(shè)檢驗(yàn)1第二章計(jì)量資料的統(tǒng)計(jì)描述(指標(biāo))2第二章主要內(nèi)容第一節(jié)頻數(shù)分布表和頻數(shù)分布圖(整理)第二節(jié)集中趨勢第三節(jié)離散趨勢第四節(jié)正態(tài)分布第五節(jié)醫(yī)學(xué)正常值范圍的估計(jì)分析應(yīng)用3現(xiàn)有子女?dāng)?shù)/個(gè)(個(gè))頻數(shù)f頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)017740.7817740.781317.1420847.9326715.4427563.3636013.8233577.1944811.0638388.255276.2241094.476163.6942698.16781.84434100.0合計(jì)434表2.1某年某地區(qū)434名15-64歲少數(shù)民族已婚婦女現(xiàn)有子女?dāng)?shù)的頻數(shù)分布4

例2.1某地用隨機(jī)抽樣方法檢查了140名成年男子的紅細(xì)胞數(shù),檢測結(jié)果如表所示:

4.765.265.615.954.464.574.31……5.004.734.475.344.704.814.93……5.244.974.714.444.945.054.78……4.334.834.565.444.794.914.26……4.955.074.805.304.654.774.50……4.814.543.824.014.894.625.12……5一、頻數(shù)表

(FrequencyTable)同時(shí)列出觀察指標(biāo)的可能取值區(qū)間及其在各區(qū)間內(nèi)出現(xiàn)的頻數(shù)。1.求全距:R=5.95-3.82=2.032.確定組數(shù)k:通常選擇在8~15之間

3.確定組距:參考組距為R/k,R為全距4.確定組段:包含下限不包含上限5.對各組段計(jì)數(shù):劃記,匯總.6某地140名正常男子紅細(xì)胞數(shù)的頻數(shù)表

紅細(xì)胞數(shù)組中值頻數(shù)頻率(%)3.80~

3.9

2

1.44.00~

4.1

6

4.34.20~

4.3

11

7.94.40~

4.5

25

17.94.60~

4.7

32

22.94.80~

4.9

27

19.35.00~

5.1

17

12.15.20~

5.3

13

9.35.40~

5.5

4

2.95.60~

5.7

2

1.45.80~

6.00

5.9

1

0.7合計(jì)1407二、直方圖(Histogram)直觀、形象地表示頻數(shù)分布的形態(tài)和特征。140名正常男子紅細(xì)胞計(jì)數(shù)的直方圖8頻數(shù)表的用途

1.作為陳述資料的形式

2.便于觀察數(shù)據(jù)的分布類型

3.便于發(fā)現(xiàn)資料中含有的異常值

4.便于進(jìn)行統(tǒng)計(jì)指標(biāo)的計(jì)算和進(jìn)一步的分析.

91.頻數(shù)表的編制步驟組段(1)頻數(shù),f(2)組中值,X(3)頻率/%(4)累計(jì)頻率/%(5)95~196.50.830.8398~799.55.836.67101~10102.58.3315.00104~18105.515.0030.00107~25108.520.8350.83110~21111.517.5068.33113~15114.512.5080.83116~15117.512.5093.33119~7120.55.8399.17122~1251123.50.83100.00合計(jì)

120100.0表2.2某市120名5歲女孩身高頻數(shù)分布101.頻數(shù)表的編制步驟第二節(jié)集中趨勢的描述為了進(jìn)一步揭示數(shù)據(jù)分布的規(guī)律,尚需要用統(tǒng)計(jì)指標(biāo)來較為準(zhǔn)確地描述數(shù)據(jù)的分布特征:集中趨勢和離散趨勢

平均數(shù)(average)是一組反映資料集中趨勢(centraltendency

)的指標(biāo)。常用的有:

1.算術(shù)均數(shù)(arithmeticmean),簡稱均數(shù)(mean)

2.幾何均數(shù)(geometricmean)

3.中位數(shù)

(median)

4.眾數(shù)(mode)11一、算術(shù)平均數(shù)(TheArithmeticmean)

簡稱均數(shù)(Mean)或均值,定義為所有變量值之和除以變量值個(gè)數(shù)(即,樣本含量SampleSize)。反映一組呈對稱分布的變量值在數(shù)量上的平均水平。12(1)直接計(jì)算法

公式:例1:試計(jì)算1,3,7,9的均數(shù)?例2:試計(jì)算1,3,3,7,7,9,9,9的均數(shù)?13(2)加權(quán)法

Σ為求和符號,讀成sigma14151.頻數(shù)表的編制步驟意義:一組性質(zhì)相同的觀察值在數(shù)量上的平均水平。表示:

(總體)X(樣本)計(jì)算:直接法、間接法、計(jì)算機(jī)特征:∑(X-X)=0?!疲╔-X)2

<∑(X-a)2(其中a≠X)

易受到極端值的影響。應(yīng)用:正態(tài)分布或近似正態(tài)分布;可以作為樣本的代表值與其他樣本進(jìn)行比較。注意:合理分組,才能求均數(shù),否則沒有意義。算術(shù)均數(shù)小結(jié)16在數(shù)量上的平均水平。例一組血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。直觀看,其平均水平應(yīng)為1000,如何求得這一數(shù)據(jù)呢?17在數(shù)量上的平均水平。可用于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布或正態(tài)分布的變量值在數(shù)量上的平均水平。二、幾何均數(shù)(geometricmean)18(1)直接法幾何均數(shù):變量對數(shù)值的算術(shù)均數(shù)的反對數(shù)。

其他對數(shù)(如自然對數(shù))變換也可獲得相同的幾何均數(shù)19例3.6測定10名傷寒病人血清抗體滴度分別為1:4,1:4,1:4,1:4,1:4,1:16,1:16,1:16,1:64,1:128,求其平均抗體滴度。以其滴度的倒數(shù)為原變量值,代入公式有:平均抗體滴度為:1:1120(2)加權(quán)法公式:21例2.5

75名兒童的平均抗體滴度計(jì)算22幾何均數(shù)小結(jié)意義:N個(gè)數(shù)值的乘積開N次方即為這N個(gè)數(shù)的幾何均數(shù)。表示:G計(jì)算:直接法、間接法應(yīng)用:原始數(shù)據(jù)分布不對稱,經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。例如抗體滴度。等比資料注意觀察值不能同時(shí)有正負(fù)或有零,若全是負(fù)值,則計(jì)算時(shí)可先去掉負(fù)號,得出結(jié)果后再加上負(fù)號。同一資料,幾何均數(shù)<均數(shù)233.中位數(shù)(median)

中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,符號為M,反映一批觀察值在位次上的平均水平。

11只大鼠平均存活時(shí)間如下,求其平均存活天數(shù)?4,10,7,50,3,15,2,9,13,>60,>60變量排序2,

3,

4,7,9,10,13,15,50,>60,>60秩次

123456789101124(一)中位數(shù)計(jì)算方法

1.直接法:適用于樣本量較小的計(jì)量資料。當(dāng)n為奇數(shù)時(shí)

當(dāng)n為偶數(shù)時(shí)251.頻數(shù)表的編制步驟例

9名中學(xué)生甲型肝炎的潛伏期分別為12,13,14,14,15,15,15,17,19天,

求其中位數(shù)。261.頻數(shù)表的編制步驟2.頻數(shù)表法(百分位數(shù)法):適用于樣本量較大的計(jì)量資料,如頻數(shù)表資料。

LM:中位數(shù)所在組段下限i:組距

fM

:中位數(shù)所在組段頻數(shù)∑fL:中位數(shù)所在組段前一組的累計(jì)頻數(shù)27頻數(shù)表資料的中位數(shù)下限值L100cm上限值U120cmi;fm中位數(shù)M28中位數(shù)=100+20x[(1503x50%-448)/520]=111.67(分)291.頻數(shù)表的編制步驟中位數(shù)小結(jié)計(jì)算時(shí)只利用了位置居中的測量值

優(yōu)點(diǎn):對極值不敏感缺點(diǎn):并非考慮到每個(gè)觀測值適用于各種分布類型的資料,特別適合于:

①大樣本偏態(tài)分布資料②或者一端或兩端無確切數(shù)值的資料③或分布不清的資料﹡對于正態(tài)分布資料,中位數(shù)等于均數(shù),對于對數(shù)正態(tài)分布資料,中位數(shù)等于幾何均數(shù).301.頻數(shù)表的編制步驟第三節(jié)、離散趨勢的描述變異(variation)指標(biāo):反映數(shù)據(jù)的離散度(Dispersion)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)(全距)

2.百分位數(shù)與四分位數(shù)間距

PercentileandQuartilerange

3.方差

Variance

4.標(biāo)準(zhǔn)差StandardDeviation

5.變異系數(shù)

CoefficientofVariation

311.頻數(shù)表的編制步驟

例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤,得結(jié)果如下(萬/mm3)盤編號甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500甲乙丙321.頻數(shù)表的編制步驟1.極差(Range)(全距)優(yōu)點(diǎn):簡便缺點(diǎn):只利用了兩個(gè)極端值;n大,R也會大,不穩(wěn)定。應(yīng)用:用于描述單峰對稱分布小樣本資料;初步了解資料的變異程度。1204020R=Xmax-Xmin332.百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange百分位數(shù)

:數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對應(yīng)的值。記為Px。

34

PX

X%(100-X)%XminXmaxP100變量值從小到大排列P0百分位數(shù)示意圖35百分位數(shù)的計(jì)算

直接法:略頻數(shù)表法:公式36P25=80+20x[(1503x25%-0)/448]=96.77(分)P75=120+20x[(1503x75%-968)/226]=134.09(分)37四分位間距:Q=P75-P25Q越大,表示資料的離散程度越高,反之亦然。與中位數(shù)的應(yīng)用條件相同.可以看作是一對指標(biāo)。0P25P50P75100%383.方差

方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。平均偏差=離均差平方和(SS)=離均差=39總體方差

方差性質(zhì):方差越大說明數(shù)據(jù)的變異越大

n-1為自由度(degreeoffreedom,簡記為DF)指隨機(jī)變量能自由取值的個(gè)數(shù)40樣本方差為什么要除以(n-1)與自由度(degreesoffreedom)有關(guān)。自由度是數(shù)學(xué)名詞,在統(tǒng)計(jì)學(xué)中,n個(gè)數(shù)據(jù)如不受任何條件的限制,則n個(gè)數(shù)據(jù)可取任意值,稱為有n個(gè)自由度。若受到k個(gè)條件的限制,就只有(n-k)個(gè)自由度了。計(jì)算標(biāo)準(zhǔn)差時(shí),n個(gè)變量值本身有n個(gè)自由度。但受到樣本均數(shù)的限制,任何一個(gè)“離均差”均可以用另外的(n-1)個(gè)“離均差”表示,所以只有(n-1)個(gè)獨(dú)立的“離均差”。因此只有(n-1)個(gè)自由度。

41例題:求某市城區(qū)11名5歲女孩身高的樣本方差,已知X=107.39。S2=[(112.9-107.39)2+(99.5-107.39)+…+(116.5-107.39)]/(11-1)=48.75(cm)2方差的計(jì)算424.標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差

(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。計(jì)算公式:43標(biāo)準(zhǔn)差(standarddeviation)樣本標(biāo)準(zhǔn)差為樣本方差的平方根;

總體標(biāo)準(zhǔn)差為總體方差的平方根。44頻數(shù)表標(biāo)準(zhǔn)差計(jì)算公式

451.頻數(shù)表的編制步驟組段(1)頻數(shù),f(2)組中值,X(3)fX(4)fX2(5)95~196.596.596.598~799.5696.569301.75101~10102.5102510506.25104~18105.51899200344.5107~25108.52712.5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論