數(shù)據(jù)特征與統(tǒng)計(jì)描述課件_第1頁(yè)
數(shù)據(jù)特征與統(tǒng)計(jì)描述課件_第2頁(yè)
數(shù)據(jù)特征與統(tǒng)計(jì)描述課件_第3頁(yè)
數(shù)據(jù)特征與統(tǒng)計(jì)描述課件_第4頁(yè)
數(shù)據(jù)特征與統(tǒng)計(jì)描述課件_第5頁(yè)
已閱讀5頁(yè),還剩193頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述

第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述第一節(jié)頻數(shù)分布表與頻數(shù)分布圖第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)第三節(jié) 計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)第四節(jié)統(tǒng)計(jì)圖表本章結(jié)構(gòu)

第一節(jié)頻數(shù)分布表與頻數(shù)分布圖本章結(jié)構(gòu)第一節(jié)頻數(shù)分布表與頻數(shù)分布圖第一節(jié)頻數(shù)分布表與頻數(shù)分布圖

一、頻數(shù)分布表(frequencytable)

用途:用于描述資料的分布特征

頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù)。資料類(lèi)型組段頻數(shù)計(jì)數(shù)和等級(jí)觀察結(jié)果的所有分類(lèi)相同類(lèi)別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)P44表4-1,4-2,4-3一、頻數(shù)分布表(frequencytable)

用途:表4-3某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)

編號(hào)紅細(xì)胞數(shù)編號(hào)紅細(xì)胞數(shù)13.98……24.541434.6734.741445.4045.131455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.19表4-3某地150名正常成年男子紅細(xì)胞數(shù)(1012/1.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09

(1012/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分8-15個(gè)組,為方便計(jì),組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=2.09/10=0.209≈0.2。1.頻數(shù)表的編制步驟(1)求極差(range):即最大值與(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.8組段頻數(shù),f組中值,XfX3三、頻數(shù)分布圖

P47三、頻數(shù)分布圖

P47二、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類(lèi)型*(1)對(duì)稱分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對(duì)稱(總體則完全對(duì)稱),就認(rèn)為該資料是對(duì)稱分布(圖4-2)(2)偏態(tài)分布:二、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類(lèi)型*右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,頻數(shù)向右側(cè)拖尾。

表4-115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件左偏態(tài)分布(負(fù)偏態(tài)分布):

左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。表4-101名正常人的血清肌紅蛋白()含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件2.描述計(jì)量資料分布的

集中趨勢(shì)和離散趨勢(shì)①集中趨勢(shì)(centraltendency):變量值集中位置。本例在組段“4.7~”?!骄街笜?biāo)②離散趨勢(shì)(tendencyofdispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠(yuǎn),頻數(shù)越小;且圍繞“中心”左右對(duì)稱?!儺愃街笜?biāo)

2.描述計(jì)量資料分布的

集中趨勢(shì)和離散趨勢(shì)①集中3.便于發(fā)現(xiàn)一些特大或特小的可疑值*3.便于發(fā)現(xiàn)一些特大或特小的可疑值*4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)描述集中趨勢(shì)的特征數(shù)描述離散趨勢(shì)的特征數(shù)第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)描述集中趨勢(shì)的特征數(shù)計(jì)量資料(定量資料、數(shù)值變量資料)總體:有限或無(wú)限個(gè)(定量)變量值樣本:從總體隨機(jī)抽取的n個(gè)變量值:

X1,X2,X3,……,Xnn為樣本例數(shù)(樣本大小、樣本含量)計(jì)量資料(定量資料、數(shù)值變量資料)一、描述集中趨勢(shì)的特征數(shù)(平均指標(biāo))總稱為平均數(shù)(average)反映了資料的集中趨勢(shì)(centraltendency

)。常用的有:

1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱均數(shù)

(mean)

2.幾何均數(shù)(geometricmean)

3.中位數(shù)

(median)

一、描述集中趨勢(shì)的特征數(shù)(平均指標(biāo))總稱為平均數(shù)(avera均數(shù)(mean)Σ為求和符號(hào),讀成sigma,k,X,f意義例4-2“權(quán)數(shù)”例4-3符號(hào):總體樣本

適用條件:資料呈對(duì)稱分布,尤其是正態(tài)或近似正態(tài)。

計(jì)算:

(1)直接法(2)頻數(shù)表法均數(shù)(mean)Σ為求和符號(hào),讀成sigma,k,X,p49,例4-3:均數(shù)=719.8/150=4.8p49,例4-3:均數(shù)=719.8/150=4.82.幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。

2.幾何均數(shù)(geometricmean)幾何均數(shù):變量幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料

例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)頻數(shù)表資料的幾何均數(shù)抗體滴度⑴

人數(shù),f⑵

滴度倒數(shù),X⑶lgX⑷

f·lgX⑸1:4

1:81:161:32┇1:512

合計(jì)1562┇572481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471p51,例4-5:幾何均數(shù)=反對(duì)數(shù)(72.2471/40)=64.00頻數(shù)表資料的幾何均數(shù)抗體滴度人數(shù),f滴度倒數(shù),XlgX3.中位數(shù)(median)

意義:中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。符號(hào):Md

適用條件:適合各種類(lèi)型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。

3.中位數(shù)(median)意義:中位數(shù)是將一中位數(shù)計(jì)算公式與實(shí)例

先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)p51,例4-6:5人潛伏期:2,3,5,8,20中位數(shù)計(jì)算公式與實(shí)例先將觀察值按從小到大順序排列,再按以下頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md

潛伏期/h

(1)

頻數(shù),f(2)

累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48

合計(jì)2145145例4-8中位數(shù)=12+6x[(145x50%-63)/38]

=13.5(h)潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)小結(jié):

集中趨勢(shì)的描述——平均數(shù)

平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。

不同的分布使用不同的指標(biāo)

(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料

幾何均數(shù):對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料

中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)小結(jié):

集中趨勢(shì)的描述——平均數(shù)平均數(shù)二、描述離散趨勢(shì)的特征數(shù)

(變異(variation)指標(biāo))

反映數(shù)據(jù)的離散度(Dispersion

)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)

(全距)

2.百分位數(shù)與四分位數(shù)間距

PercentileandQuartilerange

3.方差

Variance

4.標(biāo)準(zhǔn)差StandardDeviation

5.變異系數(shù)

CoefficientofVariation

二、描述離散趨勢(shì)的特征數(shù)

(變異(variation)指

盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500

例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)甲乙丙盤(pán)編號(hào)甲乙丙14404804902460490495351.極差(Range)(全距)

1204020符號(hào):R意義:反映全部變量值的變動(dòng)范圍。

優(yōu)點(diǎn):簡(jiǎn)便,如說(shuō)明傳染病、食物中毒的最長(zhǎng)、最短潛伏期等。

缺點(diǎn):1.只利用了兩個(gè)極端值

2.n大,R也會(huì)大

3.不穩(wěn)定適用范圍:任何計(jì)量資料;是參考變異指標(biāo)1.極差(Range)(全距)1204020符號(hào):R2.百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:

(定義:P53)Q=P75-P25

四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px2.百分位數(shù)與四分位數(shù)間距

Percentileand頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)Px頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)PxP25=6+6x[(145x25%-17)/46]=8.51(h)P75=18+6x[(145x75%-101)/32]=19.45(h)Q=19.45-8.51=10.94(h)

潛伏期/h

(1)

頻數(shù),f(2)

累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48

合計(jì)2145145P25=6+6x[(145x25%-17)/46]=8.51百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencera3.方差

方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。3.方差方差(variance)也稱均方差(me樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計(jì)證明,n代替N后,計(jì)算出的樣本方差對(duì)總體方差的估計(jì)偏小。對(duì)于樣本資料,對(duì)離均差平方和取平均時(shí)分母用n-1代替n。樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計(jì)證明,n代替N后,計(jì)算4.標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。(p54)4.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standarddeviat標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500126040012510001250250標(biāo)準(zhǔn)差50.9915.817.91標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901方差=(3476.48-719.82/150)/(150-1)=0.1503標(biāo)準(zhǔn)差=0.39(1012/L)(例4-12)

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.8方差=(3476.48-719.82/150)/(150-15.變異系數(shù)(coefficientofvariation)符號(hào):CV適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)

標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%

意義:挑選指標(biāo)時(shí)變異系數(shù)越小,指標(biāo)越好。P56例4-135.變異系數(shù)(coefficientofvariatio變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;

偏態(tài)分布:中位數(shù)、四分位半間距變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布第三節(jié)計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)一、計(jì)數(shù)資料的數(shù)據(jù)整理二、常用相對(duì)數(shù)指標(biāo)三、應(yīng)用注意事項(xiàng)第三節(jié)計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)一、計(jì)數(shù)資料的數(shù)據(jù)整理

計(jì)數(shù)資料(分類(lèi)資料):總體:有限或無(wú)限個(gè)定性(分類(lèi))變量值樣本:從總體中抽取的n個(gè)定性(分類(lèi))變量值整理為:分類(lèi)個(gè)體數(shù),即:計(jì)數(shù)資料頻數(shù)表絕對(duì)數(shù)計(jì)數(shù)資料(分類(lèi)資料):一、計(jì)數(shù)資料的數(shù)據(jù)整理

計(jì)數(shù)資料:按某種屬性分類(lèi),然后清點(diǎn)每類(lèi)的數(shù)據(jù)(以下是:孕婦分娩資料)住院號(hào)年齡職業(yè)文化程度分娩方式妊娠結(jié)局202565527無(wú)中學(xué)順產(chǎn)足月202565322無(wú)小學(xué)助產(chǎn)足月202583025管理人員大學(xué)順產(chǎn)足月202567724知識(shí)分子中學(xué)順產(chǎn)早產(chǎn)202564730管理人員大學(xué)順產(chǎn)足月202584832無(wú)小學(xué)剖宮產(chǎn)足月201991527無(wú)中學(xué)順產(chǎn)死產(chǎn)202586129無(wú)大學(xué)剖宮產(chǎn)足月202460125農(nóng)民中學(xué)順產(chǎn)足月200038626無(wú)小學(xué)順產(chǎn)足月一、計(jì)數(shù)資料的數(shù)據(jù)整理計(jì)數(shù)資料:按某種屬性分按年齡(2歲一組)與職業(yè)整理年齡工人管理人員農(nóng)民商業(yè)服務(wù)無(wú)知識(shí)分子總計(jì)182000305209261018045222871024701115024503428521534436126504325451337036628343510347857248301114112239171143214231424360344253122283621145114383110218400020002合計(jì)2071411022085372061401按年齡(2歲一組)與職業(yè)整理年齡工人管理人員農(nóng)民商業(yè)服務(wù)無(wú)知二、常用相對(duì)數(shù)絕對(duì)數(shù):通過(guò)調(diào)查或?qū)嶒?yàn)得到的原始數(shù)據(jù)。如某病的出院人數(shù)、治愈人數(shù)、死亡人數(shù)等。但絕對(duì)數(shù)通常不具有可比性:1.如2005級(jí)臨床五年制一、二大班學(xué)生人數(shù)不同時(shí),比較兩班醫(yī)學(xué)統(tǒng)計(jì)學(xué)的及格人數(shù)沒(méi)有意義,因此需要在絕對(duì)數(shù)的基礎(chǔ)上計(jì)算相對(duì)數(shù)。相對(duì)數(shù):兩個(gè)有聯(lián)系的指標(biāo)之比,常用的相對(duì)數(shù)有:一、比二、比率三、速率二、常用相對(duì)數(shù)絕對(duì)數(shù):通過(guò)調(diào)查或?qū)嶒?yàn)得到的原始數(shù)據(jù)。如某病的相對(duì)比簡(jiǎn)稱比,是兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明兩指標(biāo)間的比例關(guān)系。計(jì)算公式為式中兩指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)。(一)比(ratio)相對(duì)比簡(jiǎn)稱比,是兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明兩指標(biāo)間的比例關(guān)系。(

(一)兩個(gè)絕對(duì)數(shù)之比:

如某年某醫(yī)院出生嬰兒中,男性嬰兒為370人,女性嬰兒為358人,則出生嬰兒性別比例為370/358×100=103,說(shuō)明該醫(yī)院該年每出生100名女?huà)雰海陀?03名男性嬰兒出生,它反映了男性嬰兒與女性嬰兒出生的對(duì)比水平。

(一)兩個(gè)絕對(duì)數(shù)之比:(二)兩個(gè)率之比:如相對(duì)危險(xiǎn)度(RR)。

例如某地某年齡組男性吸煙和非吸煙的冠心病死亡資料如表7-2,試分析其相對(duì)危害度。

說(shuō)明男性吸煙組的冠心病死亡率是非吸煙組的2.139倍。表7-2

某地某年齡組男性吸煙和非吸煙的冠心病死亡資料(二)兩個(gè)率之比:如相對(duì)危險(xiǎn)度(RR)。

(三)兩個(gè)相對(duì)比之比:如流行病學(xué)常用的比數(shù)比(OR)。

例服用反應(yīng)停與肢體缺陷關(guān)系病例對(duì)照研究資料如表所示:

(三)兩個(gè)相對(duì)比之比:如流行病學(xué)常用的比數(shù)比(OR)。比率(P57):分子分母都是絕對(duì)數(shù),且分子必須是分母的一部分。無(wú)量綱,[0,1]

。1.率(rate)(強(qiáng)度相對(duì)數(shù))說(shuō)明某現(xiàn)象或某事物發(fā)生的頻率或強(qiáng)度。

率=(實(shí)際發(fā)生數(shù)/可能發(fā)生總數(shù))×比例基數(shù)如:治愈率、病死率、陽(yáng)性率、人群患病率等比例基數(shù):100%、1000‰、10000/萬(wàn)、100000(1/10萬(wàn))等(按習(xí)慣,使結(jié)果保留1-2位小數(shù))例如:患病率通常用百分率、嬰兒死亡率用千分率、腫瘤死亡率以十萬(wàn)分率表示。(二)比率(proportion)比率(P57):分子分母都是絕對(duì)數(shù),且分子必須是分母的一部2.構(gòu)成比(結(jié)構(gòu)相對(duì)數(shù))(proportion):表示事物內(nèi)部某一部分的個(gè)體數(shù)與該事物各部分個(gè)體數(shù)的總和之比,用來(lái)說(shuō)明各構(gòu)成部分在總體中所占的比重或分布。通常以100%為比例基數(shù)。其計(jì)算公式為

如:教研室16人高級(jí)職稱有4人,占25%;中級(jí)職稱有8人,占50%;初級(jí)職稱有4人,占25%。2.構(gòu)成比(結(jié)構(gòu)相對(duì)數(shù))(proportion):(三)速率(rate):分母中含有時(shí)間量綱。P58例4-14是反映單位時(shí)間內(nèi)某事件出現(xiàn)的可能性大小,多用于面向人群的出生、死亡和發(fā)病資料的統(tǒng)計(jì).

人口出生率=(某年中活產(chǎn)總數(shù)/該年平均人口數(shù))×100%(三)速率(rate):P58例4-14是反映單位時(shí)間內(nèi)某三、應(yīng)用注意事項(xiàng)1、不能以構(gòu)成比代替率。三、應(yīng)用注意事項(xiàng)1、不能以構(gòu)成比代替率。率與構(gòu)成比容易誤用

年齡組⑴

受檢人數(shù)⑵白內(nèi)障例數(shù)⑶

患者年齡構(gòu)成比(%)⑷患病率(%)⑸=(3)/(2)40~50~60~70~≥80合計(jì)5604412961492268129135971915.1828.7930.1321.654.2412.1429.2545.6165.1086.361468448100.0030.52率與構(gòu)成比容易誤用年齡組受檢白內(nèi)障例數(shù)患者年齡構(gòu)成比2、計(jì)算相對(duì)數(shù)的分母不宜過(guò)小。小則直接敘述。3、進(jìn)行率的對(duì)比分析時(shí),應(yīng)注意資料可比性。如比較療效時(shí),比較組間應(yīng)病情輕重相同,性別影響,應(yīng)按性別分組后再作比較。2、計(jì)算相對(duì)數(shù)的分母不宜過(guò)小。小則直接敘述。(1)觀察對(duì)象是否同質(zhì),研究方法是否相同,觀察時(shí)間是否相等,以及地區(qū)、周?chē)h(huán)境、風(fēng)俗習(xí)慣和經(jīng)濟(jì)條件是否一致或相近等。(2)觀察對(duì)象內(nèi)部結(jié)構(gòu)是否相同,若兩組資料的年齡、性別等構(gòu)成不同,可以分別進(jìn)行同年齡別、同性別的小組率比較或?qū)偮剩ê嫌?jì)率)進(jìn)行標(biāo)準(zhǔn)化后再作比較。

(1)觀察對(duì)象是否同質(zhì),研究方法是否相同,觀察時(shí)間是否相等,4、正確求平均率。例:若P1=x1/n1,P2=x2/n2

P3=x3/n3

P=(x1+x2+x3)/n1+n2+n3)(正確)

P=(P1+P2+P3)/3(錯(cuò)誤)5.樣本率(或構(gòu)成比)同樣存在抽樣誤差,故應(yīng)進(jìn)行樣本率(或構(gòu)成比)差別的假設(shè)檢驗(yàn)。4、正確求平均率。5.樣本率(或構(gòu)成比)同樣存在抽樣第四節(jié)統(tǒng)計(jì)圖表

統(tǒng)計(jì)表(statisticaltable)——數(shù)據(jù)代替文字描述,便于統(tǒng)計(jì)結(jié)果的精確、簡(jiǎn)潔的表達(dá)和對(duì)比分析

統(tǒng)計(jì)圖(statisticalchart)——用圖形代替數(shù)據(jù),獲得直觀、形象的效果第四節(jié)統(tǒng)計(jì)圖表統(tǒng)計(jì)表(statistical第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件一、統(tǒng)計(jì)表1.統(tǒng)計(jì)表的結(jié)構(gòu)

2.統(tǒng)計(jì)表的種類(lèi)

一、統(tǒng)計(jì)表1.統(tǒng)計(jì)表的結(jié)構(gòu)標(biāo)題:標(biāo)目:線條:數(shù)字:無(wú)數(shù)字用“—”表示,缺失數(shù)字用“”表示,數(shù)值為0者記為“0”,不要留空項(xiàng)。備注:1、統(tǒng)計(jì)表的基本結(jié)構(gòu)

標(biāo)題:1、統(tǒng)計(jì)表的基本結(jié)構(gòu)頂線底線表名標(biāo)題頂線底線表名

表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)

受檢人數(shù)異常人數(shù)檢出率(%)

血壓心率

TTTGPT5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75

:TTT(麝香草酚濁度試驗(yàn)),:GPT(谷丙轉(zhuǎn)氨酶)。表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)2.統(tǒng)計(jì)表的種類(lèi)

根據(jù)分組標(biāo)目的復(fù)雜程度,統(tǒng)計(jì)表可大致分為簡(jiǎn)單表和復(fù)合表。

簡(jiǎn)單表(simpletable):只按一個(gè)特征或標(biāo)志分組。如表4-1。

組合表(combinativetable):按兩個(gè)或兩個(gè)以上特征或標(biāo)志結(jié)合起來(lái)分組。如表4-8。2.統(tǒng)計(jì)表的種類(lèi)根據(jù)分組標(biāo)目的復(fù)雜程度,統(tǒng)計(jì)簡(jiǎn)單表示例分組標(biāo)志為矯治方法

簡(jiǎn)單表示例分組標(biāo)志為矯治方法表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)

受檢人數(shù)異常人數(shù)檢出率(%)

血壓心率

TTTGPT5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75

:TTT(麝香草酚濁度試驗(yàn)),:GPT(谷丙轉(zhuǎn)氨酶)。

(丁建生等.中國(guó)衛(wèi)生統(tǒng)計(jì)1999;16(3):166)復(fù)合表示例

分組標(biāo)志:不同年份不同檢測(cè)指標(biāo)表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常例下表是復(fù)方豬膽膠囊治療兩型老年性慢性支氣管炎的療效比較,請(qǐng)對(duì)該表的繪制進(jìn)行評(píng)價(jià),并指出所存在的問(wèn)題。表

兩個(gè)組的療效觀察

分型及療效

單純型慢性支氣管炎

喘息型慢性支氣管炎

指標(biāo)

治愈

顯效

好轉(zhuǎn)

無(wú)效

治愈

顯效

好轉(zhuǎn)

無(wú)效

例數(shù)

60

98

51

12

23

83

65

11

合計(jì)

209

12

171

11

療效

94.6

94.0

例下表是復(fù)方豬膽膠囊治療兩型老年性慢性支氣管炎的療效表復(fù)方豬膽膠囊治療兩型老年慢性支氣管炎患者的療效比較表復(fù)方豬膽膠囊治療兩型老年慢性支氣管炎患者的療效比較一、統(tǒng)計(jì)圖

統(tǒng)計(jì)圖(statisticalchart或statisticalgraph)是用點(diǎn)、線、面等幾何圖形,直觀形象地表達(dá)、描述數(shù)據(jù)或結(jié)果。

1.統(tǒng)計(jì)圖的結(jié)構(gòu)

2.

統(tǒng)計(jì)圖的種類(lèi)與繪制注意事項(xiàng)一、統(tǒng)計(jì)圖統(tǒng)計(jì)圖(statisticalchar1、統(tǒng)計(jì)圖的結(jié)構(gòu)標(biāo)題:用于簡(jiǎn)明扼要地說(shuō)明資料的內(nèi)容,一般位于圖的下方中央位置。圖域:即制圖空間,是整個(gè)統(tǒng)計(jì)圖的視覺(jué)中心。除圓圖外,一般都是存在于特定的坐標(biāo)體系下。標(biāo)目:分為縱標(biāo)目和橫標(biāo)目,表示坐標(biāo)系下縱軸與橫軸的含義。圖例:用于識(shí)別比較的統(tǒng)計(jì)圖中各種圖形所代表的含義。刻度:即縱軸和橫軸上的坐標(biāo)??潭葦?shù)值按從小到大的順序,縱軸由下向上,橫軸由左向右排列。1、統(tǒng)計(jì)圖的結(jié)構(gòu)標(biāo)題:用于簡(jiǎn)明扼要地說(shuō)明資料的內(nèi)容,一般位于2.統(tǒng)計(jì)圖的種類(lèi)與繪制注意事項(xiàng)直條圖百分條圖圓圖線圖與半對(duì)數(shù)線圖直方圖箱圖散點(diǎn)圖統(tǒng)計(jì)地圖2.統(tǒng)計(jì)圖的種類(lèi)與繪制注意事項(xiàng)直條圖

(1)條圖(bargraph)

1.概念

條圖用等寬長(zhǎng)條的高度表示按性質(zhì)分類(lèi)資料各類(lèi)別的數(shù)值大小,用于表示他們之間的對(duì)比關(guān)系。

2.適用資料:相互獨(dú)立的資料(資料有明確分

組,不連續(xù))。

3.分類(lèi)

(1)單式條圖具有一個(gè)統(tǒng)計(jì)指標(biāo),一個(gè)分組因素。

(2)復(fù)式條圖具有一個(gè)統(tǒng)計(jì)指標(biāo),兩個(gè)分組因素。

(1)條圖(bargraph)

條圖條圖表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)

受檢人數(shù)異常人數(shù)檢出率(%)

血壓心率

TTTGPT5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75

:TTT(麝香草酚濁度試驗(yàn)),:GPT(谷丙轉(zhuǎn)氨酶)。

(丁建生等.中國(guó)衛(wèi)生統(tǒng)計(jì)1999;16(3):166)條圖表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常條圖條圖繪制條圖注意事項(xiàng)

⑴縱軸的刻度必須從“0”開(kāi)始。

(2)橫軸各直條一般按統(tǒng)計(jì)指標(biāo)由大到小排列,也可按事物本身的自然順序排列。

(3)各直條的寬度要一致,各直條應(yīng)有相等的間隔,其寬度一般與直條的寬度相等或?yàn)橹睏l寬度的一半。

繪制條圖注意事項(xiàng)⑴縱軸的刻度必須從“0”開(kāi)始。(2)圓圖(piegraph)

1.概念

以圓形的總面積代表100%,把面積按比例分成若干部分,以角度大小來(lái)表示各部分所占的比重。

2.適用資料:構(gòu)成比資料(2)圓圖(piegraph)1.概念

以圓形的2002年某醫(yī)院1402例孕婦分娩結(jié)果分娩結(jié)果例數(shù)構(gòu)成比(%)過(guò)期產(chǎn)211死產(chǎn)211早產(chǎn)21215足月114883總某醫(yī)院1402例孕婦分娩結(jié)果分娩結(jié)果例數(shù)構(gòu)成比(%(3)百分條圖(percentagechart)

百分條圖的作用與圓圖相同。但更適用于多組百分比的比較。020406080100呼吸系統(tǒng)病腦血管病惡性腫瘤損傷與中毒心臟疾病其它圖2-18我國(guó)部分縣1988年的死因構(gòu)成比(3)百分條圖(percentagechart)百分條圖不同性別某癌三種類(lèi)型的構(gòu)成

分化型癌低分化腺癌未分化型合計(jì)男52.327.819.9100女30.218.151.7100不同性別某癌三種類(lèi)型的構(gòu)成分化型癌低分化腺癌未分化型合計(jì)男(4)線圖一、普通線圖(線圖)1.概念線圖(linegraph)是用線段的升降來(lái)表示統(tǒng)計(jì)指標(biāo)的變化趨勢(shì)。如某事物隨時(shí)間的發(fā)展變化,或某現(xiàn)象隨另一現(xiàn)象變遷的情況。2.適用資料適用于隨時(shí)間變化的連續(xù)性資料。(4)線圖一、普通線圖(線圖)1.概念3.分析目的:用線段的升降表示某事物在時(shí)間上的發(fā)展變化趨勢(shì)。3.分析目的:第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件二、半對(duì)數(shù)線圖1.概念是一種特殊的線圖,其坐標(biāo)縱軸是對(duì)數(shù)尺度,特別適宜作不同指標(biāo)變化速度的比較。

2.適用資料適用于隨時(shí)間變化的連續(xù)性資料,尤其比較數(shù)值相差懸殊的多組資料時(shí)采用。二、半對(duì)數(shù)線圖1.概念3.分析目的:半對(duì)數(shù)線圖中線段的升降是用來(lái)表示某事物發(fā)展速度(或者說(shuō)是相對(duì)比)。3.分析目的:第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件普通線圖(線圖):縱橫軸均為算術(shù)尺度,半對(duì)數(shù)圖:縱軸為對(duì)數(shù)尺度,橫軸為算術(shù)尺度。普通線圖(線圖):縱橫軸均為算術(shù)尺度,注意:在普通線圖中,結(jié)核病死亡率線條的坡度比白喉死亡率線條下降的陡峭,只能說(shuō)明兩種疾病的死亡率逐年變化幅度不同,不能錯(cuò)認(rèn)為結(jié)核病死亡率的下降速度比白喉死亡率的下降速度快。在半對(duì)數(shù)線圖中就不會(huì)出現(xiàn)這種錯(cuò)覺(jué)。在比較事物間的變化速度時(shí),應(yīng)選擇半對(duì)數(shù)線圖。

注意:在普通線圖中,結(jié)核病死亡率線條的坡度比白(5)直方圖1.概念是以直方面積描述各組頻數(shù)的多少,面積的總和相當(dāng)于各組頻數(shù)之和。2.適用資料:直方圖用于表達(dá)連續(xù)性資料的頻數(shù)分布。(5)直方圖1.概念3.制圖要求:(1)一般縱軸表示被觀察現(xiàn)象的頻數(shù)(或頻率),橫軸表示連續(xù)變量,以各矩形(寬為組距)的面積表示各組段頻數(shù)。(2)直方圖的各直條間不留空隙;各直條間可用直線分隔,但也可不用直線分隔。(3)組距不等時(shí),橫軸仍表示連續(xù)變量,但縱軸是每個(gè)橫軸單位的頻數(shù)。3.制圖要求:第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件(6)散點(diǎn)圖1.概念

散點(diǎn)圖以直角坐標(biāo)系中各點(diǎn)的密集程度和趨勢(shì)來(lái)表示兩現(xiàn)象間的關(guān)系。常在對(duì)資料進(jìn)行相關(guān)分析之前使用。

2.適用資料:雙變量資料。(6)散點(diǎn)圖1.概念

散點(diǎn)圖以直角坐標(biāo)系中各點(diǎn)的密12名女大學(xué)生身高與體重散點(diǎn)圖12名女大學(xué)生身高與體重散點(diǎn)圖TheendTheend人有了知識(shí),就會(huì)具備各種分析能力,明辨是非的能力。所以我們要勤懇讀書(shū),廣泛閱讀,古人說(shuō)“書(shū)中自有黃金屋。”通過(guò)閱讀科技書(shū)籍,我們能豐富知識(shí),培養(yǎng)邏輯思維能力;通過(guò)閱讀文學(xué)作品,我們能提高文學(xué)鑒賞水平,培養(yǎng)文學(xué)情趣;通過(guò)閱讀報(bào)刊,我們能增長(zhǎng)見(jiàn)識(shí),擴(kuò)大自己的知識(shí)面。有許多書(shū)籍還能培養(yǎng)我們的道德情操,給我們巨大的精神力量,鼓舞我們前進(jìn)。人有了知識(shí),就會(huì)具備各種分析能力,第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述

第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述第一節(jié)頻數(shù)分布表與頻數(shù)分布圖第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)第三節(jié) 計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)第四節(jié)統(tǒng)計(jì)圖表本章結(jié)構(gòu)

第一節(jié)頻數(shù)分布表與頻數(shù)分布圖本章結(jié)構(gòu)第一節(jié)頻數(shù)分布表與頻數(shù)分布圖第一節(jié)頻數(shù)分布表與頻數(shù)分布圖

一、頻數(shù)分布表(frequencytable)

用途:用于描述資料的分布特征

頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù)。資料類(lèi)型組段頻數(shù)計(jì)數(shù)和等級(jí)觀察結(jié)果的所有分類(lèi)相同類(lèi)別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)P44表4-1,4-2,4-3一、頻數(shù)分布表(frequencytable)

用途:表4-3某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)

編號(hào)紅細(xì)胞數(shù)編號(hào)紅細(xì)胞數(shù)13.98……24.541434.6734.741445.4045.131455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.19表4-3某地150名正常成年男子紅細(xì)胞數(shù)(1012/1.頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09

(1012/L)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分8-15個(gè)組,為方便計(jì),組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=2.09/10=0.209≈0.2。1.頻數(shù)表的編制步驟(1)求極差(range):即最大值與(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。(3)列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.8組段頻數(shù),f組中值,XfX3三、頻數(shù)分布圖

P47三、頻數(shù)分布圖

P47二、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類(lèi)型*(1)對(duì)稱分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對(duì)稱(總體則完全對(duì)稱),就認(rèn)為該資料是對(duì)稱分布(圖4-2)(2)偏態(tài)分布:二、頻數(shù)表和頻數(shù)分布圖用途1.描述頻數(shù)分布的類(lèi)型*右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,頻數(shù)向右側(cè)拖尾。

表4-115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件左偏態(tài)分布(負(fù)偏態(tài)分布):

左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。表4-101名正常人的血清肌紅蛋白()含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件2.描述計(jì)量資料分布的

集中趨勢(shì)和離散趨勢(shì)①集中趨勢(shì)(centraltendency):變量值集中位置。本例在組段“4.7~”?!骄街笜?biāo)②離散趨勢(shì)(tendencyofdispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠(yuǎn),頻數(shù)越?。磺覈@“中心”左右對(duì)稱?!儺愃街笜?biāo)

2.描述計(jì)量資料分布的

集中趨勢(shì)和離散趨勢(shì)①集中3.便于發(fā)現(xiàn)一些特大或特小的可疑值*3.便于發(fā)現(xiàn)一些特大或特小的可疑值*4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理4.便于進(jìn)一步做統(tǒng)計(jì)分析和處理第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)描述集中趨勢(shì)的特征數(shù)描述離散趨勢(shì)的特征數(shù)第二節(jié)計(jì)量資料的常用統(tǒng)計(jì)指標(biāo)描述集中趨勢(shì)的特征數(shù)計(jì)量資料(定量資料、數(shù)值變量資料)總體:有限或無(wú)限個(gè)(定量)變量值樣本:從總體隨機(jī)抽取的n個(gè)變量值:

X1,X2,X3,……,Xnn為樣本例數(shù)(樣本大小、樣本含量)計(jì)量資料(定量資料、數(shù)值變量資料)一、描述集中趨勢(shì)的特征數(shù)(平均指標(biāo))總稱為平均數(shù)(average)反映了資料的集中趨勢(shì)(centraltendency

)。常用的有:

1.算術(shù)均數(shù)(arithmeticmean),簡(jiǎn)稱均數(shù)

(mean)

2.幾何均數(shù)(geometricmean)

3.中位數(shù)

(median)

一、描述集中趨勢(shì)的特征數(shù)(平均指標(biāo))總稱為平均數(shù)(avera均數(shù)(mean)Σ為求和符號(hào),讀成sigma,k,X,f意義例4-2“權(quán)數(shù)”例4-3符號(hào):總體樣本

適用條件:資料呈對(duì)稱分布,尤其是正態(tài)或近似正態(tài)。

計(jì)算:

(1)直接法(2)頻數(shù)表法均數(shù)(mean)Σ為求和符號(hào),讀成sigma,k,X,p49,例4-3:均數(shù)=719.8/150=4.8p49,例4-3:均數(shù)=719.8/150=4.82.幾何均數(shù)(geometricmean)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。

2.幾何均數(shù)(geometricmean)幾何均數(shù):變量幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料

例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)幾何均數(shù)的適用條件與實(shí)例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)頻數(shù)表資料的幾何均數(shù)抗體滴度⑴

人數(shù),f⑵

滴度倒數(shù),X⑶lgX⑷

f·lgX⑸1:4

1:81:161:32┇1:512

合計(jì)1562┇572481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471p51,例4-5:幾何均數(shù)=反對(duì)數(shù)(72.2471/40)=64.00頻數(shù)表資料的幾何均數(shù)抗體滴度人數(shù),f滴度倒數(shù),XlgX3.中位數(shù)(median)

意義:中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,反映一批觀察值在位次上的平均水平。符號(hào):Md

適用條件:適合各種類(lèi)型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。

3.中位數(shù)(median)意義:中位數(shù)是將一中位數(shù)計(jì)算公式與實(shí)例

先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)p51,例4-6:5人潛伏期:2,3,5,8,20中位數(shù)計(jì)算公式與實(shí)例先將觀察值按從小到大順序排列,再按以下頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md

潛伏期/h

(1)

頻數(shù),f(2)

累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48

合計(jì)2145145例4-8中位數(shù)=12+6x[(145x50%-63)/38]

=13.5(h)潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)小結(jié):

集中趨勢(shì)的描述——平均數(shù)

平均數(shù):描述一組變量值的集中位置或平均水平的指標(biāo)體系。

不同的分布使用不同的指標(biāo)

(算術(shù))均數(shù):正態(tài)或近似正態(tài)或觀察值相差不大的小樣本資料

幾何均數(shù):對(duì)數(shù)正態(tài)分布或等比級(jí)數(shù)資料

中位數(shù):一般偏態(tài)分布(傳染病發(fā)病的潛伏期)小結(jié):

集中趨勢(shì)的描述——平均數(shù)平均數(shù)二、描述離散趨勢(shì)的特征數(shù)

(變異(variation)指標(biāo))

反映數(shù)據(jù)的離散度(Dispersion

)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)

(全距)

2.百分位數(shù)與四分位數(shù)間距

PercentileandQuartilerange

3.方差

Variance

4.標(biāo)準(zhǔn)差StandardDeviation

5.變異系數(shù)

CoefficientofVariation

二、描述離散趨勢(shì)的特征數(shù)

(變異(variation)指

盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500

例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)甲乙丙盤(pán)編號(hào)甲乙丙14404804902460490495351.極差(Range)(全距)

1204020符號(hào):R意義:反映全部變量值的變動(dòng)范圍。

優(yōu)點(diǎn):簡(jiǎn)便,如說(shuō)明傳染病、食物中毒的最長(zhǎng)、最短潛伏期等。

缺點(diǎn):1.只利用了兩個(gè)極端值

2.n大,R也會(huì)大

3.不穩(wěn)定適用范圍:任何計(jì)量資料;是參考變異指標(biāo)1.極差(Range)(全距)1204020符號(hào):R2.百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:

(定義:P53)Q=P75-P25

四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px2.百分位數(shù)與四分位數(shù)間距

Percentileand頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)Px頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)PxP25=6+6x[(145x25%-17)/46]=8.51(h)P75=18+6x[(145x75%-101)/32]=19.45(h)Q=19.45-8.51=10.94(h)

潛伏期/h

(1)

頻數(shù),f(2)

累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48

合計(jì)2145145P25=6+6x[(145x25%-17)/46]=8.51百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個(gè)體的測(cè)量值在此范圍。中位數(shù)Md與四分位半間距QD一起使用,描述偏態(tài)分布資料的特征百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencera3.方差

方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。3.方差方差(variance)也稱均方差(me樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計(jì)證明,n代替N后,計(jì)算出的樣本方差對(duì)總體方差的估計(jì)偏小。對(duì)于樣本資料,對(duì)離均差平方和取平均時(shí)分母用n-1代替n。樣本方差為什么要除以(n-1)數(shù)理統(tǒng)計(jì)證明,n代替N后,計(jì)算4.標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。(p54)4.標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standarddeviat標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500126040012510001250250標(biāo)準(zhǔn)差50.9915.817.91標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901方差=(3476.48-719.82/150)/(150-1)=0.1503標(biāo)準(zhǔn)差=0.39(1012/L)(例4-12)

組段(1)

頻數(shù),f(2)

組中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.8方差=(3476.48-719.82/150)/(150-15.變異系數(shù)(coefficientofvariation)符號(hào):CV適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)

標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%

意義:挑選指標(biāo)時(shí)變異系數(shù)越小,指標(biāo)越好。P56例4-135.變異系數(shù)(coefficientofvariatio變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;

偏態(tài)分布:中位數(shù)、四分位半間距變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布第三節(jié)計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)一、計(jì)數(shù)資料的數(shù)據(jù)整理二、常用相對(duì)數(shù)指標(biāo)三、應(yīng)用注意事項(xiàng)第三節(jié)計(jì)數(shù)資料的常用統(tǒng)計(jì)指標(biāo)一、計(jì)數(shù)資料的數(shù)據(jù)整理

計(jì)數(shù)資料(分類(lèi)資料):總體:有限或無(wú)限個(gè)定性(分類(lèi))變量值樣本:從總體中抽取的n個(gè)定性(分類(lèi))變量值整理為:分類(lèi)個(gè)體數(shù),即:計(jì)數(shù)資料頻數(shù)表絕對(duì)數(shù)計(jì)數(shù)資料(分類(lèi)資料):一、計(jì)數(shù)資料的數(shù)據(jù)整理

計(jì)數(shù)資料:按某種屬性分類(lèi),然后清點(diǎn)每類(lèi)的數(shù)據(jù)(以下是:孕婦分娩資料)住院號(hào)年齡職業(yè)文化程度分娩方式妊娠結(jié)局202565527無(wú)中學(xué)順產(chǎn)足月202565322無(wú)小學(xué)助產(chǎn)足月202583025管理人員大學(xué)順產(chǎn)足月202567724知識(shí)分子中學(xué)順產(chǎn)早產(chǎn)202564730管理人員大學(xué)順產(chǎn)足月202584832無(wú)小學(xué)剖宮產(chǎn)足月201991527無(wú)中學(xué)順產(chǎn)死產(chǎn)202586129無(wú)大學(xué)剖宮產(chǎn)足月202460125農(nóng)民中學(xué)順產(chǎn)足月200038626無(wú)小學(xué)順產(chǎn)足月一、計(jì)數(shù)資料的數(shù)據(jù)整理計(jì)數(shù)資料:按某種屬性分按年齡(2歲一組)與職業(yè)整理年齡工人管理人員農(nóng)民商業(yè)服務(wù)無(wú)知識(shí)分子總計(jì)182000305209261018045222871024701115024503428521534436126504325451337036628343510347857248301114112239171143214231424360344253122283621145114383110218400020002合計(jì)2071411022085372061401按年齡(2歲一組)與職業(yè)整理年齡工人管理人員農(nóng)民商業(yè)服務(wù)無(wú)知二、常用相對(duì)數(shù)絕對(duì)數(shù):通過(guò)調(diào)查或?qū)嶒?yàn)得到的原始數(shù)據(jù)。如某病的出院人數(shù)、治愈人數(shù)、死亡人數(shù)等。但絕對(duì)數(shù)通常不具有可比性:1.如2005級(jí)臨床五年制一、二大班學(xué)生人數(shù)不同時(shí),比較兩班醫(yī)學(xué)統(tǒng)計(jì)學(xué)的及格人數(shù)沒(méi)有意義,因此需要在絕對(duì)數(shù)的基礎(chǔ)上計(jì)算相對(duì)數(shù)。相對(duì)數(shù):兩個(gè)有聯(lián)系的指標(biāo)之比,常用的相對(duì)數(shù)有:一、比二、比率三、速率二、常用相對(duì)數(shù)絕對(duì)數(shù):通過(guò)調(diào)查或?qū)嶒?yàn)得到的原始數(shù)據(jù)。如某病的相對(duì)比簡(jiǎn)稱比,是兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明兩指標(biāo)間的比例關(guān)系。計(jì)算公式為式中兩指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)。(一)比(ratio)相對(duì)比簡(jiǎn)稱比,是兩個(gè)有關(guān)指標(biāo)之比,說(shuō)明兩指標(biāo)間的比例關(guān)系。(

(一)兩個(gè)絕對(duì)數(shù)之比:

如某年某醫(yī)院出生嬰兒中,男性嬰兒為370人,女性嬰兒為358人,則出生嬰兒性別比例為370/358×100=103,說(shuō)明該醫(yī)院該年每出生100名女?huà)雰?,就?03名男性嬰兒出生,它反映了男性嬰兒與女性嬰兒出生的對(duì)比水平。

(一)兩個(gè)絕對(duì)數(shù)之比:(二)兩個(gè)率之比:如相對(duì)危險(xiǎn)度(RR)。

例如某地某年齡組男性吸煙和非吸煙的冠心病死亡資料如表7-2,試分析其相對(duì)危害度。

說(shuō)明男性吸煙組的冠心病死亡率是非吸煙組的2.139倍。表7-2

某地某年齡組男性吸煙和非吸煙的冠心病死亡資料(二)兩個(gè)率之比:如相對(duì)危險(xiǎn)度(RR)。

(三)兩個(gè)相對(duì)比之比:如流行病學(xué)常用的比數(shù)比(OR)。

例服用反應(yīng)停與肢體缺陷關(guān)系病例對(duì)照研究資料如表所示:

(三)兩個(gè)相對(duì)比之比:如流行病學(xué)常用的比數(shù)比(OR)。比率(P57):分子分母都是絕對(duì)數(shù),且分子必須是分母的一部分。無(wú)量綱,[0,1]

。1.率(rate)(強(qiáng)度相對(duì)數(shù))說(shuō)明某現(xiàn)象或某事物發(fā)生的頻率或強(qiáng)度。

率=(實(shí)際發(fā)生數(shù)/可能發(fā)生總數(shù))×比例基數(shù)如:治愈率、病死率、陽(yáng)性率、人群患病率等比例基數(shù):100%、1000‰、10000/萬(wàn)、100000(1/10萬(wàn))等(按習(xí)慣,使結(jié)果保留1-2位小數(shù))例如:患病率通常用百分率、嬰兒死亡率用千分率、腫瘤死亡率以十萬(wàn)分率表示。(二)比率(proportion)比率(P57):分子分母都是絕對(duì)數(shù),且分子必須是分母的一部2.構(gòu)成比(結(jié)構(gòu)相對(duì)數(shù))(proportion):表示事物內(nèi)部某一部分的個(gè)體數(shù)與該事物各部分個(gè)體數(shù)的總和之比,用來(lái)說(shuō)明各構(gòu)成部分在總體中所占的比重或分布。通常以100%為比例基數(shù)。其計(jì)算公式為

如:教研室16人高級(jí)職稱有4人,占25%;中級(jí)職稱有8人,占50%;初級(jí)職稱有4人,占25%。2.構(gòu)成比(結(jié)構(gòu)相對(duì)數(shù))(proportion):(三)速率(rate):分母中含有時(shí)間量綱。P58例4-14是反映單位時(shí)間內(nèi)某事件出現(xiàn)的可能性大小,多用于面向人群的出生、死亡和發(fā)病資料的統(tǒng)計(jì).

人口出生率=(某年中活產(chǎn)總數(shù)/該年平均人口數(shù))×100%(三)速率(rate):P58例4-14是反映單位時(shí)間內(nèi)某三、應(yīng)用注意事項(xiàng)1、不能以構(gòu)成比代替率。三、應(yīng)用注意事項(xiàng)1、不能以構(gòu)成比代替率。率與構(gòu)成比容易誤用

年齡組⑴

受檢人數(shù)⑵白內(nèi)障例數(shù)⑶

患者年齡構(gòu)成比(%)⑷患病率(%)⑸=(3)/(2)40~50~60~70~≥80合計(jì)5604412961492268129135971915.1828.7930.1321.654.2412.1429.2545.6165.1086.361468448100.0030.52率與構(gòu)成比容易誤用年齡組受檢白內(nèi)障例數(shù)患者年齡構(gòu)成比2、計(jì)算相對(duì)數(shù)的分母不宜過(guò)小。小則直接敘述。3、進(jìn)行率的對(duì)比分析時(shí),應(yīng)注意資料可比性。如比較療效時(shí),比較組間應(yīng)病情輕重相同,性別影響,應(yīng)按性別分組后再作比較。2、計(jì)算相對(duì)數(shù)的分母不宜過(guò)小。小則直接敘述。(1)觀察對(duì)象是否同質(zhì),研究方法是否相同,觀察時(shí)間是否相等,以及地區(qū)、周?chē)h(huán)境、風(fēng)俗習(xí)慣和經(jīng)濟(jì)條件是否一致或相近等。(2)觀察對(duì)象內(nèi)部結(jié)構(gòu)是否相同,若兩組資料的年齡、性別等構(gòu)成不同,可以分別進(jìn)行同年齡別、同性別的小組率比較或?qū)偮剩ê嫌?jì)率)進(jìn)行標(biāo)準(zhǔn)化后再作比較。

(1)觀察對(duì)象是否同質(zhì),研究方法是否相同,觀察時(shí)間是否相等,4、正確求平均率。例:若P1=x1/n1,P2=x2/n2

P3=x3/n3

P=(x1+x2+x3)/n1+n2+n3)(正確)

P=(P1+P2+P3)/3(錯(cuò)誤)5.樣本率(或構(gòu)成比)同樣存在抽樣誤差,故應(yīng)進(jìn)行樣本率(或構(gòu)成比)差別的假設(shè)檢驗(yàn)。4、正確求平均率。5.樣本率(或構(gòu)成比)同樣存在抽樣第四節(jié)統(tǒng)計(jì)圖表

統(tǒng)計(jì)表(statisticaltable)——數(shù)據(jù)代替文字描述,便于統(tǒng)計(jì)結(jié)果的精確、簡(jiǎn)潔的表達(dá)和對(duì)比分析

統(tǒng)計(jì)圖(statisticalchart)——用圖形代替數(shù)據(jù),獲得直觀、形象的效果第四節(jié)統(tǒng)計(jì)圖表統(tǒng)計(jì)表(statistical第四章數(shù)據(jù)特征與統(tǒng)計(jì)描述課件一、統(tǒng)計(jì)表1.統(tǒng)計(jì)表的結(jié)構(gòu)

2.統(tǒng)計(jì)表的種類(lèi)

一、統(tǒng)計(jì)表1.統(tǒng)計(jì)表的結(jié)構(gòu)標(biāo)題:標(biāo)目:線條:數(shù)字:無(wú)數(shù)字用“—”表示,缺失數(shù)字用“”表示,數(shù)值為0者記為“0”,不要留空項(xiàng)。備注:1、統(tǒng)計(jì)表的基本結(jié)構(gòu)

標(biāo)題:1、統(tǒng)計(jì)表的基本結(jié)構(gòu)頂線底線表名標(biāo)題頂線底線表名

表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)指標(biāo)異常檢出率檢測(cè)指標(biāo)1994年1998年受檢人數(shù)異常人數(shù)檢出率(%)

受檢人數(shù)異常人數(shù)檢出率(%)

血壓心率

TTTGPT5195195195195544362010.160.486.943.85582582582582383923166.526.703.952.75

:TTT(麝香草酚濁度試驗(yàn)),:GPT(谷丙轉(zhuǎn)氨酶)。表4-8某省某工廠1994、1998年四項(xiàng)檢測(cè)2.統(tǒng)計(jì)表的種類(lèi)

根據(jù)分組標(biāo)目的復(fù)雜程度,統(tǒng)計(jì)表可大致分為簡(jiǎn)單表和復(fù)合表。

簡(jiǎn)單表(simpletable):只按一個(gè)特征或標(biāo)志分組。如表4-1。

組合表(combinativetable):按兩個(gè)或兩個(gè)以上特征或標(biāo)志結(jié)合起來(lái)分組。如表4-8。2.統(tǒng)計(jì)表的種類(lèi)根據(jù)分組標(biāo)目的復(fù)雜程度,統(tǒng)計(jì)簡(jiǎn)單表示例分組標(biāo)志

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論