高等教育統(tǒng)計(jì)描述一課件_第1頁
高等教育統(tǒng)計(jì)描述一課件_第2頁
高等教育統(tǒng)計(jì)描述一課件_第3頁
高等教育統(tǒng)計(jì)描述一課件_第4頁
高等教育統(tǒng)計(jì)描述一課件_第5頁
已閱讀5頁,還剩93頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)描述(一)統(tǒng)計(jì)描述(一)1統(tǒng)計(jì)描述統(tǒng)計(jì)分析

統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)描述統(tǒng)計(jì)統(tǒng)計(jì)描述統(tǒng)計(jì)推斷2統(tǒng)計(jì)描述統(tǒng)計(jì)描述是統(tǒng)計(jì)分析的必經(jīng)之路,通過計(jì)算相應(yīng)的統(tǒng)計(jì)指標(biāo),必要時(shí)結(jié)合統(tǒng)計(jì)圖表就可較全面地刻畫出研究結(jié)果的特征。統(tǒng)計(jì)描述統(tǒng)計(jì)描述是統(tǒng)計(jì)分析的必經(jīng)之路,通過計(jì)算相應(yīng)的3統(tǒng)計(jì)描述在統(tǒng)計(jì)分析中,沒有準(zhǔn)確的統(tǒng)計(jì)描述,就得不出合理的統(tǒng)計(jì)推斷結(jié)果。因此我們必須重視統(tǒng)計(jì)描述;否則,統(tǒng)計(jì)推斷就成了“無源之水”。統(tǒng)計(jì)描述在統(tǒng)計(jì)分析中,沒有準(zhǔn)確的統(tǒng)計(jì)描述,就得不出合理4統(tǒng)計(jì)描述統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)圖表統(tǒng)計(jì)分布Poisson分布變異指標(biāo)平均數(shù)指標(biāo)統(tǒng)計(jì)表統(tǒng)計(jì)圖正態(tài)分布t分布F分布x2分布二項(xiàng)分布相對數(shù)指標(biāo)統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)圖表統(tǒng)計(jì)分布Poisson分布變異指標(biāo)平均數(shù)指5頻數(shù)分布表與頻數(shù)分布圖

(frequencytableandfrequencydistribution)

頻數(shù)分布表與頻數(shù)分布圖

(frequencytable6

用途:描述資料的分布特征

頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù)。資料類型組段頻數(shù)計(jì)數(shù)和等級觀察結(jié)果的所有分類相同類別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)頻數(shù)分布表

(frequencytable)

用途:描述資料的分布特征

頻數(shù):在一批樣本中,相同情形出7某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)

3.985.394.544.745.134.434.814.983.795.494.665.264.904.904.174.284.634.944.334.844.754.014.494.575.165.694.845.035.324.544.684.604.394.804.974.804.855.214.454.625.054.135.074.405.084.735.104.734.424.814.983.895.464.534.744.104.904.914.274.294.665.235.314.864.674.434.575.005.165.694.835.044.464.615.004.364.754.965.045.374.954.704.834.424.134.784.864.785.234.785.204.804.554.824.983.944.544.745.104.434.584.994.314.644.665.265.284.834.154.354.935.175.614.875.043.984.484.574.774.114.955.005.365.064.684.634.405.304.975.294.855.884.494.624.534.104.534.704.805.235.674.674.675.405.294.775.385.154.645.19某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)3.988

計(jì)量資料頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組段數(shù)和組距:根據(jù)樣本含量n確定,組段數(shù)通常取8-15組。實(shí)際工作中,組距通常參考極差的十分之一,再略加調(diào)整。本例i=R

/10=2.09/10=0.209≈0.2。計(jì)量資料頻數(shù)表的編制步驟(1)求極差(range):即最大9(3)確定各個(gè)組段的上限和下限:組段的左端點(diǎn)稱為下限,右端點(diǎn)稱為上限。第一組段把最小值包括進(jìn)去,最后一個(gè)組段把最大值包括進(jìn)去。本例:第一組下限可取3.7,則上限為3.9,依此類推……,共得11組。(4)列表整理:按照“下限≤X<上限”的原則,用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。(3)確定各個(gè)組段的上限和下限:組段的左端點(diǎn)稱為下限,右端點(diǎn)10組段(1)頻數(shù)f(2)組中值X0(3)fX0(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9合計(jì)15.85.8150—719.8組段頻數(shù)f組中值X0fX03.7~111頻數(shù)分布圖

(frequencydistribution)

計(jì)數(shù)資料

以類別或?qū)傩詾闄M軸,以各直條的長短表示頻數(shù)的多少頻數(shù)分布圖

(frequencydistribution12計(jì)量資料以組段為橫軸,在各組段上分別繪制長方形,令長方形的高度等于相應(yīng)的頻數(shù)。這樣的頻數(shù)圖因諸多長方形又名為頻數(shù)直方圖。計(jì)量資料13頻數(shù)表和頻數(shù)分布圖用途第一:

描述資料分布的類型(1)對稱分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對稱,就認(rèn)為該資料是對稱分布(2)偏態(tài)分布:頻數(shù)表和頻數(shù)分布圖用途第一:描述資料分布的類型14右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,向右側(cè)拖尾的分布。

115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的15[高等教育]統(tǒng)計(jì)描述一課件16左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。

表101名正常人的血清肌紅蛋白(μg/mL)含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)17[高等教育]統(tǒng)計(jì)描述一課件18第二:描述頻數(shù)分布的集中趨勢和離散趨勢集中趨勢(centraltendency):頻數(shù)較集中的組段趨勢。——平均水平指標(biāo)離散趨勢(tendencyofdispersion):頻數(shù)由較集中的組段逐漸減少的趨勢。

——變異水平指標(biāo)

第二:描述頻數(shù)分布的集中趨勢和離散趨勢集中趨勢(centra19第三:便于發(fā)現(xiàn)一些特大或特小的可疑值第三:便于發(fā)現(xiàn)一些特大或特小的可疑值20計(jì)量資料常用的統(tǒng)計(jì)描述指標(biāo)描述集中趨勢的指標(biāo)描述離散趨勢的指標(biāo)計(jì)量資料常用的統(tǒng)計(jì)描述指標(biāo)描述集中趨勢的指標(biāo)21(一)、描述集中趨勢的指標(biāo)(平均水平指標(biāo))統(tǒng)稱為平均數(shù)(average),反映資料的集中趨勢。常用的平均數(shù)有:

1.算術(shù)均數(shù)(arithmeticmean),簡稱均數(shù)(mean)

2.幾何均數(shù)(geometricmean)

3.中位數(shù)

(median)

(一)、描述集中趨勢的指標(biāo)(平均水平指標(biāo))統(tǒng)稱為平均數(shù)(av221、算術(shù)均數(shù)(mean)

符號:總體均數(shù),樣本均數(shù)

適用條件:資料呈對稱分布,尤其是正態(tài)分布或近似正態(tài)分布計(jì)算:(1)直接法1、算術(shù)均數(shù)(mean)符號:總體均數(shù),樣本均數(shù)

適23(2)頻數(shù)表法該組段的組中值組段的頻數(shù)(2)頻數(shù)表法該組段的組中值組段的頻數(shù)24表示求X的以10為底的反對數(shù)(即)符號:只適合于數(shù)據(jù)大于0的資料適用條件:數(shù)據(jù)呈倍數(shù)關(guān)系或服從對數(shù)對稱分布(一種偏態(tài)分布)的資料計(jì)算:(1)直接法:(2)頻數(shù)表法:2、幾何均數(shù)(geometricmean)表示求X的以10為底的反對數(shù)(即)符號:25

血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。解:特點(diǎn):1、倍數(shù)關(guān)系

2、偏態(tài)分布算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。因此,平均抗體效價(jià)約為1:1000例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、10026頻數(shù)表資料的幾何均數(shù)抗體滴度

⑴人數(shù),f⑵滴度倒數(shù),X⑶lgX⑷

f·lgX⑸1:4

1:81:161:32┇1:512

合計(jì)1562┇540481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471

頻數(shù)表資料的幾何均數(shù)抗體滴度人數(shù),f滴度倒數(shù),XlgX273.中位數(shù)(median)符號:M意義:中位數(shù)是將全部觀察值由小到大排列后位次居中的數(shù)據(jù)值。適用條件:①偏態(tài)分布的資料;②分布類型不明的資料;③開口資料3.中位數(shù)(median)符號:M28計(jì)算:先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)(n為奇數(shù))(n為偶數(shù))計(jì)算:先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):29頻數(shù)表資料的中位數(shù)對于頻數(shù)表資料可通過百分位數(shù)法計(jì)算中位數(shù)。

百分位數(shù):是一種位置指標(biāo),用表示。是一個(gè)界值,它將觀察值分成兩部分,有X%的觀察值比它小,有(100-X)%的觀察值比它大。

如:第25百分位數(shù)第50百分位數(shù)第75百分位數(shù)第50百分位數(shù)即中位數(shù)頻數(shù)表資料的中位數(shù)對于頻數(shù)表資料可通過百分位數(shù)法計(jì)算中位數(shù)30

頻數(shù)表資料中百分位數(shù)計(jì)算方法:

百分位數(shù)該組的頻數(shù)所在組段的下限該組段的組距總頻數(shù)該組段之前的累計(jì)頻數(shù)頻數(shù)表資料中百分位數(shù)計(jì)算方法:百分位數(shù)該組的頻數(shù)所在31潛伏期/h(1)頻數(shù),f(2)累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48合計(jì)2145145—例4-8潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176~466332均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布:均數(shù)≈中位數(shù)右(正)偏態(tài)分布:均數(shù)>中位數(shù)左(負(fù))偏態(tài)分布時(shí):均數(shù)<中位數(shù)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布:均數(shù)≈中位數(shù)33【例】某地239名居民發(fā)汞(mol/kg)分布組段頻數(shù)累積頻數(shù)累積百分比1-20208.373-668635.985-6014661.097-4819481.179-1821288.7011-1622895.4013-623497.9115-123598.3317-123698.7419-3239100.00合計(jì)239【例】某地239名居民發(fā)汞(mol/kg)分布組段頻數(shù)累積34Mean=6.69Median=6.00右偏態(tài)分布時(shí)中位數(shù)與均數(shù)的關(guān)系Mean=6.69Median=6.00右偏態(tài)分布時(shí)中位數(shù)與35小結(jié):

集中趨勢的描述——平均數(shù)

定義:描述一組變量值的集中位置或平均水平的指標(biāo)體系。應(yīng)用:均數(shù):正態(tài)分布或?qū)ΨQ分布資料(參數(shù)方法)中位數(shù):偏態(tài)分布或未知分布資料(非參數(shù)方法)幾何均數(shù)—變量值呈倍數(shù)(等比級數(shù))關(guān)系,或資料呈對數(shù)正態(tài)分布。小結(jié):集中趨勢的描述——平均數(shù)定義:描述一組變量值的集中36(二)、描述離散趨勢的指標(biāo)(變異指標(biāo))反映數(shù)據(jù)的離散度,即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差/全距(range)

2.四分位數(shù)間距(IQR,inter-quartilerange)

3.方差(variance)

4.標(biāo)準(zhǔn)差(standarddeviation)

5.變異系數(shù)(coefficientofvariation)

(二)、描述離散趨勢的指標(biāo)(變異指標(biāo))反映數(shù)據(jù)的離散度,即個(gè)371、極差/全距(range,

R)符號:R計(jì)算:意義:反映個(gè)體變異的范圍。適用范圍:任何計(jì)量資料,是參考變異指標(biāo)缺點(diǎn):1.只利用了兩個(gè)極端值

2.n大,R也會大

3.穩(wěn)定性差1、極差/全距(range,R)符號:R38一組性質(zhì)相同的定量數(shù)據(jù)中,第75百分位數(shù)()與第25百分位數(shù)()之差,可看作中間一半觀測值的極差。

多用于描述偏態(tài)分布資料的變異水平。2、四分位數(shù)間距(inter-quartilerange,IQR

)一組性質(zhì)相同的定量數(shù)據(jù)中,第75百分位數(shù)()與第25百39潛伏期/h(1)頻數(shù),f(2)累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48合計(jì)2145145—潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176~466340反映一組數(shù)據(jù)的平均變異水平,前者是后者的平方。標(biāo)準(zhǔn)差最常應(yīng)用,常結(jié)合均數(shù)描述正態(tài)分布的特征。

標(biāo)準(zhǔn)差計(jì)算如下:3、方差(variance)和標(biāo)準(zhǔn)差(standarddeviation,S)反映一組數(shù)據(jù)的平均變異水平,前者是后者的平方。標(biāo)準(zhǔn)差最41離均差

離均差平方和

總體方差總體標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差變異與N有關(guān)離均差變異與N有關(guān)42頻數(shù)表計(jì)算樣本標(biāo)準(zhǔn)差的公式為:頻數(shù)表計(jì)算樣本標(biāo)準(zhǔn)差的公式為:43標(biāo)準(zhǔn)差的計(jì)算丙甲2乙2丙27.9115.8150.99標(biāo)準(zhǔn)差250051050550049549012604003136002916002500002116001936001251000270400260100250000240100230400125025026010025502525000024502524010025002500合計(jì)52056055105404500500349046024804401乙甲盤編號標(biāo)準(zhǔn)差的計(jì)算丙甲2乙2丙27.9115.8150.99標(biāo)準(zhǔn)差44組段(1)頻數(shù),f(2)組中值,X(3)

fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9

合計(jì)15.85.8150719.8組段頻數(shù),f組中值,XfX345標(biāo)準(zhǔn)差應(yīng)用標(biāo)準(zhǔn)差是數(shù)據(jù)處理中最常用的統(tǒng)計(jì)指標(biāo),用途:(1)常用作為計(jì)量資料描述的專用符號。:平均水平;:變異度大小

(2)表示數(shù)據(jù)分布的離散程度,衡量變異度大小。(3)描述計(jì)量資料,尤其是正態(tài)分布的數(shù)據(jù)資料,并利用正態(tài)曲線下面積分布規(guī)律,制定各種參考值范圍。標(biāo)準(zhǔn)差應(yīng)用標(biāo)準(zhǔn)差是數(shù)據(jù)處理中最常用的統(tǒng)計(jì)指標(biāo),用途:465.變異系數(shù)(coefficientofvariation)符號:CV適用條件:①觀察指標(biāo)單位不同,如身高、體重

②同單位資料,但均數(shù)相差懸殊均數(shù)標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%

意義:挑選指標(biāo)時(shí)變異系數(shù)越小,指標(biāo)越好。計(jì)算:5.變異系數(shù)(coefficientofvariati47變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊的資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用,如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;偏態(tài)分布:中位數(shù)變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布48統(tǒng)計(jì)描述思考題:一個(gè)服從正態(tài)分布的總體,若其中每個(gè)變量均加上一個(gè)常數(shù),問:均數(shù)、方差、標(biāo)準(zhǔn)差、變異系數(shù)的變化?若是均乘以一個(gè)常數(shù),這4個(gè)指標(biāo)又是如何變化的?統(tǒng)計(jì)描述思考題:49統(tǒng)計(jì)描述(一)統(tǒng)計(jì)描述(一)50統(tǒng)計(jì)描述統(tǒng)計(jì)分析

統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)描述統(tǒng)計(jì)統(tǒng)計(jì)描述統(tǒng)計(jì)推斷51統(tǒng)計(jì)描述統(tǒng)計(jì)描述是統(tǒng)計(jì)分析的必經(jīng)之路,通過計(jì)算相應(yīng)的統(tǒng)計(jì)指標(biāo),必要時(shí)結(jié)合統(tǒng)計(jì)圖表就可較全面地刻畫出研究結(jié)果的特征。統(tǒng)計(jì)描述統(tǒng)計(jì)描述是統(tǒng)計(jì)分析的必經(jīng)之路,通過計(jì)算相應(yīng)的52統(tǒng)計(jì)描述在統(tǒng)計(jì)分析中,沒有準(zhǔn)確的統(tǒng)計(jì)描述,就得不出合理的統(tǒng)計(jì)推斷結(jié)果。因此我們必須重視統(tǒng)計(jì)描述;否則,統(tǒng)計(jì)推斷就成了“無源之水”。統(tǒng)計(jì)描述在統(tǒng)計(jì)分析中,沒有準(zhǔn)確的統(tǒng)計(jì)描述,就得不出合理53統(tǒng)計(jì)描述統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)圖表統(tǒng)計(jì)分布Poisson分布變異指標(biāo)平均數(shù)指標(biāo)統(tǒng)計(jì)表統(tǒng)計(jì)圖正態(tài)分布t分布F分布x2分布二項(xiàng)分布相對數(shù)指標(biāo)統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)圖表統(tǒng)計(jì)分布Poisson分布變異指標(biāo)平均數(shù)指54頻數(shù)分布表與頻數(shù)分布圖

(frequencytableandfrequencydistribution)

頻數(shù)分布表與頻數(shù)分布圖

(frequencytable55

用途:描述資料的分布特征

頻數(shù):在一批樣本中,相同情形出現(xiàn)的次數(shù)稱為該情形的頻數(shù)。資料類型組段頻數(shù)計(jì)數(shù)和等級觀察結(jié)果的所有分類相同類別出現(xiàn)的次數(shù)計(jì)量根據(jù)觀察結(jié)果重新劃分分組統(tǒng)計(jì)頻數(shù)分布表

(frequencytable)

用途:描述資料的分布特征

頻數(shù):在一批樣本中,相同情形出56某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)

3.985.394.544.745.134.434.814.983.795.494.665.264.904.904.174.284.634.944.334.844.754.014.494.575.165.694.845.035.324.544.684.604.394.804.974.804.855.214.454.625.054.135.074.405.084.735.104.734.424.814.983.895.464.534.744.104.904.914.274.294.665.235.314.864.674.434.575.005.165.694.835.044.464.615.004.364.754.965.045.374.954.704.834.424.134.784.864.785.234.785.204.804.554.824.983.944.544.745.104.434.584.994.314.644.665.265.284.834.154.354.935.175.614.875.043.984.484.574.774.114.955.005.365.064.684.634.405.304.975.294.855.884.494.624.534.104.534.704.805.235.674.674.675.405.294.775.385.154.645.19某地150名正常成年男子紅細(xì)胞數(shù)(1012/L)3.9857

計(jì)量資料頻數(shù)表的編制步驟(1)求極差(range):即最大值與最小值之差,又稱為全距。本例極差:R=5.88-3.79=2.09(1012/L)(2)決定組段數(shù)和組距:根據(jù)樣本含量n確定,組段數(shù)通常取8-15組。實(shí)際工作中,組距通常參考極差的十分之一,再略加調(diào)整。本例i=R

/10=2.09/10=0.209≈0.2。計(jì)量資料頻數(shù)表的編制步驟(1)求極差(range):即最大58(3)確定各個(gè)組段的上限和下限:組段的左端點(diǎn)稱為下限,右端點(diǎn)稱為上限。第一組段把最小值包括進(jìn)去,最后一個(gè)組段把最大值包括進(jìn)去。本例:第一組下限可取3.7,則上限為3.9,依此類推……,共得11組。(4)列表整理:按照“下限≤X<上限”的原則,用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。(3)確定各個(gè)組段的上限和下限:組段的左端點(diǎn)稱為下限,右端點(diǎn)59組段(1)頻數(shù)f(2)組中值X0(3)fX0(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9合計(jì)15.85.8150—719.8組段頻數(shù)f組中值X0fX03.7~160頻數(shù)分布圖

(frequencydistribution)

計(jì)數(shù)資料

以類別或?qū)傩詾闄M軸,以各直條的長短表示頻數(shù)的多少頻數(shù)分布圖

(frequencydistribution61計(jì)量資料以組段為橫軸,在各組段上分別繪制長方形,令長方形的高度等于相應(yīng)的頻數(shù)。這樣的頻數(shù)圖因諸多長方形又名為頻數(shù)直方圖。計(jì)量資料62頻數(shù)表和頻數(shù)分布圖用途第一:

描述資料分布的類型(1)對稱分布:若各組段頻數(shù)的分布以頻數(shù)最多的組段為中心左右兩側(cè)大體對稱,就認(rèn)為該資料是對稱分布(2)偏態(tài)分布:頻數(shù)表和頻數(shù)分布圖用途第一:描述資料分布的類型63右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),高峰向左偏移,向右側(cè)拖尾的分布。

115名正常成年女子血清轉(zhuǎn)氨酶(mmol/L)含量分布右偏態(tài)分布(正偏態(tài)分布):頻數(shù)最多組段右側(cè)的組段數(shù)多于左側(cè)的64[高等教育]統(tǒng)計(jì)描述一課件65左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。

表101名正常人的血清肌紅蛋白(μg/mL)含量分布左偏態(tài)分布(負(fù)偏態(tài)分布):左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)66[高等教育]統(tǒng)計(jì)描述一課件67第二:描述頻數(shù)分布的集中趨勢和離散趨勢集中趨勢(centraltendency):頻數(shù)較集中的組段趨勢。——平均水平指標(biāo)離散趨勢(tendencyofdispersion):頻數(shù)由較集中的組段逐漸減少的趨勢。

——變異水平指標(biāo)

第二:描述頻數(shù)分布的集中趨勢和離散趨勢集中趨勢(centra68第三:便于發(fā)現(xiàn)一些特大或特小的可疑值第三:便于發(fā)現(xiàn)一些特大或特小的可疑值69計(jì)量資料常用的統(tǒng)計(jì)描述指標(biāo)描述集中趨勢的指標(biāo)描述離散趨勢的指標(biāo)計(jì)量資料常用的統(tǒng)計(jì)描述指標(biāo)描述集中趨勢的指標(biāo)70(一)、描述集中趨勢的指標(biāo)(平均水平指標(biāo))統(tǒng)稱為平均數(shù)(average),反映資料的集中趨勢。常用的平均數(shù)有:

1.算術(shù)均數(shù)(arithmeticmean),簡稱均數(shù)(mean)

2.幾何均數(shù)(geometricmean)

3.中位數(shù)

(median)

(一)、描述集中趨勢的指標(biāo)(平均水平指標(biāo))統(tǒng)稱為平均數(shù)(av711、算術(shù)均數(shù)(mean)

符號:總體均數(shù),樣本均數(shù)

適用條件:資料呈對稱分布,尤其是正態(tài)分布或近似正態(tài)分布計(jì)算:(1)直接法1、算術(shù)均數(shù)(mean)符號:總體均數(shù),樣本均數(shù)

適72(2)頻數(shù)表法該組段的組中值組段的頻數(shù)(2)頻數(shù)表法該組段的組中值組段的頻數(shù)73表示求X的以10為底的反對數(shù)(即)符號:只適合于數(shù)據(jù)大于0的資料適用條件:數(shù)據(jù)呈倍數(shù)關(guān)系或服從對數(shù)對稱分布(一種偏態(tài)分布)的資料計(jì)算:(1)直接法:(2)頻數(shù)表法:2、幾何均數(shù)(geometricmean)表示求X的以10為底的反對數(shù)(即)符號:74

血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。解:特點(diǎn):1、倍數(shù)關(guān)系

2、偏態(tài)分布算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。因此,平均抗體效價(jià)約為1:1000例血清的抗體效價(jià)滴度的倒數(shù)分別為:10、100、10075頻數(shù)表資料的幾何均數(shù)抗體滴度

⑴人數(shù),f⑵滴度倒數(shù),X⑶lgX⑷

f·lgX⑸1:4

1:81:161:32┇1:512

合計(jì)1562┇540481632┇5120.60210.90311.20411.5051┇2.70930.60214.51557.22463.0102┇13.546572.2471

頻數(shù)表資料的幾何均數(shù)抗體滴度人數(shù),f滴度倒數(shù),XlgX763.中位數(shù)(median)符號:M意義:中位數(shù)是將全部觀察值由小到大排列后位次居中的數(shù)據(jù)值。適用條件:①偏態(tài)分布的資料;②分布類型不明的資料;③開口資料3.中位數(shù)(median)符號:M77計(jì)算:先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):僅僅利用了中間的1~2個(gè)數(shù)據(jù)(n為奇數(shù))(n為偶數(shù))計(jì)算:先將觀察值按從小到大順序排列,再按以下公式計(jì)算:特點(diǎn):78頻數(shù)表資料的中位數(shù)對于頻數(shù)表資料可通過百分位數(shù)法計(jì)算中位數(shù)。

百分位數(shù):是一種位置指標(biāo),用表示。是一個(gè)界值,它將觀察值分成兩部分,有X%的觀察值比它小,有(100-X)%的觀察值比它大。

如:第25百分位數(shù)第50百分位數(shù)第75百分位數(shù)第50百分位數(shù)即中位數(shù)頻數(shù)表資料的中位數(shù)對于頻數(shù)表資料可通過百分位數(shù)法計(jì)算中位數(shù)79

頻數(shù)表資料中百分位數(shù)計(jì)算方法:

百分位數(shù)該組的頻數(shù)所在組段的下限該組段的組距總頻數(shù)該組段之前的累計(jì)頻數(shù)頻數(shù)表資料中百分位數(shù)計(jì)算方法:百分位數(shù)該組的頻數(shù)所在80潛伏期/h(1)頻數(shù),f(2)累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48合計(jì)2145145—例4-8潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176~466381均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布:均數(shù)≈中位數(shù)右(正)偏態(tài)分布:均數(shù)>中位數(shù)左(負(fù))偏態(tài)分布時(shí):均數(shù)<中位數(shù)均數(shù)、中位數(shù)二者關(guān)系正態(tài)分布:均數(shù)≈中位數(shù)82【例】某地239名居民發(fā)汞(mol/kg)分布組段頻數(shù)累積頻數(shù)累積百分比1-20208.373-668635.985-6014661.097-4819481.179-1821288.7011-1622895.4013-623497.9115-123598.3317-123698.7419-3239100.00合計(jì)239【例】某地239名居民發(fā)汞(mol/kg)分布組段頻數(shù)累積83Mean=6.69Median=6.00右偏態(tài)分布時(shí)中位數(shù)與均數(shù)的關(guān)系Mean=6.69Median=6.00右偏態(tài)分布時(shí)中位數(shù)與84小結(jié):

集中趨勢的描述——平均數(shù)

定義:描述一組變量值的集中位置或平均水平的指標(biāo)體系。應(yīng)用:均數(shù):正態(tài)分布或?qū)ΨQ分布資料(參數(shù)方法)中位數(shù):偏態(tài)分布或未知分布資料(非參數(shù)方法)幾何均數(shù)—變量值呈倍數(shù)(等比級數(shù))關(guān)系,或資料呈對數(shù)正態(tài)分布。小結(jié):集中趨勢的描述——平均數(shù)定義:描述一組變量值的集中85(二)、描述離散趨勢的指標(biāo)(變異指標(biāo))反映數(shù)據(jù)的離散度,即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差/全距(range)

2.四分位數(shù)間距(IQR,inter-quartilerange)

3.方差(variance)

4.標(biāo)準(zhǔn)差(standarddeviation)

5.變異系數(shù)(coefficientofvariation)

(二)、描述離散趨勢的指標(biāo)(變異指標(biāo))反映數(shù)據(jù)的離散度,即個(gè)861、極差/全距(range,

R)符號:R計(jì)算:意義:反映個(gè)體變異的范圍。適用范圍:任何計(jì)量資料,是參考變異指標(biāo)缺點(diǎn):1.只利用了兩個(gè)極端值

2.n大,R也會大

3.穩(wěn)定性差1、極差/全距(range,R)符號:R87一組性質(zhì)相同的定量數(shù)據(jù)中,第75百分位數(shù)()與第25百分位數(shù)()之差,可看作中間一半觀測值的極差。

多用于描述偏態(tài)分布資料的變異水平。2、四分位數(shù)間距(inter-quartilerange,IQR

)一組性質(zhì)相同的定量數(shù)據(jù)中,第75百分位數(shù)()與第25百88潛伏期/h(1)頻數(shù),f(2)累計(jì)頻數(shù)Sf(3)0~17176~466312~3810118~3213324~613930~013936~414342~48合計(jì)2145145—潛伏期/h頻數(shù),f累計(jì)頻數(shù)Sf0~17176~466389反映一組數(shù)據(jù)的平均變異水平,前者是后者的平方。標(biāo)準(zhǔn)差最常應(yīng)用,常結(jié)合均數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論