定量資料統(tǒng)計描述課件_第1頁
定量資料統(tǒng)計描述課件_第2頁
定量資料統(tǒng)計描述課件_第3頁
定量資料統(tǒng)計描述課件_第4頁
定量資料統(tǒng)計描述課件_第5頁
已閱讀5頁,還剩49頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第二章定量資料的統(tǒng)計描述3定量資料統(tǒng)計描述第一節(jié)頻數(shù)與頻數(shù)分布

(frequencydistribution)

頻數(shù)分布表,又稱頻數(shù)表,是對樣本量較大的資料進(jìn)行統(tǒng)計描述的常用方法。通過頻數(shù)表可以顯示數(shù)據(jù)分布的范圍與形態(tài)。3定量資料統(tǒng)計描述例:某地用隨機(jī)抽樣方法檢查140名成年男子的紅細(xì)胞數(shù)5.953.82一、連續(xù)型定量變量的頻數(shù)分布3定量資料統(tǒng)計描述頻數(shù)表(frequencytable)的編制:求極差(range):R=Max-Min=5.95-3.82=2.13確定組段數(shù)、組距和組段1.確定組段數(shù)(k):通常10-15個。2.確定組距(i):相鄰兩組段的最小值(下限)之差,一般用等距。i=R/k,一般取整取偶數(shù)。3.確定組限:界限分明,每個組段的起點稱下限,終點稱上限。最末一行應(yīng)同時寫出下限和上限。

4.列表劃記:得到各組段的觀察單位數(shù)。3定量資料統(tǒng)計描述3定量資料統(tǒng)計描述紅細(xì)胞數(shù)組中值頻數(shù)頻率(%)3.80~3.9021.44.00~4.1064.34.20~4.30117.94.40~4.502517.94.60~4.703222.94.80~4.902719.35.00~5.101712.15.20~5.30139.35.40~5.5042.95.60~5.7021.45.80~6.005.9010.7某地140名正常男子紅細(xì)胞數(shù)頻數(shù)表3定量資料統(tǒng)計描述直方圖3定量資料統(tǒng)計描述頻數(shù)分布表的用途可以替代繁瑣的原始資料,便于進(jìn)一步分析;便于觀察數(shù)據(jù)的分布類型;便于發(fā)現(xiàn)資料中某些遠(yuǎn)離群體的特大或特小的可疑值;樣本含量較大時,可用各組段的頻率作為概率的估計值。3定量資料統(tǒng)計描述頻數(shù)分布的類型對稱分布偏態(tài)分布正偏態(tài):負(fù)偏態(tài):3定量資料統(tǒng)計描述二、離散型定量變量的頻數(shù)分布例2-1:1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,……….,4,7。表2-1是96名婦女產(chǎn)前檢查次數(shù)分布的頻數(shù)表3定量資料統(tǒng)計描述表2-11998年某地96名婦女產(chǎn)前檢查次數(shù)分布檢查次數(shù)頻數(shù)頻率(%)累計人數(shù)累計頻率

044.244.2177.31111.521111.52222.931313.53536.542627.16163.552324.08487.5

>51212.596100.0

合計961003定量資料統(tǒng)計描述3定量資料統(tǒng)計描述第二節(jié)集中趨勢指標(biāo)集中趨勢指標(biāo)用于描述一組同質(zhì)計量資料的集中趨勢或反映一組觀察值的平均水平。常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)及中位數(shù)三種。3定量資料統(tǒng)計描述一、算術(shù)均數(shù)(mean)算術(shù)均數(shù)簡稱平均數(shù)或均數(shù)。X表示變量X的樣本均數(shù),

(希臘字母)表示總體均數(shù)。均數(shù)適用于對稱分布資料,正態(tài)或近似正態(tài)分布資料。3定量資料統(tǒng)計描述計算方法直接法:當(dāng)樣本含量n較小時,可選用此法。設(shè)有n個觀察值,分別為X1,X2

……,Xn,均數(shù)的計算公式為:3定量資料統(tǒng)計描述例1.10名12歲男孩身高(cm)分別為125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.122.5,140.0。求平均數(shù)。3定量資料統(tǒng)計描述加權(quán)法:當(dāng)樣本含量n較大時,一般將觀察值分組,列出頻數(shù)表,再用加權(quán)法計算均數(shù)。其計算公式為:式中f為各組的頻數(shù),x為各組的組中值。3定量資料統(tǒng)計描述3定量資料統(tǒng)計描述1.編制頻數(shù)表(1)求全距:R=183.5-162.9=20.6(cm)(2)求組段和組距:20.6÷10=2.06,取整數(shù)2.0cm為組距;第一組段的下限為162(3)列出頻數(shù)表:表7-1中第3列為組中值X,計算方法是將本組下限和下組下限相加除以2,如第一組X1=(162+164)/2=163,余此類推。第4列fX是頻數(shù)f和組中值X的乘積。3定量資料統(tǒng)計描述3定量資料統(tǒng)計描述2.根據(jù)公式計算110名20歲健康男大學(xué)生的身高均數(shù)為172.73cm。3定量資料統(tǒng)計描述二、幾何均數(shù)

(geometricmean,G)幾何均數(shù)用G表示。適用于對數(shù)正態(tài)分布資料或等比資料,例如抗體的平均滴度和平均效價。計算方法:直接法:樣本含量n較小時,選用此法。有n個觀察值X1,X2,……Xn,幾何均數(shù)的計算公式為:3定量資料統(tǒng)計描述上式計算時需作連乘,還要開n次方,比較麻煩,一般采用對數(shù)形式計算。3定量資料統(tǒng)計描述例.6份血清抗體滴度為:1:2,1:4,1:8,1:8,1:16,1:32,求平均數(shù)。幾何平均滴度為1:8

3定量資料統(tǒng)計描述102名健康人的鉤端螺旋體血清抗體平均滴度抗體滴度(1)人數(shù)f(2)滴度倒數(shù)X

(3)lgX(4)flgX(5)=(2)(4)1︰10071002.00014.0001︰200192002.30143.7191︰400344002.60288.4681︰800298002.90384.1871︰16001316003.20441.652

合計102272.0263定量資料統(tǒng)計描述三、中位數(shù)(median,M)將一組觀察值從小到大按順序排列,位次居中的觀察值就稱中位數(shù)。用M表示。中位數(shù)適用于任何一種分布的計量數(shù)據(jù),一般多用于描述偏態(tài)分布或數(shù)據(jù)一端無界資料的集中趨勢。3定量資料統(tǒng)計描述計算方法直接法:樣本含量n較小時,可根據(jù)下式計算:n為奇數(shù)時n為偶數(shù)時3定量資料統(tǒng)計描述某病患者5人潛伏期分別為2,4,6,7,20,求中位數(shù)。本例n=5,為奇數(shù)天若上例在第25天又發(fā)現(xiàn)一例患者,患者數(shù)增加為6名3定量資料統(tǒng)計描述頻數(shù)表法:樣本含量n較大時計算中位數(shù)可用頻數(shù)表法。將觀察資料歸納成頻數(shù)表,計算累計頻數(shù),按下式計算。L為本組(中位數(shù)所在組)下限,i為本組組距,f為本組頻數(shù),ΣfL為上一組的累計頻數(shù)。本組位置可根據(jù)累計頻數(shù)的數(shù)值來判斷。當(dāng)某一組的累計頻數(shù)首先超過n/2時或累計頻率首先超過50%時,即定為本組。3定量資料統(tǒng)計描述107名正常人尿鉛含量分布尿鉛(mg/l)例數(shù)f累計頻數(shù)ΣfL累計頻率(%)0~141413.14~223633.68~296560.712~188377.616~159891.620~610497.124~110598.128~2107100.03定量資料統(tǒng)計描述附:百分位數(shù)(PX)百分位數(shù)是一種位置指標(biāo),用PX表示。對總體來說,它表示總體中數(shù)值小于PX的個體恰有X%;對樣本來說,它表示按照升序排列的數(shù)列里小于PX的個體恰占X%百分位數(shù)是一個有序數(shù)列百等分的分割值。第50百分位數(shù)(P50)也就是中位數(shù),中位數(shù)是一個特定的百分位數(shù)。計算公式:3定量資料統(tǒng)計描述對上例的資料計算P25,P75。求P25,由第4欄可見,第2組的累計頻率超25%,該組即P25所在組。求P75,同理P75在第4組段內(nèi)3定量資料統(tǒng)計描述第三節(jié)離散趨勢指標(biāo)兩組計量數(shù)據(jù)如下,分析其分布特征。甲組:98,99,100,101,102乙組:80,90,100,110,1203定量資料統(tǒng)計描述兩組數(shù)據(jù)的均數(shù)都是100,說明集中趨勢相同。但兩組數(shù)據(jù)的分布特征不盡相同,5個數(shù)據(jù)間的參差不齊的程度不一樣。甲組數(shù)據(jù)的變化范圍較小,而乙組數(shù)據(jù)的變化范圍較大,即兩組的離散度不同,離散度是一個非常重要的統(tǒng)計指標(biāo)。3定量資料統(tǒng)計描述一、全距(range,R)亦稱極差,用R表示,是一組觀察值中最大值與最小值之差,反映個體差異的范圍。全距大,說明變異度大;反之,說明變異度小。如上例中甲組全距為4,乙組全距為40,表明乙組變異度大。但全距除了最大值和最小值之外,不能反映組內(nèi)其它數(shù)據(jù)的變異度;易受個別數(shù)據(jù)的影響,穩(wěn)定性較差,抽樣誤差較大,而且還受n大小的影響,平均起來,n越大,全距越大。3定量資料統(tǒng)計描述二、四分位數(shù)間距

(quartilerange,Q)四分位數(shù)間距是兩個特定的百分位數(shù)之差,用Q表示Q=QU-QL=P75-P25適用于任何分布的計量資料,尤其適用于偏態(tài)分布的資料(不宜用標(biāo)準(zhǔn)差表示離散度)四分位數(shù)間距比全距穩(wěn)定,但仍然未考慮到每個觀察值的變異。3定量資料統(tǒng)計描述三、方差與標(biāo)準(zhǔn)差為克服全距的缺點,應(yīng)全面考慮組內(nèi)每個觀察值的離散情況??煽紤]以總體中每個變量值X與總體平均數(shù)之差,稱為離均差X-

。由于離均差有正有負(fù),其和為0,這樣仍不能反映變異度的大小。故將離均差平方后再相加,稱離均差平方和3定量資料統(tǒng)計描述3定量資料統(tǒng)計描述為了消除觀察值的總個數(shù)N的影響,將離均差平方和除以N,這就是總體方差,用σ2表示。方差的單位是原度量單位(如kg)的平方,把總體方差開平方,這就是總體標(biāo)準(zhǔn)差,度量單位與原始觀察值一致,即方差(variance)標(biāo)準(zhǔn)差(standarddeviation)3定量資料統(tǒng)計描述實際工作中經(jīng)常得到的是樣本資料,總體均數(shù)

是未知的,只能用樣本均數(shù)X代替。這樣用代替,用樣本含量n代替N,所得的結(jié)果比σ偏小。英國統(tǒng)計學(xué)家W.S.Gosset提出用n-1代替n,求得樣本標(biāo)準(zhǔn)差更接近總體標(biāo)準(zhǔn)差σ,樣本標(biāo)準(zhǔn)差用S表示,公式為:上式n-1稱為自由度(ν)。樣本標(biāo)準(zhǔn)差計算也可用直接法或加權(quán)法。n較小時,選擇直接法,n較大,選擇加權(quán)法3定量資料統(tǒng)計描述直接法:由于標(biāo)準(zhǔn)差的計算公式可改寫為:3定量資料統(tǒng)計描述3定量資料統(tǒng)計描述計算兩組數(shù)據(jù)的標(biāo)準(zhǔn)差甲組:n=5,ΣX=98+99+100+101+102=500ΣX2=982+992+1002+1012+1022=50010乙組:n=5,ΣX=500,ΣX2

=51000甲組:98,99,100,101,102

乙組:80,90,100,110,1203定量資料統(tǒng)計描述加權(quán)法3定量資料統(tǒng)計描述例:求表P7-1中110名20歲男大學(xué)生身高的標(biāo)準(zhǔn)差。3定量資料統(tǒng)計描述已知Σf=110,ΣfX=19000,需要在該表中增加fx2欄,由第(3)、(4)欄相乘,再將該欄數(shù)據(jù)相加,將ΣfX2=代入公式3定量資料統(tǒng)計描述四、變異系數(shù)

(coefficientofvariation,CV)適用:(1)比較度量單位不同的多組資料的變異度(2)比較均數(shù)相差懸殊的多組資料變異度計算公式為:3定量資料統(tǒng)計描述例:某地20歲男子100人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為4.95cm,其體重均數(shù)為53.72kg,標(biāo)準(zhǔn)差為4.96kg。請比較何者變異度較大。由于兩者度量單位不同,不能直接比較標(biāo)準(zhǔn)差,而應(yīng)比較變異系數(shù)。身高體重3定量資料統(tǒng)計描述運用離散指標(biāo)的注意事項:1.離散指標(biāo)表示變量值的變異情況,常與集中指標(biāo)(如均數(shù))結(jié)合運用。2.離散指標(biāo)種類雖多,但一般其值大表示變異大,數(shù)值較分散;值小表示變異小,數(shù)值較集中。比較兩個或幾個同類事物的變異,要用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論