定量資料統(tǒng)計描述07224_第1頁
定量資料統(tǒng)計描述07224_第2頁
定量資料統(tǒng)計描述07224_第3頁
定量資料統(tǒng)計描述07224_第4頁
定量資料統(tǒng)計描述07224_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、Chapter 4定量資料的統(tǒng)計描述2006年某市120名10歲男孩的身高(cm)資料如:135.4139.8144.0 147.3146.3142.5138.1143.6141.6152.6132.1144.7143.6146.8144.2141.3137.5142.8140.6150.4145.9140.2144.5148.2146.4142.4138.5148.9146.2155.4134.2139.2143.5141.6143.5142.3148.9143.6141.5151.1132.5138.7149.6146.9148.7141.5137.8142.7144.6151.8136.

2、4140.0144.3147.5145.6142.5138.5143.7149.5153.6130.2138.9143.7146.5138.8141.7136.9142.0140.5150.3135.7145.7144.2147.8145.8142.6138.6143.8141.3153.9133.4139.6143.7147.5144.8148.0137.4142.1140.8141.8134.5139.4142.9147.5144.7141.8136.9143.5140.7151.4145.6147.3143.9141.9151.6145.6148.9144.3139.1145.8145.

3、6145.3147.6148.6145.5137.3146.5140.3148.4136.5 2【思考如下問題】根據(jù)前面所學判斷數(shù)據(jù)為何種類型資料?如何描述10歲男孩身高的數(shù)量特征?3頻數(shù)表和頻數(shù)圖 集中趨勢的描述 離散趨勢的描述正態(tài)分布及其應用本章主要內(nèi)容41 頻數(shù)表和頻數(shù)圖5 表達變量取值及其不同取值頻數(shù)分布情況的統(tǒng)計表稱為頻數(shù)分布表,簡稱頻數(shù)表(frequency table)。 一、頻數(shù)表(Frenquency table)(一)、頻數(shù)表的概念6(二)、頻數(shù)表的編制 求極差(range) 找出一組觀察值中的最大值與最小值,其差值即為極差(或全距),用R表示。 如例4-1中:R=155.

4、4-130.2=25.272. 確定組數(shù)和組距(i) 根據(jù)樣本含量的大小及研究目的確定組數(shù);一般設815個組。 例4-1:i=25.2/10=2.52,取整數(shù)2做組距。 83. 確定組段 即確定每一組的起點(下限)和終點(上限) 。 起點稱為下限(lower limit)終點稱為上限(upper limit) 上限=下限+組距94. 歸組計數(shù),整理成表 確定組段界限后,采用計算機或用劃記法將各原始數(shù)據(jù)歸入各組匯總,得出各組段的觀察例數(shù),也就是頻數(shù) 。 10表4-1 2006年某市120名10歲男孩身高(cm)的頻數(shù)表身高(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)1301

5、32134136138140142144146148150152154156 1 3 4 8121721201410 6 3 1 0.8 2.5 3.3 6.710.014.217.516.711.7 8.3 5.0 2.5 0.8 1 4 8 16 28 45 66 86100110116119120 0.8 3.3 6.713.323.337.555.071.783.391.796.799.2100.0合計 120 100.011(三)、頻數(shù)表的用途 揭示資料的頻數(shù)分布特征和頻數(shù)分布類型 頻數(shù)分布的特征: 集中趨勢(central tendency) 離散趨勢(dispersion) 頻數(shù)

6、分布的類型: 對稱分布 偏態(tài)分布 122.便于進一步計算指標和統(tǒng)計處理 利用頻數(shù)表計算百分位數(shù)、中位數(shù)、標準差等3. 便于發(fā)現(xiàn)某些特大或特小的可疑值。對于頻數(shù)表,如果連續(xù)某幾個組段的頻數(shù)為0,接下來的組段出現(xiàn)頻數(shù)不為0的數(shù)值,此數(shù)值即為可疑值。13 頻數(shù)圖(graph of frequency)是以變量值為橫坐標、頻數(shù)(頻率)為縱坐標(不等距分組時以頻率/組距=頻率密度為縱坐標),以每個等寬的矩形面積表示每組的頻數(shù)(或頻率)。二、頻數(shù)圖(graph of frequency) (一)、頻數(shù)圖的概念14連續(xù)型定量資料:頻數(shù)圖中各矩形是相連的,又稱直方圖(histogram);離散型定量資料:頻數(shù)

7、圖中各矩形是間隔的,又稱直條圖(bar graph)。 15圖4-1 2006年某市120名10歲男孩身高的頻數(shù)圖16圖 69例RA患者血清EBV-VCA-IgG 抗體滴度的頻數(shù)分布圖 101名正常人血清肌紅蛋白的頻數(shù)分布172 集中趨勢的描述18定量資料集中趨勢的描述,常用平均數(shù)(average)表達一組同質(zhì)定量數(shù)據(jù)的平均水平或集中位置。 算術均數(shù) 幾何均數(shù) 中位數(shù) 眾數(shù) 調(diào)和均數(shù)19 又稱均數(shù)(mean),是用一組觀察值相加除以觀察值的個數(shù)所得。樣本均數(shù)用 ,總體均數(shù)用 。 算術均數(shù)(arithmetic mean) 201. 計算方法直接法:樣本含量較少 加權法:相同觀察值較多或頻數(shù)表資

8、料21【例4-2】 某醫(yī)生測量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計算該組數(shù)據(jù)的均數(shù)。1022【例4-3】根據(jù)表4-1資料,用加權法求120名10歲男孩身高的均數(shù)。身高(1)頻數(shù)fi(2)組中值xi(3)fixi(4)130132134136138140142144146148150152154156 1 3 48121721201410 6 3 1131133135137139141143145147149151153155 131 399 540109616682397300329002058

9、1490906459155合計120( )17202( )表4-2 2006年某市120名10歲男孩身高(cm)的均數(shù)計算表232. 應用 均數(shù)適用于對稱分布特別是正態(tài)分布資料集中趨勢的描述。 24 是n個觀察值乘積的n次方根,又稱倍數(shù)均數(shù),用G表示 。 幾何均數(shù)(geometric mean) 251. 計算方法直接法:樣本含量較少 加權法:相同觀察值較多或頻數(shù)表資料26 【例4-4】 某實驗室測得7人血清中某種抗體的滴度分別為1/4,1/8,1/16,1/32,1/64,1/128,1/256,試求平均滴度。 27【例4-6】50名麻疹易感兒接種麻疹疫苗后,測得血凝抑制抗體滴度資料見表4-

10、3,求抗體的平均滴度。86.9977表4-3 50名麻疹易感兒血凝抑制抗體滴度28 50名麻疹易感兒接種麻疹疫苗后血凝抑制抗體的平均滴度為1/54。 292. 應用及注意事項幾何均數(shù)適用 對數(shù)正態(tài)分布 等比級數(shù)資料觀察值中不能有0 觀察值不能有正有負30中位數(shù)與百分位數(shù) 【例4-7】200名食物中毒患者潛伏期資料如表4-4,研究人員據(jù)此采用加權法計算均數(shù)得平均潛伏期為27小時。 (1)該組數(shù)據(jù)在分布上有何特點? (2)用均數(shù)描述該資料的平均水平是否合適? 31表4-4 200名食物中毒患者的潛伏期潛伏期(小時)(1)頻數(shù)(2)累計頻數(shù)(3)累計頻率(%)(4)=(3)/n030 3015.01

11、27110150.5244915074.5362817889.0481419296.060 719999.57284 1200 100.0合計 20032中位數(shù)(median):將一組觀察值由小到大排序后,居于中間位置的數(shù)值即為中位數(shù) ,用 表示。 中位數(shù)是一種位置平均數(shù),它將全部數(shù)據(jù)排列成的有序數(shù)列平均分為兩部分,小于和大于中位數(shù)的觀察值個數(shù)相等,各占50%。 331. 中位數(shù)的計算(1)直接法:觀察值個數(shù)較少 34【例4-8】某實驗師對10只小白鼠染毒后觀察各小鼠的生存時間(分鐘),得數(shù)據(jù)為:35,60,62,63,63,65,66,68,69,69,試計算小白鼠的平均生存時間。 35(2

12、)頻數(shù)表法 :頻數(shù)表資料LM 中位數(shù)所在組段下限 組距 中位數(shù)所在組段的頻數(shù) 中位數(shù)所在組段前一組的累計頻率36求:下表200名食物中毒患者的平均潛伏期潛伏期(小時)(1)頻數(shù)(2)累計頻數(shù)(3)累計頻率(%)(4)=(3)/n030 3015.0127110150.5244915074.5362817889.0481419296.060 719999.57284 1200 100.0合計 20037(小時) 38百分位數(shù)(percentile):是指將一組觀察值由小到大排序后,將其平均分成100等份,對應于每一分割位置上的數(shù)值就稱為一個百分位數(shù),用 表示 。 39 是一種位置指標,一個百分位

13、數(shù)將一組觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大。40【例4-10】根據(jù)表4-4,計算P25、P75。(小時)(小時) 412. 中位數(shù)與百分位數(shù)的應用中 位 數(shù): 偏態(tài)分布資料 一端或兩端無確切值 總體分布不明百分位數(shù):非正態(tài)分布資料 423 離散趨勢的描述 43 【例4-11】分別觀察兩組各9只動物的每日進食量(mg/g),結(jié)果如下: A組 24 25 26 27 28 29 30 31 32 B組 20 21 22 23 24 25 26 27 64兩組動物每日進食量的平均數(shù),均為28mg/g。 思考:28mg/g能否分別代表兩組動物每日近食量的平均

14、水平?44離散趨勢是頻數(shù)分布的另一特征,反映了觀察值之間的變異情況,只有將集中趨勢與離散趨勢結(jié)合起來描述才能全面反映定量資料的數(shù)量特征。 45描述離散趨勢指標 極差 四分位間距 標準差 變異系數(shù)46極差(range,R):亦稱全距,是一組同質(zhì)觀察值中最大值( )與最小值( )之差。 極 差 概念極差越大表示數(shù)據(jù)離散程度越大47只考慮最大值與最小值之差異,不能 反映組內(nèi)其它觀察值的變異度樣本含量越大,極差可能越大 極差描述離散趨勢的局限48四分位數(shù)間距(inter-quartile range,Q):為上四分位數(shù)QU(即P75)與下四分位數(shù)QL (即P25)之差。四分位數(shù)間距 概念49 【例4-

15、12】根據(jù)例4-7資料,計算四分位數(shù)間距。 小時 小時 四分位數(shù)間距: (小時)50每個觀察值x與 間的變異稱為離均差由于變異程度用離均差平方和反應 方 差 考慮觀察值個數(shù)N的影響 51在實際工作中,采用樣本方差 n-1稱為自由度( degree of freedom)方差適用:描述對稱分布特別是正態(tài)分布資料的離散程度。 52方差的度量單位是原度量單位的平方 方差開方后即與原數(shù)據(jù)的度量單位相同, 這就是標準差(standard deviation)標準差 53在實際工作中,常計算樣本標準差 n-1稱為自由度( degree of freedom)標準差適用:描述對稱分布特別是正態(tài)分布資料 的離

16、散程度。 54數(shù)學上可以證明 55 【例4-13】 某醫(yī)生測量了10名腦出血患者的血尿素氮(mmol/L)分別是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,試計算該組數(shù)據(jù)的標準差。56身高(1)頻數(shù)(2)頻率(%)(3)累計頻數(shù)(4)累計頻率(%)(5)130132134136138140142144146148150152154156 1 3 4 8121721201410 6 3 1 0.8 2.5 3.3 6.710.014.217.516.711.78.35.02.50.8 1 4 8 16 28 45 66 86100110116119120 0

17、.8 3.3 6.713.323.337.555.071.783.391.796.799.2100.0合計 120 100.0【例4-14】根據(jù)下表資料,計算120名10歲男孩身高的標準差。5758 【例4-15】某醫(yī)院預防保健科,對一組5歲男孩進行體檢,測量身高、體重等指標。得身高均數(shù)與標準差為115.8 cm和4.5 cm,體重均數(shù)與標準差為20.2kg和0.56 kg,得出結(jié)論:身高的變異程度比體重大。變異系數(shù) 上述結(jié)論是否正確? 59變異系數(shù)(coefficient of variation,簡記為CV):是一組觀察值的標準差與其均數(shù)的比值, 概念度量衡單位不同的資料單位相同但均數(shù)相差

18、懸殊的兩組或多組資料 適用于60根據(jù)例4-15資料分別計算身高與體重的變異系數(shù)。身高:體重: 614 正態(tài)分布及其應用62圖4-1 120名10歲男孩身高資料的頻數(shù)圖 6364正態(tài)分布(normal distribution)稱為高斯分布(Gauss distribution),如果連續(xù)型隨機變量X的概率密度函數(shù)為: 概念正態(tài)分布的概念與特征 則稱隨機變量X服從參數(shù)為 和 的正態(tài)分布,記作: x 65正態(tài)曲線(normal curve)在橫軸上方均數(shù)處最高;并以均數(shù)為中心,左右對稱;兩端與橫軸永不相交,呈鐘形曲線。 正態(tài)分布特征正態(tài)曲線66正態(tài)分布有兩個參數(shù),即位置參數(shù) 和形狀參數(shù) 峰的位置位

19、置參數(shù)67形態(tài)參數(shù)68正態(tài)曲線下面積的分布有一定的規(guī)律。 正態(tài)曲線與橫軸之間的面積恒等于1或100%;對稱分布,對稱軸兩側(cè)的面積各為50;在 區(qū)間的面積為68.27 在 區(qū)間的面積為95.00 在 區(qū)間的面積為99.00 6970思考:能否編制正態(tài)曲線下面積的分布表,然后通過查表來確定某區(qū)間對應的面積呢? 標準正態(tài)分布 統(tǒng)計學家發(fā)現(xiàn),可以使所有的正態(tài)分布轉(zhuǎn)化為統(tǒng)一的 , 的正態(tài)分布,該正態(tài)分布稱為標準正態(tài)分布(standard normal distribution)。 71這種變換稱為標準化變換或Z變換。若X服從正態(tài)分布 ,則Z就服從 。 72標準正態(tài)分布曲線下面積分布規(guī)律73 【例4-18

20、】 已知某地2003年18歲男大學生身高的均數(shù) cm,標準差 cm,且18歲男大學生的身高服從正態(tài)分布。問該地18歲男大學生中身高在166.8 cm及其以下者占多大的比例? 先將x轉(zhuǎn)換為z 查附表3 表的左側(cè)找-1.9,表的上方找0.06,相交處為0.025 74 【例4-19】某地2003年抽樣調(diào)查了100名18歲男大學生身高,算得均數(shù)為172.70cm,標準差為4.01cm。正態(tài)分布的應用 估計正態(tài)分布資料的頻數(shù)分布 【問題】 該地18歲男大學生中身高在162.35cm183.05cm 范圍內(nèi)者所占的比例是多少?75 查附表3, 左側(cè)的面積為0.005,由正態(tài)分布曲線的對稱性可知, 右側(cè)的面積也為0.005,又由正態(tài)分布曲線下的總面積為1,可得-2.58與2.58之間的面積為1-20.005=0.99=99% 。76制定醫(yī)學參考值范圍 醫(yī)學參考值范圍:亦稱正常值范圍,指絕大多數(shù)“正常人”的解剖、生理、生化等指標的波動范圍。所謂“正常人”不是指絕對的“健康人”,而是指排除了影響

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論