




已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第二章 計量資料的統(tǒng)計描述,衛(wèi)生統(tǒng)計學教研室任艷峰,Qualitative dataanalysis (ranked),Quantitative data analysis,Statistical description,Statistical Inference,Statistical Inference,Statistical description,Design,Collection of data,Sorting data,Statistical analysis,Statistical analysis,Statistical description,Statistical description,Statistical Inference,Statistical Inference,Parameter Estimation,Hypothesis Test,熟悉頻數(shù)表的劃記步驟,頻數(shù)表的用途。 掌握集中趨勢指標的定義、適用范圍和計算。 掌握離散趨勢指標的定義、適用范圍和計算。,學習目標,定量資料進行描述時,如果樣本量較大,需要對原始資料進行整理,列出頻數(shù)分布表,通過頻數(shù)表以顯示資料的分布類型。,第一節(jié) 頻數(shù)分布表與頻數(shù)分布圖,頻數(shù)(frequency) 某數(shù)值在數(shù)據(jù)中出現(xiàn)的次數(shù)。相對頻數(shù)(frequency) 也叫頻率,數(shù)值在總觀察例數(shù)中所占的比例。頻數(shù)表(frequency table) 將所有“互相排斥的情形”的頻數(shù)毫無遺漏地排列在一起。由頻數(shù)與組段組成。,如1998年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資料: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7。這是什么類型的資料?,一、離散型定量資料的頻數(shù)分布,1998年某地96名孕婦產(chǎn)前檢查次數(shù)分布,圖中橫坐標表示產(chǎn)前檢查次數(shù),縱坐標表示各檢查次數(shù)的孕婦例數(shù)占總孕婦數(shù)的頻率(比例)。從直條高度和分布情況看出,產(chǎn)前檢查次數(shù)分布呈負偏態(tài)分布。,二、連續(xù)型定量資料的頻數(shù)分布,1.找出最大值 和最小值,(一)頻數(shù)分布表的編制方法,2.計算全距 (range,R)也叫極差,(1)根據(jù)數(shù)據(jù)多少,組段數(shù)一般515個左右(10);(2)根據(jù)(R/預(yù)計組段數(shù))估計組距大小 (22.22/10=2.22);(3)確定組段數(shù)和組距;兩端的組段包含最大值和最小值;盡量取整數(shù)作為組段的端點;組距盡量取相等為宜。,3.確定組段數(shù)和組距(class interval),4.列表:根據(jù)下限X上限的原則確定每一例數(shù)據(jù)所歸屬的組段。,標 題,120名正常成年男子血清鐵含量(mol/L)頻數(shù)表,1.揭示資料的分布特征;(1)集中趨勢:大部分數(shù)據(jù)向中間集中,中間數(shù)據(jù)居多。(2)離散趨勢:從中央到兩側(cè),頻數(shù)分布逐漸減少。2 .揭示資料的分布類型; 正態(tài)分布:中間高兩側(cè)低、左右對稱的單峰分布。 偏態(tài)分布:集中位置偏向一側(cè),分布不對稱。3.便于發(fā)現(xiàn)某些特大或特小的可疑值;4.便于計算指標和統(tǒng)計分析。,(二)、頻數(shù)分布表的用途,正偏態(tài),正態(tài)分布,負偏態(tài),120例健康成年男子血清鐵含量分布,頻數(shù)分布圖,120例健康成年男子血清鐵含量分布,頻數(shù)分布圖,頻率密度=頻率/組距,第二節(jié) 集中趨勢的描述,集中趨勢指某計量資料大多數(shù)觀察值所在的中心位置。常用指標有:1.算術(shù)均數(shù)(arithmetic mean),簡稱均數(shù)(mean)2.幾何均數(shù)(geometric mean)3.中位數(shù) (median),算術(shù)均數(shù)(mean),1.定義:算術(shù)平均數(shù)是由所有數(shù)據(jù)之和除以數(shù)據(jù)個數(shù)所得的商數(shù)。反映一組同質(zhì)的觀察值在數(shù)量上的平均水平??傮w均數(shù)用希臘字母,樣本均數(shù)用 表示。,2. 適用范圍:(1)描述對稱分布資料的集中趨勢;(2)描述正態(tài)分布資料的集中趨勢。,3.均數(shù)的計算公式:,(1)直接法:,(2)加權(quán)法,f 為組段的頻數(shù)X0為組段的組中值X0=(上限+下限)/2,例:測得8只正常大鼠的血清中酸性磷酸酶(TACP)含量(U/L)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試計算算數(shù)均數(shù)。,幾何均數(shù)(geometric mean),1. 定義: n個觀察值的連乘積的n次方根,幾何均數(shù)用G表示。2. 適用范圍:(1)成倍數(shù)關(guān)系或等比關(guān)系的資料(2)對數(shù)正態(tài)分布資料,3. 計算公式:,(1)直接法:,(2) 加權(quán)法:,例:7名慢性遷延性肝炎患者的HBsAg滴度資料為:1:16,1:32,1:32,1:64,1:64,1:128,1:512。試計算其幾何均數(shù)。,4.幾何均數(shù)的特點:,(1) 觀察值不能同時存在大于和小于0的數(shù)據(jù),不能有等于0的數(shù)據(jù)。 (2)同一組資料所得幾何均數(shù)小于等于均數(shù)。,中位數(shù)(median),1.中位數(shù):將一組觀察值按照從小到大,或者大到小的順序排列,位次居中的觀察值水平。中位數(shù)用M表示。百分位數(shù)(percentile):一個位置指標,用Px表示。描述觀察值序列在某百分位置的水平。,PX,理論上適用于任何分布類型 ;(2)尤其偏態(tài)分布資料;(3)開口資料;(4)分布類型不清的資料;,2.中位數(shù)的適用范圍:,(1)直接法,3. 計算公式:,(2) 加權(quán)法:,Px :百分位數(shù) L : Px所在組段的下限值 i : 組距 fx : Px所在組段的頻數(shù) n : 樣本例數(shù) f L : 該組段之前的累計頻數(shù),例: 某藥廠觀察9只小鼠口服山紅景醇提物(RSAE)后在缺乏氧條件下的生存時間(分鐘)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。試求其中位數(shù)。,中位數(shù)實例,10例正常人的發(fā)汞值: 1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16.3 M=(4.8+5.6)/2=5.2,對于某項風險較高的新手術(shù)術(shù)后的生存時間進行跟蹤,共調(diào)查了7人, 6人死亡之前分別生存了5天、6天、10天、16天、25天、29天,還有一人術(shù)后30天隨訪時仍存活。本資料屬于“開口”資料。本例數(shù)據(jù)已經(jīng)按從小到大的升序排列,n=7,為奇數(shù),其中位數(shù)為16天。,例:試對下表資料求其中位數(shù)M。,M = P50,描述離散趨勢的指標,第三節(jié)、離散趨勢的描述,離散程度指某計量資料的所有觀察值與中心位置的發(fā)散程度。,描述離散趨勢的指標,極差(range),極差(range,R):又稱全距,一組觀察值中最大值和最小值的差。2. 計算公式:,3. 特點,(1)簡單明了,計算簡單,應(yīng)用廣泛。(2)只能反映最大值和最小值的變異,不能反映所有數(shù)據(jù)的變異。(3)樣本含量n變大時,R也會變大。(4)樣本含量不變時,R抽樣誤差也較大,不穩(wěn)定。,4. 適用范圍:任何分布類型資料,資料做粗略分析。,四分位間距,2. 計算公式:,1.四分位數(shù)(quartile):是特定的百分位數(shù),下四分位數(shù)P25,記作QL;上四分位數(shù)P75,記作QU。上四分位數(shù)P75,與下四分位數(shù)P25之差即是四分位間距。,(1)避免了極差受極端值的影響;(2)樣本含量n變大時,Q比R穩(wěn)定;(3)只能反映中間50%的數(shù)據(jù)的變異,不能反映所有數(shù)據(jù)的變異;(4)去頭棄尾,丟失大量的信息。,3. 特點,(1) 偏態(tài)分布資料;開口資料;分布類型不清的資料(2) Q與M一起使用,描述偏態(tài)分布資料的集中趨勢和離散趨勢。,4. 適用范圍,方差 (variance),1.方差 (variance,2/S2):總體(樣本)內(nèi)所有個體觀察值與總體(樣本)均值的離均差平方和(sum of square)的均值。,2. 計算公式:,自由度:df/ 表示隨機變量能“自由”取值的個數(shù) 例如有一四個數(shù)據(jù)的樣本,受到均數(shù)為5的條件的限制,在自由確定4、2、5三個數(shù)據(jù)后,第四個數(shù)據(jù)只能是9,=3任何統(tǒng)計量自由度的個數(shù)為=n-限制條件的個數(shù)。,(1) 能夠反映所有觀察值之間的離散程度(2) 考慮到每一個觀察值,信息利用充分(3) 對數(shù)據(jù)的變化反應(yīng)靈敏,3. 特點,4. 適用范圍: 正態(tài)分布資料或近似正態(tài)分布資料.,標準差 (standard deviation),1.標準差 (standard deviation,S ) :即方差的正平方根;其單位與原變量X的單位相同??傮w標準差:樣本標準差:S,2. 計算公式:,(1) 能夠反映所有觀察值之間的離散程度(2) 考慮到每一個觀察值,信息利用充分(3)對數(shù)據(jù)的變化反應(yīng)靈敏,3. 特點,(1) 正態(tài)分布資料或近似正態(tài)分布資料(2) 標準差和均數(shù)相結(jié)合,描述正態(tài)分布資料的集中趨勢和離散趨勢,4. 適用范圍,變異系數(shù) (coefficient of variation),1.變異系數(shù) (coefficient of variation,CV ):標準差與相應(yīng)均數(shù)的比值;其意義是標準差為均數(shù)的多少
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 稀土金屬壓延加工的綠色制造實踐與挑戰(zhàn)考核試卷
- 生理參數(shù)監(jiān)測與疾病預(yù)防考核試卷
- 方便食品包裝的可降解材料研究考核試卷
- 流體包裹體對鉻礦成礦作用的指示意義考核試卷
- 安全機器學習與模式識別考核試卷
- 經(jīng)紀人如何進行藝人宣傳推廣與市場營銷策劃考核試卷
- 珠海市高三月質(zhì)量監(jiān)測(二模)理綜生物試題
- 石家莊信息工程職業(yè)學院《Html網(wǎng)頁開發(fā)與設(shè)計》2023-2024學年第二學期期末試卷
- 江西管理職業(yè)學院《田間試驗與統(tǒng)計》2023-2024學年第一學期期末試卷
- 南京理工大學紫金學院《互換性與技術(shù)測量A》2023-2024學年第二學期期末試卷
- 六年級下冊數(shù)學課件-第4單元 比例 整理和復(fù)習 人教版(共21張PPT)
- JJF(魯) 142-2022 稱重式雨量計校準規(guī)范
- Adobe-Illustrator-(Ai)基礎(chǔ)教程
- 程序的運行結(jié)果PPT學習教案
- 圓柱鋼模計算書
- 合成寶石特征x
- 查擺問題及整改措施
- 年度研發(fā)費用專項審計報告模板(共22頁)
- 隧道工程隧道支護結(jié)構(gòu)設(shè)計實用教案
- 得力打卡機破解Excel工作表保護密碼4頁
- 炭陽極焙燒爐7室運行實踐
評論
0/150
提交評論