版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、計量資料的統(tǒng)計描述 statistical description本次課內(nèi)容一、頻數(shù)表二、計量資料的頻數(shù)分布三、集中趨勢指標四、離散趨勢指標五、正態(tài)分布頻數(shù)表的繪制頻數(shù)分布表(frequency distribution table)對資料中各變量值的頻數(shù)匯總而成的表格,用來反映各變量值與其頻數(shù)間的關(guān)系,可以觀察該資料的分布類型。是最基礎(chǔ)的統(tǒng)計描述。例:某市1995年110名7歲男童的身高(cm)某市1995年110名7歲男童的身高(cm)(1)計算極差:找出觀察值中最大值與最小值,二者之差稱為極差(全距Range)。R 表示。本例134.5-110.2=24.3。(2)決定組數(shù)(class
2、number)、組段(class)、組距(class interval):組數(shù):不宜過多或過少。8-12組組段:變量值的范圍。有上限,下限。組距:相鄰兩組段下限值之差稱為組距,一般等距,R/組數(shù)之商。本例:預(yù)分為10組,組距:24.3/10=2.43,取2自上而下、從小到大排列。第一組段包括最小值,最后組段包括最大值。某市1995年110名7歲男童的身高(cm)(3)列表劃記:將原始數(shù)據(jù)用劃記法做出頻數(shù)表,得出各組段的頻數(shù)、頻率、累計頻率。注意事項:A: 除最后組段除外,組段無上限。B: 盡量做到等組距。特殊情況特殊對待。如年齡,數(shù)值差異很大;C:要有頻數(shù)、頻率、累計頻率標記。某市1995年1
3、10名7歲男童的身高(cm)頻數(shù)表頻數(shù)表的用途:(1)揭示頻數(shù)的分布特征:兩個重要特征:集中趨勢(central tendency):數(shù)值高低不等,但中等水平的人數(shù)最多。離散趨勢(tendency of dispersion):是指一組數(shù)據(jù)背離分布中心值的特征,反映各變量值遠離其中心值的程度 。 身高(cm)某市1995年110名7歲男童的身高分布直方圖頻數(shù)圖(frequency diagram):統(tǒng)計描述(statistical description):描述必須基于資料的分布(distribution)類型,主要是資料的分布特征。分布類型不同,統(tǒng)計指標不同。分布:數(shù)值在所研究樣本(或總體)
4、中的存在狀態(tài),通常用頻數(shù)(frequency)來表示。頻數(shù):某變量值出現(xiàn)的次數(shù)(某現(xiàn)象發(fā)生的次數(shù))。頻數(shù)的分布特征:集中趨勢(central tendency):數(shù)值高低不等,但中等水平的人數(shù)最多。離散趨勢(tendency of dispersion):數(shù)值之間參差不齊;逐漸變大(或變小)的人數(shù)漸少。向兩端分散。兩方面含義:數(shù)值大小和位置。集中趨勢central tendency平均數(shù)(average):用于描述數(shù)值變量資料的集中趨勢(平均水平)。特點:簡明概括,便于比較。包括:算術(shù)平均數(shù),幾何平均數(shù),中位數(shù),百分位數(shù)1、算術(shù)平均數(shù)(arithmetic mean)一組變量值之和除以變量值個
5、數(shù)所得的商,簡稱均數(shù)??傮w均數(shù) ,樣本均數(shù) 表示。適用條件:資料成正態(tài)分布(或近似正態(tài),或?qū)ΨQ分布)。計算方法:直接法,加權(quán)法直接法:當樣本的觀察值個數(shù)不多時,將各觀察值X1,X2,Xn相加再除以觀察值的個數(shù)n(樣本含量)即得均數(shù)。 公式:加權(quán)法weighted method當觀察值個數(shù)較多時,可先將各觀察值分組歸納成頻數(shù)表,用加權(quán)法求均數(shù)。利用頻數(shù)表,計算組中值(為本組段的下限與相鄰較大組段的下限的均值),各組段頻數(shù)與組中值的乘積,近似等于該組變量值之和,各乘積之和除以總頻數(shù),所得的商,就是均數(shù)。幾何均數(shù)是算數(shù)均數(shù)的近似值。均數(shù)的兩個重要屬性:(1)各離均差(各觀察值與均數(shù)之差)的總和等于零
6、。(2)離均差的平方和小于各個觀察值X與任何數(shù)a(a )之差的平方和。均數(shù)是一組觀察值理想的代表值。均數(shù)的應(yīng)用:(1)只能在合理分布的基礎(chǔ)上,對同質(zhì)事物求均數(shù)才有意義,才能反映事物的特性。(2)均數(shù)最適用于對稱分布,尤其是正態(tài)分布資料。此時,均數(shù)位于分布的中央,能反映觀察值的集中趨勢。2、幾何均數(shù)geometric mean G將n個觀察值的乘積再開n次方的方根(或各觀察值對數(shù)值均值的反對數(shù))。適用條件: (1)觀察值為非對稱分布,差距較大,用算術(shù)均數(shù)表示其平均水平會受少數(shù)特大或特小值影響;(2)數(shù)值按大小順序排列后,各觀察值呈倍數(shù)關(guān)系或近似倍數(shù)關(guān)系。如:抗體滴度,藥物效價等直接法:當觀察例數(shù)
7、不多時采用。加權(quán)法:觀察例數(shù)多時采用。幾何均數(shù)的應(yīng)用:(1)常用于等比級數(shù)資料,滴度,效價,衛(wèi)生事業(yè)平均發(fā)展速度,人口幾何增長,對數(shù)正態(tài)分布資料;(2)觀察值不能有0;(3)觀察值不能同時有正值和負值。(4)同一組資料求得的幾何均數(shù)小于算術(shù)均數(shù)。中位數(shù)(median, M) :位于中間位置上的數(shù)值。把一組觀察值,按大小順序排列,位置居中的變量值(奇數(shù)個)或位置居中的兩個變量值的均值(偶數(shù)個)。是位置指標,以中位數(shù)為界,將觀察值分為兩半,有一半比它大,一般比它小。適用于:(1)資料偏態(tài)分布;(2)兩端無確定數(shù)值;(3)資料分布不清楚;潛伏期,毒物測定值等用中位數(shù)表示其集中趨勢。中位數(shù)的算法:未分
8、組資料,依變量個數(shù)定。 分組資料,用下公式。L:中位數(shù)所在組的下限W:中位數(shù)所在組的寬度f:中位數(shù)所在組的頻數(shù)(例數(shù))n:總頻數(shù)C:中位數(shù)所在組的前一組的累計頻數(shù)百分位數(shù)(percentile, P):位于某個百分位置上的數(shù)值。把一組數(shù)據(jù)從小到大排列,分成100等份,各等份含1%的觀察值,處在分割界線上的數(shù)值,就是百分位數(shù),Pr 表示。百分位數(shù)將總體或樣本的全部觀察值分為兩部分,理論上有r%的觀察值比它小,有(100-r)%的觀察值比它大。如含量為n的樣本,P5即表示:理論上有n5%個觀察值比P5小,有n95%個觀察值比P5大。常用的百分位數(shù):5,25,75,95 分位數(shù)。百分位數(shù)頻數(shù)表法計算
9、:Pr:百分位數(shù);L:該百分位數(shù)所在組段的下限;W: 組距;f:該百分位數(shù)所在組段的頻數(shù); C: 小于L的各組段的累積頻數(shù);n:樣本數(shù)中位數(shù)是特定的百分位數(shù)。中位數(shù)常用于描述偏態(tài)分布資料的集中趨勢,它反映居中位置的變量值的大小。不受特大,特小值的影響,只受位置居中的觀察值的影響,因而不夠敏感。而均數(shù),幾何均數(shù)是由全部觀察值綜合計算出的,敏感性好。但理論上,中位數(shù)等于算術(shù)均數(shù)。百分位數(shù)常用于描述一組資料在某百分位置上的水平和分布特征。多個百分位數(shù)結(jié)合使用,可更全面地描述總體或樣本的分布特征,包括位置大小和變異度。百分位數(shù)常用于確定醫(yī)學(xué)正常值范圍(normal range)。醫(yī)學(xué)正常值范圍,不用樣
10、本觀察值的極差,習慣上用包括95%正常人的界值,百分位數(shù)是數(shù)列的百分界值。如:白細胞數(shù)的確定,過高,過低都屬異常,故計算P2.5,P97.5,為雙側(cè)的正常值范圍。如:肺活量95%正常值范圍,只有過低算異常,故計算P5.如:尿鉛,過高為異常,故計算P95.一般說,分布中部的百分位數(shù)相當穩(wěn)定,具有較好代表性,靠近兩端的百分位數(shù),只在樣本含量足夠大時,才穩(wěn)定,故,樣本量不夠大時,不應(yīng)取太近兩端的百分位數(shù)。 以上是集中趨勢指標。A: 8 9 10 11 12B: 3 7 10 13 17 兩組均數(shù)都為10,但離散程度不同,B組較大。均數(shù)只反映平均水平,不能反映離散度。離散趨勢tendency of d
11、ispersion全距,四分位數(shù)間距,方差,標準差,變異系數(shù)全距(Range):極大與極小值之差。全距大,資料離散程度大,但易受極端值大小的影響。樣本量越大,抽到極端值的可能性越大,全距可能會越大。故:全距不宜單獨使用。四分位數(shù)間距(quartile interval Q):將一組資料分為四等份,上四分位數(shù)P75和下四分位數(shù)P25之差,叫四分位數(shù)間距。意義:Q越大,離散程度越大,通常用于描述偏態(tài)分布資料的離散程度。優(yōu)點:比全距穩(wěn)定;若資料一端或兩端無確切數(shù)值,只能選擇Q作為離散指標。缺點:未考慮全部觀察值,不能全面反映資料離散趨勢。方差(variance)和標準差(standard devia
12、tion SD)對總體而言,為了克服極差和四分位數(shù)間距的缺點,要描述資料的離散趨勢,必須考慮到各個觀察值,離均差的平方和是最好的指標, 為了消除例數(shù)的影響,將其取均值,就是方差。 總體方差: 樣本方差:標準差:方差的平方根的正值。 總體的標準差: 樣本的標準差:自由度=n-1樣本的標準差:分組資料的標準差計算意義:方差,標準差越大,變異程度越大。其值越小,觀察值的離散度越小,用均數(shù)反映平均水平的代表性越好。標準差應(yīng)用:(1)反映一組觀察值的離散程度: 直接比較標準差:數(shù)值單位相同; 計算變異系數(shù):數(shù)值單位不同;變異系數(shù)(coefficient of variation, CV) 也稱離散系數(shù)(
13、coefficient of dispersion)標準差與均數(shù)之比用百分數(shù)表示。公式:常用于比較度量單位不同或均數(shù)相差懸殊的資料的變異。同時考慮了均數(shù)和標準差,更客觀。比如:身高,體重的變異比較;(2)估計變量值的頻數(shù)分布:正態(tài)曲線,正態(tài)分布normal distribution正態(tài)分布標準正態(tài)分布面積(或概率) -1 +1 -1 +168.27% 1.96 +1.96-1.96 +1.9695.00% 2.58 +2.58-2.58 +2.5899.00%(3)計算標準誤(4)估計醫(yī)學(xué)正常值范圍:雙側(cè):均數(shù) 1.96倍標準差單側(cè):均數(shù) 1.645倍標準差概念: 頻數(shù)分布以均數(shù)為中心,左右兩
14、側(cè)基本對稱,靠近均數(shù)兩側(cè)頻數(shù)較多,離均數(shù)愈遠,頻數(shù)愈少,形成一個中間多,兩側(cè)逐漸減少的對稱分布。是一種連續(xù)型分布。又稱高斯分布. 高斯(Johann Carl Friedrich Gauss,生于1777年4月30日于不倫瑞克,卒于1855年2月23日于哥廷根,德國著名數(shù)學(xué)家、天文學(xué)家、大地測量學(xué)家、物理學(xué)家。被認為是最重要的數(shù)學(xué)家,并有數(shù)學(xué)王子的美譽。 正態(tài)分布(normal distribution)正態(tài)分布用N(, )表示,其位置與均數(shù)有關(guān),形狀與標準差有關(guān)。醫(yī)學(xué)現(xiàn)象許多呈正態(tài)分布,或近似正態(tài)分布:如正常人的生理,生化指標變量,等從直方圖到正態(tài)曲線的過渡對稱分布正(右)偏分布負(左)偏分
15、布幾種常見的頻數(shù)分布正態(tài)分布有兩個特征:對稱和正態(tài)峰。分布不對稱就是偏態(tài)。峰偏左,長尾向右側(cè)(即觀察值較大一端)伸延的叫右偏態(tài),此時均數(shù)與眾數(shù)之差為正值,故稱正偏態(tài);峰偏右,長尾向左側(cè)(即觀察值較小一端)伸延的叫左偏態(tài),此時均數(shù)與眾數(shù)之差為負值,故稱負偏態(tài)。正態(tài)分布之所以重要, 三個主要原因:1. 正態(tài)分布在分析上較易處理。2. 正態(tài)分布之概率密度函數(shù)(p.d.f.,probability density function)的圖形為鐘形曲線(bell-shaped curve), 對稱, 很適合當做不少事件之機率模式。3. 正態(tài)分布可當做不少大樣本的近似分布。 正態(tài)分布的密度函數(shù):式中為均數(shù);
16、為標準差;為圓周率;為自然對數(shù)的底,即2.71828。以上均為常數(shù),僅x為變量。主要特征1集中性:正態(tài)曲線的高峰位于正中央,即均數(shù)所在的位置。 2對稱性:正態(tài)曲線以均數(shù)為中心,左右對稱,曲線兩端永遠不與橫軸相交。 3均勻變動性:正態(tài)曲線由均數(shù)所在處開始,分別向左右兩側(cè)逐漸均勻下降。 4正態(tài)分布有兩個參數(shù),即均數(shù)和標準差,可記作N(,2):均數(shù)決定正態(tài)曲線的中心位置;標準差決定正態(tài)曲線的陡峭或扁平程度。越小,曲線越陡峭;越大,曲線越扁平。 5u變換:為了便于描述和應(yīng)用,常將正態(tài)變量作數(shù)據(jù)轉(zhuǎn)換。 標準正態(tài)分布:為了應(yīng)用方便,常將式進行變量變換,即:u變換. 所得到的新變量u的分布即為標準正態(tài)分布。
17、u的含義:變量到均數(shù)間的距離相當于標準差的倍數(shù)。標準正態(tài)分布的概率密度函數(shù):正態(tài)分布曲線的模擬u變換后,=0,=1,使原來的正態(tài)分布變換為標準正態(tài)分布(standard normal distribution)亦稱u分布。標準正態(tài)分布 N(0,1).正態(tài)分布的特征和分布規(guī)律: (1)曲線在x軸的上方,與x軸不相交,當x=時,曲線位于最高點。 f(u=0)=0.3989(2)曲線關(guān)于直線x=左右對稱。(3)正態(tài)分布有兩個參數(shù):均數(shù),標準差;標準正態(tài)的參數(shù)分別為:0, 1(4)正態(tài)分布的面積分布有一定規(guī)律。正態(tài)曲線下面積的分布規(guī)律正態(tài)曲線下,橫軸上一定區(qū)間的面積,等于該區(qū)間的頻數(shù)發(fā)生的概率(即所有
18、隨機事件發(fā)生的概率)。面積可用積分求得。F(x)為正態(tài)變量X 的累積分布函數(shù),反映正態(tài)曲線下,自- 到x的面積,即左側(cè)累積面積。 統(tǒng)計學(xué)家已經(jīng)按 編成了附表(p194),標準正態(tài)分布曲線下的面積。應(yīng)用時注意:(1)當總體 , 已知時,先計算u值,再用u值查表,得出所求區(qū)間面積占總面積的比例。如果未知,常分別用樣本均數(shù)和樣本標準差來估計。(2)曲線下對稱于0的區(qū)間,面積相等。如:區(qū)間(- ,-2.58)與區(qū)間(2.58, )的面積相等。(3)曲線下橫軸上的總面積為100% 或為1。根據(jù)后兩個特征,可計算右側(cè)累積面積。3原則 P(-X+)=68.3%P(-2X+2)=95.4%P(-3X+3)=9
19、9.7%正態(tài)分布標準正態(tài)分布面積(或概率) -1_ +1 -1_+168.27%1.96_+1.96-1.96_+1.9695.00% 2.58_+2.58-2.58_+2.5899.00%正態(tài)分布和標準正態(tài)分布曲線下面積分布規(guī)律(-1,1),68.27%(-1.96,1.96),95%(-2.58,2.58),99%雙側(cè)概率單側(cè)概率正態(tài)曲線下面積的分布規(guī)律的應(yīng)用:一、確定醫(yī)學(xué)參考值范圍意義:是正常人指標測定值的波動范圍,可用于劃分正常,或異常。步驟:1、抽樣 2、控制測量誤差 3、取單側(cè)或雙側(cè) 4、選定合適的百分界限 5、資料正態(tài)性檢驗 6、進行參考值估計常用方法:正態(tài)分布法,對數(shù)正態(tài)分布法,百分位數(shù)法95%正常值范圍的估計適用對象雙側(cè)界限單側(cè)上界單側(cè)下界正態(tài)分布法正
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)字電視安裝質(zhì)量保證協(xié)議
- 2024專業(yè)版商業(yè)合作合同書
- 房屋建筑工程清包合同格式
- 集資房指標轉(zhuǎn)讓協(xié)議書
- 婚前購房協(xié)議書范本
- 技術(shù)合作三方協(xié)議
- 國際快遞服務(wù)協(xié)議范本
- 2024年購車借款協(xié)議書范本
- 股權(quán)分紅協(xié)議書模板
- 二手購房合同協(xié)議范本
- 坐標紙(網(wǎng)格型坐標紙-直接打印即可)
- 占比分析類PPT模板
- GB/T 21633-2020摻混肥料(BB肥)
- GB/T 21435-2008相變加熱爐
- 河南省洛陽市《綜合能力測試》事業(yè)單位國考真題
- 智慧消防整體解決方案消防大數(shù)據(jù)一體化管理平臺解課件
- 《推窗風來》中考語文作文優(yōu)秀6篇
- 腹部血管疾病的超聲診斷課件整理
- 《客源國概論》期末考試題
- 公司吸煙管理規(guī)定范文
- 《江蘇省建筑業(yè)10項新技術(shù)(2021)》
評論
0/150
提交評論