版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第七章人群健康研究的統(tǒng)計學(xué)方法人群健康研究的統(tǒng)計學(xué)方法衛(wèi)生統(tǒng)計學(xué)授課提綱
課時:30第一講醫(yī)學(xué)統(tǒng)計的基本概念與基本步驟第二講數(shù)值變量的統(tǒng)計描述;集中趨勢指標(biāo)第三講數(shù)值變量的統(tǒng)計描述;離散趨勢指標(biāo)
第四講數(shù)值變量的統(tǒng)計推斷:總體均數(shù)的估計第五講兩均數(shù)比較的假設(shè)檢驗第六講分類變量的統(tǒng)計描述第七講分類變量的統(tǒng)計推斷:X2檢驗第八講統(tǒng)計圖表、復(fù)習(xí)、階段考試人群健康研究的統(tǒng)計學(xué)方法工作生活中常見的統(tǒng)計學(xué)問題如何判斷藥物的療效?(假設(shè)檢驗)明天是否下雨?體育彩票能否中獎?(概率論)子女為什么象父母,其強度有多大?(相關(guān)與回歸)美國的民意測驗是如何進(jìn)行的?(設(shè)計,抽樣)中國的市場調(diào)查的可信性有多大?(現(xiàn)場調(diào)查)
人群健康研究的統(tǒng)計學(xué)方法第一節(jié)
醫(yī)學(xué)統(tǒng)計方法概述人群健康研究的統(tǒng)計學(xué)方法
在自然界,在人們的實踐活動中,所遇到的現(xiàn)象一般可以分為兩類:
確定現(xiàn)象
隨機現(xiàn)象(偶然現(xiàn)象)
一、統(tǒng)計學(xué)的意義透過偶然現(xiàn)象,分析、判斷和闡述事物的內(nèi)在規(guī)律性人群健康研究的統(tǒng)計學(xué)方法
確定性現(xiàn)象:在一定條件下,一定會發(fā)生或一定不會發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。
例如,向上拋一枚硬幣,由于受到地心引力的作用,硬幣上升到某一高度后必定會下落.我們把這類現(xiàn)象稱為確定性現(xiàn)象(或必然現(xiàn)象).水在2℃會結(jié)冰,肯定不發(fā)生稱不可能事件。
人群健康研究的統(tǒng)計學(xué)方法隨機現(xiàn)象(偶然現(xiàn)象)
在一定的條件下,可能會出現(xiàn)各種不同的結(jié)果,也就是說,在完全相同的條件下,進(jìn)行一系列觀測或?qū)嶒灒瑓s未必出現(xiàn)相同的結(jié)果.
人群健康研究的統(tǒng)計學(xué)方法例如拋擲一枚硬幣,當(dāng)硬幣落在地面上時,可能是正面(有國徽的一面)朝上,也可能是反面朝上,在硬幣落地前我們不能預(yù)知究竟哪一面朝上.我們把這類現(xiàn)象稱為隨機現(xiàn)象(或偶然現(xiàn)象).同樣,自動機床加工制造一個零件,可能是合格品,也可能是不合格品;射擊運動員一次射擊,可能擊中10環(huán),也可能擊中9環(huán)8環(huán)……甚至脫靶等等也都是隨機現(xiàn)象.人群健康研究的統(tǒng)計學(xué)方法統(tǒng)計規(guī)律性
對隨機現(xiàn)象,從表面上看,由于人們事先不能知道會出現(xiàn)哪一種結(jié)果,似乎是不可捉摸的;其實不然.人們通過實踐觀察到并且證明了,在相同的條件下,對隨機現(xiàn)象進(jìn)行大量的重復(fù)試驗(觀測),其結(jié)果總能呈現(xiàn)出某種規(guī)律性.例如,多次重復(fù)拋一枚硬幣,正面朝上和反面朝上的次數(shù)幾乎相等;對某個靶進(jìn)行多次射擊,雖然各次彈著點不完全相同,但這些點卻按一定的規(guī)律分布;等等.我們把隨機現(xiàn)象的這種規(guī)律性稱為統(tǒng)計規(guī)律性。人群健康研究的統(tǒng)計學(xué)方法統(tǒng)計學(xué)是以醫(yī)學(xué)理論為指導(dǎo),運用統(tǒng)計學(xué)原理和方法研究醫(yī)學(xué)領(lǐng)域中居民健康狀況以及衛(wèi)生服務(wù)領(lǐng)域中有關(guān)數(shù)據(jù)的搜集、整理、分析的一門應(yīng)用性科學(xué),是研究隨機現(xiàn)象的統(tǒng)計規(guī)律性的一門科學(xué)
人群健康研究的統(tǒng)計學(xué)方法二、統(tǒng)計學(xué)的幾個基本概念
1.同質(zhì)與變異2.總體與樣本3.變量及變量值4.參數(shù)與統(tǒng)計量5.抽樣與誤差6.概率人群健康研究的統(tǒng)計學(xué)方法1.同質(zhì)與變異homogeneityandvariation
同質(zhì):指事物的性質(zhì)、影響條件或背景相同或非常相近。變異:指同質(zhì)的個體之間的差異。人群健康研究的統(tǒng)計學(xué)方法同質(zhì)與變異的例子例1調(diào)查2003年西安市7歲男童的身高和體重同質(zhì):2003年、西安市、7歲男童變異:身高和體重各不相同例2研究某降壓藥的療效同質(zhì):高血壓患者、用某藥治療變異:療效各不相同人群健康研究的統(tǒng)計學(xué)方法2.總體與樣本
populationandsample總體:根據(jù)研究目的確定的同質(zhì)觀察單位(個體)的全體(集合)。分有限總體與無限總體樣本:從總體中隨機抽取的部分觀察單位
人群健康研究的統(tǒng)計學(xué)方法隨機抽樣randomsampling為了保證樣本的可靠性和代表性,需要采用隨機的抽樣方法(在總體中每個個體具有相同的機會被抽到)。人群健康研究的統(tǒng)計學(xué)方法3.變量及變量值研究者對每個觀察單位的某項特征進(jìn)行觀察和測量,這種特征稱為變量,變量的測得值叫變量值(也叫觀察值),稱為資料。統(tǒng)計上習(xí)慣用大寫拉丁字母表示,如X、Y、Z、…
。
變量值習(xí)慣用小寫拉丁字母表示,如性別x1=1(男)、x2=1
(男)、x3=0
(女)
、…。編號(ID)性別(X)體重(kg)療效(Z)張11660李21781王30572…………人群健康研究的統(tǒng)計學(xué)方法表1120名正常成年男子紅細(xì)胞計量值(1012/L)
5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,極差=2.89算術(shù)均數(shù)=4.72,標(biāo)準(zhǔn)差=0.57
人群健康研究的統(tǒng)計學(xué)方法4.參數(shù)與統(tǒng)計量
parameterandstatistic參數(shù):總體的統(tǒng)計指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母分別記為μ、σ。(為固定的常數(shù))
總體樣本抽取部分觀察單位
統(tǒng)計量
參數(shù)
推斷inference統(tǒng)計量:樣本的統(tǒng)計指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉丁字母分別記為。(參數(shù)附近波動的隨機變量
)人群健康研究的統(tǒng)計學(xué)方法5.抽樣與誤差(error)誤差:實際觀察值與客觀真實值之差(1)系統(tǒng)誤差(2)隨機誤差人群健康研究的統(tǒng)計學(xué)方法(1)系統(tǒng)誤差
systematicerror在實際觀測過程中,由受試對象、研究者、儀器設(shè)備、研究方法、非實驗因素影響等原因造成的有一定傾向性或規(guī)律性的誤差。流行病學(xué)稱之為偏倚(bias)。特點:觀察值有系統(tǒng)性、方向性、周期性的偏離真值??梢酝ㄟ^嚴(yán)格的實驗設(shè)計和技術(shù)措施消除。人群健康研究的統(tǒng)計學(xué)方法(2)隨機誤差randomerror排除上述誤差后尚存的誤差,受多種無法控制的因素的影響。特點:大小方向不一的隨機變化。隨機測量誤差(randommeasurementerror)——提高操作者熟練程度可以減少這種誤差
隨機抽樣誤差(random
samplingerror):由抽樣造成的樣本統(tǒng)計量和總體參數(shù)間的差異。人群健康研究的統(tǒng)計學(xué)方法指樣本指標(biāo)之間或與總體指標(biāo)之間存在的差別。例如:隨機抽取110名7歲男孩,樣本的平均身高一般不等于全體7歲男孩的平均身高;(3)抽樣誤差:人群健康研究的統(tǒng)計學(xué)方法種類原因性質(zhì)表現(xiàn)存在與解決測量誤差(系統(tǒng))單一因素測值-真值方向單一大小一致可避免查明并去除原因測量誤差(隨機)測量變異測值-真值隨機不可避免提高測量精度抽樣誤差(隨機)個體變異樣本--總體樣本--樣本隨機不可避免增加樣本含量三種誤差的比較人群健康研究的統(tǒng)計學(xué)方法6.概率probability
概率:隨機事件發(fā)生的可能性大小,用大寫的P表示;取值[0,1].是對總體而嚴(yán)的,屬于參數(shù)。確定性現(xiàn)象:在一定條件下,一定會發(fā)生或一定不會發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果的叫必然事件;肯定不發(fā)生某種結(jié)果的叫不可能事件。隨機現(xiàn)象:在同樣條件下可能會出現(xiàn)兩種或多種結(jié)果,究竟會發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為隨機事件。隨機事件的特征:①隨機性;②規(guī)律性:每次發(fā)生的可能性的大小是確定的。人群健康研究的統(tǒng)計學(xué)方法樣本的實際發(fā)生率稱為頻率(f)。設(shè)在相同條件下,獨立重復(fù)進(jìn)行n次試驗,事件A出現(xiàn)x次,則事件A出現(xiàn)的頻率f=x/n。頻率與概率間的關(guān)系:樣本頻率總是圍繞概率上下波動樣本含量n越大,波動幅度越小,頻率越接近概率。頻率frequency人群健康研究的統(tǒng)計學(xué)方法必然事件P=1不可能事件P=0隨機事件0<P<1
P≤0.05(5%)或P≤0.01(1%)稱為小概率事件(習(xí)慣),統(tǒng)計學(xué)上認(rèn)為在一次實驗或觀察中該事件發(fā)生的可能性很小,可視為很可能不發(fā)生。小概率事件人群健康研究的統(tǒng)計學(xué)方法
三、統(tǒng)計資料的類型(一)變量一般可分為兩類:數(shù)值變量:多為連續(xù)變量,也稱定量或計量資料。
分類變量:無序分類變量,也稱計數(shù)資料(定性資料)(二項分類;多項分類)有序分類變量,也稱等級資料人群健康研究的統(tǒng)計學(xué)方法數(shù)值變量(計量資料)定義:用儀器、工具等測量(measure)方法獲得的數(shù)據(jù),即為計量資料,也叫定量數(shù)據(jù)。即通過度量衡的方法,測量每一個觀察單位的某項統(tǒng)計指標(biāo)的量的大小,得到的一系列數(shù)據(jù)資料。例如:體重(kg)與身高(cm)特點:1、有度量衡單位
2、多為連續(xù)性資料(通過測量得到)人群健康研究的統(tǒng)計學(xué)方法(二)變量間的轉(zhuǎn)化資料不同與其適應(yīng)的統(tǒng)計分析方法也不同,進(jìn)行處理時要分清是什么類型的資料,選擇合適的統(tǒng)計分析方法進(jìn)行分析。如:計量資料一般選用t檢驗、方差分析。人群健康研究的統(tǒng)計學(xué)方法
三類資料間關(guān)系
例:一組20
40歲成年人的血壓以12kPa為界分為正常與異常兩組,統(tǒng)計每組例數(shù)
<8低血壓
8
正常血壓
12
輕度高血壓
15
中度高血壓
17
重度高血壓計量資料等級資料計數(shù)資料人群健康研究的統(tǒng)計學(xué)方法四、統(tǒng)計工作的基本步驟第一步.統(tǒng)計設(shè)計:制定計劃,對整個過程進(jìn)行安排。是整個工作的關(guān)鍵。包括現(xiàn)場調(diào)查、實驗設(shè)計。如何進(jìn)行設(shè)計?舉例。背景-目的-方法-內(nèi)容-經(jīng)費預(yù)算第二步搜集資料(現(xiàn)場調(diào)查)
:根據(jù)計劃取得準(zhǔn)確、可靠、完整的原始資料收集資料的方法有三種:統(tǒng)計報表、日常性工作、專題調(diào)查。注重資料的真實性。第三步整理資料:原始資料的整理、清理、核實、查對,使其條理化、系統(tǒng)化便于計算和分析。可借助于計算機(常用軟件:SPSS、SAS)。第四步分析資料(統(tǒng)計分析):統(tǒng)計學(xué)的關(guān)鍵所在。運用統(tǒng)計學(xué)的基本原理和方法,分析計算有關(guān)的指標(biāo)和數(shù)據(jù),揭示事物內(nèi)部的規(guī)律。人群健康研究的統(tǒng)計學(xué)方法統(tǒng)計描述:將計算出的統(tǒng)計指標(biāo)與統(tǒng)計圖表相結(jié)合,全面描述資料的數(shù)量特征及分布規(guī)律統(tǒng)計推斷:利用樣本信息推斷總體特征(總體參數(shù)的估計和假設(shè)性檢驗)人群健康研究的統(tǒng)計學(xué)方法目標(biāo)自測題(單項選擇題)
1、統(tǒng)計學(xué)上所說的樣本是指()
A、按研究者要求取總體中有意義的部分B.隨意抽取總體中任意部分
C.有意識地選擇總體中典型部分D.按隨機原則抽取總體中有代表性部分E.總體中的每一個個體2.抽樣誤差是由()
A.測量引起的B.個體差異造成的C.計算引起的
D.采樣結(jié)果不準(zhǔn)確引起的E試劑、儀器未校正引起的3.已知某地出生男嬰平均體重3.2公斤,從該地隨機抽?。玻懊錾袐耄瑴y得體重均數(shù)為3.3公斤則3.3公斤與3.2公斤不同,主要原因是()A.個體變異B.抽樣誤差C.樣本均數(shù)不同D.隨機測量誤差4.研究某地正常成年男子血壓情況,用未經(jīng)校正的血壓計測定200名正常成年人的血壓值,所得資料可出現(xiàn)()
A.系統(tǒng)誤差B.隨機測量誤差C.抽樣誤差
D.個體差異E.偶然誤差人群健康研究的統(tǒng)計學(xué)方法
5、為了了解某地20~29歲健康女性血紅蛋白的正常值范圍,現(xiàn)隨機調(diào)查了該地2000名20~29歲的健康女性,并對其血紅蛋白進(jìn)行測量,請問本次調(diào)查的總體是(
)
A.該地所有20~29的健康女性
B.該地所有20~29的健康女性的血紅蛋白測量值
C.抽取的這2000名20~29歲女性
D.抽取的這2000名20~29歲女性的血紅蛋白測量值人群健康研究的統(tǒng)計學(xué)方法
B1型題
A、計數(shù)資料(無序分類變量)B、計量資料(數(shù)值變量)
C、等級資料(有序分類變量)D、總體中的個體6、身高是()7、脈搏數(shù)(次/分)是()8、血型是()9、療效是()人群健康研究的統(tǒng)計學(xué)方法
第二節(jié)數(shù)值變量的統(tǒng)計分析
人群健康研究的統(tǒng)計學(xué)方法(一)頻數(shù)表與頻數(shù)分布一、數(shù)值變量的頻數(shù)分布人群健康研究的統(tǒng)計學(xué)方法
表7-1102名正常成年女子的體溫值編號體溫值編號體溫值137.0……237.29536.9337.39637.2437.39737.1537.59836.9637.29937.3736.510036.7836.810137.0……10236.9人群健康研究的統(tǒng)計學(xué)方法頻數(shù)表的編制步驟(1)求計算全距(極差):即最大值與最小值之差,又稱為極差。本例極差:R=37。5-36。5=1。0(°C)(2)決定組數(shù)、組段和組距:根據(jù)研究目的和樣本含量n確定。組距=極差/組數(shù),通常分10-15個組,為方便計,組距參考極差的十分之一,再略加調(diào)整。本例i=R/10=1。0/10=0.1(°C)(3)列出組段:第一組段應(yīng)包含最小值,最后一個組段上限必須包含最大值,其它組段上限值忽略。(4)劃記計數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。人群健康研究的統(tǒng)計學(xué)方法組段(1)劃記(2)頻數(shù),f(3)組中值,X(4)
fX(5)=(3)×(4)36.5~一136.5536.5536.6~336.65109.9536.7~正536.75183.7536.8~正正1236.85442.2036.9~正正正1736.95628.1537.0~正正正正正2537.05926.2537.1~正正正一1637.15594.4037.2~正正一1137.25409.7537.3~正737.35261.4537.4~437.45149.8037.5~37.6一137.5537.55合計
102102——3779.80均數(shù)=3779.8/102=37.06°C人群健康研究的統(tǒng)計學(xué)方法(二)頻數(shù)分布圖(見P138圖7-1)人數(shù)人群健康研究的統(tǒng)計學(xué)方法(三)頻數(shù)表的分布特征①集中趨勢(centraltendency):變量值集中位置。本例在組段“37.0~”?!骄街笜?biāo)②離散趨勢(tendencyofdispersion):變量值圍繞集中位置的分布情況。離“中心”位置越遠(yuǎn),頻數(shù)越??;且圍繞“中心”左右對稱?!儺愃街笜?biāo)
人群健康研究的統(tǒng)計學(xué)方法(四)頻數(shù)分布類型
1、正態(tài)分布正態(tài)分布是高峰位于中央(均數(shù)所在處)兩側(cè)逐漸降低且左右對稱、不與橫軸相交的鐘型光滑曲線,也叫高斯分布,是最常見、最重要的一種連續(xù)型分布。
2、偏態(tài)分布有正偏態(tài)分布和負(fù)偏態(tài)分布
人群健康研究的統(tǒng)計學(xué)方法正態(tài)分布:中間高、兩邊低、左右對稱正偏態(tài)分布:長尾向右延伸負(fù)偏態(tài)分布:長尾向左延伸人群健康研究的統(tǒng)計學(xué)方法(五)頻數(shù)表和頻數(shù)分布圖的應(yīng)用頻數(shù)表和頻數(shù)分布圖可揭示頻數(shù)的分布特征分布類型,是資料分析的基礎(chǔ),還可發(fā)現(xiàn)可疑值,我們可根據(jù)分布特征分布類型選擇統(tǒng)計分析方法人群健康研究的統(tǒng)計學(xué)方法二、集中趨勢(平均指標(biāo))又稱為平均數(shù)反映了資料的集中趨勢。
常用的有:
1.算術(shù)均數(shù)(arithmeticmean),簡稱均數(shù)(mean)
2.幾何均數(shù)(geometricmean)
3.中位數(shù)
(median)
4.眾數(shù)(mode)人群健康研究的統(tǒng)計學(xué)方法(一)算術(shù)均數(shù)(mean)Σ為求和符號,讀成sigma意義:一組性質(zhì)相同(同質(zhì))的觀察值在數(shù)量上的平均水平。表示μ(總體)X(樣本)計算:直接法、加權(quán)法(間接法)、計算機特征:∑(
X-X)=0估計誤差之和為0。應(yīng)用:正態(tài)分布或近似正態(tài)分布注意:合理分組,才能求均數(shù),否則沒有意義。
X1+X2+X3+......+XnΧ=-----------------------=∑Χ/nn
人群健康研究的統(tǒng)計學(xué)方法(二)幾何均數(shù)(geometricmean)幾何均數(shù):變量對數(shù)值的算術(shù)均數(shù)的反對數(shù)。
人群健康研究的統(tǒng)計學(xué)方法幾何均數(shù)的適用條件與實例適用條件:呈倍數(shù)關(guān)系的等比資料或?qū)?shù)正態(tài)分布(正偏態(tài))資料;如抗體滴度資料意義:N個數(shù)值的乘積開N次方即為這N個數(shù)的幾何均數(shù)。表示:G例如:血清的抗體效價滴度的倒數(shù)分別為:10、100、1000、10000、100000,求幾何均數(shù)。此例的算術(shù)均數(shù)為22222,顯然不能代表滴度的平均水平。同一資料,幾何均數(shù)<均數(shù)人群健康研究的統(tǒng)計學(xué)方法頻數(shù)表資料的幾何均數(shù)抗體滴度⑴人數(shù),f⑵滴度倒數(shù),X⑶lgX⑷
f·lgX⑸
1:2.5
1:101:401:1601:640
合計141822126722.510.040.0160.0640.00.39791.00001.60212.20412.80625.570618.000035.246226.449216.8372102.1032人群健康研究的統(tǒng)計學(xué)方法(三)中位數(shù)(median)
中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,符號為M,反映一批觀察值在位次上的平均水平。
適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料;
②資料有不確定數(shù)值;③資料分布不明等。
人群健康研究的統(tǒng)計學(xué)方法中位數(shù)計算公式與實例先將觀察值按從小到大順序排列,再按以下公式計算:特點:僅僅利用了中間的1~2個數(shù)據(jù)人群健康研究的統(tǒng)計學(xué)方法頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)M人群健康研究的統(tǒng)計學(xué)方法潛伏期(小時)(1)頻數(shù),f(2)累計頻數(shù)Sf(3)累計百分率(4)0~151510.796~496446.0412~359971.2218~3012992.8124~513496.6430~413899.2836~013899.2842~1139100.00合計139——中位數(shù)=12+6x[(139x50%-64)/35]=12.94表7-4139食物中毒病人潛伏期的中位數(shù)計算表人群健康研究的統(tǒng)計學(xué)方法
百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對應(yīng)的值。記為Px。M=P50百分位數(shù)人群健康研究的統(tǒng)計學(xué)方法三、變異(variation)指標(biāo)反映數(shù)據(jù)的離散度(Dispersion
)。即個體觀察值的變異程度。常用的指標(biāo)有:
(一)極差(Range)
(全距)
(二)百分位數(shù)與四分位數(shù)間距
PercentileandQuartilerange
(三)方差
Variance
(四)標(biāo)準(zhǔn)差StandardDeviation
(五)變異系數(shù)
CoefficientofVariation
人群健康研究的統(tǒng)計學(xué)方法500500500均數(shù)250025002500合計51052056055055105404500500500349549046024904804401丙乙甲盤編號例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計數(shù),每人數(shù)5個計數(shù)盤,得結(jié)果如下(萬/mm3)甲乙丙人群健康研究的統(tǒng)計學(xué)方法(一)極差(Range)(全距)1204020優(yōu)點:簡便缺點:1.只利用了兩個極端值
2.不穩(wěn)定人群健康研究的統(tǒng)計學(xué)方法(二)百分位數(shù)與四分位數(shù)間距
Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對應(yīng)的值。記為Px。四分位間距:QR=P75-P25=Qu-QLP100(max)P75P50(中位數(shù))P25P0(min)Px人群健康研究的統(tǒng)計學(xué)方法P25=6+6x[(139x25%-15)/49]=8.30P75=18+6x[(139x75%-99)/30]=19.05QR=19.05-8.03=10.75;組段(1)頻數(shù),f(2)累計頻數(shù),F(xiàn)(3)
累計頻率(%)(4)0~151510.796~496446.0412~359971.2218~3012992.8124~513496.6430~413899.2836~013899.2842~1139100合計139——100人群健康研究的統(tǒng)計學(xué)方法百分位數(shù)的應(yīng)用確定醫(yī)學(xué)參考值范圍(referencerange):如95%參考值范圍=P97.5-P2.5;表示有95%正常個體的測量值在此范圍。中位數(shù)M與四分位數(shù)間距QR一起使用,描述偏態(tài)分布資料的特征人群健康研究的統(tǒng)計學(xué)方法(三)方差(variance)也稱均方差(meansquaredeviation)
即樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。人群健康研究的統(tǒng)計學(xué)方法樣本方差為什么要除以(n-1)
與自由度(degreesoffreedom)有關(guān)。自由度是數(shù)學(xué)名詞,在統(tǒng)計學(xué)中,n個數(shù)據(jù)如不受任何條件的限制,則n個數(shù)據(jù)可取任意值,稱為有n個自由度。
人群健康研究的統(tǒng)計學(xué)方法(四)標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。1、標(biāo)準(zhǔn)差及計算人群健康研究的統(tǒng)計學(xué)方法標(biāo)準(zhǔn)差的計算7.9115.8150.99標(biāo)準(zhǔn)差2500510505500495490丙313600291600250000211600193600甲2270400260100250000240100230400乙2260100255025250000245025240100丙225002500合計52056055105404500500349046024804401乙甲盤編號人群健康研究的統(tǒng)計學(xué)方法組段(1)頻數(shù),f(3)組中值,X(4)
fX(5)=(3)×(4)36.5~136.5536.5536.6~336.65109.9536.7~536.75183.7536.8~1236.85442.2036.9~1736.95628.1537.0~2537.05926.2537.1~1637.15594.4037.2~1137.25409.7537.3~737.35261.4537.4~437.45149.8037。5~37。6137。5537。55合計102——3779。80方差=(140071.475-3779.802/102)/(102-1)=0.0392標(biāo)準(zhǔn)差=0.198人群健康研究的統(tǒng)計學(xué)方法2、標(biāo)準(zhǔn)差的應(yīng)用:
(1)描述事物的變異程度:適用于描述正態(tài)或近似正態(tài)分布資料的變異程度(2)衡量均數(shù)的代表性:在多組資料單位相同,均數(shù)近似條件下,S越大,表示變量值離均數(shù)較遠(yuǎn),反之相反,則均數(shù)的代表性好(3)結(jié)合樣本均數(shù)描述頻數(shù)分布特征:描述正態(tài)分布特征,確定參考值范圍。(4)計算變異系數(shù)和標(biāo)準(zhǔn)誤人群健康研究的統(tǒng)計學(xué)方法(五)變異系數(shù)(coefficientofvariation,CV)適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)標(biāo)準(zhǔn)差變異系數(shù)女大學(xué)生身高162.05cm4.67cm2.88%體重50.10kg4.98kg9.94%人群健康研究的統(tǒng)計學(xué)方法變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;
偏態(tài)分布:中位數(shù)、四分位半間距人群健康研究的統(tǒng)計學(xué)方法
對稱分布偏態(tài)分布對數(shù)正態(tài)分布集中趨勢均數(shù)中位數(shù)幾何均數(shù)離散趨勢標(biāo)準(zhǔn)差四分位數(shù)間距對數(shù)標(biāo)準(zhǔn)差變異系數(shù)
描述頻數(shù)分布特征的指標(biāo)總結(jié)人群健康研究的統(tǒng)計學(xué)方法
四、正態(tài)分布和醫(yī)學(xué)參考值范圍
(一)正態(tài)分布(圖形、特征、面積的分布規(guī)律)(二)醫(yī)學(xué)參考值范圍人群健康研究的統(tǒng)計學(xué)方法正態(tài)分布的圖形人群健康研究的統(tǒng)計學(xué)方法正態(tài)分布人群健康研究的統(tǒng)計學(xué)方法(一)正態(tài)分布
正態(tài)分布是高峰位于中央(均數(shù)所在處)、兩側(cè)逐漸降低且左右對稱、不與橫軸相交的鐘型光滑曲線,也叫高斯分布,是最常見、最重要的一種連續(xù)型分布。人群健康研究的統(tǒng)計學(xué)方法1、正態(tài)分布的圖形人群健康研究的統(tǒng)計學(xué)方法正態(tài)曲線圖形特點:鐘型中間高兩頭低左右對稱最高處對應(yīng)于X軸的值就是均數(shù)曲線下面積為17.正態(tài)分布有兩個參數(shù),即均數(shù)與標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差決定曲線的形狀,均數(shù)決定曲線的位置一般用N(,σ2)表示Xf(X)μμ
人群健康研究的統(tǒng)計學(xué)方法X不同,S相同X決定位置,X
越大,曲線越向右移動;s
標(biāo)準(zhǔn)差決定曲線的形狀人群健康研究的統(tǒng)計學(xué)方法X相同,S不同S越大,曲線越“矮”越“胖”;S越小,曲線越“高”越“瘦”人群健康研究的統(tǒng)計學(xué)方法、
變化人群健康研究的統(tǒng)計學(xué)方法函數(shù)學(xué)表達(dá)式人群健康研究的統(tǒng)計學(xué)方法標(biāo)準(zhǔn)正態(tài)分布為便于描述和應(yīng)用,常將正態(tài)變量作數(shù)據(jù)轉(zhuǎn)換。利用公式使原始正態(tài)變量X轉(zhuǎn)換成u值,得到標(biāo)準(zhǔn)正態(tài)分布。數(shù)理統(tǒng)計證明:
u值的均數(shù)等于0,標(biāo)準(zhǔn)差等于1,即將X的位置移到零點,橫軸尺度以σ為單位。即把原始正態(tài)變量X向左平移
個單位后再縮小σ倍得到u值。標(biāo)準(zhǔn)正態(tài)分布用N(0,1)表示,u值稱為標(biāo)準(zhǔn)正態(tài)變量。也稱U布人群健康研究的統(tǒng)計學(xué)方法標(biāo)準(zhǔn)正態(tài)分布N(0,1)人群健康研究的統(tǒng)計學(xué)方法2、正態(tài)分布特征
①鐘型、中間高、兩頭低、左右對稱
②最高處對應(yīng)于X軸的值就是均數(shù)
③正態(tài)曲線下面積分布有一定的規(guī)律,正態(tài)曲線下面積為1
④正態(tài)分布有兩個參數(shù),即均數(shù)與標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差決定曲線的形狀,均數(shù)決定曲線的中心位置人群健康研究的統(tǒng)計學(xué)方法3、正態(tài)曲線下面積分布有一定的規(guī)律統(tǒng)計學(xué)家按標(biāo)準(zhǔn)正態(tài)分布的累積概率分布函數(shù)(積分法),編制了下表,標(biāo)準(zhǔn)正態(tài)分布曲線下的面積,由表可查出曲線下某區(qū)間的面積。人群健康研究的統(tǒng)計學(xué)方法曲線下面積分布規(guī)律0-11-1.961.96-2.582.5868.27%95.00%99.00%μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%人群健康研究的統(tǒng)計學(xué)方法正態(tài)曲線下面積的分布規(guī)律
曲線下橫軸上的總面積為100%或1。表中面積指曲線下從-∞到u的面積。對稱于均數(shù)(零)的區(qū)域面積相等。對于正態(tài)或近似正態(tài)分布的資料,只要求得均數(shù)和標(biāo)準(zhǔn)差就可根據(jù)分布規(guī)律概括地估計任何兩個變量值之間所夾的面積總結(jié)人群健康研究的統(tǒng)計學(xué)方法在實際工作中,往往不知道總體均數(shù)和總體標(biāo)準(zhǔn)差,只有樣本資料,則可用作為的估計值,以S作為的估計值,用正態(tài)分布曲線下面積對其頻數(shù)作出概括估計。圖中為總體均數(shù),為總體標(biāo)準(zhǔn)差,若以曲線下面積為1(100%),則曲線在:
在±范圍內(nèi)占總面積的68.27%,即約有68.27%的觀察值分布在此范圍內(nèi);在±1.96范圍內(nèi)占總面積的95%,即約有95%的觀察值分布在此范圍內(nèi):在±2.58范圍內(nèi)占總面積的99%,即約有99%的觀察值分布在此范圍內(nèi)。
正態(tài)曲線是一條高峰位于中央,兩側(cè)逐漸下降并完全對稱,兩端永遠(yuǎn)不與橫軸相交的鐘型曲線。
曲線下面積有一定的分布規(guī)律(見圖)。圖正態(tài)曲線及其面積分布68.27%95.00%99.00%
-2.58σ–1.96σ-1σμ1σ1.96σ2.58σ總結(jié)人群健康研究的統(tǒng)計學(xué)方法曲線下面積人群健康研究的統(tǒng)計學(xué)方法(二)醫(yī)學(xué)參考值范圍的估計(一)估計變量值的頻數(shù)分布(二)估計醫(yī)學(xué)參考值范圍(三)正態(tài)分布是許多統(tǒng)計方法的理論基礎(chǔ)人群健康研究的統(tǒng)計學(xué)方法(二)醫(yī)學(xué)正常值范圍的估計
定義:又稱參考值范圍,是指特定健康人群的解剖、生理、生化等各種數(shù)據(jù)的波動范圍。習(xí)慣上是確定包括95%的人的界值。
單雙側(cè):根據(jù)指標(biāo)的實際用途,有的指標(biāo)有上下界值,過高過低均屬異常;某些指標(biāo)過高為異常,只需確定上限;某些指標(biāo)過低為異常,只需確定下限。
單側(cè)下限---過低異常單側(cè)上限---過高異常雙側(cè)---過高、過低均異常
單側(cè)下限異常正常單側(cè)上限異常正常異常正常雙側(cè)下限雙側(cè)上限異常人群健康研究的統(tǒng)計學(xué)方法當(dāng)分布不是標(biāo)準(zhǔn)正態(tài)分布,但已知μ,σ和X時,先按式求得u值,再查表求得曲線下某區(qū)間的面積。人群健康研究的統(tǒng)計學(xué)方法計算醫(yī)學(xué)參考值范圍常用的方法正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料。雙側(cè)界值:,單側(cè)上界:單側(cè)下界:百分位數(shù)法:常用于偏態(tài)分布資料雙側(cè)界值:P2.5和P97.5;單側(cè)上界:P95;或單側(cè)下界:P5人群健康研究的統(tǒng)計學(xué)方法醫(yī)學(xué)正常值范圍估計在醫(yī)療衛(wèi)生工作中,醫(yī)務(wù)人員經(jīng)常要應(yīng)用各種生理、生化指標(biāo)的正常值。所謂正常值是指正常人(或動物)的各種生理常數(shù)。包括人體的形態(tài)、功能及代謝產(chǎn)物等。由于個體差異的存在,這些數(shù)值有一定的波動范圍,因此,一般采用正常值范圍。根據(jù)專業(yè)知識,有的指標(biāo)正常值范圍是過高、過低均為異常,正常值范圍應(yīng)制訂上、下限。有的指標(biāo)是不得超過一定數(shù)值(如鉛含量)或不低于一定數(shù)值(如肺活量),此時只需制訂正常值范圍的上限或下限。
醫(yī)學(xué)正常值范圍的估計要根據(jù)資料的分布,有正態(tài)分布法和百分位數(shù)法。
正態(tài)分布法:如資料的分布呈正態(tài)分布,雙側(cè)95%正常值范圍用±1.96S,單側(cè)95%正常值范圍用±1.645S;
百分位數(shù)法:如資料呈偏態(tài)分布,雙側(cè)95%正常值范圍為P2.5~P97.5,單側(cè)95%正常值范圍為P95(以過高為異常,是正常值上限)、P5(以過低為異常,是正常值下限)。詳細(xì)描述人群健康研究的統(tǒng)計學(xué)方法例如:102名女大學(xué)生體重均數(shù)為37.06,標(biāo)準(zhǔn)差為0.198,根據(jù)正態(tài)曲線下分布規(guī)律,可估計其頻數(shù)分布,見表9-12。表7-5102名女大學(xué)生口腔溫度頻數(shù)實際分布與理論分布比較實際分布
范圍人數(shù)%由上表可知,本例實際頻數(shù)分布與理論分布的百分?jǐn)?shù)很接近??梢哉J(rèn)為這102名女大學(xué)生的口腔溫度分布服從于正態(tài)分布。根據(jù)這個道理,醫(yī)學(xué)上常以±1.96S來估計某些生理生化的正常值范圍。如本例可利用102名女大學(xué)生口腔溫度的計算結(jié)果,判斷該地所有21歲女大學(xué)生口腔溫度的正常值范圍為36.55~37.57℃
。理論分布%1S36.86~37.267169.6168.27±1.96S36.67~37.459694.1295.00±2.58S36.55~37.57102100.0099.00人群健康研究的統(tǒng)計學(xué)方法小結(jié)習(xí)題:1.正態(tài)分布曲線下,從均數(shù)u到u+1.96
的面積為;A.95%B.45%C.97.5%D.47.5%人群健康研究的統(tǒng)計學(xué)方法2、出生體重低于2500克為低體重兒。若由某項研究得某地嬰兒出生體重均數(shù)為3200克,標(biāo)準(zhǔn)差為350克,估計該地當(dāng)年低體重兒所占的比例。
人群健康研究的統(tǒng)計學(xué)方法課后作業(yè)測得某地300名正常人尿汞值,其頻數(shù)表如下。試計算均數(shù)和中位數(shù),何者的代表性好?并求95%的參考值范圍。
300例正常人尿汞值(ug/L)頻數(shù)表尿汞值例數(shù)尿汞值例數(shù)尿汞值例數(shù)0~494~278~5812~5016~4520~2224~1628~932~936~440~544~048~352~056~260~064~068~1人群健康研究的統(tǒng)計學(xué)方法五、均數(shù)的抽樣誤差和總體均數(shù)的估計概念在一個總體均數(shù)為μ,總體標(biāo)準(zhǔn)差為σ的總體中,隨機抽取一個樣本含量為n的樣本,計算其均數(shù),由于總體中個體間存在變異,則X不一定等于μ,這種由于抽樣引起樣本均數(shù)與總體均數(shù)的差異,稱為均數(shù)的抽樣誤差。n=100n=100n=100全校女生身高n=8001.6mn=100n=100n=100n=100(一)均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤1、均數(shù)的抽樣誤差μ人群健康研究的統(tǒng)計學(xué)方法抽樣誤差在抽樣研究中不可避免,但有規(guī)律可循。從一個正態(tài)總體中,隨機抽取許多含量相等的樣本,這些樣本均數(shù)的頻數(shù)服從以總體均數(shù)為中心的正態(tài)分布。即使總體不呈正態(tài)分布,只要樣本含量足夠大樣本均數(shù)仍近似于正態(tài)分布。若把樣本均數(shù)看成是變量值,就可用樣本均數(shù)的標(biāo)準(zhǔn)差來說明各樣本均數(shù)的變異程度,樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤,用表示。全校女生身高n=8001.6mn=100n=100n=100n=100n=100n=100n=100n=1002、均數(shù)的標(biāo)準(zhǔn)誤人群健康研究的統(tǒng)計學(xué)方法標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤是表示抽樣誤差大小的指標(biāo),數(shù)理統(tǒng)計已證明,標(biāo)準(zhǔn)誤的大小與標(biāo)準(zhǔn)差呈正比,與樣本含量的平方根成反比,即:實際工作中總體標(biāo)準(zhǔn)差是未知的,常用樣本標(biāo)準(zhǔn)差代替,求得標(biāo)準(zhǔn)誤的估計值,于是公式可寫成:
用102名女大學(xué)生體溫值來說明,=37.06,S=0.198,求標(biāo)準(zhǔn)誤,代入公式:
即102名女大學(xué)生體溫的標(biāo)準(zhǔn)誤為標(biāo)準(zhǔn)誤0.0196℃。人群健康研究的統(tǒng)計學(xué)方法3、標(biāo)準(zhǔn)誤的應(yīng)用(1)表示樣本均數(shù)的離散程度:
標(biāo)準(zhǔn)誤小,表示抽樣誤差小,說明樣本均數(shù)與總體均數(shù)越接近,用樣本均數(shù)代表總體均數(shù)的可靠性大。反之,標(biāo)準(zhǔn)誤大,說明抽樣誤差大,用樣本均數(shù)推斷總體均數(shù)的可靠性小。醫(yī)學(xué)文獻(xiàn)上常用±表示樣本均數(shù)的可靠程度。如本例可寫成:37.06±(2)估計總體均數(shù)的可信區(qū)間:結(jié)合樣本均數(shù)可對總體均數(shù)做區(qū)間估計(3)用以進(jìn)行假設(shè)檢驗(t檢驗)人群健康研究的統(tǒng)計學(xué)方法標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差是常用的統(tǒng)計指標(biāo),兩者均為變異指標(biāo),但兩者之間既有區(qū)別又有聯(lián)系
標(biāo)準(zhǔn)差反映個體觀察值的離散程度對一個變量值是否在在正常值范圍作出估計±1.96S
用來估計正態(tài)分布用以計算標(biāo)準(zhǔn)誤和變異系數(shù)
標(biāo)準(zhǔn)誤反映樣本均數(shù)的離散程度用來描述樣本均數(shù)的可靠程度±
可估計總體均數(shù)的可信區(qū)間用來進(jìn)行假設(shè)檢驗
標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤與樣本含量的關(guān)系:當(dāng)樣本含量不變時,標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤成正比,標(biāo)準(zhǔn)差大,標(biāo)準(zhǔn)誤也大,反之。當(dāng)樣本含量達(dá)200以上時,標(biāo)準(zhǔn)差基本趨于穩(wěn)定,而標(biāo)準(zhǔn)誤隨樣本含量增多而減少。在標(biāo)準(zhǔn)差不變時,標(biāo)準(zhǔn)誤與樣本含量平方根成反比。人群健康研究的統(tǒng)計學(xué)方法(二)t分布
t分布的由來t分布的特征t分布曲線下的面積人群健康研究的統(tǒng)計學(xué)方法t分布的由來變量變換總體
N(μσ2)
樣本均數(shù)
N(μσ×2)
中心極限定理標(biāo)準(zhǔn)正態(tài)分布
變量變換未知人群健康研究的統(tǒng)計學(xué)方法從總體N(4.83,0.522)中抽出100個樣本的、S、t值與的95%的可信區(qū)間
100個樣本均數(shù)的均數(shù)為4.828,與總體均數(shù)4.83接近;樣本均數(shù)的標(biāo)準(zhǔn)差為0.18。將上述100個樣本均數(shù)看成新變量值,則構(gòu)成一新分布,人群健康研究的統(tǒng)計學(xué)方法樣本均數(shù)的抽樣分布有如下特點1、各樣本均數(shù)未必等于總體均數(shù)2、各樣本均數(shù)間存在差異3、樣本均數(shù)的分布很有規(guī)律從正態(tài)分布N(μ,σ2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布;即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布;4、樣本均數(shù)的總體均數(shù)仍為
,樣本均數(shù)的標(biāo)準(zhǔn)差比原個體變量值的標(biāo)準(zhǔn)差要小。人群健康研究的統(tǒng)計學(xué)方法如果抽取例數(shù)n=5的樣本k個,每個樣本又都可以按公式(7-21)計算出一個t值,可將k個t值編制成頻數(shù)表,作出直方圖,當(dāng)k無限增大時,則可得到一條光滑的曲線。
(式7-21)同理,如果抽取例數(shù)n=15時,仍能得到一條t分布曲線,因此,當(dāng)n變化時,就可以得到不同的t分布曲線,如圖7-5:人群健康研究的統(tǒng)計學(xué)方法圖7.5
自由度分別為1、5、∞的t分布
γ=1γ=5γ=∞人群健康研究的統(tǒng)計學(xué)方法自由度隨機變量能夠自由取值的個數(shù)
υ=n-限制條件的個數(shù)υ人群健康研究的統(tǒng)計學(xué)方法t分布是一簇單峰分布曲線。t分布以0為中心,左右對稱且均勻下降。其形態(tài)變化與自由度
的大小有關(guān)。自由度
越小,則t值越分散,曲線越低平;自由度
逐漸增大時,t分布逐漸逼近u分布(標(biāo)準(zhǔn)正態(tài)分布);當(dāng)
=∞時,t分布即為u分布,單側(cè)α和雙側(cè)2α的t值相同;在相同自由度下α越小,tα,
υ
值越大,反之相反;而當(dāng)α相同,自由度越小,則tα,
υ
值越大,反之相反。
t分布的特征
人群健康研究的統(tǒng)計學(xué)方法t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%t分布曲線下面積以0為中心左右對稱。由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個常量,而是隨自由度的大小而變化,如P261頁附表9。
人群健康研究的統(tǒng)計學(xué)方法附表9(P261),t分布表的特點附表9的橫標(biāo)目為自由度υ,縱標(biāo)目為概率P,表中數(shù)值為其相應(yīng)的t界值,記作tα,
υ
。附表9只列出正值,若計算的t值為負(fù)值時,可用其絕對值查表附表9右上附圖的陰影部分表示tα,
υ以外尾部面積的概率(p)自由度(υ)一定時,p與t成反比;
概率(p)一定時,υ與t成反比人群健康研究的統(tǒng)計學(xué)方法t值表(附表9P261)橫坐標(biāo):自由度,υ
縱坐標(biāo):概率,p,即曲線下陰影部分的面積;
表中的數(shù)值:相應(yīng)的|t|界值。記作tα,
υ
人群健康研究的統(tǒng)計學(xué)方法單側(cè)t0.05,30=1.697人群健康研究的統(tǒng)計學(xué)方法(三)總體均數(shù)的估計
用樣本指標(biāo)估計總體指標(biāo)稱為參數(shù)估計,是統(tǒng)計推斷的一個重要方面??傮w均數(shù)估計的兩種方法點估計:是直接用統(tǒng)計量估計總體參數(shù)
.區(qū)間估計:由于抽樣誤差的客觀存在,因而按一定的概率(100(1-α)%)估計總體均數(shù)所在的范圍(亦稱可信區(qū)間)。人群健康研究的統(tǒng)計學(xué)方法1.點估計例1:11名18歲男大學(xué)生身高均數(shù)資料得,
=172.25cm,s=3.31cm,試估計該地18歲男大學(xué)生身高總體均數(shù)?答:該地18歲男大學(xué)生身高總體均數(shù)為172.25cm人群健康研究的統(tǒng)計學(xué)方法2、區(qū)間估計▲概念:根據(jù)樣本均數(shù),按一定的可信度(1-α)計算出總體均數(shù)很可能在的一個數(shù)值范圍,這個范圍稱為總體均數(shù)的可信區(qū)間或置信區(qū)間。常用95%可信區(qū)間?!椒ǎ?1)u分布法(2)t分布法人群健康研究的統(tǒng)計學(xué)方法(1)u分布法公式:σ已知P150式(7-22)
σ未知P150式
(7-23)應(yīng)用條件:大樣本資料例題:P150例7-15意義:總體均數(shù)被包含在該區(qū)間的可能性是1-α人群健康研究的統(tǒng)計學(xué)方法(2)t分布法公式P151式7-24應(yīng)用條件:
未知,且n小的小樣本資料例題:P151例7-16意義:標(biāo)準(zhǔn)誤和tα,
υ
值越小,估計總體均數(shù)可信區(qū)間的范圍也越窄,對總體均數(shù)的估計也就越精確人群健康研究的統(tǒng)計學(xué)方法可信區(qū)間有兩個要素
準(zhǔn)確度:反映在可信度(1-
)的大小上,即可信區(qū)間包含總體均數(shù)的可能性大小,從準(zhǔn)確度的角度看,愈接近1愈好,如可信度99%比95%好。精密度:反映在可信區(qū)間的長度上,即長度愈小愈好。在抽樣誤差確定的情況下,二者是相互矛盾的,若提高了可信度,可信區(qū)間勢必增大,精密度下降。因此,需要同時兼顧準(zhǔn)確度與精密度,一般情況下,常用95%可信區(qū)間。人群健康研究的統(tǒng)計學(xué)方法正常值范圍概念:絕大多數(shù)正常人的某指標(biāo)范圍。(95%,99%,指絕大多數(shù)正常人)計算公式:正態(tài)時95%正常值范圍雙側(cè)界值為±1.96S
用途:判斷觀察對象的某項指標(biāo)是否正常.可信區(qū)間概念:總體均數(shù)所在的數(shù)值范圍(95%,99%指可信度)計算公式:見前述用途:估計總體均數(shù)正常值范圍估計與可信區(qū)間估計人群健康研究的統(tǒng)計學(xué)方法六、均數(shù)的假設(shè)檢驗▲顯著性檢驗;▲科研數(shù)據(jù)處理的重要工具;▲某事發(fā)生了:是由于碰巧?還是由于必然的原因?統(tǒng)計學(xué)家運用顯著性檢驗來處理這類問題。人群健康研究的統(tǒng)計學(xué)方法1、假設(shè)檢驗的原因由于個體差異的存在,即使從同一總體中嚴(yán)格的隨機抽樣,X1、X2、X3、X4、、、,不同。
因此,X1、X2不同有兩種(而且只有兩種)可能:(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性。(2)分別所代表的總體均數(shù)不同。差別有顯著性。(一)假設(shè)檢驗的意義和一般步驟假設(shè)檢驗背景人群健康研究的統(tǒng)計學(xué)方法2、假設(shè)檢驗的目的3、假設(shè)檢驗的原理/思想反證法:當(dāng)一件事情的發(fā)生只有兩種可能A和B,為了肯定其中的一種情況A,但又不能直接證實A,這時否定另一種可能B,則間接的肯定了A。概率論:事件的發(fā)生不是絕對的,只是可能性大小而已。判斷是由于何種原因造成的不同,以做出決策。假設(shè)檢驗背景人群健康研究的統(tǒng)計學(xué)方法(二)假設(shè)檢驗的一般步驟1.建立假設(shè):檢驗假設(shè)(無效假設(shè),H0):兩個總體均數(shù)相等;備擇假設(shè)
(H1):與H0相反;2.確定顯著性水平(α):區(qū)分大小概率事件的標(biāo)準(zhǔn),常取0.053.
計算統(tǒng)計量:根據(jù)分析目的、設(shè)計類型和資料類型,選用適當(dāng)?shù)臋z驗方法,計算相應(yīng)的統(tǒng)計量。(U或
t)4,確定概率值:P值是指在H0所規(guī)定的總體中隨機抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計量的概率人群健康研究的統(tǒng)計學(xué)方法5、假設(shè)檢驗的結(jié)果接受檢驗假設(shè):若P>
時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率不是小概率,現(xiàn)有樣本信息還不足以拒絕H0。拒絕檢驗假設(shè):若P≤
,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率是小概率,按小概率事件原理現(xiàn)有樣本信息不支持H0,因而拒絕H0。因此,當(dāng)P≤α?xí)r,按所取α檢驗水準(zhǔn),拒絕H0,接受H1。
正確理解結(jié)論的概率性(都隱含著犯錯誤的可能性)。人群健康研究的統(tǒng)計學(xué)方法其分析目的是推斷樣本所代表的未知總體均數(shù)
與已知總體均數(shù)
0有無差別。(三)均數(shù)的
t檢驗
1.樣本均數(shù)與總體均數(shù)比較的t檢驗
人群健康研究的統(tǒng)計學(xué)方法P151例7-17據(jù)大量調(diào)查知,健康成年男子脈搏的均數(shù)為72次/分,某醫(yī)生在山區(qū)隨機調(diào)查了25名健康成年男子,其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分,能否認(rèn)為該山區(qū)成年男子的脈搏高于一般人群?人群健康研究的統(tǒng)計學(xué)方法(1)建立檢驗假設(shè),確定檢驗水準(zhǔn)
H0:μ=μ0山區(qū)成年男子平均脈搏數(shù)與一般人群相等
H1:μ>μ0山區(qū)成年男子平均脈搏數(shù)與一般人群不等雙側(cè)α=0.05(2)計算統(tǒng)計量:(3)確定P值,作出統(tǒng)計推斷查附表9,t界值表,t0.05,24=2.064,t<t(0.0524),得P>0.05,按α=0.05水準(zhǔn),拒絕H1,可認(rèn)為該山區(qū)健康成年男子的脈搏均數(shù)與一般健康成年男子的脈搏均數(shù)無差別。人群健康研究的統(tǒng)計學(xué)方法
2.配對設(shè)計的均數(shù)比較在醫(yī)學(xué)科學(xué)研究中的配對設(shè)計主要有以下情況:配對的兩個受試對象分別接受兩種處理之后的數(shù)據(jù);同一樣品用兩種方法(或儀器等)檢驗的結(jié)果;同一受試對象兩個部位的數(shù)據(jù)。其目的是推斷兩種處理(或方法)的結(jié)果有無差別。人群健康研究的統(tǒng)計學(xué)方法3、兩個樣本均數(shù)比較▲目的:由兩個樣本均數(shù)的差別推斷兩樣本所代表的總體均數(shù)間有無差別。
方法:1).兩個小樣本均數(shù)比較的t檢驗:p153例7-182).兩個大樣本均數(shù)比較的u檢驗:p155例7-20
人群健康研究的統(tǒng)計學(xué)方法
假設(shè)檢驗中的注意事項
要保證組間的可比性要根據(jù)研究目的、設(shè)計類型和資料類型選用適當(dāng)?shù)臋z驗方法正確理解差別有無顯著性的統(tǒng)計學(xué)意義結(jié)論不能絕對化單、雙側(cè)檢驗應(yīng)事先確定人群健康研究的統(tǒng)計學(xué)方法(四)
I型錯誤與II型錯誤
拒絕了實際上成立的H0,這類“棄真”的錯誤為I型錯誤(typeIerror)也稱α錯誤;不拒絕實際上不成立的H0,這類“存?zhèn)巍钡腻e誤為II型錯誤(typeIIerror)也稱β錯誤。人群健康研究的統(tǒng)計學(xué)方法客觀實際拒絕H0
不拒絕H0
H0成立I型錯誤(
)推斷正確(1-
)H0不成立推斷正確(1-
)II型錯誤(
)人群健康研究的統(tǒng)計學(xué)方法第三節(jié)分類變量的統(tǒng)計分析
一、相對數(shù)人群健康研究的統(tǒng)計學(xué)方法學(xué)習(xí)目標(biāo)敘述相對數(shù)的概念和常用種類能計算及應(yīng)用常用相對數(shù)指標(biāo)說出相對數(shù)應(yīng)用時的注意事項敘述率的抽樣誤差和總體率的估計人群健康研究的統(tǒng)計學(xué)方法相對數(shù)的概念(一)計數(shù)資料常見的數(shù)據(jù)形式是絕對數(shù),如某病的出院人數(shù)、治愈人數(shù)、死亡人數(shù)等。但絕對數(shù)通常不具有可比性:1、如甲、乙兩個醫(yī)院某病出院人數(shù)不同時,比較兩醫(yī)院該病的死亡人數(shù)沒有意義2、如00級七年制一、二大班學(xué)生人數(shù)不同時,比較兩班醫(yī)學(xué)統(tǒng)計學(xué)的及格人數(shù)沒有意義因此需要在絕對數(shù)的基礎(chǔ)上計算相對數(shù)。相對數(shù):指幾個相關(guān)數(shù)據(jù)或指標(biāo)之比值人群健康研究的統(tǒng)計學(xué)方法
(二)常用的相對數(shù)指標(biāo)1.率:指現(xiàn)象或事件發(fā)生的強度甲地人口3000,某年高血壓患者300人,患病率10%;乙地人口1000,同年高血壓患者250人,患病率25%。
何處高血壓流行情況嚴(yán)重?哪處高血壓醫(yī)治工作量較大?觀察疾病防治工作的效果,應(yīng)觀察什么?人群健康研究的統(tǒng)計學(xué)方法率:說明某現(xiàn)象發(fā)生的頻率或強度。常以百分率(%)、千分率(‰)、萬分率(1/萬)、十萬分率(1/10萬)等表示,計算公式為:
人群健康研究的統(tǒng)計學(xué)方法(1)計劃生育統(tǒng)計指標(biāo)
1)出生率(birthrate):
某年出生人數(shù)同年平均人口數(shù)出生率=×1000‰2)人口自然增長率:人口自然增長率=出生率-死亡率社區(qū)常用的生命統(tǒng)計指標(biāo)人群健康研究的統(tǒng)計學(xué)方法生育率=×1000‰某年出生人數(shù)同年平均育齡婦女?dāng)?shù)3)生育率(fertilityrate):人群健康研究的統(tǒng)計學(xué)方法
(2)疾病統(tǒng)計指標(biāo)
1)發(fā)病率(incidencerate):發(fā)病率(年)=×1000‰年內(nèi)新發(fā)生病例總數(shù)年平均人口數(shù)上年末人口數(shù)+本年末人口數(shù)2年均人口數(shù)=某病發(fā)病率(年)=×K
某年內(nèi)某病新發(fā)生病例數(shù)同年暴露人口數(shù)(式中k可為100%,1000‰,1萬/1萬……。)人群健康研究的統(tǒng)計學(xué)方法某一時點新舊病例數(shù)該時點觀察人口數(shù)時點患病率=×K2)患病率
(prevalencerate)年患病率=×K某年內(nèi)的新舊病例數(shù)同年平均人口數(shù)3)感染率:(infectiousrate)
感染率=×K受檢陽性人數(shù)受檢總?cè)藬?shù)人群健康研究的統(tǒng)計學(xué)方法4)罹患率:(attackrate)
表達(dá)一次疾病流行期內(nèi)的發(fā)?。ɑ疾。┣闆r。常用于描述疾病的暴發(fā)流行情況。罹患率=×K觀察期內(nèi)病例數(shù)同期暴露人口數(shù)人群健康研究的統(tǒng)計學(xué)方法(3)死亡統(tǒng)計指標(biāo)1)死亡率(mortalityrate):某年地區(qū)全部死亡數(shù)年均人口數(shù)
總死亡率=
×1000‰某年地區(qū)因某病死亡數(shù)年均人口數(shù)
某病死亡率=
×1000‰人群健康研究的統(tǒng)計學(xué)方法嬰兒死亡率:表示某年平均每1000名出生人數(shù)中未活滿一周歲的死亡數(shù)。孕產(chǎn)婦死亡率:指年內(nèi)直接因妊娠、分娩及產(chǎn)后疾病死亡的婦女
人數(shù)與同年活產(chǎn)數(shù)的
比值。人群健康研究的統(tǒng)計學(xué)方法2)某病病死率(casefatalityrate)
指某類死因的死亡數(shù)占總死亡數(shù)的百分比。某病病死率=×100%某時期內(nèi)因某病死亡人數(shù)同期患該病人數(shù)3)死因構(gòu)成:人群健康研究的統(tǒng)計學(xué)方法1)治愈率(curerate)(4)醫(yī)院工作統(tǒng)計指標(biāo)
治愈率=×100%治愈病人數(shù)受治病人數(shù)治療有效人數(shù)受治病人數(shù)
有效率=×100%2)有效率(efficiencyrate)
3)生存率(survivalrate)
隨訪滿n年仍存活的病例數(shù)隨訪病例數(shù)
存活率=×100%人群健康研究的統(tǒng)計學(xué)方法
重點掌握發(fā)病率、患病率、死亡率的應(yīng)用意義,主要包括:
反映人群的健康狀況,反映人群的衛(wèi)生服務(wù)需求,反映疾病對人群健康的威脅程度,用于評價疾病防治效果,描述疾病的三間分布等,用于探討病因。人群健康研究的統(tǒng)計學(xué)方法上一年度下一年度觀察年度1月1日12月31日5月1日(觀察時點)發(fā)病痊愈或死亡(預(yù)后)A病程年發(fā)病率、年患病率、時點患病率計算示意病例按病程特點可以分為四種類型。
A:上一年度發(fā)病,病程跨越整個觀察年度。人群健康研究的統(tǒng)計學(xué)方法上一年度下一年度觀察年度1月1日12月31日5月1日(觀察時點)發(fā)病痊愈或死亡(預(yù)后)AB病程年發(fā)病率、年患病率、時點患病率計算示意B:觀察年度發(fā)病,病程延續(xù)至下一年度。人群健康研究的統(tǒng)計學(xué)方法上一年度下一年度觀察年度1月1日12月31日5月1日(觀察時點)發(fā)病痊愈或死亡(預(yù)后)AC病程年發(fā)病率、年患病率、時點患病率計算示意
C:上一年度發(fā)病,病程在觀察年度終止。B人群健康研究的統(tǒng)計學(xué)方法上一年度下一年度觀察年度1月1日12月31日5月1日(觀察時點)發(fā)病痊愈或死亡(預(yù)后)ACD病程年發(fā)病率、年患病率、時點患病率計算示意
D:觀察年度內(nèi)發(fā)病,病程亦終止在觀察年度。B人群健康研究的統(tǒng)計學(xué)方法上一年度下一年度觀察年度1月1日12月31日5月1日(觀察時點)ABCD年發(fā)病率=年發(fā)病率、年患病率、時點患病率計算示意B+D年均人口數(shù)×K疾病率計算應(yīng)正確選擇分子和分母人群健康研究的統(tǒng)計學(xué)方法上一年度下一年度觀察年度1月1日12月31日5月1日(觀察時點)ABCD年發(fā)病率、年患病率、時點患病率計算示意年患病率=
A+B+C+D年均人口數(shù)×K人群健康研究的統(tǒng)計學(xué)方法上一年度下一年度觀察年度1月1日12月31日5月1日(觀察時點)ABCD時點患病率=A+D調(diào)查人口數(shù)×K年發(fā)病率、年患病率、時點患病率計算示意人群健康研究的統(tǒng)計學(xué)方法2.構(gòu)成比:指事物內(nèi)部各部分所占的比重某年某地早產(chǎn)兒母親的職業(yè)分析母親職業(yè)產(chǎn)業(yè)工人一般工人科室機關(guān)文教衛(wèi)生商業(yè)其他合計人數(shù)241113175373%32.915.117.823.36.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年稅務(wù)會計咨詢合同
- 銀行網(wǎng)點租賃合同模板
- 空氣凈化設(shè)備租賃協(xié)議樣本
- 排水管道管涵施工合同
- 超市收銀區(qū)地磚鋪裝項目協(xié)議
- 醫(yī)院防雷施工合同
- 商場衛(wèi)生清潔工招聘合同
- 未婚夫婚前房產(chǎn)協(xié)議
- 養(yǎng)老院租賃協(xié)議
- 通信工程商品混凝土施工協(xié)議
- 《大學(xué)物理學(xué)》精美課件(全)
- 規(guī)范權(quán)力運行方面存在問題及整改措施范文(五篇)
- 減壓孔板計算
- 博物館學(xué)概論課件:博物館與觀眾
- 著色滲透探傷檢測報告
- 反恐培訓(xùn)內(nèi)容
- 配套課件-計算機網(wǎng)絡(luò)技術(shù)實踐教程-王秋華
- 農(nóng)產(chǎn)品質(zhì)量安全檢測機構(gòu)考核評審細(xì)則
- 裝修申請審批表
- 建筑施工安全檢查標(biāo)準(zhǔn)jgj59-2023
- 2023年大學(xué)生《思想道德與法治》考試題庫附答案(712題)
評論
0/150
提交評論