混雜偏倚-效應(yīng)修正_第1頁
混雜偏倚-效應(yīng)修正_第2頁
混雜偏倚-效應(yīng)修正_第3頁
混雜偏倚-效應(yīng)修正_第4頁
混雜偏倚-效應(yīng)修正_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

混雜偏倚的識別與控制

一、混雜偏倚的概念

在病因研究中,當(dāng)對所關(guān)心的某種暴露因素(E)與某種疾病(D)之間的關(guān)聯(lián)進(jìn)行定量估計(jì)時(shí),由于其他因子(F)的影響,致使E和D之間關(guān)聯(lián)的真實(shí)性被歪曲,關(guān)聯(lián)強(qiáng)度被放大或縮小,這種歪曲關(guān)聯(lián)真實(shí)性的作用被稱作混雜作用(confoundingeffect),起到混雜作用的因子被稱為混雜因子(confounder或confoundingfactor,F)。?混雜偏倚本質(zhì)

√一種人為造成的偏倚√是在研究的設(shè)計(jì)階段未對混雜因子加以控制或資料分析時(shí)未能進(jìn)行正確校正所致√是完全可以避免和控制的一種系統(tǒng)誤差?

混雜因子成立的條件(1)必須是所研究疾病的危險(xiǎn)因素或保護(hù)性因素(2)必須和暴露因素之間存在統(tǒng)計(jì)學(xué)關(guān)聯(lián)(3)一定不是暴露因素與疾病因果鏈上的中間變量

二、混雜偏倚產(chǎn)生的機(jī)理

例:氡氣與肺癌的定群研究

?以RR值描述暴露于氡氣人群與不暴露于氡氣人群在肺癌發(fā)生頻率之間的關(guān)聯(lián)強(qiáng)度。

肺癌患者(D+)未患肺癌者(D–)

暴露于氡氣的人群(E)aba+b未暴露于氡氣的人群(ē)cdc+da/(a+b)RR=----------------------c/(c+d)以四格表的數(shù)據(jù)計(jì)算關(guān)聯(lián)強(qiáng)度指標(biāo)RR值

?RR值的真實(shí)性評價(jià)

此RR值是否真實(shí)地反映了氡氣與肺癌之間的關(guān)聯(lián)強(qiáng)度,完全取決于下述條件:

(1)氡氣暴露人群(E)和未暴露人群(ē)之間在產(chǎn)生肺癌的易感性方面是否可比

(2)導(dǎo)致肺癌的其它危險(xiǎn)因素在兩組人群之間的分布頻率是否可比?!癮”例肺癌的歸因可能性(來自暴露人群):(A)由氡氣所致

(B)由吸煙所致(研究者已知道的致肺癌因素)(C)由其它未知因素所致

“c”例肺癌的歸因可能性(來自非暴露人群):

(B)由吸煙所致

(C)由其它未知因素所致

?對RR值的解讀此相對危險(xiǎn)度RR在本項(xiàng)研究中包含有三種效應(yīng):(A)氡氣的致癌效應(yīng)

(B)吸煙的致癌效應(yīng)

(C)其它未知因素的致癌效應(yīng)

?RR值產(chǎn)生混雜偏倚的條件

(B)吸煙的致癌效應(yīng)RRS≠1

(C)其它未知因素的致癌效應(yīng)RRU≠1

?當(dāng)吸煙的致癌效應(yīng)RRS≠1時(shí)

下述情況下吸煙可導(dǎo)致該研究產(chǎn)生混雜偏倚:?研究設(shè)計(jì)階段:未保證吸煙者在兩人群中的均衡性?分析階段:未先將兩人群按吸煙和未吸煙分層,然后再按每一層去確定氡氣暴露和肺癌之間的關(guān)聯(lián)

該研究中混雜偏倚產(chǎn)生的機(jī)理:

是因?yàn)閷?dǎo)致肺癌產(chǎn)生的另一因素吸煙在兩

組人群中分布不均衡。

三、混雜偏倚和混雜因子的判別

?根據(jù)專業(yè)知識確定研究中可能存在的混雜

因子

在流行病學(xué)研究中,混雜因子可分為兩類:

1.人口統(tǒng)計(jì)學(xué)因子:

年齡、性別、種族、職業(yè)、經(jīng)濟(jì)收入、文

化水平等人口統(tǒng)計(jì)學(xué)指標(biāo),是經(jīng)常遇到的

混雜因子。

2.暴露因素以外的其它危險(xiǎn)因子:研究中混雜因子廣泛存在,表現(xiàn)形式多樣,

常常在隱匿中起到混雜作用。

?利用分層分析進(jìn)行定量判別-以定群研究為例-分層分析:將研究人群按是否暴露于可疑

混雜因子F分類(最簡單可分為暴露與不

暴露兩組),然后再做單因素分析。

未分層資料的分析

cRR暴露人群(E)aba+b未暴露人群(ē)cdc+d患者(D+)非患者(D-)暴露人群(E)a1b1未暴露人群(ē)c1d1患者(D+)非患者(D-)aRR1aRR2

分層資料的分析

a2b2c2d2患者(D+)非患者(D-)

暴露第三因子F

未暴露第三因子FD+D-

E+a1b1E-c1d1D+D-

E+a2b2E-c2d2D+D-

E+abE-cdcRRaRR1aRR2F+F-

?用簡單公式描述:1.cRR=aRR2或aRR1:

F不是混雜因子,cRR值不存在F的混雜偏倚。2.cRRaRR2或aRR1:

F是混雜因子,cRR值存在F的混雜偏倚。

上述分析也可適用于病例對照的OR值分析。

四、混雜偏倚的方向根據(jù)偏倚的產(chǎn)生機(jī)理,當(dāng)混雜因子對暴露與疾病之間的關(guān)聯(lián)產(chǎn)生歪曲時(shí),混雜偏倚具有一定的方向性和大小。其方向可正可負(fù),其作用可大可小,取決于E、F和D之間的關(guān)系。

?正混雜:cRR或cOR被放大,高于真實(shí)值

?負(fù)混雜:cRR或cOR被縮小,低于真實(shí)值

五、混雜偏倚的控制

(一)在設(shè)計(jì)階段進(jìn)行控制

1.限制。

2.隨機(jī)分配:隨機(jī)分配又可細(xì)分為簡單隨機(jī)分配

和分層隨機(jī)分配(stratifiedrandomization)

兩種方式。

3.匹配(matching):匹配是最經(jīng)常用于控制混

雜因子的方法。

?群體頻數(shù)匹配

指混雜因子發(fā)生的頻度在不同組應(yīng)大致平橫;

?個(gè)體匹配

指按一個(gè)至數(shù)個(gè)混雜因子分層,為病例選擇同層

的對照,一個(gè)病例配的對照數(shù)多為1-4個(gè)。

?匹配的好處√可以有效地控制混雜因子的作用,提高研究結(jié)果的真實(shí)性;√在減少總樣本數(shù)的情況下得到結(jié)論,提高研究的效率。

?匹配的缺點(diǎn):(A)難以對匹配掉的混雜因子及交互作用做深入分析;

(B)在病例對照調(diào)查中,用匹配的方法控制混雜經(jīng)常低估暴露對疾病的作用,嚴(yán)重時(shí)會引起過度匹配(overmatching)的問題,掩蓋暴露的真實(shí)作用。

(C)過分苛刻的匹配,會使得部分病例找不到對照,致使信息浪費(fèi),使研究的效率反而降低。

(二)在分析階段控制混雜

1.分層分析:分層分析是按混雜因素分層后,分別就暴露對疾病的關(guān)聯(lián)做分析,可以使用Mantel-Haenszel方法在分析階段控制混雜因子。-可以評價(jià)在各層中暴露與疾病的關(guān)聯(lián);-可整體估價(jià)用分層技術(shù)排除混雜后的暴露與疾病總的關(guān)聯(lián)強(qiáng)度。

例:食管癌病因研究—病例對照研究設(shè)計(jì)

因素病例對照年齡(歲)

25-111535-919045-4616755-7616665-5510675+1331均值60.050.2標(biāo)準(zhǔn)差9.214.3酒精(克/天)

0-2938640-7528080-5187120+4522均值84.944.4標(biāo)準(zhǔn)差48.431.9

食管癌病例組和對照組暴露因素分布

?對資料進(jìn)行初步審查

(1)對照組年輕人比重大于病例組

(2)在病例組中,飲酒消耗量的均值大于對照組,且重度飲酒者的比例大于對照組

(3)年齡和飲酒之間呈現(xiàn)輕度的負(fù)相關(guān)根據(jù)上述資料和已往醫(yī)學(xué)知識,即食管癌在年齡大者中多見,推測年齡這一因素可能對判斷飲酒與食管癌之間的關(guān)聯(lián)起一定的混雜作用。

飲酒(E)→食管癌(D)

\∕年齡(F)

?計(jì)算未分層時(shí)總的比值比cOR

飲酒不飲酒計(jì)

食管癌病例96(a)104(b)200(n1)

對照109(c)666(d)775(n0)

計(jì)205(m1)770(m0)975(N)cOR=ad/bc=(96x666)/(104x109)=5.64

[(ad-bc)–0.5N]2(N–1)X2=--------------------------------------n0m0n1m1

=108.11df=1,P<0.0001cOR的95%可信限區(qū)間估計(jì)公式為:

lnORU,lnORL=EXP[lnOR±1.96x(Var(lnOR))1/2]

式中:

Var(lnOR)=1/a+1/b+1/c+1/d

lnORu,lnORL=1.730.34,

即:ORL=4.02,ORu=7.93年齡(歲)組別每日飲酒量aORi80克0-79克25-病例對照19010635-病例對照42651645.0545-病例對照2529211385.6755-病例對照4227341396.3665-病例對照191836882.5875+病例對照50831

?按可疑的混雜因子年齡分層計(jì)算每層比值比aOR

?比較cOR和aOR

發(fā)現(xiàn)cOR與多組aORi有較大不一致,提示年齡可能

起了一定混雜作用。

?用Mantel-Haenszel方法

計(jì)算調(diào)整年齡這一混雜因子影響后總的ORmh。

∑(aidi/Ni)

ORM-H=-----------------------∑(bici/Ni)∑(aidi/Ni)ORM-H=-----------------------∑(bici/Ni)(1x106/116)+(4x164/199)+…+(5x31/44)]ORM-H=--------------------------------------------------(0x9/116)+(2x26/199)+…+(8x0/44)]=5.158

?對分層后總的ORmh=5.158做X2檢驗(yàn)

確定這一樣本來自O(shè)R=1的總體的概率,計(jì)算公式為:

(∑ai–∑Ai–1/2)2X2=-----------------------------------[∑Var(ai;OR=1)]

式中:ai為各年齡組中第一小格內(nèi)的實(shí)際觀察值A(chǔ)i為各年齡組中第一小格內(nèi)理論值,其估計(jì)公式為:

m1in1iAi=---------------(1)Ni

Var(ai;OR=1)為來自總體OR=1的樣本分層后各層暴露病例數(shù)ai的方差,其計(jì)算公式為:

m1in1im0in0iVar(ai;OR=1)=-------------------------(2)Ni2(Ni–1)An1-Am1-An0-m1+An1n0m0m1

在特定的無效假設(shè)下,即H0:OR=1時(shí),可根據(jù)

前述公式(1)計(jì)算理論值A(chǔ):

m1in1iAi=--------------Ni

計(jì)算每一層內(nèi)第一小格理論值A(chǔ)i的結(jié)果如下:

25-歲組:A1=(10x1)/116=0.08635-歲組:A2=(30x9)/199=1.356······75+歲組:A7=(5x31)/44=1.477

每層的方差按述前公式(2)計(jì)算Var(a1;OR=1)如下:

25-歲組:Var(a1;OR=1)=(10x106x1x115)/1162X(116-1)=0.079

35-歲組:Var(a2;OR=1)=(30x169x9x190)/1992X(199-1)=1.106·········75+歲組:Var(a7;OR=1)=(5x39x13x31)/442X(44-1)=0.944

每層的Ai值和Var(ai;OR=1)值見下表:年齡(歲)aiAiVar(ai;OR=1)25-10.0860.07935-41.3561.10645-2511.6636.85855-4221.66810.67065-1912.6406.44975+51.4770.9449648.89026.106

代入上述X2公式,得:

(96–48.890–1/2)2X2=--------------------------------=83.2226.106df=1,P<0.0001

ORmh的95%可信限區(qū)間估計(jì)公式為:

ORu,ORL=ORmh[1±1.96/(x2)1/2]

式中:X2應(yīng)為未作連續(xù)校正的值,該值為:

X2=(96-48.890)2/26.106=85.01;

以此帶入[1±1.96/(x2)1/2]計(jì)算得:

[1±1.96/(x2)1/2]=0.7874,1.2126

代入上式得:

ORu,ORL=5.1580.7876,5.1581.2126

=3.64,7.31

比較cOR和ORmh,顯示兩者有較小的差別,表明年

齡起輕微的混雜作用,經(jīng)分層調(diào)整消除年齡的混

雜作用后,食管癌與飲酒之間的關(guān)聯(lián)為:ORmh=5.158,95%可信限為3.64-7.31。

2.多因素分析

-當(dāng)分析多個(gè)因子的混雜效應(yīng)時(shí),會出現(xiàn)分層過多的現(xiàn)象,以至難于實(shí)現(xiàn)對混雜的調(diào)整;

-應(yīng)用多因素分析方法可有效控制混雜因子的影響常用的方法有下述幾種。

(1)多元Logistic回歸分析和Cox回歸分析適用于因變量為二值函數(shù)(患病,不患病)的定

群研究病和例對照研究。(2)協(xié)方差分析

適用于因變量是一連續(xù)變量的資料分析。效應(yīng)修正作用的識別與描述D+D-

E+a1b1E-c1d1D+D-

E+a2b2E-c2d2aRR1aRR2F+F-效應(yīng)修正作用概念:外部因子改變了研究因素與疾病的關(guān)聯(lián)強(qiáng)度測量:如果aRR1≠aRR2,存在效應(yīng)修正作用:如果aRR1=aRR2,不存在效應(yīng)修正作用:

意義:探討病因

正交互作用:aRR1>aRR2

負(fù)交互作用:aRR1<aRR2年齡(歲)組別每日飲酒量aORi80克0-79克25-病例對照19010635-病例對照42651645.0545-病例對照2529211385.6755-病例對照4227341396.3665-病例對照191836882.5875+病例對照50831

第三因子年齡分層后計(jì)算的每層比值比aOR

各層aORi值不太一致,提示年齡可能是效應(yīng)修正因子通過一致性χ2檢驗(yàn),確定層間差異是否有統(tǒng)計(jì)學(xué)意義

aORi一致性χ2檢驗(yàn)公式為:

?式中理論值A(chǔ)i(ORmh),是根據(jù)ORmh的值通過計(jì)算每個(gè)年齡組相應(yīng)的四格表中ai的理論值所獲得,其值的計(jì)算可按下述公式解一元二次方程:(本例中ORmh=5.158,為調(diào)整混雜效應(yīng)后總的OR值)

25-34歲組:

A1(115–10+A1)=(1–A1)(10–A1)x

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論