循證醫(yī)學(xué)4流行病學(xué)研究中的常見偏倚 課件_第1頁
循證醫(yī)學(xué)4流行病學(xué)研究中的常見偏倚 課件_第2頁
循證醫(yī)學(xué)4流行病學(xué)研究中的常見偏倚 課件_第3頁
循證醫(yī)學(xué)4流行病學(xué)研究中的常見偏倚 課件_第4頁
循證醫(yī)學(xué)4流行病學(xué)研究中的常見偏倚 課件_第5頁
已閱讀5頁,還剩169頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

流行病學(xué)研究中的常見偏倚

及其控制

上海交通大學(xué)公共衛(wèi)生學(xué)院施榕流行病學(xué)研究中的常見偏倚

及其控制

上海交通大學(xué)公共衛(wèi)生學(xué)院1偏倚(bias)指觀察值與真值之間的偏離,是一種隨機(jī)誤差以外誤差的誤差,屬系統(tǒng)誤差(systemicerror)它是由某些較為恒定的不能準(zhǔn)確測(cè)量的因素所造成。偏倚可發(fā)生在流行病學(xué)研究的設(shè)計(jì)、實(shí)施分析等各個(gè)階段,如選擇對(duì)象中以志愿者代替隨機(jī)樣本,使調(diào)查對(duì)象不能代表總體。重復(fù)抽樣或加大樣本含量并不能使這種誤差減少或消失。流行病學(xué)研究中常見的偏倚主要有三大類,即選擇偏倚、信息偏倚、混雜偏倚。。偏倚(bias)2第一節(jié)選擇偏倚及控制一、選擇偏倚概念及類型選擇偏倚(selectionbias)是由于選擇研究對(duì)象的方法有問題,使入選者與未入選者在某些特征上存在著系統(tǒng)差異,從而導(dǎo)致研究結(jié)果偏離真實(shí)情況。在各類流行病學(xué)研究中均可發(fā)生選擇偏倚,以病例對(duì)照研究中較為常見,如入院率偏倚、現(xiàn)患病例-新病例偏倚、檢出癥候群偏倚等。第一節(jié)選擇偏倚及控制一、選擇偏倚概念及類型31.入院率偏倚(admissionratebias)入院率偏倚是由于各種疾病的入院率不同而致的偏倚?,F(xiàn)舉例說明。某研究者計(jì)劃研究A病與X因素的關(guān)系,A病例取自某醫(yī)院,同時(shí),他以同一醫(yī)院隨機(jī)抽取相應(yīng)人數(shù)的B病人作對(duì)照。1.入院率偏倚(admissionratebias)入院4OR=1,χ2檢驗(yàn)差異無顯著性,說明A病與X因素?zé)o關(guān)系。OR=1,χ2檢驗(yàn)差異無顯著性,說明A病與X因素?zé)o關(guān)系。5假設(shè)A病住院率為25%,B病住院率為60%,具有X因素也有一定的入院率為40%?,F(xiàn)就上述不同的入院率計(jì)算住院人數(shù):A病無X因素住院人數(shù)=4800×0.25=1200人A病有X因素住院人數(shù)=1200×0.25+(1200-300)×0.4=660人B病無X因素住院人數(shù)=4800×0.6=2800人B病有X因素住院人數(shù)=1200×0.6+(1200-720)×0.4=912人假設(shè)A病住院率為25%,B病住院率為60%,具有X因素也有一6表6-2醫(yī)院為基礎(chǔ)的病例對(duì)照研究表6-2醫(yī)院為基礎(chǔ)的病例對(duì)照研究7P<0.01,上述結(jié)果表明人群中A病與X因素本無關(guān)聯(lián),而以醫(yī)院病例作為樣本所得觀察結(jié)果則是有關(guān)聯(lián)的。P<0.01,上述結(jié)果表明人群中A病與X因素本無關(guān)聯(lián),而以醫(yī)82.現(xiàn)患病例-新病例偏倚(prevalence-incidencebias)在病例對(duì)照研究,調(diào)查時(shí)選擇的病例往往是存活的現(xiàn)患病例,無法對(duì)那些因患病已死亡的病例或輕型、非典型或已痊愈的病例進(jìn)行調(diào)查,而隊(duì)列研究中常采用新發(fā)生的病例,因而病例對(duì)照研究得出的結(jié)論與隊(duì)列研究的結(jié)果可能發(fā)生差異,此即現(xiàn)患病例-新病例偏倚,也稱為奈曼偏倚(Neymanbias)。2.現(xiàn)患病例-新病例偏倚(prevalence-incide9例如,F(xiàn)riedman等人在美國(guó)弗明漢地區(qū)對(duì)心血管系統(tǒng)疾病的研究中發(fā)現(xiàn):男性居民在隊(duì)列研究中,具有高膽固醇水平者,患冠心病的RR值為2.40,而另一項(xiàng)病例對(duì)照研究中,病例組與對(duì)照組卻無明顯差異,OR=1.16(表)。例如,F(xiàn)riedman等人在美國(guó)弗明漢地區(qū)對(duì)心血管系統(tǒng)疾病的10表6-3費(fèi)明漢地區(qū)男性居民血膽固醇水平與冠心病關(guān)系表6-3費(fèi)明漢地區(qū)男性居民血膽固醇水平與冠心病關(guān)系11進(jìn)一步調(diào)查發(fā)現(xiàn),患冠心病病人在被診斷為該病后,其后來的生活習(xí)慣或嗜好發(fā)生改變,如開始戒煙、多食低膽固醇食物、進(jìn)行體育鍛煉,從而使血中膽固醇水平降低,因此病例對(duì)照研究的結(jié)論存在明顯的差異。進(jìn)一步調(diào)查發(fā)現(xiàn),患冠心病病人在被診斷為該病后,其后來的生活習(xí)123.檢出征候群偏倚(detectionsignalbias)檢出征候群偏倚是指某因素與某疾病在病因?qū)W上雖無關(guān)系,但由于該因素的存在會(huì)引起該病的臨床癥狀或體征的出現(xiàn),從而使患者及早就醫(yī),接受多種檢查,導(dǎo)致該人群有較高的檢出率,致使過高地估計(jì)該因素與該疾病的關(guān)聯(lián)。

3.檢出征候群偏倚(detectionsignalbia13

例如,1975年,Ziel等以病例對(duì)照研究,從美國(guó)加州洛杉磯婦女中調(diào)查口服雌激素與子宮內(nèi)膜癌的關(guān)系,結(jié)果表明子宮內(nèi)膜癌患者雌激素暴露比例明顯高于對(duì)照組,認(rèn)為子宮內(nèi)膜癌與服用雌激素密切相關(guān)。例如,1975年,Ziel等以病例對(duì)照研究,從美國(guó)加14表6-4更年期服用雌激素與子宮內(nèi)膜癌的關(guān)系表6-4更年期服用雌激素與子宮內(nèi)膜癌的關(guān)系151978年,Horwitz指出,這一結(jié)論是由檢出征候偏倚所致,兩者之間的高度關(guān)聯(lián)是虛假的。因?yàn)樵谌巳褐杏幸欢康臒o癥狀的子宮內(nèi)膜癌早期病人,她們?nèi)舨环么萍に?,子宮不致出血,因而不去醫(yī)院就診,而不能被發(fā)現(xiàn)。

1978年,Horwitz指出,這一結(jié)論是由檢出征候偏倚所致164.志愿者偏倚(volunteerbias)一般情況下,志愿者與非志愿者在關(guān)心健康、注意飲食習(xí)慣、禁煙、禁酒及體育鍛煉等方面可能存在系統(tǒng)的差別,因而,志愿者被入選為觀察對(duì)象,而非志愿者落選,這樣的研究結(jié)果往往有選擇偏倚。例如,一項(xiàng)以體育鍛煉預(yù)防冠心病的研究,干預(yù)組都是志愿者,而將非志愿者作對(duì)照,以比較該項(xiàng)措施的效果,這樣就可能會(huì)得出不正確的結(jié)論。4.志愿者偏倚(volunteerbias)一般情況下,17從上例可以看出選好對(duì)照組是十分不容易的,它同研究者的臨床知識(shí),經(jīng)驗(yàn),及關(guān)于研究變量的特征,對(duì)象選入的方法等都有關(guān)。有時(shí)還需將多種對(duì)照同時(shí)觀察更能說明問題。從上例可以看出選好對(duì)照組是十分不容易的,它同研究者的臨床知識(shí)185.無應(yīng)答偏倚(nonrespondentbias)無應(yīng)答者是指研究對(duì)象中未按設(shè)計(jì)要求對(duì)被調(diào)查的內(nèi)容予以應(yīng)答者。某個(gè)特定樣本中的無應(yīng)答者的患病情況及某些因素的暴露情況與應(yīng)答者可能不同,因此而產(chǎn)生的偏倚稱為無應(yīng)答偏倚。此種偏倚在分析性研究和實(shí)驗(yàn)性研究中均可發(fā)生。5.無應(yīng)答偏倚(nonrespondentbias)無19如Seltze等報(bào)道,以函訪調(diào)查人群吸煙狀況時(shí)發(fā)現(xiàn),85%的非吸煙者在一個(gè)月內(nèi)回函應(yīng)答了調(diào)查內(nèi)容,但在吸煙者中,應(yīng)答率僅占67%,這樣對(duì)男性吸煙的估計(jì)是明顯低估的。如Seltze等報(bào)道,以函訪調(diào)查人群吸煙狀況時(shí)發(fā)現(xiàn),85%的206.失訪偏倚(losstofollowupbias)失訪也是無應(yīng)答的一種表現(xiàn),只是它主要發(fā)生在隊(duì)列及實(shí)驗(yàn)性研究中。在隨訪研究過程中,研究對(duì)象未能按計(jì)劃被隨訪,它是此類研究選擇偏倚的主要原因之一。6.失訪偏倚(losstofollowupbias21失訪一般有兩種情況,一種是由于觀察期限短于原規(guī)定的觀察危險(xiǎn)期,一般與所觀察的暴露因素或結(jié)果無關(guān),且經(jīng)過統(tǒng)計(jì)學(xué)處理能把他們當(dāng)作截尾數(shù)據(jù)(censoreddata)處理。雖觀察不到他們發(fā)生某事件的概率,但與留在觀察組中的非失訪者是相同的,一般較少引起偏倚。

失訪一般有兩種情況,一種是由于觀察期限短于原規(guī)定的觀察危險(xiǎn)期22另一種失訪是在隨訪過程中因種種原因拒絕繼續(xù)留在觀察組中,他們的失訪是主動(dòng)的,多半同所研究的暴露因素或結(jié)果有關(guān)。若數(shù)量不大,不致引起偏倚,但若數(shù)量較大,則有可能產(chǎn)生偏倚。一項(xiàng)研究的失訪率最好不超過10%或稍高,否則應(yīng)慎重考慮對(duì)結(jié)果的解釋。

另一種失訪是在隨訪過程中因種種原因拒絕繼續(xù)留在觀察組中,他們23二、選擇偏倚的測(cè)量與防制

(一)、選擇偏倚的測(cè)量二、選擇偏倚的測(cè)量與防制

(一)、選擇偏倚的測(cè)量24選擇偏倚在理論上可以通過總?cè)巳号c實(shí)際抽樣人群疾病與暴露分布情況進(jìn)行測(cè)量。下面以病例對(duì)照研究為例,總?cè)巳号c實(shí)際抽樣人群中疾病與暴露因素的分布分別如表6-5和表6-6所示:選擇偏倚在理論上可以通過總?cè)巳号c實(shí)際抽樣人群疾病與暴露分布情25表6-6實(shí)際抽樣人群疾病與暴露分布表6-5總?cè)巳杭膊∨c暴露分布總?cè)巳罕葦?shù)比:樣本比數(shù)比:表6-6實(shí)際抽樣人群疾病與暴露分布表6-5總?cè)巳杭膊∨c26選擇概率為:根據(jù)選擇概率:選擇偏倚或選擇概率為:根據(jù)選擇概率:選擇偏倚或27若偏倚=0即=1,則不存在選擇偏倚偏倚>0,即>1,則存在正向選擇偏倚偏倚<0,即<1,則存在負(fù)向選擇偏倚若偏倚=0即=1,則不存在選擇偏倚偏倚>0,即>128現(xiàn)以前述入院率偏倚為例,α=660/1200=0.55β=1200/4800=0.25γ=912/1200=0.76δ=2880/4800=0.6

偏倚=-1=0.74現(xiàn)以前述入院率偏倚為例,偏倚=-1=0.7429(二)選擇偏倚的防制1、正確的研究設(shè)計(jì)首先研究者對(duì)整個(gè)研究可能會(huì)產(chǎn)生的各種選擇偏倚有充分的了解。在設(shè)計(jì)中,應(yīng)注意使被比較的各組有同等的概率受到調(diào)查。應(yīng)考慮可能出現(xiàn)的各種偏倚,以及會(huì)在那些環(huán)節(jié)出現(xiàn),只有在設(shè)計(jì)時(shí)考慮周全,并采取相應(yīng)措施,在各個(gè)環(huán)節(jié)中阻斷偏倚產(chǎn)生的可能性,才能防止或減少其發(fā)生。

(二)選擇偏倚的防制1、正確的研究設(shè)計(jì)302、盡量采用多種對(duì)照理想的是以人群中全體病例和非病例(或其有代表性的樣本)作為研究對(duì)象。如以醫(yī)院病例為研究對(duì)象,宜在多個(gè)醫(yī)院選擇對(duì)象,且最好有2個(gè)對(duì)照組,其中一個(gè)對(duì)照組來自社區(qū)一般人群,在隊(duì)列研究中,最好也應(yīng)設(shè)多種對(duì)照,以減少選擇偏倚對(duì)結(jié)果的影響。2、盡量采用多種對(duì)照313、嚴(yán)格掌握研究對(duì)象入選與排除的標(biāo)準(zhǔn)使研究對(duì)象能較好地代表其相應(yīng)的總體。如病例對(duì)照,一般可規(guī)定病例的入選原則為新發(fā)的確診病例,以避免Neyman偏倚。在實(shí)驗(yàn)性研究中,應(yīng)嚴(yán)格按照隨機(jī)分配的原則,將研究對(duì)象分組,使兩組除所觀察因素外應(yīng)具有均衡性、可比性。應(yīng)避免將志愿者分為一組,非志愿者分為另一組,病情輕者分在一組,病情重者分在另一組等情況的發(fā)生。3、嚴(yán)格掌握研究對(duì)象入選與排除的標(biāo)準(zhǔn)324、提高研究對(duì)象的依從性在研究中應(yīng)采取相應(yīng)措施,盡量取得研究對(duì)象的合作,盡可能提高應(yīng)答率,減少無應(yīng)答率和隊(duì)列研究中的主動(dòng)失訪,要做好組織、宣傳工作,調(diào)查手段要簡(jiǎn)便易行,對(duì)調(diào)查中的問題應(yīng)采取適當(dāng)?shù)奶幚砑记伞H魺o應(yīng)答或失訪者超過10%,應(yīng)對(duì)無應(yīng)答者或失訪者進(jìn)行隨機(jī)抽樣調(diào)查,對(duì)失訪者和已隨訪者的特征做比較分析。對(duì)研究結(jié)果可能有影響有關(guān)數(shù)據(jù)與應(yīng)答者進(jìn)行分析比較,若兩者差異有顯著性,說明對(duì)結(jié)果有影響,在結(jié)論中應(yīng)加以說明并應(yīng)作慎重的分析。

4、提高研究對(duì)象的依從性33第二節(jié)信息偏倚及控制一、信息偏倚的概念及類型信息偏倚(informationbias)是指在研究的實(shí)施階段中從研究對(duì)象獲取研究所需的信息時(shí)產(chǎn)生的系統(tǒng)誤差,其原因是由于診斷疾病、測(cè)量暴露或結(jié)局的方法有問題,導(dǎo)致被比較各組間收集的信息有差異而引入的誤差。各種類型的流行病學(xué)研究中均可產(chǎn)生信息偏倚,病例對(duì)照研究中常見的信息偏倚有回憶偏倚、報(bào)告偏倚、調(diào)查者偏倚、誘導(dǎo)偏倚等。錯(cuò)誤分類偏倚則在病例對(duì)照研究和隊(duì)列研究中都可產(chǎn)生。

第二節(jié)信息偏倚及控制一、信息偏倚的概念及類型341.回憶偏倚(recallbias)指比較組間在回憶過去的暴露或既往史時(shí),其完整性與準(zhǔn)確性存在系統(tǒng)誤差而引起的偏倚?;貞浧性诓±龑?duì)照研究中最常見,主要原因有:(1).研究對(duì)象對(duì)調(diào)查的內(nèi)容關(guān)心程度不同,一般情況下,病例組患者對(duì)調(diào)查的事件回憶認(rèn)真程度高于對(duì)照人群,因而導(dǎo)致兩組對(duì)象在回憶以往事件的準(zhǔn)確性存在差異。(2).調(diào)查的事件或因素發(fā)生的頻率較低,未給研究對(duì)象留下深刻印象而遺忘。(3).調(diào)查事件是很久以前發(fā)生的事情,研究對(duì)象記憶不清。

1.回憶偏倚(recallbias)指比較組間在回憶過去的352.報(bào)告偏倚(reportingbias)被調(diào)查者有意隱瞞真實(shí)情況,夸大或縮小某些信息而導(dǎo)致研究結(jié)果產(chǎn)生偏倚,故亦稱說謊偏倚。常見于敏感問題,如未成年人的吸煙史、冶游史。例如,有些人有冶游史,可能會(huì)難于陳述實(shí)情。而對(duì)于一些職業(yè)危害進(jìn)行調(diào)查,研究對(duì)象因涉及勞保福利等原因可能會(huì)夸大某些暴露信息。

2.報(bào)告偏倚(reportingbias)被調(diào)查者有意隱瞞363.診斷懷疑偏倚(diagnosticsuspicionbias)由于研究者事先了解研究對(duì)象對(duì)研究因素的暴露情況,于是帶著“先入為主”的傾向性,懷疑其患某病或在主觀上傾向出現(xiàn)某種陽性結(jié)果。如對(duì)暴露組或?qū)嶒?yàn)組進(jìn)行非常仔細(xì)地檢查,而對(duì)非暴露組或?qū)φ战M則不然,從而使研究結(jié)果出現(xiàn)偏差,由此而產(chǎn)生診斷懷疑偏倚,此類偏倚多見于隊(duì)列研究和臨床試驗(yàn)。

3.診斷懷疑偏倚(diagnosticsuspicion374.暴露懷疑偏倚(exposuresuspicionbias)與上述的診斷懷疑偏倚一樣,研究者在收集并確定病例組的暴露比例時(shí)所具有的認(rèn)真、細(xì)致程度遠(yuǎn)高于對(duì)照組,從而導(dǎo)致錯(cuò)誤結(jié)論,此即暴露懷疑偏倚。這類偏倚多見于病例對(duì)照研究,如采用病史記錄作為分析資料,因?yàn)樵儐柌∈返尼t(yī)生知道某些因素和某病發(fā)病有關(guān),因此對(duì)病例組患者在詢問病史時(shí)特別仔細(xì),常有陽性的記錄,而調(diào)查對(duì)照組時(shí)則漫不經(jīng)心,陰性結(jié)果很多。對(duì)兩組對(duì)象以不同的調(diào)查方法進(jìn)行調(diào)查,從而產(chǎn)生偏倚。

4.暴露懷疑偏倚(exposuresuspicionbi385.錯(cuò)誤分類偏倚(misclassificationbias)調(diào)查中使用的方法如果偏離了金標(biāo)準(zhǔn),則將產(chǎn)生錯(cuò)誤分類偏倚。在度量疾病狀態(tài)和暴露狀態(tài)都可能發(fā)生。每項(xiàng)診斷試驗(yàn)或測(cè)定儀器都有一定的靈敏度和特異度,但兩者都不大可能是100%,于是就會(huì)出現(xiàn)假陽性和假陰性,這就發(fā)生了錯(cuò)誤分類,即本應(yīng)是病人,但錯(cuò)將他分入了對(duì)照組,而本應(yīng)是非病人,則將他分入病例組。

5.錯(cuò)誤分類偏倚(misclassificationbia39無差異性錯(cuò)誤分類和差異性錯(cuò)誤分類第三節(jié)研究的偏倚表8-3

無差異性錯(cuò)誤分類

差異性錯(cuò)誤分類 錯(cuò)誤分類數(shù)據(jù) 錯(cuò)誤分類數(shù)據(jù)

研究真實(shí)數(shù)據(jù)

研究真實(shí)數(shù)據(jù)無差異性錯(cuò)誤分類和差異性錯(cuò)誤分類第三節(jié)研究的偏倚表8-3 40(1)無差異錯(cuò)分(nodifferentialmisclassification)當(dāng)se=se’、sp=sp’時(shí)產(chǎn)生,其實(shí)測(cè)結(jié)果往往低于真值,現(xiàn)以下例說明。表6-7是某隊(duì)列研究暴露組和非暴露組病例的真實(shí)分布情況。(1)無差異錯(cuò)分(nodifferentialmiscla41表6-7暴露組和非暴露組病例的真實(shí)分布情況RR=2表6-7暴露組和非暴露組病例的真實(shí)分布情況RR=242表6-8暴露組人員錯(cuò)分后的分布情況現(xiàn)假設(shè)某診斷疾病方法的se=0.8、sp=0.9,則暴露組病例400人,該方法診斷為病人400*0.8=380人,另有80人漏診,但另有600*(1-0.9)=60人誤診,故實(shí)際診斷為病人380人,診斷非病人為620人(表6-8)。表6-8暴露組人員錯(cuò)分后的分布情況現(xiàn)假設(shè)某診斷疾病方法的s43表6-9非暴露組人員錯(cuò)分后的分布情況非暴露組中該方法診斷病人為200×0.8=160人,誤診800*(1-0.9)=80,實(shí)際診斷病例數(shù)為240人診斷為非病人760人(表6-9)。表6-9非暴露組人員錯(cuò)分后的分布情況非暴露組中該方法診斷44表6-10暴露組、非暴露組病例的實(shí)際分布情況RRo=1.583錯(cuò)分偏倚=(RRo-RR)/RR=(1.583-2)/2=-0.209表6-10暴露組、非暴露組病例的實(shí)際分布情況RRo=1.45(2)有差異錯(cuò)分(differentialmisclassification)當(dāng)兩組測(cè)定方法的靈敏度和特異度不同,則可產(chǎn)生有差異錯(cuò)分,資料的實(shí)際估計(jì)值可高于真值,也可低于真值,即可能高估也可低估研究因素與疾病之間的聯(lián)系。(2)有差異錯(cuò)分(differentialmisclass46二、信息偏倚的控制1.搞好研究方法的質(zhì)量控制。調(diào)查表的設(shè)計(jì)時(shí),對(duì)所有調(diào)查內(nèi)容、指標(biāo)要規(guī)定明確、客觀的標(biāo)準(zhǔn),并力求量化所詢問方式的調(diào)查內(nèi)容;每個(gè)問題的答案應(yīng)標(biāo)準(zhǔn)化。對(duì)調(diào)查人員要進(jìn)行統(tǒng)一培訓(xùn),使其充分了解調(diào)查的目的、意義,統(tǒng)一標(biāo)準(zhǔn),統(tǒng)一調(diào)查技巧,調(diào)查詢問方式相同,有相同的深度和廣度。對(duì)所有調(diào)查方法應(yīng)規(guī)定質(zhì)量控制方法及標(biāo)準(zhǔn)。另外,還要對(duì)研究對(duì)象做好宣傳、組織工作,以取得研究對(duì)象的密切合作。

二、信息偏倚的控制1.搞好研究方法的質(zhì)量控制。472.資料的校正方法根據(jù)調(diào)查所得資料靈敏度、特異度可對(duì)含有信息偏倚(錯(cuò)分偏倚)的資料予以校正,下面介紹兩組資料測(cè)定方法敏感度與特異度較近時(shí)的校正方法,校正公式如下,現(xiàn)以表6-11資料為例說明信息偏倚的校正方法。A=(Sp·n1-c)/(se+Sp-1)B=(Sp·n2-d)/(se+Sp-1)C=n1-A

D=n2-B

2.資料的校正方法48表6-11某病例對(duì)照研究研究因素的暴露情況本病例組及對(duì)照組敏感度為0.9,特異度為0.7,代入公式計(jì)算得ORo=2.1。A=(0.7×100-34)/(0.9+0.7-1)=36/0.6=60B=(0.7×100-52)/(0.9+0.7-1)=18/0.6=30C=100-60=40D=100-30=70表6-11某病例對(duì)照研究研究因素的暴露情況本病例組及對(duì)照49循證醫(yī)學(xué)4流行病學(xué)研究中的常見偏倚課件503.盡可能采用“盲法”設(shè)計(jì)在調(diào)查中采用雙盲設(shè)計(jì),使調(diào)查人員和研究對(duì)象均不知曉分組情況,以避免診斷懷疑偏倚、暴露懷疑偏倚、報(bào)告偏倚等。對(duì)在調(diào)查過程仍可有可缺發(fā)生的信息偏倚,如錯(cuò)誤分類,則由于比較組間資料的準(zhǔn)確度相似,即使發(fā)生錯(cuò)誤分類,屬于無差異錯(cuò)誤分類的可能性較大,可應(yīng)用上述校正方法,作出相應(yīng)估計(jì)。

3.盡可能采用“盲法”設(shè)計(jì)514.利用客觀指標(biāo)或客觀方法收集資料在研究中應(yīng)盡量采用實(shí)驗(yàn)室檢查結(jié)果。研究對(duì)象的體格檢查記錄或診療記錄等客觀治療信息來源。對(duì)只能通過調(diào)查詢問方法收集主觀資料時(shí),應(yīng)盡量采用封閉式提問方式。條件許可時(shí),收集資料時(shí)可包括一些“無關(guān)”的信息。以分散被調(diào)查者的注意力,減少主觀因素的影響。

4.利用客觀指標(biāo)或客觀方法收集資料52第三節(jié)混雜偏倚及控制一、混雜偏倚概念混雜偏倚(confoundingbias)是在研究暴露與疾病的聯(lián)系時(shí),假如有一種外界因素既是與研究疾病的危險(xiǎn)因素有聯(lián)系,又在被比較各組中的分布不同,那么這一因素則稱為混雜變量。由于混雜變量的存在,造成了觀察到的聯(lián)系強(qiáng)度偏離了實(shí)際情況,則稱為混雜偏倚。

第三節(jié)混雜偏倚及控制一、混雜偏倚概念53F(混雜因素)

E(暴露因素)

D(疾?。?/p>

統(tǒng)計(jì)學(xué)聯(lián)系因果聯(lián)系圖6-1混雜偏倚示意圖F(混雜因素)統(tǒng)計(jì)學(xué)聯(lián)系因果聯(lián)系圖6-154混雜因素的基本特點(diǎn):(1)必須是研究疾病的獨(dú)立危險(xiǎn)因子(2)必須與研究因素有關(guān)(3)不是研究因素與疾病因果鏈上的中間變量

混雜因素的基本特點(diǎn):55

繼發(fā)關(guān)聯(lián)(secondaryassociation)

定義是一種純粹由混雜偏倚產(chǎn)生的關(guān)聯(lián)即懷疑的病因(暴露)E與疾病D并不存在因果關(guān)系,而是由于兩者(E,D)有共同的原因C,E,D同C存在關(guān)聯(lián),從而繼發(fā)產(chǎn)生E與D的關(guān)聯(lián)。第三節(jié)研究的偏倚C?DE繼發(fā)關(guān)聯(lián)(secondaryassociatio56例如高血清膽固醇是冠心病的危險(xiǎn)因素,高血清膽固醇可產(chǎn)生沉積于眼瞼的黃色瘤,從而導(dǎo)致黃色瘤與冠心病的繼發(fā)關(guān)聯(lián)。另外,E與C也可以由于相關(guān)(因果方向不明)而產(chǎn)生繼發(fā)關(guān)聯(lián)。例如吸煙是胰腺癌的危險(xiǎn)因素,吸煙又與喝咖啡存在相關(guān)(沒有確定的時(shí)間先后),從而造成喝咖啡與胰腺癌的繼發(fā)關(guān)聯(lián)。第三節(jié)研究的偏倚例如高血清膽固醇是冠心病的危險(xiǎn)因素,高血清膽固醇可產(chǎn)生沉57

直接因果關(guān)聯(lián)的歪曲

如果懷疑病因E與疾病D既存在直接關(guān)聯(lián),又存在間接關(guān)聯(lián)(圖A)或與其他危險(xiǎn)(保護(hù))因素F存在相關(guān)(圖B),暴露E與疾病D的直接因果關(guān)聯(lián)程度或方向?qū)⒖赡苁艿交祀s干擾,即得到歪曲的關(guān)聯(lián)估計(jì)值。

第三節(jié)研究的偏倚FDEFDE??AB直接因果關(guān)聯(lián)的歪曲第三節(jié)研究的偏倚FDEFDE??58

例如靜脈吸毒E與性亂F都是HIV感染D的危險(xiǎn)因素,吸毒者易發(fā)生多性伴行為,即吸毒同HIV感染既存在直接關(guān)聯(lián)(E→D)又存在間接關(guān)聯(lián)(E→F→D)(圖8-3,(2)),吸毒與多性伴沒有確定的時(shí)間先后而呈雙向相關(guān)(圖8-3,(3)),多性伴F將對(duì)吸毒E與HIV感染D的直接因果關(guān)聯(lián)起混雜或歪曲作用。第三節(jié)研究的偏倚例如靜脈吸毒E與性亂F都是HIV感染D的危險(xiǎn)因素,吸毒59第三節(jié)研究的偏倚圖8-3第三節(jié)研究的偏倚圖8-360圖6-2混雜因素成立與不成立的幾種情況示意圖不存在混雜偏倚的幾種情況存在混雜偏倚的幾種情況圖6-2混雜因素成立與不成立的幾種情況示意圖不存在混雜偏倚61二、混雜因素的測(cè)量:進(jìn)一步測(cè)量某一可疑混雜因子的混雜作用,可疑通過將含有該因素時(shí)(如RR、OR),與扣除該因素后的估計(jì)值進(jìn)行比較分析來實(shí)現(xiàn)。研究因素與疾病的估計(jì)值為cRR或cOR,稱為粗RR或粗OR;按該可疑因素調(diào)整后的估計(jì)值為aRR(f)或aOR(f),稱作調(diào)整RR或調(diào)整OR,aRR(f)可用MentelHaenszel分層分析方法計(jì)算。現(xiàn)以估計(jì)值RR說明測(cè)量方法(OR測(cè)量方法相同)。

二、混雜因素的測(cè)量:進(jìn)一步測(cè)量某一可疑混雜因子的混雜作用,可62(1).若CRR=aRR,f無混雜作用(2).若CRR≠aRR,f有混雜作用。CRR>aRR為正混雜:混雜偏倚的存在使研究中暴露與疾病之間存在的真實(shí)聯(lián)系被夸大。CRR>aRR為負(fù)混雜,由于f的混雜作用,使cRR低估研究因素與疾病之間的聯(lián)系。(3).混雜偏倚=(CRR-aRR)/aRR。若值=0,無混雜。若值>0,有正混雜;若值<0為負(fù)混雜。(1).若CRR=aRR,f無混雜作用63對(duì)混雜因素的分析,可將含有該因素時(shí)研究因素與疾病的估計(jì)值與按該因素分層后,研究因素與疾病的估計(jì)值進(jìn)行比較,若兩者不一致,則有可能存在混雜偏倚,現(xiàn)舉例說明如下。某隊(duì)列研究調(diào)查粉塵與呼吸道疾病的關(guān)系,吸煙(F)可能是混雜因素,

對(duì)混雜因素的分析,可將含有該因素時(shí)研究因素與疾病的估計(jì)值與按64計(jì)算粗RRRR=1計(jì)算粗RRRR=165按吸煙與否分層:RR=0.58RR=3.06按吸煙與否分層:RR=0.58RR=3.0666分層前RR與分層RR后不一致,說明吸煙很可能是一個(gè)混雜因素,分析吸煙與呼吸道系統(tǒng)疾病是否關(guān)聯(lián)。RR=1.42,表明吸煙是呼吸道系統(tǒng)疾病危險(xiǎn)因素。任何一個(gè)外界因素本身并不固有混雜因素的特性,必須有另一暴露因素同時(shí)存在,且它在暴露組與非暴露組的分布不均勻,才可能成為混雜因素分層前RR與分層RR后不一致,說明吸煙很可能是一個(gè)混雜因素,67三、混雜偏倚控制1.研究階段(1)限制(restriction)如果認(rèn)為某個(gè)或某些因素是可能的或已知的混雜因素,在設(shè)計(jì)過程中,可對(duì)研究對(duì)象的選擇條件進(jìn)行規(guī)定,但限制條件不宜太多。如研究冠心病與吸煙的關(guān)系,年齡與性別可能是混雜因素,就規(guī)定本次調(diào)查僅限與40-50歲的男性居民。三、混雜偏倚控制1.研究階段68(2)配比(matching)個(gè)體配比將每個(gè)指示病例選擇一個(gè)或多個(gè)對(duì)照,該對(duì)照與病例具有某些相同的特征,如年齡、性別等,在各比較組有相同的分布,以達(dá)到清除混雜作用的目的。頻數(shù)配比將使對(duì)照組在某個(gè)潛在的混雜變量的分布與指示病例組的分布相同,如暴露組30-39歲為30%,40-49歲為30%,50-59歲為40%,那么非暴露組應(yīng)與暴露組有相同的年齡分布。(3)隨機(jī)化(randomization)一般用于實(shí)驗(yàn)性研究,其目的之一就是將混雜因素均勻地分配在各組中。

(2)配比(matching)個(gè)體配比將每個(gè)指示病例選692.資料的分析階段(1)分層分析在對(duì)研究的因素與疾病的聯(lián)系進(jìn)行分析時(shí),可首先按某個(gè)潛在的混雜因子進(jìn)行分層,如不存在研究因素與混雜因素對(duì)疾病的交互作用,可用Mantel-Haenszel法,求出合并的ORMH及MH

2.資料的分析階段70隊(duì)列研究

(1)累計(jì)發(fā)病率資料第三節(jié)研究的偏倚表8-4隊(duì)列研究

(1)累計(jì)發(fā)病率資料第三節(jié)研究的偏倚表8-471(2)發(fā)病密度資料第三節(jié)研究的偏倚表8-5(2)發(fā)病密度資料第三節(jié)研究的偏倚表8-572病例對(duì)照研究第三節(jié)研究的偏倚表8-6病例對(duì)照研究第三節(jié)研究的偏倚表8-673

(1)按可能的混雜因素吸煙分層第三節(jié)研究的偏倚表8-7表8-8ai

bi

m1i

ci

di

m0ini

n0

ti

(1)按可能的混雜因素吸煙分層第三節(jié)研究的偏倚表8-74(2)判定層間關(guān)聯(lián)效應(yīng)水平是否同質(zhì)

按是否吸煙分層后,兩層內(nèi)的飲酒與肺癌的關(guān)聯(lián)效應(yīng)大小是同質(zhì)(同質(zhì)性檢驗(yàn))的,可以應(yīng)用M-H方法計(jì)算綜合OR第三節(jié)研究的偏倚(2)判定層間關(guān)聯(lián)效應(yīng)水平是否同質(zhì) 按是否吸煙分層后,兩層75(3)計(jì)算綜合或調(diào)整OR,并與粗OR比較

P>0.25第三節(jié)研究的偏倚(3)計(jì)算綜合或調(diào)整OR,并與粗OR比較P>0.25第76(4)結(jié)論吸煙對(duì)飲酒與肺癌的關(guān)聯(lián)(cOR=3.69)有混雜作用(cOR≠ORMH)控制吸煙的混雜作用后,飲酒與肺癌無關(guān)聯(lián)(=0.6509,P>0.25)注意針對(duì)ORMH的2檢驗(yàn)是在排除了混雜偏倚的基礎(chǔ)上再排除隨機(jī)誤差,而針對(duì)cOR的2檢驗(yàn)是建立在沒有排除混雜偏倚的基礎(chǔ)上的第三節(jié)研究的偏倚(4)結(jié)論吸煙對(duì)飲酒與肺癌的關(guān)聯(lián)(cOR=3.69)有77分層分析法分層前:分層后:COR=ad/bc分層分析法分層后:COR=ad/bc78的方差:的方差:79例如,病例組為某地醫(yī)院診療的25-49歲患心肌梗死的婦女234名,對(duì)照組為該地年齡為25-49歲婦女的隨機(jī)樣本1742名。病例組和對(duì)照組均按同一方法和標(biāo)準(zhǔn)收集三個(gè)月前避孕藥的暴露情況。不考慮對(duì)口服避孕藥與心肌梗死的關(guān)系其粗比數(shù)比為1.86(表6-17)表6-17口服避孕藥與心肌梗死的關(guān)系=5.84,OR=1.86例如,病例組為某地醫(yī)院診療的25-49歲患心肌梗死的婦女2380年齡與口服避孕藥與心肌梗死的關(guān)系列于表6-18表6-18年齡與心肌梗死與口服避孕藥的關(guān)系年齡與口服避孕藥與心肌梗死的關(guān)系列于表6-18表6-18年81自上表可發(fā)現(xiàn)年齡與心肌梗死和口服避孕藥均不關(guān)聯(lián)。且在病例組和對(duì)照組分布不均。年齡有可能為混雜因子,應(yīng)予調(diào)整,按年齡分層,口服避孕藥與心肌梗死的關(guān)系列于表6-19,按Mantel-Halnszel方法估計(jì)調(diào)整比數(shù)比aOR(f),列于表6-20。自上表可發(fā)現(xiàn)年齡與心肌梗死和口服避孕藥均不關(guān)聯(lián)。且在病例組和82表6-19按年齡分層心肌梗死與近期使用口服避孕藥的關(guān)系表6-19按年齡分層心肌梗死與近期使用口服避孕藥的關(guān)系83表6-20M-H法計(jì)ORMH、MHORMH=23.71/5.97=3.97ORMH>OR表6-20M-H法計(jì)ORMH、MHORMH=23.7184OR的95%可信區(qū)間:混雜偏倚=表明年齡對(duì)口服避孕藥與心肌梗死的關(guān)系起負(fù)向混雜作用,使比數(shù)比低57.57%。OR的95%可信區(qū)間:混雜偏倚=表明年齡對(duì)口服避孕藥與心肌梗85(2)數(shù)學(xué)模型對(duì)于二項(xiàng)分類變量(患病,不患?。?,亦可用Logistic回歸模型分析,仍以上例痢疾發(fā)病病因資料說明如下:

冷飲史X1=1陽性2陰性用膳地點(diǎn)X2=1本部食堂2西部食堂(2)數(shù)學(xué)模型冷飲史X1=1陽性2陰性用膳地點(diǎn)X2=86y=3.101X1+0.325X2P<0.05表示控制了用膳地點(diǎn),冷飲史仍為危險(xiǎn)因素。表示控制冷飲史后,用膳地點(diǎn)的作用消失了,結(jié)論與分層分析一致P<0.05P>0.05y=3.101X1+0.325X2P<0.05表示控制87流行病學(xué)研究中的常見偏倚

及其控制

上海交通大學(xué)公共衛(wèi)生學(xué)院施榕流行病學(xué)研究中的常見偏倚

及其控制

上海交通大學(xué)公共衛(wèi)生學(xué)院88偏倚(bias)指觀察值與真值之間的偏離,是一種隨機(jī)誤差以外誤差的誤差,屬系統(tǒng)誤差(systemicerror)它是由某些較為恒定的不能準(zhǔn)確測(cè)量的因素所造成。偏倚可發(fā)生在流行病學(xué)研究的設(shè)計(jì)、實(shí)施分析等各個(gè)階段,如選擇對(duì)象中以志愿者代替隨機(jī)樣本,使調(diào)查對(duì)象不能代表總體。重復(fù)抽樣或加大樣本含量并不能使這種誤差減少或消失。流行病學(xué)研究中常見的偏倚主要有三大類,即選擇偏倚、信息偏倚、混雜偏倚。。偏倚(bias)89第一節(jié)選擇偏倚及控制一、選擇偏倚概念及類型選擇偏倚(selectionbias)是由于選擇研究對(duì)象的方法有問題,使入選者與未入選者在某些特征上存在著系統(tǒng)差異,從而導(dǎo)致研究結(jié)果偏離真實(shí)情況。在各類流行病學(xué)研究中均可發(fā)生選擇偏倚,以病例對(duì)照研究中較為常見,如入院率偏倚、現(xiàn)患病例-新病例偏倚、檢出癥候群偏倚等。第一節(jié)選擇偏倚及控制一、選擇偏倚概念及類型901.入院率偏倚(admissionratebias)入院率偏倚是由于各種疾病的入院率不同而致的偏倚?,F(xiàn)舉例說明。某研究者計(jì)劃研究A病與X因素的關(guān)系,A病例取自某醫(yī)院,同時(shí),他以同一醫(yī)院隨機(jī)抽取相應(yīng)人數(shù)的B病人作對(duì)照。1.入院率偏倚(admissionratebias)入院91OR=1,χ2檢驗(yàn)差異無顯著性,說明A病與X因素?zé)o關(guān)系。OR=1,χ2檢驗(yàn)差異無顯著性,說明A病與X因素?zé)o關(guān)系。92假設(shè)A病住院率為25%,B病住院率為60%,具有X因素也有一定的入院率為40%。現(xiàn)就上述不同的入院率計(jì)算住院人數(shù):A病無X因素住院人數(shù)=4800×0.25=1200人A病有X因素住院人數(shù)=1200×0.25+(1200-300)×0.4=660人B病無X因素住院人數(shù)=4800×0.6=2800人B病有X因素住院人數(shù)=1200×0.6+(1200-720)×0.4=912人假設(shè)A病住院率為25%,B病住院率為60%,具有X因素也有一93表6-2醫(yī)院為基礎(chǔ)的病例對(duì)照研究表6-2醫(yī)院為基礎(chǔ)的病例對(duì)照研究94P<0.01,上述結(jié)果表明人群中A病與X因素本無關(guān)聯(lián),而以醫(yī)院病例作為樣本所得觀察結(jié)果則是有關(guān)聯(lián)的。P<0.01,上述結(jié)果表明人群中A病與X因素本無關(guān)聯(lián),而以醫(yī)952.現(xiàn)患病例-新病例偏倚(prevalence-incidencebias)在病例對(duì)照研究,調(diào)查時(shí)選擇的病例往往是存活的現(xiàn)患病例,無法對(duì)那些因患病已死亡的病例或輕型、非典型或已痊愈的病例進(jìn)行調(diào)查,而隊(duì)列研究中常采用新發(fā)生的病例,因而病例對(duì)照研究得出的結(jié)論與隊(duì)列研究的結(jié)果可能發(fā)生差異,此即現(xiàn)患病例-新病例偏倚,也稱為奈曼偏倚(Neymanbias)。2.現(xiàn)患病例-新病例偏倚(prevalence-incide96例如,F(xiàn)riedman等人在美國(guó)弗明漢地區(qū)對(duì)心血管系統(tǒng)疾病的研究中發(fā)現(xiàn):男性居民在隊(duì)列研究中,具有高膽固醇水平者,患冠心病的RR值為2.40,而另一項(xiàng)病例對(duì)照研究中,病例組與對(duì)照組卻無明顯差異,OR=1.16(表)。例如,F(xiàn)riedman等人在美國(guó)弗明漢地區(qū)對(duì)心血管系統(tǒng)疾病的97表6-3費(fèi)明漢地區(qū)男性居民血膽固醇水平與冠心病關(guān)系表6-3費(fèi)明漢地區(qū)男性居民血膽固醇水平與冠心病關(guān)系98進(jìn)一步調(diào)查發(fā)現(xiàn),患冠心病病人在被診斷為該病后,其后來的生活習(xí)慣或嗜好發(fā)生改變,如開始戒煙、多食低膽固醇食物、進(jìn)行體育鍛煉,從而使血中膽固醇水平降低,因此病例對(duì)照研究的結(jié)論存在明顯的差異。進(jìn)一步調(diào)查發(fā)現(xiàn),患冠心病病人在被診斷為該病后,其后來的生活習(xí)993.檢出征候群偏倚(detectionsignalbias)檢出征候群偏倚是指某因素與某疾病在病因?qū)W上雖無關(guān)系,但由于該因素的存在會(huì)引起該病的臨床癥狀或體征的出現(xiàn),從而使患者及早就醫(yī),接受多種檢查,導(dǎo)致該人群有較高的檢出率,致使過高地估計(jì)該因素與該疾病的關(guān)聯(lián)。

3.檢出征候群偏倚(detectionsignalbia100

例如,1975年,Ziel等以病例對(duì)照研究,從美國(guó)加州洛杉磯婦女中調(diào)查口服雌激素與子宮內(nèi)膜癌的關(guān)系,結(jié)果表明子宮內(nèi)膜癌患者雌激素暴露比例明顯高于對(duì)照組,認(rèn)為子宮內(nèi)膜癌與服用雌激素密切相關(guān)。例如,1975年,Ziel等以病例對(duì)照研究,從美國(guó)加101表6-4更年期服用雌激素與子宮內(nèi)膜癌的關(guān)系表6-4更年期服用雌激素與子宮內(nèi)膜癌的關(guān)系1021978年,Horwitz指出,這一結(jié)論是由檢出征候偏倚所致,兩者之間的高度關(guān)聯(lián)是虛假的。因?yàn)樵谌巳褐杏幸欢康臒o癥狀的子宮內(nèi)膜癌早期病人,她們?nèi)舨环么萍に?,子宮不致出血,因而不去醫(yī)院就診,而不能被發(fā)現(xiàn)。

1978年,Horwitz指出,這一結(jié)論是由檢出征候偏倚所致1034.志愿者偏倚(volunteerbias)一般情況下,志愿者與非志愿者在關(guān)心健康、注意飲食習(xí)慣、禁煙、禁酒及體育鍛煉等方面可能存在系統(tǒng)的差別,因而,志愿者被入選為觀察對(duì)象,而非志愿者落選,這樣的研究結(jié)果往往有選擇偏倚。例如,一項(xiàng)以體育鍛煉預(yù)防冠心病的研究,干預(yù)組都是志愿者,而將非志愿者作對(duì)照,以比較該項(xiàng)措施的效果,這樣就可能會(huì)得出不正確的結(jié)論。4.志愿者偏倚(volunteerbias)一般情況下,104從上例可以看出選好對(duì)照組是十分不容易的,它同研究者的臨床知識(shí),經(jīng)驗(yàn),及關(guān)于研究變量的特征,對(duì)象選入的方法等都有關(guān)。有時(shí)還需將多種對(duì)照同時(shí)觀察更能說明問題。從上例可以看出選好對(duì)照組是十分不容易的,它同研究者的臨床知識(shí)1055.無應(yīng)答偏倚(nonrespondentbias)無應(yīng)答者是指研究對(duì)象中未按設(shè)計(jì)要求對(duì)被調(diào)查的內(nèi)容予以應(yīng)答者。某個(gè)特定樣本中的無應(yīng)答者的患病情況及某些因素的暴露情況與應(yīng)答者可能不同,因此而產(chǎn)生的偏倚稱為無應(yīng)答偏倚。此種偏倚在分析性研究和實(shí)驗(yàn)性研究中均可發(fā)生。5.無應(yīng)答偏倚(nonrespondentbias)無106如Seltze等報(bào)道,以函訪調(diào)查人群吸煙狀況時(shí)發(fā)現(xiàn),85%的非吸煙者在一個(gè)月內(nèi)回函應(yīng)答了調(diào)查內(nèi)容,但在吸煙者中,應(yīng)答率僅占67%,這樣對(duì)男性吸煙的估計(jì)是明顯低估的。如Seltze等報(bào)道,以函訪調(diào)查人群吸煙狀況時(shí)發(fā)現(xiàn),85%的1076.失訪偏倚(losstofollowupbias)失訪也是無應(yīng)答的一種表現(xiàn),只是它主要發(fā)生在隊(duì)列及實(shí)驗(yàn)性研究中。在隨訪研究過程中,研究對(duì)象未能按計(jì)劃被隨訪,它是此類研究選擇偏倚的主要原因之一。6.失訪偏倚(losstofollowupbias108失訪一般有兩種情況,一種是由于觀察期限短于原規(guī)定的觀察危險(xiǎn)期,一般與所觀察的暴露因素或結(jié)果無關(guān),且經(jīng)過統(tǒng)計(jì)學(xué)處理能把他們當(dāng)作截尾數(shù)據(jù)(censoreddata)處理。雖觀察不到他們發(fā)生某事件的概率,但與留在觀察組中的非失訪者是相同的,一般較少引起偏倚。

失訪一般有兩種情況,一種是由于觀察期限短于原規(guī)定的觀察危險(xiǎn)期109另一種失訪是在隨訪過程中因種種原因拒絕繼續(xù)留在觀察組中,他們的失訪是主動(dòng)的,多半同所研究的暴露因素或結(jié)果有關(guān)。若數(shù)量不大,不致引起偏倚,但若數(shù)量較大,則有可能產(chǎn)生偏倚。一項(xiàng)研究的失訪率最好不超過10%或稍高,否則應(yīng)慎重考慮對(duì)結(jié)果的解釋。

另一種失訪是在隨訪過程中因種種原因拒絕繼續(xù)留在觀察組中,他們110二、選擇偏倚的測(cè)量與防制

(一)、選擇偏倚的測(cè)量二、選擇偏倚的測(cè)量與防制

(一)、選擇偏倚的測(cè)量111選擇偏倚在理論上可以通過總?cè)巳号c實(shí)際抽樣人群疾病與暴露分布情況進(jìn)行測(cè)量。下面以病例對(duì)照研究為例,總?cè)巳号c實(shí)際抽樣人群中疾病與暴露因素的分布分別如表6-5和表6-6所示:選擇偏倚在理論上可以通過總?cè)巳号c實(shí)際抽樣人群疾病與暴露分布情112表6-6實(shí)際抽樣人群疾病與暴露分布表6-5總?cè)巳杭膊∨c暴露分布總?cè)巳罕葦?shù)比:樣本比數(shù)比:表6-6實(shí)際抽樣人群疾病與暴露分布表6-5總?cè)巳杭膊∨c113選擇概率為:根據(jù)選擇概率:選擇偏倚或選擇概率為:根據(jù)選擇概率:選擇偏倚或114若偏倚=0即=1,則不存在選擇偏倚偏倚>0,即>1,則存在正向選擇偏倚偏倚<0,即<1,則存在負(fù)向選擇偏倚若偏倚=0即=1,則不存在選擇偏倚偏倚>0,即>1115現(xiàn)以前述入院率偏倚為例,α=660/1200=0.55β=1200/4800=0.25γ=912/1200=0.76δ=2880/4800=0.6

偏倚=-1=0.74現(xiàn)以前述入院率偏倚為例,偏倚=-1=0.74116(二)選擇偏倚的防制1、正確的研究設(shè)計(jì)首先研究者對(duì)整個(gè)研究可能會(huì)產(chǎn)生的各種選擇偏倚有充分的了解。在設(shè)計(jì)中,應(yīng)注意使被比較的各組有同等的概率受到調(diào)查。應(yīng)考慮可能出現(xiàn)的各種偏倚,以及會(huì)在那些環(huán)節(jié)出現(xiàn),只有在設(shè)計(jì)時(shí)考慮周全,并采取相應(yīng)措施,在各個(gè)環(huán)節(jié)中阻斷偏倚產(chǎn)生的可能性,才能防止或減少其發(fā)生。

(二)選擇偏倚的防制1、正確的研究設(shè)計(jì)1172、盡量采用多種對(duì)照理想的是以人群中全體病例和非病例(或其有代表性的樣本)作為研究對(duì)象。如以醫(yī)院病例為研究對(duì)象,宜在多個(gè)醫(yī)院選擇對(duì)象,且最好有2個(gè)對(duì)照組,其中一個(gè)對(duì)照組來自社區(qū)一般人群,在隊(duì)列研究中,最好也應(yīng)設(shè)多種對(duì)照,以減少選擇偏倚對(duì)結(jié)果的影響。2、盡量采用多種對(duì)照1183、嚴(yán)格掌握研究對(duì)象入選與排除的標(biāo)準(zhǔn)使研究對(duì)象能較好地代表其相應(yīng)的總體。如病例對(duì)照,一般可規(guī)定病例的入選原則為新發(fā)的確診病例,以避免Neyman偏倚。在實(shí)驗(yàn)性研究中,應(yīng)嚴(yán)格按照隨機(jī)分配的原則,將研究對(duì)象分組,使兩組除所觀察因素外應(yīng)具有均衡性、可比性。應(yīng)避免將志愿者分為一組,非志愿者分為另一組,病情輕者分在一組,病情重者分在另一組等情況的發(fā)生。3、嚴(yán)格掌握研究對(duì)象入選與排除的標(biāo)準(zhǔn)1194、提高研究對(duì)象的依從性在研究中應(yīng)采取相應(yīng)措施,盡量取得研究對(duì)象的合作,盡可能提高應(yīng)答率,減少無應(yīng)答率和隊(duì)列研究中的主動(dòng)失訪,要做好組織、宣傳工作,調(diào)查手段要簡(jiǎn)便易行,對(duì)調(diào)查中的問題應(yīng)采取適當(dāng)?shù)奶幚砑记?。若無應(yīng)答或失訪者超過10%,應(yīng)對(duì)無應(yīng)答者或失訪者進(jìn)行隨機(jī)抽樣調(diào)查,對(duì)失訪者和已隨訪者的特征做比較分析。對(duì)研究結(jié)果可能有影響有關(guān)數(shù)據(jù)與應(yīng)答者進(jìn)行分析比較,若兩者差異有顯著性,說明對(duì)結(jié)果有影響,在結(jié)論中應(yīng)加以說明并應(yīng)作慎重的分析。

4、提高研究對(duì)象的依從性120第二節(jié)信息偏倚及控制一、信息偏倚的概念及類型信息偏倚(informationbias)是指在研究的實(shí)施階段中從研究對(duì)象獲取研究所需的信息時(shí)產(chǎn)生的系統(tǒng)誤差,其原因是由于診斷疾病、測(cè)量暴露或結(jié)局的方法有問題,導(dǎo)致被比較各組間收集的信息有差異而引入的誤差。各種類型的流行病學(xué)研究中均可產(chǎn)生信息偏倚,病例對(duì)照研究中常見的信息偏倚有回憶偏倚、報(bào)告偏倚、調(diào)查者偏倚、誘導(dǎo)偏倚等。錯(cuò)誤分類偏倚則在病例對(duì)照研究和隊(duì)列研究中都可產(chǎn)生。

第二節(jié)信息偏倚及控制一、信息偏倚的概念及類型1211.回憶偏倚(recallbias)指比較組間在回憶過去的暴露或既往史時(shí),其完整性與準(zhǔn)確性存在系統(tǒng)誤差而引起的偏倚?;貞浧性诓±龑?duì)照研究中最常見,主要原因有:(1).研究對(duì)象對(duì)調(diào)查的內(nèi)容關(guān)心程度不同,一般情況下,病例組患者對(duì)調(diào)查的事件回憶認(rèn)真程度高于對(duì)照人群,因而導(dǎo)致兩組對(duì)象在回憶以往事件的準(zhǔn)確性存在差異。(2).調(diào)查的事件或因素發(fā)生的頻率較低,未給研究對(duì)象留下深刻印象而遺忘。(3).調(diào)查事件是很久以前發(fā)生的事情,研究對(duì)象記憶不清。

1.回憶偏倚(recallbias)指比較組間在回憶過去的1222.報(bào)告偏倚(reportingbias)被調(diào)查者有意隱瞞真實(shí)情況,夸大或縮小某些信息而導(dǎo)致研究結(jié)果產(chǎn)生偏倚,故亦稱說謊偏倚。常見于敏感問題,如未成年人的吸煙史、冶游史。例如,有些人有冶游史,可能會(huì)難于陳述實(shí)情。而對(duì)于一些職業(yè)危害進(jìn)行調(diào)查,研究對(duì)象因涉及勞保福利等原因可能會(huì)夸大某些暴露信息。

2.報(bào)告偏倚(reportingbias)被調(diào)查者有意隱瞞1233.診斷懷疑偏倚(diagnosticsuspicionbias)由于研究者事先了解研究對(duì)象對(duì)研究因素的暴露情況,于是帶著“先入為主”的傾向性,懷疑其患某病或在主觀上傾向出現(xiàn)某種陽性結(jié)果。如對(duì)暴露組或?qū)嶒?yàn)組進(jìn)行非常仔細(xì)地檢查,而對(duì)非暴露組或?qū)φ战M則不然,從而使研究結(jié)果出現(xiàn)偏差,由此而產(chǎn)生診斷懷疑偏倚,此類偏倚多見于隊(duì)列研究和臨床試驗(yàn)。

3.診斷懷疑偏倚(diagnosticsuspicion1244.暴露懷疑偏倚(exposuresuspicionbias)與上述的診斷懷疑偏倚一樣,研究者在收集并確定病例組的暴露比例時(shí)所具有的認(rèn)真、細(xì)致程度遠(yuǎn)高于對(duì)照組,從而導(dǎo)致錯(cuò)誤結(jié)論,此即暴露懷疑偏倚。這類偏倚多見于病例對(duì)照研究,如采用病史記錄作為分析資料,因?yàn)樵儐柌∈返尼t(yī)生知道某些因素和某病發(fā)病有關(guān),因此對(duì)病例組患者在詢問病史時(shí)特別仔細(xì),常有陽性的記錄,而調(diào)查對(duì)照組時(shí)則漫不經(jīng)心,陰性結(jié)果很多。對(duì)兩組對(duì)象以不同的調(diào)查方法進(jìn)行調(diào)查,從而產(chǎn)生偏倚。

4.暴露懷疑偏倚(exposuresuspicionbi1255.錯(cuò)誤分類偏倚(misclassificationbias)調(diào)查中使用的方法如果偏離了金標(biāo)準(zhǔn),則將產(chǎn)生錯(cuò)誤分類偏倚。在度量疾病狀態(tài)和暴露狀態(tài)都可能發(fā)生。每項(xiàng)診斷試驗(yàn)或測(cè)定儀器都有一定的靈敏度和特異度,但兩者都不大可能是100%,于是就會(huì)出現(xiàn)假陽性和假陰性,這就發(fā)生了錯(cuò)誤分類,即本應(yīng)是病人,但錯(cuò)將他分入了對(duì)照組,而本應(yīng)是非病人,則將他分入病例組。

5.錯(cuò)誤分類偏倚(misclassificationbia126無差異性錯(cuò)誤分類和差異性錯(cuò)誤分類第三節(jié)研究的偏倚表8-3

無差異性錯(cuò)誤分類

差異性錯(cuò)誤分類 錯(cuò)誤分類數(shù)據(jù) 錯(cuò)誤分類數(shù)據(jù)

研究真實(shí)數(shù)據(jù)

研究真實(shí)數(shù)據(jù)無差異性錯(cuò)誤分類和差異性錯(cuò)誤分類第三節(jié)研究的偏倚表8-3 127(1)無差異錯(cuò)分(nodifferentialmisclassification)當(dāng)se=se’、sp=sp’時(shí)產(chǎn)生,其實(shí)測(cè)結(jié)果往往低于真值,現(xiàn)以下例說明。表6-7是某隊(duì)列研究暴露組和非暴露組病例的真實(shí)分布情況。(1)無差異錯(cuò)分(nodifferentialmiscla128表6-7暴露組和非暴露組病例的真實(shí)分布情況RR=2表6-7暴露組和非暴露組病例的真實(shí)分布情況RR=2129表6-8暴露組人員錯(cuò)分后的分布情況現(xiàn)假設(shè)某診斷疾病方法的se=0.8、sp=0.9,則暴露組病例400人,該方法診斷為病人400*0.8=380人,另有80人漏診,但另有600*(1-0.9)=60人誤診,故實(shí)際診斷為病人380人,診斷非病人為620人(表6-8)。表6-8暴露組人員錯(cuò)分后的分布情況現(xiàn)假設(shè)某診斷疾病方法的s130表6-9非暴露組人員錯(cuò)分后的分布情況非暴露組中該方法診斷病人為200×0.8=160人,誤診800*(1-0.9)=80,實(shí)際診斷病例數(shù)為240人診斷為非病人760人(表6-9)。表6-9非暴露組人員錯(cuò)分后的分布情況非暴露組中該方法診斷131表6-10暴露組、非暴露組病例的實(shí)際分布情況RRo=1.583錯(cuò)分偏倚=(RRo-RR)/RR=(1.583-2)/2=-0.209表6-10暴露組、非暴露組病例的實(shí)際分布情況RRo=1.132(2)有差異錯(cuò)分(differentialmisclassification)當(dāng)兩組測(cè)定方法的靈敏度和特異度不同,則可產(chǎn)生有差異錯(cuò)分,資料的實(shí)際估計(jì)值可高于真值,也可低于真值,即可能高估也可低估研究因素與疾病之間的聯(lián)系。(2)有差異錯(cuò)分(differentialmisclass133二、信息偏倚的控制1.搞好研究方法的質(zhì)量控制。調(diào)查表的設(shè)計(jì)時(shí),對(duì)所有調(diào)查內(nèi)容、指標(biāo)要規(guī)定明確、客觀的標(biāo)準(zhǔn),并力求量化所詢問方式的調(diào)查內(nèi)容;每個(gè)問題的答案應(yīng)標(biāo)準(zhǔn)化。對(duì)調(diào)查人員要進(jìn)行統(tǒng)一培訓(xùn),使其充分了解調(diào)查的目的、意義,統(tǒng)一標(biāo)準(zhǔn),統(tǒng)一調(diào)查技巧,調(diào)查詢問方式相同,有相同的深度和廣度。對(duì)所有調(diào)查方法應(yīng)規(guī)定質(zhì)量控制方法及標(biāo)準(zhǔn)。另外,還要對(duì)研究對(duì)象做好宣傳、組織工作,以取得研究對(duì)象的密切合作。

二、信息偏倚的控制1.搞好研究方法的質(zhì)量控制。1342.資料的校正方法根據(jù)調(diào)查所得資料靈敏度、特異度可對(duì)含有信息偏倚(錯(cuò)分偏倚)的資料予以校正,下面介紹兩組資料測(cè)定方法敏感度與特異度較近時(shí)的校正方法,校正公式如下,現(xiàn)以表6-11資料為例說明信息偏倚的校正方法。A=(Sp·n1-c)/(se+Sp-1)B=(Sp·n2-d)/(se+Sp-1)C=n1-A

D=n2-B

2.資料的校正方法135表6-11某病例對(duì)照研究研究因素的暴露情況本病例組及對(duì)照組敏感度為0.9,特異度為0.7,代入公式計(jì)算得ORo=2.1。A=(0.7×100-34)/(0.9+0.7-1)=36/0.6=60B=(0.7×100-52)/(0.9+0.7-1)=18/0.6=30C=100-60=40D=100-30=70表6-11某病例對(duì)照研究研究因素的暴露情況本病例組及對(duì)照136循證醫(yī)學(xué)4流行病學(xué)研究中的常見偏倚課件1373.盡可能采用“盲法”設(shè)計(jì)在調(diào)查中采用雙盲設(shè)計(jì),使調(diào)查人員和研究對(duì)象均不知曉分組情況,以避免診斷懷疑偏倚、暴露懷疑偏倚、報(bào)告偏倚等。對(duì)在調(diào)查過程仍可有可缺發(fā)生的信息偏倚,如錯(cuò)誤分類,則由于比較組間資料的準(zhǔn)確度相似,即使發(fā)生錯(cuò)誤分類,屬于無差異錯(cuò)誤分類的可能性較大,可應(yīng)用上述校正方法,作出相應(yīng)估計(jì)。

3.盡可能采用“盲法”設(shè)計(jì)1384.利用客觀指標(biāo)或客觀方法收集資料在研究中應(yīng)盡量采用實(shí)驗(yàn)室檢查結(jié)果。研究對(duì)象的體格檢查記錄或診療記錄等客觀治療信息來源。對(duì)只能通過調(diào)查詢問方法收集主觀資料時(shí),應(yīng)盡量采用封閉式提問方式。條件許可時(shí),收集資料時(shí)可包括一些“無關(guān)”的信息。以分散被調(diào)查者的注意力,減少主觀因素的影響。

4.利用客觀指標(biāo)或客觀方法收集資料139第三節(jié)混雜偏倚及控制一、混雜偏倚概念混雜偏倚(confoundingbias)是在研究暴露與疾病的聯(lián)系時(shí),假如有一種外界因素既是與研究疾病的危險(xiǎn)因素有聯(lián)系,又在被比較各組中的分布不同,那么這一因素則稱為混雜變量。由于混雜變量的存在,造成了觀察到的聯(lián)系強(qiáng)度偏離了實(shí)際情況,則稱為混雜偏倚。

第三節(jié)混雜偏倚及控制一、混雜偏倚概念140F(混雜因素)

E(暴露因素)

D(疾?。?/p>

統(tǒng)計(jì)學(xué)聯(lián)系因果聯(lián)系圖6-1混雜偏倚示意圖F(混雜因素)統(tǒng)計(jì)學(xué)聯(lián)系因果聯(lián)系圖6-1141混雜因素的基本特點(diǎn):(1)必須是研究疾病的獨(dú)立危險(xiǎn)因子(2)必須與研究因素有關(guān)(3)不是研究因素與疾病因果鏈上的中間變量

混雜因素的基本特點(diǎn):142

繼發(fā)關(guān)聯(lián)(secondaryassociation)

定義是一種純粹由混雜偏倚產(chǎn)生的關(guān)聯(lián)即懷疑的病因(暴露)E與疾病D并不存在因果關(guān)系,而是由于兩者(E,D)有共同的原因C,E,D同C存在關(guān)聯(lián),從而繼發(fā)產(chǎn)生E與D的關(guān)聯(lián)。第三節(jié)研究的偏倚C?DE繼發(fā)關(guān)聯(lián)(secondaryassociatio143例如高血清膽固醇是冠心病的危險(xiǎn)因素,高血清膽固醇可產(chǎn)生沉積于眼瞼的黃色瘤,從而導(dǎo)致黃色瘤與冠心病的繼發(fā)關(guān)聯(lián)。另外,E與C也可以由于相關(guān)(因果方向不明)而產(chǎn)生繼發(fā)關(guān)聯(lián)。例如吸煙是胰腺癌的危險(xiǎn)因素,吸煙又與喝咖啡存在相關(guān)(沒有確定的時(shí)間先后),從而造成喝咖啡與胰腺癌的繼發(fā)關(guān)聯(lián)。第三節(jié)研究的偏倚例如高血清膽固醇是冠心病的危險(xiǎn)因素,高血清膽固醇可產(chǎn)生沉144

直接因果關(guān)聯(lián)的歪曲

如果懷疑病因E與疾病D既存在直接關(guān)聯(lián),又存在間接關(guān)聯(lián)(圖A)或與其他危險(xiǎn)(保護(hù))因素F存在相關(guān)(圖B),暴露E與疾病D的直接因果關(guān)聯(lián)程度或方向?qū)⒖赡苁艿交祀s干擾,即得到歪曲的關(guān)聯(lián)估計(jì)值。

第三節(jié)研究的偏倚FDEFDE??AB直接因果關(guān)聯(lián)的歪曲第三節(jié)研究的偏倚FDEFDE??145

例如靜脈吸毒E與性亂F都是HIV感染D的危險(xiǎn)因素,吸毒者易發(fā)生多性伴行為,即吸毒同HIV感染既存在直接關(guān)聯(lián)(E→D)又存在間接關(guān)聯(lián)(E→F→D)(圖8-3,(2)),吸毒與多性伴沒有確定的時(shí)間先后而呈雙向相關(guān)(圖8-3,(3)),多性伴F將對(duì)吸毒E與HIV感染D的直接因果關(guān)聯(lián)起混雜或歪曲作用。第三節(jié)研究的偏倚例如靜脈吸毒E與性亂F都是HIV感染D的危險(xiǎn)因素,吸毒146第三節(jié)研究的偏倚圖8-3第三節(jié)研究的偏倚圖8-3147圖6-2混雜因素成立與不成立的幾種情況示意圖不存在混雜偏倚的幾種情況存在混雜偏倚的幾種情況圖6-2混雜因素成立與不成立的幾種情況示意圖不存在混雜偏倚148二、混雜因素的測(cè)量:進(jìn)一步測(cè)量某一可疑混雜因子的混雜作用,可疑通過將含有該因素時(shí)(如RR、OR),與扣除該因素后的估計(jì)值進(jìn)行比較分析來實(shí)現(xiàn)。研究因素與疾病的估計(jì)值為cRR或cOR,稱為粗RR或粗OR;按該可疑因素調(diào)整后的估計(jì)值為aRR(f)或aOR(f),稱作調(diào)整RR或調(diào)整OR,aRR(f)可用MentelHaenszel分層分析方法計(jì)算?,F(xiàn)以估計(jì)值RR說明測(cè)量方法(OR測(cè)量方法相同)。

二、混雜因素的測(cè)量:進(jìn)一步測(cè)量某一可疑混雜因子的混雜作用,可149(1).若CRR=aRR,f無混雜作用(2).若CRR≠aRR,f有混雜作用。CRR>aRR為正混雜:混雜偏倚的存在使研究中暴露與疾病之間存在的真實(shí)聯(lián)系被夸大。CRR>aRR為負(fù)混雜,由于f的混雜作用,使cRR低估研究因素與疾病之間的聯(lián)系。(3).混雜偏倚=(CRR-aRR)/aRR。若值=0,無混雜。若值>0,有正混雜;若值<0為負(fù)混雜。(1).若CRR=aRR,f無混雜作用150對(duì)混雜因素的分析,可將含有該因素時(shí)研究因素與疾病的估計(jì)值與按該因素分層后,研究因素與疾病的估計(jì)值進(jìn)行比較,若兩者不一致,則有可能存在混雜偏倚,現(xiàn)舉例說明如下。某隊(duì)列研究調(diào)查粉塵與呼吸道疾病的關(guān)系,吸煙(F)可能是混雜因素,

對(duì)混雜因素的分析,可將含有該因素時(shí)研究因素與疾病的估計(jì)值與按151計(jì)算粗RRRR=1計(jì)算粗RRRR=1152按吸煙與否分層:RR=0.58RR=3.06按吸煙與否分層:RR=0.58RR=3.06153分層前RR與分層RR后不一致,說明吸煙很可能是一個(gè)混雜因素,分析吸煙與呼吸道系統(tǒng)疾病是否關(guān)聯(lián)。RR=1.42,表明吸煙是呼吸道系統(tǒng)疾病危險(xiǎn)因素。任何一個(gè)外界因素本身并不固有混雜因素的特性,必須有另一暴露因素同時(shí)存在,且它在暴露組與非暴露組的分布不均勻,才可能成為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論