《病例對照研究》PPT課件.ppt_第1頁
《病例對照研究》PPT課件.ppt_第2頁
《病例對照研究》PPT課件.ppt_第3頁
《病例對照研究》PPT課件.ppt_第4頁
《病例對照研究》PPT課件.ppt_第5頁
已閱讀5頁,還剩97頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1,病例對照研究 Case Control Study,劉麗 流行病與衛(wèi)生統(tǒng)計學系 ,目的與要求,掌握病例與對照的選擇;掌握非匹配或成組匹配設計資料的分析、個體匹配資料的分析;掌握上述兩種資料OR值的計算及OR值的意義。 熟悉病例對照研究基本概念、基本特點;熟悉病例對照研究分層、分級資料分析;熟悉病例對照研究的優(yōu)缺點。 了解病例對照研究的目的、研究類型、實施步驟、樣本含量的估計、研究應注意的問題;了解資料的多因素分析、病例對照研究的偏倚及控制。,2,檢驗假設,驗證假設,第一節(jié) 基本原理,病例對照研究的概念 選擇患有某病和未患有某特定疾病的人群,分別作為病例組和對照組,調查并比較兩組研究對象既往某些因素的暴露情況,判斷該暴露因素是否與該病有關聯及關聯程度大小的一種觀察性研究方法。 從疾病出發(fā),去探討可能的病因 回顧性研究 (Retrospective study),暴露 (exposure) 指研究對象接觸過某種待研究的物質(如重金屬、X線)、具備某種待研究的特征(如年齡、性別及基因突變等)或行為(如吸煙)。 暴露因素或研究因素,5,6,危險因素(risk factor) 引起某特定不良結局發(fā)生或使其概率增加的因素。 保護因素(protective factor) 導致疾病事件降低的暴露因素稱為保護因素,決定因素/研究因素,暴露即是具有該研究因素,以確診患某種特定疾病的病人作為病例組 以不患該病但具有可比性的個體作為對照組 通過詢問、實驗室檢查或復查病史,搜集既往危險因素暴露史 測量并比較兩組各因素的暴露比例,經統(tǒng)計學檢驗該因素與疾病之間是否存在統(tǒng)計學關聯; 利用病因推斷技術,對統(tǒng)計學上的關聯進行分析。,基本原理,a,c,b,d,a/(a+c),b/(b+d),人數,比較,病例對照研究特點,觀察法 按照是否患病分組,設立對照(分析性方法) 測量的是暴露情況,而非疾病情況 回顧性,由果 因研究 一般不能驗證病因,1843年Guy向統(tǒng)計學會報告-最早病例對照研究 分析職業(yè)暴露與肺結核發(fā)生的關系 1844年Louis的著作 最早出現病例對照研究的概念 1926年Lane Claypon 報告 生殖因素與乳腺癌關系的研究(符合現代病例對照研究的概念),研究簡史,1947年Schreck和Lenowitz 包皮環(huán)切和性衛(wèi)生與陰莖癌的關系 1947年Hartwell 輸血與肝炎關系的研究 1950年Doll和Hill 吸煙與肺癌的研究,20世紀60年代以來,孕婦服用沙利度胺(thalidomide,反應停)與嬰兒短肢畸形 母親吸煙與先天性畸形 早產兒吸入高濃度氧與晶體后纖維組織增生癥 經期使用月經棉與中毒性休克綜合征 小劑量電離輻射與白血病 母親早孕期服用雌激素與少女陰道腺癌等之間的關系,應用,廣泛探索疾病的可疑危險因素 深入檢驗病因假說 為進一步前瞻性研究提供依據 治療方法或藥物有害作用的研究 疾病預后因素的研究 診斷試驗的評價、防治措施效果的評價,第二節(jié) 研究類型,病例與對照不匹配 病例與對照匹配 衍生的研究類型,按設計類型分,病例與對照不匹配,從設計所規(guī)定病例和對照人群中,分別 抽取一定量的研究對象 對照組人數病例組人數 對照組應能代表產生病例的人群 此外沒有其他限制與規(guī)定。,病例與對照匹配,匹配/配比(matching) 要求 對照在某些因素或特征上與病例保持一致 目的 對兩組進行比較時排除匹配因素的干擾 分類 頻數匹配 frequency matching 個體匹配 individual matching,頻數匹配(又稱成組匹配) 匹配因素所占的比例在對照組與病例組一致整體的匹配。 個體匹配 以病例和對照個體為單位進行匹配。 1:1匹配,又稱配對;1:2, 1:3, 1:41:R 匹配。 匹配因素的一致程度: 離散變量,完全匹配; 連續(xù)變量,在一定范疇內匹配(分組或分類),匹配法注意事項 慎重選擇匹配因素(已知混雜因素或有理由懷疑為混雜因素!) 可疑病因不作為匹配因素 比例一般為1:1,最多不超過1:4 避免匹配過度(overmatching),匹配的目的 提高研究效率 控制混雜因素的作用,對照/病例比例與研究效率的關系,個體匹配時,以M為對照的個數,研究效率=M/(M+1)。 M越大,效率越高。但比例數與效率的提高不成比例。,匹配過度(overmatching) 把不必要的項目進行匹配,企圖使病例和對照盡量一致,可能導致信息丟失,增加工作難度,反而降低研究效率。 不應進行匹配的情況(非混雜因素) 疾病因果鏈上的中間變量; 只與暴露因素有關,與疾病無關的因素; 可能是疾病的某一危險因素。,衍生的研究類型,巢式病例對照研究 病例病例研究 病例時間對照設計,病例對照與隊列研究作為病因研究的主要方法,有其各自的優(yōu)勢與不足,而且這些優(yōu)勢與不足相互補充,因此,在實踐過程中產生了一些新的研究類型,結合使用這兩種方法,揚長避短。,病例隊列研究 病例交叉設計,巢式病例對照研究(nested case-control study) 基本原理 按隊列研究方式進行 選擇一隊列,收集基線資料,采集所研究的生物學標志的組織或體液標本儲存?zhèn)溆?隨 訪 隨訪到出現能滿足病例對照研究樣本量的病例數為止,匹配 按病例進入隊列的時間、疾病出現時間與性別、年齡等匹配條件,從同一隊列選擇1個或數個非病例作對照,抽取病例與對照的基線資料并檢測收集的標本 資料處理 按匹配病例對照研究方法處理資料,1992年Ross用巢式病例對照研究: 上海地區(qū)肝癌與尿中黃曲霉素生物學標志關系 18244名中年男性隊列中發(fā)現22例肝癌 每例配4個對照 檢測研究開始時的尿樣: 發(fā)現黃曲霉素B1及其代謝產物和DNA加成物的OR值經 調整混雜因素后,為3.8(1.212.2)。 黃曲霉素作為肝癌致病因素最直接的證據,病例隊列研究(case-cohort study) 基本原理 研究開始時,在隊列中隨機選取一組樣本作為對照組 觀察結束時,隊列中出現被研究疾病所有病例作病例組 與隨機對照組進行比較 這種研究模式,可同時研究幾種疾病,不同疾病有不同病例組,但對照組都是同一組隨機樣本,病例隊列與巢式病例對照研究的區(qū)別 對照是隨機選取,不與病例進行匹配 隨機對照組中成員如發(fā)生被研究疾病,既為對照,又同時為病例 1個隨機對照組可以同時和幾個病例組比較分析,病例隊列與巢式病例對照研究的優(yōu)點 因果關系清楚 資料可靠 論證強度高 省時省力省錢 適合于分子流行病學研究,背 景 1994年Piegorseh、Begs等提出 遺傳與環(huán)境的關系 交互作用 病例對照研究和隊列研究的效率費用,病例病例研究(case-case study)也稱單純病例研究,應用前提條件 在正常人群中基因型與環(huán)境暴露各自獨立發(fā)生,所研究疾病為罕見病(此時可用OR來估計RR值),基本原理,研究示意圖,單純病例研究,環(huán)境暴露,基因型,病人,+,-,+,-,+,-,OR=ad/bc 當ORge1時, 有正相乘模型交互作用 當ORge=1時, 無相乘模型交互作用 當ORge1時, 有負相乘模型交互作用,E+,E-,G-,G+,b,a,d,c,表5-1 環(huán)境暴露與基因型,解決問題 1991年美國Maclure提出病例交叉設計 日常生活中一些突發(fā)事件之后,常會伴隨某些結果的發(fā)生。究竟是這些突發(fā)事件導致了結果的發(fā)生,還是僅僅由于機會所致?,病例交叉研究(case-crossover design),暴露與某急性事件有關 比較相同研究對象暴露情況 在急性事件發(fā)生前一段時間與未發(fā)生事件的某段時間,基本原理,如果暴露與少見的事件(或疾病)有關,那么剛好在事件發(fā)生前一段時間內的暴露頻率應該高于更早時間內的暴露頻率。,研究對象 病例和對照,兩部分的信息均來自于同一個體 “病例部分“ 危險期,疾病或事件發(fā)生前的一段時間 “對照部分” 對照期,危險期外特定的一段時間 研究是對個體危險期和對照期內的暴露信息進行比較,第三節(jié) 研究設計與實施,確定研究假設 確定研究類型 研究對象的選擇 樣本量估計 資料收集 偏倚的識別與控制 資料整理和分析,研究步驟 提出假設 根據以往疾病分布的記錄或現況調查得到的結果,結合文獻資料,提出病因假設,明確適宜的研究類型 選擇病例與對照比較的方法: 形式: 非匹配、頻數匹配、個體匹配 原則: 廣泛探索病因,采用不匹配或頻數匹配 罕見病采用個體匹配 1:R的匹配法,R值不宜超過4 防止匹配過度,病例與對照的來源與選擇 基本原則: 代表性 病例能代表總體的病例 對照能代表產生病例的總體人群或源人群 可比性(往往更重要) 病例組與對照組在年齡、性別等主要特征上無明顯差異 來源: 以醫(yī)院為基礎 hospital-based 以社區(qū)為基礎 community-based,病例的選擇 判斷病人的標準/如何獲得符合標準的病人? 選擇病例的要求 診斷可靠 使用金標準 病例類型:新發(fā)病例、現患病例、死亡病例 選擇確診的新病例,回憶偏倚小 代表性好 容易合作 被調查因素改變少,來 源 醫(yī)院住院或門診的病例,代表性好 工作開展比較困難 耗費人力物力,社區(qū)的病例 (最優(yōu)),比較合作 資料易得到且比較可靠 與對照的可比性好 代表性差,對照的選擇 對照的選擇是整個研究的關鍵之一;研究結論是否可靠,首先要看對照的選擇是否合理。 原 則 1. 未患此病的人(可以是其它疾?。?2. 足以代表產生病例的總體(代表性); 3. 除研究因素外其它條件一致(可比性); 4. 必須具有暴露于研究因素的可能性; 5. 根據需要確定配比數(對照形式)。,來 源 社區(qū)基礎的健康人或非該病人(最接近全人群的無偏樣本) 醫(yī)院來源的其他病例(使用最多) 配偶、親屬、鄰居、同事、同學等 社會團體人群的非該病病人或健康人,醫(yī)院為基礎的對照選擇注意事項: 對照所患疾病與病例的病因無關 選擇多個病種的病人組成 從新發(fā)病人中選取對照 不選擇當前患有多種疾病的病人,病例對照研究 社區(qū)為基礎/醫(yī)院為基礎,樣本含量的估計 影響樣本大小的因素 人群中被研究因素的暴露率(對照組中的暴露率) 暴露與疾病關聯強度指標OR的估計值(查閱文獻或預調查獲得) 值 把握度1- 根據以上有關參數查表或代入公式計算,方 法 查表法 公式法: 不匹配(病例組與對照組人數相等),病例組暴露率,對照組暴露率,P1=P0OR/(1+P0OR-P0),P1=P0OR/(1+P0OR-P0),P1=P0OR/(1+P0(OR-1),例:為研究某市肺癌與吸煙的關系,欲進行一次病例對照研究。 某市普通人群中吸煙率 P0=20% OR=2.0 =0.05 把握度0.90 問需要多少病例與對照?,、值查表,Z為1.96, Z為1.282 代入公式得: 病例組與對照組,各需232人。,病例組與對照組例數不等時的公式: 病例數:對照數=1:c 對照組例數為c*n,1:1匹配設計 總對子數 p0和p1分別代表目標人群中對照組與病例組 的估計暴露率 m為暴露狀況不一致的對子數,4. 1:R配比樣本量估計 先計算病例數n,進而求得對照數為rn,估計樣本量注意事項: 選擇適當的樣本量 樣本量一定時,病例組和對照組樣本含量相等時,效率最高。,研究因素的選定與測量 根據研究的目的或具體的目標,確定調查變量的數目和每一個變量的具體項目。 每項變量都要有明確的定義。 研究中應盡可能地采用定量或半定量的量度。,吸煙與肺癌的關系的研究 吸煙的定義: 吸煙與否; 開始吸煙的年齡、吸煙的年限、每天吸煙量、是否戒煙、戒煙的時間;是否被動吸煙(被動吸煙的定義); 三手煙?,資料來源與收集方法 資料的收集在病例對照研究中十分重要 方式方法不恰當,收集的資料就不可靠,存在統(tǒng)計處理無法糾正的系統(tǒng)誤差 準確、完整、可比、可靠 資料來源 醫(yī)院病案記錄 疾病登記報告等摘錄 致病因素數據需檢 測病人的標本或環(huán)境獲得 詢問調查獲得,調查表,內容 調查表的名稱、編號 一般項目:姓名、性別、民族等 研究項目:研究變量,疾病史、吸煙史等 結尾部分:調查員簽名、調查日期等,調查實施時遵循的原則 調查表的設計需要各專家參加討論 調查員要經過嚴格的培訓 調查員手冊 監(jiān)督與審查,第四節(jié) 資料的整理與分析,資料整理,描述性統(tǒng)計 統(tǒng)計性推斷 不匹配資料的分析 1:1配對資料的分析 混雜因素作用的估計與分層分析,資料整理,核查原始資料(查漏補缺糾錯) 原始資料的分組、歸納、或編碼輸入計算機 雙人平行錄入,描述性分析: 研究對象的一般特征描述: 病例組和對照組樣本量,人口學特征構成,目的是分析研究對象的代表性;頻數匹配時還應描述匹配因素的頻數比例。 均衡性檢驗 比較病例組和對照組某些基本特征是否相似或齊同,檢驗病例組和對照組的可比性。 如有統(tǒng)計學差異的因素,應分析其是否對其他因素產生影響。,目的:分析研究因素是否與疾病關聯? 內容: 檢驗研究因素與疾病之間是否存在統(tǒng)計學關聯; 評價關聯強度/研究因素的效應大小; 分析偏倚對結果的影響。 不同設計類型的病例對照研究資料分析形式有所不同。,統(tǒng)計性推斷,2檢驗 檢驗研究因素與疾病之間有否統(tǒng)計學聯系?,非匹配病例對照資料的分析,統(tǒng)計性推斷,P0.05, 表明吸煙與食管癌有聯系,但聯系強度如何,要計算OR,H0:吸煙與食管癌無統(tǒng)計學關聯 H1:吸煙與食管癌有統(tǒng)計學關聯,關聯強度分析 比值比(odds ratio, OR)計算與可信限的估計及意義 比值是事件發(fā)生的概率與不發(fā)生的概率之比: 病例組中暴露的概率a/(a+c)與無暴露的概率c/(a+c)之比 對照組中暴露的概率b/(b+d)與無暴露的概率d/(b+d)之比 暴露比值比(優(yōu)勢比)OR為病例組暴露的比值與對照組暴露的比值之比。,與RR一樣,OR反映暴露者患某種疾病的危險性是無暴露者的倍數。 OR1, 說明疾病的危險度因暴露而增加; OR1, 說明疾病的危險度因暴露而減少。 前提條件 所研究疾病的發(fā)病率(死亡率)很低 病例對照研究中所選擇的研究對象代表性好,則OR值就很接近甚至等于RR值,OR的置信區(qū)間(confidence interval, CI) 1)Woolf自然對數轉換法:以OR方差為基礎 Var(lnOR)=1/a+1/b+1/c+1/d lnOR 95% CI=lnOR1.96 OR 95% CI=exp(lnOR 95%CI) 2) Miettnen卡方值法 置信區(qū)間不包括1,即可認為該OR在0.05的水平上有統(tǒng)計學意義。,結果表明吸煙者患食管癌的危險性是不吸煙者的2.87倍,95%的可信范圍是在2.183.78之間,匹配資料是由病例與對照結合成對子,分析結果時不應把對子拆開分析。 先將資料列成表5-4的格式 注意表內的數字a、b、c、d是病例與對照配成對的對子數,1:1配對資料的分析,2=(|b-c|-1)2/(b+c) 2=11.28, OR=4.33 表明男性吸煙者患食管癌的危險性是不吸煙者的4.3倍 OR 95%CI=,H0:吸煙與食管癌無統(tǒng)計學關聯 H1:吸煙與食管癌有統(tǒng)計學關聯,分級暴露資料分析,分析暴露與疾病的劑量反應關系 根據暴露因素的分級將資料歸納成列聯表 對列聯表數據進行卡方檢驗 計算出各暴露水平的OR 卡方趨勢檢驗,男性每日吸煙的支數與肺癌關系,卡方檢驗(RC): 2=43.15, =3, P0.001 說明吸煙量按吸煙水平分級后,組間差別有統(tǒng)計學意義。 各暴露分級的OR: 以不吸煙為參照組。OR1=8.10, OR2=11.52, OR3=17.93 OR隨吸煙劑量的增加而遞增。 卡方趨勢檢驗: 2=40.01, =1,P0.001 劑量反應趨勢具有統(tǒng)計學意義,說明吸煙與男性肺癌之間存在劑量-反應關系。,卡方趨勢檢驗,非個體匹配分層資料,分層分析是按照某種特征(如年齡、性別等)把研究人群分為不同的層次(層),然后分別分析各層中暴露與疾病的關聯。 可評價分層因素本身作用及其與暴露之間關系 評價分層因素與暴露因素在疾病中的交互作用 既可以識別混雜因素,也可以控制混雜,同時提高檢驗效率。 可幫助正確設計多因素模型 分層太多,層中例數會出現“0”,導致丟失效率 食管癌與吸煙的研究時,考慮飲酒為混雜因素,則按是否飲酒進行分層分析。 吸煙 食管癌 飲酒,按飲酒與否分層 計算OR值,飲酒者中吸煙的OR(2.98)稍高于不分層OR(2.87) 不飲酒者中吸煙的OR(1.67)卻低得很多,吸煙與食管癌的關系列表計算 2=56.6 P0.05, OR=2.87,在非病例中判斷吸煙與飲酒的關系 2=37.3, P0.01 吸煙與飲酒存在統(tǒng)計學關聯,在資料中886例食管癌病人與對照中有586例飲酒. 在非暴露組中判斷飲酒與食管癌的關系 2 =31.9, OR=2.29 因此飲酒與食管癌有聯系,且飲酒與吸煙密切相關,表明飲酒是混雜因素,飲酒可能加強吸煙的作用。 消除飲酒的影響,就要計算這兩組人群合并的與OR值,而在此之前必須先作齊性檢驗。,進行齊性檢驗 (層別效應的一致性假設與檢驗) 齊性檢驗 合并與OR值 OR值無明顯差別,則飲酒是混雜因素 合并OR值 OR值有顯著差異,則飲酒與吸煙存在交互 合并OR值 本例齊性檢驗無顯著差異( 2 =3.38),計算合并OR與2,計算合并OR與2值 公式(M-H法):,=37.74,=2.42,經飲酒分層調整后,吸煙的2與OR(即合并2與合并OR)雖較未調整的2 (56.6)與OR(2.87)為低,但仍有一定強度與統(tǒng)計學上的顯著性。 吸煙與食管癌之間有顯著的關聯。 飲酒是吸煙與食管癌之間的混雜因素,似能加強吸煙的作用,2,MH,表5-8 分層計算結果整理表,分層分析的過程總結,病例對照研究中偏倚的種類 偏倚的控制,第五節(jié) 常見偏倚及其控制,選擇偏倚(selection bias) 選入的研究對象與未選入的研究對象在某些特征上存在差異而引起的誤差(選擇的研究對象不能代表總體人群)。常發(fā)生在研究的設計階段。 最常見偏倚 入院率偏倚,又稱伯克森偏倚(Berksons bias) 選擇醫(yī)院的病人作為病例與對照,這些病人可以因為種種原因造成入院率的差異。例如高血壓、腫瘤、闌尾炎病人的入院率顯然各不相同入院率的不同就可造成偏倚。,病例對照研究中常見偏倚的種類,選擇偏倚的控制 盡量合理地選擇病例與對照 盡可能地從多家(類)醫(yī)院選擇病例與對照,信息偏倚(information bias) 在研究的實施階段從研究對象獲取所需數據時產生的系統(tǒng)誤差。其發(fā)生可能來自與收集數據有關的所有人和物,包括研究對象、研究者本身、測量儀器、設備、方法等。,回憶偏倚 病例對照研究是回顧性調查,難避免回憶偏倚。 傾向性 被調查者與調查員均可能有傾向性,盲法可以克服,匹配研究方法的偏倚 匹配過度 將一些被研究因素或因果鏈的中間變量,或將一些不必匹配的因素作為匹配因素而造成 匹配過度的影響 可使研究得不出結果 真實的結果被歪曲了 浪費不少工作量 匹配因素 明確的或有充分理由懷疑的混雜因素 匹配因素不宜過多 不可將研究因素匹配,混雜偏倚(confounding bias) 定義:在評價暴露因素與疾病之間的關聯時,由于一個或多個既與暴露因素有關,同時由于研究疾病有關的外來因素存在,使得暴露因素的效應和外來因素的效應混在一起,從而歪曲了暴露因素與疾病的關聯性。此外來因素即為混雜因素。 基本特征: 混雜因素必須與所研究疾病有關 混雜因素必須與所研究因素有關 混雜因素不是研究因素與研究疾病因果鏈上的中間環(huán)節(jié)。,流行病學研究中,發(fā)現統(tǒng)計學意義上的聯系,在進行病因學推論前,必須首先排除潛在混雜因素的作用,估計和調整混雜偏倚的影響。 混雜偏倚類型: 正混雜偏倚:夸大暴露與疾病的關聯 負混雜偏倚:減弱暴露與疾病的關聯。,混雜因素作用的估計與分層分析 限制(設計階段) 隨機化分組(實驗流行病學) 配比法 (設計階段) 分層分析 (資料分析階段) 多因素分析(資料分析階段),第六節(jié) 研究實例,研究背景 研究方法 研究結果,研究背景,美國波士頓Vincent紀念醫(yī)院婦產科醫(yī)生Herbst發(fā)現 19661969年收治7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論