版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
如何通過建??刂苹祀s因素第1頁,講稿共41頁,2023年5月2日,星期三1978年8月9號美國一著名報紙刊登了一條科技信息:某單位對美國20個城市做飲水氟化研究,10個城市的飲水氟化,而另10個城市未氟化作對照,結論是:“飲水氟化有致癌作用”。但過了一個時期,該報紙又刊登了相反的文章。案例:引水氟化是否有致癌作用?第2頁,講稿共41頁,2023年5月2日,星期三
原來前述論文發(fā)表后,受到美國癌腫協(xié)會和英國統(tǒng)計協(xié)會的懷疑,他們派人對該批數(shù)據(jù)重新做統(tǒng)計分析,其結論是:“飲水氟化沒有發(fā)現(xiàn)有致癌作用,相反,卻略有保護作用。兩個結論差別如此之大,根源在于第一分析法未控制混雜,采用單因素分析法,而后一個結論則把兩個城市中的種族、生活環(huán)境上的混雜因素進行控制(多元統(tǒng)計分析),再去比較兩組城市的癌癥患病率。第3頁,講稿共41頁,2023年5月2日,星期三
案例:攜帶火柴和發(fā)生肺癌間有關系?某研究者進行問卷調查,結果發(fā)現(xiàn):是否攜帶火柴和肺癌患病率有關,攜帶火柴的人更有可能發(fā)生肺癌。難道這表明攜帶火柴可能引起肺癌?!
客觀事實:攜帶火柴不可能引起肺癌!第4頁,講稿共41頁,2023年5月2日,星期三混雜因素的影響
攜帶火柴?肺癌
吸煙
這中間存在混雜因素---吸煙第5頁,講稿共41頁,2023年5月2日,星期三6一、混雜因素混雜(confounding):指在流行病學研究中,由于一個或多個潛在的混雜因素的影響,掩蓋或夸大了研究因素與疾病(或事件)之間的聯(lián)系,從而使兩者之間的真正聯(lián)系被錯誤地估計,造成混雜。1.概念混雜因素(confoundingfactor):指與研究因素和研究疾病均有關,若在比較的人群中分布不均,可以歪曲研究因素與疾病之間真正聯(lián)系的因素。第6頁,講稿共41頁,2023年5月2日,星期三72.混雜因素的基本特點:(1)必須與所研究疾病有關(2)必須與所研究因素有關(3)一定不是研究因素與研究疾病因果鏈上的中間變量
具備基本條件,如果在比較的人群中分布不均,即可導致偏倚。第7頁,講稿共41頁,2023年5月2日,星期三策略
設計階段限制進入隨機化分組匹配8
分析階段分層分析標準化多因素分析如何控制混雜因素?第8頁,講稿共41頁,2023年5月2日,星期三二、如何通過建??刂苹祀s因素第9頁,講稿共41頁,2023年5月2日,星期三
表1數(shù)據(jù)形式(P≥2)
觀察對象X1X2…Xp
Y1a11
a12…a1py12a21a22…a2py2
…
…
…
…
…
…nan1an2…anpyn分因變量具體情況:
y是計量資料,多元線性回歸分析
y是定性資料,尤其是二值資料,采用
Logistic回歸分析
y=t是生存時間,后面有是否為完全數(shù)據(jù)標志,采用
COX回歸分析
設在實際研究問題中,含有p個自變量x1,x2,…,xp;1個因變量,n個觀察對象。第10頁,講稿共41頁,2023年5月2日,星期三在醫(yī)學實踐中,常會遇到一個應變量與多個自變量數(shù)量關系的問題。如醫(yī)院住院人數(shù)不僅與門診人數(shù)有關,而且可能與病床周轉次數(shù),床位數(shù)等有關;兒童的身高不僅與遺傳有關還與生活質量,性別,地區(qū),國別等有關;人的體表面積與體重、身高等有關。第11頁,講稿共41頁,2023年5月2日,星期三多元線性回歸模型
通過實驗測得含有p個自變量x1,x2,x3,…,xp及一個因變量y的n個觀察對象值,利用最小二乘法原理,建立多元線性回歸模型:
其中b0為截距,b1,b2…bp稱為偏回歸系數(shù).bi表示當將其它p-1個變量的作用加以固定后,Xi改變1個單位時Y將改變bi個單位.第12頁,講稿共41頁,2023年5月2日,星期三
例:
27名糖尿病人的性別、年齡、血清總膽固醇、甘油三脂、空腹胰島素、糖化血紅蛋白、空腹血糖的測量值列于表3中,試建立血糖與其它幾項指標關系的多元線性回歸方程。多元線性回歸分析13第13頁,講稿共41頁,2023年5月2日,星期三表327名糖尿病人的血糖及有關變量的測量結果
14第14頁,講稿共41頁,2023年5月2日,星期三15資料的研究目的是建立血糖與其它因素的線性回歸方程性別和年齡與應變量(血糖)含量有關,也可能與自變量(血清總膽固醇、甘油三脂、空腹胰島素、糖化血紅蛋白)有關,因此,懷疑性別、年齡為混雜因素將混雜因素(性別和年齡)放到多元線性回歸模型中進行控制,從而更加準確地考察其它自變量與血糖的關系第15頁,講稿共41頁,2023年5月2日,星期三SPSS分析結果結果為扣除性別和年齡兩個混雜因素的影響后,各指標與血糖的關系16第16頁,講稿共41頁,2023年5月2日,星期三在醫(yī)學上,人們更關心疾病是否發(fā)生或發(fā)展的影響因素,既因變量是二值的。
令:y=1發(fā)?。栃浴⑺劳?、治愈等)y=0未發(fā)病(陰性、生存、未治愈等)Logistic回歸模型是一種概率模型,適合于病例—對照研究、隨訪研究和橫斷面研究,且結果發(fā)生的變量取值必須是二分的或多項分類。可用影響結果變量發(fā)生的因素為自變量與因變量,建立回歸方程。第17頁,講稿共41頁,2023年5月2日,星期三Logistic回歸--Logistic回歸種類成組資料的非條件Logistic回歸配對資料的條件Logistic回歸兩分類反應變量的Logistic回歸多分類有序反應變量Logistic回歸多分類無序反應變量Logistic回歸1:1配對資料的條件Logistic回歸1:m配對資料的條件Logistic回歸n:m配對資料的條件Logistic回歸Logistic回歸分析第18頁,講稿共41頁,2023年5月2日,星期三表5肺癌與危險因素的調查分析例號是否患病性別吸煙年齡地區(qū)111030021014613000351………………30000261注:是否患病中,‘0’代表否,‘1’代表是。性別中‘1’代表男,‘0’代表女,吸煙中‘1’代表吸煙,‘0’代表不吸煙。地區(qū)中,‘1’代表農(nóng)村,‘0’代表城市。第19頁,講稿共41頁,2023年5月2日,星期三
由上最大似然估計分析知因素X2(吸煙),X3(年齡)對肺癌的發(fā)生有影響。所得的回歸方程為:Logit(P)=-9.781+2.520X1+3.999X2+0.189X3-1.3067X4第20頁,講稿共41頁,2023年5月2日,星期三解釋
設第i個因素的回歸系數(shù)為bi,表示當有多個自變量存在時,其它自變量固定不變的情況下,自變量Xi每增加一個單位時,所得到的優(yōu)勢比的自然對數(shù)。也就是其它自變量固定不變的情況下,自變量Xi每增加一個單位時,影響因變量Y=0發(fā)生的倍數(shù)。當bi>0時,對應的優(yōu)勢比(oddsratio,記為ORi):ORi=exp(bi)>1,說明該因素是危險因素;當bi<0時,對應的優(yōu)勢比ORi=exp(bi)<1,說明該因素是保護因素。
第21頁,講稿共41頁,2023年5月2日,星期三弗明漢心血管疾病研究
742名居住在弗明漢年齡為40-49歲的男性,在各自暴露不同水平的影響因素(詳見下表中的6種因素),經(jīng)過12年的追蹤觀察冠心病(CHD)的發(fā)病情況。根據(jù)此742名受試者每人暴露各項因素的水平和CHD發(fā)病與否的資料,采用多因素Logistic回歸模型進行分析。22多因素Logistic回歸分析第22頁,講稿共41頁,2023年5月2日,星期三資料的研究目的是探討CHD發(fā)病與否的危險因素血液中的膽固醇水平、血紅蛋白濃度、血壓水平、
吸煙量因素可能是CHD發(fā)病的危險因素年齡既與膽固醇水平、血紅蛋白水平、血壓水平等因素相關,又與CHD是否發(fā)病相關,懷疑年齡是混雜因素使用多因素Logistic回歸分析,將年齡放到模型中進行控制,考察CHD發(fā)病的危險因素23第23頁,講稿共41頁,2023年5月2日,星期三24SPSS分析結果變量參數(shù)估計值
標準誤OROR的95%CILowerUpper截距-13.2573年齡0.12160.04371.13001.03661.2303膽固醇(mg/dl)0.00700.00251.01001.00211.0120BP(mmHg)0.00680.00601.01000.99511.0187血紅蛋白(g%)-0.00100.00980.99900.98001.0184吸煙(0,1,2,3)0.42230.10311.53001.24641.8671ECG(0,1)0.72060.40092.06000.93694.5103第24頁,講稿共41頁,2023年5月2日,星期三
影響生存時間的長短不僅與治療措施有關,還可能與病人的體質,年齡,病情的輕重等多種因素有關。如何找出它們之間的關系呢?對生存資料不能用多元線性回歸分析。1972年英國統(tǒng)計學家CoxDR.提出了一種能處理多因素生存分析數(shù)據(jù)的比例危險模型(Cox'sproportionalharzardmodel)。COX回歸模型分析第25頁,講稿共41頁,2023年5月2日,星期三2023/6/3026生存時間(survivaltime):疾病治療的預后情況,一方面看結局好壞,另一方面還要看出現(xiàn)這種結局所經(jīng)歷的時間長短。所經(jīng)歷的時間稱為生存時間。完全與不完全數(shù)據(jù):一部分研究對象可觀察到死亡,從而得到準確的生存時間,所提供的信息是完全的,稱為完全數(shù)據(jù);另一部分病人由于失訪、意外事故、或到觀察結束時仍存活等原因,無法知道確切的生存時間,它提供了不完全的信息,稱為不完全數(shù)據(jù)(截尾數(shù)據(jù)、刪失數(shù)據(jù):censordata)。第26頁,講稿共41頁,2023年5月2日,星期三27例:某醫(yī)師對1988年收治的16例鼻腔淋巴瘤患者隨訪了13年,信息包括:年齡(X1)、性別(X2)、疾病分期(X3)、鼻血(X4)、放療(X5)、化療(X6),數(shù)據(jù)見表2,試作COX回歸分析鼻腔淋巴瘤的危險因素。第27頁,講稿共41頁,2023年5月2日,星期三28
表2鼻腔淋巴瘤患者隨訪資料編項目登記觀察記錄整理號性別年齡分期鼻血放療化療開始日終止日結局生存天數(shù)
1145220188-1-1789-8-171578
2036220188-1-2192-4-1711549
3045201088-2-290-12-3104717……………051221088-12-195-5-2212363
注:性別‘1’為男性;
放療‘1’表示采用,‘0’表示未采用;
結局‘1’表示死亡。第28頁,講稿共41頁,2023年5月2日,星期三該生存資料的研究目的是考察鼻腔淋巴瘤的生存時間的危險因素疾病分期(X3)、鼻血(X4)、放療(X5)、化療(X6),可能是鼻腔淋巴瘤患者生存時間的危險因素或者保護因素性別和年齡可能是鼻腔淋巴瘤患者生存時間的混雜因素因此使用COX回歸分析控制混雜因素,探討鼻腔淋巴瘤患者生存時間的危險因素。29第29頁,講稿共41頁,2023年5月2日,星期三30SPSS分析結果第i個因素的回歸系數(shù)為bi,對應的風險比(riskratio,記為RRi):RRi=exp(bi),表示在控制其它因素(包括混雜因素)的情況下,該因素每增加一個單位時,風險度改變多少。VariablesintheEquationBSEWalddfSig.RRRR的95%CILowerUpperStep1X41.0840.4216.63010.0102.9571.2956.747Step2X41.3810.5306.79910.0093.9781.40811.244X5-1.5890.6955.22110.0220.2040.0520.797第30頁,講稿共41頁,2023年5月2日,星期三31在本例中放療X5,取值0和1,b=-1.589,
RR=0.204,表示控制年齡、性別兩個混雜因素,以及疾病分期、是否化療等因素前提下,化療(水平1)與不化療(水平0)比較,樣本資料前者的風險度是后者的0.204倍(20.4%),提示“放療”是保護因素?!氨茄盭4取值是0、1、2,b=1.38,RR=3.979,表示控制其它因素的前提下,樣本資料該因素水平每增加1個等級,風險度增加3.979倍,提示“鼻血”是危險因素。第31頁,講稿共41頁,2023年5月2日,星期三COX比例風險模型生存分析的基礎模型?先進模型Kaplan-Meier方法(簡稱K-M法)估計生存概率;Log-rank方法比較兩條或多條生存曲線;Cox比例風險模型分析多個潛在因素對生存時間的影響。只考慮一種終點事件,其余事件均作為刪失事件處理;若存在多個終點及競爭風險事件的情況下仍用單終點分析方法,將會由于競爭風險事件的存在導致對這些終點事件概率的估計偏差。32第32頁,講稿共41頁,2023年5月2日,星期三一般的生存時間過程:T0事件1競爭風險過程:
T0刪失可能發(fā)生的終點事件(endpoint)只有一個類型事件1事件2事件m刪失……可能發(fā)生的終點事件有多個研究方法33考慮競爭事件:競爭風險模型第33頁,講稿共41頁,2023年5月2日,星期三34首先需要注意變量的賦值方法對自變量的結果值編碼方法(習慣上稱為賦值)不同,則自變量的對應參數(shù)估計值及符號將有所不同,從而對結果的解釋方式亦不同三、建??刂苹祀s因素中的注意事項第34頁,講稿共41頁,2023年5月2日,星期三單因素分析的必要性第35頁,講稿共41頁,2023年5月2日,星期三第36頁,講稿共41頁,2023年5月2日,星期三某研究者探討成人過敏性鼻炎的環(huán)境危險因素,采用1∶1配對的病例-對照研究設計,選擇某醫(yī)院耳鼻喉科確診的100例過敏性鼻炎患者為病例;同時選擇該院耳鼻喉科確診的非過敏性鼻炎患者,與病例1∶1相匹配為對照。通過問卷調查的方法收集兩組人群的一般社會人口學特征、疾病健康狀況、吸煙史、職業(yè)接觸史、室內(nèi)環(huán)境狀況及家族史等信息。問卷的統(tǒng)計分析采用多因素的條件Logsitic回歸分析。37注意啞變量的使用第37頁,講稿共41頁,2023年5月2日,星期三38分析變量及賦值表變量賦值是否吸煙1=是,0=否家人是否吸煙1=是,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025建筑裝飾合同范書
- 洛陽理工學院《大型活動與宴會策劃》2023-2024學年第一學期期末試卷
- 2024年某航空公司與旅客關于航班座位租賃的合同
- 2024年買賣合同擔保條款在電子商務領域的應用與實踐3篇
- 酒店鋁合金裝修施工合同
- 垃圾處理設施增項合同
- 商業(yè)設施工程款結算
- 勞動合同試用期延長與轉正流程
- 2024年度鋼材運輸合同(鐵路)2篇
- 2024年度創(chuàng)新型企業(yè)員工激勵機制合同3篇
- 人音版一年級上冊《我有一只小羊羔》課件1
- 常用急救藥品
- 內(nèi)科主治醫(yī)師講義
- 小學生簡筆畫社團活動記錄
- 2023年生態(tài)環(huán)境綜合行政執(zhí)法考試備考題庫(含答案)
- 現(xiàn)澆簡支梁施工方案
- 體育經(jīng)濟學概論PPT全套教學課件
- 全球標準食品安全BRCGS第九版文件清單一覽表
- 路基二工區(qū)涵洞施工臺賬
- 2022年中國人口與發(fā)展研究中心招聘應屆生筆試備考題庫及答案解析
- 單位負反饋系統(tǒng)校正自動控制原理課程設計
評論
0/150
提交評論