如何通過建??刂苹祀s因素_第1頁
如何通過建模控制混雜因素_第2頁
如何通過建??刂苹祀s因素_第3頁
如何通過建模控制混雜因素_第4頁
如何通過建??刂苹祀s因素_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

如何通過建模控制混雜因素第1頁,講稿共41頁,2023年5月2日,星期三1978年8月9號(hào)美國(guó)一著名報(bào)紙刊登了一條科技信息:某單位對(duì)美國(guó)20個(gè)城市做飲水氟化研究,10個(gè)城市的飲水氟化,而另10個(gè)城市未氟化作對(duì)照,結(jié)論是:“飲水氟化有致癌作用”。但過了一個(gè)時(shí)期,該報(bào)紙又刊登了相反的文章。案例:引水氟化是否有致癌作用?第2頁,講稿共41頁,2023年5月2日,星期三

原來前述論文發(fā)表后,受到美國(guó)癌腫協(xié)會(huì)和英國(guó)統(tǒng)計(jì)協(xié)會(huì)的懷疑,他們派人對(duì)該批數(shù)據(jù)重新做統(tǒng)計(jì)分析,其結(jié)論是:“飲水氟化沒有發(fā)現(xiàn)有致癌作用,相反,卻略有保護(hù)作用。兩個(gè)結(jié)論差別如此之大,根源在于第一分析法未控制混雜,采用單因素分析法,而后一個(gè)結(jié)論則把兩個(gè)城市中的種族、生活環(huán)境上的混雜因素進(jìn)行控制(多元統(tǒng)計(jì)分析),再去比較兩組城市的癌癥患病率。第3頁,講稿共41頁,2023年5月2日,星期三

案例:攜帶火柴和發(fā)生肺癌間有關(guān)系?某研究者進(jìn)行問卷調(diào)查,結(jié)果發(fā)現(xiàn):是否攜帶火柴和肺癌患病率有關(guān),攜帶火柴的人更有可能發(fā)生肺癌。難道這表明攜帶火柴可能引起肺癌?!

客觀事實(shí):攜帶火柴不可能引起肺癌!第4頁,講稿共41頁,2023年5月2日,星期三混雜因素的影響

攜帶火柴?肺癌

吸煙

這中間存在混雜因素---吸煙第5頁,講稿共41頁,2023年5月2日,星期三6一、混雜因素混雜(confounding):指在流行病學(xué)研究中,由于一個(gè)或多個(gè)潛在的混雜因素的影響,掩蓋或夸大了研究因素與疾?。ɑ蚴录┲g的聯(lián)系,從而使兩者之間的真正聯(lián)系被錯(cuò)誤地估計(jì),造成混雜。1.概念混雜因素(confoundingfactor):指與研究因素和研究疾病均有關(guān),若在比較的人群中分布不均,可以歪曲研究因素與疾病之間真正聯(lián)系的因素。第6頁,講稿共41頁,2023年5月2日,星期三72.混雜因素的基本特點(diǎn):(1)必須與所研究疾病有關(guān)(2)必須與所研究因素有關(guān)(3)一定不是研究因素與研究疾病因果鏈上的中間變量

具備基本條件,如果在比較的人群中分布不均,即可導(dǎo)致偏倚。第7頁,講稿共41頁,2023年5月2日,星期三策略

設(shè)計(jì)階段限制進(jìn)入隨機(jī)化分組匹配8

分析階段分層分析標(biāo)準(zhǔn)化多因素分析如何控制混雜因素?第8頁,講稿共41頁,2023年5月2日,星期三二、如何通過建模控制混雜因素第9頁,講稿共41頁,2023年5月2日,星期三

表1數(shù)據(jù)形式(P≥2)

觀察對(duì)象X1X2…Xp

Y1a11

a12…a1py12a21a22…a2py2

…nan1an2…anpyn分因變量具體情況:

y是計(jì)量資料,多元線性回歸分析

y是定性資料,尤其是二值資料,采用

Logistic回歸分析

y=t是生存時(shí)間,后面有是否為完全數(shù)據(jù)標(biāo)志,采用

COX回歸分析

設(shè)在實(shí)際研究問題中,含有p個(gè)自變量x1,x2,…,xp;1個(gè)因變量,n個(gè)觀察對(duì)象。第10頁,講稿共41頁,2023年5月2日,星期三在醫(yī)學(xué)實(shí)踐中,常會(huì)遇到一個(gè)應(yīng)變量與多個(gè)自變量數(shù)量關(guān)系的問題。如醫(yī)院住院人數(shù)不僅與門診人數(shù)有關(guān),而且可能與病床周轉(zhuǎn)次數(shù),床位數(shù)等有關(guān);兒童的身高不僅與遺傳有關(guān)還與生活質(zhì)量,性別,地區(qū),國(guó)別等有關(guān);人的體表面積與體重、身高等有關(guān)。第11頁,講稿共41頁,2023年5月2日,星期三多元線性回歸模型

通過實(shí)驗(yàn)測(cè)得含有p個(gè)自變量x1,x2,x3,…,xp及一個(gè)因變量y的n個(gè)觀察對(duì)象值,利用最小二乘法原理,建立多元線性回歸模型:

其中b0為截距,b1,b2…bp稱為偏回歸系數(shù).bi表示當(dāng)將其它p-1個(gè)變量的作用加以固定后,Xi改變1個(gè)單位時(shí)Y將改變bi個(gè)單位.第12頁,講稿共41頁,2023年5月2日,星期三

例:

27名糖尿病人的性別、年齡、血清總膽固醇、甘油三脂、空腹胰島素、糖化血紅蛋白、空腹血糖的測(cè)量值列于表3中,試建立血糖與其它幾項(xiàng)指標(biāo)關(guān)系的多元線性回歸方程。多元線性回歸分析13第13頁,講稿共41頁,2023年5月2日,星期三表327名糖尿病人的血糖及有關(guān)變量的測(cè)量結(jié)果

14第14頁,講稿共41頁,2023年5月2日,星期三15資料的研究目的是建立血糖與其它因素的線性回歸方程性別和年齡與應(yīng)變量(血糖)含量有關(guān),也可能與自變量(血清總膽固醇、甘油三脂、空腹胰島素、糖化血紅蛋白)有關(guān),因此,懷疑性別、年齡為混雜因素將混雜因素(性別和年齡)放到多元線性回歸模型中進(jìn)行控制,從而更加準(zhǔn)確地考察其它自變量與血糖的關(guān)系第15頁,講稿共41頁,2023年5月2日,星期三SPSS分析結(jié)果結(jié)果為扣除性別和年齡兩個(gè)混雜因素的影響后,各指標(biāo)與血糖的關(guān)系16第16頁,講稿共41頁,2023年5月2日,星期三在醫(yī)學(xué)上,人們更關(guān)心疾病是否發(fā)生或發(fā)展的影響因素,既因變量是二值的。

令:y=1發(fā)病(陽性、死亡、治愈等)y=0未發(fā)病(陰性、生存、未治愈等)Logistic回歸模型是一種概率模型,適合于病例—對(duì)照研究、隨訪研究和橫斷面研究,且結(jié)果發(fā)生的變量取值必須是二分的或多項(xiàng)分類??捎糜绊懡Y(jié)果變量發(fā)生的因素為自變量與因變量,建立回歸方程。第17頁,講稿共41頁,2023年5月2日,星期三Logistic回歸--Logistic回歸種類成組資料的非條件Logistic回歸配對(duì)資料的條件Logistic回歸兩分類反應(yīng)變量的Logistic回歸多分類有序反應(yīng)變量Logistic回歸多分類無序反應(yīng)變量Logistic回歸1:1配對(duì)資料的條件Logistic回歸1:m配對(duì)資料的條件Logistic回歸n:m配對(duì)資料的條件Logistic回歸Logistic回歸分析第18頁,講稿共41頁,2023年5月2日,星期三表5肺癌與危險(xiǎn)因素的調(diào)查分析例號(hào)是否患病性別吸煙年齡地區(qū)111030021014613000351………………30000261注:是否患病中,‘0’代表否,‘1’代表是。性別中‘1’代表男,‘0’代表女,吸煙中‘1’代表吸煙,‘0’代表不吸煙。地區(qū)中,‘1’代表農(nóng)村,‘0’代表城市。第19頁,講稿共41頁,2023年5月2日,星期三

由上最大似然估計(jì)分析知因素X2(吸煙),X3(年齡)對(duì)肺癌的發(fā)生有影響。所得的回歸方程為:Logit(P)=-9.781+2.520X1+3.999X2+0.189X3-1.3067X4第20頁,講稿共41頁,2023年5月2日,星期三解釋

設(shè)第i個(gè)因素的回歸系數(shù)為bi,表示當(dāng)有多個(gè)自變量存在時(shí),其它自變量固定不變的情況下,自變量Xi每增加一個(gè)單位時(shí),所得到的優(yōu)勢(shì)比的自然對(duì)數(shù)。也就是其它自變量固定不變的情況下,自變量Xi每增加一個(gè)單位時(shí),影響因變量Y=0發(fā)生的倍數(shù)。當(dāng)bi>0時(shí),對(duì)應(yīng)的優(yōu)勢(shì)比(oddsratio,記為ORi):ORi=exp(bi)>1,說明該因素是危險(xiǎn)因素;當(dāng)bi<0時(shí),對(duì)應(yīng)的優(yōu)勢(shì)比ORi=exp(bi)<1,說明該因素是保護(hù)因素。

第21頁,講稿共41頁,2023年5月2日,星期三弗明漢心血管疾病研究

742名居住在弗明漢年齡為40-49歲的男性,在各自暴露不同水平的影響因素(詳見下表中的6種因素),經(jīng)過12年的追蹤觀察冠心?。–HD)的發(fā)病情況。根據(jù)此742名受試者每人暴露各項(xiàng)因素的水平和CHD發(fā)病與否的資料,采用多因素Logistic回歸模型進(jìn)行分析。22多因素Logistic回歸分析第22頁,講稿共41頁,2023年5月2日,星期三資料的研究目的是探討CHD發(fā)病與否的危險(xiǎn)因素血液中的膽固醇水平、血紅蛋白濃度、血壓水平、

吸煙量因素可能是CHD發(fā)病的危險(xiǎn)因素年齡既與膽固醇水平、血紅蛋白水平、血壓水平等因素相關(guān),又與CHD是否發(fā)病相關(guān),懷疑年齡是混雜因素使用多因素Logistic回歸分析,將年齡放到模型中進(jìn)行控制,考察CHD發(fā)病的危險(xiǎn)因素23第23頁,講稿共41頁,2023年5月2日,星期三24SPSS分析結(jié)果變量參數(shù)估計(jì)值

標(biāo)準(zhǔn)誤OROR的95%CILowerUpper截距-13.2573年齡0.12160.04371.13001.03661.2303膽固醇(mg/dl)0.00700.00251.01001.00211.0120BP(mmHg)0.00680.00601.01000.99511.0187血紅蛋白(g%)-0.00100.00980.99900.98001.0184吸煙(0,1,2,3)0.42230.10311.53001.24641.8671ECG(0,1)0.72060.40092.06000.93694.5103第24頁,講稿共41頁,2023年5月2日,星期三

影響生存時(shí)間的長(zhǎng)短不僅與治療措施有關(guān),還可能與病人的體質(zhì),年齡,病情的輕重等多種因素有關(guān)。如何找出它們之間的關(guān)系呢?對(duì)生存資料不能用多元線性回歸分析。1972年英國(guó)統(tǒng)計(jì)學(xué)家CoxDR.提出了一種能處理多因素生存分析數(shù)據(jù)的比例危險(xiǎn)模型(Cox'sproportionalharzardmodel)。COX回歸模型分析第25頁,講稿共41頁,2023年5月2日,星期三2023/6/3026生存時(shí)間(survivaltime):疾病治療的預(yù)后情況,一方面看結(jié)局好壞,另一方面還要看出現(xiàn)這種結(jié)局所經(jīng)歷的時(shí)間長(zhǎng)短。所經(jīng)歷的時(shí)間稱為生存時(shí)間。完全與不完全數(shù)據(jù):一部分研究對(duì)象可觀察到死亡,從而得到準(zhǔn)確的生存時(shí)間,所提供的信息是完全的,稱為完全數(shù)據(jù);另一部分病人由于失訪、意外事故、或到觀察結(jié)束時(shí)仍存活等原因,無法知道確切的生存時(shí)間,它提供了不完全的信息,稱為不完全數(shù)據(jù)(截尾數(shù)據(jù)、刪失數(shù)據(jù):censordata)。第26頁,講稿共41頁,2023年5月2日,星期三27例:某醫(yī)師對(duì)1988年收治的16例鼻腔淋巴瘤患者隨訪了13年,信息包括:年齡(X1)、性別(X2)、疾病分期(X3)、鼻血(X4)、放療(X5)、化療(X6),數(shù)據(jù)見表2,試作COX回歸分析鼻腔淋巴瘤的危險(xiǎn)因素。第27頁,講稿共41頁,2023年5月2日,星期三28

表2鼻腔淋巴瘤患者隨訪資料編項(xiàng)目登記觀察記錄整理號(hào)性別年齡分期鼻血放療化療開始日終止日結(jié)局生存天數(shù)

1145220188-1-1789-8-171578

2036220188-1-2192-4-1711549

3045201088-2-290-12-3104717……………051221088-12-195-5-2212363

注:性別‘1’為男性;

放療‘1’表示采用,‘0’表示未采用;

結(jié)局‘1’表示死亡。第28頁,講稿共41頁,2023年5月2日,星期三該生存資料的研究目的是考察鼻腔淋巴瘤的生存時(shí)間的危險(xiǎn)因素疾病分期(X3)、鼻血(X4)、放療(X5)、化療(X6),可能是鼻腔淋巴瘤患者生存時(shí)間的危險(xiǎn)因素或者保護(hù)因素性別和年齡可能是鼻腔淋巴瘤患者生存時(shí)間的混雜因素因此使用COX回歸分析控制混雜因素,探討鼻腔淋巴瘤患者生存時(shí)間的危險(xiǎn)因素。29第29頁,講稿共41頁,2023年5月2日,星期三30SPSS分析結(jié)果第i個(gè)因素的回歸系數(shù)為bi,對(duì)應(yīng)的風(fēng)險(xiǎn)比(riskratio,記為RRi):RRi=exp(bi),表示在控制其它因素(包括混雜因素)的情況下,該因素每增加一個(gè)單位時(shí),風(fēng)險(xiǎn)度改變多少。VariablesintheEquationBSEWalddfSig.RRRR的95%CILowerUpperStep1X41.0840.4216.63010.0102.9571.2956.747Step2X41.3810.5306.79910.0093.9781.40811.244X5-1.5890.6955.22110.0220.2040.0520.797第30頁,講稿共41頁,2023年5月2日,星期三31在本例中放療X5,取值0和1,b=-1.589,

RR=0.204,表示控制年齡、性別兩個(gè)混雜因素,以及疾病分期、是否化療等因素前提下,化療(水平1)與不化療(水平0)比較,樣本資料前者的風(fēng)險(xiǎn)度是后者的0.204倍(20.4%),提示“放療”是保護(hù)因素?!氨茄盭4取值是0、1、2,b=1.38,RR=3.979,表示控制其它因素的前提下,樣本資料該因素水平每增加1個(gè)等級(jí),風(fēng)險(xiǎn)度增加3.979倍,提示“鼻血”是危險(xiǎn)因素。第31頁,講稿共41頁,2023年5月2日,星期三COX比例風(fēng)險(xiǎn)模型生存分析的基礎(chǔ)模型?先進(jìn)模型Kaplan-Meier方法(簡(jiǎn)稱K-M法)估計(jì)生存概率;Log-rank方法比較兩條或多條生存曲線;Cox比例風(fēng)險(xiǎn)模型分析多個(gè)潛在因素對(duì)生存時(shí)間的影響。只考慮一種終點(diǎn)事件,其余事件均作為刪失事件處理;若存在多個(gè)終點(diǎn)及競(jìng)爭(zhēng)風(fēng)險(xiǎn)事件的情況下仍用單終點(diǎn)分析方法,將會(huì)由于競(jìng)爭(zhēng)風(fēng)險(xiǎn)事件的存在導(dǎo)致對(duì)這些終點(diǎn)事件概率的估計(jì)偏差。32第32頁,講稿共41頁,2023年5月2日,星期三一般的生存時(shí)間過程:T0事件1競(jìng)爭(zhēng)風(fēng)險(xiǎn)過程:

T0刪失可能發(fā)生的終點(diǎn)事件(endpoint)只有一個(gè)類型事件1事件2事件m刪失……可能發(fā)生的終點(diǎn)事件有多個(gè)研究方法33考慮競(jìng)爭(zhēng)事件:競(jìng)爭(zhēng)風(fēng)險(xiǎn)模型第33頁,講稿共41頁,2023年5月2日,星期三34首先需要注意變量的賦值方法對(duì)自變量的結(jié)果值編碼方法(習(xí)慣上稱為賦值)不同,則自變量的對(duì)應(yīng)參數(shù)估計(jì)值及符號(hào)將有所不同,從而對(duì)結(jié)果的解釋方式亦不同三、建??刂苹祀s因素中的注意事項(xiàng)第34頁,講稿共41頁,2023年5月2日,星期三單因素分析的必要性第35頁,講稿共41頁,2023年5月2日,星期三第36頁,講稿共41頁,2023年5月2日,星期三某研究者探討成人過敏性鼻炎的環(huán)境危險(xiǎn)因素,采用1∶1配對(duì)的病例-對(duì)照研究設(shè)計(jì),選擇某醫(yī)院耳鼻喉科確診的100例過敏性鼻炎患者為病例;同時(shí)選擇該院耳鼻喉科確診的非過敏性鼻炎患者,與病例1∶1相匹配為對(duì)照。通過問卷調(diào)查的方法收集兩組人群的一般社會(huì)人口學(xué)特征、疾病健康狀況、吸煙史、職業(yè)接觸史、室內(nèi)環(huán)境狀況及家族史等信息。問卷的統(tǒng)計(jì)分析采用多因素的條件Logsitic回歸分析。37注意啞變量的使用第37頁,講稿共41頁,2023年5月2日,星期三38分析變量及賦值表變量賦值是否吸煙1=是,0=否家人是否吸煙1=是,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論