統(tǒng)計學(xué)-logistic回歸分析_第1頁
統(tǒng)計學(xué)-logistic回歸分析_第2頁
統(tǒng)計學(xué)-logistic回歸分析_第3頁
統(tǒng)計學(xué)-logistic回歸分析_第4頁
統(tǒng)計學(xué)-logistic回歸分析_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第十六章第十六章 logistic回歸分析回歸分析 logistic回歸為概率型非線性回歸回歸為概率型非線性回歸 模型,是研究分類觀察結(jié)果模型,是研究分類觀察結(jié)果(y)與與 一些影響因素一些影響因素(x)之間關(guān)系的一種之間關(guān)系的一種 多變量分析方法多變量分析方法 問題提出:問題提出: 醫(yī)學(xué)研究中常研究某因素存在條件下某結(jié)果是否醫(yī)學(xué)研究中常研究某因素存在條件下某結(jié)果是否 發(fā)生?以及之間的關(guān)系如何?發(fā)生?以及之間的關(guān)系如何? 因素(因素(X) 疾病結(jié)果(疾病結(jié)果(Y) x1,x2,x3XK 發(fā)生發(fā)生 Y=1 不發(fā)生不發(fā)生 Y=0 例:暴露因素例:暴露因素 冠心病結(jié)果冠心病結(jié)果 高血壓史高血壓史(x

2、1):有:有 或無或無 有有 或或 無無 高血脂史高血脂史(x2): 有有 或或 無無 吸煙吸煙(x3): 有或無有或無 研究問題可否用多元線性回歸方法?研究問題可否用多元線性回歸方法? 1.多元線性回歸方法要求多元線性回歸方法要求 Y 的取值為計量的取值為計量 的連續(xù)性隨機變量。的連續(xù)性隨機變量。 2.多元線性回歸方程要求多元線性回歸方程要求Y與與X間關(guān)系為線間關(guān)系為線 性關(guān)系。性關(guān)系。 3.多元線性回歸結(jié)果多元線性回歸結(jié)果 不能回答不能回答“發(fā)生與發(fā)生與 否否” logistic回歸方法補充多元線性回歸的不足回歸方法補充多元線性回歸的不足 Y 1 12 2 m m ya bxb xb x

3、Logistic回歸方法 該法研究是該法研究是 當(dāng)當(dāng) y 取某值(如取某值(如y=1)發(fā)生的概率()發(fā)生的概率(p)與)與 某暴露因素(某暴露因素(x)的關(guān)系。)的關(guān)系。 P(概率)的取值波動(概率)的取值波動01范圍。范圍。 基本原理基本原理:用一組觀察數(shù)據(jù)擬合:用一組觀察數(shù)據(jù)擬合Logistic模型,模型, 揭示若干個揭示若干個x與一個因變量取值的關(guān)系,反映與一個因變量取值的關(guān)系,反映y 對對x的依存關(guān)系。的依存關(guān)系。 (1/ )( ),( )p yxf xf x即p 一、基本概念一、基本概念 1.變量的取值變量的取值 logistic回歸要求應(yīng)變量(回歸要求應(yīng)變量(Y)取值為分類變量)取

4、值為分類變量 (兩分類或多個分類)(兩分類或多個分類) 自變量(自變量(Xi)稱為危險因素或暴露因素,可為連續(xù))稱為危險因素或暴露因素,可為連續(xù) 變量、等級變量、分類變量。變量、等級變量、分類變量。 可有可有m個自變量個自變量X1, X2, Xm )未發(fā)病、無效、存活等出現(xiàn)陰性結(jié)果 發(fā)病、有效、死亡等)出現(xiàn)陽性結(jié)果 ( 0 ( 1 Y 2.兩值因變量的兩值因變量的logistic回歸模型方程回歸模型方程 一個自變量與一個自變量與Y關(guān)系的回歸模型關(guān)系的回歸模型 如:如:y:發(fā)生:發(fā)生=1,未發(fā)生未發(fā)生=0 x 有有=1無無=0, 記為記為p(y=1/x)表示某暴露因素狀態(tài)下,結(jié))表示某暴露因素狀

5、態(tài)下,結(jié) 果果y=1的概率(的概率(P)模型。)模型。 )(exp1 1 )/1( 0 x xyp x x e e xyP 0 0 1 )/1( 或或 模型描述了應(yīng)變量模型描述了應(yīng)變量p與與x的關(guān)系的關(guān)系 P概率概率 1 0.5 Z值值 0123-1-2-3 圖圖16-1 Logistic回歸函數(shù)的幾何圖形回歸函數(shù)的幾何圖形 )(exp1 1 ) 1( 0 x yp xz 10 為正值,為正值,x越越 大,結(jié)果大,結(jié)果y=1發(fā)發(fā) 生的可能性(生的可能性(p) 越大。越大。 幾個幾個logistic回歸模型方程回歸模型方程 0 0 1 (1/1) 1 x x e pP yx e 0 0 1 (0

6、/1)11 1 x x e P yxp e 0 0 0 (1/0) 1 e pP yx e 0 0 0 (0/0)11 1 e P yxp e logistic回歸模型方程的線性表達回歸模型方程的線性表達 對對logistic回歸模型的概率(回歸模型的概率(p)做)做logit變變 換,換, log ( )ln() 1 p it p p 110 )(logxpity 截距(常數(shù))截距(常數(shù))回歸系數(shù)回歸系數(shù) Y(-至至+) 線性線性 關(guān)系關(guān)系 在有多個危險因素(在有多個危險因素(Xi)時)時 多個變量多個變量的logistic回歸模型方程的線性表達:回歸模型方程的線性表達: mmX XX P

7、P 22110 = 1 lnlogit(p) 01 12 (.) 1 (1/,) 1 kkk k xx p yx xx e 或或 2.模型中參數(shù)的意義模型中參數(shù)的意義 110 = 1 lnX P P 0(常數(shù)項)(常數(shù)項):暴露因素:暴露因素Xi=0時,個體發(fā)病時,個體發(fā)病 概率與不發(fā)病概率之比的自然對數(shù)比值。概率與不發(fā)病概率之比的自然對數(shù)比值。 0 = )0/0(1 )0/1( ln xyP xyP 的含義:的含義:某危險因素,暴露水平變化時,即某危險因素,暴露水平變化時,即 Xi=1與與Xi=0相比,發(fā)生某結(jié)果(如發(fā)?。﹥?yōu)勢比相比,發(fā)生某結(jié)果(如發(fā)?。﹥?yōu)勢比 的對數(shù)值。的對數(shù)值。 11 0

8、0 10 01 1001 1 /(1) lnln /(1) loglog ()() PP OR PP itPitP xxx i P1(y=1/x=1)的概率)的概率 P0(y=1/x=0)的概率)的概率 0 1 00 11 )1/( )1/( odds odds PP PP OR eOR 危險因素危險因素 Y x= 1 x= 0 發(fā)病發(fā)病=1 30(a) 10( b) 不發(fā)病不發(fā)病=0 70(c) 90(d) a+c b+d 危險因素危險因素 Y x= 1 x= 0 發(fā)病發(fā)病=1 p1 p0 不發(fā)病不發(fā)病=0 1-p1 1-p0 1 a p ac 有暴露因素人群中發(fā)病的比例有暴露因素人群中發(fā)病

9、的比例 反映了在其他變量固定后,反映了在其他變量固定后,X=1與與x=0相比相比 發(fā)生發(fā)生Y事件的對數(shù)優(yōu)勢比。事件的對數(shù)優(yōu)勢比。 回歸系數(shù)回歸系數(shù)與與OR X與與Y的關(guān)聯(lián)的關(guān)聯(lián) =0,OR=1, 無關(guān)無關(guān) 0,OR1 , 有關(guān),危險因素有關(guān),危險因素 0,OR1, 有關(guān),保護因子有關(guān),保護因子 事件發(fā)生率很小,事件發(fā)生率很小,ORRR。 多元回歸模型的的 概念 i i i 011 logit(p)ln= 1 mm P XX P 二、二、 Logistic回歸模型回歸模型 Logistic回歸的分類回歸的分類 二分類二分類 多分類多分類 條件條件Logistic回歸回歸 非條件非條件Logist

10、ic回歸回歸 Logit變換變換 也稱對數(shù)單位轉(zhuǎn)換也稱對數(shù)單位轉(zhuǎn)換 logit P= ln 1 P P 流行病學(xué)概念:流行病學(xué)概念: 設(shè)設(shè)P表示暴露因素表示暴露因素X時個體發(fā)病的概率,時個體發(fā)病的概率, 則發(fā)病的概率則發(fā)病的概率P與未發(fā)病的概率與未發(fā)病的概率1-P 之之 比為優(yōu)勢比為優(yōu)勢(odds), logit P就是就是odds 的對數(shù)值。的對數(shù)值。 Logistic回歸模型回歸模型 Logistic回歸的回歸的logit模型模型 Logistic回歸模型回歸模型 01122 logit P=b kk b xb xb x 01 122 01 122 () () 1 kk kk bb xb

11、xb x bb xb xb x e P e 三、參數(shù)估計三、參數(shù)估計 最大似然估計法最大似然估計法 (Maximum likehood estimate) 似然函數(shù):似然函數(shù):L=Pi 對數(shù)似然函數(shù):對數(shù)似然函數(shù): lnL=(ln P)=ln P1+ln P2+ln Pn 非線性迭代方法非線性迭代方法 Newton-Raphson法法 四、參數(shù)檢驗四、參數(shù)檢驗 似然比檢驗似然比檢驗(likehood ratio test) 通過比較包含與不包含某一個或通過比較包含與不包含某一個或 幾個待檢驗觀察因素的兩個模型的對幾個待檢驗觀察因素的兩個模型的對 數(shù)似然函數(shù)變化來進行,其統(tǒng)計量為數(shù)似然函數(shù)變化來

12、進行,其統(tǒng)計量為G (又稱(又稱Deviance)。)。 G=-2(ln Lp-ln Lk) 樣本量較大時,樣本量較大時, G近似服從自由近似服從自由 度為待檢驗因素個數(shù)的度為待檢驗因素個數(shù)的 分布。 分布。 比分檢驗比分檢驗(score test) 以未包含某個或幾個變量的模型為基礎(chǔ),以未包含某個或幾個變量的模型為基礎(chǔ), 保留模型中參數(shù)的估計值,并假設(shè)新增加保留模型中參數(shù)的估計值,并假設(shè)新增加 的參數(shù)為零,計算似然函數(shù)的一價偏導(dǎo)數(shù)的參數(shù)為零,計算似然函數(shù)的一價偏導(dǎo)數(shù) (又稱有效比分)及信息距陣,兩者相乘(又稱有效比分)及信息距陣,兩者相乘 便得比分檢驗的統(tǒng)計量便得比分檢驗的統(tǒng)計量S 。樣本量

13、較大時,樣本量較大時, S近似服從自由度為待檢驗因素個數(shù)的近似服從自由度為待檢驗因素個數(shù)的 分布。 分布。 Wald檢驗檢驗( wald test) 即廣義的即廣義的t檢驗,統(tǒng)計量為檢驗,統(tǒng)計量為u u服從正態(tài)分布,即為標準正態(tài)離差。服從正態(tài)分布,即為標準正態(tài)離差。 Logistic回歸系數(shù)的區(qū)間估計回歸系數(shù)的區(qū)間估計 i i b b u = s i bi Sub 上述三種方法中,似然比檢驗上述三種方法中,似然比檢驗 最可靠,比分檢驗一般與它相一致,最可靠,比分檢驗一般與它相一致, 但兩者均要求較大的計算量;而但兩者均要求較大的計算量;而 Wald檢驗未考慮各因素間的綜合檢驗未考慮各因素間的綜

14、合 作用,在因素間有共線性時結(jié)果不作用,在因素間有共線性時結(jié)果不 如其它兩者可靠。如其它兩者可靠。 五、回歸系數(shù)的意義五、回歸系數(shù)的意義 單純從數(shù)學(xué)上講,與多元線性單純從數(shù)學(xué)上講,與多元線性 回歸分析中回歸系數(shù)的解釋并無不回歸分析中回歸系數(shù)的解釋并無不 同,亦即同,亦即bi表示表示xi改變一個單位時,改變一個單位時, logit P的平均變化量。的平均變化量。 流行病學(xué)中的一些基本概念:流行病學(xué)中的一些基本概念: 相對危險度相對危險度(relative risk): RR=P1/P2 比數(shù)比數(shù)Odds=P/(1-P) 比數(shù)比比數(shù)比OR=P /(1-P)/P/(1-P) 在患病率較小情況下,在患

15、病率較小情況下,ORRR Logistic回歸中的常數(shù)項(回歸中的常數(shù)項(b0)表示,)表示, 在不接觸任何潛在危險保護因素條在不接觸任何潛在危險保護因素條 件下,效應(yīng)指標發(fā)生與不發(fā)生事件的件下,效應(yīng)指標發(fā)生與不發(fā)生事件的 概率之比的對數(shù)值。概率之比的對數(shù)值。 Logistic回歸中的回歸系數(shù)回歸中的回歸系數(shù)( bi )表示,表示, 某一因素改變一個單位時,效應(yīng)指標某一因素改變一個單位時,效應(yīng)指標 發(fā)生與不發(fā)生事件的概率之比的對數(shù)發(fā)生與不發(fā)生事件的概率之比的對數(shù) 變化值,即變化值,即OR的對數(shù)值。的對數(shù)值。 Logistic回歸系數(shù)的意義回歸系數(shù)的意義 分析因素分析因素xi為二分類變量時,存在

16、(暴為二分類變量時,存在(暴 露)露)xi ,不存在(未暴露),不存在(未暴露)xi , 則則Logistic回歸中回歸中xi的系數(shù)的系數(shù)bi就是暴露與就是暴露與 非暴露優(yōu)勢比的對數(shù)值即非暴露優(yōu)勢比的對數(shù)值即 OR=exp(bi)=e (bi) 分析因素分析因素xi為多分類變量時,為方便起為多分類變量時,為方便起 見,常用見,常用1,2,k分別表示分別表示k個不個不 同的類別。進行同的類別。進行Logistic回歸分析前需回歸分析前需 將該變量轉(zhuǎn)換成將該變量轉(zhuǎn)換成k-1個指示變量或啞變個指示變量或啞變 量量(design/dummy variable),這樣指,這樣指 示變量都是一個二分變量,

17、每一個指示變量都是一個二分變量,每一個指 示變量均有一個估計系數(shù),即回歸系示變量均有一個估計系數(shù),即回歸系 數(shù),其解釋同前。數(shù),其解釋同前。 分析因素分析因素xi為等級變量時,如果每個等級的為等級變量時,如果每個等級的 作用相同,可按計量資料處理:如以最小或作用相同,可按計量資料處理:如以最小或 最大等級作參考組,并按等級順序依次取為最大等級作參考組,并按等級順序依次取為 0,1,2,。此時,。此時, e(bi) 表示表示xi增加一個等增加一個等 級時的優(yōu)勢比,級時的優(yōu)勢比, e(k* bi)表示表示xi增加增加k個等級時個等級時 的優(yōu)勢比。如果每個等級的作用不相同,則的優(yōu)勢比。如果每個等級的

18、作用不相同,則 應(yīng)按多分類資料處理。應(yīng)按多分類資料處理。 分析因素分析因素xi為連續(xù)性變量時,為連續(xù)性變量時, e(bi)表示表示xi增加增加 一個計量單位時的優(yōu)勢比。一個計量單位時的優(yōu)勢比。 多因素多因素Logistic回歸分析時,回歸分析時, 對回歸系數(shù)的解釋都是指在其它對回歸系數(shù)的解釋都是指在其它 所有自變量固定的情況下的優(yōu)勢所有自變量固定的情況下的優(yōu)勢 比。存在因素間交互作用時,比。存在因素間交互作用時, Logistic回歸系數(shù)的解釋變得更回歸系數(shù)的解釋變得更 為復(fù)雜,應(yīng)特別小心。為復(fù)雜,應(yīng)特別小心。 根據(jù)根據(jù)Wald檢驗,可知檢驗,可知Logistic回歸回歸 系數(shù)系數(shù)bi服從服從

19、u分布。因此其可信區(qū)間為分布。因此其可信區(qū)間為 進而,優(yōu)勢比進而,優(yōu)勢比e(bi)的可信區(qū)間為的可信區(qū)間為 i bi Sub )( i bi Sub e 六、六、 Logistic回歸分析方法回歸分析方法 基本思想同線性回歸分析?;舅枷胪€性回歸分析。 從所用的方法看,有強迫法、前進法、從所用的方法看,有強迫法、前進法、 后退法和逐步法。在這些方法中,篩選變量后退法和逐步法。在這些方法中,篩選變量 的過程與線性回歸過程的完全一樣。但其中的過程與線性回歸過程的完全一樣。但其中 所用的統(tǒng)計量不再是線性回歸分析中的所用的統(tǒng)計量不再是線性回歸分析中的F統(tǒng)計統(tǒng)計 量,而是以上介紹的參數(shù)檢驗方法中的三種

20、量,而是以上介紹的參數(shù)檢驗方法中的三種 統(tǒng)計量之一。統(tǒng)計量之一。 為計算方便,通常向前選取為計算方便,通常向前選取 變量用似然比或比分檢驗,而向變量用似然比或比分檢驗,而向 后剔除變量常用后剔除變量常用Wald檢驗。檢驗。 七、條件七、條件Logistic回歸回歸 對配對對配對/比調(diào)查資料,應(yīng)該用條件比調(diào)查資料,應(yīng)該用條件 Logistic回歸分析?;貧w分析。 對于配比資料,第對于配比資料,第i個配比組個配比組 可以建立一個可以建立一個Logistic回歸:回歸: i1 122 logit P=b kk b xb xb x 假設(shè)自變量在各配比組中對結(jié)果變量假設(shè)自變量在各配比組中對結(jié)果變量 的作

21、用是相同的,即自變量的回歸系的作用是相同的,即自變量的回歸系 數(shù)與配比組無關(guān)。數(shù)與配比組無關(guān)。 配比設(shè)計的配比設(shè)計的Logistic回歸模型回歸模型 其中不含常數(shù)項。其中不含常數(shù)項。 1 122 logit P=b kk xb xb x 可以看出此回歸模型與非條件可以看出此回歸模型與非條件Logistic 回歸模型十分相似,只不過這里的參回歸模型十分相似,只不過這里的參 數(shù)估計是根據(jù)條件概率得到的,因此數(shù)估計是根據(jù)條件概率得到的,因此 稱為條件稱為條件Logistic回歸模型?;貧w模型。 條件條件Logistic回歸的回歸系數(shù)檢驗與分回歸的回歸系數(shù)檢驗與分 析,和非條件析,和非條件Logist

22、ic回歸完全相同?;貧w完全相同。 八、八、logisticlogistic回歸的應(yīng)用回歸的應(yīng)用 1.1.疾?。辰Y(jié)果)的危險因素分析和篩選疾?。辰Y(jié)果)的危險因素分析和篩選 用回歸模型中的回歸系數(shù)(用回歸模型中的回歸系數(shù)(i i)和)和OROR說明說明 危險因素與疾病的關(guān)系。危險因素與疾病的關(guān)系。 適用的資料:適用的資料: 前瞻性研究設(shè)計、病例對照研究設(shè)計、前瞻性研究設(shè)計、病例對照研究設(shè)計、 橫斷面研究設(shè)計的資料。橫斷面研究設(shè)計的資料。 三類研究計算的三類研究計算的logistic logistic 回歸模型的回歸模型的 意義是一致。僅常意義是一致。僅常 數(shù)項不同。(證明略)數(shù)項不同。(證明略

23、) 2.校正混雜因素,對療效做評價校正混雜因素,對療效做評價 在臨床研究和療效的評價,組間某些因素構(gòu)成在臨床研究和療效的評價,組間某些因素構(gòu)成 不一致干擾療效分析,通過該法可控制非處不一致干擾療效分析,通過該法可控制非處 理因素,正確評價療效。理因素,正確評價療效。 3.預(yù)測與判別預(yù)測與判別 預(yù)測個體在某因素存在條件下,發(fā)生某事件預(yù)測個體在某因素存在條件下,發(fā)生某事件 (發(fā)?。┑母怕?,為進一步治療提供依據(jù)。(發(fā)病)的概率,為進一步治療提供依據(jù)。 輸精管切除術(shù)與動脈粥樣硬化疾病的研究輸精管切除術(shù)與動脈粥樣硬化疾病的研究 1問題的描述問題的描述 (1)輸精管切除術(shù)是否與動脈粥樣硬化疾病 有關(guān)? (

24、2)如果存在聯(lián)系,與其他已知的危險因素 相比,輸精管切除術(shù)的相對重要性有多大? (3)哪些男性亞群在輸精管切除術(shù)以后發(fā)生 動脈粥樣硬化疾病的可能性特別大? 九、九、logistic回歸的應(yīng)用舉例回歸的應(yīng)用舉例 研究目的研究目的 (1)一般目的)一般目的 確定輸精管切除術(shù)與其后因確定輸精管切除術(shù)與其后因 動脈粥樣硬化疾病而住院之間是否有因果動脈粥樣硬化疾病而住院之間是否有因果 聯(lián)系;如果有,則確定輸精管切除術(shù)與患聯(lián)系;如果有,則確定輸精管切除術(shù)與患 動脈粥樣硬化性疾病的危險性是否因觀察動脈粥樣硬化性疾病的危險性是否因觀察 對象具有其他冠心病危險因素,如吸煙、對象具有其他冠心病危險因素,如吸煙、

25、高血壓和高膽固醇等而增強。高血壓和高膽固醇等而增強。 (2)特殊目的)特殊目的 A估計輸精管切除術(shù)及其男性動脈粥樣硬估計輸精管切除術(shù)及其男性動脈粥樣硬 化性疾病危險因素的相對危險度(使用單化性疾病危險因素的相對危險度(使用單 變量分析方法);變量分析方法); B估計輸精管切除術(shù)對動脈粥樣硬化性疾估計輸精管切除術(shù)對動脈粥樣硬化性疾 病獨立的作用(利用條件病獨立的作用(利用條件Logistic回歸?;貧w模 型);型); C檢測輸精管切除術(shù)導(dǎo)致動脈粥樣硬化性檢測輸精管切除術(shù)導(dǎo)致動脈粥樣硬化性 疾病的可能期限;疾病的可能期限; D檢測在輸精管切除術(shù)、吸煙和高血壓之檢測在輸精管切除術(shù)、吸煙和高血壓之 間

26、可能的協(xié)同作用。間可能的協(xié)同作用。 研究變量研究變量 (1)按照世界衛(wèi)生組織標準來診斷動脈粥樣)按照世界衛(wèi)生組織標準來診斷動脈粥樣 硬化性疾??;硬化性疾??; (2)病人特征:年齡,出生日期,宗教,教)病人特征:年齡,出生日期,宗教,教 育,職業(yè),家庭史,婚姻狀況。育,職業(yè),家庭史,婚姻狀況。 (3)生育史:存活子女的數(shù)量與性別,妻子)生育史:存活子女的數(shù)量與性別,妻子 的生育情況。的生育情況。 (4)生活方式:吸煙習(xí)慣,飲酒量,飲食習(xí))生活方式:吸煙習(xí)慣,飲酒量,飲食習(xí) 慣,食鹽量,喝咖啡量,體力活動。慣,食鹽量,喝咖啡量,體力活動。 (5)醫(yī)學(xué)史:有無可能導(dǎo)致不育的疾病或手)醫(yī)學(xué)史:有無可能

27、導(dǎo)致不育的疾病或手 術(shù)、高血壓、糖尿病或高膽固醇血癥。術(shù)、高血壓、糖尿病或高膽固醇血癥。 研究設(shè)計研究設(shè)計 抽樣:抽樣: 以完全隨機抽樣方式確定樣本。樣以完全隨機抽樣方式確定樣本。樣 本量大小的計算是基于事先確定顯著性水平、本量大小的計算是基于事先確定顯著性水平、 把握度和打算測知的相對危險度水平。假定把握度和打算測知的相對危險度水平。假定 樣本量確定為病例組樣本量確定為病例組500例,對照組例,對照組1000例。例。 本設(shè)計力圖避免或減少在病例一對照研究中本設(shè)計力圖避免或減少在病例一對照研究中 常見的偏倚與誤差?;貞浧?、選擇偏倚和常見的偏倚與誤差?;貞浧?、選擇偏倚和 輸精管切除術(shù)報告偏倚

28、對研究結(jié)果的真實性輸精管切除術(shù)報告偏倚對研究結(jié)果的真實性 是極其重要的。是極其重要的。 資料收集:資料收集: 病例組的選?。赫{(diào)查員審閱病例組的選?。赫{(diào)查員審閱 每日住院病人情況每日住院病人情況如果診斷適合研究的范如果診斷適合研究的范 圍,將病例轉(zhuǎn)給心臟病主任醫(yī)師作評估圍,將病例轉(zhuǎn)給心臟病主任醫(yī)師作評估由由 他做出病例診斷是否合格的決定他做出病例診斷是否合格的決定調(diào)查人員調(diào)查人員 核對病人背景資料是否合格核對病人背景資料是否合格如果病人滿足如果病人滿足 診斷標椎和背景資料合格診斷標椎和背景資料合格調(diào)查人員開始詢調(diào)查人員開始詢 問并填寫調(diào)查表問并填寫調(diào)查表每完成每完成5個病例和個病例和10個配個配

29、 對對照以后,請研究中心的工作人員對調(diào)查對對照以后,請研究中心的工作人員對調(diào)查 表進行評估表進行評估重復(fù)以上步驟。重復(fù)以上步驟。 對照組的選?。赫{(diào)查人員評估入院對照組的選取:調(diào)查人員評估入院 單并選擇符合配對標椎和入院診斷單并選擇符合配對標椎和入院診斷 合適的對照病例合適的對照病例核對病人背景資核對病人背景資 料是否符合入院標準料是否符合入院標準如對照組成如對照組成 員合格,則進行調(diào)查。員合格,則進行調(diào)查。 統(tǒng)計分析:統(tǒng)計分析: A計算未校正的相對危險比(計算未校正的相對危險比(OR)與)與95 可信限范圍,以估計輸精管切除術(shù)和其可信限范圍,以估計輸精管切除術(shù)和其 他危險因素的相對危險度。他危

30、險因素的相對危險度。 B利用配對的條件利用配對的條件Logistic 回歸模型計回歸模型計 算校正相對危險比,用此比來評價輸精管算校正相對危險比,用此比來評價輸精管 切除術(shù)對動脈粥樣硬化的獨立影響。切除術(shù)對動脈粥樣硬化的獨立影響。 C利用動脈粥樣硬化作為因變量,輸精管利用動脈粥樣硬化作為因變量,輸精管 切除術(shù)后間隔時間作為自變量,用條件切除術(shù)后間隔時間作為自變量,用條件 Logistic回歸模型來檢驗輸精管切除術(shù)后時回歸模型來檢驗輸精管切除術(shù)后時 間長短對發(fā)生動脈粥樣硬化的時間效應(yīng)。間長短對發(fā)生動脈粥樣硬化的時間效應(yīng)。 二、Logistic回歸應(yīng)用的注意事項回歸應(yīng)用的注意事項 1.模型中自變量

31、的取值模型中自變量的取值 自變量(自變量(X)可為計量數(shù)據(jù)、分類數(shù)據(jù)和)可為計量數(shù)據(jù)、分類數(shù)據(jù)和 等級數(shù)據(jù)。等級數(shù)據(jù)。 計量數(shù)據(jù)常重新劃為有序組段,計量數(shù)據(jù)常重新劃為有序組段,OR的實際的實際 意義較大。意義較大。 例:年齡(歲,例:年齡(歲,x1) 1 ln()0.04 1 p ax p exp(0.04)1.0408OR 十、十、logisticlogistic回歸的注意事項回歸的注意事項 數(shù)據(jù)的幾種賦值形式數(shù)據(jù)的幾種賦值形式 1)兩分類變量,賦值為:有)兩分類變量,賦值為:有=1,無,無=0 2)有序變量,賦值;無)有序變量,賦值;無=0,少,少=1,中,中=2,多,多=3 例;年齡例;

32、年齡 45=1 45-54=2 55-64=3 65=4 3.)多分類無序變量:)多分類無序變量: 賦值為:啞變量(賦值為:啞變量(dummy variable)形式)形式 見例:見例: 注:變量取值不同,方程的系數(shù)和符號將發(fā)生變化。注:變量取值不同,方程的系數(shù)和符號將發(fā)生變化。 冠心病可能的危險因素與賦值冠心病可能的危險因素與賦值 因素因素變量名變量名賦值說明賦值說明 年齡年齡(歲歲)X145=1, 45 54=2, 55 64=3, 65 =4 高血壓史高血壓史X2無無=0, 有有=1 高血壓家族史高血壓家族史X3無無=0, 有有=1 吸煙吸煙X4不吸不吸=0, 吸吸=1 年齡(年齡(X)

33、化為啞變量的賦值)化為啞變量的賦值 年齡(歲年齡(歲) 有序變量有序變量啞變量(方法一)啞變量(方法一) X水平水平D1D2D3 401000 40 2100 503010 60 4001 110 )(logxpit 方程方程1:有序變量方程:有序變量方程 含義:含義:x每增加每增加1個單位(個單位(10歲),發(fā)病的歲),發(fā)病的 lnOR平均增加平均增加1 方程方程2:啞變量方程(啞變量個數(shù):啞變量方程(啞變量個數(shù)=分類數(shù)分類數(shù)1) 方程系數(shù)的解釋:方程系數(shù)的解釋: 表示表示40-歲歲/40歲相比的對數(shù)優(yōu)勢比歲相比的對數(shù)優(yōu)勢比 表示表示50-歲歲/40歲相比的對數(shù)優(yōu)勢比歲相比的對數(shù)優(yōu)勢比 表示表示60-歲歲/40歲相比的對數(shù)優(yōu)勢比歲相比的對數(shù)優(yōu)勢比 0112233 log ( )it pDDD 1 2 3 啞變量的賦值方法 例2:研究某結(jié)果與血型的關(guān)系 血型 (X) 啞變量 X1X2X3 A000

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論