logistic回歸分析PPT課件_第1頁
logistic回歸分析PPT課件_第2頁
logistic回歸分析PPT課件_第3頁
logistic回歸分析PPT課件_第4頁
logistic回歸分析PPT課件_第5頁
已閱讀5頁,還剩31頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、logistic回歸分析 logistic回歸分析回歸分析 陸健陸健 副教授副教授 2021-8-15 logistic回歸分析 表表1 吸煙、飲酒與食管癌關(guān)系的病例對照調(diào)查資吸煙、飲酒與食管癌關(guān)系的病例對照調(diào)查資 料料 分層分層吸煙吸煙 飲酒飲酒陽性例數(shù)陽性例數(shù)陰性例數(shù)陰性例數(shù)觀察例數(shù)觀察例數(shù) 1否否否否 63 136 199 2否否是是 63 107 170 3是是否否 44 57 101 4是是是是 265 151 416 logistic回歸分析 表表1 吸煙、飲酒與食管癌關(guān)系的病例對照調(diào)查資吸煙、飲酒與食管癌關(guān)系的病例對照調(diào)查資 料料 (收集資料的形式)(收集資料的形式) 調(diào)查對象序

2、號調(diào)查對象序號吸煙吸煙飲酒飲酒食管癌食管癌 1101 2000 875111 876010 logistic回歸分析 分類資料的影響因素分析方法分類資料的影響因素分析方法 n如果采用線性回歸分析,應(yīng)變量不滿足條如果采用線性回歸分析,應(yīng)變量不滿足條 件,預(yù)測值會超出件,預(yù)測值會超出0和和1的范圍。的范圍。 n如果采用單變量的如果采用單變量的 2檢驗,則必然忽略其他檢驗,則必然忽略其他 自變量對應(yīng)變量的影響。自變量對應(yīng)變量的影響。 n如果采用如果采用Mantel-Haenszel分層分析,需要分層分析,需要 較大的樣本量,而且自變量不能太多。較大的樣本量,而且自變量不能太多。 nlogistic回

3、歸能較好地解決上述問題。回歸能較好地解決上述問題。 logistic回歸分析 logistic回歸模型回歸模型 n應(yīng)變量應(yīng)變量Y是一個二值變量,取值為是一個二值變量,取值為 n自變量自變量X1,X2,Xm。 nP表示在表示在m個自變量作用下事件發(fā)生的概率。個自變量作用下事件發(fā)生的概率。 1 Y 發(fā) 事事件件發(fā)發(fā)生生(病病、有有效效、死死亡亡等等) 0 0 事事件件未未發(fā)發(fā)生生(未未發(fā)發(fā)病病、無無效效、存存活活等等) logistic回歸分析 logistic回歸模型回歸模型 12 01 1 1 (1/,) 1exp (.) m mm P yx xx xx 01 1 12 (.) 1 (1/,)

4、 1 m m m xx P yx xx e logistic回歸分析 logistic回歸模型回歸模型 P Z 01 1 . mm Zxx logistic回歸分析 logit變換變換 n事件發(fā)生概率與未發(fā)生概率之比的自然事件發(fā)生概率與未發(fā)生概率之比的自然 對數(shù),稱為對數(shù),稱為P的的logit變換,記作變換,記作logit(P)。 n概率概率P的取值范圍在的取值范圍在01之間,而之間,而logit(P) 取值是沒有界限的。取值是沒有界限的。 logit( )ln() 1 P P P logistic回歸分析 logit變換變換 01 1 12 (.) 1 (0/,)1 1 m m m xx P

5、 yx xx e 01 1 01 1 (.) 12 (.) (0/,) 1 m m m m xx m xx e P yx xx e 01 1 (.) 1 m m xx P e P 01 1 ln(). 1 mm P xxy P logistic回歸分析 回歸模型中參數(shù)的意義回歸模型中參數(shù)的意義 n 0(常數(shù)項):所有影響因素均為(常數(shù)項):所有影響因素均為 0 時時 (記作(記作X=0),個體發(fā)生事件概率與不),個體發(fā)生事件概率與不 發(fā)生事件的概率之比的自然對數(shù)值。發(fā)生事件的概率之比的自然對數(shù)值。 n j 的含義:某因素因素的含義:某因素因素 Xj 改變一個單位改變一個單位 時,個體發(fā)生事件概

6、率與不發(fā)生事件的時,個體發(fā)生事件概率與不發(fā)生事件的 概率之比的自然對數(shù)變化值。概率之比的自然對數(shù)變化值。 logistic回歸分析 優(yōu)勢比(優(yōu)勢比(odds ratio,OR) n優(yōu)勢(優(yōu)勢(odds)是指某影響因素控制在某)是指某影響因素控制在某 種水平時,事件發(fā)生率與事件不發(fā)生率種水平時,事件發(fā)生率與事件不發(fā)生率 的比值,即的比值,即P/(1-P)。 n某影響因素的兩個不同水平的優(yōu)勢的比某影響因素的兩個不同水平的優(yōu)勢的比 值稱為優(yōu)勢比,如某影響因素的一個水值稱為優(yōu)勢比,如某影響因素的一個水 平為平為c1,另一個水平為,另一個水平為c0,則這兩個水,則這兩個水 平的優(yōu)勢比為:平的優(yōu)勢比為:

7、11 00 /(1) /(1) PP OR PP logistic回歸分析 優(yōu)勢比(優(yōu)勢比(odds ratio,OR) nOR表示影響因素對事件發(fā)生的影響方表示影響因素對事件發(fā)生的影響方 向和影響能力大小。向和影響能力大小。 nOR1表示該因素取值越大,事件發(fā)生表示該因素取值越大,事件發(fā)生 的概率越大,又稱危險因素。的概率越大,又稱危險因素。 nOR 0,OR 1,影響因素的取值越大,影響因素的取值越大, 事件的發(fā)生的概率越大。事件的發(fā)生的概率越大。 n 0,OR 1,影響因素的取值越大,影響因素的取值越大, 事件的發(fā)生的概率越小。事件的發(fā)生的概率越小。 logistic回歸分析 logis

8、tic回歸模型的參數(shù)估計回歸模型的參數(shù)估計 n通常采用最大似然估計(通常采用最大似然估計(maximum likeli- hood estimate,MLE)估計回歸系數(shù))估計回歸系數(shù) ,同同 時得到回歸系數(shù)的標(biāo)準(zhǔn)誤時得到回歸系數(shù)的標(biāo)準(zhǔn)誤Sb。 n根據(jù)最大似然原理,在一次抽樣中獲得現(xiàn)根據(jù)最大似然原理,在一次抽樣中獲得現(xiàn) 有樣本的概率應(yīng)該最大。即似然函數(shù)取值有樣本的概率應(yīng)該最大。即似然函數(shù)取值 最大。最大。 n計算可以通過統(tǒng)計軟件來完成。計算可以通過統(tǒng)計軟件來完成。 1 11 ii nn YY iii ii LlP Q logistic回歸分析 logistic回歸模型的參數(shù)估計回歸模型的參數(shù)估

9、計 n根據(jù)計算所得的根據(jù)計算所得的bj計算計算OR值。值。 nOR值的可信區(qū)間:可以利用值的可信區(qū)間:可以利用bj的抽樣的抽樣 分布來估計,在樣本含量較大的情況分布來估計,在樣本含量較大的情況 下,近似服從正態(tài)分布。當(dāng)自變量只下,近似服從正態(tài)分布。當(dāng)自變量只 有兩個水平時,可采用下列公式計算。有兩個水平時,可采用下列公式計算。 /2 exp() j jb buS 10 exp() jj ORb cc logistic回歸分析 logistic回歸模型的參數(shù)估計回歸模型的參數(shù)估計 n以表以表16-1的數(shù)據(jù),計算吸煙和飲酒與食管癌關(guān)的數(shù)據(jù),計算吸煙和飲酒與食管癌關(guān) 系研究的系研究的logistic

10、回歸分析中各項參數(shù)估計值?;貧w分析中各項參數(shù)估計值。 影響因素影響因素bSbOROR的的95%CI 常數(shù)項常數(shù)項-0.90990.1358 吸煙吸煙0.88560.15002.421.813.25 飲酒飲酒0.52610.15721.691.242.30 logistic回歸分析 logistic回歸模型的假設(shè)檢驗回歸模型的假設(shè)檢驗 n根據(jù)樣本得到的根據(jù)樣本得到的logistic回歸模型還需經(jīng)過檢回歸模型還需經(jīng)過檢 驗才能說明影響因素對事件發(fā)生的影響是否驗才能說明影響因素對事件發(fā)生的影響是否 具有統(tǒng)計學(xué)意義。具有統(tǒng)計學(xué)意義。 n假設(shè)檢驗的假設(shè)有兩種:假設(shè)檢驗的假設(shè)有兩種: nH0: 1= 2=

11、 m(將多個影響因素作為一(將多個影響因素作為一 個整體考慮)個整體考慮) nH0: j=0(單獨檢驗?zāi)硞€影響因素)(單獨檢驗?zāi)硞€影響因素) logistic回歸分析 logistic回歸模型的假設(shè)檢驗回歸模型的假設(shè)檢驗方法方法 n似然比檢驗似然比檢驗(likelihood ratio test):既適合:既適合 單個影響因素的假設(shè)檢驗,又適合多個單個影響因素的假設(shè)檢驗,又適合多個 影響因素的同時檢驗;影響因素的同時檢驗; nWald檢驗檢驗(Wald test):適合單個影響因:適合單個影響因 素的檢驗;素的檢驗; n計分檢驗(計分檢驗(score test):與傳統(tǒng)):與傳統(tǒng)Mantel-

12、 Haenszel檢驗結(jié)果相同,小樣本時比似然檢驗結(jié)果相同,小樣本時比似然 比檢驗跟接近比檢驗跟接近 2分布,犯分布,犯I型錯誤的可能型錯誤的可能 性更小。性更小。 logistic回歸分析 似然比檢驗的基本思想似然比檢驗的基本思想 n比較包含需檢驗影響因素的模型和不包含比較包含需檢驗影響因素的模型和不包含 該影響因素的模型,如果檢驗結(jié)果為拒絕該影響因素的模型,如果檢驗結(jié)果為拒絕 H0,則表示該影響因素對回歸模型有統(tǒng)計,則表示該影響因素對回歸模型有統(tǒng)計 學(xué)意義,即對事件發(fā)生有影響。反之,則學(xué)意義,即對事件發(fā)生有影響。反之,則 沒有統(tǒng)計學(xué)意義,對事件發(fā)生沒有影響。沒有統(tǒng)計學(xué)意義,對事件發(fā)生沒有影

13、響。 logistic回歸分析 似然比檢驗(例似然比檢驗(例161) nG=2(lnL1-lnL0),自由度,自由度d=p-l nG1=2lnL(X1,X2)- lnL(X2)=35.45 nG2=2lnL(X1,X2)- lnL(X1)=11.23 n 20.05,1=3.84, G1 20.05,1, G2 20.05,1 n結(jié)論:扣除飲酒因素后,吸煙對食管癌的結(jié)論:扣除飲酒因素后,吸煙對食管癌的 發(fā)生有影響;扣除吸煙因素后,飲酒對食發(fā)生有影響;扣除吸煙因素后,飲酒對食 管癌有影響。管癌有影響。 logistic回歸分析 Wald檢驗(例檢驗(例161) n結(jié)論:食管癌與吸煙、飲酒有關(guān)。結(jié)

14、論:食管癌與吸煙、飲酒有關(guān)。 j b j S b u 22 )( j b j S b 1 22 1 0.8856 ()34.86 0.1500 22 2 0.5261 ()11.20 0.1572 22 12 3.84 3.84 logistic回歸分析 變量篩選變量篩選 n當(dāng)影響因素較多時,需挑選出與事件發(fā)生當(dāng)影響因素較多時,需挑選出與事件發(fā)生 確實有關(guān)或關(guān)系更密切的影響因素,建立確實有關(guān)或關(guān)系更密切的影響因素,建立 更加穩(wěn)定的回歸模型。更加穩(wěn)定的回歸模型。 n篩選方法:前進(jìn)法、后退法、逐步法。篩選方法:前進(jìn)法、后退法、逐步法。 n檢驗方法:似然比檢驗、檢驗方法:似然比檢驗、Wald檢驗和計

15、分檢驗和計分 檢驗。檢驗。 n入選和剔除標(biāo)準(zhǔn):入選和剔除標(biāo)準(zhǔn):0.05和和0.10。(常規(guī))。(常規(guī)) logistic回歸分析 表表2 冠心病危險因素的病例對照調(diào)查資料冠心病危險因素的病例對照調(diào)查資料 序號X1X2X3X4X5X6X7X8Y 1310100110 2201100100 53210100111 54311010311 logistic回歸分析 表表3 冠心病危險因素的賦值冠心病危險因素的賦值 因素因素變量名變量名賦值說明賦值說明 年齡(歲)年齡(歲)X145=1,45=2,55=3,65=4 高血壓史高血壓史X2無無=0,有,有=1 高血壓家族史高血壓家族史X3無無=0,有,有

16、=1 吸煙吸煙X4不吸煙不吸煙=0,吸煙,吸煙= 1 高血脂史高血脂史X5無無=0,有,有=1 動物脂肪攝入動物脂肪攝入X6低低= 0,高,高= 1 體重指數(shù)體重指數(shù)X724=1,24=2,26=3 A型性格型性格X8否否= 0,是,是= 1 冠心病冠心病Y對照對照= 0,病例,病例= 1 logistic回歸分析 變量篩選后的模型變量篩選后的模型 影響因影響因 素素 bSb Wald 2 PbOR 常數(shù)項常數(shù)項 - 4.70 5 1.5439.300.0023 X1 0.92 4 0.4773.760.05250.4012.52 X5 1.49 6 0.7444.040.04330.4064

17、.46 X6 3.13 6 1.2496.300.01210.70323.00 1.94 7 0.8475.290.02150.5237.01 logistic回歸分析 結(jié)論結(jié)論 n年齡越大,有高血脂史,高動物脂肪攝入年齡越大,有高血脂史,高動物脂肪攝入 量以及量以及A型性格的人,比較容易患冠心病。型性格的人,比較容易患冠心病。 n根據(jù)根據(jù)OR值或標(biāo)準(zhǔn)化回歸系數(shù)可以判斷出,值或標(biāo)準(zhǔn)化回歸系數(shù)可以判斷出, 動物脂肪攝入量高對冠心病的影響最大,動物脂肪攝入量高對冠心病的影響最大, 其次為其次為A型性格和有高血脂史,最后為年齡型性格和有高血脂史,最后為年齡 因素。因素。 n標(biāo)準(zhǔn)化回歸系數(shù):標(biāo)準(zhǔn)化回歸

18、系數(shù): /(/3) jjj bbs logistic回歸分析 條件條件logistic回歸回歸 n根據(jù)病例的具體情況,安排某些條件相根據(jù)病例的具體情況,安排某些條件相 同的個體作為對照。同的個體作為對照。 n可以是可以是1:1對照,也可以對照,也可以1個病例選擇多個病例選擇多 個對照,稱為個對照,稱為1:M對照(對照(M 3)。)。 n分析過程與非條件分析過程與非條件logistic回歸相同?;貧w相同。 n條件條件logistic回歸與非條件回歸與非條件logistic回歸的回歸的 區(qū)別是沒有常數(shù)項。區(qū)別是沒有常數(shù)項。 logistic回歸分析 logistic回歸的應(yīng)用回歸的應(yīng)用 n流行病學(xué)

19、危險因素分析流行病學(xué)危險因素分析 n病例對照研究中探索疾病的發(fā)病原因;病例對照研究中探索疾病的發(fā)病原因; n隊列研究中驗證危險因素的作用大小。隊列研究中驗證危險因素的作用大小。 n臨床試驗數(shù)據(jù)分析臨床試驗數(shù)據(jù)分析 n當(dāng)評價指標(biāo)為分類數(shù)據(jù),而且有其他影響評價指當(dāng)評價指標(biāo)為分類數(shù)據(jù),而且有其他影響評價指 標(biāo)的影響因素(年齡、病情、病種等)存在時。標(biāo)的影響因素(年齡、病情、病種等)存在時。 logistic回歸分析 logistic回歸的應(yīng)用回歸的應(yīng)用 n分析藥物和毒物的劑量反應(yīng)分析藥物和毒物的劑量反應(yīng) n計算半數(shù)效量(如計算半數(shù)效量(如ED50);); n考察不同藥物的交互作用??疾觳煌幬锏慕换?/p>

20、作用。 n預(yù)測和判別預(yù)測和判別 n根據(jù)個體的特征,判斷個體發(fā)生某事件的概率;根據(jù)個體的特征,判斷個體發(fā)生某事件的概率; n判斷個體屬于的類型。判斷個體屬于的類型。 logistic回歸分析 logistic回歸應(yīng)用的注意事項回歸應(yīng)用的注意事項 n變量取值形式變量取值形式 n事件變量的取值:一般發(fā)生為事件變量的取值:一般發(fā)生為1,未發(fā)生為,未發(fā)生為0, 如果發(fā)生為如果發(fā)生為0,未發(fā)生為,未發(fā)生為1,則模型中回歸系,則模型中回歸系 數(shù)絕對值不變,但符號相反。數(shù)絕對值不變,但符號相反。 n自變量可以是二分類變量、有序變量、多分自變量可以是二分類變量、有序變量、多分 類變量、連續(xù)變量。類變量、連續(xù)變量。 logistic回歸分析 logistic回歸應(yīng)用的注意事項回歸應(yīng)用的注意事項 n連續(xù)變量一般需轉(zhuǎn)換為等級變量,否則實連續(xù)變量一般需轉(zhuǎn)換為等級變量,否則實 際意義不大。際意義不大。 n如年齡每增加如年齡每增加1歲的優(yōu)勢比。歲的優(yōu)勢比。 n等級變量取值等級變量取值 n認(rèn)為變化每個等級的優(yōu)勢比相近,則取秩認(rèn)為變化每個等級的優(yōu)勢比相近,則取秩 n認(rèn)為變化每個等級的優(yōu)勢比不同,則應(yīng)轉(zhuǎn)換為認(rèn)為變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論