醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析課件_第1頁
醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析課件_第2頁
醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析課件_第3頁
醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析課件_第4頁
醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析課件_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析1 第十六章第十六章 logistic回歸分析回歸分析 (Logistic Regression)2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析2ContentnLogistic regression nConditional logistic regression nApplication 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析3講述內(nèi)容講述內(nèi)容: :第一節(jié)第一節(jié) logisticlogistic回歸回歸第二節(jié)第二節(jié) 條件條件logisticlogistic回歸回歸第三節(jié)第三節(jié) logisticlogisti

2、c回歸的應(yīng)用回歸的應(yīng)用 及其注意事項及其注意事項2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析4目的:目的:作出以多個自變量(危險因素)估計作出以多個自變量(危險因素)估計應(yīng)變量(應(yīng)變量(結(jié)果因素)結(jié)果因素)的的logistic回歸方程?;貧w方程。屬于概率型非線性回歸。屬于概率型非線性回歸。資料:資料:1. 應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生的應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生的二值變量;二值變量;2. 自變量宜全部或大部分為分類自變量宜全部或大部分為分類變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量化?;?。2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分

3、析5用途:用途:研究某種疾病或現(xiàn)象發(fā)生和多個危研究某種疾病或現(xiàn)象發(fā)生和多個危 險因素(或保護因子)的數(shù)量關(guān)系。險因素(或保護因子)的數(shù)量關(guān)系。 用用 檢驗(或檢驗(或u檢驗)的檢驗)的局限性局限性: 1.只能研究只能研究1個危險因素;個危險因素; 2.只能得出定性結(jié)論。只能得出定性結(jié)論。22022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析6 種類種類: 1. 成組(非條件)成組(非條件)logistic回歸方程?;貧w方程。 2. 配對(條件)配對(條件)logistic回歸方程?;貧w方程。2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析7第一節(jié)第一節(jié) logistic回歸回歸 (

4、非條件(非條件logistic回歸回歸 )2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析8 一、基本概念一、基本概念1 0 Y發(fā)生應(yīng)變量未發(fā)生12,mXXX自變量,在m個自變量的作用下陽性結(jié)果發(fā)生的概率記作個自變量的作用下陽性結(jié)果發(fā)生的概率記作:),| 1(21mXXXYPP1P02022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析911ZPe若令若令: mmXXXZ2211001122ln=1mmPXXXP0112211 exp ()mmPXXX回回歸歸模模型型其中0為常數(shù)項, m,21為回歸系數(shù)。 概率概率P:01,logitP:。 取值范圍取值范圍 logitP2022-1

5、-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析10圖圖16-1 logistic函數(shù)的圖形函數(shù)的圖形00.51-4-3-2-10123410.5PZ:, 0, : 0, 0.5, 1PZ2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析11模模型型參參數(shù)數(shù)的的意意義義01122ln=logit1mmPXXXPP常數(shù)項常數(shù)項 表示暴露劑量為表示暴露劑量為0時個體發(fā)病時個體發(fā)病與不發(fā)病概率之比的自然對數(shù)。與不發(fā)病概率之比的自然對數(shù)?;貧w系數(shù)回歸系數(shù) 表示自變量表示自變量 改變一個單位時改變一個單位時logitP 的改變量。的改變量。0), 2 , 1(mjjjX2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)

6、Logistic回歸分析12流行病學(xué)衡量危險因素作用大小的流行病學(xué)衡量危險因素作用大小的比數(shù)比例比數(shù)比例指標(biāo)。指標(biāo)。計算公式為:計算公式為:1100/(1)/(1)jPPORPP優(yōu)勢比優(yōu)勢比OR(odds ratio)2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析13111000010010/(1)lnlnlogitlogit/(1)()()()jmmjttjtttjtjjPPORPPPPcXcXcc對對比比某某一一危危險險因因素素兩兩個個不不同同暴暴露露水水平平1cXj與與0cXj的的發(fā)發(fā)病病情情況況(假假定定其其它它因因素素的的水水平平相相同同) ,其其優(yōu)優(yōu)勢勢比比的的自自然然對

7、對數(shù)數(shù)為為: 與與 logisticP 的關(guān)系的關(guān)系:2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析140, 1 exp, 0, 1 0, 1 jjjjjjOROROROR無作用危險因保子護因子則有101 , 1, 0 jccX暴非若暴露露由 于jOR值 與 模 型 中的 常 數(shù)項0無 關(guān) ,0在 危 險 因素 分 析中 通 常視 其 為無 效 參數(shù) 。 1100/(1) 1, /(1)PPPORRRPP當(dāng)則有10 exp()jjORcc即2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析15 11(1)iinYYiiiLPP 1lnln(1) ln(1)niiiiiLYPYP

8、 mbbbb,210 二、logistic回歸模型的參數(shù)估計回歸模型的參數(shù)估計 參數(shù)估計參數(shù)估計 原理:最大似然原理:最大似然( likelihood )估計估計 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析16 )(exp01ccbROjj若自變量jX只有暴露和非暴露兩個水平, 則優(yōu)勢比jOR的1可信區(qū)間估計公式為 )exp(2/jbjSub 2. 優(yōu)勢比估計優(yōu)勢比估計 可反映某一因素兩個不同水平(c1,c0)的優(yōu)勢比。2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析17例16-1 表16-1是一個研究吸煙、飲酒與食道癌關(guān)系的病例對照資料,試作logistic回歸分析。

9、121 0 1 0 1 0 XXY吸煙不吸煙飲酒不飲酒病例對照確確定定各各變變量量編編碼碼 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析18分層 吸煙 飲酒 觀察例數(shù) 陽性數(shù) 陰性數(shù) g X1 X2 ng dg ng dg 1 0 0 199 63 136 2 0 1 170 63 107 3 1 0 101 44 57 4 1 1 416 265 151 表表16-1 吸煙與食道癌關(guān)系的病例對照調(diào)查資料吸煙與食道癌關(guān)系的病例對照調(diào)查資料 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析19=0.1572 吸煙與不吸煙的優(yōu)勢比:11expexp0.8856=2.42ORb

10、經(jīng)logistic回歸計算后得:0b=-0.9099,0bS=0.1358;1b=0.8856, 1bS=0.1500;2b=0.5261,2bS=0.1572 吸 煙 與 不 吸 煙 的 優(yōu) 勢 比 :1OR的 95可信區(qū)間: 110.05/ 2expexp(0.88561.960.1500)(1.81,3.25)bbuS 飲酒與不飲酒的優(yōu)勢比: 飲酒與不飲酒的優(yōu)勢比: 飲酒與不飲酒的優(yōu)勢比: 22expexp0.52611.69ORb 22exp(1.96)exp(0.5261 1.96 0.1572)(1.24,2.30)bbS2OR的95可信區(qū)間: 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Lo

11、gistic回歸分析20 三、三、logistic回歸模型的假設(shè)檢驗回歸模型的假設(shè)檢驗 Wald 檢驗 將各參數(shù)的估計值jb與 0 比較,而用它的標(biāo)準(zhǔn)誤jbS作為參照,檢驗統(tǒng)計量為 2, 1jjjjbbbbuSS2 或 221220111022120.8856 34.860.15000.5261 11.200 :0, :0, 0.05,:0, :0,.157 0 05,2.HHHH 2值均大于 3.84,說明食道癌與吸煙、飲酒有關(guān)系,結(jié)論同前。 2.1.似然比檢驗2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析21方法:方法:前進法、后退法和逐步法前進法、后退法和逐步法。檢驗統(tǒng)計量:檢

12、驗統(tǒng)計量:不是不是 F 統(tǒng)計量,而是似然比統(tǒng)計量、統(tǒng)計量,而是似然比統(tǒng)計量、 Wald 統(tǒng)計量和計分統(tǒng)計量之一。統(tǒng)計量和計分統(tǒng)計量之一。四、變量篩選四、變量篩選例16-2 為了探討冠心病發(fā)生的有關(guān)危險因素,對為了探討冠心病發(fā)生的有關(guān)危險因素,對26例冠心病病人和例冠心病病人和28例對照者進行病例例對照者進行病例 對照研究,各對照研究,各因素的說明及資料見表因素的說明及資料見表16-2和表和表16-3。試用。試用logistic 逐逐步回歸分析方法篩選危險因素。步回歸分析方法篩選危險因素。)15. 0,10. 0(出入2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析22表表16-2 冠心

13、病冠心病8個可能的危險因素與賦值個可能的危險因素與賦值2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析23序號 X1 X2 X3 X4 X5 X6 X7 X8 Y 1 3 1 0 1 0 0 1 1 0 2 2 0 1 1 0 0 1 0 0 3 2 1 0 1 0 0 1 0 0 4 2 0 0 1 0 0 1 0 0 5 3 0 0 1 0 1 1 1 0 6 3 0 1 1 0 0 2 1 0 7 2 0 1 0 0 0 1 0 0 8 3 0 1 1 1 0 1 0 0 9 2 0 0 0 0 0 1 1 0 10 1 0 0 1 0 0 1 0 0 . . . . . . .

14、 . . . . . . . . . . . . . . . . . . . . . . . 51 2 0 1 1 0 1 2 1 1 52 2 1 1 1 0 0 2 1 1 53 2 1 0 1 0 0 1 1 1 54 3 1 1 0 1 0 3 1 1 表表16-3 冠心病危險因素的病例冠心病危險因素的病例 對照調(diào)查資料對照調(diào)查資料 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析24 表表16-4 例例16-2進入方程中的自變量及有關(guān)參數(shù)的估計值進入方程中的自變量及有關(guān)參數(shù)的估計值 選入 變量 回歸系 數(shù) b 標(biāo)準(zhǔn)誤 bS Wald 2 P 值 標(biāo)準(zhǔn)回歸 系數(shù) b OR 常數(shù)

15、項 -4.705 1.543 9.30 0.0023 - - X1 0.924 0.477 3.76 0.0525 0.401 2.52 X5 1.496 0.744 4.04 0.0443 0.406 4.46 X6 3.136 1.249 6.30 0.0121 0.703 23.00 X8 1.947 0.847 5.29 0.0215 0.523 7.01 學(xué)會看結(jié)果!學(xué)會看結(jié)果!2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析25 最終進入 logistic 回歸模型的危險因素有4 個,它們分別是年齡增高)(1X、高血脂史)(5X、 動物脂肪攝入量)(6X和 A 型性格)(8

16、X。 標(biāo)準(zhǔn)回歸系數(shù)3/jjjSbb可以用來比較各因素的相對重要性,jS為變量jX的標(biāo)準(zhǔn)差,=3.1416。 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析26配對資料。最常用的是每組中有一個病例和若干個對照, 即 1: M 配對研究(一般) 3M。 一、原理 第二節(jié) 條件logistic回歸 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析27表表16-5 1: M 條件條件logistic回歸數(shù)據(jù)的格式回歸數(shù)據(jù)的格式 * t = 0 為病例,其他為對照 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析28條件 logistic 模型0112211 exp (.)ii

17、mmPXXX 1,2, iniP 表示第 i 層在一組危險因素作用下發(fā)病的概率, i0 表示各層的效應(yīng),m,21 為待估計的參數(shù)。 與非條件 logistic 回歸模型不同之處在常數(shù)項上,不同匹配組的i0可以各不相同,但內(nèi)在假定了每個危險因素的致病能力在不同匹配組中相同。 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析29二、應(yīng)用實例例16-3 某北方城市研究喉癌發(fā)病的危險因素, 用1:2配對的病例對照研究方法進行了調(diào)查?,F(xiàn)選取了6 個可能的危險因素并節(jié)錄25對數(shù)據(jù), 各因素的賦值說明見表16-6,資料列于表16-7。試作條件logistic 逐步回歸分析。 表16-6 喉癌的危險因

18、素與賦值說明 因素 變量名 賦值說明 咽炎 X1 無=1, 偶爾=2, 經(jīng)常=3 吸煙量(支/日) X2 0=1, 14=2, 59=3, 1020=4, 20=5 聲嘶史 X3 無=1, 偶爾=2, 經(jīng)常=3 攝食新鮮蔬菜 X4 少=1, 經(jīng)常=2, 每天=3 攝食水果 X5 很少=1, 少量=2, 經(jīng)常=3 癌癥家族史 X6 無=0, 有=1 是否患喉癌 Y 病例=1, 對照=0 )15. 0,10. 0(出入2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析30表表16-7 喉癌喉癌1:2配對病例配對病例 對照調(diào)查資料整理表對照調(diào)查資料整理表 P344:2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)

19、計學(xué)Logistic回歸分析31表16-8 例16-3進入方程中的自變量及有關(guān)參數(shù)的估計值 選入的 4 個危險因素分別為吸煙量)(2X、 有聲嘶史)(3X、 是否經(jīng)常攝食新鮮蔬菜)(4X及癌癥家族史)(6X,其中攝食新鮮蔬菜為保護因素)0(4b。 采用逐步法 6個危險因素 變量篩選 4個進方程,結(jié)果見表16-9。 選選入入變變量量 回回歸歸系系數(shù)數(shù) b 標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤 Sb Wald2 RO P 值值 X2 1.4869 0.5506 7.29 4.42 0.0069 X3 1.9166 0.9444 4.12 6.80 0.0424 X4 3.7641 1.8251 4.25 0.02 0.0

20、392 X6 3.6321 1.8657 3.79 37.79 0.0516 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析32一、logistic回歸的應(yīng)用1流行病學(xué)危險因素分析 logistic回歸分析的特點之一是參數(shù)意義清楚,即得到某一因素的回歸系數(shù)后,可以很快估計出這一因素在不同水平下的優(yōu)勢比或近似相對危險度,因此非常適合于流行病學(xué)研究。logistic回歸既適合于隊列研究(cohort study),也適合于病例-對照研究(case-control study),同樣還可以用于斷面研究(cross-sectional study)第三節(jié) logistic回歸的應(yīng)用及其注意事

21、項2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析332臨床試驗數(shù)據(jù)分析 臨床試驗的目的大多是為了評價某種藥物或治療方法的效果,如果有其他影響效果的非處理因素(如年齡、病情等)在試驗組和對照組中分布不均衡,就有可能夸大或掩蓋試驗組的治療效果。 盡管在分組時要求按隨機化原則分配,但由于樣本含量有限,非處理因素在試驗組和對照組內(nèi)的分布仍有可能不均衡,需要在分析階段對構(gòu)成混雜的非處理因素進行調(diào)整。當(dāng)評價指標(biāo)為二值變量時(如有效和無效),可以利用logistic回歸分析得到調(diào)整后的藥物評價結(jié)果。對于按分層設(shè)計的臨床試驗可以用相同的方法對分層因素進行調(diào)整和分析。2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)L

22、ogistic回歸分析343分析藥物或毒物的劑量反應(yīng) 在一些藥物或毒物效價的劑量-反應(yīng)實驗研究中,每一只動物藥物耐受量可能有很大的不同,不同劑量使動物發(fā)生“陽性反應(yīng)”的概率分布常呈正偏態(tài),將劑量取對數(shù)后則概率分布接近正態(tài)分布。由于正態(tài)分布函數(shù)與logistic分布函數(shù)十分接近,如果用P表示在劑量為X時的陽性率,可用下述模型表示它們之間的關(guān)系)ln(exp110XP用這一模型可以求出任一劑量的陽性反應(yīng)率用這一模型可以求出任一劑量的陽性反應(yīng)率傳統(tǒng)的一些方法往往對實驗設(shè)計有嚴(yán)格的要求,如劑量按等比級傳統(tǒng)的一些方法往往對實驗設(shè)計有嚴(yán)格的要求,如劑量按等比級數(shù)排列,各劑量組的例數(shù)必須相同等數(shù)排列,各劑量組的例數(shù)必須相同等, 采用采用logistic回歸的方法則回歸的方法則沒有這些限制。沒有這些限制。 2022-1-15醫(yī)學(xué)醫(yī)學(xué)統(tǒng)計學(xué)Logistic回歸分析354預(yù)測與判別 logistic回歸是一個概率型模型,因此可以利用它預(yù)測某事件發(fā)生的概率。例如在臨床上可以根據(jù)患者的一些檢查指標(biāo),判斷患某種疾病的概率有多大。關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論