第十六章logistic回歸分析(LogisticRegression)_第1頁(yè)
第十六章logistic回歸分析(LogisticRegression)_第2頁(yè)
第十六章logistic回歸分析(LogisticRegression)_第3頁(yè)
第十六章logistic回歸分析(LogisticRegression)_第4頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、391 第十六章第十六章 logistic回歸分析回歸分析 (Logistic Regression)392ContentnLogistic regression nConditional logistic regression nApplication 393講述內(nèi)容講述內(nèi)容: :第一節(jié)第一節(jié) logisticlogistic回歸回歸第二節(jié)第二節(jié) 條件條件logisticlogistic回歸回歸第三節(jié)第三節(jié) logisticlogistic回歸的應(yīng)用回歸的應(yīng)用 及其注意事項(xiàng)及其注意事項(xiàng)394目的:目的:作出以多個(gè)自變量(危險(xiǎn)因素)估計(jì)作出以多個(gè)自變量(危險(xiǎn)因素)估計(jì)應(yīng)變量(應(yīng)變量(結(jié)果因素)

2、結(jié)果因素)的的logistic回歸方程?;貧w方程。屬于概率型非線性回歸。屬于概率型非線性回歸。資料:資料:1. 應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生的應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生的二值變量;二值變量;2. 自變量宜全部或大部分為分類自變量宜全部或大部分為分類變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量變量,可有少數(shù)數(shù)值變量。分類變量要數(shù)量化?;?。395用途:用途:研究某種疾病或現(xiàn)象發(fā)生和多個(gè)危研究某種疾病或現(xiàn)象發(fā)生和多個(gè)危 險(xiǎn)因素(或保護(hù)因子)的數(shù)量關(guān)系。險(xiǎn)因素(或保護(hù)因子)的數(shù)量關(guān)系。 用用 檢驗(yàn)(或檢驗(yàn)(或u檢驗(yàn))的檢驗(yàn))的局限性局限性: 1.只能研究只能研究1個(gè)危險(xiǎn)因素;個(gè)危險(xiǎn)因素; 2.只能得出

3、定性結(jié)論。只能得出定性結(jié)論。2396 種類種類: 1. 成組(非條件)成組(非條件)logistic回歸方程?;貧w方程。 2. 配對(duì)(條件)配對(duì)(條件)logistic回歸方程。回歸方程。397第一節(jié)第一節(jié) logistic回歸回歸 (非條件(非條件logistic回歸回歸 )398 一、基本概念一、基本概念1 0 Y發(fā)生應(yīng)變量未發(fā)生12,mXXX自變量,在m個(gè)自變量的作用下陽(yáng)性結(jié)果發(fā)生的概率記作個(gè)自變量的作用下陽(yáng)性結(jié)果發(fā)生的概率記作:),| 1(21mXXXYPP1P039911ZPe若令若令: mmXXXZ2211001122ln=1mmPXXXP0112211 exp ()mmPXXX回

4、回歸歸模模型型其中0為常數(shù)項(xiàng), m,21為回歸系數(shù)。 概率概率P:01,logitP:。 取值范圍取值范圍 logitP3910圖圖16-1 logistic函數(shù)的圖形函數(shù)的圖形00.51-4-3-2-10123410.5PZ:, 0, : 0, 0.5, 1PZ3911模模型型參參數(shù)數(shù)的的意意義義01122ln=logit1mmPXXXPP常數(shù)項(xiàng)常數(shù)項(xiàng) 表示暴露劑量為表示暴露劑量為0時(shí)個(gè)體發(fā)病時(shí)個(gè)體發(fā)病與不發(fā)病概率之比的自然對(duì)數(shù)。與不發(fā)病概率之比的自然對(duì)數(shù)?;貧w系數(shù)回歸系數(shù) 表示自變量表示自變量 改變一個(gè)單位時(shí)改變一個(gè)單位時(shí)logitP 的改變量。的改變量。0), 2 , 1(mjjjX39

5、12流行病學(xué)衡量危險(xiǎn)因素作用大小的流行病學(xué)衡量危險(xiǎn)因素作用大小的比數(shù)比例比數(shù)比例指標(biāo)。指標(biāo)。計(jì)算公式為:計(jì)算公式為:1100/(1)/(1)jPPORPP優(yōu)勢(shì)比優(yōu)勢(shì)比OR(odds ratio)3913111000010010/(1)lnlnlogitlogit/(1)()()()jmmjttjtttjtjjPPORPPPPcXcXcc對(duì)對(duì)比比某某一一危危險(xiǎn)險(xiǎn)因因素素兩兩個(gè)個(gè)不不同同暴暴露露水水平平1cXj與與0cXj的的發(fā)發(fā)病病情情況況(假假定定其其它它因因素素的的水水平平相相同同) ,其其優(yōu)優(yōu)勢(shì)勢(shì)比比的的自自然然對(duì)對(duì)數(shù)數(shù)為為: 與與 logisticP 的關(guān)系的關(guān)系:39140, 1 ex

6、p, 0, 1 0, 1 jjjjjjOROROROR無(wú)作用危險(xiǎn)因保子護(hù)因子則有101 , 1, 0 jccX暴非若暴露露由于jOR值與模型中的常數(shù)項(xiàng)0無(wú)關(guān),0在危險(xiǎn)因素分析中通常視其為無(wú)效參數(shù)。 1100/(1) 1, /(1)PPPORRRPP當(dāng)則有10 exp()jjORcc即3915 11(1)iinYYiiiLPP 1lnln(1) ln(1)niiiiiLYPYP mbbbb,210 二、logistic回歸模型的參數(shù)估計(jì)回歸模型的參數(shù)估計(jì) 1. 參數(shù)估計(jì)參數(shù)估計(jì) 原理:最大似然原理:最大似然( likelihood )估計(jì)估計(jì) 3916 )(exp01ccbROjj若自變量jX只

7、有暴露和非暴露兩個(gè)水平, 則優(yōu)勢(shì)比jOR的1可信區(qū)間估計(jì)公式為 )exp(2/jbjSub 2. 優(yōu)勢(shì)比估計(jì)優(yōu)勢(shì)比估計(jì) 可反映某一因素兩個(gè)不同水平(c1,c0)的優(yōu)勢(shì)比。3917例16-1 表16-1是一個(gè)研究吸煙、飲酒與食道癌關(guān)系的病例對(duì)照資料,試作logistic回歸分析。 121 0 1 0 1 0 XXY吸煙不吸煙飲酒不飲酒病例對(duì)照確確定定各各變變量量編編碼碼 3918分層 吸煙 飲酒 觀察例數(shù) 陽(yáng)性數(shù) 陰性數(shù) g X1 X2 ng dg ng dg 1 0 0 199 63 136 2 0 1 170 63 107 3 1 0 101 44 57 4 1 1 416 265 151

8、表表16-1 吸煙與食道癌關(guān)系的病例對(duì)照調(diào)查資料吸煙與食道癌關(guān)系的病例對(duì)照調(diào)查資料 3919=0.1572 吸煙與不吸煙的優(yōu)勢(shì)比:11expexp0.8856=2.42ORb 經(jīng)logistic回歸計(jì)算后得:0b=-0.9099,0bS=0.1358;1b=0.8856, 1bS=0.1500;2b=0.5261,2bS=0.1572 吸 煙 與 不 吸 煙 的 優(yōu) 勢(shì) 比 :1OR的 95可信區(qū)間: 110.05/ 2expexp(0.88561.960.1500)(1.81,3.25)bbuS 飲酒與不飲酒的優(yōu)勢(shì)比: 飲酒與不飲酒的優(yōu)勢(shì)比: 飲酒與不飲酒的優(yōu)勢(shì)比: 22expexp0.52

9、611.69ORb 22exp(1.96)exp(0.5261 1.96 0.1572)(1.24,2.30)bbS2OR的95可信區(qū)間: 3920 三、三、logistic回歸模型的假設(shè)檢驗(yàn)回歸模型的假設(shè)檢驗(yàn) Wald 檢驗(yàn) 將各參數(shù)的估計(jì)值jb與 0 比較,而用它的標(biāo)準(zhǔn)誤jbS作為參照,檢驗(yàn)統(tǒng)計(jì)量為 2, 1jjjjbbbbuSS2 或 221220111022120.8856 34.860.15000.5261 11.200 :0, :0, 0.05,:0, :0,.157 0 05,2.HHHH 2值均大于 3.84,說(shuō)明食道癌與吸煙、飲酒有關(guān)系,結(jié)論同前。 2.1.似然比檢驗(yàn)3921

10、方法:方法:前進(jìn)法、后退法和逐步法前進(jìn)法、后退法和逐步法。檢驗(yàn)統(tǒng)計(jì)量:檢驗(yàn)統(tǒng)計(jì)量:不是不是 F 統(tǒng)計(jì)量,而是似然比統(tǒng)計(jì)量、統(tǒng)計(jì)量,而是似然比統(tǒng)計(jì)量、 Wald 統(tǒng)計(jì)量和計(jì)分統(tǒng)計(jì)量之一。統(tǒng)計(jì)量和計(jì)分統(tǒng)計(jì)量之一。四、變量篩選四、變量篩選例16-2 為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素,對(duì)為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素,對(duì)26例冠心病病人和例冠心病病人和28例對(duì)照者進(jìn)行病例例對(duì)照者進(jìn)行病例 對(duì)照研究,各對(duì)照研究,各因素的說(shuō)明及資料見(jiàn)表因素的說(shuō)明及資料見(jiàn)表16-2和表和表16-3。試用。試用logistic 逐逐步回歸分析方法篩選危險(xiǎn)因素。步回歸分析方法篩選危險(xiǎn)因素。)15. 0,10. 0(出入392

11、2表表16-2 冠心病冠心病8個(gè)可能的危險(xiǎn)因素與賦值個(gè)可能的危險(xiǎn)因素與賦值3923序號(hào) X1 X2 X3 X4 X5 X6 X7 X8 Y 1 3 1 0 1 0 0 1 1 0 2 2 0 1 1 0 0 1 0 0 3 2 1 0 1 0 0 1 0 0 4 2 0 0 1 0 0 1 0 0 5 3 0 0 1 0 1 1 1 0 6 3 0 1 1 0 0 2 1 0 7 2 0 1 0 0 0 1 0 0 8 3 0 1 1 1 0 1 0 0 9 2 0 0 0 0 0 1 1 0 10 1 0 0 1 0 0 1 0 0 . . . . . . . . . . . . . . .

12、 . . . . . . . . . . . . . . . 51 2 0 1 1 0 1 2 1 1 52 2 1 1 1 0 0 2 1 1 53 2 1 0 1 0 0 1 1 1 54 3 1 1 0 1 0 3 1 1 表表16-3 冠心病危險(xiǎn)因素的病例冠心病危險(xiǎn)因素的病例 對(duì)照調(diào)查資料對(duì)照調(diào)查資料 3924 表表16-4 例例16-2進(jìn)入方程中的自變量及有關(guān)參數(shù)的估計(jì)值進(jìn)入方程中的自變量及有關(guān)參數(shù)的估計(jì)值 選入 變量 回歸系 數(shù) b 標(biāo)準(zhǔn)誤 bS Wald 2 P 值 標(biāo)準(zhǔn)回歸 系數(shù) b OR 常數(shù)項(xiàng) -4.705 1.543 9.30 0.0023 - - X1 0.924 0.

13、477 3.76 0.0525 0.401 2.52 X5 1.496 0.744 4.04 0.0443 0.406 4.46 X6 3.136 1.249 6.30 0.0121 0.703 23.00 X8 1.947 0.847 5.29 0.0215 0.523 7.01 學(xué)會(huì)看結(jié)果!學(xué)會(huì)看結(jié)果!3925 最終進(jìn)入 logistic 回歸模型的危險(xiǎn)因素有4 個(gè),它們分別是年齡增高)(1X、高血脂史)(5X、 動(dòng)物脂肪攝入量)(6X和 A 型性格)(8X。 標(biāo)準(zhǔn)回歸系數(shù)3/jjjSbb可以用來(lái)比較各因素的相對(duì)重要性,jS為變量jX的標(biāo)準(zhǔn)差,=3.1416。 3926配對(duì)資料。最常用的是

14、每組中有一個(gè)病例和若干個(gè)對(duì)照, 即 1: M 配對(duì)研究(一般) 3M。 一、原理 第二節(jié) 條件logistic回歸 3927表表16-5 1: M 條件條件logistic回歸數(shù)據(jù)的格式回歸數(shù)據(jù)的格式 * t = 0 為病例,其他為對(duì)照 3928條件 logistic 模型0112211 exp (.)iimmPXXX 1,2, iniP 表示第 i 層在一組危險(xiǎn)因素作用下發(fā)病的概率, i0 表示各層的效應(yīng),m,21 為待估計(jì)的參數(shù)。 與非條件 logistic 回歸模型不同之處在常數(shù)項(xiàng)上,不同匹配組的i0可以各不相同,但內(nèi)在假定了每個(gè)危險(xiǎn)因素的致病能力在不同匹配組中相同。 3929二、應(yīng)用實(shí)

15、例例16-3 某北方城市研究喉癌發(fā)病的危險(xiǎn)因素, 用1:2配對(duì)的病例對(duì)照研究方法進(jìn)行了調(diào)查?,F(xiàn)選取了6 個(gè)可能的危險(xiǎn)因素并節(jié)錄25對(duì)數(shù)據(jù), 各因素的賦值說(shuō)明見(jiàn)表16-6,資料列于表16-7。試作條件logistic 逐步回歸分析。 表16-6 喉癌的危險(xiǎn)因素與賦值說(shuō)明 因素 變量名 賦值說(shuō)明 咽炎 X1 無(wú)=1, 偶爾=2, 經(jīng)常=3 吸煙量(支/日) X2 0=1, 14=2, 59=3, 1020=4, 20=5 聲嘶史 X3 無(wú)=1, 偶爾=2, 經(jīng)常=3 攝食新鮮蔬菜 X4 少=1, 經(jīng)常=2, 每天=3 攝食水果 X5 很少=1, 少量=2, 經(jīng)常=3 癌癥家族史 X6 無(wú)=0, 有

16、=1 是否患喉癌 Y 病例=1, 對(duì)照=0 )15. 0,10. 0(出入3930表表16-7 喉癌喉癌1:2配對(duì)病例配對(duì)病例 對(duì)照調(diào)查資料整理表對(duì)照調(diào)查資料整理表 P344:3931表16-8 例16-3進(jìn)入方程中的自變量及有關(guān)參數(shù)的估計(jì)值 選入的 4 個(gè)危險(xiǎn)因素分別為吸煙量)(2X、 有聲嘶史)(3X、 是否經(jīng)常攝食新鮮蔬菜)(4X及癌癥家族史)(6X,其中攝食新鮮蔬菜為保護(hù)因素)0(4b。 采用逐步法 6個(gè)危險(xiǎn)因素 變量篩選 4個(gè)進(jìn)方程,結(jié)果見(jiàn)表16-9。 選選入入變變量量 回回歸歸系系數(shù)數(shù) b 標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤 Sb Wald2 RO P 值值 X2 1.4869 0.5506 7.29

17、4.42 0.0069 X3 1.9166 0.9444 4.12 6.80 0.0424 X4 3.7641 1.8251 4.25 0.02 0.0392 X6 3.6321 1.8657 3.79 37.79 0.0516 3932一、logistic回歸的應(yīng)用1流行病學(xué)危險(xiǎn)因素分析 logistic回歸分析的特點(diǎn)之一是參數(shù)意義清楚,即得到某一因素的回歸系數(shù)后,可以很快估計(jì)出這一因素在不同水平下的優(yōu)勢(shì)比或近似相對(duì)危險(xiǎn)度,因此非常適合于流行病學(xué)研究。logistic回歸既適合于隊(duì)列研究(cohort study),也適合于病例-對(duì)照研究(case-control study),同樣還可以用

18、于斷面研究(cross-sectional study)第三節(jié) logistic回歸的應(yīng)用及其注意事項(xiàng)39332臨床試驗(yàn)數(shù)據(jù)分析 臨床試驗(yàn)的目的大多是為了評(píng)價(jià)某種藥物或治療方法的效果,如果有其他影響效果的非處理因素(如年齡、病情等)在試驗(yàn)組和對(duì)照組中分布不均衡,就有可能夸大或掩蓋試驗(yàn)組的治療效果。 盡管在分組時(shí)要求按隨機(jī)化原則分配,但由于樣本含量有限,非處理因素在試驗(yàn)組和對(duì)照組內(nèi)的分布仍有可能不均衡,需要在分析階段對(duì)構(gòu)成混雜的非處理因素進(jìn)行調(diào)整。當(dāng)評(píng)價(jià)指標(biāo)為二值變量時(shí)(如有效和無(wú)效),可以利用logistic回歸分析得到調(diào)整后的藥物評(píng)價(jià)結(jié)果。對(duì)于按分層設(shè)計(jì)的臨床試驗(yàn)可以用相同的方法對(duì)分層因素進(jìn)

19、行調(diào)整和分析。39343分析藥物或毒物的劑量反應(yīng) 在一些藥物或毒物效價(jià)的劑量-反應(yīng)實(shí)驗(yàn)研究中,每一只動(dòng)物藥物耐受量可能有很大的不同,不同劑量使動(dòng)物發(fā)生“陽(yáng)性反應(yīng)”的概率分布常呈正偏態(tài),將劑量取對(duì)數(shù)后則概率分布接近正態(tài)分布。由于正態(tài)分布函數(shù)與logistic分布函數(shù)十分接近,如果用P表示在劑量為X時(shí)的陽(yáng)性率,可用下述模型表示它們之間的關(guān)系)ln(exp110XP用這一模型可以求出任一劑量的陽(yáng)性反應(yīng)率用這一模型可以求出任一劑量的陽(yáng)性反應(yīng)率傳統(tǒng)的一些方法往往對(duì)實(shí)驗(yàn)設(shè)計(jì)有嚴(yán)格的要求,如劑量按等比級(jí)傳統(tǒng)的一些方法往往對(duì)實(shí)驗(yàn)設(shè)計(jì)有嚴(yán)格的要求,如劑量按等比級(jí)數(shù)排列,各劑量組的例數(shù)必須相同等數(shù)排列,各劑量組的例數(shù)必須相同等, 采用采用logistic回歸的方法則回歸的方法則沒(méi)有這些限制。沒(méi)有這些限制。 39354預(yù)測(cè)與判別 logistic回歸是一個(gè)概率型模型,因此可以利用它預(yù)測(cè)某事件發(fā)生的概率。例如在臨床上可以

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論