Logistic回歸分析及應(yīng)用.ppt_第1頁
Logistic回歸分析及應(yīng)用.ppt_第2頁
Logistic回歸分析及應(yīng)用.ppt_第3頁
Logistic回歸分析及應(yīng)用.ppt_第4頁
Logistic回歸分析及應(yīng)用.ppt_第5頁
已閱讀5頁,還剩71頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1,第十六章Logistic回歸分析,Logistic regression,2,復(fù)習(xí)多元線性回歸(multiple linear regression),在醫(yī)學(xué)實(shí)踐中,常會(huì)遇到一個(gè)應(yīng)變量與多個(gè)自變量數(shù)量關(guān)系的問題。如醫(yī)院住院人數(shù)不僅與門診人數(shù)有關(guān), 而且可能與病床周轉(zhuǎn)次數(shù), 床位數(shù)等有關(guān);兒童的身高不僅與遺傳有關(guān)還與生活質(zhì)量,性別,地區(qū),國(guó)別等有關(guān);人的體表面積與體重、身高等有關(guān)。,3,表 多元線性回歸分析的數(shù)據(jù)結(jié)構(gòu) 實(shí)驗(yàn)對(duì)象 y X1 X2 X3 . XP 1 y1 a11 a12 a13 a1p 2 y2 a21 a22 a23 a2p 3 y3 a31 a32 a33 a3p n yn

2、 an1 an2 an3 anp 其中:y取值是服從正態(tài)分布,4,多元線性回歸模型,通過實(shí)驗(yàn)測(cè)得含有p個(gè)自變量x1,x2,x3,xp及一個(gè)因變量y的n個(gè)觀察對(duì)象值, 利用最小二乘法原理, 建立多元線性回歸模型: 其中b0為截距, b1 ,b2 bp稱為偏回歸系數(shù). bi表示當(dāng)將其它p-1個(gè)變量的作用加以固定后, Xi改變1個(gè)單位時(shí)Y將改變bi個(gè)單位.,5,logistic regression analysis,Logistic回歸分析及其應(yīng)用,6,(一)基本概念和原理,1.應(yīng)用背景 Logistic回歸模型是一種概率模型,適合于病例對(duì)照研究、隨訪研究和橫斷面研究,且結(jié)果發(fā)生的變量取值必須是二

3、分的或多項(xiàng)分類??捎糜绊懡Y(jié)果變量發(fā)生的因素為自變量與因變量,建立回歸方程。,7,設(shè)資料中有一個(gè)因變量y、p個(gè)自變量x1, x2,xp,對(duì)每個(gè)實(shí)驗(yàn)對(duì)象共有n次觀測(cè)結(jié)果,可將原始資料列成表2形式。,2、Logistic回歸模型的數(shù)據(jù)結(jié)構(gòu),8,表2 Logistic回歸模型的數(shù)據(jù)結(jié)構(gòu) 實(shí)驗(yàn)對(duì)象 y X1 X2 X3 . XP 1 y1 a11 a12 a13 a1p 2 y2 a21 a22 a23 a2p 3 y3 a31 a32 a33 a3p n yn an1 an2 an3 anp 其中:y取值是二值或多項(xiàng)分類,表3 肺癌與危險(xiǎn)因素的調(diào)查分析 例號(hào) 是否患病 性別 吸煙 年齡 地區(qū) 1 1

4、1 0 30 0 2 1 0 1 46 1 3 0 0 0 35 1 30 0 0 0 26 1 注:是否患病中,0代表否,1代表是。性別中1代表男,0代表女,吸煙中1代表吸煙,0代表不吸煙。地區(qū)中,1代表農(nóng)村,0代表城市。,表4 配對(duì)資料(1:1) 對(duì)子號(hào) 病例 對(duì)照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0 注:X1蛋白質(zhì)攝入量,取值:0,1,2,3 X2不良飲食習(xí)慣,取值:0,1,2,3 X3精神狀況 ,取值:0,1,2,11,Logistic回歸- Logistic回歸與多重線性

5、回歸聯(lián)系與區(qū)別,聯(lián)系: 用于分析多個(gè)自變量與一個(gè)因變量的關(guān)系,目的是矯正混雜因素、篩選自變量和更精確地對(duì)因變量作預(yù)測(cè)等。 區(qū)別: 線性模型中因變量為連續(xù)性隨機(jī)變量,且要求呈正態(tài)分布. Logistic回歸因變量的取值僅有兩個(gè),不滿足正態(tài)分布。,12,3、 Logistic回歸模型,令: y=1 發(fā)?。栃浴⑺劳?、治愈等) y=0 未發(fā)?。幮?、生存、未治愈等) 將發(fā)病的概率記為P,它與自變量x1, x2,xp之間的Logistic回歸模型為: 可知,不發(fā)病的概率為:,經(jīng)數(shù)學(xué)變換得: 定義: 為L(zhǎng)ogistic變換,即:,14,4、回歸系數(shù)i的意義 流行病學(xué)的常用指標(biāo)優(yōu)勢(shì)比(odds ratio

6、,OR)或稱比數(shù)比,定義為:暴露人群發(fā)病優(yōu)勢(shì)與非暴露人群發(fā)病優(yōu)勢(shì)之比。 即Xi的優(yōu)勢(shì)比為:,故對(duì)于樣本資料OR=exp( ) 95%置信區(qū)間為: 可見 是影響因素Xi增加一個(gè)單位所引起的對(duì)數(shù)優(yōu)勢(shì)的增量,反映了其對(duì)Y作用大小。 如果要比較不同因素對(duì)Y作用大小,需要消除變量量綱的影響,為此計(jì)算標(biāo)準(zhǔn)化回歸系數(shù),5.假設(shè)檢驗(yàn),(1)回歸方程的假設(shè)檢驗(yàn) H0:所有 H1:某個(gè) 計(jì)算統(tǒng)計(jì)量為:G=-2lnL,服從自由度等于n-p 的 分布 (2)回歸系數(shù)的假設(shè)檢驗(yàn) H0: H1:,計(jì)算統(tǒng)計(jì)量為:Wald,,自由度等于1。,17,(二) Logistic回歸類型及其實(shí)例分析,1、非條件Logistic回歸

7、當(dāng)研究設(shè)計(jì)為隊(duì)列研究、橫斷面研究或成組病例對(duì)照研究時(shí),可以用非條件Logistic回歸。,18,實(shí)例1,某研討究者調(diào)查了30名成年人,記錄了同肺癌發(fā)病的有關(guān)因素情況, 數(shù)據(jù)見表4。其中是否患病中, 0代表否, 1代表是;性別中 1代表男, 0代表女;吸煙中 1代表吸煙, 0代表不吸煙;地區(qū)中, 1代表農(nóng)村, 0代表城市。試分析各因素與肺癌間的關(guān)系。,19,表5 肺癌與危險(xiǎn)因素的調(diào)查分析 例號(hào) 是否患病 性別 吸煙 年齡 地區(qū) 1 1 1 0 30 0 2 1 0 1 46 1 3 0 0 0 35 1 30 0 0 0 26 1 注:是否患病中,0代表否,1代表是。性別中1代表男,0代表女,吸

8、煙中1代表吸煙,0代表不吸煙。地區(qū)中,1代表農(nóng)村,0代表城市。,20,SPSS操作步驟:,Analyze-Regression-Binary Logistic -Dependent框(y)-Covariates框(x1,x2,)-ok,非條件Logistic回歸SPSS操作步驟:,21,22,23,結(jié)果表明, 性別, 吸煙, 年齡三個(gè)因素都與肺癌有關(guān). 由于在對(duì)某一因素進(jìn)行單因素分析時(shí)沒有控制其它因素的干擾, 因此結(jié)果不可靠.,單因素分析的結(jié)果,24,多因素分析的結(jié)果,25,26,由上最大似然估計(jì)分析知因素X2(吸煙), X3(年齡)對(duì)肺癌的發(fā)生有影響。 所得的回歸方程為: Logit(P)=

9、-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.,27,2.條件logistic回歸分析,配對(duì)設(shè)計(jì)的類型:1:1、1:m、n:m (可采用分層COX模型來擬合)。 例如:某市調(diào)查三種生活因素與胃癌的關(guān)系,資料見表5。,表6 配對(duì)資料(1:1) 對(duì)子號(hào) 病例 對(duì)照 x1 x2 x3 x1 x2 x3 1 1 3 0 1 0 1 2 0 3 1 1 3 0 3 0 1 2 0 2 0 10 2 2 2 0 0 0 注:X1蛋白質(zhì)攝入量,取值:0,1,2,3 X2不良飲食習(xí)慣,取值:0,1,2,3 X3精神狀況 ,取值:0,1,2,29,配對(duì)Logistic回

10、歸SPSS操作步驟:,Analyze-Survival-COX Regression-Time框(outcome)-Status框( Status ) -Define Event:Single value 1:continue-Covariates框(x1、x2、x3)-Strata框(id)-Options-at last step-ok,30,31,32,33,34,35,36,37,3、逐步Logistic回歸分析,(1)向前法(forward selection),開始方程中沒有變量,自變量由少到多一個(gè)一個(gè)引入回歸方程。按自變量對(duì)因變量的貢獻(xiàn)(P值的大?。┯尚〉酱笠来翁暨x,變量入選的條

11、件是其P值小于規(guī)定進(jìn)入方程的P界值Enter, 缺省值 P(0.05)。,38,(2)后退法(backward selection),開始變量都在方程中,然后按自變量因變量的貢獻(xiàn)(P值的大?。┯纱蟮叫∫来翁蕹兞刻蕹臈l件是其P值小于規(guī)定的剔除標(biāo)準(zhǔn)Remove, 缺省值 p(0.10)。,39,(3)逐步回歸法逐步引入-剔除法(stepwise selection),前進(jìn)逐步引入-剔除法 是在前進(jìn)法的思想下,考慮剔除變量, 因此有兩個(gè)p界值Enter, Remove。,40,無論是條件還是非條件Logistic回歸,在多變量分析時(shí)均可以采用逐步回歸方法,實(shí)現(xiàn)的方法是:在 model后加選項(xiàng):

12、/selection=forward、backward或stepwise 再給出SLE, SLS的界值。,調(diào)試法:P從大到小取值0.5,0.1,0.05, 一般實(shí)際用時(shí), SLE,SLS應(yīng)多次選取調(diào)整,41,解 釋,設(shè)第i個(gè)因素的回歸系數(shù)為bi,表示當(dāng)有多個(gè)自變量存在時(shí),其它自變量固定不變的情況下,自變量Xi每增加一個(gè)單位時(shí),所得到的優(yōu)勢(shì)比的自然對(duì)數(shù)。也就是其它自變量固定不變的情況下,自變量Xi每增加一個(gè)單位時(shí),影響因變量Y=0發(fā)生的倍數(shù)。 當(dāng)bi0時(shí),對(duì)應(yīng)的優(yōu)勢(shì)比(odds ratio,記為ORi):ORi=exp(bi)1,說明該因素是危險(xiǎn)因素;當(dāng)bi0時(shí),對(duì)應(yīng)的優(yōu)勢(shì)比ORi=exp(bi

13、)1,說明該因素是保護(hù)因素。,42,在本例中不良飲食習(xí)慣X2 ,取值:0、1,2、3,b=1.2218, OR=3.393,表示不良飲食習(xí)慣是危險(xiǎn)因素;精神狀況X3 ,取值:0、1、2,b=2.2947, OR=9.922,表示精神狀況是危險(xiǎn)因素。,43,SPSS無論是條件還是非條件Logistic回歸,在多變量分析時(shí)均可以采用逐步回歸方法,實(shí)現(xiàn)的方法是: 在 method后加選項(xiàng): Enter:所有變量一次全部進(jìn)入方程。 Forward:逐步向前法 Backward:后退法 變量移出方程所采取的檢驗(yàn)方法: Conditional; LR; Ward(盡量不用),44,45,二分類Logist

14、ic回歸,46,SPSS 軟件實(shí)現(xiàn)方法,FileOpen相應(yīng)數(shù)據(jù)(已存在) Analyze RegressionBinary Logistic Dependent(y)Covariates (自變量) Mothod(逐步回歸方法)Specify model(單因素或多因素) save(欲保存的內(nèi)容)Options(輸出選項(xiàng))OK,47,調(diào)試法:P從大到小取值0.5,0.1,0.05, 一般實(shí)際用時(shí),Enter、Remove應(yīng)多次選取調(diào)整,48,Block 1: Method = Forward Stepwise (Likelihood Ratio),49,50,51,52,53,54,4.Lo

15、gistic回歸- Logistic回歸種類,55,對(duì)于成組資料的非條件Logistic回歸,()兩分類反應(yīng)變量的Logistic回歸,56,57,自變量分為以下情況: 定量資料時(shí),直接計(jì)算; 二值時(shí),化為與或與; 有序多分類:有線性規(guī)律時(shí)連續(xù)賦值 ,. 無線性規(guī)律按無序多分類無序多分類:需要先轉(zhuǎn)換成n-1個(gè)啞變量,以 啞變量進(jìn)行分析。,58,59,60,61,62,二分類Logistic回歸多重比較的方法,Indicator第一類或最后一類為參照類,每一類與 參照類比較 Simple-除參照類外,每一類與參照類比較 Difference-除第一類外,每一類與其前各類的平均 效應(yīng)比較,有稱反H

16、elmert Helmert-除最后一類外,每一類與其后各類的平均 Repeated相鄰兩類比較,除第一類外,每類與其前一 比較 Polynominal正交多名義分類比較,該法假設(shè)每一分類都 有相等的空間,僅適于數(shù)值變量 Deviation除參照類外,每一類與總效應(yīng)比較,63,64,65,()多分類無序反應(yīng)變量Logistic回歸*,66,67,()多分類有序反應(yīng)變量Logistic回歸*,68,69,練習(xí),據(jù)報(bào)道目前全世界每年的自殺率為1010萬,我國(guó)自殺率為2310萬,我國(guó)高校自殺率則為210萬。為了了解當(dāng)代大學(xué)生綜合素質(zhì)現(xiàn)狀、為了進(jìn)行提高大學(xué)生綜合素質(zhì)的對(duì)策研究,利用中國(guó)現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)教

17、育統(tǒng)計(jì)與管理專業(yè)學(xué)會(huì)設(shè)計(jì)的中國(guó)大學(xué)生綜合素質(zhì)調(diào)查問卷,采用分層整群抽樣,選擇了不同年級(jí)、不同性別、不同專業(yè)以及不同生源的醫(yī)學(xué)大學(xué)生554名的調(diào)查問卷,其中129人有過自殺的意念。應(yīng)用 Logistic回歸分析,探討大學(xué)生有自殺意念的影響因素。,70,部隊(duì)3所院校,1121份有效問卷、地方3所院校1874份有效問卷。,表8 各校有效問卷情況 單 位 有效問卷份數(shù) 軍隊(duì): 北京軍醫(yī)學(xué)院 554 海軍工程大學(xué) 450 解放軍信息工程大學(xué) 117 地方:同濟(jì)醫(yī)學(xué)院 778 中國(guó)科技大學(xué) 628 廣西工學(xué)院 468,71,1. 各項(xiàng)目的名稱及量化方法 在中國(guó)大學(xué)生綜合素質(zhì)調(diào)查問卷中又增加的2個(gè)小題記為A

18、01,A02?;厩闆rA共有21項(xiàng),分別記為A1,A2,A21。當(dāng)有的項(xiàng)目中又分為2項(xiàng)時(shí)再分別賦予不同的名稱,如A10父母親文化程度分為:父親文化程度A10.1、母親文化程度A10.2。其它項(xiàng)目的名稱以此類推。,72,利用EXCEL將調(diào)查問卷各項(xiàng)進(jìn)行量化:有序的項(xiàng)目按照順序賦值0,1,2,;兩分類無序項(xiàng)目賦值0和1;多項(xiàng)無序和多選項(xiàng)目,根據(jù)例數(shù)多少進(jìn)行合并成兩項(xiàng)或引進(jìn)啞變量。去掉了幾項(xiàng)人數(shù)少或不容易量化的個(gè)別多選題:A9.1父親職業(yè)、A9.2母親職業(yè)、B16加入WTO后大學(xué)生最應(yīng)具備的素質(zhì)、B17在當(dāng)代大學(xué)生中你認(rèn)為普遍欠缺的東西、C10.1對(duì)學(xué)習(xí)吃力的再回答、C19.1決定考研者進(jìn)一步需回答、C21.1-C21.3參與過科研或社會(huì)實(shí)踐者進(jìn)一步需回答的問題。最終確定的變量個(gè)數(shù)是:A類有22個(gè)、B類有17個(gè)、C類有38個(gè)、D類有32個(gè)、E類有20個(gè),總計(jì)129個(gè)變量。,73,大學(xué)生產(chǎn)生自殺念頭的影響因素和程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論