版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、大城小事1問題提出: 醫(yī)學(xué)研究中常研究某因素存在條件下某結(jié)果是否發(fā)生?以及之間的關(guān)系如何? 因素(X) 疾病結(jié)果(Y) x1,x2,x3XK 發(fā)生 Y=1 不發(fā)生 Y=0例:暴露因素 冠心病結(jié)果高血壓史(x1):有 或無 有 或 無高血脂史(x2): 有 或 無吸煙(x3): 有或無大城小事2研究問題可否用多元線性回歸方法?1.多元線性回歸方法要求 Y 的取值為計量的連續(xù)性隨機變量。2.多元線性回歸方程要求Y與X間關(guān)系為線性關(guān)系。3.多元線性回歸結(jié)果 不能回答“發(fā)生與否”logistic回歸方法補充多元線性回歸的不足大城小事3Logistic回歸方法該法研究是 當(dāng) y 取某值(如y=1)發(fā)生的
2、概率(p)與某暴露因素(x)的關(guān)系。 P(概率)的取值波動01范圍。 基本原理:用一組觀察數(shù)據(jù)擬合Logistic模型,揭示若干個x與一個因變量取值的關(guān)系,反映y 對x的依存關(guān)系。大城小事4第一節(jié) logistic回歸一、基本概念 1.變量的取值 logistic回歸要求應(yīng)變量(Y)取值為分類變量(兩分類或多個分類) 自變量(Xi)稱為危險因素或暴露因素,可為連續(xù)變量、等級變量、分類變量。 可有m個自變量X1, X2, Xm 大城小事52.兩值因變量的logistic回歸模型方程一個自變量與Y關(guān)系的回歸模型如:y:發(fā)生=1,未發(fā)生=0 x : 有=1,無=0,記為p(y=1/x)表示某暴露因素
3、狀態(tài)下,結(jié)果y=1的概率(P)模型?;蚰P兔枋隽藨?yīng)變量p與x的關(guān)系大城小事6P概率10.5Z值0123-1-2-3圖16-1 Logistic回歸函數(shù)的幾何圖形為正值,x越大,結(jié)果y=1發(fā)生的可能性(p)越大。大城小事7幾個logistic回歸模型方程大城小事8logistic回歸模型方程的線性表達(dá)對logistic回歸模型的概率(p)做logit變換,截距(常數(shù))回歸系數(shù)Y(-至+)線形關(guān)系方程如下:大城小事9在有多個危險因素(Xi)時多個變量的logistic回歸模型方程的線性表達(dá):或公式16-2大城小事102.模型中參數(shù)的意義0(常數(shù)項):暴露因素Xi=0時,個體發(fā)病概率與不發(fā)病概率之比
4、的自然對數(shù)比值。 大城小事11 的含義:某危險因素,暴露水平變化時,即Xi=1與Xi=0相比,發(fā)生某結(jié)果(如發(fā)?。﹥?yōu)勢比的對數(shù)值。 P1(y=1/x=1)的概率P0(y=1/x=0)的概率大城小事12 危險因素 Y x= 1 x= 0發(fā)病=1 30(a) 10( b) 不發(fā)病=0 70(c) 90(d) a+c b+d 危險因素 Y x= 1 x= 0發(fā)病=1 p1 p0 不發(fā)病=0 1-p1 1-p0 有暴露因素人群中發(fā)病的比例大城小事13 反映了在其他變量固定后,X=1與x=0相比發(fā)生Y事件的對數(shù)優(yōu)勢比。 回歸系數(shù)與OR X與Y的關(guān)聯(lián) =0,OR=1, 無關(guān) 1,OR1 , 有關(guān),危險因素
5、 1,OR1, 有關(guān),保護因子事件發(fā)生率很小,ORRR。多元回歸模型的的 概念大城小事14二、logistic回歸模型的參數(shù)估計1. 模型中的參數(shù)(i)估計 通常用最大似然函數(shù) (maximum likelihood estimate, MLE)估計, 由統(tǒng)計軟件包完成。(講義259頁), , 大城小事152. 優(yōu)勢比(OR)及可信區(qū)間的估計如X=1,0兩分類,則OR的1-可信區(qū)間估計公式為回歸系數(shù)的標(biāo)準(zhǔn)誤(公式16-10)大城小事16例:講義表16-1資料一個研究吸煙、飲酒與食道癌關(guān)系的病例對照資料(886例),試作logistic回歸分析。變量的賦值大城小事17經(jīng)logistic回歸計算后
6、得 b0 =-0.9099, b1 =0.8856, b2 =0.5261, 方程表達(dá):控制飲酒因素后,吸煙與不吸煙相比患食管癌的優(yōu)勢比為2.4倍 大城小事18OR的可信區(qū)間估計吸煙與不吸煙患食管癌OR的95%可信區(qū)間:飲酒與不飲酒OR的95%可信區(qū)間:大城小事19三、Logistic 回歸模型的假設(shè)檢驗1.檢驗一:對建立的整個模型做檢驗。 說明自變量對Y的作用是否有統(tǒng)計意義。檢驗方法(講義260-261頁)1)似然比檢驗 (likelihood ratio test)2)Wald檢驗3)計分檢驗(score test)大城小事20例表16-1吸煙、飲酒與食管癌資料(SAS軟件計算) 1.對建
7、立的整個模型做檢驗。Testing Global Null Hypothesis: BETA=0Test Chi-Square DF Pr似然比 68.5457 2 .0001計分檢驗 67.0712 2 .0001Wald檢驗 64.2784 2 .0001大城小事212.檢驗二:檢驗?zāi)P椭心呈欠駥有作用。檢驗假設(shè):檢驗統(tǒng)計量:主要為Wald檢驗(SAS軟件)例;在大樣本時,三方法結(jié)果一致。公式16-13=1的2大城小事22例表16-1資料,對各x的做檢驗(wald檢驗)參數(shù) 估計值 標(biāo)準(zhǔn)誤 Chi-Squa Pr常數(shù)-0.9099 0.1358 44.8699 .0001吸煙 0.885
8、6 0.1500 34.8625 .0001飲酒 0.5261 0.1572 11.2069 .0008 Odds Ratio Estimates Point 95% WaldEffect Estimate Confidence Limits 吸煙x1 2.424 1.807 3.253 飲酒x2 1.692 1.244 2.303大城小事23似然比檢驗(講義)對某個做檢驗,檢驗統(tǒng)計量(G)包括p個自變量的對數(shù)似然函數(shù)包括 l 個自變量的對數(shù)似然函數(shù)G服從自由度(d)=p-l的2分布大城小事24似然比檢驗對做檢驗例:X1為吸煙,X2為飲酒,檢驗飲酒與食管癌關(guān)系,H0:2=0,H1:20G 3.
9、84,p0.05,說明調(diào)整吸煙因素后,飲酒與食管癌有關(guān)系。大城小事25四、變量篩選目的;將回歸系數(shù)有顯著意義的自變量選入模型中,作用不顯著的自變量則排除在外。變量篩選算法有:前進(jìn)法、后退法和 逐步法(stepwise)。例:講義例16-2,用逐步法選入變量的顯著水準(zhǔn)為0.10,變量保留在方程的水準(zhǔn)為0.15例:16-2講義261-263頁大城小事26表16-4 進(jìn)入方程的自變量及參數(shù)估計變量 Sb Wald2 P 標(biāo)準(zhǔn) OR常數(shù) -4.705 1.54 9.30 0.0023 年齡 0.924 0.477 3.76 0.0525 0.401 2.52X5 1.496 0.744 4.04 0.
10、0443 0.406 4.46X6 3.136 1.249 6.30 0.0121 0.703 23.06X8 1.947 0.847 5.29 0.0215 0.523 7.01標(biāo)準(zhǔn)回歸系數(shù)(b) 比較各自變量對Y 的相對貢獻(xiàn)大城小事27第二節(jié) 條件Logistic回歸概念:用配對設(shè)計獲得病例對照研究資料,計算的Logistic回歸模型為條件Logistic回歸。成組(未配對)設(shè)計的病例對照研究資料,計算的Logistic回歸模型為非條件Logistic回歸。例:見265頁區(qū)別:條件Logistic回歸的參數(shù)估計無常數(shù)項(0),主要用于危險因素的分析。大城小事28第三節(jié) logistic回歸
11、的應(yīng)用及注意事項 一、logistic回歸的應(yīng)用1.疾?。辰Y(jié)果)的危險因素分析和篩選 用回歸模型中的回歸系數(shù)(i)和OR說明危險因素與疾病的關(guān)系。例:講義例16-1,16-2,16-3適用的資料: 前瞻性研究設(shè)計、病例對照研究設(shè)計、 橫斷面研究設(shè)計的資料。三類研究計算的logistic 回歸模型的意義是一致。僅常數(shù)項不同。(證明略)大城小事29Logistic回歸的應(yīng)用2.校正混雜因素,對療效做評價在臨床研究和療效的評價,組間某些因素構(gòu)成不一致干擾療效分析,通過該法可控制非處理因素,正確評價療效。3.預(yù)測與判別預(yù)測個體在某因素存在條件下,發(fā)生某事件(發(fā)病)的概率,為進(jìn)一步治療提供依據(jù)。大城小
12、事30表5-4甲乙兩療法某病治愈率%比較病型 甲療法 乙療法 病人 治愈 治愈 病人 治愈 治愈 數(shù) 數(shù) 率 數(shù) 數(shù) 率普通型 300 180 60.0 100 65 65.0重型 100 35 35.0 300 125 41.7合計 400 215 53.8 400 190 47.5例:例1大城小事31表5-5直接法計算標(biāo)準(zhǔn)化治愈率病型 標(biāo)準(zhǔn) 甲療法 乙療法 治療 原治 預(yù)期 原治 預(yù)期 人數(shù) 愈率 治愈數(shù) 愈率 治愈數(shù)普通型 400 60.0 240 65.0 260重型 400 35.0 140 41.7 167合計 800 380 427調(diào)整率(標(biāo)準(zhǔn)化率): 大城小事32X1療法(甲=
13、0,乙=1)X2病情(輕=1,重=0)Y療效(Y=1有效,Y=0無效) LOGISTIC回歸計算 Standard Wald Parameter Estimate Error Chi-Squa Pr Intercept -0.6453 0.1653 15.24 .0001 療法 0.2482 0.1699 2.13 0.1442 病情 0.9900 0.1699 33.93 .0001 Odds Ratio Estimate Point 95% Wald Effect Estimate Confidence Limits 療法 1.282 0.919 1.788 病情 2.691 1.929
14、3.755大城小事33例2 性別、兩種藥物對某病療效的研究不考慮性別的影響,療效與藥物的logistic回歸2=10.23,p=0.0014,OR=4.46性別治療方法療效有效(y=1) 無效(y=0)合計女X1=1新藥(x2=1)21627對照(x2=0)131932男X1=0新藥(x2=1)7714對照(x2=0)11011大城小事34考慮性別、藥物對療效的作用 Standard WaldParame Estimate Error Chi-Square Pr 常數(shù) -1.9037 0.5982 10.127 0.0015性別 1.4685 0.575 6.508 0.0107藥物 1.78
15、16 0.518 11.794 0.0006 Odds Ratio Estimates Point 95% Wald Effect Estimate Confidence Limits x1 性別 4.343 1.405 13.421 x2 藥物 5.939 2.149 16.417大城小事35結(jié)論:性別和藥物的回歸系數(shù)都均有統(tǒng)計意義。說明女性或用新藥的療效較優(yōu)。用Logistic模型方程對個體的療效做預(yù)測 :設(shè)如女性病人,x1=1,用新藥x2=1,有效的概率p=0.79如男性病人x1=0,用新藥x2=1, 有效的概率p=0.4695大城小事36二、Logistic回歸應(yīng)用的注意事項1.模型中
16、自變量的取值 自變量(X)可為計量數(shù)據(jù)、分類數(shù)據(jù)和等級數(shù)據(jù)。 計量數(shù)據(jù)常重新劃為有序組段,OR的實際意義較大。 例:年齡(歲,x1) 大城小事37數(shù)據(jù)的幾種賦值形式1)兩分類變量,賦值為:有=1,無=02)有序變量,賦值;無=0,少=1,中=2,多=3 例;年齡 45=1 45-54=2 55-64=3 65=43.)多分類無序變量:賦值為:啞變量(dummy variable)形式見例:注:變量取值不同,方程的系數(shù)和符號將發(fā)生變化。大城小事38表16-2 冠心病8個可能的危險因素與賦值(講義262頁) 因素變量名賦值說明年齡(歲)X145=1, 4554=2, 5564=3, 65=4高血壓
17、史X2無=0, 有=1高血壓家族史X3無=0, 有=1吸煙X4不吸=0, 吸=1大城小事39表16-9 年齡(X)化為啞變量的賦值年齡(歲)有序變量啞變量(方法一)X水平D1D2D3 ChiSq Deviance 1 3.4202 0.0644 Pearson 1 3.4218 0.0643大城小事464.多分類的Logistic回歸Logistic回歸可處理: 1)應(yīng)變量(Y)為有序的多分類資料如結(jié)果為:治愈、顯效、好轉(zhuǎn)、無效 2)應(yīng)變量(Y)為無序的多分類資料例: 研究闌尾炎類型與危險因素關(guān)系闌尾炎類型有:卡他型、壞疽型、腹膜炎型多分類Logistic回歸方法(略)大城小事47結(jié)果的表達(dá)一
18、般logistic 回歸分析報告內(nèi)容:1.危險因素的回歸系數(shù)及標(biāo)準(zhǔn)誤、p值2.標(biāo)準(zhǔn)化的回歸系數(shù)。3.危險因素對應(yīng)的OR和可信區(qū)間4.Logistic回歸方程講義264頁大城小事48本節(jié)重點掌握內(nèi)容和作業(yè)一、問答題1.Logistic回歸與線性回歸有什么不同?2. Logistic回歸可解決哪些問題?3.自變量可以有哪些類型,應(yīng)用時應(yīng)如何賦值?4. Logistic回歸中的含義和方程的表達(dá)。二、計算分析題的第2題的第(1)題。大城小事49大城小事50Logistic regressionLogistic回歸大城小事51 第一節(jié).非條件logistic回歸第二節(jié).條件logistic回歸第三節(jié).
19、應(yīng)用及其注意事項大城小事52 醫(yī)學(xué)研究中常碰到應(yīng)變量的可能取值僅有兩個(即二分類變量),如發(fā)病與未發(fā)病、陽性與陰性、死亡與生存、治愈與未治愈、暴露與未暴露等,顯然這類資料不滿足多重回歸的條件 什么情況下采用Logistic回歸大城小事53 Brown(1980)在術(shù)前檢查了53例前列腺癌患者,擬用年齡(AGE)、酸性磷酸酯酶(ACID)兩個連續(xù)型的變量,X射線(X_RAY)、術(shù)前探針活檢病理分級(GRADE)、直腸指檢腫瘤的大小與位置(STAGE)三個分類變量與手術(shù)探查結(jié)果變量NODES(1、0分別表示癌癥的淋巴結(jié)轉(zhuǎn)移與未轉(zhuǎn)移 )建立淋巴結(jié)轉(zhuǎn)移的預(yù)報模型。實例大城小事5453例接受手術(shù)的前列腺
20、癌患者情況 大城小事5526例冠心病病人和28例對照者進(jìn)行病例對照研究 大城小事5626例冠心病病人和28例對照者進(jìn)行病例對照研究 大城小事57一、logistic回歸模型 大城小事58概率預(yù)報模型 大城小事59二、模型的參數(shù)估計 Logistic回歸參數(shù)的估計通常采用最大似然法(maximum likelihood,ML)。最大似然法的基本思想是先建立似然函數(shù)與對數(shù)似然函數(shù),再通過使對數(shù)似然函數(shù)最大求解相應(yīng)的參數(shù)值,所得到的估計值稱為參數(shù)的最大似然估計值。 大城小事60參數(shù)估計的公式 大城小事61三、回歸參數(shù)的假設(shè)檢驗 大城小事62優(yōu)勢比及其可信區(qū)間 大城小事63標(biāo)準(zhǔn)化回歸參數(shù)大城小事64P
21、262表16-3資料計算的SAS程序大城小事65 The LOGISTIC ProcedureAnalysis of Maximum Likelihood Estimates大城小事66 預(yù)報模型大城小事67四、回歸參數(shù)的意義 當(dāng)只有一個自變量時,以相應(yīng)的預(yù)報概率為縱軸,自變量 為橫軸,可繪制出一條S形曲線?;貧w參數(shù)的正負(fù)符號與絕對值大小,分別決定了S形曲線的形狀與方向 大城小事68大城小事69大城小事70五、整個回歸模型的假設(shè)檢驗 大城小事71似然比檢驗(likelihood ratio test)大城小事72六、logistic逐步回歸(變量篩選)MODEL語句加入選項“ SELECTION=STEPWISE SLE=0.10 SLS=0.10;”常采用似然比檢驗:決定自變量是否引入或剔除。大城小事73模型中有X5、X6、X8,看是否引入X1模型含X5、X6、X8的模型的負(fù)二倍對數(shù)似然為: 50.402模型含X1、X5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 8.3 撒哈拉以南的非洲(同步練習(xí))(原卷版)
- 【社招】2025年江西省供銷集團總部及直屬單位公開招聘19人高頻重點提升(共500題)附帶答案詳解
- 2025黑龍江齊齊哈爾市事業(yè)單位招聘116人歷年高頻重點提升(共500題)附帶答案詳解
- 2025黑龍江哈爾濱香坊區(qū)選調(diào)行政機關(guān)人員和鄉(xiāng)鎮(zhèn)副職15人歷年高頻重點提升(共500題)附帶答案詳解
- 2025黑龍江佳木斯佳和投資限公司招聘3人高頻重點提升(共500題)附帶答案詳解
- 2025陜西西安財金投資管理限公司招聘27人高頻重點提升(共500題)附帶答案詳解
- 2025陜西省銅川市綜合類事業(yè)單位招聘266人歷年高頻重點提升(共500題)附帶答案詳解
- 2024童鞋銷售合同范本
- 2025陜西寶雞蟠龍新區(qū)開發(fā)建設(shè)限公司及所屬公司招聘17人高頻重點提升(共500題)附帶答案詳解
- 2025陜煤集團府谷能源開發(fā)限公司招聘95人高頻重點提升(共500題)附帶答案詳解
- 2024年度公務(wù)員勞動合同范本社保福利全面保障3篇
- 2025年內(nèi)蒙古包鋼公司招聘筆試參考題庫含答案解析
- 專題6.8 一次函數(shù)章末測試卷(拔尖卷)(學(xué)生版)八年級數(shù)學(xué)上冊舉一反三系列(蘇科版)
- 教科版科學(xué)一年級上冊期末測試卷含完整答案(必刷)
- 2024年危險化學(xué)品生產(chǎn)單位安全生產(chǎn)管理人員證考試題庫及答案
- 江蘇省宿遷市沭陽縣2023-2024學(xué)年八年級上學(xué)期期末英語試題
- 老年人視覺障礙護理
- 安全隱患大排查大整治專項行動方案
- 藍(lán)軍戰(zhàn)略課件
- 《請柬及邀請函》課件
- 遼寧省普通高中2024-2025學(xué)年高一上學(xué)期12月聯(lián)合考試語文試題(含答案)
評論
0/150
提交評論