logistic族回歸_第1頁
logistic族回歸_第2頁
logistic族回歸_第3頁
logistic族回歸_第4頁
logistic族回歸_第5頁
已閱讀5頁,還剩148頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1122ppYXXX的平均數(shù)1122ppPXXX的平均數(shù)1122ppPXXX的平均數(shù)1PoddsPlnlnlog( )1Poddsit PP1122log ( )ln().1ppPit PXXXP11log ( )lnln()1ppPit PoddsXXPln(x)是以是以e為底的為底的x的的對數(shù)對數(shù)。11lnlogit( ).1ppPPXXP反變換:反變換:求求11exp(.)1ppPXXP11(1)exp(.)ppPPXX1111exp(.)exp(.)ppppPXXPXX1111exp(.)exp(.)ppppPPXXXX1111(1exp(.)exp(.)ppppPXXXX1111ex

2、p(.)1exp(.)ppppXXPXX高等數(shù)學(xué)里高等數(shù)學(xué)里exp指指指數(shù)函數(shù)指數(shù)函數(shù) 例:例:expF(X)是是e的的F(X)次方次方 111111()()()12111logistic()logitppppppXXXXXXpePeeXP上式右端在數(shù)學(xué)上屬于函數(shù)為截距項, 、為 偏 回歸系數(shù),表示 改變一個單位時,的改變量。預(yù)報事件發(fā)生預(yù)報事件發(fā)生(Y=1)的概率的概率 P的計算公式為:的計算公式為:預(yù)報事件不發(fā)生預(yù)報事件不發(fā)生(Y=0)的概率的概率1P的計算公的計算公式為:式為:1 11 1(1/)1ppppxxxxeP yXe1 11(0) 1(1)1p pxxP yP ye 1100/

3、(1)/(1)PPPP暴露人群的優(yōu)勢OR=非暴露人群的優(yōu)勢1100/ (1)55 1643.7089/ (1)19 12895%1111exp()2.0964 6.5616aPPadPPbcORORuabcdOR=的可信區(qū)間:素素0.2478 1.31070.2478 1.3107(1)1xxeP yejX當模型含有多個自變量時,其他自變量固定,增加一個單位后與增加前比較011log ()ln odds =jjppit PXXX0()jX 增加一個單位后,log ( ):jXit P增加一個單位后,的平均改變量為1010log ( )log ()ln()ln()(1)jjjjit Pit Po

4、ddsoddsX111log ()ln odds =(1)ppjjit PXXX1():1221j)相對應(yīng)的優(yōu)勢比為(與的兩個水平同理,與變量CCCCX101010log ()log ()ln()-ln()lnlnjititoddsoddsoddsORodds10joddsOReodds優(yōu)勢比當當Xj的水平增加一個單位時,的水平增加一個單位時,)(12-CCjeORjiORXlnlogit,)的改變量為(引起增加一個單位時某自變量的應(yīng)用OR10jej,則與增加前相比:若1100OR1,joddseoddsoddsodds,即011010,111odds則,0,0,OR1,表明與表明與Xi相應(yīng)的

5、因素為危險因素相應(yīng)的因素為危險因素 (如:該因素使得患病率(如:該因素使得患病率升高)。升高)。110011001100()0OR10OR10OR1jjjjjjORoddseoddsoddseoddsoddseodds的應(yīng)用自變量增加一個單位時若,則,表明該因素為危險因素若,則,表明該因素為保護因素若,則,表明該因素對結(jié)果變量不起作用。注意:與變量的編碼密切相關(guān),編碼不同,含義可能相反注意:與變量的編碼密切相關(guān),編碼不同,含義可能相反ii00011155X0log ()ln=ln,1.0629119128X1log ()ln=ln,1.31071164Pit Pa aPPit PaP 時,()

6、時,()log ()1.0629 1.3107it PX回歸方程為0001111ln()ln=log ()log ()1()=1lnPPORit Pit PPPaaOR eOR (),可解釋為優(yōu)勢比倒數(shù)的對數(shù)值111-1-1-155X1log ()ln=ln,119128X-1log ()ln=ln- ,11640.40750.6554Pit PaPPit PaPa時,()時,(),log ()0.4075+0.6554it PX回歸方程為11111121ln()ln=log ()log ()1()()2 ,lnPPORit Pit PPPaaOReOR()可解釋為優(yōu)勢比平方根的對數(shù)值kee表

7、示增加一個等級時的優(yōu)勢比;表示增加k個等級時的優(yōu)勢比;1(1)aaee( )橫斷面調(diào)查研究中,表示基線狀態(tài)下,個體的患病率;2(1)aaee( )隊列研究,表示基線狀態(tài)下,個體的發(fā)病率;4 1:1(1)0.5aaee( ) 配比病例對照研究中,表示基線狀態(tài)下,病例在研究對象中占一半。3(1)aaee( )成組病例對照研究中,表示基線狀態(tài)下,病例在研究對象中所占比例;l以P1表示暴露者中病例的比例l以P0表示非暴露者中病例的比例acadacacORbdbcbdbd1aPa c0bPbd11ePe 01ePe暴露x=1非暴露x=0病例y=1 P1= P0=對照 1-P1= 1-P0=1ee 1ee

8、11 e 11el故得到似然函數(shù)故得到似然函數(shù)L Ll對L取對數(shù)InLl對對InL分別求分別求的一階偏導(dǎo)的一階偏導(dǎo)l令令0,0InLInL11() () () ()1111abcdeeLeeee( ),()badInIndbcadORebclog( )()baditPxInInxdbc1.96( )SE22200,()( )( )zzSESE1.96()SEe參數(shù)的可信區(qū)間是以參數(shù)的可信區(qū)間是以Wald法計算的,在法計算的,在應(yīng)用可信區(qū)間時也應(yīng)慎重。應(yīng)用可信區(qū)間時也應(yīng)慎重。log/(1),(0.5)/(1)itPPPPXn變量選不進的原因:變量選不進的原因:非線性關(guān)系非線性關(guān)系年齡分組0123

9、40510152025發(fā)生率(%)變量選不進的原因:非線性關(guān)系變量選不進的原因:非線性關(guān)系第一組發(fā)生率第一組發(fā)生率為為0,與第二,與第二組合并組合并FSBFSB與與FSAFSA系數(shù)符號相反,父親孕前吸煙有害,孕系數(shù)符號相反,父親孕前吸煙有害,孕后吸煙有益,顯然荒唐。后吸煙有益,顯然荒唐。系數(shù)絕對值相近,當孕前孕后吸煙等級相同時,系數(shù)絕對值相近,當孕前孕后吸煙等級相同時,作用抵消作用抵消原因:父親吸煙行為改變不大,原因:父親吸煙行為改變不大,F(xiàn)SAFSA與與FSBFSB高度相高度相關(guān),等級相關(guān)系數(shù)為關(guān),等級相關(guān)系數(shù)為0.97680.9768但同時有意義,提示父親吸煙可能是重要變量。但同時有意義,

10、提示父親吸煙可能是重要變量。產(chǎn)生兩個新變量:產(chǎn)生兩個新變量:SMK1=FSA-FSBSMK1=FSA-FSB懷孕前后父親的吸煙行為改變懷孕前后父親的吸煙行為改變SMK2=maxSMK2=max(FSAFSA,F(xiàn)SBFSB)懷孕前后父親的吸煙最大懷孕前后父親的吸煙最大 等級等級將將SMK1、SMK2與與Y作作logistic回歸,回歸,產(chǎn)次無意義產(chǎn)次無意義人工流產(chǎn)次數(shù)越多,低出生體重兒可能性越大(課本人工流產(chǎn)次數(shù)越多,低出生體重兒可能性越大(課本為負系數(shù))為負系數(shù))Log Likelihood = -365.50715P入入=0.10,P出出=0.122log1.28322.2070.53480

11、.54390.69901.44711itPGMAGEGMAGERGZXZLCSMK 3RZG=0(無妊高癥),(無妊高癥), XZLC=0 (無先兆流產(chǎn))(無先兆流產(chǎn))2RGZ=1,XZLC=01RZG=0,XZLC=1smk1=0(父親吸煙無變化)1122logit ppPxxx自變量下標的含義:如自變量下標的含義:如x1011-表示配比號表示配比號0-表示組內(nèi)編號,(病例為表示組內(nèi)編號,(病例為0,對照為,對照為1至至m)1-表示自變量編號(危險因素)表示自變量編號(危險因素)1:1配對設(shè)計數(shù)據(jù)的一般格式假設(shè)有一個自變量為假設(shè)有一個自變量為X,每層中第每層中第1人的自變量記為人的自變量記為

12、X0,第第2人的自變量記為人的自變量記為X1,000000111:1111XXXeee每對中,第 人患病的概率和未患病的概率分別為和010101002:1111XXXeee第 個人患病的概率和未患病的概率分別為和)1 (01)1 (10)1 (01)1 (1000000101101001(1|)11111XXXXXPeeee第 個人患病 同一層中兩者之一患病0111(1|)1pjjjjXXPe第 個人患病 同一層中兩者之一患病自變量擴展到p個回歸回歸稱為非條件前述非匹配資料的回歸回歸稱為條件的左端為條件概率,相應(yīng)logisticlogisticlogisticlogistic的條件概率為人未患

13、病人患病,第第人患病的條件下,恰好在只有211011logpjjjjitPXX 01exp() xi設(shè)第i個配比組,患某病的概率P正比于1 11 1ilogisticlogitippxxx則第 個配比組可建立一個回歸模型P=+tt=mjj=m用 表示配比組患者序號(0,1,2,)用 表示自變量序號( 1,2,)01000itj11(1)(1|1)(1(1(0(1(011exp()imiittmmititttt tpmjijtjPLP YPP YXP YXP YXP YXxx某配比組中有1名為病例的條件下,恰好第一個觀察對象為病例的條件概率是:某配比組中第 人得病某配比組中有 人得病某配比組中有

14、 人得?。?0itj1111exp()npmijijtjLxx4416bcOR 2=7.2, P=0.0073。010,11eePPee1配比組中,暴露者中病例的比例為P,非暴露者中病例的比例為P考慮兩人中一人患病,另一人不患病的情況:(1)兩人均暴露,條件概率為1/2;(2)兩人均未暴露,條件概率為1/2;101001011001(1)(1)(1)1(4)(1)1(1)(1)1PPePPPPePPPPPPe(3)一人暴露,一人為未暴露,則暴露者患病,未暴露者不患病的條件概率為一人暴露,一人為未暴露,則未暴露者患病,暴露者不患病的條件概率為111( ) ( ) () ()2211adcbeLe

15、eln()1ln0=ln,LeccbeLccORebb對 求一階導(dǎo)數(shù):令,得 的最大似然解:ln =-aln2-dln2+c -(c+b)ln(1)Le可見,與常數(shù)項無關(guān),取對數(shù):xP3863. 1logit43863. 1 eOR各變量的定義 方程方程B的似然函數(shù)大于方程的似然函數(shù)大于方程A的似然函數(shù),的似然函數(shù),B優(yōu)。優(yōu)。注:跟多重線性回歸一樣,其回歸系數(shù)意義的解釋都是在注:跟多重線性回歸一樣,其回歸系數(shù)意義的解釋都是在其他自變量保持不變時其他自變量保持不變時必須新建一個變量,必須新建一個變量,time,time=1表示病例,表示病例,time=2表示對照表示對照TIES=BRESLOW

16、for 1:m and TIES=DISCRETE for n:m matching.display the lower and upper confidence limits ui * ptl Crosstabulationui * ptl Crosstabulation86109671.7%8.3%80.0%1592412.5%7.5%20.0%1011912084.2%15.8%100.0%Count% of TotalCount% of TotalCount% of Total01uiTotal01ptlTotalR=0.297smoke * ptl Crosstabulationsm

17、oke * ptl Crosstabulation6657155.0%4.2%59.2%35144929.2%11.7%40.8%1011912084.2%15.8%100.0%Count% of TotalCount% of TotalCount% of Total01smokeTotal01ptlTotalR=0.290(OR95%CI(1.416,3.7.786),P=0.0058)。/(| )logitln( )(| )(| )logitln( )(| )ppppP yxPxxxg xP yxP yxPxxxg xP yx1 01111122112 02211222221020y=1表

18、示表示A類,類,y=2表示表示B類,類,y=0表示表示C類。類。設(shè)設(shè)C類為參照組。類為參照組。 )|0()|2(ln)|0()| 1(ln )|2()|0()|0()| 1(ln)|2()| 1(lnlogit2/1xxxxxxxxxxyPyPyPyPyPyPyPyPyPyPP)()( )()()()( 2121222121121121xxggxxxppp|P yxP yxP yx0121( )( )( )( )( )( )( )( )|gxgxgxgxgxgxgxgxPP yxeeePP yxeeePP yxee1211221201211101217181327142OR718 627 27

19、OR11exp(),.ln 11718 131421 620627 142718OR21exp(),.ln 22718 6273 280627 27718OR出血出血”的影響不同。的影響不同。人流史對宮縮乏力性產(chǎn)人流史對宮縮乏力性產(chǎn)后大出血無影響后大出血無影響(| )(1| )(| )P yjP yP yjxxx (| )logitlogit(| )ln1(| )1,2,1jP yj xPP yj xP yj xjk pjjiiiPP yj xx 1logitlogit(|) 11(|)1exp等價于pjiiiP yj xx 符號為負符號為負111110k(| )(| )(1| )()111

20、e1 e1,2,-+ppji iji iiipjiijixxP yjP yjP yjP axuajkaaxxx定義為,定義為,exp()(b-a)iOR 0.6373logit0.63731.890.89,意義:母親的文化程度提高一個等級時,兒童智力提高一個或一個以上等級的可能性將增加倍jjPxORe 11(| )(-+-+)111e1ejjjjxxP yjP axuaxxP ye 1.4578 0.63731(1)0.10961P yee1.2254 0.63731.4578 0.637311(2)0.533311P yee3.5630 0.63731.2254 0.637311(3)0.3

21、06211P ye 3.5630 0.63731(4)10.05091x=1時 實際頻率,當實際頻率,當X=1時時Y=1的觀察頻率為的觀察頻率為91/857=0.1062433/857=0.5052280/857=0.326753/857=0.0618智力等級:智力等級:y=1:IQ90; y=2:90IQ110; y=3: 110IQ130; y=4:IQ130;入方程。入方程。計算得:OR0/1=e-0.4070=0.6656:與正常體重兒相比,低出生體重兒與正常體重兒相比,低出生體重兒日后智力提高一個或以上等級的可能性分別平均降低日后智力提高一個或以上等級的可能性分別平均降低33% OR

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論