SAS學習系列26.Logistic回歸_第1頁
SAS學習系列26.Logistic回歸_第2頁
SAS學習系列26.Logistic回歸_第3頁
SAS學習系列26.Logistic回歸_第4頁
SAS學習系列26.Logistic回歸_第5頁
已閱讀5頁,還剩26頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

實用標準文檔實用文檔文案大全26.Logistic回歸(一)Logistic回歸一、原理二元或多元線性回歸的因變量都是連續(xù)型變量,若因變量是分類變量(例如:患病與不患?。徊恢匾?、重要、非常重要),就需要用Logistic回歸。Logistic回歸分析可以從統(tǒng)計意義上估計出在其它自變量固定不變的情況下,每個自變量對因變量取某個值的概率的數(shù)值影響大小。Logistic回歸模型有“條件”與“非條件”之分,前者適用于配對病例對照資料的分析,后者適用于隊列研究或非配對的病例-對照研究成組資料的分析。對于二分類因變量,y=1表示事件發(fā)生;y=0表示事件不發(fā)生。事件發(fā)生的條件概率P{y=1|xi}與xi之間是非線性關系,通常是單調的,即隨著xi的增加/減少,P{y=1|xi}也增加/減少。Logistic函數(shù)F(x)=11+該函數(shù)值域在(0,1)之間,x趨于-∞時,F(xiàn)(x)趨于0;x趨于+∞時,F(xiàn)(x)趨于1.正好適合描述概率P{y=1|xi}.例如,某因素x導致患病與否:x在某一水平段內變化時,對患病概率的影響較大;而在x較低或較高時對患病概率影響都不大。記事件發(fā)生的條件概率P{y=1|xi}=pi,則pi=11+e記事件不發(fā)生的條件概率為1-pi=1則在條件xi下,事件發(fā)生概率與事件不發(fā)生概率之比為pi1?p稱為事件的發(fā)生比,簡記為odds.對odds取自然對數(shù)得到lnp上式左邊(對數(shù)發(fā)生比)記為Logit(y),稱為y的Logit變換??梢娮儞Q之后的Logit(y)就可以用線性回歸,計算出回歸系數(shù)α和β值。若分類因變量y與多個自變量xi有關,則變換后Logit(y)可由多元線性回歸:或二、回歸參數(shù)的解釋1.三個名詞發(fā)生比(odds)=事件發(fā)生頻數(shù)事件未發(fā)生頻數(shù)=p例如,事件發(fā)生概率為0.6,不發(fā)生概率為0.4,則發(fā)生比為1.5(發(fā)生比>1,表示事件更可能發(fā)生)。發(fā)生比率(OR)=odds1odds2=p1即主對角線乘積/副對角線乘積,也稱為交叉積比率,優(yōu)勢比。例如,說明:大于1(小于1)的發(fā)生比率,表明事件發(fā)生的可能性會提高(降低),或自變量對事件概率有正(負)的作用;發(fā)生比率為1表示變量對事件概率無作用。相對風險(RR)=p1p2用來進行兩組概率之間的比較。當p1=p2時,相對風險為1,表明兩組在事件發(fā)生方面沒有差別。2.連續(xù)型自變量回歸參數(shù)的解釋截距α:基準發(fā)生比的對數(shù),即當Logistic回歸模型中沒有任何自變量時(除常量外,所有自變量都取0值)所產生的發(fā)生比。由于理解發(fā)生比,比理解對數(shù)發(fā)生比更容易,故將Logistic回歸模型改寫為:odds=p1?p=e若βk>0(βk<0),則eβk>1(eβk<1),即xk每增加一個單位值時發(fā)生比會相應增加(減少);若βk=0,則eβeβk反映了自變量xk增加一個單位時發(fā)生比所變化的倍數(shù),即(xk+1)時的發(fā)生比與原發(fā)生比【(xk)時】之比。自變量xk(e注:由于βk是自變量xk的偏系數(shù)估計,故eβkAOR=e(b?a)3.二分類自變量回歸參數(shù)的解釋二分類變量,例如性別,取值可以用0或1編碼,也稱為標志變量或虛擬變量。若xk為取值0或1的二分類變量,則有兩式作差得可見βk就是在控制其它變量條件下,xk=1與xk=0的對數(shù)發(fā)生比的差;也即是發(fā)生比率的對數(shù),即調整發(fā)生比率的估計可表示為AOR=eβk注意,發(fā)生比率是p1/(1?p4.多分類變量的處理與回歸參數(shù)的解釋當分類自變量多于兩個類別時,需要建立一組虛擬變量來代表類型的歸屬性質。若一個分類變量包括m個類別,則可以產生m個相應的虛擬變量,但建模需要的虛擬變量的數(shù)目為m-1.省略的那個類別作為參照類。例如,年齡是有序變量,按年齡段分為四個類別:x<40,40≤x<50,50≤x<60,x≥60.設置3個虛擬變量Age1表示40≤x<50(屬于該年齡段則Age1=1,否則Age1=0);Age2表示50≤x<60(屬于該年齡段則Age2=1,否則Age2=0);Age3表示x≥60(屬于該年齡段則Age3=1,否則Age3=0);另一個不指定虛擬變量的x<40作為參照類(Age1,Age2,Age3都為0;哪一類作為參照類是隨意的,取決于偏好或解釋的方便)。則模型為同二分類變量時一樣,β1代表40≤x<50與參照類(Age0:x<40)在因變量上的差別,故β1=ln(odds)Age1vsAge0且40≤x<50對x<40的發(fā)生比率為eβ1注:(1)名義變量直接就是分類變量;連續(xù)變量也可以改為分類變量,例如考試成績按分數(shù)段分為高、中、低三檔。(2)另外,也可采用效應變量編碼,三種取值:-1,0(參照類),1.(3)用SAS中CLASS語句指定分類變量,可以自動進行效應編碼,作為一組變量納入模型,并對每一類別單獨做顯著性檢驗。5.用概率解釋自變量的作用(1)對事件發(fā)生概率的偏作用,可用Logit函數(shù)求該自變量的偏導數(shù)來刻畫:其中p為事件發(fā)生概率。對于二元Logistic回歸,p=0.5時,斜率最陡,此時x=-α/β,稱為中位有效水平。(2)利用得到的Logistic回歸方程,可以預測概率:有預測概率就可以計算某自變量值發(fā)生離散變化時,預測概率的離散變化:三、標準化系數(shù)通常在線性回歸模型中的連續(xù)型自變量是以不同尺度度量的,這就使得某自變量中一個單位的變化并不等價于另一自變量上一個單位的變化。因此,要使用標準化系數(shù)(使得因變量的作用具有可比性)。標準化系數(shù)表示自變量的一個標準差的變化所導致的因變量上以其標準差為單位度量的變化。有兩種標準化的方法:(1)先回歸再標準化;(2)先標準化x,y再回歸;注:對于分類變量,例如性別、民族等,變量的標準化是沒有意義的。但其尺度標準要一致,比如0,1,2,3都變成1,2,3,4.四、偏相關偏相關,用來刻畫在控制其他變量下,某自變量對Logistic回歸的貢獻(依賴于其它變量)。偏相關系數(shù)計算公式如下:其中,d.f.為自由度,分母為-2倍的截距模型(只有截距)的對數(shù)似然值。五、回歸參數(shù)的估計Logistic回歸參數(shù)的估計通常采用最大似然法,其基本思想是先建立似然函數(shù)與對數(shù)似然函數(shù),再通過使對數(shù)似然函數(shù)最大求解相應的參數(shù)值,所得到的估計值稱為參數(shù)的最大似然估計值。假設有N個案例構成的總體,Y1,…,YN.從中隨機抽取n個案例作為樣本,觀測值標注為y1,…,yn.設pi=P(yi=1|xi)為給定xi的條件下得到結果yi=1的條件概率,而在同樣條件下得到結果為yi=0的條件概率為P(yi=0|xi)=1-pi.于是,得到一個觀測值的概率為其中,yi=1或yi=0.當yi=1時,P(yi)=pi=P(yi=1|xi).由于各項觀測相互獨立,故它們的聯(lián)合分布可表示為各邊際分布的乘積:稱為n個觀測的似然函數(shù)。對于Logistic回歸,.根據(jù)最大似然原理,估計參數(shù)α和β使得似然函數(shù)L(θ)最大,令稱為對數(shù)似然函數(shù),也即讓ln[L(θ)]最大。令采用牛頓迭代法解出α和β的估計值。六、假設檢驗1.似然比檢驗H0:β1=β2=…=βp=0統(tǒng)計量服從自由度為變量個數(shù)該變量(從L0到L1)的卡方分布。若P值<0.05,則拒絕原假設。2.比分檢驗以未包含某個或幾個變量的模型為基礎,保留模型中參數(shù)的估計值,并假設新增加的參數(shù)為零,計算似然函數(shù)的一價偏導數(shù)(也稱“有效比分”)及信息距陣,兩者相乘便得比分檢驗的統(tǒng)計量S.樣本量較大時,S近似服從自由度為待檢驗因素個數(shù)的分布。3.Wald檢驗即廣義的T檢驗,統(tǒng)計量為其中為的標準誤。H0:βk=0為真時,Z為標準正態(tài)分布,W服從自由度為1的漸近分布。βk的95%置信區(qū)間估計為:.發(fā)生比率的1-α置信區(qū)間為:.注:上述三種方法中,似然比檢驗最可靠,比分檢驗一般與它相一致,但兩者均要求較大的計算量;而Wald檢驗未考慮各因素間的綜合作用,在因素間有共線性時結果不如其它兩者可靠。為計算方便,通常向前選取變量用似然比或比分檢驗,而向后剔除變量常用Wald檢驗。七、模型的評價——擬合優(yōu)度檢驗檢查模型估計與實際數(shù)據(jù)的符合情況。檢驗統(tǒng)計量:1.剩余差D;2.皮爾遜χ2若統(tǒng)計量的P值>0.05,則認為模型擬合較好。(二)PROCLOGISTIC過程步基本語法:PROCLOGISTICdata=數(shù)據(jù)集<可選項>;CLASS分類變量;FREQ頻數(shù)變量;<WEIGHT權重變量;><EFFECT效應名=效應類型(變量列表</可選項>);>MODEL因變量<(變量選項)>=自變量列表</可選項>;<EXACT變量列表;><CONTRAST’label’分類變量名線性組合系數(shù)表;><ODDSRATIO<’label’>variable</options>;><OUTPUTOUT=輸出數(shù)據(jù)集</可選項>;><ROC<’label’><變量></可選項>;><SCOREOUT=輸出數(shù)據(jù)集<可選項>;><TEST系數(shù)關系式;>注:CLASS,EFFECT語句必須在MODEL語句之前;CONTRAST,EXACT,ROC語句必須在MODEL語句之后。說明:(1)輸入數(shù)據(jù)集可選項DESCENDING——指定因變量按降序排序(“y=1”放前面);ORDER=——指定因變量的排序順序;PLOT——繪圖選項;(2)EFFECT語句用原變量數(shù)據(jù)創(chuàng)建某種效應設計矩陣做對比用,例如LAG效應等。(3)CLASS語句對分類變量進行0-1化處理,變成虛擬變量;(4)MODEL語句是必不可少的,用來指定因變量和自變量。可以用可選項指定“y=1”,例如:modelremiss(event='1')=cellsmearinfilliblasttemp;可選項:selection=stepwise/forward/backwardsle或sls——指定變量進入或剔除出模型的顯著水平;Aggregate和scale=n|p|d計算偏差和pearson卡方擬和優(yōu)度統(tǒng)計量,n表示對離差參數(shù)不進行校正;p規(guī)定離差參數(shù)的估計為pearson卡方統(tǒng)計量除以自由度;d規(guī)定離差參數(shù)的估計為偏差除以自由度;alpha=——設置置信限;cl/clparm=WALD——估計所有參數(shù)/WALD參數(shù)的置信區(qū)間;plrl——對自變量估計比數(shù)比的置信區(qū)間;influence——做回歸診斷;RSQUARE——輸出擬合的調整的R2;EFFECTPLOT——輸出模型擬合統(tǒng)計量;(5)ESTIMATE語句——用來估計效應變量的線性組合的值;(6)EXACT語句用其它變量的充分統(tǒng)計量對變量的充分統(tǒng)計量做精確檢驗;(7)CONTRAST語句用來檢驗均值的線性組合關系的原假設。有三個基本參數(shù),一是標簽,二是分類變量名,三是效應均值線性組合的系數(shù)表(系數(shù)的次序是匹配分類變量按字母數(shù)字次序的水平值)。示例:contrast'USvsNON-U.S.'brand11-2;檢驗H0:β1+β2-2β3=0(8)ROC語句——繪制ROC曲線;(9)SCORE語句——輸出若干結果到數(shù)據(jù)集。(10)TEST語句對系數(shù)關系式做檢驗,示例:(ai為自變量名)test1:testintercept+.5*a2=0;test2:testintercept+.5*a2;test3:testa1=a2=a3;test4:testa1=a2,a2=a3;例1不同治療方法對某病療效的影響研究:用Logistic回歸模型P{effect=1|treat}=eα+βtreatLogit(p)=ln(p1?p)=α+β代碼:dataeffects;inputtreateffectcount;cards;1116104821402020;proclogisticdata=effectsDESCENDING;freqcount;modeleffect=treat;/*或者用modeleffect(event='1')=treat;前面就可以不用DESCENDING選項了*/run;運行結果及說明:響應概況有序

值effect總頻數(shù)11562068建模的概率為effect=1。模型收斂狀態(tài)滿足收斂準則(GCONV=1E-8)。模型擬合統(tǒng)計量準則僅截距截距和協(xié)變量AIC172.737152.361SC175.558158.001-2L170.737148.361檢驗全局零假設:BETA=0檢驗卡方自由度Pr

>

卡方似然比22.37681<.0001評分21.70871<.0001Wald20.27621<.0001假設檢驗H0:β1=…=βk=0.似然比檢驗的卡方值=-2lnL0–(-2lnLk)=170.737–148.361=22.3768.自由度為1-0=1(只有截距0個變量,到1個變量),P值<0.0001<α=0.05.故拒絕H0.最大似然估計值分析參數(shù)自由度估計值標準

誤差Wald卡方Pr

>

卡方Intercept1-2.89040.639020.4594<.0001treat11.79180.397920.2762<.0001回歸方程為:Logit(p)=-2.8904+1.7918*treat優(yōu)比估計值效應點估計值95%Wald

置信限treat6.0002.75113.087發(fā)生比率(OR)=6.000.預測概率和觀測響應的關聯(lián)一致部分所占百分比50.4SomersD0.420不一致部分所占百分比8.4Gamma0.714結值百分比41.2Tau-a0.210對3808c0.710例2研究性別、疾病的嚴重程度對疾病療效的影響,得數(shù)據(jù)如下:擬合回歸方程為Logit(p)=α+β1Sex+β2Degree.代碼:dataeffects2;inputsexdegreeeffectcount@@;cards;00121000601190109101810010111411011;run;proclogisticdata=effects2DESCENDING;freqcount;modeleffect=sexdegree/scale=noneaggregate;*模型的擬合優(yōu)度檢驗;outputout=predictpred=prob;*output語句設置輸出結果,這里結果存在predict數(shù)據(jù)中,預測值為prob;run;procprintdata=predict;run;*考慮兩個自變量的交互作用;proclogisticdata=effects2DESCENDING;freqcount;modeleffect=sexdegreesex*degree;run;運行結果:響應概況有序

值effect總頻數(shù)11422036建模的概率為effect=1。模型收斂狀態(tài)滿足收斂準則(GCONV=1E-8)。偏差和Pearson擬合優(yōu)度統(tǒng)計量準則值自由度值/自由度Pr

>

卡方偏差0.214110.21410.6436Pearson0.215510.21550.6425剩余差D和Pearson擬合優(yōu)度檢驗的P值分別為0.6436和0.6425都遠大于0.05,故擬合結果較好可以接受。唯一輪廓數(shù):4模型擬合統(tǒng)計量準則僅截距截距和協(xié)變量AIC109.669101.900SC112.026108.970-2L107.66995.900檢驗全局零假設:BETA=0檢驗卡方自由度Pr

>

卡方似然比11.769420.0028評分11.241020.0036Wald10.064420.0065假設檢驗H0:β1=…=βk=0.似然比檢驗的P值=0.0028<α=0.05.故拒絕H0.最大似然估計值分析參數(shù)自由度估計值標準

誤差Wald卡方Pr

>

卡方Intercept11.15680.40368.21670.0042sex1-1.27700.49806.57500.0103degree1-1.05450.49804.48440.0342擬合回歸方程為:Logit(p)=1.1568-1.2770*Sex–1.0545*Degree優(yōu)比估計值效應點估計值95%Wald

置信限sex0.2790.1050.740degree0.3480.1310.924優(yōu)勢比(OR):男性(Sex=1)治愈與未治愈的比值為:p1/(1-p1)=exp(1.1568-1.2770*1–1.0545*Degree)女性(Sex=0)治愈與未治愈的比值為:p0/(1-p0)=exp(1.1568-1.2770*0–1.0545*Degree)兩個比值的比即優(yōu)勢比為:OR=[p1/(1-p1)]/[p0/(1-p0)]=eβ1=e-1.2770預測概率和觀測響應的關聯(lián)一致部分所占百分比60.0SomersD0.419不一致部分所占百分比18.1Gamma0.536結值百分比21.9Tau-a0.211對1512c0.709Obssexdegreeeffectcount_LEVEL_prob10012110.760752000610.760753011910.525554010910.525555101810.4699961001010.469997111410.2360181101110.23601輸出預測概率。最大似然估計值分析參數(shù)自由度估計值標準

誤差Wald卡方Pr

>

卡方Intercept11.25280.46297.32390.0068sex1-1.47590.66284.95870.0260degree1-1.25280.66073.59540.0579sex*degree10.46431.00120.21510.6428Sex*Degree的卡方檢驗P值=0.6428遠大于其它參數(shù)的P值,故不用考慮該交互作用的影響。例3多分類自變量的虛擬變量處理(CLASS語句將會自動完成自變量的“虛擬變量化”處理過程,因變量不需要用CLASS語句處理),以及對比檢驗(CONTRAST語句)。代碼:datauti;inputdiagnosis:$13.treatment$response$count@@;datalines;complicatedAcured78complicatedAnot28complicatedBcured101complicatedBnot11complicatedCcured68complicatedCnot46uncomplicatedAcured40uncomplicatedAnot5uncomplicatedBcured54uncomplicatedBnot5uncomplicatedCcured34uncomplicatedCnot6;run;odsselectFitStatistics;proclogisticdata=uti;freqcount;classdiagnosistreatment/param=ref;modelresponse=diagnosis|treatment;run;odsselectFitStatisticsGoodnessOfFitTypeIIIOddsRatios;proclogisticdata=uti;freqcount;classdiagnosistreatment;modelresponse=diagnosistreatment/scale=noneaggregate;run;*clodds:計算似然比的置信區(qū)間clparm:計算參數(shù)的置信區(qū)間;odsselectClparmPLCloddsPL;proclogisticdata=uti;freqcount;classdiagnosistreatment;modelresponse=diagnosistreatment/scale=noneaggregateclodds=plclparm=pl;run;*contrast:定制假設檢驗的方式,變量需要是矩陣形式;odsselectContrastTestContrastEstimate;proclogisticdata=uti;freqcount;classdiagnosistreatment/param=ref;modelresponse=diagnosistreatment;contrast'BversusA'treatment-11/estimate=exp;contrast'A'treatment10;contrast'jointtest'treatment10,treatment01;run;運行結果及說明:(部分)偏差和Pearson擬合優(yōu)度統(tǒng)計量準則值自由度值/自由度Pr

>

卡方偏差2.514721.25730.2844Pearson2.757421.37870.25193型效應分析效應自由度Wald卡方Pr

>

卡方diagnosis110.28850.0013treatment224.6219<.0001優(yōu)比估計值效應點估計值95%Wald

置信限diagnosisuncomplicated-complicated0.3820.2120.688treatmentC-A1.7951.0693.011treatmentC-B4.7622.5648.847參數(shù)估計和剖面似然置信區(qū)間參數(shù)

估計值95%置信限Intercept

1.65281.36211.9751diagnosiscomplicated-0.4808-0.7897-0.1987treatmentA-0.1304-0.46180.2052treatmentB0.84560.47561.2523優(yōu)比估計和剖面似然置信區(qū)間效應單位估計值95%置信限diagnosisuncomplicated-complicated1.00000.3820.2060.672treatmentC-A1.00001.7951.0743.031treatmentC-B1.00004.7622.6159.085對比檢驗結果對比自由度Wald卡方Pr

>

卡方BversusA18.69190.0032A14.90200.0268jointtest224.6219<.0001對比估計和逐行檢驗結果對比類型行估計值標準

誤差Alpha置信限Wald卡方Pr

>

卡方BversusAEXP12.65390.87860.051.38705.07788.69190.0032例4自變量連續(xù)有序變量(例如,年齡)的Logistic回歸。代碼:datacoronary;inputsexecgageca@@;datalines;002801042101460114500034010441014811145100380104500149011451004111046001490114610044010480015201148100451105000153111571004601052101541115710047010521015501159100500105400157111601005101055002461116310051010591024801235000530105910257112371005511132002601124310059011370103001247100601113811034012481013211138110361124900133011421103811258101350114301039012591013901143110420126010140011441;run;*selection用于選擇逐步回歸方法,包括forward,backward,stepwiseinclude:設定每個擬合模型中包含model語句中列的因子的個數(shù).units:可以設置自變量每次變化10個單位,計算的調整的發(fā)生比率AOR;proclogisticdata=coronarydescending;modelca=sexecgageecg*ecgage*agesex*ecgsex*ageecg*age/selection=forwardinclude=3detailslackfit;run;proclogisticdescending;modelca=sexecgage;unitsage=10;run;運行結果及說明(部分):最大似然估計值分析參數(shù)自由度估計值標準

誤差Wald卡方Pr

>

卡方Intercept1-5.64181.80619.75720.0018sex11.35640.54646.16160.0131ecg10.87320.38435.16190.0231age10.09290.03517.00030.0081經過篩選之后的3個自變量及截距的估計,回歸方程略。優(yōu)比估計值效應點估計值95%Wald

置信限sex3.8821.33011.330ecg2.3951.1275.086age1.0971.0241.175殘差卡方檢驗卡方自由度Pr

>

卡方2.327750.8022對條目合格的效應分析效應自由度評分卡方Pr

>

卡方ecg*ecg10.37660.5394age*age10.77120.3798sex*ecg10.03520.8513sex*age10.02900.8647ecg*age10.88250.3475上述5個自變量的卡方檢驗P值>α=0.05,故不必加入回歸方程。Hosmer和Lemeshow檢驗的分區(qū)組總計ca=1ca=0觀測值期望值觀測值期望值1821.0266.982811.8076.203832.5955.414833.4254.585844.0743.936965.3833.627945.9753.038875.9912.019876.9811.0210443.7700.23Hosmer和Lemeshow擬合優(yōu)度檢驗卡方自由度Pr

>

卡方4.776680.7812優(yōu)比效應單位估計值age10.00002.531自變量年齡按10歲為單位變化,得到的調整優(yōu)勢比為:AOR=2.531.例5回歸診斷。代碼:datauti2;inputdiagnosis:$13.treatment$responsetrials;datalines;complicatedA78106complicatedB101112complicatedC68114uncomplicatedA4045uncomplicatedB5459uncomplicatedC3440;*INFLUENCE診斷;proclogisticdata=uti2;classdiagnosistreatment/param=ref;modelresponse/trials=diagnosistreatment/influence;run;proclogisticdata=uti2;classdiagnosistreatment/param=ref;modelresponse/trials=diagnosis/scale=noneaggregate=(treatmentdiagnosis)influenceiplots;run;運行結果及說明(略)例6精確檢驗。代碼:dataliver;inputtime$group$status$count@@;datalines;earlyantidotesevere6earlyantidotenot12earlycontrolsevere6earlycontrolnot2delayedantidotesevere3delayedantidotenot4delayedcontrolsevere3delayedcontrolnot0lateantidotesevere5lateantidotenot1latecontrolsevere6latecontrolnot0;*estimate=both,表示對第一個exact語句中指定的變量進行精確點估計.joint,表示對第二個exact中time、group進行聯(lián)合檢驗;proclogisticdescending;freqcount;classtime(ref='early')group(ref='control')/param=ref;modelstatus=timegroup/scale=noneaggregateclparm=wald;exact'Model1'intercepttimegroup/estimate=both;exact'JointTest'timegroup/joint;run;運行結果(部分):最大似然估計值分析參數(shù)

自由度估計值標準

誤差Wald卡方Pr

>

卡方Intercept

11.41320.79703.14390.0762timedelayed10.70240.83440.70870.3999timelate12.55331.16674.78930.0286groupantidote1-2.21700.87996.34800.0118優(yōu)比估計值效應點估計值95%Wald

置信限timeearly-delayed2.0190.39310.359timeearly-late12.8491.305126.471groupcontrol-antidote0.1090.0190.611參數(shù)估計和Wald置信區(qū)間參數(shù)

估計值95%置信限Intercept

1.4132-0.14892.9754timedelayed0.7024-0.93302.3378timelate2.55330.26664.8400groupantidote-2.2170-3.9417-0.4924例7繪制ROC曲線。ROC曲線是根據(jù)一系列不同的二分類方式(分界值或決定閾),以真陽性率(靈敏度)為縱坐標,假陽性率(1-特異度)為橫坐標繪制的曲線。1.ROC曲線能很容易地查出任意界限值時的對疾病的識別能力。2.選擇最佳的診斷界限值。ROC曲線越靠近左上角,試驗的準確性就越高。最靠近左上角的ROC曲線的點是錯誤最少的最好閾值,其假陽性和假陰性的總數(shù)最少。3.兩種或兩種以上不同診斷試驗對疾病識別能力的比較。在對同一種疾病的兩種或兩種以上診斷方法進行比較時,可將各試驗的ROC曲線繪制到同一坐標中,以直觀地鑒別優(yōu)劣,靠近左上角的ROC曲線所代表的受試者工作最準確。亦可通過分別計算各個試驗的ROC曲線下的面積(AUC)進行比較,哪一種試驗的AUC最大,則哪一種試驗的診斷價值最佳。代碼:dataData1;inputdiseasenage;datalines;0142502035019457185561265171775;odsgraphicson;proclogisticdata=Data1plots(only)=roc(id=obs);modeldisease/n=age/scale=noneclparm=waldclodds=plrsquare;unitsage=10;effectplot;run;odsgraphicsoff;運行結果(部分):偏差和Pearson擬合優(yōu)度統(tǒng)計量準則值自由度值/自由度Pr

>

卡方偏差7.775641.94390.1002Pearson6.602041.65050.1585最大似然估計值分析參數(shù)自由度估計值標準

誤差Wald卡方Pr

>

卡方Intercept1-12.50162.555523.9317<.0001age10.20660.042823.3475<.0001參數(shù)估計和Wald置信區(qū)間參數(shù)估計值95%置信限Intercept-12.5016-17.5104-7.4929age0.20660.12280.2904優(yōu)比估計和剖面似然置信區(qū)間效應單位估計值95%置信限age10.00007.8923.88121.406例8多分類Logistic回歸,也稱廣義Logistic回歸(因變量是多分類有序變量)。代碼:dataschool;lengthProgram$9;inputSchoolProgram$Style$Count@@;datalines;1regularself101regularteam171regularclass261afternoonself51afternoonteam121afternoonclass502regularself212regularteam172regularclass262afternoonself162afternoonteam122afternoonclass363regularself153regularteam153regularclass163afternoonself123afternoon

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論