

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、文案大全二分類Logistic歸模型在對資料進行統(tǒng)計分析時常過到反應變廿為分類變冊的資料.那么.能否用類似于線性回歸的棋型來對這種資料進行分析呢?答案杲肯定的。本章將向大家介紹對二分類因變廿進行回歸廷棋的Logistic回歸棋型。賓節(jié)模型簡介_、棋型入門在很多場合下都能碰到反應變2為二分類的資料.如考索公司中總裁級的領導層中是否有女性職員、某一天是否下雨、某病忠者結局是否痊愈、調査對象是否為某商品的潛在消費者等c對于分類資料的分析相佶大家并不陌生.當要考來的彬響因素較少.且也為分類變廿時,分析者常用列(contingencyTable)形式對這種資料進行整理.并使用檢臉來進行分析,漢存在分類的
2、混雜因素時.還可應用Mantel-Haenszel/2檢驗進行統(tǒng)計學檢臉.這種方法可以很好地控制混雜因素的彬響°但是這種經(jīng)典分析方法也存在局限性,首先.它如然可以控制若干個因素的作用,但無法描述其作用大小及方向.更不能考索各因素間是否存在交互任用;其次.該方法對樣本含冊的要求較大.當控制的分層因素較多時,單元格被劃分的越來越細.列聯(lián)農(nóng)的格子中頻數(shù)可能很小甚至為0,將導致檢驗結果的不可靠。垠后.力'檢驗無法對連續(xù)性自變妒的彬響進行分析,而這將大大限制其應用范田無疑是其致使的缺陷Q那么,能否廷立類似于線性回歸的棋型,對這種數(shù)據(jù)加以分析?以衆(zhòng)簡單的二分類因變廿為例來加以探討.為了討
3、論方便,制定義出現(xiàn)陽性結果時反應變冊取值為1.反之則取值為0o例如當領導層有女性職員、下雨、痊愈時反應變廿y=l.而沒有女性職員、未下雨、未痊愈時反應變甘)丿=0。記出現(xiàn)陽性結果的頻率為反應變廿P(y=l)。首先.回顧一下標準的線性回歸棋型:丫"+貼+0”凡如果對分類變冊宜接擬合.則實質上擬合的是發(fā)生概率.勢照前面線性回歸方程很自然d電會恕到是否可以建立下面形式的回歸棋型.:尸"+0內(nèi)+0”凡顯然.該棋型可以描述當各自變妒變化時.因變廿的發(fā)生概率會怎樣變化.可以滿足分析的基本要求。實際上.統(tǒng)計學家們衆(zhòng)早也在朝這一方向努力,并考慮到衆(zhòng)小二來法擬合時過到的各種問題.對計算方法進
4、行了改進.衆(zhòng)終提出了加權垠小二乘法來對該棋型進行擬合.至今這種分析忠路還偶有應用。既然可以使用加權衆(zhòng)小二乘法對棋型加以估計.為什么現(xiàn)在又放棄了這種做法呢?原因在于有以下兩個問題是這種分析忠路所無法解決的:(1) 取值區(qū)間:上述棋型右側的取值范田.或者說應用上述棋型進行預報的范田為整個實數(shù);_s,+s).而棋型的左邊的取值范®0<P<lt二者并不相符°棋型本身不能保證在自變冊的各種組合下因變廿的估計值仍限制在01內(nèi).因此可能分析者會W到這種荒唐的結論:男性、30歲、病Wr較輕的忠含披治愈的槪率A300%!研究者當然可以將此結果等價于100%可以治愈,但是從數(shù)理統(tǒng)計
5、的用度講.這種棋型顯然是極不嚴謹?shù)腝(2) 曲線關聯(lián):根據(jù)大冊的觀來.反應變妒P與自變妒的關系通常不是宜線關系而ASSZ曲線關系。這里以收入水平和購車概率的關系來加以說明,當收入非朋低時.收入的增加對購買概率彩響很小;但繪在收入達到某一閾值時.購買概率會隨肴收入的土曾加而迅迪增加;在購買概率達到一定水平.絕大部分在該收入水平的人都會購車時.收入增加的彬響又會逐漸減網(wǎng)°如果用圖形來農(nóng)示.則如圖1所示°顯然.線性關聯(lián)是線性回歸中至關笙要的一個前提假設,而在上述棋型中這一假設是明顯無法滿足的c圖1S型曲線圖以上問題促使統(tǒng)計學家們不傅不尋求新的解決思路.如同在曲線回歸中.往往采用變
6、妒變換.使W曲線宜線化.然后再進行直線回歸方程的擬合。那么.能否考慮對所預測的因變廿加以變換,以使傅以上矛盾得以解決?基于這一忠恕.又有一大批統(tǒng)計學家在尋找合適的變換函數(shù)°終于.在1970年.Cox弓I入了以前用于人口學領域的Logit變換(LogitTransformation)f成功地解決了上述問題°那么,什么是Logit變換呢?通常的把出現(xiàn)某種結果的概率與不出現(xiàn)的概率之比稱為TTTC比值(odds,國內(nèi)也譯為優(yōu)勢、比數(shù)),HPOdds=,取其對數(shù)兄=ln(Odds)=In01一龍1-7T這就是logit變換c下面來活一下該變換是如何解決上述兩個問惣的.首先是因變冊取值
7、區(qū)間的變化.概率是以0.5為對稱點.分布在01的范田內(nèi)的.而相應的logit(P)的大小為:7T=0logIt(龍)=111(0/1)=-OO龍=0.5logit()=111(0.5/0.5)=07T=llogit(-T)=111(1/0)=+oo顯然.通過變換.Logit(龍)的取值范田詆披擴展為以0為對稱點的整個實數(shù)域,這T史訝在任何自變冊取值下.對兀值的預測均有實際您義。其次.大廿實踐證明.Logit(-T)往往和自更妒呈線性關系.換言之.概率和自變冊間關系的S形曲線往往就苻合logit函數(shù)關系.從而可以通過該變換將曲線直線化°因此,只需要以Logit(/r)為因變姑,廷立包含
8、p個自變妒的logistic回歸棋型如下:loglt(P)=00+0應+PpXp以上BP為logistic回歸棋型。由上式可推得:p=exp(0°+0內(nèi)+腫丿_戶=11+exp(0°+0內(nèi)+ppxp)1+exp(0°+0內(nèi)+Ppxp)上面三個方程式相互等價。通過大妒的分析實踐,發(fā)現(xiàn)logistic回歸棋型可以很好地滿足對分類數(shù)據(jù)的理棋需求.因此目前它已經(jīng)成為了分類因變廿的標準理棋方法°通過上面的討論.可以很容鳥地理解二分logistic回歸棋型對資料的要求是:(1) 反應變2為二分類的分類變廿或是某爭件的發(fā)生率°(2) 自變廿與Logit()之
9、間為線性關系°(3) 殘差合計為0,且服從二項分布。(4) 各觀測值間相互獨立Q由于因更妒為二分央.所以logistic回歸棋型的誤差應當服從二項分布.而不是正態(tài)分布c因此.該棋型實際上不應當使用以前的垠小二乘法進行彗數(shù)估計.上次均使用衆(zhòng)大似然法來稱決方程的估計和檢驗問題。二、一些念由于使用了log:it變換.Logistic棋型中的彗數(shù)含義略顯復雜.但有很好的實用價值.為此現(xiàn)對一些基本概念加以解釋。1. 優(yōu)勢比如前所述,人們常把出現(xiàn)某種結果的概率與不出現(xiàn)的概率之比稱為比值(odds).PPPodds=o兩個比值之比稱為優(yōu)勢比(oddsRatio.簡稱加)。首先考猱OR的特性:1PP
10、p若Pl>P2,貝!Jodds.=>二=oddsr1_片1-P2pp若PlvP2,貝!Jodds.=<二=oddSr1_片i-app若Pl=P2,貝!Jodds.=一=一匚=odds1_片1-P2顯然.OR扯否大于1可以用作兩種情形下發(fā)生概率大小的比較。2. Logistic回歸系數(shù)的您義從數(shù)學上講,0和多元回歸中系數(shù)的解釋并無不同,代農(nóng)X改變一個單位時logit(/)的平均改變冊,但由于odds的自然對數(shù)即為logit變換.因此Logistic回歸棋型中的系數(shù)和Q?有看宜接的變換關系.使Logistic回歸系數(shù)有更加貼近實際的稱釋.從而電使傅該棋型訝到了廣泛的應用。下面用一
11、個實例加以說明:以4格農(nóng)資料為例其體說明各回歸系數(shù)的您義:農(nóng)14格農(nóng)資料治療方法(treat)治療結果(outcome)合計治愈率治愈(=1)未治愈(=0)新療法(=1)60(a)21(c)8174.07%傳統(tǒng)療法(=0)42(b)27(d)6960.87%合計1024813068.00%該資料如果擬合Logistic回歸棋型.則結果如下(操作步驟詫見后述):Logit(P|outcome=1)=0。+0】xtreat=-0.442+0.608xtreat(1) 常數(shù)項:農(nóng)示自變冊取全為0(稱基線狀態(tài))時,比數(shù)(Y二1與¥=0的概率之比)的自然對數(shù)值,本例中為0o=-0442=ln(
12、42/69)/(27/69)=ln(42/27)=ln(b/d),pp傳統(tǒng)療法組的治愈率與未治愈率之比的自然對數(shù)值。在不同的研究設計中,常數(shù)項的具體含義可能不同,如基線狀態(tài)下個體忠病率、基線個體發(fā)病率、基線狀態(tài)中病例所占比例等.但這些數(shù)值的大小研究者一般并不關心(2) 各自變垠的回歸系數(shù):0,0=1,")農(nóng)示自變冊兀毎改變一個單位.優(yōu)勢比的自然對數(shù)值改變冊.而exp(0J艮pQ?值,農(nóng)示自變廿兀毎變化一個單位.陽性結果出現(xiàn)極率與不出現(xiàn)概率的比值是變化前的相應比值的倍數(shù).即優(yōu)勢比(注您:不是出現(xiàn)陽性結果的槪率為更化前的倍數(shù).即優(yōu)勢比并不等同于相對危險度)。本例中自變冊治療方法的回歸系數(shù)
13、*=0.608,為兩組病人的治愈率與未治愈率之比的對數(shù)值之菱,pphi(60/81)/(21/81)=lii(42/69)/(27/69)=ln(ad/be)o因此,對于四格農(nóng)資料而言,所建立的Logistic回歸棋型也可以寫成:logit(P|outcome=1)=ln(b/d)+ln(ad/be)xtreat=ln(b/d)+n(OR)xtreat由以上關系可知exp(0o)農(nóng)示傳統(tǒng)療法組的治愈率與未治愈之比值門exp(0J則農(nóng)示治療方法増加一個單位.pp將療法從傳統(tǒng)療法改為新療法時.靳療法組病人治愈率與未治愈率之上匕值相對于傳統(tǒng)療法組病人的夕臺愈率與未夕臺愈率上匕值的倍數(shù)°而兩
14、組病人的勺臺愈率之上匕=(60/81)/(42/69)=1.217.并不完全相同。但是.當研究結果出現(xiàn)陽性的概率較小時(一般認為小于0.1,反之當概率大于0.9時亦可).0?值大小和發(fā)生概率之比非常接近.此時可以近似地說一組研究對敦的陽性結果發(fā)生率是另一組研究對農(nóng)發(fā)生率的0?值倍.即用0R值的大小來挖地農(nóng)示相對危險度的大小°三、簡單分析實例SPSS中通過regression棋塊中的BinaryLogistic過程實現(xiàn)結果變冊為二分類的Logistic回歸.下面通過一個實例分析.具體講解相應的操作和結果解釋°例1某醫(yī)師殺望研究病人的年齡(歲)、性另!J(0為女性.1為男性)、
15、心電圖檢驗是否異常(ST段壓低,0為正常、1為輕度異制、2為笙度異席)與忠冠心病是否有關°調用SPSS中的BinaryLogistic過程:圖2Logistic回歸主對話框本例中涉及的對話框界面如圖9.2所示.注您對話框中部有一個以前未出現(xiàn)過的a*b按鈕、用于納入交互作用.只要先將相應變妒選中,然后單擊此按鈕.相應的交互項就會被納入棋型。本例因較為簡單.未用到此功能。性別處為分類變冊,但儀有兩個取值水平.所以可以宜接引入棋型.結果仍然可以被正常解釋°結果如下:首先輸出分析中使用的記錄數(shù)匯總.此處略。農(nóng)2DependentVariableEncodingOriginalVal
16、ueInternalValue未患病0患病1農(nóng)2為因變妒的取值水平編碼,SPSS擬合棋型時默認取值水平髙的為陽性結果.對于本例來講.擬合的棋型是logit(P|y二忠?。?。隨后進行棋型擬合.首先給出的是棋型不含任訶自變冊,而只有常數(shù)項(PP無效棋型)時的輸出結果,標趣為:“Block0:BeginningBlock"。此時的棋型為:log()=0o=0.103,P=exp(0°)l+exp(0°)exp(0.103)“5257l+exp(0103)喉3ClassificationTable<tbObservedPredicted繪否忠冠心病Percentag
17、e忠病CorrectStep0是否忠冠心病未忠病0370忠病041100.0OverallPercentage52.6a.Constantisincludedinth己model.bThecutvalueis500農(nóng)9.3輸出的是棋型中僅含有常數(shù)項(見農(nóng)4)時計算的預測分類結果.SPSS根據(jù)p值是否大于0.5將觀索對敦判斷為是否出現(xiàn)陽性結果.RP是否忠耳病°由于棋型中僅含有席數(shù)項.因此所有人的預測概率均為樣本率估計值P=05257,將所有的觀乘對象均判昕為宼心病°判斷正確率為526軋實際上就是全部研究對象的忠病率11、78=0.5256(細小差別為四舍五入產(chǎn)生)o也就是說.
18、由于當前樣本中大部分人為忠病.因此當棋型中不包含任何自變廿時,樣本中所有觀來對農(nóng)皆被預測為忠病.總的預測準確率為52.6%oVariablesintheEquationBS.EWalddfSig.Exp(B)Step0Constant103.2272051.6511.108農(nóng)4輸出結果中B為棋型中未引入自變妒時制數(shù)項的估計值.S.E為其標準誤.Wald為Wald/21扯對總體回歸系數(shù)是否為0進行統(tǒng)計學檢驗°農(nóng)格中df為其自由度.Sig.相應的P值°此時的己xp(B)為e的0o次方。其實際您義為總體研究對象忠病率與未忠病率的比值°EP1.108=0.5256/0.4
19、744。*5VariablesnotintheEquationScoredfSig.Step0Variablessex6.0211.014ecg7.Ill1.008age7.7341.005OverallStatistics18.5623.000農(nóng)5輸出了當前未引入棋型的變冊的比分檢驗(ScoreTest)結果,其您義為向當前棋型中弓I入某變冊(如sex時).該變冊回歸系數(shù)是否等于0的比分檢驗假設°對于取值水平為二分類的自變冊來說.訝分檢驗的X2值等于由該自變妒與反應變妒構成的四格農(nóng)的Pearson曠o基于無效棋型.現(xiàn)在開始在分析中弓I入自更冊°標趣為“Block1:Met
20、hod二Enter”。*6OmnibusTestsofModelCoefficientsChi-squaredfSig.Step1Step21.1143.000Block21.1143.000Model21.1143.000由于此處尚未涉及變妒篩選的問題.棋型中會同時弓I入三個自變妒.自由度=3,此處的力值為似然比/'值.等于上一步(棋型中只含有常數(shù)項時)的-21og(似然比值)與當前棋型的-21og(似然比值)的差值,參見農(nóng)6o本例Z2=-86.8113-(-107.9257)=21.1144°M7ModelSumaryStep-2LoglikelihoodCox&
21、SnellRSquareNagelkerkeRSquare186.811°.237.316a.Estimationterminatedatiterationnumber5becauseparameterestimateschangedbylessthan.001.農(nóng)7輸出了當前棋型的-21og(似然比值)和兩個偽決定系數(shù)(“偽”,以示與線性回歸棋型中的決定系數(shù)相區(qū)別)Cox&SnellR2NagelkerkeR2Q后兩者從不同瑋度反映了當前棋型中自戀好解釋了反應變妒的變異占反應變妒總變異的比例。但對于Logistic回歸而言.通常肴到的棋型偽決定系數(shù)的大小不像線性回歸棋型中的
22、決定系數(shù)那么大。農(nóng)8ClassificationTable*ObservedPredicted是否患冠心病PercentageCorrect未患病思病Step1是否患冠心病未患病觀病OverallPercentage2510123167.675.671.8a.Thecutvalueis500這是應用弓I入三個自更妒后磁靳擬合的回歸棋型進行預測的分類農(nóng)格.P>0.5判昕為出現(xiàn)陽性結果°可見己經(jīng)出現(xiàn)了披預測為未忠病的研究對農(nóng),此處78例研究對象中共有56(25+31)例判斷正確.總正確率為56/78=71.8%,如農(nóng)8所示。農(nóng)9輸出了棋型中各自變廿的偏回歸系數(shù)及其標準誤、Wald/
23、2.自由度、P值.及(即農(nóng)格衆(zhòng)右側的Exp(B)o由此可以W出結論.男性(sex=l)較女性更容易忠冠心病、心電圖異常程度越高越容易被診昕為冠心病.年齡越大的越容易忠冠心病°由于年齡不可能為0.這也粗出了樣本所觀來的自變妒age取值范田.因此這里的常數(shù)項無實際您義°喉9VariablesintheEquationBS.E.WalddfSig.Exp(B)Steplasex1.3565466.1621.0133.882ecg8733845.16210232.395age.093.0357.00010081.097Constant-5.6421.8069.7571002.004
24、a.Variable(s)enteredonstep1:sex,ecg,age.到此為止,可廷立如下Logistic回歸方程:P(y=)=exp(-5.642一1.356xsex-0.873xecg一0.093xage)1+exp(-5.642一1.356xsex-0.873xecg一0.093xage)或Logif(P)=-5.642-1.356xjex-0.873xecg-0.093xage第二節(jié)分典自36畳的龍義與比較方法一、使用啞變妒的必要性在回歸棋型中,回歸系數(shù)b農(nóng)示其他自變廿不變,x毎改變一個單位時,所預測的y的平均變化妒.當x為連續(xù)性變冊時這樣解釋沒有問題.二分類變冊由于只存在兩
25、個類別間的比較.也可以對系數(shù)傅到很好的解釋.但是當x為多分類更妒時擬合一個回歸系數(shù)就不太合適了.此時需要使用啞變冊(DummyVariable)方式對棋型加以定義.為說明該問題.先弓I入下面的一個實例。例2Hosmer和Lemeshow于1989年研究了低出生體證嬰兒的彬響因素。結果變冊為足否娩出低出生體笙兒(變冊名為LOW,1為低出生體笙.PP嬰兒出生體®<2500gt0為非低出生體笙).考慮的彬響(自變妒)有:產(chǎn)婦妊娠前體笙(1wtt磅)、產(chǎn)婦年齡(age,歲)、產(chǎn)婦在妊娠期間是否吸煙(smoke.0=未吸、1=吸煙)、本次妊娠前早產(chǎn)次數(shù)(ptl,次)、繪否忠有侖血壓(ht
26、.0=未忠.1=忠?。?、子宮對按摩、傕產(chǎn)素等剌澈引起收縮的應激性(ui.0=無、1=有)、妊娠前三個月社區(qū)醫(yī)生隨訪次數(shù)(ftv,次)、種族(race,1=白人,2=熙人.3=其他民族)。本例包含的自變廿種類齊全,有連續(xù)性變冊、二分類、無序多分類變廿°SPSS默認將所有的自變冊均視作連續(xù)性變廿.如本例.不同種族的變廿賦值為1、2、3,但這僅是一個代碼而已,并不您味肴白人、黑人、其他民族間存在大小次序的關系.田并非代農(nóng)產(chǎn)婦娩出低出生體笙兒概率的logit(P)會按此順序線性増加或減少。PP使是有序多分類變曲.如家庚收入分髙、中、低三檔.各類別間的差距也是無法準確衡冊的.按編碼數(shù)值來分析實
27、際上就是強行規(guī)定為等距,這顯然可能引入更大的誤菱°在以上情況時,詆必須將原始的多分類變廿轉化為數(shù)個啞變冊.毎個啞變廿只代農(nóng)某兩個級別或若干個級別間的菱異這樣W到的回歸結果才能有明確而合理的實際您義。圖3Categorical子對話框SPSS提供了Categorical按鈕用于指定無序多分類自變?nèi)缛鐖D3所示,對于取值有n個水平的自更冊X.默認會產(chǎn)生nT個啞更妒X(1),.X(n-l)t此時以第n個水平為彗飆水平.SPSS會在分類變甘編碼矩陣中輸出具體的賦值情況,矩陣中元索均為“0”的那一行農(nóng)示以該自變冊相對應的取值水平作為彗照水平°例如種族race有三個水平.則SPSS會產(chǎn)生
28、兩個啞變妒:*10CategoricalVariablesCodingsFrequencyParametercoding(1)(2)種族白人961.000.000黑人260001.000其他種族67000.000在農(nóng)10中可以肴出.相應的兩個啞更妒含義如下:race(1)=1,白人;0,非白人race(2)=1,黑人;0,非熙人由于兩個啞變冊繪同時使用的,而只有“其他種族”這一類在兩個啞變甘中取值都為0,因此當同時使用時.實際上兩個啞變甘都是以“其他種族”作為參照水平°分別對上述啞變甘的系數(shù)進行估計.就可以分別傅知白人、黑人利參照水平(其他種族)的差異.而這兩個啞變廿的參數(shù)估計值之差
29、就反映了白人和黑人間的差異。例如在本例中如果只分析種族的作用.則衆(zhòng)終的結果彗見農(nóng)11.利其他種族相比.白人低出生體笙的風險較低.而黑人則風險較高但兩者均無統(tǒng)計學您義。如果將白人和黑人相比.則相應的系數(shù)為-0.636-0.209=-0.845,其0R值為exp(-0.845)二043,白人的風險要比黑人小訝多°顯然.這兩個類別之間有無這菱異還需要進行檢驗,而這在農(nóng)11中是無法立接體現(xiàn)的C*11VariablesintheEquationBS.E.WalddfSig.ExpSteprrace4.9222085race(l)-6363483.3451067.529race(2).20947
30、119716571.232Constant-519.2534.2181040.595a.Variable(s)enteredonstep1:race.農(nóng)11的輸出中兩個啞變姑均無統(tǒng)計學您義.如果同一分類變妍的不同啞變妒出現(xiàn)了有些有您義.有些無您義的情形.又該如何處理?首先.結果中會對分類變廿先進行一個總體的檢驗.例如在本例中種族的檢驗其P值為0.085,農(nóng)明從總體上講,種族應當對因變姑無彬響,此時所有的啞變廿都不用卉納入分析了總的檢驗比分項的檢驗更有權威性;如果總的檢驗有差異.而有些啞變妒無統(tǒng)計學您義.則由于啞變甘應當同進同出.原則上仍然應當在棋型中納入所有的啞變冊.以保證啞變冊代農(nóng)含義的正確
31、性°否則.剔除郃分啞變妒將會導致參照水平的變化,從而啞變廿的其體含義電會發(fā)生改變。二、SPSS中預設的啞變廿編碼方式除以上歐認的啞變冊對比方式外,SPSS的Categorical子對話框中還提供了其余幾種對比方式:1Indicator:指示對比°用于指定某一分類變冊的彗班水平°這時計葬出來的參數(shù)0是以該變冊的衆(zhòng)后一個或第一個水平作為勢照水平(取決于下面的R己feznceCategory中選擇的是last還是first)。在本例中.ReferenceCategory均為lasto變妒race以"其他種族”作為參照水平Q2. Simple:簡單對比°
32、;可計葬該分類變冊的各水平與參班水平相比的0(值°對于本例來說,Simple與Indicator選項是一樣的.前提是下面的ReferenceCategory中所選擇的同是last(或first)o3. Difference:菱別對比°分類變妒某個水平與其前面的所有水平平均值進行比較°此法與Helmert法相反.因此電叫JXHelmert法°如2水平與1水平相比:3水平與1、2水平的平均值相比.以此類推。如果在某水平處系數(shù)變小且無統(tǒng)計學您義(P>0.05)t說明該分類變冊對風險率產(chǎn)生的彫響在該水平處達到停滯狀態(tài)°此選擇項一般用于有序的分類變
33、協(xié)。對無序多分類變妒則無實際怠義°4. Helmert:缺爾默特對比°分類變廿某水平與其后面各水平平均值進行比較°如果在某水平系數(shù)土曾大且有統(tǒng)計學息義.說明該分類變妒自該水平超開始對風險率產(chǎn)生彬響。同樣也適用于有序的分央變冊c5. Repeated:磁復對比°分類變訃的各水平與其前面相鄰的水平相比較(笫一水平除外).此時以“前一水平”為參照水平。6. Polynomial:多項式對比°僅用于數(shù)字型的分類變姑o無效假設是假設各水平是等距離的(可以是線性的關系,也可以是立方、四次方的關系)。例如年齡毎增加5歲.娩出低出生體笙兒的危險増加幅度是一樣的
34、.但實際情況常常與之相反,例如在20歲與30歲年齡段.年齡祁增加5歲,所增加的娩出低出生體笙兒的危險肯定是不一樣的.其體情況需要根據(jù)各人的研究課題而定。7. Deviation:離菱對比°除了所規(guī)定的參照水平外,其余毎個水平均與總體水平相比c此時毎個水平的回歸系數(shù)都是相對于,邇體水平而言的改變Tihc對于男P個裁班t水平而言,它的回歸系數(shù)可以通過其他nT個回歸系數(shù)算出來.等于0減去其他幾個水平回歸系數(shù)的代數(shù)和。PP些時n個水平的回歸系數(shù)的代數(shù)利為“0”。三、設JBL啞變冊時要注您的問題1. 彗飆水平衆(zhòng)好要有實際您義.否則將會推動比較的目標。如果將一些難以分類的個體放到一超.然后集其名
35、曰“其他”.此時往往不如逍已知的某個類別其體在與誰進行比較.進而導致啞變冊的回歸系數(shù)難以解釋C因為不同研究樣本中的“其他”往往是不同的.這樣研究結果之間難以相互進行比較。2. 彗飆水平組應有一定的頻數(shù)作保證°如果參照水平頻數(shù)過少.將導致其他與之相對比的水平多數(shù)估計的標準誤增大.進而J1信區(qū)間擴大,耕確度降低。有學者認為.彗照水平組的頻數(shù)應不少于30例或50例°3. 如果不通iXCategoricamsi對分類自變妒產(chǎn)生啞變冊.而是自己通過Compute過程產(chǎn)生,需要注您在逐步回歸篩選自變甘時.啞變冊應該同時進入棋型或者同時退出棋私。4對有序自變冊的分析°一是從專業(yè)
36、出發(fā),如果認為在不同等級對反應變妒的彬響程度是一致的.如文化程度毎增加一個等級.成為某項時尚消或品潛在消費者的比數(shù)(P/(1-P)的自然對數(shù)增加幅度也相同這時可以將該更妒作為連續(xù)性變姑進行處理.這樣W到的棋型也更簡潔.結果的解釋電史方便c當專業(yè)上不能給出以上假設時,則需要先將該有序變好分別以啞變妒利連續(xù)性變妍的方式引入棋型.觀來各啞變妒的回歸系數(shù)間是否存在等級關系,以及對兩個棋型進行似然比檢驗,似然比/2值等于兩個棋型的-21og(L)之差.自由度為兩個棋型中自變冊個數(shù)之差.如果似然比檢驗無統(tǒng)計學您義.且各啞變妒的回歸系數(shù)間存在等級關系,可以將該自變冊作為連續(xù)性變妒引入棋型.否則衆(zhòng)好還是采用啞
37、變妒的方式引入棋%第三予標準化EJ歸系如o回歸棋型的擬合優(yōu)度與多範線性回歸類似.自變訃妒綱(單位)不同.非標準化的logistic回歸系數(shù)不能用于比較各自變冊對爭件發(fā)生概率的貢獻大小°欲研究logistic回歸中各變妒的相對貢獻,要么爭先將各自變冊標準化后卉作回歸分析.要么對logistic回歸系數(shù)進行標準化c我們可以用極大似然估計的回歸系數(shù)乘以該變妒的樣本標準差求訝logistic回歸的標準化回歸系數(shù)Cb;=bjXS®(16)SPSS軟件可以提供回歸系數(shù)及其變廿的樣本標準差.但不能宜接傅到標準化回歸系數(shù)。在標準化系數(shù)問題上要T至慎.應注您標準化的原您是消去不同甘綱的彬響.堵加可比性c對于一些二分類的自變甘.不存在廿綱問題.則不宜作標準化°另外.一般不利用標準化回歸系數(shù)估計優(yōu)努比,因為按標準化回歸系數(shù)所計算的優(yōu)勢比不是變化一個單位.而是變化一個標準菱的優(yōu)努比了。二、回歸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大竹縣竹中中考數(shù)學試卷
- 營養(yǎng)型輸液項目風險識別與評估綜合報告
- 自籌經(jīng)費措施方案
- 喀什非開挖頂管施工方案
- 智能制造與物聯(lián)網(wǎng)(IoT)應用的策略及實施方案
- 新型城鎮(zhèn)化中的農(nóng)村振興與現(xiàn)代農(nóng)業(yè)發(fā)展的策略
- 能源結構優(yōu)化與清潔能源轉型的策略
- 降碳減污擴綠增長的經(jīng)濟學分析
- 文化交流與一帶一路人文合作的推動路徑
- 更大力度穩(wěn)定和擴大就業(yè)的策略及實施路徑
- 多發(fā)傷骨折護理查房
- 中建二測考試題庫及答案
- 2023年軟件評測師《基礎知識》考試題庫(濃縮500題)
- 中建預制構件吊裝安全專項施工方案
- 華東師范大學《外國人文經(jīng)典(下)》2021-2022學年第一學期期末試卷
- 基礎護理及病房管理
- 辦理拆遷事項委托書
- 2023年湖北省生態(tài)環(huán)保有限公司招聘筆試真題
- 2023年新疆事業(yè)單位開展招聘考試真題
- 學校班主任談心制度實施方案
- 2024年《工會法》知識競賽題庫及答案
評論
0/150
提交評論