版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多元線性回歸回歸1第一頁,共八十五頁,編輯于2023年,星期五概念多因素分析是同時(shí)對觀察對象的兩個或兩個以上的變量進(jìn)行分析。常用的統(tǒng)計(jì)分析方法有:多元線性回歸、Logistic回歸、COX比例風(fēng)險(xiǎn)回歸模型、因子分析、主成分分析等。2第二頁,共八十五頁,編輯于2023年,星期五多變量資料數(shù)據(jù)格式例號X1X2…XpY1X11X12…X1pY12X21X22…X2pY2┆┆┆…┆┆nXn1Xn2…XnpYnY為定量變量——LinearRegressionY為二項(xiàng)分類變量——BinaryLogisticRegressionY為多項(xiàng)分類變量——MultinomialLogisticRegressionY為有序分類變量——OrdinalLogisticRegressionY為生存時(shí)間與生存結(jié)局——CoxRegression3第三頁,共八十五頁,編輯于2023年,星期五
(1)因素篩選:例如影響高血壓的諸多因素中:
1)哪些是主要因素?
2)各因素的作用大???(2)控制混雜因素(3)提高回歸方程的估計(jì)精度多因素分析只有一個自變量的單因素回歸更能縮小應(yīng)變量Y對其估計(jì)值的離差,在預(yù)測和統(tǒng)計(jì)控制方面應(yīng)用的效果更好。多因素回歸分析主要用途:4第四頁,共八十五頁,編輯于2023年,星期五Y,X——直線回歸Y,X1,X2,…Xm——多元回歸(多重回歸)一、多元線性回歸
(multiplelinearregressoin)例:欲研究血壓受年齡、性別、體重、性格、職業(yè)(體力勞動或腦力勞動)、飲食、吸煙、血脂水平等因素的影響。5第五頁,共八十五頁,編輯于2023年,星期五β0為回歸方程的常數(shù)項(xiàng)(constant),表示各自變量均為0時(shí)y的平均值;m為自變量的個數(shù);β1、β2、βm為偏回歸系數(shù)(Partialregressioncoefficient)意義:如β1
表示在X2、X3……Xm固定條件下,X1每增減一個單位對Y的效應(yīng)(Y增減β個單位)。e為去除m個自變量對Y影響后的隨機(jī)誤差,稱殘差(residual)。多元回歸方程的一般形式(一)多元回歸模型6第六頁,共八十五頁,編輯于2023年,星期五
為y的估計(jì)值或預(yù)測值(predictedvalue);
b0為回歸方程的常數(shù)項(xiàng)(constant),表示各自變量均為0時(shí)y的估計(jì)值;由樣本估計(jì)而得的多元回歸方程:b1、b2、bm為偏回歸系數(shù)(Partialregressioncoefficient)意義:如b1
表示在X2、X3……Xm固定條件下,X1每增減一個單位對Y的效應(yīng)(Y增減b個單位)。7第七頁,共八十五頁,編輯于2023年,星期五適用條件:線性(linear)、獨(dú)立性(independent)、正態(tài)性(normal)、方差齊性(equalvariance)——“LINE”。線性——自變量與應(yīng)變量的關(guān)系是線性的。用散點(diǎn)圖判斷。獨(dú)立性——任意兩個觀察值互相獨(dú)立。常利用專業(yè)知識判斷。正態(tài)性——就自變量的任何一個線性組合,應(yīng)變量y均服從正態(tài)分布。即要求殘差服從正態(tài)分布。常用殘差圖分析。方差齊性——就自變量的任何一個線性組合,應(yīng)變量y的方差均相同。即要求殘差的方差齊性。用散點(diǎn)圖或殘差圖判斷。8第八頁,共八十五頁,編輯于2023年,星期五(1)用各變量的數(shù)據(jù)建立回歸方程(2)對總的方程進(jìn)行假設(shè)檢驗(yàn)(3)當(dāng)總的方程有顯著性意義時(shí),應(yīng)對每個自變量的偏回歸系數(shù)再進(jìn)行假設(shè)檢驗(yàn),若某個自變量的偏回歸系數(shù)無顯著性,則應(yīng)把該變量剔除,重新建立不包含該變量的多元回歸方程。(二)多元回歸分析步驟對新建立的多元回歸方程及偏回歸系數(shù)按上述程序進(jìn)行檢驗(yàn),直到余下的偏回歸系數(shù)都具有統(tǒng)計(jì)意義為止。最后得到最優(yōu)方程。9第九頁,共八十五頁,編輯于2023年,星期五例127名糖尿病人的血清總膽固醇、甘油三脂、空腹胰島素、糖化血紅蛋白、空腹血糖的測量值列于表1中,試建立血糖與其它幾項(xiàng)指標(biāo)關(guān)系的多元線性回歸方程。表127名糖尿病人的血糖及有關(guān)變量的測量結(jié)果序號i總膽固醇甘油三脂胰島素糖化血血
糖(mmol/L)(mmol/L)(μU/ml)紅蛋白(%)(mmol/L)X1X2X3X4Y15.681.904.538.211.223.791.647.326.98.836.023.566.9510.812.3………………265.840.928.616.413.3273.841.206.459.610.410第十頁,共八十五頁,編輯于2023年,星期五由上表得到如下多元線性回歸方程:1、建立回歸方程11第十一頁,共八十五頁,編輯于2023年,星期五2、回歸方程的假設(shè)檢驗(yàn)——F檢驗(yàn)結(jié)果無顯著性
1)表明所觀察的自變量與應(yīng)變量不存在線性回歸關(guān)系;
2)也可能由于樣本例數(shù)過少;結(jié)果有顯著性表明至少有一個自變量與應(yīng)變量之間存在線性回歸關(guān)系。H0:β1=β2=…=βm=0H1:β1、β2、…βm不等于0或不全等于012第十二頁,共八十五頁,編輯于2023年,星期五13第十三頁,共八十五頁,編輯于2023年,星期五3、各個偏回歸系數(shù)的假設(shè)檢驗(yàn)——t檢驗(yàn)將總膽固醇(X1)
剔除。
注意:通常每次只剔除關(guān)系最弱的一個因素。
對于同一資料,不同自變量的t值可以相互比較,t的絕對值越大,或P越小,說明該自變量對Y所起的作用越大。14第十四頁,共八十五頁,編輯于2023年,星期五重新建立不包含提出因素的回歸方程注意:表中偏回歸系數(shù)已變化。15第十五頁,共八十五頁,編輯于2023年,星期五對新建立的回歸方程進(jìn)行檢驗(yàn)檢驗(yàn)結(jié)果有顯著性意義。16第十六頁,共八十五頁,編輯于2023年,星期五對新方程的偏回歸系數(shù)進(jìn)行檢驗(yàn)檢驗(yàn)結(jié)果均有意義,因此回歸方程保留甘油三酯(X2)、胰島素(X3)和糖化血紅蛋白(X4)三個因素。最后獲得回歸方程為:17第十七頁,共八十五頁,編輯于2023年,星期五1、確定系數(shù)(R2):意義:在y的總變異中,由x變量組建立的線性回歸方程所能解釋的比例。0~1,越大越優(yōu)。特點(diǎn):R2是隨自變量的增加而增大。因此,在相近的情況下,以包含的自變量少者為優(yōu)。(三)回歸方程的評價(jià)2、R——復(fù)相關(guān)系數(shù)(multiplecorrelationcoefficient)表示m個自變量共同對應(yīng)變量線性相關(guān)的密切程度。0≤R≤1。即Y與的相關(guān)系數(shù)。18第十八頁,共八十五頁,編輯于2023年,星期五
3、校正確定系數(shù)(adjustedR-square,R2a
)越大越優(yōu)。R2a不會隨無意義的自變量增加而增大。是衡量方程優(yōu)劣的常用指標(biāo)。
校正確定系數(shù)的計(jì)算:p為方程中包含的自變量個數(shù),p≤m。R2一定時(shí),p↑→R2
a↓19第十九頁,共八十五頁,編輯于2023年,星期五20第二十頁,共八十五頁,編輯于2023年,星期五(四)自變量的篩選基本思路:盡可能將回歸效果顯著的自變量選入方程中,作用不顯著的自變量排除在外。(1)全局擇優(yōu)法(allpossiblesubsetsselection):(2)逐步選擇法前進(jìn)法(Forwardselection)后退法(Backwardelimination)逐步法(Stepwise)21第二十一頁,共八十五頁,編輯于2023年,星期五1、全局擇優(yōu)法(最優(yōu)子集回歸)
(allpossiblesubsetsselection):有m個自變量就有2m-1個自變量子集。在各子集中選擇最優(yōu)的回歸方程。僅適用于自變量個數(shù)不太多的情況。22第二十二頁,共八十五頁,編輯于2023年,星期五2、向前篩選法(Forwardselection):事先給定一個入選標(biāo)準(zhǔn),即(通常=0.05),然后根據(jù)各因素偏回歸平方和從大到小,依次逐個引入回歸方程至無顯著性自變量可以入選為止,因素一旦入選便始終保留在方程中而不被剔除。局限性:后續(xù)變量的引入可能會使先進(jìn)入方程的變量變得不重要。23第二十三頁,共八十五頁,編輯于2023年,星期五3、向后剔除法(Backwardelimination)首先建立全部自變量的全回歸方程,給定剔除標(biāo)準(zhǔn),根據(jù)各因素偏回歸平方和從小到大,依次逐個將無顯著性的自變量從回歸方程中剔除。優(yōu)點(diǎn):考慮到了自變量的組合作用,選中的自變量數(shù)目一般會比前進(jìn)法選中的多。缺點(diǎn):當(dāng)自變量數(shù)目較多或有某些自變量高度相關(guān)時(shí),可能得不出正確的結(jié)果。24第二十四頁,共八十五頁,編輯于2023年,星期五4、逐步法(Stepwise):給出入選標(biāo)準(zhǔn)(通常1=0.05)和剔除標(biāo)準(zhǔn)(通常2=0.10),每次選入一個在方程外且最具統(tǒng)計(jì)學(xué)意義的自變量后,就對原在方程中的自變量做剔除檢驗(yàn),這個過程逐步進(jìn)行,直到?jīng)]有有統(tǒng)計(jì)意義的自變量可以入選,也沒有無統(tǒng)計(jì)學(xué)意義的自變量保留在方程中為止。實(shí)際工作中,多采用逐步法。用上述方法對上例資料進(jìn)行分析。25第二十五頁,共八十五頁,編輯于2023年,星期五
(六)應(yīng)用多元線性回歸分析時(shí)需注意的事項(xiàng)
(1)樣本量要求:無精確的計(jì)算公式。據(jù)經(jīng)驗(yàn),樣本量應(yīng)是自變量數(shù)的5~10倍以上。(2)做預(yù)報(bào)時(shí),只能在自變量X的觀察值范圍內(nèi)進(jìn)行;(3)在資料要求上,應(yīng)變量Y服從正態(tài)分布;(4)注意資料的特異點(diǎn)(outlier);26第二十六頁,共八十五頁,編輯于2023年,星期五(5)觀測值重新量化問題二項(xiàng)分類資料:用X表示分類變量,陰性為0,陽性為1。有序多項(xiàng)分類資料:用一個X作為分類變量,以自然數(shù)0,1,2,…賦值。如將病情分為輕中重三類時(shí),用X表示病情,賦值方法為:無序多項(xiàng)分類資料:或27第二十七頁,共八十五頁,編輯于2023年,星期五
上述以職員作為對比水平(基礎(chǔ)水平)。啞變量X1、X2、X3分別代表了工人、農(nóng)民、干部與職員相比的系數(shù)。啞變量代表的是同一個變量的不同取值,在分析時(shí)應(yīng)當(dāng)同時(shí)進(jìn)入或移出方程。即使只有部分啞變量有統(tǒng)計(jì)學(xué)意義也是如此。28第二十八頁,共八十五頁,編輯于2023年,星期五(7)自變量的聯(lián)合作用分析若要考慮X3、X4對應(yīng)變量y的聯(lián)合作用,可設(shè)置一個新變量X5=X3X4。若b3、b4和b5都有統(tǒng)計(jì)學(xué)意義,則說明X3、X4對應(yīng)變量既有單獨(dú)作用,又有交互作用。(6)自變量篩選過程中引入和剔除變量時(shí)檢驗(yàn)水準(zhǔn)的確定1)引入變量檢驗(yàn)的水準(zhǔn)小于或等于剔除變量時(shí)檢驗(yàn)的水準(zhǔn)2)通常引入變量檢驗(yàn)的水準(zhǔn)為0.05,剔除變量時(shí)0.10,但不絕對。29第二十九頁,共八十五頁,編輯于2023年,星期五說明X3、X4對應(yīng)變量既有單獨(dú)作用,又有交互作用。即說明糖尿病人體內(nèi)胰島素對血糖的影響依賴于糖化血紅蛋白的含量。30第三十頁,共八十五頁,編輯于2023年,星期五(8)自變量的共線性
當(dāng)自變量之間存在較強(qiáng)的相關(guān)關(guān)系時(shí),稱之為共線性。
后果——偏回歸系數(shù)的估計(jì)值容易失真。當(dāng)多元回歸的分析結(jié)果出現(xiàn)以下情況時(shí)可考慮是否存在自變量共線性:
1)在某個檢驗(yàn)水準(zhǔn)下,整個回歸方程有統(tǒng)計(jì)學(xué)意義,但是每個偏回歸系數(shù)的檢驗(yàn)均無統(tǒng)計(jì)學(xué)意義。
2)偏回歸系數(shù)的符號與醫(yī)學(xué)專業(yè)知識不一致。
3)參數(shù)估計(jì)的標(biāo)準(zhǔn)誤變得很大,使t值變得很小,P值很大。31第三十一頁,共八十五頁,編輯于2023年,星期五判斷方法:利用自變量間的相關(guān)系數(shù)陣。(r>0.9,共線性可能性大)處理方法:最簡單、有效的方法是根據(jù)專業(yè)知識人為去除在專業(yè)上比較次要的、或缺失值較多、測量誤差較大的共線性因子。
32第三十二頁,共八十五頁,編輯于2023年,星期五(9)殘差分析——模型診斷通常以標(biāo)準(zhǔn)化殘差(standardizedresidual)為縱坐標(biāo),以為橫坐標(biāo),作殘差圖。33第三十三頁,共八十五頁,編輯于2023年,星期五34第三十四頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例例1為研究男性高血壓患者血壓與年齡、身高、體重等變量的關(guān)系,隨機(jī)測量了32名40歲以上男性的血壓y、年齡x1、體重指數(shù)x2,試建立多重線性回歸方程。數(shù)據(jù)文件見mreg2.sav。第三十五頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例-初步分析初步分析:與簡單線性回歸相類似,先繪制散點(diǎn)圖,以便在進(jìn)行回歸分析之前了解各變量之間是否存在線性關(guān)系。本例有兩個自變量與一個反應(yīng)變量,繪制散點(diǎn)圖矩陣,如下。第三十六頁,共八十五頁,編輯于2023年,星期五
繪制散點(diǎn)圖矩陣簡單分析實(shí)例-初步分析第三十七頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例第三十八頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例第三十九頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
給出了自變量進(jìn)入模型的方式,此處尚未涉及變量篩選問題,因?yàn)閮蓚€變量是被強(qiáng)行納入模型的(Method為Enter),當(dāng)然就不存在剔除變量的事情了。第四十頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
模型擬合優(yōu)度情況的檢驗(yàn),結(jié)果顯示,復(fù)相關(guān)系數(shù)為0.840,決定系數(shù)為0.706,調(diào)整的決定系數(shù)為0.686,還輸出了剩余標(biāo)準(zhǔn)差。第四十一頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
回歸模型的假設(shè)檢驗(yàn)結(jié)果,顯示F=34.808,P<0.001,說明所建立的回歸模型是有統(tǒng)計(jì)學(xué)意義的,至少有一個自變量的回歸系數(shù)不為0。第四十二頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
給出了模型的常數(shù)項(xiàng)以及兩個自變量的偏回歸系數(shù)及其檢驗(yàn)結(jié)果,可以寫出回歸方程如下:Y=54.798+1.379x1+4.513x2主要結(jié)果第四十三頁,共八十五頁,編輯于2023年,星期五
SPSS結(jié)果中輸出偏回歸系數(shù)的同時(shí),也輸出了各自的標(biāo)準(zhǔn)偏回歸系數(shù)。年齡的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.664,體重指數(shù)的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.247,因此,可以認(rèn)為,年齡對血壓的影響比體重指數(shù)對血壓的影響大。簡單分析實(shí)例結(jié)果分析第四十四頁,共八十五頁,編輯于2023年,星期五例2
仍以例1的資料為例,試作逐步回歸分析。數(shù)據(jù)文件見mreg2.sav。逐步回歸第四十五頁,共八十五頁,編輯于2023年,星期五逐步回歸第四十六頁,共八十五頁,編輯于2023年,星期五逐步回歸第四十七頁,共八十五頁,編輯于2023年,星期五逐步回歸
輸出SPSS在逐步回歸過程中擬合的步驟中,每一步引入模型的變量情況,此處只有一個變量引入。結(jié)果分析第四十八頁,共八十五頁,編輯于2023年,星期五逐步回歸結(jié)果分析
分別輸出擬合的模型中,擬合優(yōu)度情況的檢驗(yàn)結(jié)果:復(fù)相關(guān)系數(shù)、決定系數(shù)、調(diào)整的決定系數(shù)以及剩余標(biāo)準(zhǔn)差。本例只有一步,故結(jié)果很簡單,僅擬合一個模型。第四十九頁,共八十五頁,編輯于2023年,星期五逐步回歸結(jié)果分析
給出各個擬合模型的常數(shù)項(xiàng)以及各自變量的偏回歸系數(shù)、95%可信區(qū)間及其檢驗(yàn)結(jié)果(此處為僅有一步的結(jié)果)。第五十頁,共八十五頁,編輯于2023年,星期五逐步回歸結(jié)果分析
給出擬合模型過程中被剔除的變量情況及其檢驗(yàn)結(jié)果(此處為僅有一步)。第五十一頁,共八十五頁,編輯于2023年,星期五殘差分析非標(biāo)準(zhǔn)化殘差(原始?xì)埐睿?biāo)準(zhǔn)化殘差(Pearson殘差)學(xué)生化殘差剔除殘差學(xué)生化剔除殘差
殘差種類第五十二頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-因變量與自變量之間存在線性關(guān)系的檢驗(yàn)(以例1為例:年齡)第五十三頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-因變量與自變量之間存在線性關(guān)系的檢驗(yàn)(以例1為例:體重指數(shù))第五十四頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-獨(dú)立性的檢驗(yàn)通過LinearRegression過程的statistics按鈕中的Durbin-Watson檢驗(yàn)進(jìn)行判斷。若自變量數(shù)少于4個,統(tǒng)計(jì)量接近2,基本上可以肯定殘差間相互獨(dú)立。仍以例1為例,結(jié)果如下。第五十五頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-方差齊性的檢驗(yàn)第五十六頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-正態(tài)性的檢驗(yàn)繪制殘差的直方圖及PP圖的復(fù)選框第五十七頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-正態(tài)性的檢驗(yàn)結(jié)果第五十八頁,共八十五頁,編輯于2023年,星期五二、Logistic
回歸一、概念
Logistic回歸是一種適用于應(yīng)變量為分類值多因素概率型曲線模型。Y為二項(xiàng)分類:非條件Logistic回歸——成組設(shè)計(jì)條件Logistic回歸——配對設(shè)計(jì)Y為多分類:多分類Logistic回歸59第五十九頁,共八十五頁,編輯于2023年,星期五BinaryLogistic適用于應(yīng)變量為二項(xiàng)分類的資料。應(yīng)變量(Y)在一組自變量(X)的作用下所發(fā)生的結(jié)果賦值規(guī)則為:logistic回歸模型:統(tǒng)計(jì)學(xué)中,把ln(P/Q)稱為P的Logit轉(zhuǎn)換或?qū)?shù)轉(zhuǎn)換,即LogitP。由此得到的回歸方程,稱為Logistic回歸方程。
出現(xiàn)陽性的結(jié)果——1,其概率用P來表示;出現(xiàn)陰性的結(jié)果——0,其概率用Q或(1–P)來表示。60第六十頁,共八十五頁,編輯于2023年,星期五由上式可得:由樣本估計(jì)而得的logistic回歸模型:61第六十一頁,共八十五頁,編輯于2023年,星期五將P/Q稱為比數(shù)(odds,優(yōu)勢、比值);兩個比數(shù)之比稱為比數(shù)比OR(oddsratio,優(yōu)勢比、比值比)。第i個觀察對象的發(fā)病概率比數(shù)(odds)為Pi/Qi,則:第l個觀察對象的發(fā)病概率比數(shù)為Pl/Ql,則:62第六十二頁,共八十五頁,編輯于2023年,星期五則:式中:——同一因素xj的不同暴露水平之差。
bj——在其它自變量固定不變的情況下,xj的水平每增加一個單位時(shí),ln(OR)的改變量,即所引起的比數(shù)比為增加前的ebj倍若Xj賦值為:63第六十三頁,共八十五頁,編輯于2023年,星期五bj=0時(shí),ORj=1,說明因素xj對疾病不起作用;bj>0時(shí),ORj>1,說明xj是一個危險(xiǎn)因素;bj<0時(shí),ORj<1,說明xj是一個保護(hù)因素。對于發(fā)病率很低的慢性?。ㄈ缧哪X血管疾病、惡性腫瘤等),由于P<<1,OR可作為RR的近似估計(jì):所以,logistic回歸常用于流行病學(xué)調(diào)查資料,其優(yōu)點(diǎn)是得到某一因素的回歸系數(shù)估計(jì)值后,就可得到不同水平下相對危險(xiǎn)度的近似估計(jì)值。64第六十四頁,共八十五頁,編輯于2023年,星期五模型的應(yīng)用主要有三個方面:篩選危險(xiǎn)因素:求出各協(xié)變量對應(yīng)變量的比數(shù)比(OR);校正混雜因素:可以很方便地控制混雜因素,得到校正后比數(shù)比的估計(jì)值和置信區(qū)間;預(yù)測與判斷:Logistic回歸模型是概率型模型,在一定條件下能預(yù)測某事件發(fā)生的概率,或估計(jì)各種自變量組合條件下應(yīng)變量的某一類結(jié)果是否發(fā)生。65第六十五頁,共八十五頁,編輯于2023年,星期五例1某醫(yī)師希望研究病人的年齡age、性別sex(0為女性、1為男性)、心電圖檢驗(yàn)是否異常ecg(ST段壓低、0為正常、1為輕度異常、2為重度異常)與冠心病ca是否有關(guān),數(shù)據(jù)見logistic_binary.sav。簡單分析實(shí)例第六十六頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例第六十七頁,共八十五頁,編輯于2023年,星期五選入應(yīng)變量選入自變量簡單分析實(shí)例第六十八頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
此表為應(yīng)變量取值水平編碼,SPSS默認(rèn)取值水平高的為陽性結(jié)果。第六十九頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
本表輸出當(dāng)前模型的-2log(似然值)和兩個偽決定系數(shù),但對于logistic回歸而言,通??匆姷膫螞Q定系數(shù)不像線性回歸模型中的決定系數(shù)那么大。第七十頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
此表輸出模型中的各自變量的偏回歸系數(shù)及其標(biāo)準(zhǔn)誤、Wald2、自由度、P值、OR值(即exp(B))。第七十一頁,共八十五頁,編輯于2023年,星期五啞變量設(shè)置在回歸模型中,回歸系數(shù)b表示其他自變量不變,x每改變一個單位時(shí),所預(yù)測的y的平均變化量,當(dāng)x為連續(xù)性變量時(shí),這樣解釋沒有問題,二分類變量由于只存在兩個類別間的比較,也可以對系數(shù)得到很好的解釋。但是當(dāng)x為多分類變量時(shí),僅擬合一個回歸系數(shù)就不太合適了,此時(shí)需要使用啞變量(dummyvariable)方式對模型進(jìn)行定義。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 房屋出租協(xié)議書樣本模板
- 2024年室內(nèi)裝修工程安全合同
- 個人開車與單位免責(zé)協(xié)議書經(jīng)典版
- 室內(nèi)裝潢后污染治理合同
- 2024年二手車轉(zhuǎn)讓協(xié)議樣本
- 購房團(tuán)購活動合同
- 雙方合伙買房合同范本
- 貨場散貨租賃合同范本2024年
- 高一語文開學(xué)第一課-課件-(共22張)
- 公路養(yǎng)護(hù)管理承包合同
- 血液及骨髓細(xì)胞形態(tài)學(xué)專項(xiàng)考核試題
- 水稻高產(chǎn)栽培技術(shù)的優(yōu)化研究
- 海洋牧場建設(shè)與規(guī)劃
- 運(yùn)動員宣誓詞
- 生物傳感器技術(shù)在電子元件中的應(yīng)用
- 醫(yī)生類抖音代運(yùn)營方案(綜合)
- 發(fā)熱伴寒顫的護(hù)理課件
- 地貌與公路工程-河谷地貌(工程地質(zhì)課件)
- 江西省南昌三中高新校區(qū)2023-2024學(xué)年八年級上學(xué)期期中地理試卷
- 消防安全管理程序
- 煤礦井下攝像、拍照安全技術(shù)措施
評論
0/150
提交評論