版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多元線性回歸回歸1第一頁,共八十五頁,編輯于2023年,星期五概念多因素分析是同時(shí)對(duì)觀察對(duì)象的兩個(gè)或兩個(gè)以上的變量進(jìn)行分析。常用的統(tǒng)計(jì)分析方法有:多元線性回歸、Logistic回歸、COX比例風(fēng)險(xiǎn)回歸模型、因子分析、主成分分析等。2第二頁,共八十五頁,編輯于2023年,星期五多變量資料數(shù)據(jù)格式例號(hào)X1X2…XpY1X11X12…X1pY12X21X22…X2pY2┆┆┆…┆┆nXn1Xn2…XnpYnY為定量變量——LinearRegressionY為二項(xiàng)分類變量——BinaryLogisticRegressionY為多項(xiàng)分類變量——MultinomialLogisticRegressionY為有序分類變量——OrdinalLogisticRegressionY為生存時(shí)間與生存結(jié)局——CoxRegression3第三頁,共八十五頁,編輯于2023年,星期五
(1)因素篩選:例如影響高血壓的諸多因素中:
1)哪些是主要因素?
2)各因素的作用大???(2)控制混雜因素(3)提高回歸方程的估計(jì)精度多因素分析只有一個(gè)自變量的單因素回歸更能縮小應(yīng)變量Y對(duì)其估計(jì)值的離差,在預(yù)測和統(tǒng)計(jì)控制方面應(yīng)用的效果更好。多因素回歸分析主要用途:4第四頁,共八十五頁,編輯于2023年,星期五Y,X——直線回歸Y,X1,X2,…Xm——多元回歸(多重回歸)一、多元線性回歸
(multiplelinearregressoin)例:欲研究血壓受年齡、性別、體重、性格、職業(yè)(體力勞動(dòng)或腦力勞動(dòng))、飲食、吸煙、血脂水平等因素的影響。5第五頁,共八十五頁,編輯于2023年,星期五β0為回歸方程的常數(shù)項(xiàng)(constant),表示各自變量均為0時(shí)y的平均值;m為自變量的個(gè)數(shù);β1、β2、βm為偏回歸系數(shù)(Partialregressioncoefficient)意義:如β1
表示在X2、X3……Xm固定條件下,X1每增減一個(gè)單位對(duì)Y的效應(yīng)(Y增減β個(gè)單位)。e為去除m個(gè)自變量對(duì)Y影響后的隨機(jī)誤差,稱殘差(residual)。多元回歸方程的一般形式(一)多元回歸模型6第六頁,共八十五頁,編輯于2023年,星期五
為y的估計(jì)值或預(yù)測值(predictedvalue);
b0為回歸方程的常數(shù)項(xiàng)(constant),表示各自變量均為0時(shí)y的估計(jì)值;由樣本估計(jì)而得的多元回歸方程:b1、b2、bm為偏回歸系數(shù)(Partialregressioncoefficient)意義:如b1
表示在X2、X3……Xm固定條件下,X1每增減一個(gè)單位對(duì)Y的效應(yīng)(Y增減b個(gè)單位)。7第七頁,共八十五頁,編輯于2023年,星期五適用條件:線性(linear)、獨(dú)立性(independent)、正態(tài)性(normal)、方差齊性(equalvariance)——“LINE”。線性——自變量與應(yīng)變量的關(guān)系是線性的。用散點(diǎn)圖判斷。獨(dú)立性——任意兩個(gè)觀察值互相獨(dú)立。常利用專業(yè)知識(shí)判斷。正態(tài)性——就自變量的任何一個(gè)線性組合,應(yīng)變量y均服從正態(tài)分布。即要求殘差服從正態(tài)分布。常用殘差圖分析。方差齊性——就自變量的任何一個(gè)線性組合,應(yīng)變量y的方差均相同。即要求殘差的方差齊性。用散點(diǎn)圖或殘差圖判斷。8第八頁,共八十五頁,編輯于2023年,星期五(1)用各變量的數(shù)據(jù)建立回歸方程(2)對(duì)總的方程進(jìn)行假設(shè)檢驗(yàn)(3)當(dāng)總的方程有顯著性意義時(shí),應(yīng)對(duì)每個(gè)自變量的偏回歸系數(shù)再進(jìn)行假設(shè)檢驗(yàn),若某個(gè)自變量的偏回歸系數(shù)無顯著性,則應(yīng)把該變量剔除,重新建立不包含該變量的多元回歸方程。(二)多元回歸分析步驟對(duì)新建立的多元回歸方程及偏回歸系數(shù)按上述程序進(jìn)行檢驗(yàn),直到余下的偏回歸系數(shù)都具有統(tǒng)計(jì)意義為止。最后得到最優(yōu)方程。9第九頁,共八十五頁,編輯于2023年,星期五例127名糖尿病人的血清總膽固醇、甘油三脂、空腹胰島素、糖化血紅蛋白、空腹血糖的測量值列于表1中,試建立血糖與其它幾項(xiàng)指標(biāo)關(guān)系的多元線性回歸方程。表127名糖尿病人的血糖及有關(guān)變量的測量結(jié)果序號(hào)i總膽固醇甘油三脂胰島素糖化血血
糖(mmol/L)(mmol/L)(μU/ml)紅蛋白(%)(mmol/L)X1X2X3X4Y15.681.904.538.211.223.791.647.326.98.836.023.566.9510.812.3………………265.840.928.616.413.3273.841.206.459.610.410第十頁,共八十五頁,編輯于2023年,星期五由上表得到如下多元線性回歸方程:1、建立回歸方程11第十一頁,共八十五頁,編輯于2023年,星期五2、回歸方程的假設(shè)檢驗(yàn)——F檢驗(yàn)結(jié)果無顯著性
1)表明所觀察的自變量與應(yīng)變量不存在線性回歸關(guān)系;
2)也可能由于樣本例數(shù)過少;結(jié)果有顯著性表明至少有一個(gè)自變量與應(yīng)變量之間存在線性回歸關(guān)系。H0:β1=β2=…=βm=0H1:β1、β2、…βm不等于0或不全等于012第十二頁,共八十五頁,編輯于2023年,星期五13第十三頁,共八十五頁,編輯于2023年,星期五3、各個(gè)偏回歸系數(shù)的假設(shè)檢驗(yàn)——t檢驗(yàn)將總膽固醇(X1)
剔除。
注意:通常每次只剔除關(guān)系最弱的一個(gè)因素。
對(duì)于同一資料,不同自變量的t值可以相互比較,t的絕對(duì)值越大,或P越小,說明該自變量對(duì)Y所起的作用越大。14第十四頁,共八十五頁,編輯于2023年,星期五重新建立不包含提出因素的回歸方程注意:表中偏回歸系數(shù)已變化。15第十五頁,共八十五頁,編輯于2023年,星期五對(duì)新建立的回歸方程進(jìn)行檢驗(yàn)檢驗(yàn)結(jié)果有顯著性意義。16第十六頁,共八十五頁,編輯于2023年,星期五對(duì)新方程的偏回歸系數(shù)進(jìn)行檢驗(yàn)檢驗(yàn)結(jié)果均有意義,因此回歸方程保留甘油三酯(X2)、胰島素(X3)和糖化血紅蛋白(X4)三個(gè)因素。最后獲得回歸方程為:17第十七頁,共八十五頁,編輯于2023年,星期五1、確定系數(shù)(R2):意義:在y的總變異中,由x變量組建立的線性回歸方程所能解釋的比例。0~1,越大越優(yōu)。特點(diǎn):R2是隨自變量的增加而增大。因此,在相近的情況下,以包含的自變量少者為優(yōu)。(三)回歸方程的評(píng)價(jià)2、R——復(fù)相關(guān)系數(shù)(multiplecorrelationcoefficient)表示m個(gè)自變量共同對(duì)應(yīng)變量線性相關(guān)的密切程度。0≤R≤1。即Y與的相關(guān)系數(shù)。18第十八頁,共八十五頁,編輯于2023年,星期五
3、校正確定系數(shù)(adjustedR-square,R2a
)越大越優(yōu)。R2a不會(huì)隨無意義的自變量增加而增大。是衡量方程優(yōu)劣的常用指標(biāo)。
校正確定系數(shù)的計(jì)算:p為方程中包含的自變量個(gè)數(shù),p≤m。R2一定時(shí),p↑→R2
a↓19第十九頁,共八十五頁,編輯于2023年,星期五20第二十頁,共八十五頁,編輯于2023年,星期五(四)自變量的篩選基本思路:盡可能將回歸效果顯著的自變量選入方程中,作用不顯著的自變量排除在外。(1)全局擇優(yōu)法(allpossiblesubsetsselection):(2)逐步選擇法前進(jìn)法(Forwardselection)后退法(Backwardelimination)逐步法(Stepwise)21第二十一頁,共八十五頁,編輯于2023年,星期五1、全局擇優(yōu)法(最優(yōu)子集回歸)
(allpossiblesubsetsselection):有m個(gè)自變量就有2m-1個(gè)自變量子集。在各子集中選擇最優(yōu)的回歸方程。僅適用于自變量個(gè)數(shù)不太多的情況。22第二十二頁,共八十五頁,編輯于2023年,星期五2、向前篩選法(Forwardselection):事先給定一個(gè)入選標(biāo)準(zhǔn),即(通常=0.05),然后根據(jù)各因素偏回歸平方和從大到小,依次逐個(gè)引入回歸方程至無顯著性自變量可以入選為止,因素一旦入選便始終保留在方程中而不被剔除。局限性:后續(xù)變量的引入可能會(huì)使先進(jìn)入方程的變量變得不重要。23第二十三頁,共八十五頁,編輯于2023年,星期五3、向后剔除法(Backwardelimination)首先建立全部自變量的全回歸方程,給定剔除標(biāo)準(zhǔn),根據(jù)各因素偏回歸平方和從小到大,依次逐個(gè)將無顯著性的自變量從回歸方程中剔除。優(yōu)點(diǎn):考慮到了自變量的組合作用,選中的自變量數(shù)目一般會(huì)比前進(jìn)法選中的多。缺點(diǎn):當(dāng)自變量數(shù)目較多或有某些自變量高度相關(guān)時(shí),可能得不出正確的結(jié)果。24第二十四頁,共八十五頁,編輯于2023年,星期五4、逐步法(Stepwise):給出入選標(biāo)準(zhǔn)(通常1=0.05)和剔除標(biāo)準(zhǔn)(通常2=0.10),每次選入一個(gè)在方程外且最具統(tǒng)計(jì)學(xué)意義的自變量后,就對(duì)原在方程中的自變量做剔除檢驗(yàn),這個(gè)過程逐步進(jìn)行,直到?jīng)]有有統(tǒng)計(jì)意義的自變量可以入選,也沒有無統(tǒng)計(jì)學(xué)意義的自變量保留在方程中為止。實(shí)際工作中,多采用逐步法。用上述方法對(duì)上例資料進(jìn)行分析。25第二十五頁,共八十五頁,編輯于2023年,星期五
(六)應(yīng)用多元線性回歸分析時(shí)需注意的事項(xiàng)
(1)樣本量要求:無精確的計(jì)算公式。據(jù)經(jīng)驗(yàn),樣本量應(yīng)是自變量數(shù)的5~10倍以上。(2)做預(yù)報(bào)時(shí),只能在自變量X的觀察值范圍內(nèi)進(jìn)行;(3)在資料要求上,應(yīng)變量Y服從正態(tài)分布;(4)注意資料的特異點(diǎn)(outlier);26第二十六頁,共八十五頁,編輯于2023年,星期五(5)觀測值重新量化問題二項(xiàng)分類資料:用X表示分類變量,陰性為0,陽性為1。有序多項(xiàng)分類資料:用一個(gè)X作為分類變量,以自然數(shù)0,1,2,…賦值。如將病情分為輕中重三類時(shí),用X表示病情,賦值方法為:無序多項(xiàng)分類資料:或27第二十七頁,共八十五頁,編輯于2023年,星期五
上述以職員作為對(duì)比水平(基礎(chǔ)水平)。啞變量X1、X2、X3分別代表了工人、農(nóng)民、干部與職員相比的系數(shù)。啞變量代表的是同一個(gè)變量的不同取值,在分析時(shí)應(yīng)當(dāng)同時(shí)進(jìn)入或移出方程。即使只有部分啞變量有統(tǒng)計(jì)學(xué)意義也是如此。28第二十八頁,共八十五頁,編輯于2023年,星期五(7)自變量的聯(lián)合作用分析若要考慮X3、X4對(duì)應(yīng)變量y的聯(lián)合作用,可設(shè)置一個(gè)新變量X5=X3X4。若b3、b4和b5都有統(tǒng)計(jì)學(xué)意義,則說明X3、X4對(duì)應(yīng)變量既有單獨(dú)作用,又有交互作用。(6)自變量篩選過程中引入和剔除變量時(shí)檢驗(yàn)水準(zhǔn)的確定1)引入變量檢驗(yàn)的水準(zhǔn)小于或等于剔除變量時(shí)檢驗(yàn)的水準(zhǔn)2)通常引入變量檢驗(yàn)的水準(zhǔn)為0.05,剔除變量時(shí)0.10,但不絕對(duì)。29第二十九頁,共八十五頁,編輯于2023年,星期五說明X3、X4對(duì)應(yīng)變量既有單獨(dú)作用,又有交互作用。即說明糖尿病人體內(nèi)胰島素對(duì)血糖的影響依賴于糖化血紅蛋白的含量。30第三十頁,共八十五頁,編輯于2023年,星期五(8)自變量的共線性
當(dāng)自變量之間存在較強(qiáng)的相關(guān)關(guān)系時(shí),稱之為共線性。
后果——偏回歸系數(shù)的估計(jì)值容易失真。當(dāng)多元回歸的分析結(jié)果出現(xiàn)以下情況時(shí)可考慮是否存在自變量共線性:
1)在某個(gè)檢驗(yàn)水準(zhǔn)下,整個(gè)回歸方程有統(tǒng)計(jì)學(xué)意義,但是每個(gè)偏回歸系數(shù)的檢驗(yàn)均無統(tǒng)計(jì)學(xué)意義。
2)偏回歸系數(shù)的符號(hào)與醫(yī)學(xué)專業(yè)知識(shí)不一致。
3)參數(shù)估計(jì)的標(biāo)準(zhǔn)誤變得很大,使t值變得很小,P值很大。31第三十一頁,共八十五頁,編輯于2023年,星期五判斷方法:利用自變量間的相關(guān)系數(shù)陣。(r>0.9,共線性可能性大)處理方法:最簡單、有效的方法是根據(jù)專業(yè)知識(shí)人為去除在專業(yè)上比較次要的、或缺失值較多、測量誤差較大的共線性因子。
32第三十二頁,共八十五頁,編輯于2023年,星期五(9)殘差分析——模型診斷通常以標(biāo)準(zhǔn)化殘差(standardizedresidual)為縱坐標(biāo),以為橫坐標(biāo),作殘差圖。33第三十三頁,共八十五頁,編輯于2023年,星期五34第三十四頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例例1為研究男性高血壓患者血壓與年齡、身高、體重等變量的關(guān)系,隨機(jī)測量了32名40歲以上男性的血壓y、年齡x1、體重指數(shù)x2,試建立多重線性回歸方程。數(shù)據(jù)文件見mreg2.sav。第三十五頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例-初步分析初步分析:與簡單線性回歸相類似,先繪制散點(diǎn)圖,以便在進(jìn)行回歸分析之前了解各變量之間是否存在線性關(guān)系。本例有兩個(gè)自變量與一個(gè)反應(yīng)變量,繪制散點(diǎn)圖矩陣,如下。第三十六頁,共八十五頁,編輯于2023年,星期五
繪制散點(diǎn)圖矩陣簡單分析實(shí)例-初步分析第三十七頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例第三十八頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例第三十九頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
給出了自變量進(jìn)入模型的方式,此處尚未涉及變量篩選問題,因?yàn)閮蓚€(gè)變量是被強(qiáng)行納入模型的(Method為Enter),當(dāng)然就不存在剔除變量的事情了。第四十頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
模型擬合優(yōu)度情況的檢驗(yàn),結(jié)果顯示,復(fù)相關(guān)系數(shù)為0.840,決定系數(shù)為0.706,調(diào)整的決定系數(shù)為0.686,還輸出了剩余標(biāo)準(zhǔn)差。第四十一頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
回歸模型的假設(shè)檢驗(yàn)結(jié)果,顯示F=34.808,P<0.001,說明所建立的回歸模型是有統(tǒng)計(jì)學(xué)意義的,至少有一個(gè)自變量的回歸系數(shù)不為0。第四十二頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
給出了模型的常數(shù)項(xiàng)以及兩個(gè)自變量的偏回歸系數(shù)及其檢驗(yàn)結(jié)果,可以寫出回歸方程如下:Y=54.798+1.379x1+4.513x2主要結(jié)果第四十三頁,共八十五頁,編輯于2023年,星期五
SPSS結(jié)果中輸出偏回歸系數(shù)的同時(shí),也輸出了各自的標(biāo)準(zhǔn)偏回歸系數(shù)。年齡的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.664,體重指數(shù)的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.247,因此,可以認(rèn)為,年齡對(duì)血壓的影響比體重指數(shù)對(duì)血壓的影響大。簡單分析實(shí)例結(jié)果分析第四十四頁,共八十五頁,編輯于2023年,星期五例2
仍以例1的資料為例,試作逐步回歸分析。數(shù)據(jù)文件見mreg2.sav。逐步回歸第四十五頁,共八十五頁,編輯于2023年,星期五逐步回歸第四十六頁,共八十五頁,編輯于2023年,星期五逐步回歸第四十七頁,共八十五頁,編輯于2023年,星期五逐步回歸
輸出SPSS在逐步回歸過程中擬合的步驟中,每一步引入模型的變量情況,此處只有一個(gè)變量引入。結(jié)果分析第四十八頁,共八十五頁,編輯于2023年,星期五逐步回歸結(jié)果分析
分別輸出擬合的模型中,擬合優(yōu)度情況的檢驗(yàn)結(jié)果:復(fù)相關(guān)系數(shù)、決定系數(shù)、調(diào)整的決定系數(shù)以及剩余標(biāo)準(zhǔn)差。本例只有一步,故結(jié)果很簡單,僅擬合一個(gè)模型。第四十九頁,共八十五頁,編輯于2023年,星期五逐步回歸結(jié)果分析
給出各個(gè)擬合模型的常數(shù)項(xiàng)以及各自變量的偏回歸系數(shù)、95%可信區(qū)間及其檢驗(yàn)結(jié)果(此處為僅有一步的結(jié)果)。第五十頁,共八十五頁,編輯于2023年,星期五逐步回歸結(jié)果分析
給出擬合模型過程中被剔除的變量情況及其檢驗(yàn)結(jié)果(此處為僅有一步)。第五十一頁,共八十五頁,編輯于2023年,星期五殘差分析非標(biāo)準(zhǔn)化殘差(原始?xì)埐睿?biāo)準(zhǔn)化殘差(Pearson殘差)學(xué)生化殘差剔除殘差學(xué)生化剔除殘差
殘差種類第五十二頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-因變量與自變量之間存在線性關(guān)系的檢驗(yàn)(以例1為例:年齡)第五十三頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-因變量與自變量之間存在線性關(guān)系的檢驗(yàn)(以例1為例:體重指數(shù))第五十四頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-獨(dú)立性的檢驗(yàn)通過LinearRegression過程的statistics按鈕中的Durbin-Watson檢驗(yàn)進(jìn)行判斷。若自變量數(shù)少于4個(gè),統(tǒng)計(jì)量接近2,基本上可以肯定殘差間相互獨(dú)立。仍以例1為例,結(jié)果如下。第五十五頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-方差齊性的檢驗(yàn)第五十六頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-正態(tài)性的檢驗(yàn)繪制殘差的直方圖及PP圖的復(fù)選框第五十七頁,共八十五頁,編輯于2023年,星期五殘差分析
模型適用條件的檢驗(yàn)-正態(tài)性的檢驗(yàn)結(jié)果第五十八頁,共八十五頁,編輯于2023年,星期五二、Logistic
回歸一、概念
Logistic回歸是一種適用于應(yīng)變量為分類值多因素概率型曲線模型。Y為二項(xiàng)分類:非條件Logistic回歸——成組設(shè)計(jì)條件Logistic回歸——配對(duì)設(shè)計(jì)Y為多分類:多分類Logistic回歸59第五十九頁,共八十五頁,編輯于2023年,星期五BinaryLogistic適用于應(yīng)變量為二項(xiàng)分類的資料。應(yīng)變量(Y)在一組自變量(X)的作用下所發(fā)生的結(jié)果賦值規(guī)則為:logistic回歸模型:統(tǒng)計(jì)學(xué)中,把ln(P/Q)稱為P的Logit轉(zhuǎn)換或?qū)?shù)轉(zhuǎn)換,即LogitP。由此得到的回歸方程,稱為Logistic回歸方程。
出現(xiàn)陽性的結(jié)果——1,其概率用P來表示;出現(xiàn)陰性的結(jié)果——0,其概率用Q或(1–P)來表示。60第六十頁,共八十五頁,編輯于2023年,星期五由上式可得:由樣本估計(jì)而得的logistic回歸模型:61第六十一頁,共八十五頁,編輯于2023年,星期五將P/Q稱為比數(shù)(odds,優(yōu)勢(shì)、比值);兩個(gè)比數(shù)之比稱為比數(shù)比OR(oddsratio,優(yōu)勢(shì)比、比值比)。第i個(gè)觀察對(duì)象的發(fā)病概率比數(shù)(odds)為Pi/Qi,則:第l個(gè)觀察對(duì)象的發(fā)病概率比數(shù)為Pl/Ql,則:62第六十二頁,共八十五頁,編輯于2023年,星期五則:式中:——同一因素xj的不同暴露水平之差。
bj——在其它自變量固定不變的情況下,xj的水平每增加一個(gè)單位時(shí),ln(OR)的改變量,即所引起的比數(shù)比為增加前的ebj倍若Xj賦值為:63第六十三頁,共八十五頁,編輯于2023年,星期五bj=0時(shí),ORj=1,說明因素xj對(duì)疾病不起作用;bj>0時(shí),ORj>1,說明xj是一個(gè)危險(xiǎn)因素;bj<0時(shí),ORj<1,說明xj是一個(gè)保護(hù)因素。對(duì)于發(fā)病率很低的慢性?。ㄈ缧哪X血管疾病、惡性腫瘤等),由于P<<1,OR可作為RR的近似估計(jì):所以,logistic回歸常用于流行病學(xué)調(diào)查資料,其優(yōu)點(diǎn)是得到某一因素的回歸系數(shù)估計(jì)值后,就可得到不同水平下相對(duì)危險(xiǎn)度的近似估計(jì)值。64第六十四頁,共八十五頁,編輯于2023年,星期五模型的應(yīng)用主要有三個(gè)方面:篩選危險(xiǎn)因素:求出各協(xié)變量對(duì)應(yīng)變量的比數(shù)比(OR);校正混雜因素:可以很方便地控制混雜因素,得到校正后比數(shù)比的估計(jì)值和置信區(qū)間;預(yù)測與判斷:Logistic回歸模型是概率型模型,在一定條件下能預(yù)測某事件發(fā)生的概率,或估計(jì)各種自變量組合條件下應(yīng)變量的某一類結(jié)果是否發(fā)生。65第六十五頁,共八十五頁,編輯于2023年,星期五例1某醫(yī)師希望研究病人的年齡age、性別sex(0為女性、1為男性)、心電圖檢驗(yàn)是否異常ecg(ST段壓低、0為正常、1為輕度異常、2為重度異常)與冠心病ca是否有關(guān),數(shù)據(jù)見logistic_binary.sav。簡單分析實(shí)例第六十六頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例第六十七頁,共八十五頁,編輯于2023年,星期五選入應(yīng)變量選入自變量簡單分析實(shí)例第六十八頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
此表為應(yīng)變量取值水平編碼,SPSS默認(rèn)取值水平高的為陽性結(jié)果。第六十九頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
本表輸出當(dāng)前模型的-2log(似然值)和兩個(gè)偽決定系數(shù),但對(duì)于logistic回歸而言,通??匆姷膫螞Q定系數(shù)不像線性回歸模型中的決定系數(shù)那么大。第七十頁,共八十五頁,編輯于2023年,星期五簡單分析實(shí)例結(jié)果分析
此表輸出模型中的各自變量的偏回歸系數(shù)及其標(biāo)準(zhǔn)誤、Wald2、自由度、P值、OR值(即exp(B))。第七十一頁,共八十五頁,編輯于2023年,星期五啞變量設(shè)置在回歸模型中,回歸系數(shù)b表示其他自變量不變,x每改變一個(gè)單位時(shí),所預(yù)測的y的平均變化量,當(dāng)x為連續(xù)性變量時(shí),這樣解釋沒有問題,二分類變量由于只存在兩個(gè)類別間的比較,也可以對(duì)系數(shù)得到很好的解釋。但是當(dāng)x為多分類變量時(shí),僅擬合一個(gè)回歸系數(shù)就不太合適了,此時(shí)需要使用啞變量(dummyvariable)方式對(duì)模型進(jìn)行定義。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度農(nóng)業(yè)科技項(xiàng)目推廣與技術(shù)咨詢合同集錦3篇
- 生產(chǎn)與運(yùn)作管理-第5版 課件匯 第1-7章 生產(chǎn)系統(tǒng)與生產(chǎn)運(yùn)作管理概述 - 生產(chǎn)計(jì)劃
- 二零二五年度國有土地使用權(quán)出讓合同示范文本3篇
- 二零二五版智慧小區(qū)物業(yè)與社區(qū)共享空間服務(wù)合同3篇
- 二零二五年度教育裝備投標(biāo)擔(dān)保書制定規(guī)范3篇
- 路燈工程專項(xiàng)安全施工方案
- 二零二五年度鋼材電商平臺(tái)合作運(yùn)營協(xié)議2篇
- 二零二五年度家族企業(yè)股權(quán)析產(chǎn)分家協(xié)議書:企業(yè)股權(quán)傳承新規(guī)3篇
- 腳手架外墻模板施工方案
- 二零二五年度個(gè)人網(wǎng)絡(luò)安全投資合作協(xié)議2篇
- 安全生產(chǎn)技術(shù)規(guī)范 第49部分:加油站 DB50-T 867.49-2023
- 《三國演義》中的語言藝術(shù):詩詞歌賦的應(yīng)用
- 腸外營養(yǎng)液的合理配制
- 地鐵保潔服務(wù)投標(biāo)方案(技術(shù)標(biāo))
- 消防安全教育培訓(xùn)記錄表
- 2023年河南省新鄉(xiāng)市鳳泉區(qū)事業(yè)單位招聘53人高頻考點(diǎn)題庫(共500題含答案解析)模擬練習(xí)試卷
- 2023年小升初簡歷下載
- 廣府文化的奇葩
- 公路工程標(biāo)準(zhǔn)施工招標(biāo)文件(2018年版)解析
- 七年級(jí)地理下冊(cè)期末試卷(人教版)
- C語言程序設(shè)計(jì)期末考試試題(含答案)
評(píng)論
0/150
提交評(píng)論