多元線性回歸回歸

上傳人：卓*** IP屬地：廣東上傳時(shí)間：2023-05-27 格式：PPT 頁數(shù)：85 大?。?.23MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩80頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多元線性回歸回歸1第一頁，共八十五頁，編輯于2023年，星期五概念多因素分析是同時(shí)對(duì)觀察對(duì)象的兩個(gè)或兩個(gè)以上的變量進(jìn)行分析。常用的統(tǒng)計(jì)分析方法有：多元線性回歸、Logistic回歸、COX比例風(fēng)險(xiǎn)回歸模型、因子分析、主成分分析等。2第二頁，共八十五頁，編輯于2023年，星期五多變量資料數(shù)據(jù)格式例號(hào)X1X2…XpY1X11X12…X1pY12X21X22…X2pY2┆┆┆…┆┆nXn1Xn2…XnpYnY為定量變量——LinearRegressionY為二項(xiàng)分類變量——BinaryLogisticRegressionY為多項(xiàng)分類變量——MultinomialLogisticRegressionY為有序分類變量——OrdinalLogisticRegressionY為生存時(shí)間與生存結(jié)局——CoxRegression3第三頁，共八十五頁，編輯于2023年，星期五

（1）因素篩選：例如影響高血壓的諸多因素中：

1）哪些是主要因素？

2）各因素的作用大??？（2）控制混雜因素（3）提高回歸方程的估計(jì)精度多因素分析只有一個(gè)自變量的單因素回歸更能縮小應(yīng)變量Y對(duì)其估計(jì)值的離差，在預(yù)測和統(tǒng)計(jì)控制方面應(yīng)用的效果更好。多因素回歸分析主要用途：4第四頁，共八十五頁，編輯于2023年，星期五Y，X——直線回歸Y，X1，X2，…Xm——多元回歸（多重回歸）一、多元線性回歸

(multiplelinearregressoin)例：欲研究血壓受年齡、性別、體重、性格、職業(yè)（體力勞動(dòng)或腦力勞動(dòng)）、飲食、吸煙、血脂水平等因素的影響。5第五頁，共八十五頁，編輯于2023年，星期五β0為回歸方程的常數(shù)項(xiàng)（constant)，表示各自變量均為0時(shí)y的平均值；m為自變量的個(gè)數(shù)；β1、β2、βm為偏回歸系數(shù)（Partialregressioncoefficient）意義：如β1

表示在X2、X3……Xm固定條件下，X1每增減一個(gè)單位對(duì)Y的效應(yīng)（Y增減β個(gè)單位）。e為去除m個(gè)自變量對(duì)Y影響后的隨機(jī)誤差，稱殘差（residual)。多元回歸方程的一般形式（一）多元回歸模型6第六頁，共八十五頁，編輯于2023年，星期五

為y的估計(jì)值或預(yù)測值（predictedvalue)；

b0為回歸方程的常數(shù)項(xiàng)（constant)，表示各自變量均為0時(shí)y的估計(jì)值；由樣本估計(jì)而得的多元回歸方程：b1、b2、bm為偏回歸系數(shù)（Partialregressioncoefficient）意義：如b1

表示在X2、X3……Xm固定條件下，X1每增減一個(gè)單位對(duì)Y的效應(yīng)（Y增減b個(gè)單位）。7第七頁，共八十五頁，編輯于2023年，星期五適用條件：線性（linear）、獨(dú)立性（independent）、正態(tài)性（normal）、方差齊性（equalvariance）——“LINE”。線性——自變量與應(yīng)變量的關(guān)系是線性的。用散點(diǎn)圖判斷。獨(dú)立性——任意兩個(gè)觀察值互相獨(dú)立。常利用專業(yè)知識(shí)判斷。正態(tài)性——就自變量的任何一個(gè)線性組合，應(yīng)變量y均服從正態(tài)分布。即要求殘差服從正態(tài)分布。常用殘差圖分析。方差齊性——就自變量的任何一個(gè)線性組合，應(yīng)變量y的方差均相同。即要求殘差的方差齊性。用散點(diǎn)圖或殘差圖判斷。8第八頁，共八十五頁，編輯于2023年，星期五（1）用各變量的數(shù)據(jù)建立回歸方程（2）對(duì)總的方程進(jìn)行假設(shè)檢驗(yàn)（3）當(dāng)總的方程有顯著性意義時(shí)，應(yīng)對(duì)每個(gè)自變量的偏回歸系數(shù)再進(jìn)行假設(shè)檢驗(yàn)，若某個(gè)自變量的偏回歸系數(shù)無顯著性，則應(yīng)把該變量剔除，重新建立不包含該變量的多元回歸方程。（二）多元回歸分析步驟對(duì)新建立的多元回歸方程及偏回歸系數(shù)按上述程序進(jìn)行檢驗(yàn)，直到余下的偏回歸系數(shù)都具有統(tǒng)計(jì)意義為止。最后得到最優(yōu)方程。9第九頁，共八十五頁，編輯于2023年，星期五例127名糖尿病人的血清總膽固醇、甘油三脂、空腹胰島素、糖化血紅蛋白、空腹血糖的測量值列于表1中，試建立血糖與其它幾項(xiàng)指標(biāo)關(guān)系的多元線性回歸方程。表127名糖尿病人的血糖及有關(guān)變量的測量結(jié)果序號(hào)i總膽固醇甘油三脂胰島素糖化血血

糖（mmol/L）(mmol/L)(μU/ml)紅蛋白(%)(mmol/L)X1X2X3X4Y15.681.904.538.211.223.791.647.326.98.836.023.566.9510.812.3………………265.840.928.616.413.3273.841.206.459.610.410第十頁，共八十五頁，編輯于2023年，星期五由上表得到如下多元線性回歸方程：1、建立回歸方程11第十一頁，共八十五頁，編輯于2023年，星期五2、回歸方程的假設(shè)檢驗(yàn)——F檢驗(yàn)結(jié)果無顯著性

1）表明所觀察的自變量與應(yīng)變量不存在線性回歸關(guān)系；

2）也可能由于樣本例數(shù)過少；結(jié)果有顯著性表明至少有一個(gè)自變量與應(yīng)變量之間存在線性回歸關(guān)系。H0：β1=β2=…=βm=0H1：β1、β2、…βm不等于0或不全等于012第十二頁，共八十五頁，編輯于2023年，星期五13第十三頁，共八十五頁，編輯于2023年，星期五3、各個(gè)偏回歸系數(shù)的假設(shè)檢驗(yàn)——t檢驗(yàn)將總膽固醇(X1)

剔除。

注意：通常每次只剔除關(guān)系最弱的一個(gè)因素。

對(duì)于同一資料，不同自變量的t值可以相互比較，t的絕對(duì)值越大，或P越小，說明該自變量對(duì)Y所起的作用越大。14第十四頁，共八十五頁，編輯于2023年，星期五重新建立不包含提出因素的回歸方程注意：表中偏回歸系數(shù)已變化。15第十五頁，共八十五頁，編輯于2023年，星期五對(duì)新建立的回歸方程進(jìn)行檢驗(yàn)檢驗(yàn)結(jié)果有顯著性意義。16第十六頁，共八十五頁，編輯于2023年，星期五對(duì)新方程的偏回歸系數(shù)進(jìn)行檢驗(yàn)檢驗(yàn)結(jié)果均有意義，因此回歸方程保留甘油三酯(X2)、胰島素(X3)和糖化血紅蛋白(X4)三個(gè)因素。最后獲得回歸方程為：17第十七頁，共八十五頁，編輯于2023年，星期五1、確定系數(shù)（R2）：意義：在y的總變異中，由x變量組建立的線性回歸方程所能解釋的比例。0~1，越大越優(yōu)。特點(diǎn)：R2是隨自變量的增加而增大。因此，在相近的情況下，以包含的自變量少者為優(yōu)。（三）回歸方程的評(píng)價(jià)２、R——復(fù)相關(guān)系數(shù)（multiplecorrelationcoefficient）表示m個(gè)自變量共同對(duì)應(yīng)變量線性相關(guān)的密切程度。0≤R≤1。即Y與的相關(guān)系數(shù)。18第十八頁，共八十五頁，編輯于2023年，星期五

３、校正確定系數(shù)（adjustedR-square，R2a

）越大越優(yōu)。R2a不會(huì)隨無意義的自變量增加而增大。是衡量方程優(yōu)劣的常用指標(biāo)。

校正確定系數(shù)的計(jì)算：p為方程中包含的自變量個(gè)數(shù)，p≤m。R2一定時(shí)，p↑→R2

a↓19第十九頁，共八十五頁，編輯于2023年，星期五20第二十頁，共八十五頁，編輯于2023年，星期五（四）自變量的篩選基本思路：盡可能將回歸效果顯著的自變量選入方程中，作用不顯著的自變量排除在外。（1）全局擇優(yōu)法（allpossiblesubsetsselection）：（2）逐步選擇法前進(jìn)法（Forwardselection）后退法（Backwardelimination）逐步法（Stepwise）21第二十一頁，共八十五頁，編輯于2023年，星期五1、全局擇優(yōu)法（最優(yōu)子集回歸）

（allpossiblesubsetsselection）：有m個(gè)自變量就有2m-1個(gè)自變量子集。在各子集中選擇最優(yōu)的回歸方程。僅適用于自變量個(gè)數(shù)不太多的情況。22第二十二頁，共八十五頁，編輯于2023年，星期五2、向前篩選法（Forwardselection）：事先給定一個(gè)入選標(biāo)準(zhǔn)，即（通常=0.05），然后根據(jù)各因素偏回歸平方和從大到小，依次逐個(gè)引入回歸方程至無顯著性自變量可以入選為止，因素一旦入選便始終保留在方程中而不被剔除。局限性：后續(xù)變量的引入可能會(huì)使先進(jìn)入方程的變量變得不重要。23第二十三頁，共八十五頁，編輯于2023年，星期五3、向后剔除法（Backwardelimination）首先建立全部自變量的全回歸方程，給定剔除標(biāo)準(zhǔn)，根據(jù)各因素偏回歸平方和從小到大，依次逐個(gè)將無顯著性的自變量從回歸方程中剔除。優(yōu)點(diǎn)：考慮到了自變量的組合作用，選中的自變量數(shù)目一般會(huì)比前進(jìn)法選中的多。缺點(diǎn)：當(dāng)自變量數(shù)目較多或有某些自變量高度相關(guān)時(shí)，可能得不出正確的結(jié)果。24第二十四頁，共八十五頁，編輯于2023年，星期五4、逐步法（Stepwise）：給出入選標(biāo)準(zhǔn)（通常1=0.05）和剔除標(biāo)準(zhǔn)（通常2=0.10），每次選入一個(gè)在方程外且最具統(tǒng)計(jì)學(xué)意義的自變量后，就對(duì)原在方程中的自變量做剔除檢驗(yàn)，這個(gè)過程逐步進(jìn)行，直到?jīng)]有有統(tǒng)計(jì)意義的自變量可以入選，也沒有無統(tǒng)計(jì)學(xué)意義的自變量保留在方程中為止。實(shí)際工作中，多采用逐步法。用上述方法對(duì)上例資料進(jìn)行分析。25第二十五頁，共八十五頁，編輯于2023年，星期五

（六）應(yīng)用多元線性回歸分析時(shí)需注意的事項(xiàng)

（1）樣本量要求：無精確的計(jì)算公式。據(jù)經(jīng)驗(yàn)，樣本量應(yīng)是自變量數(shù)的5~10倍以上。（2）做預(yù)報(bào)時(shí)，只能在自變量X的觀察值范圍內(nèi)進(jìn)行；（3）在資料要求上，應(yīng)變量Y服從正態(tài)分布；（4）注意資料的特異點(diǎn)（outlier）；26第二十六頁，共八十五頁，編輯于2023年，星期五（5）觀測值重新量化問題二項(xiàng)分類資料：用X表示分類變量，陰性為0，陽性為1。有序多項(xiàng)分類資料：用一個(gè)X作為分類變量，以自然數(shù)0，1，2，…賦值。如將病情分為輕中重三類時(shí)，用X表示病情，賦值方法為：無序多項(xiàng)分類資料：或27第二十七頁，共八十五頁，編輯于2023年，星期五

上述以職員作為對(duì)比水平(基礎(chǔ)水平)。啞變量X1、X2、X3分別代表了工人、農(nóng)民、干部與職員相比的系數(shù)。啞變量代表的是同一個(gè)變量的不同取值，在分析時(shí)應(yīng)當(dāng)同時(shí)進(jìn)入或移出方程。即使只有部分啞變量有統(tǒng)計(jì)學(xué)意義也是如此。28第二十八頁，共八十五頁，編輯于2023年，星期五（7）自變量的聯(lián)合作用分析若要考慮X3、X4對(duì)應(yīng)變量y的聯(lián)合作用，可設(shè)置一個(gè)新變量X5=X3X4。若b3、b4和b5都有統(tǒng)計(jì)學(xué)意義，則說明X3、X4對(duì)應(yīng)變量既有單獨(dú)作用，又有交互作用。（6）自變量篩選過程中引入和剔除變量時(shí)檢驗(yàn)水準(zhǔn)的確定1）引入變量檢驗(yàn)的水準(zhǔn)小于或等于剔除變量時(shí)檢驗(yàn)的水準(zhǔn)2）通常引入變量檢驗(yàn)的水準(zhǔn)為0.05，剔除變量時(shí)0.10，但不絕對(duì)。29第二十九頁，共八十五頁，編輯于2023年，星期五說明X3、X4對(duì)應(yīng)變量既有單獨(dú)作用，又有交互作用。即說明糖尿病人體內(nèi)胰島素對(duì)血糖的影響依賴于糖化血紅蛋白的含量。30第三十頁，共八十五頁，編輯于2023年，星期五（8）自變量的共線性

當(dāng)自變量之間存在較強(qiáng)的相關(guān)關(guān)系時(shí)，稱之為共線性。

后果——偏回歸系數(shù)的估計(jì)值容易失真。當(dāng)多元回歸的分析結(jié)果出現(xiàn)以下情況時(shí)可考慮是否存在自變量共線性：

1）在某個(gè)檢驗(yàn)水準(zhǔn)下，整個(gè)回歸方程有統(tǒng)計(jì)學(xué)意義，但是每個(gè)偏回歸系數(shù)的檢驗(yàn)均無統(tǒng)計(jì)學(xué)意義。

2）偏回歸系數(shù)的符號(hào)與醫(yī)學(xué)專業(yè)知識(shí)不一致。

3）參數(shù)估計(jì)的標(biāo)準(zhǔn)誤變得很大，使t值變得很小，P值很大。31第三十一頁，共八十五頁，編輯于2023年，星期五判斷方法：利用自變量間的相關(guān)系數(shù)陣。（r＞0.9，共線性可能性大）處理方法：最簡單、有效的方法是根據(jù)專業(yè)知識(shí)人為去除在專業(yè)上比較次要的、或缺失值較多、測量誤差較大的共線性因子。

32第三十二頁，共八十五頁，編輯于2023年，星期五（9）殘差分析——模型診斷通常以標(biāo)準(zhǔn)化殘差（standardizedresidual)為縱坐標(biāo)，以為橫坐標(biāo)，作殘差圖。33第三十三頁，共八十五頁，編輯于2023年，星期五34第三十四頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例例1為研究男性高血壓患者血壓與年齡、身高、體重等變量的關(guān)系，隨機(jī)測量了32名40歲以上男性的血壓y、年齡x1、體重指數(shù)x2,試建立多重線性回歸方程。數(shù)據(jù)文件見mreg2.sav。第三十五頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例－初步分析初步分析：與簡單線性回歸相類似，先繪制散點(diǎn)圖，以便在進(jìn)行回歸分析之前了解各變量之間是否存在線性關(guān)系。本例有兩個(gè)自變量與一個(gè)反應(yīng)變量，繪制散點(diǎn)圖矩陣，如下。第三十六頁，共八十五頁，編輯于2023年，星期五

繪制散點(diǎn)圖矩陣簡單分析實(shí)例－初步分析第三十七頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例第三十八頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例第三十九頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例結(jié)果分析

給出了自變量進(jìn)入模型的方式，此處尚未涉及變量篩選問題，因?yàn)閮蓚€(gè)變量是被強(qiáng)行納入模型的（Method為Enter），當(dāng)然就不存在剔除變量的事情了。第四十頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例結(jié)果分析

模型擬合優(yōu)度情況的檢驗(yàn)，結(jié)果顯示，復(fù)相關(guān)系數(shù)為0.840，決定系數(shù)為0.706，調(diào)整的決定系數(shù)為0.686，還輸出了剩余標(biāo)準(zhǔn)差。第四十一頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例結(jié)果分析

回歸模型的假設(shè)檢驗(yàn)結(jié)果，顯示F＝34.808，P<0.001，說明所建立的回歸模型是有統(tǒng)計(jì)學(xué)意義的，至少有一個(gè)自變量的回歸系數(shù)不為0。第四十二頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例結(jié)果分析

給出了模型的常數(shù)項(xiàng)以及兩個(gè)自變量的偏回歸系數(shù)及其檢驗(yàn)結(jié)果，可以寫出回歸方程如下：Y＝54.798+1.379x1+4.513x2主要結(jié)果第四十三頁，共八十五頁，編輯于2023年，星期五

SPSS結(jié)果中輸出偏回歸系數(shù)的同時(shí)，也輸出了各自的標(biāo)準(zhǔn)偏回歸系數(shù)。年齡的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.664，體重指數(shù)的標(biāo)準(zhǔn)化偏回歸系數(shù)為0.247，因此，可以認(rèn)為，年齡對(duì)血壓的影響比體重指數(shù)對(duì)血壓的影響大。簡單分析實(shí)例結(jié)果分析第四十四頁，共八十五頁，編輯于2023年，星期五例2

仍以例1的資料為例，試作逐步回歸分析。數(shù)據(jù)文件見mreg2.sav。逐步回歸第四十五頁，共八十五頁，編輯于2023年，星期五逐步回歸第四十六頁，共八十五頁，編輯于2023年，星期五逐步回歸第四十七頁，共八十五頁，編輯于2023年，星期五逐步回歸

輸出SPSS在逐步回歸過程中擬合的步驟中，每一步引入模型的變量情況,此處只有一個(gè)變量引入。結(jié)果分析第四十八頁，共八十五頁，編輯于2023年，星期五逐步回歸結(jié)果分析

分別輸出擬合的模型中，擬合優(yōu)度情況的檢驗(yàn)結(jié)果：復(fù)相關(guān)系數(shù)、決定系數(shù)、調(diào)整的決定系數(shù)以及剩余標(biāo)準(zhǔn)差。本例只有一步，故結(jié)果很簡單，僅擬合一個(gè)模型。第四十九頁，共八十五頁，編輯于2023年，星期五逐步回歸結(jié)果分析

給出各個(gè)擬合模型的常數(shù)項(xiàng)以及各自變量的偏回歸系數(shù)、95％可信區(qū)間及其檢驗(yàn)結(jié)果（此處為僅有一步的結(jié)果）。第五十頁，共八十五頁，編輯于2023年，星期五逐步回歸結(jié)果分析

給出擬合模型過程中被剔除的變量情況及其檢驗(yàn)結(jié)果（此處為僅有一步）。第五十一頁，共八十五頁，編輯于2023年，星期五殘差分析非標(biāo)準(zhǔn)化殘差（原始?xì)埐睿?biāo)準(zhǔn)化殘差（Pearson殘差）學(xué)生化殘差剔除殘差學(xué)生化剔除殘差

殘差種類第五十二頁，共八十五頁，編輯于2023年，星期五殘差分析

模型適用條件的檢驗(yàn)－因變量與自變量之間存在線性關(guān)系的檢驗(yàn)（以例1為例：年齡）第五十三頁，共八十五頁，編輯于2023年，星期五殘差分析

模型適用條件的檢驗(yàn)－因變量與自變量之間存在線性關(guān)系的檢驗(yàn)（以例1為例：體重指數(shù)）第五十四頁，共八十五頁，編輯于2023年，星期五殘差分析

模型適用條件的檢驗(yàn)－獨(dú)立性的檢驗(yàn)通過LinearRegression過程的statistics按鈕中的Durbin-Watson檢驗(yàn)進(jìn)行判斷。若自變量數(shù)少于4個(gè)，統(tǒng)計(jì)量接近2，基本上可以肯定殘差間相互獨(dú)立。仍以例1為例，結(jié)果如下。第五十五頁，共八十五頁，編輯于2023年，星期五殘差分析

模型適用條件的檢驗(yàn)－方差齊性的檢驗(yàn)第五十六頁，共八十五頁，編輯于2023年，星期五殘差分析

模型適用條件的檢驗(yàn)－正態(tài)性的檢驗(yàn)繪制殘差的直方圖及PP圖的復(fù)選框第五十七頁，共八十五頁，編輯于2023年，星期五殘差分析

模型適用條件的檢驗(yàn)－正態(tài)性的檢驗(yàn)結(jié)果第五十八頁，共八十五頁，編輯于2023年，星期五二、Logistic

回歸一、概念

Logistic回歸是一種適用于應(yīng)變量為分類值多因素概率型曲線模型。Y為二項(xiàng)分類：非條件Logistic回歸——成組設(shè)計(jì)條件Logistic回歸——配對(duì)設(shè)計(jì)Y為多分類：多分類Logistic回歸59第五十九頁，共八十五頁，編輯于2023年，星期五BinaryLogistic適用于應(yīng)變量為二項(xiàng)分類的資料。應(yīng)變量（Y）在一組自變量（X）的作用下所發(fā)生的結(jié)果賦值規(guī)則為：logistic回歸模型：統(tǒng)計(jì)學(xué)中，把ln（P/Q）稱為P的Logit轉(zhuǎn)換或?qū)?shù)轉(zhuǎn)換，即LogitP。由此得到的回歸方程，稱為Logistic回歸方程。

出現(xiàn)陽性的結(jié)果——1，其概率用P來表示；出現(xiàn)陰性的結(jié)果——0，其概率用Q或（1–P）來表示。60第六十頁，共八十五頁，編輯于2023年，星期五由上式可得:由樣本估計(jì)而得的logistic回歸模型：61第六十一頁，共八十五頁，編輯于2023年，星期五將P/Q稱為比數(shù)（odds，優(yōu)勢(shì)、比值）；兩個(gè)比數(shù)之比稱為比數(shù)比OR（oddsratio，優(yōu)勢(shì)比、比值比）。第i個(gè)觀察對(duì)象的發(fā)病概率比數(shù)（odds)為Pi/Qi，則：第l個(gè)觀察對(duì)象的發(fā)病概率比數(shù)為Pl/Ql，則：62第六十二頁，共八十五頁，編輯于2023年，星期五則：式中：——同一因素xj的不同暴露水平之差。

bj——在其它自變量固定不變的情況下，xj的水平每增加一個(gè)單位時(shí)，ln(OR)的改變量，即所引起的比數(shù)比為增加前的ebj倍若Xj賦值為：63第六十三頁，共八十五頁，編輯于2023年，星期五bj=0時(shí)，ORj=1，說明因素xj對(duì)疾病不起作用；bj＞0時(shí)，ORj＞1，說明xj是一個(gè)危險(xiǎn)因素；bj＜0時(shí)，ORj<1，說明xj是一個(gè)保護(hù)因素。對(duì)于發(fā)病率很低的慢性?。ㄈ缧哪X血管疾病、惡性腫瘤等），由于P<<1，OR可作為RR的近似估計(jì)：所以，logistic回歸常用于流行病學(xué)調(diào)查資料，其優(yōu)點(diǎn)是得到某一因素的回歸系數(shù)估計(jì)值后，就可得到不同水平下相對(duì)危險(xiǎn)度的近似估計(jì)值。64第六十四頁，共八十五頁，編輯于2023年，星期五模型的應(yīng)用主要有三個(gè)方面：篩選危險(xiǎn)因素：求出各協(xié)變量對(duì)應(yīng)變量的比數(shù)比（OR）；校正混雜因素：可以很方便地控制混雜因素，得到校正后比數(shù)比的估計(jì)值和置信區(qū)間；預(yù)測與判斷：Logistic回歸模型是概率型模型，在一定條件下能預(yù)測某事件發(fā)生的概率，或估計(jì)各種自變量組合條件下應(yīng)變量的某一類結(jié)果是否發(fā)生。65第六十五頁，共八十五頁，編輯于2023年，星期五例1某醫(yī)師希望研究病人的年齡age、性別sex（0為女性、1為男性）、心電圖檢驗(yàn)是否異常ecg（ST段壓低、0為正常、1為輕度異常、2為重度異常）與冠心病ca是否有關(guān)，數(shù)據(jù)見logistic_binary.sav。簡單分析實(shí)例第六十六頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例第六十七頁，共八十五頁，編輯于2023年，星期五選入應(yīng)變量選入自變量簡單分析實(shí)例第六十八頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例結(jié)果分析

此表為應(yīng)變量取值水平編碼，SPSS默認(rèn)取值水平高的為陽性結(jié)果。第六十九頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例結(jié)果分析

本表輸出當(dāng)前模型的-2log（似然值）和兩個(gè)偽決定系數(shù)，但對(duì)于logistic回歸而言，通?？匆姷膫螞Q定系數(shù)不像線性回歸模型中的決定系數(shù)那么大。第七十頁，共八十五頁，編輯于2023年，星期五簡單分析實(shí)例結(jié)果分析

此表輸出模型中的各自變量的偏回歸系數(shù)及其標(biāo)準(zhǔn)誤、Wald2、自由度、P值、OR值（即exp（B））。第七十一頁，共八十五頁，編輯于2023年，星期五啞變量設(shè)置在回歸模型中，回歸系數(shù)b表示其他自變量不變，x每改變一個(gè)單位時(shí)，所預(yù)測的y的平均變化量，當(dāng)x為連續(xù)性變量時(shí)，這樣解釋沒有問題，二分類變量由于只存在兩個(gè)類別間的比較，也可以對(duì)系數(shù)得到很好的解釋。但是當(dāng)x為多分類變量時(shí)，僅擬合一個(gè)回歸系數(shù)就不太合適了，此時(shí)需要使用啞變量（dummyvariable）方式對(duì)模型進(jìn)行定義。

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多元線性回歸回歸

文檔簡介

溫馨提示

最新文檔

評(píng)論

多元線性回歸回歸

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔