實(shí)習(xí)四回歸分析_第1頁
實(shí)習(xí)四回歸分析_第2頁
實(shí)習(xí)四回歸分析_第3頁
實(shí)習(xí)四回歸分析_第4頁
實(shí)習(xí)四回歸分析_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、簡單線性回歸、多重線性回歸、簡單線性回歸、多重線性回歸、Logistic回歸、回歸、Cox回歸回歸盧潔盧潔Email: 鄭州大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室鄭州大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室實(shí)習(xí)四實(shí)習(xí)四 回歸分析回歸分析回歸分析回歸分析1個(gè)因變量個(gè)因變量Y1個(gè)自變量個(gè)自變量X 2個(gè)以上自變量個(gè)以上自變量XY是數(shù)值是數(shù)值變量變量Y是分類是分類型變量型變量兩個(gè)因變量兩個(gè)因變量(結(jié)局分類變量(結(jié)局分類變量+時(shí)間)時(shí)間)生存分析生存分析Cox回歸回歸一元回歸一元回歸Simple regression Logistic 回歸回歸Logistic regression 多重回歸多重回歸Multiple

2、regression 常用的回歸分析中分類:常用的回歸分析中分類:曲線回歸線性回歸回歸回歸分析分析簡單線性:簡單線性:多重線性:多重線性:logistic回歸回歸線性回歸線性回歸iiXXXY.22110kkkkxxxxkkeexXX1101101.1ln22110或110011)-1Ln(-)-1Ln()(LneORORXY只只1個(gè)個(gè)X: (簡單簡單)多個(gè)多個(gè)X:XXeeX0011ln0或Cox回歸回歸).exp()()(22110ppXXXththjjRRln)exp(jjRR實(shí)習(xí)內(nèi)容實(shí)習(xí)內(nèi)容u簡單回歸分析簡單回歸分析:例例10-1(P183,實(shí)驗(yàn)實(shí)驗(yàn)10-1)u多重回歸分析多重回歸分析:例

3、例11-1(P207,實(shí)驗(yàn)實(shí)驗(yàn)11-1)uLogistic回歸分析回歸分析: 例例18-1(P365,實(shí)驗(yàn)實(shí)驗(yàn)18-1);例例18-3(P366,實(shí)驗(yàn)實(shí)驗(yàn)18-3); 自選實(shí)習(xí)內(nèi)容:自選實(shí)習(xí)內(nèi)容:uCox回歸分析:回歸分析: 例例19-2(P390,實(shí)驗(yàn)實(shí)驗(yàn)19-2,實(shí)驗(yàn)實(shí)驗(yàn)19-3)(一)線性回歸分析(一)線性回歸分析例例12-1 :試對(duì)大氣污染一氧化氮(:試對(duì)大氣污染一氧化氮(NO)的濃度和汽)的濃度和汽車流量、氣溫、氣濕、風(fēng)速等的關(guān)系進(jìn)行回歸分析。車流量、氣溫、氣濕、風(fēng)速等的關(guān)系進(jìn)行回歸分析。例:例: 只考慮只考慮NO濃濃度和車流量的度和車流量的關(guān)系,問之間關(guān)系,問之間是否存在數(shù)量是否存

4、在數(shù)量依存關(guān)系?依存關(guān)系?1. 簡單線性回歸適用條件簡單線性回歸適用條件u僅適用于僅適用于1個(gè)因變量個(gè)因變量 x和和1個(gè)應(yīng)變量個(gè)應(yīng)變量 y。u要求數(shù)據(jù)滿足要求數(shù)據(jù)滿足線性線性、獨(dú)立性獨(dú)立性、正態(tài)性正態(tài)性、方方差齊性差齊性的要求。的要求。u注意樣本中的極端值,必要時(shí)可剔除或進(jìn)注意樣本中的極端值,必要時(shí)可剔除或進(jìn)行變量變換。行變量變換。簡單線性回歸簡單線性回歸(simple linar regression)線性回歸分析的步驟線性回歸分析的步驟:繪制繪制散點(diǎn)圖散點(diǎn)圖:1.線性趨勢?線性趨勢? 2. 異常值或強(qiáng)影響點(diǎn)?異常值或強(qiáng)影響點(diǎn)?估計(jì)回歸系數(shù)估計(jì)回歸系數(shù)b和常數(shù)項(xiàng)和常數(shù)項(xiàng)a回歸方程和回歸系數(shù)回

5、歸方程和回歸系數(shù) 的假設(shè)檢驗(yàn)的假設(shè)檢驗(yàn)參數(shù)估計(jì)參數(shù)估計(jì):總體回歸系數(shù):總體回歸系數(shù)的區(qū)間估計(jì)的區(qū)間估計(jì)回歸方程的統(tǒng)計(jì)應(yīng)用回歸方程的統(tǒng)計(jì)應(yīng)用n方程:方差分析方程:方差分析n回歸系數(shù):回歸系數(shù):t 檢驗(yàn)法檢驗(yàn)法預(yù)測和控制、影響因素分析預(yù)測和控制、影響因素分析XbYa21)()(XXYYXXbiniii最小二乘估計(jì)最小二乘估計(jì)【電腦實(shí)現(xiàn)電腦實(shí)現(xiàn)】簡單線性回歸分析簡單線性回歸分析 1. 數(shù)據(jù)錄入數(shù)據(jù)錄入 2. 作散點(diǎn)圖:作散點(diǎn)圖: 3. 讀散點(diǎn)圖,作線性趨勢判斷:讀散點(diǎn)圖,作線性趨勢判斷:4.線性回歸分析線性回歸分析:SPSS電腦實(shí)現(xiàn)電腦實(shí)現(xiàn)5. 結(jié)果及結(jié)果輸出:結(jié)果及結(jié)果輸出: 回歸分析結(jié)果:回歸分

6、析結(jié)果:車流量158. 0135. 0 y1. 當(dāng)車流量為當(dāng)車流量為0時(shí),空氣中時(shí),空氣中NO濃度的預(yù)測值是濃度的預(yù)測值是 - 0.135,(顯然這只是個(gè)理論值,因?yàn)榇酥挡豢赡転樨?fù))(顯然這只是個(gè)理論值,因?yàn)榇酥挡豢赡転樨?fù))2.車流量每增加一個(gè)單位,空氣中車流量每增加一個(gè)單位,空氣中NO深度的預(yù)測值增加深度的預(yù)測值增加0.158。3.確定系數(shù)確定系數(shù)R2=65.27%,說明空氣中,說明空氣中NO濃度總變異的濃度總變異的65.27%與車流量有關(guān),說明車流量在空氣污染中影響還與車流量有關(guān),說明車流量在空氣污染中影響還是很大的。是很大的。統(tǒng)計(jì)應(yīng)用統(tǒng)計(jì)應(yīng)用預(yù)測:預(yù)測:當(dāng)車流量為當(dāng)車流量為1300輛,求

7、空氣中一氧輛,求空氣中一氧化氮化氮95%的容許區(qū)間。的容許區(qū)間。答答:XY1584. 01353. 0已知回歸方程已知回歸方程0707. 03 . 11584. 01353. 0YX=1.300時(shí)時(shí):故空氣中故空氣中NO的的98%容許區(qū)間容許區(qū)間為為:62101467. 00000. 01124. 24035. 13 . 124110358. 0074. 20707. 0回歸方程應(yīng)用回歸方程應(yīng)用預(yù)測預(yù)測個(gè)體預(yù)測值個(gè)體預(yù)測值和和其其95%參考值區(qū)間參考值區(qū)間的保存的保存 統(tǒng)計(jì)應(yīng)用統(tǒng)計(jì)應(yīng)用控制控制:該城市為降低空氣中:該城市為降低空氣中NO的含量,擬的含量,擬對(duì)車流量進(jìn)行適當(dāng)?shù)目刂?,根?jù)空氣污染指

8、數(shù)分級(jí),要對(duì)車流量進(jìn)行適當(dāng)?shù)目刂疲鶕?jù)空氣污染指數(shù)分級(jí),要求空氣中氮氧化合物含量不超過求空氣中氮氧化合物含量不超過0.1000.15010-6 。XY1584. 01353. 0已知回歸方程已知回歸方程答答:千輛時(shí)當(dāng)千輛時(shí)當(dāng)801. 11584. 0/135. 0150. 010150. 0485. 11584. 0/135. 0100. 010100. 0162161,XY,XY故該城市單位時(shí)間內(nèi)車流量應(yīng)控制在故該城市單位時(shí)間內(nèi)車流量應(yīng)控制在1500輛以內(nèi),輛以內(nèi),最多不超過最多不超過1800輛,否則會(huì)導(dǎo)致輕度污染的發(fā)生。輛,否則會(huì)導(dǎo)致輕度污染的發(fā)生。例例12-1 :試對(duì)大氣污染一氧化氮(:

9、試對(duì)大氣污染一氧化氮(NO)的濃度和汽)的濃度和汽車流量、氣溫、氣濕、風(fēng)速等的關(guān)系進(jìn)行回歸分析。車流量、氣溫、氣濕、風(fēng)速等的關(guān)系進(jìn)行回歸分析。2. 多重線性回歸適用條件多重線性回歸適用條件u僅適用于僅適用于1個(gè)應(yīng)變量個(gè)應(yīng)變量 y和和多個(gè)因變量多個(gè)因變量 x。u要求要求1個(gè)應(yīng)變量個(gè)應(yīng)變量 y和和該組因變量該組因變量 x 間滿足間滿足線性線性、獨(dú)立性獨(dú)立性、正態(tài)性正態(tài)性、方差齊性方差齊性的要求。的要求。u注意樣本中的極端值,必要時(shí)可剔除或進(jìn)行變注意樣本中的極端值,必要時(shí)可剔除或進(jìn)行變量變換。量變換。多重線性回歸多重線性回歸(multiple linar regression)3. 多重線性回歸分析

10、的基本步驟: 估計(jì)b0、 b1、 b2 、bP最小二乘法回歸方程和系數(shù) 的假設(shè)檢驗(yàn)列出回歸方程,統(tǒng)計(jì)應(yīng)用方差分析和 t 檢驗(yàn)ppXbXbXbbY.22110預(yù)測和控制、影響因素分析關(guān)聯(lián)趨勢的圖形考察u確定變量篩選的方法u數(shù)據(jù)預(yù)處理:強(qiáng)影響點(diǎn)用多重共線性u(píng)模型診斷:殘差分析是否適合該模型(Line)建模準(zhǔn)備散點(diǎn)圖、散點(diǎn)圖矩陣、重疊/三維散點(diǎn)圖【電腦實(shí)現(xiàn)電腦實(shí)現(xiàn)】多重線性回歸分析多重線性回歸分析1.數(shù)據(jù)錄入數(shù)據(jù)錄入2. 散點(diǎn)圖矩陣散點(diǎn)圖矩陣圖形輸出:圖形輸出:【Method】(自變量的選入方法)(自變量的選入方法) Enter(強(qiáng)行進(jìn)入法)(強(qiáng)行進(jìn)入法) Stepwise(逐步法)(逐步法) Re

11、move(強(qiáng)制剔除法)(強(qiáng)制剔除法) Backward(向后法)(向后法) Forward(向前法)(向前法) 自變量篩選方法的選擇:自變量篩選方法的選擇:【Statistics 】Regression Coefficients:回歸系數(shù):回歸系數(shù)nEstimate:非標(biāo)準(zhǔn)化及標(biāo)準(zhǔn)化回歸系數(shù):非標(biāo)準(zhǔn)化及標(biāo)準(zhǔn)化回歸系數(shù)、標(biāo)準(zhǔn)誤,及其顯、標(biāo)準(zhǔn)誤,及其顯著性檢驗(yàn)結(jié)果(著性檢驗(yàn)結(jié)果(t值和值和P值)。值)。nConfidence intervals:非標(biāo)準(zhǔn)化回歸系數(shù)的:非標(biāo)準(zhǔn)化回歸系數(shù)的95%可信區(qū)間??尚艆^(qū)間。nModel fit:模型擬合優(yōu)度檢驗(yàn),給出復(fù)相關(guān)系數(shù):模型擬合優(yōu)度檢驗(yàn),給出復(fù)相關(guān)系數(shù)R

12、,決定系,決定系數(shù)數(shù)R2,調(diào)整,調(diào)整R2及方差分析結(jié)果及方差分析結(jié)果 nR squared change:每剔出或引入一個(gè)自變量所引趨同的:每剔出或引入一個(gè)自變量所引趨同的R2的變化量及相應(yīng)的的變化量及相應(yīng)的F值和值和P值。值。nDescriptives:輸出每個(gè)變量的均數(shù)、標(biāo)準(zhǔn)差,樣本容量,:輸出每個(gè)變量的均數(shù)、標(biāo)準(zhǔn)差,樣本容量,相關(guān)系數(shù)及單側(cè)檢驗(yàn)相關(guān)系數(shù)及單側(cè)檢驗(yàn)P值的矩陣。值的矩陣。 nPart and partial correlations:簡單相關(guān)系數(shù)及偏相關(guān)系數(shù)。:簡單相關(guān)系數(shù)及偏相關(guān)系數(shù)。nCollinearity diagnostics:輸出共線性診斷的統(tǒng)計(jì)量。:輸出共線性診

13、斷的統(tǒng)計(jì)量。Residuals:用于選擇輸出殘差診斷的信息:用于選擇輸出殘差診斷的信息All cases:給出所:給出所有觀察單位的殘差、標(biāo)準(zhǔn)化殘差和預(yù)測值。有觀察單位的殘差、標(biāo)準(zhǔn)化殘差和預(yù)測值?!綪lots】標(biāo)準(zhǔn)化殘差標(biāo)準(zhǔn)化殘差標(biāo)準(zhǔn)化預(yù)測值標(biāo)準(zhǔn)化預(yù)測值 1. 前提條件和殘差分析前提條件和殘差分析模型假設(shè)診斷模型假設(shè)診斷2. 多重共線性的問題多重共線性的問題3. 啞變量的設(shè)置啞變量的設(shè)置4.交互作用交互作用結(jié)果輸出:結(jié)果輸出:1.多重共線性分析的應(yīng)用條件診斷:多重共線性分析的應(yīng)用條件診斷:1. 線性和方差齊性:線性和方差齊性:殘差散點(diǎn)圖殘差散點(diǎn)圖 residual plot模型假設(shè)診斷:模型假

14、設(shè)診斷:LINE散點(diǎn)均勻分布在以散點(diǎn)均勻分布在以0 0為中心,與橫軸平為中心,與橫軸平行的帶狀區(qū)域內(nèi),可以認(rèn)為基本滿足線行的帶狀區(qū)域內(nèi),可以認(rèn)為基本滿足線性和方差齊性的假定條件。性和方差齊性的假定條件。散點(diǎn)呈現(xiàn)曲線趨勢,提示散點(diǎn)呈現(xiàn)曲線趨勢,提示資料不滿足線性的假定。資料不滿足線性的假定。散點(diǎn)隨預(yù)測值的變化散點(diǎn)隨預(yù)測值的變化而變化,提示資料不而變化,提示資料不滿足方差齊性的假定。滿足方差齊性的假定。散點(diǎn)隨預(yù)測值的變化而變化散點(diǎn)隨預(yù)測值的變化而變化且呈曲線趨勢,提示資料不且呈曲線趨勢,提示資料不滿足線性和方差齊性的假定。滿足線性和方差齊性的假定。SPSS電腦實(shí)現(xiàn)電腦實(shí)現(xiàn)3. 線性和方差齊性檢驗(yàn)結(jié)

15、果線性和方差齊性檢驗(yàn)結(jié)果殘差散點(diǎn)圖:殘差散點(diǎn)圖: 散點(diǎn)均勻分布在以散點(diǎn)均勻分布在以0為中心,與橫軸平行的帶狀區(qū)域?yàn)橹行模c橫軸平行的帶狀區(qū)域內(nèi),可認(rèn)為基本滿足線性和方差齊性的假定條件。內(nèi),可認(rèn)為基本滿足線性和方差齊性的假定條件。2.正態(tài)性:正態(tài)性:殘差圖殘差圖residual plot 或或正態(tài)概率圖正態(tài)概率圖提示殘差滿提示殘差滿足正態(tài)分布足正態(tài)分布3. 獨(dú)立性:獨(dú)立性: 應(yīng)用應(yīng)用殘差圖殘差圖 或或Durbin-Watson統(tǒng)計(jì)量統(tǒng)計(jì)量判斷判斷 Durbin-Watson統(tǒng)計(jì)量的取值一般在統(tǒng)計(jì)量的取值一般在0-4之之間,如果殘差之間相互獨(dú)立,則取值在間,如果殘差之間相互獨(dú)立,則取值在2左右,左

16、右,如果取值接近如果取值接近0或或4,則提示不滿足獨(dú)立性。,則提示不滿足獨(dú)立性。SPSS電腦實(shí)現(xiàn)電腦實(shí)現(xiàn)M Mo od de el l S Su um mm ma ar ry yd d.808a.653.637.035801.851b.725.698.032640.887c.787.755.0293871.593Model123RR SquareAdjustedR SquareStd. Error ofthe EstimateDurbin-WatsonPredictors: (Constant), 車流量(X1)a. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4

17、)b. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4), 氣溫(X2)c. Dependent Variable: NO(Y)d. 3. 獨(dú)立性檢驗(yàn):獨(dú)立性檢驗(yàn): 若殘差之間相互獨(dú)立,則取值在若殘差之間相互獨(dú)立,則取值在2左右左右。11.3.3 多重共線性多重共線性在進(jìn)行多重線性回歸分析時(shí),除了要滿足在進(jìn)行多重線性回歸分析時(shí),除了要滿足LINE 外,外,還要求各變量之間不能存在共線性,即各變量之間還要求各變量之間不能存在共線性,即各變量之間要相互獨(dú)立。為此,需要進(jìn)行共線性診斷;要相互獨(dú)立。為此,需要進(jìn)行共線性診斷;當(dāng)自變量均為隨機(jī)變量時(shí),若它們之間高度相關(guān),當(dāng)自

18、變量均為隨機(jī)變量時(shí),若它們之間高度相關(guān),則稱變量間存在多重共線性則稱變量間存在多重共線性(multicollinearity);自自變量之間不存在多重共線性,即稱其互相獨(dú)立。變量之間不存在多重共線性,即稱其互相獨(dú)立。相關(guān)系數(shù)相關(guān)系數(shù) Correlation容忍度容忍度 Torelance方差膨脹因子方差膨脹因子 VIF條件數(shù)條件數(shù) Condition index方差比例方差比例Variance proportions, VP 方差相關(guān)矩陣方差相關(guān)矩陣Variance Matrix可用來判斷變量可用來判斷變量之間的獨(dú)立性、之間的獨(dú)立性、或說多重共線性或說多重共線性C Co or rr re el

19、 la at ti io on ns s1.000.808.017.279-.680.8081.000-.141.395-.568.017-.1411.000-.073.384.279.395-.0731.000-.146-.680-.568.384-.1461.000.000.468.094.000.000.255.028.002.468.255.368.032.094.028.368.247.000.002.032.247.24242424242424242424242424242424242424242424242424NO(Y)車流量(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)NO(Y

20、)車流量(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)NO(Y)車流量(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)Pearson CorrelationSig. (1-tailed)NNO(Y)車流量(X1)氣溫(X2)氣濕(X3)風(fēng)速(X4)如果兩個(gè)自變量之間的相關(guān)系數(shù)超過如果兩個(gè)自變量之間的相關(guān)系數(shù)超過0.9,則會(huì)帶來共,則會(huì)帶來共線性問題,如果在線性問題,如果在0.8以下,一般不會(huì)出現(xiàn)多大問題。以下,一般不會(huì)出現(xiàn)多大問題。共線性診斷1.兩個(gè)自變量之間的相關(guān)系數(shù)2.容忍度容忍度 Tolerance /方差膨脹因子 VIFC Co oe ef ff fi ic ci ie en nt ts s

21、a a-.135.035-3.829.001-.209-.062.158.025.8086.432.000.107.2101.0001.000-.050.049-1.027.316-.151.051.122.027.6234.476.000.065.179.6771.477-.025.011-.325-2.338.029-.048-.003.6771.477-.142.058-2.452.024-.263-.021.116.025.5924.699.000.065.168.6701.493-.035.010-.448-3.316.003-.057-.013.5831.716.004.002.2

22、732.430.025.001.008.8441.185(Constant)車流量(X1)(Constant)車流量(X1)風(fēng)速(X4)(Constant)車流量(X1)風(fēng)速(X4)氣溫(X2)Model123BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95% Confidence Interval for BToleranceVIFCollinearity StatisticsDependent Variable: NO(Y)a. 容忍度容忍度 =1/V

23、IF經(jīng)驗(yàn)表明:經(jīng)驗(yàn)表明:VIF大于大于5或或10時(shí),存在嚴(yán)重的共線性;一時(shí),存在嚴(yán)重的共線性;一般要求般要求Tolerance必須大于必須大于0.1,或,或 VIF必須小于必須小于10。C Co ol ll li in ne ea ar ri it ty y D Di ia ag gn no os st ti ic cs sa a1.9781.000.01.01.0229.566.99.992.7721.000.00.00.02.2173.574.00.04.48.01115.731.99.96.513.7551.000.00.00.01.00.2194.137.00.03.43.00.018

24、14.367.02.67.54.41.00722.717.97.30.02.58Dimension121231234Model123EigenvalueConditionIndex(Constant)車流量(X1)風(fēng)速(X4)氣溫(X2)Variance ProportionsDependent Variable: NO(Y)a. 3.條件數(shù)條件數(shù)condition index / 方差比例方差比例variance proportions, VP 一般地,當(dāng)一般地,當(dāng)條件數(shù)條件數(shù)大于大于10,且有兩個(gè)以上的自變量對(duì),且有兩個(gè)以上的自變量對(duì)應(yīng)的應(yīng)的方差比例方差比例大于大于0.5時(shí),可以認(rèn)為這些自

25、變量是嚴(yán)時(shí),可以認(rèn)為這些自變量是嚴(yán)重相關(guān)的。重相關(guān)的。 2.多重線性回歸分析的結(jié)果輸出:多重線性回歸分析的結(jié)果輸出: 決定系數(shù)越大,說明構(gòu)建的回歸方程越好 Enter:強(qiáng)制引入法:強(qiáng)制引入法 未標(biāo)準(zhǔn)化的未標(biāo)準(zhǔn)化的 回歸系數(shù)及標(biāo)準(zhǔn)誤回歸系數(shù)及標(biāo)準(zhǔn)誤回歸系數(shù)回歸系數(shù)的的t t檢驗(yàn)檢驗(yàn)標(biāo)準(zhǔn)化的標(biāo)準(zhǔn)化的回歸系數(shù)回歸系數(shù)4321035. 0000006. 0004. 0116. 0142. 0 xxxxyM Mo od de el l S Su um mm ma ar ry yd d.808a.653.637.035801.851b.725.698.032640.887c.787.755.0293871

26、.593Model123RR SquareAdjustedR SquareStd. Error ofthe EstimateDurbin-WatsonPredictors: (Constant), 車流量(X1)a. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4)b. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4), 氣溫(X2)c. Dependent Variable: NO(Y)d. 決定系數(shù)越大,說明構(gòu)建的回歸方程越好。 STEPWISE:逐步回歸方程的決定系數(shù):逐步回歸方程的決定系數(shù)A AN NO OV VA Ad d.

27、0531.05341.376.000a.02822.001.08123.0592.02927.623.000b.02221.001.08123.0643.02124.687.000c.01720.001.08123RegressionResidualTotalRegressionResidualTotalRegressionResidualTotalModel123Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 車流量(X1)a. Predictors: (Constant), 車流量(X1), 風(fēng)速(X4)b. Predictor

28、s: (Constant), 車流量(X1), 風(fēng)速(X4), 氣溫(X2)c. Dependent Variable: NO(Y)d. STEPWISE:逐步回歸方程的方差分析表:逐步回歸方程的方差分析表C Co oe ef ff fi ic ci ie en nt ts sa a-.135.035-3.829.001-.209-.062.158.025.8086.432.000.107.210-.050.049-1.027.316-.151.051.122.027.6234.476.000.065.179-.025.011-.325-2.338.029-.048-.003-.142.058

29、-2.452.024-.263-.021.116.025.5924.699.000.065.168-.035.010-.448-3.316.003-.057-.013.004.002.2732.430.025.001.008(Constant)車流量(X1)(Constant)車流量(X1)風(fēng)速(X4)(Constant)車流量(X1)風(fēng)速(X4)氣溫(X2)Model123BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Lower BoundUpper Bound95% Confidence Inte

30、rval for BDependent Variable: NO(Y)a. 未標(biāo)準(zhǔn)化的未標(biāo)準(zhǔn)化的 回歸系數(shù)及標(biāo)準(zhǔn)誤回歸系數(shù)及標(biāo)準(zhǔn)誤回歸系數(shù)回歸系數(shù)的的t t檢驗(yàn)檢驗(yàn)標(biāo)準(zhǔn)化的標(biāo)準(zhǔn)化的回歸系數(shù)回歸系數(shù) STEPWISE:逐步回歸方程的參數(shù)估計(jì):逐步回歸方程的參數(shù)估計(jì)421035. 0004. 0116. 0142. 0 xxxy 回歸分析結(jié)果回歸分析結(jié)果:421035. 0004. 0116. 0142. 0 xxxy2. 影響因素分析:根據(jù)影響因素分析:根據(jù)SPSS輸出結(jié)果,可以認(rèn)為車流輸出結(jié)果,可以認(rèn)為車流量、氣溫和風(fēng)速是影響空氣中量、氣溫和風(fēng)速是影響空氣中NO濃度的主要因素:濃度的主要因素:

31、u車流量增加車流量增加1千輛,估計(jì)千輛,估計(jì)NO濃度平均升高濃度平均升高0.11610-6;u氣溫上升氣溫上升1,估計(jì),估計(jì)NO濃度平均升高濃度平均升高0.00410-6;u風(fēng)速增加風(fēng)速增加1m/s,估計(jì),估計(jì)NO濃度平均減少濃度平均減少0.03510-6。3. 根據(jù)標(biāo)準(zhǔn)化偏回歸系數(shù),認(rèn)為作用車流量根據(jù)標(biāo)準(zhǔn)化偏回歸系數(shù),認(rèn)為作用車流量氣溫氣溫風(fēng)速。風(fēng)速。4. 根據(jù)確定系數(shù),方程根據(jù)確定系數(shù),方程3因素可解釋污染變異的因素可解釋污染變異的78.7%。1. 回歸方程回歸方程(二)(二)Logistic回歸分析回歸分析例例18-1 為了解某藥引發(fā)臨床上消化道出血情況,開展為了解某藥引發(fā)臨床上消化道出

32、血情況,開展了大樣本安全性評(píng)價(jià)?;仡櫺哉{(diào)查了大樣本安全性評(píng)價(jià)?;仡櫺哉{(diào)查47136例服用該藥例服用該藥的患者中,有的患者中,有155例上消化道出血;同期沒有服用該例上消化道出血;同期沒有服用該藥的藥的44634例對(duì)照中,有例對(duì)照中,有96例上消化道出血。例上消化道出血。X=1:服藥:服藥 X=0:未服藥:未服藥賦值:賦值: Y=1:有消化道出血:有消化道出血 Y=0:無消化道出血:無消化道出血3. logistic回歸模型擬合步驟:回歸模型擬合步驟: 估計(jì)參數(shù):估計(jì)參數(shù):0、 1 、 2、 i回歸方程的假設(shè)檢驗(yàn)回歸方程的假設(shè)檢驗(yàn)統(tǒng)計(jì)應(yīng)用統(tǒng)計(jì)應(yīng)用極大似然法極大似然法列出回歸方程列出回歸方程回歸系

33、數(shù)的區(qū)間估計(jì)回歸系數(shù)的區(qū)間估計(jì)1.檢驗(yàn)整個(gè)模型檢驗(yàn)整個(gè)模型 似然比檢驗(yàn)似然比檢驗(yàn)2.檢驗(yàn)單個(gè)自變量檢驗(yàn)單個(gè)自變量 Wald檢驗(yàn)檢驗(yàn)iiiiXXXXXXee.221102211011. 預(yù)測預(yù)測某陽性事件發(fā)生概率大小某陽性事件發(fā)生概率大小2. 分析影響因素分析影響因素,定量描述其作用,定量描述其作用【電腦實(shí)現(xiàn)電腦實(shí)現(xiàn)】SPSS1. 數(shù)據(jù)錄入數(shù)據(jù)錄入Logistic 回歸分析:回歸分析:注意:注意:一般將陽性事件定義為一般將陽性事件定義為1;陰性事件定義為;陰性事件定義為0。2. 數(shù)字加權(quán)數(shù)字加權(quán)3. SPSS過程過程Model SummaryModel Summary3452.912a.000.

34、003Step1-2 LoglikelihoodCox & SnellR SquareNagelkerkeR SquareEstimation terminated at iteration number 9 becauseparameter estimates changed by less than .001.a. 3. 結(jié)果及結(jié)果輸出:結(jié)果及結(jié)果輸出: Enter:強(qiáng)制進(jìn)入法:強(qiáng)制進(jìn)入法與線性回歸中的決與線性回歸中的決定系數(shù)有相似之處定系數(shù)有相似之處 -2倍的對(duì)數(shù)似然值,用來倍的對(duì)數(shù)似然值,用來表示模型的擬合效果,越接表示模型的擬合效果,越接近于與,說明效果越好。近于與,說明效果

35、越好。是是 Cox & Snell R square的的校正,取值校正,取值0-1,越接近,越接近1,說明方程的擬合效果越好。說明方程的擬合效果越好。Variables in the EquationVariables in the Equation.426.13010.7141.0011.531-6.140.1023611.0831.000.002服藥ConstantStep1aBS.E.WalddfSig.Exp(B)Variable(s) entered on step 1: 服藥.a. 回歸系數(shù)回歸系數(shù)回歸系數(shù)的回歸系數(shù)的Wald x2檢驗(yàn)檢驗(yàn)回歸系數(shù)回歸系數(shù)的標(biāo)準(zhǔn)誤的標(biāo)準(zhǔn)誤

36、Enter: 強(qiáng)制進(jìn)入法回歸方程的參數(shù)估計(jì)強(qiáng)制進(jìn)入法回歸方程的參數(shù)估計(jì)OR值值X426. 0140. 61ln列入方程:列入方程:XXee426.0140.6426.0140.61或或 常數(shù)項(xiàng)常數(shù)項(xiàng)是未服用該藥品人群是未服用該藥品人群“發(fā)生出血癥狀發(fā)生出血癥狀”優(yōu)勢估優(yōu)勢估計(jì)值的自然對(duì)數(shù)計(jì)值的自然對(duì)數(shù), 自變量自變量X的回歸系數(shù)的回歸系數(shù)是是優(yōu)勢比估計(jì)值的自然對(duì)數(shù)優(yōu)勢比估計(jì)值的自然對(duì)數(shù)。 1.樣本優(yōu)勢比樣本優(yōu)勢比OR值:值:exp(0.426)=1.5306; 3.總體總體OR的的95%置信區(qū)間為:置信區(qū)間為:1.1861.975, 置信區(qū)間下限大于置信區(qū)間下限大于1,因此服用非甾體抗炎藥是上

37、消化,因此服用非甾體抗炎藥是上消化道出血癥狀的危險(xiǎn)因素。道出血癥狀的危險(xiǎn)因素。X426. 0140. 61ln 回歸模型的解釋:回歸模型的解釋: 結(jié)果報(bào)告結(jié)果報(bào)告: 為評(píng)價(jià)服用非甾體類藥物是否引起消化道出血的癥狀,為評(píng)價(jià)服用非甾體類藥物是否引起消化道出血的癥狀,用回顧性調(diào)查的跟蹤調(diào)查了用回顧性調(diào)查的跟蹤調(diào)查了47136例服藥患者的消化道出血情例服藥患者的消化道出血情況,另外用況,另外用44634例未服藥的患者作為對(duì)照。例未服藥的患者作為對(duì)照。 logistic 回歸分析顯示:服用非甾體類藥物與消化道出血的回歸分析顯示:服用非甾體類藥物與消化道出血的癥狀有關(guān)(癥狀有關(guān)(P0.001),服藥組對(duì)非

38、服藥組的優(yōu)勢比為),服藥組對(duì)非服藥組的優(yōu)勢比為1.513,其其95%置信區(qū)間為置信區(qū)間為1.1861.975。variableCoefficient Stand errorWald x2POdd ratio95%CIalimentary tract hemorrhage0.4260.13010.7140.0011.5131.1861.975Constant-6.1400.1023611.0830.0000.002附表附表 非甾體類藥物與消化道出血的非甾體類藥物與消化道出血的logistic回歸分析結(jié)果回歸分析結(jié)果 性別性別 X1 年齡年齡 X2 年人均收入年人均收入 X3 醫(yī)療保障醫(yī)療保障 X

39、4 距就近醫(yī)療點(diǎn)時(shí)間距就近醫(yī)療點(diǎn)時(shí)間 X5 自感疾病嚴(yán)重程度自感疾病嚴(yán)重程度 X6 發(fā)病時(shí)間發(fā)病時(shí)間 X7 就診就診 Y (二)多自變量的(二)多自變量的LogisticLogistic回歸回歸例:研究居民兩周患病例:研究居民兩周患病未治療未治療的影響因素,采用多階段的影響因素,采用多階段分層整群抽樣,對(duì)某地分層整群抽樣,對(duì)某地11,790名居民進(jìn)行了調(diào)查,其中名居民進(jìn)行了調(diào)查,其中兩周患病者兩周患病者1649人,未就醫(yī)者人,未就醫(yī)者720人,試作回歸分析。人,試作回歸分析。 變變 量量 賦賦 值值X1 性別性別男:男:0,女:,女:1X2 年齡年齡5歲歲:1, 5歲歲:2, 15歲歲:3,

40、45歲歲:4, 65歲歲:5X3 年人均收入年人均收入不低于平均水平不低于平均水平:0,低于平均水平,低于平均水平:1X4 醫(yī)療保障醫(yī)療保障有有:0,無,無:1X5 距就近醫(yī)療點(diǎn)時(shí)間距就近醫(yī)療點(diǎn)時(shí)間10min:1 ,10min:2,30min:3X6 自感疾病嚴(yán)重程度自感疾病嚴(yán)重程度不嚴(yán)重不嚴(yán)重:1,一般,一般:2,嚴(yán)重,嚴(yán)重:3X7 發(fā)病時(shí)間發(fā)病時(shí)間急診病兩周內(nèi)發(fā)生急診病兩周內(nèi)發(fā)生:1,急診病兩周前發(fā)生延續(xù)到兩周內(nèi)急診病兩周前發(fā)生延續(xù)到兩周內(nèi):2,慢性病持續(xù)到兩周內(nèi)慢性病持續(xù)到兩周內(nèi):3Y 就診就診就診就診:0,未就診,未就診:1指標(biāo)賦值:指標(biāo)賦值:分類變量或分類變量或(名義變量)(名義變量

41、)【電腦實(shí)現(xiàn)電腦實(shí)現(xiàn)】SPSS1. 數(shù)據(jù)錄入數(shù)據(jù)錄入2. SPSS過程過程自變量的選入方法自變量的選入方法EnterForward: ConditionalForward: LRForward: WaldBackward: ConditionalBackward: LR1.Backward: Wald注意:基于條件參數(shù)估計(jì)(注意:基于條件參數(shù)估計(jì)(Condional)和偏最大似然估計(jì))和偏最大似然估計(jì)(LR)的篩選方法都)的篩選方法都 比較可靠,尤以后者為佳;比較可靠,尤以后者為佳; 但基于但基于Wald檢驗(yàn)的結(jié)果,因未考慮各因素的綜合作用,當(dāng)因素間存檢驗(yàn)的結(jié)果,因未考慮各因素的綜合作用,當(dāng)因

42、素間存在共線性時(shí)要不可靠,應(yīng)慎用。在共線性時(shí)要不可靠,應(yīng)慎用。 ?!綧ethod】Enter:所有自變量強(qiáng)制進(jìn)入回歸方程;:所有自變量強(qiáng)制進(jìn)入回歸方程;Forward - Conditional:基于條件參數(shù)的向前:基于條件參數(shù)的向前逐步回歸法;逐步回歸法;Forward - LR:基于最大似然估計(jì)的向前逐步:基于最大似然估計(jì)的向前逐步回歸法;回歸法;Forward - Wald:基于:基于Ward統(tǒng)計(jì)量的向前逐步統(tǒng)計(jì)量的向前逐步回歸法;回歸法;Backward - Conditional:基于條件參數(shù)的向后:基于條件參數(shù)的向后逐步回歸法;逐步回歸法;Backward - LR:基于最大似然估

43、計(jì)的向后逐:基于最大似然估計(jì)的向后逐步回歸法;步回歸法;Backward - Wald:基于:基于Ward統(tǒng)計(jì)量的向后逐統(tǒng)計(jì)量的向后逐步回歸法;步回歸法;即:計(jì)算出來的即:計(jì)算出來的i是以該變量是以該變量的最后一個(gè)作為參照水平的最后一個(gè)作為參照水平 【 Categorical】如果自變量是無序分類變量(如血型等)如果自變量是無序分類變量(如血型等)和不等距有有序變量,須將其啞變量化,那么就要用該和不等距有有序變量,須將其啞變量化,那么就要用該按鈕將該變量指定為分類變量,如果有必要,可用里面按鈕將該變量指定為分類變量,如果有必要,可用里面的選擇按鈕進(jìn)行詳細(xì)的定義,如以哪個(gè)取值作為基礎(chǔ)水的選擇按鈕

44、進(jìn)行詳細(xì)的定義,如以哪個(gè)取值作為基礎(chǔ)水平,默認(rèn)的是以最大取值為基礎(chǔ)水平。平,默認(rèn)的是以最大取值為基礎(chǔ)水平。 【Option】:Removal: 設(shè)為設(shè)為0.05(和課本保持一致)(和課本保持一致)3. 結(jié)果輸出:(結(jié)果輸出:( Backward LR Method)賦賦值結(jié)果:值結(jié)果:“發(fā)病時(shí)間發(fā)病時(shí)間”啞變量化結(jié)果:啞變量化結(jié)果: 運(yùn)行結(jié)果:運(yùn)行結(jié)果: 對(duì)回歸模型對(duì)回歸模型假設(shè)檢驗(yàn):假設(shè)檢驗(yàn):727162340. 0500. 0609. 0233. 0467. 0)1ln(XXXXPP列方程:列方程:727162727162340. 0500. 0609. 0233. 0467. 0340.

45、 0500. 0609. 0233. 0467. 01XXXXXXXXeeP或:或:結(jié)果報(bào)告:結(jié)果報(bào)告: 為研究過去兩周內(nèi)患病居民未治療率的影響因素,采用為研究過去兩周內(nèi)患病居民未治療率的影響因素,采用現(xiàn)況調(diào)查方法,調(diào)查了過去兩周內(nèi)患病者現(xiàn)況調(diào)查方法,調(diào)查了過去兩周內(nèi)患病者1 649人,采用非條人,采用非條件件logistic回歸分析,向后逐步篩選變量,結(jié)果顯示:年齡、自回歸分析,向后逐步篩選變量,結(jié)果顯示:年齡、自感疾病嚴(yán)重程度和發(fā)病時(shí)間三個(gè)變量有統(tǒng)計(jì)學(xué)意義感疾病嚴(yán)重程度和發(fā)病時(shí)間三個(gè)變量有統(tǒng)計(jì)學(xué)意義( P0.001 ),OR值的估計(jì)值分別為值的估計(jì)值分別為1.262、0.544、0.606

46、(類別類別1與與3相比相比)和和0.712(類別(類別2與與3比),比),OR值的值的95%置信敬意分別為(置信敬意分別為(1.128,1.412)、()、(0.468、0.632)、()、(0.480,0.766)和()和(0.495,1.022)。)。variableCoefficient Stand errorWald x2POdd ratio95%CIalimentary tract hemorrhage0.4260.13010.7140.0011.5131.1861.975Constant-6.1400.1023611.0830.0000.002(四)(四)Cox 回歸分析回歸分析例:例:某醫(yī)院泌尿外科醫(yī)師對(duì)某醫(yī)院泌尿外科醫(yī)師對(duì)可能影響膀胱腫瘤術(shù)生生可能影響膀胱腫瘤術(shù)生生存的因素存的因素進(jìn)行了調(diào)查,選擇進(jìn)行了調(diào)查,選擇1996-2000年間手術(shù)治療的年間手術(shù)治療的膀胱

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論