《多元統(tǒng)計(jì)分析-基于R(第3版)》課件 第5章-多元線性模型_第1頁
《多元統(tǒng)計(jì)分析-基于R(第3版)》課件 第5章-多元線性模型_第2頁
《多元統(tǒng)計(jì)分析-基于R(第3版)》課件 第5章-多元線性模型_第3頁
《多元統(tǒng)計(jì)分析-基于R(第3版)》課件 第5章-多元線性模型_第4頁
《多元統(tǒng)計(jì)分析-基于R(第3版)》課件 第5章-多元線性模型_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

主編:費(fèi)宇中國人民大學(xué)出版社5.1多元正態(tài)分布5.2多元線性模型5.3變量選擇5.4回歸診斷5.5回歸預(yù)測第5章多元線性模型2主編:費(fèi)宇2024/7/315.1.1多元正態(tài)分布的定義5.1多元正態(tài)分布2024/7/313主編:費(fèi)宇5.1.1多元正態(tài)分布的定義5.1多元正態(tài)分布2024/7/314主編:費(fèi)宇5.1.2多元正態(tài)分布的性質(zhì)5.1多元正態(tài)分布2024/7/315主編:費(fèi)宇5.1.2多元正態(tài)分布的性質(zhì)5.1多元正態(tài)分布2024/7/316主編:費(fèi)宇5.2多元線性模型5.2.1模型定義其中x1,…,xp是非隨機(jī)的自變量,y是隨機(jī)的因變量,β0是常數(shù)項(xiàng),β1,…,βp是回歸系數(shù),ε是隨機(jī)誤差項(xiàng).7主編:費(fèi)宇2024/7/315.2.1.模型定義模型(5.1)的樣本形式其中i=1,…,n,表示有n組觀測值.8主編:費(fèi)宇2024/7/315.2.1.模型定義模型(5.2)的矩陣形式其中9主編:費(fèi)宇2024/7/31例5.1(數(shù)據(jù)文件為eg5.1)10主編:費(fèi)宇表5-1抽樣調(diào)查得到的36個(gè)學(xué)生的相關(guān)成績2024/7/31yx1x2x3x4x5yx1x2x3x4x5858386909076456065608678909288879280768081758075787076738590888582868580807281829088828081868790………………………………928385908580627865608588788482739083878083857883模型(5.3)的參數(shù)的最小二乘估計(jì)的最小二乘估計(jì)

5.2.2模型的參數(shù)估計(jì)和檢驗(yàn)2024/7/3111主編:費(fèi)宇1.回歸方程的顯著性檢驗(yàn)其中是回歸平方和,而

是殘差平方和,拒絕域?yàn)?/p>

5.2.2模型的參數(shù)估計(jì)和檢驗(yàn)2024/7/3112主編:費(fèi)宇5.2.2模型的參數(shù)估計(jì)和檢驗(yàn)2024/7/3113主編:費(fèi)宇例5.1續(xù)1(數(shù)據(jù)文件為eg5.1)14主編:費(fèi)宇建立y關(guān)于x1、x2、x3、x4和x5的線性回歸方程,并對(duì)方程和回歸系數(shù)進(jìn)行顯著性檢驗(yàn).2024/7/31yx1x2x3x4x5yx1x2x3x4x5858386909076456065608678909288879280768081758075787076738590888582868580807281829088828081868790………………………………928385908580627865608588788482739083878083857883#例5.1回歸分析:全變量回歸setwd("C:/data")#設(shè)定工作路徑d5.1<-read.csv("exam5.1.csv",header=T)#將exam5.1.csv數(shù)據(jù)讀入到d5.1中l(wèi)m.exam<-lm(y~x1+x2+x3+x4+x5,data=d5.1)#建立y關(guān)于x1,x2,x3,x4和x5的線性回歸方程,數(shù)據(jù)為d5.1summary(lm.exam)#給出回歸系數(shù)的估計(jì)和顯著性檢驗(yàn)等例5.1續(xù)1(數(shù)據(jù)文件為eg5.1)15主編:費(fèi)宇R程序?yàn)?Call:lm(formula=y~x1+x2+x3+x4+x5,data=d5.1)Residuals:Min1QMedian3QMax-10.0696-1.7983-0.15352.93616.8726

Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)-32.7353415.35701-2.1320.0413*x10.162710.150311.0820.2877x20.227840.138351.6470.1100x30.881160.111087.9337.46e-09***x4-0.051360.15476-0.3320.7423x50.168870.143761.1750.2494回歸分析結(jié)果為2024/7/3116主編:費(fèi)宇---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1

Residualstandarderror:4.021on30degreesoffreedomMultipleR-squared:0.8945,AdjustedR-squared:0.877F-statistic:50.89on5and30DF,p-value:9.359e-14例5.1續(xù)(數(shù)據(jù)文件為eg5.1)2024/7/3117主編:費(fèi)宇回歸方程的F值為50.89,相應(yīng)的p值為9.359

10-14,說明回歸方程是顯著的;但t檢驗(yàn)對(duì)應(yīng)的p值則顯示:常數(shù)項(xiàng)和x3是顯著的,而x1、x2、x4和x5不顯著.最優(yōu)模型一般滿足2個(gè)條件(1)模型反映了變量間的真實(shí)關(guān)系

(2)模型包含的變量盡量少例5.1(續(xù)2)建立y關(guān)于x1、x2、x3、x4和x5的線性回歸方程,并對(duì)方程和回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(逐步回歸建立“最優(yōu)方程”).

5.3變量選擇2024/7/3118主編:費(fèi)宇>#例5.1回歸分析:逐步回歸>#假設(shè)exam5.1.xls中的數(shù)據(jù)已經(jīng)讀入到d5.1中>lm.exam<-lm(y~x1+x2+x3+x4+x5,data=d5.1)#建立全變量回歸方程>lm.step<-step(lm.exam,direction="both")#進(jìn)行逐步回歸5.3變量選擇2024/7/3119主編:費(fèi)宇例5.1(續(xù)2)逐步回歸程序Start:AIC=105.63y~x1+x2+x3+x4+x5

DfSumofSqRSSAIC-x411.78486.83103.76-x1118.95503.99105.01-x5122.31507.36105.25<none>485.05105.63-x2143.85528.90106.74-x311017.441502.49144.335.3變量選擇2024/7/3120主編:費(fèi)宇例5.1(續(xù))回歸結(jié)果Step:AIC=103.76y~x1+x2+x3+x5

DfSumofSqRSSAIC-x1117.91504.73103.06-x5120.57507.40103.25<none>486.83103.76-x2142.99529.81104.80+x411.78485.05105.63-x311112.961599.79144.595.3變量選擇2024/7/3121主編:費(fèi)宇Step:AIC=103.06y~x2+x3+x5

DfSumofSqRSSAIC-x5117.40522.14102.28<none>504.73103.06+x1117.91486.83103.76+x410.74503.99105.01-x2170.76575.50105.78-x311848.492353.23156.485.3變量選擇2024/7/3122主編:費(fèi)宇Step:AIC=102.28y~x2+x3

DfSumofSqRSSAIC<none>522.14102.28+x5117.40504.73103.06+x1114.74507.40103.25+x410.25521.89104.26-x2166.64588.78104.60-x311953.302475.43156.305.3變量選擇2024/7/3123主編:費(fèi)宇Call:lm(formula=y~x2+x3,data=d5.1)Residuals:Min1QMedian3QMax-10.4395-2.5508-0.44592.73677.2345

Coefficients:EstimateStd.ErrortvaluePr(>|t|)(Intercept)-18.842907.58902-2.4830.0183*x20.249230.121442.0520.0481*x30.968040.0871311.1111.09e-12***---Signif.codes:0‘***’0.001‘**’0.01‘*’0.05‘.’0.1‘’1

Residualstandarderror:3.978on33degreesoffreedomMultipleR-squared:0.8865,AdjustedR-squared:0.8796F-statistic:128.8on2and33DF,p-value:2.566e-16回歸模型匯總信息:summary(lm.step)2024/7/3124主編:費(fèi)宇5.4.1殘差分析和異常點(diǎn)探測

殘差向量e是模型中隨機(jī)誤差項(xiàng)

的估計(jì),殘差分析可以診斷模型的基本假定是否成立。

5.4

回歸診斷2024/7/3125主編:費(fèi)宇例5.2

計(jì)算例5.1得到的逐步回歸模型lm.step的普通殘差和標(biāo)準(zhǔn)化殘差,判斷可能存在的異常點(diǎn),畫出相應(yīng)的殘差散點(diǎn)圖,并直觀判斷模型的基本假定是否成立.5.4

回歸診斷2024/7/3126主編:費(fèi)宇#例5.2#假設(shè)由例5.1已經(jīng)得到逐步回歸模型lm.stepy.res<-residuals(lm.exam)#計(jì)算模型lm.exam的普通殘差y.rst<-rstandard(lm.step)#計(jì)算回歸模型lm.step的標(biāo)準(zhǔn)化殘差print(y.rst)#輸出回歸模型lm.step的標(biāo)準(zhǔn)化殘差y.rsty.fit<-predict(lm.step)#計(jì)算回歸模型lm.step的預(yù)測值plot(y.res~y.fit)#繪制以普通殘差為縱坐標(biāo),預(yù)測值為橫坐標(biāo)的散點(diǎn)圖plot(y.rst~y.fit)#繪制以標(biāo)準(zhǔn)化殘差為縱坐標(biāo),預(yù)測值為橫坐標(biāo)的散點(diǎn)圖5.4

回歸診斷2024/7/3127主編:費(fèi)宇分別采用residuals(),rstandard()和rstudent()來計(jì)算普通殘差,標(biāo)準(zhǔn)化殘差和學(xué)生化殘差.123456-1.226479490.701233481.85465439-0.18487397-0.731575470.14591132789101112-0.651653781.37662024-0.28171298-0.96473838-0.798622470.81284419131415161718-0.48393343-1.176685880.913377160.564389020.658766891.49006874192021222324-2.871217390.527102680.81076269-0.668013511.20184149-1.040201892526272829300.32282704-0.04616114-0.159120010.21602487-0.21306706-0.23026109313233343536-0.24302334-2.03567204-0.33183300-0.073548931.804380090.737029325.4

回歸診斷2024/7/3128主編:費(fèi)宇回歸模型lm.step的標(biāo)準(zhǔn)化殘差y.rst如下第19號(hào)點(diǎn)是異常點(diǎn)2024/7/3129主編:費(fèi)宇圖5-1例5.2中的普通殘差圖(左)和標(biāo)準(zhǔn)化殘差圖(右)例5.3

通過方差穩(wěn)定變換來更新例5.1得到的逐步回歸模型lm.step,并計(jì)算更新后模型的標(biāo)準(zhǔn)化殘差,畫出相應(yīng)的殘差散點(diǎn)圖,并直觀判斷模型的基本假定是否成立.5.4

回歸診斷2024/7/3130主編:費(fèi)宇#例5.3#假設(shè)由例5.1已經(jīng)得到逐步回歸模型lm.steplm.step_new<-update(lm.step,log(.)~.)#對(duì)模型進(jìn)行對(duì)數(shù)變換y.rst<-rstandard(lm.step_new)#計(jì)算lm.step_new的標(biāo)準(zhǔn)化殘差y.fit<-predict(lm.step_new)#計(jì)算lm.step_new的預(yù)測值plot(y.rst~y.fit)#繪制以標(biāo)準(zhǔn)化殘差為縱坐標(biāo),預(yù)測值為橫坐標(biāo)的散點(diǎn)圖(見圖5-2)采用對(duì)數(shù)變換來解決方差非齊問題2024/7/3131主編:費(fèi)宇對(duì)數(shù)變換后:第19號(hào)點(diǎn)是異常點(diǎn)2024/7/3132主編:費(fèi)宇圖5-2例5.3中的標(biāo)準(zhǔn)化殘差圖lm.exam<-lm(log(y)~x1+x2+x3+x4,data=d5.1[-c(19),])#去掉第19號(hào)觀測值再建立全變量回歸方程lm.step<-step(lm.exam,direction="both")#用一切子集回歸法來進(jìn)行逐步回歸y.rst<-rstandard(lm.step)#計(jì)算回歸模型lm.step的標(biāo)準(zhǔn)化殘差y.fit<-predict(lm.step)#計(jì)算回歸模型lm.step的預(yù)測值plot(y.rst~y.fit)#繪制以標(biāo)準(zhǔn)化殘差為縱坐標(biāo),預(yù)測值為橫坐標(biāo)的散點(diǎn)圖去掉19號(hào)觀測值再回歸2024/7/3133主編:費(fèi)宇殘差幾乎全部落在[-2,2]區(qū)域內(nèi)2024/7/3134主編:費(fèi)宇圖5-3例5.3中的標(biāo)準(zhǔn)化殘差圖:去掉19號(hào)觀測值5.4.2回歸診斷:一般的方法殘差分析無法分析模型的影響點(diǎn),即探測哪些點(diǎn)對(duì)模型的推斷有重要影響,本節(jié)給出的回歸診斷方法,可以診斷模型的基本假定是否成立,哪些值是異常點(diǎn),哪些點(diǎn)是強(qiáng)影響點(diǎn).在R中,函數(shù)plot()和influence.measures()可以用來繪制診斷圖和計(jì)算診斷統(tǒng)計(jì)量.5.4

回歸診斷2024/7/3135主編:費(fèi)宇例5.4對(duì)例5.3得到的逐步回歸模型lm.step_new進(jìn)行回歸診斷分析.5.4回歸診斷2024/7/3136主編:費(fèi)宇#例5.4#假定由例5.3已經(jīng)獲得模型lm.step_newpar(mfrow=c(2,2))#在一個(gè)2×2網(wǎng)格中創(chuàng)建4個(gè)繪圖區(qū)plot(lm.step_new)#繪制模型診斷圖influence.measures(lm.step_new)#計(jì)算各個(gè)觀測值的診斷統(tǒng)計(jì)量運(yùn)行上述程進(jìn)行序可得回歸診斷圖(圖5-4)和如下36個(gè)觀測值對(duì)應(yīng)的診斷統(tǒng)計(jì)量的值.第11,19和33號(hào)觀測值被診斷為強(qiáng)影響點(diǎn).2024/7/3137主編:費(fèi)宇I(lǐng)nfluencemeasuresoflm(formula=log(y)~x2+x3,data=d5.1):dfb.1_dfb.x2dfb.x3dffitcov.rcook.dhatinf10.172353-0.052013-1.36e-01-0.291711.0522.82e-020.06622-0.0789410.0622346.53e-030.110451.1604.17e-030.069130.196029-0.049262-1.17e-010.373080.8364.31e-020.0383…110.014319-0.1934602.46e-01-0.270291.3462.49e-020.2065*12-0.0378780.0103993.07e-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論