第十一講多元線性回歸模型_第1頁(yè)
第十一講多元線性回歸模型_第2頁(yè)
第十一講多元線性回歸模型_第3頁(yè)
第十一講多元線性回歸模型_第4頁(yè)
第十一講多元線性回歸模型_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十一講多元線性回歸模型第1頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics安徽財(cái)經(jīng)大學(xué)AnhuiUniversityofFinance&Economics1959第十一講多元線性回歸模型第2頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月回歸分析就是根據(jù)實(shí)驗(yàn)數(shù)據(jù)或歷史數(shù)據(jù),研究變量之間的相關(guān)關(guān)系,建立起一個(gè)數(shù)學(xué)模型,進(jìn)而將此模型用于預(yù)測(cè)或控制.一般:設(shè)Y是一個(gè)為因變量(內(nèi)生變量、被解釋變量),為自變量(解釋變量)如果,其中是隨機(jī)誤差,稱上述表達(dá)式為多元線性回歸模型.

第3頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月利用多元回歸模型解決實(shí)際問(wèn)題有以下幾個(gè)步驟:

(1)作出各解釋變量與因變量的散點(diǎn)圖,根據(jù)散點(diǎn)圖的形狀決定是否可以進(jìn)行線性回歸;(2)建立模型求解回歸系數(shù),并對(duì)其進(jìn)行檢驗(yàn),如果原始數(shù)據(jù)含有異常點(diǎn),則應(yīng)刪除異常點(diǎn)或者引入虛擬變量加以改進(jìn)模型;(3)對(duì)模型的殘差進(jìn)行分析,如果存在異方差,則應(yīng)對(duì)模型進(jìn)行調(diào)整;(4)對(duì)模型的殘差進(jìn)行自相關(guān)性的DW檢驗(yàn),如果存在自相關(guān),則通過(guò)廣義差分變換消除自相關(guān)性;(5)對(duì)模型的結(jié)果給出合理的解釋.第4頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月多元線性回歸模型的Matlab實(shí)現(xiàn)

多元線性回歸的命令:[b,bint,r,rint,s]=regress(y,X,alpha)其中:輸入y:因變量(列向量),X:1與自變量組成的矩陣,Alpha:顯著性水平(缺省時(shí)設(shè)定為0.05)s:4個(gè)統(tǒng)計(jì)量:可決系數(shù)R2,F(xiàn)值,F(1,n-2)分布大于F值的概率p,殘差的誤差平方和S2輸出:b=(),bint:b的置信區(qū)間,r:殘差(列向量),rint:r的置信區(qū)間R2,越接近1越好;p<時(shí)回歸模型有效,S2越小越好第5頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月rcoplot(r,rint)然后作出殘差及其置信區(qū)間圖形,命令為:根據(jù)圖形,如果有異常點(diǎn)(該點(diǎn)為紅色),剔除異常點(diǎn)后再次進(jìn)行回歸。

最后對(duì)模型進(jìn)行檢驗(yàn):

(1)殘差的正態(tài)檢驗(yàn):由jbtest檢驗(yàn),h=0表明殘差服從正態(tài)分布,h=1表明殘差不服從正態(tài)分布(2)殘差的異方差檢驗(yàn)(3)殘差的自相關(guān)性檢驗(yàn)(后續(xù)課程介紹)第6頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月例1:根據(jù)下面的數(shù)據(jù)建立血壓與年齡、體重指數(shù)、吸煙習(xí)慣之間的回歸模型

序號(hào)血壓年齡體重指數(shù)吸煙習(xí)慣序號(hào)血壓年齡體重指數(shù)吸煙習(xí)慣11443924.20211363625.0022154731.11221425026.2131384522.60231203923.50101545619.30301756927.41(完整數(shù)據(jù)詳細(xì)見(jiàn)后面的程序中)第7頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月說(shuō)明:體重指數(shù)=體重(kg)/身高(m)的平方吸煙習(xí)慣:0表示不吸煙,1表示吸煙首先做出血壓與年齡,血壓與體重指數(shù)之間的散點(diǎn)圖

散點(diǎn)圖命令為:

y=[144 215 138 145 162 142 170 124 158 154162 150 140 110 128 130 135 114 116 124136 142 120 120 160 158 144 130 125 175];x1=[39 47 45 47 65 46 67 42 67 5664 56 59 34 42 48 45 18 20 1936 50 39 21 44 53 63 29 25 69];第8頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月x2=[24.231.122.624.025.925.129.519.727.219.328.025.827.320.121.722.227.418.822.621.525.026.223.520.327.128.628.322.025.327.4];x3=[010110101010000100000100110101];plot(x1,y,'*')figure(2);plot(x2,y,'or')可見(jiàn)血壓與年齡、血壓與體重指數(shù)存在一定的線性相關(guān)性,所以建立多元線性回歸模型:

y與x1的散點(diǎn)圖y與x2的散點(diǎn)圖第9頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月其次建立模型(繼續(xù)輸入):Y=y';X=[ones(30,1),x1',x2',x3'];%1與自變量組成的矩陣[b,bint,r,rint,s]=regress(y',X);%多元線性回歸b,bint,srcoplot(r,rint)%作出殘差及其置信區(qū)間圖形回歸系數(shù)回歸系數(shù)估計(jì)值(b)回歸系數(shù)置信區(qū)間(bint)045.3636[3.553787.1736]10.3604[-0.07580.7965]23.0906[1.05305.1281]311.8246[-0.148223.7973]R2=0.6855

F=18.8906

p<0.0001s2=169.7917輸出結(jié)果:第10頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月第三模型的改進(jìn)。的置信區(qū)間包含零點(diǎn),殘差與殘差置信區(qū)間的圖形(如下圖)也有異常點(diǎn),利用索引向量刪除第二與第十點(diǎn)。再次進(jìn)行回歸第11頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月a=[1,3:9,11:30];Y1=Y(a,:);X1=X(a,:);[b1,bint1,r1,rint1,s1]=regress(Y1,X1);b1,bint1,s1命令如下:回歸系數(shù)回歸系數(shù)估計(jì)值回歸系數(shù)置信區(qū)間058.5101[29.906487.1138]10.4303[0.12730.7332]22.3449[0.85093.8389]310.3065[3.387817.2253]R2=0.8462F=44.0087

p<0.0001s2=53.6604這時(shí)置信區(qū)間不包含零點(diǎn),F(xiàn)統(tǒng)計(jì)量增大,可決系數(shù)從0.6855增大到0.8462,S2從169.7減少到53.6第12頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月最后得到回歸模型為:模型的檢驗(yàn)(殘差的正態(tài)檢驗(yàn))輸入命令:h=jbtest(r1)結(jié)果:h=0表明殘差服從正態(tài)分布

說(shuō)明血壓與吸煙習(xí)慣的相關(guān)性最大,與體重指數(shù)的相關(guān)性次之,與年齡的相關(guān)性最小。第13頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月對(duì)于實(shí)際問(wèn)題建立的模型應(yīng)該注意:(1)模型中是否應(yīng)該具有常數(shù)項(xiàng),這取決于該常數(shù)的實(shí)際意義是什么?(2)對(duì)于牽涉到有關(guān)專業(yè)的問(wèn)題,必須請(qǐng)教有關(guān)專家決定自變量的取舍.對(duì)于此題的結(jié)果醫(yī)學(xué)院的專家認(rèn)為:模型中的常數(shù)無(wú)法給出合理的解釋,此外吸煙與血壓的高低沒(méi)有關(guān)系.因此,可以考慮建立血壓與年齡、體重指數(shù)之間的二元回歸模型.第14頁(yè),課件共15頁(yè),創(chuàng)作于2023年2月X1=[75.277.680.77679.581.898.367.77415190.8102.3115.6125137.8175.6155.2];X2=[30.631.333.929.632.527.924.823.633.927.745.542.64045.851.767.265];X3=[21.121.422.921.421.521.721.52122.424.723.224.323.129.124.627.526.5];y=[1090.411331242.11003.21283.21012.21098.8

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論