第八講多元線性回歸_第1頁
第八講多元線性回歸_第2頁
第八講多元線性回歸_第3頁
第八講多元線性回歸_第4頁
第八講多元線性回歸_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第八講多元線性回歸第一頁,共十五頁,編輯于2023年,星期一回歸模型例3:血壓與年齡、體重指數(shù)、吸煙習慣序號血壓年齡體重指數(shù)吸煙習慣序號血壓年齡體重指數(shù)吸煙習慣11443924.20211363625.0022154731.11221425026.2131384522.60231203923.50101545619.30301756927.41體重指數(shù)=體重(kg)/身高(m)的平方吸煙習慣:0表示不吸煙,1表示吸煙建立血壓與年齡、體重指數(shù)、吸煙習慣之間的回歸模型第二頁,共十五頁,編輯于2023年,星期一模型建立血壓y,年齡x1,體重指數(shù)x2,吸煙習慣x3

y與x1的散點圖y與x2的散點圖線性回歸模型回歸系數(shù)0,1,2,3由數(shù)據(jù)估計,是隨機誤差第三頁,共十五頁,編輯于2023年,星期一n=30;m=3;y=[144 215 138 145 162 142 170 124 158 154162 150 140 110 128 130 135 114 116 124136 142 120 120 160 158 144 130 125 175];x1=[39 47 45 47 65 46 67 42 67 5664 56 59 34 42 48 45 18 20 1936 50 39 21 44 53 63 29 25 69];x2=[24.231.122.624.025.925.129.519.727.219.328.025.827.320.121.722.227.418.822.621.525.026.223.520.327.128.628.322.025.327.4];x3=[0101101010100001000...00100110101];X=[ones(n,1),x1',x2',x3'];[b,bint,r,rint,s]=regress(y',X);s2=sum(r.^2)/(n-m-1);b,bint,s,s2rcoplot(r,rint)第四頁,共十五頁,編輯于2023年,星期一回歸系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間045.3636[3.553787.1736]10.3604[-0.07580.7965]23.0906[1.05305.1281]311.8246[-0.148223.7973]R2=0.6855

F=18.8906

p<0.0001s2=169.7917模型求解回歸系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間058.5101[29.906487.1138]10.4303[0.12730.7332]22.3449[0.85093.8389]310.3065[3.387817.2253]R2=0.8462F=44.0087

p<0.0001s2=53.6604剔除異常點(第2點和第10點)后xueya01.m第五頁,共十五頁,編輯于2023年,星期一第六頁,共十五頁,編輯于2023年,星期一此時可見第二與第十二個點是異常點,于是刪除上述兩點,再次進行回歸得到改進后的回歸模型的系數(shù)、系數(shù)置信區(qū)間與統(tǒng)計量回歸系數(shù)回歸系數(shù)估計值回歸系數(shù)置信區(qū)間058.5101[29.906487.1138]10.4303[0.12730.7332]22.3449[0.85093.8389]310.3065[3.387817.2253]R2=0.8462F=44.0087

p<0.0001s2=53.6604這時置信區(qū)間不包含零點,F(xiàn)統(tǒng)計量增大,可決系數(shù)從0.6855增大到0.8462,我們得到回歸模型為:第七頁,共十五頁,編輯于2023年,星期一通常,進行多元線性回歸的步驟如下:(1)做自變量與因變量的散點圖,根據(jù)散點圖的形狀決定是否可以進行線性回歸;(2)輸入自變量與因變量;(3)利用命令:[b,bint,r,rint,s]=regress(y,X,alpha),rcoplot(r,rint)得到回歸模型的系數(shù)以及異常點的情況;(4)對回歸模型進行檢驗首先進行殘差的正態(tài)性檢驗:jbtest,ttest第八頁,共十五頁,編輯于2023年,星期一其次進行殘差的異方差檢驗:戈德菲爾德一匡特(Goldfeld—Quandt)檢驗戈德菲爾德檢驗,簡稱為G—Q檢驗.為了檢驗異方差性,將樣本按解釋變量排序后分成兩部分,再利用樣本1和樣本2分別建立回歸模型,并求出各自的殘差平方和RSSl和RSS2。如果誤差項的離散程度相同(即為同方差的),則RSSl和RSS2的值應(yīng)該大致相同;若兩者之間存在顯著差異,則表明存在異方差.檢驗過程中為了“夸大”殘差的差異性,一般先在樣本中部去掉C個數(shù)據(jù)(通常取c=n/4),再利用F統(tǒng)計量判斷差異的顯著性:第九頁,共十五頁,編輯于2023年,星期一其中,n為樣本容量,k為自變量個數(shù).然后對殘差進行自相關(guān)性的檢驗,通常我們利用DW檢驗進行殘差序列自相關(guān)性的檢驗。該檢驗的統(tǒng)計量為:其中為殘差序列,對于計算出的結(jié)果通過查表決定是否存在自相關(guān)性。若du<DW<4-du,則不存在自相關(guān)性;若DW<dl,則存在一階正相關(guān);

DW>4-dl,則存在一階負相關(guān);若dl<DW<du或4-du<DW<4-dl,則無法判斷第十頁,共十五頁,編輯于2023年,星期一下面我們對模型進行檢驗:(1)殘差的正態(tài)檢驗:由jbtest檢驗,h=0表明殘差服從正態(tài)分布,進而由t檢驗可知h=0,p=1,故殘差服從均值為零的正態(tài)分布;(2)殘差的異方差檢驗:我們將28個數(shù)據(jù)從小到大排列,去掉中間的6個數(shù)據(jù),得到F統(tǒng)計量的觀測值為:f=1.9092,由F(7,7)=3.79,可知:f=1.9092<3.79,故不存在異方差.(3)殘差的自相關(guān)性檢驗:計算得到:dw=1.4330,查表后得到:dl=0.97,du=1.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論