第三講 MATLAB預(yù)測(1)回歸分析_第1頁
第三講 MATLAB預(yù)測(1)回歸分析_第2頁
第三講 MATLAB預(yù)測(1)回歸分析_第3頁
第三講 MATLAB預(yù)測(1)回歸分析_第4頁
第三講 MATLAB預(yù)測(1)回歸分析_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、先來看兩個例子:先來看兩個例子: 問題1 (血壓與年齡)為了了解血壓隨著年齡的增長而升高的關(guān)系,調(diào)查了30個成年人的血壓,如表所示,我們希望用這組數(shù)確定血壓與年齡之間的關(guān)系,并且由此從年齡預(yù)測血壓可能的變化范圍。表 1序號血壓年齡序號血壓年齡序號血壓年齡11443911162642113636221547121505622142503138451314059231203941454714110342412021516265151284225160446142461613048261585371706717135452714463812442181141828130299158671911620

2、29125251015456201241930175692模型模型:記血壓為y,年齡為x,可以做出如上圖所示的散點(diǎn)圖,從圖形上直觀的可以看出,y與x大致呈線性關(guān)系,即有:01yx需要由數(shù)據(jù)確定系數(shù) 的估計(jì)值 。01,01,此函數(shù)為一元線性函數(shù)!3 問題2 (血壓與年齡,體重指數(shù),吸煙習(xí)慣) 世界衛(wèi)生組織頒布的“體重指數(shù)”的定義是體重(kg)除以身高(m)的平方,下表給出了30個人的體重指數(shù)等數(shù)據(jù),其中,0表示不吸煙,1表示吸煙,怎么考慮吸煙這個因素,此因素對于血壓升高有影響嗎,并對體重指數(shù)為25,50歲的吸煙者的血壓做出預(yù)測。表 2序號 血壓 年齡體重指數(shù)吸煙習(xí)慣序號 血壓 年齡體重指數(shù)吸煙習(xí)

3、慣序號 血壓 年齡體重指數(shù)吸煙習(xí)慣11443924.20111626428.01211363625.0022154731.11121505625.80221425026.2131384522.60131405927.30231203923.5041454724.01141103420.10241202120.3051626525.91151284221.70251604427.1161424625.10161304822.21261585328.6171706729.51171354527.40271446328.3081244219.70181141818.80281302922.01915

4、86727.21191162022.60291252525.30101545619.30201241921.50301756927.414模型:模型:記血壓為 ,年齡為 ,體重指數(shù)為 ,吸煙習(xí)慣為 ,用Matlab將 與 的數(shù)據(jù)做散點(diǎn)圖,看出大致也呈線性關(guān)系,建立模型:y1x2x3xy2x01 12233yxxx由數(shù)據(jù)估計(jì)系數(shù) ,也可看做曲面擬合(其實(shí)為超平面)0234, , ,多元線性回歸多元線性回歸 b=regress( Y, X )npnnppxxxxxxxxxX.1.1.1212222111211nYYYY.21pb.101、確定回歸系數(shù)的點(diǎn)估計(jì)值:確定回歸系數(shù)的點(diǎn)估計(jì)值:ppxxy.

5、110第三講第三講 MATLAB預(yù)測方法(預(yù)測方法(1)回歸分析)回歸分析63、畫出殘差及其置信區(qū)間:畫出殘差及其置信區(qū)間: rcoplot(r,rint)2、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型: b, bint,r,rint,stats=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計(jì)殘差用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有三個數(shù)值:R2、F值、與F對應(yīng)的概率p、以及殘差的方差的估計(jì)值置信區(qū)間 顯著性水平(缺省時為0.05)7問題1的求解:y=;%已知的因變量數(shù)組x=;%已知的自變量數(shù)組n=;%已知的數(shù)據(jù)容量X=ones(n,1),x;%

6、1與自變量組成的輸入矩陣b,bint,r,rint,s=regress(y,X);%回歸分析程序(顯著性水平為0.05)b, bint, s,%輸出回歸系數(shù)及其置信區(qū)間和統(tǒng)計(jì)量 rcoplot(r,rint) %殘差及其置信區(qū)間作圖輸出結(jié)果為:b=98.40840.9732bint = 78.7484 118.0683 0.5601 1.3864s = 0.4540 23.2834 0.0000 273.71378結(jié)果整理為下表:R2=0.4540 F=23.2834 p0.001 s2=273.71370.5601 1.38640.973274.7484, 118.068398.4084回歸

7、系數(shù)置信區(qū)間回歸系數(shù)估計(jì)值回歸系數(shù)01 從以下幾點(diǎn)可以看出模型是有效的:參數(shù)的置信區(qū)間不含0點(diǎn);p小于顯著性水平;用Matlab可以求出F1-(1,n-2)=4.1960,顯然小于F值。 但是由于1的置信區(qū)間過長,R2較小,說明模型的精度不高!9殘差圖如圖所示:圖中第二個點(diǎn)的殘差置信區(qū)間中不包含0點(diǎn),由于殘差服從均值為0的正態(tài)分布,因此可以認(rèn)為這個點(diǎn)為異常數(shù)據(jù),偏離數(shù)據(jù)整體的變化范圍,應(yīng)該剔除,重新進(jìn)行回歸分析!殘差與殘差區(qū)間杠桿圖,最好在0點(diǎn)線附近比較均勻的分布,而不呈現(xiàn)一定的規(guī)律性,如果是這樣,就說明回歸分析做得比較理想。10剔除第二個點(diǎn)后得到的結(jié)果:R2=0.7123 F=66.8358

8、 p0.0001 s2=91.43050.7140, 1.19250.953385.4771, 108.255996.8665回歸系數(shù)置信區(qū)間回歸系數(shù)估計(jì)值回歸系數(shù)01對50歲的人血壓進(jìn)行預(yù)測,得到結(jié)果為:0010096.86650.9533144.5298yxx根據(jù)預(yù)測區(qū)間 ,可以得到其置信度為0.95的置信區(qū)間為:125.7887,163.2708.001122,yus yus11同樣方法做問題二第一次做多元回歸結(jié)果:R2=0.6855 F=18.8906 p0.0001 s2=169.7917-0.0758 0.79650.36043.5537 87.173645.3636回歸系數(shù)置信區(qū)

9、間回歸系數(shù)估計(jì)值回歸系數(shù)013.090611.82461.0530 5.1281-0.1482 23.797323通過殘差分析圖可以得到第2個點(diǎn)和第10個點(diǎn)為異常點(diǎn),刪除后重新進(jìn)行回歸分析,可以得到下面表:12R2=0.8462 F=44.0087 p0.0001 s2=53.66040.1273 0.73320430329.9064 87.113858.5101回歸系數(shù)置信區(qū)間回歸系數(shù)估計(jì)值回歸系數(shù)012.344910.30650.8509 3.83893.3878 17.225323用上面的參數(shù)通過計(jì)算可以得到:50歲,體重指數(shù)為25,吸煙的人的血壓預(yù)測為:148.9525置信度為0.95

10、的置信區(qū)間為:134.5951,163.3099多多 項(xiàng)項(xiàng) 式式 回回 歸歸 (一)一元多項(xiàng)式回歸(一)一元多項(xiàng)式回歸 (1)確定多項(xiàng)式系數(shù)的命令:p,S=polyfit(x,y,m)(2)一元多項(xiàng)式回歸命令:polytool(x,y,m)1、回歸:、回歸:y=a1xm+a2xm-1+amx+am+12、預(yù)測和預(yù)測誤差估計(jì):、預(yù)測和預(yù)測誤差估計(jì):(1)Y=polyval(p,x)求polyfit所得的回歸多項(xiàng)式在x處 的預(yù)測值Y;(2)Y,DELTA=polyconf(p,x,S,alpha)求polyfit所得的回歸多項(xiàng)式在x處的預(yù)測值Y及預(yù)測值的顯著性為1-alpha的置信區(qū)間Y DELT

11、A;alpha缺省時為0.05t (s)1/302/303/304/305/306/307/30s (cm)11.8615.6720.6026.6933.7141.9351.13t (s)8/309/3010/3011/3012/3013/3014/30s (cm)61.4972.9085.4499.08113.77129.54146.48方法一方法一 直接作二次多項(xiàng)式回歸:直接作二次多項(xiàng)式回歸: t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.5

12、4 146.48; p,S=polyfit(t,s,2)1329. 98896.652946.4892tts得回歸模型為 :方法二方法二化為多元線性回歸:化為多元線性回歸:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;T=ones(14,1) t (t.2);b,bint,r,rint,stats=regress(s,T);b,stats22946.4898896.651329. 9tts得回歸模型為 :Y=polyconf(p

13、,t,S) plot(t,s,k+,t,Y,r)預(yù)測及作圖預(yù)測及作圖(二)多元二項(xiàng)式回歸(二)多元二項(xiàng)式回歸命令:rstool(x,y,model, alpha)nm矩陣顯著性水平(缺省時為0.05)n維列向量 例例2 設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價格的統(tǒng)計(jì)數(shù) 據(jù)如下,建立回歸模型,預(yù)測平均收入為1000、價格為6時 的商品需求量.需求量10075807050659010011060收入10006001200500300400130011001300300價格5766875439方法一方法一 直接用多元二項(xiàng)式回歸:x1=1000 600 1200 500 300 400 1300 1100 1300 300;x2=5 7 6 6 8 7 5 4 3 9;y=100 75 80 70 50 65 90 100 110 60;x=x1 x2; rstool(x,y,purequadratic) 點(diǎn)擊畫面左下方的Export按鈕,則beta、rmse和residuals都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論