matlab經(jīng)典算法的程序數(shù)據(jù)分析回歸分析_第1頁
matlab經(jīng)典算法的程序數(shù)據(jù)分析回歸分析_第2頁
matlab經(jīng)典算法的程序數(shù)據(jù)分析回歸分析_第3頁
matlab經(jīng)典算法的程序數(shù)據(jù)分析回歸分析_第4頁
matlab經(jīng)典算法的程序數(shù)據(jù)分析回歸分析_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、數(shù)學(xué)實(shí)驗(yàn)之回歸分析(2)第二講:多元線性與非線性回歸分析 引例:某建材公司的銷售量因素分析 多元線性回歸模型 MATLAB軟件實(shí)現(xiàn) 簡介多元非線性回歸模型 實(shí)驗(yàn)1)了解回歸分析的基本原理;2)掌握MATLAB的實(shí)現(xiàn)方法;3)練習(xí)用回歸分析方法解決實(shí)際問題;實(shí)驗(yàn)?zāi)康?某建材公司對某年20個(gè)地區(qū)的建材銷售量Y(千方)、推銷開支、實(shí)際帳目數(shù)、同類商品競爭數(shù)和地區(qū)銷售潛力分別進(jìn)行了統(tǒng)計(jì)。試分析推銷開支、實(shí)際帳目數(shù)、同類商品競爭數(shù)和地區(qū)銷售潛力對建材銷售量的影響作用。試建立回歸模型,且分析哪些是主要的影響因素。引例:某建筑材料公司的銷售量因素分析 設(shè):推銷開支x1 實(shí)際帳目數(shù)x2 同類商品競爭數(shù)x3 地

2、區(qū)銷售潛力x412345678910111213141516171819205.52.58.03.03.02.98.09.04.06.55.55.06.05.03.58.06.04.07.57.031556750387130564273604450395570405062591081278121258511126101061111998691615178104167126441468131179.3200.1163.2200.1146.0177.730.9291.9160.0339.4159.686.3237.5107.2155.0201.4100.2135.8223.3195.0 x1 x2

3、 x3 x4 y1111.11111X=尋找關(guān)系: y = E(Y|x1,x2,x3,x4) = f(x1,x2,x3,x4)模型:假設(shè):1、因變量Y是隨機(jī)變量,并且它服從正態(tài)分布;2、f(x1,x2,x3,x4)是線性函數(shù)(非線性);2、多元線性回歸模型模型要解決的問題可歸納為以下幾個(gè)方面: 1) 在回歸模型中如何估計(jì)參數(shù)i (i=0,1,m)和2? 2) 模型的假設(shè)(線性)是否正確? 3) 判斷每個(gè)自變量xi (i=1,m)對Y的影響是否顯著? 4) 利用回歸方程對試驗(yàn)指標(biāo) Y進(jìn)行預(yù)測或控制?知識(shí)介紹參數(shù)估計(jì) 假設(shè)有n個(gè)獨(dú)立觀測數(shù)據(jù)(xi1,xi2,xim,yi),i = 1,2,n, 要

4、確定回歸系數(shù) 由最小二乘法求解結(jié)果y的估計(jì)值:擬合誤差e = y y 稱為殘差,殘差平方和統(tǒng)計(jì)分析1、是的線性最小方差無偏估計(jì)2、3、殘差平方和Q,由此得2的無偏估計(jì)4、對Y的樣本方差S2進(jìn)行分解回歸模型的假設(shè)檢驗(yàn)構(gòu)造F-統(tǒng)計(jì)量及檢驗(yàn)H0的拒絕域:注意:衡量y與x1,x2,xm相關(guān)程度的指標(biāo)可以定義復(fù)相關(guān)系數(shù)R,R的值越接近于1,它們的相關(guān)程度越密切。回歸系數(shù)的檢驗(yàn) 主要判斷每個(gè)自變量xi對y的影響是否顯著。由此可得MATLAB軟件實(shí)現(xiàn) b = regress (Y, X) 或 b, bint, r, rint, stats = regress(Y, X, alpha)1、使用命令regres

5、s實(shí)現(xiàn)多元線性回歸回歸系數(shù)0,1,m以及它們的置信區(qū)間殘差向量e=Y-Y及它們的置信區(qū)間相關(guān)系數(shù)R2,F(xiàn)-統(tǒng)計(jì)量和與F對應(yīng)的概率p。引例求解:輸入:(jzhui.m)x1=5.5 2.5 8 3 8 6 4 7.5 7;(20維)x2=31 55 67 55 70 40 50 62 59;x3=10 8 12 11 11 9 9;x4=8 6 9 16 8 13 11;y=79.3 200.1 135.8 223.3 195;X=ones(size(x1),x1,x2,x3,x4;b,bint,r,rint,stats=regress(y,X)計(jì)算結(jié)果: (輸出)b = 191.9158 -0

6、.7719 3.1725 -19.6811 -0.4501 0 1 2 3 4bint = 103.1071 280.7245(系數(shù)的置信區(qū)間)r = -6.3045 -4.2215 8.4422 23.4625 3.3938rint=(略)stats = 0.9034(R2) 35.0509(F) 0.0000(p)Q = r*r2= Q/(n-2) = 537.2092 (近似) 殘差向量分析圖 如何分析四個(gè)因素x1,x2,x3,x4 對試驗(yàn)指標(biāo)Y的作用大小?使用逐步回歸方法。在MATLAB軟件中使用以下命令: stepwise(X, y, inmodel,alfha)如上例,輸入: X=

7、x1,x2,x3,x4; stepwise(X,y,1,2,3)模型中均方差歷史數(shù)據(jù)記載表參變量數(shù)據(jù)分析表經(jīng)過觀察,得到各種情況下的均方差對比:變量組合x1,x2x1,x3x1,x4x2,x3x2,x4x3,x4RMSE5351.9661.7723.9652.9644.75變量組合x1,x2x3x1, x2x4x1, x3 x4x2,x3x4x1,x2x3, x4RMSE24.6554.4345.8624.6425.39最佳回歸方程范例: 某化學(xué)反應(yīng)問題 這是一個(gè)非線性回歸模型的實(shí)例 1、問題 為了研究三種化學(xué)元素:氫、n戊烷和異構(gòu)戊烷與生成物的反應(yīng)速度Y(%)之間的關(guān)系,經(jīng)試驗(yàn)測定得到某些數(shù)

8、據(jù)。試建立非線性回歸模型,并進(jìn)行統(tǒng)計(jì)分析。2、假設(shè)及建模 在各因素與指標(biāo)(因變量)之間的信息“一無所知”的情況下,假設(shè)模型Y = f (x1,x2,x3)+中的函數(shù)f 是多項(xiàng)式形式,即 y = b 0 + b 1 x 1 + b 2 x 2 + b 3 x 3 + (linear terms) b 12 x 1 x 2 + b 13 x 1 x 3 + b 23 x 2 x 3 + (interaction terms) b 11 x 1 2 + b 22 x 2 2 + b 33 x 3 2 + (quadratic terms) N(0, 2) 在MATLAB軟件下,實(shí)現(xiàn)二次多項(xiàng)式回歸分析

9、的命令: rstool(X, y, model, alpha) (它將產(chǎn)生一個(gè)交互式的界面)linear:(缺省)y = 0+1x1+mxm purequadratic: y = 0+1x1+mxm +j=1 to mj*xj2 interaction: y = 0+1x1+mxm +1jk mjkxjxk quadratic(完全二次,以上模型之和)其中model有以下四種選擇:load reaction(調(diào)出數(shù)據(jù))Whos (查看數(shù)據(jù)名稱及大?。?Name Size Bytes Class beta 5x1 40 double array model 1x6 12 char array r

10、ate 13x1 104 double array reactants 13x3 312 double array xn 3x10 60 char array yn 1x13 26 char array三個(gè)自變量因變量YX=reactants;y=rate;rstool(X,y,quadratic)ExportParametersRMSEResidualsAllLinearPure QuadraticInteractionsFull QuadraticUser Specified在工作空間可以分別給出參數(shù)估計(jì)值、殘差平方和、殘差向量。 假定由實(shí)際問題背景分析知經(jīng)驗(yàn)公式為: MATLAB實(shí)現(xiàn) 非線性回歸nlintool(X,y, model, beta)以M-文件形式建立模型模型中未知參數(shù)向量2)一般的非線性模型及擬合 建立M函數(shù)文件 (hougen.m); 執(zhí)行 (hgy3.m) nlinfit(X,y ,hougen,beta) nlintool(X,y,hougen,beta,0.01) 要辯識(shí)的參數(shù)MATLAB2、某公司出口換匯成本分析 對經(jīng)營同一類產(chǎn)品出口業(yè)務(wù)的公司進(jìn)行抽樣調(diào)查, 被調(diào)查的13家公司,其出口換匯成本與商品流轉(zhuǎn)費(fèi)用率資料如下表。試分析兩個(gè)變量之間的關(guān)系,并估計(jì)某家公司商品流轉(zhuǎn)費(fèi)用率是6.5%的出口換匯成本。實(shí)驗(yàn)內(nèi)容公司出口換匯

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論