![數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn) 回歸分析ppt課件_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/49f4731d-a11d-45ae-b177-c45e28a4eee8/49f4731d-a11d-45ae-b177-c45e28a4eee81.gif)
![數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn) 回歸分析ppt課件_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/49f4731d-a11d-45ae-b177-c45e28a4eee8/49f4731d-a11d-45ae-b177-c45e28a4eee82.gif)
![數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn) 回歸分析ppt課件_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/49f4731d-a11d-45ae-b177-c45e28a4eee8/49f4731d-a11d-45ae-b177-c45e28a4eee83.gif)
![數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn) 回歸分析ppt課件_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/49f4731d-a11d-45ae-b177-c45e28a4eee8/49f4731d-a11d-45ae-b177-c45e28a4eee84.gif)
![數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn) 回歸分析ppt課件_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-2/3/49f4731d-a11d-45ae-b177-c45e28a4eee8/49f4731d-a11d-45ae-b177-c45e28a4eee85.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)數(shù)學(xué)建模與數(shù)學(xué)實(shí)驗(yàn)回歸分析回歸分析實(shí)驗(yàn)?zāi)康膶?shí)驗(yàn)?zāi)康膶?shí)驗(yàn)內(nèi)容實(shí)驗(yàn)內(nèi)容2、掌握用數(shù)學(xué)軟件求解回歸分析問題。、掌握用數(shù)學(xué)軟件求解回歸分析問題。1、直觀了解回歸分析基本內(nèi)容。、直觀了解回歸分析基本內(nèi)容。1 1、回歸分析的基本理論。、回歸分析的基本理論。3 3、實(shí)驗(yàn)作業(yè)。、實(shí)驗(yàn)作業(yè)。2、用數(shù)學(xué)軟件求解回歸分析問題。、用數(shù)學(xué)軟件求解回歸分析問題。回歸分析回歸分析數(shù)學(xué)模型及定義數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)模型參數(shù)估計(jì)* *檢驗(yàn)、預(yù)測與控制檢驗(yàn)、預(yù)測與控制可線性化的一元非線可線性化的一元非線性回歸曲線回歸)性回歸曲線回歸)數(shù)學(xué)模型及定義數(shù)學(xué)模型及定義*模型參數(shù)估計(jì)模型參數(shù)估計(jì)*多元線性回歸中
2、的多元線性回歸中的檢驗(yàn)與預(yù)測檢驗(yàn)與預(yù)測逐步回歸分析逐步回歸分析一、數(shù)學(xué)模型一、數(shù)學(xué)模型例例1 測測16名成年女子的身高與腿長所得數(shù)據(jù)如下:名成年女子的身高與腿長所得數(shù)據(jù)如下:身高143145146147149150153154155156157158159160162164腿長8885889192939395969897969899100102以身高x為橫坐標(biāo),以腿長y為縱坐標(biāo)將這些數(shù)據(jù)點(diǎn)xI,yi在平面直角坐標(biāo)系上標(biāo)出.1401451501551601658486889092949698100102散點(diǎn)圖xy10 一般地,稱由xy10確定的模型為一一元元線線性性回回歸歸模模型型,記為 210
3、, 0DExy固定的未知參數(shù)0、1稱為回歸系數(shù),自變量 x 也稱為回歸變量.一元線性回歸分析的主要任務(wù)是:1、用試驗(yàn)值(樣本值)對0、1和作點(diǎn)估計(jì);2、對回歸系數(shù)0、1作假設(shè)檢驗(yàn); 3、在 x=0 x處對 y 作預(yù)測,對 y 作區(qū)間估計(jì).xY10,稱為 y 對對 x的的回回歸歸直直線線方方程程.返回返回二、模型參數(shù)估計(jì)二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘估計(jì)、回歸系數(shù)的最小二乘估計(jì)有 n 組獨(dú)立觀測值, (x1,y1) , (x2,y2) , (xn,yn) 設(shè) 相互獨(dú)立且,niiiiDEnixy., , 0,.,2 , 1,21210 記 niiiniixyQQ12101210),(最小二
4、乘法最小二乘法就是選擇0和1的估計(jì)0,1使得 ),(min),(10,1010QQ2、2的的無無偏偏估估計(jì)計(jì)記 niniiiiieyyxyQQ11221010)(),(稱 Qe為殘殘差差平平方方和和或剩剩余余平平方方和和. 2的的無無偏偏估估計(jì)計(jì)為 )2(2nQee稱2e為剩剩余余方方差差(殘殘差差的的方方差差) , 2e分別與0、1獨(dú)立 。 e稱為剩剩余余標(biāo)標(biāo)準(zhǔn)準(zhǔn)差差.返回返回三、檢驗(yàn)、預(yù)測與控制三、檢驗(yàn)、預(yù)測與控制1、回歸方程的顯著性檢驗(yàn)、回歸方程的顯著性檢驗(yàn) 對回歸方程xY10的顯著性檢驗(yàn),歸結(jié)為對假設(shè) 0:; 0:1110HH進(jìn)行檢驗(yàn).假設(shè)0:10H被拒絕,則回歸顯著,認(rèn)為 y 與 x
5、存在線性關(guān)系,所求的線性回歸方程有意義;否則回歸不顯著,y 與 x 的關(guān)系不能用一元線性回歸模型來描述,所得的回歸方程也無意義.()F檢驗(yàn)法檢驗(yàn)法 當(dāng)0H成立時(shí), )2/( nQUFeF(1,n-2)其中 niiyyU12(回回歸歸平平方方和和)故 F)2, 1 (1nF,拒絕0H,否則就接受0H. ()t檢驗(yàn)法檢驗(yàn)法niiniixxxnxxxL12212)(其中當(dāng)0H成立時(shí),exxLT1t(n-2)故)2(21ntT,拒絕0H,否則就接受0H.()r檢驗(yàn)法檢驗(yàn)法當(dāng)|r| r1-時(shí),拒絕 H0;否則就接受 H0.記 niniiiniiiyyxxyyxxr11221)()()(其中2, 1211
6、11nFnr2、回歸系數(shù)的置信區(qū)間、回歸系數(shù)的置信區(qū)間0和和1置信水平為置信水平為 1-的置信區(qū)間分別為的置信區(qū)間分別為 xxexxeLxnntLxnnt221022101)2(,1)2(和 xxexxeLntLnt/)2(,/)2(2112112的的置置信信水水平平為為 1-的的置置信信區(qū)區(qū)間間為為 )2(,)2(22221nQnQee3、預(yù)測與控制、預(yù)測與控制(1預(yù)測預(yù)測用 y0的回歸值0100 xy作為 y0的的預(yù)預(yù)測測值值.0y的置信水平為1的預(yù)測區(qū)間預(yù)測區(qū)間為 )(),(0000 xyxy其中xxeLxxnntx2021011)2()( 特 別 , 當(dāng) n 很 大 且 x0在x附 近
7、 取 值 時(shí) ,y 的 置 信 水 平 為1的 預(yù)預(yù) 測測 區(qū)區(qū) 間間 近近 似似 為為 2121,uyuyee(2控制控制要求:xy10的值以1的概率落在指定區(qū)間yy ,只要控制 x 滿足以下兩個(gè)不等式 yxyyxy )(,)(要求)(2xyy .若yxyyxy )(,)(分別有解x和x ,即yxyyxy )(,)(. 則xx ,就是所求的 x 的控制區(qū)間.返回返回四、可線性化的一元非線性回歸四、可線性化的一元非線性回歸 (曲線回歸)(曲線回歸)例例2 出鋼時(shí)所用的盛鋼水的鋼包,由于鋼水對耐火材料的侵蝕,出鋼時(shí)所用的盛鋼水的鋼包,由于鋼水對耐火材料的侵蝕, 容積不斷增大容積不斷增大.我們希望
8、知道使用次數(shù)與增大的容積之間的關(guān)我們希望知道使用次數(shù)與增大的容積之間的關(guān) 系系.對一鋼包作試驗(yàn),測得的數(shù)據(jù)列于下表:對一鋼包作試驗(yàn),測得的數(shù)據(jù)列于下表:使用次數(shù)增大容積使用次數(shù)增大容積234567896.428.209.589.509.7010.009.939.991011121314151610.4910.5910.6010.8010.6010.9010.7624681012141666.577.588.599.51010.511散點(diǎn)圖此即非線性回歸或曲線回歸 問題需要配曲線)問題需要配曲線)配曲線的一般方法是:配曲線的一般方法是:先對兩個(gè)變量 x 和 y 作 n 次試驗(yàn)觀察得niyxii,
9、.,2 , 1),(畫出散點(diǎn)圖,根據(jù)散點(diǎn)圖確定須配曲線的類型.然后由 n 對試驗(yàn)數(shù)據(jù)確定每一類曲線的未知參數(shù) a 和 b.采用的方法是通過變量代換把非線性回歸化成線性回歸,即采用非線性回歸線性化的方法.通常選擇的六類曲線如下:(1)雙雙曲曲線線xbay1(2)冪冪函函數(shù)數(shù)曲曲線線y=abx, 其中 x0,a0(3)指指數(shù)數(shù)曲曲線線 y=abxe其中參數(shù) a0.(4)倒倒指指數(shù)數(shù)曲曲線線 y=axbe/其中 a0,(5)對對數(shù)數(shù)曲曲線線 y=a+blogx,x0(6)S 型型曲曲線線xbeay1返回返回解例2.由散點(diǎn)圖我們選配倒指數(shù)曲線y=axbe/根據(jù)線性化方法,算得4587. 2,1107.
10、 1Ab由此 6789.11Aea最后得 xey1107. 16789.11一、數(shù)學(xué)模型及定義一、數(shù)學(xué)模型及定義一般稱 nICOVEXY2),(, 0)( 為高斯馬爾柯夫線性模型(k k 元線性回歸模型元線性回歸模型),并簡記為),(2nIXY nyyY.1,nknnkkxxxxxxxxxX.1.1.1212222111211,k.10,n.21kkxxy.110稱為回回歸歸平平面面方方程程. 返回返回線性模型),(2nIXY考慮的主要問題是: (1)用試驗(yàn)值(樣本值)對未知參數(shù)和2作點(diǎn)估計(jì)和假設(shè)檢驗(yàn),從而建立 y 與kxxx,.,21之間的數(shù)量關(guān)系; (2)在,.,0022011kkxxxx
11、xx處對 y 的值作預(yù)測與控制,即對 y 作區(qū)間估計(jì). 二、模型參數(shù)估計(jì)二、模型參數(shù)估計(jì)1、對、對i和和2作估計(jì)作估計(jì)用最小二乘法求k,.,0的估計(jì)量:作離差平方和 niikkiixxyQ12110.選擇k,.,0使 Q 達(dá)到最小。解得估計(jì)值 YXXXTT1 得到的i代入回歸平面方程得: kkxxy.110稱為經(jīng)經(jīng)驗(yàn)驗(yàn)回回歸歸平平面面方方程程.i稱為經(jīng)經(jīng)驗(yàn)驗(yàn)回回歸歸系系數(shù)數(shù).注注意意 :服從 p+1 維正態(tài)分 布,且為的無偏估 計(jì),協(xié)方差陣為C2. C=L-1=(cij), L=XX2、 多多 項(xiàng)項(xiàng) 式式 回回 歸歸設(shè)變量 x、Y 的回歸模型為 ppxxxY.2210其中 p 是已知的,),
12、2 , 1(pii是未知參數(shù),服從正態(tài)分布), 0(2N. 令iixx ,i=1,2,k 多項(xiàng)式回歸模型變?yōu)槎嘣€性回歸模型.返回返回 kkxxxY.2210稱為回回歸歸多多項(xiàng)項(xiàng)式式.上面的回歸模型稱為多多項(xiàng)項(xiàng)式式回回歸歸.三、多元線性回歸中的檢驗(yàn)與預(yù)測三、多元線性回歸中的檢驗(yàn)與預(yù)測1、線線性性模模型型和和回回歸歸系系數(shù)數(shù)的的檢檢驗(yàn)驗(yàn)假設(shè) 0.:100kH ()F檢驗(yàn)法檢驗(yàn)法()r檢驗(yàn)法檢驗(yàn)法定義eyyQUULUR為 y 與 x1,x2,.,xk的多多元元相相關(guān)關(guān)系系數(shù)數(shù)或復(fù)復(fù)相相關(guān)關(guān)系系數(shù)數(shù)。由于2211RRkknF,故用 F 和用 R檢驗(yàn)是等效的。當(dāng) H0成立時(shí),)1,()1/(/knkF
13、knQkUFe如果 F F1-(k,n-k-1) ,則拒絕 H0,認(rèn)為 y 與 x1, xk之間顯著地有線性關(guān)系;否則就接受 H0,認(rèn)為 y 與 x1, xk之間線性關(guān)系不顯著.其中 niiyyU12(回回歸歸平平方方和和) niiieyyQ12)(殘差平方和)2、預(yù)測、預(yù)測(1點(diǎn)預(yù)測點(diǎn)預(yù)測求出回歸方程kkxxy.110,對于給定自變量的值kxx ,.,*1,用*110*.kkxxy來預(yù)測*110.kkxxy.稱* y為*y的點(diǎn)預(yù)測.(2區(qū)間預(yù)測區(qū)間預(yù)測y 的1的預(yù)測區(qū)間(置信)區(qū)間為),(21yy,其中) 1(1) 1(12/10022/1001kntxxcyykntxxcyykikjjii
14、jekikjjiijeC=L-1=(cij), L=XX1knQee返回返回四、逐步回歸分析四、逐步回歸分析(4)“有進(jìn)有出的逐步回歸分析。(1從所有可能的因子變量組合的回歸方程中選擇最優(yōu)者;(2從包含全部變量的回歸方程中逐次剔除不顯著因子;(3從一個(gè)變量開始,把變量逐個(gè)引入方程;選擇“最優(yōu)的回歸方程有以下幾種方法: “最優(yōu)的回歸方程就是包含所有對Y有影響的變量, 而不包含對Y影響不顯著的變量回歸方程。 以第四種方法,即逐步回歸分析法在篩選變量方面較為理想. 這個(gè)過程反復(fù)進(jìn)行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時(shí)為止。逐步回歸分析法的思想:逐步回歸分析法的思想:
15、從一個(gè)自變量開始,視自變量Y作用的顯著程度,從大到地依次逐個(gè)引入回歸方程。 當(dāng)引入的自變量由于后面變量的引入而變得不顯著時(shí),要將其剔除掉。 引入一個(gè)自變量或從回歸方程中剔除一個(gè)自變量,為逐步回歸的一步。 對于每一步都要進(jìn)行Y值檢驗(yàn),以確保每次引入新的顯著性變量前回歸方程中只包含對Y作用顯著的變量。返回返回1、多元線性回歸、多元線性回歸2、多項(xiàng)式回歸、多項(xiàng)式回歸3、非線性回歸、非線性回歸4、逐步回歸、逐步回歸返回返回多元線性回歸多元線性回歸 b=regress( Y, X )npnnppxxxxxxxxxX.1.1.1212222111211nYYYY.21pb.101、確定回歸系數(shù)的點(diǎn)估計(jì)值:
16、、確定回歸系數(shù)的點(diǎn)估計(jì)值:ppxxy.110對一元線性回歸,取 p=1 即可3、畫出殘差及其置信區(qū)間:、畫出殘差及其置信區(qū)間: rcoplotr,rint)2、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型: b, bint,r,rint,stats=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計(jì)殘差用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有三個(gè)數(shù)值:相關(guān)系數(shù)r2、F值、與F對應(yīng)的概率p置信區(qū)間 顯著性水平(缺省時(shí)為0.05) 相關(guān)系數(shù) r2越接近 1,說明回歸方程越顯著; F F1-(k,n-k-1)時(shí)拒絕 H0,F(xiàn) 越大,說明回歸方程越顯著; 與 F
17、 對應(yīng)的概率 p時(shí)拒絕 H0,回歸模型成立.例例1 解:解:1、輸入數(shù)據(jù):、輸入數(shù)據(jù): x=143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164; X=ones(16,1) x; Y=88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102;2、回歸分析及檢驗(yàn):、回歸分析及檢驗(yàn): b,bint,r,rint,stats=regress(Y,X) b,bint,stats得結(jié)果:b = bint = -16.0730 -33.7071 1.5612 0.7194 0.6047 0.
18、8340 stats = 0.9282 180.9531 0.0000即7194. 0,073.1610;0的置信區(qū)間為-33.7017,1.5612, 1的置信區(qū)間為0.6047,0.834;r2=0.9282, F=180.9531, p=0.0000p0.05, 可知回歸模型 y=-16.073+0.7194x 成立.To MATLAB(liti11)3、殘差分析,作殘差圖:、殘差分析,作殘差圖: rcoplot(r,rint) 從殘差圖可以看出,除第二個(gè)數(shù)據(jù)外,其余數(shù)據(jù)的殘差離零點(diǎn)均較近,且殘差的置信區(qū)間均包含零點(diǎn),這說明回歸模型 y=-16.073+0.7194x能較好的符合原始數(shù)據(jù)
19、,而第二個(gè)數(shù)據(jù)可視為異常點(diǎn). 4、預(yù)測及作圖:、預(yù)測及作圖:z=b(1)+b(2)*x plot(x,Y,k+,x,z,r)246810121416-5-4-3-2-101234Residual Case Order PlotResidualsCase Number返回返回To MATLAB(liti12)多多 項(xiàng)項(xiàng) 式式 回回 歸歸 (一一元多項(xiàng)式回歸(一一元多項(xiàng)式回歸 (1確定多項(xiàng)式系數(shù)的命令:確定多項(xiàng)式系數(shù)的命令:p,S=polyfitx,y,m) 其中 x=(x1,x2,xn) ,y=(y1,y2,yn) ;p=(a1,a2,am+1)是多項(xiàng)式y(tǒng)=a1xm+a2xm-1+amx+am+
20、1的系數(shù);S 是一個(gè)矩陣,用來估計(jì)預(yù)測誤差.(2一元多項(xiàng)式回歸命令:一元多項(xiàng)式回歸命令:polytoolx,y,m)1、回歸:、回歸:y=a1xm+a2xm-1+amx+am+12、預(yù)測和預(yù)測誤差估計(jì):、預(yù)測和預(yù)測誤差估計(jì):(1Y=polyvalp,x求polyfit所得的回歸多項(xiàng)式在x處 的預(yù) 測值Y; (2)Y,DELTA=polyconfp,x,S,alpha求polyfit所得 的回歸多項(xiàng)式在x處的預(yù)測值Y及預(yù)測值的顯著性為1- alpha的置信區(qū)間Y DELTA;alpha缺省時(shí)為0.5. 例例 2 觀測物體降落的距離s 與時(shí)間t 的關(guān)系,得到數(shù)據(jù)如下表,求s關(guān)于 t 的回歸方程2c
21、tbtas.t (s)1/302/303/304/305/306/307/30s (cm)11.8615.6720.6026.6933.7141.9351.13t (s)8/309/3010/3011/3012/3013/3014/30s (cm)61.4972.9085.4499.08113.77129.54146.48法一法一 直接作二次多項(xiàng)式回歸:直接作二次多項(xiàng)式回歸: t=1/30:1/30:14/30; s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48; p
22、,S=polyfit(t,s,2)To MATLABliti21)1329. 98896.652946.4892tts得回歸模型為 :法二法二化為多元線性回歸:化為多元線性回歸:t=1/30:1/30:14/30;s=11.86 15.67 20.60 26.69 33.71 41.93 51.13 61.49 72.90 85.44 99.08 113.77 129.54 146.48;T=ones(14,1) t (t.2);b,bint,r,rint,stats=regress(s,T);b,statsTo MATLAB(liti22)22946.4898896.651329. 9tts
23、得回歸模型為 :Y=polyconf(p,t,S) plot(t,s,k+,t,Y,r)預(yù)測及作圖預(yù)測及作圖To MATLAB(liti23)(二多元二項(xiàng)式回歸(二多元二項(xiàng)式回歸命令:rstoolx,y,model, alpha)nm矩陣顯著性水平(缺省時(shí)為0.05)n維列向量由下列 4 個(gè)模型中選擇 1 個(gè)(用字符串輸入,缺省時(shí)為線性模型): linear(線性):mmxxy 110 purequadratic(純二次): njjjjmmxxxy12110 interaction(交叉): mkjkjjkmmxxxxy1110 quadratic(完全二次): mkjkjjkmmxxxxy,
24、1110 例例3 設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)數(shù)設(shè)某商品的需求量與消費(fèi)者的平均收入、商品價(jià)格的統(tǒng)計(jì)數(shù) 據(jù)如下,建立回歸模型,預(yù)測平均收入為據(jù)如下,建立回歸模型,預(yù)測平均收入為1000、價(jià)格為、價(jià)格為6時(shí)時(shí) 的商品需求量的商品需求量.需求量10075807050659010011060收入10006001200500300400130011001300300價(jià)格5766875439選擇純二次模型,即 2222211122110 xxxxy法一法一 直接用多元二項(xiàng)式回歸:x1=1000 600 1200 500 300 400 1300 1100 1300 300;x2=5
25、7 6 6 8 7 5 4 3 9;y=100 75 80 70 50 65 90 100 110 60;x=x1 x2; rstool(x,y,purequadratic) 在畫面左下方的下拉式菜單中選all”, 則beta、rmse和residuals都傳送到Matlab工作區(qū)中.在左邊圖形下方的方框中輸入1000,右邊圖形下方的方框中輸入6。 則畫面左邊的“Predicted Y下方的數(shù)據(jù)變?yōu)?8.47981,即預(yù)測出平均收入為1000、價(jià)格為6時(shí)的商品需求量為88.4791.在Matlab工作區(qū)中輸入命令: beta, rmse得結(jié)果:beta = 110.5313 0.1464 -2
26、6.5709 -0.0001 1.8475 rmse = 4.5362故回歸模型為:2221218475. 10001. 05709.261464. 05313.110 xxxxy剩余標(biāo)準(zhǔn)差為 4.5362, 說明此回歸模型的顯著性較好.To MATLAB(liti31)2) (2nyysxy為剩余標(biāo)準(zhǔn)差,表示應(yīng)變量Y值對于回歸直線的離散程度。 X=ones(10,1) x1 x2 (x1.2) (x2.2);b,bint,r,rint,stats=regress(y,X);b,stats結(jié)果為: b = 110.5313 0.1464 -26.5709 -0.0001 1.8475 stat
27、s = 0.9702 40.6656 0.0005法二法二To MATLAB(liti32)返回返回 2222211122110 xxxxy將 化為多元線性回歸:非線性回非線性回 歸歸 (1確定回歸系數(shù)的命令:確定回歸系數(shù)的命令: beta,r,J=nlinfitx,y,model, beta0)(2非線性回歸命令:非線性回歸命令:nlintoolx,y,model, beta0,alpha)1、回歸:、回歸:殘差Jacobian矩陣回歸系數(shù)的初值是事先用m-文件定義的非線性函數(shù)估計(jì)出的回歸系數(shù)輸入數(shù)據(jù)x、y分別為 矩陣和n維列向量,對一元非線性回歸,x為n維列向量。mn2、預(yù)測和預(yù)測誤差估計(jì)
28、:、預(yù)測和預(yù)測誤差估計(jì):Y,DELTA=nlpredci(model, x,beta,r,J)求nlinfit 或nlintool所得的回歸函數(shù)在x處的預(yù)測值Y及預(yù)測值的顯著性為1-alpha的置信區(qū)間Y DELTA.例例 4 對第一節(jié)例對第一節(jié)例2,求解如下:,求解如下:1、對將要擬合的非線性模型 y=axbe/,建立 m-文件 volum.m 如下: function yhat=volum(beta,x) yhat=beta(1)*exp(beta(2)./x);2、輸入數(shù)據(jù): x=2:16; y=6.42 8.20 9.58 9.5 9.7 10 9.93 9.99 10.49 10.5
29、9 10.60 10.80 10.60 10.90 10.76; beta0=8 2;3、求回歸系數(shù): beta,r ,J=nlinfit(x,y,volum,beta0); beta得結(jié)果:beta = 11.6036 -1.0641即得回歸模型為:xey10641. 16036.11To MATLAB(liti41)4、預(yù)測及作圖: YY,delta=nlpredci(volum,x,beta,r ,J); plot(x,y,k+,x,YY,r)To MATLAB(liti42)例例5 財(cái)政收入預(yù)測問題:財(cái)政收入與國民收入、工業(yè)總產(chǎn)值、財(cái)政收入預(yù)測問題:財(cái)政收入與國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)
30、總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資等因素有關(guān)。農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資等因素有關(guān)。下表列出了下表列出了1952-1981年的原始數(shù)據(jù),試構(gòu)造預(yù)測模型。年的原始數(shù)據(jù),試構(gòu)造預(yù)測模型。 解解 設(shè)國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝凇⒕蜆I(yè)設(shè)國民收入、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、總?cè)丝?、就業(yè)人口、固定資產(chǎn)投資分別為人口、固定資產(chǎn)投資分別為x1、x2、x3、x4、x5、x6,財(cái)政,財(cái)政收入為收入為y,設(shè)變量之間的關(guān)系為:,設(shè)變量之間的關(guān)系為:y= ax1+bx2+cx3+dx4+ex5+fx6使用非線性回歸方法求解。使用非線性回歸方法求解。1 對回歸模型建立M文件model.m如下
31、: function yy=model(beta0,X) a=beta0(1); b=beta0(2); c=beta0(3); d=beta0(4); e=beta0(5); f=beta0(6); x1=X(:,1); x2=X(:,2); x3=X(:,3); x4=X(:,4); x5=X(:,5); x6=X(:,6); yy=a*x1+b*x2+c*x3+d*x4+e*x5+f*x6; 2. 主程序主程序liti6.m如下如下:X=598.00 349.00 461.00 57482.00 20729.00 44.00 . 2927.00 6862.00 1273.00 10007
32、2.0 43280.00 496.00;y=184.00 216.00 248.00 254.00 268.00 286.00 357.00 444.00 506.00 . 271.00 230.00 266.00 323.00 393.00 466.00 352.00 303.00 447.00 . 564.00 638.00 658.00 691.00 655.00 692.00 657.00 723.00 922.00 . 890.00 826.00 810.0;beta0=0.50 -0.03 -0.60 0.01 -0.02 0.35;betafit = nlinfit(X,y,mo
33、del,beta0)To MATLAB(liti6) betafit = 0.5243 -0.0294 -0.6304 0.0112 -0.0230 0.3658即即y= 0.5243x1-0.0294x2-0.6304x3+0.0112x4-0.0230 x5+0.3658x6結(jié)果為結(jié)果為:返返 回回逐逐 步步 回回 歸歸逐步回歸的命令是: stepwisex,y,inmodel,alpha) 運(yùn)行stepwise命令時(shí)產(chǎn)生三個(gè)圖形窗口:Stepwise Plot,Stepwise Table,Stepwise History. 在Stepwise Plot窗口,顯示出各項(xiàng)的回歸系數(shù)及其置信
34、區(qū)間. Stepwise Table 窗口中列出了一個(gè)統(tǒng)計(jì)表,包括回歸系數(shù)及其置信區(qū)間,以及模型的統(tǒng)計(jì)量剩余標(biāo)準(zhǔn)差RMSE)、相關(guān)系數(shù)R-square)、F值、與F對應(yīng)的概率P.矩陣的列數(shù)的指標(biāo),給出初始模型中包括的子集缺省時(shí)設(shè)定為全部自變量)顯著性水平缺省時(shí)為0.5)自變量數(shù)據(jù), 階矩陣mn因變量數(shù)據(jù), 階矩陣1n例例6 水泥凝固時(shí)放出的熱量水泥凝固時(shí)放出的熱量y與水泥中與水泥中4種化學(xué)成分種化學(xué)成分x1、x2、x3、 x4 有關(guān),今測得一組數(shù)據(jù)如下,試用逐步回歸法確定一個(gè)有關(guān),今測得一組數(shù)據(jù)如下,試用逐步回歸法確定一個(gè) 線性線性模模 型型. 序號(hào)12345678910111213x1711
35、1117113122111110 x226295631525571315447406668x3615886917221842398x46052204733226442226341212y78.574.3104.387.695.9109.2102.772.593.1115.983.8113.3109.41、數(shù)據(jù)輸入:、數(shù)據(jù)輸入:x1=7 1 11 11 7 11 3 1 2 21 1 11 10;x2=26 29 56 31 52 55 71 31 54 47 40 66 68;x3=6 15 8 8 6 9 17 22 18 4 23 9 8;x4=60 52 20 47 33 22 6 44
36、 22 26 34 12 12;y=78.5 74.3 104.3 87.6 95.9 109.2 102.7 72.5 93.1 115.9 83.8 113.3 109.4;x=x1 x2 x3 x4;2、逐步回歸:、逐步回歸:(1先在初始模型中取全部自變量:先在初始模型中取全部自變量: stepwise(x,y)得圖得圖Stepwise Plot 和表和表Stepwise Table圖圖Stepwise Plot中四條直線都是虛中四條直線都是虛線,說明模型的顯著性不好線,說明模型的顯著性不好從表從表Stepwise Table中看出變中看出變量量x3和和x4的顯著性最差的顯著性最差.(2
37、在圖在圖Stepwise Plot中點(diǎn)擊直線中點(diǎn)擊直線3和直線和直線4,移去變量,移去變量x3和和x4移去變量移去變量x3和和x4后模型具有顯著性后模型具有顯著性. 雖然剩余標(biāo)準(zhǔn)差RMSE沒有太大的變化,但是統(tǒng)計(jì)量F的值明顯增大,因此新的回歸模型更好.To MATLAB(liti51)(3對變量對變量y和和x1、x2作線性回歸:作線性回歸: X=ones(13,1) x1 x2; b=regress(y,X)得結(jié)果:b = 52.5773 1.4683 0.6623故最終模型為:y=52.5773+1.4683x1+0.6623x2To MATLAB(liti52)返回返回1、考察溫度x對產(chǎn)量
38、y的影響,測得下列10組數(shù)據(jù):溫度()20253035404550556065產(chǎn)量(kg)13.215.116.417.117.918.719.621.222.524.3求y關(guān)于x的線性回歸方程,檢驗(yàn)回歸效果是否顯著,并預(yù)測x=42時(shí)產(chǎn)量的估值及預(yù)測區(qū)間置信度95%).2、某零件上有一段曲線,為了在程序控制機(jī)床上加工這一零件,需要求這段曲線的解析表達(dá)式,在曲線橫坐標(biāo)xi處測得縱坐標(biāo)yi共11對數(shù)據(jù)如下:xi02468101214161820yi0.62.04.47.511.817.123.331.239.649.761.7求這段曲線的縱坐標(biāo)y關(guān)于橫坐標(biāo)x的二次多項(xiàng)式回歸方程.3、 在研究化學(xué)動(dòng)
39、力學(xué)反應(yīng)過程中,建立了一個(gè)反應(yīng)速度和反應(yīng)物含量的數(shù)學(xué)模型,形式為 34231253211xxxxxy其中51,是未知參數(shù),321,xxx是三種反應(yīng)物(氫,n 戊烷,異構(gòu)戊烷)的含量,y 是反應(yīng)速度.今測得一組數(shù)據(jù)如表 4,試由此確定參數(shù)51,,并給出置信區(qū)間.51,的參考值為(1,0.05, 0.02, 0.1, 2).序號(hào)反應(yīng)速度 y氫 x1n 戊烷 x2異構(gòu)戊烷 x318.554703001023.79285801034.8247030012040.024708012052.754708010614.391001901072.54100806584.3547019065913.001003
40、0054108.50100300120110.05100801201211.3228530010133.132851901204、混凝土的抗壓強(qiáng)度隨養(yǎng)護(hù)時(shí)間的延長而增加,現(xiàn)將一批混凝土作成12個(gè)試塊,記錄了養(yǎng)護(hù)日期x日及抗壓強(qiáng)度ykg/cm2的數(shù)據(jù):養(yǎng)護(hù)時(shí)間 x234579121417212856抗壓強(qiáng)度 y354247535965687376828699試求xbayln型回歸方程.四四 軟件開發(fā)人員的薪金軟件開發(fā)人員的薪金問題:問題:一家高技術(shù)公司人事部門為研究軟件開發(fā)人員的薪金與一家高技術(shù)公司人事部門為研究軟件開發(fā)人員的薪金與他們他們的資歷、管理責(zé)任、教育程度等因素之間的關(guān)系,要建的資歷、
41、管理責(zé)任、教育程度等因素之間的關(guān)系,要建立一立一個(gè)數(shù)學(xué)模型,以便分析公司人士策略的合理性,并作為個(gè)數(shù)學(xué)模型,以便分析公司人士策略的合理性,并作為新聘新聘用人員工資的參考。他們認(rèn)為目前公司人員的薪金總體用人員工資的參考。他們認(rèn)為目前公司人員的薪金總體上是上是合理的,可以作為建模的依據(jù),于是調(diào)查了合理的,可以作為建模的依據(jù),于是調(diào)查了4646名開發(fā)人名開發(fā)人員的員的檔案資料,如表。其中資歷一列指從事專業(yè)工作的年數(shù),檔案資料,如表。其中資歷一列指從事專業(yè)工作的年數(shù),管管理一列中理一列中1 1表示管理人員,表示管理人員,0 0表示非管理人員,教育一列表示非管理人員,教育一列中中1 1表示中學(xué)程度,表示
42、中學(xué)程度,2 2表示大學(xué)程度,表示大學(xué)程度,3 3表示更高程度研究表示更高程度研究生)生)開發(fā)人員的薪金與他們的資歷、管理責(zé)任、教育程度分析與假設(shè):分析與假設(shè):按照常識(shí),薪金自然按照資歷年的增長而增加,管理人員的薪金高于非管理人員,教育程度越高薪金越高。薪金記作y,資歷年記作1x,為了表示是否為管理人員定義2x1,管理人員0,非管理人員為了表示三種教育程度,定義3x1,中學(xué)0,其它4x1,大學(xué)0,其它這樣,中學(xué)用0, 143xx表示,大學(xué)用1, 043xx表示,研究生則用0, 043xx表示。為了簡單起見,我們假定資歷年對薪金的作用是線性的,即資歷每加一年,薪金的增長是常數(shù);管理責(zé)任、教育程度
43、、資歷諸因素之間沒有交互作用,建立線性回歸模型?;灸P停夯灸P停盒浇饄與資歷1x,管理責(zé)任2x,教育程度43,xx之間的多元線性回歸模型為443322110 xaxaxaxaay其中,410,aaa是待估計(jì)的回歸系數(shù),是隨機(jī)誤差。利用MATLAB的系統(tǒng)工具箱可以得到回歸系數(shù)及其置信區(qū)間(置信水平 )05. 0、檢驗(yàn)統(tǒng)計(jì)量pFR,2的結(jié)果,見表。0a1a2a3a4a0,226,957. 02pFR結(jié)果分析:結(jié)果分析:從表中,957. 02R,即因變量薪金的95.7%可由模型確定,F(xiàn)值超過F檢驗(yàn)的臨界值,p遠(yuǎn)小于,因而模型從整體來看是可用的。比如,利用模型可以估計(jì)或估計(jì)一個(gè)大學(xué)畢業(yè)、有2年資歷
44、、管理人員的薪金為12273100243210aaaaay模型中各個(gè)回歸系數(shù)的含義可初步解釋如下:1x的系數(shù)為546,說明資歷每增加一年,薪金增長546;2x的系數(shù)為6883,說明管理人員的薪金比非管理人員多6883;3x的系數(shù)為-2994,說明中學(xué)程度的薪金比研究生少2994;4x的系數(shù)為148,說明大學(xué)程度的薪金比研究生多148,但是應(yīng)該注意到4a的置信區(qū)間包含零點(diǎn),所以這個(gè)系數(shù)的解釋是不可靠的。注意:上述解釋是就平均值來說的,并且,一個(gè)因素改變引起的因變量的變化量,都是在其它因素不變的條件下才成立的。進(jìn)一步討論:進(jìn)一步討論:的置信區(qū)間包含零點(diǎn),說明上述基本模型存在缺點(diǎn)。為了4a尋找改進(jìn)的
45、方向,常用殘差分析法殘差指薪金的實(shí)際值y與模型估計(jì)的薪金y 之差,是基本模型中隨機(jī)誤差的估計(jì)值,這里用同一個(gè)符號(hào))。我們將影響因素分成資歷與管理教育組合兩類,管理-教育組合定義如表。管理管理教育組合教育組合為了對殘差進(jìn)行分析,下圖給出與資歷1x的關(guān)系,及與管理2x-教育43, xx組合間的關(guān)系。與資歷1x的關(guān)系與432,xxx 組合的關(guān)系從左圖看,殘差大概分成3個(gè)水平,這是由于6種管理教育組合混在一起,在模型中未被正確反映的結(jié)果;從右圖看,對于前4個(gè)管理教育組合,殘差或者全為正,或者全為負(fù),也表明管理-教育組合在模型中處理不當(dāng)。在模型中,管理責(zé)任和教育程度是分別起作用的,事實(shí)上,二者可能起著交
46、互作用,如大學(xué)程度的管理人員的薪金會(huì)比二者分別的薪金之和高一點(diǎn)。以上分析提示我們,應(yīng)在基本模型中增加管理更好的模型:更好的模型:2x與教育43, xx的交互項(xiàng),建立新的回歸模型。增加2x與43, xx的交互項(xiàng)后,模型記作426325443322110 xxaxxaxaxaxaxaay利用MATLAB的統(tǒng)計(jì)工具箱得到的結(jié)果如表:0a1a2a3a4a5a6a0,554,999. 02pFR由上表可知,這個(gè)模型的做該模型的兩個(gè)殘差分析圖,可以看出,已經(jīng)消除了不正?,F(xiàn)象,這也說明了模型的適用性。2R和F值都比上一個(gè)模型有所改進(jìn),并且所有回歸系數(shù)的置信區(qū)間都不含零點(diǎn),表明這個(gè)模型完全可用。與1x的關(guān)系與
47、432,xxx 組合的關(guān)系從上圖,還可以發(fā)現(xiàn)一個(gè)異常點(diǎn):具有10年資歷、大學(xué)程度的管理人員編號(hào)33的實(shí)際薪金明顯低于模型的估計(jì)值,也明顯低于與他有類似經(jīng)歷的其他人的薪金。這可能是由我們未知的原因造成的。為了使個(gè)別數(shù)據(jù)不致影響整個(gè)模型,應(yīng)該將這個(gè)異常數(shù)據(jù)去掉,對模型重新估計(jì)回歸系數(shù),得到的結(jié)果如表。殘差分析見圖。可以看到,去掉異常數(shù)據(jù)后結(jié)果又有改善。0a1a2a3a4a5a6a0,36701,9998. 02pFR與1x的關(guān)系與432,xxx 組合的關(guān)系模型的應(yīng)用:模型的應(yīng)用:對于第二個(gè)模型,用去掉異常數(shù)據(jù)33號(hào)后估計(jì)出的系數(shù)得到的結(jié)果是滿意的。模型的應(yīng)用之一,可以用來“制訂6種管理教育組合人員
48、的“根底薪金即資歷為零的薪金),這是平均意義上的。利用第二個(gè)模型和去掉異常數(shù)據(jù)后得到的回歸系數(shù),可以得到如下結(jié)果:30aa 5320aaaa40aa 6420aaaa0a20aa 可以看出,大學(xué)程度的管理人員薪金比研究生程度管理人員薪金高,而大學(xué)程度的非管理人員薪金比研究生程度非管理人員薪金略低。當(dāng)然,這是根據(jù)這家公司實(shí)際數(shù)據(jù)建立的模型得到的結(jié)果,并不具普遍性。評注:評注:從建立回歸模型的角度,通過這個(gè)問題的求解我們學(xué)習(xí)了:1) 對于影響因變量的定性因素管理、教育),可以引入 01變量來處理,01變量的個(gè)數(shù)比定性因素的水平少 1如教育程度有3個(gè)水平,引入2個(gè)01變量)。2) 用殘差分析法可以發(fā)
49、現(xiàn)模型的缺陷,引入交互作用項(xiàng)常 ??梢缘玫礁纳啤?) 若發(fā)現(xiàn)異常值應(yīng)剔除,有助于結(jié)果的合理性??紤]:在這里我們由簡到繁,先分別引進(jìn)管理和教育因素,再考慮:在這里我們由簡到繁,先分別引進(jìn)管理和教育因素,再引入交互項(xiàng)。試直接對引入交互項(xiàng)。試直接對6 6種管理種管理- -教育組合引入教育組合引入5 5個(gè)個(gè)0101變量,建變量,建立模型,看結(jié)果如何。立模型,看結(jié)果如何。五五 教學(xué)評估教學(xué)評估為了考評教師的教學(xué)質(zhì)量,教學(xué)研究部門設(shè)計(jì)了一個(gè)教學(xué)評估表,對學(xué)生進(jìn)行一次問卷調(diào)查,要求學(xué)生對12位教師的15門課程其中3為教師有兩門課程按以下7項(xiàng)內(nèi)容打分,分值為15分5分最好,1分最差):問題:問題:1X課程內(nèi)容組織的合理性;2X主要問題展開的邏輯性;3X回答學(xué)生問題的有效性;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年春八年級(jí)歷史下冊 第11課 城鄉(xiāng)人民生存狀態(tài)的滄桑巨變說課稿1(pdf) 川教版
- Unit 2 Understanding each other Project 說課稿-2023-2024學(xué)年高中英語牛津譯林版(2020)選擇性必修第四冊
- Unit 6 Meet my family Part B Let's talk Let's learn大單元整體說課稿表格式-2024-2025學(xué)年人教PEP版英語四年級(jí)上冊
- 2024年秋七年級(jí)生物上冊 3.5.2 綠色植物的呼吸作用說課稿 (新版)新人教版001
- 葡萄園立柱施工方案
- 2023三年級(jí)數(shù)學(xué)下冊 三 美麗的街景-兩位數(shù)乘兩位數(shù)信息窗1 美麗的街燈第2課時(shí)說課稿 青島版六三制
- 預(yù)制水泥臨時(shí)圍墻施工方案
- 臨時(shí)合同范例復(fù)制
- 西安電動(dòng)推拉雨棚施工方案
- 2024秋一年級(jí)語文上冊 漢語拼音 11 ie üe er說課稿 新人教版
- 2024美團(tuán)簡化版商家合作合同標(biāo)準(zhǔn)文本一
- 2025年貴州黔源電力股份有限公司招聘筆試參考題庫含答案解析
- 《休閑食品加工技術(shù)》 課件 1 休閑食品生產(chǎn)與職業(yè)生活
- 春季開學(xué)安全第一課
- 2025年新生兒黃疸診斷與治療研究進(jìn)展
- 廣東大灣區(qū)2024-2025學(xué)年度高一上學(xué)期期末統(tǒng)一測試英語試題(無答案)
- 2025年四川中煙工業(yè)限責(zé)任公司招聘110人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 課題申報(bào)書:數(shù)智賦能高職院校思想政治理論課“金課”實(shí)踐路徑研究
- 公司安全生產(chǎn)事故隱患內(nèi)部報(bào)告獎(jiǎng)勵(lì)工作制度
- H3CNE認(rèn)證考試題庫官網(wǎng)2022版
- 感統(tǒng)訓(xùn)練培訓(xùn)手冊(適合3-13歲兒童)
評論
0/150
提交評論