版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、回歸分析與時間序列11.1一元線性回歸(1)編輯數(shù)據(jù)集,命名為 lin ehuigui1.dat3-113Ch23150335Q15$447315*7754d1L?U1/0y3丄J_5ih10101右150111113a17S121214JIttS 1prQducTcosi輸入命令可以看到,產(chǎn)量和生產(chǎn)費用是正線性相關(guān)的關(guān)系。scatter cost product,xlabel(#10, grid) ylabel(#10, grid),得到如下散點圖,a.I *JD TO M TO so M 'W tID pHTdurl(2 )輸入命令 reg cost pr
2、oduct,得到如下圖:” r旳 COST prndurTSourmssdtMSMunber of obb rc 1,10;Prob > rR-squd它dAdj HsquaredBoor HSE= 12 -阪尊-O.fXXX)-0出CB -n蟲31號-6- zeiziodel Residual777.710174S7,206S11075?7.71O1745.?206STorml<n bftZ11SWC<pef Hstd.Err.tP>lt 1mterL-fli Jproduct-COtIG弓?101.號5. 71?ai571-ftaQ.om o.coo15-7611可
3、得線性函數(shù)(Product 為自 變量,cost 為因變量):y=0.4206832x+124.15,30=124.15 ,山=0.4206832(3 )對相關(guān)系數(shù)的顯著性進行檢驗,可輸入命令pwcorr costp roduct, sig star(.05)prin t(.05),得到下圖: pwcorr cost product, sig 吞tar(.05) print(Q5>匚ostpro du Ctcost1.0000product0-9202*0.00001*0000可見,在 a=0.05的顯著性水平下,P=0.0000<用之間存在顯著的正相關(guān)性。11.2(1)編輯數(shù)據(jù)集
4、,命名為lin ehuigui2.datf firtirtutiffl電164£2613343447023EBB27G923H77218S7722a=0.05,故拒絕原假設(shè),即產(chǎn)量和生產(chǎn)費輸入命令看到,分數(shù)和復(fù)習(xí)時間是正線性相關(guān)的關(guān)系。scatter fen shu time,xlabel(#4, grid) ylabel(#4, grid),得到如下散點圖,可以計算相關(guān)系數(shù),得下圖: cor fetKhu(ob5=5)timefenshuti mefenshu timeL.OOOO th 86211.00002 )輸入命令 cor fenshu time可見,r=0.8621 ,可
5、見分數(shù)和復(fù)習(xí)時間之間存在高度的正相關(guān)性。11.3( 1)( 2)對于線性回歸方程31=-0.5,表示x變化一單位引起(3) x=6 時,E(y)=10-0.5*6=7y=10-0.5x ,其中30=10 ,表示回歸直線的截距為10 ;y的變化為-0.5 ooo ?114( 1 ) ?=- 、 )' '? ?+?+?:?= ?判定系數(shù)??測度了回歸直線對觀測數(shù)據(jù)的擬合程度,即在分數(shù)的變差中, 在分數(shù)取值的變動中,有有90%可以由分數(shù)與復(fù)習(xí)時間之間的線性關(guān)系解釋,或者說,90%由復(fù)習(xí)時間決定??梢姡瑑烧咧g有很強的線性關(guān)系。(2 )估計標準誤差??=/?-?=?*»= ?
6、分,即根據(jù)復(fù)習(xí)時間來估計分數(shù)時,平均的(1)編輯數(shù)據(jù)集,命名為lin ehuigui3.dat估計誤差為0.25分。Cineju1113. 5S2521. 02 IS34. 010 7042. Q5 5051. 04 30£ a74. &135081. 532?93. 0670105.0121511.5輸入命令到,時間和距離是正線性相關(guān)的關(guān)系。scatter time juli,xlabel(#5, grid) ylabel(#5, grid),得到如下散點圖,可以看5001000Ju1500(2 )輸入命令-cor time(obs=10)cor time julilull
7、計算相關(guān)系數(shù),得下圖:mejuHtime1.0000juli0,94891,0000可見,r=0.9489 ,可見時間和距離之間存在高度的正相關(guān)性。(3 )輸入命令reg time juli 得到下圖:sourceSEdfMSNumber of obs =10u F耳hrModel Residua!16.68162131.84337B721816,6816213 230422339廠 丄J7Prob > FR-squaredAdj R-squared ROOT MSE-O'.CXXX) -0*9005-=.4W0£Txa1IS,牡,9timeCoef.Std*Err.t
8、p>|r|9琳 conf,intervaljull_匚 Qns.0035851 -liSUffl.00042148. 51.3S514770. 33'.000.748.O2G135-.700843.0045568 .971012.reg time jull可得線性函數(shù)(juli為自變量,time 為因變量):y=0.x+0.1181291, 即 加=0.1181291表示回歸直線的截距為 0.1181291; 31=0.0035851,表示距離(x)變化1km 引起時間(y )的變化為0.天。11.6lin ehuigui4.datprovinetGDPdipt1Beijing盈
9、峠因7淀衍2LIaoring1122644903Shanghai34547115 4&4Ji arigxi4G51259fi5Henan&4446Guizhou2 62isoa7Shinxi45 42035(1)編輯數(shù)據(jù)集,命名為輸入命令 scatter cspt GDP,xlabel(#3, grid) ylabel(#3, grid) 到,時間和距離是正線性相關(guān)的關(guān)系。,得到如下散點圖,可以看sgr-u *r(2 )輸入命令cor cspt GDP 計算相關(guān)系數(shù),得下圖:.cor cspt (UPCobs-7)csptGDPcspt1.0000石DP(K 99S11.000
10、0可見,r=0.9981 ,可見人均消費水平和人均GDP之間存在高度的正相關(guān)性。(3 )輸入命令reg cspt GDP 得到下圖:5宓rc«MiT«il片口*«of ofcl 二7F 1.5> -pr&b > R-D-Cicnon Yqud廠 gB-O. Wh%Adj n-squai-etl O.995SPSE=JC5PtPltl黠M f onf* internal J JtW啞 f.UOMMW 熱詁 y 0,OW>£770.001可得線性函數(shù) (GDP為自變量,cspt為因變量):y=0.x+734.6928, 即加=734
11、.6928,表示回歸直線的截距為 734.6928 ;價=0.,表示人均GDP (x)變化1元引起人均消費水平(y )的變化為0.元。(4)由(3)得到的結(jié)果可得??=0.9963,判定系數(shù)??測度了回歸直線對觀測數(shù)據(jù)的擬合程度,即在人均消費水平的變差中,有 性關(guān)系解釋,或者說,在人均消費水平取值的變動中,99.63%可以由人均消費水平與人均GDP之間的線有99.63% 由人均GDP決定??梢?兩者之間有很強的線性關(guān)系。F檢驗值1331.69 對應(yīng)的檢驗 P值為(5 )由(3)得到的結(jié)果可得回歸方程線性關(guān)系的0.0000< a=0.05 ,故拒絕原假設(shè),即人均消費水平和人均 GDP之間存
12、在顯著的正相關(guān)性。(6) x=5000 時,E (y) =0.3086827*5000+734.6928=2278.1063(7) x=5000 時,輸入命令 Predictnl PT=predict(xb),ci(lb ub) l(95) 水平下的置信區(qū)間,如下圖:,得到各人均GDPjt>7Cfir. ?&74?與5+£70斗4195-呂乩tElB11333-756lOBsr.ezi11339.EB3llES2百715?.環(huán)fiil丄40«孑IZJe.jIZL?lia.D9DCme, &輸入如下命令,得到置信區(qū)間和預(yù)測區(qū)間示意圖:P redict y
13、hatp redict std p, std pp redict stdf, stdfgen erate zl = yhat - i nvttail(5,0.025)*std pgen erate zu= yhat + in vttail(5,0.025)*std pgen erate yl = yhat - i nvttail(5,0.025)*stdf gen erate yu = yhat + in vttail(5,0.025)*stdftwoway (I fitci cs pt GDP, level(95) (scatter cspt GDP) (li ne zl zu yl yu取
14、 cspt=y,GDP=x,y0 為 x0=5000 的預(yù)測值,x1 為 GDP 平均值,x2= (x0-x1 )人2, x3= sum(x-x1)2)?= V= ? ?= ? ?7、. "7y0=0.3086827*5000+734.6928=2278.1063,egen x1=mean(x),得到 x1=12248.429,gen x2=(5000-12248.429)2 ,得到 x2= 52539722.968 egen x3= sum(x-x1)2) ,得到 x3=854750849.7143 dis play dis play dis play dis play 即人均y0
15、+2.7764*247.3*sqrt(1/7+x2/x3)y0-2.7764*247.3*sqrt(1/7+x2/x3)y0+2.7764*247.3*sqrt(1+1/7+x2/x3)y0+2.7764*247.3*sqrt(1+1/7+x2/x3)GDP為5000元時,人均消費水平95%,得 zu= 2588.4671,得 zl= 1967.7455,得 yu= 3031.5972,得 yl= 1524.6154的置信區(qū)間為1967.7455,2588.4671預(yù)測區(qū)間為1524.6154, 3031.5972。(1)編輯數(shù)據(jù)集,命名為 lin ehuigui5.datpercentor
16、pl ts1Si.321276.65527e.fi35475.7Efl&7467.2藥771.273S70.3122991.4IB10125輸入命令scattercmpits11.7percen t,xlabel(#5, grid) ylabel(#5, grid) 可以看到,時間和距離是負線性相關(guān)的關(guān)系。,得到如下散點圖,Ius -7075BOtrcencS5(2)輸入命令 reg cmpItspercent 得到下圖:” r犧 cnplrs pjwrnrSourcedfH£Hodel dualS7T7. sb1 877?. SSI巧2B5J.aibaiB 15/2/001
17、NunibEr of Dbs - r< 1, fl】 -Total9 12<n.«2222prob T F-U-S-4uAreC-Adj 觀sqiiAr*«d - pg M5E=lU0.0011O./S<5o./znC«p<1lT5coef.FTP.55% conf. TmeruslpercentC<H1S-4. 7UOb?JO.UOL -4-J. M4/J64 30.1&9125.960.000M丸 7999可得線性函數(shù)(percent 為自變量,cmpIts為因變量):y=-4.700623x+430.1892,,表示回歸
18、直線的截距為430.1892 ;31=4700623,表示航班正點率1%使投訴次數(shù)cmpIts 的減少-4.700623 次。得到的結(jié)果可得回歸系數(shù)檢驗的t值-4.96對應(yīng)的P值為0.001< a=0.05 ,即航班正點率percent是投訴次數(shù)cmpits的一個顯著因素(或者輸入test30=430.1892p ercent 提高(3 )由(2)故拒絕原假設(shè),p erce nt=0 )(4)x=80 時,(5)x=80 時,平下的置信區(qū)間,如下圖:E(y)=-4.700623*80+430.1892=54.13936 輸入命令 predictnl PT=predict(xb),ci(l
19、b ub) l(95)次。,得到各航班正點率水rrlb(jt-3?1270O5氣中C141hOZmflr61.244604狂檢M7-£55702 5&5-7Ci7ClC33.3345?£?65&0+l5S.1j214222.7.E5MG157.5O75S5?S7.ia0477L.SL941<¥:.44«caiJI.輸入如下命令,得到置信區(qū)間和預(yù)測區(qū)間示意圖:P redict yhatp redict std p, std pp redict stdf, stdfgen erate zl = yhat - i nvttail(8,0.
20、025)*std pgen erate zu= yhat + in vttail(8,0.025)*std p gen erate yl = yhat - i nvttail(8,0.025)*stdfgenerate yu = yhat + invttail(8,0.025)*stdftwoway (lfitci cmp Itsp ercent, level(95) (scatter cmpitsyu p ercent, p style( p2 p2 p3 p3) sort)P erce nt) (li ne zl zu yl玄.s.Ig.7075so93% Cl Fttted t mlLE
21、SVtrn訓(xùn)怡=w*刊BE取 cmplts=y , percent=x , yO 為 x0=80 的預(yù)測值,x1 為 percent 平均值,x2= (x0-x1 ) 人2 , x3= sum(x-x1)A2) ?= V ?= ? ? = ? ?. ? 'y0=-4.700623*80+430.1892=54.13936,egen x1=mean(x),得到 x1=12248.429,gen x2=(80-75.86)2 ,得到 x2= 17.1396dis playdis playdis playdis play,得 zu= 70.619033,得 zl= 37.659687,得 y
22、u= 100.7063,得 yl= 7.572417170.619033,預(yù)測egen x3= sum(x-x1)2) ,得到 x3= 397.024 y0+2.3060*18.887*sqrt(1/10+x2/x3) y0-2.3060*18.887*sqrt(1/10+x2/x3) y0+2.3060*18.887*sqrt(1+1/10+x2/x3) y0-2.3060*18.887*sqrt(1+1/10+x2/x3)即航班正點率為 80%時,投訴次數(shù)的95%的置信區(qū)間為37.659687, 區(qū)間為7.5724171, 100.7063。11.8( 1 )打開一張EXCEL表格,輸入數(shù)
23、據(jù)如下:出也耳g 5+方米月川全g70. £bs. U7473. 49367. 170?G. 184£S. 763. 467?3.b10a71.495SC. 7107fl. J3a62667e. 7iOShy. b70GE. 731ee. 57567. 73Zee.49472裁67. 97S(2 )數(shù)據(jù)I分析I數(shù)據(jù)分析I回歸,彈出回歸對話框并設(shè)置如下:Y值iSAE感;咖1國K值iSA兇握期:SBjZ.JfjZlI匡1也 1_:糊!寵曆© S匸戛鋼*_輸出E何G.?軒工咋圭組n.圭丫工咋聲to)(3)單擊“確定”SUMMARY OUTPUT回歸統(tǒng)計Mult ip l
24、e R0.79508R Square0.632151Adjusted R0.611715Square標準誤差2.685819觀測值20得如下輸出結(jié)果:方差分析dfSSMSFSign ifica neeF回歸分析1223.1403223.140330.933182.79889E-05殘差18129.84527.213622總計19352.9855標準誤差Upper下限上限Coefficie ntst StatP-valueLower 95%95%95.0%95.0%In terce pt49.317683.80501612.961231.45E-1041.3236350557.3117241.3
25、2363557.31172X Variable 10.2492230.044815.5617612.8E-050.1550803050.3433650.15508030.343365Excel輸出的回歸結(jié)果包括以下幾個部分:第一部分是“回歸統(tǒng)計”,這部分給出了回歸分析中的一些常用統(tǒng)計量,包括表中復(fù)相關(guān)系數(shù) Multi pie R=0.79508,它是度量復(fù)相關(guān)程度的指標,取值0,1之間,取值越大,表明要素或變量之間的線性相關(guān)程度越密切;判定系數(shù) R Square=0.632151,表示有63.2151% 的出租率可以由每平方米月租金之間的線性關(guān)系來解釋;調(diào)整的決定系數(shù) Adjusted R S
26、quare=0.611715,表示調(diào)整后的判定系數(shù)使用了自由度為一個權(quán)重因子,即使解釋變量增加,如果它與被解釋變量無關(guān),則調(diào)整后的判定系數(shù)不會增故又稱為均方誤差的平方根,在這加會減少; 標準誤差,表示各測量值誤差的平方的平均值的平方根, 里取2.685819(已驗證,該值即為 ??)觀測值個數(shù)19。第二部分是“方差分析”,這部分給出的是回歸分析的方差分析表,包括自由度df、回歸平方和SSR=223.1403 、殘差平方和 SSE=129.8452 、總平方和 SST=352.9855 、回歸的 均方根223.1403 、殘差的均方根 MSE=7.213622999999/99999999檢驗統(tǒng)
27、計量 99= ?/(?.?=)為=?;?F 檢驗的顯著性水平 SignificanceF=2.79889E-05,用于線性關(guān)系的顯著性檢驗,說明兩個變量之間的線性是否顯著;第三部分是參數(shù)估計的有關(guān)內(nèi)容。包括回歸方程的截距30=49.31768;斜率31=0.249223 ,表示月租金變化 1元引起的出租率變化 24.9223% ;截距的標準誤差 3.805016 ,斜率的標準誤差 0.04481;用于回歸系數(shù)檢驗的t統(tǒng)計量及對應(yīng)的 P值,說明回歸系數(shù)的顯著性,即月租金和出租率兩者之間是否有顯著關(guān)系;截距和斜率的置信區(qū)間Lower 95%, Upper 95%。11.9(1)方差分析表方差分析d
28、fSSMSFSign ifica neeF回歸分析11602708.61602708.6399.12.17E-09殘差1040158.074015.807總計111642866.67? ? ?(2) ?尹=孟?? ??=?汽車銷售量的變差中有97.556%由廣告費用 的變動引起。(3)汽車銷售量與廣告費用的相關(guān)系數(shù)??= V f?= V?表明汽車銷售量與廣告費用有高度的相關(guān)性。(4 )由題意得,y=1.420211x+363.6891 o 30=363.6891 ,表示回歸直線的截距為363.6891; 31=1.420211,表示廣告費用提高 1單位使汽車銷售量改變1.420211 單位。(
29、5)線性關(guān)系顯著性檢驗的 ? ? = ?,其對應(yīng)的P= Sig nifica nee F= 0<0.05故拒絕原假設(shè),即汽車銷售量與廣告費用之間的線性關(guān)系顯著。10(1 )編輯數(shù)據(jù)集,命名為lin ehuigui7.daty115472a319EC4124450£1scatter y xs畐1$5.10(2 )輸入命令reg y x得到下圖:輸入命令e,得到如下散點圖,可以看到,y和x是負線性相關(guān)的關(guān)系。ourCBModeldrutjlVI. 7hsbM or 3古、Pf 1.升=M.Wprob > f-O.WUn” 耳y 日-(KBJIAajkuot-3- (M3con
30、sc«r. sid. Irr.4.W可得線性函數(shù):表示x變化1y?2.302932x+13.62541,13.62541; 31?2.302932輸入 predict yhat gen e?x-yhat即30=13.62541,表示回歸直線的截距為單位使使y變化2.302932 單位。得到殘差e,見卜圖:Xyyhate1154746.16351-35.1碼mei233«32.04SS6-24, 0斗3&6319&657.3S11O7-33. 3 311074124441.260536-29.260-&ee55Z125.1400石5-ZO.14C0&a
31、mp;5由(2)的結(jié)果可得,判定系數(shù)?= ?即 y 的變有較強的線性關(guān)系;93.73% 由x引起,y和x之間估計標準誤差??= V? ?由于??= ?和x之間有較強的線性關(guān)系,直線擬合得較好。?/? ? ?/?11.11(2)(1 )?爼? ? ?' 丿?/(?-?)?/(?-?) ?= ?:.:?:. 尸.y.,由??> ?.?故拒絕原假設(shè);?z V f?= V?. ?(5)由(3)知,x與y之間有顯著的線性關(guān)系。11.12由題意得,12取y0為x0?4的預(yù)測值,x1為x平均值,x2? (x0-x1 )人2 , x3?sum(x-x1)A2)?= ? ?.?= ?y0?3*4+
32、5?17 x1?2 ,x2=4 ,x3= 20dis play17+2.1009*1.0*sqrt(1/20+4/20)dis playdis play17-2.1009*1.0*sqrt(1/20+4/20)17+2.1009*1.0*sqrt(1+1/20+4/20)dis play17-2.1009*1.0*sqrt(1 + 1/20+4/20),得 zu? 18.05045,得 zl? 15.94955,得 yu? 19.348878,得 yl? 14.651122即x為4元時,y的95%的置信區(qū)間為15.94955, 18.05045,預(yù)測區(qū)間為14.651122,11.13(1 )
33、編輯數(shù)據(jù)¥1E?弓4妁亠54C. Lfl?T441, f5"o,命名為lin ehuigui8.dat19.348878UgA9輸入命令scatter y x ,得到如下散點圖,可以看到,8y和x是負線性相關(guān)的關(guān)系。f怕Y X£SdfMShuflter of 血F( 1.可prob > FR-squAFfrdAdi Ji R-squdrodNur KS£a=D-ODDJ-affiii-iOH. /bR«&id>LiAl7UW0.1976IJOZ6 ue2t. LMMTMal/444JSJl1yCQpf"沆d. Er
34、r.THill訕站coifIfltWviln.-*fr.W41U1H-RAOAfi-Q,7JaoQO Or w10. now -?DS.D7*12U. JM/bI1?.4W7(2 )輸入命令reg y x得到下圖:可得線性函數(shù):y=15.23977x-46.29181, 即 加=-46.29181,表示回歸直線的截距為-46.29181; 31=15.23977,表示x變化1單位使使y變化15.23977 單位。(3)輸入如下命令,得到置信區(qū)間示意圖:P redict yhatp redict std p, std pgen erate zl = yhat - i nvttail(20,0.0
35、25)*std pgen erate zu= yhat + in vttail(20,0.025)*std ptwoway (Ifitci y x, level(95) (scatter y x) (li ne zl zu x, p style (p2 p2 p3 p3) sort)取 yO 為 xO=4O 的預(yù)測值,x1 為 x 平均值,x2= (x0-x1 )人2 , x3= sum(x-x1)2) ?= V ? = ? ? ? = ?/ ?y0=15.23977*40-46.29181=563.29899egen x1=mean(x),得到 x1= 24.9375 ,gen x2=(40
36、-24.9375)2egen x3= sum(x-x1)2)dis playy0+2.4469*dis playy0-2.4469*,得到 x2= 226.87890625,,得到 x3= 2692.11875?*?qrt(1/8+x2/x3),得 zu= 685.04208?qrt(1/8+x2/x3),得 zl= 441.5559即x為40元時,y的95%的置信區(qū)間為441.5559,685.04208。11.14編輯數(shù)據(jù)集,命名為lin ehuigui9.datJ 丄.丄4vSai337ne ElO 33 3ZS671011九占It11LtJOlOL2九5t-4丄弓irIt1»
37、2LQtlt2t-frle輸入命令得圖:scatter e1 v1假定的描述變量 x和y之間的關(guān)系模型是合理的,*- *ry6 *itoV4可見對所有的x值,£的方差都相同, 殘差圖對應(yīng)的模型是滿意的模式;輸入命令scatter e2 v4 得圖:(1 )編輯數(shù)據(jù)集,命名為lin ehuigui10.dat可見該殘差圖對應(yīng)的模型不合適,應(yīng)考慮曲線回歸或多元回歸模型。11.151932401052輸入命令 系。scatter y x,得到如下散點圖,可以看到,銷售額和廣告費用是正線性相關(guān)的關(guān)£T>T10D5丹輸入命令reg y x得到下圖:r ¥ wdf1)/
38、,試jjPC5>Prih 匕 rAdj 巧 Bar 屯dGoat hSC-T=U.l%-C.flW* -"CkSD -aZH -r, NTinESiidualI 曲旳、丄 s E.KSaaeTot al1CHI7aIA7y3td. EPr,工1tissK tK!f.1 門 twuallKVWS1. MFW札*07科)氐12«. 0212.*1-可得線性函數(shù):y=1.547478x+29.39911, 即3o=29.39911,表示回歸直線的截距為29.39911 ; 31=1.547478 ,表示廣告支出費用提高1萬元使銷售額提高 1.547478 萬元。(2 )由(
39、1 )得到的結(jié)果可得回歸方程線性關(guān)系的 F檢驗值11.15 對應(yīng)的檢驗 P值為 0.0206< a=0.05,故拒絕原假設(shè),即銷售額和廣告費用之間存在顯著的正相關(guān)性。(3)輸入 Predict yhatgen e=y-yhatscatter e x輸入 gen z= e/ 7.8775scatter z x得到標準化殘差圖如下:可見標準化殘差都在-2到2之間,對所有的x值,£的方差都相同,假定的描述變量x和y 之間的關(guān)系模型是合理的,該殘差圖對應(yīng)的模型是滿意的模式。(4 )由(3)知雖然愛關(guān)于誤差項£的假設(shè)被滿足了,可是通過散點圖的走勢可以發(fā)現(xiàn),如果用指數(shù)型曲線模擬效
40、果會更好。11.161z345a(1 )編輯數(shù)據(jù)集,X12065- 710417C-CS?y3GZO1513S命名為lin ehuigui11.dat8910輸入命令 系。5a1001*5021*5L. *5,31*7scatter y x4.3,得到如下散點圖,可以看到,銷售量和廣告費用是正線性相關(guān)的關(guān)輸入命令reg y x得到下圖:nMbrce55dfHSNumber of obs r( 1.S)pro& A F (t-quaredAdjRjWt r/SE- 10 -九Mt-O.ODO?-0.7643 三C.7S23霰2 i dual735.4902071 a735.4SD2072
41、5.2912242TQtal937.624104202222yatd.TP>|T 195'k CorfnrervalX-tons旳i.nn6 fniO.fW7-<f67757+ 27* V! n . 06707可得線性函數(shù):y=0.1958404x+4.068466, 即 =4.068466 ,表示回歸直線的截距為4.068466 ; 31=0.1958404 ,表示廣告支出費用提高1萬元使銷售量提高 0.1958404 萬箱。(2)輸入 Predict yhatgen e=y-yhatscatter e x得到殘差圖如下501001»tW0輸入 gen z= e
42、/ 7.8775scatter z x得到標準化殘差圖如下:可見標準化殘差都在-2到2之間,對所有的x值,£的方差都相同,假定的描述變量x和y 之間的關(guān)系模型是合理的,該殘差圖對應(yīng)的模型是滿意的模式。最后一點(120.0,36.3 )對應(yīng)的標準化殘差較大,接近?= ?該點為異常點。取 x1 為 x 平均值,x2= (x-x1 )人2 , x3= sum(x-x1)A2)egen x1=mean(x),得至U x1= 40.5 ,gen x2=(x-x1)2,egen x3= sum(x-x1)2) ,得到 x3= 19176.64gen x4=1/10+ x2/x3gen x5=1/
43、10gen x6=x4-x5scatter x6 x5D150由上圖可知,倒數(shù)最大的一個點(120.0,36.3)具有高杠桿率,該點是有影響的觀測值。(3)有影響的觀測值不一定是一個異常值。9512.1多元線性回歸(1)編輯數(shù)據(jù)集,命名為ymli nehuigui1.dat112174寸Z13ZB1333t1B5442B咖<5ii1艸el&j7豳2L&E&2?10113弓&I&?1017EKlreg y x1 x2 得到下圖:soLirctdfW5Lfibtr of ubs =ID“71 -n. fuwodtl3JZ.WJ/44177,9S
44、1;J37L3* 丿Prob > FR-squaredJdj R-squared Ro-5t MSE-O.4JbS -0,2109=-0.0146-1J.341Total15/W.99yCoef.std.Err.tp >mii9 菇 Canf.rnterval Kl X? .tansi,q?m69.tO5W4471.T1l.LZ0.6«, 296網(wǎng)34CG -1.-27.651SS.2am 795- «W?76 r7,7M2B輸入命令r*>g y xl可得線性函數(shù):y=-0.0497143x1+1.928169x2+25.0287。當 x1=200 ,x2=7 時,y=-0.0497143*200+1.928169*7+25.0287=28.58302312.2模型涉及3個變量,45個觀察值;回歸方程 y=657.0534-0.416917x1-3.471481x2;其中Significanee F=0.002724<0.05 ,故y與x1和x2之間的線性關(guān)系顯著;Se=109.429596,即根據(jù)所建立的多元回歸方程進行預(yù)測是,平均的預(yù)測誤差為109.429596;R2=0.709650 ,即y的變差中,能由x1和x2解釋的比例為70.9650% ;?芻=0.630463 ,即在用樣本量和模型中的自變量的個數(shù)調(diào)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 防雷設(shè)施安裝維護合同三篇
- 化妝品行業(yè)保安工作總結(jié)
- 兒童游樂設(shè)施設(shè)計美工工作總結(jié)
- 林業(yè)行業(yè)美工的森林保護
- 風險防范工作總結(jié)
- 【八年級下冊地理粵教版】第8章 珠江三角洲 單元測試
- 本科生畢業(yè)論文答辯記錄表
- 2025屆揚州市高三語文(上)1月質(zhì)量調(diào)研試卷及答案解析
- 創(chuàng)新成果知識產(chǎn)權(quán)合同(2篇)
- DB33T 2188.4-2019 大型賽會志愿服務(wù)崗位規(guī)范 第4部分:禮賓接待志愿服務(wù)
- 養(yǎng)老服務(wù)中心裝飾裝修工程施工方案
- 落地式腳手架監(jiān)理實施細則
- 上海市金山區(qū)2022-2023學(xué)年中考一模英語試題含答案
- 節(jié)水灌溉供水工程初步設(shè)計報告
- 【期末試題】河西區(qū)2018-2019學(xué)年度第一學(xué)期六年級數(shù)學(xué)期末試題
- 2022年總經(jīng)理年會發(fā)言稿致辭二
- 警綜平臺運行管理制度
- 立法學(xué)完整版教學(xué)課件全套ppt教程
- 簡約中國風水墨山水工作總結(jié)通用PPT模板
- 礦山測量課程設(shè)計
- 藥廠生產(chǎn)車間現(xiàn)場管理-PPT課件
評論
0/150
提交評論