版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2023—2023學(xué)年第二學(xué)期《數(shù)據(jù)分析》期末論文題目影響成品鋼材需求量的回歸分析姓名韓金偉學(xué)號(hào)20231021135系〔院〕數(shù)學(xué)系專業(yè)數(shù)學(xué)與應(yīng)用數(shù)學(xué)2023年6月19日題目:影響成品鋼材需求量的回歸分析摘要:隨著社會(huì)經(jīng)濟(jì)的不斷開展,科學(xué)技術(shù)的不斷進(jìn)步,統(tǒng)計(jì)方法越來(lái)越成為人們必不可收的工具盒手段。應(yīng)用回歸分析是其中的一個(gè)重要分支,本著國(guó)家經(jīng)濟(jì)水平的不斷提高,我們采用回歸分析的方法對(duì)我國(guó)成品鋼材的需求量進(jìn)行分析應(yīng)用。為了使分析的模型具有社會(huì)實(shí)際意義,我們引用了1980——1998年的成品鋼材、原油、生鐵、原煤、發(fā)電量、鐵路貨運(yùn)量、固定資產(chǎn)投資額、居民消費(fèi)、政府消費(fèi)9個(gè)不同的量來(lái)進(jìn)行回歸分析。通過建立回歸模型充分說(shuō)明成品鋼材需求量與其他8個(gè)變量的關(guān)系,以及我國(guó)社會(huì)經(jīng)濟(jì)的實(shí)際開展情況和意義。關(guān)鍵字:線性回歸回歸分析社會(huì)經(jīng)濟(jì)回歸模型成品鋼材多元回歸國(guó)家經(jīng)濟(jì)社會(huì)開展目錄TOC\o"1-4"\h\u609第1章題目表達(dá)18766第2章問題假設(shè)121327第3章問題分析27124第4章數(shù)據(jù)的預(yù)處理3179294.1曲線統(tǒng)計(jì)圖3141544.2散點(diǎn)統(tǒng)計(jì)圖4251744.3樣本的相關(guān)系數(shù)414715第5章回歸模型的建立527941第6章回歸模型的檢驗(yàn)684606.1F檢驗(yàn)6271566.2T檢驗(yàn)6113766.3T檢驗(yàn)分析6271246.4Chow斷點(diǎn)檢驗(yàn)8196636.5Chow預(yù)測(cè)檢驗(yàn)85753第7章違背模型根本假設(shè)的情況9218777.1異方差性的檢驗(yàn)9113987.1.1殘差圖示檢驗(yàn)9295587.1.2懷特〔White〕檢驗(yàn)9250057.2自相關(guān)性的檢驗(yàn)1060527.2.1LM檢驗(yàn)10222367.2.2DW檢驗(yàn)103343第8章自變量選擇與逐步回歸1023868.1前進(jìn)逐步回歸法1022138.1.1前進(jìn)逐步回歸10318198.1.2前進(jìn)逐步回歸模型預(yù)測(cè)1188758.2后退逐步回歸法12268898.2.1后退逐步回歸12289648.2.2后退逐步回歸模型預(yù)測(cè)1328705第9章多重共線性的診斷及消除14292929.1多重共線性的診斷14241199.2消除多重共線性1512674第10章回歸模型總結(jié)1726507參考文獻(xiàn)186623附錄:19影響成品鋼材需求量的回歸分析第1章題目表達(dá)理論上認(rèn)為影響成品鋼材的需求量的因素主要有經(jīng)濟(jì)開展水平、收入水平、產(chǎn)業(yè)開展、人民生活水平提高、能源轉(zhuǎn)換技術(shù)等因素。為此,收集了我國(guó)成品鋼材的需求量,選擇與其相關(guān)的八個(gè)因素:原油產(chǎn)量、生鐵產(chǎn)量、原煤產(chǎn)量、發(fā)電量、鐵路貨運(yùn)量、固定資產(chǎn)投資額、居民消費(fèi)、政府消費(fèi)作為影響變量,1980——1998年的有關(guān)數(shù)據(jù)如下表。此題旨在通過建立這些經(jīng)濟(jì)變量的線性模型來(lái)說(shuō)明影響成品鋼材需求量的原因。數(shù)據(jù)來(lái)源:易丹輝.數(shù)據(jù)分析與EViews應(yīng)用.中國(guó)人民大學(xué)出版社.2023〔教材第85頁(yè)〕。原始數(shù)據(jù)〔中國(guó)統(tǒng)計(jì)年鑒〕:年份成品鋼材〔萬(wàn)噸〕原油〔萬(wàn)噸〕生鐵〔萬(wàn)噸〕原煤〔億噸〕發(fā)電量〔億千瓦時(shí)〕鐵路貨運(yùn)量〔萬(wàn)噸〕固定資產(chǎn)投資額〔億元〕居民消費(fèi)〔億元〕19802716.2105953802.46.23006.2111279910.92317.119812670.1101223416.66.23092.71076739612604.1198229021021235516.6632771134951230.42867.9198330721060737387.1535141187841430.13182.51984337211461.340017.8937701240741832.93674.51985369312489.543848.7241071307092543.245891986405813068.850648.9444951356353120.65175198743561341455039.2849731406533791.75961.21988468913704.657049.854521449484753.87633.11989485913764.1582010.5458481514894410.48523.51990515313830.6623810.8621215068145179113.21991563814009.2676510.8767751528935594.510315.91992669714209.7758911.1675391576278080.112459.81993771614523.7873911.51839516266313072.315682.41994848214608.2974112.4928116309317042.120809.819958979.815004.9410529.2713.6110070.316588520019.326944.519969338.0215733.3910722.513.9710813.11688032297432152.319979978.9316074.1411511.4113.7311355.5316973422913.534854.6說(shuō)明:由于數(shù)據(jù)是經(jīng)過人工錄入的,經(jīng)反復(fù)對(duì)照沒有發(fā)現(xiàn)錯(cuò)誤,因此就采用了此數(shù)據(jù)做回歸模型。但是也不能排除在錄入過程中會(huì)出現(xiàn)一些小的錯(cuò)誤,所以回歸模型僅滿足上表數(shù)據(jù)。第2章問題假設(shè)為了問題的簡(jiǎn)潔明了,現(xiàn)對(duì)題目中的變量給出以下假設(shè):中國(guó)成品鋼材的需求量為〔萬(wàn)噸〕、原油產(chǎn)量〔萬(wàn)噸〕、生鐵產(chǎn)量〔萬(wàn)噸〕、原煤產(chǎn)量〔億噸〕、發(fā)電量〔億千瓦時(shí)〕、鐵路貨運(yùn)量〔萬(wàn)噸〕、固定資產(chǎn)投資額〔億元〕、居民消費(fèi)〔億元〕、政府消費(fèi)〔億元〕作為影響變量,而且此題收集的數(shù)據(jù)均為定量變量,其符號(hào)和經(jīng)濟(jì)意義如下表:變量符號(hào)代表意義中國(guó)成品鋼材的需求量為〔萬(wàn)噸〕成品鋼材需求總量原油產(chǎn)量〔萬(wàn)噸〕原油工業(yè)開展水平生鐵產(chǎn)量〔萬(wàn)噸〕生鐵工業(yè)開展水平原煤產(chǎn)量〔億噸〕原煤工業(yè)開展水平發(fā)電量〔億千瓦時(shí)〕發(fā)電技術(shù)水平鐵路貨運(yùn)量〔萬(wàn)噸〕運(yùn)輸產(chǎn)業(yè)水平固定資產(chǎn)投資額〔億元〕固定資產(chǎn)支出水平居民消費(fèi)〔億元〕居民支出水平政府消費(fèi)〔億元〕政府支出水平第3章問題分析在上述問題中,中國(guó)成品鋼材的需求量〔萬(wàn)噸〕的影響因素不只是原油產(chǎn)量〔萬(wàn)噸〕,還有生鐵產(chǎn)量〔萬(wàn)噸〕、原煤產(chǎn)量〔億噸〕、發(fā)電量〔億千瓦時(shí)〕、鐵路貨運(yùn)量〔萬(wàn)噸〕、固定資產(chǎn)投資額〔億元〕、居民消費(fèi)〔億元〕、政府消費(fèi)〔億元〕等,這樣因變量就與多個(gè)自變量有關(guān)。因此,我們就可以采用多元線性回歸進(jìn)行問題的分析。多元線性回歸模型的根本形式:設(shè)隨機(jī)變量與一般變量的理論線性回歸模型為:其中,是個(gè)未知參數(shù),稱為回歸常數(shù),稱為回歸系數(shù)。稱為被解釋變量〔因變量〕,而是個(gè)可以精確測(cè)量并可控制的一般變量,稱為解釋變量〔自變量〕。是隨機(jī)誤差,與一元線性回歸一樣,對(duì)隨機(jī)誤差項(xiàng)我們常假定稱為理論回歸方程。第4章數(shù)據(jù)的預(yù)處理4.1曲線統(tǒng)計(jì)圖分析:從曲線統(tǒng)計(jì)圖上我們可以大致的來(lái)看,變量和因變量在1980年到1986年的增長(zhǎng)速度都相對(duì)平穩(wěn)沒有明顯的增勢(shì);從1986年到1993年,個(gè)變量開始緩慢增長(zhǎng);從1993年到1998年,增長(zhǎng)的幅度開始加大了。的曲線近似為一條水平的直線,這兩個(gè)變量分別表示原油和原煤的量,可能受到資源和政策的限制,因而增長(zhǎng)的速度非常緩慢。從圖中可以明顯看到隨著年限的增加,我國(guó)的各種產(chǎn)業(yè)和支出水平都隨之逐漸增長(zhǎng)。4.2散點(diǎn)統(tǒng)計(jì)圖分析:從散點(diǎn)統(tǒng)計(jì)圖上我們可以細(xì)致的來(lái)看,變量〔鐵路運(yùn)貨量〕的變化最為明顯,還可以清楚的看到1981年,1991年,1998年,因?yàn)橐恍┨厥馐录鴮?dǎo)致的鐵路運(yùn)輸量降低。與在1980年到1986年的增長(zhǎng)速度都相對(duì)平穩(wěn)沒有明顯的增勢(shì),從1986年到1993年,個(gè)變量開始緩慢增長(zhǎng);從1993年到1998年,增長(zhǎng)的幅度開始加大了。但是〔原油〕與〔原煤〕的產(chǎn)量卻始終保持相對(duì)平穩(wěn)的增長(zhǎng)趨勢(shì),而卻增長(zhǎng)速度非常的緩慢,這可能是受到了資源的限制和國(guó)家政策的影響。從散點(diǎn)圖中可以很明顯的看到各年的真是數(shù)據(jù),還可以看出隨著年限的增加,我國(guó)的各種產(chǎn)業(yè)和支出水平都隨之逐漸增長(zhǎng)。4.3樣本的相關(guān)系數(shù)分析:從樣本的相關(guān)系數(shù)表來(lái)看,各變量的相關(guān)系數(shù)都在0.9以上,說(shuō)明自變量與因變量有高度的線性相關(guān)性,適合做與8個(gè)自變量的多元線性回歸。〔說(shuō)明:本表格是由EViews軟件計(jì)算得出,但由于不能導(dǎo)出,所以通過保存成圖片后經(jīng)WPS截圖工具截得?!车?章回歸模型的建立將原始數(shù)據(jù)導(dǎo)入到Eviews6.0(破解版〕的數(shù)據(jù)框中,然后用Eviews軟件做線性回歸分析如下:在Eviews主窗口菜單單擊Quick/EstimateEquation,彈出方程估計(jì)窗口,再在彈出的窗口清單內(nèi)填入以下回歸方程的書寫形式。整形式:y=c(1)+c(2)*x1+c(3)*x2+c(4)*x3+c(5)*x4+c(6)*x5+c(7)*x6+c(8)*x7+c(9)*x8簡(jiǎn)化形式:ycx1x2x3x4x5x6x7x8這里我們采用簡(jiǎn)化形式執(zhí)行后得到輸出結(jié)果為:VariableCoefficientStd.Errort-StatisticProb.C-381.4846912.1465-0.4182270.6846X10.1218180.1074241.1339930.2833X20.1248840.1870620.6676070.5195X3-149.1537121.3537-1.2290830.2472X40.6533660.2769372.3592600.0400X50.0030580.0233490.1309590.8984X60.0813780.0421241.9318700.0822X7-0.1202380.046747-2.5697230.0279X80.3939660.2394131.6455520.1309R-squared0.999009
Meandependentvar5742.518AdjustedR-squared0.998215
S.D.dependentvar2679.609S.E.ofregression113.1993
Akaikeinfocriterion12.60169Sumsquaredresid128140.8
Schwarzcriterion13.04906Loglikelihood-110.7161
Hannan-Quinncriter.12.67740F-statistic1259.526
Durbin-Watsonstat2.245475Prob(F-statistic)0.000000分析:從模型匯總表中可以看出,決定系數(shù),由決定系數(shù)看回歸模型高度顯著。又由,P值=0.000000,回歸模型通過了F檢驗(yàn),說(shuō)明8個(gè)自變量整體對(duì)因變量y產(chǎn)生顯著線性影響的判斷所犯錯(cuò)誤的概率僅為0.000000。說(shuō)明整體上對(duì)有高度顯著的線性影響。表中第二列是我們的回歸方程參數(shù)估計(jì)值,由此可以得到對(duì)8個(gè)自變量的線性回歸方程為:從回歸方程中可以看到,對(duì)成品鋼材需求量起正影響,對(duì)成品鋼材需求量起負(fù)影響。從實(shí)際社會(huì)生活來(lái)看,原煤生產(chǎn)水平和居民的消費(fèi)水平提高,都會(huì)促進(jìn)成品鋼材的需求量,應(yīng)該和成品鋼材的需求量成正相關(guān),這與定性分析的結(jié)果不一致。為此,我們對(duì)它進(jìn)行更深層次的分析。第6章回歸模型的檢驗(yàn)6.1F檢驗(yàn)
F-statistic1259.526Prob(F-statistic)0.000000分析:從表中結(jié)果可以看出,Prob(F-statistic)即相伴概率P值,由,P值=0.000000<0.05,可知此回歸方程拒絕零假設(shè),即做出8個(gè)自變量整體對(duì)因變量y產(chǎn)生顯著線性影響的判斷所犯錯(cuò)誤的概率僅為0.000000,回歸方程通過了F檢驗(yàn)。6.2T檢驗(yàn)
Variablet-StatisticProb.C-0.4182270.6846X11.1339930.2833X20.6676070.5195X3-1.2290830.2472X42.3592600.0400X50.1309590.8984X61.9318700.0822X7-2.5697230.0279X81.6455520.1309分析:通過看上面的T檢驗(yàn)表可以發(fā)現(xiàn),在顯著性水平時(shí),只有的Prob〔收尾概率〕小于0.05,通過了顯著性檢驗(yàn)。6.3T檢驗(yàn)分析為了盡可能的保存合理變量,我們就針對(duì)逐個(gè)變量給以T檢驗(yàn)分析,逐步剔除不合理的變量,使回歸模型更完善。因此我們首先剔除Prob最大的變量,再做回歸分析的T檢驗(yàn)如下:
VariableCoefficientStd.Errort-StatisticProb.C-274.5262387.5811-0.7083070.4935X10.1326010.0658382.0140550.0691X20.1205290.1756660.6861250.5068X3-137.533579.00025-1.7409250.1096X40.6775700.1968143.4426930.0055X60.0823610.0395552.0822050.0615X7-0.1235670.036909-3.3479080.0065X80.3877850.2239831.7313140.1113分析:剔除后,在顯著性水平時(shí),有的Prob〔收尾概率〕小于0.05,通過了顯著性檢驗(yàn)。此時(shí)我們發(fā)現(xiàn),剔除了后,通過T檢驗(yàn)的變量增多了,這是一個(gè)很好的結(jié)果。因此我們?cè)偬蕹齈rob最大的變量,再做回歸分析的T檢驗(yàn)如下:
VariableCoefficientStd.Errort-StatisticProb.C-279.1420378.8809-0.7367540.4754X10.1539610.0567192.7144740.0188X3-151.034474.80430-2.0190610.0664X40.7722020.1372735.6253070.0001X60.0995120.0299723.3202370.0061X7-0.1345920.032486-4.1430960.0014X80.4029940.2179131.8493320.0892分析:剔除后,在顯著性水平時(shí),有的Prob〔收尾概率〕小于0.05,通過了顯著性檢驗(yàn)。此時(shí)我們發(fā)現(xiàn),剔除了后,通過T檢驗(yàn)的變量又增多了一個(gè)。因此我們?cè)偬蕹齈rob最大的變量,再做回歸分析的T檢驗(yàn)如下:VariableCoefficientStd.Errort-StatisticProb.C-108.8183400.2650-0.2718660.7900X10.1495260.0617182.4227510.0307X3-248.800057.63980-4.3164630.0008X40.9775440.08790711.120230.0000X60.1267900.0284164.4620050.0006X7-0.0840690.019143-4.3914990.0007R-squared0.998669
Meandependentvar5742.518AdjustedR-squared0.998157
S.D.dependentvar2679.609S.E.ofregression115.0260
Akaikeinfocriterion12.58028Loglikelihood-113.5127
Hannan-Quinncriter.12.63076F-statistic1951.080
Durbin-Watsonstat1.886506Prob(F-statistic)0.000000分析:剔除后,在顯著性水平時(shí),剩余變量的Prob〔收尾概率〕都小于0.05,全部通過了顯著性T檢驗(yàn)。以做回歸分析的輸出表來(lái)看,決定系數(shù),由決定系數(shù)看回歸模型仍然具有高度的顯著性。又由,P值=0.000000,回歸模型通過了F檢驗(yàn),說(shuō)明8個(gè)自變量整體對(duì)因變量y產(chǎn)生顯著線性影響的判斷所犯錯(cuò)誤的概率僅為0.000000。說(shuō)明整體上對(duì)有高度顯著的線性影響。表中第二列是我們的回歸方程參數(shù)估計(jì)值,由此可以得到對(duì)5個(gè)自變量的線性回歸方程為:從回歸方程中可以看到,對(duì)成品鋼材需求量起正影響,對(duì)成品鋼材需求量起負(fù)影響。此時(shí)回歸方程雖然通過了F,T檢驗(yàn),但是增加了不合理變量所占回歸方程的比重,這也是不合社會(huì)實(shí)際的。6.4Chow斷點(diǎn)檢驗(yàn)該檢驗(yàn)的思想是對(duì)每個(gè)子樣本單獨(dú)擬合方程來(lái)觀察估計(jì)方程是否有顯著差異。零假設(shè)是兩個(gè)子樣本擬合的方程無(wú)顯著差異。
ChowBreakpointTest:1990
EquationSample:19801998F-statistic7992.972Prob.F(9,1)0.0087Loglikelihoodratio212.4876Prob.Chi-Square(9)0.0000WaldStatistic
71936.75Prob.Chi-Square(9)0.0000分析:從檢驗(yàn)表中可以看出,由于,檢驗(yàn)量的收尾概率分別是0.0087,0.0000,0.0000,所以回歸模型接受原假設(shè),說(shuō)明模型參數(shù)有超樣本特性,回歸方程沒有顯著差異,回歸模型具有穩(wěn)定性。6.5Chow預(yù)測(cè)檢驗(yàn)該檢驗(yàn)的思想,Chow預(yù)測(cè)檢驗(yàn)先對(duì)包含前個(gè)觀測(cè)值的子樣本建立模型,然后用這個(gè)模型對(duì)后個(gè)觀測(cè)值的自變量進(jìn)行預(yù)測(cè),假設(shè)實(shí)際值與預(yù)測(cè)值有很大變動(dòng),就可以疑心這兩個(gè)子樣本估計(jì)關(guān)系的穩(wěn)定性。
ChowForecastTest:Forecastfrom1990to1998F-statistic7992.972
Prob.F(9,1)0.0087Loglikelihoodratio212.4876
Prob.Chi-Square(9)0.0000分析:從Chow預(yù)測(cè)檢驗(yàn)表中可以看出,檢驗(yàn)量的收尾概率分別為0.0087,0.0000,說(shuō)明回歸模型的預(yù)測(cè)值和實(shí)際值沒有很大的波動(dòng),所以就可以認(rèn)為回歸模型是穩(wěn)定的。第7章違背模型根本假設(shè)的情況7.1異方差性的檢驗(yàn)7.1.1殘差圖示檢驗(yàn)我們分別以回歸標(biāo)準(zhǔn)化殘差和因變量y來(lái)繪制殘差圖分析模型是否存在異方差。分析:從殘差的散點(diǎn)圖上我們可以看出,回歸的標(biāo)準(zhǔn)化殘差隨因變量y的表變化并沒有明顯的規(guī)律性分布,殘差圖上的點(diǎn)都是隨機(jī)散布的,無(wú)任何規(guī)律,因此我們可以初步判定回歸模型不存在異方差。7.1.2懷特〔White〕檢驗(yàn)懷特檢驗(yàn),是把作為因變量,原先的自變量和自變量的平方項(xiàng)作為新自變量建立線性回歸模型,通過這個(gè)模型的擬合情況來(lái)檢驗(yàn)是否有異方差性,檢驗(yàn)的零假設(shè)是殘差不存在異方差性。懷特檢驗(yàn)的統(tǒng)計(jì)量是,是樣本觀測(cè)量,是輔助回歸的擬合優(yōu)度。此題的懷特檢驗(yàn)如下:
HeteroskedasticityTest:WhiteF-statistic1.958884
Prob.F(8,10)0.1579Obs*R-squared11.59867
Prob.Chi-Square(8)0.1700ScaledexplainedSS1.445422
Prob.Chi-Square(8)0.9936分析:上表中Obs*R-squared即為,檢驗(yàn)結(jié)果中由于收尾概率遠(yuǎn)大于顯著性水平0.1,0.05或0.01,接收原假設(shè),殘差不存在異方差。7.2自相關(guān)性的檢驗(yàn)7.2.1LM檢驗(yàn)LM檢驗(yàn)是根據(jù)決定系數(shù)和F檢驗(yàn)值的收尾概率大小來(lái)判斷是否存在自相關(guān)性。原假設(shè):殘差不存在從一階到p階的自相關(guān)。檢驗(yàn)統(tǒng)計(jì)量為。
Breusch-GodfreySerialCorrelationLMTest:F-statistic3.174716
Prob.F(2,8)0.0966Obs*R-squared8.407246
Prob.Chi-Square(2)0.0149分析:從LM檢驗(yàn)表的收尾概率來(lái)看,prob〔收尾概率〕都大于0.01,F(xiàn)檢驗(yàn)的收尾概率大于0.05,但是都小于0.1,。由此來(lái)看檢驗(yàn)?zāi)P痛嬖谧韵嚓P(guān)。7.2.2DW檢驗(yàn)對(duì)于自相關(guān)性我們用DW檢驗(yàn)來(lái)判斷,回歸估計(jì)式的殘差來(lái)定義DW統(tǒng)計(jì)量,假設(shè)有,通過化簡(jiǎn)后DW值與的關(guān)系式為,在Eviews中運(yùn)行結(jié)果如下表〔只選取了DW的統(tǒng)計(jì)值〕:
Durbin-Watsonstat2.245475分析:從表中的數(shù)據(jù)我們可以看到,=2.245475,因而可以近似的計(jì)算出,通過查表可以判斷出誤差項(xiàng)的自相關(guān)性成輕微的負(fù)自相關(guān)〔由于自相關(guān)性不是很明顯,所以在這里就不做自相關(guān)性的消除〕。第8章自變量選擇與逐步回歸8.1前進(jìn)逐步回歸法8.1.1前進(jìn)逐步回歸取顯著性水平進(jìn)行逐步回歸檢驗(yàn)選變量。VariableCoefficientStd.Errort-StatisticProb.*C196.0980259.59320.7554050.4617X20.4999330.1595893.1326320.0068X40.5035810.1709542.9457050.0100X3-110.542945.39905-2.4349170.0279R-squared0.997746
Meandependentvar5742.518AdjustedR-squared0.997296
S.D.dependentvar2679.609S.E.ofregression139.3449
Akaikeinfocriterion12.89644Sumsquaredresid291254.9
Schwarzcriterion13.09527Loglikelihood-118.5162
Hannan-Quinncriter.12.93009F-statistic2213.770
Durbin-Watsonstat1.041553Prob(F-statistic)0.000000SelectionSummaryAddedX2AddedX4AddedX3分析:從逐步回歸模型的匯總表中我們可以看出,逐步回歸最終選取的變量為x2,x4,x3,逐步回歸后模型決定系數(shù)。逐步回歸后的模型保持著回歸方程高度的顯著性。從表中我們可以看到,F(xiàn)的檢驗(yàn)值為2213.770,P值始終是0.000000不變,由此可見模型犯錯(cuò)的概率始終為0.000000不變,故逐步回歸后的回歸方程同樣具有高度的顯著性。從上述表中結(jié)果可以看到逐步回歸后的回歸方程為由回歸方程可以看出,生鐵的產(chǎn)量和發(fā)電量的系數(shù)都是正數(shù),對(duì)因變量y起正相關(guān)作用,原煤量的系數(shù)為負(fù)值,對(duì)因變量y起負(fù)相關(guān)作用,而卻從數(shù)值上看是-11.0543,對(duì)y的影響很大,這與實(shí)際情況不符,這可能是因變量與之間有較強(qiáng)的相關(guān)性。同時(shí)從表中還可以看出,用逐步回歸法的選元過程為第一步引入,第二步引入,第三步引入再形成一個(gè)符合要求的線性回歸方程。8.1.2前進(jìn)逐步回歸模型預(yù)測(cè)分析:如下圖是前進(jìn)逐步回歸的模型預(yù)測(cè),左邊是預(yù)測(cè)圖,兩條細(xì)線表示預(yù)測(cè)值的兩倍標(biāo)準(zhǔn)誤差帶,右邊是有關(guān)預(yù)測(cè)的一些評(píng)價(jià)指標(biāo)。從他的誤差帶我們可以看出回歸模型較為精確,誤差帶緊隨實(shí)際曲線變動(dòng),再?gòu)挠疫叺腗APE值為2.218047可以判定模型的預(yù)測(cè)精度較高。8.2后退逐步回歸法8.2.1后退逐步回歸取顯著性水平進(jìn)行逐步回歸檢驗(yàn)選變量。VariableCoefficientStd.Errort-StatisticProb.*C-279.1420378.8809-0.7367540.4754X10.1539610.0567192.7144740.0188X40.7722020.1372735.6253070.0001X3-151.034474.80430-2.0190610.0664X7-0.1345920.032486-4.1430960.0014X80.4029940.2179131.8493320.0892X60.0995120.0299723.3202370.0061R-squared0.998964
Meandependentvar5742.518AdjustedR-squared0.998447
S.D.dependentvar2679.609S.E.ofregression105.6149
Akaikeinfocriterion12.43479Sumsquaredresid133854.0
Schwarzcriterion12.78274Loglikelihood-111.1305
Hannan-Quinncriter.12.49367F-statistic1929.141
Durbin-Watsonstat2.584581Prob(F-statistic)0.000000SelectionSummaryRemovedX5RemovedX2分析:采用后退逐步回歸法最后選擇的變量有,從后退逐步回歸后模型決定系數(shù),調(diào)整決定系數(shù),可知模型仍然具有高度的顯著性。表中F的檢驗(yàn)值為1929.141,P值始終為0.000000不變,由此可見模型犯錯(cuò)的概率始終為0.000000不變。綜合考慮后退逐步回歸得到的模型比前進(jìn)逐步回歸得到的模型要好一些。對(duì)變量與因變量做線性回歸得:
VariableCoefficientStd.Errort-StatisticProb.C-278.8229476.6925-0.5849120.5668X20.9369830.03335228.093350.0000X5-0.0022580.004663-0.4842950.6347由此我們可以寫出關(guān)于的線性回歸方程為:從回歸的最終模型來(lái)看,此回歸方程剔除了一些變量后反而變得更加顯著,并且更有實(shí)際的社會(huì)意義,它消除了不合理的變量和。在回歸方程中又新出現(xiàn)了負(fù)變量〔鐵路運(yùn)貨量〕,雖然也是不合實(shí)際的,但是它占回歸方程的比重很小因此可以不做處理。8.2.2后退逐步回歸模型預(yù)測(cè)分析:如下圖是后退逐步回歸的模型預(yù)測(cè),左邊是預(yù)測(cè)圖,兩條細(xì)線表示預(yù)測(cè)值的兩倍標(biāo)準(zhǔn)誤差帶,右邊是有關(guān)預(yù)測(cè)的一些評(píng)價(jià)指標(biāo)。從他的誤差帶我們可以看出回歸模型同樣較為精確,誤差帶緊隨實(shí)際曲線變動(dòng),而卻緊隨的效果要比前進(jìn)回歸模型的要好,貼近實(shí)際曲線的效果也前進(jìn)逐步回歸模型的好,再?gòu)挠疫叺脑u(píng)價(jià)指標(biāo)RMSE值為83.93419,MAE值為67.52228,MAPE值為1.320231,都比前進(jìn)逐步回歸模型的數(shù)值小,從而可以判定模型的預(yù)測(cè)能力比前進(jìn)逐步回歸模型的預(yù)測(cè)好,精度高。第9章多重共線性的診斷及消除9.1多重共線性的診斷由于Eviews軟件無(wú)法對(duì)模型多重共線作出診斷,因此這里我們就用spss19.0軟件對(duì)模型做共線性診斷,關(guān)鍵的輸出結(jié)果見下表〔限于篇幅就對(duì)表格做出調(diào)整,只輸出關(guān)鍵的結(jié)果〕。模型常量X1X2X3X4X5X6X7X8VIF61.091413.326133.044947.996329.438182.413416.185701.380分析:從表中的輸出結(jié)果可以看出,的方差擴(kuò)大因子VIF都很大,遠(yuǎn)遠(yuǎn)的超過了10,說(shuō)明成品鋼材需求量的回歸方程存在著嚴(yán)重的多重共線性。又因?yàn)榈姆讲顢U(kuò)大因子都是大于10的,說(shuō)明回歸方程的多重共線性就是由自變量間的多重共線性引起的。共線性診斷a模型維數(shù)特征值條件索引方差比例(常量)x1x2x3x4x5x6x7x8118.3211.000.00.00.00.00.00.00.00.00.002.6593.553.00.00.00.00.00.00.00.00.003.01127.458.04.00.00.01.00.00.00.01.004.00443.444.01.00.00.00.00.00.31.08.005.00357.552.00.00.02.04.01.00.11.06.056.001106.541.12.26.02.08.02.00.05.00.027.000157.928.05.07.30.05.02.00.03.50.698.000213.430.01.02.53.39.36.03.41.01.1894.043E-5453.668.78.65.11.43.60.97.09.35.05a.因變量:y分析:從條件數(shù)可以看到,最大的條件數(shù),說(shuō)明自變量間存在嚴(yán)重的多重共線性,這一判斷與上面的方差擴(kuò)大因子法判斷結(jié)果一致。表中的方差比例是按從小到大的順序排列的,不是按自變量順序排列的,這與方差擴(kuò)大因子不同。在維數(shù)為9的時(shí)候,我們可以看到的系數(shù)都很快的增大要接近1,這也可以說(shuō)明之間存在較強(qiáng)的多重共線性。9.2消除多重共線性在前面多重共線性的診斷中我們看到的方差擴(kuò)大因子為最大,因此剔除,建立與的回歸方程。關(guān)鍵的輸出結(jié)果見下表〔限于篇幅就對(duì)表格做出調(diào)整,只輸出關(guān)鍵的結(jié)果〕。模型常量X1X2X3X5X6X7X8VIF38.881248.129130.880174.510133.668372.202525.920分析:從剔除了自變量的回歸模型中我們可以看到的方差擴(kuò)大因子為最大,卻遠(yuǎn)大于10,因此再剔除,建立與的回歸方程。關(guān)鍵的輸出結(jié)果見下表〔限于篇幅就對(duì)表格做出調(diào)整,只輸出關(guān)鍵的VIF結(jié)果〕。模型常量X1X2X3X5X6X7VIF35.514169.934108.057174.510132.017101.870分析:從剔除了自變量的回歸系數(shù)表中我們可以看到的方差擴(kuò)大因子為最大,卻遠(yuǎn)大于10,因此再剔除,建立與的回歸方程。相關(guān)輸出結(jié)果如下:模型常量X1X2X3X6X7VIF23.17893.59023.358124.08464.691分析:從剔除了自變量的回歸系數(shù)表中我們可以看到的方差擴(kuò)大因子為最大,還是遠(yuǎn)大于10,因此再剔除,建立與的回歸方程。相關(guān)輸出結(jié)果如下:模型常量X1X2X3X7VIF16.42549.76623.10124.008分析:從剔除了自變量的回歸系數(shù)表中我們可以看到的方差擴(kuò)大因子為最大,還是大于10,因此再剔除,建立與的回歸方程。相關(guān)輸出結(jié)果如下:模型常量X1X3X7VIF15.74319.2264.511分析:從剔除了自變量的回歸系數(shù)表中我們可以看到的方差擴(kuò)大因子為最大,還是大于10,因此再剔除,建立與的回歸方程。相關(guān)輸出結(jié)果如下:模型常量X1X7VIF3.6943.694分析:從剔除了自變量的回歸系數(shù)表中我們可以看到,剩下的自變量的方差擴(kuò)大因子分別為,都是小于10的,而卻回歸系數(shù)也都有合理的社會(huì)經(jīng)濟(jì)解釋,說(shuō)明此回歸模型不存在較強(qiáng)的多重共線性了,可以作為最終的回歸模型?,F(xiàn)在我們用Eviews軟件建立與的回歸模型:VariableCoefficientStd.Errort-StatisticProb.C-2210.9341272.616-1.7373140.1015X10.4398630.1097244.0088110.0010X70.1611030.0182948.8064060.0000R-squared0.972630
Meandependentvar5742.518AdjustedR-squared0.969209
S.D.dependentvar2679.609S.E.ofregression470.2027
Akaikeinfocriterion15.28814Sumsquaredresid3537450.
Schwarzcriterion15.43727Loglikelihood-142.2374
Hannan-Quinncriter.15.31338F-statistic284.2909
Durbin-Watsonstat0.568156Prob(F-statistic)0.000000與的回歸方程為由標(biāo)準(zhǔn)化的回歸方程我們可以看到,對(duì)成品鋼材需求量影響較大的事原油產(chǎn)量和居民消費(fèi),從社會(huì)經(jīng)濟(jì)角度來(lái)考慮,這是貼近人民生活的兩個(gè)量,其中居民消費(fèi)的系數(shù)較大,影響也就較大。從整體上來(lái)看,消除多重共線性影響后得回歸方程更較為符合社會(huì)實(shí)際。
R-squared0.972630AdjustedR-squared0.969209F-statistic284.2909Prob(F-statistic)0.000000分析:從表中輸出結(jié)果可以看出,Prob即顯著性P值,由,P值=0.000,可知此回歸方程仍然具有高度的顯著,即做出2個(gè)自變量整體對(duì)因變量y產(chǎn)生顯著線性影響的判斷所犯錯(cuò)誤的概率僅為0.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安徽省六安市2023-2024年度滬科版數(shù)學(xué)九年級(jí)上學(xué)期綜合測(cè)試卷
- 2024-2030年中國(guó)大米行業(yè)營(yíng)銷戰(zhàn)略與供應(yīng)情況預(yù)測(cè)報(bào)告
- 2024-2030年中國(guó)垃圾中轉(zhuǎn)設(shè)備行業(yè)發(fā)展分析及投資戰(zhàn)略研究報(bào)告版
- 2024-2030年中國(guó)商業(yè)地產(chǎn)行業(yè)發(fā)展前景預(yù)測(cè)及投融資策略分析報(bào)告
- 2024-2030年中國(guó)衛(wèi)浴墊產(chǎn)業(yè)未來(lái)發(fā)展趨勢(shì)及投資策略分析報(bào)告
- 2024年版:呂桃與配偶解除婚姻關(guān)系協(xié)議
- 2024年施工安全協(xié)議書編制指南及審查標(biāo)準(zhǔn)2篇
- 2024年版離婚合同規(guī)范格式版B版
- 2024年個(gè)人信用評(píng)估與貸款審核委托協(xié)議3篇
- 2024年版:市場(chǎng)推廣專員合同3篇
- 22114-國(guó)家開放大學(xué)2023年春期末統(tǒng)一考試《人體解剖生理學(xué)》答案
- 小型農(nóng)田水利初步設(shè)計(jì)
- 《系統(tǒng)解剖學(xué)》課程考試復(fù)習(xí)題庫(kù)大全-6內(nèi)臟部分
- 職務(wù)犯罪課件
- 2022-2023學(xué)年廣東省東莞市高二(上)期末英語(yǔ)試卷(含答案解析)
- 農(nóng)貿(mào)市場(chǎng)項(xiàng)目可行性研究報(bào)告
- 婦幼健康教育知識(shí)宣傳
- 遺址遷移施工方案
- 【《溫州森馬鞋業(yè)財(cái)務(wù)風(fēng)險(xiǎn)分析案例報(bào)告(論文)》6000字】
- 煙花爆竹行業(yè)事故應(yīng)急救援處置培訓(xùn)
- 論群體傳播時(shí)代個(gè)人情緒的社會(huì)化傳播
評(píng)論
0/150
提交評(píng)論