數(shù)理統(tǒng)計(jì)大作業(yè)_第1頁
數(shù)理統(tǒng)計(jì)大作業(yè)_第2頁
數(shù)理統(tǒng)計(jì)大作業(yè)_第3頁
數(shù)理統(tǒng)計(jì)大作業(yè)_第4頁
數(shù)理統(tǒng)計(jì)大作業(yè)_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 應(yīng)用數(shù)理統(tǒng)計(jì)(論文)國家財(cái)政收入的逐步回歸分析指導(dǎo)教師 院系名稱 學(xué) 號(hào) 學(xué)生姓名 2012年11月18日摘要 財(cái)政收入是國民經(jīng)濟(jì)基礎(chǔ),是實(shí)現(xiàn)國家職能的財(cái)力保證。本文采用SPSS統(tǒng)計(jì)軟件中的逐步回歸分析方法,得出影響我國財(cái)政收入的顯著性變量,建立國家財(cái)政收入回歸模型,并將所得的模型給予合理的經(jīng)濟(jì)解釋。關(guān)鍵字:國家財(cái)政收入,逐步回歸,SPSS1 引言 財(cái)政收入是指國家財(cái)政參與社會(huì)產(chǎn)品分配所取得到的收入,是實(shí)現(xiàn)國家職能的財(cái)力保證。影響財(cái)政收入的因素有很多,包括工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、建筑業(yè)總產(chǎn)值、社會(huì)商品零售總額、人口數(shù)、受災(zāi)面積等等。 在經(jīng)濟(jì)模型的建立中,其中有些自變量對(duì)問題的研究可能并不重要

2、,有些自變量數(shù)據(jù)的質(zhì)量可能很差,有些變量可能和其它變量有很大程度的重疊。如果用回歸模型把這些變量都包含進(jìn)來不但會(huì)使模型計(jì)算復(fù)雜,而且往往會(huì)擴(kuò)大估計(jì)方差,降低模型精度,直接影響到回歸方程的應(yīng)用。另外,選進(jìn)太多的自變量又會(huì)造成共線性的存在。因此,本文采用線性回歸中的逐步回歸方法,利用SPSS多元統(tǒng)計(jì)軟件得出影響我國財(cái)政收入的顯著性變量,剔除了不顯著的變量,并且克服了變量間的多重共線性,得出了一個(gè)較合理的財(cái)政回歸模型。2初始模型的建立及數(shù)據(jù)分析2.1 自變量與因變量的提出 本模型是研究1997年至2011年國家財(cái)政收入與主要影響因素之間的定量關(guān)系。 本文選取財(cái)政收入Y(億元)為因變量,自變量選取如下

3、:第一產(chǎn)業(yè)國內(nèi)生產(chǎn)總值X1(億元),第二產(chǎn)業(yè)國內(nèi)生產(chǎn)總值X2(億元,第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值X3(億元),社會(huì)消費(fèi)品零售總額X4(億元),人口數(shù)X5(萬人),受災(zāi)面積X6(萬公頃)。根據(jù)中國統(tǒng)計(jì)年鑒獲取1997-2011年共十五年的統(tǒng)計(jì)數(shù)據(jù),見表1。表1 1997-2011年財(cái)政收入與部分項(xiàng)目的統(tǒng)計(jì)數(shù)據(jù)年份YX1X2X3X4X5X6財(cái)政收入(億元)第一產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元)第二產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元)第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元)社會(huì)商品零售總額(億元)人口總數(shù)(萬人)受災(zāi)面積(萬公頃)1997 8651.14 14441.89 37543.00 26988.15 31252.90 123626.

4、00 5342.70 1998 9875.95 14817.63 39004.19 30580.47 33378.10 124761.00 5014.50 1999 11444.08 14770.03 41033.58 33873.44 35647.90 125786.00 4998.00 2000 13395.23 14944.72 45555.88 38713.95 39105.70 126743.00 5468.80 2001 16386.04 15781.27 49512.29 44361.61 43055.40 127627.00 5221.50 2002 18903.64 1653

5、7.02 53896.77 49898.90 48135.90 128453.00 4694.60 2003 21715.25 17381.72 62436.31 56004.73 52516.30 129227.00 5450.60 2004 26396.47 21412.73 73904.31 64561.29 59501.00 129988.00 3710.60 2005 31649.29 22420.00 87598.09 74919.28 67176.60 130756.00 3881.80 2006 38760.20 24040.00 103719.54 88554.88 7641

6、0.00 131448.00 4109.10 2007 51321.78 28627.00 125831.36 111351.95 89210.00 132129.00 4899.20 2008 61330.35 33702.00 149003.44 131339.99 114830.10 132802.00 3999.00 2009 68518.30 35226.00 157638.78 148038.04 132678.40 133450.00 4721.40 2010 83101.51 40533.60 187383.21 173595.98 156998.40 134091.00 37

7、42.60 2011 103874.43 47486.20 220412.80 204982.50 183918.60 134735.00 3247.10 2.2 做散點(diǎn)圖,設(shè)定理論模型 作數(shù)據(jù)散點(diǎn)圖,并進(jìn)行線性擬合,觀察因變量與自變量之間關(guān)系是否有線性特點(diǎn)。散點(diǎn)圖和線性擬合結(jié)果如圖1所示。圖1因變量與各自變量的散點(diǎn)圖從散點(diǎn)圖1中可以初步看出,國家財(cái)政收入與第一、二、三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值、人口數(shù)、消費(fèi)品零售總額這些因素都有較好的線性關(guān)系。而財(cái)政收入與受災(zāi)面積之間沒有線性關(guān)系,可在逐步回歸之前將其去除。建立線性回歸分析模型如下:Y=a+b1X1+b2X2+b3X3+b4X4+b5X5;其中a為常數(shù)

8、項(xiàng),b1、b2、b5為偏回歸系數(shù)。3 逐步回歸分析概述3.1 回歸分析回歸分析是一種非常實(shí)用的統(tǒng)計(jì)方法,研究變量與變量之間定量的相關(guān)關(guān)系,尋找變量之間的數(shù)學(xué)表達(dá)式,并且利用概率統(tǒng)計(jì)的知識(shí),對(duì)此關(guān)系進(jìn)行分析,來判別所建立關(guān)系表達(dá)式的有效性?;貧w分析應(yīng)用很廣,可利用建立的經(jīng)驗(yàn)公式進(jìn)行預(yù)測或控制等等。 3.2 線性回歸分析線性回歸分析是描述一個(gè)因變量與一個(gè)或多個(gè)自變量之間的線性依存關(guān)系。 3.3 多元回歸分析方法比較與選擇應(yīng)用多元線性回歸方法對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析或者預(yù)測具有實(shí)際的研究價(jià)值。但是由于各個(gè)變量之間關(guān)系的復(fù)雜性,如何在為數(shù)眾多的許多個(gè)影響因素中選擇對(duì)所關(guān)心的因素具有顯著影響的各

9、個(gè)因素,并且不包含對(duì)因變量的影響不顯著的因素是一個(gè)很有實(shí)際意義的問題。具有這種優(yōu)點(diǎn)的回歸方程,被稱為“最優(yōu)”回歸方程。 選擇“最優(yōu)”回歸方程的方法有多種多樣,具體包括: (1) 全部比較法:從所有可能的因子組合的回歸方程中選擇最優(yōu)方程。這種方法固然可以找到一個(gè)最優(yōu)者,然而當(dāng)因子眾多時(shí),不僅計(jì)算繁冗,而且費(fèi)用也大,在實(shí)際中是不宜采用的。 (2) 向后剔除變量法(Backward Elimination):從包含全部因子的回歸方程中,逐次剔除不顯著因子,也稱為“只出不進(jìn)法”。這種方法在因子不多而且不顯著因子也不多的情況下可以采用,但是因子眾多時(shí),特別是當(dāng)不顯著因子比較多時(shí),其計(jì)算量也很大。 (3)

10、 向前挑選變量法(Forward Selection):從一個(gè)因子開始,逐個(gè)引入回歸方程,因子在引入后概不剔除,也稱為“只進(jìn)不出法”。這種方法對(duì)已經(jīng)引進(jìn)的因子在建立過程中變得不很重要的情況沒有反映。 (4) 逐步回歸法(Stepwise Regression):又稱為“有進(jìn)有出法”。這種方法在逐個(gè)將因子選入回歸方程的過程中,如果發(fā)現(xiàn)先前被引入的因子在其后由于某些因子的引入而失去其重要性時(shí),可以從回歸方程中隨時(shí)予以剔除,直到最后被選入的因子對(duì)因變量都有顯著影響為止。 3.4 逐步回歸分析法先對(duì)全部自變量按其對(duì)Y影響程度的大小排隊(duì),從大到小逐個(gè)依次引入回歸方程,并隨時(shí)檢驗(yàn),及時(shí)將由于引入新自變量而

11、變得作用不顯著者剔除,剔除后再引入新變量,再檢驗(yàn),再剔除直至最后。4 線性回歸的結(jié)果及分析以國家財(cái)政收入為因變量,以第一、二、三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值、人口數(shù)、消費(fèi)品零售總額為自變量,運(yùn)用SPSS軟件進(jìn)行逐步回歸法(stepwise)線性回歸分析。將數(shù)據(jù)導(dǎo)入SPSS軟件的Data Editor表中,選擇分析選項(xiàng)中的回歸-線性命令,將國民總收入設(shè)置為因變量(Dependent),其余各影響因素設(shè)置為自變量(Independent(s),選擇統(tǒng)計(jì)方法(Method)為逐步回歸法(Stepwise)。4.1 自變量的輸入與移除自變量的輸入與移除的標(biāo)準(zhǔn)為:F值小于等于0.05進(jìn)入模型,大于等于0.1移出模型

12、。從表2中可以看出第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元),人口數(shù)(萬人),這兩個(gè)自變量經(jīng)過逐步回歸過程被選擇進(jìn)入了回歸方程。選擇的過程是:最先引入了變量X3,建立了模型1;接著引入變量X5,沒有變量被剔除,建立了模型2(含有X3,X5);沒有新變量被引入,故最終的模型中含有變量X3,X5。表2 輸入移去的變量a模型輸入的變量移去的變量方法1第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元).步進(jìn)(準(zhǔn)則: F-to-enter 的概率 <= .050,F(xiàn)-to-remove 的概率 >= .100)。2人口總數(shù)(萬人).步進(jìn)(準(zhǔn)則: F-to-enter 的概率 <= .050,F(xiàn)-to-remove 的概率

13、 >= .100)。a. 因變量: 財(cái)政收入(億元)4.2模型概要 表3 模型匯總c模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計(jì)的誤差更改統(tǒng)計(jì)量R 方更改F 更改df1df2Sig. F 更改1.999a.998.9981302.682.9987212.060113.00021.000b.999.999998.767.00110.115112.008a. 預(yù)測變量: (常量), 第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元)。b. 預(yù)測變量: (常量), 第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元), 人口總數(shù)(萬人)。c. 因變量: 財(cái)政收入(億元)表3給出了各模型的擬合情況。其中,復(fù)相關(guān)系數(shù)(R)代表自變量或自變量的線性組合能

14、多大程度上解釋因變量,復(fù)相關(guān)系數(shù)平方值(R方)說明回歸模型自變量的變異在因變量中所占比率,接近1最好。修正的復(fù)相關(guān)系數(shù)平方值(調(diào)整R方),是為了消除變量數(shù)量的影響,給出修正的復(fù)相關(guān)系數(shù)平方值。從表中看出兩種模型的擬合度都很好,而模型2的復(fù)相關(guān)系數(shù)R=1.000,復(fù)相關(guān)系數(shù)平方值R2=0.999,調(diào)整R方為0.999,標(biāo)準(zhǔn)估計(jì)的誤差為998.767??梢娔P?的擬合度較高,變量X3,X5的作用顯著。4.3 回歸方程的顯著性檢驗(yàn)表4 Anovac模型平方和df均方FSig.1回歸1.224E1011.224E107212.060.000a殘差22060733.806131696979.524總計(jì)1

15、.226E10142回歸1.225E1026.124E96139.533.000b殘差11970430.45512997535.871總計(jì)1.226E1014a. 預(yù)測變量: (常量), 第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元)。b. 預(yù)測變量: (常量), 第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元), 人口總數(shù)(萬人)。c. 因變量: 財(cái)政收入(億元)表4顯示兩種模型的方差分析結(jié)果。方差分析結(jié)果表明,當(dāng)回歸方程為模型1、2時(shí),其顯著性概率值均小于0.000,即拒絕總體回歸系數(shù)均為0的原假設(shè)。因此,最終的回歸方程應(yīng)當(dāng)包含X3、X5這2個(gè)自變量,且方程擬和效果很好。表5 已排除的變量c模型Beta IntSig.偏相關(guān)共

16、線性統(tǒng)計(jì)量容差VIF最小容差1第一產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元).281a2.125.055.523.006160.446.006第二產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元).083a.348.734.100.003382.969.003社會(huì)商品零售總額(億元).178a1.191.257.325.006167.086.006人口總數(shù)(萬人)-.073a-3.180.008-.676.1546.510.1542第一產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元).128b.955.360.277.005218.259.004第二產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元).105b.577.576.171.003383.541.003社會(huì)商品零售總額(億元)

17、-.101b-.650.529-.192.004283.927.003a. 模型中的預(yù)測變量: (常量), 第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元)。b. 模型中的預(yù)測變量: (常量), 第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元), 人口總數(shù)(萬人)。c. 因變量: 財(cái)政收入(億元)表5顯示方程外各模型變量的有關(guān)統(tǒng)計(jì)量,即標(biāo)準(zhǔn)化偏回歸系數(shù)Beta、回歸系數(shù)顯著性檢驗(yàn)的t值、P(Sig)值、偏相關(guān)系數(shù)Partial Correlation、共線性統(tǒng)計(jì)的容差Co linearity statistic Tolerance??梢?,模型2方程外的各變量偏回歸系數(shù)經(jīng)檢驗(yàn),P值均大于0.05,故不能引入方程。4.4 回歸系數(shù)的確定

18、 表6 系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.相關(guān)性共線性統(tǒng)計(jì)量B標(biāo)準(zhǔn) 誤差試用版零階偏部分容差VIF1(常量)-7035.493624.880-11.259.000第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元).525.006.99984.924.000.999.999.9991.0001.0002(常量)70605.58724416.7212.892.014第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元).560.0121.06646.337.000.999.997.418.1546.510人口總數(shù)(萬人)-.622.196-.073-3.180.008.908-.676-.029.1546.510a. 因變量: 財(cái)政收入(

19、億元)表6顯示各模型的偏回歸系數(shù)B、標(biāo)準(zhǔn)差Std.、常數(shù)Constant、標(biāo)準(zhǔn)化偏回歸系數(shù)Beta、回歸系數(shù)顯著性檢驗(yàn)的t值和P(Sig)值。按照線性回歸模型建立的方程為:Y=70605.587+0.560X3-0.662X5 方程中的常數(shù)項(xiàng)a=70605.587,偏回歸系數(shù)b3=0.560、b5=-0.662,經(jīng)t檢驗(yàn)a、b3、b5的P值分別為0.014、0.000、0.008,按=0.10水平,均有顯著性意義。4.5 回歸模型的殘差分析對(duì)回歸模型的殘差進(jìn)行分析,殘差的積累概率圖(P-P圖)(圖2)基本圍繞在假設(shè)直線(正態(tài)分布)周圍,說明殘差分布基本符合正態(tài)分布,說明財(cái)政收入這個(gè)因變量基本上

20、可以用線性回歸方法建立模型。且回歸標(biāo)準(zhǔn)化殘差的柱狀圖(圖3)中,標(biāo)準(zhǔn)化殘差基本都分布在(-3,3)之間,沒有超過默認(rèn)值3,說明模型對(duì)數(shù)據(jù)的擬合效果較好。圖2 回歸標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖 圖3 回歸標(biāo)準(zhǔn)化殘差柱狀圖5討論5.1 模型檢驗(yàn)按照線性回歸模型建立的方程為: Y=70605.587+0.560X3-0.662X5 利用此最優(yōu)回歸方程對(duì)2010年國民總收入進(jìn)行預(yù)測并和實(shí)際值做比較。表7 2010年財(cái)政收入預(yù)測 年份X3第三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值(億元)X5人口總數(shù)(萬人)Y財(cái)政收入實(shí)際值(億元)Y '財(cái)政收入預(yù)測值(億元)偏差2010173595.98134091.0083101.51

21、79051.094.8%表7給出了運(yùn)用已經(jīng)建立的逐步回歸模型對(duì)2010年財(cái)政收入的預(yù)測結(jié)果以及實(shí)際財(cái)政收入值。通過對(duì)比我們可以發(fā)現(xiàn),預(yù)測的結(jié)果與實(shí)際情況比較接近,但還是存在一定的偏差,這可能是我們對(duì)財(cái)政收入的影響因素考慮過少造成的,因此,這是我們以后對(duì)模型改進(jìn)時(shí)所要考慮的方面。5.2 模型解釋從回歸模型中看出,第三產(chǎn)業(yè)對(duì)財(cái)政收入的影響較為顯著。這正與國家積極調(diào)整產(chǎn)業(yè)結(jié)構(gòu),倡導(dǎo)服務(wù)業(yè)全面發(fā)展的經(jīng)濟(jì)政策相符合。第三產(chǎn)業(yè)發(fā)展迅速,增加了國家收入彈性,特別是金融、期貨交易、房地產(chǎn)業(yè)、倉儲(chǔ)物流業(yè)、軟件等現(xiàn)代服務(wù)業(yè)和高薪產(chǎn)業(yè)的發(fā)展及近年來奧運(yùn)會(huì)、亞運(yùn)會(huì)、世博會(huì)對(duì)旅游業(yè)的帶動(dòng),極大提高了服務(wù)業(yè)對(duì)財(cái)政收入的貢獻(xiàn)。而人口數(shù)對(duì)財(cái)政收入的貢獻(xiàn)為負(fù)線性關(guān)系。這與近年來我國人口老齡化趨勢,人口基數(shù)仍在上漲及社會(huì)福利提高有關(guān)。眾所周知,人口基數(shù)不變或稍微增大時(shí),人口老齡化,必然導(dǎo)致就業(yè)人口相對(duì)比例減少,再加上近年來醫(yī)保、社保等社會(huì)保障及福利支出的相對(duì)提高,使國家政府給予大量財(cái)政補(bǔ)貼,因而人口數(shù)對(duì)財(cái)政收入的貢獻(xiàn)為負(fù)相關(guān)。而第

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論