版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
整理為word格式整理為word格式整理為word格式數(shù)理統(tǒng)計課程論文題目:運用spss軟件對我國人均食品支出的影響因素的統(tǒng)計分析學號姓名貢獻成績指導教師陳彩霞日期整理為word格式整理為word格式整理為word格式運用spss對我國人均食品支出的影響因素的分析摘要隨著21世紀世界的逐步發(fā)展,中國的國力日益強大,人民的生活水品也逐步提高,而人均食品支出也越來越大。這是什么原因造成的結果呢?因此我們選取了2002年到2012年這十年的數(shù)據(jù),對居民消費價格指數(shù)(CPI)、人均收入、農產(chǎn)品價格指數(shù)對人均食品支出的影響以及恩格爾系數(shù)作出了回歸分析。從數(shù)據(jù)上,我們可以發(fā)現(xiàn)人均食品支出、人均收入在逐年增長,且增長的幅度較大,居民消費價格指數(shù)與農產(chǎn)品價格指數(shù)也在增長,但增長的較慢,而恩格爾系數(shù)則幾乎沒有什么波動。我們根據(jù)所選取的數(shù)據(jù)做出來相對應的模型,并對這些模型進行驗證,通過CPI、人均收入、農產(chǎn)品價格指數(shù)的變動對人均食品支出的不同影響程度,從而發(fā)現(xiàn)這些因素對人均食品支出的實際情況,并利用這些數(shù)據(jù)對今后人均食品支出作出預測?;貧w模型1:運用多元回歸分析,由于自變量之間存在共線性,因此得出農產(chǎn)品價格指數(shù)對人均食品支出影響不顯著。(1)回歸模型2:運用多元回歸的逐步分析法,剔除回歸系數(shù)未通過0.05的顯著檢驗,保留通過的,得到“最優(yōu)”回歸方程。(2)關鍵字:回歸分析逐步回歸人均食品支出人均收入CPI農產(chǎn)品價格指數(shù)整理為word格式整理為word格式整理為word格式引言人均食品支出可以反映人民的消費狀況,反映人民的生活水品以及人們對滿足生存、發(fā)展、享受和需要所達到的程度,更能反映一段時期一個國家的消費水平和發(fā)展水品。本問題要求通過收集整理數(shù)據(jù),掌握對城鎮(zhèn)人均消費支出的影響因素,利用spss軟件進行多元回歸分析,求出回歸方程,進行統(tǒng)計檢驗(包括回歸方程的顯著性檢驗,回歸系數(shù)的顯著性檢驗)以及殘差的檢驗;然后進行估計和預測。多元線性回歸理論基礎2.1多元線性回歸的概念設自變量的觀測值及因變量對應的觀測值滿足關系式(3)式中,是相互獨立且都服從正態(tài)分布的隨機變量。根據(jù)最小二乘法,由n個觀測值確定參數(shù)的估計值后,得到公式的估計值稱為多元線性回歸方程。建立多元線性回歸方程的過程以及對回歸方程與回歸數(shù)所做的顯著性檢驗,稱為多元線性回歸分析或多元線性回歸。如果將帶入多元線性回歸方程,記,則與之間的偏差平方和,由可得到多元線性回歸的正規(guī)方程組。通過解正規(guī)方程組,即可以算出求出回歸方程。整理為word格式整理為word格式整理為word格式2.2回歸方程的顯著性檢驗與一元線性回歸方程相類似,多元線性回歸方程的總平方和SST也可以分解為剩余平方和SSE和回歸平方和SSR,即SST=SSR+SSE(4)式中,而,因此如果SSR的數(shù)值較大,SSE的數(shù)值便比較小,說明回歸的效果好。如果SSR的數(shù)值較小,SSE的數(shù)值便比較大,說明回歸的效果差。理論上已經(jīng)證明:當原假設為,并且成立時,且SSR與SSE相互獨立,(5)(6)為的無偏估計。因此,給出顯著性水平,即可進行回歸方程的顯著性檢驗。2.3回歸系數(shù)的顯著性檢驗一個多元線性回歸方程顯著,并不表示方程中的每一個自變量整理為word格式整理為word格式整理為word格式對因變量的影響都是重要的。因此為了對的重要程度作出比較與檢驗,有必要找出一個與有關的統(tǒng)計量。由于是隨機變量的線性函數(shù),各都服從正態(tài)分布,所以式中,是正規(guī)方程組的系數(shù)矩陣的逆矩陣中第行第列的元素。還可以證明,與SSE相互獨立。當原假設為并且成立時,由服從分布,推出(7)因此,給出顯著性水平,即可進行回歸常數(shù)與回歸系數(shù)的顯著性檢驗,得到各個是否顯著的結論。2.4多元線性回歸的估計與預測與一元線性回歸方程類似,多元線性回歸方程的應用也包括點預測和區(qū)間預測等內容。當,,且統(tǒng)計量,為為正規(guī)方程組的逆矩陣中第k行第j列的元素,因此,當n比較大,與與比較接近時,的方差比較小,用預測的效果比較好。整理為word格式整理為word格式整理為word格式作區(qū)間預測時,統(tǒng)計量(8)式中,MSE=,由置信水平求出P{|t|<}=中的臨界值后,若記(9)則P=,便是時的預測區(qū)間,而δ為區(qū)間的半徑。當n比較大,比較接近時,(10)數(shù)據(jù)來源及符號說明3.1數(shù)據(jù)來源所有的數(shù)據(jù)均來自中國統(tǒng)計年鑒2002-2012年十年的數(shù)據(jù),如下:年份人均食品支出人均收入CPI折合的CPI(以2001年=100)農產(chǎn)品生產(chǎn)價格指數(shù)折合的農產(chǎn)品價格指數(shù)恩格爾系數(shù)20022271.848177.4099.299.299.799.737.720032416.929061.22101.2100.39104.4104.937.120042709.6010128.51103.9104.31113.1117.7237.720052914.3911320.77101.8106.18101.4119.3736.720063111.9212719.19101.5107.78101.2120.835.820073628.0314908.61104.8112.95118.5143.1536.320084259.8117067.78105.9119.61114.1163.3437.920094478.5418858.0999.3118.7897.6159.4236.5整理為word格式整理為word格式整理為word格式20104804.7121033.42103.3122.7110.9176.7935.720115506.3323979.20105.4129.32116.5205.9636.320126040.8526958.99102.6132.68102.7211.5236.23.2符號說明......表示人均食品支出......表示人均收入......表示居民消費價格指數(shù)(CPI)......表示農產(chǎn)品價格指數(shù)......恩格爾系數(shù)恩格爾系數(shù)表示是食品支出總額占個人消費支出總額的比重?;貧w方程的建立及檢驗4.1多元回歸分析直接進入法以人均收入、居民消費價格指數(shù)、農產(chǎn)品價格指數(shù),恩格爾系數(shù)為方程的自變量,人均食品支出為因變量,利用spss做回歸分析,得到回歸系數(shù)等表,比較Sig.與0.05的大小關系,得出自變量與因變量的關系是否顯著,而則可以看出回歸方程所擬合的效果是否好。4.1.1spss所產(chǎn)生的結果表1模型匯總b模型RR方調整R方標準估計的誤差11.000a1.0001.00023.48677a.預測變量:(常量),x4,x3,x1,x2。b.因變量:y上面所定義模型表示:確定系數(shù)的平方根()為1.000,確定系數(shù)整理為word格式整理為word格式整理為word格式()為1.000,調整后的確定系數(shù)為1.000,標準誤差為23.48677。值越大所反映的自變量與因變量的共變量比率越高,模型與數(shù)據(jù)的擬合程度越好。表2Anovab模型平方和df均方FSig.1回歸16324741.62344081185.4067398.434.000a殘差3309.7706551.628總計16328051.39210a.預測變量:(常量),x4,x3,x1,x2。b.因變量:y方差分析表:列出了變異源,自由度,均方,F(xiàn)值及對F的顯著性檢驗?;貧w平方和為16324741.623,殘差平方和3309.770,F(xiàn)統(tǒng)計量的值為7398.434,Sig<0.05,可以認為所建立的回歸方程有效。表3系數(shù)a模型非標準化系數(shù)標準系數(shù)tSig.共線性統(tǒng)計量B標準誤差試用版容差VIF1(常量)-4937.552771.548-6.400.001x1.160.013.79012.140.000.008125.344x236.3688.210.3264.430.004.006160.407x3-3.0702.303-.094-1.333.231.007146.829x469.03414.973.0424.610.004.4092.445a.因變量:y回歸系數(shù)表:列出了常數(shù)及回歸系數(shù)的值及標準化的值,同時對其進行顯著性檢驗。因變量y對四個自變量的回歸的非標準化回歸系數(shù)分別為0.160,36.368,-3.070,69.034;對應的顯著性檢驗的t值分別為12.140,4.430,-1.333,4.610四個回歸系數(shù).又因為整理為word格式整理為word格式整理為word格式的Sig.值為0.231大于0.05,所以對y不顯著,而其余的變量均小于0.05,所以與y顯著,所以得到回歸方程:(11)預測值的標準差可以用剩余均方估計:(12)4.1.2對回歸方程進行統(tǒng)計檢驗表4Anovab模型平方和df均方FSig.1回歸16324741.62344081185.4067398.434.000a殘差3309.7706551.628總計16328051.39210a.預測變量:(常量),x4,x3,x1,x2。b.因變量:y(1)回歸方程的顯著性檢驗(F檢驗):若F值較大,說明自變量造成的因變量的變動遠遠大于隨機因素對因變量造成的影響。此外,F(xiàn)統(tǒng)計量也能反映回歸方程的擬合優(yōu)度。若回歸方程的擬合優(yōu)度高,F(xiàn)統(tǒng)計量月顯著;F統(tǒng)計量越高;回歸方程的擬合優(yōu)度越高。F檢驗中,假設是設各個系數(shù)=0.即各個自變量與因變量無線性關系。若F>(顯著性水平),則拒絕原假設,認為所有回歸系數(shù)同時與0有顯著差異,自變量與因變量之間存在顯著的線性關系,自變量的變化確實能反映因變量的線性變化,回歸方程顯著,若F<(顯著性水平),接受原假設,認為所有回歸系數(shù)同時與0無顯著性差異,自變量與因變量之間不存在顯著的線性關系,自變量的變化無法反映因變量的線性變化,回歸方程不顯著。整理為word格式整理為word格式整理為word格式所以,取檢驗水平=0.05,查,而F=7398.434>,所以回歸?;貧w系數(shù)的顯著性檢驗(t檢驗):表5系數(shù)a模型非標準化系數(shù)標準系數(shù)tSig.共線性統(tǒng)計量B標準誤差試用版容差VIF1(常量)-4937.552771.548-6.400.001x1.160.013.79012.140.000.008125.344x236.3688.210.3264.430.004.006160.407x3-3.0702.303-.094-1.333.231.007146.829x469.03414.973.0424.610.004.4092.445a.因變量:y回歸系數(shù)的顯著性檢驗是檢驗各個自變量對因變量y的影響是否顯著,從而找出哪些自變量對y的影響是重要的,哪些是不重要的。假設為:。若令假設成立,說明對因變量y具有顯著的影響。采用t檢驗。若|t|>或者p<a,拒絕原假設,認為該回歸系數(shù)與0有顯著差異,該自變量與因變量之間存在顯著的線性關系,它的變化確實能較好地反映因變量的線性變化,應該保留在回歸方程中。若|t|<或者p>a,接受原假設,認為該回歸系數(shù)與0無顯著差異,該自變量與因變量之間不存在顯著的線性關系,它的變化無法反映因變量的線性變化,應該剔除出回歸方程中,所以后續(xù)應采用逐步回歸分析,得出最優(yōu)的回歸方程。在此回歸系數(shù)表中,t為回歸系數(shù)檢驗統(tǒng)計量,Sig為相伴概率值p,p(常量)=0.001<0.05,p()=0.000<0.05,p()=0.004<0.05,p()=0.231>0.05,p()=0.004<0.05,說明的回歸系數(shù)不顯著,沒有意義,其余的系數(shù)都顯著。(3)共線性診斷整理為word格式整理為word格式整理為word格式表6共線性診斷a模型維數(shù)特征值條件索引方差比例(常量)x1x2x4111.9351.000.03.032.0655.464.97.97212.9301.000.00.00.002.0706.485.00.02.0038.013E-5191.2271.00.981.00313.9111.000.00.00.00.002.0896.628.00.01.00.003.000166.606.68.01.00.7446.938E-5237.422.31.981.00.26a.因變量:y上表可以顯示共線性較大,所以要采用逐步回歸法,棄掉一些共線大的數(shù)據(jù),得到最優(yōu)的回歸方程。4.2逐步回歸分析4.2.1用spss進行逐步回歸分析的結果:逐步回歸每一步進入或剔除回歸模型中的變量情況,是按照移入變量的準則,模型一移入變量x1,模型二多加入移入變量x2,模型三再加如變量x4。表7模型匯總d模型RR方調整R方標準估計的誤差Durbin-Watson1.998a.997.99676.8209621.000b.999.99943.9002831.000c1.0001.00024.757692.451a.預測變量:(常量),x1。b.預測變量:(常量),x1,x2。c.預測變量:(常量),x1,x2,x4。d.因變量:y整理為word格式整理為word格式整理為word格式上表是逐步回歸模型整體擬合效果的概述:R是相關系數(shù);R方是相關系數(shù)的平方,又稱判定系數(shù),判定線性回歸的擬合程度:用來說明用自變量解釋因變量變異的程度(所占比例);調整后的R方為調整后的判定系數(shù);最后一欄是估計標準誤差。第三個模型的擬合優(yōu)度系數(shù)為1.000,反映了因變量與自變量之間具有高度顯著的線性關系,表中還給出了杜賓-瓦特森檢驗值DW=2.451,杜賓-瓦特森檢驗統(tǒng)計量DW是一個用于檢驗一階變量自回歸形式的序列相關問題統(tǒng)計量,DW在數(shù)值2到4之間的附近說明模型變量無序列相關。表8Anovad模型平方和df均方FSig.1回歸16274938.248116274938.2482757.781.000a殘差53113.14595901.461總計16328051.392102回歸16312633.51928156316.7594232.136.000b殘差15417.87481927.234總計16328051.392103回歸16323760.78935441253.5968877.253.000c殘差4290.6047612.943總計16328051.39210a.預測變量:(常量),x1。b.預測變量:(常量),x1,x2。c.預測變量:(常量),x1,x2,x4。d.因變量:y上表是逐步回歸每一步的回歸模型的方差分析,給出了每一步的回歸及殘差的平方和,自由度,均方,F(xiàn)值和Sig(顯著性概率),顯著性概率是0.000(非常?。?,表明回歸極顯著,也就是說因變量與自變量的線性關系明顯。表9已排除的變量d整理為word格式整理為word格式整理為word格式已排除的變量d模型BetaIntSig.偏相關共線性統(tǒng)計量容差VIF最小容差1x2.401a4.423.002.842.01469.795.014x3.281a2.678.028.687.01951.315.019x4.056a4.301.003.836.7151.398.7152x3.052b.422.686.157.009117.040.006x4.036b4.261.004.850.5131.949.0103x3-.094c-1.333.231-.478.007146.829.006模型BetaIntSig.偏相關共線性統(tǒng)計量容差VIF最小容差1x2.401a4.423.002.842.01469.795.014x3.281a2.678.028.687.01951.315.019x4.056a4.301.003.836.7151.398.7152x3.052b.422.686.157.009117.040.006x4.036b4.261.004.850.5131.949.0103x3-.094c-1.333.231-.478.007146.829.006a.模型中的預測變量:(常量),x1。b.模型中的預測變量:(常量),x1,x2。c.模型中的預測變量:(常量),x1,x2,x4。d.因變量:y上表為各個模型中排出的變量。表10系數(shù)a模型非標準化系數(shù)標準系數(shù)tSig.共線性統(tǒng)計量B標準誤差試用版容差VIF1(常量)619.60065.3959.475.000x1.203.004.99852.515.0001.0001.0002(常量)-3201.503864.806-3.702.006x1.122.018.6006.609.000.01469.795x244.76710.122.4014.423.002.01469.7953(常量)-4165.603537.644-7.748.000x1.153.013.75512.017.000.010105.210x229.5016.740.2654.377.003.01097.291x460.04114.092.0364.261.004.5131.949a.因變量:y上表是逐步回歸每一步的回歸方程系數(shù)表。建立回歸模型:根據(jù)多元線性回歸模型:(13)過程一共運行了三步,最后一步以就是表中的第3步的計算結果得知:4個變量中只進入了3個變量x1,x2,x4。把表中“非標準化回歸系數(shù)”欄目中的整理為word格式整理為word格式整理為word格式“B”列數(shù)據(jù)代入多元回歸模型得到預報方程:(14)4.2.2回歸方程的顯著性檢驗:由上表8模型中的數(shù)據(jù)的F值知F=8877.253,系統(tǒng)自動檢驗的顯著性水平位0.000(非常小),查表知F(0.05,3,7)=4.35,而F=8877.253>,所以回歸方程是顯著的。4.2.3回歸方程系數(shù)的檢驗:在以上系數(shù)表中,t為回歸系數(shù)檢驗統(tǒng)計量,Sig為相伴概率值p,p(常量)=0.000<0.05,p()=0.000<0.05,p()=0.003<0.05,p()=0.004<0.05,說明系數(shù)都顯著。4.3殘差檢驗前面我們已經(jīng)就方程擬合好壞、回歸方程的線性性以及參數(shù)的顯著性進行了建模分析。在回歸分析中還有一項很重要的檢驗需要進行,這就是下面要介紹的殘差分析。在回歸分析中,測定值與按回歸方程預測的值之差即為殘差,以表示。殘差δ遵從正態(tài)分布N(0,)。(-殘差的均值)/殘差的標準差,稱為標準化殘差,以表示。遵從標準正態(tài)分布N(0,1)。實驗點的標準化殘差落在(-2,2)區(qū)間以外的概率≤0.05。若某一實驗點的標準化殘差落在(-2,2)區(qū)間以外,可在95%置信度將其判為異常實驗點,不參與回歸直線擬合。顯然,有多少對數(shù)據(jù),就有多少個殘差。殘差分析就是通過殘差所提供的信息,分析出數(shù)據(jù)的可靠性、周期性或其它干擾。整理為word格式整理為word格式整理為word格式圖1殘差向量如則學生化殘差如果樣本回歸模型對數(shù)據(jù)擬合是良好的話,那么.4.3.1殘差的正態(tài)性檢驗圖2整理為word格式整理為word格式整理為word格式圖3由以上分別為殘差的直方圖和累積概率圖(P-P圖),其中直方圖的分布為正太分布,而累積概率圖可以看出點存在于直線的周圍,構成線性的關系,這是對殘差的正態(tài)性檢驗,可以由圖像得到殘差是具有正態(tài)性的。4.3.2殘差的獨立性檢驗用Durbin--Watson檢驗,其參數(shù)稱為Dw或D。D的取值范圍是0<D<4。其統(tǒng)計學意義為:D≈2,殘差與自變量相互獨立;D<2,殘差與自變量正相關;D>2,殘差與自變量負相關。表11模型匯總b模型RR方調整R方標準估計的誤差Durbin-Watson11.000a1.0001.00023.486773.069a.預測變量:(常量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國空心柄餐具數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國布塊拼接用線數(shù)據(jù)監(jiān)測研究報告
- 2025年中國風冷螺桿空調機市場調查研究報告
- 2025年中國螺紋燭市場調查研究報告
- 2025年中國水冷卻磁粉離合器市場調查研究報告
- 區(qū)域協(xié)同立法機制研究
- 人才引進政策對企業(yè)創(chuàng)新效率的影響研究
- 二零二四年企業(yè)債券擔保委托保證合同3篇
- 2025年度船員勞務合同范本修訂版4篇
- 二零二五年度水庫水資源調配與承包管理合同3篇
- 人員測評與選拔的主要方法課件
- 2024年度節(jié)后復工建筑施工安全培訓交底
- 2024年內蒙古電力集團招聘筆試參考題庫含答案解析
- 阿米巴落地實操方案
- 藥物制劑工(三級)理論試題題庫及答案
- 高強度間歇訓練(HIIT)對代謝健康的長期影響
- ICU患者導管留置登記表
- 中建商務工作指南手冊
- 耳鼻咽喉:頭頸外科疾病診斷流程與冶療策略
- 貴州省2023年中考英語真題
- 個人借條電子版模板
評論
0/150
提交評論