人均食品支出_第1頁(yè)
人均食品支出_第2頁(yè)
人均食品支出_第3頁(yè)
人均食品支出_第4頁(yè)
人均食品支出_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

cc數(shù)理統(tǒng)計(jì)課程論文題目:運(yùn)用spss軟件對(duì)我國(guó)人均食品支出的影

響因素的統(tǒng)計(jì)分析指導(dǎo)教師陳彩霞日期運(yùn)用spss對(duì)我國(guó)人均食品支出的影響因素的分析摘要隨著21世紀(jì)世界的逐步發(fā)展,中國(guó)的國(guó)力日益強(qiáng)大,人民的生活水品也逐步提高,而人均食品支出也越來(lái)越大。這是什么原因造成的結(jié)果呢?因此我們選取了2002年到2012年這十年的數(shù)據(jù),對(duì)居民消費(fèi)價(jià)格指數(shù)(CPI)、人均收入、農(nóng)產(chǎn)品價(jià)格指數(shù)對(duì)人均食品支出的影響以及恩格爾系數(shù)作出了回歸分析。從數(shù)據(jù)上,我們可以發(fā)現(xiàn)人均食品支出、人均收入在逐年增長(zhǎng),且增長(zhǎng)的幅度較大,居民消費(fèi)價(jià)格指數(shù)與農(nóng)產(chǎn)品價(jià)格指數(shù)也在增長(zhǎng),但增長(zhǎng)的較慢,而恩格爾系數(shù)則幾乎沒(méi)有什么波動(dòng)。我們根據(jù)所選取的數(shù)據(jù)做出來(lái)相對(duì)應(yīng)的模型,并對(duì)這些模型進(jìn)行驗(yàn)證,通過(guò)CPI、人均收入、農(nóng)產(chǎn)品價(jià)格指數(shù)的變動(dòng)對(duì)人均食品支出的不同影響程度,從而發(fā)現(xiàn)這些因素對(duì)人均食品支出的實(shí)際情況,并利用這些數(shù)據(jù)對(duì)今后人均食品支出作出預(yù)測(cè)。回歸模型1:運(yùn)用多元回歸分析,由于自變量之間存在共線性,因此得出農(nóng)產(chǎn)品價(jià)格指數(shù)對(duì)人均食品支出影響不顯著。£=-4937.552+0.160x+36.368x-3.070x+69.034x+e(1)1 23 4回歸模型2:運(yùn)用多元回歸的逐步分析法,剔除回歸系數(shù)未通過(guò)0.05的顯著檢驗(yàn),保留通過(guò)的,得到“最優(yōu)”回歸方程?!?-4165.603+0.153x+29.501x+60.041x+e (2)124關(guān)鍵字:回歸分析逐步回歸人均食品支出人均收入CPI農(nóng)產(chǎn)品價(jià)格指數(shù)一、引言人均食品支出可以反映人民的消費(fèi)狀況,反映人民的生活水品以及人們對(duì)滿足生存、發(fā)展、享受和需要所達(dá)到的程度,更能反映一段時(shí)期一個(gè)國(guó)家的消費(fèi)水平和發(fā)展水品。本問(wèn)題要求通過(guò)收集整理數(shù)據(jù),掌握對(duì)城鎮(zhèn)人均消費(fèi)支出的影響因素,利用spss軟件進(jìn)行多元回歸分析,求出回歸方程,進(jìn)行統(tǒng)計(jì)檢驗(yàn)(包括回歸方程的顯著性檢驗(yàn),回歸系數(shù)的顯著性檢驗(yàn))以及殘差的檢驗(yàn);然后進(jìn)行估計(jì)和預(yù)測(cè)。二、多元線性回歸理論基礎(chǔ)2.1多元線性回歸的概念設(shè)自變量X,X,…/的觀測(cè)值X,X,/及因變量y對(duì)應(yīng)的觀測(cè)值y滿足12p i1i2 ip i關(guān)系式y(tǒng)=0+Zpx+£,i=1,2,…,n (3)i0 jijij=1式中,8,8,...,8是相互獨(dú)立且都服從正態(tài)分布N(0,。2)的隨機(jī)變量。12n根據(jù)最小二乘法,由n個(gè)觀測(cè)值(x,x,..x,y)確定參數(shù)0及0,0,下的估計(jì)i1i2 ipi 0 12p值b及b,b,..b后,得到公式的估計(jì)值y=b+lLbx稱為多元線性回歸方程。0 12p 0 jjj=1建立多元線性回歸方程的過(guò)程以及對(duì)回歸方程與回歸數(shù)所做的顯著性檢驗(yàn),稱為多元線性回歸分析或多元線性回歸。TOC\o"1-5"\h\z如果將x,x,..x帶入多元線性回歸方程,記y=b+Zbx,則y與y之間的i1 i2ip 0 jj ij=1偏差平方和Q=£(y—y)2=£(y-b—EbX)2,由絲=0(j=0,1,...,p)可得到ii i0jj 3bi=1 i=1 j=1 j多元線性回歸的正規(guī)方程組。通過(guò)解正規(guī)方程組,即可以算出b及b,b-b求出回歸方程。0 12p

2.2回歸方程的顯著性檢驗(yàn)與一元線性回歸方程相類似,多元線性回歸方程的總平方和SST也可以分解為剩余平方和SSE和回歸平方和SSR,即SST=SSR+SSE (4)式中,SST=£(y-y\=li yyi=1SSR=£(y-y)2=Zbli jjyi=1 j=1而l=£(x-x)(y-y),j=1,2,...p,因土匕jy ijjii=1SSE=l-SSRyy如果55區(qū)的數(shù)值較大,SSE的數(shù)值便比較小,說(shuō)明回歸的效果好。如果SSR的數(shù)值較小,SSE的數(shù)值便比較大,說(shuō)明回歸的效果差。理論上已經(jīng)證明:TOC\o"1-5"\h\z當(dāng)原假設(shè)H為P=0,P=0,..邛=0,并且H成立時(shí),01 2 p 0SST( \SSR(\SSE( \--~X25-11 ~X2(p), ――-%25-p-11C2 C2 C2且SSR與SSE相互獨(dú)立,F(xiàn)= SSR/PF= SSR/P-SSE/(n-p-1)~F(p,n-p-1),(5)=MSE=SSE

n-p-1(6)為o2的無(wú)偏估計(jì)。因此,給出顯著性水平a,即可進(jìn)行回歸方程的顯著性檢驗(yàn)。回歸系數(shù)的顯著性檢驗(yàn)一個(gè)多元線性回歸方程顯著,并不表示方程中的每一個(gè)自變量

x(j=1,2,...p)對(duì)因變量y的影響都是重要的。因此為了對(duì)X的重要程度作出jj比較與檢驗(yàn),有必要找出一個(gè)與b有關(guān)的統(tǒng)計(jì)量。j由于b是隨機(jī)變量y,y,…y的線性函數(shù),各y都服從正態(tài)分布,所以j 12b也服從正態(tài)分布,且jEb)=p,Db )=o2c,jj j jj式中,c是正規(guī)方程組的系數(shù)矩陣的逆矩陣中第j行第j列的元素。jj還可以證明,b與SSE相互獨(dú)立。由SSE由SSE服從%2(n—p-1)分布,推出O2當(dāng)原假設(shè)H為p=0并且H成立時(shí),0j 0,n-p-1,n-p-1),F= j j \~jSSE/ni-p-1)tj~t(tj~t(n-p-1)(7)因此,給出顯著性水平a,即可進(jìn)行回歸常數(shù)b與回歸系數(shù)b(j=1,2,...,p)的0j顯著性檢驗(yàn),得到各個(gè)b是否顯著的結(jié)論。j多元線性回歸的估計(jì)與預(yù)測(cè)與一元線性回歸方程類似,多元線性回歸方程的應(yīng)用也包括點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè)等內(nèi)容。當(dāng)x=x,x=x,…x=x,y=y,yy=b+^p^bx時(shí)1 01 2 02p0p 0 0 0 j0jj+1E(b)=P(j=0,1,...p),E(y)=E(y),jj 0 0且統(tǒng)計(jì)量y-y~N(0,O2(1+1+Z1Lc(x-x)(x-x))),c為為正規(guī)方程組的0 0 n kj0k k0jj kjk=1j=1逆矩陣中第k行第j列的元素,因此,當(dāng)n比較大,x與x,x,...,x與x比01 1 2 0pp較接近時(shí),y-較接近時(shí),y-y的方差比較小,00用y預(yù)測(cè)y的效果比較好。00作區(qū)間預(yù)測(cè)時(shí),統(tǒng)計(jì)量TOC\o"1-5"\h\zt= -0-0 ~t(n-p—i) (8):MSEQ+-+XXc(X-x,)(x-x))n kj0kk0jjk=1j=1式中,MSE=SSE,由置信水平--a求出P{|t|<t(n-p--)}=--a中的臨界n—p—1 a值ta(n-p-1)后,若記8=t(n-p-1):MSE(1+-+XXc(x-X)(x-X)) (9)a Y n kj0k k0jjk=1j=1則pfy。--0l<8}=1-a,(--8,-+8)便是x=x,x=x,...,x=x時(shí))的預(yù)測(cè)區(qū)間,而b為區(qū)間的半0 0 1 01 2 02p0p0徑。當(dāng)n比較大,x與x,x與x,...,x與x比較接近時(shí),01 1 02 2 0pp82t(n-p-1)kMSE (10)a三、數(shù)據(jù)來(lái)源及符號(hào)說(shuō)明數(shù)據(jù)來(lái)源所有的數(shù)據(jù)均來(lái)自中國(guó)統(tǒng)計(jì)年鑒2002-2012年十年的數(shù)據(jù),如下:年份人均食品支出人均收入CPI折合的CPI(以2001年二100)農(nóng)產(chǎn)品生產(chǎn)價(jià)格指數(shù)折合的農(nóng)產(chǎn)品價(jià)格指數(shù)恩格爾系數(shù)20022271.848177.4099.299.299.799.737.720032416.929061.22101.2100.39104.4104.937.120042709.6010128.51103.9104.31113.1117.7237.720052914.3911320.77101.8106.18101.4119.3736.720063111.9212719.19101.5107.78101.2120.835.820073628.0314908.61104.8112.95118.5143.1536.320084259.8117067.78105.9119.61114.1163.3437.920094478.5418858.0999.3118.7897.6159.4236.520104804.7121033.42103.3122.7110.9176.7935.720115506.3323979.20105.4129.32116.5205.9636.320126040.8526958.99102.6132.68102.7211.5236.2符號(hào)說(shuō)明Y 表示人均食品支出 表示人均收入x丫 表示居民消費(fèi)價(jià)格指數(shù)(CPI)x 表示農(nóng)產(chǎn)品價(jià)格指數(shù)x 恩格爾系數(shù)x恩格爾系數(shù)表示是食品支出總額占個(gè)人消費(fèi)支出總額的比重。四、回歸方程的建立及檢驗(yàn)多元回歸分析直接進(jìn)入法以人均收入、居民消費(fèi)價(jià)格指數(shù)、農(nóng)產(chǎn)品價(jià)格指數(shù),恩格爾系數(shù)為方程的自變量,人均食品支出為因變量,利用spss做回歸分析,得到回歸系數(shù)等表,比較Sig.與0.05的大小關(guān)系,得出自變量與因變量的關(guān)系是否顯著,而R2則可以看出回歸方程所擬合的效果是否好。spss所產(chǎn)生的結(jié)果表1上面所定義模型表示:確定系數(shù)的平方根(R)為1.000,確定系數(shù)(R2)為1.000,調(diào)整后的確定系數(shù)為1.000,標(biāo)準(zhǔn)誤差為23.48677。r2值越大所反映的自變量與因變量的共變量比率越高,模型與數(shù)據(jù)的擬合程度越好。表2方差分析表:列出了變異源,自由度,均方,F(xiàn)值及對(duì)F的顯著性檢驗(yàn)。回歸平方和為16324741.623,殘差平方和3309.770,F(xiàn)統(tǒng)計(jì)量的值為7398.434,5?8<0.05,可以認(rèn)為所建立的回歸方程有效?;貧w系數(shù)表:列出了常數(shù)及回歸系數(shù)的值及標(biāo)準(zhǔn)化的值,同時(shí)對(duì)其進(jìn)行顯著性檢驗(yàn)。因變量y對(duì)四個(gè)自變量x,x,x,x的回歸的非標(biāo)準(zhǔn)化回歸系數(shù)分別為12340.160,36.368,-3.070,69.034;對(duì)應(yīng)的顯著性檢驗(yàn)的t值分別為12.140,4.430,-1.333,4.610四個(gè)回歸系數(shù).又因?yàn)閤的Sig.值為0.231大3于0.05,所以x對(duì)y不顯著,而其余的變量均小于0.05,所以與y顯著,3所以得到回歸方程:TOC\o"1-5"\h\z,=—4937.552+0.160x+36.368x-3.070x+69.034x (11)1 23 4預(yù)測(cè)值y的標(biāo)準(zhǔn)差可以用剩余均方估計(jì):S=.<551.628=±23.487 (12)y4.1.2對(duì)回歸方程進(jìn)行統(tǒng)計(jì)檢驗(yàn)表4(1)回歸方程的顯著性檢驗(yàn)(F檢驗(yàn)):若F值較大,說(shuō)明自變量造成的因變量的變動(dòng)遠(yuǎn)遠(yuǎn)大于隨機(jī)因素對(duì)因變量造成的影響。此外,F(xiàn)統(tǒng)計(jì)量也能反映回歸方程的擬合優(yōu)度。若回歸方程的擬合優(yōu)度高,F(xiàn)統(tǒng)計(jì)量月顯著;F統(tǒng)計(jì)量越高;回歸方程的擬合優(yōu)度越高。F檢驗(yàn)中,H假設(shè)是設(shè)各個(gè)系數(shù)p=0.0i即各個(gè)自變量與因變量無(wú)線性關(guān)系。若F>F(k,n—k-1)或p<a(顯著性水平),a則拒絕原假設(shè)H,認(rèn)為所有回歸系數(shù)同時(shí)與0有顯著差異,自變量與因變量0之間存在顯著的線性關(guān)系,自變量的變化確實(shí)能反映因變量的線性變化,回歸方程顯著,若F<F(k,n-k-1)或p>a(顯著性水平),接受原假設(shè)H,認(rèn)a0為所有回歸系數(shù)同時(shí)與0無(wú)顯著性差異,自變量與因變量之間不存在顯著的線性關(guān)系,自變量的變化無(wú)法反映因變量的線性變化,回歸方程不顯著。所以,取檢驗(yàn)水平a=0.05,查F(4,6)=4.53,而F=7398.434>F,所以回0.95 1-a歸。(2)回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn)):表5回歸系數(shù)的顯著性檢驗(yàn)是檢驗(yàn)各個(gè)自變量x對(duì)因變量y的影響是否顯著,k從而找出哪些自變量對(duì)y的影響是重要的,哪些是不重要的。H假設(shè)為:00=0,i=1,2,...,夕。若令假設(shè)成立,說(shuō)明x對(duì)因變量y具有顯著的影響。采用ikt檢驗(yàn)。若代|>’Jn-kT)或者p<a,拒絕原假設(shè)H,認(rèn)為該回歸系數(shù)與0有20顯著差異,該自變量與因變量之間存在顯著的線性關(guān)系,它的變化確實(shí)能較好地反映因變量的線性變化,應(yīng)該保留在回歸方程中。若田<,Jn-k-1)或2者p>a,接受原假設(shè)H,認(rèn)為該回歸系數(shù)與0無(wú)顯著差異,該自變量與因變0量之間不存在顯著的線性關(guān)系,它的變化無(wú)法反映因變量的線性變化,應(yīng)該剔除出回歸方程中,所以后續(xù)應(yīng)采用逐步回歸分析,得出最優(yōu)的回歸方程。在此回歸系數(shù)表中,t為回歸系數(shù)檢驗(yàn)統(tǒng)計(jì)量,5?8為相伴概率值p,p(常量)=0.001<0.05,p(x)=0.000<0.05,p(x)=0.004<0.05,p(x)123=0.231>0.05,p(x)=0.004<0.05,說(shuō)明x的回歸系數(shù)不顯著,沒(méi)有意義,43其余的系數(shù)都顯著。(3)共線性診斷

上表可以顯示X與X的共線性較大,所以要采用逐步回歸法,棄掉一些34共線大的數(shù)據(jù),得到最優(yōu)的回歸方程。4.2逐步回歸分析用spss進(jìn)行逐步回歸分析的結(jié)果:逐步回歸每一步進(jìn)入或剔除回歸模型中的變量情況,是按照移入變量的準(zhǔn)則,模型一移入變量乂1,模型二多加入移入變量乂2,模型三再加如變量x4。上表是逐步回歸模型整體擬合效果的概述:R是相關(guān)系數(shù);R方是相關(guān)系數(shù)的平方,又稱判定系數(shù),判定線性回歸的擬合程度:用來(lái)說(shuō)明用自變量解釋因變量變異的程度(所占比例);調(diào)整后的R方為調(diào)整后的判定系數(shù);最后一欄是估計(jì)標(biāo)準(zhǔn)誤差。第三個(gè)模型的擬合優(yōu)度系數(shù)為1.000,反映了因變量與自變量之間具有高度顯著的線性關(guān)系,表中還給出了杜賓-瓦特森檢驗(yàn)值DW=2.451,杜賓-瓦特森檢驗(yàn)統(tǒng)計(jì)量DW是一個(gè)用于檢驗(yàn)一階變量自回歸形式的序列相關(guān)問(wèn)題統(tǒng)計(jì)量,DW在數(shù)值2到4之間的附近說(shuō)明模型變量無(wú)序列相關(guān)。上表是逐步回歸每一步的回歸模型的方差分析,給出了每一步的回歸及殘差的平方和,自由度,均方,F(xiàn)值和Sig(顯著性概率),顯著性概率是0.000(非常小),表明回歸極顯著,也就是說(shuō)因變量與自變量的線性關(guān)系明顯。表9

上表是逐步回歸每一步的回歸方程系數(shù)表。建立回歸模型:(13)根據(jù)多元線性回歸模型:(13)y=b+bx+bx+...+bx+5

0 11 22 kk過(guò)程一共運(yùn)行了三步,最后一步以就是表中的第3步的計(jì)算結(jié)果得知:4個(gè)變量中只進(jìn)入了3個(gè)變量x1,x2,x4。把表中“非標(biāo)準(zhǔn)化回歸系數(shù)”欄目中的“B”列數(shù)據(jù)代入多元回歸模型得到預(yù)報(bào)方程:Q=—4165.603+0.153x+29.501x+60.041x (14)1244.2.2回歸方程的顯著性檢驗(yàn):由上表8模型中的數(shù)據(jù)的F值知F=8877.253,系統(tǒng)自動(dòng)檢驗(yàn)的顯著性水平位0.000(非常?。?,查表知F(0.05,3,7)=4.35,而F=8877.253>仁,所以回歸方程是顯著的。4.2.3回歸方程系數(shù)的檢驗(yàn):在以上系數(shù)表中,t為回歸系數(shù)檢驗(yàn)統(tǒng)計(jì)量,5?8為相伴概率值p,p(常量)=0.000<0.05,p(x1)=0.000<0.05,p(x2)=0.003<0.05,p(x4)=0.004<0.05,說(shuō)明系數(shù)都顯著。4.3殘差檢驗(yàn)前面我們已經(jīng)就方程擬合好壞、回歸方程的線性性以及參數(shù)的顯著性進(jìn)行了建模分析。在回歸分析中還有一項(xiàng)很重要的檢驗(yàn)需要進(jìn)行,這就是下面要介紹的殘差分析。在回歸分析中,測(cè)定值與按回歸方程預(yù)測(cè)的值之差即為殘差,以5表示。殘差b遵從正態(tài)分布N(0,52)。(B-殘差的均值)/殘差的標(biāo)準(zhǔn)差,稱為標(biāo)準(zhǔn)化殘差,以6*表示。6*遵從標(biāo)準(zhǔn)正態(tài)分布N(0,1)。實(shí)驗(yàn)點(diǎn)的標(biāo)準(zhǔn)化殘差落在(-2,2)區(qū)間以外的概率W0.05。若某一實(shí)驗(yàn)點(diǎn)的標(biāo)準(zhǔn)化殘差落在(-2,2)區(qū)間以外,可在95%置信度將其判為異常實(shí)驗(yàn)點(diǎn),不參與回歸直線擬合。顯然,有多少對(duì)數(shù)據(jù),就有多少個(gè)殘差。殘差分析就是通過(guò)殘差所提供的信息,分析出數(shù)據(jù)的可靠性、周期性或其它干擾圖2圖2c敞占用因要信:¥回R.Stuti電出化股藺圖1殘差向量口=(口,口,…,口)=(y-y,y—y,…,y-y)=Y—Y12 n 1 12 2 nn如E~N(0,821)nE~N(0,52(1-H)),H=X(XtX)-1Xt,82=MSE貝4色~N(0,82(1-h)),h=xt(XtX)-1x--杠桿量i iiiii i八學(xué)生化殘差r一 £ n充分大近似N(0,1)i-MSE-(1-h)11如果樣本回歸模型對(duì)數(shù)據(jù)擬合是良好的話,那么rn(0,1).1殘差的正態(tài)性檢驗(yàn)直方囹因變量:vlEjIH標(biāo)漸■!噴差rn=-2.aEE.iii-0.廣5cc由以上分別為殘差的直方圖和累積概率圖(P-P圖),其中直方圖的分布為正太分布,而累積概率圖可以看出點(diǎn)存在于直線的周圍,構(gòu)成線性的關(guān)系,這是對(duì)殘差的正態(tài)性檢驗(yàn),可以由圖像得到殘差是具有正態(tài)性的。殘差的獨(dú)立性檢驗(yàn)用Durbin—Watson檢驗(yàn),其參數(shù)稱為Dw或D。D的取值范圍是0<D<4。其

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論