完整版多元統(tǒng)計(jì)分析課程設(shè)計(jì)終稿_第1頁
完整版多元統(tǒng)計(jì)分析課程設(shè)計(jì)終稿_第2頁
完整版多元統(tǒng)計(jì)分析課程設(shè)計(jì)終稿_第3頁
完整版多元統(tǒng)計(jì)分析課程設(shè)計(jì)終稿_第4頁
完整版多元統(tǒng)計(jì)分析課程設(shè)計(jì)終稿_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 應(yīng)用多元統(tǒng)計(jì)分析 告 驗(yàn) 報(bào)程課 實(shí) 實(shí)驗(yàn)名稱: 利用回歸法分析山東省農(nóng)村居民收入的消費(fèi)分配 學(xué)生班級: 統(tǒng)計(jì)學(xué)院統(tǒng)計(jì)0901班 學(xué)生姓名:王冬冬、王鵬、王莉、王璐 張艷麗 _ 指導(dǎo)老師: 完成日期: 2011-12-10 一、 實(shí)驗(yàn)內(nèi)容 本文通過分析研究更深一步了解山東省農(nóng)村居民生活水平。實(shí)驗(yàn)中充分利用了回歸分析、聚類分析等多種分析手段。先通過收入支出的時(shí)間序列模型的分析給出了從2000到2009年的農(nóng)村收入支出呈現(xiàn)的增長趨勢,以及城鄉(xiāng)之間的對比;然后利用聚類分析說明了收入支出的地區(qū)差異。然后利用回歸分析建立了山東省農(nóng)村居民收入與支出之間的模型,試圖尋找出農(nóng)村居民收入的消費(fèi)分配現(xiàn)狀,即單位

2、收入的支出方向問題。 二、 實(shí)驗(yàn)?zāi)康?通過本實(shí)驗(yàn)主要想達(dá)到三個(gè)目的: 1、利用山東省統(tǒng)計(jì)年鑒中有關(guān)農(nóng)村居民收入支出的數(shù)據(jù),結(jié)合多元統(tǒng)計(jì)方法,熟練掌握聚類分析和回歸分析的原理及其基本步驟; 2、希望通過本次實(shí)驗(yàn)充分掌握和運(yùn)用多元統(tǒng)計(jì)分析的統(tǒng)計(jì)方法,能夠利用基本的統(tǒng)計(jì)軟件如Eviews、Spss等軟件處理分析數(shù)據(jù),并對結(jié)果作出合理的解釋。 3、了解近幾年來山東省農(nóng)村居民收入支出的基本狀況,其中包括城鄉(xiāng)差距問題和居民收入的消費(fèi)分配問題,進(jìn)而掌握山東省農(nóng)村居民的基本生活狀況,為我省經(jīng)濟(jì)的長遠(yuǎn)發(fā)展提 供依據(jù)。三、 實(shí)驗(yàn)方法背景和原理 聚類分析的背景和原理 、1聚類分析的定義 聚類分析是統(tǒng)計(jì)學(xué)中研究“物以

3、類聚”問題的多元統(tǒng)計(jì)分析方法。聚類分析又稱群分析,它是研究對樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)方法。所謂的“類”,通俗地說就是相似元素的集合。 2聚類的方法分類 聚類分析的內(nèi)容十分豐富,按其聚類的方法可分為以下幾種:系統(tǒng)聚類法、調(diào)優(yōu)法、最優(yōu)分割法、模糊聚類法、圖論聚類法、聚類預(yù)報(bào)法。本文中應(yīng)用的是系統(tǒng)聚類法:開始每個(gè)對象自成一類,然后每次將最相似的兩類合并,合并后重新計(jì)算新類與其他類的距離或相近性測度,這一過程一直繼續(xù)直到所有對象歸為一類為止。并類的過程可用一張譜系聚類圖描述。 3.系統(tǒng)聚類法的基本步驟 (0)D。類與類之間的距離本文應(yīng)用n1)計(jì)算個(gè)樣品兩兩間的距離,得樣品間的距離矩陣(的是類平

4、均法。所謂類平均法就是:兩類樣品兩兩之間平方距離的平均作為類之間的距離,1?22dD?類方法,稱為類平均法。 即:采用這種類間距離的聚 ijpqnnG?i?G,jqpqp?XG?,類(t=1,2第個(gè)樣本各自構(gòu)成一類,(第一步:2()初始i=1)n類的個(gè)數(shù)k=n,t)t(t(0)(1)D?D)n)。此時(shí)類間的距離就是樣品間的距離(即。 1)i(?D此時(shí)類的總個(gè)數(shù)合并類間距離最小的兩類為一新類。,得到的距離矩陣i)3(對步驟k=n-i+1. 減少k1類,即 (0)D。若合并后類的總個(gè)數(shù)k)計(jì)算新類與其他類的距離,得新的距離矩陣扔大于1,(4重新步驟(3)和(4);直到類的總個(gè)數(shù)為1時(shí)轉(zhuǎn)到步驟(5)

5、。 (5)畫譜系聚類圖; (6)決定總類的個(gè)數(shù)及各類的成員。 、回歸分析的背景和原理 1.回歸分析的基本原理 回歸分析是研究兩個(gè)或多個(gè)變量之間關(guān)系的統(tǒng)計(jì)分析方法,在實(shí)際問題中,因變量 y 往x,x,L,x有關(guān)往不是只與一個(gè)變量有關(guān),而是和多個(gè)變量 ,設(shè) p12?x?Lx?xy? (3.1) p210p12?,L,L稱為回歸系數(shù),其中是p+1個(gè)未知參數(shù),y稱為回歸常數(shù),為被p10,10,px,x,Lx是p個(gè)可以精確測量并可控制的一般變量,稱為解釋變解釋變量(因變量),而p12量(自變量), 是隨機(jī)誤差.稱 ?x?x?x?L (3.2) E(y)= p0221p1為理論回歸方程。 (x,x,Lx;

6、y),i?1,2,L,n,n組觀測數(shù)據(jù)則線性回歸模對一個(gè)實(shí)際問題我們獲的ii2ipi1?xxy?Lx?1121p111012p?xxy?Lx?222221220p1p型(3.2)可表示為 (3.3) ?M?xxy?Lx?pnppn2p201n1?Xy? 寫成矩陣形式為(3.4) ?y?011?1xx?11p1?y?122?,XM,?,M?Oy其中 ?MMM?1xx?1nnp?y?pnn?的估計(jì)SSE(最小二乘原理就是求一個(gè)參數(shù)向量),使得回歸的殘差平方和函數(shù)取得最小值 ?)X)(Y?(Y?X?SSE() 由微分求極值法及矩陣微商有: ?)(?SSE?0X12XY?2X? ?XYXX 得到正規(guī)方

7、程組?XX 非退化,則得的最小二乘解若1?XY(=XX) ?)(SSE2?=的估計(jì) n?p?12. 模型的基本假定及檢驗(yàn) 為了方便進(jìn)行模型的參數(shù)估計(jì),做如下基本假定: .解釋變量是確定性變量,不是隨機(jī)變量.并且要求 rank ( X ) = p + 1 n,它表明. 設(shè)計(jì)矩陣是滿秩的 ?)?0.i?1,2,E(L,n?i?(i,j?1,2,L,n)2?j?,i .對隨機(jī)誤差項(xiàng)假定?),cov(?ji0,i?j?這個(gè)假定稱為高斯-馬爾科夫條件。 2?),i?1,2,L?N(0,n?i.正態(tài)分布的假定為 ?相互獨(dú)立L,?n12對于多元線性回歸的矩陣形式這個(gè)條件可以表示為 2?I)(0,N n2?I

8、),其中IN(X是單位陣。,Y) 由此可以得到nn為了驗(yàn)證是否能做到基本假定,所以需要做回歸模型的顯著性檢驗(yàn): F檢驗(yàn) x,x,Lx從整體上對隨機(jī)變量y是否對多元回歸方程的顯著性檢驗(yàn)就是要看自變量p12有明顯的影響,故提出原假設(shè) ?0?H:L? P201構(gòu)成F統(tǒng)計(jì)量 SSR/PF? 1)?/(n?pSSESSESSR?,MSE?MSR的方差并且稱為均方回歸和均方誤差,他們都是誤差項(xiàng) i1?pn?p22?得無偏有效估計(jì)量,而MSR只當(dāng)原假設(shè)成的估計(jì)量,但兩者的性質(zhì)有差別。MSR總是2?的有效估計(jì)量,則將趨于無窮。假設(shè)成立時(shí)統(tǒng)計(jì)量服從自由度(p,n-p-1立時(shí)才會是)?F?F(p,n?p?1)或者

9、計(jì)算對事先給定的顯著性水平F確定臨界值對應(yīng)的的F分布。?pF或F?,就拒絕原假設(shè),認(rèn)為回歸方程顯著,自變量與因變量之。若相伴概率值p?間存在顯著的線性關(guān)系。 t檢驗(yàn) 在多元回歸中,回歸方程顯著并不意味著每個(gè)自變量對因變量的影響都顯著,因此需 要對每個(gè)系數(shù)進(jìn)行顯著性檢驗(yàn)故提出原假設(shè) ?0(i?1,2,H:L,p) i02?1?1?,p)Lc),(i,j=0,1,2,)(XX),(XX)=(yN( 記由則ij1p?22?),(i?0,1,2,L,N(,E(c)?,var(p)?c) iiiiiiiii ?nn11?22?i)y?y?e?(?t,其中 因此構(gòu)造t統(tǒng)計(jì)量為 iiiin?p?1n?p?1

10、?c11i?i?ii是標(biāo)準(zhǔn)回歸差。 ?t,分布。對于給定的顯著性水平的在原假設(shè)成立時(shí),統(tǒng)計(jì)量t服從自由度為n-p-1i? 1)?n(?pt?tt?p,查處雙側(cè)檢驗(yàn)的臨界值t。當(dāng)值所對應(yīng)的相伴概率值,或者?/2/2就拒絕原假設(shè),認(rèn)為該系數(shù)對應(yīng)的自變量與因變量之間存在顯著的線性關(guān)系。否則,就接受原假設(shè),認(rèn)為該自變量與因變量之間不存在顯著性的線性關(guān)系。 擬合優(yōu)度檢驗(yàn) 擬合優(yōu)度檢驗(yàn)用與檢驗(yàn)回歸方程對樣本觀測值的擬合程度,定義樣本決定系數(shù)時(shí),就需22RR 加以修正,理由方差之比得調(diào)整后的為要對 SSE/(n-p-1) 2?1R? )n-1/(SST 2R 在線性回歸中越大越好。 共線性診斷這里提供一些經(jīng)

11、現(xiàn)在還沒有一個(gè)統(tǒng)一的診斷標(biāo)準(zhǔn),如何診斷模型是否存在多重共線性,自. t. 判定系數(shù)很高的同時(shí),針對回歸系數(shù)的檢驗(yàn)統(tǒng)計(jì)量的值又偏小驗(yàn)的診斷規(guī)則:2R很高的同時(shí),因變量與自變量之間的變量之間有高度的線性相關(guān)關(guān)系. 回歸方程的、方差比、膨脹因子、容許度這些. 特征值、病態(tài)指數(shù)(條件數(shù))偏相關(guān)系數(shù)卻很低 統(tǒng)計(jì)量都可以用來診斷多重共線性 殘差分析? 的正態(tài)性假定;進(jìn)行殘差分析有兩個(gè)目的,一是證實(shí)關(guān)于模型中誤差項(xiàng)隨機(jī)變量i也是最基本的二是檢驗(yàn)數(shù)據(jù)集中可能包含的異常值殘差分析是回歸分析的最后一項(xiàng)工作, 一項(xiàng)工作 3.回歸模型建立的步驟 確定回歸方程中的解釋變量和被解釋變量 因此回歸分析的第一步由于回歸分析用

12、于分析一個(gè)事物如何隨其他事物的變化而變化,;哪些事物是用于解)應(yīng)確定哪個(gè)事物是需要被解釋的,即哪個(gè)變量是被解釋變量(記為y。在多元線性回歸分析中,模型中應(yīng)引入)釋其他變量的,即哪些變量是解釋變量(記為x回歸方程將無法很好地解釋說如果引入的解釋變量較少,多少解釋變量是需要重點(diǎn)研究的。因?yàn)檫@些變量之間可能存在多重但是也并非引入解釋變量越多越好,明被解釋變量的變化。在多元的回歸分析因此要采取一些策略對解釋變量引入回歸方程加以控制和篩選。共線性。挑選自因此就存在著挑選自變量的問題,中并不是所有的變量都對因變量具有顯著的影響, 變量有多種方法:前進(jìn)法、后退法、逐步篩選法等。這里主要采用后退法挑選自變量。

13、后退法策略是解釋變量不斷剔除出回歸方程的過程。首先,所有的解釋變量全部引入回歸方程,并對回歸方程進(jìn)行各種檢驗(yàn)。然后,在回歸系數(shù)并重新建立回歸方t剔除檢驗(yàn)值最小的解釋變量,顯著性檢驗(yàn)不顯著的一個(gè)或多個(gè)變量中,并重新建立回歸方程和進(jìn)行各種檢程和進(jìn)行各種檢驗(yàn)。如果新建回歸方程中說有解釋變量,否則,如果新建回歸方程中說有解釋變量的回歸系數(shù)檢驗(yàn)都顯著,則回歸方程建立結(jié)束。驗(yàn)。 按照上述方法再一次剔除最不顯著的解釋變量,直到再也沒有可剔除的解釋變量為止 確定回歸模型如果被解通過觀察散點(diǎn)圖確定應(yīng)通過哪種教學(xué)模型來概括回歸線。根據(jù)函數(shù)擬合方式,釋變量和解釋變量之間存在線性關(guān)系,則應(yīng)進(jìn)行線性回歸分析,建立線性回

14、歸模型;反之,建立非線性回則應(yīng)進(jìn)行非線性回歸分析,如果被解釋變量和解釋變量之間存在非線性關(guān)系, 歸模型。 建立回歸模型 根據(jù)手機(jī)到樣本數(shù)據(jù)以及上一步所確定的回歸模型,在一定得統(tǒng)計(jì)擬合準(zhǔn)則下估計(jì)出模 型中的各個(gè)參數(shù),得到一個(gè)確定的回歸方程。 對回歸方程進(jìn)行各種檢驗(yàn) 各種檢驗(yàn)方法在前文中已經(jīng)涉及,在此不在一一說明。 利用方程進(jìn)行回歸預(yù)測 建立回歸方程的目的之一是根據(jù)回歸方程對事物的未來發(fā)展趨勢進(jìn)行預(yù)測。 四、實(shí)驗(yàn)數(shù)據(jù)與實(shí)驗(yàn)結(jié)果 、數(shù)據(jù)的收集和處理通過圖書館查閱資料以及網(wǎng)絡(luò)查詢資料等方式采集了山東省統(tǒng)計(jì)年鑒(2010)中有關(guān)各市農(nóng)村居民指標(biāo)(2009)的數(shù)據(jù)。分析過程中,一般利用了Eviews,sp

15、ss等統(tǒng)計(jì)軟件進(jìn)行統(tǒng)計(jì)分析。農(nóng)村人均總收入與總支出應(yīng)用一元線性回歸模型分析數(shù)據(jù);城鄉(xiāng)差異應(yīng)用折線圖軟件進(jìn)行聚類分析的處理;消費(fèi)的不同類別應(yīng)用SPSS來展現(xiàn);各城市之間的地區(qū)差異運(yùn)用 因子分析法處理數(shù)據(jù)并得出結(jié)論;收入和支出模型的建立利用了后退法篩選變量并做出回歸分析,同時(shí)用散點(diǎn)圖直觀展現(xiàn)其線性關(guān)系。 、數(shù)據(jù)分析 (一)收入和支出的概況分析 (1)收入支出隨時(shí)間的增長趨勢 表21-1(a)2000年至2009年山東省農(nóng)村居民人均總收入 年份 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 人均總收 入3872.22 4138.61 4305.7

16、7 4482.15 5037.52 5037.52 5037.52 7150.28 8136.66 8683.22 通過上表信息,利用Eviews進(jìn)行一元線性回歸分析,得到如下結(jié)果 表21-1(b)人均總收入線性回歸結(jié)果 Dependent Variable: Y Method: Least Squares Date: 12/09/11 Time: 16:09 Sample: 2000 2009 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 2724.857 299.5539 9.09

17、6385 0.0000 X 553.1632 48.27748 11.45800 0.0000 R-squared 0.942564 Mean dependent var 5767.255 Adjusted R-squared 0.935385 S.D. dependent var 1725.057 S.E. of regression 438.5020 Akaike info criterion 15.18146 Sum squared resid 1538272. Schwarz criterion 15.24198 Log likelihood -73.90731 F-statistic

18、 131.2857 Durbin-Watson stat 0.479131 Prob(F-statistic) 0.000003 $xy =2724.857+553.1632由表知回歸模型為:,回歸模型的斜率是553.1632,表明每增長一年,人均純收入增加553.1632元。 從上表中R-squared為0.942564,說明擬合優(yōu)度比較高;Prob(F-statistic)為0.000003,說明方程顯著地。2724.857所對應(yīng)的Prob( t-Statistic)為0.0000,在顯著性水平0.05的條件下是顯著的,回歸系數(shù)553.1632所對應(yīng)的Prob( t-Statistic)為

19、0.0000,說明是顯著的。 山東省農(nóng)民的收入水平是隨著我國經(jīng)濟(jì)發(fā)展而快速增長的一個(gè)過程,以2000 年為基期,如圖 所示,山東農(nóng)民在 2000 年時(shí)候的人均純收入水平是 3872.22元, 到 2009 年的時(shí)候,山東省農(nóng)民的人均總收入水平已經(jīng)達(dá)到了 8683.22元。十年間,山東省農(nóng)民的收入一共增加了 4811.00 元,收入增長了約 2.24倍??傮w來講,山東省農(nóng)民的收入一直是呈增加的趨勢的。 2009 2008 2007 2006 2005 2004 2003 2002 2001 2000 年份 每均平年人全出總支 (元)3036.20 3326.79 3438.78 3521.42.

20、 .3999.23 4561.27 5059.48 5863.21 6697.38 7258.17 年山東省農(nóng)村居民人均總支出及分析結(jié)果2000年至2009表21-1(c) )人均總支出回歸結(jié)果(d表21-1 Dependent Variable: Y Method: Least Squares Time: 16:31 Date: 12/09/11 Sample: 2000 2009 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 2046.519 272.7071 7.504458 0

21、.0001 X 478.6862 43.95072 10.89143 0.0000 R-squared 0.936820 Mean dependent var 4679.293 Adjusted R-squared 0.928923 S.D. dependent var 1497.368 S.E. of regression 399.2023 Akaike info criterion 14.99367 Sum squared resid 1274900. Schwarz criterion 15.05419 Log likelihood -72.96835 F-statistic 118.6

22、233 Durbin-Watson stat 0.435934 Prob(F-statistic) 0.000004 $xy =2046.519+478.6862478.6862,回歸模型的斜率是表明每增由表知回歸模型為: 元。長一年,人均純支出增加478.6862為,說明擬合優(yōu)度比較高;0.936820Prob(F-statistic) 從上表中R-squared為,在顯著)為0.0001,說明方程顯著地。2046.519所對應(yīng)的Prob( t-Statistic0.000004,0.0000t-Statistic)為所對應(yīng)的性水平0.05的條件下是顯著的,回歸系數(shù)478.6862Prob(

23、 說明是顯著的。年為基2000山東省農(nóng)民的支出水平也是隨著我國經(jīng)濟(jì)發(fā)展而快速增長的一個(gè)過程,以年的時(shí)元,到3036.202009期,如表所示,山東農(nóng)民在 2000 年時(shí)候的人均總支出水平是 十年間,山東省農(nóng)民的收入一共候,山東省農(nóng)民的人均總支出水平已經(jīng)達(dá)到了7258.17元。山東省農(nóng)民的收入一直是呈增總體來講, 2.39 倍。元,增加了4221.97支出增長了約 加的趨勢的。 )收入支出的城鄉(xiāng)差異2( 21-1(d)農(nóng)村人均總收入總支出 表年2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 份8683.8總3872.24138.66188.54

24、305.78136.64482.15037.57150.25676.92 8 收2 1 2 7 4 5 8 6 入7258.1總3036.23999.23326.75090.45863.23438.74561.26697.33521.47 支0 8 9 7 3 2 8 8 1 出表21-1(e)城鎮(zhèn)人人均總收入總支出 2001 2002 2003 年2000 2004 2005 2006 2007 2008 2009 份19336總13222153668158.7141.101879057.1754810744 16 .26 .91 .79 6521.613 .85 .97 58 .12 收入

25、 總5596.7457.9666.110068468.6069.6673.120125022.5252.支4 .61 31 .73 35 61 75 43 00 42出 由表可知:城鎮(zhèn)收入支出和農(nóng)村收入的變化速度都是隨著年份的增加由緩慢逐漸增快,但是城鎮(zhèn)明顯的收入支出比農(nóng)村的收入要快,而且隨著時(shí)間的增加,城鎮(zhèn)與農(nóng)村的差距越來越大,但總體都是增長的較快。 (3)收入支出的地區(qū)差異 這里利用附錄中的關(guān)于山東省17個(gè)地區(qū)的收入支出表,進(jìn)行聚類分析和因子分析,從而得到不同地區(qū)之間收入支出的差異和不同的支出指標(biāo)之間的差異。 (一)利用聚類分析處理17個(gè)地區(qū)之間的收入差異 利用spss軟件處理得到的結(jié)果如

26、下: 圖4-2 山東省17個(gè)市的年純收入的聚類分析結(jié)果 Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 13 臨沂 16 濱州 14 德州 11 日照 4 棗莊 8 濟(jì)寧 15 聊城 17 菏澤 9 泰安 5 東營 12 萊蕪 6 煙臺 7 濰坊 1 濟(jì)南 2 青島 10 威海 淄博 3 這里,利用SPSS層次聚類的Q型聚類對山東17個(gè)市區(qū)進(jìn)行分析。其中,個(gè)體距離采用平方歐式距離,類間距離采用組間平均連鎖距離,由于數(shù)據(jù)不存在數(shù)量級上的差異,因此無須進(jìn)行標(biāo)準(zhǔn)化處理。生成的聚類分析樹形圖

27、如圖4-2所示,其他結(jié)果略去。 通過分析歸納,認(rèn)為分為三類比較合適,煙臺,濰坊,濟(jì)南,青島,威海地理位置也是比較近,都位于山東的東北部,之間的地理特點(diǎn),文化風(fēng)俗,經(jīng)濟(jì)主體相似,都是山東的重要城市,經(jīng)濟(jì)發(fā)展水平較高。大都是沿海城市,有利于經(jīng)濟(jì)的發(fā)展,所以收入普遍肩高。淄博年純收入較高,可以這樣解釋,淄博是山東乃至全國重要的重化工業(yè)基地,工業(yè)發(fā)展以石油化工、醫(yī)藥、建材、冶金、紡織、機(jī)械、陶瓷等行業(yè)為骨干,門類齊全,特色鮮明,比較優(yōu)勢突出。,淄博依靠工業(yè)發(fā)展迅速,經(jīng)濟(jì)水平較高,年純收入較高。 (二)利用聚類分析處理17個(gè)地區(qū)之間的支出差異 利用spss軟件處理數(shù)據(jù)得到結(jié)果如下: 圖 4-1 山東省

28、17個(gè)市區(qū)各種支出情況的聚類分析結(jié)果 Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ 8 濟(jì)寧 13 臨沂 17 菏澤 4 棗莊 11 日照 9 泰安 12 萊蕪 14 德州 15 聊城 16 濱州 濟(jì)南 1 濟(jì)南 5 東營 6 煙臺 3 淄博 10 威海 7 濰坊 青島 青島 2 這里,利用SPSS層次聚類的Q型聚類對山東17個(gè)市區(qū)進(jìn)行分析。其中,個(gè)體距離采用平方歐式距離,類間距離采用組間平均連鎖距離,由于數(shù)據(jù)不存在數(shù)量級上的差異,因此無須進(jìn)行標(biāo)準(zhǔn)化處理。生成的聚類分析樹形圖如圖4

29、-1所示,其他結(jié)果略去。 通過分析歸納,分為三類比較合適:濟(jì)南,東營,煙臺,淄博,威海,濰坊為一類,這些地區(qū)大致位于山東省的東北部,它們之間聯(lián)系大,所以經(jīng)濟(jì),文化等相互影響,支出水平差不多。濟(jì)寧,臨沂,菏澤,棗莊,日照,泰安,萊蕪,德州,聊城為一類,也可以很好解釋,這些地區(qū)位于山東省的西南方,比較東部沿海的幾個(gè)城市有著一定的差距,所以與第一類可以區(qū)分開成為另一類。青島自成一類,青島市位于沿海,有著較強(qiáng)的地理優(yōu)勢,對經(jīng)濟(jì)的發(fā)展相當(dāng)有利,生活水平支出水平較高,在全省比較突出,所以歸為一類。 二、收入的消費(fèi)分配回歸分析 根據(jù)山東省統(tǒng)計(jì)年鑒(2009年)提供的各地區(qū)農(nóng)村居民家庭平均每人按來源分的純收入

30、數(shù)據(jù),選取總收入和四項(xiàng)收入來源指標(biāo)作為分配來源我們把Y作為全年純收入,Y1為工資性純收入,Y2為家庭經(jīng)營性純收入,Y3為財(cái)產(chǎn)性純收入,Y4為轉(zhuǎn)移性收入。再選取 8 個(gè)反映消費(fèi)支出的指標(biāo)為消費(fèi)分配的去向:x1食品支出,x2 衣著支出,x3居住支出,x4 家庭設(shè)備及服務(wù)支出, x5醫(yī)療保健支出,x6 交通和通訊支出 ,x7文教和娛樂用品及服務(wù)支出,x8 其他商品及服務(wù)支出下面我們將利用后退法分別進(jìn)行回歸分析。 全年純收入Y與各項(xiàng)支出指標(biāo)之間的回歸分析 這里利用spss軟件處理數(shù)據(jù),觀測每一步檢驗(yàn)的變化情況,并進(jìn)行殘差分析和異常點(diǎn) 探測,分析結(jié)果如表所示: 表22-1(a) 多元線性回歸分析結(jié)果(向

31、后篩選策略) g Model SummaryModel R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1 2 3 4 5 6 a.958b.958c.957d.956e.953f.948.917 .917 .916 .914 .907 .899 .835 .853 .865 .874 .877 .876 505.52093 476.95081 457.08662 440.81385 436.65116 437.72183 1.334 a. Predictors: (Constant), 其他商品和服務(wù)

32、消費(fèi), 醫(yī)療保健消費(fèi), 家庭設(shè)備用品消費(fèi), 交通和通訊消費(fèi), 衣著消費(fèi), 居住消費(fèi), 文化教育娛樂消費(fèi), 食品消費(fèi) b. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 家庭設(shè)備用品消費(fèi), 交通和通訊消費(fèi), 衣著消費(fèi), 文化教育娛樂消費(fèi), 食品消費(fèi) c. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 交通和通訊消費(fèi), 衣著消費(fèi), 文化教育娛樂消費(fèi), 食品消費(fèi) d. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 交通和通訊消費(fèi), 衣著消費(fèi), 文化教育娛樂消費(fèi) e. Predict

33、ors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 交通和通訊消費(fèi), 衣著消費(fèi) f. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 衣著消費(fèi) g. Dependent Variable: 全年純收入 表22-1(b)最終方程線性回歸檢驗(yàn) g ANOVAModel Sum of Squares df Mean Square F Sig. Regression 6 Residual Total 2.224E7 2490805.224 2.473E7 Unstandardized Coefficients 3 13 16 Coefficie

34、nts7411694.408 191600.402 a Standardized Coefficients 38.683 .000 f. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 衣著消費(fèi) 全年純收入g. Dependent Variable: Beta t Std. Error B Model Sig. 下表省略了前五步,只留下第六步的最終模型 )多元線性回歸分析結(jié)果c(22-1表 a CoefficientsStandardized Unstandardized Coefficients Coefficients Beta t Sig. Mode

35、l B Std. Error .000 6 (Constant) 4030.718 8.749 460.703 衣著消費(fèi).000 1.361 .940 7.766 10.573 醫(yī)療保健消費(fèi).004 1.322 .333 4.632 3.504 其他商品和服務(wù)消費(fèi).009 -3.092 -18.466 -.352 5.972 a. Dependent Variable: 全年純收入由上表可知,利用后退法共經(jīng)過六部完成回歸方程的建立,最終模型為第六個(gè)模型。模型依次剔除了居住消費(fèi)、家庭設(shè)備用品消費(fèi)、食品消費(fèi)和文化教育娛樂消費(fèi),保留了衣著消費(fèi)、醫(yī)療保健消費(fèi)、其他商品和服務(wù)消費(fèi)。由表2-1(b)(c)

36、可知,回歸方程顯著性檢驗(yàn)和最終方程的回歸系數(shù)顯著性檢驗(yàn)的概率p值遠(yuǎn)小于顯著水平a(a為0.05),因此三個(gè)解釋變量和被解釋變量間的線性關(guān)系顯著,其留在模型中是合理的。所以可以得到的最終回歸方程為 Y=4030.718+10.573*衣著消費(fèi)+4.632*醫(yī)療保健消費(fèi)-18.466*其他商品和服務(wù)消費(fèi), 即為Y=4030.718+10.573*x2+4.632*x5-18.466*x8。該方程意味著全年純收入主要與衣著消費(fèi),醫(yī)療保健消費(fèi)呈正相關(guān),與其他商品和服務(wù)消費(fèi)呈負(fù)相關(guān),可以通過散點(diǎn)圖看出,如圖22-1(d)。 而且從標(biāo)準(zhǔn)化后的方程(Y=0.940*x2+0.333*x5-0.352*x8)

37、可以看出單位收入主要流向了衣著消費(fèi)(0.94)和醫(yī)療保?。?.333),說明農(nóng)村居民的基本消費(fèi)趨向還主要停留在自身基本狀況的需要上;作為其他商品和服務(wù)消費(fèi)(-0.352),系數(shù)為負(fù),說明這項(xiàng)消費(fèi)遠(yuǎn)遠(yuǎn)低于農(nóng)村居民的基本消費(fèi)指標(biāo)。 圖22-1(d) 全年純收入分別和衣著消費(fèi)、醫(yī)療保健消費(fèi)、其他商品和服務(wù)消費(fèi)的散點(diǎn)圖 2 工資性純收入Y1、家庭經(jīng)營性純收入Y2、財(cái)產(chǎn)性純收入Y3、轉(zhuǎn)移性純收入Y4與支出各項(xiàng)指標(biāo)之間的線性回歸 這里同樣利用后退法進(jìn)行回歸分析,利用SPSS軟件可以分別得到相應(yīng)的回歸分析結(jié)果,并通過后退法回歸后,得到其散點(diǎn)圖,如下所示: 表22-2(a)工資性純收入與支出指標(biāo)的回歸分析結(jié)果

38、 a CoefficientsUnstandardized Standardized Coefficients Coefficients Beta Std. Error t Sig. B Model .109 365.756 (Constant) 625.478 1.710 7 衣著消費(fèi).000 .983 4.525 .638 4.605 醫(yī)療保健消費(fèi).010 1.214 2.971 3.608 .412 a. Dependent Variable: 工資性純收入 (a1) (a2) 勞動法中的工資是指用人單位依據(jù)國家有關(guān)規(guī)定或勞動合同的約定,以貨幣形式直接支付給本單位勞動者的勞動報(bào)酬,一般包

39、括計(jì)時(shí)工資、計(jì)件工資、資金、津貼和補(bǔ)貼、延長工作時(shí)間的工資報(bào)酬以及特殊情況下支付的工資等。工資是勞動者勞動收入的主要組成部分。 通過觀察標(biāo)準(zhǔn)化后的各項(xiàng)數(shù)據(jù)可知P值小于0.05,所以工資性純收入與衣著消費(fèi),醫(yī)療保健消費(fèi)線性顯著;由散點(diǎn)圖樂意看出它們之間存在正相關(guān)。 寫出標(biāo)準(zhǔn)化后的回歸方程Y1(工資性純收入)=0.638*x1(衣著)+0.412*x5(醫(yī)療保?。?,一單位的衣著消費(fèi)需要0.638個(gè)單位的工資性純收入,一單位的醫(yī)療保健消費(fèi)需要0.412個(gè)單位的工資性純收入;工資性收入是農(nóng)民最主要最基本的收入來源,衣著也是其重要消費(fèi)方式,當(dāng)工資提高時(shí),人們會提高對衣著的需求和醫(yī)療保健的支出。 22-2

40、(b)家庭經(jīng)營性純收入與支出指標(biāo)的回歸分析結(jié)果表 a CoefficientsStandardized Unstandardized Coefficients Coefficients Beta t Sig. Model B Std. Error .001 8 (Constant) 2123.285 4.038 525.764 交通和通訊消費(fèi).010 2.998 1.012 .608 2.962 家庭經(jīng)營純收入a. Dependent Variable: (b) 經(jīng)營性收入(Operational Income)是指納稅人通過經(jīng)常性的生產(chǎn)經(jīng)營活動而取得的收益,即企業(yè)在銷售貨物、提供勞務(wù)以及讓渡

41、資產(chǎn)使用權(quán)等日?;顒又兴a(chǎn)生的收入,通常表現(xiàn)為現(xiàn)金流入、其他資產(chǎn)的增加或負(fù)債的減少。 由表可知P值小于0.05,認(rèn)為家庭經(jīng)營性收入與交通和通訊消費(fèi)線性關(guān)系顯著;由圖可以很好看出他們之間成正相關(guān)。 標(biāo)準(zhǔn)化后的回歸方程Y2(經(jīng)營性收入)=0.608*x6(交通通訊),增加一單位的交通通訊消費(fèi)需要0.608個(gè)單位的經(jīng)營性收入;增加一單位的經(jīng)營性收入用于0.608個(gè)單位的交通通訊消費(fèi);經(jīng)營性收入不是農(nóng)民普遍的收入方式,因?yàn)樾枰欢ǖ某杀?,并且收入高。他們的生活條件也相應(yīng)較好,從而會增加享受消費(fèi),如度假旅游,購買手機(jī)等通訊設(shè)備。 表22-2(c)財(cái)產(chǎn)性純收入與支出指標(biāo)的回歸分析結(jié)果 .796 (Cons

42、tant) 8 -15.136 57.584 -.263 醫(yī)療保健消費(fèi).000 .204 .757 .913 4.481 財(cái)產(chǎn)純收入a. Dependent Variable: (c) 財(cái)產(chǎn)性收入,指通過資本、技術(shù)和管理等要素與社會生產(chǎn)和生活活動所產(chǎn)生的收入。即家庭擁有的動產(chǎn)(如銀行存款、有價(jià)證券)和不動產(chǎn)(如房屋、車輛、收藏品等)所獲得的收入。包括出讓財(cái)產(chǎn)使用權(quán)所獲得的利息、租金、專利收入;財(cái)產(chǎn)營運(yùn)所獲得的紅利收入、財(cái)產(chǎn)增值收益等。 由表可知檢驗(yàn)的P值為0.000認(rèn)為財(cái)產(chǎn)性收入與醫(yī)療保健消費(fèi)線性相關(guān)關(guān)系顯著;同樣圖也能看出之間呈正相關(guān)。 由表可以寫出其標(biāo)準(zhǔn)化后的回歸方程為Y3(財(cái)產(chǎn)性純收入)

43、=0.757*x5(醫(yī)療保健消費(fèi)),可以這樣解釋,一單位的財(cái)產(chǎn)性收入的百分之75.7用于醫(yī)療保健消費(fèi),說明財(cái)產(chǎn)性收入的大部分用于醫(yī)療保健支出;同樣支出一單位的醫(yī)療保健消費(fèi)需要從財(cái)產(chǎn)性純收入中支付0.757個(gè)單位。 通過財(cái)產(chǎn)性收入的定義范圍可以理解兩者之間的關(guān)系,對于家庭比較富裕的農(nóng)民來說,他們會有剩余的錢存入銀行獲得利息收入和出租房屋車輛等的收入。由于醫(yī)療保健不屬于必須消費(fèi),所以在生活比較寬裕的情況下此種消費(fèi)會隨之提高,這一回歸方程很符合現(xiàn)實(shí)情況。 表22-2(d)轉(zhuǎn)移性純收入與支出指標(biāo)的回歸分析結(jié)果 a CoefficientsStandardized Unstandardized Coef

44、ficients Coefficients Beta t Sig. Model B Std. Error .007 8 (Constant) 145.814 3.155 46.221 醫(yī)療保健消費(fèi).039 .369 .164 .503 2.256 轉(zhuǎn)移性純收入a. Dependent Variable: (d) 轉(zhuǎn)移性收入就是指國家、單位、社會團(tuán)體對居民家庭的各種轉(zhuǎn)移支付和居民家庭間的收入轉(zhuǎn)移。包括政府對個(gè)人收入轉(zhuǎn)移的離退休金、失業(yè)救濟(jì)金、賠償?shù)?單位對個(gè)人收入轉(zhuǎn)移的辭退金、保險(xiǎn)索賠、住房公積金、家庭間的贈送和贍養(yǎng)等。 由表可知檢驗(yàn)的P值小于0.05,認(rèn)為轉(zhuǎn)移性收入與醫(yī)療保健之間線性相關(guān),通過

45、圖也可以看出之間存在正相關(guān)。 標(biāo)準(zhǔn)化后的回歸方程為Y4(轉(zhuǎn)移性收入) =0.503*x5(醫(yī)療保健),這個(gè)很好解釋了現(xiàn)實(shí)情況,很符合現(xiàn)實(shí)狀況,轉(zhuǎn)移性收入的獲得者大都是退休老人,失業(yè)或者有疾病生理缺陷的群體,他們對身體健康相對重視,從而對醫(yī)療保健消費(fèi)比較重視 。 綜上,通過山東省農(nóng)村居民收入的消費(fèi)分配的回歸分析,得出:山東省農(nóng)村居民的收入還這說明農(nóng)村居民的收入還主要用于生活基本消費(fèi),主要流向了衣著消費(fèi)和醫(yī)療保健消費(fèi), 無法像城鎮(zhèn)居民那樣享受更多的消費(fèi)服務(wù)。從一側(cè)面反映了山東省的城鄉(xiāng)差距依然十分嚴(yán)峻,需要更多地關(guān)注農(nóng)村居民的基本生活,提高農(nóng)村居民的生活水平,刺激農(nóng)村居民的消費(fèi)能力,從而達(dá)到全省經(jīng)濟(jì)

46、水平的全面提升。 五、心得體會 經(jīng)過兩周的努力,我們終于完成了這篇實(shí)驗(yàn)報(bào)告的寫作。作為統(tǒng)計(jì)專業(yè)的學(xué)生,這是我們第一次實(shí)質(zhì)性地做有關(guān)自己專業(yè)的報(bào)告實(shí)踐。過程雖然不是十分順利,但卻讓我們受益匪淺。寫作過程可謂是一波三折:在選擇模型時(shí)選擇哪個(gè)模型比較合適,在查找數(shù)據(jù)時(shí)數(shù)據(jù)的選擇、以及整理都遇到了不小的問題。上交初稿之后,老師給我們提出了很多問題:論文結(jié)構(gòu)問題;論文內(nèi)容的組織問題以及模型建立的合理性問題等等。當(dāng)時(shí)說實(shí)話,感覺很失敗、很沮喪。最后我們大家還是相互鼓勵(lì),按照老師的要求一步一步地將自己的錯(cuò)誤進(jìn)行了更正,將實(shí)驗(yàn)報(bào)告完善起來。 綜合這次實(shí)踐過程,我們學(xué)到了很多:首先,我們熟悉掌握了論文中幾種模型的原理和處理方法,將自己的所學(xué)運(yùn)用到了實(shí)踐過程中;其次,通過這次實(shí)驗(yàn)設(shè)計(jì),我們對EXCEL、SPSS軟件以及Eviews等統(tǒng)計(jì)軟件的操作和應(yīng)用更加熟練,為以后的學(xué)習(xí)建立了良好的基礎(chǔ);再次,我們清楚的明白了想要做好一件事,僅僅一個(gè)人是不夠的,這需要隊(duì)友的配合。在一個(gè)團(tuán)隊(duì)之中,只有更好的配合好,才會做出更好成績。 參考文獻(xiàn) 1沈黎華.影響居民家庭現(xiàn)金

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論