多元統(tǒng)計(jì)課程設(shè)計(jì)張燦_第1頁(yè)
多元統(tǒng)計(jì)課程設(shè)計(jì)張燦_第2頁(yè)
多元統(tǒng)計(jì)課程設(shè)計(jì)張燦_第3頁(yè)
多元統(tǒng)計(jì)課程設(shè)計(jì)張燦_第4頁(yè)
多元統(tǒng)計(jì)課程設(shè)計(jì)張燦_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多元統(tǒng)計(jì)分析課程設(shè)計(jì) 多元統(tǒng)計(jì)分析 課程設(shè)計(jì)題 目: 結(jié)合聚類分析及回歸分 析的方法和應(yīng)用 學(xué) 院: 理學(xué)院 班 級(jí): 數(shù)學(xué)11-1班 學(xué) 生 姓 名: xxxx 學(xué) 生 學(xué) 號(hào): xxxx 指 導(dǎo) 教 師: xxxxxx 2014年 6月 5 日課程設(shè)計(jì)任務(wù)書(shū)姓名xxxx班級(jí)xxxxxx學(xué)號(hào)xxxx設(shè)計(jì)題目結(jié)合聚類分析及回歸分析的方法和應(yīng)用理論要點(diǎn)通過(guò)結(jié)合回歸分析及聚類分析對(duì)實(shí)際問(wèn)題進(jìn)行分析,利用系統(tǒng)聚類法即最短距離法,最長(zhǎng)距離法,重心法,離差平方和法等,以統(tǒng)一形式的遞推公式:對(duì)距離的不同定義,將各指標(biāo)量之間的樣品以不同的距離分開(kāi)進(jìn)行聚類,根據(jù)想要?jiǎng)澐值念悢?shù),即可達(dá)到分類的要求。設(shè)計(jì)目標(biāo)以對(duì)

2、聚類分析及回歸分析的理論要點(diǎn)的學(xué)習(xí),將實(shí)際問(wèn)題轉(zhuǎn)化為應(yīng)用多元統(tǒng)計(jì)分析的具體問(wèn)題,運(yùn)用聚類分析的知識(shí),熟練使用聚類分析軟件命令,及運(yùn)用聚類分析的方法解決實(shí)際問(wèn)題,實(shí)現(xiàn)對(duì)問(wèn)題的分類和解讀,達(dá)到分類的真正目標(biāo)。研究方法步驟1深入的學(xué)習(xí)聚類分析的相關(guān)知識(shí),掌握各種距離計(jì)算的方法。2借閱相關(guān)書(shū)籍,了解多元統(tǒng)計(jì)的相關(guān)解決方法。3根據(jù)樣品變量估計(jì)分類的數(shù)量,及相應(yīng)的分類結(jié)果。4運(yùn)用Eviews,spss軟件,解決實(shí)際問(wèn)題,進(jìn)行分類。預(yù)期結(jié)果運(yùn)用Eviews,spss軟件實(shí)現(xiàn)實(shí)際問(wèn)題的分類過(guò)程,得到相應(yīng)的圖表,使問(wèn)題更加簡(jiǎn)潔明了,易于分析并提出解決辦法。計(jì)劃與進(jìn)步的安排課程安排一周,分四次完成:第一次(1-2

3、天):上網(wǎng)搜查有關(guān)的資料,并開(kāi)始考慮設(shè)計(jì)的方法:第二次(3-4天):寫(xiě)論文的前言、摘要、以及理論依據(jù)部分:第三次(4-6天):寫(xiě)論文的問(wèn)題描述、問(wèn)題分析以及求解計(jì)算部分:第四次(7天):寫(xiě)論文的結(jié)論部分以及最后的審核和排版、打印等。摘要 本文通過(guò)回歸分析、聚類分析等多種分析手段,以系統(tǒng)聚類法有最短距離法、最長(zhǎng)距離法、重心法、類平均法、中間距離法、可變類平均法、可變法、李差平方和法等,通過(guò)收入支出的時(shí)間序列模型的分析給出了從2000到2009年的農(nóng)村收入支出呈現(xiàn)的增長(zhǎng)趨勢(shì),以及城鄉(xiāng)之間的對(duì)比;然后利用聚類分析說(shuō)明了收入支出的地區(qū)差異通過(guò)給定的分類情況,可將各省糧食產(chǎn)量情況的各項(xiàng)指標(biāo)綜合得到四至七

4、類,在這些分類中,可以充分的體現(xiàn)各指標(biāo)之間的關(guān)系,鮮明形象的體現(xiàn)了聚類分析的優(yōu)勢(shì)。然后利用回歸分析建立了黑龍江省農(nóng)村居民收入與支出之間的模型,試圖尋找出農(nóng)村居民收入的消費(fèi)分配現(xiàn)狀,即單位收入的支出方向問(wèn)題。 本實(shí)驗(yàn)充分掌握和運(yùn)用多元統(tǒng)計(jì)分析的統(tǒng)計(jì)方法,能夠利用基本的統(tǒng)計(jì)軟件如Eviews、Spss等軟件處理分析數(shù)據(jù),并對(duì)結(jié)果作出合理的解釋。了解近幾年來(lái)山東省農(nóng)村居民收入支出的基本狀況,其中包括城鄉(xiāng)差距問(wèn)題和居民收入的消費(fèi)分配問(wèn)題,進(jìn)而掌握黑龍江省農(nóng)村居民的基本生活狀況,為我省經(jīng)濟(jì)的長(zhǎng)遠(yuǎn)發(fā)展提供依據(jù)。關(guān)鍵詞:系統(tǒng)聚類 聚類分析 回歸分析 多元統(tǒng)計(jì)分析 3目錄一 基本理論基礎(chǔ)1(一)聚類分析的背景

5、和原理1(二)回歸分析的背景和原理1二 問(wèn)題描述2三 問(wèn)題分析3(一)收入和支出的概況分析3(二)收入支出的城鄉(xiāng)差異5(三)收入支出的地區(qū)差異6四 計(jì)算求解6(一)利用聚類分析分類收入差異6(二)利用回歸分析分配收入消費(fèi)8五 心得體會(huì)14六 參考文獻(xiàn)144 多元統(tǒng)計(jì)分析課程設(shè)計(jì)結(jié)合聚類分析及回歸分析的方法和應(yīng)用一 基本理論基礎(chǔ)(一)聚類分析的背景和原理1,聚類分析的定義 聚類分析是統(tǒng)計(jì)學(xué)中研究“物以類聚”問(wèn)題的多元統(tǒng)計(jì)分析方法。聚類分析又稱群分析,它是研究對(duì)樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)方法。所謂的“類”,通俗地說(shuō)就是相似元素的集合。2,聚類的方法分類聚類分析的內(nèi)容十分豐富,按其聚類的方法可

6、分為以下幾種:系統(tǒng)聚類法、調(diào)優(yōu)法、最優(yōu)分割法、模糊聚類法、圖論聚類法、聚類預(yù)報(bào)法。本文中應(yīng)用的是系統(tǒng)聚類法:開(kāi)始每個(gè)對(duì)象自成一類,然后每次將最相似的兩類合并,合并后重新計(jì)算新類與其他類的距離或相近性測(cè)度,這一過(guò)程一直繼續(xù)直到所有對(duì)象歸為一類為止。并類的過(guò)程可用一張譜系聚類圖描述。3,系統(tǒng)聚類法的基本步驟 (1)計(jì)算n個(gè)樣品兩兩間的距離,得樣品間的距離矩陣。類與類之間的距離本文應(yīng)用的是類平均法。所謂類平均法就是:兩類樣品兩兩之間平方距離的平均作為類之間的距離,即: 采用這種類間距離的聚類方法,稱為類平均法。 (2) 初始(第一步:i=1)n個(gè)樣本各自構(gòu)成一類,類的個(gè)數(shù)k=n,第t類 (t=1,2

7、···,n)。此時(shí)類間的距離就是樣品間的距離(即)。 (3)對(duì)步驟i得到的距離矩陣,合并類間距離最小的兩類為一新類。此時(shí)類的總個(gè)數(shù)k減少1類,即k=n-i+1. (4)計(jì)算新類與其他類的距離,得新的距離矩陣。若合并后類的總個(gè)數(shù)k扔大于1,重新步驟(3)和(4);直到類的總個(gè)數(shù)為1時(shí)轉(zhuǎn)到步驟(5)。 (5)畫(huà)譜系聚類圖; (6)決定總類的個(gè)數(shù)及各類的成員。(二)回歸分析的背景和原理1,回歸分析的基本原理 回歸分析是研究?jī)蓚€(gè)或多個(gè)變量之間關(guān)系的統(tǒng)計(jì)分析方法,在實(shí)際問(wèn)題中,因變量 y 往往不是只與一個(gè)變量有關(guān),而是和多個(gè)變量有關(guān) ,設(shè) (3.1)其中是p+1個(gè)未知參數(shù),

8、稱為回歸常數(shù),稱為回歸系數(shù),y為被解釋變量(因變量),而是p個(gè)可以精確測(cè)量并可控制的一般變量,稱為解釋變量(自變量), 是隨機(jī)誤差.稱 (3.2)為理論回歸方程。利用最小二乘原理就是求一個(gè)參數(shù)向量的估計(jì),使得回歸的殘差平方和函數(shù)SSE()取得最小值。2, 模型的基本假定及檢驗(yàn) 為了方便進(jìn)行模型的參數(shù)估計(jì),做如下基本假定:1)解釋變量是確定性變量,不是隨機(jī)變量.并且要求 ,它表明設(shè)計(jì)矩陣是滿秩的.2)對(duì)隨機(jī)誤差項(xiàng)假定 這個(gè)假定稱為高斯-馬爾科夫條件。3)正態(tài)分布的假定為 相互獨(dú)立,對(duì)于多元線性回歸的矩陣形式這個(gè)條件可以表示為,由此可以得到,其中是單位陣。為了驗(yàn)證是否能做到基本假定,所以需要做回歸

9、模型的顯著性檢驗(yàn):3,回歸模型建立的步驟1) 確定回歸方程中的解釋變量和被解釋變量 由于回歸分析用于分析一個(gè)事物如何隨其他事物的變化而變化,因此回歸分析的第一步應(yīng)確定哪個(gè)事物是需要被解釋的,即哪個(gè)變量是被解釋變量(記為y);哪些事物是用于解釋其他變量的,即哪些變量是解釋變量(記為x)。在多元線性回歸分析中,模型中應(yīng)引入多少解釋變量是需要重點(diǎn)研究的。如果引入的解釋變量較少,回歸方程將無(wú)法很好地解釋說(shuō)明被解釋變量的變化。但是也并非引入解釋變量越多越好,因?yàn)檫@些變量之間可能存在多重共線性。因此要采取一些策略對(duì)解釋變量引入回歸方程加以控制和篩選。在多元的回歸分析中并不是所有的變量都對(duì)因變量具有顯著的影

10、響,因此就存在著挑選自變量的問(wèn)題,挑選自變量有多種方法:前進(jìn)法、后退法、逐步篩選法等。2) 確定回歸模型 根據(jù)函數(shù)擬合方式,通過(guò)觀察散點(diǎn)圖確定應(yīng)通過(guò)哪種教學(xué)模型來(lái)概括回歸線。如果被解釋變量和解釋變量之間存在線性關(guān)系,則應(yīng)進(jìn)行線性回歸分析,建立線性回歸模型;反之,如果被解釋變量和解釋變量之間存在非線性關(guān)系,則應(yīng)進(jìn)行非線性回歸分析,建立非線性回歸模型。3) 建立回歸模型 根據(jù)手機(jī)到樣本數(shù)據(jù)以及上一步所確定的回歸模型,在一定得統(tǒng)計(jì)擬合準(zhǔn)則下估計(jì)出模型中的各個(gè)參數(shù),得到一個(gè)確定的回歸方程。對(duì)回歸方程進(jìn)行各種檢驗(yàn)各種檢驗(yàn)方法在前文中已經(jīng)涉及,在此不在一一說(shuō)明。4)利用方程進(jìn)行回歸預(yù)測(cè) 建立回歸方程的目的

11、之一是根據(jù)回歸方程對(duì)事物的未來(lái)發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè)。二 問(wèn)題描述下面的資料是2009年?yáng)|北三省部分城市的農(nóng)村居民人均總支出狀況,通過(guò)收入支出的時(shí)間序列模型的分析給出了從2000到2009年的農(nóng)村收入支出呈現(xiàn)的增長(zhǎng)趨勢(shì),以及城鄉(xiāng)之間的對(duì)比;利用聚類分析說(shuō)明了收入支出的地區(qū)差異。再利用回歸分析建立了東北三省部分城市的農(nóng)村居民收入與支出之間的模型,試將其農(nóng)村收入情況進(jìn)行分類,以了解我國(guó)農(nóng)村居民的基本生活狀況。 2009年?yáng)|北三省部分城市的農(nóng)村居民人均總支出狀況 地 區(qū)全年生活消費(fèi)總支出1.食品消費(fèi) 支 出2.衣著消費(fèi) 支 出3.居住消費(fèi) 支 出4.家庭設(shè)備、用品消費(fèi)支出5.交通和通訊 消費(fèi)支出6.文化教

12、育、娛樂(lè)消費(fèi)支出7.醫(yī)療保健 消費(fèi)支出8.其他商品和 服務(wù)消費(fèi)支出沈 陽(yáng) 市4733.10 1686.30 269.89 925.32 273.10 746.71 377.81 405.41 48.56 大 連 市5831.64 2124.22 567.46 1054.79 335.31 724.42 635.93 287.65 101.86 哈爾濱市5170.68 1734.70 398.23 1082.42 310.54 504.69 587.83 452.49 99.78 長(zhǎng) 春 市3753.45 1429.99 295.11 662.66 259.90 494.86 274.14 23

13、3.74 103.05 吉 林 市4542.82 1593.74 256.14 1016.09 310.73 646.01 420.36 252.71 47.03 伊 春 市4520.75 1724.56 344.73 812.20 233.29 464.59 495.77 363.94 81.66 大 慶 市5239.96 1536.93 344.26 1373.68 296.65 701.18 562.46 312.80 112.00 通 化 市3894.78 1430.97 242.01 803.15 287.37 424.09 382.27 261.09 63.82 松 原 市3869

14、.58 1472.83 254.91 650.16 294.33 435.55 484.51 194.33 82.96 鞍 山 市5440.96 1827.96 504.87 1297.89 272.34 545.68 599.17 312.02 81.02 撫 順 市3859.43 1514.59 367.56 699.84 204.89 498.61 337.07 136.49 100.38 本 溪 市4116.64 1594.53 235.05 751.98 264.06 451.03 480.74 298.36 40.89 齊齊哈爾市3586.68 1352.67 231.59 767

15、.91 241.68 428.10 310.12 183.52 71.09 佳木斯市2842.74 1203.38 179.75 557.08 177.71 345.94 208.11 132.18 38.60 錦 州 市3169.11 1206.23 202.17 523.23 275.47 334.35 375.17 198.42 54.07 白 山 市4016.97 1257.16 201.44 1099.79 192.69 469.43 405.20 328.87 62.39 鐵 嶺 市3411.02 1392.24 185.76 653.51 175.00 354.52 351.77

16、 218.67 79.55 三 問(wèn)題分析(1) 收入和支出的概況分析1,收入支出隨時(shí)間的增長(zhǎng)趨勢(shì)表21-1(a)2000年至2009年?yáng)|北三省部分城市的農(nóng)村居民人均總收入年份2000 200120022003200420052006200720082009人均總收入3872.224138.61 4305.774482.155037.525037.525037.527150.288136.668683.22通過(guò)上表信息,利用Eviews進(jìn)行一元線性回歸分析,得到如下結(jié)果表21-1(b)人均總收入線性回歸結(jié)果Dependent Variable: YMethod: Least SquaresDat

17、e: 12/09/11 Time: 16:09Sample: 2000 2009Included observations: 10VariableCoefficientStd. Errort-StatisticProb. C2724.857299.55399.0963850.0000X553.163248.2774811.458000.0000R-squared0.942564 Mean dependent var5767.255Adjusted R-squared0.935385 S.D. dependent var1725.057S.E. of regression438.5020 Aka

18、ike info criterion15.18146Sum squared resid1538272. Schwarz criterion15.24198Log likelihood-73.90731 F-statistic131.2857Durbin-Watson stat0.479131 Prob(F-statistic)0.000003由表知回歸模型為: =2724.857+553.1632,回歸模型的斜率是553.1632,表明每增長(zhǎng)一年,人均純收入增加553.1632元。從上表中R-squared為0.942564,說(shuō)明擬合優(yōu)度比較高;Prob(F-statistic)為0.0000

19、03,說(shuō)明方程顯著地。2724.857所對(duì)應(yīng)的Prob( t-Statistic)為0.0000,在顯著性水平0.05的條件下是顯著的,回歸系數(shù)553.1632所對(duì)應(yīng)的Prob( t-Statistic)為0.0000,說(shuō)明是顯著的。 東北三省部分城市的農(nóng)民的收入水平是隨著我國(guó)經(jīng)濟(jì)發(fā)展而快速增長(zhǎng)的一個(gè)過(guò)程,以2000年為基期,如圖所示,農(nóng)民在 2000 年時(shí)候的人均純收入水平是 3872.22元,到 2009 年的時(shí)候,其農(nóng)民的人均總收入水平已經(jīng)達(dá)到了 8683.22元。十年間,東北三省農(nóng)民的收入一共增加了 4811.00 元,收入增長(zhǎng)了約 2.24倍??傮w來(lái)講,東北三省農(nóng)民的收入一直是呈增加

20、的趨勢(shì)的。年份2000200120022003200420052006200720082009平均每人全年總支出(元)3036.203326.793438.783521.42.3999.234561.275059.485863.216697.387258.17表21-1(c)2000年至2009年?yáng)|北三省農(nóng)村居民人均總支出及分析結(jié)果表21-1(d)人均總支出回歸結(jié)果Dependent Variable: YMethod: Least SquaresDate: 12/09/11 Time: 16:31Sample: 2000 2009Included observations: 10Variab

21、leCoefficientStd. Errort-StatisticProb. C2046.519272.70717.5044580.0001X478.686243.9507210.891430.0000R-squared0.936820 Mean dependent var4679.293Adjusted R-squared0.928923 S.D. dependent var1497.368S.E. of regression399.2023 Akaike info criterion14.99367Sum squared resid1274900. Schwarz criterion15

22、.05419Log likelihood-72.96835 F-statistic118.6233Durbin-Watson stat0.435934 Prob(F-statistic)0.000004 由表知回歸模型為: =2046.519+478.6862,回歸模型的斜率是478.6862,表明每增長(zhǎng)一年,人均純支出增加478.6862元。 從上表中R-squared為0.936820,說(shuō)明擬合優(yōu)度比較高;Prob(F-statistic)為0.000004,說(shuō)明方程顯著地。2046.519所對(duì)應(yīng)的Prob( t-Statistic)為0.0001,在顯著性水平0.05的條件下是顯著的,回

23、歸系數(shù)478.6862所對(duì)應(yīng)的Prob( t-Statistic)為0.0000,說(shuō)明是顯著的。東北的農(nóng)民的支出水平也是隨著我國(guó)經(jīng)濟(jì)發(fā)展而快速增長(zhǎng)的一個(gè)過(guò)程,以2000年為基期,如表所示,農(nóng)民在 2000 年時(shí)候的人均總支出水平是3036.20元,到2009年的時(shí)候,東北的農(nóng)民的人均總支出水平已經(jīng)達(dá)到了7258.17元。十年間,東北三省農(nóng)民的收入一共增加了4221.97元,支出增長(zhǎng)了約 2.39 倍??傮w來(lái)講,東北三省的農(nóng)民的收入一直是呈增加的趨勢(shì)的。(2) 收入支出的城鄉(xiāng)差異 表21-1(d)農(nóng)村人均總收入總支出年份20002001200220032004200520062007200820

24、09總收入3872.224138.614305.774482.155037.525676.986188.547150.288136.668683.82總支出3036.203326.793438.783521.423999.234561.275090.485863.216697.387258.17表21-1(e)城鎮(zhèn)人人均總收入總支出年份2000200120022003200420052006200720082009總收入6521.67141.168158.139057.5810187.1210744.7913222.8515366.2617548.9719336.91總支出5022.00525

25、2.425596.436069.356673.757457.318468.49666.6111006.6112012.73由表可知:城鎮(zhèn)收入支出和農(nóng)村收入的變化速度都是隨著年份的增加由緩慢逐漸增快,但是城鎮(zhèn)明顯的收入支出比農(nóng)村的收入要快,而且隨著時(shí)間的增加,城鎮(zhèn)與農(nóng)村的差距越來(lái)越大,但總體都是增長(zhǎng)的較快。(3) 收入支出的地區(qū)差異 這里利用附錄中的關(guān)于東北三省17個(gè)地區(qū)的收入支出表,進(jìn)行聚類分析和因子分析,從而得到不同地區(qū)之間收入支出的差異和不同的支出指標(biāo)之間的差異。四 計(jì)算求解(一)利用聚類分析分類收入差異 1,利用聚類分析處理17個(gè)地區(qū)之間的收入差異,運(yùn)用spss軟件處理得到的結(jié)果如下:圖

26、4-2 東北三省17個(gè)市的年純收入的聚類分析結(jié)果  Rescaled Distance Cluster Combine   C A S E    0         5        10       

27、0;15        20        25  Label  Num  +-+-+-+-+-+          13   齊齊哈爾         

28、60;16   白山          14   佳木斯          11    撫順           4    長(zhǎng)春  

29、;         8               通化          15            錦州  

30、0;       17                     鐵嶺           9          

31、;         松原           5              吉林          12    

32、0;                           本溪           6           &

33、#160;                                 伊春           7    

34、0;                                 大慶           1     &

35、#160;                   沈陽(yáng)           2                  

36、0;                   大連          10                    

37、                        鞍山           3   哈爾濱 這里,利用SPSS層次聚類的Q型聚類對(duì)東北三省17個(gè)市區(qū)進(jìn)行分析。其中,個(gè)體距離采用平方歐式距離,類間距離采用組間平均連鎖距離,由

38、于數(shù)據(jù)不存在數(shù)量級(jí)上的差異,因此無(wú)須進(jìn)行標(biāo)準(zhǔn)化處理。生成的聚類分析樹(shù)形圖如圖4-2所示,其他結(jié)果略去。 通過(guò)分析歸納,認(rèn)為分為三類比較合適,伊春,大慶,沈陽(yáng),大連,鞍山地理位置也是比較近,都位于東北的東北部,之間的地理特點(diǎn),文化風(fēng)俗,經(jīng)濟(jì)主體相似,都是東北的重要城市,經(jīng)濟(jì)發(fā)展水平較高。大都是沿海城市,有利于經(jīng)濟(jì)的發(fā)展,所以收入普遍肩高。淄博年純收入較高,可以這樣解釋,哈爾濱是東北乃至全國(guó)重要的重化工業(yè)基地,工業(yè)發(fā)展以石油化工、醫(yī)藥、建材、冶金、機(jī)械、等行業(yè)為骨干,門(mén)類齊全,特色鮮明,比較優(yōu)勢(shì)突出。,哈爾濱依靠工業(yè)發(fā)展迅速,經(jīng)濟(jì)水平較高,年純收入較高。2,利用聚類分析處理17個(gè)地區(qū)之間的支出差異

39、利用spss軟件處理數(shù)據(jù)得到結(jié)果如下:圖 4-1 東北三省17個(gè)市區(qū)各種支出情況的聚類分析結(jié)果                      Rescaled Distance Cluster Combine   C A S E    0 &#

40、160;       5        10        15        20        25  Label  Num  +-+-+-+-+

41、-+           8   通化          13   齊齊哈爾          17    鐵嶺      

42、60;    4    長(zhǎng)春          11             撫順           9      &

43、#160;   松原          12                         本溪          1

44、4              佳木斯          15                         

45、                      錦州          16                 &#

46、160;        白山   濟(jì)南     1                                 &#

47、160;        沈陽(yáng)           5                              

48、;     吉林           6                             伊春    

49、       3                                  哈爾濱        &#

50、160; 10                     鞍山           7               

51、60;    大慶     青島   2   大連 這里,利用SPSS層次聚類的Q型聚類對(duì)東北的17個(gè)市區(qū)進(jìn)行分析。其中,個(gè)體距離采用平方歐式距離,類間距離采用組間平均連鎖距離,由于數(shù)據(jù)不存在數(shù)量級(jí)上的差異,因此無(wú)須進(jìn)行標(biāo)準(zhǔn)化處理。生成的聚類分析樹(shù)形圖如圖4-1所示,其他結(jié)果略去。 通過(guò)分析歸納,分為三類比較合適:沈陽(yáng),吉林,伊春,哈爾濱,鞍山,大慶為一類,這些地區(qū)大致位于山東省的東北部,它們之間聯(lián)系大,所以經(jīng)濟(jì),文化等相互影響,支出水平差不多。

52、通化,齊齊哈爾,鐵嶺,長(zhǎng)春 ,撫順,松原,本溪,佳木斯,錦州為一類,也可以很好解釋,這些地區(qū)位于山東省的西南方,比較東部沿海的幾個(gè)城市有著一定的差距,所以與第一類可以區(qū)分開(kāi)成為另一類。大連自成一類,大連市位于沿海,有著較強(qiáng)的地理優(yōu)勢(shì),對(duì)經(jīng)濟(jì)的發(fā)展相當(dāng)有利,生活水平支出水平較高,在東北三省比較突出,所以歸為一類。(2) 利用回歸分析分配收入消費(fèi) 根據(jù)東北三省統(tǒng)計(jì)年鑒(2009年)提供的各地區(qū)農(nóng)村居民家庭平均每人按來(lái)源分的純收入數(shù)據(jù),選取總收入和四項(xiàng)收入來(lái)源指標(biāo)作為分配來(lái)源我們把Y作為全年純收入,Y1為工資性純收入,Y2為家庭經(jīng)營(yíng)性純收入,Y3為財(cái)產(chǎn)性純收入,Y4為轉(zhuǎn)移性收入。再選取 8 個(gè)反映消

53、費(fèi)支出的指標(biāo)為消費(fèi)分配的去向:x1食品支出,x2 衣著支出,x3居住支出,x4 家庭設(shè)備及服務(wù)支出, x5醫(yī)療保健支出,x6 交通和通訊支出 ,x7文教和娛樂(lè)用品及服務(wù)支出,x8 其他商品及服務(wù)支出下面我們將利用后退法分別進(jìn)行回歸分析。1,全年純收入Y與各項(xiàng)支出指標(biāo)之間的回歸分析 這里利用spss軟件處理數(shù)據(jù),觀測(cè)每一步檢驗(yàn)的變化情況,并進(jìn)行殘差分析和異常點(diǎn)探測(cè),分析結(jié)果如表所示:表22-1(a) 多元線性回歸分析結(jié)果(向后篩選策略)Model SummarygModelRR SquareAdjusted R SquareStd. Error of the EstimateDurbin-Wat

54、son1.958a.917.835505.520932.958b.917.853476.950813.957c.916.865457.086624.956d.914.874440.813855.953e.907.877436.651166.948f.899.876437.721831.334a. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 家庭設(shè)備用品消費(fèi), 交通和通訊消費(fèi), 衣著消費(fèi), 居住消費(fèi), 文化教育娛樂(lè)消費(fèi), 食品消費(fèi)b. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 家庭設(shè)備用品消費(fèi), 交通和通訊消費(fèi)

55、, 衣著消費(fèi), 文化教育娛樂(lè)消費(fèi), 食品消費(fèi)c. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 交通和通訊消費(fèi), 衣著消費(fèi), 文化教育娛樂(lè)消費(fèi), 食品消費(fèi)d. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 交通和通訊消費(fèi), 衣著消費(fèi), 文化教育娛樂(lè)消費(fèi)e. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 交通和通訊消費(fèi), 衣著消費(fèi)f. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 衣著消費(fèi)g. Dependent Variable: 全年

56、純收入表22-1(b)最終方程線性回歸檢驗(yàn)ANOVAgModelSum of SquaresdfMean SquareFSig.6Regression2.224E737411694.40838.683.000fResidual2490805.22413191600.402Total2.473E716f. Predictors: (Constant), 其他商品和服務(wù)消費(fèi), 醫(yī)療保健消費(fèi), 衣著消費(fèi)g. Dependent Variable: 全年純收入下表省略了前五步,只留下第六步的最終模型表22-1(c)多元線性回歸分析結(jié)果CoefficientsaModelUnstandardized C

57、oefficientsStandardized CoefficientstSig.BStd. ErrorBeta6(Constant)4030.718460.7038.749.000衣著消費(fèi)10.5731.361.9407.766.000醫(yī)療保健消費(fèi)4.6321.322.3333.504.004其他商品和服務(wù)消費(fèi)-18.4665.972-.352-3.092.009a. Dependent Variable: 全年純收入 由上表可知,利用后退法共經(jīng)過(guò)六部完成回歸方程的建立,最終模型為第六個(gè)模型。模型依次剔除了居住消費(fèi)、家庭設(shè)備用品消費(fèi)、食品消費(fèi)和文化教育娛樂(lè)消費(fèi),保留了衣著消費(fèi)、醫(yī)療保健消費(fèi)、

58、其他商品和服務(wù)消費(fèi)。由表2-1(b)(c)可知,回歸方程顯著性檢驗(yàn)和最終方程的回歸系數(shù)顯著性檢驗(yàn)的概率p值遠(yuǎn)小于顯著水平a(a為0.05),因此三個(gè)解釋變量和被解釋變量間的線性關(guān)系顯著,其留在模型中是合理的。所以可以得到的最終回歸方程為 Y=4030.718+10.573*衣著消費(fèi)+4.632*醫(yī)療保健消費(fèi)-18.466*其他商品和服務(wù)消費(fèi), 即為Y=4030.718+10.573*x2+4.632*x5-18.466*x8。該方程意味著全年純收入主要與衣著消費(fèi),醫(yī)療保健消費(fèi)呈正相關(guān),與其他商品和服務(wù)消費(fèi)呈負(fù)相關(guān),可以通過(guò)散點(diǎn)圖看出,如圖22-1(d)。 而且從標(biāo)準(zhǔn)化后的方程(Y=0.940*

59、x2+0.333*x5-0.352*x8)可以看出單位收入主要流向了衣著消費(fèi)(0.94)和醫(yī)療保?。?.333),說(shuō)明農(nóng)村居民的基本消費(fèi)趨向還主要停留在自身基本狀況的需要上;作為其他商品和服務(wù)消費(fèi)(-0.352),系數(shù)為負(fù),說(shuō)明這項(xiàng)消費(fèi)遠(yuǎn)遠(yuǎn)低于農(nóng)村居民的基本消費(fèi)指標(biāo)。圖22-1(d) 全年純收入分別和衣著消費(fèi)、醫(yī)療保健消費(fèi)、其他商品和服務(wù)消費(fèi)的散點(diǎn)圖 2,工資性純收入Y1、家庭經(jīng)營(yíng)性純收入Y2、財(cái)產(chǎn)性純收入Y3、轉(zhuǎn)移性純收入Y4與支出各項(xiàng)指標(biāo)之間的線性回歸 這里同樣利用后退法進(jìn)行回歸分析,利用SPSS軟件可以分別得到相應(yīng)的回歸分析結(jié)果,并通過(guò)后退法回歸后,得到其散點(diǎn)圖,如下所示:表22-2(a

60、)工資性純收入與支出指標(biāo)的回歸分析結(jié)果CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta7(Constant)625.478365.7561.710.109衣著消費(fèi)4.525.983.6384.605.000醫(yī)療保健消費(fèi)3.6081.214.4122.971.010a. Dependent Variable: 工資性純收入 (a1) (a2) 勞動(dòng)法中的工資是指用人單位依據(jù)國(guó)家有關(guān)規(guī)定或勞動(dòng)合同的約定,以貨幣形式直接支付給本單位勞動(dòng)者的勞動(dòng)報(bào)酬,一般包括計(jì)時(shí)工資、計(jì)

61、件工資、資金、津貼和補(bǔ)貼、延長(zhǎng)工作時(shí)間的工資報(bào)酬以及特殊情況下支付的工資等。工資是勞動(dòng)者勞動(dòng)收入的主要組成部分。 通過(guò)觀察標(biāo)準(zhǔn)化后的各項(xiàng)數(shù)據(jù)可知P值小于0.05,所以工資性純收入與衣著消費(fèi),醫(yī)療保健消費(fèi)線性顯著;由散點(diǎn)圖樂(lè)意看出它們之間存在正相關(guān)。 寫(xiě)出標(biāo)準(zhǔn)化后的回歸方程Y1(工資性純收入)=0.638*x1(衣著)+0.412*x5(醫(yī)療保健),一單位的衣著消費(fèi)需要0.638個(gè)單位的工資性純收入,一單位的醫(yī)療保健消費(fèi)需要0.412個(gè)單位的工資性純收入;工資性收入是農(nóng)民最主要最基本的收入來(lái)源,衣著也是其重要消費(fèi)方式,當(dāng)工資提高時(shí),人們會(huì)提高對(duì)衣著的需求和醫(yī)療保健的支出。表22-2(b)家庭經(jīng)營(yíng)

62、性純收入與支出指標(biāo)的回歸分析結(jié)果CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta8(Constant)2123.285525.7644.038.001交通和通訊消費(fèi)2.9981.012.6082.962.010a. Dependent Variable: 家庭經(jīng)營(yíng)純收入 (b) 經(jīng)營(yíng)性收入(Operational Income)是指納稅人通過(guò)經(jīng)常性的生產(chǎn)經(jīng)營(yíng)活動(dòng)而取得的收益,即企業(yè)在銷(xiāo)售貨物、提供勞務(wù)以及讓渡資產(chǎn)使用權(quán)等日?;顒?dòng)中所產(chǎn)生的收入,通常表現(xiàn)為現(xiàn)金流入、其他資產(chǎn)的增加或負(fù)債的減少。 由表可知P值小于0.05,認(rèn)為家庭經(jīng)營(yíng)性收入與交通和通訊消費(fèi)線性關(guān)系顯著;由圖可以很好看出他們之間成正相關(guān)。 標(biāo)準(zhǔn)化后的回歸方程Y2(經(jīng)營(yíng)性收入)=0.608*x6(交通通訊),增加一單位的交通通訊消費(fèi)需要0.608個(gè)單位的經(jīng)營(yíng)性收入;增加一單位的經(jīng)營(yíng)性收入用于0.608個(gè)單位的交通通訊消費(fèi);經(jīng)營(yíng)性收入不是農(nóng)民普遍的收入方式,因?yàn)樾枰欢ǖ某杀?,并且收入高。他們的生活條件也相應(yīng)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論