歸分析41931873_第1頁
歸分析41931873_第2頁
歸分析41931873_第3頁
歸分析41931873_第4頁
歸分析41931873_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、北京聯(lián)合大學(xué)實訓(xùn)報告課程名稱: 空間經(jīng)濟數(shù)學(xué)方法 項目名稱: 回歸分析實訓(xùn) 學(xué) 院: 應(yīng)用文理學(xué)院 專 業(yè):資源環(huán)境與城鄉(xiāng)規(guī)劃管理班 級: 1002B 學(xué) 號:姓 名: 成 績: 2012年10月7日一、任務(wù)與目的了解一元線性回歸、多元線性回歸和逐步回歸的原理及基本概念;理解三種回歸的模型建立及統(tǒng)計檢驗;掌握使用應(yīng)用軟件解決回歸問題。其中,一元回歸可以仿照教材案例分析2-1,多元回歸和逐步回歸可以仿照教材“2.3 回歸分析應(yīng)用案例住房需求量分析”,具體內(nèi)容包括:提出問題,定性分析,搜集數(shù)據(jù),散點圖模擬(僅一元回歸),建立模型等;在數(shù)據(jù)處理中主要介紹計算機求解的步驟和過程;在結(jié)論中,除了寫出求出

2、的回歸方程式外,一定要得出檢驗的結(jié)論。 二、原理(條件)回歸分析(regression analysis)是探察變量之間的數(shù)量變化規(guī)律,并通過一定的數(shù)學(xué)表達(dá)式來描述這種關(guān)系,進(jìn)而確定一個或幾個變量的變化對另一個變量的影響程度,確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。一元線性回歸分析是研究兩個變量間的統(tǒng)計關(guān)系。一元線性回歸數(shù)學(xué)模型:其中y是因變量,0是y的截距,1+稱為偏回歸系數(shù),表示其他變量不變,x變化時所預(yù)測y的平均變化率,為隨機誤差。 多元線性回歸是研究多個變量之間的關(guān)系,因變量如何受到多個自變量的影響,用多個自變量預(yù)測因變量的值。多元線性回歸是研究多個變量之間因果關(guān)

3、系的常用方法之一,每個自變量和因變量之間的關(guān)系都是線性的。多元線性回歸數(shù)學(xué)模型:y=0+1x1+2x2+逐步回歸是在建立多元回歸方程的過程中,按偏相關(guān)系數(shù)的大小次序?qū)⒆宰兞恐饌€引入方程,對引入方程中的每個自變量偏相關(guān)系數(shù)進(jìn)行統(tǒng)計檢驗,效應(yīng)顯著的自變量留在回歸方程內(nèi),循此繼續(xù)遴選下一個自變量。如果效應(yīng)不顯著,停止引入新自變量。由于新自變量的引入,原已引入方程中的自變量由于變量之間的相互作用其效應(yīng)有可能變得不顯著者,經(jīng)統(tǒng)計檢驗確證后要隨時從方程中剔除,只保留效應(yīng)顯著的自變量。直至不再引入和剔除自變量為止,從而得到最優(yōu)的回歸方程。三、內(nèi)容與步驟用回歸方法研究問題、進(jìn)行回歸分析的主要內(nèi)容是:(1)建立

4、回歸模型,確定自變量X,因變量Y。(2)確定回歸方程(3)方程準(zhǔn)確性判斷及準(zhǔn)確化。回歸分析步驟1.做出散點圖(觀察變量間的趨勢)2.考察數(shù)據(jù)的分布,做出必要的預(yù)處理,分析變量的正態(tài)性和方差齊等問題3.進(jìn)行直線回歸分析4.殘差分析,檢驗殘差的獨立性和正態(tài)性5.影響點的診斷和多重共線性問題的判斷四、數(shù)據(jù)處理(現(xiàn)象分析)1、一元線性回歸分析(以城市化水平研究來分析)模型匯總b模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計的誤差Durbin-Watson1.972a.944.941.008126.136a. 預(yù)測變量: (常量), 人均GDP。b. 因變量: 城市化水平從模型匯總的表中,決定系數(shù)R方是0.944,

5、反映因變量Y的全部變異中能通過自變量回歸系數(shù)被自變量解釋的比例為94.4%,接近于1,說明因變量的全部變量中能通過回歸系數(shù)被自變量解釋的比例很高。殘差的獨立性檢驗:D.W統(tǒng)計量范圍是04,越接近于2,殘差與自變量之間越獨立。上表中D.W值為0.136,說明獨立性差。Anovab模型平方和df均方FSig.1回歸.0201.020302.773.000a殘差.00118.000總計.02119a. 預(yù)測變量: (常量), 人均GDP。b. 因變量: 城市化水平Anovab方差表主要進(jìn)行回歸直線意義的F檢驗,統(tǒng)計量F=平均回歸平方和/平均殘差平方和。若F值過小說明自變量對因變量的解釋力度很差,擬合

6、的回歸直線沒有意義,相反若概率值Sig越小則線性方程越明顯。該F很大,是302.773,SIG值為0,所以該回歸直線有意義。系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)B標(biāo)準(zhǔn) 誤差1(常量).588.003人均GDP(元)4.761E-6.000系數(shù)a模型標(biāo)準(zhǔn)系數(shù)tSig.相關(guān)性試用版零階偏部分1(常量)201.441.000人均GDP(元).97217.400.000.972.972.972a. 因變量: 城市化水平根據(jù)上表,可寫出回歸方程:y=0.588+0.972x,其中x是人均GDP,y是城市化水平。T檢驗是對回歸系數(shù)的檢驗,考察是否每一個自變量都對因變量都有顯著的影響,其中Sig越接近0越好。由上表可得,

7、常量和人均GDP系數(shù)的Sig值都為0,所以該方程中,自變量對因變量由顯著的影響。該圖為標(biāo)準(zhǔn)化殘差直方圖,由圖可知標(biāo)準(zhǔn)化殘差基本符合正態(tài)分布,有意義。該圖為回歸標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖,圖中的點基本位于一條直線上,說明該方程有意義。該圖為散點圖,點基本分布均勻在區(qū)域內(nèi),殘差符合正態(tài)分布。2、多元線性回歸分析(以研究城市人均居住面積(平米)為例分析進(jìn)入法)模型匯總b模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計的誤差Durbin-Watson1.995a.989.983.233021.621a. 預(yù)測變量: (常量), 人均基本建設(shè)投資額(元), 城鎮(zhèn)儲蓄存款余額 (億元), 人均國內(nèi)生產(chǎn)總值(元), 城鎮(zhèn)居

8、民家庭平均每人每年全部收入(元), 城鎮(zhèn)居民家庭平均每人每年可支配收入(元), 人均城鎮(zhèn)儲蓄存款余額(元), 基本建設(shè)投資額 (萬元)。b. 因變量: 城市人均居住面積(平米)從模型匯總的表中,調(diào)整后R方為0.983,表示因變量Y的全部變異中能通過自變量回歸系數(shù)被自變量解釋的比例為98.3%,接近于1,說明因變量的全部變量中能通過回歸系數(shù)被自變量解釋的比例很高。殘差的獨立性檢驗:D.W統(tǒng)計量范圍是04,越接近于2,殘差與自變量之間越獨立。上表中D.W=1.621,說明獨立性較好。Anovab模型平方和df均方FSig.1回歸59.68578.526157.022.000a殘差.65212.05

9、4總計60.33619a. 預(yù)測變量: (常量), 人均基本建設(shè)投資額(元), 城鎮(zhèn)儲蓄存款余額 (億元), 人均國內(nèi)生產(chǎn)總值(元), 城鎮(zhèn)居民家庭平均每人每年全部收入(元), 城鎮(zhèn)居民家庭平均每人每年可支配收入(元), 人均城鎮(zhèn)儲蓄存款余額(元), 基本建設(shè)投資額 (萬元)。b. 因變量: 城市人均居住面積(平米) Anovab方差表主要進(jìn)行回歸直線意義的F檢驗,統(tǒng)計量F=平均回歸平方和/平均殘差平方和。若F值過小說明自變量對因變量的解釋力度很差,擬合的回歸直線沒有意義,相反若概率值Sig越小則線性方程越明顯。該表中F值為157.022,較大,Sig.值等于0,說明回歸方程有意義。系數(shù)a模型

10、非標(biāo)準(zhǔn)化系數(shù)B標(biāo)準(zhǔn) 誤差1(常量)3.466.327城鎮(zhèn)居民家庭平均每人每年全部收入(元)-.001.001城鎮(zhèn)居民家庭平均每人每年可支配收入(元).000.001城鎮(zhèn)儲蓄存款余額 (億元).010.003人均城鎮(zhèn)儲蓄存款余額(元)-.001.000人均國內(nèi)生產(chǎn)總值(元).001.000基本建設(shè)投資額 (萬元)-6.493E-6.000人均基本建設(shè)投資額(元).005.002模型標(biāo)準(zhǔn)系數(shù)tSig.相關(guān)性試用版零階偏1(常量)10.588.000城鎮(zhèn)居民家庭平均每人每年全部收入(元)-2.565-1.805.096.937-.462城鎮(zhèn)居民家庭平均每人每年可支配收入(元)-.807-.723.4

11、84.938-.204城鎮(zhèn)儲蓄存款余額 (億元)4.8312.902.013.902.642人均城鎮(zhèn)儲蓄存款余額(元)-4.970-3.451.005.914-.706人均國內(nèi)生產(chǎn)總值(元)5.2546.555.000.951.884基本建設(shè)投資額 (萬元)-5.554-2.005.068.938-.501人均基本建設(shè)投資額(元)4.8492.521.027.938.588系數(shù)a模型相關(guān)性共線性統(tǒng)計量部分容差VIF1(常量)城鎮(zhèn)居民家庭平均每人每年全部收入(元)-.054.0002243.322城鎮(zhèn)居民家庭平均每人每年可支配收入(元)-.022.0011384.324城鎮(zhèn)儲蓄存款余額.087.

12、0003079.586人均城鎮(zhèn)儲蓄存款余額(元)-.104.0002304.558人均國內(nèi)生產(chǎn)總值(元).197.001713.916基本建設(shè)投資額-.060.000851.290人均基本建設(shè)投資額(元).076.0004110.621a. 因變量: 城市人均居住面積(平米)根據(jù)系數(shù)表中的B,可寫出回歸方程為Y=-0.001X1+0.000*X2+0.010X3-0.001X4+0.001X5-6.493E-6X6+0.005X7+3.466該方程中,自變量X1為城鎮(zhèn)居民家庭平均每人每年全部收入(元), X2 為城鎮(zhèn)居民家庭平均每人每年可支配收入(元), X3為城鎮(zhèn)儲蓄存款余額, X4為人均城

13、鎮(zhèn)儲蓄存款余額(元), X5為人均國內(nèi)生產(chǎn)總值(元), X6為基本建設(shè)投資額, X7為人均基本建設(shè)投資額(元)。因變量Y為城市人均居住面積(平米)。標(biāo)準(zhǔn)化系數(shù)絕對值越大越重要。從表中可見人均國內(nèi)生產(chǎn)總值(元),基本建設(shè)投資額(萬元)相對重要通過上表進(jìn)行T檢驗 ,T檢驗是對回歸系數(shù)的檢驗,考察是否每一個自變量都對因變量都有顯著的影響。Sig.值越小,越接近于0,該變量對Y的影響越顯著。越不顯著可剔除方程。其中,城鎮(zhèn)居民家庭平均每人每年可支配收入(元)Sig.值為0.484,說明其對Y影響不顯著,可剔除方程?;窘ㄔO(shè)投資額和城鎮(zhèn)居民人均每人每年全部收入的sig值都較大,也可以剔除方程。 F通過,T

14、不顯著,可能存在共線性問題。容差越小,表明該變量與其他變量相關(guān)性越強,共線性問題嚴(yán)重。 從上表中可以看出各個自變量的容差都很小,說明該方程共線性問題嚴(yán)重。VIF 方差膨脹因子,>2 則可能存在共線性問題。>10,則共線性問題較嚴(yán)重。從上表中可看出共線性問題很嚴(yán)重。共線性診斷a模型維數(shù)特征值條件索引方差比例(常量)城鎮(zhèn)居民家庭平均每人每年全部收入(元)城鎮(zhèn)居民家庭平均每人每年可支配收入(元)城鎮(zhèn)儲蓄存款余額 (億元)117.4861.000.00.00.00.002.4793.954.04.00.00.003.02816.374.08.00.00.004.00636.682.11.0

15、1.01.005.00179.003.03.04.00.026.000143.679.09.01.58.0379.873E-5275.354.06.91.21.3482.682E-5528.369.60.04.20.60特征值越趨近于0,自變量之間共線性越問題越嚴(yán)重。從表中維數(shù)3的特征值為0.028,維數(shù)4的特征值0.006,維數(shù)5的特征值0.001,維數(shù)6的特征值0.000可見該方程的共線性問題嚴(yán)重。條件索引值15,可能存在共線性,條件索引值30,共線性問題很嚴(yán)重。從表中維數(shù)4-維數(shù)8的條件索引值36.682-528.369,可見存在嚴(yán)重的共線性問題。該圖為標(biāo)準(zhǔn)化殘差直方圖,由圖可知標(biāo)準(zhǔn)化殘

16、差較符合正態(tài)分布,有意義。該圖為回歸標(biāo)準(zhǔn)化殘差的標(biāo)準(zhǔn)P-P圖(正態(tài)概率圖),圖中的點基本位于一條直線上,有意義。該圖為散點圖,點均勻的分布在該區(qū)域內(nèi),殘差符合正態(tài)分布。3、逐步回歸分析(以研究城市人均居住面積(平米)為例分析逐步法)模型匯總d模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計的誤差Durbin-Watson1.951a.905.900.564122.981b.962.958.366403.988c.976.972.298141.451a. 預(yù)測變量: (常量), 人均國內(nèi)生產(chǎn)總值(元)。b. 預(yù)測變量: (常量), 人均國內(nèi)生產(chǎn)總值(元), 城鎮(zhèn)儲蓄存款余額。c. 預(yù)測變量: (常量), 人均

17、國內(nèi)生產(chǎn)總值(元), 城鎮(zhèn)儲蓄存款余額, 城鎮(zhèn)居民家庭平均每人每年可支配收入(元)。d. 因變量: 城市人均居住面積(平米)從模型匯總的表中的模型3,調(diào)整后R方為0.976,表示因變量Y的全部變異中能通過自變量回歸系數(shù)被自變量解釋的比例為97.6%,接近于1,說明因變量的全部變量中能通過回歸系數(shù)被自變量解釋的比例很高,獨立性很好。殘差的獨立性檢驗:D.W統(tǒng)計量范圍是04,越接近于2,殘差與自變量之間越獨立。上表中D.W=1.451,說明獨立性較好。Anovad模型平方和df均方FSig.1回歸54.608154.608171.598.000a殘差5.72818.318總計60.336192回歸

18、58.054229.027216.215.000b殘差2.28217.134總計60.336193回歸58.914319.638220.925.000c殘差1.42216.089總計60.33619a. 預(yù)測變量: (常量), 人均國內(nèi)生產(chǎn)總值(元)。b. 預(yù)測變量: (常量), 人均國內(nèi)生產(chǎn)總值(元), 城鎮(zhèn)儲蓄存款余額。c. 預(yù)測變量: (常量), 人均國內(nèi)生產(chǎn)總值(元), 城鎮(zhèn)儲蓄存款余額, 城鎮(zhèn)居民家庭平均每人每年可支配收入(元)。d. 因變量: 城市人均居住面積(平米)Anovab方差表主要進(jìn)行回歸直線意義的F檢驗,統(tǒng)計量F=平均回歸平方和/平均殘差平方和。若F值過小說明自變量對因變

19、量的解釋力度很差,擬合的回歸直線沒有意義,相反若概率值Sig越小則線性方程越明顯。該表中Sig.值等于0,說明回歸方程有意義。系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)B標(biāo)準(zhǔn) 誤差1(常量)5.787.202人均國內(nèi)生產(chǎn)總值(元).000.0002(常量)4.647.261人均國內(nèi)生產(chǎn)總值(元).001.000城鎮(zhèn)儲蓄存款余額-.003.0013(常量)4.340.234人均國內(nèi)生產(chǎn)總值(元).001.000城鎮(zhèn)儲蓄存款余額-.002.001城鎮(zhèn)居民家庭平均每人每年可支配收入(元)-.001.000系數(shù)a模型標(biāo)準(zhǔn)系數(shù)tSig.相關(guān)性試用版零階偏1(常量)28.583.000人均國內(nèi)生產(chǎn)總值(元).95113.10

20、0.000.951.9512(常量)17.825.000人均國內(nèi)生產(chǎn)總值(元)2.4528.175.000.951.893城鎮(zhèn)儲蓄存款余額-1.520-5.066.000.902-.7763(常量)18.548.000人均國內(nèi)生產(chǎn)總值(元)4.5886.296.000.951.844城鎮(zhèn)儲蓄存款余額-1.096-3.921.001.902-.700城鎮(zhèn)居民家庭平均每人每年可支配收入(元)-2.558-3.110.007.938-.614系數(shù)a模型相關(guān)性共線性統(tǒng)計量部分容差VIF1(常量)人均國內(nèi)生產(chǎn)總值(元).9511.0001.0002(常量)人均國內(nèi)生產(chǎn)總值(元).386.02540.44

21、7城鎮(zhèn)儲蓄存款余額-.239.02540.4473(常量)人均國內(nèi)生產(chǎn)總值(元).242.003360.375城鎮(zhèn)儲蓄存款余額-.151.01953.042城鎮(zhèn)居民家庭平均每人每年可支配收入(元)-.119.002458.896a. 因變量: 城市人均居住面積(平米)根據(jù)系數(shù)表中的B,可寫出回歸方程為Y=-0.001*X1-0.002*X2-0.001*X3+4.340該方程中,自變量X1為人均國內(nèi)生產(chǎn)總值(元), X2 為城鎮(zhèn)儲蓄存款余額, X3為城鎮(zhèn)居民家庭平均每人每年可支配收入(元),因變量Y為城市人均居住面積(平米)。標(biāo)準(zhǔn)化系數(shù)絕對值越大越重要。從表中可見人均國內(nèi)生產(chǎn)總值(元)相對重要

22、。通過上表進(jìn)行T檢驗 ,T檢驗是對回歸系數(shù)的檢驗,考察是否每一個自變量都對因變量都有顯著的影響。Sig.值越小,越接近于0,該變量對Y的影響越顯著,越不顯著可剔除方程。從上表可見,各變量都對Y有較顯著的影響,而城鎮(zhèn)居民家庭平均每人每年可支配收入(元)對Y影響不是很顯著。 F通過,T不顯著,可能存在共線性問題。容差越小,表明該變量與其他變量相關(guān)性越強,存在共線性問題。 VIF 方差膨脹因子,>2 則可能存在共線性問題。>10,則共線性問題較嚴(yán)重。人均國內(nèi)生產(chǎn)總值(元)容差0.003,VIF值 360.375,城鎮(zhèn)儲蓄存款余額容差0.019,VIF值 53.042,城鎮(zhèn)居民家庭平均每人每年可支配收入(元)容差0.002 ,VIF 值458.896.可見其容

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論