


版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、一 問題描述1.設(shè)定問題與收集數(shù)據(jù)影響一個(gè)地區(qū)人均消費(fèi)水平的因素有很多,例如,一個(gè)地區(qū)的GDP該地區(qū)人均可支配收入,該地區(qū)的教育水平,以及地區(qū)人口增長(zhǎng)變化情況等,下面我們選取6個(gè)解釋變量研究 地區(qū)人均消費(fèi)水平,解釋變量分別為:x1地區(qū)生產(chǎn)總值,x2人口自然增長(zhǎng)率,x3高等學(xué)校在 校學(xué)生數(shù),x4農(nóng)林牧漁業(yè)總產(chǎn)值,x5衛(wèi)生機(jī)構(gòu)人員數(shù),x6人均可支配收入。選取了 2014年 省統(tǒng)計(jì)年鑒中1990年到2013年的歷年數(shù)據(jù),以地區(qū)人均消費(fèi)水平為因變量,以如上 6 個(gè)自變量作多元線性回歸。數(shù)據(jù)如下戦護(hù)離丄匚每就就翳莉職進(jìn)躺1彌7Q6.14B90, ffi11.402*2481 n1201431忍*_imR
2、UM16.31a. so2朗19511431338251點(diǎn)1m935.62yn. 2?9.30対613565.62136556禺_1993甌(816D4卿66). 691陽1砂_15M!fNl. 4119040.259嚥15S18O_19951圉01 那,219.9041社1訶17醐J. a帥41,2 牝 32miim2即“3,241, fl_B.TD4辺財(cái)1,395.(3181587V111颶Z2輒業(yè)1 駅 (94M351,45i 131ST1G0測(cè)ire2 3砒3,闌 126M811JU85305J?5U7J200025弘狀4 9凰»5.1D95,5651_4戲5223328CV
3、352011215躍19諷11MTQ1,謝9ami腳20(22914.39界25.013.9D152, ?54151.53278330揶20(3,203.365, 333.1911Dlayoe1J34.49S3623M6B2肌$旣20t, 3?9.63180215,213;25:2B363179L63120054J30.0B 3E5.102應(yīng)STf19B2阿帕竝叭8,3862N64.5OU0煦埶4512點(diǎn)2【0Wk熾MT廻OD2也Ila JJS9Tf56o3rS7MT1函MB6jGT2.002.3&聊13曲20400248豳2NS溯S11,102J2m3屜91師8133920108,1
4、02.001135,4323331 冊(cè)24,081,81舸1M61201193.00a, 025, £82耶&調(diào)6£93題50131TJ9!M2H230.0&23, B72,80? 9Tmi rll331,5195,433,125O6E20,3072013國(guó)軒5.00見 260. rr3.003?M0b5,620.26鯽5爲(wèi)3682.闡述理論由經(jīng)濟(jì)理論知,地區(qū)GDP地區(qū)人均可支配收入,高等學(xué)校在校學(xué)生數(shù)(代表教育水平),農(nóng) 林牧漁業(yè)總產(chǎn)值(代表基礎(chǔ)消費(fèi)品供應(yīng)水平),衛(wèi)生機(jī)構(gòu)人員數(shù)(醫(yī)療水平),以及人口自然 增長(zhǎng)率(人口變化水平)是影響各省 GDP勺主要因素。
5、通常情況下,除了人口自然增長(zhǎng)率以外 的其余5個(gè)解釋變量與人均消費(fèi)水平呈正相關(guān)關(guān)系, 而人口自然增長(zhǎng)率則呈負(fù)相關(guān)關(guān)系。 在這 里,將人均消費(fèi)水平作為被解釋變量,其余 6個(gè)變量作為解釋變量,建立 x1,x2,.,x6 與y 的多元線性回歸模型。二處理數(shù)據(jù)1.多元回歸分析(1) 畫散點(diǎn)圖>setwd("D:/R-3.2.3/data")>mydata<-read.csv("book2.csv",header = T)> plot(mydata)rn.T-由上圖,可以看到y(tǒng)與除X2以外的其余解釋變量呈正相關(guān),與X2呈負(fù)相關(guān),與我們的分 析
6、一致,還可以看到,解釋變量本身存在相關(guān)性,可能存在多重多線性。L-匚產(chǎn)匚1«(2) 將數(shù)據(jù)標(biāo)準(zhǔn)化與求其相關(guān)系數(shù)>mydata_scale<-scale(mydata)>mydata_scale_cor<-cor(mydata_scale)>hist(mydata_scale_cor,xlab = "cor")Histogram of mydata_scale_corAau nba)LLcor由相關(guān)系數(shù)的頻率直方圖可知,大部分相關(guān)系數(shù)在0.91之間,相關(guān)性很強(qiáng),作回歸分析 較為合理。(3) 得到線性擬合模型mydata_scale<
7、;-as.data.frame(mydata_scale)tlm<-lm(yx1+x2+x3+x4+x5+x6,data=mydata_scale)summary(tlm)得到:Call :In (formula =y xl -Kx2 + x3 + x4+ x5 + x6, data=ruydatascal e)Re5"i dual 5 Iwiniqriedi anMax-0.049S10 -0.0173090.0040290.0158660,063060coeffncientsaEsrlmareSTd. Errort valuePr(>|r|)(zrtercept)-6
8、.C8Ce-176.628e-O3Q. 000l.oatjQooxl了'29S電011.83Ce-Ql3, 97 5C.00097B* *x2'5.403C-022.6B4e-02-2. 013(h 060207x3-1.737C-014.461e-02-3.8940.001168w *X41.189C-017.482e-021. 5890.130528X57.577e-024.757e-021 6770.111903X咱1.969e-011.891C-O11.0410. 312467signif< sda; 0 1! 0.001 n0.01 c"0*05 !
9、0-1 ( ! 1R史sidual standard error : 0.03247 on 17 degr電電占 of freedomMui亡p2 R-squard :0.9Q89F-staTlsTlc:3653 On 6 and 17 DF, p-value: < 2.2e-16未通過由上表看到,F(xiàn)值=3633, P值=2.2*10X6,說明回歸方程整體顯著,但是x2,x4,x5,x6 T檢驗(yàn),并且系數(shù)不是整體顯著,故應(yīng)當(dāng)?shù)美^續(xù)優(yōu)化該模型。(4) 逐步回歸tstepv-step(tlm) #逐步回歸Start: AIC=-165.84y xl + x2 +十 x4 + x5 +Dfsu
10、m of sqRSSAIC-x&1OQQ 0E41Q. (U3430-17.72-xd10.00058170.013947-166.81<none>0.013366-165.84-xZ1000282780 016193-163.23-x510.003&5210. 017218-161.76-xl10 01967400.033040-146,11-xS10.02022770.033593-145. 72Df <nane> -x21-x鼻1-x31-xl1Sum of Sq0.0039310 00 5 9210, 024 8660.284415RSS0013
11、965 0.01789600丄否00 3SB510.29S380AIC -16S,?82 -1&4.829 -1&2 299 -146 238-97,299通過逐步回歸法,剔除x6,x4兩個(gè)變量,得到最優(yōu)模型summary(tstep):Call :1 m(formula = y xl + m2 + x3 + 科5* data = mydata_scale)Resi dual s:coeffi cl errs:srd. Errort valueRr(>k|)E5tima匸亡(inter匚Ept)4.231e-185,534C-030 Q001.0000xl9+196e-0
12、1d 675e-0219 671心.30e-14曲旨firx2-6.044e-022.613e-D2-2.3130. 0321-1.9126-013.2875-02-S. 8161_ 33&-O5*住左k52.1fi3e-017.693e-022- S3B0.0105Ml nIQ Median-0.039765 -0.015554 -0.0011743QCL 018759Max0.063174signlf. codes:00.0010*01 - *T 0, OSResidual standard error: 0.02711 on 19 degrees of freedom rulrl
13、ple R-squared:09994 t Adjuied R-squared:0.999 3F-statlstlc: 7818 on 4 and 19 df, p-value: < 2. 2e-16dropl(tstep)Step: ATC=-167.72y - xl + x2 + >3 + x4 + x5DfSum of 5qR55AIC-x410. 0005350.013965-16S. 78<none>0 013450167 72-x510. 004 2460.017676-163-13-x216 004 271CL 017700-153, 09-X31002予
14、工石5Q038794-1442石-Xl10.1920120.205442-1CM_ 26STEP;Zfiy - Xl + X2 -F X3 4- X5single term deletionsDfSum of SqRSSAIC<none>0.Q159G5-168.782X110.2844150.29838D-97.299X210.0039310,017896-164,829x310.0248660.036S31-146,236x510.005921G.019886-162.299Model:y - Kl + X2 + X5tlm<-lm(yx1+x2+x3+x5,data=m
15、ydata_scale)summary(tlm)call:Im (formula = yxl + x2 + x? * x51 data = nyd at a_s c a.1 e)Residuals:Min1q Median如Max-0,039765 -0.015554 -0,001174 Q.01B759 Q.QC5174coefficients;Std * Errort val uePr(>|t|)Estimate(intercept)4.231-185. 534e010, 0001,0000xlg.iece-oi4.67Se0215.6714.30C-14x2-6.C44e-O22.
16、613e022MUG.O321*x3-1.126-01A 2S7e0202-5.S161.33e-O5x52.1B3C-O1了.93e2. 8S80.0105它signify codes:0 *1 0.001 L*' 0,010.05 "”' 0.1 * J 1Residual standard rror:打.02711 on 19 degrees of freedomMultiple R-squared:0.5554 s Adjusted R-squared:0.5S&SF-statistnc:781S on 4 and 19 DF, p-value; &l
17、t; 2,2e-16可以看到,剩余的x1,x2,x3,x5都通過了 T檢驗(yàn)P值最大的為x2=0.0321,但也滿足小于0.05,所以都是高度顯著,回歸方程即:y=4.231e-18+9.196e-01*x1-6.044e-02*x6-1.912e-01*x3+2.183e-01*x5(5) 多重共線性library(car)vif(tlm) #多重共線性mea n(vif(tlm)xlx2x3x4x5>6S42.1757228. 5934946.40663141.21757216.74B44864.33035由上表看到,解釋變量的VIF值的均值為359.912 ,遠(yuǎn)大于10,說明存在較強(qiáng)
18、的多重共線 性,其中 x1,x2,x3,x4,x5 ,x6 的 VIF 值都大于 10,x6=884.33035 為最大。下面逐一剔除VIF值大于10的解釋變量,從最大的x6開始剔除,直到剩余所有解釋變量 的VIF值小于10即可得到最終回歸模型。tlm<-lm(yx1+x2+x3+x4+x5,data=mydata_scale) # vif(tlm)剔除x6xlxBx4x595.8L67521.8118234*96770 108.02054207.33712由上表看到,VIF值大于10 的為 x1,x2,x3.x4,x5.其中x5最大,故剔除x5。tlm<-lm(yx1+x2+x3
19、+x4,data=mydata_scale) #剔除x5vif(tlm)xlX2x3x464.9180528.819842 28.469293 96.4B9227由上表看到,VIF值大于10的解釋變量為x1,x3,x4,其中x4最大,故剔除x4tlm<-lm(yx1+x2+x3,data=mydata_scale) # 剔除 x4vif(tlm)由上表看到,VIF值大于10的解釋變量為x3,故剔除x4由上表看到,所有解釋變量都小于 10,說明此模型不存在強(qiáng)多重共線性,可以作為最終 回歸模型。tlm<-lm(yx1+x2,data=mydata_scale)summary(tlm)3
20、QMax0.031560.06911Coefficients;(Intercept) -3.869e-17 xlx29.662e-01 4. 500e-02Std.8.784e-Q31.295e-021.295e-020,00074.608-3.475Pr(>ltD1. 00000< 2e-16 *0.00226 *signif.cades:0,0010.01 *! 0.05! 0.1 * * 1Residual srandaird error: 0.Q4 3O3 on 21 degrees of freedomMultiple R-squared: 0.9983a Adjuste
21、d R-squared: 0.9981 f-statistic: 6200 on 2 and 21 df, p-value: < 2.2e-16由上表看到,所有的解釋變量都小于10, R方=0.9983 , F值=6200。最后得到的最終回歸模型為:Y=-3.869e-17+9.662e-01*x1-4.5e-02*x22.主成分分析:mydata.prv-pri ncomp(mydata,cor=TRUE)summary(mydata.pr,loadi ngs=TRUE)結(jié)果如下:importance of components: comp. 1 2. 5594594 0.535S33
22、2 0. 9358332standard devlati on proportlon of var5ance cumu'lari ve Proport i oncomp* 20.634784 60.05756450.9533977comp.3 0.17933472 0.004S9442 0.9979209Comp,40” 09 5 796793 0.0013110040.599303090comp_ 50.0618153487 0.000545S768 0.999fl48968call:1 m(formu 1 a = y xl + x2 F dara = mydaTa_scal e)R
23、esiduals:MinIQ Median-0.07378 -0.041420.01867St andard devn afi onProportlon of variance cumuT at I ve Proport ii onComp. 6Comp. 70.0275896640 l_671524e-O2 0. (XWllll丄91 3- 991418C-O5O.9999600853 1.000000+00L oadi ngs :yComp.1 CQinp. 2 Comp. 3 匚omp.4Gomp.5Ccmp» 60 51BComp, 7O, &19-0.332-0.SOS0. 3080. 110X1-Q,JSL-0.32Q 12?Qt 2200. 20£02石呂-O, 742xZ0. 334-0306Q43弓-0,214-0.310-250-Q S31CL 1S30.1346 200X4-O.337-0.175-CL 84 30. 2 51-6 201x5-0.理0903-6 132x6-0-3S8-0.1840,4310.120-6 759O. 187前兩個(gè)主成分累積貢獻(xiàn)率已經(jīng)達(dá)到99
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 全方位備考計(jì)算機(jī)一級(jí)WPS考試試題及答案
- WPS排版技巧及方法試題及答案
- Msoffice使用實(shí)例試題及答案
- 計(jì)算機(jī)一級(jí)Photoshop材料準(zhǔn)備試題及答案
- 2025年軟件設(shè)計(jì)師考試資料對(duì)比試題及答案
- 企業(yè)價(jià)值鏈中的風(fēng)險(xiǎn)識(shí)別試題及答案
- Msoffice工作效率提升試題及答案
- 公司戰(zhàn)略與人力資源戰(zhàn)略的協(xié)同試題及答案
- 2025年計(jì)算機(jī)一級(jí)重點(diǎn)試題及答案
- 現(xiàn)代漢語使用技巧與策略試題及答案
- 夜場(chǎng)水煙合作協(xié)議書
- 河南省青桐鳴大聯(lián)考普通高中2024-2025學(xué)年高三考前適應(yīng)性考試地理試題及答案
- 管道勞務(wù)分包協(xié)議書
- 2025年中考理化生實(shí)驗(yàn)操作考試考務(wù)培訓(xùn)大綱
- 拆遷服務(wù)方案
- 2025-2030中國(guó)鋰電子電池行業(yè)市場(chǎng)深度調(diào)研及前景趨勢(shì)與投資研究報(bào)告
- 天津市部分區(qū)小學(xué)2025年小升初數(shù)學(xué)自主招生備考卷含解析
- 2021年高考地理試卷(全國(guó)甲卷)(空白卷)
- (二模)2024~2025學(xué)年度蘇錫常鎮(zhèn)四市高三教學(xué)情況調(diào)研(二)數(shù)學(xué)試卷(含答案詳解)
- 2024初級(jí)社會(huì)工作者職業(yè)資格筆試題庫(kù)附答案
- 江蘇省南京市建鄴區(qū)2023-2024學(xué)年八年級(jí)下學(xué)期期末考試物理試題【含答案解析】
評(píng)論
0/150
提交評(píng)論