基于R語言的上海房價預測模型_第1頁
基于R語言的上海房價預測模型_第2頁
基于R語言的上海房價預測模型_第3頁
基于R語言的上海房價預測模型_第4頁
基于R語言的上海房價預測模型_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、- -基于R語言的上海房價預測模型摘要:利用R語言優(yōu)秀的統(tǒng)計計算和統(tǒng)計制圖特點,對多元統(tǒng)計模型進行分析。本文建立的模型主要是討論上海商品房房價問題??紤]到商品房經(jīng)濟始于1998年,且可供查找的數(shù)據(jù)截止到2011年,故本文的數(shù)據(jù)來源于1998-2011年的上海統(tǒng)計年鑒和國家統(tǒng)計局。在本文中主要討論影響上海商品房房價的因素及各個因素對于房價的影響作用,考慮到房地產(chǎn)不同于一般的消費品,它不僅提供居住的功能,帶來收租收益,發(fā)生價值增值,而且對人的行為有重要的影響,因此,在進行預測自由貿(mào)易下的房價時,本文主要從人均生產(chǎn)總值、人均可支配收入、商品零售價格指數(shù)、常住人口、住房竣工面積、住宅投資總額、居民居住

2、消費價格指數(shù)7個方面來考慮對于商品房房價的影響。本文在建模型時,先通過R軟件擬合商品房房價與時間的非線性回歸模型,再利用7個自變量與因變量商品房價多元線性關(guān)系,并進行逐步回歸,得到最優(yōu)回歸模型。最后將時間的非線性回歸模型與影響因素的多元線性模型預測值進行比較,給出2012、2013、2014年的房屋價格,其中2012年與2013年可與實際進行對比,進而評價模型的好壞。關(guān)鍵詞:R語言非線性回歸多元線性回歸價格預測模型顯著性檢驗第一章分析軟件R語言簡介R語言是屬于GNG系統(tǒng)的一個自由、免費、源代碼開放的軟件,是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具。主要用于統(tǒng)計分析、繪圖的語言和操作環(huán)境。R本來是由

3、來自新西蘭奧克蘭大學的RossIhaka和RobertGentleman開發(fā)(也因此稱為R),現(xiàn)在由“R開發(fā)核心團隊”負責開發(fā)。R是基于S語言的一個GNU項目,所以也可以當作S語言的一種實現(xiàn),通常用S語言編寫的代碼都可以不作修改的在R環(huán)境下運行。R的語法是來自Scheme。R的源代碼可自由下載使用,亦有已編譯的可執(zhí)行文件版本可以下載,可在多種平臺下運行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。R主要是以命令行操作,同時有人開發(fā)了幾種圖形用戶界面。R的功能能夠通過由用戶撰寫的套件增強。增加的功能有特殊的統(tǒng)計技術(shù)、繪圖功能,以及編程介面和數(shù)據(jù)輸出/輸入功能。這

4、些軟件包是由R語言、LaTeX、Java及最常用C語言和Fortran撰寫。下載的執(zhí)行檔版本會連同一批核心功能的軟件包,而根據(jù)CRAN紀錄有過千種不同的軟件包。其中有幾款較為常用,例如用于經(jīng)濟計量、財經(jīng)分析、人文科學研究以及人工智能。第二章商品房房價與時間的非線性模型數(shù)據(jù)準備本文從研究影響房地產(chǎn)價格的因素入手,鑒于國家在1998年出臺停止福利分房,進而促進了的商品房的自由貿(mào)易,故數(shù)據(jù)始于1998年,且上海統(tǒng)計年鑒可查的到2011年年鑒,故通過綜合國家統(tǒng)計局及上海市年鑒1998年2011年的房地產(chǎn)相關(guān)數(shù)據(jù),最后篩選出如下可能影響未來房地產(chǎn)價格走勢的變量,本文取定七個因素:x:人均生產(chǎn)總值;x:人

5、均可支配收入;x:商品零售價格指數(shù);x:常1234住人口;x:住房竣工面積;x:住宅投資總額;x:居民居住消費價格指數(shù);567y:上海商品房房產(chǎn)均價m數(shù)據(jù)如下:tyx1x2x3x4x5x6x71998302125206877341521527.001963.51404.96113.619993176270711093240401567.001731.55378.82105.920003326300471171838951608.601724.02443.90103.320013659317991288338401668.331743.9466.71102.3200240073395813250

6、37901712.971880.5584.51100.020034989384861486737541765.842280.79694.30101.120046385448391668337881834.983270.43922.61101.620056698496481864537671890.262819.35936.36102.920068237548582066837741964.112746.8854.15102.9200710292620402362338652063.582843.62853.13104.5200813411669322667540712140.651899.48

7、71.52102.5200915800691652883840482210.281522.07922.8196.6201019276760743183841172302.661415.441232.96103.5201124595825603623042842347.461581.031403.13105.42.2建立非線性模型首先對y畫出關(guān)于時間t的散點圖,對應的R語言程序為:X=read.csv(E:2.csv)attach(X)plot(t,y)得到圖一:1998200020022004200620082010t由散點圖可知,初步認為y與t成指數(shù)關(guān)系,利用R語言進行擬合檢驗。m- - -

8、對指數(shù)函數(shù)y=aebt兩邊取自然對數(shù)得:lny=Ina+bt,令y=lny,a=Ina則mm1m1可將其化為一元線性函數(shù)y二a+bt對y取對數(shù)并進行一元線性回歸的R語言11m程序為:yl=log(ym)al=log(a)reg=lm(y1t)summary(reg)得到結(jié)果如下:腌RConsoleI=|回Call:lM(fo22niulaL=ylt4ResidaslB:MinIQMedian3QMax-1.395e-13-1.057e-146.60Se-152.419e-145.532e-14Coefficients:EBtiir.dteStd.Errort-vslae(Intexcept)一

9、3603e-l:365E+13t1.6Ble-013.296e-155.099e+132e-16Signif.codes:00.0010.010.05J0.11R亡sidaalstandarderror972e-lon12d亡qh亡亡日of:E工亡亡dono.MultipleR-sqjiared:1,AdjustedR-sq口atireid.:1F-statistic:2.6e47on1and1DFfp-vdlae:Residuals:37-3u3HinIQedzan-5237-23212DE百匚口eftieiant3:Em匚Imaze3匸d.Error匸valuePr(匸|)rnrercep

10、n)XlxZx3x7-4.725e0-3-今.2e-011259=-0J5g7c0(J9312=001-630e-013758=H-0CI曹.222E-+011.975e+042239e-01S.204?-012104+00l05=十Cd丘.739=-Dl17B8=十DOZIOIe+DI-2.3930.053B4-01DA653,923000773*2,92O.0311G&0.S570.421130.220Slt|IIntercept卜-3a135e+043a-659e-bO3-ea5692-65e-05Xl2829e-ai7-241S-02-39070004502A-frx2:L220C+Q

11、O937e-Ql6.1090000227曲E881e-k0a1832e+00312E001411E*4-133e+00l-131e-FaO500000807-6A-fr3-856e+016-llle-bai06310545618Signifcodes:Q,斃足!ft*0.0-310.011I0057ResidualSLandaLXClerrcr:383on8degreesfreedamMultipleR-squared:CL998fAdjustedR-squared:05967F-statistic:on5andSDF,p-value:1438e-10繼續(xù)剔除x,7Reg4=lm(ymx1+x

12、2+x3+x6)summary(reg4)得到如下結(jié)果:11:Im(fcizml3L=*Xl4x24-x3Rrsiduals-HinTIQ-632.02-7E.96.E4205.2S3SD.33Coefficicnts:EsLima匸eSLdErrorcvaluePrOlEl)(Intercept-3.136e+O3,535e+03-8.073勺.59e-0Kl53B=-O15-3356-02-4.705D001213126=十QCI1237e-017501D7e-0SxS6916=+00苦.SSfe-Ol7.77427Se-05KBr535e-l-O05,5716-01今.73EDOOlOf

13、iSignifcdes:05D011*J30百13.J111Residualscaxidarderxcx:3757OH9degree3工needomMultipleR.-squared:Q.勺?79尸AdjustedR-squared:-statistic:10S1ar.4and殳DFpvalues5072e-12盤RConsoler對結(jié)果整理得:B0B1B2B3B6估計值標準差T值P值-3.136e+043.535e+03-8.8739.59e-06*-2.538e-015.395e-02-4.7050.00111*1.126e+001.287e-018.7501.07e-05*6.916e

14、+008.896e-017.7742.78e-05*4.538e+009.577e-014.7380.00106*對系數(shù)進行顯著性檢驗,由結(jié)果可知,P,P,P,P,P在=0.05條件下,01236、II丨均拒絕原假設,認為具有很好的效果。對方程進行檢驗,殘差的標準差為375.7而相關(guān)系數(shù)R2=0.9969,P值小于0.05,效果明顯,故拒絕原假設,即認為y與各個變量之間存在多元線性回歸關(guān)m系。3.3模型的總結(jié)通過三次逐步回歸,則最終得到最優(yōu)的多元線性模型為:y=31360-0.2538*x+1.126*x+6.916*x+4.538*xTOC o 1-5 h zm1236從該模型分析可知,在所

15、選的因素中,x:人均生產(chǎn)總值;x:人均可支配12收入;x:商品零售價格指數(shù);x:住宅投資總額等因素被保留了下來,而x:364常住人口;x:住房竣工面積;x:居民居住消費價格指數(shù)被剔除,特別是x574- -和x本應該對房價產(chǎn)生直接影響,通過分析可知,上海市住房竣工面積并不是逐5年增加或減少等的規(guī)律性變化,呈現(xiàn)無規(guī)律性,這導致它在作為影響因素發(fā)揮的作用大大減小,而x為何也被剔除,在我的能力范圍內(nèi),分析認為可能是因為其4隨時間變化緩慢造成的。第四章房價預測及模型的對比評價指數(shù)方程預測房價故本文共得到兩個預測模型及其預測值為:y關(guān)于t的指數(shù)方程為:m亍=(3.220924e-143)*exp(0.16

16、81*t)m對ym進行預測的R語言程序為:tt=2012:2014yy=a*exp(b*tt)yy三年的預測值為:20122013201424765.3329298.7534662.03多元線性回歸預測房價y關(guān)于影響因素的多元線性回歸模型:my=-313600.2538*x+1.126*x+6.916*x+4.538*xm1236在國家不出臺政策的條件下,我們假設7個自變量按照符合實際的增長率增長,依次求出未來三年的各項數(shù)據(jù)。自變量增長率2012年2013年2014年人均生產(chǎn)總值10%9081699897.6109887.4人均可支配收入10%3985343838.348222.1商品零售價格

17、指數(shù)2%4369.74457.14546.2住宅投資總額7%1501.351606.441718,89帶入回歸方程,則可得多元線性方程預測的三年房價的值為:20122013201427499.3530763.2434245.12預測模型的對比評價通過收集實際數(shù)據(jù),與兩個預測模型進行對比,可對預測的結(jié)果進行評價得到結(jié)果如下:兩個模型預測房價與實際房價的對比201220132014實際房價2569129537(截止到5月)無時間指數(shù)模型預測值24765.3329298.7534662.03與實際的偏差比例3.6%6.6%無多因素回歸模型預測值27499.3530763.2434245.12與實際的

18、偏差比例6.5%4.2%無則可知,指數(shù)模型和多因素線性回歸模型均得到較好的預測值,預測偏差均非常小。根據(jù)房價時間模型,房價將隨著時間呈指數(shù)增長之勢,因此必須出臺相關(guān)政策,有效抑制房價增長。根據(jù)多元線性模型,房價與各個自變量的正負相關(guān)性就是各個變量前系數(shù)的正負。要抑制房價的增長,可以通過使系數(shù)為正的自變量增長率減少,系數(shù)為負的自變量增長率增加來達到目的。比如可以通過中央人民銀行對于貸款利率的增加,減少投資者的過度投機行為,使土地拍賣價格降低,直接降低房屋成本,同時貸款利率的增加減少了房地產(chǎn)商的貸款,使房地產(chǎn)商資金面收緊,迫使其降價賣出現(xiàn)有房屋,已達到回籠資金償還原來貸款的目的??偨Y(jié)學習的心得是:學習一個軟件,并將其應用于實踐,可以快速提高軟件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論