基于R軟件的北京農林牧漁總產值多元線性回歸分析_第1頁
基于R軟件的北京農林牧漁總產值多元線性回歸分析_第2頁
基于R軟件的北京農林牧漁總產值多元線性回歸分析_第3頁
基于R軟件的北京農林牧漁總產值多元線性回歸分析_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、摘要:農林牧漁業(yè)作為第一產業(yè)在整個國民經濟運行中起著重要的作用,一方面它作為其他行業(yè)提供賴以生存的物質基礎,另一方面它也能很好地解決勞動力就業(yè)等社會問題,本文運用統(tǒng)計學方法,通過R軟件進行數(shù)據(jù)處理,研究2004年至2012年北京農林牧漁業(yè)總產值與農業(yè)、林業(yè)、牧業(yè)、漁業(yè)等因素的關系,從而提出合理的建議,來發(fā)展國民經濟關鍵詞:相關性分析,多元線性回歸,回歸診斷一、相關性分析(散點圖)本文選擇2003年至2012年北京農林牧漁總產值,農業(yè)總產值、林業(yè)總產值、牧業(yè)總產值、漁業(yè)總產值(單位:億元)進行系統(tǒng)分析,如下表(表1)所示:TOC o 1-5 h z200420052006200720082009

2、2010201120122013總產值262268.85240.19272.3303.9314.95328363.14395.71421.78農業(yè)92.68100.59104.47115.48128.1140.44154.2163.37166.29170.41林業(yè)12.7413.3414.7917.7820.4922.916.818.9254.8375.89牧業(yè)138.69135.75105.14122.38140.52136.08139.6162.73154.16154.75漁業(yè)9.869.739.7910.169.7910.2811.511.5212.9812.78設農林牧漁業(yè)總產值為y,

3、農業(yè)總產值為I林業(yè)總產值為x2,牧業(yè)總產值為x3,漁業(yè)總產值為x4,分別畫出y與片込込込的散點圖(圖1):圖1立多元線性模型由圖1可知,四個元素基本滿足線性關系,因此設回歸方程為y邙1X1+卩2X2+卩3X3+卩4X4+%用R軟件計算的結果是用于回歸方程檢驗的F統(tǒng)計量的p值與用于回歸系數(shù)檢驗的t統(tǒng)計量的p值均很?。?05),因此回歸方程與回歸系數(shù)的檢驗都是顯著的,回歸方程為:Y=0.90914X1+0.97949X2+1.05197X3+2.64014X4-5.66337三、預測2013年農林牧漁總產值用predict命令預測出y=420.1301,相應的y的0.95的預測區(qū)間為【414.65

4、94,,425.6008】,與2013年的真實值421.78比較,相對誤差為0.3912%,所以該多元線性回歸模型較合理,預測性良好。四、方差齊性的診斷及修正方法根據(jù)殘差圖判斷誤差方差是否齊性,若為非齊性,可以通過對因變量作適當?shù)淖儞Q,使得關于因變量在回歸中誤差的方差接近齊性。利用residual和standard命令畫出殘差圖和標準殘差圖,如下圖(圖2)所示圖2觀察圖2可知,殘差圖集中于下部,從左到右有逐漸聚合的趨勢,方差齊性不成立,所以,考慮對x和y做對數(shù)變換,下圖(圖3)是變換后的標準殘差圖o:oC1ooo:o0QQ15.515.-65.75.815.9yr.fiit圖3由上述殘差圖可看

5、出,觀測點的分布有明顯改善,沒有什么規(guī)律。變換后的回歸方程為lny=0.326153lnX1+0.07663725lnX2+0.502905491lnX3+0.19323851lnX4五、異常點的識別如果某一年出現(xiàn)什么異常情況影響了生產值,使得偏離正常范圍,例如禽流感等會引起畜牧業(yè)生產值的下降,也可能某一年的生產值特別高,如果采用這樣的數(shù)據(jù)就不利于模型的確立,在擬合預測時就會出現(xiàn)誤差,若出現(xiàn)異常點,結合實際情況進行分析。標準化殘差的絕對值=2的觀測點認為是可疑點,絕對值=3的觀測點認為是異常點若存在異常點,根據(jù)含有異常點的觀測值算出的回歸模型就具有一定的誤差,準確性降低,找到異常點并剔除就顯得

6、很重要。觀察圖3可知,沒有可疑點和異常點,所有數(shù)據(jù)均合理。說明我市農林牧漁業(yè)發(fā)展穩(wěn)定,其他因素的影響不大。六、影響分析從分析觀測點對回歸結果的影響入手,找出對回歸結果影響很大的觀測點,用influence.measures命令判斷影響性大小,結果為除第五個觀測點之外,都是強影響點第五個數(shù)據(jù)是2008年農林牧漁產值情況,2008年發(fā)生很多天災人禍加上奧運會的召開,農林牧漁歌行業(yè)會受到一定的影響,偏離正常范圍。七、共線性診斷在擬合多元線性回歸時,自變量之間可能會存在線性關系或近似線性關系,自變量之間的線性關系會隱蔽變量之間的顯著性,增加參數(shù)估計的誤差,還會產生一個很不穩(wěn)定的模型,所以利用vif命令

7、觀察是否存在線性關系,結果是X1,X2,X3,X4方差膨脹因子均小于10,所以這四個因素之間不存在共線性問題。所以因變量為這四個因素,產生的多元回歸模型較合理穩(wěn)定。主觀上,我們可能會認為農林牧漁各業(yè)之間應該會有一定的聯(lián)系,但計算表明,這四個因素之間并沒有什么線性關系,獨立發(fā)展。八、結論農林牧漁總產值受農業(yè)、林業(yè)、牧業(yè)、漁業(yè)影響顯著,隨這四個因素的變化而變化,y由最后的回歸方程可以看出,農林牧漁總產值受農業(yè)和牧業(yè)的影響最顯著,所以我市需要大力發(fā)展農業(yè)和牧業(yè),已提高農林牧漁總產值,促進農村經濟發(fā)展,力求為我市經濟建設作出更大的貢獻。加強農業(yè)基礎設施建設,提高有限耕地的生產能力,對農業(yè)基礎設施投入要

8、提高,財政信貸要增加支農資金;積極優(yōu)化農業(yè)結構,引進優(yōu)良品種,增強農產品市場競爭力;進一步宣傳落實農村改革的各項強農、惠農扶持政策,推進農業(yè)產業(yè)化進程推進特色產業(yè);積極因勢利導,推動農牧名和政府大力發(fā)展設施、人工牧場、高產飼草料基地及產業(yè)化養(yǎng)殖,從根本上改變牧業(yè)靠天吃飯飛被動局面,提高土地產出率,實現(xiàn)從傳統(tǒng)牧業(yè)向現(xiàn)代牧業(yè)的轉變,確保糧食安全。參考文獻:【1】湯銀才,R語言與統(tǒng)計分析,高等教育出版社,2008年5月【2】2012年國家強農惠農政策措施匯總 HYPERLINK /view/9c690e6a1eb91a37f1115c34.html?re=view /view/9c690e6a1eb91a37f1115c34.html?re=view【3】北京郊區(qū)健康養(yǎng)殖的思考 HYPERLINK /view/2d57b643336c1eb91a375d20.html /view/2d57b643336c1eb91a375d20.html【4】十二五北京都市型現(xiàn)代農業(yè)發(fā)展規(guī)劃 HYP

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論