![R語言與回歸分析_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/8/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c0/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c01.gif)
![R語言與回歸分析_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/8/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c0/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c02.gif)
![R語言與回歸分析_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/8/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c0/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c03.gif)
![R語言與回歸分析_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/8/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c0/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c04.gif)
![R語言與回歸分析_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/8/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c0/19dd7b0d-d3fa-4dbf-8501-2f5ae279d7c05.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、R 語言與回歸分析回歸模型是計量里最基礎也最常見的模型之一。究其原因,我想是因為在實際問題中我們并不知道總體分布如何,而且只有一組數(shù)據(jù),那么試著對數(shù)據(jù)作回歸分析將會是一個不錯的選擇。一、簡單線性回歸簡單的線性回歸涉及到兩個變量:一個是解釋變量,通常稱為X;另一個是被解釋變量,通常稱為y?;貧w會用常見的最小二乘算法擬合線性模型:yi=B0+B1xi+si其中BO和Bl是回歸系數(shù),表示誤差。在R中,你可以通過函數(shù)lm()去計算他。Lm()用法如下:lm(formula,data,subset,weights,na.action,method=qr,model=TRUE,x=FALSE,y=FALS
2、E,qr=TRUE,singular.ok=TRUE,contrasts=NULL,offset,.)參數(shù)是formula模型公式,例如yx。公式中波浪號()左側(cè)的是響應變量,右側(cè)是預測變量。函數(shù)會估計回歸系數(shù)B0和B1,分別以截距(intercept)和x的系數(shù)表示。有三種方式可以實現(xiàn)最小二乘法的簡單線性回歸,假設數(shù)據(jù)wagel(可以通過names函數(shù)查看數(shù)據(jù)框各項名稱)(1)lm(wage1$wagewage1$educ+wage1$exper)lm(wageeduc+exper,data=wage1)(3)attach(wage1)lm(wageeduc+exper)#不要忘記處理完后用
3、detach()解出關(guān)聯(lián)我們以數(shù)據(jù)wagel為例,可以看到工資與教育水平的線性關(guān)系:運行下列代碼:library(foreign)Alm(wageeduc,data=A)Call:lm(formula=wageeduc,data=A)Coefficients:(Intercept)educ-0.90490.5414當然得到這些數(shù)據(jù)是不夠的,我們必須要有足夠的證據(jù)去證明我們所做的回歸的合理性。那么如何獲取回歸的信息呢?嘗試運行以下代碼:result|t|)(Intercept)-0.904850.68497-1.3210.187educ0.541360.0532510.1672e-16*Sign
4、if.codes:0*0.001*0.010.05.0.11Residualstandarderror:3.378on524degreesoffreedomMultipleR-squared:0.1648,AdjustedR-squared:0.1632F-statistic:103.4on1and524DF,p-value:2.2e-16解讀上述結(jié)果,我們不難看出,單從判決系數(shù)R-squared上看,回歸結(jié)果是不理想的, 但是, 從p值來看, 我們還是可以得到回歸系數(shù)是很顯著地 (注意, 這里的P0.05就可以認為拒絕回歸系數(shù)為0,即回歸變量與被解釋變量無關(guān)的原擇假設,選擇備擇假設)所以說我
5、們的回歸的效果不好但還是可以接受的。當然,這一點也可以通過做散點圖給我們直觀的印象:2gCDOJ4Dg8ooczS3-8Omws0IHi80HB00Omws0IHi80HB0000o800o8Q20O8BQ20O8BQ1012141618educ但是影響薪酬的因素不只是education,可能還有其他的,比如工作經(jīng)驗,工作任期。為了更好地解釋影響薪酬的因素,我們就必須用到多元線性回歸二、多元線性回歸還是使用lm函數(shù)。在公式的右側(cè)指定多個預測變量,用加號(+)連接:lm(yu+v+w)顯然,多元線性回歸是簡單的線性回歸的擴展??梢杂卸鄠€預測變量,還是用OLS計算多項式的系數(shù)。三變量的回歸等同于這
6、個線性模型:yi=B0+B1ui+B2vi+B3wi+si在R中,簡單線性回歸和多元線性回歸都是用lm函數(shù)。只要在模型公式的右側(cè)增加變量即可。輸出中會有擬合的模型的系數(shù):result1summary(result1)Call:lm(formula=wageeduc+exper+tenure,data=A)Residuals:Min1QMedian3QMax-866.29-249.23-51.07189.622190.01Coefficients:EstimateStd.ErrortvaluePr(|t|)(Intercept)-276.240106.702-2.5890.009778*Sign
7、if.codes:0*0.001*0.01*0.05Residualstandarderror:374.3on931degreesoffreedomMultipleR-squared:0.1459,AdjustedR-squared:0.1431F-statistic:53on3and931DF,p-value:2.2e-16educ74.415exper14.892tenure8.2576.28711.8363.2534.5782.4983.306plot(wageeduc,data=A)A$logwageresult1summary(result1)Call:lm(formula=logw
8、ageeduc+exper+tenure,data=A)Residuals:Min1QMedian3QMax-2.05802-0.29645-0.032650.287881.42809Coefficients:EstimateStd.ErrortvaluePr(|t|)(Intercept)0.2843600.1041902.7290.00656*educ0.0920290.00733012.5552e-16*exper0.0041210.0017232.3910.01714*tenure0.0220670.0030947.1333.29e-12*Signif.codes:0*0.001*0.
9、010.05.0.11Residualstandarderror:0.4409on522degreesoffreedomMultipleR-squared:0.316,AdjustedR-squared:0.3121F-statistic:80.39on3and522DF,p-value:2.2e-16看得出,平穩(wěn)化后的數(shù)據(jù)線性性是更加好的。下面我們來提取回歸分析的各項統(tǒng)計數(shù)據(jù):一些統(tǒng)計量和參數(shù)都被存儲在lm或者summary中outputv-summary(result1)SSR-deviance(result1)#殘差平方和;(另一種方法:RSquared-output$r.squared
10、)LL-logLik(result1)#對數(shù)似然統(tǒng)計量DegreesOfFreedom-result1$df#自由度Yhat-result1$fitted.values#擬合值向量Resid-result1$residualss-output$sigma#誤差標準差的估計值(假設同方差)CovMatrix-sA2*output$cov#系數(shù)的方差一協(xié)方差矩陣(與vcov(resultl)同)ANOVA-anova(result1)confidentinterval-confint(result1)#回歸系數(shù)的置信區(qū)間,level=0.95effects(result1)#計算正交效應向量(Vectoroforthogonaleffects)三、檢查結(jié)果通過圖形我們可以以一種十分直觀的辦法檢測我們的擬合效果:plot(result1)NormalCVQ通過擴展包car中的函數(shù)來檢測異常
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- g k h 說課稿-2024-2025學年語文一年級上冊統(tǒng)編版
- 2024年四年級英語上冊 Unit 5 I like those shoes Lesson 30說課稿 人教精通版(三起)
- 14小狗學叫 說課稿-2024-2025學年三年級上冊語文統(tǒng)編版
- 項目產(chǎn)品推廣方案
- Unit 1 My classroom Part B Read and write 大單元整體說課稿表格式-2024-2025學年人教PEP版英語四年級上冊
- 5《協(xié)商決定班級事務》第1課時(說課稿)-部編版道德與法治五年級上冊
- 出售供暖平房合同范本
- Unit 4 Then and now 單元整體(說課稿)-2023-2024學年人教PEP版英語六年級下冊
- 萬億存款合同范例
- 中介房產(chǎn)抵押合同范例
- Unit 2 Know your body(說課稿)-2024-2025學年外研版(三起)(2024)英語三年級下冊
- 跨學科主題學習2-探索太空逐夢航天 說課稿-2024-2025學年粵人版地理七年級上冊
- 《電子技術(shù)應用》課程標準(含課程思政)
- 電力儲能用集裝箱技術(shù)規(guī)范
- 小學生雪豹課件
- 《課標教材分析》課件
- 《信號工程施工》課件 項目一 信號圖紙識讀
- 基礎護理常規(guī)制度
- 針灸治療動眼神經(jīng)麻痹
- 傾聽幼兒馬賽克方法培訓
- 設備日常維護及保養(yǎng)培訓
評論
0/150
提交評論