版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1回歸分析中SAS的使用21、回歸分析計算PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量;RUN;PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量名列/ p cli clm RUN;32、回歸線作圖PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量/p cli clm r; PLOT y變量*x變量/選項;RUN;利用plot語句可以繪制與擬合數(shù)據(jù)有關(guān)散點(diǎn)圖、回歸線和置信曲線、預(yù)測區(qū)間曲線4回歸線作圖PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量/p cli clm r; PLOT y變量*x變量/選項;RUN;y變量和
2、x變量可以是應(yīng)變量、自變量和其它與回歸分析有關(guān)的變量:p.(predicted) 預(yù)測值r. (residual) 余差U95., L95. 預(yù)測值置信限U95M.,L95M.預(yù)測均值置信限選項:conf 95作預(yù)測均值置信曲線pred95作預(yù)測值置信曲線overlay將語句中規(guī)定的圖迭置在一幅圖上AIC CP MSE SSE在圖上顯示相應(yīng)的統(tǒng)計量53、逐步回歸分析計算-變量選擇PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量名列/p cli clm r selection=stepwise slentry=0.05 slstay=0.05 details;RUN;64、回歸
3、診斷例外值(outliers)或異常作用點(diǎn)的檢查從已擬合回歸的數(shù)據(jù)中分析線性模型的假定是否被破壞:應(yīng)變量的均值是否是獨(dú)立變量的線性函數(shù),是否需要對變量進(jìn)行變換或擬合曲線回歸余差(residuals)是否同方差,不相關(guān),正態(tài)分布獨(dú)立變量間是否存在線性關(guān)系(僅多元有)考察余差散點(diǎn)圖是進(jìn)行回歸診斷的必要步驟7回歸診斷8回歸診斷回歸分析的余差值是回歸診斷的重要工具rYYiii = - 個預(yù)測值為第其中 :余差的定義為iYYYriiii 利用余差可以考察余差和預(yù)測值的散點(diǎn)圖也可以檢驗余差分布的正態(tài)性9回歸診斷3.4.1.2.模型合適模型合適應(yīng)改曲線模應(yīng)改曲線模型型不等方差不等方差觀測值不獨(dú)立觀測值不獨(dú)立
4、10回歸診斷生成余差在PROC REG的model語句加上選項 p,就會輸出預(yù)測值和相應(yīng)的余差PROC REG DATA=數(shù)據(jù)集名; MODEL 應(yīng)變量=自變量/p; PLOT y變量*x變量/選項;RUN;利用plot語句 plot r.*p. ; 就可得到余差-預(yù)測散點(diǎn)圖11回歸診斷識別異常觀測值在PROC REG的model語句加上選項 r,就會輸出與預(yù)測值和余差有關(guān)的一些統(tǒng)計量。他們可用于識別異常數(shù)據(jù)(outlier)及其影響PROC REG DATA=數(shù)據(jù)集名 ; MODEL 應(yīng)變量=自變量/r;RUN;Predict Value 預(yù)測值Std Err Predict 預(yù)測值標(biāo)準(zhǔn)差R
5、esidual 余差Std Err Predict 余差標(biāo)準(zhǔn)差Student Residual student化的余差-2 -1 0 1 2 余差顯著性圖Cooks D Cooks D統(tǒng)計量12回歸診斷余差分布正態(tài)性有了余差的數(shù)據(jù),就可對其運(yùn)用圖形方法或正式的分布正態(tài)性的檢驗在INSIGHT中可直接對數(shù)據(jù)表中的預(yù)測余差變量進(jìn)行分析在PROC REG可利用下列語句用圖形分析余差分布正態(tài)性PROC REG DATA=數(shù)據(jù)集名 graphics ; MODEL 應(yīng)變量=自變量; PLOT nqq.*student.(nqq.*r.);RUN;13回歸診斷識別有影響的觀測Cook D統(tǒng)計量度量一個觀測
6、從分析中剔除時參數(shù)估計值的變化對一個觀測值其 Cook D 統(tǒng)計量的值超過 4/n 時(n為樣本容量),這個觀測存在反常效應(yīng)14回歸診斷識別有影響的觀測Dffitsi 度量第i 個觀測對預(yù)測值的影響iY第i個觀測的預(yù)測值 )(iY用排除第i個觀測的回歸對第i個觀測的預(yù)測值 )(iYS第i個觀測的預(yù)測值的標(biāo)準(zhǔn)差 )(Dffits)(iiiiYsYY npi/2? |Dffits|p 為模型中參數(shù)的個數(shù), n 為樣本容量15回歸診斷識別有影響的觀測Proc REG 的 Model語句加選項 r 可獲得 Cook D 統(tǒng)計量Proc REG 的 Model語句加選項 influence 可獲得 Df
7、fits 等反映觀測值影響的統(tǒng)計量PROC REG DATA=數(shù)據(jù)集名 ; MODEL 應(yīng)變量=自變量/r influence;RUN;16選項 influence 生成的統(tǒng)計量 17五、影響點(diǎn)診斷proc reg data=e4;model y1=x1-x4/influence r;run;其中選項influence 同上一頁。R主要給出Cook-distance.前面已有。18六、共線性診斷共線性(collinearity, multicollinearity)問題是指獨(dú)立變量間存在線性關(guān)系變量間的線性關(guān)系會隱蔽變量的顯著性也會增加參數(shù)估計的方差產(chǎn)生不穩(wěn)定的模型只有擬合多元回歸才會發(fā)生這一
8、問題共線性的診斷可使用方差膨脹因子、條件指數(shù)和方差比例19回歸診斷共線性診斷-VIF方差膨脹因子(VIF)是對由于共線性而引起的參數(shù)估計量的方差增加的一個相對度量r2rTOL111VIFrR獨(dú)立時系數(shù)方差系數(shù)方差Rr2 是Xr關(guān)于模型中其它獨(dú)立變量回歸的R2一般采用 VIF 10 表明存在共線性問題Proc REG 的Model語句加選項 VIF20回歸診斷共線性診斷-條件指數(shù)和方差比例條件指數(shù)(condition index)和方差比例(variance proportion)聯(lián)合使用可確認(rèn)存在線性關(guān)系的變量組條件指數(shù)(hi=(lmax/li)1/2)在10-30間為弱相關(guān)在30-100間為中度相關(guān)大于100表明有強(qiáng)相關(guān)大的條件指數(shù)伴隨方差比例 0.5 可確認(rèn)有共線性的獨(dú)立變量子集Proc REG: Model語句加選項collin 或 collinoint
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版門窗行業(yè)品牌推廣與宣傳合同4篇
- 二零二五年度文化產(chǎn)業(yè)發(fā)展基金擔(dān)保貸款合同樣本3篇
- 二零二五年度建設(shè)工程施工合同擔(dān)保服務(wù)協(xié)議2篇
- 2025年離婚補(bǔ)充協(xié)議辦理及情感咨詢合同2篇
- 2025年度銅棒生產(chǎn)安全防護(hù)與應(yīng)急救援合同
- 二零二五年度智能快遞柜租賃及配送服務(wù)合同3篇
- 2025年度大宗貨物物流運(yùn)輸責(zé)任與保險合同范本
- 2025年度個人住宅租賃合同范本7篇
- 課題申報參考:民族交融視域下唐代四夷樂舞伎服飾形象研究
- 課題申報參考:媒介創(chuàng)新視角下中華傳統(tǒng)文化傳播的“數(shù)字新考”研究
- 湖北省黃石市陽新縣2024-2025學(xué)年八年級上學(xué)期數(shù)學(xué)期末考試題 含答案
- 硝化棉是天然纖維素硝化棉制造行業(yè)分析報告
- 央視網(wǎng)2025亞冬會營銷方案
- 《00541語言學(xué)概論》自考復(fù)習(xí)題庫(含答案)
- 《無砟軌道施工與組織》 課件 第十講雙塊式無砟軌道施工工藝
- 2024新版《藥品管理法》培訓(xùn)課件
- 《阻燃材料與技術(shù)》課件 第7講 阻燃橡膠材料
- 爆炸物運(yùn)輸安全保障方案
- 電力安全工作規(guī)程(完整版)
- 借名買車的協(xié)議書范文范本
- 江蘇省南京市2025屆高三學(xué)業(yè)水平調(diào)研考試數(shù)學(xué)試卷(解析版)
評論
0/150
提交評論