回歸分析及其SAS過程_第1頁
回歸分析及其SAS過程_第2頁
回歸分析及其SAS過程_第3頁
回歸分析及其SAS過程_第4頁
回歸分析及其SAS過程_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

回歸分析及其SAS過程一、回歸分析回歸分析是研究一個(gè)變量與一組變量之間關(guān)系的重要手段?;貧w分析中主要解決的問題有:

1.建立回歸模型并進(jìn)行顯著性檢驗(yàn);

2.進(jìn)行回歸診斷;

3.回歸預(yù)測。最為普遍使用于進(jìn)行一般線性回歸模型的擬合分析過程。二、回歸分析過程在SAS/STAT中有多種回歸分析的過程,主要有:1.REG2.GLM通用線性模型(GeneralLinearModel)用最小二乘法擬合,既可處理連續(xù)變量又可處理離散型變量。其主要功能有:建立二次響應(yīng)面回歸模型,并對之進(jìn)行分析以確定1)建立一般線性回歸模型,包括簡單回歸、多重線性回歸、多項(xiàng)式回歸及加權(quán)回歸;3.NLIN借助于迭代法對用戶自行選定的回歸表達(dá)式擬合非線性回歸模型。4.RSREG最優(yōu)響應(yīng)因子水平,還可進(jìn)行嶺回歸分析.2)進(jìn)行方差分析。1.可處理多個(gè)Model語句;2.提供多達(dá)9種模型選擇方法;3.對線性及多變量假設(shè)進(jìn)行檢驗(yàn);4.作數(shù)據(jù)或統(tǒng)計(jì)量的散點(diǎn)圖;5.可進(jìn)行回歸診斷并給出相應(yīng)統(tǒng)計(jì)量;可利用相關(guān)陣或協(xié)方差陣作為建立模型的數(shù)據(jù),并可將它們輸出到SAS數(shù)據(jù)集中;三、REG過程的主要功能

回歸預(yù)測,并估計(jì)預(yù)測值,殘差、學(xué)生化殘差,可信限等,并可將它們輸出到SAS數(shù)據(jù)集中。四、簡單程序?qū)嵗?用一批兒童的身高及體重的實(shí)測數(shù)據(jù),建立如下線性回歸模型:

WEIGHT=a+b×HEIGHT+

式中:WEIGHT反應(yīng)變量,HEIGHT回歸變量,

a

,b待估參數(shù),

誤差DATAclass;INPUTname$heightweightage@@;CARDS;Alfre69.0112.514Joyce51.350.511PROCREG;MODELweight=height;PLOTweight*height;RUN;五、交互方式運(yùn)行REG過程謂交互方式:指在調(diào)用REG過程語句且用Model語句完成了一個(gè)模型后,若此時(shí)是用RUN運(yùn)行的,則可再執(zhí)行其他相關(guān)語句,而并不需要再次調(diào)用REG過程

1.簡介:優(yōu)點(diǎn)是:當(dāng)以交互方式運(yùn)行時(shí),可以先擬合一個(gè)模型對模型進(jìn)行分析、診斷,甚至修改(可以增減變量),再擬合,再診斷。這種方式節(jié)約計(jì)算機(jī)運(yùn)行時(shí)間。PROCREGDATA=CLASS;VARheightage;MODELweight=height;RUN;DELETEheight;ADDage;PRINT;RUN;如在上模型中,刪去height變量,增加age變量,重新擬合注意:MODEL語句只定義了一個(gè)自變量,因此向模型增加變量時(shí),必須保證最終模型中最多只能有一個(gè)自變量2.REG中的交互語句1)ADD變量1[變量2?]向模型中增加變量;2)DELETE變量1[變量2?]刪去原擬合模型中有關(guān)變量;3)MTEST對多重因變量進(jìn)行多變量擬合;4)PRINT輸出有關(guān)模型的有關(guān)信息;5)REFIT重新擬合模型;6)TEST進(jìn)行F檢驗(yàn);7)OUTOUTOUT=SAS數(shù)據(jù)集關(guān)鍵字=?

;產(chǎn)生一個(gè)SAS數(shù)據(jù)集,并給出相應(yīng)統(tǒng)計(jì)量的期望值、殘差等3.實(shí)例PROCREGDATA=CLASS;MODELweight=ageheight;RUN;DELETEage;PRINT;RUN;六、REG過程中模型的選擇(8種,僅介紹3種)前進(jìn)法開始時(shí),模型中尚無變量。其工作方式為:對每一個(gè)尚不在模型內(nèi)的自變量,按一定的顯著水平,根據(jù)其一旦進(jìn)入模型的貢獻(xiàn)大小,逐個(gè)引入方程,直至方程外無對模型有顯著貢獻(xiàn)的自變量。因此要事先規(guī)定顯著水平。MODEL因變量=自變量1自變量2?

/selection=?

;1.Forword

:前進(jìn)法在“slentry=”中可按自己需要選擇不同顯著水平,如0.1,0.2等,若不指定此選項(xiàng),則顯著水平為0.5;格式語句:MODEL因變量=自變量1自變量2?

/selection=Forword

slentry=;2.Backword:后退法后退法先建立包含全部自變量的回歸模型,然后按一定的顯著水平,從模型中逐個(gè)剔除對模型影響的顯著水平小于選定值的變量。

格式語句:MODEL因變量=自變量1自變量2?/

selection=Backword

slstay=;用slstay=來指定顯著水平。若不指定此選項(xiàng),默認(rèn)顯著水平為0.1

;逐步法是在前進(jìn)法基礎(chǔ)上進(jìn)行的修正。方法是:當(dāng)利用前進(jìn)法選進(jìn)變量時(shí),若模型中已有變量,則逐步法將模型內(nèi)的所有變量進(jìn)行逐個(gè)檢驗(yàn),看其是否由于新變量的引入而對模型的貢獻(xiàn)變的不顯著,若是將其從模型中剔除。若無,則保留。如此,直至方程外再無對模型有顯著影響的變量,而方程內(nèi)所有變量對方程均顯著。3.Stepwise(逐步法)逐步法一般要規(guī)定兩個(gè)顯著水平,即選入水平及剔除水平,且應(yīng)規(guī)定剔除水平低于選入水平,否則將導(dǎo)致無一變量被選進(jìn)方程的結(jié)局。格式語句:MODEL因變量=自變量1自變量2?/

selection=stepwiseslentry=slstay=;在“slentry=”后和

“slstay=”后分別表上自己選定的顯著水平,缺省值為0.15。前進(jìn)法與后退法各有利弊,前者較多適用于用戶希望只選擇少數(shù)變量的情況,而后者則較多適用于用戶希望多數(shù)變量留在模型中的情況。七、與模型選擇有關(guān)的選擇項(xiàng)MODEL因變量=自變量1自變量2?/選擇項(xiàng)1.INCLUDE=n

表示在MODEL語句中的前n個(gè)自變量必須進(jìn)入模型,至于其余自變量,則按

selection=定義的方式進(jìn)行剔選。

2.NOINT

此選擇項(xiàng)表示擬合無常數(shù)項(xiàng)(截距)的回歸模型選擇項(xiàng)中除了“selection=”外還有一些相關(guān)的選擇項(xiàng)。表示當(dāng)模型中含有s個(gè)自變量時(shí)停止模型的進(jìn)一步選擇。是對STEPWISE選擇項(xiàng),此選擇項(xiàng)表示模型擬合時(shí)從前s個(gè)自變量開始。不指定時(shí)默認(rèn)從0開始3.STOP=s4.START=s八、有關(guān)結(jié)果的屏幕輸出選擇項(xiàng)1.CLI

輸出每個(gè)個(gè)體觀測值的95%上、下限2.CLM

輸出每個(gè)觀測因變量期望值的95%上、下限3.R

輸出每個(gè)個(gè)體預(yù)測值、殘差及標(biāo)準(zhǔn)差。4.P

輸出每個(gè)個(gè)體觀測值、預(yù)測值、殘差等若已選擇CLI、CLM及R,則無需再選擇PVIF

輸出用于診斷變量間相關(guān)性的方差膨脹系數(shù);COLLINCOLLINOINT實(shí)現(xiàn)共線性診斷10.I

輸出

矩陣11.XPX

輸出

矩陣輸出參數(shù)估計(jì)的協(xié)方差矩陣7.STB

輸出標(biāo)準(zhǔn)化偏回歸系數(shù)矩陣;8.CORRB

輸出參數(shù)估計(jì)的相關(guān)矩陣9.COVB應(yīng)用實(shí)例例1對肺活量適應(yīng)性預(yù)測的研究變量如下:AGR:年齡;

WEIGHT:體重;RUNTIME:跑的時(shí)間OXY:耗氧量;

RSTPULSE:靜態(tài)心率;RUNPULSE:跑動(dòng)時(shí)心率;MAXPULSE:最高心率;DATAA;INPUTageweightoxyruntimerstpulse

runpulse

maxpulse;CARDS;PROCREG;MODELoxy=ageweightruntimerstpulse

runpulse

maxpulse/selection=stepwisestb

covb

corrb;RUN;例2對美國1790~1970年間每隔10年的人口數(shù)據(jù)建立模型,并打印個(gè)體預(yù)測值、期望值及95%上、下限以及殘差、標(biāo)準(zhǔn)誤差。DATAPOP;INPUTpop@@;RETAINyear1780;year=year+10;說明變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論