統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關、回歸分析與logistic回歸_第1頁
統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關、回歸分析與logistic回歸_第2頁
統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關、回歸分析與logistic回歸_第3頁
統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關、回歸分析與logistic回歸_第4頁
統(tǒng)計分析系統(tǒng)SAS軟件 第六章 線性相關、回歸分析與logistic回歸_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、協(xié)方差分析過程格式PROC GLM 選項;CLASS 變量表;MODEL 依變量=效應/選項;MEANS 效應/選項;LSMEANS 效應/選項;PROC GLM 語句選項可設定分析數(shù)據(jù)集等;CLASS 指明分類變量,協(xié)方差分析時必須設定,必須在MODEL語句之前;MODEL 定義協(xié)方差分析的線性數(shù)學模型, model y=a t;一般的協(xié)方差分析模型 model y=t x(t);分離斜率模型 model y=t x x*t;共斜率模型 model后SOLUTION的選項給出參數(shù)的估計值MEANS 語句用于計算依變量的平均數(shù),選項用于多重比較;LSMEANS 語句計算效應的最小二乘估計的平均

2、數(shù)(LSM) 選項E=效應,設定測驗誤差項,缺省為試驗分析誤差. STDERR給出LSM的標準誤, TDIEF, PDIEF要求顯示測驗H0:LSM(i)=LSM(j)的t值和概率值.應用舉例單向分組資料的協(xié)方差分析兩向分組資料的協(xié)方差分析單因素試驗的協(xié)方差分析第六章 線性相關、回歸分析與logistic回歸相關分析(CORR)回歸分析(REG)廣義線型模型(GLM)REG過程 語法格式 語法說明 MODEL語句,必需語句,定義回歸分析模型 VAR語句為可選的,指定用于計算交叉積的變量 PLOT語句為可選的,用于繪制變量間的散點圖,還可添加回歸線。 【過程選項】OUTEST=數(shù)據(jù)集名 指定統(tǒng)計

3、量和參數(shù)估計輸出的新數(shù)據(jù)集名。 NOPRINT 禁止統(tǒng)計結(jié)果在OUTPUT視窗中輸出。 SIMPLE 輸出REG過程中所用的每個變量的基本統(tǒng)計量。 CORR 輸出MODEL語句或VAR語句中所列變量的相關矩陣。 ALL 等價于MODEL語句加上全部選項,即輸出該語句所有選項分析結(jié)果。【MODEL語句】 MODEL語句定義模型中的因變量、自變量、模型選項及結(jié)果輸出選項。語句中的變量只能是數(shù)據(jù)集中的變量,任何形式的變換都必須先產(chǎn)生一個新變量,然后用于分析。如X1的二次項,不能在模型中直接指定X1*X1,而要產(chǎn)生另一個新變量代表X1*X1,方可引入模型。MODEL語句中常用的選項NOINT 在模型中

4、不擬合常數(shù)項。 STB 輸出標準化回歸系數(shù)。 CLI 輸出個體預測值的95%可信區(qū)間上下限。 CLM 輸出因變量期望值(均值)的95%可信區(qū)間上下限。 R 輸出個體預測值、殘差及其標準誤。 P 輸出實際值Yi、預測值 和殘差等。如已選擇了CLI、CLM和R,則無需選擇P。【關鍵字】 結(jié)果解釋 如果在MODEL語句中使用CLI、CLM選項,則系統(tǒng)輸出因變量均值以及個體預測值的95可信區(qū)間上下限,輸出如下 CORR過程PROC CORR 選項 ;VAR 變量名列 ;1WITH 變量名列;2WEIGHT 變量名;FREQ 變量名;BY 變量名列;語法說明 除了PROC語句為必需,其他語句都是可選的,

5、如果省略所有的可選語句,則對所有變量作相關分析。VAR語句,可選的語句,定義相關分析的變量 WITH語句,可選的語句,定義分析相關性的另一組變量PROC CORR;VAR A B;WITH X Y Z ;結(jié)果解釋 例 下表給出了12名不同年齡(歲,X)婦女的收縮壓測量值(mmHg,Y),試進行回歸分析。 (1) 制作散點圖;(2) 建立由X預報的回歸方程,制作回歸直線;(3) 對回歸方程及回歸系數(shù)b進行假設檢驗;(4) 繪制的95可信區(qū)間;(5) 建立單個Y值的預報方程;(6) 計算積矩相關系數(shù),并進行假設檢驗。多元線性回歸 REG過程: 只要把要分析的多個自變量名放在MODEL語句中應變量后

6、即可。 語法選項 (MODEL語句選項)SELECTION=method,規(guī)定變量篩選的方法,method可以是以下幾種選項FORWARD(或F),前進法,按照SLE規(guī)定的P值從無到有依次選一個變量進入模型 BACKWARD(或B),后退法,按照SLS規(guī)定的P值從含有全部變量的模型開始,依次剔除一個變量 STEPWISE(或S),逐步法,按照SLE的標準依次選入變量,同時對模型中現(xiàn)有的變量按SLS的標準剔除不顯著的變量 MODEL語句選項NONE,即不選擇任何選項,不作任何變量篩選,此時使用的是含有全部自變量的全回歸模型MODEL語句選項SLE=概率值,入選標準,規(guī)定變量入選模型的顯著性水平,

7、前進法的默認是0.5,逐步法是0.15 SLS=概率值,剔除標準,指定變量保留在模型的顯著水平,后退法默認為0.10,逐步法是0.15 標準化偏回歸系數(shù) STB 可用來比較各個自變量作用的大小 COLLIN 要求詳細分析自變量之間的共線性,給出信息矩陣的特征根和條件數(shù),來判斷自變量之間有無多重共線性。 應用實例 現(xiàn)有20名糖尿病人的血糖(y,mmol/L)、胰島素(X1,mU/L)及生長素(X2,g/L)的測量數(shù)據(jù)列于中,試進行多元線性回歸分析 程序如下 data bk4_1;input id y x1 x2; cards;proc reg data=bk4_1;model y=x1 x2/s

8、tb;model y=x1 x2/ selection=stepwise stb;run;程序運行的主要結(jié)果 相關和偏相關分析REG過程 logistic回歸 如果應變量為分類的變量,則不符合一般回歸分析模型的要求,可用logistic回歸來分析。Logistic回歸按反應變量的類型分為:兩分類的Logistic回歸 多分類有序反應變量的Logistic回歸 多分類無序反應變量的Logistic回歸按照設計類型可分為:非條件Logistic回歸,即研究對象未經(jīng)過配對條件Logistic回歸,即研究對象為1:1或1:m配對 語法格式 語法說明 LOGISTIC過程,用最大似然法對應變量擬合一個L

9、ogistic模型。除了PROC 和MODEL語句為必需,其他都可省略?!具^程選項】OUTEST=數(shù)據(jù)集名 指定統(tǒng)計量和參數(shù)估計輸出的新數(shù)據(jù)集名。 NOPRINT 禁止統(tǒng)計結(jié)果在OUTPUT視窗中輸出。ORDER=DATA|FORMATTED|INTERNAL 規(guī)定擬和模型的應變量的水平順序 DATA :應變量的順序與數(shù)據(jù)集中出現(xiàn)的順序一致 FORMATTED:按照格式化值的順序,為默認的選項,相當于應變量所賦值的大小順序 INTERNAL:按照非格式化值的順序DESCENDING|DES 顛倒應變量的排列順序,如果同時指定了選項ORDER,則系統(tǒng)先按照ORDER規(guī)定的順序排列,然后則降序排列

10、。就是說,如果應變量的賦值,死亡為1,存活0,為了得到死亡對存活的概率(或者說是死亡的風險),應選擇此選項,否則得到的是存活對死亡的概率?!綧ODEL語句】 MODEL語句指定模型的自變量、應變量,模型選項及結(jié)果輸出選項,如要擬和交互作用項,需先產(chǎn)生一個表示交互作用的新變量。可以擬合帶有一個或多個自變量的Logistic回歸模型,用最大似然估計法估計模型的參數(shù),打印出模型估計的過程和模型參數(shù)的可信區(qū)間。NOINT 在模型中不擬合常數(shù)項,在條件的Logistic回歸中用到。 SELECTION= FORWARD(或F)| BACKWARD(或B)| STEPWISE|SCORE 規(guī)定變量篩選的方

11、法,分別為向前、向后、逐步和最優(yōu)子集法。缺省時為NONE,擬合全回歸模型。 SLE=概率值,指定變量進入模型的顯著水平,缺省為0.05 SLS=概率值,指定變量保留在模型的顯著水平,缺省為0.05 CL|WALDCL,要求估計所有回歸參數(shù)的可信區(qū)間 CLODDS=PL|WALD|BOTH, 要求計算OR值的可信區(qū)間 PLRL,對所有自變量估計OR的可信區(qū)間應用實例 某工作者在探討腎細胞癌轉(zhuǎn)移的有關臨床病理因素研究中,收集了一批行根治性腎切除術患者的腎癌標本資料,現(xiàn)從中抽取26例資料作為示例進行l(wèi)ogistic回歸分析。 表中有關符號意義說明:i: 樣品序號x1:確診時患者的年齡(歲)x2:腎細胞癌血管內(nèi)皮生長因子(VEGF), 其陽性表述由低到高共3個等級x3:腎細胞癌組織內(nèi)微血管數(shù)(MVC)x4:腎癌細胞核組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論