生存分析的SAS編程操作PPT課件_第1頁
生存分析的SAS編程操作PPT課件_第2頁
生存分析的SAS編程操作PPT課件_第3頁
生存分析的SAS編程操作PPT課件_第4頁
生存分析的SAS編程操作PPT課件_第5頁
已閱讀5頁,還剩27頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、.,1,生存分析的SAS編程操作,薛 富 波 2006/05/21,.,2,生存分析的有關概念,事件時間(time-to-event,TTE):又稱為生存時間(survival time)或失效時間(failure time),是指從研究開始到相應事件發(fā)生的時間。 刪失值(censored value):是指TTE在某些觀測上其確切的取值是未知的,所能知道的僅僅是其測量值肯定大于或小于某個特定值(即其取值的下限或上限),或者位于某個特定的取值范圍內(取值區(qū)間)。 右側刪失:反映真實值下限的數據。 左側刪失:反映真實值上限的數據。 區(qū)間刪失:反映真實值所在區(qū)間的數據。,.,3,生存分析的方法分類

2、,非參數法:乘積極限法、壽命表法等; 參數法:指數分布法、威布爾分布(Weibull Distribution)法、對數正態(tài)回歸分析法以及對數logistic回歸分析法等; 半參數法:Cox模型分析方法。,.,4,生存分析方法的SAS過程,非參數法:lifetest過程; 參數法:lifereg過程; 半參數法:phreg過程。,.,5,生存分析的非參數方法,.,6,非參數法生存分析示例1,45例乳腺癌患者中,免疫過氧化物酶檢測結果顯示9例陽性、36例陰性,比較其生存時間分布的SAS程序如下。,proc lifetest plots=(s); time time*censor(1); stra

3、ta immuno; run;,.,7,非參數法生存分析示例2,proc lifetest data=valung method=lt; time survtime*censor(1); strata cell; run;,一項有關肺癌患者生存天數的臨床研究數據。應變量survtime表示患者生存天數,其中的負值表示刪失值;協變量包括cell(細胞類型)、治療方法therapy(標準方法和試驗方法)、既往治療prior(0-無,10-有)、年齡age(歲)、診斷月數diagtime(確診至入組時的以月為單位的時間間隔)、KPS評分kps等。數據中產生一個刪失值指示變量censor(取1表示刪失

4、,取0表示非刪失),一個治療分組變量treatment(0表示標準方法,1表示試驗方法)。,.,8,lifetest過程,用以對右側刪失類型的時間數據進行時間分布的描述以及多組間時間分布的比較(檢驗兩個或多個樣本是否來自具有同一個生存函數的總體); 提供兩種秩檢驗方法和一種似然比檢驗方法來檢驗多組生存函數的同一性,兩種秩檢驗方法為包括廣義Savage(指數得分)檢驗(即log-rank檢驗)和Wilcoxon檢驗。,.,9,lifetest過程可包含的語句,.,10,proc lifetest語句,proc lifetest語句為調用lifetest過程的開始,其主要語句選項及其可執(zhí)行的功能見

5、下表。,.,11,proc lifetest語句的主要選項,.,12,intervals=選項的設置方法,端點值間以空格分隔,如“intervals=10 30 50 70”; 端點之間以逗號分隔,如“intervals=10,30,50,70”; “a to b”的形式,如“intervals=1 to 7”; “a to b by c”的形式,如“intervals=1 to 7 by 2”; 混合方式,如“intervals=1,3 to 7, 10”。,.,13,plots=選項的繪圖類型,.,14,strata語句,strata語句的作用是指定用以分層的變量; lifetest過程根

6、據strata變量的非缺失值對輸入數據進行分層; 如果要將strata變量的缺失值也作為一個合法的水平用以分層,可在strata語句中設置“missing” 選項; strata語句中可指定多個分層變量,分層情況將由各分層變量水平的組合來決定; 對于數值型分層變量,若為其設置分層區(qū)間端點列表,該變量的水平與形成的區(qū)間一一對應,設置方式與proc lifetest語句的“intervals=”選項中類似 ; 對于數值型分層變量,若為其設置分層區(qū)間端點列表,該變量的水平與形成的區(qū)間一一對應。所劃分的區(qū)間均為半開半閉區(qū)間,第一個區(qū)間總是以-為下界,最后一個區(qū)間總是以為上界。,.,15,strata語

7、句分層區(qū)間端點列表設置方式,端點值間以空格分隔,如: strata age(5 10 20 30); 端點之間以逗號分隔,如: strata age(5,10,20,30); “a to b”的形式,如: strata age(5 to 10); “a to b by c”的形式,如: strata age(5 to 30 by 10); 混合方式,如: strata age(5,10 to 50 by 10); 舉例: strata wt(50 to 80 by 10); 此時變量wt將按照如下的5個區(qū)間劃分成5個水平:,.,16,test語句,test語句指定需要與生存時間進行關聯性分析的

8、協變量; test語句中的變量必須為數值型; 對于test變量,lifetest過程將通過兩類秩檢驗統(tǒng)計量來檢驗它們與生存時間的關聯性; 每一個test變量的單變量檢驗的統(tǒng)計量也將被給出; 一個有關協變量聯合效應的統(tǒng)計量列表也將被給出,此統(tǒng)計量列表的順序和各協變量對聯合效應貢獻的大小順序相一致。,.,17,time語句,time語句為調用lifetest過程所必需,用以指定代表生存時間的變量。 time語句具有如下的形式: time variable ; 其中“variable”即為生存時間變量的名稱,此變量名稱必須指定; 隨后的星號“*”及“censor(list)”項可有可無,用來表示數據

9、的刪失值情況?!癱ensor”為代表刪失值狀況的變量名稱,“(list)”為該變量的部分取值列表(須為數值型,且不是缺失值),如果此變量取該列表中的值,則該觀測上的生存時間為刪失值; 此處的刪失值均表示右側刪失值。,.,18,生存分析的半參數方法,.,19,半參數法生存分析示例1,proc phreg data=Myeloma; model Time*VStatus(0)=LogBUN HGB Platelet Age LogWBC Frac LogPBM Protein SCalc / selection=stepwise slentry=0.15 slstay=0.15 details;

10、run;,一項有關骨髓瘤患者生存時間的研究數據,治療了65例患者,研究中48名患者死亡,17名存活。變量time表示患者從確診之日起的生存時間;變量vstatus表示患者的生存狀態(tài),0代表存活,1代表死亡。懷疑與生存函數有關的變量包括logbun(確診時BUN對數值),hgb(確診時HGB),platelet(血小板,0-異常,1-正常),age(年齡),logwbc(確診時白細胞對數值),frac(確診時骨折發(fā)生,0-無,1-有),scalc(確診時血清鈣含量)。分析目的在于從該9個解釋變量中鑒別出重要的預后因素。,.,20,phreg過程,phreg過程針對生存數據執(zhí)行基于Cox比例風險模

11、型(Cox proportional hazards model)的回歸分析; 可以檢驗有關回歸參數的線性假設; 針對配對病例-對照研究執(zhí)行條件logistic回歸分析過程; 創(chuàng)建包含有關統(tǒng)計量的輸出數據集等。,.,21,phreg過程可包含的語句,.,22,proc phreg語句,proc phreg語句為調用phreg過程的開始,語句中可設置的語句選項較少,其設置方法及功能詳見下表。,.,23,proc phreg語句選項,.,24,model語句,model語句用來指定作為失效時間的變量、可選的刪失值狀態(tài)變量以及自變量等。 model語句可設置為兩種不同的形式: model respo

12、nse = variables ; model (t1, t2) = variables ; 第一種類型適用于僅有一個應變量的情況,第二種類型適用于計數過程輸入方式的兩個應變量的情況; model語句的第一種類型中,等號前的“response”項代表作為失效時間的變量,如果包含刪失值,則須指定“censor”項,以表示刪失值狀態(tài); model語句的第二種類型中,表示失效時間的變量為兩個,構成一個半開半閉區(qū)間,表示觀察對象處于危險狀態(tài)的時間區(qū)間。 phreg過程要求刪失值狀態(tài)變量和自變量必須為數值型變量,失效時間變量不能取負數值。如果失效時間的取值為負數,相應的觀測將被剔除。,.,25,mode

13、l語句的主要選項,.,26,編程語句(programming statements),是指可用于phreg過程的其它SAS語句(主要為data步的常用編程語句),用來創(chuàng)建新的自變量的取值,或修改自變量的已有取值; 此類語句尤其在擬合包含時間依賴型自變量的模型時非常有用; 它們還可被用于創(chuàng)建新的非時間依賴型自變量; data步的各種函數也可在phreg過程中使用,其用法也完全相同,執(zhí)行完全相同的功能。,.,27,可用于phreg過程的data步語句,.,28,編程語句的操作示例,考察血壓對生存時間的影響,在研究期間的多個時間點上測量受試者的血壓。 血壓可看作時間依賴型自變量,擬合模型時可以在每一

14、時點上應用最近測量的血壓值,而不是全部應用最初的或最后的血壓測量值。 針對每一位受試者,右側變量的取值均被測量,如果無條件或無法測出,則以缺失值取代。,Time 生存時間 Censor 刪失值狀態(tài)(0表示刪失值) BP0 受試者進入研究時的血壓 T1 時刻1 BP1 時刻1的血壓測量值 T2 時刻2 BP2 時刻2的血壓測量值,.,29,strata語句,比例風險假設不一定對所有的數據均適用,如果確實如此,對數據進行分層分析就十分必要和合理; strata語句用來指定用以分層的變量,phreg過程根據strata變量的非缺失值(除非語句中設置“missing”選項)對輸入數據進行分層。,.,3

15、0,半參數法生存分析示例2(條件logistic回歸模型),一項有關低體重兒出生情況的調查數據,共189位受訪婦女,59例分娩出低體重兒,其余130例分娩正常體重兒??赡艿奈kU因素包括:婦女末次月經時體重-weight,高血壓情況-ht,孕期吸煙-smoke,尿激惹癥狀-ui等。婦女年齡作為配對因素進行m:n配對的logistic回歸分析。,proc phreg data=LBW; model Time*Low(0)= LWT Smoke HT UI / ties=discrete; strata Age; run; proc logistic data=lbw; class Smoke HT UI/ref=first; model low(event=1)=LWT Smoke HT UI; strata Age; run;,.,31,練習1,數據集males為有關男性心絞痛患者生存率的調查數據,其中包含3個變量,years為確診后的生存時間,censored為刪失值指示變量(1-刪失,0-未刪失),freq為每個時間點的頻數。 請以此數據繪制壽命表(1年為單位),以壽命表法進行每個時間點的生存函數估計,計算其中位生存時間及其可信區(qū)間,并繪制生存分布函數對時間變化的生存曲線圖。,.,32,練習2,為探討某惡性腫瘤的預后,收

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論