生存分析(第17章)_第1頁
生存分析(第17章)_第2頁
生存分析(第17章)_第3頁
生存分析(第17章)_第4頁
生存分析(第17章)_第5頁
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1第17章生存分析SurvivalAnalysis第二軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計學(xué)教研室張羅漫12講課內(nèi)容第一節(jié)生存分析中的基本概念(重點)第二節(jié)生存率的估計與生存曲線第三節(jié)生存曲線的log-rank檢驗第四節(jié)Cox比例風(fēng)險回歸模型(重點)23開始觀察時間:1992.01.01終止隨訪時間:2001.12.3141.

兩種治療方法的治愈率相同,但平均治愈天數(shù)不同。甲、乙兩藥物治療某病治愈率均為90%,甲藥治療的患者平均12天出院,乙藥治療的患者平均7天出院。隨訪觀測評價臨床療效存在三個問題52.一部分研究對象可觀測到死亡,得到準確生存時間(完全數(shù)據(jù));一部分研究對象中途失訪、或死于其它疾病、或觀測結(jié)束時仍存活,得不到準確生存時間(不完全數(shù)據(jù))。3.生存時間分布通常不服從正態(tài)分布。隨訪觀測評價臨床療效存在三個問題62個效應(yīng)變量

生存時間(天數(shù))

結(jié)局(死亡或生存、陽性或陰性等)存在不完全數(shù)據(jù)分布類型復(fù)雜生存時間分布常呈正偏態(tài)分布生存時間資料的特點7

2個效應(yīng)變量錯誤1:忽略生存時間,采用logistic回歸分析死亡與否與各Xi的關(guān)系。錯誤2:忽略結(jié)局,采用多元線性回歸分析生存時間與各Xi的關(guān)系。對生存時間資料的錯誤處理8對生存時間資料的錯誤處理不完全數(shù)據(jù)錯誤1:丟棄不完全數(shù)據(jù),只考慮完全

數(shù)據(jù),損失了部分信息。錯誤2:將不完全數(shù)據(jù)當(dāng)作完全數(shù)據(jù)處

理,低估了生存時間的平均水平。9對生存時間資料的錯誤處理非正態(tài)分布數(shù)據(jù)錯誤1:描述時采用平均生存時間而不是采用中位生存時間來表示生存時間的平均水平。錯誤2:推斷時采用常規(guī)t檢驗或方差分析進行各組間生存時間比較。10針對以上生存時間資料的特點,生存分析是將事件發(fā)生的結(jié)果與隨訪時間兩個因素結(jié)合起來、可以對完全或不完全數(shù)據(jù)進行分析的方法。11第一節(jié)生存分析中的基本概念TheBasicConceptofSurvivalAnalysis1112

一、名詞解釋

1.生存時間(survivaltime,

t)

起始事件終點事件

發(fā)病死亡戒煙開始重新吸煙白血病治療緩解復(fù)發(fā)冠心病前一次發(fā)作下一次發(fā)作接觸危險因素發(fā)病開始服藥治愈132.截尾值(censoredvalue,X+)隨訪中由于某種原因未能觀測到病人的明確結(jié)局,提示真實生存時間長于觀測到的時間原因:失訪(一般失訪率不應(yīng)>20%);死于其他疾??;病人生存期超過研究的終止期;治療措施改變。又稱刪失值或終檢值

,本章討論右刪失情況143.死亡概率(mortalityprobability,q)

死于某時間段內(nèi)的可能性大小。有刪失值時:年初校正人數(shù)=原年初人數(shù)刪失例數(shù)/2154.生存概率(survivalprobability,p)單位時段開始時存活的個體到該時段結(jié)束時仍存活的可能性。

p=1q有刪失值時:年初校正人數(shù)=原年初人數(shù)刪失例數(shù)/2165.生存率

(survivalrate,S(t,X))

又稱生存函數(shù),累積生存概率。生存概率針對單位時間;生存率針對某個較長時間段,它是生存概率的累積結(jié)果。如5年生存率是每一年不同生存概率乘積。協(xié)變量17例手術(shù)治療50例肺癌病人,術(shù)后1、2、3年的死亡數(shù)分別為10、10、10例,無截尾數(shù)據(jù)。求各年的生存概率和3年生存率。各年生存概率p1=(50–10)/50=0.8000p2=(40–10)/40=0.7500p3=(30–10)/30=0.66673年生存率

S(3)=(N–d)/N

=(50–30)/50=0.4000S(3)=p1×

p2×

p3=0.8000×0.7500×0.6667=0.4000186.風(fēng)險函數(shù)

(hazardfunction,h(t,X))生存時間已達到t的一群具有協(xié)變量X的觀測對象在t

時刻的瞬時死亡率。本章討論的重點風(fēng)險函數(shù)h(t,X)是生存率S(t,X)的導(dǎo)數(shù)函數(shù),通過研究風(fēng)險函數(shù)同樣達到研究生存率的目的。19

二、資料收集(一)隨訪內(nèi)容

1.明確開始隨訪的時間如出院時間、確診時間、開始治療時間

2.隨訪的結(jié)局終止隨訪時間死亡死亡時間生存但中途失訪最后一次訪問時間死于其他疾病死于該病時間生存但隨訪結(jié)束研究結(jié)束時間

3.記錄影響生存時間的有關(guān)因素20(二)隨訪方式○○○○○××××?xí)r間0始點t終點×

死亡○失訪治療措施改變死于其他疾病21○○○○○××××?xí)r間0始點t終點×

死亡○失訪治療措施改變死于其他疾病22○○○○○××××?xí)r間

始點t終點×

死亡○失訪治療措施改變死于其他疾病23三、生存分析研究的主要內(nèi)容1.描述生存過程生存時間分布特點估計生存率及平均生存時間繪制生存曲線2.比較生存過程對各樣本生存曲線進行比較3.影響生存時間的因素分析擬合生存分析模型24四、生存分析的基本方法25第一節(jié)生存分析中的基本概念25一、名詞解釋二、資料收集三、生存分析研究的主要內(nèi)容四、生存分析的基本方法26第二節(jié)生存率的估計與生存曲線

(生存過程的描述)26EstimateofSurvivalRate&SurvivalCurve27

一、小樣本資料

1.生存率的計算

2.生存率標準誤的計算

3.生存曲線

4.中位生存時間281.生存率的計算乘積極限法

(product-limitedmethod)由Kaplan-Meier于1958年提出,又稱為Kaplan-Meier法。利用生存概率與概率乘法原理計算生存率29例有人研究了甲種手術(shù)方法治療腎上腺腫瘤病人23例的生存情況,定義從手術(shù)后到病人死亡時間為生存時間,得到生存時間(月)如下(+為截尾數(shù)據(jù)),試計算其生存率與標準誤。

1,3,5,5,5,6,6,6,7,8,10,

10,14+,17,19+

,20+

,22+

,26+

,

31+

,34,34+

,44,59。相同數(shù)據(jù)只列一次,完全數(shù)據(jù)與截尾數(shù)據(jù)相同時,截尾數(shù)據(jù)在后。300.957×0.955×0.857=0.783312.生存率標準誤的計算

由Greenwood1926年提出32總體生存率1-的可信區(qū)間

333.生存曲線例

用乙種手術(shù)方法治療與甲種手術(shù)方法病情基本相同的腎上腺腫瘤病人20例,定義從手術(shù)后到病人死亡的時間為生存時間,得到生存時間(月)如下(+為截尾數(shù)據(jù))。試計算其生存率與標準誤,并繪制甲、乙兩種手術(shù)方法的生存曲線。

1,1,2,3,3,4,4,4,6,6,8,9,

9,10,11,12,13,15,17,18。34SPSS實現(xiàn)3536死亡373839每一級階梯代表一個死亡時間點,在截尾時間點無階梯。39173440例有人研究了甲種手術(shù)方法治療腎上腺腫瘤病人23例的生存情況,定義從手術(shù)后到病人死亡時間為生存時間,得到生存時間(月)如下(+為截尾數(shù)據(jù)),試計算其生存率與標準誤。

1,3,5,5,5,6,6,6,7,8,10,

10,14+,17,19+

,20+

,22+

,26+

,

31+

,34,34+

,44,59。414.中位生存時間生存率為50%時對應(yīng)的時間。424.中位生存時間生存率為50%時對應(yīng)的時間。434344

二、大樣本資料

1.生存率的計算

壽命表法(lifetablemethod)由E.Halley(英,1656-1742)最早提出。452418-456=19621962-19.5=1942.5462.生存率曲線4647

第二節(jié)生存率的估計與生存曲線47一、小樣本資料

乘積極限法

(Kaplan-Meier法)二、大樣本資料壽命表法4849第三節(jié)生存曲線的log-rank檢驗

(生存過程的比較)48Log-rankTestforSurvivalCurves50log-rank檢驗譯為時序檢驗,譯為對數(shù)秩檢驗是錯誤的。log-記錄。log-rank檢驗是對各組生存曲線作整體的比較log-rank檢驗的基本思想將各組生存時間混合統(tǒng)一排序后,對實際死亡數(shù)與期望死亡數(shù)進行比較。log-rank檢驗是一種非參數(shù)方法。51例用甲、乙兩種手術(shù)方法分別治療病情基本相同的腎上腺腫瘤病人23例與20例,定義從手術(shù)后到病人死亡的時間為生存時間,得到生存時間(月)如下(+為截尾數(shù)據(jù)),問甲、乙兩種手術(shù)方式后病人生存率有無差別?甲(n=23)1,3,5,5,5,6,6,6,7,8,10,10,14+,17,19+

,20+

,22+

,26+

,31+

,34,34+

,44,59乙(n=20)1,1,2,3,3,4,4,4,6,6,8,9,9,10,11,12,13,15,17,1852H0:兩種手術(shù)方式后病人的生存曲線相同H1:兩種手術(shù)方式后病人的生存曲線不相同=0.05是兩條生存曲線的整體比較53混合統(tǒng)一排序截尾生存時間5455(1)將兩組生存時間混合后統(tǒng)一排序

c1i、c2i分別表示兩組截尾數(shù)據(jù)(2)計算各組的期望死亡數(shù):56(3)求各組的期望死亡人數(shù)之和:

(4)計算值:結(jié)論:按=0.05水準拒絕H0

,接受H1

,認為兩種手術(shù)方式后病人的生存曲線有差別。57SPSS軟件計算58死亡59差別由三種方法在各時點所取權(quán)重不同造成。60第三節(jié)生存曲線的log-rank檢驗59兩樣本生存曲線比較及SPSS實現(xiàn)61第四節(jié)Cox比例風(fēng)險回歸模型

(生存過程影響因素分析)60Cox’sProportionalHazardRegressionModel62

1972年由英國統(tǒng)計學(xué)家D.R.Cox

提出,解決以下問題:在生存時間的分布種類繁多且難以確定、存在截尾數(shù)據(jù)的情況下,研究協(xié)變量X與生存函數(shù)S(t,X)之間的關(guān)系。Cox模型不直接考察生存函數(shù)S(t,X)與協(xié)變量的關(guān)系,而是用風(fēng)險函數(shù)h(t,X)作為應(yīng)變量。該方法在不對生存時間的具體分布進行假設(shè)的情況下分析協(xié)變量的影響,大大降低了生存分析的煩瑣性,被譽為生存分析研究的里程碑。63DavidRoxbeeCox(英,1924~)1972年發(fā)表了在生存分析領(lǐng)域具有開創(chuàng)性的論文《回歸模型和壽命表》,提出了著名的Cox比例風(fēng)險模型,從而極大地推動了壽命分布模型的發(fā)展并且拓寬了模型的應(yīng)用。1990年他因此獲得了凱特靈獎和金質(zhì)獎?wù)?。?966年到1991年,擔(dān)任著名生物統(tǒng)計學(xué)雜志Biometrika編委,發(fā)表了300多篇論文,出版了多部著作。他被推舉擔(dān)任了英國皇家統(tǒng)計學(xué)會和國際統(tǒng)計機構(gòu)的會長。64一、Cox模型的基本形式與意義h(t,X)=h0(t)exp(β1X1+β2X2+···+βmXm)h(t,X):風(fēng)險函數(shù),瞬時死亡率

X=(X1,X2,···,Xm)’:影響生存時間的協(xié)變量,不隨時間而變化。

h0(t):危險因素為0的基礎(chǔ)風(fēng)險率,分布未知,

與h(t,X)呈比例非參數(shù)部分

β=(β1,β2,···,βm)’:偏回歸系數(shù)參數(shù)部分65對于0,1變量,假設(shè)危險因素Xj在非暴露組取值為0,在暴露組取值為1:h(t,X)=h0(t)exp(β1X1+β2X2+···+βmXm

)

對于連續(xù)變量,假設(shè)危險因素Xj取值為k與k+1Cox比例風(fēng)險回歸模型6667例:

為探討胃癌患者的預(yù)后,對是否施行手術(shù)治療(X1,手術(shù)=1,否=0)和是否接受放射治療(X2,放射=1,否=0)的效果進行分析,其偏回歸系數(shù)分別為-0.360與-0.333。h(t,Xi=1)=h0(t)exp(β1X1+β2X2)=h0(t)exp(0.360×1

0.333×1)=0.5h0(t)

h(t,Xi=0)=h0(t)exp(0.360×0

0.333×0)=

h0(t)RR=h(t,Xi=1)∕h(t,Xi=0)=0.5多因素相對危險度

RR=h(t,Xi=1)/h(t,Xi=0)=exp[β’(Xi=1Xi=0)]68多因素相對危險度

RR=h(t,Xi=1)/h(t,Xi=0)=HR風(fēng)險比(hazardratio)69

二、參數(shù)估計與假設(shè)檢驗(一)參數(shù)估計在時刻ti上病人死亡的條件概率為:S代表ti時刻以后危險集R(ti)中對似然函數(shù)有貢獻的個體。70

n個病人死亡的條件概率相乘,并非通常意義下的似然函數(shù),但Cox證明了它是觀察數(shù)據(jù)在特定意義下的一部分,稱為偏似然函數(shù)。71

截尾資料(i=0截尾;i=1死亡)的偏似然函數(shù)

對ln()求關(guān)于j的一階偏導(dǎo)數(shù),并求其等于0

的解,可得到j(luò)的最大似然函數(shù)估計值bj。72

(二)假設(shè)檢驗

1.最大似然比檢驗(maximumlikelihoodratiotest)模型中原有不顯著變量剔除與新變量引進;包含不同協(xié)變量的模型間比較。733.計分檢驗(scoretest)新變量是否能夠引進模型。2.wald檢驗(waldtest)模型中的協(xié)變量是否應(yīng)從模型中剔除。74

(三)生存率的估計基礎(chǔ)生存率75三、因素的初步篩選與最佳模型的建立常用多元逐步Cox模型分析,SAS程序:

procphreg;modelt*y(1)=X1~Xn/selection=stepwiseslentry=0.05slstay=0.10;

檢驗各因素是否有統(tǒng)計學(xué)意義:

Maximunlikelihoodratiotest(選與剔)Scoretest(選)Waldtest(剔)

76

四、Cox模型的統(tǒng)計描述

1.回歸系數(shù)(bj)和標準回歸系數(shù)(bj’)反應(yīng)某因素Xj對生存時間影響的程度。

2.相對危險度(某因素Xj取值為1與取值為0相比)RR的1–可信區(qū)間:773.個體預(yù)后指數(shù)(personalprognosisindex)PI>0

表示該病人對應(yīng)的危險度大于平均水平PI=0表示該病人對應(yīng)的危險度達到平均水平PI<0表示該病人對應(yīng)的危險度小于平均水平

78

五、應(yīng)用實例7980X4治療方式(傳統(tǒng)=1,新=0)X5淋巴結(jié)是否轉(zhuǎn)移(是=1,否=0)81SPSS軟件計算82死亡83基于最大似然估計的向前逐步回歸法848586六、Cox模型的注意事項及應(yīng)用范圍設(shè)計階段應(yīng)注意的問題研究樣本要有代表性;協(xié)變量在研究對象中的分布要有敏感性;盡可能全部包括影響因素;生存時間要有明確規(guī)定;過多的失訪容易造成研究結(jié)果的偏倚;協(xié)變量隨時間變化而變化時采用Cox時間依存協(xié)變量模型;樣本含量一般為自變量個數(shù)的15~20倍。87模型配合時應(yīng)注意的問題消除多元共線的影響;選擇單因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論