第十七章:生存分析(理論)_第1頁
第十七章:生存分析(理論)_第2頁
第十七章:生存分析(理論)_第3頁
第十七章:生存分析(理論)_第4頁
第十七章:生存分析(理論)_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、問題1 在你學過的統(tǒng)計方法中,對于不能痊愈在你學過的統(tǒng)計方法中,對于不能痊愈的慢性病治療效果的考核可用什么指標的慢性病治療效果的考核可用什么指標和統(tǒng)計方法?和統(tǒng)計方法? (其結局都是死亡)(其結局都是死亡)引出新概念:生存時間 不僅要考察不僅要考察結局結局的好壞,還要考察經(jīng)歷的好壞,還要考察經(jīng)歷的的時間時間長短。長短。 對于能治愈疾病,看治愈時間的長短,對于能治愈疾病,看治愈時間的長短,對于不能治愈的疾病,看延長生存時間對于不能治愈的疾病,看延長生存時間的長短。的長短。問題2 采用隨訪研究可以研究生存時間,但此采用隨訪研究可以研究生存時間,但此時失訪問題不可避免,怎么辦?時失訪問題不可避免,怎

2、么辦? 例如例如,使用生存率(或有效率)指標,分使用生存率(或有效率)指標,分子是什么?分母是什么?子是什么?分母是什么?以3年生存率為例 3年期滿的某病生存人數(shù)年期滿的某病生存人數(shù)/期初某病觀察期初某病觀察總人數(shù)總人數(shù) 3年期滿的某病生存人數(shù)年期滿的某病生存人數(shù)/3年期滿的某病年期滿的某病觀察總人數(shù)觀察總人數(shù) 對象在期間失訪如何處理?對象在期間失訪如何處理?對上述對上述2個問題的解決辦法個問題的解決辦法p 應用一類對生存時間進行的統(tǒng)計分應用一類對生存時間進行的統(tǒng)計分析析生存分析:包括生存分析:包括生存率估計(乘積極限法和壽命表法)生存率估計(乘積極限法和壽命表法)生存率比較(生存率比較(lo

3、g-rank檢驗和檢驗和Breslow檢驗)檢驗)Cox模型模型第十七章第十七章生存分析生存分析第一節(jié)第一節(jié) 基本概念基本概念 在醫(yī)學在醫(yī)學, ,生物學研究中生物學研究中, ,常用到生存常用到生存分析分析 (Survival Analysis)(Survival Analysis)方法。例如方法。例如對于腫瘤等疾病的療效及預后的考核對于腫瘤等疾病的療效及預后的考核, ,通通常不用治愈率,有效率等表示,而用將常不用治愈率,有效率等表示,而用將來復發(fā)或死亡的時間長短表示來復發(fā)或死亡的時間長短表示, ,也即生存也即生存時間來表示。時間來表示。 所謂生存時間(所謂生存時間(survival times

4、urvival time)是)是指從某個標準時刻指從某個標準時刻( (如發(fā)病如發(fā)病, ,確診確診, ,開始治開始治療或進行手術的時間療或進行手術的時間) )算起至死亡或復發(fā)算起至死亡或復發(fā)為止的時間。為止的時間。 生存分析數(shù)據(jù)的三個特點:生存分析數(shù)據(jù)的三個特點:1.1.隨訪觀察獲得,同時考慮生存時間和生存結局隨訪觀察獲得,同時考慮生存時間和生存結局 2.2.有截尾數(shù)據(jù)(有截尾數(shù)據(jù)(censored data)censored data) 隨訪中未能知道病人的確切生存時間,只知隨訪中未能知道病人的確切生存時間,只知道病人的生存時間大于某時間。道病人的生存時間大于某時間。(1 1)病人失訪或因其他

5、原因而死亡)病人失訪或因其他原因而死亡-失訪失訪(2 2)到了研究的終止期病人尚未死亡)到了研究的終止期病人尚未死亡-終訪終訪截尾數(shù)據(jù)截尾數(shù)據(jù)可記為可記為t t+ +, ,如:如: 4 4+ + = = 生存時間大于生存時間大于4 4年。年。 雖然雖然截尾數(shù)據(jù)提供的信息是不完全的,但不截尾數(shù)據(jù)提供的信息是不完全的,但不能刪去,因為這不僅損失了資料,而且會造成偏能刪去,因為這不僅損失了資料,而且會造成偏性。性。3. 生存期的資料一般不服從正態(tài)分布。生存期的資料一般不服從正態(tài)分布。 由于上述原因,常用的統(tǒng)計方法不適用,而由于上述原因,常用的統(tǒng)計方法不適用,而要用特殊的統(tǒng)計方法。要用特殊的統(tǒng)計方法。

6、 生存分析是指對于生存時間這一指標進行分生存分析是指對于生存時間這一指標進行分析的一系列特殊的統(tǒng)計方法。析的一系列特殊的統(tǒng)計方法。例17-1 為了估計為了估計HIV(人類免疫缺陷病毒)陽性(人類免疫缺陷病毒)陽性患者的生存時間,某研究者進行了臨床隨訪研患者的生存時間,某研究者進行了臨床隨訪研究。研究對象是于究。研究對象是于2002年年1月月1日至日至2004年年12月月31日期間在某市確診為日期間在某市確診為HIV陽性者,隨訪這陽性者,隨訪這些對象直至死于些對象直至死于AIDS(艾滋?。┗蚱洳l(fā)癥(艾滋?。┗蚱洳l(fā)癥(status=1為死亡,為死亡,0為刪失),研究截止日為刪失),研究截止日期

7、為期為2008年年12月月31日。并記錄每個研究對象日。并記錄每個研究對象的性別(的性別(sex=1為男,為男, 0為女)、年齡(為女)、年齡(age,歲)、是否用藥(歲)、是否用藥(drug=1為用藥,為用藥,0為不用)。為不用)。表表17-1 10017-1 100名名HIVHIV陽性患者的生存時間(月)及陽性患者的生存時間(月)及其影響因素其影響因素 ID entdate enddate time sex age drug status 12004-10-72005-8-7100 27 1 1 22002-6-292002-7-29 10 47 1 0 32004-8-22005-1-1

8、 51 40 1 1 42004-4-52007-2-3341 37 0 1 52004-10-12004-10-31 10 33 1 1 62003-12-122004-1-11 10 42 1 1 72003-12-82008-9-5570 37 0 1 82003-2-142003-10-15 81 32 1 1 92002-1-102003-1-10120 37 1 0 10 2002-12-172004-7-15191 34 0 1 包括:包括:(1)(1)開始觀察日期,終止觀察日期開始觀察日期,終止觀察日期-生存時間生存時間(2)(2)結局(最終觀察到的是死亡還是存活)結局(最終觀

9、察到的是死亡還是存活) 死于該病死于該病-完全數(shù)據(jù)完全數(shù)據(jù) 存活或死于其他原因存活或死于其他原因-截尾數(shù)據(jù)截尾數(shù)據(jù) 每個生存期數(shù)據(jù)要用每個生存期數(shù)據(jù)要用2 2個變量表示:觀察到的個變量表示:觀察到的生存時間和是否截尾(如:用生存時間和是否截尾(如:用0 0表示截尾,用表示截尾,用1 1表示死亡;表示死亡;4 4+ + 用用4 4,0 0表示;表示;4 4用用4 4,1 1表示)。表示)。(3)(3)協(xié)變量協(xié)變量-各種影響生存期長短的因素。各種影響生存期長短的因素。隨訪資料的記錄隨訪資料的記錄-生存分析的數(shù)據(jù)生存分析的數(shù)據(jù)結構和要求結構和要求一、生存時間一、生存時間 是一個廣義的概念,是一個廣義

10、的概念,生存時間不一定專用于死生存時間不一定專用于死與活的情況與活的情況, ,生存時間生存時間( (存活時間存活時間) )可定義為從可定義為從某種起始事件到達某終點事件所經(jīng)歷的時間跨某種起始事件到達某終點事件所經(jīng)歷的時間跨度。度。 例如:例如:l 急性白血病病人治療急性白血病病人治療- -復發(fā)之間的緩解期復發(fā)之間的緩解期; ;l 冠心病病人在兩次發(fā)作之間隔冠心病病人在兩次發(fā)作之間隔; ;l 已作輸卵管結扎的婦女從施行輸卵管吻合手術后至受孕的時間間隔已作輸卵管結扎的婦女從施行輸卵管吻合手術后至受孕的時間間隔; ;l 在流行病學研究中在流行病學研究中, ,從開始接觸危險因素到發(fā)病所經(jīng)歷的時間;從開

11、始接觸危險因素到發(fā)病所經(jīng)歷的時間;l 住院到出院之間所花費的醫(yī)療費用;住院到出院之間所花費的醫(yī)療費用;l 從購買到失效期間某醫(yī)療設備被使用的次數(shù);從購買到失效期間某醫(yī)療設備被使用的次數(shù);l 從購買到第一次維修某車輛所行駛的總里程等。從購買到第一次維修某車輛所行駛的總里程等。l 結婚到離婚結婚到離婚l 投保投保( (人壽保險人壽保險) )到死亡到死亡l 開始戒煙開始戒煙( (毒毒) )到再次吸煙到再次吸煙( (毒毒) )l 。l 展開你的想象力,專業(yè)應用領域很廣!展開你的想象力,專業(yè)應用領域很廣! 結局(終點事件)的理解結局(終點事件)的理解l 死亡(生存)死亡(生存)l 復發(fā)(白血病、第二次心

12、肌梗死)復發(fā)(白血病、第二次心肌梗死)l 痊愈、好轉痊愈、好轉l 并發(fā)癥(糖尿病的視網(wǎng)膜病變等)并發(fā)癥(糖尿病的視網(wǎng)膜病變等)l 長出第一顆乳牙長出第一顆乳牙l 第一次來月經(jīng)第一次來月經(jīng)l 動物實驗中發(fā)生腫瘤等動物實驗中發(fā)生腫瘤等二、生存時間類型二、生存時間類型完全數(shù)據(jù)(完全數(shù)據(jù)(complete data)刪失數(shù)據(jù)(刪失數(shù)據(jù)(censored data,截尾數(shù)據(jù))截尾數(shù)據(jù)) 隨訪研究示意隨訪研究示意(完全數(shù)據(jù)與截尾數(shù)據(jù)完全數(shù)據(jù)與截尾數(shù)據(jù))觀察起點觀察起點觀察終點觀察終點5 6123 4 起點事件 終點事件 失訪三、生存時間圖示三、生存時間圖示四四. . 生存率生存率(Survival Rat

13、e)(Survival Rate) 又稱為生存函數(shù)又稱為生存函數(shù), ,它表示一個病人的生存它表示一個病人的生存時間長于時間時間長于時間t t的概率的概率, ,用用S(t) S(t) 表示:表示: s(t)=Ps(t)=P(T T t t) 如如5 5年生存率:年生存率: s(5)=Ps(5)=P(T T 5 5) 如無刪失數(shù)據(jù),則生存率計算公式(17-3) 如有刪失數(shù)據(jù),則生存率計算公式(17-4) 式中pi(i=1,2,.,k)為各時段的生存概率。觀察總例數(shù)時刻仍存活的例數(shù)ttTPtS)()(觀察總例數(shù)時刻仍存活的例數(shù)ttTPtS)()(觀察總例數(shù)時刻仍存活的例數(shù)ttTPtS)()(觀察總例

14、數(shù)時刻仍存活的例數(shù)ttTPtS)()(kkkiptSpppptS*)(.*)(121生存率的計算生存率的計算五、死亡概率與生存概率五、死亡概率與生存概率 q 某 時 段 內(nèi) 死 亡 人 數(shù)該 時 段 初 期 尚 存 活 的 人 數(shù) P 某 時 段 內(nèi) 存 活 人 數(shù)該 時 段 初 期 人 數(shù)1Pq 生存概率與生存率?生存概率與生存率? 下列關于生存概率和生存率的敘述,正確的是下列關于生存概率和生存率的敘述,正確的是 A二者均隨時間增加而增大二者均隨時間增加而增大 B二者均隨時間增加而減小二者均隨時間增加而減小 C生存概率是生存率的累積生存概率是生存率的累積 D生存率是生存概率的累積生存率是生存

15、概率的累積 E生存概率一定小于生存率生存概率一定小于生存率生存曲線 以生存時間為橫軸,生存率為縱軸繪圖,即所謂的Kaplan-Meier生存曲線生存曲線的繪制生存曲線的特征生存曲線的特征 它是一條下降的曲線它是一條下降的曲線, ,下降的坡度越陡下降的坡度越陡, ,表示生存率越低或生存時間越短表示生存率越低或生存時間越短, ,其斜率其斜率表示死亡速率。表示死亡速率。常見生存函數(shù)的類型示意六、風險函數(shù)(六、風險函數(shù)(hazard function) 風險函數(shù)表示一個生存到時間t的個體,在從t到 這一區(qū)間內(nèi)死亡概率的極限,也就是一個生存到時間t的個體在時間t的瞬時死亡率(條件死亡速率)。 tt0Pr

16、( )limttTtt Tth tt 1( )iiitth tt死于區(qū)間 到內(nèi)的病人數(shù)在 時生存的病人數(shù) 該區(qū)間包含的單位時間數(shù)風險函數(shù)圖的意義風險函數(shù)圖的意義 當用當用t t作橫坐標作橫坐標,h(t),h(t)為縱坐標所繪的曲線為縱坐標所繪的曲線, ,如遞增如遞增, ,則表示條件死亡速率隨時間而增加則表示條件死亡速率隨時間而增加, ,如平行于橫軸如平行于橫軸, ,則表示沒有隨時間而加速。則表示沒有隨時間而加速。常見風險函數(shù)的類型示意 風險函數(shù)的不同情況:風險函數(shù)的不同情況:常數(shù),常數(shù), 如:死于飛機失事。如:死于飛機失事。下降,下降, 如:意外傷害。如:意外傷害。先升后降,先升后降, 如:交

17、通事故。如:交通事故。上升,上升, 如:持續(xù)接觸危險因素。如:持續(xù)接觸危險因素。澡盆樣,澡盆樣, 如:人的一生如:人的一生。平均生存時間平均生存時間 由于生存時間的分布總是偏態(tài)的,故平由于生存時間的分布總是偏態(tài)的,故平均生存時間常用均生存時間常用中位生存時間中位生存時間(median survival time)來計算,其意義是)來計算,其意義是50的個體存活且有的個體存活且有50的個體死亡的時間,的個體死亡的時間,也即生存率為也即生存率為50時在生存曲線中所對時在生存曲線中所對應的生存時間。應的生存時間。 (1)估計生存函數(shù)及其他相關指標。)估計生存函數(shù)及其他相關指標。(2)比較各組的生存函

18、數(shù)。)比較各組的生存函數(shù)。(3)研究影響生存期長短的因素。)研究影響生存期長短的因素。(4)預測不同個體的預后。)預測不同個體的預后。生存分析目的與用途生存分析目的與用途第二節(jié)第二節(jié) 生存分析的統(tǒng)計方法生存分析的統(tǒng)計方法 非參數(shù)方法非參數(shù)方法 參數(shù)方法參數(shù)方法乘積乘積-極限法極限法 指數(shù)分布指數(shù)分布(又稱又稱Kaplan-Meier法法) Weibull分布分布壽命表方法壽命表方法 Gamma分布分布 logistic分布分布 對數(shù)正態(tài)分布對數(shù)正態(tài)分布 。 Kaplan-Meier法法 又稱又稱:乘積極限法:乘積極限法( product-limit,PL法法)P(Tt)=S1S2St 從隨訪開

19、始到生存時間長于t年的生存率為:式中Si表示已生存表示已生存ti-1年條件下再生存一年年條件下再生存一年到達到達ti年的條件概率。年的條件概率。計算生存率 例17-2(P307) 例例17-2 17-2 為了比較不同手術方法治療腎上腺腫瘤的療效,為了比較不同手術方法治療腎上腺腫瘤的療效,某研究者隨機將某研究者隨機將4343例病人分成兩組,甲組例病人分成兩組,甲組2323例、乙組例、乙組2020例的例的生存時間(月)如下所示:生存時間(月)如下所示:甲組:甲組:1 1,3 3,5 5(3 3),),6 6(3 3),),7 7,8 8,1010(2 2),),1414+ +,1717, 19 1

20、9+ +,2020+ + ,2222+ +,2626+ +,3131+ +,3434, 34 34+ +,4444,5 5 乙組:乙組:1 1(2 2),),2 2,3 3(2 2),),4 4(3 3),), 6 6(2 2),),8 8,9 9 (2 2),),1010,1111,1212,1313,1515,1717,1818其中有其中有“+ +”者是刪失數(shù)據(jù),表示病人仍生存或失訪,括號者是刪失數(shù)據(jù),表示病人仍生存或失訪,括號內(nèi)為重復死亡數(shù)。試計算甲組的生存率與標準誤。內(nèi)為重復死亡數(shù)。試計算甲組的生存率與標準誤。 序號序號 時間時間(月月) 死亡數(shù)死亡數(shù) 刪失數(shù)刪失數(shù) 期初例數(shù)期初例數(shù)

21、死亡概率死亡概率 生存概率生存概率 生存率生存率 生存率標準誤生存率標準誤 (1) (2) (3) (4) (5) (6) (7) (8) (9) 1 1 1 0 23 1/23=0.0435 0.9565 0.9565 0.0425 2 3 1 0 22 1/22=0.0455 0.9545 0.95650.9545=0.9130 0.0588 3 5 3 0 21 3/21=0.1429 0.8571 0.91300.8571=0.7826 0.0860 4 6 3 0 18 3/18=0.1667 0.8333 0.78260.8333=0.6522 0.0993 5 7 1 0 15

22、1/15=0.0667 0.9333 0.65220.9333=0.6087 0.1018 6 8 1 0 14 1/14=0.0714 0.9286 0.60870.9286=0.5652 0.1034 7 10 2 0 13 2/13=0.1538 0.8462 0.56520.8462=0.4783 0.1042 8 14 0 1 11 0/11=0.0000 1.0000 0.47831.0000=0.4783 0.1042 9 17 1 0 10 1/10=0.1000 0.9000 0.47830.9000=0.4304 0.1041 10 19 0 1 9 0/9=0.0000

23、1.0000 0.43041.0000=0.4304 0.1041 11 20 0 1 8 0/8=0.0000 1.0000 0.43041.0000=0.4304 0.1041 12 22 0 1 7 0/7=0.0000 1.0000 0.43041.0000=0.4304 0.1041 13 26 0 1 6 1/6=0.0000 1.0000 0.43041.0000=0.4304 0.1041 14 31 0 1 5 0/5=0.0000 1.0000 0.43041.0000=0.4304 0.1041 15 34 1 0 4 1/4=0.2500 0.7500 0.43040.

24、7500=0.3228 0.1216 16 34 0 1 3 0/3=0.0000 1.0000 0.32281.0000=0.3228 0.1216 17 44 1 0 2 1/2=0.5000 0.5000 0.32280.5000=0.1614 0.1293 18 59 1 0 1 1/1=1.0000 0.0000 0.16140.0000=0.0000 0.0000 i表表17-4 17-4 甲種手術方式的生存率與標準誤甲種手術方式的生存率與標準誤生存曲線 以生存時間為橫軸,生存率為縱軸繪圖,即所謂的Kaplan-Meier生存曲線圖 兩組手術方式生存概率(Kaplan-Meier)

25、曲線補充說明補充說明生存率的可信區(qū)間估計(正態(tài)近似法)100(1-)可信區(qū)間為: i/2iS( )S ttuSE平均生存時間 由于生存時間的分布總是偏態(tài)的,故平由于生存時間的分布總是偏態(tài)的,故平均生存時間常用均生存時間常用中位生存時間中位生存時間(median survival time)來計算,其意義是)來計算,其意義是50的個體存活且有的個體存活且有50的個體死亡的時間,的個體死亡的時間,也即生存率為也即生存率為50時在生存曲線中所對時在生存曲線中所對應的生存時間。應的生存時間。 兩種計算方法:圖解法和線性內(nèi)插法兩種計算方法:圖解法和線性內(nèi)插法 圖解法(使用圖解法(使用spss生存率圖編輯

26、來說明生存率圖編輯來說明其結果)其結果) 線性內(nèi)插法:取線性內(nèi)插法:取2個相繼生存率,使得一個相繼生存率,使得一個大于個大于0.5,一個小于,一個小于0.5,然后,以表,然后,以表17-4為例計算甲組中位生存時間。為例計算甲組中位生存時間。 (8-10)/(8-百分位數(shù)百分位數(shù))=(0.5652-0.4783)/(0.5652-0.50), t=9.50(月月)圖 平均生存時間示意(Kaplan-Meier估計)生存率 壽命表法(lifetable method) 不作要求! 壽命表法計算生存率的基本原理是將整個隨訪時間劃分為若干個時間區(qū)間,分別計算每個時間區(qū)間開始時的觀察個體數(shù)、死亡數(shù)和失訪數(shù),進而計算每個時間區(qū)間的條件死亡率 和條件生存率 。根據(jù)概率的乘法原理,t時刻的生存率 為t時刻前各時間區(qū)間條件生存率的乘積。 1iiF t t1iiS t t iS tP310例173 不作要求!非參數(shù)方法非參數(shù)方法 參數(shù)方法參數(shù)方法時序時序(log-rank)檢驗檢驗 分布參數(shù)檢驗分布參數(shù)檢驗分層分層時序時序檢驗檢驗Gehan檢驗檢驗(廣義廣義Wilcoxon檢驗檢驗)Mantel-Haenszel檢驗檢驗logrank 檢驗檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論