生存分析(2012年)推薦課件_第1頁(yè)
生存分析(2012年)推薦課件_第2頁(yè)
生存分析(2012年)推薦課件_第3頁(yè)
生存分析(2012年)推薦課件_第4頁(yè)
生存分析(2012年)推薦課件_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、生存分析生存分析Survival Analysis主 講:楊永利單 位:公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室12021/8/22前邊介紹的logistic回歸只考慮終點(diǎn)事件的出現(xiàn)與否,但在惡性腫瘤、慢性病或其他情況的隨訪研究中,有時(shí)除考慮終點(diǎn)出現(xiàn)與否,還需考察觀察對(duì)象達(dá)到終點(diǎn)所經(jīng)歷的時(shí)間長(zhǎng)短。生存分析是將終點(diǎn)事件的出現(xiàn)與否和達(dá)到終點(diǎn)所經(jīng)歷的時(shí)間結(jié)合起來(lái)進(jìn)行綜合分析的一種方法,源于古老的壽命表。講講 授授 內(nèi)內(nèi) 容容第一節(jié)生存分析基本概念第二節(jié)生存曲線的估計(jì)第三節(jié)生存曲線的比較第四節(jié) cox回歸分析 生存時(shí)間生存分析常用描述指標(biāo) 第一節(jié)生存分析基本概念在臨床醫(yī)學(xué)中, 對(duì)病人療效考查:治療結(jié)局?1.生存時(shí)

2、間? 一、生 存 時(shí) 間問(wèn)題1 某腫瘤患者5年生存率 觀察人數(shù) 生存人數(shù)A組: 20 0B組: 20 0 OR=?一、生 存 時(shí) 間問(wèn)題2 如何計(jì)算平均數(shù)1 1)手術(shù)到死亡時(shí)間)手術(shù)到死亡時(shí)間 3 7 15 20 25 26 30 3 7 15 20 25 26 30 平均生存時(shí)間平均生存時(shí)間 meanmean=18=182 2)3 9 15 20 25+ 27 30+3 9 15 20 25+ 27 30+ 中位生存時(shí)間中位生存時(shí)間 median=median=20203 3)3 9+ 15 20 20+ 26 30+3 9+ 15 20 20+ 26 30+ ? ?生 存 時(shí) 間問(wèn)題3 如

3、何綜合評(píng)價(jià)??jī)山M間的比較:兩組間的比較: A A3 63 6 8 10 22 8 10 22 26 26 30 30 3030 B B6 86 8 10 20 3010 20 30 3030 3030 3030生 存 時(shí) 間完全數(shù)據(jù)的均數(shù):完全數(shù)據(jù)的均數(shù):Mean(A)=12.5Mean(B)=11.0以以3030天為界的分類(lèi)結(jié)果:天為界的分類(lèi)結(jié)果:死亡死亡 生存生存A A 6 6 2 2B B 4 4 4 4 生 存 時(shí) 間 的 概 念終點(diǎn)事件死亡出現(xiàn)故障治愈復(fù)發(fā)起始事件生物生存電腦開(kāi)始使用正常疾病產(chǎn)生疾病治愈生存時(shí)間(survival time)可以廣泛地定義為從規(guī)定的觀察起點(diǎn)到某一特定終

4、點(diǎn)事件出現(xiàn)的時(shí)間長(zhǎng)度。生 存 時(shí) 間 三 要 素觀察起點(diǎn)終點(diǎn)事件時(shí)間的度量起始事件隨訪時(shí)間終點(diǎn)事件隨機(jī)對(duì)照臨床試驗(yàn)的觀察起點(diǎn)通常是隨機(jī)化分組的時(shí)間。觀察性研究中,觀察起點(diǎn)可以是發(fā)病時(shí)間、第一次確診時(shí)間或接受正規(guī)治療的時(shí)間。終點(diǎn)事件可以是某種疾病發(fā)生、某種處理的反應(yīng)、疾病的復(fù)發(fā)或死亡等。隨訪研究隨訪研究(follow-up study)示意圖示意圖合格的合格的研究對(duì)象研究對(duì)象 出現(xiàn)結(jié)果出現(xiàn)結(jié)果 尚未出現(xiàn)結(jié)果尚未出現(xiàn)結(jié)果 失訪、脫落失訪、脫落試驗(yàn)組試驗(yàn)組對(duì)照組對(duì)照組伴隨因素伴隨因素干擾因素干擾因素【例題】n某醫(yī)院泌尿外科醫(yī)師選擇1996-2000年間經(jīng)手術(shù)治療的膀胱腫瘤患者,對(duì)可能影響膀胱腫瘤術(shù)后

5、生存的因素進(jìn)行了調(diào)查,隨訪截止日期為2000年12月30日。n事件(event):研究者所規(guī)定的生存時(shí)間的終點(diǎn)。n完全數(shù)據(jù):隨訪研究中,在規(guī)定的觀察期內(nèi),對(duì)某些觀察對(duì)象如觀察到了終點(diǎn)事件發(fā)生,從起點(diǎn)到終點(diǎn)事件所經(jīng)歷的時(shí)間,稱(chēng)為生存時(shí)間的完全數(shù)據(jù)(complete data)。n刪失數(shù)據(jù)(censored data):又稱(chēng)截尾。隨訪研究中,在規(guī)定的觀察期內(nèi),對(duì)某些觀察對(duì)象由于某種原因未能觀察到終點(diǎn)事件的發(fā)生,并不知道確切的生存時(shí)間。左刪失:終點(diǎn)事件發(fā)生在某一時(shí)點(diǎn)之前。期間刪失:終點(diǎn)事件發(fā)生在某兩時(shí)點(diǎn)之間。右刪失:終點(diǎn)事件發(fā)生在最后一次隨訪觀察時(shí)刻的右方。 刪失必須調(diào)整,否則導(dǎo)致偏倚。產(chǎn)生刪失數(shù)據(jù)

6、的原因有:(1)失訪;(2)研究結(jié)束時(shí)終點(diǎn)事件尚未發(fā)生;(3)死于其它原因;(4)由于嚴(yán)重藥物反應(yīng)而終止觀察或改變治療措施。隨訪研究( 表21-2)患者進(jìn)入期間事件研究結(jié)束時(shí)終點(diǎn)事件尚未發(fā)生研究截止時(shí)點(diǎn)2000/12/30死亡失訪死于車(chē)禍死亡死亡刪刪 失失生存時(shí)間資料的特點(diǎn) 1 有2個(gè)效應(yīng)變量:(1)生存時(shí)間(天數(shù)),(2)結(jié)局(死亡與否、是否陽(yáng)性等)2 截尾數(shù)據(jù):如表21-1中的1號(hào)、 3號(hào)和4號(hào)病人未觀察到底,不知他們究竟能活多長(zhǎng)時(shí)間。 處理截尾數(shù)據(jù)時(shí)兩種錯(cuò)誤的做法:錯(cuò)誤1:丟棄截尾數(shù)據(jù),只考慮確切數(shù)據(jù)。(損失了信息)錯(cuò)誤2:將截尾數(shù)據(jù)當(dāng)作確切數(shù)據(jù)處理。(低估了生存時(shí)間的平均水平)。生存時(shí)

7、間資料的特點(diǎn) 3. 分布類(lèi)型復(fù)雜:生存時(shí)間常呈正偏態(tài)分布。在處理正偏態(tài)分布數(shù)據(jù)時(shí)兩種錯(cuò)誤的做法:n錯(cuò)誤1:采用平均生存時(shí)間而不是采用中位生存時(shí)間來(lái)表示生存時(shí)間的平均水平。n錯(cuò)誤2:采用常規(guī)t檢驗(yàn)或方差分析進(jìn)行組間比較。(應(yīng)采用log-rank檢驗(yàn)比較幾組生存時(shí)間 )二、生存分析的統(tǒng)計(jì)描述指標(biāo)二、生存分析的統(tǒng)計(jì)描述指標(biāo)1. 死亡概率、生存概率2. 生存率及標(biāo)準(zhǔn)誤3. 半數(shù)生存期(中位數(shù)) 及四分位數(shù)間距1. 死亡概率、生存概率1)死亡概率(probability of death):表示某時(shí)段開(kāi)始存活的個(gè)體,在該時(shí)段內(nèi)死亡的可能性。計(jì)算年初人口數(shù)年內(nèi)死亡人數(shù))死亡概率(q注意:如果年內(nèi)有刪失,則

8、分母用校正人口數(shù): 校正人口數(shù)= 年初人口數(shù)刪失例數(shù)/22)生存概率:?jiǎn)挝粫r(shí)段開(kāi)始時(shí)存活的個(gè)體到該時(shí)段結(jié)束時(shí)仍然存活的可能性; p=某年活滿(mǎn)一年人數(shù)/某年年初人口數(shù) 注意:若年內(nèi)有刪失,分母用校正人口數(shù)。若年內(nèi)有刪失,分母用校正人口數(shù)。2. 生存率及標(biāo)準(zhǔn)誤 生存率(survival rate) :0時(shí)刻存活的個(gè)體在t時(shí)刻仍存活的可能性。 生存概率是針對(duì)單位時(shí)間而言的,生存率是針對(duì)某個(gè)較長(zhǎng)時(shí)段的,是生存概率的累計(jì)結(jié)果。觀察總例數(shù)時(shí)刻仍存活例數(shù)資料中無(wú)刪失數(shù)據(jù)時(shí)kkttTPtS)()(kkkkkptSppptTPtS)(.)()(121資料中有刪失數(shù)據(jù)時(shí)n生存率 (survival rate)又稱(chēng)

9、為 累積生存概率 ( cumulative probability of survival )生存率的標(biāo)準(zhǔn)誤 kjjjjjkkdnndtStSSE100)()()(第j個(gè)時(shí)間段內(nèi)死亡人數(shù)第j個(gè)時(shí)間段期初人口數(shù)【例】手術(shù)治療50例肺癌病人,術(shù)后1,2,3年的 死亡數(shù)分別為10,10,10例,無(wú)截尾數(shù)據(jù)。試求各年的生存概率和3年生存率。 各年生存概率 p1 = ( 5010 )/50 p2 = ( 4010 )/ 40 p3 = ( 3010 )/30 3年生存率 S(3)=P(T3)=(5030)/50 =0.4 1)半數(shù)生存期,也稱(chēng)中位生存期(median survival time),即生存

10、時(shí)間中位數(shù),表示50%的個(gè)體可存活的時(shí)間。即生存率為時(shí)對(duì)應(yīng)的生存時(shí)間(集中趨勢(shì)指標(biāo))。中位生存期越長(zhǎng),表示疾病的預(yù)后越好。2)生存期的四分位數(shù)間距 反映離散程度大小3. 半數(shù)生存期及四分位數(shù)間距 壽命表法(life table method) 乘積極限法( Kaplan-Meier method )第二節(jié)生存曲線的估計(jì)一、壽命表法(life table method)應(yīng)用范圍:樣本含量較大時(shí)【例21-1】 收集374名某惡性腫瘤患者的隨訪資料,取時(shí)間區(qū)間均為1年,整理結(jié)果見(jiàn)表21-3中(1)(5)欄,試估計(jì)各年生存率。 期初有效例數(shù)期初有效例數(shù)=期初病例數(shù)期初病例數(shù)-期內(nèi)刪失數(shù)期內(nèi)刪失數(shù)/2

11、死亡概率死亡概率=期內(nèi)死亡數(shù)期內(nèi)死亡數(shù)/期初有效例數(shù)期初有效例數(shù) 生存概率生存概率=1-死亡概率死亡概率kkppptS.)(421生存率 惡性腫瘤患者確診后5年內(nèi)生存率下降較塊,5年后生存率下降較平緩,說(shuō)明確診后5年內(nèi)該惡性腫瘤患者的死亡威脅較大。壽命表法曲線為折線。該法只估計(jì)時(shí)段右端點(diǎn)的生存率,省略了時(shí)段內(nèi)的生存率估計(jì)。 二、乘積極限法( Kaplan-Meier method )Product limit method,應(yīng)用于樣本含量較小時(shí)。基本思想:將生存時(shí)間由小到大依次排列,在每個(gè)死亡點(diǎn)上,計(jì)算期初人數(shù)、死亡人數(shù)、死亡概率、生存概率和生存率。Kaplan-Meier法生存曲線為階梯形曲

12、線。Group:1 代表 3cm,2代表3cmTime: 生存時(shí)間Status:0代表刪失,1代表完全數(shù)據(jù)(結(jié)局事件)第三節(jié)生存曲線的比較(Log rank 檢驗(yàn)) 【例21-3】 比較上例中膀胱腫瘤小于3.0cm患者和腫瘤大于或等于3.0cm患者的生存曲線,就總體而言,兩個(gè)生存函數(shù)是否有差別?時(shí)間由小到大排序?qū)山M數(shù)據(jù)統(tǒng)一按生存:兩總體生存曲線不同:兩總體生存曲線相同. 105. 010HHiigigigiiiigigiindnTTtdndnt上的理論死亡數(shù)計(jì)算各組在時(shí)間。和死亡例數(shù)兩組合計(jì)的期初例數(shù)以及和死亡例數(shù)上的期初例數(shù)分別計(jì)算兩組在時(shí)間. 3,. 2患者?;颊叩纳媲€高于,腫瘤做出

13、統(tǒng)計(jì)結(jié)論(計(jì)算統(tǒng)計(jì)量數(shù)和理論死亡總數(shù)計(jì)算各組的實(shí)際死亡總cm0 . 3cm0 . 305. 0. 6196. 64584. 9)4584. 9165416.17)5416.1711). 5. 42222PTTAggg【小結(jié)】Log-rank檢驗(yàn)屬于非參數(shù)檢驗(yàn)的方法;Log-rank檢驗(yàn)可用于兩組或多組生存曲線的比較;Log-rank檢驗(yàn)屬于單因素分析方法,其應(yīng)用條件是除比較因素外,影響生存率的各混雜因素在不同的組間均衡。否則,可采用cox回歸。第四節(jié)cox 回歸1)多重線性回歸模型:反應(yīng)變量為定量資料,且服從正態(tài)分布。2)Logistic回歸模型:反應(yīng)變量為定性資料。3)生存資料同時(shí)考慮生存結(jié)

14、局和生存時(shí)間,生存時(shí)間往往不服從正態(tài)分布,且可能含有刪失。錯(cuò)誤1:忽略生存時(shí)間,采用Logistic回歸分析死亡率。錯(cuò)誤2:忽略結(jié)局,采用t檢驗(yàn)、線性回歸分析生存時(shí)間。Cox模型是由英國(guó)倫敦大學(xué)的Cox于1972年提出的,它是一種半?yún)?shù)模型。Cox 模型以生存結(jié)局和生存時(shí)間為因變量,可同時(shí)分析眾多因素對(duì)生存期的影響,分析帶有刪失數(shù)據(jù)的資料,且不要求資料服從特定的分布類(lèi)型。Cox模型主要用于研究多個(gè)因子對(duì)生存時(shí)間的影響;Cox模型表達(dá)式時(shí)刻的風(fēng)險(xiǎn)函數(shù)。為tthxxththpp)().exp()()(0110nCox回歸模型的模型假定:任兩個(gè)個(gè)體風(fēng)險(xiǎn)之比不隨時(shí)間的變化而變化。nAssumption

15、 of proportional hazard( PH假定) .exp.exp2211022110jjiiXXthXXthRRnCox 回歸中PH假定的判定(1)nCox 回歸中PH假定的判定(2)案例討論 某研究者觀察了確診后采取同樣方案進(jìn)行化療的26例急性混合型白血病患者,欲了解某種不良染色體是否會(huì)影響患者病情的緩解,于是將治療后120天內(nèi)癥狀是否緩解作為結(jié)果變量 y(緩解= 0,未緩解= 1),有無(wú)不良染色體 chr有= l,無(wú)= 0)作為研究因素,數(shù)據(jù)收集后(詳細(xì)數(shù)據(jù)見(jiàn)表20-9)進(jìn)行一系列統(tǒng)計(jì)分析,請(qǐng)結(jié)合以下問(wèn)題,對(duì)分析結(jié)果進(jìn)行恰當(dāng)?shù)脑u(píng)價(jià)。(1)按照有無(wú)不良染色體分組比較緩解率,考慮

16、到例數(shù)較小,采用Fisher精確概率法,得到P值為0.667,此時(shí)的結(jié)論如何?(2)考慮到有無(wú)不良染色體并非研究人員可以隨機(jī)化分配的處理,所以比較組之間其它影響患者緩解的因素不一定均衡,因而需要考慮平衡其他可能的影響因素的作用。于是該研究者進(jìn)一步查閱了相關(guān)文獻(xiàn),追加記錄了患者的年齡age(歲)、骨髓原幼細(xì)胞數(shù)分組bl(大于等于50 1,小于 50 0)、CD34表達(dá) cd(陽(yáng)性=1,陰性=0)、性別 sex(男= l,女=0)這幾個(gè)變量,采用多因素 logistic模型來(lái)分析,經(jīng)逐步法按 a=0.10準(zhǔn)得到表 2010中的結(jié)果。此時(shí)的結(jié)論又如何?解釋變量 回歸系數(shù) 標(biāo)準(zhǔn)誤 2 自由度 P值 c

17、hr -1.457 1.352 1.161 1 0.281 0.233 bl -2.961 1.355 4.778 1 0.029 0.052表21-11 logistic回歸分析結(jié)果(3)有臨床醫(yī)生指出,對(duì)于這種患者只要能使緩解時(shí)間提前臨床上就可以認(rèn)為有一定療效,所以?xún)H考慮是否緩解還不夠,如果進(jìn)一步利用緩解時(shí)間的長(zhǎng)短來(lái)進(jìn)行分析,信息會(huì)利用得更充分。費(fèi)了很大辛苦,幸好查到了所有患者的緩解時(shí)間,于是采用logrank檢驗(yàn)比較了有無(wú)不良染色體的兩個(gè)組病人的生存曲線,得到2=1.28,P值為 0.2579,此時(shí)的結(jié)論如何? (4)有統(tǒng)計(jì)學(xué)家提醒研究者,生存時(shí)間的比較仍然需要考慮組間的可比性,這種觀察

18、對(duì)比得到的數(shù)據(jù)還需要做多因素的生存分析,結(jié)論會(huì)比單因素Iogrank檢驗(yàn)可靠。于是進(jìn)行多因素Cox回歸分析,逐步回歸結(jié)果列在表 2112。此時(shí),因?yàn)?chr的 P值大于 0. 05,所以認(rèn)為有無(wú)不良染色體并沒(méi)有什么關(guān)系。 解釋變量 回歸系數(shù) 標(biāo)準(zhǔn)誤 2 自由度 P值 chr -1.838 0.954 3.709 1 0.054 0.159 bl -3.205 1.078 8.838 1 0.003 0.041 cd -1.877 0.629 8.904 1 0.003 0.153表21-12 cox回歸分析結(jié)果綜合上述分析過(guò)程,你對(duì)此項(xiàng)研究的設(shè)計(jì)、資料收集及統(tǒng)計(jì)分析方法的選擇有何評(píng)論?案例解析首先,結(jié)果變量的選取應(yīng)充分考慮專(zhuān)業(yè)上的要求。對(duì)于白血病等一些難以完全治愈的較為兇險(xiǎn)的疾患,延長(zhǎng)患者的生存時(shí)間在臨床上是有現(xiàn)實(shí)意義的,故而結(jié)果變量應(yīng)選取結(jié)局(病情是否緩解)以及出現(xiàn)結(jié)局的時(shí)間(緩解時(shí)間)。這樣,僅以病情是否緩解為結(jié)果變量的單因素Fisher精確概率結(jié)果以及多因素logistic模型結(jié)果就不很恰當(dāng)。案例解析其次,在使用生存分析方法時(shí),應(yīng)考慮到影響緩解時(shí)間的因素, 除了研究者所關(guān)心的是

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論