生存分析1實(shí)用教案_第1頁
生存分析1實(shí)用教案_第2頁
生存分析1實(shí)用教案_第3頁
生存分析1實(shí)用教案_第4頁
生存分析1實(shí)用教案_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一節(jié)生存時(shí)間資料的特點(diǎn)第二節(jié)小樣本生存率的kaplan-Meier估計(jì)第三節(jié)大樣本生存率的壽命(shumng)表法估計(jì)第四節(jié) 生存曲線比較的假設(shè)檢驗(yàn) 第1頁/共44頁第一頁,共44頁。 第一節(jié)生存時(shí)間資料的特點(diǎn) 一、數(shù)據(jù)結(jié)構(gòu)(sh j ji u) 二、統(tǒng)計(jì)描述指標(biāo) 三、資料要求 第2頁/共44頁第二頁,共44頁。一、數(shù)據(jù)結(jié)構(gòu)一、數(shù)據(jù)結(jié)構(gòu)(sh j ji u) 在臨床醫(yī)學(xué)中, 對(duì)病人療效考查(koch):治療結(jié)局?生存時(shí)間? 第3頁/共44頁第三頁,共44頁。 “ 生存時(shí)間”的概念 開始事件(shjin) 終點(diǎn)事件(shjin) 生物生存 死亡 電腦開始使用正常(zhngchng) 出現(xiàn)故障

2、疾病產(chǎn)生 治愈疾病治愈 復(fù)發(fā) 陰性 陽性第4頁/共44頁第四頁,共44頁。生存生存(shngcn)時(shí)間的三個(gè)要點(diǎn)時(shí)間的三個(gè)要點(diǎn) 一、起始(q sh)事件二、 終點(diǎn)事件三、生存時(shí)間 第5頁/共44頁第五頁,共44頁。醫(yī)學(xué)例子:起始醫(yī)學(xué)例子:起始(q sh)事件事件 隨訪時(shí)間隨訪時(shí)間 終點(diǎn)事件終點(diǎn)事件 疾病(jbng)確診 死亡 治療(zhlio)開始 死亡治療開始 痊愈接觸危險(xiǎn)物 出現(xiàn)反應(yīng)治愈出院 復(fù)發(fā)廣義的廣義的“生存時(shí)間生存時(shí)間”也可為醫(yī)療也可為醫(yī)療費(fèi)用(元)、費(fèi)用(元)、醫(yī)療設(shè)備使用次數(shù)、車輛行駛總里醫(yī)療設(shè)備使用次數(shù)、車輛行駛總里程程(公里公里)等等 第6頁/共44頁第六頁,共44頁。隨訪

3、(隨訪(follow-up)資料)資料(zlio)的記錄的記錄 生存資料一般通過隨訪收集, 記錄的項(xiàng)目: (起始與終止)隨訪事件 生存時(shí)間(開始觀察日期(rq)與終止觀察日期(rq))(年、月、天、小時(shí)、分、秒等) 分組變量(處理方法) 和其它協(xié)變量(性別、年齡、職業(yè)、文化程度等)第7頁/共44頁第七頁,共44頁。月 份(2000年)圖12-1 生存時(shí)間原始記錄示意 (+截尾)789101112130.01.02.03.04.05.06.07.0No. 1 2 3 4 5 天 數(shù)圖12-2 生存時(shí)間排序整理數(shù)據(jù)示意03060901201501800.01.02.03.04.05.06.07.0

4、No. 5 4 1 2 33396158 01167第8頁/共44頁第八頁,共44頁。生存生存(shngcn)時(shí)間資料的特時(shí)間資料的特點(diǎn)點(diǎn) 2個(gè)效應(yīng)變量(1)生存時(shí)間(天數(shù)(tinsh),(2)結(jié)局(死亡與否、是否陽性等)刪失(截尾)數(shù)據(jù):在規(guī)定的觀察期內(nèi),對(duì)某些觀察對(duì)象由于某種原因未能觀察到死亡結(jié)局,并不知道確切的生存時(shí)間,稱為生存時(shí)間的刪失數(shù)據(jù)(censored data)。如表12-1中的1號(hào)和 3號(hào)病人未觀察到底,不知他們究竟能活多長時(shí)間。 產(chǎn)生結(jié)尾原因:(1)遷移 (2)死于其他原因 (3)因其他客觀原因中途退出 (4)研究結(jié)束時(shí)終點(diǎn)事件尚未發(fā)生分布類型復(fù)雜:生存時(shí)間分布不服從正態(tài)分

5、布,常常呈正偏態(tài)分布、Weibull分布、Gamma分布或更為復(fù)雜的分布,因此要用特殊的統(tǒng)計(jì)方法。第9頁/共44頁第九頁,共44頁。 2個(gè)效應(yīng)變量(1)生存時(shí)間(天數(shù)),(2)結(jié)局(jij)(死亡與否、是否陽性等)錯(cuò)誤1:忽略生存時(shí)間,采用Logistic回歸分析死亡率錯(cuò)誤2:忽略結(jié)局(jij),采用t檢驗(yàn)、線性回歸分析生存時(shí)間第10頁/共44頁第十頁,共44頁。 得不到確切的生存(shngcn)時(shí)間,但它們提供的生存(shngcn)時(shí)間長于觀察期的時(shí)間,這種數(shù)據(jù)為不完全數(shù)據(jù)?;蚪匚矓?shù)據(jù)、刪失數(shù)據(jù)或終檢值。 (如有確切的生存(shngcn)時(shí)間,則這種數(shù)據(jù)稱為完全數(shù)據(jù)。) 兩種錯(cuò)誤的做法: 錯(cuò)

6、誤1:丟棄截尾數(shù)據(jù),只考慮確切數(shù)據(jù)。(損失了信息) 錯(cuò)誤2:將截尾數(shù)據(jù)當(dāng)作確切數(shù)據(jù)處理。(低估了生存(shngcn)時(shí)間的平均水平)。截尾截尾(ji wi)(ji wi)(刪失刪失) )數(shù)據(jù)或終檢值數(shù)據(jù)或終檢值(censored data)(censored data)第11頁/共44頁第十一頁,共44頁。 兩種錯(cuò)誤的做法: 錯(cuò)誤1:采用平均生存時(shí)間而不是(b shi)采用中位生存時(shí)間來表示生存時(shí)間的平均水平。 錯(cuò)誤2:采用常規(guī)t檢驗(yàn)或方差分析進(jìn)行組間比較。(應(yīng)采用log-rank檢驗(yàn)比較幾組生存時(shí)間 )正偏態(tài)(正偏態(tài)(positive skewnesspositive skewness)數(shù)據(jù)

7、)數(shù)據(jù)(shj)(shj)第12頁/共44頁第十二頁,共44頁。二、生存分析的統(tǒng)計(jì)描述二、生存分析的統(tǒng)計(jì)描述(mio sh)(mio sh)指標(biāo)指標(biāo)1.死亡死亡(swng)概率、生存概率、生存概率概率2. 生存率及其標(biāo)準(zhǔn)誤生存率及其標(biāo)準(zhǔn)誤3. 半數(shù)生存期(中位數(shù))半數(shù)生存期(中位數(shù)) 及四分位數(shù)間距及四分位數(shù)間距第13頁/共44頁第十三頁,共44頁。例1 手術(shù)治療60例肺癌病人,術(shù)后每年(minin)死亡10例,無刪失。試求基本生存分析指標(biāo)。N=60;術(shù)后 年內(nèi) 年內(nèi) 年初 年 死亡死亡 死亡死亡 生存生存 (t+1)年年 年 死亡 截尾 觀察 平均 率率 概率概率 概率概率 生存率生存率 數(shù)

8、 例數(shù) 例數(shù) 例數(shù) 例數(shù) p=1-q t d c n0 n=no-d/2 m=d/n q=d/n0 (n0-d)/n0 (n0-d)/N (1) (2) (3) (4) (5) (6) (7) (8) (9) 0 10 0 60 55 . 181 . 167 . 833 . 833 1 10 0 50 45 . 222 . 200 . 800 . 667 2 10 0 40 35 . 286 . 250 . 750 . 500 3 10 0 30 25 . 400 . 333 . 667 . 333 4 10 0 20 15 . 667 . 500 . 500 . 167第14頁/共44頁第十

9、四頁,共44頁。 1 . 死亡率、死亡概率、生存(shngcn)概率 (1) 死亡率 (mortality rate,death rate) 表示某單位時(shí)間內(nèi)的死亡強(qiáng)度。 年平均人口數(shù)=(年初人口數(shù)+年末人 口數(shù))/20001000年平均人口數(shù)年內(nèi)死亡人數(shù)年死亡率m第15頁/共44頁第十五頁,共44頁。 (2) 死亡概率 ( mortality probability ) 是指單位時(shí)段開始時(shí)存活的個(gè)體到該時(shí)段結(jié)束時(shí)死亡的可能性,即死于某時(shí)段tt+n內(nèi)的概率。 d/n0 年內(nèi)有刪失,分母用校正(jiozhng)人口數(shù): 校正(jiozhng)人口數(shù)= 年初人口數(shù)刪失例數(shù) / 2 n0c/2 年初

10、觀察例數(shù)年內(nèi)死亡人數(shù)年死亡概率 q第16頁/共44頁第十六頁,共44頁。 (3) 生存概率 ( survival probability ) 指某單位時(shí)段開始時(shí)存活的個(gè)體到該時(shí)段結(jié)束時(shí)仍存活的可能性的大小(dxio)。 (n0-d)/n0 分子為年末尚存人數(shù), 若年內(nèi)有刪失,分母用校正人口數(shù)。qp死亡概率年生存概率1年初人口數(shù)該年活滿一年的人數(shù)第17頁/共44頁第十七頁,共44頁。生存率 (survival rate) ( 累積生存概率 cumulative probability of survival ) 指病人經(jīng)歷t個(gè)單位時(shí)間(shjin)后仍存活的概率。 生存概率指單個(gè)時(shí)段的概率, 生

11、存率指從0t多個(gè)時(shí)段的積累概率。 2. 生存率及其生存率及其標(biāo)準(zhǔn)標(biāo)準(zhǔn)(biozhn)誤誤第18頁/共44頁第十八頁,共44頁。 生存率與生存概率僅一字之差,含義卻是不同的。 生存概率是針對(duì)單位時(shí)間而言的,生存率是針對(duì)某個(gè)較長時(shí)間段的,它是生存概率的累積結(jié)果。 如評(píng)價(jià)腫瘤預(yù)后常用的5年生存率,是指第1年存活(cn hu)、第2年也存活(cn hu),直至第5年仍存活(cn hu)的累積概率,而這5年間每1年有不同的生存概率。 第19頁/共44頁第十九頁,共44頁。如數(shù)據(jù)中無刪失,生存率可用下式計(jì)算如果有刪失數(shù)據(jù),則需分時(shí)段計(jì)算不同單位時(shí)間的生存概率(gil)Pi(i=1,2,t),然后利用概率(

12、gil)乘法原理將Pi相乘得到t時(shí)刻生存率。S ( t ) = P (T tk ) = p1 p2 pk 時(shí)刻內(nèi)觀察總例數(shù)時(shí)刻仍存活例數(shù)tttTPtS)()(第20頁/共44頁第二十頁,共44頁。 例如手術(shù)治療50例肺癌病人(bngrn),術(shù)后1,2,3年的 死亡數(shù)分別為10,10,10例,無截尾數(shù)據(jù)。 試求各年的 生存概率和3年生存率。 解: 各年生存概率 p1 = ( 50 10 ) / 50, p2 = ( 40 10 ) / 40, p3 = ( 30 10 ) / 30 3 年生存率 S(3) = P(T 3) (n0-d)/N = ( 50 30 ) / 50 = 0.4000 或

13、 S(3) = p1 p2 p3 = 0.4000 第21頁/共44頁第二十一頁,共44頁。 生存率的標(biāo)準(zhǔn)(biozhn)誤 生存率置信區(qū)間 kjjjjjkkjjjjkkdnndtSnpqtStSSE10010)()()()(2( ) ( )S tZSE S t第22頁/共44頁第二十二頁,共44頁。 生存(shngcn)曲線 以生存(shngcn)時(shí)間為橫軸,生存(shngcn)率為縱軸繪制的曲線 (a)研究終止在475天 (b) 研究終止在474天圖12-3 乘積極限法生存曲線(階梯形階梯形)及其半數(shù)生存期(Md=158天)0100200300400500t (day)0.00.20.40

14、.60.81.0S(t)S(132)=0.50100200300400500t (day)0.00.20.40.60.81.0S(t)Md=158圖12-4 壽命表法生存(shngcn)曲線(折線)及其半數(shù)生存(shngcn)期(Md=1.7年)第23頁/共44頁第二十三頁,共44頁。生存生存(shngcn)曲線給我們的信息曲線給我們的信息 階梯狀;每一級(jí)階梯代表一個(gè)死亡時(shí)間點(diǎn) (在截尾時(shí)間點(diǎn)無階梯);如果最大時(shí)間點(diǎn)是截尾則生存曲線(qxin)不與曲線(qxin)相交(見下圖),否則與橫軸相交。0.00.10.20.30.40.50.60.70.80.91.00123456Time (Year

15、s)DeathCensored第24頁/共44頁第二十四頁,共44頁。 Median Survival0.00.10.20.30.40.50.60.70.80.91.00123456Time (Years)1.8 Years生存(shngcn)曲線給我們的信息第25頁/共44頁第二十五頁,共44頁。 3. 半數(shù)生存期及四分位數(shù)間距 半數(shù)生存期也稱中位生存期(median survival time), 即生存時(shí)間中位數(shù),表示恰好有50%的個(gè)體活過此時(shí)間,即生存率為時(shí)對(duì)應(yīng)的生存時(shí)間(集中趨勢(shì)指標(biāo))。其數(shù)值可借助生存曲線進(jìn)行粗略的圖表法估計(jì),或用線性內(nèi)插法求解精確的數(shù)值。刪失數(shù)據(jù)超過樣本量的50%

16、時(shí),無法估計(jì)中位生存時(shí)間。此時(shí)較為實(shí)際的做法是使用生存時(shí)間超過一給定(i dn)時(shí)間長度的概率(如3年生存率或5年生存率)生存期的四分生存期的四分(s fn)位數(shù)間距位數(shù)間距tt,反映離散程度大小反映離散程度大小第26頁/共44頁第二十六頁,共44頁。三、資料三、資料(zlio)的基本要求的基本要求 1. 死亡例數(shù)(或死亡比例)不宜太少,否 則宜出現(xiàn)偏性; 2. 截尾原因無偏性; 3. 生存時(shí)間(shjin)盡可能記錄精確 第27頁/共44頁第二十七頁,共44頁。第28頁/共44頁第二十八頁,共44頁。 第二節(jié)小樣本(yngbn)生存率的kaplan-Meier估計(jì) 第29頁/共44頁第二十九

17、頁,共44頁。 乘積極限法乘積極限法(product-limit method)又稱又稱Kaplan-Meier 法,由法,由Kaplan和和Meier于于1958年提出年提出(t ch) ,主要針對(duì)小樣本資料,也可用于大樣本,是一種非參數(shù)方法。,主要針對(duì)小樣本資料,也可用于大樣本,是一種非參數(shù)方法?;舅枷耄簩⑸鏁r(shí)間由小到大依次排列,在每個(gè)死亡點(diǎn)上,計(jì)算其期初人數(shù)、死亡人數(shù)、死基本思想:將生存時(shí)間由小到大依次排列,在每個(gè)死亡點(diǎn)上,計(jì)算其期初人數(shù)、死亡人數(shù)、死亡概率、生存概率和生存率。亡概率、生存概率和生存率。 第30頁/共44頁第三十頁,共44頁。11名接受名接受“手術(shù)手術(shù)+化療化療”治療

18、的乳腺癌患者治療的乳腺癌患者(hunzh)的生存的生存時(shí)間:時(shí)間:10,14,15,16+,19,19,20,20+,24,26,28序序號(hào)號(hào)時(shí)間時(shí)間(月月)死死亡亡數(shù)數(shù)刪刪失失數(shù)數(shù)期初例期初例數(shù)數(shù)生存概率生存概率生存率生存率標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)誤itidiciniPi=(ni-di)/niS(ti)SE(S(ti)110101110/11=0.90910.90910.086721410109/10=0.90000.81820.11633151098/9=0.88890.72730.1343416+0188/8=1.00000.727307=0.71430.51950.1569

19、6201054/5=0.80000.41560.1562720+0144/4=1.00000.415603=0.66670.277102=0.50000.13850.124510281010/1=0.00000.0000-第31頁/共44頁第三十一頁,共44頁。1952.19,5 . 05195. 04196. 05195. 0192019mmtt中位生存期3911.24,75. 08182. 07273. 08182. 01415147575tt7503.14,25. 02771. 01385. 02771. 02426242525tt第3

20、2頁/共44頁第三十二頁,共44頁。kjjjjjkkjjjjkkdnndtSnpqtStSSE10010)()()()(第33頁/共44頁第三十三頁,共44頁。 (a)研究終止在475天 (b) 研究終止在474天圖12-3 乘積極限法生存曲線(階梯形階梯形)及其半數(shù)生存期(Md=158天)0100200300400500t (day)0.00.20.40.60.81.0S(t)S(132)=0.50100200300400500t (day)0.00.20.40.60.81.0S(t)Md=15800第34頁/共44頁第三十四頁,共44頁。第三節(jié) 大樣本生存率的壽命(shumng)表法估計(jì)

21、壽命(shumng)表法(life-table method)的應(yīng)用早于KaplanMeier法,它是KaplanMeier法的近似方法(頻數(shù)表法) 第35頁/共44頁第三十五頁,共44頁。10100( (1)(1)(1)()kjkkjjjkjkjjjjqSE S tS tp ndS tnnd第36頁/共44頁第三十六頁,共44頁。圖圖12-4 壽命表法生存曲線壽命表法生存曲線(qxin)(折線折線)及其半數(shù)生存期及其半數(shù)生存期(Md=1.7年)年)壽命表法只估計(jì)(gj)時(shí)段右端點(diǎn)的生存率,省略了時(shí)段內(nèi)的生存率估計(jì)(gj) 第37頁/共44頁第三十七頁,共44頁。 第四節(jié) 生存曲線比較的假設(shè)檢驗(yàn) Log rank(時(shí)序) 檢驗(yàn)(也稱為(chn wi)Cox-Mantel檢驗(yàn)) Breslow檢驗(yàn)(也稱Breslow廣義Wilcoxon檢驗(yàn) ) 第38頁/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論