生存分析概述及實(shí)例分析_第1頁(yè)
生存分析概述及實(shí)例分析_第2頁(yè)
生存分析概述及實(shí)例分析_第3頁(yè)
生存分析概述及實(shí)例分析_第4頁(yè)
生存分析概述及實(shí)例分析_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

.,生存分析,(10號(hào))21160311055侯笛,.,目錄,.,概述,.,定義,生存分析是研究生存現(xiàn)象和響應(yīng)時(shí)間數(shù)據(jù)及其統(tǒng)計(jì)規(guī)律的一門學(xué)科。由于最初研究的關(guān)鍵事件是死亡,故稱為生存分析。生存分析是統(tǒng)計(jì)科學(xué)的重要分支,其研究的兩個(gè)重要變?cè)獮椤笆录焙汀皦勖?。事件:生存分析中定義的事件有死亡、損壞、失敗、解雇、病發(fā)等等。例如病人的死亡,產(chǎn)品的失效,疾病的發(fā)生,職員被解雇。壽命:從記錄開始到事件發(fā)生的時(shí)間。,.,特點(diǎn),生存分析的優(yōu)點(diǎn)在于其能夠處理刪失數(shù)據(jù)。生存分析的統(tǒng)計(jì)資料以生存時(shí)間為反應(yīng)變量,此類資料的生存時(shí)間變量大多不服從正態(tài)分布,且由于刪失值的存在,不適合用傳統(tǒng)的分析方法處理。此時(shí)就應(yīng)選用生存分析的方法。,.,研究?jī)?nèi)容,生存分析研究的內(nèi)容主要有以下兩個(gè)方面:一對(duì)生存過程的描述二分析生存過程的影響因素并對(duì)生存的結(jié)局加以預(yù)測(cè),.,應(yīng)用領(lǐng)域,生存分析雖然源自醫(yī)學(xué)領(lǐng)域,但其在生物學(xué),保險(xiǎn)學(xué),可靠性工程學(xué),經(jīng)濟(jì)學(xué),教育學(xué),社會(huì)學(xué)等領(lǐng)域都有廣泛的應(yīng)用。比如:醫(yī)療科學(xué)中病人的去世保險(xiǎn)行業(yè)中的賠償可靠性工程中產(chǎn)品的失效金融領(lǐng)域中銀行賬戶從開立到取消的時(shí)間的研究教育行業(yè)中學(xué)生的中途退學(xué)客戶關(guān)系管理中的客戶流失,.,常用術(shù)語(yǔ),.,生存數(shù)據(jù),生存分析中所分析的數(shù)據(jù)通常稱為分析數(shù)據(jù),一般度量的是某個(gè)事件發(fā)生所經(jīng)歷的時(shí)間長(zhǎng)度。生存數(shù)據(jù)可以分為完全數(shù)據(jù)和刪失數(shù)據(jù)。完全數(shù)據(jù):指提供了完整信息的數(shù)據(jù)。例如,在研究產(chǎn)品的失效時(shí)間時(shí),某個(gè)樣品從進(jìn)入研究直到失效都在我們的觀察中,可以得到該樣品的具體失效時(shí)間,這就是一個(gè)完全數(shù)據(jù)。刪失數(shù)據(jù):是指在觀測(cè)期內(nèi),我們并沒有看見個(gè)體的狀態(tài)發(fā)生改變,無(wú)法確定個(gè)體具體的生存時(shí)間。又分為左刪失數(shù)據(jù),右刪失數(shù)據(jù),區(qū)間刪失數(shù)據(jù)。,.,刪失數(shù)據(jù)示意圖,起始觀測(cè)時(shí)間區(qū)間終止,死亡,死亡,死亡,未知,退出,完全數(shù)據(jù):A,觀測(cè)期內(nèi)死亡右刪失數(shù)據(jù):B,觀測(cè)未終止時(shí)因故退出C,觀測(cè)終止時(shí)尚未死亡左刪失數(shù)據(jù):D,死亡時(shí)間在某一時(shí)刻之前,具體時(shí)間未知區(qū)間刪失數(shù)據(jù):E,死亡時(shí)間位于某一區(qū)間,具體時(shí)間未知,.,生存函數(shù),生存函數(shù)(survivalfunction),又稱為累積生存率,我們用符號(hào)T表示個(gè)體的生存時(shí)間(從開始記錄到事件發(fā)生的時(shí)間),用t表示觀測(cè)時(shí)間,將生存函數(shù)記作S(t),是指?jìng)€(gè)體生存時(shí)間大于t的概率。S(t)=P(Tt),顯然S(t)是非升函數(shù),且S(0)=1,S()=0,,.,風(fēng)險(xiǎn)函數(shù),風(fēng)險(xiǎn)函數(shù)(hazardfunction),又稱為瞬時(shí)死亡率,記作h(t)。是指在t時(shí)刻存活的個(gè)體,在t+t時(shí)刻死亡的概率。顯然,h(t)非負(fù),且無(wú)上限。,.,分析方法,.,按照是否使用參數(shù),可以將生存分析中的分析方法分為三類:參數(shù)方法:若已經(jīng)證明某事件的發(fā)展可以用某個(gè)參數(shù)模型很好地?cái)M合,就可以用參數(shù)方法做該事件的生存分析。常用的參數(shù)模型有指數(shù)分布模型、對(duì)數(shù)分布模型、正態(tài)分布模型,威泊分布模型等。非參數(shù)方法:當(dāng)被研究事件不能被參數(shù)模型很好地?cái)M合時(shí),可以采用非參數(shù)方法研究它的生存特征。常用的非參數(shù)方法包括生命表分析和K-M分析。半?yún)?shù)方法:它比參數(shù)模型靈活,與非參數(shù)方法相比更容易對(duì)分析結(jié)果進(jìn)行解釋。生存分析中使用的半?yún)?shù)模型是Cox比例風(fēng)險(xiǎn)模型。,.,非參數(shù)方法,生命表分析K-M分析,.,生命表分析,生命表分析將觀測(cè)時(shí)間分成時(shí)間段,按時(shí)間段逐個(gè)統(tǒng)計(jì)事件發(fā)生的情況,以此估計(jì)生存函數(shù)。假設(shè)共有k個(gè)時(shí)間段t0,t1),t1,t2),tk-1,tk),每個(gè)區(qū)間中事件發(fā)生的次數(shù)分別為d1,d2,dk,每個(gè)區(qū)間中的個(gè)體總數(shù)分別為n1,n2,nk,所以在第i個(gè)區(qū)間個(gè)體存活的概率為(ni-di)/ni,而個(gè)體可以從第一個(gè)區(qū)間存活到第i個(gè)區(qū)間的概率(累積生存率)為:i=1,2,k,且S(t)為遞減函數(shù)。,.,K-M分析,Kaplan-Meier分析,也稱為乘積極限分析,是Kaplan和Meier在1958年提出的一種估計(jì)生存函數(shù)的非參數(shù)方法。與生命表分析不同,K-M分析以事件發(fā)生的時(shí)間點(diǎn)將觀測(cè)區(qū)間分段,用來(lái)估計(jì)生存函數(shù)。下舉例說(shuō)明其具體的分析過程。,.,下表記錄了5個(gè)實(shí)驗(yàn)對(duì)象的存活時(shí)間,其中F代表失效,S代表存活,2和4為右刪失數(shù)據(jù)。,用S(t)表示實(shí)驗(yàn)對(duì)象的累積存活概率,分時(shí)間段計(jì)算如右:,t,0,31):此區(qū)間5個(gè)實(shí)驗(yàn)對(duì)象均存活,故S(t)=5/5=1.31,65):個(gè)體1在31小時(shí)死亡,故本區(qū)間S(t)=14/5=0.865,150):個(gè)體2在65小時(shí)退出實(shí)驗(yàn),本區(qū)間無(wú)個(gè)體死亡,S(t)=0.84/4=0.8.150,220):個(gè)體3在150小時(shí)死亡,S(t)=0.82/3=0.53.220,300):個(gè)體4在220小時(shí)退出實(shí)驗(yàn),本區(qū)間無(wú)個(gè)體死亡,S(t)=0.532/2=0.53.t=300時(shí),個(gè)體5死亡,S(300)=0,.,以SPSS對(duì)上例進(jìn)行K-M分析,結(jié)果如下:1.輸入數(shù)據(jù),2.進(jìn)行K-M分析,.,參數(shù)設(shè)置,.,輸出結(jié)果,K-M分析生存函數(shù)圖,.,生命表分析與K-M分析的比較,生命表分析適用于大樣本的情況,特別是沒有個(gè)體數(shù)據(jù)的情形,主要優(yōu)點(diǎn)是對(duì)生存時(shí)間的分布沒有要求。K-M分析中時(shí)間區(qū)間的劃分是以事件的發(fā)生為依據(jù)的,因此必須知道每個(gè)個(gè)體的生存時(shí)間數(shù)據(jù),適用于小樣本的情況。,.,半?yún)?shù)方法,生存分析中我們常常遇到個(gè)體的生存狀況受到多種因素影響的情況。這些對(duì)生存時(shí)間有影響的變量稱為協(xié)變量。在分析生存數(shù)據(jù)時(shí)要將協(xié)變量的影響考慮進(jìn)去。Cox半?yún)?shù)模型就很好地解決了這個(gè)問題。它假定風(fēng)險(xiǎn)函數(shù)由兩部分構(gòu)成:基準(zhǔn)風(fēng)險(xiǎn)函數(shù)和協(xié)變量線性組合的指數(shù)。Cox半?yún)?shù)模型又分為獨(dú)立協(xié)變量比例風(fēng)險(xiǎn)模型和時(shí)間相依性協(xié)變量比例風(fēng)險(xiǎn)模型兩種。二者的區(qū)別在于協(xié)變量的取值是否和時(shí)間有關(guān)。,.,Cox獨(dú)立協(xié)變量比例風(fēng)險(xiǎn)模型,該模型可寫成如下形式:式中,Z1,Z2,Zm為協(xié)變量,這里的協(xié)變量與時(shí)間無(wú)關(guān),1,2,m為對(duì)應(yīng)協(xié)變量的未知參數(shù)。h0(t)是基準(zhǔn)風(fēng)險(xiǎn)函數(shù)。實(shí)際應(yīng)用中常比較兩個(gè)不同個(gè)體風(fēng)險(xiǎn)函數(shù)的比率,即危險(xiǎn)率??梢宰C明危險(xiǎn)率為常數(shù),因此該模型又稱為比例風(fēng)險(xiǎn)模型。當(dāng)協(xié)變量與時(shí)間有關(guān)時(shí),危險(xiǎn)率將不再是常數(shù),此時(shí)稱為時(shí)間相依性比例風(fēng)險(xiǎn)模型。,.,案例分析,.,兩組小白鼠用來(lái)檢驗(yàn)癌癥的治療狀況。一組使用傳統(tǒng)治療方法,另一組使用試驗(yàn)方法,試驗(yàn)人員記錄了小白鼠的存活時(shí)間及狀態(tài):Days為存活時(shí)間或觀測(cè)時(shí)間;Status表示生存狀態(tài),取值1表示死亡,0表示存活;Group表示治療方法,取0表示傳統(tǒng)療法,取1表示試驗(yàn)療法,共有64組數(shù)據(jù)。,.,原始數(shù)據(jù)如下:,.,首先用生命表分析方法對(duì)數(shù)據(jù)進(jìn)行處理:,1.輸入數(shù)據(jù),2.選擇生命表分析,.,3.設(shè)置參數(shù),.,4.輸出結(jié)果,可以看出,大約在200天時(shí)兩種治療方法的生存函數(shù)相交,在200天以前傳統(tǒng)治療方法的存活率較高,而在200天以后試驗(yàn)方法的治療效果明顯優(yōu)于傳統(tǒng)治療方法。,中位數(shù)生存時(shí)間是生存率為50%時(shí),生存時(shí)間的平均水平。從中位數(shù)生存時(shí)間來(lái)看,傳統(tǒng)治療方法的中位數(shù)為241天,試驗(yàn)方法的中位數(shù)為266天,明顯高于傳統(tǒng)治療方法。可以判斷試驗(yàn)方法的療效相比傳統(tǒng)治療方法有所提高。,.,用K-M方法對(duì)數(shù)據(jù)進(jìn)行處理,結(jié)果如下:,生存函數(shù)分布和生命表分析的結(jié)果相似。K-M方法可以記錄刪失數(shù)據(jù),且由于分段較多整體呈現(xiàn)密集的鋸齒,而生命表分析的分布則較為平緩。在結(jié)果檢驗(yàn)上,不同檢驗(yàn)方法結(jié)果有所差異,其中LogRank檢驗(yàn)的p值小于0.05,表明兩種治療方法有顯著性差異。,.,除了治療方法對(duì)小白鼠的生存狀況有影響,其他因素如性別,年齡,體重等都可能對(duì)其生存時(shí)間造成影響。加入這些數(shù)據(jù)后,用Cox獨(dú)立協(xié)變量比例風(fēng)險(xiǎn)模型重新分析。,1.輸入數(shù)據(jù),2.設(shè)置參數(shù),.,3.輸出結(jié)果,分類變量是指不連續(xù)的變量,此例中治療方法的值只取0和1,性別只取F和M。不同于體重、年齡這些連續(xù)變量,分類變量在計(jì)算風(fēng)險(xiǎn)比例時(shí)以參考類別作為參照。如在本案例中治療方法這一因子以試驗(yàn)方法作為參照。計(jì)算結(jié)果為傳統(tǒng)方法的風(fēng)險(xiǎn)率相對(duì)于參考的倍數(shù)。,.,.,上表為模型系數(shù)的綜合檢驗(yàn)結(jié)果??梢钥吹絧=0,小于0.05,說(shuō)明這些因素中有些變量對(duì)白鼠的生存時(shí)間有顯著影響。,.,此表給出了各個(gè)變量的單個(gè)模型系數(shù)檢驗(yàn)結(jié)果,可以看到體重變量的p=0,說(shuō)明體重對(duì)風(fēng)險(xiǎn)函數(shù)有極顯著影響。體重每增加1(盎司

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論