生存數(shù)據(jù)的mea分析_第1頁
生存數(shù)據(jù)的mea分析_第2頁
生存數(shù)據(jù)的mea分析_第3頁
生存數(shù)據(jù)的mea分析_第4頁
生存數(shù)據(jù)的mea分析_第5頁
全文預覽已結(jié)束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

生存數(shù)據(jù)的mea分析

生存分析是一種將最終事件發(fā)生與結(jié)束事件經(jīng)歷的統(tǒng)計分析方法。生存分析以其通常的研究結(jié)束事件為基礎。當前,生存分析已廣泛的運用于惡性腫瘤、慢性疾病或其他情況的隨訪研究中事件分析,比如疾病的發(fā)生、復發(fā)、傷口的愈合、某種癥狀的消失等。生存資料的分析主要特點就是考慮每個研究對象出現(xiàn)某一結(jié)局所經(jīng)歷的時間。生存曲線則是以生存時間為橫軸,生存率為縱軸,將各個時間點對應的生存率連接在一起的曲線圖。系統(tǒng)評價Meta分析中對生存資料的合并是一個棘手的問題,主要原因是較多原始研究無法直接獲得效應量及其可信區(qū)間或原始數(shù)據(jù)。當前使用軟件進行合并時,一般來說要獲得以下三類數(shù)據(jù):(1)O-E(logrankObservedminusExpectedevents)和V(logrankVariance);(2)lnHR(風險比的對數(shù))和SelnHR(風險比對數(shù)的標準誤);(3)lnHR(風險比的對數(shù)),lnLL(風險比可信區(qū)間下限的對數(shù))和lnUL(風險比可信區(qū)間上限的的對數(shù))。這些類型的數(shù)據(jù)一般在原始研究中不會直接報告或僅報告了其中的某一部分,在這樣的情況下就需要對數(shù)據(jù)進行正確的轉(zhuǎn)換。然而,即便如此,有些數(shù)據(jù)還是無法獲得,但多數(shù)的預后研究的文章會提供生存曲線,如何從生存曲線中獲取有效的數(shù)據(jù)呢?本文將系統(tǒng)介紹如何從生存曲線中提取數(shù)據(jù)并進行合理的計算,最終獲得可以用于合并的數(shù)據(jù)。1數(shù)據(jù)的合并和應用當前,制作生存資料Meta分析的方法有以下幾種方法:第一,通過非編程軟件完成。當前可用的有ReviewManager5(RevMan5)和ComprehensiveMetaAnalysisV2(CMAV2)。一般來說要直接獲得或通過數(shù)據(jù)轉(zhuǎn)化獲得以下三類數(shù)據(jù)才能進行有效合并:(1)O-E和V;(2)lnHR和SelnHR;(3)lnHR,lnLL和lnUL。第二,通過編程軟件完成。如Stata、R、JAGS、BUGS、Stan軟件。一般來說要獲得以下兩類數(shù)據(jù)才能進行有效合并:(1)lnHR和SelnHR;(2)lnHR,lnLL和lnUL。第三,在HR無法計算的條件下,也可選擇相對危險度(RR)或者比值比(OR)為效應量。這種方法存在一些固有的缺陷,主要因為HR考慮了發(fā)生終點的時間所經(jīng)歷的時間,但RR或者OR并未考慮時間因素,較HR丟失了一些重要的信息,故采用RR或者OR作為生存資料的效應量不作為常規(guī)選擇。這種方法與常規(guī)的二分類數(shù)據(jù)的Meta分析是一樣的。第四,IPD的Meta分析。因該類Meta分析數(shù)據(jù)難以獲取且國內(nèi)開展的可能性極小,故不作展開介紹。2獲取和處理生存曲線圖以下將以實例的形式演示如何從生存曲線中提取Meta分析所需要的各時間段的生存率并通過計算獲得Meta分析所需要的數(shù)據(jù)。2.1下載和安裝軟件2.2起源文件的格式從原始文獻中獲取的圖片要足夠清晰,建議至少到達300dpi,原始文獻盡可能選擇下載高質(zhì)量的PDF格式。本文示例為《lancetoncology》上的一篇Ⅲ期隨機對照試驗《Continuationofbevacizumabafterfirstprogressioninmetastaticcolorectalcancer(ML18147):arandomisedphase3trial》。獲得PDF格式的全文以后,再通過Windows操作系統(tǒng)自帶的截圖工具截取該圖片。具體操作方法為:盡可能放大使圖在屏幕上完全顯示,并且包含完整縱橫坐標,點擊鍵盤右上角的“PrtScn”鍵,再按照“所有程序→附件→截圖工具”打開畫圖工具并使用“Ctrl+V”將圖片黏貼到畫圖工具中,再存為JPG格式并重新命名。2.3黑白圖片去色由于EngaugeDigitizer4.1軟件僅能識別灰度圖,對于生存曲線為彩色線條的圖片需要常規(guī)將其調(diào)整為黑白圖片。此時可以借助于很多圖片處理軟件實現(xiàn),最常用的就是AdobePhotoshop。將截圖并保存的圖片導入AdobePhotoshopCS5軟件進行去色,去色的方法為依次點擊“圖像→調(diào)整→去色”即可實現(xiàn)。去色后,還需通過色階功能使黑白對比明顯,操作方法為通過“圖像→調(diào)整→色階”調(diào)出對話框,詳見圖1。處理后的圖片如圖2所示。3連續(xù)采樣方法提取生存曲線數(shù)據(jù)3.1圖像導入把處理后的圖(圖2)導入EngaugeDigitizer4.1軟件,導入方法及導入后狀態(tài)如圖3所示。3.2chem布里因子因為本例坐標中有2條生存曲線,故需要新建2條待提取數(shù)據(jù)的曲線。根據(jù)原文,將兩條曲線分別命名為“chemotherapy”和“bevaci”。如圖4所示,依次點擊“Settings→Curves→New”。新建曲線可點擊“properties”設置線型和顏色,有助于取點時區(qū)別兩條生存曲線。3.3個二維坐標系一般首先確定原點,然后分別確定X軸與Y軸的刻度,此步驟其實是在原圖的基礎上重新構(gòu)建一個二維坐標系,在這個新建的二維坐標系中的任何一個點都可以通過(x,y)表示。依次點擊“Digitize→AxisPoint”,調(diào)出圖5所示對話框并行相關設置。3.4連續(xù)取點的采用這兩條曲線3.5生存率數(shù)據(jù)的輸入和存儲3.6提取一般小數(shù)位數(shù)由于采用的是連續(xù)取點法提取數(shù)據(jù),故密集的取了很多點,得到了很多數(shù)據(jù)。然而,實際操作中并不需要如此多的數(shù)據(jù)用于后續(xù)的計算,故還需對提取的數(shù)據(jù)進行初步的篩選。首先通過Excel打開“圖5.csv”文件,然后把X這一列設置小數(shù)位數(shù)為0位,其余兩列數(shù)據(jù)小數(shù)位數(shù)設置為2位,如圖7所示。然后,選取時間點為0、3、6、9、12、15、18、21、24、27、30、33、36、39、42、45月時對應的生存率數(shù)據(jù),并刪除不需要的數(shù)據(jù)。需要說明一點:一般后一個時間點的生存率不可能大于前一個時間點,但因數(shù)據(jù)提取時存在誤差,可能出現(xiàn)后時間點生存率略大于前時間點,且這種情況多出現(xiàn)于生存曲線是水平線時,故需要對數(shù)據(jù)進行合理的整理。如果出現(xiàn)后一個時間點生存率的數(shù)據(jù)大于前一個時間點的情況,需要把后一個時間點的數(shù)據(jù)用前一個時間點的生存率數(shù)據(jù)代替,理由是前后時間點生存率相等是符合客觀情況的。此外還要注意,在隨訪開始時,一般0時間點的生存率為100%。處理后的數(shù)據(jù)如圖8所示。4ssr表的應用lnHR和SelnHR計算的具體方法可參考JayneFTierney等人的文獻這個Excel計算程序共計7個工作表,每個工作表都有特定的作用,本文主要就其中的與生存曲線數(shù)據(jù)提取相關的工作表作簡單介紹,其他計算方法讀者可參考JayneFTierney等人的文獻。4.1在做控制模塊時,把bevaci-chem-apy關聯(lián)到造林在工作表(1)中輸入本例中研究組的名稱,在Research一欄中輸入“bevacizumab”,在Control一欄中輸入“chemotherapy”,如圖9所示。提示一點:此步驟不是必須的,之所以需要命名是為了便于后續(xù)操作,具體的命名要根據(jù)實際情況確定。4.2采用紅色區(qū)域少數(shù)字報告,估計截尾在工作表(2a)中follow-up一欄中填入隨訪時間(一般輸入隨訪時間的范圍,本例中原文并沒有直接提供隨訪時間范圍,僅報告了隨訪時間的四分位數(shù)間距,筆者通過合理的估算填入了5~45.1月),此處必填,主要用于估計截尾數(shù)據(jù)。接著,依次輸入隨訪時間點,各時間點各組的生存率及各組的樣本例數(shù)(此處樣本例數(shù)應該填入進入ITT分析的樣本例數(shù))。在本步驟填寫過程中如果出現(xiàn)紅色字體提示,那就表示填寫或者計算過程有錯誤,需要重新核對錯誤的原因。整個填寫過程如圖10所示。4.3生存曲線模擬工作表(2a)填寫完畢后,在工作表(2b)中即可自動顯示按照提取的生存曲線數(shù)據(jù)重新模擬的生存曲線??稍诖伺c原文中的生存曲線進行比較,判斷是否有大的差別,如果有很大的差異需要重新尋找原因。本例中模擬的生存曲線與原文生存曲線相似,如圖11所示。5生存率的提取上述介紹了連續(xù)取點法提取的過程。如果僅需要從生存曲線選取所需要的點進行數(shù)據(jù)提取,并不希望像連續(xù)取點法那樣先取數(shù)個點再進行篩選和刪除,就可以選擇間斷取點的方法進行數(shù)據(jù)提取。為了便于比較,仍選取時間點為0、3、6、9、12、15、18、21、24、27、30、33、36、39、42、45月時對應的生存率數(shù)據(jù)進行提取。首先,借助AdobePhotoshop劃分圖片確定生存曲線上目標時間點對應的生存率所代表的點。將圖導入Photoshop后,選擇切片工具,并通過拖拉參考線把整個坐標區(qū)域框定,如圖13所示。第二步,平均劃分坐標區(qū)域為16等分(因本例按每隔3個月取一個點,故平均劃分為16等分,其他的實例需視具體情況而定),如圖14所示。第三步,選擇直線工具并按照上一步驟事先劃分的標記畫垂直豎線,垂直豎線與生存曲線的交點即是需要提取數(shù)據(jù)的點。至此我完成了已知橫縱坐標的數(shù)據(jù)點,如圖15和圖16所示。完成后進行保存?zhèn)溆谩W詈笠徊?將保存好的圖16導入EngaugeDigitizer4.1軟件,新建Curves、確定坐標軸的原點與縱橫坐標的刻度、后續(xù)取完點之后的計算等操作步驟與連續(xù)取點法相同;唯一不同點是取點時需要選擇間斷取點工具,如圖17所示。6間斷取點法目前從曲線或者圖形中提取數(shù)據(jù)的軟件很多,曲線是一種二維圖形,該類型的數(shù)據(jù)提取是相對較簡單的一種,各種數(shù)據(jù)提取軟件的原理大致相同,一般是按照原圖確定原點及縱橫坐標軸以重建一個二維坐標系,然后通過重建的二維坐標系確定其中任意一點的坐標。數(shù)據(jù)提取本身并不難,由生存率數(shù)據(jù)計算Meta合并所需要的中間數(shù)據(jù)我們可根據(jù)JayneFTierney等人共享的Excel程序進行計算,過程也并不難。但是以上操作是基于對生存分析深刻理解上的,所以建議讀者能系統(tǒng)學習生存分析的理論及概念。本例中間斷取點似乎并沒有顯示更多的優(yōu)越性。主要原因在于對于生存曲線需要取多個點,有些圖形的數(shù)據(jù)提取并不需要提取太多的點(比如僅需要幾個點),這種情況下間斷取點似乎更有優(yōu)勢。無論采用何種取點方法,具體建議讀者根據(jù)目標數(shù)據(jù)的特點、結(jié)合文章的背景而定。本文主要應用的軟件為圖形數(shù)據(jù)提取軟件EngaugeDigitizer4.1,軟件下載地址為:/projects/digitizer/。此類軟件有很多種,本文僅介紹EngaugeDigitizer,因為該軟件相對簡單并且容易獲得,而且完全免費。下載軟件并解壓后雙擊Engauge.exe即可使用,可創(chuàng)建桌面快捷方式方便下一步操作。選擇連續(xù)取點工具分別對“chemotherapy”及“bevaci”兩條曲線進行連續(xù)取點,此工具把鼠標移動到相應的位置可自動識別取點的區(qū)域,但需要注意同一個坐標軸中有2條曲線時需要按照原圖進行分辨,尤其是當兩條曲線非常接近之時,不能把一條曲線上的點誤認為是另外一條曲線的點。取點方法如圖6所示。軟件默認的導出數(shù)據(jù)的文件格式為“.csv”,這也是通用的數(shù)據(jù)存儲格式,可通過Exc

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論