【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報(bào)告論文(附代碼數(shù)據(jù))_第1頁
【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報(bào)告論文(附代碼數(shù)據(jù))_第2頁
【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報(bào)告論文(附代碼數(shù)據(jù))_第3頁
【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報(bào)告論文(附代碼數(shù)據(jù))_第4頁
【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報(bào)告論文(附代碼數(shù)據(jù))_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、【原創(chuàng)】定制代寫開發(fā)輔導(dǎo)答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計(jì)分析可視化調(diào)研報(bào)告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(wù)(附代碼數(shù)據(jù)),咨詢QQ:3025393450歡迎登陸官網(wǎng):/datablogR語言生存分析可視化數(shù)據(jù)分析報(bào)告R中的生存分析安裝并加載所需的R包我們將使用兩個(gè)R包:生存用于計(jì)算存活分析用于總結(jié)和可視化生存分析結(jié)果的survminer安裝軟件包install.packages(c(survival,survminer)加載包lib

2、rary(survival)library(survminer)示例數(shù)據(jù)集我們將使用生存包中提供的肺癌數(shù)據(jù)。data(lung)有問題百度搜索“石屛*據(jù)”就可以了歡迎登陸官網(wǎng):/databloghead(lung)insttimestatusagesexph.ecogph.karnopat.karnomeal.calwt.loss3306234552310101521021883212102217411906810901090119060101007411501001175NA9012251590NA156011501190NA0805130機(jī)構(gòu):機(jī)構(gòu)代碼時(shí)間:以天為單位的生存時(shí)間狀態(tài):審查狀

3、態(tài)1=審查,2=失效年齡:歲性別:男=1女=2ph.ecog:ECOG成績(jī)得分(0=好5=死)ph.karno:醫(yī)師對(duì)Karnofsky績(jī)效評(píng)分(差=0-好=100)pat.karno:Karnofsky表現(xiàn)評(píng)分,按患者評(píng)分meal.cal:用餐時(shí)消耗的卡路里wt.loss:最近六個(gè)月的體重減輕計(jì)算生存曲線:survfit()我們要按性別計(jì)算生存率。函數(shù)survfit()在生存包中可用于計(jì)算kaplan-Meier生存估計(jì)。其主要論點(diǎn)包括:歡迎登陸官網(wǎng):/datablog使用Surv()函數(shù)創(chuàng)建的生存對(duì)象以及包含變量的數(shù)據(jù)集。要計(jì)算生存曲線,請(qǐng)輸入:fit-survfit(Surv(time,

4、status)sex,data=lung)print(fit)Call:survfit(formula=Surv(time,status)sex,data=lung)neventsmedian0.95LCL0.95UCLsex=1138112270212310sex=29053426348550默認(rèn)情況下,函數(shù)print()顯示生存曲線的簡(jiǎn)短摘要。它打印觀察值,事件數(shù),中位生存率和中位值的置信度限制。如果要顯示生存曲線的更完整摘要,請(qǐng)鍵入以下內(nèi)容:Summaryofsurvivalcurvessummary(fit)Accesstothesortsummarytablesummary(fit)

5、$table訪問survfit()返回的值函數(shù)survfit()返回變量列表,包括以下組件:n:每條曲線中的對(duì)象總數(shù)。時(shí)間:曲線上的時(shí)間點(diǎn)。有問題百度搜索“柘花站居”就可以了歡迎登陸官網(wǎng):/datablogn。風(fēng)險(xiǎn):時(shí)間t處有風(fēng)險(xiǎn)的受試者人數(shù)n.event:在時(shí)間t發(fā)生的事件數(shù)。n。審查者:在時(shí)間t退出事件而不發(fā)生風(fēng)險(xiǎn)的審查者的數(shù)量。下,上:曲線的置信度上限和下限。分層:表示曲線估計(jì)的分層。如果地層不為NULL,則結(jié)果中有多條曲線。層次(因子)是曲線的標(biāo)簽??梢园匆韵路绞皆L問組件:dns38(100)78(57)31(22)136(4)2(1)K(10066(73)26(29)11(12)2(

6、2)0(0)02004006003001000TimeindaysTimeindaysKaplan-Meier圖可以解釋如下:橫軸(x軸)表示以天為單位的時(shí)間,縱軸(y軸)表示生存的可能性或生存的人口比例。線代表兩組的存活曲線。曲線中的垂直下降表示事件。曲線上的垂直刻度線表示此時(shí)已對(duì)患者進(jìn)行檢查。在零時(shí),生存概率為1.0(或100%的參與者還活著)。歡迎登陸官網(wǎng):/datablog在時(shí)間250,性別=1的存活概率約為0.55(或55%),性別=2的存活概率約為0.75(或75%)。性別=2的中位生存期約為270天,性別=2的中位生存期約為426天,這表明性別=2的生存期高于性別=1可以使用以下

7、代碼獲得每組的中位生存時(shí)間:summary(fit)$tablerecordsn.maxn.startevents*rmean*se(rmean)median0.95LCL0.95UCLsex=1138138138112325.066322.59845270212310sex=290909053458.275733.78530426348550每組的中位生存時(shí)間代表生存概率S(t)為0.5的時(shí)間。性別=1(男性)的中位生存時(shí)間為270天,而性別=2(女性)則為426天。與男性相比,女性肺癌似乎具有生存優(yōu)勢(shì)。但是,要評(píng)估此差異是否具有統(tǒng)計(jì)學(xué)顯著性,需要進(jìn)行正式的統(tǒng)計(jì)檢驗(yàn),這將在下一節(jié)中討論。注意

8、,置信極限在曲線的尾部很寬,很難進(jìn)行有意義的解釋。這可以通過以下事實(shí)來解釋:在實(shí)踐中,通常有一些患者在隨訪結(jié)束時(shí)迷失了隨訪或存活。因此,明智的做法是在隨訪結(jié)束之前在x軸上縮短繪圖(Pocock等,2002)o可以使用參數(shù)xlim縮短生存曲線,如下所示:ggsurvplot(fit,=TRUE,risk.table.col=strata,#Changerisktablecolorbygroupsggtheme=theme_bw(),#Changeggplot2theme有問題百度搜索“匚石屛”就可以了歡迎登陸官網(wǎng):/datablogpalette=c(#E7B800,#2E9FDF),xlim=

9、c(0,600)O.OD-020040DTime600+注意,可以使用參數(shù)fun指定三個(gè)經(jīng)常使用的轉(zhuǎn)換:“l(fā)og”:幸存者功能的對(duì)數(shù)轉(zhuǎn)換,事件”:繪制累積事件(f(y)=1-y)。也稱為累積發(fā)生率“cumhaz:”繪制了累積危害函數(shù)(f(y)=-log(y)例如,要繪制累積事件,請(qǐng)鍵入:ggsurvplot(fit,=TRUE,risk.table.col=strata,#Changerisktablecolorbygroups【原創(chuàng)】定制代寫開發(fā)輔導(dǎo)答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassig

10、nment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計(jì)分析可視化調(diào)研報(bào)告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(wù)(附代碼數(shù)據(jù)),咨詢QQ:3025393450【原創(chuàng)】定制代寫開發(fā)輔導(dǎo)答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計(jì)分析可視化調(diào)研報(bào)告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(wù)(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“石踹丸訂居”就可以了歡迎登陸官網(wǎng):/datablogggtheme=theme_bw(),#Changeggplot2t

11、hemepalette=c(#E7B800,#2E9FDF),fun=event)Stratasex=1+56x=2三署pra-nujnuKaplan-Meier生命表:生存曲線摘要如上所述,您可以使用函數(shù)summary()來獲得生存曲線的完整摘要:summary(fit)有問題百度搜索“石屛*據(jù)”就可以了歡迎登陸官網(wǎng):/datablog還可以使用功能surv_summary()在survminer程序包中獲取生存曲線的摘要。與默認(rèn)的summary()函數(shù)相比,surv_summary()創(chuàng)建一個(gè)包含來自survfit結(jié)果的摘要的數(shù)據(jù)框。res.sum-surv_summary(fit)hea

12、d(res.sum)timen.riskn.eventn.censorsurvstd.errupperlowerstratasex1113800.97826090.012689781.00000000.9542301sex=11213500.97101450.014707470.99941240.9434235sex=11313400.95652170.018148850.99115860.9230952sex=11513200.94927540.019677680.98660170.9133612sex=12613100.94202900.021117080.98183650.9038355

13、sex=13013000.93478260.022484690.97689890.8944820sex=1函數(shù)surv_summary()返回包含以下列的數(shù)據(jù)幀:時(shí)間:曲線有階躍的時(shí)間點(diǎn)。n。風(fēng)險(xiǎn):處于t風(fēng)險(xiǎn)中的受試者人數(shù)。n.event:在時(shí)間t發(fā)生的事件數(shù)。n。審查者:審查事件的數(shù)量。surv:估計(jì)生存概率。std.err:生存標(biāo)準(zhǔn)誤差。upper:置信區(qū)間的上限較低:置信區(qū)間的下限分層:表示曲線估計(jì)的分層。層次(因子)是曲線的標(biāo)簽?!驹瓌?chuàng)】定制代寫開發(fā)輔導(dǎo)答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscience

14、assignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計(jì)分析可視化調(diào)研報(bào)告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(wù)(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“柘花站居”就可以了【原創(chuàng)】定制代寫開發(fā)輔導(dǎo)答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計(jì)分析可視化調(diào)研報(bào)告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(wù)(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“柘花站居”就可以了歡迎登陸官網(wǎng):/datablog在生存曲線已擬合一個(gè)或多個(gè)

15、變量的情況下,surv_summary對(duì)象包含表示變量的額外列。這使得有可能按層次或某些因素組合來考慮ggsurvplot的輸出。surv_summary對(duì)象還有一個(gè)名為“表”的屬性,其中包含有關(guān)生存曲線的信息,包括具有置信區(qū)間的生存中位數(shù)以及每條曲線中受試者的總數(shù)和事件數(shù)。要訪問“表”屬性,請(qǐng)輸入以下內(nèi)容:attr(res.sum,table)比較生存曲線的Log-Rank檢驗(yàn):survdiff()對(duì)數(shù)秩檢驗(yàn)是比較兩個(gè)或多個(gè)生存曲線的最廣泛使用的方法。零假設(shè)是兩組之間的生存率沒有差異。對(duì)數(shù)秩檢驗(yàn)是一種非參數(shù)檢驗(yàn),它不對(duì)生存分布做出任何假設(shè)。本質(zhì)上,對(duì)數(shù)秩檢驗(yàn)將每個(gè)組中觀察到的事件數(shù)與如果原假

16、設(shè)為真(即,生存曲線相同)時(shí)的預(yù)期事件數(shù)進(jìn)行比較。對(duì)數(shù)秩統(tǒng)計(jì)量近似作為卡方檢驗(yàn)統(tǒng)計(jì)量分布。函數(shù)survdiff()在生存包中可用于比較兩個(gè)或更多生存曲線的對(duì)數(shù)秩檢驗(yàn)。survdiff()可以如下使用:surv_diff-survdiff(Surv(time,status)sex,data=lung)surv_diffCall:survdiff(formula=Surv(time,status)sex,data=lung)NObservedExpected(O-E)A2/E(O-E)A2/Vsex=113811291.64.5510.3sex=2905373.45.6810.3Chisq=10.

17、3on1degreesoffreedom,p=0.00131歡迎登陸官網(wǎng):/datablog該函數(shù)返回組件列表,包括:n:每組的科目數(shù)。obs:每組中事件的加權(quán)觀測(cè)數(shù)量。exp:每個(gè)組中加權(quán)的預(yù)期事件數(shù)。chisq:用于檢驗(yàn)相等性的卡方統(tǒng)計(jì)量。階層:(可選)每個(gè)階層中包含的主題數(shù)。生存差異的對(duì)數(shù)秩檢驗(yàn)給出p值為p=0.0013,表明性別群體的生存差異顯著。擬合復(fù)雜的生存曲線在本節(jié)中,我們將使用多個(gè)因素的組合來計(jì)算生存曲線。接下來,我們將結(jié)合多種因素來研究ggsurvplot()的輸出1-使用結(jié)腸數(shù)據(jù)集擬合(復(fù)雜)生存曲線require(survival)fit2-survfit(Surv(ti

18、me,status)sex+rx+adhere,data=colon)1-使用survminer可視化輸出。下圖顯示了根據(jù)rx&粘附力值按性別分面的生存曲線。#Plotsurvivalcurvesbysexandfacetbyrxandadhereggsurv-ggsurvplot(fit2,fun=event,=TRUE,ggtheme=theme_bw()ggsurv$plot+theme_bw()+theme(legend.position=right)+facet_grid(rxadhere)【原創(chuàng)】定制代寫開發(fā)輔導(dǎo)答疑r/python/spss/matlab/WEKA/sas/sql

19、/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計(jì)分析可視化調(diào)研報(bào)告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(wù)(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“柘花站居”就可以了【原創(chuàng)】定制代寫開發(fā)輔導(dǎo)答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計(jì)分析可視化調(diào)研報(bào)告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(wù)(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“刃端居”就可以了歡迎登陸官網(wǎng):/datablog0.250.00075*+0.75G.50J0.00JG.25-Stratab-stjx=irx-=Ltu+5FU,-adhtsrt+sqk=0.rx=Lo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論