cox比例風(fēng)險(xiǎn)回歸模型及其R程序_第1頁(yè)
cox比例風(fēng)險(xiǎn)回歸模型及其R程序_第2頁(yè)
cox比例風(fēng)險(xiǎn)回歸模型及其R程序_第3頁(yè)
cox比例風(fēng)險(xiǎn)回歸模型及其R程序_第4頁(yè)
cox比例風(fēng)險(xiǎn)回歸模型及其R程序_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、cox回歸分析,利用生存率函數(shù)s(t,x)與風(fēng)險(xiǎn)函數(shù)h(t,x)的關(guān)系可導(dǎo)出,較好地解決截尾值的問(wèn)題,反映了協(xié)變量x與生存函數(shù)的關(guān)系,cox模型的基本形式,所有危險(xiǎn)因素為0時(shí)的基礎(chǔ)風(fēng)險(xiǎn)率,它是未知的,但假定它與h(t,x)是呈比例的,右側(cè)可分為兩部分:h0(t)沒(méi)有明確的定義,分布無(wú)明確的假定,參數(shù)無(wú)法估計(jì),為非參數(shù)部分;另一部分是參數(shù)部分,其參數(shù)可以通過(guò)樣本的實(shí)際觀察值來(lái)估計(jì)的,正因?yàn)閏ox模型有非參數(shù)和參數(shù)兩部分組成,故又稱為半?yún)?shù)模型,若i0,則rr1,該因素為危險(xiǎn)因素; 若i0,則rr1, 該因素為保護(hù)因素; 若i=0,則rr=1, 該因素為無(wú)關(guān)因素,偏回歸系數(shù)i的意義是,當(dāng)其它協(xié)變量

2、都不變時(shí),xi每變化一個(gè)單位,相對(duì)危險(xiǎn)度的自然對(duì)數(shù)(lnrr)變化i個(gè)單位,相對(duì)危險(xiǎn)度rr,相對(duì)危險(xiǎn)度rr,同時(shí)考慮2個(gè)協(xié)變量,2個(gè)因素都存在的危險(xiǎn)率與2個(gè)因素都不存在時(shí)的危險(xiǎn)率之比(相對(duì)危險(xiǎn)度)為,cox回歸基本模型的兩個(gè)前提假設(shè),各危險(xiǎn)因素的作用不隨時(shí)間變化而變化,即 不隨時(shí)間變化而變化; 對(duì)數(shù)線性假定:模型中的協(xié)變量應(yīng)該與對(duì)數(shù)風(fēng)險(xiǎn)比成線性關(guān)系,cox回歸模型與一般的回歸分析不同,它不是直接用生存時(shí)間作為回歸方程的因變量,協(xié)變量對(duì)生存時(shí)間的影響是通過(guò)風(fēng)險(xiǎn)函數(shù)和基礎(chǔ)風(fēng)險(xiǎn)函數(shù)的比值反映的,其中的風(fēng)險(xiǎn)函數(shù)和基礎(chǔ)風(fēng)險(xiǎn)函數(shù)是未知的。另外偏回歸系數(shù)的估計(jì)需要借助于偏似然函數(shù)的方法。在完成參數(shù)估計(jì)的情況

3、下,可對(duì)基礎(chǔ)風(fēng)險(xiǎn)函數(shù)和風(fēng)險(xiǎn)函數(shù)做出估計(jì),并可計(jì)算每一個(gè)時(shí)刻的生存率,二、cox回歸分析的一般步驟,1. 分析前的準(zhǔn)備-數(shù)據(jù)整理 2. 參數(shù)估計(jì),建立最佳模型 3. 假設(shè)檢驗(yàn) 4. cox模型的解釋及應(yīng)用 5. cox模型擬合優(yōu)度的考察,1. 分析前的準(zhǔn)備-數(shù)據(jù)整理,嚴(yán)密的研究設(shè)計(jì) 收集資料:影響疾病的因素、病人的個(gè)性及行為特征等資料(如病人的年齡、性別、職業(yè)、是否飲酒、是否吸煙及病情、病理類型等資料)、研究對(duì)象的生存時(shí)間和截尾指示變量(一般用變量t表示生存時(shí)間,用變量d表示是否截尾)。資料應(yīng)盡量避免偏性及主觀因素的影響。 樣本含量:不宜過(guò)小。一般情況下,樣本例數(shù)應(yīng)為分析因素的5-20倍。 數(shù)據(jù)

4、預(yù)處理:如數(shù)據(jù)的變換、日歷數(shù)據(jù)與生存時(shí)間的轉(zhuǎn)化等。同時(shí)要對(duì)數(shù)據(jù)進(jìn)行描述性分析,2. 參數(shù)估計(jì),建立最佳模型,1) 參數(shù)估計(jì)-偏似然估計(jì) 假定有n個(gè)病人,他們的生存時(shí)間由小到大排列: t1t2tn 對(duì)于每個(gè)生存時(shí)間ti來(lái)說(shuō),凡生存時(shí)間大于等于ti的所有病人組成一個(gè)危險(xiǎn)集,記為r(ti)。在危險(xiǎn)集內(nèi)的病人,在ti以前尚生存,但處在危險(xiǎn)之中,隨著時(shí)間的推移,危險(xiǎn)集內(nèi)的病人陸續(xù)死亡,逐漸退出觀察,直至最后一個(gè)病人死亡時(shí),危險(xiǎn)集消失,代表ti時(shí)刻以后危險(xiǎn)集r(ti)中對(duì)似然函數(shù)作貢獻(xiàn)的個(gè)體,將n個(gè)病人死亡的 條件概率相乘,兩邊取自然對(duì)數(shù),2) 建立最佳模型,為建立最佳模型常需對(duì)研究的因素進(jìn)行篩選,篩選方

5、法有前進(jìn)法、后退法和逐步回歸法。實(shí)際工作中要根據(jù)具體情況選擇使用,最常用的為逐步回歸法。 因素篩選時(shí)需規(guī)定顯著性水平,一般情況下初步篩選因素的顯著性水平確定為0.1或0.15,設(shè)計(jì)較嚴(yán)格的研究顯著性水平可確定為0.05。 另外,篩選因素時(shí),還要考慮因素間共線性的影響。當(dāng)存在共線性時(shí),應(yīng)考慮消除共線的影響,如采用主成分回歸等方法,3. 參數(shù)的假設(shè)檢驗(yàn),1) 似然比檢驗(yàn)(likelihood ratio test) (2) 得分檢驗(yàn)(score test)(又稱為拉格朗日乘數(shù)法) (3) wald檢驗(yàn) 是三種基于極大似然法大樣本檢驗(yàn)方法,似然比檢驗(yàn):用于模型中原有不顯著變量的剔除和顯著變量的引入,

6、以及包含不同變量數(shù)時(shí)模型間的比較。檢驗(yàn)新增加的協(xié)變量是否有統(tǒng)計(jì)學(xué)意義的統(tǒng)計(jì)量為,拉格朗日乘子檢驗(yàn)(lm,基本思想:拉格朗日乘子檢驗(yàn)(lm),又稱為score檢驗(yàn)。該檢驗(yàn)基于約束模型,無(wú)需估計(jì)無(wú)約束模型。 假設(shè)約束條件為 ,在約束條件下最大化對(duì)數(shù)似然函數(shù),另 表示拉格朗日乘子向量,此時(shí),拉格朗日函數(shù)為 約束條件下最大化問(wèn)題就是求解下式根,拉格朗日乘子檢驗(yàn)(lm,如果約束成立,對(duì)數(shù)似然函數(shù)值不會(huì)有顯著變化。這就意味著在一階條件下,第二項(xiàng)應(yīng)該很小,特別是 應(yīng)該很小。因此,約束條件是否成立檢驗(yàn)轉(zhuǎn)化成檢驗(yàn) ,這就是拉格朗日乘子檢驗(yàn)的思想。 但是直接檢驗(yàn) 比較困難,有一個(gè)等價(jià)而簡(jiǎn)單的方法。如果約束條件成立

7、,在約束估計(jì)值處計(jì)算對(duì)數(shù)似然函數(shù)的導(dǎo)數(shù)應(yīng)該近似為零,如果該值顯著異于零,則約束條件不成立,拒絕原假設(shè)。 對(duì)數(shù)似然函數(shù)的導(dǎo)數(shù)就是得分向量,因此,lm檢驗(yàn)就是檢驗(yàn)約束條件下參數(shù)估計(jì)值的得分向量值是否顯著異于零,因而,lm檢驗(yàn)又稱為得分檢驗(yàn),拉格朗日乘子檢驗(yàn)(lm,在最大似然估計(jì)過(guò)程中,通過(guò)解似然方程 ,可以求出無(wú)約束估計(jì)量 ;如果計(jì)算有約束估計(jì)量 在此處得分,則 一般不為零,但是如果約束有效,則 趨近于零。 在原假設(shè)成立條件下,拉格朗日乘子檢驗(yàn)(lm,對(duì)于線性約束 將有關(guān)量代入上式得, 拒絕域,拉格朗日乘子檢驗(yàn)(lm,lm統(tǒng)計(jì)量另一種表達(dá)形式, lr、 wald 、lm關(guān)系(一般情況下成立,4.

8、cox模型的解釋及應(yīng)用,1) 探索結(jié)局事件發(fā)生的危險(xiǎn)因素,分析各因素的作用大小。 (2) 計(jì)算個(gè)體預(yù)后指數(shù)(prognosis index,pi),對(duì)個(gè)體進(jìn)行定性的預(yù)后評(píng)價(jià)。 (3) 通過(guò)估計(jì)生存率,對(duì)群體定量地進(jìn)行預(yù)后評(píng)價(jià),影響因素xi的標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)正態(tài)離差,相應(yīng)偏回歸系數(shù)的標(biāo)準(zhǔn)誤,2)計(jì)算個(gè)體預(yù)后指數(shù)(prognosis index,pi),對(duì)個(gè)體進(jìn)行定性的預(yù)后評(píng)價(jià)。 定義第j個(gè)觀察單位的預(yù)后指數(shù)為: 式中 為第i個(gè)協(xié)變量的標(biāo)準(zhǔn)偏回歸系數(shù) 的估計(jì)值( ), 為第j個(gè)觀察單位(個(gè)體)第i個(gè)協(xié)變量的標(biāo)準(zhǔn)化值。 若pij=0,說(shuō)明該個(gè)體死亡風(fēng)險(xiǎn)處于平均水平; 若pij0,說(shuō)明該個(gè)體死亡風(fēng)險(xiǎn)高于平

9、均水平; 若pij0,說(shuō)明該個(gè)體死亡風(fēng)險(xiǎn)低于平均水平,3通過(guò)估計(jì)生存率,對(duì)群體定量地進(jìn)行預(yù)后評(píng)價(jià),由于生存率與基礎(chǔ)生存率相關(guān),故只要估計(jì)出基礎(chǔ)生存率,再結(jié)合各因素的偏回歸系數(shù)就可以估計(jì)出生存率, 即,ti 時(shí)刻的基礎(chǔ)生存率公式,ti 時(shí)刻的基礎(chǔ)累計(jì)風(fēng)險(xiǎn)函數(shù)公式,在tk時(shí)刻的死亡人數(shù),ti 時(shí)刻的生存率計(jì)算公式,2.breslow法,5. cox模型擬合優(yōu)度的考察,可將研究對(duì)象按個(gè)體預(yù)后指數(shù)恰當(dāng)?shù)胤纸M,用乘積極限法估計(jì)各組的生存率曲線,并與按cox模型預(yù)后指數(shù)分類的生存率曲線在同一坐標(biāo)系內(nèi)進(jìn)行比較,若兩種曲線具有一致性,說(shuō)明模型擬合較理想。也可以使用卡方檢驗(yàn)的方法,比例風(fēng)險(xiǎn)假定(ph假定,ph假

10、定的檢驗(yàn)方法大致可以分為圖法和正規(guī)的檢驗(yàn)方法。 圖法:即通過(guò)觀察散點(diǎn)圖中散點(diǎn)的分布或趨勢(shì)是否滿足既定模型基本假設(shè)下的形狀來(lái)判斷資料是否滿足或近似滿足模型假定,主要的方法有:比較cox-km生存曲線、基于累計(jì)風(fēng)險(xiǎn)函數(shù)的圖示法、schoenfeld殘差圖、score殘差圖; 正規(guī)的檢驗(yàn)方法:通過(guò)構(gòu)造滿足既定模型基本假定下服從某一已知分布的統(tǒng)計(jì)量,利用p值來(lái)檢驗(yàn)資料是否滿足或近似滿足模型假定。主要方法有:時(shí)協(xié)變量法、線性相關(guān)檢驗(yàn)、加權(quán)殘差score檢驗(yàn)、三次樣條函數(shù)法 .cox比例風(fēng)險(xiǎn)回歸模型診斷及預(yù)測(cè)有關(guān)問(wèn)題的研究_余紅梅.caj.caj,對(duì)數(shù)線性假定,主要的方法:多重法;鞅殘差法;改進(jìn)的鞅殘差法

11、;構(gòu)造變量法 cox回歸影響點(diǎn)的分析 鞅殘差,剩余殘差,得分殘差,schoenfeld殘差, 加權(quán)schoenfeld殘差,r程序,在survival包中的函數(shù): coxph(formula,data,weights,subset,na.action) formula:反應(yīng)變量要有surv()函數(shù)定義 cox.zph(fit,transform= ,global=t/f) 檢驗(yàn)比例風(fēng)險(xiǎn)假定 basehaz(fit,centered=t/f) 計(jì)算基礎(chǔ)風(fēng)險(xiǎn)率的函數(shù),getwd() setwd(c:/users/administrator/desktop) my-read.csv(pharynx.

12、csv,header=t) attach(my) my-mycond!=9 model =/選項(xiàng); strata freq ; by ; proportionality_test:test ;/*比例風(fēng)險(xiǎn)假定,時(shí)協(xié)變量法*/ run,libname ll f:r語(yǔ)言學(xué)習(xí)cox; data a; set ll.pharynx; run; data a; set a; if cond=9 or grade=9 then delete; if cond=3 or cond=4 then cond=2; if cond=0 then cond=1; run; proc phreg data=a; mo

13、del time*status(0)=tx cond site t_stage n_stage age grade inst/selection=stepwise risklimits sle=0.15 sls=0.15; baseline out=cox survival=suv stderr=stderr /method=ch; run,四、cox模型的適用范圍及注意事項(xiàng),1. 適用范圍 cox模型適用于生存資料的統(tǒng)計(jì)分析,屬半?yún)?shù)模型,對(duì)資料沒(méi)有特殊的要求,也可以估計(jì)各因素的參數(shù),并能做多因素的統(tǒng)計(jì)分析。該模型的主要優(yōu)點(diǎn)在于能從眾多的影響因素中排除混雜因素的影響,找出影響生存時(shí)間的因素,

14、根據(jù)各因素的參數(shù)估計(jì)出個(gè)體的生存率。 另外,cox模型能分析具有截尾數(shù)值的生存時(shí)間。 cox模型可以分析多種因素對(duì)疾病預(yù)后的影響,使其更適合于臨床的隨訪研究。cox模型使臨床觀察的定性指標(biāo)又加上定量指標(biāo)進(jìn)行分析,提高了分析的效率,2. 注意事項(xiàng),1) 設(shè)計(jì)階段應(yīng)注意的問(wèn)題 樣本的代表性要好。樣本的含量為觀察協(xié)變量的5-20倍。 所有危險(xiǎn)因素要在設(shè)計(jì)時(shí)考慮全面,避免漏掉重要因素和加入無(wú)關(guān)因素。 生存時(shí)間的定義要明確。起始事件和終點(diǎn)事件要有明確規(guī)定,時(shí)間盡可能精確測(cè)量。 研究的協(xié)變量在研究對(duì)象中的分布要適中,否則會(huì)給參數(shù)的估計(jì)帶來(lái)困難。 在設(shè)計(jì)時(shí)要注意影響時(shí)間的效應(yīng)因素。如研究吸煙對(duì)肺癌患者生存率

15、的影響,若本來(lái)吸煙的人因患肺癌而戒煙,則一般模型不易分析吸煙的作用,需考慮吸煙量隨時(shí)間變化的趨勢(shì)。如果研究的因素隨時(shí)間而發(fā)生變化,必要時(shí)可以采用伴時(shí)協(xié)變量的cox模型進(jìn)行分析,注意事項(xiàng),2) 模型擬合時(shí)應(yīng)注意的問(wèn)題 多重共線性問(wèn)題:醫(yī)學(xué)研究中的許多變量間并不是獨(dú)立的,但通常不會(huì)影響分析的結(jié)果,如果變量間存在高度的相關(guān),則會(huì)影響cox模型的參數(shù)估計(jì),此時(shí)可采用主成分分析法或r型聚類分析法消除多元共線性的影響。 應(yīng)注意cox模型要求病人的風(fēng)險(xiǎn)函數(shù)與基礎(chǔ)風(fēng)險(xiǎn)函數(shù)呈比例,如果這一假定不成立,則不能用cox模型進(jìn)行分析,注意事項(xiàng),3) 模型應(yīng)用時(shí)應(yīng)注意的問(wèn)題 結(jié)果的解釋應(yīng)結(jié)合專業(yè)知識(shí)。cox模型與其他回歸分析一樣,當(dāng)進(jìn)入模型中的因素有統(tǒng)計(jì)學(xué)意義時(shí),該因素與生存時(shí)間不一定有因果關(guān)系,其中有一部分因素與生存時(shí)間的關(guān)系為伴隨關(guān)系。 cox回歸的生存率一般不宜用于不同資料之間的比較,因?yàn)榛鶞?zhǔn)危險(xiǎn)率函數(shù)只在同一份資料內(nèi)保持相同,不同資料的基準(zhǔn)危險(xiǎn)率往往不同;而且在多因素分析的情況下,協(xié)變量組合也很難一致,可比性難以保證,3. c

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論