cox模型局部擬合效果的評價_第1頁
cox模型局部擬合效果的評價_第2頁
cox模型局部擬合效果的評價_第3頁
cox模型局部擬合效果的評價_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

cox模型局部擬合效果的評價

優(yōu)異成績測試在統(tǒng)計理論中發(fā)揮著特殊的作用。它不僅是統(tǒng)計基礎(chǔ)的組成部分,而且與實際應(yīng)用密切相關(guān)。眾所周知,為進行參數(shù)估計和假設(shè)檢驗,總是假定某種總體分布或選定一統(tǒng)計模型,然后按該總體或模型的理論處理實際問題。那么,實際數(shù)據(jù)是否滿足該總體或模型的要求?換言之,是否可用已知分布或模型擬合現(xiàn)實數(shù)據(jù)?擬合好壞的標準是什么?這就是擬合優(yōu)度檢驗研究的問題。KarlPearson在他的講義MathematicalcontributionstotheTheoryofEvolution中,提出了如何檢驗用分布擬合試驗數(shù)據(jù)好壞的問題。1900年,Pearson提出了χ2檢驗。直到今日,χ2檢驗及與其有關(guān)的檢驗仍是應(yīng)用最廣的檢驗。Pearson提出了χ2檢驗后,引起廣大學者對擬合優(yōu)度檢驗的興趣,發(fā)展了各種檢驗方法及相應(yīng)理論。擬合優(yōu)度檢驗統(tǒng)計量大體上可分為χ2型、基于經(jīng)驗分布的EDF(EmpiricalDistributionfunction)型和積分變換型檢驗,以及針對常用分布(例如正態(tài)分布、指數(shù)分布、均勻分布等),體現(xiàn)分布特征的檢驗統(tǒng)計量。目前截尾數(shù)據(jù)的擬合優(yōu)度檢驗較多的用χ2檢驗。χ2檢驗的基本思想是比較理論頻數(shù)和觀察頻數(shù)的差異,用統(tǒng)計量χ2=k∑i=1(Ei-Οi)2/Eiχ2=∑i=1k(Ei?Oi)2/Ei其中Ei為理論頻數(shù),Oi為觀察頻數(shù)。為評價Cox模型的擬合效果,可用χ2及對應(yīng)的P值。但目前的方法僅針對模型的整體擬合效果。很多時候,模型整體的擬合效果好,在局部(尤其是邊沿部分)的擬合效果不理想。這時候,僅評價模型的整體擬合效果是不夠的。本文給出了評價Cox模型的局部擬合效果的公式。觀察局部擬合效果設(shè)(T,u,v)分別表示生存時間、進入隊列時已生存時間、退出隊列時的生存時間,λ(t)為風險率。已知在u時刻生存,在(u,v]時間內(nèi)死亡的條件概率記為m=P(T≤ν|T>u)可以證明m的估計為?m=Τ∧ν∫uλ(s)ds(1)m?=∫uT∧νλ(s)ds(1)這里T∧v表示T與v中最小值。?mm?是瞬時風險率與相應(yīng)的觀察人年數(shù)的積,是按風險率λ(t)計算的理論死亡數(shù),因此Ei=Τi∧νi∫uiλi(s)dsEi=∫uiTi∧νiλi(s)ds為觀察對象i的理論死亡數(shù)。E=ΣEi為合計理論死亡數(shù)。設(shè)Oi=I(ui<T≤vi)(2)表第i個觀察對象在(ui,vi]的死亡次數(shù),其中I為示性函數(shù)。則O=ΣOi指觀察死亡數(shù)。由鞅理論,可以證明(O-E)E-1/2近似服從標準正態(tài)分布,因此G=(O-E)2/E(3)為自由度為1的χ2分布,它表示觀察死亡數(shù)與理論死亡數(shù)的差,可以檢驗?zāi)P偷臄M合效果。將上述結(jié)果用于檢驗Cox模型的擬合優(yōu)度。Cox模型可表為:λi(t)=λ0(t)exp(ziβ)(4)其中zi為觀察對象i的p維協(xié)變量向量。?ββ?為p維系數(shù)β的估計,觀察對象i的理論死亡數(shù)為Ei=Τi∧νi∫uiλi(s)ds=Τi∧νi∫uiλ0(s)exp(zi?β)ds=exp(zi?β)[?Λ0(Τi∧νi)-?Λ0(ui)](5)Ei=∫uiTi∧νiλi(s)ds=∫uiTi∧νiλ0(s)exp(ziβ?)ds=exp(ziβ?)[Λ?0(Ti∧νi)?Λ?0(ui)](5)其中?ΛΛ?0(t)為累積基礎(chǔ)風險函數(shù)Λ0(t)的估計,Λ0(t)=t∫0λ0(s)dsΛ0(t)=∫0tλ0(s)ds。將各觀察對象的理論死亡數(shù)求和E=ΣEi,代入公式(3),所得的G值可以評價Cox模型的整體擬合效果。很多時候整體擬合效果好的模型在某些局部區(qū)域,特別是兩端部分,擬合效果不理想。因此僅評價模型的整體擬合效果是不夠的。下面給出評價局部擬合效果的公式。為觀察局部的擬合效果,我們比較各風險點上的理論死亡數(shù)與觀察死亡數(shù)。設(shè)s1<s2<…<sd為肺癌發(fā)生的時間,即比較(0,s1],(s1,s2],(s2,s3],…(sd-1,sd]上的觀察死亡數(shù)及理論死亡數(shù)。風險點sk上的死亡病例只可能源自風險集R(sk)={j:uj<sk≤Tj∧vj},因此為計算(sk-1,sk]上的理論死亡數(shù),只需考慮風險集R(sk)中的觀察。若觀察對象i在R(sk)中,其在(sk-1,sk]上的理論死亡數(shù)為Aik=min(Τi∧vi,Sk)∫max(ui,s(k-1)λi(s)ds=min(Τi∧vi,Sk)∫max(ui,s(k-1)λ0(s)exp(zi?β)ds=exp(zi?β)[?Λ0(Τ?iv?isk)-?Λ0(max(ui;sk-1))](6)Aik=∫max(ui,s(k?1)min(Ti∧vi,Sk)λi(s)ds=∫max(ui,s(k?1)min(Ti∧vi,Sk)λ0(s)exp(ziβ?)ds=exp(ziβ?)[Λ?0(Ti?vi?sk)?Λ?0(max(ui;sk?1))](6)由于觀察對象i屬于R(sk),Ti∧νi≥sk,Ti∧νi∧sk=sk,因此?Λ0(Τi∧νi∧sk)=?Λ0(sk)Λ?0(Ti∧νi∧sk)=Λ?0(sk)又?Λ0(max(ui,sk-1))={?Λ0(sk-1)ifui≤sk-1?Λ0(ui)ifsk-1<ui<sk(7)Λ?0(max(ui,sk?1))={Λ?0(sk?1)ifui≤sk?1Λ?0(ui)ifsk?1<ui<sk(7)?ΛΛ?0(t)為階梯函數(shù),其跳躍點在s1,s2,…,sd上,并且若sk-1≤t<sk,則有?Λ0(t)=?Λ0(sk-1)Λ?0(t)=Λ?0(sk?1),因此?Λ0(max(ui,sk-1))=?Λ0(sk-1)(8)由(6),(7),(8),得Aik=exp(zi?β)[?Λ0(sk)-?Λ0(sk-1)]Ak=∑i∈R*(Sk)Aik=(?Λ0(sk)-?Λ0(sk-1))∑i∈R*(Sk)exp(zi?β)(9)Ak為(sk-1,sk]上的理論死亡數(shù),與對應(yīng)區(qū)間上的觀察死亡數(shù)比較,代入公式(3),所得的各G值可以評價Cox模型的局部擬合效果。cox模型擬合在模型的擬合優(yōu)度檢驗中,盡管模型的整體擬合效果較好,但某些局部的擬合效果較差(簡稱壞點)。下面的擬合試驗說明本文給出的公式(9)可以準確找出這些壞點。針對這些壞點的再分析和處理可為模型的進一步改善提供可能。x1,x2分別取自均勻分布U(0.5,5),U(1,6),t時刻的風險函數(shù)滿足:λ(t,x)=λ0(t)exp(-0.4x1-0.5x2)λ0(t)服從風險率為2的指數(shù)分布。抽1000個樣本,并有25.9%被均勻分布U(0,40)截尾。將所有觀察時間小于0.8的觀察所對應(yīng)的時間改為它們的平均值0.36,因此風險點0.36是一個壞點。這樣的數(shù)據(jù)用Cox模型擬合后,其整體擬合效果仍然不差,G=0.069,p=0.793。(A)模擬試驗;(B)某礦資料利用公式(9),可以計算出各風險點上的理論死亡數(shù),與觀察死亡數(shù)比較,求出對應(yīng)的G值。結(jié)果見圖1A。其中橫軸為風險點,縱軸為對應(yīng)點上的G值(見式(3))。從圖上我們可以發(fā)現(xiàn)一個明顯的壞點,即風險點0.36,其他點的理論死亡數(shù)與觀察死亡數(shù)幾乎沒有差別。局部擬合效果檢驗?zāi)车V是世界知名的職業(yè)性肺癌高發(fā)地區(qū),現(xiàn)有職工幾萬人,從50年代以來已有二千多例肺癌發(fā)生,至今每年仍有新發(fā)病例80~100人,為國際上罕見的大型肺癌防治研究現(xiàn)場。本資料取自1992~1996年建立的高危人群隊列,1992~1996年,共有10141個觀察對象進入隊列。其中875個只采集了生物樣品,而沒有其他任何資料,有詳細調(diào)查資料的觀察對象有9266個,將其中不符合隊列定義的觀察對象剔除,最后可用于分析的觀察對象有8209例,其中338例確診為肺癌。將公式(5)中的各理論死亡數(shù)求和可得總的理論死亡數(shù)為338.8662,實際觀察的死亡數(shù)為338例,G=0.0022,P=0.96,可以認為總的擬合效果很好。為了解模型的局部擬合效果,考查各風險點上的理論死亡數(shù)及觀察死亡數(shù),結(jié)果見圖1B。其中橫軸為風險點,縱軸為對應(yīng)點上的G值。風險點652月(觀察的病例數(shù)為8例,理論的病例數(shù)為8.107例)的G=1.419704e-003最大,擬合效果最差,但所對應(yīng)的P值仍為0.97,因此即使在該點,模型擬合效果仍可以接受。表1是各風險點上的擬合優(yōu)度檢驗的統(tǒng)計量G及對應(yīng)的P值分布,分別給出G及P的最小值、1/4分位點、中位數(shù)、均數(shù)、3/4分位點、最大值。總體及局部的擬合效果顯示,Cox模型很好地擬合了該資料,基于該模型的預(yù)測及估計是可靠

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論