版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、生存分析,(10號)21160311055戶籍,1,目錄,2,概述,3,定義,生存分析是研究生存現象和響應時間數據及統(tǒng)計規(guī)律的學問。最初研究的主要事件是死亡,所以被稱為生存分析。生存分析是統(tǒng)計科學的重要領域,其研究的兩個重要參數是“事件”和“壽命”。事件:生存分析中定義的事件包括死亡、損壞、失敗、解雇、發(fā)病等。例如,患者的死亡、產品的失效、疾病的發(fā)生、員工的解雇。壽命:從記錄開始到事件發(fā)生之間的時間。4,特性,生存分析的優(yōu)點是可以處理刪除的數據。生存分析的統(tǒng)計將生存時間作為反應變量,這些數據的生存時間變量大部分不服從正規(guī)分布,由于刪除值的存在,不適合傳統(tǒng)的分析方法處理。這時要選擇生存分析方法。
2、5,研究內容,生存分析研究的內容主要有兩個方面。對一對生存過程的描述2分析了生存過程的影響因素并預測了生存結果。6、應用領域、生存分析源于醫(yī)學領域,但在生物學、保險學、可靠性工程、經濟學、教育學、社會學等領域有廣泛的應用,如:在醫(yī)療科學中,患者死亡保險業(yè)的賠償可靠性工程中,產品的失效金融領域中,從開設到取消銀行帳戶的研究教育行業(yè)中學生中途退學客戶關系管理中,7,常用術語,8,客戶流失生存數據可以分為完整數據和刪除的數據。完整數據:提供完整信息的數據。例如,在研究產品的到期時間時,某個樣品從進入研究到失效都在我們的觀察中,可以得到該樣品的具體失效時間,這就是完整的數據。刪除數據:意味著在觀察期間
3、沒有看到個人狀態(tài)的變化,無法確認個人的具體生存時間。分為左數據刪除、右數據刪除、間隔數據刪除。9,刪除數據圖,開始觀測時間間隔結束,死亡,死亡,死亡,未知,終止,全部數據:a,在觀測期間死亡右側數據刪除:b,在觀測未終止時因某種原因退出c,在觀測結束時未死亡的情況下刪除左側數據:dS(t)=P(T t),顯然S(t)是非升函數,S(0)=1,S()=0,11,風險函數,風險函數顯然,h(t)不是負數,沒有上限。12,分析方法,13,根據是否使用參數,在生存分析中,分析方法可以分為三類。參數方法:如果證明事件的開發(fā)與參數模型很吻合,則可以使用參數方法進行事件的生存分析。常用參數模型包括金志洙分布
4、模型、對數分布模型、正態(tài)分布模型、波分布模型等。非參數方法:如果研究的事件不能很好地與參數化模型相匹配,則可以使用非參數方法研究生存特性。常用的非參數方法包括生命表分析和K-M分析。半參數化方法:比參數化模型更靈活,比非參數化方法更容易分析分析結果。生存分析中使用的半參數模型是Cox比例風險模型。14,非參數方法,生命表分析K-M分析,15,生命表分析總k周期t 0、t 1)、t 1、t 2)、t k-1、t k),假設每個間隔內事件發(fā)生的次數分別為d 1、d 2、d k,并且每個間隔內的總對象數分別為n 1、n 2、n k,因此I,16,K-M分析,Kaplan-Meier分析,又稱產品極限
5、分析,是估計Kaplan和Meier在1958年提出的生存函數的非參數方法。與生命表分析不同,K-M分析將觀察區(qū)間劃分為事件發(fā)生的時間點,估計生存函數。以下示例說明了具體的分析過程。17,下表記錄了5個實驗對象的生存時間。其中,F表示失效,S表示生存,2和4表示右側刪除數據。S(t)用于表示實驗對象的累積生存概率,時間分隔計算為右:t,0,31)因為:是區(qū)間的所有5個實驗對象都活著,所以s (t)=5/5=1.31,65S(t)=150,220) :對象3在150小時內死亡,使用s (t)=0.82/3=0.53.220,300) SPSS對上述實例進行K-M分析,結果為1。數據輸入,2 .K
6、-M分析,19,設置參數,20,輸出結果,K-M分析生存函數圖,21,生命表分析和K-M分析K-M分析,時間區(qū)間的劃分基于事件發(fā)生,因此必須知道每個人的生存時間數據并應用于較小的樣本。22,半參數化方法,在生存分析中,我們經常遇到個人生存狀態(tài)受多種因素影響的情況。影響生存時間的這些變量稱為空變量。分析生存數據時,要考慮空變量的影響。Cox半參數化模型很好地解決了這個問題。假設風險函數由兩部分組成:基準風險函數和協(xié)方差線性組合的指數。Cox半參數模型分為兩種類型:獨立的協(xié)方差比率風險模型和時間相關的協(xié)方差比率風險模型。兩者的區(qū)別在于空變量的值是否與時間相關。23,Cox獨立變量比率風險模型,該模
7、型可以寫成:格式中,Z1、Z2、Zm是空變量,其中空變量與時間無關。1,2,M是該參數的未知參數。H 0(t)是基準風險函數。在實際應用中,經常徐璐比較其他兩個個人風險函數的比率,即風險率。因為可以證明風險率是常數,所以這個模型也稱為比例風險模型。如果變量與時間相關,則危險率不再是常數,這稱為時間相關比率風險模型。24,病例分析,25,兩組大鼠用于檢查癌癥的治療狀態(tài)。一組使用傳統(tǒng)療法,另一組使用實驗方法記錄老鼠的生存時間和狀態(tài)。Days是生存時間或觀察時間。Status表示生存狀態(tài),值1表示死亡,0表示生存。Group表示治療方法,0表示傳統(tǒng)療法,1表示實驗療法,共64組數據。26,原始數據如
8、下:27,首先用生命表分析方法處理數據:1。數據輸入,2 .生命表分析選擇,28,3。設定參數,29,4。結果輸出,約200,中等生存時間為存活率50%時生存時間的平均水平。以中等存活時間來看,傳統(tǒng)治療方法的中值為241天,實驗方法的中值為266天,明顯高于傳統(tǒng)治療方法??梢哉J為,實驗方法的療效比傳統(tǒng)的治療方法有所提高。,使用30,K-M方法處理數據,生存函數分布與生命表分析的結果相似。K-M方法可以記錄刪除的數據,由于線段很多,出現了整體密集的鋸齒,生命表分析的分布相對平坦。結果檢查中,根據檢查方法的不同,結果也不同。在這里,如果Log Rank檢查的P值小于0.05,則表明這兩種治療方法之
9、間存在相當大的差異。31,除了治療方法影響老鼠的生存狀態(tài)外,性別、年齡、體重等其他因素都會影響生存時間。添加此數據后,使用Cox獨立變量比率風險模型再次分析。1 .數據輸入,2 .參數設置,32,3。輸出結果,分類變量是離散變量。在這種情況下,治療方法的值為0和1萬,性別為f和m。與體重、年齡等連續(xù)變量不同,分類變量在計算風險率時使用參考類別作為參考。在這種情況下,治療的要素以實驗方法為參考。計算結果是現有方法的危險率和參考倍數。33,34上表是模型系數的綜合檢查結果。請注意,它小于P=0,0.05??梢钥闯?,其中的一些因素對老鼠的生存時間有很大的影響。35,此表提供了每個變量的單個模型系數檢查結果,可以看到體重變量的p=0,表明體重對危險函數有很大影響。每增加一盎司體重,危險就約為三分之一。治療方法的p=0.06
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年物業(yè)買賣擔保合同
- 高職班主任工作計劃范文
- 七年級教學計劃三篇
- 心理健康工作計劃
- 師德規(guī)范學習心得體會
- 游藝機項目可行性研究報告
- 初中數學教師年度考核總結
- 幼兒園大班班會活動教案
- 公司經理述職報告三篇
- 小升初自我鑒定合集12篇
- 2023年婦科門診總結及計劃
- 方大重整海航方案
- 河北省秦皇島市昌黎縣2023-2024學年八年級上學期期末數學試題
- 礦山治理專項研究報告范文
- 國家開放大學2023年7月期末統(tǒng)一試《11124流行病學》試題及答案-開放本科
- 貨運安全生產管理制度
- 幼兒園中班體育《我們愛運動》+課件
- 郭錫良《古代漢語》課件
- 外研版四年級英語下冊(一年級起點)全冊完整課件
- 防止電力生產事故的-二十五項重點要求(2023版)
- 教研室主任崗位申請書
評論
0/150
提交評論