《SPSS統(tǒng)計(jì)方法體系與案例實(shí)驗(yàn)進(jìn)階》課件 李望晨 第10、11章 Logistic回歸分析、生存分析_第1頁
《SPSS統(tǒng)計(jì)方法體系與案例實(shí)驗(yàn)進(jìn)階》課件 李望晨 第10、11章 Logistic回歸分析、生存分析_第2頁
《SPSS統(tǒng)計(jì)方法體系與案例實(shí)驗(yàn)進(jìn)階》課件 李望晨 第10、11章 Logistic回歸分析、生存分析_第3頁
《SPSS統(tǒng)計(jì)方法體系與案例實(shí)驗(yàn)進(jìn)階》課件 李望晨 第10、11章 Logistic回歸分析、生存分析_第4頁
《SPSS統(tǒng)計(jì)方法體系與案例實(shí)驗(yàn)進(jìn)階》課件 李望晨 第10、11章 Logistic回歸分析、生存分析_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

《SPSS統(tǒng)計(jì)方法體系與案例實(shí)驗(yàn)進(jìn)階》學(xué)習(xí)目標(biāo):1、熟悉logistic回歸分析的提出思想2、掌握二分類logistic回歸分析3、熟悉無序多分類logistic回歸分析和有序多分類logistic回歸分析重點(diǎn):1、二分類logistic回歸分析第10章Logistic回歸分析如果建立線性回歸方程鑒于自變量可取任意值,則P取值范圍變?yōu)轱@然這與P取值[0,1]相互矛盾、無法解釋.考慮構(gòu)造出P的單調(diào)函數(shù)使之取值為且在P=0或1附近變化敏感.取值范圍為稱為發(fā)生與不發(fā)生優(yōu)勢比,流行病學(xué)中廣泛應(yīng)用.不妨作變換取值范圍構(gòu)造與m個自變量的回歸方程:其中為常數(shù)項(xiàng),為回歸系數(shù).取值范圍系數(shù)解釋為自變量X變化一個單位,引起的改變量.回歸方程等價形式為模型參數(shù)根據(jù)樣本數(shù)據(jù)估計(jì)得出,因其過程復(fù)雜性而由軟件完成.2模型參數(shù)2.1優(yōu)勢與優(yōu)勢比(1)優(yōu)勢(odds)優(yōu)勢(odds)是指控制其余自變量而某個自變量取值變化,結(jié)局事件發(fā)生與不發(fā)生概率的比值,即,稱為比數(shù)或比值.(2)優(yōu)勢比(oddsratio,OR)某個影響因素不同水平的優(yōu)勢比值之比,也稱為優(yōu)勢比.如有水平值C2和C1,則C2相對于C1的優(yōu)勢比為.OR表示影響因素不同水平變化對結(jié)局事件發(fā)生影響方向和影響能力.OR>1表示該因素為危險(xiǎn)因素;OR<1表示該因素為保護(hù)因素;OR=1表示該因素與事件的發(fā)生沒有關(guān)系.2.2系數(shù)意義假設(shè)自變量Xj有水平值C1、C2,其中C2>C1.也就是P1、P2分別表示Xj取值為C1、C2時的概率.表示控制其他自變量值,自變量Xj值每增加1個單位時變化量.設(shè)Xj暴露賦值1、非暴露賦值0,則暴露相對于非暴露的優(yōu)勢比則水平C2相對于水平C1的優(yōu)勢比:回歸系數(shù)與優(yōu)勢比(OR)j關(guān)系為=ln(OR)j.(1)=0時,(OR)j=1,說明因素Xj對事件發(fā)生(Y=1)不起作用.(2)>0時,(OR)j>1,

說明Xj是危險(xiǎn)因素,Xj取值增大會增加事件(Y=1)概率.(3)<0時,(OR)j<1,說明Xj是保護(hù)因素,Xj取值增大會減少事件(Y=1)概率.3.自變量賦值隨著自變量賦值方式不同,參數(shù)估計(jì)值及符號也不同,則結(jié)果解釋意義也不同.3.1二分類變量賦值較小的水平常作為參照水平,二分類變量X常以0和1賦值.例如“有=1,無=0”;“男=1、女=0”.水平1與水平0的優(yōu)勢比有解釋意義.3.2無序多分類變量若為比較無序分類之間的類別變化,可以將所有分類轉(zhuǎn)化設(shè)置為啞變量形式.OR用于解釋其他類與參照類相比,引起結(jié)局事件Y發(fā)生與不發(fā)生概率的倍數(shù).無序多分類的自變量X轉(zhuǎn)化為啞變量:k個類別等同為k-1個啞變量(同進(jìn)同出).如教育程度共4個水平(類別):文盲、小學(xué)、初中、高中以上.以“文盲”為參照,將教育程度4個水平(類別)轉(zhuǎn)化為3個啞變量X1、X2、X3.表10-1啞變量設(shè)置表教育程度X1X2X3“文盲=0”000“小學(xué)=1”100“初中=2”010“高中以上=3”001僅考慮教育程度影響,則回歸方程:文盲小學(xué)初中高中以上以文盲作為參照,比數(shù)比無序多分類變量須設(shè)置啞變量,以最后一個類別為默認(rèn)參照.參照選取不同,則OR數(shù)值解釋也不同,用戶根據(jù)實(shí)際需要選擇參照水平,在列表框中設(shè)置指示符,點(diǎn)擊更改按鈕并得以生效.OR值:X1→小學(xué)對比文盲、X2→初中對比文盲、X3→高中以上對比文盲.3.3有序多分類變量若為比較有序分類之間的數(shù)值變化,可以不設(shè)置啞變量,則OR用于解釋等級取值每改變一個單位,引起結(jié)局事件Y發(fā)生與不發(fā)生概率的倍數(shù)變化.如果設(shè)置啞變量,則與無序分類變量相似解釋.3.4連續(xù)型數(shù)值變量若以連續(xù)型數(shù)值變量作為自變量(少用),解釋為取值每改變一個單位,引起結(jié)局事件Y發(fā)生與不發(fā)生概率的倍數(shù)變化,OR值變化往往無統(tǒng)計(jì)學(xué)意義,一般將其轉(zhuǎn)化為有序分類變量(分類水平值),在每個水平值間比較分析.例如,以年齡為連續(xù)型數(shù)值變量,比較患與不患高血壓的風(fēng)險(xiǎn)倍數(shù)變化.實(shí)際上,由X歲變?yōu)閄+1歲,1歲增加前后患高血壓風(fēng)險(xiǎn)優(yōu)勢比往往無變化.于是,不妨將年齡分組,討論高年齡組相對于低年齡(參照組)每改變一個級別引起的患高血壓風(fēng)險(xiǎn)的優(yōu)勢比,更有實(shí)際解釋意義.二、應(yīng)用條件及范圍(1)數(shù)據(jù)來自隨機(jī)樣本,觀察對象之間相互獨(dú)立.(2)因變量為二分類變量.自變量一般為定序變量或定類變量(須轉(zhuǎn)換啞變量).(3)自變量與logit(P)(即)之間為線性表達(dá)式關(guān)系.(4)樣本量足夠大,否則參數(shù)估計(jì)值不穩(wěn)定現(xiàn)象,有時甚至無法計(jì)算.經(jīng)驗(yàn)認(rèn)為,試驗(yàn)和對照人數(shù)至少為30~50例,樣本量至少為自變量數(shù)5~10倍.三、Logistic回歸分析的應(yīng)用Logistic回歸廣泛用于社會、心理或流行病調(diào)查領(lǐng)域的影響因素分析.(1)尋找危險(xiǎn)(影響)因素,篩選因變量的危險(xiǎn)(影響)因素.(2)預(yù)測:根據(jù)自變量預(yù)測某事件發(fā)生的概率(3)判別:根據(jù)自變量判斷屬于某事件的概率Logistic回歸一般步驟:“變量編碼→啞變量設(shè)置→自變量單因素分析→變量篩選→交互作用考察→模型優(yōu)選→模型評價→結(jié)果解釋”.在專業(yè)設(shè)計(jì)(調(diào)查問卷)時有意選擇具有實(shí)際意義的自變量,在統(tǒng)計(jì)設(shè)計(jì)時首先進(jìn)行單因素分析(粗選),繼續(xù)由Logistic回歸方法作多因素分析.【實(shí)例1】[問題敘述]篩選糖尿病發(fā)生的影響因素,由Logistic回歸模型進(jìn)行分析.令X1,X2,...,X7為自變量,Y為因變量(二分類).表10-2糖尿病患病可能影響因素賦值表因素變量名賦值說明年齡(歲)X1連續(xù)變量性別X2男=1、女=0糖尿病家族史X3無=0、有=1體重指數(shù)X4超重=1、肥胖=2、正常=3吸煙X5不吸煙=0、吸煙=1飲酒X6不飲酒=0、飲酒=1血壓X7正常=0、不正常=1糖尿病Y患病=1、不患病=0表10-3糖尿病相關(guān)影響因素調(diào)查資料(不列出、見數(shù)據(jù)庫)[實(shí)驗(yàn)?zāi)康腯理解二分類Logistic回歸分析的基本原理、應(yīng)用條件、主要用途,掌握模型參數(shù)與優(yōu)勢比OR值的關(guān)系與含義,利用SPSS根據(jù)樣本數(shù)據(jù)建立因變量關(guān)于自變量的Logistic回歸方程,篩選出主要的影響因素,并解釋實(shí)際意義.[操作步驟]變量要求:一個因變量,變量類型為數(shù)值型或字符型,且是為二分類變量;一個(或多個)自變量,類型可以是連續(xù)型變量,也可以是定序變量或定類變量.定義9個變量:編號X1,X2,...,X7,Y,變量類型為數(shù)值型的,分別錄入關(guān)數(shù)據(jù).菜單選擇:主菜單“分析(Analyze)”→“回歸(Regression)”→“二元Logistic(BinaryLogistic)”.界面設(shè)置:選擇因變量Y進(jìn)入“因變量(Dependent)”框,選自變量X1,X2,...,X7到“協(xié)變量(Covariates)”框;在“方法(Method)”中選擇“向前:條件(Forward:Conditional)”方法.自變量篩選方法:進(jìn)入(強(qiáng)行進(jìn)入法,所有變量一次全部進(jìn)入方程)、向前:條件(向前法,基于條件參數(shù)似然比檢驗(yàn)的結(jié)果剔除變量)向前:LR(向前法,基于偏最大似然比檢驗(yàn)的結(jié)果剔除變量)向前:Wald(向前法,基于Wald統(tǒng)計(jì)量的結(jié)果剔除變量)向后:條件(后退法,基于條件參數(shù)似然比檢驗(yàn)的結(jié)果剔除變量)向后:LR(后退法,基于偏最大似然比檢驗(yàn)的結(jié)果剔除變量)向后:Wald(后退法,基于Wald統(tǒng)計(jì)量的結(jié)果剔除變量).無序多分類自變量X4-體重指數(shù)(超重=1、肥胖=2、正常=3),須設(shè)置啞變量.在三個以上類別情況下,單擊“分類(Categorical)”按鈕,設(shè)置啞變量.將X4選入“分類協(xié)變量(CategoricalCvariates)”框,對比方式以默認(rèn)“指示符”,參考類別是“最后一個”,點(diǎn)擊更改.OR值是以“體重正?!睘閰⒄?超重和肥胖相對優(yōu)勢之比.單擊“繼續(xù)(Continue)”;單擊“選項(xiàng)(Options)”按鈕,選取“exp(B)CI:95%”,生成OR值95%可信區(qū)間.單擊“確定(OK)”按鈕.表10-5啞變量賦值情況頻率參數(shù)編碼(1)(2)體重指數(shù)超重101.000.000肥胖8.0001.000正常12.000.000[結(jié)果分析]表10-4和表10-5顯示因變量Y和啞變量X4的賦值情況.請注意:二分類Logistic過程默認(rèn)以因變量較大取值的概率P(Y=1),分析結(jié)果時要弄清因變量的賦值情況,確保解釋正確性;可以設(shè)置啞變量的對照類型,默認(rèn)最后一個.(2)回歸方程的檢驗(yàn)與分析表10-6模型的整體性檢驗(yàn)結(jié)果卡方dfSig.步驟1步驟14.4491.000塊14.4491.000模型14.4491.000步驟2步驟9.5841.002塊24.0332.000模型24.0332.000統(tǒng)計(jì)量為24.033,對應(yīng)的概率值P=0.000<0.001,在顯著性水平0.05下模型有統(tǒng)計(jì)學(xué)意義.表10-7模型擬合優(yōu)度分析結(jié)果步驟-2對數(shù)似然值Cox&SnellR方NagelkerkeR方126.605a.382.513217.021b.551.739經(jīng)擬合優(yōu)度分析,Cox&SnellR2=0.551,NagelkerkeR2=0.739,越接近1說明擬合優(yōu)度越好,本例中的擬合優(yōu)度情況良好.模型回歸系數(shù)檢驗(yàn)方法常用Wald卡方檢驗(yàn).表10-8模型回歸系數(shù)及其檢驗(yàn)和OR值BS.EWald卡方統(tǒng)計(jì)量dfSig.Exp(B)即OR值Exp(B)的95%C.I.下限上限步驟1aX33.245.99810.5771.00125.6673.631181.437常量-1.299.6513.9791.046.273步驟2bX1.187.0766.0561.0141.2051.0391.398X33.5521.4026.4181.01134.8802.234544.468常量-9.9323.8016.8281.009.000B、SE、Wald、df、Sig、Exp(B)及95%CI分別表示偏回歸系數(shù)、標(biāo)準(zhǔn)誤、統(tǒng)計(jì)量、自由度、P值、OR值及其95%置信區(qū)間.經(jīng)分析,經(jīng)過2次變量篩選后,X1(年齡)、X3(糖尿病家族史)被引入方程,回歸系數(shù)的Wald檢驗(yàn),對應(yīng)的概率值P均小于0.05,說明都有統(tǒng)計(jì)學(xué)意義.(3)結(jié)論Logistic回歸方程或影響因素有年齡(OR=1.205)和糖尿病家族史(OR=34.880),OR值均大于1,說明年齡、糖尿病家族史為糖尿病的危險(xiǎn)因素,糖尿病家族史是最危險(xiǎn)因素.若年齡每增加一歲,患與不患糖尿病風(fēng)險(xiǎn)之比是原來年齡的1.205倍;若有糖尿病家族史,患與不患糖尿病風(fēng)險(xiǎn)之比是無糖尿病家族史的34.880倍.由此認(rèn)為,有糖尿病家族史的老年居民是糖尿病的高發(fā)、易發(fā)人群.補(bǔ)充:由經(jīng)驗(yàn)常識,年齡增長1歲則患與不患糖尿病風(fēng)險(xiǎn)之比往往變化不明顯.此題若對年齡按分段組別來劃分:(1)如果將年齡組別劃分為有序分類數(shù)值,則年齡每上升一個等級,患與不患糖尿病風(fēng)險(xiǎn)之比是原來年齡等級的倍數(shù).(2)如果將年齡組別劃分為無序分類數(shù)值,則不妨以低年齡組作為參照,解釋其他年齡組與低年齡組患與不患糖尿病風(fēng)險(xiǎn)的倍數(shù).【練習(xí)1】[問題敘述]胃癌手術(shù)后預(yù)后因素分析資料共98例,指標(biāo)如下:Y:手術(shù)后三年情況(死亡=1、存活=0)X1:胃癌位置(1=胃底、2=胃體、3=胃竇)X2:胃癌大小(0、1、2、3、4、5級)X3:大體類型(1=潰瘍、2=腫塊、3=浸潤)X4:組織學(xué)類型(1=腺癌、2=粘液癌、3=未分化癌、4=混合型)X5:深度(1、2、3、4、5、6級)X6:淋巴結(jié)轉(zhuǎn)移(0、1、2、3級)X7:手術(shù)方式(1=I式、2=Ⅱ式、3=近胃、4=全切除)X8:血色素(g/L)X9:白細(xì)胞(個/立方毫米)X10:手術(shù)時年令(歲)X11:性別(1=男性、0=女性)X12:是否化療(1=用化療、0=未用化療)請以Y為因變量,X1~X12為自變量,逐步進(jìn)行Logistic回歸.注意:X1、X3、X4和X7為無序多分類變量,應(yīng)設(shè)置為啞變量;X2、X5、X6為有序多分類變量,不必設(shè)置為啞變量;X8、X9為連續(xù)型數(shù)值變量,不必設(shè)置為啞變量.不同類型變量篩選中,OR值解釋將會有差別.11.1生命表分析一、核心知識生存資料中要獲得各時間點(diǎn)上生存函數(shù)的估計(jì)值,常用壽命表法.特點(diǎn):療效指標(biāo)中既有結(jié)局變量、又有時間變量,隨訪對象可能會釋放或死于其他疾病,由于研究經(jīng)費(fèi)和時間限制不可能等到所有觀察對象都出現(xiàn)結(jié)局才終止.生存分析方法既考慮結(jié)局Y,又考慮生存時間t.生存時間:從起始事件到終點(diǎn)事件之間所經(jīng)歷的時間跨度.失效事件:反映治療效果特征的時間,又稱死亡事件或終點(diǎn)事件.資料類型:

完全數(shù)據(jù)或截尾數(shù)據(jù).截尾:

失訪、退出或終止.學(xué)習(xí)目標(biāo):1、掌握壽命表法和LM法2、掌握COX回歸分析重點(diǎn):1、COX回歸分析第11章生存分析1.基本原理壽命表法采用與編制生命表相似的原理計(jì)算生存率,通過計(jì)數(shù)落入?yún)^(qū)間[t,t+k]內(nèi)的失效和截尾的觀察例數(shù)來估計(jì)該區(qū)間死亡概率,然后根據(jù)概率的乘法原則,將不同時期的生存概率相乘,得到自觀察開始到指定某一時刻的生存率.2.應(yīng)用條件(1)壽命表法適用于區(qū)間數(shù)據(jù):當(dāng)資料是按照固定時間間隔收集,隨訪結(jié)果是該年或該月期間若干觀察人數(shù)、出現(xiàn)預(yù)期觀察結(jié)果數(shù)和截尾數(shù)(刪失數(shù)),數(shù)據(jù)總結(jié)成若干個時段頻數(shù)表形式,每位患者確切生存時間未知,應(yīng)當(dāng)用壽命表法進(jìn)行研究;(2)壽命表法適用于觀察例數(shù)較多而分組的大樣本生存資料.

3.適用范圍與對象(1)估計(jì)某生存時間的生存率,以及生存時間中位數(shù);(2)繪制各種曲線:如生存函數(shù)、風(fēng)險(xiǎn)函數(shù)曲線等;(3)對某一研究因素不同水平的生存時間分布的比較;(4)控制另一個因素后對研究因素不同水平的生存時間分布的比較;(5)對多組生存時間分布進(jìn)行兩兩比較.【實(shí)例1】[問題敘述]現(xiàn)有450例肺癌患者的隨訪資料,請對其生存情況進(jìn)行描述.表11-1450例肺癌患者的隨訪資料術(shù)后年數(shù)012345678910期間死亡人數(shù)9082655240302015842期間刪失人數(shù)324108542121[實(shí)驗(yàn)?zāi)康腯理解壽命表基本思想、應(yīng)用條件及適用范圍,掌握SPSS操作方法和結(jié)果解讀.[操作步驟]變量要求:將資料整理成頻數(shù)表形式,時間變量,類型為數(shù)值型;頻數(shù)變量,類型為數(shù)值型,加權(quán);結(jié)局變量,類型為數(shù)值型;還可以有分組變量,類型為數(shù)值型.隨訪時間數(shù)據(jù)是時間變量取值;隨訪期間的死亡和刪失人數(shù)是頻數(shù)變量取值;結(jié)局變量取值為1和0:若頻數(shù)為死亡則賦值1,若頻數(shù)為刪失(截尾)則賦值0.定義一個時間變量“術(shù)后年數(shù)”,一個頻數(shù)變量“人數(shù)”,一個結(jié)局變量“結(jié)局”,并設(shè)置其“值(Value)”為“1=死亡,0=刪失”.將術(shù)后年數(shù)錄入時間變量,將期間死亡人數(shù)和期間刪失人數(shù)錄入頻數(shù)變量,將頻數(shù)變量對應(yīng)的兩類數(shù)據(jù)分別錄入1、0至結(jié)局變量.菜單選擇:(1)變量加權(quán):主菜單“數(shù)據(jù)(Data)”→“加權(quán)個案(WeightCases)”→“加權(quán)個案(Weightcasesby)”;選頻數(shù)變量“人數(shù)”到“頻率變量(FrequencyVariable)”框,點(diǎn)擊“確定(OK)”按鈕.(2)生命表分析:主菜單“分析(Analyze)”→“生存函數(shù)(Survival)”→“壽命表(LifeTables)”.界面設(shè)置:將“術(shù)后年數(shù)”選入“時間(Time)”欄;在“顯示時間間隔(Displaytimeintervals)”區(qū)域,在“0到(0through)”框填入最大生存時間的上限10;在“步長(by)”框填入生存時間的組距1;在“狀態(tài)(Status)”框選入結(jié)局變量“結(jié)局”,點(diǎn)擊“定義事件(DefineEvents)”按鈕,在“單值(SingleValue)”框填入1.在主界面中,單擊“選項(xiàng)(Option)”按鈕,在“圖形(Plot)”區(qū)域,勾選“生存函數(shù)(Survival)”,點(diǎn)擊“繼續(xù)(Continue)”,其它按默認(rèn)值,點(diǎn)擊“確定(OK)”按鈕.經(jīng)分析,中位數(shù)生存時間為2.78年,表明術(shù)后死亡人數(shù)達(dá)到一半時間為2.78年.其他指標(biāo):☆終結(jié)比例,即死亡概率;☆生存比例,即生存概率;☆期末的累積生存比例,即截止本段上限的累積生存概率;☆概率密度指所有個體在時點(diǎn)t后單位時間內(nèi)死亡概率估計(jì)值;☆風(fēng)險(xiǎn)率,表示活過時點(diǎn)t后、單位時間內(nèi)死亡概率估計(jì)值;☆風(fēng)險(xiǎn)率的標(biāo)準(zhǔn)誤等.期初時間期初記入數(shù)期內(nèi)退出數(shù)歷險(xiǎn)數(shù)期間終結(jié)數(shù)終結(jié)比例生存比例期末累積生存比例概率密度風(fēng)險(xiǎn)率04503448.50090.20.80.80.201.2213572356.00082.23.77.62.184.2622734271.00065.24.76.47.148.27320410199.00052.26.74.35.122.3041428138.00040.29.71.25.100.34594591.50030.33.67.16.080.39659457.00020.35.65.11.058.43735234.00015.44.56.06.047.57818117.5008.46.54.03.027.599928.0004.50.50.02.016.6710312.5002.80.20.00.000.00表11-2肺癌患者術(shù)后壽命表圖11-2為累積生存率曲線圖,橫坐標(biāo)為生存的時間,而縱坐標(biāo)是生存函數(shù)的大小.顯然,隨著時間流逝,生存的概率遞減,曲線呈下降趨勢.11.2Kaplan-Meier分析一、核心知識Kaplan-Meier法利用條件概率及概率乘法原理計(jì)算生存率及標(biāo)準(zhǔn)誤,又稱乘積極限法(Product-LimitMethod,P-L法).1.1生存率計(jì)算:(1)生存時間由小到大排列;(2)生存時間t對應(yīng)的死亡人數(shù);(3)期初觀察人數(shù);(4)計(jì)算條件死亡率及條件生存率;(5)計(jì)算活過t時點(diǎn)的生存率.生存率的標(biāo)準(zhǔn)誤計(jì)算:1.2生存曲線:以生存時間為橫軸,生存率為縱軸繪制生存曲線并描述生存過程,又稱K—M曲線,分析時應(yīng)注意曲線高度和下降坡度.1.3中位生存時間(生存時間中位數(shù)):50%個體存貨期大于該時間.2.應(yīng)用條件Kaplan-Meier分析適用于小樣本或者大樣本未分組資料的生存率的估計(jì)和組間生存率的比較,主要用于樣本含量較小的資料分析.3.適用范圍與對象(1)估計(jì)各生存時間的生存率和中位生存時間;(2)繪制曲線:如生存函數(shù)、風(fēng)險(xiǎn)函數(shù)曲線等;(3)某因素不同水平的生存時間有無差異比較;(4)控制某個分層因素后對研究因素不同水平的生存時間分布比較;(5)多組生存時間分布兩兩比較;(6)各總體分布比較采用Log-rank等非參數(shù)方法.【實(shí)例2】[問題敘述]中藥加化療(中藥組)和化療(對照組)療法治療白血病,隨訪記錄患者生存時間,不帶“+”號者表示已死亡,即完全數(shù)據(jù);帶“+”號者表示尚存活,即截尾數(shù)據(jù),請作生存分析.表11-3兩組療法治療白血病隨訪資料(單位:月)中藥組102+12+13186+19+269+8+6+43+943124對照組2+137+11+61113177[實(shí)驗(yàn)?zāi)康腯理解Kaplan-Meier法基本思想、應(yīng)用條件及適用范圍,掌握SPSS操作方法和結(jié)果解讀.[操作步驟]變量要求:時間變量,類型為數(shù)值型;結(jié)局變量,類型為數(shù)值型;還可以有分組變量,類型為數(shù)值型或字符型.隨訪時間數(shù)據(jù)是時間變量取值;結(jié)局變量取值為1和0(死亡為1,截尾為0).定義時間變量“生存時間”;結(jié)局變量“結(jié)局”,并設(shè)置其“值(Value)”為“1=死亡,0=截尾”;分組變量,設(shè)置其“值(Value)”為“1=中藥組,2=對照組”.將生存時間錄入時間變量,將死亡和截尾數(shù)據(jù)分別對應(yīng)錄入1、0至結(jié)局變量,將組別分別對應(yīng)錄入1、2至分組變量.菜單選擇:“分析(Analyze)”→“生存函數(shù)(Survival)”→“Kaplan-Meier…”.界面設(shè)置:將“生存時間”選入“時間(Time)”欄;將“結(jié)局”選入“狀態(tài)(Status)”欄,點(diǎn)擊“定義事件(DefineEvents)”按鈕,在“單值(SingleValue)”框填入1;將分組變量“組別”選入“因子(Factor)”框.在主界面中,單擊“選項(xiàng)(Option)”按鈕,在“圖(Plot)”區(qū)域,勾選“生存函數(shù)(Survival)”,點(diǎn)擊“繼續(xù)(Continue)”;單擊“比較因子(CompareFactor)”按鈕,勾選“對數(shù)秩(Log-rank)”,用于檢驗(yàn)時間分布是否相同,點(diǎn)擊“繼續(xù)(Continue)”;其它按默認(rèn)值,點(diǎn)擊“確定(OK)”按鈕.[結(jié)果分析]分組總數(shù)事件數(shù)刪失N百分比對照組107330.0%中藥組168850.0%整體26151142.3%表11-4兩組人群生存率估計(jì)表分組時間狀態(tài)此時生存的累積比例累積事件數(shù)剩余個案數(shù)估計(jì)標(biāo)準(zhǔn)誤對照組11.000死亡.900.0951922.000存活..1833.000死亡.788.1342746.000死亡.675.1553657.000死亡.563.1654567.000存活..44711.000死亡.422.17453811.000存活..52913.000死亡.211.173611017.000死亡.000.00070分組時間狀態(tài)此時生存的累積比例累積事件數(shù)剩余個案數(shù)估計(jì)標(biāo)準(zhǔn)誤中藥組14.000死亡.933.06411426.000存活..11336.000存活..11248.000存活..11159.000死亡.848.10021069.000存活..29710.000死亡.754.12638812.000存活..37913.000死亡.646.147461018.000死亡.539.157551119.000存活..541224.000死亡.404.166631326.000死亡.269.156721431.000死亡.135.123811543.000存活..80生存率估計(jì)表中“此時生存的累積比例估計(jì)值”表示該時點(diǎn)的生存率估計(jì)值.兩組的平均生存時間中,中位數(shù)平均時間、標(biāo)準(zhǔn)誤及95%置信區(qū)間等信息.中藥組生存時間均值為22.013個月,中位數(shù)為24個月;對照組生存時間均值為9.775個月,中位數(shù)為11個月.分組均值中位數(shù)估計(jì)標(biāo)準(zhǔn)誤95%置信區(qū)間估計(jì)標(biāo)準(zhǔn)誤95%置信區(qū)間下限上限下限上限對照組9.7751.9745.90513.64511.0004.9401.31820.682中藥組22.0133.66314.83429.19324.0007.5199.26238.738整體17.5392.79312.06523.01213.0003.4816.17719.823兩組及多組生存曲線的比較采用Log-rank檢驗(yàn),即以生存時間對數(shù)為基礎(chǔ)推導(dǎo).表11-6兩組生存率LogRank比較卡方dfSig.LogRank(Mantel-Cox)6.5791.010為分組的不同水平檢驗(yàn)生存分布等同性.經(jīng)分析,兩組比較LogRank檢驗(yàn)結(jié)果(對應(yīng)的概率值P=0.010),檢驗(yàn)結(jié)果表明兩組生存率差異有統(tǒng)計(jì)學(xué)意義.經(jīng)分析,兩組生存曲線的大致分布規(guī)律,并可以進(jìn)行兩組生存率比較,看出中藥組(組別1)預(yù)后效果比對照組(組別2)好.11.3Cox回歸分析一、核心知識Cox回歸模型是1972年由英國統(tǒng)計(jì)學(xué)家Cox提出,主要用來研究各種因素(稱為協(xié)變量或伴隨變量等)對于生存期長短的關(guān)系.生存資料同時考慮生存結(jié)局和生存時間,生存時間不服從正態(tài)分布,可能含有刪失,面對這些特點(diǎn),傳統(tǒng)多因素分析方法無能為力.因此傳統(tǒng)分析方法不能同時處理生存結(jié)局和生存時間,也不能處理刪失時間.(1)Logistic回歸以生存結(jié)局為因變量,僅考慮結(jié)局好壞(死亡或生存),而未考慮出現(xiàn)該結(jié)局的時間長短,無論死亡在隨訪早期或晚期,處理均相同.(2)多重線性回歸以生存時間為因變量,雖能考慮生存時間,但生存時間一般不服從正態(tài)分布,而且傳統(tǒng)線性回歸不能有效利用刪失時間.☆Cox回歸以生存結(jié)局和生存時間為因變量,同時分析眾多因素對生存期的影響,分析帶有刪失生存時間的資料,且不要求資料服從特定的分布.其中是協(xié)變量;是回歸系數(shù),由樣本估計(jì)而得.系數(shù)含義:在其他協(xié)變量不變情況下,協(xié)變量Xi每改變一個單位引起相對危險(xiǎn)度/風(fēng)險(xiǎn)比的自然對數(shù)的該變量.>0表示協(xié)變量是危險(xiǎn)因素,越大生存時間越短;<0表示協(xié)變量是保護(hù)因素,越大生存時間越長.1.基本原理(詳見醫(yī)學(xué)統(tǒng)計(jì)學(xué)教材)Cox回歸模型基本形式為:2.應(yīng)用條件Cox回歸模型假定預(yù)后因素對其死亡風(fēng)險(xiǎn)作用強(qiáng)度在所有時間上都保持一致.3.適用范圍與對象(1)因素分析:分析哪些因素(協(xié)變量)影響生存期的長短;(2)計(jì)算各因素在排除其它因素影響后,對于死亡的相對危險(xiǎn)度;如某因素xi的偏回歸系數(shù)為bi,則該因素xi對于死亡的比數(shù)比為exp(bi).(3)比較各因素對于生存期長短的相對重要性;比較標(biāo)準(zhǔn)化偏回歸系數(shù)bi絕對值大小,越大對生存期長短作用也大.COX模型分析時的樣本含量不宜太小;自變量較多時,要進(jìn)行多元共線性診斷;【實(shí)例3】[問題敘述]為探討某惡性腫瘤的預(yù)后,收集了25例患者的生存時間、生存結(jié)局及影響因素.影響因素包括病人年齡、性別、組織學(xué)類型、治療方式、淋巴結(jié)轉(zhuǎn)移,生存時間以月計(jì)算,變量的賦值和所收集的資料.請用Cox回歸模型進(jìn)行分析.因素變量名賦值說明年齡X1單位(歲)性別X2女=0、男=1組織學(xué)類型X3高分化=0、低分化=1治療方法X4傳統(tǒng)療法=0、新療法=1淋巴結(jié)轉(zhuǎn)移X5否=0、是=1生存時間t單位(月)生存結(jié)局Y刪失=0、死亡=1表11-8收集的25例惡性腫瘤患者生存時間(月)NOX1X2X3X4X5tY15401115202570000510358010135144310111030548010071640000060074400005808360101291939101070010420000670……………………[實(shí)驗(yàn)?zāi)康腯理解Cox回歸模型基本思想、應(yīng)用條件及適用范圍,掌握SPSS操作方法和結(jié)果解讀.[操作步驟]變量要求:一個時間變量,類型為數(shù)值型;一個結(jié)局變量,類型為數(shù)值型;多個影響因素變量(定類、定序、定距及定比數(shù)據(jù)變量),類型為數(shù)值或字符型.隨訪時間數(shù)據(jù)是時間變量取值;結(jié)局變量取值為1和0(死亡為1,截尾為0).定義因素變量“年齡”、“性別”、“組織學(xué)類型”、“治療方式”、“淋巴結(jié)轉(zhuǎn)移”,時間變量“生存時間”,結(jié)局變量“生存結(jié)局”,設(shè)置“值(Value)”“1=死亡,0=截尾”.將影響因素X1~X5數(shù)據(jù)分別錄入影響因素變量,將生存時間錄入時間變量,將死亡和截尾兩類數(shù)據(jù)分別對應(yīng)錄入1、0至結(jié)局變量.菜單選擇:主菜單“分析(Analyze)”→“生存函數(shù)(Survival)”→“Cox回歸(CoxRegression)”.界面設(shè)置:將時間變量“生存時間”選入“時間(Time)”框;把結(jié)局變量“生存結(jié)局”選入“狀態(tài)(Status)”框,點(diǎn)擊“定義事件(DefineEvent)”按鈕,“單值(Singlevalue)”中輸入1;把影響因素變量“年齡、性別、組織學(xué)類型、治療方式、淋巴結(jié)轉(zhuǎn)移”選入“協(xié)變量(Covariates)”框;方法選擇“條件:向前(ForwardConditional)”.點(diǎn)擊“分類(Categorical)”按鈕,一般將多分類無序變量選入“分類協(xié)變量(CategoricalCovariates)”框,系統(tǒng)將作為啞變量處理.將“治療方式”和“組織學(xué)類型”選入,“參考類別(ReferenceCategory)”選“第一個(First)”,一定點(diǎn)擊“更改(Change)”;點(diǎn)擊“選項(xiàng)(Options)”按鈕,在“模型統(tǒng)計(jì)量(ModelStatistics)”區(qū)域選擇“CI用于exp(B)95%(CIforexp(B)95%)”;點(diǎn)擊“繪圖(Plots)”按鈕,勾選“生存函數(shù)(Survival)”,將“協(xié)變量值的位置”框中的“治療方式”選入“單線(SeparateLinesfor)”框.點(diǎn)擊“繼續(xù)(Continue)”,點(diǎn)擊“確定(OK)”.[結(jié)果分析]表11-9Cox回歸模型整體性檢驗(yàn)步驟-2倍對數(shù)似然值整體(得分)從上一步驟開始更改從上一塊開始更改卡方dfSig.卡方dfSig.卡方dfSig.1a30.7986.0771.0145.9541.0155.9541.0152b22.16813.2292.0018.6311.00314.5842.0013c18.70914.7303.0023.4581.06318.0433.000經(jīng)Cox回歸模型整體性檢驗(yàn),三種Cox回歸模型整體都有統(tǒng)計(jì)學(xué)意義.表11-10Cox回歸模型參數(shù)檢驗(yàn)BSEWalddfSig.Exp(B)95%CI用于Exp(B)下部上部步驟1治療方法-2.2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論