單獨(dú)二分類Logit模型在有序分類資料中的應(yīng)用_第1頁(yè)
單獨(dú)二分類Logit模型在有序分類資料中的應(yīng)用_第2頁(yè)
單獨(dú)二分類Logit模型在有序分類資料中的應(yīng)用_第3頁(yè)
單獨(dú)二分類Logit模型在有序分類資料中的應(yīng)用_第4頁(yè)
單獨(dú)二分類Logit模型在有序分類資料中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、單獨(dú)二分類Logit模型在有序分類資料中的應(yīng)用 作者:林黨新 許濤 沈念春 賴勝 鄧政偉【摘要】 目的:通過幽門螺桿菌與胃癌癌前病變關(guān)系研究的資料,探討單獨(dú)二分類Logit模型中有序分類資料中的應(yīng)用。方法: 選擇293名患有輕度萎縮性胃炎的患者,對(duì)病變進(jìn)展的影響因素分析分別采用累積比數(shù)Logit模型和單獨(dú)的二分類Logit模型,并對(duì)兩種模型的分析結(jié)果進(jìn)行比較。結(jié)果:累積比數(shù)Logit模型分析結(jié)果顯示幽門螺桿菌感染對(duì)胃癌癌前病變的影響無統(tǒng)計(jì)學(xué)意義(OR=1.158,95%CI:0.9862.464),但得分檢驗(yàn)發(fā)現(xiàn)幽門螺桿菌不滿足累積比數(shù)Logit模型的比例優(yōu)勢(shì)假定條件(2=24.100,P&a

2、mp;lt;0.0001),故采用單獨(dú)的二分類Logit模型進(jìn)一步分析。結(jié)果表明,幽門螺桿菌陽(yáng)性者比陰性者有更高的危險(xiǎn)至少進(jìn)展到重度萎縮性胃炎(OR=2.334,95%CI:1.4023.885)。結(jié)論:幽門螺桿菌感染主要作用于胃癌癌前病變的早期階段。對(duì)于有序分類資料的分析,選用模型時(shí)應(yīng)注意其應(yīng)用條件,若條件不滿足最好換用其它更為恰當(dāng)?shù)姆椒ā?【關(guān)鍵詞】 胃癌癌前病變; 幽門螺桿菌; 累積比數(shù)Logit模型; 單獨(dú)的二分類Logit模型有序分類資料最常用的分析方法是累積比數(shù)Logit模型1,對(duì)多分類有序反應(yīng)資料,如果采用一般的二分類Logit模型,而不是累積比數(shù)Logit模型,只能獲得50%7

3、0%的檢驗(yàn)效能2,說明在處理有序分類數(shù)據(jù)方面,累積比數(shù)Logit模型要優(yōu)于二分類Logit模型。近幾年累積比數(shù)Logit模型在國(guó)內(nèi)應(yīng)用領(lǐng)域有所增多,但不少忽略了模型的使用條件,盲目套用,以致影響所得結(jié)論的可靠性。本研究通過累積比數(shù)Logit模型在實(shí)際數(shù)據(jù)分析中的應(yīng)用,說明了忽視模型應(yīng)用條件所產(chǎn)生的后果,并介紹了如何選擇恰當(dāng)?shù)姆治龇椒ā? 資料與方法1.1 資料來源資料來源于1項(xiàng)茂名市某醫(yī)院的隊(duì)列研究數(shù)據(jù),該研究選擇了360名輕度慢性萎縮性胃炎(CAG)患者,根據(jù)他們的幽門螺桿菌(Hp)感染情況分為陰性組和陽(yáng)性組兩組人群,隨訪3年后重新進(jìn)行病理學(xué)診斷,觀察他們的病變情況。1.2 胃黏膜病理診斷用

4、胃內(nèi)窺鏡觀察胃黏膜病變,并在胃體大小彎、胃角、胃竇大小彎、前后壁各取胃黏膜活檢組織1塊。病理切片照全國(guó)胃、十二指腸活檢、病理診斷標(biāo)準(zhǔn)進(jìn)行診斷。每個(gè)受檢對(duì)象以最嚴(yán)重病變?yōu)榈谝辉\斷。1.2 統(tǒng)計(jì)分析方法累積比數(shù)Logit模型的形式為3:Logit(P(Yk|X)=ln(P(Yk|x)1-P(Yk|x)=ak-pi=1ixi ,k=1,2,K-1。 (1)反應(yīng)變量Y為K個(gè)等級(jí)的有序變量,第k(k=1,2,K)類的概率分別為1,2,k,且Kk=1k=1 。影響因素xT=(x1,x2,xP)為解釋變量,xi(i=1,2,p)可以是連續(xù)變量、無序或有序分類變量。則該模型實(shí)際上是將K個(gè)等級(jí)人為地分成1,k

5、和k+1,K兩類,在這兩類基礎(chǔ)上定義的Logit P表示屬于前k個(gè)等級(jí)的累積概率(P(Yk|x)與后K-k個(gè)等級(jí)的累積概率(1-P(Yk|x)的比數(shù)之對(duì)數(shù)。故該模型稱為累積比數(shù)模型,其應(yīng)用有一個(gè)基本的假定條件,即比例優(yōu)勢(shì)假定(proportional odds assumption)。這一條件要求自變量的回歸系數(shù)應(yīng)與分割點(diǎn)k無關(guān),換句話說,無論從哪一點(diǎn)分類,對(duì)所有的累積logit,變量xk都有一個(gè)相同的k估計(jì)。單獨(dú)的二分類logit模型(separate binary logistic modes)主要是把反應(yīng)變量按照不同分割點(diǎn)合并為不同的二類,然后分別進(jìn)行二分類的Logistic回歸分析4。

6、本研究中的反應(yīng)變量為隨訪5年后的病變,分為輕度CAG、重度CAG、腸上皮化生(IM)、不典型增生(DYS)共4類,有3個(gè)分割點(diǎn),故定義為3個(gè)二分類Logit:一是將IM、重度CAG和輕度CAG合并,即DYSVSIM,重度CAG,輕度CAG,表示至少進(jìn)展到DYS;二是將DYS和IM合并,重度CAG和輕度CAG合并,即DYS,IMVS重度CAG,輕度CAG,表示至少進(jìn)展到IM;三是將DYS、IM和重度CAG合并,即DYS,IM,重度CAGVS輕度CAG,表示至少進(jìn)展到重度CAG。然后以上述分類分別作3次二分類的logistic回歸分析。整個(gè)分析過程均由SAS 8.2(SAS Institute,

7、Cary,N.C.)來完成5。2 結(jié)果經(jīng)3年隨訪后,共67人因各種原因失訪,293人具有可供分析的完整資料。其中,118人病變?nèi)詾檩p度CAG,91人進(jìn)展為重度CAG,49人進(jìn)展為IM,35人進(jìn)展為DYS。具體進(jìn)展情況見表1。累積比數(shù)Logit模型分析結(jié)果表明(表2),除性別因素外,其他因素對(duì)胃癌癌前病變的影響均無統(tǒng)計(jì)學(xué)意義。但從得分檢驗(yàn)(score test)結(jié)果來看(表3),Hp不滿足比例優(yōu)勢(shì)假定條件(2=24.100,P<0.0001),也就是說,在反應(yīng)變量的不同分割點(diǎn)上,Hp的估計(jì)值不同。由于基本假定條件違背,該資料采用累積比數(shù)Logit模型分析未必合適。表1 293人隨訪

8、5年后的病變進(jìn)展情況表2 累積比數(shù)Logit模型的參數(shù)估計(jì)結(jié)果表3 比例優(yōu)勢(shì)假定檢驗(yàn)結(jié)果為了核實(shí)結(jié)果的正確性,并充分利用該資料有序的特點(diǎn),故采用單獨(dú)的二分類Logit模型進(jìn)一步分析(表4),可以看出,年齡、性別、吸煙、飲酒這四個(gè)變量在不同分割點(diǎn)的OR值相差不大,而Hp的OR值則差別很大。把DYS、IM和重度CAG合并為一類(即“至少進(jìn)展為重度CAG”)時(shí),Hp的影響有統(tǒng)計(jì)學(xué)意義(OR=2.334,95%CI:1.4023.885)。而對(duì)“至少進(jìn)展到DYS”和“至少進(jìn)展到IM”的影響則無統(tǒng)計(jì)學(xué)意義。表4 單獨(dú)二分類Logit模型分析結(jié)果3 討論本次研究結(jié)果顯示,年齡、性別、吸煙、飲酒對(duì)胃癌癌前病

9、變的進(jìn)展無影響。在校正上述因素的影響后,Hp感染主要作用于胃癌癌前病變的早期階段,Hp陽(yáng)性者至少進(jìn)展到重度CAG的可能性是Hp陰性者的2.334倍(OR=2.334,95%CI:1.4023.885),而對(duì)進(jìn)展到更高級(jí)的病變?nèi)鏘M、DYS,則Hp陽(yáng)性與陰性并無差別。這與有學(xué)者提出的Hp主要作用于胃癌癌前病變的早期階段的結(jié)論是一致的6,7。累積比數(shù)Logit模型是分析有序分類資料最常用的方法,但其應(yīng)用需要滿足一定的條件,其中一個(gè)基本條件就是比例優(yōu)勢(shì)假定條件,即自變量的回歸系數(shù)應(yīng)與分割點(diǎn)k無關(guān)。對(duì)于一個(gè)自變量xk而言,不同累積比數(shù)發(fā)生比的回歸線相互平行,只是截距參數(shù)有所差別。以往有人認(rèn)為,累積比數(shù)

10、Logit模型對(duì)這一條件并不敏感,但在實(shí)際中,這一條件不滿足往往容易導(dǎo)致錯(cuò)誤的結(jié)論,本研究即證明了這一點(diǎn)。Ralf也曾對(duì)這一問題進(jìn)行了探討8,并指出,如果不滿足比例優(yōu)勢(shì)假定條件,最好采用單獨(dú)的二分類Logit模型進(jìn)行分析,否則做出的結(jié)論往往給人以誤導(dǎo)甚至是毫無意義的。本研究發(fā)現(xiàn)資料不滿足比例優(yōu)勢(shì)假定條件,因此采用了簡(jiǎn)單且易于理解的單獨(dú)的二分類Logit模型進(jìn)一步分析。結(jié)果表明,盡管Hp對(duì)進(jìn)展到更高級(jí)的病變(IM、DYS)無影響,但對(duì)至少進(jìn)展到重度CAG的影響有統(tǒng)計(jì)學(xué)意義,即Hp主要作用于胃癌癌前病變的早期階段。如果忽略比例優(yōu)勢(shì)假定條件的檢驗(yàn),接受累積比數(shù)Logit模型的分析結(jié)果,便會(huì)得出相反的

11、結(jié)論。當(dāng)有序分類資料不滿足比例優(yōu)勢(shì)假定條件時(shí),還有其它一些方法可供選擇9,如stereotype模型、偏比例優(yōu)勢(shì)模型(partial proportional odds models)等10。這些方法都是基于累積Logits計(jì)算的,因而可與單獨(dú)的二分類Logit模型直接比較,但其計(jì)算過程繁瑣,且結(jié)果的解釋不如單獨(dú)的二分類Logit模型易于理解。多項(xiàng)Logit模型(polytomous logits models)是基于廣義Logits計(jì)算的,其計(jì)算過程和結(jié)果解釋均與單獨(dú)的二分類Logit模型不同,因而二者不可直接比較,一般也不作為比例優(yōu)勢(shì)假定條件不滿足時(shí)的首選方法??傊?,對(duì)于有序分類資料的分析

12、,應(yīng)先看其是否滿足模型的使用條件,如不滿足,最好換用其它更為合適的方法。本次研究一開始采用累積比數(shù)Logit模型分析,結(jié)果顯示Hp對(duì)胃癌癌前病變的影響無統(tǒng)計(jì)學(xué)意義,這實(shí)際上是由于Hp不滿足比例優(yōu)勢(shì)假定條件所致。在利用單獨(dú)的二分類Logit模型作進(jìn)一步詳細(xì)分析后,則可以發(fā)現(xiàn),Hp陽(yáng)性者至少進(jìn)展到重度CAG的危險(xiǎn)顯著高于Hp陰性者?!緟⒖嘉墨I(xiàn)】 1 McCullagh P.Regression Models for Ordinal Data (with Discussion). J.R.Stat Soc,1980,42:109.2 BG Amstrong,M Sloan.Ordinal Regre

13、ssion Models for Epidemiologic Data.Am J of Epidemiology,1989,129:191204.3 Ludwig Fahrmeir,Gerhard Tutz.Multivariate Statistical Modeling Based on Generalized Linear Models.Beijing:World Publishing Cooperation,1998,7579.4 Ralf Bender,Ulrich Grouven.Using Binary Logistic Regression Models for Ordinal

14、 Data with Non-proportional Odds.Journal of Clinical Epidemiol,1998,51:809816.5 Ralf Bender,Axel Bender.Calculating Ordinal Regression Models in SAS and SPlus.Biometrical Journal,2000,42:677699.6 Kunio Takeuchi, Yoshihiro Ohno, Yasushi Tsuzuki, etc. Helicobacter pylori Infection and Early Gastric Ca

15、ncer.J Clin Gastroenterol, 2003,36:321324.7 夏志偉,林三仁.幽門螺桿菌與胃癌.幽門螺桿菌感染的基礎(chǔ)與臨床(修訂版).北京:中國(guó)科學(xué)技術(shù)出版社, 2002, 172178.8 Ralf Bender,Ulrich Grouven.Ordinal Logistic Regression in Medical research.Journal of the Royal College of Physicians of London,1997,31:546551.9 R Lall,MJ Campbell.A Review of Ordinal Regression Models Applied

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論