樹模型在慢性乙肝與肝硬化和肝癌臨床診斷中的應(yīng)用_第1頁
樹模型在慢性乙肝與肝硬化和肝癌臨床診斷中的應(yīng)用_第2頁
樹模型在慢性乙肝與肝硬化和肝癌臨床診斷中的應(yīng)用_第3頁
樹模型在慢性乙肝與肝硬化和肝癌臨床診斷中的應(yīng)用_第4頁
樹模型在慢性乙肝與肝硬化和肝癌臨床診斷中的應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、樹模型在慢性乙肝與肝硬化和肝癌臨床診斷中的應(yīng)用作者:王劍,劉殿武,曹國玉,李偉勇,李金奎【摘要】目的:利用決策樹模型挖掘常見的臨床檢驗(yàn)資料信息,進(jìn)一步提高慢 性乙型肝炎及相關(guān)疾病的確診率.方法:將臨床收集的102例慢性乙肝患者和 80例肝癌及肝硬化患者常見的17種信息和臨床檢測結(jié)果綜合分析,利用決策樹 卡方自動(dòng)交互探測(chaid)和分類與回歸樹(crt)兩種算法構(gòu)建預(yù)測模型,并 采用正確預(yù)測率和交互印證對其進(jìn)行風(fēng)險(xiǎn)評估.結(jié)果:進(jìn)入chaid和crt兩種算 法模型的主要變量是年齡和膽紅素指標(biāo)及職業(yè)等,兩模型預(yù)測慢性乙型和肝炎肝 硬化及肝癌的總體準(zhǔn)確率分別為71.4%和74.2%.結(jié)論:決策樹模

2、型在數(shù)據(jù)挖掘, 資料再利用方面效果良好.【關(guān)鍵詞】肝炎,乙型;決策樹;診斷0引言在已知各型肝炎中,乙型病毒性肝炎的危害最嚴(yán)重1 乙型病毒性肝炎 極易發(fā)展為肝硬化、肝癌,因此如何早期診斷并加以區(qū)分具有重大的臨床意義目 前肝硬化及肝癌的診斷主要依賴于血清學(xué)和影像學(xué)檢測等,而金標(biāo)準(zhǔn)肝臟穿刺的 使用多受限制2-3在目前尚無特異性生物標(biāo)志的情況下,充分利用現(xiàn)有的臨 床檢測結(jié)果,通過高效的統(tǒng)計(jì)方法,挖掘數(shù)據(jù)內(nèi)在的信息以提高診斷準(zhǔn)確性,是 目前較為可行的方法之一 4-5.本研究試圖利用決策樹模型在此方面做有益的 探索.1材料和方法1. 1材料收集200703/200705河北省石家莊市傳染病醫(yī)院的部分住院患

3、者182例,其中慢性乙肝102例,肝癌及肝硬化者80例.以上病例均符合國家 200512制定的慢性乙型肝炎防治指南的診斷標(biāo)準(zhǔn),并排除合并其他型別的感染6-7 ,部分病例經(jīng)過肝臟穿刺病理證實(shí),肝癌患者全部經(jīng)病理證實(shí).12方法1. 2. 1數(shù)據(jù)來源乙型病毒性肝炎患者的病毒dna定量采用適時(shí)熒光pcr方法, 乙肝5項(xiàng)檢測采用酶免疫法,肝功能等檢測采用常規(guī)生化方法.數(shù)據(jù)采集均符合 醫(yī)學(xué)倫理學(xué)要求.1. 2. 2統(tǒng)計(jì)方法模型構(gòu)建利用spss15. 0統(tǒng)計(jì)軟件,決策樹研究共有4種不同 算法,本次研究采用卡方自動(dòng)交互探測(chi squared automatic interaction detection

4、, chaid )和分類與回歸樹(classification and regression tree, crt ) 兩種算法對各變量進(jìn)行預(yù)測,因?yàn)閏haid可以進(jìn)行多分類結(jié)點(diǎn)劃分,crt只能進(jìn) 行二分類結(jié)點(diǎn)劃分,具有一定代表性.自變量的重要性依據(jù)對應(yīng)變量反應(yīng)程度的 大小依次排列,結(jié)點(diǎn)劃分水準(zhǔn)定為005研究變量的賦值情況如表1表1各研究變量賦值明細(xì)表(略)2結(jié)果21患者資料基本情況收集的182例乙型肝炎患者中男性118例(64. 8%), 女性 64 例(35.2%),年齡 12 - 76 ( 45. 4 ± 8. 7 )歲.2.2決策樹模型匯總不同算法下乙型病毒性肝炎和肝硬化及肝癌

5、診斷決策樹 主要技術(shù)指標(biāo)見表2.表2慢性乙型肝炎與肝硬化及肝癌診斷決策樹(略)2. 3決策樹模型依以上技術(shù)指標(biāo),用chaid和crt兩種算法構(gòu)造樹模型圖分 別見圖1,2.其中chaid模型的預(yù)測變量分別是年齡、膽紅素水平和職業(yè)等因素, 按目標(biāo)效應(yīng)響應(yīng)率從高到低的順序排列(即出現(xiàn)肝硬化和肝癌的危險(xiǎn)性高低),分 別為結(jié)點(diǎn)6 (87. 5%),結(jié)點(diǎn)5 (54. 5%),結(jié)點(diǎn)7(51.2%),結(jié)點(diǎn)4 (18. 4%)和結(jié)點(diǎn) 1 (13. 9%),即在基本條件滿足的情況下,年齡大于51歲,職業(yè)為農(nóng)民或個(gè)體者, 患肝硬化和肝癌的危險(xiǎn)性最高.而crt模型的預(yù)測變量則是膽紅素水平和年齡, 按目標(biāo)效應(yīng)響應(yīng)率從高

6、到低的順序排列(即出現(xiàn)硬化及肝癌危險(xiǎn)性高低),分別為 結(jié)點(diǎn)4(74.6%),結(jié)點(diǎn)3(36.1%),結(jié)點(diǎn)1(14.8%),即當(dāng)膽紅素水平高于14. 3, 同時(shí)年齡大于47. 5歲者,患肝炎肝硬化及肝癌危險(xiǎn)性最大.圖1慢性乙型肝炎和肝硬化及肝癌的診斷決策樹形圖(chaid)(略)圖2慢性乙型肝炎和肝硬化及肝癌診斷決策樹形圖(crt)(略)2.4決策樹模型的分類評價(jià)和風(fēng)險(xiǎn)評估用chaid和crt兩種算法構(gòu)建的決策 樹模型,可將不同特征的患者預(yù)測為相對應(yīng)的目標(biāo),其正確分類分別達(dá)到71.4% 和74.2% (表3),說明模型的擬合效果良好.交互印證的風(fēng)險(xiǎn)評估表明,chaid 和crt兩種模型的風(fēng)險(xiǎn)分別為

7、0.451和0.352,標(biāo)準(zhǔn)誤為0. 037和0. 035,雖在可 接受范圍內(nèi),但前者稍高,有一定風(fēng)險(xiǎn).表3慢性乙型肝炎與肝硬化及肝癌診斷決策樹模型的分類(略)注:括弧內(nèi)、外分別是crt和chaid算法.3討論乙型肝炎患者極易發(fā)展為肝硬化及肝癌,而早期肝硬化和肝癌因臨床癥狀不 典型,常常被患者忽視,直到中晚期才被發(fā)現(xiàn),臨床治療十分被動(dòng).本研究試圖 對常規(guī)臨床監(jiān)測數(shù)據(jù)進(jìn)行挖掘,以發(fā)現(xiàn)隱含的、有預(yù)測價(jià)值的信息,達(dá)到早期預(yù) 警8-9 .決策樹模型構(gòu)建一般有4種算法,crt和quest算法得到的樹結(jié)構(gòu)模型每個(gè) 結(jié)點(diǎn)有2個(gè)分支,稱為二叉樹.chaid和exhaustive chaid算法允許結(jié)點(diǎn)含有多

8、于2個(gè)子結(jié)點(diǎn)的樹稱為多叉樹,我們在兩類算法中各取一類,即chaid和crt, 目的在于借助這一高效的統(tǒng)計(jì)手段,充分利用現(xiàn)有資料,構(gòu)建樹形圖為臨床服務(wù). 值得注意的是,在兩種樹模型中,反映肝纖維化的四項(xiàng)指標(biāo)透明質(zhì)酸(ha)、層連 蛋白(ln)、iii型前膠原(pciii )和iv型膠原(iv c)均未出現(xiàn),反映出該四項(xiàng) 指標(biāo)應(yīng)用價(jià)值的局限性,即僅作一次檢測很難準(zhǔn)確判斷肝損程度,在應(yīng)用時(shí)要反 復(fù)多次檢測肝纖四項(xiàng),動(dòng)態(tài)觀察,才能判斷和掌握病情.這對于臨床實(shí)踐有一定 指導(dǎo)意義.比較表2和圖2,我們會(huì)發(fā)現(xiàn)盡管crt算法中引入模型的變量有10個(gè),但在 決策樹形圖中并未完全顯示,這是由于最大樹深度是人為設(shè)置

9、的,其目的就是不 要使“樹”長得過于“茂盛”,否則模型的實(shí)用性將大大降低.兩個(gè)模型中被引 入的變量相似,主要是年齡和膽紅素等,與臨床實(shí)際吻和的很好.對已經(jīng)構(gòu)建好 的決策樹模型進(jìn)行分類評價(jià),決策樹模型的正確預(yù)測率高達(dá)70%以上,擬合效果 很好,而利用交互印證進(jìn)行風(fēng)險(xiǎn)評估,風(fēng)險(xiǎn)均在可接受范圍內(nèi).綜上,決策樹模 型在實(shí)際臨床應(yīng)用中具有良好的參考和使用價(jià)值.【參考文獻(xiàn)】1 姜寶法.病毒性肝炎a /李力明.流行病學(xué)m. 5版.北京: 人民衛(wèi)生出版社,2003: 477.2 于曉輝,趙連三,張秀輝,等慢性乙型肝炎病理與臨床診斷的一致性 j胃腸病和肝臟病雜志,2005,14 ( 1 ) : 71-73.3

10、劉杰,王吉耀,陸曄.血清纖維化指標(biāo)對肝纖維化診斷價(jià)值的研究j 中華內(nèi)科雜志,2006,45 ( 6 ) : 475-477.4 張輝,李軍,錢宗才,等.基于數(shù)據(jù)挖掘技術(shù)的骨腫瘤診斷知識(shí)的自動(dòng)獲 取j.第四軍醫(yī)大學(xué)學(xué)報(bào),2004, 25 ( 7 ) : 669-670.5 張曉東.數(shù)據(jù)挖掘技術(shù)在肺癌生存期預(yù)測中的應(yīng)用探討j中國衛(wèi) 生統(tǒng)計(jì),2006, 13 (4): 324-328.6 張文宏,翁心華,莊輝.慢性乙型肝炎防治指南專家討論會(huì)紀(jì)要 j中華肝臟病雜志,2006, 14 ( 5 ): 390-392.7 中華醫(yī)學(xué)會(huì).病毒性肝炎防治方案j中華傳染病雜志,2001, 19 (1 ): 56-62.8 jonathau bl bard anatomies: the intersection of anatomy andb

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論