CT影像組學(xué)在預(yù)測肺腺癌ALK融合基因表達(dá)中的價值初探_第1頁
CT影像組學(xué)在預(yù)測肺腺癌ALK融合基因表達(dá)中的價值初探_第2頁
CT影像組學(xué)在預(yù)測肺腺癌ALK融合基因表達(dá)中的價值初探_第3頁
CT影像組學(xué)在預(yù)測肺腺癌ALK融合基因表達(dá)中的價值初探_第4頁
CT影像組學(xué)在預(yù)測肺腺癌ALK融合基因表達(dá)中的價值初探_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

摘要

目的探討CT影像組學(xué)定量特征在預(yù)測肺腺癌間變性淋巴瘤激酶(ALK)融合基因表達(dá)中的價值。方法回顧性分析2015年11月至2018年5月北京協(xié)和醫(yī)院有ALK基因檢測結(jié)果且術(shù)前接受本院胸部CT檢查的195例肺腺癌患者(其中ALK突變患者60例)。使用肺結(jié)節(jié)自動檢測分割算法在CT圖像上標(biāo)注病變的三維容積感興趣區(qū)(VOI)。利用PyRadiomics工具對所有VOI區(qū)域進(jìn)行重采樣、圖像預(yù)處理(包括基于小波和拉普拉斯濾波器的預(yù)處理方法)和特征提取。在Dr.Wise科研平臺上對已提取的特征進(jìn)行標(biāo)準(zhǔn)化處理,并分別基于不同圖像預(yù)處理方式及不同特征類型篩選關(guān)鍵特征,用多因素logistic回歸建模和10次5折交叉驗證法進(jìn)行驗證。采用ROC評價模型對ALK基因突變的預(yù)測能力,并使用DeLong比較不同模型的效能。

結(jié)果每個病灶共提取1232個影像組學(xué)特征。在特征篩選后共納入15個組學(xué)特征建模,在訓(xùn)練集和驗證集中模型預(yù)測ALK基因突變的AUC分別是0.88和0.78。分別基于原始CT圖像、小波處理后圖像和拉普拉斯高斯濾波器處理后圖像的組學(xué)特征建模時,在驗證集中模型的AUC分別為0.76、0.75和0.76。這3組模型與全部特征聯(lián)合建模模型的效能相比差異均無統(tǒng)計學(xué)意義(P>0.05)。以不同類型的組學(xué)特征建模,一階特征和灰度共生矩陣(GLCM)紋理特征預(yù)測ALK基因突變能力較好,其中GLCM特征模型最優(yōu),在驗證集中的AUC為0.83,準(zhǔn)確率、敏感度和特異度分別為0.74、0.85和0.69;一階特征模型在驗證集中的AUC為0.80。結(jié)論CT影像組學(xué)定量特征在預(yù)測肺腺癌ALK融合基因表達(dá)中有較大的應(yīng)用價值。近年來肺癌的分子病理學(xué)和分子靶向治療研究進(jìn)展迅速,不同基因突變被認(rèn)為是各型肺癌發(fā)病和演變的基礎(chǔ)[1],許多研究證實間變性淋巴瘤激酶(anaplasticlymphomakinase,ALK)融合基因是僅次于表皮生長因子受體(epidermalgrowthfactorreceptor,EGFR)基因的又一參與非小細(xì)胞肺癌發(fā)病的主要基因[2],且多發(fā)生于肺腺癌患者。對ALK陽性腫瘤靶向治療的效果優(yōu)于傳統(tǒng)治療,因此精準(zhǔn)識別ALK突變患者對選擇合適的治療至關(guān)重要。有學(xué)者研究了肺腺癌的CT征象與ALK基因突變間的相關(guān)性[3,4],認(rèn)為ALK基因突變陽性者易呈實性密度、分葉狀邊緣,這些CT征象可能有助于預(yù)測基因突變。近年來影像組學(xué)技術(shù)迅速發(fā)展,研究顯示影像組學(xué)特征可預(yù)測不同的基因表達(dá)模式,但既往多集中在對EGFR基因的研究[1,5,6],采用影像組學(xué)預(yù)測肺癌ALK基因突變的文獻(xiàn)報道較少,且特征提取及特征選擇算法簡單[7]。因此,本研究嘗試基于薄層CT提取定量影像組學(xué)特征,結(jié)合不同特征選擇算法構(gòu)建組學(xué)模型,探討不同種類組學(xué)特征在預(yù)測肺腺癌ALK融合基因表達(dá)中的價值。資料與方法一、臨床資料回顧性分析2015年11月至2018年5月北京協(xié)和醫(yī)院符合下列標(biāo)準(zhǔn)的患者。納入標(biāo)準(zhǔn):(1)手術(shù)或活檢病理確診為肺腺癌;(2)具有ALK基因檢測結(jié)果;(3)術(shù)前接受本院胸部CT檢查,且CT檢查與手術(shù)或活檢間隔<1個月;(4)有薄層(層厚≤2mm)肺窗圖像。排除標(biāo)準(zhǔn):(1)術(shù)前CT圖像偽影較大,影響分析;(2)術(shù)前接受過新輔助放化療或抗炎治療者。根據(jù)納入和排除標(biāo)準(zhǔn),共195例肺腺癌(ALK陽性60例,ALK陰性135例)患者納入研究,男89例,女106例,年齡58±10(26~81)歲;腫瘤病變均為單發(fā)。ALK免疫組織化學(xué)染色按照Ventana免疫組織化學(xué)法進(jìn)行,兔單克隆陰性質(zhì)控抗體及ALK陽性與陰性的肺癌病例用于系統(tǒng)水平質(zhì)控,以確保該檢測合乎要求。

二、CT檢查方法采用多層螺旋CT(德國SiemensSomatomForce,SomatomFlash雙源CT或美國GEDiscoveryCT750HD)行術(shù)前常規(guī)胸部CT檢查。掃描參數(shù):管電壓120kV,自動管電流,螺距0.984~1.200,矩陣512×512,F(xiàn)OV350mm×350mm,原始數(shù)據(jù)采集后所有患者均行0.5~2.0mm無間隔薄層重建,采用高分辨肺算法,肺窗窗寬1200HU,窗位-500HU。

三、影像組學(xué)分析1.病變標(biāo)注:將匿名化后的薄層肺窗DICOM圖像導(dǎo)入Dr.Wise科研平臺,使用平臺上肺結(jié)節(jié)檢測和分割模型進(jìn)行病變自動檢測和分割。平臺內(nèi)置的深度學(xué)習(xí)模型采用基于圖像和特征金字塔網(wǎng)絡(luò)(featurepyramidnetworks,F(xiàn)PN)結(jié)合的兩級網(wǎng)絡(luò),并已在公開數(shù)據(jù)集和內(nèi)部數(shù)據(jù)集上訓(xùn)練完成。深度學(xué)習(xí)模型的分割結(jié)果,在不給出病理結(jié)果和其他信息的情況下,由2名分別具有3年和14年肺癌影像診斷經(jīng)驗的放射科醫(yī)師共同逐層確認(rèn)并做必要的修改;三維容積感興趣區(qū)(volumeofinterest,VOI)按照瘤肺界面進(jìn)行勾畫,勾畫過程中盡量排除血管、支氣管、肺不張等區(qū)域,為了較準(zhǔn)確真實地勾畫病變,如區(qū)分中心型肺癌與肺門血管或遠(yuǎn)端肺不張組織等,有時需結(jié)合增強(qiáng)CT縱隔窗圖像。

2.特征提?。菏褂肞yRadiomics工具包計算VOI內(nèi)腫瘤組織的影像組學(xué)特征。首先對圖像進(jìn)行重采樣,使圖像在3個解剖方向上像素間距為1.0mm,排除CT機(jī)型不同造成的空間分辨率不一致引起的干擾。

對于原始CT圖像,應(yīng)用高通或低通小波濾波器和具有不同λ參數(shù)的拉普拉斯高斯濾波器進(jìn)行預(yù)處理,得到8個小波預(yù)處理后圖像和5個拉普拉斯濾波器預(yù)處理后圖像。提取原始CT圖像和預(yù)處理后圖像的影像組學(xué)特征,包括基于CT值或預(yù)處理后圖像像素值的一階特征、描述腫瘤形態(tài)的形態(tài)特征及描述腫瘤內(nèi)部和表面紋理的灰度共生矩陣(GLCM)、灰度游程矩陣(GLRLM)、灰度區(qū)域大小矩陣(GLSZM)和灰度共生矩陣(GLDM)紋理特征。每個病變共提取1232個影像組學(xué)特征,并進(jìn)行Z-score標(biāo)準(zhǔn)化。

3.機(jī)器學(xué)習(xí)模型建立和評估:首先,使用全部組學(xué)特征進(jìn)行建模;然后,使用原始圖像上提取的組學(xué)特征、預(yù)處理圖像提取的組學(xué)特征分別建模;最后,按特征提取類別對組學(xué)特征進(jìn)行分組,包括一階特征、形態(tài)特征及紋理特征(GLCM、GLRLM、GLSZM和GLDM),并使用每組特征分別建模。比較不同組學(xué)特征預(yù)測ALK基因突變的差異。

采用多因素logistic回歸方法建模,模型超參數(shù)使用網(wǎng)格化搜索,根據(jù)驗證集中受試者工作曲線(ROC)下面積(AUC)逆向選擇最佳超參數(shù)。對每個模型,均采用10次5折交叉驗證進(jìn)行訓(xùn)練。分別記錄每次迭代時模型預(yù)測訓(xùn)練及驗證集數(shù)據(jù)為ALK+的概率,計算每個數(shù)據(jù)作為訓(xùn)練集或驗證集時每次迭代記錄的概率的均值,作為模型的訓(xùn)練集或驗證集的結(jié)果。據(jù)此計算模型在訓(xùn)練集和驗證集的各項指標(biāo),包括模型的AUC、準(zhǔn)確率、敏感度、特異度等。對最大AUC值行后向淘汰篩選,獲得關(guān)鍵影像組學(xué)特征。上述特征選擇、模型構(gòu)建和評估均通過Dr.Wise科研平臺進(jìn)行。

四、統(tǒng)計學(xué)方法統(tǒng)計分析用SPSS20.0軟件。年齡、病變最大徑和平均CT值為連續(xù)變量,以±s或M(P25,P75)表示,ALK陽性組與陰性組間年齡比較采用獨立樣本t檢驗,病變最大徑及平均CT值的比較采用Mann-Whitney

U檢驗;性別為分類變量,采用卡方檢驗。在Dr.Wise科研平臺基于Scikit-learn軟件包(Version0.20.3)構(gòu)建logistic回歸模型。使用Matplotlib(Version3.1.0)繪制ROC曲線圖。使用MedCalc軟件(Version19.0.2)對模型的ROC曲線進(jìn)行DeLong檢驗,比較各模型間效能差異是否有統(tǒng)計學(xué)意義。P<0.05為差異有統(tǒng)計學(xué)意義。結(jié)果一、一般臨床資料及定量參數(shù)195例肺腺癌患者兩組間一般臨床資料及定量參數(shù)的比較見表1,性別及病變最大徑差異無統(tǒng)計學(xué)意義,年齡和平均CT值在兩組間差異具有統(tǒng)計學(xué)意義。

二、影像組學(xué)特征分析結(jié)果1232個影像組學(xué)特征全部聯(lián)合建模,特征選擇后模型共納入15個組學(xué)特征(表2),在訓(xùn)練集和驗證集的AUC分別是0.88(95%CI,0.83~0.92)和0.78(95%CI,0.71~0.83)(圖1),在驗證集中的準(zhǔn)確率為0.78。

圖1

驗證集中不同模型效能ROC。所有特征聯(lián)合建模、一階特征及灰度共生矩陣(GLCM)特征模型的ROC下面積分別為0.78、0.80和0.83根據(jù)圖像處理方式建模,基于原始CT圖像提取114個一階、形態(tài)及紋理特征,基于小波處理后圖像提取688個一階、形態(tài)及紋理特征,基于拉普拉斯高斯處理后圖像提取430個一階、形態(tài)及紋理特征,特征選擇后分別納入11個、7個和12個特征建模,在驗證集中的AUC分別為0.76(95%CI,0.70~0.82)、0.75(95%CI,0.69~0.81)和0.76(95%CI,0.69~0.82),略低于全部特征聯(lián)合模型的預(yù)測性能?;谌N不同圖像處理方式的特征模型分別與全部特征聯(lián)合模型的AUC相比均無統(tǒng)計學(xué)差異(DeLong檢驗,P>0.05)。根據(jù)一階特征、形態(tài)特征和紋理特征(包括GLCM、GLSZM、GLRLM和GLDM)3種特征類型分別建模,結(jié)果顯示一階特征和GLCM紋理特征模型預(yù)測ALK融合基因突變的能力最好,在驗證集的AUC分別為0.80(95%CI,0.74~0.85)和0.83(95%CI,0.77~0.88)(圖1),形態(tài)特征的AUC僅為0.6(95%CI,0.53~0.67);其他紋理特征的AUC均在0.75左右。GLCM特征模型的結(jié)果見表3。討論本研究ALK陽性組患者年齡明顯較ALK-組年輕(P=0.001),兩組間性別、病變大小差異無統(tǒng)計學(xué)意義,年齡、病變大小方面與既往研究相符,但Choi等[4]的研究認(rèn)為ALK陽性肺癌好發(fā)于男性患者,而本研究ALK陽性組女性相對更多見,但與ALK陰性組相比差異無統(tǒng)計學(xué)意義,關(guān)于性別好發(fā)情況有待后續(xù)進(jìn)一步大樣本報道。本研究ALK陽性組平均CT值明顯高于ALK陰性組,這與既往研究顯示ALK陽性腫瘤易呈實性密度的結(jié)論相符。既往研究旨在從臨床和影像角度篩選出對ALK治療敏感的突變?nèi)巳?,但大多?shù)影像學(xué)方面的研究是基于病變的常規(guī)定量或定性信息在實際操作中費(fèi)時費(fèi)力且易受醫(yī)師主觀判斷及臨床經(jīng)驗的影響,導(dǎo)致上述研究方法的應(yīng)用受到了限制。本研究聚焦于探索CT組學(xué)特征預(yù)測肺腺癌患者ALK基因突變的效能。我們基于不同圖像處理方式的3組特征模型在驗證集中的AUC(0.76、0.75、0.76)分別與全部特征模型的AUC(0.78)相比差異均無統(tǒng)計學(xué)意義,說明本研究的預(yù)測模型具有一定的魯棒性。本研究不同特征類型分別建模時,顯示形態(tài)特征模型在驗證集中的AUC僅為0.6,提示腫瘤形態(tài)特征預(yù)測ALK基因突變的能力較差。其發(fā)現(xiàn)ALK基因突變僅與胸腔積液和年齡因素相關(guān),兩者聯(lián)合預(yù)測ALK突變的AUC為0.65。一階特征在原始圖像中主要反映的是CT值信息,本研究中一階特征模型在驗證集中AUC達(dá)0.80,提示病變密度有助于鑒別ALK突變狀態(tài)。既往亦研究了CT影像組學(xué)預(yù)測ALK基因突變的價值,模型預(yù)測ALK融合基因陽性的敏感度、特異度、陽性和陰性預(yù)測值分別為0.73、0.70、0.71和0.69。本研究探索了不同組學(xué)特征模型的表現(xiàn),經(jīng)比較發(fā)現(xiàn)GLCM特征模型在預(yù)測肺腺癌ALK基因突變時效能最優(yōu),AUC高于研究,敏感度高于研究,特異性相近。與研究相比,本研究GLCM特征模型在驗證集中的AUC(0.83vs0.79)和敏感度(0.85vs0.74)更高,特異性稍低(0.69vs0.81)。本研究結(jié)果表明影像組學(xué)特征可有效預(yù)測肺腺癌的ALK基因表達(dá)。與研究相比,本研究采用了基于深度學(xué)習(xí)的病變自動檢測分割算法,該算法已由來自公共和內(nèi)部數(shù)據(jù)集的50000多份CT圖像進(jìn)行訓(xùn)練,可大大節(jié)省醫(yī)師勾畫病變VOI的時間,且結(jié)果的可重復(fù)性高;在提取組學(xué)特征前行圖像重采樣且使用小波或拉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論