




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基于LVQ神經(jīng)網(wǎng)絡(luò)的微鈣化分類(lèi)方法論文導(dǎo)讀::數(shù)字化的乳腺X光片仍然是乳腺癌檢測(cè)的可靠工具,X光片中出現(xiàn)的微鈣化點(diǎn)是癌癥的主要標(biāo)志。本文提出了一個(gè)基于自適應(yīng)的學(xué)習(xí)矢量量化神經(jīng)網(wǎng)路LVQ的乳腺癌良惡性分類(lèi)方法,該方法在提取特征向量的根底上對(duì)CC和MLO兩種視圖的良性和惡性數(shù)字化乳腺X光片圖像進(jìn)行訓(xùn)練和測(cè)試,分類(lèi)結(jié)果使用最正確分類(lèi)率和平均分類(lèi)率來(lái)說(shuō)明。實(shí)驗(yàn)結(jié)果說(shuō)明本文方法對(duì)CC視圖的圖象的平均測(cè)試分類(lèi)率為92.6%,而對(duì)MLO視圖是93.18%。在微鈣化分類(lèi)系統(tǒng)中采用邏輯或的方式用于合并兩種不同的視圖下的網(wǎng)絡(luò),合并后的網(wǎng)絡(luò)可以獲得的最正確分類(lèi)性能是94.8%。論文關(guān)鍵詞:微鈣化點(diǎn)良惡性分類(lèi),腫瘤模
2、式識(shí)別,學(xué)習(xí)矢量量化神經(jīng)網(wǎng)絡(luò),敏感度,特異度1 引言隨著早期檢測(cè)的重視,近年來(lái)乳腺癌的死亡率有降低的趨勢(shì),但僅是在歐美國(guó)家,比方美國(guó)癌癥協(xié)會(huì)ACS建議40-50歲之間的婦女每隔一年就做一次X光片的早期檢查,而對(duì)50歲以上的那么要求一年一次【1】。在過(guò)去的十年里中國(guó)的乳腺癌診斷病例以每年3%的比例在增長(zhǎng),這個(gè)比例已高于西方國(guó)家【2】,并且呈年輕化的趨勢(shì),這可能歸結(jié)于環(huán)境的變化、飲食結(jié)構(gòu)等改變。本文的主要工作是提出將微鈣化簇分類(lèi)為良性或惡性的分類(lèi)算法。分類(lèi)算法包括4個(gè)步驟:1從DDSM數(shù)據(jù)庫(kù)中獲取研究對(duì)象,并修改圖像格式和尺寸;2從數(shù)據(jù)庫(kù)相關(guān)說(shuō)明文件中提取病灶區(qū)域;3提取有效的特征向量;4對(duì)CC和
3、MLO兩種視圖的圖像使用LVQ神經(jīng)網(wǎng)絡(luò)分別訓(xùn)練和測(cè)試獲得最正確的分類(lèi)率;5使用邏輯或操作計(jì)算最后的分類(lèi)結(jié)果,即如果認(rèn)為任何一個(gè)視圖下的圖像是惡性的,那該病人的病灶性質(zhì)就是惡性的。2 圖像預(yù)處理及特征提取2.1 圖像數(shù)據(jù)庫(kù)和預(yù)處理本文采用的試驗(yàn)數(shù)據(jù)庫(kù)是南佛羅里達(dá)州立大學(xué)提供的乳腺癌診斷圖DDSM數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)可以在該大學(xué)的網(wǎng)站上免費(fèi)下載【3】,該數(shù)據(jù)庫(kù)中每個(gè)病人有四張圖像,分別是cc和mlo視圖下的左右乳腺組織圖像,所有的圖像都是使用LJPEG格式進(jìn)行壓縮,這樣保證了不喪失任何圖像細(xì)節(jié)敏感度,但因此圖像尺寸也非常大,而CAD系統(tǒng)要能快速檢測(cè)并具備高準(zhǔn)確度,對(duì)一個(gè)模式識(shí)別系統(tǒng)來(lái)說(shuō),低分辨率圖像是
4、高效和可行的【4】。所以,要對(duì)圖像的尺寸進(jìn)行修改,同時(shí)盡可能地保存圖像的細(xì)節(jié)。下面是圖像預(yù)處理的步驟:1先將LJPEG格式圖像進(jìn)行解壓縮,將DDSM中的LJPEG格式的圖像轉(zhuǎn)換成12位的TIFF格式的圖像,使得其可以在MATLAB中進(jìn)行后續(xù)處理【5】;2將它轉(zhuǎn)換成8位格式圖像;3人工去除黑色背景,提取乳腺區(qū)域;4選擇在使用雙線性插值算法進(jìn)行圖像映射,修改圖像尺寸為300*200像素,這樣在減小圖像的尺寸的同時(shí)防止圖像失真。 使用雙線性插值算法,修改圖像尺寸為300*200像素大小 圖1 圖像預(yù)處理與分割流程2.2 提取病灶區(qū)域DDSM數(shù)據(jù)庫(kù)的每個(gè)病人案例都附帶了相關(guān)信息,用于標(biāo)注可疑的病灶區(qū)域
5、,這些病灶區(qū)域的信息標(biāo)注是基于像素級(jí)的地表實(shí)況;,每個(gè)可疑區(qū)域的邊界通過(guò)在每個(gè)圖像案例中的.overlay文件中的聯(lián)結(jié)點(diǎn)值來(lái)標(biāo)注。使用這些邊界信息,就可以獲取了每個(gè)可疑區(qū)域的邊界坐標(biāo),從而提取出病灶區(qū)域。2.3 特征提取有效的特征提取可以大大簡(jiǎn)化分類(lèi)系統(tǒng)的設(shè)計(jì),好的特征的選取是處理過(guò)程中一個(gè)關(guān)鍵的步驟,因?yàn)榻酉聛?lái)的步驟只是關(guān)注這些特征并在這些特征上進(jìn)行運(yùn)算。我們采用統(tǒng)計(jì)學(xué)方法計(jì)算病灶區(qū)域的第一類(lèi)特征,即以下17個(gè)灰度特征:平均灰度、平均邊界灰度、平均強(qiáng)度、平均比照度、差分、能量、修正能量、熵、修正熵、標(biāo)準(zhǔn)差、修正標(biāo)準(zhǔn)差、傾斜、修正傾斜、微鈣化簇的半徑、團(tuán)簇中微鈣化的數(shù)目、團(tuán)簇中微鈣化的分布、團(tuán)
6、簇的面積。本文取的第二類(lèi)特征即四個(gè)bi-rads特征是密度,腫塊形狀、腫塊邊緣和異常風(fēng)險(xiǎn)評(píng)估。最后一個(gè)特征是病人的年齡特征。后面兩類(lèi)特征在數(shù)據(jù)庫(kù)說(shuō)明文件中都可以獲得具體的值論文開(kāi)題報(bào)告范例。這樣就組成了22維的特征向量,使用這些特征向量對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測(cè)試。3 LVQ神經(jīng)網(wǎng)絡(luò)的分類(lèi)算法本文在LVQ 改良算法的根底上采用自適應(yīng)學(xué)習(xí)速率調(diào)整的技術(shù),來(lái)提高競(jìng)爭(zhēng)神經(jīng)元的利用率、微鈣化識(shí)別率和縮短訓(xùn)練速度。基于LVQ神經(jīng)網(wǎng)絡(luò)方法的微鈣化分類(lèi)算法過(guò)程如圖2所示:圖2 基于LVQ神經(jīng)網(wǎng)絡(luò)方法的微鈣化分類(lèi)算法過(guò)程接下來(lái)在DDSM數(shù)據(jù)庫(kù)中選擇240個(gè)良惡性案例進(jìn)行訓(xùn)練和測(cè)試,先前面提到的算法將圖像預(yù)處理成3
7、00*200像素。假定LVQ網(wǎng)絡(luò)輸入層的輸入向量為,其中,M為輸入神經(jīng)元的數(shù)目;輸入層和競(jìng)爭(zhēng)層之間的連接權(quán)值矩陣為。中,i=1,2,P;j=1,2,,M表示輸入層第i個(gè)神經(jīng)元和第j個(gè)神經(jīng)元之間的連接權(quán)值,P為競(jìng)爭(zhēng)神經(jīng)元的數(shù)目,競(jìng)爭(zhēng)層的輸出向量為,競(jìng)爭(zhēng)層與輸出層神經(jīng)元之間的連接權(quán)值矩陣為,其中。中敏感度,k=1,2,N;r=1,2,p,表示競(jìng)爭(zhēng)層第k個(gè)神經(jīng)元與輸出層第r個(gè)神經(jīng)元之間的鏈接權(quán)值,N為輸出層神經(jīng)元的數(shù)目。競(jìng)爭(zhēng)層的每個(gè)神經(jīng)元通過(guò)學(xué)習(xí)原型向量,并對(duì)輸入空間進(jìn)行分類(lèi)。將競(jìng)爭(zhēng)層學(xué)習(xí)得到的類(lèi)稱(chēng)為子類(lèi),將輸出層學(xué)習(xí)得到的類(lèi)稱(chēng)為目標(biāo)類(lèi)【6】。LVQ學(xué)習(xí)算法步驟如下:第一步:設(shè)置變量和參量。1輸入向
8、量和目標(biāo)向量的設(shè)計(jì)。每幅圖像的原始尺寸為300*200,參與訓(xùn)練的有X=240幅圖像,提取的輸入特征向量是22個(gè)。240張腫瘤圖像分為2類(lèi)良性和惡性,所以目標(biāo)向量為240 x2的向量,其中每一列中只有一個(gè)1;,其余均為0;。為輸入向量,或稱(chēng)訓(xùn)練樣本。2設(shè)置權(quán)值向量和學(xué)習(xí)速率。為權(quán)值向量,i=1,2,M。t為迭代次數(shù),T為迭代總次數(shù),N是輸入層節(jié)點(diǎn)數(shù),M是輸出層節(jié)點(diǎn)數(shù)。選擇學(xué)習(xí)速率的函數(shù)。第二步:初始化權(quán)值向量及學(xué)習(xí)速率。在初始狀態(tài)下,所有神經(jīng)元都擁有相同的權(quán)值,即為這些向量的中間值。學(xué)習(xí)速率反映了學(xué)習(xí)過(guò)程中連接權(quán)調(diào)整量的大小,初值設(shè)為0. 1,閾值。第三步:輸入訓(xùn)練樣本,計(jì)算輸入向量與權(quán)值向量
9、之間的距離,找到與輸入向量距離最小的權(quán)值向量,這里使用歐氏距離最小的標(biāo)準(zhǔn),如公式1,從而尋找獲勝神經(jīng)元c,從而實(shí)現(xiàn)了神經(jīng)元的競(jìng)爭(zhēng)過(guò)程。, i=1,2,M(1)第四步:期望誤差的選取和網(wǎng)絡(luò)結(jié)構(gòu)確實(shí)定。期望誤差初始值設(shè)為0.1,學(xué)習(xí)函數(shù)用LVQ1,最大訓(xùn)練步數(shù)設(shè)為1000,開(kāi)始對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。訓(xùn)練經(jīng)過(guò)20次迭代就可到達(dá)誤差要求,為了進(jìn)一步降低訓(xùn)練誤差,要通過(guò)增加隱含層的節(jié)點(diǎn),以及訓(xùn)練時(shí)間來(lái)獲得。訓(xùn)練好的網(wǎng)絡(luò)在選定的圖像集選取良惡性圖像各50張,總共100張上測(cè)試的結(jié)果是:當(dāng)競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)小于10時(shí)敏感度,不能進(jìn)行有效分類(lèi);當(dāng)競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)為10-20時(shí),分類(lèi)率為80-86%左右;當(dāng)競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)為20-
10、30時(shí),分類(lèi)率為90%左右。競(jìng)爭(zhēng)層節(jié)點(diǎn)數(shù)再增加,對(duì)識(shí)別結(jié)果影響不大。所以,根據(jù)實(shí)驗(yàn)結(jié)果,我們采用隱藏層節(jié)點(diǎn)數(shù)為30的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行最終的測(cè)試和分類(lèi)。第五步:判斷分類(lèi)是否正確,根據(jù)如下規(guī)那么調(diào)整獲勝神經(jīng)元的權(quán)值向量:如果,那么(2)否那么,當(dāng),有(3)對(duì)于其他神經(jīng)元,保持權(quán)值不變論文開(kāi)題報(bào)告范例。第六步:調(diào)整學(xué)習(xí)速率,LVQ 算法中學(xué)習(xí)速率是個(gè)很重要的參數(shù),它影響算法的穩(wěn)定性和權(quán)值收斂的速度,是LVQ 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中需要重點(diǎn)考慮的參數(shù)。在定義學(xué)習(xí)速率的時(shí)候要貫徹快速穩(wěn)定的原那么,這里我們采用自適應(yīng)學(xué)習(xí)速率定義方法:一般來(lái)說(shuō),學(xué)習(xí)速率的選擇需要考慮的是,在迭代的初始時(shí)刻選擇較大的值,然后,隨著迭
11、代的進(jìn)行,線性或非線性地降到0。在初始階段,通常取較大的值,表示算法迅速修正較大的誤分類(lèi)權(quán)值,隨著時(shí)間的進(jìn)行,越來(lái)越小,說(shuō)明使用較小的學(xué)習(xí)系數(shù)(緩慢的自適應(yīng))來(lái)修正較小的誤分類(lèi)權(quán)值,以至在學(xué)習(xí)完成后,誤分類(lèi)的樣本數(shù)得到最少。使用自適應(yīng)學(xué)習(xí)速率,神經(jīng)網(wǎng)絡(luò)的權(quán)值在剛開(kāi)始快些收斂,結(jié)束時(shí)保證權(quán)值相對(duì)穩(wěn)定,因此它比定學(xué)習(xí)速率有較快的收斂速率和更高的穩(wěn)定性。第七步:判斷迭代次數(shù)是否超過(guò)T,如果就轉(zhuǎn)到第三步,否那么就結(jié)束迭代過(guò)程。對(duì)40張cc和mlo視圖上的圖像其中CC和MLO視圖上的圖像各20張敏感度,包括10張惡性,10張良性,并且左右視圖各對(duì)半即5張進(jìn)行訓(xùn)練,獲得了最正確的學(xué)習(xí)模式。對(duì)另外200個(gè)案
12、例良惡性各100張,對(duì)不同兩種視圖分開(kāi)來(lái)進(jìn)行良惡性組織的分類(lèi)的測(cè)試。為了降低漏掉真陽(yáng)性案例的可能性,對(duì)兩種視圖下的神經(jīng)網(wǎng)絡(luò)分類(lèi)效果使用邏輯或的方式進(jìn)行處理,就是如果任何一種視圖cc或mlo網(wǎng)絡(luò)分類(lèi)器將圖像病灶分類(lèi)成是惡性的,那么就認(rèn)為該病例是惡性的,否那么,就認(rèn)為是正?;蛄夹缘膱D像。4 實(shí)驗(yàn)結(jié)果使用MATLAB進(jìn)行仿真計(jì)算,實(shí)驗(yàn)結(jié)果說(shuō)明完成的測(cè)試集在cc和mlo視圖上各自平均分類(lèi)性能是92.6%和93.18%。整合的系統(tǒng)的平均分類(lèi)性能略微的降低到91.84%如表1,而最正確分類(lèi)性能是94.8%。表1 240個(gè)DDSM案例的神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測(cè)試結(jié)果 CC視圖 MLO視圖 整合兩個(gè)視圖的網(wǎng)絡(luò) 訓(xùn)練圖
13、像數(shù)=20 訓(xùn)練圖像數(shù)=100 訓(xùn)練圖像數(shù)=20 訓(xùn)練圖像數(shù)=100 訓(xùn)練圖像數(shù)=40 訓(xùn)練圖像數(shù)=100 測(cè)試圖像數(shù)=100 測(cè)試圖像數(shù)=20 測(cè)試圖像數(shù)=100 測(cè)試圖像數(shù)=20 測(cè)試圖像數(shù)=200 測(cè)試圖像數(shù)=20 訓(xùn)練集的分類(lèi)率 最正確分類(lèi)率 100 100 100 100 平均分類(lèi)率 97.13 98.63 95.8 96.68 標(biāo)準(zhǔn)偏差 1.93 1.36 3.42 2.60 測(cè)試集的分類(lèi)率 最正確分類(lèi)率 93 100 94 100 94.8 100 平均分類(lèi)率 92.6 92.38 93.18 94.75 91.84 93.75 標(biāo)準(zhǔn)偏差 0.46 2.16 0.447 1.82
14、 1.3865 2.1826 4 結(jié)束語(yǔ)本文提出了一個(gè)學(xué)習(xí)向量量化神經(jīng)網(wǎng)絡(luò)整合系統(tǒng)用于區(qū)分乳腺癌的良惡性病灶的方法。整合的神經(jīng)網(wǎng)絡(luò)擁有更強(qiáng)的學(xué)習(xí)技能,可以改善神經(jīng)系統(tǒng)學(xué)習(xí)的泛化能力。本文整合的神經(jīng)網(wǎng)絡(luò)分類(lèi)系統(tǒng)使用了低分辨率的圖像,微鈣化使用自適應(yīng)的學(xué)習(xí)向量量化網(wǎng)絡(luò)提取,這個(gè)網(wǎng)絡(luò)在cc和mlo視圖下使用良性和惡性的圖像進(jìn)行訓(xùn)練,整合的系統(tǒng)完成的最正確分類(lèi)性能是94.8%。盡管如此,但整合后的系統(tǒng)的平均分類(lèi)率有所下降,這是以后需要研究和改良的方向。參考文獻(xiàn)【1】McLelland, R.Screening for breast cancer: opportunities, status and c
15、hallenges. In: Brunner,S., Langfeldt, B. (eds.) Advances in Breast Cancer Detection: Recent Results inCancer Research, vol. 119, Springer, pp 29-38, 1990.【2】Li, S. L. Oncology of breast. Beijing: Science Technique LiteraturePublishing House, 2000. pp 210, 218-220.【5】Khuwaja, G. A. An adaptive combined c
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川航天職業(yè)技術(shù)學(xué)院《食用菌學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 山西能源學(xué)院《環(huán)境經(jīng)營(yíng)學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北機(jī)電職業(yè)技術(shù)學(xué)院《跨境電商概論》2023-2024學(xué)年第二學(xué)期期末試卷
- 深圳職業(yè)技術(shù)大學(xué)《能源動(dòng)力測(cè)試技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 天津工程職業(yè)技術(shù)學(xué)院《工程光學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 南昌大學(xué)《稻谷加工工藝學(xué)實(shí)驗(yàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 《8 二十四節(jié)氣》(教學(xué)設(shè)計(jì))-2023-2024學(xué)年六年級(jí)下冊(cè)綜合實(shí)踐活動(dòng)長(zhǎng)春版
- 淮陰工學(xué)院《機(jī)械學(xué)科概論》2023-2024學(xué)年第二學(xué)期期末試卷
- 重慶對(duì)外經(jīng)貿(mào)學(xué)院《電路分析理論》2023-2024學(xué)年第二學(xué)期期末試卷
- Unit 2 Preparing for the topic-pronunciation 教學(xué)設(shè)計(jì) 2024-2025學(xué)年仁愛(ài)科普版(2024)七年級(jí)英語(yǔ)上冊(cè)
- 高中轉(zhuǎn)學(xué)申請(qǐng)書(shū)
- 2025年中國(guó)建材集團(tuán)所屬中建材聯(lián)合投資有限公司招聘筆試參考題庫(kù)附帶答案詳解
- 2025年企業(yè)合伙聯(lián)營(yíng)框架協(xié)議模板(2篇)
- 中國(guó)電信行業(yè)人工智能行業(yè)市場(chǎng)調(diào)研及投資規(guī)劃建議報(bào)告
- 水幕噴淋系統(tǒng)的工作原理與應(yīng)用
- 門(mén)樓施工方案
- 2024年山東海洋集團(tuán)有限公司社會(huì)招聘考試真題
- 小學(xué)生拗九節(jié)課件
- 《感冒中醫(yī)治療》課件
- 研發(fā)費(fèi)用管理制度內(nèi)容
- 壓力容器設(shè)計(jì)委托書(shū)
評(píng)論
0/150
提交評(píng)論