基于LVQ神經(jīng)網(wǎng)絡(luò)的微鈣化分類方法

上傳人：冷*** IP屬地：上海上傳時(shí)間：2022-08-16 格式：DOC 頁數(shù)：12 大?。?6.09KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩7頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于LVQ神經(jīng)網(wǎng)絡(luò)的微鈣化分類方法論文導(dǎo)讀:：數(shù)字化的乳腺X光片仍然是乳腺癌檢測的可靠工具，X光片中出現(xiàn)的微鈣化點(diǎn)是癌癥的主要標(biāo)志。本文提出了一個(gè)基于自適應(yīng)的學(xué)習(xí)矢量量化神經(jīng)網(wǎng)路LVQ的乳腺癌良惡性分類方法，該方法在提取特征向量的根底上對(duì)CC和MLO兩種視圖的良性和惡性數(shù)字化乳腺X光片圖像進(jìn)行訓(xùn)練和測試，分類結(jié)果使用最正確分類率和平均分類率來說明。實(shí)驗(yàn)結(jié)果說明本文方法對(duì)CC視圖的圖象的平均測試分類率為92.6%，而對(duì)MLO視圖是93.18%。在微鈣化分類系統(tǒng)中采用邏輯或的方式用于合并兩種不同的視圖下的網(wǎng)絡(luò)，合并后的網(wǎng)絡(luò)可以獲得的最正確分類性能是94.8%。論文關(guān)鍵詞：微鈣化點(diǎn)良惡性分類，腫瘤模

2、式識(shí)別，學(xué)習(xí)矢量量化神經(jīng)網(wǎng)絡(luò)，敏感度，特異度1 引言隨著早期檢測的重視，近年來乳腺癌的死亡率有降低的趨勢，但僅是在歐美國家，比方美國癌癥協(xié)會(huì)ACS建議40-50歲之間的婦女每隔一年就做一次X光片的早期檢查，而對(duì)50歲以上的那么要求一年一次【1】。在過去的十年里中國的乳腺癌診斷病例以每年3%的比例在增長，這個(gè)比例已高于西方國家【2】，并且呈年輕化的趨勢，這可能歸結(jié)于環(huán)境的變化、飲食結(jié)構(gòu)等改變。本文的主要工作是提出將微鈣化簇分類為良性或惡性的分類算法。分類算法包括4個(gè)步驟：1從DDSM數(shù)據(jù)庫中獲取研究對(duì)象，并修改圖像格式和尺寸；2從數(shù)據(jù)庫相關(guān)說明文件中提取病灶區(qū)域；3提取有效的特征向量；4對(duì)CC和

3、MLO兩種視圖的圖像使用LVQ神經(jīng)網(wǎng)絡(luò)分別訓(xùn)練和測試獲得最正確的分類率；5使用邏輯或操作計(jì)算最后的分類結(jié)果，即如果認(rèn)為任何一個(gè)視圖下的圖像是惡性的，那該病人的病灶性質(zhì)就是惡性的。2 圖像預(yù)處理及特征提取2.1 圖像數(shù)據(jù)庫和預(yù)處理本文采用的試驗(yàn)數(shù)據(jù)庫是南佛羅里達(dá)州立大學(xué)提供的乳腺癌診斷圖DDSM數(shù)據(jù)庫，該數(shù)據(jù)庫可以在該大學(xué)的網(wǎng)站上免費(fèi)下載【3】，該數(shù)據(jù)庫中每個(gè)病人有四張圖像，分別是cc和mlo視圖下的左右乳腺組織圖像，所有的圖像都是使用LJPEG格式進(jìn)行壓縮，這樣保證了不喪失任何圖像細(xì)節(jié)敏感度，但因此圖像尺寸也非常大，而CAD系統(tǒng)要能快速檢測并具備高準(zhǔn)確度，對(duì)一個(gè)模式識(shí)別系統(tǒng)來說，低分辨率圖像是

4、高效和可行的【4】。所以，要對(duì)圖像的尺寸進(jìn)行修改，同時(shí)盡可能地保存圖像的細(xì)節(jié)。下面是圖像預(yù)處理的步驟：1先將LJPEG格式圖像進(jìn)行解壓縮，將DDSM中的LJPEG格式的圖像轉(zhuǎn)換成12位的TIFF格式的圖像，使得其可以在MATLAB中進(jìn)行后續(xù)處理【5】；2將它轉(zhuǎn)換成8位格式圖像；3人工去除黑色背景，提取乳腺區(qū)域；4選擇在使用雙線性插值算法進(jìn)行圖像映射，修改圖像尺寸為300*200像素，這樣在減小圖像的尺寸的同時(shí)防止圖像失真。使用雙線性插值算法，修改圖像尺寸為300*200像素大小圖1 圖像預(yù)處理與分割流程2.2 提取病灶區(qū)域DDSM數(shù)據(jù)庫的每個(gè)病人案例都附帶了相關(guān)信息，用于標(biāo)注可疑的病灶區(qū)域

5、，這些病灶區(qū)域的信息標(biāo)注是基于像素級(jí)的地表實(shí)況;，每個(gè)可疑區(qū)域的邊界通過在每個(gè)圖像案例中的.overlay文件中的聯(lián)結(jié)點(diǎn)值來標(biāo)注。使用這些邊界信息，就可以獲取了每個(gè)可疑區(qū)域的邊界坐標(biāo)，從而提取出病灶區(qū)域。2.3 特征提取有效的特征提取可以大大簡化分類系統(tǒng)的設(shè)計(jì)，好的特征的選取是處理過程中一個(gè)關(guān)鍵的步驟，因?yàn)榻酉聛淼牟襟E只是關(guān)注這些特征并在這些特征上進(jìn)行運(yùn)算。我們采用統(tǒng)計(jì)學(xué)方法計(jì)算病灶區(qū)域的第一類特征，即以下17個(gè)灰度特征：平均灰度、平均邊界灰度、平均強(qiáng)度、平均比照度、差分、能量、修正能量、熵、修正熵、標(biāo)準(zhǔn)差、修正標(biāo)準(zhǔn)差、傾斜、修正傾斜、微鈣化簇的半徑、團(tuán)簇中微鈣化的數(shù)目、團(tuán)簇中微鈣化的分布、團(tuán)

6、簇的面積。本文取的第二類特征即四個(gè)bi-rads特征是密度，腫塊形狀、腫塊邊緣和異常風(fēng)險(xiǎn)評(píng)估。最后一個(gè)特征是病人的年齡特征。后面兩類特征在數(shù)據(jù)庫說明文件中都可以獲得具體的值論文開題報(bào)告范例。這樣就組成了22維的特征向量，使用這些特征向量對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試。3 LVQ神經(jīng)網(wǎng)絡(luò)的分類算法本文在LVQ 改良算法的根底上采用自適應(yīng)學(xué)習(xí)速率調(diào)整的技術(shù)，來提高競爭神經(jīng)元的利用率、微鈣化識(shí)別率和縮短訓(xùn)練速度?；贚VQ神經(jīng)網(wǎng)絡(luò)方法的微鈣化分類算法過程如圖2所示：圖2 基于LVQ神經(jīng)網(wǎng)絡(luò)方法的微鈣化分類算法過程接下來在DDSM數(shù)據(jù)庫中選擇240個(gè)良惡性案例進(jìn)行訓(xùn)練和測試，先前面提到的算法將圖像預(yù)處理成3

7、00*200像素。假定LVQ網(wǎng)絡(luò)輸入層的輸入向量為，其中，M為輸入神經(jīng)元的數(shù)目；輸入層和競爭層之間的連接權(quán)值矩陣為。中，i=1,2,P;j=1,2,，M表示輸入層第i個(gè)神經(jīng)元和第j個(gè)神經(jīng)元之間的連接權(quán)值，P為競爭神經(jīng)元的數(shù)目，競爭層的輸出向量為，競爭層與輸出層神經(jīng)元之間的連接權(quán)值矩陣為，其中。中敏感度，k=1,2,N；r=1,2,p,表示競爭層第k個(gè)神經(jīng)元與輸出層第r個(gè)神經(jīng)元之間的鏈接權(quán)值，N為輸出層神經(jīng)元的數(shù)目。競爭層的每個(gè)神經(jīng)元通過學(xué)習(xí)原型向量，并對(duì)輸入空間進(jìn)行分類。將競爭層學(xué)習(xí)得到的類稱為子類，將輸出層學(xué)習(xí)得到的類稱為目標(biāo)類【6】。LVQ學(xué)習(xí)算法步驟如下：第一步：設(shè)置變量和參量。1輸入向

8、量和目標(biāo)向量的設(shè)計(jì)。每幅圖像的原始尺寸為300*200，參與訓(xùn)練的有X=240幅圖像，提取的輸入特征向量是22個(gè)。240張腫瘤圖像分為2類良性和惡性，所以目標(biāo)向量為240 x2的向量,其中每一列中只有一個(gè)1;,其余均為0;。為輸入向量，或稱訓(xùn)練樣本。2設(shè)置權(quán)值向量和學(xué)習(xí)速率。為權(quán)值向量，i=1，2，M。t為迭代次數(shù)，T為迭代總次數(shù)，N是輸入層節(jié)點(diǎn)數(shù)，M是輸出層節(jié)點(diǎn)數(shù)。選擇學(xué)習(xí)速率的函數(shù)。第二步：初始化權(quán)值向量及學(xué)習(xí)速率。在初始狀態(tài)下，所有神經(jīng)元都擁有相同的權(quán)值，即為這些向量的中間值。學(xué)習(xí)速率反映了學(xué)習(xí)過程中連接權(quán)調(diào)整量的大小，初值設(shè)為0. 1，閾值。第三步：輸入訓(xùn)練樣本，計(jì)算輸入向量與權(quán)值向量

9、之間的距離，找到與輸入向量距離最小的權(quán)值向量，這里使用歐氏距離最小的標(biāo)準(zhǔn)，如公式1，從而尋找獲勝神經(jīng)元c，從而實(shí)現(xiàn)了神經(jīng)元的競爭過程。, i=1,2,M(1)第四步：期望誤差的選取和網(wǎng)絡(luò)結(jié)構(gòu)確實(shí)定。期望誤差初始值設(shè)為0.1，學(xué)習(xí)函數(shù)用LVQ1，最大訓(xùn)練步數(shù)設(shè)為1000，開始對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。訓(xùn)練經(jīng)過20次迭代就可到達(dá)誤差要求，為了進(jìn)一步降低訓(xùn)練誤差，要通過增加隱含層的節(jié)點(diǎn)，以及訓(xùn)練時(shí)間來獲得。訓(xùn)練好的網(wǎng)絡(luò)在選定的圖像集選取良惡性圖像各50張，總共100張上測試的結(jié)果是：當(dāng)競爭層節(jié)點(diǎn)數(shù)小于10時(shí)敏感度，不能進(jìn)行有效分類；當(dāng)競爭層節(jié)點(diǎn)數(shù)為10-20時(shí)，分類率為80-86%左右；當(dāng)競爭層節(jié)點(diǎn)數(shù)為20-

10、30時(shí)，分類率為90%左右。競爭層節(jié)點(diǎn)數(shù)再增加，對(duì)識(shí)別結(jié)果影響不大。所以，根據(jù)實(shí)驗(yàn)結(jié)果，我們采用隱藏層節(jié)點(diǎn)數(shù)為30的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行最終的測試和分類。第五步：判斷分類是否正確，根據(jù)如下規(guī)那么調(diào)整獲勝神經(jīng)元的權(quán)值向量：如果，那么(2)否那么，當(dāng)，有(3)對(duì)于其他神經(jīng)元，保持權(quán)值不變論文開題報(bào)告范例。第六步：調(diào)整學(xué)習(xí)速率，LVQ 算法中學(xué)習(xí)速率是個(gè)很重要的參數(shù)，它影響算法的穩(wěn)定性和權(quán)值收斂的速度，是LVQ 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中需要重點(diǎn)考慮的參數(shù)。在定義學(xué)習(xí)速率的時(shí)候要貫徹快速穩(wěn)定的原那么，這里我們采用自適應(yīng)學(xué)習(xí)速率定義方法：一般來說，學(xué)習(xí)速率的選擇需要考慮的是，在迭代的初始時(shí)刻選擇較大的值，然后，隨著迭

11、代的進(jìn)行，線性或非線性地降到0。在初始階段，通常取較大的值，表示算法迅速修正較大的誤分類權(quán)值，隨著時(shí)間的進(jìn)行，越來越小，說明使用較小的學(xué)習(xí)系數(shù)(緩慢的自適應(yīng))來修正較小的誤分類權(quán)值，以至在學(xué)習(xí)完成后，誤分類的樣本數(shù)得到最少。使用自適應(yīng)學(xué)習(xí)速率，神經(jīng)網(wǎng)絡(luò)的權(quán)值在剛開始快些收斂，結(jié)束時(shí)保證權(quán)值相對(duì)穩(wěn)定，因此它比定學(xué)習(xí)速率有較快的收斂速率和更高的穩(wěn)定性。第七步：判斷迭代次數(shù)是否超過T，如果就轉(zhuǎn)到第三步，否那么就結(jié)束迭代過程。對(duì)40張cc和mlo視圖上的圖像其中CC和MLO視圖上的圖像各20張敏感度，包括10張惡性，10張良性，并且左右視圖各對(duì)半即5張進(jìn)行訓(xùn)練，獲得了最正確的學(xué)習(xí)模式。對(duì)另外200個(gè)案

12、例良惡性各100張，對(duì)不同兩種視圖分開來進(jìn)行良惡性組織的分類的測試。為了降低漏掉真陽性案例的可能性，對(duì)兩種視圖下的神經(jīng)網(wǎng)絡(luò)分類效果使用邏輯或的方式進(jìn)行處理，就是如果任何一種視圖cc或mlo網(wǎng)絡(luò)分類器將圖像病灶分類成是惡性的，那么就認(rèn)為該病例是惡性的，否那么，就認(rèn)為是正?；蛄夹缘膱D像。4 實(shí)驗(yàn)結(jié)果使用MATLAB進(jìn)行仿真計(jì)算，實(shí)驗(yàn)結(jié)果說明完成的測試集在cc和mlo視圖上各自平均分類性能是92.6%和93.18%。整合的系統(tǒng)的平均分類性能略微的降低到91.84%如表1，而最正確分類性能是94.8%。表1 240個(gè)DDSM案例的神經(jīng)網(wǎng)絡(luò)訓(xùn)練和測試結(jié)果 CC視圖 MLO視圖整合兩個(gè)視圖的網(wǎng)絡(luò) 訓(xùn)練圖

13、像數(shù)=20 訓(xùn)練圖像數(shù)=100 訓(xùn)練圖像數(shù)=20 訓(xùn)練圖像數(shù)=100 訓(xùn)練圖像數(shù)=40 訓(xùn)練圖像數(shù)=100 測試圖像數(shù)=100 測試圖像數(shù)=20 測試圖像數(shù)=100 測試圖像數(shù)=20 測試圖像數(shù)=200 測試圖像數(shù)=20 訓(xùn)練集的分類率最正確分類率 100 100 100 100 平均分類率 97.13 98.63 95.8 96.68 標(biāo)準(zhǔn)偏差 1.93 1.36 3.42 2.60 測試集的分類率最正確分類率 93 100 94 100 94.8 100 平均分類率 92.6 92.38 93.18 94.75 91.84 93.75 標(biāo)準(zhǔn)偏差 0.46 2.16 0.447 1.82

14、 1.3865 2.1826 4 結(jié)束語本文提出了一個(gè)學(xué)習(xí)向量量化神經(jīng)網(wǎng)絡(luò)整合系統(tǒng)用于區(qū)分乳腺癌的良惡性病灶的方法。整合的神經(jīng)網(wǎng)絡(luò)擁有更強(qiáng)的學(xué)習(xí)技能，可以改善神經(jīng)系統(tǒng)學(xué)習(xí)的泛化能力。本文整合的神經(jīng)網(wǎng)絡(luò)分類系統(tǒng)使用了低分辨率的圖像，微鈣化使用自適應(yīng)的學(xué)習(xí)向量量化網(wǎng)絡(luò)提取，這個(gè)網(wǎng)絡(luò)在cc和mlo視圖下使用良性和惡性的圖像進(jìn)行訓(xùn)練，整合的系統(tǒng)完成的最正確分類性能是94.8%。盡管如此，但整合后的系統(tǒng)的平均分類率有所下降，這是以后需要研究和改良的方向。參考文獻(xiàn)【1】McLelland, R.Screening for breast cancer: opportunities, status and c

15、hallenges. In: Brunner,S., Langfeldt, B. (eds.) Advances in Breast Cancer Detection: Recent Results inCancer Research, vol. 119, Springer, pp 29-38, 1990.【2】Li, S. L. Oncology of breast. Beijing: Science Technique LiteraturePublishing House, 2000. pp 210, 218-220.【5】Khuwaja, G. A. An adaptive combined c

人人文庫> 全部分類> 教育資料 > 畢業(yè)論文

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于LVQ神經(jīng)網(wǎng)絡(luò)的微鈣化分類方法

文檔簡介

溫馨提示

最新文檔

評(píng)論

基于LVQ神經(jīng)網(wǎng)絡(luò)的微鈣化分類方法

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔