基于深度學(xué)習(xí)的低劑量CT去噪后處理算法研究_第1頁(yè)
基于深度學(xué)習(xí)的低劑量CT去噪后處理算法研究_第2頁(yè)
基于深度學(xué)習(xí)的低劑量CT去噪后處理算法研究_第3頁(yè)
基于深度學(xué)習(xí)的低劑量CT去噪后處理算法研究_第4頁(yè)
基于深度學(xué)習(xí)的低劑量CT去噪后處理算法研究_第5頁(yè)
已閱讀5頁(yè),還剩66頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目錄摘要21引言51.1 課題背景和意義51.2 CT成像基本原理61.3 國(guó)內(nèi)外研究現(xiàn)狀及趨勢(shì)101.4論文主要研究?jī)?nèi)容及結(jié)構(gòu)安排122 與研究相關(guān)卷積神經(jīng)網(wǎng)絡(luò)概要142.1 與研究相關(guān)深度學(xué)習(xí)卷積神經(jīng)概要142.1.1 卷積層142.1.2 反卷積162.1.3 激活層172.1.5 全連接層182.1.4 池化層182.1.6 損失函數(shù)192.1.7 優(yōu)化算法202.2 相關(guān)卷積神經(jīng)網(wǎng)絡(luò)接結(jié)構(gòu)闡述202.2.1 VGG202.2.2 ResNet212.2.3 Inception模型222.2.4 生成對(duì)抗網(wǎng)絡(luò)222.3 圖像質(zhì)量定量評(píng)價(jià)參數(shù)243 基于卷積神經(jīng)網(wǎng)絡(luò)的低劑量CT鈣化點(diǎn)去噪

2、研究253.1 殘差編碼解碼低劑量CT去噪結(jié)構(gòu)263.1.1 去噪模型263.1.2 去噪網(wǎng)絡(luò)結(jié)構(gòu)273.2 頭部數(shù)據(jù)集283.2.1 數(shù)據(jù)集介紹及處理284.2.2 鈣化點(diǎn)數(shù)據(jù)分析294.2.3 網(wǎng)絡(luò)設(shè)計(jì)324.2.4 損失函數(shù)設(shè)計(jì)333.3 網(wǎng)絡(luò)訓(xùn)練383.3.1 訓(xùn)練參數(shù)384.3.2 訓(xùn)練環(huán)境383.4 實(shí)驗(yàn)結(jié)果及分析383.4.1 數(shù)據(jù)處理方案效果對(duì)比383.4.2 實(shí)驗(yàn)結(jié)果393.5 本章小結(jié)414 基于生成對(duì)抗網(wǎng)絡(luò)的非監(jiān)督低劑量CT去噪算法研究424.1 CycleGAN生成對(duì)抗網(wǎng)絡(luò)框架介紹434.2 基于深度學(xué)習(xí)的非監(jiān)督低劑量CT去噪網(wǎng)絡(luò)研究444.2.1 生成器設(shè)計(jì)454.2

3、.2 判別器結(jié)構(gòu)494.2.3 損失函數(shù)調(diào)整514.3 訓(xùn)練數(shù)據(jù)集534.3.1 胸腹部臨床數(shù)據(jù)534.3.2 MAYO公開(kāi)集數(shù)據(jù)544.3.3 數(shù)據(jù)處理554.4 網(wǎng)絡(luò)訓(xùn)練與實(shí)驗(yàn)結(jié)果554.4.1 訓(xùn)練參數(shù)說(shuō)明554.4.2 實(shí)驗(yàn)結(jié)果565.5 本章總結(jié)616 全文總結(jié)及展望616.1 全文總結(jié)616.2 展望62參考文獻(xiàn)62摘要1895年德國(guó)物理學(xué)家倫琴W.K.發(fā)現(xiàn)X射線(xiàn)(又稱(chēng)倫琴射線(xiàn)),X射線(xiàn)發(fā)明后英國(guó)電子工程師亨斯菲爾德(Hounsfield)于1967年成功制作了第一臺(tái)CT機(jī)器。X射線(xiàn)計(jì)算機(jī)斷層掃描(Computed Tomography,CT)以?huà)呙钑r(shí)間快、成像清晰等特點(diǎn)在醫(yī)學(xué)臨床

4、診斷方面廣泛應(yīng)用。CT對(duì)人體進(jìn)行拍攝時(shí)所用的X射線(xiàn)產(chǎn)生的輻射會(huì)對(duì)人體造成傷害,近年來(lái)CT輻射問(wèn)題受到人們?cè)絹?lái)越多的重視。人們用低劑量CT掃描方法來(lái)降低輻射減少對(duì)人體產(chǎn)生的危害,但是低劑量CT圖像會(huì)產(chǎn)生噪聲等導(dǎo)致CT圖像質(zhì)量下降,直接影響醫(yī)生對(duì)病人的病情診斷。為了提高低劑量CT圖像質(zhì)量,本文基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)方法對(duì)低劑量CT去噪圖像后處理方法進(jìn)行研究。針對(duì)目前基于深度學(xué)習(xí)低劑量CT去噪方法中存在的問(wèn)題,從兩個(gè)方面進(jìn)行改進(jìn)。主要工作如下:(1) 針對(duì)存在鈣化點(diǎn)的低劑量CT數(shù)據(jù)提出了一種可以保留鈣化點(diǎn)的低劑量CT卷積神經(jīng)網(wǎng)絡(luò)去噪方法。由于CT圖像中鈣化點(diǎn)一般較小且含鈣化點(diǎn)的數(shù)據(jù)較少,一般的卷積

5、神經(jīng)網(wǎng)絡(luò)會(huì)將較小的鈣化點(diǎn)當(dāng)作噪聲點(diǎn)去掉。研究首先設(shè)計(jì)一種鈣化點(diǎn)添加方法,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理。然后設(shè)計(jì)出滿(mǎn)足要求的低劑量CT去噪網(wǎng)絡(luò)。最后設(shè)計(jì)兩種不同的損失函數(shù),卷積神經(jīng)網(wǎng)絡(luò)采用這兩種損失函數(shù)分兩步相繼訓(xùn)練。通過(guò)與目前常用方法進(jìn)行對(duì)比研究,證明提出的方法可以保留“鈣化點(diǎn)”的基礎(chǔ)上完成了低劑量CT去噪。(2) 提出了一種可以利用結(jié)構(gòu)不同的非對(duì)齊低劑量CT和標(biāo)準(zhǔn)劑量CT圖像進(jìn)行無(wú)監(jiān)督訓(xùn)練的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)。目前大多基于深度學(xué)習(xí)的低劑量CT去噪算法需要大量結(jié)構(gòu)相同的(對(duì)齊)低劑量CT圖像和標(biāo)準(zhǔn)劑量CT圖像進(jìn)行訓(xùn)練。人體胸腹部等非剛性部位獲得對(duì)齊數(shù)據(jù)比較困難,限制了基于深度學(xué)習(xí)的低劑量CT去噪算法

6、的應(yīng)用范圍。本文通過(guò)CycleGAN生成對(duì)抗網(wǎng)絡(luò)框架,設(shè)計(jì)高效生成器和判別器,利用非對(duì)齊CT數(shù)據(jù)進(jìn)行訓(xùn)練并得到了良好效果。拓寬了深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)低劑量CT去噪的范圍。關(guān)鍵詞:低劑量CT 卷積神經(jīng)網(wǎng)絡(luò) 去噪 鈣化點(diǎn) 非對(duì)齊AbstractIn 1895, German physicist W.K. roentgen discovered x-ray (also known as roentgen ray). After the invention of X-ray, Hounsfield, the British electronic engineer, successfully made

7、the first CT machine in 1967. X-ray computed tomography (CT) is widely used in clinical diagnosis because of its fast scanning time and clear imaging. In recent years, more and more attention has been paid to the problem of CT radiation. People use low-dose CT scan to reduce the harm of radiation to

8、 human body, but low-dose CT image will produce noise, which will lead to the decline of CT image quality, low-quality CT image will affect the doctors diagnosis of the disease.In order to improve the image quality of low-dose CT, this paper studies the image post-processing method of low-dose CT de

9、noising based on deep learning convolution neural network. In view of the existing problems in the denoising method of low dose CT based on deep learning, two improvements are made. The main work is as follows:(1) (1) A convolution neural network denoising method for low dose CT data with calcificat

10、ion points is proposed. Because the calcification points in CT images are generally small and the data containing calcification points are few, the convolution neural network will remove the small calcification points as noise points. Firstly, a calcification adding method is designed to preprocess

11、the training data. Then a low dose CT denoising network is designed. At last, two different loss functions are designed, which are used to train convolutional neural network in two steps. Compared with the current common methods, it is proved that the proposed method can retain the calcification and

12、 complete the low-dose CT denoising.(2) A deep learning convolutional neural network is proposed, which can be used to train unsupervised images of non aligned low dose CT and standard dose CT with different structures. At present, most low-dose CT denoising algorithms based on deep learning need a

13、large number of low-dose CT images with the same structure (alignment) and standard dose CT images for training. It is difficult to get alignment data of non rigid parts such as chest and abdomen, which limits the application of low dose CT denoising algorithm based on deep learning. In this paper,

14、we use cyclegan to generate the network framework, design an efficient generator and discriminator, and use the non aligned CT data to train and get good results. The application of deep learning convolution neural network in low dose CT denoising is extended.Key words: low dose CT convolution neura

15、l network denoising calcification point non alignment1引言1.1 課題背景和意義CT(Computed Tomography)電子計(jì)算機(jī)斷層掃描利用精確準(zhǔn)直的X線(xiàn)束等,與靈敏度極高的探測(cè)器一同圍繞人體做的斷面掃描,可以快速獲得圖像清晰的CT圖像應(yīng)用于疾病的檢查;根據(jù)所采用的射線(xiàn)不同可分為:X 射線(xiàn) CT(X-CT)、超聲 CT(UCT)以及 射線(xiàn) CT(-CT) 等1。1972年發(fā)明了第一臺(tái)CT拍攝設(shè)備,并將其成功應(yīng)用于腦部檢查,宣告了CT的誕生同時(shí)也開(kāi)創(chuàng)了數(shù)字醫(yī)學(xué)影像臨床引用的先河2,3。近年來(lái)CT技術(shù)產(chǎn)生了快速發(fā)展,產(chǎn)生如螺旋CT4,電

16、子束CT5等多種CT技術(shù)。作為現(xiàn)代影像學(xué)的杰出代表,CT已經(jīng)成為放射診斷領(lǐng)域內(nèi)不可缺少的一部分,是目前臨床診斷中最常見(jiàn)的無(wú)損檢測(cè)手段之一6。科學(xué)技術(shù)的發(fā)展推動(dòng)人類(lèi)社會(huì)進(jìn)步,方便人們的生活,同時(shí)科學(xué)技術(shù)使人類(lèi)社會(huì)面臨各種各樣的風(fēng)險(xiǎn)7。CT 技術(shù)在為醫(yī)療診斷帶來(lái)極大方便的同時(shí),CT 掃描輻射也正在危害著人類(lèi)的健康8,研究表明,過(guò)量的X光照射會(huì)誘發(fā)產(chǎn)生多種疾病,如白血病、癌癥、新陳代謝異常及其它一些遺傳性疾病6,9-15。據(jù)報(bào)道,患者接受一次全身CT掃描所受到的輻射劑量相當(dāng)于其位于日本廣島和長(zhǎng)崎原子彈爆炸中心2.5km處接受的輻射量大小16,全球醫(yī)療所致年人均輻射劑量在過(guò)去1015年的時(shí)間里約增加1

17、倍,尤其在高度發(fā)達(dá)的國(guó)家這種情況更為突出17-18。某些人群,如青少年對(duì)CT輻射敏感度約為成年人的10倍以上19,青少年身體發(fā)育情況診斷常常需要拍攝左手腕骨CT圖片,根據(jù)CT圖片進(jìn)行骨齡判斷并結(jié)合實(shí)際年齡得到結(jié)果。目前CT已被許多發(fā)達(dá)國(guó)家列為最主要的醫(yī)療輻射源15。隨著人們對(duì)CT輻射認(rèn)識(shí)的加深,提出在保證CT圖像質(zhì)量和滿(mǎn)足臨床診斷要求的同時(shí),盡可能減少受檢者的輻射劑量(ALARA)已成為當(dāng)今影像學(xué)重要的研究方向和目標(biāo)20。Naidich21等人在1990年首次提出低劑量CT(LDCT)的概念。在CT拍攝中X射線(xiàn)強(qiáng)度和拍攝時(shí)掃描時(shí)間長(zhǎng)短是影響CT劑量的直接因素22,23,實(shí)際應(yīng)用中通常通過(guò)降低C

18、T拍攝儀器X射管電流強(qiáng)度來(lái)降低CT劑量,管電流的下降導(dǎo)致信噪比下降引起密度分辨率的下降,其結(jié)果可能導(dǎo)致密度相近區(qū)域辨識(shí)困難6,造成圖片質(zhì)量下降。降低的CT圖像會(huì)影響醫(yī)生的診斷?;谝陨蠁?wèn)題,低劑量CT去噪研究近年來(lái)得到了快速發(fā)展。目前常用的低劑量CT去噪方法主要包括三個(gè)類(lèi)別:投影域方法、圖像域重建方法和后處理方法。其中后處理方法利用低劑量拍攝到的CT圖像,對(duì)其去噪重建為標(biāo)準(zhǔn)劑量CT質(zhì)量,具有不依賴(lài)具體CT設(shè)備,簡(jiǎn)單易用等特點(diǎn),成為低劑量CT去噪的熱點(diǎn)方案。1.2 CT成像基本原理CT成像是用X線(xiàn)束對(duì)人體檢查部位進(jìn)行掃描,由探測(cè)器接收透過(guò)人體的X線(xiàn),通過(guò)轉(zhuǎn)換后經(jīng)將光信號(hào)轉(zhuǎn)為數(shù)字信號(hào),輸入計(jì)算機(jī)處

19、理。人體各個(gè)部位對(duì)X光線(xiàn)吸收情況不同,CT重建算法根據(jù)人體各個(gè)部位對(duì)CT吸收的不同程度將其轉(zhuǎn)為不同的黑白像素值構(gòu)成CT圖像。圖像采集通過(guò)CT儀器X管儀器向被拍攝者發(fā)送X射線(xiàn)并圍繞被拍攝者旋轉(zhuǎn)持續(xù)拍攝,在X線(xiàn)管對(duì)立面(被拍攝者另一邊)有接收X射線(xiàn)的檢測(cè)器,檢測(cè)器和X線(xiàn)管同步圍繞被拍攝者旋轉(zhuǎn),檢測(cè)到的信息為投影數(shù)據(jù)。如下圖1.1所示。人體X射線(xiàn)檢測(cè)器X線(xiàn)管圖1.1 CT設(shè)備工作圖Figure1.1 Working drawing of CT equipmentX線(xiàn)對(duì)人體有極強(qiáng)的穿透力,從X線(xiàn)管發(fā)出的X線(xiàn)可以穿過(guò)人體并被對(duì)立面的檢測(cè)器接收。X線(xiàn)在穿過(guò)人體的時(shí)候會(huì)與人體組織發(fā)生相互作用,這主要包括光電

20、效應(yīng)和康普頓散射,光電效應(yīng)使X光穿過(guò)人體時(shí)與人體的原子內(nèi)層電子發(fā)生作用(需要較強(qiáng)的能量),光子被吸收,光子能量越高越不會(huì)被吸收,穿透性越高。光電效應(yīng)是臨床CT的主要衰減形式;康普頓散射指X光子與人體原子的外層電子相互作用(所需能量相對(duì)較弱)導(dǎo)致光子能量減弱并改變運(yùn)動(dòng)方向,光子方向改變后無(wú)法達(dá)到預(yù)定接收器位置使該位置相應(yīng)信號(hào)減弱,光子改變方向后到達(dá)其它位置也會(huì)給相應(yīng)位置帶來(lái)噪聲干擾,康普頓散射是CT圖像噪聲的主要來(lái)源。人體不同的組織和X線(xiàn)產(chǎn)生的光電效應(yīng)和康普頓散熱作用不同,當(dāng)降低X管線(xiàn)電流時(shí)會(huì)使光電效應(yīng)減弱,康普頓散射增強(qiáng),圖像產(chǎn)生更多噪音,質(zhì)量下降。當(dāng)強(qiáng)度為I0的X射線(xiàn)通過(guò)某一種均勻介質(zhì)(如下

21、圖1.2)時(shí)會(huì)產(chǎn)生衰減,其衰減規(guī)律可由朗伯比爾定律(Lambert-Beer law)24表示,如公式(1-1):uII0圖1.2 X線(xiàn)穿過(guò)物體Figure 1.2 X-ray through object (1-1) (1.2)式中:I為探測(cè)器接收到的X線(xiàn)強(qiáng)度;xX射線(xiàn)穿過(guò)介質(zhì)的直線(xiàn)長(zhǎng)度;u物體衰減系數(shù)。假設(shè)物體時(shí)分段均勻的(如下圖1.3),并且各段長(zhǎng)度和衰減系數(shù)分別為x1:u1、x2:u2、.,其衰減規(guī)律如公式(1-3)。.U1U1II0圖1.3 X線(xiàn)穿過(guò)多個(gè)物體Figure 1.2 X-ray through multiple object (1-3)上式也可表示為:(1-4)如果X射線(xiàn)

22、穿過(guò)人體等連續(xù)不均勻介質(zhì),在某方向M為:(1-5)式(1-4)和式(1-5)等于號(hào)兩邊均可表示為X射線(xiàn)穿過(guò)介質(zhì)后的投影,在數(shù)據(jù)采集過(guò)程中會(huì)切換幾百甚至上千個(gè)掃描角度,綜合所有角度的方程可以獲得人體對(duì)X射線(xiàn)的衰減分布圖U(x,y),人體大部分組織衰減系數(shù)u很?。ㄈ缂∪鉃?.192cm-124),為了方便臨床使用,不直接使用衰減系統(tǒng)而是采用不同組織相對(duì)于水的衰減系統(tǒng)的比值關(guān)系。組織N的CT值計(jì)算公式(1-6)如下:(1-6)式中:u0水的衰減系數(shù);u所求組織衰減系數(shù);CT單位為“亨”(Hounsfield Unit,HU)。常見(jiàn)人體組織及介質(zhì)CT值如下表1.1所示:表1.1 人體部分組織和常見(jiàn)介質(zhì)

23、 CT 值Table 1.1 CT values of some human tissues and common media人體組織CT 值(HU)人體組織CT 值(HU)骨組織400肝臟5070鈣質(zhì)80300脾臟3560血塊6484胰臟3055腦白質(zhì)-2535腎臟2550腦灰質(zhì)2844肌肉4055腦脊液38膽囊1030血液1332甲狀腺5090血漿314脂肪-100-20滲出液15水0空氣-200 以上漏出液(蛋白30g/L)182有了CT掃描斷層各部位CT值以后,用CT值代替掃描圖像對(duì)應(yīng)值便可以得到CT圖像。人類(lèi)眼睛只能辨別16階灰度,CT有大約2000階灰度,因此人眼無(wú)法準(zhǔn)確識(shí)別每一階

24、灰度,只能分辨出差異不小于125Hu的CT圖像,如差異小于50Hu的人體軟組織人眼就無(wú)法識(shí)別出來(lái)。為了能利用CT圖像的高精度同時(shí)可以觀(guān)察到各個(gè)不同CT值的人體組織,人們通過(guò)分段觀(guān)察的方式觀(guān)察CT圖像,根據(jù)需要觀(guān)察組織的CT值范圍,只觀(guān)察該CT值范圍內(nèi)的圖像,將該范圍定義為觀(guān)察的窗寬,該范圍的中心即為窗位或窗中心。窗寬的范圍大小會(huì)影響CT圖像的對(duì)比度。當(dāng)我們選定了窗寬之后,會(huì)將該窗寬內(nèi)CT范圍劃分為16個(gè)灰階進(jìn)行觀(guān)察,例如我們選擇CT值1000Hu到1160Hu區(qū)間內(nèi)圖像,窗寬為160Hu,這160Hu重新對(duì)應(yīng)到從白到黑16個(gè)灰階,每個(gè)灰階CT值范圍為10Hu。如果我們選擇窗寬越小,每個(gè)灰階CT

25、值范圍越小,對(duì)比度越強(qiáng)。要根據(jù)人體組織內(nèi)CT值范圍選擇合適窗寬。窗位是窗寬的中心值。如觀(guān)察某組織CT圖像窗寬為100Hu,窗位為1000Hu。在這張CT圖像中CT值950Hu(窗位減去窗寬一半)到1050Hu(窗位加上窗寬一半)均可以被觀(guān)察到。CT值大于1050Hu表現(xiàn)為白色,CT值小于950Hu的表現(xiàn)為黑色。本文利用深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行訓(xùn)練,針對(duì)深度學(xué)習(xí)特點(diǎn)對(duì)數(shù)據(jù)進(jìn)行優(yōu)化,將CT圖像歸一話(huà)到0到1之間。如頭部數(shù)據(jù)觀(guān)察范圍變?yōu)?.24, 0.28,胸腹部數(shù)據(jù)觀(guān)察范圍為0.23, 0.29。下圖1.4展示直接觀(guān)測(cè)CT值和利用窗口窗口觀(guān)察圖像的差異。 (A) (B)圖1.4 (A)直接查看

26、CT圖像(B)采用窗口值查看CT圖像Figure 1.4 (a) view CT image directly (b) view CT image by window value1.3 國(guó)內(nèi)外研究現(xiàn)狀及趨勢(shì)當(dāng)前臨床在保持硬件條件不變的情況進(jìn)行低劑量CT掃描往往通過(guò)降低X射線(xiàn)球管中的管電流,此種方法會(huì)導(dǎo)致發(fā)射信號(hào)信噪比下降進(jìn)而獲得的CT圖像質(zhì)量下降影響醫(yī)務(wù)工作者病情診斷。國(guó)內(nèi)外學(xué)者進(jìn)行了大量的研究實(shí)驗(yàn)提高低劑量CT的圖像質(zhì)量,這些工作研究方向大體可以分為三種:投影域處理方法、圖像域重建方法和后處理方法。1.3.1 投影域處理方法投影域處理方法也稱(chēng)為預(yù)處理方法,對(duì)探測(cè)器接收到的投影數(shù)據(jù)進(jìn)行去噪處理

27、,然后通過(guò)濾波反投影或其它CT圖像重建方法重建CT圖像。此類(lèi)方法速度較快效率高、便于臨床應(yīng)用,但是對(duì)設(shè)備具有一定依賴(lài)性,大多數(shù)廠(chǎng)家不提供投影數(shù)據(jù)增大了算法研究的難度。Hsieh J等將投影數(shù)據(jù)采用自適應(yīng)截?cái)嗑担╝daptive trimmed mean,ATM)的方法進(jìn)行處理,有效抑制重建圖像中條形偽影25;Yu L等提出一種對(duì)投影數(shù)據(jù)局部自適應(yīng)雙邊濾波算法,提高了重建圖像對(duì)比度,使人體各組織邊沿信息更加清晰26;Zhang Y等根據(jù)投影數(shù)據(jù)中不同的噪音信息,針對(duì)不同強(qiáng)度或性質(zhì)噪聲采用不同去噪方法進(jìn)行濾波,并實(shí)驗(yàn)獲得了較高質(zhì)量中間圖像27;Gui Z等對(duì)投影數(shù)據(jù)采用了一種模糊中值濾波方法,對(duì)

28、投影數(shù)據(jù)中噪聲一職和偽影消除均取得良好效果27。投影域?yàn)V波方法對(duì)圖像重建前的投影數(shù)據(jù)進(jìn)行處理,如果設(shè)計(jì)不合理將直接影響重建圖像質(zhì)量,產(chǎn)生畸變等錯(cuò)誤圖像,在重建時(shí)纏手新的噪聲28,濾波算法性能非常重要29。1.3.2圖像域重建方法圖像重建算法包括解析重建(analytic reconstruction,AR)和迭代重建(iterative reconstruction,IR)兩類(lèi)30-38。解析法是以 Radon 變換對(duì)投影數(shù)據(jù)解析處理后計(jì)算的一種方法,如 FBP 重建算法8。解析法重建速度較快,但是其對(duì)CT的輻射劑量要求較高39。迭代法圖像重建算法通過(guò)對(duì)此迭代計(jì)算獲得人體每個(gè)部位CT值,獲得的

29、圖像質(zhì)量較好。開(kāi)始時(shí)假設(shè)一種初始值,然后從某個(gè)角度進(jìn)行投影得到預(yù)估值和真實(shí)值,計(jì)算其差值進(jìn)行反饋修正預(yù)估值,通過(guò)一次次迭代直到預(yù)估值和真實(shí)值差值為0,此時(shí)即可獲得準(zhǔn)確CT重建出質(zhì)量較高CT圖像。迭代法需要較高的計(jì)算機(jī)性能,幾年來(lái)隨著計(jì)算機(jī)性能越來(lái)越好,迭代法也慢慢開(kāi)始獲得重視。將先驗(yàn)信息作為懲罰項(xiàng)加入低劑量 CT 統(tǒng)計(jì)迭代重建模型中,可以有效地增強(qiáng)重建圖像中散射噪聲和偽影的去除效果40。馬爾科夫隨機(jī)場(chǎng)(Markov Random Field, MRF)是常用的先驗(yàn)?zāi)P?,如Zhang R41等將馬爾可夫隨機(jī)場(chǎng)模型混合高斯處理提高重建質(zhì)量。非局部均值和字典學(xué)習(xí)近年來(lái)也慢慢被用來(lái)進(jìn)行懲罰項(xiàng)設(shè)計(jì),朱永

30、成等42采用K-SVD算法迭代學(xué)習(xí)去除低劑量CT噪聲;郝立巍等43通過(guò)引入局部相位特征,設(shè)計(jì)圖像子塊相似性函數(shù),對(duì)低劑量CT去除噪聲的同時(shí)保留了邊界、囊腫區(qū)及低密度區(qū)等重要特征。1.3.3 后處理方法后處理算法直接對(duì)設(shè)備拍攝得到低劑量CT圖像進(jìn)行去噪重建位標(biāo)準(zhǔn)劑量CT圖像,與投影域處理方法相比無(wú)須獲得投影數(shù)據(jù),具有與圖像重建算法和CT設(shè)備無(wú)關(guān)性,具有更好的普適性,與圖象域重建算法相比具有更快的速度??梢越梃b圖像去噪算法,提高算法還發(fā)效率。近年來(lái)深度學(xué)習(xí)的興起,其在圖像處理領(lǐng)域取得了良好的成績(jī),利用深度學(xué)習(xí)方法進(jìn)行低劑量CT去噪的方法也表現(xiàn)出了強(qiáng)大的性能。Zamyatin A等44利用自適應(yīng)多尺

31、度濾波器對(duì)低劑量CT進(jìn)行去噪并且有效保留了圖像邊緣信息;Chen Y等45利用鄰域加權(quán)平均算法對(duì)低劑量CT數(shù)據(jù)進(jìn)行處理完成去除噪聲和抑制偽影良好效果;Kang D46等提出一種自適應(yīng)三維塊匹配算法,有效提高低劑量CT圖像去噪水平。Chen H47-49設(shè)計(jì)了設(shè)計(jì)了一種卷積神經(jīng)網(wǎng)絡(luò)完成了對(duì)低劑量CT的良好去噪效果,隨后通過(guò)加深網(wǎng)絡(luò)設(shè)計(jì)出RED-CNN網(wǎng)絡(luò)架構(gòu),利用模擬數(shù)據(jù)和臨床數(shù)據(jù)進(jìn)行訓(xùn)練,均表現(xiàn)出了較強(qiáng)的去噪性能。Eunhee K50-51利用對(duì)低劑量CT進(jìn)行小波處理然后送入卷積神經(jīng)網(wǎng)絡(luò)完成了去噪效果,后期利用生成對(duì)抗網(wǎng)絡(luò)利用心臟部位非對(duì)齊數(shù)據(jù)進(jìn)行訓(xùn)練完成非監(jiān)督的低劑量CT去噪網(wǎng)絡(luò)方法;章云港

32、52-53等利用空洞卷積、批歸一化(Batch Normalization,BN)和殘差學(xué)習(xí)54設(shè)計(jì)卷積神經(jīng)網(wǎng)絡(luò)降低網(wǎng)絡(luò)的復(fù)雜度,不僅提高了訓(xùn)練速度同時(shí)得到了高質(zhì)量的去噪水平,提出一種改進(jìn)型殘差解編碼網(wǎng)絡(luò),通過(guò)減小卷積網(wǎng)絡(luò)卷積尺寸和更改普通卷積層為空洞卷積等方式改進(jìn)RED-CNN完成高效低劑量CT去噪效果;呂曉琪等55利用池化層、批歸一化和殘差學(xué)習(xí)設(shè)計(jì)深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)完整的肺部低劑量CT完成了去噪;徐曾春等55利用改進(jìn)型WGAN對(duì)低劑量CT進(jìn)行去噪并取得良好效果。1.4論文主要研究?jī)?nèi)容及結(jié)構(gòu)安排科研工作者對(duì)低劑量CT去噪做了大量的研究,在CT掃描的投影域、圖像重建和后處理等各方面都獲得優(yōu)異的去噪

33、效果。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,已有大量基于深度學(xué)習(xí)的低劑量CT去噪研究,如Chen H等57研究人員提出的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò),無(wú)論模擬低劑量CT數(shù)據(jù)還是臨床數(shù)據(jù),與傳統(tǒng)方法的高性能低劑量CT去噪算法相比均表現(xiàn)出巨大的優(yōu)勢(shì)。但是深度學(xué)習(xí)方法仍有一些問(wèn)題值得研究和探索,如低劑量CT中的鈣化點(diǎn)問(wèn)題和非監(jiān)督訓(xùn)練問(wèn)題。研究從圖像后處理方向入手,利用深度學(xué)習(xí)卷積網(wǎng)絡(luò)強(qiáng)大的圖像處理能力針對(duì)含鈣化點(diǎn)的CT數(shù)據(jù)提出一種含鈣化點(diǎn)的低劑量CT去噪算法。針對(duì)結(jié)構(gòu)不同低劑量CT和標(biāo)準(zhǔn)劑量CT非對(duì)齊數(shù)據(jù)提出一種無(wú)監(jiān)督的低劑量CT去噪網(wǎng)絡(luò),可以應(yīng)用非對(duì)齊數(shù)據(jù)進(jìn)行訓(xùn)練并獲得了良好的效果。(1) 解決低劑量CT去噪中鈣化點(diǎn)問(wèn)

34、題。鈣化點(diǎn)是人體中的鈣化組織,有良性的也由惡性的,應(yīng)當(dāng)引起我們的重視。并非每個(gè)人都有鈣化點(diǎn),鈣化點(diǎn)也可能只存在在某些部位,因此只有極少CT圖像中存在鈣化點(diǎn)。鈣化點(diǎn)在CT圖像上特征和噪聲非常相似,除比噪聲點(diǎn)稍大外無(wú)明顯差別,目前低劑量CT去噪算法往往將其作為噪聲去除,影響醫(yī)生對(duì)病情診斷。研究提出一種基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的低劑量CT去噪算法,通過(guò)設(shè)計(jì)數(shù)據(jù)處理算法,改進(jìn)低劑量CT去噪網(wǎng)絡(luò)和損失函數(shù)設(shè)計(jì)等工作,成功實(shí)現(xiàn)對(duì)由鈣化點(diǎn)的低劑量CT數(shù)據(jù)去噪并保留鈣化點(diǎn)。(2) 提出一種基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的無(wú)監(jiān)督的低劑量CT訓(xùn)練算法。隨著深度學(xué)習(xí)的發(fā)展,其在低劑量CT去噪領(lǐng)域表現(xiàn)出了強(qiáng)大的性能,相比傳

35、統(tǒng)低劑量CT去噪算法也具有很大的優(yōu)勢(shì)?,F(xiàn)有的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)低劑量CT去噪方法大多需要大量結(jié)構(gòu)相同的低劑量CT和標(biāo)準(zhǔn)劑量CT數(shù)據(jù)進(jìn)行有監(jiān)督學(xué)習(xí)。目前僅有一種應(yīng)用于心臟部位的無(wú)監(jiān)督訓(xùn)練方法且性能較差,研究利用生成對(duì)抗網(wǎng)絡(luò)架構(gòu)提出一種非監(jiān)督的深度學(xué)習(xí)訓(xùn)練方法并獲得了優(yōu)異的低劑量CT去噪能力。文章結(jié)構(gòu)安排如下:第1章 引言。首先介紹本文課題的研究和意義;然后,簡(jiǎn)介CT原理并進(jìn)一步介紹了國(guó)內(nèi)外研究人員從各方面進(jìn)行低劑量CT去噪的研究現(xiàn)狀;最后提出本文的內(nèi)容和結(jié)構(gòu)安排。第2章 與研究相關(guān)卷積神網(wǎng)絡(luò)知識(shí)概要及本文網(wǎng)絡(luò)評(píng)價(jià)指標(biāo)。介紹與本文研究相關(guān)的深度學(xué)習(xí)知識(shí)概要及研究所設(shè)計(jì)到的卷積神經(jīng)網(wǎng)絡(luò)框架,提出本

36、文網(wǎng)絡(luò)評(píng)價(jià)指標(biāo),為后面章節(jié)部分進(jìn)行知識(shí)預(yù)備。第3章 基于卷積神經(jīng)網(wǎng)絡(luò)的低劑量含鈣化點(diǎn)CT去噪研究。首先通過(guò)頭部數(shù)據(jù)集展示鈣化點(diǎn)并總結(jié)其特點(diǎn)提出低劑量CT去噪中鈣化點(diǎn)問(wèn)題研究的意義,然后利用經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)低劑量CT去噪方法探討對(duì)包含鈣化點(diǎn)數(shù)據(jù)去噪中遇到的問(wèn)題。接著從數(shù)據(jù)預(yù)處理、損失函數(shù)和網(wǎng)絡(luò)設(shè)計(jì)數(shù)據(jù)設(shè)計(jì)等方面完成包含鈣化點(diǎn)的低劑量CT去噪,最后通過(guò)與經(jīng)典低劑量CT去噪方法對(duì)比總結(jié)證明提出方法的優(yōu)勢(shì)并進(jìn)行本章小結(jié)。第4章 基于生成對(duì)抗網(wǎng)絡(luò)的無(wú)監(jiān)督低劑量CT去噪研究。首先展示非對(duì)齊的CT數(shù)據(jù)特點(diǎn),通過(guò)經(jīng)典低劑量CT去噪方法實(shí)現(xiàn)對(duì)齊去噪提出無(wú)監(jiān)督方法的意義,然后通過(guò)對(duì)經(jīng)典非監(jiān)督深度學(xué)習(xí)方法框架的研

37、究從生成器、判別器和損失函數(shù)方面進(jìn)行改進(jìn)提出非監(jiān)督的低劑量CT去噪算法。最后通過(guò)與現(xiàn)有方法進(jìn)行對(duì)比研究提出研究的價(jià)值并進(jìn)行本章小結(jié)。第5章 總結(jié)和展望,通過(guò)總結(jié)文本的研究工作及取得成就,分析放方法中仍存在的問(wèn)題,提出相關(guān)問(wèn)題解決方法和未來(lái)的研究方向。2 與研究相關(guān)卷積神經(jīng)網(wǎng)絡(luò)知識(shí)概要及網(wǎng)絡(luò)性能測(cè)試指標(biāo)2.1 與研究相關(guān)深度學(xué)習(xí)卷積神經(jīng)概要LeCun63于1989年提出世界上第一個(gè)真正意義上的卷積神經(jīng)網(wǎng)絡(luò),從廣為流傳的手寫(xiě)字體識(shí)別LeNet65網(wǎng)絡(luò),到2012到Alex Krizhevsky等發(fā)布AlexNet64,卷積神經(jīng)網(wǎng)絡(luò)近幾年獲得了快速的發(fā)展,在計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理方面表現(xiàn)出強(qiáng)大性能

38、。如人臉檢測(cè)、人臉識(shí)別到圖像去噪等應(yīng)用。本章通過(guò)對(duì)卷積神經(jīng)網(wǎng)絡(luò)的組成等基礎(chǔ)知識(shí)進(jìn)行概要,討論卷積神經(jīng)網(wǎng)絡(luò)的卷積層、激活層、池化層和全連接層等結(jié)構(gòu)及其特點(diǎn)。2.1.1 卷積層卷積層由若干卷積核和偏置組成,通過(guò)與輸入圖像或特征層進(jìn)行點(diǎn)積和累加得到特征圖(feature map)。卷積核可以提取輸入圖像的局部特征,不同的卷積核會(huì)提取輸入圖像的不同特征。卷積核的尺寸中長(zhǎng)和寬為該卷積核的感受野,說(shuō)明了卷積核所能感知的區(qū)域。卷積核的通道數(shù)與輸入圖像的通道數(shù)相同。當(dāng)卷積操作開(kāi)始后,卷積核由設(shè)置的步長(zhǎng)(卷積核在圖像上滑動(dòng)時(shí)移動(dòng)元素?cái)?shù))由左向右、由上向下滑動(dòng),卷積核初始位置由padding確定,每滑動(dòng)一次卷積核

39、上元素和圖像上對(duì)應(yīng)元素相加并求和得到輸出矩陣對(duì)應(yīng)值,如下圖2.1所示:12345678910111213141516100101010=*23273943 圖2.1 卷積操作示意圖Figure 2.1 schematic diagram of convolution operation以上圖二維卷積運(yùn)算為例,輸入圖像為4*4*1矩陣,卷積核為3*3*1,步長(zhǎng)為1。初始位置卷積運(yùn)算:1*1+2*0+3*0+5*1+6*0+7*1+9*0+10*1+11*0=23,以這種方式依次滑動(dòng)計(jì)算,得到輸出結(jié)果。卷積層具有兩個(gè)主要特征:局部連接和權(quán)值共享。(1) 局部連接:也叫稀疏連接,指卷積層節(jié)點(diǎn)只和前一

40、層的部分節(jié)點(diǎn)連接。這種局部感知結(jié)構(gòu)理念受動(dòng)物視覺(jué)皮層結(jié)構(gòu)啟發(fā),動(dòng)物對(duì)外界事物的視覺(jué)感知過(guò)程先局部感知然后全局。在計(jì)算機(jī)視覺(jué)中,同一張圖像不同區(qū)域的相關(guān)性與其相互間距離正相關(guān),圖像中的兩個(gè)像素距離越近其相關(guān)性越大,反之越弱。局部感知神經(jīng)元對(duì)局部進(jìn)行感知,在更高層將之前的局部信息綜合得到全局信息。通過(guò)局部連接可以讓卷積網(wǎng)絡(luò)只關(guān)注應(yīng)該關(guān)注的位置,同時(shí)可以大大降低神經(jīng)網(wǎng)絡(luò)的參數(shù),如10個(gè)神經(jīng)元對(duì)一張100100圖像連接,如果采用全連接方式,每個(gè)神經(jīng)元都要與圖像的所有像素進(jìn)行連接,參數(shù)量將達(dá)到10100100=105,很難進(jìn)行訓(xùn)練。如果采用局部連接方式,每個(gè)神經(jīng)元與1010的局部圖像連接,參數(shù)量為10(

41、100/10)(100/10)=103。(2) 權(quán)值共享:權(quán)值共享指同卷積層的一次卷積運(yùn)算卷積核權(quán)重是共享的,無(wú)論卷積到輸入圖像的哪個(gè)位置,卷積核權(quán)重都是一樣的。同一卷積層的不同卷積核參數(shù)可能不同,不同卷積層中卷積核也可能不同。通過(guò)權(quán)值共享可以進(jìn)一步降低訓(xùn)練參數(shù),如上例子中讓每個(gè)神經(jīng)元的10*10權(quán)值相同,那么需要訓(xùn)練的參數(shù)量降低為10*10。一個(gè)卷積核僅能學(xué)習(xí)到一種特征,實(shí)際生活中僅憑某一種特征無(wú)法準(zhǔn)確的描述區(qū)分不同事物,如貓和狗,只給出顏色不能準(zhǔn)確的描述它們也無(wú)法正確區(qū)分它們。于是同一卷積層往往具有多個(gè)卷積核對(duì)輸入圖像進(jìn)行特征提取,卷積核數(shù)代表了可以學(xué)習(xí)到的特征數(shù)。同一卷積層可以設(shè)置多種卷

42、積核學(xué)習(xí)多種不同特征,卷積神經(jīng)網(wǎng)絡(luò)可以通過(guò)增加卷積層數(shù)學(xué)習(xí)更深層特征。如2014年牛津大學(xué)視覺(jué)組提出的VGG67網(wǎng)絡(luò)結(jié)構(gòu)獲得當(dāng)年ILSRC比賽亞軍,VGG網(wǎng)絡(luò)通過(guò)降低卷積核尺寸同時(shí)增加卷積層數(shù)(網(wǎng)絡(luò)深度),利用兩層33卷積層達(dá)到一層55卷積層的感受野,同時(shí)證明了網(wǎng)絡(luò)深度是影響卷積神經(jīng)網(wǎng)絡(luò)性能的一個(gè)關(guān)鍵因素。Padding為卷積神經(jīng)網(wǎng)絡(luò)卷積核對(duì)輸入圖像進(jìn)行卷積時(shí)遇到越過(guò)輸入圖像邊界時(shí)的補(bǔ)充邊界行為。研究利用tensorflow深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)進(jìn)行訓(xùn)練,以tensorflow中Padding分例,分為“VALID”和“SAME”兩種。當(dāng)padding為“VALID”時(shí),若無(wú)法完整滑動(dòng),則輸入圖像或

43、特征層右面和下面部分直接丟掉。當(dāng)padding為“SAME”時(shí),當(dāng)無(wú)法完整滑動(dòng),在輸入圖像上下左右補(bǔ)0,若不夠繼續(xù)在右面和下面補(bǔ)0。如下圖2.2所示。1231415168VALID1231415161111步長(zhǎng)為2*1230141051600000SAME8466圖2.2 padding操作Figure 2.2 padding operation2.1.2 反卷積傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)輸入圖像進(jìn)行卷積之后得到的特征層長(zhǎng)和寬根據(jù)padding的不同等于或小于輸入圖像的長(zhǎng)和寬,當(dāng)我們需要將圖像恢復(fù)到原理的尺寸的時(shí)候需要用到反卷積操作,它相當(dāng)于對(duì)圖像進(jìn)行上采樣。反卷積通過(guò)對(duì)輸入圖像進(jìn)行補(bǔ)0擴(kuò)大尺寸,然

44、后進(jìn)行卷積,如下圖2.3所示,左邊為輸入圖像,右邊為進(jìn)行反卷積時(shí)對(duì)圖像進(jìn)行補(bǔ)0擴(kuò)大,然后按章2.1.1中卷積方法對(duì)圖像進(jìn)行卷積。0000000010203000000000104010000000005010600000000123141516圖2.3 反卷積操作Figure 2.3 deconvolution operation2.1.3 激活層激活層利用激活函數(shù)把輸入的線(xiàn)性數(shù)據(jù)轉(zhuǎn)換為非線(xiàn)性輸出給下一層,多層線(xiàn)性模型變換后和一層線(xiàn)性模型變換無(wú)本質(zhì)差別,激活函數(shù)通過(guò)將線(xiàn)性模型轉(zhuǎn)換為非線(xiàn)性,解決線(xiàn)性模型對(duì)深層卷積神經(jīng)網(wǎng)絡(luò)表達(dá)力不夠的問(wèn)題。常用的激活函數(shù)有Sigmoid函數(shù)、Tanh函數(shù)、ReLU

45、和PReLU等,以下為研究涉及到的兩個(gè)的激活函數(shù)。(1) ReLU激活函數(shù)(2-1)ReLU(x)f(x)X圖2.4 ReLU 圖像Figure 2.4 ReLU imageReLU71(Rectified Linear Unit)是深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)中常用的激活函數(shù)。其數(shù)學(xué)表達(dá)式如公式(2-1),其函數(shù)圖像如上圖2.4所示。當(dāng)x大于0時(shí),其導(dǎo)數(shù)恒為1,收斂快。當(dāng)x小于0時(shí),輸出為0,增強(qiáng)了網(wǎng)絡(luò)稀疏性,提高了網(wǎng)絡(luò)泛化性。(2) PReLU激活函數(shù)(2-2)式中:i-代表不同通PReLU(x)f(x)X圖2.5 ReLU 圖像Figure 2.5 PReLU imageReLU激活函數(shù)對(duì)輸入小

46、于0的數(shù)據(jù)置為0,提高了網(wǎng)絡(luò)的稀釋性,這同樣也將導(dǎo)致訓(xùn)練變得容易“die”,一個(gè)大的梯度經(jīng)過(guò)一個(gè)ReLU神經(jīng)元,參數(shù)更新后這個(gè)神經(jīng)元就再也不會(huì)對(duì)任何數(shù)據(jù)有激活現(xiàn)象了,那么這個(gè)神經(jīng)元的梯度就永遠(yuǎn)都會(huì)是0。如果學(xué)習(xí)率很高,網(wǎng)絡(luò)中很多神經(jīng)元都會(huì)“dead”。針對(duì)這種情況Kaiming he等提出的PReLU72激活函數(shù),如公式(2-2)和函數(shù)圖像如圖2.5所示。PReLU再輸入小于0時(shí)也會(huì)有一定輸出,ai在采用帶動(dòng)量方式更新。這樣PReLU僅增加極少量參數(shù),仍保持了ReLU激活函數(shù)的優(yōu)勢(shì),同時(shí)解決了其“dead”問(wèn)題。2.1.5 全連接層全連接層(fully connected layers,F(xiàn)C)

47、是一個(gè)特殊的卷積層,在整個(gè)卷積神經(jīng)網(wǎng)絡(luò)中起到“分類(lèi)器”的作用。全連接層一般在卷積神經(jīng)網(wǎng)絡(luò)尾部,經(jīng)卷積層等結(jié)構(gòu)學(xué)習(xí)到的特征信息映射到樣本標(biāo)記空間,對(duì)前面學(xué)習(xí)到的特征做加權(quán)和。其激活函數(shù)常采用ReLU激活函數(shù)。2.1.4 池化層池化層(pooling)對(duì)圖像進(jìn)行下采樣,減小特征層尺寸。減小網(wǎng)絡(luò)訓(xùn)練計(jì)算量,提高訓(xùn)練速度,同時(shí)池化層會(huì)提取了圖像主要特征,忽略一些特征,降低網(wǎng)絡(luò)過(guò)擬合的可能性。均值池化和最大值池化是比較常見(jiàn)的池化層。最大池化將圖像池化區(qū)域最大值保留,如下圖2.5所示:1231141251658737最大值池化步長(zhǎng)2,尺寸2*24387圖2.5 池化操作Figure 2.5 pooling

48、 operation上圖采用一個(gè)22的filter進(jìn)行最大值池化,在每一個(gè)區(qū)域中尋找最大值,這里的stride=2,最終在原特征圖中提取主要特征得到右圖。均值池化是對(duì)每一個(gè)區(qū)域元素求和,再除以區(qū)域包含元素?cái)?shù),得到主要特征。池化層使特征圖縮小,會(huì)影響網(wǎng)絡(luò)精度。2.1.6 損失函數(shù)損失函數(shù)反映了網(wǎng)絡(luò)模型預(yù)測(cè)值與真實(shí)值之間的差距,用來(lái)評(píng)估模型性能。損失函數(shù)結(jié)果值越大模型性能越差。深度學(xué)習(xí)在訓(xùn)練過(guò)程中不斷計(jì)算損失進(jìn)行反向傳播,算法以此來(lái)更新模型參數(shù),向模型損失減小的方向訓(xùn)練提高模型性能。損失函數(shù)對(duì)模型訓(xùn)練訓(xùn)練具有一定指導(dǎo)意義,實(shí)際應(yīng)用中要根據(jù)算法的差異選擇合適的損失函數(shù)將算法達(dá)到最優(yōu)。本文涉及損失函數(shù)

49、有L1損失和L2損失:(1) L1損失L1損失即平均絕對(duì)誤差(Mean Absolute Error,MAE)如公式(2-3),L1損失表達(dá)了目標(biāo)值和模型預(yù)測(cè)值各個(gè)元素差的絕對(duì)值的均值,對(duì)異常有較強(qiáng)的魯棒性。(2-3)式中:m、n目標(biāo)和預(yù)測(cè)圖像的尺寸;代表絕對(duì)值。(2) L2損失L2損失即均方誤差(MeanSquaredError,MSE)表示是預(yù)測(cè)值和實(shí)際觀(guān)測(cè)值間差的平方的均值,如公式(2-4)。由于平方的影響數(shù)學(xué)特性更好,對(duì)較大的誤差比L1損失更敏感。(2-4)式中:m、n目標(biāo)和預(yù)測(cè)圖像的尺寸。2.1.7 優(yōu)化算法在訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的時(shí)候,我們希望損失函數(shù)可以降到最低,收斂越快越好,并希望

50、損失達(dá)到最低后不會(huì)出現(xiàn)反彈保持穩(wěn)定下降,這就要用到優(yōu)化算法。目前優(yōu)化算法主要有梯度下降優(yōu)化算法、指數(shù)加權(quán)平均算法、動(dòng)量梯度下降算法、RMSprop算法和Adam73優(yōu)化算法。Adam(Adaptive momentum)是一種自適應(yīng)動(dòng)量的隨機(jī)優(yōu)化方法(A method for stochastic optimization),它能基于訓(xùn)練動(dòng)態(tài)更新神經(jīng)網(wǎng)絡(luò)權(quán)重。經(jīng)常作為深度學(xué)習(xí)中的優(yōu)化器算法。2.2 相關(guān)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)2.2.1 VGG網(wǎng)絡(luò)VGG74卷積神經(jīng)網(wǎng)絡(luò)是牛津大學(xué)視覺(jué)組(VisualGeometryGroup)于2014年提出的卷積神經(jīng)網(wǎng)絡(luò),擁有較強(qiáng)分類(lèi)性能和定位性能。其拓展性和泛化性

51、都很好。VGG有深度不同的VGG19和VGG16兩種結(jié)構(gòu)。VGG19網(wǎng)絡(luò)包括16層卷積層,所有卷積核尺寸全部為33,padding均為“SAME”,激活函數(shù)全部才哦那個(gè)ReLU激活函數(shù)。其網(wǎng)絡(luò)結(jié)構(gòu)前兩層卷積層均有64個(gè)卷積核,然后利用一個(gè)最大池化層進(jìn)行最大池化;接下來(lái)兩層卷積層有128個(gè)卷積核,然后利用最大池化層進(jìn)行最大池化;第五到第八層卷積層有256個(gè)卷積核,然后利用最大池化層進(jìn)行最大池化;第九到第十三層卷積層有512個(gè)卷積核,利用最大池化層進(jìn)行最大池化;第十四到第十六層卷積層有256個(gè)卷積核,然后經(jīng)過(guò)一個(gè)最大池化的池化層;所有池化層步長(zhǎng)均為2,大小均為22,padding均為“SAME”;

52、最后為三個(gè)全連接層,并用ReLU作為激活函數(shù),全連接層尺寸分別為4096、4096和1000。利用softmax函數(shù)進(jìn)行分類(lèi)。VGG網(wǎng)絡(luò)通過(guò)連續(xù)的兩層步長(zhǎng)為1的33卷積層代替一層55卷積層,連續(xù)的三層步長(zhǎng)為1的33卷積層代替77卷積層,使網(wǎng)絡(luò)較之前的單層卷積層保持相同的感受野的情況下提升了網(wǎng)絡(luò)的深度,每層卷積層后面均利用ReLU激活函數(shù)進(jìn)行激活,這樣VGG網(wǎng)絡(luò)具有更深的非線(xiàn)性層結(jié)構(gòu),可以學(xué)習(xí)更復(fù)雜的模型,提升網(wǎng)絡(luò)性能,而且計(jì)算量較之前網(wǎng)絡(luò)大幅下降。例如原來(lái)一個(gè)55卷積核參數(shù)量為55=25,替換為兩個(gè)33的卷積核后參數(shù)量變?yōu)?33=18。VGG網(wǎng)絡(luò)非常簡(jiǎn)潔,整個(gè)網(wǎng)絡(luò)卷積核尺寸均為3x3,和最大池

53、化尺寸均為2x2,VGG取得良好成績(jī)證明在一定程度下可以通過(guò)增加網(wǎng)絡(luò)深度提升網(wǎng)絡(luò)性能。2.2.2 ResNetVGG通過(guò)加深深度卷積神經(jīng)網(wǎng)絡(luò)深度在降低計(jì)算量的情況提高了網(wǎng)絡(luò)性能,自此卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)開(kāi)始把目光放到提升網(wǎng)絡(luò)的層數(shù)。然后通過(guò)不斷的加深網(wǎng)絡(luò)深度研究者很快發(fā)現(xiàn)不斷地增加網(wǎng)絡(luò)層數(shù),網(wǎng)絡(luò)性能并沒(méi)有得到預(yù)想中的提升,相反網(wǎng)絡(luò)層數(shù)到達(dá)一定程度后網(wǎng)絡(luò)變得很難訓(xùn)練,訓(xùn)練集損失不僅不再縮小甚至變大,訓(xùn)練效果甚至不如層數(shù)較少的卷積神經(jīng)網(wǎng)絡(luò),發(fā)生退化現(xiàn)象。通過(guò)研究發(fā)現(xiàn)隨著網(wǎng)絡(luò)層數(shù)的增加,梯度反向傳播到前面層距離變大,累計(jì)相乘后梯度變得無(wú)窮小造成梯度消失。針對(duì)這種情況,2015年何凱明等68提出一種深度殘

54、差網(wǎng)絡(luò)結(jié)構(gòu),這種網(wǎng)絡(luò)通過(guò)跳躍連接來(lái)解決層次過(guò)多帶來(lái)的問(wèn)題,其借鑒了高速公路結(jié)構(gòu)(Highway Networks)設(shè)計(jì)思路,其結(jié)構(gòu)原理如下圖2.6所示:XF(X)Relu權(quán)重層權(quán)重層ReluF(X)+X+圖2.6 ResNet殘差連接Figure 2.6 residual connection假如網(wǎng)絡(luò)輸入為X,期望輸出為H(X),加入殘差連接后H(X)=F(X)+X。這種跳躍連接沒(méi)有增加參數(shù)數(shù)量,同時(shí)將底層特征帶到高層有效減少了信息丟失,有效的解決了使深層次的卷積神經(jīng)網(wǎng)絡(luò)退化問(wèn)題。2.2.3 Inception模型2014年Christian Szegedy等提出的GoogleNet,并獲得了

55、當(dāng)年ImageNet挑戰(zhàn)賽軍。VGG證明了通過(guò)增大深度學(xué)習(xí)網(wǎng)絡(luò)深度可以提高網(wǎng)絡(luò)性能,但是增大到一定程度會(huì)出現(xiàn)網(wǎng)絡(luò)退化現(xiàn)象,ResNet通過(guò)添加殘差連接解決了網(wǎng)絡(luò)深度問(wèn)題。GooleNet中提出的inception模型提出了另一種提高網(wǎng)絡(luò)性能的方案,與ResNet增加網(wǎng)絡(luò)深度不同,Inception模型通過(guò)增加網(wǎng)絡(luò)“寬度”達(dá)到提升網(wǎng)絡(luò)性能的效果。Inception模塊是一種優(yōu)良的局部拓?fù)浣Y(jié)構(gòu),通過(guò)對(duì)輸入圖像并行地執(zhí)行多種不同尺寸的卷積核進(jìn)行卷積運(yùn)算或池化操作,然后將并行的所有輸出結(jié)果拼接為一個(gè)特征圖。如Inception利用11、33和55三種尺寸卷積核對(duì)輸入圖像進(jìn)行卷積和池化操作,然后將其獲得所有不同信息綜合起來(lái)獲得更好的特征提取性能。如下圖2.7所示:輸入圖像/特征層拼接33卷積55卷積33池化11卷積圖2.7 Inception單元Figur

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論