人工智能創(chuàng)新實(shí)驗(yàn)教程 課件 第14章 卷積神經(jīng)網(wǎng)絡(luò)_第1頁(yè)
人工智能創(chuàng)新實(shí)驗(yàn)教程 課件 第14章 卷積神經(jīng)網(wǎng)絡(luò)_第2頁(yè)
人工智能創(chuàng)新實(shí)驗(yàn)教程 課件 第14章 卷積神經(jīng)網(wǎng)絡(luò)_第3頁(yè)
人工智能創(chuàng)新實(shí)驗(yàn)教程 課件 第14章 卷積神經(jīng)網(wǎng)絡(luò)_第4頁(yè)
人工智能創(chuàng)新實(shí)驗(yàn)教程 課件 第14章 卷積神經(jīng)網(wǎng)絡(luò)_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

寧夏大學(xué)

第十四章卷積神經(jīng)網(wǎng)絡(luò)2目錄

CONTENT01引言02模型概述03實(shí)驗(yàn)數(shù)據(jù)04模型構(gòu)建05本章小結(jié)引言01引言在簡(jiǎn)單學(xué)習(xí)深度學(xué)習(xí)的背景和上一章較為基礎(chǔ)的感知機(jī)算法后,本章節(jié)將學(xué)習(xí)深度學(xué)習(xí)經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)是一種具有局部連接、權(quán)重共享等特性的深層前饋神經(jīng)網(wǎng)絡(luò)。最早主要是用來處理圖像信息。卷積神經(jīng)網(wǎng)絡(luò)在短時(shí)間內(nèi),變成了一種顛覆性的技術(shù),打破了從文本、視頻到語音等多個(gè)領(lǐng)域所有最先進(jìn)的算法,遠(yuǎn)遠(yuǎn)超出了其最初在圖像處理的應(yīng)用范圍。模型概述021卷積神經(jīng)網(wǎng)絡(luò)的產(chǎn)生6卷積神經(jīng)網(wǎng)絡(luò)是受生物學(xué)上感受野機(jī)制的啟發(fā)而提出的。舉個(gè)簡(jiǎn)單而直觀例子來了解感受野,人眼看到物體的情況,如下圖所示:圖中眼睛里其中的一個(gè)神經(jīng)元,它會(huì)盯著圖像,但它并不會(huì)盯著圖像的每一個(gè)像素,它只會(huì)盯著圖像的一部分。盯的一部分,稱為感受野,也就是感受一部分視野。另外一個(gè)神經(jīng)元它又會(huì)盯著另外的一部分,但是它們有重疊。這就相當(dāng)于一些神經(jīng)元看線,另外一些神經(jīng)元會(huì)看線的方向,這些線和方向會(huì)組合成一些更大的感受野,然后組成一些基礎(chǔ)圖像,基礎(chǔ)圖像再組合成我們的所看到的圖像。2卷積神經(jīng)網(wǎng)絡(luò)基本機(jī)構(gòu)7目前的卷積神經(jīng)網(wǎng)絡(luò)一般是由卷積層、匯聚(池化)層和全連接層交叉堆疊而成的前饋神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)主要有兩個(gè)結(jié)構(gòu)上的特性:局部連接、權(quán)重共享。這些特性使得卷積神經(jīng)網(wǎng)絡(luò)具有一定程度上的平移、縮放和旋轉(zhuǎn)不變性。和前饋神經(jīng)網(wǎng)絡(luò)相比,卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)更少。積神經(jīng)網(wǎng)絡(luò)主要使用在圖像和視頻分析的各種任務(wù)(比如圖像分類、人臉識(shí)別、物體識(shí)別、圖像分割等)上,其準(zhǔn)確率一般也遠(yuǎn)遠(yuǎn)超出了其他的神經(jīng)網(wǎng)絡(luò)模型。下圖給出一種經(jīng)典的卷積網(wǎng)絡(luò)結(jié)構(gòu)用于圖像分類的一種卷積神經(jīng)網(wǎng)絡(luò)2.1卷積層8為什么要使用卷積方法:

用全連接神經(jīng)網(wǎng)絡(luò)處理大尺寸圖像具有三個(gè)明顯的缺點(diǎn):(1)首先將圖像展開為向量會(huì)丟失空間信息;(2)其次參數(shù)過多效率低下,訓(xùn)練困難;(3)同時(shí)大量的參數(shù)也很快會(huì)導(dǎo)致網(wǎng)絡(luò)過擬合。而使用卷積神經(jīng)網(wǎng)絡(luò)可以很好地解決上面的三個(gè)問題。卷積層的作用:1.

濾波器的作用。卷積層的參數(shù)是有一些可學(xué)習(xí)的濾波器集合構(gòu)成的。每個(gè)濾波器在空間上都比較小,但是深度和輸入數(shù)據(jù)一致。直觀地來說,網(wǎng)絡(luò)會(huì)讓濾波器學(xué)習(xí)到當(dāng)它看到某些類型的視覺特征時(shí)就激活。2.

可以被看做是神經(jīng)元的一個(gè)輸出。神經(jīng)元只觀察輸入數(shù)據(jù)中的一小部分,并且和空間上左右兩邊的所有神經(jīng)元共享參數(shù)(因?yàn)檫@些數(shù)字都是使用同一個(gè)濾波器得到的結(jié)果)。3.

降低參數(shù)的數(shù)量。這個(gè)由于卷積具有“權(quán)值共享”這樣的特性,可以降低參數(shù)數(shù)量,達(dá)到降低計(jì)算開銷,防止由于參數(shù)過多而造成過擬合。2.1卷積層9卷積層最主要的兩個(gè)特征就是局部連接和權(quán)值共享。

所謂局部連接,就是卷積層的節(jié)點(diǎn)僅僅和其前一層的部分節(jié)點(diǎn)相連接,只用來學(xué)習(xí)局部特征。局部感知結(jié)構(gòu)的構(gòu)思理念來源于動(dòng)物視覺的皮層結(jié)構(gòu),其指的是動(dòng)物視覺的神經(jīng)元在感知外界物體的過程中起作用的只有一部分神經(jīng)元。

在計(jì)算機(jī)視覺中,圖像中的某一塊區(qū)域中,像素之間的相關(guān)性與像素之間的距離同樣相關(guān),距離較近的像素間相關(guān)性強(qiáng),距離較遠(yuǎn)則相關(guān)性就比較弱,由此可見局部相關(guān)性理論也適用于計(jì)算機(jī)視覺的圖像處理領(lǐng)域。因此,局部感知采用部分神經(jīng)元接受圖像信息,再通過綜合全部的圖像信息達(dá)到增強(qiáng)圖像信息的目的。這種局部連接的方式大幅減少了參數(shù)數(shù)量,加快了學(xué)習(xí)速率,同時(shí)也在一定程度上減少了過擬合的可能。2卷積層特點(diǎn)10卷積層的另一大特征是權(quán)值共享,比如一個(gè)3*3的卷積核,共9個(gè)參數(shù),它會(huì)和輸入圖片的不同區(qū)域作卷積,來檢測(cè)相同的特征。而只有不同的卷積核才會(huì)對(duì)應(yīng)不同的權(quán)值參數(shù),來檢測(cè)不同的特征。如下圖所示,通過權(quán)值共享的方法,這里一共只有3組不同的權(quán)值,如果只用了局部連接的方法,共需要3*4=12個(gè)權(quán)值參數(shù),而加上了權(quán)值共享的方法后,現(xiàn)在僅僅需要3個(gè)權(quán)值,更進(jìn)一步地減少參數(shù)數(shù)量。2.1卷積層11如圖可以看到如下幾個(gè)參數(shù):兩個(gè)神經(jīng)元,即depth=2,意味著有兩個(gè)濾波器。數(shù)據(jù)窗口每次移動(dòng)兩個(gè)步長(zhǎng)取3*3的局部數(shù)據(jù),取stride=2、zero-padding=1。然后分別以兩個(gè)濾波器filter為軸滑動(dòng)數(shù)組進(jìn)行卷積計(jì)算,得到兩組不同的結(jié)果。

左邊是輸入(7*7*3中,7*7代表圖像的像素/長(zhǎng)寬,3代表R、G、B三個(gè)顏色通道)中間部分是兩個(gè)不同的濾波器Filterw0、Filterw1最右邊則是兩個(gè)不同的輸出、隨著左邊數(shù)據(jù)窗口的平移滑動(dòng),濾波器Filterw0/

Filterw1對(duì)不同的局部數(shù)據(jù)進(jìn)行卷積計(jì)算。為更好理解卷積層,下圖給出卷積層運(yùn)作動(dòng)態(tài)圖:2.2池化層12通常在連續(xù)的卷積層之間會(huì)周期性地插入一個(gè)池化層。它的作用是逐漸降低數(shù)據(jù)體的空間尺寸,這樣的話就能減少網(wǎng)絡(luò)中參數(shù)的數(shù)量,使得計(jì)算資源耗費(fèi)變少,也能有效控制過擬合。

池化的做法是對(duì)圖像的某一個(gè)區(qū)域用一個(gè)值代替,如最大值或平均值。如果采用最大值,叫做max池化;如果采用均值,叫做mean池化。

除了降低圖像尺寸之外,下采樣帶來的另外一個(gè)好處是平移、旋轉(zhuǎn)不變性,因?yàn)檩敵鲋涤蓤D像的一片區(qū)域計(jì)算得到,對(duì)于平移和旋轉(zhuǎn)并不敏感。對(duì)平移和旋轉(zhuǎn)不敏感mean池化和max池化都可以完成下采樣操作,前者是線性函數(shù),而后者是非線性函數(shù),一般情況下max池化有更好的效果。

下圖給出池化動(dòng)態(tài)執(zhí)行過程:2.3全連接層13

卷積取的是局部特征,全連接就是把以前的局部特征重新通過權(quán)值矩陣組裝成完整的圖。因?yàn)橛玫搅怂械木植刻卣?,所以叫全連接。和常規(guī)神經(jīng)網(wǎng)絡(luò)中一樣,它們的激活可以先用矩陣乘法,再加上偏差。全連接層,是每一個(gè)結(jié)點(diǎn)都與上一層的所有結(jié)點(diǎn)相連,用來把前邊提取到的特征綜合起來。由于其全相連的特性,一般全連接層的參數(shù)也是最多的。例如在VGG16中,第一個(gè)全連接層FC1有4096個(gè)節(jié)點(diǎn),上一層POOL2是7*7*512=25088個(gè)節(jié)點(diǎn),則該傳輸需要4096*25088個(gè)權(quán)值,需要耗很大的內(nèi)存。下圖為一個(gè)經(jīng)典的三通道圖像在卷積后的全連接操作:實(shí)驗(yàn)數(shù)據(jù)031數(shù)據(jù)準(zhǔn)備數(shù)據(jù)集介紹:MNIST是一個(gè)手寫體數(shù)字的圖片數(shù)據(jù)集,該數(shù)據(jù)集來由美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究所發(fā)起并整理,該數(shù)據(jù)集的收集目的是希望通過算法,實(shí)現(xiàn)對(duì)手寫數(shù)字的識(shí)別。

訓(xùn)練集一共包含了60,000張圖像和標(biāo)簽,而測(cè)試集一共包含了10,000張圖像和標(biāo)簽??梢詮腜ytorch中導(dǎo)入MNIST數(shù)據(jù)集。程序會(huì)檢查用戶目錄下是否已下載MNIST數(shù)據(jù)集文件,若有則會(huì)直接調(diào)用該數(shù)據(jù)集,并將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)、測(cè)試數(shù)據(jù);若沒有該文件則會(huì)自動(dòng)下載,并完成數(shù)據(jù)劃分。

右圖為MNIST數(shù)據(jù)集部分?jǐn)?shù)據(jù):2數(shù)據(jù)處理16在數(shù)據(jù)處理過程中首先導(dǎo)入數(shù)據(jù)集并將數(shù)據(jù)切割后放入集合當(dāng)中,具體實(shí)現(xiàn)步驟如下所示:之后將numpy圖像數(shù)據(jù)轉(zhuǎn)換為GPU可使用的tensor格式數(shù)據(jù),Pytorch提供transforms函數(shù)進(jìn)行格式轉(zhuǎn)換,代碼如下:模型構(gòu)建041網(wǎng)絡(luò)搭建18本次CNN構(gòu)建將使用ReLU作為激活函數(shù),采用MaxPool池化方法,訓(xùn)練時(shí)使用交叉熵?fù)p失函數(shù),并使用Adam方法進(jìn)行優(yōu)化。在之前相關(guān)激活函數(shù)已經(jīng)介紹,再次不在贅述。右邊給出基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)的搭建方式,本實(shí)驗(yàn)僅實(shí)現(xiàn)兩層網(wǎng)絡(luò),有興趣的同學(xué)可自行實(shí)現(xiàn)多層網(wǎng)絡(luò)并對(duì)比網(wǎng)絡(luò)層數(shù)與準(zhǔn)確率關(guān)系。實(shí)驗(yàn)環(huán)境為: PyTorch>=1.6 Python>=3.6

以及相關(guān)基礎(chǔ)庫(kù)2結(jié)果分析19在訓(xùn)練集上訓(xùn)練好模型后將測(cè)試集數(shù)據(jù)輸入模型,其輸出的預(yù)測(cè)數(shù)字與測(cè)試集中的標(biāo)簽作對(duì)比,檢驗(yàn)?zāi)P偷挠行?。代碼如下:由訓(xùn)練結(jié)果可知2層CNN模型對(duì)MNIST數(shù)據(jù)集的分類準(zhǔn)確率為97.6%,測(cè)試結(jié)果與訓(xùn)練集相當(dāng),說明模型未出現(xiàn)過擬合、欠擬合現(xiàn)象模型是有效的。本章小結(jié)0521卷積神經(jīng)網(wǎng)絡(luò)是受生物學(xué)上感受野機(jī)制啟發(fā)而提出的。本章簡(jiǎn)要介紹了CNN個(gè)工作流程、圖片卷積、激活、池化等,在MNIST數(shù)據(jù)集上實(shí)現(xiàn)了CNN手寫字體分類目前,卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為計(jì)算機(jī)視覺領(lǐng)域的主流模型。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論