人工智能創(chuàng)新實(shí)驗(yàn)教程課件第14章卷積神經(jīng)網(wǎng)絡(luò)

上傳人：q*** IP屬地：山東上傳時(shí)間：2024-06-17 格式：PPTX 頁(yè)數(shù)：22 大?。?.63MB 積分：15 舉報(bào) 版權(quán)申訴

人工智能創(chuàng)新實(shí)驗(yàn)教程課件第14章卷積神經(jīng)網(wǎng)絡(luò)_第2頁(yè)

人工智能創(chuàng)新實(shí)驗(yàn)教程課件第14章卷積神經(jīng)網(wǎng)絡(luò)_第3頁(yè)

人工智能創(chuàng)新實(shí)驗(yàn)教程課件第14章卷積神經(jīng)網(wǎng)絡(luò)_第4頁(yè)

人工智能創(chuàng)新實(shí)驗(yàn)教程課件第14章卷積神經(jīng)網(wǎng)絡(luò)_第5頁(yè)

已閱讀5頁(yè)，還剩17頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

寧夏大學(xué)

第十四章卷積神經(jīng)網(wǎng)絡(luò)2目錄

CONTENT01引言02模型概述03實(shí)驗(yàn)數(shù)據(jù)04模型構(gòu)建05本章小結(jié)引言01引言在簡(jiǎn)單學(xué)習(xí)深度學(xué)習(xí)的背景和上一章較為基礎(chǔ)的感知機(jī)算法后，本章節(jié)將學(xué)習(xí)深度學(xué)習(xí)經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)是一種具有局部連接、權(quán)重共享等特性的深層前饋神經(jīng)網(wǎng)絡(luò)。最早主要是用來處理圖像信息。卷積神經(jīng)網(wǎng)絡(luò)在短時(shí)間內(nèi)，變成了一種顛覆性的技術(shù)，打破了從文本、視頻到語音等多個(gè)領(lǐng)域所有最先進(jìn)的算法，遠(yuǎn)遠(yuǎn)超出了其最初在圖像處理的應(yīng)用范圍。模型概述021卷積神經(jīng)網(wǎng)絡(luò)的產(chǎn)生6卷積神經(jīng)網(wǎng)絡(luò)是受生物學(xué)上感受野機(jī)制的啟發(fā)而提出的。舉個(gè)簡(jiǎn)單而直觀例子來了解感受野，人眼看到物體的情況，如下圖所示：圖中眼睛里其中的一個(gè)神經(jīng)元，它會(huì)盯著圖像，但它并不會(huì)盯著圖像的每一個(gè)像素，它只會(huì)盯著圖像的一部分。盯的一部分，稱為感受野，也就是感受一部分視野。另外一個(gè)神經(jīng)元它又會(huì)盯著另外的一部分，但是它們有重疊。這就相當(dāng)于一些神經(jīng)元看線，另外一些神經(jīng)元會(huì)看線的方向，這些線和方向會(huì)組合成一些更大的感受野，然后組成一些基礎(chǔ)圖像，基礎(chǔ)圖像再組合成我們的所看到的圖像。2卷積神經(jīng)網(wǎng)絡(luò)基本機(jī)構(gòu)7目前的卷積神經(jīng)網(wǎng)絡(luò)一般是由卷積層、匯聚（池化）層和全連接層交叉堆疊而成的前饋神經(jīng)網(wǎng)絡(luò)。卷積神經(jīng)網(wǎng)絡(luò)主要有兩個(gè)結(jié)構(gòu)上的特性：局部連接、權(quán)重共享。這些特性使得卷積神經(jīng)網(wǎng)絡(luò)具有一定程度上的平移、縮放和旋轉(zhuǎn)不變性。和前饋神經(jīng)網(wǎng)絡(luò)相比，卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)更少。積神經(jīng)網(wǎng)絡(luò)主要使用在圖像和視頻分析的各種任務(wù)（比如圖像分類、人臉識(shí)別、物體識(shí)別、圖像分割等）上，其準(zhǔn)確率一般也遠(yuǎn)遠(yuǎn)超出了其他的神經(jīng)網(wǎng)絡(luò)模型。下圖給出一種經(jīng)典的卷積網(wǎng)絡(luò)結(jié)構(gòu)用于圖像分類的一種卷積神經(jīng)網(wǎng)絡(luò)2.1卷積層8為什么要使用卷積方法：

用全連接神經(jīng)網(wǎng)絡(luò)處理大尺寸圖像具有三個(gè)明顯的缺點(diǎn)：（1）首先將圖像展開為向量會(huì)丟失空間信息；（2）其次參數(shù)過多效率低下，訓(xùn)練困難；（3）同時(shí)大量的參數(shù)也很快會(huì)導(dǎo)致網(wǎng)絡(luò)過擬合。而使用卷積神經(jīng)網(wǎng)絡(luò)可以很好地解決上面的三個(gè)問題。卷積層的作用：1.

濾波器的作用。卷積層的參數(shù)是有一些可學(xué)習(xí)的濾波器集合構(gòu)成的。每個(gè)濾波器在空間上都比較小，但是深度和輸入數(shù)據(jù)一致。直觀地來說，網(wǎng)絡(luò)會(huì)讓濾波器學(xué)習(xí)到當(dāng)它看到某些類型的視覺特征時(shí)就激活。2.

可以被看做是神經(jīng)元的一個(gè)輸出。神經(jīng)元只觀察輸入數(shù)據(jù)中的一小部分，并且和空間上左右兩邊的所有神經(jīng)元共享參數(shù)（因?yàn)檫@些數(shù)字都是使用同一個(gè)濾波器得到的結(jié)果）。3.

降低參數(shù)的數(shù)量。這個(gè)由于卷積具有“權(quán)值共享”這樣的特性，可以降低參數(shù)數(shù)量，達(dá)到降低計(jì)算開銷，防止由于參數(shù)過多而造成過擬合。2.1卷積層9卷積層最主要的兩個(gè)特征就是局部連接和權(quán)值共享。

所謂局部連接，就是卷積層的節(jié)點(diǎn)僅僅和其前一層的部分節(jié)點(diǎn)相連接，只用來學(xué)習(xí)局部特征。局部感知結(jié)構(gòu)的構(gòu)思理念來源于動(dòng)物視覺的皮層結(jié)構(gòu)，其指的是動(dòng)物視覺的神經(jīng)元在感知外界物體的過程中起作用的只有一部分神經(jīng)元。

在計(jì)算機(jī)視覺中，圖像中的某一塊區(qū)域中，像素之間的相關(guān)性與像素之間的距離同樣相關(guān)，距離較近的像素間相關(guān)性強(qiáng)，距離較遠(yuǎn)則相關(guān)性就比較弱，由此可見局部相關(guān)性理論也適用于計(jì)算機(jī)視覺的圖像處理領(lǐng)域。因此，局部感知采用部分神經(jīng)元接受圖像信息，再通過綜合全部的圖像信息達(dá)到增強(qiáng)圖像信息的目的。這種局部連接的方式大幅減少了參數(shù)數(shù)量，加快了學(xué)習(xí)速率，同時(shí)也在一定程度上減少了過擬合的可能。2卷積層特點(diǎn)10卷積層的另一大特征是權(quán)值共享，比如一個(gè)3*3的卷積核，共9個(gè)參數(shù)，它會(huì)和輸入圖片的不同區(qū)域作卷積，來檢測(cè)相同的特征。而只有不同的卷積核才會(huì)對(duì)應(yīng)不同的權(quán)值參數(shù)，來檢測(cè)不同的特征。如下圖所示，通過權(quán)值共享的方法，這里一共只有3組不同的權(quán)值，如果只用了局部連接的方法，共需要3*4=12個(gè)權(quán)值參數(shù)，而加上了權(quán)值共享的方法后，現(xiàn)在僅僅需要3個(gè)權(quán)值，更進(jìn)一步地減少參數(shù)數(shù)量。2.1卷積層11如圖可以看到如下幾個(gè)參數(shù)：兩個(gè)神經(jīng)元，即depth=2，意味著有兩個(gè)濾波器。數(shù)據(jù)窗口每次移動(dòng)兩個(gè)步長(zhǎng)取3*3的局部數(shù)據(jù)，取stride=2、zero-padding=1。然后分別以兩個(gè)濾波器filter為軸滑動(dòng)數(shù)組進(jìn)行卷積計(jì)算，得到兩組不同的結(jié)果。

左邊是輸入（7*7*3中，7*7代表圖像的像素/長(zhǎng)寬，3代表R、G、B三個(gè)顏色通道）中間部分是兩個(gè)不同的濾波器Filterw0、Filterw1最右邊則是兩個(gè)不同的輸出、隨著左邊數(shù)據(jù)窗口的平移滑動(dòng)，濾波器Filterw0/

Filterw1對(duì)不同的局部數(shù)據(jù)進(jìn)行卷積計(jì)算。為更好理解卷積層，下圖給出卷積層運(yùn)作動(dòng)態(tài)圖：2.2池化層12通常在連續(xù)的卷積層之間會(huì)周期性地插入一個(gè)池化層。它的作用是逐漸降低數(shù)據(jù)體的空間尺寸，這樣的話就能減少網(wǎng)絡(luò)中參數(shù)的數(shù)量，使得計(jì)算資源耗費(fèi)變少，也能有效控制過擬合。

池化的做法是對(duì)圖像的某一個(gè)區(qū)域用一個(gè)值代替，如最大值或平均值。如果采用最大值，叫做max池化；如果采用均值，叫做mean池化。

除了降低圖像尺寸之外，下采樣帶來的另外一個(gè)好處是平移、旋轉(zhuǎn)不變性，因?yàn)檩敵鲋涤蓤D像的一片區(qū)域計(jì)算得到，對(duì)于平移和旋轉(zhuǎn)并不敏感。對(duì)平移和旋轉(zhuǎn)不敏感mean池化和max池化都可以完成下采樣操作，前者是線性函數(shù)，而后者是非線性函數(shù)，一般情況下max池化有更好的效果。

下圖給出池化動(dòng)態(tài)執(zhí)行過程：2.3全連接層13

卷積取的是局部特征，全連接就是把以前的局部特征重新通過權(quán)值矩陣組裝成完整的圖。因?yàn)橛玫搅怂械木植刻卣?，所以叫全連接。和常規(guī)神經(jīng)網(wǎng)絡(luò)中一樣，它們的激活可以先用矩陣乘法，再加上偏差。全連接層，是每一個(gè)結(jié)點(diǎn)都與上一層的所有結(jié)點(diǎn)相連，用來把前邊提取到的特征綜合起來。由于其全相連的特性，一般全連接層的參數(shù)也是最多的。例如在VGG16中，第一個(gè)全連接層FC1有4096個(gè)節(jié)點(diǎn)，上一層POOL2是7*7*512=25088個(gè)節(jié)點(diǎn)，則該傳輸需要4096*25088個(gè)權(quán)值，需要耗很大的內(nèi)存。下圖為一個(gè)經(jīng)典的三通道圖像在卷積后的全連接操作：實(shí)驗(yàn)數(shù)據(jù)031數(shù)據(jù)準(zhǔn)備數(shù)據(jù)集介紹：MNIST是一個(gè)手寫體數(shù)字的圖片數(shù)據(jù)集，該數(shù)據(jù)集來由美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究所發(fā)起并整理，該數(shù)據(jù)集的收集目的是希望通過算法，實(shí)現(xiàn)對(duì)手寫數(shù)字的識(shí)別。

訓(xùn)練集一共包含了60,000張圖像和標(biāo)簽，而測(cè)試集一共包含了10,000張圖像和標(biāo)簽?？梢詮腜ytorch中導(dǎo)入MNIST數(shù)據(jù)集。程序會(huì)檢查用戶目錄下是否已下載MNIST數(shù)據(jù)集文件，若有則會(huì)直接調(diào)用該數(shù)據(jù)集，并將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)、測(cè)試數(shù)據(jù)；若沒有該文件則會(huì)自動(dòng)下載，并完成數(shù)據(jù)劃分。

右圖為MNIST數(shù)據(jù)集部分?jǐn)?shù)據(jù)：2數(shù)據(jù)處理16在數(shù)據(jù)處理過程中首先導(dǎo)入數(shù)據(jù)集并將數(shù)據(jù)切割后放入集合當(dāng)中，具體實(shí)現(xiàn)步驟如下所示：之后將numpy圖像數(shù)據(jù)轉(zhuǎn)換為GPU可使用的tensor格式數(shù)據(jù)，Pytorch提供transforms函數(shù)進(jìn)行格式轉(zhuǎn)換，代碼如下：模型構(gòu)建041網(wǎng)絡(luò)搭建18本次CNN構(gòu)建將使用ReLU作為激活函數(shù)，采用MaxPool池化方法，訓(xùn)練時(shí)使用交叉熵?fù)p失函數(shù)，并使用Adam方法進(jìn)行優(yōu)化。在之前相關(guān)激活函數(shù)已經(jīng)介紹，再次不在贅述。右邊給出基礎(chǔ)卷積神經(jīng)網(wǎng)絡(luò)的搭建方式，本實(shí)驗(yàn)僅實(shí)現(xiàn)兩層網(wǎng)絡(luò)，有興趣的同學(xué)可自行實(shí)現(xiàn)多層網(wǎng)絡(luò)并對(duì)比網(wǎng)絡(luò)層數(shù)與準(zhǔn)確率關(guān)系。實(shí)驗(yàn)環(huán)境為： PyTorch>=1.6 Python>=3.6

以及相關(guān)基礎(chǔ)庫(kù)2結(jié)果分析19在訓(xùn)練集上訓(xùn)練好模型后將測(cè)試集數(shù)據(jù)輸入模型，其輸出的預(yù)測(cè)數(shù)字與測(cè)試集中的標(biāo)簽作對(duì)比，檢驗(yàn)?zāi)Ｐ偷挠行?。代碼如下：由訓(xùn)練結(jié)果可知2層CNN模型對(duì)MNIST數(shù)據(jù)集的分類準(zhǔn)確率為97.6%，測(cè)試結(jié)果與訓(xùn)練集相當(dāng)，說明模型未出現(xiàn)過擬合、欠擬合現(xiàn)象模型是有效的。本章小結(jié)0521卷積神經(jīng)網(wǎng)絡(luò)是受生物學(xué)上感受野機(jī)制啟發(fā)而提出的。本章簡(jiǎn)要介紹了CNN個(gè)工作流程、圖片卷積、激活、池化等，在MNIST數(shù)據(jù)集上實(shí)現(xiàn)了CNN手寫字體分類目前，卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)成為計(jì)算機(jī)視覺領(lǐng)域的主流模型。

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

人工智能創(chuàng)新實(shí)驗(yàn)教程課件第14章卷積神經(jīng)網(wǎng)絡(luò)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

人工智能創(chuàng)新實(shí)驗(yàn)教程 課件 第14章 卷積神經(jīng)網(wǎng)絡(luò)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

人工智能創(chuàng)新實(shí)驗(yàn)教程課件第14章卷積神經(jīng)網(wǎng)絡(luò)