計算機視覺應用開發(fā)課件:VGG-19_第1頁
計算機視覺應用開發(fā)課件:VGG-19_第2頁
計算機視覺應用開發(fā)課件:VGG-19_第3頁
計算機視覺應用開發(fā)課件:VGG-19_第4頁
計算機視覺應用開發(fā)課件:VGG-19_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

VGG-19VGG-19的由來01任務結構解析02任務學習目標了解VGG-19的由來掌握VGG-19的網(wǎng)絡結構1VGG-19的由來1VGG-19的由來2014年,牛津大學計算機視覺組(VisualGeometryGroup)和GoogleDeepMind公司的研究員一起提出了一種新的深度卷積神經(jīng)網(wǎng)絡:VGGNet,并取得了ILSVRC2014比賽分類項目的第二名。VGGNet的主要貢獻是使用很小的卷積核(3×3)構建各種深度的卷積神經(jīng)網(wǎng)絡結構,并對這些網(wǎng)絡結構進行了評估,最終證明在16-19層的網(wǎng)絡深度能夠取得較好的識別精度。這也就是常用來提取圖像特征的VGG-16和VGG-19。2結構解析2結構解析VGG-19整體由五個卷積塊和3個全連接層組成,每個卷積塊由不同層數(shù)的卷積層構成。其中第一,二個卷積塊分別有兩個卷積層,第三,四,五個卷積塊分別有四個卷積層。那VGG-19中的19是怎么來的?這里的19只算了卷積層(16層)和全連接層(3層)的數(shù)量,沒有包括池化層。VGG-19的輸入為224×224×3的圖像,并且對圖像做了均值處理,在每個像素中減去在訓練集上計算的RGB均值。2結構解析VGG-19中使用的都是3×3的卷積核,來代替比較大的卷積核,并且使用了連續(xù)多個卷積層。使用小的卷積核的問題是,其感受野必然變小,但使用連續(xù)的卷積核,可以增大感受野。卷積的固定步長為1,并在圖像的邊緣填充1個像素,這樣卷積后保持圖像的分辨率不變;連續(xù)的卷積層(卷積塊)后會接著一個池化層,做最大池化,步長為2;最后一層卷積層之后,接著的是3個全連接層,前兩個每個都有4096個通道,第三是輸出層輸出1000個分類。2結構解析2結構解析VGG-19優(yōu)勢:VGG-19的結構很是簡潔,整個網(wǎng)絡都使用了一樣大小的卷積核尺寸(3×3)和最大池化尺寸(2×2)。幾個小濾波器(3×3)卷積層的組合比一個大濾波器(5×5或7×7)卷積層好,驗證了經(jīng)過不斷加深網(wǎng)絡結構能夠提高性能。VGG-19缺點:VGG-19耗費更多計算資源,而且使用了更多的參數(shù),致使更多的內(nèi)存占用(140M)。其中絕大多數(shù)的參數(shù)都是來自于第一個全連接層。VGG-19但是有3個全連接層。注:不少pretrained的方法就是使用VGG的model(主要是16和19),VGG相對其余的方法,參數(shù)空間很大,最終的model有500多m,AlexNet只有200m,GoogLeNet更少,因此train一個V

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論