【圖像分類探析綜述1700字】_第1頁
【圖像分類探析綜述1700字】_第2頁
【圖像分類探析綜述1700字】_第3頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

圖像分類分析綜述目錄TOC\o"1-2"\h\u12312圖像分類分析綜述 1284391.1傳統(tǒng)圖像分類算法 1132561.2卷積神經(jīng)網(wǎng)絡圖像分類 2190344.產(chǎn)生分類器,進行預測識別 2234632.3小樣本數(shù)據(jù)集微調(diào) 2245492.3.1正則化 2177112.3.2拓展數(shù)據(jù)集 3圖像分類的任務就是對于給定的一個圖像,通過運算能夠正確得到該圖像所屬的類別。對于強大的人類視覺系統(tǒng)來說,通過人眼接收到圖像,判別出一個圖像的所屬類別是件很簡單的事,只需根據(jù)這個圖像所具有的特點即可進行相對準確判斷;但是對于計算機來說,計算機對于輸入的圖像得到的是圖像中每個像素的具體數(shù)值,這些數(shù)值并不能為計算機提供便于后續(xù)分類運算操作的有效語義信息。以一個RGB圖像為例,假設(shè)圖像的尺寸是32*32,那么計算機接收到的就是一個形狀為3*32*32的高維矩陣,或者更正式將該矩陣命名為“張量”(“張量”簡單來說就是高維的矩陣),故計算機進行圖像分類任務其實是尋找一個函數(shù)關(guān)系,通過這個函數(shù)關(guān)系能夠?qū)⑦@些像素的數(shù)值映射到某一個具體的類別(類別可以用某個具體數(shù)值表示)[9]。1.1傳統(tǒng)圖像分類算法通常完整建立圖像識別模型一般包括底層特征提取、特征編碼、空間特征約束、分類器設(shè)計、模型融合等幾個階段。1.底層特征提?。簭膱D像中按照固定步長和尺度提取大量局部特征,一般也采用多種特征描述,防止丟失過多的有用信息。2.特征編碼:提取到的底層特征中一般都包含了大量冗余與噪聲,為了提高特征表達的魯棒性,需要一種特征變換算法完成對底層特征的編碼,該算法稱作特征編碼。3.空間特征約束:進行特征編碼之后一般會經(jīng)歷空間特征約束過程,也稱作特征匯聚。特征匯聚是指在一個空間區(qū)域范圍內(nèi),每一維特征取最大值或平均值,獲得一定特征不變形的特征表達。4.通過分類器分類:經(jīng)過上述步驟之后可以使用一個固定維度的向量描述輸入圖像,后通過分類器針對所提取的特征對圖像進行分類。1.2卷積神經(jīng)網(wǎng)絡圖像分類基于深度學習的圖像分類,選定某一基礎(chǔ)神經(jīng)網(wǎng)絡作為基礎(chǔ)分類神經(jīng)網(wǎng)絡,將基礎(chǔ)圖像數(shù)據(jù)集分為訓練集和測試集,用訓練集對神經(jīng)網(wǎng)絡進行遷移學習(將神經(jīng)網(wǎng)絡當作分類器),當訓練達到滿意效果后用測試集測試該網(wǎng)絡模型的分類效果,最后調(diào)用遷移學習完成的模型得到圖像分類結(jié)果[10]。CNN網(wǎng)絡主要特點是使用卷積層模擬人的視覺神經(jīng)通過卷積運算進行特征提取,使單個神經(jīng)元只對某種特定的圖像特征做出響應,比如圖像橫向或者縱向的邊緣,單個神經(jīng)元本身非常簡單,但是將這些簡單的單體神經(jīng)元構(gòu)筑成一個完整層次結(jié)構(gòu),在層數(shù)疊加足夠多后,就可以獲取足夠豐富的特征,特征越豐富,后續(xù)預測分類效果越好。卷積層初步提取特征:通過將卷積核大小不斷進行修改,以此確定使得初步表征圖片特征的有用的卷積核是哪些,再得到與相應的卷積核相乘后的輸出矩陣。池化層提取主要特征:對卷積層輸出的特征向量進行降維操作,只保留最有用的圖片信息,減少噪聲的傳遞。全連接層將各部分特征匯總:重新切割池化層輸出的張量使其成為一些向量,與權(quán)重矩陣相乘,加上偏置值,然后對其使用RELU激活函數(shù),用梯度下降法優(yōu)化參數(shù)。產(chǎn)生分類器,進行預測識別2.3小樣本數(shù)據(jù)集微調(diào)在課題實際操作過程中,數(shù)據(jù)集過小會導致模型過擬合,而大型數(shù)據(jù)集的收集也存在操作難度,如何提高小樣本數(shù)據(jù)的泛化能力減少模型過擬合就成為一個網(wǎng)絡模型遷移學習中重要問題。在遷移學習中通過微調(diào)方法改變小樣本數(shù)據(jù)集能夠較好解決小樣本數(shù)據(jù)集過擬合問題,使模型具有更好的分類預測結(jié)果。以下為常用機器學習提高泛化能力方法[11]。2.3.1正則化在卷積神經(jīng)網(wǎng)絡模型的網(wǎng)絡層對權(quán)重、偏置向量或是輸出加入正則化項進行優(yōu)化,這些項目和損失函數(shù)共同作為神經(jīng)網(wǎng)絡的最終優(yōu)化目標,能夠減少因數(shù)據(jù)集過小導致的過擬合現(xiàn)象?;蛘呖梢栽诰矸e神經(jīng)網(wǎng)絡中加入Dropout項/層,在模型訓練時隨機暫停工作網(wǎng)絡模型某些隱含層神經(jīng)元的權(quán)重,并暫時將其暫停工作的節(jié)點從網(wǎng)絡結(jié)構(gòu)中取出,認為暫時不屬于該網(wǎng)絡結(jié)構(gòu),但保留節(jié)點對應權(quán)重。通常情況下,通過調(diào)整Dropout項可有效減少過擬合的影響。2.3.2拓展數(shù)據(jù)集小樣本數(shù)據(jù)在模型的應用中為得到較好分度精度,可使用數(shù)據(jù)增強方法對待檢測圖像進行處理,如:旋轉(zhuǎn),將圖像隨機旋轉(zhuǎn)一定角度,改變圖像內(nèi)容的朝向;翻轉(zhuǎn)變換,沿水平或垂直對圖像進行翻轉(zhuǎn);縮放變換,按一定比例放大或縮小圖像;平移變換,對圖像

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論