計算機視覺概述_第1頁
計算機視覺概述_第2頁
計算機視覺概述_第3頁
計算機視覺概述_第4頁
計算機視覺概述_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上計算機視覺是指用攝像機和計算機代替人眼對目標進行識別、跟蹤和測量等圖像分類圖像分類問題是通過對圖像的分析,將圖像劃歸為若干個類別中的某一種,主要強調(diào)對圖像整體的 語義進行 判 定。 是一個層的卷積神經(jīng)網(wǎng)絡(luò),前 層是卷積層,后層為全連接層,其中最后一層采用進行分類。該模型采用 ()來取代傳統(tǒng)的和函數(shù)作為神經(jīng)元的非線性激活函數(shù),并提出了 方法 來減輕過擬合問題。物體檢測圖像檢測是指在分類圖像的同時把物體用矩形框給圈起來。從14年到16年,先后涌現(xiàn)出R-CNN,Fast R-CNN, Faster R-CNN, YOLO, SSD等知名框架,其檢測平均精度(mAP),在計算

2、機視覺一個知名數(shù)據(jù)集上PASCAL VOC上的檢測平均精度(mAP),也從R-CNN的53.3%,到Fast RCNN的68.4%,再到Faster R-CNN的75.9%,最新實驗顯示,F(xiàn)aster RCNN結(jié)合殘差網(wǎng)(Resnet-101),其檢測精度可以達到83.8%。深度學(xué)習(xí)檢測速度也越來越快,從最初的RCNN模型,處理一張圖片要用2秒多,到Faster RCNN的198毫秒/張,再到Y(jié)OLO的155幀/秒(其缺陷是精度較低,只有52.7%),最后出來了精度和速度都較高的SSD,精度75.1%,速度23幀/秒。圖像檢測示例姿態(tài)估計正確快速地識別和理解圖像中人的 姿 態(tài) 動 作姿態(tài)估計的

3、主要任務(wù)就是,給定一張圖,圖中會有一個 人,你 需 要 給 出 這 個 人 的 姿 態(tài) 動 作 是 什 么 樣 的。人們會提前選定出比較重要的幾個人體關(guān)節(jié)(比如肩膀、肘部、脖子等),然后用一個固定維數(shù)(比如維和維)的坐標向量來表示這個動作,每一維都表示圖中人物的重要關(guān)節(jié)所在的具體坐標,如圖 所示。換句話說,你需要給出一個火柴人的形狀來表示這個人的姿態(tài)。圖像分割它的目的是把圖像中各種不同物體給用不同顏色分割出來,如下圖所示,圖像分割的例子人臉識別人臉識別系統(tǒng)主要包括四個組成部分,分別為:人臉圖像采集及檢測、人臉圖像預(yù)處理、人臉圖像特征提取以及匹配與識別。 人臉圖像采集及檢測人臉圖像采集

4、:不同的人臉圖像都能通過攝像鏡頭采集下來,比如靜態(tài)圖像、動態(tài)圖像、不同的位置、不同表情等方面都可以得到很好的采集。當(dāng)用戶在采集設(shè)備的拍攝范圍內(nèi)時,采集設(shè)備會自動搜索并拍攝用戶的人臉圖像。 人臉檢測:人臉檢測在實際中主要用于人臉識別的預(yù)處理,即在圖像中準確標定出人臉的位置和大小。人臉圖像中包含的模式特征十分豐富,如直方圖特征、顏色特征、模板特征、結(jié)構(gòu)特征及Haar特征等。人臉檢測就是把這其中有用的信息挑出來,并利用這些特征實現(xiàn)人臉檢測。 主流的人臉檢測方法基于以上特征采用Adaboost學(xué)習(xí)算法,Adaboost算法是一種用來分類的方法,它把一些比較弱的分類方法合在一起,組合

5、出新的很強的分類方法。 人臉檢測過程中使用Adaboost算法挑選出一些最能代表人臉的矩形特征(弱分類器),按照加權(quán)投票的方式將弱分類器構(gòu)造為一個強分類器,再將訓(xùn)練得到的若干強分類器串聯(lián)組成一個級聯(lián)結(jié)構(gòu)的層疊分類器,有效地提高分類器的檢測速度。 人臉圖像預(yù)處理人臉圖像預(yù)處理:對于人臉的圖像預(yù)處理是基于人臉檢測結(jié)果,對圖像進行處理并最終服務(wù)于特征提取的過程。系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機 干擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預(yù)處理。對于人臉圖像而言,其預(yù)處理過程主要包括人臉圖像的光線補 償、灰度變換、直方圖均衡化、歸

6、一化、幾何校正、濾波以及銳化等。 人臉圖像特征提取 人臉圖像特征提?。喝四樧R別系統(tǒng)可使用的特征通常分為視覺特征、像素統(tǒng)計特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù) 特征等。人臉特征提取就是針對人臉的某些特征進行的。人臉特征提取,也稱人臉表征,它是對人臉進行特征建模的過程。人臉特征提取的方法歸納起來分為兩大 類:一種是基于知識的表征方法;另外一種是基于代數(shù)特征或統(tǒng)計學(xué)習(xí)的表征方法。 基于知識的表征方法主要是根據(jù)人臉器官的形狀描述以及他們之間的距離特性來獲得有助于人臉分類的特征數(shù)據(jù),其特征分 量通常包括特征點間的歐氏距離、曲率和角度等。人臉由眼睛、鼻子、嘴、下巴等局部構(gòu)成,對這些局部和它們之間結(jié)構(gòu)關(guān)系的幾何描述,可作為識別人臉的重要特 征,這些特征被稱為幾何特征?;谥R的人臉表征主要包括基于幾何特征的方法和模板匹配法。 人臉圖像匹配與識別人臉圖像匹配與識別:提取的人臉圖像的特征數(shù)據(jù)與數(shù)據(jù)庫中存儲的特征模板進行搜索匹配,通過設(shè)定一個閾值,當(dāng)相似度超過這一閾值,則把匹配得到的結(jié)果輸 出。人臉識別就是將待識

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論