版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
計(jì)算機(jī)視覺(jué)課程復(fù)習(xí)資料
目錄
第2節(jié)底層視覺(jué)I深度學(xué)習(xí)初步知識(shí)與特征檢測(cè).............................................2
第3節(jié)底層視覺(jué)II特征點(diǎn)提取、描述與匹配.................................................6
第4節(jié)底層視覺(jué)III圖像分割..............................................................13
第5節(jié)三維視覺(jué)I相機(jī)模型與多視幾何.....................................................16
第6節(jié)三維視覺(jué)II相機(jī)標(biāo)定與稀疏重速....................................................20
第7節(jié)三維視覺(jué)III立體視覺(jué)與三維建模...................................................22
第10節(jié)運(yùn)動(dòng)分析..........25
第11節(jié)視覺(jué)跟蹤..........27
第12節(jié)行為識(shí)別..........28
第13節(jié)計(jì)算機(jī)視覺(jué)中的機(jī)器學(xué)習(xí)方法與人腦工程...........................................31
第14節(jié)物體表達(dá)與場(chǎng)景表達(dá)..............................................................33
第16節(jié)計(jì)算機(jī)視覺(jué)常用優(yōu)化方法..........................................................34
第17節(jié)典型視覺(jué)應(yīng)用及系統(tǒng)..............................................................37
第18節(jié)視覺(jué)測(cè)量及計(jì)算攝影學(xué)簡(jiǎn)介........................................................38
第2節(jié)底層視覺(jué)I深度學(xué)習(xí)初步知識(shí)與特征檢測(cè)
神經(jīng)網(wǎng)絡(luò)的知識(shí)應(yīng)該已經(jīng)爛大街了,全連接,卷積,激活,池化亂七八糟的。
特征提取是計(jì)算機(jī)視覺(jué)的基本步驟,這邊注意一下邊緣,輪廓還有關(guān)鍵點(diǎn)提取。
知識(shí)點(diǎn):神經(jīng)網(wǎng)絡(luò),一階算子(Sobel),二階算子(Laplacian),Canny邊緣檢
測(cè),Harris角點(diǎn),F(xiàn)AST角點(diǎn)
邊緣:
?邊緣是圖像中亮度突然變化的區(qū)域。
?圖像灰度構(gòu)成的曲面上的陡峭區(qū)域。
?像素灰度存在階躍變化或屋脊?fàn)钭兓南袼氐募稀?/p>
如何提取邊緣?(灰度圖象)
灰度圖象邊緣提取思路:
■抑制噪聲(低通波波、平滑,去噪、模糊)
?邊緣特征增強(qiáng)(高通濾波、說(shuō)化)
■邊境定位
一階微分算子,例如Sobel算子等,檢測(cè)最大值(一階導(dǎo)的最大值,不是像素最大
值哦)。
二階微分算子,例如Laplacian,主要是檢測(cè)過(guò)零點(diǎn)。
一階導(dǎo)致的極大值點(diǎn):
Edge={p-(x,y)|p=argmax(|7/(p)|))
二階導(dǎo)敗的過(guò)零點(diǎn):
叫”)=(?分
R中,圖像梯度向■:Edge={p=(x,y)|A/(p)=0,zerocrossing)
梯度幅值表示邊燎的強(qiáng)弱梯度方向代表灰度變化最快的方向
拉普拉斯算子:
I刃(x,y)l4?(x,y)=arct,喘/第
“/(x+Ax)-f(x)
_階導(dǎo)梯度計(jì)算:“幻―甚A,“戰(zhàn)
離散情況(也就是數(shù)字圖像上):/,/("】)—-)
對(duì)于噪聲圖像,需要進(jìn)行濾波,否則單點(diǎn)的梯度無(wú)法表示最終趨勢(shì):
拉普拉斯算子:
▽”也+也
dx2dy2
LaplacianofGaussian(LoG)過(guò)零點(diǎn)檢測(cè)
先用Gaussian平滑去噪,然后用Laplacian算子
高新離新的導(dǎo)敷離斯拉普拉斯
/,。(…。二三二粥彳M”,”)
Ox
1[x2+y2l"+y
LOG算子:°ZG(x,y)=一肅|】一^-卜-^
Canny邊緣檢測(cè)器
算法基本過(guò)程:
計(jì)算圖像梯度大小■《*?0
方向Ihet.(x.y)
NM5:
梯度非極大值抑制Nor-MaximaSuppression
雙閾值提取邊緣點(diǎn)
(I)求圖像與高斯平滑注波器卷積:(3)幅值和方位向:
2
5。,尸)-GQ,y,o)?/(.<.Z)M(x,y)=jDx(x,y)+Dy(x,yy
。代表對(duì)圖像的平滑程度
O(x.y)=arctan(Dy(x,y)/Dx(x,y))
(2)使用一階有限差分計(jì)算偏導(dǎo)數(shù)的兩個(gè)陣列:
D,(x.y)*(S(x.y+1)-S(x.y)+S(x+l,y+l)-S(x+l,y))/2M代表生度幅值的大小,在存在邊緣的圖像位置處,M
Dy(x.y)?(S(x.y)-S(x+Ly)+S(x,y+I)-5(x+l.y+1))/2的值變大,圖像的邊緣特征極“坳強(qiáng)”?
相當(dāng)于與模版進(jìn)行卷積運(yùn)算:J_J_J_J_
~~77
?非極大值抑制(NMS:Non-MaxmaSuppression)
?主要思想:由梯度幅值圖像Mx.y),僅保留極大值.
(嚴(yán)格地說(shuō),保留梯度方向上的極大值點(diǎn).)
得到的結(jié)果為N(x.y),具體過(guò)程:
?初始化NGc,y)=M(x,y)
?對(duì)于每個(gè)點(diǎn),在梯度方向和反梯度方向各找n個(gè)像素點(diǎn).
若M(x.y)不是這些點(diǎn)中的最大點(diǎn),剜將N(x.y)置零,否則
保持N(x.y)不變。
?在密度方向的沿線(xiàn)上檢測(cè)該點(diǎn)是否為局部極大值
?N(x.y)單像素寬度:
?韻比的情形,只使用4個(gè)方向;[0,45,90.135)
?問(wèn)題:領(lǐng)外的邊緣點(diǎn),丟失的邊緣點(diǎn)?得到的結(jié)果N(,/)包含邊緣的寬度為1個(gè)像素
?對(duì)上述得到的N(x.y)使用閾值進(jìn)行二值化使用雙閾值檢測(cè)邊緣
?使用大的閾值,得到:
兩個(gè)面值:
?少■的邊緣點(diǎn)T2T2?T1
?由“樗到El(x,y),低闌值邊緣圖:更大的誤檢淵率
?許多空隙?由12將到£2(凡口.高閾值邊緣圖:JEJM可事
?使用小的面值,得到:邊緣寄接;
?大■的邊緣點(diǎn)
?大■的錯(cuò)誤檢測(cè)
邊緣連接
1.將E2(x.y)中相連的邊韁點(diǎn)依匕為一幡邊蜂圖像E(x.y)
2.對(duì)于E(x.y)中每條邊,從端點(diǎn)出發(fā)在El(x.y)中尋找只延長(zhǎng)
的部分,直至與E(x.y)中另外一條邊的端點(diǎn)相連,否則認(rèn)
為E1(x.y)中沒(méi)有它延長(zhǎng)的部分
3.將E(x.y)作為姑果輸出
角點(diǎn)檢測(cè)算法
Harris角點(diǎn),主要思想就是F移窗口觀察灰度變換,然后有兩個(gè)方向入1和入2,觀察
兩個(gè)方向的比值,比值比較大說(shuō)明是邊緣,兩個(gè)值都大的是角點(diǎn),都比較小是非角
點(diǎn),非邊緣。具體計(jì)算如下,了解思想即可。
將圖像窗口平移U0產(chǎn)生灰度變化/:.(“,u)
于是對(duì)于局部微小的移動(dòng)■["?],可以近似得到下面的表達(dá):
其中M是2x2矩陣,可由圖像的導(dǎo)數(shù)求得:
窗口函數(shù)w(x,y)A,,噴
1inwindow.0outside
窗口移動(dòng)導(dǎo)致的圖像變化,文對(duì)稱(chēng)矩陣M的特征值分析通過(guò)M的兩個(gè)特征值
的大小對(duì)圖像盤(pán)進(jìn)行
£(",U)S(U,V)M(:)二^項(xiàng)函效^mavAnin土M的特征值分類(lèi):
怏速變化的方向
E5,
刃的橢圓形式0慢變化的方向
如果3和X,&.很小,
圖像鬼口在所有方向上
序動(dòng)都無(wú)明顯灰度變化
Harris角點(diǎn)性質(zhì):
?旋轉(zhuǎn)不變性
?對(duì)于圖像灰度的仿射變化(亮度變換不具有不變性,對(duì)比度變換具有不變性)
具有部分的不變性
?尺度不具有不變性
FAST
假設(shè):若該點(diǎn)的灰度值比其周?chē)I(lǐng)域內(nèi)足夠多的像素點(diǎn)的灰度值大或者小,則該點(diǎn)
可能為角點(diǎn)、。
FAST算法步驟
1.從圖片中選取一個(gè)像素P,下面我們將判斷它是否是
一個(gè)特征點(diǎn)。我們首先把它的亮度值設(shè)為
2.設(shè)定一個(gè)合適的閾值t。
3.考慮以該像素點(diǎn)為中心的一個(gè)半徑等于3像素的離散化
的Bresenham圓,這個(gè)圓的邊界上有16個(gè)像素.
4.如果在這個(gè)大小為16個(gè)像素的圓上有n個(gè)連續(xù)的像素點(diǎn),
它們的像素值要么都比/p+t大,要么都比仆-t小,那么
它就是一個(gè)角點(diǎn)。(白色虛線(xiàn)所示)
n的值可以設(shè)置為12
或者9,實(shí)驗(yàn)證明選擇
9可能會(huì)有更好的效果。
FAST需要改進(jìn)的地方
I.由于FAST算法依賴(lài)于一個(gè)閾值t因此算法還需要人為干涉
2.FAST算法不產(chǎn)生多尺度特征而且FAST特征點(diǎn)沒(méi)有方向信息,這樣就會(huì)失去
旋轉(zhuǎn)不變性
第3節(jié)底層視覺(jué)II特征點(diǎn)提取、描述與匹配
知識(shí)點(diǎn):SIFT,ORB->BRIEF,ICP,RANSAC
一、SIFT特征點(diǎn)提取與匹配(以下為個(gè)人總結(jié),可能與PPT不像)
SIFT識(shí)別圖像寬度、高度以及最重要的比例尺上的獨(dú)特關(guān)鍵點(diǎn)。通過(guò)考慮尺
度,我們可以確定即使在感興趣的模板改變大小、圖像質(zhì)量變得更好或更差,或者
當(dāng)模板發(fā)生視點(diǎn)或縱橫比發(fā)生變化時(shí),這些關(guān)鍵點(diǎn)也會(huì)(在一定程度上)保持穩(wěn)定。
此外,每個(gè)關(guān)鍵點(diǎn)都有一個(gè)相關(guān)的方向,這使得SIFT特征不受模板旋轉(zhuǎn)的影響。
最后,SIFT將為每個(gè)關(guān)鍵點(diǎn)生成一個(gè)描述符,一個(gè)128長(zhǎng)的向量,允許對(duì)關(guān)鍵點(diǎn)進(jìn)
行比較。這些描述符只不過(guò)是在關(guān)鍵點(diǎn)鄰域內(nèi)計(jì)算的梯度直方圖。本文為SIFT從
零一步步搭建的步驟。
1.圖像高斯金字塔與DoG空間生成
通常,圖像金字塔是連續(xù)模糊值。的高斯模糊圖像與不同尺度的圖像組成。相
同尺度一組圖像我們稱(chēng)之為一個(gè)octave層,每一層由若干高斯模糊圖像組成。由于
需要對(duì)圖像進(jìn)行高斯模糊操作,所以對(duì)原始的RGB圖像要進(jìn)行灰度圖轉(zhuǎn)換,再進(jìn)
行高斯模糊。
首先便是生成高斯金字塔的過(guò)程,高斯金字塔每一個(gè)octave層的尺度不一樣,
相鄰octave層的尺度相差1倍。一般octave層數(shù)。有固定計(jì)算公式為:
0=log2(1)
其中“和〃分別為圖像在該octave層的尺度寬與高,此公式層數(shù)是不針對(duì)對(duì)原圖尺
寸進(jìn)行上采樣生成octave的情況,如果上采樣則計(jì)算的。層數(shù)應(yīng)為
log2min(W,H)—1。
每一個(gè)octave層將有S+3層的圖像,相鄰連個(gè)圖像之間的模糊值A(chǔ)倍,并且這
里的模糊值均相對(duì)于原始圖像。其中S為人為設(shè)定值,我們這里設(shè)定為3oZ有固定
計(jì)算公式,k=21/So第。層octave層的第r張圖像的模糊值為o(o,r)=5)2°+工。其
中如為高斯模糊的初始值,一般建議設(shè)置為1.6,而考慮相機(jī)已經(jīng)對(duì)圖像進(jìn)行。=
0.5的模糊,故實(shí)際我們也可以設(shè)置為。0=01.62-0.52=1.52。
Sole
(next
octave)
圖1.高斯金字塔與DoG空間
在生成高斯金字塔時(shí),由于o(o+LO)=Oo20+i=Oo2°+?=o(o,s),故可以
直接取上一層octave的第s張圖像直接進(jìn)行下采樣,作為下一層octave的第1張圖
像。注意這里的。是相對(duì)于原始圖像的模糊系數(shù),高斯平滑具有一個(gè)平方特性,即
進(jìn)行一次內(nèi)的平滑,再進(jìn)行一次”的平滑,相當(dāng)于進(jìn)行一次娟強(qiáng)的平滑。因
此我們的高斯模糊可以連續(xù)模糊,而不是每次模糊都相對(duì)于第一張圖像進(jìn)行模糊。
圖2展示了對(duì)Lena進(jìn)行高斯金字塔模糊結(jié)果。
接下來(lái)是差分金字若DoG空間,這個(gè)空間只需要octave層相鄰的圖像的插值
計(jì)算即可,由模糊系數(shù)高的減去模糊系數(shù)低的。注意的是,這里可以直接采納圖像
相減,即最低值可以為0,不需要為負(fù)值,這是因?yàn)樵诤竺鏄O值點(diǎn)檢測(cè)時(shí)候負(fù)值都
是低對(duì)比度,無(wú)需考慮。圖3是一些DoG空間的可視化。
2.DoG空間極值點(diǎn)檢測(cè)與關(guān)鍵點(diǎn)精確定位,消除不穩(wěn)定點(diǎn)。
極值點(diǎn)檢測(cè)很簡(jiǎn)單,在DoG空間每一層ociave層,尋找相鄰兩層的極值點(diǎn),
包括極大值與極小值,如圖4所示。注意,只需要最大值和最小值即可,不需要是
唯一最大值或者唯一最小值。如果其對(duì)比度滿(mǎn)足要求,繼續(xù)進(jìn)行精確定位,對(duì)比度
閾值7計(jì)算公式如下:
/0.5xc\
T=tx255(2)
其中Q為對(duì)比度,這里設(shè)置為0.04。
接下來(lái)計(jì)算精確點(diǎn),精確點(diǎn)滿(mǎn)足泰勒展開(kāi):
Q1
。㈤=〃+而x+⑶
這里一階梯度和二階導(dǎo)分別是圖像關(guān)于長(zhǎng)寬和模糊度方向的導(dǎo)數(shù),以及
Hessian矩陣。然后反復(fù)計(jì)算精確點(diǎn),如果精確點(diǎn)不再偏移,則結(jié)束循環(huán)。
/一//J/
圖4.極值點(diǎn)檢測(cè)
確定精確點(diǎn)后,依然要做最后的處理,去除不穩(wěn)定的關(guān)鍵點(diǎn),首先再次確認(rèn)對(duì)
比度是否足夠,然后嘗試去除邊緣上的點(diǎn)。一般來(lái)說(shuō)是計(jì)算長(zhǎng)度與寬度方向的
Hessian矩陣,計(jì)算其特征值對(duì)比度:
2222
Tr(/7)QI+%)2(rA+A)(r4-l)(7;+l)
---:——=---------=----2-----2--=-------->---------(4)
Det(H)AtA2rA2A2rTr'"
如果上式成立,說(shuō)明存在邊緣響應(yīng),去除該點(diǎn),否則保留。其中7;=10。一
般減少Tr可以抑制關(guān)鍵點(diǎn)的數(shù)量。
3.關(guān)鍵點(diǎn)四配
需要進(jìn)行點(diǎn)匹配的話(huà),我們就需要構(gòu)建描述子,即構(gòu)建點(diǎn)特征,再?gòu)囊环鶊D像
的點(diǎn)與另一幅圖像的點(diǎn)集匹配,找到最佳匹配點(diǎn)對(duì)。
首先在上一節(jié)中計(jì)算的每一個(gè)特征點(diǎn)位置,我們需要構(gòu)建特征,對(duì)其進(jìn)行主方
向的計(jì)算。由于梯度我們是可以計(jì)算出梯度方向的。梯度方向直方圖的橫軸是梯度
方向的角度(梯度方向的范圍是0到360度,直方圖每36度一個(gè)柱共10個(gè)柱),
縱軸是梯度方向?qū)?yīng)梯度幅值的累加,在直方圖的峰值就是特征點(diǎn)的主方向
確認(rèn)好主方向后,我們需要對(duì)特征進(jìn)行構(gòu)建描述子,具體有:
?校正旋轉(zhuǎn)主方向,確保旋轉(zhuǎn)不變性。
?生成描述子,最終形成一個(gè)128維的特征向量
?歸一化處理,將特征向量長(zhǎng)度進(jìn)行歸一化處理,進(jìn)一步去除光照的影響。
主方向校正SIFT描述子的構(gòu)造
旋轉(zhuǎn)后以主方向?yàn)橹行娜?X8的窗口,求取誨個(gè)像素的梯度幅
值與梯度方向,箭頭方向代表該像素的梯度方向,長(zhǎng)度代表梯
電場(chǎng)值,在每個(gè)4X4的小塊上給出18個(gè)方向的梯倍百方圖
SIFT描述子的構(gòu)造
?將關(guān)鍵點(diǎn)鄰域劃分為4X4個(gè)子區(qū)域
適應(yīng)光照變化
?梯度方向劃分為8個(gè)方向
?直方圖的值為梯度幅值的累加?為了去除光照變化的影響,對(duì)特征向量進(jìn)行歸一
?得到一個(gè)4X4X8=128維向量化處理,去除圖像灰度值整體漂移
?對(duì)于非線(xiàn)性光照,相機(jī)飽和度變化對(duì)造成某些方
向的梯度值過(guò)大,而對(duì)方向的影響微弱。因此設(shè)
置門(mén)限值(向量歸一化后,一般取0.2)截?cái)噍^大
的梯度值。然后,再進(jìn)行一次歸一化處理
SIFT具有:
尺度不變:DoG金字塔的作用
旋轉(zhuǎn)不變:主方向計(jì)算
適應(yīng)光照變化:描述子特征歸一化
二、ORB特征
ORB=oFAST+rBRIEF
研究動(dòng)機(jī):快速性、兼禎準(zhǔn)確性
FAST請(qǐng)見(jiàn)第2節(jié),oFAST就是在這個(gè)基礎(chǔ)上加入了主方向以解決旋轉(zhuǎn)問(wèn)題。
oFAST
?采用灰度質(zhì)心的方法IntensityCentroid
?圖像的矩mpq=2xPy?/(x,y)
xy
八m(”\
Q=(嬴?用?=^2(m01,m10)
BRIEF
描述子構(gòu)造方法:在已提取出的特征點(diǎn)的鄰域paich中,隨機(jī)選取若干對(duì)像素點(diǎn),
分別比較每對(duì)像素點(diǎn)的灰度大小。
不同選擇點(diǎn)的方式。1.x,y方向平均分布采樣;2.x,y均服從Gaussian(0」;S2)各向同
性采樣;3.x服從Gauss(0,福$2),y服從Gauss(0,京S?)采樣;4.x,y從網(wǎng)格中隨機(jī)
獲取;5.x一直在(0,0),y從網(wǎng)格中隨機(jī)選取。如下圖所示
GlGilGill
GIVGV
然后分別比較每對(duì)像素點(diǎn)的灰度大小,賦值為1或0,從而構(gòu)建描述子。一般
抽樣?id=256對(duì)點(diǎn)對(duì)。
1ifP(x)<p(y)
r(p;x,y):=
0otherwise
九(P):=Ei金82一?。≒;Xi,yJ
SteeredBRIEF:方向旋轉(zhuǎn)后的BRIEF
「BRIEF用一種貪婪學(xué)習(xí)算法篩選具有高variance和高不相關(guān)的steeredbrief
?首先建立300k個(gè)特征點(diǎn)測(cè)試集。對(duì)于測(cè)試集中的每個(gè)點(diǎn),考慮其31x31鄰
域。(不同于原始BRIEF算法,在對(duì)圖像進(jìn)行高斯平滑之后,使用鄰域中
的某個(gè)點(diǎn)的5x5鄰域灰度平均值來(lái)代替某個(gè)點(diǎn)對(duì)的值,進(jìn)而比較點(diǎn)對(duì)的大
小。這樣特征值更加具備抗噪性。)
?在31x31的鄰域內(nèi)共有(31-5+1)x(31-5+1)=729個(gè)子窗口,取點(diǎn)對(duì)的方法
共有M=265356種,在這M種方法中選取256種取法
?D在300k特征點(diǎn)的每個(gè)31x31鄰域內(nèi)按M種方法取點(diǎn)對(duì),比較點(diǎn)對(duì)大小,形成
一個(gè)300kxM的二進(jìn)制矩陣0。矩陣的每一列代表300k個(gè)點(diǎn)按某種取法得到的二
進(jìn)制數(shù)。
?2)對(duì)Q矩陣的每一列求取平均值,按照平均值到0.5的距離大小重新對(duì)Q矩陣
的列向量排序,形成矩陣T。
?3)將T的第一列向量放到R中。
?4)取T的下一列向量和R中的所有列向量計(jì)算相關(guān)性,如果相關(guān)系數(shù)小于設(shè)定
的閾值,則將T中的該列向量移至R中。
?5)按照4)的方式不斷進(jìn)行操作,直到R中的向量數(shù)量為256。通過(guò)這種方法
就選取了這256種取點(diǎn)對(duì)的方法。這就是rBRIEF算法。
ORB=oFAST+rBRIEF
匹配用漢明距離,也就是對(duì)應(yīng)位置數(shù)值不相同距離+1.
“1011101”與100001”之間的漢明距離是2
漢明距離就是度量下面角d(P)的二進(jìn)制的距離。
?。╬.xV):=Pifp(x)<P(y)
''[0otherwise
九(p):=£1金為2—?。≒;Xi,yJ
三、基于CNN的特征點(diǎn)與描述子學(xué)習(xí)
方法比較簡(jiǎn)單,感覺(jué)沒(méi)什么的
Keypoint2D
Locations
Keypoint
Descriptors
Interest
PointLoss
Descriptor
Loss
Interest
PointLoss
四、ICP算法
ICP算法主要用于匹配
問(wèn)題
?已知:兩個(gè)對(duì)應(yīng)點(diǎn)集合
==
X(XpX2>X3?(a**Xn)P{DpPj.P3....vpn)
?求解:旋轉(zhuǎn)矩陣R和平移向量t,使得
F(R.t)=argmin^ylk(-Rp(-t||2
(■1
流程圖如圖所示,基本就是不斷迭代評(píng)價(jià)匹配度,匹配度不行再更新迭代
ICP算法
五、RANSAC
注意說(shuō)法:一致集,雖然全景拼接的論文寫(xiě)的是inlier和outlier。
RANSAC估計(jì)模型M的一般步驟
確定求解模型M,所需要的最小費(fèi)據(jù)點(diǎn)的個(gè)數(shù)0?由日數(shù)
據(jù)點(diǎn)組成的子集稱(chēng)為模型M的一個(gè)樣本;
從數(shù)據(jù)點(diǎn)集D中隨機(jī)地抽取一個(gè)樣本J,由該樣本計(jì)算模型
的一個(gè)實(shí)例Mp(J),防定與M0(J)之間幾何距離v闌值t的
數(shù)據(jù)點(diǎn)所構(gòu)成的集合,并記為S(MJJ)),稱(chēng)為實(shí)例Mp(J)的
如果在一致集S(M/J))中數(shù)據(jù)點(diǎn)的個(gè)數(shù)#S(Mp(J))>閱值T.
則用S(MJJ))重新格計(jì)模型M,并輸出結(jié)果,如果“S(M
p(J))〈閾優(yōu)T,返回到步驟2;
經(jīng)過(guò)K次隨機(jī)抽樣,選擇最大的一致集S(Mp(J)),用S(M
p(J))重新估計(jì)模型M.并輸出結(jié)果.
第4節(jié)底層視覺(jué)III圖像分割
具體需要關(guān)注基于聚類(lèi)的圖像分割算法,K?means流程,GMM特點(diǎn)以及用EM算
法更新參數(shù),Mean-Shift,以及基于圖論的圖割,重點(diǎn)關(guān)注Normalizedcut算法的
流程。深度學(xué)習(xí)的FRCN和YOLO目標(biāo)檢測(cè),以及DeepLab還有UNET很熟悉
了,這里不放了。
傳統(tǒng)的方法:
?閾值法
?局部閾依法
?邊緣分割法
基于特定理論的方法
1.Kmeans聚類(lèi)
K-Means步驟
?確定聚類(lèi)(cluster,也稱(chēng)簇)中心的個(gè)數(shù)K,并
為它們隨機(jī)初始化一個(gè)各自的聚類(lèi)質(zhì)心點(diǎn)
(clustercentroids)
?根據(jù)每個(gè)數(shù)據(jù)點(diǎn)到質(zhì)心的距離來(lái)進(jìn)行分類(lèi)
?初始質(zhì)心并不是真正的質(zhì)心,質(zhì)心應(yīng)滿(mǎn)足聚類(lèi)里
每個(gè)點(diǎn)到它的歐式距離平方和最小這個(gè)條件。根
據(jù)初步分類(lèi)結(jié)果,重新計(jì)算每一聚類(lèi)中所有向?
的平均值,并確定出新的質(zhì)心
?重復(fù)上述步驟,進(jìn)行一定次數(shù)的迭代,直到質(zhì)心
的位置不再發(fā)生太大變化
Kmeans缺點(diǎn):聚類(lèi)個(gè)數(shù)需要手動(dòng)設(shè)定,另外質(zhì)心初始化是隨機(jī)的。
2.高斯混合模型GMM
我們假設(shè)數(shù)據(jù)點(diǎn)滿(mǎn)足不同參數(shù)下的高斯分布,用兩個(gè)參數(shù)來(lái)描述聚類(lèi)的形狀均值和
標(biāo)準(zhǔn)差。以二維分布為例標(biāo)準(zhǔn)差的存在允許聚類(lèi)的形狀可以是任何種類(lèi)的橢圓形不
再局限于圓形。如果數(shù)據(jù)點(diǎn)符合某個(gè)高斯分布那它就會(huì)被歸類(lèi)為那個(gè)聚類(lèi)。
GMM通常用EM算法進(jìn)行更新,即一邊E步進(jìn)行評(píng)估期望,另一邊M步用于更新
參數(shù)。
GMM缺點(diǎn):
KMeans相比GMM每一步迭代的計(jì)算量比較大。
基于EM算法有可能陷入局部極值需要經(jīng)過(guò)多次迭代。
GMM優(yōu)點(diǎn):
聚類(lèi)形狀不再限制為圓舫
權(quán)重引入為多個(gè)聚類(lèi)目標(biāo)提供了思路。
3.MeanShift
一種基于一般核函數(shù)的非參數(shù)密度梯度的估計(jì)算法,并給出了保證估計(jì)值與
真實(shí)值之間漸近無(wú)偏、一致和均勻連續(xù)時(shí)核函數(shù)應(yīng)滿(mǎn)足的條件。
核心思想:找到概率密度梯度為零的采樣點(diǎn),并以此作為特征空間聚類(lèi)的模
式點(diǎn)。
基本流程:1.計(jì)算平移向量,2.轉(zhuǎn)換密度估計(jì)窗口
Stepl:對(duì)于始.ComputeMeanShiftVector:m(zj).
m(M)=-------------------------------------x
23刑亍11)2
其中g(shù)(x)=-k'(x).
Step2:TranslateDensityEstimationWindow:
寸'=W+m(zf)
Step3:IterateStep1andStep2untilconveigence.
應(yīng)用到整幅圖也很簡(jiǎn)單,在圖像空間上均勻放入點(diǎn),然后對(duì)每個(gè)點(diǎn)都進(jìn)行密度估計(jì)
以及平移向量計(jì)算,然后進(jìn)行點(diǎn)位置更新,不斷迭代,最終幾個(gè)點(diǎn)聚集中心便是圖
像聚類(lèi)中心。
與K-Means方法的最大優(yōu)點(diǎn)是無(wú)需指定聚類(lèi)數(shù)目K,聚類(lèi)中心處于最高密度處,也
符合直覺(jué)認(rèn)知。
缺點(diǎn)是如何正確選擇窗口尺寸h。
4.GraphCut圖割
基本思想
1將圖像用圖的方式表示頂點(diǎn)表示像素邊表示像素之間的關(guān)系。圖像分割對(duì)應(yīng)圖的
割集。
2確定圖中邊的權(quán)值使圖像分割目標(biāo)能量最小化對(duì)應(yīng)圖的最小割。
3用最大流算法求解最小割問(wèn)題。
在圖論中,去掉其中所有邊能使一張網(wǎng)絡(luò)流圖不再連通(即分成兩個(gè)子圖)的邊集
稱(chēng)為圖的割(英語(yǔ):cut(graphtheory))(英語(yǔ):cut),一張圖上最小的割稱(chēng)為最
小割(英語(yǔ):minimumcutmin-cut)。
A有源節(jié)點(diǎn)(s)和終
節(jié)點(diǎn)(t)
》每條邊有一個(gè)帶負(fù)
的容量Cap(ij)
》對(duì)于不存在的邊,
其容量為0/
53
G={『,£}
Normalizedcut
需要注意的是:僅考慮用割集的權(quán)值之和來(lái)度量?jī)蓚€(gè)集合之間的相關(guān)性,會(huì)容易出
現(xiàn)孤立分割的問(wèn)題。如下圖所示:
Min-cut2
nlMin-cutI
一個(gè)解決上述問(wèn)題的辦法是通過(guò)定義新的類(lèi)間相似性度量。Normalizedcut(Ncut)
,、cut(A,B)cut(A,B)
Neut(AF)=assoc(AV.)+a5soc(fi^
這里assoc(,A,V)=zw(u,t)
ue4.tev
這樣包含孤立點(diǎn)的槍"唯不會(huì)小。
再定義總的類(lèi)內(nèi)相似性度量
assoc{A,A)assoc(B,B)
Nassoc(A,8)
assoc(A,V)assoc(B,V)
具體算法:
①給定一個(gè)點(diǎn)集,構(gòu)建圖G(V.E),邊的權(quán)為對(duì)應(yīng)兩端點(diǎn)的
相似度。
②求解(D—W)x=4Dx的特征值及其所對(duì)應(yīng)的特征向量。
③用次小特征值所對(duì)應(yīng)的特征向量進(jìn)行二分類(lèi)。
④若需再分,則在每個(gè)分好的類(lèi)別中重復(fù)上述過(guò)程。否則
終止。
圖像應(yīng)用:
將一幅圖像上所有像素點(diǎn)看作點(diǎn)集V,每?jī)蓚€(gè)點(diǎn)之間都建立一條邊,得到邊集E。
為每條邊賦值。這樣就建立一個(gè)賦權(quán)無(wú)向圖G=(V,E)o按照前述算法,我們就可以
完成對(duì)該幅圖像分割操作。
深度學(xué)習(xí)部分速議自己看看
第5節(jié)三維視覺(jué)I相機(jī)模型與多視幾何
需要掌握相機(jī)模型,基本矩陣以及8點(diǎn)法計(jì)算,本質(zhì)矩陣以及5點(diǎn)法計(jì)算
小孔成像
小光圈:曝光時(shí)間增長(zhǎng)、高亮度圖像
大光圈:曝光時(shí)間短、埃糊圖像
光圈過(guò)小(產(chǎn)生衍射現(xiàn)象,圖像模糊)
射影空間:對(duì)n維歐式空間加入無(wú)窮遠(yuǎn)元素,并對(duì)有限元素和無(wú)窮遠(yuǎn)元素不加區(qū)
分,則他們共同構(gòu)成n維射影空間
齊次坐標(biāo)是射影空間的坐標(biāo)表達(dá)方式
?非齊次坐標(biāo)到齊次坐標(biāo)的轉(zhuǎn)換:
X
(工,!/)=>y(q!z,z)n
?齊次坐標(biāo)到非其次坐標(biāo)的轉(zhuǎn)換:
x
)I=?(x/w,y/w,z/w)
y=>{x/w.y/wz
w
w
相機(jī)模型
相機(jī)內(nèi)參數(shù)矩陣:
P,
K=04Py
00I
簡(jiǎn)化版完贅版
多視幾何
X1=K網(wǎng)小
x2=K2[R2|t2]x
x3=K5[R,|t3]x
R>t,
令皿W是空間點(diǎn)X分別在兩個(gè)攝像機(jī)下的投影,通常稱(chēng)它們?yōu)辄c(diǎn)對(duì)應(yīng)(Point
Correspondence),并記作m—zn'。
基本矩陣(fundamentalmatrix)
兩視圖的極幾何約束(叩ipolargeometry)可以用一個(gè)3x3矩陣描述,稱(chēng)為基本矩陣
(fundamentalmatrix)F
F表達(dá)了image1中的齊次坐標(biāo)點(diǎn)p與image2中p的極線(xiàn)之間的映射關(guān)系
圖像對(duì)應(yīng)點(diǎn)間的極幾何約束關(guān)系可以表達(dá)為:q7Fp=0
R:左右相機(jī)間的相對(duì)的狀t:左右相機(jī)何的平秣
qHR[t]jK[p=0
F*---theFundairentalmatrix
兩視圖幾何一8點(diǎn)法(在兩個(gè)相機(jī)參數(shù)不已知的情況下)
x,rFx=0
rf3x3
令x'=[x[,y[t1],x=[x,y,1],而且已知FGIR
L23g
/11/1/1
/21/22/23
/3/3s/li
12/33
A
xixifll+xiVif21+卬31+
+V曲22+%力2+
巾13+Vif23+/33=0
由于解9個(gè)變量(/ii,/n,…,啟3),至少需要8組解才可以解出唯一平凡解。
X*;X:以y\Zfu
欣就X:煙Xx;fn
小X:詡yix;fn
A
XX.他X:必y:¥
l2=0Af=0
X:/*A
疝;就詡R
.他X:必y:,t:&
加就X;謠y;¥k
X*:出X:渤¥人
則8點(diǎn)法基本流程
?由8組對(duì)應(yīng)點(diǎn)構(gòu)造方程Af=0
?對(duì)A進(jìn)行SVD分解A=U,VT,V的最后一個(gè)列向
量構(gòu)造F
?對(duì)F進(jìn)行SVD分解F=U,Vi
a,oo'a,oo-
z=0(T,0.Z'=0(T,0
.°06.000
?F'=UZ'VT
注意:當(dāng)空間點(diǎn)位于空間同一平面時(shí),產(chǎn)生退化情況,無(wú)法求解
兩視圖幾何一5點(diǎn)法(在兩個(gè)相機(jī)參數(shù)已知的情況下)
球巳。=。鏟E0=o
theEssentialmatrix(本質(zhì)矩陣)
5點(diǎn)法求的是本質(zhì)矩陣,而8點(diǎn)法求的是基礎(chǔ)矩陣。主要區(qū)別是否已知相機(jī)內(nèi)參數(shù)。
Algorithm5(Thefive-pointrelativeorientation)Givenfiveimagepointcorre-
spondencesu,1u;fari=1,....5.computetherotationandthetranslation
betweenthetwoviews.
I.Formthe5x9linearsystem.
2.Computethefour-dimensionalnullspaceofthelinearsystembySVD.
3.Obtainthecacfficienlsofajparamefrizedhythreeparametersx,y、zfromthe
abovenullspace.
4.FormtheAIOX2Oniutrixfromthetencubicpolynomialconstraints.
5.ObtainthereducedinalrixBiox\ofr<?nAIOX2Ob、Gauss-Jordanelimination.
6.FormthemuliiplicationmatrixXTfmniB(oxio-
7.Compuietheeiffenveclorsof
8.Eachei^eitvecturisasohuiontob.mid
x=M/bio,y=b&/bi。,andz=%/瓦。.
9.Computejfromx,y,z,anilconverte,jintothenuiirixE.
10.DecomposetheEintotheRandtbySVD.
11.ChoosetheRandtthatreconstntcta31)pointinfromofthecameras.
ThereareulmostfensolutionstoRandt.
就是通過(guò)5個(gè)點(diǎn)計(jì)算旋轉(zhuǎn)(4對(duì)點(diǎn))和平移(額外一對(duì)點(diǎn))的矩陣,然后用
RANSAC(見(jiàn)第三節(jié))進(jìn)行校正。用最小配置解原因是不可避免選擇的點(diǎn)對(duì)是存
在外點(diǎn)的。
第6節(jié)三維視覺(jué)II相機(jī)標(biāo)定與稀疏重建
相機(jī)標(biāo)定與稀疏重建,尢為某個(gè)圖像中的坐標(biāo),K為相機(jī)內(nèi)參,R為旋轉(zhuǎn)參數(shù),t為
平移參數(shù),X為世界坐標(biāo)系位置。%=K[R\t]X
?己知x、K、R、t?求X:三角化(Triangulation)
?已知x、X、K,求R、t:姿態(tài)估計(jì)(PoseEstimation)
?已知x、X,求K、R、t:相機(jī)標(biāo)定(CameraCalibration)
?已知、,求K、Rot%X:稀疏重建(SparseReconstruction)
StructurefromMotion(SfM)
StructureandMotionEstimation
三角化:最小化重構(gòu)投影誤差:min£i||.困同乂一々||2
相機(jī)標(biāo)定:需要知道一組2D—3D對(duì)應(yīng),并知道對(duì)應(yīng)點(diǎn)的2D與3D坐標(biāo)。通常情況
下,需要一個(gè)人工制作的標(biāo)定物(通常需要至少6對(duì)點(diǎn)用于標(biāo)定)
優(yōu)點(diǎn):標(biāo)定精度高;通過(guò)一幅圖像即可標(biāo)定
缺點(diǎn):需要高精度的三維標(biāo)定塊
更實(shí)用的標(biāo)定方案:使用平面標(biāo)定板(至少需要4對(duì)點(diǎn))
注意,在8點(diǎn)法時(shí)候8對(duì)點(diǎn)是不能同一平面(已知%和X2,計(jì)算基本矩陣F),但
相機(jī)標(biāo)定可以(已知x和X,計(jì)算K,R,t)o
1打印一個(gè)模版貼在一人平面上
2拍攝多幅照片
3計(jì)算圖像特征點(diǎn)
4計(jì)算K、R、I
5計(jì)算重投影誤差
6揄出結(jié)果
求相機(jī)標(biāo)定的幾何誤差
使用上述線(xiàn)性求解的代數(shù)最小誤差下的K、R、t為初始值,迭代求解最小重投影
誤差問(wèn)題(即求幾何誤差最小下的K、R、t)
稀疏重建:一般通過(guò)8點(diǎn)法計(jì)算出基本矩陣F,但是F無(wú)法分解出唯一的K-K2f
R,t,當(dāng)內(nèi)參數(shù)矩陣Ki,&已知時(shí),E=R田x稱(chēng)為本質(zhì)矩陣。本質(zhì)矩陣通過(guò)5點(diǎn)
法求出。
通過(guò)基本矩陣F或本質(zhì)矩陣E,求K、R、t,然后通過(guò)三角化求X,通過(guò)E求X有四
種解,選擇X在兩個(gè)相機(jī)前方數(shù)量多的那個(gè)解。要求幾何誤差意義下的KRtX,還
是用之前的方法,首先以代數(shù)誤差最小化情況下的KRtX作為初值,然后迭代求解
重投影誤差最小化問(wèn)題,得到幾何誤差最小化意義下的KRCX。
實(shí)際中可以通過(guò)圖片EXIF獲取相機(jī)焦距、鏡頭型號(hào)等獲取相機(jī)內(nèi)參數(shù)K
增量式SfM
1、給定一堆圖像
2、特征點(diǎn)檢測(cè)
3、特征匹配,并通過(guò)8點(diǎn)法和RANSAC方式去除錯(cuò)誤點(diǎn)
4、選擇初始圖像對(duì)
5、通過(guò)兩視圖SfMH算初始模型
6、如果圖像連接關(guān)系圖還有未選擇的圖像(這個(gè)就是增量了,多次添加)
a.選擇一幅能看到目前模型中最多3D點(diǎn)的圖像;
b.根據(jù)3D?2D點(diǎn)對(duì)應(yīng)估計(jì)相機(jī)位姿;(找到相機(jī)位置,R,t)
c.三角化新的特征點(diǎn)Tracks(就是互相匹配的點(diǎn))
d.Bundleadjustment
第7節(jié)三維視覺(jué)III立體視覺(jué)與三維建模
極線(xiàn)校正
左圖像和右圖像位于同一平面(兩相機(jī)K、R相同),左圖像和右圖像的x軸與基
線(xiàn)平行,對(duì)應(yīng)點(diǎn)具有相同的y坐標(biāo)。
R在右圖像上的極線(xiàn)平行于x軸,搜索P,匹配點(diǎn)的過(guò)程只需在水平掃描線(xiàn)上進(jìn)疔
極線(xiàn)校正方法
可以通過(guò)設(shè)置虛擬攝像機(jī)位置進(jìn)行極線(xiàn)校正
單應(yīng)變換幾種形式
兩圖像間的對(duì)極約束和場(chǎng)景的結(jié)構(gòu)無(wú)關(guān),也就是說(shuō)對(duì)極約束對(duì)于任意場(chǎng)景結(jié)構(gòu)的兩
幅圖像都是成立的,不能給出兩幅圖像上的像點(diǎn)的——對(duì)應(yīng)關(guān)系,只能給出點(diǎn)對(duì)
應(yīng)的必要條件,另一幅圖像上與圖像上對(duì)應(yīng)的像點(diǎn)在位于對(duì)應(yīng)的對(duì)極線(xiàn)上。基礎(chǔ)矩
陣F描述的實(shí)際是一種點(diǎn)和直線(xiàn)的映射關(guān)系,而不是一種點(diǎn)對(duì)點(diǎn)的約束關(guān)系,并不
能給出另一個(gè)點(diǎn)的確切空置。
通過(guò)空間平面誘導(dǎo)的單應(yīng),也就是圖像上的點(diǎn)都在世界空間的同一平面上
注意:和基本矩陣F的區(qū)別
單應(yīng)矩陣H和基本矩陣F是有區(qū)別的
單應(yīng):從物體平面到圖像平面的映射,同時(shí)表征了這兩個(gè)平面的相對(duì)位置和攝像
機(jī)投影矩陣。通常描述處于共同平面上的一些點(diǎn)在兩張圖像之間的變換關(guān)系。
P2=Hpi
基礎(chǔ)矩陣描述的是對(duì)極幾何中兩張圖像之間匹配特征點(diǎn)的空間位置變化關(guān)系。
P“Pi=°
視差:極線(xiàn)校正后,左右圖像的一對(duì)匹配點(diǎn)在x軸上坐標(biāo)的差異稱(chēng)為視差
(Disparity)。視差的大小與點(diǎn)距離相機(jī)距離的遠(yuǎn)近成反比。
立體視覺(jué)的目的就是通過(guò)左右圖像計(jì)算(稠密)視差圖
視差圖是一幅灰度圖像,像素點(diǎn)的值表示這一點(diǎn)的視差大小,灰度值越高表示視差
越大(距離越近)
立體視覺(jué)三維建模流程
三維模型
(稠密點(diǎn)云)
立體匹
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版土地開(kāi)發(fā)前期策劃協(xié)議3篇
- 2024年版專(zhuān)項(xiàng)信息保密協(xié)議模板版B版
- 成人朗誦課程設(shè)計(jì)
- 環(huán)境監(jiān)測(cè)儀器與應(yīng)用考核試卷
- 有關(guān)項(xiàng)目管理的課程設(shè)計(jì)
- 消防與安防的課程設(shè)計(jì)
- 《并聯(lián)型有源電力濾波器的研究》
- 《當(dāng)代大學(xué)生民族精神存在的問(wèn)題及培育研究》
- 《基于差分蟻群算法的應(yīng)急糧食運(yùn)輸問(wèn)題應(yīng)用研究》
- 《我國(guó)財(cái)產(chǎn)保全制度存在的問(wèn)題及完善》
- 保險(xiǎn)行業(yè)風(fēng)控規(guī)則與制度培訓(xùn)
- 2022-2023學(xué)年佛山市禪城區(qū)六年級(jí)數(shù)學(xué)第一學(xué)期期末達(dá)標(biāo)測(cè)試試題含解析
- 《廣聯(lián)達(dá)培訓(xùn)教程》課件
- 揚(yáng)州育才小學(xué)2023-2024六年級(jí)數(shù)學(xué)上冊(cè)期末復(fù)習(xí)試卷(一)及答案
- 函數(shù)的單調(diào)性說(shuō)課課件-2023-2024學(xué)年高一上學(xué)期數(shù)學(xué)人教A版(2019)必修第一冊(cè)
- 浙江省溫州市2022-2023學(xué)年五年級(jí)上學(xué)期語(yǔ)文期末試卷(含答案)3
- 軟件系統(tǒng)實(shí)施與質(zhì)量保障方案
- UV激光切割機(jī)市場(chǎng)需求分析報(bào)告
- 裝修工程竣工驗(yàn)收?qǐng)?bào)告模板模板
- 籃球館受傷免責(zé)協(xié)議
- 神經(jīng)生物學(xué)復(fù)習(xí)知識(shí)點(diǎn)
評(píng)論
0/150
提交評(píng)論