




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、SURF特征提取分析背景引言計(jì)算機(jī)視覺中,引入尺度不變的特征,主要的思想是每個(gè)檢測到的特征點(diǎn)都伴隨著對應(yīng)的尺寸因子。當(dāng)我們想匹配不同圖像時(shí),經(jīng)常會(huì)遇到圖像尺度不同的問題,不同圖像中特征點(diǎn)的距離變得不同,物體變成不同的尺寸,如果我們通過修正特征點(diǎn)的大小,就會(huì)造成強(qiáng)度不匹配。為了解決這個(gè)問題,提出一個(gè)尺度不變的SURF特征檢測,在計(jì)算特征點(diǎn)的時(shí)候把尺度因素加入之中。SURF與SIFT算法相似,SIFT算法比較穩(wěn)定,檢測特征點(diǎn)更多,但是復(fù)雜度較高,而SURF要運(yùn)算簡單,效率高,運(yùn)算時(shí)間短一點(diǎn)。相關(guān)SIFT算法請?jiān)斠姴┪摹緢D像分析】尺度不變特征變換(SIFT)特征提取分析。本節(jié)介紹SURF算法相關(guān)知識(shí)
2、?;窘榻B首先,我們引用3中對SURF描述為:“SURF (Speeded Up Robust Features)isa robust local feature detector, first presented byHerbert Bayet al. in 2006, that can be used in computer vision tasks likeobject recognition or 3D reconstruction. It is partly inspired by the SIFT descriptor.The standard version of SU
3、RF is several times faster than SIFT and claimed by its authors to be more robust against different image transformations than SIFT. SURF is based on sums of2D Haar wavelet responses and makes an efficient use ofintegral images.It uses an integer approximation to the determinant of Hessian blob dete
4、ctor, which can be computed extremely quickly with an integral image (3 integer operations). For features, it uses the sum ofthe Haar wavelet response around the point of interest. Again, these can be computed with the aid of the integral image".從上述對SURF描述,可知:第一、SURF算法是對SIFT算法加強(qiáng)版,同時(shí)加速的具有魯棒性的特征。
5、第二、標(biāo)準(zhǔn)的SURF算子比SIFT算子快好幾倍,并且在多幅圖片下具有更好的魯棒性。SURF最大的特征在于采用了harr特征以及積分圖像integral image的概念,這大大加快了程序的運(yùn)行時(shí)間。算法描述為了實(shí)現(xiàn)尺度不變性的特征點(diǎn)檢測與匹配,SURF算法則先利用Hessian矩陣確定候選點(diǎn),然后進(jìn)行非極大抑制,計(jì)算復(fù)雜度降低多了。整個(gè)算法由以下幾個(gè)部分組成。1.Hessian黑森矩陣構(gòu)建我們知道:SIFT算法建立一幅圖像的金字塔,在每一層進(jìn)行高斯濾波并求取圖像差(DOG)進(jìn)行特征點(diǎn)的提取,而SURF則用的是Hessian Matrix進(jìn)行特征點(diǎn)的提取,所以黑森矩陣是SURF算法的核心。假設(shè)函
6、數(shù)f(x,y),Hessian矩陣H是由函數(shù)偏導(dǎo)數(shù)組成。首先來看看圖像中某個(gè)像素點(diǎn)的Hessian Matrix的定義為:從而每一個(gè)像素點(diǎn)都可以求出一個(gè)Hessian Matrix. Hessian矩陣判別式為:判別式的值是H矩陣的特征值,可以利用判定結(jié)果的符號(hào)將所有點(diǎn)分類,根據(jù)判別式取值正負(fù),從來判別該點(diǎn)是或不是極點(diǎn)的值。在SURF算法中,通常用圖像像素I(x,y)取代函數(shù)值f(x,y)。然后選用二階標(biāo)準(zhǔn)高斯函數(shù)作為濾波器。通過特定核間的卷積計(jì)算二階偏導(dǎo)數(shù),這樣便能計(jì)算出H矩陣的三個(gè)矩陣元素Lxx, Lxy, Lyy,從而計(jì)算出H矩陣公式如下:但是由于我們的特征點(diǎn)需要尺度無關(guān)性,所以在進(jìn)行H
7、essian矩陣構(gòu)造前,需要對其進(jìn)行高斯濾波。這樣,經(jīng)過濾波后在進(jìn)行Hessian的計(jì)算,其公式如下:L(x,t)是一幅圖像在不同解析度下的表示,可以利用高斯核G(t)與圖像函數(shù)I(x)在點(diǎn)x的卷積來實(shí)現(xiàn),其中高斯核G(t)為:其中g(shù)(t)為高斯函數(shù),t 為高斯方差。通過這種方法可以為圖像中每個(gè)像素計(jì)算出其H矩陣的決定值,并用這個(gè)值來判別特征點(diǎn)。為此Herbert Bay提出用近似值現(xiàn)代替L(x,t)。為平衡準(zhǔn)確值與近似值間的誤差引入權(quán)值。權(quán)值隨尺度變化,則H矩陣判別式可表示為:其中為何式中0.9呢.請?jiān)斠?。因求Hessian時(shí)要先高斯平滑,然后求其二階導(dǎo)數(shù),這在離散的像素是用模板卷積形成的
8、。這比如說y方向上的模板Fig1(a)和Fig1(c).Fig1(a)即用高斯平滑后在y方向上求二階導(dǎo)數(shù)的模板。為了加快運(yùn)算用了近似處理,其處理結(jié)果如Fig1(b)所 示,這樣就簡化了很多。并且可以采用積分圖來運(yùn)算,大大的加快了速度。同理,x和y方向的二階混合偏導(dǎo)模板Fig1(b)與Fig1(d)。2. 尺度空間生成圖像的尺度空間是這幅圖像在不同解析度下的表示。上面講的這么多只是得到了一張近似Hessian行列式圖,這類似SIFT中的DOG圖,但是在金字塔圖像中分為很多層,每一層叫做一個(gè)octave,每一個(gè)octave中又有幾張尺度不同的圖片。在SIFT算法中,同一個(gè)octave層中的圖片尺寸
9、(即大小)相同,但是尺度(即模糊程度)不同,而不同的octave層中的圖片尺寸大小也不相同,因?yàn)樗怯缮弦粚訄D片降采樣得到的。在進(jìn)行高斯模糊時(shí),SIFT的高斯模板大小是始終不變的,只是在不同的octave之間改變圖片的大小。而在SURF中,圖片的大小是一直不變的,不同的octave層得到的待檢測圖片是改變高斯模糊尺寸大小得到的,當(dāng)然了,同一個(gè)octave中個(gè)的圖片用到的高斯模板尺度也不同。算法允許尺度空間多層圖像同時(shí)被處理,不需對圖像進(jìn)行二次抽樣,從而提高算法性能。上圖左邊是傳統(tǒng)方式建立一個(gè)如圖所示的金字塔結(jié)構(gòu),圖像的寸是變化的,并且運(yùn) 算會(huì)反復(fù)使用高斯函數(shù)對子層進(jìn)行平滑處理,上圖右邊說明SU
10、RF算法使原始圖像保持不變而只改變?yōu)V波器大小。SURF采用這種方法節(jié)省了降采樣過程,其處理速度自然也就提上去了(注:上圖片來自于網(wǎng)絡(luò))。3. 利用非極大值抑制初步確定特征點(diǎn)和精確定位特征點(diǎn)將經(jīng)過hessian矩陣處理過的每個(gè)像素點(diǎn)與其3維領(lǐng)域的26個(gè)點(diǎn)進(jìn)行大小比較,如果它是這26個(gè)點(diǎn)中的最大值或者最小值,則保留下來,當(dāng)做初步的特征點(diǎn)。檢測過程中使用與該尺度層圖像解析度相對應(yīng)大小的濾波器進(jìn)行檢測,以3×3的濾波器為例,該尺度層圖像中9個(gè)像素點(diǎn)之一.如下圖中檢測特征點(diǎn)與自身尺度層中其余8個(gè)點(diǎn)和在其之上及之下的兩個(gè)尺度層9個(gè)點(diǎn)進(jìn)行比較,共26個(gè)點(diǎn),圖中標(biāo)記x的像素點(diǎn)的特征值若大于周圍像素則
11、可確定該點(diǎn)為該區(qū)域的特征點(diǎn)。然后,采用3維線性插值法得到亞像素級(jí)的特征點(diǎn),同時(shí)也去掉那些值小于一定閾值的點(diǎn),增加極值使檢測到的特征點(diǎn)數(shù)量減少,最終只有幾個(gè)特征最強(qiáng)點(diǎn)會(huì)被檢測出來。4. 選取特征點(diǎn)主方向確定為了保證旋轉(zhuǎn)不變性,在SURF中,不統(tǒng)計(jì)其梯度直方圖,而是統(tǒng)計(jì)特征點(diǎn)領(lǐng)域內(nèi)的Harr小波特征。即以特征點(diǎn)為中心,計(jì)算半徑為6s(S為特征點(diǎn)所在的尺度值)的鄰域內(nèi),統(tǒng)計(jì)60度扇形內(nèi)所有點(diǎn)在x(水平)和y(垂直)方向的Haar小波響應(yīng)總和(Haar小波邊長取4s),并給這些響應(yīng)值賦高斯權(quán)重系數(shù),使得靠近特征點(diǎn)的響應(yīng)貢獻(xiàn)大,而遠(yuǎn)離特征點(diǎn)的響應(yīng)貢獻(xiàn)小,然后60度范圍內(nèi)的響應(yīng)相加以形成新的矢量,遍歷整個(gè)
12、圓形區(qū)域,選擇最長矢量的方向?yàn)樵撎卣鼽c(diǎn)的主方向。這樣,通過特征點(diǎn)逐個(gè)進(jìn)行計(jì)算,得到每一個(gè)特征點(diǎn)的主方向。該過程的示意圖如下:5. 構(gòu)造SURF特征點(diǎn)描述算子在SURF中,也是在特征點(diǎn)周圍取一個(gè)正方形框,框的邊長為20s(s是所檢測到該特征點(diǎn)所在的尺度)。該框帶方向,方向當(dāng)然就是第4步檢測出來的主方向了。然后把該框分為16個(gè)子區(qū)域,每個(gè)子區(qū)域統(tǒng)計(jì)25個(gè)像素的水平方向和垂直方向的haar小波特征,這里的x(水平)和y(垂直)方向都是相對主方向而言的。該haar小波特征為x(水平)方向值之和,水平方向絕對值之和,垂直方向之和,垂直方向絕對值之和。該過程的示意圖如下所示:綜上所述,目前,對SURF算法
13、有了一定了解。所以,可知SURF采用Henssian矩陣獲取圖像局部最值還是十分穩(wěn)定的,但是在求主方向階段太過于依賴局部區(qū)域像素的梯度方向,有可能使得找到的主方向不準(zhǔn)確,后面的特征向量提取以及匹配都嚴(yán)重依賴于主方向,即使不大偏差角度也可以造成后面特征匹配的放大誤差,從而匹配不成功;另外圖像金字塔的層取得不足夠緊密也會(huì)使得尺度有誤差,后面的特征向量提取同樣依賴相應(yīng)的尺度,在這個(gè)問題上我們只能采用折中解決方法:取適量的層然后進(jìn)行插值。實(shí)驗(yàn)結(jié)果:圖像特征提取效果圖如下所示:圖像匹配效果圖所示:補(bǔ)充思考問題1. 為什么選用高斯金字塔來作特征提取?首先,采用DOG的金字塔原因是:因?yàn)樗咏麹OG,而LO
14、G的極值點(diǎn)提供了最穩(wěn)定的特征,而且DOG方便計(jì)算(只要做減法).而LOG的極值點(diǎn)提供的特征最穩(wěn)定。其次,我們從直觀理解:特征明顯的點(diǎn)經(jīng)過不同尺度的高斯濾波器進(jìn)行濾波后,差別較大,所以用到的是DOG。但是直觀上怎么理解呢. 如果相鄰Octave的sigma不是兩倍關(guān)系還好理解:如果兩幅圖像只是縮放的關(guān)系,那么假設(shè)第一個(gè)Octave找到了小一倍圖像的極值點(diǎn),那么大一倍圖像的極值點(diǎn)會(huì)在下一個(gè)Octave找到相似的。但是現(xiàn)在,如果把大一倍圖像進(jìn)行一次下采樣(這樣和小的圖像就完全一樣了),進(jìn)行Gauss濾波時(shí),兩個(gè)圖像濾波系數(shù)(sigma)是不一樣的,不就找不到一樣的極值點(diǎn)了么.2.Hessian矩陣為
15、什么能用來篩選極值點(diǎn)?SIFT先利用非極大抑制,再用到Hessian矩陣進(jìn)行濾除。SURF先用Hessian矩陣,再進(jìn)行非極大抑制。SURF的順序可以加快篩選速度么(Hessian矩陣濾除的點(diǎn)更多?)至于SURF先用Hessian矩陣,再進(jìn)行非極大抑制的原因,是不管先極大值抑制還是判斷Hessian矩陣的行列式,金字塔上的點(diǎn)的行列式都是要計(jì)算出來的。先判斷是否大于0只要進(jìn)行1次判斷,而判斷是否是極大值點(diǎn)或者極小值點(diǎn)要與周圍26個(gè)點(diǎn)比較,只比較1次肯定快。而在SIFT中,構(gòu)建的高斯金字塔只有一座(不想SURF是有3座),要進(jìn)行非極大抑制可以直接用金字塔的結(jié)果進(jìn)行比較。而如果計(jì)算Hessian矩陣
16、的行列式,還要再計(jì)算Dxx、Dxy、Dyy。因此先進(jìn)行非極大抑制。這兩個(gè)步驟的先后與SIFT/SURF的實(shí)際計(jì)算情況有關(guān)的,都是當(dāng)前算法下的最佳順序,而不是說哪種先計(jì)算一定更好。3、為什么采用梯度特征作為局部不變特征?這與人的視覺神經(jīng)相關(guān)。采用梯度作為描述子的原因是,人的視覺皮層上的神經(jīng)元對特定方向和空間頻率的梯度相應(yīng)很敏感,經(jīng)過SIFT作者的一些實(shí)驗(yàn)驗(yàn)證,用梯度的方法進(jìn)行匹配效果很好。4、為什么可以采用某些特征點(diǎn)的局部不變特征進(jìn)行整幅圖像的匹配?從直觀的人類視覺印象來看,人類視覺對物體的描述也是局部化的,基于局部不變特征的圖像識(shí)別方法十分接近于人類視覺機(jī)理,通過局部化的特征組合,形成對目標(biāo)物
17、體的整體印象,這就為局部不變特征提取方法提供了生物學(xué)上的解釋,因此局部不變特征也得到了廣泛應(yīng)用。圖像中的每個(gè)局部區(qū)域的重要性和影響范圍并非同等重要,即特征不是同等顯著的,其主要理論來源是Marr的計(jì)算機(jī)視覺理論和Treisman的特征整合理論,一般也稱為“原子論”。該理論認(rèn)為視覺的過程開始于對物體的特征性質(zhì)和簡單組成部分的分析,是從局部性質(zhì)到大范圍性質(zhì)。SIFT/SURF都是對特征點(diǎn)的局部區(qū)域的描述,這些特征點(diǎn)應(yīng)該是影響重要的點(diǎn),對這些點(diǎn)的分析更加重要。所以在局部不變特征的提取和描述時(shí)也遵循與人眼視覺注意選擇原理相類似的機(jī)制,所以SIFT/SURF用于匹配有效果。5. 為什么Hessian矩陣
18、可以用來判斷極大值/極小值?在x0點(diǎn)上,hessian矩陣是正定的,且各分量的一階偏導(dǎo)數(shù)為0,則x0為極小值點(diǎn)。在x0點(diǎn)上,hessian矩陣是負(fù)定的,且各分量的一階偏導(dǎo)數(shù)為0,則x0為極大值點(diǎn)。對于某個(gè)局部區(qū)域,若hessian矩陣是半正定的,則這個(gè)區(qū)域是凸的(反之依然成立);若負(fù)定,則這個(gè)區(qū)域是凹的(反之依然成立)。而對于正定和負(fù)定來說,Hessian矩陣的行列式總是大于等于0的。反過來就是說:某個(gè)點(diǎn)若是極大值/極小值,hessian矩陣的行列式必然要大于等于0,而大于等于0如果是滿足的,這個(gè)點(diǎn)不一定是極大值/極小值(還要判斷一階導(dǎo)數(shù))。所以后面還要進(jìn)行極大值抑制.補(bǔ)充知識(shí)1 OpenSURF-The Offical Home of the Image Processing Libary. 參考資料1 Herbert Bay, Andreas Ess, Tinne T
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【真題】人教版三年級(jí)下冊期末考試數(shù)學(xué)試卷(含解析)2024-2025學(xué)年福建省三明市大田縣
- 風(fēng)季施工的技術(shù)保障措施
- 物業(yè)經(jīng)理項(xiàng)目協(xié)調(diào)職責(zé)
- 學(xué)校辦公室接待管理職責(zé)
- 以奈達(dá)功能對等原則解鎖體育英語翻譯密碼:理論、實(shí)踐與策略探究
- 汽車制造周資金計(jì)劃
- 行政管理專業(yè)企業(yè)競爭力調(diào)查報(bào)告范文
- 交通運(yùn)輸各部門職能及各崗位職責(zé)匯編
- 機(jī)械安全風(fēng)險(xiǎn)評(píng)估管理保障措施
- 美術(shù)興趣小組暑期活動(dòng)計(jì)劃
- 安徽省小學(xué)學(xué)生學(xué)籍表
- 無創(chuàng)腦血氧監(jiān)護(hù)儀技術(shù)審評(píng)報(bào)告
- 糖尿病足的診斷與治療ppt課件
- 非車險(xiǎn)銷售人員基礎(chǔ)培訓(xùn)系列第一講走進(jìn)非車險(xiǎn)世界
- 比選申請文件模板
- pt1000熱電阻分度表
- 汽車維修安全生產(chǎn)管理制度大全
- 晉江市勞動(dòng)合同書
- 無縫鋼管廠設(shè)備介紹
- 中國銀行_境外匯款申請書樣板(最新版)-帶中行行標(biāo)
- 壓力管道安裝竣工資料--特檢所版式
評(píng)論
0/150
提交評(píng)論