【基于雙目視覺立體車庫超限檢測技術(shù)8900字(論文)】_第1頁
【基于雙目視覺立體車庫超限檢測技術(shù)8900字(論文)】_第2頁
【基于雙目視覺立體車庫超限檢測技術(shù)8900字(論文)】_第3頁
【基于雙目視覺立體車庫超限檢測技術(shù)8900字(論文)】_第4頁
【基于雙目視覺立體車庫超限檢測技術(shù)8900字(論文)】_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

引言雙目視覺是計算機視覺中相當(dāng)關(guān)鍵的一部分,其原理是:利用相機等成像設(shè)備在相同時刻但不同方向上,獲取被測物體的兩幅圖像,之后計算左圖像和右圖像的同名點之間的位置偏差,再結(jié)合相機參數(shù)來得到該被測物體的三維幾何信息。雙目視覺作為一種非接觸性的測量,直接模擬人眼處理場景的方式,在實現(xiàn)三維圖像建模上具有設(shè)備簡單、成本低、精度高、性能優(yōu)異、使用可靠方便等優(yōu)點,在無人駕駛、三維重建、虛擬現(xiàn)實、視覺導(dǎo)航和安防監(jiān)控等領(lǐng)域都有廣泛應(yīng)用。一個完整的立體視覺系統(tǒng)主要有:圖像收集、圖像預(yù)處理、相機標(biāo)定、特征提取、立體匹配、三維重建和后期處理等七個步驟。立體匹配作為雙目視覺的重要部分,其目標(biāo)是找出一幅圖像上的每一個像素點在另外一個視角下拍攝的圖像上的對應(yīng)像素點,算出視差圖像,故而視差圖的優(yōu)劣直接取決于立體匹配算法的精度。2車輛輪廓檢測技術(shù)的研究立體車庫在車輛尺寸的超限檢測的過程中,需要利用兩個雙目攝像頭獲取車輛正面和側(cè)面圖像信息,通過圖像處理技術(shù)對圖像信息進行處理,以便獲得質(zhì)量更高、清晰度更好的圖像。由上述操作得到的圖像計算機可以更好地進行下一步處理,得到更為精確的效果。圖像處理技術(shù)主要有圖像濾波、圖像增強、邊緣檢測和特征提取等一些內(nèi)容。由于立體車庫工作環(huán)境并不如實驗條件下單一,會存在各種噪聲對車輛輪廓的提取造成干擾,比如光照、空氣、溫濕度都會產(chǎn)生一定的噪聲。本章也通過算法優(yōu)化對噪聲有所改善,為后續(xù)的立體匹配提供更為優(yōu)質(zhì)的圖像信息。2.1數(shù)字圖像處理技術(shù)介紹圖像預(yù)處理是圖像信息處理中不可或缺的一環(huán)。由于測量過程中不可避免的會受到外界的干擾噪聲。所以為了提高測量的精度,在圖像預(yù)處理方面也做了大量工作,通過預(yù)處理工作提高圖像質(zhì)量,為下文的車輛輪廓檢測和識別奠定基礎(chǔ)。2.1.1圖像灰度化由于攝像頭采集的圖像均保留了豐富細節(jié)信息的彩色圖像,在處理圖像時帶來了許多困難,也會極大降低圖像處理的速度。所以在保留關(guān)鍵信息的基礎(chǔ)上提高處理速度,灰度化便是解決方案,灰度化后的圖像保留的信息足以支撐系統(tǒng)的需要?;叶然S玫挠腥N:最大值法、平均值法、加權(quán)平均值法(權(quán)值分別為0.3,0.59,0.11)。三種方法得到的結(jié)果如下圖,經(jīng)對比最優(yōu)為加權(quán)平均值法,本文也將采取此法進行灰度化。圖2.1三種方式灰度化2.1.2圖像去噪圖像獲取的過程中不可避免的會在場景內(nèi)出現(xiàn)各種噪聲,極大的影響了所獲取的圖像質(zhì)量,從而使提取完整的圖像信息變得更為艱難。噪聲的出現(xiàn)對視覺測距系統(tǒng)都是一個挑戰(zhàn),會很大的影響測距的精度,所以系統(tǒng)中必然要加入濾波器進行濾波操作。常見的去噪算法有均值濾波、高斯濾波、中值濾波以及自適應(yīng)中值濾波。為選擇更為優(yōu)質(zhì)的去噪算法,選取3X3均值濾波模板、3X3的高斯濾波模板、3X3和5X5的中值濾波以及自適應(yīng)中值濾波進行比較。首先對圖像加入0.1%的椒鹽噪聲,然后對圖像進行處理得到圖2.2。實驗發(fā)現(xiàn)均值濾波和高斯濾波效果較差,中值濾波表現(xiàn)較好,自適應(yīng)中值濾波最佳。圖3.2椒鹽噪聲處理對圖像加入0.03%的高斯噪聲,然后分別用上述算法對圖像進行處理得到圖2.3。實驗發(fā)現(xiàn)均值濾波表現(xiàn)仍很差,3X3中值濾波和5X5中值濾波都出現(xiàn)了一定程度的模糊現(xiàn)象,高斯濾波和自適應(yīng)中值濾波表現(xiàn)較為出色。圖2.3高斯噪聲處理為進一步準(zhǔn)確的對比各個濾波器的性能,可以通過對比它們處理后的圖像與原圖像的PSNR和SSIM值,其中PSNR為峰值信噪比,其值越大表示失真越?。籗SIM表示結(jié)構(gòu)相似性,其值越接近為1,說明與原圖最為接近。從而得到表3.1和表3.2。表3.1各濾波器PSNR值表3.2各濾波器SSIM值由實驗數(shù)據(jù)可知,中值濾波在處理椒鹽噪聲更具有優(yōu)勢,但是處理高斯噪聲時相對較一般;其他濾波器均沒有突出表現(xiàn)。綜合考慮實驗場景的噪聲問題,選擇性能均衡的由自適應(yīng)中值濾波。2.2背景差分法提取目標(biāo)物在圖像中提取確定的物體的位置并將其提取出來是本節(jié)的首要任務(wù)。對車輛尺寸的檢測或多或少都會有大量環(huán)境因素進行干擾接下來的檢測與計算,所以將待測車輛進行目標(biāo)提取可以很大的提高測量的準(zhǔn)確率。本節(jié)利用背景差分法對車輛進行提取,以方便接下來的處理。2.2.1背景差分算法原理背景差分法的目的是去除背景的干擾,以便提取前景,簡化圖像處理的操作復(fù)雜度,簡言之就是圖像的前景與背景之間的差分算法,得到的圖像通過圖像處理方式進行修補,以達到最優(yōu)狀態(tài),背景差分算法可以計算兩幅圖像的差異信息,廣泛的用于運動物體的檢測、目標(biāo)物的提取等場景。在實際場景中,立體車庫的超限檢測場景一般是不會發(fā)生改變的,攝像頭也是固定不變的位置,所以攝像頭與背景之間可以保持確定的位置,所獲取的背景大小和位置可以默認為靜止不變,圖像中的車輛可以看作圖像中變化的部分,這樣便可以利用同一位置的像素點的顏色和灰度值的差異進行提取目標(biāo)車輛。在實際場景內(nèi),車庫的背景雖然一般不會改變,但是車庫的背景相對繁雜,可能會岀現(xiàn)各種各樣的邊緣及角點,這對下文的操作,尤其是立體匹配操作極為不利,很容易產(chǎn)生誤檢點,從而出現(xiàn)很大的誤差?;谏厦娴目紤],本文釆用背景差分法來實現(xiàn)目標(biāo)車輛的提取。首先對待檢車輛進行圖像獲取,攝像機分別捕捉兩張不同時間的圖像,其中一張圖像為背景圖,另一張圖像是車輛停在待檢區(qū)域的前景圖片;然后對所得的背景與前景圖像進行差分處理,得到目標(biāo)車輛的圖像,由于背景與前景的獲取時間不完全相同,存在光照等一些偏差,無法完美提取目標(biāo)車輛;所以接著需要對所得到得圖像進行二值化操作和連通性分析;最終實現(xiàn)目標(biāo)車輛的提取操作,背景差分提取算法流程圖如圖2.4所示:圖2.4背景差分算法流程圖2.2.2灰度二值化處理經(jīng)過圖像差分計算所得到粗略的車輛前景記為D(x.y),需要對其進行二值化操作,通過設(shè)定二值化閾值<5進行判斷處理。當(dāng)像素點灰度值小于該閾值,則將該點的灰度值置為0(黑),反之為1(白)。經(jīng)過二值化操作,對應(yīng)圖像背景/(x,切的像素點去除,車體部分由于灰度值較大保存下來,提取的目標(biāo)圖像為如公式(2.1)所示。(2.1)由上述可知,閾值的選取對二值化十分重要,經(jīng)過査閱文獻選取最優(yōu)閾值法㈣。該方法就是統(tǒng)計圖像的中各灰度分布特性,設(shè)定相關(guān)判據(jù)來確定最優(yōu)閾值δ,選取類別方差作為判據(jù)方法。具體算法如下:設(shè)圖像的灰度級共有m級,則灰度值為k的像素個數(shù)有佻那么像素總數(shù)N為:(2.2)可知,公式(2.2)中各像素出現(xiàn)的概率為:(2.3)假設(shè)以圖像灰度閾值z?將灰度圖像分為Z和H兩個部分,則:(2.4)對應(yīng)各自的概率為:(2.5)則灰度均值分別為:(2.6)其中,為圖像灰度統(tǒng)計的均值??芍狶區(qū)域和H區(qū)域的類間距離為:(2.7)最后可以構(gòu)造統(tǒng)計量:(2.8)由此可知從灰度級(l,2,3...m)中選取i值,當(dāng)p2(i)得到最大值時,此時i值便是最優(yōu)閾值δ.經(jīng)過如此選取的閾值可以一定程度減輕天氣等噪聲的影響。2.2.3噪點和連通性處理實驗發(fā)現(xiàn),經(jīng)過二值化處理后的圖像并不能滿足預(yù)想的結(jié)果,保存的目標(biāo)前景區(qū)域仍存在各種噪點,在所需的區(qū)域內(nèi)仍然存在或多或少的空隙和不連貫區(qū)域,都會對之后的操作帶來不可預(yù)知的影響。所以采用形態(tài)學(xué)運算去填充孔洞,連接間隙,最終達到消減噪聲的目的。圖2.5為最終進行背景差分算法處理后的實驗圖:圖2.5背景差分算法車體目標(biāo)檢測2.2.4背景估計方法在實際測量實驗中發(fā)現(xiàn),背景圖像容易受場景的環(huán)境影響,當(dāng)時間改變時光照、氣候均會發(fā)生或大或小的變化,同時部分場景也可能發(fā)生抖動也會造成背景圖像的改變。當(dāng)場景中沒有車輛時,可能仍能檢測到目標(biāo),造成誤檢測。因此通過在不同時間釆集多張背景圖像進行平均計算,在一定程度上可以自適應(yīng)修正背景圖。修正方法如公式(2.9)所示。(2.9)由上式可知,如果選取合適的參數(shù)M并用多幅圖進行平均計算,可以得到一個較為真實、具有一定普遍意義的背景圖像。3雙目視覺系統(tǒng)硏究與實現(xiàn)SLAM系統(tǒng)需要外部的傳感器來獲得姿態(tài)位置的信息。與其他的傳感器相比,立體視覺圖像攝影機主要的特點是制造成本低、信息的采集數(shù)據(jù)容量大。與單目立體的視覺檢測技術(shù)相比,雙目立體的視覺在獲得深度數(shù)據(jù)的過程中,具備了算法單一、實時性好等優(yōu)勢。本文的研究實驗系統(tǒng)的軟件和平臺主要選用了兩臺雙目立體的視覺軟件作為研究的傳感器,本章以兩臺常用網(wǎng)絡(luò)攝像機和一臺電腦作為軟件和實際研究的平臺,詳細地介紹了這兩臺網(wǎng)絡(luò)圖像的基本原理及主要發(fā)展階段:圖像標(biāo)定、圖像校正和立體對準(zhǔn)、SIFT提取和匹配。3.1相機模型在電腦中,一幅圖包含許多個像素,每一個像素有著屬于自己的信息。從三維世界中所釋放出來的光通過相機的一個光學(xué)中心,投射到相機的一個二維成像平面上。攝影頭和相機傳感器在接受到光后,測量到的數(shù)據(jù)就是像素。如圖3.1所示。圖3.1針孔相機在從一個空間點進行投影到另一個平面上的過程中,讓投影的中心設(shè)定為O,也就是相機的光學(xué)中心。其中,以歐幾里德坐標(biāo)系為基礎(chǔ)的光學(xué)核心位于該坐標(biāo)系。平面z=稱之為圖像平面或者是物體歸一化成像平面,位于投影的中心前面,是歸一化的成像平面。圖像獨立坐標(biāo)系的定義就是將一個圖建立在帶有視覺圖像的垂直水平平面上,坐標(biāo)系中原點和的定義分別為a和c。在一個不同類型的激光照相機中或有別于其他針孔式和像素式激光照相機的三維成像模型中,將三個坐標(biāo)分別固定為(X,Y,Z)T,根據(jù)相似的三角形原理,投影得到像面上每一個點的位置坐標(biāo),我們可以被計算成(fx/z,fy/z,f)T。刪除最后一個圖像的坐標(biāo)后,將顯示從世界坐標(biāo)到圖像坐標(biāo)的中心映射關(guān)系如下:(X,Y,Z)T(fX/Z,fY/Z,f)T(3.1)公式(3.1)描述了三維點與現(xiàn)實世界的三維空間關(guān)系,但由照相機獲取的三維點是在三維圖像表面上進行采樣并被精確地量化后的三維點。假設(shè)在一個圖像的平面上應(yīng)該有一個像素平面,如圖3.2所示。圖3.2像素平面圖像左上角的點是它的坐標(biāo)原點,橫向像素坐標(biāo)線和軸u與整個圖像立體平面像素坐標(biāo)系在圖中的一個x或y軸和線相等,縱向像素坐標(biāo)線和軸v與整個圖像立體平面像素坐標(biāo)系在圖中的x或y軸和軸大致相等。給出了三維空間點P與其像素坐標(biāo)(u,v)T的對應(yīng)關(guān)系為:(3.2)其中,f的單位是m,α、β是縮放倍數(shù),α是u軸相對于X軸的倍數(shù),β是v軸相對于Y軸的倍數(shù),同時兩個原點也發(fā)生了平移,平移是[Cx,C將αf合并為fx,將βf合并為fy,單位為像素,則得:(3.3)3.2雙目相機模型包括兩個獨立的單目攝像機的相機就是雙目相機,其成像模型結(jié)構(gòu)如圖3.3左圖所示。在這兩種雙目相機中,兩種攝像頭都是可以被認為是一種單目針孔攝像頭。假定左攝像機的投影中心位置為OL,右攝像機的投影中心為OR。請注意,二者之間的距離就是基線。圖3.3雙目相機的成像模型將一個點P分別從左右兩個攝像機進行攝像,P的投影點分別為PL和PR。兩個點的位置并不相同攝像機標(biāo)定的目的是消除圖像失真,如圖2-4的右圖所示。左右兩個點的高度相同,只有X軸不同。橫坐標(biāo)uL是PL的橫坐標(biāo),同樣的,PR的橫坐標(biāo)是uR,z是深度值,b是基線的長度,關(guān)系是:z?fz=b?uL+u整理得:z=fbd,d=uL?uR(3-5其中d是uL與uR之間的差,而這個視差和被測深度成一個正比,參考線和被測的深度成反比,視差越小,參考線時間越長,雙目照相機在其中所可以檢測到的深度數(shù)值范圍就越廣。3.3攝像機標(biāo)定計算機視覺學(xué)科研究的主要目的之一就是通過對二維世界圖像進行計算,獲取三維世界中的環(huán)境資料,其中包括地理、形貌、運動、姿勢等。所獲得的影像位置和時間均與空中物體于其表面的各種幾何位移有著緊密聯(lián)系。這些位置之間的關(guān)系是由于攝像機在進行成像時所需要的各種幾何模擬測量方法來進行確定的,其中幾何參數(shù)也統(tǒng)稱為相對于攝像機的各種參數(shù)。所以,參數(shù)的準(zhǔn)確性和精度直接影響到我們是否能夠從二維畫面中準(zhǔn)確獲得三維的信息。這一個參數(shù)采集的過程叫做計算機標(biāo)準(zhǔn)化。必須在指定的三維視圖上確定一個點以及它們在各個視圖上相對應(yīng)的二維投射。在平面標(biāo)定方法中,這些參數(shù)可以通過棋盤標(biāo)定板獲得。傳統(tǒng)的標(biāo)定算法主要目的就是選擇一個在結(jié)構(gòu)上尚未知、準(zhǔn)確性較高的標(biāo)定相位攝像機對象,并以其作為真實的空間參考攝像機的對象,通過將真實的參考攝像機對象的真實環(huán)境特征點和真實的參考攝像機對象的圖像特征點之間的相互對應(yīng)性進行匹配,建立相位攝像機的參數(shù)模型約束,然后再通過這個算法進行計算。傳統(tǒng)標(biāo)定法在獲得標(biāo)定參數(shù)的過程中具有精度高的優(yōu)勢,但其缺點是需要一個高精度的基準(zhǔn)來作為標(biāo)定的參數(shù)。與其他傳統(tǒng)的標(biāo)定技術(shù)相比,自標(biāo)定技術(shù)可以在任何時間進行多次標(biāo)定。主動控制視覺標(biāo)準(zhǔn)化方法就是基于主動控制的攝像機來獲取影像數(shù)據(jù)。這個方法的優(yōu)點是它的標(biāo)定時間內(nèi)攝像機的運行軌跡被認為已經(jīng)知道兩次,因此,對攝像機的參數(shù)模型能夠進行線性化的求解。它的缺點是它們需要一個高粘度的移動平臺,標(biāo)定費用高。實驗中采用普通網(wǎng)絡(luò)攝像機作為觀測傳感器,參數(shù)固定,無需頻繁進行標(biāo)定。本實驗采用了傳統(tǒng)標(biāo)定。以邊長28mm、8行6列的方格棋盤為參考對象,如圖3.4所示,對攝像機進行標(biāo)定。圖3.4相機圖片直接從MATLAB的一個CommandWindow里面進行選擇它并輸入一個cameraCalibrator即時就可以對其中標(biāo)定的一個應(yīng)用程式進行程序調(diào)用,如圖3.5所示。圖3.5matlab標(biāo)定首先先把之前我們拍攝好的棋盤格圖像重新加載到進去,輸入每個棋盤格的誤差最大和錯切的誤差最小,之后再次重新選擇這個參數(shù),在matlab中再次重新選擇如何正確使用這兩個參數(shù),并且重新選擇了誤差最大和誤差錯切的誤差錯切和桶型畸變。然后再次點擊按鈕,在開始的時候再次等待了很長一段時間后,就已經(jīng)能夠?qū)崿F(xiàn)完成這個目標(biāo)的設(shè)置。并且matlab可以直接實現(xiàn)對圖像的比較校正前后,如圖3.6所示。點擊showundistorted按鈕即可直觀的在屏幕上看到一個完整的沒有任何畸變的圖像,如圖3.7所示。圖3.6matlab矯正圖像圖3.7matlab無畸變圖像隨后查看結(jié)果,如圖3.8所示。圖3.8matlab輸出結(jié)果3.4立體匹配根據(jù)三角測距原理,兩圖對齊,立體視差的計算精度最高,誤差最小。立體匹配方法的研究目標(biāo)之一就是投影兩個相同攝像機的影像,使它們能夠到同一水平面上,保持光線能夠?qū)R,如圖3.9所示。圖3.9相機數(shù)學(xué)對準(zhǔn)基于對極幾何的基礎(chǔ),左右兩側(cè)的圖像能夠進行完美的匹配。如圖3.10所示:圖3.10對極幾何在三維圖3.10中,由于三維空間中兩點的角p和兩個的點相對于光學(xué)攝像機的兩個光學(xué)圖像中心的點來說所決定的光學(xué)平面的點c為一個極大的光學(xué)平面?;具B線與兩個相等于一的攝像機數(shù)碼圖片的一個基線交點結(jié)合稱為極端,與兩個相等于一的攝像機數(shù)碼圖片在一個基線平面上的另一個基線交點結(jié)合稱做基線極端。同一個圖片平面上的所有極點在這個交點處都是相交。其中一條直線PleftEleft是與左圖中的一個點Pright相對應(yīng)的另外一條極線,直線PrightEright是與另外一條右圖中的點Pleft相對應(yīng)的另外一條極線。如果左邊的平面Pleft的位置都已知,則右邊的平面Pright的外部相應(yīng)點必須固定在右邊的像素所對應(yīng)的外部極線上,即右邊固定在一條直線上;雙目視覺檢測的一個主要特點便是極線性約束。但另一方面,從極線與約束之間的關(guān)系來看,只是因為我們能夠讓我們清楚地知道它所相互對應(yīng)的點在右平面上的大小和位置,然而,極線約束給我們提供了從另一幅畫中搜索到匹配的對應(yīng)點的時間和約束條件,從而縮短了由另外一幅繪畫中搜索到匹配的相關(guān)點至從一條直線上搜索到匹配相關(guān)點的時間和搜索速度。因此,極線約束法主要需求攝影機具備以下幾個主要優(yōu)勢:在我們進一步認識到雙目攝影機之間的極線關(guān)系后,兩幅攝影機中的所有與該特性相匹配的二維搜索方式便會被轉(zhuǎn)化成為一維搜索。本文通過Bouguet算法,對圖像信號進行了校正以此獲取深層圖像信息。給定的立體投影圖像之間的Bouguet投影算法在徑向旋轉(zhuǎn)矩陣和徑向平移矩陣(R,t)的運動計算基礎(chǔ)上,使得每幅立體投影圖像再次開始時需要進行一次投影的運動次數(shù)最少,觀察者看到的圖像面積最大。為了減少失真,左右兩個攝像頭都分別在拍照時完成了矩陣r1、r2,使得攝像頭的主光能夠指向相反的方向。這樣相機的圖像與象形物體共面,但無法完成對齊。設(shè)置一個極點可以被變換的矩陣Rrect,左視圖中的極點變成了無限大,極線也就轉(zhuǎn)變?yōu)榱怂?,攝像機在這個過程中投影到一個正中心左右的一個平移矢量的方向也就是左極點的方向。e1=T//T//,T=[Tx,Ty,Tz]T(e2必須和e1正交。其中,一種簡單的計算方法也就是通過選擇與激光照相機的相機主軸與光線方向角度正交的距離,可以通過利用下式中的計算得出相機主軸與光線方向之間的叉積。經(jīng)歸一,e2=Tx,Ty,0T2Tx第三個向量e3與e1,e2正交,e3=e1×e2(3所以,將左極點映射為矩陣至無限遠的一個行對準(zhǔn)變換矩陣定義為:(3.9)通過矩陣r1、r2和Rrect,我們就可以得到Rleft和Rright。(3.10)Bouguet算法使圖像的光軸平行于左右,得到一個理想的平行排列的雙目系統(tǒng)。切割出正確的非相干場角圖像,同時在場角處觀看左右極點圖像并達到最大化,如圖3.11所示。A圖像作為校正前的影像,B的影像作為校正后的影像,正確的圖像達到直線的對齊。圖3.11圖像校正結(jié)果對比3.5特征點的提取SLAM系統(tǒng)需要采集現(xiàn)實中的信息。標(biāo)點符號在地圖上位置信息,在地圖作為一個輸入,選擇一個現(xiàn)實中的點是很重要的一個步驟。視覺SLAM中的特征點提取算法可以先得到現(xiàn)實中的一個點,將它當(dāng)作輸入點來看待。現(xiàn)在已經(jīng)有很多檢測方法可以實現(xiàn)檢測網(wǎng)狀特征點,主要目的就是根據(jù)網(wǎng)狀結(jié)構(gòu)來進行識別,SLAM系統(tǒng)必須通過檢測得出穩(wěn)定的網(wǎng)狀圖像特征點,如不同的角度和地表光照條件下的位置。特征點的提取需要具有良好的環(huán)境適應(yīng)力,因此必須對特征點的位置進行一次旋轉(zhuǎn)。對于模擬投影,最好用的方法有兩種,,一是基于SIFT尺度提取特征二是原點變換式,而SIFT擁有模擬射擊不變,并且還有非常高的一致性。因此,SIFT特征點的取得是一種可以有效地與穩(wěn)定的特征點相吻合并且有效地保持其一致性的最佳方法。其步驟如下:3.5.1建立一個尺度空間復(fù)制多個圖像進行縮放,建立尺度空間,模擬出一個圖像具有多尺度特點。SIFT算法定義圖像的尺度空間如下:L(x,y,σ)=G(x,y,σ)*I(x,y)(3-11)I(x,y)是一個二維圖像,G(x,y,σ)是一個在大小和長度上具有不同非線性的高斯函數(shù),I(x,y)為二維圖像。高斯金字塔從圖像中建立,構(gòu)建log(width)/log(2)-2層次的金字塔,width是其寬度,每個層級的默認四個層次如圖3.12所示,顯示了高斯核的卷積處理的過程。圖3.12高斯金字塔的搭建過程3.5.2建立高斯差分金字塔相同層的圖像分別進行差分,則我們可以直接獲得高斯差分金字塔(DifferenceofGaussian,DOG),如圖3.13所示。圖3.13極值檢測為了更好地檢測該區(qū)域的尺度非常不變的兩個特征點,需要更好地檢測該區(qū)域在圖像上的兩個相關(guān)極值,為了更好地檢測DOG的空間極大值和最低極小值,SIFT算法將該區(qū)域的鄰接層和其所在層3層附近的26個相鄰像素的值進行比較。如圖3.13所示。如果"叉號"的位置和像素值是大于或等于它們相鄰26個像素的值,那么該點就是這個圖像上的極大值或最低的值。并將其所處的地理區(qū)域進行記錄。本文通過實驗可以從每個層次金字塔空間中從圖像中得到四個不同尺度后可以得到三個不同極值。3.5.3確定特征點特征描述符將坐標(biāo)軸在某一點上旋轉(zhuǎn),直到坐標(biāo)軸與另一點的方向可以重合,并且要確保這個點在某一時刻的旋轉(zhuǎn)不改變。圖3.14左中心表示了各個特征點的大小和位置,每個藍色格子表示與其他特征點相同尺度。計算并進行積累后看到右邊的部分窗口每個4*4子塊上8個朝向相反梯度方向的不同梯度種子數(shù)目,就認為可以直接形成一個新的種子點。4*4=16個種子點同樣可以用來構(gòu)造一個各具8個種子特征的種子點,每個種子具有8個種子特征的都是種子點,每個具有128個特征的種子描述物具有128個維度,鄰域的信息和種子方向的信息相互結(jié)合的設(shè)計思想,既提高了該算法的抵御噪聲和穩(wěn)定性,又為定位誤差所對應(yīng)的功能量提供了較好的適應(yīng)性。圖3.14特征點描述符3.5.4特征點匹配在比較左右圖像的特征點及其維度描述符128之后,兩個圖像的功能節(jié)點可以容易地組合。當(dāng)我們使用一幅圖上點去對應(yīng)另一幅圖上的點時,我們對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論