關于三維圖像目標識別文獻綜述_第1頁
關于三維圖像目標識別文獻綜述_第2頁
關于三維圖像目標識別文獻綜述_第3頁
關于三維圖像目標識別文獻綜述_第4頁
關于三維圖像目標識別文獻綜述_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、關于三維目的識別的文獻綜述前言:隨著計算機技術和現(xiàn)代信息處理技術的快速開展,目的識別已經(jīng)迅速開展成為一種重要的工具與手段,目的識別是指一個特殊目的或一種類型的目的從其它目的或其它類型的目的中被區(qū)分出來的過程。它既包括兩個非常相似目的的識別,也包括一種類型的目的同其他類型目的的識別。目的識別的根本原理是利用雷達回波中的幅度、相位、頻譜和極化等目的特征信息,通過數(shù)學上的各種多維空間變換來估算目的的大小、形狀、重量和外表層的物理特性參數(shù),最后根據(jù)大量訓練樣本所確定的鑒別函數(shù),在分類器中進展識別判決。它屬于形式識別的范疇,也可以狹義的理解為圖像識別。三維目的識別是以物體外表朝向的三維信息來識別完好的三

2、維物體模型目的識別需要綜合運用計算機科學、形式識別、機器視覺以及圖像理解等學科知識。目的識別技術已廣泛應用于國民經(jīng)濟、空間技術和國防等領域。正文:圖像識別總的來說主要包括目的圖像特征提取和分類兩個方面。但是一般情況下,圖像受各種因素影響,與真實物體有較大的差異,這樣,就需要經(jīng)過預處理、圖像分割、特征提取、分析、匹配識別等一系列過程才能完成整個識別過程。目前,最主流的三種三維物體識別研究思路是:1)基于模型或幾何的方法;2)基于外觀或視圖的方法;3)基于局部特征匹配的方法;一、基于模型或幾何的方法:這種方法所識別的目的是的,原理就是利用傳感器獲得真實目的的三維信息并對信息進展分析處理,得到一種外

3、表、邊界及連接關系的描繪,這里,三維物體識別中有兩類最經(jīng)常使用的傳感器:灰度傳感器和深度傳感器,前者獲取圖像的每個像素點對應于一個亮度測量,而后者對應于從傳感器到可視物體外表的間隔;另一方面,利用CAD建立目的的幾何模型,對模型的外表、邊界及連接關系進展完好的描繪。然后把這兩種描繪加以匹配就可以來識別三維物體。其流程如以下圖所示:E1-1基于模型的二維物體識別算法框閨傳感器數(shù)據(jù)獲取過程,就是從現(xiàn)實生活中的真實物體中產(chǎn)生待識別的模型。分析/建模過程,是對傳感器數(shù)據(jù)進展處理,從中提取與目的有關的獨立應用特征。模型庫的建立一般式在識別過程之前,即首先根據(jù)物體的某些特定特征建立一些關系以及將這些信息匯

4、總成一個庫。在模型匹配過程,系統(tǒng)通過從圖像中抽取出的物體關系屬性圖,把物體描繪與模型描繪通過某種匹配算法進展比較、分析,最終得到與物體最相似的一種描繪,從而確定物體的類型和空間位置基于模型的三維物體識別,需要著重解決以下4個問題:1)模型產(chǎn)生:主要有CAD設計法用以產(chǎn)生模型庫和傳感器產(chǎn)生法用以產(chǎn)生目的;2)目的描繪:有基于不變性特征法、外表模型法等;3)模型描繪:一般和目的描繪方法相似;4)模型匹配:可用間隔法、最小二乘匹配法及樹匹配等?;谀P偷姆椒ㄟM展三維物體識別,優(yōu)點是比較直觀和易于理解,但是一般使用的算法的運算量都較大,并且需要人工借助CAD等軟件產(chǎn)生模型。另外,對復雜物體建立三維幾何

5、模型的難度和工作量比較大,在應用中還非常不方便,因此怎樣在這個根底上加以改善是一個值得討論的問題。二、基于視圖的方法二維圖像一般情況下通過普通相機就可以獲取,在一幅二維圖像中,三維物體的外觀取決于形狀、反射特性、姿態(tài)和環(huán)境亮度等?;谕庥^或基于視圖的三維物體識別算法研究,近來成為人們的研究熱點。即使最簡單的物體,其不同視點的二維視圖差異往往會很大,而生物視覺系統(tǒng)對此表現(xiàn)出非常穩(wěn)健的識別才能,它們的識別過程趨向于選擇物體的二維視圖,而不是物體的三維描繪?;谝晥D的方法通過視覺相似性來識別物體,識別系統(tǒng)設計相對簡單,無需顯式地計算物體三維模型。該方法一般分為兩個步驟:首先,通過不同光照條件和三維物

6、體在二維圖像中呈現(xiàn)出的不同姿態(tài),來自動地學習物體的表示或訓練系統(tǒng);然后,在一幅未知的二維圖像中判斷是否存在目的物。該方法一個主要的限制條件是,我們感興趣的對象必須與背景可以較好的區(qū)分開來,因此對物體間的重疊較為敏感,且需要較好的圖像分割。但當物體的幾何建模很困難或根本不可能得到時,那么可利用基于視圖的方法來識別三維物體。該方法的關鍵點和難點,是在于如何準確有效地用多個視角圖像來描繪一個物體。基于視圖的三維物體識別算法流程,如以下圖所示:圖像預處理待識別三維物體圖像濾波閾伯處理二值化分類識別I神經(jīng)網(wǎng)舉-支撲支持機 SNoW-特征提取圖1-2基J視圖的三維物期識別算法框圖三、基于局部特征匹配的方法

7、理論上要求識別系統(tǒng)具有通用性、穩(wěn)健性且學習簡單。傳統(tǒng)的圖像描繪方法采用的是全局特征,旨在將目的作為一個整體,從大量包含目的的圖片集中學習并抽取全局特征,如面積、周長、不變矩等,并采用統(tǒng)計分類技術進展目的分類。這種識別方法有以下缺陷:1對于構造復雜的圖像,識別效果受到圖像分割精度的制約;2需要學習大量的數(shù)據(jù)以及較長的訓練時間;3由于沒有捕捉到圖像中的局部信息,當目的的形狀發(fā)生較大變化時,比方目的被局部擋住,就會導致全局特征的突然變化,對于目的識別是非常不利的。前面提到的基于模型的方法和基于視圖的方法,在這些方面有所缺陷。最近,基于局部區(qū)域特征匹配的算法,在物體識別領域里獲得了相當好的效果。局部特

8、征目前還沒有一個統(tǒng)一的定義,它的提出主要是相對全局特征而言,用局部特征對圖像進展描繪時可以得到圖像中物體的局部信息。在復雜背景下,噪聲干擾較大、局部遮擋、目的姿態(tài)發(fā)生變化的情況下,利用局部信息進展目的識別是非常有效的。如同基于視圖的方法,該方法從物體的圖像中學習并構造物體的模型,同時提取局部圖像塊的特征用于匹配。該方法通過對視角改變而局部不變的過程,來檢測得到視圖中三維物體的局部區(qū)域,然后通過從局部測量計算得到的不變量描繪的區(qū)域集合來表示物體。局部特征可以從幾何角度粗略的分為點、線、面3種類型:1、基于點特征的目的識別技術:角點是圖像的一個重要的局部特征,它具有旋轉(zhuǎn)不變性,幾乎不受光照條件的影

9、響。角點可以是圖像中具有周圍灰度變化劇烈特征的點,也可以是圖像邊界上具有曲率足夠高的點,還可以是圖像中具有最大偏轉(zhuǎn)角和偏向的點、灰度梯度方向變化較大的地方等。角點在圖像匹配中有廣泛應用。常見的特征描繪方法是:將形心到相鄰兩角點的直線所成的夾角作為識別的特征,這組特征對于比例、平移和旋轉(zhuǎn)都是不變的。但是由于角點的檢測容易出現(xiàn)漏檢和虛假角點等,在利用角點作為不變量對目的進展識別時,可以考慮與其他特征結合起來進展識別。2、基于線特征的目的識別技術提取圖像中的特征線如直線、曲線、各種輪廓線等,可以使圖像的表述更簡潔,而曲線可以用直線加以近似,進而形成封閉的輪廓。常用的直線提取方法有Houg喳換、啟發(fā)式

10、連接算法、層次記號編組法和相位編組法等。Houg喳換提取直線準確且穩(wěn)定,抗噪聲才能強,不會產(chǎn)生直線斷裂等情況,但是計算量很大且由于不考慮各點之間的間隔信息,因此,容易將不屬于直線上的點也連接到該直線上,即容易出現(xiàn)過連接現(xiàn)象。啟發(fā)式連接算法提取直線抑制了Hough變換的缺陷,但對邊緣檢測結果敏感,容易產(chǎn)生直線斷裂的情況。層次記號編組法提取直線速度快,能連接短直線,然而存在參數(shù)難以選擇、分辨率低的問題。而相位編組法采用了另一種思路,相位編組法是根據(jù)各像素點的梯度相位進展分組,相鄰的梯度方向一樣的點形成邊緣支持區(qū)域,再從每個區(qū)域提取直線段。這種方法在提取低比照度直線時效果很好,但是抗噪才能較差,提取

11、的直線往往存在斷裂。下面有一種基于直線特征目的識別算法:首先,創(chuàng)立一個圖像中的線條的近鄰搜索構造;使用范圍搜索,識別出在每個模型和圖像中的每個角落;對于每個模型做這樣的處理:H=?初始化假設列表為空;對每個模型線和圖像線組成的線對1,11,令:C二線對1,11以及鄰近角落產(chǎn)生的狀態(tài)假設;H=HUC;對C中的相鄰的模型及圖像的相似性進展比較;完畢;P=將H按鄰域內(nèi)的相似性進展分類得出的結果;對每一個Pii=1,2,門,和模型的特征加以比較;假設發(fā)現(xiàn)足夠的相似線對,那么一個圖像就可以被識別出來;完畢。3、基于面特征的目的識別技術面特征從嚴格意義上已不屬于傳統(tǒng)的幾何形狀特征了,一般稱為局部紋理特征或

12、者局部外觀特征。這類特征不受圖像分割精度的影響。局部外觀特征是通過對興趣區(qū)域進展計算得到的,這就是說首先要提取興趣區(qū)域,然后選擇適宜的區(qū)域描繪子進展描繪。一般區(qū)域檢測算子得到的興趣區(qū)域是橢圓區(qū)域,它們在仿射像變換中具有不變性。常用的興趣區(qū)域有Harris-Laplace區(qū)域、DoG區(qū)域、Hessian-Laplace區(qū)域、凸顯區(qū)域、極大穩(wěn)定極值區(qū)域等?;诰植刻卣髌ヅ涞哪康淖R別方法的優(yōu)點是,因為視角改變引起的物體外觀的形變,全局看來盡管非常復雜,但在局部的尺度上可通過簡單的變化來估計;同時因為無需所有的局部特征得到匹配,這種方法在物體有重疊和復雜背景情況下都有較好的穩(wěn)健性。因為建立了區(qū)域間的相

13、似性,物體識別也做到了局部化。在基于局部特征匹配這一大類方法中,各種算法的區(qū)別在于,局部圖像區(qū)域的選擇和基于這些區(qū)域的特征計算。結論:三維目的識別是一門比較新的科學,它可以從已經(jīng)比較成熟的二維圖像識別中過渡一些根本處理方法,但是三維圖像以及物體所涵蓋的信息量遠遠大于二維圖像,因此,對于三維目的識別的研究陸續(xù)的出現(xiàn)了各種各樣的方法??偟膩碚f,三維目的識別是一個比較復雜的但是值得研究的課題。對生活等許多領域?qū)a(chǎn)生很大影響。參考文獻:徐勝.彭啟琮.三維物體識別研究期刊論文-計算機工程與應用2021(31)陶曼.深度圖像的分割與壓縮學位論文碩士2006學位論文博士2021林應強.基于模型的三維物體識別學位論文碩士1997樊亞軍.利用神經(jīng)網(wǎng)絡實現(xiàn)三維飛機目的識別學位論文碩士2005胡薇.基于特征空間的3D目的識別方法研究學位論文碩士2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論