機器視覺人工智能及其應(yīng)用_第1頁
機器視覺人工智能及其應(yīng)用_第2頁
機器視覺人工智能及其應(yīng)用_第3頁
機器視覺人工智能及其應(yīng)用_第4頁
機器視覺人工智能及其應(yīng)用_第5頁
已閱讀5頁,還剩119頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第九章第九章 機器視覺機器視覺人工智能及其應(yīng)用 對人類感覺信息的理解與處理是人工智能研究和應(yīng)用又一重要領(lǐng)域。人類的這些感覺信息是多種多樣的,包括視覺、聽覺、力覺、觸覺、嗅覺、味覺、接近感和臨場感(telexistence或telepresence)以及情感等。其中,對視覺和力覺的研究最為重要,且均已進入實用階段。對觸覺和聽覺的研究也已獲得顯著進展。不過,對嗅覺,尤其是味覺的研究尚未有重大突破。至于對人工情感的研究,仍停留在科學(xué)幻想階段。 除了對各種單一的傳感信息進行研究外,近年來又出現(xiàn)了對多種傳感信息的集成與融合(integration and fusion)研究;它利用各種傳感器性能上的差異

2、性與互補性,融合不同傳感器的信息源并加以綜合分析,以得到正確理解的、穩(wěn)定可靠的周圍環(huán)境信息,使系統(tǒng)具有容錯性,提高系統(tǒng)的信息處理速度,保證決策的正確性和準確性。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 視覺是人類最重要的感覺能力之一。視覺數(shù)據(jù)是人的最復(fù)雜和最有用的感覺輸入信息。人眼能感覺顏色,因為它具有全色能力。人眼能感覺運動,因為視網(wǎng)能提供所出現(xiàn)事物的實際響應(yīng)。 當(dāng)代科學(xué)技術(shù)能否用機器來完全解釋、模擬、復(fù)現(xiàn)和處理人的視覺呢?作為一種感覺輸入數(shù)據(jù),人們已能以有限的但是比較重要的方法重現(xiàn)視覺信息。機器視覺涉及對相似視覺數(shù)據(jù)的解釋。接至計算機的視覺傳感器感受到圖

3、像的明暗信號,并把這些信號變換為可供處理的形式。把視覺傳感器裝在機器人的機械手上,只要物體與其背景的對比度明顯不同,而且不相互接觸或重疊,那么就能夠讓機器人通過圖像輪廓來識別物體。這種視覺系統(tǒng)已獲得應(yīng)用。 由機器來感覺環(huán)境并執(zhí)行要完成的任務(wù)具有明顯的優(yōu)點,并獲得多方面的應(yīng)用。除了用于由機器人進行裝配和檢驗作業(yè)外,還可用于星際空間搜索、醫(yī)用X-射線自動鑒別、地球資源遙感監(jiān)視和各種軍事應(yīng)用等。這種視覺機器有助于執(zhí)行許多日常單調(diào)的甚至對人危險的任務(wù);如果沒有某種感覺能力,那么這些任務(wù)是很難甚至無法完成的。 大多數(shù)工業(yè)裝配任務(wù),包括一些看起來很簡單的任務(wù)(如把車輛裝在汽車上),一般都需要采用視覺技術(shù)。

4、在惡劣環(huán)境下(例如,在太空和水下)或在加工有害材料時,一般都需要機器視覺。對于許多應(yīng)用,視覺系統(tǒng)必須是自主的。 計算機視覺(即機器視覺)就是由圖像數(shù)據(jù)來產(chǎn)生視野環(huán)境內(nèi)有用符號描述的過程。所開發(fā)的計算機視覺的特點與過程往往與其應(yīng)用場合有關(guān)。 機器視覺包含眾多的研究課題,如視覺可計算性原理、圖像的形成和獲取、圖像預(yù)處理、邊緣檢測與分割、特征抽取與匹配、區(qū)域生成與分割、形狀分析與識別、運動視覺、主動視覺、三維視覺以及視覺知識的表示和視覺系統(tǒng)的控制策略等。機器視覺已發(fā)展成為一門獨立的學(xué)科。因此,對機器視覺的系統(tǒng)、全面和深入的研究,已不是本書的任務(wù)。本章僅對機器視覺進行導(dǎo)論性介紹,僅限于討論一些比較基本

5、的問題,這些問題可能與機器人視覺有比較直接的關(guān)系。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.1圖像的理解與分析 對圖像的理解和解釋是計算機視覺的研究中心,也是人工智能研究的焦點之一??梢园岩曈X理解為一個從外部世界圖像產(chǎn)生對觀察者有用的描述過程。這些描述依次由許多不同的記錄了的景物某一方向的固定表達組成。因此,選擇視覺系統(tǒng)的表達方法,對于視覺系統(tǒng)是至關(guān)重要的。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.1.1視覺信息的表達方法 根據(jù)馬氏(Marr)提出的假設(shè),視覺信息處理過程包括三個主要表達層次,即初始簡圖、二維半簡圖和三維簡圖,如圖9.1所示。聯(lián)為聯(lián)為- -

6、稻草人自動化稻草人自動化1.初始簡圖初始簡圖 亮度圖像含有兩種重要信息:圖像的亮度變化和局部幾何特征。初始簡圖是一種本原表達法,它能完全而又清楚地表示上述信息。初始簡圖所包含的信息大部分集中在與實際邊緣以及邊緣終止點有關(guān)的劇烈灰度變化上。對于每一邊緣亮度變化,在初始簡圖上都有對應(yīng)的描述。這些描述包括:與邊緣有關(guān)的亮度變化率、總的亮度變化、邊緣長度、曲率和方向等。粗略地說,初始簡圖是以勾畫草圖的形式來表示圖像中的亮度變化的。圖9.2即為初始簡圖的一個例子,說明它的輝亮邊界描述和亮度變化。如果所用邊緣檢測方法所產(chǎn)生的是短線段,那么,就要利用聚集過程把那些相容的描述線段連接起來。 根據(jù)馬氏理論產(chǎn)生初

7、始簡圖,并不需要關(guān)于特定物體的有關(guān)知識。也就是說,馬氏建議試圖描述圖像具有的屬性,而對景物可能與什么事物有關(guān)則不作任何假設(shè)。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化2.二維半簡圖二維半簡圖 要對圖像進行更深入的描述,需要知道其內(nèi)在特性。這些內(nèi)在特性包括表面方向、從觀察者至被觀察表面的距離、反射和入射光照表面的紋理以及材料特性等。二維半簡圖(2D sketch)包含景物表面的信息,可以把它看做某些內(nèi)在特性的混合信息。二維半簡圖清楚地表示物體表面方向的信息。物體表面法線從物體內(nèi)部穿出來,使物體好像穿刺滿了針一樣。有時,這種二維半簡圖又稱為指針圖,或簡稱針圖(needle diagram)。此外,二維

8、半簡圖還包含從觀察者到圖像各部分的距離。圖9.3表示出二維半簡圖的表面方向信息。圖中,指針的箭頭表示垂直于表面的矢量,即為表面法線。 在初始簡圖和二維半簡圖中,信息往往是以與觀察者有關(guān)的坐標系表示的。因此,這種表達法稱為觀察者中心表達法。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化3.三維模型三維模型 三維表達法能夠完全而又清晰地表示有關(guān)物體形狀的信息,其方法之一即為廣義柱體。廣義柱體的概念十分重要,而其表示方法又十分簡單,如圖9.4所示。圖中,柱體的橫截面沿軸線的投影不變。一個普通圓柱可看做是一個圓周沿其中心垂線移動而成;一個楔形物是一個三角形沿其中垂線移動而得的,等等。一般地說,一個廣義柱體是二

9、維輪廓圖沿其軸線移動而成的。在移動過程中,輪廓與軸線之間保持固定的角度不變。輪廓可為任何形狀,而且在移動過程中其尺寸可能是變化的,其軸線也不一定是垂線或直線,如圖9.5所示。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 復(fù)雜物體往往是由一些廣義柱體連接而成的。一般地,一個中央主柱體被一些凹槽或凸面所修正。這樣,復(fù)雜物體就可以由一些基本圖形構(gòu)成。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.1.2 邊緣距離的計算1.圖像輝亮邊緣的平均與差分圖像輝亮邊緣的平均與差分 圖9.6表示出兩平面間邊緣處的亮度變化圖。其中,圖9.6(a)為理想邊緣亮度變化;這時,亮度在邊緣處由一值躍變?yōu)榱硪恢?。圖9.6(b)則表示實

10、際邊緣亮度變化;這時亮度的變化比較模糊,不存在明顯的階躍變化,因而也就很難確定邊緣的位置。這種情況是與圖像輸入裝置不可能產(chǎn)生足夠清晰的圖像有關(guān)的。因為在獲得圖像時,會遇到傳感器的亮度靈敏性波動、圖像坐標信息誤差、電子噪聲、光源擾動以及無力接收大范圍變化的亮度信息等。另一個原因是圖像本身很復(fù)雜,其實際邊緣并不是陡峭的,而是逐步過渡的;還可能存在相互照明效應(yīng)、意外劃痕和灰塵等。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 一種處理噪聲邊緣的方法包括下列4個步驟:(1)從圖像建立平均亮度陣列。取局部亮度的平均值能夠減少噪聲的影響。下述公式說明需要進行的計算。為簡化起見,所列公式是用于二維計算的一維形式:

11、式中,Ii為i點的圖像亮度,而Ai為i點的平均亮度。(2)從平均亮度陣列產(chǎn)生平均一階差分陣列。取右鄰差分(Ai+1 -Ai)與左鄰差分(Ai-Ai-1)的平聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 均值,這相當(dāng)于把i的左鄰和右鄰相平均。令Fi為平均亮度Ai的一次平均差分,則有: 上式與一次微分的有限差分近似。(3)從一次平均差分陣列建立二次平均差分陣列。 為此,求一次差分的平均值。令Si為平均亮度的平均二次差分,則(4)據(jù)所得陣列,記下峰點、陡變斜率和過零點,以尋求邊緣信號的集合。 平均過程是把理想的臺階曲線和被噪聲模糊的臺階曲線都變換為平滑的臺階曲線;一次差分過程把平滑了的臺階曲線變換為凸緣形

12、曲線;二次差分過程又把凸緣形曲線變換為S形曲線,如正弦曲線一樣變化。圖9.7(b)至(d)表示出上述邊緣處理過程,而圖9.7(a)則表示理想的邊緣亮度分布。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 平均和差分作用能夠被綜合到一個綜合平均過程中去,并通過點擴散函數(shù)由輸入點特性來確定輸出點特性。點擴散函數(shù)表示單個孤立點亮度不為。的點在圖像中如何擴散其影響。當(dāng)按輸入來確定輸出特性時,稱輸出被點擴散函數(shù)所濾波。 在實際圖像中所用到的點擴散函數(shù)必須表示比較多的點的組合,而且點擴散函數(shù)必須是二維的。這些計算論證的概要是:聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化(1)必須用衰減高頻點擴散函數(shù)對噪聲進行濾波處理。

13、選用二維高斯函數(shù)要比平均函數(shù)好得多。(2)應(yīng)當(dāng)用二次差分來對邊緣進行定位。高斯濾波器對噪聲的抑制作用能夠抵消差分過程對噪聲增強的影響。(3)用二維高斯濾波后,進行的二次二維差分相當(dāng)于以形狀像墨西哥草帽或?qū)掃叢菝钡膯蝹€點擴散函數(shù)來濾波。墨西哥草帽形狀是一維情況下尖峰和穿越(peak-and-through)形狀在二維情況下的相似物。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化(4)一個窄的正高斯點擴散函數(shù)加上一個寬的負高斯點擴散函數(shù),能夠足夠精確地表示出先高斯濾波后差分所對應(yīng)的二維墨西哥草帽狀的點擴散函數(shù),如圖9.8所示。(5)用二維高斯點擴散函數(shù)來濾波相當(dāng)于連續(xù)以兩個一維高斯點擴散函數(shù)(一個為垂直方

14、向,另一為水平方向)來濾波。這意味著,高斯濾波是快速的。因此,墨西哥草帽形濾波也可以是快速的。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化2.靈長目動物視網(wǎng)膜特性靈長目動物視網(wǎng)膜特性 墨西哥草帽形濾波器與一些了解靈長目動物早期視覺的實驗相一致。關(guān)鍵實驗如圖9.9所示。被試動物注視各種從白色背景前移過的色質(zhì)(stimuli)。這些色質(zhì)包括一條窄的黑帶、一條寬的黑帶以及一個單白一黑邊緣。記錄探針測定各種神經(jīng)反應(yīng)。把此神經(jīng)反應(yīng)與據(jù)墨西哥形草帽濾波器作出的預(yù)計進行比較。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 圖9.10給出比較結(jié)果。在圖9.10中,(a)表示3個自左向右移動的色質(zhì)的亮度分布曲線;(b)表示以

15、適當(dāng)寬度的墨西哥草帽形濾波器對所給出的亮度分布進行濾波的結(jié)果;(c)為所謂X神經(jīng)節(jié)細胞上記錄的實驗數(shù)據(jù)。比較圖9.10(b)和(c)可見,兩者極其相似。這表明靈長目動物的視網(wǎng)膜確實進行了某些與墨西哥草帽形濾波器十分相似的處理工作。如果對墨西哥草帽形濾波器稍加修改,就能夠改善相似性,如圖9.10(d)所示。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 比較結(jié)果得到的高度相似性,使我們有足夠的根據(jù)作出下列假設(shè):(1)靈長目動物視網(wǎng)膜所進行的濾波處理功能在運算上與由墨西哥草帽形點擴散函數(shù)所進行的濾波相似。(2)存在有兩種視網(wǎng)膜細胞,一種用于傳輸濾波圖像的正向部分,另一種傳遞濾波匾像的負向部分。(3)對于每

16、種細胞,墨西哥草帽形濾波器是通過激發(fā)與禁止這兩種操作的組合來實現(xiàn)的。這個濾波器等價于兩個以二維高斯濾波器濾波所得圖像的差。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化3.物體距離的確定物體距離的確定 立體視覺由兩眼得到的信息來確定距離。由于兩眼間的距離是已知的,因而一旦在兩眼所得圖像中找到了物體的位置,就容易求得觀察者到此物體的距離。 圖9.11表示兩眼立體視覺中的相對位置關(guān)系。圖中,P點為一物體。兩個透鏡的軸線是平行的。f為兩透鏡與圖像平面的距離,即為其焦距。b為兩透鏡軸線在基線上的距離,即為兩眼的距離。l和r分別為P點與左、右透鏡軸的距離。和分別為左右圖像與其相應(yīng)透鏡軸線的距離。 從兩相似三角形

17、,我們可以得下列關(guān)系式:聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 已知b=L+r,代入上式,可求得觀察者雙眼至物體的距離: 由于雙眼距離b為已知,焦距f也是確定的,因此,一個物體與雙眼的距離和(+)反比。 (+)為該點的一幅圖像點位置相對于另一幅圖像點位置的位移,稱為視(disparity)。 立體視覺的實際問題就是根據(jù)左右兩圖像找到相應(yīng)的物體,以便能夠測量視差。有許多不同的立體視覺系統(tǒng)能在不同程度上成功地尋找出相應(yīng)的物體。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.1.3表面方向的計算 研究由圖像明暗度(shading)來計算物體表面方向信息的過程,其目的在于更多翅解為產(chǎn)生二維半簡圖信息所需要的

18、計算。1.反射圖體現(xiàn)光照約束反射圖體現(xiàn)光照約束 從物體表面反射的光量取決于表面材料以及光源、觀察者與表面法線之間的相對角度。這些角度如圖9.12所示。其中, i為表面法線與光源方向之間的入射角;e為表雇線和觀察者之間的出射角;g為觀察者方向與光源方向間的相位角。 把從所有可能位置觀察到的亮度都相同的表面定義為朗伯表面(Lamber surface),它的亮度只由光源的方向決定。這一關(guān)系遵循下列公式: Ecosi (9.5) 式中,E為被觀察亮度; 為表面反射率(對于特定的表面材料, 為一常數(shù));i為入射角。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 為了認識朗

19、伯表面如何反射光,我們進行如下實驗:用朗伯顏料涂敷一個球面,并讓它在一點光源附近移動。對于每一光源位置,觀察并記下亮度與表面法線的關(guān)系,畫出其等亮度線。圖9.13給出三個不同光源方向情況下的等亮度線。其中,對于圖9.13(a),光線正好從觀察者背后照射,其等亮度線為一些同心圓。最亮點的亮度為, 此點的法線正好指向觀察者。這時,cos i=1。離開球面的邊界方向,亮度逐漸變暗,在邊界處的亮度變?yōu)?,因為這時cosi=0。對于圖9.13(b),光源方向與觀察者方向間的夾角為450,這時,最亮點的亮度仍為,但它已不是表面法線正對觀察者的點,而是表面法線指向光源的點。亮度為0的線是球面上的圓周,但不是

20、球面的二維圖像中的圓周。有時,稱亮度為0的線為陰影線(shadow line),或明暗界線(terminator)。對于圖9.13(c),光線是從右面照射的,而且觀察者方向與光源方向呈直角交角。這時,最亮點是在球面邊緣上,而陰影線則為直線。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 雖然圖9.13可用來說明表面方向與亮度的關(guān)系,不過它是在空間曲面上的表示方法,因而不便于實際使用。實際中使用的方法是把等亮度線投影到平面上去。投影后的等亮度線構(gòu)成反射圖(reflectance map)。 有多種繪制反射圖的方法,其中之一是把等亮度線投影到梯度空間平面。梯度空間平面

21、是一個和視線垂直的切面。投影的方法是把表面各點的法線向外延長,直至與梯度空間平面相交為止。另一種有用的投影方法也是把球面上的點投影到球面的切面上去(切面的坐標軸為F和G),其投影方法是:從球面上與觀察者相對的點出發(fā),與要投影的點連成直線,再與切面相交。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化2.表面方向的確定表面方向的確定 上面研究了利用表面方向預(yù)測表面的亮度。下面研究相反的問題,即從感測到的亮度來計算表面各方向參數(shù)f和g。 由f和g來確定表面方向,初看起來似乎是不可能的。因為一小塊表面只能確定切面FG上的一條曲線,而不是單一的點。但是,事實上這樣做卻是可能的,因為大部分表面是平滑的,在不同深度

22、和方向上只出現(xiàn)有少數(shù)不連續(xù)的情況。因此,可以利用下面兩個約束:(1)亮度。由f和g所確定的表面方向應(yīng)與表面亮度所要求的表面方向無多大不同。(2)表面平滑度。一點的表面方向應(yīng)與鄰近各點的表面方向無多大變化。 對于每個點,計算的f和g值應(yīng)兼顧上述兩個約束計算所得的值。圖9.14中,根據(jù)亮度,要求特定點的f和g值應(yīng)落在等亮度線上,而據(jù)表面平滑度則要求f和g值接近相鄰點f和g的平均值。 從直觀上看,在平均點與等亮度線之間選擇某個點是有道理的。不過,仍然存在兩個間題,即這個所選擇的點在哪里,以及如何知道相鄰點的平均值。下面是這兩個問題的解答。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化(1)折中通過平均點并垂

23、直于等亮度線的直線上的某個點,作為所選擇的點。(2)首先假設(shè)所有未知的f和g均為零值,然后用在初始值的平均點與等亮度線之間求得的折中方法,為每一點計算新的f和g值,再重復(fù)利用更新了的值計算f和g值,直至其值變化足夠小為止。 為檢查上述計算過程是否可行,需要一些耗時的和可選擇的計算。先研究兩種誤差平滑性偏差e1和預(yù)計亮度偏差e2的測量。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 總誤差為e=e1+e2,其中為一常數(shù),用于調(diào)整兩偏差以保持一定的平衡。要求得使總偏差為最小的fi,j和gi,j,我們對fi,j和gi,j分別取微分,并令其微分值等于0。這樣可得下式: 根

24、據(jù)下列第(n+1)個迭代項(fi,jn+1,gi,jn+1)與第n個迭代項(fi,jn,gi,jn)的相關(guān)規(guī)則,能夠求得這些方程式的解答如下:式中, fi,j0=0,gi,j0=0聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 這些規(guī)則稱為松弛公式。應(yīng)用這些公式相當(dāng)于從原來的估計值出發(fā),沿著垂直于等亮度線方向,朝等亮度線移動一步,以改善對f和g的估計。每步移動大小正比于所觀察到的亮度與據(jù)當(dāng)前f和9預(yù)測到的亮度之差,也與誤差平衡參數(shù)成正比。 應(yīng)用松弛公式的過程,通常稱為松弛過程。 綜上所述,可得計算表面方向的松弛算法如下:(1)對所有非邊界點,令f=0和g=0。對所有邊界點,令f和g規(guī)定一個長度為2的垂

25、直于邊界的矢量。稱輸入陣列為當(dāng)前陣列。(2)進行下列步驟(直到所有的值變化得足夠慢為止): (a)對當(dāng)前陣列中的每個點: i)如果是邊界點,則不做任何事; ii)如果是非邊界點,那么用松弛公式計算新的f和g值。 (b)把所得新陣列稱為當(dāng)前陣列。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.2積木世界的景物分析 景物分析是研究視覺的重要問題??梢姷木拔镉蓚鞲衅骶幋a,并被表示為一個灰度數(shù)值矩陣,再由檢測器處理。檢測器搜索圖像的主要成分,如線段、簡單曲線和角度等。對這些成分進行處理,以便利用知識來推斷有關(guān)景物的三維特征信息。其最終目標在于利用模型來表示該景物。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.2

26、.1積木世界景物的線條標示方法 積木世界視覺研究的主要目標是理解從一堆玩具積木的圖像得到對于景物的描述。所謂描述就是把出現(xiàn)在圖像中的大量的線條聚集成代表景物中各個積木的線條組。研究積木世界景物時,輸入的圖像可以是積木景物的照片、電視攝影圖像或是線條圖。如果是屬于前兩種,那么第一步就是從圖像得到線條圖。這屬于馬氏初始簡圖的范圍,但沒有那樣復(fù)雜,只是用了邊緣檢測算子。在以下的討論中,我們都假設(shè)已經(jīng)得到了積木世界的線條圖的情況。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 積木世界景物分析的研究對象比較狹窄,并且是有意地進行了簡化,但仍不失為合適的計算機視覺研究的初步目標。在這個領(lǐng)域中的研究已經(jīng)取得了一些

27、有實用意義的成果。積木世界可以推廣為類似工業(yè)零件的多面體,而理解簡單的三維工程圖是建立有視覺的工業(yè)機器人裝配系統(tǒng)的第一步。 對積木世界研究的最早成果是羅伯茨(Roberts)在1965年發(fā)表的論文。羅伯茨希望以圖9.15中所示的多面體基元來解釋圖9.16(a)中的線條圖。景物中的一個簡單的物體可以看成是基元經(jīng)、過變換以后得到的一個實例。變換可以包括沿三個軸的比例變化、轉(zhuǎn)化和旋轉(zhuǎn)。組合的多面體可以看成是由若干個簡單的多面體貓合而成。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 要理解景物的局部,首先要確定圖像中有哪些基元,基元要經(jīng)過什么變換才能出現(xiàn)在景物中現(xiàn)在的位置上。識別基元是通過把線條圖和模型基元

28、的拓撲特性(面、線、頂點的結(jié)構(gòu))進行匹配來實現(xiàn)的。先是試驗性的匹配,然后由一個量度過程來確定這個轉(zhuǎn)換是否是允許的。當(dāng)在景物中識別出轉(zhuǎn)換的基元時,這個基元就被想象成已被切開并被移走了,新的可看見的線條就填進來,又開始對新的景物進行分析。羅伯茨的算法雖然不是很可靠,但這是一項開拓性的工作,標志著積木世界景物分析研究工作的開始。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 古茲門(Guzmen)在1969年提出的程序可以對一幅相當(dāng)復(fù)雜的線條圖(圖9.16 (b)進行分析。線條把圖分成若干個多面體區(qū)域。程序的目標是把這些區(qū)域聚集成組,每一組相應(yīng)于一個多面體“塊”。任何無

29、多義性的、合理的解釋都是可以接受的?;镜母拍钊匀皇菑木拔锓e累局部證據(jù);然后,根據(jù)這些證據(jù)聚集成多面體。古茲門的算法以連接兩個屬于同一物體的兩個區(qū)域的鏈作為證據(jù)。鏈圍繞頂點排列。頂點可分成圖9.17所示的類型。物體和背景之間不考慮鏈。使用相當(dāng)復(fù)雜的規(guī)則,根據(jù)區(qū)域和鏈,利用聚類方法對景物進行解釋。鏈還包括不允許某9個相鄰區(qū)域?qū)儆谕晃矬w的禁止鏈。古茲門的算法對一般的景物可以工作得良好,但由于存在過多的特殊情況和例外,容易引起混亂??傊?在相當(dāng)廣的應(yīng)用范圍里這種算法雖然不十分精巧,但還是可以勝任的。 聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 赫夫曼(Huffmen)與克洛斯(Clows)獨立地研究了

30、與古茲門相似的景物。他們希望對景物的解釋不只是分析哪些區(qū)是由單個物體產(chǎn)生的,而且希望分析線條。圖9.18所示為一個懸在空中的L形實心體。標有“”標志的是凸面邊緣,標有“”標志的是凹面邊緣。箭頭標志“”表示物體遮住了后面的表面。當(dāng)沿著箭頭方向看時,引起遮擋的實體是在右面,被遮住的表面是在左面。如果立方體懸在空中,那么最下面的線可標為“”而不是“”(赫夫曼并沒有考慮陰影線,也沒有考慮斷裂線)。按這樣的方法,分析的目標就變成對線條圖中的每一條線確定它是由景物中的什么類型邊緣產(chǎn)生的。換句話說,現(xiàn)在所研究的任務(wù)是標示線條。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 雖然每條線單從其本身來考慮有三種可能性:凸

31、面邊緣、凹面邊緣以及遮擋邊緣,但對一個由線條相交形成的接點來說,并不是所有這些可能性組合都可以解釋為實際可能實現(xiàn)的邊緣連接。例如,對三面相交的頂點來說,在64種線條組合中只有圖9.28所示的18種(T形接點包括在內(nèi))是可實現(xiàn)的。這樣,就可能對每種接點類型規(guī)定可允許的接點。把這些允許的接點收集在一起就可形成“接點字典”。然后,可利用接點字典來限制線條組合的可能性。另外,因為線條在其兩端都代表同一種邊緣,所以不難看到,從原理上來說算法可以利用這種一致性的約束來刪除不可能的標示。 華爾茲(Waltz)發(fā)展和完善了古茲門和克洛斯的算法。華爾茲的算法對光照以及陰影條件幾乎不作限制??梢苑治鋈鐖D9.16(

32、c)所示線條圖。此圖中包含有陰影線和斷裂線。華爾茲的算法可把圖中的每一條線都解釋為”種可能的邊緣中的一種。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 在分析線條圖時(如圖9.16 (c),一個主要問題是確定哪些是分割物體的邊界線。從圖9.16(c)可以看到邊界線、凸面線、凹面線、陰影線和斷裂線只能以很少幾種方式組合在接點上,而這種對接點組合的限制,稱為符號約束或約束,又決定了對線條圖中每一條線的合理的物理解釋。一旦知道了對線條的正確解釋就不難利用已知的邊界線把線條圖分成各個物體。華爾茲方法的基本過程是約束傳播。約束傳播過程通過局部計算達到全局的一致性。它也是一種推理過程。 以下介紹華爾茲的線條標示

33、方法,并且主要研究只具有三面頂點的物體。先從比較簡單的無陰影和無斷裂線的情況開始,然后,擴展到有陰影和有斷裂線的情況。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.2.2無斷裂和陰影時三面頂點的標示方法1.線條和接點的分類線條和接點的分類 下面先研究無斷裂的三面頂點,并且設(shè)想合適的光照條件,避免了所有的陰影。在這樣的環(huán)境下,圖中的所有線條代表了各種天然產(chǎn)生的邊緣。這些線條的簡單分類如下: 邊界線 所有線條 凸面線 內(nèi)邊線 凹面線 首先把線條分成邊界線和內(nèi)邊線。邊界線分割屬于不同物體的區(qū)域,而內(nèi)邊線分割屬于同一物體的區(qū)域。內(nèi)邊線或者與凸面邊緣有關(guān),或者與凹面邊緣有關(guān)。聯(lián)為聯(lián)為- -稻草人自動化稻草人

34、自動化 為便于以符號表示,線條的解釋可以在圖上以線條標示來辨認。因為經(jīng)常用到這些標示,所以最好能熟記腦中。 凸面線帶有加標志“”; 凹面線帶有減標志“一”; 邊界線帶有箭頭標志“”。 圍繞接點的線條標示的組合稱為接點標示。將可看到天然的約束限制了在實際上可以實現(xiàn)的接點標示的數(shù)目。標在邊界線上的箭頭標示的方向決定于邊界線的哪一邊相應(yīng)于造成這條邊界線的物體的面。設(shè)想沿邊界線行進,并保持產(chǎn)生此邊界線的物體在你的右面。這樣,行進的方向就是箭頭的方向。 很容易以一種反映我們對圖9.18上所畫的L形實心體的直覺的方法來標志圖上的每一根線。通過標志這張圖說明,為了解釋這些線條,我們應(yīng)用了對實際情況的理解?,F(xiàn)

35、在所要探求的關(guān)鍵概念是改變原來過程,轉(zhuǎn)而利用線條解釋的知識以達到對實際的可實現(xiàn)性的理解。為了要這樣做,必須理解現(xiàn)實世界所強加的固有的約束。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 現(xiàn)實世界中的頂點造成線條圖中的接點??梢愿鶕?jù)相交的線條數(shù)目和線條之間角度的大小對這些接點進行分類。在圖9.19中對每種接點分配了一個助記名。在下述簡單假設(shè)下,可以把接點種類歸納成叉(fork)、箭(arrow) , L和T形等幾種:(1)有限的線條解釋,即假設(shè)沒有陰影或斷裂。如果頂點是三面頂點并且無陰影和斷裂 線,就只包括叉、箭,L和T4種。(2)三個面組成的頂點,即所有的頂點都正好是由物體的三個面相交而成。(3)通用

36、的位置。觀察點應(yīng)選擇好,使其不因眼睛的微小移動而造成接點的變化。 我們只暫時實行上述假設(shè),以后將會撤銷這些假設(shè)。這些假設(shè)的用途是減少可能的接點的數(shù)目,從而減少可能的對接點周圍線條的解釋。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 三面頂點的假設(shè)意味著空間所有的頂點都嚴格地是三個面相交,如同立方體的頂點那樣。圖9.20中的每個物體都僅僅涉及到三面頂點。請注意,在圖上只出現(xiàn)三種接點:叉形、箭形和L形。因為一個物體可以在另一個物體的前面,所以T形接點也可能出現(xiàn)。但因為僅限于研究三面頂點,所以先避免山峰、Psi,K和X形等頂點。 因為可有4種方式標志任何給定的線條,所以就必然有4“一16種方式標志一個L形

37、接點。類似地,必然有43 =64種方式標志任何特定的叉、箭和T形接點,這就決定了可能出現(xiàn)在一個線條圖中的接點標志數(shù)目的上界是208種,但事實上只有其中的18種是可能出現(xiàn)的。例如在我們所作的假設(shè)之下,在現(xiàn)實的多面體的線條圖中要找到圖9.21中所示的接點標志是不可能的。 聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 下一項工作是把可能出現(xiàn)的接點標示收集在一起,L、叉、T和箭形接點的可能接點標志數(shù)分別為6,5,4和3。知道了這些可能的接點標示,分析線條圖就像是玩拼板游戲。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化2.標志三面接點的方法標志三面接點的方法 為了對圍繞接點的線條的標示方式進行分類,我們需要從每個可

38、能的方向來觀察每種實際可能的三面頂點。這樣做會遇到可供選擇的方向過多的困難,為此把除了一般的觀察位置以外的方向都排除在外,以減少可能出現(xiàn)的情況。假設(shè)在這一節(jié)的其余部分僅討論只包含三面頂點的線條圖。任何三面頂點的三個面規(guī)定了三個相交的平面,這三個相交的平面把空間分成8個間隔,如圖9. 22所示。很明顯,某個形成一個頂角的物體就占有上述8個間隔(或八分體)中的一個或幾個。接點標志所說明的是物體如何占有八分體??梢酝ㄟ^以下兩個步驟來構(gòu)成完整的包含所有連接可能性的字典:先考慮所有的以物體來充滿這8個八分體的方式;然后,從未被充滿的八分體觀察所得到的頂點。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 當(dāng)然,如

39、果沒有一個八分體被充滿,或者所有的八分體都被充滿了,那么說明不存在頂點,從而沒什么要進一步考慮的。但如果8個八分體中的7個被充滿了,如圖9.23(a)所示,顯然,7個八分體的情況確認了一個叉形接點標志。在此接點標志中,有關(guān)的三根線條中的每一根都標有負號。這里要說明的是,在此線條圖中我們惟一感興趣的接點是在中心的接點。圖中周圍的線條只是為了在視覺上幫助理解這7個被充滿的八分體如何形成一個接點。再則,因為有7個八分體被充滿,所以只余下一個八分體,從這個八分體來觀察這個頂點,不論在八分體內(nèi)的什么位置,所看到的這個接點的類型都是叉形。幸運的是,在八分體內(nèi)所觀察的接點類型不變這個性質(zhì)是普遍的。當(dāng)觀察的位

40、置在八分體內(nèi)移動時,雖然線條之間的角度有顯著的變化,但接點的類型并不變。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 至今,在可能的接點標志的字典中只有一項:叉形。如只有一個八分體被充滿,就可得到一個新項。圖9.23(b)中所示為這個新項。與上一種情況相似,只研究中心的接點,其周圍的線條只是為了幫助理解這個被充滿的八分體在空間的位置。因為僅有一個八分體被充滿,所以可以從其余7個八分體來觀察這個頂點。而至今只有1個從與這個八分體對角相對的八分體觀察所得到的接點標志。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 下面來研究從其余6個八分體觀察的情況。圖9.24中所畫的小人占了其中的3個位置。如圖9.25所示,

41、對于剩下的3個八分體中的兩個,把小人放入窗框中,并升高到這個立方體頂部所規(guī)定的平面以上。最后一個觀察點由頂部的小人所規(guī)定。所有6個小人觀察點只產(chǎn)生兩種新的接點標志,因為其中三個產(chǎn)生一種箭形標志,另外三種產(chǎn)生一種L形。實際上,從所研究的情況是對稱的就可以料想到這一點。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 現(xiàn)在來研究有2個、4個或6個八分體被充滿的情況。所有這些都僅限在當(dāng)初的三面頂點的假設(shè)之下。例如,設(shè)有2個八分體被充滿。如果這2個八分體是相鄰的,那么,這2個八分體之間的邊緣就是斷裂線,這樣在中心頂點就有4個物體面,所以這個頂點就不再是3面的。如這2個八分體不相鄰,那么這2個八分體或者將在一條邊

42、緣相交,或在一個公共點。無論上述哪一種方式,都會使中心頂點的面多于3個。相類似的論證可以把4個和6個八分體的情況也排除在外,只留下3個和5個八分體的情況需要考慮。 在3個八分體的情況下,如圖9.26所示,從其余5個八分體中的每一個來觀察都得到互不相同的接點標志。當(dāng)然,從其中的一個八分體觀察得到的是叉形,從另一個八分體觀察得到的是箭形,從其余的三個八分體觀察得到的是L形。所觀察得到的L形中的每一個都是互不相同的。 圖9.27所示為5個八分體被充滿的情況。共有三種接點標志,其中的任何一種都不同于以前所看到的。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 最后,因為沒

43、有斷裂,所以只有4種方式可用來標志T。所有這些T的標志都是部分遮擋的結(jié)果。這樣使得標志接點的方式的總數(shù)達到18種。所有這些標志方式都收集在圖9.28中,再要指出一點,即有三種標志的方式是旋轉(zhuǎn)對稱的。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 以上列舉了所有可能的組成三面頂點的方式,并且從所有可能的方向來觀察每個這樣的頂點。這18種接點標志就是所有可能的這些接點被標志的方式,任何不在所列的表中的標志,都找不到實際的三面頂點與之相對應(yīng)。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.2.3有斷裂和陰影時線條圖的分析 到目前為止,我們都是在物體懸掛在背景前面的假設(shè)下分析線條圖的。如果一個立方體是放在桌子上,那

44、么這個立方體的底線就表示凹面邊緣,而不是邊界。然而這樣的解釋不是惟一的,因為一個立方體也可能如圖9.29所示,是貼在墻上的。如果沒有附加的線條或假定,幾種解釋同樣都可以接受。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 如果引入陰影就可以解決這種不確定性。在圖9.30中間的那個方塊肯定是放在一個水平面上的,而左面和右面的方塊雖然不熟悉,但看起來是垂直地貼著的。顯然,擴展標志種類使其包括陰影標志加進了新的約束,并簡化分析。 注意:注意:圖9.30引入的陰影標志,如同邊界標志那樣,代表一個方向。陰影標志是一個指向陰影區(qū)域的小箭頭。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 這樣,在標志字典中,已有6種標志,

45、其中邊界和陰影各有兩種,凸面和凹面邊緣各有一種。用這組擴展了的標志來進行標示是簡單的但卻是乏味的工作。從已完成的例子說明,改善線條描述可使約束的數(shù)目增加,從而提高分析的速度。下面進一步研究是否有其他方法對線條的解釋作進一步的分類。在介紹具體方法以前,有一個問題需要注意,即隨著線標志集合的擴展,實際接點標志的集合將顯著增加。將會有幾千種合法的接點標志,而不是只有18種。因此不可能建立一個合法接點標志表以試圖讓模擬計算機利用這個表格來做些什么。我們不這樣做,而是問:合法的標志數(shù)目相對于不合法的標志數(shù)如何增加。然后研究實驗結(jié)果,以幫助回答關(guān)于擴展標志會帶來什么改進和為什么能夠得到這些改進的問題。下面

46、介紹兩種對線條解釋作進一步分類的方法。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化(1)對凹面標志進一步分類并引入斷裂線標志對凹面標志進一步分類并引入斷裂線標志 考慮到物體經(jīng)常放在一起,所以,凹面標志可以分成三類,這三類表示有關(guān)物體的數(shù)目并可確定哪個物體是在前面的。設(shè)一條凹面邊緣表示兩個物體接觸在一起的地方。然后想象把這兩個物體稍為拉開一點。這樣,這個凹面邊緣就成為邊界,其上標志指向兩個可能方向中的一個,如圖9.31(a)和9.31(b)所示。這兩種可能性以一個由原來的負號標志和一個新的箭頭標志組成的合成標志來表示。如果有三個物體相接觸,同樣可以利用一個合成標志表示如果物體稍微離開一些時可以看到什么

47、,如圖9.31(c)所示。 斷裂線也可以類似地處理:每一根斷裂線被標以一個c和一個箭頭,表示這兩個有關(guān)的物體如何配合在一起。連同斷裂線一起,我們有如圖9.32所示的圖表?,F(xiàn)在一共有11種標志線條的方法。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化(2)用光照條件增加標志數(shù)量和嚴格約束用光照條件增加標志數(shù)量和嚴格約束 另一種改善線條描述的方法是結(jié)合單光源的光照條件。假設(shè)物體任何一個面的照明狀態(tài)必定屬于如圖9.33所示的三種類型中的一種:一個面可能是被直接照明,或被另一個面所遮光,或因為背離光源而處于陰影區(qū)。這三種可能性可用符號來表示:工表示直接照明;S表示被另一物

48、體所遮光;SS表示因背離光源而處于陰影,也稱為自遮光。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 線條標志除了表示關(guān)于邊緣類型的基本信息以外,還可以表示關(guān)于照明狀態(tài)的知識。如果照明狀態(tài)和線條解釋可以自由組合,那么對上述11種線條解釋中的每一種都可以有32=9種照明組合,這樣可以造成總共99種可能性,但其中只有50種是可能實現(xiàn)的。例如,不存在下述這種組合,在這種組合下,陰影線的兩邊的面都是被照明的。類似地,任何類型的凹面邊緣的兩個邊的照明狀態(tài)不可能是不同的。因為這樣將要求不可實現(xiàn)的重合情況,即要求.陰影線恰好投影在凹面邊緣上。 概括起來,線條解釋的每一次改進都促使一次線條標志的大擴展。開始時只考慮基

49、本的線條、邊界線、內(nèi)部的凹面線和凸面線。這些初始的線條種類擴展到包括陰影線。凹面線又分成4類以反映接觸在一起的物體個數(shù)以及這些物體間相互遮擋的情況。這引入了斷裂線并以和凹面線相類似的方式分成兩類。最后,線條的信息和照明信息相結(jié)合。從最后這次擴展產(chǎn)生50種線條標志。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 上述這些線條標志的變化擴大了實際的接點集。原來接點種類有叉形、箭形,L形和T形。因解除了三面頂點和一般的位置約束從而新增加有山峰Psi, K, X, Muti和Kk等形接點。下面討論從增加這些接點類型得到了什么,以及從尋找和使用這些新接點標志可以得到什么結(jié)果的問題。 首先來研究可能的實際接點集和

50、無約束集的比較。 表9. 1所列為初始線條標志的情況。頂點類型可能組合成的接點數(shù)可實現(xiàn)的接點數(shù)比例 (%)L叉T箭16646464654337.57.86.24.7聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 上述比例數(shù)表示了嚴格的但并不過分的約束。但當(dāng)線條種類擴大時,所有的數(shù)量都變大,約束成為不可能了。在擴大了的集合(稱為華爾茲集)中的接點標志數(shù),從絕對數(shù)來說是大的,但與可能出現(xiàn)的接點數(shù)相比卻是小的。見表9.2. 在某些情況下,接點標志中合法的部分只有將近總數(shù)的110-5%??梢钥隙ǖ氖?雖然線條標志的總數(shù)太多,以致由人工是無法利用這些標志的,但是約束也是如此激烈,所以,對子復(fù)雜的線條圖來說,計算

51、機利用大的線條標志集,仍然可以更快和更少不確定性地收斂到解。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化頂點類型可能組合成的接點數(shù)可實現(xiàn)的接點數(shù)比例 (%)L叉T箭PsiKXMuti山峰Kk2.5X1031.2X1051.2X1051.2X1056.2X1066.2X1066.2X1066.2X1066.2X1063.1X10880500500703001001001001030324.0X10-14.0X10-15.6X10-24.8X10-31.6X10-31.6X10-31.6X10-31.6X10-39.6X10-6表表9.2聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.3視覺的知識表示與控制策

52、略 為研究更高級的思維過程如何影響和利用視覺,必定會遇到非視覺范圍的問題以及具有更廣泛的適用范圍的推理能力的問題。關(guān)于某一范圍內(nèi)的事物模型,可以支持在視覺領(lǐng)域中與應(yīng)用對象有關(guān)的對物體的計算,但這樣的模型相當(dāng)復(fù)雜。在人工智能其他領(lǐng)域中發(fā)展起來的知識表達方法,可以描述這樣的模型。類似地,在人工智能領(lǐng)域里還對推理和規(guī)劃作了大量的研究。相關(guān)的技術(shù)不但可用于其他目的的推理,也可以用于視覺領(lǐng)域中來處理概念和實現(xiàn)預(yù)定的目標。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.3.1視覺信息的語義網(wǎng)絡(luò)表示 在視覺領(lǐng)域里,知識表達方法可能是模擬的,也可能是命題邏輯的。模擬的知識表達方法可以表示物體的重要物理和幾何特性。命

53、題邏輯表達方法是一些說明有關(guān)的事物(或有關(guān)事物的模型)是真或是假的陳述。例如用景物中物體的各種物理特性,如表面方向、速度、遮擋輪廓線來表示圖像,是模擬的表達方法。用如實心體的三維模型表示景物也是模擬的表達方法。用這種模型可以計算實心體的幾何特性,甚至也能計算某些設(shè)計者未表示出來的特性。一組謂詞計算的子句是命題邏輯的。這兩種表達形式用于不同的目的,一種并不比另一種更高級。通常可以把一種表達形式轉(zhuǎn)換成另一種表達形式而不損失信息。這種區(qū)分方法是以關(guān)于人類如何表示世界的理論為基礎(chǔ)的。心理學(xué)實驗的數(shù)據(jù)表明,人類同時應(yīng)用這兩種表達方法,而不是只用一種。這里著重介紹語義網(wǎng)絡(luò),這是因為它具有如下特點: 聯(lián)為聯(lián)

54、為- -稻草人自動化稻草人自動化(1)語義網(wǎng)絡(luò)可作為一種很方便地存取模擬知識的表達方法以及命題邏輯的知識表達的數(shù)據(jù)結(jié)構(gòu)。(2)語義網(wǎng)絡(luò)可作為一種反映在有關(guān)領(lǐng)域中事物之間相互關(guān)系的模擬結(jié)構(gòu)。(3)語義網(wǎng)絡(luò)可用作一種具有特殊的推理規(guī)則的命題邏輯表達法。 下面舉例介紹語義網(wǎng)絡(luò)在計算機視覺中的應(yīng)用。例如,試用語義網(wǎng)絡(luò)表示以下景物: “在道路57(road57)與河流3(river3)交叉處的橋梁位于建筑物30(building30 )附近。” 這個景物可以用圖9.34所示語義網(wǎng)絡(luò)來表示。圖中,e為element of之縮寫,ROAD(道路),BLDG(建筑物),BRIDGE(橋梁),RIVER(河流)

55、,NEAR(附近),INT(交叉)是表示類別和概念的節(jié)點。ROAD57, BLDG30, RIVER3等節(jié)點,以及用ISA鏈與概念節(jié)點相聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 連接的未加標志的節(jié)點都是表示實例的節(jié)點。原來是多元關(guān)系的在語義網(wǎng)絡(luò)中都已用一組等效的二元關(guān)系所代替。除此以外,在圖中還有標志為X的節(jié)點,它是一條特定的道路與一座特定的橋梁相交叉的結(jié)果,它并不表示為任何類別概念的實例,這是一個虛節(jié)點。如果引入很復(fù)雜的關(guān)系,可以免除虛節(jié)點。但這將犧牲語義網(wǎng)絡(luò)的重要特性,即可以用一小組基元來構(gòu)造大量復(fù)雜的關(guān)系。虛節(jié)點通過引用局部的復(fù)雜關(guān)系增強了這種能力。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9

56、.3.2位置網(wǎng)絡(luò)表示 位置網(wǎng)絡(luò)是在計算機視覺領(lǐng)域中應(yīng)用語義網(wǎng)絡(luò)的一個有普遍意義的例子。位置網(wǎng)絡(luò)可以把幾何的和模擬的數(shù)據(jù)與一個語義網(wǎng)絡(luò)結(jié)構(gòu)相結(jié)合。這個語義網(wǎng)絡(luò)有時像一個具有專門的求值規(guī)則的框架。位置網(wǎng)絡(luò)不但可以用于航空圖像,也可以用于醫(yī)學(xué)圖像的應(yīng)用場合。 位置網(wǎng)絡(luò)是一組幾何點的網(wǎng)絡(luò)表示。這組幾何點由集合理論以及如集合的交運算、并運算、距離計算等幾何運算聯(lián)系在一起。這些運算相應(yīng)于有關(guān)物體位置的限制,是由思維方面的或是由物理上的因素所決定的。 聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 位置網(wǎng)絡(luò)中的每個內(nèi)部節(jié)點包含幾何運算、運算所需的變量表以及運算結(jié)果。例如,一個節(jié)點可以表示兩個變量點集的并,其運算結(jié)果

57、是一個點集。推理是由對網(wǎng)絡(luò)進行求值來進行的,即對網(wǎng)絡(luò)中所有,的運算求值,以求取頂節(jié)點(根節(jié)點)運算的點集。這樣,網(wǎng)絡(luò)就有了一個通過變量鏈疊加在網(wǎng)絡(luò)上的祖先和后代層次。在這個層次結(jié)構(gòu)的底部是數(shù)據(jù)節(jié)點。數(shù)據(jù)節(jié)點不包含運算和變量,只有幾何數(shù)據(jù)。網(wǎng)絡(luò)中的每個節(jié)點處于以下三個狀態(tài)中的一個:如果附加在節(jié)點上的數(shù)據(jù),在當(dāng)前被認為是準確的,那么,這個節(jié)點是更新的;如果已知數(shù)據(jù)是不完全的、不準確的或有遺漏的,那么這個數(shù)據(jù)是過時的;如果節(jié)點上的內(nèi)容是由求值過程建立的,但未經(jīng)圖像驗證,那么數(shù)據(jù)是假設(shè)的。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 在一般的應(yīng)用場合中,景物中所期望的特征的相對位置都已表示在網(wǎng)絡(luò)中,這樣網(wǎng)絡(luò)

58、就把圖像所期望的結(jié)構(gòu)模型化了。物體之間幾何關(guān)系的基本運算有以下4種:(1)方向性運算方向性運算(左、反射、北、上、下等):以相對于其他點集的位置和方向來規(guī)定點集。(2)區(qū)域運算區(qū)域運算(靠近于、在四邊形內(nèi)、在圓周內(nèi)等):建立一個和其他點集無方向關(guān)系的點集。(3)集合運算集合運算:完成并、交以及求差等集合運算。(4)謂詞運算謂詞運算:對區(qū)域進行的謂詞運算可通過測量某些數(shù)據(jù)的特征來刪除某些點集。例如,把寬度、長度或面積相對某個數(shù)值進行測試的謂詞運算,可以限制在允許范圍內(nèi)集合的大小。 網(wǎng)絡(luò)是由程序從上而下地、以遞歸的方式進行解釋的。解釋過程中把每條規(guī)則的部分結(jié)果儲存在和這條規(guī)則有關(guān)的最高層節(jié)點處(只

59、有少數(shù)例外)。求值從根節(jié)點開始,在絕大多數(shù)網(wǎng)絡(luò)中,這個節(jié)點是運算節(jié)點。對運算節(jié)點的求值,首先要對它所有的變量求值,然后對這些由變量求值產(chǎn)生的結(jié)果進行運算。這樣網(wǎng)絡(luò)中其他要求求值的節(jié)點可以利用這個運算結(jié)果。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化 數(shù)據(jù)節(jié)點可能已經(jīng)包含結(jié)果,這個結(jié)果可能來自變換,或以前應(yīng)用視覺運算的結(jié)果。在求值過程中的某個時刻,求值進行到某個節(jié)點。這個節(jié)點已被求值,并且是更新的或者是假設(shè)的(這樣的節(jié)點包含對這個節(jié)點以下的節(jié)點求值的結(jié)果)。這些節(jié)點的結(jié)果被返回,并且可當(dāng)作數(shù)據(jù)節(jié)點來使用。這時的節(jié)點使得求值機構(gòu)執(zhí)行一個低級過程,以確定特性的位置。如果這個過程在它的能力范圍內(nèi)不能確定物體

60、的狀態(tài),那么節(jié)點仍處于過時的狀態(tài)。任何時候,在處理過時節(jié)點時都不要求先重新計算更新節(jié)點。標有假設(shè)的標志的節(jié)點有一個通常由推理過程支持的、但未經(jīng)低級圖像處理過程驗證的值。假設(shè)的數(shù)據(jù)可用于推理過程:所有基于假設(shè)的數(shù)據(jù)的推理結(jié)果,也都標以假設(shè)的標志。 如果什么時候數(shù)據(jù)節(jié)點上的數(shù)據(jù)改變了(比如,由于一個獨立的過程增加了新的信息),那么所有這個節(jié)點的祖先就要標志為過時的。因此,根節(jié)點也要標為過時的狀態(tài)。但只有那些在過時的節(jié)點的通路上的節(jié)點才必須重新求值,以使網(wǎng)絡(luò)更新。聯(lián)為聯(lián)為- -稻草人自動化稻草人自動化9.3.3視覺系統(tǒng)的控制策略 計算機涉及控制規(guī)模大而復(fù)雜的信息處理任務(wù),有智能的生物系統(tǒng)解決了這個控

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論