版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第十章 機(jī)器視覺(jué)教學(xué)內(nèi)容:本章所研究的機(jī)器視覺(jué)是諸多傳感信息中包含信息最豐富、最復(fù)雜和最重要的感覺(jué)之一,也是應(yīng)用最為廣泛的機(jī)器感覺(jué)之一。內(nèi)容包括圖象的理解與分析、視覺(jué)的知識(shí)表示與控制策略和物體形狀的分析與識(shí)別等。教學(xué)重點(diǎn):物體邊緣距離的計(jì)算、表面方向的計(jì)算、物體形狀識(shí)別方法教學(xué)難點(diǎn):圖匹配法、松弛標(biāo)示法、多層匹配法等教學(xué)方法:用較為通俗的語(yǔ)言將機(jī)器視覺(jué)的相關(guān)知識(shí)講透徹,同時(shí)結(jié)合圖表,對(duì)不同線條的標(biāo)示方法進(jìn)行講解。多結(jié)合日常生活中常有的現(xiàn)象,讓學(xué)生對(duì)所學(xué)知識(shí)有更深入的認(rèn)識(shí)。教學(xué)要求:重點(diǎn)掌握視覺(jué)信息的表達(dá)方法,包括初始簡(jiǎn)圖、二維半簡(jiǎn)圖和三維模型;掌握物體邊緣距離和表面方向的生理學(xué)基礎(chǔ)及計(jì)算原理和
2、計(jì)算方法;了解復(fù)雜形狀物體的表示和三維物體的形狀描述方法;一般了解機(jī)器視覺(jué)應(yīng)用系統(tǒng)的構(gòu)成、視覺(jué)系統(tǒng)的設(shè)計(jì)思想。10.1 圖象的理解與分析教學(xué)內(nèi)容:對(duì)圖象進(jìn)行理解和解釋是計(jì)算機(jī)視覺(jué)的研究中心,也是人工智能研究的焦點(diǎn)之一。教學(xué)重點(diǎn):初始簡(jiǎn)圖、二維半簡(jiǎn)圖和三維模型教學(xué)難點(diǎn):松弛算法、邊緣距離的計(jì)算教學(xué)方法:以課堂書(shū)本知識(shí)為主,采取提問(wèn),討論等方式提高學(xué)生學(xué)習(xí)的積極性,自主性和創(chuàng)造性。教學(xué)要求:重點(diǎn)掌握視覺(jué)信息的表達(dá)方法,包括初始簡(jiǎn)圖、二維半簡(jiǎn)圖和三維模型;掌握物體邊緣距離和表面方向的生理學(xué)基礎(chǔ)及計(jì)算原理和計(jì)算方法10.1.1 視覺(jué)信息的表達(dá)方法根據(jù)馬氏(Marr)提出的假設(shè),視覺(jué)信息處理過(guò)程包括3個(gè)
3、主要表達(dá)層次,即初始簡(jiǎn)圖、二維半簡(jiǎn)圖和三維簡(jiǎn)圖,如圖10.1所示。圖10.1 視覺(jué)信息的表達(dá)層次1、初始簡(jiǎn)圖的基本概念:亮度圖象含有兩種重要信息:圖象的亮度變化和局部幾何特征。初始簡(jiǎn)圖是一種本原表達(dá)法,它能完全而又清楚地表示上述信息。初始簡(jiǎn)圖所包含的信息大部分集中在與實(shí)際邊緣以及邊緣終止點(diǎn)有關(guān)的劇烈灰度變化上。對(duì)于每一邊緣亮度變化,在初始簡(jiǎn)圖上都有對(duì)應(yīng)的描述。這些描述包括:與邊緣有關(guān)的亮度變化率、總的亮度變化、邊緣長(zhǎng)度、曲率和方向等。粗略地說(shuō),初始簡(jiǎn)圖是以勾劃草圖的形式來(lái)表示圖象中的亮度變化的。 圖10.2 用初始簡(jiǎn)圖表示灰度變化 圖10.3 二維半簡(jiǎn)圖舉例2、二維半簡(jiǎn)圖的基本概念:二維半簡(jiǎn)圖
4、包含景物表面的信息,可以把它看做某些內(nèi)在特性的混合信息。二維半簡(jiǎn)圖清楚地表示物體表面方向的信息。物體表面法線從物體內(nèi)部穿出來(lái),使物體好象穿刺。3、三維模型的表示方法三維表達(dá)法能夠完全而又清晰地表示有關(guān)物體形狀的信息,其方法之一即為廣義柱體。廣義柱體的概念十分重要,而其表示方法又十分簡(jiǎn)單,如圖10.4所示。圖中,柱體的橫截面沿軸線的投影不變。一個(gè)普通圓柱可看作是一個(gè)圓周沿其中心垂線移動(dòng)而成;一個(gè)楔形物是一個(gè)三角形沿其中垂線移動(dòng)而得的,等等。一般地說(shuō),一個(gè)廣義柱體是二維輪廓圖沿其軸線移動(dòng)而成的。在移動(dòng)過(guò)程中,輪廓與軸線之間保持固定的角度不變。輪廓可為任何形狀,而且在移動(dòng)過(guò)程中其尺寸可能是變化的,其
5、軸線也不一定是垂線或直線,如圖10.4所示。 圖10.4 廣義錐體 10.5 截面形狀變化或軸線為曲線時(shí)的廣義柱體10.1.2邊緣距離的計(jì)算1、圖象輝亮邊緣的平均與差分產(chǎn)生噪聲邊緣問(wèn)題是因?yàn)樵讷@得圖象時(shí),會(huì)遇到傳感器的亮度靈敏性波動(dòng)、圖象坐標(biāo)信息誤差、電子噪聲、光源擾動(dòng)以及無(wú)力接收大范圍變化的亮度信息等。另一個(gè)原因是圖象本身很復(fù)雜,其實(shí)際邊緣并不是陡削的,而是逐步過(guò)渡的;還可能存在相互照明效應(yīng)、意外劃痕和灰塵等。一種處理噪聲邊緣的方法包括下列四個(gè)步驟:(1)從圖象建立平均亮度陣列。(2)從平均亮度陣列產(chǎn)生平均一階差分陣列。(3)從一次平均差分陣列建立二次平均差分陣列。(4)據(jù)所得陣列,記下峰點(diǎn)
6、、陡變斜率和過(guò)零點(diǎn),以尋求邊緣信號(hào)的集合。2、靈長(zhǎng)目動(dòng)物視網(wǎng)膜特性 圖10.6 靈長(zhǎng)目動(dòng)物視網(wǎng)膜輸入輸出特性實(shí)驗(yàn) 圖10.7 視網(wǎng)膜實(shí)驗(yàn)特性與墨西哥草帽形濾波結(jié)果的比較 墨西哥草帽形濾波器與一些了解靈長(zhǎng)目動(dòng)物早期視覺(jué)的實(shí)驗(yàn)相一致。關(guān)鍵實(shí)驗(yàn)如圖10.6所示。被試動(dòng)物注視各種從白色背景前移過(guò)的色質(zhì)(stimuli)。這些色質(zhì)包括一條窄的黑帶、一條寬的黑帶以及一個(gè)單白黑邊緣。記錄探針測(cè)定各種神經(jīng)反應(yīng)。把此神經(jīng)反應(yīng)與據(jù)墨西哥形草帽濾波器作出的預(yù)計(jì)進(jìn)行比較。圖10.7給出比較結(jié)果。在圖10.7中,(a)表示3個(gè)自左向右移動(dòng)的色質(zhì)的亮度分布曲線;(b) 表示以適當(dāng)寬度的墨西哥草帽形濾波器對(duì)所給出的亮度分布
7、進(jìn)行濾波的結(jié)果;(c)為所謂X神經(jīng)節(jié)細(xì)胞上記錄的實(shí)驗(yàn)數(shù)據(jù)。比較圖10.7(b)和(c)可見(jiàn),兩者極其相似。這表明靈長(zhǎng)目動(dòng)物的視網(wǎng)確實(shí)進(jìn)行了某些與墨西哥草帽形濾波器十分相似的處理工作。如果對(duì)墨西哥草帽形濾波器稍加修改,就能夠改善相似性,如圖10.7(d)所示。比較結(jié)果得到的高度相似性,使我們有足夠的根據(jù)作出下列假設(shè):(1)靈長(zhǎng)目動(dòng)物視膜所進(jìn)行的濾波處理功能在運(yùn)算上是與由墨西哥草帽形點(diǎn)擴(kuò)散函數(shù)所進(jìn)行的濾波相似。(2)存在有兩種視膜細(xì)胞,一種用于傳輸濾波圖象的正向部分,另一種傳遞濾波圖象的負(fù)向部分。(3)對(duì)于每種細(xì)胞,墨西哥草帽形濾波器是通過(guò)激發(fā)與禁止這兩種操作的組合來(lái)實(shí)現(xiàn)的。這個(gè)濾波器等價(jià)于兩個(gè)以
8、二維高斯濾波器濾波所得圖象的差。 3、物體距離的測(cè)定圖10.8表示兩眼立體視覺(jué)中的相對(duì)位置關(guān)系。圖中,P點(diǎn)為一物體。兩個(gè)透鏡的軸線是平行的。f為兩透鏡與圖象平面的距離,即為其焦距。b為兩透鏡軸線在基線上的距離,即為兩眼的距離。l和r分別為P點(diǎn)與左、右透鏡軸的距離。和分別為左右圖象與其相應(yīng)透鏡軸線的距離。從兩相似三角形,可求得觀察者雙眼至物體的距離: 由于雙眼距離b為已知,焦距f也是確定的,因此,一個(gè)物體與雙眼的距離和(+)成反比。(+)為該點(diǎn)的一幅圖象點(diǎn)位置相對(duì)于另一幅圖象點(diǎn)位置的位移,稱(chēng)為視差(disparity)。立體視覺(jué)的實(shí)際問(wèn)題就是據(jù)左右兩圖象找到相應(yīng)的物體,以便能夠測(cè)量視差。已有許多
9、不同的立體視覺(jué)系統(tǒng)能在不同程度上成功地尋找出相應(yīng)的物體。10.1.3 表面方法的計(jì)算1、反射圖體現(xiàn)光照約束把從所有可能位置觀察到的亮度都相同的表面定義為朗伯表面(Lambertian Surface),它的亮度只由光源的方向決定。這一關(guān)系遵循下列公式:E=cosi。式中,E為被觀察亮度;為表面反射率(對(duì)于特定的表面材料,為一常數(shù));i為入射角。2、表面方向的確定上面我們研究了利用表面方向預(yù)測(cè)表面的亮度。下面研究從感測(cè)到的亮度來(lái)計(jì)算表面各方向參數(shù)f和g。由f和g來(lái)確定表面方向,初看起來(lái)似乎是不可能的。因?yàn)橐恍K表面只能確定切面FG上的一條曲線,而不是單一的點(diǎn)。但是,事實(shí)上這樣做卻是可能的,因?yàn)榇?/p>
10、部分表面是平滑的,在不同深度和方向上只出現(xiàn)有少數(shù)不連續(xù)的情況。因此,可以利用下面兩個(gè)約束:(1)亮度。由f和g所確定的表面方向應(yīng)與表面亮度所要求的表面方向無(wú)多大不同。(2)表面平滑度。一點(diǎn)的表面方向應(yīng)與鄰近各點(diǎn)的表面方向無(wú)多大變化。對(duì)于每個(gè)點(diǎn),計(jì)算的f和g值應(yīng)兼顧上述兩個(gè)約束計(jì)算所得的值。據(jù)亮度要求特定點(diǎn)的f和g值應(yīng)落在等亮度線上,而據(jù)表面平滑度則要求f和g值接近相鄰點(diǎn)f和g的平均值。3、松弛算法(1)對(duì)所有非邊界點(diǎn),令f=0和g=0。對(duì)所有邊界點(diǎn),令f和g規(guī)定一個(gè)長(zhǎng)度為2的垂直于邊界的矢量。稱(chēng)輸入陣列為當(dāng)前陣列。(2)進(jìn)行下列步驟(直到所有的值變化得足夠慢為止):(a)對(duì)當(dāng)前陣列中的每個(gè)點(diǎn):
11、i)如果是個(gè)邊界點(diǎn),則不做任何事;ii)如果是個(gè)非邊界點(diǎn),那么用松弛公式計(jì)算新的f和g值。(b)把所得新陣列稱(chēng)為當(dāng)前陣列。10.2 積木世界的景物分析教學(xué)內(nèi)容:可見(jiàn)的景物的傳感器編碼,檢測(cè)器搜索圖象主要成分(如線段、簡(jiǎn)單曲線和角度等)的處理,利用知識(shí)推斷有關(guān)景物的三維特征信息。教學(xué)重點(diǎn):無(wú)斷裂和陰影時(shí)三面頂點(diǎn)的標(biāo)示方法,有斷裂和陰影時(shí)線條圖的分析。教學(xué)難點(diǎn):無(wú)斷裂和陰影時(shí)三面頂點(diǎn)的標(biāo)示方法。教學(xué)方法:以課堂教育為主,通過(guò)多種途徑開(kāi)發(fā)學(xué)生的學(xué)習(xí)熱情,結(jié)合實(shí)踐。教學(xué)要求:基本了解積木世界景物的線條標(biāo)示方法,掌握無(wú)斷裂和陰影時(shí)三面頂點(diǎn)的標(biāo)示方法和有斷裂和陰影時(shí)線條圖的分析。10.2.1積木世界景物的
12、線條標(biāo)示方法圖10.9 幾種典型的線條圖積木世界視覺(jué)研究的主要目標(biāo)是理解從一堆玩具積木的圖象得到對(duì)于景物的描述。所謂描述就是把出現(xiàn)在圖象中的大量的線條聚集成代表景物中各個(gè)積木的線條組。研究積木世界景物時(shí),輸入的圖象可以是積木景物的照片、電視攝影圖象或是線條圖。如果是屬于前二種,那么第一步就是從圖象得到線條圖。這屬于馬氏初始簡(jiǎn)圖的范圍,但沒(méi)有那樣復(fù)雜,只是用了邊緣檢測(cè)算子。在以下的討論中,我們都假設(shè)已經(jīng)得到了積木世界的線條圖的情況。積木世界景物分析的研究對(duì)象比較狹窄,并且是有意地進(jìn)行了簡(jiǎn)化,但仍不失為合適的計(jì)算機(jī)視覺(jué)研究的初步目標(biāo)。在這個(gè)領(lǐng)域中的研究已經(jīng)取得了一些有實(shí)用意義的成果。積木世界可以推
13、廣為類(lèi)似工業(yè)零件的多面體,而理解簡(jiǎn)單的三維工程圖是建立有視覺(jué)的工業(yè)機(jī)器人裝配系統(tǒng)的第一步。10.2.2 無(wú)斷裂和陰影時(shí)三面頂點(diǎn)的標(biāo)示方法1、線條和接點(diǎn)的分類(lèi)先研究無(wú)斷裂的三面頂點(diǎn),并且設(shè)想合適的光照條件,避免了所有的陰影。在這樣的環(huán)境下,圖中的所有線條代表了各種天然產(chǎn)生的邊緣。這些線條的簡(jiǎn)單分類(lèi)如下。2、標(biāo)志三面接點(diǎn)的方法為了對(duì)圍繞接點(diǎn)的線條的標(biāo)示方式進(jìn)行分類(lèi),需要從每個(gè)可能的方向來(lái)觀察每種實(shí)際可能的三面頂點(diǎn)。但這樣做會(huì)遇到可供選擇的方向過(guò)多的困難,為此把除了一般的觀察位置以外的方向都排除在外,以減少可能出現(xiàn)的情況。假設(shè)在這一節(jié)的其余部分僅討論只包含三面頂點(diǎn)的線條圖。任何三面頂點(diǎn)的3個(gè)面規(guī)定了
14、3個(gè)相交的平面,這3個(gè)相交的平面把空間分成8個(gè)間隔。很明顯,某個(gè)形成一個(gè)頂角的物體就占有上述8個(gè)間隔(或八分體)中的一個(gè)或幾個(gè)。接點(diǎn)標(biāo)志所說(shuō)明的是物體如何占有八分體??梢酝ㄟ^(guò)以下兩個(gè)步驟來(lái)構(gòu)成完整的包含所有連接可能性的字典:先考慮所有的以物體來(lái)充滿這8個(gè)八分體的方式;然后,從未被充滿的八分體觀察所得到的頂點(diǎn)。10.2.3 有斷裂和陰影時(shí)線條圖的分析改善線條描述可使約束的數(shù)目增加,從而提高分析的速度。要進(jìn)一步研究是否有別的方法對(duì)線條的解釋作進(jìn)一步的分類(lèi)。在介紹具體方法以前,有一個(gè)問(wèn)題需要注意,即隨著線標(biāo)志集合的擴(kuò)展,實(shí)際接點(diǎn)標(biāo)志的集合將顯著增加。將會(huì)有幾千種合法的接點(diǎn)標(biāo)志,而不是只有18種。因此
15、不可能建立一個(gè)合法接點(diǎn)標(biāo)志表和企圖讓摸擬計(jì)算機(jī)利用這個(gè)表格來(lái)做些什么。以下介紹兩種對(duì)線條解釋作進(jìn)一步分類(lèi)的方法:1.對(duì)凹面標(biāo)志進(jìn)一步分類(lèi)并引入斷裂線標(biāo)志考慮到物體經(jīng)常放在一起。所以,凹面標(biāo)志可以分成3類(lèi),這3類(lèi)表示有關(guān)物體的數(shù)目和認(rèn)出哪個(gè)物體是在前面的。設(shè)一條凹面邊緣表示兩個(gè)物體接觸在一起的地方。然后想象把這兩個(gè)物體稍為拉開(kāi)一點(diǎn)。這樣,這個(gè)凹面邊緣就成為邊界,其上標(biāo)志指向兩個(gè)可能方向中的一個(gè)。這兩種可能性以一個(gè)由原來(lái)的負(fù)號(hào)標(biāo)志和一個(gè)新的箭頭標(biāo)志組成的合成標(biāo)志來(lái)表示。如果有3個(gè)物體相接觸,同樣可利用一個(gè)合成標(biāo)志表示如果物體稍為離開(kāi)一些時(shí)可以看到什么。斷裂線也可以類(lèi)似地處理:每一根斷裂線被標(biāo)以1個(gè)
16、c和1個(gè)箭頭,表示這兩個(gè)有關(guān)的物體如何配合在一起。2.用光照條件增加標(biāo)志數(shù)量和嚴(yán)格約束另一種改善線條描述的方法是結(jié)合單光源的光照條件。概括起來(lái),線條解釋的每一次改進(jìn)都促使一次線條標(biāo)志的大擴(kuò)展。開(kāi)始時(shí)只考慮基本的線條、邊界線、內(nèi)部的凹面線和凸面線。這些初始的線條種類(lèi)擴(kuò)展到包括陰影線。凹面線又分成四類(lèi)以反映接觸在一起的物體個(gè)數(shù),以及這些物體間如何相互遮擋。這引入了斷裂線并以和凹面線相類(lèi)似的方式分成2類(lèi)。最后,線條的信息和照明信息相結(jié)合。從最后這次擴(kuò)展產(chǎn)生50種線條標(biāo)志。思考:合法的標(biāo)志數(shù)目相對(duì)于不合法的標(biāo)志數(shù)如何增加。10.3 視覺(jué)的知識(shí)表示與控制策略教學(xué)內(nèi)容:研究在人工智能其它領(lǐng)域中發(fā)展起來(lái)的知
17、識(shí)表達(dá)方法,主要是語(yǔ)義網(wǎng)絡(luò)在視覺(jué)領(lǐng)域中的應(yīng)用。教學(xué)重點(diǎn):語(yǔ)義網(wǎng)絡(luò),位置網(wǎng)絡(luò)教學(xué)難點(diǎn):位置網(wǎng)絡(luò)教學(xué)方法:以課堂教育為主,通過(guò)多種途徑開(kāi)發(fā)學(xué)生的學(xué)習(xí)熱情,例如:課堂練習(xí),思考,討論及提問(wèn)等,并結(jié)合實(shí)踐,加深對(duì)課堂知識(shí)的理解。教學(xué)要求:了解語(yǔ)義網(wǎng)絡(luò)及位置網(wǎng)絡(luò),一般了解視覺(jué)系統(tǒng)的控制策略。10.3.1 視覺(jué)信息的語(yǔ)義網(wǎng)絡(luò)表示著重介紹語(yǔ)義網(wǎng)絡(luò),它具有如下特點(diǎn):(1)可作為一種很方便地存取模擬知識(shí)的表達(dá)方法以及命題邏輯的知識(shí)表達(dá)的數(shù)據(jù)結(jié)構(gòu)。(2)可作為一種反映在有關(guān)領(lǐng)域中事物之間相互關(guān)系的模擬結(jié)構(gòu)。(3)可用作一種具有特殊的推理規(guī)則的命題邏輯表達(dá)法。習(xí)題:試用語(yǔ)義網(wǎng)絡(luò)表示以下景物:“在道路57(road5
18、7)與河流3(river3)交叉處的橋梁位于建筑物30(building30)附近。”10.3.2 位置網(wǎng)絡(luò)表示在一般的應(yīng)用場(chǎng)合中,景物中所期望的特征的相對(duì)位置都已表示在網(wǎng)絡(luò)中,這樣網(wǎng)絡(luò)就把圖象的所期望的結(jié)構(gòu)模型化了。物體之間幾何關(guān)系的基本運(yùn)算有以下4種:(1)方向性運(yùn)算(左、反射、北、上、下等):以相對(duì)于其他點(diǎn)集的位置和方向來(lái)規(guī)定點(diǎn)集。(2)區(qū)域運(yùn)算(靠近于、在四邊形內(nèi)、在圓周內(nèi)等等):建立一個(gè)和其他點(diǎn)集無(wú)方向關(guān)系的點(diǎn)集。(3)集合運(yùn)算:完成并、交以及求差等集合運(yùn)算。(4)謂詞運(yùn)算:對(duì)區(qū)域進(jìn)行的謂詞運(yùn)算可通過(guò)測(cè)量某些數(shù)據(jù)的特征來(lái)刪除某些點(diǎn)集。10.3.3 視覺(jué)系統(tǒng)的控制策略視覺(jué)控制策略支配著
19、通過(guò)各表達(dá)層次的信息流和活動(dòng),哪個(gè)觸發(fā)機(jī)構(gòu)在處理?是像視網(wǎng)膜上色塊一般的低級(jí)輸入呢,還是一種高層期望,對(duì)于這兩種極端作不同的強(qiáng)調(diào)是一個(gè)基本控制問(wèn)題,這兩個(gè)極端表征如下:(1)圖象數(shù)據(jù)的驅(qū)動(dòng)。這里控制的進(jìn)行過(guò)程是從建立廣義圖象到已分割圖象結(jié)構(gòu),最后為描述,這也叫由底向上控制(bottomup control)。(2)內(nèi)部模型驅(qū)動(dòng)。知識(shí)庫(kù)內(nèi)的高層模型產(chǎn)生對(duì)輸入的幾何、分割的或廣義圖象的期望或預(yù)測(cè),圖象理解是這種預(yù)測(cè)的驗(yàn)證,這也稱(chēng)為自頂向下控制(topdown control)。(3)非層次控制。這個(gè)術(shù)語(yǔ)似乎由麥卡洛克(McCulloch)提出來(lái)的,他使用這個(gè)術(shù)語(yǔ)描述腦神經(jīng)反應(yīng)連通性所蘊(yùn)涵的反應(yīng)的本
20、質(zhì),其思想是在任何給定時(shí)刻使用能夠完成最終任務(wù)的辦法,提供最多幫助的專(zhuān)家。10.4 物體形狀的分析與識(shí)別教學(xué)內(nèi)容:多面體化為對(duì)非多面體景物的描述問(wèn)題,并以這些描述為基礎(chǔ),對(duì)物體形狀進(jìn)行分析與識(shí)別。教學(xué)重點(diǎn):討論非多面物體的分析,并特別集中于形狀分析。教學(xué)難點(diǎn):松弛標(biāo)示法、多層匹配法。教學(xué)方法:課堂講解教學(xué)要求:了解物體形狀分析與識(shí)別的基本概念10.4.1 復(fù)雜形狀物體的表示一個(gè)好的形狀表示能夠由物體的部分視圖來(lái)識(shí)別物體,而且物體形狀的小變化只引起形狀描述的小變化。物體各部分的連接表示應(yīng)當(dāng)是很方便的,它能夠比較兩個(gè)物體的差別和相似性,而不僅是進(jìn)行簡(jiǎn)單的分類(lèi)。如果把復(fù)雜物體表示為被分割的比較簡(jiǎn)單的
21、部分以及這些部分間的相互關(guān)系,那么上述要求就比較容易得到滿足。對(duì)形狀的識(shí)別是由兩個(gè)相關(guān)描述的匹配獲得的。一個(gè)物體的部分視圖所產(chǎn)生的描述圖是完整的物體描述子圖,并能適當(dāng)匹配過(guò)程的需要。1、曲線形狀的描述與量度曲線描述對(duì)于一些特別物體(如字母符號(hào))和三維景物(如某地區(qū)照片上的道路)分析是很重要的。此外,三維物體的形狀描述也往往被簡(jiǎn)化為“輪廓”線條結(jié)構(gòu)。(1)曲線的存儲(chǔ)方法。依次采用曲線上各點(diǎn)的坐標(biāo)序列來(lái)表示線條是最容易的描述方法。如果只要存儲(chǔ)曲線的起點(diǎn)坐標(biāo)和依次各點(diǎn)的坐標(biāo)增量,那么就能夠顯著節(jié)省計(jì)算機(jī)內(nèi)存。(2)曲線的近似描述。曲線的緊密和結(jié)構(gòu)描述可以采用近似方法。一種方法是把曲線展開(kāi)為正交級(jí)數(shù);
22、另一種是把曲線分段為一些比較簡(jiǎn)單的曲線。線性分割分段近似是最常見(jiàn)的,而樣條函數(shù)(對(duì)多項(xiàng)式分段,在各連接點(diǎn)規(guī)定連續(xù)條件)具有普遍意義。(3)曲線形狀分析量度法。把一些與某曲線的分析近似法有關(guān)的系數(shù)用來(lái)表示該曲線形狀的特征。不同形狀的曲線具有不同的系數(shù)。不過(guò),隨著比例尺、旋轉(zhuǎn)和遮斷情況的不同,這些系數(shù)可能變化很大。因此,這種分析量度法只適用于曲線數(shù)目較少及預(yù)期變化較小的情況。2、面積形狀的描述與量度采用圖形內(nèi)部不在邊界上的點(diǎn)來(lái)描述圖形,比較健全,因?yàn)楸容^小的面積變化能引起大得多的邊界變化。(1)簡(jiǎn)單形狀的量度。由平面圖形的面積和周邊來(lái)粗略量度其形狀面積(周長(zhǎng))2是個(gè)與圖形尺寸、位置和方向無(wú)關(guān)的量度
23、不變式。把一個(gè)圖形的最小約束矩形定義為一個(gè)完全包圍該圖形的矩形,而且此矩形不會(huì)被任何其它的這類(lèi)矩形所包圍,見(jiàn)圖10.10。一種改進(jìn)的對(duì)圖形形狀的近似量度是由它的凸緣進(jìn)行的。把凸緣定義為包圍已知圖形的最小凸出圖形。原圖形則由凸緣形狀及圖中凹面或凹陷的數(shù)目和形狀來(lái)描述,見(jiàn)圖10.11。圖10.10最小約束矩形 圖10.11圖形的凸緣與凹陷(2)面積分析量度法。如同曲線描述一樣,借助于某些基本函數(shù)(如二維傅里葉級(jí)數(shù))對(duì)圖形展開(kāi)或近似而得到的系數(shù),可用于對(duì)圖形形狀進(jìn)行分析量度。對(duì)于一些基本函數(shù),有可能組合這些系數(shù)以獲得一個(gè)對(duì)比例尺、位置和方向的不變式。10.4.2 三維物體的形狀描述三維物體的形狀可由
24、物體的外表面或這些外表面所包絡(luò)的容體來(lái)描述(可把洞孔描述為負(fù)容積)。三維物體描述特別困難之處在于,三維表面或容積需要二維圖象來(lái)推斷,尤其是對(duì)不可見(jiàn)表面的推斷。下面我們將著重分析由二維圖象進(jìn)行容積描述問(wèn)題。1、物體形狀的廣義錐體表示可用廣義柱體(有時(shí)稱(chēng)為廣義錐體)來(lái)表示物體的形狀。由于單一的廣義錐體能夠描述任意容積,因此,復(fù)雜的形狀能夠自然地分割為若干個(gè)比較簡(jiǎn)單的廣義錐體來(lái)描述。圖10.13所示的螺絲起子可由4個(gè)廣義錐體來(lái)描述。其中,一個(gè)對(duì)應(yīng)于螺絲刀片,為一變化的矩形截面;另一個(gè)對(duì)應(yīng)于螺絲刀桿,具有圓截面;還有2個(gè)廣義錐體在手把上。簡(jiǎn)化廣義錐體的準(zhǔn)則應(yīng)是其橫截面的形狀、尺寸或軸線方向不發(fā)生陡削變
25、化。圖10.13螺絲起子的廣義錐體表示2、廣義錐體描述的計(jì)算廣義錐體表示不是變換表示,對(duì)于同一輸入可能有許多可供選擇的描述。需要從中選擇一種或多種最好的描述。(1)擬合表面數(shù)據(jù)。已知可見(jiàn)表面的三維位置以及對(duì)軸線和橫截面形狀的約束,就能擬合出最佳廣義錐體。對(duì)于已知形狀的橫截面,可能求得一個(gè)簡(jiǎn)單的迭代解答??紤]一個(gè)正圓柱體。起初,該圓柱體的軸線方向和橫截面都是未知的。任選一個(gè)方向之后,就能夠?qū)梢?jiàn)表面擬合出橢圓橫斷面。通過(guò)這些橫截面矩心的某軸線,并不需要與該軸線垂直。接著,能夠作出垂直于該軸的橫截面。重復(fù)此過(guò)程,直至只觀察到很小的橫截面變化為止。對(duì)于正圓柱體和正圓錐體,這個(gè)過(guò)程收斂得很快。對(duì)于任意
26、形狀的物體,其收斂情況是不確定的,這時(shí),要采用這種擬合技術(shù),需要假設(shè)橫截面由橢圓所近似。(2)采用物體邊界。二維錐面能夠由物體的邊界來(lái)計(jì)算。如果二維輪廓是三維物體的投影,那么被計(jì)算的錐面就是所求的三維錐體的投影。10.4.3 物體形狀識(shí)別方法物體或者由幾個(gè)物體組成的構(gòu)件,可由比較它們的描述及存儲(chǔ)在計(jì)算機(jī)內(nèi)的模型描述來(lái)識(shí)別。這些模型可能由下列方法獲取:存儲(chǔ)預(yù)先遇到的物體的機(jī)器描述,直接學(xué)習(xí)視圖數(shù)據(jù)序列,或者只是由操作人員提供。如果物體的描述是一張?zhí)匦郧鍐?,即特性矢量,那么能夠采用一般的?shù)學(xué)模式識(shí)別技術(shù)來(lái)識(shí)別。對(duì)于結(jié)構(gòu)性描述,需要采用比較復(fù)雜的匹配技術(shù)。此外,不要求用大量的內(nèi)存把一個(gè)描述與每一個(gè)存
27、儲(chǔ)模型進(jìn)行匹配試驗(yàn),沒(méi)有完全匹配而要選擇一個(gè)合適的子集,就需要進(jìn)行檢索。1、圖匹配法(Graph matching)結(jié)構(gòu)性描述可視為圖或網(wǎng)絡(luò)。我們對(duì)評(píng)價(jià)兩幅圖的相似性感興趣。下面介紹一些有關(guān)相似性的量度。令某幅圖G:N,P,R定義為由結(jié)點(diǎn)集合N(表示物體的部件)、這些結(jié)合特性的集合P以及結(jié)點(diǎn)(節(jié)點(diǎn))間關(guān)系的集合R組成的。已知兩幅圖G:N,P,R和G:N,P,R,如果當(dāng)且僅當(dāng)P(n)與P(n)對(duì)某一給定的相似性量度相似(即節(jié)點(diǎn)n的特性與節(jié)點(diǎn)n的特性相似)時(shí),就說(shuō)形成一對(duì)配對(duì)(assignment)(n,n)。如果有兩對(duì)配對(duì)(n1,n1)和(n2,n2),對(duì)于R中的r和R中的r的所有關(guān)系使得r(n
28、1,n1)=r(n2,n2)成立,那么就說(shuō)這兩對(duì)配對(duì)是兼容的。其中,我們假設(shè)關(guān)系是二元的。如果兩幅圖G和G的節(jié)點(diǎn)具有一對(duì)一的配對(duì),使得所有配對(duì)相互兼容,那么就稱(chēng)這兩幅圖是同構(gòu)的(isomorphic)。其中,如果(n,n)為一配對(duì),那么仍然要求P(n)=P(n)。如果G的子圖與G的子圖同構(gòu),那么就稱(chēng)圖G與G為亞同構(gòu)的(subisomorphic)。2、松弛標(biāo)示法(Relaxation labeling)把標(biāo)示問(wèn)題定義為一個(gè)標(biāo)示集合與一個(gè)節(jié)點(diǎn)(或單元)集合的配對(duì),使得標(biāo)示配對(duì)與給定約束相一致。這種標(biāo)示法有許多應(yīng)用,而且包含了圖匹配問(wèn)題。這時(shí),標(biāo)示是其它圖的節(jié)點(diǎn)。令N為被標(biāo)示節(jié)點(diǎn)的集合,L為可標(biāo)示
29、的集合。對(duì)于每個(gè)ni,想要指定一個(gè)標(biāo)示集合Li,使得Li為L(zhǎng)的一個(gè)子集,而且這些標(biāo)示與給定約束相容。對(duì)于不含糊的情況,每個(gè)集合Li只包含一個(gè)元。最簡(jiǎn)單的約束是一元的,限制標(biāo)示只可能賦予某個(gè)確定的節(jié)點(diǎn),而不考慮網(wǎng)絡(luò)中的其它節(jié)點(diǎn)。二元約束規(guī)定一對(duì)節(jié)點(diǎn)的標(biāo)示之間的關(guān)系。對(duì)于節(jié)點(diǎn)ni的一個(gè)標(biāo)示集合Li,可能與節(jié)點(diǎn)nj的一個(gè)標(biāo)示集合Lj相容,如果Li的每個(gè)標(biāo)示至少與Lj的一個(gè)標(biāo)示相容的話。這種相容性稱(chēng)為弧相容性(arc consistency)。一般說(shuō)來(lái),約束是n元的,而且弧相容性可能并不導(dǎo)致全局相容性(global consistency)。圖10.44給出一個(gè)例子,其一元約束為:要對(duì)每個(gè)節(jié)點(diǎn)標(biāo)示為紅
30、色或綠色,而且要求相鄰點(diǎn)為不同的顏色。每當(dāng)對(duì)一個(gè)節(jié)點(diǎn)指定紅色或綠色之后,我們能夠?qū)ζ湎噜徆?jié)點(diǎn)指定一個(gè)相容的標(biāo)示,但是不能使這3個(gè)節(jié)點(diǎn)同時(shí)滿足全局約束。一個(gè)更大的約束是路徑相容性(path consistency)。兩個(gè)節(jié)點(diǎn)ni和nj(其標(biāo)示為1k和1l)是路徑一致的,如果網(wǎng)絡(luò)內(nèi)存在一條從ni至nj的路徑,對(duì)于此路徑上的每個(gè)節(jié)點(diǎn)不存在標(biāo)示集合,而對(duì)于兩端點(diǎn)同時(shí)與標(biāo)示1k和1l相一致(用二元法)。圖10.14的網(wǎng)絡(luò)不是距徑相容的。只考慮弧相容性,因?yàn)樗鼘?duì)減少可供選擇的方案往往是有用的。圖10.14弧一致但全局不一致的標(biāo)示3、多層匹配法(Multilevel matching)圖匹配和景物松馳標(biāo)示技
31、術(shù)是普遍的。不過(guò),它們不能提供對(duì)相似和差異的滿意描述。采用數(shù)字權(quán),結(jié)合非相關(guān)特性(如顏色和尺寸等)可能沒(méi)有多大意義。一個(gè)可供替代的方案是多層匹配法。對(duì)兩種描述進(jìn)行多層匹配的結(jié)果本身就是一種有關(guān)它們相似和差異的描述。如果由兩個(gè)模型匹配求出同樣的差異,那么可能需要對(duì)景物重新進(jìn)行檢查,以找出更精細(xì)的細(xì)節(jié)。已有一些采用這種方法來(lái)識(shí)別物體的例子。在某些情況下,兩個(gè)模型可能具有類(lèi)似的連通性。這時(shí),可由各個(gè)單獨(dú)部件的特性來(lái)對(duì)模型加以區(qū)別。一般上,需要比較詳細(xì)的分析。當(dāng)模型數(shù)較多時(shí),對(duì)每個(gè)模型進(jìn)行匹配是不適宜的,而且對(duì)內(nèi)存的檢索很可能只需要檢索少數(shù)幾個(gè)模型即可??梢圆捎弥T如觀察者方位以及環(huán)境中期望物體的知識(shí)等
32、關(guān)系來(lái)檢索。一個(gè)檢索過(guò)程應(yīng)當(dāng)能夠適應(yīng)因觀察條件不同而引起的物體描述變化以及由描述過(guò)程本身引起的可變性。描述的可變性可由檢索觀察過(guò)的描述以及根據(jù)期望變化干涉這些描述來(lái)調(diào)整。10.5 小 結(jié)本章所研究的機(jī)器視覺(jué)是諸多傳感信息中包含信息最豐富、最復(fù)雜和最重要的感覺(jué)之一,也是應(yīng)用最為廣泛的機(jī)器感覺(jué)之一。圖象的理解與分析是機(jī)器視覺(jué)的中心研究?jī)?nèi)容之一。物體形狀是最重要的視覺(jué)信息之一,也是工農(nóng)業(yè)生產(chǎn)、交通和國(guó)防等應(yīng)用中需要識(shí)別與分析的最主要的問(wèn)題。a variety of connectors, supporting or providing temporary support. Lateral templ
33、ate installation, install a waterproof top bracing, clean the wall of debris, then install the template in place on the inside, the template is in place to ensure the template bottom line with the elastic edge of the template, template template control lines when the lines are not visible (parallel with the template invocation line 20 cm) check the
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全教育防微杜漸
- 腦出血急救培訓(xùn)護(hù)理
- 創(chuàng)業(yè)夢(mèng)創(chuàng)新夢(mèng)主題活動(dòng)
- 黑龍江省 哈爾濱市第四十七中學(xué)校2024-2025學(xué)年七年級(jí)上學(xué)期期中考試語(yǔ)文試題
- 甘肅省蘭州市蘭州樹(shù)人中學(xué)2023-2024學(xué)年九年級(jí)上學(xué)期期中歷史試卷 - 副本
- 全球與中國(guó)CBRN防護(hù)服市場(chǎng)發(fā)展需求及投資機(jī)遇研究報(bào)告2024-2030年
- 廣東省廣州市白云區(qū)華賦學(xué)校2024-2025學(xué)年上學(xué)期七年級(jí)英語(yǔ)期中考試卷
- 內(nèi)蒙古自治區(qū)通遼市科爾沁左翼中旗聯(lián)盟校2024-2025學(xué)年九年級(jí)上學(xué)期期中考試歷史試題
- 天津市西青區(qū)富力中學(xué)2024-2025學(xué)年九年級(jí)上學(xué)期期中檢測(cè)物理試題
- 【課件】Unit4SectionA1a-1d課件人教版英語(yǔ)七年級(jí)上冊(cè)
- 介紹新會(huì)陳皮
- 腸系膜動(dòng)脈夾層護(hù)理課件
- 軍工板塊行業(yè)分析
- 道德與法治九年級(jí)上冊(cè)每課教學(xué)反思
- 肌骨超聲在RA的應(yīng)用課件
- 2024年醫(yī)保知識(shí)題庫(kù)及答案(通用版)
- 大陳島墾荒精神
- 維吾爾族舞蹈
- 門(mén)診部工作總結(jié)匯報(bào)
- 靜壓樁施工對(duì)周邊環(huán)境的影響及控制措施
- 肖戰(zhàn)分析報(bào)告
評(píng)論
0/150
提交評(píng)論