




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、作者姓名:潘春洪;張彩霞計(jì)算機(jī)視覺(jué)簡(jiǎn)述 人們常說(shuō):眼睛是心靈的窗戶(hù),通過(guò)眼睛人們可以輕易地交流情感,眼睛也是與外界交流的窗口,這些都是通過(guò)“看”來(lái)完成的。 人們可以很容易“看到”一幅畫(huà),但這一“簡(jiǎn)單”過(guò)程并不如此簡(jiǎn)單,大致上它可以分為以下幾個(gè)階段:首先是通過(guò)眼睛將圖成像在視網(wǎng)膜上;其次大腦對(duì)圖像進(jìn)行理解;最后根據(jù)處理的結(jié)果做出反應(yīng)。用比較專(zhuān)業(yè)一點(diǎn)的語(yǔ)言來(lái)描述,該過(guò)程包括了識(shí)別、描述與理解三個(gè)層次;這其中還隱含了邊緣檢測(cè)(各物體的輪廓等)、圖像的分割(各物體區(qū)域的劃分)等階段。以上實(shí)際上概述了視覺(jué)系統(tǒng)的三個(gè)層次,即低層階段:基于圖像特征提取及分割階段;中層階段:基于物體的幾何模型與圖像特性表達(dá)階
2、段;高層階段:基于景物知識(shí)的描述、識(shí)別與理解階段,這是根據(jù)先驗(yàn)知識(shí)介入的程度劃分的,且實(shí)現(xiàn)起來(lái)也越來(lái)越困難。 毫無(wú)疑問(wèn),如何人工實(shí)現(xiàn)這一過(guò)程是極具挑戰(zhàn)性和應(yīng)用前景的一項(xiàng)工作,計(jì)算機(jī)視覺(jué)也因此而應(yīng)運(yùn)而生。計(jì)算機(jī)視覺(jué)是研究用計(jì)算機(jī)和成像設(shè)備來(lái)模擬人和生物視覺(jué)系統(tǒng)功能的技術(shù)學(xué)科,其目標(biāo)是從圖像或圖像序列中獲取對(duì)外部世界的認(rèn)知和理解,即利用二維圖像恢復(fù)三維環(huán)境中物體的幾何信息,比如形狀、位置、姿態(tài)、運(yùn)動(dòng)等,并能描述、識(shí)別與理解。 計(jì)算機(jī)視覺(jué)的基礎(chǔ)是各種成像設(shè)備,例如CCD(Charge Coupled Device )攝像機(jī)(數(shù)碼相機(jī)屬于此類(lèi)型)、紅外攝像機(jī)、醫(yī)學(xué)上常用的核磁共振成像、X射線成像等,這
3、些設(shè)備不僅可以成像,還可以獲取比人眼更豐富的圖像,人們可以形象地把攝像機(jī)看成計(jì)算機(jī)視覺(jué)的視網(wǎng)膜部分??梢哉f(shuō)從人類(lèi)拍攝出第一幅圖像開(kāi)始,就為計(jì)算機(jī)視覺(jué)的誕生奠定了基礎(chǔ)。 而計(jì)算機(jī)視覺(jué)的核心是數(shù)字 HYPERLINK t _blank 電子計(jì)算機(jī),其發(fā)展可謂突飛猛進(jìn),在計(jì)算和存儲(chǔ)能力上,人腦已經(jīng)無(wú)法與之相比,人們的目標(biāo)就是利用計(jì)算機(jī)非凡的計(jì)算處理能力來(lái)代替人腦實(shí)現(xiàn)對(duì)圖像的理解,而計(jì)算機(jī)日新月異的發(fā)展也使得這一愿望越來(lái)越成為可能。 用于指導(dǎo)“計(jì)算機(jī)”這個(gè)大腦運(yùn)作的核心是計(jì)算機(jī)視覺(jué)的理論方法,計(jì)算機(jī)視覺(jué)使用的理論方法主要基于幾何、概率和運(yùn)動(dòng)學(xué)計(jì)算與三維重構(gòu)的視覺(jué)計(jì)算理論,它的基礎(chǔ)包括射影幾何學(xué)、剛體運(yùn)
4、動(dòng)力學(xué)、概率論與隨機(jī)過(guò)程、圖像處理、人工智能等理論。 在20世紀(jì)70年代,視覺(jué)研究大多采用模式識(shí)別的方法;80年代,開(kāi)始采用空間幾何的方法以及物理知識(shí)進(jìn)行視覺(jué)研究;90年代以后,隨著智能機(jī)器人視覺(jué)研究的發(fā)展,引入了許多新的理論與技術(shù)如主動(dòng)視覺(jué)理論、不變量理論、融合技術(shù)等,并應(yīng)用于許多計(jì)算機(jī)視覺(jué)系統(tǒng)中。 研究計(jì)算機(jī)視覺(jué),不得不提的是英國(guó)已故科學(xué)家戴維馬爾(David Marr),他在計(jì)算機(jī)視覺(jué)發(fā)展史上可謂寫(xiě)下了濃重的一筆。在20世紀(jì)70年代末,他提出了第一個(gè)較為完善的視覺(jué)系統(tǒng)框架,即計(jì)算視覺(jué)理論框架。他認(rèn)為視覺(jué)是一個(gè)復(fù)雜的信息處理過(guò)程,并有不同的信息表達(dá)方式和不同層次的處理過(guò)程,而最終的目的是實(shí)
5、現(xiàn)計(jì)算機(jī)對(duì)外部世界的描述。由此,他提出了三個(gè)層次的研究方法,即計(jì)算理論層、表征與算法層以及實(shí)現(xiàn)層。并且設(shè)想出了自下而上,沒(méi)有反饋的視覺(jué)處理框架,他認(rèn)為視覺(jué)的主要任務(wù)是獲得物體的三維形狀,并把獲取過(guò)程分為三個(gè)階段,即原始基元圖(primal sketch)2.5維圖( 2.5dimensional sketch)3維模型表示。其中,基元圖由二維圖像中的邊緣點(diǎn)、直線、曲線、頂點(diǎn)等基本幾何元素或特征組成;2.5維圖是指對(duì)基元圖進(jìn)行一系列處理運(yùn)算,推導(dǎo)出可見(jiàn)表面的朝向、輪廓等幾何信息,是在觀察者坐標(biāo)系下描述的部分的、不完整的三維物體形狀(另一部分是物體的背面或被遮擋的部分);3維模型表示則描述物體坐標(biāo)
6、系下的各種形狀及其空間組織。 迄今為止,研究者們?cè)贛arr計(jì)算視覺(jué)理論框架下,進(jìn)行了大量的研究,并取得了豐富的成果,最矚目也最完善的成果當(dāng)屬基于幾何方法的計(jì)算機(jī)視覺(jué)理論體系。 圖1攝像機(jī)成像的針孔模型 日常生活中最常用的成像設(shè)備數(shù)碼相機(jī)的理想成像模型是針孔模型,很多視覺(jué)研究?jī)?nèi)容都是在這種模型下進(jìn)行的。如圖1所示,可以看出:景物點(diǎn)、針孔、景物點(diǎn)的像三點(diǎn)共線。為了方便起見(jiàn),通常認(rèn)為圖像平面在針孔的前面,即虛擬圖像的位置,除了是相互倒立的外,二者是完全等價(jià)的。利用成像設(shè)備,獲取了圖像,這時(shí)圖像點(diǎn)的位置已經(jīng)確定,如果針孔的位置也可以確定的話,那么根據(jù)三點(diǎn)共線的約束,可知景物點(diǎn)一定在這條射線上,但是這條
7、射線上的每一點(diǎn)成像都是相同的,所以?xún)H從一幅圖像是無(wú)法確定景物點(diǎn)距離攝像機(jī)光心(即針孔位置)的深度的。這樣,若再有一幅包含上述景物點(diǎn)的圖像(同一景物點(diǎn)在不同相機(jī)下的像稱(chēng)為一對(duì)對(duì)應(yīng)點(diǎn)),則存在另一條射線,兩條射線相交,從而可以確定出景物點(diǎn)的空間位置,如圖2所示,對(duì)于兩幅或多幅圖像上的每對(duì)對(duì)應(yīng)點(diǎn)都進(jìn)行類(lèi)似的處理,則可獲得物體的三維形狀信息,如圖3所示。這種由兩幅或多幅兩維圖像恢復(fù)物體三維幾何形狀的方法,即是立體視覺(jué)方法,這一過(guò)程就是三維重建。其間包含了許多步工作,例如特征提取、匹配、攝像機(jī)標(biāo)定、運(yùn)動(dòng)估計(jì)等,每一步都凝結(jié)了眾多研究者的心血,并取得了大量?jī)?yōu)秀的研究成果,像Canny邊緣檢測(cè)算子,Harr
8、is角點(diǎn)檢測(cè),Tsai塊標(biāo)定,張正友的平面模板標(biāo)定等。圖2立體視覺(jué)圖3 兩幅圖像的三維重建 在Marr計(jì)算視覺(jué)理論框架下,觀測(cè)者(計(jì)算機(jī))只是被動(dòng)地分析獲取的靜態(tài)圖像,并不對(duì)成像設(shè)備(攝像機(jī))做任何控制,這使得許多視覺(jué)任務(wù)(如識(shí)別、導(dǎo)航等)難以完成。可以想一下人類(lèi)的視覺(jué),人們?cè)诳吹臅r(shí)候,眼球通常不自覺(jué)地或半自覺(jué)地跳動(dòng)或轉(zhuǎn)動(dòng),這說(shuō)明大腦在主動(dòng)且交互式地接受外界的信息。因此,有學(xué)者提出了主動(dòng)視覺(jué)、有目的的視覺(jué)、定性視覺(jué)等理論,但主動(dòng)視覺(jué)的研究往往與有目的的以及定性視覺(jué)的研究結(jié)合在一起。在主動(dòng)視覺(jué)系統(tǒng)中,攝像機(jī)的狀態(tài)參數(shù)如焦距、縮放、聚散度都可以控制,加之具有可以精確控制的平臺(tái),使得許多不適定的視覺(jué)
9、任務(wù)變?yōu)檫m定的。圖4為一主動(dòng)視覺(jué)平臺(tái),下方是一小車(chē),最上方是兩個(gè)攝像機(jī),計(jì)算機(jī)可以控制車(chē)和攝像機(jī)的運(yùn)動(dòng)、調(diào)整攝像機(jī)的注視點(diǎn),并通過(guò)精確控制平臺(tái)的運(yùn)動(dòng),可以獲得攝像機(jī)的運(yùn)動(dòng)參數(shù),從而使一些原本是非線性的問(wèn)題變成線性問(wèn)題,提高了計(jì)算速度和準(zhǔn)確性,這對(duì)實(shí)時(shí)地獲取外界信息并做出反應(yīng)(如避障)是非常重要的。圖4主動(dòng)視覺(jué)系統(tǒng)平臺(tái) 除了重建,視覺(jué)的另一個(gè)任務(wù)是識(shí)別。其基本方法是首先建立物體模型,然后使用各種匹配算法從圖像中識(shí)別出與物體模型最相似的物體。這里,就用到了先驗(yàn)知識(shí),即識(shí)別前,物體模型需事先存儲(chǔ)在計(jì)算機(jī)中,這是很顯然的事情。平常人們能從圖中認(rèn)出事物,是因?yàn)榇竽X對(duì)它們的特征有了事先的認(rèn)識(shí)。在物體識(shí)別中
10、,“假設(shè)檢驗(yàn)”是一種很重要的識(shí)別方法,又稱(chēng)為基于模型的識(shí)別方法,如圖5所示。從圖像進(jìn)行重建人們已經(jīng)粗略地作了介紹,用其重建出的部分模型與模型庫(kù)中的物體模型作比較,方法是先“假設(shè)”,后“檢驗(yàn)”,即假設(shè)待識(shí)物體是模型庫(kù)中的某個(gè)物體,然后為了減少匹配時(shí)間,只利用部分幾何元素來(lái)判斷它們是否匹配,如果不匹配,則改變假設(shè);反之,則用其他幾何元素在圖像中對(duì)該匹配做“檢驗(yàn)”,以此來(lái)判斷是否需要再修改假設(shè),并重復(fù)上述過(guò)程。因此,這是一種自下而上與自上而下策略的結(jié)合。圖5 假設(shè)檢驗(yàn)方法 可以看出,識(shí)別過(guò)程涉及了視覺(jué)中從低到高所有層次,它是當(dāng)前計(jì)算機(jī)視覺(jué)領(lǐng)域最困難但也是最活躍的領(lǐng)域。之所以困難,可以借用宋朝著名詩(shī)人
11、蘇軾的一首詩(shī)概括:“橫看成嶺側(cè)成峰,遠(yuǎn)近高低各不同”,這說(shuō)明同一事物,因觀測(cè)的角度不同甚至?xí)a(chǎn)生截然相反的圖像,但是即使同一幅圖像,也可能有天壤之別的感受,如圖6所示,左圖中看起來(lái)凹的,而右圖像是凸的,但是這是同一幅圖像,只不過(guò)倒置了一下,但卻讓人們看到了如此有趣的現(xiàn)象。圖6 一對(duì)倒置圖 由于計(jì)算機(jī)視覺(jué)系統(tǒng)發(fā)展遭遇到眾多瓶頸問(wèn)題,如:圖像分割的不穩(wěn)定性、二維圖形到三維立體的病態(tài)問(wèn)題、機(jī)器缺少大規(guī)模并行處理能力等,使得現(xiàn)有的計(jì)算機(jī)視覺(jué)系統(tǒng)在識(shí)別能力、實(shí)時(shí)性上與人類(lèi)視覺(jué)相差甚遠(yuǎn),更不可比擬的是,選擇性注意的能力,即人類(lèi)視覺(jué)分分秒秒都在接受外界的信息,但是人們并不會(huì)對(duì)所有的信息都處理,而是對(duì)很多都會(huì)
12、“視而不見(jiàn)”。從總體的理論研究和應(yīng)用角度來(lái)說(shuō),國(guó)內(nèi)外在計(jì)算機(jī)視覺(jué)的研究水平還是處于起步階段,目前還沒(méi)有一個(gè)完整的理論體系能統(tǒng)一和解決所有的計(jì)算機(jī)視覺(jué)問(wèn)題。圖7 工業(yè)機(jī)器人識(shí)別和定位零件系統(tǒng)示意圖圖8 Rocky7 雖然困難重重,然而計(jì)算機(jī)視覺(jué)技術(shù)正在蓬勃地發(fā)展著,且已經(jīng)有了廣泛的應(yīng)用。例如:零件識(shí)別與定位,圖7是一個(gè)具有簡(jiǎn)單視覺(jué)的工業(yè)機(jī)器人系統(tǒng)示意圖,其視覺(jué)系統(tǒng)由一個(gè)位于零件傳輸帶上方的攝像機(jī)和相關(guān)的視覺(jué)信息處理系統(tǒng)組成。為了有利于視覺(jué)系統(tǒng)將零件從傳輸帶上分離出來(lái),并進(jìn)行識(shí)別和定位,可以選擇與零件顏色差別較大的傳輸帶。由于工業(yè)環(huán)境的結(jié)構(gòu)、照明等因素可以嚴(yán)格地控制,使得這種機(jī)器人視覺(jué)系統(tǒng)在工業(yè)生
13、產(chǎn)和裝配中得到了成功的應(yīng)用;再如,移動(dòng)機(jī)器人導(dǎo)航,圖8是美國(guó)NASA/JPL開(kāi)發(fā)的Rocky7火星探測(cè)移動(dòng)機(jī)器人,在其后部、前部及桅桿上都安裝了一對(duì)黑白CCD攝像機(jī),另外,在桅桿上還安裝了一個(gè)用于近距離成像的攝像機(jī)。借助于這些視覺(jué)系統(tǒng),Rocky7可以進(jìn)行障礙檢測(cè)、自身車(chē)輛檢查、挖掘/傾倒核查等任務(wù);其他的象安全鑒別、監(jiān)視與跟蹤;運(yùn)動(dòng)分析;工業(yè)產(chǎn)品、農(nóng)作物生長(zhǎng)及食品檢測(cè);智能交通系統(tǒng);娛樂(lè)等。更可喜的是,在我國(guó),指紋識(shí)別已達(dá)到實(shí)用階段,人臉識(shí)別也已研究成功。目前,基于內(nèi)容的圖像數(shù)據(jù)查詢(xún)、基于內(nèi)容的圖像自動(dòng)索引等成為很熱門(mén)的研究和應(yīng)用課題,可應(yīng)用于數(shù)字圖書(shū)館、體育圖像自動(dòng)分析、運(yùn)動(dòng)物體自動(dòng)跟蹤等
14、系統(tǒng),根據(jù)物體的二維圖像提取相應(yīng)的特征不變量進(jìn)行識(shí)別和分類(lèi)也是一個(gè)十分重要的研究方向。同時(shí),三維物體識(shí)別也開(kāi)始進(jìn)入了實(shí)用階段。可以看到,視覺(jué)技術(shù)在如此多的領(lǐng)域都已經(jīng)成功地得到了應(yīng)用,而且越來(lái)越貼近生活,雖然這些還只是計(jì)算機(jī)視覺(jué)研究與應(yīng)用的冰山一角,只是邁出了萬(wàn)里長(zhǎng)征的第一步,但人們有理由相信有一天計(jì)算機(jī)會(huì)擁有人一樣的視覺(jué)識(shí)別和理解能力,為人們帶來(lái)精彩的生活。參考文獻(xiàn):1 馬頌德, 張正友. 計(jì)算機(jī)視覺(jué): 計(jì)算理論與算法基礎(chǔ)M. 科學(xué)出版社, 1997.2 賈云得, 機(jī)器視覺(jué)M. 科學(xué)出版社, 2000.3 D.馬爾著, 姚國(guó)正, 劉磊, 汪云九譯. 視覺(jué)計(jì)算理論M. 科學(xué)出版社, 1988.4 朱淼良, 計(jì)算機(jī)視覺(jué)M. 浙江大學(xué)出版社, 1997.5 D. A. Forsyth, J.
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 古風(fēng)吊頂活動(dòng)方案
- 臺(tái)球收費(fèi)活動(dòng)方案
- 各個(gè)行業(yè)活動(dòng)方案
- 合成寵物活動(dòng)方案
- 吉他授課活動(dòng)方案
- 吊頂公司活動(dòng)方案
- 同城女裝活動(dòng)策劃方案
- 名家講座活動(dòng)方案
- 名師總結(jié)活動(dòng)方案
- 吐真言談心活動(dòng)方案
- 山東省煙臺(tái)市牟平區(qū)(五四制)2023-2024學(xué)年八年級(jí)下學(xué)期期末考試數(shù)學(xué)試題
- 國(guó)開(kāi)機(jī)考答案9-人文英語(yǔ)1(閉卷)
- DZ∕T 0348-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 菱鎂礦、白云巖(正式版)
- 文史哲與藝術(shù)中的數(shù)學(xué)智慧樹(shù)知到期末考試答案章節(jié)答案2024年吉林師范大學(xué)
- 酒吧會(huì)員方案
- 汽輪機(jī)檢修安全施工方案
- 教科版六年級(jí)下冊(cè)科學(xué)第一單元《小小工程師》教材分析及全部教案(定稿;共7課時(shí))
- 2024屆北京市海淀區(qū)101中學(xué)語(yǔ)文八年級(jí)第二學(xué)期期末檢測(cè)試題含解析
- 國(guó)家自然科學(xué)基金申請(qǐng)經(jīng)驗(yàn)匯總課件
- 《新產(chǎn)程管理》課件
- 管理ABC-干嘉偉(美團(tuán)網(wǎng)COO)
評(píng)論
0/150
提交評(píng)論