計(jì)算機(jī)視覺技術(shù)概述_第1頁
計(jì)算機(jī)視覺技術(shù)概述_第2頁
計(jì)算機(jī)視覺技術(shù)概述_第3頁
計(jì)算機(jī)視覺技術(shù)概述_第4頁
計(jì)算機(jī)視覺技術(shù)概述_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

計(jì)算機(jī)視覺技術(shù)概述計(jì)算機(jī)視覺技術(shù)概述計(jì)算機(jī)視覺技術(shù)概述計(jì)算機(jī)視覺技術(shù)概述編制僅供參考審核批準(zhǔn)生效日期地址:電話:傳真:郵編:計(jì)算機(jī)視覺現(xiàn)狀及應(yīng)用發(fā)展研究目錄摘要 2緒論 2第一章概述 2計(jì)算機(jī)視覺技術(shù)是什么 2計(jì)算機(jī)視覺技術(shù)的原理 2第二章計(jì)算機(jī)視覺技術(shù)的發(fā)展 2計(jì)算機(jī)視覺技術(shù)的發(fā)展 2計(jì)算機(jī)視覺現(xiàn)狀 2第三章計(jì)算機(jī)視覺技術(shù)的應(yīng)用 2應(yīng)用概述 2視覺測試技術(shù) 2計(jì)算機(jī)視覺在工農(nóng)業(yè)檢測中的應(yīng)用 2第四章計(jì)算機(jī)視覺技術(shù)的圖像處理方發(fā) 2圖像的增強(qiáng) 2圖像的平滑 2圖像的數(shù)據(jù)編碼和傳輸 2邊緣銳化 2圖像的分割 2數(shù)據(jù)驅(qū)動的分割 2模型驅(qū)動的分割 2圖像分割的半自動方法 2圖像的識別 2視覺技術(shù)的研究 2計(jì)算機(jī)視覺研究的對象與方法 2計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域 2第五章計(jì)算機(jī)視覺的發(fā)展趨勢 2計(jì)算機(jī)視覺的發(fā)展趨勢 2參考文獻(xiàn) 2摘要計(jì)算機(jī)視覺技術(shù)集數(shù)字圖像處理、數(shù)字信號處理、光學(xué)、物理學(xué)、幾何學(xué)、應(yīng)用數(shù)學(xué)、模式識別7XA.工智能等知識于一體.其應(yīng)用已經(jīng)涉及到計(jì)算幾何、計(jì)算機(jī)圖形學(xué)、圖像處理、機(jī)器人學(xué)等領(lǐng)域。文中簡要地回顧了計(jì)算機(jī)視覺技術(shù)的發(fā)展史。利用工業(yè)攝像鏡頭替代目視作為傳感器,通過圖像采集。圖像處理,圖像識別等一系列操作。達(dá)到在線對包裝產(chǎn)品進(jìn)行標(biāo)簽檢測的目的。關(guān)鍵詞計(jì)算機(jī)視覺圖像處理視覺系統(tǒng)圖像識別檢測標(biāo)簽緒論計(jì)算機(jī)視覺系統(tǒng)一般有光源、攝像機(jī)、采集卡及PC軟件系統(tǒng)等組成,可以完成圖像的采集與處理、目標(biāo)的識別功能,視覺系統(tǒng)的結(jié)構(gòu)一般是從系統(tǒng)的模型的角度理解的。計(jì)算機(jī)視覺既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個富有挑戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺是一門綜合性的學(xué)科,它已經(jīng)吸引了來自各個學(xué)科的研究者參加到對它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。計(jì)算機(jī)視覺學(xué)所研究的對象,簡單地說就是研究如何讓計(jì)算機(jī)通過圖象傳感器或其它光傳感器來感知、分析和理解周圍環(huán)境。人類感知外界環(huán)境主要通過視覺,聽覺和觸覺等四大感覺系統(tǒng)。其中視覺系統(tǒng)是最復(fù)雜的。人類從外界獲得的信息中視覺信號量最大。模仿人類的視覺系統(tǒng),計(jì)算機(jī)視覺系統(tǒng)中信息的處理和分析大致可以分成兩個階段:圖象處理階段又稱視覺處理中的低水平和中水平階段;圖象分析、理解階段又稱視覺處理中的高水平處理階段。在圖象分析和理解階段,計(jì)算機(jī)根據(jù)事先存貯在數(shù)據(jù)庫中的預(yù)知識模型,識別出各個基元或某些基元組合所代表的客觀世界中的某些實(shí)體稱之為模型匹配以及根據(jù)圖象中各基元之間的關(guān)系在預(yù)知識的指導(dǎo)下得出圖象所代表的實(shí)際景物的含義,得出圖象的解釋或描述。必須強(qiáng)調(diào),預(yù)知識在視覺系統(tǒng)中起著相當(dāng)重要的作用。在預(yù)知識庫中存放著各種實(shí)際可能遇到的物體的知識模型,和實(shí)際景物中各種物體之間的約束關(guān)系。計(jì)算機(jī)的作用是根據(jù)被分析的圖象中的各基元及其關(guān)系,利用預(yù)知識作為指導(dǎo),通過匹配,搜索和推理等手段,最終得到對圖象的描述。在整個過程中預(yù)知識時(shí)刻提供處理的樣板和證據(jù)。每一步的處理結(jié)果隨時(shí)同預(yù)知識進(jìn)行對比。有時(shí),處理的中間結(jié)果和最終結(jié)果還要饋送給預(yù)知識庫作為知識的更新和積累。第一章概述計(jì)算機(jī)視覺技術(shù)是什么計(jì)算機(jī)視覺(Computer

Vision,

CV)是一門研究如何讓計(jì)算機(jī)達(dá)到人類那樣“看”的學(xué)科。更準(zhǔn)確點(diǎn)說,它是利用攝像機(jī)和電腦代替人眼使得計(jì)算機(jī)擁有類似于人類的那種對目標(biāo)進(jìn)行分割、分類、識別、跟蹤、判別決策的功能。計(jì)算機(jī)視覺是使用計(jì)算機(jī)及相關(guān)設(shè)備對生物視覺的一種模擬,是人工智能領(lǐng)域的一個重要部分,它的研究目標(biāo)是使計(jì)算機(jī)具有通過二維圖像認(rèn)知三維環(huán)境信息的能力。計(jì)算機(jī)視覺是以圖象處理技術(shù)、信號處理技術(shù)、概率統(tǒng)計(jì)分析、計(jì)算幾何、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)理論和計(jì)算機(jī)信息處理技術(shù)等為基礎(chǔ),通過計(jì)算機(jī)分析與處理視覺信息。作為一個新興學(xué)科,計(jì)算機(jī)視覺是通過對相關(guān)的理論和技術(shù)進(jìn)行研究,從而試圖建立從圖像或多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng)。計(jì)算機(jī)視覺是一門綜合性的學(xué)科,它已經(jīng)吸引了來自各個學(xué)科的研究者參加到對它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。計(jì)算機(jī)視覺也是當(dāng)前計(jì)算機(jī)科學(xué)中的一個非?;钴S的領(lǐng)域,計(jì)算機(jī)視覺領(lǐng)域與圖像處理,模式識別,投影幾何,統(tǒng)計(jì)推斷,統(tǒng)計(jì)學(xué)習(xí)等學(xué)科密切相關(guān),近年來,與計(jì)算機(jī)圖形學(xué),三維表現(xiàn)等學(xué)科也發(fā)生了很強(qiáng)的聯(lián)系。目前,計(jì)算機(jī)視覺技術(shù)已經(jīng)應(yīng)用在制造業(yè)、工業(yè)檢驗(yàn)、文檔分析、醫(yī)療診斷、軍事目標(biāo)跟蹤、自主導(dǎo)航等系統(tǒng)當(dāng)中計(jì)算機(jī)視覺技術(shù)的原理計(jì)算機(jī)視覺就是用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,由計(jì)算機(jī)來代替大腦完成處理和解釋。計(jì)算機(jī)視覺的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。要經(jīng)過長期的努力才能達(dá)到的目標(biāo)。因此,在實(shí)現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個系統(tǒng)能依據(jù)視覺敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計(jì)算機(jī)視覺的一個重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航,還沒有條件實(shí)現(xiàn)象人那樣能識別和理解任何環(huán)境,完成自主導(dǎo)航的系統(tǒng)。因此,人們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺系統(tǒng)中計(jì)算機(jī)起代替人腦的作用,但并不意味著計(jì)算機(jī)必須按人類視覺的方法完成視覺信息的處理。計(jì)算機(jī)視覺可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來進(jìn)行視覺信息的處理。但是,人類視覺系統(tǒng)是迄今為止,人們所知道的功能最強(qiáng)大和完善的視覺系統(tǒng)。如在以下的章節(jié)中會看到的那樣,對人類視覺處理機(jī)制的研究將給計(jì)算機(jī)視覺的研究提供啟發(fā)和指導(dǎo)。因此,用計(jì)算機(jī)信息處理的方法研究人類視覺的機(jī)理,建立人類視覺的計(jì)算理論,也是一個非常重要和信人感興趣的研究領(lǐng)域。這方面的研究被稱為計(jì)算視覺(ComputationalVision)。計(jì)算視覺可被認(rèn)為是計(jì)算機(jī)視覺中的一個研究領(lǐng)域。第二章計(jì)算機(jī)視覺技術(shù)的發(fā)展計(jì)算機(jī)視覺技術(shù)的發(fā)展計(jì)算機(jī)視覺是在20世紀(jì)50年代從統(tǒng)計(jì)模式識別開始的.當(dāng)時(shí)的工作主要集中在二維圖像分析和識別上,如光學(xué)字符識別.工件表面、顯微圖片和航空圖片的分析和解釋等.60年代,Roberts(1965)通過計(jì)算機(jī)程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對物體形狀及物體的空間關(guān)系進(jìn)行描述[Roberts1965]。到了70年代,已經(jīng)出現(xiàn)了一些視覺應(yīng)用系統(tǒng)『Guzman1969,Maekworth1973,』。70年代中期,麻省理工學(xué)院(MIT)人工智能(AI)實(shí)驗(yàn)室正式開設(shè)“機(jī)器視覺”(MachineVision)課程,由國際著名學(xué)者B.K.P.Hom教授講授。80年代以來,計(jì)算機(jī)視覺的研究已經(jīng)歷r從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用的發(fā)展階段。而計(jì)算機(jī)工業(yè)水平的飛速提高以及人工智能、并行處理和神經(jīng)元網(wǎng)絡(luò)等學(xué)科的發(fā)展,更促進(jìn)了計(jì)算機(jī)視覺系統(tǒng)的實(shí)用化和涉足許多復(fù)雜視覺過程的研究。目前,計(jì)算機(jī)視覺技術(shù)正在廣泛的應(yīng)用于計(jì)算幾何、計(jì)算機(jī)圖形學(xué)、圖像處理、機(jī)器人學(xué)等多個領(lǐng)域中。二十年前,計(jì)算機(jī)的出現(xiàn)使工作場所出現(xiàn)革命化發(fā)展。直到現(xiàn)在,約75%的辦公室工作通過計(jì)算機(jī)和互聯(lián)網(wǎng)來實(shí)現(xiàn)。1990年,大約15%美國家庭擁有了一臺計(jì)算機(jī),現(xiàn)在增加到70%。計(jì)算機(jī)視覺(Computerv|si0n)一詞最早出現(xiàn)在P.H.Westonl975年的論文中。計(jì)算機(jī)視覺是以視覺處理理論為中心,屬于人工智能范疇的一個新領(lǐng)域。它也是以圖像處理、模式識別、計(jì)算機(jī)技術(shù)和生理學(xué)心理學(xué)為基礎(chǔ)的信息處理科學(xué)中的一個重要分支。計(jì)算機(jī)視覺技術(shù)集數(shù)字圖像處理、數(shù)字信號處理、光學(xué)、物理學(xué)、幾何學(xué)、應(yīng)用數(shù)學(xué)、模式識別及人工智能等知識于一體,其應(yīng)用已經(jīng)涉及到計(jì)算幾何、計(jì)算機(jī)圖形學(xué)、圖像處理、機(jī)器人學(xué)等領(lǐng)域。計(jì)算機(jī)視覺既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個富有挑戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺研究的目標(biāo)有兩個:一個是開發(fā)從輸入的圖像數(shù)據(jù)自動構(gòu)造場景描述的圖像理解系統(tǒng),另一個是理解人類視覺,以便有朝一日用機(jī)器代替人去作人類難以達(dá)到或根本無法達(dá)到的工作。當(dāng)前,計(jì)算機(jī)視覺也是人工智能及機(jī)器人科學(xué)中頗為活躍的和卓有成效的熱門研究課題。視覺理解是計(jì)算機(jī)視覺系統(tǒng)的一個重要處理環(huán)節(jié),當(dāng)前,具有視黨反饋功能的機(jī)器人已能代替人完成各種復(fù)雜的任務(wù),如:產(chǎn)品的自動裝配、焊接和檢驗(yàn)、生物醫(yī)學(xué)中的自動診斷、遙感照片的自動解釋、各種車輛的自動導(dǎo)航等。這種賦予機(jī)器以類似人的視覺信息處理能力并為人類自身服務(wù)的美好愿望在一定范圍或特定任務(wù)下已部分地成為現(xiàn)實(shí)。今天,計(jì)算機(jī)視覺的應(yīng)用已滲透到機(jī)器人、天文、地理、醫(yī)學(xué)、化學(xué)、物理等宏觀及微觀世界的各個研究領(lǐng)域。有人預(yù)言,計(jì)算機(jī)視覺是實(shí)現(xiàn)智能機(jī)器人和第五代計(jì)算機(jī)的關(guān)鍵因素之一。計(jì)算機(jī)視覺是一個復(fù)雜的處理過程,景物理解及景物分析是其處理要點(diǎn)之一。用機(jī)器實(shí)現(xiàn)景物理解必須將輸入的圖像和預(yù)先存入的有關(guān)物體結(jié)構(gòu)和環(huán)境約束知識進(jìn)行交互作用,建立明確而有意義的描述理解。這種過程可歸結(jié)為從一幅圖像中提取景物信息,完成某些計(jì)算,在不同階段的理解過程引入相關(guān)的先驗(yàn)知識,從而完成理解處理。類似的工作實(shí)際上早在50年代就已經(jīng)開始了。目前,三維物體及景物分析工作的重點(diǎn)在三維物體與自然景物的識Ⅱ與分析上。80年代,在計(jì)算機(jī)視覺研究中占主導(dǎo)地位的是Mart教授提出的視覺計(jì)算理論框架,在這種框架下,Marr認(rèn)為視覺可看做是三個層次的信息處理過程,而且要從計(jì)算理論、算法描述及硬件實(shí)現(xiàn)三個方面去實(shí)現(xiàn)三個層次的工作。三維物體識別研究自Mart教授創(chuàng)立視覺計(jì)算理論后取得了重大進(jìn)展。這一理論的要點(diǎn)在于把視覺看成一個過程,它從外部世界的圖像逐步產(chǎn)生對景物的三個層次的描述,即:a)初始簡圖——這是基本意義的灰度變動的局部幾何性質(zhì),以線條勾畫出的草圖形式出現(xiàn)b)二維半簡圖——該圖主要描述物體可視面的表面方向和觀察點(diǎn)到表面的距離}c)三維模型表示——這是物體形狀的全部而清晰的描述。有人認(rèn)為,Marr教授的視覺計(jì)算理論是肘計(jì)算機(jī)視覺研究的最杰出的貢獻(xiàn)。90年代,Rosenfeld認(rèn)為應(yīng)重視三個方面的工作,一是計(jì)算的魯棒性問題,二是主動視覺(activevision)的研究,三是定性視覺的研究(qualitativevision)。有人把視覺定義為“根據(jù)獲得的圖像理解景物信息的處理過程,而計(jì)算機(jī)視覺主要是利用計(jì)算機(jī)提供的手段和方法去完成這一信息處理過程。具體包括:視覺信息的獲取圖像預(yù)處理、分割、描述、識別理解等幾步工作。1965年,L.Roberts關(guān)于“三維物體的感知”一文提出了幾種獲取三維信息的基本方法。這些基本方法至今還被計(jì)算機(jī)視覺研究領(lǐng)域普遍采用。目前,獲取視覺信息的主要方法有主動法和被動法兩大類,主動法需要對測試物體加入特殊的人造光源其中包括:三角光法、結(jié)構(gòu)光法和飛行時(shí)間法。三角光法類似三角測量法,此法需逐點(diǎn)測量,費(fèi)時(shí)較多。結(jié)構(gòu)光法是把已知結(jié)構(gòu)的圖像投影到被淵物體表面,由于該物體表面的取向不同,標(biāo)準(zhǔn)圖案會產(chǎn)生畸變,利用這畸變可算出物體表面的三維坐標(biāo)。標(biāo)準(zhǔn)圖像一般用細(xì)線、方格等。這種方法最早由日本學(xué)者Y.Shirai提出,具體做法可采用激光掃描或投影儀來實(shí)現(xiàn)。飛行時(shí)間測距法是以雷達(dá)原理為基礎(chǔ)的方法。這種方法可直接測得物體表面距離而獲得三維信息,它不涉及圖像處理問題。具體實(shí)現(xiàn)可采用激光雷達(dá)或超聲雷達(dá),超聲雷達(dá)的缺點(diǎn)是聚焦比較困難,但是處理方法比較簡單。被動法是在自然光條件下獲得三維信息的方法。其中包括:體視法、陰影恢復(fù)形狀法、由運(yùn)動恢復(fù)形狀法、紋理恢復(fù)形狀和灰度體視法等。體視法與人的視覺原理有許多相似之處,由不同位置上的攝像機(jī)獲取兩幅(或多幅)圖像,根據(jù)三角測量原理,利用立體圖像中的對應(yīng)點(diǎn)的視差計(jì)算出景物的三維信息。因此,兩幅圖像的匹配是體視法的關(guān)鍵。早期的匹配主要基于區(qū)域的灰度相關(guān)計(jì)算,現(xiàn)代方法則側(cè)重于特征匹配。因而,只能獲得稀疏的特征信息,要用各種內(nèi)插法獲取整幅圖像的三維信息。體視法體現(xiàn)了Marr教授的理論精髓。形狀分析法是根據(jù)圖像中灰度陰影分布、物體的運(yùn)動、紋理結(jié)構(gòu)等信息分析計(jì)算景物的三維信息。運(yùn)動序列圖像分析法是依靠物體或攝像機(jī)運(yùn)動時(shí)得到多幅序列圖像,通過對三維運(yùn)動參數(shù)的計(jì)算分析獲取三維信息。此方法基本屬于形狀分析法,它在計(jì)算機(jī)視覺研究中較受重視,已成為一個重要分支??傊S信息獲取是計(jì)算機(jī)視覺研究的基礎(chǔ),也是目前非?;钴S的課題之一。無論在理論上還是實(shí)踐上都有舉足輕重的作用三維信息獲取中的重要環(huán)節(jié)——三維定標(biāo)系統(tǒng)研究也是極受重視的課題。為提高定標(biāo)的精度曾做了大量的研究工作,并提出了不少算法。計(jì)算機(jī)視覺現(xiàn)狀計(jì)算機(jī)視覺領(lǐng)域的突出特點(diǎn)是其多樣性與不完善性。這一領(lǐng)域的先驅(qū)可追溯到更早的時(shí)候,但是直到20世紀(jì)70年代后期,當(dāng)計(jì)算機(jī)的性能提高到足以處理諸如圖像這樣的大規(guī)模數(shù)據(jù)時(shí),計(jì)算機(jī)視覺才得到了正式的關(guān)注和發(fā)展。然而這些發(fā)展往往起源于其他不同領(lǐng)域的需要,因而何謂“計(jì)算機(jī)視覺問題”始終沒有得到正式定義,很自然地,“計(jì)算機(jī)視覺問題”應(yīng)當(dāng)被如何解決也沒有成型的公式。盡管如此,人們已開始掌握部分解決具體計(jì)算機(jī)視覺任務(wù)的方法,可惜這些方法通常都僅適用于一群狹隘的目標(biāo)(如:臉孔、指紋、文字等),因而無法被廣泛地應(yīng)用于不同場合。對這些方法的應(yīng)用通常作為某些解決復(fù)雜問題的大規(guī)模系統(tǒng)的一個組成部分(例如醫(yī)學(xué)圖像的處理,工業(yè)制造中的質(zhì)量控制與測量)。在計(jì)算機(jī)視覺的大多數(shù)實(shí)際應(yīng)用當(dāng)中,計(jì)算機(jī)被預(yù)設(shè)為解決特定的任務(wù),然而基于機(jī)器學(xué)習(xí)的方法正日漸普及,一旦機(jī)器學(xué)習(xí)的研究進(jìn)一步發(fā)展,未來“泛用型”的電腦視覺應(yīng)用或許可以成真。人工智能所研究的一個主要問題是:如何讓系統(tǒng)具備“計(jì)劃”和“決策能力”從而使之完成特定的技術(shù)動作(例如:移動一個機(jī)器人通過某種特定環(huán)境)。這一問題便與計(jì)算機(jī)視覺問題息息相關(guān)。在這里,計(jì)算機(jī)視覺系統(tǒng)作為一個感知器,為決策提供信息。另外一些研究方向包括模式識別和機(jī)器學(xué)習(xí)(這也隸屬于人工智能領(lǐng)域,但與計(jì)算機(jī)視覺有著重要聯(lián)系),也由此,計(jì)算機(jī)視覺時(shí)常被看作人工智能與計(jì)算機(jī)科學(xué)的一個分支。物理是與計(jì)算機(jī)視覺有著重要聯(lián)系的另一領(lǐng)域。計(jì)算機(jī)視覺關(guān)注的目標(biāo)在于充分理解電磁波——主要是可見光與紅外線部分——遇到物體表面被反射所形成的圖像,而這一過程便是基于光學(xué)物理和固態(tài)物理,一些尖端的圖像感知系統(tǒng)甚至?xí)?yīng)用到量子力學(xué)理論,來解析影像所表示的真實(shí)世界。同時(shí),物理學(xué)中的很多測量難題也可以通過計(jì)算機(jī)視覺得到解決,例如流體運(yùn)動。也由此,計(jì)算機(jī)視覺同樣可以被看作是物理學(xué)的拓展。另一個具有重要意義的領(lǐng)域是神經(jīng)生物學(xué),尤其是其中生物視覺系統(tǒng)的部分。在整個20世紀(jì)中,人類對各種動物的眼睛、神經(jīng)元、以及與視覺刺激相關(guān)的腦部組織都進(jìn)行了廣泛研究,這些研究得出了一些有關(guān)“天然的”視覺系統(tǒng)如何運(yùn)作的描述(盡管仍略嫌粗略),這也形成了計(jì)算機(jī)視覺中的一個子領(lǐng)域——人們試圖建立人工系統(tǒng),使之在不同的復(fù)雜程度上模擬生物的視覺運(yùn)作。同時(shí)計(jì)算機(jī)視覺領(lǐng)域中,一些基于機(jī)器學(xué)習(xí)的方法也有參考部分生物機(jī)制。計(jì)算機(jī)視覺的另一個相關(guān)領(lǐng)域是信號處理。很多有關(guān)單元變量信號的處理方法,尤其是對時(shí)變信號的處理,都可以很自然的被擴(kuò)展為計(jì)算機(jī)視覺中對二元變量信號或者多元變量信號的處理方法。但由于圖像數(shù)據(jù)的特有屬性,很多計(jì)算機(jī)視覺中發(fā)展起來的方法,在單元信號的處理方法中卻找不到對應(yīng)版本。這類方法的一個主要特征,便是他們的非線性以及圖像信息的多維性,以上二點(diǎn)作為計(jì)算機(jī)視覺的一部分,在信號處理學(xué)中形成了一個特殊的研究方向。除了上面提到的領(lǐng)域,很多研究課題同樣可被當(dāng)作純粹的數(shù)學(xué)問題。例如,計(jì)算機(jī)視覺中的很多問題,其理論基礎(chǔ)便是統(tǒng)計(jì)學(xué),最優(yōu)化理論以及幾何學(xué)。如何使既有方法通過各種軟硬件實(shí)現(xiàn),或說如何對這些方法加以修改,而使之獲得合理的執(zhí)行速度而又不損失足夠精度,是現(xiàn)今電腦視覺領(lǐng)域的主要課題。第三章計(jì)算機(jī)視覺技術(shù)的應(yīng)用應(yīng)用概述智能計(jì)算機(jī)不但使計(jì)算機(jī)更便于為人們所使用,同時(shí)如果用這樣的計(jì)算機(jī)來控制各種自動化裝置特別是智能機(jī)器人,就可以使這些自動化系統(tǒng)和智能機(jī)器人具有適應(yīng)環(huán)境,和自主作出決策的能力。這就可以在各種場合取代人的繁重工作,或代替人到各種危險(xiǎn)和惡劣環(huán)境中完成任務(wù)。應(yīng)用范圍從任務(wù),比如工業(yè)機(jī)器視覺系統(tǒng),比方說,檢查瓶子上的生產(chǎn)線加速通過,研究為人工智能和計(jì)算機(jī)或機(jī)器人,可以理解他們周圍的世界。計(jì)算機(jī)視覺和機(jī)器視覺領(lǐng)域有顯著的重疊。計(jì)算機(jī)視覺涉及的被用于許多領(lǐng)域自動化圖像分析的核心技術(shù)。機(jī)器視覺通常指的是結(jié)合自動圖像分析與其他方法和技術(shù),以提供自動檢測和機(jī)器人指導(dǎo)在工業(yè)應(yīng)用中的一個過程。在許多計(jì)算機(jī)視覺應(yīng)用中,計(jì)算機(jī)被預(yù)編程,以解決特定的任務(wù),但基于學(xué)習(xí)的方法現(xiàn)在正變得越來越普遍。計(jì)算機(jī)視覺應(yīng)用的實(shí)例包括用于系統(tǒng):(1)控制過程,比如,一個工業(yè)機(jī)器人;(2)導(dǎo)航,例如,通過自主汽車或移動機(jī)器人;(3)檢測的事件,如,對視頻監(jiān)控和人數(shù)統(tǒng)計(jì);(4)組織信息,例如,對于圖像和圖像序列的索引數(shù)據(jù)庫;(5)造型對象或環(huán)境,如,醫(yī)學(xué)圖像分析系統(tǒng)或地形模型;(6)相互作用,例如,當(dāng)輸入到一個裝置,用于計(jì)算機(jī)人的交互;(7)自動檢測,例如,在制造業(yè)的應(yīng)用程序。其中最突出的應(yīng)用領(lǐng)域是醫(yī)療計(jì)算機(jī)視覺和醫(yī)學(xué)圖像處理。這個區(qū)域的特征的信息從圖像數(shù)據(jù)中提取用于使患者的醫(yī)療診斷的目的。通常,圖像數(shù)據(jù)是在形式顯微鏡圖像,X射線圖像,血管造影圖像,超聲圖像和斷層圖像。的信息,可以從這樣的圖像數(shù)據(jù)中提取的一個例子是檢測的腫瘤,動脈粥樣硬化或其他惡性變化。它也可以是器官的尺寸,血流量等。這種應(yīng)用領(lǐng)域還支持通過提供新的信息,醫(yī)學(xué)研究的測量例如,對腦的結(jié)構(gòu),或約醫(yī)學(xué)治療的質(zhì)量。計(jì)算機(jī)視覺在醫(yī)療領(lǐng)域的應(yīng)用還包括增強(qiáng)是由人類的解釋,例如超聲圖像或X射線圖像,以降低噪聲的影響的圖像。第二個應(yīng)用程序區(qū)域中的計(jì)算機(jī)視覺是在工業(yè),有時(shí)也被稱為機(jī)器視覺,在那里信息被提取為支撐的制造工序的目的。一個例子是質(zhì)量控制,其中的信息或最終產(chǎn)品被以找到缺陷自動檢測。另一個例子是,被拾取的位置和細(xì)節(jié)取向測量由機(jī)器人臂。機(jī)器視覺也被大量用于農(nóng)業(yè)的過程,從散裝材料,這個過程被稱為去除不想要的東西,食物的光學(xué)分揀。軍事上的應(yīng)用很可能是計(jì)算機(jī)視覺最大的地區(qū)之一。最明顯的例子是探測敵方士兵或車輛和導(dǎo)彈制導(dǎo)。更先進(jìn)的系統(tǒng)為導(dǎo)彈制導(dǎo)發(fā)送導(dǎo)彈的區(qū)域,而不是一個特定的目標(biāo),并且當(dāng)導(dǎo)彈到達(dá)基于本地獲取的圖像數(shù)據(jù)的區(qū)域的目標(biāo)做出選擇。現(xiàn)代軍事概念,如“戰(zhàn)場感知”,意味著各種傳感器,包括圖像傳感器,提供了豐富的有關(guān)作戰(zhàn)的場景,可用于支持戰(zhàn)略決策的信息。在這種情況下,數(shù)據(jù)的自動處理,用于減少復(fù)雜性和融合來自多個傳感器的信息,以提高可靠性。一個較新的應(yīng)用領(lǐng)域是自主車,其中包括潛水,陸上車輛(帶輪子,轎車或卡車的小機(jī)器人),高空作業(yè)車和無人機(jī)(UAV)。自主化水平,從完全獨(dú)立的(無人)的車輛范圍為汽車,其中基于計(jì)算機(jī)視覺的系統(tǒng)支持驅(qū)動程序或在不同情況下的試驗(yàn)。完全自主的汽車通常使用計(jì)算機(jī)視覺進(jìn)行導(dǎo)航時(shí),即知道它在哪里,或用于生產(chǎn)的環(huán)境(地圖SLAM)和用于檢測障礙物。它也可以被用于檢測特定任務(wù)的特定事件,例如,一個UAV尋找森林火災(zāi)。支承系統(tǒng)的例子是障礙物警報(bào)系統(tǒng)中的汽車,以及用于飛行器的自主著陸系統(tǒng)。數(shù)家汽車制造商已經(jīng)證明了系統(tǒng)的汽車自動駕駛,但該技術(shù)還沒有達(dá)到一定的水平,就可以投放市場。有軍事自主車型,從先進(jìn)的導(dǎo)彈,無人機(jī)的偵察任務(wù)或?qū)椀闹茖?dǎo)充足的例子。太空探索已經(jīng)正在使用計(jì)算機(jī)視覺,自主車比如,美國宇航局的火星探測漫游者和歐洲航天局的ExoMars火星漫游者。視覺測試技術(shù)非接觸測試技術(shù)很多,特別值得一提的是視覺測試技術(shù)?,F(xiàn)代視覺理論和技術(shù)的發(fā)展,不僅在于模擬人眼能完成的功能,更重要的是它能完成人眼所不能勝任的工作,所以視覺技術(shù)作為當(dāng)今最新技術(shù),在電子、光學(xué)和計(jì)算機(jī)等技術(shù)不斷成熟和完善的基礎(chǔ)上得到迅速發(fā)展。視覺測試技術(shù)是建立在計(jì)算機(jī)視覺研究基礎(chǔ)上的一門新興測試技術(shù)。與計(jì)算機(jī)視覺研究的視覺模式識別、視覺理解等內(nèi)容不同,視覺測試技術(shù)重點(diǎn)研究物體的幾何尺寸及物體的位置測量,如轎車白車身三維尺寸的測量、模具等三維面形的快速測量、大型工件同軸度測量、共面性測量等。它可以廣泛應(yīng)用于在線測量、逆向工程等主動、實(shí)時(shí)測量過程。視覺測試技術(shù)在國外發(fā)展很快,早在20世紀(jì)80年代,美國國家標(biāo)準(zhǔn)局就預(yù)計(jì),檢測任務(wù)的90%將由視覺測試系統(tǒng)來完成。美國在80年代就有100多家公司躋身于視覺測試系統(tǒng)的經(jīng)營市場,可見視覺測試系統(tǒng)確實(shí)很有前途。在1999年10月的北京國際機(jī)床博覽會上已見到國外利用視覺檢測技術(shù)研制的儀器,如流動式光學(xué)三坐標(biāo)測量機(jī)、高速高精度數(shù)字化掃描系統(tǒng)、非接觸式光學(xué)三坐標(biāo)測量機(jī)等先進(jìn)器。計(jì)算機(jī)視覺在工農(nóng)業(yè)檢測中的應(yīng)用由于計(jì)算機(jī)視覺技術(shù)具有非接觸、獲得信息量大、作用距離遠(yuǎn)等特點(diǎn),特別是隨著計(jì)算機(jī)圖像處理技術(shù)的不斷發(fā)展,近幾十年來,它在工業(yè)、農(nóng)業(yè)、科學(xué)研究、軍事等方面都獲得了十分廣泛的應(yīng)用。下面主要介紹一下計(jì)算機(jī)視覺技術(shù)在工業(yè)檢測中的應(yīng)用概況。工業(yè)檢測:圖像識別技術(shù)在工業(yè)領(lǐng)域的應(yīng)用,主要用于能夠代替人眼的計(jì)算機(jī)系統(tǒng)。在高速、大批量、連續(xù)自動化生產(chǎn)流水線,往往需要視覺系統(tǒng)進(jìn)行質(zhì)量檢查、零件辨識和尺寸測量;實(shí)際上,在發(fā)達(dá)國家,幾乎任何產(chǎn)品的生產(chǎn),從半導(dǎo)體芯片到食品飲料,甚至人工鉆石,都越發(fā)依賴視覺系統(tǒng)的應(yīng)用,可以用于基于圖像處理技術(shù)的非接觸精密測量、產(chǎn)品表面質(zhì)量檢測與監(jiān)控、基于機(jī)器視覺的工業(yè)自動化閉環(huán)控制、流水線產(chǎn)品外觀質(zhì)量檢測設(shè)備、復(fù)雜形狀非接觸精密測量設(shè)備。醫(yī)療:B超、CT、X光、ECT、內(nèi)窺鏡、病理分析、醫(yī)學(xué)影像、血管造影,細(xì)胞圖像分析系統(tǒng)等。采用醫(yī)療圖像分析系統(tǒng),可對血液細(xì)胞自動分類計(jì)數(shù)、染色體分析、癌癥細(xì)胞識別等。公安:指紋識別、痕跡辨認(rèn)、電子警察、圖像自動跟蹤、安全監(jiān)控等。石油:巖石圖像分析系統(tǒng),能夠分析含油數(shù)量等信息。金融:印章支票真?zhèn)闻袆e、票證處理、柜員機(jī)自動檢測、金庫監(jiān)控、運(yùn)鈔車現(xiàn)場自動檢測與傳輸?shù)?。其中紙幣印刷質(zhì)量檢測系統(tǒng)利用圖像處理技術(shù),通過對紙幣生產(chǎn)流水線上的紙幣20多項(xiàng)特征(號碼、盲文、顏色、圖案等)進(jìn)行比較分析,檢測紙幣的質(zhì)量,替代傳統(tǒng)的人眼辨別的方法。交通:汽車車牌識別、高速公路收費(fèi)、違章闖紅燈檢測、交通管制系統(tǒng)等。采用智能交通管理系統(tǒng),通過在交通要道放置攝像頭,當(dāng)有違章車輛(如闖紅燈)時(shí),攝像頭將車輛的牌照拍攝下來,傳輸給中央管理系統(tǒng),系統(tǒng)利用圖像處理技術(shù),對拍攝的圖片進(jìn)行分析,提取出車牌號,存儲在數(shù)據(jù)庫中,可以供管理人員進(jìn)行檢索。體育:足球越位及出界報(bào)警、保齡球道計(jì)分、運(yùn)動人體動作分析等方面。商標(biāo)管理:可以建立商標(biāo)圖像庫,利用圖像檢索技術(shù),對新申請的商標(biāo)與圖像庫里的注冊商標(biāo)進(jìn)行分析,檢查是否設(shè)計(jì)相似或雷同。數(shù)字圖書館:數(shù)字多媒體內(nèi)容的發(fā)布和管理。金相分析:金相圖像分析系統(tǒng)能對金屬或其它材料的基體組織、雜質(zhì)含量、組織成分等進(jìn)行精確、客觀地分析,為產(chǎn)品質(zhì)量提供可靠的依據(jù)。瓶裝啤酒生產(chǎn)流水線檢測系統(tǒng):可以檢測啤酒是否達(dá)到標(biāo)準(zhǔn)的容量、啤酒標(biāo)簽是否完整等。第四章計(jì)算機(jī)視覺技術(shù)的圖像處理方發(fā)計(jì)算機(jī)視覺系統(tǒng)中,視覺信息的處理技術(shù)主要依賴于圖像處理方法,它包括圖像增強(qiáng)、數(shù)據(jù)編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計(jì)算機(jī)對圖像進(jìn)行分析、處理和識別。圖像的增強(qiáng)圖像的增強(qiáng)用于調(diào)整圖像的對比度,突出圖像中的重要細(xì)節(jié),改善視覺質(zhì)量。通常采用灰度直方圖修改技術(shù)進(jìn)行圖像增強(qiáng)。圖像的灰度直方圖是表示一幅圖像灰度分布情況的統(tǒng)計(jì)特性圖表,與對比度緊密相連。通過灰度直方圖的形狀,能判斷該圖像的清晰度和黑白對比度。如果獲得一幅圖像的直方圖效果不理想,可以通過直方圖均衡化處理技術(shù)作適當(dāng)修改,即把一幅已知灰度概率分布圖像中的像素灰度作某種映射變換,使它變成一幅具有均勻灰度概率分布的新圖像,實(shí)現(xiàn)使圖像清晰的目的。圖像的平滑圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。眾所周知,實(shí)際獲得的陶像在形成、傳輸、接收和處理的過程中,不可避免地存在著外部干擾和內(nèi)部干擾,如光電轉(zhuǎn)換過程中敏感元件靈敏度的不均勻性、數(shù)字化過程的量化噪聲、傳輸過程中的誤差以及人為因素等.均會使圖像變質(zhì)。因此,去除噪聲,恢復(fù)原始圖像是圖像處理中的一個重要內(nèi)容。圖像的數(shù)據(jù)編碼和傳輸數(shù)字圖像的數(shù)據(jù)量是相當(dāng)龐大的,一幅512。512個像素的數(shù)字圖像的數(shù)據(jù)量為256K字節(jié),若假設(shè)每秒傳輸25幀圖像,則傳輸?shù)男诺浪俾蕿?2.4M比特/秒。高信道速率意味瞢高投資,也意味著普及難度的增加,因此。傳輸過程中,對圖像數(shù)據(jù)進(jìn)行壓縮顯得非常重要。數(shù)據(jù)的壓縮主要通過圖像數(shù)據(jù)的編霄和變換壓縮完成。圖像數(shù)據(jù)編碼一般采用預(yù)測編碼.即將圖像數(shù)據(jù)的空間變化規(guī)律和序列變化規(guī)律用一個預(yù)測公式表示.如果知道了,某一像素的前面各相鄰像素值之后.可以用公式預(yù)測該像素值。該方法可將一幅圖像的數(shù)據(jù)壓縮到為數(shù)不多的幾十個特傳輸,在接收端再變換回去即可。邊緣銳化圖像邊緣銳化處理主要是加強(qiáng)圖像中的輪廓邊緣和細(xì)節(jié),形成完整的物體邊界.達(dá)到將物體從圖像中分離出來或?qū)⒈硎就晃矬w表面的區(qū)域檢測出來的目的。它是早期視覺理論和算法中的基本問題.也是中期和后期視覺成敗的重要因素之一。圖像的分割圖像分割是將圖像分成若干部分,每一部分對應(yīng)于某一物體表面.在進(jìn)行分割時(shí).每一部分的灰度或紋理符合某一種均勻測度度量。某本質(zhì)是將像素進(jìn)行分類。分類的依據(jù)是像素的灰度值、顏色、頻譜特性、空間特性或紋理特性等。圖像分割是圖像處理技術(shù)的基本方法之一,應(yīng)用于諸如染色體分類、景物理解系統(tǒng)、機(jī)器視覺等方面。圖像分割主要有兩種方法:一是鑒于度量宅問的灰度閭值分割法。它是根據(jù)圖像灰度直方圖來決定圖像空間域像素聚類。二是空間域區(qū)域增長分割方法。它是對在某種意義上(如灰度級、組織、梯度等)具有相似性質(zhì)的像素連通集構(gòu)成分割區(qū)域,該方法有很好的分割效果,但缺點(diǎn)是運(yùn)算復(fù)雜.處理速度慢。數(shù)據(jù)驅(qū)動的分割常見的數(shù)據(jù)驅(qū)動分割包括基于邊緣檢測的分割、基于區(qū)域的分割、邊緣與區(qū)域相結(jié)合的分割等。對于基于邊緣檢測的分割,其基本思想是先檢測圖像中的邊緣點(diǎn),再按一定策略連接成輪廓,從而構(gòu)成分割區(qū)域。難點(diǎn)在于邊緣檢測時(shí)抗噪聲性能和檢測精度的矛盾,若提高檢測精度,則噪聲產(chǎn)生的偽邊緣會導(dǎo)致不合理的輪廓;若提高抗噪聲性能,則會產(chǎn)生輪廓漏檢和位置偏差。為此,人們提出各種多尺度邊緣檢測方法,根據(jù)實(shí)際問題設(shè)計(jì)多尺度邊緣信息的結(jié)合方案,以較好地兼顧抗噪聲性能和檢測精度。基于區(qū)域的分割的基本思想是根據(jù)圖像數(shù)據(jù)的特征將圖像空間劃分成不同的區(qū)域。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。方法有閾值法、區(qū)域生長法、聚類法、松弛法等。邊緣檢測能夠獲得灰度或彩色值的局部變化強(qiáng)度,區(qū)域分割能夠檢測特征的相似性與均勻性。將兩者結(jié)合起來,通過邊緣點(diǎn)的限制,避免區(qū)域的過分割;同時(shí)通過區(qū)域分割補(bǔ)充漏檢的邊緣,使輪廓更加完整。例如,先進(jìn)行邊緣檢測與連接,再比較相鄰區(qū)域的特征(灰度均值、方差),若相近則合并;對原始圖像分別進(jìn)行邊緣檢測和區(qū)域生長,獲得邊緣圖和區(qū)域片段圖后,再按一定的準(zhǔn)則融合,得到最終分割結(jié)果。模型驅(qū)動的分割常見的模型驅(qū)動分割包括基于動態(tài)輪廓(Snakes)模型、組合優(yōu)化模型、目標(biāo)幾何與統(tǒng)計(jì)模型。Snakes模型用于描述分割目標(biāo)的動態(tài)輪廓。由于其能量函數(shù)采用積分運(yùn)算,具有較好的抗噪聲性,對目標(biāo)的局部模糊也不敏感,因而適用性很廣。但這種分割方法容易收斂到局部最優(yōu),因此要求初始輪廓應(yīng)盡可能靠近真實(shí)輪廓。近年來對通用分割方法的研究傾向于將分割看作一個組合優(yōu)化問題,并采用一系列優(yōu)化策略完成圖像分割任務(wù)。主要思路是在分割定義的約束條件之外,根據(jù)具體任務(wù)再定義一個優(yōu)化目標(biāo)函數(shù),所求分割的解就是該目標(biāo)函數(shù)在約束條件下的全局最優(yōu)解。以組合優(yōu)化的觀點(diǎn)處理分割問題,主要是利用一個目標(biāo)函數(shù)綜合表示分割的各種要求和約束,將分割變?yōu)槟繕?biāo)函數(shù)的優(yōu)化求解。由于目標(biāo)函數(shù)通常是一個多變量函數(shù),可采用隨機(jī)優(yōu)化方法?;谀繕?biāo)幾何與統(tǒng)計(jì)模型的分割是將目標(biāo)分割與識別集成在一起的方法,常稱作目標(biāo)檢測或提取?;舅枷胧菍⒂嘘P(guān)目標(biāo)的幾何與統(tǒng)計(jì)知識表示成模型,將分割與識別變?yōu)槠ヅ浠虮O(jiān)督分類。常用的模型有模板、特征矢量模型、基于連接的模型等。這種分割方法能夠同時(shí)完成部分或全部識別任務(wù),具有較高的效率。然而由于成像條件變化,實(shí)際圖像中的目標(biāo)往往與模型有一定的區(qū)別,需要面對誤檢與漏檢的矛盾,匹配時(shí)的搜索步驟也頗為費(fèi)時(shí)。圖像分割的半自動方法從人工參與程度來看,圖像分割可分為人工、半自動、自動等三種類型。其中人工分割完全由操作者利用鼠標(biāo)勾畫出分割區(qū)域的輪廓,費(fèi)時(shí)費(fèi)力,且容易受操作者主觀因素的影響,重復(fù)性差。自動分割不需人機(jī)交互,但適應(yīng)性差,很難實(shí)現(xiàn)對一批圖像同時(shí)獲得滿意的分割效果。半自動分割將人機(jī)交互與自動分割相結(jié)合,能夠適應(yīng)不同的圖像和需求,且有效降低計(jì)算復(fù)雜度。目前半自動分割中人機(jī)交互的方式有:勾畫目標(biāo)的大致輪廓,構(gòu)成自動分割的初始化;根據(jù)特定的圖像和任務(wù)調(diào)整算法參數(shù);在分割過程中加入人工交互節(jié)等??傊?從實(shí)用化的角度看,自動分割仍是長期努力的方向。目前更為現(xiàn)實(shí)的是在自動分割前或分割過程中加入人機(jī)交互的半自動分割。其發(fā)展方向?yàn)楸M可能少和簡便的人機(jī)交互??梢?圖像分割是圖像處理和機(jī)器視覺必不可少的重要環(huán)節(jié),也是圖像理論發(fā)展的瓶頸之一。隨著計(jì)算機(jī)速度與容量的快速進(jìn)展,圖像處理與機(jī)器視覺實(shí)用化系統(tǒng)碩果累累。例如,基于內(nèi)容的圖像檢索系統(tǒng)、智能監(jiān)視系統(tǒng)、視覺引導(dǎo)的智能交通系統(tǒng)、手寫體字符/人臉/指紋/虹膜識別系統(tǒng)等。然而有關(guān)的理論研究并沒有取得突破性進(jìn)展。圖像的識別圖像的識別過程實(shí)際上可以看作是一個標(biāo)記過程,即利用識別算法來辨別景物中已分割好的各個物體.給這螳物體賦予特定的標(biāo)記,它是汁算機(jī)視覺系統(tǒng)必須完成的一個任務(wù)。按照網(wǎng)像識別從易到難.町分為i類問題第一類識別問題中.圖像中的像素表達(dá)了某一物體的某種特定信息。第二類問題中,待識別物是有形的整體。二維圖像信息已經(jīng)足夠識別該物體.如文字識別、某些具有穩(wěn)定可視表面的三維體識別等。第三類問題是由輸入的二維圖、要素圖、2x5維圖等.得出被測物體的三維表示。這里存著如何將隱含的三維信息提取出來的問題.當(dāng)是今研究的熱點(diǎn)。目前用于圖像識別的方法主要分為決策理論和結(jié)構(gòu)方法。決策理論方法的基礎(chǔ)是決策函數(shù),利用它對模式向量進(jìn)行分類識別.是以定時(shí)描述(如統(tǒng)計(jì)紋理)為基礎(chǔ)的:結(jié)構(gòu)方法的核心是將物體分解成』'模式或模式基元,而不同的物體結(jié)構(gòu)有不同的基元串(或稱字符串),通過對未知物體利用給定的模式基元求出編碼邊界,得到字符串,冉根據(jù)字符串判斷它的屬類。這是一種依賴于符號描述被測物體之間關(guān)系的方法。視覺技術(shù)的研究人類很多研究都是以延伸人類能力為目的的,早期的工作是在體力上延伸,計(jì)算機(jī)發(fā)明以來,就拓展到對人類腦力和感知能力的延伸上。對人類視覺感知能力的計(jì)算機(jī)模擬導(dǎo)致了計(jì)算機(jī)視覺的產(chǎn)生。計(jì)算機(jī)視覺也經(jīng)常被稱為圖像理解,是指研究完成一項(xiàng)任務(wù)所需的視覺信息及如何從圖像中獲取這些信息的研究領(lǐng)域。其基本目的有三個:(1)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;(2)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的運(yùn)動參數(shù);(3)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的表面物理特性。要達(dá)到的最終目的是實(shí)現(xiàn)對于三維景物世界的理解,即實(shí)現(xiàn)人的視覺系統(tǒng)的某些功能。也就是利用二維投影圖像來重構(gòu)三維物體的可視部分。計(jì)算機(jī)視覺研究的對象與方法以模型世界為主要對象的視覺基本方法研究這個階段以Roberts的開創(chuàng)性工作為標(biāo)志。在Roberts的工作中引入了三維物體與二維成像的關(guān)系,采用了一些簡單的邊緣特征提取方法并引入了組合線段的方法。這些早期的工作對視覺的發(fā)展起了促進(jìn)作用,但對于稍微復(fù)雜的景物便難于奏效。為他對三維關(guān)系的分析僅僅是靠簡單的邊緣線段的約束關(guān)系,并沒有充分考慮人類或其他動物視覺系統(tǒng)感知三維空間關(guān)系的方式。以計(jì)算理論為核心的視覺模型研究20世紀(jì)70年代開始,對計(jì)算機(jī)視覺的研究進(jìn)入更為理性化的階段,主要集中于各種本征特性的恢復(fù),包括三維形狀、運(yùn)動、光源等的恢復(fù)。主要出發(fā)點(diǎn)是從生理學(xué)、光學(xué)和射影幾何的方法出發(fā),研究成像及其逆問題。在這一階段中,以Marr為代表的一些研究者提出了以表示為核心、以算法為中間轉(zhuǎn)換過程的一般性視覺處理模型。在其理論中強(qiáng)調(diào)表示的重要性以及從不同層次上去研究信息處理問題,在計(jì)算理論和算法實(shí)現(xiàn)上又特別強(qiáng)調(diào)計(jì)算理論的重要性。在三維信息的感知方面,根據(jù)人類感知深度的不同提出了一系列ShapefromX的方法。計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域主要包括對照片、視頻資料如航空照片、衛(wèi)星照片、視頻片段等的解釋、精確制導(dǎo)、移動機(jī)器人視覺導(dǎo)航、醫(yī)學(xué)輔助診斷、工業(yè)機(jī)器人的手眼系統(tǒng)、地圖繪制、物體三維形狀分析與識別及智能人機(jī)接口等。早期進(jìn)行數(shù)字圖像處理的目的之一就是要通過采用數(shù)字技術(shù)提高照片的質(zhì)量,輔助進(jìn)行航空照片和衛(wèi)星照片的讀取判別與分類。由于需要判讀的照片數(shù)量很多,于是希望有自動的視覺系統(tǒng)進(jìn)行判讀解釋,在這樣的背景下,產(chǎn)生了許多航空照片和衛(wèi)星照片判讀系統(tǒng)與方法。自動判讀的進(jìn)一步應(yīng)用就是直接確定目標(biāo)的性質(zhì),進(jìn)行實(shí)時(shí)的自動分類,并與制導(dǎo)系統(tǒng)相結(jié)合。目前常用的制導(dǎo)方式包括激光制導(dǎo)、電視制導(dǎo)和圖像制導(dǎo),在導(dǎo)彈系統(tǒng)中常常將慣性制導(dǎo)與圖像制導(dǎo)結(jié)合,利用圖像進(jìn)行精確的末制導(dǎo)。工業(yè)機(jī)器人的手眼系統(tǒng)是計(jì)算機(jī)視覺應(yīng)用最為成功的領(lǐng)域之一,由于工業(yè)現(xiàn)場的諸多因素,如光照條件、成像方向均是可控的,因此使得問題大為簡化,有利于構(gòu)成實(shí)際的系統(tǒng)。與工業(yè)機(jī)器人不同,對于移動機(jī)器人而言,由于它具有行為能力,于是就必須解決行為規(guī)劃問題,即是對環(huán)境的了解。隨著移動式機(jī)器人的發(fā)展,越來越多地要求提供視覺能力,包括道路跟蹤、回避障礙、特定目標(biāo)識別等。目前移動機(jī)器人視覺系統(tǒng)研究仍處于實(shí)驗(yàn)階段,大多采用遙控和遠(yuǎn)視方法。在醫(yī)學(xué)上采用的圖像處理技術(shù)大致包括壓縮、存儲、傳輸和自動/輔助分類判讀,此外還可用于醫(yī)生的輔助訓(xùn)練手段。與計(jì)算機(jī)視覺相關(guān)的工作包括分類、判讀和快速三維結(jié)構(gòu)的重建等方面。長期以來,地圖繪制是一件耗費(fèi)人力、物力和時(shí)間的工作。以往的做法是人工測量,現(xiàn)在更多的是利用航測加上立體視覺中恢復(fù)三維形狀的方法繪制地圖,大大提高了地圖繪制的效率。同時(shí),通用物體三維形狀分析與識別一直是計(jì)算機(jī)視覺的重要研究目標(biāo),并在景物的特征提取、表示、知識的存儲、檢索以及匹配識別等方面都取得了一定的進(jìn)展,構(gòu)成了一些用于三維景物分析的系統(tǒng)。近年來,基于生物特征(biometrics)的鑒別技術(shù)得到了廣泛重視,主要集中在對人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關(guān)。與生物特征識別密切相關(guān)的另一個重要應(yīng)用是用于構(gòu)成智能人機(jī)接口?,F(xiàn)在計(jì)算機(jī)與人的交流還是機(jī)械式的,計(jì)算機(jī)無法識別用戶的真實(shí)身份,除鍵盤、鼠標(biāo)外,其他輸入手段還不成熟。利用計(jì)算機(jī)視覺技術(shù)可以使計(jì)算機(jī)檢測到用戶是否存在、鑒別用戶身份、識別用戶的體勢(如點(diǎn)頭、搖頭)。此外,這種人機(jī)交互方式還可推廣到一切需要人機(jī)交互的場合,如入口安全控制、過境人員的驗(yàn)放等。第五章計(jì)算機(jī)視覺的發(fā)展趨勢計(jì)算機(jī)視覺的發(fā)展趨勢計(jì)算機(jī)視覺研究經(jīng)歷了近40年的過程,仍面臨許多問題。主要由于這一方向是多學(xué)科的交叉與結(jié)合,同時(shí)視覺是一個涉及生理、心理的復(fù)雜過程,不僅與眼睛有關(guān),還和大腦的推理、學(xué)習(xí)有關(guān)。研究計(jì)算機(jī)視覺的目的是要實(shí)現(xiàn)對人類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論