![計算機視覺技術_第1頁](http://file4.renrendoc.com/view/5866bde2d5b6129dacd879448fcd094a/5866bde2d5b6129dacd879448fcd094a1.gif)
![計算機視覺技術_第2頁](http://file4.renrendoc.com/view/5866bde2d5b6129dacd879448fcd094a/5866bde2d5b6129dacd879448fcd094a2.gif)
![計算機視覺技術_第3頁](http://file4.renrendoc.com/view/5866bde2d5b6129dacd879448fcd094a/5866bde2d5b6129dacd879448fcd094a3.gif)
![計算機視覺技術_第4頁](http://file4.renrendoc.com/view/5866bde2d5b6129dacd879448fcd094a/5866bde2d5b6129dacd879448fcd094a4.gif)
![計算機視覺技術_第5頁](http://file4.renrendoc.com/view/5866bde2d5b6129dacd879448fcd094a/5866bde2d5b6129dacd879448fcd094a5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
計算機視覺技術1.概念計算機視覺(ComputerVision,CV)是一門研究如何讓計算機達到人類那樣“看”的學科。更準確點說,它是利用攝像機和電腦代替人眼使得計算機擁有類似于人類的那種對目標進行分割、分類、識別、跟蹤、判別決策的功能。計算機視覺是使用計算機及相關設備對生物視覺的一種模擬,是人工智能領域的一個重要部分,它的研究目標是使計算機具有通過二維圖像認知三維環(huán)境信息的能力。計算機視覺是以圖像處理技術、信號處理技術、概率統(tǒng)計分析、計算幾何、神經(jīng)網(wǎng)絡、機器學習理論和計算機信息處理技術等為基礎,通過計算機分析與處理視覺信息。幾乎在每個計算機視覺技術的具體應用都要解決一系列相同的問題。這些經(jīng)典的問題包括:識別:一個計算機視覺,圖像處理和機器視覺所共有的經(jīng)典問題便是判定一組圖像數(shù)據(jù)中是否包含某個特定的物體,圖像特征或運動狀態(tài)。這一問題通常可以通過機器自動解決,但是到目前為止,還沒有某個單一的方法能夠廣泛的對各種情況進行判定:在任意環(huán)境中識別任意物體。現(xiàn)有技術能夠也只能夠很好地解決特定目標的識別,比如簡單幾何圖形識別,人臉識別,印刷或手寫文件識別或者車輛識別。而且這些識別需要在特定的環(huán)境中,具有指定的光照,背景和目標姿態(tài)要求。廣義的識別在不同的場合又演化成了幾個略有差異的概念:識別(狹義的):對一個或多個經(jīng)過預先定義或學習的物體或物類進行辨識,通常在辨識過程中還要提供他們的二維位置或三維姿態(tài)。鑒別:識別辨認單一物體本身。例如:某一人臉的識別,某一指紋的識別。監(jiān)測:從圖像中發(fā)現(xiàn)特定的情況內容。例如:醫(yī)學中對細胞或組織不正常技能的發(fā)現(xiàn),交通監(jiān)視儀器對過往車輛的發(fā)現(xiàn)。監(jiān)測往往是通過簡單的圖像處理發(fā)現(xiàn)圖像中的特殊區(qū)域,為后繼更復雜的操作提供起點。識別的幾個具體應用方向:基于內容的圖像提?。涸诰薮蟮膱D像集合中尋找包含指定內容的所有圖片。被指定的內容可以是多種形式,比如一個紅色的大致是圓形的圖案,或者一輛自行車。在這里對后一種內容的尋找顯然要比前一種更復雜,因為前一種描述的是一個低級直觀的視覺特征,而后者則涉及一個抽象概念(也可以說是高級的視覺特征),即‘自行車’,顯然的一點就是自行車的外觀并不是固定的。姿態(tài)評估:對某一物體相對于攝像機的位置或者方向的評估。例如:對機器臂姿態(tài)和位置的評估。光學字符識別對圖像中的印刷或手寫文字進行識別鑒別,通常的輸出是將之轉化成易于編輯的文檔形式。運動:基于序列圖像的對物體運動的監(jiān)測包含多種類型,諸如:自體運動:監(jiān)測攝像機的三維剛性運動。圖像跟蹤:跟蹤運動的物體。場景重建:給定一個場景的二或多幅圖像或者一段錄像,場景重建尋求為該場景建立一個計算機模型/三維模型。最簡單的情況便是生成一組三維空間中的點。更復雜的情況下會建立起完整的三維表面模型。圖像恢復:圖像恢復的目標在于移除圖像中的噪聲,例如儀器噪聲,模糊等。2.原理計算機視覺就是用各種成像系統(tǒng)代替視覺器官作為輸入信號,由計算機來代替人腦來完成、處理和解釋。計算機視覺的最終研究目標就是使計算機能類似人那樣通過視覺觀察和理解世界,具有自主適應環(huán)境的能力。要經(jīng)過長期的努力才能達到的目標。因此,在實現(xiàn)最終目標以前,人們努力的終期目標是建立一種視覺系統(tǒng),這個系統(tǒng)能依據(jù)視覺敏感和反饋的某種程度的智能完成一定的任務。計算機視覺學所研究的對象,簡單地說就是研究如何讓計算機通過圖像傳感器或其它光傳感器來感知、分析和理解周圍環(huán)境。模仿人類的視覺系統(tǒng),計算機視覺系統(tǒng)中信息的處理和分析大致可以分成兩個階段:圖像處理階段又稱視覺處理中的低水平和中水平階段;圖像分析、理解階段又稱視覺處理中的高水平處理階段。計算機視覺系統(tǒng)中,視覺信息的處理技術主要依賴于圖像處理方法,它包括圖像增強、數(shù)據(jù)編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經(jīng)過這些處理后,輸出圖像的質量得到相當程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。在圖像處理階段,計算機對圖像信息進行一系列的加工處理,這主要是:1、 校正成像過程中系統(tǒng)引進的光度學和幾何學的畸變抑制和去除成像過程中引進的噪聲一統(tǒng)稱為圖像的恢復。2、 從圖像信息如亮度分布信息中提取諸如邊沿信息深度信息圖像點沿軸方向的尺度,表面三維傾斜方向信息等反映客觀景物特征的信息。3、 根據(jù)抽取的特征信息把反映三維客體的各個圖像基元,如輪廓、線條、紋理、邊緣、邊界、物體的各個面等從圖像中分離出來,并且建立起各個基元之間的拓撲學上的和幾何學上的關系一稱之基元的分割和關系的確定。在圖像分析和理解階段,計算機根據(jù)事先存貯在數(shù)據(jù)庫中的預知識模型,識別出各個基元或某些基元組合所代表的客觀世界中的某些實體稱之為模型匹配以及根據(jù)圖像中各基元之間的關系在預知識的指導下得出圖像所代表的實際景物的含義,得出圖像的解釋或描述。在圖像分析和理解階段,計算機根據(jù)事先存貯在數(shù)據(jù)庫中的預知識模型,識別出各個基元或某些基元組合所代表的客觀世界中的某些實體稱之為模型匹配以及根據(jù)圖像中各基元之間的關系在預知識的指導下得出圖像所代表的實際景物的含義,得出圖像的解釋或描述。必須強調,預知識在視覺系統(tǒng)中起著相當重要的作用。在預知識庫中存放著各種實際可能遇到的物體的知識模型,和實際景物中各種物體之間的約束關系。計算機的作用是根據(jù)被分析的圖像中的各基元及其關系,利用預知識作為指導,通過匹配、搜索和推理等手段,最終得到對圖像的描述。在整個過程中預知識時刻提供處理的樣板和證據(jù)。每一步的處理結果隨時同預知識進行對比。有時,處理的中間結果和最終結果還要饋送給預知識庫作為知識的更新和積累。計算機視覺也經(jīng)常被稱為圖像理解,是指研究完成一項任務所需的視覺信息及如何從圖像中獲取這些信息的研究領域。其基本目的有三個:1,根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標物體的距離;根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標物體的運動參數(shù);根據(jù)一幅或多幅二維投影圖像計算出觀察點到目標物體的表面物理特性。要達到的最終目的是實現(xiàn)對于三維景物世界的理解,即實現(xiàn)人的視覺系統(tǒng)的某些功能。也就是利用二維投影圖像來重構三維物體的可視部分。3框架模仿人類的視覺系統(tǒng),計算機視覺系統(tǒng)中信息的處理和分析大致可以分成兩個階段:視覺的圖像處理階段又稱視覺處理中的低水平和中水平階段;圖像分析、理解階段又稱視覺處理中的高水平處理階段。圖像獲?。阂环鶖?shù)字圖像是由一個或多個圖像感知器產(chǎn)生,這里的感知器可以是各種光敏攝像機,包括遙感設備,X射線斷層攝影儀,雷達,超聲波接收器等。取決于不同的感知器,產(chǎn)生的圖片可以是普通的二維圖像,三維圖組或者一個圖像序列。圖片的像素值往往對應于光在一個或多個光譜段上的強度(灰度圖或彩色圖),但也可以是相關的各種物理數(shù)據(jù),如聲波,電磁波或核磁共振的深度,吸收度或反射度。預處理:在對圖像實施具體的計算機視覺方法來提取某種特定的信息前,一種或一些預處理往往被采用來使圖像滿足后繼方法的要求。例如:二次取樣保證圖像坐標的正確。平滑去噪來濾除感知器引入的設備噪聲。提高對比度來保證實現(xiàn)相關信息可以被檢測到。調整尺度空間使圖像結構適合局部應用。特征提?。簭膱D像中提取各種復雜度的特征。例如:線,邊緣提取。局部化的特征點檢測如邊角檢測,斑點檢測。更復雜的特征可能與圖像中的紋理形狀或運動有關。檢測/分割:在圖像處理過程中,有時會需要對圖像進行分割來提取有價值的用于后繼處理的部分,例如:篩選特征點。分割一幅或多幅圖片中含有特定目標的部分。高級處理:到了這一步,數(shù)據(jù)往往具有很小的數(shù)量,例如圖像中經(jīng)先前處理被認為含有目標物體的部分。這時的處理包括:驗證得到的數(shù)據(jù)是否符合前提要求。估測特定系數(shù),比如目標的姿態(tài),體積。對目標進行分類。視覺信息的處理技術主要依賴于圖像處理方法,它包括圖像增強、數(shù)據(jù)編碼和傳輸、于圖像處理方法,它包括圖像增強、數(shù)據(jù)編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識別與平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經(jīng)過這些處理后,輸出圖像的質量得到相當程度的改善,既改善了圖像的視覺效果,又便于計算機對圖像進行分析、處理和識別。4.功能功能1:識別鑒別,對一個或多個經(jīng)過預先定義或學習的物體或物類進行辨識,判定一組圖像數(shù)據(jù)中是否包含某個特定的物體,圖像特征或運動狀態(tài)。現(xiàn)有技術能夠也只能夠很好地解決特定目標的識別,比如簡單幾何圖形識別,人臉識別,印刷或手寫文件識別或者車輛識別。而且這些識別需要在特定的環(huán)境中,具有指定的光照,背景和目標姿態(tài)要求。廣義的識別包括以下幾個概念:(狹義的)識別,鑒別,監(jiān)測,圖像提取,姿態(tài)評估等等。功能2:運動,基于視頻的對圖像中運動物體的識別,監(jiān)測,跟蹤,軌跡等。功能3:
場景重建,給定一個場景的二或多幅圖像或者一段錄像,場景重建尋求為該場景建立一個計算機模型/三維模型。功能4:圖像恢復,是通過計算機處理,對質量下降的圖像加以重建或恢復的處理過程。在圖像恢復中,需建立造成圖像質量下降的退化模型,然后運用相反過程來恢復原來圖像,并運用一定準則來判定是否得到圖像的最佳恢復。5.特點特點1:特點特點1:特點2:特點3:非接觸、獲得信息量大、作用距離遠。多樣性與不完善性。提高生產(chǎn)的柔性和自動化程度。在一些不適合于人工作業(yè)的危險工作環(huán)境或人工視覺難以滿足要求的場合,常用機器視覺來替代人工視覺。特點4:可以快
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年雙方貨物代理合同變更文本
- 2025典范燒烤場地租賃合同書
- 2025年個性化輔導機構合同范本
- 2025年傷殘人士求職援助協(xié)議
- 2025年兼職員工競業(yè)限制協(xié)議
- 2025年哈爾濱貨運從業(yè)資格證模擬試題題庫答案
- 2025年專業(yè)范文投資咨詢與服務協(xié)議
- 2025年農(nóng)村簡易住房租賃協(xié)議
- 車輛付款委托協(xié)議
- 2025年古建筑修復工程保護協(xié)議
- 水土保持方案中沉沙池的布設技術
- 安全生產(chǎn)技術規(guī)范 第25部分:城鎮(zhèn)天然氣經(jīng)營企業(yè)DB50-T 867.25-2021
- 現(xiàn)代企業(yè)管理 (全套完整課件)
- 走進本土項目化設計-讀《PBL項目化學習設計》有感
- 《網(wǎng)店運營與管理》整本書電子教案全套教學教案
- 教師信息技術能力提升培訓課件希沃的課件
- 高端公寓住宅項目營銷策劃方案(項目定位 發(fā)展建議)
- 執(zhí)業(yè)獸醫(yī)師聘用協(xié)議(合同)書
- 第1本書出體旅程journeys out of the body精教版2003版
- [英語考試]同等學力英語新大綱全部詞匯
- 2022年肝動脈化療栓塞術(TACE)
評論
0/150
提交評論