第1講-計(jì)算機(jī)視覺總論課件_第1頁
第1講-計(jì)算機(jī)視覺總論課件_第2頁
第1講-計(jì)算機(jī)視覺總論課件_第3頁
第1講-計(jì)算機(jī)視覺總論課件_第4頁
第1講-計(jì)算機(jī)視覺總論課件_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

計(jì)算機(jī)視覺概述計(jì)算機(jī)視覺概述1本節(jié)內(nèi)容人類視覺計(jì)算機(jī)視覺Marr的視覺計(jì)算理論框架視覺系統(tǒng)研究的三個層次視覺信息處理的三個階段計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域計(jì)算機(jī)視覺與圖像處理計(jì)算機(jī)視覺與計(jì)算機(jī)圖形學(xué)計(jì)算機(jī)視覺與模式識別計(jì)算機(jī)視覺與人工智能計(jì)算機(jī)視覺與心理物理學(xué)計(jì)算機(jī)視覺的應(yīng)用本節(jié)內(nèi)容人類視覺2百聞不如一見Onepictureisworthmorethantenthousandwords. 百聞不如一見Onepictureisworthmor3人類視覺視網(wǎng)膜外側(cè)膝狀體視皮層周圍環(huán)境中的物體在可見光的照射下,在人眼的視網(wǎng)膜上形成圖像,由感光細(xì)胞轉(zhuǎn)換成神經(jīng)脈沖信號,經(jīng)神經(jīng)纖維傳入大腦皮層進(jìn)行處理與理解。人類視覺視網(wǎng)膜外側(cè)膝狀體視皮層周圍環(huán)境中的物體在可見光的照射4人類約有75%的信息是通過視覺系統(tǒng)獲取的。視覺是思維的一種最基本的工具人類視覺人類約有75%的信息是通過視覺系統(tǒng)獲取的。人類視覺5計(jì)算機(jī)視覺計(jì)算機(jī)視覺是一門研究如何使機(jī)器“看”的科學(xué),即用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量。用計(jì)算機(jī)實(shí)現(xiàn)對視覺信息處理的全過程計(jì)算機(jī)視覺計(jì)算機(jī)視覺是一門研究如何使機(jī)器“看”的科學(xué),即用攝6計(jì)算機(jī)視覺人類視覺是通過人眼來感知世界的過程

輸入:通過眼睛對世界的觀察

輸出:對世界的感知計(jì)算機(jī)視覺人類視覺是通過人眼來感知世界的過程7計(jì)算機(jī)視覺計(jì)算機(jī)視覺是通過對圖像和視頻的分析處理,實(shí)現(xiàn)類似人類視覺感知能力的過程

輸入:圖像(images)或視頻(video)輸出:對象的恢復(fù)以及對對象信息的使用計(jì)算機(jī)視覺計(jì)算機(jī)視覺是通過對圖像和視頻的分析處理,實(shí)現(xiàn)類似人8本節(jié)內(nèi)容人類視覺計(jì)算機(jī)視覺Marr的視覺計(jì)算理論框架視覺系統(tǒng)研究的三個層次視覺信息處理的三個階段計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域計(jì)算機(jī)視覺與圖像處理計(jì)算機(jī)視覺與計(jì)算機(jī)圖形學(xué)計(jì)算機(jī)視覺與模式識別計(jì)算機(jī)視覺與人工智能計(jì)算機(jī)視覺與心理物理學(xué)計(jì)算機(jī)視覺的應(yīng)用本節(jié)內(nèi)容人類視覺9視覺的計(jì)算理論

——Marr的視覺計(jì)算理論框架DavidMarr(1945-1980)是英國心理學(xué)家。他將心理學(xué)、人工智能和神經(jīng)生理學(xué)的結(jié)果結(jié)合起來,對視覺的研究做出了重要貢獻(xiàn)。他是計(jì)算視覺的奠基人。DavidMarr70年代末在美國MIT提出了第一個較為完善的視覺系統(tǒng)框架此框架盡管存在很多缺陷,但過去20多年一直處于主導(dǎo)地位D.Marr,Vision,1982.中譯本:視覺計(jì)算理論姚國正、劉磊、汪云九譯,科學(xué)出版社,1988。視覺的計(jì)算理論

——Marr的視覺計(jì)算理論框架DavidM10Marr的視覺計(jì)算理論框架

——視覺系統(tǒng)研究的三個層次

Marr的視覺計(jì)算理論框架

——視覺系統(tǒng)研究的三個層次

11一個例子:超市的自動收銀機(jī)(cashregister)1)計(jì)算理論它做的是加法。為什么它做加法而不是乘法?2)表達(dá)與算法

加法的輸入輸出是十進(jìn)制的阿拉伯?dāng)?shù)字。加法的算法是滿十進(jìn)一。3)物理實(shí)現(xiàn)

由電線和晶體管組成的電子設(shè)備。一個例子:超市的自動收銀機(jī)(cashregister)1)12Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段低層視覺(Low-levelvision)

構(gòu)成所謂的“要素圖”(primarysketch),包含一些基本的圖像特征(角點(diǎn)、邊緣、線條、邊界、色彩、紋理等)Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段低層視13Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段低層視覺(Low-levelvision)

構(gòu)成所謂的“要素圖”(primarysketch),包含一些基本的圖像特征(角點(diǎn)、邊緣、線條、邊界、色彩、紋理等)Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段低層視14Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段低層視覺(Low-levelvision)

構(gòu)成所謂的“要素圖”(primarysketch),包含一些基本的圖像特征(角點(diǎn)、邊緣、線條、邊界、色彩、紋理等)Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段低層視15Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段中層視覺(Intermediate-levelvision)構(gòu)成對環(huán)境的2.5維描述,即部分的、不完整的三維信息描述(恢復(fù)場景可見部分的深度、法線方向、輪廓等,包含了深度信息,但不是真正的物體三維表示。)Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段中層視16Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段中層視覺(Intermediate-levelvision)構(gòu)成對環(huán)境的2.5維描述,即部分的、不完整的三維信息描述(恢復(fù)場景可見部分的深度、法線方向、輪廓等,包含了深度信息,但不是真正的物體三維表示。)Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段中層視17Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段中層視覺(Intermediate-levelvision)構(gòu)成對環(huán)境的2.5維描述,即部分的、不完整的三維信息描述(恢復(fù)場景可見部分的深度、法線方向、輪廓等,包含了深度信息,但不是真正的物體三維表示。)Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段中層視18Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段高層視覺(High-levelvision)

從2.5維描述得到完整的三維描述(恢復(fù)、表示和識別三維物體)Marr的視覺計(jì)算理論框架

——視覺信息處理的三個階段高層視19Marr模型的缺點(diǎn):假定視覺系統(tǒng)是被動的,給什么圖像就處理什么缺乏或者未足夠重視高層知識的指導(dǎo)作用由局部信息到整體信息的單向過程,沒有反饋Marr框架的計(jì)算機(jī)視覺三階段Marr模型的缺點(diǎn):Marr框架的計(jì)算機(jī)視覺三階段20本節(jié)內(nèi)容人類視覺計(jì)算機(jī)視覺Marr的視覺計(jì)算理論框架視覺系統(tǒng)研究的三個層次視覺信息處理的三個階段計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域計(jì)算機(jī)視覺與圖像處理計(jì)算機(jī)視覺與計(jì)算機(jī)圖形學(xué)計(jì)算機(jī)視覺與模式識別計(jì)算機(jī)視覺與人工智能計(jì)算機(jī)視覺與心理物理學(xué)計(jì)算機(jī)視覺的應(yīng)用本節(jié)內(nèi)容人類視覺21圖像處理(ImageProcessing):實(shí)現(xiàn)從輸入圖像到另一種圖像的轉(zhuǎn)換(把輸入圖像轉(zhuǎn)換成具有所希望特性的另一幅圖象)。圖像去噪計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與圖像處理圖像處理(ImageProcessing):實(shí)現(xiàn)從輸入圖像22計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與圖像處理圖像增強(qiáng)圖像處理(ImageProcessing):實(shí)現(xiàn)從輸入圖像到另一種圖像的轉(zhuǎn)換(把輸入圖像轉(zhuǎn)換成具有所希望特性的另一幅圖象)。計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與圖像處理圖像增強(qiáng)圖23計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與圖像處理圖像修復(fù)圖像處理(ImageProcessing):實(shí)現(xiàn)從輸入圖像到另一種圖像的轉(zhuǎn)換(把輸入圖像轉(zhuǎn)換成具有所希望特性的另一幅圖象)。計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與圖像處理圖像修復(fù)圖24計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與圖像處理圖像去模糊圖像處理(ImageProcessing):實(shí)現(xiàn)從輸入圖像到另一種圖像的轉(zhuǎn)換(把輸入圖像轉(zhuǎn)換成具有所希望特性的另一幅圖象)。計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與圖像處理圖像去模糊25圖像中多余物體的去除計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與圖像處理圖像處理(ImageProcessing):實(shí)現(xiàn)從輸入圖像到另一種圖像的轉(zhuǎn)換(把輸入圖像轉(zhuǎn)換成具有所希望特性的另一幅圖象)。圖像中多余物體的去除計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視26圖像處理(ImageProcessing):實(shí)現(xiàn)從輸入圖像到另一種圖像的轉(zhuǎn)換(把輸入圖像轉(zhuǎn)換成具有所希望特性的另一幅圖象)。圖像處理:人是最終的解釋者計(jì)算機(jī)視覺:計(jì)算機(jī)是圖像的解釋者計(jì)算機(jī)視覺系統(tǒng)需要圖像處理模塊(利用圖像處理技術(shù)進(jìn)行預(yù)處理和特征抽?。┯?jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與圖像處理圖像處理(ImageProcessing):實(shí)現(xiàn)從輸入圖像27計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與計(jì)算機(jī)圖形學(xué)計(jì)算機(jī)圖形學(xué)(ComputerGraphics):從三維描述到二維圖像顯示。(給定關(guān)于景象結(jié)構(gòu)、表面反射特性、光源配置及相機(jī)模型的信息,生成圖像。

)計(jì)算機(jī)視覺:從二維圖像數(shù)據(jù)到三維描述。(給定圖象,推斷景象特性實(shí)現(xiàn)的是從模型到圖像的變換,也就是說從圖象數(shù)據(jù)提取信息,包括景象的三維結(jié)構(gòu),運(yùn)動檢測,識別物體等。)在一定意義上講,計(jì)算機(jī)視覺是計(jì)算機(jī)圖形學(xué)的逆問題兩者從最初相互獨(dú)立的平行發(fā)展到最近的融合是一大趨勢計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與計(jì)算機(jī)圖形學(xué)計(jì)算機(jī)28計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與模式識別模式識別(PatternRecognition):研究各類模式的分類,其中模式可以有不同的物理意義和表現(xiàn)形式。例如,文字識別或指紋識別。字符識別計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與模式識別模式識別(29計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與模式識別模式識別(PatternRecognition):研究各類模式的分類,其中模式可以有不同的物理意義和表現(xiàn)形式。例如,文字識別或指紋識別。計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與模式識別模式識別(30計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與模式識別圖像模式的分類是計(jì)算機(jī)視覺中的一個重要問題模式識別中的許多方法可以應(yīng)用于計(jì)算機(jī)視覺中在計(jì)算機(jī)視覺中模式識別技術(shù)經(jīng)常用于對圖象中的某些部分(例如分割區(qū)域)的識別和分類。模式識別(PatternRecognition):研究各類模式的分類,其中模式可以有不同的物理意義和表現(xiàn)形式。例如,文字識別或指紋識別。計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與模式識別圖像模式的31計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與人工智能人工智能(Artificialintelligence):主要研究智能系統(tǒng)的設(shè)計(jì)和有關(guān)智能的計(jì)算理論與方法AImaybeconsideredashavingthreestages:perception,cognitionandaction計(jì)算機(jī)視覺經(jīng)常被視為AI的一個分支計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與人工智能人工智能(32計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與心理物理學(xué)心理物理學(xué)(Psychophysics):主要研究人類自身視覺系統(tǒng)的有關(guān)機(jī)理與現(xiàn)象計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與心理物理學(xué)心理物理33閃爍的藍(lán)點(diǎn)在你移動視線時,圖中的藍(lán)點(diǎn)似乎在閃爍。但如果盯住一個點(diǎn),這種發(fā)光便消失蹤影。德國阿倫驗(yàn)光研究所在1994年發(fā)現(xiàn)的閃爍網(wǎng)格錯覺現(xiàn)象“藍(lán)寶石之光”閃爍的藍(lán)點(diǎn)在你移動視線時,圖中的藍(lán)點(diǎn)似乎在閃爍。但如果盯住一34第1講-計(jì)算機(jī)視覺總論ppt課件35第1講-計(jì)算機(jī)視覺總論ppt課件36懷特效應(yīng)——1979年,塔斯馬尼亞高級教育學(xué)院的邁克爾·懷特發(fā)現(xiàn)了一種錯覺現(xiàn)象,徹底改變了視覺學(xué)的面貌。如圖所示,左側(cè)的灰條亮度超過右側(cè)灰條。而實(shí)際上,所有灰條都是一樣的。在懷特發(fā)現(xiàn)這種現(xiàn)象前,所有亮度錯覺均被認(rèn)為由拮抗過程所致,也就是說,灰色物體在被白色物體包圍時看上去更為暗淡,被黑色物體包圍時則顯得更為明亮。但在這幅錯覺圖中,被白色包圍的灰條亮度更高,被黑色包圍時則更為暗淡。迄今為止,懷特效應(yīng)背后的大腦機(jī)制仍舊是一個未知數(shù)。懷特效應(yīng)——1979年,塔斯馬尼亞高級教育學(xué)院的邁克爾·懷特37年度最佳錯覺圖結(jié)合了懷特效應(yīng)(窗簾后面的花瓶似乎呈現(xiàn)出不同的顏色)和著名的面部-花瓶錯覺(花瓶被換成獲勝者的獎杯)構(gòu)成。懷特效應(yīng)---眼見未必為實(shí)年度最佳錯覺圖結(jié)合了懷特效應(yīng)(窗簾后面的花瓶似乎呈現(xiàn)出不同的38第1講-計(jì)算機(jī)視覺總論ppt課件39視覺錯位本身就是攝影的一種藝術(shù)和創(chuàng)作視覺錯位本身就是攝影的一種藝術(shù)和創(chuàng)作40計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與心理物理學(xué)心理物理學(xué)(Psychophysics):主要研究人類自身視覺系統(tǒng)的有關(guān)機(jī)理與現(xiàn)象心理物理學(xué)的研究結(jié)果往往被用來作為建立計(jì)算機(jī)視覺模型的理論根據(jù)計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域

——計(jì)算機(jī)視覺與心理物理學(xué)心理物理41本節(jié)內(nèi)容人類視覺計(jì)算機(jī)視覺Marr的視覺計(jì)算理論框架視覺系統(tǒng)研究的三個層次視覺信息處理的三個階段計(jì)算機(jī)視覺與相關(guān)研究領(lǐng)域計(jì)算機(jī)視覺與圖像處理計(jì)算機(jī)視覺與計(jì)算機(jī)圖形學(xué)計(jì)算機(jī)視覺與模式識別計(jì)算機(jī)視覺與人工智能計(jì)算機(jī)視覺與心理物理學(xué)計(jì)算機(jī)視覺的應(yīng)用本節(jié)內(nèi)容人類視覺42計(jì)算機(jī)視覺的應(yīng)用

零件識別與定位產(chǎn)品檢驗(yàn)移動機(jī)器人導(dǎo)航遙感圖像分析醫(yī)學(xué)圖像分析安全、監(jiān)控與跟蹤國防系統(tǒng)其它(動畫、體育、考古)計(jì)算機(jī)視覺的應(yīng)用零件識別與定位43空間探索空間探索44Sojourner火星車前部圖,中部的兩個小突出是兩個黑白CCD攝像機(jī)Sojourner火星車前部圖,中部的兩個小突出是兩個黑白45So

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論