計(jì)算機(jī)視覺(jué)發(fā)展史課件

上傳人：愛(ài)*** IP屬地：貴州上傳時(shí)間：2022-12-22 格式：PPT 頁(yè)數(shù)：80 大小：1.38MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩75頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

22十二月20221參考教材：賈云得《機(jī)器視覺(jué)》科學(xué)出版社，2000參考書(shū)目：1、《圖像處理、分析與機(jī)器視覺(jué)》（第二版）

M.Sonka,V.Hlavac,R.Boyle著，艾海舟等譯，人民郵電出版社，20032、《機(jī)器視覺(jué)教程》W.E.Snyder,H.Qi著林學(xué)訚等譯，機(jī)械工業(yè)出版社，20053、《計(jì)算機(jī)視覺(jué)》馬頌德著，科學(xué)出版社，1999課程教材19十二月20221參考教材：賈云得《機(jī)器視覺(jué)》科學(xué)122十二月202221.引言

智能機(jī)器:能模擬人類(lèi)的功能，能感知外部世界并有效地解決人所能解決問(wèn)題．感知系統(tǒng)：人類(lèi)感知外部世界主要是通過(guò)視覺(jué)、觸覺(jué)、聽(tīng)覺(jué)和嗅覺(jué)等感覺(jué)器官，其中約80%的信息是由視覺(jué)獲取的．因此,對(duì)于智能機(jī)器來(lái)說(shuō)，賦予機(jī)器以人類(lèi)視覺(jué)功能對(duì)發(fā)展智能機(jī)器是及其重要的，也由此形成了一門(mén)新的學(xué)科—計(jì)算機(jī)視覺(jué)(也稱(chēng)機(jī)器視覺(jué)或圖像分析與理解等)．計(jì)算機(jī)視覺(jué)的發(fā)展不僅將大大推動(dòng)智能系統(tǒng)的發(fā)展，也將拓寬計(jì)算機(jī)與各種智能機(jī)器的研究范圍和應(yīng)用領(lǐng)域．

計(jì)算機(jī)視覺(jué)：研究用計(jì)算機(jī)來(lái)模擬生物視覺(jué)功能的科學(xué)和技術(shù)．計(jì)算機(jī)視覺(jué)系統(tǒng)的首要目標(biāo)是用圖像創(chuàng)建或恢復(fù)現(xiàn)實(shí)世界模型，然后認(rèn)知現(xiàn)實(shí)世界．19十二月202221.引言智能機(jī)器:能模擬人類(lèi)的222十二月20223

20世紀(jì)50年代歸入模式識(shí)別----主要集中在二維圖像分析和識(shí)別上，如，光學(xué)字符識(shí)別，工件表面、顯微圖片和航空?qǐng)D片的分析和解釋等．60年代MIT的Roberts通過(guò)計(jì)算機(jī)程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu)，并對(duì)物體形狀及物體的空間關(guān)系進(jìn)行描述．Roberts的研究工作開(kāi)創(chuàng)了以理解三維場(chǎng)景為目的的三維計(jì)算機(jī)視覺(jué)的研究．Roberts對(duì)積木世界的創(chuàng)造性研究給人們以極大的啟發(fā)，許多人相信，一旦由白色積木玩具組成的三維世界可以被理解，則可以推廣到理解更復(fù)雜的三維場(chǎng)景．70年代，已經(jīng)出現(xiàn)了一些視覺(jué)應(yīng)用系統(tǒng)．70年代中期，麻省理工學(xué)院(MIT)人工智能(AI)實(shí)驗(yàn)室正式開(kāi)設(shè)“計(jì)算機(jī)視覺(jué)”(

MachineVision)課程，由B．K．P．Horn教授講授．2.計(jì)算機(jī)視覺(jué)發(fā)展19十二月2022320世紀(jì)50年代歸入模式識(shí)別---322十二月20224MITAI實(shí)驗(yàn)室吸引了國(guó)際上許多知名學(xué)者參與計(jì)算機(jī)視覺(jué)的理論、算法、系統(tǒng)設(shè)計(jì)的研究，DavidMarr教授就是其中的一位．他于1973年應(yīng)邀在MITAI實(shí)驗(yàn)室領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組，1977年提出了不同于“積木世界”分析方法的計(jì)算視覺(jué)理論(computationalvision)，該理論在80年代成為計(jì)算機(jī)視覺(jué)研究領(lǐng)域中的一個(gè)十分重要的理論框架．19十二月20224MITAI實(shí)驗(yàn)室吸引了國(guó)際上許多422十二月20225研究熱潮是從20世紀(jì)80年代開(kāi)始的，到了80年代中期，計(jì)算機(jī)視覺(jué)獲得了蓬勃發(fā)展，新概念、新方法、新理論不斷涌現(xiàn)，比如，基于感知特征群的物體識(shí)別理論框架，主動(dòng)視覺(jué)理論框架，視覺(jué)集成理論框架等．Marr的計(jì)算理論19十二月20225研究熱潮是從20世紀(jì)80年代開(kāi)始的522十二月20226許多會(huì)議論文集都反應(yīng)了該領(lǐng)域的最新進(jìn)展，比如：Int.Conf.onComputerVisionandPatternRecognition(CVPR);Int.Conf.onComputerVision(ICCV);Int.Conf.onPatternRecognition(ICPR);Int.Conf.onRoboticsandAutomation(ICRA);WorkshoponComputerVision,SPIE．還有許多學(xué)術(shù)期刊也包含了這一領(lǐng)域的最新研究成果,如：IEEETrans.onPatternAnalysisandMachineIntelligence(PAMI);ComputerVision,Graphics,andImageProcessing(CVGIP);IEEETrans.onImageProcessing;IEEETrans.onSystems,Man,andCybernetics(SMC);MachineVisionandApplications;Int.JonComputerVision(IJCV);ImageandVisionComputing;PatternRecognition．19十二月20226許多會(huì)議論文集都反應(yīng)了該領(lǐng)域的最新進(jìn)622十二月202273.Marr的視覺(jué)計(jì)算理論Marr的視覺(jué)計(jì)算理論[Marr1982]立足于計(jì)算機(jī)科學(xué)，系統(tǒng)地概括了心理生理學(xué)、神經(jīng)生理學(xué)等方面取得的所有重要成果，是視覺(jué)研究中迄今為止最為完善的視覺(jué)理論．Marr建立的視覺(jué)計(jì)算理論，使計(jì)算機(jī)視覺(jué)研究有了一個(gè)比較明確的體系，并大大推動(dòng)了計(jì)算機(jī)視覺(jué)研究的發(fā)展．人們普遍認(rèn)為，計(jì)算機(jī)視覺(jué)這門(mén)學(xué)科的形成與Marr的視覺(jué)理論有著密切的關(guān)系．19十二月202273.Marr的視覺(jué)計(jì)算理論Marr722十二月202283.1信息處理三個(gè)層次19十二月202283.1信息處理三個(gè)層次822十二月202293.2視覺(jué)表示框架第一階段(也稱(chēng)為早期階段)是將輸入的原始圖像進(jìn)行處理，抽取圖像中諸如角點(diǎn)、邊緣、紋理、線(xiàn)條、邊界等基本特征，這些特征的集合稱(chēng)為基元圖(primitivesketch)；第二階段(中期階段)是指在以觀測(cè)者為中心的坐標(biāo)系中，由輸入圖像和基元圖恢復(fù)場(chǎng)景可見(jiàn)部分的深度、法線(xiàn)方向、輪廓等，這些信息的包含了深度信息，但不是真正的物體三維表示，因此，稱(chēng)為二維半圖(2．5dimensionalsketch)；第三階段(后期階段)是在以物體為中心的坐標(biāo)系中，由輸入圖像、基元圖、二維半圖來(lái)恢復(fù)、表示和識(shí)別三維物體。19十二月202293.2視覺(jué)表示框架第一階段(也稱(chēng)為922十二月202210表1-2由圖像恢復(fù)形狀信息的表示框架19十二月202210表1-2由圖像恢復(fù)形狀信息的表1022十二月202211Marr理論是計(jì)算機(jī)視覺(jué)研究領(lǐng)域的劃時(shí)代成就，但該理論不是十分完善的，許多方面還有爭(zhēng)議．比如:

視覺(jué)處理框架基本上是自下而上，沒(méi)有反饋;

沒(méi)有足夠地重視知識(shí)的應(yīng)用．Marr理論給了我們研究計(jì)算機(jī)視覺(jué)許多珍貴的哲學(xué)思想和研究方法，同時(shí)也給計(jì)算機(jī)視覺(jué)研究領(lǐng)域創(chuàng)造了許多研究起點(diǎn)。3.3Marr視覺(jué)理論的不足19十二月202211Marr理論是計(jì)算機(jī)視覺(jué)研究領(lǐng)域的1122十二月20221219十二月2022121222十二月2022134.計(jì)算機(jī)視覺(jué)的應(yīng)用

零件識(shí)別與定位（工業(yè)生產(chǎn)線(xiàn)）產(chǎn)品檢驗(yàn)（紡織工業(yè)棉花質(zhì)量檢驗(yàn)）移動(dòng)機(jī)器人導(dǎo)航（星球機(jī)器人）遙感圖像分析（植被分析）醫(yī)學(xué)圖像分析（骨骼定位）安全鑒別、監(jiān)視與跟蹤（門(mén)禁系統(tǒng)）國(guó)防系統(tǒng)（目標(biāo)自動(dòng)識(shí)別ATR與目標(biāo)跟蹤）其它（動(dòng)畫(huà)、體育、考古）19十二月2022134.計(jì)算機(jī)視覺(jué)的應(yīng)用零件識(shí)別1322十二月202214Sojourner火星車(chē)前部圖，中部的兩個(gè)小突出是兩個(gè)黑白CCD攝像機(jī)19十二月202214Sojourner火星車(chē)前部圖，1422十二月20221519十二月2022151522十二月202216Rocky7火星機(jī)器人19十二月202216Rocky7火星機(jī)器人1622十二月20221719十二月2022171722十二月202218

Rocky7視覺(jué)系統(tǒng)獲取的立體圖象對(duì)障礙物探測(cè)示意圖Rocky7視覺(jué)系統(tǒng)對(duì)場(chǎng)景的深度恢復(fù)

19十二月202218Rocky7視覺(jué)系統(tǒng)獲取的立體圖1822十二月202219CMU月球探測(cè)實(shí)驗(yàn)車(chē)Nomad漫游者19十二月202219CMU月球探測(cè)實(shí)驗(yàn)車(chē)Nomad漫游1922十二月202220月球探測(cè)實(shí)驗(yàn)車(chē)Nomad漫游者19十二月202220月球探測(cè)實(shí)驗(yàn)車(chē)Nomad漫游者2022十二月202221昆蟲(chóng)機(jī)器人足球機(jī)器人足球機(jī)器人19十二月202221昆蟲(chóng)機(jī)器人足球機(jī)器人足球機(jī)器人2122十二月202222日本

Honda

仿人機(jī)器人19十二月202222日本Honda仿人機(jī)器2222十二月202223具有立體視覺(jué)的機(jī)器人19十二月202223具有立體視覺(jué)的機(jī)器人2322十二月202224人頭部跟蹤演示19十二月202224人頭部跟蹤演示2422十二月202225MITMediaLab，與虛擬生物交互演示19十二月202225MITMediaLab，與2522十二月202226基于恢復(fù)圖象序列的五角大樓三維重建19十二月202226基于恢復(fù)圖象序列的五角大樓三維重建2622十二月202227基于圖象序列的三維人臉恢復(fù)19十二月202227基于圖象序列的三維人臉恢復(fù)2722十二月202228視覺(jué)系統(tǒng)坐標(biāo)系像素坐標(biāo)：表示圖像陣列中圖像像素的位置；圖像平面坐標(biāo)：表示場(chǎng)景點(diǎn)在圖像平面上的投影；攝象機(jī)坐標(biāo)：即以觀察者為中心的坐標(biāo)，將場(chǎng)景點(diǎn)表示成以觀察者為中心的數(shù)據(jù)形式．場(chǎng)景坐標(biāo)：也稱(chēng)作絕對(duì)坐標(biāo)(或世界坐標(biāo))，用于表示場(chǎng)景點(diǎn)的絕對(duì)坐標(biāo)；19十二月202228視覺(jué)系統(tǒng)坐標(biāo)系像素坐標(biāo)：表示圖像陣2822十二月2022295.計(jì)算機(jī)視覺(jué)的研究?jī)?nèi)容一、輸入設(shè)備(inputdevice)包括成像設(shè)備和數(shù)字化設(shè)備．成象設(shè)備是指通過(guò)光學(xué)攝像機(jī)或紅外、激光、超聲、X射線(xiàn)對(duì)周?chē)鷪?chǎng)景或物體進(jìn)行探測(cè)成象，得到關(guān)于場(chǎng)景或物體的二維或三維數(shù)字化圖像．二、低層視覺(jué)(lowlevel)主要是對(duì)輸入的原始圖像進(jìn)行處理．這一過(guò)程借用了大量的圖像處理技術(shù)和算法，如圖像濾波、圖像增強(qiáng)、邊緣檢測(cè)等，以便從圖像中抽取諸如角點(diǎn)、邊緣、線(xiàn)條、邊界以及色彩等關(guān)于場(chǎng)景的基本特征；這一過(guò)程還包含了各種圖像變換（如校正）、圖像紋理檢測(cè)、圖像運(yùn)動(dòng)檢測(cè)等．19十二月2022295.計(jì)算機(jī)視覺(jué)的研究?jī)?nèi)容一、輸2922十二月202230三、中層視覺(jué)（middlelevel）主要任務(wù)是恢復(fù)場(chǎng)景的深度、表面法線(xiàn)方向、輪廓等有關(guān)場(chǎng)景的2．5維信息，實(shí)現(xiàn)的途徑有立體視覺(jué)（stereovision）、測(cè)距成像（rangefinder）運(yùn)動(dòng)估計(jì)（motionestimation）、明暗特征、紋理特征等.系統(tǒng)標(biāo)定、系統(tǒng)成像模型等研究?jī)?nèi)容一般也是在這個(gè)層次上進(jìn)行的．四、高層視覺(jué)（highlevel）主要任務(wù)是在以物體為中心的坐標(biāo)系中，在原始輸入圖像、圖像基本特征、2．5維圖的基礎(chǔ)上，恢復(fù)物體的完整三維圖，建立物體三維描述，識(shí)別三維物體并確定物體的位置和方向．19十二月202230三、中層視覺(jué)（middlelev3022十二月2022316.計(jì)算機(jī)視覺(jué)研究面臨的困難（1）圖像多義性：三維場(chǎng)景被投影為二維圖像，深度和不可見(jiàn)部分的信息被丟失，因而會(huì)出現(xiàn)不同形狀的三維物體投影在圖像平面上產(chǎn)生相同圖像的問(wèn)題．另外，在不同角度獲取同一物體的圖像會(huì)有很大的差異．（2）環(huán)境因素影響：場(chǎng)景中的諸多因素，包括照明、物體形狀、表面顏色、攝像機(jī)以及空間關(guān)系變化都會(huì)對(duì)成像有影響，（3）知識(shí)導(dǎo)引：同樣的圖像在不同的知識(shí)導(dǎo)引下，將會(huì)產(chǎn)生不同的識(shí)別結(jié)果．．（4）大量數(shù)據(jù)：灰度圖像，彩色圖像，深度圖像的信息量十分巨大，巨大的數(shù)據(jù)量需要很大的存貯空間，同時(shí)不易實(shí)現(xiàn)快速處理．19十二月2022316.計(jì)算機(jī)視覺(jué)研究面臨的困難（13122十二月2022327.計(jì)算機(jī)視覺(jué)與其它學(xué)科領(lǐng)域的關(guān)系（1）圖像處理：圖像處理通常是把一幅圖像變換成另外一幅圖像，也就是說(shuō)，圖像處理系統(tǒng)的輸入是圖像，輸出仍然是圖像，信息恢復(fù)任務(wù)則留給人來(lái)完成（2）計(jì)算機(jī)圖形學(xué)：通過(guò)幾何基元，如線(xiàn)、圓和自由曲面，來(lái)生成圖像，它在可視化（Visualization）和虛擬現(xiàn)實(shí)(VirtualReality）中起著很重要的作用．計(jì)算機(jī)視覺(jué)正好是解決相反的問(wèn)題，即從圖像中估計(jì)幾何基元和其它特征．因此，計(jì)算機(jī)圖形學(xué)屬于圖像綜合，計(jì)算機(jī)視覺(jué)屬于圖像分析．（3）模式識(shí)別：用于識(shí)別各種符號(hào)、圖畫(huà)等平面圖形．模式一般指一類(lèi)事物區(qū)別于其它事物所具有的共同特征。模式識(shí)別方法有統(tǒng)計(jì)方法和句法方法兩種，統(tǒng)計(jì)方法是指從模式抽取一組特征值，并以劃分特征空間的方法來(lái)識(shí)別每一個(gè)模式19十二月2022327.計(jì)算機(jī)視覺(jué)與其它學(xué)科領(lǐng)域的關(guān)3222十二月202233（4）人工智能（AI）：涉及到智能系統(tǒng)的設(shè)計(jì)和智能計(jì)算的研究．在經(jīng)過(guò)圖像處理和圖像特征提取過(guò)程后，接下來(lái)要用人工智能方法對(duì)場(chǎng)景特征進(jìn)行表示，并分析和理解場(chǎng)景．人工智能有三個(gè)過(guò)程：感知、認(rèn)知和行動(dòng)．．（5）人工神經(jīng)網(wǎng)絡(luò)（ANNs）：是一種信息處理系統(tǒng)，它是由大量簡(jiǎn)單的處理單元（稱(chēng)為神經(jīng)元）通過(guò)具有強(qiáng)度的連接相互聯(lián)系起來(lái)，實(shí)現(xiàn)并行分布式處理（PDP）．人工神經(jīng)網(wǎng)絡(luò)的最大特點(diǎn)是可以通過(guò)改變連接強(qiáng)度來(lái)調(diào)整系統(tǒng)，使之適應(yīng)復(fù)雜的環(huán)境，實(shí)現(xiàn)類(lèi)似人的學(xué)習(xí)、歸納和分類(lèi)等功能．（6）神經(jīng)物理學(xué)與認(rèn)知科學(xué)：將人類(lèi)視覺(jué)作為主要的研究對(duì)象．計(jì)算機(jī)視覺(jué)中已有的許多方法與人類(lèi)視覺(jué)極為相似．許多計(jì)算機(jī)視覺(jué)研究者對(duì)研究人類(lèi)視覺(jué)計(jì)算模型比研究計(jì)算機(jī)視覺(jué)系統(tǒng)更感興趣，希望計(jì)算機(jī)視覺(jué)更加自然化，更加接近生物視覺(jué)19十二月202233（4）人工智能（AI）：涉及到智能3322十二月2022348.計(jì)算機(jī)視覺(jué)研究對(duì)策

研究人員不斷尋求新的途徑和手段，比如，主動(dòng)視覺(jué)(activevision)，面向任務(wù)的視覺(jué)(task-orientedvision)，基于知識(shí)、基于模型的視覺(jué)，以及多傳感融合和集成視覺(jué)等方法，其中人們?cè)絹?lái)越重視對(duì)知識(shí)的應(yīng)用．我們會(huì)看到，計(jì)算機(jī)視覺(jué)系統(tǒng)的最大特征是，在視覺(jué)的各個(gè)階段，系統(tǒng)盡可能地進(jìn)行自動(dòng)運(yùn)算．為此，系統(tǒng)需要使用各種知識(shí)，包括特征模型、成像過(guò)程、物體模型和物體間的關(guān)系．如果計(jì)算機(jī)視覺(jué)系統(tǒng)不用這些知識(shí)，則其應(yīng)用的范圍及其功能將十分有限．因此，視覺(jué)系統(tǒng)應(yīng)該使用那些可以被明確表示的知識(shí)，以使系統(tǒng)具有更高的適應(yīng)性和魯棒性．合理地使用知識(shí)不僅可以有效地提高系統(tǒng)的適應(yīng)性和魯棒性，而且可以求解計(jì)算機(jī)視覺(jué)中較難的問(wèn)題．19十二月2022348.計(jì)算機(jī)視覺(jué)研究對(duì)策3422十二月2022351．基于視覺(jué)感知與認(rèn)知機(jī)理的圖像分析與識(shí)別系統(tǒng)研究目標(biāo)：突破基于人類(lèi)視覺(jué)感知與認(rèn)知機(jī)理的圖像處理模型、關(guān)鍵技術(shù)和算法，建立個(gè)性化、高準(zhǔn)確度的圖像分析與識(shí)別系統(tǒng)。研究?jī)?nèi)容：分層交互的統(tǒng)計(jì)視覺(jué)計(jì)算模型與推理，基于感知整合機(jī)制的視覺(jué)模式識(shí)別技術(shù)，具有選擇性注意機(jī)制的視覺(jué)信息搜索與多目標(biāo)跟蹤模型。863計(jì)劃信息技術(shù)領(lǐng)域2006年度專(zhuān)題課題申請(qǐng)指南目標(biāo)導(dǎo)向類(lèi)課題：19十二月2022351．基于視覺(jué)感知與認(rèn)知機(jī)理的圖像分3522十二月2022362．復(fù)雜應(yīng)用環(huán)境下的生物特征識(shí)別系統(tǒng)研究目標(biāo)：突破安全便捷的、高可靠性的多生物特征獲取及識(shí)別算法，建立面向典型應(yīng)用的生物特征識(shí)別與認(rèn)證原型系統(tǒng)。研究?jī)?nèi)容：臉相、虹膜、掌紋等多生物特征獲取技術(shù)，大規(guī)模生物特征庫(kù)的分類(lèi)和檢索，具有魯棒性的生物特征識(shí)別關(guān)鍵技術(shù)，面向?qū)嶋H應(yīng)用需求的多種生物特征的融合技術(shù)等。863計(jì)劃信息技術(shù)領(lǐng)域2006年度專(zhuān)題課題申請(qǐng)指南目標(biāo)導(dǎo)向類(lèi)課題：19十二月202236863計(jì)劃信息技術(shù)領(lǐng)域2006年度3622十二月202237圖1．6透視投影倒立成像幾何示意圖透視投影19十二月202237圖1．6透視投影倒立成像幾何示3722十二月202238圖1．7透視投影幾何示意圖

19十二月202238圖1．7透視投影幾何示意圖3822十二月202239圖1．8正交投影幾何示意圖正交投影19十二月202239圖1．8正交投影幾何示意圖正3922十二月202240視覺(jué)系統(tǒng)坐標(biāo)系像素坐標(biāo)：表示圖像陣列中圖像像素的位置；圖像平面坐標(biāo)：表示場(chǎng)景點(diǎn)在圖像平面上的投影；攝象機(jī)坐標(biāo)：即以觀察者為中心的坐標(biāo)，將場(chǎng)景點(diǎn)表示成以觀察者為中心的數(shù)據(jù)形式．場(chǎng)景坐標(biāo)：也稱(chēng)作絕對(duì)坐標(biāo)(或世界坐標(biāo))，用于表示場(chǎng)景點(diǎn)的絕對(duì)坐標(biāo)；19十二月202240視覺(jué)系統(tǒng)坐標(biāo)系像素坐標(biāo)：表示圖像陣4022十二月202241參考教材：賈云得《機(jī)器視覺(jué)》科學(xué)出版社，2000參考書(shū)目：1、《圖像處理、分析與機(jī)器視覺(jué)》（第二版）

MachineVision)課程，由B．K．P．Horn教授講授．2.計(jì)算機(jī)視覺(jué)發(fā)展19十二月2022320世紀(jì)50年代歸入模式識(shí)別---4322十二月202244MITAI實(shí)驗(yàn)室吸引了國(guó)際上許多知名學(xué)者參與計(jì)算機(jī)視覺(jué)的理論、算法、系統(tǒng)設(shè)計(jì)的研究，DavidMarr教授就是其中的一位．他于1973年應(yīng)邀在MITAI實(shí)驗(yàn)室領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組，1977年提出了不同于“積木世界”分析方法的計(jì)算視覺(jué)理論(computationalvision)，該理論在80年代成為計(jì)算機(jī)視覺(jué)研究領(lǐng)域中的一個(gè)十分重要的理論框架．19十二月20224MITAI實(shí)驗(yàn)室吸引了國(guó)際上許多4422十二月202245研究熱潮是從20世紀(jì)80年代開(kāi)始的，到了80年代中期，計(jì)算機(jī)視覺(jué)獲得了蓬勃發(fā)展，新概念、新方法、新理論不斷涌現(xiàn)，比如，基于感知特征群的物體識(shí)別理論框架，主動(dòng)視覺(jué)理論框架，視覺(jué)集成理論框架等．Marr的計(jì)算理論19十二月20225研究熱潮是從20世紀(jì)80年代開(kāi)始的4522十二月202246許多會(huì)議論文集都反應(yīng)了該領(lǐng)域的最新進(jìn)展，比如：Int.Conf.onComputerVisionandPatternRecognition(CVPR);Int.Conf.onComputerVision(ICCV);Int.Conf.onPatternRecognition(ICPR);Int.Conf.onRoboticsandAutomation(ICRA);WorkshoponComputerVision,SPIE．還有許多學(xué)術(shù)期刊也包含了這一領(lǐng)域的最新研究成果,如：IEEETrans.onPatternAnalysisandMachineIntelligence(PAMI);ComputerVision,Graphics,andImageProcessing(CVGIP);IEEETrans.onImageProcessing;IEEETrans.onSystems,Man,andCybernetics(SMC);MachineVisionandApplications;Int.JonComputerVision(IJCV);ImageandVisionComputing;PatternRecognition．19十二月20226許多會(huì)議論文集都反應(yīng)了該領(lǐng)域的最新進(jìn)4622十二月2022473.Marr的視覺(jué)計(jì)算理論Marr的視覺(jué)計(jì)算理論[Marr1982]立足于計(jì)算機(jī)科學(xué)，系統(tǒng)地概括了心理生理學(xué)、神經(jīng)生理學(xué)等方面取得的所有重要成果，是視覺(jué)研究中迄今為止最為完善的視覺(jué)理論．Marr建立的視覺(jué)計(jì)算理論，使計(jì)算機(jī)視覺(jué)研究有了一個(gè)比較明確的體系，并大大推動(dòng)了計(jì)算機(jī)視覺(jué)研究的發(fā)展．人們普遍認(rèn)為，計(jì)算機(jī)視覺(jué)這門(mén)學(xué)科的形成與Marr的視覺(jué)理論有著密切的關(guān)系．19十二月202273.Marr的視覺(jué)計(jì)算理論Marr4722十二月2022483.1信息處理三個(gè)層次19十二月202283.1信息處理三個(gè)層次4822十二月2022493.2視覺(jué)表示框架第一階段(也稱(chēng)為早期階段)是將輸入的原始圖像進(jìn)行處理，抽取圖像中諸如角點(diǎn)、邊緣、紋理、線(xiàn)條、邊界等基本特征，這些特征的集合稱(chēng)為基元圖(primitivesketch)；第二階段(中期階段)是指在以觀測(cè)者為中心的坐標(biāo)系中，由輸入圖像和基元圖恢復(fù)場(chǎng)景可見(jiàn)部分的深度、法線(xiàn)方向、輪廓等，這些信息的包含了深度信息，但不是真正的物體三維表示，因此，稱(chēng)為二維半圖(2．5dimensionalsketch)；第三階段(后期階段)是在以物體為中心的坐標(biāo)系中，由輸入圖像、基元圖、二維半圖來(lái)恢復(fù)、表示和識(shí)別三維物體。19十二月202293.2視覺(jué)表示框架第一階段(也稱(chēng)為4922十二月202250表1-2由圖像恢復(fù)形狀信息的表示框架19十二月202210表1-2由圖像恢復(fù)形狀信息的表5022十二月202251Marr理論是計(jì)算機(jī)視覺(jué)研究領(lǐng)域的劃時(shí)代成就，但該理論不是十分完善的，許多方面還有爭(zhēng)議．比如:

視覺(jué)處理框架基本上是自下而上，沒(méi)有反饋;

沒(méi)有足夠地重視知識(shí)的應(yīng)用．Marr理論給了我們研究計(jì)算機(jī)視覺(jué)許多珍貴的哲學(xué)思想和研究方法，同時(shí)也給計(jì)算機(jī)視覺(jué)研究領(lǐng)域創(chuàng)造了許多研究起點(diǎn)。3.3Marr視覺(jué)理論的不足19十二月202211Marr理論是計(jì)算機(jī)視覺(jué)研究領(lǐng)域的5122十二月20225219十二月2022125222十二月2022534.計(jì)算機(jī)視覺(jué)的應(yīng)用

零件識(shí)別與定位（工業(yè)生產(chǎn)線(xiàn)）產(chǎn)品檢驗(yàn)（紡織工業(yè)棉花質(zhì)量檢驗(yàn)）移動(dòng)機(jī)器人導(dǎo)航（星球機(jī)器人）遙感圖像分析（植被分析）醫(yī)學(xué)圖像分析（骨骼定位）安全鑒別、監(jiān)視與跟蹤（門(mén)禁系統(tǒng)）國(guó)防系統(tǒng)（目標(biāo)自動(dòng)識(shí)別ATR與目標(biāo)跟蹤）其它（動(dòng)畫(huà)、體育、考古）19十二月2022134.計(jì)算機(jī)視覺(jué)的應(yīng)用零件識(shí)別5322十二月202254Sojourner火星車(chē)前部圖，中部的兩個(gè)小突出是兩個(gè)黑白CCD攝像機(jī)19十二月202214Sojourner火星車(chē)前部圖，5422十二月20225519十二月2022155522十二月202256Rocky7火星機(jī)器人19十二月202216Rocky7火星機(jī)器人5622十二月20225719十二月2022175722十二月202258

Rocky7視覺(jué)系統(tǒng)獲取的立體圖象對(duì)障礙物探測(cè)示意圖Rocky7視覺(jué)系統(tǒng)對(duì)場(chǎng)景的深度恢復(fù)

19十二月202218Rocky7視覺(jué)系統(tǒng)獲取的立體圖5822十二月202259CMU月球探測(cè)實(shí)驗(yàn)車(chē)Nomad漫游者19十二月202219CMU月球探測(cè)實(shí)驗(yàn)車(chē)Nomad漫游5922十二月202260月球探測(cè)實(shí)驗(yàn)車(chē)Nomad漫游者19十二月202220月球探測(cè)實(shí)驗(yàn)車(chē)Nomad漫游者6022十二月202261昆蟲(chóng)機(jī)器人足球機(jī)器人足球機(jī)器人19十二月202221昆蟲(chóng)機(jī)器人足球機(jī)器人足球機(jī)器人6122十二月202262日本

Honda

仿人機(jī)器人19十二月202222日本Honda仿人機(jī)器6222十二月202263具有立體視覺(jué)的機(jī)器人19十二月202223具有立體視覺(jué)的機(jī)器人6322十二月202264人頭部跟蹤演示19十二月202224人頭部跟蹤演示6422十二月202265MITMediaLab，與虛擬生物交互演示19十二月202225MITMediaLab，與6522十二月202266基于恢復(fù)圖象序列的五角大樓三維重建19十二月202226基于恢復(fù)圖象序列的五角大樓三維重建6622十二月202267基于圖象序列的三維人臉恢復(fù)19十二月202227基于圖象序列的三維人臉恢復(fù)6722十二月202268視覺(jué)系統(tǒng)坐標(biāo)系像素坐標(biāo)：表示圖像陣列中圖像像素的位置；圖像平面坐標(biāo)：表示場(chǎng)景點(diǎn)在圖像平面上的投影；攝象機(jī)坐標(biāo)：即以觀察者為中心的坐標(biāo)，將場(chǎng)景點(diǎn)表示成以觀察者為中心的數(shù)據(jù)形式．場(chǎng)景坐標(biāo)：也稱(chēng)作絕對(duì)坐標(biāo)(或世界坐標(biāo))，用于表示場(chǎng)景點(diǎn)的絕對(duì)坐標(biāo)；19十二月202228視覺(jué)系統(tǒng)坐標(biāo)系像素坐標(biāo)：表示圖像陣6822十二月2022695.計(jì)算機(jī)視覺(jué)的研究?jī)?nèi)容一、輸入設(shè)備(inputdevice)包括成像設(shè)備和數(shù)字化設(shè)備．成象設(shè)備是指通過(guò)光學(xué)攝像機(jī)或紅外、激光、超聲、X射線(xiàn)對(duì)周?chē)鷪?chǎng)景或物體進(jìn)行探測(cè)成象，得到關(guān)于場(chǎng)景或物體的二維或三維數(shù)字化圖像．二、低層視覺(jué)(lowlevel)主要是對(duì)輸入的原始圖像進(jìn)行處理．這一過(guò)程借用了大量的圖像處理技術(shù)和算法，如圖像濾波、圖像增強(qiáng)、邊緣檢測(cè)等，以便從圖像中抽取諸如角點(diǎn)、邊緣、線(xiàn)條、邊界以及色彩等關(guān)于場(chǎng)景的基本特征；這一過(guò)程還包含了各種圖像變換（如校正）、圖像紋理檢測(cè)、圖像運(yùn)動(dòng)檢測(cè)等．19十二月2022295.計(jì)算機(jī)視覺(jué)的研究?jī)?nèi)容一、輸6922十二月202270三、中層視覺(jué)（middlelevel）主要任務(wù)是恢復(fù)場(chǎng)景的深度、表面法線(xiàn)方向、輪廓等有關(guān)場(chǎng)景的2．5維信息，實(shí)現(xiàn)的途徑有立體視覺(jué)（stereovision）、測(cè)距成像（rangefinder）運(yùn)動(dòng)估計(jì)（motionestimation）、明暗特征、紋理特征等.系統(tǒng)標(biāo)定、系統(tǒng)成像模型等研究?jī)?nèi)容一般也是在這個(gè)層次上進(jìn)行的．四、高層視覺(jué)（highlevel）主要任務(wù)是在以物體為中心的坐標(biāo)系中，在原始輸入圖像、圖像基本特征、2．5維圖的基礎(chǔ)上，恢復(fù)物體的完整三維圖，建立物體三維描述，識(shí)別三維物體并確定物體的位置和方向．19十二月202230三、中層視覺(jué)（middlelev7022十二月2022716.計(jì)算機(jī)視覺(jué)研究面臨的困難（1）圖像多義性：三維場(chǎng)景被投影為二維圖像，深度和不可見(jiàn)部分的信息被丟失，因而會(huì)出現(xiàn)不同形狀的三維物體投影在圖像平面上產(chǎn)生相同圖像的問(wèn)題．另外，在不同角度獲取同一物體的圖像會(huì)有很大的差異．（2）環(huán)境因素影響：場(chǎng)景中的諸多因素，包括照明、物體形狀、表面顏色、攝像機(jī)以及空間關(guān)系變化都會(huì)對(duì)成像有影響，（3）知識(shí)導(dǎo)引：同樣的圖像在不同的知識(shí)導(dǎo)引下，將會(huì)產(chǎn)生不同的識(shí)別結(jié)果．．（4）大量數(shù)據(jù)：灰度圖像，彩色圖像，深度圖像的信息量十分巨大，巨大的數(shù)據(jù)量需要很大的存貯空間，同時(shí)不易實(shí)現(xiàn)快速處理．19十二月2022316.計(jì)算機(jī)視覺(jué)研究面臨的困難（17122十二月2022727.計(jì)算機(jī)視覺(jué)與其它學(xué)科領(lǐng)域的關(guān)系（1）圖像處理：圖像處理通常是把一幅圖像變換成另外一幅圖像，也就是說(shuō)，圖像處理系統(tǒng)的輸入是圖像，輸出仍然是圖像，信息恢復(fù)任務(wù)則留給人來(lái)完成（2）計(jì)算機(jī)圖形學(xué)：通過(guò)幾何基元，如線(xiàn)、圓和自由曲面，來(lái)生成圖像，它在可視化（Visualization）和虛擬現(xiàn)實(shí)(VirtualReality）中起著很重要的作用．計(jì)算機(jī)視覺(jué)正好是解決相反的問(wèn)題，即從圖像中估計(jì)幾何基元和其它特征．因此，計(jì)算機(jī)圖形學(xué)屬于圖像綜合，計(jì)算機(jī)視覺(jué)屬于圖像分析．（3）模式識(shí)別：用于識(shí)別各種符號(hào)、圖畫(huà)等平面圖形．模式一般指一類(lèi)事物區(qū)別于其它事物所具有的共同特征。模式識(shí)別方法有統(tǒng)計(jì)方法和句法方法兩種，統(tǒng)計(jì)方法是指從模式抽取一組特征值，并以劃分特征空間的方法來(lái)識(shí)別每一個(gè)模式19十二月2022327.計(jì)算機(jī)視覺(jué)與其它學(xué)科領(lǐng)域的關(guān)7222十二月202273（4）人工智能（AI）：涉及到智能系統(tǒng)的設(shè)計(jì)和智能計(jì)算的研究．在經(jīng)過(guò)圖像處理和圖像特征提取過(guò)程后，接下來(lái)要用人工智能方法對(duì)場(chǎng)景特征進(jìn)行表示，并分析和理解場(chǎng)景．人工智能有三個(gè)過(guò)程：感知、認(rèn)知和行動(dòng)．．（5）人工神經(jīng)網(wǎng)絡(luò)（ANNs）：是一種信息處理系統(tǒng)，它是由大量簡(jiǎn)單的處理單元（稱(chēng)為神經(jīng)元）通過(guò)具有強(qiáng)度的連接相互聯(lián)系起來(lái)，實(shí)現(xiàn)并行分布式處理（PDP）．人工神經(jīng)網(wǎng)絡(luò)的最大特點(diǎn)是可以通過(guò)改變連接強(qiáng)度來(lái)調(diào)整系統(tǒng)，使之適應(yīng)復(fù)雜的環(huán)境，實(shí)現(xiàn)類(lèi)似人的學(xué)習(xí)、歸納和分類(lèi)等功能．（6）神經(jīng)物理學(xué)與認(rèn)知科學(xué)：將人類(lèi)視覺(jué)作為主要的研究對(duì)象．計(jì)算機(jī)視覺(jué)中已有的許多方法與人類(lèi)視覺(jué)極為相似．許多計(jì)算機(jī)視覺(jué)研究者對(duì)研究人類(lèi)視覺(jué)計(jì)算模型比研究計(jì)算機(jī)視覺(jué)系統(tǒng)更感興趣，希望計(jì)算機(jī)視覺(jué)更加自然化，更

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

計(jì)算機(jī)視覺(jué)發(fā)展史課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

計(jì)算機(jī)視覺(jué)發(fā)展史課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔