人工智能導(dǎo)論課件第10章第3節(jié)_第1頁
人工智能導(dǎo)論課件第10章第3節(jié)_第2頁
人工智能導(dǎo)論課件第10章第3節(jié)_第3頁
人工智能導(dǎo)論課件第10章第3節(jié)_第4頁
人工智能導(dǎo)論課件第10章第3節(jié)_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1機(jī)器視覺的發(fā)展2圖像處理3計(jì)算機(jī)視覺4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別第3節(jié)5神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)1機(jī)器視覺的發(fā)展2圖像處理3計(jì)算機(jī)視覺4計(jì)算機(jī)視覺與機(jī)器視覺10.3機(jī)器視覺與圖像處理智能圖像處理是指一類基于計(jì)算機(jī)的自適應(yīng)于各種應(yīng)用場合的圖像處理和分析技術(shù),本身是一個獨(dú)立的理論和技術(shù)領(lǐng)域,但同時(shí)又是機(jī)器視覺中的一項(xiàng)十分重要的技術(shù)支撐。人工智能、機(jī)器視覺和智能圖像處理技術(shù)之間的關(guān)系如右圖所示。圖10-7智能圖像處理的支撐作用10.3機(jī)器視覺與圖像處理智能圖像處理是指一類基于計(jì)算機(jī)10.3.1機(jī)器視覺的發(fā)展具有智能圖像處理功能的機(jī)器視覺(MachineVision),相當(dāng)于人們在賦予機(jī)器智能的同時(shí)為機(jī)器按上了眼睛,使機(jī)器能夠“看得見”、“看得準(zhǔn)”,可替代甚至勝過人眼做測量和判斷,使得機(jī)器視覺系統(tǒng)可以實(shí)現(xiàn)高分辨率和高速度的控制。而且,機(jī)器視覺系統(tǒng)與被檢

測對象無接觸,安全可靠。圖10-8圖像處理與模式識別應(yīng)用于指紋識別10.3.1機(jī)器視覺的發(fā)展具有智能圖像處理功能的機(jī)器視覺10.3.1機(jī)器視覺的發(fā)展機(jī)器視覺是人工智能領(lǐng)域中發(fā)展迅速的一個重要分支,正處于不斷突破、走向成熟的階段。一般認(rèn)為機(jī)器視覺“是通過光學(xué)裝置和非接觸傳感器自動地接受和處理一個真實(shí)場景的圖像,通過分析圖像獲得所需信息或用于控制機(jī)器運(yùn)動的裝置”,可以看出智能圖像處理技術(shù)在機(jī)器視覺中占有舉足輕重的位置。機(jī)器視覺的起源可追溯到20世紀(jì)60年代美國學(xué)者L.R.羅伯茲對多面體積木世界的圖像處理研究,70年代麻省理工學(xué)院(MIT)人工智能實(shí)驗(yàn)室“機(jī)器視覺”課程的開設(shè)。到80年代,全球性機(jī)器視覺研究熱潮開始興起,出現(xiàn)了一些基于機(jī)器視覺的應(yīng)用系統(tǒng)。90年代以后,隨著計(jì)算機(jī)和半導(dǎo)體技術(shù)的飛速發(fā)展,機(jī)器視覺的理論和應(yīng)用得到進(jìn)一步發(fā)展。10.3.1機(jī)器視覺的發(fā)展機(jī)器視覺是人工智能領(lǐng)域中發(fā)展迅10.3.1機(jī)器視覺的發(fā)展進(jìn)入21世紀(jì)后,機(jī)器視覺技術(shù)的發(fā)展速度更快,已經(jīng)大規(guī)模地應(yīng)用于多個領(lǐng)域,如智能制造、智能交通、醫(yī)療衛(wèi)生、安防監(jiān)控等領(lǐng)域。常見機(jī)器視覺系統(tǒng)主要分為兩類,一類是基于計(jì)算機(jī)的,如工控機(jī)或PC,另一類是更加緊湊的嵌入式設(shè)備。典型的基于工控機(jī)的機(jī)器視覺系統(tǒng)主要包括:光學(xué)系統(tǒng),攝像機(jī)和工控機(jī)(包含圖像采集、圖像處理和分析、控制/通信)等單元。機(jī)器視覺系統(tǒng)對核心的圖像處理要

求算法準(zhǔn)確、快捷和穩(wěn)定,同時(shí)還要求

系統(tǒng)的實(shí)現(xiàn)成本低,升級換代方便。圖10-9機(jī)器視覺系統(tǒng)10.3.1機(jī)器視覺的發(fā)展進(jìn)入21世紀(jì)后,機(jī)器視覺技術(shù)的10.3.2圖像處理圖像處理(Imageprocessing)又稱影像處理,是利用計(jì)算機(jī)技術(shù)與數(shù)學(xué)方法,對圖像、視頻信息的表示、編解碼、圖像分割、圖像質(zhì)量評價(jià)、目標(biāo)檢測與識別以及立體視覺等方面開展科學(xué)研究。主要研究內(nèi)容包括:圖像、視頻的模式識別和安全監(jiān)控、醫(yī)學(xué)和材料圖像處理、演化算法、人工智能、粗糙集和數(shù)據(jù)挖掘等。在人臉識別、指紋識別、文字檢測和識別、語音識別以及多個領(lǐng)域的信息管理系統(tǒng)等方面均有廣泛應(yīng)用。10.3.2圖像處理圖像處理(Imageprocess10.3.2圖像處理圖像處理一般指數(shù)字圖像處理,是用計(jì)算機(jī)對圖像進(jìn)行分析,以達(dá)到所需結(jié)果的技術(shù)。數(shù)字圖像是指用數(shù)字?jǐn)z像機(jī)、掃描儀等設(shè)備經(jīng)過采樣和數(shù)字化得到的一個大的二維數(shù)組,該數(shù)組的元素稱為像素,其值為一整數(shù),稱為灰度值。圖像處理技術(shù)的主要內(nèi)容包括圖像壓縮,增強(qiáng)和復(fù)原,匹配、描述和識別3個部分。常見的處理有圖像數(shù)字化、圖像編碼、圖像增強(qiáng)、圖像復(fù)原、圖像分割和圖像分析等。10.3.2圖像處理圖像處理一般指數(shù)字圖像處理,是用計(jì)算10.3.3計(jì)算機(jī)視覺從圖像處理和模式識別發(fā)展起來的計(jì)算機(jī)視覺(computervision)是用計(jì)算機(jī)來模擬人的視覺機(jī)理獲取和處理信息的能力,就是指用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。計(jì)算機(jī)視覺研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng)。計(jì)算機(jī)視覺的挑戰(zhàn)是要為計(jì)算機(jī)和機(jī)器人開發(fā)具有與人類水平相當(dāng)?shù)囊曈X能力。10.3.3計(jì)算機(jī)視覺從圖像處理和模式識別發(fā)展起來的計(jì)算10.3.3計(jì)算機(jī)視覺計(jì)算機(jī)視覺研究對象之一是如何利用二維投影圖像恢復(fù)三維景物世界。計(jì)算機(jī)視覺使用的理論方法主要是基于幾何、概率和運(yùn)動學(xué)計(jì)算與三維重構(gòu)的視覺計(jì)算理論,它的基礎(chǔ)包括射影幾何學(xué)、剛體運(yùn)動力學(xué)、概率論與隨機(jī)過程、圖像處理、人工智能等理論。計(jì)算機(jī)視覺要達(dá)到的基本目的有以下幾個:(1)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;(2)根據(jù)一幅或多幅二維投影圖像計(jì)算出目標(biāo)物體的運(yùn)動參數(shù);(3)根據(jù)一幅或多幅二維投影圖像計(jì)算出目標(biāo)物體的表面物理特性;(4)根據(jù)多幅二維投影圖像恢復(fù)出更大空間區(qū)域的投影圖像。10.3.3計(jì)算機(jī)視覺計(jì)算機(jī)視覺研究對象之一是如何利用二10.3.3計(jì)算機(jī)視覺計(jì)算機(jī)視覺要達(dá)到的最終目的是實(shí)現(xiàn)利用計(jì)算機(jī)對于三維景物世界的理解,即實(shí)現(xiàn)人的視覺系統(tǒng)的某些功能。在計(jì)算機(jī)視覺領(lǐng)域里,醫(yī)學(xué)圖像分析、光學(xué)文字識別對模式識別的要求需要提到一定高度。又如模式識別中的預(yù)處理和特征抽取環(huán)節(jié)應(yīng)用圖像處理的技術(shù);圖像處理中的圖像分析也應(yīng)用模式識別的技術(shù)。在計(jì)算機(jī)視覺的大多數(shù)實(shí)際應(yīng)用當(dāng)中,計(jì)算機(jī)被預(yù)設(shè)為解決特定的任務(wù),然而基于機(jī)器學(xué)習(xí)的方法正日漸普及,一旦機(jī)器學(xué)習(xí)的研究進(jìn)一步發(fā)展,未來“泛用型”的電腦視覺應(yīng)用或許可以成真。10.3.3計(jì)算機(jī)視覺計(jì)算機(jī)視覺要達(dá)到的最終目的是實(shí)現(xiàn)利10.3.3計(jì)算機(jī)視覺人工智能所研究的一個主要問題是:如何讓系統(tǒng)具備“計(jì)劃”和“決策能力”?從而使之完成特定的技術(shù)動作(例如:移動一個機(jī)器人通過某種特定環(huán)境)。這一問題便與計(jì)算機(jī)視覺問題息息相關(guān)。在這里,計(jì)算機(jī)視覺系統(tǒng)作為一個感知器,為決策提供信息。另外一些研究方向包括模式識別和機(jī)器學(xué)習(xí)(這也隸屬于人工智能領(lǐng)域,但與計(jì)算機(jī)視覺有著重要聯(lián)系),也由此,計(jì)算機(jī)視覺時(shí)常被看作人工智能與計(jì)算機(jī)科學(xué)的一個分支。10.3.3計(jì)算機(jī)視覺人工智能所研究的一個主要問題是:如10.3.3計(jì)算機(jī)視覺為了達(dá)到計(jì)算機(jī)視覺的目的,有兩種技術(shù)途徑可以考慮。第一種是仿生學(xué)方法,即從分析人類視覺的過程入手,利用大自然提供給我們的最好參考系——人類視覺系統(tǒng),建立起視覺過程的計(jì)算模型,然后用計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)之。第二種是工程方法,即脫離人類視覺系統(tǒng)框框的約束,利用一切可行和實(shí)用的技術(shù)手段實(shí)現(xiàn)視覺功能。此方法的一般做法是,將人類視覺系統(tǒng)作為一個黑盒子對待,實(shí)現(xiàn)時(shí)只關(guān)心對于某種輸入,視覺系統(tǒng)將給出何種輸出。這兩種方法理論上都是可以使用的,但面臨的困難是,人類視覺系統(tǒng)對應(yīng)某種輸入的輸出到底是什么,這是無法直接測得的。而且由于人的智能活動是一個多功能系統(tǒng)綜合作用的結(jié)果,即使是得到了一個輸入輸出對,也很難肯定它是僅由當(dāng)前的輸入視覺刺激所產(chǎn)生的響應(yīng),而不是一個與歷史狀態(tài)綜合作用的結(jié)果。10.3.3計(jì)算機(jī)視覺為了達(dá)到計(jì)算機(jī)視覺的目的,有兩種技10.3.3計(jì)算機(jī)視覺不難理解,計(jì)算機(jī)視覺的研究具有雙重意義。其一,是為了滿足人工智能應(yīng)用的需要,即用計(jì)算機(jī)實(shí)現(xiàn)人工的視覺系統(tǒng)的需要。這些成果可以安裝在計(jì)算機(jī)和各種機(jī)器上,使計(jì)算機(jī)和機(jī)器人能夠具有“看”的能力。其二,視覺計(jì)算模型的研究結(jié)果反過來對于我們進(jìn)一步認(rèn)識和研究人類視覺系統(tǒng)本身的機(jī)理,甚至人腦的機(jī)理,也同樣具有相當(dāng)大的參考意義。10.3.3計(jì)算機(jī)視覺不難理解,計(jì)算機(jī)視覺的研究具有雙重10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別一般認(rèn)為,計(jì)算機(jī)就是機(jī)器的一種,那么,計(jì)算機(jī)視覺與機(jī)器視覺有什么區(qū)別呢?(1)定義不同。計(jì)算機(jī)視覺:是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說,就是指用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別一般認(rèn)為,計(jì)算機(jī)就10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別機(jī)器視覺:是用機(jī)器代替人眼來做測量和判斷。機(jī)器視覺系統(tǒng)是通過機(jī)器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別機(jī)器視覺:是用機(jī)器10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別(2)原理不同。計(jì)算機(jī)視覺:是用各種成像系統(tǒng)代替視覺器官作為輸入敏感手段,由計(jì)算機(jī)來代替大腦完成處理和解釋。計(jì)算機(jī)視覺的最終研究目標(biāo)就是使計(jì)算機(jī)能像人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。要經(jīng)過長期的努力才能達(dá)到的目標(biāo)。因此,在實(shí)現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個系統(tǒng)能依據(jù)視覺敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計(jì)算機(jī)視覺的一個重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航,還沒有條件實(shí)現(xiàn)象人那樣能識別和理解任何環(huán)境,完成自主導(dǎo)航的系統(tǒng)。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別(2)原理不同。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別例如,人們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺系統(tǒng)中計(jì)算機(jī)起代替人腦的作用,但并不意味著計(jì)算機(jī)必須按人類視覺的方法完成視覺信息的處理。計(jì)算機(jī)視覺可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來進(jìn)行視覺信息的處理。但是,人類視覺系統(tǒng)是迄今為止,人們所知道的功能最強(qiáng)大和完善的視覺系統(tǒng)。如在以下的章節(jié)中會看到的那樣,對人類視覺處理機(jī)制的研究將給計(jì)算機(jī)視覺的研究提供啟發(fā)和指導(dǎo)。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別例如,人們努力的研10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別因此,用計(jì)算機(jī)信息處理的方法研究人類視覺的機(jī)理,建立人類視覺的計(jì)算理論,也是一個非常重要和信人感興趣的研究領(lǐng)域。這方面的研究被稱為計(jì)算視覺(ComputationalVision)。計(jì)算視覺可被認(rèn)為是計(jì)算機(jī)視覺中的一個研究領(lǐng)域。機(jī)器視覺:其檢測系統(tǒng)采用CCD照相機(jī)將被檢測的目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號,圖像處理系統(tǒng)對這些信號進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,如面積、數(shù)量、位置、長度,再根據(jù)預(yù)設(shè)的允許度和其他條件輸出結(jié)果,包括尺寸、角度、個數(shù)、合格/不合格、有/無等,實(shí)現(xiàn)自動識別功能。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別因此,用計(jì)算機(jī)信息10.3.5神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)神經(jīng)網(wǎng)絡(luò)圖像識別技術(shù)是在傳統(tǒng)的圖像識別方法和基礎(chǔ)上融合神經(jīng)網(wǎng)絡(luò)算法的一種圖像識別方法。在神經(jīng)網(wǎng)絡(luò)圖像識別技術(shù)中,遺傳算法與BP網(wǎng)絡(luò)相融合的神經(jīng)網(wǎng)絡(luò)圖像識別模型是非常經(jīng)典的,在很多領(lǐng)域都有它的應(yīng)用。在圖像識別系統(tǒng)中利用神經(jīng)網(wǎng)絡(luò)系統(tǒng),一般會先提取圖像的特征,再利用圖像所具有的特征映射到神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像識別分類。10.3.5神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)神經(jīng)網(wǎng)絡(luò)圖像識別技術(shù)是10.3.5神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)以汽車拍照自動識別技術(shù)為例,當(dāng)汽車通過的時(shí)候,汽車自身具有的檢測設(shè)備會有所感應(yīng)。此時(shí)檢測設(shè)備就會啟用圖像采集裝置來獲取汽車正反面的圖像。獲取了圖像后必須將圖像上傳到計(jì)算機(jī)進(jìn)行保存以便識別。最后車牌定位模塊就會提取車牌信息,對車牌上的字符進(jìn)行識別并顯示最終的結(jié)果。在對車牌上的字符進(jìn)行識別的過程中就用到了基于模板匹配算法和基于人工神經(jīng)網(wǎng)絡(luò)算法。10.3.5神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)以汽車拍照自動識別技術(shù)人工智能導(dǎo)論Introductiontoartificialintelligence人工智能導(dǎo)論Introductiontoartifici1機(jī)器視覺的發(fā)展2圖像處理3計(jì)算機(jī)視覺4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別第3節(jié)5神經(jīng)網(wǎng)絡(luò)的圖像識別技術(shù)1機(jī)器視覺的發(fā)展2圖像處理3計(jì)算機(jī)視覺4計(jì)算機(jī)視覺與機(jī)器視覺10.3機(jī)器視覺與圖像處理智能圖像處理是指一類基于計(jì)算機(jī)的自適應(yīng)于各種應(yīng)用場合的圖像處理和分析技術(shù),本身是一個獨(dú)立的理論和技術(shù)領(lǐng)域,但同時(shí)又是機(jī)器視覺中的一項(xiàng)十分重要的技術(shù)支撐。人工智能、機(jī)器視覺和智能圖像處理技術(shù)之間的關(guān)系如右圖所示。圖10-7智能圖像處理的支撐作用10.3機(jī)器視覺與圖像處理智能圖像處理是指一類基于計(jì)算機(jī)10.3.1機(jī)器視覺的發(fā)展具有智能圖像處理功能的機(jī)器視覺(MachineVision),相當(dāng)于人們在賦予機(jī)器智能的同時(shí)為機(jī)器按上了眼睛,使機(jī)器能夠“看得見”、“看得準(zhǔn)”,可替代甚至勝過人眼做測量和判斷,使得機(jī)器視覺系統(tǒng)可以實(shí)現(xiàn)高分辨率和高速度的控制。而且,機(jī)器視覺系統(tǒng)與被檢

測對象無接觸,安全可靠。圖10-8圖像處理與模式識別應(yīng)用于指紋識別10.3.1機(jī)器視覺的發(fā)展具有智能圖像處理功能的機(jī)器視覺10.3.1機(jī)器視覺的發(fā)展機(jī)器視覺是人工智能領(lǐng)域中發(fā)展迅速的一個重要分支,正處于不斷突破、走向成熟的階段。一般認(rèn)為機(jī)器視覺“是通過光學(xué)裝置和非接觸傳感器自動地接受和處理一個真實(shí)場景的圖像,通過分析圖像獲得所需信息或用于控制機(jī)器運(yùn)動的裝置”,可以看出智能圖像處理技術(shù)在機(jī)器視覺中占有舉足輕重的位置。機(jī)器視覺的起源可追溯到20世紀(jì)60年代美國學(xué)者L.R.羅伯茲對多面體積木世界的圖像處理研究,70年代麻省理工學(xué)院(MIT)人工智能實(shí)驗(yàn)室“機(jī)器視覺”課程的開設(shè)。到80年代,全球性機(jī)器視覺研究熱潮開始興起,出現(xiàn)了一些基于機(jī)器視覺的應(yīng)用系統(tǒng)。90年代以后,隨著計(jì)算機(jī)和半導(dǎo)體技術(shù)的飛速發(fā)展,機(jī)器視覺的理論和應(yīng)用得到進(jìn)一步發(fā)展。10.3.1機(jī)器視覺的發(fā)展機(jī)器視覺是人工智能領(lǐng)域中發(fā)展迅10.3.1機(jī)器視覺的發(fā)展進(jìn)入21世紀(jì)后,機(jī)器視覺技術(shù)的發(fā)展速度更快,已經(jīng)大規(guī)模地應(yīng)用于多個領(lǐng)域,如智能制造、智能交通、醫(yī)療衛(wèi)生、安防監(jiān)控等領(lǐng)域。常見機(jī)器視覺系統(tǒng)主要分為兩類,一類是基于計(jì)算機(jī)的,如工控機(jī)或PC,另一類是更加緊湊的嵌入式設(shè)備。典型的基于工控機(jī)的機(jī)器視覺系統(tǒng)主要包括:光學(xué)系統(tǒng),攝像機(jī)和工控機(jī)(包含圖像采集、圖像處理和分析、控制/通信)等單元。機(jī)器視覺系統(tǒng)對核心的圖像處理要

求算法準(zhǔn)確、快捷和穩(wěn)定,同時(shí)還要求

系統(tǒng)的實(shí)現(xiàn)成本低,升級換代方便。圖10-9機(jī)器視覺系統(tǒng)10.3.1機(jī)器視覺的發(fā)展進(jìn)入21世紀(jì)后,機(jī)器視覺技術(shù)的10.3.2圖像處理圖像處理(Imageprocessing)又稱影像處理,是利用計(jì)算機(jī)技術(shù)與數(shù)學(xué)方法,對圖像、視頻信息的表示、編解碼、圖像分割、圖像質(zhì)量評價(jià)、目標(biāo)檢測與識別以及立體視覺等方面開展科學(xué)研究。主要研究內(nèi)容包括:圖像、視頻的模式識別和安全監(jiān)控、醫(yī)學(xué)和材料圖像處理、演化算法、人工智能、粗糙集和數(shù)據(jù)挖掘等。在人臉識別、指紋識別、文字檢測和識別、語音識別以及多個領(lǐng)域的信息管理系統(tǒng)等方面均有廣泛應(yīng)用。10.3.2圖像處理圖像處理(Imageprocess10.3.2圖像處理圖像處理一般指數(shù)字圖像處理,是用計(jì)算機(jī)對圖像進(jìn)行分析,以達(dá)到所需結(jié)果的技術(shù)。數(shù)字圖像是指用數(shù)字?jǐn)z像機(jī)、掃描儀等設(shè)備經(jīng)過采樣和數(shù)字化得到的一個大的二維數(shù)組,該數(shù)組的元素稱為像素,其值為一整數(shù),稱為灰度值。圖像處理技術(shù)的主要內(nèi)容包括圖像壓縮,增強(qiáng)和復(fù)原,匹配、描述和識別3個部分。常見的處理有圖像數(shù)字化、圖像編碼、圖像增強(qiáng)、圖像復(fù)原、圖像分割和圖像分析等。10.3.2圖像處理圖像處理一般指數(shù)字圖像處理,是用計(jì)算10.3.3計(jì)算機(jī)視覺從圖像處理和模式識別發(fā)展起來的計(jì)算機(jī)視覺(computervision)是用計(jì)算機(jī)來模擬人的視覺機(jī)理獲取和處理信息的能力,就是指用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。計(jì)算機(jī)視覺研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng)。計(jì)算機(jī)視覺的挑戰(zhàn)是要為計(jì)算機(jī)和機(jī)器人開發(fā)具有與人類水平相當(dāng)?shù)囊曈X能力。10.3.3計(jì)算機(jī)視覺從圖像處理和模式識別發(fā)展起來的計(jì)算10.3.3計(jì)算機(jī)視覺計(jì)算機(jī)視覺研究對象之一是如何利用二維投影圖像恢復(fù)三維景物世界。計(jì)算機(jī)視覺使用的理論方法主要是基于幾何、概率和運(yùn)動學(xué)計(jì)算與三維重構(gòu)的視覺計(jì)算理論,它的基礎(chǔ)包括射影幾何學(xué)、剛體運(yùn)動力學(xué)、概率論與隨機(jī)過程、圖像處理、人工智能等理論。計(jì)算機(jī)視覺要達(dá)到的基本目的有以下幾個:(1)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;(2)根據(jù)一幅或多幅二維投影圖像計(jì)算出目標(biāo)物體的運(yùn)動參數(shù);(3)根據(jù)一幅或多幅二維投影圖像計(jì)算出目標(biāo)物體的表面物理特性;(4)根據(jù)多幅二維投影圖像恢復(fù)出更大空間區(qū)域的投影圖像。10.3.3計(jì)算機(jī)視覺計(jì)算機(jī)視覺研究對象之一是如何利用二10.3.3計(jì)算機(jī)視覺計(jì)算機(jī)視覺要達(dá)到的最終目的是實(shí)現(xiàn)利用計(jì)算機(jī)對于三維景物世界的理解,即實(shí)現(xiàn)人的視覺系統(tǒng)的某些功能。在計(jì)算機(jī)視覺領(lǐng)域里,醫(yī)學(xué)圖像分析、光學(xué)文字識別對模式識別的要求需要提到一定高度。又如模式識別中的預(yù)處理和特征抽取環(huán)節(jié)應(yīng)用圖像處理的技術(shù);圖像處理中的圖像分析也應(yīng)用模式識別的技術(shù)。在計(jì)算機(jī)視覺的大多數(shù)實(shí)際應(yīng)用當(dāng)中,計(jì)算機(jī)被預(yù)設(shè)為解決特定的任務(wù),然而基于機(jī)器學(xué)習(xí)的方法正日漸普及,一旦機(jī)器學(xué)習(xí)的研究進(jìn)一步發(fā)展,未來“泛用型”的電腦視覺應(yīng)用或許可以成真。10.3.3計(jì)算機(jī)視覺計(jì)算機(jī)視覺要達(dá)到的最終目的是實(shí)現(xiàn)利10.3.3計(jì)算機(jī)視覺人工智能所研究的一個主要問題是:如何讓系統(tǒng)具備“計(jì)劃”和“決策能力”?從而使之完成特定的技術(shù)動作(例如:移動一個機(jī)器人通過某種特定環(huán)境)。這一問題便與計(jì)算機(jī)視覺問題息息相關(guān)。在這里,計(jì)算機(jī)視覺系統(tǒng)作為一個感知器,為決策提供信息。另外一些研究方向包括模式識別和機(jī)器學(xué)習(xí)(這也隸屬于人工智能領(lǐng)域,但與計(jì)算機(jī)視覺有著重要聯(lián)系),也由此,計(jì)算機(jī)視覺時(shí)常被看作人工智能與計(jì)算機(jī)科學(xué)的一個分支。10.3.3計(jì)算機(jī)視覺人工智能所研究的一個主要問題是:如10.3.3計(jì)算機(jī)視覺為了達(dá)到計(jì)算機(jī)視覺的目的,有兩種技術(shù)途徑可以考慮。第一種是仿生學(xué)方法,即從分析人類視覺的過程入手,利用大自然提供給我們的最好參考系——人類視覺系統(tǒng),建立起視覺過程的計(jì)算模型,然后用計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)之。第二種是工程方法,即脫離人類視覺系統(tǒng)框框的約束,利用一切可行和實(shí)用的技術(shù)手段實(shí)現(xiàn)視覺功能。此方法的一般做法是,將人類視覺系統(tǒng)作為一個黑盒子對待,實(shí)現(xiàn)時(shí)只關(guān)心對于某種輸入,視覺系統(tǒng)將給出何種輸出。這兩種方法理論上都是可以使用的,但面臨的困難是,人類視覺系統(tǒng)對應(yīng)某種輸入的輸出到底是什么,這是無法直接測得的。而且由于人的智能活動是一個多功能系統(tǒng)綜合作用的結(jié)果,即使是得到了一個輸入輸出對,也很難肯定它是僅由當(dāng)前的輸入視覺刺激所產(chǎn)生的響應(yīng),而不是一個與歷史狀態(tài)綜合作用的結(jié)果。10.3.3計(jì)算機(jī)視覺為了達(dá)到計(jì)算機(jī)視覺的目的,有兩種技10.3.3計(jì)算機(jī)視覺不難理解,計(jì)算機(jī)視覺的研究具有雙重意義。其一,是為了滿足人工智能應(yīng)用的需要,即用計(jì)算機(jī)實(shí)現(xiàn)人工的視覺系統(tǒng)的需要。這些成果可以安裝在計(jì)算機(jī)和各種機(jī)器上,使計(jì)算機(jī)和機(jī)器人能夠具有“看”的能力。其二,視覺計(jì)算模型的研究結(jié)果反過來對于我們進(jìn)一步認(rèn)識和研究人類視覺系統(tǒng)本身的機(jī)理,甚至人腦的機(jī)理,也同樣具有相當(dāng)大的參考意義。10.3.3計(jì)算機(jī)視覺不難理解,計(jì)算機(jī)視覺的研究具有雙重10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別一般認(rèn)為,計(jì)算機(jī)就是機(jī)器的一種,那么,計(jì)算機(jī)視覺與機(jī)器視覺有什么區(qū)別呢?(1)定義不同。計(jì)算機(jī)視覺:是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說,就是指用攝影機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量等機(jī)器視覺,并進(jìn)一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別一般認(rèn)為,計(jì)算機(jī)就10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別機(jī)器視覺:是用機(jī)器代替人眼來做測量和判斷。機(jī)器視覺系統(tǒng)是通過機(jī)器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別機(jī)器視覺:是用機(jī)器10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別(2)原理不同。計(jì)算機(jī)視覺:是用各種成像系統(tǒng)代替視覺器官作為輸入敏感手段,由計(jì)算機(jī)來代替大腦完成處理和解釋。計(jì)算機(jī)視覺的最終研究目標(biāo)就是使計(jì)算機(jī)能像人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。要經(jīng)過長期的努力才能達(dá)到的目標(biāo)。因此,在實(shí)現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個系統(tǒng)能依據(jù)視覺敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計(jì)算機(jī)視覺的一個重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航,還沒有條件實(shí)現(xiàn)象人那樣能識別和理解任何環(huán)境,完成自主導(dǎo)航的系統(tǒng)。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別(2)原理不同。10.3.4計(jì)算機(jī)視覺與機(jī)器視覺的區(qū)別例如,人們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺系統(tǒng)中計(jì)算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論