計(jì)算機(jī)視覺(jué)概述.doc_第1頁(yè)
計(jì)算機(jī)視覺(jué)概述.doc_第2頁(yè)
計(jì)算機(jī)視覺(jué)概述.doc_第3頁(yè)
計(jì)算機(jī)視覺(jué)概述.doc_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī)視覺(jué)概述關(guān)于計(jì)算機(jī)視覺(jué)的介紹性文章,包括計(jì)算機(jī)視覺(jué)的定義,和人類視覺(jué)的區(qū)別以及涉及到的學(xué)科等等。1. 什么是計(jì)算機(jī)視覺(jué)計(jì)算機(jī)視覺(jué)既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個(gè)富有挑戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺(jué)是一門(mén)綜合性的學(xué)科,它已經(jīng)吸引了來(lái)自各個(gè)學(xué)科的研究者參加到對(duì)它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號(hào)處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。視覺(jué)是各個(gè)應(yīng)用領(lǐng)域,如制造業(yè)、檢驗(yàn)、文檔分析、醫(yī)療診斷,和軍事等領(lǐng)域中各種智能自主系統(tǒng)中不可分割的一部分。由于它的重要性,一些先進(jìn)國(guó)家,例如美國(guó)把對(duì)計(jì)算機(jī)視覺(jué)的研究列為對(duì)經(jīng)濟(jì)和科學(xué)有廣泛影響的科學(xué)和工程中的重大基本問(wèn)題,即所謂的重大挑戰(zhàn)(grandchallenge)。計(jì)算機(jī)視覺(jué)的挑戰(zhàn)是要為計(jì)算機(jī)和機(jī)器人開(kāi)發(fā)具有與人類水平相當(dāng)?shù)囊曈X(jué)能力。機(jī)器視覺(jué)需要圖象信號(hào),紋理和顏色建模,幾何處理和推理,以及物體建模。一個(gè)有能力的視覺(jué)系統(tǒng)應(yīng)該把所有這些處理都緊密地集成在一起。Neg91作為一門(mén)學(xué)科,計(jì)算機(jī)視覺(jué)開(kāi)始于60年代初,但在計(jì)算機(jī)視覺(jué)的基本研究中的許多重要進(jìn)展是在80年代取得的。現(xiàn)在計(jì)算機(jī)視覺(jué)已成為一門(mén)不同于人工智能、圖象處理、模式識(shí)別等相關(guān)領(lǐng)域的成熟學(xué)科。計(jì)算機(jī)視覺(jué)與人類視覺(jué)密切相關(guān),對(duì)人類視覺(jué)有一個(gè)正確的認(rèn)識(shí)將對(duì)計(jì)算機(jī)視覺(jué)的研究非常有益。為此我們將先介紹人類視覺(jué)。1.1 人類視覺(jué)感覺(jué)是人的大腦與周?chē)澜缏?lián)系的窗口,它的任務(wù)是識(shí)別周?chē)奈矬w,并告訴這些物體之間的關(guān)系。我們的思維活動(dòng)是以我們對(duì)客觀世界與環(huán)境的認(rèn)識(shí)為基礎(chǔ)的,而感覺(jué)則是外界是客觀世界與我們對(duì)環(huán)境的認(rèn)識(shí)之間的橋梁,使我們的思維與周?chē)澜缃⒛撤N對(duì)應(yīng)關(guān)系。視覺(jué)則是人最重要的感覺(jué),它是人的主要感覺(jué)來(lái)源,人類認(rèn)識(shí)外界信息的80%來(lái)自視覺(jué)。人有多種感覺(jué),但對(duì)人的智力產(chǎn)生影響的主要是視覺(jué)和聽(tīng)覺(jué)。味覺(jué)和嗅覺(jué)是豐富多樣的,但很少有人去思考它們。在視覺(jué)和聽(tīng)覺(jué)中形狀、色彩、運(yùn)動(dòng)、聲音等就很容易被結(jié)合成各種明確和高度復(fù)雜、多樣的空間和時(shí)間的組織結(jié)構(gòu)。所以這兩種感覺(jué)就成了理智活動(dòng)得以行使和發(fā)揮作用的非常合適的媒介和環(huán)境。但人聽(tīng)到的聲音要想具有意義還需要聯(lián)系其它的感性材料。而視覺(jué)則不同,它是一種高度清晰的媒介,它提供關(guān)于外界世界中各種物體和事件的豐富信息。因此它是思維的一種最基本的工具。視覺(jué)對(duì)正常人來(lái)說(shuō)是生而有之,毫不費(fèi)力的能力。但實(shí)際上視覺(jué)系統(tǒng)所完成的功能卻十分復(fù)雜的。有人認(rèn)為視覺(jué)本身就包含了思維的一切基本因素。設(shè)想你要在一個(gè)會(huì)場(chǎng)中尋找一位朋友,呈現(xiàn)在你眼前的是由參加會(huì)議的人、桌、椅、主席臺(tái)等組成的復(fù)雜景物。眼睛得到這些信息以后先要對(duì)景物的各部分進(jìn)行分類,然后從中選出與朋友的外表有關(guān)的特征作出判斷,那么在人的眼睛視網(wǎng)膜上映照的景物成象是否就能直接提供判斷時(shí)所需要的有關(guān)特征呢?不是的,這里需要大腦的思考。例如,雖然人在不同距離處觀察同一物體時(shí)在眼睛中成象的大小是不同的。但人們?cè)谟^察某人以便估計(jì)他的身高時(shí)卻不會(huì)因?yàn)樗诮幎械剿咝膊粫?huì)因他在遠(yuǎn)處而感到他矮些。這是由于大腦根據(jù)被觀察物體的距離和與周?chē)矬w的比較,并依靠有關(guān)的知識(shí)對(duì)輸入的圖象信息進(jìn)行處理,解釋的結(jié)果。如果你是在一個(gè)燈光暗淡的劇院中尋找朋友,這個(gè)問(wèn)題就變得更為困難。你剛走進(jìn)劇院時(shí)開(kāi)始會(huì)感到一片漆黑看不清東西,過(guò)了幾分鐘你的眼睛變得習(xí)慣于在黑暗中觀察。事實(shí)上你的視覺(jué)系統(tǒng)在此期間中對(duì)微光變得更敏感了。但這時(shí)許多本來(lái)可用的信息喪失了,物體可能難以與背景相區(qū)分,許多細(xì)節(jié)難以分辨。即使這樣人也總能認(rèn)出朋友??傊?,視覺(jué)是一個(gè)復(fù)雜的感知和思維的過(guò)程,視覺(jué)器官-眼睛接受外界的刺激信息,而大腦對(duì)這些信息通過(guò)復(fù)雜的機(jī)理進(jìn)行處理和解釋,使這些刺激具有明確的物理意義。從以上分析我們還可以看到敏感(Sansation)、感覺(jué)(Perception)、認(rèn)知(Cognition)這三個(gè)概念之間的聯(lián)系和差別。敏感是把外界的各種刺激轉(zhuǎn)換成人體神經(jīng)系統(tǒng)能夠接受的生物電信號(hào)。它所完成的是信號(hào)的轉(zhuǎn)換,并不涉及對(duì)信號(hào)的理解。例如,人眼是視覺(jué)的敏感器官,它使光信號(hào)通過(guò)視網(wǎng)膜轉(zhuǎn)換電信號(hào)。與攝象機(jī)的光電傳感器相似,視網(wǎng)膜的感光細(xì)胞對(duì)光信號(hào)在平面上進(jìn)行采樣,產(chǎn)生點(diǎn)陣形式的電信號(hào),所不同的僅是攝象機(jī)的空間采樣是均勻的,而視網(wǎng)膜的采樣是不均勻的,在中央凹附近采樣分辨率高,而在周?chē)姆直媛实汀6杏X(jué)的任務(wù)是把敏感器官的各種輸入轉(zhuǎn)換和處理成為對(duì)外部世界的理解。例如,對(duì)視覺(jué)來(lái)說(shuō)就是能說(shuō)出周?chē)澜缰杏惺裁礀|西和這些東西之間的空間關(guān)系。這些都是關(guān)于周?chē)澜绲母拍?。從輸入的點(diǎn)陣形式的信號(hào)到形式對(duì)客觀世界的各種概念其中要經(jīng)過(guò)復(fù)雜的信息處理和推理。而認(rèn)知是以人們對(duì)周?chē)陀^世界的概念為基礎(chǔ)的。如果沒(méi)有感覺(jué)這個(gè)人與外部世界的橋梁或窗口,人的思維活動(dòng)就換去基本的依據(jù)。1.2 計(jì)算機(jī)視覺(jué)人類正在進(jìn)入信息時(shí)代,計(jì)算機(jī)將越來(lái)越廣泛地進(jìn)入幾乎所有領(lǐng)域。一方面是更多未經(jīng)計(jì)算機(jī)專業(yè)訓(xùn)練的人也需要應(yīng)用計(jì)算機(jī),而另一方面是計(jì)算機(jī)的功能越來(lái)越強(qiáng),使用方法越來(lái)越復(fù)雜。這就使人在進(jìn)行交談和通訊時(shí)的靈活性與目前在使用計(jì)算機(jī)時(shí)所要求的嚴(yán)格和死板之間產(chǎn)生了尖銳的矛盾。人可通過(guò)視覺(jué)和聽(tīng)覺(jué),語(yǔ)言與外界交換信息,并且可用不同的方式表示相同的含義,而目前的計(jì)算機(jī)卻要求嚴(yán)格按照各種程序語(yǔ)言來(lái)編寫(xiě)程序,只有這樣計(jì)算機(jī)才能運(yùn)行。為使更多的人能使用復(fù)雜的計(jì)算機(jī),必須改變過(guò)去的那種讓人來(lái)適應(yīng)計(jì)算機(jī),來(lái)死記硬背計(jì)算機(jī)的使用規(guī)則的情況。而是反過(guò)來(lái)讓計(jì)算機(jī)來(lái)適應(yīng)人的習(xí)慣和要求,以人所習(xí)慣的方式與人進(jìn)行信息交換,也就是讓計(jì)算機(jī)具有視覺(jué)、聽(tīng)覺(jué)和說(shuō)話等能力。這時(shí)計(jì)算機(jī)必須具有邏輯推理和決策的能力。具有上述能力的計(jì)算機(jī)就是智能計(jì)算機(jī)。智能計(jì)算機(jī)不但使計(jì)算機(jī)更便于為人們所使用,同時(shí)如果用這樣的計(jì)算機(jī)來(lái)控制各種自動(dòng)化裝置特別是智能機(jī)器人,就可以使這些自動(dòng)化系統(tǒng)和智能機(jī)器人具有適應(yīng)環(huán)境,和自主作出決策的能力。這就可以在各種場(chǎng)合取代人的繁重工作,或代替人到各種危險(xiǎn)和惡劣環(huán)境中完成任務(wù)。計(jì)算機(jī)視覺(jué)就是用各種成象系統(tǒng)代替視覺(jué)器官作為輸入敏感手段,由計(jì)算機(jī)來(lái)代替大腦完成處理和解釋。計(jì)算機(jī)視覺(jué)的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過(guò)視覺(jué)觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。要經(jīng)過(guò)長(zhǎng)期的努力才能達(dá)到的目標(biāo)。因此,在實(shí)現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺(jué)系統(tǒng),這個(gè)系統(tǒng)能依據(jù)視覺(jué)敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計(jì)算機(jī)視覺(jué)的一個(gè)重要應(yīng)用領(lǐng)域就是自主車(chē)輛的視覺(jué)導(dǎo)航,目前還沒(méi)有條件實(shí)現(xiàn)象人那樣能識(shí)別和理解任何環(huán)境,完成自主導(dǎo)航的系統(tǒng)。因此,目前人們努力的研究目標(biāo)是實(shí)現(xiàn)在高速公路上具有道路跟蹤能力,可避免與前方車(chē)輛碰撞的視覺(jué)輔助駕駛系統(tǒng)。這里要指出的一點(diǎn)是在計(jì)算機(jī)視覺(jué)系統(tǒng)中計(jì)算機(jī)起代替人腦的作用,但并不意味著計(jì)算機(jī)必須按人類視覺(jué)的方法完成視覺(jué)信息的處理。計(jì)算機(jī)視覺(jué)可以而且應(yīng)該根據(jù)計(jì)算機(jī)系統(tǒng)的特點(diǎn)來(lái)進(jìn)行視覺(jué)信息的處理。但是,人類視系統(tǒng)是迄今為止,人們所知道的功能最強(qiáng)大和完善的視覺(jué)系統(tǒng)。如在以下的章節(jié)中會(huì)看到的那樣,對(duì)人類視覺(jué)處理機(jī)制的研究將給計(jì)算機(jī)視覺(jué)的研究提供啟發(fā)和指導(dǎo)。因此,用計(jì)算機(jī)信息處理的方法研究人類視覺(jué)的機(jī)理,建立人類視覺(jué)的計(jì)算理論,也是一個(gè)非常重要和信人感興趣的研究領(lǐng)域。這方面的研究被稱為計(jì)算視覺(jué)(ComputationalVision)。計(jì)算視覺(jué)可被認(rèn)為是計(jì)算機(jī)視覺(jué)中的一個(gè)研究領(lǐng)域。有不少學(xué)科的研究目標(biāo)與計(jì)算機(jī)視覺(jué)相近或與此有關(guān)。這些學(xué)科中包括圖象處理、模式識(shí)別或圖象識(shí)別、景物分析、圖象理解等。由于歷史發(fā)展或領(lǐng)域本身的特點(diǎn)這些學(xué)科互有差別,但又有某種程度的相互重迭。為了清晰起見(jiàn),我們把這些與計(jì)算機(jī)視覺(jué)有關(guān)的學(xué)科研究目標(biāo)和方法的角度加以歸納。1. 圖象處理圖象處理技術(shù)把輸入圖象轉(zhuǎn)換成具有所希望特性的另一幅圖象。例如,可通過(guò)處理使輸出圖象有較高的信-噪比,或通過(guò)增強(qiáng)處理突出圖象的細(xì)節(jié),以便于操作員的檢驗(yàn)。在計(jì)算機(jī)視覺(jué)研究中經(jīng)常利用圖象處理技術(shù)進(jìn)行預(yù)處理和特征抽取。2. 模式識(shí)別(圖象識(shí)別)模式識(shí)別技術(shù)根據(jù)從圖象抽取的統(tǒng)計(jì)特性或結(jié)構(gòu)信息,把圖象分成予定的類別。例如,文字識(shí)別或指紋識(shí)別。在計(jì)算機(jī)視覺(jué)中模式識(shí)別技術(shù)經(jīng)常用于對(duì)圖象中的某些部分,例如分割區(qū)域的識(shí)別和分類。3. 圖象理解(景物分析)給定一幅圖象,圖象理解程序不僅描述圖象本身,而且描述和解釋圖象所代表的景物,以便對(duì)圖象代表的內(nèi)容作出決定。在人工智能視覺(jué)研究的初期經(jīng)常使用景物分析這個(gè)術(shù)語(yǔ),以強(qiáng)調(diào)二維圖象與三維

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論