



免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
計(jì)算機(jī)視覺(jué)綜述華顯明(重慶師范大學(xué)數(shù)學(xué)系系統(tǒng)分析與集成)摘要:自從1956 年Dartmouth學(xué)會(huì)上提出“人工智能”后,世界各國(guó)的研究者發(fā)展了眾多理論和原理。人工智能是一門(mén)極富挑戰(zhàn)性的學(xué)科,研究他的工作人員必須懂得多門(mén)學(xué)科的知識(shí),比如計(jì)算機(jī)、心理學(xué)、哲學(xué)、生物學(xué)、仿生學(xué)等等,它涉及的范圍相當(dāng)?shù)膹V泛。并且在這些廣泛的學(xué)科又由不通的領(lǐng)域組成,如計(jì)算機(jī)學(xué)習(xí)、計(jì)算機(jī)視覺(jué)等。研究人工智能的目的是使機(jī)器能夠擔(dān)任一些需要人工處理的工作。而這些工作需要做一定的決策,要求機(jī)器能夠自行的根據(jù)當(dāng)時(shí)的環(huán)境做出相對(duì)較好的決策。這就需要計(jì)算機(jī)不僅僅能夠計(jì)算,還能夠擁有一定得智能。而要對(duì)周?chē)沫h(huán)境進(jìn)做出好的決策就需要對(duì)周邊的環(huán)境進(jìn)行分析,即要求機(jī)器能夠“看”到周?chē)沫h(huán)境,并能夠理解它們。就像人做的那樣。所以計(jì)算機(jī)視覺(jué)是人工智能中非常重要的一個(gè)領(lǐng)域。關(guān)鍵詞:計(jì)算機(jī); 視覺(jué); 圖像;Abstract:Since 1956 the Dartmouth learn put forward “artificial intelligence”, many countries in world have developed many theories and principles. Artificial intelligence is an extremely challenging subject. The researchers must know lots of other knowledge. Such as the computer, psychology, philosophy, biology, bionics, etc. It involved a widespread discipline. And in these widespread disciplines are composed by many different fields, such as computer learning, computer vision, etc. The artificial intelligence is designed to make the machine to do some work that need people do now. And these work needs to be done certain decision-making, the machine can make according to the requirements of the environment to make a relatively good decision. This needs the computer can not merely calculate, can also have intelligence. That need the computer can see the world and also know them, just like human do. So the computer vision is a very important field in the artificial intelligence.計(jì)算機(jī)視覺(jué)的應(yīng)用人類(lèi)正在進(jìn)入信息時(shí)代,計(jì)算機(jī)將越來(lái)越廣泛地進(jìn)入幾乎所有領(lǐng)域。一方面是更多未經(jīng)計(jì)算機(jī)專(zhuān)業(yè)訓(xùn)練的人也需要應(yīng)用計(jì)算機(jī),而另一方面是計(jì)算機(jī)的功能越來(lái)越強(qiáng),使用方法越來(lái)越復(fù)雜。這就使人在進(jìn)行交談和通訊時(shí)的靈活性與目前在使用計(jì)算機(jī)時(shí)所要求的嚴(yán)格和死板之間產(chǎn)生了尖銳的矛盾。人可通過(guò)視覺(jué)和聽(tīng)覺(jué),語(yǔ)言與外界交換信息,并且可用不同的方式表示相同的含義,而目前的計(jì)算機(jī)卻要求嚴(yán)格按照各種程序語(yǔ)言來(lái)編寫(xiě)程序,只有這樣計(jì)算機(jī)才能運(yùn)行。為使更多的人能使用復(fù)雜的計(jì)算機(jī),必須改變過(guò)去的那種讓人來(lái)適應(yīng)計(jì)算機(jī),來(lái)死記硬背計(jì)算機(jī)的使用規(guī)則的情況。而是反過(guò)來(lái)讓計(jì)算機(jī)來(lái)適應(yīng)人的習(xí)慣和要求,以人所習(xí)慣的方式與人進(jìn)行信息交換,也就是讓計(jì)算機(jī)具有視覺(jué)、聽(tīng)覺(jué)和說(shuō)話等能力。這時(shí)計(jì)算機(jī)必須具有邏輯推理和決策的能力。具有上述能力的計(jì)算機(jī)就是智能計(jì)算機(jī)。計(jì)算機(jī)視覺(jué)就是用各種成象系統(tǒng)代替視覺(jué)器官作為輸入敏感手段,由計(jì)算機(jī)來(lái)代替大腦完成處理和解釋。計(jì)算機(jī)視覺(jué)的最終研究目標(biāo)就是使計(jì)算機(jī)能象人那樣通過(guò)視覺(jué)觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。而計(jì)算機(jī)視覺(jué)技術(shù)正廣泛的應(yīng)用于各個(gè)方面,充醫(yī)學(xué)圖像到遙感圖像,充各有檢查到文件處理。在需要人類(lèi)視覺(jué)的場(chǎng)合幾乎都需要用感到計(jì)算機(jī)視覺(jué),許多人類(lèi)視覺(jué)無(wú)法感知的場(chǎng)合,如精確定律感知、危險(xiǎn)場(chǎng)景感知、不可見(jiàn)物體感知等,計(jì)算機(jī)視覺(jué)更突出他的優(yōu)越性?,F(xiàn)在計(jì)算機(jī)視覺(jué)已在一些領(lǐng)域的到應(yīng)用,如零件識(shí)別與定位,產(chǎn)品的檢驗(yàn),移動(dòng)機(jī)器人導(dǎo)航遙感圖像分析,安全減半、監(jiān)視與跟蹤,國(guó)防系統(tǒng)等。它們的應(yīng)用于計(jì)算機(jī)視覺(jué)的發(fā)展起著相互促進(jìn)的作用。2、計(jì)算機(jī)視覺(jué)與人類(lèi)視覺(jué)計(jì)算機(jī)視覺(jué)正如它的名字一樣,就是一門(mén)研究計(jì)算機(jī)“看”的學(xué)科,即使指通過(guò)攝像機(jī)和計(jì)算機(jī)的處理來(lái)對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等,并進(jìn)一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像。作為一個(gè)科學(xué)學(xué)科,計(jì)算機(jī)視覺(jué)研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng)。同時(shí)計(jì)算機(jī)視覺(jué)也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué)。通過(guò)這些技術(shù)來(lái)讓計(jì)算機(jī)代替人完成對(duì)問(wèn)題的處理。計(jì)算機(jī)視覺(jué)最終的目標(biāo)是讓計(jì)算機(jī)能夠像人一樣通過(guò)視覺(jué)對(duì)外部環(huán)境進(jìn)行觀察和理解,從而具有自主適應(yīng)環(huán)境的能力。雖然當(dāng)前還難以實(shí)現(xiàn),但人們正超這一目標(biāo)努力。現(xiàn)在的前期目標(biāo)是建立一個(gè)初步的系統(tǒng),這個(gè)系統(tǒng)能夠反饋某種程度的信息,能在一定程度上完成一些任務(wù)。比如自主車(chē)輛的視覺(jué)導(dǎo)航,這種導(dǎo)航能夠使車(chē)輛在高手公路上具有道路跟蹤能力,可避免與前方車(chē)輛碰撞的視覺(jué)輔助駕駛系統(tǒng)。這種系統(tǒng)就像是在開(kāi)車(chē)一樣,它是模仿人腦進(jìn)行各種判斷。而就目前而言人類(lèi)視覺(jué)系統(tǒng)是人們所知道的功能最強(qiáng)大和完善的視覺(jué)系統(tǒng)。因此,對(duì)人類(lèi)視覺(jué)處理機(jī)制的研究將給計(jì)算機(jī)視覺(jué)的研究提供啟發(fā)和指導(dǎo)。視覺(jué)是人類(lèi)最重要的感覺(jué),它是人類(lèi)的主要感覺(jué)來(lái)源,人類(lèi)認(rèn)識(shí)外界信息80%來(lái)自視覺(jué)。人們看東西的時(shí)候視乎是毫不費(fèi)力、輕而易舉的事,但實(shí)際上視覺(jué)系統(tǒng)在你看東西的時(shí)候所完成的工作是十分復(fù)雜的。當(dāng)眼睛看到某種東西時(shí),先要對(duì)它的各部分進(jìn)行分類(lèi),然后從中選出有用的特征信息來(lái)做出判斷。人的眼睛并不會(huì)對(duì)事物、信息進(jìn)行判斷,它是將信息反饋給大腦,然后大腦根據(jù)得到的信息與原來(lái)大腦里的信息來(lái)進(jìn)行比較得出解釋結(jié)果。敏感、感覺(jué)、認(rèn)識(shí)是視覺(jué)系統(tǒng)的3個(gè)重要的概念。敏感是把外界的各種刺激轉(zhuǎn)換成人體神經(jīng)系統(tǒng)能夠及時(shí)的生物點(diǎn)信號(hào)。它所完成的是信號(hào)的轉(zhuǎn)換,并不涉及對(duì)信號(hào)的理解。感覺(jué)的任務(wù)是把敏感器官的各種輸入轉(zhuǎn)換和處理成為對(duì)外部世界的理解。而認(rèn)識(shí)是以人們對(duì)周?chē)陀^世界的概念為基礎(chǔ)的。如果沒(méi)有感覺(jué)作為人與外部世界的橋梁或窗口,人的思維活動(dòng)就失去了基本的依據(jù)了。因此人們?cè)谀7氯祟?lèi)視覺(jué)時(shí)需要相應(yīng)的各種處理,比如攝取圖像,處理圖像,理解圖像。3、 計(jì)算機(jī)視覺(jué)的研究3.1計(jì)算機(jī)視覺(jué)的處理過(guò)程模仿人類(lèi)的視覺(jué)系統(tǒng),計(jì)算機(jī)視覺(jué)系統(tǒng)中信息的處理和分析大致可以分成兩個(gè)階段:圖象處理階段又稱(chēng)視覺(jué)處理中的低水平和中水平階段;圖象分析、理解階段又稱(chēng)視覺(jué)處理中的高水平處理階段。在圖象處理階段,計(jì)算機(jī)對(duì)圖象信息進(jìn)行一系列的加工處理,這主要是:(1)、校正成象過(guò)程中系統(tǒng)引進(jìn)的光度學(xué)和幾何學(xué)的畸變,抑制和去除成象過(guò)程中引進(jìn)的噪聲統(tǒng)稱(chēng)為圖象的恢復(fù)。(2)、從圖象信息如亮度分布信息中提取諸如邊沿信息,深度信息圖象點(diǎn)沿軸方向的尺度,表面三維傾斜方向信息等反映客觀景物特征的信息。(3)、根據(jù)抽取的特征信息把反映三維客體的各個(gè)圖象基元,如輪廓、線條、紋理、邊緣、邊界、物體的各個(gè)面等從圖象中分離出來(lái),并且建立起各個(gè)基元之間的拓樸學(xué)上的和幾何學(xué)上的關(guān)系稱(chēng)之基元的分割和關(guān)系的確定。在圖象分析和理解階段,計(jì)算機(jī)根據(jù)事先存貯在數(shù)據(jù)庫(kù)中的預(yù)知識(shí)模型,識(shí)別出各個(gè)基元或某些基元組合所代表的客觀世界中的某些實(shí)體稱(chēng)之為模型匹配以及根據(jù)圖象中各基元之間的關(guān)系在預(yù)知識(shí)的指導(dǎo)下得出圖象所代表的實(shí)際景物的含義,得出圖象的解釋或描述。3.2計(jì)算機(jī)視覺(jué)的處理技術(shù)3.2.1圖像獲取圖像的獲取是通過(guò)輸入設(shè)備來(lái)得到的。輸入設(shè)備包括成像設(shè)備和數(shù)字化設(shè)備。成像設(shè)備是通過(guò)光學(xué)攝像機(jī)或紅外、激光、超聲、X射線對(duì)周?chē)鷪?chǎng)景或物體進(jìn)行探測(cè)成像,得到關(guān)于場(chǎng)景或物體的二維或三維數(shù)字圖像。好的成像系統(tǒng)能夠很好的對(duì)圖像的處理做好前期準(zhǔn)備。如紅外成像系統(tǒng),激光成像系統(tǒng),還有計(jì)算機(jī)成像系統(tǒng),即每個(gè)像素元(或)若干像素元對(duì)應(yīng)一個(gè)簡(jiǎn)單的處理器,這樣可以適應(yīng)復(fù)雜場(chǎng)景動(dòng)態(tài)變化的場(chǎng)合。3.2.2圖像預(yù)處理這一過(guò)程主要對(duì)輸入的原始圖像進(jìn)行處理。這一過(guò)程借助大量的圖像處理技術(shù)和算法,如圖像濾波、圖像增強(qiáng)、邊緣檢測(cè)等,以便從圖像中抽取諸如角點(diǎn)、邊緣、線條、邊界已經(jīng)色彩等官員場(chǎng)景的基本特征;這一過(guò)程還包括了各種圖像變換(如校正)、圖像紋理檢測(cè)、圖像運(yùn)動(dòng)檢測(cè)等。在對(duì)圖像實(shí)施具體的計(jì)算機(jī)視覺(jué)方法來(lái)提取某種特定的信息前,一種或一些預(yù)處理往往被采用來(lái)使圖像滿足后繼方法的要求。3.2.3圖像復(fù)合主要任務(wù)是恢復(fù)場(chǎng)景的深度、表面法線方向、輪廓等有關(guān)場(chǎng)景的2.5維信息,實(shí)現(xiàn)的途徑有立體視覺(jué)、測(cè)距成像、運(yùn)動(dòng)估計(jì)、明暗特征、紋理特征等所謂的蔥X恢復(fù)形狀的估計(jì)方法。系統(tǒng)表達(dá)、系統(tǒng)成像模型等研究?jī)?nèi)容一般也在這里進(jìn)行。3.2.4圖像恢復(fù)任務(wù)是在以物體為中心的坐標(biāo)系中,在原始輸入圖像,圖像基本特征、2.5為圖像的基礎(chǔ)上,恢復(fù)舞臺(tái)的完整三維圖,建立舞臺(tái)三維描述,識(shí)別三維物體并確定舞臺(tái)的位置和方向。3.2.5圖像理解到這一步是為了辨別物體并對(duì)物體進(jìn)行分類(lèi)。經(jīng)過(guò)前幾個(gè)步驟的處理將被認(rèn)為含有目標(biāo)物體的部分進(jìn)行處理。驗(yàn)證得到的數(shù)據(jù)是否符合前提要求,估測(cè)待定系數(shù),比如目標(biāo)姿態(tài),體積,位置等。最后進(jìn)目標(biāo)進(jìn)行分類(lèi)理解,解釋目標(biāo)的各種特性。4、 對(duì)計(jì)算機(jī)視覺(jué)的認(rèn)識(shí)從80年代至今,研究者夢(mèng)對(duì)計(jì)算機(jī)視覺(jué)各個(gè)層次進(jìn)行了大量的研究,在國(guó)際上以計(jì)算機(jī)視覺(jué)為主題,或主要以計(jì)算機(jī)視覺(jué)為主題的國(guó)際會(huì)議有國(guó)際計(jì)算機(jī)視覺(jué)會(huì)議(ICCV),國(guó)際模式識(shí)別會(huì)議(ICPR),國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議(CVPR)等每年都有大量的論文發(fā)表。大體上將,對(duì)計(jì)算機(jī)視覺(jué)系統(tǒng)的各個(gè)部分,研究者們都在計(jì)算理論、表達(dá)與算法及硬件實(shí)現(xiàn)等各個(gè)層次上提出了大量的方法。但這些方
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國(guó)合資車(chē)行業(yè)發(fā)展概況及行業(yè)投資潛力預(yù)測(cè)報(bào)告
- 書(shū)皮壓痕機(jī)項(xiàng)目投資可行性研究分析報(bào)告(2024-2030版)
- 2025年中國(guó)控制器PLC行業(yè)市場(chǎng)深度分析及投資策略研究報(bào)告
- 2025年 車(chē)工中級(jí)職業(yè)技能考試試題單選題、判斷題附答案
- 2021-2026年中國(guó)電纜組裝市場(chǎng)全面調(diào)研及行業(yè)投資潛力預(yù)測(cè)報(bào)告
- 2025年中國(guó)航天器市場(chǎng)運(yùn)行現(xiàn)狀及行業(yè)發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- 中國(guó)住宿服務(wù)行業(yè)發(fā)展趨勢(shì)及投資前景預(yù)測(cè)報(bào)告
- 管制移動(dòng)式單搖床行業(yè)深度研究分析報(bào)告(2024-2030版)
- 2025-2030年中國(guó)紅外水份儀項(xiàng)目投資可行性研究分析報(bào)告
- 2025年眼科市場(chǎng)調(diào)查報(bào)告
- (完整版)基建建設(shè)工程流程圖
- 墻體開(kāi)槽技術(shù)交底及記錄
- 國(guó)家開(kāi)放大學(xué)《調(diào)劑學(xué)(本)》形考任務(wù)1-4參考答案
- 公務(wù)員工資套改和運(yùn)行案例
- 鐵路貨物裝載常用計(jì)算公式
- 哥尼斯堡七橋問(wèn)題PPT課件
- 總包(消防)管理方案
- 電吹風(fēng)的設(shè)計(jì)標(biāo)準(zhǔn)(2008版)
- 高爐噴吹煤粉項(xiàng)目可行性研究報(bào)告寫(xiě)作范文
- 工具鉗工理論知識(shí)鑒定要素細(xì)目表09版
- 真空泵、化工泵計(jì)算
評(píng)論
0/150
提交評(píng)論