計(jì)算機(jī)視覺(jué)參考模板_第1頁(yè)
計(jì)算機(jī)視覺(jué)參考模板_第2頁(yè)
計(jì)算機(jī)視覺(jué)參考模板_第3頁(yè)
計(jì)算機(jī)視覺(jué)參考模板_第4頁(yè)
計(jì)算機(jī)視覺(jué)參考模板_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)算機(jī)視覺(jué)結(jié)課論文姓名:張猛 學(xué)號(hào):08083403 學(xué)院:計(jì)算機(jī)學(xué)院 班級(jí):計(jì)科08-3班1 / 11計(jì)算機(jī)視覺(jué)研究引言作為計(jì)算機(jī)專(zhuān)業(yè)的學(xué)生,在學(xué)習(xí)計(jì)算機(jī)是覺(jué)得過(guò)程中,基本上可以聽(tīng)明白老師講課的內(nèi)容,但是后來(lái)的課程還是有些聽(tīng)不懂了,因?yàn)橐呀?jīng)大三了,所以專(zhuān)業(yè)課程很緊張,也沒(méi)有太多的時(shí)間能學(xué)習(xí)計(jì)算機(jī)視覺(jué)方面的相關(guān)知識(shí),但是,因?yàn)樽约菏煜hotoshop,一直用了三年了,在老師講課之后,我才知道,原來(lái)自己用了這么多年的photoshop,知識(shí)應(yīng)用,對(duì)于其中的一些基本原理并不知曉,例如,圖像相加,圖像想減,直方圖等等,立馬上我跟photoshop里面的一些功能聯(lián)系起來(lái),例如層的概念,還有圖層模式,

2、還有直方圖,閾值,高斯模糊等等功能的原理,有了進(jìn)一步的理解,這也是每一次上課,我都會(huì)去認(rèn)真的聽(tīng)課,這篇論文主要講計(jì)算機(jī)視覺(jué)在圖像處理方面的應(yīng)用吧,當(dāng)然具體可以有很多,甚至可以應(yīng)用在任何計(jì)算機(jī)視覺(jué)系統(tǒng)中,因?yàn)椋闹饕蝿?wù)就是識(shí)別。目錄計(jì)算機(jī)視覺(jué)結(jié)課論文1姓名:張猛1學(xué)號(hào):080834031學(xué)院:計(jì)算機(jī)學(xué)院1班級(jí):計(jì)科08-3班1計(jì)算機(jī)視覺(jué)研究2引言2緒論2正文3圖像分析3關(guān)鍵技術(shù)4圖像的獲取4圖像的增強(qiáng)5圖像的平滑5圖像的數(shù)據(jù)編碼和傳輸6邊緣銳化6圖像的分割6圖像的識(shí)別7存在問(wèn)題7緒論計(jì)算機(jī)視覺(jué)學(xué)是自二十世紀(jì)六十年代中期迅速發(fā)展起來(lái)的一門(mén)新學(xué)科。它是個(gè)邊緣學(xué)科, 集眾家之所長(zhǎng), 是個(gè)工程性很強(qiáng)

3、的技術(shù), 主要需要有空間幾何、 矩陣分析、光電技術(shù)、圖像處理、應(yīng)用數(shù)學(xué)、離散數(shù)學(xué)及計(jì)算機(jī)技術(shù)等等各個(gè)方 面的知識(shí),才能正確的指導(dǎo)視覺(jué)系統(tǒng)的建模、解模及實(shí)際工程問(wèn)題的解決方法。 計(jì)算機(jī)視覺(jué)是使用計(jì)算機(jī)及相關(guān)設(shè)備對(duì)生物視覺(jué)的一種模擬。它的主要任務(wù)就 是通過(guò)對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的三維信息,就像人 類(lèi)和許多其他類(lèi)生物每天所做的那樣。由于算機(jī)視覺(jué)學(xué)在工農(nóng)業(yè)生產(chǎn)、地質(zhì) 學(xué)、天文學(xué)、氣象學(xué)、醫(yī)學(xué)及軍事并學(xué)等領(lǐng)域有著極大的潛在應(yīng)用價(jià)值,所以它 在國(guó)際上越來(lái)越受人重視。計(jì)算機(jī)視覺(jué)既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個(gè)富有挑戰(zhàn)性重要研究領(lǐng)域。計(jì)算機(jī)視覺(jué)是一門(mén)綜合性的學(xué)科,它已經(jīng)吸引了來(lái)自各個(gè)學(xué)科的

4、研究者參加到對(duì)它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號(hào)處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。計(jì)算機(jī)視覺(jué)學(xué)所研究的對(duì)象,簡(jiǎn)單地說(shuō)就是研究如何讓計(jì)算機(jī)通過(guò)圖像傳感器或其它光傳感器來(lái)感知、分析和理解周?chē)h(huán)境。人類(lèi)感知外界環(huán)境主要通過(guò)視覺(jué),聽(tīng)覺(jué)和觸覺(jué)等四大感覺(jué)系統(tǒng)。其中視覺(jué)系統(tǒng)是最復(fù)雜的。人類(lèi)從外界獲得的信息中視覺(jué)信號(hào)量最大。模仿人類(lèi)的視覺(jué)系統(tǒng),計(jì)算機(jī)視覺(jué)系統(tǒng)中信息的處理和分析大致可以分成兩個(gè)階段:圖像處理階段又稱(chēng)視覺(jué)處理中的低水平和中水平階段;圖像分析、理解階段又稱(chēng)視覺(jué)處理中的高水平處理階段。正文圖像分析在圖像處理階段,計(jì)算機(jī)對(duì)圖像信息進(jìn)行一系列的加工處理,這主要是:1、校正成

5、象過(guò)程中系統(tǒng)引進(jìn)的光度學(xué)和幾何學(xué)的畸變,抑制和去除成象過(guò)程中引進(jìn)的噪聲統(tǒng)稱(chēng)為圖像的恢復(fù)。2、從圖像信息如亮度分布信息中提取諸如邊沿信息,深度信息圖像點(diǎn)沿軸方向的尺度,表面三維傾斜方向信息等反映客觀景物特征的信息。3、根據(jù)抽取的特征信息把反映三維客體的各個(gè)圖像基元,如輪廓、線(xiàn)條、紋理、邊緣、邊界、物體的各個(gè)面等從圖像中分離出來(lái),并且建立起各個(gè)基元之間的拓樸學(xué)上的和幾何學(xué)上的關(guān)系稱(chēng)之基元的分割和關(guān)系的確定。在圖像分析和理解階段,計(jì)算機(jī)根據(jù)事先存貯在數(shù)據(jù)庫(kù)中的預(yù)知識(shí)模型,識(shí)別出各個(gè)基元或某些基元組合所代表的客觀世界中的某些實(shí)體稱(chēng)之為模型匹配以及根據(jù)圖像中各基元之間的關(guān)系在預(yù)知識(shí)的指導(dǎo)下得出圖像所代表

6、的實(shí)際景物的含義,得出圖像的解釋或描述。必須強(qiáng)調(diào),預(yù)知識(shí)在視覺(jué)系統(tǒng)中起著相當(dāng)重要的作用。在預(yù)知識(shí)庫(kù)中存放著各種實(shí)際可能遇到的物體的知識(shí)模型,和實(shí)際景物中各種物體之間的約束關(guān)系。計(jì)算機(jī)的作用是根據(jù)被分析的圖像中的各基元及其關(guān)系,利用預(yù)知識(shí)作為指導(dǎo),通過(guò)匹配,搜索和推理等手段,最終得到對(duì)圖像的描述。在整個(gè)過(guò)程中預(yù)知識(shí)時(shí)刻提供處理的樣板和證據(jù)。每一步的處理結(jié)果隨時(shí)同預(yù)知識(shí)進(jìn)行對(duì)比。有時(shí),處理的中間結(jié)果和最終結(jié)果還要饋送給預(yù)知識(shí)庫(kù)作為知識(shí)的更新和積累。關(guān)鍵技術(shù)機(jī)器視覺(jué)系統(tǒng)主要由三部分組成:圖像的獲取、圖像的處理和分析、輸出或顯示。將近80%的工業(yè)視覺(jué)系統(tǒng)主要用在檢測(cè)方面,包括用于提高生產(chǎn)效率、控制生產(chǎn)

7、過(guò)程中的產(chǎn)品質(zhì)量、采集產(chǎn)品數(shù)據(jù)等。產(chǎn)品的分類(lèi)和選擇也集成于檢測(cè)功能中。下面通過(guò)一個(gè)用于生產(chǎn)線(xiàn)上的單攝像機(jī)視覺(jué)系統(tǒng),說(shuō)明系統(tǒng)的組成及功能。視覺(jué)系統(tǒng)檢測(cè)生產(chǎn)線(xiàn)上的產(chǎn)品,決定產(chǎn)品是否符合質(zhì)量要求,并根據(jù)結(jié)果,產(chǎn)生相應(yīng)的信號(hào)輸入上位機(jī)。圖像獲取設(shè)備包括光源、攝像機(jī)等;圖像處理設(shè)備包括相應(yīng)的軟件和硬件系統(tǒng);輸出設(shè)備是與制造過(guò)程相連的有關(guān)系統(tǒng),包括過(guò)程控制器和報(bào)警裝置等。數(shù)據(jù)傳輸?shù)接?jì)算機(jī),進(jìn)行分析和產(chǎn)品控制,若發(fā)現(xiàn)不合格品,則報(bào)警器告警,并將其排除出生產(chǎn)線(xiàn)。機(jī)器視覺(jué)的結(jié)果是CAQ系統(tǒng)的質(zhì)量信息來(lái)源,也可以和CIMS其它系統(tǒng)集成。圖像的獲取圖像的獲取實(shí)際上是將被測(cè)物體的可視化圖像和內(nèi)在特征轉(zhuǎn)換成能被計(jì)算機(jī)處

8、理的一系列數(shù)據(jù),它主要由三部分組成: 照明 圖像聚焦形成 圖像確定和形成攝像機(jī)輸出信號(hào)1、照明照明和影響機(jī)器視覺(jué)系統(tǒng)輸入的重要因素,因?yàn)樗苯佑绊戄斎霐?shù)據(jù)的質(zhì)量和至少30%的應(yīng)用效果。由于沒(méi)有通用的機(jī)器視覺(jué)照明設(shè)備,所以針對(duì)每個(gè)特定的應(yīng)用實(shí)例,要選擇相應(yīng)的照明裝置,以達(dá)到最佳效果。過(guò)去,許多工業(yè)用的機(jī)器視覺(jué)系統(tǒng)用可見(jiàn)光作為光源,這主要是因?yàn)榭梢?jiàn)光容易獲得,價(jià)格低,并且便于操作。常用的幾種可見(jiàn)光源是、日光燈、水銀燈和鈉光燈。但是,這些光源的一個(gè)最大缺點(diǎn)是光能不能保持穩(wěn)定。以日光燈為例,在使用的第一個(gè)100小時(shí)內(nèi),光能將下降15%,隨著使用時(shí)間的增加,光能將不斷下降。因此,如何使光能在一定的程度上

9、保持穩(wěn)定,是實(shí)用化過(guò)程中急需要解決的問(wèn)題。另一個(gè)方面,環(huán)境光將改變這些光源照射到物體上的總光能,使輸出的圖像數(shù)據(jù)存在噪聲,一般采用加防護(hù)屏的方法,減少環(huán)境光的影響。由于存在上述問(wèn)題,在現(xiàn)今的工業(yè)應(yīng)用中,對(duì)于某些要求高的檢測(cè)任務(wù),常采用X射線(xiàn)、超聲波等不可見(jiàn)光作為光源。但是不可見(jiàn)光不利于檢測(cè)系統(tǒng)的操作,且價(jià)格較高,所以,目前在實(shí)際應(yīng)用中,仍多用可見(jiàn)光作為光源。照明系統(tǒng)按其照射方法可分為:背向照明、前向照明、結(jié)構(gòu)光和頻閃光照明等。其中,背向照明是被測(cè)物放在光源和攝像機(jī)之間,它的優(yōu)點(diǎn)是能獲得高對(duì)比度的圖像。前向照明是光源和攝像機(jī)位于被測(cè)物的同側(cè),這種方式便于安裝。結(jié)構(gòu)光照明是將光柵或線(xiàn)光源等投射到被

10、測(cè)物上,根據(jù)它們產(chǎn)生的畸變,解調(diào)出被測(cè)物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,照相機(jī)拍攝要求與光源同步。2、圖像聚焦形成被測(cè)物的圖像通過(guò)一個(gè)透鏡聚焦在敏感元件上,如同照相機(jī)拍照一樣。所不同的是照相機(jī)使用膠卷,而機(jī)器視覺(jué)系統(tǒng)使用傳感器來(lái)捕捉圖像,傳感器將可視圖像轉(zhuǎn)化為電信號(hào),便于計(jì)算機(jī)處理。選取機(jī)器視覺(jué)系統(tǒng)中的攝像機(jī)應(yīng)根據(jù)實(shí)際應(yīng)用的要求,其中攝像機(jī)的透鏡參數(shù)是一項(xiàng)重要指標(biāo)。透鏡參數(shù)分為四個(gè)部分:放大倍率、焦距、景深和透鏡安裝。3、圖像確定和形成攝像機(jī)輸出信號(hào)機(jī)器視覺(jué)系統(tǒng)實(shí)際上是一個(gè)光電轉(zhuǎn)換裝置,即將傳感器所接收到的透鏡成像,轉(zhuǎn)化為什么算機(jī)能處理的電信號(hào)、攝像機(jī)可以是電子管的,也可

11、是固體狀態(tài)傳感單元。電子管攝像機(jī)發(fā)展較早,20世紀(jì)30年代就已應(yīng)用于商業(yè)電視,它采用包含光感元件的真空管進(jìn)行圖像傳感,將所接收到的圖像轉(zhuǎn)換成模擬電壓信號(hào)輸出。具有RS-170輸出制式的攝像機(jī)可直接與商用電視顯示器相連。固體狀態(tài)攝像機(jī)是在20世紀(jì)60年代后期,美國(guó)貝爾電話(huà)實(shí)驗(yàn)室發(fā)明了電荷耦合裝置(CCD),而發(fā)展起來(lái)的。它上分布于各個(gè)像元的光敏二極管的線(xiàn)性陣列或矩形陣列構(gòu)成,通過(guò)按一定順序輸出每個(gè)二極管的電壓脈沖,實(shí)現(xiàn)將圖像光信號(hào)轉(zhuǎn)換成電信號(hào)的目的。輸出的電壓脈沖序列可以直接以RS-170制式輸入標(biāo)準(zhǔn)電視顯示器,或者輸入計(jì)算機(jī)的內(nèi)存,進(jìn)行數(shù)值化處理。CCD是現(xiàn)在最常用的機(jī)器視覺(jué)傳感器。圖像處理技

12、術(shù)機(jī)器視覺(jué)系統(tǒng)中,視覺(jué)信息的處理技術(shù)主要依賴(lài)于圖像處理方法,它包括圖像增強(qiáng)、數(shù)據(jù)編碼和傳輸、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過(guò)這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺(jué)效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。圖像的增強(qiáng) 圖像的增強(qiáng)用于調(diào)整圖像的對(duì)比度,突出圖像中的重要細(xì)節(jié),改善視覺(jué)質(zhì)量。通常采用灰度直方圖修改技術(shù)進(jìn)行圖像增強(qiáng)。圖像的灰度直方圖是表示一幅圖像灰度分布情況的統(tǒng)計(jì)特性圖表,與對(duì)比度緊密相連。通常,在計(jì)算機(jī)中表示的一幅二維數(shù)字圖像可表示為一個(gè)矩陣,其矩陣中的元素是位于相應(yīng)坐標(biāo)位置的圖像灰度值,是離散化的整數(shù),一般取0,1,255。這主

13、要是因?yàn)橛?jì)算機(jī)中的一個(gè)字節(jié)所表示的數(shù)值范圍是0255。另外,人眼也只能分辨32個(gè)左右的灰度級(jí)。所以,用一個(gè)字節(jié)表示灰度即可。但是,直方圖僅能統(tǒng)計(jì)某級(jí)灰度像素出現(xiàn)的概率,反映不出該像素在圖像中的二維坐標(biāo)。因此,不同的圖像有可能具有相同的直方圖。通過(guò)灰度直方圖的形狀,能判斷該圖像的清晰度和黑白對(duì)比度。如果獲得一幅圖像的直方圖效果不理想,可以通過(guò)直方圖均衡化處理技術(shù)作適當(dāng)修改,即把一幅已知灰度概率分布圖像中的像素灰度作某種映射變換,使它變成一幅具有均勻灰度概率分布的新圖像,實(shí)現(xiàn)使圖像清晰的目的。圖像的平滑圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過(guò)程中,因成像設(shè)備和環(huán)境所造成的圖像

14、失真,提取有用信息。眾所周知,實(shí)際獲得的圖像在形成、傳輸、接收和處理的過(guò)程中,不可避免地存在著外部干擾和內(nèi)部干擾,如光電轉(zhuǎn)換過(guò)程中敏感元件靈敏度的不均勻性、數(shù)字化過(guò)程的量化噪聲、傳輸過(guò)程中的誤差以及人為因素等,均會(huì)使圖像變質(zhì)。因此,去除噪聲,恢復(fù)原始圖像是圖像處理中的一個(gè)重要內(nèi)容。在本世紀(jì)四、五十年代發(fā)展起來(lái)的線(xiàn)性濾波器以其完善的理論基礎(chǔ),數(shù)學(xué)處理方便,易于采用FFT和硬件實(shí)現(xiàn)等優(yōu)點(diǎn),一直在圖像濾波領(lǐng)域占有重要地位,其中以WIENER濾波器理論和卡爾曼濾波理論為代表。但是線(xiàn)性濾波器存在著計(jì)算復(fù)雜度高,不便于實(shí)時(shí)處理等缺點(diǎn)。雖然它對(duì)高斯噪聲有良好的平滑作用,但對(duì)脈沖信號(hào)干擾和其它形式的噪聲干擾抑

15、制效果差,信號(hào)邊緣模糊。為此,1971年,著名學(xué)者TUKEY提出非線(xiàn)笥濾波器中值濾波器,即把局部區(qū)域中灰度的中值作為輸出灰度,并將其與統(tǒng)計(jì)學(xué)理論結(jié)合起來(lái),使用迭代方法,比較理想地將圖像從噪聲中恢復(fù)出來(lái),并且能保護(hù)圖像的輪廓邊界,不使其變模糊。近年來(lái),非線(xiàn)性濾波理論在機(jī)器視覺(jué)、醫(yī)學(xué)成像、語(yǔ)音處理等領(lǐng)域有了廣泛的應(yīng)用,同時(shí),也反過(guò)來(lái)促使該理論的研究向縱深方向發(fā)展。圖像的數(shù)據(jù)編碼和傳輸數(shù)字圖像的數(shù)據(jù)量是相當(dāng)龐大的,一幅512*512個(gè)像素的數(shù)字圖像的數(shù)據(jù)量為256 K字節(jié),若假設(shè)每秒傳輸25幀圖像,則傳輸?shù)男诺浪俾蕿?2.4M比特/秒。高信道速率意味著高投資,也意味著普及難度的增加。因此,傳輸過(guò)程中

16、,對(duì)圖像數(shù)據(jù)進(jìn)行壓縮顯得非常重要。數(shù)據(jù)的壓縮主要通過(guò)圖像數(shù)據(jù)的編碼和變換壓縮完成。圖像數(shù)據(jù)編碼一般采用預(yù)測(cè)編碼,即將圖像數(shù)據(jù)的空間變化規(guī)律和序列變化規(guī)律用一個(gè)預(yù)測(cè)公式表示,如果知道了某一像素的前面各相鄰像素值之后,可以用公式預(yù)測(cè)該像素值。采用預(yù)測(cè)編碼,一般只需傳輸圖像數(shù)據(jù)的起始值和預(yù)測(cè)誤差,因此可將8比特/像素壓縮到2比特/像素。變換壓縮方法是將整幅圖像分成一個(gè)個(gè)小的(8*8或16*16)數(shù)據(jù)塊,再將這些數(shù)據(jù)塊分類(lèi)、變換、量化,從而構(gòu)成自適應(yīng)的變換壓縮系統(tǒng)。該方法可將一幅圖像的數(shù)據(jù)壓縮到為數(shù)不多的幾十個(gè)特傳輸,在接收端再變換回去即可。邊緣銳化圖像邊緣銳化處理主要是加強(qiáng)圖像中的輪廓邊緣和細(xì)節(jié),形

17、成完整的物體邊界,達(dá)到將物體從圖像中分離出來(lái)或?qū)⒈硎就晃矬w表面的區(qū)域檢測(cè)出來(lái)的目的。它是早期視覺(jué)理論和算法中的基本問(wèn)題,也是中期和后期視覺(jué)成敗的重要因素之一。圖像的分割圖像分割是將圖像分成若干部分,每一部分對(duì)應(yīng)于某一物體表面,在進(jìn)行分割時(shí),每一部分的灰度或紋理符合某一種均勻測(cè)度度量。某本質(zhì)是將像素進(jìn)行分類(lèi)。分類(lèi)的依據(jù)是像素的灰度值、顏色、頻譜特性、空間特性或紋理特性等。圖像分割是圖像處理技術(shù)的基本方法之一,應(yīng)用于諸如染色體分類(lèi)、景物理解系統(tǒng)、機(jī)器視覺(jué)等方面。圖像分割主要有兩種方法:一是鑒于度量空間的灰度閾值分割法。它是根據(jù)圖像灰度直方圖來(lái)決定圖像空間域像素聚類(lèi)。但它只利用了圖像灰度特征,并沒(méi)

18、有利用圖像中的其它有用信息,使得分割結(jié)果對(duì)噪聲十分敏感;二是空間域區(qū)域增長(zhǎng)分割方法。它是對(duì)在某種意義上(如灰度級(jí)、組織、梯度等)具有相似性質(zhì)的像素連通集構(gòu)成分割區(qū)域,該方法有很好的分割效果,但缺點(diǎn)是運(yùn)算復(fù)雜,處理速度慢。其它的方法如邊緣追蹤法,主要著眼于保持邊緣性質(zhì),跟蹤邊緣并形成閉合輪廓,將目標(biāo)分割出來(lái);錐體圖像數(shù)據(jù)結(jié)構(gòu)法和標(biāo)記松弛迭代法同樣是利用像素空間分布關(guān)系,將邊鄰的像素作合理的歸并。而基于知識(shí)的分割方法則是利用景物的先驗(yàn)信息和統(tǒng)計(jì)特性,首先對(duì)圖像進(jìn)行初始分割,抽取區(qū)域特征,然后利用領(lǐng)域知識(shí)推導(dǎo)區(qū)域的解釋?zhuān)詈蟾鶕?jù)解釋對(duì)區(qū)域進(jìn)行合并。圖像的識(shí)別圖像的識(shí)別過(guò)程實(shí)際上可以看作是一個(gè)標(biāo)記過(guò)程

19、,即利用識(shí)別算法來(lái)辨別景物中已分割好的各個(gè)物體,給這些物體賦予特定的標(biāo)記,它是機(jī)器視覺(jué)系統(tǒng)必須完成的一個(gè)任務(wù)。按照?qǐng)D像識(shí)別從易到難,可分為三類(lèi)問(wèn)題。第一類(lèi)識(shí)別問(wèn)題中,圖像中的像素表達(dá)了某一物體的某種特定信息。如遙感圖像中的某一像素代表地面某一位置地物的一定光譜波段的反射特性,通過(guò)它即可判別出該地物的種類(lèi)。第二類(lèi)問(wèn)題中,待識(shí)別物是有形的整體,二維圖像信息已經(jīng)足夠識(shí)別該物體,如文字識(shí)別、某些具有穩(wěn)定可視表面的三維體識(shí)別等。但這類(lèi)問(wèn)題不像第一類(lèi)問(wèn)題容易表示成特征矢量,在識(shí)別過(guò)程中,應(yīng)先將待識(shí)別物體正確地從圖像的背景中分割出來(lái),再設(shè)法將建立起來(lái)的圖像中物體的屬性圖與假定模型庫(kù)的屬性圖之間匹配。第三類(lèi)問(wèn)

20、題是由輸入的二維圖、要素圖、2·5維圖等,得出被測(cè)物體的三維表示。這里存著如何將隱含的三維信息提取出來(lái)的問(wèn)題,當(dāng)是今研究的熱點(diǎn)。目前用于圖像識(shí)別的方法主要分為決策理論和結(jié)構(gòu)方法。決策理論方法的基礎(chǔ)是決策函數(shù),利用它對(duì)模式向量進(jìn)行分類(lèi)識(shí)別,是以定時(shí)描述(如統(tǒng)計(jì)紋理)為基礎(chǔ)的;結(jié)構(gòu)方法的核心是將物體分解成了模式或模式基元,而不同的物體結(jié)構(gòu)有不同的基元串(或稱(chēng)字符串),通過(guò)對(duì)未知物體利用給定的模式基元求出編碼邊界,得到字符串,再根據(jù)字符串判斷它的屬類(lèi)。這是一種依賴(lài)于符號(hào)描述被測(cè)物體之間關(guān)系的方法。存在問(wèn)題計(jì)算機(jī)視覺(jué)研究經(jīng)歷了近40年的過(guò)程,仍面臨許多問(wèn)題。主要由于這一方向是多學(xué)科的交叉與結(jié)合,同時(shí)視覺(jué)是一個(gè)涉及生理、心理的復(fù)雜過(guò)程,不僅與眼睛有關(guān),還和大腦的推理、學(xué)習(xí)有關(guān)。研究計(jì)算機(jī)視覺(jué)的目的是要實(shí)現(xiàn)對(duì)人類(lèi)視覺(jué)的模擬和延伸。對(duì)于人類(lèi)而言,視覺(jué)是一個(gè)輕而易舉的功能,對(duì)機(jī)器卻不同。視覺(jué)過(guò)程很難用類(lèi)似于問(wèn)題求解的方法符號(hào)化。隨著計(jì)算機(jī)科學(xué)領(lǐng)域中對(duì)定量研究的重視,這種狀況會(huì)得到改善。在計(jì)算機(jī)視覺(jué)的研究過(guò)程中,應(yīng)考慮將功能模擬與認(rèn)知模

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論