機(jī)器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第1頁
機(jī)器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第2頁
機(jī)器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第3頁
機(jī)器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第4頁
機(jī)器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、機(jī)器視覺技術(shù)發(fā)展現(xiàn)狀人類認(rèn)識外界信息的80%來自于視覺,而機(jī)器視覺就是用機(jī)器代替人眼來做測量和判斷,機(jī)器視覺的最終目標(biāo)就是使計算機(jī)像人一樣,通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。作為一個新興學(xué)科,同時也是一個交叉學(xué)科,機(jī)器視覺是通過對相關(guān)的理論和技術(shù)進(jìn)行研究,從而建立由圖像或多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng),其特點(diǎn)是可提高生產(chǎn)的柔性和自動化程度。目前機(jī)器視覺技術(shù)已經(jīng)在很多工業(yè)制造領(lǐng)域得到了應(yīng)用,并逐漸進(jìn)入我們的日常生活。一、機(jī)器視覺簡介機(jī)器視覺就是用機(jī)器代替人眼來做測量和判斷。機(jī)器視覺主要利用計算機(jī)來模擬人的視覺功能,再現(xiàn)于人類視覺有關(guān)的某些智能行為,從客觀事物的圖像中提取信息進(jìn)

2、行處理,并加以理解,最終用于實(shí)際檢測和控制。機(jī)器視覺是一項(xiàng)綜合技術(shù),具包括數(shù)字處理、機(jī)械工程技術(shù)、控制、光源照明技術(shù)、光學(xué)成像、傳感器技術(shù)、模擬與數(shù)字視頻技術(shù)、計算機(jī)軟硬件技術(shù)和人機(jī)接口技術(shù)等,這些技術(shù)相互協(xié)調(diào)才能構(gòu)成一個完整的工業(yè)機(jī)器視覺系統(tǒng)10機(jī)器視覺強(qiáng)調(diào)實(shí)用性,要能適應(yīng)工業(yè)現(xiàn)場惡劣的環(huán)境,并要有合理的性價比、通用的通訊接口、較高的容錯能力和安全性、較強(qiáng)的通用性和可移植性。其更強(qiáng)調(diào)的是實(shí)時性,要求高速度和高精度,且具有非接觸性、實(shí)時性、自動化和智能高等優(yōu)點(diǎn),有著廣泛的應(yīng)用前景10一個典型的工業(yè)機(jī)器人視覺應(yīng)用系統(tǒng)包括光源、光學(xué)成像系統(tǒng)、圖像捕捉系統(tǒng)、圖像采集與數(shù)字化模塊、智能圖像處理與決策模

3、塊以及控制執(zhí)行模塊。通過CCD或CMOS攝像機(jī)將被測目標(biāo)轉(zhuǎn)換為圖像信號,然后通過A/D轉(zhuǎn)換成數(shù)字信號傳送給專用的圖像處理系統(tǒng),并根據(jù)像素分布、亮度和顏色等信息,將其轉(zhuǎn)換成數(shù)字化信息。圖像系統(tǒng)對這些信號進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,如面積、數(shù)量、位置和長度等,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作10機(jī)器視覺一般都包括下面四個過程:被測物體光學(xué)系統(tǒng)相機(jī)圖像采集卡計算機(jī)圖1機(jī)器視覺系統(tǒng)組成機(jī)器視覺的發(fā)展歷史機(jī)器視覺是在20世紀(jì)50年代從統(tǒng)計模式識別開始,當(dāng)時的工作主要集中在二維圖像分析、識別和理解上。從20世紀(jì)70年代才真正開始發(fā)展,并涌現(xiàn)出了主動視覺理論框架、基于感知特征群島物體識別理論框架等新

4、的概念、方法及理論。Marr視覺計算機(jī)理論是視覺研究迄今較為完善的理論,其使視覺研究有了一個較為明確的體系20Marr視覺理論從計算視覺理論出發(fā),將立體視覺分為自上而下的三個階段,即早期的二維視覺數(shù)據(jù)獲取、中期的要素處理和后期三維信息的形成和表達(dá)。經(jīng)歷這單個階段即可完成二維到三維的轉(zhuǎn)換工作.要素圖工5維圖圖2Marr理論框架的三個階段早期階段的“要素圖”(primarysketch)是由二維圖像中的點(diǎn)、直線、曲線和紋理等特征組成,早期階段的處理是從圖像中獲取這些特征。中期階段的處理是處理特征要素的位置和相互關(guān)系,從而完成對物體的識別、運(yùn)動分析和形狀恢復(fù)等操作,該階段處理的結(jié)果僅僅是對空間場景的

5、二維半描述。如若要完成對空問場景的真正三維描述,還需第三階段的后期視覺處理,將物體自身坐標(biāo)統(tǒng)一到一個世界坐標(biāo)系中3。作為立體視覺白基礎(chǔ)理論,Marr理論具有極其重要的指導(dǎo)作用,但Marr理論自身有缺陷,如單向性(視覺處理只能從前至后處理)、被動性(視覺處理只能是給什么圖像處理什么圖像)、目的單一性(視覺處理的目標(biāo)一般只是恢復(fù)空問場景中的物體形狀和位置)等。經(jīng)過幾十年的發(fā)展,許多學(xué)者紛紛提出了Marr理論的改進(jìn)框架,如在框架前增加圖像拾取模塊,使其能根據(jù)分析要求和分析結(jié)果自主獲取圖像;增加反饋環(huán)節(jié),使視覺處理結(jié)果能反向指導(dǎo)圖像獲取環(huán)節(jié),前后互動;增加高層指導(dǎo)模塊和視覺目的模塊,使整個視覺處理按照

6、視覺目的的要求,在高層指導(dǎo)模塊的指導(dǎo)下完成不同的視覺處理操作,實(shí)現(xiàn)其功能多樣化.總之,改進(jìn)的Marr理論框架使立體視覺趨于自動化、智能化和多功能化3。三、機(jī)器視覺相關(guān)技術(shù)1、圖像采集技術(shù)一一機(jī)器視覺的基礎(chǔ)圖像采集部分一般由光源、鏡頭、數(shù)字?jǐn)z像機(jī)和圖像采集卡構(gòu)成。采集過程可簡單描述為在光源提供照明的條件下,數(shù)字?jǐn)z像機(jī)拍攝目標(biāo)物體并將其轉(zhuǎn)化為圖像信號,最后通過圖像采集卡傳輸給圖像處理部分。在設(shè)計圖像采集部分時,要考慮到多方面的問題,主要是關(guān)于數(shù)字?jǐn)z像機(jī)、圖像采集卡和光源方面的問題。(1)光源照明照明是影響機(jī)器視覺系統(tǒng)輸入的重要因素,其直接影響輸入數(shù)據(jù)的質(zhì)量和應(yīng)用效果。到目前為止,還未有哪種機(jī)器視覺

7、照明設(shè)備能通用各種應(yīng)用,因此在實(shí)際應(yīng)用中,需針對應(yīng)用選擇相應(yīng)的照明設(shè)備以滿足特定需求。在光源照明方案選擇過程中,應(yīng)盡可能地突出物體特征,在物體需要檢測的部分與不重要部分之間盡量產(chǎn)生明顯的區(qū)域,增加對比度,同時還應(yīng)保證足夠的整體亮度,而物體位置的變化不應(yīng)影響成像的質(zhì)量。照明系統(tǒng)按其照射方法可分為:背向照明、前向照明、結(jié)構(gòu)光和頻閃光照明等。其中,背向照明是指將被測物放在光源和攝像機(jī)之間,以提高圖像的對比度。前向照明是光源和攝像機(jī)位于被測物的同側(cè),其優(yōu)點(diǎn)是便于安裝。結(jié)構(gòu)光照明是將光柵或線光源等投射到被測物上,并根據(jù)其產(chǎn)生的畸變,解調(diào)出被測物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機(jī)

8、拍攝要求與光源同步1。(2)光學(xué)攝像頭光學(xué)攝像頭的任務(wù)就是進(jìn)行光學(xué)成像,一般在測量領(lǐng)域都又專門的用于測量的攝像鏡頭,因?yàn)槠鋵Τ上褓|(zhì)量有著關(guān)鍵性的作用。攝像頭需要注意的一個問題是畸變。這個就需要使用相應(yīng)的畸變校正方法,目前也開發(fā)出了很多自動畸變自動校正系統(tǒng)。(3)CCD攝像機(jī)及圖像采集卡CCD(ChargeCoupledDevice微像機(jī)及圖像采集卡共同完成對目標(biāo)圖像的采集與數(shù)字化。目前CCDCMOS等固體器件的應(yīng)用技術(shù),線陣圖型敏感器件,像元尺寸不斷減小,陣列像元數(shù)量不斷增加,像元電荷傳輸速率也得到大幅提高。在基于PC機(jī)的機(jī)器視覺系統(tǒng)中,圖像采集卡是控制攝像機(jī)拍照來完成圖像的采集與數(shù)字化,并協(xié)

9、調(diào)整個系統(tǒng)的重要設(shè)備。圖像采集卡直接決定了攝像頭的接口為:黑白、彩色、模擬、數(shù)字等形式。2、圖像處理與分析一一機(jī)器視覺的核心用于機(jī)器視覺的圖像處理與分析方法的核心是,解決目標(biāo)的檢測識別問題。為此,提出方法的思想中心是如何獲得可正確描述目標(biāo)物與非目標(biāo)物的特征。當(dāng)所需要識別的目標(biāo)比較復(fù)雜時,就需要通過幾個環(huán)節(jié),從不同的側(cè)面綜合來實(shí)現(xiàn)。對目標(biāo)進(jìn)行識別提取的時候,首先是要考慮如何自動地將目標(biāo)物從背景中分離出來。目標(biāo)物提取的復(fù)雜性一般就在于目標(biāo)物與非目標(biāo)物的特征差異不是很大,在確定了目標(biāo)提取方案后,就需要對目標(biāo)特征進(jìn)行增強(qiáng)。增強(qiáng)方法有顏色特征的增強(qiáng)、累計特征的增強(qiáng)等。經(jīng)過特征增強(qiáng)后,最后就是目標(biāo)物的提取

10、了。這里也有很多不同的方法,比如偽目標(biāo)刪除方法、自適應(yīng)閾值方法、逐步驟類方法、多信息融合方法等40隨著計算機(jī)技術(shù)、微電子技術(shù)以及大規(guī)模集成電路的發(fā)展,圖像信息處理工作越來越多地借助硬件完成,如DSP芯片、專用的圖像信號處理卡等。軟件部分主要用來完成算法中并不成熟又較復(fù)雜或需不斷完善改進(jìn)的部分。這一方面提高了系統(tǒng)的實(shí)時性,同時又降低了系統(tǒng)的復(fù)雜度。四、機(jī)器視覺的發(fā)展現(xiàn)狀及應(yīng)用目前,最先進(jìn)的機(jī)器視覺技術(shù)仍然由歐美、日本等國家掌握,發(fā)達(dá)國家針對工業(yè)現(xiàn)場的應(yīng)用開發(fā)出了相應(yīng)的機(jī)器視覺軟硬件產(chǎn)品。中國目前正處于由勞動密集型向技術(shù)密集型轉(zhuǎn)型的時期,對提高生成效率、降低人工成本的機(jī)器視覺方案有著旺盛的需求,中

11、國正在成為機(jī)器視覺技術(shù)發(fā)展最為活躍的地區(qū)之一。長三角和珠三角成為國際電子和半導(dǎo)體技術(shù)的轉(zhuǎn)移地,同時也就成為了機(jī)器視覺技術(shù)的聚集地。許多具有國際先進(jìn)水平的機(jī)器視覺系統(tǒng)進(jìn)入了中國,國內(nèi)的機(jī)器視覺企業(yè)也在與國際機(jī)器視覺企業(yè)的良性競爭中不斷茁壯成長,許多大學(xué)和研究所都在致力于機(jī)器視覺技術(shù)的研究。在國外,機(jī)器視覺主要應(yīng)用在半導(dǎo)體及電子行業(yè),其中,半導(dǎo)體行業(yè)占40%50%。例如,PCBER刷電路、SMT表面貼裝、電子生產(chǎn)加工設(shè)備等。止匕外機(jī)器視覺還在質(zhì)量檢測的各方面及其他領(lǐng)域均有著廣泛應(yīng)用。(1)在工業(yè)檢測方面近幾十年來,在工業(yè)檢測中利用視覺系統(tǒng)的非接觸、速度快、精度合適、現(xiàn)場抗干擾能力強(qiáng)等突出的優(yōu)點(diǎn),使

12、機(jī)器視覺技術(shù)得到了廣泛的應(yīng)用,取得了巨大的經(jīng)濟(jì)與社會效益。自動視覺識別檢測目前已經(jīng)用于產(chǎn)品外形和表面缺陷檢驗(yàn),如木材加工檢測、金屬表面視覺檢測、二極管基片檢查、印刷電路板缺陷檢查、焊縫缺陷自動識別等。這些檢測識別系統(tǒng)屬于二維機(jī)器視覺,技術(shù)已經(jīng)較為成熟,其基本流程是用一個攝像機(jī)獲取圖像,對所獲取的圖像進(jìn)行處理及模式識別,檢測出所需的內(nèi)容50(2)在醫(yī)學(xué)上的應(yīng)用在醫(yī)學(xué)領(lǐng)域,機(jī)器視覺主要用于醫(yī)學(xué)輔助診斷。首先采集核磁共振、超聲波、激光、X射線、丫射線等對人體檢查記錄的圖像,再利用數(shù)字圖像處理技術(shù)、信息融合技術(shù)對這些醫(yī)學(xué)圖像進(jìn)行分析、描述和識別,最后得出相關(guān)信息,對輔助醫(yī)生診斷人體病源大小、形狀和異常

13、,并進(jìn)行有效治療發(fā)揮了重要的作用。不同醫(yī)學(xué)影像設(shè)備得到的是不同特性的生物組織圖像,如X射線反映的是骨骼組織,核磁共振影像反映的是有機(jī)組織圖像,而醫(yī)生往往需要考慮骨骼有機(jī)組織的關(guān)系,因而需要利用數(shù)字圖像處理技術(shù)將兩種圖像適當(dāng)?shù)丿B加起來,以便于醫(yī)學(xué)分析5(3)交通監(jiān)控領(lǐng)域中的應(yīng)用智能交通監(jiān)控領(lǐng)域中,在重要的十字路口安放攝像頭,就可以利用攝像頭的快速拍照功能,實(shí)現(xiàn)對違章、逆行等車牌的車牌進(jìn)行自動識別、存貯,以便相關(guān)的工作人員進(jìn)行查看。(4)在橋梁檢測領(lǐng)域中的應(yīng)用人工檢測法和橋檢車法都是依靠人工用肉眼對橋梁表面進(jìn)行檢測,其速度慢,效率低,漏檢率高,實(shí)時性差,影響交通,存在安全隱患,很難大幅應(yīng)用;無損檢

14、測包括激光檢測、超聲波檢測以及聲發(fā)射檢測等多種檢測技術(shù),它們儀器昂貴,測量范圍小,不能滿足日益發(fā)展的橋梁檢測要求;智能化檢測有基于導(dǎo)電性材料的混凝土裂縫分布式自動檢測系統(tǒng)和智能混凝土技術(shù),也有最前沿的基于機(jī)器視覺的檢測方法。導(dǎo)電性材料技術(shù)雖然使用方便,設(shè)備簡單,成本低廉,但是均需要事先在混凝土結(jié)構(gòu)上涂刷或者埋設(shè)導(dǎo)電性材料進(jìn)行檢測,而且智能混凝土技術(shù)還無法確定裂縫位置、裂縫寬度等一系列問題距實(shí)用化還有較長的距離;而基于機(jī)器視覺的檢測方法是利用CCD相機(jī)獲取橋梁表觀圖片,然后運(yùn)用計算機(jī)處理后自動識別出裂縫圖像,并從背景中分離出來然后進(jìn)行裂縫參數(shù)的計算的方法,它具有便捷、直觀、精確、非接觸、再現(xiàn)性好

15、、適應(yīng)性強(qiáng)、靈活性高、成本低廉的優(yōu)點(diǎn),能解放勞動力,排除人為干擾,具有很好的應(yīng)用前景60據(jù)統(tǒng)計,混凝土橋梁的損壞有90%以上都是由裂縫引起的,因此對橋梁的健康檢測主要是對橋梁表觀的裂縫進(jìn)行檢測與測量?;跈C(jī)器視覺的橋梁檢測技術(shù)主要包括三部分內(nèi)容:橋梁表觀圖像的獲取技術(shù)、基于圖像的裂縫自動識別理論與算法以及基于圖像的裂縫寬度等病害程度定量化測量方法?;跈C(jī)器視覺的自動化、智能化檢測技術(shù)已經(jīng)在道路、隧道上得到了成功應(yīng)用,在橋梁上也得到了初步的應(yīng)用,但主要集中在視線開闊的高空混凝土構(gòu)件表觀圖像獲取技術(shù)上,在病害的自動識別方面仍停留在理論研究階段,還無法應(yīng)用于實(shí)際工程當(dāng)中。針對量大面廣的混凝土梁體,智

16、能化視頻橋梁檢測車進(jìn)入理論與關(guān)鍵部件模型的研制階段,但是受到橋梁細(xì)小裂縫自動識別與清晰圖像快速化獲取難度大的限制,目前離達(dá)到實(shí)用化程度的要求還相距甚遠(yuǎn)60五、機(jī)器視覺技術(shù)發(fā)展遇到的問題對于人類來說,識別和理解周圍場景是一件非常容易的事,但對于機(jī)器人來說,卻是一件很困難的事。主要困難有一下幾個方面:(1)穩(wěn)定性問題現(xiàn)實(shí)中的環(huán)境因素是多變的,場景中的諸多因素,包括照明、物體形狀、表面顏色、攝像機(jī)以及空間關(guān)系變化都會對生成的圖像有影響。比如用于智能交通檢測的設(shè)備,如何保證其在惡劣天氣下依舊保持較高的穩(wěn)定性就是一個很難解決的問題。(2)構(gòu)造出性能良好的識別算法圖像處理與分析技術(shù)是機(jī)器視覺的核心,所以構(gòu)

17、造出一個良好的、適應(yīng)相關(guān)領(lǐng)域應(yīng)用的識別算法顯得尤為重要。而且現(xiàn)在的應(yīng)用領(lǐng)域越來越要求檢測設(shè)備具有準(zhǔn)確、高速地識別出目標(biāo)的能力,如果我們不能構(gòu)造出一個更好的識別算法,就不能適應(yīng)不斷增長的需求。(3)數(shù)據(jù)量大機(jī)器視覺所獲取的數(shù)據(jù)量非常非常大的。比如用于手機(jī)上的人臉識別功能,識別一次要投射多大幾萬個紅外線點(diǎn),這是一個龐大的數(shù)據(jù)。再比如交通檢測方面看,一天累積下來的數(shù)據(jù)量也是驚人的。所以如何處理如此大的信息量是個難題。不過隨著硬件技術(shù)的發(fā)展,這個問題將來會逐步得到解決。六、結(jié)束語機(jī)器視覺的誕生和應(yīng)用,大幅解放了人類勞動力,同時提高了生產(chǎn)自動化水平,裝備的使用效率、可靠性及穩(wěn)定性等。隨著新技術(shù)、新理論在機(jī)器視覺系統(tǒng)中的應(yīng)用,機(jī)器視覺將在國民經(jīng)濟(jì)的各領(lǐng)域中發(fā)揮更大作用,其應(yīng)用前景廣闊,并為社會的發(fā)展帶來了新的技術(shù)革命。1郭靜,羅華,張濤.機(jī)器視覺與應(yīng)用J.電子科技,2014,27(7):18

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論