傳感器與傳感器網(wǎng)絡(luò) 課件 第4、5章 視覺傳感系統(tǒng)、神經(jīng)傳感系統(tǒng)_第1頁
傳感器與傳感器網(wǎng)絡(luò) 課件 第4、5章 視覺傳感系統(tǒng)、神經(jīng)傳感系統(tǒng)_第2頁
傳感器與傳感器網(wǎng)絡(luò) 課件 第4、5章 視覺傳感系統(tǒng)、神經(jīng)傳感系統(tǒng)_第3頁
傳感器與傳感器網(wǎng)絡(luò) 課件 第4、5章 視覺傳感系統(tǒng)、神經(jīng)傳感系統(tǒng)_第4頁
傳感器與傳感器網(wǎng)絡(luò) 課件 第4、5章 視覺傳感系統(tǒng)、神經(jīng)傳感系統(tǒng)_第5頁
已閱讀5頁,還剩128頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第4章視覺傳感系統(tǒng)4.1機器視覺4.2視覺傳感器

4.1機器視覺

4.1.1機器視覺概述機器視覺是用機器模擬生物微觀和宏觀視覺功能的科學(xué)和技術(shù),或者說是使用機器來模擬人眼所具備的測量、判斷等基本功能,無論是機器視覺技術(shù)本身還是對這一技術(shù)的廣泛應(yīng)用,自2015年以來都發(fā)展得十分迅猛。機器視覺系統(tǒng)使用的是非接觸式光學(xué)傳感設(shè)備,通過圖像攝取裝置獲取現(xiàn)實中目標物體的單幅或多幅圖像,并轉(zhuǎn)化為圖像信號,經(jīng)過圖像處理系統(tǒng)后得到目標的特征信息,最終轉(zhuǎn)變?yōu)閳D像的數(shù)字信號。

在工業(yè)智能化生產(chǎn)中應(yīng)用機器視覺技術(shù),可以充分發(fā)揮機器視覺的多種優(yōu)勢:

①可以借助機器在非接觸的狀態(tài)下進行測量,也可以針對人工難以檢測的區(qū)域進行測量。

②相比于人眼,機器對光的敏感度更高,機器視覺系統(tǒng)可以用于對人眼無法識別的紅外及微弱光的檢測,有效避免了人眼檢測的缺陷,在一定程度上拓展了人眼的視覺范圍。

③機器不會出現(xiàn)視覺疲勞,可以維持長期穩(wěn)定的工作狀態(tài)。

④機器視覺技術(shù)的形式可以在一定程度上節(jié)約人力資源,為企業(yè)節(jié)省生產(chǎn)成本,實現(xiàn)增收的目的。

4.1.2機器視覺的應(yīng)用

機器視覺的應(yīng)用范圍十分廣泛,主要可以劃分為工業(yè)應(yīng)用和科學(xué)研究兩個主要方向。

在工業(yè)應(yīng)用領(lǐng)域,由于視覺環(huán)境固定可控,機器視覺任務(wù)單一明確,機器視覺系統(tǒng)可以實現(xiàn)大批量的持續(xù)性生產(chǎn)活動,顯著提高生產(chǎn)的自動化程度,從生產(chǎn)效率和產(chǎn)品精度兩個方面為企業(yè)帶來實質(zhì)性的經(jīng)濟增長和技術(shù)革新。機器視覺在工業(yè)中的主要作用是工業(yè)檢測和機器人視覺,前者包括外觀缺陷檢測、尺寸檢測、面積檢測等,檢測結(jié)果將會作為生產(chǎn)過程的重要指標,與生產(chǎn)效率和生產(chǎn)質(zhì)量密切相關(guān);后者主要用于指導(dǎo)機器人的大范圍操作,通過與傳感器技術(shù)的結(jié)合,還可以解決機器人小范圍操作的問題。

在科學(xué)研究領(lǐng)域,視覺環(huán)境復(fù)雜不可控,任務(wù)未知且不明確,所以機器視覺系統(tǒng)在工業(yè)領(lǐng)域應(yīng)用中所取得的成果比科研領(lǐng)域更為豐碩。機器視覺在科研領(lǐng)域主要用于目標的運

動和變化規(guī)律分析、材料分析和生物分析等,在享受到機器視覺為工業(yè)領(lǐng)域帶來的進步和收益后,經(jīng)過數(shù)十年的不斷發(fā)展,機器視覺技術(shù)的應(yīng)用已經(jīng)逐步拓展到消費電子、汽車制

造、光伏半導(dǎo)體等多個行業(yè),人臉識別、視頻監(jiān)控分析、智能駕駛技術(shù)、醫(yī)療影像診斷等機器視覺技術(shù)也正在逐漸滲入到人類生產(chǎn)和生活的方方面面,大幅提高了生產(chǎn)自動化程度和生活智能化程度,帶動了社會生產(chǎn)力的整體發(fā)展。

圖4-1較為全面地展示了機器視覺中用于檢測的各種應(yīng)用場景,其中約40%以上存在于半導(dǎo)體和電子行業(yè),如對電鍍的不良檢測、器件污點檢測、儀表按鍵位置錯誤檢測等。在包裝行業(yè),機器視覺的檢測功能可用于污點檢測、二維碼讀取和OCR字符識別等;在醫(yī)療行業(yè),可以用于醫(yī)學(xué)圖像分析、染色體分析、內(nèi)窺鏡檢查和外科手術(shù)等;在交通行業(yè),可以用于流動電子警察、十字路口電子警察、電子卡口和治安卡口等;而在軍事上,機器視覺一般用于武器制導(dǎo)、無人機和無人戰(zhàn)車的駕駛等。機器視覺在各行各業(yè)充分發(fā)揮著無可比擬的優(yōu)勢,極大地提升了行業(yè)的技術(shù)水平。圖4-1機器視覺的應(yīng)用

機器視覺檢測技術(shù)較為復(fù)雜,涵蓋了電子學(xué)、光電探測、圖像處理等基礎(chǔ)技術(shù)學(xué)科。機器視覺的引入,助力了工業(yè)測量領(lǐng)域?qū)ξ矬w(產(chǎn)品或零件)三維尺寸或位置的快速測量。由

于明確、特殊的工程應(yīng)用背景,視覺傳感與檢測系統(tǒng)和普通的計算機視覺、模式識別、數(shù)字圖像處理技術(shù)相比,有著較為明顯區(qū)別,如:

①應(yīng)用環(huán)境的特殊性。

②檢測目標的專用性。

③檢測系統(tǒng)的實用性、經(jīng)濟性和安全可靠性。

4.2視覺傳感器

4.2.1視覺傳感器原理1.視覺傳感器系統(tǒng)將圖像采集單元、圖像處理單元、圖像存儲單元、通信接口單元和圖像處理軟件集成于一體的視覺傳感器系統(tǒng)(如單一相機內(nèi)部的綜合體設(shè)備)如圖4-2所示,視覺傳感器使得相機能夠完全替代傳統(tǒng)的基于PC的計算機視覺系統(tǒng),獨立地完成預(yù)先設(shè)定的圖像處理和分析任務(wù)。圖4-2視覺傳感器系統(tǒng)構(gòu)成圖

1)光源的選擇

傳統(tǒng)的光源選擇方法有經(jīng)驗選擇法和實驗選擇法,前者依賴于操作人員的實踐經(jīng)驗,后者需要進行不斷的方案嘗試和方案調(diào)整。經(jīng)驗選擇法強調(diào),操作人員在選擇時需要考慮

多種影響因素,如被檢測對象的材質(zhì)、顏色、表面粗糙度等;不同應(yīng)用場景對光源的要求,如光源的強度、偏振、均勻度、方向、穩(wěn)定性、大小和形狀等;考慮市場現(xiàn)有光源的類型和

特點等,綜合地選擇最為合適的光源類型。這種方法的最大弊端是,人類往往會受到環(huán)境等外界因素的影響,使得選擇結(jié)果不可避免地存在一定的主觀性和不確定性。

雖然機器視覺系統(tǒng)使用的光源種類較多,但是使用比較頻繁的常見光源主要為熒光燈、鹵素燈、LED燈、氙燈等,而白熾燈、日光燈等光源因為不能滿足長期穩(wěn)定的工作要求,一般不會被選擇用于視覺傳感系統(tǒng)中。

表4-1對比了上述幾種常見光源的典型特性指標。

2)照明方式

在設(shè)計照明系統(tǒng)時,除了對光源類型進行選擇外,還應(yīng)該從檢測物體的特性、檢測任務(wù)的工作距離、光源的開關(guān)模式、視場大小、安裝環(huán)境、電源的穩(wěn)定性、經(jīng)濟效益等多個方

面進行綜合考量。針對每種不同的檢測對象,必須采用不同的照明方式才能突出被測對象的特征,更有甚者可能需要采取幾種照明方式的組合,往往最佳的光源和照明方式的選擇

需要通過大量的試驗才能找到。表4-2給出了幾種不同照明方式的特征對比,可以作為選擇的參考。

2.視覺傳感器關(guān)鍵技術(shù)

機器視覺系統(tǒng)的信息主要來源于視覺傳感器,視覺傳感器采集到的數(shù)據(jù)信息包括數(shù)以千計的像素值。事實上,圖像的清晰和細膩程度與像素數(shù)量密切相關(guān),通常用分辨率來衡

量。電荷耦合元件(CCD,Charge-CoupledDevice)能夠?qū)⒐庥皥D像信號轉(zhuǎn)換為數(shù)字信號,是攝像機、圖像傳感器或圖像控制器的重要組成部分,也是視覺系統(tǒng)獲取三維信息的最直接

數(shù)據(jù)來源。在視覺傳感系統(tǒng)中,成像系統(tǒng)的建模是指建立攝像機像面坐標系與測量參考坐標系之間的變換關(guān)系。

1)成像坐標變換

成像坐標變換是指不同坐標系之間的變換,在解釋這種變換關(guān)系之前,首先需要討論參照系的基本概念。為了用數(shù)值表達一個物體的位置信息,可以在參考物體上設(shè)置一種參

照系,以便于觀察和盡可能簡化對運動的描述為原則來任意選擇坐標系。如何從三維場景轉(zhuǎn)換成二維的數(shù)字圖像是成像系統(tǒng)的關(guān)鍵步驟之一,為了處理三維世界與二維圖像之間的

轉(zhuǎn)化關(guān)系,需要了解如圖4-3所示的四種參照系之間的成像變換過程。圖4-3坐標系轉(zhuǎn)換關(guān)系流程圖

(1)世界坐標系。

世界坐標系由三個相互垂直并且相交的坐標軸X、Y、Z組成,可以用來描述攝像機和物體的位置信息。攝像機坐標系和世界坐標系之間的關(guān)系可用旋轉(zhuǎn)矩陣R與平移向量t來描述,空間中任意一點P

在攝像機坐標系和世界坐標系下的齊次坐標分別為可以表示為(XC,YC,ZC,1)和(XW,YW,ZW,1)T,二者之間滿足如下關(guān)系:

(2)攝像機坐標系。

攝像機坐標系是用來建立攝像機和對象間關(guān)系的坐標系,如圖4-4所示,攝像機坐標系同樣是由X、Y、Z三個坐標軸組成的三維坐標系,XC軸、YC軸與圖像的x、y軸平行,ZC軸為攝像機的光軸,與圖像平面相垂直,攝像機光軸與圖像平面的焦點是成像平面坐標系的坐標原點O1,O點表示攝像機的光心。由O點與XC、YC、ZC軸組成的直角坐標系就稱為攝像機坐標系,OO1為攝像機的焦距。圖4-4-攝像機坐標系與成像平面坐標系的轉(zhuǎn)換關(guān)系

(3)成像平面坐標系。

成像平面坐標系是一種以物理單位(例如厘米)來表示某像素在圖像中的物理位置的坐標系,一般可以用(x,y)來表示。在成像平面坐標系中,坐標原點定義在攝像機光軸和圖像平面的交點O1處,也可以稱為圖像的主點(PrincipalPoint)

(4)圖像坐標系。

攝像機采集的圖像以M×N的二維數(shù)組格式存儲,如圖4-5所示,圖像坐標系是在圖像上定義的一種二維直角坐標系,原點位于圖像的左上角,坐標(u,v)表示像素位于數(shù)組中的列數(shù)與行數(shù)。圖4-5圖像坐標系

在圖像坐標系中,如果參考坐標P點的位置為(u0,v0),每個像素在x軸和y軸方向上的物理尺寸為dx、dy,那么任意一個像素位置可以由公式(4-2)和公式(4-3)計算求得。

結(jié)合齊次坐標與矩陣,可以將上式表示變換為公式(4-4)的形式。

2)相機成像模型

在非常理想的狀態(tài)下,如果可以忽略光線的影響,可以利用針孔模型來表示世界坐標系與真實坐標系之間的關(guān)系,這種關(guān)系也稱為中心射影或透視投影,是一種線性成像模型。在針孔模型的成像系統(tǒng)中,實際的圖像會通過比較小的孔投射到攝像機中,大部分的投影點都會分布在攝像機的中心點附近。

3)相機的標定

根據(jù)應(yīng)用需求的不同,視覺檢測系統(tǒng)有時不僅需要對缺陷目標完成定性檢測,還可能需要更進一步的定量檢測。相機標定的目的是建立起在三維世界坐標系和二維圖像坐標系

之間的投影關(guān)系,根據(jù)投影關(guān)系可以實現(xiàn)從二維圖像信息中推導(dǎo)出三維世界中物體的位置、形狀等幾何信息的目的,相機的標定精度將會直接影響系統(tǒng)最終的檢測精度。目前,相

機的標定方法主要有三種,分別是傳統(tǒng)的借助標定板的標定方法、自標定法和規(guī)定路徑的主動視覺標定法。

3.圖像信息處理

視覺傳感器的圖像信息處理是指,為了從圖像中獲取有用的信息,利用計算機技術(shù)對數(shù)字圖像進行處理的技術(shù)。在圖像采集的過程中,由于受到外界環(huán)境的干擾和相機自身物

理條件的影響,不可避免地會存在噪聲、成像不均勻等情況,為了獲取圖像中較為準確的特征信息,必須進行有效的圖像處理操作。視覺傳感系統(tǒng)的圖像處理流程如圖4-6所示。圖4-6圖像處理流程圖

1)圖像預(yù)處理

圖像預(yù)處理的目的是消除圖像中的冗余信息,恢復(fù)有價值的真實信縮減數(shù)據(jù)量,增強相關(guān)信息的可檢測性,從而優(yōu)化圖像分割、圖像特征抽取,提高圖像匹配的可靠性,降低算法復(fù)雜度的同時提高識別效率和準確率。

1)灰度化。

彩色圖像所包含的信息量較大,如果直接對彩色圖片進行識別分類過程,算法十分復(fù)雜,計算結(jié)果的準確度和精確度也無法保障。必須在進行高級算法層面處理之前,對輸入系統(tǒng)的圖像進行相關(guān)預(yù)處理操作,剔除無用信息和明顯的錯誤信息,使數(shù)據(jù)內(nèi)容實現(xiàn)標準化,降低后續(xù)算法的計算量?;叶然侵羔槍Σ噬珗D像的RGB(紅、綠、藍)三個通道同時進行處理,在不改變原始圖像信息的基礎(chǔ)上,將RGB圖像轉(zhuǎn)換為灰度圖像的方法。

(2)幾何變換。

包含同樣內(nèi)容的兩幅圖像可能由于成像角度、透視關(guān)系等因素的不同呈現(xiàn)出完全不同的成像效果,影響系統(tǒng)的識別結(jié)果。適當?shù)膸缀巫儞Q手段可以最大程度地消除幾何失真帶

來的影響,使得算法可以集中處理圖像的有效內(nèi)容。幾何變換一般包括對圖像的平移、鏡像、轉(zhuǎn)置、旋轉(zhuǎn)和縮放等變換,常采用插值法對圖像的空間變換進行修補,糾正變換導(dǎo)致的圖像偏差。

(3)圖像增強。

在采集、成像、傳輸?shù)纫幌盗袌D像采集過程中,由于受到設(shè)備、環(huán)境、操作等因素的影響,圖像的質(zhì)量會逐級發(fā)生一定程度的退化。有目的地增強圖像的整體或局部特性,將原本模糊的圖像清晰化處理或者突出某些感興趣的特征,擴大圖像中不同物體的特征差異,篩除無關(guān)特征,這便是圖像增強的目的。圖像增強技術(shù)可以改善圖像質(zhì)量、提高圖像清晰

度、豐富目標物信息量,使圖像中物體的輪廓更加清晰、細節(jié)更加明顯,進而加強對圖像的判讀和識別效果,在某些特殊場景或應(yīng)用中是不可或缺的處理過程。

2)圖像分割

圖像分割就是把圖像分成若干個特定的、具有獨特性質(zhì)的區(qū)域,提取出感興趣目標的技術(shù)和過程,這里的特性可以是圖像的顏色、形狀、灰度和紋理等。目前,圖像分割的方法

主要有基于區(qū)域特征的分割方法、基于相關(guān)匹配的分割方法和基于邊界特征的分割方法等,可以根據(jù)圖像條件進行選擇。方法各有優(yōu)劣,使用范疇各不相同,但是最終目的都是要將實際操作中外部因素的影響降到最低,使圖像分割得更加精準。通過對各種方法的有機結(jié)合和適當改造,構(gòu)成多級分割體系,不失為一種極具創(chuàng)新意識的處理方法。

3)圖像特征提取

圖像的特征通常包括目標的顏色、紋理、形狀以及圖像各部分之間的空間關(guān)系等,圖像特征提取就是提取目標圖像的上述特征或者改進特征,提取質(zhì)量的優(yōu)劣將嚴重影響到圖像識別的精度和效率。

(1)顏色特征。

顏色特征是目標的整體特征之一,描述了圖像區(qū)域中各個物體的表面特征屬性。常規(guī)的顏色特征就是指像素點的特征,所以這種特征對圖像的整體方向、大小等屬性并不敏感,

比較適合用于對特征點的捕捉,在對圖像局部特征的捕捉中存在一定的局限性。

(2)紋理特征。

紋理特征也是圖像區(qū)域中物體的表面特征屬性,是圖像中的底層特征內(nèi)容,并不能完整地反映出物體的本質(zhì)。紋理特征與顏色特征均屬于描述目標的整體特征,但是紋理特征

的特殊之處在于,它需要同時處理一塊包含有多個像素點的圖像區(qū)域。

(3)形狀特征。

形狀特征是圖像的一種高級視覺特征,較前兩種特征,能夠表達的范圍更廣、層次更高,它可以捕捉目標物體的本質(zhì)信息,信息不會因光照等外在環(huán)境的影響而發(fā)生變化,抗干擾能力相對更強。形狀特征的提取方法可以根據(jù)形狀要素分為基于輪廓的方法和基于區(qū)域的方法兩種?;谳喞姆椒ㄊ菍⒛繕宋锏倪吘壿喞畔⒆鳛橹攸c,針對物體的外邊界進行識別和提取。

根據(jù)對不同輪廓信息的捕捉方式,基于輪廓的方法又可以細分為全局方法和局部方法,全局方法通常是將目標物的形狀視為一個整體,并利用一個單一的全局描述子來表示出來,這類方法對噪聲信號不敏感,所以無法捕捉到更為精細的特征內(nèi)容;局部方法由于具有較強的抗干擾性,使用更為普遍,很多經(jīng)典成熟的算法至今仍在發(fā)揮著重要的作用?;趨^(qū)域的方法是利用目標物的內(nèi)部區(qū)域信息來表示形狀,與整個形狀區(qū)域的數(shù)據(jù)信息息息相關(guān),描述簡單的標量區(qū)域(如區(qū)域面積、矩形度、離心率、方向、細長度等)、區(qū)域骨架、區(qū)域的矩等都屬于基于區(qū)域的方法。

(4)空間關(guān)系特征。

空間關(guān)系特征主要分為兩類:圖形中目標之間的相對位置關(guān)系和每個目標在圖像中的絕對位置關(guān)系,前者主要描述了目標區(qū)域位置之間的相互關(guān)系,如連接、重疊、包含等;后

者重點關(guān)注目標區(qū)域之間的距離和位置信息,如上、下、左、右等。通常在實際使用中的思路是,對于空間關(guān)系特征的提取,首先存儲目標區(qū)域的絕對位置信息,然后基于絕對位置推導(dǎo)出相對位置關(guān)系。

4)圖像匹配

圖像匹配是指根據(jù)從不同的視角得到的一幅或多幅圖像,識別出與目標區(qū)域相同或者相似的圖像區(qū)域的過程,給定的目標區(qū)域稱為模板圖像,與模板圖像相類似的圖像稱為目標圖像。圖像匹配方法可以分為以灰度為基礎(chǔ)的匹配和以特征為基礎(chǔ)的匹配兩種。

基于灰度的匹配方法將圖像看作是二維信號,以統(tǒng)計的觀點根據(jù)空間二維滑動模板來匹配目標圖像;基于特征的匹配方法是指,首先分別提取兩個或多個圖像的特征,然后針對這些特征屬性進行識別和匹配步驟,前面描述的顏色、紋理、形狀、空間位置等均可選作匹配計算的特征。計算機進行圖像匹配的方法和過程與人類思考和推理的過程相似?;谏窠?jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法為圖像匹配應(yīng)用提供了許多新的技術(shù)手段和應(yīng)用方式,技術(shù)的融合和優(yōu)化為系統(tǒng)各個環(huán)節(jié)的協(xié)調(diào)和配合帶來了新的創(chuàng)新和助益。

4.2.2視覺傳感器應(yīng)用

視覺傳感器作為重要的視覺信息采集處理模塊,在工業(yè)生產(chǎn)、生物醫(yī)學(xué)、生活、國防安全、航空航天等領(lǐng)域均被廣泛地使用和拓展,如工業(yè)生產(chǎn)中的零件質(zhì)量檢測與分類、智能化產(chǎn)品制造、現(xiàn)代物流、智能監(jiān)控、智能機器人等,生物醫(yī)學(xué)中的微觀生物學(xué)觀測、生命科學(xué)觀測、醫(yī)療影像、醫(yī)學(xué)圖像處理等,生活中的安防監(jiān)控、虛擬現(xiàn)實、機器人視覺、體感游戲、智能交通、智能終端等,國防安全中的機載探測跟蹤、光雷達跟蹤、光電武器制導(dǎo)等,航空航天中的宇宙天體成像、衛(wèi)星圖像處理、衛(wèi)星遙感技術(shù)等。

1)單目視覺傳感系統(tǒng)

單目視覺傳感系統(tǒng)是指只采用一個攝像機拍攝的單張相片作為唯一圖像來源的傳感系統(tǒng)。這種系統(tǒng)結(jié)構(gòu)簡單,很好地規(guī)避了雙目視覺傳感系統(tǒng)的視場小、立體匹配難等問題,可以很好地實現(xiàn)針對一維移動物體的參數(shù)測量。在工業(yè)生產(chǎn)中,經(jīng)常應(yīng)用于生產(chǎn)線上物體的移動測量、目標運動狀態(tài)識別等

(1)幾何相似法。

幾何相似法是在二維空間上實現(xiàn)測量的常用方法,對二維幾何位置、形狀、形變、位移和速度的測量比較理想。當被測對象的幾何參數(shù)處于同一平面內(nèi),使被測物與攝像系統(tǒng)的光軸相垂直,與成像平面平行,在這種情況下采用幾何相似法進行計算是不錯的選擇。根據(jù)透視投影模型原理,將圖像參數(shù)與實際放大倍數(shù)相乘就可以得到物體的實際參數(shù)信息。

(2)幾何形狀約束法。

針對圓形或圓柱形等特殊形狀的被測對象,可以通過充分結(jié)合目標在幾何形狀上的獨特約束條件,利用單臺相機拍攝的單張圖片來確定目標的空間三維姿態(tài)。一個比較典型的

應(yīng)用是,在火箭、導(dǎo)彈等靶場環(huán)境中,如果圖像目標多為圓柱體形狀,目標與經(jīng)緯儀之間存在較遠的距離,那么可以采用幾何約束法,克服基于多視覺方式可能存在的點匹配問題,直接完成目標三維姿態(tài)的獲取。

(3)結(jié)構(gòu)光法。

結(jié)構(gòu)光法是以結(jié)構(gòu)光投射器為光源,產(chǎn)生點、線、面各種結(jié)構(gòu)的光信號,然后用CCD攝像機采集圖像數(shù)據(jù),最后根據(jù)三角計算原理得到物體的三維坐標信息。根據(jù)光信號結(jié)構(gòu)

的不同,分為點結(jié)構(gòu)光測量、線結(jié)構(gòu)光測量和面結(jié)構(gòu)光測量三種。點結(jié)構(gòu)光測量的原理是將半導(dǎo)體激光器作為光源,產(chǎn)生的光束照射到被測物表面上,經(jīng)過表面的散射(或反射)后,

利用面陣CCD攝像機接收,那么光點在CCD像平面上的位置就可以反映出被測物表面在法線方向上的變化,如圖4-7(a)所示。

線結(jié)構(gòu)光測量的原理是半導(dǎo)體激光器產(chǎn)生的激光經(jīng)柱面鏡變成線性結(jié)構(gòu)光,投射到被測區(qū)域后會形成一個激光帶,再用面陣CCD相機接收散射光,從而獲得被測物表面被照射區(qū)域的截面形狀或輪廓,如圖4-7(b)所示。量的原理是將半導(dǎo)體激光器發(fā)出的激光擴束后照射到光柵上,以產(chǎn)生多個光平面,接著投射到被測表面上形成多條亮帶區(qū)域,再利用CCD攝像機接收信號,從而獲取被測表面的三維信息,如圖4-7(c)所示。圖4-7結(jié)構(gòu)光測量原理示意圖

(4)激光輔助測距法。

根據(jù)成像原理和特點,單幅圖像通常只包含被測目標的二維數(shù)據(jù)信息,由于缺少被測目標與鏡頭中心的距離參數(shù),所以無法實現(xiàn)三維層面的測量。為了解決單目視覺傳感系統(tǒng)

的局限性,同時不增加傳感器數(shù)量,在進行距離測量的應(yīng)用中,測距儀成為最常用的測距手段。激光輔助測距法通過將手持激光測距儀和單目視覺傳感系統(tǒng)集成在一起,將攝像機拍攝的單幅圖像中包含的二維信息和測距儀測距得到距離信息統(tǒng)一起來,再經(jīng)過綜合計算得到待測目標的三維坐標信息。

2)雙目視覺傳感系統(tǒng)

在了解了單目視覺傳感系統(tǒng)的工作原理及技術(shù)特點的基礎(chǔ)上,為了準確復(fù)原或構(gòu)建真實的三維場景環(huán)境,實現(xiàn)更加豐富的測量,有研究學(xué)者提出了大膽的嘗試:通過對單目視覺傳感系統(tǒng)的移動或旋轉(zhuǎn),拍攝同一場景下不同角度的兩幅圖片,通過對人類視覺感知結(jié)構(gòu)的直接模擬,構(gòu)建出雙目視覺傳感系統(tǒng),從而可以真實有效地捕獲場景深度信息。

(1)平行雙目結(jié)構(gòu)模型。

如圖4-8所示,平行雙目結(jié)構(gòu)模型選取的攝像機采用左右對稱的方式放置,兩攝像機的光軸相互平行,測量時需要根據(jù)拍攝距離調(diào)整左右攝像機的基距參數(shù),保證能夠在左右攝像機成像面上得到合適的投影視差,滿足三維重建的精度要求。平行雙目結(jié)構(gòu)模型適用于視場廣、精度要求不高的重建場景中。圖4-8平行雙目結(jié)構(gòu)模型原理

(2)非平行雙目結(jié)構(gòu)模型。

與平行雙目結(jié)構(gòu)模型不同的是,非平行雙目結(jié)構(gòu)模型并未對兩臺相機擺放的位置進行嚴格的規(guī)定。如圖4-9所示,為了采集到更為理想的原始圖像,可以根據(jù)被測物體的大小、

形狀等屬性,及時調(diào)整攝像機的位置和角度,但這樣勢必會使這種結(jié)構(gòu)的數(shù)學(xué)模型較為復(fù)雜,圖像的匹配分析難度較高,一般需要采用增加公共視野范圍的方法提高測量的準確性。圖4-8平行雙目結(jié)構(gòu)模型原理

3)多目視覺傳感系統(tǒng)

多目視覺傳感系統(tǒng)是指采用更多視覺傳感器組件的傳感系統(tǒng),主要目標是實現(xiàn)對場景的三維重建。

根據(jù)多目視覺傳感器安裝方式的不同,可以將系統(tǒng)劃分為以下三個類別:

(1)分離式多目立體視覺系統(tǒng)。

這種測量系統(tǒng)利用分布在被測目標四周的多個視覺傳感器,對被測目標的三維輪廓或測點的三維坐標同時進行測量。

(2)固定式多目立體視覺系統(tǒng)。

將多個視覺傳感器固定在特定的共線支架上,避免了對現(xiàn)場攝像機間的方位參數(shù)進行評估,但是這種系統(tǒng)的測量精度與雙目系統(tǒng)相比并無明顯的改善。

(3)虛擬多目立體視覺系統(tǒng)。

基于光學(xué)反射鏡成像原理,僅使用一臺視覺傳感器實現(xiàn)多目立體視覺系統(tǒng)的功能。這種安裝方式不僅降低了系統(tǒng)的成本,而且避免了多臺高速攝像機拍攝時面臨的同步驅(qū)動復(fù)雜性問題,對小視場范圍內(nèi)物體的測量效果比較理想。第5章神經(jīng)傳感系統(tǒng)5.1神經(jīng)系統(tǒng)概述5.2人工神經(jīng)網(wǎng)絡(luò)5.3基于神經(jīng)網(wǎng)絡(luò)的傳感器應(yīng)用

5.1神經(jīng)系統(tǒng)概述

認識是主體對客體的反應(yīng),主體通過對信息的加工處理,在觀念中構(gòu)建起客體的結(jié)構(gòu)、屬性和本質(zhì)。人們需要從外界獲取信息,形成對客觀世界的規(guī)律性認識,才能逐漸適應(yīng)環(huán)境和改造環(huán)境。

5.1.1神經(jīng)元

人腦是中樞神經(jīng)系統(tǒng)的主要組成部分,是由神經(jīng)元組成并由突觸連接起來的系統(tǒng)。神經(jīng)元,即神經(jīng)元細胞,是神經(jīng)系統(tǒng)最基本的結(jié)構(gòu)和功能單位,分為細胞體和突起兩部分。細

胞體由細胞核、細胞膜、細胞質(zhì)組成,具有聯(lián)絡(luò)和整合輸入信息并傳出信息的作用。突起包括樹突和軸突。樹突較短、分枝多,是由細胞體直接擴張突出而形成的樹枝狀結(jié)構(gòu),用來接收其他神經(jīng)元軸突傳遞來的沖動并傳入細胞體;軸突較長、分枝少,通常起于軸丘,是粗細均勻的細長突起,作用是接收外來刺激,再由細胞體將刺激傳出。

軸突除了分出側(cè)枝外,在其末端還會形成樹枝樣的神經(jīng)末梢,末梢分布于某些組織器官或骨骼肌肉內(nèi),形成各種神經(jīng)末梢裝置(感受器或運動終端),比較典型的神經(jīng)元結(jié)構(gòu)圖如圖5-1所示。圖5-1典型神經(jīng)元結(jié)構(gòu)

1)感覺(傳入)神經(jīng)元

感覺(傳入)神經(jīng)元分布于全身,作用是接收來自體內(nèi)外的刺激信號,并將神經(jīng)沖動傳到中樞神經(jīng)。這種神經(jīng)元,其末梢可以呈現(xiàn)游離狀或分化出專門接收特定刺激的細胞或組織。一般來說,傳入神經(jīng)元的神經(jīng)纖維,進入中樞神經(jīng)系統(tǒng)后與其他神經(jīng)元發(fā)生以輻散為主的突觸聯(lián)系,即通過軸突末梢的分支與許多神經(jīng)元建立突觸聯(lián)系(擴大影響范圍),可引起許多神經(jīng)元同時興奮或抑制。以反射弧為例,感覺神經(jīng)元一般與中間神經(jīng)元連接,可以維持骨骼肌緊張性,作出肌牽張反射,也可以直接在中樞內(nèi)與傳出神經(jīng)元發(fā)生突觸聯(lián)系。

2)運動(傳出)神經(jīng)元

運動(傳出)神經(jīng)元將神經(jīng)沖動從胞體經(jīng)軸突傳至末梢,使肌肉收縮或腺體分泌,在中樞神經(jīng)系統(tǒng)中起到整合作用,使反應(yīng)更為精確和協(xié)調(diào)。傳出神經(jīng)纖維末梢分布到骨骼肌,組成運動終端;而分布到內(nèi)臟平滑肌和腺上皮時,傳出神經(jīng)纖維末梢將會包繞肌纖維或穿行于腺細胞之間。仍以反射弧為例,運動(傳出)神經(jīng)元一般與中間神經(jīng)元以聚合式連接,即許多傳入神經(jīng)元和同一個神經(jīng)元構(gòu)成突觸,使許多不同來源的沖動同時或先后作用于同一個神經(jīng)元。

3)聯(lián)絡(luò)(中間)神經(jīng)元

聯(lián)絡(luò)(中間)神經(jīng)元接收其他神經(jīng)元傳來的神經(jīng)沖動,再將沖動傳遞到另一個神經(jīng)元中。中間神經(jīng)元分布在腦和脊髓等中樞神經(jīng)內(nèi),是三類神經(jīng)元中數(shù)量最多的,其排列方式十分復(fù)雜,一般有輻散式、聚合式、鏈鎖狀、環(huán)狀等。復(fù)雜的反射活動是由傳入神經(jīng)元、中間神經(jīng)元和傳出神經(jīng)元互相借突觸連接而成的神經(jīng)元鏈。人類大腦皮質(zhì)的思維活動就是通過大量中間神經(jīng)元的極其復(fù)雜的反射活動形成的。

5.1.2突觸

神經(jīng)元間信息傳遞的接觸點是突觸,突觸是將一個神經(jīng)元的沖動傳到另一個神經(jīng)元或傳到與另一細胞相互接觸的結(jié)構(gòu)。一個神經(jīng)元約有103~104個突觸,人腦內(nèi)的突觸點多達

1014~1015個。突觸雖然只是一個接觸點,但是卻有著微細結(jié)構(gòu),內(nèi)部含有神經(jīng)傳遞介質(zhì),是神經(jīng)元之間進行信息轉(zhuǎn)換的關(guān)鍵結(jié)構(gòu)。突觸形態(tài)各異、聯(lián)結(jié)復(fù)雜,不僅相鄰的兩個神經(jīng)元胞體、樹突、軸突中的任何兩部分會形成突觸聯(lián)系,而且同一個神經(jīng)元還可以構(gòu)成自身突觸,在不同腦區(qū),甚至還有一些更為特殊的突觸聯(lián)系。所以神經(jīng)元所組成的人腦系統(tǒng),實際上是一個由神經(jīng)元與神經(jīng)元、神經(jīng)元與非神經(jīng)元之間依照一定方式互相連接而成的復(fù)雜神經(jīng)網(wǎng)絡(luò)。

突觸由突觸前膜、突觸間隙和突觸后膜三部分組成。借助化學(xué)信號(即遞質(zhì)),將信息進行傳送的突觸稱為化學(xué)突觸,多見于哺乳動物中;而借助于電信號傳遞信息的突觸稱為電突觸,魚類和兩棲類就有這種類型的突觸。根據(jù)突觸前膜細胞傳來的信號,可以使突觸后膜細胞興奮性上升或產(chǎn)生興奮,或者使其興奮性下降或不易產(chǎn)生興奮。按照興奮狀態(tài)又可以將突觸分為興奮性突觸和抑制性突觸。

突觸傳遞是大腦各個區(qū)域行使功能的主要基礎(chǔ),大腦中神經(jīng)元突觸間的信號傳遞又是以神經(jīng)遞質(zhì)為受體傳導(dǎo)的。神經(jīng)遞質(zhì)傳遞的基本過程如圖5-2所示圖5-2神經(jīng)遞質(zhì)傳遞過程

5.2人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN),簡稱神經(jīng)網(wǎng)絡(luò)(NeuralNetwork,NN)或類神經(jīng)網(wǎng)絡(luò),是一種模仿生物神經(jīng)網(wǎng)絡(luò)(動物的中樞神經(jīng)系統(tǒng),特別是大腦)結(jié)構(gòu)和功能的數(shù)學(xué)模型或計算模型,用于對函數(shù)進行估計或近似。神經(jīng)網(wǎng)絡(luò)由大量的人工神經(jīng)元相聯(lián)結(jié),進行信息的傳遞和計算。大多數(shù)情況下人工神經(jīng)網(wǎng)絡(luò)是一種自適應(yīng)系統(tǒng),能夠在外界信息的基礎(chǔ)上改變其內(nèi)部結(jié)構(gòu)。人工神經(jīng)網(wǎng)絡(luò)通常通過一個基于數(shù)學(xué)統(tǒng)計學(xué)類型的學(xué)習(xí)方法實現(xiàn)優(yōu)化,因此人工神經(jīng)網(wǎng)絡(luò)也可以視為數(shù)學(xué)統(tǒng)計學(xué)方法的一種實際應(yīng)用,通過統(tǒng)計學(xué)的標準數(shù)學(xué)方法能夠得到大量的可以用函數(shù)來表達的局部結(jié)構(gòu)空間。

5.2.1人工神經(jīng)元

生物神經(jīng)元是腦器官最基本的功能單位,也是構(gòu)成神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的基本單位。而在人工神經(jīng)網(wǎng)絡(luò)中,用人工神經(jīng)元來模擬生物神經(jīng)元,每一個人工神經(jīng)元都可以從其他人工神經(jīng)元或外部環(huán)境中獲取信號,并傳遞給與之相連的其他人工神經(jīng)元。圖5-3是一個完整的人工神經(jīng)元結(jié)構(gòu),包含連接權(quán)、求和單元和激活函數(shù)三個部分,人工神經(jīng)元收集到的所有輸入信號,經(jīng)過加權(quán)計算后產(chǎn)生一個激活函數(shù)的輸入信號,最后計算出人工神經(jīng)元的輸出信號。圖5-3人工神經(jīng)元

(1)連接權(quán)。連接權(quán)指神經(jīng)元連接的權(quán)重,在網(wǎng)絡(luò)訓(xùn)練中起記憶信息的作用。在網(wǎng)絡(luò)訓(xùn)練過程中連接權(quán)會進行不斷的數(shù)值調(diào)整,直至訓(xùn)練結(jié)果與目標吻合。連接權(quán)類比的是生物

神經(jīng)元中的突觸,其連接強度由連接權(quán)值表示,連接強度權(quán)值為負的時候形成興奮的抑制狀態(tài),為正時則表示激活狀態(tài)。

(2)求和單元。實現(xiàn)對各個輸入值的加權(quán)求和操作。

(3)激活函數(shù)。執(zhí)行對該神經(jīng)元所獲得的網(wǎng)絡(luò)輸入的信號變換,一般具有非線性映射屬性,可以將人工神經(jīng)元的輸出幅度控制在一定的范圍之內(nèi)。常見的激活函數(shù)有sigmoid、

tanh(x)和ReLU(x)三種,下面通過其表達式對其進行簡單的介紹。

?sigmoid函數(shù)

sigmoid函數(shù),也稱為S型生長曲線,是一種常見的神經(jīng)網(wǎng)絡(luò)激活函數(shù),用于隱層神經(jīng)元的輸出,可以將變量映射到(0,1)范圍之內(nèi),映射方法如式(5-1)、式(5-2)所示。

sigmoid函數(shù)及其導(dǎo)函數(shù)曲線圖如圖5-4所示,從圖中可以發(fā)現(xiàn),sigmoid函數(shù)的曲線比較平滑,易于計算,但是函數(shù)的計算量較大而且容易出現(xiàn)梯度消失的問題,使得網(wǎng)絡(luò)訓(xùn)練無法完整進行。圖5-4sigmoid函數(shù)及其導(dǎo)函數(shù)

?tanh(x)函數(shù)

tanh(x)也是一種比較常見的神經(jīng)網(wǎng)絡(luò)激活函數(shù),其映射方法如式(5-3)、式(5-4)所示。

tanh(x)函數(shù)及其導(dǎo)函數(shù)曲線圖如圖5-5所示,從圖中可以明顯看出tanh(x)的均值是0,該函數(shù)是sigmoid函數(shù)的變形,在實際應(yīng)用中比sigmoid有更好的使用效果。圖5-5-tanh(x)函數(shù)及其導(dǎo)函數(shù)

?ReLU(x)函數(shù)

ReLU(x)也是一種比較常見的神經(jīng)網(wǎng)絡(luò)激活函數(shù),其映射方法如式(5-5)、式(5-6)所示。

ReLU(x)函數(shù)及其導(dǎo)函數(shù)曲線圖如圖5-6所示,從圖中可以看出ReLU(x)是部分線性的,并且不會出現(xiàn)過飽和現(xiàn)象,使用ReLU(x)得到的隨機梯度下降法(SGD)的收斂速度比sigmoid和tanh(x)的都要快。利用ReLU(x)函數(shù)計算,只需要一個閾值就可以得到激活值,而不需要像sigmoid和tanh(x)一樣執(zhí)行復(fù)雜的指數(shù)運算,原理易于理解,計算更為簡單。圖5-6ReLU(x)函數(shù)及其導(dǎo)函數(shù)

5.2.2人工神經(jīng)網(wǎng)絡(luò)信息處理

人腦的每個神經(jīng)元都可以看作一個處理單元,這些處理單元互相連接形成了生物神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)中信號傳遞的強弱由神經(jīng)元之間的連接強度決定,連接的強弱又可以根據(jù)外部

的刺激信號作出自適應(yīng)性的變化。信號可以產(chǎn)生刺激或抑制的作用,每個神經(jīng)元會根據(jù)接收到的多個信號的綜合作用呈現(xiàn)興奮或抑制狀態(tài)。

典型的三層人工神經(jīng)網(wǎng)絡(luò)拓撲圖如圖5-7所示。圖5-7典型的三層人工神經(jīng)網(wǎng)絡(luò)拓撲圖

為了便于理解人工神經(jīng)網(wǎng)絡(luò)模型組成及信息傳遞處理過程,首先簡單回顧一下邏輯回歸的相關(guān)內(nèi)容。邏輯回歸模型可以表示為公式(5-7)

設(shè)線性變換z,并將其表示為公式(5-8),那么邏輯回歸模型可以變換為公式(5-9)的形式。

從上述公式中可以看到,邏輯回歸模型可以分為線性變換部分與非線性變換部分。當神經(jīng)網(wǎng)絡(luò)模型只有輸入層與輸出層兩部分且輸出層只有一個神經(jīng)元時,模型的結(jié)構(gòu)便與邏

輯回歸的模型結(jié)構(gòu)相一致,但是在神經(jīng)網(wǎng)絡(luò)中,線性變換與非線性變換會被集成在同一個處于隱藏層或輸出層中的神經(jīng)元中,如圖5-8所示。圖5-8邏輯回歸模型與神經(jīng)網(wǎng)絡(luò)模型對比

對于具有多層或多個輸出神經(jīng)元的神經(jīng)網(wǎng)絡(luò),其每個隱藏層神經(jīng)元或輸出層神經(jīng)元的值(激活值),都是由上一層神經(jīng)元經(jīng)過加權(quán)求和與非線性變換得到的,網(wǎng)絡(luò)拓撲圖如圖5-9所示。圖5-8邏輯回歸模型與神經(jīng)網(wǎng)絡(luò)模型對比

隱藏層或輸出層的每一個神經(jīng)元,都是由上一層神經(jīng)元經(jīng)過類似邏輯回歸計算而來的,如圖5-10所示。圖5-10神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)與激活值

5.2.3人工神經(jīng)網(wǎng)絡(luò)特點

人工神經(jīng)網(wǎng)絡(luò)是一種旨在模仿人腦結(jié)構(gòu)及其功能的信息處理系統(tǒng),人工神經(jīng)網(wǎng)絡(luò)模型用于模擬人腦神經(jīng)元的活動過程,其中包括對信息的加工、處理、存儲和搜索等過程。人工神經(jīng)網(wǎng)絡(luò)具有如下基本特點。

1)高度的并行性

2)高度的非線性全局作用

3)聯(lián)想記憶功能和良好的容錯性

4)良好的自適應(yīng)、自學(xué)習(xí)功能

5)知識的分布存儲

6)非凸性

5.2.4常見的人工神經(jīng)網(wǎng)絡(luò)

1.人工神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)

1)單層網(wǎng)絡(luò)

單層網(wǎng)絡(luò)是最簡單的網(wǎng)絡(luò)拓撲結(jié)構(gòu),如圖5-11所示,雖然圖中所有節(jié)點之間均采用全連接的前饋連接方式,但是在實際生物神經(jīng)網(wǎng)絡(luò)或人工神經(jīng)網(wǎng)絡(luò)中有些連接是并不存在的。輸入信號可表示為行向量X=(x1,x2,…,xn),每一分量都是通過加權(quán)計算連接到各節(jié)點處的。圖5-11單層網(wǎng)絡(luò)拓撲結(jié)構(gòu)

如果把各個加權(quán)值表示為n×m維加權(quán)矩陣W,如公式(5-12)所示,n表示輸入信號量的個數(shù),m表示該層的節(jié)點數(shù),那么輸入信號的加權(quán)和可表示為公式(5-13)的形式。

2)多層網(wǎng)絡(luò)

多層網(wǎng)絡(luò)是由單層網(wǎng)絡(luò)級聯(lián)而成的,即將上一層的輸出作為下一層的輸入。網(wǎng)絡(luò)越復(fù)雜,提供的計算能力就越強。下面以如圖5-12所示的雙層網(wǎng)絡(luò)為例,介紹多層網(wǎng)絡(luò)的信息處理方式。圖5-12雙層網(wǎng)絡(luò)

多層網(wǎng)絡(luò)的層間轉(zhuǎn)移函數(shù)一般是非線性的,這樣可以加強多層網(wǎng)絡(luò)的計算能力。假設(shè)雙層網(wǎng)絡(luò)的層間轉(zhuǎn)移函數(shù)為線性函數(shù),XW1為第一層的輸出,同時它會作為第二層的輸入,通過第二個加權(quán)矩陣得到網(wǎng)絡(luò)輸出為Y=(XW1)W2

或Y=X(W1W2),這樣雙層線性網(wǎng)絡(luò)中兩個加權(quán)矩陣的乘積等效于單層網(wǎng)絡(luò)的加權(quán)矩陣,所以多層網(wǎng)絡(luò)中層間的轉(zhuǎn)移函數(shù)是

非線性的。

3)回歸型網(wǎng)絡(luò)

回歸型網(wǎng)絡(luò)是指包含反饋連接的網(wǎng)絡(luò),反饋連接就是指網(wǎng)絡(luò)的一層輸出通過連接權(quán)值回送到同一層或前一層的輸入中。一層反饋網(wǎng)絡(luò)如圖5-13所示。在網(wǎng)絡(luò)中只限于一層之

內(nèi)的連接稱為層內(nèi)連接或?qū)觾?nèi)橫向反饋連接,層內(nèi)橫向反饋連接的網(wǎng)絡(luò)等效拓撲結(jié)構(gòu)可稱為交叉連接方式或縱橫連接方式。交叉連接方式示意圖如圖5-14所示,這種縱橫線矩陣結(jié)構(gòu)表示方式便于將網(wǎng)絡(luò)與硬件電路相映射,其中,交叉點的電阻起到加權(quán)的作用,而三角形表示加權(quán)求和的運算放大器。圖5-13一層反饋網(wǎng)絡(luò)拓撲圖圖5-14一層反饋網(wǎng)絡(luò)的交叉連接方式示意圖

2.人工神經(jīng)網(wǎng)絡(luò)模型

理解人工神經(jīng)網(wǎng)絡(luò)的主要拓撲結(jié)構(gòu)后,下面將介紹幾種非常著名的人工神經(jīng)網(wǎng)絡(luò)模型——BP、Hopfield和Kohonet,目前很多先進的新型網(wǎng)絡(luò)結(jié)構(gòu)更多的是對這幾種模型的改良和優(yōu)化。人工神經(jīng)網(wǎng)絡(luò)的分類如圖5-15所示,按照結(jié)構(gòu)方式、狀態(tài)方式和學(xué)習(xí)方式的不同,人工神經(jīng)網(wǎng)絡(luò)模型可以劃分為多種網(wǎng)絡(luò)類型。究其根源,網(wǎng)絡(luò)的拓撲結(jié)構(gòu)、神經(jīng)元傳遞函數(shù)、學(xué)習(xí)算法和系統(tǒng)特點等是區(qū)分各種網(wǎng)絡(luò)的根本要素。圖5-15-人工神經(jīng)網(wǎng)絡(luò)模型的分類

1)BP神經(jīng)網(wǎng)絡(luò)

BP(BackPropagation,反向傳播)神經(jīng)網(wǎng)絡(luò)是由Rumelhart和McClelland為首的科研小組于1986年提出的,它是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋人工神經(jīng)網(wǎng)絡(luò),也是目前應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。BP網(wǎng)絡(luò)能夠?qū)W習(xí)和存儲大量輸入輸出模式的映射關(guān)系,而無需事先揭示描述這種映射關(guān)系的數(shù)學(xué)方程。其基本原理是使用最速下降法,通過反向傳播來不斷調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,使網(wǎng)絡(luò)的誤差平方和最小。

以兩層BP神經(jīng)網(wǎng)絡(luò)為例,模型的訓(xùn)練過程可以總結(jié)為:

?系統(tǒng)自動隨機賦予權(quán)值和偏差的初始值,隨機值的取值應(yīng)當較小,以避免網(wǎng)絡(luò)出現(xiàn)加權(quán)輸入飽和的問題,除此之外,還要對期望誤差最小值、最大循環(huán)次數(shù)、權(quán)值的學(xué)習(xí)速率等參數(shù)進行初始化處理。

?輸入樣本,計算網(wǎng)絡(luò)各層輸出及網(wǎng)絡(luò)誤差。

?計算各層逆向傳播的誤差變化,更新連接權(quán)值和閾值。

?利用修正值再次計算誤差平方和,與期望誤差進行比較,達到訓(xùn)練結(jié)束條件則停止訓(xùn)練過程,否則重復(fù)上述過程繼續(xù)訓(xùn)練。

2)Hopfield神經(jīng)網(wǎng)絡(luò)

BP神經(jīng)網(wǎng)絡(luò)屬于前饋式網(wǎng)絡(luò)的一種,和BP神經(jīng)網(wǎng)絡(luò)同一時期出現(xiàn)的Hopfield神經(jīng)網(wǎng)絡(luò)也很經(jīng)典和重要,它是一種反饋式神經(jīng)網(wǎng)絡(luò),比BP的出現(xiàn)還要早一些,其基本思想為基于灌輸式的學(xué)習(xí),即網(wǎng)絡(luò)的權(quán)值不是通過訓(xùn)練求得的,而是按照一定的規(guī)則計算出來的。Hopfield神經(jīng)網(wǎng)絡(luò)就是采用了這種學(xué)習(xí)方式,其權(quán)值一旦確定就不再改變,但是網(wǎng)絡(luò)中各神經(jīng)元的狀態(tài)在運行過程中是不斷更新的,當網(wǎng)絡(luò)運行到穩(wěn)定狀態(tài)時,各神經(jīng)元的狀態(tài)便是問題的最終求解結(jié)論。

Hopfield神經(jīng)網(wǎng)絡(luò)模型可以分為離散型和連續(xù)型兩種,分別記為DHNN(DiscreteHopfieldNeuralNetwork)和CHNN(ContinuesHopfieldNeuralNetwork),這里主要討論離散型網(wǎng)絡(luò)模型,如圖5-16所示。圖5-16離散Hopfield神經(jīng)網(wǎng)絡(luò)模型表示

輸出不斷地反饋到輸入端,使得Hopfield網(wǎng)絡(luò)的狀態(tài)在輸入的激勵下產(chǎn)生持續(xù)的變化,只要存在輸入,就可以獲得輸出信號,而輸出又會被反饋到輸入以產(chǎn)生新的輸出,如此往復(fù)。如果Hopfield網(wǎng)絡(luò)是一個收斂的穩(wěn)定網(wǎng)絡(luò),那么反饋和迭代的變化就會越來越小,當網(wǎng)絡(luò)的輸出為一個穩(wěn)定的恒值時,證明網(wǎng)絡(luò)已經(jīng)達到平衡狀態(tài)可以停止訓(xùn)練。其實,這種網(wǎng)絡(luò)是否成功的關(guān)鍵就在于如何在穩(wěn)定條件下確定網(wǎng)絡(luò)的權(quán)重系數(shù)。這里僅考慮串行工作方式下的神經(jīng)網(wǎng)絡(luò)訓(xùn)練步驟,串行(異步)工作方式的Hopfield神經(jīng)網(wǎng)絡(luò)訓(xùn)練步驟如圖5-17所示,除此之外,網(wǎng)絡(luò)的訓(xùn)練方式還有并行(同步)形式,在此不再贅述。圖5-17Hopfield神經(jīng)網(wǎng)絡(luò)訓(xùn)練步驟

3)Kohonet神經(jīng)網(wǎng)絡(luò)

1972年,芬蘭的Kohonet教授提出了自組織神經(jīng)網(wǎng)絡(luò),即Kohonet神經(jīng)網(wǎng)絡(luò)。這個自組織神經(jīng)網(wǎng)絡(luò)的典型結(jié)構(gòu)如圖5-18所示,該網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層和競爭層兩部分,輸入層一般是一個一維陣列,負責接收外界信息,并通過權(quán)向量將外界信息匯集到競爭層的各神經(jīng)元中;而競爭層神經(jīng)元排列的典型結(jié)構(gòu)是二維形式,通過計算競爭層的權(quán)值向量和輸入向量的距離,可以求取最小距離的神經(jīng)元。網(wǎng)絡(luò)訓(xùn)練中會不斷修改權(quán)值及輸出神經(jīng)元,直至其小于某個特定值時結(jié)束訓(xùn)練并計算輸出結(jié)果。圖5-18自組織神經(jīng)網(wǎng)絡(luò)的典型結(jié)構(gòu)

5.2.5-人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練

1)監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)的主要思路是,根據(jù)已有的數(shù)據(jù)集、輸入輸出之間的關(guān)系,訓(xùn)練得到一個最優(yōu)的模型。

針對連續(xù)型變量和離散型變量,監(jiān)督學(xué)習(xí)可以分別實現(xiàn)分類和回歸兩種功能。例如,判斷花卉種類的訓(xùn)練集和測試集詳情如圖5-19所示。圖5-19判斷花卉種類

2)無監(jiān)督學(xué)習(xí)

在現(xiàn)實生活中,更為常見的情況是,由于缺乏足夠的先驗知識,使得監(jiān)督學(xué)習(xí)算法中需要的標簽信息難以人工標注或標注成本過高,很自然地,人們就希望計算機能代替或者至少提供一些幫助來完成這項工作,無監(jiān)督學(xué)習(xí)模式隨之產(chǎn)生。

無監(jiān)督學(xué)習(xí)中最典型的算法就是聚類,聚類的目的是把相似的東西聚集在一起,但是并不關(guān)心具體的類別是什么,因此,聚類算法的核心是知道如何計算數(shù)據(jù)的相似度。舉個

簡單的例子,在識別貓的過程中,我們可以用聚類算法,如圖5-20所示,嘗試提取貓的毛皮、四肢趾爪、眼睛、耳朵、牙齒、胡須等特征,計算機通過對特征相同的動物進行聚類計算,就可以將貓或者貓科動物聚類為一組。圖5-20無監(jiān)督學(xué)習(xí)的聚類應(yīng)用

3)強化學(xué)習(xí)

強化學(xué)習(xí)是用于描述和解決智能體在與環(huán)境交互的過程中通過學(xué)習(xí)策略來取得最大化的預(yù)期利益或?qū)崿F(xiàn)特定目標的學(xué)習(xí)方法,其中,智能體以“試錯”的方式進行學(xué)習(xí),通過與環(huán)境進行交互獲得的獎賞指導(dǎo)行為,驅(qū)動智能體向著獲得最大獎賞的目標不斷學(xué)習(xí)。強化學(xué)習(xí)與監(jiān)督學(xué)習(xí)的區(qū)別主要表現(xiàn)在強化信號上,監(jiān)督學(xué)習(xí)會提供特征和標簽來建立二者之間的聯(lián)系,但是強化學(xué)習(xí)不會告訴強化學(xué)習(xí)系統(tǒng)如何去產(chǎn)生正確的動作,而是由環(huán)境提供強化信號,對產(chǎn)生動作的好壞作出評價。由于外部環(huán)境提供的信息很少,系統(tǒng)必須依據(jù)自身的經(jīng)驗來進行學(xué)習(xí),在行動—評價體系中不斷獲取知識,動態(tài)地調(diào)整模型參數(shù),從而得到最大的強化信號。

5.3基于神經(jīng)網(wǎng)絡(luò)的傳感器應(yīng)用

5.3.1應(yīng)用概述神經(jīng)網(wǎng)絡(luò)的信息處理任務(wù)主要可以概括為兩個:(1)數(shù)學(xué)上的映射逼近。映射逼近即找到一種合適的映射函數(shù),以自組織的方式響應(yīng)對應(yīng)的樣本集。目標識別、分類等問題的計算過程都可以抽象成這樣一種近似的數(shù)學(xué)上的映射逼近。

(2)聯(lián)想記憶。聯(lián)想記憶是指對模式狀態(tài)的恢復(fù)、內(nèi)容的完善以及相關(guān)模式的相互回憶等。模式識別技術(shù)的應(yīng)用通常會一定程度上受到噪聲干擾或輸入模式的部分缺失影響。

而神經(jīng)網(wǎng)絡(luò)的信息是以分布式狀態(tài)存儲于連接權(quán)系數(shù)中的,具有很高的容錯性和魯棒性,神經(jīng)網(wǎng)絡(luò)的這一優(yōu)勢使其能夠成功地應(yīng)用于模式識別問題。

究其本質(zhì),基于神經(jīng)網(wǎng)絡(luò)的傳感信號處理主要涉及兩個重要的問題,即模式預(yù)處理變換和模式識別。模式預(yù)處理變換是指針對一種形式的模式,應(yīng)用神經(jīng)網(wǎng)絡(luò)將其轉(zhuǎn)換為更為

適用或可用形式的模式;模式識別則是指把一種模式映射到其他類型或類別的過程。因此,神經(jīng)網(wǎng)絡(luò)能夠在傳感信號處理中得到應(yīng)用,根本原因是神經(jīng)網(wǎng)絡(luò)的函數(shù)逼近能力以及基于此的傳感器建模。神經(jīng)網(wǎng)絡(luò)函數(shù)逼近算法的研究非常廣泛,基于神經(jīng)網(wǎng)絡(luò)的傳感系統(tǒng)的建模方法主要有三種:直接逆系統(tǒng)建模法、正逆系統(tǒng)建模法與逆逆系統(tǒng)建模法。

(1)直接逆系統(tǒng)建模法。該方法是指將不同的設(shè)定信號作為未知傳感器的輸入u1,測量其相應(yīng)的輸出信號y1,基于這樣的輸入輸出數(shù)據(jù)來訓(xùn)練一個神經(jīng)網(wǎng)絡(luò),將未知傳感器的輸出y1作為網(wǎng)絡(luò)輸入u2,而根據(jù)網(wǎng)絡(luò)的輸出y2預(yù)測出未知傳感器的輸入,網(wǎng)絡(luò)訓(xùn)練的目標就是使得這時的y2與u1誤差最小。

(2)正逆系統(tǒng)建模法。該方法也稱作正模型逆系統(tǒng)學(xué)習(xí)法,是指在未知傳感器的動力學(xué)系統(tǒng)(正)模型的基礎(chǔ)上建立逆動力學(xué)模型。比較典型的學(xué)習(xí)方法有兩種:另一種是傳感

器逆系統(tǒng)學(xué)習(xí)法,即直接利用設(shè)定給逆系統(tǒng)神經(jīng)網(wǎng)絡(luò)的期望輸入和未知傳

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論