深海集礦機(jī)實(shí)時(shí)避障bp神經(jīng)網(wǎng)絡(luò)建模與仿真_第1頁
深海集礦機(jī)實(shí)時(shí)避障bp神經(jīng)網(wǎng)絡(luò)建模與仿真_第2頁
深海集礦機(jī)實(shí)時(shí)避障bp神經(jīng)網(wǎng)絡(luò)建模與仿真_第3頁
深海集礦機(jī)實(shí)時(shí)避障bp神經(jīng)網(wǎng)絡(luò)建模與仿真_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

深海集礦機(jī)實(shí)時(shí)避障bp神經(jīng)網(wǎng)絡(luò)建模與仿真

近年來,隨著科學(xué)技術(shù)的不斷創(chuàng)新和進(jìn)步,在處理未知和多變環(huán)境下移動發(fā)病機(jī)的局部路徑規(guī)劃方面取得了很大進(jìn)展,提出了幾種方法,如基于模型反應(yīng)法(apf)的人工勢場法(fl)、基于行為反應(yīng)法的模糊邏輯控制方法(fl)、遺傳算法方法(ga)和神經(jīng)網(wǎng)絡(luò)法(nn)等。深海富鈷結(jié)殼及熱液硫化物調(diào)查區(qū)水深為800~4000m,包括洋中脊、海山、海盆等地質(zhì)單元;海底底質(zhì)類型為基巖(變質(zhì)玄武巖、火山巖、沉積巖、玻璃質(zhì)碎屑巖和結(jié)殼等硬基底)、砂(松散有孔蟲砂等)和泥(未固結(jié)的深海軟泥等),礦體地形崎嶇不平,多見突起和斷裂,抗壓強(qiáng)度為0.08~68.2MPa,地形坡度一般在5?~35?之間。因此,深海集礦機(jī)所面臨作業(yè)環(huán)境存在高復(fù)雜性和不可預(yù)測性?;谀P偷目刂扑惴?從海底環(huán)境模型的建立到集礦機(jī)局部路徑規(guī)劃的算法實(shí)現(xiàn),都需要考慮到各方面的影響因素,計(jì)算量大,實(shí)時(shí)性較差。而基于行為的反應(yīng)式方法通過人的知識來指導(dǎo)機(jī)器人的行為,反應(yīng)快,實(shí)時(shí)性好,且允許存在一定程度的噪聲。為此,本文作者提出基于遺傳算法的集礦機(jī)BP神經(jīng)網(wǎng)絡(luò)避障模型,將2種基于行為的反應(yīng)式方法結(jié)合應(yīng)用。重點(diǎn)放在神經(jīng)網(wǎng)絡(luò)對傳感器輸入信息的融合和擬人輸出行為控制上,充分發(fā)揮神經(jīng)網(wǎng)絡(luò)高度的非線性逼近能力和自適應(yīng)能力。并利用遺傳算法的全局搜索能力調(diào)整BP神經(jīng)網(wǎng)絡(luò)的初始化權(quán)值和閾值,從而克服其局部極小值問題。1遺傳算法神經(jīng)網(wǎng)絡(luò)權(quán)值處理人工神經(jīng)網(wǎng)絡(luò)(簡稱ANN)是指用大量的簡單計(jì)算單元(即神經(jīng)元)構(gòu)成的非線性系統(tǒng),是基于模仿人腦高度的獨(dú)立信息處理能力而建立的一種高層次擬人信息融合和處理系統(tǒng),具有高度的并行性、非線性全局性和自適應(yīng)能力。反向傳播算法是用來學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)權(quán)值最常用的方法,該算法通過目標(biāo)輸出和實(shí)際輸出的均方誤差不斷調(diào)整權(quán)值,以達(dá)到最佳擬合實(shí)際函數(shù)的目標(biāo)。但對于較為復(fù)雜的網(wǎng)絡(luò)模型,容易出現(xiàn)局部極小值問題。遺傳算法是一種通過模擬自然進(jìn)化過程搜索全局最優(yōu)解的算法,該算法同時(shí)考慮搜索空間上的多點(diǎn),并使用概率法則來引導(dǎo)其搜索,避免局部極小的可能性很大。本文將遺傳算法應(yīng)用于神經(jīng)網(wǎng)絡(luò)中,首先,將擬人信息融合技術(shù)用于分析障礙物環(huán)境,建立深海集礦機(jī)避障的神經(jīng)網(wǎng)絡(luò)模型;其次,應(yīng)用遺傳算法調(diào)整網(wǎng)絡(luò)的權(quán)值,執(zhí)行遺傳操作;最后,將執(zhí)行遺傳算法所采用的二進(jìn)制代碼譯成十進(jìn)制,輸出優(yōu)化結(jié)果解決實(shí)際問題。這樣,既繼承了遺傳算法“很強(qiáng)的宏觀搜索能力和良好的全局優(yōu)化能力”,又發(fā)揚(yáng)了神經(jīng)網(wǎng)絡(luò)“較強(qiáng)的非線性逼近能力”,可以應(yīng)用于海底這一復(fù)雜的非線性多變量環(huán)境的系統(tǒng)控制。1.1嬰兒網(wǎng)絡(luò)設(shè)計(jì)1.1.1bp神經(jīng)網(wǎng)絡(luò)的輸入集礦機(jī)在海底800~4000m工作,周圍環(huán)境采用水下聲納傳感器來檢測,分別在車體正前方、左前方、右前方、左方和右方安裝5個聲納傳感器(本文所設(shè)傳感器分布僅用于提出思路,實(shí)際情況中可以根據(jù)需要改變傳感器的數(shù)目及方向),以判斷在車體上述方向的障礙物。各方向聲波束與障礙物的相交程度,經(jīng)傳感器融合技術(shù)處理作為神經(jīng)網(wǎng)絡(luò)的輸入。傳感器及障礙物分布如圖1所示。在圖1中:1個扇形區(qū)域代表1個傳感器可檢測的最大區(qū)域(因?yàn)槁暭{傳感器是以一定角度發(fā)射聲波來檢測目標(biāo)的);L為傳感器可測最遠(yuǎn)距離;陰影區(qū)域代表障礙物區(qū)域;扇形區(qū)域與陰影區(qū)域重疊則表示傳感器檢測到障礙物。圖1所示為集礦機(jī)在行進(jìn)過程中,全部障礙物區(qū)域及其任意組合經(jīng)傳感器檢測后需要轉(zhuǎn)向時(shí)的所有可能情況(2號和3號傳感器同時(shí)檢測到障礙物,與1,2和3號傳感器同時(shí)檢測到障礙物視為同種環(huán)境類型)。設(shè)定超聲波傳感器檢測到障礙物時(shí)返回“1”信號,反之,返回“0”信號,那么,5個傳感器將分別產(chǎn)生5個返回信號,將這5個信號采用多傳感器融合技術(shù)處理后即可作為避障神經(jīng)網(wǎng)絡(luò)模型的輸入。利用BP神經(jīng)網(wǎng)絡(luò)對其進(jìn)行信息融合,在實(shí)驗(yàn)中,對于采集到的信息,去掉相同的環(huán)境信息,則剩下的信息就為代表網(wǎng)絡(luò)全部輸入特征的模式,這樣,本文所設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)含有32種輸入模式。例如向量(1,0,0,0,0)表示只有1號傳感器檢測到障礙物的輸入模式。1.1.2導(dǎo)師信號訓(xùn)練網(wǎng)絡(luò)根據(jù)實(shí)際避障控制要求,將神經(jīng)網(wǎng)絡(luò)的輸出設(shè)置為3個,用來更新集礦機(jī)的注視向量、轉(zhuǎn)向角和轉(zhuǎn)向速度,如圖2所示。在圖2中:向量m為注視向量,它始終指向垂直車體的正方向(集礦機(jī)前進(jìn)的方向)或反方向(本文規(guī)定轉(zhuǎn)向角大于90?時(shí)為非前進(jìn)方向);v為速度;ω為集礦機(jī)避開障礙物所需要的轉(zhuǎn)向角。以傳感器返回信號為依據(jù),確定與之相對應(yīng)的障礙物分布情況,對已經(jīng)設(shè)定的3個輸出量,分別采取人為設(shè)置的方法,逐個設(shè)置導(dǎo)師信號。為了與輸入模式匹配,首先將抽象的輸出數(shù)值化,設(shè)定如下:對于注視向量而言,“1”表示正方向;“-1”則表示反方向。對于轉(zhuǎn)向角而言,“1”表示不轉(zhuǎn)向,即轉(zhuǎn)向角為0?;“-2”表示向左轉(zhuǎn)φ?;“2”表示向右轉(zhuǎn)φ?(φ根據(jù)集礦機(jī)實(shí)際情況而定,本文仿真中選取45?);“-3”表示向左轉(zhuǎn)90?;“3”表示向右轉(zhuǎn)90?;“4”則表示向右轉(zhuǎn)向180?。對于速度而言,“1”表示集礦機(jī)正常工作速度;“2”表示轉(zhuǎn)向時(shí)減速后的速度。以輸入模式為(0,1,0,0,0)為例,(0,1,0,0,0,1,2,2)代表其對應(yīng)的網(wǎng)絡(luò)訓(xùn)練導(dǎo)師信號,即當(dāng)僅有2號傳感器檢測到障礙物時(shí),集礦機(jī)右轉(zhuǎn)一定角度即可實(shí)現(xiàn)避障。結(jié)合集礦機(jī)的實(shí)際行進(jìn)情況,并綜合人的行走經(jīng)驗(yàn),對全部典型環(huán)境構(gòu)成的向量一一制定相應(yīng)的導(dǎo)師信號訓(xùn)練網(wǎng)絡(luò),網(wǎng)絡(luò)訓(xùn)練的完成就意味著整組非線性關(guān)系已確定。也就是說,網(wǎng)絡(luò)已經(jīng)對人的獨(dú)立思維處理能力進(jìn)行了一定程度的模擬,可以針對采集到的任意信息給出合理的輸出,進(jìn)而使集礦機(jī)達(dá)到實(shí)時(shí)避障的目的。1.1.3神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)本文設(shè)計(jì)的BP神經(jīng)網(wǎng)絡(luò)為3層,各層神經(jīng)元設(shè)置分別為:輸入層神經(jīng)元為5個,隱藏層神經(jīng)元為10個,輸出層神經(jīng)元為3個,網(wǎng)絡(luò)中所有的權(quán)值設(shè)定在[-1,1]區(qū)間內(nèi),由遺傳算法進(jìn)行學(xué)習(xí)更新。網(wǎng)絡(luò)整體組織結(jié)構(gòu)如圖3所示。神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)包括訓(xùn)練樣本、最大循環(huán)次數(shù)、訓(xùn)練期望誤差和學(xué)習(xí)速率。已劃分的32種輸入模式為本文所需訓(xùn)練樣本;最大循環(huán)次數(shù)設(shè)定為50,期望誤差值選取0.001,學(xué)習(xí)速率選取1.0。1.2遺傳算法初始權(quán)值的確定在神經(jīng)網(wǎng)絡(luò)中,權(quán)值的初始化是網(wǎng)絡(luò)最終輸出優(yōu)劣程度最重要的決定因素之一,同時(shí),也在很大程度上影響著網(wǎng)絡(luò)本身的訓(xùn)練效果。不同的初始權(quán)值可能會對訓(xùn)練時(shí)間、收斂性、泛化誤差造成很大的差異。為了更好地解決神經(jīng)網(wǎng)絡(luò)初始權(quán)值的確定問題,本文利用遺傳算法的宏觀搜索和全局優(yōu)化能力來確定初始權(quán)值和閾值,將遺傳算法的初始種群規(guī)模設(shè)定為50,遺傳代數(shù)選取100代,執(zhí)行遺傳操作。圖4所示為本文所采用方法的具體流程。2遺傳算法適應(yīng)值根據(jù)上述模型,應(yīng)用Matlab神經(jīng)網(wǎng)絡(luò)工具箱和遺傳工具箱進(jìn)行仿真分析。為了更清楚地說明遺傳算法在神經(jīng)網(wǎng)絡(luò)應(yīng)用中的優(yōu)勢,首先對沒有引入遺傳算法的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。經(jīng)多次訓(xùn)練觀察,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)會出現(xiàn)圖5所示情況,即在誤差達(dá)到訓(xùn)練目標(biāo)之前,陷入局部極小,從而導(dǎo)致訓(xùn)練失敗。將遺傳算法引入BP神經(jīng)網(wǎng)絡(luò)后,發(fā)現(xiàn)網(wǎng)絡(luò)會在較小的訓(xùn)練代數(shù)內(nèi)達(dá)到所要求誤差,在很大程度上克服了局部極小值問題。其中,達(dá)到要求誤差精度所需訓(xùn)練代數(shù)為10~50代,本文選取訓(xùn)練代數(shù)為15代時(shí)的情況加以說明,如圖6所示。適應(yīng)值的度量是遺傳算法群體演化的依據(jù)。在GA-BP神經(jīng)網(wǎng)絡(luò)權(quán)值優(yōu)化過程中,適應(yīng)值設(shè)置為網(wǎng)絡(luò)均方誤差平方和的倒數(shù),用來描述網(wǎng)絡(luò)對所求權(quán)值的滿意度。圖7所示為遺傳算法的適應(yīng)值。從圖7可以看出:適應(yīng)值函數(shù)曲線呈單調(diào)上升狀態(tài),并在短期訓(xùn)練時(shí)間內(nèi)趨于穩(wěn)定,表明網(wǎng)絡(luò)實(shí)現(xiàn)所期望輸出的能力越來越強(qiáng),并快速完成了訓(xùn)練任務(wù),達(dá)到穩(wěn)定狀態(tài),使得輸出盡大可能地逼近網(wǎng)絡(luò)的設(shè)計(jì)目標(biāo)。并且適應(yīng)值趨于穩(wěn)定后,其值可達(dá)到約88%,從而表明神經(jīng)網(wǎng)絡(luò)訓(xùn)練是較成功的。本文建立了不同的不確定障礙物環(huán)境和集礦機(jī)預(yù)定行走路徑,以全面檢驗(yàn)避障效果。仿真參數(shù)如下:障礙物環(huán)境尺寸(長×寬)為50m×50m;集礦機(jī)外形尺寸(長×寬)為2m×2m;行走速度為1m/s(正常行走速度)和0.5m/s(轉(zhuǎn)向速度);傳感器測量最大距離為2m。避障實(shí)驗(yàn)仿真結(jié)果如圖8和圖9所示。其中:點(diǎn)型矩陣區(qū)域代表所設(shè)定隨機(jī)障礙物區(qū)域;方塊代表模擬集礦機(jī);x和y分別為海底局部區(qū)域經(jīng)、緯度坐標(biāo);虛線所示線路為方塊避障行走軌跡(考慮到圖片清晰度,行進(jìn)路線由每隔0.2s所取集礦機(jī)的中心點(diǎn)組成)。可見:應(yīng)用本文所述方法,可以使集礦機(jī)在不同的障礙物分布環(huán)境中,根據(jù)預(yù)定路徑,實(shí)時(shí)調(diào)整自身的運(yùn)行軌跡,從而較好地實(shí)現(xiàn)避障與路徑規(guī)劃。3小值問題的處理(1)結(jié)合深海集礦機(jī)的實(shí)際作業(yè)環(huán)境,建立集礦機(jī)的避障BP神經(jīng)網(wǎng)絡(luò)模型,并將遺傳算法引入神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程的學(xué)習(xí)方法,克服了BP神經(jīng)網(wǎng)絡(luò)的局部極小值問題,從而使得GA-BP避障神經(jīng)網(wǎng)絡(luò)模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論