論文-基于神經(jīng)網(wǎng)絡(luò)預(yù)測紅外圖像景物深度分析_第1頁
論文-基于神經(jīng)網(wǎng)絡(luò)預(yù)測紅外圖像景物深度分析_第2頁
論文-基于神經(jīng)網(wǎng)絡(luò)預(yù)測紅外圖像景物深度分析_第3頁
論文-基于神經(jīng)網(wǎng)絡(luò)預(yù)測紅外圖像景物深度分析_第4頁
論文-基于神經(jīng)網(wǎng)絡(luò)預(yù)測紅外圖像景物深度分析_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

[34],是它的很關(guān)鍵的一個指標,任何沒有良好泛化能力的神經(jīng)網(wǎng)絡(luò)都是沒有意義的。4.3基于BP神經(jīng)網(wǎng)絡(luò)的紅外圖像深度估計在圖像處理的過程中,大部分的工作重點可能在于處理圖像中所有的像素點以及所對應(yīng)的像素點信息,這個工作所涉及的數(shù)據(jù)量十分巨大。而對于圖像的深度估計工作,從第二章所得到的特征向量與樣本的深度值之間,可能存在的是關(guān)系是一個很大的非線性的映射,所以采用一種非線性的擬合方式,往往比線性擬合,具有更好的輸出效果。但是在實際工作中,篩選一種最合適的非線性擬合函數(shù)比較困難,所以現(xiàn)在的目標就是尋求一種在訓(xùn)練線性擬合函數(shù)的同時,也具備非線性學(xué)習能力的方法,因此就產(chǎn)生了引入神經(jīng)網(wǎng)絡(luò)到圖像處理的工作中的設(shè)想。相對于其他的計算方式,神經(jīng)網(wǎng)絡(luò)的獨立計算能力有它獨有的優(yōu)勢:神經(jīng)網(wǎng)絡(luò)具有大規(guī)模的并行分布式結(jié)構(gòu),同時由于這種結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)產(chǎn)生了比較強大的泛化能力,也就是說它存在一定的學(xué)習能力。而這,也正是能夠采用人工神經(jīng)網(wǎng)絡(luò)來進行機器人學(xué)習,實行監(jiān)督學(xué)習的預(yù)測方法的理論來源。在神經(jīng)網(wǎng)絡(luò)當中,BP神經(jīng)網(wǎng)絡(luò)模型的算法較為簡潔,同時,其基礎(chǔ)功能的強大也是很多學(xué)者看重這種模型的原因,所以BP神經(jīng)網(wǎng)絡(luò)算法在當前的應(yīng)用也比較廣泛。在這個前提下,我們這里提出一種基于簡單BP神經(jīng)網(wǎng)絡(luò)模型所拓展出的紅外圖像景物深度估計的算法。4.3.1神經(jīng)網(wǎng)絡(luò)的訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)如果需要具備良好的學(xué)習能力和泛化能力,首先需要通過訓(xùn)練使網(wǎng)絡(luò)具有聯(lián)想記憶和預(yù)測能力。其訓(xùn)練過程可以包括以下幾個步驟:(1)根據(jù)樣本訓(xùn)練集的輸入輸出序列分別確定網(wǎng)絡(luò)輸入層、隱含層和輸出層的節(jié)點數(shù),并初始化連接輸入層、隱含層和輸出層神經(jīng)元之間的權(quán)值和,給定學(xué)習速率和神經(jīng)元激勵函數(shù)。(2)計算隱含層的輸出H:(4-4)式中為隱含層節(jié)點數(shù),為各隱含層節(jié)點的閾值,為隱含層激勵函數(shù)。(3)計算預(yù)測輸出O:(4-5)式中為輸出層節(jié)點數(shù),為各輸出層節(jié)點的閾值。(4)根據(jù)預(yù)測輸出和期望輸出計算誤差e,并根據(jù)計算誤差e更新網(wǎng)絡(luò)連接權(quán)值,和各節(jié)點的閾值a,b:(4-6)(4-7)(4-8)(4-9)式中為輸入層節(jié)點數(shù),為學(xué)習速率。(5)循環(huán)步驟2到步驟4,直到算法迭代結(jié)束。將算法運用到相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型中進行運算,下圖4-4就是該算法的流程圖:構(gòu)建的深度模型,如圖所示,深度訓(xùn)練集以上部分是紅外圖像的預(yù)處理過程,將預(yù)處理獲得的圖片數(shù)據(jù)矩陣輸入到神經(jīng)網(wǎng)絡(luò)的輸入輸出端進行訓(xùn)練學(xué)習。經(jīng)過一段時間,獲得具有泛化能力的神經(jīng)網(wǎng)絡(luò)模型,之后將需要進行深度圖預(yù)測的圖,數(shù)據(jù)處理后,放入到神經(jīng)網(wǎng)絡(luò)中預(yù)測泛化,可以將所求數(shù)據(jù),經(jīng)過處理形成一個合適的矩陣數(shù)據(jù),重建恢復(fù),最終獲得我們想要的深度圖。圖4-4BP神經(jīng)網(wǎng)絡(luò)算法流程圖4.3.2實驗過程與結(jié)果在這里,我們首先對樣本集的輸入(已知紅外圖像)進行預(yù)處理:將樣本像素點數(shù)設(shè)為N,一般地,由于RGB彩色圖像的儲存原理,我們得到的紅外圖片也常常為的大小。將之處理成純灰度圖片,則其轉(zhuǎn)化成單層數(shù)據(jù),之后利用“勞斯掩膜”將其進行處理,轉(zhuǎn)化成矩陣可處理的double型數(shù)據(jù),提取我們需要的20維特征向量數(shù)據(jù),如圖4-5所示:圖4-5提取出的20維特征向量將數(shù)據(jù)另存為Input1.mat,作為訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的輸入量。對樣本集特征深度圖作處理,RGB轉(zhuǎn)化為純灰度圖后,將uint8型數(shù)據(jù)轉(zhuǎn)化為double型,則矩陣內(nèi)參數(shù)均轉(zhuǎn)換成0至1之間的數(shù)據(jù),之后重新組合成1維向量,如圖4-6,記為Output1.mat,作為訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的輸出量。圖4-6深度圖處理后的1維向量之后構(gòu)建深度訓(xùn)練集,在神經(jīng)網(wǎng)絡(luò)中,以Input1.mat為輸入,以O(shè)utput1.mat為輸出,進行訓(xùn)練。BP神經(jīng)網(wǎng)絡(luò)的隱含層節(jié)點數(shù)對它的預(yù)測精度有較大的影響:節(jié)點數(shù)太少,網(wǎng)絡(luò)欠學(xué)習,訓(xùn)練精度降低;節(jié)點數(shù)太多,造成訓(xùn)練時間增加,造成過擬合。這里我們選擇的隱層設(shè)置為nHidden=[40105],即這個三層神經(jīng)網(wǎng)絡(luò),進入輸入層之后,第一個隱層存在40個神經(jīng)元節(jié)點,第二個隱層為10個節(jié)點,第三個隱層為5個節(jié)點,之后進入輸出層。經(jīng)過計算機的訓(xùn)練演算,該模型能形成一個具有一定“泛化”能力的神經(jīng)網(wǎng)絡(luò)。之后的深度圖的實現(xiàn),就是通過對該神經(jīng)網(wǎng)絡(luò)模型的“泛化”能力進行運用而達到實驗?zāi)康牡?。在進行下一步實驗前,首先對所得到的神經(jīng)網(wǎng)絡(luò)的性能進行:對樣本進行實驗,將樣本的Input1.mat矩陣放入神經(jīng)網(wǎng)絡(luò)模型進行實驗預(yù)測,得到結(jié)果如圖4-7,4-8,4-9:圖4-7樣本集紅外圖像圖4-8樣本集特征深度圖圖4-9經(jīng)神經(jīng)網(wǎng)絡(luò)預(yù)測的樣本對樣本集特征深度圖數(shù)據(jù)矩陣,提取位于中間部分的400個數(shù)據(jù),為了進行對比,從神經(jīng)網(wǎng)絡(luò)預(yù)測樣本矩陣的相同位置同樣提取400個數(shù)據(jù),結(jié)果如圖4-10:圖4-10樣本數(shù)據(jù)和預(yù)測數(shù)據(jù)對比圖從上圖所示結(jié)果,我們發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)模型的預(yù)測在數(shù)據(jù)的總體趨勢還是近似,其泛化能力還是相當不錯的。之后我們利用神經(jīng)網(wǎng)絡(luò)進行預(yù)測,此時,選擇一張圖片,通過“勞斯掩碼”的程序,也將之轉(zhuǎn)化成的的20維向量矩陣數(shù)據(jù),輸入神經(jīng)網(wǎng)絡(luò)進行預(yù)測,得到1維的深度特征信息,按照輸入圖的像素點分布情況,經(jīng)過處理后最終可以還原成為我們所需要的特征深度圖。結(jié)果如下:(b)圖4-11(a)測試紅外圖像,(b)BP神經(jīng)網(wǎng)絡(luò)模型的深度估計預(yù)測結(jié)果在本實驗中,在確定上述隱層節(jié)點[40105]設(shè)置是否合理,為了確定實驗內(nèi)容的優(yōu)良性,我還對該神經(jīng)網(wǎng)絡(luò)模型進行了許多次的嘗試性設(shè)定,實驗結(jié)果或好或外,但是從總體結(jié)果來說,顯然還是上述節(jié)點設(shè)置較為合理。下面就是我的一部分較差的實驗設(shè)定的輸出結(jié)果:下圖4-12是原圖與隱層節(jié)點數(shù)設(shè)置[40205]的神經(jīng)網(wǎng)路的輸出預(yù)測圖圖4-12原圖與隱層節(jié)點數(shù)設(shè)置[40205]的神經(jīng)網(wǎng)路輸出預(yù)測圖對于隱層設(shè)置數(shù)為[40205]的神經(jīng)網(wǎng)絡(luò),對于細節(jié)點的表現(xiàn),往往顯得比較模糊,而且總體來說,這種設(shè)置的情況下,預(yù)測輸出圖顯得偏灰,沒有比較優(yōu)良的輸出效果,圖像沒有立體感。下圖4-13是原圖與隱層節(jié)點數(shù)設(shè)置[405]的神經(jīng)網(wǎng)絡(luò)的輸出預(yù)測圖圖4-13原圖與隱層節(jié)點數(shù)設(shè)置[405]的神經(jīng)網(wǎng)絡(luò)的輸出預(yù)測圖對于隱層設(shè)置數(shù)為[405]的神經(jīng)網(wǎng)絡(luò),由于隱層數(shù)目不足,其預(yù)測效果更加的不真實,圖像發(fā)灰發(fā)白現(xiàn)象更加嚴重,甚至對于景物中的汽車和人的輪廓的描述更是不佳,無法顯示出原圖中的景物信息。雖然沒有將所有的實驗對照組都展示出來,但是僅僅通過上述三組實驗結(jié)果的演示,就可以發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練需要比較多的嘗試,而這比較優(yōu)良的設(shè)置方案也是我在通過一些文獻的學(xué)習和多次嘗試之后才得到的。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程可以看成是一個曲線擬合的過程,網(wǎng)絡(luò)本身可以被簡單地認為是一個非線性輸入——輸出映射,那么由此就可以看出神經(jīng)網(wǎng)絡(luò)的泛化其實就是對輸入數(shù)據(jù)進行非線性插值的結(jié)果。在實驗的結(jié)果中可以發(fā)現(xiàn),我們所采用的神經(jīng)網(wǎng)絡(luò)模型所具備的泛化特性還是在實驗中比較好的體現(xiàn)了出來,并且我們得到的結(jié)果還是比較良好的。但是在實驗中,訓(xùn)練時間較長,并且神經(jīng)網(wǎng)絡(luò)的隱層節(jié)點數(shù)沒有較好的理論可以指導(dǎo)我進行設(shè)置,這些方面,之后還有改進的可能性。4.4本章小結(jié)本章首先介紹了生物神經(jīng)元結(jié)構(gòu)并且解釋了人工神經(jīng)元(ANN)網(wǎng)絡(luò)的原理結(jié)構(gòu),之后介紹了人工神經(jīng)元網(wǎng)絡(luò)的發(fā)展歷史,對BP神經(jīng)網(wǎng)絡(luò)的特點進行了討論。基于第三章的算法結(jié)構(gòu)和思路,搭建相應(yīng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),之后將第二章樣本圖片預(yù)處理結(jié)構(gòu)輸入神經(jīng)網(wǎng)絡(luò)訓(xùn)練之后進行相應(yīng)的實驗過程。之后就多個神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)定值進行實驗結(jié)果的分析討論,從中找出了結(jié)果較為優(yōu)良的實驗組,并且分析總結(jié)本次實驗的得與失。

5本文總結(jié)5.1工作小結(jié)這次的畢業(yè)設(shè)計中,我的主目標是尋找一種合適的方法來進行紅外圖像的處理。趙老師在這方面給了我很大的幫助,通過對以前的各種方法的學(xué)習和回顧,我最終決定采用MATLAB這個功能強大的軟件進行我的畢業(yè)設(shè)計。雖然曾經(jīng)學(xué)習過MATLAB的課程,但是也遺忘了許多,這次的畢業(yè)設(shè)計的過程,我通過老師的指導(dǎo),以及查閱相關(guān)資料進行自學(xué),不僅回顧了以前課程中的學(xué)習過程,還學(xué)到了許多不曾學(xué)習過的新東西,這對我是一次很好的經(jīng)歷,對我以后工作、學(xué)習、生活都有很大的幫助。通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練,得到相應(yīng)的數(shù)據(jù)處理模型,之后將預(yù)處理后得到的數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)后經(jīng)過神經(jīng)網(wǎng)絡(luò)的預(yù)測,得到輸出的深度圖效果良好,實驗證明了通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練的模型有較好的泛化能力,達到了預(yù)期的目的。但是總的來說,實驗過程中,由于神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建,數(shù)據(jù)量很大,計算過程比較長,對于計算機的性能也是一個比較大的考驗,希望以后能找到更加好的方式來縮短這個過程。同時在神經(jīng)網(wǎng)絡(luò)的隱層安排過程中,就算有先驗經(jīng)驗的存在,但這同樣也是一個并不容易的過程,希望能在以后有機會,掌握到更好的更好地設(shè)計思路。5.2討論與展望在整個實驗過程中,仍然存在有許多不足之處,如對于神經(jīng)網(wǎng)絡(luò)的樣本處理過于單一,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度比較慢,并且神經(jīng)網(wǎng)絡(luò)訓(xùn)練的模型雖然有較好的泛化能力,但對于一小部分圖像的輸出效果并不是很理想。原因在于對原始數(shù)據(jù)的處理方面,勞斯掩膜雖然具有較好的效果,但是還有可以改進的地方。在神經(jīng)網(wǎng)絡(luò)方面,程序部分方面也可以改進很多,我的知識面仍然不足,我覺得以后如果有機會學(xué)習到更加良好的模型,這方面的效果肯定會有顯著的提升,并且能有不錯的預(yù)測效果。相信經(jīng)過這次畢業(yè)設(shè)計的學(xué)習過程,我對于以后的工作學(xué)習生活過程中,不管是否還能用到這些知識,但是它們帶給我的收獲,等多的是對于學(xué)習態(tài)度的一種提升,我會在以后更加關(guān)注這方面的知識。

參考文獻張敬賢,李玉丹,金偉其.微光與紅外成像技術(shù)[M].北京:北京理工大學(xué)出版社,1994紀紅.紅外技術(shù)基礎(chǔ)與應(yīng)用[M].北京:科學(xué)出版社,1979張鳴平.紅外技術(shù)物理基礎(chǔ)[C],哈爾濱:中國人民解放軍炮兵工程學(xué)院,1962李俊山,楊威,張雄美.紅外圖像處理、分析與融合[M].北京:科學(xué)出版社,2009邢素霞.紅外熱成像與信號處理[M].北京:國防工業(yè)出版社,2010田國良,熱紅外遙感[M].電子工業(yè)出版社.2006.7倪愛偉.基于雙目立體視覺的三維重建技術(shù)研究[D].南京航空航天大學(xué).2009.鄒寧.深度圖像分析方法研究[D].華中理工大學(xué).2000Mohan,S,Automated3dmodelingandrenderingfromsingleviewimages,Proceedings-InternationalConferenceonComputationalIntelligenceandMultimediaApplications[J],2007(4):476-480馬祥音,查紅彬.基于單幅圖像的深度非連續(xù)性估計,計算機應(yīng)用[J].2010.30(12):43-46D.Scharstein,R.Szeliski.Ataxonomyandevaluationofdensetwo-framestereocorrespondencealgorithms.Int’lJournalofComputerVision[J],2002.(47):7–42.李濤,單目視圖與多目視圖的深度圖恢復(fù)方法研究[D].,清華大學(xué)工學(xué)碩士學(xué)位論文,2009.6Barnard,S.T.andMartin.AFischlerComputationalStereo.ACMComputingSurveys[J],1982.14(4):553-572Dhond,U.R.andJ.K.Aggarwal.StructurefromStereoAReview.IEEETransactionsonSystemsManandCybernetics[J],1989.19(6):1489-1510MyronZ,BrownDarius,BurschkaandG.D.Hager.AdvancesinComputationalStereo,IEEETransactionsonPatternAnalysisandMachineIntelligence[J],2003.25(8):993-1008Horn,B.K.B.Obtainingshapefromshadinginformation,ThePsychologyofComputerVision.NewYork:McGrawHill[J].1975:115-155Saxena,A,Chung,H&Ng.A.Learningdepthfromsinglemonocularimages[D].InNIPS,2006,18HoiemD,Efros,a.a,&HebertM.AutomaticPhotopop-up,InACMSIGGRAPH[J],2005.24(3):577-584WeiQ.Converting2Dto3D:asurvey[C]ProceedingsofInternationalConference.Netherlands:DelftUniversityofTechnology,2005,7:14ZhangL,VazquezC,KnorrS.3D-TVcontentcreation:automatic2D-to-3Dvideoconversion[J].IEEETransactionson,Broadcasting,2011,57(2):372-383.[DOI:10.1109/TBC.2011.2122930]CaoX,BovikAC,WangY,etal.Converting2Dvideoto3D:anefficientpathto3Dexperience[J].MultiMedia,IEEE,2011,18(4):12-17.[DOI:10.1109/MMUL.2011.65]AkiyukiAnzai,

GregoryCDeAngelis.Neuralcomputationsunderlyingdepthperception,CurrentOpinioninNeurobiology,2010.20(3):367-375ByronBoots,InferringDepthfromSingleImagesinNaturalScenes,DepartmentofComputerScience古小婧,基于圖像分析的自然彩色夜視成像方法研究[D],2011.9趙信宇,朱曉蕊,余錦全.單幅圖像深度信息的提取[J],制造業(yè)自動化,2010.32(3):15-17E.R.Davies.Laws’textureenergyinTEXTURE[M].InMachineVision:Theory,Algorithms,Practicalities2ndEdition.AcademicPress,SanDiego,1997李樂,張茂軍,熊志輝,徐瑋.基于內(nèi)容理解的單幅靜態(tài)街景圖像深度估計[J],機器人,2011.33(1):174-180高雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實例[D].北京:機械工業(yè)出版社,2003.7李愛軍.前虧神經(jīng)網(wǎng)絡(luò)工作機理分析與學(xué)習算法[D].北京交通大學(xué),2005趙貴玉.多層前向網(wǎng)絡(luò)泛化能力研究與應(yīng)用[D].中國人民解放軍信息工程大學(xué),2006魏海坤.神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計的理論與方法[D].北京:國防工業(yè)出版社,2005.2BartlettPL.ForV

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論