畢業(yè)設(shè)計(jì)方案(共8頁)_第1頁
畢業(yè)設(shè)計(jì)方案(共8頁)_第2頁
畢業(yè)設(shè)計(jì)方案(共8頁)_第3頁
畢業(yè)設(shè)計(jì)方案(共8頁)_第4頁
畢業(yè)設(shè)計(jì)方案(共8頁)_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上畢業(yè)設(shè)計(jì)方案題 目 : 基于神經(jīng)網(wǎng)絡(luò)的圖像識別方法研究 學(xué) 院 : 忻州師范學(xué)院 系 別 : 計(jì)算機(jī)系 本0904班 學(xué) 號 : 3 姓 名 :楊旭東 指導(dǎo)老師: 曹建芳 2012年12月11日一、 選題背景與意義1 隨著圖像技術(shù)各種基本理論的發(fā)展,各種應(yīng)用圖文系統(tǒng)在國民經(jīng)濟(jì)各部門得到了廣泛的應(yīng)用?,F(xiàn)在,通信、廣播、計(jì)算機(jī)技術(shù)、工業(yè)自動化、國防工業(yè)、,乃至印刷、醫(yī)療等部門的尖端課題無一不與圖像技術(shù)的發(fā)展密切相關(guān)。事實(shí)上,圖像技術(shù)已成為各種高技術(shù)領(lǐng)域的匯流點(diǎn),更有人預(yù)言,“圖像識別技術(shù)”將是21世紀(jì)影響國民經(jīng)濟(jì)、國家防務(wù)和世界經(jīng)濟(jì)的舉足輕重的關(guān)鍵技術(shù)。圖像識別是近二十年

2、發(fā)展起來的一門新型技術(shù)科學(xué),它以研究某些對象或者過程(統(tǒng)稱圖像)的分類與描述為主要內(nèi)容。圖像識別在很多領(lǐng)域中得到了應(yīng)用,如人臉和指紋識別、字符識別、醫(yī)學(xué)診斷,等等。簡單的說,圖像識別是圖像中的物體的模式分類,同時包括物體特征的確定,如位置、方向和尺寸等。傳統(tǒng)方法主要是統(tǒng)計(jì)模式識別、光學(xué)模式識別、分形識別、信息熵識別方法,但這些傳統(tǒng)方法自適應(yīng)能力很差,而且是在沒有噪聲干擾的情況下進(jìn)行的。這幾年神經(jīng)網(wǎng)絡(luò)圖像識別技術(shù)作為一種新型圖像識別技術(shù),在圖像識別中的應(yīng)用越來越廣泛。2 人工神經(jīng)網(wǎng)絡(luò)是由大規(guī)模神經(jīng)元互聯(lián)組成的高度非線性動力學(xué)系統(tǒng),是在認(rèn)識、理解人腦組織結(jié)構(gòu)和運(yùn)行機(jī)制的基礎(chǔ)上模擬起結(jié)構(gòu)和智能行為的

3、一種工程系統(tǒng),它具有很強(qiáng)的學(xué)習(xí)、容錯和信息處理能力,并有很高的靈活心及計(jì)算機(jī)并行性。最初,神經(jīng)網(wǎng)絡(luò)作為模式識別分類器和聚類技術(shù)在圖像處理領(lǐng)域中得到應(yīng)用,如印刷體和手寫字符識別、語音識別,以及指紋、人臉識別,等等。隨著人們對神經(jīng)網(wǎng)絡(luò)理論的進(jìn)一步研究,神經(jīng)網(wǎng)絡(luò)在圖像處理的很多領(lǐng)域也得到了成功的應(yīng)用。如圖像壓縮、圖像特征提取、圖像變換編碼,等等。如今,人工神經(jīng)網(wǎng)絡(luò)已經(jīng)成為當(dāng)今科學(xué)研究的熱點(diǎn)之一。二、設(shè)計(jì)內(nèi)容 1.圖像識別技術(shù)的基本原理和相應(yīng)的處理技術(shù),對目前常用的圖像識別方法進(jìn)行了分析、討論和比較。2.神經(jīng)網(wǎng)絡(luò)的基本原理、網(wǎng)絡(luò)結(jié)構(gòu)及網(wǎng)絡(luò)的學(xué)習(xí)方式,研究了神經(jīng)網(wǎng)絡(luò)用于圖像識別的原理及優(yōu)點(diǎn)。3.圖像識別

4、中常用的前饋神經(jīng)網(wǎng)絡(luò)及其采用的BP算法,并將具有全局優(yōu)化功能的遺傳算法與前饋神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出了一種遺傳與BP相結(jié)合的圖像識別方法,解決7BP算法容易陷入局部極小的不足。并給出了仿真實(shí)驗(yàn)。4.支持向量機(jī)的基本知識及其分類識別的原理。詳細(xì)介紹了支持向量機(jī)的分類策略和核函數(shù)的選擇問題。并在此基礎(chǔ)上,將二迸制編碼引入到圖像識別的支持向量機(jī)分類策略中,提高了支持向量機(jī)在圖像識別中的識別速度。并在此分類策略上提出了一種動態(tài)的自動樣本類別增】Jnill練方法。5.遺傳一BP網(wǎng)絡(luò)和支持向量機(jī)在車牌及人臉識別中具體的應(yīng)用方法及結(jié)果分析。三、設(shè)計(jì)方案 1 引言人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural

5、Networks)(簡稱ANN)系統(tǒng)從20世紀(jì)40年代末誕生至今僅短短半個世紀(jì),但由于它具有信息的分布存儲、并行處理以及自學(xué)習(xí)能力等優(yōu)點(diǎn),已經(jīng)大信息處理、模式識別、智能是基于誤差反向傳播(Error Back Propagation)算法的多層前饋網(wǎng)絡(luò)(Multiple-Layer Feedforward Network)(簡稱BP網(wǎng)絡(luò)),可以以任意精度逼近任意的連續(xù)函數(shù),所以廣泛應(yīng)用魚非線性建模、函數(shù)逼近、模式分類等方面。 目標(biāo)識別是模式領(lǐng)域的一項(xiàng)傳統(tǒng)的課題,這是因?yàn)槟繕?biāo)識別不是一個孤立的問題,而是模式識別領(lǐng)域中大多數(shù)課題都會遇到的問題,并且在不同的課題中,由于具體的條件不同,解決的方法也不

6、盡相同,因而目標(biāo)識別的研究仍具有理論和實(shí)踐意義,這里討論的是將要識別的目標(biāo)物體用成像頭(紅外或可見光等)攝入后形成的圖像信號序列送入計(jì)算機(jī),用神經(jīng)網(wǎng)絡(luò)識別圖像的問題。2 BP神經(jīng)網(wǎng)絡(luò)2.1 BP 神經(jīng)網(wǎng)絡(luò)BP網(wǎng)絡(luò)是采用Widrow-Hoff學(xué)習(xí)算法和非線性可微轉(zhuǎn)移的多層網(wǎng)絡(luò)。一個典型的BP網(wǎng)絡(luò)采用的是梯度下降算法,也就是Widrow-Hoff算法規(guī)定的。Backpropagation就是指的為非線性多層網(wǎng)絡(luò)計(jì)算梯度的方法,一個典型的BP網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示其中:對于第k個模式對,輸出層單元的j的加權(quán)輸入為該單元的實(shí)際輸出為而隱含層單元i的加權(quán)輸入為該單元的實(shí)際輸出為函數(shù)f為可微分遞減函數(shù)其算法描

7、述如下:(1) 初始化網(wǎng)絡(luò)及學(xué)習(xí)參數(shù),如設(shè)置網(wǎng)絡(luò)初始權(quán)矩陣、學(xué)習(xí)因子等。(2) 提供訓(xùn)練模式,訓(xùn)練網(wǎng)絡(luò),直到滿足學(xué)習(xí)要求。(3) 前向傳播過程:對給定訓(xùn)練模式輸入,計(jì)算網(wǎng)絡(luò)的輸出模式,并與期望模式比較,若有誤差,則執(zhí)行(4);否則,返回(2)。(4) 后向傳播過程:a.計(jì)算同一層單元的誤差;b.修正權(quán)值和閥值;c.返回(2)。2.2 BP網(wǎng)絡(luò)隱層個數(shù)的選擇 對于含有一個隱層的三層BP網(wǎng)絡(luò)可以實(shí)現(xiàn)輸入到輸出的任何非線性映射。增加網(wǎng)絡(luò)隱層數(shù)可以降低誤差,提高精度,但同時也使網(wǎng)絡(luò)復(fù)雜化,增加網(wǎng)絡(luò)的訓(xùn)練時間。誤差精度的提高也可以通過增加隱層結(jié)點(diǎn)數(shù)來實(shí)現(xiàn)。一般情況下,應(yīng)優(yōu)先考慮增加隱含層的結(jié)點(diǎn)數(shù)。2.3

8、 隱含層神經(jīng)元個數(shù)的選擇當(dāng)用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)網(wǎng)絡(luò)映射時,隱含層神經(jīng)元個數(shù)直接影響著神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力和歸納能力。隱含層神經(jīng)元數(shù)目較少時,網(wǎng)絡(luò)每次學(xué)習(xí)的時間較短,但有可能因?yàn)閷W(xué)習(xí)不足導(dǎo)致網(wǎng)絡(luò)無法記住全部學(xué)習(xí)內(nèi)容;隱含層神經(jīng)元數(shù)目較大時,學(xué)習(xí)能力增強(qiáng),網(wǎng)絡(luò)每次學(xué)習(xí)的時間較長,網(wǎng)絡(luò)的存儲容量隨之變大,導(dǎo)致網(wǎng)絡(luò)對未知輸入的歸納能力下降,因?yàn)閷﹄[含層神經(jīng)元個數(shù)的選擇尚無理論上的指導(dǎo),一般憑經(jīng)驗(yàn)確定。3 神經(jīng)網(wǎng)絡(luò)圖像識別系統(tǒng)人工神經(jīng)網(wǎng)絡(luò)方法實(shí)現(xiàn)模式識別,可處理一些環(huán)境信息十分復(fù)雜,背景知識不清楚,推理規(guī)則不明確的問題,允許樣品有較大的缺損、畸變,神經(jīng)網(wǎng)絡(luò)方法的缺點(diǎn)是其模型在不斷豐富完善中,目前能識別的模式類還

9、不夠多,神經(jīng)網(wǎng)絡(luò)方法允許樣品有較大的缺損和畸變,其運(yùn)行速度快,自適應(yīng)性能好,具有較高的分辨率。神經(jīng)網(wǎng)絡(luò)的圖像識別系統(tǒng)是神經(jīng)網(wǎng)絡(luò)模式識別系統(tǒng)的一種,原理是一致的。一般神經(jīng)網(wǎng)絡(luò)圖像識別系統(tǒng)由預(yù)處理,特征提取和神經(jīng)網(wǎng)絡(luò)分類器組成。預(yù)處理就是將原始數(shù)據(jù)中的無用信息刪除,平滑,二值化和進(jìn)行幅度歸一化等。神經(jīng)網(wǎng)絡(luò)圖像識別系統(tǒng)中的特征提取部分不一定存在,這樣就分為兩大類: 有特征提取部分的:這一類系統(tǒng)實(shí)際上是傳統(tǒng)方法與神經(jīng)網(wǎng)絡(luò)方法技術(shù)的結(jié)合,這種方法可以充分利用人的經(jīng)驗(yàn)來獲取模式特征以及神經(jīng)網(wǎng)絡(luò)分類能力來識別目標(biāo)圖像。特征提取必須能反應(yīng)整個圖像的特征。但它的抗干擾能力不如第2類。 無特征提取部分的:省去特征

10、抽取,整副圖像直接作為神經(jīng)網(wǎng)絡(luò)的輸入,這種方式下,系統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度大大增加了,輸入模式維數(shù)的增加導(dǎo)致了網(wǎng)絡(luò)規(guī)模的龐大。此外,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)需要完全自己消除模式變形的影響。但是網(wǎng)絡(luò)的抗干擾性能好,識別率高。本文采用無特征提取的神經(jīng)網(wǎng)絡(luò)識別方法。 當(dāng)BP 網(wǎng)用于分類時,首先要選擇各類的樣本進(jìn)行訓(xùn)練,類樣本的個數(shù)要近似相等。其原因在于一方面防止訓(xùn)練后網(wǎng)絡(luò)對樣本多的類別響應(yīng)過于敏感而對樣本數(shù)少的類別不敏感。另一方面可以大幅度提高訓(xùn)練速度,避免網(wǎng)絡(luò)陷入局部最小點(diǎn)。由于BP 網(wǎng)絡(luò)不具有不變識別的能力,所以要使網(wǎng)絡(luò)對模式的平移、旋轉(zhuǎn)、伸縮具有不變性,要盡可能選擇各種可能情況的樣本。例如要選擇不同姿態(tài)

11、、不同方位、不同角度、不同背景等有代表性的樣本,這樣可以保證網(wǎng)絡(luò)有較高的識別率。構(gòu)造神經(jīng)網(wǎng)絡(luò)分類器首先要選擇適當(dāng)?shù)木W(wǎng)絡(luò)結(jié)構(gòu):神經(jīng)網(wǎng)絡(luò)分類器的輸入就是圖像的特征向量;神經(jīng)網(wǎng)絡(luò)分類器的輸出節(jié)點(diǎn)應(yīng)該是類別數(shù)。隱層數(shù)要選好,每層神經(jīng)元數(shù)要合適,目前有很多采用一層隱層的網(wǎng)絡(luò)結(jié)構(gòu)。然后要選擇適當(dāng)?shù)膶W(xué)習(xí)算法,這樣才會有很好的識別效果。在學(xué)習(xí)階段應(yīng)該用大量的樣本進(jìn)行訓(xùn)練學(xué)習(xí),通過樣本的大量學(xué)習(xí)對神經(jīng)網(wǎng)絡(luò)的各層網(wǎng)絡(luò)的連接權(quán)值進(jìn)行修正,使其對樣本有正確的識別結(jié)果,這就像人記數(shù)字一樣,網(wǎng)絡(luò)中的神經(jīng)元就像是人腦細(xì)胞,權(quán)值的改變就像是人腦細(xì)胞的相互作用的改變,神經(jīng)網(wǎng)絡(luò)在樣本學(xué)習(xí)中就像人記數(shù)字一樣,學(xué)習(xí)樣本時的網(wǎng)絡(luò)權(quán)值調(diào)

12、整就相當(dāng)于人記住各個數(shù)字的形象,網(wǎng)絡(luò)權(quán)值就是網(wǎng)絡(luò)記住的內(nèi)容,網(wǎng)絡(luò)學(xué)習(xí)階段就像人由不認(rèn)識數(shù)字到認(rèn)識數(shù)字反復(fù)學(xué)習(xí)過程是一樣的。神經(jīng)網(wǎng)絡(luò)是按整個特征向量的整體來記憶圖像的,只要大多數(shù)特征符合曾學(xué)習(xí)過的樣本就可識別為同一類別,所以當(dāng)樣本存在較大噪聲時神經(jīng)網(wǎng)絡(luò)分類器仍可正確識別。在圖像識別階段,只要將圖像的點(diǎn)陣向量作為神經(jīng)網(wǎng)絡(luò)分類器的輸入,經(jīng)過網(wǎng)絡(luò)的計(jì)算,分類器的輸出就是識別結(jié)果。4 仿真實(shí)驗(yàn)4.1 實(shí)驗(yàn)對象本實(shí)驗(yàn)用MATLAB 完成了對神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和圖像識別模擬。從實(shí)驗(yàn)數(shù)據(jù)庫中選擇09 這十個數(shù)字的BMP 格式的目標(biāo)圖像。圖像大小為16×8 像素,每個目標(biāo)圖像分別加10、20、30、40、

13、50大小的隨機(jī)噪聲,共產(chǎn)生60 個圖像樣本。將樣本分為兩個部分,一部分用于訓(xùn)練,另一部分用于測試。實(shí)驗(yàn)中用于訓(xùn)練的樣本為40個,用于測試的樣本為20 個。隨機(jī)噪聲調(diào)用函數(shù)randn(m,n)產(chǎn)生。4.2 網(wǎng)絡(luò)結(jié)構(gòu)本試驗(yàn)采用三層的BP 網(wǎng)絡(luò),輸入層神經(jīng)元個數(shù)等于樣本圖像的象素個數(shù)16×8 個。隱含層選24 個神經(jīng)元,這是在試驗(yàn)中試出的較理想的隱層結(jié)點(diǎn)數(shù)。輸出層神經(jīng)元個數(shù)就是要識別的模式數(shù)目,此例中有10 個模式,所以輸出層神經(jīng)元選擇10 個,10 個神經(jīng)元與10 個模式一一對應(yīng)。4.3 基于MATLAB 語言的網(wǎng)絡(luò)訓(xùn)練與仿真建立并初始化網(wǎng)絡(luò)% =S1 = 24;% 隱層神經(jīng)元數(shù)目S1

14、選為24R,Q = size(numdata);S2,Q = size(targets);F = numdata;P=double(F);net = newff(minmax(P),S1 S2,'logsig''logsig','traingda','learngdm')這里numdata 為訓(xùn)練樣本矩陣,大小為128×40, targets 為對應(yīng)的目標(biāo)輸出矩陣,大小為10×40。newff(PR,S1 S2SN,TF1 TF2TFN,BTF,BLF,PF)為MATLAB 函數(shù)庫中建立一個N 層前向BP 網(wǎng)絡(luò)

15、的函數(shù),函數(shù)的自變量PR 表示網(wǎng)絡(luò)輸入矢量取值范圍的矩陣Pmin Pmax;S1SN 為各層神經(jīng)元的個數(shù);TF1TFN 用于指定各層神經(jīng)元的傳遞函數(shù);BTF 用于指定網(wǎng)絡(luò)的訓(xùn)練函數(shù);BLF 用于指定權(quán)值和閥值的學(xué)習(xí)函數(shù);PF 用于指定網(wǎng)絡(luò)的性能函數(shù),缺省值為mse。設(shè)置訓(xùn)練參數(shù)net.performFcn = 'sse' %平方和誤差性能函數(shù)net.trainParam.goal = 0.1; %平方和誤差目標(biāo)net.trainParam.show = 20; %進(jìn)程顯示頻率net.trainParam.epochs = 5000;%最大訓(xùn)練步數(shù)net.trainParam.mc = 0.95; %動量常數(shù)網(wǎng)絡(luò)訓(xùn)練net=init(net);%初始化網(wǎng)絡(luò)net,tr = train(net,P,T);網(wǎng)絡(luò)訓(xùn)練對訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行仿真D=sim(net,P);A = sim(net,B);B 為測試樣本向量集,128×20 的點(diǎn)陣。D 為網(wǎng)絡(luò)對訓(xùn)練樣本的識別結(jié)果,A 為測試樣本的網(wǎng)絡(luò)識別結(jié)果。實(shí)驗(yàn)結(jié)果表明:網(wǎng)絡(luò)對訓(xùn)練樣本和對測試樣本的識別率均為100。如圖(3)為64579五個數(shù)字添加50%隨機(jī)噪聲后網(wǎng)絡(luò)的識別結(jié)果。5 結(jié) 論由實(shí)驗(yàn)可知,采用神經(jīng)網(wǎng)絡(luò)識別圖像是切實(shí)可行的,由于時間關(guān)系,目前只是用M

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論