基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別_第1頁(yè)
基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別_第2頁(yè)
基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別_第3頁(yè)
基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別_第4頁(yè)
基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、百度文庫(kù)-好好學(xué)習(xí),天天向上模式識(shí)別作業(yè)題目基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別科目模式識(shí)別II百度文庫(kù)-好好學(xué)習(xí),天天向上基于BP神經(jīng)網(wǎng)絡(luò)的數(shù)字識(shí)別摘要人工神經(jīng)網(wǎng)絡(luò)技術(shù)在現(xiàn)在取得了巨大的發(fā)展,它具有的高度非線性,使我們能表達(dá)一些至少是目前尚無法用計(jì)算理論表達(dá)清楚的外部世界模型;同時(shí),神經(jīng)網(wǎng)絡(luò)所具有的自學(xué)習(xí),自組織能力使我們能在與外部世界的交互作用下,實(shí)現(xiàn)無法用當(dāng)前的計(jì)算理論表達(dá)清楚的功能;對(duì)于那些無法建立精確數(shù)學(xué)模型的系統(tǒng),神經(jīng)網(wǎng)絡(luò)有著獨(dú)特的優(yōu)勢(shì)。本課題主要研究基于BP神經(jīng)網(wǎng)絡(luò)的方法來實(shí)現(xiàn)數(shù)字識(shí)別。首先對(duì)圖像進(jìn)行灰度化、二值化、平滑去噪、歸一化、細(xì)化的預(yù)處理,以便于進(jìn)行像素值的提取,對(duì)設(shè)計(jì)好的神經(jīng)網(wǎng)絡(luò)

2、進(jìn)行訓(xùn)練,對(duì)比訓(xùn)練的結(jié)果與期望的結(jié)構(gòu),并根據(jù)對(duì)比的結(jié)果對(duì)神經(jīng)網(wǎng)絡(luò)的一些權(quán)值進(jìn)行修改,最終得到訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)。并選擇測(cè)試樣本,進(jìn)行仿真測(cè)試。整個(gè)仿真實(shí)驗(yàn)中,對(duì)含數(shù)字的圖片進(jìn)行處理,其數(shù)字識(shí)別效果可在本課題中的MATLAB仿真實(shí)驗(yàn)中體現(xiàn)。關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);灰度化;預(yù)處理;仿真測(cè)試-II-II百度文庫(kù)-好好學(xué)習(xí),天天向上目錄Notableofcontentsentriesfound.百度文庫(kù)-好好學(xué)習(xí),天天向上百度文庫(kù)-好好學(xué)習(xí),天天向上 - 背景介紹.研究背景為了解決計(jì)算機(jī)字符的自動(dòng)識(shí)別、高速加工處理,使計(jì)算機(jī)達(dá)到真正智能化,人們對(duì)計(jì)算機(jī)識(shí)別進(jìn)行了多年的研究,并取得了很大的進(jìn)步。數(shù)字識(shí)別是字符識(shí)

3、別的一個(gè)分支,一般通過特征匹配及特征判別的方法來進(jìn)行處理,目前識(shí)別率還較低。因此,為了提高識(shí)別率,還要尋求新的方法和途徑。近年來,人工神經(jīng)網(wǎng)絡(luò)技術(shù)取得了巨大的發(fā)展,它所具有的優(yōu)勢(shì):固有的并行結(jié)構(gòu)和并行處理、知識(shí)的分布存儲(chǔ)、容錯(cuò)性、自適應(yīng)性、模式識(shí)別能力,為手寫體數(shù)字識(shí)別開辟了新的途徑。數(shù)字識(shí)別作為模式識(shí)別的一個(gè)重要分支,在郵政、稅務(wù)、交通、金融等行業(yè)的實(shí)踐活動(dòng)中有著及其廣泛的應(yīng)用。數(shù)字識(shí)別作為模式識(shí)別領(lǐng)域的一個(gè)重要問題,也有著重要的理論價(jià)值。一方面,阿拉伯?dāng)?shù)字是世界各國(guó)通用的符號(hào),因此,數(shù)字是一個(gè)重要樞紐。在符號(hào)識(shí)別領(lǐng)域,數(shù)字識(shí)別為這一領(lǐng)域提供了一個(gè)算法研究的平臺(tái)。另一方面,數(shù)字的識(shí)別方法很容

4、易推廣到其它一些相關(guān)問題,特別是對(duì)英文字母的識(shí)別,但到目前為止機(jī)器的識(shí)別本領(lǐng)還無法與人的認(rèn)知能力相比,這仍是一個(gè)有難度的開放問題。.數(shù)字識(shí)別的發(fā)展現(xiàn)狀模式識(shí)別(PatternRecognition)是對(duì)表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程。它是信息科學(xué)和人工智能的重要組成部分。而數(shù)字識(shí)別作為模式識(shí)別的一個(gè)分支。在日常生活和科研中具有十分重要的作用。數(shù)字識(shí)別的算法一般是采用以知識(shí)、神經(jīng)網(wǎng)絡(luò)、人工智能為基礎(chǔ)的模板匹配法、輪廓多邊形相關(guān)、傅立葉系數(shù)法等方法來進(jìn)行識(shí)別的。以上方法識(shí)別效率高,但是實(shí)現(xiàn)較為復(fù)雜。.本課題

5、主要的研究?jī)?nèi)容MATLAB軟件包含了被稱為Toolbox的各類應(yīng)用問題的求解工具。神經(jīng)網(wǎng)絡(luò)工具箱正是在MATLAB環(huán)境下所開發(fā)出來的許多工具箱之一。設(shè)計(jì)者則可以根據(jù)自己的需要去調(diào)用工具箱中有關(guān)神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)與訓(xùn)練的程序,使自己能夠從煩瑣的編程中解脫出來,集中精力去思考和解決問題。人工神經(jīng)網(wǎng)絡(luò)(ANN)是理論化的人腦神經(jīng)網(wǎng)絡(luò)的模型,是模仿大腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能而建立起來的一種信息處理系統(tǒng)。神經(jīng)網(wǎng)絡(luò)的一個(gè)最主要的功能就是分類,這個(gè)功能有助于機(jī)器的模式識(shí)別。本課題就是利用神經(jīng)網(wǎng)絡(luò)的分類功能,并借助于MATLAB軟件的神經(jīng)網(wǎng)絡(luò)工具箱,采用具有自適應(yīng)學(xué)習(xí)速率和附加動(dòng)量因子的BP型神經(jīng)網(wǎng)絡(luò),從而實(shí)現(xiàn)羅馬數(shù)

6、字的模式識(shí)別。圖像預(yù)處理由于自然和人為因素影響,可能造成數(shù)字圖像筆劃缺損、噪聲嚴(yán)重及幾何形變等現(xiàn)象。故識(shí)別前必須對(duì)圖像進(jìn)行必要的預(yù)處理。圖像處理流程如圖1所示。圖1圖像預(yù)處理流程.彩色圖像的灰度化圖像輸入后一般都是256色彩色圖像,因?yàn)?56色位圖調(diào)色板內(nèi)容復(fù)雜,很多算法無法進(jìn)行,所以要進(jìn)行彩色圖像的灰度化?;叶然蠡叶葓D像的RGB值是相等的,只有亮度的不同,灰度值大的像素亮度也大,灰度值小的圖像亮度暗,灰度值為255的像素為白色,灰度值為0的像素為黑色。.灰度圖像的二值化彩色圖像灰度化后每像素只有一個(gè)值,即灰度值,二值化就是根據(jù)一定標(biāo)準(zhǔn)將圖像分成黑白二色。因?yàn)楸菊n題所做的是掃描圖像,所以用給

7、定閾值法,給定閾值為220。.梯度銳化因?yàn)槎祷蟮膱D像字體模糊,所以有必要進(jìn)行梯度銳化。梯度銳化同時(shí)對(duì)噪聲也起一定的去除作用,在這里采取Roberts算子對(duì)圖像銳化,可以讓模糊的邊緣變清楚,同時(shí)選用合適閾值可以減弱和消除細(xì)小的噪聲。.去離散噪聲由于圖像的掃描和傳輸過程可能夾帶噪聲,所以需要去離散噪聲。具體方法是:掃描整個(gè)圖像,當(dāng)發(fā)現(xiàn)一個(gè)黑色像素就考察和它直接或間接相連的黑色像素有多少,如果大于一定值(具體數(shù)值視情況定),就可以認(rèn)為它非離散點(diǎn),否則就認(rèn)為他是離散點(diǎn),將其從圖像中去掉。.歸一化調(diào)整因?yàn)閽呙璧淖址笮〈嬖诓町惗鴮?duì)同一尺寸的圖像進(jìn)行識(shí)別準(zhǔn)確率高一些,所以要進(jìn)行歸一化調(diào)整。歸一化方法是

8、先得到原來字符的高度,并與系統(tǒng)要求的高度比較,得出高度變換系數(shù),然后根據(jù)這個(gè)系數(shù)得到變換后應(yīng)有的寬度,得出高度、寬度后,把新圖像里的點(diǎn)按照插值的方法映射到原圖像,為了以后特征提取方便,進(jìn)行BP網(wǎng)絡(luò)訓(xùn)練時(shí)縮短訓(xùn)練時(shí)間,高和寬不宜設(shè)置過大。這里取高為m寬為n。模式識(shí)別.特征提取經(jīng)過預(yù)處理,把原來大小不同、分布不規(guī)律的各字符變成大小一樣、排列整齊的字符。下面要從預(yù)處理完的字符中提取最能體現(xiàn)這一個(gè)字符的特征向量,將提取出的訓(xùn)練樣本中的特征向量代入BP網(wǎng)絡(luò)中就可以對(duì)BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練。提取出待識(shí)別的樣本中特征向量代入訓(xùn)練好的BP網(wǎng)絡(luò)中就可以進(jìn)行識(shí)別。在這里采取逐像素特征提取法,方法是對(duì)圖像進(jìn)行逐行逐列掃描

9、,當(dāng)遇到黑色像素時(shí),取其特征值為1,當(dāng)遇到白色像素時(shí),取其特征值為0。這樣掃描結(jié)束后就形成一個(gè)維數(shù)與圖像中像素點(diǎn)的個(gè)數(shù)相同的特征向量矩陣。.BP神經(jīng)網(wǎng)絡(luò)BP算法的多層感知器采用BP算法的多層感知器是至今為止應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò),在多層感知器的應(yīng)用中,一般習(xí)慣將單隱層感知器稱為三層感知器,所謂三層包括了輸入層、隱層和輸出層。三層BP神經(jīng)網(wǎng)絡(luò)如圖2所示。圖2三層BP網(wǎng),隱層輸出向量為三層感知器中,輸入向量為=(1*八*;1|,輸出層輸出向量為=時(shí)宀小汐,期百度文庫(kù)-好好學(xué)習(xí),天天向上百度文庫(kù)-好好學(xué)習(xí),天天向上望輸出向量為7輸入層到輸出層的權(quán)值為鞋丨1-,隱藏層到輸出層的權(quán)值矩陣為卅=(比WW,北

10、),各層之間的信號(hào)關(guān)系如下:對(duì)輸出層有:5=山叫)頊5=工2對(duì)隱藏層有:上式中,變換函數(shù)f(x)均為單極性sigmoid函數(shù)心777F(x)具有連續(xù)可導(dǎo)的特點(diǎn),以上共同構(gòu)成三層感知器的數(shù)學(xué)模型算法過程初始化對(duì)權(quán)值矩陣w、V賦隨機(jī)數(shù),將樣本模式計(jì)數(shù)器p和訓(xùn)練次數(shù)計(jì)數(shù)器q置為1,誤差E置0,學(xué)習(xí)率n設(shè)為o1內(nèi)的小數(shù),網(wǎng)絡(luò)訓(xùn)練后達(dá)到的精度|血設(shè)為一個(gè)正的小數(shù)。輸入訓(xùn)練樣本對(duì),計(jì)算各層輸出用當(dāng)前樣本對(duì)X,d序列賦值=2心上=12“占=八心,i=12沖3)計(jì)算網(wǎng)絡(luò)輸出誤差設(shè)共有P對(duì)訓(xùn)練樣本,網(wǎng)絡(luò)對(duì)于不同的樣本具有不同的誤差采用均方根誤差作為總誤差:(4)計(jì)算各層誤差信號(hào)=(各:*)兒(1-打)/-I(5

11、)調(diào)整各層權(quán)值在阿二祠廠=-s)0-耳)七7=眄、=應(yīng)?E)打(1-兒)形X=|6)檢查是否對(duì)所有樣本完成一次輪訓(xùn)若p,P,計(jì)數(shù)器p、q增1,返回步驟(2),否則轉(zhuǎn)步驟(7)。7)檢查網(wǎng)絡(luò)總誤差是否達(dá)到精度要求BP學(xué)習(xí)算法的流程如圖3所示。百度文庫(kù)-好好學(xué)習(xí),天天向上百度文庫(kù)-好好學(xué)習(xí),天天向上- - 圖3BP學(xué)習(xí)算法的流程圖神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)與訓(xùn)練神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)方法按照BP神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)方法選用兩層BP網(wǎng)絡(luò)。采用newff函數(shù)來建立BP網(wǎng)絡(luò)。其輸入節(jié)點(diǎn)數(shù)為16X16=256,隱層傳輸函數(shù)為Sigmoid函數(shù)。假設(shè)用一個(gè)輸出節(jié)點(diǎn)表示10個(gè)數(shù)字,則輸出層傳輸函數(shù)為pureline,隱層節(jié)點(diǎn)數(shù)為1256+

12、1+a(a=110),取25。神經(jīng)網(wǎng)絡(luò)仿真程序設(shè)計(jì)構(gòu)造訓(xùn)練樣本集,并構(gòu)成訓(xùn)練所需的輸入向量P和目標(biāo)向量t.通過畫圖工具獲得數(shù)字。本例構(gòu)造了新宋體12號(hào)、8號(hào)字體各10個(gè),黑體12號(hào)、8號(hào)各10個(gè),及宋體加粗18號(hào)字體。神經(jīng)網(wǎng)絡(luò)測(cè)試。由于圖像處理的復(fù)雜性,對(duì)于不同噪聲的污染選擇不同的方法,選擇沒有噪聲的數(shù)字進(jìn)行測(cè)試。選擇訓(xùn)練樣本中的任意數(shù)據(jù)進(jìn)行測(cè)試,結(jié)構(gòu)非常正確。選擇生成的新宋體8號(hào)大小的數(shù)字進(jìn)行測(cè)試。結(jié)果正確,選擇其他類型的字體進(jìn)行測(cè)試,則結(jié)果不是完全正確。仿真實(shí)驗(yàn)的結(jié)果簡(jiǎn)單起見,只對(duì)含有單獨(dú)數(shù)字的圖片樣本進(jìn)行識(shí)別,不涉及分割字符等前期處理。使用BP網(wǎng)絡(luò)進(jìn)行數(shù)字識(shí)別的流程如下:首先利用大量的訓(xùn)

13、練樣本來訓(xùn)練網(wǎng)絡(luò),以得到以文件形式保存的權(quán)值。訓(xùn)練樣本為精心選擇的可以很好地反映樣本可分特性的已知數(shù)據(jù)。將訓(xùn)練樣本圖片進(jìn)行特征提取后,就可以送入BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練。其次,訓(xùn)練完BP網(wǎng)絡(luò)后就可以用它對(duì)未知數(shù)據(jù)進(jìn)行識(shí)別了。首先要經(jīng)過預(yù)處理,然后進(jìn)行特征提取,最后送入BP網(wǎng)絡(luò)直至得出結(jié)果。數(shù)字識(shí)別效果如圖4、5、6所示。Figure1匚|冋反RFigure2回區(qū)FiEcInsToRedWineHe勺原始數(shù)字圖像FiEcVi葉ToDeslWin淫nsh-b數(shù)字識(shí)別結(jié)果(a=0)0圖4數(shù)字0的識(shí)別效果原始數(shù)字圖像廠WFigure12口叵FiEViMToDeslWinM四nat圖5數(shù)字4的識(shí)別效果圖6數(shù)字9

14、的識(shí)別效果總結(jié)數(shù)字識(shí)別是多年來的研究熱點(diǎn),將神經(jīng)網(wǎng)絡(luò)應(yīng)用于數(shù)字識(shí)別是神經(jīng)網(wǎng)絡(luò)應(yīng)用最為成功的方面之一,人工神經(jīng)網(wǎng)絡(luò)在模式識(shí)別問題上,相比其他傳統(tǒng)方法有其優(yōu)勢(shì):要求對(duì)問題的了解較少;可以對(duì)特征空間進(jìn)行較復(fù)雜的劃分;適用于高速并行處理系統(tǒng)來實(shí)現(xiàn)。本課題結(jié)合神經(jīng)網(wǎng)絡(luò)技術(shù),對(duì)數(shù)字識(shí)別問題進(jìn)行了探討和研究,主要研究成果如下:(1)針對(duì)數(shù)字?jǐn)?shù)據(jù),首先進(jìn)行了灰度化、二值化、平滑去噪、歸一化、細(xì)化等常規(guī)預(yù)處理,然后對(duì)處理完的數(shù)字圖像進(jìn)行特征提取,提取了能體現(xiàn)字符特點(diǎn)的特征向量。(2)針對(duì)數(shù)字識(shí)別問題,研究了BP神經(jīng)網(wǎng)絡(luò)分類器的建立和識(shí)別過程。仿真結(jié)果表明,對(duì)于字體和字號(hào)與訓(xùn)練樣本集相同的測(cè)試樣本,無論圖像中的數(shù)字在什么位置,都可以識(shí)別出來,而對(duì)于字體和字號(hào)與訓(xùn)練樣本集不同的測(cè)試樣本,只有一部分能正確識(shí)別。并且對(duì)于帶有噪聲的數(shù)字,運(yùn)行程序的實(shí)驗(yàn)結(jié)果是不理想的,所以本課題程序有待于進(jìn)一步的整理和調(diào)試。為提高識(shí)別率,可以增加訓(xùn)練樣本,或通過增加字體的特征向量等途徑來解決。參考文獻(xiàn)李望晨.BP神經(jīng)網(wǎng)絡(luò)改進(jìn)及其在手寫數(shù)字識(shí)別中的應(yīng)用第3-4頁(yè)哈爾濱工業(yè)大學(xué)碩士學(xué)位論文,劉長(zhǎng)安.人工神經(jīng)網(wǎng)絡(luò)的研究方法及應(yīng)用電子工業(yè)出版社出版,等.阮秋崎等譯數(shù)字圖像處理電子工業(yè)出版社出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論