神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用_第1頁
神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用_第2頁
神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用_第3頁
神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用引言早在上世紀60年代末,人臉識別即引起了研究者的強烈興趣.但早期的人臉識別一般都需要人的某些先驗知識,無法擺脫人的干預(yù)。進入上世紀9O年代,由于高速度、高性能計算機的出現(xiàn),人臉識別的方法有了重大突破,進入了真正的機器自動識別階段,人臉識別研究得到了前所未有的重視。人臉識別方法有很多種:⑴特征臉方法。這種方法起源于圖像描述技術(shù),采用特征臉識別方法有良好的穩(wěn)定性、位移不變性、特征向量與圖像的高度成比例變化以及轉(zhuǎn)置不變性。不足之處是受表情變化、光照角度強度變化和視角變化等嚴重影響,魯棒性較差。⑵隱馬爾可夫模型方法(HiddenMarkovModel)是用于描述信號統(tǒng)計特征的一組統(tǒng)計模型。HMM的基本理論是由Baum和Welch等人在20世紀60年代末70年代初建立,在語音識別中應(yīng)用較多。⑶彈性圖匹配方法。彈性圖匹配方法是一種基于動態(tài)連接結(jié)構(gòu)的方法。它將人臉用格狀的稀疏圖表示。⑷神經(jīng)網(wǎng)絡(luò)方法。人工神經(jīng)網(wǎng)絡(luò)是由多個神經(jīng)元按照一定的排列順序構(gòu)成的,是一個非線性動力學(xué)系統(tǒng),其特色在于信息的分布式存儲和并行協(xié)同處理。雖然單個神經(jīng)元的結(jié)構(gòu)極其簡單,功能有限,但由大量沖經(jīng)元所構(gòu)成的網(wǎng)絡(luò)系統(tǒng)卻能夠?qū)崿F(xiàn)復(fù)雜豐富的功能。神經(jīng)網(wǎng)絡(luò)系統(tǒng)除了具有集體運算的能力和自適應(yīng)的學(xué)習(xí)能力外,還有根強的容錯性和魯棒性.善于聯(lián)想、綜合和推廣。神經(jīng)網(wǎng)絡(luò)模型各種各樣。它們是從不同的角度對生物神經(jīng)系統(tǒng)不同層次的描述和模擬。有代表性的網(wǎng)絡(luò)模型有感知器、多層映射BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)等。目前,在人工神經(jīng)網(wǎng)絡(luò)的實際應(yīng)用中,絕大部分的神經(jīng)網(wǎng)絡(luò)模型都是采用BP網(wǎng)絡(luò)及其變化形式,它也是前向網(wǎng)絡(luò)的核心部分,是人工神經(jīng)網(wǎng)絡(luò)最精華的部分。2BP神經(jīng)網(wǎng)絡(luò)的人臉識別BP神經(jīng)網(wǎng)絡(luò)用于人臉識別一般應(yīng)先對輸入圖像實行圖像預(yù)處理,然后進行特征提取,接下來就是BP網(wǎng)絡(luò)訓(xùn)練,最后用訓(xùn)練好的網(wǎng)絡(luò)進行識別,獲得識別結(jié)果。基于特征臉和BP神經(jīng)網(wǎng)絡(luò)的人臉識別方法2.1特征臉分析這種方法是根據(jù)圖像的統(tǒng)計特征進行正交變換(K-L變換)[3],以去除樣本間的相關(guān)性,然后根據(jù)特征值的大小選擇特征向量(主分量),由于這些特征向量的圖像類似人臉,所以稱為特征臉[4,5]。下面就這種方法作簡要介紹。XERN為表示一幅圖像的隨機向量,這里N是圖像的大小,X由圖像的行或列連接而成的向量。假設(shè)有p個人,每個人有r1(IWiWP)個人臉樣本圖像,樣本集為{Xji),Xji表示第j個人的第i個樣本。那么每個人樣本均值向量為mi(1WiWp);總體樣本均值向量為m;類間散布矩陣為Sb項產(chǎn)”n廠m)(11}J-初7, (4;/=L'Sb是NXN的大矩陣,一般由奇異值分解定理[8]得到其特征向量矩陣U及樣本集的特征系數(shù)向量矩陣C。其中u=f峋」…/U]一17JC=>r'n>%[打U的秩總是小于p的,它的每一列就是一特征臉(向量),一般有p-1個。每一張人臉都可以投影到這p-1個特征臉張成的子空間中,得到一個特征系數(shù)向量,C就是樣本在子空間中投影得到的系數(shù),每一列ci就代表mi在特征臉空間投影的特征系數(shù)向量,它有p-1行,即投影得到的p-1特征系數(shù)。如圖1是本文實驗一張人臉的具體展開,第一項為平均臉,其他是按特征值大小排序的特征臉,常稱為主元。在最近鄰識別中,將輸入的人臉圖像連接成一維向量,向特征臉張成的子空間投影,然后在子空間中,如果與ci的距離最近,就判別為第i類。圖】用特征臉表示人臉示意圖2.2神經(jīng)網(wǎng)絡(luò)實現(xiàn)分類器基于BP算法的前向多層神經(jīng)網(wǎng)絡(luò)以其算法、概念及基本理論都很簡單,但有很強的學(xué)習(xí)能力,已經(jīng)在實際問題中有了大量成功的應(yīng)用:10],簡稱其為BP神經(jīng)網(wǎng)絡(luò)。本文用最小均方誤差小于0.0001的學(xué)習(xí),這樣神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的實質(zhì)就是進行后驗概率估計;分類時實質(zhì)就是采用最大后驗概率分類方法[10,12]。下面簡要對它們的關(guān)系作推導(dǎo)。神經(jīng)網(wǎng)絡(luò)實現(xiàn)的映射F:RdTRM,這樣期望最小均方誤差E[y-F(x)]2最小,這里F(x)=E(y/x),y是期望的輸出yj=(0,…,0,1,0,…,0)T,如果xE(第j類)。F(x)=E(y/x),這樣對給定第j類的輸入x,對應(yīng)的輸出為

Fj(x)=E[yj/x]1xP((yj=1)/x)+0xP((y=0)/x)=P((yjFj(x)=E[yj/x]1xP((yj=1)/x)+0xP((y=0)/x)=P((yj=1)/x)=P(coj/x)本文中,神經(jīng)網(wǎng)絡(luò)的輸入是特征臉分析得到的39個特征,輸出是40個人的每個人的后驗概率。訓(xùn)練時,如果是第j個人,讓輸出的向量的第j元素為1,其他全為0。換句話說,讓第j類的概率為1。分類識別時,取最大的輸出作為結(jié)果,即最大后驗概率作為輸出。實驗及結(jié)果分析本文的實驗是在ORL人臉數(shù)據(jù)庫上進行的,有40人,每人有10張人臉樣本。實驗中,每人隨機選擇五張圖片作為樣本集,剩下的作為測試集,然后交叉實驗,讓第一次的測試集作為樣本集,第一次的樣本集用來測試。特征臉識別用最近鄰判別方法,為了較客觀的反映它的識別率,選擇了四種常用的相似性度量方式[9]。對于識別率本文采取人臉識別中常用的累積識別率的辦法。由于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的不同,會帶來識別率較大的差別;并且由于網(wǎng)絡(luò)權(quán)值初始化的隨機,性,每一次的結(jié)果不會完全一樣。所以統(tǒng)計了幾種不同隱層神經(jīng)元數(shù)目的平均識別率。在實驗中,發(fā)現(xiàn)多于三層的網(wǎng)絡(luò)結(jié)構(gòu)無益于識別率的提高,所以采用常見的三層結(jié)構(gòu),39個輸入層,40個輸出層。而隱層的數(shù)目不能少于20個,當(dāng)少于20個時,識別率將會變得很差;當(dāng)多于100個時,識別率增加不明顯,有時反而會下降。從表1,表2可以看到,在最近鄰識別的幾種方法中,馬氏距離取得了較好的效果。BP網(wǎng)絡(luò)的隱層神經(jīng)元數(shù)目在一個較大的范圍內(nèi),都取得了令人滿意的識別率,比最近鄰的識別率要好。當(dāng)隱層神經(jīng)元數(shù)目是樣本的一半左右時,取得了更高的識別率。在交叉實驗的比較中,發(fā)現(xiàn)第二組的識別率明顯好于第一組,這是因為人臉識別問題可以看作回歸問題,而回歸問題中,樣本顯得特別重要,樣本只是一定程度上反映問題的真實模型,好的樣本能較好地逼近真實模型。在實際問題中,當(dāng)樣本沒有選擇余地時,就會出現(xiàn)偏差和方差兩難問題:10一12] 。\嬲馬氐仰,離隱層神谿元敖;30(半均詛元敏;90別啊隱層州辨其婦湘〔平均俱別申)Aft;110(Y-均詛別啊TopDir81%劇.眺£5.5%36.75%ffi.75%&O.75%陽.75%lopRe脂,5%91.5%我%虬5%95%95.25%TopUtm92,5%9盅94.5%鼻,眺94,25%囹.5%97.25%97.25%表1識別率比較\類型戴JEBffifflS8FS企弦頂育馬KR離BE神斟元St30(平均詛刖啊元數(shù):90(平均幟隱層神鑫;L?:100(平均雙Mt)SEWS兀數(shù):no(均俱別啊TapOre84蜘困%82.5%88%91.S%92.3%92%Tap加91S%93.5%觀96%93.5%ffi.誑96.75%90.25%TopBree94%97%挪95,75%97%99%99%表2樣本集和測試集交換后識別率比較結(jié)論人臉識別是一個困難的研究課題,目前還處于探索階段。本文利用特征臉的方法提取特征,利用BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力強、分類能力強的優(yōu)點,實現(xiàn)分類器。為了與經(jīng)典的最近鄰分類器更好地比較,選擇了四種相似度測量方法。用神經(jīng)網(wǎng)絡(luò)實現(xiàn)分類器時,較多地研究了網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)造。實驗結(jié)果表明,如果網(wǎng)絡(luò)的結(jié)構(gòu)合理,識別率比最近鄰分類器有較大的提高。5?參考文獻:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論