下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用引言早在上世紀60年代末,人臉識別即引起了研究者的強烈興趣.但早期的人臉識別一般都需要人的某些先驗知識,無法擺脫人的干預(yù)。進入上世紀9O年代,由于高速度、高性能計算機的出現(xiàn),人臉識別的方法有了重大突破,進入了真正的機器自動識別階段,人臉識別研究得到了前所未有的重視。人臉識別方法有很多種:⑴特征臉方法。這種方法起源于圖像描述技術(shù),采用特征臉識別方法有良好的穩(wěn)定性、位移不變性、特征向量與圖像的高度成比例變化以及轉(zhuǎn)置不變性。不足之處是受表情變化、光照角度強度變化和視角變化等嚴重影響,魯棒性較差。⑵隱馬爾可夫模型方法(HiddenMarkovModel)是用于描述信號統(tǒng)計特征的一組統(tǒng)計模型。HMM的基本理論是由Baum和Welch等人在20世紀60年代末70年代初建立,在語音識別中應(yīng)用較多。⑶彈性圖匹配方法。彈性圖匹配方法是一種基于動態(tài)連接結(jié)構(gòu)的方法。它將人臉用格狀的稀疏圖表示。⑷神經(jīng)網(wǎng)絡(luò)方法。人工神經(jīng)網(wǎng)絡(luò)是由多個神經(jīng)元按照一定的排列順序構(gòu)成的,是一個非線性動力學(xué)系統(tǒng),其特色在于信息的分布式存儲和并行協(xié)同處理。雖然單個神經(jīng)元的結(jié)構(gòu)極其簡單,功能有限,但由大量沖經(jīng)元所構(gòu)成的網(wǎng)絡(luò)系統(tǒng)卻能夠?qū)崿F(xiàn)復(fù)雜豐富的功能。神經(jīng)網(wǎng)絡(luò)系統(tǒng)除了具有集體運算的能力和自適應(yīng)的學(xué)習(xí)能力外,還有根強的容錯性和魯棒性.善于聯(lián)想、綜合和推廣。神經(jīng)網(wǎng)絡(luò)模型各種各樣。它們是從不同的角度對生物神經(jīng)系統(tǒng)不同層次的描述和模擬。有代表性的網(wǎng)絡(luò)模型有感知器、多層映射BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)等。目前,在人工神經(jīng)網(wǎng)絡(luò)的實際應(yīng)用中,絕大部分的神經(jīng)網(wǎng)絡(luò)模型都是采用BP網(wǎng)絡(luò)及其變化形式,它也是前向網(wǎng)絡(luò)的核心部分,是人工神經(jīng)網(wǎng)絡(luò)最精華的部分。2BP神經(jīng)網(wǎng)絡(luò)的人臉識別BP神經(jīng)網(wǎng)絡(luò)用于人臉識別一般應(yīng)先對輸入圖像實行圖像預(yù)處理,然后進行特征提取,接下來就是BP網(wǎng)絡(luò)訓(xùn)練,最后用訓(xùn)練好的網(wǎng)絡(luò)進行識別,獲得識別結(jié)果。基于特征臉和BP神經(jīng)網(wǎng)絡(luò)的人臉識別方法2.1特征臉分析這種方法是根據(jù)圖像的統(tǒng)計特征進行正交變換(K-L變換)[3],以去除樣本間的相關(guān)性,然后根據(jù)特征值的大小選擇特征向量(主分量),由于這些特征向量的圖像類似人臉,所以稱為特征臉[4,5]。下面就這種方法作簡要介紹。XERN為表示一幅圖像的隨機向量,這里N是圖像的大小,X由圖像的行或列連接而成的向量。假設(shè)有p個人,每個人有r1(IWiWP)個人臉樣本圖像,樣本集為{Xji),Xji表示第j個人的第i個樣本。那么每個人樣本均值向量為mi(1WiWp);總體樣本均值向量為m;類間散布矩陣為Sb項產(chǎn)”n廠m)(11}J-初7, (4;/=L'Sb是NXN的大矩陣,一般由奇異值分解定理[8]得到其特征向量矩陣U及樣本集的特征系數(shù)向量矩陣C。其中u=f峋」…/U]一17JC=>r'n>%[打U的秩總是小于p的,它的每一列就是一特征臉(向量),一般有p-1個。每一張人臉都可以投影到這p-1個特征臉張成的子空間中,得到一個特征系數(shù)向量,C就是樣本在子空間中投影得到的系數(shù),每一列ci就代表mi在特征臉空間投影的特征系數(shù)向量,它有p-1行,即投影得到的p-1特征系數(shù)。如圖1是本文實驗一張人臉的具體展開,第一項為平均臉,其他是按特征值大小排序的特征臉,常稱為主元。在最近鄰識別中,將輸入的人臉圖像連接成一維向量,向特征臉張成的子空間投影,然后在子空間中,如果與ci的距離最近,就判別為第i類。圖】用特征臉表示人臉示意圖2.2神經(jīng)網(wǎng)絡(luò)實現(xiàn)分類器基于BP算法的前向多層神經(jīng)網(wǎng)絡(luò)以其算法、概念及基本理論都很簡單,但有很強的學(xué)習(xí)能力,已經(jīng)在實際問題中有了大量成功的應(yīng)用:10],簡稱其為BP神經(jīng)網(wǎng)絡(luò)。本文用最小均方誤差小于0.0001的學(xué)習(xí),這樣神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的實質(zhì)就是進行后驗概率估計;分類時實質(zhì)就是采用最大后驗概率分類方法[10,12]。下面簡要對它們的關(guān)系作推導(dǎo)。神經(jīng)網(wǎng)絡(luò)實現(xiàn)的映射F:RdTRM,這樣期望最小均方誤差E[y-F(x)]2最小,這里F(x)=E(y/x),y是期望的輸出yj=(0,…,0,1,0,…,0)T,如果xE(第j類)。F(x)=E(y/x),這樣對給定第j類的輸入x,對應(yīng)的輸出為
Fj(x)=E[yj/x]1xP((yj=1)/x)+0xP((y=0)/x)=P((yjFj(x)=E[yj/x]1xP((yj=1)/x)+0xP((y=0)/x)=P((yj=1)/x)=P(coj/x)本文中,神經(jīng)網(wǎng)絡(luò)的輸入是特征臉分析得到的39個特征,輸出是40個人的每個人的后驗概率。訓(xùn)練時,如果是第j個人,讓輸出的向量的第j元素為1,其他全為0。換句話說,讓第j類的概率為1。分類識別時,取最大的輸出作為結(jié)果,即最大后驗概率作為輸出。實驗及結(jié)果分析本文的實驗是在ORL人臉數(shù)據(jù)庫上進行的,有40人,每人有10張人臉樣本。實驗中,每人隨機選擇五張圖片作為樣本集,剩下的作為測試集,然后交叉實驗,讓第一次的測試集作為樣本集,第一次的樣本集用來測試。特征臉識別用最近鄰判別方法,為了較客觀的反映它的識別率,選擇了四種常用的相似性度量方式[9]。對于識別率本文采取人臉識別中常用的累積識別率的辦法。由于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的不同,會帶來識別率較大的差別;并且由于網(wǎng)絡(luò)權(quán)值初始化的隨機,性,每一次的結(jié)果不會完全一樣。所以統(tǒng)計了幾種不同隱層神經(jīng)元數(shù)目的平均識別率。在實驗中,發(fā)現(xiàn)多于三層的網(wǎng)絡(luò)結(jié)構(gòu)無益于識別率的提高,所以采用常見的三層結(jié)構(gòu),39個輸入層,40個輸出層。而隱層的數(shù)目不能少于20個,當(dāng)少于20個時,識別率將會變得很差;當(dāng)多于100個時,識別率增加不明顯,有時反而會下降。從表1,表2可以看到,在最近鄰識別的幾種方法中,馬氏距離取得了較好的效果。BP網(wǎng)絡(luò)的隱層神經(jīng)元數(shù)目在一個較大的范圍內(nèi),都取得了令人滿意的識別率,比最近鄰的識別率要好。當(dāng)隱層神經(jīng)元數(shù)目是樣本的一半左右時,取得了更高的識別率。在交叉實驗的比較中,發(fā)現(xiàn)第二組的識別率明顯好于第一組,這是因為人臉識別問題可以看作回歸問題,而回歸問題中,樣本顯得特別重要,樣本只是一定程度上反映問題的真實模型,好的樣本能較好地逼近真實模型。在實際問題中,當(dāng)樣本沒有選擇余地時,就會出現(xiàn)偏差和方差兩難問題:10一12] 。\嬲馬氐仰,離隱層神谿元敖;30(半均詛元敏;90別啊隱層州辨其婦湘〔平均俱別申)Aft;110(Y-均詛別啊TopDir81%劇.眺£5.5%36.75%ffi.75%&O.75%陽.75%lopRe脂,5%91.5%我%虬5%95%95.25%TopUtm92,5%9盅94.5%鼻,眺94,25%囹.5%97.25%97.25%表1識別率比較\類型戴JEBffifflS8FS企弦頂育馬KR離BE神斟元St30(平均詛刖啊元數(shù):90(平均幟隱層神鑫;L?:100(平均雙Mt)SEWS兀數(shù):no(均俱別啊TapOre84蜘困%82.5%88%91.S%92.3%92%Tap加91S%93.5%觀96%93.5%ffi.誑96.75%90.25%TopBree94%97%挪95,75%97%99%99%表2樣本集和測試集交換后識別率比較結(jié)論人臉識別是一個困難的研究課題,目前還處于探索階段。本文利用特征臉的方法提取特征,利用BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力強、分類能力強的優(yōu)點,實現(xiàn)分類器。為了與經(jīng)典的最近鄰分類器更好地比較,選擇了四種相似度測量方法。用神經(jīng)網(wǎng)絡(luò)實現(xiàn)分類器時,較多地研究了網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)造。實驗結(jié)果表明,如果網(wǎng)絡(luò)的結(jié)構(gòu)合理,識別率比最近鄰分類器有較大的提高。5?參考文獻:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 采購降本知識培訓(xùn)課件
- 金融標(biāo)準化知識培訓(xùn)課件
- 藥肥市場知識培訓(xùn)課件
- 二零二五年度園林景區(qū)開荒保潔與生態(tài)保護合同3篇
- 某年珠江帝景營銷推廣方案
- 日本“醫(yī)養(yǎng)結(jié)合”社區(qū)養(yǎng)老模式構(gòu)建及對我國的啟示-基于制度分析視角
- 共筑安全墻快樂過寒假模板
- Unit 10 I've had this bike for three years!Section A 2a-2d 英文版說課稿 2024-2025學(xué)年人教版八年級英語下冊
- 交易中心數(shù)字化改造升級設(shè)備更新采購項目可行性研究報告模板-立項拿地
- 貴州輕工職業(yè)技術(shù)學(xué)院《動畫原理與網(wǎng)絡(luò)游戲動畫設(shè)計》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025年進出口貿(mào)易公司發(fā)展戰(zhàn)略和經(jīng)營計劃
- 2025年上海市嘉定區(qū)高三語文一模作文8篇范文:人們往往用“有用”作為判別事物并做出選擇的重要標(biāo)準
- 2025年行政執(zhí)法人員執(zhí)法資格考試必考題庫及答案(共232題)
- 網(wǎng)站建設(shè)合同范本8篇
- 污水站安全培訓(xùn)
- 宜賓天原5萬噸氯化法鈦白粉環(huán)評報告
- 教育機構(gòu)年度總結(jié)和來年規(guī)劃
- 2024年工廠股權(quán)轉(zhuǎn)讓盡職調(diào)查報告3篇
- 醫(yī)療器械考試題及答案
- 初三家長會數(shù)學(xué)老師發(fā)言稿
- 責(zé)任護理組長競選
評論
0/150
提交評論