




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、智能媒體計(jì)算課程論文基于深度學(xué)習(xí)的人臉識(shí)別摘要隨著目標(biāo)的正確識(shí)別逐漸成為人工智能的重要組成部分,基于深度學(xué)習(xí)的人臉識(shí)別目前也成為了特征識(shí)別領(lǐng)域的研究熱點(diǎn)。但是因?yàn)槟槻啃畔⒌膹?fù)雜性,對(duì)特征識(shí)別算法的要求會(huì)更高。在人臉識(shí)別領(lǐng)域有很多算法,如基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的人臉識(shí)別方法、深度非線性人臉形狀提取方法基于深度學(xué)習(xí)的人臉姿態(tài)魯棒性建模,有約束環(huán)境中的全自動(dòng)人臉識(shí)別、基于深度學(xué)習(xí)的視頻監(jiān)控下的人臉識(shí)別、基于深度學(xué)習(xí)的低分辨率人臉識(shí)別以及其他基于深度學(xué)習(xí)的人臉信息的識(shí)別等;并對(duì)當(dāng)前人臉識(shí)別技術(shù)在深度學(xué)習(xí)應(yīng)用中存在的問題及發(fā)展趨勢進(jìn)行分析。關(guān)鍵字:深度學(xué)習(xí);人臉識(shí)別;卷積神經(jīng)網(wǎng)絡(luò);生物特征識(shí)別1背景
2、介紹人臉識(shí)別研究是從20世紀(jì)50年代開始的,作為一種重要的生物特征識(shí)別技術(shù),其具有直接、友好、方便、交互性好等優(yōu)點(diǎn),一直被研究學(xué)者所關(guān)注。人臉識(shí)別技術(shù)在安防和金融支付等方面有許多實(shí)際的應(yīng)用,如視頻監(jiān)控、智能支付、訪問控制等,是目前機(jī)器學(xué)習(xí)和模式識(shí)別中最熱門的研究方向。2深度學(xué)習(xí)近年來,隨著機(jī)器學(xué)習(xí)的不斷發(fā)展,深度學(xué)習(xí)作為一個(gè)新的研究方向引起人工智能領(lǐng)域的廣泛關(guān)注。其目的在于建立一個(gè)人工的神經(jīng)網(wǎng)絡(luò),通過模擬人腦的機(jī)制對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí)。傳統(tǒng)的深度訓(xùn)練算法采用的是BP算法,其隨機(jī)獲取參數(shù),并對(duì)它們進(jìn)行初始化,然后通過殘差反向傳播算法對(duì)這些參數(shù)進(jìn)行相應(yīng)的完善,最終達(dá)到深度學(xué)習(xí)的目的。在此之后,專家學(xué)
3、者通過獲取前層的參數(shù),再依次逐層進(jìn)行相同的操作達(dá)到依次訓(xùn)練的目的,最后通過對(duì)每層的調(diào)整來獲得最終的結(jié)果。深度學(xué)習(xí)不僅可以分布式表示輸入數(shù)據(jù),同時(shí):擁有很高的數(shù)據(jù)特征學(xué)習(xí)水平,提供學(xué)習(xí)機(jī)會(huì)的同時(shí)提高了學(xué)習(xí)的效率。它的本質(zhì)是通過對(duì)大量有效數(shù)據(jù)的分析與訓(xùn)練,得出更深層次的數(shù)據(jù)信息。組建出一個(gè)多隱含層的模型,以此增加判斷與分析的準(zhǔn)確性。通過將神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)有效組合,一種深度神經(jīng)網(wǎng)絡(luò)逐漸出現(xiàn)在了人們的視野里。隨著科技的不斷進(jìn)步,更高等級(jí)的深度神經(jīng)網(wǎng)絡(luò)不僅可以提取出更加復(fù)雜的特征信息,同時(shí):也很好提升了特征信息的學(xué)習(xí)效率。在目前的深度學(xué)習(xí)領(lǐng)域中,存在著多種類型的算法,但是較多的信息的識(shí)別與檢測等都以深
4、度卷積神經(jīng)網(wǎng)絡(luò)為工具。區(qū)別于傳統(tǒng)算法,卷積神經(jīng)網(wǎng)絡(luò)面對(duì)的對(duì)象直接是圖像,并且適應(yīng)空間變化的復(fù)雜性與多樣性。一方面,不同神經(jīng)元間的非全連接通過信息的局部識(shí)別形成,另一方面,同一層中某些神經(jīng)元通過共同使用相同權(quán)值來達(dá)到共享的目的。同時(shí),通過適當(dāng)降采樣來減少一定的信息特征。在相同權(quán)值共享的基礎(chǔ)上,實(shí)現(xiàn)神經(jīng)的并行學(xué)習(xí)。3人臉識(shí)別技術(shù)人臉具有高度非剛性的特點(diǎn),存在著大量體現(xiàn)個(gè)體差異的細(xì)節(jié)。人臉識(shí)別是通過從靜態(tài)圖像或者動(dòng)態(tài)視頻中檢測出的人臉圖像與數(shù)據(jù)庫中的人臉圖像進(jìn)行比對(duì),找到與之匹配的人臉的過程,通常用于身份識(shí)別和鑒定的目的,是屬于生物特征識(shí)別領(lǐng)域的課題。目前,基于機(jī)器視覺的人臉識(shí)別方法已經(jīng)取得了豐碩成
5、果。研究中需要考慮受到人面部表情、姿態(tài)、年齡、位置和遮蓋物等因素引起的類內(nèi)變化,及來自外界光照、背景等身份不同引起的類間變化,這兩種變化的分布是高度復(fù)雜且非線性的。傳統(tǒng)的基于淺層學(xué)習(xí)的人臉識(shí)別方法,對(duì)于類內(nèi)和類間這兩種變化的復(fù)雜分布和非線性的人臉數(shù)據(jù)進(jìn)行識(shí)別,往往達(dá)不到預(yù)期效果。深度學(xué)習(xí)是模擬人類視覺感知神經(jīng)系統(tǒng)的認(rèn)知學(xué)習(xí),能夠獲得更具表征力的高層特征,可以用來解決人臉識(shí)別中的類內(nèi)和類間的變化分布這一難題。3. 1傳統(tǒng)人臉識(shí)別技術(shù)傳統(tǒng)的人臉識(shí)別方法有多種,女口主玄力形狀模型(activeshapemodel,ASM)14和主動(dòng)表觀模型(activeappearancemodeIs,AAM),基
6、于局部的方法9如利用局音B描述子Gabor、局部:值模式(localbinarypattern,LBP)等進(jìn)行識(shí)別;還有基于全局的方法,包括經(jīng)典的人臉識(shí)別算法,如特征臉方法線性判別分析法(linealdiscriminantanalysis,LDA)等子空間學(xué)習(xí)算法以及局部保持投影算法(localitypreservingprojection,LPP)等流行學(xué)習(xí)算法。但是,由于受到光照、姿態(tài)及表情變化、遮擋、海量數(shù)據(jù)等因素的影響,傳統(tǒng)的人臉識(shí)別方法由于自身的局限性,其識(shí)別精度受到制約。3. 2基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)在深度學(xué)習(xí)框架下,學(xué)習(xí)算法直接從原始圖像學(xué)習(xí)判別性的人臉特征.在海量人臉數(shù)據(jù)
7、支撐下,基于深度學(xué)習(xí)的人臉識(shí)別在速度和精度方面已經(jīng)遠(yuǎn)遠(yuǎn)超過人類?深度學(xué)習(xí)借助于圖形處理器(GPU)組成的運(yùn)算系統(tǒng)作大數(shù)據(jù)分析,人臉識(shí)別是圖像處理及人工智能的一個(gè)重要指標(biāo),證明深度學(xué)習(xí)模型有助于推動(dòng)人仁智能發(fā)展,將來甚至可能超越人類的智能水平。3.1.1 基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的人臉識(shí)別方法卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型,能挖掘數(shù)據(jù)局部特征,提取全局訓(xùn)練特征和分類,其權(quán)值共享結(jié)構(gòu)網(wǎng)絡(luò)使之更類似于生物神經(jīng)網(wǎng)絡(luò),在模式識(shí)別各個(gè)領(lǐng)域都得到成功應(yīng)用.CNN通過結(jié)合人臉圖像空間的局部感知區(qū)域、共享權(quán)重、在空間或時(shí)間上的降采樣來充分利用數(shù)據(jù)本身包含的局部性等特征,優(yōu)化模型結(jié)構(gòu)
8、,保證一定的位移不變性。3.1.2 深度非線性人臉形狀提取方法主動(dòng)形狀模型(activeshapemodeIfASM)和主動(dòng)表觀楣|型(activeappearancemodeIs,AAM)是經(jīng)典的人臉對(duì)齊方法?它們使用線性的主成分分析技術(shù)對(duì)人臉形狀和紋理變化建模,并通過優(yōu)化模型參數(shù)使之適配測試人臉圖像.由子線性模型難以刻畫復(fù)雜的人臉形狀和紋理變化,在大姿態(tài)、夸張表情、劇烈光照變化和部分遮擋下的效果欠佳。該問題的最新進(jìn)展是通過級(jí)聯(lián)多個(gè)線性回歸模型直接從人臉紋理特征預(yù)測人臉形狀。人臉識(shí)別中的主要難點(diǎn)在于人臉形態(tài)和紋理高度復(fù)雜性的特點(diǎn),為進(jìn)一步提高算法的非線性回歸能力以獲得對(duì)形狀等變化的魯棒性,z
9、hang等提出了一種由粗到細(xì)的深度非線性人臉形狀提取方法(coarse-tofneauto-encodersnetworks,CFAN).CFAN級(jí)聯(lián)多個(gè)由棧式自編碼網(wǎng)絡(luò)實(shí)現(xiàn)的非線性回歸模型,每一級(jí)刻畫從人臉表觀到人臉形狀的部分非線性映射.在對(duì)人臉圖像識(shí)別過程中,深度學(xué)習(xí)方法不僅能夠提取有用的人臉紋理特征,而且能夠得到精確的人臉形狀和幾何結(jié)構(gòu)信廣。4人臉識(shí)別方法4. 1人臉識(shí)別的過程觀察一個(gè)人的臉可以直接、自然地獲得一個(gè)人的許多消息,比如:年齡、性另I、情緒等雖然不同的人臉檢測系統(tǒng)所使用的算法原理各不相同,但是大都可以歸結(jié)為以下步驟:1)人臉檢測:即從圖像信息中檢測出人臉并返回位置范圍;2)人
10、臉規(guī)范化:校正因?yàn)樵诠庹諒?qiáng)度圖像像素等問題下人臉?biāo)l(fā)生的變化;3)人臉特征的提?。簩⒆R(shí)別到的人臉中的特征提取出來;4)人臉識(shí)別:將提取的到的特征與數(shù)據(jù)庫中已有的特征進(jìn)行匹配,進(jìn)行人臉識(shí)別。4. 2Python實(shí)現(xiàn)人臉識(shí)別算法4. 2.10penCV庫介紹使用Python語言開發(fā)具有高效性,得益于其豐富的第三方庫,Python能夠?qū)⑵渌Z言制作的模塊快速輕松地連接在起。本文所使用的OpenCV就是可以通過Python語言進(jìn)行調(diào)用的一個(gè)第三方視覺庫。OpenC吁1999年由Intel創(chuàng)立至今經(jīng)過多年的發(fā)展已經(jīng)成為當(dāng)今計(jì)算機(jī)視覺領(lǐng)域一款功能強(qiáng)大且通用的圖像視覺處理庫。4. 2.11臉檢測原理Open
11、C雇供三個(gè)人臉識(shí)別器分別為基PCA的特征面識(shí)別器以及基于LDA的Fisherface分類器和本文所用的LBPH分類器相比于其他兩種分類算法LBPH算法有著受光源影響較小的優(yōu)點(diǎn)。該方法是通過檢測圖像的局部信息來獲特征值,通過比較圖像中的每個(gè)像素點(diǎn)與臨近像素點(diǎn)之間的灰度值獲得特征信息。將RGB圖片轉(zhuǎn)化為灰度圖片后取3x3的矩陣,當(dāng)灰度值大于中心圖像時(shí)采用0表示,當(dāng)?shù)扔谛∮跁r(shí)使用1表示,以此得到一個(gè)由0和1組成的二進(jìn)制列表。將圖片中每一個(gè)像素都進(jìn)行處理后并將其轉(zhuǎn)化為十進(jìn)制后統(tǒng)計(jì)得到一張直方圖,該直方圖即是特征直方圖。5. 2.12法實(shí)現(xiàn)在實(shí)現(xiàn)方法前首先需要配置好Python開發(fā)環(huán)境和OpenC蚱并且
12、下載CascadeCIassifie進(jìn)行分類所需的訓(xùn)練集。本文的實(shí)現(xiàn)過程主要有以下幾個(gè)步驟:1)采集被測對(duì)象的人臉信息;2)遍歷圖像進(jìn)行灰度處理;3)識(shí)別圖像臉部區(qū)域進(jìn)行截??;4)對(duì)應(yīng)截取區(qū)域每個(gè)像素點(diǎn)生成二值矩陣;5)生成沒張圖像的特征直方圖;6)將被測對(duì)象臉部進(jìn)行LBPH轉(zhuǎn)化后進(jìn)行標(biāo)簽匹配。程序運(yùn)行的步驟如下:首先使用攝像頭對(duì)被對(duì)象進(jìn)行圖像信息的采集,使用cascadeclassifier分類器對(duì)視頻中的每一幀進(jìn)行檢測,當(dāng)確認(rèn)識(shí)到識(shí)別臉部后后會(huì)對(duì)該圖片打上標(biāo)簽后作為訓(xùn)練集進(jìn)行保存。對(duì)采集到的照片進(jìn)行LPBH算法分析,提取特征值生成特征直方圖。使用攝像頭捕捉圖像,將視頻每幀圖像的臉部信息進(jìn)行
13、分析后生成特征直方圖后與采集的訓(xùn)練集進(jìn)行比對(duì),打上標(biāo)簽后在視頻信息中進(jìn)行標(biāo)記。以下為該方法實(shí)現(xiàn)用到的主要函數(shù)。1)該函數(shù)的功能為識(shí)別人臉有效區(qū)域。defRmctionI(img)giay=cv2.cMColor(mig,cv2.C0L0R_BGR2GRAY)#對(duì)圖片進(jìn)行灰皮轉(zhuǎn)化Img_two_.imgcap二cv2.CascadeCIassifier('face_discren.xmT)#識(shí)另0是否有有效人月僉faceRects二cap.detectMultiScale(gi-ay,seaIeFactor.1.2)ifIen(faceRects)=0:if"ha*e_face
14、=0ifIen(faceRects):1 f?'ha-e_face二1returnimg_hvo,if_ha'e_face#返回原始圖像以及否有人臉的確認(rèn)數(shù)值2 )該函數(shù)是對(duì)圖像被測對(duì)象圖像進(jìn)行采集。defEmctioii2(number)#number是米集照片的數(shù)目the_whnumber.1while(1)ret,iniga二cap.read0#i賣取攝像頭圖彳象iing_add=cv2.fIip(imga,1)#對(duì)圖像進(jìn)行翻轉(zhuǎn)original_imgtifface=cesliicesIii.fimction1(imgadd)ififIface二I:判斷攝像頭是否識(shí)別到人
15、臉#將圖片以當(dāng)前時(shí)間命名存儲(chǔ)the_now_time二time.sti'ftiine("%Y-%m-%d%H:%M:%S”,time.locaItime0)the_pictiire_name_.str(the_now_time)thewhiiumber+=1oId_fiInamethe_picture_name+jpg1fiInameold_filname?repIace(CA2.imwrite(fiInamejmga)thewhiiumber+=1ifthewhnumbernumber:break3)該函數(shù)采集到的照片進(jìn)行遍歷為來自每一個(gè)被測對(duì)象的照片打上標(biāo)簽將其臉部圖像區(qū)
16、域提取出作為返回值輸入到LBPH分類器中。deffiinction3(img):gray二cv2.cvtColo】(img.cv2.COLORBGR2GRAY)face_cascade二cv2.CascadeCIassifier(face_discren?xinI*)face_data-.face_cascade.detectMuItiSeaIe(gray,seaIeFactor.1.2)(x,ytw,h)二face_data0returngiayy:y+w,x:x+h,faces_data044)主程序如下:whiIe(I):retjmga.cap?read()face,rect,cRinc
17、tion3(imga)a,b,face,rectlabel.facerecogiiizer.predict(face)label_text=subjectsIabeI0ifc!二0:di-aw_rectangIe(imga,rect)diaw_text(imga,labeltext,rect0rrectl-5)cv2.inishow(iniage,iniga)4. 2.13法論證以記錄個(gè)被測人每人記錄20張照片的形式對(duì)標(biāo)記為的被測人經(jīng)行測試,隨機(jī)選取10組識(shí)別結(jié)果與相識(shí)度進(jìn)行輸出放入表1中。標(biāo)簽5555555555相似度40.2641.2244.1946.9444.7739.7838.8245
18、.8939.1944.06表1隨機(jī)選取的10組識(shí)另U結(jié)果以及相似度ifthewhnumbernumber:break經(jīng)過測試該方法可以正確的識(shí)別并跟蹤特定的人臉。5結(jié)語隨著目前人工智能產(chǎn)業(yè)的飛速發(fā)展以及大數(shù)據(jù)時(shí)代的到來,深度學(xué)習(xí)成為了目前眾多專家學(xué)者的研究熱點(diǎn)。而隨著智能化場景的逐步推廣以及互聯(lián)網(wǎng)金融日益智能化,基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)的市場將變得更加廣闊。但是在人臉識(shí)別的過程中仍有難題等待處理,在面對(duì)具體問題時(shí),數(shù)據(jù)模型的建立沒有系統(tǒng)的參考。學(xué)習(xí)框架的選取以及神經(jīng)網(wǎng)絡(luò)的建立都需要依靠眾多數(shù)據(jù)以及實(shí)驗(yàn)的支持,這就難以避免訓(xùn)練時(shí)長過長的問題,同時(shí),對(duì)計(jì)算能力的要求也會(huì)變得更嚴(yán)格。所以,應(yīng)加大對(duì)基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)研究力度,不斷完整體系,尋求突破,以此獲得更大的研究成果。參考文獻(xiàn)1山世光.人臉識(shí)別中若干關(guān)鍵問題的研究D.中國科學(xué)院研究生院(計(jì)算技術(shù)研究所),2004.4.2. 14YangMH.KerneIEigenfacesvs.KerneIFishei-faeesFaceRecognitionUsingKerneIMethodsC/lEEEInternationalConferenceonAutomaticFaceand
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 借款合同范本中介版
- 云南購房合同范本
- 從化學(xué)校食堂承包合同范本
- 保潔公司人員合同范本
- pu線條安裝合同范本
- fob合同范本日文
- 包架子合同范本
- 公司代管合同范本
- 共同經(jīng)營餐廳合同范本
- 三方合作民宿協(xié)議合同范本
- 課程改革與學(xué)前教育發(fā)展研究
- 普通昆蟲學(xué)-實(shí)驗(yàn)指導(dǎo)
- 中職對(duì)口升學(xué)養(yǎng)殖專業(yè)獸醫(yī)基礎(chǔ)習(xí)題集判斷題詳解
- 公園綠化養(yǎng)護(hù)景觀綠化維護(hù)項(xiàng)目迎接重大節(jié)會(huì)活動(dòng)的保障措施
- 初中物理各單元思維導(dǎo)圖
- 氧化還原反應(yīng)和氧化還原平衡--ppt課件
- 國內(nèi)外旅游公共服務(wù)研究的文獻(xiàn)綜述
- 2022年北京市專升本英語真題
- 鍺的提取方法
- 機(jī)車電測儀表使用及檢修
- PMS顏色對(duì)照表
評(píng)論
0/150
提交評(píng)論