基于深度學(xué)習(xí)的人臉識(shí)別

上傳人：s*** IP屬地：天津上傳時(shí)間：2022-05-01 格式：DOCX 頁數(shù)：16 大?。?4.96KB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩11頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、智能媒體計(jì)算課程論文基于深度學(xué)習(xí)的人臉識(shí)別摘要隨著目標(biāo)的正確識(shí)別逐漸成為人工智能的重要組成部分，基于深度學(xué)習(xí)的人臉識(shí)別目前也成為了特征識(shí)別領(lǐng)域的研究熱點(diǎn)。但是因?yàn)槟槻啃畔⒌膹?fù)雜性，對(duì)特征識(shí)別算法的要求會(huì)更高。在人臉識(shí)別領(lǐng)域有很多算法，如基于卷積神經(jīng)網(wǎng)絡(luò)（CNN）的人臉識(shí)別方法、深度非線性人臉形狀提取方法基于深度學(xué)習(xí)的人臉姿態(tài)魯棒性建模,有約束環(huán)境中的全自動(dòng)人臉識(shí)別、基于深度學(xué)習(xí)的視頻監(jiān)控下的人臉識(shí)別、基于深度學(xué)習(xí)的低分辨率人臉識(shí)別以及其他基于深度學(xué)習(xí)的人臉信息的識(shí)別等；并對(duì)當(dāng)前人臉識(shí)別技術(shù)在深度學(xué)習(xí)應(yīng)用中存在的問題及發(fā)展趨勢進(jìn)行分析。關(guān)鍵字：深度學(xué)習(xí)；人臉識(shí)別；卷積神經(jīng)網(wǎng)絡(luò)；生物特征識(shí)別1背景

2、介紹人臉識(shí)別研究是從20世紀(jì)50年代開始的，作為一種重要的生物特征識(shí)別技術(shù)，其具有直接、友好、方便、交互性好等優(yōu)點(diǎn)，一直被研究學(xué)者所關(guān)注。人臉識(shí)別技術(shù)在安防和金融支付等方面有許多實(shí)際的應(yīng)用，如視頻監(jiān)控、智能支付、訪問控制等，是目前機(jī)器學(xué)習(xí)和模式識(shí)別中最熱門的研究方向。2深度學(xué)習(xí)近年來，隨著機(jī)器學(xué)習(xí)的不斷發(fā)展，深度學(xué)習(xí)作為一個(gè)新的研究方向引起人工智能領(lǐng)域的廣泛關(guān)注。其目的在于建立一個(gè)人工的神經(jīng)網(wǎng)絡(luò)，通過模擬人腦的機(jī)制對(duì)數(shù)據(jù)進(jìn)行分析學(xué)習(xí)。傳統(tǒng)的深度訓(xùn)練算法采用的是BP算法，其隨機(jī)獲取參數(shù)，并對(duì)它們進(jìn)行初始化，然后通過殘差反向傳播算法對(duì)這些參數(shù)進(jìn)行相應(yīng)的完善，最終達(dá)到深度學(xué)習(xí)的目的。在此之后，專家學(xué)

3、者通過獲取前層的參數(shù)，再依次逐層進(jìn)行相同的操作達(dá)到依次訓(xùn)練的目的，最后通過對(duì)每層的調(diào)整來獲得最終的結(jié)果。深度學(xué)習(xí)不僅可以分布式表示輸入數(shù)據(jù)，同時(shí)：擁有很高的數(shù)據(jù)特征學(xué)習(xí)水平，提供學(xué)習(xí)機(jī)會(huì)的同時(shí)提高了學(xué)習(xí)的效率。它的本質(zhì)是通過對(duì)大量有效數(shù)據(jù)的分析與訓(xùn)練，得出更深層次的數(shù)據(jù)信息。組建出一個(gè)多隱含層的模型，以此增加判斷與分析的準(zhǔn)確性。通過將神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)有效組合，一種深度神經(jīng)網(wǎng)絡(luò)逐漸出現(xiàn)在了人們的視野里。隨著科技的不斷進(jìn)步，更高等級(jí)的深度神經(jīng)網(wǎng)絡(luò)不僅可以提取出更加復(fù)雜的特征信息，同時(shí)：也很好提升了特征信息的學(xué)習(xí)效率。在目前的深度學(xué)習(xí)領(lǐng)域中，存在著多種類型的算法，但是較多的信息的識(shí)別與檢測等都以深

4、度卷積神經(jīng)網(wǎng)絡(luò)為工具。區(qū)別于傳統(tǒng)算法，卷積神經(jīng)網(wǎng)絡(luò)面對(duì)的對(duì)象直接是圖像，并且適應(yīng)空間變化的復(fù)雜性與多樣性。一方面，不同神經(jīng)元間的非全連接通過信息的局部識(shí)別形成，另一方面，同一層中某些神經(jīng)元通過共同使用相同權(quán)值來達(dá)到共享的目的。同時(shí)，通過適當(dāng)降采樣來減少一定的信息特征。在相同權(quán)值共享的基礎(chǔ)上，實(shí)現(xiàn)神經(jīng)的并行學(xué)習(xí)。3人臉識(shí)別技術(shù)人臉具有高度非剛性的特點(diǎn)，存在著大量體現(xiàn)個(gè)體差異的細(xì)節(jié)。人臉識(shí)別是通過從靜態(tài)圖像或者動(dòng)態(tài)視頻中檢測出的人臉圖像與數(shù)據(jù)庫中的人臉圖像進(jìn)行比對(duì)，找到與之匹配的人臉的過程，通常用于身份識(shí)別和鑒定的目的，是屬于生物特征識(shí)別領(lǐng)域的課題。目前，基于機(jī)器視覺的人臉識(shí)別方法已經(jīng)取得了豐碩成

5、果。研究中需要考慮受到人面部表情、姿態(tài)、年齡、位置和遮蓋物等因素引起的類內(nèi)變化，及來自外界光照、背景等身份不同引起的類間變化，這兩種變化的分布是高度復(fù)雜且非線性的。傳統(tǒng)的基于淺層學(xué)習(xí)的人臉識(shí)別方法，對(duì)于類內(nèi)和類間這兩種變化的復(fù)雜分布和非線性的人臉數(shù)據(jù)進(jìn)行識(shí)別，往往達(dá)不到預(yù)期效果。深度學(xué)習(xí)是模擬人類視覺感知神經(jīng)系統(tǒng)的認(rèn)知學(xué)習(xí)，能夠獲得更具表征力的高層特征，可以用來解決人臉識(shí)別中的類內(nèi)和類間的變化分布這一難題。3. 1傳統(tǒng)人臉識(shí)別技術(shù)傳統(tǒng)的人臉識(shí)別方法有多種，女口主玄力形狀模型(activeshapemodel,ASM)14和主動(dòng)表觀模型(activeappearancemodeIs,AAM),基

6、于局部的方法9如利用局音B描述子Gabor、局部：值模式(localbinarypattern,LBP)等進(jìn)行識(shí)別；還有基于全局的方法，包括經(jīng)典的人臉識(shí)別算法，如特征臉方法線性判別分析法(linealdiscriminantanalysis,LDA)等子空間學(xué)習(xí)算法以及局部保持投影算法(localitypreservingprojection,LPP)等流行學(xué)習(xí)算法。但是，由于受到光照、姿態(tài)及表情變化、遮擋、海量數(shù)據(jù)等因素的影響，傳統(tǒng)的人臉識(shí)別方法由于自身的局限性，其識(shí)別精度受到制約。3. 2基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)在深度學(xué)習(xí)框架下，學(xué)習(xí)算法直接從原始圖像學(xué)習(xí)判別性的人臉特征.在海量人臉數(shù)據(jù)

7、支撐下，基于深度學(xué)習(xí)的人臉識(shí)別在速度和精度方面已經(jīng)遠(yuǎn)遠(yuǎn)超過人類？深度學(xué)習(xí)借助于圖形處理器(GPU)組成的運(yùn)算系統(tǒng)作大數(shù)據(jù)分析，人臉識(shí)別是圖像處理及人工智能的一個(gè)重要指標(biāo)，證明深度學(xué)習(xí)模型有助于推動(dòng)人仁智能發(fā)展，將來甚至可能超越人類的智能水平。3.1.1 基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的人臉識(shí)別方法卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型，能挖掘數(shù)據(jù)局部特征，提取全局訓(xùn)練特征和分類，其權(quán)值共享結(jié)構(gòu)網(wǎng)絡(luò)使之更類似于生物神經(jīng)網(wǎng)絡(luò)，在模式識(shí)別各個(gè)領(lǐng)域都得到成功應(yīng)用.CNN通過結(jié)合人臉圖像空間的局部感知區(qū)域、共享權(quán)重、在空間或時(shí)間上的降采樣來充分利用數(shù)據(jù)本身包含的局部性等特征，優(yōu)化模型結(jié)構(gòu)

8、，保證一定的位移不變性。3.1.2 深度非線性人臉形狀提取方法主動(dòng)形狀模型(activeshapemodeIfASM)和主動(dòng)表觀楣|型(activeappearancemodeIs,AAM)是經(jīng)典的人臉對(duì)齊方法？它們使用線性的主成分分析技術(shù)對(duì)人臉形狀和紋理變化建模，并通過優(yōu)化模型參數(shù)使之適配測試人臉圖像.由子線性模型難以刻畫復(fù)雜的人臉形狀和紋理變化，在大姿態(tài)、夸張表情、劇烈光照變化和部分遮擋下的效果欠佳。該問題的最新進(jìn)展是通過級(jí)聯(lián)多個(gè)線性回歸模型直接從人臉紋理特征預(yù)測人臉形狀。人臉識(shí)別中的主要難點(diǎn)在于人臉形態(tài)和紋理高度復(fù)雜性的特點(diǎn)，為進(jìn)一步提高算法的非線性回歸能力以獲得對(duì)形狀等變化的魯棒性，z

9、hang等提出了一種由粗到細(xì)的深度非線性人臉形狀提取方法(coarse-tofneauto-encodersnetworks,CFAN).CFAN級(jí)聯(lián)多個(gè)由棧式自編碼網(wǎng)絡(luò)實(shí)現(xiàn)的非線性回歸模型，每一級(jí)刻畫從人臉表觀到人臉形狀的部分非線性映射.在對(duì)人臉圖像識(shí)別過程中，深度學(xué)習(xí)方法不僅能夠提取有用的人臉紋理特征，而且能夠得到精確的人臉形狀和幾何結(jié)構(gòu)信廣。4人臉識(shí)別方法4. 1人臉識(shí)別的過程觀察一個(gè)人的臉可以直接、自然地獲得一個(gè)人的許多消息，比如：年齡、性另I、情緒等雖然不同的人臉檢測系統(tǒng)所使用的算法原理各不相同，但是大都可以歸結(jié)為以下步驟：1)人臉檢測：即從圖像信息中檢測出人臉并返回位置范圍；2)人

10、臉規(guī)范化：校正因?yàn)樵诠庹諒?qiáng)度圖像像素等問題下人臉?biāo)l(fā)生的變化；3)人臉特征的提?。簩⒆R(shí)別到的人臉中的特征提取出來；4)人臉識(shí)別：將提取的到的特征與數(shù)據(jù)庫中已有的特征進(jìn)行匹配，進(jìn)行人臉識(shí)別。4. 2Python實(shí)現(xiàn)人臉識(shí)別算法4. 2.10penCV庫介紹使用Python語言開發(fā)具有高效性，得益于其豐富的第三方庫，Python能夠?qū)⑵渌Z言制作的模塊快速輕松地連接在起。本文所使用的OpenCV就是可以通過Python語言進(jìn)行調(diào)用的一個(gè)第三方視覺庫。OpenC吁1999年由Intel創(chuàng)立至今經(jīng)過多年的發(fā)展已經(jīng)成為當(dāng)今計(jì)算機(jī)視覺領(lǐng)域一款功能強(qiáng)大且通用的圖像視覺處理庫。4. 2.11臉檢測原理Open

11、C雇供三個(gè)人臉識(shí)別器分別為基PCA的特征面識(shí)別器以及基于LDA的Fisherface分類器和本文所用的LBPH分類器相比于其他兩種分類算法LBPH算法有著受光源影響較小的優(yōu)點(diǎn)。該方法是通過檢測圖像的局部信息來獲特征值，通過比較圖像中的每個(gè)像素點(diǎn)與臨近像素點(diǎn)之間的灰度值獲得特征信息。將RGB圖片轉(zhuǎn)化為灰度圖片后取3x3的矩陣，當(dāng)灰度值大于中心圖像時(shí)采用0表示，當(dāng)?shù)扔谛∮跁r(shí)使用1表示，以此得到一個(gè)由0和1組成的二進(jìn)制列表。將圖片中每一個(gè)像素都進(jìn)行處理后并將其轉(zhuǎn)化為十進(jìn)制后統(tǒng)計(jì)得到一張直方圖，該直方圖即是特征直方圖。5. 2.12法實(shí)現(xiàn)在實(shí)現(xiàn)方法前首先需要配置好Python開發(fā)環(huán)境和OpenC蚱并且

12、下載CascadeCIassifie進(jìn)行分類所需的訓(xùn)練集。本文的實(shí)現(xiàn)過程主要有以下幾個(gè)步驟:1）采集被測對(duì)象的人臉信息；2）遍歷圖像進(jìn)行灰度處理；3）識(shí)別圖像臉部區(qū)域進(jìn)行截??；4）對(duì)應(yīng)截取區(qū)域每個(gè)像素點(diǎn)生成二值矩陣；5）生成沒張圖像的特征直方圖；6）將被測對(duì)象臉部進(jìn)行LBPH轉(zhuǎn)化后進(jìn)行標(biāo)簽匹配。程序運(yùn)行的步驟如下：首先使用攝像頭對(duì)被對(duì)象進(jìn)行圖像信息的采集，使用cascadeclassifier分類器對(duì)視頻中的每一幀進(jìn)行檢測，當(dāng)確認(rèn)識(shí)到識(shí)別臉部后后會(huì)對(duì)該圖片打上標(biāo)簽后作為訓(xùn)練集進(jìn)行保存。對(duì)采集到的照片進(jìn)行LPBH算法分析，提取特征值生成特征直方圖。使用攝像頭捕捉圖像，將視頻每幀圖像的臉部信息進(jìn)行

13、分析后生成特征直方圖后與采集的訓(xùn)練集進(jìn)行比對(duì)，打上標(biāo)簽后在視頻信息中進(jìn)行標(biāo)記。以下為該方法實(shí)現(xiàn)用到的主要函數(shù)。1)該函數(shù)的功能為識(shí)別人臉有效區(qū)域。defRmctionI(img)giay=cv2.cMColor(mig,cv2.C0L0R_BGR2GRAY)#對(duì)圖片進(jìn)行灰皮轉(zhuǎn)化Img_two_.imgcap二cv2.CascadeCIassifier('face_discren.xmT)#識(shí)另0是否有有效人月僉faceRects二cap.detectMultiScale(gi-ay,seaIeFactor.1.2)ifIen(faceRects)=0:if"ha*e_face

14、=0ifIen(faceRects):1 f?'ha-e_face二1returnimg_hvo,if_ha'e_face#返回原始圖像以及否有人臉的確認(rèn)數(shù)值2 )該函數(shù)是對(duì)圖像被測對(duì)象圖像進(jìn)行采集。defEmctioii2(number)#number是米集照片的數(shù)目the_whnumber.1while(1)ret,iniga二cap.read0#i賣取攝像頭圖彳象iing_add=cv2.fIip(imga,1)#對(duì)圖像進(jìn)行翻轉(zhuǎn)original_imgtifface=cesliicesIii.fimction1(imgadd)ififIface二I:判斷攝像頭是否識(shí)別到人

15、臉#將圖片以當(dāng)前時(shí)間命名存儲(chǔ)the_now_time二time.sti'ftiine("%Y-%m-%d%H:%M:%S”,time.locaItime0)the_pictiire_name_.str(the_now_time)thewhiiumber+=1oId_fiInamethe_picture_name+jpg1fiInameold_filname?repIace(CA2.imwrite(fiInamejmga)thewhiiumber+=1ifthewhnumbernumber:break3)該函數(shù)采集到的照片進(jìn)行遍歷為來自每一個(gè)被測對(duì)象的照片打上標(biāo)簽將其臉部圖像區(qū)

16、域提取出作為返回值輸入到LBPH分類器中。deffiinction3(img):gray二cv2.cvtColo】(img.cv2.COLORBGR2GRAY)face_cascade二cv2.CascadeCIassifier(face_discren?xinI*)face_data-.face_cascade.detectMuItiSeaIe(gray,seaIeFactor.1.2)(x,ytw,h)二face_data0returngiayy:y+w,x:x+h,faces_data044)主程序如下：whiIe(I):retjmga.cap?read()face,rect,cRinc

17、tion3(imga)a,b,face,rectlabel.facerecogiiizer.predict(face)label_text=subjectsIabeI0ifc!二0:di-aw_rectangIe(imga,rect)diaw_text(imga,labeltext,rect0rrectl-5)cv2.inishow(iniage,iniga)4. 2.13法論證以記錄個(gè)被測人每人記錄20張照片的形式對(duì)標(biāo)記為的被測人經(jīng)行測試，隨機(jī)選取10組識(shí)別結(jié)果與相識(shí)度進(jìn)行輸出放入表1中。標(biāo)簽5555555555相似度40.2641.2244.1946.9444.7739.7838.8245

18、.8939.1944.06表1隨機(jī)選取的10組識(shí)另U結(jié)果以及相似度ifthewhnumbernumber:break經(jīng)過測試該方法可以正確的識(shí)別并跟蹤特定的人臉。5結(jié)語隨著目前人工智能產(chǎn)業(yè)的飛速發(fā)展以及大數(shù)據(jù)時(shí)代的到來，深度學(xué)習(xí)成為了目前眾多專家學(xué)者的研究熱點(diǎn)。而隨著智能化場景的逐步推廣以及互聯(lián)網(wǎng)金融日益智能化，基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)的市場將變得更加廣闊。但是在人臉識(shí)別的過程中仍有難題等待處理，在面對(duì)具體問題時(shí)，數(shù)據(jù)模型的建立沒有系統(tǒng)的參考。學(xué)習(xí)框架的選取以及神經(jīng)網(wǎng)絡(luò)的建立都需要依靠眾多數(shù)據(jù)以及實(shí)驗(yàn)的支持，這就難以避免訓(xùn)練時(shí)長過長的問題，同時(shí)，對(duì)計(jì)算能力的要求也會(huì)變得更嚴(yán)格。所以，應(yīng)加大對(duì)基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)研究力度，不斷完整體系，尋求突破，以此獲得更大的研究成果。參考文獻(xiàn)1山世光.人臉識(shí)別中若干關(guān)鍵問題的研究D.中國科學(xué)院研究生院(計(jì)算技術(shù)研究所),2004.4.2. 14YangMH.KerneIEigenfacesvs.KerneIFishei-faeesFaceRecognitionUsingKerneIMethodsC/lEEEInternationalConferenceonAutomaticFaceand

人人文庫> 全部分類> 應(yīng)用文書 > 作業(yè)報(bào)告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于深度學(xué)習(xí)的人臉識(shí)別

文檔簡介

溫馨提示

最新文檔

評(píng)論

基于深度學(xué)習(xí)的人臉識(shí)別

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔