版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
摘要人臉檢測是指在圖像或視頻中判斷人臉是否存在,若存在,確定人臉的大小、位置。人臉檢測是實(shí)時(shí)人臉識(shí)別和表情識(shí)別的基礎(chǔ),只有將人臉檢測準(zhǔn)確,人臉識(shí)別和表情識(shí)別才得以實(shí)現(xiàn)。人臉檢測還在視頻監(jiān)控、數(shù)字視頻處理和基于內(nèi)容的人臉檢索中有著重要和廣泛的應(yīng)用。計(jì)算機(jī)人臉識(shí)別技術(shù)也就是利用計(jì)算機(jī)提取人臉的特征來分析人臉圖像,進(jìn)而從中提取出有效識(shí)別信息,并根據(jù)這些特點(diǎn)進(jìn)行人臉身份驗(yàn)證的技術(shù)。人臉與人體的其他生物特征(指紋、虹膜等)一樣與生俱來,它們所具有的不易被復(fù)制和唯一性的良好特性為身份鑒別提供了必要的前提。然而人臉作為人類自身在熟悉不過的一個(gè)組成部分,其檢測問題卻是一個(gè)極賦挑戰(zhàn)性的課題。首先人臉是一個(gè)包含五官、毛發(fā)等的極不規(guī)則的復(fù)雜待測目標(biāo),不同的人臉在形狀、大小、顏色、質(zhì)地等方面都有很大的變化性;其次為了實(shí)現(xiàn)檢測方法的魯棒性,我們要考慮人臉在各種復(fù)雜的背景中,不同的方向、角度、尺度等情況下所展現(xiàn)出來的不同表象。可見人臉檢測有一定的難度和復(fù)雜性,但對(duì)這一問題的深入研究必將推動(dòng)模式識(shí)別、計(jì)算機(jī)視覺、人工智能等計(jì)算機(jī)科學(xué)分支的發(fā)展。本文介紹了一種基于特征提取技術(shù)的人臉檢測與定位系統(tǒng),可分為人臉檢測與定位兩個(gè)模塊。主要實(shí)現(xiàn)人臉的定位,人臉的眼睛、鼻子、嘴巴特征點(diǎn)的定位。運(yùn)用了基于膚色的人臉檢測算法,人臉區(qū)域分割算法,特征點(diǎn)的輪廓提取。關(guān)鍵詞:圖像處理、人臉識(shí)別、特征提取、閾值分割A(yù)bstractFacedetectionisanimageorvideofaceinjudgingwhetherthere,ifitexists,determinethefacesize,position.Facedetectionisthebasisofreal-timefacerecognitionandexpressionrecognition,onlytofacedetection,facerecognitionandexpressionrecognitionwasachieved.Facedetectioninvideosurveillance,digitalvideoprocessingandcontent-basedfaceretrievalhasanimportantandwideapplication.Computerfacerecognitiontechnologyistheuseofthecharacteristicsofcomputerextractingfacetofaceimageanalysis,andthenextracttheeffectiverecognitioninformationfrom,andforfaceauthenticationaccordingtothecharacteristicsoftechnology.Otherbiologicalfeaturesoffaceandbody(fingerprint,irisetc.)asinnate,theyarenoteasytobecopiedanduniquenessofgoodcharacteristicsforauthenticationprovidesthenecessaryprerequisite.Howeverthefaceashumanbeingsinthefamiliaronecomponent,thedetectionproblemisaverychallengingtask.Thefirstfaceisafacialfeatures,hairandotherirregularandcomplicatedtarget,differentfacehaschangedgreatlyinshape,size,color,textureandsoon;secondly,inordertoachieverobustnessdetectionmethod,weshouldconsiderthefaceincomplexbackground,differentrepresentationindifferentdirection,angle,scaleandothercircumstancesrevealed.Visiblefacedetectionhasacertaindegreeofdifficultyandcomplexity,butwillbein-depthstudyonthisissuetopromotethedevelopmentofpatternrecognition,computervision,artificialintelligence,computersciencedivision.Thispaperintroducesakindoffacedetectionandlocationsystembasedonfeatureextractiontechnology,canbedividedintotwomodules:facedetectionandorientation.Locationoftherealizationofface,eyes,nose,facelocationforthemouthfeaturepoints.Usingthefacedetectionalgorithmbasedonskincolor,facialregionsegmentation,featurepointsonthecontourextraction.Keywords:imageprocessing,facerecognition,featureextraction,thresholdsegmentation1.緒論1.1人臉檢測研究的目的及意義隨著社會(huì)的發(fā)展以及技術(shù)的進(jìn)步,尤其是近十年內(nèi)計(jì)算機(jī)技術(shù)的飛速發(fā)展,社會(huì)生活中很多方面都需要運(yùn)用到身份驗(yàn)證,其中運(yùn)用人臉圖像進(jìn)行身份識(shí)別的鑒別和確認(rèn),具有被動(dòng)識(shí)別、易于為用戶接受、友好方便的特點(diǎn),因此也成為國內(nèi)外各高校研究的熱點(diǎn)之一。人臉識(shí)別技術(shù)是將靜態(tài)圖像或視頻圖像中的人臉圖像信息進(jìn)行提取,庫存中的人臉信息與之對(duì)比,從而找出與之匹配的人臉的技術(shù),以達(dá)到身份識(shí)別的意義。它屬于人工智能領(lǐng)域和生物特征識(shí)別領(lǐng)域的一個(gè)課題。人臉識(shí)別是圖像分析與理解的一種最成功的應(yīng)用,其在商業(yè)、安全、身份認(rèn)證、法律執(zhí)行等眾多方而的廣泛應(yīng)用,以及人們?cè)谌四樧R(shí)別技術(shù)方面的多年研究,使其越來越得到重視,并逐漸成為一個(gè)充滿活力的研究領(lǐng)域。人臉識(shí)別按照人臉信息的來源可分為兩種:基于靜態(tài)人臉圖像的識(shí)別和基于包含人臉的動(dòng)態(tài)視頻信息的識(shí)別。雖然人類在嬰幼兒時(shí)期已經(jīng)具有識(shí)別人臉的功力。但建造一個(gè)全自動(dòng)、識(shí)別率高的計(jì)算機(jī)人臉識(shí)別系統(tǒng)并沒有那么簡單。目前,許多困難仍沒有得到解決。這些困難主要表現(xiàn)在:人臉是一個(gè)三維非剛性物體。其表情、姿態(tài)、光源的不相同使得同一人的圖像千變?nèi)f化;其次,人臉會(huì)隨著年齡的增長而變化;第三,眼鏡、發(fā)型、胡須等對(duì)人臉圖像存在影響。由美國國防部組織的FERET測試表明,當(dāng)光照條件和人臉姿態(tài)發(fā)生變化后(例如人臉在深度方向發(fā)生偏轉(zhuǎn))。人臉識(shí)別系統(tǒng)的識(shí)別率會(huì)出現(xiàn)明顯的下降。人臉識(shí)別研究在二十世紀(jì)六七十年代已經(jīng)引起了諸多學(xué)科領(lǐng)域的研究者的濃厚興趣。而在九十年代后期,由于各行業(yè)對(duì)人臉識(shí)別系統(tǒng)的迫切需求,人臉識(shí)別研究就再次成為熱門課題。當(dāng)前世界各國有很多研究機(jī)構(gòu)都在從事人臉檢測方面的研究,這些成果受到軍方、警方以及大公司的高度重視和資助。美國軍方還專門組織人臉識(shí)別竟賽以促進(jìn)人臉識(shí)別技術(shù)研究的發(fā)展。研究人員將提出的諸多人臉識(shí)別方法,建成一系列實(shí)驗(yàn)系統(tǒng),其中一些成功的人臉識(shí)別商業(yè)軟件也投入市場。人臉識(shí)別作為模式識(shí)別的一種,一般可以分為三個(gè)組成部分:從場景中檢測、分割人臉;抽取人臉特征;匹配識(shí)別人臉信息。由于人臉檢測已經(jīng)發(fā)展成為一個(gè)獨(dú)立課題,其具有特定的思想方法。作為生物特征識(shí)別的一個(gè)重要組成方面,人臉識(shí)別在檔案管理系統(tǒng)、安全驗(yàn)證系統(tǒng)、信用卡驗(yàn)證、公安系統(tǒng)的罪犯身份識(shí)別、銀行和海關(guān)的監(jiān)控、人機(jī)交互等領(lǐng)域都具有廣闊的前景。與指紋識(shí)別、視網(wǎng)膜識(shí)別、虹膜識(shí)別等相比,人臉識(shí)別技術(shù)在數(shù)據(jù)采集方面程序比較簡單,使用者更容易接受。人臉作為生物特征,雖然唯一性比指紋和虹膜要差(基于人臉的識(shí)別系統(tǒng)識(shí)別率的上限是由同卵雙胞胎的出生率決定的),在高安全性要求的系統(tǒng)中只能作為輔助手段。然而,對(duì)于一般安全性要求的身份驗(yàn)證和鑒別系統(tǒng),人臉識(shí)別技術(shù)已經(jīng)足夠應(yīng)用了。1.2國內(nèi)外研究現(xiàn)狀20世紀(jì)60年代末至70年代初,人臉識(shí)別的研究剛剛起步,最早的研究者建立了一個(gè)半自動(dòng)的人臉識(shí)別系統(tǒng),主要以人臉特征點(diǎn)的間距、比率等參數(shù)為特征。早期的人臉識(shí)別方法有兩大特點(diǎn):一個(gè)是基于部件的識(shí)別方法,他們利用人臉的幾何特征進(jìn)行識(shí)別,提取的信息主要是人臉五官特征信息及其之間的幾何關(guān)系。這類方法比較簡單,但是容易丟失有用的信息;第二個(gè)特點(diǎn)就是人臉識(shí)別研究主要是在較強(qiáng)約束條件下的人臉圖像識(shí)別。系統(tǒng)假設(shè)圖像單一或無背景,人臉位置已知或很容易獲得,因此對(duì)現(xiàn)實(shí)場景產(chǎn)生的圖像處理效果很不佳。90年代以來,隨著計(jì)算機(jī)軟硬件性能的迅速提高,以及對(duì)人臉識(shí)別技術(shù)的高要求,人臉識(shí)別技術(shù)越來越成熟。目前人臉識(shí)別方法的研究方向主要有兩個(gè):其一是基于整體的研究方法,它主要是考慮了模式的整體屬性,包括特征臉方法、模版匹配方法、彈性圖匹配方法、隱馬爾可夫模型方法以及神經(jīng)網(wǎng)絡(luò)方法等;其二是基于特征分析的方法,也就是將人臉基準(zhǔn)點(diǎn)的相對(duì)比率和其他描述人臉臉部特征的形狀參數(shù)或類別參數(shù)等一起構(gòu)成識(shí)別特征向量。這種基于整個(gè)人臉的識(shí)別不僅保留了人臉的主要特征部件之間的拓?fù)潢P(guān)系,也保留了各部件本身的信息?;谔卣鞣治龅淖R(shí)別是通過提取出局部輪廓信息及圖像灰度信息來設(shè)計(jì)具體識(shí)別算法。兩種方式的人臉識(shí)別方法各有優(yōu)點(diǎn),基于整體的識(shí)別保留了更多信息,基于人臉特征分析的人臉識(shí)別比基于整體人臉的方法直觀,它提取并利用了最有用的特征,如關(guān)鍵點(diǎn)的位置以及部件的形狀等。90年代中期以來,人臉識(shí)別方法向著整體識(shí)別和部件分析相結(jié)合的趨勢發(fā)展。研究人員開始逐漸認(rèn)識(shí)到人臉識(shí)別算法必須能夠充分利用人臉的各種特征點(diǎn)信息,并融合人臉的形狀拓?fù)浣Y(jié)構(gòu)特征、局部灰度特征和全局灰度分布特征等多種特征。因此,設(shè)計(jì)構(gòu)思出了很多新的算法,這些算法是將原先單一的算法結(jié)合起來,共同完成人臉的識(shí)別?;叶群托螤罘蛛x的可變形模型方法就是其中之一。人臉識(shí)別技術(shù)現(xiàn)如今已經(jīng)非常成熟,其表現(xiàn)是全世界相當(dāng)數(shù)量的科研院提出了各自的人臉識(shí)別的算法,同時(shí)也出現(xiàn)了一批提供人臉識(shí)別相關(guān)產(chǎn)品的公司。近年來,因?yàn)榭植婪肿拥钠茐幕顒?dòng),尤其是自美國911事件之后,包括人臉識(shí)別在內(nèi)的生物特征識(shí)別再度成為人們關(guān)注的熱點(diǎn),各國也紛紛增加了對(duì)該領(lǐng)域研發(fā)的投入,其應(yīng)用也非常廣泛。1.3幾種人臉檢測方法對(duì)比1.3.1基于形狀的檢測方法人臉的形狀特征是指人類面部器官在幾何上表現(xiàn)的特征,這里分別介紹兩種主要的方法。(1)基于先驗(yàn)知識(shí)的方法基于先驗(yàn)知識(shí)的方法是將人臉面部器官之間的關(guān)系編碼化的人臉檢測方法。該方法是一種自頂向下的方法,依據(jù)人臉面部器官的對(duì)稱性、灰度差異等先驗(yàn)知識(shí),制定出一系列準(zhǔn)則。當(dāng)圖像中的待測區(qū)域符合準(zhǔn)則,則檢測為人臉。自頂向下的方法能夠較好地把握全局信息,但是缺點(diǎn)在于對(duì)初始位置的定位非常重要,一旦出現(xiàn)偏差,將導(dǎo)致整體跟蹤結(jié)果的偏移和變形。目前比較好的方法有鑲嵌圖人臉分塊方法、3×3的廣義三分圖方法、結(jié)合3×3和4×4的分塊方法。分塊的思想在于根據(jù)每塊的灰度值制定準(zhǔn)則進(jìn)行判定。例如將系統(tǒng)分為三級(jí),利用不同精度的平均和二次采樣產(chǎn)生三級(jí)不用分辨率的圖像。針對(duì)不同分辨率的圖像的準(zhǔn)則進(jìn)行判定,低分辨率圖像的準(zhǔn)則主要體現(xiàn)人臉的大體輪廓,高分辨率圖像的準(zhǔn)則主要體現(xiàn)人臉的細(xì)節(jié)特征。(2)基于模板的方法基于模板的方法可以分為兩類:預(yù)定模板和變形模板。預(yù)定模板方法首先制定出標(biāo)準(zhǔn)的模板,然后計(jì)算檢測區(qū)域和模板的相關(guān)值,當(dāng)相關(guān)值符合制定的準(zhǔn)則就判斷檢測區(qū)域?yàn)槿四樧冃文0迨紫戎贫ǔ瞿0鍏?shù),然后根據(jù)檢測區(qū)域的數(shù)據(jù)對(duì)參數(shù)進(jìn)行修改直至收斂,以達(dá)到檢測出人臉面部器官位置的目的?,F(xiàn)有比較好的方法有層次模板匹配方法、多模板匹配方法、主動(dòng)性狀模型、主動(dòng)表觀模型等。1.3.2基于統(tǒng)計(jì)理論的檢測方法基于統(tǒng)計(jì)理論的人臉檢測是利用統(tǒng)計(jì)分析與機(jī)器學(xué)習(xí)的方法來尋找出人臉樣本與非臉樣本各自的統(tǒng)計(jì)特征,在使用各自的特征構(gòu)建分類器并使用分類器完成人臉檢測?;诮y(tǒng)計(jì)特征的人臉方法主要有:子空間方法、神經(jīng)網(wǎng)絡(luò)方法、支持向量機(jī)方法、隱馬爾可夫模型方法以及Boosting方法。其中最成熟的方法是AdaBoost方法。1.4本系統(tǒng)研究內(nèi)容及技術(shù)方案本系統(tǒng)主要對(duì)人臉的檢測與定位做了深入研究,人臉識(shí)別作為模式識(shí)別的一種,一般可以分為人臉檢測及定位,人臉特征提取技術(shù)和人臉對(duì)比確認(rèn)識(shí)別。構(gòu)思運(yùn)用人臉檢測及定位技術(shù)包括閾值分割,特征點(diǎn)提取技術(shù)等設(shè)計(jì)一個(gè)系統(tǒng),系統(tǒng)主要實(shí)現(xiàn)人臉圖像相似度處理,圖像二值化,濾波去噪;對(duì)人臉圖像進(jìn)行水平方向和垂直方向求直方圖;用方框標(biāo)記出人臉區(qū)域;對(duì)人臉區(qū)域進(jìn)行邊緣提??;根據(jù)邊緣提取結(jié)果、人臉先驗(yàn)知識(shí)及膚色標(biāo)記眼睛特征點(diǎn);根據(jù)人臉先驗(yàn)知識(shí)與膚色特征標(biāo)記出嘴巴鼻子特征點(diǎn)等功能。其具體步驟如下:1.選擇顏色空間和膚色模型。2.計(jì)算得到相似度灰度圖。3.根據(jù)相似度灰度圖將圖像二值化。4.垂直方向和水平方向投影。5.標(biāo)識(shí)人臉區(qū)域。6.人臉內(nèi)輪廓的提取7.眼睛的識(shí)別與定位8.鼻子的識(shí)別與定位9.嘴部的識(shí)別與定位2.圖像預(yù)處理技術(shù)為了實(shí)現(xiàn)檢測方法的魯棒性,我們要考慮監(jiān)測對(duì)象在各種復(fù)雜的背景中,不同的方向、角度、尺度等情況下所展現(xiàn)出來的不同表象,而采集照片時(shí)特別是光照條件包括光源的方向、明暗、色彩等都會(huì)對(duì)圖像的效果產(chǎn)生很大的影響,進(jìn)而影響我們對(duì)檢測目標(biāo)的識(shí)別。所以我們需要對(duì)圖像進(jìn)行預(yù)處理。2.1BMP圖像文件BMP位圖文件格式是Windows系統(tǒng)交換圖像數(shù)據(jù)的一種標(biāo)準(zhǔn)圖像文件存儲(chǔ)格式,是一種與硬件設(shè)備無關(guān)的圖像文件格式,使用非常廣。它采用位映射存儲(chǔ)格式,除了圖像深度可選以外,不采用其他任何壓縮,因此,BblP文件所占用的空間很大。BMP文件的圖像深度可選lbit、4bit、8bit及24bit。BMP文件存儲(chǔ)數(shù)據(jù)時(shí),圖像的掃描方式是按從左到右、從下到上的順序。由于BMP文件格式是Windows環(huán)境中交換與圖有關(guān)的數(shù)據(jù)的一種標(biāo)準(zhǔn),在Windows環(huán)境下運(yùn)行的所有圖像處理軟件都支持這種格式。Windows3.0以前的BMP位圖文件格式與顯示設(shè)備有關(guān),因此把它稱為設(shè)備相關(guān)位圖(Device-dependentBitmap,DDB)文件格式。Windows3.0以后的BMP位圖文件格式稱為設(shè)備無關(guān)位圖(Device-independentBitmap,DIB)格式,目的是為了讓W(xué)indows能夠在任何類型的顯示設(shè)備上顯示BMP位圖文件。BMP位圖文件默認(rèn)的文件擴(kuò)展名是bmp。BMP位圖文件是由4個(gè)部分組成:位圖文件頭(Bitmap-fileHeader)、位圖信息頭(Bitmap-informationHeader)、調(diào)色板(Palette)和像素?cái)?shù)據(jù)(ImageData)。如圖所示。位圖文件頭位圖信息位圖信息頭調(diào)色板數(shù)據(jù)像素?cái)?shù)據(jù)圖2-12.2圖像的相似度計(jì)算圖像相似度計(jì)算主要用于對(duì)于兩幅圖像之間內(nèi)容的相似程度進(jìn)行打分,根據(jù)分?jǐn)?shù)的高低來判斷圖像內(nèi)容的相近程度。要計(jì)算圖像的相似度,必須要找出圖像的特征。這樣跟你描述一個(gè)人的面貌:國字臉,濃眉,雙眼皮,直鼻梁,大而厚的嘴唇。這些特征決定了這個(gè)人跟同事、朋友、家人的相似程度。圖像也一樣,要計(jì)算相似度,必須抽象出一些特征比如藍(lán)天白云綠草。常用的圖像特征有顏色特征、紋理特征、形狀特征和空間關(guān)系特征等。顏色特征的算是最常用的,在其中又分為直方圖、顏色集、顏色矩、聚合向量和相關(guān)圖等。直方圖能夠描述一幅圖像中顏色的全局分布,而且容易理解和實(shí)現(xiàn),所以入門級(jí)的圖像相似度計(jì)算都是使用直方圖。圖像的相似度比較的大致實(shí)現(xiàn)步驟:將圖像轉(zhuǎn)換成相同大小,以有利于計(jì)算出相像的特征計(jì)算轉(zhuǎn)化后的灰度,二值利用相似度公式,得到圖像相似度的定量度量統(tǒng)計(jì)相似度結(jié)果數(shù)據(jù)相似度公式:SimG,S2.3二值化技術(shù)二值圖像也就是只具有兩個(gè)灰度級(jí)的圖像,他是數(shù)字圖像的一個(gè)重要子集。一個(gè)二值圖像(如一個(gè)剪影像或一個(gè)輪廓圖)通常是由一個(gè)圖像分割操作產(chǎn)生的。如果初始的分割不夠令人滿意,對(duì)二值圖像的某些形式的處理通常能提高其質(zhì)量。一個(gè)有效的二值圖像處理運(yùn)算集是從數(shù)學(xué)形態(tài)學(xué)下的集合輪方法發(fā)展起來的。盡管它的基本運(yùn)算很簡單,但它們和它們的推廣結(jié)合起來可以產(chǎn)生復(fù)雜得多的效果。并且,它們適合于用相應(yīng)的硬件構(gòu)造查找表的方式,實(shí)現(xiàn)快速的流水線處理。這種方法通常用于二值圖像,但也可以擴(kuò)展到灰度級(jí)圖像的處理。在通常情況下,形態(tài)學(xué)圖像處理意在圖像中移動(dòng)一個(gè)結(jié)構(gòu)元素并進(jìn)行一種類似于卷積操作的方式進(jìn)行,像卷積核一樣,結(jié)構(gòu)元素可以具有任意的大小,也可以包含任意的0與1的組合。在每個(gè)像素位置,結(jié)構(gòu)元素核與在它下面的二值圖像之間進(jìn)行一種特定的邏輯運(yùn)算。邏輯運(yùn)算的二進(jìn)制結(jié)果存在輸出圖像中對(duì)應(yīng)于該像素的位置上。產(chǎn)生的效果取決于結(jié)構(gòu)元素的大小、內(nèi)容及邏輯運(yùn)算的性質(zhì)。圖像的二值化一般按下面公式進(jìn)行:gbg(x,y)是原圖像中位于(x,y)處像素的像素的灰度,gb(x,y)是二值化后該處的像素值,它只能取1(白)或0(黑)。二值化后的人臉圖像中,數(shù)字為0的部分為背景,數(shù)值為1的部分表示人臉,2.3.1直方圖直方圖又稱灰度直方圖,是圖象處理中一種十分重要的圖像分析工具,它是用來表示是圖像各個(gè)灰度級(jí)的分布圖像,任何一幅直方圖都包含了豐富的信息。從數(shù)學(xué)上來說圖像直方圖是圖像各個(gè)灰度值統(tǒng)計(jì)特性與圖像灰度值的函數(shù),它統(tǒng)計(jì)了一幅圖像中各個(gè)灰度級(jí)出現(xiàn)的次數(shù)和概率。下面是對(duì)圖2-3進(jìn)行相似度計(jì)算而后得到2-4再進(jìn)行二值化得到2-52-32-42-53.人臉膚色相似度比較在第一章緒論中已經(jīng)介紹許多種現(xiàn)有的人臉檢測算法,若以檢測過程中是否利用了色彩或膚色信息,我們可以分為基于彩色信息的人臉檢測算法、基于灰度信息的人臉檢測算法以及彩色信息與灰度信息相結(jié)合的人臉檢測算法;在彩色信息與灰度信息相結(jié)合的人臉檢測算法中,我們又可以根據(jù)如何應(yīng)用膚色信息這一角度在進(jìn)行細(xì)分:例如,可以分為膚色信息作為前期與處理的方法、膚色信息作為后期驗(yàn)證的方法等。經(jīng)過詳細(xì)周密的考證,我們的系統(tǒng)采用基于膚色的人臉檢測算法。人臉的膚色不依賴于面部的其他特征,對(duì)于人臉姿態(tài)和表情的變化不敏感,具有較好的穩(wěn)定性,而且明顯區(qū)別于大多數(shù)背景物體的顏色。大量實(shí)驗(yàn)證明,不同膚色的人臉對(duì)應(yīng)的色調(diào)是比較一致的,其區(qū)別主要在于灰度。因此,為了進(jìn)行人臉檢測,這里采用人臉膚色作為識(shí)別人臉的特征即采用基于膚色法進(jìn)行人臉識(shí)別。為了準(zhǔn)確進(jìn)行人臉膚色識(shí)別,首先將人臉圖像從RGB顏色空間映射到Y(jié)CbCr顏色空間,然后建立膚色模型并求得相似度矩陣,最后用相似度矩陣中的最大值對(duì)相似度矩陣進(jìn)行歸一化,該歸一化矩陣將用于后續(xù)人臉檢測。3.1色彩空間與色彩空間的聚類3.1.1歸一化RGB顏色空間在RGB顏色空間中,三個(gè)顏色分量R、G、B不但表示各自的色彩,也包含了各自的亮度分量。研究表明,如果圖像中的兩個(gè)像素點(diǎn)R、G、B和R'RR'=因此,在色度空間中除去亮度分量,即形成膚色空間,得到歸一化的RGB顏色空間。如式(3-1-2)rgb由于r+g+b=1,從未忽略了任何一個(gè)變量,經(jīng)過上述變換其中二維都是獨(dú)立的,大大減少了亮度分量的影響,相當(dāng)于將三位的RGB空間降低成二維的r-g空間。3.1.2HSV顏色空間HSV顏色空間在視覺上是均勻的,與人類的視覺特性有很好的一致性。如果去掉其亮度分量V,使用H和S分量對(duì)圖像進(jìn)行膚色分割,也可以得到很好的效果,但是它也有很大的不足:(1)三個(gè)分量H、S、V是由三基色R、G、B經(jīng)過非線性變換得到的,因此計(jì)算復(fù)雜度高,計(jì)算效率較低。(2)HSV顏色空間中存在著奇異點(diǎn),即色度點(diǎn)在V軸上時(shí),其S值為零,而H沒有定義。而且在奇異點(diǎn)附近R、G、B值的較小變化就會(huì)引起H、S、V值的較大變化。飽和度S越小,顏色越淺時(shí),色調(diào)H值越不穩(wěn)定。圖3-3-13.1.3YCbCr顏色空間YCbCr顏色空間的Y亮度分量和色度分量Cb與Cr基本分離,比較適合膚色聚類。除此YCbCr顏色空間還顯示了其他一些良好的特性:該空間具有與人類視覺感知過程相類似的構(gòu)成原理。YCbCr色彩空間被廣泛地應(yīng)用在電視顯示等領(lǐng)域中,也是許多視頻壓縮編碼,如MPEG和JPEG等標(biāo)準(zhǔn)中普遍采用的顏色表示。YCbCr的計(jì)算過程和空間坐標(biāo)表示形式簡單,與RGB之間的轉(zhuǎn)換為線性,容易實(shí)現(xiàn),避免了非線性的奇異性。YCbCr顏色空間是離散的,采用YCbCr顏色空間易于實(shí)現(xiàn)聚類算法。AnilK.Jain等人繪制了853571個(gè)膚色點(diǎn)的統(tǒng)計(jì)圖像,其結(jié)果表明,膚色在YCbCr顏色空間的淚俱效果較好。一般情況下,顏色圖像都是RGB顏色空間的,其他顏色空間都是通過RGB轉(zhuǎn)換得到的,而YCbCr也是如此。由于是線性轉(zhuǎn)換關(guān)系,其中的亮度分量Y并不是完全獨(dú)立于色度信息存在的,而AnilK.Jain等人的實(shí)驗(yàn)也表明,膚色的聚類區(qū)域因?yàn)榱炼确至康年P(guān)系而呈現(xiàn)非線性變化的情況,而且在YCbCr顏色空間中,膚色聚類成兩頭尖的橢球形。因此單純的排除亮度分量Y的影響,可能會(huì)導(dǎo)致選取的膚色區(qū)域不夠準(zhǔn)確,降低其魯棒性。所以,在膚色檢測之前,要先對(duì)圖像進(jìn)行分段線性顏色變換。由YCbCr到Y(jié)Cb’Cr’如式3-1-3所示。Ci其中,i表示b或r,WCb=46.7,WCr=38.76,Ki和Kh為常量分別為125和3.1.4RGB顏色空間到Y(jié)CbCr顏色空間的映射人類的膚色在YCbCr顏色空間相對(duì)比較集中(被稱為膚色的聚類特性),因此選用在YCbCr顏色空間中進(jìn)行人臉檢測,需完成RGB顏色空間到Y(jié)CbCr顏色空間的映射。在你從RGB到Y(jié)CbCr的轉(zhuǎn)換過程中,輸入、輸出數(shù)據(jù)都是8位二進(jìn)制格式。轉(zhuǎn)換公式如下:Y=0.2990R+0.5870G+0.1140BCb=-C式中,R、G、B是RGB顏色空間中紅、綠、藍(lán)3種顏色通道的顏色值。YCbCr顏色空間中,Y的范圍為16~235,Cb和Cr的范圍為16~240。但是,由于Y和Cb、Cr可能偶然超出16~235和16~240范圍(視頻處理和噪聲的緣故),根據(jù)以上公式可知,此時(shí)RGB的值可能偏移到0~15和236~255范圍內(nèi)。計(jì)算機(jī)系統(tǒng)中的RGB數(shù)值范圍為0~255,因此,使用以下的方程式會(huì)更加方便:Y=0.257R+0.504G+0.098B+16CC3.2膚色模型選好顏色空間后,接下來就是在此顏色空間中進(jìn)行膚色建模。所謂膚色模型是指用一種代數(shù)的、解析的或查找表等形式來表示膚色的聚類特性,或者表征出某一像素的顏色與膚色的相似程度。常用的膚色模型、橢圓模型和高斯模型。3.2.1直方圖模型直方圖模型是一種非參數(shù)化模型。此模型通過選定的顏色空間對(duì)膚色進(jìn)行統(tǒng)計(jì)得出其各顏色分量直方圖,由直方圖顯現(xiàn)出的規(guī)律選定閾值,通過該閾值來對(duì)整個(gè)圖像進(jìn)行膚色與非膚色的判別。盡管此模型在三維直方圖中效果比較好,但是由于其訓(xùn)練樣本數(shù)量龐大而且訓(xùn)練時(shí)間較長。因此,在膚色建模中較少使用。3.2.2橢圓模型膚色在Cb-Cr空間中也可以用橢圓分布來描述,根據(jù)式()和式()來匹配橢圓分布兩個(gè)色度分量的距離。x-xy其中,ecx和ecy分別為Cb和Cr的統(tǒng)計(jì)均值。式中的參數(shù)ecx=1.60,ecy=2.41,a=25.39,b=14.033.2.3高斯模型高斯模型主要是利用了統(tǒng)計(jì)學(xué)的原理。膚色符合正態(tài)分布的隨機(jī)樣本,在特征空間中的分布則復(fù)合高斯分布,高斯函數(shù)平面圖如圖3-2-3所示。高斯分布的數(shù)學(xué)表達(dá)形式簡單且直觀,又是統(tǒng)計(jì)學(xué)中研究比較深入的一種正態(tài)模型,因此借助此模型具有一定的優(yōu)越性。它主要通過統(tǒng)計(jì)分析,預(yù)測高斯分布的參數(shù),或通過統(tǒng)計(jì)直接求得顏色空間中每個(gè)分量(一般利用的是該顏色空間中的色度分量)的均值與協(xié)方差。這種方法分為兩步:首先選擇方法確定模型的參數(shù)(即均值和協(xié)方差),其次利用該模型來判別新的像素或區(qū)域是否為膚色。圖3-2-33.3膚色模型3.3.1光線補(bǔ)償光線補(bǔ)償?shù)南敕ǖ奶岢鲋饕强紤]到膚色等色彩信息經(jīng)常受到光源顏色、圖像采集設(shè)備的色彩偏差等因素的影響,而在整體上偏離本質(zhì)色彩而向某一方向移動(dòng),即我們通常所說的色彩偏冷、偏暖,照片偏黃、偏藍(lán)等等。這種現(xiàn)象在藝術(shù)照片中更為常見。我們采用GaryWorld算法對(duì)RGB圖像進(jìn)行快速顏色補(bǔ)償,即:SC=式中,Cstd為標(biāo)準(zhǔn)亮度圖像R、G、B的平均值;Cave為輸入圖像R、G、B的平均值;C為原圖像的像素值;3.3.2膚色模型不同種族、不同年齡、不同性別的人膚色看起來存在差異,但這個(gè)差異主要體現(xiàn)在亮度上。當(dāng)去除亮度,膚色就具有很高的聚類性。在RGB顏色空間,為了去除光照影響,人臉膚色需進(jìn)行亮度歸一化。歸一化的顏色分量分別為r,g,b。r=RR+G+B,g=G式中,r、g、b分別來自于R、G、B,相互獨(dú)立且r+g+b=1。由于這種歸一僅去除了R、G、B中的相對(duì)亮度成分R+G+B,而r、g、b仍存在亮度信息,所以這種方法用于膚色檢測效果不好。在YCbCr色彩空間,歸一化色度直方圖后假定膚色滿足二維高斯模型M=(m,C),其中m為均值,m=E(x),x=Cb,CrT,CPC已經(jīng)證明,這個(gè)模型能很好的區(qū)分出人臉和非人臉。3.3.3中值濾波中值濾波是抑制噪聲的一種非線性平滑處理方法,由J.W.Jukey首次提出并將其應(yīng)用于時(shí)間序列的一維信號(hào)處理技術(shù)中,后來人們將其用于二維數(shù)字圖像處理中。中值濾波也是一種鄰域運(yùn)算,但不是簡單的以待處理像素點(diǎn)(i,j)的8個(gè)相鄰像素的灰度均值來取代該點(diǎn)的灰度,對(duì)于給定的n個(gè)像素(n為奇數(shù))的灰度值{a1,a陣列xi,jM×N經(jīng)過窗口為Mn的中值濾波后,待處理像素點(diǎn)(f3-3-3式中,Mn表示待處理點(diǎn)的鄰域模板,窗口模板可以是正方形或十字形的,分別如圖3-3-3-1和圖111111111010111010圖3-3-3-1圖3-3-3-23.4膚色相似度計(jì)算為了方便在后續(xù)處理中利用圖像像素的鄰域信息,我們首先將像素從彩色空間變到一維空間。根據(jù)膚色在色度空間中的高斯分布,對(duì)于彩色圖像中的每個(gè)像素點(diǎn),將其從RGB色彩空間變換到Y(jié)CgCr色彩空間后,就可以計(jì)算該點(diǎn)屬于皮膚區(qū)域的概率,即根據(jù)該點(diǎn)距離高斯分布中心的遠(yuǎn)近的到其與膚色的相似度,即PC對(duì)一幅圖像中的每個(gè)像素點(diǎn)計(jì)算完畢后,我們統(tǒng)計(jì)出該幅圖像上所有像素點(diǎn)的最大膚色相似度PmaxCG,CR,并將每個(gè)像素點(diǎn)的膚色相似度PCg,3.5人臉膚色相似度算法流程對(duì)人臉膚色相似度計(jì)算,一般需要經(jīng)過以下幾個(gè)步驟:首先利用如下公式:Y=0.257R+0.504G+0.098B+16CC將人臉圖像從RGB顏色空間映射到Y(jié)CbCr顏色空間,建立膚色模型,具體代碼如下:Cb_Mean=117.4361;Cr_Mean=156.5599;Cov00=160.1301;Cov10=12.1430;Cov11=299.4574;膚色相似度矩陣的計(jì)算,得到m_pSimArray[i][j]的值;對(duì)所得到的m_pSimArray[i][j]進(jìn)行中值濾波;用相似度矩陣中的最大值對(duì)相似度矩陣進(jìn)行歸一化處理。人臉膚色相似度算法流程圖如圖3-5所示。初始化初始化獲取圖像參數(shù)將圖像從RGB色彩空間映射到Y(jié)CbCr色彩空間建立膚色模型利用膚色模型,求相似度矩陣中值濾波用相似度矩陣中的最大值對(duì)相似度矩陣進(jìn)行歸一結(jié)束圖3-53.6人臉相似度算法實(shí)現(xiàn)結(jié)果對(duì)3-6-a建立人臉膚色模型,進(jìn)行人臉相似度計(jì)算處理后,得到結(jié)果如圖3-6-b圖3-6-a圖3-6-b4.人臉區(qū)域分割為了更清晰的顯示人臉和非人臉區(qū)域,還要對(duì)相似度圖進(jìn)行二值化處理。圖像的二值化,就是將圖像上的像素點(diǎn)的灰度值設(shè)置為0或255,也就是將整個(gè)圖像呈現(xiàn)出明顯的只有黑和白的視覺效果。最常用的方法就是設(shè)定一個(gè)全局閾值T,用T將圖像的數(shù)據(jù)分成兩部分:大于T的像素群和小于T的像素群。將大于T的像素群的像素值設(shè)定為白色(或者黑色),小于T的像素群的像素值設(shè)定為黑色(或者白色)。這里閾值T采用整幅圖像的灰度平均值。4.1閾值分割技術(shù)閾值分割就是把一幅圖像中像素值處于一定范圍內(nèi)的點(diǎn)賦予特定的值(比如0表示黑色),而在這個(gè)范圍之外的像素點(diǎn)被賦予另外一個(gè)值(比如255表示白色)或者保持這些像素點(diǎn)得值不變。圖像閾值化的目的是要按照灰度級(jí)對(duì)像素集合進(jìn)行劃分,得道的每個(gè)子集形成一個(gè)與現(xiàn)實(shí)景物相對(duì)應(yīng)的區(qū)域,各個(gè)區(qū)域內(nèi)部具有一致的屬性,而相鄰區(qū)域布局也有這種一致性。閾值法是一種傳統(tǒng)的圖像分割方法,因其實(shí)現(xiàn)簡單、計(jì)算量小、性能較穩(wěn)定而成為圖像分割方法中最基本和應(yīng)用最廣泛的分割技術(shù),已被應(yīng)用于很多的領(lǐng)域。例如,在醫(yī)學(xué)應(yīng)用中,血液細(xì)胞圖像的分割,磁共振圖像的分割。在紅外技術(shù)應(yīng)用中,紅外無損檢測中紅外熱圖像的分割,紅外成像跟蹤系統(tǒng)中目標(biāo)的分割。在農(nóng)業(yè)工程應(yīng)用中,水果品質(zhì)無損檢測過程中水果圖像與背景的分割。在這些應(yīng)用中,分割是對(duì)圖像的進(jìn)一步分析的前提,分割的準(zhǔn)確性將直接影響后續(xù)操作的有效性。常用的閾值分割技術(shù)有最大方差閾值分割、自適應(yīng)閾值分割和HIS選取閾值分割等。面向彩色圖像處理的顏色模型中最常用的是HIS模型,它克服了RGB顏色模型不直觀以及各分量高度相關(guān)的缺點(diǎn),而且H和S分量的大小與人對(duì)顏色的感受是緊密相連的,這種彩色描述對(duì)人來說自然的、直觀的。其中,H(色調(diào))在3個(gè)分量中更能反映不同顏色物體的差異,因此對(duì)于彩色圖像的閾值分割更有效。本系統(tǒng)中,為了從血液圖像中提取紅細(xì)胞,現(xiàn)手動(dòng)選取一塊特征顏色區(qū)域,記錄特征顏色區(qū)域的HIS值(實(shí)際選出來的為RGB顏色空間),然后根據(jù)記錄的HIS值在整個(gè)圖像內(nèi)進(jìn)行搜索,以選出所有紅細(xì)胞。4.2Blob分析技術(shù)Blob分析技術(shù)又叫斑點(diǎn)分析,是一種對(duì)圖像中相同像素的連通域進(jìn)行分析的技術(shù),該連通域稱為Blob。Blob算法就是找出圖像中的連通域,并確定其數(shù)量、大小、面積和位置等信息的一種方法。Blob分析適用場合主要有以下幾種:對(duì)象在尺寸、形狀或方向上差異很大(訓(xùn)練模型很難或者不可能)對(duì)象有背景中找不到的截然不同的灰度。對(duì)象沒有重疊或者接觸。通常的Blob分析主要步驟如圖4-2所示獲取圖像獲取圖像閾值分割連通性規(guī)則形態(tài)學(xué)處理計(jì)算得出特征值圖4-2在進(jìn)行與之分割后運(yùn)用連通性規(guī)則找到連通區(qū)域,目的是提取目標(biāo)物體。由于是人為選取HIS顏色特征區(qū)域,可能選取不恰當(dāng),或者實(shí)際圖像處理過程中受光照不均勻、背景噪聲和圖像分割算法缺陷等因素的影響,使得圖像中存在一些大大小小的孔洞或者碎片,成為偽連通區(qū)域,使得提取目標(biāo)物體不準(zhǔn)確,。這樣會(huì)使后續(xù)操作精確率降低,在腐蝕細(xì)胞外圍時(shí),內(nèi)部孔洞也在擴(kuò)大,所以需要填充孔洞的算法來更新。填充孔洞的原理是:在閾值處理時(shí),如果像素已被標(biāo)志,則填充孔洞時(shí),先統(tǒng)計(jì)所有連通的非標(biāo)志區(qū)域的面積,這些面積中有相對(duì)較大和較小的區(qū)域。那些較小或很小的區(qū)域往往就是需要填充的空洞。在算法中,先判斷孔洞區(qū)域,如果判定某個(gè)區(qū)域在目標(biāo)區(qū)域范圍之內(nèi),并且滿足其連通部分不與背景區(qū)域有相交點(diǎn),則此區(qū)域?yàn)榭锥?,進(jìn)行填充。在圖像中,被標(biāo)志區(qū)域默認(rèn)用藍(lán)色標(biāo)志。4.3邊緣提取技術(shù)所謂邊緣就是圖像中灰度發(fā)生急劇變化的像素點(diǎn)的集合。對(duì)二維圖像進(jìn)行邊緣提取,就是檢測邊緣在強(qiáng)度上的非連續(xù)性,或者說對(duì)這些圖像強(qiáng)度的不連續(xù)點(diǎn)進(jìn)行提取。在圖像中像素點(diǎn)的梯度可以很好地體現(xiàn)圖像強(qiáng)度。梯度的定義如下所示。給定一幅二維圖像f(x,y)在點(diǎn)(x,y)的梯度用幅度和方向表示為:gx,y=G其中g(shù)(x,y)表示梯度幅度,Gx表示對(duì)x的編導(dǎo),Gy表示對(duì)φx,y其中φx,y梯度的方向就是函數(shù)的最大變化率的方向,故梯度的數(shù)值就是f(x,y)在其最大變化率方向上的單位距離所增加的量。對(duì)于二維圖像,偏導(dǎo)數(shù)可以用差分來近似,如式4-3-3所示
?fx進(jìn)行上述近似后,梯度的模如式(4-3-4)所示。gx,y一般為了計(jì)算方便,采用式(4-3-5)絕對(duì)值近似公式gx,y對(duì)于彩色圖像,可以分別R、G、B進(jìn)行梯度計(jì)算。用gx,y在離散情況下多用梯度算子來檢測提取邊緣。常用的梯度算子如表4-3所示。在系統(tǒng)操作過程中,圖像中往往存在這樣的點(diǎn),覆蓋在多個(gè)細(xì)胞的邊界相連處,使得閾值分割后將邊界相連處和細(xì)胞內(nèi)部的顏色值差距較大存在突變,而存在顏色突變的地方其相應(yīng)的梯度值也較大,因此,梯度修正就是去掉這些梯度值很大的點(diǎn),使其不被標(biāo)志。在修正中Sobel算子。4.4人臉區(qū)域分割系統(tǒng)結(jié)構(gòu)圖人臉區(qū)域分割的系統(tǒng)結(jié)構(gòu)圖如下:圖像中的膚色和非膚色像素點(diǎn)圖像中的膚色和非膚色像素點(diǎn)人臉區(qū)域分割算法包含人臉區(qū)域在內(nèi)的一系列矩形區(qū)圖4-4在上面的示意圖中,輸出的一系列矩形就將取代原來的整幅圖像作為后面的人臉檢測算法的輸入。所以對(duì)于這些矩陣的要求如下:這一系列矩形應(yīng)該盡可能的包含待檢測圖像中的所有人臉對(duì)于距離較近或者是有接觸的多個(gè)人臉,分割后得到的膚色區(qū)域自然距離較近或者是連在一起,這是可以用一個(gè)矩陣區(qū)域覆蓋它們。不漏檢、不降低正確率是整個(gè)膚色分割預(yù)處理的前提,也自然是人臉區(qū)域分割算法的首要前提。根據(jù)前面對(duì)膚色模型的分析,無論什么樣的膚色模型都存在著判斷失誤的現(xiàn)象,所以算法輸出的一系列矩形應(yīng)該盡量包含所有的人臉區(qū)域便顯得尤為重要。這一系列矩形應(yīng)該少包含非膚色區(qū)域也即相對(duì)原來的整幅圖像,經(jīng)過膚色分割預(yù)處理后的這一系列矩形的大小要明顯小于原來的整幅圖像。這也正是膚色分割預(yù)處理能夠提高人臉檢測算法的時(shí)間效率的原因:也是膚色分割預(yù)處理能夠降低誤報(bào)率的關(guān)鍵。4.5人臉區(qū)域分割算法根據(jù)上面對(duì)于膚色區(qū)域分割算法結(jié)果的要求,也就是對(duì)于算法本身的要求,這里介紹一種新穎、快捷、魯棒的人臉區(qū)域分割算法。物體分割方法大體上有3大類方法:基于像素的方法,基于邊界的方法基于區(qū)域的方法。前面的利用膚色模型的膚色像素點(diǎn)的提取相當(dāng)于已經(jīng)應(yīng)用了基于像素的方法,在此基礎(chǔ)上要將這一個(gè)個(gè)分散的膚色像素點(diǎn)構(gòu)成一個(gè)個(gè)人臉區(qū)域,再用這些人臉區(qū)域的外接矩形來表征它們。對(duì)于其他的兩種方法,我們可以簡單的分析一下它們各自的優(yōu)缺點(diǎn)?;谶吔绲姆椒ㄓ捎谔幚淼南袼?cái)?shù)量相對(duì)較少,各像素點(diǎn)間的相鄰關(guān)系也相對(duì)簡單,所以處理起來的速度要比基于區(qū)域的方法快;但另一方面,由于基于邊界的方法是從局部特性來求圖像整體的分割,因此在全局宏觀性質(zhì)的考慮上不如基于區(qū)域的方法。綜合上面對(duì)基于邊界的方法和基于區(qū)域的方法各自優(yōu)缺點(diǎn)的比較,我們應(yīng)該力求兩者能夠取長補(bǔ)短,所以在這一部分中我們采用了將基于邊界的方法和基于區(qū)域的方法相結(jié)合的算法;基于邊界的方法主要用于前期初始矩形序列的產(chǎn)生,爭取快速得到包含人臉區(qū)域的外接矩形;然后用基于區(qū)域的方法,全局考慮,對(duì)初始矩形序列進(jìn)行區(qū)域歸并,得到最終的輸出矩形。對(duì)人臉識(shí)別一般需要經(jīng)過以下幾個(gè)步驟:將圖像進(jìn)行灰度化處理,并計(jì)算出整幅圖像的灰度平均值。將每個(gè)像素的灰度值與平均值進(jìn)行比較。若大于平均值,則將其灰度值設(shè)為0;若小于平均值,則設(shè)為255。建立一個(gè)新視圖顯示分割結(jié)果。算法的整體流程圖見4-5否否初始化獲取圖像參數(shù)計(jì)算圖像灰度平均值像素的灰度值是否大于平均值?是將該像素灰度值設(shè)為0將該像素灰度值設(shè)為255建立一個(gè)新視圖顯示分割結(jié)果結(jié)束圖4-54.6人臉檢測模塊總體結(jié)構(gòu)人臉檢測模塊由兩個(gè)模塊組成:即人臉膚色相似度比較模塊和人臉識(shí)別與分割模塊。人臉檢測系統(tǒng)總體框架如圖4-6所示。過程過程建立膚色模型RGB顏色空間到Y(jié)CbCr顏色空間的映射亮度補(bǔ)償相似度計(jì)算二值化方法人臉圖像膚色相似度計(jì)算人臉識(shí)別與分割圖4-64.7人臉識(shí)別與分割模塊實(shí)現(xiàn)結(jié)果人臉識(shí)別與分割模塊將膚色相似度計(jì)算之后的結(jié)果(圖4-6-a)進(jìn)行二值化處理得到圖4-7-b,再求得水平直方圖和垂直直方圖,分別得到圖4-7-c和圖4-7-d。圖4-7-a圖4-7-b圖4-7-c圖4-7-d5.人臉定位模塊人臉定位以人臉檢測為基礎(chǔ),對(duì)人臉中具有穩(wěn)定特性特征的五官進(jìn)行定位,是人臉識(shí)別的另一個(gè)重要研究部分。對(duì)人臉進(jìn)行定位,實(shí)際上就是對(duì)人臉進(jìn)行檢測的過程,它首先是在所輸入的圖像中確定是否有人臉,如果有,則需要進(jìn)一步確定人臉的相關(guān)信息。在一幅圖像中出現(xiàn)的人臉,通常具有相互對(duì)稱的兩只眼睛、一個(gè)鼻子和一張嘴。特征之間的相互關(guān)系可以通過它們的相對(duì)距離和位置來描述。因此,在檢測到人臉的條件下,就可以對(duì)人臉的部分特征例如眼睛、鼻子、嘴進(jìn)行定位,對(duì)這些人臉特性的定位在人臉識(shí)別、三維虛擬人臉合成、人臉表情分析與合成等方面具有非常重要的作用。本次設(shè)計(jì)旨在設(shè)計(jì)的系統(tǒng)具有人臉初始位置定位及人臉內(nèi)輪廓提取的功能,同時(shí)能夠?qū)θ四槇D像中固有特征,如眼睛、鼻子、嘴進(jìn)行識(shí)別和定位。5.1人臉定位模塊總體構(gòu)架人臉定位系統(tǒng)由以下4個(gè)模塊構(gòu)成。如圖5-1過程過程人臉輪廓提取眼睛識(shí)別與定位鼻子識(shí)別與定位嘴部識(shí)別與定位人臉檢測系統(tǒng)輸出圖像邊緣檢測位置準(zhǔn)則膚色掩碼方法圖5-15.2人臉定位5.2.1人臉定位的技術(shù)原理為了進(jìn)行人臉的定位,首先需要對(duì)人臉的位置區(qū)域進(jìn)行初步的確定。原是彩色圖像在經(jīng)過光線補(bǔ)償、膚色提取、去噪和填充后,由于有時(shí)有背景與膚色的相似性以及裸露的四肢、頸部等膚色圖像的存在,會(huì)嚴(yán)重干擾人臉區(qū)域的確定,所以必須采取一定措施將非人臉去除。根據(jù)一下判斷規(guī)則來排除非人臉區(qū)域和確定人臉區(qū)域。在豎直方向上對(duì)人臉區(qū)域(白色像素)進(jìn)行白色像素投影,并計(jì)算器最大值,然后用這個(gè)值去歸一每列人臉區(qū)域的像素投影值(相當(dāng)于求頻度);通過頻度確定人臉區(qū)域的左邊界和右邊界。這里,左邊界和右邊界設(shè)定的閾值為0.2,即從頻度最大向左尋找頻度減少到0.2的那一列作為左邊界,從而頻度最大向右尋找頻度減小到0.2的那一列作為右邊界;同理,在水平方向上對(duì)人臉區(qū)域進(jìn)行白色像素投影,并計(jì)算其最大值,也用這個(gè)值去歸一每一行人臉區(qū)域的像素投影值(相當(dāng)于求頻度);通過頻度確定人臉區(qū)域的上邊界,上邊界的閾值仍設(shè)定為0.2,即從頻度最大向上查找頻度減少到0.2的那一行作為上邊界。下邊界則按如下方式求取:人臉擬合為矩形時(shí),人臉的長寬比值約為1.2,現(xiàn)已知上邊界、左邊界和右邊界,可據(jù)此求出人臉的下邊界。設(shè)計(jì)時(shí)沒有通過膚色去檢測人臉下邊界,這是因?yàn)槿舜┎煌路r(shí),外露脖子的長短會(huì)有變化。若依靠膚色檢測人臉下邊界,脖子區(qū)域也會(huì)被誤當(dāng)成人臉檢測出來,影響人臉定位效果。5.1.2人臉定位算法對(duì)人臉的定位一般需要經(jīng)過一下幾個(gè)步驟:彩色人臉圖像及相應(yīng)的二值圖像;統(tǒng)計(jì)出每列白色像素的個(gè)數(shù),并求出最大值,對(duì)其他列的值進(jìn)行歸一化的處理;確定出左右邊界;統(tǒng)計(jì)出每行白色像素的個(gè)數(shù),并求出最大值,對(duì)其他行的值進(jìn)行歸一化處理;確定出上下邊界;在彩色圖像上標(biāo)記出邊界的位置。人臉定位算法流程圖如圖5-1-2所示。初始化初始化獲取彩色圖像及二值圖像參數(shù)在豎直方向統(tǒng)計(jì)白色像素個(gè)數(shù),并求出最大值歸一其他列的值確定左右邊界在水平方向統(tǒng)計(jì)白色像素個(gè)數(shù),并求出最大值歸一其他列的值確定上邊界確定下邊界在彩色圖像上標(biāo)記邊界位置結(jié)束圖5-1-25.1.3人臉定位實(shí)現(xiàn)結(jié)果人臉定位模塊的程序?qū)崿F(xiàn)結(jié)果如圖5-1-35-1-35.2人臉內(nèi)輪廓提取5.2.1人臉內(nèi)輪廓提取技術(shù)原理為了提高在人臉區(qū)域內(nèi)眼睛、鼻子和嘴的定位精度,本設(shè)計(jì)在人臉區(qū)域內(nèi)進(jìn)行輪廓提取,以突顯眼睛、鼻子和嘴的位置。首先將已經(jīng)定位的彩色人臉圖像進(jìn)行二值化處理。其基本原理是計(jì)算出每點(diǎn)像素的紅、綠值,然后利用下面的公式進(jìn)行二值化處理,得到圖像的灰度值T。T=255(0.246<g<0.398,0.233<r<0.664,r<g,g>0.5×(1-r))0在得到人臉的二值化圖像后需進(jìn)行邊緣檢測,利用圖5-2-2所示的模板對(duì)圖像進(jìn)行卷積計(jì)算,得到每個(gè)像素點(diǎn)的新的灰度值。為了能夠利用單像素點(diǎn)描述人臉圖像的邊緣,作如下處理:生成一個(gè)3×3的模板,統(tǒng)計(jì)模板中灰度值小于-5和大于5的像素點(diǎn)個(gè)數(shù)。若每一類像素的個(gè)數(shù)均大于2,則模版中心像素灰度值置為0,生成所要提取的內(nèi)輪廓及人臉內(nèi)輪廓。-2-4-4-4-2-4080-4-4811-4-4080-4-2-4-4-4-2圖5-25.2.2人臉內(nèi)輪廓提取算法對(duì)人臉內(nèi)輪廓的提取一般需要經(jīng)過以下幾個(gè)步驟:獲取顏色表;根據(jù)m_pImgDataIn1,lineByteIn及pixelByteIn的值計(jì)算出每個(gè)像素點(diǎn)的r和g的值;如果所得像素點(diǎn)的r和g值同時(shí)滿足如下條件:0.246<g<0.398;0.233<r<0.664;r<g;g>0.5×(1-r);則將該像素的灰度值設(shè)為255,否則,該像素的灰度值設(shè)為0,即得到二值化圖像;用如圖5-2所示的模板對(duì)圖像進(jìn)行卷積計(jì)算,得到每個(gè)像素點(diǎn)的新的灰度值result;再用一個(gè)3×3的模板,統(tǒng)計(jì)模板中result的值小于-5的個(gè)數(shù),記為positive;統(tǒng)計(jì)result的值大于5的點(diǎn)的個(gè)數(shù),記為negtive;若positive和negtive同時(shí)滿足如下條件:positive>2;negative>2;則該像素點(diǎn)的灰度值設(shè)為0,即為所要提取的內(nèi)輪廓;顯示人臉內(nèi)輪廓提取的結(jié)果。人臉內(nèi)輪廓提取算法流程圖如圖5-2-2所示初始化初始化獲取定位后的圖像參數(shù)獲取顏色表計(jì)算出r和g的值根據(jù)條件對(duì)圖像進(jìn)行二值化處理對(duì)圖像進(jìn)行卷積計(jì)算,得result的值統(tǒng)計(jì)3*3模板內(nèi)positive和negative的值,得到內(nèi)輪廓顯示結(jié)果結(jié)束圖5-2-25.2.3人臉內(nèi)輪廓提取實(shí)現(xiàn)結(jié)果運(yùn)行人臉內(nèi)輪廓提取程序,得到5-2-3的結(jié)果。圖5-2-35.3眼睛的識(shí)別與定位該模塊在人臉輪廓提取的基礎(chǔ)上,進(jìn)行雙眼的識(shí)別與定位。通過對(duì)人臉區(qū)域的擴(kuò)充,形成多個(gè)連通區(qū)域,再分析分人臉上頭發(fā)區(qū)域、眼睛區(qū)域的面積與位置準(zhǔn)則后即可對(duì)雙眼進(jìn)行定位,然后標(biāo)記出眼睛。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度房產(chǎn)股東債務(wù)承擔(dān)及風(fēng)險(xiǎn)合作協(xié)議范本3篇
- 二零二五年度汽車抵押貸款法律咨詢合同范例3篇
- 二零二五年度倉儲(chǔ)租賃及倉儲(chǔ)保險(xiǎn)合作協(xié)議3篇
- 二零二五年度國際勞務(wù)派遣與綠色出行協(xié)議3篇
- 2024版親屬間收養(yǎng)協(xié)議樣本版B版
- 二零二五年度國際快遞業(yè)務(wù)代理運(yùn)輸服務(wù)協(xié)議
- 背景信息在市場營銷中的作用研究
- 2024桿塔運(yùn)輸合同范本
- 二零二五年度影視制作場地借用及使用協(xié)議3篇
- 隨機(jī)算法在大數(shù)據(jù)中的應(yīng)用探索
- 壓鑄機(jī)結(jié)構(gòu)及原理2
- GB/T 29663-2013化妝品中蘇丹紅Ⅰ、Ⅱ、Ⅲ、Ⅳ的測定高效液相色譜法
- GA 1205-2014滅火毯
- 個(gè)人掃描的吳玉生楷書7000字
- 醫(yī)院污水處理工程施工組織設(shè)計(jì)
- 閘板防噴器使用手冊(cè) 精品
- 歡迎新同學(xué)幼兒園中小學(xué)開學(xué)第一課入學(xué)準(zhǔn)備ppt
- 金手指外觀檢驗(yàn)重點(diǎn)標(biāo)準(zhǔn)
- 新教材人教版高中化學(xué)選擇性必修1全冊(cè)各章節(jié)知識(shí)點(diǎn)考點(diǎn)重點(diǎn)難點(diǎn)歸納總結(jié)匯總
- 高級(jí)財(cái)務(wù)管理(第2版)-教學(xué)大綱
- 檔案保護(hù)技術(shù)概論期末復(fù)習(xí)資料教材
評(píng)論
0/150
提交評(píng)論