基于膚色相似度的人臉檢測(cè)與定位_第1頁(yè)
基于膚色相似度的人臉檢測(cè)與定位_第2頁(yè)
基于膚色相似度的人臉檢測(cè)與定位_第3頁(yè)
基于膚色相似度的人臉檢測(cè)與定位_第4頁(yè)
基于膚色相似度的人臉檢測(cè)與定位_第5頁(yè)
已閱讀5頁(yè),還剩34頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于膚色相似度的人臉檢測(cè)與定位摘要本課題致力于完成VisualC++6.0平臺(tái)下的人臉檢測(cè)與定位系統(tǒng),人臉檢測(cè)定位的算法限制于基于膚色相似度算法。要完成的工作包括相似度的計(jì)算,圖像的二值化,垂直直方圖和水平直方圖的獲取,人臉特征〔眼睛、嘴和鼻子〕的提取。本課題著重于膚色模型相似度在人臉檢測(cè)與定位中的應(yīng)用,對(duì)增加人臉檢測(cè)與定位的準(zhǔn)確率的研究有一定的指導(dǎo)意義。提出一種基于膚色的人臉檢測(cè)定位算法,設(shè)計(jì)了基于膚色的人臉檢測(cè)和定位系統(tǒng)。采用了臉部皮膚之間相似度的方法以及二值化方法,使用了基于邊界方法和基于區(qū)域方法相結(jié)合的算法,提取了眼睛、嘴和鼻子等關(guān)鍵特征,最終較好地實(shí)現(xiàn)了人臉定位。在MicrosoftWindows平臺(tái)上,利用VisualC++6.0開(kāi)發(fā)了軟件。本課題的成果具有一定的應(yīng)用價(jià)值。實(shí)驗(yàn)結(jié)果說(shuō)明,該軟件對(duì)于一定尺寸范圍內(nèi)清晰的正面人臉圖能夠正確檢測(cè)定位并提取特征,并且在速度和準(zhǔn)確性方面具有良好的性能。關(guān)鍵詞:圖像分割;人臉定位;膚色;人臉檢測(cè);特征提取DetectionandLocalizationofPersonFaceBasedonSkinColorSimilarityAbstractThistopicdevotestocompletingthedetectionandlocalizationsystemofthepersonfaceundertheVisualC++6.0platforms,andthedetectionlocalizationalgorithmofthepersonfacelimittobasingontheskincolorsimilarityalgorithm.Thetopicmustcompletesimilaritycomputation,binaryimageprocessing,verticalhistogram,horizontalhistogramandextractingpersonfacecharacteristic(eye,mouthandnose).Thistopicemphasizeapplicationofskincolormodelsimilarityinthedetectionandthelocalizationofpersonface,andhasasignificantinstructionforresearchofincreasingaccuracyindetectionandthelocalizationofpersonface.Inthispaper,theauthorshavepresentedanalgorithmanddesignedasystemforfacedetectionandlocationbasedoncomplexion.Bystrengtheningthecontrastbetweenfacefeaturesandbyadoptingbinaryimageprocessingmethod,thesystemhasimprovedthepreprocessingeffect;andbyusingboundary-basedalgorithmplusregion-basedalgorithm,thesystemhasrealizedfacelocationthroughtheextractionofthefeaturesofeyes,noseandmouth.TakingadvantagesofVisualC++6.0,theauthorshavealsodevelopedcorrespondingsoftwarebasedonMicrosoftWindows.Productionofthispaperhavedefiniteapplicationvalue.Experimentresultsprovethatthesystemisvalidindetecting,locatingandextractingfrontalviewfacefeaturesinacertainrange.Anditpossessfavorableperformanceinrapidityandaccuracy.Keywords:imagesegmentation;facelocalization;complexion;facedetection;featureex-traction目錄引言1第1章人臉檢測(cè)與定位概述21.1人臉檢測(cè)的定義、應(yīng)用及難點(diǎn)21.2人臉檢測(cè)的研究背景及現(xiàn)狀21.3本文研究的主要內(nèi)容3第2章基于膚色模型的人臉檢測(cè)42.1人臉檢測(cè)方法42.2基于膚色的人臉檢測(cè)42.2.1色彩空間的選擇42.2.2膚色模型52.3人臉膚色相似度的計(jì)算6第3章相似度根底上的人臉特征定位103.1人臉檢測(cè)與定位算法103.1.1人臉區(qū)域分割算法103.1.2人臉區(qū)域標(biāo)記算法123.1.3人臉檢測(cè)流程123.2人眼的檢測(cè)算法及標(biāo)定133.2.1有背景灰度人臉圖像中的人眼檢測(cè)與定位143.2.2眼睛的標(biāo)定153.3鼻子的標(biāo)定173.4嘴的標(biāo)定183.5設(shè)計(jì)結(jié)果及分析19結(jié)論與展望21致謝22參考文獻(xiàn)23附錄A引用的外文文獻(xiàn)及翻譯24附錄B參考文獻(xiàn)題錄及摘要27附錄C主要源程序29插圖清單圖2-1訓(xùn)練流程圖……………6圖2-2二值化流程圖………………………...7圖2-3原圖…………………...7圖2-4相似度圖……………...8圖2-5二值化圖……………...8圖2-6垂直直方圖…………...8圖2-7水平直方圖…………...9圖3-1人臉檢測(cè)與定位的總體流程……….10圖3-2人臉區(qū)域分割系統(tǒng)………………….10圖3-3區(qū)域分割算法流程………………….11圖3-4標(biāo)記人臉區(qū)域……………………….12圖3-5人臉檢測(cè)流程圖……………………..13圖3-6LOG算子…………….15圖3-7邊緣提取流程……………………….15圖3-8邊緣提取圖………….16圖3-9眼睛的定位………….16圖3-10眼睛標(biāo)記流程圖……………………17圖3-11眼睛標(biāo)記……………17圖3-12鼻子的標(biāo)記流程圖…………………18圖3-13鼻子標(biāo)記……………18圖3-14嘴巴標(biāo)記……………19圖3-15系統(tǒng)主界面…………19引言人臉檢測(cè)和定位是人臉識(shí)別中一個(gè)重要的組成局部,其檢測(cè)問(wèn)題卻是一個(gè)極賦挑戰(zhàn)性的課題。人臉是一個(gè)包含五官、毛發(fā)等的極不規(guī)那么的復(fù)雜待測(cè)目標(biāo),不同的人臉在形狀、大小、顏色、質(zhì)地等方面都有很大的變化;所考慮的檢測(cè)對(duì)象大多是由圖像捕捉設(shè)備所采集的數(shù)字圖。所以采集條件特別是光照條件包括光源的方向、明暗、色彩等都會(huì)對(duì)圖的效果產(chǎn)生很大的影響,進(jìn)而影響對(duì)人臉的檢測(cè);另外,人臉上還可能長(zhǎng)有胡須、戴有眼鏡等,這些也同樣是人臉檢測(cè)不可無(wú)視的因素。人臉檢測(cè)具有一定的難度和復(fù)雜性,對(duì)這一問(wèn)題的深入研究必將推動(dòng)模式識(shí)別等計(jì)算機(jī)科學(xué)的開(kāi)展。人臉的檢測(cè)問(wèn)題在近10年中得到了廣泛的關(guān)注,國(guó)內(nèi)外很多研究人士提出了很多方法,在不同領(lǐng)域取得了一定進(jìn)展。但是對(duì)于一種能夠普遍適用于各種復(fù)雜情況的,準(zhǔn)確率很高的檢測(cè)算法,還有很大的探索空間。本文利用VisualC++6.0開(kāi)發(fā)了人臉定位和特征提取的軟件,該軟件對(duì)于一定尺寸范圍內(nèi)清晰的正面人臉圖能夠正確檢測(cè)定位并提取特征。第1章人臉檢測(cè)與定位概述1.1人臉檢測(cè)的定義、應(yīng)用及難點(diǎn)人臉檢測(cè)(facedetection)是指在輸入圖中確定所有人臉(如果存在)的位置與大小。人臉檢測(cè)系統(tǒng)的輸入是可能包含人臉的圖,輸出是關(guān)于圖中是否存在人臉以及人臉的數(shù)目、位置、尺度、位姿等信息的參數(shù)化描述。人臉檢測(cè)問(wèn)題最初來(lái)源于人臉識(shí)別(facerecogznition)。人臉識(shí)別的研究可以追溯到20世紀(jì)60—70年代,經(jīng)過(guò)幾十年的曲折開(kāi)展已日趨成熟。人臉檢測(cè)是自動(dòng)人臉識(shí)別系統(tǒng)中的一個(gè)關(guān)鍵環(huán)節(jié),但是早期的人臉識(shí)別研究主要針對(duì)具有較強(qiáng)約束條件的人臉圖(如無(wú)背景的圖),往往假設(shè)人臉位置或很容易獲得,因此人臉檢測(cè)問(wèn)題并未受到重視。近幾年隨著電子商務(wù)等應(yīng)用的開(kāi)展,人臉識(shí)別成為最有潛力的生物身份驗(yàn)證手段,這種應(yīng)用背景要求自動(dòng)人臉識(shí)別系統(tǒng)能夠?qū)σ话悱h(huán)境下的圖像具有一定的適應(yīng)能力,由此所面臨的一系列問(wèn)題使得人臉檢測(cè)開(kāi)始作為一個(gè)獨(dú)立的課題受到研究者的重視。人臉檢測(cè)研究的就是如何從靜態(tài)圖或者視頻序列中找出人臉,如果存在人臉,那么輸出人臉數(shù)目、每個(gè)人臉的位置及大小。人臉檢測(cè)是人臉身份識(shí)別的前期工作,同時(shí)人臉檢測(cè)作為完整的單獨(dú)功能模塊,在智能視頻監(jiān)控、視頻檢索和視頻內(nèi)容組織等方面都有直接的應(yīng)用。人臉檢測(cè)的一個(gè)最重要的應(yīng)用是人臉識(shí)別技術(shù)。人臉識(shí)別技術(shù)的研究是本世紀(jì)計(jì)算機(jī)視覺(jué)領(lǐng)域最具挑戰(zhàn)性的研究課題之一,其應(yīng)用領(lǐng)域十分廣泛:可用于公安系統(tǒng)的罪犯身份識(shí)別、平安驗(yàn)證系統(tǒng)、信用卡驗(yàn)證、醫(yī)學(xué)、檔案管理、視頻會(huì)議、人機(jī)交互系統(tǒng)、駕駛執(zhí)照及護(hù)照等與實(shí)際持證人的核對(duì)、銀行及海關(guān)的監(jiān)控系統(tǒng)及自動(dòng)門(mén)衛(wèi)系統(tǒng)等。今天,人臉檢測(cè)的應(yīng)用背景已經(jīng)遠(yuǎn)遠(yuǎn)超出了人臉識(shí)別系統(tǒng)的范疇,在基于內(nèi)容的檢索、數(shù)字視頻處理、視覺(jué)監(jiān)測(cè)等方面有著重要的應(yīng)用價(jià)值。人臉檢測(cè)研究具有重要的學(xué)術(shù)價(jià)值,受到學(xué)者越來(lái)越多的關(guān)注。人臉檢測(cè)雖然有誘人的應(yīng)用前景,但是在現(xiàn)實(shí)中卻還沒(méi)有開(kāi)始大規(guī)模的使用。其主要原因之一就是用計(jì)算機(jī)自動(dòng)進(jìn)行人臉的檢測(cè)和識(shí)別十分困難,目前的檢測(cè)效果〔正確率、速度〕不如其他的生物識(shí)別技術(shù),如指紋識(shí)別,視網(wǎng)膜識(shí)別等等。人們?cè)谌粘I钪芯瓦M(jìn)行了大量的人臉檢測(cè)和識(shí)別工作,對(duì)人臉檢測(cè)與特征的定位取得了一定的成績(jī),但人臉檢測(cè)仍然存在著許多難點(diǎn)。人臉是一類(lèi)具有相當(dāng)復(fù)雜的細(xì)節(jié)變化的自然結(jié)構(gòu)目標(biāo),此類(lèi)目標(biāo)的檢測(cè)問(wèn)題的挑戰(zhàn)性在于:臉由于外貌、表情、膚色等不同,具有模式的可變性;一般意義上的人臉,可能存在眼鏡、胡須等附屬物;作為三維物體的人臉的影不可防止地受由光照產(chǎn)生的陰影的影響。因此,如果能夠找到解決這些問(wèn)題的方法,成功構(gòu)造出人臉檢測(cè),將為解決其它類(lèi)似的復(fù)雜模式檢測(cè)問(wèn)題提供重要的啟示。1.2人臉檢測(cè)的研究背景及現(xiàn)狀人臉檢測(cè)的研究歷史比擬悠久。高爾頓(Galton)早在1888年和1910年就分別在《Nature》雜志發(fā)表了兩篇關(guān)于利用人臉進(jìn)行身份識(shí)別的文章,對(duì)人類(lèi)自身的人臉識(shí)別能力進(jìn)行了分析。最早的研究論文見(jiàn)于1965年陳〔Chan〕和布萊索〔Bledsoe〕在PanoramicResearchInc.發(fā)表的技術(shù)報(bào)告,至今已有四十多年的歷史。近年來(lái),人臉檢測(cè)研究得到了諸多研究人員的青睞,涌現(xiàn)出了諸多技術(shù)方法。尤其是1990年以來(lái),人臉檢測(cè)更得到了長(zhǎng)足的開(kāi)展。幾乎所有知名的理工科大學(xué)和主要IT產(chǎn)業(yè)公司都有研究組在從事相關(guān)研究。人臉檢測(cè)研究的開(kāi)展主要分為以下幾個(gè)階段:第一階段〔1964年~1990年〕這一階段人臉檢測(cè)通常只是作為一個(gè)一般性的模式識(shí)別問(wèn)題來(lái)研究,所采用的主要技術(shù)方案是基于人臉幾何結(jié)構(gòu)特征〔Geometricfeaturebased〕的方法。人工神經(jīng)網(wǎng)絡(luò)也一度曾經(jīng)被研究人員用于人臉識(shí)別問(wèn)題中。這一階段是人臉檢測(cè)識(shí)別研究的初級(jí)階段,非常重要的成果不是很多,也根本沒(méi)有獲得實(shí)際應(yīng)用。第二階段〔1991年~1997年〕這一階段盡管時(shí)間相對(duì)短暫,但卻是人臉識(shí)別研究的高潮期,可謂碩果累累:不但誕生了假設(shè)干代表性的人臉識(shí)別算法,而且美國(guó)軍方還組織了著名的FERET人臉識(shí)別算法測(cè)試,并出現(xiàn)了假設(shè)干商業(yè)化運(yùn)作的人臉識(shí)別系統(tǒng),比方最為著名的Visionics〔現(xiàn)為Identix〕的FaceIt系統(tǒng)。這一階段的人臉識(shí)別技術(shù)開(kāi)展非常迅速,所提出的算法在較理想圖采集條件、對(duì)象配合、中小規(guī)模正面人臉數(shù)據(jù)庫(kù)上到達(dá)了非常好的性能,也因此出現(xiàn)了假設(shè)干知名的人臉識(shí)別商業(yè)公司。第三階段〔1998年~現(xiàn)在〕FERET’96人臉檢測(cè)識(shí)別算法評(píng)估說(shuō)明:主流的人臉識(shí)別技術(shù)對(duì)光照、姿態(tài)等由于非理想采集條件或者對(duì)象不配合造成的變化魯棒性比擬差。因此,光照、姿態(tài)問(wèn)題逐漸成為研究熱點(diǎn)。與此同時(shí),人臉識(shí)別的商業(yè)系統(tǒng)進(jìn)一步開(kāi)展。為此,美國(guó)軍方在FERET測(cè)試的根底上分別于2000年和2002年組織了兩次商業(yè)系統(tǒng)評(píng)測(cè)。目前非理想條件下〔尤其是光照和姿態(tài)〕、對(duì)象不配合、大規(guī)模人臉數(shù)據(jù)庫(kù)上的人臉識(shí)別問(wèn)題逐漸成為研究的熱點(diǎn)問(wèn)題。而非線性建模方法、統(tǒng)計(jì)學(xué)習(xí)理論、基于Boosting的學(xué)習(xí)技術(shù)、基于3D模型的人臉建模與識(shí)別方法等逐漸成為備受重視的技術(shù)開(kāi)展趨勢(shì)。目前國(guó)內(nèi)的,國(guó)外的對(duì)人臉檢測(cè)問(wèn)題的研究很多,比擬著名的有MIT,CMU等;清華大學(xué)、北京工業(yè)大學(xué)、中科院計(jì)算所和自動(dòng)化所等都有人員從事人臉檢測(cè)相關(guān)的研究。而且,MPEG7標(biāo)準(zhǔn)組織已經(jīng)建立了人臉識(shí)別草案小組,人臉檢測(cè)算法也是一項(xiàng)征集的內(nèi)容。隨著人臉檢測(cè)研究的深入,國(guó)際上發(fā)表的有關(guān)論文數(shù)量也大幅度增長(zhǎng),如IEEE的FG(IEEEInternationalConferenceonAutomaticFaceandGestureRecognition)、ICIP(InternationalConferenceonImageProcessing)、CVPR(ConferenceonComputerVisionandPatternRecognition)等重要國(guó)際會(huì)議上每年都有大量關(guān)于人臉檢測(cè)的論文,占有關(guān)人臉研究論文的近1/3之多。1.3本文研究的主要內(nèi)容本課題致力于完成VisualC++6.0平臺(tái)下的人臉檢測(cè)與定位系統(tǒng),人臉檢測(cè)定位的算法限制于基于膚色相似度算法。要完成的工作包括相似度的計(jì)算,圖像的二值化,垂直直方圖和水平直方圖的獲取,人臉特征〔眼睛、嘴和鼻子〕的提取。本課題著重于膚色模型相似度在人臉檢測(cè)與定位中的應(yīng)用,對(duì)增加人臉檢測(cè)與定位的準(zhǔn)確率的研究有一定的指導(dǎo)意義。第2章基于膚色模型的人臉檢測(cè)2.1人臉檢測(cè)方法人臉檢測(cè)傳統(tǒng)的方法多是在亮度空間進(jìn)行,僅有灰度信息的變化,沒(méi)有任何區(qū)域或比例的限制,所以必須做多尺度空間的全搜索,計(jì)算量非常大,而利用色度信息那么可大大降低搜索區(qū)域,其中膚色信息是最為直接有效的。而且在人臉區(qū)域中,膚色一定是占主導(dǎo)地位的像素色彩值。膚色雖然因人而異,但很多研究說(shuō)明膚色在色彩空間中的一定范圍內(nèi)還是呈聚類(lèi)特性的,特別是在排除了光照亮度和在經(jīng)過(guò)變換的色彩空間中。所以利用膚色這一線索可以排除掉在灰度圖像中很像人臉而對(duì)應(yīng)到彩色圖像中根本不是膚色的區(qū)域,這在人臉檢測(cè)中會(huì)起到積極的作用。目前人臉檢測(cè)方法主要可以分為以下4類(lèi):基于知識(shí)的方法:利用人臉的幾何形狀以及臉部器官的比例對(duì)稱(chēng)關(guān)系來(lái)定位人臉;基于特征的方法:直接利用人臉信息如膚色特征、輪廓特征、紋理特征等;基于模板的方法:使用模板在待測(cè)圖像中逐點(diǎn)掃描計(jì)算匹配度,根據(jù)匹配度來(lái)判斷有無(wú)人臉;基于外觀的方法:如神經(jīng)網(wǎng)絡(luò)法、支持向量機(jī)法、特征臉?lè)ǖ?。上述的各種方法都存在自身的優(yōu)缺點(diǎn)和適用領(lǐng)域,很多學(xué)者在各自所面臨的問(wèn)題范圍內(nèi)不斷探索,也創(chuàng)造了許多卓有成效的檢測(cè)算法。但各種檢測(cè)算法都存在效率與性能上的矛盾,也即在正確率、魯棒性能方面更好的算法往往會(huì)花費(fèi)更多的時(shí)間及系統(tǒng)消耗。在本文的設(shè)計(jì)中提出了一種基于膚色相似度的人臉檢測(cè)與定位的方法,采用了臉部皮膚之間相似度的方法以及二值化方法,使用了基于邊界方法和基于區(qū)域方法相結(jié)合的算法,提取了眼睛、嘴和鼻子等關(guān)鍵特征,最終較好地實(shí)現(xiàn)了人臉的檢測(cè)與定位。下面就介紹這種方法。2.2基于膚色的人臉檢測(cè)色彩空間的選擇根據(jù)計(jì)算機(jī)色彩理論,對(duì)一種顏色而言,在計(jì)算機(jī)中有不同的表達(dá)式,這樣就形成了各種不同的色彩空間,當(dāng)然各種色彩空間只不過(guò)是顏色在計(jì)算機(jī)內(nèi)的不同的表達(dá)形式而已,在具體的色彩空間中通過(guò)實(shí)踐找到膚色區(qū)間,建立起可操作性的膚色模型,這樣就讓膚色信息成為了人臉檢測(cè)的核心方法。不同膚色模型的建立基于不同的顏色空間,且為顏色空間的一個(gè)子空間。主要的彩色空間有以下幾種:RGB格式〔紅、綠、藍(lán)三基色模型〕、HIS格式〔色度、飽和度、亮度模型〕和YCbCr(YUV)格式。對(duì)于彩色空間來(lái)說(shuō),RGB是最常用的顏色表示系統(tǒng),但是人臉膚色在這一系統(tǒng)中的分布非常廣泛,因此不適合表示人臉區(qū)域,往往需要轉(zhuǎn)換到其他的彩色空間。在該文的設(shè)計(jì)中采用了YCbCr(YUV)格式。這種色彩空間是以演播室質(zhì)量標(biāo)準(zhǔn)為目標(biāo)的CCIR601編碼方案中采用的彩色表示模型,被廣泛地應(yīng)用在電視的色彩顯示等領(lǐng)域中。其優(yōu)點(diǎn)將在下一節(jié)介紹。通過(guò)下面的轉(zhuǎn)換公式,可以將像素由RGB空間轉(zhuǎn)換到Y(jié)CbCr空間。Y=0.299R+0.587G+0.114BCb=-0.1687R-0.3313G+0.5B+128〔2-1〕Cr=0.5R-0.4187G-0.0813B+128我們將統(tǒng)計(jì)采集到的多幅圖像人臉區(qū)域像素RGB值,按上式進(jìn)行轉(zhuǎn)換,統(tǒng)計(jì)在CbCr空間的分布概率,保存概率大于0.1的像素點(diǎn),得到膚色分布區(qū)域。最終,我們得到的膚色范圍是:Cb∈[90,125],Cr∈[135,165]。將膚色范圍內(nèi)的像素置1,其余置0,得到分割后的二值圖像,實(shí)現(xiàn)人臉的初步定位。膚色模型膚色是人臉一個(gè)重要而明顯的特征,利用膚色模型可以快速排除非膚色區(qū)域,大大減小搜索空間,提高人臉檢測(cè)的效率。1.光線補(bǔ)償處理考慮到膚色等色彩信息經(jīng)常受到光源顏色、圖像采集設(shè)備的色彩的偏差等因素的影響,而在整體上偏離本質(zhì)色彩而向某一方向移動(dòng),即我們通常所說(shuō)的色彩偏冷、偏暖,照片偏黃、偏藍(lán)等等,這種現(xiàn)象在藝術(shù)照片中更為常見(jiàn)。為了抵消這種整個(gè)圖像中存在著的色彩偏差,我們將整個(gè)圖像中所有像素的亮度(是經(jīng)過(guò)了非線性Y--校正后的亮度)從高到低進(jìn)行排列,取前5%的像素,如果這些像素的數(shù)目足夠多(例如,大于100),我們就將它們的亮度作為“參考白〞(ReferenceWhite),也即將它們的色彩的R、G、B分量值都調(diào)整為最大的255。整幅圖像的其他像素點(diǎn)的色彩值也都按這一調(diào)整尺度進(jìn)行變換。2.非線性分段色彩變換這是構(gòu)成我們實(shí)際利用膚色模型的主要局部。這一非線性分段色彩變換得到的膚色模型屬于色彩空間中的聚類(lèi)模型,這一類(lèi)膚色模型的建立首先要選取一種適宜的色彩空間,我們注意到Y(jié)CbCr色彩空間具有如下優(yōu)點(diǎn):YCbCr色彩格式具有人類(lèi)視覺(jué)感知過(guò)程相類(lèi)似的構(gòu)成原理;CbCr色彩格式被廣泛的應(yīng)用在電視顯示等領(lǐng)域中,也是許多視頻壓縮解碼,如MPEG,JPEG等標(biāo)準(zhǔn)中普遍采用的顏色表示格式;YCbCr色彩格式具有與HIS等其他一些顏色格式相類(lèi)似的將色彩中的亮度分量別離出來(lái)的優(yōu)點(diǎn);相比HIS等其他一些色彩格式,YCbCr色彩格式的計(jì)算過(guò)程和空間坐標(biāo)表示形式比擬簡(jiǎn)單;實(shí)驗(yàn)結(jié)果說(shuō)明在YCbCr色彩空間中膚色的聚類(lèi)特性比擬好。在YCbCr色彩空間中,膚色聚類(lèi)事兩頭尖的紡錘形狀,也就是在Y值較大和較小的局部,膚色聚類(lèi)區(qū)域也隨之縮減。由此可見(jiàn),在值較大和較小的局部,膚色聚類(lèi)區(qū)域也隨之縮減。由此可見(jiàn),在Y值不同的地方,我們對(duì)Cb-Cr子平面進(jìn)行投影,得到的結(jié)果是不同的,由此得到結(jié)論,簡(jiǎn)單地排除Y分類(lèi),按照傳統(tǒng)地做法在三維的Cb-Cr子平面中尋求膚色的聚類(lèi)區(qū)域是不可行的,我們必須考慮Y值不同造成的影響,從而對(duì)YCbCr色彩格式進(jìn)行非線性分段色彩變換。首先應(yīng)用膚色模型進(jìn)行人臉的初定位,接著提出了一種基于膚色區(qū)域分割方法得到包含人臉區(qū)域在內(nèi)的一系列矩形區(qū)域,從而進(jìn)行了定位。2.3人臉膚色相似度的計(jì)算該文設(shè)計(jì)的是基于人臉膚色模型,利用相似度方法,對(duì)人臉區(qū)域進(jìn)行了檢測(cè)和定位。我們定義r=R/(R+G+B),b=B/(R+G+B),這樣把三維的RGB降為二維。而在這個(gè)二維平面上,膚色區(qū)域服從高斯分布。我們可以采用訓(xùn)練的方法來(lái)計(jì)算得到一個(gè)分布中心,此過(guò)程主要生成可用于識(shí)別的參數(shù)。通常,在已有的樣本訓(xùn)練集根底上確定某個(gè)判定規(guī)那么,使得按此規(guī)那么對(duì)被識(shí)別對(duì)象進(jìn)行分類(lèi)所造成的錯(cuò)誤識(shí)別率最小或者結(jié)果期望最大。開(kāi)始訓(xùn)練命令,翻開(kāi)bmp格式的圖像后計(jì)算每幅圖像的像素?cái)?shù)CrList和CbList,然后查詢(xún)總的圖像數(shù)count用于將當(dāng)前數(shù)據(jù)庫(kù)內(nèi)的所有用戶(hù)圖片進(jìn)行訓(xùn)練,最后對(duì)每幅圖像求訓(xùn)練平均,得到可供識(shí)別比對(duì)的訓(xùn)練基。訓(xùn)練的過(guò)程如下圖:訓(xùn)練開(kāi)始訓(xùn)練開(kāi)始讀取用戶(hù)數(shù)量以及對(duì)應(yīng)的圖像數(shù)讀取用戶(hù)數(shù)量以及對(duì)應(yīng)的圖像數(shù)讀取下一個(gè)用戶(hù)的信息讀取下一個(gè)用戶(hù)的信息讀取下一幅圖像讀取下一幅圖像轉(zhuǎn)成灰階形式轉(zhuǎn)成灰階形式全部圖全部圖NY全部用戶(hù)N全部用戶(hù)Y保存訓(xùn)練基對(duì)每個(gè)人求保存訓(xùn)練基對(duì)每個(gè)人求訓(xùn)練平均圖2-1訓(xùn)練流程圖這樣訓(xùn)練以后,得到了Cb和Cr的均值為117.4361和156.5599,落在膚色范圍內(nèi),驗(yàn)證了理論的正確性。同樣也得到了膚色信息的均值M和方差C,為下一步計(jì)算相似度做了準(zhǔn)備。然后根據(jù)所考察的像素離中心遠(yuǎn)近得到膚色的相似度,得到與原圖相似的分布圖,均值M和方差C如下:M=E(x),C=E((x-M)(x-M)T),其中x=[r,b]T相似度計(jì)算公式為:P(r,b)=exp[-0.5(x-m)TC-1(x-m)]〔2-2〕關(guān)于相似度軟件的實(shí)現(xiàn)純粹是公式的實(shí)現(xiàn),在這就不做說(shuō)明了。再按照一定的規(guī)那么對(duì)該圖二值化,通過(guò)設(shè)置適宜的閾值〔關(guān)于最正確閾值的設(shè)置將在下一章中介紹〕,可將圖像變成只有0和1的二值圖像,這樣做的目的是為了減小計(jì)算量,加快處理速度,同時(shí),還可將目標(biāo)從背景中別離出來(lái),有效的突出了目標(biāo)。二值化流程如下:NNNY找到第一個(gè)像素的位置其灰度值>閾值灰度值=0灰度值=1查找下個(gè)像素結(jié)束圖2-2二值化流程圖按這種方法就可以對(duì)輸入的bmp圖像2-3進(jìn)行處理,圖2-3原圖其相似度計(jì)算結(jié)果如圖2-4示:圖2-4相似度圖可以給出二值化圖2-5示:圖2-5二值化圖以及垂直直方圖2-6示:圖2-6垂直直方圖水平直方圖2-7示:圖2-7水平直方圖至此完成了相似度的計(jì)算和圖像的二值化,以及兩種直方圖的提取,那么下一章節(jié)將在此根底之上進(jìn)行人臉區(qū)域的標(biāo)記和人臉特征〔眼睛、鼻子、嘴巴〕的提取。第3章相似度根底上的人臉特征定位在上一章得到的人臉區(qū)域根底上,對(duì)原圖像進(jìn)行灰度計(jì)算,將可能的眼睛區(qū)域分割成小圖像塊標(biāo)定人眼中心,從而在眼睛確定的情況下把鼻子和嘴巴提取出來(lái)??傮w流程如下:眼睛定位眼睛定位圖像灰度化圖像灰度化翻開(kāi)位圖翻開(kāi)位圖計(jì)算相似度標(biāo)記人臉圖像二值化計(jì)算相似度標(biāo)記人臉圖像二值化圖3-1人臉檢測(cè)與定位的總體流程下面將介紹人臉標(biāo)記和眼睛、鼻子、嘴巴定位的算法及其流程。3.1人臉檢測(cè)與定位算法人臉區(qū)域分割算法人臉區(qū)域分割的系統(tǒng)結(jié)構(gòu)如圖3-2所示:包含人臉區(qū)域在內(nèi)的一系列矩形區(qū)圖像中的膚色和非膚色象素點(diǎn)包含人臉區(qū)域在內(nèi)的一系列矩形區(qū)圖像中的膚色和非膚色象素點(diǎn)人臉區(qū)域分割算法人臉區(qū)域分割算法圖3-2人臉區(qū)域分割系統(tǒng)在圖3-2中,輸出的一系列矩形將取代原來(lái)的整幅圖像作為人臉檢測(cè)算法的輸入。這些矩形應(yīng)該滿足以下條件:矩形系列中應(yīng)該盡可能地包含待檢測(cè)圖像中的全部人臉對(duì)于距離較近或者是有接觸的多個(gè)人臉,分割后得到的膚色區(qū)域自然距離較近或者是連在一起,這時(shí)可以用一個(gè)矩形區(qū)域覆蓋它們。不漏檢、不降低正確率是膚色分割處理的前提,也是人臉區(qū)域分割算法的首要前提。據(jù)前面對(duì)膚色模型的分析,無(wú)論什么樣的膚色模型都存在判斷失誤,所以算法輸出的一系列矩形應(yīng)該盡量包含所有的人臉區(qū)域。矩形系列應(yīng)該少包含非膚色區(qū)域相對(duì)整幅圖像,經(jīng)過(guò)膚色分割預(yù)處理后的這一系列矩形的大小要明顯小于原來(lái)的整幅圖像,這是膚色分割預(yù)處理能夠提高人臉檢測(cè)算法時(shí)間效率的主要原因,也是膚色分割預(yù)處理能夠降低誤報(bào)率的關(guān)鍵。對(duì)于可能的人臉區(qū)域來(lái)說(shuō),其相對(duì)于水平方向的旋轉(zhuǎn)角度在45°到135°之間,因此旋轉(zhuǎn)角度小于45°或大于135°的區(qū)域?yàn)榉侨四槄^(qū)域。圖像分割的目的是把人臉的器官與臉的其他局部別離開(kāi)來(lái),并保證每個(gè)器官的完整性。在包含人臉的圖像中,臉部比擬明顯而易區(qū)分的特征主要是面部器官:眼睛、嘴、鼻子和眉毛。鼻子往往與臉的反差不大,因此通常用鼻孔代替。這幾個(gè)面部特征在灰度圖像中一般比周?chē)鷧^(qū)域暗。尤其是眼睛和嘴在絕大局部情況下都清晰可見(jiàn)。因此圖像分割可以利用的特征是:灰度比周?chē)鷧^(qū)域暗的區(qū)域。在設(shè)計(jì)中,為了減少圖像分割這一步的運(yùn)算量,對(duì)圖像做了二值化處理。分割的對(duì)象是黑白圖像,分割簡(jiǎn)化為找出所有黑色的連通區(qū)域,它們都成為人臉器官的候選者。從一幅圖中,按一定規(guī)那么劃分出感興趣的局部或區(qū)域稱(chēng)為分割。對(duì)于利用人臉各器官之間幾何關(guān)系的人臉定位方法來(lái)說(shuō),分割算法是十分重要的。在這里,感興趣的局部是人臉的器官(眼睛、嘴、眉毛、鼻子等等)。成功的分割算法能夠有效地把人臉器官和臉的其他局部別離開(kāi)來(lái),并且保持器官的完整性。設(shè)計(jì)采用了基于邊界的方法和基于區(qū)域的方法相結(jié)合的算法?;谶吔绶椒ㄊ翘崛∵吘墸眠吘夁M(jìn)行分割,該方法處理的像素?cái)?shù)量比擬少,各像素點(diǎn)間的相鄰關(guān)系比擬簡(jiǎn)單,處理速度比擬快,但是,基于邊界的方法是從局部特性來(lái)求圖像整體的分割,因此在全局宏觀性質(zhì)上不如基于區(qū)域的方法?;趨^(qū)域的方法那么是尋找互相連接在一起、并有相同特征的像素所形成的區(qū)域,它是實(shí)現(xiàn)圖像分割的一種重要方法。在本系統(tǒng)中,基于邊界的方法主要用于前期矩形序列的產(chǎn)生,快速地得到包含人臉區(qū)域的外接矩形;然后用基于區(qū)域的方法,,全局考慮,對(duì)初始矩形序列進(jìn)行區(qū)域歸并,得到最終的輸出矩形。算法的整體流程圖如圖3-4所示:輸入的經(jīng)過(guò)膚色分割的圖像輸入的經(jīng)過(guò)膚色分割的圖像去噪聲處理去噪聲處理提取邊界提取邊界對(duì)邊界的連通關(guān)系作處理對(duì)邊界的連通關(guān)系作處理由邊界的連通性和閉合性得到初始的一系列矩形由邊界的連通性和閉合性得到初始的一系列矩形將初始的矩形序列進(jìn)行歸并處理將初始的矩形序列進(jìn)行歸并處理輸出最終的矩形輸出最終的矩形圖3-3區(qū)域分割算法流程人臉區(qū)域標(biāo)記算法在標(biāo)記人臉之前,首先要對(duì)相似度圖像進(jìn)行二值化操作,這一局部已經(jīng)在前面一章中介紹了。接下來(lái)就要對(duì)人臉區(qū)域進(jìn)行檢測(cè),標(biāo)記人臉的過(guò)程實(shí)際上是對(duì)得到的二值化圖像進(jìn)行人臉邊界估計(jì)的過(guò)程。估計(jì)人邊界臉?biāo)惴ɡ昧巳四樀慕Y(jié)構(gòu)特征:人臉左右邊界膚色點(diǎn)個(gè)數(shù)約為人臉垂直方向最多膚色點(diǎn)個(gè)數(shù)的0.2~0.3倍;人臉上邊界膚色點(diǎn)個(gè)數(shù)應(yīng)該約為人臉區(qū)域?qū)挾鹊?.5倍;人臉區(qū)域高度約為人臉區(qū)域?qū)挾鹊?.5倍。首先估計(jì)人臉的左右邊界,具體算法如下:搜索垂直方向具有最多灰度值為0的點(diǎn)(白點(diǎn),即可能的人臉)的x坐標(biāo)pos,并將白點(diǎn)數(shù)目計(jì)為count;從pos開(kāi)始往左邊搜索得到垂直方向第一次具有小于0.2count個(gè)白點(diǎn)的x坐標(biāo)作為人臉區(qū)域的左邊界left;pos開(kāi)始往右邊搜索,得到垂直方向第一次具有小于0.3count個(gè)白點(diǎn)的x坐標(biāo)作為人臉區(qū)域的右邊界right。接著估計(jì)人臉的上下邊界,具體算法如下:從上往下搜索水平方向的白點(diǎn)數(shù),得到第一次具有大于0.5(right-left)個(gè)白點(diǎn)的y坐標(biāo)作為人臉區(qū)域的上邊界top;根據(jù)人臉結(jié)構(gòu)特征,將top+1.5(right-left)作為人臉區(qū)域的下邊界bottom。從而,可以確定人臉區(qū)域?yàn)閞ect(left,top,right,bottom)。標(biāo)定的人臉區(qū)域如圖3-5所示。從圖可以看出,經(jīng)過(guò)相似度計(jì)算和二值化操作,然后對(duì)人臉進(jìn)行邊界估計(jì),最后進(jìn)行標(biāo)定,根本上做到了。圖3-4標(biāo)記人臉區(qū)域人臉檢測(cè)流程整個(gè)基于膚色模型的人臉檢測(cè)的流程如下:原始圖像原始圖像膚色檢測(cè)皮膚圖像皮膚圖像濾波和填充修正后的皮膚圖像修正后的皮膚圖像檢查每個(gè)皮膚區(qū)域皮膚像素與整個(gè)矩形面積的比找到該區(qū)域的外接矩形皮膚像素與整個(gè)矩形面積的比非人臉小于固定值非人臉矩形面積小于固定值矩形面積非人臉?lè)侨四槾笥诠潭ㄖ禈?biāo)準(zhǔn)候選人臉標(biāo)準(zhǔn)候選人臉在原始圖像相同位置得到矩形,進(jìn)行放縮、直方圖均衡化等處理候選人臉候選人臉圖3-5人臉檢測(cè)流程圖3.2人眼的檢測(cè)算法及標(biāo)定因?yàn)槿四樀奈骞傥挥谀槻宽旤c(diǎn)與下巴點(diǎn)之間,將搜索范圍設(shè)為一矩形區(qū)域,矩形的長(zhǎng)為臉部頂點(diǎn)與下巴點(diǎn)的距離,矩形的寬即是臉寬。標(biāo)記人臉區(qū)域以后,就可以進(jìn)行邊緣提取,接著標(biāo)記眼睛,由人臉各特征的位置關(guān)系,就可以從上到下區(qū)分出眼睛、鼻子、嘴等特征。假設(shè)人臉的姿勢(shì)比擬正,那么人臉上的特征是水平邊緣集中的區(qū)域。我們可以在低分辨率下提取水平邊緣,然后找到人臉區(qū)域內(nèi)富含這些邊緣的連通區(qū),作為人臉特征的候選區(qū)域。這些區(qū)域的位置和大小并不準(zhǔn)確,因?yàn)檫吘墮z測(cè)本身容易出現(xiàn)位置偏移,連通區(qū)的大小也隨著閾值而變化。所以還要進(jìn)一步修正上面的結(jié)果。對(duì)正面的人臉來(lái)說(shuō),眼睛、鼻子等特征和整個(gè)人臉的尺寸大小之間存在先驗(yàn)的約束關(guān)系,這就是人臉結(jié)構(gòu)的恒常性,因此我們利用這些約束關(guān)系來(lái)確定特征區(qū)域的大小。〔因?yàn)橄日已劬?,我們就以眼睛的大小為?zhǔn),最后在調(diào)整嘴巴的大小〕。人臉是一種特殊的模式,而人的雙眼與眉毛、鼻、口按一定的結(jié)構(gòu)分布在灰度根本均勻的人臉平面上,人臉這種特殊模式與圖像背景模式大相徑庭,從而為判別人的雙眼位置提供了依據(jù)。尋找最正確分割閾值使人眼從復(fù)雜圖像背景和人臉中別離出來(lái)是人眼定位的第一步。所謂最正確分割閾值指的是能將眼睛虹膜、瞳孔、上眼框與眉毛以及其它人臉部位、背景物明顯別離的灰度分割閾值。由于眼睛虹膜、瞳孔部位的灰度值明顯比其鄰近區(qū)域(眼部周?chē)つw、眼白)灰度值要低,因此能夠從適當(dāng)光照條件下拍照的圖像中分割眼睛虹膜、瞳孔部位的灰度值總是存在的,并且不是唯一的,而是有一定的小范圍。然而尋找這樣的最正確分割閾值并不是一件容易的事,眼睛虹膜、瞳孔部位及其鄰近區(qū)域的灰度值會(huì)因人而異,并隨光照條件、帶眼鏡時(shí)鏡片的反光而變化,加上復(fù)雜背景的變化,使得最正確分割閾值的估計(jì)十分困難,但通過(guò)圖像灰度直方圖分析和統(tǒng)計(jì)的方法,對(duì)最正確分割閾值可能所在的灰度區(qū)間進(jìn)行粗估計(jì)還是可以做到的。經(jīng)對(duì)多幅在復(fù)雜背景及不同光照條件下人臉圖像的直方圖分析與統(tǒng)計(jì)發(fā)現(xiàn),只要臉部光照適中,雙眼部位較清晰,絕大多數(shù)情況下最正確分割閾值位于歸一化灰度值0.1與0.6之間。假設(shè)選擇固定的背景和光照條件,由統(tǒng)計(jì)的方法可估計(jì)出更小的最正確分割閾值可能所在的區(qū)間。另外,利用直方圖均衡方法也可使輸入圖像的最正確分割閾值可能所在的區(qū)間縮小。有背景灰度人臉圖像中的人眼檢測(cè)與定位首先用某一分割閾值Threshold將包含人臉的灰度圖像二值化,去除二值化圖像中小的黑斑點(diǎn),再對(duì)二值化圖像中黑色塊進(jìn)行標(biāo)記、計(jì)算每塊面積(像素?cái)?shù))、確定每塊的外接矩形位置及寬高。人眼位置的判定是根據(jù)眼睛在二值化人臉圖像中的幾何位置確定的,主要有以下幾條準(zhǔn)那么:雙眼中心距應(yīng)在某個(gè)范圍內(nèi):考慮到人臉在圖像中大小的變化,雙眼中心距變化大約在一定像素距離范圍內(nèi);雙眼下方一定距離內(nèi)不能有其它黑塊:雙眼下方一定距離內(nèi)沒(méi)有其它器官,因此在二值化圖像中不能有其它黑塊,這一特點(diǎn)也是區(qū)分眉毛與眼睛的重要判據(jù);雙眼中心位置上下相差不超過(guò)一定距離:由于人臉在圖像中可能向兩側(cè)傾斜,雙眼中心位置常常不在水平線上。作為判據(jù),允許人臉在一定程度上向兩側(cè)傾斜,雙眼中心位置在垂直方向相差不超過(guò)一定距離(如15個(gè)像素距離);眼睛黑塊所包含的像素?cái)?shù)應(yīng)在某個(gè)范圍內(nèi):二值化圖像中眼塊所包含的像素?cái)?shù)應(yīng)在某個(gè)范圍內(nèi)(如5~50個(gè)像素),太大的黑塊不太可能是眼塊;眼睛黑塊的外接矩形應(yīng)是一寬大于高的矩形或接近于正方形:由于眼睛的結(jié)構(gòu)特點(diǎn),二值化圖像中眼塊的外接矩形常常是一寬大于高的矩形或接近于正方形,眼塊的幾何中心位于圓形的眼睛虹膜(含瞳孔)位置,高遠(yuǎn)大于寬的外接矩形對(duì)應(yīng)的黑塊不可能是眼塊;與圖像四邊接壤或非常接近的黑塊不是眼塊:由于拍攝人臉圖像時(shí),要求人臉在照片中應(yīng)完整,且較靠近圖像中心,因此在二值化圖像中與圖像四邊接壤或非常接近的黑塊不是眼塊。為了能從粗估計(jì)的分割閾值區(qū)間中找到最正確分割閾值,我們提出了結(jié)合找人眼位置過(guò)程的自動(dòng)調(diào)整法。選擇一適當(dāng)?shù)拈撝?,從初始閾值T0=0.1遞增(在T0到Tmax=0.6區(qū)間搜索),以每一新的閾值Threshold二值化人臉灰度圖像,并按上述人眼位置判定準(zhǔn)那么檢測(cè)人眼黑塊是否出現(xiàn)。隨著閾值的不斷增加,可以看到二值化人臉圖像中新黑塊在不斷地出現(xiàn),已有的黑塊面積在擴(kuò)展并不斷地與別的黑塊相重合。一旦在某個(gè)閾值下檢測(cè)到雙眼黑塊出現(xiàn),此時(shí)的閾值即為最優(yōu)分割閾值,檢測(cè)到的人眼黑塊的幾何中心也應(yīng)接近于虹膜(瞳孔)中心(這是因?yàn)榉指铋撝翟酱?,眼塊可能由無(wú)到有,由小到大,此時(shí)最先出現(xiàn)的應(yīng)是具有較低灰度值的瞳孔和虹膜所對(duì)應(yīng)的黑塊)。眼睛的標(biāo)定由于眼睛和膚色的差異較大,在上一章人臉區(qū)域二值化的根底上,再進(jìn)行邊緣檢測(cè)。所謂的邊緣就是圖像的最根本特征,是指圖像周?chē)笏鼗叶扔须A躍變化和屋頂變化的像素的集合;是由灰度的不連續(xù)性反映的。邊緣廣泛存在于物體與背景之間、物體與物體之間、圖像基元與基元之間。它是圖像分割所依賴(lài)的重要特征。經(jīng)典的邊緣提取方法是考慮圖像的每個(gè)像素在某個(gè)領(lǐng)域灰度的變化,利用邊緣臨近的一階或二階方向?qū)?shù)變化規(guī)律,進(jìn)行局部梯度運(yùn)算。求梯度根據(jù)濾波算子的不同可以分為好多種。通過(guò)對(duì)處理后的圖像進(jìn)行研究比照發(fā)現(xiàn):拉普拉斯高斯算子既具備了高斯算子的優(yōu)點(diǎn)又具備了拉普拉斯算子的優(yōu)點(diǎn)在邊緣檢測(cè)中不但對(duì)灰度漸變和噪聲較多的圖像處理最好,而且是各向同性的,得到的處理后的圖像具有連貫性和高清晰度。常用的5X5LOG算子如下列圖:-2-4-4-4-2-4080-4-48248-4-4080-4-2-4-4-4-2圖3-6LOG算子LOG算子首先用高斯函數(shù)對(duì)圖像進(jìn)行低通濾波消除空間尺度遠(yuǎn)小于高斯空間常數(shù)的圖像強(qiáng)度變化即去除噪聲,然后用拉普拉斯算子進(jìn)行高通濾波提取線特征在一個(gè)灰度均勻區(qū)域的邊緣處LOG算子有以下表現(xiàn):邊緣以外灰度均勻處取零,邊緣較暗一側(cè)取正,邊緣較亮一側(cè)取負(fù),邊緣中某些點(diǎn)處取零。用LOG算子提取邊緣流程為:膚色區(qū)域用LOG用LOG算子進(jìn)行邊緣提取是否為邊緣?NY是否為邊緣?處理為白色處理為黑色處理為白色處理為黑色圖3-7邊緣提取流程這樣就可以將人臉的整個(gè)邊界的輪廓大致地提取出來(lái)了。其邊緣提取結(jié)果如下:圖3-8邊緣提取圖然后對(duì)邊緣檢測(cè)的結(jié)果進(jìn)行水平方向的投影,根本能確定眼睛的兩個(gè)范圍I和II。這里雖然有眉毛的影響,但是由于眉毛正好位于眼睛的上方,因此不影響水平區(qū)域確實(shí)定,如圖示:ABIIIABIII右眼眉毛左眼眉毛右眼眉毛左眼眉毛左眼右眼左眼右眼圖3-9眼睛的定位然后在I和II的上方區(qū)域的豎直方向投影,得到的第一個(gè)峰值附近的區(qū)域A、B。然后在A與I以及B與II確定的兩個(gè)矩形區(qū)域內(nèi),對(duì)黑點(diǎn)進(jìn)行區(qū)域膨脹,可以得到的眼睛的大致輪廓和左右眼角,然后黑點(diǎn)的坐標(biāo)的平均值作為瞳孔的位置。具體算法是:在確定的人臉區(qū)域,把人臉局部劃分為左右、上下四等份,再把人臉寬度12等份,每一份為nSlidWinWidth和人臉高度30等份,每一份為nSlidWinHeight。由經(jīng)驗(yàn)可知:人眼只可能位于人臉上半局部的下9/15區(qū)域內(nèi),在這個(gè)區(qū)域內(nèi)找白色像素的個(gè)數(shù)當(dāng)它大于nSlidWinWidth*nSlidWinHeight/3時(shí),可把參考位圖的像素變?yōu)榧t色。這樣就把眼睛區(qū)域劃分為很多的小區(qū)域,在把這些區(qū)域中寬度小于人臉寬度的1/20刪除掉,然后在合并相鄰的閉合區(qū)域〔小于人臉寬度的1/40〕,這樣就可確定人眼的水平區(qū)域。以同樣的方法:去除掉小于人臉高度的1/100的區(qū)域,然后在合并區(qū)域〔小于人臉高度的1/100〕,這樣就可以確定人眼的垂直區(qū)域。在確定的人眼范圍內(nèi),標(biāo)定出左右眼角和眼睛的位置。眼睛標(biāo)定的流程為:確定人臉區(qū)域確定人臉區(qū)域邊緣檢測(cè)邊緣檢測(cè)確定人眼的水平區(qū)域確定人眼的水平區(qū)域確定人眼的垂直區(qū)域確定人眼的垂直區(qū)域標(biāo)記左右眼角和眼睛的位置標(biāo)記左右眼角和眼睛的位置圖3-10眼睛標(biāo)記流程圖標(biāo)記效果如圖:圖3-11眼睛標(biāo)記3.3鼻子的標(biāo)定在確定了眼睛的位置以后,鼻子的位置也就相應(yīng)地定位下來(lái)了。以?xún)裳鄣耐酁?來(lái)計(jì)算,鼻子到兩眼中心的距離為0.7到1,在附近尋找顏色較深的區(qū)域,根本得到鼻孔的位置。然后在鼻孔上方一定范圍內(nèi)〔鼻孔距離的1/2左右〕找到亮度最高的點(diǎn)作為鼻尖。其算法流程為:確定眼睛區(qū)域確定眼睛區(qū)域可能的鼻子區(qū)域可能的鼻子區(qū)域找出鼻尖找出鼻尖確定鼻孔的位置確定鼻孔的位置標(biāo)記鼻孔標(biāo)記鼻孔圖3-12鼻子標(biāo)記流程圖標(biāo)記的結(jié)果如圖示:圖3-13鼻子標(biāo)記3.4嘴的標(biāo)定嘴確實(shí)認(rèn)考慮到唇色和位置兩重信息。對(duì)于唇色,滿足如下限制條件的位于臉的下部區(qū)域可能是嘴:〔3-1〕嘴到兩眼中心的距離可能為1.0到1.3左右,在滿足條件的區(qū)域采用類(lèi)似找眼睛的方法,區(qū)域膨脹,確定左右嘴角和嘴的中心。其結(jié)果如圖3-14示:圖3-14嘴巴標(biāo)記3.5設(shè)計(jì)結(jié)果及分析設(shè)計(jì)程序的主界面如下:圖3-15系統(tǒng)主界面單擊翻開(kāi)圖像翻開(kāi)一幅人臉圖像,然后用上述界面進(jìn)行相似度計(jì)算,圖像二值化、垂直直方圖、水平直方圖、標(biāo)記人臉區(qū)域,接著可以依次標(biāo)記眼睛的位置和鼻子的位置的特征標(biāo)注。在MicrosoftWindows平臺(tái)上,利用VisualC++6.0實(shí)現(xiàn)了以上算法。使用此算法對(duì)多幅人臉圖像進(jìn)行了處理,所采用的圖像都是在正常光照以及室內(nèi)條件下所攝取的正面人臉圖片(其相對(duì)于水平方向的旋轉(zhuǎn)角度在45°到135°之間),并具有各種背景,上面的算法能成功地檢測(cè)定位多張人臉圖,本設(shè)計(jì)結(jié)果的正確檢測(cè)率到達(dá)90%以上。然而由于人臉拍攝的環(huán)境不同,也給系統(tǒng)帶來(lái)了一些問(wèn)題。該軟件與人臉的外界光照條件、人臉的拍攝角度以及是否帶眼鏡有關(guān),易受人臉模式的多樣性(如胡須、眼鏡等)、圖像獲取過(guò)程中的不確定性(如光照的強(qiáng)度、光源方向等)等因素的影響?;谀w色的人臉檢測(cè)和定位算法分析:統(tǒng)計(jì)出一般的人臉區(qū)域中膚色像素所應(yīng)占的百分比,然后具有較高的檢測(cè)成功率;利用這一百分比作為閾值對(duì)檢測(cè)算法得到的候選臉區(qū)域進(jìn)行驗(yàn)證,從而排除了膚色像素?cái)?shù)不滿足這一閾值的候選臉;采用了增強(qiáng)人臉特征與臉部皮膚之間比照度的方法,以及改良的對(duì)人臉圖像進(jìn)行二值化處理,減少了運(yùn)算量。結(jié)論與展望通過(guò)基于膚色的人臉檢測(cè)、定位等操作,可以較好地定位人臉的識(shí)別區(qū)域。文中給出了人臉?lè)指?、檢測(cè)算法、關(guān)鍵器官定位等主要算法。經(jīng)過(guò)改良二值化處理,對(duì)于全局閾值占有很大比重的情形,可以較好地解決圖像的二值化,為進(jìn)一步的人臉識(shí)別奠定了根底。本設(shè)計(jì)耗時(shí)數(shù)月,最后完成了所要求的功能??偨Y(jié)下來(lái),主要優(yōu)點(diǎn)如下:界面人性化,容易操作;對(duì)用戶(hù)的添加、錄入、刪除十分方便;在光照適當(dāng)、人臉位姿恰當(dāng)時(shí),識(shí)別率可以到達(dá)100%;模塊化編程,可擴(kuò)充性好,以后可以添加進(jìn)一步的功能。當(dāng)然,系統(tǒng)也有它的缺點(diǎn),主要是下面的兩點(diǎn):訓(xùn)練時(shí)間過(guò)長(zhǎng),不能動(dòng)態(tài)的添加用戶(hù);魯棒性較差,環(huán)境光照的改變會(huì)影響識(shí)別率。基于這些優(yōu)缺點(diǎn),今后如果要進(jìn)行改良,首先解決的問(wèn)題必然是魯棒性的問(wèn)題。如何將光照對(duì)識(shí)別的影響減小到最少,是一個(gè)很有難度的問(wèn)題。目前的去光照處理的效果并不令人滿意,白平衡處理那么只能對(duì)總體進(jìn)行小幅度的修正,不能解決光照造成的左右不平衡的問(wèn)題。當(dāng)然也可以從其它角度解決這個(gè)問(wèn)題,例如將攝像頭和燈光結(jié)合,使得每次識(shí)別的主光源都位于正前方。其次是增加對(duì)側(cè)面臉進(jìn)行識(shí)別的功能。我們知道人類(lèi)對(duì)人臉的識(shí)別能力遠(yuǎn)遠(yuǎn)超過(guò)正面,而是可以從正面到側(cè)面的各種角度進(jìn)行區(qū)分。如何使得計(jì)算機(jī)也能對(duì)側(cè)面臉進(jìn)行檢測(cè)識(shí)別也是目前研究的一個(gè)熱點(diǎn)??尚械姆椒ㄖ皇鞘褂萌S的人臉模型,當(dāng)模型足夠細(xì)膩的時(shí)候,就可以模擬出人臉各個(gè)角度的圖像。致謝大學(xué)四年的光陰如白駒過(guò)隙,轉(zhuǎn)瞬即逝。想想自己即將踏出寧?kù)o而優(yōu)美的校園,也許這一生的學(xué)生生活就這樣結(jié)束了。不禁生起一絲悲涼之意。在這四年中我根本完成當(dāng)時(shí)還是在遙遠(yuǎn)的大一時(shí)定下的目標(biāo),可以這么說(shuō)我能有今天的一切,跟母校-老師們是別離不開(kāi)的!在這里我深深說(shuō)一句:親愛(ài)的老師們謝謝你!尤其是在最后的半學(xué)期里,得到了老師的熱情指導(dǎo),對(duì)本文的算法、編撰和定稿不吝賜教,使我看到了一個(gè)搞科學(xué)研究的學(xué)者應(yīng)有的作風(fēng),為以后的我真正的走上工作崗位—搞研發(fā)時(shí)應(yīng)怎樣處理類(lèi)似的工作奠定了根底。在這還要感謝那些曾做過(guò)和我一樣課題的前輩們,正是看了關(guān)于你們?nèi)四槞z測(cè)與定位的專(zhuān)著和論文后才啟發(fā)了我怎樣進(jìn)行人臉檢測(cè)、怎么樣的算法才是最合理的??梢哉f(shuō)在拿到這個(gè)課題時(shí),我可是一臉的朦朧,正是你們的著作在我做畢業(yè)設(shè)計(jì)的過(guò)程中敲打著我,時(shí)刻啟迪我。謝謝你們!致謝人:2007年6月17日參考文獻(xiàn)[1]王天學(xué),刑桂芬,江波.基于區(qū)域分割的復(fù)雜背景中的人臉檢測(cè)與定位[J].計(jì)算機(jī)工程與設(shè)計(jì),2004,11(25):1-3[2]王學(xué)武,石躍祥.基于眼睛特征的人臉檢測(cè)方法[J].計(jì)算機(jī)應(yīng)用研究,2006年,1(1):1-3[3]王春紅,楊伯原,張洛平,張波.B超圖像邊緣檢測(cè)算法分析及C++實(shí)現(xiàn)[J].河南科技大學(xué)學(xué)報(bào)〔自然科學(xué)版〕,2006,2(27):1-3[4]王鄭耀.數(shù)字圖像的邊緣檢測(cè),西安交通大學(xué)本科畢業(yè)論文[D],2003年6月[5]朱文佳,戚飛虎.快速人臉檢測(cè)與特征定位[J].中國(guó)圖像圖形學(xué)報(bào),2005,11(10):1-4[6]吳為.人臉識(shí)別的軟件系統(tǒng)開(kāi)發(fā),復(fù)旦大學(xué)工學(xué)學(xué)士學(xué)位論文[D],2005年6月[7]張宏林.VisualC++數(shù)字圖像模式識(shí)別技術(shù)及工程實(shí)踐[C].北京:人民郵電出版社,2003[8]張永梅,韓焱,商細(xì)云.一種人臉的檢測(cè)與定位方法[J].中北大學(xué)學(xué)報(bào)〔自然科學(xué)版〕,2006,3(27):1-5[9]張敏,陶亮.人臉圖像中人眼的檢測(cè)與定位[J].光電工程,2006,8(33):1-6[10]郭瑞,張淑玲,汪小芬.人臉識(shí)別特征提取方法和相似度匹配方法研究[J].計(jì)算機(jī)工程,2006,11(32):1-2[11]黃翠榮,嚴(yán)佩敏,時(shí)鹿鳴.基于方差相似度計(jì)算的人臉識(shí)別技術(shù)[J].上海大學(xué)學(xué)報(bào)(自然科學(xué)版),2003,12(4):1-4[12]梁路宏,艾海舟,徐光佑,張鈸.人臉檢測(cè)研究綜述[J].電子學(xué)報(bào),2001,29〔6〕:744-747[13]謝建新.數(shù)字視頻采集與目標(biāo)跟蹤,華僑大學(xué)本科畢業(yè)論文[D],2004年6月[14]蔡照.利用delphi6實(shí)現(xiàn)拉普拉斯高斯邊緣檢測(cè)算法[J].圖形圖像處理與游戲編程,2006,7(11):1-2[15]裘偉.一種基于相似度及復(fù)雜度人眼定位算法[J].蘇州大學(xué)學(xué)報(bào)〔工科版〕,2006,6(26):1-4[16]S.Phimoltares,C.Lursinsap,K.ChamnongthaiFacedetectionandfacialfeaturelocalizationwithoutconsideringtheappearanceofimagecontext[J].ImageandVisionComputing25(2007)741–753附錄A引用的外文文獻(xiàn)及翻譯Facedetectionandfacialfeaturelocalizationwithoutconsideringtheappearanceofimagecontext2.OurmethodologyInthisSection,weintroduceourmethodtoprocessthefrontal-viewfaceimagesfortheextractionofheadboundary,faceboundary,andfacialfeaturesincludingeyeswitheyebrows,nostrils,andmouth.Headboundaryistheouterprofileofheadincluding,shouldersFaceboundaryisthefacecontourthatexcludeshair,shoulders,andneck.Weuserectangularboxestolocatefacialfeatures.2.1.SmoothingandthresholdingTheschemediagramofthedouble-thresholdmethodisshowninFig.1.Thefirststepistoreducenoisebyusinga3?3medianfilter.Afterthat,anedgeoperatorisapplied.WetestedtheedgedetectiontechniquebyWechslerandKidode[13]andtheresultisshowninFig.2.Theedgeoutputappearstoothinandthetop-faceboundaryistooweaktobedetectedinthelatershareholdingprocedure.Inordertoobtainfatboundary,JianmingHuetal.[14]proposedfourmasks(horizontal(size3?7),vertical(7?3),45_(9?3),and135_(9?3))todetectimageedgesandselectthemaximumastheedgestrength.Insteadofusinglargesizes,wedevelopsmallersizesofmasksasshowninFig.3foredgedetection.Experimentalresultsshowthatourmethodisasgoodastheirmethod.Thresholdingisperformedtotransformthegray-leveledgeimagesintobinary.Thehighthresholdvalueisdeterminedbychoosingallthehighintensitypixelsthatoccupy5%oftheentirepixels.Thelowthresholdvalueisdecidedbychoosingallthehighintensitypixelsthatoccupy25%oftheentirepixels.Thehighthresholdedimageisusedtoobtaintheheadboundaryandthelowthresholdedimageisusedtoproducethefaceboundary.Thesethresholdingpercentagesaredeterminedbasedonourempiricaldatainordertoachievethebestresults.2.2.TracingheadandfaceboundariesInordertotracetheheadboundary,wedividethehigh-thresholdimageintoleftandrighthalves.Whenwescantheedgeimagefromtoptobottom,thefirstlayerofthecontouroccurredistheheadboundaryandthesecondlayerofthecontouroccurredisthefaceboundary.Fortracingtheheadboundary,astartingpointislocatedasthefirstwhitepixelonthefirstlayerofthelefthalf.Fromthestartingpoint,wetracetheleftandrightprofilesofhead.Becausetheouterboarderofthefirstlayerisshiftedoutwardsfromtheactualboundaryforafewpixels(say,p),weadjusttheedgeofthelefthalftotherightandtheedgeoftherighthalftotheleftbyppixelsrespectively.Becausesomefaceprofilesdisappearinthehighthresholdedimage,thelowthresholdedimageisusedtotracefaceboundary.Theheadbordersareremovedandamorphologicalopeningisusedtoeliminateunnecessarynoises.Afterthat,theimageisscannedfromfourdirections(righttoleft,lefttoright,toptobottom,andbottomtotop)toproducethefaceboundary.2.3.LocatefacialfeaturesInordertoidentifyfacialfeatures,wefirstextracttheircandidates.Thecandidatesareextractedbyoverlayingthefaceboundaryobtainedfromtheprevioussectiononthebinaryedgeimage,andconvertingallthewhitepixelsinthebinaryedgeimagethatareonoroutsidethefaceboundarytoblack.Afterthat,weapplyx-andy-projectionstolocatefacialfeatures.Inthecandidateimage,weusex-projectiontoobtainthefacialfeatures’horizontallocationsandy-projectiontoobtaintheirverticallocations.Bycombiningthehorizontalandverticallocations,wecanobtainfourrectangularboxes:twoforeyes,onefornostrils,andoneformouth.譯文不用考慮面部?jī)?nèi)容的人臉檢測(cè)與定位2我們的方法在這個(gè)局部,我們介紹我們的方法處理前面對(duì)人臉圖像的看法,從而來(lái)提取頭頂區(qū)域、面孔區(qū)域,并且面部特征包括眼睛以及眼眉、鼻孔,和嘴.頭頂區(qū)域是頭外面外形,包括肩膀。面孔區(qū)域是排除頭發(fā)、肩膀和脖子的面孔等高。我們使用直方圖定位面部特征。2.1平滑和閾值使用雙重閾值法如下圖。第一步將使用3x3的中值濾波器來(lái)減少噪聲,在這以后進(jìn)行邊緣操作。我們使用Wechsler和Kidode的方法來(lái)測(cè)試邊緣檢測(cè)技術(shù)的可靠性,結(jié)果在圖2中顯示。邊緣檢測(cè)結(jié)果看上去太稀薄而且人臉頂部區(qū)域太微弱以至于不能夠被閾值程序所檢測(cè)。為了獲得圓潤(rùn)的界限,JianmingHu等[14]提出了四個(gè)面具(水平(大小3.7),垂直(7.3),45_(9.3),和135_(9.3))用來(lái)檢測(cè)圖像邊緣和選擇最大值作為邊緣分量。而不是使用大些的作為邊緣分量。我們?cè)O(shè)計(jì)出一些面具模板用來(lái)邊緣檢測(cè),實(shí)驗(yàn)結(jié)果說(shuō)明我們的方法像他們的一樣好。閾值法是把灰度級(jí)邊緣圖像轉(zhuǎn)化為二值圖像,高閾值點(diǎn)是由占整個(gè)圖像的前5%灰度級(jí)高的灰度決定的,而低閾值點(diǎn)是由占整個(gè)圖像的前25%灰度級(jí)高的灰度決定的。高閾值是用來(lái)獲取頭頂區(qū),而低閾值是用來(lái)獲得面部區(qū)域的。這些閾值百分比的選定是由經(jīng)驗(yàn)性數(shù)據(jù)決定的,為了獲取最好的實(shí)驗(yàn)結(jié)果。2.2檢測(cè)頭型和面部區(qū)域?yàn)榱舜_定頭部邊界區(qū)域,我們把高閾值圖分割成左右兩半局部。當(dāng)我們從頂部到低部掃描圖邊緣時(shí),第一層周線產(chǎn)生的是頭部邊界和第二層周線產(chǎn)生的是面部邊界區(qū)域。為了追蹤頭部邊界,起始點(diǎn)設(shè)置在第一層左半部的第一個(gè)白象素的位置。從這個(gè)起始點(diǎn)開(kāi)始,我們來(lái)追蹤左右局部頂部輪廓。因?yàn)榈谝粚拥耐獠窟吔鐝膶?shí)際的邊界向外移動(dòng)數(shù)個(gè)象素?cái)?shù)〔稱(chēng)為P〕,我們分別各自調(diào)整左半部到右半部和右半部到左半部個(gè)P象素點(diǎn)。因?yàn)橐恍┟娌枯喞诟唛撝祱D中很模糊,所以我們用低閾值來(lái)檢測(cè)面部區(qū)域。頭部區(qū)域被隔離,我們用形態(tài)學(xué)的方法來(lái)消除不必要的噪聲。這樣做以后,圖像被從四個(gè)方向〔從左到右,從右向左,從頂?shù)降祝瑥牡紫蝽敗尺M(jìn)行檢測(cè)來(lái)確定臉部特征。2.3定位臉部特征為了識(shí)別臉部特征,我們首先提取他們的候選區(qū)域。候選區(qū)域通過(guò)覆蓋臉部邊界獲得原圖的二進(jìn)制圖邊緣局部和把在或不在二進(jìn)制圖內(nèi)的白象素轉(zhuǎn)化成黑象素。這樣之后我們應(yīng)用x和y坐標(biāo)來(lái)定位臉部特征,在圖的候選區(qū)域中用x坐標(biāo)來(lái)獲得臉部特征的水平定位和用y坐標(biāo)來(lái)獲得臉部特征的垂直定位。通過(guò)合并水平和垂直方向上的定位,我們可以得到四個(gè)直方圖:兩眼的、鼻孔的和嘴巴的。附錄B參考文獻(xiàn)題錄及摘要[1]黃翠榮,嚴(yán)佩敏,時(shí)鹿鳴.基于方差相似度計(jì)算的人臉識(shí)別技術(shù)[J].上海大學(xué)學(xué)報(bào)(自然科學(xué)版),2003.12(4):1-4摘要:針對(duì)人臉識(shí)別過(guò)程中所需的圖像匹配,采用計(jì)算特征矢量方差的方法,經(jīng)過(guò)一定的對(duì)應(yīng)關(guān)系變化,得到了相似度計(jì)算的權(quán)值。這些權(quán)值具有很好的穩(wěn)定性和準(zhǔn)確性,有利于識(shí)別率的提高。實(shí)驗(yàn)采用自制人臉庫(kù)進(jìn)行識(shí)別測(cè)試,取得了較滿意的結(jié)果,驗(yàn)證了此方法的有效性。[2]王天學(xué),刑桂芬,江波.基于區(qū)域分割的復(fù)雜背景中的人臉檢測(cè)與定位[J].計(jì)算機(jī)工程與設(shè)計(jì),2004,11(25):1-3摘要:基于區(qū)域分割和特征驗(yàn)證,提出了一種復(fù)雜背景下的人臉檢測(cè)與定位的方法。在粗略定位人臉的根底上,提出了一種新穎簡(jiǎn)單的區(qū)域分割方法,有效地定位出了人臉的候選區(qū)域,通過(guò)檢測(cè)眼睛和嘴唇完成對(duì)人臉確實(shí)認(rèn)。實(shí)驗(yàn)說(shuō)明該方法檢測(cè)速度快、準(zhǔn)確率高、魯棒性好。[3]朱文佳,戚飛虎.快速人臉檢測(cè)與特征定位[J].中國(guó)圖像圖形學(xué)報(bào),2005,11(10):1-4摘要:人臉檢測(cè)與特征定位是人臉?lè)治黾夹g(shù)的一個(gè)重要組成局部,其目標(biāo)是在圖像中搜索人臉特征(如眼、鼻、嘴、耳等)的位置。雖然人們可以毫不費(fèi)力地完成這些工作,但對(duì)于機(jī)器來(lái)說(shuō),這依然是一件極其困難的任務(wù)。近幾年來(lái)該項(xiàng)技術(shù)已有了長(zhǎng)足的開(kāi)展,已成功地應(yīng)用于諸如人臉識(shí)別、姿態(tài)識(shí)別、表情識(shí)別、臉部動(dòng)畫(huà)等諸多領(lǐng)域。本文利用DavidCristinace和TimCootes提出的一個(gè)多階段人臉特征檢測(cè)方法實(shí)現(xiàn)了一個(gè)實(shí)時(shí)人臉特征定位系統(tǒng)。同時(shí)也對(duì)原算法本身作了一些改良,在對(duì)精度影響極小的情況下,大大提高了原算法的速度。[4]郭瑞,張淑玲,汪小芬.人臉識(shí)別特征提取方法和相似度匹配方法研究[J].計(jì)算機(jī)工程,2006,11(32):1-2摘要:橫向比擬特征提取方法,綜合考慮認(rèn)證率和特征提取時(shí)間兩方面因素,該文認(rèn)為特征臉結(jié)合線性判別分析方法是研究的4種特征提取方法中最優(yōu)的方法。通過(guò)對(duì)投影空間維數(shù)的研究,最正確投影空間維數(shù)同數(shù)據(jù)庫(kù)本身類(lèi)內(nèi)圖像的相似程度和每一類(lèi)的樣本數(shù)目同方向增長(zhǎng),它們之間存在定性關(guān)系而非定量關(guān)系。相似度匹配方法的研究結(jié)果說(shuō)明余弦距離分類(lèi)器分類(lèi)效果最正確。[5]張敏,陶亮.人臉圖像中人眼的檢測(cè)與定位[J].光電工程,2006,8(33):1-6摘要:利用人臉幾何特征和圖像分割原理,提出了一種在有背景的灰度和彩色人臉圖像中自動(dòng)檢測(cè)與定位人眼的新算法。首先,基于人臉器官幾何分布先驗(yàn)知識(shí)建立人眼位置判定準(zhǔn)那么;其次對(duì)人眼的分割閾值范圍進(jìn)行粗估計(jì);然后采用分割閾值遞增法,并結(jié)合人眼位置判定準(zhǔn)那么判定分割圖像中雙眼黑塊是否出現(xiàn);最后利用二維相關(guān)系數(shù)作為對(duì)稱(chēng)相似性測(cè)度,檢驗(yàn)檢測(cè)到的雙眼的真實(shí)性。為了防止圖像背景對(duì)人眼檢測(cè)的干擾,還運(yùn)用了膚色分割原理來(lái)縮小檢測(cè)人眼的搜索區(qū)域,從而進(jìn)一步提高人眼定位的準(zhǔn)確性。實(shí)驗(yàn)驗(yàn)證說(shuō)明,所提出的人眼檢測(cè)與定位方法在速度和準(zhǔn)確性方面具有良好的性能。[6]張永梅,韓焱,商細(xì)云.一種人臉的檢測(cè)與定位方法[J].中北大學(xué)學(xué)報(bào)〔自然科學(xué)版〕2006,3(27):1-5摘要:出一種基于膚色的人臉檢測(cè)定位算法,設(shè)計(jì)了基于膚色的人臉檢測(cè)和定位系統(tǒng).采用了增強(qiáng)人臉特征與臉部皮膚之間比照度的方法以及二值化方法,改良了預(yù)處理的效果.使用了基于邊界方法和基于區(qū)域方法相結(jié)合的算法,提取了眼睛、嘴和鼻子等關(guān)鍵特征,最終較好地實(shí)現(xiàn)了人臉定位。在MicrosoftWindowsME平臺(tái)上,利用VisualC++6.0開(kāi)發(fā)了軟件。實(shí)驗(yàn)結(jié)果說(shuō)明,該軟件對(duì)于一定尺寸范圍內(nèi)清晰的正面人臉圖像能夠正確檢測(cè)定位并提取特征。[7]裘偉.一種基于相似度及復(fù)雜度人眼定位算法[J].蘇州大學(xué)學(xué)報(bào)〔工科版〕2006,6(26):1-4摘要:出一種在檢測(cè)到人臉區(qū)域的前提下,對(duì)人眼進(jìn)行準(zhǔn)確定位的算法。該算法首先計(jì)算人臉圖像的相似度信息,并對(duì)得到的相似度圖像進(jìn)行二值化,從而標(biāo)定人臉區(qū)域。然后對(duì)得到的人臉區(qū)域進(jìn)行圖像塊分割,通過(guò)復(fù)雜度計(jì)算得到三個(gè)復(fù)雜度最大的區(qū)域塊,計(jì)算其居中度,從而實(shí)現(xiàn)對(duì)人眼的準(zhǔn)確定位。[8]吳為.人臉識(shí)別的軟件系統(tǒng)開(kāi)發(fā),復(fù)旦大學(xué)工學(xué)學(xué)士學(xué)位論文,2005年6月摘要:人臉識(shí)別技術(shù)有著廣闊的應(yīng)用前景和迫切的現(xiàn)實(shí)需求,是當(dāng)前模式識(shí)別、計(jì)算機(jī)視覺(jué)等領(lǐng)域里最熱門(mén)的研究方向之一。而人臉識(shí)別的軟件系統(tǒng)開(kāi)發(fā),那么是聯(lián)系理論和實(shí)踐的最重要的環(huán)節(jié)。本文著重介紹了人臉識(shí)別軟件系統(tǒng)開(kāi)發(fā)的背景,原理以及最后的設(shè)計(jì)結(jié)果。[9]謝建新.數(shù)字視頻采集與目標(biāo)跟蹤,華僑大學(xué)本科畢業(yè)論文,2004年6月摘要:在室內(nèi)環(huán)境條件下,使攝像機(jī)具有智能檢測(cè)的視頻采集功能,實(shí)現(xiàn)攝像機(jī)對(duì)移動(dòng)人體的臉部區(qū)域的檢測(cè),并對(duì)人體的臉部區(qū)域進(jìn)行實(shí)時(shí)跟蹤。在目標(biāo)跟蹤模塊中,通過(guò)對(duì)所采集圖像進(jìn)行灰度變換、二值化、垂直直方圖、水平直方圖的變換,結(jié)合膚色和人臉橢圓形狀來(lái)檢測(cè)彩色圖像、背景中的人臉區(qū)域。首先利用人類(lèi)膚色在色度空間分布的穩(wěn)定性,檢測(cè)出圖像中的皮膚區(qū)域,通過(guò)先驗(yàn)知識(shí)進(jìn)行甄別,選出候選人臉區(qū)域。利用人臉的寬高比、顏色、結(jié)構(gòu)等特征進(jìn)行人臉逐級(jí)判別,從而確定人臉位置;通過(guò)對(duì)臉部的各器官建立相應(yīng)的數(shù)學(xué)模型,檢測(cè)出人臉的特征,對(duì)其鼻子,眼睛,嘴巴進(jìn)行的定位,來(lái)驗(yàn)證人臉區(qū)域定位的準(zhǔn)確性。最后根據(jù)后續(xù)幀中人臉區(qū)域重心的位移來(lái)控制云臺(tái)實(shí)現(xiàn)跟蹤。[10]王學(xué)武,石躍祥.基于眼睛特征的人臉檢測(cè)方法[J].計(jì)算機(jī)應(yīng)用研究.2006年,1(1):1-3摘要:于眼球的灰度級(jí)較低,而眼球周?chē)咨珔^(qū)域的灰度級(jí)較高,因此在其交界處灰度級(jí)產(chǎn)生強(qiáng)烈突變。利用這一特征先從圖像中找出可能的眼睛對(duì),定位可能的人臉區(qū)域,通過(guò)計(jì)算其對(duì)稱(chēng)性來(lái)確定各種人臉特征的存在,更進(jìn)一步驗(yàn)證可能的人臉區(qū)域。實(shí)驗(yàn)證明,此方法能迅速準(zhǔn)確地從復(fù)雜背景圖像中檢測(cè)出人臉,而且對(duì)多人臉圖像同樣有效。附錄C主要源程序////////////////////////////////////////////////////////////////////////////計(jì)算相似度//////////////////////////////////////////////////////////////////////////voidCLikelyHood::CalLikeHood(){inti,j;for(i=0;i<m_nHeight;i++) {for(j=0;j<m_nWidth;j++) {doublex1,x2; TCbCrtemp=CalCbCr(m_pSourceData[i][j].rgbRed,m_pSourceData[i][j].rgbGreen,m_pSourceData[i][j].rgbBlue); x1=temp.Cb-bmean; x2=temp.Cr-rmean; doublet; t=x1*(x1*brcov[1][1]-x2*brcov[1][0])+x2*(-x1*brcov[0][1]+x2*brcov[0][0]); t/=(brcov[0][0]*brcov[1][1]-brcov[0][1]*brcov[1][0]); t/=(-2); m_pLikeliHoodArray[i][j]=exp(t); } } filter(m_pLikeliHoodArray,m_nWidth,m_nHeight);doublemax=0.0; for(i=0;i<m_nHeight;i++) for(j=0;j<m_nWidth;j++) if(m_pLikeliHoodArray[i][j]>max) max=m_pLikeliHoodArray[i][j]; for(i=0;i<m_nHeight;i++) {for(j=0;j<m_nWidth;j++) {m_pLikeliHoodArray[i][j]/=max; } }m_bLikeliHoodReady=true;}/////////////////////////////////////////////////////////////////////////////////計(jì)算Cb,Cr///////////////////////////////////////////////////////////////////////////////TCbCrCLikelyHood::CalCbCr(intR,intG,intB){ TCbCrres;

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論