




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
人臉檢測問題研究綜述
1人臉檢測系統(tǒng)的應(yīng)用背景面部特征的檢測是輸入圖像時(shí)確定每個(gè)臉的位置、大小和位置的過程。面部特征的識別是人類信息數(shù)據(jù)處理的一項(xiàng)重要技術(shù)。近年來,它已成為計(jì)算機(jī)及其他犯罪現(xiàn)場的一個(gè)受廣泛關(guān)注、研究活躍的問題。人臉檢測問題最初來源于人臉識別(facerecognition).人臉識別的研究可以追溯到20世紀(jì)60—70年代,經(jīng)過幾十年的曲折發(fā)展已日趨成熟.人臉檢測是自動人臉識別系統(tǒng)中的一個(gè)關(guān)鍵環(huán)節(jié),但是早期的人臉識別研究主要針對具有較強(qiáng)約束條件的人臉圖像(如無背景的圖像),往往假設(shè)人臉位置已知或很容易獲得,因此人臉檢測問題并未受到重視.近幾年隨著電子商務(wù)等應(yīng)用的發(fā)展,人臉識別成為最有潛力的生物身份驗(yàn)證手段,這種應(yīng)用背景要求自動人臉識別系統(tǒng)能夠?qū)σ话悱h(huán)境圖像具有一定的適應(yīng)能力,由此所面臨的一系列問題使得人臉檢測開始作為一個(gè)獨(dú)立的課題受到研究者的重視.今天,人臉檢測的應(yīng)用背景已經(jīng)遠(yuǎn)遠(yuǎn)超出了人臉識別系統(tǒng)的范疇,在基于內(nèi)容的檢索、數(shù)字視頻處理、視覺監(jiān)測等方面有著重要的應(yīng)用價(jià)值.人臉檢測研究具有重要的學(xué)術(shù)價(jià)值.人臉是一類具有相當(dāng)復(fù)雜的細(xì)節(jié)變化的自然結(jié)構(gòu)目標(biāo),此類目標(biāo)的檢測問題的挑戰(zhàn)性在于:(1)人臉由于外貌、表情、膚色等不同,具有模式的可變性;(2)一般意義下的人臉上,可能存在眼鏡、胡須等附屬物;(3)作為三維物體的人臉的影像不可避免地受由光照產(chǎn)生的陰影的影響.因此,如果能夠找到解決這些問題的方法,成功構(gòu)造出人臉檢測與跟蹤系統(tǒng),將為解決其它類似的復(fù)雜模式檢測問題提供重要的啟示.目前,國外對人臉檢測問題的研究很多,比較著名的有MIT,CMU等;國內(nèi)的清華大學(xué)、北京工業(yè)大學(xué)、中國科學(xué)院計(jì)算技術(shù)研究所和中國科學(xué)院自動化研究所等都有人員從事人臉檢測相關(guān)的研究.而且,MPEG7標(biāo)準(zhǔn)組織已經(jīng)建立了人臉識別草案小組,人臉檢測算法也是一項(xiàng)征集的內(nèi)容.隨著人臉檢測研究的深入,國際上發(fā)表的有關(guān)論文數(shù)量也大幅度增長,如IEEE的FG(IEEEInternationalConferenceonAutomaticFaceandGestureRecognition)、ICIP(InternationalConferenceonImageProcessing)、CVPR(ConferenceonComputerVisionandPatternRecognition)等重要國際會議上每年都有大量關(guān)于人臉檢測的論文,占有關(guān)人臉研究論文的近1/3之多.有關(guān)人臉檢測的內(nèi)容在人臉識別研究的綜述中有所涉及,但僅僅側(cè)重于人臉識別系統(tǒng)的輸入環(huán)節(jié),目前較為詳盡的人臉檢測與跟蹤綜述為文獻(xiàn),著重于介紹各種方法所使用的特征和模型,本文則系統(tǒng)地整理分析了相關(guān)的研究文獻(xiàn),按照人臉檢測的問題分類與模式分析、人臉特征的提取與綜合等線索對近年來的研究進(jìn)行了綜述.2人臉模式的系統(tǒng)研究人臉檢測問題所包含的內(nèi)容十分廣泛,從不同的角度可以有多種分類方法(表1).本文主要討論靜止圖像中的人臉檢測問題.動態(tài)圖像中單幀內(nèi)的人臉檢測與靜止圖像的情況基本相同,若考慮動態(tài)信息則屬于人臉跟蹤(facetracking)問題,將不在本文討論.人臉圖像所包含的模式特征十分豐富,如圖1所示.這些特征中哪些是最有用的、如何利用這些特征,是人臉檢測要研究的一個(gè)關(guān)鍵問題.人臉模式具有復(fù)雜而細(xì)致的變化,因此一般需要采用多種模式特征綜合的方法,如圖2所示.歸納起來,根據(jù)利用特征的色彩屬性可以將人臉檢測方法分為基于膚色特征的方法和基于灰度特征的方法兩類.前者適用于構(gòu)造快速的人臉檢測和人臉跟蹤算法,后者利用了人臉區(qū)別于其它物體的更為本質(zhì)的特征,是人臉檢測領(lǐng)域研究的重點(diǎn).根據(jù)特征綜合時(shí)采用的不同模型,可以將基于灰度特征的方法分為兩大類:基于啟發(fā)式(知識)模型的方法和基于統(tǒng)計(jì)模型的方法.由于人臉檢測問題的復(fù)雜性,無論哪一類方法都無法適應(yīng)所有的情況,一般都針對人臉檢測領(lǐng)域內(nèi)某個(gè)或某些特定的問題.3面部特征的提取人臉模式的特征包括膚色特征和灰度特征.3.1色度空間與結(jié)構(gòu)膚色是人臉的重要信息,不依賴于面部的細(xì)節(jié)特征,對于旋轉(zhuǎn)、表情等變化情況都能適用,具有相對的穩(wěn)定性并且和大多數(shù)背景物體的顏色相區(qū)別.因此膚色特征在人臉檢測中是最常用的一種特征.膚色特征主要由膚色模型描述.使用何種形式的膚色模型與色度空間(chrominancespace)的選擇密切相關(guān).可以從兩個(gè)方面考察某種色度空間:(1)在該色度空間中能否用給定的模型描述“膚色”區(qū)域的分布;(2)色度空間中“膚色”與“非膚色”區(qū)域的重疊有多少.人臉檢測常用的色度空間主要有RGB(紅、綠、藍(lán)三基色)、rgb(亮度歸一化的三基色)、SHI(飽和度、色調(diào)、亮度)、YIQ(NTSC制的光亮度和色度模型)、YUV(PAL制的光亮度和色度模型)、YCbCr(CCIR601編碼方式的色度模型,與YUV在數(shù)學(xué)上具有等價(jià)性)、CIEL*a*b(國際照明委員會提出的基于色度學(xué)的彩色模型)等.常用的膚色模型有高斯模型、混合高斯模型和直方圖模型.Terrillon等考察了歸一化的r-g、CIE-xy、歸一化的TSL、CIE-DSH、HSV、YIQ、YES、CIE-L*u*v和CIE-L*a*b9種色度空間,比較了高斯模型和混合高斯模型在不同色度空間中的性能,發(fā)現(xiàn)除了少數(shù)情況外,一般需要使用混合高斯模型才能較好地描述膚色區(qū)域的分布.Terrillon等同時(shí)指出,最終限制檢測性能的因素是不同色度空間中“膚色”與“非膚色”區(qū)域的重疊程度.Jones等研究了RGB空間中“膚色”與“非膚色”像素的分布,根據(jù)標(biāo)定出膚色區(qū)域的近2萬幅圖片(包含約20億個(gè)像素)建立了三維直方圖,在此基礎(chǔ)上比較了直方圖模型和混合高斯模型,發(fā)現(xiàn)前者的性能略好于后者.除上述3種膚色模型外,還有直接利用幾何參數(shù)描述膚色區(qū)域分布范圍的模型、三維投影模型、基于神經(jīng)網(wǎng)的膚色模型等.此外也有同時(shí)考慮“膚色”與“非膚色”像素分布的基于貝葉斯方法的模型.3.2人臉核心區(qū)域灰度特征包括人臉輪廓特征、人臉灰度分布特征(鑲嵌圖特征、直方圖特征等)、器官特征(對稱性等)、模板特征等.輪廓是人頭部的重要特征.Craw等首先在低分辨率圖像中使用一個(gè)輪廓模板匹配出人臉的大致范圍,然后在高分辨率圖像中使用Sobel算子獲得邊緣的位置和方向,并連接出完整的人臉輪廓.Wang等提取邊緣特征并根據(jù)廣義Hough變換抽取橢圓形狀信息.人臉核心區(qū)域(眼睛、鼻子、嘴區(qū)域)具有獨(dú)特的灰度分布特征.Yang等首先提出了人臉的鑲嵌圖(mosaicimage,又稱為馬賽克圖)特征.所謂鑲嵌圖就是將圖像劃分為一組大小相同的方格,每個(gè)方格的灰度為格中各個(gè)像素的平均值.鑲嵌圖特征是指這些塊的值應(yīng)滿足的約束規(guī)則.Lu等依據(jù)人臉的左右對稱性,通過提取投影直方圖特征檢測人臉的旋轉(zhuǎn)角度,再提取鑲嵌圖特征.Dai等提取空間灰度共現(xiàn)矩陣(SGLD)特征等等.人臉區(qū)域內(nèi)的各個(gè)器官(如雙眼、鼻子、嘴等)是人臉的重要特征.Kouzani等使用人工神經(jīng)網(wǎng)分別檢測眼睛、鼻子、嘴以及人臉的整體特征.人臉區(qū)域的灰度本身可以作為模板特征,通常取僅包含雙眼、鼻子和嘴的面部中心區(qū)域作為共性的人臉模板特征,排除掉頭發(fā)、臉頰兩側(cè)變化很大的部分.被廣泛地用于基于統(tǒng)計(jì)學(xué)習(xí)的人臉檢測方法中.4面部特征的綜合人臉的檢測過程實(shí)際上就是對人臉模式特征的綜合判斷過程,包括多種方法.4.1細(xì)胞被裂變后的人臉及細(xì)胞的歸并對于彩色圖像,在確定膚色模型之后,首先可以進(jìn)行膚色檢測.在檢測出膚色像素后,需要根據(jù)它們在色度上的相似性和空間上的相關(guān)性分割出可能的人臉區(qū)域,同時(shí)利用區(qū)域的幾何特征或灰度特征進(jìn)行是否是人臉的驗(yàn)證,以排除其它色彩類似膚色的物體.區(qū)域分割與驗(yàn)證在很多方法中是密切結(jié)合、統(tǒng)一考慮的.在一些情況下,僅根據(jù)膚色像素的聚積特性即可完成區(qū)域分割.Yoo等利用膚色像素的連通性分割出區(qū)域,使用橢圓擬合各個(gè)區(qū)域,根據(jù)橢圓長短軸的比率判斷其是否為人臉.Cai等根據(jù)膚色模型提供的像素的似然度,采用從局部最大值處逐漸擴(kuò)展的方法得到膚色區(qū)域,然后使用灰度平均臉模板匹配的方法驗(yàn)證區(qū)域內(nèi)是否有人臉.對于較為復(fù)雜的情況,則需要考慮兩方面的問題:(1)由于光照和臉部器官的影響,人臉可能被割裂為若干互不連通的膚色區(qū)域;(2)人臉區(qū)域可能與其它類膚色區(qū)域連接在一起.聚類-歸并-驗(yàn)證策略是較常用的解決方法:首先將膚色像素按照較為嚴(yán)格的顏色一致性和幾何約束條件聚類為區(qū)域,然后按照一定規(guī)則進(jìn)行歸并,歸并后或歸并過程中利用其它特征進(jìn)行驗(yàn)證.Garcia等按照色度的差異將膚色進(jìn)一步量化為不同的類型,將類型相同且相鄰的膚色像素聚類為區(qū)域,根據(jù)幾何位置、形狀和色調(diào)相容性進(jìn)行歸并,歸并過程中利用區(qū)域的小波特征進(jìn)行驗(yàn)證.Yang等根據(jù)色度的一致性和空間距離將膚色像素聚類成區(qū)域,然后逐步歸并直到得到符合一定先驗(yàn)知識的橢圓區(qū)域?yàn)橹?最后檢查區(qū)域中由眼睛、嘴巴等特征形成的暗區(qū)或空洞,以確定是否為人臉.Abdel-Mottaleb等首先排除了局部鄰域內(nèi)亮度變化較大的膚色像素,對其余膚色像素進(jìn)行聚類,從而得到色度一致的區(qū)域;然后使用基于鄰接圖的方法歸并不連通的區(qū)域,并且檢查區(qū)域內(nèi)亮度在鄰域中變化較大的像素(可能對應(yīng)于眼睛、嘴等特征)所占的比率,對歸并結(jié)果進(jìn)行驗(yàn)證.另一種策略是先用較弱的條件將膚色像素聚類為區(qū)域,再將符合一定條件的區(qū)域分裂開.Wei等根據(jù)區(qū)域的大小和形狀找出可能的人臉,剩下的區(qū)域按照一定規(guī)則不斷分裂,以便找出與類膚色背景連接在一起的人臉,最后利用亮度信息對各個(gè)區(qū)域進(jìn)行驗(yàn)證.還有一些方法使用膚色模板進(jìn)行搜索匹配.Karlekar等對YCbCr格式的彩色圖像進(jìn)行了小波變換,訓(xùn)練一個(gè)多層感知器在Cb,Cr平面的低通色度子圖中檢測膚色像素,然后使用一個(gè)“人臉-背景”二值人臉模板匹配搜索,最后利用亮度分量的小波變換系數(shù)驗(yàn)證搜索結(jié)果.Wu等采用了模糊模板匹配方法,該方法不僅建立了膚色模型,同時(shí)也建立了頭發(fā)顏色的模型.根據(jù)人臉位姿的不同,構(gòu)造了5種“膚色-發(fā)色”模板,并定義了相應(yīng)的隸屬度函數(shù)和模糊匹配規(guī)則,對所有可能尺度和位置的區(qū)域進(jìn)行搜索.此外,還有在分割之前就將膚色檢測的結(jié)果與其它特征融合在一起的方法,如Sun等提出的基于膚色與對稱信息的方法、Kim等提出的膚色信息與深度信息相結(jié)合的方法等.4.2人臉局部特征檢測基于啟發(fā)式模型的方法首先抽取幾何形狀、灰度、紋理等特征,然后檢驗(yàn)它們是否符合人臉的先驗(yàn)知識.Govindaraju等使用變形模板(deformabletemplate)匹配頭頂輪廓線和左右兩條面頰輪廓線,實(shí)現(xiàn)人臉定位.Yang等提出了基于鑲嵌圖(mosaicimage,又稱為馬賽克圖)的人臉檢測方法.Yang等將人臉的五官區(qū)域分別劃分為4×4個(gè)和8×8個(gè)馬賽克塊,使用一組規(guī)則進(jìn)行檢驗(yàn),并且利用邊緣特征進(jìn)一步驗(yàn)證.盧春雨等對鑲嵌圖方法進(jìn)行了改進(jìn),按照人臉器官的分布將人臉劃分為3×3個(gè)馬賽克塊,在檢測中自適應(yīng)地調(diào)整各塊的大小,使用一組基于各塊灰度和梯度統(tǒng)計(jì)特征的知識規(guī)則檢驗(yàn)該區(qū)域是否為人臉,取得了較好的實(shí)驗(yàn)結(jié)果.人臉區(qū)域內(nèi)的各個(gè)器官也具有較為恒定的模式,因此一些方法首先檢測器官(如雙眼、鼻子、嘴等)或局部特征,然后根據(jù)它們的相對位置關(guān)系判斷整個(gè)區(qū)域是否為人臉.Kouzani等將使用人工神經(jīng)網(wǎng)分別檢測出來的眼睛、鼻子、嘴以及人臉的整體特征及相互間的位置關(guān)系輸入一個(gè)模糊神經(jīng)元網(wǎng)絡(luò),根據(jù)其中的領(lǐng)域知識判斷被檢測的區(qū)域是否為人臉.Miao等從輸入圖像中提取可能對應(yīng)于眉毛、眼睛、嘴等器官的水平方向的馬賽克邊緣(mosaicedge),計(jì)算各段邊緣的“重心”(gravitycenter)后,使用“重心”模板進(jìn)行匹配,最后使用灰度和邊緣特征驗(yàn)證匹配的結(jié)果.該方法對人臉位姿的變化具有較強(qiáng)的適應(yīng)能力.采用局部特征檢測方法的還有基于雙眼檢測的方法、基于概率框架的局部特征聚類方法以及結(jié)構(gòu)模型、紋理模型和特征模型相結(jié)合的方法等.人臉灰度模板也可以看作是一種啟發(fā)式模型.梁路宏等使用了直接的平均臉模板匹配方法.與Cai等的方法不同,該方法考慮到眼睛在人類辨識人臉過程中的特殊作用,使用雙眼模板首先進(jìn)行粗篩選,然后使用不同長寬比的人臉模板進(jìn)行匹配,最后使用馬賽克規(guī)則進(jìn)行驗(yàn)證.使用的模板參見圖3.此外還有Lu等根據(jù)投影直方圖分析首先確定人臉的旋轉(zhuǎn)角度,然后使用基于鑲嵌圖的方法檢測人臉;Dai等根據(jù)空間灰度共現(xiàn)矩陣特征檢測人臉等等.其它基于知識模型的方法可以參見文獻(xiàn).利用人臉的輪廓、對稱性等少量特征的方法適用于較強(qiáng)約束條件下(如簡單背景、頭肩圖像)的人臉檢測.由于使用的特征較少,此類算法可以達(dá)到較高的檢測速度,實(shí)現(xiàn)實(shí)時(shí)檢測與跟蹤.利用人臉五官分布特征的知識模型方法能夠在一定程度上適用于復(fù)雜背景圖像中的人臉檢測,同時(shí)達(dá)到較高的檢測速度,如文獻(xiàn)等.但是需要看到,要想進(jìn)一步提高知識模型的適應(yīng)能力,需要綜合更多的特征,這實(shí)際上涉及到圖像理解這一困難的問題.這是此類方法進(jìn)一步發(fā)展遇到的主要障礙.4.3人臉檢測問題的分類由于人臉圖像的復(fù)雜性,顯式地描述人臉特征具有一定困難,因此另一類方法——基于統(tǒng)計(jì)模型的方法越來越受到重視.此類方法將人臉區(qū)域看作一類模式,即模板特征,使用大量的“人臉”與“非人臉”樣本訓(xùn)練、構(gòu)造分類器,通過判別圖像中所有可能區(qū)域?qū)儆谀念惸J降姆椒▽?shí)現(xiàn)人臉的檢測.實(shí)際上,人臉檢測問題被轉(zhuǎn)化為統(tǒng)計(jì)模式識別的二分類問題.4.3.1人臉檢測算法此類方法將人臉區(qū)域圖像變換到某一特征空間,根據(jù)其在特征空間中的分布規(guī)律劃分“人臉”與“非人臉”兩類模式.主分量分析(Principal-ComponentAnalysis,PCA)是一種常用的方法.它根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行正交變換(K-L變換),以消除原有向量各個(gè)分量間的相關(guān)性.變換得到對應(yīng)特征值依次遞減的特征向量,即特征臉.Moghaddam等發(fā)現(xiàn)人臉在特征臉空間的投影聚集比較緊密,因此利用前若干張?zhí)卣髂槍⑷四樝蛄客队暗街髟涌臻gF和與其正交的補(bǔ)空間FˉˉˉFˉ,相應(yīng)的距離度量分別稱為DIFS(DistanceInFeatureSpace)和DFFS(DistanceFromFeatureSpace).對于人臉檢測問題,由于沒有考慮“非人臉”樣本的分布,需要同時(shí)使用DIFS和DFFS才能取得較好的效果.MIT的Sung等提出了基于事例學(xué)習(xí)的方法,同時(shí)使用了19×19像素分辨率的“人臉”和“非人臉”樣本.樣本預(yù)處理后按行列順序展開為樣本向量進(jìn)行主分量分解.采用k-均值聚類方法在特征空間中建立6個(gè)“人臉”簇(Clusters),同時(shí)建立包圍“人臉”簇的6個(gè)“非人臉”簇,以使“人臉”與“非人臉”模式的邊界更為清晰.Sung等使用樣本到各個(gè)簇中心的距離訓(xùn)練一個(gè)多層感知器進(jìn)行分類.需要指出的是,人臉檢測中“非人臉”樣本的選取是一個(gè)較為困難的問題.Sung等使用了“自舉”(bootstrap)方法加以解決:首先建立一個(gè)僅使用“人臉”簇的初始分類器對一組圖像進(jìn)行檢測,將所有的錯誤報(bào)警(不是人臉而被錯檢為“人臉”的結(jié)果)加入“非人臉”樣本庫,構(gòu)造新的使用“人臉”與“非人臉”簇的分類器重新檢測.以上過程不斷迭代,直到收集了足夠的“非人臉”樣本.屬于特征空間方法的還有因子分解方法(FactorAnalysis,FA)和Fisher準(zhǔn)則方法(FisherLinearDiscriminant,FLD).Yang等在混合線性子空間(mixturesoflinearsubspaces)中對“人臉”和“非人臉”樣本的分布進(jìn)行建模,分別使用基于EM算法的擴(kuò)展FA方法和基于自組織映射(Self-OrganizingMap,SOM)的FLD方法構(gòu)造檢測器.此外,小波變換也被用于人臉檢測,如文獻(xiàn)中使用了小波變換提取人臉的多分辨率特征作為分類的依據(jù).4.3.2正面和正面旋轉(zhuǎn)人臉人工神經(jīng)網(wǎng)(ANN)方法是把模式的統(tǒng)計(jì)特性隱含在ANN的結(jié)構(gòu)和參數(shù)之中,對于人臉這類復(fù)雜的、難以顯式描述的模式,基于ANN的方法具有獨(dú)特的優(yōu)勢.CMU的Rowley等使用了多個(gè)ANN檢測多姿態(tài)的人臉,算法的框架如圖4所示.圖中顯示了兩類ANN:1個(gè)位姿檢測器(poseestimator)用于估計(jì)輸入窗口中人臉的位姿、3個(gè)檢測器(detector)分別檢測正面(frontal)、半側(cè)面(halfprofile)和側(cè)面(profile)的人臉.使用經(jīng)過對準(zhǔn)和預(yù)處理的“人臉”樣本以及采用“自舉”(bootstrap)方法收集分類器錯分的樣本作為“非人臉”樣本訓(xùn)練各個(gè)ANN,進(jìn)一步修正分類器.檢測時(shí)對輸入圖像中所有可能位置和尺度的區(qū)域首先使用位姿檢測器估計(jì)人臉位姿,經(jīng)校準(zhǔn)和預(yù)處理后送入3個(gè)檢測器中,最后對檢測器的分類結(jié)果進(jìn)行仲裁.在上述框架下,Rowley等對正面端正人臉和正面旋轉(zhuǎn)人臉的檢測單獨(dú)進(jìn)行了研究.對于正面端正的人臉,僅使用了正面人臉檢測ANN,是一種三層前向網(wǎng):輸入層對應(yīng)20×20像素的圖像區(qū)域;隱層節(jié)點(diǎn)分為對應(yīng)不同人臉區(qū)域的若干組,與輸入層部分連接;ANN輸出1到-1區(qū)間的值表示這個(gè)區(qū)域是否為人臉.Rowley等使用相同的“人臉”樣本和不同“自舉”過程收集的“非人臉”樣本訓(xùn)練了多個(gè)正面人臉檢測ANN,對它們的檢測結(jié)果進(jìn)行仲裁,以進(jìn)一步減少錯誤報(bào)警.對于正面旋轉(zhuǎn)人臉的檢測使用了旋轉(zhuǎn)角度檢測器及正面人臉檢測ANN,并使用相似的多ANN仲裁方法降低錯誤報(bào)警.基于人工神經(jīng)網(wǎng)的方法還有Juell等和Kou-zani等提出的基于人臉器官檢測的多級網(wǎng)絡(luò)方法、Anifantis等提出的雙輸出人工神經(jīng)網(wǎng)的檢測算法等.4.3.3基于概率估計(jì)的人臉檢測基于概率模型方法的一種思路是計(jì)算輸入圖像區(qū)域region屬于人臉模式object的后驗(yàn)概率p(object|region),據(jù)此對所有可能的圖像窗口進(jìn)行判別.CMU的Schneiderman等提出一種基于后驗(yàn)概率估計(jì)的人臉檢測方法.該方法利用貝葉斯原理將后驗(yàn)概率估計(jì)轉(zhuǎn)化為一個(gè)似然度求解問題:P(region|object)P(region|objectˉˉˉˉˉˉˉˉˉ)<objectˉˉˉˉˉˉˉˉˉobject>λ=P(objectˉˉˉˉˉˉˉˉˉ)P(object),Ρ(region|object)Ρ(region|objectˉ)<objectˉobject>λ=Ρ(objectˉ)Ρ(object),將難以估計(jì)的先驗(yàn)概率P(objectˉˉˉˉˉˉˉˉˉ)Ρ(objectˉ)和P(object)用一個(gè)比率參數(shù)λ代替,作為調(diào)節(jié)檢測器敏感度的參量.Schneiderman等采用64×64像素的模式區(qū)域,將其分為16個(gè)子區(qū)域,通過子區(qū)域獨(dú)立性等假設(shè)降低“人臉”和“非人臉”模式分布表達(dá)式P(region|object)和P(region|objectˉˉˉˉˉˉˉˉˉ)Ρ(region|objectˉ)的復(fù)雜性,最后轉(zhuǎn)化為稀疏編碼的直方圖,通過計(jì)算訓(xùn)練樣本的頻度求得兩種模式的概率分布.Schneiderman等還將概率估計(jì)的方法用于檢測正面旋轉(zhuǎn)人臉和側(cè)面人臉,同時(shí)使用多分辨率信息復(fù)用和由粗到精搜索的策略提高檢測的速度.屬于這一類的還有Weber等提出的視點(diǎn)不變性學(xué)習(xí)(Viewpoint-InvariantLearning)的方法等.另一種概率模型是用于描述信號統(tǒng)計(jì)特性的隱馬爾可夫模型(HiddenMarkovModels,HMM),目前也被應(yīng)用于人臉檢測與識別.Nefian等根據(jù)正面人臉由上到下各個(gè)區(qū)域(頭發(fā)、額頭、雙眼、鼻子、嘴)具有自然不變的順序這一事實(shí),使用一個(gè)包含五個(gè)狀態(tài)的一維連續(xù)HMM加以表示.將頭部圖像按照這五個(gè)區(qū)域劃分為互有重疊的條塊,對各塊進(jìn)行K-L變換,選取前若干個(gè)變換系數(shù)作為觀測向量訓(xùn)練HMM.Nefian等還提出了基于嵌入式HMM的人臉檢測方法.該方法同時(shí)考慮到人臉由左到右各個(gè)特征的自然順序,使用了二維HMM,并且采用二維DCT變換的系數(shù)作為觀察向量.此外還有Meng等使用HMM描述人臉的小波特征中不同級間的相關(guān)性等方法.基于HMM的方法一般只使用“人臉”樣本進(jìn)行訓(xùn)練,主要針對用于人臉識別的頭肩部圖像.4.3.4svm的泛化應(yīng)用支持向量機(jī)(SupportVectorMachines,SVM)是Vapnik等提出的基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理(StructuralRiskMinimizationPrinciple,SRM)的統(tǒng)計(jì)學(xué)習(xí)理論,用于分類與回歸問題.SRM使VC(VapnikCherovnenkis)維數(shù)的上限最小化,這使得SVM方法比基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化(EmpiricalRiskMinimizationPrinciple,ERM)的人工神經(jīng)網(wǎng)方法具有更好的泛化能力.Osuna等將SVM方法用于人臉檢測,取得了較好的實(shí)驗(yàn)結(jié)果.該方法的基本思路是對每一個(gè)19×19像素的檢測窗口使用SVM進(jìn)行分類,以區(qū)分“人臉”和“非人臉”窗口.SVM的訓(xùn)練使用了大量人臉樣本和“自舉”方法收集的“非人臉”樣本,并且使用逼近優(yōu)化的方法減少支持矢量的數(shù)量.需要說明的是,長期以來SVM的訓(xùn)練需要求解計(jì)算復(fù)雜度極高的二次規(guī)劃問題,限制了該方法的應(yīng)用.Platt提出的SMO(SequentialMinimalOptimization)算法解決了SVM訓(xùn)練困難的問題.4.3.5高檢測系統(tǒng)的魯棒性檢測基于統(tǒng)計(jì)模型的方法是目前比較流行的方法,是解決復(fù)雜的人臉檢測問題的有效途徑.它具有如下優(yōu)點(diǎn):(1)不依賴于人臉的先驗(yàn)知識和參數(shù)模型,可以避免不精確或不完整的知識造成的錯誤;(2)采用了實(shí)例學(xué)習(xí)的方法獲取模型的參數(shù),統(tǒng)計(jì)意義上更為可靠;(3)通過增加學(xué)習(xí)的實(shí)例可以擴(kuò)充檢測模式的范圍、提高檢測系統(tǒng)的魯棒性.基于統(tǒng)計(jì)模型的方法大多適用于復(fù)雜背景圖像中的人臉檢測.目前基于統(tǒng)計(jì)模型的方法主要針對正面端正人臉的檢測.評估不同方法的性能需要共同的測試集,目前比較公認(rèn)的測試集是Sung等的MIT測試集和Rowley等的CMU測試集(涵蓋了Sung等的測試集).表2列出了幾個(gè)具有代表性的算法在該測試集上的檢測結(jié)果統(tǒng)計(jì).由于基于統(tǒng)計(jì)的方法對訓(xùn)練樣本具有較強(qiáng)的依賴性,因此表中同時(shí)列出了各種方法使用的樣本規(guī)模.需要指出的是,由于人臉檢測問題本身的復(fù)雜性,加之不同方法往往具有不同的針對性,表2所列數(shù)據(jù)并不是為了比較各種方法的優(yōu)劣,而是用來說明目前的研究所達(dá)到的大致水平.基于統(tǒng)計(jì)模型的方法具有很強(qiáng)的適應(yīng)能力和魯棒性,但由于需要對所有可能的檢測窗口進(jìn)行窮舉搜索,計(jì)算復(fù)雜度很高,因此檢測速度有待于提高,另外“非人臉”樣本的選取仍然是一個(gè)較為困難的問題.此類方法主要針對正面端正人臉的檢測,旋轉(zhuǎn)人臉、多姿態(tài)人臉的檢測由于比較復(fù)雜和困難,有效的方法還不多.5人臉檢測的出路本文結(jié)合近年來人臉檢測問題上的研究工作,綜述了人臉檢測問題的研究現(xiàn)狀.隨著人機(jī)交互技術(shù)日益成為當(dāng)前研究的一個(gè)中心,人臉檢測問題越來越受到重視,成為模式識別與計(jì)算機(jī)視覺領(lǐng)域研究的一個(gè)熱點(diǎn).人臉檢測問題的內(nèi)涵十分廣泛,已有的方法一般都是針對某一類問題提出的.由于人臉檢測問題的復(fù)雜性,實(shí)現(xiàn)通用的人臉檢測方法還不現(xiàn)實(shí),因此解決特定約束條件下或某種應(yīng)用背景下的人臉檢測問題仍將是該領(lǐng)域研
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GA 2170-202470周歲以上人員申請機(jī)動車駕駛證能力測試內(nèi)容與方法
- 解除同居合同協(xié)議書范本
- 購銷合同和租賃協(xié)議
- 貨運(yùn)司機(jī)招聘合同協(xié)議
- 購買青菜協(xié)議書范本
- 貨代對接雇傭合同協(xié)議
- 購買商鋪定金合同協(xié)議
- 購房車位產(chǎn)權(quán)合同協(xié)議
- 甘肅省定西市臨洮縣2020-2021學(xué)年八年級(上)期中考試物理試題【含答案解析】
- 2025年精算師考試重點(diǎn)試題及答案
- 2025年新高考全國Ⅰ卷英語模擬試卷(含答案)
- 四年級數(shù)學(xué)(小數(shù)加減運(yùn)算)計(jì)算題專項(xiàng)練習(xí)與答案
- 慢阻肺的康復(fù)治療
- 《中醫(yī)養(yǎng)生保健服務(wù)(非醫(yī)療)技術(shù)操作規(guī)范 刮痧》
- 洛必 達(dá)法則課件
- DB32-T 4443-2023 罐區(qū)內(nèi)在役危險(xiǎn)化學(xué)品(常低壓)儲罐管理規(guī)范
- 足療養(yǎng)生門店禮儀培訓(xùn)
- 乒乓球教學(xué)課件
- 【中職】8完整版本.4.1-圓的標(biāo)準(zhǔn)方程
- 超星爾雅學(xué)習(xí)通《當(dāng)代大學(xué)生國家安全教育》章節(jié)測試答案
- 2024秋期國家開放大學(xué)《可編程控制器應(yīng)用實(shí)訓(xùn)》一平臺在線形考(形成任務(wù)3)試題及答案
評論
0/150
提交評論