人臉識別發(fā)展歷史_第1頁
人臉識別發(fā)展歷史_第2頁
人臉識別發(fā)展歷史_第3頁
人臉識別發(fā)展歷史_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質文檔-傾情為你奉上精選優(yōu)質文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質文檔-傾情為你奉上專心-專注-專業(yè)人臉識別發(fā)展歷史1引言在我們生存的這個地球上,居住著近65億人。每個人的面孔都由額頭、眉毛、眼睛、鼻子、嘴巴、雙頰等少數(shù)幾個區(qū)域組合而成,它們之間的大體位置關系也是固定的,并且每張臉的大小不過七八寸見方。然而,它們居然就形成了那么復雜的模式,即使是面容極其相似的雙胞胎,其家人通常也能夠非常容易地根據(jù)他們面孔上的細微差異將他們區(qū)分開來。這使得我們不得不承認這個世界上找不出兩張完全相同的人臉!那么,區(qū)分如此眾多的不同人臉的“特征”到底是什么?能否設計出具有與人類一樣的人臉識

2、別能力的自動機器?這種自動機器的人臉識別能力是否能夠超越人類自身?對這些問題的分析和解答無疑具有重要的理論和應用價值,這正是眾多從事自動人臉識別研究的研究人員所面臨的挑戰(zhàn)。本文首先給出了人臉識別的一個一般計算模型,然后簡單回顧自動人臉識別的研究歷史,接下來闡述人臉識別的研究現(xiàn)狀并介紹幾種主流的技術方法,簡單介紹計算所人臉識別研究組的研究進展,最后對上述哲學層面的問題作了一些簡單的探討。2人臉識別發(fā)展歷史人臉識別是一個被廣泛研究著的熱門問題,大量的研究論文層出不窮,在一定程度上有泛濫成“災”之嫌。為了更好地對人臉識別研究的歷史和現(xiàn)狀進行介紹,本文將AFR的研究歷史按照研究內容、技術方法等方面的特

3、點大體劃分為三個時間階段,如表1所示。該表格概括了人臉識別研究的發(fā)展簡史及其每個歷史階段代表性的研究工作及其技術特點。下面對三個階段的研究進展情況作簡單介紹:第一階段(1964年1990年)這一階段人臉識別通常只是作為一個一般性的模式識別問題來研究,所采用的主要技術方案是基于人臉幾何結構特征(Geometricfeaturebased)的方法。這集中體現(xiàn)在人們對于剪影(Profile)的研究上,人們對面部剪影曲線的結構特征提取與分析方面進行了大量研究。人工神經網絡也一度曾經被研究人員用于人臉識別問題中。較早從事AFR研究的研究人員除了布萊索(Bledsoe)外還有戈登斯泰因(Goldstein

4、)、哈蒙(Harmon)以及金出武雄(KanadeTakeo)等。金出武雄于1973年在京都大學完成了第一篇AFR方面的博士論文,直到現(xiàn)在,作為卡內基-梅隆大學(CMU)機器人研究院的一名教授,仍然是人臉識別領域的活躍人物之一。他所在的研究組也是人臉識別領域的一支重要力量。總體而言,這一階段是人臉識別研究的初級階段,非常重要的成果不是很多,也基本沒有獲得實際應用。第二階段(1991年1997年)這一階段盡管時間相對短暫,但卻是人臉識別研究的高潮期,可謂碩果累累:不但誕生了若干代表性的人臉識別算法,美國軍方還組織了著名的FERET人臉識別算法測試,并出現(xiàn)了若干商業(yè)化運作的人臉識別系統(tǒng),比如最為著

5、名的Visionics(現(xiàn)為Identix)的FaceIt系統(tǒng)。美國麻省理工學院(MIT)媒體實驗室的特克(Turk)和潘特蘭德(Pentland)提出的“特征臉”方法無疑是這一時期內最負盛名的人臉識別方法。其后的很多人臉識別技術都或多或少與特征臉有關系,現(xiàn)在特征臉已經與歸一化的協(xié)相關量(NormalizedCorrelation)方法一道成為人臉識別的性能測試基準算法。這一時期的另一個重要工作是麻省理工學院人工智能實驗室的布魯內里(Brunelli)和波基奧(Poggio)于1992年左右做的一個對比實驗,他們對比了基于結構特征的方法與基于模板匹配的方法的識別性能,并給出了一個比較確定的結論

6、:模板匹配的方法優(yōu)于基于特征的方法。這一導向性的結論與特征臉共同作用,基本中止了純粹的基于結構特征的人臉識別方法研究,并在很大程度上促進了基于表觀(Appearance-based)的線性子空間建模和基于統(tǒng)計模式識別技術的人臉識別方法的發(fā)展,使其逐漸成為主流的人臉識別技術。麻省理工學院的馬哈丹(Moghaddam)則在特征臉的基礎上,提出了基于雙子空間進行貝葉斯概率估計的人臉識別方法。該方法通過“作差法”,將兩幅人臉圖像對的相似度計算問題轉換為一個兩類(類內差和類間差)分類問題,類內差和類間差數(shù)據(jù)都要首先通過主成分分析(PCA)技術進行降維,計算兩個類別的類條件概率密度,最后通過貝葉斯決策(最

7、大似然或者最大后驗概率)的方法來進行人臉識別。局部特征分析技術是由洛克菲勒大學(RockefellerUniversity)的艾提克(Atick)等人提出的。LFA在本質上是一種基于統(tǒng)計的低維對象描述方法,與只能提取全局特征而且不能保留局部拓撲結構的PCA相比,LFA在全局PCA描述的基礎上提取的特征是局部的,并能夠同時保留全局拓撲信息,從而具有更佳的描述和判別能力。LFA技術已商業(yè)化為著名的FaceIt系統(tǒng),因此后期沒有發(fā)表新的學術進展。由美國國防部反毒品技術發(fā)展計劃辦公室資助的FERET項目無疑是該階段內的一個至關重要的事件。FERET項目的目標是要開發(fā)能夠為安全、情報和執(zhí)法部門使用的AF

8、R技術。該項目包括三部分內容:資助若干項人臉識別研究、創(chuàng)建FERET人臉圖像數(shù)據(jù)庫、組織FERET人臉識別性能評測。該項目分別于1994年,1995年和1996年組織了3次人臉識別評測,幾種最知名的人臉識別算法都參加了測試,極大地促進了這些算法的改進和實用化。該測試的另一個重要貢獻是給出了人臉識別的進一步發(fā)展方向:光照、姿態(tài)等非理想采集條件下的人臉識別問題逐漸成為熱點的研究方向??傮w而言,這一階段的人臉識別技術發(fā)展非常迅速,所提出的算法在較理想圖像采集條件、對象配合、中小規(guī)模正面人臉數(shù)據(jù)庫上達到了非常好的性能,也因此出現(xiàn)了若干知名的人臉識別商業(yè)公司。從技術方案上看,2D人臉圖像線性子空間判別分

9、析、統(tǒng)計表觀模型、統(tǒng)計模式識別方法是這一階段內的主流技術。第三階段(1998年現(xiàn)在)沙蘇哈(Shashua)等于2001年提出了一種基于商圖像13的人臉圖像識別與繪制技術。該技術是一種基于特定對象類圖像集合學習的繪制技術,能夠根據(jù)訓練集合中的少量不同光照的圖像,合成任意輸入人臉圖像在各種光照條件下的合成圖像?;诖?,沙蘇哈等還給出了對各種光照條件不變的人臉簽名(Signature)圖像的定義,可以用于光照不變的人臉識別,實驗表明了其有效性。巴斯里(Basri)和雅各布(Jacobs)則利用球面諧波(SphericalHarmonics)表示光照、用卷積過程描述朗博反射的方法解析地證明了一個重要的結論:由任意遠點光源獲得的所有朗博反射函數(shù)的集合形成一個線性子空間。這意味著一個凸的朗博表面物體在各種光照條件下的圖像集合可以用一個低維的線性子空間來近似。這不僅與先前的光照統(tǒng)計建模方法的經驗實驗結果相吻合,更進一步從理論上促進了線性子空間對象識別方法的發(fā)展。而且,這使得用凸優(yōu)化方法來強制光照函數(shù)非負成為可能,為光照問題的解決提供了重要思路??傮w而言,目前非理想成像條件下(尤其是光照和姿態(tài))、對象不配合、大規(guī)模人臉數(shù)據(jù)庫上的人臉識別問題逐漸成為研究的熱點問題。而非線性建模方法、統(tǒng)計學習理論、基于Boosting15的學習技術、基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論