基于OpenCV的人臉檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)說明書_第1頁
基于OpenCV的人臉檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)說明書_第2頁
基于OpenCV的人臉檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)說明書_第3頁
基于OpenCV的人臉檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)說明書_第4頁
基于OpenCV的人臉檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)說明書_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 畢業(yè)設(shè)計(jì)說明書 基于opencv的人臉檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) 黃河科技學(xué)院畢業(yè)設(shè)計(jì)說明書 第 39 頁 畢業(yè)設(shè)計(jì)(論文)原創(chuàng)性聲明和使用授權(quán)說明原創(chuàng)性聲明本人鄭重承諾:所呈交的畢業(yè)設(shè)計(jì)(論文),是我個(gè)人在指導(dǎo)教師的指導(dǎo)下進(jìn)行的研究工作及取得的成果。盡我所知,除文中特別加以標(biāo)注和致謝的地方外,不包含其他人或組織已經(jīng)發(fā)表或公布過的研究成果,也不包含我為獲得 及其它教育機(jī)構(gòu)的學(xué)位或?qū)W歷而使用過的材料。對本研究提供過幫助和做出過貢獻(xiàn)的個(gè)人或集體,均已在文中作了明確的說明并表示了謝意。作 者 簽 名: 日 期: 指導(dǎo)教師簽名: 日期: 使用授權(quán)說明本人完全了解 大學(xué)關(guān)于收集、保存、使用畢業(yè)設(shè)計(jì)(論文)的規(guī)

2、定,即:按照學(xué)校要求提交畢業(yè)設(shè)計(jì)(論文)的印刷本和電子版本;學(xué)校有權(quán)保存畢業(yè)設(shè)計(jì)(論文)的印刷本和電子版,并提供目錄檢索與閱覽服務(wù);學(xué)校可以采用影印、縮印、數(shù)字化或其它復(fù)制手段保存論文;在不以贏利為目的前提下,學(xué)??梢怨颊撐牡牟糠只蛉績?nèi)容。作者簽名: 日 期: 學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫的成果作品。對本文的研究做出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人完全意識到本聲明的法律后果由本人承擔(dān)。作者簽名: 日期: 年 月 日學(xué)位論文版權(quán)使

3、用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán) 大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。涉密論文按學(xué)校規(guī)定處理。作者簽名:日期: 年 月 日導(dǎo)師簽名: 日期: 年 月 日基于opencv的人臉檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)摘 要目前,人臉檢測定位和跟蹤已經(jīng)成為計(jì)算機(jī)視覺與模式識別領(lǐng)域非?;钴S的研究課題之一,在身份驗(yàn)證、信息安全、電子商務(wù)、基于內(nèi)容的圖像與視頻檢索、視頻監(jiān)控、智能人機(jī)交互、可視通信、虛擬現(xiàn)實(shí)、公安檔案管理等很多

4、方面都有著重要的應(yīng)用價(jià)值。人臉檢測是人臉識別的首要環(huán)節(jié),目的就是將人臉從圖像背景中檢測出來,是人臉識別、視頻跟蹤及人臉圖像壓縮等應(yīng)用中的重要環(huán)節(jié)。由于受圖像背景、亮度變化及人的頭部姿勢等因素的影響,使得人臉檢測成為一項(xiàng)復(fù)雜的、具有挑戰(zhàn)性的研究課題。 本文首先闡述了人臉檢測技術(shù)的基本概念,對人臉檢測領(lǐng)域的發(fā)展?fàn)顩r做了簡要的介紹,然后對現(xiàn)有的各種人臉檢測算法和技術(shù)做了深入的研究和討論,并介紹了intel開源計(jì)算機(jī)視覺庫opencv及其在vc+6.0下的配置方法,最后采用adaboost學(xué)習(xí)算法實(shí)現(xiàn)了基本的人臉檢測,以及視頻中的人臉檢測、攝像頭監(jiān)控檢測等功能。實(shí)驗(yàn)表明本文研究的人臉檢測方法具有檢測速

5、度快、精度高、實(shí)時(shí)性好的特點(diǎn),具有一定的理論價(jià)值與實(shí)用價(jià)值。本文研究了基于adaboost的人臉檢測算法之后,發(fā)現(xiàn)雖然它具有具有很強(qiáng)的實(shí)時(shí)性,但當(dāng)采樣照片的背景色彩較為復(fù)雜或者光照較強(qiáng)時(shí),該方法容易在周圍環(huán)境景物中識別到錯(cuò)誤的”人臉”,人臉檢測率,錯(cuò)檢率等指標(biāo)不是很理想。關(guān)鍵詞:opencv,人臉檢測及追蹤,adaboost算法,haar特征 design and implementation of face detection system based on opencv author: chen jiang ying tutor:wang hong yongabstractcurrentl

6、y, human face detection and tracking has become one of the most active and challenging tasks in the field of computer vision and pattern recognition. it has great application value in such fields as personal identification, information security, electronic commerce,content-based image and video retr

7、ieval,video surveillance,intelligent human-machine interaction, visual communication, virtual reality, criminal archive administration, etc.face detection is the first step of face recognition, and its aim is to detect human faces from the background of image. its an important step in the field of f

8、ace recognition, video tracking and human face image compression, etc. however, the result of face detection is usually affected by the image background, brightness or head posture of image and so on, which makes face detection become a complicated and challenging subject.this paper firstly presente

9、d the basic concept of human face detection technology, and gave a brief introduction of the development of face detection; then some existing face detection algorithms are deeply studied and discussed, and it introduced intel open source computer vision library and the configuration method under th

10、e environment of vc+6.0; lastly used adaboost-based learning algorithm and relized the basic function of face detection, face detection in the video and camera face monitoring. the experiment indicate that the method of face detection proposed in this paper has the character of rapid speed, high acc

11、uracy and real-time,showing a certain degree of theoretical and practical value.after studying the adaboost-based algorithm of face detection in this paper, we can see that it has the character of real-time, but when the background color of the sample image is relatively complex or has strong light,

12、 this method might identify wrong “human faces” in the surrounding environment, and face detection rate, error detection rate is not satisfying.keywords:opencv, face detection and tracking, adaboost algorithm, haar feature目 錄1 緒論11.1 課題背景及目的11.2 人臉檢測技術(shù)概況11.3課題研究背景及意義31.4人臉檢測研究現(xiàn)狀41.5論文研究內(nèi)容51.6論文組織結(jié)構(gòu)5

13、1.7本章小結(jié)62 人臉檢測算法綜述72.1基于幾何特征的方法72.2基于模板匹配的方法82.3基于統(tǒng)計(jì)模型的方法92.4本章小結(jié)133 opencv概述及安裝配置方法143.1 opencv概述143.2 opencv的安裝及在vc+6.0環(huán)境下的配置163.3 本章小結(jié)204 人臉檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)214.1 系統(tǒng)開發(fā)環(huán)境214.2 系統(tǒng)可行性分析214.3 系統(tǒng)功能需求分析224.4 系統(tǒng)功能模塊實(shí)現(xiàn)234.5 本章小結(jié)275 系統(tǒng)運(yùn)行與測試285.1 系統(tǒng)運(yùn)行285.2 系統(tǒng)測試方案與結(jié)果285.3 系統(tǒng)的優(yōu)點(diǎn)與不足345.4 本章小結(jié)356 結(jié)論36致謝37參考文獻(xiàn)381 緒論1.1

14、 課題背景及目的近年來,隨著計(jì)算機(jī)技術(shù)的迅猛發(fā)展和安全入口控制、信息安全、金融貿(mào)易、電子商務(wù)等方面應(yīng)用需求的快速增長,生物識別技術(shù)漸漸得到廣泛的重視。人臉識別技術(shù)由于其具有的非接觸型認(rèn)證、直接、友好、方便等特點(diǎn)得到廣泛的研究和開發(fā),成為近30年模式識別和計(jì)算機(jī)視覺領(lǐng)域最有潛力的生物身份驗(yàn)證手段和最熱門的研究課題之一。人臉檢測是人臉識別研究中重要的第一步,目的就是從圖像中分割出不包括背景的人臉區(qū)域。但是由于早期的人臉識別研究主要針對具有較強(qiáng)約束條件的人臉圖像(如無背景圖像),往往假設(shè)人臉位置已知或者容易獲得,因而人臉檢測問題并未受到重視。近幾年,隨著電子商務(wù)等應(yīng)用的不斷發(fā)展,人臉檢測開始作為獨(dú)立

15、的課題受到研究者的重視。今天,人臉檢測的研究已經(jīng)遠(yuǎn)遠(yuǎn)超過了人臉識別系統(tǒng)的范疇,在身份驗(yàn)證、基于內(nèi)容的圖像檢索、視點(diǎn)監(jiān)測等方面都有著重要的應(yīng)用價(jià)值。對人臉檢測技術(shù)的研究,已經(jīng)經(jīng)歷了由簡單到復(fù)雜,由靜態(tài)圖像檢測到視頻流實(shí)時(shí)檢測的發(fā)展,目前正在向三維人臉檢測的方向發(fā)展,特別是viola等人于2001年提出的基于積分圖像的adaboost算法,是第一個(gè)實(shí)時(shí)的人臉檢測算法,從根本上解決了檢測速度的問題,成為目前最為流行、檢測效率最高的一種算法。目前對人臉檢測的研究不僅實(shí)現(xiàn)了對靜態(tài)圖像進(jìn)行單個(gè)、多個(gè)人臉的檢測,而且能夠?qū)?dòng)態(tài)視頻圖像的人臉進(jìn)行檢測和跟蹤。但對動(dòng)態(tài)人臉的檢測還處于初級階段,還有很多問題有待解

16、決。目前對于人臉檢測技術(shù)的研究距實(shí)際應(yīng)用還有一定的距離,性能和檢測準(zhǔn)確率還有待提高;因而,在今后的社會發(fā)展和研究領(lǐng)域中,人臉檢測與跟蹤的研究不僅具有重要的理論意義,而且具有十分重要的應(yīng)用價(jià)值。1.2 人臉檢測技術(shù)概況1.2.1 基本概念 人臉檢測是指在輸入圖像或動(dòng)態(tài)的場景中確定所有存在的人臉的位置、大小、位姿、數(shù)量等的過程。人臉檢測作為人臉信息處理中的一項(xiàng)關(guān)鍵技術(shù),近年來成為模式識別和計(jì)算機(jī)視覺領(lǐng)域內(nèi)一項(xiàng)受到普遍重視、研究相當(dāng)活躍的課題,它是目標(biāo)檢測和識別的一個(gè)典型案例。 人臉檢測研究具有重要的學(xué)術(shù)價(jià)值和很大的挑戰(zhàn)性,其研究的難點(diǎn)主要在于:人臉是一類高度非剛性的目標(biāo);人臉由于相貌、表情、膚色等

17、差異,具有模式可變性;人臉上可能存在一些附屬物,如眼鏡、胡須等;人臉姿態(tài)千變?nèi)f化,而且可能受光照、遮擋物等的影響;待檢測圖像的性質(zhì)差異,如分辨率等。人臉檢測的過程涉及從復(fù)雜的背景中分割、提取人臉區(qū)域和可能用到的人臉器官特征。一個(gè)成功的人臉檢測系統(tǒng)應(yīng)該能夠很好地處理光線、噪聲、遮擋等不可預(yù)測因素的影響。因此,如果能夠找到解決上述問題的方法,成功構(gòu)造人臉檢測和跟蹤系統(tǒng),將為解決其它類似的復(fù)雜模式檢測問題提供重要的啟示。1.2.2 發(fā)展歷史人臉檢測問題最初來源于人臉識別,對人臉識別的研究可以追溯到上個(gè)世紀(jì)六、七十年代,經(jīng)過幾十年的發(fā)展已日趨成熟。早期的人臉識別研究主要針對有約束條件的人臉圖像,而且假

18、設(shè)人臉的位置固定或容易獲得。因此人臉檢測問題并沒有得到重視。近年來,隨著電子商務(wù)和人們安全意識的提高,對人臉識別系統(tǒng)的各種應(yīng)用需求要求識別系統(tǒng)能夠?qū)σ话悱h(huán)境具有一定的適應(yīng)能力,由此吸引了很多研究者對各方面檢測技術(shù)的研究,并逐漸形成一個(gè)獨(dú)立的研究方向。人臉識別的研究已經(jīng)有相當(dāng)長的歷史,大致可以分為四個(gè)階段:1第一階段:人類最早的研究至少可追朔到20世紀(jì)50年代在心理學(xué)方面的研究和六十年代在工程學(xué)方面的研究:j. s. bruner于1954年寫下了關(guān)于心理學(xué)的the perception of people, bledsoe在 1964 年就工程學(xué)寫了facial recognition pro

19、ject report,國外有許多學(xué)校在研究人臉識別技術(shù),其中有從感知和心理學(xué)角度探索人類識別人臉機(jī)理的,如美國texas at dallas大學(xué)的abdi 和tool小組,由stirling大學(xué)的bruce教授和glasgow大學(xué)的 burton 教授合作領(lǐng)導(dǎo)的小組等;也有從視覺機(jī)理角度進(jìn)行研究的,如英國的graw 小組和荷蘭groningen 大學(xué)的petkov 小組等。 2第二階段:始于20世紀(jì)70年代的關(guān)于人臉的機(jī)器識別研究:以allen 和 parke 為代表,主要研究人臉識別所需的面部特征。研究者采用計(jì)算機(jī)實(shí)現(xiàn)了較高質(zhì)量的人臉灰度圖模型。這一階段工作的特點(diǎn)是識別過程完全依賴于操作人

20、員,不能完成自動(dòng)識別。 3第三階段:人機(jī)交互識別階段:harmon 和 lesk 用幾何特征參數(shù)來表示人臉正面圖像。他們采用多維特征矢量表示人臉面部特征,并設(shè)計(jì)了基于這一特征表示法的識別系統(tǒng)。kaya 和 kobayashi 則采用了統(tǒng)計(jì)識別方法,用歐氏距離來表示人臉特征。但這類方法需要來自操作員的先驗(yàn)知識,仍擺脫不了人的干預(yù)。4第四階段:20世紀(jì) 90 年代以來,隨著高性能計(jì)算機(jī)的出現(xiàn),人臉識別方法有了重大突破,對于人臉識別的研究進(jìn)入了真正的機(jī)器自動(dòng)識別階段。 1.3課題研究背景及意義1.3.1 研究背景人臉檢測問題最初來源于人臉識別,一個(gè)完整的人臉識別應(yīng)用系統(tǒng)應(yīng)該包括人臉檢測、特征提取和識

21、別三大基本過程。早期人臉識別研究主要針對具有較強(qiáng)約束條件的人臉圖像,即簡單人臉檢測,因此人臉檢測問題并未受到重視。近年來,隨著社會的發(fā)展和視覺監(jiān)控、遠(yuǎn)程教育和智能人機(jī)交互等方面應(yīng)用需求的急速增長,人臉識別以其非侵犯性、直接、友好和方面的優(yōu)勢成為最有潛力的、使用最廣泛的生物統(tǒng)計(jì)識別手段,這種應(yīng)用背景要求人臉識別系統(tǒng)能夠適應(yīng)通用人臉檢測范疇的應(yīng)用,由此所面臨的一系列問題引起了眾多研究者對人臉檢測各個(gè)方面研究的極大興趣,人臉檢測漸漸獨(dú)立于人臉識別成為一個(gè)專門的研究方向。今天,人臉檢測的研究背景已經(jīng)遠(yuǎn)遠(yuǎn)超出了人臉識別,在身份驗(yàn)證、人機(jī)交互、虛擬現(xiàn)實(shí)、圖像檢索等方面都有著廣泛的應(yīng)用。1.3.2 研究意義

22、人臉檢測作為人臉識別的第一步,目的就是將人臉從圖像背景中分割出來。雖然近年來人臉方面的研究取得了一些可喜的成果,但現(xiàn)有的人臉研究算法對人臉位置和狀態(tài)都有一定的要求,通常要求事先己經(jīng)知道人臉?biāo)幍奈恢?、人臉大小,并且對人臉的旋轉(zhuǎn)角度、亮度和對比度也有較嚴(yán)格的要求,因而具有一定的局限性。實(shí)際應(yīng)用中,圖像和視頻中人臉的位置、朝向和旋轉(zhuǎn)角度都不是固定的,而且圖像背景,光照等條件也是變化的,這就需要首先進(jìn)行人臉檢測,得到人臉位置并分離背景,對視頻圖像則需跟蹤數(shù)幀中的人臉狀態(tài),從中選出適合處理算法的人臉圖像。人臉檢測系統(tǒng)的構(gòu)造將為解決人臉識別、表情分析、性別、種族、年齡判別等類似的復(fù)雜模式奠定良好的基礎(chǔ),

23、同時(shí)也為這些問題的解決提供重要的啟示。因此,人臉檢測與識別課題具有十分重要的理論和應(yīng)用研究價(jià)值。1.4人臉檢測研究現(xiàn)狀1.4.1 國外研究現(xiàn)狀由于人臉檢測有著相當(dāng)廣泛的應(yīng)用和研究價(jià)值,因此,許多國家很早就展開了相關(guān)方面的研究。主要有美國、歐洲國家、日本、韓國等科技發(fā)達(dá)的國家。早在1993年,美國國防部高級研究項(xiàng)目組(arpa)和美國陸軍研究實(shí)驗(yàn)室(arl)成立了feret(face recognition technology)項(xiàng)目組,建立了feret人臉數(shù)據(jù)庫,廣泛應(yīng)用于評價(jià)人臉檢測算法的性能。目前,國外對人臉檢測問題的研究層出不窮,英國、美國等許多國家都有大量的研究小組從事人臉檢測方面的研

24、究,這些研究受到了軍方、警方以及一些身份驗(yàn)證等公司的高度重視和支持。著名的研究機(jī)構(gòu)有美國麻省理工大學(xué)(mit)的media lab、ai lab,卡內(nèi)基梅隆大學(xué)(cmu)的human-computer interface institute,microsoft research,英國的department of engineering in university of cambridge,法國的inria研究院,日本的atr研究院等等 。關(guān)于人臉檢測的學(xué)術(shù)交流活動(dòng)也相當(dāng)活躍。在一些重要的國際會議上,如國際計(jì)算機(jī)視覺會議(iccv)、計(jì)算機(jī)視覺與模式會議(cvpr)、計(jì)算機(jī)圖形學(xué)大會(siggr

25、aph)都設(shè)有人臉檢測的專題。1.4.2 國內(nèi)研究現(xiàn)狀人臉檢測技術(shù)在機(jī)關(guān)單位考勤、網(wǎng)絡(luò)安全、物業(yè)管理等領(lǐng)域起著越來越重要的作用,我國對人臉檢測的研究起步于20世紀(jì)80年代,主要的研究單位有清華大學(xué),哈爾濱工業(yè)大學(xué),中科院計(jì)算所,中科院自動(dòng)化所,復(fù)旦大學(xué),北京科技大學(xué)等,并都取得了一定的成果。研究方法主要集中在幾何特征、代數(shù)特征、神經(jīng)網(wǎng)絡(luò)和模板匹配等方面,特別是對神經(jīng)網(wǎng)絡(luò)的研究比重較大。在此基礎(chǔ)上,基于多分類器的人臉檢測受到的關(guān)注較大,研究成果也較多。特別在引入三維特征后,利用二維信息和三維信息的融合進(jìn)行人臉檢測成為了另一個(gè)亮點(diǎn)和熱點(diǎn)。中國科學(xué)院計(jì)算所的國家863項(xiàng)目“面像檢測與識別核心技術(shù)”通

26、過成果鑒定并得以初步應(yīng)用,標(biāo)志著我國在人臉檢測這一當(dāng)今熱點(diǎn)科研領(lǐng)域得到了飛躍的進(jìn)步,并掌握了一定的核心技術(shù)3。2005年1月18日,由清華大學(xué)電子系蘇光大教授主持承擔(dān)的國家“十五”攻關(guān)項(xiàng)目人臉識別系統(tǒng)通過了由公安部主持的專家鑒定,鑒定委員會認(rèn)定該項(xiàng)技術(shù)達(dá)到了國內(nèi)領(lǐng)先水平和國際先進(jìn)水平。雖然國內(nèi)的研究取得了突飛猛進(jìn)的進(jìn)展,但對人臉檢測和識別的研究仍處于初級階段,研究方向比較狹隘,與國際研究水平仍存在一定的差距。1.5論文研究內(nèi)容本文在理論上對人臉檢測與跟蹤關(guān)鍵技術(shù)進(jìn)行研究,了解和掌握了數(shù)字圖像處理和人臉檢測的主要算法,通過visual c+和opencv結(jié)合編程實(shí)現(xiàn)了人臉檢測系統(tǒng)的主要功能,并作

27、了詳細(xì)的分析。具體來說,本文主要研究內(nèi)容歸結(jié)如下:(1) 對人臉檢測技術(shù)的產(chǎn)生和發(fā)展過程等進(jìn)行了調(diào)查研究,介紹了各種人臉檢測算法的實(shí)現(xiàn)原理。(2) 了解intel開源計(jì)算機(jī)視覺庫opencv的基本結(jié)構(gòu),掌握其在visual c+6.0開發(fā)環(huán)境下的配置方法。(3) 利用opencv基本函數(shù)和vc+開發(fā)環(huán)境編程,采用adaboost算法和矩形特征構(gòu)建人臉檢測級聯(lián)分類器,開發(fā)人臉檢測系統(tǒng)界面,實(shí)現(xiàn)人臉檢測和跟蹤。(4)總結(jié)分析系統(tǒng)的檢測性能,并對影響性能的因素如光照、遮擋等進(jìn)行探討,以改進(jìn)系統(tǒng)性能。1.6論文組織結(jié)構(gòu)論文系統(tǒng)完整地分析和討論了基于opencv開源計(jì)算機(jī)視覺庫的人臉檢測實(shí)現(xiàn)方法,各章內(nèi)

28、容的安排如下:概述:簡要介紹了人臉檢測技術(shù)的概念、發(fā)展歷史和研究現(xiàn)狀及本文的課題背景、研究意義,以及論文的主要研究內(nèi)容。人臉檢測技術(shù)綜述:介紹了各種人臉檢測算法的實(shí)現(xiàn)原理。opencv概述及安裝配置方法:首先介紹了intel開源計(jì)算機(jī)視覺庫opencv的概念、基本結(jié)構(gòu)和特點(diǎn),其次介紹了它的安裝和在vc+6.0環(huán)境下的配置方法。人臉檢測系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn):對系統(tǒng)開發(fā)環(huán)境進(jìn)行了介紹,并進(jìn)行了系統(tǒng)可行性分析、需求分析,詳細(xì)介紹了各個(gè)模塊的實(shí)現(xiàn)方法。系統(tǒng)運(yùn)行與測試:對系統(tǒng)運(yùn)行界面進(jìn)行了展示,并對各個(gè)模塊進(jìn)行了測試,并給出了測試結(jié)果;然后分析了系統(tǒng)的優(yōu)缺點(diǎn)。第六章 總結(jié)與展望:對論文的工作進(jìn)行了總結(jié),并對人

29、臉檢測技術(shù)的發(fā)展方向進(jìn)行了展望。1.7本章小結(jié) 本章主要介紹了人臉檢測技術(shù)概況,對人臉檢測這個(gè)熱門的前沿技術(shù)課題進(jìn)行了大體的分析。首先通過引言引出了人臉檢測在計(jì)算機(jī)視覺領(lǐng)域的研究發(fā)展過程,然后對人臉檢測技術(shù)的概念和發(fā)展歷史進(jìn)行了詳細(xì)的介紹,并給出了本課題的研究背景和研究意義,對國內(nèi)外在人臉檢測領(lǐng)域的研究現(xiàn)狀進(jìn)行了分析,最后給出了論文的主要研究內(nèi)容和結(jié)構(gòu)組織框架。2 人臉檢測算法綜述2.1基于幾何特征的方法人臉的幾何特征指的是人臉面部器官在幾何上體現(xiàn)的特征閣?;趲缀翁卣鞯娜四槞z測方法的思想是把典型人臉的幾何特征編碼并規(guī)則化的人臉檢測方法。它通過檢測不同的人臉面部特征的位置,然后根據(jù)它們的空間幾

30、何關(guān)系來定位人臉,當(dāng)圖像中的待測區(qū)域符合準(zhǔn)則,即被檢測為人臉。2.1.1基于器官特征的方法正如世界上沒有兩片完全相同的葉子一樣,人臉也各不相同,但是器官也遵循著一些普遍適用的規(guī)則,即五官形狀及其分布的幾何規(guī)則。檢測圖像中是否存在人臉,即是否存在滿足這些規(guī)則的圖像塊。這種方法的步驟一般是先對人臉的器官或器官的組合建立模板,然后檢測圖像中幾個(gè)器官可能分布的位置,對這些位置點(diǎn)分別進(jìn)行組合,用器官分布規(guī)則進(jìn)行篩選,從而找到可能存在的人臉。2.1.2基于輪廓特征的方法人臉的輪廓可以近似地被看成一個(gè)橢圓形狀,所以對圖像進(jìn)行人臉檢測可以通過檢測橢圓輪廓來確定是否有人臉存在。具體來說,首先對待檢測的圖像進(jìn)行邊

31、緣檢測,并對細(xì)化后的邊緣提取曲線特征,然后計(jì)算各曲線合成人臉的評估函數(shù)來確定是否存在人臉。采用輪廓特征的方法對側(cè)臉的檢測同樣適用。2.1.3基于顏色紋理的方法膚色是人臉的重要信息,它不依賴于人臉面部的細(xì)節(jié)特征,在旋轉(zhuǎn)、表情變化等情況下都能保持不變,具有相對穩(wěn)定性,并且和大多數(shù)背景物體的顏色相區(qū)別,因此膚色特征是在對彩色圖像的人臉檢測中最常用的一種特征。膚色特征主要由膚色模型描述,常用的膚色模型有高斯模型、混合高斯模型和直方圖模型。此方法主要利用人臉皮膚表面顏色和紋理所具有的穩(wěn)定性來進(jìn)行人臉檢測。人臉的膚色在顏色空間中的分布相對集中,且大多數(shù)和背景物體的顏色相區(qū)別,可以利用這個(gè)特點(diǎn)檢測人臉。用膚

32、色信息進(jìn)行人臉檢測的關(guān)鍵是合理選擇色度坐標(biāo)。常用的方案是將彩色的r、g、b分量歸一化處理。目前人們研究更多的是將r、g、b彩色空間轉(zhuǎn)化為其它彩色空間,以突出色度信息。其它模型主要有yuv、yiq、xyz、ycbcr等等,其中ycbc是使用最多的一種,ycrcb是yuv模型中的一種,是一個(gè)色差模型,利用了人對色度遠(yuǎn)沒有對亮度敏感而建立的,更符合人眼的視覺特點(diǎn)。其中,y是亮度信號,crcb是色度或彩度信號。這種方法的最大優(yōu)點(diǎn)是可以在不同視角中檢測到人臉,對姿態(tài)變化不敏感。利用膚色特征檢測出的人臉區(qū)域可能不夠準(zhǔn)確,但如果在整個(gè)系統(tǒng)實(shí)現(xiàn)中作為人臉檢測的粗定位環(huán)節(jié),它具有直觀、實(shí)現(xiàn)簡單、快速等特點(diǎn),可以

33、為后面進(jìn)一步進(jìn)行精確定位創(chuàng)造良好的條件,以達(dá)到最優(yōu)的系統(tǒng)性能。研究中可以和其他方法交叉使用,提高檢測速度和精度。2.2基于模板匹配的方法模板匹配是一種經(jīng)典的模式識別方法,該方法的思想是首先建立一個(gè)標(biāo)準(zhǔn)的人臉模板,由包含局部人臉特征的子模板構(gòu)成,然后對一幅輸入圖像進(jìn)行全局搜索,對應(yīng)不同尺度大小的圖像窗口,計(jì)算模板與待檢測圖像之間的相關(guān)性,通過預(yù)先設(shè)置的閾值來判斷候選圖像區(qū)域是否為人臉區(qū)域。檢測時(shí),將模板在被檢測的區(qū)域內(nèi)分別在行和列方向上移動(dòng),計(jì)算出相關(guān)值最大的區(qū)域就是人臉區(qū)域。此方法的優(yōu)點(diǎn)是簡單好用;缺點(diǎn)是計(jì)算量大,速度慢,算法復(fù)雜度高。2.2.1 通用模板匹配法此方法首先根據(jù)人臉的先驗(yàn)知識設(shè)計(jì)

34、出一個(gè)或多個(gè)人臉輪廓模板以及各個(gè)器官特征子模板,然后通過計(jì)算樣本圖像中臉部輪廓區(qū)域和人臉輪廓模板的相關(guān)值來檢測出人臉候選區(qū)域,最后利用眼睛、鼻子等器官特征子模板驗(yàn)證上一步檢測出的人臉候選區(qū)域是否包含人臉。這種方法的優(yōu)點(diǎn)是比較簡單,但由于人臉特征復(fù)雜且變化很大,很難得到有效的通用模板來表示人臉的共性,且不能有效處理尺寸、姿態(tài)和形狀的變化,因而在很多場合并不適用。這種方法目前已不多見,但人們在有的系統(tǒng)中將其作為粗檢測或預(yù)處理的手段。在實(shí)際中多采用多分辨率、多尺度、多子模板和可變形模板實(shí)現(xiàn)模板匹配,用來增加適應(yīng)性和準(zhǔn)確性。2.2.2 可變形模板匹配法可變形模板匹配是wiskott等提出的一種基于小波

35、變換的人臉匹配算法。該方法用小波變換的結(jié)果描述人臉的局部信息,并通過人臉網(wǎng)格特征點(diǎn)的不斷移動(dòng),搜索特征點(diǎn)的準(zhǔn)確位置,可以說是幾何特征方法的一種改進(jìn)。找到特征點(diǎn)后,就可以根據(jù)每個(gè)特征點(diǎn)上小波變換的結(jié)果,對待檢測人臉和庫中的人臉進(jìn)行識別比較。具體來說,該算法主要思想是根據(jù)臉部特征和形狀特點(diǎn)定義一個(gè)可變形的參數(shù)模板和一個(gè)能量函數(shù)來描述特征,通過一個(gè)非線性最優(yōu)化方法求得能使能量函數(shù)最小的參數(shù)模板,此模板即被認(rèn)為是所求特征的描述。此方法的優(yōu)點(diǎn)是充分考慮到了人臉是變形體的特點(diǎn),穩(wěn)定可靠,而且與姿態(tài)和光照無關(guān),但仍然存在能量函數(shù)的加權(quán)系數(shù)難以適應(yīng)一般情況和能量函數(shù)優(yōu)化耗時(shí)、計(jì)算量巨大的問題,所以難以實(shí)現(xiàn)實(shí)時(shí)

36、的應(yīng)用。2.3基于統(tǒng)計(jì)模型的方法此方法遵循一種統(tǒng)一的模式,將人臉檢測問題轉(zhuǎn)化為模式識別的二分類問題,即利用統(tǒng)計(jì)分析與機(jī)器學(xué)習(xí)的方法來尋找出人臉樣本與非人臉樣本各自的統(tǒng)計(jì)特征,繼而在大量訓(xùn)練樣本集的基礎(chǔ)上構(gòu)建一個(gè)能對人臉和非人臉樣本進(jìn)行正確識別的分類器,然后對被檢測圖像進(jìn)行全局掃描,使用分類器掃描完成人臉檢測。采用這種檢測模式的理論依據(jù)是:人臉具有統(tǒng)一的結(jié)構(gòu)模式(都是由眉毛,眼睛,鼻子和嘴唇等人臉器官構(gòu)成),如果把所有的圖像集看作一個(gè)高維線性空間,那么整個(gè)人臉圖像集僅對應(yīng)于其中的某個(gè)子空間。于是可以通過檢驗(yàn)待測圖像窗口是否落在這個(gè)子空間中來確定是否為人臉。因此,可以通過大量的人臉和非人臉樣本來建

37、立一個(gè)分類器,使它能夠正確分辨這兩種不同的圖像模式,再利用訓(xùn)練好的分類器在未知的圖像中檢測人臉。采用這種檢測策略的關(guān)鍵在于如何選取大量的具有代表性的圖像樣本,特別是非人臉圖像樣本訓(xùn)練分類器。 此方法是目前比較流行的方法,是解決復(fù)雜人臉檢測問題的有效途徑。它的優(yōu)點(diǎn)如下:1)不依賴于人臉的先驗(yàn)知識和參數(shù)模型,可以避免不精確或者不完整知識造成的錯(cuò)誤;2)采用了樣本學(xué)習(xí)方法得到模型的參數(shù),在統(tǒng)計(jì)意義上更加可靠;3)通過增加樣本的訓(xùn)練可以擴(kuò)充檢測模式的范圍、提高檢測系統(tǒng)的魯棒性。因此,基于統(tǒng)計(jì)模型的方法大多適用于復(fù)雜背景圖像中的人臉檢測。2.3.1 子空間方法子空間分析(subspace analysi

38、s)方法是基于統(tǒng)計(jì)模型方法中的一種,又稱為基于特征空間方法。它的主要思想就是把高維空間中松散分布的人臉圖像通過線性或非線性變換壓縮到一個(gè)低維的子空間中去。根據(jù)其在子空間中的分布規(guī)律劃分 “人臉”與“非人臉”兩類模式。子空間方法主要包括兩類: 主分量分析(pca)方法主分量分析方法(pca,principal-component analysis)是最早由pentland引入到人臉檢測的子空間方法,它根據(jù)圖像的統(tǒng)計(jì)特性進(jìn)行正交變換(kl變換),以消除原來各分量之間的相關(guān)性,取變換后所得到的最大的若干個(gè)特征向量(即特征臉)來表示原圖像,保留了原圖像差異的最大信息,這若干個(gè)特征向量就稱為主分量。 線

39、性判別分析(lda)方法線性判別分析(liner discriminant analysis)方法也叫做fisher線性判別法(fisher liner discriminant),是模式識別的經(jīng)典算法。它是在1996年由belhumeur引入模式識別和人工智能領(lǐng)域的。此算法的基本思想是將高維的模式樣本投影到最佳鑒別矢量空間,以達(dá)到抽取分類信息和壓縮特征空間維數(shù)的效果,投影后保證模式樣本在新的子空間中具有最佳可分離性,因此它是一種有效的特征提取方法。2.3.2人工神經(jīng)網(wǎng)絡(luò)方法人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ann)方法的研究具有悠久的歷史,它是一種以大量處理單

40、元(神經(jīng)元)為節(jié)點(diǎn),大量處理單元之間實(shí)現(xiàn)加權(quán)值互聯(lián)的復(fù)雜拓?fù)浣Y(jié)構(gòu),處理單元是人類大腦神經(jīng)單元的簡化,結(jié)構(gòu)上更類似于人腦,是一種更接近人智能的信息處理方式。人工神經(jīng)網(wǎng)絡(luò)是一個(gè)非線性動(dòng)力學(xué)系統(tǒng),在解決問題的自適應(yīng)性和魯棒性方面表現(xiàn)出極好的特性,其特色在于信息的分布式存儲的并行協(xié)同處理,具有非線性特性、良好的容錯(cuò)能力、聯(lián)想記憶功能以及通過學(xué)習(xí)獲取知識并解決問題的能力,用以解決復(fù)雜模式識別與行為控制問題?;谏窠?jīng)網(wǎng)絡(luò)的人臉識別方法是最近幾年比較活躍的一個(gè)研究方向,已被應(yīng)用于人臉檢測、正面人臉識別、表情分析等問題,并取得了較好的效果。mit(麻省理工大學(xué))的學(xué)者首先對樣本集合中的人臉樣本集和非人臉樣本集

41、進(jìn)行類聚,以測試樣本與人臉樣本集和非人臉樣本集的子類之間的距離作為識別特征向量,利用多層感知網(wǎng)絡(luò)作為分類器。cmu的研究人員則直接以圖像作為神經(jīng)網(wǎng)絡(luò)的輸入,設(shè)計(jì)了一個(gè)具有獨(dú)特結(jié)構(gòu)的適用于人臉特征的神經(jīng)網(wǎng)絡(luò)分類器,并且通過前饋神經(jīng)網(wǎng)絡(luò)對人臉檢測結(jié)果進(jìn)行了優(yōu)化?;谏窠?jīng)網(wǎng)絡(luò)的人臉識別方法要求訓(xùn)練集中包含較多的人臉的數(shù)目,只能適合于小型人臉庫。另外,由于原始灰度圖像數(shù)據(jù)量龐大,神經(jīng)網(wǎng)絡(luò)的神經(jīng)元數(shù)目通常很大,因此該方法仍然存在運(yùn)算量大、訓(xùn)練時(shí)間長、過程較復(fù)雜、收斂速度慢以及容易陷入局部最小等問題,成為制約其在人臉識別中更加廣泛應(yīng)用的主要因素。2.3.3 支持向量機(jī)方法支持向量機(jī)(svm,support

42、 vector machine)是由boser、guyon、vapnik等人在colt-92上提出的一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的統(tǒng)計(jì)學(xué)習(xí)理論,用于分類與回歸問題。由于其出色的學(xué)習(xí)性能,該技術(shù)已成為當(dāng)前國際機(jī)器學(xué)習(xí)界的研究熱點(diǎn),在模式識別、回歸估計(jì)、函數(shù)逼近等領(lǐng)域有了廣泛的應(yīng)用。支持向量機(jī)的基本思想是通過內(nèi)積函數(shù)定義的非線性變換,將輸入空間變換到一個(gè)高維的線性空間,然后在這個(gè)空間中求取最優(yōu)分類面。為了解決小樣本的學(xué)習(xí)問題,osuna首先將支持向量機(jī)引入人臉檢測中。支持向量機(jī)方法是依據(jù)統(tǒng)計(jì)學(xué)習(xí)理論(statistical learning theory,slt)發(fā)展起來的一種通用的模式識別方法,根

43、據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,以期獲得最好的推廣能力。傳統(tǒng)學(xué)習(xí)理論力圖使經(jīng)驗(yàn)風(fēng)險(xiǎn)(experience risk)最小化,而svm力圖使學(xué)習(xí)過程中的結(jié)構(gòu)風(fēng)險(xiǎn)(struemral risk)最小化,從而表現(xiàn)出很多優(yōu)于已有方法的性能。90年代以來,一直引起各領(lǐng)域的廣泛注意和研究者的極大興趣。2.3.4隱馬爾可夫模型隱馬爾可夫模型(hidden markov model)是用于描述信號統(tǒng)計(jì)特性的一組常用統(tǒng)計(jì)模型,能夠很好的處理隨機(jī)時(shí)序數(shù)據(jù)的識別與預(yù)測。hmm使用馬爾科夫鏈來模擬信號統(tǒng)計(jì)特征的變化,而統(tǒng)計(jì)特征的變化又是間接地通過觀察序列來描述的,因此hmm過程是一個(gè)雙重隨機(jī)

44、過程。其中之一是馬爾可夫鏈,這是基本隨機(jī)過程,它描述狀態(tài)的轉(zhuǎn)移;另一個(gè)隨機(jī)過程描述狀態(tài)和觀察值之間的統(tǒng)計(jì)對應(yīng)關(guān)系。在hmm中,用節(jié)點(diǎn)來表示狀態(tài),用有向邊來表示狀態(tài)之間的轉(zhuǎn)移,一個(gè)狀態(tài)可以具有特征空間中的任意特征。對同一特征,不同狀態(tài)表現(xiàn)出這一特征的概率不同。hmm的主要問題是評估、估計(jì)和解碼。根據(jù)狀態(tài)轉(zhuǎn)移的類型,hmm可分為遍歷型和左右型。前者表示狀態(tài)轉(zhuǎn)移是任意的,可以到本身和其他所有狀態(tài);后者狀態(tài)轉(zhuǎn)移只限于本身和下一個(gè)狀態(tài)。由于hmm是一個(gè)統(tǒng)計(jì)模型,對于同一特征序列,可能會對應(yīng)許多狀態(tài)序列,特征序列與狀態(tài)序列之間的對應(yīng)關(guān)系是非確定的。這種模型對于狀態(tài)序列來說是隱含的,可以觀察到的是各個(gè)狀態(tài)產(chǎn)

45、生的非確定的觀察值,因此稱為隱馬爾可夫模型。利用hmm對人臉進(jìn)行描述和識別,把面部器官特征和一個(gè)狀態(tài)轉(zhuǎn)移模型聯(lián)系起來,既考慮了人臉的各個(gè)器官的不同特征,又考慮了他們的關(guān)聯(lián),比起孤立地利用各個(gè)器官的數(shù)值特征有概念上的進(jìn)步,該模型的參數(shù)能較好的表示具體的人臉模型。hmm方法的魯棒性較好,對表情、姿態(tài)變化不太敏感,對于不同角度的人臉圖像和不同的光照條件,都可以達(dá)到滿意的識別精度。2.3.5 adaboost方法adaboost 算法是由yoav freund和robert eschapire在1995 年提出的一種快速人臉檢測算法,它是人臉檢測領(lǐng)域里程碑式的進(jìn)步,其核心思想是針對同一個(gè)訓(xùn)練集訓(xùn)練不同

46、的分類能力一般的簡單分類器(弱分類器),然后把這些弱分類器集合起來,構(gòu)成一個(gè)更強(qiáng)的最終分類器(強(qiáng)分類器)。其算法本身是通過改變數(shù)據(jù)分布來實(shí)現(xiàn)的,它根據(jù)每次訓(xùn)練集之中每個(gè)樣本的分類是否正確,以及上次的總體分類的準(zhǔn)確率,來確定每個(gè)樣本的權(quán)值。將修改過權(quán)值的新數(shù)據(jù)集送給下層分類器進(jìn)行訓(xùn)練,最后將每次訓(xùn)練得到的分類器融合起來,作為最后的決策分類器。使用adaboost分類器可以排除一些不必要的訓(xùn)練數(shù)據(jù)特征,并將關(guān)鍵放在關(guān)鍵的訓(xùn)練數(shù)據(jù)上面。這種算法根據(jù)弱學(xué)習(xí)的反饋,適應(yīng)性地調(diào)整假設(shè)的錯(cuò)誤率,使在效率不降低的情況下,檢測正確率得到了很大的提高。adaboost算法是目前人臉檢測方面檢測速度較快、檢測效率較

47、高的一種檢測方法,它是把弱分類器采用級聯(lián)的方式訓(xùn)練成為強(qiáng)分類器的迭代方法。這些弱分類器只需滿足比隨機(jī)猜測好一點(diǎn),就能通過不斷修正每個(gè)弱分類器的權(quán)值,即挑選好的分類器,拋棄不好的分類器,最終形成由這些弱分類器組成的強(qiáng)分類器,與其它的人臉檢測算法相比,adaboost方法對每個(gè)弱分類器的權(quán)值的形成都是完全自動(dòng)化的,因而adaboost算法有著很好的易用性。大量的實(shí)驗(yàn)證明,adaboost算法訓(xùn)練的分類器具有比較好的分類效果,檢測速度較快,效率高。viola等人在2001年提出使用adaboost學(xué)習(xí)算法的快速人臉檢測方法,實(shí)現(xiàn)了實(shí)時(shí)的正面人臉檢測系統(tǒng)。viola的系統(tǒng)中核心思想主要有三個(gè): 提出了

48、一種稱為“積分圖像”的圖像表示方法,這種表示法能夠快速計(jì)算出檢測器用到的特征; 采用基于haar-like特征的adaboost學(xué)習(xí)算法,從一個(gè)較大的特征集中選擇少量的關(guān)鍵視覺特征,產(chǎn)生一個(gè)高效分類器; 再用級聯(lián)的方式將單個(gè)的分類器合成為一個(gè)更加復(fù)雜的分類器,使圖像的背景區(qū)域可以被快速地被丟棄,而在有可能存在目標(biāo)(人臉)的區(qū)域花費(fèi)更多的計(jì)算。該人臉檢測系統(tǒng)在實(shí)時(shí)正面人臉檢測中能夠達(dá)到15幀秒的速率。由于該方法能夠達(dá)到較高的檢測率并且具有目前最好的實(shí)時(shí)性,因此激發(fā)了更多研究人員在基于類haar特征和boost學(xué)習(xí)算法的實(shí)時(shí)人臉檢測算法方面的研究。2.4本章小結(jié)本章主要對人臉檢測的各種算法進(jìn)行了綜

49、述,將人臉檢測進(jìn)行分類,分為基于幾何特征、基于模板匹配和基于統(tǒng)計(jì)模型三大塊進(jìn)行介紹,介紹了各種人臉檢測算法的基本原理和優(yōu)缺點(diǎn)。3 opencv概述及安裝配置方法3.1 opencv概述3.1.1 opencv簡介opencv(open source computer vision library)是intel公司開發(fā)的圖像處理和計(jì)算機(jī)視覺開放源碼庫,是于1999年在俄羅斯設(shè)立的軟件開發(fā)中心“software development center”開發(fā)的,它由一系列的c函數(shù)和c+類組成,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺方面的很多通用算法。opencv包含300多個(gè)c/c+函數(shù)的跨平臺的中、高層api(

50、application programming interface,應(yīng)用程序編程接口),具有強(qiáng)大的圖像和矩陣運(yùn)算能力。盡管也可以使用某些外部庫,但opencv不依賴于其他的外部庫。opencv是在ipl圖像處理庫(image processing library)的基礎(chǔ)上發(fā)展起來的,在ipl支持下, 可輕松實(shí)現(xiàn)物體輪廓跟蹤、圖像的幾何處理、形態(tài)學(xué)處理、圖像特征提取、背景分離、金字塔算法、種子填充算法、光流算法、主動(dòng)輪廓算法、相機(jī)的較正、姿勢的識別等很多操作。opencv的設(shè)計(jì)簡單易用,其中大部分類及庫函數(shù)的設(shè)計(jì)都有其特定的在實(shí)際應(yīng)用中的背景,因此整個(gè)庫的體系結(jié)構(gòu)非常簡單明了提供了一些與諸如ei

51、c、ch、matlab等其它語言或環(huán)境的接口,最大的特點(diǎn)是具有開放性。opencv主要用于對圖像進(jìn)行一些高級處理,比如說特征檢測與跟蹤、運(yùn)動(dòng)分析、目標(biāo)分割與識別以及3d重建等。由于opencv的源代碼是完全開放的,而且源代碼的編寫簡潔而高效,特別是其中大部分的函數(shù)都已經(jīng)通過匯編最優(yōu)化,以使之能高效而充分地利用英特爾系列處理芯片的設(shè)計(jì)體系,執(zhí)行效率是非常高,所以近年來在國外的圖像處理相關(guān)領(lǐng)域中被廣泛地使用,成為一種流行的圖像處理開發(fā)包。3.1.2 opencv基本結(jié)構(gòu)和內(nèi)容opencv主體分為5個(gè)主要模塊,分別包括下面幾類: cxcore:包括一些基本結(jié)構(gòu)和算法函數(shù),如數(shù)據(jù)結(jié)構(gòu)與線性代數(shù)支持,主

52、要提供對各種數(shù)據(jù)類型的基本運(yùn)算功能。 cv:圖像處理和計(jì)算機(jī)視覺功能,是主要的opencv函數(shù),包括圖像處理、結(jié)構(gòu)分析、運(yùn)動(dòng)分析、物體跟蹤、模式識別及攝像機(jī)標(biāo)定等功能。 cxaux:opencv附加庫函數(shù),包括一些實(shí)驗(yàn)性的函數(shù),如view morphing、三維跟蹤、pca(principal components analysis)和hmm(hidden markov model)等函數(shù)。 highgui:用戶交互部分,包括gui(graphical user interface)、圖像及視頻i/o和系統(tǒng)調(diào)用函數(shù)等。 ml:新加入的機(jī)器學(xué)習(xí)模塊,包含一些基于統(tǒng)計(jì)的分類和聚類工具。模塊結(jié)構(gòu)圖如

53、下圖3.1所示: cv圖像處理和視覺算法 ml 統(tǒng)計(jì)分類器 highguigui,圖像和視頻的i/o cxcore基本結(jié)構(gòu)和算法,xml支持,繪圖函數(shù)圖3.1 opencv的基本結(jié)構(gòu)圖3.1中并沒有包含cvaux模塊,該模塊中一般存放一些即將被淘汰的算法和函數(shù)(如基于嵌入式hmm模型的人臉識別算法),同時(shí)還有一些新出現(xiàn)的實(shí)驗(yàn)性的算法和函數(shù)(如背景和前景的分割)。3.1.3 opencv功能與優(yōu)勢1. opencv的主要功能如下:(1)對圖像數(shù)據(jù)的操作:包括分配、釋放、復(fù)制、設(shè)置和轉(zhuǎn)換。(2)對圖像和視頻的輸入輸出:以文件和攝像頭作為輸入,圖像和視頻文件作為輸出。(3)具有對矩陣和向量的操作以及

54、線性代數(shù)的算法程序:包括矩陣積、解方程、特征值以及奇異值等。 (4)可對各種動(dòng)態(tài)數(shù)據(jù)結(jié)構(gòu)進(jìn)行操作:如列表、隊(duì)列、集合、樹、圖等。 (5)具有基本的數(shù)字圖像處理能力:可進(jìn)行濾波、邊緣檢測、角點(diǎn)檢測、采樣與差值、色彩空間轉(zhuǎn)換、形態(tài)操作、直方圖、圖像金字塔等操作。 (6)可對各種結(jié)構(gòu)進(jìn)行分析:包括連接部件、輪廓處理、距離變換、各種矩的計(jì)算、模板匹配、hough變換、直線擬合、橢圓擬合等。 (7)對攝像頭進(jìn)行定標(biāo):包括發(fā)現(xiàn)與跟蹤定標(biāo)模式、定標(biāo)、基本矩陣估計(jì)、齊次矩陣估計(jì)和立體對應(yīng)。(8)對運(yùn)動(dòng)的分析:如對光流、運(yùn)動(dòng)分割、跟蹤的分析。 (9)對目標(biāo)的識別:包括特征法、隱馬爾可夫模型法。 (10)具有基本

55、的gui功能:包括圖像和視頻的顯示、鍵盤和鼠標(biāo)事件處理、滾動(dòng)條等。(11)圖像標(biāo)注:如線、二次曲線、多邊形、畫文字等。 2. opencv作為一種開源的計(jì)算機(jī)視覺庫,在計(jì)算機(jī)視覺領(lǐng)域得到廣泛應(yīng)用,與其具有的不可比擬的優(yōu)勢是密不可分的:(1)跨平臺可移植性好,無論windows、linux還是mac 0s都可以運(yùn)行;(2)對個(gè)人及商業(yè)開發(fā)免費(fèi),源代碼公開; (3)支持大多數(shù)cc+編譯器,如:vc+6.0、vcnet2008、vc.net2005及c+builder等,可以輕易在不同平臺之間進(jìn)行移植; (4)提供方便靈活的用戶接口,采用c、c+編寫,包括300多個(gè)cc+函數(shù),代碼效率高;支持中、高

56、層api;可以使用外部庫,也可以獨(dú)立使用; (5)具備強(qiáng)大的圖像和矩陣運(yùn)算能力,減少開發(fā)者的工作量,有效提高開發(fā)效率和程序運(yùn)行的可靠性; (6)針對intel的處理器進(jìn)行了優(yōu)化。3.2 opencv的安裝及在vc+6.0環(huán)境下的配置 1. opencv的安裝首先安裝visual c+6.0開發(fā)環(huán)境,然后安裝opencv。首先,運(yùn)行下載的opencv1.0安裝程序,按照安裝向?qū)У奶崾静僮?,選擇安裝路徑為“d:program filesopencv”,然后點(diǎn)擊next,到如圖3.2所示界面時(shí),勾選“addopencvbin to the system path”復(fù)選框,即將路徑“d:program filesopencvbin”加入系統(tǒng)變量path中,或者不選擇,安裝后右鍵單擊“我的電腦”-“屬性”中將其加入。圖3.2 opencv的安裝2. vis

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論