版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1緒論1.1研究背景在信息高速發(fā)展的今天,幾乎全部領(lǐng)域都離不開(kāi)計(jì)算機(jī),在滿足人們的習(xí)慣方式和生活習(xí)慣下,讓計(jì)算機(jī)進(jìn)行較好的通信,是計(jì)算機(jī)智能的一種必備的條件。其中,計(jì)算機(jī)智能視覺(jué)是其應(yīng)用的重要方向,它是研究使用多個(gè)成像輸入設(shè)備替代人類(lèi)視覺(jué)器官的領(lǐng)域叫智能視覺(jué),并使用智能設(shè)備來(lái)替代人們完畢識(shí)別和分析。讓智能設(shè)備能夠像人類(lèi)同樣觀察和理解是人們研究計(jì)算機(jī)視覺(jué),并且智能設(shè)備還能隨著環(huán)境的變化而做出對(duì)應(yīng)的變化。行人檢測(cè)是計(jì)算機(jī)視覺(jué)的一種具體體現(xiàn)形式,并應(yīng)用在下列方面:智能監(jiān)控現(xiàn)在,為了避免財(cái)產(chǎn)安全和留下有效的證據(jù),大部分的公眾場(chǎng)合都裝備了攝像監(jiān)控設(shè)備。但是,這些監(jiān)控設(shè)備大部分還是有專(zhuān)人進(jìn)行的查看的,這會(huì)造成下列問(wèn)題的出現(xiàn),首先長(zhǎng)時(shí)間的監(jiān)控,監(jiān)控人員很可能出現(xiàn)疲倦,可能造成某些重要信息的遺漏,另首先不能充足的把監(jiān)控信息運(yùn)用起來(lái)。然而人工的局限性能夠運(yùn)用行人檢測(cè)有關(guān)技術(shù)較好的解決,這樣不僅能夠減少多個(gè)資源的投入,又能夠讓監(jiān)控的精確度得到較好的改善,當(dāng)碰到緊急狀況有能夠及時(shí)預(yù)警。車(chē)輛輔助系統(tǒng)隨著社會(huì)的發(fā)展,人民的經(jīng)濟(jì)水平不停提高,汽車(chē)逐步走入了千家萬(wàn)戶,然而汽車(chē)數(shù)量的急劇增加也造成了頻繁的交通事故,無(wú)情的奪去了人們的生命財(cái)產(chǎn)安全。如果我們將行人檢測(cè)系統(tǒng)加入到汽車(chē)控制系統(tǒng)中,這樣在行駛過(guò)程中車(chē)輛附近的人們能夠被識(shí)別出來(lái),極大了避免的交通事故的發(fā)生。這樣不僅能夠有效的減少交通事故,并且這也能夠帶來(lái)汽車(chē)行業(yè)的革命式變化。事實(shí)上,現(xiàn)在有許多公司已經(jīng)研制出了無(wú)人駕駛的汽車(chē),這些車(chē)的使用都需要行人檢測(cè)技術(shù),固然現(xiàn)在的能智能還沒(méi)進(jìn)入市場(chǎng),現(xiàn)在還在實(shí)驗(yàn)當(dāng)中。高級(jí)人機(jī)接口在21世紀(jì),計(jì)算機(jī)技術(shù)得到了迅猛發(fā)展,并且更加趨于智能化的特點(diǎn),極大地變化了我們的生活方式。我們不僅規(guī)定計(jì)算機(jī)能夠快速精確的接受到外界輸入的信息,并且能夠高效地對(duì)信息進(jìn)行解決并得到最適宜的輸出信息,作出的對(duì)應(yīng)的反映。人臉識(shí)別技術(shù)和物體檢測(cè)技術(shù)的發(fā)展,能夠較好的協(xié)助計(jì)算機(jī)去獲取和解決外界的信息。這不僅需要良好的智能設(shè)備,同時(shí)也需要行人檢測(cè)技術(shù)去協(xié)助完畢。1.2研究現(xiàn)狀行人檢測(cè)在汽車(chē)領(lǐng)域含有很大的應(yīng)用前景,近年來(lái)是模式識(shí)別領(lǐng)域研究的熱點(diǎn)課題方向之一。并且國(guó)內(nèi)外也有了諸多了研究成果,如由本田公司研發(fā)的基于紅外攝像機(jī)的行人檢測(cè)系統(tǒng)[1];CMU[2]、MIT[3]等國(guó)外的大學(xué)在這方面獲得了很大的進(jìn)步,清華大學(xué)[4]等也進(jìn)行了有關(guān)方面的研究。行人檢測(cè)技術(shù)事實(shí)上為圖像解決技術(shù)的分支,其核心思想就是運(yùn)用計(jì)算機(jī)視覺(jué)技術(shù)和數(shù)字圖像解決技術(shù),去分析監(jiān)控設(shè)備獲取的信息,分析解決行人的行為。行人檢測(cè)的成功開(kāi)發(fā)含有很大的應(yīng)用前景,能夠在各個(gè)領(lǐng)域得到發(fā)展。并且由于檢測(cè)的行人外形不同,加上周邊的復(fù)雜混亂的環(huán)境,給行人檢測(cè)系統(tǒng)的運(yùn)行帶來(lái)了很大的挑戰(zhàn)。早期的行人檢測(cè)以靜態(tài)圖像解決中的分割、邊沿提取、運(yùn)動(dòng)檢測(cè)等辦法為主。例如:(1)以Gavrila為代表的全局模板辦法[5];(2)以Broggi為代表的局部模板辦法[6];(3)以Lipton為代表的光流檢測(cè)辦法[7];(4)以Heisele為代表的運(yùn)動(dòng)檢測(cè)辦法[8];(5)以Wohler為代表的神經(jīng)網(wǎng)絡(luò)辦法[9];但是這些辦法的檢測(cè)速度很慢,并且普遍存在著誤報(bào)、漏檢率高的特點(diǎn)。行人檢測(cè)的現(xiàn)狀:大致能夠分為兩類(lèi):(1)基于背景建模的辦法:分割出前景,提取運(yùn)動(dòng)目的,在進(jìn)一步提取特性,分類(lèi)鑒別。然而這個(gè)辦法構(gòu)建了很復(fù)雜的模型,因此系統(tǒng)很容易受到干擾。(2)基于統(tǒng)計(jì)學(xué)習(xí)的辦法:根據(jù)大量訓(xùn)練樣原來(lái)構(gòu)建行人檢測(cè)分類(lèi)器,提取樣本的特性,普通分類(lèi)器涉及SVM[10],AdaBoost[11]?,F(xiàn)在,基于學(xué)習(xí)的行人檢測(cè)辦法得到了很大的發(fā)展,如基于AdaBoost、基于SVM、基于HOG等行人檢測(cè)辦法。首先,這些辦法都是學(xué)習(xí)正樣本和負(fù)樣本的變化,再根據(jù)大量的訓(xùn)練樣本對(duì)不同的特性進(jìn)行分類(lèi),因此,基于統(tǒng)計(jì)學(xué)習(xí)的辦法有廣泛的合用性。在行人檢測(cè)系統(tǒng)中,目的記別和ROIs分割是兩個(gè)重要的部分。目的記別根據(jù)監(jiān)測(cè)信息的不同分為基于形狀的辦法和基于運(yùn)動(dòng)的辦法。ROIs分割可分為基于運(yùn)動(dòng)、基于距離、基于圖像特性和基于攝像機(jī)參數(shù)四種辦法。在具體操作中,普通將這四種辦法綜合起來(lái)使用,能獲得更加好的成果。研究難點(diǎn)現(xiàn)在行人檢測(cè)技術(shù)面臨著以下的技術(shù)難點(diǎn):(a)每個(gè)人都有各自的姿態(tài),著裝各異;(b)特性空間的待提取的特性分布不集中;(c)受訓(xùn)練的樣本變化大,造成系統(tǒng)分類(lèi)效果的好壞;(d)受訓(xùn)練的樣本很難包含多個(gè)復(fù)雜的真實(shí)環(huán)境;現(xiàn)在的行人檢測(cè)技術(shù)正處在發(fā)展的核心時(shí)期,已經(jīng)獲得了某些可喜的進(jìn)步,但許多難點(diǎn)問(wèn)題急待解決。在某些環(huán)境背景良好的狀況下,行人檢測(cè)算法檢測(cè)效果較好,但是實(shí)際中諸多環(huán)境是很復(fù)雜的,檢測(cè)的效果并不能滿足規(guī)定。另外,檢測(cè)時(shí)會(huì)有延時(shí)也減少了系統(tǒng)的實(shí)用性,并且現(xiàn)在還缺少原則的測(cè)試辦法和數(shù)據(jù)庫(kù)的建立。本文研究的重要內(nèi)容首先,本文簡(jiǎn)要地介紹了現(xiàn)在的多個(gè)算法,并互相對(duì)比,指出其中的優(yōu)點(diǎn)和存在的問(wèn)題。另首先,介紹本文研究的重要算法HOG算法原理,并進(jìn)行改善,并比較改善前后,算法性能的變化。最后,本文提出HOG+SVM算法,通過(guò)將現(xiàn)有的HOG算法和SVM分類(lèi)器,巧妙的將兩者結(jié)合改善,使之滿足多個(gè)復(fù)雜條件。本文的創(chuàng)新之處在于,通過(guò)將HOG和SVM算法結(jié)合并加以改善,使檢測(cè)效率大大提高,并且實(shí)時(shí)性更強(qiáng)。本文構(gòu)造:第一章是緒論,介紹了行人檢測(cè)的背景和意義,并敘述了其研究現(xiàn)狀,給出了本文的研究?jī)?nèi)容;第二章具體介紹了行人檢測(cè)重要算法,并互相比較,得到其中的優(yōu)缺點(diǎn);第三章重要介紹HOG算法原理以及該算法的優(yōu)缺點(diǎn);第四章研究了基于HOG和SVM算法的行人檢測(cè)算法,并進(jìn)行了改善得到實(shí)驗(yàn)成果,具體分析后得到結(jié)論;第五章重要是對(duì)本文研究的總結(jié)以及將來(lái)技術(shù)發(fā)展的展望。2行人檢測(cè)重要辦法介紹及比較2.1引言現(xiàn)在,隨著智能交通的發(fā)展,行人檢測(cè)這方面的算法的研究也在不停的進(jìn)一步,每年都會(huì)涌現(xiàn)出諸多優(yōu)秀的文論,有的是對(duì)行人檢測(cè)進(jìn)行全新的研究,或者是對(duì)原有算法進(jìn)行進(jìn)一步的改善,提高檢測(cè)的精確度以及檢測(cè)的速度,加緊了行人檢測(cè)的實(shí)用化進(jìn)程。下列是對(duì)兩類(lèi)算法的具體介紹:第一類(lèi)為基于特性的算法。在將矩形框范疇內(nèi)的行人作為一種整體的前提下,它的核心在于找到能夠代表框內(nèi)行人的特性信號(hào)參數(shù),然后運(yùn)用機(jī)器學(xué)習(xí)算法將這種參數(shù)進(jìn)行分類(lèi),這樣就能夠分辨行人和非行人,達(dá)成識(shí)別的目的。從這個(gè)過(guò)程中,我們能夠懂得基于特性的算法分為分類(lèi)器的學(xué)習(xí)和特性的提取,因此一種好的特性提取算法變得很重要。例如HOG特性、wavelet特性、shapelet特性,LBP等。該類(lèi)辦法的實(shí)現(xiàn)的算法比較簡(jiǎn)樸,架構(gòu)容易,當(dāng)使用不同特性辦法時(shí),也不用更改原來(lái)的架構(gòu),且易于實(shí)現(xiàn)。然而能夠使用分類(lèi)效果好的特性,就能夠較好地從被檢測(cè)目的較好的檢測(cè)出行人目的。前面我們提到行人都有各自的特點(diǎn),因此現(xiàn)在很難找到一種完美的算法來(lái)描述行人的特性。特別是在行人行走過(guò)程中,行人的姿勢(shì)不停變化、監(jiān)控設(shè)備的視角也在變化、同時(shí)行人也會(huì)被其它物體遮掩?,F(xiàn)在的全部特性參數(shù)不能獲得較好的效果?,F(xiàn)在,被研究人員認(rèn)為最穩(wěn)定的特性是行人的輪廓,因此諸多研究人員都將重點(diǎn)放在了提取行人的輪廓信息。第二類(lèi)為基于多部位的辦法,就是分別取檢測(cè)人的各個(gè)部位,然后綜合起來(lái)判斷與否是行人。通過(guò)一定的算法,來(lái)分析各個(gè)部位的關(guān)系,從而判斷與否為行人目的。當(dāng)行人在行走過(guò)程中發(fā)生部分遮掩,使用該類(lèi)辦法能夠較好的解決,并且解決效果要比第一類(lèi)辦法好許多。但是,該類(lèi)辦法的核心在于,如何通過(guò)一種有效的機(jī)制,將各部分的檢測(cè)成果合成一種整體,來(lái)判斷與否為檢測(cè)的目的。受到人臉識(shí)別的啟發(fā),將人臉的正側(cè)面分別作為訓(xùn)練樣本,減少類(lèi)內(nèi)差別,能夠使訓(xùn)練難度減少。在這里,我們能夠?qū)⑿腥朔譃檎婧蛡?cè)面,按照類(lèi)似的解決辦法,同樣得到了一定的成果。但是,在無(wú)形之中需要增加諸多的訓(xùn)練樣本值,使得工作量變大諸多。但是解決效果較好。2.2基于特性的辦法2.2.1wavelet特性在1997年,機(jī)器學(xué)習(xí)的思想被Oren[18]第一次引進(jìn)到行人檢測(cè)領(lǐng)域,該辦法的大致是通過(guò)大量的訓(xùn)練樣本,然后對(duì)樣本進(jìn)行學(xué)習(xí),形成適宜的模型,使得機(jī)器能夠通過(guò)自動(dòng)學(xué)習(xí)來(lái)建立模型。這種辦法使行人檢測(cè)獲得了很大的突破,開(kāi)創(chuàng)了行人檢測(cè)的新局面。但是隨著時(shí)間的變化,行人檢測(cè)的技術(shù)在不停的發(fā)展,該算法的效果并不能滿足人們的規(guī)定。理解它,能夠協(xié)助我們較好的學(xué)習(xí)后續(xù)的復(fù)雜的算法。該辦法的提出重要有下列的奉獻(xiàn):第一,該辦法實(shí)驗(yàn)成果表明,在行人檢測(cè)領(lǐng)域引入機(jī)器學(xué)習(xí)是很有必要的通過(guò)吧某些簡(jiǎn)樸的特性進(jìn)行分類(lèi)訓(xùn)練,然后加以分類(lèi)是一種較好的方案。第二,該辦法對(duì)負(fù)樣本的規(guī)范定義,在Oren提出該辦法之前,負(fù)樣本還沒(méi)用統(tǒng)一的原則。如何選用精確的負(fù)樣本,是許多研究人員關(guān)心的問(wèn)題,但是始終都沒(méi)有找到較好的方案。由于這種辦法的出現(xiàn),負(fù)樣本的訓(xùn)練對(duì)系統(tǒng)的益處大大地增加。在此之后,許多研究人員沿著這一方向繼續(xù)研究,并出現(xiàn)了新算法。2.2.2Adaboost算法Adaboost算法是通過(guò)變化數(shù)據(jù)的分布實(shí)現(xiàn)的,是一種迭代算法。在每次進(jìn)行訓(xùn)練之前,都會(huì)對(duì)之前全部訓(xùn)練的樣本進(jìn)行初始化權(quán)重,判斷上一輪分類(lèi)器的總體精確率。在對(duì)樣本就行訓(xùn)練時(shí),對(duì)完全能夠精確分類(lèi)的樣本,就減少它的權(quán)值。在下一輪訓(xùn)練時(shí),被選中的概率就會(huì)減少。與之相反的是,如果被判斷錯(cuò)誤的分類(lèi)樣本,在下一次訓(xùn)練時(shí),被選中作為樣本的概率就會(huì)變大。這樣,在每次訓(xùn)練時(shí),都會(huì)訓(xùn)練上一次被判斷為錯(cuò)誤分類(lèi)的樣本,學(xué)習(xí)了對(duì)的的樣本。最后由各個(gè)弱分類(lèi)器級(jí)聯(lián)成強(qiáng)分類(lèi)器。Adaboost算法不僅有計(jì)算效率高,弱分類(lèi)器的兼容性好、參數(shù)少等特點(diǎn)被廣泛應(yīng)用。2.2.3shapelet特性該算法是基于boosting算法進(jìn)行兩次解決。第一次提取某些簡(jiǎn)樸的的特性,然后對(duì)提取出的特性進(jìn)行訓(xùn)練,將訓(xùn)練的成果進(jìn)行加權(quán),得到shapelet。接下來(lái)第二次,是將得到的shapelet通過(guò)訓(xùn)練器再進(jìn)行訓(xùn)練,得到最后的訓(xùn)練分類(lèi)器。該算法的優(yōu)點(diǎn)在于,通過(guò)簡(jiǎn)樸的特性作為基礎(chǔ),通過(guò)學(xué)習(xí)、訓(xùn)練得到比較好的訓(xùn)練分類(lèi)器。因此該算法的性能比較良好,在檢測(cè)效率上,shapelet也高于與之相似的edgelet算法,應(yīng)用也很廣泛。2.3基于多部位的辦法2.3.1自適應(yīng)組合分類(lèi)器首先,該算法將人分為頭肩、左肩、右肩和下半身四個(gè)部分,然后運(yùn)用算法分別訓(xùn)練出每個(gè)部位的模型,得到各自的分類(lèi)器。該算法使用了基于小波的算法,但是特性的維數(shù)更高,因此性能也有了一定的提高。然后將這四個(gè)分類(lèi)器的參數(shù)作為最后分類(lèi)器的參數(shù)輸入,運(yùn)用算法再做訓(xùn)練,得到最后分類(lèi)器的模型。需要指出的是,必須在一定范疇內(nèi)對(duì)四個(gè)部位的分類(lèi)器進(jìn)行搜索,得到最優(yōu)的返回值。2.3.2基于貝葉斯推斷的組合算法基于貝葉斯推斷的辦法是由BoWu從概率角度出發(fā)提出的,然后通過(guò)一系列計(jì)算,得到最大概率解。在這個(gè)算法中,將人分成頭肩、軀干、腿部三個(gè)重要部分。類(lèi)似于2.3.1的辦法,首先,對(duì)檢測(cè)對(duì)象的三個(gè)部位進(jìn)行訓(xùn)練,得到訓(xùn)練分類(lèi)器,并進(jìn)行檢測(cè)。最后,將各個(gè)部分得到的實(shí)驗(yàn)成果比較分析,以貝葉斯為根據(jù)來(lái)判斷與否出現(xiàn)了行人。2.3.3隱式形狀模型該算法在訓(xùn)練階段,首先建立圖片塊字典,也就是為全部的圖片塊建一種索引。隨即,要得到圖片塊的任何信息時(shí),通過(guò)前面建立的索引,進(jìn)行查詢。首先,我們需要獲得在愛(ài)好點(diǎn)附近的圖片信息,并在對(duì)應(yīng)的字典中找到對(duì)應(yīng)的匹配項(xiàng),通過(guò)比對(duì)有關(guān)信息,對(duì)中心位置進(jìn)行分析即投票。毋庸置疑,那些得到票數(shù)最高將作為成果。最后,分析實(shí)驗(yàn)數(shù)據(jù),擬定實(shí)驗(yàn)成果。2.4基于多視角的辦法基于多視角的辦法在人臉識(shí)別的領(lǐng)域應(yīng)用很廣泛,但是將該辦法引入行人檢測(cè)方向的辦法現(xiàn)在還不是諸多。這是由于在不同視角下,人臉的差別是很大,但是對(duì)于行人來(lái)講該特性確要小諸多。另外,現(xiàn)在的訓(xùn)練樣本還不夠充足,不能得到抱負(fù)的實(shí)驗(yàn)效果?,F(xiàn)在多視角的辦法有下列幾個(gè):第一種辦法是對(duì)于視角的差別,我們并不做不同解決,而是將它們統(tǒng)一解決。正由于這樣解決,這種辦法的難點(diǎn)是如果不同的視角的物體差別很大,那將造成類(lèi)間差別很大,使得訓(xùn)練出來(lái)的分類(lèi)器是無(wú)效的。對(duì)于行人來(lái)說(shuō),有些狀況很特殊,即使各個(gè)視角的行人也有差別。但是那些差別還局限性以造成訓(xùn)練無(wú)法正常進(jìn)行,例如某些基于特性的辦法,并沒(méi)有考慮多視角問(wèn)題,但是檢測(cè)效果和識(shí)別效果同樣較好。第二種辦法是通過(guò)視角將樣本進(jìn)行分開(kāi),將不同分組的樣本分別訓(xùn)練成一種個(gè)分類(lèi)器,并分別檢測(cè)全部的分類(lèi)器。這個(gè)辦法的弊端在于,視角分的越多復(fù)雜度就越大,并且大大增加了人工的負(fù)擔(dān)。第三種辦法是提取不同視角之間的共同特點(diǎn),這樣能夠減少算法的復(fù)雜度,提高速度。這類(lèi)辦法不僅考慮了多視角的行人特性的不同,也考慮到了視角分類(lèi)太多類(lèi)內(nèi)變化大的缺點(diǎn)。因此,第三種辦法是現(xiàn)在研究的大趨勢(shì)?,F(xiàn)在,基于樹(shù)的構(gòu)造的分類(lèi)器已經(jīng)受到了越來(lái)越多人的關(guān)注,由于它能夠解決不同的實(shí)驗(yàn)樣本,提高了系統(tǒng)的性能。這樣既能夠有效的避免類(lèi)內(nèi)變化大的缺點(diǎn),又能夠解決視角特性不同帶來(lái)的誤差,這樣的能夠大大縮減算法的復(fù)雜度。
3基于HOG特性的行人檢測(cè)3.1引言行人檢測(cè)的目的是將每一幀圖像中行人識(shí)別出來(lái),并得到其空間位置。由于描述行人的辦法不同,普通將行人檢測(cè)算法分為下列三類(lèi):基于特性表述的辦法、基于模板匹配的辦法、基于紋理和形狀結(jié)合的辦法。另一種劃分方式是根據(jù)將行人與否作為整體進(jìn)行檢測(cè),能夠分為基于整體的檢測(cè)和基于部位的檢測(cè)。前面我們?cè)诘诙乱呀?jīng)學(xué)習(xí)到了HOG算法,在這一章,我們將進(jìn)一步研究HOG算法。首先,我們需要對(duì)每幀圖像進(jìn)行特性提取,然后將提取的特性訓(xùn)練生成分類(lèi)器。根據(jù)提取特性的映射分類(lèi)不同,分類(lèi)器模型有能夠分為鑒別模型和生成模型。由于運(yùn)用的是特性之間的近似性,生成模型重要從統(tǒng)計(jì)分類(lèi)學(xué)角度計(jì)算特性的聯(lián)合概率。它所針對(duì)的是特性之間的相似性,與之相反的是鑒別模型,鑒別模型是根據(jù)特性之間的差別性進(jìn)行的。在訓(xùn)練分類(lèi)的過(guò)程中,不停尋找不同特性所對(duì)應(yīng)的最優(yōu)分類(lèi)辦法。鑒別模式最典型的代表是SVM算法,該辦法從樣本學(xué)習(xí)帶檢測(cè),目的的有關(guān)分類(lèi)特性。通過(guò)樣本學(xué)習(xí)、樣本訓(xùn)練之后,生成最優(yōu)的分類(lèi)面,在不同環(huán)境條件下,SVM都有比較好的適應(yīng)性?,F(xiàn)在,針對(duì)SVM算法進(jìn)行改善的算法諸多,該算法的優(yōu)越性使之越來(lái)越流行。3.2HOG特性原理3.2.1HOG特性算法思想,Dalal在CVPR會(huì)議上提出方向梯度直方圖(HOG),該算法的特性是通過(guò)統(tǒng)計(jì)和計(jì)算圖像局部區(qū)域的HOG來(lái)獲取的,在圖像解決與識(shí)別領(lǐng)域被稱為描述物體的特性算子。該算法的核心思想為:假設(shè)訓(xùn)練的樣本大小為64*64像素。第一步,將該64*64像素的樣本劃分成小的連通區(qū)域即cell,每個(gè)cell的大小不妨設(shè)為8*8像素,這樣樣本圖像就被劃分成8×8=64個(gè)cell。二步將每個(gè)cell中的各像素點(diǎn)的邊沿或者梯度的直方圖采集出來(lái)。接下來(lái)把這些采集來(lái)的直方圖進(jìn)行整合形成特性描述算子。然而為了提高HOG算法的性能,普通將相鄰的4個(gè)cell劃分為一種block。圖3-1為HOG特性模板,其中寬W:H之比為1:1。圖3-1HOG特性模板隨著每個(gè)細(xì)胞單元的滑動(dòng)而形成block,block每一次滑動(dòng)一種cell的寬度,對(duì)于一種64*64的圖我們能夠得到49個(gè)block。圖3-2是描述block與cell的關(guān)系:圖3-2block與cell的關(guān)系在劃分大小為8*8像素的cell后,接下來(lái)采用9個(gè)bin的直方圖去統(tǒng)計(jì)cell的每個(gè)像素的梯度信息。用梯度方向?qū)ell內(nèi)每個(gè)像素在直方圖中進(jìn)行加權(quán)投影,就得到了該cell的梯度方向直方圖,如圖3-3所示。最后將各個(gè)cell組合成大的、連通的blocks。就這樣,在一種block內(nèi)四個(gè)cell的特性向量能夠串聯(lián)起來(lái)就能夠得到該block的HOG特性。因此,每個(gè)cell的特性以不同的特性出現(xiàn)在最后的HOG特性向量中。歸一化之后的block描述符就是HOG特性描述算子。圖3-3梯度劃分3.2.2HOG特性算法的實(shí)現(xiàn)HOG特性算法實(shí)現(xiàn)用下面流程圖如圖3-4表達(dá)圖3-4HOG算法流程圖首先第一步將圖片進(jìn)行歸一化解決,由于圖片的顏色信息作用并不大,加上壓縮解決能夠有效的改善圖片局部陰影和光照的影響。普通首先將待檢測(cè)的圖片轉(zhuǎn)化為灰度圖,壓縮公式為:3-(1)其中g(shù)amma=1/2;接下來(lái)計(jì)算進(jìn)一步計(jì)算梯度方向值,這樣不僅能夠進(jìn)一步減小光照的影響,并且能夠獲得圖像的各個(gè)輪廓,各個(gè)像素點(diǎn)的梯度計(jì)算公式為:3-(2)3-(3)式中Gx(x,y)、Gy(x,y)、H(x,y)分別表達(dá)輸入圖片的像素的水平梯度、垂直梯度、和像素點(diǎn)。像素點(diǎn)(x,y)處得幅度值和梯度方向分別為:3-(4)3-(5)第三步是計(jì)算每個(gè)cell的梯度直方圖,并進(jìn)行規(guī)定的權(quán)重投影。第四步是將單一的cell合成大的block,并計(jì)算塊內(nèi)梯度直方圖。用來(lái)進(jìn)一步解決部分關(guān)照的變化以及對(duì)比度的變化。并且歸一化形成HOG描述符。第五步是對(duì)于每一種重疊block塊內(nèi)cell進(jìn)行對(duì)比度歸一化,并把全部block內(nèi)的直方圖向量一起組合成一種大的HOG特性向量3.2.3HOG特性算法的實(shí)驗(yàn)成果實(shí)驗(yàn)一:在正常條件下,行人特性比較明顯的條件下,使用原則庫(kù)的HOG算法對(duì)輸入圖片進(jìn)行解決,成果如圖:圖3-5HOG檢測(cè)實(shí)驗(yàn)一從圖中可知,在特性明顯的條件下,HOG算法檢測(cè)效果較好,圖中全部人都能夠檢測(cè)出來(lái)。實(shí)驗(yàn)二:行人特性為側(cè)面時(shí),HOG算法檢測(cè)成果如圖:圖3-6HOG檢測(cè)實(shí)驗(yàn)二從圖3-6中的檢測(cè)成果能夠看出,當(dāng)行人側(cè)面出現(xiàn),并且身體部分遮掩時(shí),hog算法出現(xiàn)漏檢現(xiàn)象。這與檢測(cè)的精確度有關(guān)同時(shí)也與樣本數(shù)量以及行人特性的多樣性有關(guān)。實(shí)驗(yàn)三:夜間圖片檢測(cè),檢測(cè)成果如圖:圖3-7HOG檢測(cè)實(shí)驗(yàn)三從圖中檢測(cè)成果可知在夜間行人特性不明顯的條件下,hog算法檢測(cè)效果不太好,這由于夜間環(huán)境復(fù)雜,行人的特性與周邊的環(huán)境背景很相似,很容易造成漏檢的狀況。現(xiàn)在這些都是諸多學(xué)者正在解決的問(wèn)題。實(shí)驗(yàn)四:當(dāng)圖像像素含糊,但特性明顯的狀況下,檢測(cè)的成果,如圖所示圖3-8HOG檢測(cè)實(shí)驗(yàn)四從圖中的檢測(cè)成果可知,及時(shí)像素不太好的狀況下,只要行人特性明顯,hog檢測(cè)效果明顯。3.3HOG特性算法的優(yōu)缺點(diǎn)
HOG特性算法想對(duì)于其它特性描述算法有諸多優(yōu)點(diǎn)。首先,在圖片的局部細(xì)胞單元格上操作是HOG的一大特點(diǎn),這樣它對(duì)圖片的光學(xué)和幾何的變化都有較好的適應(yīng)性,因此,HOG算法對(duì)這兩種形變的解決是其它算法無(wú)法比擬的。另首先,在某些特定環(huán)境條件下,只要行人的特性大致上比較明顯,即使行人在動(dòng)作特性上有某些細(xì)小的變化,檢測(cè)成果也同樣不會(huì)受到任何的影響。因此,HOG特性算法在行人檢測(cè)領(lǐng)域特別受歡迎,但是HOG算法設(shè)計(jì)復(fù)雜,訓(xùn)練時(shí)間較長(zhǎng),檢測(cè)時(shí)間也很長(zhǎng),給檢測(cè)帶來(lái)很大的延時(shí),不符合行人檢測(cè)實(shí)時(shí)性的規(guī)定。
4基于HOG和SVM的行人檢測(cè)4.1引言 通過(guò)前兩章的介紹,我們對(duì)HOG算法和SVM算法有了初步的理解。在這一章,我們將要進(jìn)一步學(xué)習(xí)HOG算法和SVM算法。在前兩章,我們學(xué)習(xí)到,HOG算法和SVM算法都有各自的優(yōu)點(diǎn)和缺點(diǎn),那么這一章我們將研究如何將兩者巧妙的結(jié)合,發(fā)揮各自的優(yōu)勢(shì),較好的解決在多個(gè)條件下,行人檢測(cè)的效果。使檢測(cè)的效果更加精確,實(shí)時(shí)性更高,算法實(shí)現(xiàn)更容易。4.2SVM分類(lèi)器的介紹在機(jī)器學(xué)習(xí)中,支持向量機(jī)(SVM)是與有關(guān)的學(xué)習(xí)算法有關(guān)的監(jiān)督學(xué)習(xí)模型,重要用于分類(lèi)和回歸分析。例如現(xiàn)在在一種p維的空間中有兩個(gè)由一系列的數(shù)據(jù)形成的數(shù)據(jù)集合,每個(gè)數(shù)據(jù)僅屬于其中一種集合,為了擬定新的數(shù)據(jù)點(diǎn)事屬于哪一種集合,支持向量機(jī)會(huì)將將每一種數(shù)據(jù)都當(dāng)作一種p維向量,然后通過(guò)計(jì)算分類(lèi),找出能夠?qū)蓚€(gè)數(shù)據(jù)集合分開(kāi)的p-1維的超平面。因此支持向量機(jī)也叫做線性分類(lèi)器。尚有許多超平面,可能對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。如果存在一種超平面使全部的數(shù)據(jù)不出錯(cuò)地分類(lèi),同時(shí)每類(lèi)數(shù)據(jù)與超平面的距離近來(lái)的向量距離最大,那么這個(gè)超平面稱之為最優(yōu)超平面?;赟VM的算法不僅有運(yùn)算速度快的優(yōu)點(diǎn),并且實(shí)現(xiàn)較容易、運(yùn)算效率高的特點(diǎn),但是SVM算法也有某些局限性之處:(1)普通,行人檢測(cè)中的正樣本和負(fù)樣本在數(shù)量上有很大的不同,就會(huì)出現(xiàn)樣本不均衡的問(wèn)題,分類(lèi)器的分類(lèi)面偏向于樣本少的一方,而過(guò)于關(guān)注樣本多的一方,這樣會(huì)使分類(lèi)器的精度大大減少。(2)由于過(guò)于關(guān)注弱分類(lèi)器的精度,這樣造成過(guò)擬合現(xiàn)象。4.3HOG和SVM的改善及結(jié)合 普通SVM算法關(guān)注的是在正樣本和負(fù)樣本數(shù)量相隔不大條件下的問(wèn)題,但是當(dāng)正樣本和負(fù)樣本數(shù)量相差很大時(shí),直接使用SVM算法,會(huì)造成降分類(lèi)器的分類(lèi)精度減少諸多。針對(duì)這一問(wèn)題,本文做的的解決是,首先通過(guò)HOG特性提取足夠的正負(fù)樣本,通過(guò)大量HOG提取的樣本并使用SVM進(jìn)行分類(lèi),這樣能夠解決分類(lèi)器解決精度,進(jìn)而提高行人檢測(cè)的精度。通過(guò)HOG特性提取的訓(xùn)練樣本能夠較好適應(yīng)多個(gè)狀況下檢測(cè)和識(shí)別。 另首先,通過(guò)HOG特性提取的樣本投入SVM分類(lèi)器進(jìn)行樣本訓(xùn)練。通過(guò)將大量的正負(fù)樣本進(jìn)行訓(xùn)練,能夠得到model,然后由得到的model生成檢測(cè)因子,接下來(lái)使用生成的檢測(cè)因子去檢測(cè)負(fù)樣本,得到hardexample,最后提取hardexample中的hog特性,并與hog特性的負(fù)樣本一起投入訓(xùn)練生成最后的檢測(cè)因子。 改善的hog+svm算法,通過(guò)增加訓(xùn)練的樣本、改善hog算法的多個(gè)參數(shù),以及改善svm分類(lèi)器的各個(gè)參數(shù),這樣能夠達(dá)成兩種算法結(jié)合的最優(yōu)狀態(tài)。檢測(cè)的效果能夠適應(yīng)多個(gè)環(huán)境,并且檢測(cè)速度也更加緊速,實(shí)時(shí)性更強(qiáng)。4.4實(shí)驗(yàn)過(guò)程及解決整個(gè)實(shí)驗(yàn)過(guò)程大致如圖4-1所示:圖4-1實(shí)驗(yàn)成果流程圖實(shí)驗(yàn)過(guò)程中的部分正負(fù)樣本如圖4-2、圖4-3,實(shí)驗(yàn)過(guò)程中的代碼部分見(jiàn)附錄。圖4-2訓(xùn)練的正樣本圖4-3訓(xùn)練的負(fù)樣本4.5實(shí)驗(yàn)成果及分析實(shí)驗(yàn)一:在正常條件下,行人特性比較明顯的條件下,使用本文算法對(duì)圖片就行檢測(cè)得到以下成果:圖4-4實(shí)驗(yàn)一成果從圖中我們能夠看到,檢測(cè)矩形窗口較好地識(shí)別了每一位行人,固然,在這里全部人的特性比較明顯,并且背景干擾也比較小。因此在整個(gè)解決效果上是非常好的,并且也比較符合普通的行人特性。同時(shí)也闡明了本文所涉及的算法的檢測(cè)效果是非常好的,在正常狀況下,不會(huì)產(chǎn)生錯(cuò)誤的識(shí)別或者遺漏某些行人。并且訓(xùn)練時(shí)間比HOG算法短了許多,檢測(cè)時(shí)間實(shí)時(shí)性更高。實(shí)驗(yàn)二:行人側(cè)面特性檢測(cè)效果。從圖中我們看到,被攝像頭側(cè)面抓拍的行人,在通過(guò)HOG+SVM算法解決之后,能夠精確的識(shí)別出來(lái)。同時(shí),我們也能注意到距離較遠(yuǎn)的兩個(gè)行人并未識(shí)別。這與算法本身精度有關(guān),以及那兩位行人距離較遠(yuǎn)特性識(shí)別不明顯,造成漏檢。圖4-5實(shí)驗(yàn)二成果圖實(shí)驗(yàn)三:在圖片清晰度不高的條件下,訓(xùn)練特性對(duì)圖片的檢測(cè)效果。圖4-6實(shí)驗(yàn)三成果圖從圖中檢測(cè)的成果,我們能夠容易的看出即使在圖片清晰度不高的條件下,只要行人的特性比較明顯,本文的算法檢測(cè)顯示了極大的優(yōu)勢(shì),在較短時(shí)間里就能完全識(shí)別全部行人。HOG+SVM顯示了其良好的性能及解決的效果。比較符合實(shí)際生活中多個(gè)狀況下的行人檢測(cè),因此該算法兼?zhèn)淞薍OG和SVM特性的優(yōu)點(diǎn),同時(shí),我在設(shè)計(jì)算法時(shí)巧妙的選用適宜的參數(shù),是的解決精度更加完善。實(shí)驗(yàn)四:在此實(shí)驗(yàn)中,我選獲得圖片是一張夜間行人圖片,用于對(duì)比分析白天的解決效果。在夜間,圖像的亮度和光度較差,很容易造成誤檢以及漏檢,夜間的背景環(huán)境也比白天復(fù)雜的多。解決效果如圖所示:圖4-7實(shí)驗(yàn)四成果圖從圖中能夠看到,左邊兩個(gè)人被樓檢了,分析其因素,有兩點(diǎn)。第一,在夜間燈光不明顯,圖片本身效果比較差,造成訓(xùn)練樣本在檢測(cè)圖片時(shí)出現(xiàn)了漏檢。第二,兩個(gè)均穿的黑色的衣服,整體效果與左邊墻體相融,造成特性判斷出現(xiàn)錯(cuò)誤,誤將行人當(dāng)成墻體。對(duì)于解決這一類(lèi)問(wèn)題,現(xiàn)在有許多研究人員正在進(jìn)行研究,都在嘗試找到最佳的解決辦法去改善特性不明顯,被誤判漏檢的狀況。將改善的HOG+SVM算法在INRIA庫(kù)上進(jìn)行測(cè)試,測(cè)試成果如圖4-8:圖4-8HOG+SVM在INRIA庫(kù)上測(cè)試成果 通過(guò)多次實(shí)驗(yàn),通過(guò)本文改善的算法檢測(cè)多個(gè)環(huán)境下大量的行人圖片,我們通過(guò)對(duì)比,我們會(huì)發(fā)現(xiàn),改善后的HOG+SVM,不僅在精確度上有了較好的改善并且在檢測(cè)時(shí)間大大減小。改善后的算法在檢測(cè)精確度上為95%,基本處在誤差允許范疇內(nèi),充足闡明本文改善的算法的性能較好。
5總結(jié)與展望 隨著計(jì)算機(jī)科學(xué)技術(shù)與計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,行人檢測(cè)技術(shù)會(huì)越來(lái)越成熟。在計(jì)算機(jī)技術(shù)高速發(fā)展的今天,機(jī)器學(xué)習(xí)更加智能,在生活各個(gè)方面,都會(huì)應(yīng)用行人檢測(cè)技術(shù)。例如,智能交通方面、交通安全領(lǐng)域、公共場(chǎng)合的智能監(jiān)控等各個(gè)領(lǐng)域都會(huì)涉及行人檢測(cè)技術(shù)。因此,行人檢測(cè)技術(shù)會(huì)不停發(fā)展,識(shí)別和檢測(cè)的精度會(huì)越來(lái)越高,解決的速度會(huì)越來(lái)越快,這必將是一種趨勢(shì),行人檢測(cè)技術(shù)必將更加好的造福于我們每一種人。 在本文中,我們首先介紹了行人檢測(cè)的有關(guān)技術(shù),以及現(xiàn)在存在的主流算法,以及研究的成果。接著,我介紹了現(xiàn)在行人檢測(cè)的重要有關(guān)算法,并對(duì)各個(gè)算法進(jìn)行了比較。隨即,我們介紹了HOG+SVM算法,并在本文中進(jìn)行了改善。最后使用我們改善的算法解決含有多個(gè)特性的行人圖片,并對(duì)解決成果進(jìn)行了分析與對(duì)比。 簡(jiǎn)樸來(lái)講,本論文的創(chuàng)新點(diǎn)在于下列幾點(diǎn):1、在本文中,通過(guò)使用HOG特性,SVM分類(lèi)器結(jié)合的辦法來(lái)實(shí)現(xiàn)行人檢測(cè)。2、通過(guò)改善HOG特性與SVM分類(lèi)器,是結(jié)合的算法有更加好的兼容性,并發(fā)揮各自算法的優(yōu)點(diǎn),使得識(shí)別效果與檢測(cè)效果更加良好。3、改善后的算法不僅含有檢測(cè)精度高,整體的識(shí)別效果也更加完備,實(shí)時(shí)性更強(qiáng),檢測(cè)時(shí)間和訓(xùn)練時(shí)間都有減短。但是,本文所研究的HOG+SVM算法仍有某些局限性,即使這一改善的算法在解決速度和精度上有了較好的提高,但是在某些條件下,例如對(duì)黑夜里拍攝的圖片,會(huì)出現(xiàn)漏檢現(xiàn)象,這些問(wèn)題仍需要進(jìn)一步解決。接下來(lái)需要進(jìn)一步的研究有兩個(gè)方面,一是找到更加好的特性算法,以提供檢測(cè)的精度,能夠較好的解決漏檢現(xiàn)象;二是找到更加好的的算法,在檢測(cè)之后,使用更加好的算法來(lái)判斷和評(píng)定特性與否符合。
參考文獻(xiàn)[1]XuFL,LiuX,FujimuraK.Pedestriandetectionandtrackingwithnightvision[J].IEEETransactionsonIntelligentTransportationSystems,,6(1):63-71[2]ZhaoL,ThorpeC.Stereoandneuralnetwork2basedpedestriandetection[J].IEEETransactionsonIntelligentTransportationSystems,,1(3):148-154[3]MohanA,PapageorgiouC,PoggioT.Example2basedobjectdetectioninimagesbycomponents[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,,23(4):349–361[4]賈慧星,章毓晉.車(chē)輛輔助駕駛系統(tǒng)中基于計(jì)算機(jī)視覺(jué)的行人檢測(cè)研究綜述[J].自動(dòng)化學(xué)報(bào),,33(1):84-90[5]GavrilaDM.Pedestriandetectionfromamovingvehicle[A].ProceedingsofEuropeanconferenceonComputerVision[C].London,UK:Springer,.1843.37-49[6]BertozziM,BroggiA,LasagniA,RoseMD.Infraredstereovision-basedpedestriandetection[A].ProceedingsofIEEEInternationalConferenceonIntelligentVehiclesSymposium[C].LasVegas,USA:IEEE,.24-29[7]LiptonA.Localapplicationofopticflowtoana
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代農(nóng)業(yè)裝備在種植業(yè)中的技術(shù)優(yōu)勢(shì)
- 現(xiàn)代醫(yī)療技術(shù)中的人才培養(yǎng)與團(tuán)隊(duì)建設(shè)
- 校園文化與企業(yè)文化的對(duì)接與互鑒
- 14《母雞》說(shuō)課稿-2023-2024學(xué)年統(tǒng)編版四年級(jí)語(yǔ)文下冊(cè)
- 24 《古人談讀書(shū)》說(shuō)課稿-2024-2025學(xué)年語(yǔ)文五年級(jí)上冊(cè)統(tǒng)編版
- 6 傳統(tǒng)游戲我會(huì)玩2023-2024學(xué)年二年級(jí)下冊(cè)道德與法治同步說(shuō)課稿(統(tǒng)編版)
- 14 圓明園的毀滅 說(shuō)課稿-2024-2025學(xué)年語(yǔ)文五年級(jí)上冊(cè)統(tǒng)編版
- 5 樹(shù)和喜鵲(說(shuō)課稿)-2023-2024學(xué)年統(tǒng)編版語(yǔ)文一年級(jí)下冊(cè)
- 17《爬天都峰》說(shuō)課稿-2024-2025學(xué)年統(tǒng)編版語(yǔ)文四年級(jí)上冊(cè)
- 2023三年級(jí)英語(yǔ)下冊(cè) Unit 4 Food and Restaurants Lesson 21 In the Restaurant說(shuō)課稿 冀教版(三起)
- 《社區(qū)康復(fù)》課件-第七章 腦癱患兒的社區(qū)康復(fù)實(shí)踐
- 城鄉(xiāng)環(huán)衛(wèi)一體化內(nèi)部管理制度
- 小學(xué)數(shù)學(xué)六年級(jí)解方程練習(xí)300題及答案
- 光伏十林業(yè)可行性報(bào)告
- 公路工程安全風(fēng)險(xiǎn)辨識(shí)與防控手冊(cè)
- 骨科手術(shù)糾紛案例分析課件
- 2022年廣西高考英語(yǔ)真題及答案(全國(guó)甲卷)
- 安全生產(chǎn)責(zé)任清單(加油站)
- 動(dòng)物檢疫技術(shù)-動(dòng)物檢疫的程序(動(dòng)物防疫與檢疫技術(shù))
- 煤礦復(fù)工復(fù)產(chǎn)專(zhuān)項(xiàng)安全風(fēng)險(xiǎn)辨識(shí)
- DB42T 1049-2015房產(chǎn)測(cè)繪技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論