![視頻中的行人檢測 數(shù)字圖像處理課程設(shè)計說明書_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/24c18102-945c-45b0-8c45-6c3d4cbf3b5b/24c18102-945c-45b0-8c45-6c3d4cbf3b5b1.gif)
![視頻中的行人檢測 數(shù)字圖像處理課程設(shè)計說明書_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/24c18102-945c-45b0-8c45-6c3d4cbf3b5b/24c18102-945c-45b0-8c45-6c3d4cbf3b5b2.gif)
![視頻中的行人檢測 數(shù)字圖像處理課程設(shè)計說明書_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/24c18102-945c-45b0-8c45-6c3d4cbf3b5b/24c18102-945c-45b0-8c45-6c3d4cbf3b5b3.gif)
![視頻中的行人檢測 數(shù)字圖像處理課程設(shè)計說明書_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/24c18102-945c-45b0-8c45-6c3d4cbf3b5b/24c18102-945c-45b0-8c45-6c3d4cbf3b5b4.gif)
![視頻中的行人檢測 數(shù)字圖像處理課程設(shè)計說明書_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/10/24c18102-945c-45b0-8c45-6c3d4cbf3b5b/24c18102-945c-45b0-8c45-6c3d4cbf3b5b5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、目 錄目 錄I摘 要II第 1 章 緒論11.1 研究背景與意義11.2 智能視頻監(jiān)控概述21.2.1 智能視頻監(jiān)控的發(fā)展21.2.2 智能視頻監(jiān)控的研究內(nèi)容31.3 行人檢測與跟蹤31.3.1 行人檢測41.3.2 行人跟蹤41.4 國內(nèi)外研究現(xiàn)狀41.5 論文主要研究內(nèi)容與章節(jié)安排6第 2 章 視頻序列圖像中運動目標檢測與跟蹤方法72.1 圖像處理基礎(chǔ)72.1.1 顏色空間72.1.2 圖像預(yù)處理102.1.3 形態(tài)學(xué)方法102.2 運動目標檢測方法102.2.1 背景差分法102.2.2光流法112.2.3 邊緣檢測方法122.3 運動目標跟蹤方法122.3.1 基于特征的跟蹤方法132
2、.3.2 基于模型的跟蹤方法142.3.3 基于主動輪廓的跟蹤方法152.4 本章小結(jié)16三、設(shè)計內(nèi)容XVII3.1背景減法運動目標檢測XVIII3.2閾值的選取XX3.3形態(tài)學(xué)濾波XXI四、實驗結(jié)果及分析XXV結(jié)束語XXVII摘 要 智能視頻監(jiān)控是計算機視覺領(lǐng)域新興的研究方向,它通過對攝像機拍攝的視頻圖像序列進行自動分析來對被監(jiān)控場景中的事物變化進行定位、跟蹤和識別,并以此對相關(guān)目標的行為進行分析和判別,在實現(xiàn)了日常管理工作的同時又能對目標的異常行為做出及時反應(yīng)。行人目標檢測與跟蹤算法是智能視頻監(jiān)控系統(tǒng)中的核心問題,研究相關(guān)算法對于提高智能視頻監(jiān)控系統(tǒng)的性能具有重要的意義。本文在熟悉和掌握了
3、有關(guān)數(shù)字圖像處理原理和技術(shù)的基礎(chǔ)上,分析對比了常用的目標檢測和跟蹤方法,針對不同條件下的行人目標檢測和跟蹤進行了研究。本文完成的主要研究工作如下:1)針對運動攝像機跟蹤行人所導(dǎo)致的背景運動與行人尺寸變化問題,提出了一種綜合應(yīng)用梯度方向直方圖和粒子濾波的行人跟蹤算法。該方法以粒子濾波為跟蹤框架,利用改進的小型化梯度方向直方圖方法實現(xiàn)了小尺度行人跟蹤,并根據(jù)其檢測結(jié)果確定目標,不斷修正粒子采樣,有效實現(xiàn)了行人跟蹤。仿真實驗結(jié)果表明,與傳統(tǒng)的粒子濾波算法相比,該算法能夠更加準確有效地跟蹤動態(tài)背景中尺寸變化的行人目標。2)介紹了智能視頻監(jiān)控系統(tǒng)的重要應(yīng)用社會治安視頻監(jiān)控系統(tǒng),在分析其圖像處理技術(shù)及架構(gòu)
4、后,針對實際監(jiān)控條件與要求,完成了行人檢測和跟蹤模塊的設(shè)計,采用matlab平臺和 OpenCV 算法庫進行了圖像提取和預(yù)處理、運動目標分割、目標分類、目標特征提取、行人目標跟蹤等部分的功能實現(xiàn)。實驗結(jié)果表明,本模塊能夠處理一般靜態(tài)背景條件下的行人目標,滿足了實際應(yīng)用的初步要求。關(guān)鍵詞:智能視頻監(jiān)控 行人檢測 行人跟蹤 粒子濾波 動態(tài)背景 梯度方向直方圖IIIII第 1 章 緒論1.1 研究背景與意義 計算機視覺是計算機科學(xué)和人工智能的一個重要分支。它研究的主要內(nèi)容包括怎樣利用各種成像系統(tǒng)代替視覺器官來獲取信息,由計算機代替大腦完成對信息的處理和解釋使計算機具有人一樣的視覺功能。智能視頻監(jiān)控技
5、術(shù)是計算機視覺領(lǐng)域近年來新興的一個研究方向,是模式識別技術(shù)在視頻監(jiān)控領(lǐng)域的重要應(yīng)用。智能視頻監(jiān)控的研究對象為監(jiān)控視頻中的行人、車輛和其他物體。它通過對視頻中的運動目標進行實時檢測、跟蹤和行為分析,使得系統(tǒng)能夠自動去除大量的非必要信息。通過分析視頻圖像中目標的運動行為,它可以為實時的監(jiān)控和預(yù)警提供更為有效的信息。 智能視頻監(jiān)控技術(shù)將計算機視覺同網(wǎng)絡(luò)化的視頻監(jiān)控結(jié)合起來,增強了系統(tǒng)的智能化自動處理能力,從而極大地減少主觀干擾,增強監(jiān)控效果,在減輕了相關(guān)人員的工作量的同時,對視頻監(jiān)控場景中的目標實現(xiàn)了自動實時的檢測、跟蹤、識別與分析等功能。智能視頻監(jiān)控技術(shù)可用于安防監(jiān)控、智能交通、醫(yī)院護理等眾多方面
6、,具有重要的研究意義和美好的應(yīng)用前景。當前較多的應(yīng)用主要集中在以下幾個方面:行人和車輛目標的自動檢測、跟蹤和識別,目標異常行為預(yù)警,敏感場所的異常物體滯留以及物品丟失,人流量估計、人群運動監(jiān)測及擁塞控制,行人和車輛的交通流量監(jiān)測等。 作為當前視頻監(jiān)控系統(tǒng)發(fā)展的必然方向,近年來智能視頻監(jiān)控相關(guān)技術(shù)的研發(fā)受到一些發(fā)達國家的重視,其商業(yè)化應(yīng)用也得到了很大的發(fā)展。尤其在 2001年美國 9.11 事件及 2005 年英國 77 倫敦地鐵爆炸案等恐怖暴力事件的發(fā)生后,出于對反恐、社會安定、國家公共安全等多方面的考慮,世界各國更是都高度重視如何在重要、敏感的安全相關(guān)部門和擁有很大人流量的公共場合實現(xiàn) 24
7、 小時自動化實時的監(jiān)測,智能視頻監(jiān)控成為了國際上最被關(guān)注的前沿研究領(lǐng)域之一??紤]到監(jiān)控場景中行人是作為主要目標,因而行人行為分析作為智能視頻監(jiān)控的重要功能部分,正受到當前諸多研究人員的關(guān)注。行人行為分析的實現(xiàn)要以行人檢測與跟蹤為基礎(chǔ),所以對行人的檢測和跟蹤是一個至關(guān)重要的問題。對運動人體快速而準確的檢測和跟蹤是一項十分重要且極具挑戰(zhàn)性的工作,這屬于智能視頻監(jiān)控系統(tǒng)的前端工作,其工作性能的好壞將直接影響后續(xù)工作以至整個系統(tǒng)的性能。除了視覺監(jiān)控之外,人體檢測和跟蹤在高級人機交互、動畫制作等方面也有著廣泛的應(yīng)用。1.2 智能視頻監(jiān)控概述1.2.1 智能視頻監(jiān)控的發(fā)展智能視頻監(jiān)控是在傳統(tǒng)的視頻監(jiān)控基礎(chǔ)
8、上發(fā)展起來的。傳統(tǒng)的視頻監(jiān)控自投入應(yīng)用已有數(shù)十年,其發(fā)展經(jīng)歷了三個時代。第一代:模擬時代。上個世紀末以前,初始的視頻監(jiān)控以模擬式磁帶錄像機(Video Cassette Recorder, VCR)為代表。此時的視頻監(jiān)控存儲量大,信息檢索和查詢相對困難。第二代:數(shù)字時代。進入 21 世紀后,隨著數(shù)字視頻壓縮編碼技術(shù)的產(chǎn)生和發(fā)展,數(shù)字式視頻錄像機(Digital Video Recorder, DVR)投入使用。數(shù)字化存儲極大增強了對視頻信息的處理效率,事后的信息檢索也變得相對簡單。第三代:網(wǎng)絡(luò)時代。從 2004 年開始,隨著網(wǎng)絡(luò)帶寬的提高和成本的降低、硬盤容量的加大和中心存儲成本的降低,以及各
9、種實用視頻處理技術(shù)的出現(xiàn),視頻監(jiān)控步入了全數(shù)字化的網(wǎng)絡(luò)時代,DVR 系統(tǒng)進一步發(fā)展為網(wǎng)絡(luò)數(shù)字視頻錄像機(Network DVR, NVR),實現(xiàn)了視頻信息的數(shù)字化網(wǎng)絡(luò)傳播。更進一步,發(fā)展成為了網(wǎng)絡(luò)化視頻監(jiān)控系統(tǒng),又稱 IP 監(jiān)控系統(tǒng)(IP Video Surveillance, IPVS)。網(wǎng)絡(luò)化視頻監(jiān)控系統(tǒng)基于 TCP/IP 協(xié)議,采用開放式架構(gòu),其視頻信息從攝像機或網(wǎng)絡(luò)視頻服務(wù)器下來就直接進入網(wǎng)絡(luò),以數(shù)字視頻的壓縮、傳輸、存儲和播放為基礎(chǔ),通過強大的平臺軟件實施管理。視頻監(jiān)控系統(tǒng)在系統(tǒng)功能和設(shè)備性能上得到了很大的提高,但是仍然受到了一些固有因素的限制,整個系統(tǒng)在安全性和實用性方面難以滿足人
10、們不斷提高的要求(李子青,2007)。具體的制約因素如下:(1)人類自身的弱點。很多情況下,由于生理上的弱點,人們經(jīng)常無法覺察安全威脅,從而產(chǎn)生了漏報(false negatives)的現(xiàn)象。(2)監(jiān)控時間。大多數(shù)視頻監(jiān)控系統(tǒng)難以按照 1:1 的比例來配置監(jiān)控攝像機和視頻顯示裝置,尤其是在機場、港灣等大型的視頻監(jiān)控系統(tǒng)中,各個監(jiān)控點很難都處于監(jiān)控之下。(3)誤報和漏報。這是視頻監(jiān)控系統(tǒng)中最常見的兩大問題,誤報(falsepositives)會浪費人力物力,漏報可能會導(dǎo)致非常危險的后果發(fā)生。這兩種情況都會大大降低人們的信任,進而降低監(jiān)控系統(tǒng)的應(yīng)用價值。(4)數(shù)據(jù)分析困難。傳統(tǒng)的視頻監(jiān)控系統(tǒng)缺乏智
11、能因素,錄像數(shù)據(jù)無法被有效地分類存儲,更毋論其他的智能處理,因此數(shù)據(jù)分析工作要耗費相當多的時間。而經(jīng)常發(fā)生的誤報漏報現(xiàn)象也造成了無用數(shù)據(jù)的進一步增加,帶來更大的困難。(5)響應(yīng)時間長。對于安全威脅的響應(yīng)速度直接關(guān)系到一個安全系統(tǒng)的整體性能。傳統(tǒng)的視頻監(jiān)控系統(tǒng)通常由人來對威脅做出響應(yīng)和處理,而實際處理問題時,往往同時涉及到多個功能部分,需要多個相關(guān)部門的協(xié)調(diào)配合,共同處理,因而對響應(yīng)時間有了更高的要求。為了解決上述導(dǎo)致視頻監(jiān)控系統(tǒng)效率低下的問題,人們把計算機視覺的相關(guān)技術(shù)引入視頻監(jiān)控中,從而發(fā)展起新型的視頻監(jiān)控技術(shù)智能視頻監(jiān)控,也稱自動視頻監(jiān)控,在視頻監(jiān)控系統(tǒng)中處于核心地位,對于整個系統(tǒng)的效率提
12、高具有重要意義。1.2.2 智能視頻監(jiān)控的研究內(nèi)容智能視頻監(jiān)控的研究內(nèi)容包括運動目標檢測、運動目標跟蹤以及對監(jiān)視場景中目標行為的理解與描述,如圖 1.1 所示。圖 1.1 中,目標檢測、目標分類、目標識別和目標跟蹤是視頻處理中的基礎(chǔ)部分,而行為分析和理解則屬于更高級的處理分析部分。運動檢測、目標分類和目標跟蹤是研究者們關(guān)心最多的三個基本問題;而行為分析與理解因為跟應(yīng)用直接相關(guān),所以近些年成為被廣泛關(guān)注的熱點問題。1.3 行人檢測與跟蹤視頻監(jiān)控場景中行人是監(jiān)控的主要對象,因此對行人的檢測和跟蹤是一個至關(guān)重要的問題,這屬于智能視頻監(jiān)控系統(tǒng)的底層工作,其性能好壞將直接影響后續(xù)工作乃至整個系統(tǒng)的性能。
13、1.3.1 行人檢測行人檢測就是把視頻圖像中的行人目標從背景中分割出來并精確定位?;谝曈X的行人檢測目前仍舊是計算機視覺領(lǐng)域的一個公認的難題。原因在于:行人同背景混合在一起,行人可能走,也有可能站著或者不可預(yù)測地改變運動方向;行人所處的背景非常復(fù)雜,特別是當視覺系統(tǒng)基于運動云臺上的攝像系統(tǒng)時,背景的突然改變不可避免。到目前為止,一些人體檢測系統(tǒng)在某些約束環(huán)境中被證明能有效地檢測行人,從而鼓舞了研究人員開展進一步的研究工作。行人的衣著、運動姿態(tài)、光照存在著很大的差異,并且存在背景復(fù)雜、遮擋和其它運動物體的干擾,這些因素是行人檢測要解決的重點問題。1.3.2 行人跟蹤行人跟蹤監(jiān)視人體在視頻中的空間
14、和時間變化,包括人體的出現(xiàn)、位置變化、大小信息、形狀等,在連續(xù)幀上匹配目標區(qū)域,求解時間上的對應(yīng)問題?;谝曈X的人體跟蹤一般從人體檢測開始,而且在后繼的視頻序列中需要不斷地檢測人體以校驗跟蹤和維持跟蹤連續(xù)進行,它是人體的姿態(tài)估計和活動識別的基礎(chǔ)。跟蹤過程根據(jù)應(yīng)用場景中的目標數(shù)目分為單目標和多目標。場景中目標數(shù)目的不同,跟蹤的難易程度不同,所采用的技術(shù)也不同。1.4 國內(nèi)外研究現(xiàn)狀伴隨著視頻處理、數(shù)據(jù)庫、人工智能等學(xué)科的發(fā)展,智能視頻監(jiān)控越來越顯現(xiàn)出廣闊的應(yīng)用前景和潛在的經(jīng)濟價值。歐美等國家將其作為是維護社會安全的重要手段,投入大量人力、財力以促進其發(fā)展。例如,1997 年美國國防高級研究項目署
15、(DARPA)設(shè)立了 VSAM(VisualSurveillance And Monitoring)(Collins et al. 2000)項目,該系統(tǒng)融合多種不同類型傳感器,研究軍事和民用場景下視頻理解技術(shù)。2004 年,英國的雷丁大學(xué)與法國 INRIA 等研究機構(gòu)共同開展了智能監(jiān)控項目 AVITRAC(Sullivan5et al. 2000)的研究,研究對機場地面目標進行智能跟蹤和異常行為監(jiān)控與報警的系統(tǒng)解決方案。智能視頻監(jiān)控更是受到很多學(xué)者的高度關(guān)注,在理論方面取得了長足的進展。計算機視覺領(lǐng)域中的著名期刊如 IJCV、CVIU、PAMI、IVC 和重要的學(xué)術(shù)會議如 ICCV、CVPR
16、、ECCV、IWVS 等先后刊登了大量智能視覺監(jiān)控領(lǐng)域相關(guān)的最新研究成果。國際上也有許多公司研究智能視頻監(jiān)控技術(shù)并推出了市場化的產(chǎn)品(焦波,2005)。其中有美國的 Vidient 和 ObjectVideo 等公司。Vidient 前身為 NEC 公司的一個實驗室,產(chǎn)品 SmartCatch,能檢測包括移動物體檢測、遺留物體檢測、周邊入侵檢測等的多種異常行為,其主要用戶為機場;ObjectVideo 公司的產(chǎn)品類型包括邊界保安和入侵探測、可疑人員逗留、物品遺留異樣物體探測、財產(chǎn)保護防盜探測、人流物流監(jiān)控,圖像變化攝像機檢測、交通工具監(jiān)控和測速等等。還有以色列的 Mate、NiceVision
17、 和 Ioimage 等公司也提供了市場化的產(chǎn)品。Mate 的主要產(chǎn)品為 BehaveWatch,可檢測六種異常行為,包括路徑檢測、突然出現(xiàn)報警、定向運動檢測等,提出三層防護概念;NiceVision 視頻分析儀對不同的威脅提供實時偵測功能,其檢測活動包括對闖入者、車輛、被遺棄的行李和包裹、周邊及設(shè)施保護、阻塞安全出入口及消防路線、盜竊偵測防止安全設(shè)備被移動、計算人數(shù),車輛和其它其物件、顯示人群聚集、監(jiān)控安全率水平、量度人流、顯示企圖尾隨進入入口處控制點等;Ioimage 的產(chǎn)品能實現(xiàn)五種行為的檢測,包括入侵探測、PTZ 自動跟蹤、遺留物體探測、非法滯留探測、移動物體探測等。以及法國的 Cit
18、iLog 公司,其核心技術(shù)是自主研發(fā)的動態(tài)圖像背景自適應(yīng)技術(shù)和車輛圖像跟蹤技術(shù),徹底消除了光線、雨雪、灰塵對系統(tǒng)的影響,可以及時檢測監(jiān)控區(qū)域內(nèi)發(fā)生的交通事件,采集交通數(shù)據(jù),輔助進行交通控制等。智能化監(jiān)控技術(shù)在中國起步較晚,其技術(shù)研發(fā)和市場推廣都有待進一步發(fā)展,當前大多數(shù)國內(nèi)視頻監(jiān)控產(chǎn)品都是非智能化的。隨著公共安全意識的提高,國內(nèi)市場上對智能化視頻監(jiān)控產(chǎn)品的需求日益增大,己經(jīng)有部分公司如??低?、智安邦等企業(yè)開展相關(guān)的研究。但是,受到國內(nèi)研發(fā)能力限制,當前大多公司都是引進國外成熟技術(shù),推出面向中國市場的相關(guān)產(chǎn)品。如漢王科技公司與Mate 公司合作推出了基于多種行為的嵌入式視頻檢測產(chǎn)品。國內(nèi)的科研
19、機構(gòu)近年來也在積極展開智能視頻監(jiān)控系統(tǒng)的研究與商業(yè)產(chǎn)品開發(fā)(李子青,2007)。中國科學(xué)院自動化所模式識別國家重點實驗室視覺監(jiān)控小組總結(jié)了英國雷丁大學(xué) VIEWS 的車輛交通監(jiān)控原型系統(tǒng)的研究經(jīng)驗,在以往的理論研究的基礎(chǔ)上,自行設(shè)計并初步實現(xiàn)了一個擁有完全自主知識產(chǎn)權(quán)的交通監(jiān)控原型系統(tǒng) Vstar(Visual Surveillance Star)。另外還有南京大學(xué)、南京長城6信息系統(tǒng)有限公司和江蘇省公安廳刑警總隊聯(lián)合研制的“基于單幅訓(xùn)練圖像的多表情人臉自動識別系統(tǒng)”等等。行人檢測是指將行人區(qū)域從視頻圖像中分割出來,其分割的有效與否影響后期目標跟蹤、行為分析和理解等高層處理的效果。因為圖像背景
20、存在動態(tài)變化,以及陰天、雨雪、光照陰影和其他干擾等的影響,使得運動檢測工作具有相當困難,當前的常用方法有背景差分法(Haritaoglu et al. 2000)、相鄰幀差分(Collins et al. 2000)、光流法(Mayer et al. 1998)以及基于目標特征的統(tǒng)計識別(Stauffer and Grimson 2000)等檢測方法。行人跟蹤大多是基于位置、速度、色彩、紋理等特征的目標匹配跟蹤,存在很多的相關(guān)算法。Polana et al(1994)和 Daniel et al(2002)都提出基于運動特征的跟蹤方法,Polana 以質(zhì)心為特征實現(xiàn)了行人運動跟蹤,Daniel
21、 利用了顏色特征,對多目標進行分類、識別和跟蹤。Kass et al(1992)利用 Snake 輪廓模型進行目標跟蹤。Park et al(200l)對 Snake 方法有所改進,提出一種指向型的Snake 模型,可減少邊緣定位錯誤。Gardner et al(1996)提出了基于 3D 模型的方法,Ralf et al(2001)在此基礎(chǔ)上建立了人體 3D 模型。Avidan et al(2004)提出了支持向量跟蹤算法(Support Vector Tracking),通過將支持向量機與基于光流場的跟蹤器相結(jié)合,在目標鄰域搜索具有最大 SVM 得分的區(qū)域進行跟蹤。Isard 和Blake
22、(1998)等提出condensation (conditional Density Propagation)算法,通過先驗概率采樣,再根據(jù)觀測似然修正權(quán)值,以此近似后驗概率。Deutscher et al(2001)等采用退火粒子濾波(Annealed Particle Filtering),并采用自動空間分解和交叉算子進行跟蹤。當前在行人檢測和跟蹤方面已經(jīng)開展了大量的工作,取得了很多研究成果,但面臨各種具體情況,仍存在著許多問題有待解決。本文針對動態(tài)場景和靜態(tài)場景進行了研究,分別提出了有特色的行人檢測和跟蹤方法。1.5 論文主要研究內(nèi)容與章節(jié)安排本文主要研究社會治安視頻監(jiān)控中行人目標的檢測
23、與跟蹤,為更高級的行為分析和異常行為檢測奠定基礎(chǔ)。本文在分析常用運動目標檢測以及運動跟蹤方法的基礎(chǔ)上,結(jié)合行人目標特點,實現(xiàn)了社會治安視頻中行人目標的智能檢測與跟蹤。同時針對運動攝像機跟蹤行人所導(dǎo)致的背景運動與行人尺寸變化問題,本文提出了一種綜合應(yīng)用梯度方向直方圖(Histograms of Oriented Gradients,HOG)和粒子濾波的行人跟蹤算法。第 2 章 視頻序列圖像中運動目標檢測與跟蹤方法智能視頻監(jiān)控中的行人檢測與跟蹤方法涉及到很多研究領(lǐng)域,如數(shù)字圖像處理、計算機視覺、信息融合、模式識別與人工智能等。為了后續(xù)各章內(nèi)容的展開,本章系統(tǒng)地介紹相關(guān)的一些預(yù)備知識和常用的目標檢測
24、與跟蹤方法。2.1 圖像處理基礎(chǔ)數(shù)字圖像處理涉及的領(lǐng)域相當廣泛,其各種理論算法、技術(shù)應(yīng)用更是不勝枚舉。篇幅起見,本節(jié)僅簡要介紹相關(guān)的顏色空間、圖像預(yù)處理和形態(tài)學(xué)方法等內(nèi)容。2.1.1 顏色空間顏色空間也稱彩色模型,又稱彩色空間或彩色系統(tǒng),它的用途是在某些標準下用通常可接受的方式對彩色加以說明。本質(zhì)上,彩色模型是坐標系統(tǒng)和子空間的闡述,位于系統(tǒng)的每種顏色都由單個點表示。顏色空間從提出到現(xiàn)在已經(jīng)有上百種,大部分只是局部的改變或?qū)S糜谀骋活I(lǐng)域,現(xiàn)在采用的大多數(shù)顏色模型都是面向硬件或面向應(yīng)用的。數(shù)字圖像處理中常用的是 RGB(Red, Green, Blue)、HSI(Hue, Saturation,
25、Intensity)和 HSV(Hue, Saturation, Value)模型。(1)RGB 彩色模型RGB 彩色模型是工業(yè)界最為常見的顏色模型,它也是人們最為熟悉常見的顏色模型。它以紅、綠、藍為原色,建立三維直角坐標系,通過混合各個原色以產(chǎn)生各種復(fù)合色彩。通過對紅、綠、藍三種顏色施加變化以及疊加可以得到各種顏色。RGB 即是代表紅、綠、藍三種色彩組成的顏色空間,這一顏色空間幾乎包括人類能感知的所有顏色,因而應(yīng)用最為廣泛。RGB 顏色空間的設(shè)計是以顏色發(fā)光為原理的,簡單理解其顏色混合方式就好像有紅、綠、藍三盞不同顏色的彩燈,當三盞燈的光相互混合的時候,其色彩相混,而亮度等于三者總和,也即滿
26、足加法混合。知道其原理后,在很多圖像處理軟件中進行的 RGB 顏色設(shè)定就很容易理解了。圖 2.1 形象地顯示了 RGB 顏色空間。(2)HSV 模型RGB 和 CMY 彩色模型對硬件實現(xiàn)很理想,另外它同人眼對紅、綠、藍三原色的強烈感覺相匹配,但是這一模型不能很好地解釋實際的顏色。觀察一個彩色物體時,人們用色調(diào)(Hue)、色飽和度(Saturation)和強度(Value)來描述它,相比較而言,HSV 顏色模型是面向用戶的,該模型對應(yīng)于圓柱坐標系的一個圓錐形子集。色調(diào) H:與光波的波長有關(guān),它表示人的感官對不同顏色的感受,如紅色、綠色、藍色等,它也可表示一定范圍的顏色,如暖色、冷色等。飽和度 S
27、:表示顏色的純度,純光譜色是完全飽和的,加入白光會稀釋飽和度。飽和度越大,顏色看起來就會越鮮艷,反之亦然。強度 V:對應(yīng)成像亮度和圖像灰度,是顏色的明亮程度。HSV 顏色空間如圖 2.2 所示,其空間模型為一個圓錐。圓錐的頂面對應(yīng)的強度 V 為 1,代表最亮的顏色。繞 V 軸的旋轉(zhuǎn)角代表色彩 H,紅、黃、藍分別對應(yīng)于 0°、120°、240°。在這一顏色模型中,每一種顏色和其補色相差 180°。由圓心向圓周移動時,飽和度 S 的取值從 0 變化到 1。由于 HSV 顏色模型所代表的顏色域是屬于 CIE 色度圖的一個子集,所以其最大飽和度的顏色的純度值并不
28、到 100。在下方的圓錐頂點處,V 為 0,H 和 S 無定義,代表黑色。圓錐頂面中心處 S 為 0,V 為 1,H 無定義,代表白色,從該點到頂點代表亮度漸暗的白色,即不同灰度的白色。所有 V、 S 都為 1 的顏色都是純色。圖 2.2 HSV 彩色空間HSV 顏色模型類似畫家配色時采用的方法。而畫家常通過改變色深和色濃來從純色中得到各種色調(diào)的顏色。具體做法為:在純色中加入黑色可以改變色深,加入白色可以改變色濃,同時加入一定比例的黑色、白色即可得到某種色調(diào)的顏色。(3)顏色空間變換顏色空間變換可以分為從 RGB 到 HSV 轉(zhuǎn)換以及從 HSV 到 RGB 的轉(zhuǎn)換兩種。從 RGB 到 HSV
29、轉(zhuǎn)換時,設(shè)(r,g,b)分別是一個顏色的紅、綠和藍坐標,它們的值是 0 到 1 之間的實數(shù)。設(shè) max 等價于 r,g 和 b 中的最大者。設(shè) min 等于這些值中的最小者。要找到在 HSL 空間中的(h,s,v)值,這里的 h0,360)是角度的色相角,而 s,v0,1是飽和度和亮度。2.1.2 圖像預(yù)處理常用的圖像預(yù)處理過程都涉及到一些濾波的方法。由于圖像在拍攝過程中往往會由傳感器引入噪聲,因此需要在目標分割前對圖像進行預(yù)處理,來減除噪聲的干擾,增強目標提取的效果。通常可采用低通濾波的方法來消除噪聲。低通濾波既可在頻域進行也可在空域進行。常見的頻域低通濾波器有巴特沃茲低通濾波器和高斯低通濾
30、波器。常見的空域低通濾波器主要有均值濾波器、加權(quán)均值濾波器和中值濾波器。2.1.3 形態(tài)學(xué)方法形態(tài)學(xué)(morphology)原本代表的是生物學(xué)的一個學(xué)科,在這里介紹的是數(shù)學(xué)形態(tài)學(xué)(mathematical morphology)。作為一種圖像處理工具,它被用于對圖像區(qū)域進行處理,以提取對于表示和描述有用的圖像分量。下面要介紹的是圖像處理中常用到的膨脹和腐蝕,以及開操作和閉操作。2.2 運動目標檢測方法運動目標檢測是指將運動區(qū)域從視頻圖像中分割出來。運動目標檢測從視頻圖像序列中檢測出運動目標,減小圖像處理計算量,得到所需的目標信息,為后續(xù)的識別和跟蹤奠定基礎(chǔ)。由于運動目標的正確檢測與否將直接影響
31、后續(xù)的目標跟蹤與分類效果,所以它也成為智能視頻監(jiān)控系統(tǒng)相關(guān)技術(shù)中深受關(guān)注的研究重點。運動目標檢測過程包括運動目標檢測的預(yù)處理和運動目標的分割兩大步。目前常用的運動目標檢測方法有四種:幀差法,背景差分法,光流法,邊緣檢測法等。2.2.1 背景差分法背景差分法也是常用的運動目標檢測方法之一。這種方法將新的視頻圖像同已經(jīng)建立的背景模型進行比較,通過圖像灰度值或其他參考量的變化來估計目標運動。大量的研究人員都在致力于開發(fā)不同的背景模型,以解決不同場景條件下目標分割所要面對的各種問題。在種類紛繁的背景建模方法中,較為常用的有時間平均法、像素估計法和混合高斯模型法。(1)時間平均法(Time Averag
32、e Background Initializing, TABI)是最簡單直接的方法,即求一時間序列上的視頻圖像的平均值作為背景的估計值。這種方法計算雖然簡單,但是容易將前景物體混入背景中,使得背景模糊,不清晰。(2)像素估計法就是從過去的一組視頻序列中按照一定的算法估計出每個像素的背景值。時間中值法(Time Median Background Initializing, TMBI)是其中最具有代表性的方法。其原理比較簡單。一般認為,背景至少可以在 50%的時間內(nèi)被觀測到,因而圖像序列中處于每個像素點亮度值中間的那個點的值即為該位置處的背景值。著名的 W4 系統(tǒng)在背景初始化階段就采用了中值法的
33、思想。(3)混合高斯模型法(Gaussian Mixture Model ,GMM)也稱為統(tǒng)計背景模型法。該算法的思想是:對于緩慢變化的背景,可以用正態(tài)分布來表征像素灰度值的變化。每一種背景像素的值都可以通過多個高斯分布的加權(quán)和來描述。最早提出的是三分布 GMM,每個像素點用三個高斯分布來分別表征背景、前景的陰影、前景這三種不同的模式,但實際情況很復(fù)雜,對背景、前景等模式都限定只用一個高斯分布來描述是不夠的。因而以后又出現(xiàn)了固定分布數(shù) K 的混合高斯分布模型(Fixed-K Gaussian Mixture Model ),以及后面發(fā)展而來的基于自適應(yīng)分布數(shù) K 的混合高斯分布模型(Adapt
34、ive-K Gaussian Mixture Model, AKGMM)。在一般靜態(tài)場景下,背景建模方法在進行目標檢測時可以獲得良好的效果,但是在處理動態(tài)場景視頻時,由于背景本身就存在相對運動,所以需要其他方法來解決這一問題。2.2.2光流法物體運動時其表面像素點的亮度也隨之運動,在視頻圖像中表現(xiàn)為光流,對應(yīng)圖像中產(chǎn)生的瞬時速度場就是光流場。從光流中可以獲得物體形狀結(jié)構(gòu)和運動狀態(tài)信息。通常情況下,鏡頭運動、目標運動或二者的共同運動都會產(chǎn)生光流。光流的常用計算方法有兩種:基于梯度的方法和基于匹配的方法。(1)基于梯度的方法梯度可以用于光流計算,由于其更為簡單的計算過程和相對較好的實驗結(jié)果,這類方
35、法得到了廣泛的應(yīng)用。但由于受到可調(diào)參數(shù)、可靠性評價因子和預(yù)處理方法等因素的影響,在應(yīng)用光流對目標進行檢測與自動跟蹤時仍存在很多問題。(2)基于匹配的方法這類方法主要采用基于區(qū)域的和基于特征的兩種匹配方法?;谔卣鞯钠ヅ浞椒ㄐ枰粩嗟孬@取目標特征對其進行檢測和跟蹤,對較大目標的運動和亮度變化比較敏感,但是得到的光流往往很稀疏,而且目標的特征提取與匹配也有相當難度;基于區(qū)域的匹配方法需要先定位相似區(qū)域的位置,然后通過相似區(qū)域和初始區(qū)域的比較來計算光流,基于區(qū)域的方法在網(wǎng)絡(luò)視頻傳輸編碼中得到了大量運用,但其計算中的光流仍然稀疏。光流法能夠獨立檢測運動目標,而不需要場景的預(yù)設(shè)信息,并且能夠檢測動態(tài)場景
36、下的運動情況。由于存在噪聲干擾、光源分布、光照陰影、物體遮擋等因素,計算得到光流場分布的準確性易受影響;并且光流法的計算過程相對復(fù)雜、耗時更長,如果沒有專業(yè)硬件支持加速,則難以實現(xiàn)實時的檢測。2.2.3 邊緣檢測方法圖像的邊緣為圖像中灰度發(fā)生急劇變化的區(qū)域,邊界分為階躍狀和屋頂狀兩種類型。圖像的邊緣一般對應(yīng)一階導(dǎo)數(shù)較大,二階導(dǎo)數(shù)為零的點。常用到的邊緣檢測方法有 Robert 算子、Sobel 算子、Laplace 算子等。與相鄰幀差法和背景差分法比較,邊緣檢測方法有利于鄰近運動目標的區(qū)分和運動目標特征的提取,對背景噪聲的魯棒性很大,但其運算復(fù)雜度也相對較大。運動圖像邊緣的檢測可以通過時間和空間
37、上的差分來獲得,空間上的差分可以使用已有的各種邊緣檢測算法,時間上的差分可以通過計算連續(xù)幀的差來獲得,也可以通過計算當前圖像與背景圖像的差分圖像,然后求其邊緣來計算。2.3 運動目標跟蹤方法信息理論中,目標跟蹤可定義為在給定一組觀測的條件下對系統(tǒng)的狀態(tài)進行估計。在視覺跟蹤中,跟蹤的目標是圖像中提取的目標特征,如果在每一幀圖像中特征的位置或形狀都能被準確確定,則物體能被很好地跟蹤。目標的軌跡就是二位圖像或三維世界中被跟蹤特征的位置序列。目標跟蹤是計算機視覺中最困難的任務(wù)之一,其困難和干擾主要有目標的形狀變化、攝像機及目標的運動和目標所處的復(fù)雜背景等(李培華,2010)。目標跟蹤問題所包含的內(nèi)容十
38、分廣泛,根據(jù)是否恢復(fù)或獲得感興趣物體的三維結(jié)構(gòu),目標跟蹤方法可分為 3D 和 2D 跟蹤方法。前者一般需要多攝像機以獲得目標在三維世界中的姿態(tài),而后者致力于單目攝像機對圖像平面中的目標進行跟蹤。本文主要研究目標的二維跟蹤方法。對于目標的二維跟蹤,從不同角度考慮可以按照多種方法進行分類。根據(jù)提取特征的不同,可將目標跟蹤的方法分為三類:基于邊緣特征的方法,其跟蹤特征是目標的邊緣信息;基于區(qū)域特征的方法,這種方法綜合考慮整個跟蹤區(qū)域內(nèi)的顏色、灰度、紋理以及運動信息;融合邊緣和區(qū)域特征的方法,此類方法將邊緣信息和區(qū)域信息結(jié)合起來,統(tǒng)一到一個跟蹤理論框架中。根據(jù)數(shù)學(xué)工具的不同,大致可以分為基于理論的目標
39、跟蹤方法、基于均值漂移(Mean Shift)的目標跟蹤方法和基于偏微分方程的目標跟蹤方法。基于濾波理論的跟蹤方法將跟蹤問題轉(zhuǎn)化為概率密度函數(shù)估計問題,利用卡爾曼濾波器(Kalman Filter, KF)或粒子濾波(朱志宇,2010)來跟蹤目標?;?Mean Shift的目標跟蹤方法采用概率密度函數(shù)之間的相似性函數(shù)度量目標和候選目標之間的相似性,通過梯度下降算法推導(dǎo)出 Mean Shift 迭代方程從而實現(xiàn)目標跟蹤?;谄⒎址匠痰母櫡椒▽⒛繕说母檰栴}轉(zhuǎn)化為泛函優(yōu)化問題,通過偏微分方程的求解得到泛函的極值,從而實現(xiàn)目標跟蹤。目標跟蹤算法的分類方法眾多,難以盡數(shù)列舉,所以本文僅介紹如下幾
40、種常用方法。2.3.1 基于特征的跟蹤方法跟蹤中可以使用許多種類的目標特征,在時間間隔很短的相鄰兩幀待檢測圖像中,可以認為其中的目標特征具有平滑性,因此可以利用目標特征來實現(xiàn)運動跟蹤?;谔卣鞯母櫡椒ㄍǔ0ㄌ卣魈崛∨c特征匹配兩個部分。目標特征可以是其位置中心,或者其上任意其他點,但要求該特征具備一定的穩(wěn)定性,不易受包括噪聲、光照在內(nèi)的種種因素干擾。常見的特征匹配方法有角點匹配,不變矩匹配,紋理匹配等。這些方法的優(yōu)點十分明顯:目標運動方式簡單,具備平滑性。而其難點在于,如果目標遭受遮擋或者旋轉(zhuǎn)等情況,則運動目標中的部分區(qū)域會消失,一些新區(qū)域也會出現(xiàn),因此需要提取新情況下的目標特征用以更新?;?/p>
41、于角點的方法是一種典型的基于特征的跟蹤方法,它的計算量較大,而在不同研究中對角點的定義也多有差別,因此實際的角點檢測方法多種多樣。大體上角點檢測方法可分為兩類:一類是基于輪廓邊界的方法。其角點定義為輪廓線段的交點,該方法對圖像分割和邊緣提取效果的依賴性較強,而且本身操作難度也很大,若目標發(fā)生遮擋等局部變化,則易導(dǎo)致圖像分割和邊緣提取失敗,所以這種方法的適用性不大。另一類是從灰度圖中直接提取角點的方法。盡管該類方法不用進行輪廓分割,但使用了二階偏微分,因此對圖像噪聲十分敏感。在檢測到新圖像中的角點后,將其同原有角點按照一定方法進行匹配,再按照匹配策略刪除誤配對角點就得到了最后的匹配結(jié)果。不變矩作
42、為圖像特征也可用于目標跟蹤。由 Hu 提出的三階以下矩具備旋轉(zhuǎn)、縮放、平移(Rotation Scaling and Translation, RST)不變性的特點。圖像進行 RST 變化后,其位置分布雖然發(fā)生改變,但由圖像各階矩計算出的不變矩仍然具有 RST 不變性,所以不變矩特征也常用于目標跟蹤過程。但是不變矩需要對所有像素點灰度值用于計算,對應(yīng)運算量太大,難以滿足實時跟蹤的要求。紋理也是圖像的基本特征,它被認為是對圖像灰度分布的描述,是對圖像局部性質(zhì)的統(tǒng)計,所以也可利用圖像的紋理特征來實現(xiàn)匹配,實現(xiàn)目標跟蹤。利用紋理特征進行圖像分割可以取得良好的效果,但是對于本身具備不同紋理的目標,就需
43、要對各個部分建立紋理特征。另一方面基于統(tǒng)計的紋理信息難以實現(xiàn)準確的測量,特別是在相似紋理匹配方面的效果不夠精準。2.3.2 基于模型的跟蹤方法基于模型的跟蹤方法正受到越來越多的關(guān)注,其研究進展也不斷深入。這類方法利用高層的語義知識將目標擬合為幾何模型,從而將對目標的跟蹤轉(zhuǎn)換為對目標的識別,具有更強的可靠性。同利用其他特征的方法相比,基于模型的跟蹤方法能更充分利用目標的特性,在復(fù)雜環(huán)境下具有顯著的優(yōu)勢。它的缺點也很明顯,模型的建立和更新代表著更大的計算量,并且還要考慮復(fù)雜模型的旋轉(zhuǎn)和平移等變化,更是增大了計算的復(fù)雜度,另外模型的建立還需要預(yù)知關(guān)于目標的先驗知識。這種方法比較適宜對具有線外表的物品
44、進行跟蹤,因為這類物品容易建立線框模型?;谀P偷母櫡椒ㄖ羞\動較多的是 Adaboost 算法。應(yīng)用 Adaboost 算法,首先需要對大量目標圖片和背景圖片標記后作為正負18樣本,經(jīng)過訓(xùn)練后得到目標的模型,用于后續(xù)識別和跟蹤。圖 2.5 描述了 Adaboost算法通過樣本訓(xùn)練獲得分類器然后進行目標檢測的過程。Adaboost 算法在不同訓(xùn)練集上分別訓(xùn)練得到若干弱分類器,將這些弱分類器根據(jù)錯誤率分配權(quán)重,經(jīng)過若干次迭代后進行組合得到最終的強分類器。圖 2.5 訓(xùn)練目標分類器及目標檢測流程2.3.3 基于主動輪廓的跟蹤方法從邊緣特征中可以獲得獨立于形狀和運動的目標信息,Kass et al(
45、1987)提出了主動輪廓算法來提取利用邊緣信息,這種方法使用一種被稱為 Snake 的模型。Denzler et al(1995)與 Dubuisson et al(1995)利用該模型來檢測和跟蹤目標。Snake 模型利用輪廓線來分割圖像。輪廓線在內(nèi)部力、外部力和約束力的共同作用下,自動地向目標輪廓移動,滿足能量最小要求的曲線就是最終得到的目標輪廓?;谥鲃虞喞母櫡椒ɡ昧巳值妮喞畔ⅲ恍枰P(guān)于目標的先驗知識,因而在邊緣檢測、目標檢測、目標跟蹤等方面的工作應(yīng)用較多。主動輪廓模型分為兩類:參數(shù)化主動輪廓和短程線主動輪廓。參數(shù)化主動輪廓中運動曲線用參數(shù)表示,并且要預(yù)先附加外界控制條件或知
46、道先驗知識。而短程線主動輪廓能夠自動處理曲線運動中的結(jié)構(gòu)變化,而不需要外界條件控制,在多個非剛性運動目標的跟蹤中表現(xiàn)更好。2.4 本章小結(jié)運動目標檢測與跟蹤是智能視頻監(jiān)控的關(guān)鍵步驟,而行人運動分析又是智能視頻監(jiān)控的核心內(nèi)容,其運動檢測與跟蹤同樣要以運動目標檢測與跟蹤為基礎(chǔ)。本章首先介紹了圖像處理相關(guān)的基礎(chǔ)知識,包括顏色空間、圖像預(yù)處理和形態(tài)學(xué)方法等;然后重點介紹了包括相鄰幀差、背景差分、光流法和邊緣檢測等的運動檢測方法,以及基于特征、基于模型、和基于主動輪廓等的運動跟蹤方法。在此基礎(chǔ)上,結(jié)合行人運動分析特點來實現(xiàn)行人運動檢測和跟蹤將是后續(xù)章節(jié)的主要內(nèi)容。XXX三、設(shè)計內(nèi)容基于幀間差分的運動檢測
47、即幀差法,它根據(jù)相鄰幀或隔幀圖像間亮度變化的大小來檢測運動目標,幀間差分公式如下:Di(x,y)=Ii(x,y)Ii-1(x,y) Ii(x,y),Ii-1(x,y)為前后兩幀圖像,幀差分運動檢測只針對前景區(qū)域進行,運動檢測公式如下,其中T為門限值。1,Di>TMi(x,y)=0,DiT選取T=20,仿真結(jié)果如下圖: 第19幀圖像 第20幀圖像 差分后二值化圖像 第79幀圖像 第80幀圖像 差分后二值化圖像 第139幀圖像 第140幀圖像 差分后二值化圖像圖3-1幀間差分實驗由上面的仿真實驗可以得出:運用幀間差分方法進行運動目標的檢測,可以有效的檢測出運動物體。右子圖中,可以比較清晰地得
48、到運動物體的輪廓。但是,這種算法雖然可以使背景像素不隨時間積累,迅速更新,因此這種算法有比較強的適應(yīng)場景變化能力。但是幀差法表示的是相鄰兩幀同位置的變化量,因此很有可能將比較大的運動目標,或者運動目標內(nèi)部顏色差異不大的像素判斷錯誤,在實體內(nèi)部產(chǎn)生拉伸、空洞現(xiàn)象8。而且當前景運動很慢且時間間隔選擇不合適時,容易出現(xiàn)根本檢測不到物體的情況。在差分圖像中,有很多“雪花”般的噪聲,這些是由于圖像局部的干擾造成的。本文隨后的章節(jié)將對如何消除這些噪聲進行討論。使用幀間差分法,需要考慮如何選擇合理的時間間隔,這一般取決于運動目標的速度。對于快速運動的目標,需要選擇較短的時間間隔,如果選擇不當,最壞情況下目標
49、在前后兩幀中沒有重疊,被檢測為兩個分開的目標;對于慢速運動的目標,應(yīng)該選擇較長的時間間隔,如果選擇不當,最壞情況下目標在前后兩幀中幾乎完全重疊,根本檢測不到目標。此外,在場景中由于多個運動目標的速度不一致也給時間間隔的選取帶來很大麻煩。3.1背景減法運動目標檢測背景差分算法的實質(zhì)是:實時輸入的場景圖像與背景圖像進行差分,可以較準確的分割出運動目標。但是背景差分算法也有其天然的缺陷,隨著時間的推移,場景的光線、樹葉的遮擋、或者運動物體滯留都會很大程度的破壞已經(jīng)建立好的背景圖像。為了解決這些問題,最好的方法便是使用背景建模和背景更新算法來彌補。前面已經(jīng)討論過相關(guān)問題,因此,本文假設(shè)背景處于理想情況
50、下進行背景差分算法的研究。設(shè)(x, y)是二維數(shù)字圖像的平面坐標,基于背景減法的二值化數(shù)學(xué)描述為:Di(x,y)=|Ii(x,y)Bi(x,y)| 1,Di>TMi(x,y) 0,DiTIi(x,y)表示圖像序列中當前幀的灰度圖像,Bi (x, y)表示當前幀背景的灰度圖像,Mi(x,y)表示相減后的二值化結(jié)果,T表示對應(yīng)的相減后灰度圖像的閾值,選取固定閾值T=20,基于背景減法的MATLAB仿真,如圖 圖3-2背景差分實驗Surendra算法計算出背景圖像,左圖為原始輸入圖像,中圖為背景圖像,右圖為背景差分法得出的二值化圖像。實驗結(jié)果表明:背景差分算法也可以有效地檢測出運動目標。由于背
51、景建模算法的引入,使得背景對噪聲有一定的抑制作用,在差分圖像中“雪花”較幀間差分算法有所減少。同時,使用背景差分算法檢測出的運動物體輪廓,比幀間差分法的檢測結(jié)果更清晰。因此,在背景建模與背景更新處于比較理想的狀態(tài)下,背景差分算法得到的差分結(jié)果略好于幀間差分的結(jié)果。3.2閾值的選取Surendra算法提取背景及目標提取都需對圖像二值化。分割閾值的選取雖看似簡單,但直接影響目標的分割效果,閾值T增大,雖然可以一定量的減少環(huán)境對效果的影響,但同時也會將差分結(jié)果中變化不明顯的區(qū)域作為前景被忽略掉;閾值T減小,效果卻又恰恰相反。前面提到的相關(guān)算法中,閾值的選取都是采用的靜態(tài)固定閾值。這種閾值的選取方法在
52、實際運用中是不可取的,因為在視頻監(jiān)控應(yīng)用中,監(jiān)控者不可能隨時對監(jiān)控質(zhì)量做出評估并相應(yīng)的修改閾值。所以,研究人員提出了許多閾值的選取方法。但是到目前為止還不存在一種通用的方法,也不存在一個判斷分割是否成功的客觀標準。閾值法可以分為全局閾值法和局部閾值法兩種9。全局閾值法是指在在整幅圖像范圍內(nèi)用同一閾值來進行二值化處理的方法;局部閾值法是當圖像中的敏感度不均勻,以慢斜率變化時,將圖像分割成幾個子塊。如果在每個子塊中可以找到最佳閾值,就稱這樣的的閾值確定方法為局部閾值法。本文選用循環(huán)分割法來自適應(yīng)地得到在二值化一幅圖像時所需要的全局閾值T?;静襟E如下:(1)選擇一個T的初始估計值(2)用T分割圖像
53、。這樣做會生成兩組像素:G1由所有灰度值大于T的像素組成,而G2由所有灰度值小于或等于T的像素組成。(3)對區(qū)域G1和G2中的所有像素計算平均灰度值1和2。(4)按下式計算新的閾值。T=1/2(2+1)(5)重復(fù)步驟(2)到(4),直到逐次迭代所得到的T值之差小于預(yù)先定義的參數(shù)。當背景和對象在圖像中占據(jù)的面積相近時,好的T的初始值就是圖像的平均灰度值。如果對象與背景所占的面積不相近時,則其中一個像素組合會在直方圖中占主要地位,平均灰度值就不是好的初始選擇。此時,T更合適的初值是諸如灰度值的中間值一類的初值。對車輛檢測進行仿真時,由于車輛與背景面積相差較大,選用的初值就是最大灰度和最小灰度和的一半。進行閾值計算時還應(yīng)注意迭代速度和精度的矛盾。3.3形態(tài)學(xué)濾波由于刮風(fēng)、氣流等原因,背景中部分物體小幅度晃動;光線的變化等不確定因素,會使得視頻圖像產(chǎn)生大量噪聲,當差值圖像二值化后,仍然有很多無用的噪聲斑點。因此,需要采用數(shù)學(xué)形態(tài)學(xué)方法,對分割后的二值圖像進行形態(tài)學(xué)濾波。數(shù)學(xué)形態(tài)學(xué)的主要用途是獲取物體拓撲和結(jié)構(gòu)信息。它通過物體和機構(gòu)元素相互作用的某些運算
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 個人借款質(zhì)押合同書樣本
- 專用線鐵路物流服務(wù)合同細則
- 個人與企業(yè)租賃合同范本大全
- 采購標準合同書
- 專業(yè)講師聘任合同范本
- 萬畝高標準農(nóng)田建設(shè)項目合同
- 業(yè)務(wù)承包合同書正式版
- 個人借款合同典范:版
- 上海市商品房買賣合同范本
- 專業(yè)測量儀器租賃合同模板
- 2025年中國山泉水市場前景預(yù)測及投資規(guī)劃研究報告
- GB/T 18109-2024凍魚
- 2025年八省聯(lián)考數(shù)學(xué)試題(原卷版)
- CONSORT2010流程圖(FlowDiagram)【模板】文檔
- 中興ZCTP 5GC高級工程師認證考試題庫匯總(含答案)
- 大學(xué)生創(chuàng)新創(chuàng)業(yè)教程PPT全套完整教學(xué)課件
- 小學(xué)科學(xué)項目化作業(yè)的設(shè)計與實施研究
- 2023年考研考博-考博英語-西安建筑科技大學(xué)考試歷年真題摘選含答案解析
- 2020年中考生物試卷及答案
- MCNP-5A程序使用說明書
- java基礎(chǔ)知識大全
評論
0/150
提交評論