人體行為識(shí)別技術(shù)_1605_第1頁(yè)
人體行為識(shí)別技術(shù)_1605_第2頁(yè)
人體行為識(shí)別技術(shù)_1605_第3頁(yè)
人體行為識(shí)別技術(shù)_1605_第4頁(yè)
人體行為識(shí)別技術(shù)_1605_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、解?!?】精品人體行為識(shí)別技術(shù)在計(jì)算機(jī)視覺(jué)領(lǐng)域中, 人體運(yùn)動(dòng)行為識(shí)別是一個(gè)被廣泛關(guān)注的熱點(diǎn)問(wèn)題,在智能監(jiān)控、機(jī)器人、人機(jī)交互、虛擬現(xiàn)實(shí),智能家居,智能安防,運(yùn)動(dòng)員輔助訓(xùn)練等方面有巨大應(yīng)用價(jià)值。 行為識(shí)別問(wèn)題一般遵從如下基本過(guò)程:數(shù)據(jù)圖像預(yù)處理,運(yùn)動(dòng)人體檢測(cè)、運(yùn)動(dòng)特征提取、特征訓(xùn)練與分類、行為識(shí)別。著重從這幾方面逐一回顧了近年來(lái)人體行為識(shí)別的發(fā)展現(xiàn)狀和常有方法。并對(duì)當(dāng)前該研究方向上待解決的問(wèn)題和未來(lái)趨勢(shì)做了分析。行為理解可以簡(jiǎn)單地認(rèn)為是時(shí)變數(shù)據(jù)的分類問(wèn)題,即將測(cè)試序列與預(yù)先標(biāo)定的代表典型行為的參考序列進(jìn)行匹配。通過(guò)對(duì)大量行為理解研究文獻(xiàn)的整理發(fā)現(xiàn):人行為理解研究一般遵從特征提取與運(yùn)動(dòng)表征、行為識(shí)

2、別、高層行為與場(chǎng)景理解等幾個(gè)基本過(guò)程。特征提取與運(yùn)動(dòng)表征是在對(duì)目標(biāo)檢測(cè)、分類和跟蹤等底層和中層處理的基礎(chǔ)上,從目標(biāo)的運(yùn)動(dòng)信息中提取目標(biāo)圖像特征并用來(lái)表征目標(biāo)運(yùn)動(dòng)狀態(tài);行為識(shí)別則是將輸入序列中提取的運(yùn)動(dòng)特征與參考序列進(jìn)行匹配,判斷當(dāng)前的動(dòng)作處于哪種行為模型;高層行為與場(chǎng)景理解是結(jié)合行為發(fā)生的場(chǎng)景信息和相關(guān)領(lǐng)域知識(shí),識(shí)別復(fù)雜行為,實(shí)現(xiàn)對(duì)事件和場(chǎng)景的理1 、行為識(shí)別的應(yīng)用從應(yīng)用領(lǐng)域的分類來(lái)講,可以將人體運(yùn)動(dòng)分析的應(yīng)用分成如下幾個(gè)領(lǐng)域:智能監(jiān)控這里所指的 “智能 ” 包含兩個(gè)方面的含義。 一種 “智能 ”是指系統(tǒng)能夠在一定的場(chǎng)景中檢測(cè)是否有人的出現(xiàn)(如通過(guò)檢測(cè)人臉的方法 )防止只是簡(jiǎn)單的通過(guò)運(yùn)動(dòng)目標(biāo)檢

3、測(cè)所造成的錯(cuò)誤報(bào)警(例如因?yàn)閯?dòng)物活動(dòng)或者刮風(fēng)搖動(dòng)樹(shù)枝等等而造感謝下載載精品成誤報(bào) )。另外一種 “ 智能 ”是指系統(tǒng)能夠監(jiān)視一定場(chǎng)所中人的活動(dòng),并對(duì)其行為進(jìn)行分析和識(shí)別,跟蹤可疑行為(如經(jīng)常在重要地點(diǎn)徘徊等等行為)從而采取相應(yīng)的報(bào)警措施。通常把報(bào)警系統(tǒng)設(shè)置于銀行、機(jī)場(chǎng)、車站、碼頭、超市、辦公大樓、住宅小區(qū)等地,以實(shí)現(xiàn)對(duì)這些場(chǎng)所的智能監(jiān)控。虛擬現(xiàn)實(shí)跟蹤現(xiàn)實(shí)世界人的姿態(tài), 從而創(chuàng)建一個(gè)虛擬的仿真場(chǎng)景,實(shí)現(xiàn)人與這個(gè)虛擬世界的交互。該領(lǐng)域的具體應(yīng)用涉及視頻游戲、 虛擬攝影棚、計(jì)算機(jī)動(dòng)畫(huà)等方面。高級(jí)用戶接口指可以通過(guò)對(duì)用戶手勢(shì)的識(shí)別來(lái)代替?zhèn)鹘y(tǒng)的鼠標(biāo)和鍵盤輸入,從而實(shí)現(xiàn)人與計(jì)算機(jī)之間的智能交互。 此外,通

4、過(guò)對(duì)手勢(shì)語(yǔ)言的理解, 還可以進(jìn)行聾人與計(jì)算機(jī)之間的手語(yǔ)交流。運(yùn)動(dòng)分析人體運(yùn)動(dòng)分析可以運(yùn)用于基于內(nèi)容的視頻檢索領(lǐng)域。例如可以檢索在運(yùn)動(dòng)會(huì)上單杠比賽中運(yùn)動(dòng)員的杠上動(dòng)作。 這樣可以節(jié)省用戶大量的查詢視頻資料的時(shí)間和精力。另外一種應(yīng)用是用于各種體育項(xiàng)目中,提取運(yùn)動(dòng)員的各項(xiàng)技術(shù)參數(shù)(如關(guān)節(jié)位置、角度和角速度,等等),通過(guò)分析這些信息,可以為運(yùn)動(dòng)員的訓(xùn)練提供指導(dǎo)和建議, 有助于提高運(yùn)動(dòng)員的訓(xùn)練水平。此外,還可以用于體育舞蹈動(dòng)作的分析,以及臨床矯形術(shù)的研究等領(lǐng)域。基于模型的視頻編碼通過(guò)提取一定的靜態(tài)場(chǎng)景中人物的形態(tài)特征參數(shù)和3D 姿態(tài)參數(shù),以較低的數(shù)據(jù)量對(duì)視頻數(shù)據(jù)流加以描述,實(shí)現(xiàn)視頻數(shù)據(jù)的壓縮和低比特率傳送

5、??梢杂糜谠谝蛱鼐W(wǎng)上展開(kāi)遠(yuǎn)程視頻會(huì)議以及VOD ( Video-On-Demand)視頻點(diǎn)播。感謝下載載精品總之,人體運(yùn)動(dòng)跟蹤的研究已涉及到計(jì)算機(jī)視覺(jué)、模式識(shí)別、 視頻圖像處理等方面的理論問(wèn)題和實(shí)際應(yīng)用問(wèn)題,對(duì)人體這一帶有關(guān)節(jié)旋轉(zhuǎn)運(yùn)動(dòng)的非剛體目標(biāo)的跟蹤與分析將會(huì)促進(jìn)這些領(lǐng)域在理論上產(chǎn)生新的處理方法,并將對(duì)諸多應(yīng)用領(lǐng)域產(chǎn)生潛在的影響。2、行為識(shí)別研究難點(diǎn)行為識(shí)別發(fā)展至今, 取得了很大的進(jìn)展, 在低層,中層和高層都取得了一定的突破,但是行為識(shí)別算法并不成熟, 目前不存在一個(gè)算法適合所有的行為分類,3 個(gè)視覺(jué)層次中都還有很多嚴(yán)峻的問(wèn)題有待解決。其研究的難點(diǎn)主要體現(xiàn)在以下幾個(gè)方面:1)動(dòng)作類內(nèi)類間的變

6、化太大對(duì)于大多數(shù)的動(dòng)作, 即使是同一動(dòng)作都有不同的表現(xiàn)形式。比如說(shuō)走路, 可以在不同的背景環(huán)境中完成, 走路的速度也可以從慢到快, 走路的步長(zhǎng)亦有長(zhǎng)有短。其它的動(dòng)作也有類似的結(jié)果,特別是一些非周期的運(yùn)動(dòng), 比如過(guò)馬路時(shí)候的走路,這與平時(shí)周期性的走路步伐明顯不同。 由此可見(jiàn),動(dòng)作的種類本身就很多,再加上每一種類又有很多個(gè)變種,所以給行為識(shí)別的研究帶來(lái)了不少麻煩。2)環(huán)境背景等影響環(huán)境問(wèn)背景等因素的影響可謂是計(jì)算機(jī)視覺(jué)各個(gè)領(lǐng)域的最大難點(diǎn)。主要有視角的多樣性,同樣的動(dòng)作從不同的視角來(lái)觀察會(huì)得到不同的二維圖像;人與人之間,人與背景之間的相互遮擋也使計(jì)算機(jī)對(duì)動(dòng)作的分類前期特征提取帶來(lái)了困難,目前解決多視

7、覺(jué)和遮擋問(wèn)題,有學(xué)者提出了多攝像機(jī)融合通過(guò)3 維重建來(lái)處理;另外其影響因素還包括動(dòng)態(tài)變化和雜亂的背景,環(huán)境光照的變化, 圖像視頻的低分辨率等。感謝下載載精品3)時(shí)間變化的影響人體的行為離不開(kāi)時(shí)間這個(gè)因素。 而我們拍攝的視頻其存放格式有可能不同,其播放速度有慢有快,這就導(dǎo)致了我們提出的系統(tǒng)需對(duì)視頻的播放速率不敏感。4)數(shù)據(jù)的獲取和標(biāo)注既然把行為識(shí)別問(wèn)題當(dāng)成一個(gè)分類問(wèn)題,就需要大量的數(shù)據(jù)來(lái)訓(xùn)練分類模型。而這些數(shù)據(jù)是視頻數(shù)據(jù), 每一個(gè)動(dòng)作在視頻中出現(xiàn)的位置和時(shí)間都不確定,同時(shí)要考慮同一種動(dòng)作的不同表現(xiàn)形式以及不同動(dòng)作之間的區(qū)分度,即數(shù)據(jù)的多樣性和全面性。這一收集過(guò)程的工作量不小, 網(wǎng)上已經(jīng)有一些公開(kāi)

8、的數(shù)據(jù)庫(kù)供大家用來(lái)實(shí)驗(yàn),這將在本文的第3 部分進(jìn)行介紹。另外,手動(dòng)對(duì)視頻數(shù)據(jù)標(biāo)注非常困難。當(dāng)然,有學(xué)者也提出了一些自動(dòng)標(biāo)注的方法,比如說(shuō)利用網(wǎng)頁(yè)圖片搜索引擎,利用視頻的字幕,以及利用電影描述的文本進(jìn)行匹配。5)高層視覺(jué)的理解上面一提到,目前對(duì)行為識(shí)別的研究尚處在動(dòng)作識(shí)別這一層。其處理的行為可以分為 2 類,一類是有限制類別的簡(jiǎn)單規(guī)則行為,比如說(shuō)走、跑、揮手、彎腰、跳等。另一類是在具體的場(chǎng)景中特定的行為,如檢測(cè)恐怖分子異常行為,丟包后突然離開(kāi)等。在這種場(chǎng)景下對(duì)行為的描述有嚴(yán)格的限制,此時(shí)其描述一般采用了運(yùn)動(dòng)或者軌跡。 這 2 種行為識(shí)別的研究都還不算完善,遇到了不少問(wèn)題, 且離高層的行為識(shí)別要求

9、還相差很遠(yuǎn)。 因此高層視覺(jué)的理解表示和識(shí)別是一個(gè)巨大的難題。3 人體行為分析研究感謝下載載精品一般的運(yùn)動(dòng)人體行為分析主要包括一下幾個(gè)流程:1 )數(shù)據(jù)庫(kù)建立; 2 )運(yùn)動(dòng)人體檢測(cè);3 )運(yùn)動(dòng)特征提??;4 )行為理解與識(shí)別。在我們的運(yùn)動(dòng)人體行為分析研究中,重點(diǎn)研究運(yùn)動(dòng)人體檢測(cè)和運(yùn)動(dòng)特征提取。如圖1 所示是運(yùn)動(dòng)行為分析研究的整體框架:圖 13.1 運(yùn)動(dòng)目標(biāo)檢測(cè)對(duì)于不依賴先驗(yàn)知識(shí)的目標(biāo)跟蹤來(lái)講,運(yùn)動(dòng)檢測(cè)是實(shí)現(xiàn)跟蹤的第一步,運(yùn)動(dòng)檢測(cè)即為從序列圖像中將變化區(qū)域從背景圖像中提取出來(lái)。目前,已有的運(yùn)動(dòng)目標(biāo)檢測(cè)方法按照算法的基本原理可以分為三類:幀間差分法、背景減除法和光流法。三類方法各有其優(yōu)缺點(diǎn)。(1) 背景

10、減除法背景減除法是預(yù)先選取不含前景運(yùn)動(dòng)目標(biāo)的背景圖像,然后將當(dāng)前圖像幀與背景圖像相減得到前景目標(biāo)。最常用且有效的是背景減除法。此類算法的缺點(diǎn)是由于通常需要緩沖若干幀來(lái)學(xué)習(xí)背景,因此往往需要消耗大量的內(nèi)存,這使其使用范圍受到了限制。此外,對(duì)于大范圍的背景擾動(dòng),此類算法的檢測(cè)效果也不理想。Stauffer和 Grimson提出的高斯混合模型是使用最為廣泛的背景建模方法。高斯混合模型通過(guò)多個(gè)高斯分布對(duì)背景建模,每個(gè)分布對(duì)應(yīng)一種背景像素的模態(tài),從而能夠適應(yīng)像素層面上感謝下載載精品的背景擾動(dòng)問(wèn)題,并能通過(guò)對(duì)背景的不斷更新,使系統(tǒng)能對(duì)背景的變化自適應(yīng)。但是 ,高斯混合模型對(duì)于全局光照變化、陰影非常敏感,對(duì)

11、于緩慢的運(yùn)動(dòng)目標(biāo)檢測(cè)效果也不理想。(2) 幀間差分法幀間差分法的主要思想就是利用視頻圖像序列中連續(xù)兩幀或三頓的差異來(lái)檢測(cè)發(fā)生運(yùn)動(dòng)的區(qū)域。 Lipton等人提出的用于實(shí)時(shí)視頻流中運(yùn)動(dòng)冃標(biāo)檢測(cè)的算法就是頓間差分的方法Lipton98。頓間差分法的特點(diǎn)是動(dòng)態(tài)性強(qiáng),能夠適應(yīng)動(dòng)態(tài)背景下的運(yùn)動(dòng)目標(biāo)檢測(cè)。但是,這類算法檢測(cè)出的目標(biāo)輪廓非常不理想,在目標(biāo)內(nèi)部會(huì)留有許多空洞,在目標(biāo)運(yùn)動(dòng)較快時(shí)目標(biāo)的輪廓會(huì)被擴(kuò)大 ,在目標(biāo)運(yùn)動(dòng)較慢時(shí)甚至有可能無(wú)法得到目標(biāo)的邊界。(3) 基于光流的運(yùn)動(dòng)目標(biāo)檢測(cè)算法基于光流的運(yùn)動(dòng)目標(biāo)檢測(cè)算法是利用光流方程計(jì)算出每個(gè)像素點(diǎn)的運(yùn)動(dòng)狀態(tài)矢量,從而發(fā)現(xiàn)運(yùn)動(dòng)的像素點(diǎn),并且能夠?qū)@些像素點(diǎn)進(jìn)行跟蹤

12、。在攝像機(jī)運(yùn)動(dòng)、背景變化時(shí),光流法也能檢測(cè)出運(yùn)動(dòng)目標(biāo),并且它能同時(shí)完成運(yùn)動(dòng)目標(biāo)檢測(cè)和跟蹤,但是該方法的計(jì)算復(fù)雜度高,在沒(méi)有專用硬件支持的情況下很難做到實(shí)時(shí)檢測(cè),同時(shí) ,光流場(chǎng)的計(jì)算非常容易受到噪聲、光照變化和背景擾動(dòng)的影響。采用光流場(chǎng)計(jì)算的方法也很難將運(yùn)動(dòng)目標(biāo)的輪廓完整地提取出來(lái)。3.2 運(yùn)動(dòng)目標(biāo)分類目標(biāo)分類是指從運(yùn)動(dòng)目標(biāo)檢測(cè)到的前景運(yùn)動(dòng)區(qū)域中提取感興趣目標(biāo)區(qū)域。復(fù)雜場(chǎng)景小檢測(cè)到的前景區(qū)域可能包含不同種類的目標(biāo),如行人、車輛、飛鳥(niǎo)、劉云、搖動(dòng)的樹(shù)枝等,在人體運(yùn)動(dòng)分析系統(tǒng)中,只對(duì)運(yùn)動(dòng)人體感興趣,因此需要對(duì)運(yùn)動(dòng)目標(biāo)的類型進(jìn)行分析識(shí)別,提感謝下載載精品取人體目標(biāo)。目前常用的目標(biāo)分類方法有如圖2:根據(jù)

13、運(yùn)動(dòng)區(qū)域的形狀使用簡(jiǎn)單的人體輪廓模式的特征進(jìn)行分類形狀參數(shù)檢測(cè)運(yùn)動(dòng)人體這兩類目標(biāo)分類方法基于形狀信提取區(qū)域的分散度、面積、寬高比等特征,采用三層神經(jīng)網(wǎng)絡(luò)將前景目標(biāo)也可結(jié)合使用,以得息的分類到更準(zhǔn)確的分類結(jié)果分類為人、人群、車輛和背景干擾分散度和面積信息區(qū)分人、車輛及混亂擾動(dòng)目標(biāo)分類根據(jù)人體運(yùn)動(dòng)的周期性特性,采用時(shí)頻分析法判斷運(yùn)動(dòng)軌跡是否存在基于運(yùn)動(dòng)信周期性,從而識(shí)別出運(yùn)動(dòng)人體息的分類通過(guò)計(jì)算運(yùn)動(dòng)區(qū)域的殘余光流來(lái)利用人體運(yùn)動(dòng)的周分析運(yùn)動(dòng)目標(biāo)的剛性和周期性期性進(jìn)行分類與剛性車輛的運(yùn)動(dòng)相比,非剛性的人體運(yùn)動(dòng)具有較高的平均殘余光流并且人體運(yùn)動(dòng)呈現(xiàn)周期性,因此可將人體區(qū)分出來(lái)圖 23.3 運(yùn)動(dòng)目標(biāo)跟蹤依

14、據(jù)運(yùn)動(dòng)目標(biāo)的表達(dá)和相似性度量, 運(yùn)動(dòng)目標(biāo)跟蹤算法可以分為四類: 基于主動(dòng)輪廓的跟蹤、基于特征的跟蹤、基于區(qū)域的跟蹤和基于模型的跟蹤。跟蹤算法的精度和魯棒性很大程度上取決于對(duì)運(yùn)動(dòng)目標(biāo)的表達(dá)和相似性度量的定義, 跟蹤算法的實(shí)時(shí)性取決于匹配搜索策略和濾波預(yù)測(cè)算法。1) 基于主動(dòng)輪廓的跟蹤Kass 等人提出的主動(dòng)輪廓模型, 即 Snake 模型 , 是在圖像域內(nèi)定義的可變形曲線, 通過(guò)對(duì)其能量函數(shù)的最小化, 動(dòng)態(tài)輪廓逐步調(diào)整自身形狀與目標(biāo)輪廓相一致, 該可變形曲線又稱為 Snake 曲線。 Snake 技術(shù)可以處理任意形狀物體的任意形變,首先將分割得到的物體邊界作為跟蹤的初始模板, 然后確定表征物體真

15、實(shí)邊界的目標(biāo)函數(shù), 并通過(guò)降低目標(biāo)函數(shù)值,使初始感謝下載載精品輪廓逐漸向物體的真實(shí)邊界移動(dòng)。基于主動(dòng)輪廓跟蹤的優(yōu)點(diǎn)是不但考慮來(lái)自圖像的灰度信息 , 而且考慮整體輪廓的幾何信息, 增強(qiáng)了跟蹤的可靠性。由于跟蹤過(guò)程實(shí)際上是解的尋優(yōu)過(guò)程, 帶來(lái)的計(jì)算量比較大,而且由于Snake 模型的盲目性 , 對(duì)于快速運(yùn)動(dòng)的物體或者形變較大的情況, 跟蹤效果不夠理想2) 基于特征的跟蹤基于特征匹配的跟蹤方法不考慮運(yùn)動(dòng)目標(biāo)的整體特征, 只通過(guò)目標(biāo)圖像的一些顯著特征來(lái)進(jìn)行跟蹤。假定運(yùn)動(dòng)目標(biāo)可以由惟一的特征集合表達(dá), 搜索到該相應(yīng)的特征集合就認(rèn)為跟蹤上了運(yùn)動(dòng)目標(biāo)。 除了用單一的特征來(lái)實(shí)現(xiàn)跟蹤外, 還可以采用多個(gè)特征信息

16、融合在一起作為跟蹤特征。2 )基于特征的跟蹤基于特征的跟蹤主要包括特征提取和特征匹配兩個(gè)方面。(1) 特征提取,特征提取是指從景物的原始圖像中提取圖像的描繪特征,理想的圖像特征應(yīng)具備的特點(diǎn)是a) 特征應(yīng)具有直觀意義 ,符合人們的視覺(jué)特性 ; b) 特征應(yīng)具備較好的分類能力,能夠區(qū)分不同的圖像內(nèi)容 ; c)特征計(jì)算應(yīng)該相對(duì)簡(jiǎn)單,以便于快速識(shí)別 ; d) 特征應(yīng)具備圖像平移、旋轉(zhuǎn)、 尺度變化等不變性。目標(biāo)跟蹤中常用的運(yùn)動(dòng)目標(biāo)的特征主要包括顏色、紋理、邊緣、 塊特征、 光流特征、周長(zhǎng)、 面積、 質(zhì)心、 角點(diǎn)等。提取對(duì)尺度伸縮、形變和亮度變化不敏感的有效特征至今仍是圖像處理研究領(lǐng)域中一個(gè)比較活躍的方面

17、。(2) 特征匹配,特征提取的目的是進(jìn)行幀間目標(biāo)特征的匹配 , 并以最優(yōu)匹配來(lái)跟蹤目標(biāo)。常見(jiàn)的基于特征匹配的跟蹤算法有:基于二值化目標(biāo)圖像匹配的跟蹤、基于邊緣特征匹配或角點(diǎn)特征匹配的跟蹤、基于目標(biāo)灰度特征匹配的跟蹤、 基于目標(biāo)顏色特征匹配的跟蹤等?;谔卣鞯母櫵惴ǖ膬?yōu)點(diǎn)在于對(duì)運(yùn)動(dòng)目標(biāo)的尺度、 形變和亮度等變化不敏感 , 即使目標(biāo)的某一部分被遮擋,只要還有一部分特征可以被看到 , 就可以完成跟蹤任務(wù) ; 另外 , 這種方法與K al man濾波器聯(lián)合使用 , 也具有很好的跟蹤效果。但是其對(duì)于圖像模糊、噪聲等比較敏感 , 圖像特征的提取效果也依賴于各種感謝下載載精品提取算子及其參數(shù)的設(shè)置, 此外

18、 , 連續(xù)幀間的特征對(duì)應(yīng)關(guān)系也較難確定, 尤其是當(dāng)每一幀圖像的特征數(shù)目不一致、存在漏檢、特征增加或減少等情況。3) 基于區(qū)域的跟蹤基于區(qū)域的跟蹤算法基本思想是: a)得到包含目標(biāo)的模板, 該模板可通過(guò)圖像分割獲得或預(yù)先人為確定, 模板通常為略大于目標(biāo)的矩形, 也可為不規(guī)則形狀; b) 在序列圖像中 , 運(yùn)用相關(guān)算法跟蹤目標(biāo)。這種算法的優(yōu)點(diǎn)在于當(dāng)目標(biāo)未被遮擋時(shí), 跟蹤精度非常高、跟蹤非常穩(wěn)定。但其缺點(diǎn)首先是費(fèi)時(shí), 當(dāng)搜索區(qū)域較大時(shí)情況尤其嚴(yán)重; 其次 , 算法要求目標(biāo)變形不大 , 且不能有太大遮擋, 否則相關(guān)精度下降會(huì)造成目標(biāo)的丟失。近年來(lái), 對(duì)基于區(qū)域的跟蹤方法關(guān)注較多的是如何處理模板變化時(shí)的

19、情況, 這種變化是由運(yùn)動(dòng)目標(biāo)姿態(tài)變化引起的,如果能正確預(yù)測(cè)目標(biāo)的姿態(tài)變化, 則可實(shí)現(xiàn)穩(wěn)定跟蹤。4) 基于模型的跟蹤基于模型的跟蹤是通過(guò)一定的先驗(yàn)知識(shí)對(duì)所跟蹤目標(biāo)建立模型, 然后通過(guò)匹配跟蹤目標(biāo)進(jìn)行模型的實(shí)時(shí)更新。對(duì)于剛體目標(biāo)來(lái)說(shuō), 其運(yùn)動(dòng)狀態(tài)變換主要是平移、旋轉(zhuǎn)等 , 可以利用該方法實(shí)現(xiàn)目標(biāo)跟蹤。但是實(shí)際應(yīng)用中跟蹤的不僅僅是剛體, 還有一大部分是非剛體, 目標(biāo)確切的幾何模型不容易得到。這種方法不易受觀測(cè)視角的影響, 具有較強(qiáng)的魯棒性, 模型匹配跟蹤精度高, 適合于機(jī)動(dòng)目標(biāo)的各種運(yùn)動(dòng)變化, 抗干擾能力強(qiáng), 但由于計(jì)算分析復(fù)雜、運(yùn)算速度慢 , 模型的更新較為復(fù)雜, 實(shí)時(shí)性較差。準(zhǔn)確建立運(yùn)動(dòng)模型是模

20、型匹配能否成功的關(guān)鍵。3.4 運(yùn)動(dòng)目標(biāo)的特征運(yùn)動(dòng)目標(biāo)的特征,是判斷一個(gè)目標(biāo)區(qū)別于另外一個(gè)目標(biāo)的重要依據(jù)。有效的運(yùn)動(dòng)目標(biāo)特征集可以準(zhǔn)確地區(qū)分不同目標(biāo)。運(yùn)動(dòng)目標(biāo)特征的提取是實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)分類的重要步驟。感謝下載載精品運(yùn)動(dòng)目標(biāo)分類方法概述目前,基于視頻的運(yùn)動(dòng)目標(biāo)分類方法已經(jīng)有很多,主要有 3 類:基于靜態(tài)特征的分類,基于動(dòng)態(tài)特征的分類和基于靜態(tài)、動(dòng)態(tài)特征相結(jié)合的分類。1)基于靜態(tài)特征的分類基于靜態(tài)信息的分類,即利用檢測(cè)出來(lái)的運(yùn)動(dòng)區(qū)域的形狀、顏色等物理特征進(jìn)行目標(biāo)分類的方法。 Lipton等利用離散度和面積信息對(duì)運(yùn)動(dòng)區(qū)域進(jìn)行分類,區(qū)分人、車、及混亂擾動(dòng),并利用時(shí)間一致性約束使分類更準(zhǔn)確,把除人、車外的目

21、標(biāo)當(dāng)成干擾物,實(shí)現(xiàn)簡(jiǎn)單。Zang等人利用長(zhǎng)寬比、 角點(diǎn)特征對(duì)運(yùn)動(dòng)區(qū)域進(jìn)行分類,區(qū)分人、汽車。 Rivlin 、Bogomolov等利用外接橢圓的長(zhǎng)寬比以及星形骨架等形狀特征,區(qū)分人、動(dòng)物、汽車。Hu等定義了目標(biāo)輪廓上的點(diǎn)與幾何中心的距離為“中距離”,利用中距離的離散度、最大中距離與最小中距離的比值作為分類特征,區(qū)分人、自行車、汽車。方帥等利用最大互信息獲得一組可靠、獨(dú)立且具辨認(rèn)力的目標(biāo)特征集,并用有向無(wú)環(huán)圖的多類支持向量機(jī)進(jìn)行分類,區(qū)分人、汽車。Otoom等人以角點(diǎn)的個(gè)數(shù)、圓的個(gè)數(shù)、離散度為分類特征,區(qū)分機(jī)場(chǎng)周圍的人、人群、包裹、手推車, 該文分類效果較差,主要是因?yàn)橥粋€(gè)目標(biāo)角點(diǎn)的個(gè)數(shù)與離攝

22、像頭遠(yuǎn)近差別很大,而且圓的個(gè)數(shù)判斷人、人群依賴目標(biāo)姿勢(shì)。2)基于動(dòng)態(tài)特征的分類基于動(dòng)態(tài)特征的分類,即利用人體運(yùn)動(dòng)的周期性或其他與運(yùn)動(dòng)相關(guān)的特征進(jìn)行目標(biāo)分類的方法。 采用靜態(tài)特征往往會(huì)造成在特征提取上對(duì)姿勢(shì)依賴的問(wèn)題,而有效的動(dòng)態(tài)特征可以減少對(duì)姿勢(shì)的依賴。Cutler與 Davis對(duì)目標(biāo)隨著時(shí)間變化的自相關(guān)特性進(jìn)行計(jì)算,再通過(guò)時(shí)頻化方法分析目標(biāo)是否存在周期性的運(yùn)動(dòng)特征而將人識(shí)別出來(lái)。Yang Ran與 TsaacWeiss ,基于周期性分類人和車輛,對(duì)目標(biāo)較小、圖像分辨率低的航空和紅外圖片有比較好感謝下載載精品的分類效果。 Javed 、Shah等利用是否有人體周期性運(yùn)動(dòng)特征、圓的個(gè)數(shù)等特征,分

23、類人、人群和車輛。3) 基于靜態(tài)與動(dòng)態(tài)特征相結(jié)合的分類Bogomolov、 Dror等的系統(tǒng)是基于目標(biāo)靜態(tài)特征和動(dòng)態(tài)運(yùn)動(dòng)特性相結(jié)合進(jìn)行目標(biāo)分類的,采用了屬于同類目標(biāo)的靜態(tài)輪廓的相似性和身體的傾斜角、腳之間的距離等運(yùn)動(dòng)特征,用支持向量機(jī)分類器進(jìn)行分類,提高了精確度和魯棒性。Aggarwal等利用緊湊度值以及運(yùn)動(dòng)方向的變化量,區(qū)分人、 人群、汽車、 自行車, 運(yùn)動(dòng)方向的變化量區(qū)分度不是很好。Li 等使用速度、長(zhǎng)寬比、離散度等特征,以BP 神經(jīng)網(wǎng)絡(luò)作為分類器,區(qū)分交通場(chǎng)景中的人、自行車,較好地對(duì)復(fù)雜場(chǎng)景下人、自行車進(jìn)行分類。常見(jiàn)的運(yùn)動(dòng)目標(biāo)特征分析一個(gè)運(yùn)動(dòng)目標(biāo)特征往往無(wú)法識(shí)別三個(gè)以上的目標(biāo),或者識(shí)別的

24、準(zhǔn)確率不夠高,一般目標(biāo)分類研究都是選擇至少兩個(gè)特征。通用特征指的是能反映所有目標(biāo)特性的特征;屬性特征,顧名思義,某個(gè)目標(biāo)的所固有的特征是特別能反映該目標(biāo)特性的特征。1)運(yùn)動(dòng)目標(biāo)的通用特征常見(jiàn)的通用特征主要有面積、長(zhǎng)寬比、離散度、空隙率(緊湊度 )等。目標(biāo)面積是在像素平面的投影面積,不是目標(biāo)的實(shí)際目標(biāo),同一位置的不同目標(biāo)大小各異,但是攝像機(jī)拍攝的目標(biāo)近大遠(yuǎn)小, 即使是同一目標(biāo),攝像頭拍攝的距離不同,面積也是不一樣的,在固定單攝像機(jī)的情況下, 面積對(duì)不同類目標(biāo)之間的區(qū)分度不是很大;攝像機(jī)標(biāo)定后該特征有一定的應(yīng)用。長(zhǎng)寬比即目標(biāo)外接矩形的長(zhǎng)寬比例,與距離攝像頭遠(yuǎn)近無(wú)關(guān),具有歸一化的特性,能真實(shí)反映目標(biāo)

25、的形狀比例,是最常用的一種目標(biāo)特征。離散度即運(yùn)動(dòng)目標(biāo)周長(zhǎng)的平方與面積的比值, 外形越復(fù)雜的目標(biāo),離散度越大;對(duì)于目標(biāo)碎片比較多的運(yùn)動(dòng)目標(biāo),由于目標(biāo)的輪廓感謝下載載精品準(zhǔn)確獲取不易, 離散度計(jì)算比較復(fù)雜并且計(jì)算的準(zhǔn)確性無(wú)法保證??障堵始茨繕?biāo)外接矩形內(nèi)部非目標(biāo)像素點(diǎn)所占的比例,與其相反的特征就是緊湊度。2)運(yùn)動(dòng)目標(biāo)的屬性特征人的屬性特征主要有圓、人體運(yùn)動(dòng)周期性等。人頭近似圓,從人的頭頂往下的角度看,人頭所在位置可以檢測(cè)到圓;研究中發(fā)現(xiàn)圓特征嚴(yán)重依賴目標(biāo)角度、姿勢(shì),正面、 側(cè)面的角度下, 圓特征不明顯、 人頭所在位置常常無(wú)法檢測(cè)到圓。人體運(yùn)動(dòng)周期性特征反映的是人體步態(tài)的規(guī)律性變化,周期性特征的提取對(duì)

26、目標(biāo)的觀察角度有很高的要求,只有人體目標(biāo)偏側(cè)面才能準(zhǔn)確提取到該特征。汽車的屬性特征主要有運(yùn)動(dòng)速度、離散度變化量等。 運(yùn)動(dòng)速度即相鄰兩幀的目標(biāo)像素距離與時(shí)間間隔的比值,該特征在一定程度上反應(yīng)了目標(biāo)在視頻圖像中的運(yùn)動(dòng)快慢,汽車的運(yùn)動(dòng)速度比較快; 但是由于目標(biāo)在不同的視頻中所處的環(huán)境和位置不同,攝像頭拍攝的角度和距離也不同,該特征與面積特征一樣,只有進(jìn)行攝像機(jī)標(biāo)定后,才有實(shí)際應(yīng)用意義。離散度變化量反映了各個(gè)目標(biāo)的變化幅度。離散度變化量特征與離散度一樣,計(jì)算比較復(fù)雜并且計(jì)算的準(zhǔn)確性無(wú)法保證??障堵首兓坑?jì)算簡(jiǎn)單,也能反映各個(gè)目標(biāo)的變化幅度,并且在目標(biāo)碎片比較多的情況下也能很好的提取,可以較好地替代離散度變化量特征。自行車既不是剛體,也不是非剛體,是一種介于剛體(汽車)與非剛體(人)的目標(biāo)。目前很少有文獻(xiàn)提起自行車行之有效的屬性特征,其特征一般都是介于人、汽車之間。運(yùn)動(dòng)目標(biāo)特征的選取由于實(shí)驗(yàn)中提取到的前景目標(biāo)存在多角度、目標(biāo)含有少量影子、目標(biāo)區(qū)域提取不完整和目標(biāo)較小等情況,采用基于形狀的特征分類目標(biāo),可較好地適應(yīng)這些情況。因此, 我們參賽的特征主要是基于形狀的特征。感謝下載載精品目標(biāo)基于形狀的特征主要有目標(biāo)輪廓、面積、長(zhǎng)寬比、離散度、質(zhì)心、外接矩形等。目前研究中廣泛使用的目標(biāo)特征主要有長(zhǎng)寬比P、面積信息S、離散

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論