人體行為識(shí)別技術(shù)_1605

上傳人：i*** IP屬地：天津上傳時(shí)間：2021-12-02 格式：DOCX 頁(yè)數(shù)：15 大小：116.51KB 積分：36 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩10頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、解?！?】精品人體行為識(shí)別技術(shù)在計(jì)算機(jī)視覺(jué)領(lǐng)域中，人體運(yùn)動(dòng)行為識(shí)別是一個(gè)被廣泛關(guān)注的熱點(diǎn)問(wèn)題，在智能監(jiān)控、機(jī)器人、人機(jī)交互、虛擬現(xiàn)實(shí)，智能家居，智能安防，運(yùn)動(dòng)員輔助訓(xùn)練等方面有巨大應(yīng)用價(jià)值。行為識(shí)別問(wèn)題一般遵從如下基本過(guò)程：數(shù)據(jù)圖像預(yù)處理，運(yùn)動(dòng)人體檢測(cè)、運(yùn)動(dòng)特征提取、特征訓(xùn)練與分類(lèi)、行為識(shí)別。著重從這幾方面逐一回顧了近年來(lái)人體行為識(shí)別的發(fā)展現(xiàn)狀和常有方法。并對(duì)當(dāng)前該研究方向上待解決的問(wèn)題和未來(lái)趨勢(shì)做了分析。行為理解可以簡(jiǎn)單地認(rèn)為是時(shí)變數(shù)據(jù)的分類(lèi)問(wèn)題，即將測(cè)試序列與預(yù)先標(biāo)定的代表典型行為的參考序列進(jìn)行匹配。通過(guò)對(duì)大量行為理解研究文獻(xiàn)的整理發(fā)現(xiàn)：人行為理解研究一般遵從特征提取與運(yùn)動(dòng)表征、行為識(shí)

2、別、高層行為與場(chǎng)景理解等幾個(gè)基本過(guò)程。特征提取與運(yùn)動(dòng)表征是在對(duì)目標(biāo)檢測(cè)、分類(lèi)和跟蹤等底層和中層處理的基礎(chǔ)上，從目標(biāo)的運(yùn)動(dòng)信息中提取目標(biāo)圖像特征并用來(lái)表征目標(biāo)運(yùn)動(dòng)狀態(tài)；行為識(shí)別則是將輸入序列中提取的運(yùn)動(dòng)特征與參考序列進(jìn)行匹配，判斷當(dāng)前的動(dòng)作處于哪種行為模型；高層行為與場(chǎng)景理解是結(jié)合行為發(fā)生的場(chǎng)景信息和相關(guān)領(lǐng)域知識(shí)，識(shí)別復(fù)雜行為，實(shí)現(xiàn)對(duì)事件和場(chǎng)景的理1 、行為識(shí)別的應(yīng)用從應(yīng)用領(lǐng)域的分類(lèi)來(lái)講，可以將人體運(yùn)動(dòng)分析的應(yīng)用分成如下幾個(gè)領(lǐng)域：智能監(jiān)控這里所指的 “智能 ” 包含兩個(gè)方面的含義。一種 “智能 ”是指系統(tǒng)能夠在一定的場(chǎng)景中檢測(cè)是否有人的出現(xiàn)(如通過(guò)檢測(cè)人臉的方法 )防止只是簡(jiǎn)單的通過(guò)運(yùn)動(dòng)目標(biāo)檢

3、測(cè)所造成的錯(cuò)誤報(bào)警(例如因?yàn)閯?dòng)物活動(dòng)或者刮風(fēng)搖動(dòng)樹(shù)枝等等而造感謝下載載精品成誤報(bào) )。另外一種 “ 智能 ”是指系統(tǒng)能夠監(jiān)視一定場(chǎng)所中人的活動(dòng)，并對(duì)其行為進(jìn)行分析和識(shí)別，跟蹤可疑行為(如經(jīng)常在重要地點(diǎn)徘徊等等行為)從而采取相應(yīng)的報(bào)警措施。通常把報(bào)警系統(tǒng)設(shè)置于銀行、機(jī)場(chǎng)、車(chē)站、碼頭、超市、辦公大樓、住宅小區(qū)等地，以實(shí)現(xiàn)對(duì)這些場(chǎng)所的智能監(jiān)控。虛擬現(xiàn)實(shí)跟蹤現(xiàn)實(shí)世界人的姿態(tài)，從而創(chuàng)建一個(gè)虛擬的仿真場(chǎng)景，實(shí)現(xiàn)人與這個(gè)虛擬世界的交互。該領(lǐng)域的具體應(yīng)用涉及視頻游戲、虛擬攝影棚、計(jì)算機(jī)動(dòng)畫(huà)等方面。高級(jí)用戶接口指可以通過(guò)對(duì)用戶手勢(shì)的識(shí)別來(lái)代替?zhèn)鹘y(tǒng)的鼠標(biāo)和鍵盤(pán)輸入，從而實(shí)現(xiàn)人與計(jì)算機(jī)之間的智能交互。此外，通

4、過(guò)對(duì)手勢(shì)語(yǔ)言的理解，還可以進(jìn)行聾人與計(jì)算機(jī)之間的手語(yǔ)交流。運(yùn)動(dòng)分析人體運(yùn)動(dòng)分析可以運(yùn)用于基于內(nèi)容的視頻檢索領(lǐng)域。例如可以檢索在運(yùn)動(dòng)會(huì)上單杠比賽中運(yùn)動(dòng)員的杠上動(dòng)作。這樣可以節(jié)省用戶大量的查詢(xún)視頻資料的時(shí)間和精力。另外一種應(yīng)用是用于各種體育項(xiàng)目中，提取運(yùn)動(dòng)員的各項(xiàng)技術(shù)參數(shù)(如關(guān)節(jié)位置、角度和角速度，等等)，通過(guò)分析這些信息，可以為運(yùn)動(dòng)員的訓(xùn)練提供指導(dǎo)和建議，有助于提高運(yùn)動(dòng)員的訓(xùn)練水平。此外，還可以用于體育舞蹈動(dòng)作的分析，以及臨床矯形術(shù)的研究等領(lǐng)域?；谀Ｐ偷囊曨l編碼通過(guò)提取一定的靜態(tài)場(chǎng)景中人物的形態(tài)特征參數(shù)和3D 姿態(tài)參數(shù)，以較低的數(shù)據(jù)量對(duì)視頻數(shù)據(jù)流加以描述，實(shí)現(xiàn)視頻數(shù)據(jù)的壓縮和低比特率傳送

5、?？梢杂糜谠谝蛱鼐W(wǎng)上展開(kāi)遠(yuǎn)程視頻會(huì)議以及VOD （ Video-On-Demand）視頻點(diǎn)播。感謝下載載精品總之，人體運(yùn)動(dòng)跟蹤的研究已涉及到計(jì)算機(jī)視覺(jué)、模式識(shí)別、視頻圖像處理等方面的理論問(wèn)題和實(shí)際應(yīng)用問(wèn)題，對(duì)人體這一帶有關(guān)節(jié)旋轉(zhuǎn)運(yùn)動(dòng)的非剛體目標(biāo)的跟蹤與分析將會(huì)促進(jìn)這些領(lǐng)域在理論上產(chǎn)生新的處理方法，并將對(duì)諸多應(yīng)用領(lǐng)域產(chǎn)生潛在的影響。2、行為識(shí)別研究難點(diǎn)行為識(shí)別發(fā)展至今，取得了很大的進(jìn)展，在低層，中層和高層都取得了一定的突破，但是行為識(shí)別算法并不成熟，目前不存在一個(gè)算法適合所有的行為分類(lèi)，3 個(gè)視覺(jué)層次中都還有很多嚴(yán)峻的問(wèn)題有待解決。其研究的難點(diǎn)主要體現(xiàn)在以下幾個(gè)方面：1）動(dòng)作類(lèi)內(nèi)類(lèi)間的變

6、化太大對(duì)于大多數(shù)的動(dòng)作，即使是同一動(dòng)作都有不同的表現(xiàn)形式。比如說(shuō)走路，可以在不同的背景環(huán)境中完成，走路的速度也可以從慢到快，走路的步長(zhǎng)亦有長(zhǎng)有短。其它的動(dòng)作也有類(lèi)似的結(jié)果，特別是一些非周期的運(yùn)動(dòng)，比如過(guò)馬路時(shí)候的走路，這與平時(shí)周期性的走路步伐明顯不同。由此可見(jiàn)，動(dòng)作的種類(lèi)本身就很多，再加上每一種類(lèi)又有很多個(gè)變種，所以給行為識(shí)別的研究帶來(lái)了不少麻煩。2）環(huán)境背景等影響環(huán)境問(wèn)背景等因素的影響可謂是計(jì)算機(jī)視覺(jué)各個(gè)領(lǐng)域的最大難點(diǎn)。主要有視角的多樣性，同樣的動(dòng)作從不同的視角來(lái)觀察會(huì)得到不同的二維圖像；人與人之間，人與背景之間的相互遮擋也使計(jì)算機(jī)對(duì)動(dòng)作的分類(lèi)前期特征提取帶來(lái)了困難，目前解決多視

7、覺(jué)和遮擋問(wèn)題，有學(xué)者提出了多攝像機(jī)融合通過(guò)3 維重建來(lái)處理；另外其影響因素還包括動(dòng)態(tài)變化和雜亂的背景，環(huán)境光照的變化，圖像視頻的低分辨率等。感謝下載載精品3）時(shí)間變化的影響人體的行為離不開(kāi)時(shí)間這個(gè)因素。而我們拍攝的視頻其存放格式有可能不同，其播放速度有慢有快，這就導(dǎo)致了我們提出的系統(tǒng)需對(duì)視頻的播放速率不敏感。4）數(shù)據(jù)的獲取和標(biāo)注既然把行為識(shí)別問(wèn)題當(dāng)成一個(gè)分類(lèi)問(wèn)題，就需要大量的數(shù)據(jù)來(lái)訓(xùn)練分類(lèi)模型。而這些數(shù)據(jù)是視頻數(shù)據(jù)，每一個(gè)動(dòng)作在視頻中出現(xiàn)的位置和時(shí)間都不確定，同時(shí)要考慮同一種動(dòng)作的不同表現(xiàn)形式以及不同動(dòng)作之間的區(qū)分度，即數(shù)據(jù)的多樣性和全面性。這一收集過(guò)程的工作量不小，網(wǎng)上已經(jīng)有一些公開(kāi)

8、的數(shù)據(jù)庫(kù)供大家用來(lái)實(shí)驗(yàn)，這將在本文的第3 部分進(jìn)行介紹。另外，手動(dòng)對(duì)視頻數(shù)據(jù)標(biāo)注非常困難。當(dāng)然，有學(xué)者也提出了一些自動(dòng)標(biāo)注的方法，比如說(shuō)利用網(wǎng)頁(yè)圖片搜索引擎,利用視頻的字幕，以及利用電影描述的文本進(jìn)行匹配。5）高層視覺(jué)的理解上面一提到，目前對(duì)行為識(shí)別的研究尚處在動(dòng)作識(shí)別這一層。其處理的行為可以分為 2 類(lèi)，一類(lèi)是有限制類(lèi)別的簡(jiǎn)單規(guī)則行為，比如說(shuō)走、跑、揮手、彎腰、跳等。另一類(lèi)是在具體的場(chǎng)景中特定的行為，如檢測(cè)恐怖分子異常行為，丟包后突然離開(kāi)等。在這種場(chǎng)景下對(duì)行為的描述有嚴(yán)格的限制，此時(shí)其描述一般采用了運(yùn)動(dòng)或者軌跡。這 2 種行為識(shí)別的研究都還不算完善，遇到了不少問(wèn)題，且離高層的行為識(shí)別要求

9、還相差很遠(yuǎn)。因此高層視覺(jué)的理解表示和識(shí)別是一個(gè)巨大的難題。3 人體行為分析研究感謝下載載精品一般的運(yùn)動(dòng)人體行為分析主要包括一下幾個(gè)流程：1 ）數(shù)據(jù)庫(kù)建立； 2 ）運(yùn)動(dòng)人體檢測(cè)；3 ）運(yùn)動(dòng)特征提?。? ）行為理解與識(shí)別。在我們的運(yùn)動(dòng)人體行為分析研究中，重點(diǎn)研究運(yùn)動(dòng)人體檢測(cè)和運(yùn)動(dòng)特征提取。如圖1 所示是運(yùn)動(dòng)行為分析研究的整體框架：圖 13.1 運(yùn)動(dòng)目標(biāo)檢測(cè)對(duì)于不依賴(lài)先驗(yàn)知識(shí)的目標(biāo)跟蹤來(lái)講，運(yùn)動(dòng)檢測(cè)是實(shí)現(xiàn)跟蹤的第一步，運(yùn)動(dòng)檢測(cè)即為從序列圖像中將變化區(qū)域從背景圖像中提取出來(lái)。目前,已有的運(yùn)動(dòng)目標(biāo)檢測(cè)方法按照算法的基本原理可以分為三類(lèi):幀間差分法、背景減除法和光流法。三類(lèi)方法各有其優(yōu)缺點(diǎn)。(1) 背景

10、減除法背景減除法是預(yù)先選取不含前景運(yùn)動(dòng)目標(biāo)的背景圖像，然后將當(dāng)前圖像幀與背景圖像相減得到前景目標(biāo)。最常用且有效的是背景減除法。此類(lèi)算法的缺點(diǎn)是由于通常需要緩沖若干幀來(lái)學(xué)習(xí)背景,因此往往需要消耗大量的內(nèi)存,這使其使用范圍受到了限制。此外,對(duì)于大范圍的背景擾動(dòng),此類(lèi)算法的檢測(cè)效果也不理想。Stauffer和 Grimson提出的高斯混合模型是使用最為廣泛的背景建模方法。高斯混合模型通過(guò)多個(gè)高斯分布對(duì)背景建模,每個(gè)分布對(duì)應(yīng)一種背景像素的模態(tài),從而能夠適應(yīng)像素層面上感謝下載載精品的背景擾動(dòng)問(wèn)題,并能通過(guò)對(duì)背景的不斷更新,使系統(tǒng)能對(duì)背景的變化自適應(yīng)。但是 ,高斯混合模型對(duì)于全局光照變化、陰影非常敏感,對(duì)

11、于緩慢的運(yùn)動(dòng)目標(biāo)檢測(cè)效果也不理想。(2) 幀間差分法幀間差分法的主要思想就是利用視頻圖像序列中連續(xù)兩幀或三頓的差異來(lái)檢測(cè)發(fā)生運(yùn)動(dòng)的區(qū)域。 Lipton等人提出的用于實(shí)時(shí)視頻流中運(yùn)動(dòng)冃標(biāo)檢測(cè)的算法就是頓間差分的方法Lipton98。頓間差分法的特點(diǎn)是動(dòng)態(tài)性強(qiáng),能夠適應(yīng)動(dòng)態(tài)背景下的運(yùn)動(dòng)目標(biāo)檢測(cè)。但是,這類(lèi)算法檢測(cè)出的目標(biāo)輪廓非常不理想,在目標(biāo)內(nèi)部會(huì)留有許多空洞,在目標(biāo)運(yùn)動(dòng)較快時(shí)目標(biāo)的輪廓會(huì)被擴(kuò)大 ,在目標(biāo)運(yùn)動(dòng)較慢時(shí)甚至有可能無(wú)法得到目標(biāo)的邊界。(3) 基于光流的運(yùn)動(dòng)目標(biāo)檢測(cè)算法基于光流的運(yùn)動(dòng)目標(biāo)檢測(cè)算法是利用光流方程計(jì)算出每個(gè)像素點(diǎn)的運(yùn)動(dòng)狀態(tài)矢量,從而發(fā)現(xiàn)運(yùn)動(dòng)的像素點(diǎn),并且能夠?qū)@些像素點(diǎn)進(jìn)行跟蹤

12、。在攝像機(jī)運(yùn)動(dòng)、背景變化時(shí),光流法也能檢測(cè)出運(yùn)動(dòng)目標(biāo),并且它能同時(shí)完成運(yùn)動(dòng)目標(biāo)檢測(cè)和跟蹤,但是該方法的計(jì)算復(fù)雜度高,在沒(méi)有專(zhuān)用硬件支持的情況下很難做到實(shí)時(shí)檢測(cè),同時(shí) ,光流場(chǎng)的計(jì)算非常容易受到噪聲、光照變化和背景擾動(dòng)的影響。采用光流場(chǎng)計(jì)算的方法也很難將運(yùn)動(dòng)目標(biāo)的輪廓完整地提取出來(lái)。3.2 運(yùn)動(dòng)目標(biāo)分類(lèi)目標(biāo)分類(lèi)是指從運(yùn)動(dòng)目標(biāo)檢測(cè)到的前景運(yùn)動(dòng)區(qū)域中提取感興趣目標(biāo)區(qū)域。復(fù)雜場(chǎng)景小檢測(cè)到的前景區(qū)域可能包含不同種類(lèi)的目標(biāo)，如行人、車(chē)輛、飛鳥(niǎo)、劉云、搖動(dòng)的樹(shù)枝等，在人體運(yùn)動(dòng)分析系統(tǒng)中，只對(duì)運(yùn)動(dòng)人體感興趣，因此需要對(duì)運(yùn)動(dòng)目標(biāo)的類(lèi)型進(jìn)行分析識(shí)別，提感謝下載載精品取人體目標(biāo)。目前常用的目標(biāo)分類(lèi)方法有如圖2：根據(jù)

13、運(yùn)動(dòng)區(qū)域的形狀使用簡(jiǎn)單的人體輪廓模式的特征進(jìn)行分類(lèi)形狀參數(shù)檢測(cè)運(yùn)動(dòng)人體這兩類(lèi)目標(biāo)分類(lèi)方法基于形狀信提取區(qū)域的分散度、面積、寬高比等特征，采用三層神經(jīng)網(wǎng)絡(luò)將前景目標(biāo)也可結(jié)合使用，以得息的分類(lèi)到更準(zhǔn)確的分類(lèi)結(jié)果分類(lèi)為人、人群、車(chē)輛和背景干擾分散度和面積信息區(qū)分人、車(chē)輛及混亂擾動(dòng)目標(biāo)分類(lèi)根據(jù)人體運(yùn)動(dòng)的周期性特性，采用時(shí)頻分析法判斷運(yùn)動(dòng)軌跡是否存在基于運(yùn)動(dòng)信周期性，從而識(shí)別出運(yùn)動(dòng)人體息的分類(lèi)通過(guò)計(jì)算運(yùn)動(dòng)區(qū)域的殘余光流來(lái)利用人體運(yùn)動(dòng)的周分析運(yùn)動(dòng)目標(biāo)的剛性和周期性期性進(jìn)行分類(lèi)與剛性車(chē)輛的運(yùn)動(dòng)相比，非剛性的人體運(yùn)動(dòng)具有較高的平均殘余光流并且人體運(yùn)動(dòng)呈現(xiàn)周期性，因此可將人體區(qū)分出來(lái)圖 23.3 運(yùn)動(dòng)目標(biāo)跟蹤依

14、據(jù)運(yùn)動(dòng)目標(biāo)的表達(dá)和相似性度量, 運(yùn)動(dòng)目標(biāo)跟蹤算法可以分為四類(lèi): 基于主動(dòng)輪廓的跟蹤、基于特征的跟蹤、基于區(qū)域的跟蹤和基于模型的跟蹤。跟蹤算法的精度和魯棒性很大程度上取決于對(duì)運(yùn)動(dòng)目標(biāo)的表達(dá)和相似性度量的定義, 跟蹤算法的實(shí)時(shí)性取決于匹配搜索策略和濾波預(yù)測(cè)算法。1) 基于主動(dòng)輪廓的跟蹤Kass 等人提出的主動(dòng)輪廓模型, 即 Snake 模型 , 是在圖像域內(nèi)定義的可變形曲線, 通過(guò)對(duì)其能量函數(shù)的最小化, 動(dòng)態(tài)輪廓逐步調(diào)整自身形狀與目標(biāo)輪廓相一致, 該可變形曲線又稱(chēng)為 Snake 曲線。 Snake 技術(shù)可以處理任意形狀物體的任意形變,首先將分割得到的物體邊界作為跟蹤的初始模板, 然后確定表征物體真

15、實(shí)邊界的目標(biāo)函數(shù), 并通過(guò)降低目標(biāo)函數(shù)值,使初始感謝下載載精品輪廓逐漸向物體的真實(shí)邊界移動(dòng)。基于主動(dòng)輪廓跟蹤的優(yōu)點(diǎn)是不但考慮來(lái)自圖像的灰度信息 , 而且考慮整體輪廓的幾何信息, 增強(qiáng)了跟蹤的可靠性。由于跟蹤過(guò)程實(shí)際上是解的尋優(yōu)過(guò)程, 帶來(lái)的計(jì)算量比較大,而且由于Snake 模型的盲目性 , 對(duì)于快速運(yùn)動(dòng)的物體或者形變較大的情況, 跟蹤效果不夠理想2) 基于特征的跟蹤基于特征匹配的跟蹤方法不考慮運(yùn)動(dòng)目標(biāo)的整體特征, 只通過(guò)目標(biāo)圖像的一些顯著特征來(lái)進(jìn)行跟蹤。假定運(yùn)動(dòng)目標(biāo)可以由惟一的特征集合表達(dá), 搜索到該相應(yīng)的特征集合就認(rèn)為跟蹤上了運(yùn)動(dòng)目標(biāo)。除了用單一的特征來(lái)實(shí)現(xiàn)跟蹤外, 還可以采用多個(gè)特征信息

16、融合在一起作為跟蹤特征。2 ）基于特征的跟蹤基于特征的跟蹤主要包括特征提取和特征匹配兩個(gè)方面。(1) 特征提取，特征提取是指從景物的原始圖像中提取圖像的描繪特征,理想的圖像特征應(yīng)具備的特點(diǎn)是a) 特征應(yīng)具有直觀意義 ,符合人們的視覺(jué)特性 ; b) 特征應(yīng)具備較好的分類(lèi)能力,能夠區(qū)分不同的圖像內(nèi)容 ; c)特征計(jì)算應(yīng)該相對(duì)簡(jiǎn)單,以便于快速識(shí)別 ; d) 特征應(yīng)具備圖像平移、旋轉(zhuǎn)、尺度變化等不變性。目標(biāo)跟蹤中常用的運(yùn)動(dòng)目標(biāo)的特征主要包括顏色、紋理、邊緣、塊特征、光流特征、周長(zhǎng)、面積、質(zhì)心、角點(diǎn)等。提取對(duì)尺度伸縮、形變和亮度變化不敏感的有效特征至今仍是圖像處理研究領(lǐng)域中一個(gè)比較活躍的方面

17、。(2) 特征匹配，特征提取的目的是進(jìn)行幀間目標(biāo)特征的匹配 , 并以最優(yōu)匹配來(lái)跟蹤目標(biāo)。常見(jiàn)的基于特征匹配的跟蹤算法有：基于二值化目標(biāo)圖像匹配的跟蹤、基于邊緣特征匹配或角點(diǎn)特征匹配的跟蹤、基于目標(biāo)灰度特征匹配的跟蹤、基于目標(biāo)顏色特征匹配的跟蹤等。基于特征的跟蹤算法的優(yōu)點(diǎn)在于對(duì)運(yùn)動(dòng)目標(biāo)的尺度、形變和亮度等變化不敏感 , 即使目標(biāo)的某一部分被遮擋,只要還有一部分特征可以被看到 , 就可以完成跟蹤任務(wù) ; 另外 , 這種方法與K al man濾波器聯(lián)合使用 , 也具有很好的跟蹤效果。但是其對(duì)于圖像模糊、噪聲等比較敏感 , 圖像特征的提取效果也依賴(lài)于各種感謝下載載精品提取算子及其參數(shù)的設(shè)置, 此外

18、 , 連續(xù)幀間的特征對(duì)應(yīng)關(guān)系也較難確定, 尤其是當(dāng)每一幀圖像的特征數(shù)目不一致、存在漏檢、特征增加或減少等情況。3) 基于區(qū)域的跟蹤基于區(qū)域的跟蹤算法基本思想是: a)得到包含目標(biāo)的模板, 該模板可通過(guò)圖像分割獲得或預(yù)先人為確定, 模板通常為略大于目標(biāo)的矩形, 也可為不規(guī)則形狀; b) 在序列圖像中 , 運(yùn)用相關(guān)算法跟蹤目標(biāo)。這種算法的優(yōu)點(diǎn)在于當(dāng)目標(biāo)未被遮擋時(shí), 跟蹤精度非常高、跟蹤非常穩(wěn)定。但其缺點(diǎn)首先是費(fèi)時(shí), 當(dāng)搜索區(qū)域較大時(shí)情況尤其嚴(yán)重; 其次 , 算法要求目標(biāo)變形不大 , 且不能有太大遮擋, 否則相關(guān)精度下降會(huì)造成目標(biāo)的丟失。近年來(lái), 對(duì)基于區(qū)域的跟蹤方法關(guān)注較多的是如何處理模板變化時(shí)的

19、情況, 這種變化是由運(yùn)動(dòng)目標(biāo)姿態(tài)變化引起的,如果能正確預(yù)測(cè)目標(biāo)的姿態(tài)變化, 則可實(shí)現(xiàn)穩(wěn)定跟蹤。4) 基于模型的跟蹤基于模型的跟蹤是通過(guò)一定的先驗(yàn)知識(shí)對(duì)所跟蹤目標(biāo)建立模型, 然后通過(guò)匹配跟蹤目標(biāo)進(jìn)行模型的實(shí)時(shí)更新。對(duì)于剛體目標(biāo)來(lái)說(shuō), 其運(yùn)動(dòng)狀態(tài)變換主要是平移、旋轉(zhuǎn)等 , 可以利用該方法實(shí)現(xiàn)目標(biāo)跟蹤。但是實(shí)際應(yīng)用中跟蹤的不僅僅是剛體, 還有一大部分是非剛體, 目標(biāo)確切的幾何模型不容易得到。這種方法不易受觀測(cè)視角的影響, 具有較強(qiáng)的魯棒性, 模型匹配跟蹤精度高, 適合于機(jī)動(dòng)目標(biāo)的各種運(yùn)動(dòng)變化, 抗干擾能力強(qiáng), 但由于計(jì)算分析復(fù)雜、運(yùn)算速度慢 , 模型的更新較為復(fù)雜, 實(shí)時(shí)性較差。準(zhǔn)確建立運(yùn)動(dòng)模型是模

20、型匹配能否成功的關(guān)鍵。3.4 運(yùn)動(dòng)目標(biāo)的特征運(yùn)動(dòng)目標(biāo)的特征，是判斷一個(gè)目標(biāo)區(qū)別于另外一個(gè)目標(biāo)的重要依據(jù)。有效的運(yùn)動(dòng)目標(biāo)特征集可以準(zhǔn)確地區(qū)分不同目標(biāo)。運(yùn)動(dòng)目標(biāo)特征的提取是實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)分類(lèi)的重要步驟。感謝下載載精品運(yùn)動(dòng)目標(biāo)分類(lèi)方法概述目前，基于視頻的運(yùn)動(dòng)目標(biāo)分類(lèi)方法已經(jīng)有很多，主要有 3 類(lèi)：基于靜態(tài)特征的分類(lèi)，基于動(dòng)態(tài)特征的分類(lèi)和基于靜態(tài)、動(dòng)態(tài)特征相結(jié)合的分類(lèi)。1）基于靜態(tài)特征的分類(lèi)基于靜態(tài)信息的分類(lèi)，即利用檢測(cè)出來(lái)的運(yùn)動(dòng)區(qū)域的形狀、顏色等物理特征進(jìn)行目標(biāo)分類(lèi)的方法。 Lipton等利用離散度和面積信息對(duì)運(yùn)動(dòng)區(qū)域進(jìn)行分類(lèi)，區(qū)分人、車(chē)、及混亂擾動(dòng)，并利用時(shí)間一致性約束使分類(lèi)更準(zhǔn)確，把除人、車(chē)外的目

21、標(biāo)當(dāng)成干擾物，實(shí)現(xiàn)簡(jiǎn)單。Zang等人利用長(zhǎng)寬比、角點(diǎn)特征對(duì)運(yùn)動(dòng)區(qū)域進(jìn)行分類(lèi)，區(qū)分人、汽車(chē)。 Rivlin 、Bogomolov等利用外接橢圓的長(zhǎng)寬比以及星形骨架等形狀特征，區(qū)分人、動(dòng)物、汽車(chē)。Hu等定義了目標(biāo)輪廓上的點(diǎn)與幾何中心的距離為“中距離”，利用中距離的離散度、最大中距離與最小中距離的比值作為分類(lèi)特征，區(qū)分人、自行車(chē)、汽車(chē)。方帥等利用最大互信息獲得一組可靠、獨(dú)立且具辨認(rèn)力的目標(biāo)特征集，并用有向無(wú)環(huán)圖的多類(lèi)支持向量機(jī)進(jìn)行分類(lèi)，區(qū)分人、汽車(chē)。Otoom等人以角點(diǎn)的個(gè)數(shù)、圓的個(gè)數(shù)、離散度為分類(lèi)特征，區(qū)分機(jī)場(chǎng)周?chē)娜恕⑷巳?、包裹、手推?chē)，該文分類(lèi)效果較差，主要是因?yàn)橥粋€(gè)目標(biāo)角點(diǎn)的個(gè)數(shù)與離攝

22、像頭遠(yuǎn)近差別很大，而且圓的個(gè)數(shù)判斷人、人群依賴(lài)目標(biāo)姿勢(shì)。2）基于動(dòng)態(tài)特征的分類(lèi)基于動(dòng)態(tài)特征的分類(lèi)，即利用人體運(yùn)動(dòng)的周期性或其他與運(yùn)動(dòng)相關(guān)的特征進(jìn)行目標(biāo)分類(lèi)的方法。采用靜態(tài)特征往往會(huì)造成在特征提取上對(duì)姿勢(shì)依賴(lài)的問(wèn)題，而有效的動(dòng)態(tài)特征可以減少對(duì)姿勢(shì)的依賴(lài)。Cutler與 Davis對(duì)目標(biāo)隨著時(shí)間變化的自相關(guān)特性進(jìn)行計(jì)算，再通過(guò)時(shí)頻化方法分析目標(biāo)是否存在周期性的運(yùn)動(dòng)特征而將人識(shí)別出來(lái)。Yang Ran與 TsaacWeiss ，基于周期性分類(lèi)人和車(chē)輛，對(duì)目標(biāo)較小、圖像分辨率低的航空和紅外圖片有比較好感謝下載載精品的分類(lèi)效果。 Javed 、Shah等利用是否有人體周期性運(yùn)動(dòng)特征、圓的個(gè)數(shù)等特征，分

23、類(lèi)人、人群和車(chē)輛。3）基于靜態(tài)與動(dòng)態(tài)特征相結(jié)合的分類(lèi)Bogomolov、 Dror等的系統(tǒng)是基于目標(biāo)靜態(tài)特征和動(dòng)態(tài)運(yùn)動(dòng)特性相結(jié)合進(jìn)行目標(biāo)分類(lèi)的，采用了屬于同類(lèi)目標(biāo)的靜態(tài)輪廓的相似性和身體的傾斜角、腳之間的距離等運(yùn)動(dòng)特征，用支持向量機(jī)分類(lèi)器進(jìn)行分類(lèi)，提高了精確度和魯棒性。Aggarwal等利用緊湊度值以及運(yùn)動(dòng)方向的變化量，區(qū)分人、人群、汽車(chē)、自行車(chē)，運(yùn)動(dòng)方向的變化量區(qū)分度不是很好。Li 等使用速度、長(zhǎng)寬比、離散度等特征，以BP 神經(jīng)網(wǎng)絡(luò)作為分類(lèi)器，區(qū)分交通場(chǎng)景中的人、自行車(chē)，較好地對(duì)復(fù)雜場(chǎng)景下人、自行車(chē)進(jìn)行分類(lèi)。常見(jiàn)的運(yùn)動(dòng)目標(biāo)特征分析一個(gè)運(yùn)動(dòng)目標(biāo)特征往往無(wú)法識(shí)別三個(gè)以上的目標(biāo)，或者識(shí)別的

24、準(zhǔn)確率不夠高，一般目標(biāo)分類(lèi)研究都是選擇至少兩個(gè)特征。通用特征指的是能反映所有目標(biāo)特性的特征；屬性特征，顧名思義，某個(gè)目標(biāo)的所固有的特征是特別能反映該目標(biāo)特性的特征。1）運(yùn)動(dòng)目標(biāo)的通用特征常見(jiàn)的通用特征主要有面積、長(zhǎng)寬比、離散度、空隙率(緊湊度 )等。目標(biāo)面積是在像素平面的投影面積，不是目標(biāo)的實(shí)際目標(biāo)，同一位置的不同目標(biāo)大小各異，但是攝像機(jī)拍攝的目標(biāo)近大遠(yuǎn)小，即使是同一目標(biāo)，攝像頭拍攝的距離不同，面積也是不一樣的，在固定單攝像機(jī)的情況下，面積對(duì)不同類(lèi)目標(biāo)之間的區(qū)分度不是很大；攝像機(jī)標(biāo)定后該特征有一定的應(yīng)用。長(zhǎng)寬比即目標(biāo)外接矩形的長(zhǎng)寬比例，與距離攝像頭遠(yuǎn)近無(wú)關(guān)，具有歸一化的特性，能真實(shí)反映目標(biāo)

25、的形狀比例，是最常用的一種目標(biāo)特征。離散度即運(yùn)動(dòng)目標(biāo)周長(zhǎng)的平方與面積的比值，外形越復(fù)雜的目標(biāo)，離散度越大；對(duì)于目標(biāo)碎片比較多的運(yùn)動(dòng)目標(biāo)，由于目標(biāo)的輪廓感謝下載載精品準(zhǔn)確獲取不易，離散度計(jì)算比較復(fù)雜并且計(jì)算的準(zhǔn)確性無(wú)法保證?？障堵始茨繕?biāo)外接矩形內(nèi)部非目標(biāo)像素點(diǎn)所占的比例，與其相反的特征就是緊湊度。2）運(yùn)動(dòng)目標(biāo)的屬性特征人的屬性特征主要有圓、人體運(yùn)動(dòng)周期性等。人頭近似圓，從人的頭頂往下的角度看，人頭所在位置可以檢測(cè)到圓；研究中發(fā)現(xiàn)圓特征嚴(yán)重依賴(lài)目標(biāo)角度、姿勢(shì)，正面、側(cè)面的角度下，圓特征不明顯、人頭所在位置常常無(wú)法檢測(cè)到圓。人體運(yùn)動(dòng)周期性特征反映的是人體步態(tài)的規(guī)律性變化，周期性特征的提取對(duì)

26、目標(biāo)的觀察角度有很高的要求，只有人體目標(biāo)偏側(cè)面才能準(zhǔn)確提取到該特征。汽車(chē)的屬性特征主要有運(yùn)動(dòng)速度、離散度變化量等。運(yùn)動(dòng)速度即相鄰兩幀的目標(biāo)像素距離與時(shí)間間隔的比值，該特征在一定程度上反應(yīng)了目標(biāo)在視頻圖像中的運(yùn)動(dòng)快慢，汽車(chē)的運(yùn)動(dòng)速度比較快；但是由于目標(biāo)在不同的視頻中所處的環(huán)境和位置不同，攝像頭拍攝的角度和距離也不同，該特征與面積特征一樣，只有進(jìn)行攝像機(jī)標(biāo)定后，才有實(shí)際應(yīng)用意義。離散度變化量反映了各個(gè)目標(biāo)的變化幅度。離散度變化量特征與離散度一樣，計(jì)算比較復(fù)雜并且計(jì)算的準(zhǔn)確性無(wú)法保證?？障堵首兓坑?jì)算簡(jiǎn)單，也能反映各個(gè)目標(biāo)的變化幅度，并且在目標(biāo)碎片比較多的情況下也能很好的提取，可以較好地替代離散度變化量特征。自行車(chē)既不是剛體，也不是非剛體，是一種介于剛體（汽車(chē)）與非剛體（人）的目標(biāo)。目前很少有文獻(xiàn)提起自行車(chē)行之有效的屬性特征，其特征一般都是介于人、汽車(chē)之間。運(yùn)動(dòng)目標(biāo)特征的選取由于實(shí)驗(yàn)中提取到的前景目標(biāo)存在多角度、目標(biāo)含有少量影子、目標(biāo)區(qū)域提取不完整和目標(biāo)較小等情況，采用基于形狀的特征分類(lèi)目標(biāo)，可較好地適應(yīng)這些情況。因此，我們參賽的特征主要是基于形狀的特征。感謝下載載精品目標(biāo)基于形狀的特征主要有目標(biāo)輪廓、面積、長(zhǎng)寬比、離散度、質(zhì)心、外接矩形等。目前研究中廣泛使用的目標(biāo)特征主要有長(zhǎng)寬比P、面積信息S、離散

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

人體行為識(shí)別技術(shù)_1605

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

人體行為識(shí)別技術(shù)_1605

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔