




已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀
(生物醫(yī)學(xué)工程專業(yè)論文)運動人體檢測及遮擋處理.pdf.pdf 免費下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
哈爾濱 i j 程人學(xué)碩十學(xué)位論文 n ii i i i l l i l i i l i a bs t r a c t d y n a m i co b j e c tt r a c k i n g h a sr e c e i v e dc o n s i d e r a b l ea t t e n t i o ni ni m a g e p r o c e s s i n ga r e ad u et oi t sw i d ea p p l i c a t i o np r o s p e c t si nc o m p u t ev i s i o n s p o r t s a t h l e t et r a c k i n ga n da n a l y s i si sa l li m p o r t a n te m b r a n c h r n e n t w ec a l lg e tt h e p a r a m e t e r so f t h ea t h l e t es u c ha st h ea c c e l e r a t i o n t h ea n g l eo ft h eb o d ya n ds oo n t h e s ep a r a m e t e r sc a nb ep r o v i d e dt ot h ec o a c ht oi m p r o v et h ee f f e c to ft h es p o r t s t r a i n i n g b u tt h ed i v e r s i t ya n dc o m p l e x i t yo fv i s u a le n v i r o n m e n tm a k ei t d i f f i c u l t t oe f f e c t i v e l ya n ds t a b l yc o m p l e t et h et r a c k i n gt a s k an e wi n t e g r a t e da l g o r i t h mb a s e do nm e a ns h i f tw a sp r o p o s e dt os o l v et h e f a s tm o v e m e n tt r a c k i n go fs p o r t sv i d e o t h eb a c k g r o u n dw e i g h t e dh i s t o g r a m t h e f o r e c a s to ft a r g e tp o s i t i o nb yk a l m a nf i l t e ra n dt h et i m e l yu p d a t e dt e m p l a t eo f t a r g e tb yk a l m a nf i l t e r i si n t e g r a t e d i ts u c c e s s f u l l ys o l v et h ed i s a d v a n t a g eo f m e a ns h i f ta l g o r i t h m f i r s t l y i no r d e rt oa v o i dt h ei n f e c t i o no ft h ec l u t t e rb a c k g r o u n di n f o r m a t i o n b a c k g r o u n dw e i g h t e dh i s t o g r a m i sb u i l ti nh s vc o l o rs p a c ef o rs e l e c t i n go n l yt h e s a l i e n tp a r t sf r o mt h er e p r e s e n t a t i o n so ft h et a r g e tm o d e la n dt a r g e tc a n d i d a t e s e c o n d l y t h ef o r e c a s to ft a r g e tp o s i t i o ni sm a d eb yk a l m a nf i l t e rt oi m p r o v e t h e r o b u s t n e s so ft r a c k i n ga l g o r i t h m t h i r d l y t h ek e r n e l b a s e dm e a ns h i f ta l g o r i t h m i se m p l o y e dt op e r f o r mt h eo p t i m i z a t i o nf o rt a r g e tl o c a l i z a t i o n a tl a s t t h e t e m p l a t eo ft a r g e ti su p d a t e dt i m e l y i nt h ep r e s e n t e dt r a c k i n ge x a m p l e s t h e p r o b l e m so fp a r t i a lo c c l u s i o n s c l u t t e ra n dt a r g e ts c a l ev a r i a t i o n sa r ed e a l tw i t ht h e p r o p o s e da l g o r i t h ms u c c e s s f u l t y k e yw o r d s o b j e c tt r a c k i n g o c c l u s i o np r o c e s s i n g b a c k g r o u n dw e i g h t e d k a l m a n p r e d i c t i o n t e m p l a t eu p d a t e d 哈爾濱工程大學(xué) 學(xué)位論文原創(chuàng)性聲明 本人鄭重聲明 本論文的所有工作 是在導(dǎo)師的指導(dǎo)卜 作者本人獨立完成的 有關(guān)觀點 方法 數(shù)據(jù)和文獻(xiàn)的引剛已稚j 文中指出 并與參考文獻(xiàn)相對應(yīng) 除文中己注明引用的內(nèi)容外 本論文不包含任何其他個人或集體已經(jīng)公開發(fā)表的作品成果 刈 本文的研究做出重要貢獻(xiàn)的個人和集體 均已在文中以明確辦式 標(biāo)明 本人完全意識到本聲明的法律結(jié)果由本人承擔(dān) 作者 簽字 6 叉廠 日期 叫年 月i 日 哈爾濱工程大學(xué) 學(xué)位論文授權(quán)使用聲明 本人完全了解學(xué)校保護(hù)知識產(chǎn)權(quán)的有關(guān)規(guī)定 即研究生詛 校 攻讀學(xué)位期間論文工作的知識產(chǎn)權(quán)屬于哈爾濱工程火學(xué) 哈爾濱 工程大學(xué)有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)i f j 件 本人允許哈爾濱工程大學(xué)將論文的部分或全部內(nèi)容編入有關(guān)數(shù)據(jù) 庫進(jìn)行檢索 可采用影印 縮印或掃描等復(fù)制手段保存和7 f 編本 學(xué)位論文 可以公布論文的全部內(nèi)容 尉時本人保證畢 i k 后結(jié)合 學(xué)位論文研究課題再撰寫的論文一律注明作者第一署名甲 位為l i 合 爾濱工程大學(xué) 涉密學(xué)位論文待解密后適用本聲明 本論文 囤在授予學(xué)位后即可口在授予學(xué)位12 個月后 口 解密后 由哈爾濱工程大學(xué)送交有關(guān)部門進(jìn)行保存 汀 編等 作者 簽字 捌支 二導(dǎo)師 簽字 籀 日期 為一年 月j 日 1 年j 月曠日 f 1 哈爾濱 l 程火學(xué)碩十學(xué)何論文 第1 章緒論 1 1 課題研究的背景和意義 對視頻中的人的運動進(jìn)行跟蹤 自動識別并解釋人的行為一直以來都有 著許多重要的應(yīng)用 其中對人體及其組成部分的檢測與跟蹤是整個系統(tǒng)中的 最重要的部分 運動的識別和分析均須在其基礎(chǔ)上進(jìn)行 經(jīng)過二十余年的發(fā) 展 當(dāng)前基于視頻的檢測與跟蹤技術(shù)融合了圖像處理 計算機(jī)視覺 計算機(jī) 圖形學(xué) 人工智能以及人體運動學(xué)等多學(xué)科的理論 成為多學(xué)科交叉的一個 熱門領(lǐng)域 人體運動檢測與跟蹤是指 在某種分辨率下 捕捉人體運動的過程 是 人體運動分析的一個分支川 其核心思想是綜合利用圖像處理 視頻分析等 技術(shù)手段 快速 準(zhǔn)確地捕捉運動目標(biāo) 市場上比較成熟的人體運動捕捉系 統(tǒng)有基于電動機(jī)械的 e l e c t r o m e c h a n i c a l 電磁的 e l e c t r o m a g n e t i c 和特殊 光學(xué)標(biāo)志 r e t r o r e f l e c t i v em a r k e r 等類型 磁性或者光學(xué)的標(biāo)記被附在人 的肢體上 它們的三維軌跡被用來描述目標(biāo)運動 這些系統(tǒng)是自動的 但是 其設(shè)備非常笨重 且價格昂貴 隨著廉價數(shù)字?jǐn)z像機(jī)和高性能家用p c 機(jī)的 普及 基于視頻的人體運動捕捉越來越成為研究的熱點 基于視頻的人體運動捕捉有很多潛在的應(yīng)用領(lǐng)域 主要有 體育與醫(yī)學(xué)領(lǐng)域 人體運動分析主要應(yīng)用于醫(yī)學(xué)和體育領(lǐng)域 在醫(yī)學(xué)方 面 可以利用運動分析對病人進(jìn)行步態(tài)分析 2 3 在體育方面 可以通過對運 動員的運動分析幫助他們提高運動技能1 4 卅 智能視頻監(jiān)控 智能視頻監(jiān)控在商業(yè) 軍事上有廣泛的應(yīng)用 7 9 1 智能視 頻監(jiān)控也可用于銀行 機(jī)場 政府重要機(jī)構(gòu)等公共場所的無人值制1 0 1 1 這 些系統(tǒng)的一個特點是減少對人工的依賴 系統(tǒng)自動完成對感興趣目標(biāo)的分析 與表述 而對目標(biāo)的實時檢測與跟蹤是其中的主要環(huán)節(jié) 是基于視頻的運動 分析 行為理解等后續(xù)工作的基礎(chǔ) 基于視頻的人機(jī)交互 目前鍵盤和鼠標(biāo)是我們和計算機(jī)交互的接口方式 我們希望有更簡潔的 智能化和人性化的人機(jī)交互方式 計算機(jī)無接觸式地 哈爾濱y n 大學(xué)碩 學(xué)傳論文 收集人類在計算機(jī)前的視頻信號 利用計算機(jī)視覺的相關(guān)理論分析視頻信號 做到分辨人類的動作 明白人類的意圖 即 我們希望計算機(jī)能盡可能地 理 解 我們 近些年的工作 1 2 4 主要集中在姿態(tài)分析 面部表情及其它的運動 等 以便計算機(jī)能夠識別和理解這些動作 此外 目標(biāo)檢測與跟蹤還包括基于視覺的控制 動畫 影視中特技制作 基于內(nèi)容的視頻編碼等等 由于應(yīng)用的不同 應(yīng)用對檢測與跟蹤系統(tǒng)的性能要求也有所不同 主要 的性能要求體現(xiàn)在對健壯性 準(zhǔn)確性和速度三個方面的要求 般來說系統(tǒng)對環(huán)境假設(shè)越少時對系統(tǒng)健壯性要求越高 監(jiān)視一般在不 可控制的條件下進(jìn)行 所以前景背景分離應(yīng)基于運動 而且一般不使用人體 模型 運動分析則是在受控的條件下實現(xiàn) 要求準(zhǔn)確地跟蹤各個關(guān)節(jié)點 系 統(tǒng)往往使用大量假設(shè) 商業(yè)系統(tǒng)則一般是通過給身體做記號的方法 再利用 偏移量獲得骨骼位置 表1 1 不同應(yīng)用的性能要求 監(jiān)視控制 分析 健壯性 七 一 準(zhǔn)確性 速度 1 2 國內(nèi)外研究現(xiàn)狀 目標(biāo)檢測與跟蹤就是通過對攝像機(jī)獲得的圖像序列進(jìn)行分析 計算出目 標(biāo)在每幀圖像上的二維位置坐標(biāo) 并根據(jù)不同的特征值 將圖像序列中不同 幀之間同一運動目標(biāo)關(guān)聯(lián)起來 得到各個運動目標(biāo)完整的運動軌跡 即在連 續(xù)的圖像序列中建立運動目標(biāo)的對應(yīng)關(guān)系 目前 國內(nèi)外學(xué)者提出了許多不同的跟蹤算法和跟蹤系統(tǒng) 可以按照不 同的劃分依據(jù)對跟蹤算法進(jìn)行不同的分類 就跟蹤對象而言 可以分為車輛 跟蹤 人體跟蹤或人體部位跟蹤 如跟蹤手 臉 頭和腳等身體部分 等 就跟蹤目標(biāo)個數(shù)而言 可以分為單目標(biāo)跟蹤和多目標(biāo)跟蹤 就跟蹤視角而言 可以分為單攝像機(jī)的單一視角 多攝像機(jī)的多視角和全方位視角 還可以通 過攝像機(jī)類型 紅外攝像機(jī) 可見光攝像機(jī) 攝像機(jī)狀態(tài) 運動 固定 哈爾濱下科人學(xué)碩十學(xué)位論文 跟蹤空間 二維 三維 和跟蹤環(huán)境 室內(nèi) 室外 等方面來進(jìn)行分類 針對不同的研究對象有不同的跟蹤算法 本文對固定攝像機(jī)的人體跟蹤 進(jìn)行了重點研究 下面按照對圖像所含信息的利用程度對跟蹤算法進(jìn)行總結(jié) 根據(jù)這個分類標(biāo)準(zhǔn) 主要有以下幾種跟蹤算法 1 基于模型的檢測與跟蹤 用點 線 區(qū)域來對跟蹤目標(biāo)建立幾何模型 然后在圖像序列中將運動 目標(biāo)與模型進(jìn)行比較 從而實現(xiàn)目標(biāo)跟蹤 常用的人體表示方法有以下三種 a 棍狀圖 s t i c k f i g u r e b 二維輪廓 區(qū)域模型 2 dc o n t o u r r e g i o n c 三維模型 3 d 基于模型的跟蹤方法其優(yōu)點是即使在復(fù)雜環(huán)境下 利用目標(biāo)的模型知識 也能得到滿意的跟蹤結(jié)果 可以處理目標(biāo)平移 旋轉(zhuǎn)和變形的情況 可靠性 強(qiáng) 它的缺點是要耗費大量的時間來計算復(fù)雜的目標(biāo)模型 實時性差 而且 需要目標(biāo)的先驗知識 2 基于特征的檢測與跟蹤 為了實現(xiàn)目標(biāo)跟蹤 沒有必要跟蹤整個目標(biāo)區(qū)域 只要跟蹤目標(biāo)的某些 顯著特征 就可以實現(xiàn)對整個運動目標(biāo)的跟蹤 這些顯著特征可以是目標(biāo)的 質(zhì)心 也可以是目標(biāo)上的任意一點 只要這些特征具有高度的穩(wěn)定性 不易 受外界因素如光照強(qiáng)度變化 噪聲等因素的干擾 對目標(biāo)大小 位置 方位 不敏感即可 為了提高跟蹤的魯棒性 往往不只選一個特征 而是選一組特 征 在一般情況下 可利用的特征有 角點 直邊緣等局部特征和質(zhì)心 表 面積和慣量矩等全局特征 在實際應(yīng)用中 采用什么特征主要取決于目標(biāo)具 有哪些特征以及算法實現(xiàn)的具體要求 基于特征的目標(biāo)跟蹤方法利用跟蹤特征點位置的變化來跟蹤目標(biāo) 首先 從圖像序列中提取目標(biāo)的顯著特征 如拐點 質(zhì)心或有明顯標(biāo)記區(qū)域?qū)?yīng)的 點 線 曲線等 然后在連續(xù)圖像幀之間尋找特征的對應(yīng)關(guān)系 即進(jìn)行特征 匹配 最后計算運動信息 從而通過對特征的跟蹤來完成對整個目標(biāo)的跟蹤 p o l a n a i s 將每個行人用一個矩形框封閉起來 封閉框的質(zhì)心被選作跟蹤的特 征 在跟蹤過程中 如果兩人出現(xiàn)相互遮擋的情況 只要能區(qū)分質(zhì)心的速度 就能成功地完成人體跟蹤 哈爾濱r j 竄火學(xué)碩十學(xué)位論文 這種方法的優(yōu)點是 即使場景中出現(xiàn)部分遮擋情況 只要目標(biāo)的一些特 征可見 仍可以保持對運動目標(biāo)的跟蹤 由于只跟蹤已選擇的顯著特征 上 一幀目標(biāo)的特征在下一幀圖像中的可能匹配數(shù)目大大小于相關(guān)跟蹤算法 處 理的數(shù)據(jù)量小 并且由于特征的精心選取 使得在光照和目標(biāo)幾何形狀發(fā)生 變化時 也能進(jìn)行目標(biāo)跟蹤 具有一定的魯棒性 特征的選取對整個跟蹤算 法十分重要 關(guān)系到整個跟蹤系統(tǒng)的可靠性和跟蹤精度 它應(yīng)具有對目標(biāo)大 小 位置 方向和照度變化不敏感的特點 如狄度局部極大值點 局部邊緣 點 角點 孤立點等 因此必須要選擇十分有效的特征提取算法 3 基于動態(tài)輪廓的檢測與跟蹤 主動輪廓線模型 是由k a s s 在進(jìn)行人的唇動跟蹤的研究中創(chuàng)立的 由 于它的動態(tài)行為非常像 蛇 故又稱為s n a k e 模型 直觀地說 s n a k e 模型 就是一種二維的變形曲線 在圖像作用力的影響下產(chǎn)生運動 根據(jù)圖像信息 來改變曲線的位置和形狀 它的行為由內(nèi)力和外力來控制 內(nèi)力約束它的形 狀 起到平滑限制的作用 而外力引導(dǎo)輪廓線的行為 將其拖向顯著的圖像 特征 主動輪廓線在內(nèi) 外力作用下尋找其能量函數(shù)的極小值 s n a k e 利用 對光照變化相對不敏感的輪廓信息來對目標(biāo)物體進(jìn)行建模 并對輪廓的曲率 和物體的運動加入平滑約束 這比直接對整個物體建模更具有普適性 比利 用角點等圖像底層信息來進(jìn)行信號分析更能夠抑制干擾 通過動態(tài)輪廓邊界進(jìn)行跟蹤近幾年來得到了廣泛地研究 利用封閉的曲 線輪廓來表達(dá)運動目標(biāo) 并且該輪廓能夠自動連續(xù)更新 計算量小 如果丌 始能夠合理地分開每個運動目標(biāo)并實現(xiàn)輪廓的初始化 那么即使有部分遮擋 也能連續(xù)地進(jìn)行跟蹤 其不足是要求獨立而準(zhǔn)確地初始化邊界 而這在實際 應(yīng)用中往往很難實現(xiàn) 4 1 基于區(qū)域的檢測與跟蹤 基于區(qū)域的跟蹤方法包含跟蹤整個人體和部分人體的方法 跟蹤整個人 體的方法不需要考慮精確的人體模型和人體部分的細(xì)節(jié) 所以不需要對模型 進(jìn)行初始化 它通過對檢測到的前景區(qū)域進(jìn)行面積 幾何結(jié)構(gòu)的約束 對跟 蹤區(qū)域加框線來進(jìn)行跟蹤 對人體的部分進(jìn)行跟蹤需要比跟蹤整體更精確的 運動前景 假設(shè)像素服從高斯分御 通過對人體的輪廓與顏色的分析 對人 的不同部分 如頭 手 身體等 進(jìn)行分類統(tǒng)計 構(gòu)造不同部分的代表物 4 哈爾濱 1 程火學(xué)碩十學(xué)位論文 有新區(qū)域出現(xiàn)則產(chǎn)生新的代表物 對應(yīng)區(qū)域消失則刪除該區(qū)域的代表物 通 過卡爾曼濾波對運動進(jìn)行預(yù)測 可以在有遮擋的情況下完成對人體部分的跟 蹤 基于區(qū)域的跟蹤方法目前已有較多的應(yīng)用 如w r e n 1 7 等利用小區(qū)域進(jìn) 行室內(nèi)單人體的跟蹤 文中將人體看作由頭 軀干 四肢等身體部分所對應(yīng) 的小區(qū)域塊組成 利用高斯分布建立人體和場景的模型 屬于人體的像素被 劃為不同的身體部分 通過跟蹤各個小區(qū)域來完成整個人體的跟蹤 基于區(qū) 域跟蹤的難點是處理運動的影子和遮擋 這可以利用彩色信息以及陰影區(qū)域 缺乏紋理的性質(zhì)來解決 如m c k e n n a l l 8 等首先利用色彩和梯度信息建立自適 應(yīng)的背景模型 并且利用背景減除方法提取運動區(qū)域 有效地消除了陰影的 影響 然后 跟蹤過程在區(qū)域 人和人群三個抽象級別上進(jìn)行 區(qū)域可以合 并和分裂 由于入是由許多身體部分區(qū)域在滿足幾何約束的條件下組成的 同時人群又是由單個的人組成 因此利用區(qū)域跟蹤并結(jié)合人的表面顏色模型 可以處理遮擋的情況 5 基于相關(guān)的檢測與跟蹤 相關(guān)跟蹤法 又叫模板匹配法 其主要思想是 將目標(biāo)的基準(zhǔn)圖像 模 板 在實時圖像中以不同的偏移值進(jìn)行位移 然后根據(jù)一定的相似性度量準(zhǔn) 則對每一個偏移值下重疊的兩個圖像進(jìn)行處理 計算兩者的相關(guān)值 根掘最 大相關(guān)值確定實時圖像中目標(biāo)的位置 簡單地說 就是在當(dāng)前幀中尋找與上 一幀目標(biāo)相關(guān)性最大的區(qū)域 相關(guān)跟蹤法具有很強(qiáng)的躁聲抑制能力 可以在很小的信嗓比條件下工作 它具有對有關(guān)目標(biāo)的知識要求甚少 定位精度高 跟蹤距離遠(yuǎn) 可靠性高和 較強(qiáng)的局部抗干擾能力等優(yōu)點 而且計算簡單 易于編程和硬化 由于它只 利用圖像間的灰度相關(guān)性作為區(qū)域相似性的判斷依據(jù) 對幾何和灰度畸變十 分敏感 光照強(qiáng)度變化或目標(biāo)運動姿態(tài)發(fā)生變化等都將對算法產(chǎn)生較大的影 響 計算量偏大 而且往往不能充分利用目標(biāo)的幾何特性 易產(chǎn)生積累誤差 它適用于實時圖像與參考圖像的產(chǎn)生條件較為一致 目標(biāo)尺寸變化很小 景 物與目標(biāo)的相關(guān)性不強(qiáng)的場合 6 基于運動估計的檢測與跟蹤 基于運動估計的跟蹤方法是利用圖像序列中目標(biāo)的運動信息來對目標(biāo)進(jìn) 哈爾濱一r 程人學(xué)碩十學(xué)位論文 行跟蹤的一種方法 運動信息又稱為光流 基于光流估計的方法 利用了狄 度的變化信息 首先 從圖像序列的灰度變化中計算速度場 般需要計算 灰度的一階導(dǎo)數(shù)和二階導(dǎo)數(shù) 然后利用一些約束條件從速度場中估計運動參 數(shù)和物體結(jié)構(gòu) 光流方法又分局部光流法和全局光流法 局部光流法能夠準(zhǔn)確的反映出 運動邊緣處的運動信息 但是對于圖像中的弱紋理區(qū)域不敏感 全局光流法 能夠得到每個像素處的光流 但是對于運動邊界處的光流變化不敏感 由于 噪聲 多光源 陰影和遮擋等原因 使得計算出的光流分布不是十分可靠和 準(zhǔn)確 實際景物中的速度場不一定總是與圖像中的直觀速度場有唯一對應(yīng)關(guān) 系 且偏導(dǎo)數(shù)計算會加重噪聲水平 計算復(fù)雜 使得基于光流的方法在實際 應(yīng)用中常常不穩(wěn)定 除了光流估計法以外 對目標(biāo)狀態(tài)進(jìn)行估計的最常用方法是卡爾曼濾波 算法 常規(guī)的卡爾曼濾波算法適合于線性運動 且運動參數(shù)服從單一高斯分 布 不能處理非線性 多模分布的情況 為此 人們開發(fā)出了各種非線性濾 波算法 一種是擴(kuò)展卡爾曼濾波 e l 汀 它對非線性系統(tǒng)進(jìn)行局部線性化 從而間接利用卡爾曼濾波算法進(jìn)行濾波和估算 但是它只適用于濾波誤差和 預(yù)測誤差很小的情況 否則 濾波初期估計協(xié)方差下降太快導(dǎo)致濾波不穩(wěn)定 甚至發(fā)散 修正增益的推廣卡爾曼濾波算法雖然通過改善增益矩陣 相應(yīng)改 善了狀態(tài)協(xié)方差的估計性能 但該方法對測量誤差有一定限制 若測量誤差 較大 則算法在收斂精度 時間及穩(wěn)定性等方面表現(xiàn)很不理想 另一種是蒙 特卡羅算法 1 9 2 1 1 亦即p a r t i c l e 濾波器 是解決非線性問題的有效算法 粒 子濾波是 種從非高斯 非線性 高維的觀測數(shù)據(jù)中計算后驗概率的方法 它是基于對前一幀的后驗概率分布估計值進(jìn)行采樣 然后傳播這些采樣值形 成當(dāng)前幀的后驗概率估計值 適用于任何用狀態(tài)空間模型以及傳統(tǒng)的卡爾曼 濾波表示的非線性系統(tǒng) 粒子濾波有很多變種 如c o n d e n s a t i o n l 2 2 1 u n s c e n t e d p a r t i c l ef i l t e r i n g l 2 3 1 它的缺點是為保證當(dāng)前狀態(tài)進(jìn)行最大似然估計的 f 確性 所需的采樣點太多導(dǎo)致計算量過大 很難適應(yīng)實時多目標(biāo)跟蹤的要求 盡管目標(biāo)跟蹤算法可以大致分為上述幾類 但是這些方法并不是孤立的 在進(jìn)行目標(biāo)跟蹤時 為了保證跟蹤的可靠性和準(zhǔn)確性 常?;旌鲜褂脦追N算 法以得到更好的跟蹤效果 6 哈爾濱j i j 程人學(xué)碩 學(xué)位論文 其中當(dāng)被跟蹤目標(biāo)發(fā)生遮擋時 為解決目標(biāo)遮擋問題 人們提出了很多 算法 大致可分為如下四類 1 基于目標(biāo)特征匹配的算法1 2 4 j 其中特征可以是目標(biāo)灰度圖像 二值 分割圖像 邊緣點 角點 顏色直方圖等等 文獻(xiàn) 2 5 用廣義的h o u 曲變換解 決遮擋問題 以目標(biāo)的角點作為特征點 發(fā)生遮擋時用剩余的特征點來表決 目標(biāo)可能的位置 2 多子范本匹配的方法 文獻(xiàn) 2 6 以匹配誤差判定子模板是否被遮擋 然后用狄度相關(guān)匹配繼續(xù)跟蹤目標(biāo) 文獻(xiàn)1 27 基于最大后驗概率原則以子模板 的相關(guān)匹配來度量該模板屬于哪個目標(biāo) 解決多目標(biāo)相互遮擋的問題 3 基于動態(tài)貝葉斯網(wǎng)絡(luò)模型來精確地對遮擋過程建模 2 8 2 9 4 基于顏色分布的粒子濾波器可以解決部分遮擋問題 3 們 1 3 存在的問題及困擾 根據(jù)m a r r 的理論 可以將基于視頻的人體檢測與跟蹤系統(tǒng)看作為一個尋 找視頻與人體運動的對應(yīng)關(guān)系的過程 3 1 1 輸入是一個或多個視角的的圖像序 列 輸出是有關(guān)人體運動的運動參數(shù) 由于不同跟蹤系統(tǒng)的輸入 輸出內(nèi)容 各不相同 所以他們的表示和實現(xiàn)也有所不同 在視頻輸入中 由于視頻容易受到現(xiàn)實場景中諸多因素的影響 如光照 變化 景物變化 樹枝 旗幟搖動 物體之間的遮擋 運動目標(biāo)形狀和速度 的變化等因素 這些都給準(zhǔn)確有效地跟蹤運動目標(biāo)帶來了相當(dāng)大的困難 如 何處理這些問題 一直是目標(biāo)跟蹤研究的對象 目標(biāo)跟蹤難點主要在于以下 幾個方面 1 復(fù)雜多變的運動目標(biāo) 在實際應(yīng)用場景中 有著不同類型的運動目標(biāo) 如車輛 行人等 有剛體性物體 有非剛體性物體 目標(biāo)的運動速度也是多 變的 在復(fù)雜場景中 有高速運動的物體 也有低速運動或靜止的物體 不 同時刻 物體的速度也在不斷地改變 2 復(fù)雜背景 復(fù)雜背景給運動目標(biāo)的準(zhǔn)確提取增加了難度 如飄動的旗 幟 搖動的樹枝 場景中光照變化等都會產(chǎn)生錯誤的檢測 建立一個能適應(yīng) 于復(fù)雜環(huán)境動態(tài)變化的背景模型對目標(biāo)檢測來說是至關(guān)重要的 它的結(jié)果直 接影n i n o n 后續(xù)目標(biāo)跟蹤的準(zhǔn)確性 7 哈爾濱i 程人學(xué)碩十學(xué)位論文 3 遮擋問題 運動目標(biāo)之i 日j 的相互遮擋是在捌擠條件下產(chǎn)生的 是目標(biāo) 跟蹤中的一大難題 大多數(shù)的跟蹤系統(tǒng)都不能很好地處理目標(biāo)之間相互遮擋 的情況 尤其在擁擠狀態(tài)下 多目標(biāo)檢測和跟蹤問題更是難于處理 對目標(biāo)跟蹤系統(tǒng)而言 魯棒性 準(zhǔn)確性和處理速度是三個基本性能指標(biāo) 對于不同的應(yīng)用場景 有不同的要求 如對于監(jiān)控系統(tǒng)中 系統(tǒng)的魯棒性特 別重要 它通常要求能自動 連續(xù)的工作 對噪聲 光照 天氣等因素的影 響不能太敏感 在控制應(yīng)用中 系統(tǒng)的準(zhǔn)確性特別重要 如基于行為或姿勢 識別的接口控制場合中 而系統(tǒng)的處理速度對于那些需要實時高速的監(jiān)控系 統(tǒng)來說更是非常關(guān)鍵的 因此 如何選擇有效的工作方案來提高系統(tǒng)性能是 特別值得考慮的問題 1 4 論文的主要研究內(nèi)容和組織結(jié)構(gòu) 本文以冰上運動的運動人體為研究對象 重點研究了和解決了快速運動 目標(biāo)的跟蹤以及跟蹤過程中產(chǎn)生的遮擋問題 在本文中 我們介紹了m e a n s h i f t 算法及相關(guān)的改進(jìn)算法 第一章緒論 詳細(xì)闡述了人體運動跟蹤的研究背景 目的和意義 總結(jié) 了國內(nèi)外研究的發(fā)展現(xiàn)狀 討論了目前人體運動跟蹤中存在的困難和不足 指出了本文重點解決的問題 第二章主要研究了m e a ns h i f t 算法作為一種特殊的無參數(shù)密度估計算法 的基本理論 說明了該算法的特點 探討了該算法的物理含義 證明了m e a n s h i f t 算法是收斂的 第三章介紹了基于背景加權(quán)的m e a ns h i f t 算法在運動人體跟蹤中的應(yīng) 用 m e a ns h i f t 算法的目標(biāo)模型表示方法在背景較為復(fù)雜時跟蹤的效果不好 而背景加權(quán)算法利用選擇目標(biāo)模型和候選模型的顯著不同部分作為特征 可 以很好地解決以上問題 第四章介紹了基于k a l m a n 濾波器的起始點預(yù)測 利用k a l m a n 的預(yù)測性 估計目標(biāo)的位置 匹配算法以該估計為起點從而減少匹配的次數(shù) 提高m e a n s h i f t 算法的實時性 當(dāng)發(fā)生遮擋時 k a l m a n 的預(yù)測位置直接作為算法的跟 蹤結(jié)果 第五章介紹了基于k a l m a n 濾波器的模板更新機(jī)制 在目標(biāo)的運動中 哈爾濱t 程人學(xué)碩 學(xué)位論文 目標(biāo)的姿態(tài) 環(huán)境的照度等會發(fā)生變化 用場景圖像中已經(jīng)變化了的目標(biāo)的 候選模板去匹配早先定義的初始模板 顯然匹配度不高 這時場景中某些物 體可能和目標(biāo)初始狀態(tài)比如顏色狀態(tài)比較相似 跟蹤就會收斂到這些物體而 不是目標(biāo) 利用k a l m a n 濾波器模板更新機(jī)制很好的解決的模板更新的問題 提高了m e a ns h i f t 算法的魯棒性 最后對本文的綜合算法進(jìn)行了總結(jié)和展望 9 哈爾濱 r 程大學(xué)碩 學(xué)位論文 第2 章基于無參數(shù)密度估計的m e a ns h i f t 算法 m e a ns h i f t 這個概念最早是由f u k u n a g a 等人 3 2 于1 9 7 5 年在一篇關(guān)于概 率密度梯度函數(shù)的估計中提出來的 其最初含義j 下如其名 就是偏移的均值 向量 在這里m e a ns h i f t 是一個名詞 它指代的是一個向量 但隨著m e a ns h i f t 理論的發(fā)展 m e a ns h i f t 的含義也發(fā)生了變化 如果我們說m e a ns h i f t 算法 一般是指一個迭代的步驟 即先算出當(dāng)前點的偏移均值 移動該點到其偏移 均值 然后以此為新的起始點 繼續(xù)移動 直到滿足一定的條件結(jié)束 然而在以后的很長一段時間內(nèi)m e a ns h i f t 并沒有引起人們的注意 直到 2 0 年以后 也就是1 9 9 5 年 另外一篇關(guān)于m e a ns h i f t 的重要文獻(xiàn)1 3 3 才發(fā)表 在這篇重要的文獻(xiàn)中 y i z o n gc h e n g 對基本的m e a ns h i f t 算法在以下兩個方 面做了推廣 首先y i z o n gc h e n g 定義了一簇核函數(shù) 使得隨著樣本與被偏移 點的距離不同 其偏移量對均值偏移向量的貢獻(xiàn)也不同 其次y i z o n gc h e n g 還設(shè)定了一個權(quán)重系數(shù) 使得不同的樣本點重要性不一樣 這大大擴(kuò)大了 m e a ns h i f t 的適用范圍 另外y i z o n gc h e n g 指出了m e a ns h i f t 可能應(yīng)用的領(lǐng) 域 并給出了具體的例子 c o m a n i c i u 等人 3 4 3 5 把m e a ns h i f t 成功的運用到特征空間的分析 在圖 像平滑和圖像分割中m e a ns h i f t 都得到了很好的應(yīng)用 c o m a n i c i u 等在文章 中證明了 m e a ns h i f t 算法在滿足一定條件下 一定可以收斂到最近的一個 概率密度函數(shù)的穩(wěn)態(tài)點 因此m e a ns h i f t 算法可以用來檢測概率密度函數(shù)中 存在的模態(tài) 2 1 無參數(shù)密度估計理論 在一些低層視覺任務(wù)中 如場景中檢測運動目標(biāo) 目標(biāo)跟蹤等 對目標(biāo) 或者背景的表象建立一種表達(dá)很重要 我們通過對新舊表達(dá)的對比達(dá)到目標(biāo) 的檢測或者跟蹤的目的 一個表達(dá)方式就是對目標(biāo)的表象的變化進(jìn)行統(tǒng)計建 模 將目標(biāo)的表象信息映射到一個特征空間中 其中的特征值就是特征空 白j 中的隨機(jī)變量 假定特征值服從已知函數(shù)類型的概率密度函數(shù) 由目標(biāo)區(qū)域 內(nèi)的數(shù)據(jù)估計密度函數(shù)的參數(shù) 通過估計的參數(shù)得到整個特征空間的概率密 1 0 哈爾濱 l 程大學(xué)碩十學(xué)位論文 度分飾函數(shù) 這種方法我們稱之為參數(shù)密度估計方法 參數(shù)密度估計方法要求特征空間服從一個已知的概率密度函數(shù) 實際問 題中這個要求很難達(dá)到 而且這個已知的概率密度函數(shù)一般是典型函數(shù) 大 部分是單峰的 而實際的計算機(jī)視覺問題涉及的密度分布往往是多變量多峰 的 無參密度估計理論恰好能很好地處理這些問題 2 1 1 1 參數(shù)估計密度 傳統(tǒng)的參數(shù)概率密度估計的目的是尋找一個已知函數(shù)類型的概率密度函 數(shù) 它的分布就是或者近似于我們分析的數(shù)據(jù)分布 給定一組數(shù)據(jù)點x 這 組數(shù)據(jù)服從一個己知的概率密度函數(shù)廠 1 9 的 曰是該函數(shù)的參數(shù) 參數(shù)概 率密度估計的目的是找到參數(shù)0 的最優(yōu)估計占 這樣通過否就可以計算 廠f i 莎1 而得到整個數(shù)據(jù)的密度函數(shù)的估計廠 對參數(shù)的估計可以采用最大似然估計方法 其基本假設(shè)是 數(shù)據(jù)點是從 符合概率密度函數(shù)廠的相同的隨機(jī)變量中獨立提取的 例如 一組數(shù)據(jù)服從 高斯分布n t 盯 均值參數(shù)為 方差參數(shù)為盯2 從這些數(shù)據(jù)中采樣得到 一組數(shù)據(jù)點x 薯l 其中這兩個參數(shù)的最大似然估計p 專 x v f e 爿 1 子 i 1 x p 既 參數(shù)的最大似然估計是采樣均值和采樣方差 v 孑 利用參數(shù)函數(shù)對數(shù)據(jù)建模的好處是 將大量的數(shù)據(jù)壓縮為簡潔的參數(shù)形 式 幾個參數(shù)就可以準(zhǔn)確描述數(shù)據(jù)的分布 這在許多應(yīng)用領(lǐng)域是很有吸引力 的 其缺點是事先須知道數(shù)據(jù)分布函數(shù)的形式 在計算機(jī)視覺中這種要求是 不現(xiàn)實的 數(shù)據(jù)模型往往是未知的 如果指定的密度模型不j 下確 估計就會 有偏差 而且偏差不會隨采樣數(shù)據(jù)的增多而消除 換句話說 得到的模型沒 有收斂于數(shù)據(jù) 另外一個缺點是參數(shù)的估計未必是最優(yōu)的 一種情況就是它 有時會收斂于一些局部點 2 1 2 無參數(shù)密度估計 無參密度估計一般也稱非參數(shù)估計技術(shù) 屬于數(shù)理統(tǒng)計學(xué)的一個分支一 非參數(shù)統(tǒng)計學(xué)的范疇 形成于2 0 世紀(jì)4 0 年代 有很強(qiáng)的實用價值 常見的 哈爾濱 i 程人學(xué)碩十學(xué)俄論文 非參數(shù)估計技術(shù)有以下幾種 直方圖法 最近鄰域法及核密度估計法 5 0 年代以前 直方圖方法是唯一的無參密度估計方法 直方圖法通常把 數(shù)據(jù)的值域分成若干相等的區(qū)間 數(shù)據(jù)就按區(qū)間分成若干組 每組形成一個 矩形 其高和該組數(shù)據(jù)的多少成比例 其底為所屬區(qū)間 這些矩形依次排列 組成的圖形就是直方圖 它給數(shù)據(jù)的分布一個直觀的形象 但它只適用于維 數(shù)底的數(shù)據(jù) 當(dāng)維數(shù)高的時候 直方圖技術(shù)所需要的空間將隨著維數(shù)的增加 成指數(shù)級增加 最近鄰域法容易受局部噪音的影響 使得模型的估計變得很 難 而核密度估計方法適合于中小規(guī)模的數(shù)據(jù)集 它可以很快地產(chǎn)生一個漸 進(jìn)無偏的密度估計 有良好的概率統(tǒng)計性質(zhì) 由于隨機(jī)干擾的存在 采樣的數(shù)據(jù)往往有很大的擺動 不很光滑 因此 要去除干擾 也就是說使圖形光滑 最簡單的是三點平均 某個點附近三個 點的平均值作為這個點的值 當(dāng)然 也可以取1 1 個數(shù)據(jù)來平均 r l 越大 圖 形越光滑 但除了均值以外的很多細(xì)節(jié)信息也丟失了 所以既要消除干擾 還要防止把有用的信息丟掉 核密度估計就是這樣一種平滑的無參估計方法 5 0 到6 0 年代 核密度估計方法被提了出來 是目前最通用的無參密度估 計方法 核密度估計的原理和直方圖技術(shù)有些類似 對于一組采樣數(shù)據(jù) 把 數(shù)據(jù)的值域分成若干相等的區(qū)間 每個區(qū)間稱為一個b i n 數(shù)據(jù)就按區(qū)i b j 分 成若干組 每組數(shù)據(jù)的個數(shù)與總參樣個數(shù)的比率就是每個b i n 的概率值 相 對于直方圖法 它多了一個用于平滑數(shù)據(jù)的核函數(shù) 首先 我們來看一下常用的一些核函數(shù) 核函數(shù)也稱 窗口函數(shù) 圖2 1 是一維空間中常用核函數(shù)的名稱 公式及圖形 分別是均勻 u n i f o r m 三角 t r i a n g l e 依潘涅契科夫 e p a n e c h n i k o v 雙權(quán) b i w e i g h t 高斯 g a u s s i a n 余弦弧 c o s i n u s a r e h 雙指數(shù) d o u b l ee x p o n e n t i a l 及雙依潘涅契科夫 d o u b l e e p a n e c h n i k o v 函數(shù) 1 2 哈爾濱i l 科火學(xué)碩十學(xué)位論文 u n i f o r m v i 1 扣t 2 g a u s s i a n o i 1 3 t r i a n g l e i i i g i l t 鼉 1 i 2 z c o s i n u sa r c h 三c o s 三f 42 哈爾濱j r 稃火學(xué)碩 學(xué)能論文 u b l ee x p o n e n t 壤i 丟e 一4 d u b l ee p 鯽e c h n i k v 3 m l i 圖2 1 常用核函數(shù)的形狀 可以看出這些核函數(shù)都遵循一些基本特征 核函數(shù)是對稱的 單峰的 有限局部支撐的 所謂單峰的是指從中心向邊緣其值迅速衰減為o 而有限 局部支撐指超過一定窗1 2 1 的點其值為0 并且在一維空問要求核函數(shù)k x 滿 足以下條件 1 q x 吒 一x 吒 x 0 i k x a t 1 如 f k 2 一1 以n 這里h 是核函數(shù)的帶寬 下面我們會討論 核密度估計 給定一組刀個一維空間的數(shù)據(jù)點的集合s t k 它的 未知的概率密度函數(shù)為刷 取核函數(shù)為k z 那么在x 點處的密度可以按 下式計算 夕 x 亡 x 一 2 2 l 其中 x 為核函數(shù)的中心點 即相對于點x 圖形對稱 核密度估計的含 義可以理解為 將在每個采樣點為中心的局部函數(shù)的平均效果作為該采樣點 概率密度函數(shù)的估計值 或者 核估計器在被估計點為中心的窗口內(nèi)計算數(shù) 據(jù)點加權(quán)的局部平均 圖2 2 說明核密度估計的原理 下面的九條虛線表示9 個數(shù)據(jù)點上的核函數(shù) 這里采樣的是高斯核函數(shù) 實線表示將這些核函數(shù)累 加后得到的密度函數(shù)估計 可以看出 核密度估計可以估計密度函數(shù)是多峰 的分布 這是參數(shù)估計所做不到的 1 4 哈爾濱 l j 科火學(xué)碩十學(xué)位論文 圖2 2 核密度估計的原理說明 2 1 3 無參數(shù)密度估計的收斂性 核密度估計有一個性質(zhì) 如果采樣充分 核密度估計能夠漸進(jìn)地收斂于 任意的密度函數(shù) 這個性質(zhì)保證了該技術(shù)可以對服從任何分布的數(shù)掘進(jìn)行密 度估計 假設(shè)一組隨機(jī)數(shù)據(jù)x 密度函數(shù)為p 例 從中采樣組成采樣點集合 s 乩 那么 其樣本均值為 牙 在點x 處的估計密度可以 寫為 p x 寺 k x x 巨 k x 一 v l e s 即 核函數(shù)密度估計值p x 等于在樣本集合s 上函數(shù)k 伍 的樣本均 值 根據(jù)貝努罩大數(shù)定理 當(dāng)樣本點足夠多時 事件的頻率近似于事件的概 率 因此有 j l i m 多o e x x x e k x x 2e k o t p t d t 必宰p 2 3 這說明 估計的密度b x 漸進(jìn)地收斂于核函數(shù)與真實密度的卷積 因此 如果p x k 幸p x 估計密度b x 就漸進(jìn)地收斂于真實密度p x t 一個 哈爾濱1 j 程火學(xué)碩十學(xué)位論文 典型的情形是 如果核函數(shù)趨向于萬函數(shù) 采樣數(shù)據(jù)的個數(shù)趨向于無窮大 b x 收斂于p 俐 并且估計聲 x 式密度p 例的無偏估計 上面我們提到的主要是對數(shù)據(jù)的擾動起平滑作用 當(dāng)采用同樣的核函數(shù) 采用小的帶寬時 得到的密度分布圖顯得 粗糙 而采用大的帶寬時 分布 圖光滑得多 因此要使估計密度得到的密度函數(shù)盡量收斂于任何的密度函數(shù) 在采樣點盡量多的情況下 需要選擇合適的帶寬 后面在多維空l 日j 中我們會 討論核函數(shù)估計的收斂性 2 2m e a ns h i f t 理論 2 2 1 基本m e a ns h i f t 算法 給定d 維空間r d 中的聆個樣本點五 i l 聆 在x 點的m e a ns h i f t 向量 的基本形式定義為 x 三i 1 葺一x 2 4 x j e 其中 邑是一個半徑為h 的高維球區(qū)域 滿足以下關(guān)系的y 點的集合 s x 蘭 y y x 7 y x h 2 2 5 k 表示在這甩個樣本點薯中 有k 個點落入甌區(qū)域中 我們可以看到 t x 是樣本點x i 相對于點x 的偏移向量 2 4 式定義的 m e a ns h i f t 向量m h x 就是對落入?yún)^(qū)域邑中的k 個樣本點相對于點x 的偏移 向量求和然后再平均 從直觀上看 如果樣本點 從一個概率密度函數(shù)y x 中采樣得到 由于非零的概率密度梯度指向概率密度增加最大的方向 因此 從平均上來說 s 區(qū)域內(nèi)的樣本點更多的落在沿著概率密度梯度的方向 因 此 對應(yīng)的 m e a ns h i f t 向量m 應(yīng)該指向概率密度梯度的方向 1 6 哈爾濱 i 程人學(xué)碩十學(xué)何論文 圖2 3m e a ns h i f t 不恿圖 如上圖所示 大圓圈所圈定的范圍就是甌 小圓圈代表落入甌區(qū)域內(nèi)的 樣本點 最 黑點就是m e a ns h i f t 的基準(zhǔn)點x 箭頭表示樣本點相對于基 準(zhǔn)點x 的偏移向量 很明顯的 我們可以看出 平均的偏移向量m h x 會指 向樣本分布最多的區(qū)域 也就是概率密度函數(shù)的梯度方向 2 2 2 擴(kuò)展的m e a ns h i f t 算法 首先我們引進(jìn)核函數(shù)的概念 代表一個d 維的歐氏空間 x 是該空間 中的一個點 用一列向量表示 x x l l 2 石r x r 表示實數(shù)域 如果一個 函數(shù)k x 一尺存在一個剖面函數(shù)尼 o 0 0 r 即 k x 七 2 2 6 并且滿足 1 k 是非負(fù)的 2 k 是非增的 即如果口 b 那么k a k b 3 七是分段連續(xù)的 并且f 七 d r 那么 函數(shù)k x 就被稱為核函數(shù) 在m e a ns h i f t 中 有兩類核函數(shù)經(jīng)常用到 他們分別是 哈爾濱 r 群大學(xué)碩十學(xué)位論文 單位均勻核函數(shù) x 1 0 i fi i x i 1 單位高斯核函數(shù) x p i d 2 這兩類核函數(shù)如下圖所示 2 7 2 8 a 單位均勻核函數(shù) b 單位高斯核函數(shù) 圖2 4 常用核函數(shù) 一個核函數(shù)可以與一個均勻核函數(shù)相乘而截尾 如一個截尾的高斯核函數(shù)為 口 c x 手 m 2 簍 捌三三 t 2 9 圖2 4 顯示了不同的 五值所對應(yīng)的截尾高斯核函數(shù)的示意圖 a 巧 b o 1 e 圖2 5 截尾高斯核函數(shù) 從 2 4 式我們可以看出 只要是落入甌的采樣點 無論其離x 遠(yuǎn)近 對最終 哈爾濱j 1 程人學(xué)碩十學(xué)何論文 的m h x 計算的貢獻(xiàn)是 樣的 然而我們知道 一般的說來 離x 越近的采 樣點對估計x 周圍的統(tǒng)計特性越有效 因此我們引進(jìn)核函數(shù)的概念 在計算 m x 時可以考慮距離的影響 同時我們也可以認(rèn)為在這所有的樣本點 中 重要性并不一樣 因此我們對每個樣本都引入一個權(quán)重系數(shù) 如此以來我們就可以把基本的m e a ns h i f t 形式擴(kuò)展為 一 g h x i x w 一 x m x 蘭型 f 一 2 1 0 g 一一x w 其中 g 五一x 1 日i l 2 g h 州2 一x 寬矩陣h 一般被限定為一個對角矩陣h d i a g l 砰 h 2l 甚至更簡單的被取 蝌一 億11 眠 工 三旦百 一 2 一 g 竿 w 一 2 g 1 0 i f i l x l l 1 1 9 哈爾濱 程大學(xué)碩十學(xué)位論文 脅羔孽坦 p 2 八曲2 1 杰 廠 q 1 2 p x d x l k x 七 2 2 1 3 g x g 2 2 1 4 饑加嗍加竺型衛(wèi)芏吐竺億 5 夥 x 耵 x 了 i 秀主童 石產(chǎn) 2 15 由上面的定義 g 一k x g x g 1 2 上式可以重寫為 乩 2 g 睜陸 耽功 1 貶翥產(chǎn) 2 0 哈爾濱j i j 程人學(xué)碩 學(xué)位論文 一2 陬g 罕 w h 2 l廳4 n w x 崆心 叫g(shù) 剛罕陸 j l 西再礦 2 1 6 上式右邊的第二個中括號內(nèi)的那一部分就是 2 1 1 式定義的m e a ns h i f t 向量 第一個中括號內(nèi)o 內(nèi) g 部分是以g x 為核函數(shù)對概率密度函數(shù)f x 的估計 我們記做五 x 而 2 一1 2 式定義的夕 x 我們重新記做五 x i n l t t 2 1 4 式可 以重新寫為 豇 工 畈 x p 一 l 工 鳩 x 2 1 7 由 2 1 5 式我們可以得出 一1 爐鬻 2 1 8 上式表明 用核函數(shù)g 在x 點計算得到的m e a ns h i f t 向量m h x 正比于歸一 化的用核函數(shù)k 估計的概率密度的函數(shù)五 x 的梯度 歸一化因子為用核函 數(shù)g 估計的x 點的概率密度 因此m e a ns h i f t 向量心 x 總是指向概率密度 增加最大的方向 2 3m e a ns h i f t 算法及收斂性證明 我們在前面已經(jīng)指出 我們在提及m e a ns h i f t 向量和m e a ns h i f t 算法的 時候指代不同的概念 m e a ns h i f t 向量是名詞 指的是一個向量 而m e a ns h i f t 算法是動詞 指的是一個迭代的步驟 我們把 2 1 1 式的x 提到求和號的外面 來 可以得到下式 芝g 罕 w 葺 心 石 號 警j 一一x 2 1 9 g 罕 w 葺 我們把上式右邊的第一項記為m h x 即 哈爾濱丁程大學(xué)碩士學(xué)位論文 吶 鬻 x j x p 冽 3 如果1 1 x x l i f 結(jié)束循環(huán) 若不然 繼續(xù)執(zhí)行 1 我們用 y j j l 2 來表示m e a ns h i f t 算法中移動點的痕跡 由 2 2 0 擎nx 霉 竺乒 二 p 2 l 5 一 1 2 2 與y 對應(yīng)的概率密度函數(shù)估計值夕 y 可表示為 她 罐d 掌n 倍2 2 烈 方式扣 犯 2 2 下面的定理將證明序列 乃 和 夕 乃 的收斂性 哈爾溟 1 釋人寧顧十號 何論文 式 2 一1 3 和 2 一1 4 定義 則序列 j j 和 廠 y 是收斂的 證明 由于n 是有限的 核函數(shù)k x k o 因此序列 廠 y 是有界的 所以我們只需要證明 y 是嚴(yán)格遞增的的 即要證明 對所有j l 2 如 果y j l y j 那么 f y j 一 2 w 一 1 辦 2 w x g i f f g l f 2 o 薯1 1 2 一i l 乃 一 1 1 2 w c 2 壙眇川 吣 2 y 喜葺g i i 專i 2 卜c 書 i i y l i l 2 喜g 1 魯l 2 w c c 2 2 7 由 2 2 1 式我們可以得出 夕c y 一夕c y i i 麗1 o y l l 2 2 g 1 專1 1 2 c 2 2 8 半 竿 iiiii ii i iiijiiii 哈爾濱1 i 程人學(xué)碩 學(xué)位論文 由于剖面函數(shù)尼 x 是單調(diào)遞減的 所以求和項 2 g 魯l 門 因此 只要 y l o 2 2 8 式的右邊項嚴(yán)格大于零 即夕 1 夕o 由此可證 得 序列 夕 收斂
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鳳翔學(xué)校九年級數(shù)學(xué)試卷
- 低分和高分?jǐn)?shù)學(xué)試卷
- 肝病中醫(yī)康復(fù)課件
- 地調(diào)小升初考試數(shù)學(xué)試卷
- 肖琴中醫(yī)課件
- 公廁管護(hù)培訓(xùn)課件內(nèi)容
- 鄧州市大聯(lián)考數(shù)學(xué)試卷
- 肉牛飼養(yǎng)技術(shù)課件
- 課件制作培訓(xùn)過程
- 2025至2030城市應(yīng)急聯(lián)動行業(yè)市場深度研究與戰(zhàn)略咨詢分析報告
- 商場動火作業(yè)培訓(xùn)
- 德育培訓(xùn)課件
- 2025年企業(yè)管理專業(yè)考試試題及答案
- 版2025-2030中國天然火山灰市場深度調(diào)查與未來發(fā)展趨勢研究報告
- 2025年廣東省廣州市越秀區(qū)第十六中學(xué)中考二模數(shù)學(xué)試卷(含部分答案)
- 2025年湖南省中考語文試卷真題及答案詳解(精校打印版)
- 甲流講解課件
- 韶關(guān)市樂昌市招聘醫(yī)療衛(wèi)生專業(yè)技術(shù)人員筆試真題2024
- JHA工作危害分析專項培訓(xùn)
- 18CrNiMo7-6齒輪鋼滲碳工藝優(yōu)化及其對疲勞性能的影響研究
- 2025益陽市赫山區(qū)中小學(xué)教師招聘考試試題及答案
評論
0/150
提交評論