手勢識別綜述_第1頁
手勢識別綜述_第2頁
手勢識別綜述_第3頁
手勢識別綜述_第4頁
手勢識別綜述_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

手勢識別綜述匯報人:yljy52725日期:2019.6.13CONTENT手勢識別概述01手勢預處理算法02手勢分類算法03下一階段計劃04相比于傳統(tǒng)人機交互模式,手勢具有豐富信息,必將在未來人機交互中發(fā)揮重要作用手勢識別概述01鍵鼠觸控語音體感交互第一代人機交互使用鍵盤、鼠標首次實現(xiàn)將人類輸入信息傳達至計算機新型人機交互模式實現(xiàn)更為自然化的人機交互,人可以在虛擬環(huán)境中體驗真實物理世界般的交互體驗多點觸控觸控式交互推動了移動互聯(lián)網(wǎng)發(fā)展人機交互模式01讀取圖像02手勢分割04手勢識別03手勢分類手勢識別過程010203基于視覺單目視覺立體視覺040506邊緣輪廓提取多特征結(jié)合法指關(guān)節(jié)跟蹤法手勢分析通過分析手勢,獲得手勢形狀特征及運動軌跡信息手勢分割使用圖像采集設(shè)備獲得手勢圖像,轉(zhuǎn)換為手勢平面模型/立體模型手勢預處理將模型參數(shù)空間軌跡分類到該空間某個子集的過程手勢識別動態(tài)手勢識別可以通過幀形式轉(zhuǎn)換為靜態(tài)手勢識別任務靜態(tài)手勢識別使用雙重隨機過程對手勢軌跡進行識別隱馬爾科夫模型動態(tài)手勢識別將手勢看做由靜態(tài)手勢圖像構(gòu)成的序列,然后將待識別圖像與已知手勢模板進行比較模板匹配法通過對大量標注/非標注手勢數(shù)據(jù)進行學習,最終實現(xiàn)對未知手勢數(shù)據(jù)進行識別深度學習010305020406手勢識別手勢分割影響最終的手勢分類結(jié)果手勢預處理算法02標題文字0102030405基于顏色空間基于區(qū)域聚類算法基于直方圖(閾值)基于邊緣分割要點1、背景消除2、多特征結(jié)合基于單目視覺手勢分割算法不同分割算法結(jié)果比較模擬人類視覺原理,使用計算機被動感知距離。從兩個或者多個點觀察一個物體,獲取在不同視角下的圖像,根據(jù)圖像之間像素的匹配關(guān)系,通過三角測量原理計算出像素之間的偏移來獲取物體的三維信息灰度圖像大多通過算子尋找邊緣和區(qū)域生長融合來分割圖像;彩色圖像增加了色彩信息,可以通過不同的色彩值來分割圖像彩色圖像分割計算復雜度較高,但是可以在三維空間對圖像進行分割?,F(xiàn)在衍生出較多改進算法(分解算法、基于最佳熵算法等)三維OTSU算法直接對RGB圖像進行聚類運算,但是計算開銷較大聚類算法基于立體視覺手勢分割算法立體視覺分割算法比較手勢識別的最終目標就是實現(xiàn)對手勢的正確分類手勢分類算法03建立圖像識別模型:底層特征學習、特征編碼、空間約束、分類器設(shè)計、模型融合階段。并且深度學習的分類精度較高,但是計算空間和時間復雜度較高。深度學習屬于二分類算法,可以支持線性和非線性的分類。通過計算數(shù)據(jù)點與超平面之間的距離得到支持向量,當某一類支持向量較多時,則判斷待分類數(shù)據(jù)屬于該類。SVM雙重隨機過程,底層是馬爾可夫概率狀態(tài)過程;從底層狀態(tài)到表層觀察值的隨機過程。通過已知分類樣本,挖掘分類樣本中隱藏的信息。HMM計算待分類樣本與已知類別的訓練樣本之間的距離,找到距離與待分類樣本數(shù)據(jù)最近的k個鄰居;再根據(jù)這些鄰居所屬的類別來判斷待分類樣本數(shù)據(jù)的類別。KNN分類算法共50/101/152層。使用殘差結(jié)構(gòu)和恒等結(jié)構(gòu)。ResNet50/101/152共22層(5M參數(shù)),使用Inception結(jié)構(gòu),無全連接層GoogleNet五個卷積層,三個全連接層,共8層(60M參數(shù))AlexNet兩個卷積層,三個全連接層,共5層LeNet-51LeNet-53GoogleNet2AlexNet4ResNet50/101/152卷積神經(jīng)網(wǎng)絡(CNN)如何精簡網(wǎng)絡結(jié)構(gòu),降低算法計算復雜度和空間復雜度較深的網(wǎng)絡擁有較高性能,因此網(wǎng)絡向著更深層次發(fā)展網(wǎng)絡參數(shù)在更新時存在梯度消失和梯度爆炸等問題可解釋性較差卷積神經(jīng)網(wǎng)絡發(fā)展瓶頸下一階段計劃04下一階段計劃1、影響手勢識別效果的因素,一方面取決于對手勢原始數(shù)據(jù)的預處理;一方面取決于最終的

網(wǎng)絡參數(shù)。所以如何對手勢數(shù)據(jù)有效的預處理以及調(diào)整網(wǎng)絡參數(shù)使得網(wǎng)絡具有更好性能。2、較深網(wǎng)絡的分類精度較高,所以現(xiàn)在深度學習均向增加網(wǎng)絡深度和寬度的方向發(fā)展,但最

終使得的網(wǎng)絡參數(shù)量過大。但是現(xiàn)在使用網(wǎng)絡的冗余度仍然較高。如何精簡網(wǎng)絡,以有效

降低網(wǎng)絡的時間和空

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論