基于智能手機(jī)傳感器數(shù)據(jù)的人類行為識(shí)別研究_第1頁
基于智能手機(jī)傳感器數(shù)據(jù)的人類行為識(shí)別研究_第2頁
基于智能手機(jī)傳感器數(shù)據(jù)的人類行為識(shí)別研究_第3頁
基于智能手機(jī)傳感器數(shù)據(jù)的人類行為識(shí)別研究_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Computer Engineering and Applications 計(jì)算機(jī)工程與應(yīng)用2016,52(23)1熱點(diǎn)與綜述基于智能傳感器數(shù)據(jù)的人類行為識(shí)別研究ZHU Xiangbin, QIU Hu,浙江 金華 321000浙江師范大學(xué) 數(shù)理與College of Mathematics, Physics ana,321000,ZHU Xiangbin, QIU Huiling. Humanand Applications, 2016, 52(23):1-5.Abstract:Recognition of human activity from t fields, such as heal

2、thcare services, intelligent envir methods is not enough in many applications, especiallproposes a Random Forest(RF)approach to recognize h(SpLPP)as the method of feature reduction. Firstly, the oppplications in many n accuracy of most existedder to improve accuracy, the paper hoose Sparse Local Pre

3、serving Projectionure subsets are determined by LPP. Secondly, theresults of activity recognition are classified by RF ensemble classifier. Compared with other methods, the method uses thesignificantly less number of features, and the over-all accKey words:human activity recognition;randombeen incre

4、ased.y preserving projections; smartphone摘 要:運(yùn)用智能應(yīng)用。目前,大多數(shù)的智能環(huán)境和網(wǎng)絡(luò)空間安全等領(lǐng)域有許多重要為了提高行為活動(dòng)的識(shí)別準(zhǔn)確率,先利用稀疏局部保持投影降維,將實(shí)驗(yàn)的數(shù)據(jù)集進(jìn)行特征約簡得到最優(yōu)的實(shí)驗(yàn)特征人類行為識(shí)別。實(shí)驗(yàn)結(jié)果證明,該了提高了整體精確度。文獻(xiàn)標(biāo)志碼:A1 引言人類行為識(shí)別的目的是通過一系列的觀察,對(duì)人的 動(dòng)作類型、行為模式進(jìn)行分析和識(shí)別,并使用自然語言等方式對(duì)其加以描述。人類的行為可分為單一和多樣兩種,單一的行為識(shí)別只需要將給定的數(shù)據(jù)準(zhǔn)確已知的幾個(gè)行為類別;多樣的行為較為復(fù)雜,往往識(shí)別的是多種行為,系統(tǒng)需要根據(jù)給定的數(shù)據(jù)自動(dòng)

5、識(shí)別出行 為的類別。目前,人類行為識(shí)別已被廣泛地應(yīng)用于醫(yī)療服務(wù)、智能環(huán)境和網(wǎng)絡(luò)空間安全等領(lǐng)域。隨著速度正以展,可穿戴的流行了多種多樣的傳感器,如:高清相機(jī),光傳感器,陀螺儀傳感器感器等 。智能已經(jīng)達(dá)到近 80%的使用率,并且在 2020 年將會(huì)達(dá)到 80預(yù)見,這種功能強(qiáng)大的方便、有效并且易于使用的工具去自動(dòng) 為(Activities of Daily Living,ADL)3 。靈活、基基金項(xiàng)目ZH125);浙江省公益技術(shù)研究 No.LQ13F020007,No.LY16F030上海市作者簡介收稿日期:2016 06 06修回日期:2016 07 11文章編號(hào):1002 8331(2016)2

6、3 0001 0522016,52(23)Computer Engineering and Applications 計(jì)算機(jī)工程與應(yīng)用于智能傳感器數(shù)據(jù)的人類行為識(shí)別是一個(gè)很熱門3 提出的3.1 基本思路的研究方向。本文結(jié)合了降維和器設(shè)計(jì)。由于實(shí)驗(yàn)獲2國內(nèi)外研究現(xiàn)狀目前,基于智能得的時(shí)間序列數(shù)據(jù)集具有連續(xù)且局部相關(guān)性高等特點(diǎn)。稀疏局部保持投影優(yōu)化保留了鄰域結(jié)構(gòu)的數(shù)據(jù)集9 , 并且可以自適應(yīng)地選擇領(lǐng)域的個(gè)數(shù)以及計(jì)算權(quán)重值 0 。因此選擇稀疏局部保持投影(Sparse Local PreservingProjection,SpLPP)對(duì)數(shù)據(jù)進(jìn)行降維階段的特征約簡。傳感器的人類行為識(shí)別研究已經(jīng)吸引了大

7、量的國內(nèi)外研究,并且也獲得了一些成果。L.Bao和S.Intille等人收集了來自20 個(gè)用戶的實(shí)驗(yàn)數(shù)據(jù),他們分別將 5 個(gè)雙軸度傳感器節(jié),腕關(guān)節(jié),踝關(guān)節(jié),大腿和素放在大腿上的動(dòng)4 。J.Kwapisz.G.Weiss和S.Moore等用戶的褲子口袋中的Andriod 智能放在右髖關(guān),并且出現(xiàn)想,本文選用隨機(jī)森林作為分進(jìn)行識(shí)別。速度傳感器中的數(shù)據(jù),結(jié)果表明:J48 決策樹本文先利用稀疏局部保持投影的降維,將動(dòng)地識(shí).-實(shí)驗(yàn)的數(shù)據(jù)集進(jìn)行特征約簡,進(jìn)而得到最優(yōu)的實(shí)驗(yàn)特征子集,再用隨機(jī)森林集成器完成人類行為的識(shí)別。態(tài)活動(dòng),值得注意的是沒有一種別所有的活動(dòng),尤其是上樓D.Lee.和W.-Y.Ch如圖 1

8、 所示,信號(hào)于嵌入在智能中的度傳感器和陀螺儀傳感器。實(shí)驗(yàn)選用了人類日常活動(dòng)的六類常見行為,分別為:走、上樓梯、下樓梯、坐、站、躺。、信號(hào)也融入了不同頻段的度。HAR 數(shù)據(jù)包的貢獻(xiàn)者Auguita 等人,進(jìn)行了包含上下樓梯的 6 種活動(dòng)感器數(shù)據(jù)進(jìn)行多類支持法對(duì)參數(shù)進(jìn)行解釋,所以結(jié)果缺乏透明性3 。S.-B.Cho 和Y.-S.Lee 同樣也使用了智能數(shù)據(jù),采用分層隱們的結(jié)果強(qiáng)調(diào)了HHMMs 在處理低和能量、頻偏和間角度等特征。接下來是對(duì)提取出的集用于實(shí)驗(yàn)的器對(duì)最優(yōu)特機(jī)森林的集成單的 HMMs 和人工神經(jīng)網(wǎng)絡(luò)更有效6 。Charissa Ronao 等人在同樣數(shù)據(jù)的基礎(chǔ)上,運(yùn)用兩爾科夫模型Huyn

9、h 采用隨機(jī)森林對(duì)同樣的數(shù)據(jù)進(jìn)行Ann高精度地識(shí)別出六類行為。RF分果準(zhǔn)確度都超過了 83%,整體精確度達(dá)到了 96%(http:/ M基于譜聚類和隱Hidden Markov M有效地挖掘了不同時(shí)間片段之間的關(guān)聯(lián)性,從而提高了 動(dòng)作的識(shí)別率,最后達(dá)到平均 93.48%的識(shí)別率8 ,但是這種算法在區(qū)分上下樓梯時(shí)表現(xiàn)得不太理想。以上的這些研究成果無論圖1 人類行為識(shí)別流程圖性降析(Principal Component(MultidimensioAnalysis,PEmbedding,LLE)、拉斯特征(Laplacian Eigen-要目的是減少實(shí)驗(yàn)的特征數(shù)量,但目前,很多實(shí)驗(yàn)數(shù)據(jù)maps,L

10、E)、局 部 切 空 間 排 列(Local Tangent Space Alignment,LTSA)和局部保持投影(Locality Preserving Projections,LPP)等。PCA 和LDA 這類經(jīng)典算法目前已經(jīng)有了豐富的理論知識(shí)儲(chǔ)備,并且在處理執(zhí)行和分析操 作時(shí)相對(duì)簡易。但是這類算法有一個(gè)缺點(diǎn):較易忽略高維數(shù)據(jù)空間的內(nèi)在幾何結(jié)構(gòu)特征,最終導(dǎo)致低識(shí)別率 3 。在經(jīng)過數(shù)據(jù)處理后,仍然特征數(shù)太多的問題,如:Anguita 等人和Ngan Huynh 的實(shí)驗(yàn)中都使用了561 個(gè)特征。大量的特征數(shù)加大了實(shí)驗(yàn)的計(jì)算復(fù)雜度并且增加了計(jì)算內(nèi)存。同時(shí),也將一些與實(shí)驗(yàn)相關(guān)度不高的特征變量帶

11、入實(shí)驗(yàn)中,從而導(dǎo)致最后的識(shí)別精確度低問題。因此,迫切地需要一種有創(chuàng)新性去提高算法的性能。人類 為:基于智能傳感器數(shù)據(jù)的人類行為識(shí)別研究2016,52(23)3如果實(shí)驗(yàn)用的數(shù)據(jù)集為人工的,LEE、Isomap 和LE 等這類流行學(xué)習(xí)算法可以得出比較優(yōu)越的結(jié)果。但是面對(duì)處理實(shí)際數(shù)據(jù)時(shí),性能往往達(dá)不到預(yù)期效果,并且會(huì)產(chǎn) 生“外樣本(out-of-sample)”問題。而LPP 不僅可以克服 “外樣本(out-of-sample)”問題還能夠提升流行學(xué)習(xí)在處理實(shí)際數(shù)據(jù)時(shí)的性能。局部保持投影是一種流行并且有效的線性的流行學(xué)習(xí)算法,它兼顧了流行學(xué)習(xí)點(diǎn) 4 ,最大限度地保持?jǐn)?shù)據(jù)上運(yùn)用Laplace Belt

12、rami 算子找到最佳線性近似的特征函數(shù)得到。LPP 實(shí)質(zhì)上是拉求解稀疏表示的最優(yōu)解 6 ,使得局部鄰域包含樣本的嵌目的。i ,通過計(jì)算 l1 范它的稀疏重構(gòu)權(quán)重系數(shù) wi 。法中的數(shù)問題,xi - Xwi w+ wi ; wi j 0 j = 1 2 m21 0 w w 是一個(gè) m 維列數(shù)元素為 0,其他系數(shù)元素 wi j j ¹ i 表示每個(gè)樣本元素 xj線性逼近 。給定一個(gè)集合x x x ÎRn ,找到一其中,wi 為稀疏表示1 2m個(gè)轉(zhuǎn)移矩陣 A ,使得 m 個(gè)點(diǎn)保持投影的 感器數(shù)據(jù)降維Rl (l n) 上,通過 y = Ax算1 得到了原始傳感器數(shù)據(jù)ii其準(zhǔn)則函數(shù)

13、為:的投影數(shù)據(jù)集 Y據(jù)空間到了低維數(shù)據(jù)空n nJ = åå間,但是保留了傳感器數(shù)據(jù)作為新的輸入數(shù)據(jù)用于下一算法1 SpLPP feature redInputs:X train:train data;y test data;y test:test label;Optains;WOutput:Ytrain;Ytest For j = 1 Ò nj Ø j + 1X train(j y tr2yi - yjWij(1)i 1 j 1式中,Wij 為樣本 xi 和樣本 xj 之間的投影權(quán)重。為了得到轉(zhuǎn)移矩陣 A ,需要計(jì)算最小化目標(biāo)函數(shù), 具體計(jì)算推導(dǎo)如下所示

14、:;X test:matrixæöøn nAopt = arg minç åå2yi - yj=Wijè i 1 j 1æöøn n2Wijarg minç ååA xi - A xj=è i 1 j 1arg min tr(A XDX A - Aarg min tr(A XLX A)XWX A) =(2)low dimen式中,D 是一個(gè)對(duì)角矩陣,它的輸入是 W 的列總Dii = åWij ;L = D - W 是一個(gè)Laplacianj 1個(gè)

15、 m ´ m 階的稀疏對(duì)稱矩陣,Wn和 j 的權(quán)重值,如果不為了消除任意縮放因子 ,加 入限制約束條件YDY = 1 ,那么,求解最小化目標(biāo)函數(shù)的轉(zhuǎn)移矩陣 A 問題就可以轉(zhuǎn)化為求解廣義特征值中的最小特征值問題來解決:Ytes(t m1,:) Y(m,:); End for3.4隨機(jī)森林隨機(jī)森林是一種基于模型聚合思想類器,由 L.Breiman 在 2001 年時(shí)對(duì)樣本進(jìn)行訓(xùn)練和單的決策樹XLX A = XDX A(3)根據(jù)求解的最小特征值 1 2 d 得到相應(yīng)的特征xi Ò yi = A xi A = (a1 a2 ad )式中,yi 是一個(gè) d 維的局部保持投影算法的缺陷

16、是在對(duì)選擇局部鄰域包含的樣本個(gè)數(shù)時(shí)不能自適應(yīng),并且領(lǐng)域圖容易因?yàn)樵肼?的影響發(fā)生改變 0 。稀疏局部保持投影將局部保持和稀疏性兩者有效地結(jié)合,它通過在 LPP 算法中引入 L1(4)式中,k 是類結(jié)果。隨機(jī)森林算法結(jié)合了思想和bagging 技術(shù)。目前已經(jīng)證明了,當(dāng)處理很多特征冗余問題時(shí),隨機(jī)子空間選取的效果往往比 bagging42016,52(23)Computer Engineering and Applications 計(jì)算機(jī)工程與應(yīng)用的要優(yōu)秀 8 。這類算法也具有一些其他的重要特征,例如:內(nèi)部錯(cuò)誤估計(jì)、強(qiáng)度、變量重要性和相關(guān)性等。隨機(jī)森林目前在很多不同的領(lǐng)域都展現(xiàn)出了它的4 實(shí)驗(yàn)4.

17、1 數(shù)據(jù)分析實(shí)驗(yàn)的數(shù)據(jù)來自于公開UCI 的機(jī)器學(xué)習(xí)知識(shí)強(qiáng)大功能。RF 良表現(xiàn)性能與每棵樹的質(zhì)量相關(guān),庫,HAR 數(shù)據(jù)集機(jī)上傳感器數(shù)據(jù),的是SamsungGalaxy SII 智能手感器和陀螺與森林中的樹的相關(guān)性小 9 。這里,定義的樹之間的相關(guān)性為OOB樣本的每次抽樣后會(huì)出現(xiàn)接近 1/3 的袋外數(shù)據(jù)OOB,OOB 樣本是觀察值的集合,并不用于建立現(xiàn)在的樹,在文獻(xiàn)20-22 中,作者都建議可以用 OOB error 作為泛化誤差估計(jì)的一個(gè)重要組成部分,并且文獻(xiàn)20通過經(jīng)驗(yàn)性實(shí)例證明OOB 錯(cuò)誤估計(jì)與相同訓(xùn)練集一樣容量的測試集得到的精度一樣,這也說明袋外數(shù)據(jù)(OOB)誤差估計(jì)是一種可以取代測試集的

18、誤差估計(jì)3.5 基于隨機(jī)森林的人類行為識(shí)別在隨機(jī)森林重要參數(shù)以及一個(gè)最終的示的是每次分割時(shí)隨機(jī)選擇輸入變量的數(shù)目,mtry 數(shù)目越大,模型中每棵決策樹強(qiáng)度越大,本文實(shí)驗(yàn)設(shè)置的mtry 數(shù)目 sqrt(size(Xtrain 2) ;ntree 表示的是樹的數(shù)目,它決定了模型中集成的決策樹數(shù)目,ntree 越大,模型收斂性越好,本文實(shí)驗(yàn)設(shè)置的 ntree500。最終的h30 名志愿者被要求樓梯、下樓梯、坐、站、的皮帶上,第二次對(duì)內(nèi),分別嵌有信號(hào)的預(yù)處理采樣(128上 放在左側(cè)環(huán) 器和陀螺儀傳感器,收集到的窗口以及 50%的重疊。最后,通(均值、標(biāo)準(zhǔn)差、信號(hào)幅度、熵以及信號(hào)對(duì)相關(guān)性等)。每描述,并

19、且對(duì)數(shù)據(jù)進(jìn)行標(biāo)機(jī)地將 70%的數(shù)據(jù)集用于訓(xùn)練,30%用于測試。(a)坐(b)站åiK (x) = arg maxI (k(x) = Y )(6)Yi 1表示了隨機(jī)森林定最終的個(gè)決策樹在傳感器數(shù)據(jù)進(jìn)行特征約簡的基礎(chǔ)下,新的特征子 集用于隨機(jī)森林的(1) 給定訓(xùn)練數(shù)據(jù)集 Xtrain ,訓(xùn)練數(shù)據(jù)集 Xtest ,測試(2) 從訓(xùn)練數(shù)據(jù)集 Xtrain 中有放回隨機(jī)采樣出m個(gè)樣本,作為決策樹的輸入樣本。(3) 從 Xtrain 特征數(shù)中隨機(jī)選擇出sqrt(size(Xtrain 2)個(gè)特征子集,作為每一個(gè)結(jié)點(diǎn)的輸入變量。(4) 以 sqrt(size(Xtrain 2) 個(gè)特征的最優(yōu)該結(jié)點(diǎn)

20、的(5) 隨機(jī)森林中的每棵樹的完全生長過程,不需要剪枝。(6)個(gè)測試樣本 Xtest 進(jìn)行投票測試數(shù)據(jù)集了最后的輸出。(7) 識(shí)別率計(jì)算,通過本的Ytest 得到每類行為的最終識(shí)別率。(c(e)下樓梯(f)上樓梯圖2 人類日常行為示例圖值得注意的是,本文的實(shí)驗(yàn)設(shè)的活動(dòng)類別者進(jìn)本文的實(shí)驗(yàn)只選用了較為基礎(chǔ)的6 項(xiàng)人類行為活動(dòng)。:基于智能傳感器數(shù)據(jù)的人類行為識(shí)別研究2016,52(23)54.2實(shí)驗(yàn)結(jié)果分析本文的實(shí)驗(yàn)是對(duì)數(shù)據(jù)先進(jìn)行降維處理后再運(yùn)20 00用器識(shí)別。如圖3,同樣的經(jīng)過比圖可以 的識(shí)別率都到了非常高的器,進(jìn)行了數(shù)據(jù)60 00顯地看到,原來因40 00為者佩戴移動(dòng)的物理位置不同,站是最難識(shí)

21、別出的活動(dòng)高了13.54%。站實(shí)驗(yàn)結(jié)果對(duì)比圖躺0 00SpLPP-R RF00%98 8700 0097 34%影結(jié)合隨機(jī)森林類的一些普遍行為,并且證的有效性。SpLPP 算法可以非常專業(yè)地處儀傳感器數(shù)的9 0%90 0080 00于其他的單一器,高效70 00躺站坐下樓梯上樓梯走圖3 數(shù)據(jù)降維前后行為識(shí)別率對(duì)比圖文算法已經(jīng)取得了高性能的表現(xiàn),但于未來的實(shí)驗(yàn)研究,還有很多需要做的:在 SpLPP約簡的過程中,時(shí)間復(fù)雜度相對(duì)較高,還有一本文運(yùn)用的SpLPP 特征約簡算法思想源自龍的文章 6 。基于SpLPP 降維后,特征數(shù)量由 561 降到了 84。為了評(píng)估SpLPP 算法的表現(xiàn),還在同樣的 HAR 數(shù)據(jù)以及相同的隨機(jī)森林他們的法有:SpLPP(84)、RFIM(132)、PCA(118)和 L

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論