基于svm的軸承故障特征選擇方法研究_第1頁
基于svm的軸承故障特征選擇方法研究_第2頁
基于svm的軸承故障特征選擇方法研究_第3頁
基于svm的軸承故障特征選擇方法研究_第4頁
基于svm的軸承故障特征選擇方法研究_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

基于svm的軸承故障特征選擇方法研究

在機械故障診斷中,由于診斷對象的復雜性,故障特征和故障類別之間的對應關系尚不清楚。人們提出使用多個原始特征來識別故障。但受分類器規(guī)模、訓練過程的復雜性以及計算機容量等諸多因素的制約,往往不能取得良好的效果。為了提高識別精度,在設計分類器前,必須去除兩類冗余特征:(1)與分類目標無關的特征;(2)與其他特征量有較高相關性的特征,即從一組維數(shù)為N的特征中選擇出維數(shù)為n(N>n)的一組最優(yōu)特征子集來,使得分類錯誤率最小。特征選擇需要解決兩個問題,一是選擇的標準,即特征的評價準則,二是采用何種尋優(yōu)方法來解決這一組合問題。診斷結果的直接表現(xiàn)來源于決策分類的錯誤,即決策分類的錯誤率越大,診斷能力越差。所以使分類錯誤率最小的那一組特征就是最好的特征。但在實際應用中,特征與類條件分布密度是不知道的,理論上無法直接計算學習錯誤率。一般采用分組輪換法(Cross-Validation)來估計學習錯誤率,但是需要多次訓練分類器,然后對計算的結果取均值,計算量很大。支持向量機(SupportVectorMachine)是在90年代出現(xiàn)的新的、有效的分類器,它已經(jīng)應用到許多領域,如模式識別、數(shù)據(jù)挖掘、特征選擇等。支持向量機基于結構風險最小化原則,它可以克服維數(shù)災難問題,可以在有限樣本的基礎上取得良好的分類效果,所以目前得到越來越多的應用。在本文中采用SVM作為分類決策器,并且采用SVM學習錯誤率的理論上界代替學習錯誤率作為SVM性能的評價,這只需要訓練一次SVM,因而它的計算效率要高于分組輪換法,而且可以避免錯誤率估計中多次訓練樣本出現(xiàn)的過擬合問題,尋優(yōu)結果相對比較穩(wěn)定。1svm的算法支持向量機是通過將低維的輸入空間數(shù)據(jù)x∈Rn通過非線性映射函數(shù)映射到高維屬性空間H,映射記為x→Φ(x)∈H,在此高維空間找到最優(yōu)分類超平面。這種映射是通過核函數(shù)實現(xiàn)的,它定義了H空間的內(nèi)積。在找到最優(yōu)分類平面的過程中,在高維空間實際上只需要進行內(nèi)積運算,這種內(nèi)積運算是可以用原空間中的函數(shù)實現(xiàn)的,甚至沒有必要知道變換的具體形式。因此,在最優(yōu)分類面中采用適當?shù)膬?nèi)積核函數(shù)K(xi,x)就可以實現(xiàn)從低維空間向高維空間的映射,從而實現(xiàn)某一非線性變換后的線性分類,而計算的復雜度卻沒有增加。設給定的訓練集為{(xi,yi)}1≤i≤l,其中樣本xi∈Rn,它所屬于的類別yi∈{-1,1},采用的核函數(shù)為K(xi,x),SVM分類算法可歸結為下列二次規(guī)劃問題:min12∥w∥2+Cl∑i=1ξis.t.yi(w?Φ(xi)+b)-1+ξi≥0(1)式中:ξi≥0為松弛項,表示錯分樣本的懲罰程度;C為常數(shù),用于控制對錯分樣本懲罰的程度,實現(xiàn)在錯分樣本數(shù)與模型復雜性之間的折衷;w和b為判決函數(shù)中的權向量和閾值。當無錯分樣本時,最小化目標函數(shù)的第一項等價于最大化兩類間的間隔,可降低分類器的VC維,實現(xiàn)結構風險最小化原則。上述二次規(guī)劃的對偶形式為{maxQ2(α)=l∑i=1αi-12l∑i,j=1αiαjyiyjΚ(xi?xj)s.t.l∑i=1αiyi=00≤αi≤C,i=1,2,?,l(2)式中:αi為Lagrange乘子。利用式(3)得到αi的優(yōu)化值α*i,最后得到SVM決策函數(shù)為f(x)=w?Φ(x)+b=∑iα?iyiΚ(xi,x)+b(3)對決策分類器的性能估計一般采分組輪換法估計它的分類錯誤率得到。對于SVM,這些方法的計算量很大,效率較低。對于支持向量機存在已被證明的關于錯誤上界的描述,包括支持向量數(shù)上界、Opper-Winther上界、Jaakkola-Haussler上界、半徑-間距(Radius-Margin,簡稱RM界)上界和跨距上界等5種。對其進行比較后認為,RM界的計算容易實現(xiàn)和控制,且最小化RM界也能得到相當好的結果,因此在實際應用中推薦使用RM界。其定理和計算公式如下所述。定理:設ρ為最大的分類間隙,Φ(x1),…,Φ(xl)為訓練特征樣本在高維空間的映射,所有映射都包含在一個最小的半徑為R的超球內(nèi)。假設α*為式(2)所求得的α值。如果高維映射在R中以間隙ρ為可分的,則期望錯誤概率EPerr存在上界為EΡerr≤1lE(R2ρ2)=1lE{R2Q2(α*)}(4)R2可通過下式計算得到{R2=maxβl∑i=1βiΚ(xi,xj)-l∑i,j=1βiβjΚ(xi,xj)s.t.l∑i=1βiyi=0βi≥0,i=1,2,?,l(5)式(5)計算還比較繁瑣,為簡化計算,提高運算效率,R2的近似值可通過下式計算得到R2≈1ll∑i=1Κ(xi,xj)-1l2l∑i,j=1Κ(xi,xj)(6)即在式(5)中令βi=1/l得到。因為從式(2)得到α*只需對全體樣本進行訓練SVM一次就可得到,相比分組輪換法需要多次訓練SVM,可以減少訓練時間,提高選擇效率。在多故障情況下,可以計算每對故障類別間的上界求其和作為總的上界。2特征算子法特征選擇是一個典型的組合優(yōu)化問題。從一組維數(shù)為n的原始特征中選擇特征子集,共有2n種子集。當n較大時,這是非常大的數(shù)目。本文采用遺傳算法尋優(yōu)特征子集,因為遺傳算法具有強大的并行模式空間搜索能力,可以收斂到全局最優(yōu)解。遺傳算法的優(yōu)化實施過程基本類似,不同的是針對問題的具體編碼方式和適合度函數(shù)的實現(xiàn)過程。在此選擇問題中,染色體的編碼方式采用二進制,令特征子集x為染色體位串,如果x的第i位為1,則此特征被選中;如果為0,則此特征未被選中,x的位數(shù)為總的特征維數(shù)N。特征子集的適合度采用RM上界,即適合度函數(shù)為f(x)=EΡerr(x)=1lE{R2Q2(α*)}(7)3基于svm特征選擇仿真樣本集有兩類樣本組成,各有50組樣本,原始特征集維數(shù)為8,其中前2個特征是有效的分類特征,可以由一個線性超平面分開。第三個特征為前2個特征的相關特征,后5個特征量的取值為0與1間的隨機數(shù),不含有任何分類信息。即原始特征集同時含有兩類冗余特征量。對于此特征數(shù)據(jù),采用基于SVM特征選擇方法進行選擇。為簡化計算,選擇了RBF核函數(shù),相應的參數(shù)σ=1,即核函數(shù)為K(xi,xj)=exp(-‖xi-xj‖2/2)。設置遺傳算法的初始種群數(shù)為10,雜交率為0.9,變異概率為0.09,迭代次數(shù)為20。懲罰參數(shù)C為10。圖1特征選擇過程中適合度隨遺傳代數(shù)的變化趨勢。圖2為特征隨遺傳代數(shù)的發(fā)展情況。由圖1,圖2看出經(jīng)過12次遺傳迭代,找到優(yōu)化子集,它包含兩個特征1,2。這與仿真設定是相吻合的,所以此方法有良好的選擇有效特征的性能。4振動加速度傳感器的安裝為驗證此特征選擇算法的有效性,對某直升機減速器滾珠軸承故障數(shù)據(jù)進行了分析。該組數(shù)據(jù)在減速器試車臺測得,振動加速度傳感器安裝在中減速器表面。軸的額定旋轉(zhuǎn)頻率為58.25Hz,選定采樣頻率為10kHz。根據(jù)直升機的工作狀況,對5種工作狀況下的減速器進行了試驗,每種工況10次重復采樣,對軸承的3種狀態(tài)即:正常、滾子點蝕和外環(huán)剝落進行了采樣,得到150個樣本,每種狀態(tài)50個樣本。4.1振動信號的處理數(shù)據(jù)預處理的目的從原始振動信號中提取特征。對軸承數(shù)據(jù)分別從時域統(tǒng)計、常規(guī)譜分析和小波變換生成特征。(1)時域統(tǒng)計。在時域,選取無量綱參數(shù)斜度因子、峭度因子、峰值因子、波形因子、脈沖因子和裕度因子為特征參數(shù)。這些特征參數(shù)的計算方法參見文獻。選取無量綱指標的目的在于最大限度的減小工況參數(shù)帶來的影響。(2)常規(guī)譜分析。診斷監(jiān)測最經(jīng)典的方法是譜分析法,采用常規(guī)譜分析的給定頻帶范圍的功率累積與總功率累積的比值為特征輸入。給定頻帶的功率累積為Gi=∫fifi-1s(f)df(8)總功率累積為G=∫fΝ0s(f)df(9)式中:s(f)為功率譜密度函數(shù);fi代表第i個頻帶頻率上限;N為頻帶數(shù)。選取N=32,即各頻帶寬為156.25Hz,由低到高分布,如頻帶1的范圍為0~156.25Hz,頻帶2的范圍為156.25Hz~312.5Hz,依次類推。分別為計算出各頻帶的相對能量比值,即Gi=Gi/G。由此生成32個特征。(3)小波包變換。由于減速器工作時,引起其振動的因素很多,通過安裝在減速器上的振動傳感器所拾取的振動信號是非常復雜的寬帶信號。本文采用小波包分解的方法來進行信號預處理。對信號經(jīng)過小波包5層分解后,可以得到N=32個特征頻帶的小波包系數(shù),各頻帶設置同常規(guī)譜分析。然后利用小波包能量譜的方法來得到原始特征。在小波包能量譜中,可以選取各個頻帶內(nèi)信號的平方和作為能量的標志。對于第i個頻帶,小波包變換結果用序列{ωi(k),k=1,2,…,M}表示,其中M為該頻帶的樣本長度。由于小波包分解后的各頻帶寬度相同,因此利用小波包分解的結果作為能量譜的輸入,則各頻帶的能量為Gi=∑k=1Μ|ωi(k)|2,令G=∑i=1ΝGi,可以計算出各頻帶的相對能量比值,即Gi=Gi/G,作為故障樣本特征,由此又得到32個特征。4.2試驗結果及分析經(jīng)過預處理,最后產(chǎn)生(6+32+32)=70個原始特征,對特征數(shù)據(jù)采用基于支持向量機的特征選擇。同仿真一樣核函數(shù)選擇RBF核函數(shù),參數(shù)σ=1。為了說明基于RM界特征選擇的優(yōu)越性,把它和傳統(tǒng)的分組輪換法估計錯誤率的方式相比較。分組輪換法把樣本分為5組進行估計錯誤率。遺傳算法的初始設置相同,初始種群數(shù)為50,雜交率為0.9,變異概率為0.09,最大迭代數(shù)為50。為考察懲罰系數(shù)C對選擇結果的影響,初步給出C取不同值時選擇結果的變化。懲罰參數(shù)C分別取0.01,0.1,1,10,100。圖3為采用RM界(懲罰系數(shù)C=10)的特征選擇過程中,遺傳算法適合度隨遺傳代數(shù)的變化趨勢,可以看出遺傳算法有較好的尋優(yōu)性能,大約經(jīng)過40次迭代,找到優(yōu)化子集。最后的試驗結果如表1所示。從表1中可以看出,基于分組輪換法的特征選擇結果不太穩(wěn)定,原因是對樣本多次訓練可能導致過擬合問題。而基于RM界的選擇則相對穩(wěn)定。參數(shù)C對基于RM界的選擇結果幾乎沒有影響,參數(shù)C對基于分組輪換法的選擇有所影響,但影響不大。另一方面是基于RM界相對基于分組輪換法的特征選擇可以大大節(jié)省計算時間,效率提高近6倍。5基于支持向量機的特征選擇方法,主要來源于受精于和受教育系統(tǒng)的支持向量機特征,其特

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論