基于核函數(shù)的fisher鑒別分析的故障特征提取方法_第1頁
基于核函數(shù)的fisher鑒別分析的故障特征提取方法_第2頁
基于核函數(shù)的fisher鑒別分析的故障特征提取方法_第3頁
基于核函數(shù)的fisher鑒別分析的故障特征提取方法_第4頁
基于核函數(shù)的fisher鑒別分析的故障特征提取方法_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基于核函數(shù)的fisher鑒別分析的故障特征提取方法

基于fisher的非線性特征提取方法故障診斷和機械故障診斷的本質(zhì)是故障識別的過程。隨著設(shè)備結(jié)構(gòu)日益復(fù)雜,故障類別越來越多,反映故障狀態(tài)的特征也相應(yīng)增加。在實際診斷過程中,為了使診斷準確可靠,對于測試信號總希望通過預(yù)處理獲得盡可能多的特征參數(shù)。但是當太多的特征輸入分類器時,又會引起訓(xùn)練過程耗時費工,甚至妨礙訓(xùn)練的收斂性,最終影響分類精度。因此,有必要從故障特征集中提取對狀態(tài)敏感的特征子集,這一工作就是特征提取。特征提取方法有多種。Fisher鑒別分析(簡稱FDA)是最為常用的特征提取方法,它通過選擇使得Fisher準則函數(shù)達到極值的向量作為最佳投影方向,從而使得樣本在該方向上投影后,達到最大的類間離散度和最小的類內(nèi)離散度。該方法基于線性代數(shù)理論的線性空間變換,是一種線性特征提取方法,被稱為經(jīng)典的Fisher線性鑒別分析方法。然而,由于故障導(dǎo)致系統(tǒng)的非線性行為,再加上環(huán)境噪聲的干擾,使得線性Fisher鑒別分析提取的特征對于設(shè)備早期故障的產(chǎn)生、發(fā)展難以識別。因此,有必要研究基于Fisher鑒別分析的非線性特征提取方法。受支持向量機(簡稱SVM)和核函數(shù)主元分析(簡稱KPCA)研究的啟發(fā),Mika等人將Fisher鑒別分析推廣到非線性領(lǐng)域,通過核函數(shù)映射樣本數(shù)據(jù)到特征空間,而后用Fisher判別分析對映射樣本進行特征提取,從而得到樣本的非線性特征,并證明了基于核函數(shù)的Fisher判別分析方法(簡稱KFDA)是一種很有效的特征提取方法。需要指出的是,雖然KPCA和KFDA都是借助于核方法的思路來提取數(shù)據(jù)的非線性特征,但是KPCA提取特征時由于沒有充分考慮到類別信息,故其提取的特征的分類效果要差于KFDA所提取的特征。為此,本文提出采用核Fisher判別分析方法對航空發(fā)動機中應(yīng)用普遍且容易損壞的機械零件——滾動軸承進行特征提取,期望能準確、有效地判斷軸承的工作狀態(tài)。文中首先系統(tǒng)介紹核Fisher判別分析方法,然后著重討論此方法在故障特征提取中的應(yīng)用,并對核Fisher鑒別分析、核主元分析及線性Fisher鑒別分析三種方法提取的特征進行了比較。1核fisher的鑒別首先在Fisher鑒別函數(shù)的基礎(chǔ)上,給出核Fisher鑒別準則函數(shù)的一般形式;然后介紹基于該準則的核Fisher鑒別分析方法;最后通過該方法提取非線性特征。1.1特征空間h中的外積算子原始樣本X經(jīng)過非線性映射Φ后對應(yīng)的樣本向量為Φ(X)∈H,則高維特征空間H中訓(xùn)練樣本的類內(nèi)離散度SΦw=1nSΦw=1np∑i=1nj∑j=1(Φ(Xij)-mΦi)(Φ(Xij)-mΦi)T(1)類間離散度為SΦb=p∑i=1njn(mΦi-mΦ0)(mΦi-mΦ0)Τ(2)總離散度為SΦt=SΦw+SΦb=1nn∑j=1(Φ(Xj)-mΦ0)(Φ(Xj)-mΦ0)Τ(3)其中:Φ(Xij)(i=1,…,p;j=1,…,nj)為高維特征空間H中第i類第j個訓(xùn)練樣本;Φ(Xj)(j=1,…,nj)為高維特征空間H中第j個訓(xùn)練樣本;mΦi=E{Φ(X)|ωi}為特征空間H中第i類訓(xùn)練樣本的均值;mΦ0=p∑i=1P(ωi)mΦi為特征空間H中所有訓(xùn)練樣本的均值。特征空間H中Fisher鑒別準則函數(shù)定義為J(v)=vΤSΦbvvΤSΦwv(4)其中:v為任一非零向量。KFDA就是通過最大化鑒別函數(shù)式(4),找到一組最佳鑒別向量構(gòu)成投影矩陣W,樣本在投影矩陣W上的投影作為提取的特征。由于特征空間H的維數(shù)非常高,甚至是無窮維的,直接顯式計算求解是不可能的,必須對式(4)進行變換,使它只包含映射后樣本的內(nèi)積運算〈Φ(X),Φ(Y)〉,這樣就可以利用SVM中的核方法進行有效計算。根據(jù)再生核理論,任何一個最優(yōu)化準則函數(shù)式(4)的解向量v一定由高維特征空間H中的所有訓(xùn)練樣本Φ(X1),…,Φ(Xn)張成的空間內(nèi)v=n∑i=1αiΦ(Xi)=Φα(5)其中:Φ=(Φ(X1),…,Φ(Xn));α=(α1,…,αn)T∈Rn。為方便起見,也稱式(5)中α為對應(yīng)于特征空間H中最佳鑒別向量v的最佳核鑒別向量。將式(5)和SΦw及SΦb代入式(4),經(jīng)過一系列的矩陣變換,則有vΤSΦbv=αΤΚbα(6)vΤSΦwv=αΤΚwα(7)其中:Kb=p∑i=1njn(μi-μ0)(μi-μ0)Τ;Κw=1np∑i=1nj∑j=1(ξXij-μi)(ξXij-μi)T。在此ξXij=(k(X1,Xij),?,k(Xn,Xij))Τμi=[1nini∑k=1Φ(XΤ1)Φ(XΤk),?,1nini∑k=1Φ(XΤn)Φ(XΤk)]Τ由式(2)可知,對應(yīng)于原始樣本X∈Rn的核樣本向量為ξX=(k(X1,X),?k(Xn,X))Τ(8)其中:k(·,·)即為選取的內(nèi)積核函數(shù)。由式(6)和式(7)可知,高維特征空間中Fisher鑒別函數(shù)式(4)等價于J(v)=vΤSΦbvvΤSΦwv=αΤΚΦbααΤΚΦwα=J(α)(9)即J(α)=αΤΚΦbααΤΚΦwα,(10)其中:α為任一n維非零列向量。式(10)即為核Fisher鑒別準則函數(shù)。1.2最佳核鑒別向量vi由上節(jié)的推導(dǎo)過程,若α1,α2,…,αd是最優(yōu)化式(10)得到的最佳核鑒別向量,則特征空間H最佳鑒別向量集構(gòu)成的投影矩陣W=(v1,?,vd)(11)其中:vi=n∑k=1αkiΦ(Xk)=Φαi,i=1,2,…,d?,F(xiàn)在問題的關(guān)鍵是如何確定最優(yōu)化式(10)的一組最佳核鑒別向量。由于式(10)即核Fisher鑒別準則函數(shù)是關(guān)于矩陣Kb和Kw的廣義Rayleigh商,根據(jù)廣義Rayleigh商的極值性質(zhì),一組最佳核鑒別向量α1,α2,…,αd就取為廣義特征方程Kbα=λKwα的d個最大的特征值所對應(yīng)的特征向量,再由式(11)就得到特征空間H的最佳鑒別向量集構(gòu)成的投影矩陣,到此即完成了核Fisher鑒別分析。1.3基于kfda的特征提取在求得特征空間H中的一組最優(yōu)鑒別向量為v1,v2,…vd后,對于任意一個原始樣本X,它的非線性最優(yōu)鑒別特征為Τ=(v1,v2,??vd)ΤΦ(X)=WΤΦ(X)=(t1,t2,?td)Τ(12)其中:ti=αTiξx(i=1,2,…,d);ξx為原始樣本的核樣本向量。綜上所述,基于KFDA的特征提取步驟如下:(1)選擇合適的核函數(shù)k(·,·),通過求解廣義特征方程,得到d個最大的特征值對應(yīng)的一組最佳核鑒別向量α1,α2,…,αd;(2)按式(11)計算最佳鑒別向量v1,v2,…,vd;(3)按式(12)計算映射數(shù)據(jù)在最佳鑒別向量方向上的投影,該投影即為原始樣本X的非線性最優(yōu)鑒別特征t1,t2,…td。2滾動軸承故障診斷在航空發(fā)動機中,滾動軸承是最普通、最容易損壞的機械零件之一,其運行狀態(tài)是否正常往往直接影響到整臺發(fā)動機的安全。但由于滾動軸承工作環(huán)境的特殊性,在故障早期難以發(fā)現(xiàn),因此,滾動軸承的工況監(jiān)視與故障診斷越來越引起國內(nèi)外工程技術(shù)人員的重視。滾動軸承在線監(jiān)測一般通過對能夠反映其工作狀態(tài)的特征信號進行觀測、分析與處理。從一定程度上說,軸承故障診斷就是軸承狀態(tài)識別,其中最關(guān)鍵的是觀測信號的特征提取方法及狀態(tài)識別方法。在滾動軸承的監(jiān)測及故障診斷中,最常用的方法是振動信號分析法,但在滾動軸承故障初期,由于缺陷比較微弱(如點蝕初期、剝落點、微小裂紋等),所導(dǎo)致的微弱振動沖擊信號常常淹沒在強背景噪聲中,并且隨著故障的發(fā)展常常導(dǎo)致軸承振動信號發(fā)生非線性行為,其故障特征具有較強的非線性。而振動信號的原始特征(共有12個,如陡度、峭度等)形式較簡單,但不能有效反映微弱的、非線性的故障信息。通過特征提取則可以較好地解決這個難題。2.1軸承振動信號分析采用鋼圈6204型滾珠軸承實測數(shù)據(jù),分別采集到整體無故障(正常)、外圈徹底損壞(故障1)、支架破壞且1個滾動體松動(故障2)、支架嚴重破壞且4個滾動體松動(故障3)、嚴重磨損但無明顯損壞(故障4)這5種狀態(tài)下運行時的振動加速度信號,每種狀態(tài)有12組數(shù)據(jù)。數(shù)據(jù)采集系統(tǒng)采用B&K分析儀,測量頻率為24.5624Hz,采樣頻率為16384Hz,最低頻率為0.7Hz,每組采樣2048個點。描述軸承工作狀態(tài)的指標眾多,選擇了12個常用的統(tǒng)計指標構(gòu)成軸承狀態(tài)原始特征集。它們分別是振動信號的最大峰值Xmax、最小值Xmin、絕對均值ˉX、有效值Xr、均方值Xrms、方差Dx、斜度α、峭度β及指標峰值因子Cf、波形因子Sf、脈沖因子If和裕度因子CLf,計算以上特征參數(shù)時應(yīng)做零均值處理。這些參數(shù)主要由時域特征和幅域特征構(gòu)成,沒有考慮頻域特征,這是因為本文主要目的在于分析軸承振動狀態(tài)與工作模式的對應(yīng)關(guān)系,而不是分析其狀態(tài)發(fā)生變化的原因。下面就以上述12個指標作為原始特征,利用KFDA方法進行特征提取。2.2特征提取從采集的原始數(shù)據(jù)中產(chǎn)生訓(xùn)練樣本集,以每種狀態(tài)的12組數(shù)據(jù)共60組作為訓(xùn)練數(shù)據(jù),用KFDA進行特征提取。KFDA中的核函數(shù)采用具有較強非線性的徑向基函數(shù),參數(shù)σ取值采用5層Cross-Validation方法進行優(yōu)選。為了比較特征提取的效果,本文還同時采用線性FDA,KPCA方法進行特征提取。KPCA方法也是采用徑向基函數(shù)。2.3特征集的確定這一節(jié)從樣本集的可分性和分類器的分類性能兩方面來考察KFDA方法提取特征的效果。為便于比較,定義下列3種不同的特征集:特征集1:KFDA對12個原始特征進行提取所得到的4個新特征KFD1,KFD2,KFD3,KFD4。特征集2:FDA對12個原始特征中進行提取所得到的4個新特征FD1,FD2,FD3,FD4。特征集3:KPCA對12個原始特征中進行提取所得到的4個新特征KPC1,KPC2,KPC3,KPC4。2.3.1特征集可分性分析為了證明本文提出的KPCA特征提取方法的有效性,對以上特征樣本集的可分性進行對比分析。首先定義平均類間可分性參數(shù),它是用來度量給定特征樣本集的可分性大小ρ=1s(s+1)s-1∑i=1s∑j=i+1(1-exp{-dijri+rj})(13)其中:s為模式類別數(shù);dij為第i類模式與第j類模式間的類內(nèi)距離;ri和rj分別為第i和j類模式中樣本距模式中心的最大距離,即為容納本類樣本的最小球體的半徑。圖1為4種特征集的可分性參數(shù)對應(yīng)不同特征維數(shù)的可分性變化曲線。從圖1可看出,KFDA提取的特征集可分性最高,其次為KPCA和FDA提取的特征集,原始特征集的可分性最小。進一步觀察可發(fā)現(xiàn),KFDA提取的特征集可分性隨著特征維數(shù)的增加而基本保持不變,而原始特征集的可分性受特征維數(shù)的影響最大,說明KFDA很好地提取了類別可分信息,最大程度地提高了樣本的可分性。為了更直觀地看到不同特征樣本集的可分性大小,把特征樣本進行歸一化處理,然后投影到2維平面顯示。圖2至圖5依次是原始特征集、FDA提取的特征集1、KPCA提取的特征集2和KFDA提取的特征集3在2維平面的投影效果。經(jīng)比較可知,圖2中的5種工作狀態(tài)重疊嚴重,可分性較差,相應(yīng)的可分性參數(shù)值就比較低;圖3中的故障2、故障3和故障4的3種狀態(tài)重疊較嚴重,可分性較差;圖4中的故障2、故障3的2種狀態(tài)重疊較嚴重,可分性較差;圖5中的5種工作狀態(tài)基本沒有重疊,可分性較好。因此,相應(yīng)的KFDA提取的特征的可分性參數(shù)值就較高。由上述比較可知,KFDA提取的特征效果最好,其次為KPCA和FDA,原始特征的效果最差。原因分析:FDA提取的是線性特征,它并不能很好地區(qū)分具有非線性特征的軸承故障狀態(tài),而KPCA和KFDA兩種非線性特征提取方法提取的特征相對來說效果更好。進一步分析可以發(fā)現(xiàn),由于故障2和故障3性質(zhì)相同,只是故障的嚴重程度不同,所以KPCA提取的特征對這兩類樣本的差異不敏感,其原因是KPCA提取特征的分類能力受數(shù)據(jù)結(jié)構(gòu)影響較大。而KFDA是從分類的角度出發(fā)提取特征,因此提取的是有利于分類的特征信息,對5種狀態(tài)的樣本數(shù)據(jù)都比較敏感,區(qū)分最好。2.3.2特征提取的敏感性測試根據(jù)分類器的分類性能來驗證本文特征提取方法的有效性。由于訓(xùn)練和測試樣本數(shù)較少,為了更準確地估計分類器的分類性能,這里采用交叉檢驗的方法對分類正確率進行估計。首先將60個樣本分成若干組,每組n個樣本,每次只取其中的一組樣本作測試,其余各組均作訓(xùn)練用,當這次訓(xùn)練和測試完后用另一組樣本作測試,而其余組樣本用于訓(xùn)練。反復(fù)進行直到每一組都測試過。如果每次測試中有mi個樣本被判正確,則正確率估計為?Ρ=n100100/n∑i=1min(14)本文取n=10,分類器采用一對多支持向量機分類器,核函數(shù)選用徑向基函數(shù)。為了考察采用不同方法提取的特征向量集對支持向量機核函數(shù)參數(shù)的敏感性,SVM取2組參數(shù)設(shè)置SVΜ1:σ=0.25,C=100;SVΜ2:σ=1,C=100。表1為4種方法提取的特征分類正確率比較結(jié)果。由表1的對比可以看出,采用KFDA特征提取的多類支持向量機的分類效果遠遠優(yōu)于直接使用原始特征的多類支持向量機,也要好于KPCA和FDA的特征提取的多類支持向量機的分類效果。另外,從支持向量機的分類正確率來看,使用KFDA提取的2維特征就能達到滿意的分類識別效果,有效地實現(xiàn)了特征維數(shù)的壓縮。當支持向量機核函數(shù)參數(shù)改變時,直接使用原始特征的多類支持向量機的分類效果明顯下降,采用FDA和KPCA特征提取的分類效果也有所下降。而采用KFDA特征提取的多類支持向量機的分類效果無明顯變化,說明采用KFDA提取的特征對支持向量機

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論