基于粗糙集的故障診斷特征提取-_第1頁
基于粗糙集的故障診斷特征提取-_第2頁
基于粗糙集的故障診斷特征提取-_第3頁
基于粗糙集的故障診斷特征提取-_第4頁
基于粗糙集的故障診斷特征提取-_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、1引言隨著設備結(jié)構日趨復雜,其故障類別越來越多,反映故障的狀態(tài)、特征也相應增加。在實際診斷過程中,為了使診斷準確可靠,總要采集盡可能多的數(shù)據(jù)樣本,以獲得足夠多的信息。但是,數(shù)據(jù)樣本的分類邊界常常是不確定的,并且故障與征兆之間的關系往往也是不確定的。因此,需要進行故障特征提取,從數(shù)據(jù)樣本中提取對診斷故障貢獻最大的信息。故障特征提取的方法受到了廣泛的重視。研究成果很多1,2。有主元特征提取,基于人工神經(jīng)網(wǎng)絡的提取,模糊信息優(yōu)化處理提取及基于互信息熵提取方法等。但是,主元特征提取會因為輸入變量的變化而改變主分量的特征值計算結(jié)果;當特征輸入太多時,基于人工神經(jīng)網(wǎng)絡的方法存在耗時費工以及合適的網(wǎng)絡結(jié)構選

2、取問題;模糊信息優(yōu)化處理和基于互信息熵的方法需要預先確定隸屬函數(shù)或數(shù)據(jù)樣本的概率分布。粗糙集(Rough Set,RS理論由波蘭的Z.Pawlak教授于上世紀80年代初提出3,被認為是處理模糊和不確定性問題的新的數(shù)學工具,近年來在人工智能界引起了極大關注。它最顯著的特點是不需要任何預備的或額外的有關數(shù)據(jù)信息,比如統(tǒng)計學中的概率分布、DS證據(jù)理論中的基本概率賦值、模糊集理論中的隸屬函數(shù)等。本文主要研究基于粗糙集理論的故障特征提取方法。首先闡述粗糙集的基本概念,然后介紹常用的連續(xù)數(shù)據(jù)樣本離散化方法,繼而在“知識的依賴性”概念和定義的基礎上,提出根據(jù)條件屬性(集對決策屬性的正域的大小來選擇屬性,進行

3、故障診斷特征提取的方法。最后,通過對熱電廠發(fā)電機組和汽車發(fā)動機兩個實例的故障診斷特征提取對該方法進行了驗證。2粗糙集的基本理論3-72.1知識表達系統(tǒng)和決策表在粗糙集理論中,知識表達系統(tǒng)S是一個四元組。S=(U, A,V,f,其中U:對象的非空有限集合,稱為論域;A:屬性的非空有限集合;V=aA"V a,V a是屬性a值域;f:U×AV是一個信息函數(shù),它為每個對象的每個屬性指定一個屬性值。設S=(U,A,V,f,A=CD,CD=!,C和D分別稱為條件屬性集和決策屬性集。具有條件屬性和決策屬性的知識表達系統(tǒng)稱為決策表。基于粗糙集的故障診斷特征提取郭小薈1,2,馬小平1GUO

4、Xiao-hui1,2,MA Xiao-ping11.中國礦業(yè)大學信息與電氣工程學院,江蘇徐州2210082.徐州師范大學計算機科學與技術學院,江蘇徐州2211161.College of Information and Electrical Engineering,CUMT,Xuzhou,Jiangsu221008,China2.College of Computer Science and Techology,XZNU,Xuzhou,Jiangsu221116,ChinaE-mail:gxhzjrGUO Xiao-hui,MA Xiao-ping.Fault diagnosis featu

5、re subset selection using rough set.Computer Engineering and Applications,2007,43(1:221-224.Abstract:Feature subset selection is of prime important for effective fault diagnosis.But the classification boundary of real fault diagnosis data sets is often ambiguous,and the relationships between faults

6、and symptoms are always uncertain.Rough set theory is a novel mathematical tool dealing vagueness and uncertainty.This paper introduces rough set theory and proposes a method for fault diagnosis feature subset selection.By two fault diagnosis examples,this paper validates the method.The results show

7、 that this method can efficiently extract the main fault features while the fault classification result is invariable.The research in this paper supplies a basis for further study of applying rough set theory in fault diagnosis.Key words:rough set theory;feature selection;fault diagnosis摘要:故障的特征提取對于

8、進行準確可靠的診斷非常重要。而實際的故障診斷數(shù)據(jù)樣本的分類邊界常常是不確定的,并且故障與征兆之間的關系往往也是不確定的。粗糙集理論是處理模糊和不確定性問題的新的數(shù)學工具。論文將粗糙集理論引入到故障診斷特征提取,提出了一種基于粗糙集的故障診斷特征提取方法。并通過兩個故障診斷實例對該方法進行了驗證。結(jié)果表明:在有效地保持故障診斷分類結(jié)果的情況下,該方法可以提取出最能反映故障的特征,從而為粗糙集在故障診斷中的深入應用打下了基礎。關鍵詞:粗糙集理論;特征提取;故障診斷文章編號:1002-8331(200701-0221-04文獻標識碼:A中圖分類號:TP271Computer Engineering

9、and Applications計算機工程與應用2007,43(12212.2不可分辨關系(Indiscernible Relation 不可分辨關系是粗糙集理論中的另一個重要概念。在決策表中,描述對象的屬性是一種不精確信息,這種不精確信息造成了對象之間是不可分辨的或不分明的,觀察這種不可分辨關系的對象正是粗糙集理論研究的出發(fā)點。S 為知識表達系統(tǒng),令P !A 定義屬性集P 的不可區(qū)分關系ind (P 為:ind (P =(x ,y U ×U|#a P ,f (x ,a =f (y ,a 如果(x ,y ind (P ,則稱x 和y 是P 不可區(qū)分的。不可分辨關系實際上是一種等價關系

10、,具有不可分辨關系的對象是屬性值完全相同的對象。符號U/P 表示不可區(qū)分關系ind (P 在U 上導出的劃分,ind (P 中的等價類稱為P 基本集。2.3上下近似、邊界和正域給定知識表達系統(tǒng)S=(U ,A ,V ,f ,對于每個子集X ,X !U和屬性子集P ,P !A ,定義兩個子集:P X=Y ind (P :Y !XP X=Y ind (P :Y X !分別稱它們?yōu)閄 的P 下近似和P 上近似。Bnd P (X =P X-P X 稱為X 的P 邊界域。Pos P (X =P X 稱為X 的P 正域。令P ,Q 為U 中的等價關系,Q 的P 正域記為Pos P (Q =X U/Q$P X

11、 。Q 的P 正域反映的是U 中所有根據(jù)分類U/P 的信息可以準確地劃分到關系Q 的等價類中去的對象集合。2.4知識的依賴性給定知識表達系統(tǒng)S=(U ,A ,V ,f ,P !A 。當k="P (Q =Pos P (Q /U 時,稱知識Q 是k 度依賴于知識P 的。2.5屬性約簡與核粗糙集中有兩個重要的概念:約簡和核。由于不涉及它們,不作介紹。3連續(xù)數(shù)據(jù)樣本的離散化粗糙集只能處理離散化數(shù)據(jù),而原始故障診斷決策系統(tǒng)中的數(shù)據(jù)往往是連續(xù)的。因此,必須先對原始故障診斷決策系統(tǒng)中的數(shù)據(jù)進行離散化處理。離散化的原則是:(1屬性離散化后空間維數(shù)盡量小,也就是每一離散化后的屬性值的種類盡量少;(2屬

12、性值被離散化后的信息丟失盡量少。下面介紹幾種常用的離散化方法7-12:(1經(jīng)驗分割法該方法是由人們憑經(jīng)驗在屬性的值域中設定斷點。(2等頻分割法、等距分割法等距離劃分、等頻率劃分法是基于統(tǒng)計基礎上的,方法簡單。(3Na #ve Scaler 算法、Semi Na #ve Scaler 算法設決策屬性已經(jīng)離散化。該算法每次只考慮一個單獨屬性下的值域,如果相鄰兩個實例所對應的決策值不同,則取相鄰兩個實例的平均值為一個斷點。依次對每個屬性進行,最后得到一個斷點集。Semi Na #ve Scaler 算法則是將由Na #ve Scaler 算法得到的斷點集作為候選集,然后對該斷點集做進一步處理。(4布

13、爾邏輯和RST 相結(jié)合的離散化算法該算法的思想是在保持信息系統(tǒng)不可分關系不變的前提下,盡量以最小數(shù)目的斷點把所有實例間的不可區(qū)分關系分開。(5自組織特征映射(SOM 網(wǎng)絡方法SOM 網(wǎng)絡對連續(xù)屬性進行離散處理,輸出層神經(jīng)元數(shù)量等于聚類數(shù)目。正確選取聚類數(shù)目非常關鍵,聚類數(shù)目少可能會得到不相容的決策系統(tǒng)(存在相互矛盾的規(guī)則,即規(guī)則的條件相同但是結(jié)論不同,導致實際應用時根據(jù)判斷條件無法做出決策;聚類數(shù)目多,會出現(xiàn)過離散情況。一般過程如下:確定數(shù)據(jù)樣本離散化后的空間維數(shù)n ;根據(jù)n 確定SOM 網(wǎng)絡的結(jié)構,建立SOM 網(wǎng)絡;訓練SOM 網(wǎng)絡;對訓練好的網(wǎng)絡,輸入需要離散化的數(shù)據(jù)樣本,網(wǎng)絡就會輸出相應

14、的分類值。(6GA 方法遺傳算法(Genetic Algorithm 是一種非常有效的搜索和優(yōu)化技術。GA 算法應用于粗糙集的連續(xù)屬性離散化處理,最主要的優(yōu)勢就是其全局尋優(yōu)能力,即將所有屬性值編碼成個體位串,得到關于所有屬性的全局離散化結(jié)構,避免了屬性局部離散獨立性所帶來的弊端。以上各種離散化方法的具體操作可以見參考文獻7-12。各種算法具有其自身優(yōu)勢,在實際應用中,通常是根據(jù)領域特點,探尋比較合適的算法。4故障特征提取方法4.1基本思想由粗糙集的基本概念可以知道,知識表達系統(tǒng)S 中,知識P ,Q 之間有依賴性。k="P (Q =Pos P (Q /U ,稱知識Q 是k度依賴與知識P

15、 的。因此,k 的大小說明了Q 對P 的依賴程度。根據(jù)知識依賴性的思想,在故障診斷特征提取時,就可以求出決策屬D 對條件屬性集C 中每個條件屬性(集C i 的依賴程度k ,并根據(jù)k 的大小進行故障特征的選擇。由k 的定義知道,k 的值是通過正域來刻畫的,因此,只需求出條件屬性(集C i 對決策屬性D 的正域,并按正域的大小進行選擇即可。同時,為了保證選擇出來的特征屬性集合F 對決策屬性D 的分類能力保持不變,可以先求出條件屬性集C 對決策屬性D 的正域Pos C (D 。這樣,在進行故障特征選擇時,求出故障特征集F 對決策屬性D 的正域Pos F (D ,并判斷是否等于Pos C (D 。4.

16、2故障特征提取方法下面給出根據(jù)條件屬性(集對決策屬性的正域的大小來選擇屬性,進行故障診斷特征提取的方法。過程如下:(1建立原始故障診斷決策表A ;(2根據(jù)實際問題的特點,選擇一種離散化的方法,進行連續(xù)屬性離散化和(或定性屬性的離散化,得到離散化的故障診斷決策表B ;(3計算條件屬性集C 對決策屬性D 的正域Pos C (D 。(4計算表B 中每個屬性對決策屬性D 的正域,并按照正域的大小降序排序,形成屬性集C ,同時需要記下每個屬性的正域的大小。(5設故障特征子集為F=;(6從屬性集C 中選擇當前正域最大的屬性a ,計算Pos F a (D ,當Pos F a (D =Pos C (D 時,F

17、=F a ,C =C -a ,轉(zhuǎn)入(8。如果不相等,則轉(zhuǎn)入(7。(7判斷屬性集C 中是否有和選取的屬性a 的正域一樣Computer Engineering and Applications 計算機工程與應用2007,43(1222序號1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24a128.3036.2018.1038.1021.2055.1028.0079.207.5026.1013.806.2036.1011.5033.1037.2040.2070.1012.408.157.2125.7071.208.11a21

18、8.3030.1010.5012.4018.7021.6037.5029.309.2011.209.7128.2026.8044.1020.5014.2033.5015.2030.2025.3035.20b12.110.810.510.751.79-1.510.41-1.31-0.02-0.75-0.81-0.01-0.61-0.81-0.79-0.810.223.82-0.380.15-0.41-0.373.81-0.81b22.561.820.350.310.311.611.751.440.00-0.92-0.72-0.04-0.01-0.93-0.85-0.87

19、-0.421.78-0.62-0.14-0.510.191.85-0.13c11.431.22-0.91-0.901.11-0.561.21-0.10-0.22-0.31-0.29-0.22-0.23-0.31-0.07-0.06-0.110.000.030.070.01-0.110.010.01c21.69-0.541.111.41-2.14-0.10-0.210.19-0.230.07-0.18-0.45-0.41-0.080.160.010.100.01-0.060.160.11FN松動松動松動松動松動松動松動松動喘振喘振喘振喘振喘振喘振喘振喘振流體激勵流體激勵流

20、體激勵流體激勵流體激勵流體激勵流體激勵流體激勵表1主軸故障診斷決策表A序號123456789101112131415161718192021222324a1234341214244343311444214a2314432114444441113414121b1433341312112111124121141b2113331112442244441444214c1441141421111112222332222c2433314412131311123232233FN111111112222222233333333表2主軸故障診斷離散化決策表B大的屬性ai ,如有一個或多個,則依次計算Pos Fa

21、i(D,并選擇PosFai (D最大的那個屬性ai,F=Fai,C=C-ai,然后轉(zhuǎn)入(6;如果沒有,則F=Fa,C=C-a,則轉(zhuǎn)入(6。(8輸出故障特征子集F。5故障診斷特征提取實例利用提出的方法提取了兩種設備的故障診斷特征。其中,熱電廠發(fā)電機組的故障診斷數(shù)據(jù)取自文獻2,汽車發(fā)動機故障診斷數(shù)據(jù)取自文獻13。5.1發(fā)電機組故障診斷特征提取熱電廠的發(fā)電機組工作中,有些故障在頻域內(nèi)分析難以區(qū)分,但在時域內(nèi)卻能收到很好的效果。如軸承松動、喘振、流體激勵等故障在頻域內(nèi)往往表現(xiàn)為連續(xù)分布的有色噪聲,難于進行頻譜特征提取。但采用時域的方差、峭度、偏斜度等參數(shù)再結(jié)合一定的分析方法就可以較好地提取特征。下面就

22、采用基于粗糙集理論的故障特征提取方法來研究如何從這6個參數(shù)中尋找最能反映故障的特征。步驟1建立原始故障診斷決策表A。表1為根據(jù)參考文獻2中的相關數(shù)據(jù)建立的原始故障診斷決策表。a1,a2,b1,b2, c1,c2分別為垂直和水平方向的方差、峭度和偏斜度,FN為故障名稱。步驟2選擇自組織特征映射(SOM網(wǎng)絡方法進行連續(xù)屬性離散化和(或定性屬性的離散化,得到離散化的故障診斷決策表B;表2為主軸故障診斷離散化決策表B。其中Va1,a2,b1,b2,c1,c2=1,2,3,4,VFN=1,2,3,軸承座松動=1,喘振=2;流體激勵=3。步驟3計算條件屬性集C對決策屬性D的正域PosC(D;U/a1=1,

23、7,10,22,2,4,13,15,16,3,5,9,11,12,14,19, 20,21,24,6,8,17,18,23;U/a2=2,7,8,15,16,17,20,22,24,6,23,1,5,18,3,4,9,10,11,12,13,14,19,21;U/b1=1,5,18,23,2,3,4,7,6,8,10,11,13,14,15,16, 19,21,22,24,9,12,17,20;U/b2=1,2,6,7,8,18,23,3,4,5,9,12,13,22,10,11, 14,15,16,17,19,20,21,24;U/c1=1,2,5,7,3,4,6,9,10,11,12,13

24、,14,8,15,16, 17,18,21,22,23,24,19,20;U/c2=1,6,7,2,3,4,11,13,18,20,23,24,5,8,10,12, 14,15,16,9,17,19,21,22;所以,U/C=1,2,3,4,518,19,20,21,22, 23,24U/D=1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17, 18,19,20,21,22,23,24可求得PosC(D=1,2,3,4,5,6,7,8,9,10,11,12,13,14, 15,16,17,18,19,20,21,22,23,24;步驟4計算表B中每個屬性Ci對決

25、策屬性的正域,并按照正域中對象元素的多少進行排序,形成屬性集C。Posa1(D=!;Posa2(D=!;Posb1(D=2,3,4,7;Posb2(D=3,4,5;Posc1(D=1,2,5,7,19,20;Posc2(D=1,6,7。于是得到屬性集C=c1,b1,b2,c2,a1,a2步驟5,6,7對于步驟5,6,7進行的過程,以表3來說明。步驟8輸出故障特征子集F。經(jīng)過步驟5,6,7,由故障特征選擇過程,可以得到故障特征子集T=c1,c2,b1。于是,就得到了在保持故障分類能力不變的前提下,最能反映故障的特征集合。具體在本問題中,由于a1,a2代表的是方差,b1,b2代表的是峭度,c1,c

26、2代表的是偏斜度,則也可以直接求出Posa1,a2(D,Posb1,b2(D,Posc1,c2(D,特征選擇的結(jié)果是一樣的。郭小薈,馬小平:基于粗糙集的故障診斷特征提取2234迭代修正然而由于地物的復雜性和影像質(zhì)量問題,Hough 算法可能會產(chǎn)生誤匹配點。所以必須對Hough 算法搜索出來的方里網(wǎng)網(wǎng)點進行修正。做法是把其中方里網(wǎng)網(wǎng)點圖像坐標和由方里網(wǎng)網(wǎng)點理論坐標映射而得到的圖像坐標相差較大的點剔除,再把剩余的對應點做最小二乘擬合。接著把擬合后的圖像坐標再用上述直線參數(shù)精確定位算法進行搜索得到更精確的方里網(wǎng)網(wǎng)點的圖像坐標,如此逐步增大精度參數(shù)反復迭代這個過程10次左右,很好地糾正了Hough 算

27、法誤檢的方里網(wǎng)網(wǎng)點,同時也 達到了亞像素級的精度。5結(jié)論本文設計的算法首先把掃描得到的地形圖灰度化,再利用Hough 算法檢測出內(nèi)圖廊點和方里網(wǎng)網(wǎng)點,再由內(nèi)圖廊點和方里網(wǎng)網(wǎng)點的理論坐標和圖像坐標的一一對應關系多次進行最小二乘擬合,在每次擬合中都用直線參數(shù)精確定位算法搜索得網(wǎng)點得精確位置。結(jié)合該技術形成了自動或者半自動掃描生成DRG 的軟件系統(tǒng)。該系統(tǒng)自動化程度高,有較好的魯棒性,而且精度也有很高的保障,可以適用于多種不同質(zhì)量的紙質(zhì)地形圖的校正,有很好的實際應用價值。(收稿日期:2006年4月參考文獻:1Basu M.Gaussian-based edge-detection methods-a

28、 surveyJ.IEEE Transactions on Systems ,Man and Cybernetics ,2002,32(3:252-260.2Steger C.An unbiased detector of curvilinear structures J.IEEETransaction on Pattern Analysis and Machine Intellegence ,1998,20(2:113-125.3孫家廣,楊長貴.計算機圖形學M.北京:清華大學出版社,1994.4章毓晉.圖象分割M.北京:科學出版社,2001.5阮秋琦.數(shù)字圖像處理學M.北京:電子工業(yè)出版社,

29、2001.6郭仁忠.空間分析M.武漢:武漢測繪科技大學出版社,2000.7陳述彭,魯學軍,周成虎.地理信息系統(tǒng)導論M .北京:科學出版社,1999.8廖克.現(xiàn)代地圖學M.北京:科學出版社,2003.9李汝昌,王祖英.地圖投影M.北京:中國地質(zhì)大學出版社,1992.10蔣長錦.科學計算和C 程序集M.北京:中國科學技術大學出版社,1998.(上接216頁故障特征子集F c1c1,b1c1,b1,b2c1,b1,c2排序的屬性集C c1,b1,b2,c2,a1,a2b1,b2,c2,a1,a2b2,c2,a1,a2c2,a1,a2b2,a1,a2Pos F (D 1,2,5,7,19,201,2,

30、3,4,5,7,12,17,18,23,19,201,2,3,4,5,6,7,8,9,10,11,12,13,14,17,18,19,20,22,231,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24Pos F (D =Pos C (D ?n n n n y表3故障特征選擇過程這個結(jié)果說明,最能反映三種故障特征的是偏斜度。從實踐中可知三種故障動態(tài)軌跡變化是有明顯區(qū)別的。流體激勵故障的軌跡重心穩(wěn)定,軸承座松動故障的軌跡重心變化較大,而喘振故障的重心偏移介于二者之間。6結(jié)語故障的特征提取對于有效可靠的診斷是十分重要的。而實際的故障診斷數(shù)據(jù)樣本的分類邊界常常是不確定的,并且故障與征兆之間的關系往往也是不確定的。粗糙集理論能夠分析隱藏在數(shù)據(jù)中的真實特性,而不需要任何附加的信息。本文結(jié)合粗糙集理論和知識的依賴性的概念和定義,提出根據(jù)條件屬性(集對決策屬性的正域的大小來選擇屬性,進行故障診斷特征提取的方法。并通過對熱電廠發(fā)電機組故障診斷特征提取對該方法進行了驗證。結(jié)果表明,這種方法能夠有效地提取故障特征,為進行準確的故障診斷打下了基礎。這種方法也可以用在其他涉及特征提取或重要屬性選擇的應用上。(收稿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論