輪對壓裝曲線中異常點數(shù)據(jù)的處理方法_第1頁
輪對壓裝曲線中異常點數(shù)據(jù)的處理方法_第2頁
輪對壓裝曲線中異常點數(shù)據(jù)的處理方法_第3頁
輪對壓裝曲線中異常點數(shù)據(jù)的處理方法_第4頁
輪對壓裝曲線中異常點數(shù)據(jù)的處理方法_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、輪對壓裝曲線中異常點數(shù)據(jù)的處理方法肖 峻,李光海,韓建斌(武漢理工大學 機電工程學院,湖北 武漢 430070)摘 要:為了去除輪對壓裝壓力信號中的異常點,獲得真實的壓裝曲線,提出了一種異常點數(shù)據(jù)處理算法-增量均值法,該算法結(jié)合壓裝壓力信號的特點,能較好的識別并剔除異常點數(shù)據(jù)。經(jīng)過在輪對壓裝過程中的實際應(yīng)用,該算法收到了較好的效果,消除了干擾對輪對壓裝曲線的影響,減少了對壓裝質(zhì)量的誤判。關(guān)鍵詞:輪對壓裝曲線;異常點;增量均值法中圖分類號: TP301.65輪對是機車和車輛走行部的主要部件之一,是由一根車軸與兩個車輪以及齒輪、制動盤等組成的完整裝置。車軸與車輪、齒輪、制動盤采用過盈配合的連接方式

2、,通過壓裝的方法組成輪對。在輪軸壓裝過程中,壓裝曲線(即壓力-位移曲線)是反映壓裝質(zhì)量的重要評判依據(jù)。在目前廣泛使用的數(shù)控輪對壓裝機中,壓裝壓力信號是由計算機數(shù)據(jù)采集系統(tǒng)采集到的一系列具有固定時間間隔(采樣頻率固定)的數(shù)字時序信號。理想情況下,采集到的數(shù)字時序信號與壓裝過程中的壓裝壓力是一致的,但是由于實際應(yīng)用場合存在一定的干擾(突變的電、磁場或其它因素),使采集到的壓力數(shù)字時序信號夾雜有信號突變,即異常點。這些異常點并不能反映油缸壓力的真實變化,如果不對其加以剔除,會使壓裝曲線失真,造成對壓裝質(zhì)量的誤判。1 異常點對壓裝曲線的影響以某一臺數(shù)控輪對壓裝機為例,其壓裝 曲線是通過壓力傳感器和位移

3、傳感器采集到的數(shù)據(jù)經(jīng)過數(shù)字濾波后繪制的。圖1為某一輪對中左輪的壓裝曲線,曲線在壓裝位移大約42mm處出現(xiàn)了降噸凹槽,依據(jù)TB/T1718-2003鐵道車輛輪對組裝技術(shù)條件中關(guān)于輪對壓裝的判斷標準,此車輪壓裝不合格。為了尋找造成該現(xiàn)象的原因,需要對采集信號做進一步的分析。圖1 某一輪對的壓裝曲線在壓力-位移曲線中,將出現(xiàn)降噸凹槽的部分放大顯示,如圖2所示,可以看到,在42mm之前,壓力信號勻速上升,之后,有3個數(shù)據(jù)()陡然變化,由300kN降到數(shù)據(jù)(270kN),然后又急速上升到(281kN),再急速上升到(296kN)。然而,反映壓裝過程中壓裝壓力收稿日期:作者簡介:肖峻(1964),男,湖北

4、武漢人,武漢理工大學機電工程學院教授;博士.基金項目:湖北省科學技術(shù)研究與開發(fā)基金項目(201097289).的動態(tài)壓力信號是連續(xù)變化的,經(jīng)過等間隔的數(shù)據(jù)采集后獲得的壓力時序信號,其數(shù)據(jù)間的變化不應(yīng)該有突變。因而,可以斷定,此處數(shù)據(jù)的急速突變并不是壓裝過程中壓力變化的真實反映,而是干擾數(shù)據(jù)點,應(yīng)該加以剔除。圖2 信號突變位置2 數(shù)據(jù)異常點的挖掘方法異常點產(chǎn)生有很多原因,根據(jù)不同的角度,可以將異常點分為如圖3所示的幾種類型。圖3 異常點分類目前,比較常用的異常點挖掘方法有以下幾大類:(1) 基于統(tǒng)計模型的挖掘方法基于統(tǒng)計模型的異常點挖掘方法,其思想主要來自于統(tǒng)計學,統(tǒng)計中常用的方法是:對于給定的

5、數(shù)據(jù)集合,先假設(shè)一個分布 (例如一個正態(tài)分布),然后根據(jù)該分布模型,采用不一致的原則對異常點進行檢驗挖掘。這種方法的缺陷在于,需要事先知道數(shù)據(jù)集數(shù)據(jù)模型、分布參數(shù)和估計的異常點的數(shù)目。由于統(tǒng)計學方法要求預(yù)先知道關(guān)于數(shù)據(jù)集合參數(shù)的知識,例如數(shù)據(jù)分布,但許多情況下,數(shù)據(jù)分布是未知的,尤其是在沒有特定檢驗的情況下,統(tǒng)計學方法不能發(fā)現(xiàn)所有的異常點,或者觀察到的分布情況過于特殊,不能用標準分布來建模描述。(2) 基于距離模型的挖掘方法基于距離的異常點DB(p,d)的定義:如果數(shù)據(jù)集合中至少有p部分對象與對象O的距離大于d,則對象O是一個帶參數(shù)p、d的基于距離的異常點,即DB(p,d)。由上面關(guān)于異常點的

6、定義可看出,DB(p,d)統(tǒng)一了異常點的概念,對異常點的判斷方法也比較明確,例如,設(shè)存在一個正態(tài)分布數(shù)據(jù)集,如果數(shù)據(jù)集中存在與均值之間的距離大于或等于3倍偏差的數(shù)據(jù)對象,則被認為是異常點。直觀而言,如果不依賴于統(tǒng)計檢驗,可將基于距離的異常點看作是那些沒有足夠多鄰居的對象,此處鄰居是基于給定對象之間的距離定義的目前,該領(lǐng)域研究人員提供了若干高效的基于距離的異常點挖掘算法,比較有代表性的是基于索引的算法、嵌套循環(huán)算法和基于單元的算法,這些算法的主要特點是以對象間的距離作為相似性度量?;诰嚯x模型的異常點挖掘方法概括了基于統(tǒng)計模型的異常點的含義,并且對相對高維數(shù)據(jù)集有較好的挖掘效果,然而,當數(shù)據(jù)集由

7、不同密度的子集混合而成時,基于距離的異常點挖掘效果不好。(3) 基于密度模型的挖掘方法Hawkwins異常點的定義如下:異常點是明顯地偏離了其他測量值,使人們對其真實性產(chǎn)生懷疑,懷疑它的產(chǎn)生機理的點。如圖4所示,為一個二維數(shù)據(jù)集的例子,該數(shù)據(jù)集包含兩個聚類C1、C2和兩個異常點O1、O2,雖然O1、O2都為異常點,但是有區(qū)別的,O1是局部異常點,O2是全局異常點。根據(jù)上面提到的算法,O2異常點特征明顯,容易挖掘,但O1異常點卻比較難挖掘出來。圖4一個二維數(shù)據(jù)集從上面的例子可看出,基于距離的異常點定義DB(p,d)在一些特定的情況下是準確和充分的,但如果數(shù)據(jù)聚類密度存在不同的單元,就會出現(xiàn)問題。

8、為了有效的解決這個問題,基于密度模型的局部異常點挖掘算法被提出,從而保證可以判斷出O1和O2在數(shù)據(jù)集中都是異常點。基于密度的診斷方法引入了度量單位:局部離群系數(shù),來表示一個數(shù)據(jù)集中數(shù)據(jù)的離群程度,正常數(shù)據(jù)的基本上都近似等于1,所以它們不是異常點。根據(jù)局部異常點的定義及其特征,可通過對數(shù)據(jù)集中的計算來確定異常點,只要一個數(shù)據(jù)對象的遠大于1,它很有可能是一個異常點,應(yīng)該引起注意或者加以排除。但是,基于密度的診斷方法仍然存在一定的問題,在數(shù)據(jù)量較大時,處理時間比較長,效率比較低。(4) 基于相似度的挖掘方法數(shù)據(jù)集的相似度隨應(yīng)用領(lǐng)域的不同,相似度的定義也不同。例如,兩個量的變化速度(斜率描述)保持一致

9、;波形允許在一定范圍內(nèi)漂移、伸縮。這種診斷方法,可以大大的減少計算量,提高效率。但相似度的確定是一個難點。3 增量均值法在介紹增量均值法之前,先給出以下定義:定義1(時間序列)時間序列是一組或多組由記錄時間和記錄值共同組成的元素有序集合,記為X=,,元素表示時間序列在時刻的記錄值為,記錄時間是嚴格增加的。在本文所采用的壓力數(shù)據(jù)采集系統(tǒng)中,時間序列的采樣間隔相等(采樣周期為70ms),可以認為,此時將壓力信號時間序列簡記為。用代表時間序列中的第各元素。定義2(元素距離)元素與元素的距離是指它們的序列號之差的絕對值,記為。定義3(鄰域)壓力信號時間序列中的元素的鄰域是指以元素為中心,與的距離不超過

10、的所有元素的集合,記為。定義4(壓力增量絕對值)指壓力信號時間序列中的元素相對于其前一個采樣點的變化量的絕對值,記為。正常情況下,壓力信號是連續(xù)均勻變化的,相鄰數(shù)據(jù)的變化量在一定的范圍內(nèi)。以上述車輪的壓力數(shù)據(jù)為例,將壓力數(shù)據(jù)中相鄰元素的壓力增量絕對值計算出來,如圖5所示,橫坐標為元素序列編號,縱坐標為元素相對于其前一個元素的增量絕對值。從圖5中可以看出,正常情況下,壓力增量絕對值在一定的范圍微小波動,當有外界干擾時,壓力增量絕對值陡增,超出了正常的波動范圍(10kN左右)。因此,可以通過設(shè)定適當?shù)膲毫υ隽拷^對值閾值來識別異常點。當時,則認為為壓力數(shù)據(jù)序列中的異常點,應(yīng)加以剔除。由此可見,的取值

11、是非常關(guān)鍵的。取值過小,剔除效果不明顯,異常點對壓裝曲線的影響大,從而可能導致壓裝質(zhì)量的誤判。取值過大,則有可能將反映壓裝過程的真實壓力數(shù)據(jù)剔除,造成壓裝曲線失真。圖5 壓力變化量分布增量均值法定義:對于壓力時序信號中的元素,求出其鄰域內(nèi)所有元素壓力增量絕對值的均值,再乘以系數(shù)來確定閾值,當時,則認為為壓力時序信號中的異常點,應(yīng)加以剔除。和用公式表示為:式中:為經(jīng)驗取值系數(shù),值的確定可以通過多次的試驗來獲得。信號中的異常點去除后,可用該異常點前面的數(shù)據(jù)加上增量均值替代,即:。經(jīng)過對大量壓裝壓力數(shù)據(jù)的試驗分析,最終確定,可以得到最佳的剔除效果。4 實驗結(jié)果分析對上述車輪帶有干擾的壓裝壓力數(shù)據(jù)進行

12、測試,圖6為對壓力數(shù)據(jù)中干擾區(qū)域的檢測結(jié)果,型點為檢測到的異常點??梢钥吹?,增量均值法對壓裝壓力數(shù)據(jù)中的異常點剔除效果很好,特別是那些變化幅度很大,影響到壓裝曲線判斷的異常點,得到了有效的消除。圖6壓裝壓力信號中異常點的檢測結(jié)果異常點剔除后,再對壓裝壓力數(shù)據(jù)進行簡單的滑動平均處理,異常點對壓裝曲線的影響便被基本消除,壓裝曲線得到了正確的修正。修正后上述車輪的壓裝曲線如圖7所示。圖7 處理后上述車輪的壓裝曲線5 結(jié)論從以上的分析可以看出,增量均值法對輪對壓裝壓力數(shù)據(jù)中的異常點剔除效果明顯。增量均值法是在萊茵達法的基礎(chǔ)上總結(jié)出來的一種新的剔除異常點的方法,其計算方法簡便,易于計算機編程。經(jīng)過在輪對

13、壓裝過程中的實際應(yīng)用,收到了較好的效果,消除了由于干擾造成的對壓裝質(zhì)量的誤判。參考文獻:1 鄭東.鐵路貨車輪對壓裝曲線記錄儀的 研制D.成都:西南交通大學,2003.6.2 TBT 1463-2003,機車輪對組裝技術(shù)條件 S.3 朱明.數(shù)據(jù)挖掘M.合肥:中國科技大學 出版社,2002.4 詹艷艷,陳曉云,徐榮聰.基于時間序列模式表示的異常檢測算法J.計算機應(yīng)用研究,2007,24(11):78-79.5 詹艷艷,徐榮聰.時間序列異常模式的k-均距異常因子檢測J.計算機工程與應(yīng)用,2009,45(9):141-145.6 楊世杰.動態(tài)測試數(shù)據(jù)中壞點處理的一種新方法-絕對均值法及應(yīng)用研究J.中國

14、測試技術(shù),2006,32(1):48-49.7 何平.剔除測量數(shù)據(jù)中異常值的若干方 法J.航空計測技術(shù),1995(01):19-22.8 薛年喜.MATLAB在數(shù)字信號處理中的 應(yīng)用M.北京:清華大學出版社,2003.9 鄭斌祥,席裕庚,杜秀華.基于離群指數(shù)的時序數(shù)據(jù)離群挖掘J.自動化學報,2004,30(1):71-76.10 高品賢.測試信號分析處理方法與程序M.成都:西南交通大學出版社,1999.A new algorithm for removing outliers from press fitting curveXIAO Jun, LI Guanghai, HAN JianbinAbstract: In order to remove outliers from press signals acquired in press fitting process, obtain true press fitting curve, a new algorithm, incremental mean algorithm is presented in this paper. According to the traits of press signals, the algorithm can distinguish

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論