




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第25卷第1期 航 天 器 環(huán) 境 工 程2008年2月 S P A C E C R A F T E N V I R O N M E N T E N G I N E E R I N G 41數(shù)據(jù)挖掘分類方法在沖擊譜試驗中的應(yīng)用馮雪梅,盧來潔,馬愛軍,劉洪英(中國航天員科研訓(xùn)練中心,北京 100094摘要:沖擊譜試驗隨機性強,難度較大。文章利用數(shù)據(jù)挖掘中分類方法提取數(shù)據(jù)背后隱藏的有用知識,通過數(shù)據(jù)預(yù)處理、構(gòu)建沖擊譜試驗數(shù)據(jù)倉庫、決策樹分析、評估比較,最終總結(jié)出一套針對不同產(chǎn)品、不同試驗工況的沖擊譜試驗調(diào)試方法。這可為以后產(chǎn)品的沖擊環(huán)境試驗提供有力的技術(shù)支持,進一步提高沖擊譜試驗的質(zhì)量和試驗中產(chǎn)品
2、的安全性。關(guān)鍵詞:數(shù)據(jù)挖掘;分類分析;沖擊譜試驗 中圖分類號:TB123;V416.2 文獻標(biāo)識碼:A 文章編號:1673-1379(200801-0041-031 引言數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊且隨機的實際應(yīng)用數(shù)據(jù)中提取隱含在其中的預(yù)先未知但又是潛在有用的信息和知識的過程1。分類是數(shù)據(jù)挖掘中常用的技術(shù)。它將建立一個分類模型,該模型能夠根據(jù)數(shù)據(jù)的屬性將數(shù)據(jù)分派到不同的組中。這樣可以利用該模型來分析已有數(shù)據(jù),并預(yù)測新數(shù)據(jù)將屬于哪一個組。沖擊譜試驗主要是模擬爆炸沖擊環(huán)境的力學(xué)試驗。模擬爆炸沖擊試驗的環(huán)境復(fù)雜,影響因素較多,隨機性強,試驗難度較大2,試驗調(diào)試往往依賴于試驗人員的經(jīng)
3、驗。通過對沖擊譜機試驗數(shù)據(jù)進行整理,構(gòu)建沖擊譜機數(shù)據(jù)倉庫,并利用數(shù)據(jù)挖掘工具(SPSS Clementine ,采用決策樹(Decision Tree 分析方法,從試驗訓(xùn)練數(shù)據(jù)集中找出隱藏、未知而有用的規(guī)律,總結(jié)出一套針對不同產(chǎn)品、不同試驗工況的沖擊譜試驗調(diào)試方法。2 數(shù)據(jù)預(yù)處理高質(zhì)量的決策依賴于高質(zhì)量的數(shù)據(jù),因此數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘過程中的重要步驟。在構(gòu)建沖擊譜試驗機數(shù)據(jù)倉庫過程中使用的數(shù)據(jù)是經(jīng)過預(yù)處理(即去掉壞的數(shù)據(jù),消除數(shù)據(jù)之間的矛盾,來自不同數(shù)據(jù)源的數(shù)據(jù)的集成,數(shù)據(jù)的轉(zhuǎn)換的歷史數(shù)據(jù),可以提高所獲規(guī)則的可靠性3。對沖擊譜試驗數(shù)據(jù)源作必要的整理,包括以下內(nèi)容:(1 數(shù)據(jù)獲取整理記錄沖擊譜試
4、驗機的歷史試驗及調(diào)試數(shù)據(jù)。(2 數(shù)據(jù)取樣按沖擊譜試驗的不同試驗規(guī)范、產(chǎn)品質(zhì)量分類,取樣以類為單位。(3 數(shù)據(jù)篩選濾除不希望包括進來的試驗數(shù)據(jù),去除數(shù)據(jù)中的噪音并糾正其不一致。例如由于加速度傳感器粘貼不當(dāng)或傳感器零漂所產(chǎn)生的“臟數(shù)據(jù)”等,將超出沖擊試驗規(guī)范一定范圍的試驗數(shù)據(jù)排除于取樣范圍之外;當(dāng)屬性出現(xiàn)缺少值、奇異值或數(shù)據(jù)存在不一致時,采用數(shù)據(jù)分箱、人機交互檢查以及回歸等方法檢測。(4 數(shù)據(jù)轉(zhuǎn)換將數(shù)據(jù)轉(zhuǎn)換成適合于挖掘的形式。3 分類分析分類是利用訓(xùn)練數(shù)據(jù)集通過一定的算法而求得分類規(guī)則。常用的算法是神經(jīng)網(wǎng)絡(luò)和決策樹。神經(jīng)網(wǎng)絡(luò)的優(yōu)點是該算法對復(fù)雜問題能進行很好地預(yù)測,對噪聲數(shù)據(jù)的承受能力比較強,以及
5、它的泛化性較好;其缺點是需要很長的訓(xùn)練時間及大量的參數(shù),而且解釋性差,即無法解釋如何得出結(jié)果和使用了什么規(guī)則。決策樹是建立在信息論基礎(chǔ)之上對數(shù)據(jù)進行分類的一種方法。這種方法相對比較簡收稿日期:2007-08-28;修回日期:2007-12-03作者簡介: 馮雪梅(1974-,女,工程師,主要從事計算機測控技術(shù)研究工作。聯(lián)系電話:(01066365643-801;E-mail: fengxuemei507 。HY FSOF TWA REC O.,LT D42 航 天 器 環(huán) 境 工 程 2008年第25卷單,其最大的優(yōu)點就是易于理解,比較直觀4。本文采用SPSS Clementine 中的決策樹
6、C5.0算法和CART 算法進行分類分析。C5.0算法是ID3算法、C4.5算法的修訂版,適用于處理大資料集,采用Boosting 方式提高模型準(zhǔn)確率,軟件的計算速度比較快,占用的內(nèi)存資源比較少。CART 算法自20世紀(jì)80年代以來就開始發(fā)展,由Friedman 等人提出,是基于樹結(jié)構(gòu)產(chǎn)生分類和回歸模型的過程,是一種產(chǎn)生二元樹的技術(shù)。CART 與C5.0算法的最大差別在于其在每一個節(jié)點上都是采用二分法,也就是一次只能夠有兩個子節(jié)點;而C5.0算法則在每一個節(jié)點上可以產(chǎn)生不同數(shù)量的分支。根據(jù)試驗規(guī)范、產(chǎn)品重量、夾具重量、溫濕度環(huán)境等信息分類,預(yù)測各個調(diào)試參數(shù)(諧振板厚度,諧振板上、板下阻尼材料參
7、數(shù),標(biāo)尺高度等,如圖1所示。圖1 決策樹圖Fig.1 Decision tree4 數(shù)據(jù)評價通過數(shù)據(jù)評價可以選擇出最好的分類模型。由于在數(shù)據(jù)挖掘過程中發(fā)現(xiàn)試驗室溫濕度環(huán)境與試驗結(jié)果有關(guān)聯(lián),因此在進行分類分析中,將數(shù)據(jù)輸入項分為兩類:第一類以試驗規(guī)范、產(chǎn)品重量、夾具重量、備件前后為輸入;第二類除包含第一類內(nèi)容以外,增加環(huán)境溫度和濕度輸入。利用C5.0算法和CART 算法進行分類分析,得到不同的分類模型結(jié)果。使用公共的標(biāo)準(zhǔn)例如提升圖,對不同數(shù)據(jù)挖掘模型進行定量比較和評價。圖2圖5分別為對諧振板厚度,諧振板上、板下阻尼材料參數(shù),標(biāo)尺高度分類結(jié)果的提升圖。(a 無溫濕度 (b 含溫濕度輸入注:Best
8、 ;$C. 諧振板;$R. 諧振板圖2 諧振板分類結(jié)果評估圖Fig.2 Evaluation chart of resonance board(a 無溫濕度 (b 含溫濕度輸入注:Best ;$C. 板下材料;$R. 板下材料圖3 板下材料分類結(jié)果評估圖Fig.3 Evaluation chart of materials under the board(a 無溫濕度 (b 含溫濕度輸入注:Best ;$C. 板上材料;$R. 板上材料圖4 板上材料分類結(jié)果評估圖Fig.4 Evaluation chart of materials on the board(a 無溫濕度 (b 含溫濕度輸入注
9、:Best ;$C. 標(biāo)尺高度數(shù);$R. 標(biāo)尺高度數(shù)圖5 提升高度分類結(jié)果評估圖Fig.5 Evaluation chart of height提升表中繪制的是累積提升值與樣本百分比的關(guān)系,即構(gòu)造/培訓(xùn)樣本。其基準(zhǔn)值(即評估每個模型的底限是1,它表示當(dāng)從樣本中隨機抽取記錄的百分點時能成功地“擊中”現(xiàn)有客戶。提示值衡量的是當(dāng)來自數(shù)據(jù)中的某一記錄使一個現(xiàn)有客戶的降序預(yù)測概率能被百分點反映時,預(yù)測模型“擊中”現(xiàn)有客戶的成功可能性(準(zhǔn)確度有多高。如上圖所示,每個模型的提升值均大于1,在100%時收斂于1。由于每個預(yù)測模型都能以有效精HY FSOF TWA REC O.,LT D度預(yù)測目標(biāo)變量,因此可以
10、說它們都是有效的。從圖2圖5中可以看出:第1期 馮雪梅等:數(shù)據(jù)挖掘分類方法在沖擊譜試驗中的應(yīng)用 43(1 對于諧振板厚度和諧振板下阻尼材料,采用C5.0算法和CART 算法都可以得到很好的分類預(yù)測結(jié)果,且環(huán)境溫濕度與分類結(jié)果無關(guān);(2 對于諧振板上阻尼材料和標(biāo)尺高度,采用C5.0算法可以得到更好的分類預(yù)測結(jié)果,且分類輸入因素應(yīng)考慮環(huán)境溫濕度的影響。分類模式往往表現(xiàn)為一棵分類樹,根據(jù)數(shù)據(jù)的值從樹根開始搜索,沿著數(shù)據(jù)滿足的分支往上走,走到樹葉就能確定類別,以供試驗人員進行試驗調(diào)試使用。圖6顯示的是諧振板下阻尼材料的分類樹結(jié)構(gòu)。圖6 板下材料的分類樹結(jié)構(gòu)Fig.6 Classification tr
11、ee models of materials under the board5 結(jié)論將數(shù)據(jù)挖掘技術(shù)應(yīng)用于試驗技術(shù)研究中,通過對沖擊譜試驗數(shù)據(jù)的分類分析,總結(jié)出一套適用于產(chǎn)品沖擊譜試驗的調(diào)試方法,改變了以往依賴試驗人員經(jīng)驗的狀況。研究結(jié)果可為以后產(chǎn)品的沖擊環(huán)境試驗提供有力的技術(shù)保障,進一步提高沖擊譜試驗的質(zhì)量和沖擊譜試驗中產(chǎn)品的安全性。參考文獻(References 1 Han Jiawei, Kamber Micheline. Data mining:concepts and techniquesM. USA: Morgan Kaufmann Publishers, 2001: 70-1812 馬愛軍, 馮雪梅, 盧來潔, 等. 一種沖擊譜試驗機的研制J. 航天醫(yī)學(xué)與醫(yī)學(xué)工程
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度混凝土攪拌站租賃與安全培訓(xùn)服務(wù)合同
- 二零二五年度定制家具定制與家居智能化解決方案合同
- 二零二五年度房屋抵押貸款與戶外露營裝備合同
- 2025年度旅游安全風(fēng)險評估與應(yīng)急預(yù)案合同
- 2025年度植樹造林工程生態(tài)保護與社區(qū)參與合同
- 2025年度照明設(shè)計師勞動合同
- 二零二五年度家居裝飾銷售代理服務(wù)合同集
- 二零二五年度城市基礎(chǔ)設(shè)施建設(shè)債權(quán)轉(zhuǎn)讓合同
- 二零二五年度特色民宿租賃及文化體驗合同
- 二零二五年度股東借款合同法律顧問服務(wù)合同
- 無光纖傳輸技術(shù)Er:YAG激光口腔臨床應(yīng)用規(guī)范
- 醫(yī)療信息共享與互聯(lián)網(wǎng)醫(yī)療管理制度
- 人教版高中英語必修二詞匯表(默寫版)
- 汽車電器線束DFMEA范例
- 船模航模車模社團教案
- 【基于上市公司數(shù)據(jù)的康芝藥業(yè)盈利能力探析(定量論文)11000字】
- 幼兒園小班學(xué)情分析案例及分析
- 2024年義務(wù)教師考試招聘考試試題及答案
- 無人機紅外技術(shù)培訓(xùn)
- 2024中考英語1500詞匯默寫匯總表練習(xí)(含答案)
- 2022年四川省綿陽市中考語文真題
評論
0/150
提交評論