數(shù)字化礦山構(gòu)建過(guò)程中的數(shù)據(jù)挖掘模型研究_第1頁(yè)
數(shù)字化礦山構(gòu)建過(guò)程中的數(shù)據(jù)挖掘模型研究_第2頁(yè)
數(shù)字化礦山構(gòu)建過(guò)程中的數(shù)據(jù)挖掘模型研究_第3頁(yè)
數(shù)字化礦山構(gòu)建過(guò)程中的數(shù)據(jù)挖掘模型研究_第4頁(yè)
數(shù)字化礦山構(gòu)建過(guò)程中的數(shù)據(jù)挖掘模型研究_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)字化礦山構(gòu)建過(guò)程中的數(shù)據(jù)挖掘模型研究摘要:礦山數(shù)字化集礦山管理、生產(chǎn)、設(shè)計(jì)、地質(zhì)勘察、測(cè)繪、開采、調(diào)度于一體。 實(shí)現(xiàn)礦山數(shù)字化可以充分合理地開采資源, 高效組織礦山生產(chǎn), 降低工人勞動(dòng)強(qiáng)度, 提高礦山企業(yè)經(jīng)濟(jì)、社會(huì)效益。而構(gòu)建數(shù)字化礦山模型過(guò)程中, 涉及到大量數(shù)據(jù)的合理組織和有效利用。針對(duì)數(shù)字化礦山過(guò)程中產(chǎn)生積累的大量數(shù)據(jù),以新的視角分析了應(yīng)用數(shù)據(jù)挖掘的基礎(chǔ)和數(shù)據(jù)特點(diǎn)。 討論了數(shù)據(jù)挖掘的基本思想,提出了集成數(shù)據(jù)挖掘的模型結(jié)構(gòu), 為數(shù)字化礦山及礦山管理決策提出了一條新的途徑。關(guān)鍵詞 :數(shù)據(jù) 數(shù)據(jù)挖掘 數(shù)字化礦山 模型數(shù)字化礦山不僅是信息社會(huì)的主要組成部分, 而且也是數(shù)字地球技術(shù)系統(tǒng)的集中表現(xiàn),

2、 是數(shù)字地球理論在地學(xué)領(lǐng)域的應(yīng)用。數(shù)字化礦山是綜合運(yùn)用 GIS(地理信息系統(tǒng) )、遙感、遙測(cè)、網(wǎng)絡(luò)、多媒體及虛擬仿真等技術(shù)系統(tǒng)對(duì)礦山資源的開發(fā)利用、信息采集、動(dòng)態(tài)監(jiān)測(cè)管理和輔助決策服務(wù)的技術(shù)系統(tǒng)。它是地理、資源、生態(tài)環(huán)境等復(fù)雜系統(tǒng)的數(shù)字化、網(wǎng)絡(luò)化、虛擬仿真, 具有優(yōu)化決策支持和可視化表現(xiàn)等強(qiáng)大功能。數(shù)字化礦山是隨數(shù)字技術(shù)、信息技術(shù)的飛速發(fā)展和計(jì)算機(jī)技術(shù)的廣泛應(yīng)用而發(fā)展起來(lái)的。 在數(shù)字化過(guò)程中產(chǎn)生積累了大量的數(shù)據(jù)。面對(duì)如此龐大的數(shù)據(jù), 一方面, 可以通過(guò)數(shù)據(jù)庫(kù)管理系統(tǒng)結(jié)合統(tǒng)計(jì)分析方法, 實(shí)現(xiàn)查詢、檢索及表報(bào)功能, 也可以進(jìn)行聯(lián)機(jī)分析處理 LAP(或 OLTP聯(lián)機(jī)事務(wù)處理 )得出可供決策參考的統(tǒng)計(jì)

3、分析數(shù)據(jù), 但數(shù)據(jù)中隱藏的內(nèi)在有用知識(shí)無(wú)法得到, 我們處在數(shù)據(jù)豐富而知識(shí)貧乏的矛盾之中。另一方面, 就人工智能中的知識(shí)獲取而言, 它主要依靠用戶或者領(lǐng)域?qū)<沂止⒅R(shí)輸入到知識(shí)庫(kù)中,耗時(shí)費(fèi)力, 且因主觀性易于出錯(cuò)。因此迫切需要能夠自動(dòng)發(fā)現(xiàn)獲取知識(shí)的新技術(shù), 這便是數(shù)據(jù)挖掘產(chǎn)生的直接推動(dòng)力。數(shù)據(jù)挖掘技術(shù)涉及人工智能、數(shù)據(jù)庫(kù)技術(shù)、模式識(shí)別、數(shù)據(jù)可視化、統(tǒng)計(jì)學(xué)等多門交叉學(xué)科。本文針對(duì)數(shù)據(jù)挖掘在數(shù)字化礦山構(gòu)建過(guò)程的應(yīng)用問(wèn)題進(jìn)行討論。數(shù)據(jù)挖掘是指從大量數(shù)據(jù)中提取或 ? 采掘 ?知識(shí), 進(jìn)而形成了廣義的 DM 定義。數(shù)據(jù)挖掘是從存在于大量數(shù)據(jù)的數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)或信息儲(chǔ)存體中發(fā)現(xiàn)有價(jià)值知識(shí)的過(guò)程。DM 的對(duì)

4、象不僅是數(shù)據(jù)庫(kù), 也可以據(jù)集合。知識(shí)發(fā)現(xiàn)是指識(shí)別出存在于數(shù)據(jù)庫(kù)中可信的、新穎的、具有潛在應(yīng)用價(jià)值和最終可理解模式的非平凡過(guò)程。而數(shù)據(jù)挖掘是此過(guò)程的一個(gè)特定關(guān)鍵步驟。數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的最終目標(biāo)都是從大量數(shù)據(jù)集合中挖掘出各種有價(jià)值、被人理解的可用于指導(dǎo)實(shí)踐的知識(shí)。KDD的定義完整準(zhǔn)確但表面上僅局限于數(shù)據(jù)庫(kù), 而 DM 對(duì)其進(jìn)行了擴(kuò)充, 指組織在一起的數(shù)據(jù)集合。但這里的數(shù)據(jù)集合應(yīng)該是來(lái)源于實(shí)踐中有用系統(tǒng)的, 而不是雜亂無(wú)章的數(shù)據(jù)堆積。DM 的過(guò)程可歸納為: 數(shù)據(jù)準(zhǔn)備 (數(shù)據(jù)選擇、清洗、變換 )、數(shù)據(jù)采掘 (各種挖掘算法的運(yùn)用 )和知識(shí)的表達(dá)、解釋與驗(yàn)證 3個(gè)階段, 是一個(gè)循環(huán)往復(fù)的過(guò)程。主要任務(wù)有

5、分類、回歸分析、聚類、預(yù)測(cè)、關(guān)聯(lián)性、變化和偏差分析、模式發(fā)現(xiàn)和路徑發(fā)現(xiàn)等。1 數(shù)字化礦山構(gòu)建過(guò)程中 DM 的基礎(chǔ)與現(xiàn)狀數(shù)字化礦山集地理、資源、生態(tài)環(huán)境等因素于一體, 又面臨資源開發(fā)利用、經(jīng)濟(jì)效益、環(huán)境保護(hù)、安全等多方面的挑戰(zhàn), 因此它是一個(gè)十分復(fù)雜的大系統(tǒng)。在構(gòu)造礦山數(shù)字模型過(guò)程中, 以計(jì)算機(jī)為核心的各種控制系統(tǒng)能夠采集、存儲(chǔ)大量礦山生產(chǎn)過(guò)程的過(guò)去 (歷史 )和當(dāng)前運(yùn)行狀態(tài) (動(dòng)態(tài) )的豐富有價(jià)值的數(shù)據(jù) (包括, 礦產(chǎn)品保有儲(chǔ)量、開采品位、礦巖性質(zhì)、設(shè)備狀態(tài)等 ); 以往人們往往過(guò)分重視控制算法的開發(fā), 而忽視了對(duì)礦山生產(chǎn)過(guò)程中有關(guān)生產(chǎn)人員的行為特征、經(jīng)驗(yàn), 設(shè)備運(yùn)行狀態(tài)及開采過(guò)程、環(huán)境狀態(tài)、

6、資源、開采條件等大量數(shù)據(jù)的全面分析利用, 更難從中發(fā)現(xiàn)知識(shí)。部分原因由于系統(tǒng)的復(fù)雜性、處理數(shù)據(jù)量的龐大和缺乏相應(yīng)的技術(shù)手段, 而DM 的產(chǎn)生為解決這些問(wèn)題提供了強(qiáng)有力的工具。它可以充分利用積累的歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù), 提取潛在的模式、規(guī)則, 以新的視角為數(shù)字化礦山構(gòu)建開辟新的途徑。這使得在數(shù)字化礦山構(gòu)建過(guò)程中展開數(shù)據(jù)挖掘應(yīng)用研究有了堅(jiān)實(shí)的基礎(chǔ)。DM 理論與技術(shù)的研究已經(jīng)較為廣泛, 國(guó)外已廣泛應(yīng)用于商業(yè)、金融、電信和企業(yè)管理中。英國(guó)已應(yīng)用 DM 于化工過(guò)程的監(jiān)控中, 取得了顯著的效益。美國(guó)鋼鐵公司和神戶鋼鐵公司運(yùn)用 DM 技術(shù)研究分析產(chǎn)品性能規(guī)律進(jìn)行質(zhì)量控制。CASSIOPEE故障發(fā)現(xiàn)系統(tǒng)被歐洲三

7、大航空公司用來(lái)診斷和預(yù)測(cè)波音 737客機(jī)的故障, 其應(yīng)用獲得了 ? 歐洲創(chuàng)新應(yīng)用 的一等獎(jiǎng)。國(guó)內(nèi)有關(guān)數(shù)字化礦山方面 DM 的理論和應(yīng)用研究才開始, 報(bào)道很少。2 數(shù)字化礦山構(gòu)建過(guò)程中數(shù)據(jù)的特點(diǎn)要進(jìn)行數(shù)字化礦山構(gòu)建過(guò)程中的數(shù)據(jù)挖掘, 在遵循 DM 一般方法的基礎(chǔ)上, 必須認(rèn)真分析其數(shù)據(jù)特點(diǎn)并結(jié)合具體生產(chǎn)工藝上的要求進(jìn)行。其數(shù)據(jù)特點(diǎn)可概括如下:(1)數(shù)據(jù)量巨大、高維且有較強(qiáng)的耦合性。在礦山生產(chǎn)過(guò)程中, 不論是計(jì)算機(jī)模擬還是計(jì)算機(jī)輔助決策的工藝過(guò)程, 都要隨生產(chǎn)過(guò)程定時(shí)采集、更新數(shù)據(jù)及生產(chǎn)狀態(tài), 以供顯示、控制之用, 另外還有重復(fù)測(cè)量和冗余測(cè)量的數(shù)據(jù), 日積月累這些數(shù)據(jù)量是非常巨大的; 同時(shí)由于礦山

8、生產(chǎn)過(guò)程的行為狀態(tài)是許多變量因素共同作用的結(jié)果, 它們之間有較強(qiáng)的耦合及非線性關(guān)系。( 2)生產(chǎn)過(guò)程中的不確定性。礦山生產(chǎn)工作環(huán)境復(fù)雜, 電、磁、粉塵、噪聲干擾較強(qiáng), 系統(tǒng)本身存在不確定性, 因而數(shù)據(jù)易受污染。( 3)動(dòng)態(tài)性與數(shù)據(jù)類型的多樣性。各種變量的值是不斷變化的, 這反映了系統(tǒng)的動(dòng)平衡過(guò)程, 是系統(tǒng)本質(zhì)的反映。在生產(chǎn)過(guò)程的監(jiān)控中通過(guò)辨識(shí)、觀察諸變量的數(shù)值, 預(yù)測(cè)系統(tǒng)的狀態(tài)及變化趨勢(shì)。其數(shù)據(jù)的類型也是多樣的, 如數(shù)值型 (整型、實(shí)型 )、非數(shù)值型、邏輯型等。( 4)多時(shí)標(biāo)性與不完整性。因系統(tǒng)的復(fù)雜性,眾多變量的變化快慢各異, 所以采集信號(hào)的頻率不同, 導(dǎo)致時(shí)間上的不同步。在數(shù)據(jù)的記錄上也可

9、能丟失數(shù)據(jù), 造成數(shù)據(jù)的不完整。( 5) 多模態(tài)性。數(shù)據(jù)是系統(tǒng)狀態(tài)變化的反應(yīng)。既有正常工作狀態(tài), 又有各種異常狀態(tài) (包括未知狀態(tài)、不確定狀態(tài) )和故障態(tài)的數(shù)據(jù)。前者是主體, 后者的數(shù)據(jù)量相對(duì)較少。但它們都是 DM中所不可缺少的。3 數(shù)字化礦山構(gòu)建過(guò)程中數(shù)據(jù)挖掘的基本思想由于礦山生產(chǎn)過(guò)程的復(fù)雜性及特點(diǎn), 其數(shù)據(jù)挖掘必須將傳統(tǒng)數(shù)據(jù)挖掘方法與現(xiàn)代以計(jì)算智能 CI( Computational Intelligence)為核心的眾多理論方法融合集成起來(lái)。以礦山生產(chǎn)過(guò)程積累的大量數(shù)據(jù)為研究對(duì)象, 發(fā)揮現(xiàn)行監(jiān)控平臺(tái)的作用, 結(jié)合生產(chǎn)工藝要求, 研究適用于數(shù)字化礦山構(gòu)建系統(tǒng)數(shù)據(jù)特點(diǎn)的魯棒、有效的新挖掘方法

10、, 解決數(shù)據(jù)豐富、知識(shí)貧乏的問(wèn)題。并運(yùn)用新方法獲取知識(shí), 補(bǔ)充、完善和更新知識(shí)系統(tǒng)和監(jiān)控手段。指導(dǎo)生產(chǎn)操作, 優(yōu)化生產(chǎn)工藝, 提高礦石產(chǎn)品質(zhì)量。3. 1 融合集成各種 DM 方法結(jié)合數(shù)據(jù)先驗(yàn)知識(shí)、工程背景知識(shí), 將基于統(tǒng)計(jì)學(xué)的傳統(tǒng) DM 方法、機(jī)器學(xué)習(xí)方法及計(jì)算智能方法融合集成起來(lái), 研究能從大量數(shù)據(jù)中提取反映系統(tǒng)狀態(tài)的模式、規(guī)則的算法與策略。該方法對(duì)數(shù)據(jù)的不確定性、不完整性, 噪聲有較強(qiáng)的魯棒性。3. 2 建立系統(tǒng)的狀態(tài)監(jiān)控與故障診斷模型基于數(shù)據(jù)挖掘的新方法, 對(duì)數(shù)字化礦山構(gòu)建過(guò)程的歷史數(shù)據(jù)包括正常狀態(tài)、異常狀態(tài)及各種故障狀態(tài)數(shù)據(jù) (系統(tǒng)中各種變量在故障發(fā)生后, 它們中的一部分或全部其數(shù)據(jù)或

11、狀態(tài)變化都會(huì)與正常情況下有所不同, 其中包含了豐富的故障信息 )進(jìn)行聚類、分類分析, 建立系統(tǒng)狀態(tài)評(píng)估和故障預(yù)測(cè)模型。在此基礎(chǔ)上, 對(duì)系統(tǒng)過(guò)程, 系統(tǒng)狀態(tài)的當(dāng)前數(shù)據(jù)進(jìn)行在線挖掘分析。對(duì)已建立的模型進(jìn)行檢驗(yàn)和修正,形成系統(tǒng)動(dòng)態(tài)分析模型。并進(jìn)行可視化處理, 提供操作指導(dǎo)與分析, 使操作員得到充分的信息, 進(jìn)行生產(chǎn)過(guò)程監(jiān)視和操作, 從而實(shí)現(xiàn)更高水平的監(jiān)控, 防止事故隱患發(fā)生, 保證礦山安全生產(chǎn)。3. 3 構(gòu)建礦石產(chǎn)品質(zhì)量控制模型所謂礦山生產(chǎn)過(guò)程最優(yōu)化可以概括為: 在滿足必要的約束條件下, 改變礦山生產(chǎn)過(guò)程的工藝參數(shù),使某種與經(jīng)濟(jì)效益有關(guān)的目標(biāo)函數(shù)達(dá)到極值。在生產(chǎn)優(yōu)化實(shí)施中, 對(duì)大量生產(chǎn)數(shù)據(jù)進(jìn)行挖掘找

12、到產(chǎn)品質(zhì)量與工藝參數(shù)的模型關(guān)系。分析諸多變量作用下的產(chǎn)品質(zhì)量規(guī)律, 幫助質(zhì)檢人員、工藝人員弄清影響礦石產(chǎn)品質(zhì)量的主次因素, 提出相應(yīng)的對(duì)策, 進(jìn)一步調(diào)整工藝參數(shù), 進(jìn)行質(zhì)量控制, 為實(shí)現(xiàn)生產(chǎn)過(guò)程操作最優(yōu)化提供指導(dǎo)。3. 4 豐富知識(shí)庫(kù)和決策支持系統(tǒng)礦山生產(chǎn)過(guò)程對(duì)象已變?yōu)橐粋€(gè)十分復(fù)雜的系統(tǒng), 產(chǎn)生了更為困難的過(guò)程控制問(wèn)題以及對(duì)高性能控制器的要求。經(jīng)典的控制方法難以勝任, 以計(jì)算機(jī)為工具的智能控制方法已經(jīng)應(yīng)用于這些系統(tǒng)中。但結(jié)構(gòu)復(fù)雜, 計(jì)算量大。通常必須有知識(shí)庫(kù)作為支持, 而知識(shí)的獲取是關(guān)鍵。數(shù)據(jù)挖掘技術(shù)可以將提取的潛在模式、規(guī)則評(píng)估檢驗(yàn)后歸入知識(shí)庫(kù), 使得智能控制充分發(fā)揮作用, 提高生產(chǎn)過(guò)程的控

13、制水平。4 數(shù)字化礦山構(gòu)建過(guò)程中的數(shù)據(jù)挖掘模型在分析數(shù)字化礦山構(gòu)建過(guò)程中數(shù)據(jù)挖掘的基礎(chǔ)、數(shù)據(jù)特點(diǎn)及討論基本思想的基礎(chǔ)上, 可以把計(jì)算機(jī)技術(shù)、控制技術(shù)和信號(hào)處理技術(shù)結(jié)合起來(lái), 建立起智能代理 (Agent)和面向?qū)ο蟮倪f階式、分布式礦山生產(chǎn)過(guò)程的集成數(shù)據(jù)挖掘模型結(jié)構(gòu), 如圖 1所示。該模型可以發(fā)揮現(xiàn)行 DCS/FCS/CIPS系統(tǒng)的作用, 是數(shù)據(jù)挖掘系統(tǒng)與經(jīng)典 CIPS系統(tǒng)的融合圖 1 集成數(shù)據(jù)挖掘模型以 DCS/FCS/CIPS中采集積累的數(shù)據(jù)、人工記錄日志及實(shí)驗(yàn)仿真數(shù)據(jù)為數(shù)據(jù)源, 進(jìn)行數(shù)據(jù)挖掘的前端處理, 以解決數(shù)據(jù)的不完整性、噪聲及重復(fù)、冗余等問(wèn)題, 提高數(shù)據(jù)質(zhì)量; 通過(guò)集成的 DM 系統(tǒng)

14、運(yùn)用各種 DM 新算法進(jìn)行知識(shí)、規(guī)則提取, 狀態(tài)辨識(shí)及模式的建立; 并以領(lǐng)域操作、監(jiān)督人員熟悉的方式可視化, 對(duì)所獲取的知識(shí)、規(guī)則及模式進(jìn)行評(píng)估檢驗(yàn), 確定其可信度; 應(yīng)用發(fā)掘的有用知識(shí)、規(guī)則及模式對(duì)礦山生產(chǎn)系統(tǒng)實(shí)施監(jiān)控、診斷或豐富知識(shí)庫(kù)。數(shù)據(jù)挖掘的過(guò)程并非一次就能成功或結(jié)束, 而是一個(gè)不斷的、反復(fù)的過(guò)程, 從而逐漸獲得有用的新知識(shí)。5 結(jié) 語(yǔ)數(shù)據(jù)挖掘應(yīng)用于數(shù)字化礦山構(gòu)建過(guò)程系統(tǒng)中是一個(gè)嶄新的領(lǐng)域, 有許多問(wèn)題有待進(jìn)一步探索。數(shù)據(jù)挖掘技術(shù)是一個(gè)新的交叉學(xué)科領(lǐng)域。本文以新的視角, 在分析數(shù)字化礦山構(gòu)建過(guò)程中數(shù)據(jù)挖掘的基礎(chǔ)、數(shù)據(jù)特點(diǎn)的基礎(chǔ)上, 討論了工業(yè)過(guò)程中數(shù)據(jù)挖掘的思想, 提出了集成的 DM 系統(tǒng)模型。為進(jìn)一步實(shí)現(xiàn)數(shù)字化礦山構(gòu)建過(guò)程的監(jiān)控、優(yōu)化與故障診斷開辟了新的途徑。參 考 文 獻(xiàn) 1 高志武, 秦德先. 數(shù)字礦床概述 J. 金屬礦山, 2005( 2): 54-56. 2 王衛(wèi)星, 崔? 冰, 趙? 芳. 金屬礦山數(shù)字化 J. 金屬礦山, 2005( 11): 1-3. 3 吳少敏,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論