試論數據挖掘在化學研究生產中的應用論文_第1頁
試論數據挖掘在化學研究生產中的應用論文_第2頁
試論數據挖掘在化學研究生產中的應用論文_第3頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、資料來源:來自本人網絡整理!祝您工作順利!試論數據挖掘在化學研究生產中的應用論文 近年來,數據挖掘引起了信息產業(yè)界的極大關注,其主要緣由是存在大量數據,可以廣泛用法,并且迫切需要將這些數據轉換成有用的信息和學問。獵取的信息和學問可以廣泛用于各種應用,包括商務管理,消費掌握,市場分析,工程設計和科學探究等。以下是我為大家細心預備的:試論數據挖掘在化學討論消費中的應用相關論文。內容僅供參考,歡送閱讀! 試論數據挖掘在化學討論消費中的應用全文如下: 1 引言 化學是一門討論化合物組成、性質以及改變的一門學科。在長期的化學、化工試驗中產生了大量的數據,但是數據的海量增加卻造成了諸如信息過量、信息平安隱

2、患、信息真假難辨等困難。同時,這些海量的數據內部存在著許多有價值的信息和規(guī)律,如何從這些數據中發(fā)覺更多更有價值的信息和規(guī)律也成為化學、化工專家關注的焦點,需要是創(chuàng)造之母,面對這一要求,數據挖掘技術在化學、化工中的應用也就應運而生,并顯示了強大的生命力。在化學領域內,數據挖掘理論和算法的進展,極大地促進了計算機化學、化學計量學和化學信息學等新學科的進展。本文就針對數據挖掘方法在化學、化工各方面的應用進展簡述。 2 數據挖掘的概述 數據挖掘(data mining),是數據庫學問發(fā)覺(kdd, knowledge-discovery in databases)中的一個步驟。數據挖掘一般是指從大量的

3、數據中通過算法搜尋發(fā)覺隱藏于其中的規(guī)律和信息的過程。近十年來,數據挖掘技術不管是在理論上還是在實際應用上,都已獲得了很大的進展1,同時也出現了各種專用或商用的數據挖掘軟件。 數據挖掘領域利用的主要思想有:統(tǒng)計學的抽樣、估量和假設檢驗;人工智能、形式識別和機器學習的搜尋算法、建模技術和學習理論。數據挖掘同時也快速地接納了最優(yōu)化、進化計算、信息論、信號處理、可視化和信息檢索等領域方面的思想。目前,常用的數據挖掘方法主要有以下幾種:數學統(tǒng)計方法、決策樹、形式識別方法、人工神經網絡方法、遺傳算法、粗糙集方法、支持向量機方法等。 3 數據挖掘在化學與化工消費中的應用 數據挖掘利用多學科領域的學問從全新的

4、角度以及更深層次中開掘存在于海量信息內部有效的、新穎的形式。在化學與化工消費中利用這種數據挖掘技術可從化學和化工消費數據中查找潛在的規(guī)律,同時利用這些規(guī)律指導企業(yè)的消費過程,最終實現消費過程的優(yōu)化以及企業(yè)效益的最大化。 3.1 中草藥成分分析中的數據挖掘 方兆華等對化裝品專利中草藥成分利用關聯規(guī)章進展分析,得出化裝品中有當歸、白芷和蘆薈等高頻單味藥,有當歸-川芎等高頻藥對,有蘆薈-芝麻-向日葵子等高頻藥組;基于置信度和支持度分析,得到了化裝品中中草藥應用的13 條強關聯規(guī)章,如向日葵子-芝麻等。陸愛軍等利用關聯規(guī)章對中醫(yī)藥效、植物科屬、化學的成分活性、中藥提取物和現代藥理之間的互相關系進展討論

5、,在分析之前對數據進展預處理,然后再對處理后的數據進展挖掘,從而得到一些好玩的關聯規(guī)章,比方中藥藥效和植物科分類的關聯規(guī)章,都是因為在該科下面的植物許多具有相應的中藥藥效。 3.2 化學討論中的數據挖掘 朱建國分析了數據的詳細特征,采納id3 的決策樹算法將數據的離散化和屬性選擇進展預處理,使決策樹樹狀構造的分類器對數據能進展更有效的分類。通過二苯乙烯系列化合物試驗數據的建樹過程,以及對所得到的規(guī)章進展分析,將決策樹有效地運用在二苯乙烯系列化合物討論過程中,并開發(fā)方案實現系統(tǒng)讓討論者可以清楚地表達分類規(guī)章,從而給討論者帶來了極大的便利。 李峰等將數據挖掘應用在稀土摻雜納米tio2構造與光催化活

6、性的關系中,用多元逐步回來分析對數據樣本間的聯絡進展挖掘,從而發(fā)覺構造參數與光催化劑的表觀速率常數間之間存在著良好的相關性,其相關系數大于0.99,說明該模型具有良好的穩(wěn)定性和預報力量。溶膠-凝膠法制備的不同稀土摻雜納米tio2不管是試驗結果還是計算機模擬結果都說明其納米構造相像,光催化活性是相近的,對于系列光催化劑制備及其動力學性質討論都能較好地建立起定量構效關系,進而通過xrd參數測試,發(fā)覺活性相近的催化劑,為選擇高效的光催化劑節(jié)省資源。 ru等人提出了一種稱為bsvr(boosting support vector regression)的方法,該方法支持向量回來,以boosting 結

7、合支持向量回來(svr)為分類器,繼而用它來處理硝基苯類,并且將其用作5-脂肪氧化酶抑止劑的1-phenyl2h-tetrahydro-triazine-3-one類化合物的qsar數據預報毒性,試驗結果說明這種方法在病毒性預報的精確性方面有明顯的進步。 cai 與feng 等人提出了一種稱為logistboost 的算法,該算法基于對數回來策略,可以對蛋白質構造數據(基于氨基酸序列)的二類、多類分類問題進展預報,試驗結果說明這種算法具有很好的預報結果。boosting 算法在蛋白質構造分類方面的預報應用是以構成蛋白質的氨基酸種類、排列挨次作為主要屬性對蛋白質的二級構造進展推斷。隨著數據挖掘在

8、化學中的應用,boosting算法有望可以對蛋白質的3d構造進展預報。friedman 等人提出了梯度boosting 算法,該方法在回來問題上挺直應用boosting 算法,從而有效解決了數據挖掘中在化學應用中回來問題上常見的問題,而tao 等人提出的新boosting算法那么可以有效解決數據挖掘在化學應用中異樣值的檢測問題。 3.3 化工消費中的數據挖掘 張泉靈等利用多支持度關聯規(guī)章的挖掘算法,開發(fā)了化工消費過程的數據挖掘軟件,通過數據挖掘軟件對操作參數和配方進展優(yōu)化,使產品的收率和有效成分得到進步,并將該系統(tǒng)應用在三唑磷的合成過程中,使三唑磷進步了1.5%的收率,同時三唑磷的含量也進步了

9、三個百分點,從80%進步到83%,為企業(yè)帶來了較好的經濟的效益和社會效益。 陸治榮等利用數據挖掘方法開發(fā)了適用于消費過程優(yōu)化、故障診斷、優(yōu)化新產品研制和配方設計的系列軟件dmos,該軟件為化工、煉油等行業(yè)消費過程優(yōu)化的工程化運營制造了條件,并將該系統(tǒng)應用到某石化廠,主要解決丙烯的收率不能滿足下游消費的問題,更重要的是回收的丙烯收率的進步可以進步經濟效益,結果說明經過dmos數據挖掘后提出了新的消費參數,對原來正常的消費狀態(tài)進展優(yōu)化后進步了丙烯的收率,優(yōu)化后丙烯的收率從14.7%進步到了19.11%。 基于合成氨消費效益的數據挖掘,用于解決氨合成裝置dmos合成氨優(yōu)化系統(tǒng),用于解決合成氨工業(yè)消費

10、參數的優(yōu)化,實現氨合成裝置消費時實時工況診斷、實時趨勢掃瞄、優(yōu)化操作指導、報表生成等功能。通過對云維集團有限公司氨合成裝置合成塔生成數據的數據挖掘,找出了影響裝置目的變量的主要工藝參數,建立目的變量與有關工藝參數間的數學模型,通過試驗說明所建模型的牢靠性強,可以優(yōu)扮裝置工藝操作,進步合成氨產量,全面進步企業(yè)的經濟效益。 3.4 化學分類中的數據挖掘 李琳等15利用決策樹對玻璃和葡萄酒進展分類,玻璃有9 個屬性作為衡量指標,葡萄酒為意大利某地的三種酒、含有13 個屬性作為分類指標。他們首先用法mdlp(最小長度描繪方法)進展離散化,再用lvf(lasvegas filter)方法進展屬性選擇,剔除冗余數據后,再由c4.5 方法構建決策樹。通過試驗說明:由決策樹建成的分類模型具有良好的預報性能,合適于化學分類學問形式的挖掘。基于預處理的決策樹克制了一般決策樹方法難以處理連續(xù)型數據集的缺點,又具有其它方法所不具備的優(yōu)勢,可從大量數據中挖掘出潛在的分類學問,并具有簡沽直觀的表達形式,易為專業(yè)人員理解和分析。 4 結論 本文對數據挖掘方法在化學和化工消費過程中如何利用海量數據、發(fā)覺和挖掘出新的規(guī)律和信息,為化學討論和化工消費供應有效精確的根據。雖然數據挖掘技術在化學和化工消費過程中獲得了大量應用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論