


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、一、數(shù)據(jù)挖掘工具分類數(shù)據(jù)挖掘工具根據(jù)其適用的范圍分為兩類:專用挖掘工具和通用挖掘工具。專用數(shù)據(jù)挖掘工具是針對某個特定領(lǐng)域的問題提供解決方案,在涉及算法的時候充分考慮了 數(shù)據(jù)、需求的特殊性,并作了優(yōu)化。對任何領(lǐng)域,都可以開發(fā)特定的數(shù)據(jù)挖掘工具。例如, IBM公司的AdvancedScout系統(tǒng)針對NBA的數(shù)據(jù),幫助教練優(yōu)化戰(zhàn)術(shù)組合。特定領(lǐng)域的數(shù)據(jù) 挖掘工具針對性比較強,只能用于一種應(yīng)用;也正因為針對性強,往往采用特殊的算法,可 以處理特殊的數(shù)據(jù),實現(xiàn)特殊的目的,發(fā)現(xiàn)的知識可靠度也比較高。通用數(shù)據(jù)挖掘工具不區(qū)分具體數(shù)據(jù)的含義,采用通用的挖掘算法,處理常見的數(shù)據(jù)類型。通 用的數(shù)據(jù)挖掘工具不區(qū)分具體數(shù)
2、據(jù)的含義,采用通用的挖掘算法,處理常見的數(shù)據(jù)類型。例 如,IBM公司Almaden研究中心開發(fā)的QUEST系統(tǒng),SGI公司開發(fā)的MineSet系統(tǒng),加拿大 SimonFraser大學(xué)開發(fā)的DBMiner系統(tǒng)。通用的數(shù)據(jù)挖掘工具可以做多種模式的挖掘,挖掘 什么、用什么來挖掘都由用戶根據(jù)自己的應(yīng)用來選擇。二、數(shù)據(jù)挖掘工具選擇需要考慮的問題數(shù)據(jù)挖掘是一個過程,只有將數(shù)據(jù)挖掘工具提供的技術(shù)和實施經(jīng)驗與企業(yè)的業(yè)務(wù)邏輯和 需求緊密結(jié)合,并在實施的過程中不斷的磨合,才能取得成功,因此我們在選擇數(shù)據(jù)挖掘工 具的時候,要全面考慮多方面的因素,主要包括以下幾點:可產(chǎn)生的模式種類的數(shù)量:分類,聚類,關(guān)聯(lián)等解決復(fù)雜問
3、題的能力操作性能數(shù)據(jù)存取能力和其他產(chǎn)品的接口三、數(shù)據(jù)挖掘工具介紹:QUESTQUEST是IBM公司Almaden研究中心開發(fā)的一個多任務(wù)數(shù)據(jù)挖掘系統(tǒng),目的是為新一代 決策支持系統(tǒng)的應(yīng)用開發(fā)提供高效的數(shù)據(jù)開采基本構(gòu)件。系統(tǒng)具有如下特點:提供了專門在大型數(shù)據(jù)庫上進行各種開采的功能:關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、時間 序列聚類、決策樹分類、遞增式主動開采等。各種開采算法具有近似線性計算復(fù)雜度,可適用于任意大小的數(shù)據(jù)庫。算法具有找全性,即能將所有滿足指定類型的模式全部尋找出來。為各種發(fā)現(xiàn)功能設(shè)計了相應(yīng)的并行算法。MineSetMineSet是由SGI公司和美國Standford大學(xué)聯(lián)合開發(fā)的多任務(wù)數(shù)據(jù)挖
4、掘系統(tǒng)MineSet 集成多種數(shù)據(jù)挖掘算法和可視化工具,幫助用戶直觀地、實時地發(fā)掘、理解大量數(shù)據(jù)背后的 知識。MineSet有如下特點:MineSet以先進的可視化顯示方法聞名于世。支持多種關(guān)系數(shù)據(jù)庫??梢灾苯訌腛racle、Informix、Sybase的表讀取數(shù)據(jù),也可以 通過SQL命令執(zhí)行查詢。多種數(shù)據(jù)轉(zhuǎn)換功能。在進行挖掘前,MineSet可以去除不必要的數(shù)據(jù)項,統(tǒng)計、集合、 分組數(shù)據(jù),轉(zhuǎn)換數(shù)據(jù)類型,構(gòu)造表達式由已有數(shù)據(jù)項生成新的數(shù)據(jù)項,對數(shù)據(jù)采樣等。操作簡單、支持國際字符、可以直接發(fā)布到Web。DBMinerDBMiner是加拿大SimonFraser大學(xué)開發(fā)的一個多任務(wù)數(shù)據(jù)挖掘系統(tǒng),
5、它的前身是 DBLearn。該系統(tǒng)設(shè)計的目的是把關(guān)系數(shù)據(jù)庫和數(shù)據(jù)開采集成在一起,以面向?qū)傩缘亩嗉壐?念為基礎(chǔ)發(fā)現(xiàn)各種知識。DBMiner系統(tǒng)具有如下特色:能完成多種知識的發(fā)現(xiàn):泛化規(guī)則、特性規(guī)則、關(guān)聯(lián)規(guī)則、分類規(guī)則、演化知識、偏離 知識等。綜合了多種數(shù)據(jù)開采技術(shù):面向?qū)傩缘臍w納、統(tǒng)計分析、逐級深化發(fā)現(xiàn)多級規(guī)則、元規(guī) 則引導(dǎo)發(fā)現(xiàn)等方法。提出了一種交互式的類SQL語言一一數(shù)據(jù)開采查詢語言DMQL。能與關(guān)系數(shù)據(jù)庫平滑集成。實現(xiàn)了基于客戶/服務(wù)器體系結(jié)構(gòu)的Unix和PC(Windows/NT)版本的系統(tǒng)。4.Intelligent Miner由美國IBM公司開發(fā)的數(shù)據(jù)挖掘軟件Intelligent M
6、iner是一種分別面向數(shù)據(jù)庫和文本 信息進行數(shù)據(jù)挖掘的軟件系列,它包括Intelligent Miner for Data和Intelligent Miner for Texto Intelligent Miner for Data可以挖掘包含在數(shù)據(jù)庫、數(shù)據(jù)倉庫和數(shù)據(jù)中心中 的隱含信息,幫助用戶利用傳統(tǒng)數(shù)據(jù)庫或普通文件中的結(jié)構(gòu)化數(shù)據(jù)進行數(shù)據(jù)挖掘。它已經(jīng)成 功應(yīng)用于市場分析、詐騙行為監(jiān)測及客戶聯(lián)系管理等;Intelligent Miner for Text允許 企業(yè)從文本信息進行數(shù)據(jù)挖掘,文本數(shù)據(jù)源可以是文本文件、Web頁面、電子郵件、Lotus Notes數(shù)據(jù)庫等等。5.SAS Enterpr
7、ise Miner這是一種在我國的企業(yè)中得到采用的數(shù)據(jù)挖掘工具,比較典型的包括上海寶鋼配礦系統(tǒng) 應(yīng)用和鐵路部門在春運客運研究中的應(yīng)用。SAS Enterprise Miner是一種通用的數(shù)據(jù)挖掘 工具,按照抽樣一探索一轉(zhuǎn)換一建模一評估的方法進行數(shù)據(jù)挖掘。可以與SAS數(shù)據(jù)倉庫和 OLAP集成,實現(xiàn)從提出數(shù)據(jù)、抓住數(shù)據(jù)到得到解答的端到端知識發(fā)現(xiàn)。6.SPSS ClementineSPSS Clementine是一個開放式數(shù)據(jù)挖掘工具,曾兩次獲得英國政府SMART創(chuàng)新獎,它不但 支持整個數(shù)據(jù)挖掘流程,從數(shù)據(jù)獲取、轉(zhuǎn)化、建模、評估到最終部署的全部過程,還支持?jǐn)?shù) 據(jù)挖掘的行業(yè)標(biāo)準(zhǔn)一CRISP-DMo C
8、lementine的可視化數(shù)據(jù)挖掘使得思路分析成為可能, 即將集中精力在要解決的問題本身,而不是局限于完成一些技術(shù)性工作(比如編寫代碼)。 提供了多種圖形化技術(shù),有助理解數(shù)據(jù)間的關(guān)鍵性聯(lián)系,指導(dǎo)用戶以最便捷的途徑找到問題 的最終解決辦法。7.數(shù)據(jù)庫廠商集成的挖掘工具SQL Server 2000包含由Microsoft研究院開發(fā)的兩種數(shù)據(jù)挖掘算法:Microsoft決策 樹和Microsoft聚集。此外,SQL Server 2000中的數(shù)據(jù)挖掘支持由第三方開發(fā)的算法。 Microsoft決策樹算法:該算法基于分類。算法建立一個決策樹,用于按照事實數(shù)據(jù)表中的 一些列來預(yù)測其他列的值。該算法可以
9、用于判斷最傾向于單擊特定標(biāo)題(banner)或從某電 子商務(wù)網(wǎng)站購買特定商品的個人。Microsoft聚集算法:該算法將記錄組合到可以表示類 似的、可預(yù)測的特征的聚集中。通常這些特征可能是隱含或非直觀的。例如,聚集算法可以 用于將潛在汽車買主分組,并創(chuàng)建對應(yīng)于每個汽車購買群體的營銷活動。,SQL Server 2005 在數(shù)據(jù)挖掘方面提供了更為豐富的模型、工具以及擴展空間。包括:可視化的數(shù)據(jù)挖掘工具 與導(dǎo)航、8種數(shù)據(jù)挖掘算法集成、DMX、XML/A、第三方算法嵌入支持等等。Oracle Data Mining (ODM)是Oracle數(shù)據(jù)庫10g企業(yè)版的一個選件,它使公司能夠 從最大的數(shù)據(jù)庫中
10、高效地提取信息并創(chuàng)建集成的商務(wù)智能應(yīng)用程序。數(shù)據(jù)分析人員能夠發(fā)現(xiàn) 那些隱藏在數(shù)據(jù)中的模式和內(nèi)涵。應(yīng)用程序開發(fā)人員能夠在整個機構(gòu)范圍內(nèi)快速自動提取和 分發(fā)新的商務(wù)智能一預(yù)測、模式和發(fā)現(xiàn)。ODM針對以下數(shù)據(jù)挖掘問題為Oracle數(shù)據(jù)庫 10g提供支持:分類、預(yù)測、回歸、聚類、關(guān)聯(lián)、屬性重要性、特性提取以及序列相似性搜 索與分析(BLAST)。所有的建模、評分和元數(shù)據(jù)管理操作都是通過Oracle Data Mining客 戶端以及PL/SQL或基于Java的API來訪問的,并且完全在關(guān)系數(shù)據(jù)庫內(nèi)部進行。IBM Intelligent Miner通過其世界領(lǐng)先的獨有技術(shù),例如典型數(shù)據(jù)集自動生成、關(guān)聯(lián) 發(fā)現(xiàn)、序列規(guī)律發(fā)現(xiàn)、概念性分類和可視化呈現(xiàn),它可以自動實現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù) 據(jù)發(fā)掘和結(jié)果呈現(xiàn)這一整套數(shù)據(jù)發(fā)掘操作。若有必要,對結(jié)果數(shù)據(jù)集還可以重復(fù)這一過程, 直至得到滿意結(jié)果為止?,F(xiàn)在,IBM的Intelligent Miner已形成系列,它幫助用戶從企業(yè) 數(shù)據(jù)資產(chǎn)中識別和提煉有價值的信息。它包括分析軟件工具 In
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 卓別林的課件
- 惠州市高三模擬數(shù)學(xué)試卷
- 湖南湘教版初一數(shù)學(xué)試卷
- 合肥一中數(shù)學(xué)試卷
- 河南體育單招數(shù)學(xué)試卷
- 健康童年暑期活動課件
- 2020-2025年中國土壤化肥速測儀行業(yè)市場調(diào)研分析及投資前景預(yù)測報告
- 中國煤泥行業(yè)調(diào)查報告
- 遼寧省丹東市通遠(yuǎn)堡高中2025年物理高二下期末達標(biāo)測試試題含解析
- 銅排銅條加工項目可行性研究報告
- 2025年中小學(xué)暑假安全教育主題家長會 課件
- 2025年佛山市南海區(qū)圖書館招聘題庫帶答案分析
- 基于學(xué)科核心素養(yǎng)的初中化學(xué)單元整體教學(xué)設(shè)計課題研究的階段小結(jié)基于學(xué)科核心素養(yǎng)的初中化學(xué)單元整體教學(xué)設(shè)計研究
- GMP質(zhì)量管理體系文件 玻璃器皿檢定規(guī)程
- 三年級英語閱讀理解(打印)
- 多彩全動畫像素游戲風(fēng)格PPT模板
- GB/T 4169.19-2006塑料注射模零件第19部分:澆口套
- GB/T 31586.1-2015防護涂料體系對鋼結(jié)構(gòu)的防腐蝕保護涂層附著力/內(nèi)聚力(破壞強度)的評定和驗收準(zhǔn)則第1部分:拉開法試驗
- 領(lǐng)導(dǎo)干部的決策力與執(zhí)行力
- 史上最全最權(quán)威婦產(chǎn)科icd編碼培訓(xùn)【版】課件
- 運梁便道施工技術(shù)方案(填土)
評論
0/150
提交評論