款常用的數(shù)據(jù)挖掘工具推薦_第1頁(yè)
款常用的數(shù)據(jù)挖掘工具推薦_第2頁(yè)
款常用的數(shù)據(jù)挖掘工具推薦_第3頁(yè)
款常用的數(shù)據(jù)挖掘工具推薦_第4頁(yè)
款常用的數(shù)據(jù)挖掘工具推薦_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、12款常用的數(shù)據(jù)挖掘工具推薦數(shù)據(jù)挖掘工具是使用數(shù)據(jù)挖掘技術(shù)從大型數(shù)據(jù)集中發(fā)現(xiàn)并識(shí)別模式的計(jì)算機(jī)軟 件。數(shù)據(jù)在當(dāng)今世界中就意味著金錢,但是因?yàn)榇蠖鄶?shù)數(shù)據(jù)都是非結(jié)構(gòu)化的。 因此,擁有數(shù)據(jù)挖掘工具將成為幫助您獲得正確數(shù)據(jù)的一種方法。常用的數(shù)據(jù)挖掘工具RR是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲(chǔ)和處 理系統(tǒng);數(shù)組運(yùn)算工具(其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大);完整連貫的 統(tǒng)計(jì)分析工具;優(yōu)秀的統(tǒng)計(jì)制圖功能;簡(jiǎn)便而強(qiáng)大的編程語(yǔ)言:可操縱數(shù)據(jù)的 輸入和輸出,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。2. Oracle 數(shù)據(jù)挖掘(ODM)Oracle Data Mining是Oracle的一個(gè)數(shù)

2、據(jù)挖掘軟件。Oracle數(shù)據(jù)挖掘是在Oracle數(shù)據(jù)庫(kù)內(nèi)核中實(shí)現(xiàn)的,挖掘模型是第一類數(shù)據(jù)庫(kù)對(duì)象。Oracle數(shù)據(jù)挖掘 流程使用Oracle數(shù)據(jù)庫(kù)的內(nèi)置功能來(lái)最大限度地提高可伸縮性并有效利用系統(tǒng) 資源。3. Tableau LisvAirJf她.1#牛叫.Il n,fti hTanlrtyTableau提供了一系列專注于商業(yè)智能的交互式數(shù)據(jù)可視化產(chǎn)品。Tableau允許 通過(guò)將數(shù)據(jù)轉(zhuǎn)化為視覺(jué)上吸引人的交互式可視化(稱為儀表板)來(lái)實(shí)現(xiàn)數(shù)據(jù)的 洞察與分析。這個(gè)過(guò)程只需要幾秒或幾分鐘,并且通過(guò)使用易于使用的拖放界 面來(lái)實(shí)現(xiàn)。ScrapyPython LibraryScrapy, Python開發(fā)的一個(gè)

3、快速、高層次的屏幕抓取和web抓取框架,用于抓 取web站點(diǎn)并從頁(yè)面中提取結(jié)構(gòu)化的數(shù)據(jù)。Scrapy用途廣泛,可以用于數(shù)據(jù)挖 掘、監(jiān)測(cè)和自動(dòng)化測(cè)試。6、WekaWeka作為一個(gè)公開的數(shù)據(jù)挖掘工作平臺(tái),集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機(jī) 器學(xué)習(xí)算法,包括對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,分類,回歸、聚類、關(guān)聯(lián)規(guī)則以及在新 的交互式界面上的可視化。Weka高級(jí)用戶可以通過(guò)Java編程和命令行來(lái)調(diào)用其分析組件。同時(shí),Weka也 為普通用戶提供了圖形化界面,稱為Weka KnowledgeFlow Environment和Weka Explorer。和R相比,Weka在統(tǒng)計(jì)分析方面較弱,但在機(jī)器學(xué)習(xí)方面要強(qiáng) 得多。7、

4、RapidMinerRapid Miner,原名YALE又一個(gè)學(xué)習(xí)環(huán)境,是一個(gè)用于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘?qū)嶒?yàn) 的環(huán)境,用于研究和實(shí)際的數(shù)據(jù)挖掘任務(wù)。毫無(wú)疑問(wèn),這是世界領(lǐng)先的數(shù)據(jù)挖 掘開源系統(tǒng)。該工具以Java編程語(yǔ)言編寫,通過(guò)基于模板的框架提供高級(jí)分 析。8、八爪魚采集器n: c0簡(jiǎn)扃來(lái)集悶=三和充E .云H理n. -ssss立削更弓軟阪程-旦am查看更多八爪魚是一款通用網(wǎng)頁(yè)數(shù)據(jù)采集器,使用簡(jiǎn)單,完全可視化操作;功能強(qiáng)大, 任何網(wǎng)站均可采集,數(shù)據(jù)可導(dǎo)出為多種格式。File Ed 計(jì)ViewHrlpA KNIME hiplDier E3+ I- bll 痹幻I*片.Tram EodtelApply

5、rnorfel沖40uecKionTree LeanwrDclsiriinv mQdlBl accuracyJavnrinpEBarCteH:MiniipuIrtlElflEXAMPLES (knrme-gueskhtk;/.1 LOCAL acal 而rkspga vz) An dlcs Datiti以玨 Other Data Typ*s Str uctured DbtLsi ej Scripting可 Tgl In財(cái)ratici n g KMIMEUbfi)匕#5捋1站加傾I lift Srul Medij F?| RepcrtingChefnistry4 iTtinqAssflgn ca

6、lofsueSn in&ePredHzIorKJNIME Analytics PlatformKNIME是一個(gè)基于Eclipse平臺(tái)開發(fā),模塊化的數(shù)據(jù)挖掘系統(tǒng)。它能夠讓用戶可 視化創(chuàng)建數(shù)據(jù)流(也就常說(shuō)的pipeline),選擇性的執(zhí)行部分或所有分解步驟, 然后通過(guò)數(shù)據(jù)和模型上的交互式視圖研究執(zhí)行后的結(jié)果。KNIME中每個(gè)節(jié)點(diǎn)都帶有交通信號(hào)燈,用于指示該節(jié)點(diǎn)的狀態(tài)(未連接、未配 置、缺乏輸入數(shù)據(jù)時(shí)為紅燈;準(zhǔn)備執(zhí)行為黃燈;執(zhí)行完畢后為綠燈)。在 KNIME中有個(gè)特色功能一一HiLite,允許用戶在節(jié)點(diǎn)結(jié)果中標(biāo)記感興趣的記錄, 并進(jìn)一步展開后續(xù)探索。Orange是一個(gè)以Python語(yǔ)言編寫的基于組件

7、的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)軟件套 件。它是一個(gè)開放源碼的數(shù)據(jù)可視化和分析的新手和專家。數(shù)據(jù)挖掘可以通過(guò) 可視化編程或Python腳本進(jìn)行。它還包含了數(shù)據(jù)分析、不同的可視化、從散點(diǎn) 圖、條形圖、樹、到樹圖、網(wǎng)絡(luò)和熱圖的特征。11、IBM SPSS ModelerIBM SPSS Modeler工具工作臺(tái)最適合處理文本分析等大型項(xiàng)目,其可視化界面 非常有價(jià)值。它允許您在不編程的情況下生成各種數(shù)據(jù)挖掘算法。它也可以用 于異常檢測(cè)、貝葉斯網(wǎng)絡(luò)、CARMA、Cox回歸以及使用多層感知器進(jìn)行反向傳 播學(xué)習(xí)的基本神經(jīng)網(wǎng)絡(luò)。12、 PentahoOpenedv c? E-r板源Nh的wk I二困口Pentaho為數(shù)

8、據(jù)集成、業(yè)務(wù)分析以及大數(shù)據(jù)處理提供一個(gè)全面的平臺(tái)。使用這 種商業(yè)工具,你可以輕松地混合各種來(lái)源的數(shù)據(jù),通過(guò)對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行分析可 以為未來(lái)的決策提供正確的信息引導(dǎo)。Pentaho整合了多個(gè)開源項(xiàng)目,目標(biāo)是和商業(yè)BI相抗衡。它偏向于與業(yè)務(wù)流程 相結(jié)合的BI解決方案,側(cè)重于大中型企業(yè)應(yīng)用。它允許商業(yè)分析人員或開發(fā) 人員創(chuàng)建報(bào)表,儀表盤,分析模型,商業(yè)規(guī)則和BI流程。12、NLTKNLTK適用于語(yǔ)言處理任務(wù),因?yàn)樗梢蕴峁┮粋€(gè)語(yǔ)言處理工具,包括數(shù)據(jù)挖 掘、機(jī)器學(xué)習(xí)、數(shù)據(jù)抓取、情感分析等各種語(yǔ)言處理任務(wù)。而您需要做的只是 安裝NLTK,然后將一個(gè)包拖拽到您最喜愛(ài)的任務(wù)中,您就可以去做其他事了。 因?yàn)樗?/p>

9、用Python語(yǔ)言編寫的,你可以在上面建立應(yīng)用,還可以自定義它的小 任務(wù)。以上介紹的幾款軟件都是優(yōu)秀的開源數(shù)據(jù)挖掘軟件,各有所長(zhǎng),同時(shí)也各有缺 點(diǎn)。讀者可以結(jié)合自己的需求來(lái)進(jìn)行選擇,或者組合使用多個(gè)軟件。本文來(lái)自于:相關(guān)閱讀:大數(shù)據(jù)技術(shù)是什么?有哪些特點(diǎn)? 大數(shù)據(jù)常見(jiàn)開發(fā)工具有哪些? 2018 大數(shù)據(jù) 10 大發(fā)展趨勢(shì) 微博數(shù)據(jù)采集淘寶數(shù)據(jù)采集 八爪魚一一90萬(wàn)用戶選擇的網(wǎng)頁(yè)數(shù)據(jù)采集器。1、操作簡(jiǎn)單,任何人都可以用:無(wú)需技術(shù)背景,會(huì)上網(wǎng)就能采集。完全可視化 流程,點(diǎn)擊鼠標(biāo)完成操作,2分鐘即可快速入門。2、功能強(qiáng)大,任何網(wǎng)站都可以采:對(duì)于點(diǎn)擊、登陸、翻頁(yè)、識(shí)別驗(yàn)證碼、瀑布 流、Ajax腳本異步加載數(shù)據(jù)的網(wǎng)頁(yè),均可經(jīng)過(guò)簡(jiǎn)單設(shè)置進(jìn)行采

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論