大數(shù)據(jù)分析報(bào)告過程中各個步驟中使用地工具_(dá)第1頁
大數(shù)據(jù)分析報(bào)告過程中各個步驟中使用地工具_(dá)第2頁
大數(shù)據(jù)分析報(bào)告過程中各個步驟中使用地工具_(dá)第3頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)分析過程中各個步驟使用的工具數(shù)據(jù)分析也好,統(tǒng)計(jì)分析也好,數(shù)據(jù)挖掘 也好、商業(yè)智能也好,都需要在學(xué)習(xí)的時候掌 握各種分析手段和技能, 特別是要掌握分析軟件工具! 學(xué)習(xí)數(shù)據(jù)分析,一般是先學(xué)軟件開始, 再去應(yīng)用,再學(xué)會理論和原理! 沒有軟件的方法就不去學(xué)了,因?yàn)閷W(xué)了也不能做, 除非你自己會編程序。下圖是一個頂級的分析工具場,cry st訓(xùn)角卩口卄5必先利DB2君dTAaiEAUIM M ir a ISQLServgp;甲骨共砌企業(yè)級斕分析工具場工欲善其事PPT Swiff ColorWheel Yed Flex XcelsrusUCINFTBu rinass I ntalligancANet D

2、rawEnterprise Miner Clementine依次從X和Y軸看:第一維度:數(shù)據(jù)存儲層 數(shù)據(jù)報(bào)表層 數(shù)據(jù)分析層 數(shù)據(jù)展現(xiàn)層第二維度:用戶級 部門級 企業(yè)級 BI級我結(jié)合上圖和其他資料統(tǒng)計(jì)了我們可能用到的軟件信息。具體的軟件效果還 需要進(jìn)一步研究分析和實(shí)踐。1第一步:設(shè)計(jì)方案可以考慮的軟件工具:mind ma nager。Mind manager(思維導(dǎo)圖又叫心智圖),是表達(dá)發(fā)射性思維的有效的圖形思維工具,它簡單卻又極其有效,是一種革命性的思維工具。 思維導(dǎo)圖運(yùn)用圖文并重的技巧,把各級主題的關(guān)系用相互隸屬與相關(guān)的層級圖表現(xiàn)出來,把主題關(guān)鍵詞與圖像、顏色等建立記憶。思維導(dǎo)圖充分運(yùn)用左右

3、腦的機(jī)能,利用記憶、閱讀、思維的規(guī)律,協(xié)助人們在科學(xué)與藝術(shù)、邏輯 與想象之間平衡發(fā)展,從而開啟人類大腦的無限潛能。思維導(dǎo)圖因此具有人類思維的強(qiáng)大功思維導(dǎo)圖是一種將放射性思考具體化的方法。我們知道放射性思考是人類大腦的自然思考方式,每一種進(jìn)入大腦的資料,不論是感覺、記憶或是想法 一一包括文字、數(shù)字、符碼、 香氣、食物、線條、顏色、意象、節(jié)奏、音符等,都可以成為一個思考中心,并由此中心向外發(fā)散出成千上萬的關(guān)節(jié)點(diǎn),每一個關(guān)節(jié)點(diǎn)代表與中心主題的一個連結(jié),而每一個連結(jié)又可以成為另一個中心主題,再向外發(fā)散出成千上萬的關(guān)節(jié)點(diǎn),呈現(xiàn)出放射性立體結(jié)構(gòu),而這些關(guān)節(jié)的連結(jié)可以視為您的記憶,也就是您的個人數(shù)據(jù)庫。Ws

4、i 產(chǎn)- |-pu iIWrHMiAw2第二步:數(shù)據(jù)采集可以考慮的工具軟件: word、excel、access、oracle、mysql。2.1 Word、Excel 和 Access 等有關(guān)ofice軟件的容,我們就不介紹了。2.2 Oracle Database又名Oracle RDBMS,或簡稱Oracle。是甲骨文公司的一款關(guān)系數(shù)據(jù)庫管理系統(tǒng)。它是在數(shù)據(jù)庫領(lǐng)域一直處于領(lǐng)先地位的產(chǎn)品??梢哉fOracle數(shù)據(jù)庫系統(tǒng)是目前世界上流行的關(guān)系數(shù)據(jù)庫管理系統(tǒng),系統(tǒng)可移植性好、使用方便、功能強(qiáng),適用于各類大、中、小、微機(jī)環(huán) 境。它是一種高效率、可靠性好的適應(yīng)高吞吐量的數(shù)據(jù)庫解決方案 。介紹:hai

5、ke haidu /picti ire/1685727 /1685727/0/f31fhe096h63f6241h74d9268544ehf81a4ca3ee html?fr =lemma&ct=si ngle#aid=0&pic=f31fbe096b63f6241b74d9268544ebf81a4ca3ee2.3 MySQL(發(fā)音為my ess cue el,不是my sequel)是一種開放源代碼的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS),MySQL數(shù)據(jù)庫系統(tǒng)使用最常用的數(shù)據(jù)庫管理語言-結(jié)構(gòu)化查詢語言(SQL)進(jìn)行數(shù)據(jù)庫管理。這個也不做過多介紹。3第三步:數(shù)據(jù)處理可以考慮的工具軟件:Epida

6、ta、excel、 SPSS、ETL3.1 EpiData 工具是一個既可以用于創(chuàng)建數(shù)據(jù)結(jié)構(gòu)文檔,也可以用于數(shù)據(jù)定量分析一組應(yīng)用工具的集合。EpiData協(xié)會于1999年在丹麥成立。EpiData采用Pascal開發(fā)。在允許的情況下, 盡可能地使用開放標(biāo)準(zhǔn)(如HTML )。介紹:baike.baidu./li nk?url=9z2e0tvF9yh7a59W-0sYFNf8sZzjpqL4u11Glxxj4J1HBMtSI8eSJMSTeUZxEMcMIMGo8L nZQCforWxTqwPPda下載地址:bbs.pi /thread-386685-1-1.html3.2 Exc

7、el 工具有關(guān)Office軟件的信息不做介紹3.3 SPSS工具(Statistical Product and Service Solutions ), 統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案 軟件。最初軟 件全稱為 社會科學(xué)統(tǒng)計(jì)軟件包 ”(SolutionsStatistical Package for the Social Sciences ), 但是隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為 統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案”,標(biāo)志著SPSS的戰(zhàn)略方向正在做出重大調(diào)整。為IBM公司推出的一系列用于統(tǒng)計(jì)學(xué)分析運(yùn)算、數(shù)據(jù)挖掘、預(yù)測分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)

8、服務(wù)的總稱 SPSS,有 Windows和Mac OS X等版本。百度百科介紹:baike.baidu./link?url=Sx6UNQj33qC5igpst8Lz2PZI494sD0FAG8fcCYgrVy0 jlSPvvBFmrHEngsfG5ou233d9aAxvgrrlw-NqSiZoa下載地址:.ddooo./softdow n/10039.htm備注:安裝需要注冊碼3.4 ETL模式是英文 Extract-Tra nsform-Load 的縮寫,用來描述將數(shù)據(jù)從來源端經(jīng)過抽?。╡xtract )、轉(zhuǎn)換(transform )、加載(load )至目的端的過程。 ETL 一詞較常用在

9、數(shù)據(jù) 倉庫,但其對象并不限于 數(shù)據(jù)倉庫。ETL是構(gòu)建數(shù)據(jù)倉庫的重要一環(huán),用戶從 數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過 數(shù)據(jù)清洗,最 終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。目前,ETL 工具的典型代表有:lnformatica Datastage、OWB、微軟 DTS、Beeload、Kettle 開源的工具有 eclipse的etl插件。cloveretl.數(shù)據(jù)集成:快速實(shí)現(xiàn)ETL百度百科介紹:baike.baidu./li nk?url=EVI1pZdi9ZtCwa7yCH2LOM87LqVCE6XJVp68rJeB87vOh nvm6XXe_rywObzP m2QflItlw

10、nSDrX5eUpsW8h-Ja0ISIdXVuoMN0P n5d1iCtTu相關(guān)軟件下載:FineBI 工具 222228.htm4第四步:數(shù)據(jù)分析可以考慮的工具軟件:SPSS、SAS、Matlab、Eviews、Stata、Excel、Weka、RapidMiner4.1 SPSS是一個綜合類數(shù)據(jù)分析處理軟件,前面介紹了,我們在這一部分就不再介紹。4.2 SAS(全稱STATISTICAL ANALYSIS SYSTEM ,簡稱SAS )是全球最大的 軟件公司 之一,是由美國NORTH CAROLINA 州立大學(xué)1966年開發(fā)的統(tǒng)計(jì)分析軟件。百度百科介紹:baike.baidu./li n

11、k?url=JNRrNyC3ZhBPJXAL0HtQ2DGFBQP8RYeKWR81b6EtpF9PPuPPyC2AiRgRT2t cnqej3AFYNATem8OdaP-Cp5TDS 7cXwJMxjc oNSocHgru下載地址:bbs.pi /thread-2114285-1-1.html備注:安裝需要虛擬光盤、sid等信息。也可以購買sid。4.3 Matlab每個人都很了解,我就不做太多介紹了。4.4 Eviews是Econo metrics Views 的縮寫,直譯為計(jì)量經(jīng)濟(jì)學(xué)觀察,通常稱為計(jì)量經(jīng)濟(jì)學(xué)軟件包。它的本意是對社會經(jīng)濟(jì)關(guān)系與經(jīng)濟(jì)活動的數(shù)量規(guī)律,采用計(jì)量經(jīng)濟(jì)

12、學(xué)方法與技術(shù)進(jìn)行觀察”。另外Eviews也是美國QMS公司研制的在 Windows下專門從事數(shù)據(jù)分析、 回歸分 析和預(yù)測的工具。使用Eviews可以迅速地從數(shù)據(jù)中尋找出統(tǒng)計(jì)關(guān)系,并用得到的關(guān)系 去預(yù)測數(shù)據(jù)的未來值。Eviews的應(yīng)用圍包括:科學(xué)實(shí)驗(yàn)數(shù)據(jù)分析與評估、金融分析、宏觀經(jīng)濟(jì)預(yù)測、仿真、銷售預(yù)測和成本分析等。介紹:baike.baidu./li nk?url=vLJW8XexwC-_vZ-7sL4zNWZQcCvN4oWRe neCHa7mopZtK4VAvbdF2hUjNwbYlg ngbqTQdcm7ApSfoTwTR4Ct_下載地址:bbs.p in /thread-

13、752891-1-1.html4.5 Stata是一套提供其使用者數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專業(yè)圖表的完整及整合性統(tǒng)計(jì)軟件。它提供許許多多功能,包含線性混合模型、均衡重復(fù)反復(fù)及多項(xiàng)式普羅比模式。Stata其統(tǒng)計(jì)分析能力遠(yuǎn)遠(yuǎn)超過了SPSS,在許多方面也超過了SAS !由于Stata在分析時是將數(shù)據(jù)全部讀入存,在計(jì)算全部完成后才和磁盤交換數(shù)據(jù),因此計(jì)算速度極快(一般來說,SAS的運(yùn)算速度要比 SPSS至少快一個數(shù)量級,而Stata的某些模塊和執(zhí)行同樣 功能的SAS模塊比,其速度又比SAS快將近一個數(shù)量級! )Stata也是采用命令行方式來操作,但使用上遠(yuǎn)比SAS簡單。其生存數(shù)據(jù)分析、縱向數(shù)據(jù)(重復(fù)

14、測量數(shù)據(jù))分析等模塊的功能甚至超過了SAS。用Stata繪制的統(tǒng)計(jì)圖形相當(dāng)精美,很有特色。介紹:baike.baidu./link?url=QUuwD6l50 QADWtvXkXQI5IBf2qvSOvny590h8oxrlF2ar6-axuye6pEOfCpL lifMCaz7LcrnFAfwzsNbOyna下載:bbs.pi /thread-714027-1-1.html4.6 weka全名是懷卡托 智能分析 環(huán)境(Waikato Environment for Knowledge Analysis),是一款免費(fèi)的,非商業(yè)化(與之對應(yīng)的是SPSS公司商業(yè)數(shù)據(jù)挖掘產(chǎn)品-Cle

15、mentine )的,基于JAVA環(huán)境下開源的機(jī)器學(xué)習(xí)(machine learning )以及數(shù)據(jù)挖掘(data minining )軟件。它和它的源代碼可在其官方下載。有趣的是,該軟件的縮寫WEKA也是NewZealand獨(dú)有的一種鳥名,而Weka的主要開發(fā)者同時恰好來自New Zealand的theUni versity of Waikato 。介紹:baike.baidu./li nk?url=AR80v-BY2MUNu2j_JXqwBKDD6Df-hK7_LThpf_4vqUFYY5AlsOL47EwpChPhZi6tzJr8ilP8UQcablDhUj-MPK下載:.xpgod./

16、soft/17508.html4.7 RapidMiner是世界領(lǐng)先的數(shù)據(jù)挖掘解決方案,在一個非常大的程度上有著先進(jìn)技術(shù)。它數(shù)據(jù)挖掘任務(wù)涉及圍廣泛,包括各種數(shù)據(jù)藝術(shù),能簡化數(shù)據(jù)挖掘過程的設(shè)計(jì)和評價。免費(fèi)提供數(shù)據(jù)挖掘技術(shù)和庫100%用Java代碼(可運(yùn)行在大部分操作系統(tǒng)上)數(shù)據(jù)挖掘過程簡單,強(qiáng)大和直觀部XML保證了標(biāo)準(zhǔn)化的格式來表示交換數(shù)據(jù)挖掘過程可以用簡單腳本語言自動進(jìn)行大規(guī)模進(jìn)程多層次的數(shù)據(jù)視圖,確保有效和透明的數(shù)據(jù)圖形用戶界面的互動原型命令行(批處理模式)自動大規(guī)模應(yīng)用Java API (應(yīng)用編程接口)簡單的插件和推廣機(jī)制強(qiáng)大的可視化引擎,許多尖端的高維數(shù)據(jù)的可視化建模值得一提的是,該工具

17、在數(shù)據(jù)挖掘工具榜上位列榜首。備注:下載需要注冊,并付費(fèi)!4.8 Origin為OriginLab公司出品的較流行的專業(yè)函數(shù) 繪圖軟件,是公認(rèn)的簡單易學(xué)、操作靈活、 功能強(qiáng)大的軟件,既可以滿足一般用戶的制圖需要,也可以滿足高級用戶 數(shù)據(jù)分析、函數(shù)擬合的需要。5第五步:數(shù)據(jù)呈現(xiàn)可以考慮的工具軟件:Excel、SAS、SPSS、Crystal Xcelsious 、PPT、Swiff Chart、Foxtable、Cognos、Tableau。5.1 Excel 和 PPT5.2 SAS 和 SPSS這兩類的情況在前面都有介紹,在這一部分也不做太多介紹。5.3 Crystal Xcelsius是全球

18、領(lǐng)先的商務(wù)智能軟件商Business Objects 的最新產(chǎn)品,中文名:水晶易表”。當(dāng)我們需要向客戶和同事展示商業(yè)數(shù)據(jù),但聽眾卻很容易被一大堆數(shù)據(jù)搞得疲倦和困惑。而且,即使人們希望通過增加圖表和圖形來增加展示的效果、來更好地表達(dá)意見,似乎也收效甚微。因?yàn)檫@些靜止的、標(biāo)準(zhǔn)的表現(xiàn)形式看起來都是一樣的。當(dāng)今的市場競爭激烈, 資源短缺,各種組織已經(jīng)大量投資于科技手段以獲得關(guān)于公司運(yùn)營的數(shù)據(jù),但人們很難快速的讓這些數(shù)據(jù)變得有意義從而做出快速、準(zhǔn)確的決策,并保持在競爭的前列。通過如果一那么會(What if)分析來為公司未來的績效進(jìn)行建模,這項(xiàng)工作經(jīng)常是由統(tǒng)計(jì)學(xué)家來完成, 但他們不太了解當(dāng)事人需要做出決

19、策并改善業(yè)績的前沿領(lǐng)域。隨著Crystal Xcelsius的推出,以上問題都會得到解決!只需要簡單的點(diǎn)擊操作,Crystal Xcelsius 就可以令靜態(tài)的excel電子表格充滿生動的 數(shù)據(jù)展示、動態(tài)表格、圖像和可交互的可視化分析,我們還可以通過多種如果-那么會”情景分析進(jìn)行預(yù)測。最后,通過一鍵式整合,這些交互式的 Crystal Xcelsius 分析結(jié)果就可以 輕松的嵌入到 PowerPoint、Adobe PDF 文檔、Outlook和網(wǎng)頁上了。下載地址:.cr173./soft/17186.html備注:破解注冊:使用存注冊破解工具,點(diǎn)擊Patch,在安裝目錄下找到xcelsius

20、.exe,確實(shí),再使用下列序列號注冊:Crystal Xcelsius pro 4.X 序列號:Xcl4Pro-DLR8FHNM14FAMA2B9NDAXcl4Pro-DWQMAHB94R4G0A036AD6Xcl4Pro-NYXA3BDF10R39AAQ12FDXcl4Pro-0TQW42AM01FA156ECARV5.4 Swiff Chart主要可以幫你把商業(yè)或重要學(xué)術(shù)研究上的數(shù)據(jù)制成圖表,并且利用參數(shù)或是加入動作事件”而成為動態(tài)圖表,完成之后更可以輸出成為Flash (*.SFW)格式,或是嵌入Powerpoi nt投影片中,不論用來放在網(wǎng)頁上傳播或是演示文稿使用都十分好用方便。下載地

21、址:dow nl oad.pchome .n et/desig n/homepage/detail-140588.html5.5 Foxtable是狐表軟件公司開發(fā)的軟件。 它將Excel、Access、Foxpro以及易表的優(yōu)勢融合在一起,無論是數(shù)據(jù)錄入、查詢、統(tǒng)計(jì),還是報(bào)表生成,都前所未有的強(qiáng)大和易用,使得 普通用戶無需編寫任何代碼,即可輕松完成復(fù)雜的數(shù)據(jù)管理工作,真正做到拿來即用。下載地址:.n ewasp .n et/soft/107521.html5.6 Cognos是在BI核心平臺之上,以服務(wù)為導(dǎo)向進(jìn)行架構(gòu)的一種數(shù)據(jù)模型,是唯一可以通過單一產(chǎn)品和在單一可靠架構(gòu)上提供完整業(yè)務(wù)智能功能

22、的解決方案。它可以提供無縫密合的報(bào)表、分析、記分卡、儀表盤等解決方案,通過提供所有的系統(tǒng)和資料資源,以簡化公司各員工處理資訊的方法。作為一個全面、靈活的產(chǎn)品,Cog nos業(yè)務(wù)智能解決方案可以容易地整合到現(xiàn)有的多系統(tǒng)和數(shù)據(jù)源架構(gòu)中。Cognos強(qiáng)大的報(bào)表制作和展示功能能夠制作 /展示任何形式的報(bào)表,其純粹的 Web界面使 用方式又使得部署成本和管理成本降到最低。同時Cog nos還可以同數(shù)據(jù)挖掘工具、統(tǒng)計(jì)分析工具配合使用,增強(qiáng)決策分析功能。百度百科介紹:baike.baidu./li nk?url=fOy n8fqlKvz-e5Lu7BB4Zk8_QOwybATKpcUzVN8l1W3z_BwoF3fqhFdlEVNvxRPYTiQljUE-LT0V-V4hpqFJAK下載地址:dow nload.csd n.n et/detail/gallop in gturtle/ 49600515.7 Tableau是桌面系統(tǒng)中最簡單的商業(yè)智能工具軟件,Table

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論