商業(yè)智能介紹090804_第1頁
商業(yè)智能介紹090804_第2頁
商業(yè)智能介紹090804_第3頁
商業(yè)智能介紹090804_第4頁
商業(yè)智能介紹090804_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

商業(yè)智能(Businessintelligence介紹刖言2007年3月,甲骨文以33億美元價格收購企業(yè)績效管理軟件廠商Hyperion(海波龍),同年4月,BusinessObjects宣布收購Cartesis,BusinessObjects公司需要支付的總交易金額為2.25億歐元(約合3億美元)現(xiàn)金。10月8日,德國軟件巨頭SAP周日表示,將以48億歐元(約合68億美元)現(xiàn)金收購法國商業(yè)智能軟件開發(fā)商博奧杰(BusinessObjects)o商業(yè)智能并購金額如此巨大,顯示必須有相應(yīng)的市場規(guī)模,BI公司才會擁有如此市值。昂貴的商業(yè)智能分析軟件,必然伴隨著商業(yè)智能分析項目的高額軟件使用許可費用和實施成本,這還不包括項目實施潛在的失敗風(fēng)險!最重要的,商業(yè)智能看似日益普及,中小企業(yè)是否可以從中受益?什么是商業(yè)智能呢?先讓我們來看看有關(guān)權(quán)威機構(gòu)是如何對商業(yè)智能定義的!第一部分權(quán)威機構(gòu)對商業(yè)智能的定義GartnerGroup--(全球最具權(quán)威的IT研究與顧問咨詢公司。其研究范圍覆蓋全部IT產(chǎn)業(yè),就IT的研究、發(fā)展、評估、應(yīng)用、市場等領(lǐng)域,為客戶提供客觀、公正的論證報告及市場調(diào)研報告,協(xié)助客戶進行市場分析、技術(shù)選擇、項目論證、投資決策)l商業(yè)智能描述了一系列的概念和方法,通過應(yīng)用基于事實的支持系統(tǒng)來輔助商業(yè)決策的制定。2商業(yè)智能技術(shù)提供使企業(yè)迅速分析數(shù)據(jù)的技術(shù)和方法,包括收集、管理和分析數(shù)據(jù),將這些數(shù)據(jù)轉(zhuǎn)化為有用的信息,然后分發(fā)到企業(yè)各處。IDC--(是IDG(國際數(shù)據(jù)集團)旗下子公司,全球著名的信息技術(shù)、電信行業(yè)和消費科技市場咨詢、顧問和活動服務(wù)專業(yè)提供商)l商業(yè)智能是一組軟件工具的集合:終端用戶查詢和報告工具:專門用來支持初級用戶的原始數(shù)據(jù)訪問,不包括適用于專業(yè)人士的成品報告生成工具OLAP工具:提供多維數(shù)據(jù)管理環(huán)境,其典型的應(yīng)用是對商業(yè)問題的建模與商業(yè)數(shù)據(jù)分析。OLAP也被稱為多維分析數(shù)據(jù)挖掘(DataMining)軟件:使用諸如神經(jīng)網(wǎng)絡(luò)、規(guī)則歸納等技術(shù),用來發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系,做出基于數(shù)據(jù)的推斷。數(shù)據(jù)集市(DataMart)和數(shù)據(jù)倉庫(DataWarehouse)產(chǎn)品:包括數(shù)據(jù)轉(zhuǎn)換、管理和存取等方面的預(yù)配置軟件,通常還包括一些業(yè)務(wù)模型,如財務(wù)分析模型。主管信息系統(tǒng)(EIS,ExecutiveInformationSystem)通俗地說BI就是收集相關(guān)信息并加以分析,以幫助您做決策。成功的BI系統(tǒng)多采用了數(shù)據(jù)倉庫技術(shù)。AMT--(AMTGroup是國內(nèi)管理理念、管理工具與信息技術(shù)領(lǐng)域創(chuàng)辦時間最長、最具影響力的權(quán)威中立資訊機構(gòu),也是率先開展企業(yè)管理、應(yīng)用軟件培訓(xùn)推廣和企業(yè)管理技術(shù)應(yīng)用咨詢、研究的領(lǐng)導(dǎo)型組織。)l商務(wù)智能,由Businessintelligence翻譯而來,簡稱BI,是用信息技術(shù)來收集、管理和分析結(jié)構(gòu)化和非結(jié)構(gòu)化的商務(wù)數(shù)據(jù)和信息,創(chuàng)造和累積商務(wù)知識和見解,改善商務(wù)決策水平。2從信息系統(tǒng)的角度來看,它包括如下的工具集合:用戶查詢和報表工具、OLAP工具、數(shù)據(jù)挖掘工具、數(shù)據(jù)倉庫、ETL工具、元數(shù)據(jù)管理工具。中程在線--(隸屬于中國科學(xué)院軟件研究所高級技術(shù)培訓(xùn)中心)l商業(yè)智能也稱作BI是英文單詞Businessintelligence的縮寫。2商業(yè)智能通常被理解為將企業(yè)中現(xiàn)有的數(shù)據(jù)轉(zhuǎn)化為知識,幫助企業(yè)做出明智的業(yè)務(wù)經(jīng)營決策的工具。3這里所談的數(shù)據(jù)包括來自企業(yè)業(yè)務(wù)系統(tǒng)的訂單、庫存、交易賬目、客戶和供應(yīng)商等來自企業(yè)所處行業(yè)和競爭對手的數(shù)據(jù)以及來自企業(yè)所處的其他外部環(huán)境中的各種數(shù)據(jù)。4商業(yè)智能能夠輔助的業(yè)務(wù)經(jīng)營決策,既可以是操作層的,也可以是戰(zhàn)術(shù)層和戰(zhàn)略層的決策。5為了將數(shù)據(jù)轉(zhuǎn)化為知識,需要利用數(shù)據(jù)倉庫、聯(lián)機分析處理(OLAP)工具和數(shù)據(jù)挖掘等技術(shù)。第二部分從三個視角觀察商業(yè)智能對很多初次接觸商業(yè)智能的人士來說,權(quán)威機構(gòu)對商業(yè)智能概念的描述仍然不是非常清晰。究其原因,在于這些機構(gòu)都是在用少而專業(yè)的詞匯精確地闡述概念。所以,對一般讀者來說往往有不甚明了的感覺。所以,如果我們不是抱著學(xué)術(shù)研究的目標(biāo)去理解商業(yè)智能,而是站在使用者的角度去審視商業(yè)智能,反而可以有一個更加清晰的認(rèn)識。我們可以從三方面去認(rèn)識商業(yè)智能。一是商業(yè)智能帶給我們什么內(nèi)容?二是商業(yè)智能的特點有哪些?三是使用什么技術(shù)和工具實現(xiàn)商業(yè)智能?一、商業(yè)智能帶給我們什么內(nèi)容?說到商業(yè)智能,我們先說說智能,以及人工智能。智能(intelligence),目前對其定義尚無統(tǒng)一的意見。一般認(rèn)為,智能是指個體對客觀事物進行合理分析、判斷及有目的地行動和有效地處理周圍環(huán)境事宜的綜合能力,智能由語言理解、用詞流暢、數(shù)、空間、聯(lián)系性記憶、感知速度及一般思維7種因子組成。人工智能AI(Artificialintelligence),最初是在1956年Dartmouth學(xué)會上提出的,是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計算機科學(xué)的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器,該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。商業(yè)智能,可以理解為運用在商務(wù)領(lǐng)域的智能,或者運用在商務(wù)領(lǐng)域的人工智能。商業(yè)智能的概念最早是GartnerGroup的HowardDresner于1996年提出來的。當(dāng)時將商業(yè)智能定義為一類由數(shù)據(jù)倉庫(或數(shù)據(jù)集市)、查詢報表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、數(shù)據(jù)備份和恢復(fù)等部分組成的、以幫助企業(yè)決策為目的技術(shù)及其應(yīng)用。當(dāng)時的預(yù)測說:到2000年,信息民主(注:指組織內(nèi)信息共享的無差別性)將在具有前瞻性思維的企業(yè)中浮現(xiàn)。借助商業(yè)智能,員工、咨詢員、客戶、供應(yīng)商以及公眾能夠有效地運用信息。商業(yè)智能所涉及的技術(shù)與應(yīng)用,在HowardDresner命名之前就有,最初被稱為主管信息系統(tǒng)(EIS,EnterpriseInformationSystem),之后又被稱為決策支持系統(tǒng)(DSS,DecisionSupportSystem)。如此看來,商務(wù)智能的目標(biāo),是為決策服務(wù)的。所以我們需要了解,在商務(wù)領(lǐng)域,我們有哪些環(huán)節(jié)和領(lǐng)域需要決策呢?類似于人工智能,商業(yè)智能也是模擬、延伸和擴展人的智能,只不過其領(lǐng)域在于商業(yè)之中。在商業(yè)領(lǐng)域,決策也可以劃分出不同的層次和階段。按照決策程序的特點,我們可以將決策劃分出初級、中級和高級階段。1、決策的初級階段在初級階段,決策所需要的信息是對原始數(shù)據(jù)的分類、匯總、排序,以獲得對經(jīng)營活動的直觀印象;譬如,一般企業(yè)最為關(guān)注的是銷售額和銷售量信息。在關(guān)注銷售信息的同時,必須從多個角度來考察。最基本的信息是每天的、甚至是每筆交易的銷售數(shù)量和銷售金額。這就是從時間這個角度來關(guān)注銷售信息的。除了時間角度以外,企業(yè)還會從區(qū)域的角度來考察,到底是哪些區(qū)域為公司貢獻的銷售最大?是國外市場還是國內(nèi)市場?是華東地區(qū)還是華南地區(qū)?在華南地區(qū),是廣東省還是福建省還是廣西自治區(qū)...對于銷售情況來說,還必須了解的情況,就是銷售商品(或者提供服務(wù))的信息,企業(yè)必須了解可供出售的商品品種(或服務(wù))各自的分類銷售情況,而不是僅僅有一個匯總數(shù)據(jù)。企業(yè)需要了解哪些類別、哪些品種的產(chǎn)品(或服務(wù))為公司貢獻的銷售最大..除了時間、區(qū)域、產(chǎn)品角度以外,企業(yè)還可以從更多的角度去了解公司的銷售信息,可以從客戶的角度、從供應(yīng)商的角度、從本企業(yè)銷售事業(yè)部和銷售員的角度、從銷售信貸額度與應(yīng)收賬款比較的角度、從應(yīng)收賬款的帳齡等角度進行查詢。又譬如庫存管理,最基本的是庫存量信息,以及庫存占用資金信息。對于庫存管理,還會包括最低和最高庫存的額度管理,庫存存儲時間,即呆滯庫存分析、庫存的批次批號管理等等。因此,為了全面分析庫存信息,首先需要對庫存按照商品種類進行分類,如原材料、主要原料、輔助材料、委外加工、半成品、產(chǎn)成品、外購商品、備品備件、低值易耗品等,或者,按照材料的金額和重要性,劃分ABC類別等。其次,還需要從存儲的倉庫庫房、庫位的角度、供應(yīng)商的角度、入庫時間的角度、存儲時期的角度等等去觀測庫存的數(shù)量和金額,以及與最高最低額度的比較數(shù)據(jù),保質(zhì)期與呆滯期的比較信息等等,來獲得和觀察企業(yè)運行的信息。2、決策的中級階段在中級階段,是對分類匯總數(shù)據(jù)中的明細(xì)數(shù)據(jù)和相關(guān)KPI的展現(xiàn),以及對相關(guān)聯(lián)的明細(xì)數(shù)據(jù),從不同角度進行的交叉觀測,以獲得對數(shù)據(jù)反映出的商業(yè)結(jié)果的原因探索;我們獲得了商業(yè)活動的初步信息,并不是商業(yè)智能分析的結(jié)束,而恰恰是進一步分析的開始。假如我們獲得了公司每個月總銷售毛利率的信息,發(fā)現(xiàn)今年第三個季度的前2個月的總毛利率與去年或者與上個季度相比是正常的,而最后一個月的總毛利率卻突然急劇地下降。于是我們希望了解其中的原因。我們最初從時間的角度,發(fā)現(xiàn)了總毛利率數(shù)據(jù)的急劇波動,現(xiàn)在我們可以立即轉(zhuǎn)換觀測的角度,我們可以從商品或者品牌的角度,去觀測哪些商品的銷售毛利發(fā)生了變化,結(jié)果可能會是:第三個月份,銷售了大量之前沒有銷售的毛利很低的商品;或者之前銷售的毛利很高的商品,本月銷售情況非常不好;或者,某些商品的銷售價格大幅下降;或者,某些商品的生產(chǎn)或者采購成本大幅上升......下一步,我們就可以立即把這些商品篩選出來,觀察這些商品是什么品牌的,賣給了哪些客戶,或者是從哪些供應(yīng)商處購買......或者,我們可以立即從銷售事業(yè)部和銷售員或者采購部門和采購員的角度去觀察,了解對于該類商品,采取了哪些銷售策略和促銷手段?是哪些部門和哪些人員在負(fù)責(zé)這些影響毛利的重要商品的銷售和采購工作;或者,我們也可以立即從倉庫的角度,了解到本月處理了大批呆滯的庫存商品在中級分析階段,我們還可以從一些關(guān)鍵績效指標(biāo)的變動情況,來了解企業(yè)經(jīng)營的情況。譬如:應(yīng)收賬款周轉(zhuǎn)次數(shù)和天數(shù)指標(biāo),可以反映應(yīng)收款的回收速度,反映出對企業(yè)現(xiàn)金流的影響;存貨周轉(zhuǎn)次數(shù)和天數(shù)指標(biāo),則可以反映企業(yè)存貨周轉(zhuǎn)的速度,反映出存貨占用資金的夕官多寡。KPI指標(biāo)是濃縮了企業(yè)經(jīng)營成果的反映器,這些指標(biāo)可以從多方面反映企業(yè)的運作情況。譬如:財務(wù)分析指標(biāo)包括負(fù)債權(quán)益比率、毛利潤率、凈利潤率、流動比率、權(quán)益回報率、現(xiàn)金流量銷售額比率、預(yù)算差異、資產(chǎn)回報率等;反映客戶管理的指標(biāo)包括客戶保有率、客戶滿意度、客戶盈利率、每個期間流失的客戶、每個期間增加的客戶等;反映流程管理的指標(biāo)如交貨延誤率、準(zhǔn)時交貨率、運費總成本比等;反映人力資源方面的雇員滿意度指標(biāo)、單位雇員培訓(xùn)成本、單位雇員培訓(xùn)時間等等。在中級決策階段,這些關(guān)聯(lián)分析和KPI分析,可以很好地為決策者提供依據(jù),使決策建立在科學(xué)的、可度量的基礎(chǔ)之上,從而避免在復(fù)雜的經(jīng)營環(huán)境中的決策迷失。3、決策的高級階段在高級階段,則是根據(jù)數(shù)據(jù),對未來做出的趨勢判斷,或者根據(jù)特定數(shù)學(xué)模型獲得的分類信息,以對未來的商業(yè)行為提供行動指南。高級分析要取得實際效果,需要2個基本要素:基礎(chǔ)數(shù)據(jù)的準(zhǔn)確完備和經(jīng)驗值準(zhǔn)確把握。實際上,盡管高級分析仍然在經(jīng)營大環(huán)境的控制當(dāng)中,譬如政策因素、行業(yè)內(nèi)科技大事件的影響因素、競爭對手行動的影響等,但是,建立在科學(xué)的數(shù)學(xué)模型基礎(chǔ)上的預(yù)測,仍然在開源節(jié)流等各方面都具備極大潛力。高級分析使用特定的數(shù)學(xué)模型和方法來進行預(yù)測。如使用預(yù)測中常用的趨勢分析法的指數(shù)平滑分析、時間序列回歸分析等方法,以及數(shù)據(jù)挖掘技術(shù)和運籌規(guī)劃中的其他方法等等。1、銷售預(yù)測銷售預(yù)測無疑是企業(yè)全面預(yù)算管理中最重要的環(huán)節(jié),而且是全面預(yù)算的源頭。企業(yè)的生產(chǎn)預(yù)算、采購預(yù)算、資本性支出預(yù)算、現(xiàn)金流量預(yù)算、籌資預(yù)算等等,莫不與之相關(guān)。銷售預(yù)測需要根據(jù)已發(fā)生業(yè)務(wù)的銷售數(shù)據(jù),結(jié)合未來影響因素,預(yù)計未來的銷售量和銷售額。企業(yè)獲得以往銷售數(shù)據(jù),首先需要在初級和中級分析階段獲得的多維數(shù)據(jù)的基礎(chǔ)上,對銷售數(shù)據(jù)進行明細(xì)的分類和匯總。這是因為不同類型的產(chǎn)品、不同品牌、不同地區(qū)、不同客戶等,其業(yè)績的基礎(chǔ)、變化趨勢可能存在差異,不同經(jīng)驗值的確定會對預(yù)測數(shù)據(jù)產(chǎn)生很大的影響。常用的方法,指數(shù)平滑法,就是根據(jù)按照時間序列的銷售數(shù)據(jù),根據(jù)經(jīng)驗確定一個權(quán)數(shù)a。(公式:Ft=aAt+(1-a)At-1)?;貧w分析法,根據(jù)y=a+bx的直線方程式,按照最小平方法的原理確定一條能正確反映自變量x和因變量y之間關(guān)系的直線。直線方程中的常數(shù)項a和系數(shù)b可根據(jù)多次數(shù)據(jù)計算得到。如果銷售歷史數(shù)據(jù)呈現(xiàn)出類似直線變化趨勢時,可以應(yīng)用回歸分析法進行銷售預(yù)測,y表示銷售量(或銷售額),x表示間隔期(即觀測期)。2、銷售自行車的廣告投遞決策自行車廠商想要通過廣告宣傳來吸引顧客。他們從各地的超市獲得超市會員的信息,計劃將廣告冊和禮品投遞給這些會員。但是投遞廣告冊是需要成本的,不可能投遞給所有的超市會員。而這些會員中有的人會響應(yīng)廣告宣傳,有的人就算得到廣告冊不會購買。所以最好是將廣告投遞給那些對廣告冊感興趣從而購買自行車的會員。分類模型的作用就是識別出什么樣的會員可能購買自行車。在分類模型中,將會員的婚姻狀況、性別、年齡等特征作為源數(shù)據(jù),所需預(yù)測的分類是客戶是否購買了自行車。根據(jù)分析模型得到的結(jié)論是:年齡小于32歲,居住在閔行地區(qū)的會員有72.75%的概率購買自行車;年齡在32和39歲之間的會員有68.42%的概率購買自行車;年齡在39和67歲之間,上班距離不大于10公里,只有1輛汽車的會員有66.08%的概率購買自行車;年齡小于32歲,不住在閔行地區(qū),上班距離在1公里范圍內(nèi)的會員有51.92%的概率購買自行車;在得到了分類模型后,將其他的會員在分類模型中查找就可預(yù)測會員購買自行車的概率有多大。隨后自行車廠商就可以有選擇性的投遞廣告冊。二、商業(yè)智能的特點有哪些?商業(yè)上的決策分析,是早在計算機科學(xué)出現(xiàn)之前就已經(jīng)存在的。那么現(xiàn)在流行的商業(yè)智能分析技術(shù),為什么會以這樣的嶄新的方式被提出來呢?技術(shù)的進步會給傳統(tǒng)的操作和使用方式,帶來革命性的變化,這已經(jīng)無數(shù)次被證明。商業(yè)智能分析技術(shù),也會證明這一點。商業(yè)智能技術(shù),首先是基于信息的大規(guī)模生產(chǎn)和數(shù)據(jù)庫技術(shù)的運用。目前,商業(yè)智能具有如下特點:1、即時性傳統(tǒng)手工數(shù)據(jù)處理,從數(shù)據(jù)收集、整理到分類、匯總,都需要經(jīng)歷漫長的時間過程。但是,商業(yè)智能使用的技術(shù),可以實時地從業(yè)務(wù)系統(tǒng)中獲得最新的數(shù)據(jù)。在對時間性敏感的決策分析中,這一點尤其重要。2、準(zhǔn)確性在準(zhǔn)確性方面,因為計算機數(shù)據(jù)處理,避免了手工操作中存在的失誤,所以計算結(jié)果是絕對準(zhǔn)確和可靠的。當(dāng)然,這其中會存在因為業(yè)務(wù)邏輯關(guān)系的缺失而導(dǎo)致的錯誤,即程序中設(shè)定的限制條件不充分而導(dǎo)致數(shù)據(jù)失誤。所以,對待重要的決策信息,應(yīng)同時建立數(shù)據(jù)核對機制,以保證建立在即時信息的準(zhǔn)確性基礎(chǔ)上的決策的正確。3、自動化商業(yè)智能技術(shù),包括一個數(shù)據(jù)抽取、轉(zhuǎn)換、裝載ETL)的過程,這個過程可以按照用戶的要求,設(shè)定ETL的時間和周期,因此,整個基礎(chǔ)數(shù)據(jù)的獲得、數(shù)據(jù)的處理,以及數(shù)據(jù)的展現(xiàn),都是一個自動化的過程,無需手工參與。使用者每日甚至每時獲得的信息,都可以是最新數(shù)據(jù)。這就為決策分析信息提供者的工作帶來了極大的便利。4、靈活性決策支持的展現(xiàn)方式靈活多樣,充分體現(xiàn)了智能的特點。對于初級階段分析的展示,可以使用圖標(biāo)和圖形的方式。譬如結(jié)構(gòu)百分比,可以使用餅圖、三維餅圖的方式;對于趨勢百分比、同比、定比、環(huán)比,可以使用折線圖、柱狀圖等;對于KPI指標(biāo),可以使用儀表盤管理;其他的散點圖、泡泡圖等,都可以根據(jù)實際業(yè)務(wù)的需要而建立。在圖表數(shù)據(jù)方面,可以進行數(shù)據(jù)的鉆取、旋轉(zhuǎn)和切片操作。當(dāng)需要進一步了解明細(xì)數(shù)據(jù)的時候,需要使用數(shù)據(jù)鉆取功能,當(dāng)需要從不同的角度觀測數(shù)據(jù)以發(fā)現(xiàn)數(shù)據(jù)變動規(guī)律時,需要利用多維數(shù)據(jù)的旋轉(zhuǎn)功能,而當(dāng)需要關(guān)注特定數(shù)據(jù)的時候,可以對特定區(qū)域的數(shù)據(jù)進行切片分析。商業(yè)智能分析的靈活性,建立在分析模型設(shè)計時周全的考慮。三、使用什么技術(shù)和工具實現(xiàn)商業(yè)智能?商業(yè)智能分析工具,是傳統(tǒng)方法的計算機化。因為計算機處理的高速度,使得原本手工處理幾乎不可能完成的工作變成可能。1、數(shù)據(jù)源OLTP&DB&OTHERS企業(yè)應(yīng)用軟件,經(jīng)歷了一個MRP、MRPII、CRM、SCM、ERP的過程,通常這些應(yīng)用軟件是為了提高企業(yè)運營效率而使用,其中內(nèi)含先進的流程。這些應(yīng)用軟件被稱為在線交易系統(tǒng)(OLTP),在線交易系統(tǒng)的數(shù)據(jù)庫中,存儲了企業(yè)經(jīng)營的大量數(shù)據(jù)??梢宰鳛樵诰€分析系統(tǒng)的原料,來制作報表,提供分析決策信息。同時,企業(yè)其他的文件,諸如Excel電子表格、txt文檔、Assess小型數(shù)據(jù)庫中的信息,甚至可從網(wǎng)絡(luò)中獲得的XML文件,都可以作為在線分析系統(tǒng)的原來,進行商業(yè)智能分析。在這方面,大型應(yīng)用軟件如SAP、ORACLE,中型的如用友、金蝶等,都屬于OLTP。2、數(shù)據(jù)抽取、轉(zhuǎn)換與裝載ETLExtraction>Transformation、Loading0ETL負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時中間層后進行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。從應(yīng)用系統(tǒng),或者Excel、TXT文檔中獲得的數(shù)據(jù),其中可能存在不規(guī)范的數(shù)據(jù),稱為垃圾數(shù)據(jù),如字段值缺失的數(shù)據(jù)、重復(fù)的數(shù)據(jù)、不規(guī)范的字符等,都需要清除;或者需要將文本型日期數(shù)據(jù)轉(zhuǎn)換成日期型數(shù)據(jù),這些都需要相應(yīng)的工具來完成。如:對于省份信息,有的系統(tǒng)的標(biāo)記是廣東省,有的標(biāo)記為廣東,有的標(biāo)記是粵,但是在分析系統(tǒng)進行數(shù)據(jù)匯總時,需要標(biāo)記一致,因此,需要在轉(zhuǎn)換時將不同標(biāo)記符號統(tǒng)一化。在這方面,微軟的SQLServer2005種的SSIS工具,是很好的ETL工具,其他的還有Informatica、Datastage等。3、數(shù)據(jù)倉庫DW數(shù)據(jù)倉庫,就是數(shù)據(jù)庫而已。第一、通常應(yīng)用程序使用的數(shù)據(jù)庫中表的設(shè)計原則是減少冗余,遵循范式。而數(shù)據(jù)倉庫,恰恰要求冗余數(shù)據(jù)。第二、數(shù)據(jù)倉庫存儲DLTP系統(tǒng)中所有時間累積的數(shù)據(jù)。數(shù)據(jù)倉庫,顧名思義,是大量存儲數(shù)據(jù)的地方,多維分析的技術(shù)要求數(shù)據(jù)倉庫的數(shù)據(jù)冗余。凡是數(shù)據(jù)庫的提供者,都可以是數(shù)據(jù)倉庫的載體的提供者,如SQLServer>Oracle>Sybase等等。4、多維數(shù)據(jù)集合(在線分析)OLAP多維數(shù)據(jù)集合是這樣一種存在形式:對于銷售金額,我們把它看作是度量值,我們從銷售時間、客戶、商品的角度去觀察它。觀察的角度稱為維度。多維數(shù)據(jù),其實就是是對數(shù)據(jù)倉庫數(shù)據(jù)使用SQL語句Groupby的結(jié)果,Groupby的成員就是維度,聚合的數(shù)據(jù)就是度量值。但是因為多維數(shù)據(jù)集對Groupby的查詢結(jié)果進行了保存,所以將來調(diào)用的時間就會很短。按照這個特性,OLAP分為多維型MOLAP、關(guān)系型ROLAP、混合型HOLAP。在這方面,知名的產(chǎn)品如SQLServerAnalysisServices與HyperionEssbase。5、數(shù)據(jù)挖掘DMDataMining(數(shù)據(jù)挖掘)主要任務(wù)有數(shù)據(jù)匯總、概念描述、分類、聚類、相關(guān)性分析、偏差分析、建模等。具體技術(shù)包括:統(tǒng)計分析(statisticalanalysis),常見的統(tǒng)計方法有回歸分析(多元回歸、自回歸等X判別分析(貝葉斯分析、費歇爾判別、非參數(shù)判別等、聚類分析(系統(tǒng)聚類、動態(tài)聚類等)和探索性分析(主元分析法、相關(guān)分析法等)。決策樹(decisiontree),是一棵樹,樹的根節(jié)點是整個數(shù)據(jù)集合空間,每個分節(jié)點是對一個單一變量的測試,該測試將數(shù)據(jù)集合空間分割成兩個或更多塊。每個葉節(jié)點是屬于單一類別的記錄。首先,通過訓(xùn)練集生成決策樹,再通過測試集對決策樹進行修剪。決策樹的功能是預(yù)言一個新的記錄屬于哪一類。決策樹分為分類樹和回歸樹兩種,分類樹對離散變量做決策樹,回歸樹對連續(xù)變量做決策樹。時間序列(timeseries),指隨時間變化的序列值,處理時序數(shù)據(jù)包括趨勢分析(長期或趨勢變化、循環(huán)變動或循環(huán)變化、季節(jié)性變動或季節(jié)性變化、非規(guī)則或隨機變化)、相似性搜索、序列模式挖掘和周期分析等內(nèi)容。其他如關(guān)聯(lián)規(guī)則(correlationrules)、貝葉斯信念網(wǎng)絡(luò)(Bayesianbeliefnetwork)、馬爾科夫模型(HiddenMarkovmodel)、神經(jīng)網(wǎng)絡(luò)(neuralnetwork)、遺傳算法(geneticalgorithms)。這方面的產(chǎn)品如微軟的DM、SAS、SPSSo6、運籌規(guī)劃OROperationalResearch.。運籌規(guī)劃軟件可以解決諸如線型規(guī)劃、運輸規(guī)劃、整數(shù)規(guī)劃、任務(wù)指派、動態(tài)規(guī)劃、投資分配、貨物配裝、預(yù)測計算、統(tǒng)籌方法、質(zhì)量控制、系統(tǒng)配置、系統(tǒng)模擬、庫存分析、競爭策略分析、選址計算、設(shè)備更新、路線規(guī)劃等應(yīng)用。在商業(yè)領(lǐng)域有廣闊的應(yīng)用前景。相關(guān)工具可以參考物流與運籌軟件ORS。7、數(shù)據(jù)展現(xiàn)DISPLAY目前數(shù)據(jù)展現(xiàn),包括圖形圖表和儀表盤方面的,都已經(jīng)比較成熟。一類是報表工具,如微軟的ReportingServices、被Hyperion收購,后又被Oracle收購的CrystalReport工具、BusinessObjects等;另一類是OLAP展現(xiàn)工具,目前市場上的商業(yè)智能產(chǎn)品很多都可以進行多維展現(xiàn)。微軟的SSAS還可以通過Excel或者OWC組件來展現(xiàn)。第三部分中小企業(yè)使用商業(yè)智能解決方案的現(xiàn)狀商業(yè)智能分析對基礎(chǔ)數(shù)據(jù)的要求比較高,而且相關(guān)的產(chǎn)品和實施費用也比較高,通常中級和高級階段的決策支持,特別是數(shù)據(jù)挖掘分析,在電信、證券、零售領(lǐng)域運用的比較多。但是,現(xiàn)在,中小企業(yè)也逐漸認(rèn)識和開始運用商業(yè)智能分析技術(shù)了。中小企業(yè)運用商業(yè)智能分析技術(shù),有如下一些特點:一、基礎(chǔ)數(shù)據(jù)不完善對于小企業(yè)來說,使用諸如ERP、SCM、CRM等在線交易系統(tǒng)的時間還不長,系統(tǒng)內(nèi)存儲的數(shù)據(jù)量還不是很大。不過中型企業(yè)基本上已經(jīng)是比較成熟的ERP用戶了。正是進行商業(yè)智能分析的大好時機。不過基礎(chǔ)數(shù)據(jù)不完善,存在著這樣2方面的情況:一是數(shù)據(jù)之間缺乏關(guān)聯(lián)關(guān)系。譬如希望分析采購訂單與收貨記錄,以考核交貨及時率,但是系統(tǒng)的數(shù)據(jù)庫表中并不存在采購訂單與入庫驗收單之間的關(guān)聯(lián);希望考核銷售員業(yè)績,但是系統(tǒng)的數(shù)據(jù)庫表中不存在銷售訂單與銷售員之間的關(guān)聯(lián)關(guān)系。這些關(guān)聯(lián)關(guān)系,都是在在線交易系統(tǒng)使用過程中實時錄入的,日后維護工作極大也不可行。二是數(shù)據(jù)不真實。譬如超市對會員的分析。為了分析會員的購買習(xí)慣,需要按照會員的性別、年齡、家庭住址與超市的距離、家庭收入、家庭成員數(shù)等進行分類,但是,實際會員填寫的資料并非是真實的。據(jù)此分析的結(jié)論顯然不會真實。二、目前處于報表階段,還沒有進入智能決策的階段由于目前中小型企業(yè)在擴張過程中,往往存在管理滯后的現(xiàn)象,以數(shù)據(jù)支持決策的工作還沒有得到成熟的階段。所以目前階段的商業(yè)智能分析,仍然處于收集數(shù)據(jù)、分類匯總、及時展現(xiàn)的初級階段。我曾經(jīng)參與過一些大型外資企業(yè)的商業(yè)智能項目,發(fā)現(xiàn)項目所實現(xiàn)的目標(biāo)其實很不實用。有的500強企業(yè)僅僅是實現(xiàn)了會計的三大報表(資

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論