商業(yè)智能化(BI)解決方案報(bào)告書_第1頁
商業(yè)智能化(BI)解決方案報(bào)告書_第2頁
商業(yè)智能化(BI)解決方案報(bào)告書_第3頁
商業(yè)智能化(BI)解決方案報(bào)告書_第4頁
商業(yè)智能化(BI)解決方案報(bào)告書_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一章概述 1第二章商業(yè)智能綜述 32.1商業(yè)智能基本結(jié)構(gòu) 32.1.1 IBM 數(shù)據(jù)倉庫架構(gòu) 42.1.2數(shù)據(jù)倉庫:用于抽取、整合、分布、存儲(chǔ)有用的信息 72.1.3多維分析:全方位了解現(xiàn)狀 72.1.4前臺(tái)分析工具82.1.5數(shù)據(jù)挖掘82.2商業(yè)智能方案實(shí)施原則 92.2.1分階段、循序漸進(jìn)的原則92.2.2實(shí)用原則92.2.3知識(shí)原則10第三章 XXX公司BI系統(tǒng)方案 113.1 XXX公司BI系統(tǒng)的需求分析 113.2 IBM的解決方案113.3建議架構(gòu)15第四章所選IBM產(chǎn)品簡介 184.1 DB2 UDB 184.1.1 概述:DB2 家族(Family)與 DB2 通用數(shù)據(jù)庫(U

2、DB) V7.2 184.1.2 DB2通用數(shù)據(jù)庫(UDB) V7.2的特色204.1.3 DB2通用數(shù)據(jù)庫(UDB)的其他先進(jìn)功能 384.2 DB2 WAREHOUSE MANAGER (數(shù)據(jù)倉庫管理器)464.2.1 DB2 Warehouse Manager 的主要部件474.2.2數(shù)據(jù)抽取、轉(zhuǎn)換和加載(ETL)功能484.2.3 元數(shù)據(jù)(Meta Data)管理544.2.4 DB2 Warehouse Manager 的其它技術(shù)特點(diǎn) 544.3 IBM OLAP SERVER (多維數(shù)據(jù)庫服務(wù)器 )574.3.1 DB2 OLAP Server 引擎574.3.2 DB2 OLAP

3、 Server 各個(gè)附件604.3.3 DB2 OLAP Server 與 DB2 Warehouse Manager 集成634.3.4 DB2 OLAP Server 支持的前端工具 644.4 DB2 OLAP ANALYZER 654.5 數(shù)據(jù)挖掘工具(IBM INTELLIGENT MINER)664.5.1數(shù)據(jù)挖掘的實(shí)現(xiàn)方法674.5.2數(shù)據(jù)挖掘基本方法694.5.3數(shù)據(jù)挖掘與多維分析相結(jié)合 71第五章工程服務(wù)和售后服務(wù) 725.1工程服務(wù)725.2售后服務(wù)725.2.1 IBM數(shù)據(jù)倉庫的安裝及配置服務(wù) 725.2.2 IBM數(shù)據(jù)倉庫的維護(hù)服務(wù) 725.2.3 IBM數(shù)據(jù)倉庫的顧問

4、服務(wù) 735.2.4 IBM 培訓(xùn)服務(wù) 735.3技術(shù)文檔74第一章概述隨著市場競爭的日益激烈,各家公司紛紛把提高決策的科學(xué)性、合理性提高 到一個(gè)新的認(rèn)識(shí)高度。在此背景下,利用信息技術(shù)的最新手段,利用業(yè)務(wù)數(shù)據(jù)進(jìn) 行面向決策的分析這一方法紛紛被國內(nèi)外許多公司所采用。通過有目的、有選擇地采集業(yè)務(wù)數(shù)據(jù),并將其轉(zhuǎn)換為對(duì)決策有用的信息,用 于智能化的分析、預(yù)測和模擬等目的,這樣的應(yīng)用被稱為商業(yè)智能應(yīng)用。從國內(nèi) 外各行各業(yè)的發(fā)展經(jīng)驗(yàn)看,實(shí)施商業(yè)智能是提高企業(yè)進(jìn)行高效的業(yè)務(wù)分析和科學(xué) 決策的有效手段。作為一個(gè)具有八十多年歷史,以開發(fā)信息技術(shù)和商業(yè)應(yīng)用而聞名的“藍(lán)色巨人”,IBM在這一領(lǐng)域進(jìn)行了多年的研究,發(fā)

5、展出完備的商業(yè)智能技術(shù),為商業(yè) 數(shù)據(jù)自動(dòng)轉(zhuǎn)化為商業(yè)知識(shí)提供了現(xiàn)實(shí)的方案。商業(yè)智能的本質(zhì),是提取收集到的數(shù)據(jù),進(jìn)行智能化的分析,揭示企業(yè)運(yùn)作 和市場情況,幫助管理層做出正確明智的經(jīng)營決定。一般現(xiàn)代化的業(yè)務(wù)操作,通 常都會(huì)產(chǎn)生大量的數(shù)據(jù),如話單、賬單以及客戶資料等,其中一部分是決策關(guān)鍵 數(shù)據(jù),但并不是所有的數(shù)據(jù)都對(duì)決策有決定意義。商業(yè)智能包括收集、清理、管 理和分析這些數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)化為有用的信息,然后及時(shí)分發(fā)到企業(yè)各處,用于 改善業(yè)務(wù)決策。企業(yè)可以利用它的信息和結(jié)論進(jìn)行更加靈活的階段性的決策:如采用什么產(chǎn)品、針對(duì)哪類客戶、如何選擇和有效地推出服務(wù)等等,也可以實(shí)現(xiàn)高效的財(cái)務(wù)分析、銷售分析、風(fēng)險(xiǎn)管理

6、、分銷和后勤管理等等。這一切都是為了降低成本、提高利潤率和擴(kuò)大市場分額。第二章商業(yè)智能綜述2.1商業(yè)智能基本結(jié)構(gòu)當(dāng)今,許多企業(yè)認(rèn)識(shí)到只有靠充分利用,發(fā)掘其現(xiàn)有數(shù)據(jù),才能實(shí)現(xiàn)更大的 商業(yè)效益。日常的商務(wù)應(yīng)用生成了大量的數(shù)據(jù),這些數(shù)據(jù)若用于決策支持則會(huì)帶 來顯著的附加值。若再加上市場分析報(bào)告、獨(dú)立的市場調(diào)查、質(zhì)量評(píng)測結(jié)果和顧 問評(píng)估等外來數(shù)據(jù)時(shí),上述處理過程產(chǎn)生的效益可進(jìn)一步增強(qiáng)。而數(shù)據(jù)倉庫正是 匯總這些商用信息后,進(jìn)而支持?jǐn)?shù)據(jù)發(fā)掘、多維數(shù)據(jù)分析等當(dāng)今尖端技術(shù)和傳統(tǒng) 的查詢及表報(bào)功能,這些對(duì)于在當(dāng)今激烈的商業(yè)競爭中保持領(lǐng)先是至關(guān)重要的。 那么怎樣把這樣大量的數(shù)據(jù)轉(zhuǎn)換成可靠的、商用的信息以便于決策支

7、持呢?建立 數(shù)據(jù)倉庫正被廣泛地公認(rèn)為最好的轉(zhuǎn)換手段。業(yè)務(wù)數(shù)據(jù)BH*底員*商業(yè)視圖建立數(shù)據(jù)倉庫的過程轉(zhuǎn)換工具商業(yè)主題元數(shù)據(jù)IBM設(shè)業(yè)務(wù)信息ffil圖1數(shù)據(jù)倉庫建立過程根據(jù)IDC的調(diào)查,使用數(shù)據(jù)倉庫的投資回報(bào)率平均超過 400 %,尤其是從小 型數(shù)據(jù)倉庫開始實(shí)施的平均超過 500 %。2.1.1 IBM數(shù)據(jù)倉庫架構(gòu)IBM早在90年代初期,就投入大量優(yōu)秀技術(shù)人員和資金開始了數(shù)據(jù)倉庫的 研究,并啟動(dòng)了 Star-Burst大型科研項(xiàng)目。該項(xiàng)目主要就是為了攻克數(shù)據(jù)倉庫領(lǐng) 域的一些技術(shù)難題,例如優(yōu)化星型連接(Star-join),實(shí)現(xiàn)多維分析。因此,IBM現(xiàn) 在發(fā)布的數(shù)據(jù)倉庫產(chǎn)品都是經(jīng)過反復(fù)推敲和久經(jīng)考驗(yàn)

8、的,真正做到讓用戶買起來 放心,用起來舒心。基于對(duì)數(shù)據(jù)倉庫結(jié)構(gòu)的深刻理解和多年積累的經(jīng)驗(yàn),計(jì)了自己的數(shù)據(jù)倉庫結(jié)構(gòu),見下圖:數(shù)據(jù)倉庫的組成。作為一個(gè)開發(fā)式結(jié)構(gòu),它 方便了用戶的產(chǎn)品選擇、實(shí)施和今后的擴(kuò)展。OLTP業(yè)務(wù)系統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)集市售售 息 銷銷存務(wù)信 售呈庫財(cái)至DSS圖2 IBM數(shù)據(jù)倉庫架構(gòu)上圖為IBM三層次數(shù)據(jù)倉庫結(jié)構(gòu):從第一層OLTP業(yè)務(wù)系統(tǒng)到第二層數(shù)據(jù)倉 庫為建倉過程,從第二層到第三層數(shù)據(jù)集市為按主題分類建立應(yīng)用的過程。第一 步包括數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)分布等步驟,按照統(tǒng)一的數(shù)據(jù)格式標(biāo)準(zhǔn)進(jìn)行統(tǒng) 一的數(shù)據(jù)轉(zhuǎn)換,建立可被企業(yè)各部門充分共享的數(shù)據(jù)倉庫。其中,數(shù)據(jù)抽取階段 完成對(duì)各種數(shù)據(jù)源

9、的訪問,數(shù)據(jù)轉(zhuǎn)換階段完成對(duì)數(shù)據(jù)的清洗、匯總和整合等,數(shù) 據(jù)分布階段完成對(duì)結(jié)果數(shù)據(jù)存儲(chǔ)的分配。這三個(gè)階段通常緊密結(jié)合在一起,由一個(gè)產(chǎn)品或幾個(gè)產(chǎn)品配合實(shí)現(xiàn)。例如,DB2 Warehouse Man ager 既可獨(dú)立完成,又可結(jié)合DataJoiner、DataPropagator實(shí)現(xiàn)對(duì)異構(gòu)數(shù)據(jù)和數(shù)據(jù)復(fù)制的處理。DB2Warehouse Manager可進(jìn)行數(shù)據(jù)映射的定義,以定期地抽取、轉(zhuǎn)換和分布數(shù)據(jù);DataJoiner可訪問的各種關(guān)系型數(shù)據(jù)庫包括DB2數(shù)據(jù)庫家族、ORACLE、SYBASE、INFORMIX 和 MS SQL Server 等;DataPropagator 主要用于數(shù)據(jù)復(fù) 制,采

10、用數(shù)據(jù)復(fù)制的方式可對(duì)業(yè)務(wù)數(shù)據(jù)倉庫進(jìn)行增量數(shù)據(jù)更新,避免對(duì)作業(yè)系統(tǒng) 事物處理性能的影響和大量重復(fù)抽取數(shù)據(jù)。數(shù)據(jù)的存儲(chǔ)由DB2家族產(chǎn)品來完成,以保證數(shù)據(jù)倉庫始終高性能地運(yùn)轉(zhuǎn),提供完整、準(zhǔn)確的數(shù)據(jù),便于將來的升級(jí)和 擴(kuò)展。第二步,在按主題分類建立應(yīng)用時(shí),若既想擁有多維數(shù)據(jù)庫的獨(dú)特功能,又要把數(shù)據(jù)存放在關(guān)系型數(shù)據(jù)庫中以便管理,則DB2 OLAP Server是用戶的最佳選擇。DB2 Warehouse Ma nager 中提供的In formation Catalog 通過描述性數(shù)據(jù) 幫助用戶查找和理解數(shù)據(jù)倉庫中的數(shù)據(jù),Intelligent Miner用于數(shù)據(jù)挖掘以便幫助 決策者預(yù)測或發(fā)現(xiàn)隱藏的關(guān)系

11、。最后,我們以報(bào)表或圖形的方式將結(jié)果數(shù)據(jù)呈現(xiàn) 給用戶,這通常由第三方產(chǎn)品來實(shí)現(xiàn),它們包括:Hyperion An alyzer, Cog nos ,Brio, Busin ess Objects 等。商業(yè)智能的實(shí)現(xiàn)方式多種多樣,其規(guī)模和特點(diǎn)由用戶的需求來決定。但萬變 不離其宗,其基本體系結(jié)構(gòu)往往包括三個(gè)部分2.1.2數(shù)據(jù)倉庫:用于抽取、整合、分布、存儲(chǔ)有用的信息一個(gè)企業(yè)的信息往往分布在不同的部門和分支機(jī)構(gòu),管理者要綜觀全局、運(yùn) 籌帷幄,必須能迅速地找到能反映真實(shí)情況的數(shù)據(jù),這些數(shù)據(jù)也許是當(dāng)前的現(xiàn)實(shí) 數(shù)據(jù),也可能是過去的歷史數(shù)據(jù)。因此,有必要把各個(gè)區(qū)域的數(shù)據(jù)集合起來,去 其糟粕、取其精華,將真實(shí)

12、的、對(duì)決策有用的數(shù)據(jù)保留下來,隨時(shí)準(zhǔn)備管理人員 使用。因此,數(shù)據(jù)倉庫不僅僅是個(gè)數(shù)據(jù)的儲(chǔ)存?zhèn)}庫,更重要的是它提供了豐富的 工具來清洗、轉(zhuǎn)換和從各地提取數(shù)據(jù),使得放在倉庫里的數(shù)據(jù)有條有理,易于使 用。2.1.3多維分析:全方位了解現(xiàn)狀管理人員往往希望從不同的角度來審視業(yè)務(wù)數(shù)值,比如從時(shí)間、地域、產(chǎn)品 來看同一類業(yè)務(wù)的總額。每一個(gè)分析的角度可以叫作一個(gè)維,因此,我們把多角 度分析方式稱為多維分析。以前,每一個(gè)分析的角度需要制作一張報(bào)表。由此產(chǎn) 生了在線多維分析工具,它的主要功能,是根據(jù)用戶常用的多種分析角度,事先 計(jì)算好一些輔助結(jié)構(gòu),以便在查詢時(shí)能盡快抽取到所要的記錄,并快速地從一維 轉(zhuǎn)變到另一維,

13、將不同角度的信息以數(shù)字、直方圖、餅圖、曲線等等方式展現(xiàn)在 您面前。2.1.4前臺(tái)分析工具提供簡單易用的圖形化界面給管理人員,由他們自由選擇要分析的數(shù)據(jù)、定 義分析角度、顯示分析結(jié)果。往往與多維分析工具配合,作為多維分析服務(wù)器的 前臺(tái)界面。以上三部分是商業(yè)智能的基礎(chǔ)。它完成的是對(duì)用戶數(shù)據(jù)的整理和觀察,可以 說,它的工作是總結(jié)過去。在此基礎(chǔ)結(jié)構(gòu)之上,商業(yè)智能可以發(fā)揮更進(jìn)一步的作 用,利用數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)問題、找出規(guī)律,達(dá)到真正的智能效果:預(yù)測將來。2.1.5數(shù)據(jù)挖掘正如在礦井中可以挖掘出珍貴的礦石,在數(shù)據(jù)倉庫的數(shù)據(jù)里也常常可以挖掘 出業(yè)務(wù)人員意想不到的信息。它比多維分析更進(jìn)一步。例如,如果管理人

14、員要求 比較各個(gè)區(qū)域某類業(yè)務(wù)在過去一年的情況,可以從多維分析中找答案。但是,如 果管理人員要問為何一種業(yè)務(wù)在某地區(qū)的情況突然變得特別好或是不好,或者問 該業(yè)務(wù)在另一地區(qū)將會(huì)怎么樣,這時(shí)數(shù)據(jù)挖掘工具可以作出回答。簡單的說,數(shù)據(jù)挖掘使用統(tǒng)計(jì)、分析等數(shù)學(xué)方法、以及電腦學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò) 等人工智能方式,從大量的數(shù)據(jù)中,找尋數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系。這種關(guān)系,一 般顯示數(shù)據(jù)組之間相似或相反的行為或變化。一個(gè)細(xì)心的分析者,往往能從這些 發(fā)掘出來的關(guān)系得到啟示。而這種啟示又很可能使得到它的業(yè)者,獲得其他競爭 者所沒有的先機(jī)數(shù)據(jù)挖掘要求有數(shù)據(jù)倉庫作基礎(chǔ),并要求數(shù)據(jù)倉庫里已經(jīng)存有豐富的數(shù)據(jù) 因此,在實(shí)施商業(yè)智能方案時(shí)

15、,一般分兩步走:第一步實(shí)現(xiàn)數(shù)據(jù)倉庫和多維分析, 構(gòu)造商業(yè)智能的基礎(chǔ),實(shí)現(xiàn)分析應(yīng)用;第二步實(shí)現(xiàn)數(shù)據(jù)挖掘,發(fā)揮商業(yè)智能的特 色。2.2商業(yè)智能方案實(shí)施原則實(shí)施商業(yè)智能方案項(xiàng)目工程,與實(shí)施傳統(tǒng)的應(yīng)用系統(tǒng)有很大的不同。其中最 重要的是,商業(yè)智能的實(shí)施是不斷的交流過程,只有雙方緊密的合作才能取得實(shí) 施的成功。 我們建議,工程實(shí)施上采取以下原則:2.2.1分階段、循序漸進(jìn)的原則任何一個(gè)項(xiàng)目的實(shí)施都是一個(gè)發(fā)現(xiàn)問題,解決問題,積累經(jīng)驗(yàn),又遇到新問 題,再解決,再積累的循序漸進(jìn)的過程。我們建議 XXX公司 應(yīng)根據(jù)現(xiàn)有的資源 以及今后發(fā)展的方向,分階段、循序漸進(jìn)的實(shí)施商業(yè)智能方案。2.2.2實(shí)用原則在第一步實(shí)現(xiàn)數(shù)

16、據(jù)倉庫時(shí),盡量針對(duì)當(dāng)前電信最關(guān)心的主題,并將該主題進(jìn) 行細(xì)致分析,盡可能用簡單、統(tǒng)一、易于使用的方式來實(shí)現(xiàn),避免追求片面的復(fù) 雜和完美。223知識(shí)原則普遍說來,由于商業(yè)智能技術(shù)相對(duì)而言比較新,企業(yè)的信息技術(shù)人員對(duì)數(shù)據(jù) 倉庫、多維分析、數(shù)據(jù)挖掘等系統(tǒng)涉及的知識(shí)往往存在著不足或偏差,實(shí)際應(yīng)用 經(jīng)驗(yàn)也很欠缺。因此,我們建議在實(shí)施過程中結(jié)合專家培訓(xùn)和服務(wù),在商業(yè)智能 系統(tǒng)的設(shè)計(jì)、開發(fā)、實(shí)施當(dāng)中,逐步培養(yǎng)出企業(yè)自己的系統(tǒng)管理、維護(hù)和開發(fā)人 員。當(dāng)系統(tǒng)投入使用時(shí),這些人員可以對(duì)系統(tǒng)進(jìn)行維護(hù)和管理,并負(fù)責(zé)對(duì)最終用 戶進(jìn)行培訓(xùn)。第三章XXX公司BI系統(tǒng)方案3.1 XXX公司BI系統(tǒng)的需求分析在XXX公司 的B

17、I系統(tǒng)中,可以實(shí)現(xiàn)如下一系列經(jīng)營過程中的分析和決策支持:除了以上列出的一系列分析和預(yù)測外,利用 BI系統(tǒng),還應(yīng)該能夠根據(jù)XXX 公司的需求很方便地?cái)U(kuò)展其功能。3.2 IBM的解決方案基于XXX公司BI系統(tǒng)的需求,以及IBM公司在數(shù)據(jù)倉庫領(lǐng)域的經(jīng)驗(yàn),我們 提出以下解決方案:采用一個(gè)企業(yè)級(jí)的數(shù)據(jù)倉庫,實(shí)現(xiàn)各分行業(yè)務(wù)數(shù)據(jù)的自動(dòng)采集、 清洗、匯總, 并且通過多維分析工具,讓用戶能夠有效的將數(shù)據(jù)轉(zhuǎn)化為靈活的報(bào)表和決策支持 信息,最終滿足用戶的信息需求。該方案的實(shí)現(xiàn)方式如下:首先,在數(shù)據(jù)主要來源于兩個(gè)方面:綜合業(yè)務(wù)系統(tǒng)和新錄入的數(shù)據(jù)。綜合業(yè) 務(wù)系統(tǒng)中的數(shù)據(jù)通過數(shù)據(jù)倉庫工具進(jìn)行自動(dòng)采集、清洗、整理,而需要新

18、錄入的 數(shù)據(jù)則通過瀏覽器方式錄入。在構(gòu)造數(shù)據(jù)倉庫的過程中,我們采取以點(diǎn)帶面的做法,采用小步長、逐步地 建立數(shù)據(jù)倉庫的策略。以XXX公司報(bào)表系統(tǒng)為開端,分階段地實(shí)現(xiàn)商業(yè)智能應(yīng) 用。小的項(xiàng)目可以立即顯示數(shù)據(jù)倉庫的價(jià)值,同時(shí)也提供了更快的投資回報(bào)。而 且,先在只有少量的數(shù)據(jù)和用戶的小系統(tǒng)上進(jìn)行學(xué)習(xí)和實(shí)踐,對(duì)技術(shù)人員來說會(huì) 學(xué)得更快。我們希望首先在需求較為迫切的領(lǐng)域,選擇一些比較有意義的主題; 基于這些主題,我們將建立一個(gè)數(shù)據(jù)集市,待用戶能夠?qū)?shù)據(jù)倉庫的概念和一些 技術(shù)有了比較深刻的認(rèn)識(shí)之后,再綜觀全局,構(gòu)建起企業(yè)級(jí)的數(shù)據(jù)倉庫。數(shù)據(jù)錄入可以采用數(shù)據(jù)文件快速裝入的方式,也可以采用專門應(yīng)用的方式。如果采用

19、后者,我們可以考慮使用IBM的WebSphere和VisualAge for Java 進(jìn) 行開發(fā),它們產(chǎn)品是IBM電子商務(wù)應(yīng)用的重要部件。利用這兩個(gè)工具,我們可以 方便地建立 Web頁面,生成Java程序,包括 Applet、Servlet和Application等 等。并且系統(tǒng)的維護(hù)工作也比較方便,當(dāng)需要修改應(yīng)用時(shí),只需要修改服務(wù)器上 的程序就可以了,不需要在客戶端做工作。另外,這種結(jié)構(gòu)對(duì)客戶機(jī)的配置要求 也不太高。在建造數(shù)據(jù)倉庫的過程中,我們推薦使用IBM的Warehouse Manager,該產(chǎn)品是IBM用來建立數(shù)據(jù)倉庫的工具,利用該工具,我們可以方便、快捷地構(gòu)造 起數(shù)據(jù)倉庫來,因?yàn)槲?/p>

20、們應(yīng)該認(rèn)識(shí)到數(shù)據(jù)倉庫必須建立在一個(gè)開放的、可更改的結(jié)構(gòu)上,以便能夠處理數(shù)據(jù)和需求的不斷膨脹。Warehouse Manager正是這樣的一個(gè)工具。提供一個(gè)開放的,從數(shù)據(jù)源到數(shù)據(jù)倉庫的一致的解決方案。在XXX公司的BI系統(tǒng)中,通過Warehouse Manager管理器可以方便地 建立數(shù)據(jù)加工的流程(process)和步驟(step),這些步驟反映了 XXX公司具體業(yè) 務(wù)數(shù)據(jù)的流程、規(guī)則。在各步驟中可以定義代理 (agent)來自動(dòng)運(yùn)行數(shù)據(jù)傳遞、清 洗和匯總功能,這些步驟可以按時(shí)間、事件運(yùn)行,或由其它步驟觸發(fā)。代理可以 運(yùn)行在 Warehouse Manager服務(wù)器上,也可以運(yùn)行在遠(yuǎn)程的業(yè)務(wù)主

21、機(jī)上,并且 可以有多個(gè)代理運(yùn)行以提高效率??梢砸苑浅V庇^的圖形化方式管理數(shù)據(jù)倉庫, 當(dāng)報(bào)表系統(tǒng)的業(yè)務(wù)需求發(fā)生變化時(shí),可以非常方便地修改步驟,滿足變化多端的 商業(yè)競爭環(huán)境。Warehouse Manager是專門為商業(yè)應(yīng)用設(shè)計(jì)的,它可以自動(dòng)在網(wǎng)絡(luò)上進(jìn)行 數(shù)據(jù)的傳送,不需要人為干預(yù),并且利用它的日志功能可以對(duì)系統(tǒng)運(yùn)行很好地監(jiān) 控。在 DB2 Warehouse Ma nager(DWM) 中含有 Warehouse Age nt 部件,它可以 用來在位于數(shù)據(jù)倉庫的目標(biāo)數(shù)據(jù)庫 DB2 UDB中執(zhí)行直接執(zhí)行數(shù)據(jù)倉庫的數(shù)據(jù)加 工。另外,在數(shù)據(jù)倉庫服務(wù)器于業(yè)務(wù)系統(tǒng)之間的文件數(shù)據(jù)FTP傳輸以及從表中抽取少量

22、數(shù)據(jù)也可以通過Age nt直接執(zhí)行建立數(shù)據(jù)倉庫之后,選擇一些有意義的主題,抽取相關(guān)的數(shù)據(jù)到DB2 OLAPServer中,利用DB2 OLAP Server的強(qiáng)大分析功能,給最終用戶提供在線多維 分析的功能,能夠讓最終用戶充分挖掘出數(shù)據(jù)中包含的信息。DWM在執(zhí)行完數(shù)據(jù)的提取任務(wù)后,自動(dòng)觸發(fā)預(yù)先定義好的OLAP操作,將數(shù)據(jù)經(jīng)過匯總計(jì)算后加載至 DB2 OLAP Server中。最終用戶工具我們選用DB2 OLAP Analyzer,這個(gè)產(chǎn)品是一個(gè)數(shù)據(jù)倉庫的前 端分析工具,利用這個(gè)工具用戶可以很容易地訪問 OLAP Server中經(jīng)過處理的數(shù) 據(jù),制作各種形式、風(fēng)格的報(bào)表,報(bào)表內(nèi)容可以包括數(shù)字、圖

23、像、曲線等,使得 管理層可以直接、直觀地查看企業(yè)的經(jīng)營情況。3.3建議架構(gòu)DB2 UDB EEDB2 Warehouse ManagerDB2 Intelligent Miner for DataDB2 Intelligent Miner ScoringDB2 OLAP Server=jlsiI_rr( rnOLAP DataWindows 2000查詢/分析WE應(yīng)用服務(wù)器DB2 OLAP An alysis ServerHTTP ServerrenuDataMeta Data管理/數(shù)據(jù)倉庫控制DB2/Warehouse Con trol Ce nterDB2 Warehouse Server

24、DB2 OLAP Server Applicatio n Ma nagerDB2 In tellige nt Min er Clie ntRS/6000生產(chǎn)系統(tǒng)3生產(chǎn)系統(tǒng)1o生產(chǎn)系統(tǒng)2Windows 2000Intranet/lnternetBrowser圖3 XXX公司BI系統(tǒng)軟硬件配置示意圖在此方案中,采用RS/6000服務(wù)器作為運(yùn)行數(shù)據(jù)倉庫目標(biāo)數(shù)據(jù)庫的服務(wù)器,其上安裝DB2 UDB EE、DB2 Warehouse Manager,用來從生產(chǎn)系統(tǒng)抽取對(duì)決策有用的業(yè)務(wù)數(shù)據(jù),經(jīng)過加工后存放在數(shù)據(jù)倉庫中。在海量數(shù)據(jù)倉庫基礎(chǔ)上針對(duì)每一類具體業(yè)務(wù)問題建立數(shù)據(jù)集市。由于XXX公司BI系統(tǒng)中的業(yè)務(wù)問題

25、大多是多維分析問題,故利用另外一臺(tái)RS/6000服務(wù)器運(yùn)行IBM公司專門的多維分析服務(wù)器產(chǎn)品 DB2 OLAP Server,以極大地加快 多維分析的速度。在數(shù)據(jù)倉庫服務(wù)器上同時(shí)安裝 DB2 Intelligent Miner for Data ,從數(shù)據(jù)倉庫服務(wù)器中抽取數(shù)據(jù)進(jìn)行智能挖掘;此外,在數(shù)據(jù)倉庫上安裝DB2 Intelligent MinerScoring,用來將數(shù)據(jù)挖掘的結(jié)果作用到數(shù)據(jù)倉庫中,實(shí)現(xiàn)打分功能。所有客戶端以瀏覽器方式,通過查詢和多維分析的WEB應(yīng)用服務(wù)器訪問數(shù)據(jù)倉庫和多維分析服務(wù)器中的數(shù)據(jù)。整個(gè)系統(tǒng)需要在一臺(tái)運(yùn)行Windows 2000的PC 服務(wù)器上安裝 DB2 OLA

26、P Analyzer Analysis Server 以及 HTTP Server,作 為為前端瀏覽器客戶提供統(tǒng)一入口的應(yīng)用服務(wù)器。為提高系統(tǒng)響應(yīng)時(shí)間及提供負(fù) 載均衡能力,可以配合 WebSphere Application Server 共同使用。另外,需要配置一臺(tái)PC服務(wù)器運(yùn)行 Windows 2000作為整個(gè)系統(tǒng)的控制服務(wù)器,安裝 DB2 Warehouse Control Server、DB2 Control Center、OLAP Server 控制臺(tái) OLAP Server Application Manager 以及挖掘服務(wù)器前端 DB2 Intelligent Miner fo

27、r Data Client。此方案的優(yōu)點(diǎn):基于公司的業(yè)務(wù)需求。各業(yè)務(wù)部門可以根據(jù)自己的需要定義數(shù)據(jù)集市的內(nèi)容, 并進(jìn)行各種指標(biāo)的多維分析,在實(shí)際應(yīng)用中不斷擴(kuò)展系統(tǒng),為決策者提供必要的 信息。高性能、高效率。數(shù)據(jù)都在本地運(yùn)行,數(shù)據(jù)量相對(duì)較小,因此對(duì)服務(wù)器計(jì)算 能力的要求相對(duì)較低。同時(shí)由于在局域網(wǎng)上運(yùn)行,對(duì)網(wǎng)絡(luò)帶寬基本不會(huì)有壓力, 并且用戶響應(yīng)時(shí)間可以得到保障。最大限度地減少網(wǎng)絡(luò)負(fù)荷。各客戶端通過瀏覽器方式從中心數(shù)據(jù)倉庫中獲取 數(shù)據(jù),只有需要的數(shù)據(jù)被傳輸。滿足XXX公司 未來發(fā)展的需要。此方案具有很好的可擴(kuò)展性,隨著 XXX 公司業(yè)務(wù)量的增加,業(yè)務(wù)數(shù)據(jù)的增多,各種業(yè)務(wù)系統(tǒng)的建立,此方案可以容易的

28、適應(yīng)這些變化,滿足業(yè)務(wù)的需求。一次性投資,長期受益。此方案不僅可以滿足 XXX公司 目前BI系統(tǒng)的需 要,更為重要的是為XXX公司商業(yè)智能應(yīng)用打下了一個(gè)堅(jiān)實(shí)的基礎(chǔ)。XXX公司 可以在此基礎(chǔ)上開發(fā)各種商業(yè)智能應(yīng)用,輔助決策者制定業(yè)務(wù)計(jì)劃和措施,在激 烈的競爭中保持良好的勢頭。第四章所選IBM產(chǎn)品簡介在這次的商業(yè)智能解決方案中,采用的產(chǎn)品包括數(shù)據(jù)庫 DB2 UDB、數(shù)據(jù)倉 庫(DB2 Warehouse Manager)、多維數(shù)據(jù)庫(OLAP Server)、前臺(tái)分析工具(DB2 OLAP Analyzer)及智能數(shù)據(jù)挖掘服務(wù)器(DB2 Intelligent Miner for Data)。以下

29、是 各個(gè)產(chǎn)品的描述說明。4.1 DB2 UDB4.1.1概述:DB2家族(Family)與DB2通用數(shù)據(jù)庫(UDB) V7.2IBM DB2家族的各種關(guān)系數(shù)據(jù)庫管理系統(tǒng)適用于各種硬件平臺(tái),其中包括基 于In tel的微機(jī)、IBM的或非IBM的各種RISC服務(wù)器和工作站、大型并行處理 機(jī)、AS/400中型計(jì)算機(jī)系統(tǒng)以及運(yùn)行 VM、VSE和MVS、OS/390操作系統(tǒng)的 主機(jī)系統(tǒng)。各種平臺(tái)上的DB2有共同的應(yīng)用程序接口,因此運(yùn)行在一種平臺(tái)上的 程序可以很容易地移植到其他的平臺(tái)。DB2家族產(chǎn)品能夠滿足不同用戶的需求,它包含了從單用戶的微機(jī)系統(tǒng)到支持 80萬用戶的主機(jī)系統(tǒng)。DB2家族除了包含 在各種平

30、臺(tái)上運(yùn)行的數(shù)據(jù)庫管理系統(tǒng)內(nèi)核之外,產(chǎn)品包中還包括了數(shù)據(jù)復(fù)制、數(shù) 據(jù)庫系統(tǒng)管理、環(huán)球網(wǎng)(Internet)網(wǎng)關(guān)支持、在線分析處理、多媒體支持和各種并 行處理能力,免費(fèi)提供DB2 UDB V7.2在PC和UNIX平臺(tái)上的客戶機(jī)端產(chǎn)品(DB2 CAE),并為所有平臺(tái)上的異構(gòu)數(shù)據(jù)庫訪問提供中介件”(Middleware)解決可運(yùn)行在基于In tel的微機(jī)及各種RISC服務(wù)器(UNIX平臺(tái))上的DB2 UDB V7.2 包括:DB2 for AIX,DB2 for HP-UX,DB2 for SUN Solaris ,DB2 for OS/2, DB2 for Windows NT,DB2 for Wi

31、n95,DB2 for Win98,DB2 for Linux,DB2 for SCO,DB2 for Si nix,DB2 for NUMA-Q 等等。這些產(chǎn)品是全功能、具有工業(yè)強(qiáng)度的關(guān)系數(shù)據(jù)庫管理系統(tǒng),分別用于服務(wù)器 和工作站平臺(tái)??梢园阉鼈兣渲玫絾蝹€(gè)的系統(tǒng)上,或者配置到支持客戶機(jī)工作站 的LAN服務(wù)器上,還可以把它們配置為環(huán)球網(wǎng)(Internet)上的數(shù)據(jù)庫服務(wù)器。如 果使用服務(wù)器配置,那就允許 DOS、Windows、OS/2、Win95、Win98、Macintosh 或UNIX客戶機(jī)去訪問DB2服務(wù)器,可以使用 TCP/IP、IPX/SPX、NetBIOS或 APPC等網(wǎng)絡(luò)協(xié)議;如

32、果作為環(huán)球網(wǎng)上的數(shù)據(jù)庫服務(wù)器,則可由一臺(tái)瀏覽器(Web Browser)作為客戶機(jī)訪問。DB2通用數(shù)據(jù)庫(UDB) V7.2產(chǎn)品建立在一個(gè)共同代碼的基礎(chǔ)之上,依據(jù)多 進(jìn)程/多線索結(jié)構(gòu)進(jìn)行設(shè)計(jì),其數(shù)據(jù)庫引擎的核心技術(shù)來自Starburst研究項(xiàng)目以及DB2 for OS/390等主機(jī)產(chǎn)品,而且它們?cè)跀?shù)據(jù)和應(yīng)用的可移植性兩個(gè)方面與 DB2家族中的其他成員完全兼容。因而任何受過一種平臺(tái)上的DB2培訓(xùn)的人員能夠很容易地使用其他平臺(tái)的 DB2產(chǎn)品。在保持這種外在的兼容性以及具備 DB2家族成員所必需具備的可靠性和可管理性的同時(shí),實(shí)際上它們每個(gè)產(chǎn)品還針對(duì)各 自的平臺(tái)環(huán)境作了調(diào)整和優(yōu)化以達(dá)到業(yè)界領(lǐng)先的性能

33、/價(jià)格比。Global SolutionsDSlConnwl DWhuaner 血ID湘sources- Oracle* 5/D3se inToimb EQL Sarvfir-IMS 產(chǎn)卡 vfiwyplTCP/IPSNAIRyiSPXHosts DB2irO3419O V DB2 lorVMindvaE 亠 DBZfDrOSjlQQClientsDOS WIDOWSMnNT . I審礁wJMMUZ* 0S12汽,SRk* HP-LKW*5CO* SUH Solen$* 5NI SlhEX9 SGI Inn MAC鼻 WebSatalliteVMnNTTCPflPfWSPXNETBIOSPer

34、sDnll卡 DBZfnrDHE! -D02TDrWnNT v DD2 (nrWn95ServersDD2fO# OS.OO DR7 fui AIKDHIm H卩 UXDH?Tim SIINSiatix.DQ2fm NUMA-0 。魚 Him SIMM DBforNT DB2 for 5C-OL DQ2 foe LiiwkManagementIIParallel Complexes*DB2UDBEEE*DB2 for OS7390*02 r( - os/ioo*0B2 Erterpri? ControlDB2. everyplaceCompleteSolutionsDB2產(chǎn)品家族提供了完整的中

35、文支持,對(duì)中文的支持貫穿于從微機(jī)到主機(jī)的 所有平臺(tái),這是任何其他數(shù)據(jù)庫廠家做不到的。DB2家族產(chǎn)品4.1.2 DB2通用數(shù)據(jù)庫(UDB) V7.2 的特色DB2通用數(shù)據(jù)庫(UDB) V7.2無論在網(wǎng)絡(luò)計(jì)算方面還是在線分析、多媒體處理,都能給你全面、滿意的支持,而且集成了豐富的數(shù)據(jù)庫管理工具,把原來復(fù) 雜的管理工作變得非常簡單DB2 V7.2致力于商業(yè)智能和數(shù)據(jù)倉庫方面的改進(jìn),包括自動(dòng)觸發(fā)器,多分區(qū)和多表的自動(dòng)總計(jì)表格,優(yōu)化星式結(jié)構(gòu)的連接方法,使查詢和整個(gè)系統(tǒng)的反應(yīng)速度大大提高。同時(shí)也增加了在裝載和在線重組時(shí)對(duì)索引的維護(hù)。在DB2中還新 增了統(tǒng)計(jì)、線性回歸等功能,直接支持進(jìn)一步深入分析,以便利用

36、DB2的查詢處 理實(shí)用程序,而以往只能在應(yīng)用程序級(jí)上做到這一點(diǎn)。另外,在支持 16和32KBPages、多個(gè)緩沖池(multiple buffer pool)的優(yōu)化、更快的完整性約束處理、處理 更多查詢的星式連接等方面,做了一系列的改進(jìn)。應(yīng)一些IBM合作伙伴軟件提供商的要求,DB2 UDB V7.2包含以下擴(kuò)充性能:表/視圖/別名的命名長度限制由原來的18個(gè)字符擴(kuò)充為128個(gè)字符。列命名長度限制由原來的18個(gè)字符擴(kuò)充為30個(gè)字符。SQL語句的最大長度由原來的32KB增大到64KB。頁大小從16KB增大到32KB。最大變量字符為32KB,取決于頁大小。最大表/表空間的大小從128GB擴(kuò)大到512

37、GB,取決于頁大小。索引關(guān)鍵字長度從255字符擴(kuò)大到1,024個(gè)字符。嵌入式SQL編程支持宏DB2 V7.2對(duì)統(tǒng)一代碼(Un icode)的支持:16-Bit固定長度的Uni code包含所有通用文本字符,容許定長字符序列(以便分析)和設(shè)定含義的字符。對(duì)UCS-2和 UTF-8格式的支持,允許用戶用各種主要語言創(chuàng)建數(shù)據(jù)庫和存取數(shù)據(jù)。DB2支持wchar_t數(shù)據(jù)類型,使得用戶在單字節(jié)環(huán)境(如英語環(huán)境)下開發(fā)的應(yīng)用在其他環(huán)境 (日語)下也可照常運(yùn)行。DB2 UDB V7.2增強(qiáng)面向?qū)ο蟮腟QL和SQL擴(kuò)展,集成 Windows平臺(tái),打 包新增免費(fèi)軟件。產(chǎn)品集成改變主要包括通用數(shù)據(jù)支持,免費(fèi)新增數(shù)據(jù)

38、倉庫中心 和DB2 OLAP starter kit 。用戶可以使用 DB2的數(shù)據(jù)連接器(DataJoiner),象訪問 DB2數(shù)據(jù)資源一樣,訪問Oracle, Sybase, Informix, SQL Server 等數(shù)據(jù)庫。用戶 只需熟悉DB2語法即可在跨平臺(tái)的復(fù)雜環(huán)境中輕松獲取非DB2數(shù)據(jù)。DB2 UDBV7.2選件中針對(duì)Oracle的關(guān)系連接部件可以使用戶通過標(biāo)準(zhǔn) SQL查詢同時(shí)訪問 DB2和Oracle的數(shù)據(jù)資源。DB2 UDB V7.2的用戶現(xiàn)在可以跨越 DB2數(shù)據(jù)庫、Oracle數(shù)據(jù)庫或者一個(gè)OLE DB資源進(jìn)行分布式的查詢,也就是可以通過使用DB2通用數(shù)據(jù)庫的SQL句法和AP

39、I在一個(gè)工作單元的查詢內(nèi)實(shí)現(xiàn)訪問和操作保存在異構(gòu)數(shù)據(jù)資源中的數(shù) 據(jù)。DB2 Relational Connect加強(qiáng)了分散查詢功能,使DB2用戶可以通過一個(gè)簡 單的查詢來訪問DB2數(shù)據(jù)和存儲(chǔ)在Oracle數(shù)據(jù)庫中的數(shù)據(jù)。DB2 UDB V7.2免費(fèi)包含的數(shù)據(jù)倉庫中心把可視化倉庫的強(qiáng)大功能和DB2控制中心的便捷特點(diǎn)結(jié)合起來,為需要商業(yè)智能的用戶提供友好的用戶界面。用戶可以使用數(shù)據(jù)倉庫中心對(duì)數(shù)據(jù)進(jìn)行定義、自動(dòng)取樣、轉(zhuǎn)換、發(fā)布、以及為數(shù)據(jù)倉 庫加載數(shù)據(jù)。這種新功能可以為一個(gè)部門或單位配置一個(gè)獨(dú)立的簡單數(shù)據(jù)中心。除數(shù)據(jù)倉庫中心之外,DB2還在 Wizards,模式名模型(Schema Modeler)

40、、元數(shù) 據(jù)交換(Metadata Interchange)等方面做了改進(jìn)。DB2 UDB V7.2數(shù)據(jù)倉庫中心使用了更便捷的新界面,用于創(chuàng)建、設(shè)計(jì)、儲(chǔ) 存以及維護(hù)數(shù)據(jù)倉庫以及 OLAP表。DB2數(shù)據(jù)倉庫管理器產(chǎn)品在大量數(shù)據(jù)傳遞、 元數(shù)據(jù)管理以及查詢管理方面做了改進(jìn)。DB2 UDB V7中包含了一些先進(jìn)的高級(jí)面向?qū)ο?SQL功能,對(duì)開發(fā)人員和 分析員都非常有用。這些聚合功能用于 OLAP應(yīng)用計(jì)算,這是在SQL-99中很難 或根本無法實(shí)現(xiàn)的,其符合SQL-99 OLAP附錄中建議的標(biāo)準(zhǔn)。DB2現(xiàn)在可以提供臨時(shí)表格支持,應(yīng)用存儲(chǔ)點(diǎn)(saving point),標(biāo)識(shí)欄(IDColumn),嵌套存儲(chǔ)過程

41、。SQL過程語言(SQL Procedure Language)支持創(chuàng)建DB2存儲(chǔ)過程,符合ANSI SQL99中的存儲(chǔ)過程模型標(biāo)準(zhǔn)。DB2 UDB存儲(chǔ)過程 創(chuàng)建工具(SPB)是一個(gè)圖形應(yīng)用工具,支持DB2存儲(chǔ)過程的快速開發(fā)。通過使用SPB,用戶可以在本地和遠(yuǎn)程DB2服務(wù)器上創(chuàng)建、修改、運(yùn)行、測試和調(diào)試存儲(chǔ) 過程。SPB提供Windows、AIX和Solaris下的開發(fā)環(huán)境,支持 DB2系列產(chǎn)品, 用戶可以從 DB2 UDB程序組啟動(dòng) SPB,也可以從 MS VC+,MS VB,IBMVisualAge for Java,DB2 控制中心啟動(dòng) SPB DB2 UDB V7.2創(chuàng)建用戶定義功能,

42、表功能和行功能時(shí)允許包含一條 SQL語句,這就減少了使用外部高級(jí)語言書寫 這些功能的需要。DB2 UDB V7.2推出了結(jié)構(gòu)數(shù)據(jù)類型(或者叫做抽象數(shù)據(jù)類型),這可以讓用戶和開發(fā)商們創(chuàng)建帶有結(jié)構(gòu)的表格。DB2 UDB V7.2版本中包括了許多可以提高系統(tǒng)性能和改善系統(tǒng)管理的功 能:能夠把ODBC/CLI應(yīng)用程序包含的動(dòng)態(tài)SQL語句轉(zhuǎn)換為靜態(tài)SQL并執(zhí)行; 活動(dòng)日志最大可為32GB ;支持多個(gè)TCP/IP收聽者(listener )。DB2 UDB 7提供三個(gè)新的擴(kuò)展器: 空間擴(kuò)展器(Spatial Extender) : DB2提出了空間SQL查詢概念(SpatiallyEnabled SQL

43、Queries),使用戶可以在關(guān)系型數(shù)據(jù)庫中集成空間數(shù)據(jù) (通 過坐標(biāo)確定位置)和普通的SQL數(shù)據(jù)。這兩種技術(shù)的結(jié)合使用戶可以進(jìn) 行新型查詢。新的空間擴(kuò)展器將能夠存儲(chǔ)和索引空間數(shù)據(jù)(坐標(biāo)信息),并 使用戶通過特定的空間數(shù)據(jù)查詢對(duì)其進(jìn)行訪問。(2) DB2 XML 擴(kuò)展器:IBM DB2 XML Extender 體現(xiàn)了 IBM 全面的 XML 技 術(shù)策略,在電子商務(wù)領(lǐng)域居業(yè)界領(lǐng)導(dǎo)地位。XML擴(kuò)展器是IBM B2B服務(wù)器的組成部分,使DB2服務(wù)器可以支持XML。IBM曾為早期XML技 術(shù)被采用和發(fā)展起到了關(guān)鍵作用,此次該擴(kuò)展器又提供了 XML存儲(chǔ)和數(shù) 據(jù)交換的新技術(shù)。通過存儲(chǔ),XML擴(kuò)展器提供了

44、 XML文檔在DB2中的 存儲(chǔ)和恢復(fù)機(jī)制,并可高效地查詢 XML內(nèi)容。通過數(shù)據(jù)交換,XML擴(kuò)展器提供新的和已存在的 DB2相關(guān)表格和XML格式文檔之間的映射。DB2用戶可以在任何地方通過 XML擴(kuò)展器進(jìn)行電子商務(wù),實(shí)現(xiàn)企業(yè)之間(B2B )和企業(yè)與消費(fèi)者之間(B2C )的應(yīng)用。本產(chǎn)品是免費(fèi)的。A支持先進(jìn)的面向?qū)ο蠛投嗝襟w應(yīng)用自從70年代IBM發(fā)明關(guān)系數(shù)據(jù)庫以來,在數(shù)據(jù)庫市場上,關(guān)系型數(shù)據(jù)庫管 理系統(tǒng)(RDBMS)得到極其廣泛的運(yùn)用。關(guān)鍵任務(wù)的應(yīng)用在很大程度上依賴于 RDBMS的使用。然而,目前很多 RDBMS用戶正轉(zhuǎn)向非傳統(tǒng)的、面向?qū)ο蟮膽?yīng) 用,需要對(duì)更廣泛的形形色色的現(xiàn)實(shí)世界數(shù)據(jù)予以支持。比如

45、,需要更有效地處 理在RDBMS中的文本、聲音、視頻、映象等數(shù)據(jù)。DB2通用數(shù)據(jù)庫(UDB)能夠支持這些先進(jìn)的應(yīng)用。DB2把對(duì)傳統(tǒng)應(yīng)用與非傳 統(tǒng)應(yīng)用的支持與數(shù)據(jù)庫體系結(jié)構(gòu)集成在一起,對(duì)關(guān)系型數(shù)據(jù)庫進(jìn)行面向?qū)ο髷U(kuò)展, 形成新一代對(duì)象關(guān)系型數(shù)據(jù)庫系統(tǒng)(Object Relational DBMS)。DB2 UDB V7.2提 供了許多對(duì)面向?qū)ο蠹岸嗝襟w應(yīng)用的支持。(1)用戶定義類型(UDT)DB2允許用戶定義新的數(shù)據(jù)類型,稱為用戶自定義類型(User DefinedType)。例如,一個(gè)用戶可以定義兩種幣值類型:用CDOLLAR表示加拿大元,用USDOLLAR表示美元。這兩種類型在內(nèi)部可以用dec

46、imal (十進(jìn)制)類型來表示,但在意義上是有顯著差別的。它們彼此間不應(yīng)也不能直接進(jìn)行比較,也不可 直接與decimal類型進(jìn)行比較。這是通過 DB2的面向?qū)ο髲?qiáng)類型(strong typing) 機(jī)制來保證的。象內(nèi)設(shè)(built-in)類型一樣,UDT可以用來定義表列的數(shù)據(jù)類型和 用戶定義函數(shù)(UDF)的參數(shù)。例如,用戶可以定義一個(gè)類型:多邊形 Polygo ns, 這個(gè)用戶自定義類型可有構(gòu)造函數(shù),還可有一組用戶定義的函數(shù)作用于它,如求 面積,求角度,以及旋轉(zhuǎn)多邊形等等。用戶定義函數(shù)(UDF)DB2允許用戶用C,C+等編譯語言定義新的函數(shù),稱為用戶自定義函數(shù)(User Defined Fun

47、ction)。UDF允許在查詢中包含強(qiáng)有力的計(jì)算過程和檢索判定,以便濾除在數(shù)據(jù)源附近無關(guān)的數(shù)據(jù)。UDF使用戶有能力提供一組函數(shù),它們作用 于用戶定義的類型,形成面向?qū)ο蟮姆庋b,從而定義該UDT的行為語義。SQL優(yōu)化器考慮到UDF的語義和執(zhí)行成本,這使得對(duì)待用戶定義的函數(shù)就完全象對(duì) 待內(nèi)設(shè)函數(shù)(如 SUBSTR和LENGTH) 一樣。開發(fā)應(yīng)用程序所用的語言環(huán)境可以 不同,女口 C、C+、COBOL、FORTRAN和PL/I等,借助于SQL,應(yīng)用程序共 享一組UDT和UDF。把用戶定義的類型和函數(shù)組合在一起使用,就能把數(shù)據(jù)的表示和解釋該數(shù)據(jù)的一組函數(shù)定義都隱藏起來。利用它們能創(chuàng)建函數(shù)庫,這些函數(shù)庫

48、可以是IBM開 發(fā)的,也可以是第三方經(jīng)銷商或客戶自行開發(fā)的,然后直接把它們集成在數(shù)據(jù)庫大對(duì)象(LOB)LOB允許用戶在一個(gè)數(shù)據(jù)庫中存儲(chǔ)特大(若干個(gè)GB)對(duì)象。在DB2中有二進(jìn) 制LOB(BLOB),字符LOB(CLOB),雙字節(jié)字符LOB(DBCLOB)等幾種類型。用 LOB可以存儲(chǔ)多媒體對(duì)象,如文檔資料、視頻信號(hào)、映象和聲音等。它也可存儲(chǔ) 由UDT和UDF定義其語義的小型結(jié)構(gòu)。DB2支持一組用于LOB的功能強(qiáng)大的 內(nèi)設(shè)函數(shù),如查找、子串和連接等。利用UDF方式用戶可隨時(shí)定義附加函數(shù)。另外,在一個(gè)表中可以定義多個(gè) LOB列。對(duì)LOB實(shí)現(xiàn)支持時(shí)要考慮到客戶對(duì)性能的需求,為此允許數(shù)據(jù)庫用戶或管 理

49、員執(zhí)行如下操作:僅訪問應(yīng)用程序需要的那部分 LOB,不必訪問整個(gè)LOB。延遲或取消LOB的求值過程。在定義一個(gè)LOB列時(shí),能做出選擇-對(duì)該LOB列是否作日志。把LOB數(shù)據(jù)存儲(chǔ)在不連續(xù)的數(shù)據(jù)庫分區(qū)中,這些分區(qū)是專為LOB管理而構(gòu)造的。關(guān)系數(shù)據(jù)庫擴(kuò)展器(Relational Extenders)關(guān)系數(shù)據(jù)庫擴(kuò)展器是一個(gè)預(yù)先包裝的用戶定義類型、用戶定義函數(shù)、觸發(fā)器、約束以及存貯過程的集合。利用 DB2提供的對(duì)象關(guān)系型特征,把 DB2的基于內(nèi)容的搜索能力擴(kuò)展到諸如文本、圖像、視頻、音頻之類的新的數(shù)據(jù)類型。使用關(guān) 系擴(kuò)展程序,只需簡單地添加由關(guān)系擴(kuò)展程序提供的相應(yīng)數(shù)據(jù)類型的列 (如文本或圖像列),用戶就可

50、以把文本文檔、圖像、視頻、音頻等連同常規(guī)企業(yè)數(shù)據(jù)一起存 貯在DB2的表中,對(duì)這些表的結(jié)構(gòu)或主關(guān)鍵列并沒有任何特殊要求。關(guān)系擴(kuò)展程 序還提供了一組用戶定義函數(shù),用于對(duì)新數(shù)據(jù)類型的管理、索引和搜索。(5)集成內(nèi)容搜索集成內(nèi)容搜索由Relational Extenders通過用戶定義函數(shù)來支持。例如:DB2Image Extender提供了一組函數(shù)來支持關(guān)于圖像的、基于內(nèi)容的搜索。一個(gè)用戶 可以在一個(gè)SQL查詢中使用一個(gè)Image Extender函數(shù)來請(qǐng)求那些與一個(gè)現(xiàn)有圖 像相似的圖像。并且,其實(shí)現(xiàn)對(duì)用戶是透明的,用戶只需簡單地把他的搜索請(qǐng)求 表示為SQL查詢即可,該SQL查詢將自動(dòng)地調(diào)用由擴(kuò)展程

51、序提供的函數(shù)。DB2的基于SQL的、支持集成內(nèi)容搜索的方法的另一個(gè)重要的優(yōu)點(diǎn)是既可以在多種 非常規(guī)的數(shù)據(jù)類型上搜索給定的查詢,又可以在常規(guī)的數(shù)據(jù)上搜索給定的查詢。B強(qiáng)勁的在線分析處理(OLAP)支持DB2優(yōu)化器能夠使用動(dòng)態(tài)位圖索引(Dy namic Bit-Map In dex An di ng)即根據(jù) 需要在相應(yīng)字段上自動(dòng)地動(dòng)態(tài)生成位圖索引,從維數(shù)表格 (Dimension table)中調(diào) 選出符合條件的記錄,再和事實(shí)表格(Fact table)連接,提高了訪問多維數(shù)據(jù)的性能;而不是執(zhí)行Cartesian的維數(shù)表格連接,避免了大量中間數(shù)據(jù)的生成,中間數(shù)據(jù)已實(shí)現(xiàn)了理論上的最小值。當(dāng)連接所涉及

52、的表達(dá)到三個(gè)或三個(gè)以上,DB2可自動(dòng)判斷是否使用星型連接技術(shù)(Star Join)和動(dòng)態(tài)位圖索引進(jìn)行優(yōu)化。DB2在SQL中新增加了 ROLLUP和CUBE功能,ROLLUP功能通過在常 規(guī)組的行中增加 小計(jì)”和總計(jì)”行來提供擴(kuò)展的組(GROUP),CUBE功能增加了 Cross-tabulation ”行。它們通過星型連接(Star join)方式在關(guān)系型數(shù)據(jù)庫中支持在 線分析處理(OLAP),使用立體的結(jié)構(gòu)查看和歸納數(shù)據(jù)而不是傳統(tǒng)的平面結(jié)構(gòu)。DB2的優(yōu)化器一向是值得IBM驕傲的,它提供了領(lǐng)先于其它數(shù)據(jù)庫廠商的基于成 本優(yōu)化技術(shù),它在優(yōu)化時(shí)考慮了 CPU速度、磁盤I/O率、表格尺寸、有效訪問路

53、 徑,并且如果可能的話可以重寫查詢, 以得到更高的性能。這更使得DB2的在線 分析處理(OLAP)功能如虎添翼。C卓越的并行處理能力(1)并行優(yōu)化技術(shù)DB2 UDB V7.2無論在SMP還是在MPP環(huán)境下,甚至在SMP節(jié)點(diǎn)組成的MPP環(huán)境下,都可充分發(fā)揮其并行處理能力。查詢執(zhí)行時(shí)被透明地分開后并行執(zhí)行(稱作內(nèi)部查詢并行性:Intra-query parallelism),過去需要數(shù)小時(shí)的查詢現(xiàn)在 只需幾分鐘就可以完成。過去不能執(zhí)行的查詢現(xiàn)在不僅可行,而且還能從中獲益。在SMP環(huán)境下處理并行,DB2 UDB采用的是吸管模型(Straw model)。此時(shí)被執(zhí)行的SQL相當(dāng)于杯子中的水,而每個(gè)CP

54、U相當(dāng)于一根吸水的吸管,這樣被 執(zhí)行的SQL很快就被CPU吸干”了。在MPP環(huán)境下處理并行,則相當(dāng)于把杯子 中的水先智能地分配給多個(gè)小水杯(參與SQL執(zhí)行的節(jié)點(diǎn)機(jī)),這樣小水杯中的水 就分別被每個(gè)節(jié)點(diǎn)機(jī) 吸干”了。有了好的模型僅僅是開了個(gè)好頭,DB2 UDB V7.2 中融入的最先進(jìn)的技術(shù)才是成功的關(guān)鍵。(1) 并行優(yōu)化:從很多系統(tǒng)中抽取非常多的數(shù)據(jù),這會(huì)耗費(fèi)大量的時(shí)間,如果效率不高,還會(huì)浪費(fèi)大量寶貴的處理能力。從串行數(shù)據(jù)庫中抽取數(shù)據(jù)有很多方 法,它們沒有必要象并行數(shù)據(jù)庫那樣運(yùn)作。DB2 UDB V7.2有一個(gè)查詢優(yōu)化器,是由IBM研究機(jī)構(gòu)開發(fā)的,它是專為提高并行抽取數(shù)據(jù)的效率而設(shè)計(jì)的。這樣就

55、可獲得高品質(zhì)的查詢性能,特別是對(duì)特大型數(shù)據(jù)庫。(2) 全面并行(Parallel Everything) : DB2首先把數(shù)據(jù)分配到數(shù)據(jù)庫中的多個(gè) 分區(qū)或子集中,這些數(shù)據(jù)庫位于多個(gè) SP站點(diǎn)或SMP服務(wù)器內(nèi)。接著,DB2自 動(dòng)創(chuàng)建一個(gè)并行處理訪問計(jì)劃。數(shù)據(jù)掃描、合并、分類、負(fù)載平衡、表格重組、數(shù)據(jù)調(diào)用、創(chuàng)建索引、索引訪問、備份與恢復(fù)等一系列工作都是在所有不同的節(jié) 點(diǎn)里同時(shí)完成的。DB2 UDB V7.2以并行方式執(zhí)行全部數(shù)據(jù)庫功能,這包括全部 SQL 語句(Select、Insert、Update 和 Delete) 實(shí)用程序(backup , restore , reorg, load)和數(shù)

56、據(jù)存取方法(連接、表掃描和索引掃描)等,而且無需任何額外的編程。 這不僅提供了更好的性能和可伸縮性,而且也提供了更佳的管理性一一有能力利 用全部處理機(jī)去執(zhí)行數(shù)據(jù)庫管理任務(wù)。進(jìn)一步說,DB2 UDB V7.2既可用于聯(lián)機(jī)事務(wù)處理(OLTP),又可用于決策支持查詢工作。(3) 管理工具在并行環(huán)境同樣適用:Governor幫助您控制每個(gè)用戶及應(yīng)用程序的資源利用率,可自動(dòng)調(diào)整查詢的優(yōu)先級(jí)。從而,在線平衡負(fù)載,簡化系統(tǒng)管 理,減少關(guān)機(jī)時(shí)間。通過并行在線備份功能可顯著減少備份及恢復(fù)所需的時(shí)間。 并行環(huán)境下功能不受任何限制:DB2 UDB V7.2對(duì)多媒體數(shù)據(jù)的支持、 支持的客戶端平臺(tái)、支持的應(yīng)用開發(fā)接口和

57、開發(fā)工具以及動(dòng)態(tài)位圖索引等多維分 析功能、對(duì) WEB和Java的支持均不受限制。對(duì)MPP結(jié)構(gòu)計(jì)算機(jī)的獨(dú)特支持當(dāng)企業(yè)的業(yè)務(wù)系統(tǒng)或數(shù)據(jù)倉庫系統(tǒng)的數(shù)據(jù)量不斷增大、并發(fā)用戶量不斷增大 時(shí),依靠單一的數(shù)據(jù)庫服務(wù)器往往難以獲得比較好的性能和處理能力。此時(shí),由 多臺(tái)服務(wù)器協(xié)同工作成為解決這一問題的有效手段。多臺(tái)服務(wù)器協(xié)同工作的手段主要有共享硬盤的集群式計(jì)算機(jī),以及不共享任 何資源而自以高速網(wǎng)絡(luò)相連的海量并行處理計(jì)算機(jī)兩種方式。隨著計(jì)算機(jī)科學(xué)的 不斷發(fā)展,無論是科學(xué)計(jì)算領(lǐng)域還是在數(shù)據(jù)庫領(lǐng)域都已經(jīng)備計(jì)算機(jī)科學(xué)家證明, 海量并行處理是目前解決大數(shù)據(jù)量、最大限度里并行處理能力的最佳手段。運(yùn)行在 MPP體系結(jié)構(gòu)計(jì)算機(jī)上的 DB2 UDB V7.2企業(yè)擴(kuò)展版(EnterpriseExtended Edition),作為并行關(guān)系數(shù)據(jù)庫它允

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論