




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)倉庫解決方案Sybase商業(yè)智能白皮書1目錄Sybase 數(shù)據(jù)倉庫解決方案3Sybase IQ 專為分析型應(yīng)用設(shè)計(jì)的數(shù)據(jù)庫5商業(yè)智能的數(shù)據(jù)庫需求5IQ 核心概念5IQ 獨(dú)特的優(yōu)勢7Industry Warehouse Studio數(shù)據(jù)倉庫基礎(chǔ)架構(gòu)9失敗的教訓(xùn)從零開始9IWS 架構(gòu)9IWS 應(yīng)用組件10分析型 CRM10商業(yè)績效分析11IWS 帶來的好處12WarehouseStudio13數(shù)據(jù)倉庫設(shè)計(jì)-Warehouse Architect13多維建模13設(shè)計(jì)向?qū)?5優(yōu)化代碼生成16Warehouse Architect 帶來的好處17Warehouse Control Center 數(shù)據(jù)
2、倉庫管理18數(shù)據(jù)倉庫整個(gè)生命周期的管理18Warehouse Control Center 帶來的好處19POWERDESIGNER1120產(chǎn)品介紹20POWERDESIGNER是一個(gè)可靠選擇22POWERDESIGNER 11的優(yōu)點(diǎn)23POWERDESIGNER 11模塊封裝242Sybase 數(shù)據(jù)倉庫解決方案BI Solutions利用完整的信息及時(shí)作出正確的決策,這就是數(shù)據(jù)倉庫所要完成的任務(wù)。在經(jīng)歷了多年以業(yè)務(wù)為主的系統(tǒng)建設(shè)以及以強(qiáng)調(diào)數(shù)據(jù)收集為主的數(shù)據(jù)倉庫建設(shè)之后,目前普遍認(rèn)為, 數(shù)據(jù)倉庫正向新的第二代數(shù)據(jù)倉庫過渡,而且很多學(xué)者專家認(rèn)為,傳統(tǒng)的以事務(wù)處理為主的應(yīng)用,其重要性正退居其次,這
3、種共存的體系構(gòu)成所謂的“閉環(huán)決策處理系統(tǒng)” 。其基本特征為:BI 成為事務(wù)處理的完整部分要得到有關(guān)實(shí)施某一任務(wù)的忠告建議或步驟,就需要更接近實(shí)時(shí)的數(shù)據(jù)更新,即席查詢, 甚至人工智能。 BI 已經(jīng)逐漸成為事務(wù)處理的完整部分。從技術(shù)上來講,對數(shù)據(jù)管理,數(shù)據(jù)加載等提出了更高的要求。多層面的用戶擴(kuò)展數(shù)據(jù)倉庫面向的使用對象將不再局限于企業(yè)管理層,隨著 Web 及 Internet 的不斷發(fā)展,通過 Web 方式向分布式企業(yè)的各類人員,及其供應(yīng)商,經(jīng)銷商,客戶提供必要的商業(yè)智能應(yīng)用正成為必需。用戶層面的擴(kuò)展同時(shí)帶來了大量的用戶并發(fā)。 從技術(shù)上來講, 對數(shù)據(jù)倉庫應(yīng)用的并發(fā)性及可擴(kuò)展性也提出了新的要求。DM
4、Review 最近的調(diào)查(如圖)指出,各類用戶對商業(yè)智能都表現(xiàn)出強(qiáng)烈的需求。數(shù)據(jù)的融合從 DM Review 最近的調(diào)查可以看到,人們希望商業(yè)智能能夠提供各方面的分析,包括財(cái)務(wù)分析,客戶關(guān)系分析,供應(yīng)鏈分析等。數(shù)據(jù)的融合和完整的數(shù)據(jù)倉庫正成為趨勢。從技術(shù)上來說,對數(shù)據(jù)倉庫的存儲規(guī)模與查詢性能提出了更大的挑戰(zhàn)。強(qiáng)調(diào)數(shù)據(jù)模型的設(shè)計(jì)在傳統(tǒng)的數(shù)據(jù)倉庫建設(shè)中,往往強(qiáng)調(diào)數(shù)據(jù)的收集以及前端的數(shù)據(jù)展現(xiàn),而對數(shù)據(jù)倉庫的設(shè)計(jì)與建模關(guān)心不足,造成系統(tǒng)升級困難,甚至項(xiàng)目實(shí)施的失敗。當(dāng)前數(shù)據(jù)倉庫的實(shí)施,設(shè)計(jì)與建模已經(jīng)得到最終用戶的高度重視, 因?yàn)槌晒Φ脑O(shè)計(jì)對數(shù)據(jù)倉庫的實(shí)施來說可以達(dá)到事半功倍的效果。然而成功的設(shè)計(jì)需要正
5、確的設(shè)計(jì)方法,大量的需求調(diào)研以及豐富的實(shí)施經(jīng)驗(yàn),這是大多數(shù)廠商在實(shí)施過程中尤為頭疼的問題。目前, 只有 Sybase 公司提供了近乎完美的行業(yè)數(shù)據(jù)倉庫設(shè)計(jì)模型IWS 。IWS 在全球已被廣泛應(yīng)用,3近期在中國國內(nèi)的應(yīng)用已經(jīng)受到了用戶的廣泛關(guān)注。Sybase 商業(yè)智能部門(Business Intelligence Division)致力于為新一代商業(yè)智能提供核心的解決方案。Sybase BI 部門所提供的軟件產(chǎn)品與專業(yè)服務(wù)將數(shù)據(jù)轉(zhuǎn)化為信息、知識與智慧,以使企業(yè)提高市場份額、減少客戶流失、向已有客戶進(jìn)行衍生銷售等。 BI 部門與其他領(lǐng)先的商業(yè)智能供應(yīng)商締結(jié)合作伙伴關(guān)系,為各類行業(yè)市場提供完整的商
6、業(yè)智能解決方案,包括金融服務(wù)、信用卡市場、保險(xiǎn)、銀行、通訊以及Internet 等。Sybase IQWarehouse StudioSybase 商業(yè)智能解決方案涵蓋數(shù)據(jù)倉庫設(shè)計(jì)、實(shí)施、管理以及方法學(xué)的各個(gè)方面的軟件產(chǎn)品。其中兩個(gè)核心產(chǎn)品:Sybase IQ 一個(gè)高性能的關(guān)系型數(shù)據(jù)庫, 專為滿足電子商務(wù)智能與 Web 化的數(shù)據(jù)倉庫的需求而設(shè)計(jì)。* 可擴(kuò)展性提供數(shù)以千計(jì)的用戶并發(fā)訪問超大規(guī)模的數(shù)據(jù)* 速度查詢響應(yīng)速度以秒計(jì),而非分鐘或小時(shí)* 靈活性允許用戶提交任何類型的即席查詢* 經(jīng)濟(jì)數(shù)據(jù)壓縮顯著降低存儲空間,簡單性減少維護(hù)成本Industry Warehouse Studio一個(gè)企業(yè)分析基礎(chǔ)
7、架構(gòu),加速商業(yè)智能應(yīng)用的設(shè)計(jì)、開發(fā)與部署??蛻艨梢允褂肐WS 建立一流的分析應(yīng)用。IWS 面向各個(gè)行業(yè):金融、媒體、通訊、銀行等。Sybase商業(yè)智能軟件產(chǎn)品所擁有的許多新的優(yōu)秀特性正使其成為建設(shè)新一代數(shù)據(jù)倉庫的楷模。4Sybase IQ 專為分析型應(yīng)用設(shè)計(jì)的數(shù)據(jù)庫商業(yè)智能的數(shù)據(jù)庫需求電子商務(wù)在不斷發(fā)展, 企業(yè)對電子商務(wù)的認(rèn)識和態(tài)度也在轉(zhuǎn)變, 新技術(shù)的不斷涌現(xiàn)如無線和移動(dòng)網(wǎng)技術(shù)等,企業(yè)對競爭與商業(yè)績效的進(jìn)一步關(guān)注,個(gè)性化的潮流,企業(yè)對成本的關(guān)注,所有這些將商業(yè)智能帶入了一個(gè)新的時(shí)代。今天的商業(yè)智能架構(gòu),對數(shù)據(jù)庫引擎提出了新的認(rèn)識。1大數(shù)據(jù)量在今天高度競爭的環(huán)境中,需要深入的理解與分析以留住有利
8、潤的客戶。你如何獲得關(guān)于客戶、產(chǎn)品、運(yùn)營、關(guān)鍵利潤來源的理解?通過收集、 保留、管理大量的數(shù)據(jù)。 而今天, 電子商務(wù)、 Internet 、原有的事務(wù)系統(tǒng)生成了大量的數(shù)據(jù)。企業(yè)需要一種方式獲取、保留、存儲、管理、研究大量的快速增長的數(shù)據(jù)。2大量并發(fā)查詢基于 Web 公司正逐步向客戶、供應(yīng)商、代理商以及其他商業(yè)合作伙伴開放對數(shù)據(jù)的訪問。今天,客戶自服務(wù)意味著數(shù)以百萬計(jì)甚至千萬計(jì)的人將會訪問與他們的帳號相關(guān)的數(shù)據(jù)?;蛘撸赡芤馕吨?10000 個(gè)供應(yīng)商訪問他們正在提供的產(chǎn)品與服務(wù)而且以一種遠(yuǎn)比消費(fèi)者復(fù)雜的模式進(jìn)行交互。3復(fù)雜的查詢商業(yè)智能從根本上來說已經(jīng)不再是簡單的查詢。它越來越是一個(gè)復(fù)雜的行為模
9、式以及復(fù)雜的客戶特征與客戶行為之間相互的關(guān)系。 數(shù)據(jù)的復(fù)雜性與問題的深度表明: 商業(yè)智能的許多查詢顯然需要消耗很多系統(tǒng)資源是復(fù)雜與困難的。4快速響應(yīng)過去幾年, Internet 的廣泛使用對數(shù)據(jù)倉庫帶來了另一個(gè)影響:數(shù)據(jù)比過去更多的被交互式的訪問。早期的數(shù)據(jù)倉庫主要集中在大量的預(yù)定義的批報(bào)告與分析。現(xiàn)在出現(xiàn)了非常不同的使用方式:大量的在線查詢, 用戶希望在秒或分鐘級獲得查詢結(jié)果,而不是幾小時(shí)或整晚。這要求數(shù)據(jù)庫引擎能夠提供交互式的快速響應(yīng)。5可擴(kuò)展性現(xiàn)在,數(shù)據(jù)倉庫不同于過去,是一個(gè)非常動(dòng)態(tài)的環(huán)境。由于大量的用戶每天都在使用,其工作量非常動(dòng)態(tài)。當(dāng)商業(yè)的步伐進(jìn)入“互聯(lián)網(wǎng)時(shí)代” ,新的應(yīng)用、主題、與
10、用戶急劇增加??蓴U(kuò)展性使數(shù)據(jù)倉庫具有高性能。這是新時(shí)代數(shù)據(jù)倉庫的重要因素。IQ 核心概念Sybase IQ 是一個(gè)高度可擴(kuò)展的分析型數(shù)據(jù)庫引擎,專門為分析型應(yīng)用與數(shù)據(jù)倉庫而設(shè)計(jì), 使數(shù)據(jù)倉庫應(yīng)用擁有卓越的查詢性能與最低的總擁有成本。不同于傳統(tǒng)數(shù)據(jù)庫主要考慮在線的事務(wù)進(jìn)程的設(shè)計(jì),是專門為分析型而不是事務(wù)型而建構(gòu)的,首先關(guān)注的是查詢的性能。其垂直存儲、專利索引技5術(shù)以及獨(dú)特的架構(gòu)使其成為數(shù)據(jù)倉庫的最佳選擇。1帶壓縮的列存儲IQ 按列存儲數(shù)據(jù),而不是行這與所有其他關(guān)系型數(shù)據(jù)庫引擎廣泛使用的存儲方法方向相反。決策處理中的很多查詢只需要很少量的列數(shù)據(jù),因而與傳統(tǒng)的RDBMS相比,這種方法在選擇滿足查詢條
11、件的數(shù)據(jù)時(shí),只須涉及到很少的數(shù)據(jù)頁面。進(jìn)一步講, 列向量在磁盤上是壓縮存儲的。按列存儲數(shù)據(jù)時(shí)由于相鄰接的字段值具有相同的數(shù)據(jù)類型,所以使Sybase IQ 更容易對數(shù)據(jù)作壓縮處理。但在傳統(tǒng)的按行存儲數(shù)據(jù)的情況下,就不可能有這樣的效果, 因?yàn)榱信c列之間數(shù)據(jù)類型通常是不同的。數(shù)據(jù)壓縮的另一好處,是經(jīng)去規(guī)范化處理而形成的表不會對磁盤空間有過量的要求,因?yàn)橹貜?fù)的數(shù)據(jù)經(jīng)壓縮實(shí)際上就消除了。數(shù)據(jù)的列式存儲所帶來的另一好處,是當(dāng)需要一列新數(shù)據(jù)時(shí)不會引起數(shù)據(jù)庫結(jié)構(gòu)的改變,而對于很多傳統(tǒng)的RDBMS而言,在這種情況下數(shù)據(jù)庫結(jié)構(gòu)的改變恰恰是免不了的事。列存儲加上數(shù)據(jù)壓縮,IQ 在查詢中典型的比傳統(tǒng)數(shù)據(jù)庫引擎少做超
12、過10-100 倍的磁盤I/O 。結(jié)果是, IQ 的列存儲帶來明顯的性能改善。2獨(dú)特的索引結(jié)構(gòu)IQ 中使用的索引結(jié)構(gòu)的組合是獨(dú)一無二的,為數(shù)據(jù)倉庫高度優(yōu)化的。比特式(bit-wise )索引及相應(yīng)的壓縮技術(shù)是 Sybase 的一項(xiàng)專利。 Sybase IQ 運(yùn)用這一技術(shù)對數(shù)據(jù)倉庫中的所有字段建立索引,由此不僅帶來查詢效率的大幅度提高,而且還降低了對磁盤空間的使用。在 IQ 中,對所有的列至少進(jìn)行一次索引化,而且可以為每個(gè)列建立多個(gè)索引。同時(shí),查詢優(yōu)化器可以進(jìn)行多種選擇以優(yōu)化查詢性能,對不同的查詢使用不同的索引。在傳統(tǒng) RDBMS 中,不僅實(shí)際數(shù)據(jù)占用磁盤空間,相應(yīng)的索引也占用磁盤空間,在總量上
13、后者超過前者的情形并不鮮見。但Sybase IQ 的比特式索引根本無須增加磁盤空間,因?yàn)镾ybase IQ 中的索引就是數(shù)據(jù)庫。Sybase 與其客戶的使用報(bào)告表明,IQ所需的磁盤一般只占原始輸入數(shù)據(jù)所需空間的40%-60% ,而且,查詢速度會比傳統(tǒng)的數(shù)據(jù)庫引擎數(shù)以千倍的提高。查詢優(yōu)化IQ 擁有有一個(gè)出色的查詢優(yōu)化器,能夠?qū)χ^詞評估、聯(lián)合類型、排序、分組、數(shù)據(jù)訪問以及其他查詢評估步驟做出復(fù)雜的決定。由于 IQ 架構(gòu)允許維護(hù)大量索引,而且由于系統(tǒng)在多數(shù)情況下通過索引化的列值保留了精確的行的記錄數(shù), 優(yōu)化器能夠比許多關(guān)系型引擎更好的利用這些信息來生成更佳的查詢計(jì)劃。并行操作新的多線索體系結(jié)構(gòu)Syb
14、ase IQ 采用了新的體系結(jié)構(gòu),即單進(jìn)程多線索結(jié)構(gòu)。這種結(jié)構(gòu)在處理多個(gè)并發(fā)用戶的請求時(shí),能夠降低處理和內(nèi)存方面的開銷 ,并能夠支持?jǐn)?shù)百甚至上千個(gè)并發(fā)用戶的能力。本質(zhì)上講, IQ 允許多個(gè)節(jié)點(diǎn)共享磁盤上的數(shù)據(jù),每一個(gè)節(jié)點(diǎn)訪問整個(gè)IQ 的共享數(shù)據(jù)存儲區(qū),并且對它直接進(jìn)行物理存取。有兩種類型的節(jié)點(diǎn): 寫節(jié)點(diǎn)和讀節(jié)點(diǎn)。 寫節(jié)點(diǎn)擁有全部的數(shù)據(jù)庫鎖執(zhí)行DBA任務(wù)是唯一的能夠更新數(shù)據(jù)庫的節(jié)點(diǎn)。寫節(jié)點(diǎn)擁有更新鎖這一事實(shí)完全消除了傳統(tǒng)的關(guān)系型數(shù)據(jù)庫中所存在的鎖系統(tǒng)開銷。在傳統(tǒng)的關(guān)系型數(shù)據(jù)庫中,為了確保數(shù)據(jù)的一致性,必須跨節(jié)點(diǎn)協(xié)調(diào)數(shù)據(jù)庫鎖。由于在 IQ 中每一個(gè)節(jié)點(diǎn)使用它自己的CPU 和內(nèi)存資源運(yùn)行,節(jié)點(diǎn)之間僅
15、需極少的通訊,因而確6保了每個(gè)節(jié)點(diǎn)之間的零沖突。只有寫節(jié)點(diǎn),能夠?qū)Q 進(jìn)行更新,以便能夠管理和更新數(shù)據(jù)存儲和對節(jié)點(diǎn)進(jìn)行同步。一個(gè)查詢在它被連接的節(jié)點(diǎn)客戶機(jī)上完成; 其它的節(jié)點(diǎn)不參與查詢工作(單個(gè)的查詢不需要跨多個(gè)節(jié)點(diǎn) )。因此不需要昂貴的,復(fù)雜的,高速的節(jié)點(diǎn)間互連。這個(gè)架構(gòu)提供了一個(gè)高度的用戶擴(kuò)展性能。查詢性能與可擴(kuò)展性相結(jié)合,其結(jié)果就是,IQ 所擁有的架構(gòu)使其可以服務(wù)于大規(guī)模的在線查詢用戶。總之, IQ 新體系結(jié)構(gòu)的效果就是高性能的處理大量的在線用戶執(zhí)行各種類型的查詢。5快速加載IQ 支持批量與非批量數(shù)據(jù)庫加載。并行操作已經(jīng)內(nèi)建到面向插入與更新操作的加載器中,因此,無需為多個(gè)數(shù)據(jù)倉庫應(yīng)用提
16、交多個(gè)并行加載工作以獲得并行化。6 IQM與“非共享的”MPP (大規(guī)模并行處理)之比較IQ 共享磁盤,不需要對數(shù)據(jù)庫進(jìn)行分區(qū)。MPP 系統(tǒng)由于需要對數(shù)據(jù)表進(jìn)行水平數(shù)據(jù)分區(qū),因此,大大地增加了工作量及維護(hù)和管理數(shù)據(jù)庫所需的成本。IQ 不受錯(cuò)誤的數(shù)據(jù)和查詢的影響,與MPP 系統(tǒng)不同,它能夠有效地管理不同規(guī)模的節(jié)點(diǎn)。IQ 獨(dú)特的優(yōu)勢信息正成為驅(qū)動(dòng)企業(yè)成功的引擎。為了贏得成功, 你需要比你的對手或敵人更迅速的將巨量的信息轉(zhuǎn)化為智慧的決策。下面描述了IQ 獨(dú)特的架構(gòu)特征所帶來的一些關(guān)鍵的效果??焖俨樵僑ybase IQ 為你的最終用戶提供的回答比使用傳統(tǒng)數(shù)據(jù)倉庫快10 到 1000 倍,而不論存在多少
17、數(shù)量的用戶和查詢。這意味著查詢結(jié)果將在幾秒或幾分鐘內(nèi)返回,而傳統(tǒng)的技術(shù)卻需要花費(fèi)幾小時(shí)或幾天。并且由于 Sybase IQ 可以對數(shù)據(jù)進(jìn)行實(shí)時(shí)加載,而不影響查詢性能,因此用戶可以高效的基于最實(shí)時(shí)的信息作出最佳的決策。高度的可擴(kuò)展性與靈活性Sybase IQ 的設(shè)計(jì)允許數(shù)據(jù)倉庫從基礎(chǔ)開始擴(kuò)展,從很小擴(kuò)展到非常巨大的規(guī)模。這一點(diǎn)已經(jīng)完全被驗(yàn)證:* 數(shù)以千計(jì)的用戶與查詢* 各種服務(wù)器,幾十個(gè)節(jié)點(diǎn),幾百個(gè)CPU ,48TB 以上的輸入數(shù)據(jù)可擴(kuò)展性對 Sybase IQ 而言,舉重若輕,你可以從一個(gè)小型的數(shù)據(jù)倉庫開始,擴(kuò)展到大型的數(shù)據(jù)倉庫。也可以從大型開始擴(kuò)展到超大型的數(shù)據(jù)倉庫。節(jié)約存儲成本/數(shù)據(jù)壓縮S
18、ybase IQ 壓縮數(shù)據(jù)倉庫可以多至 70%。在由 TPC 測試專家 Francois Raab主持的基準(zhǔn)測試中, Sybase IQ 加載了 48.2TB 的原始數(shù)據(jù),而將其壓縮到 22TB 的數(shù)據(jù)倉庫中。使用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,同樣的 48.2TB 數(shù)據(jù)可能會膨脹到 120-240TB 。這一點(diǎn)比起傳統(tǒng)的數(shù)據(jù)庫來,大大節(jié)約了存儲成本。降低維護(hù)成本徹底消除為每個(gè)查詢進(jìn)行調(diào)優(yōu)的需要, 消除為管理和維護(hù)新增節(jié)點(diǎn)和數(shù)據(jù)花費(fèi)大量時(shí)間和資源的的需要, Sybase IQ 降低了數(shù)據(jù)管理成本,減少了維護(hù)工作量及其相關(guān)成本。加快部署由于 Sybase IQ 從下到上都是為分析而構(gòu)建,所以相比傳統(tǒng)的數(shù)據(jù)庫
19、,僅需很少的部署時(shí)間。使用IQ, 不需要為分析而在數(shù)據(jù)庫上面花費(fèi)很多工作。部署時(shí)間可以大幅減少多達(dá)80%。這意味著企業(yè)可以快速獲得結(jié)果。利用現(xiàn)有投資正如所有 Sybase 技術(shù), Sybase IQ 基于開放標(biāo)準(zhǔn),確保與企業(yè)現(xiàn)有 IT 資產(chǎn)的集成與協(xié)同工作??偨Y(jié)查詢性能與可擴(kuò)展性是今天數(shù)據(jù)倉庫必不可少的功能特性。這意味著電子商務(wù)可以將數(shù)據(jù)轉(zhuǎn)化為深7邃的洞察力與真正的經(jīng)濟(jì)價(jià)值。 這同時(shí)也意味著可以用更低的費(fèi)用提供大規(guī)模用戶的查詢。 對企業(yè)來說,意味著數(shù)據(jù)倉庫的實(shí)現(xiàn)更加簡單,勿須再承擔(dān)高額的預(yù)算甚至對企業(yè)事業(yè)的威脅。8Industry Warehouse Studio數(shù)據(jù)倉庫基礎(chǔ)架構(gòu)失敗的教訓(xùn)從零
20、開始如果在過去十年的經(jīng)驗(yàn)中有什么需要吸取的唯一的教訓(xùn), 那就是從零開始建立數(shù)據(jù)倉庫是一個(gè)失敗的建議。它意味著先期必須花費(fèi)巨大的時(shí)間和資金收集需求、理解特定行業(yè)的業(yè)務(wù)、設(shè)計(jì)模型、建立抽取、轉(zhuǎn)換、加載模板以及建立分析查詢。Meta Group 的報(bào)告指出20% 的數(shù)據(jù)倉庫項(xiàng)目是“悲慘的失敗者”,而另外 50%僅僅取得了部分的成功。其他的行業(yè)評估機(jī)構(gòu)將完全失敗的比例定得更高。在大多數(shù)的案例中,失敗是由于企業(yè)缺乏數(shù)據(jù)倉庫的專業(yè)知識,并且使用了傳統(tǒng)的面向事務(wù)的開發(fā)技術(shù)與數(shù)據(jù)模型.然而,究竟有沒有一條途徑能夠集中數(shù)據(jù)倉庫專家的經(jīng)驗(yàn), 吸取在眾多數(shù)據(jù)倉庫項(xiàng)目所得到的教訓(xùn),能夠訪問已被驗(yàn)證的行業(yè)特定方法、應(yīng)用
21、與數(shù)據(jù)模型?現(xiàn)在,有了Sybase Industry Warehouse Studio (IWS) !IWS 架構(gòu)在過去的幾年里, 我們一直在研究使分析型應(yīng)用的開發(fā)成為如此長時(shí)間、 高成本與高風(fēng)險(xiǎn)的過程的因素。我們發(fā)現(xiàn),在每個(gè)行業(yè)里存在一些共同的元素工作流、衡量方法、報(bào)表需求、術(shù)語與數(shù)據(jù)類型不需要為每個(gè)新的項(xiàng)目重新建立。我們把這些共同的元素集中到我們的 IWS 中,使你能夠提交商業(yè)智能應(yīng)用,以描述整個(gè)企業(yè)范圍內(nèi)不同卻相關(guān)的客戶行為、價(jià)值、潛力等因素??焖?、以最小的成本與風(fēng)險(xiǎn)。IWS 被喻為數(shù)據(jù)倉庫實(shí)施的“新浪潮” ,它將數(shù)據(jù)倉庫基礎(chǔ)架構(gòu)的核心組件,核心的商業(yè)模型、物理數(shù)據(jù)規(guī)劃、元數(shù)據(jù)管理和應(yīng)用
22、樣本有效組織為一個(gè)單一的軟件包。IWS 方法論建立一個(gè)成功的數(shù)據(jù)倉庫可能是一個(gè)相當(dāng)復(fù)雜的過程。沒有一個(gè)“成功指南”,許多企業(yè)常常首先從選擇技術(shù)開始建立一個(gè)數(shù)據(jù)倉庫,結(jié)果是系統(tǒng)并未能描述開始建立一個(gè)數(shù)據(jù)倉庫的原因,而商業(yè)問題正是這個(gè)原因。如圖所示,數(shù)據(jù)倉庫實(shí)施決策過程的第一步是考慮商業(yè)戰(zhàn)略和明確商業(yè)目標(biāo)。IWS 方法論支持這個(gè)商業(yè)為核心的決策過程。IWS 方法論專門為建立數(shù)據(jù)倉庫而設(shè)計(jì)。它涵蓋了建立與部署一個(gè)數(shù)據(jù)倉庫的所有方面,劃分為幾個(gè)特定的階段和步驟。每個(gè)步驟都要求被執(zhí)行以生成一個(gè)成功的數(shù)據(jù)倉庫。這個(gè)方法學(xué)的結(jié)構(gòu)如圖所示:IWS 方法論以一個(gè)用來測定數(shù)據(jù)倉庫是否有效支持商業(yè)戰(zhàn)略的“準(zhǔn)備就緒測
23、試 (readiness test)”和一個(gè)用來確立商業(yè)戰(zhàn)略的內(nèi)容與優(yōu)先級的 “商業(yè)探測 (business exploration) ”階段開始。 隨著關(guān)鍵的商業(yè)驅(qū)動(dòng)的確定,確定候選的應(yīng)用就更容易和更有效。對IWS 而言,在數(shù)據(jù)倉庫實(shí)施過程中,所有這些步驟都在考慮數(shù)據(jù)倉庫工具之前發(fā)生。9IWS 方法論可以被歸類為一種進(jìn)化的方法。下面的語句總結(jié)了進(jìn)化的設(shè)計(jì)原理:在我們將局部組合起來之前,必須有一個(gè)描述整體的邏輯框架我們將這種進(jìn)化的設(shè)計(jì)原理應(yīng)用到數(shù)據(jù)倉庫,一個(gè)描述完整的數(shù)據(jù)倉庫的設(shè)計(jì)必須在進(jìn)行任何一步實(shí)施之前提供。這個(gè)理念導(dǎo)致了對IWS 數(shù)據(jù)結(jié)構(gòu)的需要。IWS 數(shù)據(jù)結(jié)構(gòu)IWS 為多個(gè)垂直行業(yè)提供
24、了一個(gè)數(shù)據(jù)倉庫設(shè)計(jì),可以即時(shí)部署到一個(gè)數(shù)據(jù)管理系統(tǒng)。面向行業(yè)的設(shè)計(jì)對減少客戶在數(shù)據(jù)倉庫實(shí)施中所需要的大量的設(shè)計(jì)與編程工作大有幫助。 既然每個(gè)企業(yè)都有自己獨(dú)特的分析數(shù)據(jù)的方法,每個(gè)特定的部署需要一些客戶化的工作以使數(shù)據(jù)庫設(shè)計(jì)適應(yīng)企業(yè)的需求。Sybase IWS 的數(shù)據(jù)結(jié)構(gòu)有幾個(gè)層次組成,如右圖所示,最里邊的3 層作為數(shù)據(jù)結(jié)構(gòu)的部分,外層作為客戶化過程的一部分。完整的數(shù)據(jù)庫設(shè)計(jì)分為幾個(gè)子模型,每個(gè)子模型代表一個(gè)特定的商業(yè)分析領(lǐng)域例如客戶劃分或者銷售分析。 每個(gè)子模型由一系列表和視圖組成,他們一起提供了某個(gè)商業(yè)領(lǐng)域的根本的數(shù)據(jù)存儲需求。任何一個(gè)表可能被用在多個(gè)子模型中。例如客戶表在客戶劃分子模型中使
25、用,也在銷售分析子模型和其他子模型中使用。核心模型是IWS 數(shù)據(jù)結(jié)構(gòu)的中心,由大約70 個(gè)表組成。它包含幾個(gè)可以跨行業(yè)應(yīng)用的子模型(包括它們的表和視圖)。因此,每個(gè)IWS 的垂直行業(yè)部署都將包含通用的核心模型的表、視圖與子模型, 除各行業(yè)特定的專注于該行業(yè)核心事件的子模型。 因此,這個(gè)核心模型提供了跨越多個(gè)行業(yè)的需求的數(shù)據(jù)倉庫的基礎(chǔ)。每個(gè)特定的行業(yè)IWS 有自己的垂直模型,與核心模型高度集成。聚合層包含系統(tǒng)中的各種聚合表。聚合有兩個(gè)主要的用途:性能和處理過時(shí)數(shù)據(jù)。某些層次的面向性能的聚合由IWS 提供,而一些則需要合并到客戶化的過程中。對過時(shí)數(shù)據(jù)的處理需要客戶化以適應(yīng)IWS 客戶的特定需求。反
26、饋數(shù)據(jù)指商業(yè)人員績效分析的結(jié)果的數(shù)據(jù)。外部數(shù)據(jù)來自企業(yè)外部的組織提供的數(shù)據(jù),這類數(shù)據(jù)被存儲在獨(dú)立的一組表中,然后與其他數(shù)據(jù)集成。面向特定工具的表是一些管理工具所要求的,例如一些前端報(bào)表工具,要求數(shù)據(jù)或元數(shù)據(jù)以“客戶化”的格式存儲。這些表起到實(shí)施過程中所選用技術(shù)的外圍工具的功能,并不是IWS 基礎(chǔ)架構(gòu)的部分。IWS 應(yīng)用組件分析型 CRM一個(gè)數(shù)據(jù)倉庫主要的好處之一是使企業(yè)充分認(rèn)識與企業(yè)其客戶的關(guān)系。理解客戶為何保持與企業(yè)聯(lián)系或者為何離開企業(yè)而與競爭對手打交道,這些信息可能深埋在企業(yè)的數(shù)據(jù)庫中,只有通過數(shù)據(jù)倉庫才能獲得。一個(gè)有效的分析型CRM 戰(zhàn)略可以幫助企業(yè)理解他們客戶的需求,從而使企業(yè)的產(chǎn)品適
27、合這些需求。使用分析型CRM 應(yīng)用,企業(yè)可以增加現(xiàn)有客戶的業(yè)務(wù)量,同時(shí)也可以證明企業(yè)通過提供增值產(chǎn)品與服務(wù)帶來新的客戶的能力。IWS 的核心模型提供了一個(gè)滿足全面分析型CRM10應(yīng)用需求的基礎(chǔ):*商業(yè)活動(dòng)管理分析*客戶特征*客戶關(guān)懷(聯(lián)系)分析*客戶忠誠度*銷售分析每個(gè)特定行業(yè)的 IWS 垂直子模型擴(kuò)展了應(yīng)用的能力與范圍,提供行業(yè)特定的商業(yè)績效與利潤分析能力??蛻籼卣鞣治霎?dāng)市場變的更加細(xì)分, 客戶分類正成為市場戰(zhàn)略中越來越重要的因素。 客戶特征化允許企業(yè)將整個(gè)客戶群細(xì)分為許多個(gè)更細(xì)的分類。特征化與客戶分類有助于在一對一的市場上建立真正的客戶關(guān)系。商業(yè)活動(dòng)分析準(zhǔn)確定位商業(yè)活動(dòng)和推廣計(jì)劃的客戶并且
28、分析他們對該活動(dòng)或計(jì)劃的反應(yīng)是將市場行為轉(zhuǎn)為客戶化行為的關(guān)鍵。 大多數(shù)企業(yè)通過不同的媒介對多種不同的產(chǎn)品進(jìn)行多種不同方式的推廣活動(dòng)。這個(gè)應(yīng)用進(jìn)一步提高企業(yè)對整個(gè)過程的理解與認(rèn)識從確定目標(biāo)客戶到分析客戶反應(yīng)。商業(yè)活動(dòng)分析允許你對某客戶群或單個(gè)客戶對各種活動(dòng)的反應(yīng)進(jìn)行評測,對不同媒介的效果進(jìn)行評估并且對活動(dòng)的成本-效益進(jìn)行分析。銷售分析銷售分析應(yīng)用允許從各個(gè)角度對銷售進(jìn)行分析,包括渠道、出口、或企業(yè)單位、產(chǎn)品、產(chǎn)品目錄或產(chǎn)品組, 地區(qū)或季節(jié)。 該應(yīng)用為企業(yè)提供一個(gè)對銷售結(jié)果的綜合觀察并使銷售主管能夠通過銷售數(shù)據(jù)分析潛在的趨勢和模式。忠誠度分析客戶忠誠度對任何企業(yè)的收益都很關(guān)鍵。然而,不幸的是很少有
29、企業(yè)利用工具來理解客戶流失的原因或者以一種結(jié)構(gòu)化的方式來衡量客戶的忠誠度。這個(gè)應(yīng)用正是為改變這種狀況而設(shè)計(jì)。忠誠度分析應(yīng)用允許你從各個(gè)角度衡量客戶忠誠度,包括關(guān)系持續(xù)時(shí)間、購買服務(wù)與產(chǎn)品的范圍以及客戶的人口統(tǒng)計(jì)學(xué)與地理學(xué)特征。就其本身而言,忠誠度分析應(yīng)用衡量客戶忠誠度并促進(jìn)企業(yè)制定計(jì)劃以保持客戶。與整個(gè)IWS 套件中的其他應(yīng)用相結(jié)合,客戶的忠誠度可以通過他們的價(jià)值體現(xiàn)、聯(lián)系歷史、 所屬分類以及影響忠誠度的交易事件進(jìn)行評估。客戶關(guān)懷分析客戶通過各種方式與企業(yè)打交道。他們可能打電話要求產(chǎn)品支持,通過填寫Web 頁面上的表格提出建議或者向銷售部門了解更多信息??蛻絷P(guān)懷分析應(yīng)用對客戶行為以及各部門的客
30、戶處理記錄提供有價(jià)值的深入分析。 客戶滿意度或不滿意度都可以通過客戶與企業(yè)之間的聯(lián)系歷史來確定。分析客戶的聯(lián)系記錄是維持和培育用戶關(guān)系與在未來保持客戶忠誠度的基本的要素。商業(yè)績效分析每個(gè)特定行業(yè)的 IWS 垂直子模型擴(kuò)展了應(yīng)用的能力與范圍,提供行業(yè)特定的商業(yè)績效與利潤分析能力。IWS 商業(yè)績效分析模型與應(yīng)用組件針對每個(gè)垂直行業(yè)并基于各行業(yè)重要的核心事件進(jìn)行設(shè)計(jì)。商業(yè)績效分析應(yīng)用為企業(yè)銷售和市場總監(jiān)以及企業(yè)戰(zhàn)略制定者提供他們所需的商業(yè)智能信息。存儲在 IWS 垂直子模型中的基于各行業(yè)核心事件的詳細(xì)數(shù)據(jù)成為提供該解決方案的動(dòng)力引擎,而且當(dāng)其與IWS 套件中相關(guān)應(yīng)用相結(jié)合,將大大革新企業(yè)管理業(yè)務(wù)與讓
31、客戶滿意的方式。對任何企業(yè)而言,利潤率分析是商業(yè)績效分析的關(guān)鍵。理解利潤率對決定價(jià)格、折扣獎(jiǎng)勵(lì)、資源分11配與發(fā)展戰(zhàn)略至關(guān)重要。然而利潤率是一個(gè)多面性的概念。它必須置于企業(yè)、渠道、產(chǎn)品、產(chǎn)品分類、商標(biāo)、客戶與客戶分類之中來考慮。而且大多數(shù)企業(yè)也希望衡量毛利潤、凈利潤與差額。另外,許多行業(yè)都有行業(yè)通用的獨(dú)特的利潤率衡量方法,通過它跟蹤企業(yè)績效和與競爭對手比較。IWS 商業(yè)績效所針對的行業(yè)包括:零售銀行業(yè)、信用卡、電信、證券、金融、保險(xiǎn)、醫(yī)療、媒體等。IWS 帶來的好處Sybase IWS 是 Sybase 多年來在全球成功部署數(shù)據(jù)倉庫的結(jié)晶。使你可以:* 最小化風(fēng)險(xiǎn)* 減少部署時(shí)間* 降低項(xiàng)目成
32、本* 增加你的投資回報(bào)* 將關(guān)鍵的重要的客戶與市場信息放到商業(yè)用戶手里使用 Sybase IWS,你可以從入門急速前進(jìn),在3 到 6 個(gè)月的短時(shí)間內(nèi),建立并運(yùn)行你的數(shù)據(jù)倉庫。忘掉從零開始。不要擔(dān)心你沒有數(shù)據(jù)倉庫專門知識。Sybase 已經(jīng)提前為你做了這一切,并且把它打包為 IWS 一個(gè)已被驗(yàn)證的成功的數(shù)據(jù)倉庫框架。12WarehouseStudioWarehouseStudio是一個(gè)針對數(shù)據(jù)倉庫應(yīng)用的集成化的解決方案,無論從技術(shù)的深度上,還是從技術(shù)的突破性上看,都是數(shù)據(jù)倉庫領(lǐng)域其他制造商所無法比擬的。WarehouseStudio 解決方案一批在業(yè)界領(lǐng)先的工具,能夠使任何新的或已有的信息提交架
33、構(gòu)立即增值。Warehouse Studio 包括:設(shè)計(jì)組件(Warehouse Architect )、元數(shù)據(jù)管理軟件 (Warehouse Control Center )以及其他一些可選組件。Warehouse Architect-數(shù)據(jù)倉庫設(shè)計(jì)Warehouse Architect 可以使數(shù)據(jù)倉庫設(shè)計(jì)人員(數(shù)據(jù)建模人員和系統(tǒng)設(shè)計(jì)人員)模擬整個(gè)數(shù)據(jù)倉庫系統(tǒng)內(nèi)的各種數(shù)據(jù)資源。數(shù)據(jù)倉庫的設(shè)計(jì),其目的是為數(shù)據(jù)倉庫的實(shí)施提供藍(lán)圖,并從一個(gè)單一的控制點(diǎn)出發(fā)實(shí)現(xiàn)對數(shù)據(jù)倉庫的配置。Warehouse Architect 使用最通用的關(guān)系數(shù)據(jù)庫和多維數(shù)據(jù)庫的設(shè)計(jì)方法建立數(shù)據(jù)倉庫模型,它為設(shè)計(jì)人員建立了一個(gè)
34、非常友好而單一的環(huán)境,能讓數(shù)據(jù)建模人員和系統(tǒng)設(shè)計(jì)人員很方便地處理數(shù)據(jù)倉庫設(shè)計(jì)中特殊的應(yīng)用需求。Warehouse Architect 為數(shù)據(jù)倉庫的設(shè)計(jì)提供了三大類功能,即:多維建模在 Warehouse Architect 環(huán)境中,設(shè)計(jì)人員可以使用針對數(shù)據(jù)倉庫問題的所有常用的設(shè)計(jì)方法, 可以獲得處置數(shù)據(jù)多維特性的功能支持。在這個(gè)環(huán)境中, 可以使用自頂向下的建模方法或者是使用自底向上的建模方法獲得各種設(shè)計(jì)。設(shè)計(jì)向?qū)?Warehouse Architect 所提供的設(shè)計(jì)向?qū)В?可以幫助設(shè)計(jì)人員生成數(shù)據(jù)的多維層系結(jié)構(gòu)、可以為聚合 (aggregation) 、分割 (partition) 、導(dǎo)入 (
35、importing) 處理而優(yōu)化的數(shù)據(jù)結(jié)構(gòu),還可以用逆向工程的方法獲得源數(shù)據(jù)定義。*多維層系。 Warehouse Architect能夠存儲、描述、模型化商業(yè)人員用來分析信息的的多維層系。*聚合與分割。Warehouse Architect包含一個(gè)輔助向?qū)еС謽?biāo)準(zhǔn)的數(shù)據(jù)倉庫設(shè)計(jì)方法如聚合與分割。*導(dǎo)入操作型系統(tǒng)。操作型系統(tǒng)的設(shè)計(jì)可以在Warehouse Architect 中記錄和描述。逆向工程功能支持超過65 種不同的數(shù)據(jù)庫和版本。優(yōu)化代碼的生成Warehouse Architect 能夠生成最流行的目標(biāo)數(shù)據(jù)倉庫和應(yīng)用環(huán)境的目錄信息所需要的代碼,對不同的環(huán)境所生成的代碼自然也不同,包括:最
36、為流行的關(guān)系數(shù)據(jù)庫環(huán)境( Adaptive Server Enterprise, Oracle,Informix, DB2等), 特定的查詢處理引擎(Sybase IQ, Red Brick) , 在線分析處理(OLAP )環(huán)境及特定的查詢環(huán)境。在客戶化之后,Warehouse Architect根據(jù)所選數(shù)據(jù)庫技術(shù)生成建立數(shù)據(jù)庫的DDL文件。除此而外, Warehouse Architect 還提供了一批相當(dāng)通用的設(shè)計(jì)功能,包括: 業(yè)務(wù)規(guī)則的定義與捕獲、可定制的報(bào)告生成、邏輯建模與物理建模、域的定義、子模型復(fù)用、實(shí)體繼承模式、物理特性的定義與規(guī)模估算、可追蹤性映射以及成組模型(team mod
37、el)管理工具。多維建模數(shù)據(jù)倉庫的設(shè)計(jì), 在表現(xiàn)形式上必須滿足最終用戶的分析和決策支持的需要。除了這些用戶需求而外,數(shù)據(jù)倉庫的設(shè)計(jì)還必須考慮到對數(shù)據(jù)倉庫的效率有直接影響的諸多因素,如:目標(biāo)平臺, 包括主流數(shù)據(jù)庫 (例如 Adaptive Server Enterprise ),經(jīng)過優(yōu)化的數(shù)據(jù)庫 ( 如 IQ)及多維環(huán)境(如 PowerDimensions )。13數(shù)據(jù)倉庫應(yīng)用的復(fù)雜程度(如聚合的級別以及變量的數(shù)目)。由數(shù)據(jù)倉庫所處理的數(shù)據(jù)的規(guī)模以及相應(yīng)的加載頻度(如數(shù)據(jù)倉庫的數(shù)據(jù)多長時(shí)間被刷新一次)。物理環(huán)境因素(如所支持的用戶的個(gè)數(shù)以及硬件的配置等)。由于這些因素的存在, 所以選擇適當(dāng)?shù)臄?shù)據(jù)
38、建模方法和設(shè)計(jì)策略, 對于優(yōu)化整個(gè)數(shù)據(jù)倉庫環(huán)境的效率至關(guān)重要。因此,以查詢?yōu)橹鞯亩嗑S建模方法越來越被數(shù)據(jù)倉庫的設(shè)計(jì)者所青睞。多維模型的數(shù)據(jù)結(jié)構(gòu)要以對最終用戶直觀而且習(xí)慣的方式表達(dá)。 設(shè)計(jì)者通常是用多維立方體的形象方式來描述多維模型。多維立方體表達(dá)了在回答信息查詢時(shí)多個(gè)表之間的關(guān)系。立方體的每個(gè)棱對應(yīng)于一個(gè)維,表達(dá)了信息搜索的一個(gè)方向。正如圖 1 所示,這種立方體設(shè)計(jì)方法,使用多個(gè)維將用戶所需要的結(jié)果集很形象地表現(xiàn)出來。這種多維模型能夠?qū)⒚總€(gè)維進(jìn)一步展開細(xì)化,使查詢的粒度完全符合用戶的要求。 Warehouse Architect 使數(shù)據(jù)倉庫的設(shè)計(jì)者能夠利用多種圖形對象進(jìn)行多維分析和建模。這樣的
39、圖形對象包括:度量( metric ):一個(gè)變量,通常為數(shù)值變量,是決策支持研究的重點(diǎn)。例如,“欠款余額”即屬此類。維( dimension):確定對某個(gè)事實(shí)或者某個(gè)度量進(jìn)行考察和分析的角度或方向。例如, “地域”即屬此類。屬性( attribute):附加在某個(gè)維上的列數(shù)據(jù),用于進(jìn)一步限定或描述相應(yīng)的維。例如, “地區(qū)主管的電話號碼”即是屬性之一例。事實(shí)表( fact table):一種既存有度量又存有相應(yīng)維的表。如,一個(gè)記錄會計(jì)帳務(wù)的表即是事實(shí)表。維表( dimension table):一種存有維和與維相聯(lián)系的屬性的表。例如,假定“時(shí)間周期”是我們選定的一個(gè)維,則與之相關(guān)聯(lián)的屬性就可以是
40、“假日” 、“年”、“季度”等等,一個(gè)同時(shí)存有這兩類信息的表就是維表。維層系( dimension hierarchy):一種劃分為具有層系結(jié)構(gòu)的維,用以表達(dá)更細(xì)的信息粒度。這種結(jié)構(gòu)所包含的層數(shù),是信息表達(dá)粒度的一種指征,它反映了對相關(guān)數(shù)據(jù)的表達(dá)可以詳盡到何種程度。例如, “地理位置”維就可以細(xì)分為“國家”維, “大區(qū)”維,“省”維及“城市”維等等。事實(shí)層系( fact hierarchy ):一種經(jīng)聚合或劃分處理而將原本一個(gè)事實(shí)細(xì)分為多個(gè)其他事實(shí),所有這些事實(shí)具有某種層系結(jié)構(gòu)的一類事實(shí)。例如,在信用卡交易中,按地區(qū)計(jì)算的年銷售額就是一個(gè)事實(shí)實(shí)體,該實(shí)體提供了得到信用卡交易情況的聚合路徑。圖
41、1:MegaBank 關(guān)于信用卡交易的多維設(shè)計(jì)14設(shè)計(jì)向?qū)arehouse Architect 所提供的設(shè)計(jì)向?qū)?,可以幫助設(shè)計(jì)人員生成數(shù)據(jù)的多維層系結(jié)構(gòu)、可以為聚合與劃分處理而優(yōu)化數(shù)據(jù)結(jié)構(gòu)、可以用逆向工程的方法獲得源數(shù)據(jù)定義。還可以為不同的目標(biāo)數(shù)據(jù)庫和可視化環(huán)境生成各自的代碼。生成多維層系結(jié)構(gòu)使用 Warehouse Architect 所提供的設(shè)計(jì)工具, 設(shè)計(jì)者可以將數(shù)據(jù)倉庫模型中的實(shí)體, 變換為一種層系結(jié)構(gòu)。利用這種層系結(jié)構(gòu), 可以實(shí)現(xiàn)聚合與劃分處理, 并可以生成前端決策支持工具所需要的數(shù)據(jù)結(jié)構(gòu)。如果現(xiàn)有的數(shù)據(jù)模型是帶有維向的,則Warehouse Architect就可以為設(shè)計(jì)人員自動(dòng)
42、地生成相應(yīng)的層系結(jié)構(gòu)。 在這一過程中, 設(shè)計(jì)者只需簡單地從設(shè)計(jì)向?qū)г趯υ捒蛑刑峁┑囊幌盗羞x項(xiàng)中按自己的需要作出選擇。 Warehouse Architect 將根據(jù)設(shè)計(jì)者的選擇,自動(dòng)地生成相應(yīng)的層系結(jié)構(gòu)。聚合、劃分與數(shù)據(jù)結(jié)構(gòu)的優(yōu)化高效率是所提交的數(shù)據(jù)倉庫真正可用的關(guān)鍵。 Warehouse Architect 通過設(shè)計(jì)向?qū)Ф峁┝艘恍┰跀?shù)據(jù)模型內(nèi)改善效率的方法,其中包括:聚合 產(chǎn)生部分冗余事實(shí)表的一種處理(所產(chǎn)生的事實(shí)稱為聚合事實(shí)) 。在運(yùn)行時(shí),前端決策支持引擎會“重新引導(dǎo)( re-path)”查詢,使之直接針對經(jīng)聚合處理的事實(shí)表。這樣,查詢的效率將得以改善。聚合數(shù)據(jù)也就是匯總性的數(shù)據(jù),通常是
43、在出現(xiàn)需要頻繁訪問的數(shù)據(jù),而且數(shù)據(jù)本身具有層系結(jié)構(gòu)時(shí),為加快查詢需要存放這類數(shù)據(jù)。 聚合能夠優(yōu)化查詢效率, 是因?yàn)椴樵兯阉鞯目臻g是特定維向所限定的匯總事實(shí)表中,相對而言比較小。因此,對事實(shí)和維作聚合處理,可以減少查詢執(zhí)行中所需的計(jì)算的總量。在對數(shù)據(jù)進(jìn)行聚合處理時(shí),通常是沿著經(jīng)常需要查詢的路徑對數(shù)據(jù)作提取,然后再將提取的結(jié)果存入一個(gè)聚合事實(shí)表中。聚合事實(shí)表和原有的事實(shí)表一并構(gòu)成事實(shí)層系。例如,你可以沿“時(shí)間”維和“行業(yè)代碼” (SIC: Standard Industry Code)維生成聚合事實(shí)表。在作了這樣的聚合處理后,若想按“月”和按“行業(yè)”分析市場趨勢,就只需在聚合表和聚合事實(shí)中(而不
44、是在交易的明細(xì)數(shù)據(jù)中)進(jìn)行了。Warehouse Architect 的 Aggregation Wizard是聚合處理的軟件向?qū)В谒囊龑?dǎo)下,針對上述要求而言, 設(shè)計(jì)者所要作的僅僅是: 選擇交易事實(shí)表 (作為基礎(chǔ)數(shù)據(jù)) ,將“時(shí)間” 維設(shè)定為 “月”,將商品維設(shè)定為 “行業(yè)代碼”。整個(gè)聚合過程都由軟件自動(dòng)完成, 聚合的結(jié)果乃是一個(gè)聚合事實(shí)表,它所記錄的是按月按行業(yè)的銷售事實(shí)。劃分 是將事實(shí)分解為更小部分的一種處理。多個(gè)小的事實(shí)表分別存放更基礎(chǔ)性的數(shù)據(jù),但這些小的事實(shí)表是彼此相關(guān)的,其總體構(gòu)成一種層系結(jié)構(gòu)。劃分處理將事實(shí)分解為某種層系,并按照一個(gè)或多個(gè)維分配數(shù)據(jù)。因此,劃分處理同樣可以優(yōu)化查
45、詢的執(zhí)行過程。 當(dāng)需要查詢很明細(xì)的數(shù)據(jù)時(shí), 往往需要先作劃分處理。 這樣作可以避免為得到所需的信息而跨越很多無關(guān)的行。另外,劃分還可以對數(shù)據(jù)倉庫中的數(shù)據(jù)實(shí)施保護(hù)。因?yàn)椋聦?shí)表中某些粒度的信息早已不復(fù)存在,從而能夠限制用戶取得細(xì)節(jié)數(shù)據(jù)的欲望。例如,你可以按地區(qū)分布情況對每個(gè)地區(qū)或者每個(gè)地區(qū)辦公機(jī)構(gòu)生成一組劃分表。有了這樣的劃分,就可以做到使每個(gè)地區(qū)辦公機(jī)構(gòu)只看到本地區(qū)的交易信息, 但看不到其它地區(qū)的交易信息。由于在分析本地區(qū)交易信息時(shí), 不必跨越到其他地區(qū)去, 所以就壓縮了對數(shù)據(jù)的查找范圍, 使分析能夠快速完成。Warehouse Architect 的 Partitioning Wizard是
46、作劃分處理的設(shè)計(jì)向?qū)?。在其引?dǎo)下, 設(shè)計(jì)者可以很簡單地建立一組劃分表:首先,選擇要對其劃分的事實(shí)表,然后,從表中指定劃分原則的一維屬性或多維屬性即可。例如,你可以選擇位置維中的地區(qū)屬性。這樣選擇的具體結(jié)果是:對地區(qū)屬性的每個(gè)值(如,東部地區(qū)交易,中部地區(qū)交易,西部地區(qū)交易)生成一個(gè)對應(yīng)的事實(shí)表。所產(chǎn)15生的劃分表的數(shù)目,取決于對每維屬性所指定的具體值的個(gè)數(shù)。導(dǎo)入源數(shù)據(jù)的定義數(shù)據(jù)倉庫模型可以是新的,也可以是從外部數(shù)據(jù)源得到的。得到這些模型所選用的方法可以是自頂向下的建模方法,或者是自底向上的建模方法。Warehouse Architect 不僅支持這兩種方法各自單用,還支持從這兩種方法中選其優(yōu)者
47、而用之,即更典型的所謂混合建模方法。自頂向下的建模方法.自頂向下的建模方法采用如下的流程完成建模工作,即:從用戶需求得到邏輯數(shù)據(jù)模型, 從邏輯數(shù)據(jù)模型得到物理數(shù)據(jù)模型,從物理數(shù)據(jù)模型得到物理數(shù)據(jù)庫定義。自底向上的建模方法.自底向上的建模方法是從指出當(dāng)前系統(tǒng)所包含的具體數(shù)據(jù)元素出發(fā),運(yùn)用綜合的辦法將這些數(shù)據(jù)元素組合成若干個(gè)維和若干個(gè)結(jié)構(gòu)單元,從這些結(jié)構(gòu)導(dǎo)出物理數(shù)據(jù)模型。Warehouse Architect 的導(dǎo)入向?qū)?,使得?shù)據(jù)倉庫的設(shè)計(jì)者可以選擇一個(gè)或多個(gè)外部的運(yùn)行數(shù)據(jù)庫作為數(shù)據(jù)倉庫模型的來源。導(dǎo)入向?qū)乖O(shè)計(jì)者能夠從這些外部數(shù)據(jù)庫中選擇某些特定的表。該向?qū)ё詣?dòng)地將所導(dǎo)入的每個(gè)表列的數(shù)據(jù)類型轉(zhuǎn)換
48、為目標(biāo)數(shù)據(jù)倉庫數(shù)據(jù)庫中適當(dāng)?shù)臄?shù)據(jù)類型。進(jìn)入目標(biāo)數(shù)據(jù)倉庫的每個(gè)外部表,都帶有它來自哪個(gè)外部數(shù)據(jù)庫的信息。一旦外部信息進(jìn)入WarehouseArchitect 后,你就可以設(shè)計(jì)目標(biāo)數(shù)據(jù)倉庫的多維模型了。Warehouse Architect 會自動(dòng)地展現(xiàn)數(shù)據(jù)倉庫實(shí)體與外部數(shù)據(jù)庫實(shí)體(包括表,列等)之間的對應(yīng)。這種對應(yīng)實(shí)際上是提供了從來源到目標(biāo)的追蹤信息,這類信息都記錄在每個(gè)表的抽取表達(dá)式里(此處的抽取表達(dá)式事實(shí)上就是用以加載數(shù)據(jù)倉庫數(shù)據(jù)庫的SQL 查詢)。Warehouse Architect 能為數(shù)據(jù)倉庫的設(shè)計(jì)者自動(dòng)地生成這些SQL 查詢,并將它們放到某個(gè)外部文件中。這些信息可由某些抽取工具用來
49、在適當(dāng)?shù)臅r(shí)候轉(zhuǎn)移最終用戶的數(shù)據(jù)。優(yōu)化代碼生成當(dāng)你生成新的數(shù)據(jù)倉庫的物理模型時(shí), Warehouse Architect 需要設(shè)計(jì)者選定自己的目標(biāo)數(shù)據(jù)倉庫的數(shù)據(jù)庫平臺。你可以從市場上流行的而且也是技術(shù)上領(lǐng)先的關(guān)系數(shù)據(jù)庫系統(tǒng)中選擇(例如 Sybase 的 Adaptive Server Enterprise ),你也可以從某些專為數(shù)據(jù)倉庫而建的關(guān)系數(shù)據(jù)庫系統(tǒng)中選擇(如 Sybase 的 IQ)。除此而外, 還需要選定功能強(qiáng)大的、用于進(jìn)行在線分析 ( OLAP )的某個(gè)引擎,如 EssBase或者 Cognos 公司的 Impromptu 。這些具體物理環(huán)境的選擇,會對Warehouse Architect的物理數(shù)據(jù)建模界面的效率有所影響。選擇得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 考驗(yàn)商務(wù)英語理解力的試題及答案
- 結(jié)合案例的2025年大學(xué)物理試題答案
- 紡織服裝制造業(yè)智能化生產(chǎn)中的智能化生產(chǎn)設(shè)備租賃政策研究報(bào)告
- 游戲化營銷與品牌忠誠度:2025年傳播效果評估報(bào)告
- 巧妙應(yīng)對土木考試試題及答案
- 制造業(yè):工業(yè)互聯(lián)網(wǎng)在制造業(yè)中的應(yīng)用與挑戰(zhàn)與機(jī)遇分析報(bào)告
- 電商生態(tài)系統(tǒng)構(gòu)建試題及答案
- 職業(yè)技能大學(xué)化學(xué)考試試題及答案
- 武漢工貿(mào)職業(yè)學(xué)院《第二外語日語》2023-2024學(xué)年第一學(xué)期期末試卷
- 教師教育教學(xué)反思與應(yīng)用策略試題及答案
- 新加坡sm214th面經(jīng)44踏水行歌
- 產(chǎn)科輸血-ppt課件
- 國家職業(yè)技能標(biāo)準(zhǔn) (2021年版) 公共營養(yǎng)師
- 森林防火PPT課件
- 多合規(guī)政策及流程變化對照版
- 鋼箱梁的制作及安裝方案
- 工程測量畢業(yè)設(shè)計(jì)畢業(yè)論文
- 艏艉密封裝置安裝工藝規(guī)程
- 一元二次方程四種解法知識點(diǎn)與練習(xí)題(包括十字相乘法)
- 水平四籃球行進(jìn)間運(yùn)球教學(xué)設(shè)計(jì)
- 雨露計(jì)劃職業(yè)教育補(bǔ)助學(xué)籍證明四川
評論
0/150
提交評論