




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第4章
數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)與設(shè)計(jì)方法數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)分布式對象技術(shù)監(jiān)控器的設(shè)計(jì)轉(zhuǎn)換器的設(shè)計(jì)集成器的設(shè)計(jì)元數(shù)據(jù)管理器的設(shè)計(jì)1數(shù)據(jù)倉庫系統(tǒng)的結(jié)構(gòu)最終用戶可視化工具數(shù)據(jù)挖掘工具多維分析工具多維數(shù)據(jù)數(shù)據(jù)倉庫工具層數(shù)據(jù)倉庫層2數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)數(shù)據(jù)倉庫可視化用戶接口OLAP工具查詢/報(bào)表工具數(shù)據(jù)挖掘工具前端開發(fā)工具集成器集成器轉(zhuǎn)換器轉(zhuǎn)換器源數(shù)據(jù)源數(shù)據(jù)元數(shù)據(jù)
及其管理工具
數(shù)據(jù)倉庫體系結(jié)構(gòu)3數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)源數(shù)據(jù):數(shù)據(jù)倉庫中的數(shù)據(jù)來源于多個數(shù)據(jù)源,它不僅可以是企業(yè)內(nèi)部的關(guān)系型數(shù)據(jù)庫,還包括非傳統(tǒng)數(shù)據(jù),如文件、HTML文檔等。數(shù)據(jù)倉庫管理系統(tǒng):元數(shù)據(jù)庫及元數(shù)據(jù)管理部件:元數(shù)據(jù)庫用來存儲由定義部件生成的關(guān)于源數(shù)據(jù)、目標(biāo)數(shù)據(jù)、提取規(guī)則、轉(zhuǎn)換規(guī)則以及源數(shù)據(jù)與數(shù)據(jù)倉庫之間的映射信息等。數(shù)據(jù)轉(zhuǎn)換部件:該部件把數(shù)據(jù)從源數(shù)據(jù)中提取出來,依定義部件的規(guī)則將不同數(shù)據(jù)格式的源數(shù)據(jù)轉(zhuǎn)換成數(shù)據(jù)倉庫的數(shù)據(jù)格式并裝載進(jìn)數(shù)據(jù)倉庫。數(shù)據(jù)集成部件:該部件根據(jù)定義部件的規(guī)則、統(tǒng)一各源數(shù)據(jù)的編碼規(guī)則,并凈化數(shù)據(jù),根據(jù)元數(shù)據(jù)中定義的數(shù)據(jù)組織形式對數(shù)據(jù)進(jìn)行匯總、聚合計(jì)算。數(shù)據(jù)倉庫管理部件:它主要用于維護(hù)數(shù)據(jù)倉庫中的數(shù)據(jù),備份、恢復(fù)數(shù)據(jù)以及管理數(shù)據(jù)的安全權(quán)限問題。 4數(shù)據(jù)倉庫系統(tǒng)的體系結(jié)構(gòu)數(shù)據(jù)倉庫前端工具集查詢/報(bào)表工具:以圖形化方式和報(bào)表方式顯示數(shù)據(jù),幫助了解數(shù)據(jù)的結(jié)構(gòu)、關(guān)系以及動態(tài)性。OLAP工具:通過對信息的多種可能的觀察形式進(jìn)行快速、一致和交互性的存取,便于用戶對數(shù)據(jù)進(jìn)行深入的分析和觀察。數(shù)據(jù)挖掘工具:從大量數(shù)據(jù)中挖掘出具有規(guī)律性的知識,以及數(shù)據(jù)之間的內(nèi)在聯(lián)系。前端開發(fā)工具:提供用戶編程接口,便于在現(xiàn)有系統(tǒng)的基礎(chǔ)上進(jìn)行二次開發(fā),增強(qiáng)系統(tǒng)的伸縮性。數(shù)據(jù)倉庫:在數(shù)據(jù)倉庫系統(tǒng)中,數(shù)據(jù)倉庫是一個數(shù)據(jù)存儲集合,它的存儲形式通常有多維數(shù)據(jù)庫,關(guān)系型數(shù)據(jù)庫及其他存儲方式。5分布式對象技術(shù)隨著Internet的廣泛應(yīng)用,將應(yīng)用擴(kuò)展到局域網(wǎng)、廣域網(wǎng)甚至Internet上已成為用戶的普遍需求,分布式計(jì)算成了新的熱點(diǎn)。分布式計(jì)算系統(tǒng)又稱為中間件。從層次上看,它處于系統(tǒng)的中間層;從功能上看,向下它可以傳遞和處理上層用戶的各種請求,向上它可以屏蔽下層的實(shí)現(xiàn)細(xì)節(jié),提供各種服務(wù)。因此,分布式計(jì)算系統(tǒng)起到了承上啟下的作用,為用戶構(gòu)造分布式應(yīng)用系統(tǒng)提供強(qiáng)有力的支持。6分布式對象概述程序設(shè)計(jì)方法經(jīng)歷了多次變革:從最初的功能分解法,到結(jié)構(gòu)化程序設(shè)計(jì)方法,再到至今仍在廣泛使用的面向?qū)ο蟪绦蛟O(shè)計(jì)方法。在80年代中期,國際標(biāo)準(zhǔn)化組織ISO推出了RPC(RemoteProcessCall,遠(yuǎn)程過程調(diào)用)標(biāo)準(zhǔn),極大地推動了分布式處理技術(shù)的規(guī)范化的標(biāo)準(zhǔn)化。到1992年,開放軟件基金會OSF頒布了DCE(DistributedComputingEnvironment,分布計(jì)算環(huán)境)標(biāo)準(zhǔn)。在這個標(biāo)準(zhǔn)中,它不僅吸收了RPC作為其遠(yuǎn)程調(diào)用的方式,而且對分布處理進(jìn)行了抽象定義,是分布式計(jì)算技術(shù)發(fā)展過程中的一個里程碑。隨著應(yīng)用系統(tǒng)對可擴(kuò)展性和可重用性的要求不斷提高,面向?qū)ο蟮姆治?、設(shè)計(jì)和編程技術(shù)得到了廣泛的應(yīng)用。將面向?qū)ο蟮乃枷霊?yīng)用到分布式環(huán)境中,提出了分布式對象的概念。
7分布式對象的代表性觀點(diǎn)組件對象是軟件的基本量子。它具有一定的功能,可插用,同時又是要維護(hù)的。分布式對象則是分布式環(huán)境中的組件對象,它封裝了設(shè)計(jì)決策,并作為一個獨(dú)立的單元處于分布式環(huán)境中。分布式對象是具有特定功能的,能夠跨越進(jìn)程的邊界、實(shí)現(xiàn)網(wǎng)絡(luò)、語言、應(yīng)用程序、開發(fā)工具和操作系統(tǒng)的”即插即用”的獨(dú)立對象。分布式對象是指任何可被分離出來,具有標(biāo)準(zhǔn)化的,可重用的公開接口的軟件。分布式對象通過接口對外提供服務(wù)。對象與對象之間,對象與客戶之間同時通過接口進(jìn)行交互。因此分布式對象一旦發(fā)布,它只能通過預(yù)定義的接口來提供合理的、一致的服務(wù)。這種接口定義的穩(wěn)定性使客戶應(yīng)用開發(fā)人員能夠構(gòu)造出穩(wěn)定的應(yīng)用。一個分布式對象可以實(shí)現(xiàn)多個接口,同時一個特定的接口也可以被多個分布式對象來實(shí)現(xiàn)。除此之外,分布式對象還提供了對象位置的透明性,也就是說一臺機(jī)器上的應(yīng)用可以透明地訪問其他機(jī)器上的分布式對象。8分布式對象的工業(yè)標(biāo)準(zhǔn)分布式對象的兩種工業(yè)標(biāo)準(zhǔn):COM/DCOM/COM+:Microsoft制定的以Windows為中心的開發(fā)環(huán)境。CORBA(CommonObjectRequestBrokerArchitecture):由700多個廠商共同提倡的,公共對象請求代理體系結(jié)構(gòu),是平臺中立的分布式技術(shù),CORBA能夠執(zhí)行于Windows,UNIX以及Linux等操作系統(tǒng)之中,但是目前成熟產(chǎn)品很少,并且支持的廠商不是十分普及。根據(jù)這兩種分布式技術(shù)演進(jìn)而產(chǎn)生的分布式對象技術(shù):例如EJB(EnterpriseJavaBean)等。9基于分布式對象的程序設(shè)計(jì)方法基于分布式對象的程序設(shè)計(jì)方法繼承并發(fā)展了面向?qū)ο蟪绦蛟O(shè)計(jì)方法。它將對象技術(shù)應(yīng)用于系統(tǒng)設(shè)計(jì),對向?qū)ο蟪绦蛟O(shè)計(jì)的實(shí)現(xiàn)過程作了進(jìn)一步抽象。分布式對象設(shè)計(jì)方法強(qiáng)調(diào)真正的軟件重用和高度的可操作性。它側(cè)重于分布式對象的產(chǎn)生和裝配,這兩方面構(gòu)成了分布式對象程序設(shè)計(jì)的核心。分布式對象的裝配使得軟件產(chǎn)品有可能用類似于“搭積木”的方法快速地建立起來,不僅可以縮短軟件產(chǎn)品的開發(fā)周期,同時也提高了系統(tǒng)的穩(wěn)定性和可靠性??芍赜玫姆植际綄ο髱觳煌趯ο髱?,分布式對象庫保存的是一些經(jīng)過測試的分布式對象。這些分布式對象遵從標(biāo)準(zhǔn)或規(guī)范,并且分布式對象庫也包括這些分布式對象的細(xì)節(jié)功能說明文檔。10基于于可可重重用用的的分分布布式式對對象象庫庫的的軟軟件件開開發(fā)發(fā)模模式式的的過過程程組合過程定制過程檢索過程標(biāo)識過程驗(yàn)證過程分類過程
可重用組件庫
軟件開發(fā)環(huán)境11基于于可可重重用用的的分分布布式式對對象象庫庫的的軟軟件件開開發(fā)發(fā)模模式式的的過過程程標(biāo)識識過過程程::標(biāo)標(biāo)識識一一個個可可重重用用的的分分布布式式對對象象。。驗(yàn)證證過過程程::判判定定可可重重用用分分布布式式對對象象所所聲聲明明的的功功能能特特性性和和性性能能特特性性。。分類類過過程程::對對已已有有分分布布式式對對象象的的功功能能、、使使用用方方法法、、適適用用范范圍圍、、接接口口等等進(jìn)進(jìn)行行說說明明性性的的描描述述,,以以便便日日后后可可以以高高效效準(zhǔn)準(zhǔn)確確地地檢檢索索。。檢索索過過程程::利利用用標(biāo)標(biāo)準(zhǔn)準(zhǔn)的的方方法法根根據(jù)據(jù)指指定定的的屬屬性性找找到到所所需需的的分分布布式式對對象象。。定制制過過程程::通通過過對對檢檢索索到到的的分分布布式式對對象象進(jìn)進(jìn)行行修修改改、、裁裁剪剪和和配配置置使使其其滿滿足足用用戶戶的的需需求求。。組合合過過程程::將將已已定定制制好好的的分分布布式式對對象象集集成成在在一一起起形形成成應(yīng)應(yīng)用用系系統(tǒng)統(tǒng)。。12COMCOM::即即組組件件對對象象模模型型,,是是一一種種以以組組件件為為發(fā)發(fā)布布單單元元的的對對象象模模型型,,這這種種模模型型使使各各軟軟件件可可以以用用一一種種統(tǒng)統(tǒng)一一的的方方式式進(jìn)進(jìn)行行交交互互。。COM既既提提供供了了組組件件之之間間進(jìn)進(jìn)行行交交互互的的規(guī)規(guī)范范,,也也提提供供了了實(shí)實(shí)現(xiàn)現(xiàn)交交互互的的環(huán)環(huán)境境。。因因?yàn)闉榻M組件件對對象象之之間間交交互互的的規(guī)規(guī)范范不不依依賴賴于于任任何何特特定定的的語語言言,,所所以以COM也也是是不不同同語語言言協(xié)協(xié)作作開開發(fā)發(fā)的的一一種種標(biāo)標(biāo)準(zhǔn)準(zhǔn)。。COM的的實(shí)質(zhì)是是這樣一一種協(xié)議議,它負(fù)負(fù)責(zé)將一一個軟件件模塊同同另一個個連接起起來,而而不再參參與其余余的事務(wù)務(wù)。連接接建立后后,兩個個模塊可可以通過過一種稱稱之為““接口””的結(jié)構(gòu)構(gòu)進(jìn)行通通信。接接口是一一組邏輯輯上相關(guān)關(guān)的函數(shù)數(shù)集合,,其函數(shù)數(shù)也被稱稱為接口口成員函函數(shù)。在在同一個個接口中中的函數(shù)數(shù)應(yīng)該提提供類似似或相關(guān)關(guān)的服務(wù)務(wù)。13COM應(yīng)應(yīng)用的組組成部分分COM接接口:通通過接口口的一個個對象暴暴露它能能提供給給COM客戶的的服務(wù)。。每個COM對對象為一一組相關(guān)關(guān)的屬性性和方法法提供了了一個接接口。在在COM中,每每一個接接口都由由一個128位位的全局局唯一標(biāo)標(biāo)識符((GUID,GlobalUniqueIdentifier))來標(biāo)識識??蛻魬敉ㄟ^GUID獲得接接口的指指針,再再通過接接口指針針,客戶戶就可以以調(diào)用其其相應(yīng)的的成員函函數(shù)。接接口是COM對對象提供供服務(wù)的的基本單單元,因因此一個個COM對象可可以同時時提供數(shù)數(shù)個不同同的接口口,并且且在不同同的接口口中提供供不同的的函數(shù)。。COM服服務(wù)器::它是一一個模塊塊,可以以是EXE、DLL或或是OCX,它它們包含含COM對象的的實(shí)現(xiàn)代代碼。一一個COM服務(wù)務(wù)器由一一個或多多個COM對象象組成,,對象在在服務(wù)器器內(nèi)部實(shí)實(shí)現(xiàn)。一一個COM服務(wù)務(wù)器可以以為多個個客戶提提供服務(wù)務(wù),客戶戶也可以以連接到到不同的的服務(wù)器器。一個個COM服務(wù)器器就是一一個向客客戶應(yīng)用用或庫提提供服務(wù)務(wù)的應(yīng)用用或庫((如DLL)。。COM客客戶:通通過接口口向服務(wù)務(wù)器申請請需要的的服務(wù)。??蛻糁佬枰獜姆?wù)務(wù)器獲得得什么,,但是客客戶不知知道服務(wù)務(wù)器內(nèi)部部的細(xì)節(jié)節(jié)。14COM的的特性面向?qū)ο笙蟮奶匦孕院涂蛻魬?服務(wù)務(wù)器的特特性。語言無關(guān)關(guān)性:COM不不依賴于于特定的的語言,,只要能能夠生成成符合COM規(guī)規(guī)范的可可執(zhí)行代代碼即可可,該特特性性為為跨語言言合作開開發(fā)提供供了統(tǒng)一一標(biāo)準(zhǔn)。。進(jìn)程透明明性:在在客戶/服務(wù)器器的軟件件結(jié)構(gòu)中中,運(yùn)行行在客戶戶端的代代碼和運(yùn)運(yùn)行在服服務(wù)器端端的代碼碼既可以以在同一一個進(jìn)程程中,也也可以在在不同的的進(jìn)程中中。COM所提提供的服服務(wù)組件件對象在在實(shí)現(xiàn)時時有兩種種進(jìn)程模模型:進(jìn)進(jìn)程內(nèi)對對象和進(jìn)進(jìn)程外對對象。根根據(jù)進(jìn)程程模型,,COM服務(wù)器器程序可可以分為為:進(jìn)程程內(nèi)服務(wù)務(wù)程序、、本地服服務(wù)程序序和遠(yuǎn)程程服務(wù)程程序。進(jìn)進(jìn)程內(nèi)服服務(wù)程序序被加載載到客戶戶的進(jìn)程程空間,,在Windows環(huán)環(huán)境下通通常以動動態(tài)鏈接接庫(DLL))的形式式實(shí)現(xiàn);;本地服服務(wù)程序序是一個個獨(dú)立的的應(yīng)用程程序,它它與客戶戶程序運(yùn)運(yùn)行在同同一臺機(jī)機(jī)器上,,通常它它是一個個EXE文件;;遠(yuǎn)程服服務(wù)程序序運(yùn)行在在與客戶戶不同的的機(jī)器上上,它既既可以是是一個DLL,,也可以以是一個個EXE文件。。雖然COM對對象有不不同的進(jìn)進(jìn)程模型型,但對對于客戶戶程序來來說是透透明的。??芍赜眯孕裕河捎谟贑OM標(biāo)準(zhǔn)是是建立在在二進(jìn)制制代碼級級的,因因此COM對象象的可重重用性與與一般的的面向?qū)ο笳Z言言的重用用過程不不同。COM的的重用性性可建立立在組件件對象的的行為方方式上,,而不是是具體的的實(shí)現(xiàn)上上,因此此它的可可重用性性不是源源代碼級級的重用用,而是是二進(jìn)制制級的重重用。15DCOMDCOM(DistributeComponentObjectModel,分分布式組組件對象象模型)):是COM的擴(kuò)展展,它可可以支持持不同計(jì)計(jì)算機(jī)上上組件對對象與客客戶程序序之間或或者組件件對象之之間的通通信,這這些計(jì)算算機(jī)可以以在局域域網(wǎng)內(nèi),,也可以以在廣域域網(wǎng)上,,甚至通通過Internet進(jìn)行連連接。對對于客戶戶程序而而言,組組件程序序所處的的位置是是透明的的,不必必編寫任任何處理理遠(yuǎn)程調(diào)調(diào)用的代代碼。DCOM在COM基礎(chǔ)礎(chǔ)上增加加的主要要特征創(chuàng)建遠(yuǎn)程程對象的的能力::客戶只只需調(diào)用用OLE32.dll提供的的庫函數(shù)數(shù)CoCreateInstance透明明地創(chuàng)建建組件,,而不關(guān)關(guān)心組件件的位置置??缇W(wǎng)絡(luò)的的數(shù)據(jù)傳傳送能力力:由于于遠(yuǎn)程對對象和客客戶處于于不同的的地址空空間,它它們之間間的數(shù)據(jù)據(jù)傳送不不但可能能要跨網(wǎng)網(wǎng)絡(luò)進(jìn)行行,還要要處理數(shù)數(shù)據(jù)格式式等一系系列調(diào)整整。當(dāng)客客戶和遠(yuǎn)遠(yuǎn)程對象象進(jìn)行數(shù)數(shù)據(jù)傳送送時,在在客戶端端需對參參數(shù)進(jìn)行行列集,,位于客客戶端的的代理對對象完成成這一任任務(wù),進(jìn)進(jìn)行跨網(wǎng)網(wǎng)絡(luò)的數(shù)數(shù)據(jù)傳送送。安全性和和訪問控控制能力力。16COM+COM+:并不不是COM的新新版本,,而是COM的的新發(fā)展展,它是是COM更高層層次上的的應(yīng)用。。COM+的底層層結(jié)構(gòu)仍仍然以COM為為基礎(chǔ),,它幾乎乎包括了了COM的所有有內(nèi)容。。COM+倡導(dǎo)了了一種新新概念,,把組件件軟件模模型建立立在應(yīng)用用層上,,把所有有組件的的底層細(xì)細(xì)節(jié)留給給操作系系統(tǒng)。COM+不再局局限于COM的的組件技技術(shù),它它更加注注重于基基于分布布式網(wǎng)絡(luò)絡(luò)應(yīng)用的的設(shè)計(jì)與與實(shí)現(xiàn)。。COM+繼承承了COM幾乎乎全部的的優(yōu)勢,,同時又又避免了了COM實(shí)現(xiàn)方方面的一一些不足足。從COM的發(fā)展展角度來來看,COM最最初作為為桌面操操作系統(tǒng)統(tǒng)平臺上上的組件件技術(shù),,主要為為OLE服務(wù)。。但是隨隨著WindowsNT與與DCOM的發(fā)發(fā)布,COM通通過底層層的遠(yuǎn)程程支持組組件技術(shù)術(shù)延伸到到了分布布式應(yīng)用用領(lǐng)域,,充分體體現(xiàn)了COM的的擴(kuò)展能能力以及及結(jié)構(gòu)模模型的優(yōu)優(yōu)勢。MTS為為COM增添了了許多新新的內(nèi)容容,彌補(bǔ)補(bǔ)了COM和DCOM的一些些不足,,它注重重于服務(wù)務(wù)器一端端的組件件管理和和配置環(huán)環(huán)境。COM+進(jìn)一步步把COM、DCOM和MTS統(tǒng)一一起來,,形成真真正適合合于企業(yè)業(yè)應(yīng)用的的技術(shù)。。17分布式組組件對象象的特性性伸縮性::隨著用用戶數(shù)目目的增加加、數(shù)據(jù)據(jù)量的不不斷增多多,分布布式應(yīng)用用系統(tǒng)的的適應(yīng)能能力反映映了系統(tǒng)統(tǒng)的優(yōu)劣劣。使用用COM/DCOM/COM+建立立起來的的應(yīng)用系系統(tǒng)能很很好地適適應(yīng)這種種規(guī)模的的變化,,當(dāng)用戶戶數(shù)比較較少、數(shù)數(shù)據(jù)量不不大時,,系統(tǒng)顯顯得小巧巧而快速速;當(dāng)應(yīng)應(yīng)用規(guī)模模增大時時,系統(tǒng)統(tǒng)也能夠夠正常運(yùn)運(yùn)行并且且在保證證性能的的情況下下不影響響可靠性性。DCOM的的位置透透明性保保證了這這種變化化可以不不必修改改組件源源程序。??膳渲眯孕裕喊惭b裝和管理理是分布布式軟件件系統(tǒng)的的兩個重重要環(huán)節(jié)節(jié)。使用用COM/DCOM/COM+建立立的分布布式軟件件系統(tǒng)可可以很方方便地對對系統(tǒng)進(jìn)進(jìn)行重新新配置,,包括服服務(wù)器的的變化、、客戶程程序的自自動安裝裝等特性性。微軟軟為DCOM提提供了一一個圖形形界面的的配置工工具程序序(DCOMCNFG.EXE),,可使客客戶程序序和組件件程序在在不改變變代碼的的情況下下適應(yīng)不不同的網(wǎng)網(wǎng)絡(luò)環(huán)境境。18分布式組組件對象象的特性性安全性::DCOM使使用了WindowsNT提供的的可擴(kuò)展展安全性性框架,,在非NT平臺臺上實(shí)現(xiàn)現(xiàn)的DCOM也也包括了了一個與與NT兼兼容的安安全提供供器。DCOM實(shí)現(xiàn)的的安全性性分為訪訪問安全全性和激激發(fā)安全全性。訪訪問安全全性指定定哪些用用戶可以以調(diào)用分分布式組組件對象象,激發(fā)發(fā)安全性性指定哪哪些用戶戶可以在在一個新新進(jìn)程中中創(chuàng)建新新的對象象。協(xié)議無關(guān)關(guān)性:在在基于COM/DCOM/COM+的分布布式應(yīng)用用系統(tǒng)中中,并不不要求專專門的網(wǎng)網(wǎng)絡(luò)協(xié)議議,所以以這種分分布式應(yīng)應(yīng)用系統(tǒng)統(tǒng)對網(wǎng)絡(luò)絡(luò)有很強(qiáng)強(qiáng)的適應(yīng)應(yīng)能力。。在Windows平平臺上,,可以使使用以下下一些協(xié)協(xié)議:TCP/IP、、UDP、IPX/SPX以以及NetBIOS。。平臺獨(dú)獨(dú)立性性:COM/DCOM/COM+把把平臺臺二進(jìn)進(jìn)制標(biāo)標(biāo)準(zhǔn)和和平臺臺無關(guān)關(guān)的標(biāo)標(biāo)準(zhǔn)隔隔離開開來,,并且且,由由于DCOM建建立在在DCERPC的的基礎(chǔ)礎(chǔ)上,,所以以DCOM能很很好地地適應(yīng)應(yīng)不同同的系系統(tǒng)平平臺,,目前前已經(jīng)經(jīng)實(shí)現(xiàn)現(xiàn)了DCOM的的操作作系統(tǒng)統(tǒng)有::Windows、、AppleMacintosh以以及Unix的的一些些版本本。19使用COM技術(shù)術(shù)實(shí)現(xiàn)現(xiàn)數(shù)據(jù)據(jù)倉庫庫的組組件數(shù)據(jù)倉倉庫是是針對對支持持整個個企業(yè)業(yè)范圍圍的主主要業(yè)業(yè)務(wù)來來建立立的。。主要要特點(diǎn)點(diǎn)是,,包含含大量量面向向整個個企業(yè)業(yè)的綜綜合信信息及及導(dǎo)出出信息息,所所以系系統(tǒng)本本身處處在一一個分分布式式環(huán)境境中,,且必必須具具有極極好的的擴(kuò)展展性和和靈活活性。。COM/DCOM/COM+技術(shù)術(shù)能適適應(yīng)數(shù)數(shù)據(jù)倉倉庫應(yīng)應(yīng)用的的需要要,能能最大大限度度地提提高靈靈活性性和可可擴(kuò)展展能力力。數(shù)據(jù)倉倉庫的的系統(tǒng)統(tǒng)設(shè)計(jì)計(jì)與開開發(fā)是是一個個動態(tài)態(tài)的反反饋和和循環(huán)環(huán)的過過程。。一方方面數(shù)數(shù)據(jù)倉倉庫的的數(shù)據(jù)據(jù)內(nèi)容容、結(jié)結(jié)構(gòu)、、粒度度、分分割以以及其其他物物理設(shè)設(shè)計(jì)根根據(jù)用用戶所所返回回的信信息不不斷地地調(diào)整整和完完善,,以提提高系系統(tǒng)的的效率率和性性能;;另一一方面面,通通過不不斷地地理解解用戶戶的分分析需需求,,向用用戶提提供更更準(zhǔn)確確、更更有用用的決決策信信息。。將數(shù)數(shù)據(jù)倉倉庫系系統(tǒng)從從功能能上分分為若若干個個獨(dú)立立的對對象,,并使使用COM技術(shù)術(shù)實(shí)現(xiàn)現(xiàn),可可以最最大限限度地地重用用這些些對象象。當(dāng)當(dāng)用戶戶的需需求增增加或或發(fā)生生變化化時,,只需需要增增加相相應(yīng)的的COM對對象或或更新新變化化的COM對象象。20使用COM技術(shù)術(shù)實(shí)現(xiàn)現(xiàn)數(shù)據(jù)據(jù)倉庫庫的組組件通過將將用戶戶業(yè)務(wù)務(wù)邏輯輯以DCOM對對象的的形式式集中中到中中間層層,系系統(tǒng)就就獲得得了對對業(yè)務(wù)務(wù)邏輯輯的獨(dú)獨(dú)立性性。當(dāng)當(dāng)用戶戶需求求改變變時,,開發(fā)發(fā)人員員可以以迅速速地在在應(yīng)用用服務(wù)務(wù)器上上更新新業(yè)務(wù)務(wù)邏輯輯,而而無需需將更更新后后的應(yīng)應(yīng)用遞遞交到到成千千上萬萬的桌桌面系系統(tǒng)上上去,,從而而使開開發(fā)人人員從從維護(hù)護(hù)眾多多客戶戶端的的繁重重工作作中解解脫出出來。。倉庫是是一個個大規(guī)規(guī)模的的工程程項(xiàng)目目,它它開發(fā)發(fā)周期期長,,而數(shù)數(shù)據(jù)倉倉庫的的需求求又是是動態(tài)態(tài)的,,不確確定的的。如如果數(shù)數(shù)據(jù)倉倉庫的的開發(fā)發(fā)周期期過長長,可可能當(dāng)當(dāng)系統(tǒng)統(tǒng)完成成后,,用戶戶的需需求已已經(jīng)發(fā)發(fā)生了了變化化,從從而造造成開開發(fā)資資源的的浪費(fèi)費(fèi);而而且在在當(dāng)今今激烈烈的市市場競競爭中中,誰誰越早早進(jìn)行行決策策,誰誰就在在競爭爭中占占得先先機(jī),,所以以數(shù)據(jù)據(jù)倉庫庫的開開發(fā)周周期越越短,,給企企業(yè)帶帶來的的效益益就越越大。。通過過COM技技術(shù)將將數(shù)據(jù)據(jù)倉庫庫系統(tǒng)統(tǒng)劃分分為不不同的的功能能對象象,可可以使使開發(fā)發(fā)團(tuán)隊(duì)隊(duì)進(jìn)行行并行行開發(fā)發(fā)。開開發(fā)人人員只只需要要定義義各個個COM對對象明明確的的接口口,彼彼此之之間不不需要要了解解各自自的工工作。。21使用COM技術(shù)實(shí)現(xiàn)現(xiàn)數(shù)據(jù)倉庫庫的組件數(shù)據(jù)倉庫的的數(shù)據(jù)是從從企業(yè)內(nèi)部部的各個操操作型環(huán)境境中提取出出來的,所所以數(shù)據(jù)倉倉庫系統(tǒng)本本身就處在在一個分布布式環(huán)境中中。由于在在數(shù)據(jù)倉庫庫中數(shù)據(jù)的的訪問量非非常大,所所以提高系系統(tǒng)性能的的首要目標(biāo)標(biāo)是盡量減減少網(wǎng)絡(luò)上上的數(shù)據(jù)傳傳遞??梢砸詫?shù)據(jù)處處理的各個個組件以DCOM對對象的形式式存放在應(yīng)應(yīng)用服務(wù)器器上,所以以,盡管可可能存在著著與應(yīng)用服服務(wù)器的多多個甚至數(shù)數(shù)百個的連連接,但應(yīng)應(yīng)用服務(wù)器器與數(shù)據(jù)庫庫服務(wù)器之之間的連接接卻只有少少數(shù)幾個,,從而達(dá)到到減少網(wǎng)絡(luò)絡(luò)上的數(shù)據(jù)據(jù)傳送量。。數(shù)據(jù)分析應(yīng)應(yīng)用中的計(jì)計(jì)算、操作作和數(shù)據(jù)過過濾通常是是很復(fù)雜的的。如果在在客戶機(jī)上上完成這些些處理工作作,不僅要要求客戶機(jī)機(jī)必須具有有足夠強(qiáng)大大的配置,,而且對網(wǎng)網(wǎng)絡(luò)負(fù)載能能力也是一一個考驗(yàn)。。通過COM技術(shù)可可以將執(zhí)行行此類處理理工作的對對象放在多多個應(yīng)用服服務(wù)器上,,利用COM+提供供的負(fù)載平平衡服務(wù)來來提高數(shù)據(jù)據(jù)倉庫系統(tǒng)統(tǒng)的可用性性。由于數(shù)據(jù)分分析時,每每次查詢涉涉及到的數(shù)數(shù)據(jù)量巨大大,所以往往往會需要要較長的響響應(yīng)時間,,特別在數(shù)數(shù)據(jù)分布時時響應(yīng)時間間有時會讓讓人難以忍忍受。COM+通過過消息隊(duì)列列組件提供供了異步通通信功能,,使得客戶戶不必等待待。22數(shù)據(jù)倉庫體體系結(jié)構(gòu)的的設(shè)計(jì)與實(shí)實(shí)現(xiàn)設(shè)計(jì)思想::客戶端通過過提交描述述要調(diào)用的的方法和要要傳遞的參參數(shù)的XML文檔進(jìn)進(jìn)行調(diào)用。。在應(yīng)用服服務(wù)器端實(shí)實(shí)現(xiàn)所需服服務(wù)的接口口,當(dāng)通信信組件接收收到XML文檔后,,創(chuàng)建XMLService組件并由由XMLService組件件根據(jù)XML文檔調(diào)調(diào)度服務(wù),,并將返回回結(jié)果或錯錯誤信息封封裝成XML文檔傳傳遞給客戶戶端。將數(shù)據(jù)倉庫庫系統(tǒng)劃分分為若干個個獨(dú)立的分分布式對象象,每個對對象都可以以獨(dú)立地完完成一項(xiàng)工工作如數(shù)據(jù)據(jù)轉(zhuǎn)換、數(shù)數(shù)據(jù)集成等等。這些對對象須使用用開放的標(biāo)標(biāo)準(zhǔn)組件,,它們具有有可重用性性高的特性性。對象與與對象之間間通過XML文檔進(jìn)進(jìn)行通信。。由于采用用開放的XML文檔檔集成數(shù)據(jù)據(jù),所以大大大提高了了系統(tǒng)集成成異構(gòu)數(shù)據(jù)據(jù)源、半結(jié)結(jié)構(gòu)化數(shù)據(jù)據(jù)及非結(jié)構(gòu)構(gòu)化數(shù)據(jù)的的能力。對象與對象象之間既可可以互相協(xié)協(xié)作共同完完成創(chuàng)建數(shù)數(shù)據(jù)倉庫的的任務(wù),又又可以獨(dú)立立地完成某某個特定功功能。這些些分布式對對象和用戶戶前端界面面以及后臺臺數(shù)據(jù)形成成了數(shù)據(jù)倉倉庫的多層層體系結(jié)構(gòu)構(gòu)。23數(shù)據(jù)倉庫系系統(tǒng)體系結(jié)結(jié)構(gòu)的設(shè)計(jì)計(jì)客戶端:可視化的用用戶界面客戶端通信信組件應(yīng)用服務(wù)器器端:服務(wù)器端通通信組件XMLService調(diào)度組組件安全組件元數(shù)據(jù)管理理器轉(zhuǎn)換器集成器數(shù)據(jù)庫服務(wù)務(wù)器端源數(shù)據(jù)元數(shù)據(jù)庫數(shù)據(jù)準(zhǔn)備區(qū)區(qū)數(shù)據(jù)倉庫24數(shù)據(jù)倉庫系系統(tǒng)中的通通信-XML概述述XML(eXtensibleMarkupLanguage,可擴(kuò)擴(kuò)展的標(biāo)記記語言)是是國際組織織W3C制制定的在Web上對對有格式的的數(shù)據(jù)進(jìn)行行描述、傳傳輸、操作作的通用語語言。XML是是一套定義義語義標(biāo)記記的規(guī)則,,這些標(biāo)記記將文檔分分成許多部部件并對這這些部件加加以標(biāo)識。。它也是元元標(biāo)記語言言,即定義義了用于定定義其他與與特定領(lǐng)域域有關(guān)的、、語義的、、結(jié)構(gòu)化的的標(biāo)記語言言的句法語語言。XML定義義了一套元元句法,允允許各種不不同的專業(yè)業(yè)開發(fā)與自自己的特定定領(lǐng)域有關(guān)關(guān)的標(biāo)記語語言。25基于XML的通信運(yùn)運(yùn)行機(jī)制應(yīng)用服務(wù)器器端通信組組件接收到到客戶端傳傳遞來的XML字符符串,創(chuàng)建建XMLService對象象。將XML字字符串以參參數(shù)形式傳傳遞給XMLService對象的調(diào)調(diào)度方法Run(),并調(diào)用用Run方方法;在Run方方法中,解解析XML字符串,,獲得客戶戶端調(diào)用的的方法;檢查用戶的的權(quán)限,如如果沒有調(diào)調(diào)用此方法法的權(quán)限,,返回錯誤誤信息;通過權(quán)限驗(yàn)驗(yàn)證后,打打開存儲在在服務(wù)器端端的FunctionMaps.xml文件,,該文件中中記錄了方方法和對象象的映射關(guān)關(guān)系,根據(jù)據(jù)文件中記記錄的內(nèi)容容獲得實(shí)現(xiàn)現(xiàn)方法的對對象名;根據(jù)獲得的的對象名創(chuàng)創(chuàng)建對象;;每個對象((元數(shù)據(jù)管管理器、轉(zhuǎn)轉(zhuǎn)換器、集集成器)除除了實(shí)現(xiàn)了了用戶所需需要的服務(wù)務(wù)外,還實(shí)實(shí)現(xiàn)了一個個調(diào)度自身身服務(wù)的Run方法法,XMLService調(diào)調(diào)度對象則則通過調(diào)用用這個Run方法來來實(shí)現(xiàn)對對對象服務(wù)的的調(diào)度。26XML通信信組件示意意圖27XML通信信組件客客戶端與服服務(wù)器端的的通信機(jī)制制啟動服務(wù)器器端管理程程序,創(chuàng)建建Application調(diào)調(diào)度對象。。用Application調(diào)調(diào)度對象的的StartNewService方方法創(chuàng)建ServerDispatcher偵偵聽聽對象,并并對客戶端端進(jìn)行偵聽聽。啟動客戶端端應(yīng)用程序序,創(chuàng)建ClientTalker會會話對象。。調(diào)用ClientTalker會話對對象的Connect方法,,請求連接接服務(wù)器。。ServerDispatcher偵偵聽對象接接收到客戶戶端的連接接請求后,,創(chuàng)建ServerTalker對象象并將它與與ClientTalker會話對象象連接。如如果活動的的通信會話話對象數(shù)量量達(dá)到了最最大限制,,新的連接接不能建立立,相關(guān)消消息將被記記錄到日志志文件中。。調(diào)用ServerTalker的Accept方法,然然后等待客客戶端發(fā)送送XML消消息;在收收到客戶端端發(fā)送的XML消息息后,加載載XMLService對象象處理XML消息,,然后將處處理結(jié)果發(fā)發(fā)回客戶端端;如果過過程中有錯錯誤發(fā)生,,錯誤信息息將被記錄錄到日志文文件中,同同時,會話話被認(rèn)為結(jié)結(jié)束;如果果在上一次次數(shù)據(jù)通信信后,在指指定時間范范圍里沒有有通信發(fā)生生,系統(tǒng)認(rèn)認(rèn)為超時,,會話也將將結(jié)束。28元數(shù)數(shù)據(jù)據(jù)管管理理器器客戶戶端端登登錄錄::負(fù)負(fù)責(zé)責(zé)接接收收客客戶戶端端登登錄錄信信息息并并進(jìn)進(jìn)行行用用戶戶權(quán)權(quán)限限檢檢查查元數(shù)數(shù)據(jù)據(jù)管管理理器器的的用用戶戶接接口口::以以接接口口形形式式向向用用戶戶提提供供對對元元數(shù)數(shù)據(jù)據(jù)增增、、刪刪、、改改、、查查的的服服務(wù)務(wù),,包包括括::源源數(shù)數(shù)據(jù)據(jù)信信息息、、數(shù)數(shù)據(jù)據(jù)倉倉庫庫信信息息、、星星型型模模型型信信息息、、維維信信息息、、維維表表字字段段信信息息、、事事實(shí)實(shí)表表字字段段信信息息、、映映射射事事實(shí)實(shí)表表字字段段信信息息、、映映射射維維表表字字段段信信息息、、鏈鏈接接事事實(shí)實(shí)表表與與維維表表字字段段的的信信息息;;元數(shù)數(shù)據(jù)據(jù)的的存存儲儲::元元數(shù)數(shù)據(jù)據(jù)管管理理器器中中的的元元數(shù)數(shù)據(jù)據(jù)存存儲儲程程序序負(fù)負(fù)責(zé)責(zé)接接收收由由接接口口程程序序傳傳遞遞來來的的關(guān)關(guān)于于對對元元數(shù)數(shù)據(jù)據(jù)進(jìn)進(jìn)行行增增加加、、修修改改和和刪刪除除等等信信息息,,并并根根據(jù)據(jù)所所提提供供的的參參數(shù)數(shù)執(zhí)執(zhí)行行存存儲儲過過程程,,將將元元數(shù)數(shù)據(jù)據(jù)的的有有關(guān)關(guān)信信息息保保存存于于服服務(wù)務(wù)器器端端的的元元數(shù)數(shù)據(jù)據(jù)庫庫中中。。29元數(shù)數(shù)據(jù)據(jù)管管理理器器的的設(shè)設(shè)計(jì)計(jì)與與實(shí)實(shí)現(xiàn)現(xiàn)元數(shù)數(shù)據(jù)據(jù)的的作作用用:定定義義數(shù)數(shù)據(jù)據(jù)倉倉庫庫的的作作用用,指指明明數(shù)數(shù)據(jù)據(jù)倉倉庫庫中中信信息息的的內(nèi)內(nèi)容容和和位位置置,刻刻畫畫數(shù)數(shù)據(jù)據(jù)的的抽抽取取和和轉(zhuǎn)轉(zhuǎn)換換規(guī)規(guī)則則,存存儲儲與與數(shù)數(shù)據(jù)據(jù)倉倉庫庫主主題題有有關(guān)關(guān)的的各各種種商商業(yè)業(yè)信信息息。。元數(shù)數(shù)據(jù)據(jù)基基于于MicrosoftSQLServer2000的的關(guān)關(guān)系系模模型型并并存存儲儲在在數(shù)數(shù)據(jù)據(jù)庫庫服服務(wù)務(wù)器器上上,,同同時時通通過過MetaManager組組件件提提供供了了一一系系列列接接口口使使用用戶戶可可以以在在所所有有應(yīng)應(yīng)用用中中共共享享元元數(shù)數(shù)據(jù)據(jù)在客客戶戶端端提提供供圖圖形形化化界界面面工工具具。。例例如如,,用用戶戶想想在在多多維維模模型型中中加加入入一一維維或或者者在在某某一一維維中中加加入入維維元元素素,,不不僅僅可可以以通通過過圖圖形形化化界界面面工工具具完完成成而而且且可可以以在在用用戶戶自自已已編編寫寫的的應(yīng)應(yīng)用用程程序序中中調(diào)調(diào)用用應(yīng)應(yīng)用用程程序序接接口口函函數(shù)數(shù),,修修改改后后的的結(jié)結(jié)果果將將記記入入元元數(shù)數(shù)據(jù)據(jù)庫庫中中。。然然后后系系統(tǒng)統(tǒng)將將根根據(jù)據(jù)元元數(shù)數(shù)據(jù)據(jù)庫庫中中的的新新內(nèi)內(nèi)容容進(jìn)進(jìn)行行數(shù)數(shù)據(jù)據(jù)的的追追加加。。30元數(shù)數(shù)據(jù)據(jù)模模型型關(guān)于于源源數(shù)數(shù)據(jù)據(jù)的的元元數(shù)數(shù)據(jù)據(jù)::它它是是現(xiàn)現(xiàn)有有的的操操作作型型業(yè)業(yè)務(wù)務(wù)系系統(tǒng)統(tǒng)的的數(shù)數(shù)據(jù)據(jù)源源的的描描述述信信息息,,是是對對不不同同平平臺臺上上的的數(shù)數(shù)據(jù)據(jù)源源的的物物理理結(jié)結(jié)構(gòu)構(gòu)和和含含義義的的描描述述。。包包括括::數(shù)數(shù)據(jù)據(jù)源源中中所所有有物物理理數(shù)數(shù)據(jù)據(jù)結(jié)結(jié)構(gòu)構(gòu);;所所有有數(shù)數(shù)據(jù)據(jù)項(xiàng)項(xiàng)的的業(yè)業(yè)務(wù)務(wù)定定義義;;每每個個數(shù)數(shù)據(jù)據(jù)項(xiàng)項(xiàng)更更新新的的頻頻率率,,以以及及由由誰誰或或哪哪個個過過程程更更新新的的說說明明;;每每個個數(shù)數(shù)據(jù)據(jù)項(xiàng)項(xiàng)的的有有效效值值;;其其它它系系統(tǒng)統(tǒng)中中具具有有相相同同業(yè)業(yè)務(wù)務(wù)含含義義的的數(shù)數(shù)據(jù)據(jù)項(xiàng)項(xiàng)的的清清單單。。關(guān)于于數(shù)數(shù)據(jù)據(jù)倉倉庫庫多多維維模模型型的的元元數(shù)數(shù)據(jù)據(jù)標(biāo)準(zhǔn)準(zhǔn)維維::由由一一張張維維表表構(gòu)構(gòu)成成,,標(biāo)標(biāo)準(zhǔn)準(zhǔn)的的星星型型模模型型采采用用這這種種維維和和事事實(shí)實(shí)表表構(gòu)構(gòu)成成的的。。維維表表中中的的一一個個字字段段或或多多個個字字段段構(gòu)構(gòu)成成了了維維的的層層次次。。雪花花維維::由由相相互互關(guān)關(guān)聯(lián)聯(lián)的的多多個個維維表表構(gòu)構(gòu)成成,,每每個個維維表表中中的的字字段段構(gòu)構(gòu)成成了了維維的的層層次次。。通通過過多多個個維維表表的的連連接接最最大大限限度度地地減減少少了了數(shù)數(shù)據(jù)據(jù)存存儲儲量量,,增增加加了了模模型型的的靈靈活活性性,,但但也也使使得得查查詢詢變變得得復(fù)復(fù)雜雜化化。。時間間維維::用用來來描描述述事事實(shí)實(shí)數(shù)數(shù)據(jù)據(jù)的的時時間間屬屬性性。。它它通通常常只只與與源源數(shù)數(shù)據(jù)據(jù)庫庫中中某某個個表表的的日日期期型型字字段段相相對對應(yīng)應(yīng),,所所以以時時間間維維的的層層次次不不可可以以由由維維表表的的字字段段來來表表示示。。時時間間維維的的層層次次由由高高到到低低分分別別為為Year、、Quarter、、Month、、Day、、Hour、、Minute、、Second,,用用戶戶可可以以任任意意選選擇擇幾幾種種構(gòu)構(gòu)成成時時間間維維的的層層次次。。31元數(shù)據(jù)模型關(guān)于數(shù)據(jù)倉庫庫映射的元數(shù)數(shù)據(jù):是數(shù)據(jù)據(jù)源中的數(shù)據(jù)據(jù)與數(shù)據(jù)倉庫庫間數(shù)據(jù)的映映射。當(dāng)數(shù)據(jù)據(jù)源中的一個個數(shù)據(jù)項(xiàng)與數(shù)數(shù)據(jù)倉庫建立立了映射關(guān)系系,就應(yīng)該記記下這些數(shù)據(jù)據(jù)項(xiàng)發(fā)生的任任何變換或變變動,即用元元數(shù)據(jù)反映數(shù)數(shù)據(jù)倉庫中的的數(shù)據(jù)項(xiàng)是從從哪個特定的的數(shù)據(jù)源填充充的,經(jīng)過哪哪些轉(zhuǎn)換、集集成過程。關(guān)于系統(tǒng)安全全的元數(shù)據(jù)::描述了系統(tǒng)統(tǒng)中用戶、權(quán)權(quán)限組及用戶戶權(quán)限信息。。每個用戶可可以屬于多個個權(quán)限組,每每個權(quán)限組都都有一定的權(quán)權(quán)限。這些權(quán)權(quán)限具體表現(xiàn)現(xiàn)為可以執(zhí)行行的元數(shù)據(jù)管管理器、轉(zhuǎn)換換器和集成器器所提供的方方法。32基于COM的的元數(shù)據(jù)管理理器MetaManager的運(yùn)行行機(jī)制用戶程序首先先啟動客戶程程序,客戶程程序連接應(yīng)用用服務(wù)器??蛻舫绦騽?chuàng)建建一個128位的SessionID并將它與與登錄帳號、、口令組成XML字符串串傳遞給應(yīng)用用服務(wù)器,XMLService調(diào)度對象接接收到XML字符串后解解析XML字字符串,創(chuàng)建建登錄對象并并調(diào)用登錄對對象的相關(guān)方方法。登錄對象通過過數(shù)據(jù)庫中的的用戶及口令令確定用戶的的合法身份,,并保存SessionID,返回回登錄成功的的信息??蛻舫绦蚴盏降降卿洺晒Φ牡男畔⒑?,以以XML字符符串形式向應(yīng)應(yīng)用服務(wù)器發(fā)發(fā)送XML命命令數(shù)據(jù)包,,命令數(shù)據(jù)包包前加上包括括SessionID的的請求報(bào)頭。。應(yīng)用服務(wù)器收收到客戶的請請求數(shù)據(jù)包后后將其解析,,獲得SessoinID,并根據(jù)據(jù)SessionID檢檢查用戶的權(quán)權(quán)限。如用戶具有合合法權(quán)限,則則由XMLService調(diào)度對對象創(chuàng)建MetaManager對對象并調(diào)用MetaManger的的Run方法法。MetaManager的Run方方法根據(jù)客戶戶傳遞的XML數(shù)據(jù)包調(diào)調(diào)用相關(guān)的方方法。返加的的結(jié)果打成XML數(shù)據(jù)包包并通過通信信組件返回給給客戶程序。。33轉(zhuǎn)換器的設(shè)計(jì)計(jì)與實(shí)現(xiàn)轉(zhuǎn)換器的功能能:數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換換和數(shù)據(jù)類型型轉(zhuǎn)換結(jié)構(gòu)化數(shù)據(jù)的的轉(zhuǎn)換:關(guān)關(guān)系對應(yīng)于對對象類,元元組對應(yīng)于對對象實(shí)例,關(guān)關(guān)系屬性對對應(yīng)于對象的的屬性值非結(jié)構(gòu)化數(shù)據(jù)據(jù)的轉(zhuǎn)換:利利用對象的的封裝性實(shí)現(xiàn)現(xiàn)對非結(jié)構(gòu)化化數(shù)據(jù)的處理理自動化或半自自動化的轉(zhuǎn)換換器生成技術(shù)術(shù):采用互操作性性標(biāo)準(zhǔn),定定義數(shù)據(jù)源與與翻譯器的接接口從數(shù)據(jù)源中提提取數(shù)據(jù)并轉(zhuǎn)轉(zhuǎn)換格式的過過程:先將各類數(shù)據(jù)據(jù)庫系統(tǒng)中不不同格式的數(shù)數(shù)據(jù)轉(zhuǎn)換成文文本文件,然然后再利用批批拷貝命令將將數(shù)據(jù)導(dǎo)入目目標(biāo)系統(tǒng)中。。以使數(shù)據(jù)倉倉庫獲得新的的數(shù)據(jù)提供決決策分析使用用。34轉(zhuǎn)換器的設(shè)計(jì)計(jì)與實(shí)現(xiàn)數(shù)據(jù)準(zhǔn)備區(qū)的的使用:首先先從源數(shù)據(jù)中中提取數(shù)據(jù),,轉(zhuǎn)換成數(shù)據(jù)據(jù)倉庫所要求求的格式后存存儲在數(shù)據(jù)倉倉庫的一個稱稱為數(shù)據(jù)準(zhǔn)備備區(qū)的緩沖區(qū)區(qū)中。在該區(qū)區(qū)域中,可以以暫時存儲原原始數(shù)據(jù),然然后由集成器器對數(shù)據(jù)進(jìn)行行清理、集成成后再裝載到到數(shù)據(jù)倉庫中中。由于使用用獨(dú)立于數(shù)據(jù)據(jù)源的數(shù)據(jù)準(zhǔn)準(zhǔn)備區(qū)為數(shù)據(jù)據(jù)倉庫準(zhǔn)備數(shù)數(shù)據(jù)可提高管管理數(shù)據(jù)倉庫庫的效率,另另外將數(shù)據(jù)準(zhǔn)準(zhǔn)備區(qū)與數(shù)據(jù)據(jù)倉庫數(shù)據(jù)隔隔離開,可以以保護(hù)數(shù)據(jù)倉倉庫的完整性性同時可以提提高數(shù)據(jù)倉庫庫的性能。在在將數(shù)據(jù)從源源數(shù)據(jù)提取到到數(shù)據(jù)準(zhǔn)備區(qū)區(qū)的過程中,,可借助于Microsoft的數(shù)數(shù)據(jù)轉(zhuǎn)換服務(wù)務(wù)(DTS))包來實(shí)現(xiàn)。。35源數(shù)據(jù)庫、數(shù)數(shù)據(jù)準(zhǔn)備區(qū)和和數(shù)據(jù)倉庫庫之間的關(guān)系系源數(shù)據(jù)數(shù)據(jù)準(zhǔn)備區(qū)數(shù)據(jù)倉庫DTS三者關(guān)系圖36DTS概述DTS:是MicrosoftSQLServer2000中提提供的數(shù)據(jù)轉(zhuǎn)轉(zhuǎn)換服務(wù)(DataTransformationServices)。DTS是一個個組件對象,,它提供一個個組件的完整整集。這些組組件可在任何何具有OLEDB、ODBC接口口的數(shù)據(jù)庫或或規(guī)格化的文文本文件間導(dǎo)導(dǎo)入、導(dǎo)出和和轉(zhuǎn)換數(shù)據(jù)。。包(Package)::導(dǎo)入、導(dǎo)出出數(shù)據(jù)的過程程定義并保存存在包中。37轉(zhuǎn)換器的實(shí)現(xiàn)現(xiàn)-轉(zhuǎn)換器的流程程圖創(chuàng)建數(shù)據(jù)準(zhǔn)備備區(qū)N開始讀元數(shù)據(jù)檢查數(shù)據(jù)準(zhǔn)備備區(qū)?執(zhí)行DTS包包更改元數(shù)據(jù)((時間,數(shù)據(jù)據(jù)狀態(tài))結(jié)束成功連接元數(shù)據(jù)庫庫創(chuàng)建DTS包包Y38選擇源數(shù)據(jù)的的窗體39數(shù)據(jù)轉(zhuǎn)換在窗體上方的的下拉列表中中選擇了數(shù)據(jù)據(jù)源類型后,,針對不同的的數(shù)據(jù)源類型型在窗體中會會顯示不同的的界面,讓用用戶輸入連接接各種數(shù)據(jù)源源的連接字符符串信息(用用戶名、密碼碼、數(shù)據(jù)庫等等)。由于DTS借助OLEDB來存取不同同數(shù)據(jù)源的數(shù)數(shù)據(jù),所以本本系統(tǒng)中可選選擇的數(shù)據(jù)源源類型包括OLEDB支持的各種種異質(zhì)數(shù)據(jù)源源。在窗體中中單擊下一步步按鈕后,將將顯示數(shù)據(jù)庫庫中各對象信信息讓用戶選選擇需要導(dǎo)入入數(shù)據(jù)準(zhǔn)備區(qū)區(qū)的數(shù)據(jù)對象象,然后創(chuàng)建建并調(diào)用Microsoft的DTS對象,,完成數(shù)據(jù)轉(zhuǎn)轉(zhuǎn)換工作。40調(diào)用DTS的過過程創(chuàng)建DTS包,,并初初始化化參數(shù)數(shù)。向DTS的的連接接集合合中添添加源源數(shù)據(jù)據(jù)連接接。檢查數(shù)數(shù)據(jù)準(zhǔn)準(zhǔn)備區(qū)區(qū)是否否存在在,如如不存存在首首先創(chuàng)創(chuàng)建數(shù)數(shù)據(jù)準(zhǔn)準(zhǔn)備區(qū)區(qū),如如果數(shù)數(shù)據(jù)準(zhǔn)準(zhǔn)備區(qū)區(qū)已存存在則則直接接向DTS的連連接集集合中中添加加目標(biāo)標(biāo)數(shù)據(jù)據(jù)源連連接。。讀取相相關(guān)元元數(shù)據(jù)據(jù)信息息,如如需要要轉(zhuǎn)換換的表表及字字段的的相關(guān)關(guān)信息息等。。根據(jù)元元數(shù)據(jù)據(jù)信息息,創(chuàng)創(chuàng)建任任務(wù)對對象并并加入入任務(wù)務(wù)集合合。創(chuàng)建步步驟對對象,,并將將任務(wù)務(wù)對象象加入入步驟驟對象象。如果有有多個個任務(wù)務(wù),則則繼續(xù)續(xù)創(chuàng)建建其他他任務(wù)務(wù)對象象,并并指定定所屬屬步驟驟對象象。執(zhí)行DTS包。。41集成器器的設(shè)設(shè)計(jì)與與實(shí)現(xiàn)現(xiàn)-集成器器的功功能轉(zhuǎn)換各各種異異質(zhì)數(shù)數(shù)據(jù)源源的格格式。。判定一一個記記錄是是否可可進(jìn)行行抽取取處理理。數(shù)據(jù)重重新格格式化化。數(shù)據(jù)清清理。。從多個個輸入入數(shù)據(jù)據(jù)源中中選取取數(shù)據(jù)據(jù)。多個輸輸入文文件重重新排排序。。產(chǎn)生不不同概概括層層次上上的輸輸出結(jié)結(jié)果。。提供缺缺省值值。區(qū)分需需要抽抽取的的和不不需要要抽取取的操操作型型數(shù)據(jù)據(jù)。進(jìn)行數(shù)數(shù)據(jù)的的匯總總。對數(shù)據(jù)據(jù)元素素的重重命名名進(jìn)行行跟蹤蹤。不常見見的或或不標(biāo)標(biāo)準(zhǔn)的的格式式處理理。指定轉(zhuǎn)轉(zhuǎn)換邏邏輯和和轉(zhuǎn)換換機(jī)制制。理解并并解開開建立立在舊舊的傳傳統(tǒng)程程序邏邏輯中中的數(shù)數(shù)據(jù)之之間的的關(guān)系系。大容量量數(shù)據(jù)據(jù)的輸輸入/輸出出(如如并行行裝載載和并并行讀讀出))。必須符符合企企業(yè)數(shù)數(shù)據(jù)模模型。。42集成器器的設(shè)設(shè)計(jì)與與實(shí)現(xiàn)現(xiàn)集成模模型::根據(jù)據(jù)元數(shù)數(shù)據(jù)中中記錄錄的映映射關(guān)關(guān)系在在星形形模型型的基基礎(chǔ)上上以向向?qū)У牡男问绞教峁┕┘沙赡P托偷目涂蛻舳硕斯ぞ呔?。?chuàng)建數(shù)數(shù)據(jù)倉倉庫后后,在在元數(shù)數(shù)據(jù)中中記錄錄數(shù)據(jù)據(jù)倉庫庫的基基本信信息,,同時時創(chuàng)建建一個個同名名的關(guān)關(guān)系型型數(shù)據(jù)據(jù)庫。。用戶戶可以以在窗窗體中中的數(shù)數(shù)據(jù)類類型下下拉列列表中中選擇擇數(shù)據(jù)據(jù)倉庫庫的數(shù)數(shù)據(jù)類類型,,由于于數(shù)據(jù)據(jù)倉庫庫是一一個海海量數(shù)數(shù)據(jù)的的存儲儲集合合,所所以選選擇的的數(shù)據(jù)據(jù)庫管管理系系統(tǒng)必必須具具有并并行處處理能能力及及可伸伸縮性性。創(chuàng)建了了物理理數(shù)據(jù)據(jù)庫后后,開開始創(chuàng)創(chuàng)建數(shù)數(shù)據(jù)倉倉庫模模型,,并裝裝載數(shù)數(shù)據(jù)。。首先先創(chuàng)建建星型型模型型中的的事實(shí)實(shí)表。。在樹型型結(jié)構(gòu)構(gòu)中列列出當(dāng)當(dāng)前元元數(shù)據(jù)據(jù)庫中中描述述的源源數(shù)據(jù)據(jù)庫以以及庫庫中的的表對對象,,用戶戶可以以選擇擇其中中一個個表作作為事事實(shí)表表;同同時窗窗體的的右邊邊以列列表形形式顯顯示了了所選選擇表表的字字段信信息。。單擊擊下一一步后后,用用戶可可以在在窗體體中選選擇度度量字字段,,并選選擇要要保留留的字字段。。將用用戶的的信息息記錄錄在元元數(shù)據(jù)據(jù)庫中中,并并根據(jù)據(jù)該信信息創(chuàng)創(chuàng)建事事實(shí)表表。43集成器器的設(shè)設(shè)計(jì)與與實(shí)現(xiàn)現(xiàn)事實(shí)表表創(chuàng)建建后,,則開開始創(chuàng)創(chuàng)建星星型模模型的的維。。在前前面的的章節(jié)節(jié)中我我們討討論了了星型型模型型的維維分為為:標(biāo)標(biāo)準(zhǔn)維維、雪雪花維維和時時間維維。完成上上述的的步驟驟后,,已成成功創(chuàng)創(chuàng)建了了一個個星形形模型型,然然后再再調(diào)用用元數(shù)數(shù)據(jù)管管理器器的相相關(guān)方方法更更新元元數(shù)據(jù)據(jù)庫中中的數(shù)數(shù)據(jù)。。數(shù)據(jù)凈凈化::當(dāng)數(shù)數(shù)據(jù)從從源數(shù)數(shù)據(jù)庫庫中提提取到到數(shù)據(jù)據(jù)準(zhǔn)備備區(qū)后后,必必須先先進(jìn)行行數(shù)據(jù)據(jù)凈化化才可可以裝裝載到到數(shù)據(jù)據(jù)倉庫庫中去去。數(shù)數(shù)據(jù)凈凈化主主要指指對數(shù)數(shù)據(jù)字字段的的有效效值檢檢驗(yàn)。。有效效值的的檢驗(yàn)驗(yàn)通常常包括括:范范圍檢檢驗(yàn)、、枚舉舉字段段取值值和相相關(guān)檢檢驗(yàn)。。范圍圍檢驗(yàn)驗(yàn)要求求數(shù)據(jù)據(jù)保證證落在在預(yù)期期的范范圍之之內(nèi),,通常常對數(shù)數(shù)據(jù)范范圍和和日期期范圍圍進(jìn)行行檢驗(yàn)驗(yàn),如如對任任何在在指定定范圍圍之外外的日日期的的發(fā)票票都應(yīng)應(yīng)刪除除。枚枚舉字字段取取值指指對一一個記記錄在在該字字段的的取值值,若若不在在指定定的值值中,,則應(yīng)應(yīng)該刪刪除。。相關(guān)關(guān)檢驗(yàn)驗(yàn)要求求將一一個字字段中中的值值與另另外一一個字字段中中的值值進(jìn)行行相關(guān)關(guān)檢驗(yàn)驗(yàn),即即在數(shù)數(shù)據(jù)庫庫中某某個字字段應(yīng)應(yīng)與另另一個個字段段形成成外鍵鍵約束束。44集成器器的設(shè)設(shè)計(jì)與與實(shí)現(xiàn)現(xiàn)維表與與事實(shí)實(shí)表的的引用用完整整性檢檢驗(yàn)::數(shù)據(jù)據(jù)倉庫庫的星星型模模型中中一般般都有有多個個維,,而在在查詢詢數(shù)據(jù)據(jù)時維維表和和事實(shí)實(shí)表之之間大大多采采用內(nèi)內(nèi)聯(lián)接接。當(dāng)當(dāng)維表表和事事實(shí)數(shù)數(shù)據(jù)表表之間間的引引用完完整性性破壞壞時,,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞動合同范本 工傷
- 代理鉆床銷售企業(yè)合同范本
- 京東商城合同范本
- 人事中介合同范本
- 保險(xiǎn)合作合同范本
- 前公司勞務(wù)合同范本
- 募資合同范本
- 2024年普洱市瀾滄縣縣第二人民醫(yī)院招聘考試真題
- 2024年宿遷市人大常委會辦公室招聘筆試真題
- 2024年欽州市第二人民醫(yī)院信息工程師招聘筆試真題
- (完整)PEP人教版小學(xué)生英語單詞四年級上冊卡片(可直接打印)
- 面神經(jīng)疾病課件
- 基本公共衛(wèi)生服務(wù)項(xiàng)目績效考核的課件
- 三年級下冊小學(xué)科學(xué)活動手冊答案
- 國家電網(wǎng)有限公司十八項(xiàng)電網(wǎng)重大反事故措施(修訂版)
- 班、團(tuán)、隊(duì)一體化建設(shè)實(shí)施方案
- 最全的人教初中數(shù)學(xué)常用概念、公式和定理
- 橋面結(jié)構(gòu)現(xiàn)澆部分施工方案
- 開網(wǎng)店全部流程PPT課件
- 人教部編版四年級語文下冊《第1課 古詩詞三首》教學(xué)課件PPT小學(xué)優(yōu)秀公開課
- 模具數(shù)控加工技術(shù)概述
評論
0/150
提交評論