版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第4章
數(shù)據(jù)倉庫系統(tǒng)的體系結構與設計方法數(shù)據(jù)倉庫系統(tǒng)的體系結構分布式對象技術監(jiān)控器的設計轉換器的設計集成器的設計元數(shù)據(jù)管理器的設計1數(shù)據(jù)倉庫系統(tǒng)的結構最終用戶可視化工具數(shù)據(jù)挖掘工具多維分析工具多維數(shù)據(jù)數(shù)據(jù)倉庫工具層數(shù)據(jù)倉庫層2數(shù)據(jù)倉庫系統(tǒng)的體系結構數(shù)據(jù)倉庫可視化用戶接口OLAP工具查詢/報表工具數(shù)據(jù)挖掘工具前端開發(fā)工具集成器集成器轉換器轉換器源數(shù)據(jù)源數(shù)據(jù)元數(shù)據(jù)
及其管理工具
數(shù)據(jù)倉庫體系結構3數(shù)據(jù)倉庫系統(tǒng)的體系結構源數(shù)據(jù):數(shù)據(jù)倉庫中的數(shù)據(jù)來源于多個數(shù)據(jù)源,它不僅可以是企業(yè)內(nèi)部的關系型數(shù)據(jù)庫,還包括非傳統(tǒng)數(shù)據(jù),如文件、HTML文檔等。數(shù)據(jù)倉庫管理系統(tǒng):元數(shù)據(jù)庫及元數(shù)據(jù)管理部件:元數(shù)據(jù)庫用來存儲由定義部件生成的關于源數(shù)據(jù)、目標數(shù)據(jù)、提取規(guī)則、轉換規(guī)則以及源數(shù)據(jù)與數(shù)據(jù)倉庫之間的映射信息等。數(shù)據(jù)轉換部件:該部件把數(shù)據(jù)從源數(shù)據(jù)中提取出來,依定義部件的規(guī)則將不同數(shù)據(jù)格式的源數(shù)據(jù)轉換成數(shù)據(jù)倉庫的數(shù)據(jù)格式并裝載進數(shù)據(jù)倉庫。數(shù)據(jù)集成部件:該部件根據(jù)定義部件的規(guī)則、統(tǒng)一各源數(shù)據(jù)的編碼規(guī)則,并凈化數(shù)據(jù),根據(jù)元數(shù)據(jù)中定義的數(shù)據(jù)組織形式對數(shù)據(jù)進行匯總、聚合計算。數(shù)據(jù)倉庫管理部件:它主要用于維護數(shù)據(jù)倉庫中的數(shù)據(jù),備份、恢復數(shù)據(jù)以及管理數(shù)據(jù)的安全權限問題。 4數(shù)據(jù)倉庫系統(tǒng)的體系結構數(shù)據(jù)倉庫前端工具集查詢/報表工具:以圖形化方式和報表方式顯示數(shù)據(jù),幫助了解數(shù)據(jù)的結構、關系以及動態(tài)性。OLAP工具:通過對信息的多種可能的觀察形式進行快速、一致和交互性的存取,便于用戶對數(shù)據(jù)進行深入的分析和觀察。數(shù)據(jù)挖掘工具:從大量數(shù)據(jù)中挖掘出具有規(guī)律性的知識,以及數(shù)據(jù)之間的內(nèi)在聯(lián)系。前端開發(fā)工具:提供用戶編程接口,便于在現(xiàn)有系統(tǒng)的基礎上進行二次開發(fā),增強系統(tǒng)的伸縮性。數(shù)據(jù)倉庫:在數(shù)據(jù)倉庫系統(tǒng)中,數(shù)據(jù)倉庫是一個數(shù)據(jù)存儲集合,它的存儲形式通常有多維數(shù)據(jù)庫,關系型數(shù)據(jù)庫及其他存儲方式。5分布式對象技術隨著Internet的廣泛應用,將應用擴展到局域網(wǎng)、廣域網(wǎng)甚至Internet上已成為用戶的普遍需求,分布式計算成了新的熱點。分布式計算系統(tǒng)又稱為中間件。從層次上看,它處于系統(tǒng)的中間層;從功能上看,向下它可以傳遞和處理上層用戶的各種請求,向上它可以屏蔽下層的實現(xiàn)細節(jié),提供各種服務。因此,分布式計算系統(tǒng)起到了承上啟下的作用,為用戶構造分布式應用系統(tǒng)提供強有力的支持。6分布式對象概述程序設計方法經(jīng)歷了多次變革:從最初的功能分解法,到結構化程序設計方法,再到至今仍在廣泛使用的面向對象程序設計方法。在80年代中期,國際標準化組織ISO推出了RPC(RemoteProcessCall,遠程過程調(diào)用)標準,極大地推動了分布式處理技術的規(guī)范化的標準化。到1992年,開放軟件基金會OSF頒布了DCE(DistributedComputingEnvironment,分布計算環(huán)境)標準。在這個標準中,它不僅吸收了RPC作為其遠程調(diào)用的方式,而且對分布處理進行了抽象定義,是分布式計算技術發(fā)展過程中的一個里程碑。隨著應用系統(tǒng)對可擴展性和可重用性的要求不斷提高,面向對象的分析、設計和編程技術得到了廣泛的應用。將面向對象的思想應用到分布式環(huán)境中,提出了分布式對象的概念。
7分布式對象的代表性觀點組件對象是軟件的基本量子。它具有一定的功能,可插用,同時又是要維護的。分布式對象則是分布式環(huán)境中的組件對象,它封裝了設計決策,并作為一個獨立的單元處于分布式環(huán)境中。分布式對象是具有特定功能的,能夠跨越進程的邊界、實現(xiàn)網(wǎng)絡、語言、應用程序、開發(fā)工具和操作系統(tǒng)的”即插即用”的獨立對象。分布式對象是指任何可被分離出來,具有標準化的,可重用的公開接口的軟件。分布式對象通過接口對外提供服務。對象與對象之間,對象與客戶之間同時通過接口進行交互。因此分布式對象一旦發(fā)布,它只能通過預定義的接口來提供合理的、一致的服務。這種接口定義的穩(wěn)定性使客戶應用開發(fā)人員能夠構造出穩(wěn)定的應用。一個分布式對象可以實現(xiàn)多個接口,同時一個特定的接口也可以被多個分布式對象來實現(xiàn)。除此之外,分布式對象還提供了對象位置的透明性,也就是說一臺機器上的應用可以透明地訪問其他機器上的分布式對象。8分布式對象的工業(yè)標準分布式對象的兩種工業(yè)標準:COM/DCOM/COM+:Microsoft制定的以Windows為中心的開發(fā)環(huán)境。CORBA(CommonObjectRequestBrokerArchitecture):由700多個廠商共同提倡的,公共對象請求代理體系結構,是平臺中立的分布式技術,CORBA能夠執(zhí)行于Windows,UNIX以及Linux等操作系統(tǒng)之中,但是目前成熟產(chǎn)品很少,并且支持的廠商不是十分普及。根據(jù)這兩種分布式技術演進而產(chǎn)生的分布式對象技術:例如EJB(EnterpriseJavaBean)等。9基于分布式對象的程序設計方法基于分布式對象的程序設計方法繼承并發(fā)展了面向對象程序設計方法。它將對象技術應用于系統(tǒng)設計,對向對象程序設計的實現(xiàn)過程作了進一步抽象。分布式對象設計方法強調(diào)真正的軟件重用和高度的可操作性。它側重于分布式對象的產(chǎn)生和裝配,這兩方面構成了分布式對象程序設計的核心。分布式對象的裝配使得軟件產(chǎn)品有可能用類似于“搭積木”的方法快速地建立起來,不僅可以縮短軟件產(chǎn)品的開發(fā)周期,同時也提高了系統(tǒng)的穩(wěn)定性和可靠性??芍赜玫姆植际綄ο髱觳煌趯ο髱欤植际綄ο髱毂4娴氖且恍┙?jīng)過測試的分布式對象。這些分布式對象遵從標準或規(guī)范,并且分布式對象庫也包括這些分布式對象的細節(jié)功能說明文檔。10基于可可重用用的分分布式式對象象庫的的軟件件開發(fā)發(fā)模式式的過過程組合過程定制過程檢索過程標識過程驗證過程分類過程
可重用組件庫
軟件開發(fā)環(huán)境11基于可可重用用的分分布式式對象象庫的的軟件件開發(fā)發(fā)模式式的過過程標識過過程::標識識一個個可重重用的的分布布式對對象。。驗證過過程::判定定可重重用分分布式式對象象所聲聲明的的功能能特性性和性性能特特性。。分類過過程::對已已有分分布式式對象象的功功能、、使用用方法法、適適用范范圍、、接口口等進進行說說明性性的描描述,,以便便日后后可以以高效效準確確地檢檢索。。檢索過過程::利用用標準準的方方法根根據(jù)指指定的的屬性性找到到所需需的分分布式式對象象。定制過過程::通過過對檢檢索到到的分分布式式對象象進行行修改改、裁裁剪和和配置置使其其滿足足用戶戶的需需求。。組合過過程::將已已定制制好的的分布布式對對象集集成在在一起起形成成應用用系統(tǒng)統(tǒng)。12COMCOM:即即組件件對象象模型型,是是一種種以組組件為為發(fā)布布單元元的對對象模模型,,這種種模型型使各各軟件件可以以用一一種統(tǒng)統(tǒng)一的的方式式進行行交互互。COM既提提供了了組件件之間間進行行交互互的規(guī)規(guī)范,,也提提供了了實現(xiàn)現(xiàn)交互互的環(huán)環(huán)境。。因為為組件件對象象之間間交互互的規(guī)規(guī)范不不依賴賴于任任何特特定的的語言言,所所以COM也是是不同同語言言協(xié)作作開發(fā)發(fā)的一一種標標準。。COM的實實質(zhì)是是這樣樣一種種協(xié)議議,它它負責責將一一個軟軟件模模塊同同另一一個連連接起起來,,而不不再參參與其其余的的事務務。連連接建建立后后,兩兩個模模塊可可以通通過一一種稱稱之為為“接接口””的結結構進進行通通信。。接口口是一一組邏邏輯上上相關關的函函數(shù)集集合,,其函函數(shù)也也被稱稱為接接口成成員函函數(shù)。。在同同一個個接口口中的的函數(shù)數(shù)應該該提供供類似似或相相關的的服務務。13COM應用用的組成部部分COM接口口:通過接接口的一個個對象暴露露它能提供供給COM客戶的服服務。每個個COM對對象為一組組相關的屬屬性和方法法提供了一一個接口。。在COM中,每一一個接口都都由一個128位的的全局唯一一標識符((GUID,GlobalUniqueIdentifier)來標標識??蛻魬敉ㄟ^GUID獲得得接口的指指針,再通通過接口指指針,客戶戶就可以調(diào)調(diào)用其相應應的成員函函數(shù)。接口口是COM對象提供供服務的基基本單元,,因此一個個COM對對象可以同同時提供數(shù)數(shù)個不同的的接口,并并且在不同同的接口中中提供不同同的函數(shù)。。COM服務務器:它是是一個模塊塊,可以是是EXE、、DLL或或是OCX,它們包包含COM對象的實實現(xiàn)代碼。。一個COM服務器器由一個或或多個COM對象組組成,對象象在服務器器內(nèi)部實現(xiàn)現(xiàn)。一個COM服務務器可以為為多個客戶戶提供服務務,客戶也也可以連接接到不同的的服務器。。一個COM服務器器就是一個個向客戶應應用或庫提提供服務的的應用或庫庫(如DLL)。COM客戶戶:通過接接口向服務務器申請需需要的服務務。客戶知知道需要從從服務器獲獲得什么,,但是客戶戶不知道服服務器內(nèi)部部的細節(jié)。。14COM的的特性面向對象象的特性性和客戶戶/服務務器的特特性。語言無關關性:COM不不依賴于于特定的的語言,,只要能能夠生成成符合COM規(guī)規(guī)范的可可執(zhí)行代代碼即可可,該特特性性為為跨語言言合作開開發(fā)提供供了統(tǒng)一一標準。。進程透明明性:在在客戶/服務器器的軟件件結構中中,運行行在客戶戶端的代代碼和運運行在服服務器端端的代碼碼既可以以在同一一個進程程中,也也可以在在不同的的進程中中。COM所提提供的服服務組件件對象在在實現(xiàn)時時有兩種種進程模模型:進進程內(nèi)對對象和進進程外對對象。根根據(jù)進程程模型,,COM服務器器程序可可以分為為:進程程內(nèi)服務務程序、、本地服服務程序序和遠程程服務程程序。進進程內(nèi)服服務程序序被加載載到客戶戶的進程程空間,,在Windows環(huán)環(huán)境下通通常以動動態(tài)鏈接接庫(DLL))的形式式實現(xiàn);;本地服服務程序序是一個個獨立的的應用程程序,它它與客戶戶程序運運行在同同一臺機機器上,,通常它它是一個個EXE文件;;遠程服服務程序序運行在在與客戶戶不同的的機器上上,它既既可以是是一個DLL,,也可以以是一個個EXE文件。。雖然COM對對象有不不同的進進程模型型,但對對于客戶戶程序來來說是透透明的。??芍赜眯孕裕河捎谟贑OM標準是是建立在在二進制制代碼級級的,因因此COM對象象的可重重用性與與一般的的面向對對象語言言的重用用過程不不同。COM的的重用性性可建立立在組件件對象的的行為方方式上,,而不是是具體的的實現(xiàn)上上,因此此它的可可重用性性不是源源代碼級級的重用用,而是是二進制制級的重重用。15DCOMDCOM(DistributeComponentObjectModel,分分布式組組件對象象模型)):是COM的擴展展,它可可以支持持不同計計算機上上組件對對象與客客戶程序序之間或或者組件件對象之之間的通通信,這這些計算算機可以以在局域域網(wǎng)內(nèi),,也可以以在廣域域網(wǎng)上,,甚至通通過Internet進行連連接。對對于客戶戶程序而而言,組組件程序序所處的的位置是是透明的的,不必必編寫任任何處理理遠程調(diào)調(diào)用的代代碼。DCOM在COM基礎礎上增加加的主要要特征創(chuàng)建遠程程對象的的能力::客戶只只需調(diào)用用OLE32.dll提供的的庫函數(shù)數(shù)CoCreateInstance透明明地創(chuàng)建建組件,,而不關關心組件件的位置置??缇W(wǎng)絡的數(shù)據(jù)據(jù)傳送能力::由于遠程對對象和客戶處處于不同的地地址空間,它它們之間的數(shù)數(shù)據(jù)傳送不但但可能要跨網(wǎng)網(wǎng)絡進行,還還要處理數(shù)據(jù)據(jù)格式等一系系列調(diào)整。當當客戶和遠程程對象進行數(shù)數(shù)據(jù)傳送時,,在客戶端需需對參數(shù)進行行列集,位于于客戶端的代代理對象完成成這一任務,,進行跨網(wǎng)絡絡的數(shù)據(jù)傳送送。安全性和訪問問控制能力。。16COM+COM+:并并不是COM的新版本,,而是COM的新發(fā)展,,它是COM更高層次上上的應用。COM+的底底層結構仍然然以COM為為基礎,它幾幾乎包括了COM的所有有內(nèi)容。COM+倡導導了一種新概概念,把組件件軟件模型建建立在應用層層上,把所有有組件的底層層細節(jié)留給操操作系統(tǒng)。COM+不再再局限于COM的組件技技術,它更加加注重于基于于分布式網(wǎng)絡絡應用的設計計與實現(xiàn)。COM+繼承承了COM幾幾乎全部的優(yōu)優(yōu)勢,同時又又避免了COM實現(xiàn)方面面的一些不足足。從COM的發(fā)發(fā)展角度來看看,COM最最初作為桌面面操作系統(tǒng)平平臺上的組件件技術,主要要為OLE服服務。但是隨隨著WindowsNT與DCOM的發(fā)布,,COM通過過底層的遠程程支持組件技技術延伸到了了分布式應用用領域,充分分體現(xiàn)了COM的擴展能能力以及結構構模型的優(yōu)勢勢。MTS為為COM增添添了許多新的的內(nèi)容,彌補補了COM和和DCOM的的一些不足,,它注重于服服務器一端的的組件管理和和配置環(huán)境。。COM+進進一步把COM、DCOM和MTS統(tǒng)一起來,,形成真正適適合于企業(yè)應應用的技術。。17分布式組件對對象的特性伸縮性:隨著著用戶數(shù)目的的增加、數(shù)據(jù)據(jù)量的不斷增增多,分布式式應用系統(tǒng)的的適應能力反反映了系統(tǒng)的的優(yōu)劣。使用用COM/DCOM/COM+建立立起來的應用用系統(tǒng)能很好好地適應這種種規(guī)模的變化化,當用戶數(shù)數(shù)比較少、數(shù)數(shù)據(jù)量不大時時,系統(tǒng)顯得得小巧而快速速;當應用規(guī)規(guī)模增大時,,系統(tǒng)也能夠夠正常運行并并且在保證性性能的情況下下不影響可靠靠性。DCOM的位置透透明性保證了了這種變化可可以不必修改改組件源程序序??膳渲眯裕喊舶惭b和管理是是分布式軟件件系統(tǒng)的兩個個重要環(huán)節(jié)。。使用COM/DCOM/COM+建立的分布布式軟件系統(tǒng)統(tǒng)可以很方便便地對系統(tǒng)進進行重新配置置,包括服務務器的變化、、客戶程序的的自動安裝等等特性。微軟軟為DCOM提供了一個個圖形界面的的配置工具程程序(DCOMCNFG.EXE)),可使客戶戶程序和組件件程序在不改改變代碼的情情況下適應不不同的網(wǎng)絡環(huán)環(huán)境。18分布式組件對對象的特性安全性:DCOM使用用了WindowsNT提供的可可擴展安全性性框架,在非非NT平臺上上實現(xiàn)的DCOM也包括括了一個與NT兼容的安安全提供器。。DCOM實實現(xiàn)的安全性性分為訪問安安全性和激發(fā)發(fā)安全性。訪訪問安全性指指定哪些用戶戶可以調(diào)用分分布式組件對對象,激發(fā)安安全性指定哪哪些用戶可以以在一個新進進程中創(chuàng)建新新的對象。協(xié)議無關性::在基于COM/DCOM/COM+的分布式式應用系統(tǒng)中中,并不要求求專門的網(wǎng)絡絡協(xié)議,所以以這種分布式式應用系統(tǒng)對對網(wǎng)絡有很強強的適應能力力。在Windows平平臺上,可以以使用以下一一些協(xié)議:TCP/IP、UDP、、IPX/SPX以及NetBIOS。平臺獨立性::COM/DCOM/COM+把把平臺二進制制標準和平臺臺無關的標準準隔離開來,,并且,由于于DCOM建建立在DCERPC的的基礎上,所所以DCOM能很好地適適應不同的系系統(tǒng)平臺,目目前已經(jīng)實現(xiàn)現(xiàn)了DCOM的操作系統(tǒng)統(tǒng)有:Windows、、AppleMacintosh以及Unix的一些版版本。19使用COM技技術實現(xiàn)數(shù)據(jù)據(jù)倉庫的組件件數(shù)據(jù)倉庫是針針對支持整個個企業(yè)范圍的的主要業(yè)務來來建立的。主主要特點是,,包含大量面面向整個企業(yè)業(yè)的綜合信息息及導出信息息,所以系統(tǒng)統(tǒng)本身處在一一個分布式環(huán)環(huán)境中,且必必須具有極好好的擴展性和和靈活性。COM/DCOM/COM+技技術術能能適適應應數(shù)數(shù)據(jù)據(jù)倉倉庫庫應應用用的的需需要要,,能能最最大大限限度度地地提提高高靈靈活活性性和和可可擴擴展展能能力力。。數(shù)據(jù)據(jù)倉倉庫庫的的系系統(tǒng)統(tǒng)設設計計與與開開發(fā)發(fā)是是一一個個動動態(tài)態(tài)的的反反饋饋和和循循環(huán)環(huán)的的過過程程。。一一方方面面數(shù)數(shù)據(jù)據(jù)倉倉庫庫的的數(shù)數(shù)據(jù)據(jù)內(nèi)內(nèi)容容、、結結構構、、粒粒度度、、分分割割以以及及其其他他物物理理設設計計根根據(jù)據(jù)用用戶戶所所返返回回的的信信息息不不斷斷地地調(diào)調(diào)整整和和完完善善,,以以提提高高系系統(tǒng)統(tǒng)的的效效率率和和性性能能;;另另一一方方面面,,通通過過不不斷斷地地理理解解用用戶戶的的分分析析需需求求,,向向用用戶戶提提供供更更準準確確、、更更有有用用的的決決策策信信息息。。將將數(shù)數(shù)據(jù)據(jù)倉倉庫庫系系統(tǒng)統(tǒng)從從功功能能上上分分為為若若干干個個獨獨立立的的對對象象,,并并使使用用COM技技術術實實現(xiàn)現(xiàn),,可可以以最最大大限限度度地地重重用用這這些些對對象象。。當當用用戶戶的的需需求求增增加加或或發(fā)發(fā)生生變變化化時時,,只只需需要要增增加加相相應應的的COM對對象象或或更更新新變變化化的的COM對對象象。。20使用用COM技技術術實實現(xiàn)現(xiàn)數(shù)數(shù)據(jù)據(jù)倉倉庫庫的的組組件件通過過將將用用戶戶業(yè)業(yè)務務邏邏輯輯以以DCOM對對象象的的形形式式集集中中到到中中間間層層,,系系統(tǒng)統(tǒng)就就獲獲得得了了對對業(yè)業(yè)務務邏邏輯輯的的獨獨立立性性。。當當用用戶戶需需求求改改變變時時,,開開發(fā)發(fā)人人員員可可以以迅迅速速地地在在應應用用服服務務器器上上更更新新業(yè)業(yè)務務邏邏輯輯,,而而無無需需將將更更新新后后的的應應用用遞遞交交到到成成千千上上萬萬的的桌桌面面系系統(tǒng)統(tǒng)上上去去,,從從而而使使開開發(fā)發(fā)人人員員從從維維護護眾眾多多客客戶戶端端的的繁繁重重工工作作中中解解脫脫出出來來。。倉庫是是一個個大規(guī)規(guī)模的的工程程項目目,它它開發(fā)發(fā)周期期長,,而數(shù)數(shù)據(jù)倉倉庫的的需求求又是是動態(tài)態(tài)的,,不確確定的的。如如果數(shù)數(shù)據(jù)倉倉庫的的開發(fā)發(fā)周期期過長長,可可能當當系統(tǒng)統(tǒng)完成成后,,用戶戶的需需求已已經(jīng)發(fā)發(fā)生了了變化化,從從而造造成開開發(fā)資資源的的浪費費;而而且在在當今今激烈烈的市市場競競爭中中,誰誰越早早進行行決策策,誰誰就在在競爭爭中占占得先先機,,所以以數(shù)據(jù)據(jù)倉庫庫的開開發(fā)周周期越越短,,給企企業(yè)帶帶來的的效益益就越越大。。通過過COM技技術將將數(shù)據(jù)據(jù)倉庫庫系統(tǒng)統(tǒng)劃分分為不不同的的功能能對象象,可可以使使開發(fā)發(fā)團隊隊進行行并行行開發(fā)發(fā)。開開發(fā)人人員只只需要要定義義各個個COM對對象明明確的的接口口,彼彼此之之間不不需要要了解解各自自的工工作。。21使用COM技術術實現(xiàn)現(xiàn)數(shù)據(jù)據(jù)倉庫庫的組組件數(shù)據(jù)倉倉庫的的數(shù)據(jù)據(jù)是從從企業(yè)業(yè)內(nèi)部部的各各個操操作型型環(huán)境境中提提取出出來的的,所所以數(shù)數(shù)據(jù)倉倉庫系系統(tǒng)本本身就就處在在一個個分布布式環(huán)環(huán)境中中。由由于在在數(shù)據(jù)據(jù)倉庫庫中數(shù)數(shù)據(jù)的的訪問問量非非常大大,所所以提提高系系統(tǒng)性性能的的首要要目標標是盡盡量減減少網(wǎng)網(wǎng)絡上上的數(shù)數(shù)據(jù)傳傳遞。??梢砸詫?shù)數(shù)據(jù)處處理的的各個個組件件以DCOM對對象的的形式式存放放在應應用服服務器器上,,所以以,盡盡管可可能存存在著著與應應用服服務器器的多多個甚甚至數(shù)數(shù)百個個的連連接,,但應應用服服務器器與數(shù)數(shù)據(jù)庫庫服務務器之之間的的連接接卻只只有少少數(shù)幾幾個,,從而而達到到減少少網(wǎng)絡絡上的的數(shù)據(jù)據(jù)傳送送量。。數(shù)據(jù)分分析應應用中中的計計算、、操作作和數(shù)數(shù)據(jù)過過濾通通常是是很復復雜的的。如如果在在客戶戶機上上完成成這些些處理理工作作,不不僅要要求客客戶機機必須須具有有足夠夠強大大的配配置,,而且且對網(wǎng)網(wǎng)絡負負載能能力也也是一一個考考驗。。通過過COM技技術可可以將將執(zhí)行行此類類處理理工作作的對對象放放在多多個應應用服服務器器上,,利用用COM+提供供的負負載平平衡服服務來來提高高數(shù)據(jù)據(jù)倉庫庫系統(tǒng)統(tǒng)的可可用性性。由于數(shù)數(shù)據(jù)分分析時時,每每次查查詢涉涉及到到的數(shù)數(shù)據(jù)量量巨大大,所所以往往往會會需要要較長長的響響應時時間,,特別別在數(shù)數(shù)據(jù)分分布時時響應應時間間有時時會讓讓人難難以忍忍受。。COM+通過過消息息隊列列組件件提供供了異異步通通信功功能,,使得得客戶戶不必必等待待。22數(shù)據(jù)倉倉庫體體系結結構的的設計計與實實現(xiàn)設計思思想::客戶端端通過過提交交描述述要調(diào)調(diào)用的的方法法和要要傳遞遞的參參數(shù)的的XML文文檔進進行調(diào)調(diào)用。。在應應用服服務器器端實實現(xiàn)所所需服服務的的接口口,當當通信信組件件接收收到XML文檔檔后,,創(chuàng)建建XMLService組件件并由由XMLService組件件根據(jù)據(jù)XML文文檔調(diào)調(diào)度服服務,,并將將返回回結果果或錯錯誤信信息封封裝成成XML文文檔傳傳遞給給客戶戶端。。將數(shù)據(jù)據(jù)倉庫庫系統(tǒng)統(tǒng)劃分分為若若干個個獨立立的分分布式式對象象,每每個對對象都都可以以獨立立地完完成一一項工工作如如數(shù)據(jù)據(jù)轉換換、數(shù)數(shù)據(jù)集集成等等。這這些對對象須須使用用開放放的標標準組組件,,它們們具有有可重重用性性高的的特性性。對對象與與對象象之間間通過過XML文文檔進進行通通信。。由于于采用用開放放的XML文檔檔集成成數(shù)據(jù)據(jù),所所以大大大提提高了了系統(tǒng)統(tǒng)集成成異構構數(shù)據(jù)據(jù)源、、半結結構化化數(shù)據(jù)據(jù)及非非結構構化數(shù)數(shù)據(jù)的的能力力。對象與對對象之間間既可以以互相協(xié)協(xié)作共同同完成創(chuàng)創(chuàng)建數(shù)據(jù)據(jù)倉庫的的任務,,又可以以獨立地地完成某某個特定定功能。。這些分分布式對對象和用用戶前端端界面以以及后臺臺數(shù)據(jù)形形成了數(shù)數(shù)據(jù)倉庫庫的多層層體系結結構。23數(shù)據(jù)倉庫庫系統(tǒng)體體系結構構的設計計客戶端::可視化的的用戶界界面客戶端通通信組件件應用服務務器端::服務器端端通信組組件XMLService調(diào)度組組件安全組件件元數(shù)據(jù)管管理器轉換器集成器數(shù)據(jù)庫服服務器端端源數(shù)據(jù)元數(shù)據(jù)庫庫數(shù)據(jù)準備備區(qū)數(shù)據(jù)倉庫庫24數(shù)據(jù)倉庫庫系統(tǒng)中中的通信信-XML概概述XML((eXtensibleMarkupLanguage,,可擴展展的標記記語言))是國際際組織W3C制制定的在在Web上對有有格式的的數(shù)據(jù)進進行描述述、傳輸輸、操作作的通用用語言。。XML是是一套套定義語語義標記記的規(guī)則則,這些些標記將將文檔分分成許多多部件并并對這些些部件加加以標識識。它也也是元標標記語言言,即定定義了用用于定義義其他與與特定領領域有關關的、語語義的、、結構化化的標記記語言的的句法語語言。XML定定義了一一套元句句法,允允許各種種不同的的專業(yè)開開發(fā)與自自己的特特定領域域有關的的標記語語言。25基于XML的通通信運行行機制應用服務務器端通通信組件件接收到到客戶端端傳遞來來的XML字符符串,創(chuàng)創(chuàng)建XMLService對對象。將XML字符串串以參數(shù)數(shù)形式傳傳遞給XMLService對象的的調(diào)度方方法Run(),并調(diào)調(diào)用Run方法法;在Run方法中中,解析析XML字符串串,獲得得客戶端端調(diào)用的的方法;;檢查用戶戶的權限限,如果果沒有調(diào)調(diào)用此方方法的權權限,返返回錯誤誤信息;;通過權限限驗證后后,打開開存儲在在服務器器端的FunctionMaps.xml文件,,該文件件中記錄錄了方法法和對象象的映射射關系,,根據(jù)文文件中記記錄的內(nèi)內(nèi)容獲得得實現(xiàn)方方法的對對象名;;根據(jù)獲得得的對象象名創(chuàng)建建對象;;每個對象象(元數(shù)數(shù)據(jù)管理理器、轉轉換器、、集成器器)除了了實現(xiàn)了了用戶所所需要的的服務外外,還實實現(xiàn)了一一個調(diào)度度自身服服務的Run方方法,XMLService調(diào)度對對象則通通過調(diào)用用這個Run方方法來實實現(xiàn)對對對象服務務的調(diào)度度。26XML通通信組件件示意圖圖27XML通通信組件件
客戶戶端與服服務器端端的通信信機制啟動服務務器端管管理程序序,創(chuàng)建建Application調(diào)調(diào)度對象象。用Application調(diào)調(diào)度對象象的StartNewService方法法創(chuàng)建ServerDispatcher偵聽聽對對象,并并對客戶戶端進行行偵聽。。啟動客戶戶端應用用程序,,創(chuàng)建ClientTalker會會話對象象。調(diào)用ClientTalker會話話對象的的Connect方法法,請求求連接服服務器。。ServerDispatcher偵聽對對象接收收到客戶戶端的連連接請求求后,創(chuàng)創(chuàng)建ServerTalker對象象并將它它與ClientTalker會話話對象連連接。如如果活動動的通信信會話對對象數(shù)量量達到了了最大限限制,新新的連接接不能建建立,相相關消息息將被記記錄到日日志文件件中。調(diào)用ServerTalker的Accept方方法,然然后等待待客戶端端發(fā)送XML消消息;在在收到客客戶端發(fā)發(fā)送的XML消消息后,,加載XMLService對象處處理XML消息息,然后后將處理理結果發(fā)發(fā)回客戶戶端;如如果過程程中有錯錯誤發(fā)生生,錯誤誤信息將將被記錄錄到日志志文件中中,同時時,會話話被認為為結束;;如果在在上一次次數(shù)據(jù)通通信后,,在指定定時間范范圍里沒沒有通信信發(fā)生,,系統(tǒng)認認為超時時,會話話也將結結束。28元數(shù)據(jù)管管理器客戶端登登錄:負負責接收收客戶端端登錄信信息并進進行用戶戶權限檢檢查元數(shù)據(jù)管管理器的的用戶接接口:以以接口形形式向用用戶提供供對元數(shù)數(shù)據(jù)增增、刪、、改、查查的服務務,包括括:源數(shù)數(shù)據(jù)信息息、數(shù)據(jù)據(jù)倉庫信信息、星星型模型型信息、、維信息息、維表表字段信信息、事事實表字字段信息息、映射射事實表表字段信信息、映映射維表表字段信信息、鏈鏈接事事實表與與維表字字段的信信息;元數(shù)據(jù)的的存儲::元數(shù)據(jù)據(jù)管理器器中的元元數(shù)據(jù)存存儲程序序負責接接收由接接口程序序傳遞來來的關于于對元數(shù)數(shù)據(jù)進行行增加、、修改和和刪除等等信息,,并根據(jù)據(jù)所提供供的參數(shù)數(shù)執(zhí)行存存儲過程程,將元元數(shù)據(jù)據(jù)的有關關信息保保存于服服務器端端的元數(shù)數(shù)據(jù)庫中中。29元數(shù)據(jù)管管理器的的設計與與實現(xiàn)元數(shù)據(jù)的的作用:定義數(shù)數(shù)據(jù)倉庫庫的作用用,指明明數(shù)據(jù)倉倉庫中信信息的內(nèi)內(nèi)容和位位置,刻刻畫數(shù)據(jù)據(jù)的抽取取和轉換換規(guī)則,存儲與與數(shù)據(jù)倉倉庫主題題有關的的各種商商業(yè)信息息。元數(shù)據(jù)基于MicrosoftSQLServer2000的關關系模型并存存儲在數(shù)據(jù)庫庫服務器上,,同時通過MetaManager組件提供了了一系列接口口使用戶可以以在所有應用用中共享元數(shù)數(shù)據(jù)在客戶端提供供圖形化界面面工具。例如如,用戶想在在多維模型中中加入一維或或者在某一維維中加入維元元素,不僅可可以通過圖形形化界面工具具完成而且可可以在用戶自自已編寫的應應用程序中調(diào)調(diào)用應用程序序接口函數(shù),,修改后的結結果將記入元元數(shù)據(jù)庫中。。然后系統(tǒng)將將根據(jù)元數(shù)據(jù)據(jù)庫中的新內(nèi)內(nèi)容進行數(shù)據(jù)據(jù)的追加。30元數(shù)據(jù)模型關于源數(shù)據(jù)的的元數(shù)據(jù):它它是現(xiàn)有的操操作型業(yè)務系系統(tǒng)的數(shù)據(jù)源源的描述信息息,是對不同同平臺上的數(shù)數(shù)據(jù)源的物理理結構和含義義的描述。包包括:數(shù)據(jù)源源中所有物理理數(shù)據(jù)結構;;所有數(shù)據(jù)項項的業(yè)務定義義;每個數(shù)據(jù)據(jù)項更新的頻頻率,以及由由誰或哪個過過程更新的說說明;每個數(shù)數(shù)據(jù)項的有效效值;其它系系統(tǒng)中具有相相同業(yè)務含義義的數(shù)據(jù)項的的清單。關于數(shù)據(jù)倉倉庫多維模模型的元數(shù)數(shù)據(jù)標準維:由由一張維表表構成,標標準的星型型模型采用用這種維和和事實表構構成的。維維表中的一一個字段或或多個字段段構成了維維的層次。。雪花維:由由相互關聯(lián)聯(lián)的多個維維表構成,,每個維表表中的字段段構成了維維的層次。。通過多個個維表的連連接最大限限度地減少少了數(shù)據(jù)存存儲量,增增加了模型型的靈活性性,但也使使得查詢變變得復雜化化。時間維:用用來描述事事實數(shù)據(jù)的的時間屬性性。它通常常只與源數(shù)數(shù)據(jù)庫中某某個表的日日期型字段段相對應,,所以時間間維的層次次不可以由由維表的字字段來表示示。時間維維的層次由由高到低分分別為Year、Quarter、Month、Day、Hour、Minute、Second,,用戶可以以任意選擇擇幾種構成成時間維的的層次。31元數(shù)據(jù)模型型關于數(shù)據(jù)倉倉庫映射的的元數(shù)據(jù)::是數(shù)據(jù)源源中的數(shù)據(jù)據(jù)與數(shù)據(jù)倉倉庫間數(shù)據(jù)據(jù)的映射。。當數(shù)據(jù)源源中的一個個數(shù)據(jù)項與與數(shù)據(jù)倉庫庫建立了映映射關系,,就應該記記下這些數(shù)數(shù)據(jù)項發(fā)生生的任何變變換或變動動,即用元元數(shù)據(jù)反映映數(shù)據(jù)倉庫庫中的數(shù)據(jù)據(jù)項是從哪哪個特定的的數(shù)據(jù)源填填充的,經(jīng)經(jīng)過哪些轉轉換、集成成過程。關于系統(tǒng)安安全的元數(shù)數(shù)據(jù):描述述了系統(tǒng)中中用戶、權權限組及用用戶權限信信息。每個個用戶可以以屬于多個個權限組,,每個權限限組都有一一定的權限限。這些權權限具體表表現(xiàn)為可以以執(zhí)行的元元數(shù)據(jù)管理理器、轉換換器和集成成器所提供供的方法。。32基于COM的元數(shù)據(jù)據(jù)管理器MetaManager的運運行機制用戶程序首首先啟動客客戶程序,,客戶程序序連接應用用服務器。。客戶程序創(chuàng)創(chuàng)建一個128位的的SessionID并將它它與登錄帳帳號、口令令組成XML字符串串傳遞給應應用服務器器,XMLService調(diào)度對象象接收到XML字符符串后解析析XML字字符串,創(chuàng)創(chuàng)建登錄對對象并調(diào)用用登錄對象象的相關方方法。登錄對象通通過數(shù)據(jù)庫庫中的用戶戶及口令確確定用戶的的合法身份份,并保存存SessionID,返回回登錄成功功的信息。??蛻舫绦蚴帐盏降卿洺沙晒Φ男畔⑾⒑?,以XML字符符串形式向向應用服務務器發(fā)送XML命令令數(shù)據(jù)包,,命令數(shù)據(jù)據(jù)包前加上上包括SessionID的的請求報頭頭。應用服務器器收到客戶戶的請求數(shù)數(shù)據(jù)包后將將其解析,,獲得SessoinID,,并根據(jù)SessionID檢查用戶戶的權限。。如用戶具有有合法權限限,則由XMLService調(diào)度度對象創(chuàng)建建MetaManager對對象并調(diào)用用MetaManger的Run方法法。MetaManager的Run方法法根據(jù)客戶戶傳遞的XML數(shù)據(jù)據(jù)包調(diào)用相相關的方法法。返加的的結果打成成XML數(shù)數(shù)據(jù)包并通通過通信組組件返回給給客戶程序序。33轉換器的設設計與實現(xiàn)現(xiàn)轉換器的功功能:數(shù)據(jù)結構轉轉換和數(shù)據(jù)據(jù)類型轉換換結構化數(shù)據(jù)據(jù)的轉換:關系對對應于對象象類,元元組對應于于對象實例例,關系系屬性對應應于對象的的屬性值非結構化數(shù)數(shù)據(jù)的轉換換:利用用對象的封封裝性實現(xiàn)現(xiàn)對非結構構化數(shù)據(jù)的的處理自動化或半半自動化的的轉換器生生成技術:采用互操作作性標準,定義數(shù)數(shù)據(jù)源與翻翻譯器的接接口從數(shù)據(jù)源中中提取數(shù)據(jù)據(jù)并轉換格格式的過程程:先將各類數(shù)數(shù)據(jù)庫系統(tǒng)統(tǒng)中不同格格式的數(shù)據(jù)據(jù)轉換成文文本文件,,然后再利利用批拷貝貝命令將數(shù)數(shù)據(jù)導入目目標系統(tǒng)中中。以使數(shù)數(shù)據(jù)倉庫獲獲得新的數(shù)數(shù)據(jù)提供決決策分析使使用。34轉換器的設設計與實現(xiàn)現(xiàn)數(shù)據(jù)準備區(qū)區(qū)的使用::首先從源源數(shù)據(jù)中提提取數(shù)據(jù),,轉換成數(shù)數(shù)據(jù)倉庫所所要求的格格式后存儲儲在數(shù)據(jù)倉倉庫的一個個稱為數(shù)據(jù)據(jù)準備區(qū)的的緩沖區(qū)中中。在該區(qū)區(qū)域中,可可以暫時存存儲原始數(shù)數(shù)據(jù),然后后由集成器器對數(shù)據(jù)進進行清理、、集成后再再裝載到數(shù)數(shù)據(jù)倉庫中中。由于使使用獨立于于數(shù)據(jù)源的的數(shù)據(jù)準備備區(qū)為數(shù)據(jù)據(jù)倉庫準備備數(shù)據(jù)可提提高管理數(shù)數(shù)據(jù)倉庫的的效率,另另外將數(shù)據(jù)據(jù)準備區(qū)與與數(shù)據(jù)倉庫庫數(shù)據(jù)隔離離開,可以以保護數(shù)據(jù)據(jù)倉庫的完完整性同時時可以提高高數(shù)據(jù)倉庫庫的性能。。在將數(shù)據(jù)據(jù)從源數(shù)據(jù)據(jù)提取到數(shù)數(shù)據(jù)準備區(qū)區(qū)的過程中中,可借助助于Microsoft的數(shù)數(shù)據(jù)轉換服服務(DTS)包來來實現(xiàn)。35源數(shù)據(jù)庫、、數(shù)據(jù)準備備區(qū)
和數(shù)數(shù)據(jù)倉庫之之間的關系系源數(shù)據(jù)數(shù)據(jù)準備區(qū)數(shù)據(jù)倉庫DTS三者關系圖36DTS概述述DTS:是是MicrosoftSQLServer2000中提供的的數(shù)據(jù)轉換換服務(DataTransformationServices))。DTS是一個組組件對象,,它提供一一個組件的的完整集。。這些組件件可在任何何具有OLEDB、ODBC接口的的數(shù)據(jù)庫或或規(guī)格化的的文本文件件間導入、、導出和轉轉換數(shù)據(jù)。。包(Package):導入入、導出數(shù)數(shù)據(jù)的過程程定義并保保存在包中中。37轉換器的實實現(xiàn)-轉換器的流流程圖創(chuàng)建數(shù)據(jù)準準備區(qū)N開始讀元數(shù)據(jù)檢查數(shù)據(jù)準準備區(qū)?執(zhí)行DTS包更改元數(shù)據(jù)據(jù)(時間,,數(shù)據(jù)狀態(tài)態(tài))結束成功連接元數(shù)據(jù)據(jù)庫創(chuàng)建DTS包Y38選擇源數(shù)據(jù)據(jù)的窗體39數(shù)據(jù)轉換在窗體上方方的下拉列列表中選擇擇了數(shù)據(jù)源源類型后,,針對不同同的數(shù)據(jù)源源類型在窗窗體中會顯顯示不同的的界面,讓讓用戶輸入入連接各種種數(shù)據(jù)源的的連接字符符串信息((用戶名、、密碼、數(shù)數(shù)據(jù)庫等))。由于DTS借助助OLEDB來存存取不同數(shù)數(shù)據(jù)源的數(shù)數(shù)據(jù),所以以本系統(tǒng)中中可選擇的的數(shù)據(jù)源類類型包括OLEDB支持的的各種異質(zhì)質(zhì)數(shù)據(jù)源。。在窗體中中單擊下一一步按鈕后后,將顯示示數(shù)據(jù)庫中中各對象信信息讓用戶戶選擇需要要導入數(shù)據(jù)據(jù)準備區(qū)的的數(shù)據(jù)對象象,然后創(chuàng)創(chuàng)建并調(diào)用用Microsoft的DTS對象象,完成數(shù)數(shù)據(jù)轉換工工作。40調(diào)用DTS的過程創(chuàng)建DTS包,并初初始化參數(shù)數(shù)。向DTS的的連接集合合中添加源源數(shù)據(jù)連接接。檢查數(shù)據(jù)準準備區(qū)是否否存在,如如不存在首首先創(chuàng)建數(shù)數(shù)據(jù)準備區(qū)區(qū),如果數(shù)數(shù)據(jù)準備區(qū)區(qū)已存在則則直接向DTS的連連接集合中中添加目標標數(shù)據(jù)源連連接。讀取相關元元數(shù)據(jù)信息息,如需要要轉換的表表及字段的的相關信息息等。根據(jù)元數(shù)據(jù)據(jù)信息,創(chuàng)創(chuàng)建任務對對象并加入入任務集合合。創(chuàng)建步驟對對象,并將將任務對象象加入步驟驟對象。如果有多個個任務,則則繼續(xù)創(chuàng)建建其他任務務對象,并并指定所屬屬步驟對象象。執(zhí)行DTS包。41集成成器器的的設設計計與與實實現(xiàn)現(xiàn)--集成成器器的的功功能能轉換換各各種種異異質(zhì)質(zhì)數(shù)數(shù)據(jù)據(jù)源源的的格格式式。。判定定一一個個記記錄錄是是否否可可進進行行抽抽取取處處理理。。數(shù)據(jù)據(jù)重重新新格格式式化化。。數(shù)據(jù)據(jù)清清理理。。從多多個個輸輸入入數(shù)數(shù)據(jù)據(jù)源源中中選選取取數(shù)數(shù)據(jù)據(jù)。。多個個輸輸入入文文件件重重新新排排序序。。產(chǎn)生生不不同同概概括括層層次次上上的的輸輸出出結結果果。。提供供缺缺省省值值。。區(qū)分分需需要要抽抽取取的的和和不不需需要要抽抽取取的的操操作作型型數(shù)數(shù)據(jù)據(jù)。。進行行數(shù)數(shù)據(jù)據(jù)的的匯匯總總。。對數(shù)數(shù)據(jù)據(jù)元元素素的的重重命命名名進進行行跟跟蹤蹤。。不常常見見的的或或不不標標準準的的格格式式處處理理。。指定定轉轉換換邏邏輯輯和和轉轉換換機機制制。。理解解并并解解開開建建立立在在舊舊的的傳傳統(tǒng)統(tǒng)程程序序邏邏輯輯中中的的數(shù)數(shù)據(jù)據(jù)之之間間的的關關系系。。大容容量量數(shù)數(shù)據(jù)據(jù)的的輸輸入入/輸輸出出((如如并并行行裝裝載載和和并并行行讀讀出出))。。必須須符符合合企企業(yè)業(yè)數(shù)數(shù)據(jù)據(jù)模模型型。。42集成成器器的的設設計計與與實實現(xiàn)現(xiàn)集成成模模型型::根根據(jù)據(jù)元元數(shù)數(shù)據(jù)據(jù)中中記記錄錄的的映映射射關關系系在在星星形形模模型型的的基基礎礎上上以以向向導導的的形形式式提提供供集集成成模模型型的的客客戶戶端端工工具具。。創(chuàng)建建數(shù)數(shù)據(jù)據(jù)倉倉庫庫后后,,在在元元數(shù)數(shù)據(jù)據(jù)中中記記錄錄數(shù)數(shù)據(jù)據(jù)倉倉庫庫的的基基本本信信息息,,同同時時創(chuàng)創(chuàng)建建一一個個同同名名的的關關系系型型數(shù)數(shù)據(jù)據(jù)庫庫。。用用戶戶可可以以在在窗窗體體中中的的數(shù)數(shù)據(jù)據(jù)類類型型下下拉拉列列表表中中選選擇擇數(shù)數(shù)據(jù)據(jù)倉倉庫庫的的數(shù)數(shù)據(jù)據(jù)類類型型,,由由于于數(shù)數(shù)據(jù)據(jù)倉倉庫庫是是一一個個海海量量數(shù)數(shù)據(jù)據(jù)的的存存儲儲集集合合,,所所以以選選擇擇的的數(shù)數(shù)據(jù)據(jù)庫庫管管理理系系統(tǒng)統(tǒng)必必須須具具有有并并行行處處理理能能力力及及可可伸伸縮縮性性。。創(chuàng)建了物物理數(shù)據(jù)據(jù)庫后,,開始創(chuàng)創(chuàng)建數(shù)據(jù)據(jù)倉庫模模型,并并裝載數(shù)數(shù)據(jù)。首首先創(chuàng)建建星型模模型中的的事實表表。在樹型結結構中列列出當前前元數(shù)據(jù)據(jù)庫中描描述的源源數(shù)據(jù)庫庫以及庫庫中的表表對象,,用戶可可以選擇擇其中一一個表作作為事實實表;同同時窗體體的右邊邊以列表表形式顯顯示了所所選擇表表的字段段信息。。單擊下下一步后后,用戶戶可以在在窗體中中選擇度度量字段段,并選選擇要保保留的字字段。將將用戶的的信息記記錄在元元數(shù)據(jù)庫庫中,并并根據(jù)該該信息創(chuàng)創(chuàng)建事實實表。43集成器的的設計與與實現(xiàn)事實表創(chuàng)創(chuàng)建后,,則開始始創(chuàng)建星星型模型型的維。。在前面面的章節(jié)節(jié)中我們們討論了了星型模模型的維維分為::標準維維、雪花花維和時時間維。。完成上上述的的步驟驟后,,已成成功創(chuàng)創(chuàng)建了了一個個星形形模型型,然然后再再調(diào)用用元數(shù)數(shù)據(jù)管管理器器的相相關方方法更更新元元數(shù)據(jù)據(jù)庫中中的數(shù)數(shù)據(jù)。。數(shù)據(jù)凈凈化::當數(shù)數(shù)據(jù)從從源數(shù)數(shù)據(jù)庫庫中提提取到到數(shù)據(jù)據(jù)準備備區(qū)后后,必必須先先進行行數(shù)據(jù)據(jù)凈化化才可可以裝裝載到到數(shù)據(jù)據(jù)倉庫庫中去去。數(shù)數(shù)據(jù)凈凈化主主要指指對數(shù)數(shù)據(jù)字字段的的有效效值檢檢驗。。有效效值的的檢驗驗通常常包括括:范范圍檢檢驗、、枚舉舉字段段取值值和相相關檢檢驗。。范圍圍檢驗驗要求求數(shù)據(jù)據(jù)保證證落在在預期期的范范圍之之內(nèi),,通常常對數(shù)數(shù)據(jù)范范圍和和日期期范圍圍進行行檢驗驗,如如對任任何在在指定定范圍圍之外外的日日期的的發(fā)票票都應應刪除除。枚枚舉字字段取取值指指對一一個記記錄在在該字字段的的取值值,若若不在在指定定的值值中,,則應應該刪刪除。。相關關檢驗驗要求求將一一個字字段中中的值值與另另外一一個字字段中中的值值進行行相關關檢驗驗,即即在數(shù)數(shù)據(jù)庫庫中某某個字字段應應與另另一個個字段段形成成外鍵鍵約束束。44集成器器的設設計與與實現(xiàn)現(xiàn)維表與與事實實表的的引用用完整整性檢檢驗::數(shù)據(jù)據(jù)倉庫庫的星星型模模型中中一般般都有有多個個維,,而在在查詢詢數(shù)據(jù)據(jù)時維維表和和事實實表之之間大大多采采用內(nèi)內(nèi)聯(lián)接接。當當維表表和事事實數(shù)數(shù)據(jù)表表之間間的引引用完完整性性破壞
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《社區(qū)社會工作》課件
- 2024年滬教版四年級英語下冊階段測試試卷
- 《激勵與人性管理》課件
- 2025年外研版2024八年級英語下冊階段測試試卷含答案
- 2025年粵教版選擇性必修1地理下冊階段測試試卷
- 2024年冀教新版四年級英語上冊月考試卷
- 信息技術安全專家管理辦法
- 電力行業(yè)電網(wǎng)運行培訓費管理辦法
- 2024年浙教新版五年級英語下冊月考試卷
- 化學工程教師錄用
- (八省聯(lián)考)河南省2025年高考綜合改革適應性演練 生物試卷(含答案)
- 人工智能銷售工作總結
- 工商注冊租房合同范例
- 2023-2024學年廣東省深圳市羅湖區(qū)八年級上學期期末生物試題
- 2025年醫(yī)院保衛(wèi)科工作總結及2025年工作計劃
- 班會課件高中
- 部編版一年級上冊語文第一單元-作業(yè)設計
- 安全生產(chǎn)泄漏課件
- 陜西省西安市高新第一中學2023-2024學年八年級上學期期末歷史試題
- 中建履帶吊安拆安全專項施工方案
- 眼鏡銷售儀容儀表培訓
評論
0/150
提交評論