




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、徐俊剛()數(shù)據(jù)倉庫2009年9月2008年11月ODS的定義和特點(diǎn)DB-ODS-DW體系結(jié)構(gòu)建立ODSODS案例數(shù)據(jù)集市的定義數(shù)據(jù)集市的特點(diǎn)數(shù)據(jù)集市與數(shù)據(jù)倉庫的區(qū)別數(shù)據(jù)集市的類型數(shù)據(jù)集市的開發(fā)方法數(shù)據(jù)集市的實(shí)施操作數(shù)據(jù)存儲(ODS)和數(shù)據(jù)集市 第3章ODS的定義和特點(diǎn)1ODS的由來1.1ODS由來DB數(shù)據(jù)環(huán)境:面向應(yīng)用和聯(lián)機(jī)事務(wù)處理,當(dāng)前的、細(xì)節(jié)的、分散的數(shù)據(jù),不能提供集成的統(tǒng)一的數(shù)據(jù)環(huán)境,共享程度低,不能提供決策支持。DW數(shù)據(jù)環(huán)境:面向高層、面向分析,可以提供集成、統(tǒng)一的數(shù)據(jù)環(huán)境,但是一定量的數(shù)據(jù)是建立DW的前提,需要使用歷史數(shù)據(jù),數(shù)據(jù)要體現(xiàn)集成性和歷史性實(shí)際中往往會有實(shí)時(shí)決策的需求,上述兩
2、者都不能滿足要求,因此產(chǎn)生了ODSODS數(shù)據(jù)環(huán)境:一方面提供全局一致的、細(xì)節(jié)的、當(dāng)前的數(shù)據(jù),可進(jìn)行聯(lián)機(jī)事務(wù)操作型處理。另一方面是一種面向主題的集成的數(shù)據(jù)環(huán)境。數(shù)據(jù)量小,可輔助完成日常決策的數(shù)據(jù)分析處理,同時(shí)可以保護(hù)投資,保留現(xiàn)有的應(yīng)用系統(tǒng)。 ODS的定義和特點(diǎn)1ODS的定義1.2ODS定義ODS是Operational Data Store的簡稱,翻譯成操作數(shù)據(jù)存儲。ODS是數(shù)據(jù)倉庫體系結(jié)構(gòu)的一部分,可以根據(jù)需要選擇是否采用ODS。它具備數(shù)據(jù)倉庫的部分特征和OLTP的部分特征。ODS是一個(gè)面向主題的、集成的、可變的、當(dāng)前的細(xì)節(jié)數(shù)據(jù)集合,用于支持企業(yè)對于即時(shí)性的、操作性的、集成的全局信息的需求。
3、常常被作為數(shù)據(jù)倉庫的過渡。作為一個(gè)中間層次,它既不是聯(lián)機(jī)事務(wù)處理,也算不上高層決策分析,是不同于 DB 的一種新的數(shù)據(jù)環(huán)境,是數(shù)據(jù)倉庫擴(kuò)展后得到的一個(gè)混合形式。ODS支持對數(shù)據(jù)的聯(lián)機(jī)修改增、刪與更新等操作ODS的定義和特點(diǎn)1ODS的特點(diǎn)1.3ODS特點(diǎn)面向主題的(與數(shù)據(jù)倉庫類似)集成的(與數(shù)據(jù)倉庫類似)可變的數(shù)據(jù)可以聯(lián)機(jī)改變,包括增、刪及更新等操作。 數(shù)據(jù)是當(dāng)前細(xì)節(jié)級或接近當(dāng)前的數(shù)據(jù)在存取時(shí)刻是最新的數(shù)據(jù)是最近一段時(shí)間之前得到的。ODS的定義和特點(diǎn)1ODS和數(shù)據(jù)倉庫的異同1.4相同點(diǎn)面向主題的集成的不同點(diǎn)DW是靜態(tài)數(shù)據(jù),而ODS中的數(shù)據(jù)是動態(tài)的、可更新的設(shè)計(jì)目標(biāo)不同,ODS的設(shè)計(jì)目標(biāo)是快速執(zhí)行
4、針對全局信息的少量數(shù)據(jù)的簡單查詢工作,這同數(shù)據(jù)倉庫中的大數(shù)據(jù)量復(fù)雜查詢截然不同。 數(shù)據(jù)內(nèi)容不同,ODS存儲當(dāng)前或者近期的數(shù)據(jù),DW存儲歷史性數(shù)據(jù)。ODS就像你的短期記憶,僅僅記錄你的近期信息,而數(shù)據(jù)倉庫就像長期記憶一樣,存儲相對長久一些的信息 數(shù)據(jù)容量不同,ODS數(shù)據(jù)容量級別較小,DW的數(shù)據(jù)容量很大ODS的定義和特點(diǎn)1ODS的分類1.5ODS類別I 類ODS,與應(yīng)用系統(tǒng)的數(shù)據(jù)延遲為12秒,實(shí)時(shí)或近似實(shí)時(shí) II 類ODS,與應(yīng)用系統(tǒng)的數(shù)據(jù)延遲為24小時(shí) III 類ODS,與應(yīng)用系統(tǒng)的數(shù)據(jù)延遲為1224小時(shí) IV 類ODS,數(shù)據(jù)倉庫中部分決策分析數(shù)據(jù)回流至ODS中不同ODS類別的特點(diǎn)數(shù)據(jù)延遲時(shí)間越
5、短,ODS建設(shè)難度越高。其中I 類ODS的建設(shè)難度最高,建設(shè)成本也是最高的。而且由于I 類ODS的實(shí)時(shí)性,對于技術(shù)的要求與其它類型ODS也有所不同,一般來講需要用到EAI技術(shù),但隨著當(dāng)前企業(yè)對數(shù)據(jù)倉庫的實(shí)時(shí)性要求越來越高,相信I 類ODS會變得越來越重要。通常在企業(yè)應(yīng)用架構(gòu)中,ODS是一個(gè)可選件,但一旦需要用到ODS的功能,那么ODS本身就將變得極為重要。目前應(yīng)用的比較多的是IV 類ODS,因?yàn)橐坏Q策分析結(jié)果加載到ODS中,重要決策信息的高性能聯(lián)機(jī)支持將成為可能。 DB-ODS-DW體系結(jié)構(gòu)2簡單結(jié)構(gòu)2.1應(yīng)用DBDBDBODSDW操作型環(huán)境分析型環(huán)境特點(diǎn):1)ODS的記錄在DB中;2)D
6、W的記錄在ODS中。DB-ODS-DW體系結(jié)構(gòu)2復(fù)雜結(jié)構(gòu)2.2SourceDatabasesHub -Data Extraction,Transformation, loadWarehouseAdmin.ToolsExtract, Transformand LoadDataModelingToolCentralMetadataArchitectedData MartsData Accessand AnalysisCentral Data Ware-house and ODSCentralDataWarehouseMid-TierRDBMSDataMartMid-TierRDBMSDataMar
7、tLocal MetadataLocal MetadataLocal MetadataMetadataExchangeODSOLTP ToolsDataCleansingToolRelationalAppl. PackageLegacyExternalMDBEnd-UserDW ToolsSourceDatabasesHub -Data Extraction,Transformation, loadWarehouseAdmin.ToolsExtract, Transformand LoadDataModelingToolCentralMetadataHub -Data Extraction,T
8、ransformation, loadWarehouseAdmin.ToolsWarehouseAdmin.ToolsExtract, Transformand LoadDataModelingToolDataModelingToolCentralMetadataArchitectedData MartsData Accessand AnalysisCentral Data Ware-house and ODSCentralDataWarehouseMid-TierRDBMSDataMartMid-TierRDBMSDataMartLocal MetadataLocal MetadataLoc
9、al MetadataLocal MetadataLocal MetadataMetadataExchangeODSOLTP ToolsDataCleansingToolRelationalAppl. PackageLegacyExternalDataCleansingToolRelationalAppl. PackageLegacyExternalMDBMDBEnd-UserDW ToolsDB-ODS-DW體系結(jié)構(gòu)2ODS在體系結(jié)構(gòu)中的幾種作用2.3在業(yè)務(wù)系統(tǒng)和數(shù)據(jù)倉庫之間形成一個(gè)隔離層 一般的數(shù)據(jù)倉庫應(yīng)用系統(tǒng)都具有非常復(fù)雜的數(shù)據(jù)來源,這些數(shù)據(jù)存放在不同的地理位置、不同的數(shù)據(jù)庫、不同的應(yīng)用
10、之中,從這些業(yè)務(wù)系統(tǒng)對數(shù)據(jù)進(jìn)行抽取并不是一件容易的事。ODS用于存放從業(yè)務(wù)系統(tǒng)直接抽取出來的數(shù)據(jù),這些數(shù)據(jù)從數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)之間的邏輯關(guān)系上都與業(yè)務(wù)系統(tǒng)基本保持一致,因此在抽取過程中極大降低了數(shù)據(jù)轉(zhuǎn)化的復(fù)雜性,而主要關(guān)注數(shù)據(jù)抽取的接口、數(shù)據(jù)量大小、抽取方式等方面的問題。轉(zhuǎn)移一部分業(yè)務(wù)系統(tǒng)細(xì)節(jié)查詢的功能在數(shù)據(jù)倉庫建立之前,大量的報(bào)表、分析是由業(yè)務(wù)系統(tǒng)直接支持的,在一些比較復(fù)雜的報(bào)表生成過程中,對業(yè)務(wù)系統(tǒng)的運(yùn)行產(chǎn)生相當(dāng)大的壓力。ODS的數(shù)據(jù)從粒度、組織方式等各個(gè)方面都保持了與業(yè)務(wù)系統(tǒng)的一致,那么原來由業(yè)務(wù)系統(tǒng)產(chǎn)生的報(bào)表、細(xì)節(jié)數(shù)據(jù)的查詢自然能夠從ODS中進(jìn)行,從而降低業(yè)務(wù)系統(tǒng)的查詢壓力。DB-ODS-
11、DW體系結(jié)構(gòu)2ODS在體系結(jié)構(gòu)中的幾種作用2.3完成數(shù)據(jù)倉庫中不能完成的一些功能 一般來說,帶有ODS的數(shù)據(jù)倉庫體系結(jié)構(gòu)中,DW層所存儲的數(shù)據(jù)都是進(jìn)行匯總過的數(shù)據(jù),并不存儲每筆交易產(chǎn)生的細(xì)節(jié)數(shù)據(jù),但是在某些特殊的應(yīng)用中,可能需要對交易細(xì)節(jié)數(shù)據(jù)進(jìn)行查詢,這時(shí)就需要把細(xì)節(jié)數(shù)據(jù)查詢的功能轉(zhuǎn)移到ODS來完成,而且ODS的數(shù)據(jù)模型按照面向主題的方式進(jìn)行存儲,可以方便地支持多維分析等查詢功能。 在一個(gè)沒有ODS層的數(shù)據(jù)倉庫應(yīng)用系統(tǒng)體系結(jié)構(gòu)中,數(shù)據(jù)倉庫中存儲的數(shù)據(jù)粒度是根據(jù)需要而確定的,但一般來說,最為細(xì)節(jié)的業(yè)務(wù)數(shù)據(jù)也是需要保留的,實(shí)際上也就相當(dāng)于ODS,但與ODS所不同的是,這時(shí)的細(xì)節(jié)數(shù)據(jù)不是“當(dāng)前、不斷
12、變化的”數(shù)據(jù),而是“歷史的,不再變化的”數(shù)據(jù)。建立ODS3ODS數(shù)據(jù)模型設(shè)計(jì)3.1數(shù)據(jù)調(diào)研 對與業(yè)務(wù)系統(tǒng)關(guān)聯(lián)的數(shù)據(jù)進(jìn)行調(diào)研,弄清楚現(xiàn)有業(yè)務(wù)系統(tǒng)對應(yīng)的數(shù)據(jù)邏輯模型和物理模型確定數(shù)據(jù)范圍 確定數(shù)據(jù)范圍實(shí)際上是對ODS進(jìn)行主題劃分的過程,這種劃分是基于對業(yè)務(wù)系統(tǒng)的調(diào)研的基礎(chǔ)上而進(jìn)行的,并不十分關(guān)心整個(gè)數(shù)據(jù)倉庫系統(tǒng)上端應(yīng)用需求,但是需要把上端應(yīng)用需求與ODS數(shù)據(jù)范圍進(jìn)行驗(yàn)證,以確保應(yīng)用所需的數(shù)據(jù)都已經(jīng)從業(yè)務(wù)系統(tǒng)中抽取出來,并且得到了很好的組織。一般來講,主題的劃分是以業(yè)務(wù)系統(tǒng)的信息模型為依據(jù)的,設(shè)計(jì)者需要綜合各種業(yè)務(wù)系統(tǒng)的信息模型,并進(jìn)行宏觀的歸并,得到企業(yè)范圍內(nèi)的高層數(shù)據(jù)視圖,并加以抽象,劃定幾個(gè)邏
13、輯的數(shù)據(jù)主題范圍。在這個(gè)階段,以ER模型表示數(shù)據(jù)主題關(guān)系最為恰當(dāng)。 建立ODS3ODS數(shù)據(jù)模型設(shè)計(jì)3.1根據(jù)數(shù)據(jù)范圍進(jìn)行進(jìn)一步的數(shù)據(jù)分析和主題定義 在第一步中定義出來了企業(yè)范圍內(nèi)的高層數(shù)據(jù)視圖,以及所收集到的各種業(yè)務(wù)系統(tǒng)的資料,在這一步中,需要對大的數(shù)據(jù)主題進(jìn)行分解,并進(jìn)行主題定義,直到每個(gè)主題能夠直接對應(yīng)一個(gè)主題數(shù)據(jù)模型為止。在這個(gè)階段,將把第一步生成的每個(gè)ER圖中的實(shí)體進(jìn)行分解,分解的結(jié)果仍以ER表示為佳。 建立ODS3ODS數(shù)據(jù)模型設(shè)計(jì)3.1定義主題元素 定義維維名稱,名稱應(yīng)該能夠清晰表示出這個(gè)維的業(yè)務(wù)含義。維成員,也就是這個(gè)維所代表的具體的數(shù)據(jù)維層次,維成員之間的隸屬與包含的層次關(guān)系,
14、每個(gè)層次需要定義名稱定義度量度量名稱,名稱應(yīng)該能夠清晰標(biāo)書這個(gè)度量的業(yè)務(wù)含義 建立ODS3ODS數(shù)據(jù)模型設(shè)計(jì)3.1定義主題元素 定義主題主題名稱和含義,說明該主題主要包含哪些數(shù)據(jù),用于什么分析;主題所包含的維和度量;主題的事實(shí)表,以及事實(shí)表的數(shù)據(jù)。定義粒度主題中事實(shí)表的數(shù)據(jù)粒度說明,這種粒度可以通過對維的層次限制加以說明,也可以通過對事實(shí)表數(shù)據(jù)的業(yè)務(wù)細(xì)節(jié)程度進(jìn)行說明。定義存儲期限主題中事實(shí)表中的數(shù)據(jù)存儲周期。建立ODS3ODS數(shù)據(jù)模型設(shè)計(jì)3.1迭代,歸并維、度量的定義在ODS中,因數(shù)據(jù)來自于多個(gè)系統(tǒng),數(shù)據(jù)主題劃分時(shí)雖然對數(shù)據(jù)概念進(jìn)行了一定程度上的歸并,但具體的業(yè)務(wù)代碼所形成的各個(gè)維、以及維成員
15、等還需要進(jìn)一步進(jìn)行歸并,把概念統(tǒng)一的維定義成一個(gè)維,不允許同一個(gè)維存在不同的實(shí)體表示(象不同的業(yè)務(wù)系統(tǒng)中一樣)。建立ODS3ODS系統(tǒng)設(shè)計(jì)3.2ODS數(shù)據(jù)抽取轉(zhuǎn)換層 數(shù)據(jù)轉(zhuǎn)換層由各種轉(zhuǎn)換工具及抽取程序組成,主要完成從源數(shù)據(jù)系統(tǒng)到ODS系統(tǒng)的數(shù)據(jù)轉(zhuǎn)換、凈化和載入 ODS數(shù)據(jù)訪問中間件 ODS系統(tǒng)中間件的一個(gè)關(guān)鍵組成部分就是網(wǎng)絡(luò)中間件。中間件的主要作用是提供用戶和ODS系統(tǒng)數(shù)據(jù)之間的無縫連接,同時(shí)還提供了系統(tǒng)應(yīng)用程序接口,允許應(yīng)用程序同本地或異地ODS系統(tǒng)進(jìn)行通信。另一方面,在DBODSDW三層結(jié)構(gòu)中,中間件也是將ODS中的信息與DW系統(tǒng)中的信息相關(guān)聯(lián)的一條途徑。建立ODS3ODS系統(tǒng)設(shè)計(jì)3.2物
16、理實(shí)現(xiàn)定義每個(gè)主題的數(shù)據(jù)抽取周期、抽取時(shí)間、抽取方式、數(shù)據(jù)接口,抽取流程和規(guī)則。物理設(shè)計(jì)不僅僅是ODS部分的數(shù)據(jù)庫物理實(shí)現(xiàn),設(shè)計(jì)數(shù)據(jù)庫參數(shù)、操作系統(tǒng)參數(shù)、數(shù)據(jù)存儲設(shè)計(jì)之外,有關(guān)數(shù)據(jù)抽取接口等問題必須清晰定義。ODS案例4帶有ODS的集團(tuán)公司DW結(jié)構(gòu)4.1信息門戶應(yīng)用模塊技術(shù)基礎(chǔ)設(shè)施運(yùn)營系統(tǒng)BI 工具, Data Mining, OLAP,Q+RData Warehouse操作數(shù)據(jù)存儲(ODS)數(shù)據(jù)采集 (ETL)信息交換批量數(shù)據(jù)實(shí)時(shí)數(shù)據(jù)ERPO-CRMHROA業(yè)績考評、預(yù)算管理、資產(chǎn)管理、財(cái)務(wù)分析、投資管理、A-CRM等集團(tuán)公司內(nèi)部信息門戶(EIP)數(shù)據(jù)集市的定義5數(shù)據(jù)集市的產(chǎn)生5.1數(shù)據(jù)集市
17、產(chǎn)生原因靈活性:要求數(shù)據(jù)倉庫能夠滿足所有最終用戶的需求,但是各個(gè)部門業(yè)務(wù)不同,需求側(cè)重點(diǎn)不同,且需求也是不斷變化的。這就要求數(shù)據(jù)倉庫存儲的數(shù)據(jù)具有充分的靈活性,以適應(yīng)各類用戶的查詢和分析性能:最終用戶對信息檢索要求是高性能的,即越快越好。對數(shù)據(jù)倉庫而言,靈活性和性能是一對矛盾體。提高靈活性就要存儲各種歷史數(shù)據(jù),但是一個(gè)特定查詢就要關(guān)聯(lián)很多表,性能就不能保證為了解決這一矛盾,數(shù)據(jù)倉庫中就增加了數(shù)據(jù)集市。數(shù)據(jù)集市存儲為特定用戶需求而預(yù)先計(jì)算好的數(shù)據(jù),從而滿足用戶對性能的要求。數(shù)據(jù)集市產(chǎn)生的另外一個(gè)原因,是數(shù)據(jù)倉庫開發(fā)周期較長,投入較大,規(guī)模較小的企業(yè)無法承擔(dān)。而數(shù)據(jù)集市能夠快速解決某些問題,而投資
18、規(guī)模也比數(shù)據(jù)倉庫小很多。 數(shù)據(jù)集市的定義5數(shù)據(jù)集市定義5.2數(shù)據(jù)集市概念數(shù)據(jù)集市的英文名稱是Data Marts。數(shù)據(jù)集市是一種小型的部門級的數(shù)據(jù)倉庫,主要面向部門級業(yè)務(wù),并且只面向某個(gè)特定的主題,是為滿足特定用戶(一般是部門級別的)的需求而建立的一種分析型環(huán)境。投資規(guī)模比較小,更關(guān)注在數(shù)據(jù)中構(gòu)建復(fù)雜的業(yè)務(wù)規(guī)則來支持功能強(qiáng)大的分析常稱為“小數(shù)據(jù)倉庫”或“部門級數(shù)據(jù)倉庫”數(shù)據(jù)集市的特點(diǎn)6數(shù)據(jù)集市的優(yōu)點(diǎn)6.1優(yōu)點(diǎn)規(guī)模小、靈活,可以按照多種方式來組織,如按特定的應(yīng)用、部門、地域、主題等。投資規(guī)模小、投資回收期短,風(fēng)險(xiǎn)小獨(dú)立數(shù)據(jù)集市的構(gòu)建比較快不同的數(shù)據(jù)集市可以分布在不同的物理平臺上,也可以邏輯地分布
19、在同一物理平臺上。這種靈活性使得數(shù)據(jù)集市可以獨(dú)立地實(shí)施,企業(yè)人員可以快速地獲取信息。數(shù)據(jù)集市的思想同時(shí)提供了分布式數(shù)據(jù)倉庫的思想。如果按照數(shù)據(jù)的地理分布來組織數(shù)據(jù)集市,那么就形成了一個(gè)地理上分布的數(shù)據(jù)倉庫。數(shù)據(jù)集市的特點(diǎn)6數(shù)據(jù)集市的缺點(diǎn)6.2缺點(diǎn)建立數(shù)據(jù)集市的部門是互相隔離的,互相之間不能就標(biāo)準(zhǔn)、流程、知識及經(jīng)驗(yàn)教訓(xùn)進(jìn)行溝通,這將導(dǎo)致大量的重復(fù)勞動及重復(fù)分析。這些部門可能會選擇不同的工具、軟件和硬件,使企業(yè)不得不為支持各種技術(shù)而維持一定數(shù)量的技術(shù)人員,造成成本增加。獨(dú)立數(shù)據(jù)集市,分別讀取業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫中的表,極大地限制了DSS的伸縮能力。如,五個(gè)獨(dú)立的數(shù)據(jù)集市都需要客戶信息,將造成對客戶管理系
20、統(tǒng)的5次數(shù)據(jù)抽取,而數(shù)據(jù)倉庫則只需要抽取一次。數(shù)據(jù)集市一般是為不同的部門建立的,這些數(shù)據(jù)集市沒有進(jìn)行集成,沒有一個(gè)會包含整個(gè)企業(yè)的視圖。因此不同數(shù)據(jù)集市對相同問題的分析可能會產(chǎn)生不同的結(jié)果。數(shù)據(jù)集市與數(shù)據(jù)倉庫的區(qū)別7數(shù)據(jù)集市與數(shù)據(jù)倉庫的比較7.1便于訪問和分析、快速分析處理海量數(shù)據(jù)、數(shù)據(jù)檢索優(yōu)化適度的歷史數(shù)據(jù)大量的歷史數(shù)據(jù)歷史數(shù)據(jù)較大的粒度最小的粒度數(shù)據(jù)粒度部門或特殊的分析主題企業(yè)主題主題部門級企業(yè)級范圍數(shù)據(jù)集市數(shù)據(jù)倉庫對比內(nèi)容單純用數(shù)據(jù)量大小來區(qū)分?jǐn)?shù)據(jù)集市和數(shù)據(jù)倉庫這種判斷方法是片面的尺寸大小不是數(shù)據(jù)集市的主要特征數(shù)據(jù)集市容易建立一個(gè)單純的數(shù)據(jù)集市確實(shí)數(shù)據(jù)倉庫復(fù)雜程度低一些,它只針對某一需要
21、解決的特定商業(yè)問題,但是圍繞數(shù)據(jù)獲取的很多復(fù)雜問題并沒有減少。數(shù)據(jù)集市往往要從多個(gè)數(shù)據(jù)源中提取數(shù)據(jù),過程和數(shù)據(jù)倉庫類似。7關(guān)于數(shù)據(jù)集市的誤區(qū)7.2數(shù)據(jù)集市與數(shù)據(jù)倉庫的區(qū)別獨(dú)立的數(shù)據(jù)集市業(yè)務(wù)系統(tǒng)數(shù)據(jù)集市容易升級到數(shù)據(jù)倉庫數(shù)據(jù)集市針對特殊的業(yè)務(wù)需要,采取特定應(yīng)用的數(shù)據(jù)模型,不可能很容易的伸縮,因此追加數(shù)據(jù)、擴(kuò)展數(shù)據(jù)都將非常困難隨著數(shù)據(jù)集市的增多,只會增加一些信息孤島,仍然不能以整個(gè)企業(yè)的視圖分析數(shù)據(jù)。Inmon的比喻:不可能把大海里的小魚堆在一起就構(gòu)成了一條大鯨魚7關(guān)于數(shù)據(jù)集市的誤區(qū)7.2數(shù)據(jù)集市與數(shù)據(jù)倉庫的區(qū)別數(shù)據(jù)集市的類型8從屬型數(shù)據(jù)集市8.1定義從屬型數(shù)據(jù)集市,是指它的數(shù)據(jù)殺戒來自于企業(yè)級數(shù)
22、據(jù)倉庫,是企業(yè)級數(shù)據(jù)倉庫的子集。各數(shù)據(jù)集市中數(shù)據(jù)的組織、格式和結(jié)構(gòu)在整個(gè)系統(tǒng)中保持一致一般為那些訪問數(shù)據(jù)倉庫十分頻繁的關(guān)鍵業(yè)務(wù)部門建立從屬型數(shù)據(jù)集市,這樣可以更好地提高查詢反應(yīng)速度。數(shù)據(jù)源數(shù)據(jù)倉庫數(shù)據(jù)集市從屬型數(shù)據(jù)集市數(shù)據(jù)集市的類型8獨(dú)立型數(shù)據(jù)集市8.2定義獨(dú)立型數(shù)據(jù)集市,是指它的數(shù)據(jù)直接來源于各操作數(shù)據(jù)環(huán)境,當(dāng)為各個(gè)部門建立相關(guān)數(shù)據(jù)集市后,這些數(shù)據(jù)集市之間相互獨(dú)立,可能具有不同的數(shù)據(jù)存儲類型。許多企業(yè)出于投資方面的考慮,往往建立的是這種類型的數(shù)據(jù)集市。獨(dú)立型數(shù)據(jù)集市數(shù)據(jù)源數(shù)據(jù)集市數(shù)據(jù)集市開發(fā)方法9自上而下方法9.1自上而下方法 對于從屬型數(shù)據(jù)集市,采用自上而下方法首先建立企業(yè)級的數(shù)據(jù)倉庫然后從企業(yè)級數(shù)據(jù)倉庫中為各個(gè)部門抽取必要的數(shù)據(jù)建立部門級的數(shù)據(jù)集市這種方法對于維護(hù)全局?jǐn)?shù)據(jù)的一致性非常有利所有數(shù)據(jù)在進(jìn)入數(shù)據(jù)倉庫之后都進(jìn)行了清洗和整理,而后才分發(fā)到數(shù)據(jù)集市中數(shù)據(jù)集市開發(fā)方法9自上而下方法9.1局部數(shù)據(jù)集市外部數(shù)據(jù)局部數(shù)據(jù)集市操作型數(shù)據(jù)企業(yè)數(shù)據(jù)倉庫數(shù)據(jù)集市開發(fā)方法9自下而上方法9.2自下而上方法 對于獨(dú)立型數(shù)據(jù)集市,采用自下而上方法首先就某一個(gè)特定的主題先做獨(dú)立的數(shù)據(jù)集市當(dāng)數(shù)據(jù)集市達(dá)到一定的規(guī)模,再從各個(gè)數(shù)據(jù)集市進(jìn)行數(shù)據(jù)的再次抽取建立企業(yè)級數(shù)據(jù)倉庫有一定級別的冗余和不一致性不過是一個(gè)切實(shí)可行的方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 質(zhì)量管理在遠(yuǎn)程教育中的應(yīng)用與挑戰(zhàn)
- 跨平臺下的計(jì)算機(jī)安全防護(hù)策略分析與應(yīng)用研究
- 足部按摩對顧客心理放松的影響研究
- 急診科室團(tuán)隊(duì)建設(shè)與合作計(jì)劃
- 重要會議活動保安風(fēng)險(xiǎn)評估與控制計(jì)劃
- 行業(yè)洞察的總結(jié)與實(shí)施策略計(jì)劃
- 工作計(jì)劃規(guī)劃
- 跨界融合與創(chuàng)新驅(qū)動-現(xiàn)代技術(shù)與艾司奧美拉唑藥物開發(fā)之間的聯(lián)系和對比
- 酒店行業(yè)保安服務(wù)的發(fā)展方向計(jì)劃
- 建立高效的工作流與流程計(jì)劃
- DB5101-T 71-2020 成都市電動汽車充電設(shè)施 安全管理規(guī)范
- 2025年七臺河職業(yè)學(xué)院高職單招語文2018-2024歷年參考題庫頻考點(diǎn)含答案解析
- 監(jiān)理人員安全培訓(xùn)考試試卷(答案)
- 2025年北京電子科技職業(yè)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- xxx項(xiàng)目財(cái)務(wù)評價(jià)報(bào)告
- 2024年山東交通職業(yè)學(xué)院高職單招語文歷年參考題庫含答案解析
- 【MOOC】數(shù)據(jù)庫系統(tǒng)(上):模型與語言-哈爾濱工業(yè)大學(xué) 中國大學(xué)慕課MOOC答案
- 高教版2023年中職教科書《語文》(基礎(chǔ)模塊)下冊教案全冊
- HCCDP 云遷移認(rèn)證理論題庫
- 現(xiàn)代交換原理與技術(shù)課件:第5章 分組交換技術(shù)
- 勵(lì)磁系統(tǒng)報(bào)告(共25頁)
評論
0/150
提交評論