版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
6.1數(shù)據(jù)倉庫的基本原理6.2數(shù)據(jù)倉庫系統(tǒng)6.3聯(lián)機(jī)分析處理6.4數(shù)據(jù)倉庫的決策支持第六章數(shù)據(jù)倉庫
6.1數(shù)據(jù)倉庫的基本原理第六章數(shù)據(jù)倉庫
16.1數(shù)據(jù)倉庫的基本原理數(shù)據(jù)倉庫的興起1.“數(shù)據(jù)太多,信息不足”的現(xiàn)狀2.異構(gòu)環(huán)境的數(shù)據(jù)源據(jù)美國《幸?!冯s志所列的全球2000家大公司中已有90%將Internet網(wǎng)絡(luò)和數(shù)據(jù)倉庫這兩項技術(shù)列入企業(yè)計劃。數(shù)據(jù)倉庫是1995年開始盛行起來的。6.1數(shù)據(jù)倉庫的基本原理數(shù)據(jù)倉庫的興起26.1.1數(shù)據(jù)倉庫的概念(1)W.H.Inmon在《建立數(shù)據(jù)倉庫》一書中,對數(shù)據(jù)倉庫的定義為:數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的,不同時間的數(shù)據(jù)集合,用于支持經(jīng)營管理中決策制定過程。6.1.1數(shù)據(jù)倉庫的概念(1)W.H.Inmon在31、數(shù)據(jù)倉庫的概念(2)SAS軟件研究所定義:數(shù)據(jù)倉庫是一種管理技術(shù),旨在通過通暢、合理、全面的信息管理,達(dá)到有效的決策支持。1、數(shù)據(jù)倉庫的概念(2)SAS軟件研究所定義:41、數(shù)據(jù)倉庫的概念
傳統(tǒng)數(shù)據(jù)庫用于事務(wù)處理,也叫操作型處理,是指對數(shù)據(jù)庫聯(lián)機(jī)進(jìn)行日常操作,即對一個或一組記錄的查詢和修改,主要為企業(yè)特定的應(yīng)用服務(wù)的。用戶關(guān)心的是響應(yīng)時間,數(shù)據(jù)的安全性和完整性。
數(shù)據(jù)倉庫用于決策支持,也稱分析型處理,用于決策分析,它是建立決策支持系統(tǒng)(DSS)的基礎(chǔ)。1、數(shù)據(jù)倉庫的概念傳統(tǒng)數(shù)據(jù)庫用于事務(wù)處理,也叫操作型5操作型數(shù)據(jù)(DB數(shù)據(jù))與分析型數(shù)據(jù)(DW數(shù)據(jù))之間的差別為:操作型數(shù)據(jù)(DB數(shù)據(jù))與62、數(shù)據(jù)倉庫特點(diǎn)(1)數(shù)據(jù)倉庫是面向主題的
主題是數(shù)據(jù)歸類的標(biāo)準(zhǔn),每一個主題基本對應(yīng)一個宏觀的分析領(lǐng)域。例如,銀行的數(shù)據(jù)倉庫的主題:客戶DW的客戶數(shù)據(jù)來源:從銀行儲蓄DB、信用卡DB、貸款DB等三個DB中抽取同一客戶的數(shù)據(jù)整理而成。在DW中分析客戶數(shù)據(jù),可決定是否繼續(xù)給予貸款。2、數(shù)據(jù)倉庫特點(diǎn)(1)數(shù)據(jù)倉庫是面向主題的72、數(shù)據(jù)倉庫特點(diǎn)(2)數(shù)據(jù)倉庫是集成的數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之前,必須經(jīng)過加工與集成。對不同的數(shù)據(jù)來源進(jìn)行統(tǒng)一數(shù)據(jù)結(jié)構(gòu)和編碼。統(tǒng)一原始數(shù)據(jù)中的所有矛盾之處,如字段的同名異義,異名同義,單位不統(tǒng)一,字長不一致等。將原始數(shù)據(jù)結(jié)構(gòu)做一個從面向應(yīng)用到面向主題的大轉(zhuǎn)變。2、數(shù)據(jù)倉庫特點(diǎn)(2)數(shù)據(jù)倉庫是集成的82、數(shù)據(jù)倉庫特點(diǎn)(3)數(shù)據(jù)倉庫是穩(wěn)定的數(shù)據(jù)倉庫中包括了大量的歷史數(shù)據(jù)。數(shù)據(jù)經(jīng)集成進(jìn)入數(shù)據(jù)倉庫后是極少或根本不更新的。(4)數(shù)據(jù)倉庫是隨時間變化的數(shù)據(jù)倉庫內(nèi)的數(shù)據(jù)時限在5~10年,故數(shù)據(jù)的鍵碼包含時間項,標(biāo)明數(shù)據(jù)的歷史時期,這適合DSS進(jìn)行時間趨勢分析。而數(shù)據(jù)庫只包含當(dāng)前數(shù)據(jù),即存取某一時間的正確的有效的數(shù)據(jù)。2、數(shù)據(jù)倉庫特點(diǎn)(3)數(shù)據(jù)倉庫是穩(wěn)定的92、數(shù)據(jù)倉庫特點(diǎn)
大型DW是一個TB(1000GB)級數(shù)據(jù)庫問題(一般為10GB級相當(dāng)于一般數(shù)據(jù)庫100MB的100倍)需要一個巨大的硬件平臺需要一個并行的數(shù)據(jù)庫系統(tǒng)最好的數(shù)據(jù)倉庫是大的和昂貴的。2、數(shù)據(jù)倉庫特點(diǎn)大型DW是一個TB(1000GB)級10
近期基本數(shù)據(jù):是最近時期的業(yè)務(wù)數(shù)據(jù),是數(shù)據(jù)倉庫用戶最感興趣的部分,數(shù)據(jù)量大。
歷史基本數(shù)據(jù):近期基本數(shù)據(jù)隨時間的推移,由數(shù)據(jù)倉庫的時間控制機(jī)制轉(zhuǎn)為歷史基本數(shù)據(jù)。
輕度綜合數(shù)據(jù):是從近期基本數(shù)據(jù)中提取出的,這層數(shù)據(jù)是按時間段選取,或者按數(shù)據(jù)屬性(attributes)和內(nèi)容(contents)進(jìn)行綜合。
高度綜合數(shù)據(jù)層:這一層的數(shù)據(jù)是在輕度綜合數(shù)據(jù)基礎(chǔ)上的再一次綜合,是一種準(zhǔn)決策數(shù)據(jù)。6.1.2數(shù)據(jù)倉庫結(jié)構(gòu)近期基本數(shù)據(jù):是最近時期的業(yè)務(wù)數(shù)據(jù),是數(shù)據(jù)倉11專家與決策支持系統(tǒng)課程12數(shù)據(jù)倉庫工作范圍和成本常常是巨大的。開發(fā)數(shù)據(jù)倉庫是代價很高、時間較長的大項目。提供更緊密集成的數(shù)據(jù)集市就應(yīng)運(yùn)產(chǎn)生。目前,全世界對數(shù)據(jù)倉庫總投資的一半以上均集中在數(shù)據(jù)集市上。6.1.3數(shù)據(jù)集市(DataMarts)6.1.3數(shù)據(jù)集市(DataMarts)13數(shù)據(jù)集市(DataMarts)是一種更小、更集中的數(shù)據(jù)倉庫,為公司提供分析商業(yè)數(shù)據(jù)的一條廉價途徑。數(shù)據(jù)集市是指具有特定應(yīng)用的數(shù)據(jù)倉庫,主要針對某個應(yīng)用或者具體部門級的應(yīng)用,支持用戶獲得競爭優(yōu)勢或者找到進(jìn)入新市場的具體解決方案。數(shù)據(jù)集市概念數(shù)據(jù)集市概念14獨(dú)立數(shù)據(jù)集市(IndependentDataMart)從屬數(shù)據(jù)集市(DependentDataMart)數(shù)據(jù)集市的種類獨(dú)立數(shù)據(jù)集市(IndependentDataMart)數(shù)151、規(guī)模是小的2、特定的應(yīng)用3、面向部門4、由業(yè)務(wù)部門定義,設(shè)計和開發(fā)5、由業(yè)務(wù)部門管理和維護(hù)6、快速實現(xiàn)7、購買較便宜8、投資快速回收9、工具集的緊密集成10、更詳細(xì)的、預(yù)先存在的數(shù)據(jù)倉庫的摘要子集11、可升級到完整的數(shù)據(jù)倉庫數(shù)據(jù)集市的特性1、規(guī)模是小的數(shù)據(jù)集市的特性16
元數(shù)據(jù)是數(shù)據(jù)倉庫的重要組成部分。
元數(shù)據(jù)描述了數(shù)據(jù)倉庫的數(shù)據(jù)和環(huán)境,即關(guān)于數(shù)據(jù)的數(shù)據(jù)(metadata)
元數(shù)據(jù)包括四種元數(shù)據(jù)。6.1.4元數(shù)據(jù)元數(shù)據(jù)是數(shù)據(jù)倉庫的重要組成部分。6.1.4元數(shù)據(jù)17元數(shù)據(jù)是現(xiàn)有的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)源的描述信息。元數(shù)據(jù)是對不同平臺上的數(shù)據(jù)源的物理結(jié)構(gòu)和含義的描述。具體為:(1)數(shù)據(jù)源中所有物理數(shù)據(jù)結(jié)構(gòu),包括所有的數(shù)據(jù)項及數(shù)據(jù)類型。(2)所有數(shù)據(jù)項的業(yè)務(wù)定義。(3)每個數(shù)據(jù)項更新的頻率,以及由誰或那個過程更新的說明。(4)每個數(shù)據(jù)項的有效值。1、關(guān)于數(shù)據(jù)源的元數(shù)據(jù)元數(shù)據(jù)是現(xiàn)有的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)源的描述信息。元數(shù)據(jù)是對不同平臺18
數(shù)據(jù)倉庫的數(shù)據(jù)模型是星型模型。通常企業(yè)數(shù)據(jù)模型被用作建立倉庫數(shù)據(jù)模型的起始點(diǎn),再對模型加以修改和變換。2、關(guān)于數(shù)據(jù)模型的元數(shù)據(jù)2、關(guān)于數(shù)據(jù)模型的元數(shù)據(jù)19元數(shù)據(jù)是數(shù)據(jù)源與數(shù)據(jù)倉庫數(shù)據(jù)間的映射。當(dāng)數(shù)據(jù)源中的一個數(shù)據(jù)項與數(shù)據(jù)倉庫建立了映射關(guān)系,就應(yīng)該記下這些數(shù)據(jù)項發(fā)生的任何變換或變動。即用元數(shù)據(jù)反映數(shù)據(jù)倉庫中的數(shù)據(jù)項是從哪個特定的數(shù)據(jù)源填充的,經(jīng)過那些轉(zhuǎn)換,變換和加載過程。3、關(guān)于數(shù)據(jù)倉庫映射的元數(shù)據(jù)元數(shù)據(jù)是數(shù)據(jù)源與數(shù)據(jù)倉庫數(shù)據(jù)間的映射。3、關(guān)于數(shù)據(jù)倉庫映射的20這類元數(shù)據(jù)是數(shù)據(jù)倉庫中信息的使用情況描述。數(shù)據(jù)倉庫的用戶最關(guān)心的是兩類元數(shù)據(jù):
(1)元數(shù)據(jù)告訴數(shù)據(jù)倉庫中有什么數(shù)據(jù),它們從哪里來。即如何按主題查看數(shù)據(jù)倉庫的內(nèi)容。(2)元數(shù)據(jù)提供已有的可重復(fù)利用的查詢語言信息。如果某個查詢能夠滿足他們的需求,或者與他們的愿望相似,他們就可以再次使用那些查詢而不必從頭開始編程。關(guān)于數(shù)據(jù)倉庫使用的元數(shù)據(jù)能幫助用戶到數(shù)據(jù)倉庫查詢所需要的信息,用于解決企業(yè)問題。4、關(guān)于數(shù)據(jù)倉庫使用的元數(shù)據(jù)這類元數(shù)據(jù)是數(shù)據(jù)倉庫中信息的使用情況描述。4、關(guān)于數(shù)216.2數(shù)據(jù)倉庫系統(tǒng)
6.2.1數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)
數(shù)據(jù)倉庫系統(tǒng)由數(shù)據(jù)倉庫(DW)、倉庫管理和分析工具三部分組成。6.2數(shù)據(jù)倉庫系統(tǒng)6.2.1數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)221、數(shù)據(jù)倉庫管理系統(tǒng)(1)定義部分
用于定義和建立數(shù)據(jù)倉庫系統(tǒng)。它包括:(1)設(shè)計和定義數(shù)據(jù)倉庫的數(shù)據(jù)庫(2)定義數(shù)據(jù)來源(3)確定從源數(shù)據(jù)向數(shù)據(jù)倉庫復(fù)制數(shù)據(jù)時的清理和增強(qiáng)規(guī)則(2)數(shù)據(jù)獲取部分
該部件把數(shù)據(jù)從源數(shù)據(jù)中提取出來,依定義部件的規(guī)則,抽取、轉(zhuǎn)化和裝載數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫。
1、數(shù)據(jù)倉庫管理系統(tǒng)(1)定義部分23(3)管理部分
它用于管理數(shù)據(jù)倉庫的工作,包括:(1)對數(shù)據(jù)倉庫中數(shù)據(jù)的維護(hù)(2)把倉庫數(shù)據(jù)送出給分散的倉庫服務(wù)器或DSS用戶(3)對倉庫數(shù)據(jù)的安全、歸檔、備份、恢復(fù)等處理工作1、數(shù)據(jù)倉庫管理系統(tǒng)(3)管理部分1、數(shù)據(jù)倉庫管理系統(tǒng)24(4)信息目錄部件(元數(shù)據(jù))
數(shù)據(jù)倉庫的目錄數(shù)據(jù)是元數(shù)據(jù),由三部分組成:
技術(shù)目錄:由定義部件生成,關(guān)于數(shù)據(jù)源、目標(biāo)、清理規(guī)則、變換規(guī)則以及數(shù)據(jù)源和倉庫之間的映象信息。
業(yè)務(wù)目錄:由倉庫管理員生成,關(guān)于倉庫數(shù)據(jù)的來源及當(dāng)前值;預(yù)定義的查詢和報表細(xì)節(jié);合法性要求等。
信息引導(dǎo)器:使用戶容易訪問倉庫數(shù)據(jù)。利用固定查詢或建立新的查詢,生成暫時的或永久的倉庫數(shù)據(jù)集合的能力等。1、數(shù)據(jù)倉庫管理系統(tǒng)(4)信息目錄部件(元數(shù)據(jù))1、數(shù)據(jù)倉庫管理系統(tǒng)25分析工具集分兩類工具:(1)查詢工具數(shù)據(jù)倉庫的查詢不是指對記錄級數(shù)據(jù)的查詢,而是指對分析要求的查詢。一般包含:
可視化工具:以圖形化方式展示數(shù)據(jù),可以幫助了解數(shù)據(jù)的結(jié)構(gòu),關(guān)系以及動態(tài)性。2、數(shù)據(jù)倉庫工具集分析工具集分兩類工具:2、數(shù)據(jù)倉庫工具集26多維分析工具(OLAP工具):通過對信息的多種可能的觀察形式進(jìn)行快速、一致和交互性的存取,這樣便利用戶對數(shù)據(jù)進(jìn)行深入的分析和觀察。多維數(shù)據(jù)的每一維代表對數(shù)據(jù)的一個特定的觀察視角,如時間、地域、業(yè)務(wù)等。2、數(shù)據(jù)倉庫工具集2、數(shù)據(jù)倉庫工具集27(2)數(shù)據(jù)挖掘工具從大量數(shù)據(jù)中挖掘具有規(guī)律性知識,需要利用數(shù)據(jù)挖掘(DataMining)工具。2、數(shù)據(jù)倉庫工具集(2)數(shù)據(jù)挖掘工具2、數(shù)據(jù)倉庫工具集283、數(shù)據(jù)倉庫的運(yùn)行結(jié)構(gòu)
數(shù)據(jù)倉庫應(yīng)用是一個典型的客戶/服務(wù)器(C/S)結(jié)構(gòu)形式。數(shù)據(jù)倉庫采用服務(wù)器結(jié)構(gòu),客戶端所做的工作有:客戶交互、格式化查詢、結(jié)果顯示、報表生成等。
服務(wù)器端完成各種輔助決策的SQL查詢、復(fù)雜的計算和各類綜合功能等?,F(xiàn)在,越來越普通的一種形式是三層C/S結(jié)構(gòu)形式,即在客戶與數(shù)據(jù)倉庫服務(wù)器之間增加一個多維數(shù)據(jù)分析(OLAP)服務(wù)器。3、數(shù)據(jù)倉庫的運(yùn)行結(jié)構(gòu)數(shù)據(jù)倉庫應(yīng)用是一個典型的客戶/29
OLAP服務(wù)器將加強(qiáng)和規(guī)范化決策支持的服務(wù)工作,集中和簡化了原客戶端和數(shù)據(jù)倉庫服務(wù)器的部分工作,降低了系統(tǒng)數(shù)據(jù)傳輸量。這種結(jié)構(gòu)形式工作效率更高。三層C/S結(jié)構(gòu)OLAP服務(wù)器將加強(qiáng)和規(guī)范化決策支持的服務(wù)工30
數(shù)據(jù)倉庫存儲采用多維數(shù)據(jù)模型。
維就是相同類數(shù)據(jù)的集合。例如:商店的集合是一維,時間的集合是一維,商品的集合是一維;每一個商店、每一段時間、每一種商品就是某一維的一個成員;每一個銷售事實由一個特定的商品、一個特定的時間、一個特定的商品組成。兩維表,如通常的電子表格。三維構(gòu)成立方體,若再增加一維,則圖形很難想象,也不容易在屏幕上畫出來。
6.2.2數(shù)據(jù)倉庫的存儲數(shù)據(jù)倉庫存儲采用多維數(shù)據(jù)模型。6.2.231數(shù)據(jù)倉庫是以多維表型的“維表—事實表”結(jié)構(gòu)形式組織的,共有三種形式:1、星型模型大多數(shù)的數(shù)據(jù)倉庫都采用“星型模型”。
星型模型是由“事實表”(大表)以及多個“維表”(小表)所組成?!笆聦嵄怼敝写娣糯罅筷P(guān)于企業(yè)的事實數(shù)據(jù)(數(shù)量數(shù)據(jù))。星型模型數(shù)據(jù)如下圖:數(shù)據(jù)倉庫是以多維表型的“維表—事實表”結(jié)構(gòu)形式組32專家與決策支持系統(tǒng)課程33
2、雪花模型雪花模型是對星型模型的擴(kuò)展,雪花模型對星型模型的維表進(jìn)一步層次化,原來的各維表可能被擴(kuò)展為小的事實表,形成一些局部的“層次”區(qū)域。它的優(yōu)點(diǎn)是最大限度地減少數(shù)據(jù)存儲量,以及把較小的維表聯(lián)合在一起來改善查詢性能。在上面星型模型的數(shù)據(jù)中,對“產(chǎn)品表”“日期表”“地區(qū)表”進(jìn)行擴(kuò)展形成雪花模型數(shù)據(jù)見下圖。
2、雪花模型34專家與決策支持系統(tǒng)課程353、星網(wǎng)模型
星網(wǎng)模型是將多個星型模型連接起來形成網(wǎng)狀結(jié)構(gòu)。多個星型模型通過相同的維,如時間維,連接多個事實表。3、星網(wǎng)模型36
聯(lián)機(jī)分析處理(OnLineAnalyticalProcessing,OLAP)的概念最早是由關(guān)系數(shù)據(jù)庫之父E.F.Codd于1993年提出的。在數(shù)據(jù)倉庫系統(tǒng)中,聯(lián)機(jī)分析處理是重要的數(shù)據(jù)分析工具。
OLAP的基本思想是從多方面和多角度以多維的形式來觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。6.3聯(lián)機(jī)分析處理聯(lián)機(jī)分析處理(OnLineAnalytic376.3.1基本概念
OLAP是在OLTP的基礎(chǔ)上發(fā)展起來的。
OLTP是以數(shù)據(jù)庫為基礎(chǔ)的,面對的是操作人員和低層管理人員,對基本數(shù)據(jù)的查詢和增、刪、改等進(jìn)行處理。
OLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的數(shù)據(jù)分析處理。它有兩個特點(diǎn):一是在線性(OnLine),由客戶機(jī)/服務(wù)器這種體系結(jié)構(gòu)來完成的;二是多維分析,這也是OLAP的核心所在。6.3.1基本概念OLAP是在OLTP的基礎(chǔ)上發(fā)381、OLAP的定義
聯(lián)機(jī)分析處理是共享多維信息的快速分析。它體現(xiàn)了四個特征:(1)快速性:用戶對OLAP的快速反應(yīng)能力有很高的要求。(2)可分析性:OLAP系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)計分析。(3)多維性:系統(tǒng)必須提供對數(shù)據(jù)分析的多維視圖和分析。(4)信息性:OLAP系統(tǒng)應(yīng)能及時獲得信息,并且管理大容量的信息1、OLAP的定義聯(lián)機(jī)分析處理是共享多維39
1993年,E.F.Codd提出OLAP的12條準(zhǔn)則,其主要的準(zhǔn)則有:多維數(shù)據(jù)分析;客戶/服務(wù)器結(jié)構(gòu);多用戶支持;一致的報表性能等。
2、OLAP準(zhǔn)則1993年,E.F.Codd提出OLAP的12條準(zhǔn)則403.多維概念視圖企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的概念模型也應(yīng)是多維的。用戶可以對多維數(shù)據(jù)模型進(jìn)行切片、切塊、旋轉(zhuǎn)坐標(biāo)或進(jìn)行多維的聯(lián)合(概括和聚集)分析。3.多維概念視圖企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的414.穩(wěn)定的報表性能
報表操作不應(yīng)隨維數(shù)增加而削弱,即當(dāng)數(shù)據(jù)維數(shù)和數(shù)據(jù)的綜合層次增加時,提供的報表能力和響應(yīng)速度不應(yīng)該有明顯的降低。
4.穩(wěn)定的報表性能報表操作不應(yīng)隨維數(shù)增加而削弱,即425.客戶/服務(wù)器體系結(jié)構(gòu)
OLAP是建立在客戶/服務(wù)器體系結(jié)構(gòu)上的。要求多維數(shù)據(jù)庫服務(wù)器能夠被不同的應(yīng)用和工具所訪問。5.客戶/服務(wù)器體系結(jié)構(gòu)OLAP是建立在客戶/服務(wù)438.多用戶支持
當(dāng)多個用戶要在同一分析模式上并行工作,需要這些功能的支持。
11.靈活的報表生成
報表必須充分反映數(shù)據(jù)分析模型的多維特征,并可按用戶需要的方式來顯示它。8.多用戶支持44OLAP是針對特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析。
(1)變量:變量是數(shù)據(jù)的實際意義,即描述數(shù)據(jù)“是什么”。
(2)維:維是人們觀察數(shù)據(jù)的特定角度。如產(chǎn)品維、顧客維、時間維等。
(3)維的層次:數(shù)據(jù)的細(xì)節(jié)不同程度為維的層次。如日、月、季、年是時間維的層次。
(4)維成員:維的一個取值稱為該維的一個維成員。如“某年某月某日”是時間維的一個成員。
3、OLAP的基本概念OLAP是針對特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析。3、OLAP45(5)多維數(shù)組:一個多維數(shù)組可以表示為:(維1,維2,……,維n,變量)
一個5維的結(jié)構(gòu),即(產(chǎn)品,地區(qū),時間,銷售渠道,銷售額)。(6)數(shù)據(jù)單元(單元格):多維數(shù)組的取值稱為數(shù)據(jù)單元。如:5維數(shù)據(jù)單元(牙膏,上海,1998年12月,批發(fā),銷售額為100000)。
3、OLAP的基本概念(5)多維數(shù)組:一個多維數(shù)組可以表示為:3、OLAP的基本概46(1)OLTPOLTP是低層人員利用計算機(jī)網(wǎng)絡(luò)對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行查詢、增、刪、改等操作,以完成事務(wù)處理工作。OLTP利用數(shù)據(jù)庫快速地處理具體業(yè)務(wù)。OLTP應(yīng)用要求多個查詢并行。
4、OLAP與OLTP的關(guān)系與比較(1)OLTP4、OLAP與OLTP的關(guān)系與比較47(2)OLAPOLAP是高層人員對數(shù)據(jù)倉庫進(jìn)行信息分析處理。①存取大量的數(shù)據(jù)②包含聚集的數(shù)據(jù)③按層次對比不同時間周期的聚集數(shù)據(jù)④以不同的方式來表現(xiàn)數(shù)據(jù)⑤要包含數(shù)據(jù)元素之間的復(fù)雜的計算⑥能夠快速的響應(yīng)用戶的查詢
4、OLAP與OLTP的關(guān)系與比較(2)OLAP4、OLAP與OLTP的關(guān)系與比較48(3)OLAP與OLTP對比(對比表)OLTPOLAP數(shù)據(jù)庫數(shù)據(jù)數(shù)據(jù)倉庫數(shù)據(jù)細(xì)節(jié)性數(shù)據(jù)綜合性數(shù)據(jù)當(dāng)前數(shù)據(jù)歷史數(shù)據(jù)一次性處理的數(shù)據(jù)量小一次處理的數(shù)據(jù)量大對響應(yīng)時間要求高響應(yīng)時間合理用戶數(shù)量大用戶相對較少面向應(yīng)用,事務(wù)驅(qū)動面向分析,分析驅(qū)動(3)OLAP與OLTP對比(對比表)OLTPOLAP數(shù)據(jù)庫496.3.2OLAP的數(shù)據(jù)組織
MOLAP和ROLAP是OLAP的兩種具體形式:
ROLAP是基于關(guān)系數(shù)據(jù)庫存儲方式建立的OLAP。多維數(shù)據(jù)映射成平面型的關(guān)系表。采用星型模型。6.3.2OLAP的數(shù)據(jù)組織MOL50
MOLAP是基于多維數(shù)據(jù)庫存儲方式建立的OLAP;表現(xiàn)為“超立方”結(jié)構(gòu),類似于多維數(shù)組的結(jié)構(gòu)。在分析中,需要“旋轉(zhuǎn)”數(shù)據(jù)立方體以及“切片”、“切塊”等操作。MOLAP是基于多維數(shù)據(jù)庫存儲方式建立的OLAP;51MOLAP和ROLAP的對比表MOLAPROLAP固定維可變維維交叉計算多維視圖行級計算超大型數(shù)據(jù)庫讀-寫應(yīng)用維數(shù)據(jù)變化速度快數(shù)據(jù)集市數(shù)據(jù)倉庫MOLAP和ROLAP的對比表MOLAPROLAP固定維可變52OLAP多維數(shù)據(jù)分析例如,以“產(chǎn)品、城市、時間”三維數(shù)據(jù),如圖6.3.3OLAP的決策支持OLAP多維數(shù)據(jù)分析6.3.3OLAP的決策支持531、基本功能:切片和切塊
對三維數(shù)據(jù),通過“切片”,分別從城市和產(chǎn)品等不同的角度觀察銷售情況:
1、基本功能:切片和切塊對三維數(shù)據(jù),通過“切片”,54鉆取鉆?。豪?,1995年各部門銷售收入表如下:鉆取鉆?。豪?,1995年各部門銷售收入表如下:55對時間維進(jìn)行下鉆操作,獲得新表如下:鉆取(續(xù))對時間維進(jìn)行下鉆操作,獲得新表如下:鉆?。ɡm(xù))56旋轉(zhuǎn)前的數(shù)據(jù)旋轉(zhuǎn)旋轉(zhuǎn)前的數(shù)據(jù)旋轉(zhuǎn)57旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)(續(xù))旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)(續(xù))58旋轉(zhuǎn)后再切片旋轉(zhuǎn)后再切片592、廣義OLAP功能
1、基本代理操作
“代理”是一些智能性代理,當(dāng)系統(tǒng)處于某種特殊狀態(tài)時提醒分析員。(1)示警報告定義一些條件,一但條件滿足,系統(tǒng)會提醒分析員去做分析。如每日報告完成或月定貨完成等通知分析員作分析。
(2)異常報告當(dāng)超出邊界條件時提醒分析員。如銷售情況已超出預(yù)定義閾值的上限或下限時提醒分析員。2、廣義OLAP功能1、基本代理操作60
2、計算能力計算引擎用于特定需求的計算或某種復(fù)雜計算。
3、模型計算增加模型,如增加系統(tǒng)優(yōu)化、統(tǒng)計分析、趨勢分析等模型,以提高決策分析能力。
2、廣義OLAP功能2、計算能力2、廣義OLAP功能61假設(shè)有一個5維數(shù)據(jù)模型,5個維分別為:商店,方案,部門,時間,銷售。1.三維表查詢在指定“商店=ALL,方案=現(xiàn)有”情況的三維表(行為部門,列為時間和銷售量)6.3.4、OLAP實例
假設(shè)有一個5維數(shù)據(jù)模型,5個維分別為:商店,方案62
19941995%增長率銷售量利潤增長%銷售量利潤增長%銷售量利潤增長服裝234,67027.2381,10221.562.4(20.0)家具62,54833.866,00531.15.6(8.0)汽車375,09822.4325,40227.2(13.2)21.4所有其它202,38821.3306,67721.750.71.9指定商店、方案后的三維表
19941995%增長率銷售量利潤增長%銷售量利潤增長%銷63
19941995%增長率銷售利潤增長%銷售利潤增長%銷售利潤增長汽車375,09822.4325,40227.2(13.2)21.4維修195,05114.2180,78615.0(7.3)5.6附件116,28043.9122,54547.55.38.2音樂63,7678.222,07114.2(63.4)7.3
2、向下鉆取對汽車部門向下鉆取出具體項目的銷售情況和利潤增長情況。
19941995%增長率銷售利潤增長%銷售利潤增長%銷售利64
1995銷售量服裝381,102家具66,005汽車325,402所有其它306,6773、切片表切片(Slice)操作是除去一些列或行不顯示
1995銷售量服裝381,102家具66,005汽車32565
1995銷售量現(xiàn)有計劃差量差量%服裝381,102350,00031.18.9家具66,00569,000(2,995)(4.3)汽車325,402300,00025,4028.5所有其它306,677350,000(44,322)12.74、旋轉(zhuǎn)表這次旋轉(zhuǎn)操作得到1995年的交叉表方案為:現(xiàn)有、計劃、差量、差量%。
1995銷售量現(xiàn)有計劃差量差量%服裝381,102350,66
6.4.1數(shù)據(jù)倉庫的開發(fā)1、數(shù)據(jù)倉庫規(guī)劃
①數(shù)據(jù)倉庫開發(fā)的范圍怎樣?
②要解決的業(yè)務(wù)問題是什么?③開發(fā)的數(shù)據(jù)倉庫的決策支持能力是什么?6.4數(shù)據(jù)倉庫的決策支持及實例6.4.1數(shù)據(jù)倉庫的開發(fā)6.4數(shù)據(jù)倉庫的決策支持及實例67決策者的需求:對信息的需求對業(yè)務(wù)過程的需求對數(shù)據(jù)訪問的需求2、定義體系結(jié)構(gòu)決策者的需求:2、定義體系結(jié)構(gòu)68確定體系結(jié)構(gòu)(1)來源:數(shù)據(jù)應(yīng)該來自于什么DBMS的源數(shù)據(jù)?(2)傳輸:數(shù)據(jù)通過什么樣的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)傳送過來?(3)目的地:數(shù)據(jù)發(fā)送到數(shù)據(jù)倉庫的什么硬件環(huán)境?(4)元數(shù)據(jù):確定存儲和訪問數(shù)據(jù)的元數(shù)據(jù)。(5)變換:編制數(shù)據(jù)抽取、變換、裝載的程序。(6)訪問:最終用戶怎樣才能查詢數(shù)據(jù)?
確定體系結(jié)構(gòu)(1)來源:數(shù)據(jù)應(yīng)該來自于什么DBMS的源數(shù)據(jù)69(1)主題域分析
確定所需數(shù)據(jù)的范圍和內(nèi)容。并建立數(shù)據(jù)倉庫的數(shù)據(jù)模型:主題域范圍數(shù)據(jù)倉庫的數(shù)據(jù)模型(2)物理數(shù)據(jù)庫設(shè)計
數(shù)據(jù)的實際存儲設(shè)計3、數(shù)據(jù)倉庫設(shè)計(1)主題域分析3、數(shù)據(jù)倉庫設(shè)計70
(1)確定源數(shù)據(jù)、檢查其完整性,進(jìn)行評價。(2)完成源數(shù)據(jù)變換到目標(biāo)數(shù)據(jù)倉庫中去。4、源系統(tǒng)分析與數(shù)據(jù)變換設(shè)計(1)確定源數(shù)據(jù)、檢查其完整性,進(jìn)行評價。4、源系統(tǒng)分71
完成數(shù)據(jù)加載;評審;元數(shù)據(jù)加載;系統(tǒng)測試5、建立數(shù)據(jù)倉庫完成數(shù)據(jù)加載;評審;元數(shù)據(jù)加載;系統(tǒng)測試5、建立數(shù)據(jù)72提供給用戶訪問的形式:(1)使用現(xiàn)有的特定工具;(2)開發(fā)一個最終用戶訪問程序。6、用戶訪問方法的設(shè)計和開發(fā)提供給用戶訪問的形式:6、用戶訪問方法的設(shè)計和開發(fā)736.4.2數(shù)據(jù)倉庫的決策支持美國著名的NCR數(shù)據(jù)倉庫公司對數(shù)據(jù)倉庫總結(jié)5種決策支持能力。
1、報表(“發(fā)生了什么”)2、隨機(jī)分析(“為什么會發(fā)生”)3、預(yù)測(“將要發(fā)生什么”)4、實時決策(“正在發(fā)生什么”)5、事件觸發(fā)的自動決策(“希望發(fā)生什么”)6.4.2數(shù)據(jù)倉庫的決策支持美國著名的NCR數(shù)據(jù)倉庫公741、報表數(shù)據(jù)倉庫所面臨的最大挑戰(zhàn)是數(shù)據(jù)集成。傳統(tǒng)的環(huán)境經(jīng)常有上百個數(shù)據(jù)源,每一數(shù)據(jù)源都有各自定義的標(biāo)準(zhǔn)和實施技術(shù)。建立的數(shù)據(jù)倉庫是通過收集各種來源的數(shù)據(jù),來回答預(yù)先設(shè)置的一些問題,告訴決策者“發(fā)生了什么”。它為以后數(shù)據(jù)倉庫的發(fā)展奠定了基礎(chǔ)。
1、報表數(shù)據(jù)倉庫所面臨的最大挑戰(zhàn)是數(shù)據(jù)集成。傳統(tǒng)的環(huán)752、隨機(jī)分析
數(shù)據(jù)倉庫應(yīng)用的第二種決策支持是,從“發(fā)生了什么”轉(zhuǎn)向“為什么會發(fā)生”。分析活動就是了解報表數(shù)據(jù)的涵義,需要更多更詳細(xì)的數(shù)據(jù)進(jìn)行各種角度的分析。在第二階段的數(shù)據(jù)倉庫主要用于隨機(jī)分析。
2、隨機(jī)分析數(shù)據(jù)倉庫應(yīng)用的第二種決策支持是,從“發(fā)763、預(yù)測
數(shù)據(jù)倉庫的第三種決策支持是幫助決策者來預(yù)測未來,回答“將要發(fā)生什么”。數(shù)據(jù)倉庫需要利用歷史資料創(chuàng)建預(yù)測模型。
3、預(yù)測數(shù)據(jù)倉庫的第三種決策支持是幫助決策者來預(yù)測774、實時決策
數(shù)據(jù)倉庫的第4種決策支持是企業(yè)需要準(zhǔn)確了解“正在發(fā)生什么”,從而需要建立動態(tài)數(shù)據(jù)倉庫(實時數(shù)據(jù)庫),用于支持戰(zhàn)術(shù)型決策,即實時決策。有效地解決當(dāng)前的實際問題。
第1到第3種決策支持的數(shù)據(jù)倉庫都以支持企業(yè)內(nèi)部戰(zhàn)略性決策為重點(diǎn),幫助企業(yè)制定發(fā)展戰(zhàn)略。
第4種決策支持側(cè)重在戰(zhàn)術(shù)性決策支持。
動態(tài)數(shù)據(jù)倉庫能夠逐項產(chǎn)品、逐個店鋪、逐秒地作出最佳決策支持。4、實時決策數(shù)據(jù)倉庫的第4種決策支持是企業(yè)需要準(zhǔn)確了785、事件觸發(fā)的自動決策
數(shù)據(jù)倉庫的第5種決策支持是由事件觸發(fā),利用動態(tài)數(shù)據(jù)庫自動決策,達(dá)到“希望發(fā)生什么”。例如,電子貨架標(biāo)簽技術(shù)結(jié)合動態(tài)數(shù)據(jù)倉庫,可以幫助企業(yè)按照自己的意愿實現(xiàn)復(fù)雜的價格管理自動化,以便以最低的損耗售出最多的存貨。5、事件觸發(fā)的自動決策數(shù)據(jù)倉庫的第5種決策支持是由事796.4.3數(shù)據(jù)倉庫應(yīng)用實例
NCR公司成功地開發(fā)了很多實際數(shù)據(jù)倉庫系統(tǒng),在此介紹一例典型的數(shù)據(jù)倉庫系統(tǒng)。實例:金融業(yè)數(shù)據(jù)倉庫解決方案
數(shù)據(jù)倉庫是金融銀行機(jī)構(gòu)實現(xiàn)客戶關(guān)系管理(CustomerRelationshipManagement)的核心技術(shù),也是金融銀行業(yè)競爭優(yōu)勢的來源,主要的應(yīng)用業(yè)務(wù)部門為信用卡部、信貸部、市場部和零售業(yè)務(wù)部等,應(yīng)用領(lǐng)域是以客戶為中心的的分銷渠道管理、客戶利潤分析、客戶關(guān)系優(yōu)化、風(fēng)險評估和管理。6.4.3數(shù)據(jù)倉庫應(yīng)用實例NCR公司成功地開發(fā)了80
銀行只有通過以客戶為中心(CustomerCentric)的數(shù)據(jù)倉庫決策支持系統(tǒng),才能使用科學(xué)的方法實現(xiàn)個性化服務(wù)。數(shù)據(jù)倉庫系統(tǒng)存放每一位客戶同銀行往來的詳細(xì)的歷史交易明細(xì)數(shù)據(jù),對客戶有統(tǒng)一的視圖。能幫助銀行業(yè)務(wù)用戶以科學(xué)的手段快速地分析、模擬和預(yù)測客戶的個性化需求,進(jìn)而設(shè)計符合客戶需求的產(chǎn)品或服務(wù)。通過客戶喜好的渠道完成交易,是增強(qiáng)商業(yè)銀行競爭能力最有效的手段。
銀行只有通過以客戶為中心(CustomerCent81
什么是個性化服務(wù)呢?可以從客戶和銀行的觀點(diǎn)來看。
客戶認(rèn)為個性化服務(wù)是:銀行知道我(Who)在什么時間(When)、需要什么產(chǎn)品或服務(wù)(What)、以我可以接受的價格(HowMuch)、經(jīng)由我喜好的分銷渠道(Where),對我提供銷售。什么是個性化服務(wù)呢?可以從客戶和銀行的觀點(diǎn)來看。82
銀行的定義是:以有競爭性的產(chǎn)品或服務(wù)(What)、在適當(dāng)?shù)臅r間(When)、通過適當(dāng)?shù)姆咒N渠道(Where)、對信用好風(fēng)險低的客戶(Who)、以合理的價格(HowMuch)和利潤(Profitable)完成銷售。
兩者都是在精打細(xì)算的前提下,以達(dá)成各自的需求和目標(biāo)。
銀行的定義是:以有競爭性的產(chǎn)品或服務(wù)(What)、在831、分銷渠道的分析和管理銀行通過分析知道客戶、渠道、產(chǎn)品或服務(wù)三者之間的關(guān)系;了解客戶的購買行為;客戶或渠道對業(yè)務(wù)收入的貢獻(xiàn);哪些客戶比較喜好經(jīng)由什么渠道在何時和銀行打交道;目前的分銷渠道的服務(wù)能力如何;需要增加哪些分銷渠道才能達(dá)到預(yù)期的服務(wù)水平。1、分銷渠道的分析和管理銀行通過分析知道客戶、渠道、842、利潤評價模型
建立所有客戶的每一個帳號的利潤評價模型,以便了解每一位客戶對銀行的總利潤貢獻(xiàn)度。銀行可以依客戶的利潤貢獻(xiàn)度安排合適的分銷渠道提供服務(wù)和銷售,知道哪些有利潤的客戶需要留住,采用什么方法留住客戶,交叉銷售改善客戶的利潤貢獻(xiàn)度,那些客戶應(yīng)該爭取。另外,銀行可以模擬和預(yù)測,新產(chǎn)品對銀行利潤的貢獻(xiàn)度,或是新政策對銀行會產(chǎn)生什么樣的財務(wù)影響,或是客戶流失或留住對銀行的整體利潤的影響。2、利潤評價模型建立所有客戶的每一個帳號的利潤評價模853、
客戶關(guān)系優(yōu)化
客戶在每一筆交易中都能主動地告訴銀行需要什么產(chǎn)品和服務(wù),如定期存款是希望退休養(yǎng)老使用等;銀行利用客戶購買傾向模型、渠道喜好模型等主動地和客戶溝通,達(dá)到留住客戶和增加利潤的目標(biāo)。
3、
客戶關(guān)系優(yōu)化
客戶在每一筆交易中都能主動地告訴864、
風(fēng)險評估和管理
風(fēng)險評估和管理主要利用各種數(shù)學(xué)模型進(jìn)行分析,模擬風(fēng)險和利潤間的關(guān)系。銀行實現(xiàn)了以客戶為中心的個性化服務(wù)數(shù)據(jù)倉庫決策支持系統(tǒng),就可以在滿足高利潤低風(fēng)險客戶需求的前提下,達(dá)成銀行收益的極大化。4、
風(fēng)險評估和管理風(fēng)險評估和管理主要利用各種數(shù)學(xué)模876.1數(shù)據(jù)倉庫的基本原理6.2數(shù)據(jù)倉庫系統(tǒng)6.3聯(lián)機(jī)分析處理6.4數(shù)據(jù)倉庫的決策支持第六章數(shù)據(jù)倉庫
6.1數(shù)據(jù)倉庫的基本原理第六章數(shù)據(jù)倉庫
886.1數(shù)據(jù)倉庫的基本原理數(shù)據(jù)倉庫的興起1.“數(shù)據(jù)太多,信息不足”的現(xiàn)狀2.異構(gòu)環(huán)境的數(shù)據(jù)源據(jù)美國《幸?!冯s志所列的全球2000家大公司中已有90%將Internet網(wǎng)絡(luò)和數(shù)據(jù)倉庫這兩項技術(shù)列入企業(yè)計劃。數(shù)據(jù)倉庫是1995年開始盛行起來的。6.1數(shù)據(jù)倉庫的基本原理數(shù)據(jù)倉庫的興起896.1.1數(shù)據(jù)倉庫的概念(1)W.H.Inmon在《建立數(shù)據(jù)倉庫》一書中,對數(shù)據(jù)倉庫的定義為:數(shù)據(jù)倉庫是面向主題的、集成的、穩(wěn)定的,不同時間的數(shù)據(jù)集合,用于支持經(jīng)營管理中決策制定過程。6.1.1數(shù)據(jù)倉庫的概念(1)W.H.Inmon在901、數(shù)據(jù)倉庫的概念(2)SAS軟件研究所定義:數(shù)據(jù)倉庫是一種管理技術(shù),旨在通過通暢、合理、全面的信息管理,達(dá)到有效的決策支持。1、數(shù)據(jù)倉庫的概念(2)SAS軟件研究所定義:911、數(shù)據(jù)倉庫的概念
傳統(tǒng)數(shù)據(jù)庫用于事務(wù)處理,也叫操作型處理,是指對數(shù)據(jù)庫聯(lián)機(jī)進(jìn)行日常操作,即對一個或一組記錄的查詢和修改,主要為企業(yè)特定的應(yīng)用服務(wù)的。用戶關(guān)心的是響應(yīng)時間,數(shù)據(jù)的安全性和完整性。
數(shù)據(jù)倉庫用于決策支持,也稱分析型處理,用于決策分析,它是建立決策支持系統(tǒng)(DSS)的基礎(chǔ)。1、數(shù)據(jù)倉庫的概念傳統(tǒng)數(shù)據(jù)庫用于事務(wù)處理,也叫操作型92操作型數(shù)據(jù)(DB數(shù)據(jù))與分析型數(shù)據(jù)(DW數(shù)據(jù))之間的差別為:操作型數(shù)據(jù)(DB數(shù)據(jù))與932、數(shù)據(jù)倉庫特點(diǎn)(1)數(shù)據(jù)倉庫是面向主題的
主題是數(shù)據(jù)歸類的標(biāo)準(zhǔn),每一個主題基本對應(yīng)一個宏觀的分析領(lǐng)域。例如,銀行的數(shù)據(jù)倉庫的主題:客戶DW的客戶數(shù)據(jù)來源:從銀行儲蓄DB、信用卡DB、貸款DB等三個DB中抽取同一客戶的數(shù)據(jù)整理而成。在DW中分析客戶數(shù)據(jù),可決定是否繼續(xù)給予貸款。2、數(shù)據(jù)倉庫特點(diǎn)(1)數(shù)據(jù)倉庫是面向主題的942、數(shù)據(jù)倉庫特點(diǎn)(2)數(shù)據(jù)倉庫是集成的數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之前,必須經(jīng)過加工與集成。對不同的數(shù)據(jù)來源進(jìn)行統(tǒng)一數(shù)據(jù)結(jié)構(gòu)和編碼。統(tǒng)一原始數(shù)據(jù)中的所有矛盾之處,如字段的同名異義,異名同義,單位不統(tǒng)一,字長不一致等。將原始數(shù)據(jù)結(jié)構(gòu)做一個從面向應(yīng)用到面向主題的大轉(zhuǎn)變。2、數(shù)據(jù)倉庫特點(diǎn)(2)數(shù)據(jù)倉庫是集成的952、數(shù)據(jù)倉庫特點(diǎn)(3)數(shù)據(jù)倉庫是穩(wěn)定的數(shù)據(jù)倉庫中包括了大量的歷史數(shù)據(jù)。數(shù)據(jù)經(jīng)集成進(jìn)入數(shù)據(jù)倉庫后是極少或根本不更新的。(4)數(shù)據(jù)倉庫是隨時間變化的數(shù)據(jù)倉庫內(nèi)的數(shù)據(jù)時限在5~10年,故數(shù)據(jù)的鍵碼包含時間項,標(biāo)明數(shù)據(jù)的歷史時期,這適合DSS進(jìn)行時間趨勢分析。而數(shù)據(jù)庫只包含當(dāng)前數(shù)據(jù),即存取某一時間的正確的有效的數(shù)據(jù)。2、數(shù)據(jù)倉庫特點(diǎn)(3)數(shù)據(jù)倉庫是穩(wěn)定的962、數(shù)據(jù)倉庫特點(diǎn)
大型DW是一個TB(1000GB)級數(shù)據(jù)庫問題(一般為10GB級相當(dāng)于一般數(shù)據(jù)庫100MB的100倍)需要一個巨大的硬件平臺需要一個并行的數(shù)據(jù)庫系統(tǒng)最好的數(shù)據(jù)倉庫是大的和昂貴的。2、數(shù)據(jù)倉庫特點(diǎn)大型DW是一個TB(1000GB)級97
近期基本數(shù)據(jù):是最近時期的業(yè)務(wù)數(shù)據(jù),是數(shù)據(jù)倉庫用戶最感興趣的部分,數(shù)據(jù)量大。
歷史基本數(shù)據(jù):近期基本數(shù)據(jù)隨時間的推移,由數(shù)據(jù)倉庫的時間控制機(jī)制轉(zhuǎn)為歷史基本數(shù)據(jù)。
輕度綜合數(shù)據(jù):是從近期基本數(shù)據(jù)中提取出的,這層數(shù)據(jù)是按時間段選取,或者按數(shù)據(jù)屬性(attributes)和內(nèi)容(contents)進(jìn)行綜合。
高度綜合數(shù)據(jù)層:這一層的數(shù)據(jù)是在輕度綜合數(shù)據(jù)基礎(chǔ)上的再一次綜合,是一種準(zhǔn)決策數(shù)據(jù)。6.1.2數(shù)據(jù)倉庫結(jié)構(gòu)近期基本數(shù)據(jù):是最近時期的業(yè)務(wù)數(shù)據(jù),是數(shù)據(jù)倉98專家與決策支持系統(tǒng)課程99數(shù)據(jù)倉庫工作范圍和成本常常是巨大的。開發(fā)數(shù)據(jù)倉庫是代價很高、時間較長的大項目。提供更緊密集成的數(shù)據(jù)集市就應(yīng)運(yùn)產(chǎn)生。目前,全世界對數(shù)據(jù)倉庫總投資的一半以上均集中在數(shù)據(jù)集市上。6.1.3數(shù)據(jù)集市(DataMarts)6.1.3數(shù)據(jù)集市(DataMarts)100數(shù)據(jù)集市(DataMarts)是一種更小、更集中的數(shù)據(jù)倉庫,為公司提供分析商業(yè)數(shù)據(jù)的一條廉價途徑。數(shù)據(jù)集市是指具有特定應(yīng)用的數(shù)據(jù)倉庫,主要針對某個應(yīng)用或者具體部門級的應(yīng)用,支持用戶獲得競爭優(yōu)勢或者找到進(jìn)入新市場的具體解決方案。數(shù)據(jù)集市概念數(shù)據(jù)集市概念101獨(dú)立數(shù)據(jù)集市(IndependentDataMart)從屬數(shù)據(jù)集市(DependentDataMart)數(shù)據(jù)集市的種類獨(dú)立數(shù)據(jù)集市(IndependentDataMart)數(shù)1021、規(guī)模是小的2、特定的應(yīng)用3、面向部門4、由業(yè)務(wù)部門定義,設(shè)計和開發(fā)5、由業(yè)務(wù)部門管理和維護(hù)6、快速實現(xiàn)7、購買較便宜8、投資快速回收9、工具集的緊密集成10、更詳細(xì)的、預(yù)先存在的數(shù)據(jù)倉庫的摘要子集11、可升級到完整的數(shù)據(jù)倉庫數(shù)據(jù)集市的特性1、規(guī)模是小的數(shù)據(jù)集市的特性103
元數(shù)據(jù)是數(shù)據(jù)倉庫的重要組成部分。
元數(shù)據(jù)描述了數(shù)據(jù)倉庫的數(shù)據(jù)和環(huán)境,即關(guān)于數(shù)據(jù)的數(shù)據(jù)(metadata)
元數(shù)據(jù)包括四種元數(shù)據(jù)。6.1.4元數(shù)據(jù)元數(shù)據(jù)是數(shù)據(jù)倉庫的重要組成部分。6.1.4元數(shù)據(jù)104元數(shù)據(jù)是現(xiàn)有的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)源的描述信息。元數(shù)據(jù)是對不同平臺上的數(shù)據(jù)源的物理結(jié)構(gòu)和含義的描述。具體為:(1)數(shù)據(jù)源中所有物理數(shù)據(jù)結(jié)構(gòu),包括所有的數(shù)據(jù)項及數(shù)據(jù)類型。(2)所有數(shù)據(jù)項的業(yè)務(wù)定義。(3)每個數(shù)據(jù)項更新的頻率,以及由誰或那個過程更新的說明。(4)每個數(shù)據(jù)項的有效值。1、關(guān)于數(shù)據(jù)源的元數(shù)據(jù)元數(shù)據(jù)是現(xiàn)有的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)源的描述信息。元數(shù)據(jù)是對不同平臺105
數(shù)據(jù)倉庫的數(shù)據(jù)模型是星型模型。通常企業(yè)數(shù)據(jù)模型被用作建立倉庫數(shù)據(jù)模型的起始點(diǎn),再對模型加以修改和變換。2、關(guān)于數(shù)據(jù)模型的元數(shù)據(jù)2、關(guān)于數(shù)據(jù)模型的元數(shù)據(jù)106元數(shù)據(jù)是數(shù)據(jù)源與數(shù)據(jù)倉庫數(shù)據(jù)間的映射。當(dāng)數(shù)據(jù)源中的一個數(shù)據(jù)項與數(shù)據(jù)倉庫建立了映射關(guān)系,就應(yīng)該記下這些數(shù)據(jù)項發(fā)生的任何變換或變動。即用元數(shù)據(jù)反映數(shù)據(jù)倉庫中的數(shù)據(jù)項是從哪個特定的數(shù)據(jù)源填充的,經(jīng)過那些轉(zhuǎn)換,變換和加載過程。3、關(guān)于數(shù)據(jù)倉庫映射的元數(shù)據(jù)元數(shù)據(jù)是數(shù)據(jù)源與數(shù)據(jù)倉庫數(shù)據(jù)間的映射。3、關(guān)于數(shù)據(jù)倉庫映射的107這類元數(shù)據(jù)是數(shù)據(jù)倉庫中信息的使用情況描述。數(shù)據(jù)倉庫的用戶最關(guān)心的是兩類元數(shù)據(jù):
(1)元數(shù)據(jù)告訴數(shù)據(jù)倉庫中有什么數(shù)據(jù),它們從哪里來。即如何按主題查看數(shù)據(jù)倉庫的內(nèi)容。(2)元數(shù)據(jù)提供已有的可重復(fù)利用的查詢語言信息。如果某個查詢能夠滿足他們的需求,或者與他們的愿望相似,他們就可以再次使用那些查詢而不必從頭開始編程。關(guān)于數(shù)據(jù)倉庫使用的元數(shù)據(jù)能幫助用戶到數(shù)據(jù)倉庫查詢所需要的信息,用于解決企業(yè)問題。4、關(guān)于數(shù)據(jù)倉庫使用的元數(shù)據(jù)這類元數(shù)據(jù)是數(shù)據(jù)倉庫中信息的使用情況描述。4、關(guān)于數(shù)1086.2數(shù)據(jù)倉庫系統(tǒng)
6.2.1數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)
數(shù)據(jù)倉庫系統(tǒng)由數(shù)據(jù)倉庫(DW)、倉庫管理和分析工具三部分組成。6.2數(shù)據(jù)倉庫系統(tǒng)6.2.1數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)1091、數(shù)據(jù)倉庫管理系統(tǒng)(1)定義部分
用于定義和建立數(shù)據(jù)倉庫系統(tǒng)。它包括:(1)設(shè)計和定義數(shù)據(jù)倉庫的數(shù)據(jù)庫(2)定義數(shù)據(jù)來源(3)確定從源數(shù)據(jù)向數(shù)據(jù)倉庫復(fù)制數(shù)據(jù)時的清理和增強(qiáng)規(guī)則(2)數(shù)據(jù)獲取部分
該部件把數(shù)據(jù)從源數(shù)據(jù)中提取出來,依定義部件的規(guī)則,抽取、轉(zhuǎn)化和裝載數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫。
1、數(shù)據(jù)倉庫管理系統(tǒng)(1)定義部分110(3)管理部分
它用于管理數(shù)據(jù)倉庫的工作,包括:(1)對數(shù)據(jù)倉庫中數(shù)據(jù)的維護(hù)(2)把倉庫數(shù)據(jù)送出給分散的倉庫服務(wù)器或DSS用戶(3)對倉庫數(shù)據(jù)的安全、歸檔、備份、恢復(fù)等處理工作1、數(shù)據(jù)倉庫管理系統(tǒng)(3)管理部分1、數(shù)據(jù)倉庫管理系統(tǒng)111(4)信息目錄部件(元數(shù)據(jù))
數(shù)據(jù)倉庫的目錄數(shù)據(jù)是元數(shù)據(jù),由三部分組成:
技術(shù)目錄:由定義部件生成,關(guān)于數(shù)據(jù)源、目標(biāo)、清理規(guī)則、變換規(guī)則以及數(shù)據(jù)源和倉庫之間的映象信息。
業(yè)務(wù)目錄:由倉庫管理員生成,關(guān)于倉庫數(shù)據(jù)的來源及當(dāng)前值;預(yù)定義的查詢和報表細(xì)節(jié);合法性要求等。
信息引導(dǎo)器:使用戶容易訪問倉庫數(shù)據(jù)。利用固定查詢或建立新的查詢,生成暫時的或永久的倉庫數(shù)據(jù)集合的能力等。1、數(shù)據(jù)倉庫管理系統(tǒng)(4)信息目錄部件(元數(shù)據(jù))1、數(shù)據(jù)倉庫管理系統(tǒng)112分析工具集分兩類工具:(1)查詢工具數(shù)據(jù)倉庫的查詢不是指對記錄級數(shù)據(jù)的查詢,而是指對分析要求的查詢。一般包含:
可視化工具:以圖形化方式展示數(shù)據(jù),可以幫助了解數(shù)據(jù)的結(jié)構(gòu),關(guān)系以及動態(tài)性。2、數(shù)據(jù)倉庫工具集分析工具集分兩類工具:2、數(shù)據(jù)倉庫工具集113多維分析工具(OLAP工具):通過對信息的多種可能的觀察形式進(jìn)行快速、一致和交互性的存取,這樣便利用戶對數(shù)據(jù)進(jìn)行深入的分析和觀察。多維數(shù)據(jù)的每一維代表對數(shù)據(jù)的一個特定的觀察視角,如時間、地域、業(yè)務(wù)等。2、數(shù)據(jù)倉庫工具集2、數(shù)據(jù)倉庫工具集114(2)數(shù)據(jù)挖掘工具從大量數(shù)據(jù)中挖掘具有規(guī)律性知識,需要利用數(shù)據(jù)挖掘(DataMining)工具。2、數(shù)據(jù)倉庫工具集(2)數(shù)據(jù)挖掘工具2、數(shù)據(jù)倉庫工具集1153、數(shù)據(jù)倉庫的運(yùn)行結(jié)構(gòu)
數(shù)據(jù)倉庫應(yīng)用是一個典型的客戶/服務(wù)器(C/S)結(jié)構(gòu)形式。數(shù)據(jù)倉庫采用服務(wù)器結(jié)構(gòu),客戶端所做的工作有:客戶交互、格式化查詢、結(jié)果顯示、報表生成等。
服務(wù)器端完成各種輔助決策的SQL查詢、復(fù)雜的計算和各類綜合功能等?,F(xiàn)在,越來越普通的一種形式是三層C/S結(jié)構(gòu)形式,即在客戶與數(shù)據(jù)倉庫服務(wù)器之間增加一個多維數(shù)據(jù)分析(OLAP)服務(wù)器。3、數(shù)據(jù)倉庫的運(yùn)行結(jié)構(gòu)數(shù)據(jù)倉庫應(yīng)用是一個典型的客戶/116
OLAP服務(wù)器將加強(qiáng)和規(guī)范化決策支持的服務(wù)工作,集中和簡化了原客戶端和數(shù)據(jù)倉庫服務(wù)器的部分工作,降低了系統(tǒng)數(shù)據(jù)傳輸量。這種結(jié)構(gòu)形式工作效率更高。三層C/S結(jié)構(gòu)OLAP服務(wù)器將加強(qiáng)和規(guī)范化決策支持的服務(wù)工117
數(shù)據(jù)倉庫存儲采用多維數(shù)據(jù)模型。
維就是相同類數(shù)據(jù)的集合。例如:商店的集合是一維,時間的集合是一維,商品的集合是一維;每一個商店、每一段時間、每一種商品就是某一維的一個成員;每一個銷售事實由一個特定的商品、一個特定的時間、一個特定的商品組成。兩維表,如通常的電子表格。三維構(gòu)成立方體,若再增加一維,則圖形很難想象,也不容易在屏幕上畫出來。
6.2.2數(shù)據(jù)倉庫的存儲數(shù)據(jù)倉庫存儲采用多維數(shù)據(jù)模型。6.2.2118數(shù)據(jù)倉庫是以多維表型的“維表—事實表”結(jié)構(gòu)形式組織的,共有三種形式:1、星型模型大多數(shù)的數(shù)據(jù)倉庫都采用“星型模型”。
星型模型是由“事實表”(大表)以及多個“維表”(小表)所組成?!笆聦嵄怼敝写娣糯罅筷P(guān)于企業(yè)的事實數(shù)據(jù)(數(shù)量數(shù)據(jù))。星型模型數(shù)據(jù)如下圖:數(shù)據(jù)倉庫是以多維表型的“維表—事實表”結(jié)構(gòu)形式組119專家與決策支持系統(tǒng)課程120
2、雪花模型雪花模型是對星型模型的擴(kuò)展,雪花模型對星型模型的維表進(jìn)一步層次化,原來的各維表可能被擴(kuò)展為小的事實表,形成一些局部的“層次”區(qū)域。它的優(yōu)點(diǎn)是最大限度地減少數(shù)據(jù)存儲量,以及把較小的維表聯(lián)合在一起來改善查詢性能。在上面星型模型的數(shù)據(jù)中,對“產(chǎn)品表”“日期表”“地區(qū)表”進(jìn)行擴(kuò)展形成雪花模型數(shù)據(jù)見下圖。
2、雪花模型121專家與決策支持系統(tǒng)課程1223、星網(wǎng)模型
星網(wǎng)模型是將多個星型模型連接起來形成網(wǎng)狀結(jié)構(gòu)。多個星型模型通過相同的維,如時間維,連接多個事實表。3、星網(wǎng)模型123
聯(lián)機(jī)分析處理(OnLineAnalyticalProcessing,OLAP)的概念最早是由關(guān)系數(shù)據(jù)庫之父E.F.Codd于1993年提出的。在數(shù)據(jù)倉庫系統(tǒng)中,聯(lián)機(jī)分析處理是重要的數(shù)據(jù)分析工具。
OLAP的基本思想是從多方面和多角度以多維的形式來觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。6.3聯(lián)機(jī)分析處理聯(lián)機(jī)分析處理(OnLineAnalytic1246.3.1基本概念
OLAP是在OLTP的基礎(chǔ)上發(fā)展起來的。
OLTP是以數(shù)據(jù)庫為基礎(chǔ)的,面對的是操作人員和低層管理人員,對基本數(shù)據(jù)的查詢和增、刪、改等進(jìn)行處理。
OLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的數(shù)據(jù)分析處理。它有兩個特點(diǎn):一是在線性(OnLine),由客戶機(jī)/服務(wù)器這種體系結(jié)構(gòu)來完成的;二是多維分析,這也是OLAP的核心所在。6.3.1基本概念OLAP是在OLTP的基礎(chǔ)上發(fā)1251、OLAP的定義
聯(lián)機(jī)分析處理是共享多維信息的快速分析。它體現(xiàn)了四個特征:(1)快速性:用戶對OLAP的快速反應(yīng)能力有很高的要求。(2)可分析性:OLAP系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)計分析。(3)多維性:系統(tǒng)必須提供對數(shù)據(jù)分析的多維視圖和分析。(4)信息性:OLAP系統(tǒng)應(yīng)能及時獲得信息,并且管理大容量的信息1、OLAP的定義聯(lián)機(jī)分析處理是共享多維126
1993年,E.F.Codd提出OLAP的12條準(zhǔn)則,其主要的準(zhǔn)則有:多維數(shù)據(jù)分析;客戶/服務(wù)器結(jié)構(gòu);多用戶支持;一致的報表性能等。
2、OLAP準(zhǔn)則1993年,E.F.Codd提出OLAP的12條準(zhǔn)則1273.多維概念視圖企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的概念模型也應(yīng)是多維的。用戶可以對多維數(shù)據(jù)模型進(jìn)行切片、切塊、旋轉(zhuǎn)坐標(biāo)或進(jìn)行多維的聯(lián)合(概括和聚集)分析。3.多維概念視圖企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的1284.穩(wěn)定的報表性能
報表操作不應(yīng)隨維數(shù)增加而削弱,即當(dāng)數(shù)據(jù)維數(shù)和數(shù)據(jù)的綜合層次增加時,提供的報表能力和響應(yīng)速度不應(yīng)該有明顯的降低。
4.穩(wěn)定的報表性能報表操作不應(yīng)隨維數(shù)增加而削弱,即1295.客戶/服務(wù)器體系結(jié)構(gòu)
OLAP是建立在客戶/服務(wù)器體系結(jié)構(gòu)上的。要求多維數(shù)據(jù)庫服務(wù)器能夠被不同的應(yīng)用和工具所訪問。5.客戶/服務(wù)器體系結(jié)構(gòu)OLAP是建立在客戶/服務(wù)1308.多用戶支持
當(dāng)多個用戶要在同一分析模式上并行工作,需要這些功能的支持。
11.靈活的報表生成
報表必須充分反映數(shù)據(jù)分析模型的多維特征,并可按用戶需要的方式來顯示它。8.多用戶支持131OLAP是針對特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析。
(1)變量:變量是數(shù)據(jù)的實際意義,即描述數(shù)據(jù)“是什么”。
(2)維:維是人們觀察數(shù)據(jù)的特定角度。如產(chǎn)品維、顧客維、時間維等。
(3)維的層次:數(shù)據(jù)的細(xì)節(jié)不同程度為維的層次。如日、月、季、年是時間維的層次。
(4)維成員:維的一個取值稱為該維的一個維成員。如“某年某月某日”是時間維的一個成員。
3、OLAP的基本概念OLAP是針對特定問題的聯(lián)機(jī)數(shù)據(jù)訪問和分析。3、OLAP132(5)多維數(shù)組:一個多維數(shù)組可以表示為:(維1,維2,……,維n,變量)
一個5維的結(jié)構(gòu),即(產(chǎn)品,地區(qū),時間,銷售渠道,銷售額)。(6)數(shù)據(jù)單元(單元格):多維數(shù)組的取值稱為數(shù)據(jù)單元。如:5維數(shù)據(jù)單元(牙膏,上海,1998年12月,批發(fā),銷售額為100000)。
3、OLAP的基本概念(5)多維數(shù)組:一個多維數(shù)組可以表示為:3、OLAP的基本概133(1)OLTPOLTP是低層人員利用計算機(jī)網(wǎng)絡(luò)對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行查詢、增、刪、改等操作,以完成事務(wù)處理工作。OLTP利用數(shù)據(jù)庫快速地處理具體業(yè)務(wù)。OLTP應(yīng)用要求多個查詢并行。
4、OLAP與OLTP的關(guān)系與比較(1)OLTP4、OLAP與OLTP的關(guān)系與比較134(2)OLAPOLAP是高層人員對數(shù)據(jù)倉庫進(jìn)行信息分析處理。①存取大量的數(shù)據(jù)②包含聚集的數(shù)據(jù)③按層次對比不同時間周期的聚集數(shù)據(jù)④以不同的方式來表現(xiàn)數(shù)據(jù)⑤要包含數(shù)據(jù)元素之間的復(fù)雜的計算⑥能夠快速的響應(yīng)用戶的查詢
4、OLAP與OLTP的關(guān)系與比較(2)OLAP4、OLAP與OLTP的關(guān)系與比較135(3)OLAP與OLTP對比(對比表)OLTPOLAP數(shù)據(jù)庫數(shù)據(jù)數(shù)據(jù)倉庫數(shù)據(jù)細(xì)節(jié)性數(shù)據(jù)綜合性數(shù)據(jù)當(dāng)前數(shù)據(jù)歷史數(shù)據(jù)一次性處理的數(shù)據(jù)量小一次處理的數(shù)據(jù)量大對響應(yīng)時間要求高響應(yīng)時間合理用戶數(shù)量大用戶相對較少面向應(yīng)用,事務(wù)驅(qū)動面向分析,分析驅(qū)動(3)OLAP與OLTP對比(對比表)OLTPOLAP數(shù)據(jù)庫1366.3.2OLAP的數(shù)據(jù)組織
MOLAP和ROLAP是OLAP的兩種具體形式:
ROLAP是基于關(guān)系數(shù)據(jù)庫存儲方式建立的OLAP。多維數(shù)據(jù)映射成平面型的關(guān)系表。采用星型模型。6.3.2OLAP的數(shù)據(jù)組織MOL137
MOLAP是基于多維數(shù)據(jù)庫存儲方式建立的OLAP;表現(xiàn)為“超立方”結(jié)構(gòu),類似于多維數(shù)組的結(jié)構(gòu)。在分析中,需要“旋轉(zhuǎn)”數(shù)據(jù)立方體以及“切片”、“切塊”等操作。MOLAP是基于多維數(shù)據(jù)庫存儲方式建立的OLAP;138MOLAP和ROLAP的對比表MOLAPROLAP固定維可變維維交叉計算多維視圖行級計算超大型數(shù)據(jù)庫讀-寫應(yīng)用維數(shù)據(jù)變化速度快數(shù)據(jù)集市數(shù)據(jù)倉庫MOLAP和ROLAP的對比表MOLAPROLAP固定維可變139OLAP多維數(shù)據(jù)分析例如,以“產(chǎn)品、城市、時間”三維數(shù)據(jù),如圖6.3.3OLAP的決策支持OLAP多維數(shù)據(jù)分析6.3.3OLAP的決策支持1401、基本功能:切片和切塊
對三維數(shù)據(jù),通過“切片”,分別從城市和產(chǎn)品等不同的角度觀察銷售情況:
1、基本功能:切片和切塊對三維數(shù)據(jù),通過“切片”,141鉆取鉆?。豪?,1995年各部門銷售收入表如下:鉆取鉆?。豪纾?995年各部門銷售收入表如下:142對時間維進(jìn)行下鉆操作,獲得新表如下:鉆?。ɡm(xù))對時間維進(jìn)行下鉆操作,獲得新表如下:鉆?。ɡm(xù))143旋轉(zhuǎn)前的數(shù)據(jù)旋轉(zhuǎn)旋轉(zhuǎn)前的數(shù)據(jù)旋轉(zhuǎn)144旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)(續(xù))旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)(續(xù))145旋轉(zhuǎn)后再切片旋轉(zhuǎn)后再切片1462、廣義OLAP功能
1、基本代理操作
“代理”是一些智能性代理,當(dāng)系統(tǒng)處于某種特殊狀態(tài)時提醒分析員。(1)示警報告定義一些條件,一但條件滿足,系統(tǒng)會提醒分析員去做分析。如每日報告完成或月定貨完成等通知分析員作分析。
(2)異常報告當(dāng)超出邊界條件時提醒分析員。如銷售情況已超出預(yù)定義閾值的上限或下限時提醒分析員。2、廣義OLAP功能1、基本代理操作147
2、計算能力計算引擎用于特定需求的計算或某種復(fù)雜計算。
3、模型計算增加模型,如增加系統(tǒng)優(yōu)化、統(tǒng)計分析、趨勢分析等模型,以提高決策分析能力。
2、廣義OLAP功能2、計算能力2、廣義OLAP功能148假設(shè)有一個5維數(shù)據(jù)模型,5個維分別為:商店,方案,部門,時間,銷售。1.三維表查詢在指定“商店=ALL,方案=現(xiàn)有”情況的三維表(行為部門,列為時間和銷售量)6.3.4、OLAP實例
假設(shè)有一個5維數(shù)據(jù)模型,5個維分別為:商店,方案149
19941995%增長率銷售量利潤增長%銷售量利潤增長%銷售量利潤增長服裝234,67027.2381,10221.562.4(20.0)家具62,54833.866,00531.15.6(8.0)汽車375,09822.4325,40227.2(13.2)21.4所有其它202,38821.3306,67721.750.71.9指定商店、方案后的三維表
19941995%增長率銷售量利潤增長%銷售量利潤增長%銷150
19941995%增長率銷售利潤增長%銷售利潤增長%銷售利潤增長汽車375,09822.4325,40227.2(13.2)21.4維修195,05114.2180,78615.0(7.3)5.6附件116,28043.9122,54547.55.38.2音樂63,7678.222,07114.2(63.4)7.3
2、向下鉆取對汽車部門向下鉆取出具體項目的銷售情況和利潤增長情況。
19941995%增長率銷售利潤增長%銷售利潤增長%銷售利151
1995銷售量服裝381,102家具66,005汽車325,402所有其它306,6773、切片表切片(Slice)操作是除去一些列或行不顯示
1995銷售量服裝381,102家具66,005汽車325152
1995銷售量現(xiàn)有計劃差量差量%服裝381,102350,00031.18.9家具66,00569,000(2,995)(4.3)汽車325,402300,00025,4028.5所有其它306,677350,000(44,322)12.74、旋轉(zhuǎn)表這次旋轉(zhuǎn)操作得到1995年的交叉表方案為:現(xiàn)有、計劃、差量、差量%。
1995銷售量現(xiàn)有計劃差量差量%服裝381,102350,153
6.4.1數(shù)據(jù)倉庫的開發(fā)1、數(shù)據(jù)倉庫規(guī)劃
①數(shù)據(jù)倉庫開發(fā)的范圍怎樣?
②要解決的業(yè)務(wù)問題是什么?③開發(fā)的數(shù)據(jù)倉庫的決策支持能力是什么?6.4數(shù)據(jù)倉庫的決策支持及實例6.4.1數(shù)據(jù)倉庫的開發(fā)6.4數(shù)據(jù)倉庫的決策支持及實例154決策者的需求:對信息的需求對業(yè)務(wù)過程的需求對數(shù)據(jù)訪問的需求2、定義體系結(jié)構(gòu)決策者的需求:2、定義體系結(jié)構(gòu)155確定體系結(jié)構(gòu)(1)來源:數(shù)據(jù)應(yīng)該來自于什么DBMS的源數(shù)據(jù)?(2)傳輸:數(shù)據(jù)通過什么樣的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)傳送過來?(3)目的地:數(shù)據(jù)發(fā)送到數(shù)據(jù)倉庫的什么硬件環(huán)境?(4)元數(shù)據(jù):確定存儲和訪問數(shù)據(jù)的元數(shù)據(jù)。(5)變換:編制數(shù)據(jù)抽取、變換、裝載的程序。(6)訪問:最終用戶怎樣才能查詢數(shù)據(jù)?
確定體系結(jié)構(gòu)(1)來源:數(shù)據(jù)應(yīng)該來自于什么DBMS的源數(shù)據(jù)156(1)主題域分析
確定所需數(shù)據(jù)的范圍和內(nèi)容。并建立數(shù)據(jù)倉庫的數(shù)據(jù)模型:主題域范圍數(shù)據(jù)倉庫的數(shù)據(jù)模型(2)物理數(shù)據(jù)庫設(shè)計
數(shù)據(jù)的實際存儲設(shè)計3、數(shù)據(jù)倉庫設(shè)計(1)主題域分析3、數(shù)據(jù)倉庫設(shè)計157
(1)確定源數(shù)據(jù)、檢查其完整性,進(jìn)行評價。(2)完成源數(shù)據(jù)變換到目標(biāo)數(shù)據(jù)倉庫中去。4、源系統(tǒng)分析與數(shù)據(jù)變換設(shè)計(1)確定源數(shù)據(jù)、檢查其完整性,進(jìn)行評價。4、源系統(tǒng)分158
完成數(shù)據(jù)加載;評審;元數(shù)據(jù)加載;系統(tǒng)測試5、建立數(shù)據(jù)倉庫完成數(shù)據(jù)加載;評審;元數(shù)據(jù)加載;系統(tǒng)測試5、建立數(shù)據(jù)159提供給用戶訪問的形式:(1)使用現(xiàn)有的特定工具;(2)開發(fā)一個最終用戶訪問程序。6、用戶訪問方法的設(shè)計和開發(fā)提供給用戶訪問的形式:6、用戶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 華為組網(wǎng)技術(shù)課程設(shè)計
- 2024至2030年輪胎熱補(bǔ)機(jī)項目投資價值分析報告
- 機(jī)械原理課程設(shè)計 戴娟
- 洗衣機(jī)改造課程設(shè)計
- 2024年度環(huán)保技術(shù)研發(fā)股份互換合同3篇
- 2024版報刊亭智能安防報警系統(tǒng)建設(shè)合同2篇
- 2024年土地承包經(jīng)營權(quán)轉(zhuǎn)讓與收益分配合同3篇
- 2024版基酒行業(yè)峰會合作銷售合同示范文本3篇
- 2024版股票期權(quán)激勵計劃執(zhí)行與反饋合同3篇
- 2024年度果樹種植技術(shù)培訓(xùn)與承包合同3篇
- 鉛鋅礦礦山供電系統(tǒng)設(shè)計與節(jié)能改造研究
- 國開可編程控制器應(yīng)用形考實訓(xùn)任務(wù)四
- DZ∕T 0211-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 重晶石、毒重石、螢石、硼(正式版)
- MOOC 作物育種學(xué)-四川農(nóng)業(yè)大學(xué) 中國大學(xué)慕課答案
- 變電站隱患排查治理總結(jié)報告
- 異彩紛呈的民族文化智慧樹知到期末考試答案2024年
- 國標(biāo)《電化學(xué)儲能電站檢修試驗規(guī)程》
- 車輛救援及維修服務(wù)方案
- 三體讀書分享
- 天津市長期護(hù)理保險護(hù)理服務(wù)項目和標(biāo)準(zhǔn)
- 2024年內(nèi)蒙古巴彥淖爾市交通投資集團(tuán)有限公司招聘筆試參考題庫含答案解析
評論
0/150
提交評論