軟件項目管理3課件_第1頁
軟件項目管理3課件_第2頁
軟件項目管理3課件_第3頁
軟件項目管理3課件_第4頁
軟件項目管理3課件_第5頁
已閱讀5頁,還剩127頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第3章聯(lián)機分析處理

3.1OLAP概念3.2OLAP的數據模型3.3多維數據的顯示3.4多維數據分析3.5OLAP的結構與分析工具1第3章聯(lián)機分析處理

3.1OLAP概念1

聯(lián)機分析處理(OnLineAnalyticalProcessing,OLAP)在數據倉庫系統(tǒng)中,聯(lián)機分析處理是重要的數據分析工具。

OLAP的基本思想是從多方面和多角度以多維的形式來觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。2聯(lián)機分析處理(OnLineAnalytic3.1OLAP概念

OLAP是在OLTP的基礎上發(fā)展起來的。

OLTP是以數據庫為基礎的,面對的是操作人員和低層管理人員,對基本數據的查詢和增、刪、改等進行處理。

OLAP是以數據倉庫為基礎的數據分析處理。它有兩個特點:一是在線性(OnLine),由客戶機/服務器這種體系結構來完成的;二是多維分析,這也是OLAP的核心所在。33.1OLAP概念OLAP是在OLTP的基礎上發(fā)3.1.1OLAP定義1.OLAP理事會給出的定義聯(lián)機分析處理(OLAP)是一種軟件技術,它使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數據的目的。這些信息是從原始數據轉換過來的,按照用戶的理解,它反映了企業(yè)真實的方方面面。43.1.1OLAP定義1.OLAP理事會給出的定義42.OLAP的簡單定義

聯(lián)機分析處理是共享多維信息的快速分析。它體現(xiàn)了四個特征:(1)快速性:用戶對OLAP的快速反應能力有很高的要求。(2)可分析性:OLAP系統(tǒng)應能處理任何邏輯分析和統(tǒng)計分析。(3)多維性:系統(tǒng)必須提供對數據分析的多維視圖和分析。(4)信息性:OLAP系統(tǒng)應能及時獲得信息,并且管理大容量的信息。

52.OLAP的簡單定義聯(lián)機分析處理是共

1993年,E.F.Codd提出OLAP的12條準則,用來評價分析處理工具,這也是他繼關系數據庫和分布式數據庫提出的兩個“12條準則”后提出的第三個“12條準則”。其主要的準則有:多維數據分析;客戶/服務器結構;多用戶支持;一致的報表性能等。

3.1.2OLAP準則

61993年,E.F.Codd提出OLAP的12條準則1.多維概念視圖企業(yè)的數據空間本身就是多維的。因此OLAP的概念模型也應是多維的。用戶可以對多維數據模型進行切片、切塊、旋轉坐標或進行多維的聯(lián)合(概括和聚集)分析。71.多維概念視圖企業(yè)的數據空間本身就是多維的。因此OLAP的4.一致穩(wěn)定的報表性能

報表操作不應隨維數增加而削弱,即當數據維數和數據的綜合層次增加時,提供的報表能力和響應速度不應該有明顯的降低。

84.一致穩(wěn)定的報表性能報表操作不應隨維數增加而削弱5.客戶/服務器體系結構

OLAP是建立在客戶/服務器體系結構上的。

多維數據庫服務器能夠被不同的應用和工具所訪問。

客戶端負責應用邏輯及用戶界面。95.客戶/服務器體系結構OLAP是建立在客戶/服務

8.多用戶支持能力

當多個用戶要在同一分析模式上并行工作,OLAP工具應能夠提供并發(fā)訪問等功能。

11.靈活的報表生成

報表必須充分反映數據分析模型的多維特征,并可按用戶需要的方式來顯示它。108.多用戶支持能力10

OLAP是針對特定問題的聯(lián)機數據訪問和分析。

(1)變量:變量是數據的實際意義,即描述數據“是什么”。

(2)維:維是人們觀察數據的特定角度。如產品維、顧客維、時間維等。

(3)維的層次:數據的細節(jié)不同程度為維的層次。如日、月、季、年是時間維的層次。

(4)維成員:維的一個取值稱為該維的一個維成員。如“某年某月某日”是時間維的一個成員。

3.1.3OLAP的基本概念

11OLAP是針對特定問題的聯(lián)機數據訪問和分析。3.1(5)多維數組:一個多維數組可以表示為:(維1,維2,……,維n,變量)一個4維的結構,即(產品,地區(qū),時間,銷售渠道,銷售額)。(6)數據單元(單元格):多維數組的取值稱為數據單元。如:4維數據單元(牙膏,上海,1998年12月,批發(fā),銷售額為100000)。

OLAP的基本概念(續(xù))12(5)多維數組:一個多維數組可以表示為:OLAP的基本概念(3.2OLAP的數據模型

3.2.1MOLAP數據模型3.2.2ROLAP數據模型3.2.3MOLAP與ROLAP的比較3.2.4HOLAP數據模型133.2OLAP的數據模型3.2.1MOLAP數據模型133.2.1MOLAP的數據模型

MOLAP是基于多維數據庫存儲方式建立的OLAP;表現(xiàn)為“超立方”結構,采用類似于多維數組的結構。例如,二維MDDB(數組,即矩陣)的數據組織見表3.1所示。

北京上海廣州衣服600700500鞋800900700帽子10020080表3.1MOLAP的數據模型143.2.1MOLAP的數據模型MOLAP是基于多維在查詢中除查詢一般的“衣服在廣州的銷售量”外,有時查詢“衣服的總銷售量”等問題,涉及到多個數據項求和,如果采取臨時進行累加,會使查詢效率大大降低,為此需增加匯總數據項。

北京上海廣州總和衣服6007005001800鞋8009007002400帽子10020080380總和1500180012804580表多維數據庫中晗綜合數據的組織15在查詢中除查詢一般的“衣服在廣州的銷售量”外,有時3.2.2ROLAP數據模型ROLAP是基于關系數據庫的OLAP。它是一個平面結構,用關系數據庫表示多維數據時,采用星型模型。163.2.2ROLAP數據模型ROLAP是基于關系數據庫的OL產品名地區(qū)銷售量衣服北京600衣服上海700衣服廣州500鞋北京800鞋上海900鞋廣州700帽子北京100帽子上海200帽子廣州80表3.3關系數據庫RDBMS數據組織17產品名地區(qū)銷售量衣服北京600衣服上海700衣服廣州500鞋3.2.3MOLAP與ROLAP的比較1.數據存取速度2.數據存儲的容量3.多維計算的能力4.維度變化的適應性5.數據變化的適應性6.軟硬件平臺的適應性7.元數據管理183.2.3MOLAP與ROLAP的比較1.數據存取速度181.數據存取速度ROLAP服務器需要將SQL語句轉化為多維存儲語句,臨時“拼合”出多維數據立方體。因此,ROLAP的響應時間較長。

MOLAP在數據存儲速度上性能好,響應速度快。191.數據存取速度ROLAP服務器需要將SQL語句轉化為多維存2.數據存儲的容量ROLAP使用的傳統(tǒng)關系數據庫的存儲方法,在存儲容量上基本沒有限制。MOLAP通常采用多平面疊加成立體的方式存放數據。當數據量超過操作系統(tǒng)最大文件長度時,需要進行數據分割。多維數據庫的數據量級難以達到太大的字節(jié)級。202.數據存儲的容量ROLAP使用的傳統(tǒng)關系數據庫的存儲方法,3.多維計算的能力MOLAP能夠支持高性能的決策支持計算。ROLAP無法完成多行的計算和維之間的計算。213.多維計算的能力MOLAP能夠支持高性能的決策支持計算。24.維度變化的適應性MOLAP增加新的維度,則多維數據庫通常需要重新建立。ROLAP對于維表的變更有很好的適應性。224.維度變化的適應性MOLAP增加新的維度,則多維數據庫通常5.數據變化的適應性當數據頻繁的變化時,MOLAP需要進行大量的重新計算,甚至重新建立索引乃至重構多維數據庫。在ROLAP中靈活性較好,對于數據變化的適應性高。235.數據變化的適應性當數據頻繁的變化時,MOLAP需要進行大6.軟硬件平臺的適應性ROLAP對軟硬件平臺的適應性很好,而MOLAP相對較差。7.元數據管理目前在元數據的管理,MOLAP和ROLAP都沒有成形的標準。246.軟硬件平臺的適應性24MOLAP和ROLAP的對比簡表MOLAPROLAP固定維可變維維交叉計算多維視圖行級計算超大型數據庫讀-寫應用維數據變化速度快數據集市數據倉庫25MOLAP和ROLAP的對比簡表MOLAPROLAP固定維可3.2.4HOLAP數據模型HOLAP(HybridOLAP),即混和OLAP介于MOLAP和ROLAP之間。在HOLAP中,對最常用的維度和維層次,使用多維數據表來存儲,對于用戶不常用的維度和數據,采用ROLAP星型結構來存儲。在HOLAP的多維數據表中的數據維度少于MOLAP中的維度表,數據存儲容量也少于MOLAP方式。HOLAP在數據存取速度上又低于MOLAP。263.2.4HOLAP數據模型HOLAP(HybridOL3.3多維數據的顯示3.3.1多維數據顯示方法3.3.2多維類型結構(MTS)3.3.3多維數據的分析視圖273.3多維數據的顯示3.3.1多維數據顯示方法273.3.1多維數據顯示方法多維數據的顯示只能在平面上展現(xiàn)出來。三維數據無法在平面上展現(xiàn)出來。三維數據顯示見表3.6所示。283.3.1多維數據顯示方法多維數據的顯示只能在平面上展現(xiàn)出產品名地區(qū) 時間銷售量衣服北京1月100衣服北京2月200衣服北京3月300衣服上海1月200衣服上海2月300衣服上海3月400衣服廣州1月150衣服廣州2月250衣服廣州3月300鞋北京1月150鞋北京2月300鞋北京3月350鞋上海1月200鞋上海2月300鞋上海3月400鞋廣州1月150鞋廣州2月250鞋廣州3月300…………29產品名地區(qū) 時間銷售量衣服北京1月100衣服北京2月200衣3.3.2多維類型結構(MTS)表示方法是:每一個維度用一條線段來表示。維度中的每一個成員都用線段上的一個單位區(qū)間來表示。例如,用三個線段分別表示時間、產品和指標三個維的多維類型結構如圖3.3所示。303.3.2多維類型結構(MTS)表示方法是:每一個維度用一在圖3.3多維類型結構(MTS)中,指定時間維成員是3月,產品維成員是鞋,指標維成員是銷售量,這樣它代表了三維數據總得一個空間數據點,如圖3.4所示。31在圖3.3多維類型結構(MTS)中,指定時間維成員是3月,產3.3.3多維數據的分析視圖在平面的屏幕上顯示多維數據,是利用行、列和頁面三個顯示組來表示的。例如,對上例的四維MTS實例,在頁面上選定商店維度中“商店3”,在行中選定時間維的“1月、2月、3月”共3個成員,在列中選定產品維中的“上衣、褲、帽子”三個成員,以及指標維中的“固定成本、直接銷售”二個成員。該四維數據的顯示如圖3.6所示。商店3(頁面)上衣褲帽子直接銷售固定成本直接銷售固定成本直接銷售固定成本1月4503505504505004002月3802804603604003203月400310480410450400323.3.3多維數據的分析視圖在平面的屏幕上顯示多維數據,是利對于更多維度的數據顯示,需要選擇維度及其成員分布在行或者列中。在頁面上可以選定多個維度,但每個維度只能顯示一個成員。在行或者列中一般只選擇二個維,每個維可以多個成員。例如,對6個維度數據,它的MTS如圖3.7所示。33對于更多維度的數據顯示,需要選擇維度及其成員分布在行或者列中對以上6維數據中,設定頁面維度為商店的成員是“商店3”,客戶維度成員是“老年”。行維度含時間維和產品維共2個維度,其中時間維中成員為“1月、2月、3月”。產品維中成員為“桌子、臺燈”。列維度含指標維和場景維共2個維度,其中指標維中成員為“直接銷售、間接銷售、總銷售”。場景維中成員為“實際、計劃”。具體的顯示數據如圖3.8所示。商店3,老年(頁面)直接銷售間接銷售總銷售實際計劃實際計劃實際計劃1月桌子250300125150375450臺燈2653201331604004802月桌子333400167200500600臺燈2833401421704255103月桌子350420175210525630臺燈25030012515037545034對以上6維數據中,設定頁面維度為商店的成員是“商店3”,客戶3.4OALP的多維數據分析3.4.1多維數據分析的基本操作3.4.2廣義OLAP功能3.4.3多維數據分析實例353.4OALP的多維數據分析3.4.1多維數據分析的基本操作例如,以“產品、城市、時間”三維數據,如圖36例如,以“產品、城市、時間”三維數據,如圖363.4.1多維數據分析的基本操作

1.切片選定多維數組的一個二維子集的操作叫做切片。例如:對三維數據,通過“切片”,分別從城市和產品等不同的角度觀察銷售情況:

373.4.1多維數據分析的基本操作1.切片372.切塊切塊有兩種情況:(1)在多維數組的某一個維上選定某一區(qū)間的維成員的操作切塊可以看成是在切片的基礎上,確定某一個維成員的區(qū)間得到的片段,也即由多個切片疊合起來。(2)選定多維數組的一個三維子集的操作在多維數組(維1,維2,……,維n,變量)中選定3個維,維i、維j、維k,在這3個維上分別取一個區(qū)間,或任意維成員,而其它維都取定一個維成員。382.切塊切塊有兩種情況:383.鉆取鉆取有向下鉆?。╠rilldown)和向上鉆取(drillup)操作。向下鉆取是使用戶在多層數據中能通過導航信息而獲得更多的細節(jié)性數據。向上鉆取獲取概括性的數據。393.鉆取鉆取有向下鉆取(drilldown)和向上鉆?。ㄣ@?。豪纾?005年各部門銷售收入表如下:40鉆?。豪纾?005年各部門銷售收入表如下:40對時間維進行下鉆操作,獲得新表如下:2005年部門1季度2季度3季度4季度部門1200200350150部門225050150150部門320015018027041對時間維進行下鉆操作,獲得新表如下:2005年部門1季度2季4.旋轉通過旋轉可以得到不同視角的數據。旋轉操作相當于平面數據將坐標軸旋轉。例如,旋轉可能包含了交換行和列,或是把某一個行維移到列維中去。或是把頁面顯示中的一個維和頁面外的維進行交換(令其成為新的行或列中的一個)424.旋轉通過旋轉可以得到不同視角的數據。旋轉操作相當于平面數旋轉時間維產品維產品維時間維(a)行列交換旋轉以改變顯示布局時間維地區(qū)維產品維時間維產品維地區(qū)維43旋轉時間維產品維產品維時間維(a)行列交換旋轉以改變時間維旋轉前的數據實例旋轉后的數據旋轉后再切片44旋轉前的數據實例旋轉后的數據旋轉后再切片443.4.2廣義OLAP功能

1、基本代理操作

當系統(tǒng)處于某種特殊狀態(tài)時“代理”提醒分析員。

(1)示警報告

定義一些條件,一但條件滿足,系統(tǒng)會提醒分析員去做分析。如每日報告完成或月定貨完成等通知分析員作分析。(2)時間報告按日歷和時鐘提醒分析員。

(3)異常報告

當超出邊界條件時提醒分析員。如銷售情況已超出預定義閾值的上限或下限時提醒分析員。453.4.2廣義OLAP功能1、基本代理操作452.數據分析模型E.F.Codd將數據模型分為4類模型:(1)絕對模型通過比較歷史數據值或行為來描述過去發(fā)生的事實。絕對模型只能對歷史數據進行比較,并且利用回歸分析等一些分析方法得出趨勢信息。462.數據分析模型E.F.Codd將數據模型分為4類模型:(2)解釋模型利用系統(tǒng)已有的多層次的綜合路徑層層細化,找出事實發(fā)生的原因。

假設今年銷售量下降,那么解釋模型應當能找出原因,即下滑與時間、地區(qū)、商品及銷售渠道四者中的何種因素有關。47(2)解釋模型利用系統(tǒng)已有的多層次的綜合路徑層層細化,找出事(3)思考模型說明在一維或多維上引入一組具體變量或參數后將會發(fā)生什么。例如該公司決策者為了了解某商品的銷售量是否與顧客的年齡有關,引入了行變量-年齡,即在當前的多維視圖上增加了顧客的年齡維。48(3)思考模型說明在一維或多維上引入一組具體變量或參數后將會(4)公式模型該模型表示在多個維上,需要引入哪些變量或參數,以及引入后所產生的結果。公式模型自動完成上述變量引入工作,從而最終找出與銷量有關的全部因素,并給出了引入后的結果。49(4)公式模型該模型表示在多個維上,需要引入哪些變量或參數,3.商業(yè)分析模型具體的商業(yè)分析模型有:(1)分銷渠道的分析模型(2)客戶利潤貢獻度模型(3)客戶關系(信用)優(yōu)化模型(4)風險評估模型503.商業(yè)分析模型具體的商業(yè)分析模型有:50(1)分銷渠道的分析模型通過客戶、渠道、產品或服務三者之間的關系,了解客戶的購買行為、客戶和渠道對業(yè)務收入的貢獻、哪些客戶比較喜好由什么渠道在何時和銀行打交道。為此,銀行需要建立客戶購買傾向模型和渠道喜好模型等。51(1)分銷渠道的分析模型通過客戶、渠道、產品或服務三者之間的(2)客戶利潤貢獻度模型通過該模型能了解每一位客戶對銀行的總利潤貢獻度。知道哪些利潤高的客戶需要留住,采用什么方法留住客戶,交叉銷售改善客戶的利潤貢獻度,哪些客戶應該爭取,完成個性化服務。52(2)客戶利潤貢獻度模型通過該模型能了解每一位客戶對(3)客戶關系(信用)優(yōu)化模型銀行對客戶的每一筆交易中,知道客戶需要什么產品或服務,例如,定期存款是希望退休養(yǎng)老使用,申請信用卡需要現(xiàn)金消費,詢問放貸利息需要住房貸款等。通過模型計算,主動地對客戶溝通并進行交叉銷售,達到留住客戶和增加利潤的目標。53(3)客戶關系(信用)優(yōu)化模型銀行對客戶的每一筆交易中,知道(4)風險評估模型模擬風險和利潤間的關系,建立風險評估的數學模型,在滿足高利潤、低風險客戶需求的前提下,達到銀行收益的極大化。54(4)風險評估模型模擬風險和利潤間的關系,建立風險評估的數學

假設有一個5維數據模型,5個維分別為:商店,方案,部門,時間,銷售。

1.多維數據存儲

在指定“商店=ALL,方案=現(xiàn)有”情況的三維表(行為部門,列為時間和銷售量)3.4.3多維數據分析實例

55假設有一個5維數據模型,5個維分別為:商店,方案

20042005%增長率銷售量利潤增長%銷售量利潤增長%銷售量利潤增長服裝234,67027.2381,10221.562.4(20.0)家具62,54833.866,00531.15.6(8.0)汽車375,09822.4325,40227.2(13.2)21.4所有其它202,38821.3306,67721.750.71.9指定商店、方案后的三維表

56

20042005%增長率銷售量利潤增長%銷售量利潤增長%銷

20042005%增長率銷售利潤增長%銷售利潤增長%銷售利潤增長汽車375,09822.4325,40227.2(13.2)21.4維修195,05114.2180,78615.0(7.3)5.6附件116,28043.9122,54547.55.38.2音樂63,7678.222,07114.2(63.4)7.3

2、向下鉆取對汽車部門向下鉆取出具體項目的銷售情況和利潤增長情況。

57

20042005%增長率銷售利潤增長%銷售利潤增長%銷售利

2005銷售量服裝381,102家具66,005汽車325,402所有其它306,6773、切片表切片(Slice)操作是除去一些列或行不顯示

58

2005銷售量服裝381,102家具66,005汽車325

2005銷售量現(xiàn)有計劃差量差量%服裝381,102350,00031.18.9家具66,00569,000(2,995)(4.3)汽車325,402300,00025,4028.5所有其它306,677350,000(44,322)12.74、旋轉表這次旋轉操作得到2005年的交叉表方案為:現(xiàn)有、計劃、差量、差量%。59

2005銷售量現(xiàn)有計劃差量差量%服裝381,102350,3.5OLAP結構與分析工具3.5.1OLAP結構3.5.2OLAP的Web結構603.5OLAP結構與分析工具3.5.1OLAP結構603.5.1OLAP結構1.OLAP邏輯結構(1)OLAP視圖:對于用戶來說他是數據倉庫或數據集市中數據的多維數據表示,不管數據怎樣存儲和存儲在何處。(2)數據存儲:要求選擇數據實際存儲的方式和實際存儲的位置,兩種常用的選擇是多維數據存儲和關系數據存儲。613.5.1OLAP結構1.OLAP邏輯結構(1)OLAP視2.OLAP物理結構多維數據存儲放在OLAP服務器中,抽取數據倉庫中的數據,然后將其轉換成多維數據結構,并把OLAP服務器傳給客戶端,這時客戶端就變成”瘦“客戶端,這是一種經典的三層結構。多維數據存儲于客戶端,數據分析也在客戶端,這樣就形成了“胖”客戶端622.OLAP物理結構多維數據存儲放在OLAP服務器中,抽取數3.5.2OLAP的Web結構數據倉庫系統(tǒng)OLAP服務器Web服務器客戶瀏覽器CGIAPIHTMLJavaappletsActiveXcontrolJavascipt當使用web結構組織OLAP應用時,其組織結構如圖所示。Web服務器負責完成瀏覽器與OLAP服務器、數據倉庫系統(tǒng)之間的通信連接。633.5.2OLAP的Web結構數據倉庫系統(tǒng)OLAP服務器W3.5.3OLAP工具及評價目前許多公司已經推出了相應的OLAP支持工具,如ORACLE、IBM、BusinessObject、SAS、NCR等等。OLAP服務器和工具可以按以下五個方面來進行評價:特征和功能、訪問性能、OLAP服務引擎、管理以及全局結構視圖。用戶可以從這五個方面分析市場上的OLAP產品,也可以把它們作為應用系統(tǒng)中OLAP需求分析指標。643.5.3OLAP工具及評價目前許多公司已經推出了相應的OOLAP服務器和工具應能完成以下功能:支持多維和維中的層次;聚集、概括、預計算和導出數據;提供計算邏輯、公式和分析過程;提供比較分析能力;進行跨維計算;沿單個或多個維的軸以及交叉表等來進行細剖和瀏覽。65OLAP服務器和工具應能完成以下功能:支持多維和維中的層次;習題1、2、3、5、9、12、14、15、1866習題1、2、3、5、9、12、14、15、1866第3章聯(lián)機分析處理

3.1OLAP概念3.2OLAP的數據模型3.3多維數據的顯示3.4多維數據分析3.5OLAP的結構與分析工具67第3章聯(lián)機分析處理

3.1OLAP概念1

聯(lián)機分析處理(OnLineAnalyticalProcessing,OLAP)在數據倉庫系統(tǒng)中,聯(lián)機分析處理是重要的數據分析工具。

OLAP的基本思想是從多方面和多角度以多維的形式來觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。68聯(lián)機分析處理(OnLineAnalytic3.1OLAP概念

OLAP是在OLTP的基礎上發(fā)展起來的。

OLTP是以數據庫為基礎的,面對的是操作人員和低層管理人員,對基本數據的查詢和增、刪、改等進行處理。

OLAP是以數據倉庫為基礎的數據分析處理。它有兩個特點:一是在線性(OnLine),由客戶機/服務器這種體系結構來完成的;二是多維分析,這也是OLAP的核心所在。693.1OLAP概念OLAP是在OLTP的基礎上發(fā)3.1.1OLAP定義1.OLAP理事會給出的定義聯(lián)機分析處理(OLAP)是一種軟件技術,它使分析人員能夠迅速、一致、交互地從各個方面觀察信息,以達到深入理解數據的目的。這些信息是從原始數據轉換過來的,按照用戶的理解,它反映了企業(yè)真實的方方面面。703.1.1OLAP定義1.OLAP理事會給出的定義42.OLAP的簡單定義

聯(lián)機分析處理是共享多維信息的快速分析。它體現(xiàn)了四個特征:(1)快速性:用戶對OLAP的快速反應能力有很高的要求。(2)可分析性:OLAP系統(tǒng)應能處理任何邏輯分析和統(tǒng)計分析。(3)多維性:系統(tǒng)必須提供對數據分析的多維視圖和分析。(4)信息性:OLAP系統(tǒng)應能及時獲得信息,并且管理大容量的信息。

712.OLAP的簡單定義聯(lián)機分析處理是共

1993年,E.F.Codd提出OLAP的12條準則,用來評價分析處理工具,這也是他繼關系數據庫和分布式數據庫提出的兩個“12條準則”后提出的第三個“12條準則”。其主要的準則有:多維數據分析;客戶/服務器結構;多用戶支持;一致的報表性能等。

3.1.2OLAP準則

721993年,E.F.Codd提出OLAP的12條準則1.多維概念視圖企業(yè)的數據空間本身就是多維的。因此OLAP的概念模型也應是多維的。用戶可以對多維數據模型進行切片、切塊、旋轉坐標或進行多維的聯(lián)合(概括和聚集)分析。731.多維概念視圖企業(yè)的數據空間本身就是多維的。因此OLAP的4.一致穩(wěn)定的報表性能

報表操作不應隨維數增加而削弱,即當數據維數和數據的綜合層次增加時,提供的報表能力和響應速度不應該有明顯的降低。

744.一致穩(wěn)定的報表性能報表操作不應隨維數增加而削弱5.客戶/服務器體系結構

OLAP是建立在客戶/服務器體系結構上的。

多維數據庫服務器能夠被不同的應用和工具所訪問。

客戶端負責應用邏輯及用戶界面。755.客戶/服務器體系結構OLAP是建立在客戶/服務

8.多用戶支持能力

當多個用戶要在同一分析模式上并行工作,OLAP工具應能夠提供并發(fā)訪問等功能。

11.靈活的報表生成

報表必須充分反映數據分析模型的多維特征,并可按用戶需要的方式來顯示它。768.多用戶支持能力10

OLAP是針對特定問題的聯(lián)機數據訪問和分析。

(1)變量:變量是數據的實際意義,即描述數據“是什么”。

(2)維:維是人們觀察數據的特定角度。如產品維、顧客維、時間維等。

(3)維的層次:數據的細節(jié)不同程度為維的層次。如日、月、季、年是時間維的層次。

(4)維成員:維的一個取值稱為該維的一個維成員。如“某年某月某日”是時間維的一個成員。

3.1.3OLAP的基本概念

77OLAP是針對特定問題的聯(lián)機數據訪問和分析。3.1(5)多維數組:一個多維數組可以表示為:(維1,維2,……,維n,變量)一個4維的結構,即(產品,地區(qū),時間,銷售渠道,銷售額)。(6)數據單元(單元格):多維數組的取值稱為數據單元。如:4維數據單元(牙膏,上海,1998年12月,批發(fā),銷售額為100000)。

OLAP的基本概念(續(xù))78(5)多維數組:一個多維數組可以表示為:OLAP的基本概念(3.2OLAP的數據模型

3.2.1MOLAP數據模型3.2.2ROLAP數據模型3.2.3MOLAP與ROLAP的比較3.2.4HOLAP數據模型793.2OLAP的數據模型3.2.1MOLAP數據模型133.2.1MOLAP的數據模型

MOLAP是基于多維數據庫存儲方式建立的OLAP;表現(xiàn)為“超立方”結構,采用類似于多維數組的結構。例如,二維MDDB(數組,即矩陣)的數據組織見表3.1所示。

北京上海廣州衣服600700500鞋800900700帽子10020080表3.1MOLAP的數據模型803.2.1MOLAP的數據模型MOLAP是基于多維在查詢中除查詢一般的“衣服在廣州的銷售量”外,有時查詢“衣服的總銷售量”等問題,涉及到多個數據項求和,如果采取臨時進行累加,會使查詢效率大大降低,為此需增加匯總數據項。

北京上海廣州總和衣服6007005001800鞋8009007002400帽子10020080380總和1500180012804580表多維數據庫中晗綜合數據的組織81在查詢中除查詢一般的“衣服在廣州的銷售量”外,有時3.2.2ROLAP數據模型ROLAP是基于關系數據庫的OLAP。它是一個平面結構,用關系數據庫表示多維數據時,采用星型模型。823.2.2ROLAP數據模型ROLAP是基于關系數據庫的OL產品名地區(qū)銷售量衣服北京600衣服上海700衣服廣州500鞋北京800鞋上海900鞋廣州700帽子北京100帽子上海200帽子廣州80表3.3關系數據庫RDBMS數據組織83產品名地區(qū)銷售量衣服北京600衣服上海700衣服廣州500鞋3.2.3MOLAP與ROLAP的比較1.數據存取速度2.數據存儲的容量3.多維計算的能力4.維度變化的適應性5.數據變化的適應性6.軟硬件平臺的適應性7.元數據管理843.2.3MOLAP與ROLAP的比較1.數據存取速度181.數據存取速度ROLAP服務器需要將SQL語句轉化為多維存儲語句,臨時“拼合”出多維數據立方體。因此,ROLAP的響應時間較長。

MOLAP在數據存儲速度上性能好,響應速度快。851.數據存取速度ROLAP服務器需要將SQL語句轉化為多維存2.數據存儲的容量ROLAP使用的傳統(tǒng)關系數據庫的存儲方法,在存儲容量上基本沒有限制。MOLAP通常采用多平面疊加成立體的方式存放數據。當數據量超過操作系統(tǒng)最大文件長度時,需要進行數據分割。多維數據庫的數據量級難以達到太大的字節(jié)級。862.數據存儲的容量ROLAP使用的傳統(tǒng)關系數據庫的存儲方法,3.多維計算的能力MOLAP能夠支持高性能的決策支持計算。ROLAP無法完成多行的計算和維之間的計算。873.多維計算的能力MOLAP能夠支持高性能的決策支持計算。24.維度變化的適應性MOLAP增加新的維度,則多維數據庫通常需要重新建立。ROLAP對于維表的變更有很好的適應性。884.維度變化的適應性MOLAP增加新的維度,則多維數據庫通常5.數據變化的適應性當數據頻繁的變化時,MOLAP需要進行大量的重新計算,甚至重新建立索引乃至重構多維數據庫。在ROLAP中靈活性較好,對于數據變化的適應性高。895.數據變化的適應性當數據頻繁的變化時,MOLAP需要進行大6.軟硬件平臺的適應性ROLAP對軟硬件平臺的適應性很好,而MOLAP相對較差。7.元數據管理目前在元數據的管理,MOLAP和ROLAP都沒有成形的標準。906.軟硬件平臺的適應性24MOLAP和ROLAP的對比簡表MOLAPROLAP固定維可變維維交叉計算多維視圖行級計算超大型數據庫讀-寫應用維數據變化速度快數據集市數據倉庫91MOLAP和ROLAP的對比簡表MOLAPROLAP固定維可3.2.4HOLAP數據模型HOLAP(HybridOLAP),即混和OLAP介于MOLAP和ROLAP之間。在HOLAP中,對最常用的維度和維層次,使用多維數據表來存儲,對于用戶不常用的維度和數據,采用ROLAP星型結構來存儲。在HOLAP的多維數據表中的數據維度少于MOLAP中的維度表,數據存儲容量也少于MOLAP方式。HOLAP在數據存取速度上又低于MOLAP。923.2.4HOLAP數據模型HOLAP(HybridOL3.3多維數據的顯示3.3.1多維數據顯示方法3.3.2多維類型結構(MTS)3.3.3多維數據的分析視圖933.3多維數據的顯示3.3.1多維數據顯示方法273.3.1多維數據顯示方法多維數據的顯示只能在平面上展現(xiàn)出來。三維數據無法在平面上展現(xiàn)出來。三維數據顯示見表3.6所示。943.3.1多維數據顯示方法多維數據的顯示只能在平面上展現(xiàn)出產品名地區(qū) 時間銷售量衣服北京1月100衣服北京2月200衣服北京3月300衣服上海1月200衣服上海2月300衣服上海3月400衣服廣州1月150衣服廣州2月250衣服廣州3月300鞋北京1月150鞋北京2月300鞋北京3月350鞋上海1月200鞋上海2月300鞋上海3月400鞋廣州1月150鞋廣州2月250鞋廣州3月300…………95產品名地區(qū) 時間銷售量衣服北京1月100衣服北京2月200衣3.3.2多維類型結構(MTS)表示方法是:每一個維度用一條線段來表示。維度中的每一個成員都用線段上的一個單位區(qū)間來表示。例如,用三個線段分別表示時間、產品和指標三個維的多維類型結構如圖3.3所示。963.3.2多維類型結構(MTS)表示方法是:每一個維度用一在圖3.3多維類型結構(MTS)中,指定時間維成員是3月,產品維成員是鞋,指標維成員是銷售量,這樣它代表了三維數據總得一個空間數據點,如圖3.4所示。97在圖3.3多維類型結構(MTS)中,指定時間維成員是3月,產3.3.3多維數據的分析視圖在平面的屏幕上顯示多維數據,是利用行、列和頁面三個顯示組來表示的。例如,對上例的四維MTS實例,在頁面上選定商店維度中“商店3”,在行中選定時間維的“1月、2月、3月”共3個成員,在列中選定產品維中的“上衣、褲、帽子”三個成員,以及指標維中的“固定成本、直接銷售”二個成員。該四維數據的顯示如圖3.6所示。商店3(頁面)上衣褲帽子直接銷售固定成本直接銷售固定成本直接銷售固定成本1月4503505504505004002月3802804603604003203月400310480410450400983.3.3多維數據的分析視圖在平面的屏幕上顯示多維數據,是利對于更多維度的數據顯示,需要選擇維度及其成員分布在行或者列中。在頁面上可以選定多個維度,但每個維度只能顯示一個成員。在行或者列中一般只選擇二個維,每個維可以多個成員。例如,對6個維度數據,它的MTS如圖3.7所示。99對于更多維度的數據顯示,需要選擇維度及其成員分布在行或者列中對以上6維數據中,設定頁面維度為商店的成員是“商店3”,客戶維度成員是“老年”。行維度含時間維和產品維共2個維度,其中時間維中成員為“1月、2月、3月”。產品維中成員為“桌子、臺燈”。列維度含指標維和場景維共2個維度,其中指標維中成員為“直接銷售、間接銷售、總銷售”。場景維中成員為“實際、計劃”。具體的顯示數據如圖3.8所示。商店3,老年(頁面)直接銷售間接銷售總銷售實際計劃實際計劃實際計劃1月桌子250300125150375450臺燈2653201331604004802月桌子333400167200500600臺燈2833401421704255103月桌子350420175210525630臺燈250300125150375450100對以上6維數據中,設定頁面維度為商店的成員是“商店3”,客戶3.4OALP的多維數據分析3.4.1多維數據分析的基本操作3.4.2廣義OLAP功能3.4.3多維數據分析實例1013.4OALP的多維數據分析3.4.1多維數據分析的基本操作例如,以“產品、城市、時間”三維數據,如圖102例如,以“產品、城市、時間”三維數據,如圖363.4.1多維數據分析的基本操作

1.切片選定多維數組的一個二維子集的操作叫做切片。例如:對三維數據,通過“切片”,分別從城市和產品等不同的角度觀察銷售情況:

1033.4.1多維數據分析的基本操作1.切片372.切塊切塊有兩種情況:(1)在多維數組的某一個維上選定某一區(qū)間的維成員的操作切塊可以看成是在切片的基礎上,確定某一個維成員的區(qū)間得到的片段,也即由多個切片疊合起來。(2)選定多維數組的一個三維子集的操作在多維數組(維1,維2,……,維n,變量)中選定3個維,維i、維j、維k,在這3個維上分別取一個區(qū)間,或任意維成員,而其它維都取定一個維成員。1042.切塊切塊有兩種情況:383.鉆取鉆取有向下鉆?。╠rilldown)和向上鉆?。╠rillup)操作。向下鉆取是使用戶在多層數據中能通過導航信息而獲得更多的細節(jié)性數據。向上鉆取獲取概括性的數據。1053.鉆取鉆取有向下鉆?。╠rilldown)和向上鉆取(鉆?。豪纾?005年各部門銷售收入表如下:106鉆?。豪纾?005年各部門銷售收入表如下:40對時間維進行下鉆操作,獲得新表如下:2005年部門1季度2季度3季度4季度部門1200200350150部門225050150150部門3200150180270107對時間維進行下鉆操作,獲得新表如下:2005年部門1季度2季4.旋轉通過旋轉可以得到不同視角的數據。旋轉操作相當于平面數據將坐標軸旋轉。例如,旋轉可能包含了交換行和列,或是把某一個行維移到列維中去。或是把頁面顯示中的一個維和頁面外的維進行交換(令其成為新的行或列中的一個)1084.旋轉通過旋轉可以得到不同視角的數據。旋轉操作相當于平面數旋轉時間維產品維產品維時間維(a)行列交換旋轉以改變顯示布局時間維地區(qū)維產品維時間維產品維地區(qū)維109旋轉時間維產品維產品維時間維(a)行列交換旋轉以改變時間維旋轉前的數據實例旋轉后的數據旋轉后再切片110旋轉前的數據實例旋轉后的數據旋轉后再切片443.4.2廣義OLAP功能

1、基本代理操作

當系統(tǒng)處于某種特殊狀態(tài)時“代理”提醒分析員。

(1)示警報告

定義一些條件,一但條件滿足,系統(tǒng)會提醒分析員去做分析。如每日報告完成或月定貨完成等通知分析員作分析。(2)時間報告按日歷和時鐘提醒分析員。

(3)異常報告

當超出邊界條件時提醒分析員。如銷售情況已超出預定義閾值的上限或下限時提醒分析員。1113.4.2廣義OLAP功能1、基本代理操作452.數據分析模型E.F.Codd將數據模型分為4類模型:(1)絕對模型通過比較歷史數據值或行為來描述過去發(fā)生的事實。絕對模型只能對歷史數據進行比較,并且利用回歸分析等一些分析方法得出趨勢信息。1122.數據分析模型E.F.Codd將數據模型分為4類模型:(2)解釋模型利用系統(tǒng)已有的多層次的綜合路徑層層細化,找出事實發(fā)生的原因。

假設今年銷售量下降,那么解釋模型應當能找出原因,即下滑與時間、地區(qū)、商品及銷售渠道四者中的何種因素有關。113(2)解釋模型利用系統(tǒng)已有的多層次的綜合路徑層層細化,找出事(3)思考模型說明在一維或多維上引入一組具體變量或參數后將會發(fā)生什么。例如該公司決策者為了了解某商品的銷售量是否與顧客的年齡有關,引入了行變量-年齡,即在當前的多維視圖上增加了顧客的年齡維。114(3)思考模型說明在一維或多維上引入一組具體變量或參數后將會(4)公式模型該模型表示在多個維上,需要引入哪些變量或參數,以及引入后所產生的結果。公式模型自動完成上述變量引入工作,從而最終找出與銷量有關的全部因素,并給出了引入后的結果。115(4)公式模型該模型表示在多個維上,需要引入哪些變量或參數,3.商業(yè)分析模型具體的商業(yè)分析模型有:(1)分銷渠道的分析模型(2)客戶利潤貢獻度模型(3)客戶關系(信用)優(yōu)化模型(4)風險評估模型1163.商業(yè)分析模型具體的商業(yè)分析模型有:50(1)分銷渠道的分析模型通過客戶、渠道、產品或服務三者之間的關系,了解客戶的購買行為、客戶和渠道對業(yè)務收入的貢獻、哪些客戶比較喜好由什么渠道在何時和銀行打交道。為此,銀行需要建立客戶購買傾向模型和渠道喜好模型等。117(1)分銷渠道的分析模型通過客戶、渠道、產品或服務三者之間的(2)客戶利潤貢獻度模型通過該模型能了解每一位客戶對銀行的總利潤貢獻度。知道哪些利潤高的客戶需要留住,采用什么方法留住客戶,交叉銷售改善客戶的利潤貢獻度,哪些客戶應該爭取,完成個性化服務。118(2)客戶利潤貢獻度模型通過該模型能了解每一位客戶對(3)客戶關系(信用)優(yōu)化模型銀行對客戶的每一筆交易中,知道客戶需要什么產品或服務,例如,定期存款是希望退休養(yǎng)老使用,申請信用卡需要現(xiàn)金消費,詢問放貸利息需要住房貸款等。通過模型計算,主動地對客戶溝通并進行交叉銷售,達到留住客戶和增加利潤的目標。119(3)客戶關系(信用)優(yōu)化模型銀行對客戶的每一筆交易中,知道(4)風險評估模型模擬風險和利潤間的關系,建立風險評估的數學模型,在滿足高利潤、低風險客戶需求的前提下,達到銀行收益的極大化。120(4)風險評估模型模擬風險和利潤間的關系,建立風險評估的數學

假設有一個5維數據模型,5個維分別為:商店,方案,部門,時間,銷售。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論