版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第九講OLAP技術本講講授目標:1.OLAP技術概念2.OLAP與多維分析3.OLAP的實施4.多維OLAP與關系OLAP5.OLAP技術評價1一.OLAP技術概念OLAP——在線分析處理或聯(lián)機分析處理,是一個應用廣泛的數據倉庫使用技術。主要特點,在線性(On_Line),多維分析(Multi_Analysis)OLAP的作用:針對特定問題的聯(lián)機數據查詢和分析對原始數據按照用戶的觀點進行轉換處理反映用戶眼中問題某一真實方面(“維”)快速、穩(wěn)定、一致和交互式的存取允許用戶對這些數據按照需要進行深入的觀察2OLAP的特性快速性系統(tǒng)能在數秒內對用戶的多數分析要求做出反應可分析性用戶無需編程就可以定義新的專門計算,將其作為分析的一部分,并以用戶所希望的方式給出報告多維性提供對數據分析的多維視圖和分析信息性能及時獲得信息,并且管理大容量信息3二.OLAP與多維分析維
維、維的層次、維成員、多維數據集、數據單元、多維數據集的度量值和聚集維的操作:“上卷”(roll_up),“下鉆”(drill_down)銷售地區(qū)西南華中華東四川云南河南湖北江蘇上海4OLAP與多維分析多維數據集銷售數量:10000服裝切片產品北京上?;瘖y品江蘇玩具服裝電器
1234時間(月)5OLAP與多維分析維成員維的一個取值、不同維層次取值的組合、維成員描述所關心的主題在維中的位置數據單元可以表示為:(維1維成員,維2維成員,維3維成員,維4維成員,觀察變量值)多維數據集的度量值多維數據集的核心值聚集立方體中包括很多層次,這些層次可以向用戶提供某一層次的概括數據通過聚集,形成基于維的有決策分析意義的一些數據交集6多維分析方法多維的切片
(維1,維2,……,維i成員,……,維n,觀察變量)是多維數據集(維1,維2,……,維i,……,維n,觀察變量)在維i上的一個切片
多維的切塊在(維1,維2,……,維i,……,維k,……,維n,觀察變量)多維數據集上,對維i,……,維k,選定了維成員,那(維1,維2,……,維i成員,……,維k成員,……,維n,觀察變量)就是多維數據集(維1,維2,……,維i,……,維k,……,維n,觀察變量)在維i,……,維k上的一個切塊7多維分析方法旋轉2002年2003年1季度2季度3季度4季度1季度2季度3季度4季度北京市123564566134562355上海市13410398871021399782天津市6773599673696294
北京市上海市天津市
2002年1季度12313467
2季度5610373
3季度459859
4季度6687962003年1季度13410273
2季度5613969
3季度239762
4季度5582948多維分析方法4.其它OLAP操作“上卷”(roll_up)、“下鉆”(drill_down)、“鉆過”(drill_across)和“鉆透”(drill_through)等鉆取操作。“上卷”是指沿某一個維的概念分層向上歸約;“下鉆”是上卷的逆向操作,它是沿某一個維的概念分層向下或引入新的維來實現(xiàn);“鉆過”是指對多個事實表進行查詢;“鉆透”是指對立方體操作時,利用數據庫關系,鉆透立方體的底層,進入后端的關系表。OLAP的其它操作還有統(tǒng)計表中最高值和最低值的項數,計算平均值、增長率、利潤、投資回報率等統(tǒng)計計算。9三.OLAP的實施
業(yè)務處理系統(tǒng)第三層第二層第一層數據抽取客戶端數據清理、轉換
數據加載多維化處理可視化處理
OLAP的實施數據倉庫OLAP服務器數據準備區(qū)10四.OLAP的存儲方式基于關系表的存儲方式——ROLAP
基于關系表的存儲方式是將數據倉庫的數據存儲在關系型數據庫的表結構中,在元數據的管理下完成數據倉庫的功能。多維數據庫存儲方式——MOLAP
多維數據庫的組織方式是直接面向OLAP分析操作的數據組織形式。這種數據庫產品也比較多,實現(xiàn)方法也不盡相同。其數據組織采用多維數據結構文件進行存儲,并有維索引及相應的元數據與其對應。11ROLAP星型模式在關系數據庫中的表示
產品ID
時間ID銷售商ID
地址ID
星型模式的關系數據庫表示產品ID銷售商ID地址ID時間ID銷售數量銷售成本總收入銷售商維度表地理位置維表時間維表產品維表12MOLAP產品名稱銷售地區(qū)銷售數量電器電器電器服裝服裝服裝江蘇上海北京江蘇上海北京940450340830350270江蘇上海北京電器服裝94083045035034027013MOLAP產品名稱銷售地區(qū)銷售數量電器電器電器電器服裝服裝服裝服裝匯總匯總匯總匯總江蘇上海北京匯總江蘇上海北京匯總江蘇上海北京匯總9404503401730830350270145017708006103180江蘇上海北京匯總電器服裝匯總940830177045035080034027061017301450318014五.OLAP技術評價1.MOLAP與ROLAP的比較(1)查詢性能(2)數據加載性能(3)分析能力(4)數據集市的大小(5)維的管理(6)維護能力15五.OLAP技術評價2.OLAP的衡量標準(1)多維性(2)直觀性(3)可訪問性(4)解釋性批處理提取(5)OLAP分析模型(6)客戶機/服務器結構性(7)透明性或開放性(8)多用戶性(9)處理非正規(guī)數據性…16五.OLAP技術評價2.OLAP服務器和工具的評價標準(1)OLAP功能(2)訪問性能(3)引擎功能(4)管理能力17六.案例研究羅斯文商貿是美國的一家從事特色食品進出口的跨國(虛擬)公司。其經營的產品涵蓋了飲料、調味品、點心、日用品、谷類/麥片、肉/家禽、特制品及海鮮等類別。該公司每天處理來自世界各地的客戶的訂單,通過歸類整理后,將由供貨商處購買的產品,交給當地的的運貨商,將產品送達客戶的手中。18基本業(yè)務流程19羅斯文商貿管理系統(tǒng)該管理系統(tǒng)是一個典型的數據庫應用系統(tǒng),包括對產品、訂單、訂單明細、供應商、雇員、客戶、產品類別和運貨商等數據進行輸入、修改、瀏覽、查找,以及打印報表等信息管理常用功能。數據庫中包含的表:Orders,OrderDetails,Products,Categories,Suppliers,Customers,Shippers,Employees等2021設計數據倉庫架構需求分析識別事實與維度設計邏輯模型設計事實表設計維度表分析多重維度架構22需求分析根據調查,得到主管希望的分析結果:希望能夠針對每一員工作銷售業(yè)績分析;希望能夠針對每一產品作銷售業(yè)績分析;希望能夠針對每一分類的產品作銷售分析;希望能夠針對每一供貨商作產品銷售分析;希望能夠針對每一顧客作銷售分析;希望能夠針對每一個國家的顧客作銷售分析;希望能夠針對每一城市的顧客作銷售分析;希望能夠針對年、季、月作銷售分析……23需求分析針對以上分析要求,不難看出分析的基準點可以分為以下5個大類:顧客除了可以作單顧客的分析之外,還可以以國別、地區(qū)、城市來作分析,它們是具有層次式的關系,國別可以向下細分為地區(qū),地區(qū)可以向下細分為城市員工以單一員工來作分析產品除了可以作單一產品的分析之外,還可以以產品分類來作分析供應商以單一的供貨商來作分析時間具有先天的層次關系,所分析的需求是年、季以及月份。分析數據倉庫所需數據的來源24信息包圖顧客員工銷售產品供應商時間顧客號員工號產品號供應商年國家產品類別季度地區(qū)月城市指標和事實:銷售量、銷售總價值信息包:銷售分析 維度類別2526識別事實與維度數據從所分析的各項數據的來源(各個表),識別哪些是事實數據,哪些是維度數據?27設計邏輯模型星型雪花架構員工維度供應商維度顧客維度時間維度產品維度產品詳細類別銷售事實表28事實表與維度表關系29設計事實表事實表名稱:Sales數據源:Orders、OrderDetails、Employees、Products、Suppliers、CustomersSQL語句SELECTe.EmployeeID,p.ProductID,s.SupplierID,c.CustomerID,o.OrderDate,od.Quantity,
od.UnitPrice,od.DiscountFROMOrderso,[OrderDetails]od,Employeese,Productsp,Supplierss,CustomerscWHEREo.OrderID=od.orderID
ANDo.EmployeeID=e.EmployeeIDAND
o.CustomerID=c.CustomerID
ANDod.ProductID=p.ProductIDANDp.SupplierID=s.SupplierID
30設計維度表Employee維度表
SelectEmployeeID,FirstName,LastName,Ti
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 西京學院《室內陳設設計》2022-2023學年第一學期期末試卷
- 音樂萬馬奔騰課件
- 西京學院《版面設計》2023-2024學年第一學期期末試卷
- 西華師范大學《小學語文課程與教學》2022-2023學年第一學期期末試卷
- 西華師范大學《水污染防治技術》2023-2024學年第一學期期末試卷
- 西華師范大學《攝影與攝像技藝》2021-2022學年第一學期期末試卷
- 9正確認識廣告 說課稿-2024-2025學年道德與法治四年級上冊統(tǒng)編版
- 電工高級工專項測試題及答案
- 第十二章第二節(jié)《滑輪》說課稿 -2023-2024學年人教版八年級物理下冊
- 2024年代森錳鋅行業(yè)前景分析:代森錳鋅行業(yè)發(fā)展趨勢推動行業(yè)國際化
- 拆除設施交接手續(xù)(參考模板)
- 古樹保護施工組織設計
- 平行四邊形和梯形整理與復習
- 肉牛屠宰公司組織機構加各個崗位職責
- 小學英語人教PEP三年級起點四年級上冊英語全冊
- 基站機房設計標準規(guī)范(1)
- 鋼絲繩的安全載重表
- 高中數學函數評課稿
- 購并技巧與案例解析
- 當代西方國家議會制度
- structure-.---中文使用手冊
評論
0/150
提交評論