數據倉庫的構建及其多維數據集分析_第1頁
數據倉庫的構建及其多維數據集分析_第2頁
數據倉庫的構建及其多維數據集分析_第3頁
數據倉庫的構建及其多維數據集分析_第4頁
數據倉庫的構建及其多維數據集分析_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、科技廣場 2007.6208入 (Import 、 導出 (Export 以及轉換的服務。 DTS 中最常 用的兩大工具是DTS向導和 DTS設計器, 因為本文涉及的數 據轉換是由多個表取得數據并轉換至目的數據庫, 因此選擇 DTS設計器。將Northwind數據庫中的數據轉移到數據倉庫的目的數 據庫中, 遵循以下步驟:設置數據源;設置數據目的地; 設置轉換方式;將數據轉移任務存儲為一個包;執(zhí)行包 進行實際數據轉移。在正式進行數據轉換之前, 首先要為Northwind的數據 倉庫新建一個數據庫Northwind_DW, 這樣數據源和數據目的 地分別為數據庫Northwind和 Northwin

2、d_DW。 然后激活DTS 設計器并創(chuàng)建轉移數據包NorthwindToNorthwind_DW。 接下來便可以進行事實表和維度表的數據轉換任務了, 這個過程是將源數據庫中的某些表中的字段抽取出來, 進行 相應的組合和轉換, 生成目的數據庫中的事實表或維度表, 這些工作都可用SQL語句及VB轉換腳本語句來完成。 以事實 表 Sales 為例, 在其轉換數據任務屬性中, 對應的 SQL 語句 如下:SELECTe.EmployeeID,p.ProductID,s.SupplierID,c. CustomerID,o.OrderDate,od.Quantity,od.UnitPrice,od. D

3、iscountFROMOrderso,OrderDetailsod,Employeese, Productsp,Supplierss,CustomerscWHEREo.OrderID=od.OrderIDANDo.EmployeeID=e. EmployeeIDANDo.CustomerID=c.CustomerIDANDod. ProductID=p.ProductIDANDp.SupplierID=s.SupplierID 除了以上抽取出的字段外, 事實表Sales還包含一個度 量值字段Total, 是將已抽取出的字段UnitPrice、 Discount、 Quantity進行組合轉換而

4、成, 對應的VB轉換腳本語句如下 : FunctionMain(DTSDestination("Total"=DTSSource("UnitPrice" *D T S S o u r c e (" Q u a n t i t y " *(1. 0-D T S S o u r c e ("Discount"Main=DTSTransformStat_OKEndFunction員工維度表Employee數據轉換方法同事實表數據轉換方 法, 其它維度表數據轉換更容易, 方法基本相同, 只是在進 行轉換選項時, 不需要選擇

5、新建選項。至此, 數據轉換包設計完畢, 保存并執(zhí)行, 便將數據由 Northwind數據庫加載到Northwind_DW中。 最后進行設置表 的主鍵和外鍵工作。3多維數據集分析在分析數據時, 用戶往往并不是以單一的維度為基準, 而是以多個維度為依據。 譬如在Northwind的數據倉庫中包 括了員工、 顧客、 產品、 供貨商以及時間等 5個維度, 就會 經常有查詢某供應商于某年提供了多少金額的某產品或查詢 某員工于某年銷售了多少金額的產品給某顧客等這類查詢。 正因為用戶查詢具有使用多重維度的特點, 所以應該將多個 維度集合在一起成為一個單位, 即構成一個多維數據集。 微軟公司在SQLServe

6、r2000上提供了AnalysisSer- vices 5,是數據倉庫的解決方案,其主要組件是分析服務器AnalysisServer, 它是執(zhí)行于 Windows2000或WindowsNT服務器上的一個服務, 會由數據倉庫中抽取信息, 并且生成多維數據集 6。激活管理分析服務器的工具AnalysisManager, 創(chuàng)建一個存儲多維數據集的數據庫Northwind_OLAP, 設置數據源為前面已創(chuàng)建好的數據庫Northwind_DW, 然后按以下步驟創(chuàng)建多維數據集:從數據源中選擇事實數據表Sales。從事實表中選取字段 Total、 Quantity、 UnitPrice、 Discount

7、作為多維數據集度量值。創(chuàng)建星型架構維度。 從數據源中分別選擇與Sales表呈星型架構的維度表Customer、 Supplier、 Employee、 Time創(chuàng)建顧客維度、 供貨商維度、 員工維度和時間維度, 其中顧客維度包括Country、 Region、 City和CustomerName四個級別, 前者為父級別, 后者為子級別;供貨商維度和員工維度包括的級別分別為SupplierName和Name;時間維度級別選擇【年,季度,月】 。創(chuàng)建雪花架構維度。從數據源中同時選中維度表 Product和Category創(chuàng)建與Sales事實表呈雪花架構的產品維度, 維度級別包括CategoryNa

8、me和ProductName, 前者為父級別, 后者為子級別。創(chuàng)建好所有的維度后, 將多維數據集命名為CUBE5并存儲處理,即可瀏覽數據了,如圖二所示。4結束語在進行數據倉庫項目開發(fā)過程中, 數據的抽取轉換工作是重點, 直接關系到數據倉庫中數據的好壞, 而如何訪問數據倉庫中的數據也是用戶所關心的問題, 本文以SQLServer2000中的Northwind數據庫為模板, 探討了一個商用數據倉庫的創(chuàng)建以及對其進行多維數據集分析的一般過程。 如何對已有的數據倉庫采用適當的算法進行數據挖掘, 為高層領導提供有用的決策信息, 是筆者下一步要研究的方向。參考文獻1InmonWH.BuildingtheDataWarehouseM.USA:ByWileyComputerPublishing,JohnWiley&Sons,Inc.1998.2李超, 余昭平.基于最大模式的關聯規(guī)則挖掘算法研究J.微計算機信息,2006, (22:2-3.3羅會蘭.數據提取、 轉換和裝載技術研究J.計算機工程與設計,2004, (255:761-765.4郭和偉,孫德寶等.數據倉庫實現過程及在線分析J.計算機與應用化學,2004, (212:293-298.5沈兆陽.SQLServer2000OLAP解決方案:數據

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論