數(shù)據(jù)倉庫開發(fā)應用過程PPT教案_第1頁
數(shù)據(jù)倉庫開發(fā)應用過程PPT教案_第2頁
數(shù)據(jù)倉庫開發(fā)應用過程PPT教案_第3頁
數(shù)據(jù)倉庫開發(fā)應用過程PPT教案_第4頁
數(shù)據(jù)倉庫開發(fā)應用過程PPT教案_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)據(jù)倉庫開發(fā)應用過程數(shù)據(jù)倉庫開發(fā)應用過程第1頁/共53頁第2頁/共53頁設計體系結構開發(fā)概念模型開發(fā)邏輯模型數(shù)據(jù)庫與元數(shù)據(jù)設計數(shù)據(jù)抽取轉換與加載開發(fā)中間件填充與測試數(shù)據(jù)倉庫數(shù)據(jù)倉庫應用數(shù)據(jù)倉庫維護數(shù)據(jù)倉庫評價規(guī)劃與確定需求 規(guī)劃 分析階段 數(shù)據(jù)倉庫 開發(fā)過程 設計實施 使用維護階段 階段第3頁/共53頁第4頁/共53頁開發(fā)策略主要有:自頂向下:自頂向下:實際應用比較困難 。自底向上:自底向上:用于一個數(shù)據(jù)集市或一個部門的數(shù)據(jù)倉庫開發(fā) ,容易獲得成功 。兩種策略的聯(lián)合使用 :能夠快速地完成數(shù)據(jù)倉庫的開發(fā)與應用,而且還可以建立具有長遠價值的數(shù)據(jù)倉庫方案。在實際使用中難以操作 。第5頁/共53頁 首

2、要目標是確定所需要信息的范圍,確定數(shù)據(jù)倉庫在為用戶提供決策幫助時,在主題和指標領域需要哪些數(shù)據(jù)源。 另一個重要目標是確定利用哪些方法和工具訪問和導航數(shù)據(jù)? 其它目標是確定數(shù)據(jù)倉庫內(nèi)部數(shù)據(jù)的規(guī)模 使用范圍確定從用戶的角度分析 從技術的角度分析 第6頁/共53頁1.數(shù)據(jù)倉庫的應用結構數(shù)據(jù)倉庫的應用結構 基于業(yè)務處理系統(tǒng)的數(shù)據(jù)倉庫基于業(yè)務處理系統(tǒng)的數(shù)據(jù)倉庫 單純數(shù)據(jù)倉庫單純數(shù)據(jù)倉庫 單純數(shù)據(jù)集市單純數(shù)據(jù)集市 數(shù)據(jù)倉庫和數(shù)據(jù)集市數(shù)據(jù)倉庫和數(shù)據(jù)集市 2.數(shù)據(jù)倉庫的技術平臺結構數(shù)據(jù)倉庫的技術平臺結構單層結構單層結構 客戶客戶/服務器兩層結構服務器兩層結構 三層客戶三層客戶/服務器服務器 多層式結構多層式結

3、構 第7頁/共53頁l實際使用方案是一個非常重要的需求原型,可以將最終用戶的決策支持要求與數(shù)據(jù)倉庫的技術要求聯(lián)系起來 l開發(fā)方案的預算進行估計 l編制數(shù)據(jù)倉庫開發(fā)說明書 :說明系統(tǒng)與企業(yè)戰(zhàn)略目標的關系,系統(tǒng)與企業(yè)急需處理的、范圍相對有限的開發(fā)機會。業(yè)務機會的說明以及任務概況說明、重點支持的職能部門和今后工作的建議。計劃中需要闡明期望取得的有形和無形利益業(yè)務價值計劃最好由目標業(yè)務主管來完成規(guī)劃書中要確定數(shù)據(jù)倉庫的開發(fā)目標實現(xiàn)范圍、體系結構和使用方案及開發(fā)預算。第8頁/共53頁概念模型的設計可以分為以下幾個階段:用戶需求調(diào)查、模型定義、模型分析和模型設計。 3.3.1 概念模型的需求調(diào)查概念模型的

4、需求調(diào)查數(shù)據(jù)倉庫開發(fā)的任務書 首先要明確用戶的信息需求 了解管理人員在信息需求方面的內(nèi)容 了解關于信息的來源 組織所使用的系統(tǒng)環(huán)境 第9頁/共53頁1.數(shù)據(jù)倉庫用戶的決策分析數(shù)據(jù)倉庫用戶的決策分析2.支持決策的數(shù)據(jù)需求分析支持決策的數(shù)據(jù)需求分析3.數(shù)據(jù)需求分析工具數(shù)據(jù)需求分析工具決策分析問題決策分析問題客戶購買商品趨勢分析客戶購買商品趨勢分析需求信息類需求信息類日期日期地點地點商品商品客戶年客戶年齡齡組組客戶經(jīng)濟狀客戶經(jīng)濟狀況況客戶信用客戶信用需求信息需求信息1層層需求信息需求信息2層層需求信息需求信息3層層需求信息需求信息4層層需求信息需求信息5層層年年(4)季季(16)月月(48)國家國家

5、(15)省省(60)市市(200)街道街道(2100)商店商店(20000)商品種類商品種類(7)商品小類商品小類(40)商品商品(220)年齡組年齡組(8)經(jīng)濟類經(jīng)濟類(10)信用信用(10)第10頁/共53頁OracleSysbaseSQL ServerVFP其它模式其它模式銷售單輸入銷售單輸入銷售單處理銷售單處理商品管理商品管理預算系統(tǒng)預算系統(tǒng)(Excel)財務計算財務計算庫存控制庫存控制后勤后勤外部數(shù)據(jù)源外部數(shù)據(jù)源商品供應商商品供應商市場調(diào)查公司市場調(diào)查公司第11頁/共53頁 客戶變動信息商品變動信息客戶號商品固有信息 客戶固有 信息 客戶號供應商號開 戶日期 日期銷售數(shù)量 日期 商品

6、號 商品 客戶 銷售第12頁/共53頁經(jīng)濟(年收入)100萬以上10萬以上1萬以上1萬以下地點國家省市銷售銷售數(shù)量銷售價格銷售金額時間ID地點ID商品ID年齡60歲以上40歲以上30歲以上20歲以上20歲以下日期年月日商品種類ID小類ID商品ID信用10萬元以上1萬元以上1千元以上1千元以下 0元第13頁/共53頁經(jīng)濟(年收入)100萬以上10萬以上1萬以上地點國家省市銷售銷售ID銷售數(shù)量銷售價格銷售金額時間ID地點ID商品ID年齡60歲以上40歲以上30歲以上20歲以上20歲以下日期年月日商品ID種類小類商品信用10萬元以上1萬元以上1千元以上1千元以下 0元商品ID生產(chǎn)廠家進貨價格進貨日期

7、客戶客戶ID姓名地址電話郵政編碼第14頁/共53頁1.概念模型設計文檔概念模型設計文檔數(shù)據(jù)倉庫開發(fā)需求分析報告概念模型分析報告概念模型概念模型的評審報告。2.概念模型的評審概念模型的評審 確定概念模型是否完整地、準確地描述了用戶的決策分析環(huán)境。 確認用戶是否已經(jīng)和項目開發(fā)成員之間建立了穩(wěn)定的聯(lián)系? 3.概念模型的評審人員概念模型的評審人員 數(shù)據(jù)倉庫項目負責人、數(shù)據(jù)倉庫分析人員、數(shù)據(jù)倉庫設計人員和數(shù)據(jù)倉庫用戶 4.概念模型的評審內(nèi)容概念模型的評審內(nèi)容 數(shù)據(jù)倉庫開發(fā)任務書;用戶決策分析信息需求調(diào)查表;數(shù)據(jù)倉庫主題;E-R圖、星型模型和雪花模型。 第15頁/共53頁數(shù)據(jù)倉庫的邏輯模型設計任務:數(shù)據(jù)倉

8、庫的邏輯模型設計任務:分析主題域,確定要裝載到數(shù)據(jù)倉庫的主題;確定粒度層次劃分;確定數(shù)據(jù)分割策略;關系模式的定義和記錄系統(tǒng)定義、確定數(shù)據(jù)抽取模型等。邏輯模型最終設計成果:邏輯模型最終設計成果:每個主題的邏輯定義,并將相關內(nèi)容記錄在數(shù)據(jù)倉庫的元數(shù)據(jù)中粒度劃分數(shù)據(jù)分割策略表劃分和數(shù)據(jù)來源等。第16頁/共53頁主題名主題名公共碼鍵公共碼鍵屬性組屬性組商商品品商品號商品號商品固有信息:商品號,商品名,類型,顏色等商品固有信息:商品號,商品名,類型,顏色等商品采購信息:商品號,供應商號,供應價,供應日期,供應量商品采購信息:商品號,供應商號,供應價,供應日期,供應量等等商品庫存信息:商品號,庫房號,庫存

9、量,日期等商品庫存信息:商品號,庫房號,庫存量,日期等銷銷售售銷售單號銷售單號銷售單固有信息:銷售單號,銷售地址等銷售單固有信息:銷售單號,銷售地址等銷售信息:客戶號,商品號,銷售價,銷售量、銷售時間等銷售信息:客戶號,商品號,銷售價,銷售量、銷售時間等客客戶戶客戶號客戶號客戶固有信息:客戶號,客戶名,性別,年齡,文化程度,住址,客戶固有信息:客戶號,客戶名,性別,年齡,文化程度,住址,電話等電話等客戶經(jīng)濟息:客戶號,年收入,家庭總收入等客戶經(jīng)濟息:客戶號,年收入,家庭總收入等第17頁/共53頁3.4.3 確定數(shù)據(jù)分割策略 把邏輯上整體的數(shù)據(jù)分割成較小的、可以獨立管理的物理單元進行存儲 。 便

10、于數(shù)據(jù)的重構、重組和恢復,以提高創(chuàng)建索引和順序掃描的效率 數(shù)據(jù)分割標準:1.數(shù)據(jù)量2.數(shù)據(jù)分析處理的對象3.粒度分割的策略3.4.4 關系模型定義第18頁/共53頁實體的邏輯分析實體所有列的具體特征列名列名列的鍵屬性列的鍵屬性值來源值來源/ /值域值域完整性約束完整性約束類型與大小類型與大小Customer_NCustomer_Numberumber主鍵列、外部主鍵列、外部鍵列鍵列來自客戶實體的合法來自客戶實體的合法客戶鍵列客戶鍵列沒有客戶鍵列,數(shù)據(jù)沒有客戶鍵列,數(shù)據(jù)就不存在就不存在Char(10)Char(10)Order_NumbOrder_Numberer主鍵列、外部主鍵列、外部鍵列鍵列

11、來自銷售單實體的合來自銷售單實體的合法鍵列法鍵列沒有銷售單鍵列,數(shù)沒有銷售單鍵列,數(shù)據(jù)就不存在據(jù)就不存在Char(10)Char(10)Product_NuProduct_Numbermber主鍵列、外部主鍵列、外部鍵列鍵列來自商品實體的合法來自商品實體的合法鍵列鍵列沒有商品鍵列,數(shù)據(jù)沒有商品鍵列,數(shù)據(jù)就不存在就不存在Char(10)Char(10)Product_PrProduct_Priceice正的金額數(shù)正的金額數(shù)Money(floaMoney(float)t)第19頁/共53頁實體實體容量容量更新頻率更新頻率CustomerCustomer中等容量,有中等容量,有100100個重點客戶

12、,個重點客戶,20002000個跟蹤客戶個跟蹤客戶每月對客戶情況進行一次分析,更新頻每月對客戶情況進行一次分析,更新頻率也為每月一次率也為每月一次ProductProduct小容量,小容量,500500種商品種商品大約有大約有500500種商品,商品的更新是每月一種商品,商品的更新是每月一次,數(shù)據(jù)更新也照此。次,數(shù)據(jù)更新也照此。Order_DetOrder_Detailail大容量,其上限是大容量,其上限是354354,000000,000000,000000,考慮到各種客戶類型與各種商,考慮到各種客戶類型與各種商品的組合情況,一般很少達到。品的組合情況,一般很少達到。數(shù)據(jù)每月匯總一次,但是業(yè)

13、務處理系統(tǒng)數(shù)據(jù)每月匯總一次,但是業(yè)務處理系統(tǒng)的數(shù)據(jù)每日需要更新一次,因此更新頻的數(shù)據(jù)每日需要更新一次,因此更新頻率為每日一次。率為每日一次。第20頁/共53頁F1 數(shù)據(jù)抽取規(guī)則P2清理數(shù)據(jù)記錄F8 數(shù)據(jù)清理規(guī)則F2KHCGF5 CQLS_KHCGF6 CQLS_KHCGF7 SJCK_KHCGP4加載到數(shù)據(jù)倉庫F3SPQKF4ZGYJP3數(shù)據(jù)排序聚集P1抽取數(shù)據(jù)源記錄第21頁/共53頁2.數(shù)據(jù)倉庫的數(shù)據(jù)抽取、轉換與加載計劃數(shù)據(jù)倉庫的數(shù)據(jù)抽取、轉換與加載計劃(1)影響數(shù)據(jù)抽取、轉換與加載的因素)影響數(shù)據(jù)抽取、轉換與加載的因素數(shù)據(jù)格式數(shù)據(jù)格式壞數(shù)據(jù)壞數(shù)據(jù)系統(tǒng)的兼容性系統(tǒng)的兼容性數(shù)據(jù)源的變化數(shù)據(jù)源的

14、變化數(shù)據(jù)抽取的時間數(shù)據(jù)抽取的時間全庫比較全庫比較利用程序日志利用程序日志利用數(shù)據(jù)庫日志利用數(shù)據(jù)庫日志利用時間戳或利用位圖索引利用時間戳或利用位圖索引第22頁/共53頁3.數(shù)據(jù)倉庫的數(shù)據(jù)清理轉換方法數(shù)據(jù)倉庫的數(shù)據(jù)清理轉換方法(1)類型轉換(2)串操作(3)數(shù)學函數(shù)(4)參照完整性(5)關鍵字翻譯(6)聚集運算4.數(shù)據(jù)倉庫的數(shù)據(jù)抽取、清理與轉換模型數(shù)據(jù)倉庫的數(shù)據(jù)抽取、清理與轉換模型第23頁/共53頁數(shù)據(jù)平臺數(shù)據(jù)平臺數(shù)據(jù)庫數(shù)據(jù)庫表名表名備注備注Windows/SQL ServerXSSJKHCG客戶采購商品表客戶采購商品表Windows/SQL ServerXSSJSPQK商品情況表商品情況表Win

15、dows/AccessRSGLZGYJ職工業(yè)績表職工業(yè)績表數(shù)據(jù)源抽取對象表第24頁/共53頁表表.列名列名過濾與連接條過濾與連接條件件比較值比較值復合條件復合條件備注備注KHCG.CGSL500AND采購商品數(shù)量大于采購商品數(shù)量大于500SPQK.SPIDABOR商品前兩位商品前兩位非非AB第25頁/共53頁目標表目標表.列列源表源表.列列轉換公式轉換公式備注備注SJCK_KHCG.KHZYKHCG.KHZY直接轉換直接轉換客戶職業(yè)客戶職業(yè)SJCK_KHCG.CGRQKHCG.CGRQ將月將月/年年/日的日期格式轉換日的日期格式轉換成年成年/月月/日格式日格式客戶采購日期客戶采購日期第26頁/

16、共53頁表表.列名列名排序排序概括概括/導導出出備注備注CQLS_KHCG.CGSL降序降序分組分組按照采購數(shù)量從大到小排序、按照日期進行按照采購數(shù)量從大到小排序、按照日期進行分組分組SJCK_KHCG.CGHZ概括概括對每一客戶采購量按照星期分別進行概括處對每一客戶采購量按照星期分別進行概括處理,計算客戶的采購總量理,計算客戶的采購總量SJCK_KHCG.PJL導出導出對每一客戶采購情況按照星期分別進行平均對每一客戶采購情況按照星期分別進行平均采購量計算采購量計算第27頁/共53頁概括表表概括表表.列列名名是否是否導出導出事實表事實表.列列名名備注備注SPGKB.SP_ID否否SPGYB.S

17、P_ID商品編號商品編號SPGKB.GYS_ID否否SPGYB.GYS_ID供應商編號供應商編號SPGKB.SPGYZSL是是SPGYB.SPGYL商品供應總量,按照供應商編號對供商品供應總量,按照供應商編號對供應數(shù)量求和應數(shù)量求和SPGKB.SPGYZJE是是SPGYB.SPGYJE商品供應總金額,按照供應商編號對商品供應總金額,按照供應商編號對供應商品的金額進行匯總供應商品的金額進行匯總第28頁/共53頁第29頁/共53頁第30頁/共53頁第31頁/共53頁在數(shù)據(jù)倉庫的模型建立過程中,可以使用某種建模工具創(chuàng)建數(shù)據(jù)倉庫的模型,此時需要從現(xiàn)有的業(yè)務處理系統(tǒng)中提取元數(shù)據(jù),并建立數(shù)據(jù)倉庫的邏輯模型

18、和物理模型,包括數(shù)據(jù)倉庫的邏輯名稱、業(yè)務名稱、列名、物理列名、業(yè)務術語和描述、查詢提示和樣值等,并將這些元數(shù)據(jù)保存在元數(shù)據(jù)目錄中。在數(shù)據(jù)倉庫中添加關于數(shù)據(jù)加載的元數(shù)據(jù),完成數(shù)據(jù)“來源定義”,主要是關于數(shù)據(jù)倉庫源數(shù)據(jù)的一些描述信息,用作從源文件向數(shù)據(jù)倉庫轉換的準備。利用數(shù)據(jù)加載工具提取數(shù)據(jù)倉庫中各種表的定義,并完成源數(shù)據(jù)到目標數(shù)據(jù)的映射定義,捕捉所有的轉換信息。這些工作大多數(shù)在數(shù)據(jù)模型的設計中完成。第32頁/共53頁將關于源數(shù)據(jù)到目標數(shù)據(jù)的映射、轉換存儲到元數(shù)據(jù)目錄中。在將源數(shù)據(jù)加載進數(shù)據(jù)倉庫時,需要能夠從元數(shù)據(jù)目錄中查找到有關源數(shù)據(jù)的類型和位置、目標數(shù)據(jù)的類型和位置、以及兩者之間的映射。在數(shù)據(jù)

19、加載前,還需要查看數(shù)據(jù)倉庫中物理狀態(tài)的最新信息,例如,磁盤空間的大小等。一邊利用元數(shù)據(jù)指導從源數(shù)據(jù)提取數(shù)據(jù),并且根據(jù)被提取的源數(shù)據(jù)情況,從中提取元數(shù)據(jù),例如,數(shù)據(jù)提取的時間、源數(shù)據(jù)的有關變化等。第33頁/共53頁將所提取的源數(shù)據(jù)經(jīng)過清理、轉換后加載進數(shù)據(jù)倉庫。根據(jù)數(shù)據(jù)加載情況,將所捕捉到的數(shù)據(jù)加載統(tǒng)計信息和審核信息保存到元數(shù)據(jù)目錄中。在數(shù)據(jù)倉庫模型建立過程中所獲取的事實表信息在元數(shù)據(jù)目錄中應該成為業(yè)務分組的一些元數(shù)據(jù),這些業(yè)務分組元數(shù)據(jù)實際上是一些關于使用數(shù)據(jù)倉庫的幫助信息,只是在元數(shù)據(jù)目錄中應該按照業(yè)務分組,便于用戶使用,這些元數(shù)據(jù)應該可以被前端展示工具獲取。用戶可以在前端數(shù)據(jù)展示工具中形成

20、查詢請求,此時元數(shù)據(jù)可以為正確的查詢請求生成提供幫助。數(shù)據(jù)倉庫將查詢使用等結果返回給用戶。將用戶的查詢情況統(tǒng)計以后,保存在元數(shù)據(jù)目錄中,作為分析、了解用戶使用數(shù)據(jù)倉庫情況的依據(jù)。第34頁/共53頁數(shù)據(jù)源物理模型 查詢統(tǒng)計邏輯模型 業(yè)務分組來源定義 加載統(tǒng)計來源-目標映射建模工具元 數(shù) 據(jù) 目錄數(shù)據(jù)加載工具數(shù)據(jù)倉庫前端展示工具ab第35頁/共53頁邏輯模型的文檔內(nèi)容:主題域分析報告,數(shù)據(jù)粒度劃分模型,數(shù)據(jù)分割策略,指標實體、維實體與詳細類別實體的關系模式和數(shù)據(jù)抽取模型。對邏輯模型的評審主要集中在主題域是否可以正確地反映用戶的決策分析需求。從用戶對概括數(shù)據(jù)使用的要求,評審數(shù)據(jù)粒度的劃分和數(shù)據(jù)分割策

21、略是否可以滿足用戶決策分析的需要。為提高數(shù)據(jù)倉庫的運行效率是否需要對關系模式進行反規(guī)范化處理。數(shù)據(jù)的抽取模型是否正確地建立了數(shù)據(jù)源與數(shù)據(jù)倉庫的對應關系。數(shù)據(jù)的約束條件和業(yè)務規(guī)則是否在這些模型中得到了正確的反映。第36頁/共53頁表的數(shù)據(jù)結構類型、索引策略、數(shù)據(jù)存放位置以及數(shù)據(jù)存儲分配等等。物理模型設計因素:I/O存取時間、空間利用率和維護的代價。工作:全面了解所選用的數(shù)據(jù)庫管理系統(tǒng),特別是存儲結構和存取方法。了解數(shù)據(jù)環(huán)境、數(shù)據(jù)的使用頻率、使用方式、數(shù)據(jù)規(guī)模以及響應時間要求等。了解外部存儲設備的特征。第37頁/共53頁保證數(shù)據(jù)倉庫的設計、實施和管理保持穩(wěn)定,不產(chǎn)生混亂,需要對物理數(shù)據(jù)模型中的實體

22、、表、列等進行規(guī)范化處理。使整個數(shù)據(jù)倉庫的物理數(shù)據(jù)模型能夠保持一致。規(guī)范化內(nèi)容主要有:完整清晰的數(shù)據(jù)定義、合適的數(shù)據(jù)格式等。數(shù)據(jù)倉庫中的每個組件或部件都確定相應的設計標準。第38頁/共53頁數(shù)據(jù)非規(guī)范化處理的優(yōu)點有:能減少對表聯(lián)結的需求,提高數(shù)據(jù)倉庫運行性能。能減少編寫專門決策支持應用程序的工作量,因為運用一些專門的查詢工具,可以更容易訪問數(shù)據(jù)。可以讓用戶以直觀的易于理解的工具來操作數(shù)據(jù),例如,可以利用電子報表來查看數(shù)據(jù)。第39頁/共53頁1.索引創(chuàng)建策略索引創(chuàng)建策略建立索引時,按照索引使用的頻率,由高到低逐步添加。建立索引時,按照索引使用的頻率,由高到低逐步添加。按主關鍵字和大多數(shù)外部關鍵字

23、建立索引按主關鍵字和大多數(shù)外部關鍵字建立索引 2.事實表索引的創(chuàng)建事實表索引的創(chuàng)建事實表中一定要設置主鍵? 據(jù)倉庫中的許多查詢中都會涉及到時間的查詢處理,因此應該將時間數(shù)據(jù)放在主鍵索引的最前面,這樣不僅提高查詢處理效率,而且還能夠提高依據(jù)時間進行數(shù)據(jù)的加載速度。 事實表中的非鍵索引通常需要根據(jù)用戶使用數(shù)據(jù)倉庫查詢的統(tǒng)計情況在以后設置。 第40頁/共53頁3.維表索引的創(chuàng)建維表索引的創(chuàng)建一般的維表中只有一個單獨的主鍵,為維表中主鍵設置一個惟一的索引是必不可少的 。為一些大型維表,例如,客戶維表、商品維表等建立索引則可以提高查詢效率。 維表中建立非主鍵索引時,主要考慮對那些經(jīng)常在連接條件、過濾操作

24、和分組操作中出現(xiàn)的列創(chuàng)建單獨列索引 。4.數(shù)據(jù)加載索引的創(chuàng)建數(shù)據(jù)加載索引的創(chuàng)建仔細分析在數(shù)據(jù)加載中所用到的各種查詢操作,為那些重要的或耗時比較長的步驟建立索引,盡可能地提高數(shù)據(jù)加載速度。 如果所增加的數(shù)據(jù)將使某些表數(shù)據(jù)量增加10%以上,就需要在加載數(shù)據(jù)之前刪除表中的索引,在完成數(shù)據(jù)加載以后,重新創(chuàng)建索引,這樣也會提高數(shù)據(jù)加載的效率。第41頁/共53頁數(shù)據(jù)的布局原則:不要把經(jīng)常需要連接的幾張表放在同一存儲設備上。如果幾臺服務器之間的連接會造成嚴重的網(wǎng)絡業(yè)務量的問題,則要考慮服務器復制表格。考慮把整個企業(yè)共享的細節(jié)數(shù)據(jù)放在主機或其他集中式服務器上。別把表格和它們的索引放在同一設備上。一般可以將索引

25、存放在高速存儲設備上,而表格則存放在一般存儲設備上,以加快數(shù)據(jù)的查詢速度。第42頁/共53頁3.5.6 數(shù)據(jù)倉庫物理模型的評審設計評審的目標要確定:物理模型在滿足數(shù)據(jù)倉庫使用的靈活性、性能、數(shù)據(jù)完整性、系統(tǒng)可用性、數(shù)據(jù)的當前性和用戶的滿意度等具體的評審項目有:表空間、分區(qū)、表格、數(shù)據(jù)壓縮、控制表和引用表、索引、數(shù)據(jù)量、數(shù)據(jù)分布、線路通信量、數(shù)據(jù)倉庫的更新、概況數(shù)據(jù)、預期變動和數(shù)據(jù)的文檔化。第43頁/共53頁實施過程中需要完成的工作:實施過程中需要完成的工作:建立數(shù)據(jù)倉庫與業(yè)務處理系統(tǒng)的接口建立數(shù)據(jù)倉庫與業(yè)務處理系統(tǒng)的接口數(shù)據(jù)倉庫的體系結構建立數(shù)據(jù)倉庫的體系結構建立實現(xiàn)數(shù)據(jù)倉庫物理倉庫與元數(shù)據(jù)庫

26、實現(xiàn)數(shù)據(jù)倉庫物理倉庫與元數(shù)據(jù)庫進行數(shù)據(jù)倉庫的數(shù)據(jù)初次加載進行數(shù)據(jù)倉庫的數(shù)據(jù)初次加載完成數(shù)據(jù)倉庫的中間件設計完成數(shù)據(jù)倉庫的中間件設計進行數(shù)據(jù)倉庫的測試。進行數(shù)據(jù)倉庫的測試。第44頁/共53頁接口應該具有這樣一些功能:接口應該具有這樣一些功能:從面向應用和操作環(huán)境生成完整的數(shù)據(jù);從面向應用和操作環(huán)境生成完整的數(shù)據(jù);數(shù)據(jù)基于時間的轉換;數(shù)據(jù)基于時間的轉換;數(shù)據(jù)的聚集;數(shù)據(jù)的聚集;對現(xiàn)有數(shù)據(jù)系統(tǒng)的有效掃描,以便今后數(shù)據(jù)倉庫對現(xiàn)有數(shù)據(jù)系統(tǒng)的有效掃描,以便今后數(shù)據(jù)倉庫的數(shù)據(jù)追加。的數(shù)據(jù)追加。第45頁/共53頁關系型數(shù)據(jù)庫、多維數(shù)據(jù)庫和對象數(shù)據(jù)庫關系型數(shù)據(jù)庫、多維數(shù)據(jù)庫和對象數(shù)據(jù)庫第46頁/共53頁數(shù)據(jù)加載之前,首先需要對準備加載的數(shù)據(jù)進行清理 復制技術 復制結構應完成以下的復雜任務:復制結構應完成以下的復雜任務:不會受到系統(tǒng)失敗等問題的影響,保證提供可靠的數(shù)據(jù)復制。只傳送符合數(shù)據(jù)完整性規(guī)則的一致數(shù)據(jù)。可以優(yōu)化傳送過程,減少在捕獲或修改數(shù)據(jù)和復制品作為結果傳送之間的等待時間。數(shù)據(jù)發(fā)行系統(tǒng)完成以下的功能:數(shù)據(jù)發(fā)行系統(tǒng)完成以下的功能:保證數(shù)據(jù)以適時和有效的方式發(fā)行。保證只發(fā)送被排序的數(shù)據(jù)。建立正確的和所需要的服務水平標準。第47頁/共53頁1.代碼發(fā)生器代碼發(fā)生器2.數(shù)據(jù)復制工具數(shù)據(jù)復制工具3

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論