數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 第三章_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 第三章_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 第三章_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 第三章_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 第三章_第5頁
已閱讀5頁,還剩115頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、0n 3.1 3.1 數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法n 3.2 3.2 數(shù)據(jù)倉庫設(shè)計的數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的數(shù)據(jù)模型n 3.3 3.3 如何提高數(shù)據(jù)倉庫的性能如何提高數(shù)據(jù)倉庫的性能n 3.4 3.4 數(shù)據(jù)倉庫設(shè)計步驟數(shù)據(jù)倉庫設(shè)計步驟n 要求要求: :n 掌握數(shù)據(jù)倉庫的設(shè)計掌握數(shù)據(jù)倉庫的設(shè)計第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計1n 3.1 3.1 數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法n 3.2 3.2 數(shù)據(jù)倉庫數(shù)據(jù)的設(shè)計模型數(shù)據(jù)倉庫數(shù)據(jù)的設(shè)計模型n 3.3 3.3 如何提高數(shù)據(jù)倉庫的性能如何提高數(shù)據(jù)倉庫的性能n 3.4 3.4 數(shù)據(jù)倉庫設(shè)計步驟數(shù)據(jù)倉庫設(shè)計步驟n 要求要求:

2、 :n 掌握數(shù)據(jù)倉庫的設(shè)計掌握數(shù)據(jù)倉庫的設(shè)計第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計2第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計nBILL INMON 于1998年在一個著名商貿(mào)雜志上說:“今年IT經(jīng)理們面對的最重要的問題就是到底是先建立數(shù)據(jù)倉庫還是先建立數(shù)據(jù)集市?!眓構(gòu)建數(shù)據(jù)倉庫兩種不同的基本方法:自頂向下自底向上3第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫數(shù)據(jù)集市n完整的/從企業(yè)整體考慮的n所有數(shù)據(jù)集市的集合n通過展示的方式進行查詢n基于公司數(shù)據(jù)視角的結(jié)構(gòu)n通過實體關(guān)系模式進行組織n部門的n一個單獨的商業(yè)處理過程n星型結(jié)構(gòu)(事實表和維度表)n適合數(shù)據(jù)連結(jié)和分析的技術(shù)n基于適合部門數(shù)據(jù)視角的結(jié)構(gòu)4第

3、三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計n自上而下自上而下n優(yōu)點:優(yōu)點:可以從整個企業(yè)的角度來看待數(shù)據(jù);可以從整個企業(yè)的角度來看待數(shù)據(jù);有機的結(jié)合有機的結(jié)合-不是由彼此分離的數(shù)據(jù)集市組成不是由彼此分離的數(shù)據(jù)集市組成對數(shù)據(jù)內(nèi)容惟一、集中的存儲;對數(shù)據(jù)內(nèi)容惟一、集中的存儲;集中控制和集中的規(guī)則;集中控制和集中的規(guī)則;對反復(fù)的查詢能夠做出快速的反應(yīng);對反復(fù)的查詢能夠做出快速的反應(yīng);n缺點:需要花較多的時間建造;失敗的風(fēng)險很大;缺點:需要花較多的時間建造;失敗的風(fēng)險很大;需要高水平的綜合技能;費用很高;需要高水平的綜合技能;費用很高;5第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計n自下而上自下而上n優(yōu)點:優(yōu)點:實施

4、快速而方便;實施快速而方便;良好的投資回報;良好的投資回報;失敗的風(fēng)險較?。皇〉娘L(fēng)險較?。粷u進地,可以先建立重要的數(shù)據(jù)集市;漸進地,可以先建立重要的數(shù)據(jù)集市;項目團隊可以從中學(xué)習(xí)和成長;項目團隊可以從中學(xué)習(xí)和成長;n缺點:每一個數(shù)據(jù)集市對數(shù)據(jù)的視角都比較窄;每個數(shù)據(jù)集缺點:每一個數(shù)據(jù)集市對數(shù)據(jù)的視角都比較窄;每個數(shù)據(jù)集市都有多余數(shù)據(jù);總是有矛盾和不一致的數(shù)據(jù);增加市都有多余數(shù)據(jù);總是有矛盾和不一致的數(shù)據(jù);增加無法管理的接口。無法管理的接口。6第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計n結(jié)合二者的折中方法看來可行。主要推崇者是ralph kimball(著名的數(shù)據(jù)倉庫專家)。n步驟:從整個公司的角度

5、來計劃和定義需求;為完整的倉庫創(chuàng)造一個體系結(jié)構(gòu);使數(shù)據(jù)內(nèi)容一致而且標(biāo)準(zhǔn)化;將數(shù)據(jù)倉庫作為一組超級數(shù)據(jù)集市來實施,每次一個。n數(shù)據(jù)集市就是整個數(shù)據(jù)倉庫系統(tǒng)的邏輯子集。數(shù)據(jù)倉庫就是一致化了的數(shù)據(jù)集市的集合。7n 數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫設(shè)計的不同:數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫設(shè)計的不同:1.系統(tǒng)設(shè)計的目標(biāo)不同:系統(tǒng)設(shè)計的目標(biāo)不同:數(shù)據(jù)庫是面向事務(wù)型處理的,所以事務(wù)數(shù)據(jù)庫是面向事務(wù)型處理的,所以事務(wù)型處理性型處理性能是系能是系統(tǒng)設(shè)計的一個主要目標(biāo)。統(tǒng)設(shè)計的一個主要目標(biāo)。而數(shù)據(jù)倉庫是為了而數(shù)據(jù)倉庫是為了支持決策分析支持決策分析而建立的一種數(shù)據(jù)存儲而建立的一種數(shù)據(jù)存儲集合。在系統(tǒng)設(shè)計時,更關(guān)心的是建立起一個

6、集合。在系統(tǒng)設(shè)計時,更關(guān)心的是建立起一個全局一致全局一致的分析型處理環(huán)境的分析型處理環(huán)境來支持企業(yè)的決策分析。來支持企業(yè)的決策分析。3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述8n 數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫設(shè)計的不同:數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫設(shè)計的不同:2.面向的需求不同:面向的需求不同:數(shù)據(jù)庫系統(tǒng)是數(shù)據(jù)庫系統(tǒng)是面向應(yīng)用的面向應(yīng)用的,所以在系統(tǒng)設(shè)計時應(yīng)以此為,所以在系統(tǒng)設(shè)計時應(yīng)以此為出發(fā)點和基礎(chǔ)。出發(fā)點和基礎(chǔ)。而在決策分析時,決策者分析問題的角度多種多樣,所而在決策分析時,決策者分析問題的角度多種多樣,所以數(shù)據(jù)處理流和信息流不固定,甚至決策者對所要進以數(shù)據(jù)處理流和信息流不固定,甚至決

7、策者對所要進行的分析處理都不太明了,數(shù)據(jù)的分析處理的需求更行的分析處理都不太明了,數(shù)據(jù)的分析處理的需求更靈活。這就決定了在數(shù)據(jù)倉庫系統(tǒng)設(shè)計時,靈活。這就決定了在數(shù)據(jù)倉庫系統(tǒng)設(shè)計時,不可能從不可能從用戶需求出發(fā)用戶需求出發(fā)來進行設(shè)計。來進行設(shè)計。3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述9n數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫設(shè)計的不同:數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫設(shè)計的不同:3.數(shù)據(jù)來源不同:數(shù)據(jù)來源不同:數(shù)據(jù)庫系統(tǒng)中數(shù)據(jù)是從企業(yè)外部通過輸入得到的,數(shù)據(jù)庫系統(tǒng)中數(shù)據(jù)是從企業(yè)外部通過輸入得到的,所以系統(tǒng)設(shè)計時就是設(shè)計如何與外部對話得到數(shù)據(jù)所以系統(tǒng)設(shè)計時就是設(shè)計如何與外部對話得到數(shù)據(jù),如何存儲這些數(shù)據(jù)

8、,它,如何存儲這些數(shù)據(jù),它關(guān)心的是數(shù)據(jù)的安全性和關(guān)心的是數(shù)據(jù)的安全性和完整性完整性等。等。數(shù)據(jù)倉庫中的數(shù)據(jù)大部分是從企業(yè)內(nèi)部的數(shù)據(jù)庫系數(shù)據(jù)倉庫中的數(shù)據(jù)大部分是從企業(yè)內(nèi)部的數(shù)據(jù)庫系統(tǒng)得到的,還有一部分是企業(yè)外部的非結(jié)構(gòu)化數(shù)據(jù)統(tǒng)得到的,還有一部分是企業(yè)外部的非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)都是安全可靠且正確有效的,所以在系,這些數(shù)據(jù)都是安全可靠且正確有效的,所以在系統(tǒng)設(shè)計時它關(guān)心的統(tǒng)設(shè)計時它關(guān)心的不是數(shù)據(jù)的安全性和完整性,而不是數(shù)據(jù)的安全性和完整性,而是數(shù)據(jù)的一致性是數(shù)據(jù)的一致性。3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述10n 數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫設(shè)計的不同:數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫設(shè)計的

9、不同:4.數(shù)據(jù)的處理類型不同:數(shù)據(jù)的處理類型不同:數(shù)據(jù)庫系統(tǒng)數(shù)據(jù)庫系統(tǒng)支持的是事務(wù)型處理,主要指數(shù)據(jù)的增、刪、支持的是事務(wù)型處理,主要指數(shù)據(jù)的增、刪、改、查改、查等等,系統(tǒng)設(shè)計時都是針對某一具體應(yīng)用。等等,系統(tǒng)設(shè)計時都是針對某一具體應(yīng)用。數(shù)據(jù)倉庫是面向分析的,它的數(shù)據(jù)處理大都是數(shù)據(jù)倉庫是面向分析的,它的數(shù)據(jù)處理大都是對數(shù)據(jù)的復(fù)雜對數(shù)據(jù)的復(fù)雜查詢查詢,所以在設(shè)計時考慮的是如何更好的面向主題,如何提,所以在設(shè)計時考慮的是如何更好的面向主題,如何提高查詢的效率等。高查詢的效率等。3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述11n 數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫設(shè)計的不同:數(shù)據(jù)倉庫系統(tǒng)設(shè)計與數(shù)據(jù)庫

10、設(shè)計的不同:5.設(shè)計方法不同:設(shè)計方法不同:由于在數(shù)據(jù)庫系統(tǒng)中業(yè)務(wù)過程和規(guī)則比較規(guī)范固定,系統(tǒng)由于在數(shù)據(jù)庫系統(tǒng)中業(yè)務(wù)過程和規(guī)則比較規(guī)范固定,系統(tǒng)設(shè)計人員能清楚的知道應(yīng)用需求和數(shù)據(jù)流程,所以系統(tǒng)設(shè)計設(shè)計人員能清楚的知道應(yīng)用需求和數(shù)據(jù)流程,所以系統(tǒng)設(shè)計一般采用系統(tǒng)生命周期法一般采用系統(tǒng)生命周期法(SystemsDevelopmentLifeCycle,SDLC)。在決策分析時,決策人員往往無法給決策需求一個規(guī)范的說在決策分析時,決策人員往往無法給決策需求一個規(guī)范的說明,只能給出一個模糊的描述,對這種需求不確定的開發(fā)過明,只能給出一個模糊的描述,對這種需求不確定的開發(fā)過程,設(shè)計方法有很大的不同,采用

11、與程,設(shè)計方法有很大的不同,采用與SDLC相反的相反的CLDS法法。3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述12操作型環(huán)境系統(tǒng)的設(shè)計一般采取系統(tǒng)生命周期法:(操作型環(huán)境系統(tǒng)的設(shè)計一般采取系統(tǒng)生命周期法:(SDLCSystemsDevelopmentLifeCycle)數(shù)據(jù)倉庫的設(shè)計方法:數(shù)據(jù)倉庫的設(shè)計方法:CLDS方法方法(與與SDLC相反相反)應(yīng)用B應(yīng)用A應(yīng)用CSDLC外部數(shù)據(jù)DBDB數(shù)據(jù)獲取集成構(gòu)建數(shù)據(jù)倉庫DSS應(yīng)用編程 系統(tǒng)測試 理解需求數(shù)據(jù)倉庫建模CLDS收集應(yīng)用需求分析應(yīng)用需求 構(gòu)建數(shù)據(jù)庫 應(yīng)用編程 系統(tǒng)測試 系統(tǒng)實施DBDW3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)

12、計方法概述需求驅(qū)動需求驅(qū)動數(shù)據(jù)驅(qū)動數(shù)據(jù)驅(qū)動13n數(shù)據(jù)驅(qū)動的系統(tǒng)設(shè)計方法:數(shù)據(jù)驅(qū)動的系統(tǒng)設(shè)計方法:創(chuàng)建數(shù)據(jù)倉庫的工作是在原有的數(shù)據(jù)庫基礎(chǔ)上進行的,那么創(chuàng)建數(shù)據(jù)倉庫的工作是在原有的數(shù)據(jù)庫基礎(chǔ)上進行的,那么在原有的數(shù)據(jù)庫系統(tǒng)中有什么呢?在原有的數(shù)據(jù)庫系統(tǒng)中有什么呢?有數(shù)據(jù),還有對數(shù)據(jù)的處有數(shù)據(jù),還有對數(shù)據(jù)的處理即應(yīng)用理即應(yīng)用。不論是在數(shù)據(jù)庫系統(tǒng)中,還是在數(shù)據(jù)倉庫環(huán)境中,一個企業(yè)不論是在數(shù)據(jù)庫系統(tǒng)中,還是在數(shù)據(jù)倉庫環(huán)境中,一個企業(yè)的數(shù)據(jù)是固定的,但數(shù)據(jù)的處理則是特殊的,對同一數(shù)據(jù)的的數(shù)據(jù)是固定的,但數(shù)據(jù)的處理則是特殊的,對同一數(shù)據(jù)的處理,在企業(yè)的不同部門是不同的,在數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)倉處理,在企業(yè)的不同

13、部門是不同的,在數(shù)據(jù)庫系統(tǒng)和數(shù)據(jù)倉庫系統(tǒng)中也是不同的。庫系統(tǒng)中也是不同的。3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述14n數(shù)據(jù)驅(qū)動的系統(tǒng)設(shè)計方法:數(shù)據(jù)驅(qū)動的系統(tǒng)設(shè)計方法:因此,創(chuàng)建數(shù)據(jù)倉庫的工作是在原有的數(shù)據(jù)庫基礎(chǔ)上進行的因此,創(chuàng)建數(shù)據(jù)倉庫的工作是在原有的數(shù)據(jù)庫基礎(chǔ)上進行的,這這“基礎(chǔ)基礎(chǔ)”也只能是原有數(shù)據(jù)庫中的數(shù)據(jù)也只能是原有數(shù)據(jù)庫中的數(shù)據(jù),即從已經(jīng)存在,即從已經(jīng)存在于操作型環(huán)境中的數(shù)據(jù)出發(fā)來進行數(shù)據(jù)倉庫的建設(shè)工作于操作型環(huán)境中的數(shù)據(jù)出發(fā)來進行數(shù)據(jù)倉庫的建設(shè)工作這種這種從已有數(shù)據(jù)出發(fā)的數(shù)據(jù)倉庫設(shè)計方法稱為從已有數(shù)據(jù)出發(fā)的數(shù)據(jù)倉庫設(shè)計方法稱為“數(shù)據(jù)驅(qū)動數(shù)據(jù)驅(qū)動”的系統(tǒng)設(shè)計方法。的系

14、統(tǒng)設(shè)計方法。 3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述15n“數(shù)據(jù)驅(qū)動數(shù)據(jù)驅(qū)動”系統(tǒng)設(shè)計方法的思路系統(tǒng)設(shè)計方法的思路利用以前所取得的工作成果(的數(shù)據(jù)、代碼)來進行系統(tǒng)利用以前所取得的工作成果(的數(shù)據(jù)、代碼)來進行系統(tǒng)建設(shè)建設(shè),要能識別出要能識別出當(dāng)前系統(tǒng)設(shè)計與已做工作的當(dāng)前系統(tǒng)設(shè)計與已做工作的“共同性共同性”。即我們在進行數(shù)據(jù)倉庫系統(tǒng)設(shè)計前即我們在進行數(shù)據(jù)倉庫系統(tǒng)設(shè)計前,需要清楚地知道需要清楚地知道:原原有的數(shù)據(jù)庫系統(tǒng)中已經(jīng)有什么?它們對當(dāng)前系統(tǒng)設(shè)計有什有的數(shù)據(jù)庫系統(tǒng)中已經(jīng)有什么?它們對當(dāng)前系統(tǒng)設(shè)計有什么影響?等等么影響?等等;要要盡可能地利用已有的數(shù)據(jù)、代碼盡可能地利用已有的數(shù)

15、據(jù)、代碼等等,而不是什么都而不是什么都從頭從頭開始開始,這是這是“數(shù)據(jù)驅(qū)動數(shù)據(jù)驅(qū)動”的系統(tǒng)設(shè)計方法的出發(fā)點,也是的系統(tǒng)設(shè)計方法的出發(fā)點,也是其目的所在。其目的所在。 3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述16n設(shè)計方法的關(guān)鍵設(shè)計方法的關(guān)鍵利用數(shù)據(jù)模型利用數(shù)據(jù)模型(datamodel)來有效地識別原有的數(shù)據(jù)庫中的數(shù)來有效地識別原有的數(shù)據(jù)庫中的數(shù)據(jù)和數(shù)據(jù)倉庫中主題的據(jù)和數(shù)據(jù)倉庫中主題的數(shù)據(jù)的數(shù)據(jù)的“共同性共同性”3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述操作型環(huán)境設(shè)計操作型處理應(yīng)用開發(fā)與設(shè)計DBDB數(shù)據(jù)倉庫環(huán)境設(shè)計DSS應(yīng)用開發(fā)與設(shè)計DW數(shù)據(jù)模型數(shù)據(jù)模型的作用數(shù)據(jù)模型的

16、作用 17n設(shè)計方法的關(guān)鍵設(shè)計方法的關(guān)鍵 數(shù)據(jù)模型是聯(lián)系操作型數(shù)據(jù)環(huán)境的設(shè)計、數(shù)據(jù)倉庫數(shù)據(jù)模型是聯(lián)系操作型數(shù)據(jù)環(huán)境的設(shè)計、數(shù)據(jù)倉庫數(shù)據(jù)環(huán)境的設(shè)計、操作型數(shù)據(jù)處理應(yīng)用的開發(fā)和設(shè)計以數(shù)據(jù)環(huán)境的設(shè)計、操作型數(shù)據(jù)處理應(yīng)用的開發(fā)和設(shè)計以及及DSSDSS應(yīng)用的開發(fā)與設(shè)計的紐帶。應(yīng)用的開發(fā)與設(shè)計的紐帶。 3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述18n數(shù)據(jù)倉庫的系統(tǒng)設(shè)計是一個動態(tài)的反饋和循環(huán)的過程數(shù)據(jù)倉庫的系統(tǒng)設(shè)計是一個動態(tài)的反饋和循環(huán)的過程數(shù)據(jù)倉庫的數(shù)據(jù)內(nèi)容、結(jié)構(gòu)、粒度、分割以及其它數(shù)據(jù)倉庫的數(shù)據(jù)內(nèi)容、結(jié)構(gòu)、粒度、分割以及其它物理設(shè)計根據(jù)用戶所返回的信息不斷地調(diào)整和完善物理設(shè)計根據(jù)用戶所返回的

17、信息不斷地調(diào)整和完善不斷地理解用戶不斷地理解用戶(確切地講是領(lǐng)導(dǎo)確切地講是領(lǐng)導(dǎo))的分析需求,向用的分析需求,向用戶提供更準(zhǔn)確、更有用的決策信息戶提供更準(zhǔn)確、更有用的決策信息3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述19n 3.1 3.1 數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法n 3.2 3.2 數(shù)據(jù)倉庫設(shè)計模型數(shù)據(jù)倉庫設(shè)計模型n 3.3 3.3 如何提高數(shù)據(jù)倉庫的性能如何提高數(shù)據(jù)倉庫的性能n 3.4 3.4 數(shù)據(jù)倉庫設(shè)計步驟數(shù)據(jù)倉庫設(shè)計步驟n 要求要求: :n 掌握數(shù)據(jù)倉庫的設(shè)計掌握數(shù)據(jù)倉庫的設(shè)計第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計20n 數(shù)據(jù)倉庫方面,一向是數(shù)據(jù)倉庫方面,一

18、向是Inmon和和Kimball兩大流派分庭抗禮。兩大流派分庭抗禮。 n 他們分別提出了各自的數(shù)據(jù)倉庫設(shè)計模型他們分別提出了各自的數(shù)據(jù)倉庫設(shè)計模型n Kimball-dimensionalmodeling(多維模型)(多維模型)n Inmon-以以ERmodel為基礎(chǔ)的結(jié)構(gòu)(實體關(guān)系)模型為基礎(chǔ)的結(jié)構(gòu)(實體關(guān)系)模型3.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述213.1數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述數(shù)據(jù)倉庫系統(tǒng)設(shè)計方法概述n目前的商業(yè)數(shù)據(jù)倉庫產(chǎn)品的態(tài)度:目前的商業(yè)數(shù)據(jù)倉庫產(chǎn)品的態(tài)度:nsybase,oracle,sqlserver都是主推維度建摸的都是主推維度建摸的;nIBM在信息倉庫建設(shè)

19、中兩面牽就,企圖左右逢緣在信息倉庫建設(shè)中兩面牽就,企圖左右逢緣;n苦苦堅持的就苦苦堅持的就NCR一家孤家寡人了一家孤家寡人了22nINMON的結(jié)構(gòu)更傾向著眼于的結(jié)構(gòu)更傾向著眼于ADHOC查詢和數(shù)據(jù)挖掘查詢和數(shù)據(jù)挖掘等更廣泛的應(yīng)用等更廣泛的應(yīng)用.n他將所有的數(shù)據(jù)經(jīng)過他將所有的數(shù)據(jù)經(jīng)過ETL過程后過程后,進行進行3NF的的NORMALIZE,作成一個企業(yè)級的數(shù)據(jù)倉庫作成一個企業(yè)級的數(shù)據(jù)倉庫(EDW),使用使用者可以直接對這個數(shù)據(jù)倉庫進行查詢者可以直接對這個數(shù)據(jù)倉庫進行查詢,也可以查詢從這個也可以查詢從這個數(shù)據(jù)倉庫得到的數(shù)據(jù)集市數(shù)據(jù)倉庫得到的數(shù)據(jù)集市.n這個結(jié)構(gòu)能更靈活的應(yīng)對各種這個結(jié)構(gòu)能更靈活的應(yīng)

20、對各種BUSINESSQUESTION.3.2數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型基于基于ER圖圖233.2.1概念模型概念模型n設(shè)計概念模型的目的,是對數(shù)據(jù)倉庫所涉及的現(xiàn)實世界中設(shè)計概念模型的目的,是對數(shù)據(jù)倉庫所涉及的現(xiàn)實世界中的所有客觀實體進行科學(xué)的、全面的分析和抽象,為數(shù)據(jù)的所有客觀實體進行科學(xué)的、全面的分析和抽象,為數(shù)據(jù)倉庫的構(gòu)建制定出倉庫的構(gòu)建制定出“藍圖藍圖”。這是成功構(gòu)建數(shù)據(jù)倉庫的第。這是成功構(gòu)建數(shù)據(jù)倉庫的第一步。一步。n概念模型設(shè)計的關(guān)鍵,是要保證所有與數(shù)據(jù)倉庫相關(guān)的客概念模型設(shè)計的關(guān)鍵,是要保證所有與數(shù)據(jù)倉庫相關(guān)的客觀實體(即業(yè)務(wù)內(nèi)容)均能得到準(zhǔn)確的理解,并被

21、完整地觀實體(即業(yè)務(wù)內(nèi)容)均能得到準(zhǔn)確的理解,并被完整地包含在模型當(dāng)中。因此,在設(shè)計概念模型時,擁有足夠的包含在模型當(dāng)中。因此,在設(shè)計概念模型時,擁有足夠的專業(yè)業(yè)務(wù)知識不僅是重要的,而且是必須的。專業(yè)業(yè)務(wù)知識不僅是重要的,而且是必須的。243.2.1概念模型概念模型n概念模型常用的表示方法:概念模型常用的表示方法:方法(實體聯(lián)系方法)方法(實體聯(lián)系方法) 描述工具:描述工具:圖圖1.長方形表示實體,數(shù)據(jù)倉庫中表示主題,框內(nèi)寫上主題名長方形表示實體,數(shù)據(jù)倉庫中表示主題,框內(nèi)寫上主題名2.橢圓形表示主題的屬性橢圓形表示主題的屬性無向邊把主題與其屬性連接起來無向邊把主題與其屬性連接起來3.菱形表示主

22、題之間的聯(lián)系,菱形框內(nèi)寫上聯(lián)系的名字菱形表示主題之間的聯(lián)系,菱形框內(nèi)寫上聯(lián)系的名字無向邊把菱形分別與有關(guān)的主題連接無向邊把菱形分別與有關(guān)的主題連接無向邊旁標(biāo)上聯(lián)系的類型無向邊旁標(biāo)上聯(lián)系的類型若聯(lián)系也有屬性若聯(lián)系也有屬性用無向邊連接屬性和菱形用無向邊連接屬性和菱形253.2.1概念模型概念模型購買供應(yīng)顧客固有信息顧客號顧客顧客購物信息日期供應(yīng)商固有信息供應(yīng)商供應(yīng)商號供應(yīng)商品信息日期商品采購信息商品銷售信息商品號商品商品固有信息商品庫存信息日期某商場的商品、顧客和供應(yīng)商之間某商場的商品、顧客和供應(yīng)商之間的概念模型的的概念模型的E-R圖圖 263.2.4邏輯模型邏輯模型n概念模型概念模型-E-R圖圖

23、(Entity-RelationshipDiagram)n邏輯模型邏輯模型-數(shù)據(jù)項(數(shù)據(jù)項(dataitemset縮寫為縮寫為dis) dis是是E-R圖的細(xì)分圖的細(xì)分E-R圖中的每一個實體圖中的每一個實體-一個一個disE-R圖disdisdisdis273.2.4邏輯模型邏輯模型n每個每個dis中的數(shù)據(jù)項分為四個組別:中的數(shù)據(jù)項分為四個組別:基本數(shù)據(jù)組基本數(shù)據(jù)組二級數(shù)據(jù)組二級數(shù)據(jù)組聯(lián)接數(shù)據(jù)組聯(lián)接數(shù)據(jù)組類型數(shù)據(jù)組類型數(shù)據(jù)組類型數(shù)據(jù)組類型數(shù)據(jù)組關(guān)鍵字關(guān)鍵字*關(guān)鍵字關(guān)鍵字*關(guān)鍵字關(guān)鍵字*關(guān)鍵字關(guān)鍵字*關(guān)鍵字關(guān)鍵字*關(guān)鍵字關(guān)鍵字基本數(shù)據(jù)組基本數(shù)據(jù)組二級數(shù)據(jù)組二級數(shù)據(jù)組聯(lián)結(jié)數(shù)據(jù)組聯(lián)結(jié)數(shù)據(jù)組283.2

24、.4邏輯模型邏輯模型n每個每個dis中的數(shù)據(jù)項分為四個組別:中的數(shù)據(jù)項分為四個組別:基本數(shù)據(jù)組基本數(shù)據(jù)組:每一個主題都有且只有一個基本數(shù)據(jù)組,其中包含了對每一個主題都有且只有一個基本數(shù)據(jù)組,其中包含了對每個主要主題域基本不會發(fā)生變化的項。同所有的數(shù)據(jù)每個主要主題域基本不會發(fā)生變化的項。同所有的數(shù)據(jù)分組一樣,基本數(shù)據(jù)組包含每個主題域的屬性和關(guān)鍵字分組一樣,基本數(shù)據(jù)組包含每個主題域的屬性和關(guān)鍵字。 二級數(shù)據(jù)組:二級數(shù)據(jù)組: 二級數(shù)據(jù)組包含對每個主題域二級數(shù)據(jù)組包含對每個主題域基本不變化,但又存在變基本不變化,但又存在變化的可能的數(shù)據(jù)項化的可能的數(shù)據(jù)項。從主要數(shù)據(jù)分組有一向下的直線段。從主要數(shù)據(jù)分組

25、有一向下的直線段指示出了二級數(shù)據(jù)分組。有多少個可以出現(xiàn)多次的不同指示出了二級數(shù)據(jù)分組。有多少個可以出現(xiàn)多次的不同數(shù)據(jù)分組,就可以含有多少個二級數(shù)據(jù)組。數(shù)據(jù)分組,就可以含有多少個二級數(shù)據(jù)組。293.2.4邏輯邏輯模型模型n每個每個dis中的數(shù)據(jù)項分為四個組別:中的數(shù)據(jù)項分為四個組別:聯(lián)接數(shù)據(jù)組聯(lián)接數(shù)據(jù)組:本主題域與其他主題域間的聯(lián)系,一個主題的公共碼鍵本主題域與其他主題域間的聯(lián)系,一個主題的公共碼鍵。類型數(shù)據(jù)組:類型數(shù)據(jù)組: 經(jīng)常變化的數(shù)據(jù)項。經(jīng)常變化的數(shù)據(jù)項。類型數(shù)據(jù)組由指向數(shù)據(jù)分組右邊的類型數(shù)據(jù)組由指向數(shù)據(jù)分組右邊的線段指示。左邊的類型數(shù)據(jù)組是超類型,右邊的類型數(shù)線段指示。左邊的類型數(shù)據(jù)組是

26、超類型,右邊的類型數(shù)據(jù)組是子類型數(shù)據(jù)組。據(jù)組是子類型數(shù)據(jù)組。303.2.4邏輯模型邏輯模型n聯(lián)接數(shù)據(jù)組聯(lián)接數(shù)據(jù)組:本主題域與其他主題域間的聯(lián)系,一個主題的公共碼鍵。本主題域與其他主題域間的聯(lián)系,一個主題的公共碼鍵。 帳戶號 顧客號帳戶主題的dis顧客主題的dis313.2.4邏輯模型邏輯模型n其余三種數(shù)據(jù)組劃分的標(biāo)準(zhǔn)其余三種數(shù)據(jù)組劃分的標(biāo)準(zhǔn):數(shù)據(jù)穩(wěn)定程度數(shù)據(jù)穩(wěn)定程度穩(wěn)定性順序穩(wěn)定性順序:基本數(shù)據(jù)組基本數(shù)據(jù)組二級數(shù)據(jù)組二級數(shù)據(jù)組類型數(shù)據(jù)組類型數(shù)據(jù)組“顧客顧客”主題主題基本數(shù)據(jù)組基本數(shù)據(jù)組:顧客號、顧客名、性別顧客號、顧客名、性別 每個主題只有一個基本數(shù)據(jù)組每個主題只有一個基本數(shù)據(jù)組二級數(shù)據(jù)組:顧

27、客的住址、文化程度、電話二級數(shù)據(jù)組:顧客的住址、文化程度、電話類型數(shù)據(jù)組:顧客的購物記錄類型數(shù)據(jù)組:顧客的購物記錄優(yōu)點:優(yōu)點:結(jié)構(gòu)清晰,具有相似屬性的數(shù)據(jù)被組織在一起結(jié)構(gòu)清晰,具有相似屬性的數(shù)據(jù)被組織在一起減少了冗余減少了冗余將低頻數(shù)據(jù)與高頻數(shù)據(jù)分開存儲將低頻數(shù)據(jù)與高頻數(shù)據(jù)分開存儲323.2.3物理模型物理模型n數(shù)據(jù)倉庫的物理模型設(shè)計是為邏輯模型設(shè)計的數(shù)據(jù)模型確數(shù)據(jù)倉庫的物理模型設(shè)計是為邏輯模型設(shè)計的數(shù)據(jù)模型確定一個最適合應(yīng)用要求的物理結(jié)構(gòu),包括存儲結(jié)構(gòu)和存取定一個最適合應(yīng)用要求的物理結(jié)構(gòu),包括存儲結(jié)構(gòu)和存取方法。方法。n物理模型的設(shè)計所做的工作是估計存儲容量,確定數(shù)據(jù)的物理模型的設(shè)計所做的工

28、作是估計存儲容量,確定數(shù)據(jù)的存儲結(jié)構(gòu),確定索引,確定數(shù)據(jù)存放位置,確定存儲分配存儲結(jié)構(gòu),確定索引,確定數(shù)據(jù)存放位置,確定存儲分配。333.2.3物理模型物理模型n估計存儲容量估計存儲容量物理模型重點在于物理存儲,隨著數(shù)據(jù)倉庫的增大,需要知道最初物理模型重點在于物理存儲,隨著數(shù)據(jù)倉庫的增大,需要知道最初和后來需要多少存儲空間;和后來需要多少存儲空間;n確定數(shù)據(jù)的存儲計劃確定數(shù)據(jù)的存儲計劃建立聚集計劃建立聚集計劃確定數(shù)據(jù)分區(qū)方案確定數(shù)據(jù)分區(qū)方案建立聚類選項建立聚類選項在數(shù)據(jù)倉庫中,很多的數(shù)據(jù)訪問是基于對大量數(shù)據(jù)的順序訪問,在數(shù)據(jù)倉庫中,很多的數(shù)據(jù)訪問是基于對大量數(shù)據(jù)的順序訪問,這可以通過聚類來提高

29、性能。聚類是將相關(guān)的數(shù)據(jù)放在存儲介質(zhì)這可以通過聚類來提高性能。聚類是將相關(guān)的數(shù)據(jù)放在存儲介質(zhì)的相鄰物理塊上管理。使相關(guān)聯(lián)的數(shù)據(jù)能夠在一次輸入操作中全的相鄰物理塊上管理。使相關(guān)聯(lián)的數(shù)據(jù)能夠在一次輸入操作中全部取出,提高查詢效率。部取出,提高查詢效率。343.2.3物理模型物理模型n確定索引策略確定索引策略需要對數(shù)據(jù)的存取路徑進行仔細(xì)設(shè)計和選擇,建立專用需要對數(shù)據(jù)的存取路徑進行仔細(xì)設(shè)計和選擇,建立專用的復(fù)雜的索引,以獲得最高的存取效率,因為在數(shù)據(jù)倉的復(fù)雜的索引,以獲得最高的存取效率,因為在數(shù)據(jù)倉庫中的數(shù)據(jù)是不常更新的,每個數(shù)據(jù)存儲是穩(wěn)定的。雖庫中的數(shù)據(jù)是不常更新的,每個數(shù)據(jù)存儲是穩(wěn)定的。雖然建立索

30、引有一定的代價,但是一旦建立就幾乎不需要然建立索引有一定的代價,但是一旦建立就幾乎不需要再維護索引。再維護索引。傳統(tǒng)的數(shù)據(jù)庫使用的是傳統(tǒng)的數(shù)據(jù)庫使用的是B-TREE索引。索引。n確定數(shù)據(jù)存放位置確定數(shù)據(jù)存放位置同一個主題的數(shù)不要求存放在相同的介質(zhì)上。在物理設(shè)同一個主題的數(shù)不要求存放在相同的介質(zhì)上。在物理設(shè)計時,常常要按數(shù)據(jù)的重要程度、使用頻率以及對相應(yīng)計時,常常要按數(shù)據(jù)的重要程度、使用頻率以及對相應(yīng)時間的要求進行分類,并將不同類的數(shù)據(jù)分別存儲在不時間的要求進行分類,并將不同類的數(shù)據(jù)分別存儲在不同的存儲設(shè)備中。同的存儲設(shè)備中。35nKIMBALL的數(shù)據(jù)倉庫理論強調(diào)面向整個企業(yè)級別的業(yè)務(wù)流程主題,

31、例如定單系統(tǒng),支付系統(tǒng). n由事實表(由度量類屬性如價格和維表外鍵組成)和維表(各種維度如時間,各自按照不同級別組成)構(gòu)成.n這些數(shù)據(jù)來源于DBMS,經(jīng)過ETL(EXTRACT,CLEAN,CONFORM,DELIVER)過程,存放在數(shù)據(jù)倉庫中,然后供使用者查詢. 3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型36例例銷售分析:銷售分析: 數(shù)據(jù)倉庫數(shù)據(jù)倉庫salessales圍繞商品銷售量這個主題。同時,銷售圍繞商品銷售量這個主題。同時,銷售量涉及以下幾個方面:量涉及以下幾個方面:time,item,locationtime,item,location,branchbranch。有

32、。有了這些方面的信息,能夠記錄商品的月銷售,銷售商品的了這些方面的信息,能夠記錄商品的月銷售,銷售商品的地點。地點。4.5基于關(guān)系數(shù)據(jù)庫的基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn)實現(xiàn) 3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型37通過將事實表和維表進行連接,我們就可以得到通過將事實表和維表進行連接,我們就可以得到“星型結(jié)構(gòu)(星型結(jié)構(gòu)(starschema)例例銷售分析的星型圖模型。銷售分析的星型圖模型。分店維分店維單位銷售額單位銷售額 現(xiàn)金銷售額現(xiàn)金銷售額 平均銷售額平均銷售額 地區(qū)維地區(qū)維產(chǎn)品維產(chǎn)品維時間維時間維4.5基于關(guān)系數(shù)據(jù)庫的基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn)實現(xiàn) 3.3數(shù)據(jù)倉庫設(shè)計的

33、多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型38例例銷售分析的星型圖模型。銷售分析的星型圖模型。4.5基于關(guān)系數(shù)據(jù)庫的基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn)實現(xiàn) 3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型39 事實表,包含用于分析的數(shù)值化信息和維事實表,包含用于分析的數(shù)值化信息和維表的關(guān)鍵字。表的關(guān)鍵字。例例銷售分析的星型圖模型。銷售分析的星型圖模型。3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型40 維表,一個組織想要記錄的透視或?qū)嶓w。每一維都有維表,一個組織想要記錄的透視或?qū)嶓w。每一維都有一個表與之相關(guān)聯(lián)。他的主鍵一定會出現(xiàn)在事實表中一個表與之相關(guān)聯(lián)。他的主鍵一定會出現(xiàn)在事實表

34、中,以便進行表連接。,以便進行表連接。4.5基于關(guān)系數(shù)據(jù)庫的基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn)實現(xiàn) 3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型41星型模式(Star Schema)n“星型模式星型模式”通過通過維表的主碼維表的主碼,將事實表與維表連接在一起,將事實表與維表連接在一起,完全用二維關(guān)系表示了數(shù)據(jù)的多維概念。,完全用二維關(guān)系表示了數(shù)據(jù)的多維概念。n建立建立“星型模式星型模式”后,可以在關(guān)系數(shù)據(jù)庫中模擬數(shù)據(jù)的多維后,可以在關(guān)系數(shù)據(jù)庫中模擬數(shù)據(jù)的多維查詢。通過維表的主碼,對事實表和每一個維表做查詢。通過維表的主碼,對事實表和每一個維表做連接操作連接操作,一次查詢就可以從得到數(shù)據(jù)

35、的值以及對數(shù)據(jù)的多維描述(,一次查詢就可以從得到數(shù)據(jù)的值以及對數(shù)據(jù)的多維描述(即對應(yīng)的各維上的維成員)。即對應(yīng)的各維上的維成員)。3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型42星型模式星型模式(StarSchema)n維度表的特征:維度表的特征:維度表鍵。維度表的主鍵,可以惟一的確定表的每一行;維度表鍵。維度表的主鍵,可以惟一的確定表的每一行;維度表很寬:一個典型的維度表會有相當(dāng)多的屬性維度表很寬:一個典型的維度表會有相當(dāng)多的屬性/列。有列。有一些維度表有一些維度表有50個以上的屬性。個以上的屬性。文本屬性:很難找到用于計算的數(shù)值數(shù)據(jù);文本屬性:很難找到用于計算的數(shù)值數(shù)據(jù);非規(guī)

36、范化非規(guī)范化上鉆上鉆/下鉆:維度表中的屬性提供了獲取從高層次的匯總信下鉆:維度表中的屬性提供了獲取從高層次的匯總信息到低層次細(xì)節(jié)信息的能力。息到低層次細(xì)節(jié)信息的能力。多級層次結(jié)構(gòu)多級層次結(jié)構(gòu)更少的記錄更少的記錄3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型43星型模式星型模式(StarSchema)n事實表的特征:事實表的特征:連接的事實表主鍵:事實表中的一行記錄與所有維度表中連接的事實表主鍵:事實表中的一行記錄與所有維度表中的相應(yīng)記錄相關(guān);事實表中的主鍵必的相應(yīng)記錄相關(guān);事實表中的主鍵必須是所有維度表主鍵連接起來的組合鍵。須是所有維度表主鍵連接起來的組合鍵。數(shù)據(jù)顆粒:事實表的一個

37、重要特征;數(shù)據(jù)顆粒:事實表的一個重要特征;表很長,但是不寬;表很長,但是不寬;稀疏的數(shù)據(jù)稀疏的數(shù)據(jù);退化的維度:獲取的數(shù)據(jù)如訂單號、發(fā)票號等,不是事實也不退化的維度:獲取的數(shù)據(jù)如訂單號、發(fā)票號等,不是事實也不是嚴(yán)格的維度屬性。但是分析中有用,依然作為是嚴(yán)格的維度屬性。但是分析中有用,依然作為屬性保留在事實表中。屬性保留在事實表中。3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型44星型模式星型模式(StarSchema)n不含事實的事實表不含事實的事實表3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型日期鍵日期鍵課程鍵課程鍵教授鍵教授鍵學(xué)生鍵學(xué)生鍵教室鍵教室鍵教授維教授維教

38、室維教室維教授維教授維教授維教授維教授維教授維45星型模式星型模式(StarSchema)n優(yōu)勢優(yōu)勢用戶容易理解用戶容易理解OLTP用戶使用預(yù)先定義好的用戶界面,沒必要理解后用戶使用預(yù)先定義好的用戶界面,沒必要理解后臺數(shù)據(jù)結(jié)構(gòu);臺數(shù)據(jù)結(jié)構(gòu);數(shù)據(jù)倉庫的用戶必須對數(shù)據(jù)倉庫數(shù)據(jù)非常熟悉;數(shù)據(jù)倉庫的用戶必須對數(shù)據(jù)倉庫數(shù)據(jù)非常熟悉;星型模式完全按照與用戶相同的理解關(guān)系的方式定義了星型模式完全按照與用戶相同的理解關(guān)系的方式定義了連接路徑。連接路徑。在數(shù)據(jù)倉庫的開發(fā)階段與用戶交流也變得很容易;在數(shù)據(jù)倉庫的開發(fā)階段與用戶交流也變得很容易;3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型46雪片模式雪

39、片模式n星型模式的問題實際中,數(shù)據(jù)往往不只有一個維層次。對于維層次復(fù)雜的維,用一張維表來描述會帶來過多的冗余數(shù)據(jù)。n為了避免冗余數(shù)據(jù)占用過大的空間,可以用多張表來描述一個復(fù)雜維。比如,產(chǎn)品維可以進一步劃分為類型表,顏色表,商標(biāo)表等,這樣在“星”的角上又出現(xiàn)了分支, 這種變種的星型模型被稱之為“雪片模式”(Snow Flake Schema)。 3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型47 例例銷售分析的雪花型模型。銷售分析的雪花型模型。將維表經(jīng)規(guī)范化處理,將數(shù)據(jù)將維表經(jīng)規(guī)范化處理,將數(shù)據(jù)進一步分解到附加表中。進一步分解到附加表中。4.5基于關(guān)系數(shù)據(jù)庫的基于關(guān)系數(shù)據(jù)庫的OLAP

40、實現(xiàn)實現(xiàn) 3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型48n雪花模型的優(yōu)勢和缺陷n優(yōu)勢減少存儲空間規(guī)范化的結(jié)構(gòu)更容易更新n缺陷模式比較復(fù)雜,用戶不容易理解瀏覽內(nèi)容困難額外的連接將使查詢性能下降3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型49 例例銷售分析的事實星座模型。銷售分析的事實星座模型。兩個事實表兩個事實表sales和和shipping共享維表共享維表time,item,location。4.5基于關(guān)系數(shù)據(jù)庫的基于關(guān)系數(shù)據(jù)庫的OLAP實現(xiàn)實現(xiàn) 3.3數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的多維數(shù)據(jù)模型50n 3.1 3.1 數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法數(shù)據(jù)倉庫的系統(tǒng)

41、設(shè)計方法n 3.2 3.2 數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型n 3.3 3.3 如何提高數(shù)據(jù)倉庫的性能如何提高數(shù)據(jù)倉庫的性能n 3.43.4 數(shù)據(jù)倉庫設(shè)計步驟數(shù)據(jù)倉庫設(shè)計步驟n 要求要求: :n 掌握數(shù)據(jù)倉庫的設(shè)計掌握數(shù)據(jù)倉庫的設(shè)計第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計513.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能n粒度劃分粒度劃分?jǐn)?shù)據(jù)倉庫設(shè)計中最重要的問題之一:劃分粒度數(shù)據(jù)倉庫設(shè)計中最重要的問題之一:劃分粒度粒度:數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細(xì)程度和級別粒度:數(shù)據(jù)倉庫中數(shù)據(jù)單元的詳細(xì)程度和級別數(shù)據(jù)越詳細(xì),粒度越小數(shù)據(jù)越詳細(xì),粒度越小級別就越低級別就越低數(shù)據(jù)綜合度越高,粒度越大數(shù)據(jù)

42、綜合度越高,粒度越大級別就越高級別就越高粒度劃分的決定性因素:總的行數(shù)不是總的數(shù)據(jù)量粒度劃分的決定性因素:總的行數(shù)不是總的數(shù)據(jù)量523.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能n劃分粒度步驟:劃分粒度步驟:1.估算數(shù)據(jù)的行數(shù)估算數(shù)據(jù)的行數(shù)對每一已知表對每一已知表:計算一行所占字節(jié)數(shù)的最大值、最小值計算一行所占字節(jié)數(shù)的最大值、最小值對一年內(nèi):對一年內(nèi):統(tǒng)計可能出現(xiàn)的數(shù)據(jù)行數(shù)的最大行數(shù)、最小行數(shù)統(tǒng)計可能出現(xiàn)的數(shù)據(jù)行數(shù)的最大行數(shù)、最小行數(shù)對五年內(nèi):對五年內(nèi):統(tǒng)計可能出現(xiàn)的數(shù)據(jù)行數(shù)的最大行數(shù)、最小行數(shù)統(tǒng)計可能出現(xiàn)的數(shù)據(jù)行數(shù)的最大行數(shù)、最小行數(shù)計算每個表的碼所占的字節(jié)數(shù)計算每個表的碼所占的字節(jié)數(shù)一年產(chǎn)生的

43、數(shù)據(jù)可能占用的最大空間最大值一年內(nèi)最大行數(shù)索引空間一年產(chǎn)生的數(shù)據(jù)可能占用的最大空間最大值一年內(nèi)最大行數(shù)索引空間一年產(chǎn)生的數(shù)據(jù)可能占用的最小空間最小值一年內(nèi)最小行數(shù)索引空間一年產(chǎn)生的數(shù)據(jù)可能占用的最小空間最小值一年內(nèi)最小行數(shù)索引空間五年產(chǎn)生的數(shù)據(jù)可能占用的最大空間最大值五年內(nèi)最大行數(shù)索引空間五年產(chǎn)生的數(shù)據(jù)可能占用的最大空間最大值五年內(nèi)最大行數(shù)索引空間五年產(chǎn)生的數(shù)據(jù)可能占用的最小空間最小值五年內(nèi)最小行數(shù)索引空間五年產(chǎn)生的數(shù)據(jù)可能占用的最小空間最小值五年內(nèi)最小行數(shù)索引空間直到計算完所有表直到計算完所有表 533.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能n劃分粒度步驟:劃分粒度步驟:2、根據(jù)估算出的數(shù)據(jù)

44、行、根據(jù)估算出的數(shù)據(jù)行和和DASD,決定是否要劃分粒度決定是否要劃分粒度,如何劃分粒度如何劃分粒度一般情況下,數(shù)據(jù)行數(shù)越多、所需占用的空間越大,粒度劃分的級別一般情況下,數(shù)據(jù)行數(shù)越多、所需占用的空間越大,粒度劃分的級別就需要越多。就需要越多。 1 1年期年期 5 5年期年期100 000 000 數(shù)據(jù)大部分在海量存儲器 上,需要認(rèn)真設(shè)計粒度10 000 000 可能有一些數(shù)據(jù)存儲于海 量存儲器上,大部分處于 磁盤中,需要考慮粒度問題1 000 000 數(shù)據(jù)存儲在磁盤上,幾乎可以 采用任何數(shù)據(jù)庫設(shè)計100 000 數(shù)據(jù)存儲在磁盤上,可以采用任 何數(shù)據(jù)庫設(shè)計1000 000 000 數(shù)據(jù)大部分在海

45、量存儲器 需 要認(rèn)真設(shè)計粒度100 000 000 可能有一些數(shù)據(jù)存儲于海 量存儲器上,大部分處于 磁盤中,需要認(rèn)真設(shè)計粒度10 000 000 數(shù)據(jù)存儲在磁盤上,幾乎可 以采用任何數(shù)據(jù)庫設(shè)計1000 000 數(shù)據(jù)存儲在磁盤上,可以采用 任何數(shù)據(jù)庫設(shè)計54n數(shù)據(jù)分割:物理存儲單元數(shù)據(jù)分割:物理存儲單元-分片分片邏輯上整體的數(shù)據(jù)邏輯上整體的數(shù)據(jù)分割成較小的、可以獨立管理分割成較小的、可以獨立管理n數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)分片方式:數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)分片方式: 水平分片:按一定的條件將一個關(guān)系按行分為若干不相交的子集水平分片:按一定的條件將一個關(guān)系按行分為若干不相交的子集垂直分片:將關(guān)系按列分為若干子集

46、垂直分片:將關(guān)系按列分為若干子集導(dǎo)出分片(導(dǎo)出水平分片):水平分片的條件不是本身屬性的條件,而是導(dǎo)出分片(導(dǎo)出水平分片):水平分片的條件不是本身屬性的條件,而是其他關(guān)系的屬性的條件其他關(guān)系的屬性的條件 3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能55例如:例如:SC(Sno,Cno,Grade)不是按照學(xué)號或課程號或成績的某類條件分片不是按照學(xué)號或課程號或成績的某類條件分片而是按照學(xué)生年齡而是按照學(xué)生年齡18歲和歲和18歲來分片歲來分片(學(xué)生年齡是學(xué)生關(guān)系(學(xué)生年齡是學(xué)生關(guān)系Student的屬性)的屬性) 混合分片:按上述三種分片方式得到的片段繼續(xù)按另一種方式分片混合分片:按上述三種分片方式得到

47、的片段繼續(xù)按另一種方式分片 1 1-1 2 2 3-1 3-2 3-3 1-2 (a) (b)混合分片混合分片 3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能56n分割形式:分割形式:按時間進行分割按時間進行分割將在同一時段內(nèi)的數(shù)據(jù)組織在一起將在同一時段內(nèi)的數(shù)據(jù)組織在一起按業(yè)務(wù)類型按業(yè)務(wù)類型按地理分布按地理分布組合分割組合分割1996家電類家電類日用化工類日用化工類針織服裝類針織服裝類副食類副食類第一季度第一季度 分片 分片 分片 分片第二季度第二季度 分片 分片 分片 分片第三季度第三季度 分片 分片 分片 分片第四季度第四季度 分片 分片 分片 分片 表表2-1商品銷售數(shù)據(jù)的分割商品銷售數(shù)據(jù)的

48、分割3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能57健康保險健康保險生命保險生命保險事故保險事故保險1988分片1分片2分片31989分片4分片5分片61990分片7分片8分片9 保險公司系統(tǒng)中的數(shù)據(jù)分割 n數(shù)據(jù)分割優(yōu)點:數(shù)據(jù)分割優(yōu)點: 提高系統(tǒng)性能提高系統(tǒng)性能“1996年家電類商品銷售的季節(jié)分布如何?”“每年的第一季度商品銷售在各類商品上的分布情況是怎樣的?” 提高靈活性提高靈活性 修改數(shù)據(jù)定義容易修改數(shù)據(jù)定義容易 不同年份的險種的定義描述是相互獨立3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能58n選擇分割標(biāo)準(zhǔn)考慮的因素:選擇分割標(biāo)準(zhǔn)考慮的因素:l 數(shù)據(jù)量(而非記錄行數(shù))數(shù)據(jù)量(而非記錄行數(shù))數(shù)

49、據(jù)量較小,不分割 數(shù)據(jù)量很大,考慮采用多重標(biāo)準(zhǔn)的組合l數(shù)據(jù)分析處理的要求數(shù)據(jù)分析處理的要求 “商品”主題:按商品大類,商品小類和時間標(biāo)準(zhǔn)分割 “供應(yīng)商”主題:按地理位置(供應(yīng)商的地址),時間分割l簡單易行簡單易行 易于實施,按時間,按業(yè)務(wù)類型l粒度劃分策略等粒度劃分策略等3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能59n將數(shù)據(jù)分割標(biāo)準(zhǔn)與粒度的劃分策略統(tǒng)一考慮將數(shù)據(jù)分割標(biāo)準(zhǔn)與粒度的劃分策略統(tǒng)一考慮“商品商品”主題主題:關(guān)于商品銷售數(shù)據(jù)的粒度是按時間和商品類別綜合關(guān)于商品銷售數(shù)據(jù)的粒度是按時間和商品類別綜合每一粒度層次上:每一粒度層次上:可以按時間和商品類別的組合進行分割可以按時間和商品類別的組合進

50、行分割3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能60 1合并表合并表 在數(shù)據(jù)倉庫中,往往存在一些例行的分析處理,它們要求的查詢也是例行的、在數(shù)據(jù)倉庫中,往往存在一些例行的分析處理,它們要求的查詢也是例行的、相對固定的。相對固定的。當(dāng)某一例行的查詢涉及固定的多個表的數(shù)據(jù)項,那么就需要首先對這幾個表進當(dāng)某一例行的查詢涉及固定的多個表的數(shù)據(jù)項,那么就需要首先對這幾個表進行連接操作,如果這幾個表的記錄分散存放在幾個物理塊中時,多個表的存取行連接操作,如果這幾個表的記錄分散存放在幾個物理塊中時,多個表的存取和連接操作的代價會很大。和連接操作的代價會很大。為了節(jié)省為了節(jié)省I/OI/O開銷,可以把這些表的記

51、錄混合存放在一起,就可以降低表連接開銷,可以把這些表的記錄混合存放在一起,就可以降低表連接操作的代價。操作的代價。 3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能61 1合并表(例子)合并表(例子) 學(xué)生姓名SN所屬系名SD學(xué)生年齡SA S1 ACS 20 S2 BCS 21 S3 CMA 19 S4 DCI 19 S5 EMA 20學(xué)號#s 學(xué)號 S#課程號 C#學(xué)習(xí)成績 G S1 C1 A S1 C2 B S1 C3 C S1 C5 C S2 C1 A S2 C2 A S2 C4 A S3 C2 B S3 C4 D S4 C3 C S4 C5 B S5 C1 B S5 C3 A S5 C4 A

52、S1ACS20 S1C1AS1C2BS1C3CS1C5CS2BCS21S2C1AS2C2AS3C4DS4DCI19 S4C3A SC表記錄S表記錄學(xué)生選課表SC合并合并表3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能622建立數(shù)據(jù)序列建立數(shù)據(jù)序列重復(fù)調(diào)頁重復(fù)調(diào)頁頁面頁面1(記錄記錄1)-頁面頁面n(記錄記錄2)-頁面頁面1(記錄記錄3)-頁面頁面2(記錄記錄4)-圖2-8 數(shù)據(jù)序列 3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能633引入冗余引入冗余數(shù)據(jù)分析處理通常要涉及不同表的多個屬性數(shù)據(jù)分析處理通常要涉及不同表的多個屬性,一些表的某些屬一些表的某些屬性可能在許多地方都要用到性可能在許多地方都要用到

53、,如果這些屬性上的值是不常更新如果這些屬性上的值是不常更新的話的話,那么我們就可以將這些屬性復(fù)制到多個主題中,從而減那么我們就可以將這些屬性復(fù)制到多個主題中,從而減少處理時被存取的表的個數(shù)。少處理時被存取的表的個數(shù)。3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能643引入冗余(例子)引入冗余(例子)例:在商場例:在商場DW中,在中,在“商品商品”主題中有一個保存商品固定信息的關(guān)系表主題中有一個保存商品固定信息的關(guān)系表:商品商品(商品號、商品名、類別、商品號、商品名、類別、),而在商品銷售表或采購表中則只存商品號。而在商品銷售表或采購表中則只存商品號。但幾乎沒有人問但幾乎沒有人問:“號商品的銷售情況

54、如何?號商品的銷售情況如何?”而經(jīng)常問而經(jīng)常問:“某品牌的冰箱的銷售可好?某品牌的冰箱的銷售可好?”或或“今年什么類型的洗衣機最暢銷?今年什么類型的洗衣機最暢銷?”這類問題以商品的一些具體描述信息作為分析的限定條件這類問題以商品的一些具體描述信息作為分析的限定條件,且涉及的有且涉及的有關(guān)銷售的數(shù)據(jù)量又很大關(guān)銷售的數(shù)據(jù)量又很大,這樣就不得不反復(fù)存取商品表這樣就不得不反復(fù)存取商品表,與大量的銷售與大量的銷售表記錄進行連接或半連接操作。表記錄進行連接或半連接操作。如果將商品表的一些特定屬性加入到銷售表或采購表中如果將商品表的一些特定屬性加入到銷售表或采購表中,即增加數(shù)據(jù)冗即增加數(shù)據(jù)冗余余,就可以省去

55、這一步連接操作就可以省去這一步連接操作,減少訪問的代價。減少訪問的代價。3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能65 4 4生成導(dǎo)出數(shù)據(jù)生成導(dǎo)出數(shù)據(jù) 導(dǎo)出數(shù)據(jù):原始數(shù)據(jù)上進行匯總或計算的結(jié)果導(dǎo)出數(shù)據(jù):原始數(shù)據(jù)上進行匯總或計算的結(jié)果預(yù)處理,提高聯(lián)機分析速度預(yù)處理,提高聯(lián)機分析速度更高級別的公用數(shù)據(jù),免去不同用戶重復(fù)計算更高級別的公用數(shù)據(jù),免去不同用戶重復(fù)計算3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能665、建立廣義索引建立廣義索引(creativeindex)n廣義索引:用來記錄具有某些特殊性質(zhì)數(shù)據(jù)的索引廣義索引:用來記錄具有某些特殊性質(zhì)數(shù)據(jù)的索引特點:非常小特點:非常小大大提高查詢效率大大提

56、高查詢效率例:記錄 當(dāng)月銷售最糟糕的10種商品的名稱 的索引建立建立“廣義索引廣義索引”:抽取數(shù)據(jù)并向數(shù)據(jù)倉庫中裝載時建立抽取數(shù)據(jù)并向數(shù)據(jù)倉庫中裝載時建立每次數(shù)據(jù)倉庫裝載時,重新生成每次數(shù)據(jù)倉庫裝載時,重新生成“廣義索引廣義索引”的的內(nèi)容不要為了建立內(nèi)容不要為了建立“廣義索引廣義索引”而去掃描數(shù)據(jù)倉庫而去掃描數(shù)據(jù)倉庫n管理管理“廣義索引廣義索引”: 元數(shù)據(jù)中完整地定義元數(shù)據(jù)中完整地定義“廣義索引廣義索引”說明說明3.3提高數(shù)據(jù)倉庫的性能提高數(shù)據(jù)倉庫的性能67n 3.1 3.1 數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法n 3.2 3.2 數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型n

57、 3.3 3.3 如何提高數(shù)據(jù)倉庫的物理性能如何提高數(shù)據(jù)倉庫的物理性能n 3.4 3.4 數(shù)據(jù)倉庫設(shè)計步驟數(shù)據(jù)倉庫設(shè)計步驟n 要求要求: :n 掌握數(shù)據(jù)倉庫的設(shè)計掌握數(shù)據(jù)倉庫的設(shè)計第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計68n 3.1 3.1 數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法n 3.2 3.2 數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型數(shù)據(jù)倉庫設(shè)計的三級數(shù)據(jù)模型n 3.3 3.3 如何提高數(shù)據(jù)倉庫的物理性能如何提高數(shù)據(jù)倉庫的物理性能n 3.4 3.4 數(shù)據(jù)倉庫設(shè)計步驟數(shù)據(jù)倉庫設(shè)計步驟n 要求要求: :n 掌握數(shù)據(jù)倉庫的設(shè)計掌握數(shù)據(jù)倉庫的設(shè)計第三章第三章數(shù)據(jù)倉庫設(shè)計數(shù)據(jù)倉庫設(shè)計693.4數(shù)據(jù)倉庫設(shè)計步驟

58、數(shù)據(jù)倉庫設(shè)計步驟1、數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法不能采用同開發(fā)傳統(tǒng)的、數(shù)據(jù)倉庫的系統(tǒng)設(shè)計方法不能采用同開發(fā)傳統(tǒng)的OLTP數(shù)據(jù)庫一樣的設(shè)計方法。數(shù)據(jù)庫一樣的設(shè)計方法。2、數(shù)據(jù)倉庫系統(tǒng)的原始需求不明確,且不斷變化與增加、數(shù)據(jù)倉庫系統(tǒng)的原始需求不明確,且不斷變化與增加,開發(fā)者最初并不能確切了解到用戶的明確而詳細(xì)的需求開發(fā)者最初并不能確切了解到用戶的明確而詳細(xì)的需求3、用戶所能提供的是需求的大方向以及部分需求,不能較、用戶所能提供的是需求的大方向以及部分需求,不能較準(zhǔn)確地預(yù)見到以后的需求準(zhǔn)確地預(yù)見到以后的需求4、采用原型法是比較合適的、采用原型法是比較合適的原型法的思想是從構(gòu)建系統(tǒng)的簡單的基本框架著手,不斷

59、原型法的思想是從構(gòu)建系統(tǒng)的簡單的基本框架著手,不斷豐富與完善整個系統(tǒng)豐富與完善整個系統(tǒng) 是不斷循環(huán)、反饋而使系統(tǒng)不斷增長與完善的過程自始至終要求決策人員和開發(fā)者的共同參與和密切協(xié)作自始至終要求決策人員和開發(fā)者的共同參與和密切協(xié)作70數(shù)據(jù)倉庫設(shè)計的大體步驟:數(shù)據(jù)倉庫設(shè)計的大體步驟:1.概念模型設(shè)計概念模型設(shè)計2.技術(shù)準(zhǔn)備工作技術(shù)準(zhǔn)備工作3.邏輯模型設(shè)計邏輯模型設(shè)計4.物理模型設(shè)計物理模型設(shè)計5.數(shù)據(jù)倉庫生成數(shù)據(jù)倉庫生成6.數(shù)據(jù)倉庫運行與維護數(shù)據(jù)倉庫運行與維護3.4數(shù)據(jù)倉庫設(shè)計步驟數(shù)據(jù)倉庫設(shè)計步驟711.界定系統(tǒng)邊界2.確定主題域 邏輯模型設(shè)計邏輯模型設(shè)計4.關(guān)系模式定義3.記錄系統(tǒng)定義1.粒度層

60、次劃分2.數(shù)據(jù)分割策略 物理模型設(shè)計物理模型設(shè)計1.確定存儲結(jié)構(gòu)2.確定索引結(jié)構(gòu)3.確定存放位置4.確定存儲分配 技術(shù)準(zhǔn)備工作技術(shù)準(zhǔn)備工作1.技術(shù)評估2.技術(shù)環(huán)境準(zhǔn)備 概念模型設(shè)計概念模型設(shè)計 分析主題域, 針對每一個選定的當(dāng)前實施的主題域1.設(shè)計接口2.數(shù)據(jù)裝入數(shù)數(shù)據(jù)據(jù)倉倉庫庫生生成成數(shù)據(jù)倉庫運行與維護數(shù)據(jù)倉庫運行與維護圖2-9 數(shù)據(jù)倉庫設(shè)計步驟3.4數(shù)據(jù)倉庫設(shè)計步驟數(shù)據(jù)倉庫設(shè)計步驟72n概念模型設(shè)計概念模型設(shè)計:1.界定系統(tǒng)邊界界定系統(tǒng)邊界2.確定主要的主題域及其內(nèi)容確定主要的主題域及其內(nèi)容概念模型設(shè)計成果概念模型設(shè)計成果:在原有的數(shù)據(jù)庫的基礎(chǔ)上建立一個較為穩(wěn)固的概念模型在原有的數(shù)據(jù)庫的基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論