數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》演示稿第5章_第1頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》演示稿第5章_第2頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》演示稿第5章_第3頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》演示稿第5章_第4頁
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》演示稿第5章_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1,復(fù)旦大學(xué) 軟件學(xué)院2004.04,數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 (第5章),2,第5章數(shù)據(jù)倉庫系統(tǒng)的實(shí)施,主要內(nèi)容 SQL Server 2000數(shù)據(jù)倉庫設(shè)計(jì)與使用 其他一些公司的數(shù)據(jù)倉庫實(shí)施戰(zhàn)略 數(shù)據(jù)倉庫的投資回報(bào)分析,3,SQL Server 2000 的基本服務(wù),SQL Server 2000 關(guān)系數(shù)據(jù)庫引擎:是一個(gè)流行的、具有高度可伸縮性和高度可靠性的數(shù)據(jù)存儲(chǔ)引擎。該數(shù)據(jù)庫引擎將數(shù)據(jù)存儲(chǔ)在表中。每個(gè)表上都列出組織感興趣的一些對(duì)象,每個(gè)表上的列表示由表建模的對(duì)象的屬性,而表上的行則代表由表建模的這種對(duì)象的事例。應(yīng)用程序可以將結(jié)構(gòu)化查詢語言 (SQL) 的語句提交給數(shù)據(jù)庫引擎,后者將表格格式的結(jié)

2、果集返回給應(yīng)用程序。SQL Server 支持的特定 SQL 語言稱為 Transact-SQL。應(yīng)用程序還可以提交 SQL 語句或 XPath 查詢,并請(qǐng)求數(shù)據(jù)庫引擎以 XML文檔形式返回結(jié)果。 關(guān)系數(shù)據(jù)庫引擎具有高度的可伸縮性。SQL Server 2000 企業(yè)版可以支持多組數(shù)據(jù)庫服務(wù)器相互協(xié)作,構(gòu)成可供上千用戶同時(shí)訪問的 TB 大小的數(shù)據(jù)庫。該引擎能夠處理世界上任何 Web 站點(diǎn)的流量。該數(shù)據(jù)庫引擎還能自我調(diào)節(jié),自動(dòng)在連接到數(shù)據(jù)庫的用戶增多時(shí)獲取資源,并在用戶注銷后釋放資源。,4,SQL Server 2000 的基本服務(wù),關(guān)系數(shù)據(jù)庫引擎具有高可靠性。在數(shù)據(jù)庫引擎的早期版本中要求停止和

3、啟動(dòng)的管理操作現(xiàn)在可以在引擎運(yùn)行當(dāng)中執(zhí)行,從而增加了可用性。數(shù)據(jù)庫引擎與 Windows 2000 和 Windows NT 故障轉(zhuǎn)移群集的集成可定義虛擬服務(wù)器,即使節(jié)點(diǎn)中的一臺(tái)物理服務(wù)器出現(xiàn)故障,這些虛擬服務(wù)器仍然保持運(yùn)行。在適當(dāng)?shù)牡胤?,日志傳送可以用于維護(hù)熱備用服務(wù)器。在故障發(fā)生的數(shù)分鐘內(nèi),熱備用服務(wù)器可以代替生產(chǎn)服務(wù)器運(yùn)行。 關(guān)系數(shù)據(jù)庫引擎具有高度的安全性。登錄身份驗(yàn)證可以與 Windows 身份驗(yàn)證集成在一起,這樣,密碼將不會(huì)存儲(chǔ)在 SQL Server 中,也不會(huì)通過網(wǎng)絡(luò)發(fā)送而被網(wǎng)絡(luò)嗅探器讀取。網(wǎng)站可以設(shè)置 C2 級(jí)審核,對(duì)所有訪問數(shù)據(jù)庫的用戶進(jìn)行審核,還可以使用安全套接字層 (SS

4、L) 加密的辦法,對(duì)所有在應(yīng)用程序和數(shù)據(jù)庫間傳送的數(shù)據(jù)進(jìn)行加密。,5,SQL Server 2000 的基本服務(wù),數(shù)據(jù)庫引擎的分布式查詢功能??梢栽L問所有可通過 OLE DB 訪問的數(shù)據(jù)源中的數(shù)據(jù)。在 Transact-SQL 語句中,可以像引用實(shí)際駐留在 SQL Server 數(shù)據(jù)庫中的表一樣引用遠(yuǎn)程 OLE DB 數(shù)據(jù)源表。此外,全文檢索功能可以對(duì) SQL Server 數(shù)據(jù)庫或 Windows 文件中存儲(chǔ)的文本數(shù)據(jù)進(jìn)行復(fù)雜的模式匹配。 關(guān)系數(shù)據(jù)庫引擎能夠存儲(chǔ)由頂層聯(lián)機(jī)事務(wù)處理 (OLTP) 系統(tǒng)生成的所有事務(wù)的詳細(xì)記錄。該數(shù)據(jù)庫引擎還可以支持最大的聯(lián)機(jī)分析 (OLAP) 數(shù)據(jù)倉庫中的事實(shí)

5、數(shù)據(jù)表和維度表的嚴(yán)格處理要求。 Microsoft SQL Server 2000 Analysis Services 提供分析數(shù)據(jù)倉庫和數(shù)據(jù)集市中存儲(chǔ)的數(shù)據(jù)的工具。Analysis Services 以多維數(shù)據(jù)集的形式顯示事實(shí)數(shù)據(jù)表和維度表中的數(shù)據(jù),從多維數(shù)據(jù)集中可以分析趨勢和其它對(duì)于規(guī)劃今后工作非常重要的信息。在 Analysis Services 多維數(shù)據(jù)集上處理 OLAP 查詢比試圖在 OLTP 數(shù)據(jù)庫中記錄的詳細(xì)數(shù)據(jù)上進(jìn)行同樣的查詢要快得多。,6,SQL Server 2000的特性,Internet 集成:SQL Server 2000 數(shù)據(jù)庫引擎提供完整的 XML 支持。它還具有

6、構(gòu)成最大的 Web 站點(diǎn)的數(shù)據(jù)存儲(chǔ)組件所需的可伸縮性、可用性和安全功能。其程序設(shè)計(jì)模型與 Windows DNA 構(gòu)架集成,用以開發(fā) Web 應(yīng)用程序,并且 還 支持 English Query 和 Microsoft 搜索服務(wù)等功能,在 Web 應(yīng)用程序中包含了用戶友好的查詢和強(qiáng)大的搜索功能。 可伸縮性和可用性:同一個(gè)數(shù)據(jù)庫引擎可以在不同的平臺(tái)上使用。SQL Server 2000 企業(yè)版支持聯(lián)合服務(wù)器、索引視圖和大型內(nèi)存支持等功能,使其得以升級(jí)到最大 Web 站點(diǎn)所需的性能級(jí)別。 企業(yè)級(jí)數(shù)據(jù)庫功能:SQL Server 2000 關(guān)系數(shù)據(jù)庫引擎能充分保護(hù)數(shù)據(jù)完整性,同時(shí)將管理上千個(gè)并發(fā)修改

7、數(shù)據(jù)庫的用戶的開銷減到最小。其分布式查詢得以引用來自不同數(shù)據(jù)源的數(shù)據(jù),就好象這些數(shù)據(jù)是 SQL Server 2000 數(shù)據(jù)庫的一部分,同時(shí)分布式事務(wù)支持充分保護(hù)任何分布式數(shù)據(jù)更新的完整性。復(fù)制功能可維護(hù)多個(gè)數(shù)據(jù)復(fù)本,同時(shí)確保單獨(dú)的數(shù)據(jù)復(fù)本保持同步。,7,SQL Server 2000的特性,易于安裝、部署和使用:SQL Server 2000 中包括一系列管理和開發(fā)工具,這些工具可改進(jìn)在多個(gè)站點(diǎn)上安裝、部署、管理和使用 SQL Server 的過程。SQL Server 2000 還支持基于標(biāo)準(zhǔn)的、與 Windows DNA 集成的程序設(shè)計(jì)模型,使 SQL Server 數(shù)據(jù)庫和數(shù)據(jù)倉庫的使

8、用成為生成強(qiáng)大的可伸縮系統(tǒng)的無縫部分。這些功能可以快速交付 SQL Server 應(yīng)用程序,使客戶只需最少的安裝和管理開銷即可實(shí)現(xiàn)這些應(yīng)用程序。 數(shù)據(jù)倉庫:SQL Server 2000 中包括析取和分析匯總數(shù)據(jù)以進(jìn)行聯(lián)機(jī)分析處理 (OLAP) 的工具。SQL Server 中還包括一些工具,可用來直觀地設(shè)計(jì)數(shù)據(jù)庫并通過 English Query 來分析數(shù)據(jù)。,8,SQL Server 2000 組件關(guān)系圖,9,SQL Server 2000數(shù)據(jù)倉庫工具,10,關(guān)系型數(shù)據(jù)庫,關(guān)系型數(shù)據(jù)庫是設(shè)計(jì)、構(gòu)造、維護(hù)數(shù)據(jù)倉庫的基礎(chǔ)技術(shù)。 Microsoft SQL Server 2000是一個(gè)關(guān)系型數(shù)據(jù)

9、庫管理系統(tǒng),它提供了強(qiáng)大的數(shù)據(jù)庫引擎和許多工具,這些工具不僅可以用于數(shù)據(jù)庫的管理,而且可以用于數(shù)據(jù)倉庫的管理,是數(shù)據(jù)倉庫的技術(shù)基礎(chǔ)。,11,數(shù)據(jù)轉(zhuǎn)換服務(wù)(DTS),提供數(shù)據(jù)轉(zhuǎn)換功能,例如數(shù)據(jù)引入、引出以及在SQL Server和任何OLE DB、ODBC或者文本各是文件之間轉(zhuǎn)換數(shù)據(jù)。 利用DTS,通過交互式地或按照規(guī)劃自動(dòng)地從多處異構(gòu)數(shù)據(jù)源輸入數(shù)據(jù),這樣便有可能在SQL Server上建立數(shù)據(jù)倉庫和數(shù)據(jù)市場。 數(shù)據(jù)的來源特性允許用戶輸入查詢數(shù)據(jù)的輸入時(shí)間、地點(diǎn)及其計(jì)算方法。數(shù)據(jù)的引入引出是通過以相同的格式讀寫數(shù)據(jù),在應(yīng)用程序之間交換數(shù)據(jù)的過程。一次轉(zhuǎn)換是指在源數(shù)據(jù)被存儲(chǔ)到目的地之前,對(duì)其進(jìn)行的

10、一系列操作。 轉(zhuǎn)換特性使得載引入引出中完成復(fù)雜數(shù)據(jù)的驗(yàn)證、清除等功能變得非常簡單。定制轉(zhuǎn)換對(duì)象可以被創(chuàng)建并集成進(jìn)第三方產(chǎn)品中。 DTS支持多步封裝,其中大量文件能被單獨(dú)處理,最終被集成為一個(gè)單一的文件。在目的地,該文件的記錄能被系統(tǒng)分為多個(gè)記錄,或相反,多個(gè)記錄被集成為一個(gè)單一的記錄。 DTS也與微軟的中心庫集成在一起,微軟數(shù)據(jù)中心庫存儲(chǔ)元數(shù)據(jù)、數(shù)據(jù)傳送包和數(shù)據(jù)源特性,許多獨(dú)立的軟件經(jīng)銷商支持和共享這個(gè)元數(shù)據(jù)模型。數(shù)據(jù)轉(zhuǎn)換服務(wù)可以在SQL Server間移動(dòng)數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)、觸發(fā)器、規(guī)則、默認(rèn)、約束和用戶定義的數(shù)據(jù)類型,只有數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)可以在不同的異構(gòu)數(shù)據(jù)源中間傳遞。,12,數(shù)據(jù)復(fù)制,數(shù)據(jù)復(fù)制

11、:是一種實(shí)現(xiàn)數(shù)據(jù)分布的方法,就是指把一個(gè)系統(tǒng)中的數(shù)據(jù)通過網(wǎng)絡(luò)分布到另外一個(gè)或者多個(gè)地理位置不同的系統(tǒng)中,以適應(yīng)可伸縮組織的需要,減輕主服務(wù)器的工作負(fù)荷和提高數(shù)據(jù)的使用效率。 數(shù)據(jù)復(fù)制的過程類似于報(bào)紙雜志的出版過程,即把信息從信息源迅速傳送到信息接受處。出版服務(wù)器包含了將要復(fù)制的數(shù)據(jù)所在的數(shù)據(jù)庫,該服務(wù)器負(fù)責(zé)制作將要出版的數(shù)據(jù),然后將這些出版的數(shù)據(jù)的所有變化發(fā)送到分布服務(wù)器中。訂閱服務(wù)器是數(shù)據(jù)復(fù)制的目標(biāo)地,負(fù)責(zé)接收復(fù)制過來的數(shù)據(jù),并且負(fù)責(zé)接收從出版服務(wù)器上傳送過來的全部變化。分布服務(wù)器在出版服務(wù)器和訂閱服務(wù)器之間起中介作用。分布服務(wù)器負(fù)責(zé)從出版服務(wù)器中接受復(fù)制過來的數(shù)據(jù),然后在該服務(wù)器上的分布數(shù)

12、據(jù)庫中存儲(chǔ)這些變化,最后按照指定的時(shí)間間隔推向響應(yīng)的訂閱服務(wù)器。 在復(fù)制過程中,把將要復(fù)制的數(shù)據(jù)稱為出版物和文章。文章是復(fù)制的基本單元,是組成出版物的最小單位。文章與數(shù)據(jù)庫中的表對(duì)應(yīng)。文章既可以對(duì)應(yīng)一個(gè)表中的全部數(shù)據(jù),也可以指包括表中的一部分?jǐn)?shù)據(jù)。出版物是一個(gè)完整的將要復(fù)制的內(nèi)容,它包括一篇或多篇文章,是訂閱服務(wù)器訂閱的對(duì)象。,13,OLE DB,OLE DB式微軟開發(fā)的數(shù)據(jù)訪問編程界面。微軟已經(jīng)定位OLE DB是ODBC繼承者,ODBC主要用于處理關(guān)系型數(shù)據(jù)。ODBC是基于SQL的,它可以很好的用于關(guān)系型數(shù)據(jù)庫訪問,但是它不能用于非關(guān)系型數(shù)據(jù)源。象ODBC一樣,OLE DB也提供對(duì)關(guān)系型數(shù)據(jù)

13、的訪問,但是OLE DB擴(kuò)展了由ODBC提供的功能。 OLE DB的設(shè)計(jì)目的是用于所有數(shù)據(jù)類型的標(biāo)準(zhǔn)界面。除了關(guān)系型數(shù)據(jù)庫的訪問,OLE DB提供對(duì)各種各樣數(shù)據(jù)源的訪問,包括Excel電子表格的數(shù)據(jù),dBase的ISAM文件、電子郵件、新的NT的Active Directory和IBM的DB2數(shù)據(jù)。使用OLE DB,用一個(gè)界面就可以訪問許多不同的數(shù)據(jù)源。 OLE DB是微軟的數(shù)據(jù)訪問策略,稱為萬能數(shù)據(jù)訪問的基礎(chǔ)。萬能數(shù)據(jù)訪問指的是一組通用界面,它用來表示來自任何數(shù)據(jù)源的數(shù)據(jù)。OLE DB是使萬能訪問成為現(xiàn)實(shí)的技術(shù)。萬能數(shù)據(jù)訪問和OLE DB的另一方面是所有的對(duì)象都應(yīng)該在數(shù)據(jù)庫中維護(hù),不是企圖把

14、商業(yè)要求的不同的數(shù)據(jù)移動(dòng)到一個(gè)面向?qū)ο蟮臄?shù)據(jù)庫中。OLE DB創(chuàng)建和理解企業(yè)數(shù)據(jù)并且在各種數(shù)據(jù)源中維護(hù)。,14,Analysis Services,在數(shù)據(jù)倉庫或者數(shù)據(jù)市場中的信息可OLAP處理,OLAP可以有效的以維度和度量組成的立方體方式察看數(shù)據(jù)。維度是一種描述性分類,例如,維度可能是地理位置,也可能是產(chǎn)品類型。度量是一種定量數(shù)值,例如銷售額、庫存量或者總費(fèi)用。來自于原始數(shù)據(jù)源的合計(jì)存儲(chǔ)在每一個(gè)立方體單元中,這種組織數(shù)據(jù)的方法可以輕易得過濾數(shù)據(jù)、有效的加快數(shù)據(jù)的查詢。然而,存在著這種問題:雖然OLAP合計(jì)是在數(shù)據(jù)倉庫中可以達(dá)到的查詢性能的關(guān)鍵因素,但是存儲(chǔ)這些合計(jì)數(shù)據(jù)的成本是磁盤存儲(chǔ)量。事實(shí)

15、上,合計(jì)數(shù)據(jù)量可以輕易的超過原有的數(shù)據(jù)量。另外,當(dāng)維度和合計(jì)量提高時(shí),所要求的OLAP數(shù)據(jù)存儲(chǔ)量也大大的提高。這種對(duì)存儲(chǔ)量的極大要求一般稱為數(shù)據(jù)爆炸。OLAP描述的是一種多維數(shù)據(jù)服務(wù),這種服務(wù)的設(shè)計(jì)目的是保證分析員、經(jīng)理和決策者針對(duì)特定的問題,通過快速、一致、交互式的實(shí)時(shí)數(shù)據(jù)訪問和分析。,15,Analysis Services,MOLAP:多維型OLAP在一個(gè)用于壓縮索引的永久數(shù)據(jù)存儲(chǔ)中存儲(chǔ)維度數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)。合計(jì)存儲(chǔ)用來加快數(shù)據(jù)訪問。MOLAP查詢引擎是專有的,而且優(yōu)化成由MOLAP數(shù)據(jù)存儲(chǔ)使用的存儲(chǔ)格式。MOLAP提供了比ROLAP更快的查詢處理速度,并且要求更少的存儲(chǔ)空間。然而,它不能

16、較好的伸縮,并且要求使用單獨(dú)的數(shù)據(jù)庫來存儲(chǔ)。 ROLAP:關(guān)系型OLAP在關(guān)系型數(shù)據(jù)表中存儲(chǔ)合計(jì)。ROLAP針對(duì)關(guān)系型數(shù)據(jù)庫的應(yīng)用允許其利用已有的數(shù)據(jù)庫資源,并且允許ROLAP應(yīng)用程序很好的伸縮。然而,ROLAP使用表存儲(chǔ)合計(jì)則要求比MOLAP更多的磁盤空間,速度相對(duì)比較慢。 HOLAP:正如其名稱所示,混合型OLAP介于MOLAP和ROLAP之間。象ROLAP一樣,HOLAP將主數(shù)據(jù)存儲(chǔ)在源數(shù)據(jù)庫中。象MOLAP一樣,HOLAP把合計(jì)存儲(chǔ)在一個(gè)永久性數(shù)據(jù)存儲(chǔ)的地方,它與主關(guān)系數(shù)據(jù)庫分開。這種混合形式使HOLAP可以具備MOLAP和ROLAP兩者的優(yōu)點(diǎn) 。,16,English Query,微

17、軟的英語查詢環(huán)境允許設(shè)計(jì)者將他們的關(guān)系數(shù)據(jù)庫轉(zhuǎn)移到英語查詢上來,這給最終用戶提供了使用英語提出問題而不是用SQL語言進(jìn)行查詢的能力。English Query服務(wù)是利用英語查詢域編輯器創(chuàng)建的,提供了數(shù)據(jù)庫的有關(guān)信息,從而使English Query可用于處理關(guān)于特殊表、域和數(shù)據(jù)的英語問題。,17,Meta Data Services,在Microsoft SQL Server 2000中,許多工具把元數(shù)據(jù)存儲(chǔ)在位于msdb系統(tǒng)數(shù)據(jù)庫中的集中式中心倉庫中。這里提到的元數(shù)據(jù)是指數(shù)據(jù)的數(shù)據(jù),Meta Data Services提供瀏覽這些元數(shù)據(jù)的功能。數(shù)據(jù)中心庫提供了一個(gè)通用的位置:可以用來存放對(duì)象

18、和對(duì)象之間的關(guān)系。通過使用一些軟件工具,可以描述面向?qū)ο蟮男畔ⅲ很浖ぞ呤褂酶黝悓?duì)象組成的信息。對(duì)象接口界面,界面由屬性、方法和集合組成,集合包含了對(duì)其他界面的關(guān)系,以及關(guān)聯(lián)對(duì)象。,18,PivotTable服務(wù),PivotTable服務(wù)和Analysis Services一起為用戶提供客戶端對(duì)OLAP數(shù)據(jù)的存取。PivotTable服務(wù)運(yùn)行于客戶端工作站上,它使得可以利用VisualBasic或其他語言來開發(fā)用戶程序,這些程序可以利用OLE DB技術(shù),并使用Analysis Services中的OLAP數(shù)據(jù)或直接取自關(guān)系數(shù)據(jù)庫的數(shù)據(jù)。當(dāng)它和OLAP服務(wù)一起使用時(shí),PivotTable服務(wù)可以

19、自動(dòng)將進(jìn)程或緩沖內(nèi)存分配到最合適的位置,并且允許多個(gè)客戶動(dòng)態(tài)存取同一個(gè)立方體。PivotTable服務(wù)業(yè)能在本地客戶機(jī)上存儲(chǔ)數(shù)據(jù),從而使用戶可以在不連接Analysis Services的情況下對(duì)數(shù)據(jù)進(jìn)行分析。這種移動(dòng)式的解決方案允許分析者將數(shù)據(jù)帶回家或在途中進(jìn)行分析。為最終用戶提供的OLAP數(shù)據(jù)分析和描述工具可以利用PivotTable服務(wù)進(jìn)行開發(fā)。PivotTable服務(wù)也提供了開放的界面,獨(dú)立的軟件銷售商可以利用它來開發(fā)第三方應(yīng)用的產(chǎn)品。,19,數(shù)據(jù)倉庫的實(shí)現(xiàn)步驟,明確用戶需求 設(shè)計(jì)和建立數(shù)據(jù)倉庫 使用數(shù)據(jù)倉庫 維護(hù)和優(yōu)化數(shù)據(jù)倉庫,20,數(shù)據(jù)倉庫生命周期管理,數(shù)據(jù)倉庫系統(tǒng)框架 影響數(shù)據(jù)倉

20、庫項(xiàng)目成功的因素 數(shù)據(jù)倉庫的技術(shù) 數(shù)據(jù)倉庫項(xiàng)目所需的角色,21,數(shù)據(jù)倉庫系統(tǒng)框架,基本特點(diǎn) 擁有為項(xiàng)目作出技術(shù)決策的觀察點(diǎn) 擁有確定項(xiàng)目是否能夠完成的計(jì)量參照點(diǎn) 擁有以靈活方式運(yùn)用現(xiàn)有知識(shí)的能力 分部分、分階段依靠多個(gè)工作小組協(xié)調(diào)完成 四個(gè)階段 設(shè)想階段 規(guī)劃階段 開發(fā)階段 穩(wěn)定階段,22,影響數(shù)據(jù)倉庫項(xiàng)目成功的因素,數(shù)據(jù)倉庫創(chuàng)建前的影響因素 管理層的信任 從管理項(xiàng)目開始:面向主題 交流實(shí)現(xiàn)目標(biāo) 任命一個(gè)面向用戶的項(xiàng)目經(jīng)理 數(shù)據(jù)倉庫創(chuàng)建時(shí)的影響因素 采用成熟的技術(shù) 注重查詢而不是注重事務(wù) 只加載所需數(shù)據(jù) 定義合適的數(shù)據(jù)源:元數(shù)據(jù)映射 明確定義主題 數(shù)據(jù)倉庫創(chuàng)建后的影響因素 面向決策的使用者的信

21、任,23,數(shù)據(jù)倉庫的技術(shù),管理大量的數(shù)據(jù) 管理多介質(zhì) 索引和監(jiān)視數(shù)據(jù) 多種技術(shù)的接口 對(duì)數(shù)據(jù)存放位置的控制 數(shù)據(jù)的并行存儲(chǔ)和管理 元數(shù)據(jù)管理技術(shù) 語言接口 數(shù)據(jù)的高效裝入 高效索引的利用技術(shù) 數(shù)據(jù)壓縮技術(shù) 復(fù)合鍵碼技術(shù) 變長數(shù)據(jù) 鎖管理切換技術(shù) 快速恢復(fù)技術(shù) 其他技術(shù):事務(wù)集成性、高速緩存、行/頁級(jí)鎖定、引用完整性、數(shù)據(jù)視圖等,24,數(shù)據(jù)倉庫項(xiàng)目所需的角色,管理角色 項(xiàng)目主管 項(xiàng)目經(jīng)理 技術(shù)角色 數(shù)據(jù)提供專家 體系結(jié)構(gòu)設(shè)計(jì)者 數(shù)據(jù)庫管理員 數(shù)據(jù)遷移專家 數(shù)據(jù)轉(zhuǎn)換專家 數(shù)據(jù)集市開發(fā)的領(lǐng)導(dǎo)人 質(zhì)量保證/測試專家 維護(hù)角色 內(nèi)行的用戶 培訓(xùn)教師 技術(shù)文檔編寫人員 工具專家 銷售商聯(lián)系人,25,創(chuàng)建數(shù)

22、據(jù)倉庫向?qū)?26,創(chuàng)建數(shù)據(jù)倉庫向?qū)?27,創(chuàng)建數(shù)據(jù)倉庫向?qū)?28,創(chuàng)建數(shù)據(jù)倉庫向?qū)?29,完成創(chuàng)建數(shù)據(jù)倉庫,30,創(chuàng)建事實(shí)維度表,31,創(chuàng)建事實(shí)維度表,32,屬性選項(xiàng)卡,33,屬性選項(xiàng)卡,34,創(chuàng)建數(shù)據(jù)庫關(guān)系圖向?qū)?35,關(guān)系圖,36,多維數(shù)據(jù)集向?qū)?37,多維數(shù)據(jù)集,38,多維數(shù)據(jù)集,39,數(shù)據(jù)倉庫軟件市場,19931998平均年增23.9%, 達(dá)22億美元。 數(shù)據(jù)值入工具:從數(shù)據(jù)庫中提取數(shù)據(jù),轉(zhuǎn)換為數(shù)據(jù)倉庫格式并送入數(shù)據(jù)倉庫中。 數(shù)據(jù)過濾工具:對(duì)數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行存放和管理。 數(shù)據(jù)存取工具:讓用戶存取數(shù)據(jù)倉庫中的數(shù)據(jù)。 數(shù)據(jù)倉庫市場劃分,軟件總市場 6949312416612。3%,數(shù)據(jù)

23、存取 663-125813.7%,第三代語言/公用程序 3061-601914.5%,CASE 1751-308512.5%,DBMS 5801-11680%15.0%,其它市場 58163-10212411.9%,數(shù)據(jù)存取 663-125813.7%,數(shù)據(jù)提取/轉(zhuǎn)換 31-23249.3%,數(shù)據(jù)管理 59-70864.3%,數(shù)據(jù)倉庫 753-219823.9%,數(shù)據(jù)復(fù)制 14-31987.1%,注:*-*% 指1993年-1998年 銷售額(M$) 年遞增率,40,(1) 動(dòng)態(tài)可伸縮的數(shù)據(jù)庫系統(tǒng)(DSA) 存放大量數(shù)據(jù): 幾個(gè)GB到幾個(gè)TB PDQ(并行數(shù)據(jù)查詢)技術(shù): 實(shí)現(xiàn)數(shù)據(jù)查詢、索引掃

24、描。 索引建立、數(shù)據(jù)修改、備份 恢復(fù)等數(shù)據(jù)庫操作的并發(fā)處理 支持所有開放系統(tǒng)硬件環(huán)境: 單CPU SMP(對(duì)稱多處理器) Cluster(松耦合群體系統(tǒng)) MPP(大規(guī)模并行系統(tǒng)),批處理 操作數(shù)據(jù),事務(wù)處理 操作數(shù)據(jù),外部數(shù)據(jù),數(shù)據(jù)倉庫 管理軟件,開放系統(tǒng) 平臺(tái),元數(shù)據(jù),目標(biāo)數(shù)據(jù)庫,數(shù)據(jù)存取 工具,INFORMIX-ONLINE 動(dòng)態(tài)服務(wù)器,INFORMIX的 數(shù)據(jù)倉庫戰(zhàn)略,41,Sybase Warehouse Works 體系結(jié)構(gòu) (1) C/S 環(huán)境下的數(shù)據(jù)倉庫框架,聯(lián)機(jī)事務(wù)處理,子系統(tǒng),部門數(shù)據(jù),部門數(shù)據(jù),局部倉庫,局部倉庫,中央倉庫,個(gè)人使用,個(gè)人使用,決策支持,數(shù)據(jù)分布的靈活性要

25、求,(2) Sybase支持?jǐn)?shù)據(jù)分布的方法 Enterprise CONNECT 互操作體系結(jié)構(gòu): 并發(fā)方法、異構(gòu)數(shù)據(jù)分布、信息打包 Replication Server 的基于事件的事件捕捉功能 基于時(shí)間調(diào)度方式的批時(shí)間拷貝方案 (3) 高速的時(shí)間訪問 Navigation Server (導(dǎo)航服務(wù)器) SQL Server中增加interaction Query(IQ) Accelerator 進(jìn)行隨機(jī)高速查詢 Sybase Omni SQL Server 提供時(shí)間訪問透明性 推薦125種無縫存取數(shù)據(jù)的工具,42,ORACLE的數(shù)據(jù)倉庫實(shí)施戰(zhàn)略,決策支持應(yīng)用系統(tǒng)Oracle Applications Data Warehouse 外部數(shù)據(jù)源析取、轉(zhuǎn)換、裝載工具 數(shù)據(jù)倉庫管理工具 數(shù)據(jù)分析工具 數(shù)據(jù)集成工具 數(shù)據(jù)挖掘并將數(shù)據(jù)切換到用戶自定義的視圖中 數(shù)據(jù)挖掘 數(shù)據(jù)切換 多維視圖,43,ORACLE的數(shù)據(jù)倉庫實(shí)施戰(zhàn)略,針對(duì)多維

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論