




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第第1 1章數(shù)據(jù)倉庫概述章數(shù)據(jù)倉庫概述 1.1 1.1 數(shù)據(jù)倉庫及其數(shù)據(jù)倉庫及其歷史歷史1.2 1.2 數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)1.3 1.3 數(shù)據(jù)倉庫系統(tǒng)開發(fā)工具數(shù)據(jù)倉庫系統(tǒng)開發(fā)工具1.4 1.4 數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫的關(guān)系數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫的關(guān)系2020世紀(jì)世紀(jì)6060年代出現(xiàn)了數(shù)據(jù)庫的概念,確立了數(shù)據(jù)庫系統(tǒng)的年代出現(xiàn)了數(shù)據(jù)庫的概念,確立了數(shù)據(jù)庫系統(tǒng)的許多概念、方法和技術(shù)。許多概念、方法和技術(shù)。7070年代由年代由E.F.CoddE.F.Codd提出了數(shù)據(jù)庫的關(guān)系理模型,開創(chuàng)了數(shù)提出了數(shù)據(jù)庫的關(guān)系理模型,開創(chuàng)了數(shù)據(jù)庫關(guān)系方法和關(guān)系數(shù)據(jù)理論的研究,為關(guān)系數(shù)據(jù)庫技術(shù)據(jù)庫關(guān)系方法和
2、關(guān)系數(shù)據(jù)理論的研究,為關(guān)系數(shù)據(jù)庫技術(shù)奠定了理論基礎(chǔ)。奠定了理論基礎(chǔ)。8080年代出現(xiàn)成熟的關(guān)系數(shù)據(jù)庫管理系統(tǒng)(年代出現(xiàn)成熟的關(guān)系數(shù)據(jù)庫管理系統(tǒng)(DBMSDBMS)。)。 9090年代以后進(jìn)入數(shù)據(jù)處理大發(fā)展時(shí)期,各種數(shù)據(jù)模型、數(shù)年代以后進(jìn)入數(shù)據(jù)處理大發(fā)展時(shí)期,各種數(shù)據(jù)模型、數(shù)據(jù)庫新技術(shù)層出不窮地涌現(xiàn),如數(shù)據(jù)倉庫和數(shù)據(jù)挖掘、商據(jù)庫新技術(shù)層出不窮地涌現(xiàn),如數(shù)據(jù)倉庫和數(shù)據(jù)挖掘、商務(wù)智能、多媒體數(shù)據(jù)庫和務(wù)智能、多媒體數(shù)據(jù)庫和WebWeb數(shù)據(jù)庫等。數(shù)據(jù)庫等。1.1.1 1.1.1 數(shù)據(jù)庫技術(shù)的發(fā)展數(shù)據(jù)庫技術(shù)的發(fā)展1.1.2 1.1.2 什么是數(shù)據(jù)倉庫什么是數(shù)據(jù)倉庫1. 1. 數(shù)據(jù)倉庫的定義數(shù)據(jù)倉庫的定義W
3、.H.InmonW.H.Inmon:數(shù)據(jù)倉庫是:數(shù)據(jù)倉庫是:一個(gè)面向一個(gè)面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)的數(shù)據(jù)的集合,以用于支持管理決策過程。據(jù)的集合,以用于支持管理決策過程。2. 2. 數(shù)據(jù)倉庫的特征數(shù)據(jù)倉庫的特征 面向主題面向主題主題是指用戶使用數(shù)據(jù)倉庫進(jìn)行決策時(shí)所關(guān)心的重點(diǎn)領(lǐng)主題是指用戶使用數(shù)據(jù)倉庫進(jìn)行決策時(shí)所關(guān)心的重點(diǎn)領(lǐng)域,也就是在一個(gè)較高的管理層次上對(duì)信息系統(tǒng)的數(shù)據(jù)按照域,也就是在一個(gè)較高的管理層次上對(duì)信息系統(tǒng)的數(shù)據(jù)按照某一具體的管理對(duì)象進(jìn)行綜合、歸類所形成的分析對(duì)象。某一具體的管理對(duì)象進(jìn)行綜合、歸類所形成的分析對(duì)象。 面向主題組織的數(shù)據(jù)具
4、有以下面向主題組織的數(shù)據(jù)具有以下特點(diǎn)特點(diǎn):各個(gè)主題有完整、一致的內(nèi)容以便在此基礎(chǔ)上作分析處理。各個(gè)主題有完整、一致的內(nèi)容以便在此基礎(chǔ)上作分析處理。主題之間有重迭的內(nèi)容,反映主題間的聯(lián)系。重迭是邏輯主題之間有重迭的內(nèi)容,反映主題間的聯(lián)系。重迭是邏輯上的,不是物理上的。上的,不是物理上的。各主題的綜合方式存在不同。各主題的綜合方式存在不同。主題域應(yīng)該具有獨(dú)立性(數(shù)據(jù)是否屬于該主題有明確的界主題域應(yīng)該具有獨(dú)立性(數(shù)據(jù)是否屬于該主題有明確的界限)和完備性(對(duì)該主題進(jìn)行分析所涉及的內(nèi)容均要在主限)和完備性(對(duì)該主題進(jìn)行分析所涉及的內(nèi)容均要在主題域內(nèi))。題域內(nèi))。 集成集成數(shù)據(jù)倉庫中存儲(chǔ)的數(shù)據(jù)一般從企業(yè)原
5、來已建立的數(shù)據(jù)庫數(shù)據(jù)倉庫中存儲(chǔ)的數(shù)據(jù)一般從企業(yè)原來已建立的數(shù)據(jù)庫系統(tǒng)中提取出來,但并不是原有數(shù)據(jù)的簡(jiǎn)單拷貝,而是經(jīng)過系統(tǒng)中提取出來,但并不是原有數(shù)據(jù)的簡(jiǎn)單拷貝,而是經(jīng)過了抽取、篩選、清理、轉(zhuǎn)換、綜合等工作。了抽取、篩選、清理、轉(zhuǎn)換、綜合等工作。 穩(wěn)定性即非易失的穩(wěn)定性即非易失的 操作型數(shù)據(jù)庫系統(tǒng)中一般只存儲(chǔ)短期數(shù)據(jù),因此其數(shù)據(jù)操作型數(shù)據(jù)庫系統(tǒng)中一般只存儲(chǔ)短期數(shù)據(jù),因此其數(shù)據(jù)是不穩(wěn)定的,它記錄的是系統(tǒng)中數(shù)據(jù)變化的瞬態(tài)。是不穩(wěn)定的,它記錄的是系統(tǒng)中數(shù)據(jù)變化的瞬態(tài)。 數(shù)據(jù)倉庫中的數(shù)據(jù)大多表示過去某一時(shí)刻的數(shù)據(jù),主要數(shù)據(jù)倉庫中的數(shù)據(jù)大多表示過去某一時(shí)刻的數(shù)據(jù),主要用于查詢、分析,不像業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)庫
6、那樣,要經(jīng)常進(jìn)用于查詢、分析,不像業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)庫那樣,要經(jīng)常進(jìn)行修改、添加,除非數(shù)據(jù)倉庫中的數(shù)據(jù)是錯(cuò)誤的。行修改、添加,除非數(shù)據(jù)倉庫中的數(shù)據(jù)是錯(cuò)誤的。 隨時(shí)隨時(shí)間而變化即時(shí)變的間而變化即時(shí)變的 數(shù)據(jù)倉庫大多關(guān)注的是歷史數(shù)據(jù),其中數(shù)據(jù)是批量載入數(shù)據(jù)倉庫大多關(guān)注的是歷史數(shù)據(jù),其中數(shù)據(jù)是批量載入的,即定期從操作型應(yīng)用系統(tǒng)中接收新的數(shù)據(jù)內(nèi)容,這使得的,即定期從操作型應(yīng)用系統(tǒng)中接收新的數(shù)據(jù)內(nèi)容,這使得數(shù)據(jù)倉庫中的數(shù)據(jù)總是擁有時(shí)間維度。數(shù)據(jù)倉庫中的數(shù)據(jù)總是擁有時(shí)間維度。3. 3. 數(shù)據(jù)倉庫的歷史數(shù)據(jù)倉庫的歷史1988年,年,IBM公司第一次提出了信息倉庫(公司第一次提出了信息倉庫(Informatio
7、n Warehouse)的概念,數(shù)據(jù)倉庫初具雛形。)的概念,數(shù)據(jù)倉庫初具雛形。1991年,年,W.H.Inmon出版了出版了Building Data Warehouse一一書。書。W.H.Inmon主張建立數(shù)據(jù)倉庫時(shí)采用自上而下方式,以主張建立數(shù)據(jù)倉庫時(shí)采用自上而下方式,以第第3范式進(jìn)行數(shù)據(jù)倉庫模型設(shè)計(jì)。范式進(jìn)行數(shù)據(jù)倉庫模型設(shè)計(jì)。1993年,年,R.Kimball(金博爾)出版了(金博爾)出版了The DataWarehouse Toolkit一書,認(rèn)同了比爾恩門對(duì)于數(shù)據(jù)倉庫的定義,但對(duì)一書,認(rèn)同了比爾恩門對(duì)于數(shù)據(jù)倉庫的定義,但對(duì)具體的構(gòu)建方法做了更進(jìn)一步的研究。具體的構(gòu)建方法做了更進(jìn)一步的
8、研究。R.Kimball主張自下主張自下而上的方式,力推數(shù)據(jù)集市建設(shè)。而上的方式,力推數(shù)據(jù)集市建設(shè)。1996年,加拿大的年,加拿大的IDC公司調(diào)查了公司調(diào)查了62家實(shí)現(xiàn)數(shù)據(jù)倉庫的歐美家實(shí)現(xiàn)數(shù)據(jù)倉庫的歐美企業(yè),結(jié)果表明:數(shù)據(jù)倉庫為企業(yè)提供了巨大的收益、進(jìn)行企業(yè),結(jié)果表明:數(shù)據(jù)倉庫為企業(yè)提供了巨大的收益、進(jìn)行數(shù)據(jù)倉庫項(xiàng)目開發(fā)的公司在平均數(shù)據(jù)倉庫項(xiàng)目開發(fā)的公司在平均2.72年內(nèi)的投資回報(bào)率為年內(nèi)的投資回報(bào)率為321%。到如今,數(shù)據(jù)倉庫已成為商務(wù)智能由數(shù)據(jù)到知識(shí),由知識(shí)轉(zhuǎn)到如今,數(shù)據(jù)倉庫已成為商務(wù)智能由數(shù)據(jù)到知識(shí),由知識(shí)轉(zhuǎn)化為利潤(rùn)的基礎(chǔ)和核心技術(shù)?;癁槔麧?rùn)的基礎(chǔ)和核心技術(shù)。1.2.1 1.2.1 數(shù)據(jù)
9、倉庫系統(tǒng)的組成數(shù)據(jù)倉庫系統(tǒng)的組成數(shù)據(jù)倉庫系統(tǒng)通常指一個(gè)數(shù)據(jù)庫環(huán)境,而不是指一件產(chǎn)品。數(shù)據(jù)倉庫系統(tǒng)通常指一個(gè)數(shù)據(jù)庫環(huán)境,而不是指一件產(chǎn)品。 是整個(gè)數(shù)據(jù)倉庫環(huán)境的核心,是數(shù)據(jù)存放的地方和提是整個(gè)數(shù)據(jù)倉庫環(huán)境的核心,是數(shù)據(jù)存放的地方和提供對(duì)數(shù)據(jù)檢索的支持。相對(duì)于操作型數(shù)據(jù)庫來說其突出的供對(duì)數(shù)據(jù)檢索的支持。相對(duì)于操作型數(shù)據(jù)庫來說其突出的特點(diǎn)是對(duì)海量數(shù)據(jù)的支持和快速的檢索技術(shù)。特點(diǎn)是對(duì)海量數(shù)據(jù)的支持和快速的檢索技術(shù)。1. 1. 數(shù)據(jù)倉庫數(shù)據(jù)倉庫把數(shù)據(jù)從各種各樣的存儲(chǔ)環(huán)境中提取出來,進(jìn)行必要的把數(shù)據(jù)從各種各樣的存儲(chǔ)環(huán)境中提取出來,進(jìn)行必要的轉(zhuǎn)化、整理,再存放到數(shù)據(jù)倉庫內(nèi)。轉(zhuǎn)化、整理,再存放到數(shù)據(jù)倉庫內(nèi)。其
10、功能包括:刪除對(duì)決策應(yīng)用沒有意義的數(shù)據(jù),轉(zhuǎn)換到其功能包括:刪除對(duì)決策應(yīng)用沒有意義的數(shù)據(jù),轉(zhuǎn)換到統(tǒng)一的數(shù)據(jù)名稱和定義,計(jì)算統(tǒng)計(jì)和衍生數(shù)據(jù),填補(bǔ)缺失數(shù)統(tǒng)一的數(shù)據(jù)名稱和定義,計(jì)算統(tǒng)計(jì)和衍生數(shù)據(jù),填補(bǔ)缺失數(shù)據(jù),統(tǒng)一不同的數(shù)據(jù)定義方式。據(jù),統(tǒng)一不同的數(shù)據(jù)定義方式。2. 2. 抽取工具抽取工具是關(guān)于數(shù)據(jù)的數(shù)據(jù),在數(shù)據(jù)倉庫中元數(shù)據(jù)位于數(shù)據(jù)倉庫是關(guān)于數(shù)據(jù)的數(shù)據(jù),在數(shù)據(jù)倉庫中元數(shù)據(jù)位于數(shù)據(jù)倉庫的上層,是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的的上層,是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)、位置和建立方法結(jié)構(gòu)、位置和建立方法的的數(shù)據(jù)。數(shù)據(jù)。通過元數(shù)據(jù)進(jìn)行數(shù)據(jù)倉庫的管理和通過元數(shù)據(jù)來使用數(shù)通過元數(shù)據(jù)進(jìn)行數(shù)據(jù)倉庫的管理和通過元數(shù)據(jù)來使用數(shù)據(jù)倉庫。據(jù)
11、倉庫。3. 3. 元數(shù)據(jù)元數(shù)據(jù)數(shù)據(jù)集市數(shù)據(jù)集市是在構(gòu)建數(shù)據(jù)倉庫的時(shí)候經(jīng)常用到的一個(gè)詞匯。是在構(gòu)建數(shù)據(jù)倉庫的時(shí)候經(jīng)常用到的一個(gè)詞匯。數(shù)據(jù)集市面向企業(yè)中的某個(gè)部門(或某個(gè)主題)是從數(shù)數(shù)據(jù)集市面向企業(yè)中的某個(gè)部門(或某個(gè)主題)是從數(shù)據(jù)倉庫中劃分出來的,這種劃分可以是邏輯上的,也可以是據(jù)倉庫中劃分出來的,這種劃分可以是邏輯上的,也可以是物理上的。物理上的。數(shù)據(jù)倉庫中存放了企業(yè)的整體信息,而數(shù)據(jù)集市只存放數(shù)據(jù)倉庫中存放了企業(yè)的整體信息,而數(shù)據(jù)集市只存放了某個(gè)主題需要的信息,其目的是減少數(shù)據(jù)處理量,使信息了某個(gè)主題需要的信息,其目的是減少數(shù)據(jù)處理量,使信息的利用更加快捷和靈活。的利用更加快捷和靈活。4.
12、4. 數(shù)據(jù)集市數(shù)據(jù)集市OLAPOLAP服務(wù)服務(wù)指的是對(duì)存儲(chǔ)在數(shù)據(jù)倉庫中的數(shù)據(jù)提供分析的指的是對(duì)存儲(chǔ)在數(shù)據(jù)倉庫中的數(shù)據(jù)提供分析的一種軟件,它能快速提供復(fù)雜數(shù)據(jù)查詢和聚集,并幫助用戶一種軟件,它能快速提供復(fù)雜數(shù)據(jù)查詢和聚集,并幫助用戶分析多維數(shù)據(jù)中的各維情況。分析多維數(shù)據(jù)中的各維情況。5. OLAP5. OLAP服務(wù)服務(wù)為用戶產(chǎn)生的各種數(shù)據(jù)分析和匯總報(bào)表,以及數(shù)據(jù)挖掘?yàn)橛脩舢a(chǎn)生的各種數(shù)據(jù)分析和匯總報(bào)表,以及數(shù)據(jù)挖掘結(jié)果。結(jié)果。6. 6. 數(shù)據(jù)報(bào)表、數(shù)據(jù)分析和數(shù)據(jù)挖掘數(shù)據(jù)報(bào)表、數(shù)據(jù)分析和數(shù)據(jù)挖掘數(shù)據(jù)倉庫應(yīng)用示例數(shù)據(jù)倉庫應(yīng)用示例1.2.2 ETL1.2.2 ETLETLETL分別是分別是Extract
13、Extract、TransformTransform、LoadLoad三個(gè)單詞的首三個(gè)單詞的首字母縮寫,也就是抽取、轉(zhuǎn)換和裝載。字母縮寫,也就是抽取、轉(zhuǎn)換和裝載。 ETLETL通常簡(jiǎn)稱為數(shù)據(jù)抽取,是商務(wù)智能通常簡(jiǎn)稱為數(shù)據(jù)抽取,是商務(wù)智能/ /數(shù)據(jù)倉庫的核數(shù)據(jù)倉庫的核心和靈魂,按照統(tǒng)一的規(guī)則集成并提高數(shù)據(jù)的價(jià)值,是負(fù)心和靈魂,按照統(tǒng)一的規(guī)則集成并提高數(shù)據(jù)的價(jià)值,是負(fù)責(zé)完成數(shù)據(jù)從數(shù)據(jù)源向目標(biāo)數(shù)據(jù)倉庫轉(zhuǎn)化的過程,是實(shí)施責(zé)完成數(shù)據(jù)從數(shù)據(jù)源向目標(biāo)數(shù)據(jù)倉庫轉(zhuǎn)化的過程,是實(shí)施數(shù)據(jù)倉庫的重要步驟。數(shù)據(jù)倉庫的重要步驟。 1.2.3 1.2.3 數(shù)據(jù)倉庫和數(shù)據(jù)集市的關(guān)系數(shù)據(jù)倉庫和數(shù)據(jù)集市的關(guān)系1. 1. 數(shù)據(jù)集市
14、的類型數(shù)據(jù)集市的類型從屬型數(shù)據(jù)集市從屬型數(shù)據(jù)集市 獨(dú)立型數(shù)據(jù)集市獨(dú)立型數(shù)據(jù)集市 2. 2. 數(shù)據(jù)集市與數(shù)據(jù)倉庫的區(qū)別數(shù)據(jù)集市與數(shù)據(jù)倉庫的區(qū)別數(shù)據(jù)集市與數(shù)據(jù)倉庫之間的區(qū)別可以從下三個(gè)方面進(jìn)數(shù)據(jù)集市與數(shù)據(jù)倉庫之間的區(qū)別可以從下三個(gè)方面進(jìn)行理解。行理解。(1 1)數(shù)據(jù)倉庫向各個(gè)數(shù)據(jù)集市提供數(shù)據(jù)。前者是企)數(shù)據(jù)倉庫向各個(gè)數(shù)據(jù)集市提供數(shù)據(jù)。前者是企業(yè)級(jí)的,規(guī)模大,后者是部門級(jí),相對(duì)規(guī)模較小。業(yè)級(jí)的,規(guī)模大,后者是部門級(jí),相對(duì)規(guī)模較小。(2 2)若干個(gè)部門的數(shù)據(jù)集市組成一個(gè)數(shù)據(jù)倉庫。數(shù))若干個(gè)部門的數(shù)據(jù)集市組成一個(gè)數(shù)據(jù)倉庫。數(shù)據(jù)集市開發(fā)周期短、速度快,數(shù)據(jù)倉庫開發(fā)的周期長(zhǎng)、速據(jù)集市開發(fā)周期短、速度快,數(shù)據(jù)
15、倉庫開發(fā)的周期長(zhǎng)、速度慢。度慢。(3 3)從其數(shù)據(jù)特征進(jìn)行分析,數(shù)據(jù)倉庫中的數(shù)據(jù)結(jié))從其數(shù)據(jù)特征進(jìn)行分析,數(shù)據(jù)倉庫中的數(shù)據(jù)結(jié)構(gòu)采用規(guī)范化模式(第三范式),數(shù)據(jù)集市中的數(shù)據(jù)結(jié)構(gòu)構(gòu)采用規(guī)范化模式(第三范式),數(shù)據(jù)集市中的數(shù)據(jù)結(jié)構(gòu)采用星形模式。通常數(shù)據(jù)倉庫中的數(shù)據(jù)粒度比數(shù)據(jù)集市的采用星形模式。通常數(shù)據(jù)倉庫中的數(shù)據(jù)粒度比數(shù)據(jù)集市的粒度要細(xì)。粒度要細(xì)。1.2.4 1.2.4 元數(shù)據(jù)及其管理元數(shù)據(jù)及其管理1. 1. 元數(shù)據(jù)的分類元數(shù)據(jù)的分類按照用途對(duì)元數(shù)據(jù)進(jìn)行分類是最常見的分類方法,可按照用途對(duì)元數(shù)據(jù)進(jìn)行分類是最常見的分類方法,可將其分為兩類:管理元數(shù)據(jù)和用戶元數(shù)據(jù)。將其分為兩類:管理元數(shù)據(jù)和用戶元數(shù)據(jù)。
16、管理元數(shù)據(jù)主要為負(fù)責(zé)開發(fā)、維護(hù)數(shù)據(jù)倉庫的人員所管理元數(shù)據(jù)主要為負(fù)責(zé)開發(fā)、維護(hù)數(shù)據(jù)倉庫的人員所使用。管理元數(shù)據(jù)是存儲(chǔ)關(guān)于數(shù)據(jù)倉庫系統(tǒng)技術(shù)細(xì)節(jié)使用。管理元數(shù)據(jù)是存儲(chǔ)關(guān)于數(shù)據(jù)倉庫系統(tǒng)技術(shù)細(xì)節(jié)的數(shù)據(jù),是用于開發(fā)和管理數(shù)據(jù)倉庫使用的數(shù)據(jù)。的數(shù)據(jù),是用于開發(fā)和管理數(shù)據(jù)倉庫使用的數(shù)據(jù)。用戶元數(shù)據(jù)從業(yè)務(wù)角度描述了數(shù)據(jù)倉庫中的數(shù)據(jù),它用戶元數(shù)據(jù)從業(yè)務(wù)角度描述了數(shù)據(jù)倉庫中的數(shù)據(jù),它提供了介于使用者和實(shí)際系統(tǒng)之間的語義層,使得不提供了介于使用者和實(shí)際系統(tǒng)之間的語義層,使得不懂計(jì)算機(jī)技術(shù)的業(yè)務(wù)人員也能夠懂計(jì)算機(jī)技術(shù)的業(yè)務(wù)人員也能夠“讀懂讀懂”數(shù)據(jù)倉庫中數(shù)據(jù)倉庫中的數(shù)據(jù)。用戶元數(shù)據(jù)是從最終用戶的角度來描述數(shù)據(jù)的數(shù)據(jù)。用
17、戶元數(shù)據(jù)是從最終用戶的角度來描述數(shù)據(jù)倉庫。倉庫。2. 2. 元數(shù)據(jù)的作用元數(shù)據(jù)的作用元數(shù)據(jù)是進(jìn)行數(shù)據(jù)集成所必需的。元數(shù)據(jù)是進(jìn)行數(shù)據(jù)集成所必需的。元數(shù)據(jù)可以幫助最終用戶理解數(shù)據(jù)倉庫中的數(shù)據(jù)。元數(shù)據(jù)可以幫助最終用戶理解數(shù)據(jù)倉庫中的數(shù)據(jù)。元數(shù)據(jù)是保證數(shù)據(jù)質(zhì)量的關(guān)鍵。元數(shù)據(jù)是保證數(shù)據(jù)質(zhì)量的關(guān)鍵。元數(shù)據(jù)可以支持需求變化。元數(shù)據(jù)可以支持需求變化。3. 3. 元數(shù)據(jù)的管理元數(shù)據(jù)的管理元數(shù)據(jù)管理的具體內(nèi)容如下:元數(shù)據(jù)管理的具體內(nèi)容如下: 獲取并存儲(chǔ)元數(shù)據(jù)獲取并存儲(chǔ)元數(shù)據(jù)元數(shù)據(jù)集成元數(shù)據(jù)集成元數(shù)據(jù)標(biāo)準(zhǔn)化元數(shù)據(jù)標(biāo)準(zhǔn)化保持元數(shù)據(jù)的同步保持元數(shù)據(jù)的同步OracleOracle公司公司的數(shù)據(jù)倉庫解決方案包含了業(yè)界領(lǐng)先的
18、數(shù)據(jù)的數(shù)據(jù)倉庫解決方案包含了業(yè)界領(lǐng)先的數(shù)據(jù)庫平臺(tái)、開發(fā)工具和應(yīng)用系統(tǒng),能夠提供一系列的數(shù)據(jù)庫平臺(tái)、開發(fā)工具和應(yīng)用系統(tǒng),能夠提供一系列的數(shù)據(jù)倉庫工具集和服務(wù),具有多用戶數(shù)據(jù)倉庫管理能力,多倉庫工具集和服務(wù),具有多用戶數(shù)據(jù)倉庫管理能力,多種分區(qū)方式,較強(qiáng)的與種分區(qū)方式,較強(qiáng)的與OLAPOLAP工具的交互能力,及快速和工具的交互能力,及快速和便捷的數(shù)據(jù)移動(dòng)機(jī)制等特性。便捷的數(shù)據(jù)移動(dòng)機(jī)制等特性。IBMIBM公司公司提供了一套基于可視數(shù)據(jù)倉庫的商務(wù)智能(提供了一套基于可視數(shù)據(jù)倉庫的商務(wù)智能(BIBI)解決方案,包括解決方案,包括Visual WarehouseVisual Warehouse、Essba
19、se/DB2 OLAP Essbase/DB2 OLAP Server 5.0Server 5.0、IBM DB2 UDBIBM DB2 UDB,以及來自第三方的前端數(shù)據(jù),以及來自第三方的前端數(shù)據(jù)展現(xiàn)工具(如展現(xiàn)工具(如BOBO)和數(shù)據(jù)挖掘工具(如)和數(shù)據(jù)挖掘工具(如SASSAS)。)。MicrosoftMicrosoft公司公司的的SQL ServerSQL Server提供了三大服務(wù)和一個(gè)工具提供了三大服務(wù)和一個(gè)工具來實(shí)現(xiàn)數(shù)據(jù)倉庫系統(tǒng)的整合,為用戶提供了可用于構(gòu)建典來實(shí)現(xiàn)數(shù)據(jù)倉庫系統(tǒng)的整合,為用戶提供了可用于構(gòu)建典型和創(chuàng)新的分析應(yīng)用程序所需的各種特性、工具和功能,型和創(chuàng)新的分析應(yīng)用程序所需
20、的各種特性、工具和功能,可以實(shí)現(xiàn)建模、可以實(shí)現(xiàn)建模、ETLETL、建立查詢分析或圖表、定制、建立查詢分析或圖表、定制KPIKPI(企(企業(yè)關(guān)鍵績(jī)效指標(biāo))、建立報(bào)表和構(gòu)造數(shù)據(jù)挖掘應(yīng)用及發(fā)布業(yè)關(guān)鍵績(jī)效指標(biāo))、建立報(bào)表和構(gòu)造數(shù)據(jù)挖掘應(yīng)用及發(fā)布等功能。等功能。SASSAS公司公司的數(shù)據(jù)倉庫解決方案是一個(gè)由的數(shù)據(jù)倉庫解決方案是一個(gè)由3030多個(gè)專用模塊構(gòu)多個(gè)專用模塊構(gòu)成的架構(gòu)體系,適應(yīng)于對(duì)企業(yè)級(jí)的數(shù)據(jù)進(jìn)行重新整合,支成的架構(gòu)體系,適應(yīng)于對(duì)企業(yè)級(jí)的數(shù)據(jù)進(jìn)行重新整合,支持多維、快速查詢,提供服務(wù)于持多維、快速查詢,提供服務(wù)于OLAPOLAP操作和決策支持的數(shù)操作和決策支持的數(shù)據(jù)采集、管理、處理和展現(xiàn)功能。據(jù)
21、采集、管理、處理和展現(xiàn)功能。NCR TeradataNCR Teradata公司公司提出了可擴(kuò)展數(shù)據(jù)倉庫基本架構(gòu),包括提出了可擴(kuò)展數(shù)據(jù)倉庫基本架構(gòu),包括數(shù)據(jù)裝載、數(shù)據(jù)管理和信息訪問幾個(gè)部分,是高端數(shù)據(jù)倉數(shù)據(jù)裝載、數(shù)據(jù)管理和信息訪問幾個(gè)部分,是高端數(shù)據(jù)倉庫市場(chǎng)最有力競(jìng)爭(zhēng)者,主要運(yùn)行在基于庫市場(chǎng)最有力競(jìng)爭(zhēng)者,主要運(yùn)行在基于UnixUnix操作系統(tǒng)平臺(tái)操作系統(tǒng)平臺(tái)的的NCRNCR硬件設(shè)備上。硬件設(shè)備上。SybaseSybase公司公司提供了稱為提供了稱為Warehouse StudioWarehouse Studio的一整套覆蓋整的一整套覆蓋整個(gè)數(shù)據(jù)倉庫建立周期的產(chǎn)品包,包括數(shù)據(jù)倉庫的建模、數(shù)個(gè)數(shù)據(jù)
22、倉庫建立周期的產(chǎn)品包,包括數(shù)據(jù)倉庫的建模、數(shù)據(jù)集成和轉(zhuǎn)換、數(shù)據(jù)存儲(chǔ)和管理、元數(shù)據(jù)管理和數(shù)據(jù)可視據(jù)集成和轉(zhuǎn)換、數(shù)據(jù)存儲(chǔ)和管理、元數(shù)據(jù)管理和數(shù)據(jù)可視化分析等產(chǎn)品;化分析等產(chǎn)品;BusinesstsBusinessts是集查詢、報(bào)表和是集查詢、報(bào)表和OLAPOLAP技術(shù)為技術(shù)為一身的智能決策支持系統(tǒng),具有較好的查詢和報(bào)表功能,一身的智能決策支持系統(tǒng),具有較好的查詢和報(bào)表功能,提供多維分析技術(shù),支持多種數(shù)據(jù)庫,同時(shí)它還支持基于提供多維分析技術(shù),支持多種數(shù)據(jù)庫,同時(shí)它還支持基于WebWeb瀏覽器的查詢、報(bào)表和分析決策。瀏覽器的查詢、報(bào)表和分析決策。CACA公司公司作為全球最大的數(shù)據(jù)倉庫產(chǎn)品和服務(wù)提供商之
23、一,作為全球最大的數(shù)據(jù)倉庫產(chǎn)品和服務(wù)提供商之一,為企業(yè)用戶提供了完整的數(shù)據(jù)倉庫解決方案。這些一體為企業(yè)用戶提供了完整的數(shù)據(jù)倉庫解決方案。這些一體化的解決方案涵蓋了數(shù)據(jù)倉庫構(gòu)造過程的每一個(gè)環(huán)節(jié),化的解決方案涵蓋了數(shù)據(jù)倉庫構(gòu)造過程的每一個(gè)環(huán)節(jié),不僅有完整的數(shù)據(jù)倉庫所需的產(chǎn)品和技術(shù),而且開放的不僅有完整的數(shù)據(jù)倉庫所需的產(chǎn)品和技術(shù),而且開放的接口可以集成其他的產(chǎn)品和技術(shù)。接口可以集成其他的產(chǎn)品和技術(shù)。BOBO(BusinessObjectsBusinessObjects)是集查詢、報(bào)表和)是集查詢、報(bào)表和OLAPOLAP技術(shù)為一技術(shù)為一身的智能決策支持系統(tǒng)。使用獨(dú)特的身的智能決策支持系統(tǒng)。使用獨(dú)特的“
24、語義層語義層”技術(shù)和技術(shù)和“動(dòng)態(tài)微立方動(dòng)態(tài)微立方”技術(shù)來表示數(shù)據(jù)庫中的多維數(shù)據(jù),具備技術(shù)來表示數(shù)據(jù)庫中的多維數(shù)據(jù),具備較好的查詢和報(bào)表功能,提供鉆取等多維分析技術(shù),支較好的查詢和報(bào)表功能,提供鉆取等多維分析技術(shù),支持多種數(shù)據(jù)庫,同時(shí)他還支持基于持多種數(shù)據(jù)庫,同時(shí)他還支持基于WebWeb瀏覽器的查詢、報(bào)瀏覽器的查詢、報(bào)表和分析決策。雖然表和分析決策。雖然BOBO在不斷增加新的功能,但從嚴(yán)格在不斷增加新的功能,但從嚴(yán)格意義上說,意義上說,BOBO只能算是個(gè)前端工具。只能算是個(gè)前端工具。1.4.1 1.4.1 從數(shù)據(jù)庫到數(shù)據(jù)倉庫從數(shù)據(jù)庫到數(shù)據(jù)倉庫傳統(tǒng)的數(shù)據(jù)庫技術(shù)是以單一的數(shù)據(jù)資源,即數(shù)據(jù)庫為中傳統(tǒng)的
25、數(shù)據(jù)庫技術(shù)是以單一的數(shù)據(jù)資源,即數(shù)據(jù)庫為中心,進(jìn)行聯(lián)機(jī)事務(wù)處理(心,進(jìn)行聯(lián)機(jī)事務(wù)處理(OLTPOLTP)、批處理、決策分析等各種)、批處理、決策分析等各種數(shù)據(jù)處理工作,主要的劃分為兩大類:數(shù)據(jù)處理工作,主要的劃分為兩大類:操作型處理操作型處理和和分析型分析型處理處理(或信息型處理)。(或信息型處理)。 操作型數(shù)據(jù)和分析型數(shù)據(jù)的區(qū)別操作型數(shù)據(jù)和分析型數(shù)據(jù)的區(qū)別 操作型數(shù)據(jù)操作型數(shù)據(jù)分析型數(shù)據(jù)分析型數(shù)據(jù)細(xì)節(jié)的細(xì)節(jié)的綜合的綜合的存取瞬間存取瞬間歷史數(shù)據(jù)歷史數(shù)據(jù)可更新可更新不可更新不可更新事先可知操作需求事先可知操作需求操作需求事先不可知操作需求事先不可知符合軟件開發(fā)生命周期符合軟件開發(fā)生命周期完全不
26、同的生命周期完全不同的生命周期對(duì)性能的要求較高對(duì)性能的要求較高對(duì)性能的要求較為寬松對(duì)性能的要求較為寬松某一時(shí)刻操作一個(gè)單元某一時(shí)刻操作一個(gè)單元某一時(shí)刻操作一個(gè)集合某一時(shí)刻操作一個(gè)集合事務(wù)驅(qū)動(dòng)事務(wù)驅(qū)動(dòng)分析驅(qū)動(dòng)分析驅(qū)動(dòng)面向應(yīng)用面向應(yīng)用面向分析面向分析一個(gè)操作的數(shù)據(jù)量較小一個(gè)操作的數(shù)據(jù)量較小一次操作的數(shù)據(jù)量較大一次操作的數(shù)據(jù)量較大支持日常操作支持日常操作支持管理需求支持管理需求傳統(tǒng)數(shù)據(jù)庫系統(tǒng)側(cè)重于企業(yè)的日常事務(wù)處理工作,但難傳統(tǒng)數(shù)據(jù)庫系統(tǒng)側(cè)重于企業(yè)的日常事務(wù)處理工作,但難于實(shí)現(xiàn)對(duì)數(shù)據(jù)分析處理要求,已經(jīng)無法滿足數(shù)據(jù)處理多樣化于實(shí)現(xiàn)對(duì)數(shù)據(jù)分析處理要求,已經(jīng)無法滿足數(shù)據(jù)處理多樣化的要求。操作型處理和分析型
27、處理的分離成為必然。的要求。操作型處理和分析型處理的分離成為必然。近年來,隨著數(shù)據(jù)庫技術(shù)的應(yīng)用和發(fā)展,人們嘗試對(duì)數(shù)近年來,隨著數(shù)據(jù)庫技術(shù)的應(yīng)用和發(fā)展,人們嘗試對(duì)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行再加工,形成一個(gè)綜合的,面向分析的環(huán)據(jù)庫中的數(shù)據(jù)進(jìn)行再加工,形成一個(gè)綜合的,面向分析的環(huán)境,以更好支持決策分析,從而形成了數(shù)據(jù)倉庫技術(shù)。境,以更好支持決策分析,從而形成了數(shù)據(jù)倉庫技術(shù)。1.4.2 1.4.2 數(shù)據(jù)倉庫為什么是分離的?數(shù)據(jù)倉庫為什么是分離的?數(shù)據(jù)倉庫的查詢通常是復(fù)雜的,涉及大量數(shù)據(jù)在匯總數(shù)據(jù)倉庫的查詢通常是復(fù)雜的,涉及大量數(shù)據(jù)在匯總級(jí)的計(jì)算,可能需要特殊的數(shù)據(jù)組織、存取方法和基于多級(jí)的計(jì)算,可能需要特殊的
28、數(shù)據(jù)組織、存取方法和基于多維視圖的實(shí)現(xiàn)方法。對(duì)數(shù)據(jù)記錄進(jìn)行只讀訪問,以進(jìn)行匯維視圖的實(shí)現(xiàn)方法。對(duì)數(shù)據(jù)記錄進(jìn)行只讀訪問,以進(jìn)行匯總和聚集??偤途奂?。如果如果OLTPOLTP和和OLAPOLAP都在操作型數(shù)據(jù)庫上運(yùn)行,會(huì)大大降都在操作型數(shù)據(jù)庫上運(yùn)行,會(huì)大大降低數(shù)據(jù)庫系統(tǒng)的吞吐量。低數(shù)據(jù)庫系統(tǒng)的吞吐量。數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫分離是由于這兩種系統(tǒng)中數(shù)數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫分離是由于這兩種系統(tǒng)中數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容和用法都不相同。據(jù)的結(jié)構(gòu)、內(nèi)容和用法都不相同。 1.4.3 1.4.3 數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫的對(duì)比數(shù)據(jù)倉庫與操作型數(shù)據(jù)庫的對(duì)比數(shù)據(jù)倉庫數(shù)據(jù)倉庫操作型數(shù)據(jù)庫操作型數(shù)據(jù)庫面向主題面向主題面向應(yīng)用面向
29、應(yīng)用容量巨大容量巨大容量相對(duì)較小容量相對(duì)較小數(shù)據(jù)是綜合的或提煉的數(shù)據(jù)是綜合的或提煉的數(shù)據(jù)是詳細(xì)的數(shù)據(jù)是詳細(xì)的保存歷史的數(shù)據(jù)保存歷史的數(shù)據(jù)保存當(dāng)前的數(shù)據(jù)保存當(dāng)前的數(shù)據(jù)通常數(shù)據(jù)是不可更新的通常數(shù)據(jù)是不可更新的數(shù)據(jù)是可更新的數(shù)據(jù)是可更新的操作需求是臨時(shí)決定的操作需求是臨時(shí)決定的操作需求是事先可知的操作需求是事先可知的一個(gè)操作存取一個(gè)數(shù)據(jù)集合一個(gè)操作存取一個(gè)數(shù)據(jù)集合一個(gè)操作存取一個(gè)記錄一個(gè)操作存取一個(gè)記錄數(shù)據(jù)常冗余數(shù)據(jù)常冗余數(shù)據(jù)非冗余數(shù)據(jù)非冗余操作相對(duì)不頻繁操作相對(duì)不頻繁操作較頻繁操作較頻繁所查詢的是經(jīng)過加工的數(shù)據(jù)所查詢的是經(jīng)過加工的數(shù)據(jù)所查詢的是原始數(shù)據(jù)所查詢的是原始數(shù)據(jù)支持決策分析支持決策分析支持
30、事務(wù)處理支持事務(wù)處理決策分析需要?dú)v史數(shù)據(jù)決策分析需要?dú)v史數(shù)據(jù)事務(wù)處理需要當(dāng)前數(shù)據(jù)事務(wù)處理需要當(dāng)前數(shù)據(jù)需做復(fù)雜的計(jì)算需做復(fù)雜的計(jì)算鮮有復(fù)雜的計(jì)算鮮有復(fù)雜的計(jì)算服務(wù)對(duì)象為企業(yè)高層決策人員服務(wù)對(duì)象為企業(yè)高層決策人員服務(wù)對(duì)象為企業(yè)業(yè)務(wù)處理方面的工作人員服務(wù)對(duì)象為企業(yè)業(yè)務(wù)處理方面的工作人員1.4.4 ODS1.4.4 ODS操作型數(shù)據(jù)庫系統(tǒng)出現(xiàn)了操作型數(shù)據(jù)庫系統(tǒng)出現(xiàn)了ODSODS(Operational Data StoreOperational Data Store,操作數(shù)據(jù)存儲(chǔ))的概念,它是企業(yè)級(jí)的全局?jǐn)?shù)據(jù)庫,用于提供操作數(shù)據(jù)存儲(chǔ))的概念,它是企業(yè)級(jí)的全局?jǐn)?shù)據(jù)庫,用于提供集成的、企業(yè)級(jí)一致的數(shù)據(jù),包含如何從各子系統(tǒng)數(shù)據(jù)庫中向集成的、企業(yè)級(jí)一致的數(shù)據(jù),包含如何從各子系統(tǒng)數(shù)據(jù)庫中向ODSODS抽取數(shù)據(jù)以及從面向主題的角度從各子系統(tǒng)數(shù)據(jù)庫中抽取的抽取數(shù)據(jù)以及從面向主題的角度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030布藝行業(yè)市場(chǎng)深度調(diào)研及發(fā)展趨勢(shì)與發(fā)展趨勢(shì)分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 改初一學(xué)霸的數(shù)學(xué)試卷
- 阜陽2024高三聯(lián)考數(shù)學(xué)試卷
- 高一聯(lián)考數(shù)學(xué)試卷
- 豐南區(qū)期末考試數(shù)學(xué)試卷
- 知識(shí)產(chǎn)權(quán)戰(zhàn)略在健身器材行業(yè)中的法律風(fēng)險(xiǎn)防范措施考核試卷
- 恩施州期末聯(lián)考數(shù)學(xué)試卷
- 贛州市一模理科數(shù)學(xué)試卷
- 印刷企業(yè)品牌形象塑造與傳播策略考核試卷
- 鳳凰教育小升初數(shù)學(xué)試卷
- 口腔解剖生理學(xué)-第八章(動(dòng)脈)
- 梅尼埃綜合征
- 國(guó)家開放大學(xué)??啤斗ɡ韺W(xué)》期末紙質(zhì)考試第四大題名詞解釋題庫2025珍藏版
- 網(wǎng)絡(luò)安全攻防演練護(hù)網(wǎng)工作報(bào)告
- 商貿(mào)公司保障服務(wù)方案
- 形勢(shì)與政策臺(tái)灣政治生態(tài)分析
- 市場(chǎng)營(yíng)銷人員勞動(dòng)合同指南
- 2024年北京市西城區(qū)中考生物真題(含解析)
- 藥物色譜分離技術(shù)-凝膠色譜(制藥技術(shù)課件)
- DZ∕T 0033-2020 固體礦產(chǎn)地質(zhì)勘查報(bào)告編寫規(guī)范(正式版)
- 《抽水蓄能電站豎井式泄洪洞設(shè)計(jì)導(dǎo)則》
評(píng)論
0/150
提交評(píng)論