數(shù)據(jù)倉(cāng)庫(kù)的多維數(shù)據(jù)模型_第1頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)的多維數(shù)據(jù)模型_第2頁(yè)
數(shù)據(jù)倉(cāng)庫(kù)的多維數(shù)據(jù)模型_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、可能很多人理解的數(shù)據(jù)倉(cāng)庫(kù)就是基于多維數(shù)據(jù)模型構(gòu)建,用于OLAP的數(shù)據(jù)平臺(tái),通過(guò)上一篇文章數(shù)據(jù)倉(cāng)庫(kù)的基本架構(gòu),我們已經(jīng)看到數(shù)據(jù)倉(cāng)庫(kù)的 應(yīng)用可能遠(yuǎn)不止這些。但不得不承認(rèn)多維數(shù)據(jù)模型是數(shù)據(jù)倉(cāng)庫(kù)的一大特點(diǎn), 也是數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用和實(shí)現(xiàn)的一個(gè)重要的方面,通過(guò)在數(shù)據(jù)的組織和存儲(chǔ)上的優(yōu)化,使其更適用于分析型的數(shù)據(jù)查詢(xún)和獲取。多維數(shù)據(jù)模型的定義和作用多維數(shù)據(jù)模型是為了滿(mǎn)足用戶(hù)從多角度多層次進(jìn)行數(shù)據(jù)查詢(xún)和分析的 需要而建立起來(lái)的基于事實(shí)和維的數(shù)據(jù)庫(kù)模型,其基本的應(yīng)用是為了實(shí)現(xiàn) OLAP ( Online Analytical Processing )。當(dāng)然,通過(guò)多維數(shù)據(jù)模型的數(shù)據(jù)展示、查詢(xún)和獲取就是其作用的展現(xiàn),

2、但其真的作用的實(shí)現(xiàn)在于,通過(guò)數(shù)據(jù)倉(cāng)庫(kù)可以根據(jù)不同的數(shù)據(jù)需求建立起各類(lèi)多維模型,并組成數(shù)據(jù)集市開(kāi)放給不同的用戶(hù)群體使用,也就是根據(jù)需求 定制的各類(lèi)數(shù)據(jù)商品擺放在數(shù)據(jù)集市中供不同的數(shù)據(jù)消費(fèi)者進(jìn)行采購(gòu)。多維數(shù)據(jù)模型實(shí)例在看實(shí)例前,這里需要先了解兩個(gè)概念:事實(shí)表和維表。事實(shí)表是用來(lái)記錄具體事件的,包含了每個(gè)事件的具體要素,以及具體發(fā)生的事情;維表 則是對(duì)事實(shí)表中事件的要素的描述信息。比如一個(gè)事件會(huì)包含時(shí)間、地點(diǎn)、 人物、事件,事實(shí)表記錄了整個(gè)事件的信息,但對(duì)時(shí)間、地點(diǎn)和人物等要素 只記錄了一些關(guān)鍵標(biāo)記,比如事件的主角叫“Michael”,那么Michael到底“長(zhǎng)什么樣”,就需要到相應(yīng)的維表里面去查詢(xún)

3、“Michael”的具體描述信息了?;谑聦?shí)表和維表就可以構(gòu)建出多種多維模型,包括星形模型、雪花模型和星 座模型。這里不再展開(kāi)了,解釋概念真的很麻煩,而且基于我的理解的描述 不一定所有人都能明白,還是直接上實(shí)例吧:地域維PK地域ID徂市LI-.-K 地址時(shí)問(wèn)繾PK時(shí)間TD年商品銷(xiāo)售事實(shí)表PKJK1PK,FK2PK,FKMPKJK4PKJK5時(shí)間ID地域ID用戶(hù)ID產(chǎn)品ID麥忖ID購(gòu)實(shí)數(shù)旬實(shí)付金顫川.白一D用廣類(lèi)型I用戶(hù)名用尸信息支付維PK支付ID苴付方式 殳付類(lèi)型5染PK產(chǎn)品TD產(chǎn)晶類(lèi)型 產(chǎn)品名產(chǎn)品屬性這是一個(gè)最簡(jiǎn)單的星形模型的實(shí)例。事實(shí)表里面主要包含兩方面的信息:維和度量,維的具體描述信息記

4、錄在維表,事實(shí)表中的維屬性只是一個(gè)關(guān)聯(lián) 到維表的鍵,并不記錄具體信息;度量一般都會(huì)記錄事件的相應(yīng)數(shù)值,比如 這里的產(chǎn)品的銷(xiāo)售數(shù)量、銷(xiāo)售額等。維表中的信息一般是可以分層的,比如 時(shí)間維的年月日、地域維的省市縣等,這類(lèi)分層的信息就是為了滿(mǎn)足事實(shí)表 中的度量可以在不同的粒度上完成聚合,比如2010年商品的銷(xiāo)售額,來(lái)自上海市的銷(xiāo)售額等。還有一點(diǎn)需要注意的是,維表的信息更新頻率不高或者保持相對(duì)的穩(wěn)定, 例如一個(gè)已經(jīng)建立的十年的時(shí)間維在短期是不需要更新的,地域維也是;但 是事實(shí)表中的數(shù)據(jù)會(huì)不斷地更新或增加,因?yàn)槭录恢痹诓粩嗟匕l(fā)生,用戶(hù) 在不斷地購(gòu)買(mǎi)商品、接受服務(wù)。多維數(shù)據(jù)模型的優(yōu)缺點(diǎn)這里所說(shuō)的多維模型是

5、指基于關(guān)系數(shù)據(jù)庫(kù)的多維數(shù)據(jù)模型,其與傳統(tǒng)的關(guān)系模型相比有著自身的優(yōu)缺點(diǎn)。優(yōu)點(diǎn):多維數(shù)據(jù)模型最大的優(yōu)點(diǎn)就是其基于分析優(yōu)化的數(shù)據(jù)組織和存儲(chǔ)模式。舉個(gè)簡(jiǎn)單的例子,電子商務(wù)網(wǎng)站的操作數(shù)據(jù)庫(kù)中記錄的可能是某個(gè)時(shí)間點(diǎn), 某個(gè)用戶(hù)購(gòu)買(mǎi)了某個(gè)商品,并寄送到某個(gè)具體的地址的這種記錄的集合,于 是我們無(wú)法馬上獲取2010年的7月份到底有多少用戶(hù)購(gòu)買(mǎi)了商品,或者 2010年的7月份有多少的浙江省用戶(hù)購(gòu)買(mǎi)了商品?但是在基于多維模型的 基礎(chǔ)上,此類(lèi)查詢(xún)就變得簡(jiǎn)單了,只要在時(shí)間維上將數(shù)據(jù)聚合到2010年的7月份,同時(shí)在地域維上將數(shù)據(jù)聚合到浙江省的粒度就可以實(shí)現(xiàn),這個(gè)就是 OLAP的概念,之后會(huì)有相關(guān)的文章進(jìn)行介紹。缺點(diǎn):

6、多維模型的缺點(diǎn)就是與關(guān)系模型相比其靈活性不夠,一旦模型構(gòu)建就很難進(jìn)行更改。比如一個(gè)訂單的事實(shí),其中用戶(hù)可能購(gòu)買(mǎi)了多種商品,包括了 時(shí)間、用戶(hù)維和商品數(shù)量、總價(jià)等度量,對(duì)于關(guān)系模型而言如果我們進(jìn)而需 要區(qū)分訂單中包含了哪些商品,我們只需要另外再建一張表記錄訂單號(hào)和商 品的對(duì)應(yīng)關(guān)系即可,但在多維模型里面一旦事實(shí)表構(gòu)建起來(lái)后,我們無(wú)法將 事實(shí)表中的一條訂單記錄再進(jìn)行拆分,于是無(wú)法建立以一個(gè)新的維度一一產(chǎn)品維,只能另外再建個(gè)以產(chǎn)品為主題的事實(shí)表。所以,在建立多維模型之前,我們一般會(huì)根據(jù)需求首先詳細(xì)的設(shè)計(jì)模型, 應(yīng)該包含哪些維和度量,應(yīng)該讓數(shù)據(jù)保持在哪個(gè)粒度上才能滿(mǎn)足用戶(hù)的分析 需求。這里對(duì)數(shù)據(jù)倉(cāng)庫(kù)的多維模型進(jìn)行了簡(jiǎn)單的介紹, 你是不是想到了其實(shí)你 在分析數(shù)據(jù)的時(shí)候很多的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論