數(shù)據(jù)倉庫原理課件_第1頁
數(shù)據(jù)倉庫原理課件_第2頁
數(shù)據(jù)倉庫原理課件_第3頁
數(shù)據(jù)倉庫原理課件_第4頁
數(shù)據(jù)倉庫原理課件_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 2.1 數(shù)據(jù)倉庫的數(shù)據(jù)模型 產(chǎn)品北京上海 化妝品江蘇 玩具 服裝 電器 1 2 3 4 時間(月)銷售數(shù)量: 10000服裝切片 兩類表:一、維表: 用來記錄維度信息。 二、事實表:用來存儲多維模型中維度交叉點處的度量值和碼值。1.星型模型星型模型 產(chǎn)品ID 時間ID 銷售商ID 地址ID產(chǎn)品ID銷售商ID地址ID時間ID銷售數(shù)量銷售成本總收入銷售商維度表地理位置維表時間維表產(chǎn)品維表 2.雪花模型 3.星座模型 4.雪暴模型 2.2 維表和事實表的數(shù)據(jù)存儲 產(chǎn)品北京上海 化妝品江蘇 玩具 服裝 電器 1 2 3 4 時間(月)銷售數(shù)量: 10000服裝切片什么是OLAP? OLAP是針對某個

2、特定的主題進行聯(lián)機數(shù)據(jù)訪問、處理和分析,通過直觀的方式從多個維度、多種數(shù)據(jù)綜合程度將系統(tǒng)的運營情況展現(xiàn)給使用者。兩個特點,在線性 (On_Line) ,多維分析 (Multi_Analysis) 維、維的層次、維成員、多維數(shù)據(jù)集、數(shù)據(jù)單元、多維維、維的層次、維成員、多維數(shù)據(jù)集、數(shù)據(jù)單元、多維數(shù)據(jù)集的度量值和聚集數(shù)據(jù)集的度量值和聚集1.維維“上卷”“下鉆”銷售地區(qū)西南華中華東四川云南河南湖北江蘇上海簡單層次簡單層次復(fù)雜層次復(fù)雜層次全國江蘇北京上海蘇州市揚州市寶應(yīng)縣類的劃分,只能依據(jù)同一層次的維成員集合來劃分類的劃分,只能依據(jù)同一層次的維成員集合來劃分 維的層次與類組合圖 產(chǎn)品維產(chǎn)品大類產(chǎn)品用途類

3、產(chǎn)品銷地類產(chǎn)品產(chǎn)地類產(chǎn)品小類2.多維數(shù)據(jù)集多維數(shù)據(jù)集 產(chǎn)品北京上海 化妝品江蘇 玩具 服裝 電器 1 2 3 4 時間(月)銷售數(shù)量: 10000服裝切片3.維成員維成員維的取值。維的取值。4.多維數(shù)據(jù)集的度量值多維數(shù)據(jù)集的度量值多維數(shù)據(jù)集的核心值多維數(shù)據(jù)集的核心值 5.數(shù)據(jù)單元數(shù)據(jù)單元即多維數(shù)組的取值。即多維數(shù)組的取值。數(shù)據(jù)單元可以表示為:(維1維成員,維2維成員,維3維成員,維4維成員,觀察變量值) 是指對多維數(shù)據(jù)集中的數(shù)據(jù)用切片、切塊和旋轉(zhuǎn)等等方式分析數(shù)據(jù),使用戶能夠多角度、多側(cè)面地去觀察數(shù)據(jù)倉庫中的數(shù)據(jù)。1.多維的切片多維的切片(維 1,維2,維i成員,維n,觀察變量)是多維數(shù)據(jù)集(維

4、1,維2,維i,維n,觀察變量)在維i上的一個切片 2.多維的切塊多維的切塊在(維1,維2,維i,維k,維n,觀察變量)多維數(shù)據(jù)集上,對維i,維k,選定了維成員,那(維1,維2,維i成員,維k成員,維n,觀察變量)就是多維數(shù)據(jù)集(維1,維2,維i,維k,維n,觀察變量)在維i,維k上的一個切塊 3.旋轉(zhuǎn)旋轉(zhuǎn) 北京市上海市天津市 2002年1季度12313467 2季度5610373 3季度459859 4季度6687962003年1季度13410273 2季度5613969 3季度239762 4季度5582944.數(shù)據(jù)的上探、下鉆數(shù)據(jù)的上探、下鉆數(shù)據(jù)的上探:是指在某一維上將低層次的細節(jié)數(shù)據(jù)數(shù)

5、據(jù)的上探:是指在某一維上將低層次的細節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù)。概括到高層次的匯總數(shù)據(jù)。數(shù)據(jù)的下鉆:是指從某維上匯總數(shù)據(jù)深入到細節(jié)數(shù)數(shù)據(jù)的下鉆:是指從某維上匯總數(shù)據(jù)深入到細節(jié)數(shù)據(jù)進行觀察。據(jù)進行觀察。 Eg:指定“商店=廣州所有商店”,(行為部門,列為時間和銷售量)如表所示,表中無括號數(shù)為增長率,有括號表示下降率。 對于汽車部門出現(xiàn)的奇怪現(xiàn)象,銷售下降了13.2%,而利潤卻增加了21.4%,此時分析是什么原因?項目2004年2005年增長率%銷售量利潤增長%銷售量利潤增長%銷售量利潤增長%服裝23467027.238110221.562.4(20.0)家具6254833.86600531.1

6、5.6(8.0)汽車37509822.432540227.2(13.2)21.4所有其他20238821.330667721.750.71.9 對汽車部門向下鉆取出具體項目(維修、配件、附件)的銷售情況和利潤增長情況。項目2004年2005年增長率%銷售量利潤增長%銷售量利潤增長%銷售量利潤增長%汽車37509822.432540227.2(13.2)21.4維修19505114.218078615.0(7.3)5.6配件11628043.912254547.55.38.2附件637678.22207114.2(63.4)7.3業(yè)務(wù)處理系統(tǒng) 第三層 第二層 第一層 客戶端數(shù)據(jù)抽取 數(shù)據(jù)清理 、

7、轉(zhuǎn)換 數(shù)據(jù)加載 多維化處理 可視化處理 圖4.7數(shù)據(jù)倉庫與OLAP關(guān)系圖數(shù)據(jù)倉庫OLAP服務(wù)器數(shù)據(jù)準(zhǔn)備區(qū) 過程:數(shù)據(jù)的抽?。╡xtraction),轉(zhuǎn)換(transform)和裝載 (load)過程。 1.數(shù)據(jù)的抽取工作: Eg:確認數(shù)據(jù)源檢查和確定數(shù)據(jù)源是否可以提供數(shù)據(jù)倉庫需要的數(shù)據(jù)。 2. 數(shù)據(jù)轉(zhuǎn)換: Eg:選擇、轉(zhuǎn)換、匯總、分離/合并等。 3. 數(shù)據(jù)裝載: 分三種類型:最初裝載、增量裝載和完全刷新。一 概念元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。二 分類和組成根據(jù)元數(shù)據(jù)在DW中所承擔(dān)的任務(wù),將元數(shù)據(jù)分為:靜態(tài)元數(shù)據(jù)-與數(shù)據(jù)結(jié)構(gòu)有關(guān)。動態(tài)元數(shù)據(jù)-與數(shù)據(jù)的狀態(tài)和使用方法有關(guān)。 靜態(tài)元數(shù)據(jù)包括:名稱,描述,格式,數(shù)據(jù)類型,關(guān)系,來源,域,業(yè)務(wù)規(guī)則等 描述:主要是對中的各種數(shù)據(jù)元素進行說明 關(guān)系:用于說明中各種數(shù)據(jù)對象之間的關(guān)系 來源:指數(shù)據(jù)的來源 域:用于說明中數(shù)據(jù)的有效值范圍 業(yè)務(wù)規(guī)則:指中數(shù)據(jù)在業(yè)務(wù)處理中所要遵循的規(guī)則 動態(tài)元數(shù)據(jù)包括:入庫時間,更新周期,統(tǒng)計信息,存儲位置,存儲大小,引用處 統(tǒng)計信息:統(tǒng)計了數(shù)據(jù)訪問的用戶、訪問對象、訪問時間和訪問次數(shù)。這些信息對于性能的提高具有較高的參考價值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論