數(shù)據(jù)倉庫維度建模_第1頁
數(shù)據(jù)倉庫維度建模_第2頁
數(shù)據(jù)倉庫維度建模_第3頁
數(shù)據(jù)倉庫維度建模_第4頁
數(shù)據(jù)倉庫維度建模_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫維度建模數(shù)據(jù)倉庫維度建模學(xué)習(xí)目的學(xué)習(xí)目的v在課程結(jié)束后應(yīng)該知道: 數(shù)據(jù)倉庫維度建模分哪幾個(gè)步驟? 每個(gè)步驟都有哪些原則,和哪些誤區(qū)? 掌握維度建模方法 ? 維度表屬性在維度模型中起到什么樣的作用? Kimball極力反對哪些建模方法?一個(gè)比喻一個(gè)比喻v比喻: 如果將數(shù)據(jù)倉庫建設(shè)看作是一個(gè)高樓大廈建造過程的話 數(shù)據(jù)倉庫維度建模就是大廈的框架建設(shè)工作 數(shù)據(jù)倉庫ETL過程,就是為大廈添磚加瓦的過程 優(yōu)秀數(shù)據(jù)訪問工具則是大廈整體裝修的最佳工具v框架的重要性 地基打多深決定大廈能做多高。 鋼筋混凝土結(jié)構(gòu)還是剛結(jié)構(gòu)決定了大廈的穩(wěn)定性 維度建模是數(shù)據(jù)倉庫框架建設(shè)的重要技術(shù)維度建模四步曲維度建模四步曲

2、v四步維度建模步驟: 1.選取要建模的業(yè)務(wù)流程 2.定義業(yè)務(wù)流程中的數(shù)據(jù)粒度 3.選定用于每個(gè)事實(shí)表行的維度 4.確定用于形成每個(gè)事實(shí)表行的數(shù)字型事實(shí)四步曲四步曲1.選取業(yè)務(wù)流程選取業(yè)務(wù)流程v誤區(qū): 不針對業(yè)務(wù)流程而針對業(yè)務(wù)部門進(jìn)行維度建模 將注意力放在業(yè)務(wù)部門身上,而不關(guān)注業(yè)務(wù)流程 為某個(gè)部門建立單獨(dú)的維度模型v原則: 針對業(yè)務(wù)流程進(jìn)行維度建模 確保某個(gè)業(yè)務(wù)流程中的核心數(shù)據(jù)只被抽取一次 保證數(shù)據(jù)倉庫中業(yè)務(wù)數(shù)據(jù)一致性四步曲四步曲2.定義粒度定義粒度(1)v粒度的解釋: 粒度傳遞了同事實(shí)表度量值相聯(lián)系的細(xì)節(jié)所達(dá)到的程度方面的信息。 簡單的說,反映了事實(shí)表的明細(xì)程度v粒度舉例: 超市小票上的購物清

3、單 醫(yī)生的處方藥品清單 倉庫每種產(chǎn)品庫存值的月快照v誤區(qū): 數(shù)據(jù)倉庫團(tuán)隊(duì)經(jīng)常繞過這個(gè)看似不必要的步驟 一個(gè)不合適的粒度定義將會使維度建模感覺無從下手四步曲四步曲2.定義粒度定義粒度(2)v原則: 優(yōu)先考慮具有原子粒度的業(yè)務(wù)信息,這些數(shù)據(jù)不能再做進(jìn)一步的細(xì)分 數(shù)據(jù)倉庫中存儲匯總的、概要性的數(shù)據(jù)主要是基于數(shù)據(jù)庫性能上的考慮 匯總數(shù)據(jù)不能成為最底層細(xì)節(jié)數(shù)據(jù)的替代品四步曲四步曲3.選定維度選定維度v誤區(qū): 沒有定義粒度就開始選定維度v原則: 在粒度確認(rèn)后,選取能從各個(gè)角度,充分描述問題的維度 為每個(gè)維度添加豐富的維度屬性v示例: 常見維度包括日期、產(chǎn)品、顧客、事務(wù)類型和狀態(tài)四步曲四步曲4.確定事實(shí)確定

4、事實(shí)v誤區(qū): 沒有第2步的粒度確認(rèn),就開始確定事實(shí) 將含有不同粒度的事實(shí)放在了同一個(gè)事實(shí)表中v原則: 確定用于形成每個(gè)事實(shí)表行的數(shù)字可加型事實(shí) 在需求調(diào)研時(shí)我們可以通過提出“您需要對哪些指標(biāo)進(jìn)行統(tǒng)計(jì)?”這樣的問題來確定事實(shí)。 具有不同粒度的事實(shí)必須放在不同的事實(shí)表中 事實(shí)一般在各維度上都有良好的可加性四步曲總結(jié)四步曲總結(jié)v維度建模總原則: 數(shù)據(jù)驅(qū)動(dòng)和需求驅(qū)動(dòng)相結(jié)合零售業(yè)案例背景零售業(yè)案例背景v背景: 設(shè)想一下在一家大型雜貨連鎖店,其業(yè)務(wù)覆蓋分布在美國5個(gè)州范圍內(nèi)的100多家雜貨店。 每個(gè)商店都有完整的配套部門,包括各類人員,并有大致60000多個(gè)品種的產(chǎn)品放在貨架上。 各雜貨店的POS系統(tǒng)記錄

5、了每位顧客交易詳?shù)募?xì)信息 定價(jià)與促銷是管理層重要決策之一 如何使各種形式的促銷活動(dòng)所產(chǎn)生的效能清晰可見?實(shí)例實(shí)例1.選取業(yè)務(wù)流程選取業(yè)務(wù)流程v選取業(yè)務(wù)流程: 你能列出該連鎖店急待解決的問題嗎? 是否有系統(tǒng)能提供解決問題所需要的數(shù)據(jù)? 該系統(tǒng)對應(yīng)的業(yè)務(wù)流程你清楚嗎?v注意: 建立的第一個(gè)維度模型應(yīng)該是一個(gè)最有影響的模型,即它應(yīng)該能對最緊迫的業(yè)務(wù)問題做出正面回答,并且要保證有足夠的操作型數(shù)據(jù)源的支持。實(shí)例實(shí)例2.定義粒度定義粒度v定義粒度: 你還記得剛才的粒度定義原則嗎? 在這個(gè)連鎖店我們應(yīng)該使用什么樣的粒度?即事實(shí)表要詳細(xì)到什么程度?實(shí)例實(shí)例3.選定維度選定維度v選定維度: 如何得出基本維度?

6、什么是附加維度? 通過粒度的判斷我們可以得出事實(shí)表的基本維度為:日期、產(chǎn)品、商店與促銷日期維度日期關(guān)鍵字日期關(guān)鍵字(PK)(PK)待定日期屬性待定日期屬性商場維度商場關(guān)鍵字商場關(guān)鍵字(PK)(PK)待定商場屬性待定商場屬性產(chǎn)品維度產(chǎn)品關(guān)鍵字產(chǎn)品關(guān)鍵字(PK)(PK)待定產(chǎn)品屬性待定產(chǎn)品屬性促銷維度促銷關(guān)鍵字促銷關(guān)鍵字(PK)(PK)待定促銷屬性待定促銷屬性POS零售營銷事務(wù)事實(shí)日期關(guān)鍵字日期關(guān)鍵字(FK)(FK)產(chǎn)品關(guān)鍵字產(chǎn)品關(guān)鍵字(FK)(FK)商場關(guān)鍵字商場關(guān)鍵字(FK)(FK)促銷關(guān)鍵字促銷關(guān)鍵字(FK)(FK)POSPOS事務(wù)編號事務(wù)編號待定事實(shí)待定事實(shí)實(shí)例實(shí)例4.確定事實(shí)確定事實(shí)v

7、確定事實(shí): 是否還記得確定事實(shí)的基本原則? 按照基本原則你認(rèn)為事實(shí)表中應(yīng)該包含哪些事實(shí)? 是否應(yīng)該在事實(shí)表中存放計(jì)算列? 實(shí)例中事實(shí)應(yīng)包括銷售量、銷售額與成本價(jià),當(dāng)然也可以包括毛利潤日期維度日期關(guān)鍵字日期關(guān)鍵字(PK)(PK)待定日期屬性待定日期屬性商場維度商場關(guān)鍵字商場關(guān)鍵字(PK)(PK)待定商場屬性待定商場屬性產(chǎn)品維度產(chǎn)品關(guān)鍵字產(chǎn)品關(guān)鍵字(PK)(PK)待定產(chǎn)品屬性待定產(chǎn)品屬性促銷維度促銷關(guān)鍵字促銷關(guān)鍵字(PK)(PK)待定促銷屬性待定促銷屬性POS零售營銷事務(wù)事實(shí)日期關(guān)鍵字日期關(guān)鍵字(FK)(FK)產(chǎn)品關(guān)鍵字產(chǎn)品關(guān)鍵字(FK)(FK)商場關(guān)鍵字商場關(guān)鍵字(FK)(FK)促銷關(guān)鍵字促銷關(guān)

8、鍵字(FK)(FK)POSPOS事務(wù)編號事務(wù)編號銷售量銷售量銷售額銷售額成本額成本額毛利潤金額毛利潤金額維度表屬性維度表屬性v添加維度表屬性 這是維度建模的最后修補(bǔ)工作 增加的維度屬性會為用戶帶來更多的查詢條件 豐富的維度屬性將使查詢變得更加靈活維度表屬性日期維度維度表屬性日期維度v日期維度屬性 是否還可以列出其它屬性日期維度日期關(guān)鍵字日期關(guān)鍵字(PK)(PK)日期日期星期星期日歷周結(jié)束日期日歷周結(jié)束日期日歷月日歷月日歷年月日歷年月日歷季度日歷季度日歷年季度日歷年季度日歷半年度日歷半年度節(jié)假日指示符節(jié)假日指示符。及其它。及其它維度表屬性產(chǎn)品維度維度表屬性產(chǎn)品維度v產(chǎn)品維度屬性 是否還可以列出其它屬性產(chǎn)品維度產(chǎn)品關(guān)鍵字產(chǎn)品關(guān)鍵字(PK)(PK)產(chǎn)品描述產(chǎn)品描述SKUSKU編號編號商標(biāo)描述商標(biāo)描述子類描述子類描述分類描述分類描述部門描述部門描述包裝類型包裝類型包裝尺寸包裝尺寸含脂量含脂量。及其它。及其它維度表屬性商場維度維度表屬性商場維度v商場維度屬性 是否還可以列出其它屬性商場維度商場關(guān)鍵字商場關(guān)鍵字(PK)(PK)商場名稱商場名稱商場編號商場編號商場所在行政區(qū)商場所在行政區(qū)商場所在地區(qū)商場所在地區(qū)首次開業(yè)日首次開業(yè)日最后重修日最后重修日。及其它。及其它維度表屬性促銷維度維度表屬性促銷維度v促銷維度屬性 是否還可以列出其它屬性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論