基于大數(shù)據(jù)體系構(gòu)建數(shù)據(jù)倉庫數(shù)倉1869日課件_第1頁
基于大數(shù)據(jù)體系構(gòu)建數(shù)據(jù)倉庫數(shù)倉1869日課件_第2頁
基于大數(shù)據(jù)體系構(gòu)建數(shù)據(jù)倉庫數(shù)倉1869日課件_第3頁
基于大數(shù)據(jù)體系構(gòu)建數(shù)據(jù)倉庫數(shù)倉1869日課件_第4頁
基于大數(shù)據(jù)體系構(gòu)建數(shù)據(jù)倉庫數(shù)倉1869日課件_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)據(jù)倉庫規(guī)范Ø 設(shè)計規(guī)范Ø 命名規(guī)范Ø 開發(fā)規(guī)范數(shù)據(jù)倉庫規(guī)范Ø 設(shè)計規(guī)范ü數(shù)據(jù)埋點(diǎn)規(guī)范ü數(shù)倉層次設(shè)計ü規(guī)范數(shù)據(jù)倉庫規(guī)范Ø 命名規(guī)范根據(jù)業(yè)務(wù)過程,抽象基本術(shù)語單元對相應(yīng)的術(shù)語單元做語義翻譯,可以采用拼音、英文、含義數(shù)字,但避免英文、拼音混用拼音、英文盡量在不失原意的情況下采用縮寫形式避免數(shù)字開頭數(shù)據(jù)倉庫規(guī)范Ø 命名規(guī)范ü表命名規(guī)范周期/數(shù)據(jù)范圍日快照:d 增量:i周:w 拉鏈表:l區(qū)全量表:a數(shù)據(jù)域訂單:ord 用戶:user 財務(wù):finc數(shù)倉層次共用維度:dim集市:dm ods:o dwd:

2、d edw:e數(shù)據(jù)倉庫規(guī)范Ø 命名規(guī)范ü 表命名規(guī)范能夠合理的區(qū)分出表所描述的數(shù)據(jù)域、數(shù)據(jù)周期等命名:層次_數(shù)據(jù)域_修飾/描述_范圍/周期訂單相關(guān)數(shù)據(jù)表dwd層:d_ord_info_d edw層:e_ord_st_d維度表:用戶維度:dim_user_d商品緩慢漸變維表: dim_product_l數(shù)據(jù)倉庫規(guī)范Ø 命名規(guī)范對于ods層表,最好能夠區(qū)分?jǐn)?shù)據(jù)來源,包括在來自什么系統(tǒng)、源數(shù)據(jù)名稱e.g 從業(yè)務(wù)系統(tǒng)全量訂單(loan_order)數(shù)據(jù)到ods層業(yè)務(wù)系統(tǒng)編碼:buss業(yè)務(wù)系統(tǒng)訂單表:loan_orderods層表命名:o_buss_loan_order_d

3、數(shù)據(jù)倉庫規(guī)范Ø 命名規(guī)范ü字段命名設(shè)計模型的時候,按照業(yè)務(wù)含義、業(yè)務(wù)術(shù)語規(guī)范命名字段漢字名稱 避免數(shù)字開頭 同一業(yè)務(wù)含義統(tǒng)一命名,避免不同表達(dá)方式 統(tǒng)一書寫格式,比如用戶id:user_id,用戶姓名:userName非統(tǒng)一格式 統(tǒng)一大小寫,建議統(tǒng)一小寫 避免與關(guān)鍵字、自定義udf重名數(shù)據(jù)倉庫規(guī)范Ø 命名規(guī)范用戶_ID應(yīng)還_金額實(shí)還_金額逾期_利息下單_計數(shù)月_下單_計數(shù)累積_下單_用戶_計數(shù)user_id ar_amt act_amt oveduce_int crt_ord_cnt m_crt_ord_cnttotal_crt_ord_user_cnt數(shù)據(jù)倉庫規(guī)

4、范Ø 命名規(guī)范ü命名規(guī)范p ETL名稱盡可能和所產(chǎn)出的表同名p、數(shù)據(jù)推送盡可能標(biāo)識數(shù)據(jù)去向p ETL若產(chǎn)生多個表,采用對應(yīng)的數(shù)據(jù)域和語義描述命名p Jar包命名以實(shí)際的業(yè)務(wù)處理邏輯語義描述為主,調(diào)度任務(wù)命名同樣盡量以產(chǎn)出表名命名數(shù)據(jù)倉庫規(guī)范Ø 命名規(guī)范ü命名規(guī)范訂單ETL過程:從表o_buss_loan_order_d整理數(shù)據(jù)并且裝載到dwd層表d_ord_ino_d中ETL命名: d_ord_info_d.shd_ord_info_d.py d_ord_info_d.hql d_ord_info_d.jarETL任務(wù)命名:d_ord_info_d一個E

5、TL產(chǎn)出多個表,比如從商品表中分離出商品維度、廠家維度ETL命名:dim_product_mfrs_d.sh/dim_product_mfrs_d.py dim_product_mfrs_d.hql/dim_product_mfrs_d.jarETL任務(wù)名稱:dim_product_mfrs_d數(shù)據(jù)倉庫規(guī)范Ø 命名規(guī)范ü命名規(guī)范數(shù)據(jù)到ods層的表o_buss_loan_order_dimp_o_buss_loan_order_d.sh/ imp_o_buss_loan_order_d.py數(shù)據(jù)表dm_ord_trsfm_d推送到BI系統(tǒng)exp_dm_ord_trsm_d.sh/exp_dm_ord_trsm_d.py數(shù)據(jù)倉庫規(guī)范Ø 開發(fā)規(guī)范p 數(shù)倉中MR程序盡可能統(tǒng)一輸入?yún)?shù)、輸出參數(shù),單個jar程序的功能模塊清晰,避免多種處理邏輯寫入一個jar包p 每個ETL盡可能產(chǎn)出一張數(shù)倉表,方便任務(wù)排查,同時也減少數(shù)倉表的耦合性p ETL格式、備注清晰,避免大范圍、格

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論