第三講數(shù)據(jù)抽取、轉(zhuǎn)換和裝載_第1頁
第三講數(shù)據(jù)抽取、轉(zhuǎn)換和裝載_第2頁
第三講數(shù)據(jù)抽取、轉(zhuǎn)換和裝載_第3頁
第三講數(shù)據(jù)抽取、轉(zhuǎn)換和裝載_第4頁
第三講數(shù)據(jù)抽取、轉(zhuǎn)換和裝載_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、事實表的ETL維度表的ETL為所有的數(shù)據(jù)裝載編寫規(guī)程組織數(shù)據(jù)緩存區(qū)域和檢測工具為聚集表制定計劃決定數(shù)據(jù)轉(zhuǎn)換和清洗規(guī)則建立全面的數(shù)據(jù)抽取規(guī)則準(zhǔn)備從源到目標(biāo)數(shù)據(jù)元素的的數(shù)據(jù)映像關(guān)系決定所有的數(shù)據(jù)源,包括內(nèi)部和外部決定數(shù)據(jù)倉庫中需要的所有的目標(biāo)數(shù)據(jù)ETL處理過程的主要步驟處理過程的主要步驟數(shù)據(jù)源確認過程數(shù)據(jù)源確認過程數(shù)據(jù)源數(shù)據(jù)源目標(biāo)目標(biāo)訂單處理訂單處理客戶客戶產(chǎn)品產(chǎn)品運輸合同運輸合同出貨跟蹤出貨跟蹤存貨管理存貨管理產(chǎn)品數(shù)據(jù)客戶運輸渠道數(shù)據(jù)部署數(shù)據(jù)時間數(shù)據(jù)訂單量度1. 列出對事實表進行分析所需要的每一個數(shù)據(jù)項或事實2. 從所有維度中列出每一個維度屬性3. 對于每個目標(biāo)數(shù)據(jù)項,找出源系統(tǒng)和源數(shù)據(jù)項4.

2、如果一個數(shù)據(jù)元素有多個來源,選擇最好的來源5. 確認一個目標(biāo)字段的多個源字段,建立合并規(guī)則6.確認多個目標(biāo)字段的一個源字段,建立分離規(guī)則7.確認默認值8.檢查缺失值的源數(shù)據(jù)源操作型系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)數(shù)據(jù)庫管理系統(tǒng)源數(shù)據(jù)庫源數(shù)據(jù)選擇選擇1:通過交易日志捕獲交易日志文件從源系統(tǒng)中抽取文件輸出觸發(fā)程序文件數(shù)據(jù)緩存區(qū)域數(shù)據(jù)緩存區(qū)域選擇選擇3:在源應(yīng)用程序中捕獲選擇選擇2:在數(shù)據(jù)庫觸發(fā)器中捕獲立即型數(shù)據(jù)抽取:可選方法立即型數(shù)據(jù)抽?。嚎蛇x方法觸發(fā)程序數(shù)據(jù)倉庫中的ETL功能是最重要。最具挑戰(zhàn)性和耗時、費勁的。 源系統(tǒng)繁多、數(shù)據(jù)量大、抽取轉(zhuǎn)換裝載難數(shù)據(jù)抽取技術(shù) 靜態(tài) 修正:立即型、延緩型數(shù)據(jù)轉(zhuǎn)換包括了數(shù)據(jù)轉(zhuǎn)化、清洗、拆分、合并數(shù)據(jù)裝載包括了初始、定期增量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論