




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)的轉(zhuǎn)換方法學(xué)習(xí)目標(biāo)2知識(shí)目標(biāo)●數(shù)據(jù)的轉(zhuǎn)換●數(shù)據(jù)轉(zhuǎn)換和加工的方法能力目標(biāo)●了解數(shù)據(jù)的轉(zhuǎn)換●掌握數(shù)據(jù)轉(zhuǎn)換的方法學(xué)習(xí)任務(wù)3初步探索數(shù)據(jù)的轉(zhuǎn)換初步探索數(shù)據(jù)轉(zhuǎn)換的方法初步探索數(shù)據(jù)加工的方法總結(jié)數(shù)據(jù)轉(zhuǎn)換的方法數(shù)據(jù)轉(zhuǎn)換和加工的方法數(shù)據(jù)的轉(zhuǎn)換4目錄5數(shù)據(jù)的轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換是指對(duì)業(yè)務(wù)系統(tǒng)中抽取的數(shù)據(jù)根據(jù)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)模型的要求,進(jìn)行數(shù)據(jù)的轉(zhuǎn)化處理,保證來(lái)自不同系統(tǒng)、不同格式的數(shù)據(jù)具有一致性和完整性,并按要求裝入數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)轉(zhuǎn)換的任務(wù)主要進(jìn)行不一致的數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)粒度的轉(zhuǎn)換,以及一些商務(wù)規(guī)則的計(jì)算。6數(shù)據(jù)的轉(zhuǎn)換不一致的數(shù)據(jù)轉(zhuǎn)換這個(gè)過(guò)程是一個(gè)整合的過(guò)程,將不同業(yè)務(wù)系統(tǒng)的相同類型的數(shù)據(jù)統(tǒng)一,比如同一個(gè)供應(yīng)商在結(jié)算系統(tǒng)的編碼是XX0001,而在CRM中編碼是YY0001,這樣在抽取過(guò)來(lái)之后統(tǒng)一轉(zhuǎn)換成一個(gè)編碼。7數(shù)據(jù)的轉(zhuǎn)換數(shù)據(jù)粒度的轉(zhuǎn)換業(yè)務(wù)系統(tǒng)一般存儲(chǔ)非常明細(xì)的數(shù)據(jù),而數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)是用來(lái)分析的,不需要非常明細(xì)的數(shù)據(jù)。一般情況下,會(huì)將業(yè)務(wù)系統(tǒng)數(shù)據(jù)按照數(shù)據(jù)倉(cāng)庫(kù)粒度進(jìn)行聚合。8數(shù)據(jù)的轉(zhuǎn)換商務(wù)規(guī)則的計(jì)算不同的企業(yè)有不同的業(yè)務(wù)規(guī)則、不同的數(shù)據(jù)指標(biāo),這些指標(biāo)有的時(shí)候不是簡(jiǎn)單的加加減減就能完成,這個(gè)時(shí)候需要在ETL中將這些數(shù)據(jù)指標(biāo)計(jì)算好了之后存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中,以供分析使用。9數(shù)據(jù)轉(zhuǎn)換和加工的方法從數(shù)據(jù)源中抽取的數(shù)據(jù)不一定完全滿足目的庫(kù)的要求,例如數(shù)據(jù)格式的不一致、數(shù)據(jù)輸入錯(cuò)誤、數(shù)據(jù)不完整等等,因此有必要對(duì)抽取出的數(shù)據(jù)進(jìn)行數(shù)據(jù)轉(zhuǎn)換和加工。數(shù)據(jù)的轉(zhuǎn)換和加工可以在ETL引擎中進(jìn)行,也可以在數(shù)據(jù)抽取過(guò)程中利用關(guān)系數(shù)據(jù)庫(kù)的特性同時(shí)進(jìn)行。10數(shù)據(jù)轉(zhuǎn)換和加工的方法ETL引擎中的數(shù)據(jù)轉(zhuǎn)換和加工ETL引擎中一般以組件化的方式實(shí)現(xiàn)數(shù)據(jù)轉(zhuǎn)換。常用的數(shù)據(jù)轉(zhuǎn)換組件有字段映射、數(shù)據(jù)過(guò)濾、數(shù)據(jù)清洗、數(shù)據(jù)替換、數(shù)據(jù)計(jì)算、數(shù)據(jù)驗(yàn)證、數(shù)據(jù)加解密、數(shù)據(jù)合并、數(shù)據(jù)拆分等。這些組件如同一條流水線上的一道道工序,它們是可插拔的,且可以任意組裝,各組件之間通過(guò)數(shù)據(jù)總線共享數(shù)據(jù)。同時(shí)ETL工具還提供了腳本支持,使得用戶可以以一種編程的方式定制數(shù)據(jù)的轉(zhuǎn)換和加工行為。相比在數(shù)據(jù)庫(kù)中加工,性能較高,但不容易進(jìn)行修改和清晰辨認(rèn)。11數(shù)據(jù)轉(zhuǎn)換和加工的方法在數(shù)據(jù)庫(kù)中進(jìn)行數(shù)據(jù)加工關(guān)系數(shù)據(jù)庫(kù)本身已經(jīng)提供了強(qiáng)大的SQL、函數(shù)來(lái)支持?jǐn)?shù)據(jù)的加工,如在SQL查詢語(yǔ)句中添加where條件進(jìn)行過(guò)濾,查詢中重命名字段名與目的表進(jìn)行映射,substr函數(shù),case條件判斷等等。12數(shù)據(jù)轉(zhuǎn)換和加工的方法數(shù)據(jù)的轉(zhuǎn)換方法(1)在數(shù)據(jù)抽取過(guò)程中進(jìn)行數(shù)據(jù)處理。(2)使用異步數(shù)據(jù)裝載,以文件的方式進(jìn)行處理。(3)在數(shù)據(jù)裝載過(guò)程中進(jìn)行數(shù)據(jù)處理。(4)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后再進(jìn)行數(shù)據(jù)處理。13數(shù)據(jù)轉(zhuǎn)換和加工的方法相比在ETL引擎中進(jìn)行數(shù)據(jù)轉(zhuǎn)換和加工,直接在SQL語(yǔ)句中進(jìn)行轉(zhuǎn)換和加工更加簡(jiǎn)單清晰;但依賴S
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 出租大塊土地合同范例
- 崔炳元鋼琴曲《秦俑》中的民族化特征分析及演奏實(shí)踐
- 借款不還抵押合同范例
- 公路煤炭合同范例
- 兒童輪滑培訓(xùn)收費(fèi)合同范例
- 加盟品牌標(biāo)準(zhǔn)合同范例
- 住家月嫂簽約合同范例
- 公司車(chē)輛報(bào)廢合同范例
- 企業(yè)合同范例擬定流程
- 關(guān)于投資合同范例
- 科學(xué)計(jì)算語(yǔ)言Julia及MWORKS實(shí)踐 課件 4-Syslab簡(jiǎn)介
- 新能源汽車(chē)三電系統(tǒng)培訓(xùn)教材
- 2024機(jī)械車(chē)間裝配作業(yè)指導(dǎo)書(shū)
- 城市污水處理廠改造施工方案
- 八項(xiàng)規(guī)定解讀
- 2024年高等教育法學(xué)類自考-00369警察倫理學(xué)考試近5年真題集錦(頻考類試題)帶答案
- 礦山開(kāi)采居間合作協(xié)議書(shū)范文
- 社交媒體對(duì)消費(fèi)者行為的影響調(diào)研報(bào)告
- 人防工程管理制度范本(三篇)
- GB/T 15822.1-2024無(wú)損檢測(cè)磁粉檢測(cè)第1部分:總則
- 計(jì)算機(jī)一級(jí)考試WPS試題及答案
評(píng)論
0/150
提交評(píng)論