下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)據(jù)加工處理數(shù)據(jù)加工實(shí)現(xiàn)方法數(shù)據(jù)加工是將源端采集的各個(gè)委辦局?jǐn)?shù)據(jù)加工為可進(jìn)行數(shù)據(jù)開(kāi)放的數(shù)據(jù),對(duì)加工過(guò)程中的錯(cuò)誤數(shù)據(jù)、冗余數(shù)據(jù)進(jìn)行問(wèn)題追溯、對(duì)加工過(guò)程中的數(shù)據(jù)質(zhì)量問(wèn)題進(jìn)行管理,保證數(shù)據(jù)加工的可視化、保證數(shù)據(jù)質(zhì)量的準(zhǔn)確化。數(shù)據(jù)加工處理,是整個(gè)數(shù)據(jù)應(yīng)用的前置環(huán)節(jié),其結(jié)果質(zhì)量直接關(guān)系到模型效果和最終結(jié)論。在實(shí)際操作中,加工處理的方式包括:1、數(shù)據(jù)生產(chǎn)計(jì)劃:數(shù)據(jù)需求和數(shù)據(jù)處理設(shè)計(jì)的子模塊,主要功能為:數(shù)據(jù)的語(yǔ)義化、加工能力的組件化,負(fù)責(zé)銜接業(yè)務(wù)和技術(shù),是信息的樞紐,也是知識(shí)庫(kù)的堅(jiān)實(shí)基礎(chǔ)。2、數(shù)據(jù)生產(chǎn)執(zhí)行:執(zhí)行數(shù)據(jù)處理的子模塊,融合了庫(kù)外ETL、庫(kù)內(nèi)數(shù)據(jù)加工、元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量檢查、調(diào)度管理等孤立系統(tǒng)的必要功能,負(fù)責(zé)數(shù)據(jù)生產(chǎn)計(jì)劃的執(zhí)行、數(shù)據(jù)的生產(chǎn)和數(shù)據(jù)質(zhì)量控制等工作。3、 數(shù)據(jù)生產(chǎn)管理:數(shù)據(jù)處理日常監(jiān)控和綜合管理的子模塊,負(fù)責(zé)數(shù)據(jù)處理和數(shù)據(jù)規(guī)范的管控。數(shù)據(jù)生產(chǎn)管理橫煥數(shù)據(jù)生產(chǎn)池J數(shù)據(jù)生產(chǎn)管理橫煥各類組件,以業(yè)務(wù)驅(qū)曲定制,供數(shù)據(jù)分析師使用+rfe制定規(guī)苑+rfe回『會(huì)折案類分析數(shù)據(jù)分美神經(jīng)網(wǎng)鏘I7M術(shù)人員 弋尸算法噗型數(shù)據(jù)分析炳管控泣程就洲i數(shù)據(jù)加工實(shí)現(xiàn)回『會(huì)折案類分析數(shù)據(jù)分美神經(jīng)網(wǎng)鏘I7M術(shù)人員 弋尸算法噗型數(shù)據(jù)分析炳管控泣程就洲i數(shù)據(jù)加工實(shí)現(xiàn)目目目目管控開(kāi)發(fā)數(shù)據(jù)加工效果評(píng)估數(shù)據(jù)準(zhǔn)確是數(shù)據(jù)共享開(kāi)放的前提,一方面要求業(yè)務(wù)需求和技術(shù)實(shí)現(xiàn)的一致性,另外一方面要求數(shù)據(jù)加工生產(chǎn)過(guò)程正確性,在數(shù)據(jù)治理過(guò)程中通過(guò)事前設(shè)計(jì)、事中管控、事后稽核的方式確保數(shù)據(jù)輸出的質(zhì)量正確。1、 事前設(shè)計(jì)數(shù)據(jù)加工前期,需要對(duì)數(shù)據(jù)加工過(guò)程進(jìn)行詳細(xì)的設(shè)計(jì),對(duì)數(shù)據(jù)加工的方法,數(shù)據(jù)的詳細(xì)字段,數(shù)據(jù)的語(yǔ)義語(yǔ)法、存儲(chǔ)方法、存儲(chǔ)位置、分層規(guī)則、命名規(guī)則、標(biāo)準(zhǔn)規(guī)則、存儲(chǔ)規(guī)則等進(jìn)行詳細(xì)的設(shè)計(jì)、論證、驗(yàn)證。數(shù)據(jù)加工處理時(shí),嚴(yán)格按照前期的設(shè)計(jì)進(jìn)行。2、 事中控制數(shù)據(jù)加工在處理過(guò)程中,可以通過(guò)一定的方法來(lái)保證數(shù)據(jù)加工處理的過(guò)程嚴(yán)格按照預(yù)先設(shè)計(jì)的規(guī)則、方法進(jìn)行,以保證數(shù)據(jù)加工處理的過(guò)程不出現(xiàn)問(wèn)題,從而保證數(shù)據(jù)的最終質(zhì)量。方法包括但不限于:(1) 目標(biāo)表加工邏輯的可視化:將處理邏輯可視化展示在平臺(tái)上,且管理的處理邏輯和生產(chǎn)的處理邏輯一致,則可支撐業(yè)務(wù)需求和技術(shù)實(shí)現(xiàn)一致性復(fù)查。(2) 目標(biāo)表加工鏈路的可視化:將目標(biāo)表的加工鏈路可視化進(jìn)行管理,通過(guò)調(diào)度圖(血緣圖)可了解整個(gè)目標(biāo)表的生成過(guò)程,則可支撐業(yè)務(wù)流程和技術(shù)實(shí)現(xiàn)流程一致性人工復(fù)查。(3) 由平臺(tái)保證開(kāi)發(fā)人員按照指定的要求進(jìn)行開(kāi)發(fā),統(tǒng)一建模標(biāo)準(zhǔn),降低理解門檻。3、 事后評(píng)估數(shù)據(jù)加工處理完成后,需要對(duì)數(shù)據(jù)的質(zhì)量進(jìn)行評(píng)估,通過(guò)一定的測(cè)試方法,來(lái)驗(yàn)證數(shù)據(jù)處理的質(zhì)量。形成整體評(píng)估報(bào)告,以確定數(shù)據(jù)處理的質(zhì)量,如數(shù)據(jù)質(zhì)量達(dá)不到要求,需要重新審視整個(gè)加工處理過(guò)程,包括前期的設(shè)計(jì),找出問(wèn)題所在,優(yōu)化處理方案,進(jìn)行重新加工,直至數(shù)據(jù)質(zhì)量達(dá)到要求。數(shù)據(jù)質(zhì)量評(píng)估包括但不限于以下內(nèi)容:對(duì)模型字段進(jìn)行檢查校驗(yàn),對(duì)各層模型數(shù)據(jù)引用規(guī)范進(jìn)行檢查,對(duì)各層模型元素命名規(guī)則進(jìn)行檢查,對(duì)模型表字段進(jìn)行檢查校驗(yàn),對(duì)數(shù)據(jù)存儲(chǔ)規(guī)范進(jìn)行檢驗(yàn)等。數(shù)據(jù)加工后存儲(chǔ)與交互數(shù)據(jù)加工平臺(tái)的數(shù)據(jù)分為操作數(shù)據(jù)、元數(shù)據(jù)、血緣、調(diào)度數(shù)據(jù),數(shù)據(jù)加工平臺(tái)的數(shù)據(jù)關(guān)系如下:而函標(biāo) 'i I 頑而B(niǎo)百TOC\o"1-5"\h\z數(shù)據(jù)爰源詈理平臺(tái) ] 1誠(chéng)4血^ I I 政據(jù)加工平臺(tái)〈應(yīng)用和85根庫(kù)}散據(jù)加工平臺(tái)[對(duì)外眼勞) ?― 諛睹.帽.at—1 : 割照!卜理蓉R―T—— ; .__大數(shù)據(jù)登源池?fù)Q犧擇 II | 基她座 主題座\o"CurrentDocument" 1 1I |安全平臺(tái) 1數(shù)據(jù)加工平臺(tái)數(shù)據(jù)存儲(chǔ)與交互數(shù)據(jù)加工平臺(tái)和外圍系統(tǒng)的數(shù)據(jù)交互需統(tǒng)一由對(duì)外服務(wù)模塊提供,和基礎(chǔ)平臺(tái)的交互由數(shù)據(jù)加工平臺(tái)應(yīng)用直接交互。由應(yīng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 教學(xué)課件修改教學(xué)課件
- 流感演練課件教學(xué)課件
- 2024光學(xué)儀器研發(fā)與制造合作合同
- 2024年太陽(yáng)能光伏發(fā)電項(xiàng)目開(kāi)發(fā)合作協(xié)議
- 2024專利實(shí)施許可合同實(shí)施范圍與許可條件
- 2024年度影視制作合同(含制作項(xiàng)目、投資額)
- 2024年度物流服務(wù)合同標(biāo)的貨物運(yùn)輸與服務(wù)內(nèi)容
- 2024乙方向甲方提供品牌授權(quán)使用合同
- 2024年度特許經(jīng)營(yíng)合同標(biāo)的為連鎖餐飲品牌
- 2024年度網(wǎng)絡(luò)安全風(fēng)險(xiǎn)評(píng)估與管理服務(wù)合同
- 2024二十屆三中全會(huì)知識(shí)競(jìng)賽題庫(kù)及答案
- 預(yù)防接種工作規(guī)范(2023年版)解讀課件
- 正高級(jí)會(huì)計(jì)師答辯面試資料
- (完整word版)小學(xué)開(kāi)展儀式教育的策略研究.
- 步兵班戰(zhàn)術(shù)教案(全)
- 推薦塞上風(fēng)情笛子簡(jiǎn)譜
- 布魯納《教育過(guò)程》
- 樣品承認(rèn)書(shū)標(biāo)準(zhǔn)版
- 田間生產(chǎn)管理記錄檔案
- 道路橋涵工程施工方案(完整版)
- 智慧城市建設(shè)論文5篇
評(píng)論
0/150
提交評(píng)論