大數(shù)據(jù)湖體系規(guī)劃與建設(shè)方案相關(guān)兩份資料_第1頁(yè)
大數(shù)據(jù)湖體系規(guī)劃與建設(shè)方案相關(guān)兩份資料_第2頁(yè)
大數(shù)據(jù)湖體系規(guī)劃與建設(shè)方案相關(guān)兩份資料_第3頁(yè)
大數(shù)據(jù)湖體系規(guī)劃與建設(shè)方案相關(guān)兩份資料_第4頁(yè)
大數(shù)據(jù)湖體系規(guī)劃與建設(shè)方案相關(guān)兩份資料_第5頁(yè)
已閱讀5頁(yè),還剩95頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)

據(jù)

規(guī)

劃與

設(shè)

案目錄12345背

景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念體

系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式共

享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃運(yùn)

營(yíng):大數(shù)據(jù)湖一體化運(yùn)營(yíng)管理建設(shè)數(shù)據(jù)架構(gòu)與承載體系的演變過(guò)程完整性、一致性、交互穩(wěn)定性,并發(fā)性,異??苫謴?fù)性企業(yè)級(jí)跨域整合、業(yè)務(wù)擴(kuò)展性、架構(gòu)設(shè)計(jì)合理性、流程規(guī)范性存儲(chǔ)經(jīng)濟(jì)性、高性能、高擴(kuò)展、高并發(fā)、靈活模型適配性E.F.Codd發(fā)明DBMSBillInmon提出DW概念Google發(fā)布三篇論文1970’s1990’s2000’s123數(shù)據(jù)庫(kù)時(shí)代數(shù)據(jù)倉(cāng)庫(kù)時(shí)代大數(shù)據(jù)平臺(tái)時(shí)代關(guān)系型數(shù)據(jù)庫(kù)解決了信息時(shí)代的數(shù)據(jù)資源存儲(chǔ)和管理,實(shí)現(xiàn)了電子化的文件柜DW研究和解決了從數(shù)據(jù)庫(kù)中獲取信息的問題,通過(guò)OLAP、數(shù)據(jù)挖掘等幫助企業(yè)決策分析,構(gòu)建商業(yè)智能(BI)面對(duì)大數(shù)據(jù)5V特點(diǎn),采用分布式、并行化的存儲(chǔ)和計(jì)算架構(gòu),提升數(shù)據(jù)處理能力ü

對(duì)象:PB級(jí),80%以上非結(jié)構(gòu)化數(shù)據(jù)ü

技術(shù):分布式架構(gòu)、云計(jì)算、虛擬化等ü

CAP原理:CAP

BASEü

采用數(shù)據(jù)模型表示數(shù)據(jù)結(jié)構(gòu),冗余小ü

面向事務(wù)管理,具有ACID特性ü

面向主題的,關(guān)注用戶重點(diǎn)業(yè)務(wù)ü

集成的,跨越歷史、區(qū)域、系統(tǒng)…ü

穩(wěn)定的,具有只讀性質(zhì),以查詢?yōu)橹鳕?/p>

以時(shí)間序列存儲(chǔ),非規(guī)范化管理ü

數(shù)據(jù)統(tǒng)一管理和控制,易維護(hù)和擴(kuò)充ü

程序與數(shù)據(jù)獨(dú)立,具有良好用戶接口ü

目標(biāo):線性擴(kuò)展、彈性計(jì)算、實(shí)時(shí)響應(yīng)、動(dòng)態(tài)調(diào)節(jié)背景:數(shù)據(jù)快速入湖,分析更加智能,應(yīng)用更加多樣,服務(wù)更加開放u

更多企業(yè)數(shù)據(jù)將進(jìn)入數(shù)據(jù)湖,來(lái)自傳統(tǒng)系統(tǒng)的數(shù)據(jù)和傳感器等新型數(shù)據(jù)資源不斷融合,數(shù)據(jù)孤島將繼續(xù)被打破。u

隨著大數(shù)據(jù)分析能力的不斷提高,人工智能的重要性被逐步提升。當(dāng)今最先進(jìn)的機(jī)器學(xué)習(xí)和人工智能系統(tǒng)正在超越傳統(tǒng)的基于規(guī)則的算法,創(chuàng)建出能夠理解、學(xué)習(xí)、預(yù)測(cè)、適應(yīng),甚至可以自主操作的系統(tǒng)。大數(shù)據(jù)發(fā)展趨勢(shì)分析數(shù)據(jù)服務(wù)以更加深度的數(shù)據(jù)開放,跨行業(yè)大數(shù)據(jù)關(guān)聯(lián)。?

以更多樣的應(yīng)用能力,構(gòu)建針對(duì)性行業(yè)解決方案。?數(shù)據(jù)服務(wù)深度數(shù)據(jù)開放,針對(duì)方案制定數(shù)據(jù)應(yīng)用?智能應(yīng)用,基于AI與機(jī)器學(xué)習(xí)分析,個(gè)性化服務(wù)提供。數(shù)據(jù)應(yīng)用?

應(yīng)用快速構(gòu)建,基于數(shù)據(jù)湖進(jìn)行細(xì)粒度的收集、探索和分析應(yīng)用更加智能,構(gòu)建更加快速?

從深度學(xué)習(xí)到機(jī)器學(xué)習(xí),從機(jī)器學(xué)習(xí)到人工智能。數(shù)據(jù)分析數(shù)據(jù)分析?

基于數(shù)據(jù)湖的大量的原始數(shù)據(jù),深度訓(xùn)練,快速分析人工智能分析,直引湖中數(shù)據(jù)數(shù)據(jù)治理入湖即治理,針對(duì)性對(duì)數(shù)據(jù)源系統(tǒng)輸入數(shù)據(jù)制定入湖標(biāo)準(zhǔn)?數(shù)據(jù)治理?

數(shù)據(jù)驅(qū)動(dòng)治理規(guī)范,以數(shù)據(jù)為核心實(shí)時(shí)制定治理規(guī)范。數(shù)據(jù)驅(qū)動(dòng)規(guī)范,入湖標(biāo)準(zhǔn)制定數(shù)據(jù)平臺(tái)?

數(shù)據(jù)平臺(tái)存儲(chǔ)方式向數(shù)據(jù)湖模式轉(zhuǎn)變,多數(shù)據(jù)匯聚。?

支持結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)多數(shù)據(jù)入湖?

。數(shù)據(jù)湖數(shù)據(jù)湖產(chǎn)生背景及概念提出企業(yè)現(xiàn)在正處于大數(shù)據(jù)的“焦慮期”問題?挑戰(zhàn)?

p

存儲(chǔ)成本問題:海量數(shù)據(jù)需要在多環(huán)境、多級(jí)下重復(fù)存儲(chǔ),存儲(chǔ)開銷大p

數(shù)據(jù)形態(tài)問題:應(yīng)用大多聚焦在經(jīng)過(guò)加工后的再生數(shù)據(jù),原始數(shù)據(jù)無(wú)法得到充分利用變革!p

業(yè)務(wù)響應(yīng)問題:必須事先進(jìn)行充分規(guī)劃和較長(zhǎng)周期加工,欠缺運(yùn)營(yíng)所需的靈活性和時(shí)效性數(shù)據(jù)湖一詞是2011年由Pentaho首席技術(shù)官詹姆斯

迪克森最初提出的,參照“數(shù)據(jù)集市”得來(lái)。ü

較小的數(shù)據(jù)存儲(chǔ)庫(kù)ü

如同瓶裝水,經(jīng)過(guò)過(guò)濾包裝結(jié)構(gòu)化后以供使用ü

數(shù)據(jù)來(lái)源于不同地方ü

如同湖泊,存儲(chǔ)更自然狀態(tài)下的大量的水n

預(yù)先設(shè)定問題n

集中存儲(chǔ)+無(wú)限能力n

使用方式單一n

用戶各取所需數(shù)據(jù)集市數(shù)據(jù)湖數(shù)據(jù)湖的定義與特性把你以前在磁帶上擁有的東西倒入到數(shù)據(jù)湖,然后開始探索該數(shù)據(jù)。重要的只把需要的數(shù)據(jù)倒入到Hadoop;如果你想結(jié)合來(lái)自數(shù)據(jù)湖的信息和客戶關(guān)系管理系統(tǒng)(CRM)里面的信息,我們就進(jìn)行連接,只有需要時(shí)才執(zhí)行這番數(shù)詹姆斯·迪克森

據(jù)結(jié)合。數(shù)據(jù)湖是一種在系統(tǒng)或存儲(chǔ)庫(kù)中以自然格式存儲(chǔ)數(shù)據(jù)的方法,它有助于以各種模式和結(jié)構(gòu)形式配置數(shù)據(jù),通常是對(duì)象塊或文件。湖中的數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)從關(guān)系數(shù)據(jù)庫(kù)(行和列),半結(jié)構(gòu)化數(shù)據(jù)(CSV、XML、JSON的日志),非結(jié)構(gòu)化數(shù)據(jù)(電子郵件,文檔,PDF)和二進(jìn)制數(shù)據(jù)(圖像、音頻、視頻)從而形成一個(gè)集中式數(shù)據(jù)存儲(chǔ)容納所有形式的數(shù)據(jù)。維基百科把不同結(jié)構(gòu)的數(shù)據(jù)統(tǒng)一存儲(chǔ),使不同數(shù)據(jù)有一致的存儲(chǔ)方式,在使用時(shí)方便連接,真正解決數(shù)據(jù)集成問題。數(shù)據(jù)湖(DataLake)核心思想n

全部采集(CollectEverything)n

隨處研究(DiveInAnywhere)n

靈活訪問(FlexibleAccess)存儲(chǔ)一切,分析一切,創(chuàng)建所需從對(duì)比中理解數(shù)據(jù)湖概念

優(yōu)勢(shì)篇對(duì)比項(xiàng)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)湖支持?jǐn)?shù)據(jù)類型

有限的數(shù)據(jù)類型支持,以結(jié)構(gòu)化為主支持結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)在數(shù)據(jù)湖世界里,沒有關(guān)于已經(jīng)取得的數(shù)據(jù)假設(shè)。一旦數(shù)據(jù)發(fā)生,即開始在細(xì)粒度級(jí)別收集數(shù)據(jù)。業(yè)務(wù)流程發(fā)現(xiàn)基于數(shù)據(jù)與輸入數(shù)據(jù)過(guò)程開始于業(yè)務(wù)流程識(shí)別,通常由數(shù)據(jù)管理者和業(yè)務(wù)負(fù)責(zé)人基數(shù)據(jù)采集方式于數(shù)據(jù)和業(yè)務(wù)的某種假設(shè)寫入模式,建立模型對(duì)數(shù)據(jù)進(jìn)行某類格式和結(jié)構(gòu)的處理,為了讀取模式,接受原始形式的數(shù)據(jù),在數(shù)據(jù)細(xì)粒度級(jí)別收集、數(shù)據(jù)處理能力

減少數(shù)據(jù)的復(fù)雜性,比較難于實(shí)現(xiàn)上卷(Rollup)和鉆取探索和分析非常簡(jiǎn)單(Drilldown)分析,該設(shè)計(jì)可能需要妥協(xié)一定粒度的數(shù)據(jù)數(shù)據(jù)庫(kù)架構(gòu)演變需要謹(jǐn)慎,過(guò)程耗時(shí),成本較高,影響較大,不存在結(jié)構(gòu)問題,支持復(fù)雜數(shù)據(jù)類型,便于重置數(shù)據(jù)模型、查詢和應(yīng)用,并具有簡(jiǎn)單的重建關(guān)系的能力架構(gòu)重建能力需要對(duì)原有數(shù)據(jù)進(jìn)行重構(gòu)動(dòng)態(tài)性擴(kuò)展性敏捷性差,采用靜態(tài)固定配置,基于業(yè)務(wù)流程驅(qū)動(dòng)而設(shè)計(jì)系統(tǒng)提供預(yù)定義的業(yè)務(wù)需求高度敏捷,動(dòng)態(tài)靈活配置,基于數(shù)據(jù)的業(yè)務(wù)流程定義點(diǎn)燃創(chuàng)新和新的商業(yè)機(jī)會(huì)從對(duì)比中理解數(shù)據(jù)湖概念

劣勢(shì)篇對(duì)比項(xiàng)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)湖數(shù)據(jù)規(guī)劃體系具有周密的數(shù)據(jù)發(fā)現(xiàn)、采集、探索和轉(zhuǎn)換的數(shù)據(jù)計(jì)劃,易于突顯數(shù)據(jù)價(jià)值

不太重視事先的數(shù)據(jù)規(guī)劃,允許存儲(chǔ)任何數(shù)據(jù),難以抓取數(shù)據(jù)價(jià)值數(shù)據(jù)利用率高,按數(shù)據(jù)優(yōu)先級(jí)和數(shù)據(jù)可用性的大小進(jìn)行組織,可以快速定

數(shù)據(jù)利用率低,缺少數(shù)據(jù)優(yōu)先級(jí)排序,需要花費(fèi)大量時(shí)間查找和分?jǐn)?shù)據(jù)利用效率位所需數(shù)據(jù)析前的準(zhǔn)備數(shù)據(jù)需求響應(yīng)能力復(fù)雜性和難度邏輯可解釋性安全性具有較高的需求響應(yīng)能力,可以保證平穩(wěn)高效的數(shù)據(jù)訪問較低,建設(shè)規(guī)模與成本可控?cái)?shù)據(jù)響應(yīng)延遲較高,整個(gè)分析過(guò)程容易中斷很高,建設(shè)難度與規(guī)模呈線性增長(zhǎng)趨勢(shì),隱性成本較高欠缺語(yǔ)義一致性和嚴(yán)格的元數(shù)據(jù),數(shù)據(jù)關(guān)系較為松散,難以解釋比較新的技術(shù),需要持續(xù)完善數(shù)據(jù)組織邏輯性強(qiáng),數(shù)據(jù)關(guān)系可解釋性較高多年發(fā)展歷程,保護(hù)數(shù)據(jù)的能力比較成熟企業(yè)的業(yè)務(wù)行家和專業(yè)人員,技術(shù)門檻低適用對(duì)象面向熟練用戶、科學(xué)領(lǐng)域的數(shù)據(jù)科學(xué)家,技術(shù)門檻高潛在風(fēng)險(xiǎn)數(shù)據(jù)湖是大數(shù)據(jù)概念的延伸數(shù)據(jù)湖的能力視圖數(shù)據(jù)湖并非是個(gè)全新概念1.

“數(shù)據(jù)湖”是關(guān)于企業(yè)應(yīng)用大數(shù)據(jù)的概念,是面向企業(yè)的最佳的大數(shù)據(jù)的解決方案p

多樣化的數(shù)據(jù)存儲(chǔ)數(shù)據(jù)能力要求p

高效的數(shù)據(jù)處理p

存儲(chǔ)全部數(shù)據(jù)p

處理任何數(shù)據(jù)p

訪問任何數(shù)據(jù)2.

“數(shù)據(jù)湖”不僅是數(shù)據(jù)存儲(chǔ)和處理的單元,也是釋放數(shù)據(jù)價(jià)值的過(guò)程3.

企業(yè)大數(shù)據(jù)應(yīng)用成功的關(guān)鍵并不是存儲(chǔ)所有的數(shù)據(jù),而是要?jiǎng)?chuàng)建一個(gè)更有意義的“數(shù)據(jù)湖”,幫助企業(yè)加速提取高價(jià)值數(shù)據(jù)的速度4.

數(shù)據(jù)湖是大數(shù)據(jù)發(fā)展方向上的高級(jí)階段,是一種建設(shè)理念,而不是一種特定的實(shí)施方法IT能n

支持所有用戶力

n

更容易適應(yīng)變化要求5.

“數(shù)據(jù)湖”是個(gè)架構(gòu)概念,是數(shù)據(jù)倉(cāng)庫(kù)的一種演進(jìn),是一種n

更快的洞悉能力大數(shù)據(jù)概念下的延伸數(shù)據(jù)湖概念上的甄別數(shù)據(jù)湖是……數(shù)據(jù)湖不是……1、用戶可以訪問大量原始數(shù)據(jù)的環(huán)境2、一個(gè)開發(fā)和驗(yàn)證分析模型的環(huán)境,然后將其轉(zhuǎn)化為生產(chǎn)1、用于安置企業(yè)所有數(shù)據(jù)的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市2、替代運(yùn)營(yíng)數(shù)據(jù)存儲(chǔ)(ODS)3、高性能的生產(chǎn)環(huán)境3、用于探索數(shù)據(jù)以獲得洞察力的分析沙箱4、企業(yè)級(jí)目錄,可幫助用戶查找數(shù)據(jù)并將業(yè)務(wù)術(shù)語(yǔ)與技術(shù)元數(shù)據(jù)鏈接起來(lái)4、生產(chǎn)型報(bào)表的應(yīng)用程序5、一個(gè)專門建立的系統(tǒng)來(lái)解決一個(gè)特定的問題(盡管專門建立的數(shù)據(jù)集市可以從數(shù)據(jù)湖中提供)5、一個(gè)支持重用數(shù)據(jù)轉(zhuǎn)換和查詢的環(huán)境數(shù)據(jù)湖體系的架構(gòu)規(guī)劃數(shù)據(jù)湖的邏輯架構(gòu)數(shù)據(jù)湖的數(shù)據(jù)架構(gòu)p

持久層(PersitentLayer):存放所有從和外部獲取的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)p

分析沙箱(AnalyticsSandbox):數(shù)據(jù)科學(xué)家和分析師被授予持久層的訪問權(quán)限并使用進(jìn)行數(shù)據(jù)研究和實(shí)驗(yàn)p

探索數(shù)據(jù)源(Curated):數(shù)據(jù)分析師會(huì)將有商業(yè)價(jià)值的數(shù)據(jù)進(jìn)行處理并創(chuàng)建新的數(shù)據(jù)源以提供給業(yè)務(wù)分析師p

可操作層(Operationallayer):業(yè)務(wù)分析師繼續(xù)精煉已處理過(guò)的數(shù)據(jù),和數(shù)據(jù)管理團(tuán)隊(duì)一起將這些數(shù)據(jù)轉(zhuǎn)換為更為容易操作和使用的數(shù)據(jù),存放之以便得到更廣泛的使用Hadoop不一定是數(shù)據(jù)湖的組成部分,只是它是目前最理想的選擇!數(shù)據(jù)湖建設(shè)的四個(gè)階段p

端到端的業(yè)務(wù)支撐能力p

穩(wěn)定的成熟度服務(wù)架構(gòu)p

靈活完善的企業(yè)運(yùn)營(yíng)模式協(xié)作交互階段p

分析能力增強(qiáng)p

優(yōu)化探索環(huán)境0403p

豐富價(jià)值發(fā)現(xiàn)模型基礎(chǔ)架構(gòu)階段p

EDW與DataLake協(xié)作02p

對(duì)外生產(chǎn)價(jià)值輸送能力p

數(shù)據(jù)服務(wù)和運(yùn)營(yíng)管理能力成熟運(yùn)營(yíng)階段01價(jià)值挖掘階段p

整合數(shù)據(jù)湖基礎(chǔ)設(shè)施p

可擴(kuò)展的數(shù)據(jù)處理和攝入大多數(shù)企業(yè)處于前三個(gè)階段的建設(shè)和完善過(guò)程中……p

數(shù)據(jù)目錄管理趨于完善數(shù)據(jù)湖體系的建設(shè)要點(diǎn)與風(fēng)險(xiǎn)分析數(shù)據(jù)湖關(guān)鍵點(diǎn)建設(shè)難點(diǎn)與風(fēng)險(xiǎn)靈活自動(dòng)化的采集與存儲(chǔ)企業(yè)全局?jǐn)?shù)據(jù)的掌握與預(yù)測(cè)組織和編目數(shù)據(jù)管理統(tǒng)一的透明訪問方式數(shù)據(jù)質(zhì)量和可靠性統(tǒng)一元數(shù)據(jù)規(guī)范和管控能力業(yè)務(wù)關(guān)聯(lián)場(chǎng)景的數(shù)據(jù)理解系統(tǒng)化的質(zhì)量管控體系無(wú)感知的分布式架構(gòu)(存儲(chǔ)、計(jì)算、網(wǎng)絡(luò))分布技術(shù)的規(guī)劃和擴(kuò)展能力參考:來(lái)自實(shí)踐中數(shù)據(jù)湖建設(shè)內(nèi)容業(yè)界主流公司的數(shù)據(jù)湖規(guī)劃

HortonworksHortonworks公司基于

Hadoop生態(tài)構(gòu)建的數(shù)據(jù)湖提出的現(xiàn)代化數(shù)據(jù)架構(gòu)(MordenDataArchitecture),從南向北包含四個(gè)層面:數(shù)據(jù)采集層(DataAcquisitionLayer)數(shù)據(jù)采集層負(fù)責(zé)從數(shù)據(jù)源抽取和移動(dòng)數(shù)據(jù),并將數(shù)據(jù)存放到數(shù)據(jù)湖中。采集的數(shù)據(jù)源包括傳統(tǒng)的關(guān)系型或事務(wù)型系統(tǒng)、用戶獲取的數(shù)據(jù)、非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)、外部數(shù)據(jù)或流數(shù)據(jù)等。數(shù)據(jù)監(jiān)管層(DataCurationLayer)數(shù)據(jù)監(jiān)管層負(fù)責(zé)數(shù)據(jù)湖中的數(shù)據(jù)組織、定型并為其他層提供消費(fèi),包含數(shù)據(jù)標(biāo)準(zhǔn)化流程制定,數(shù)據(jù)創(chuàng)建、脫敏、清洗、轉(zhuǎn)換、維護(hù)、管理和展現(xiàn)等工作。數(shù)據(jù)供應(yīng)層(DataProvisioningLayer)數(shù)據(jù)供應(yīng)層采用更適用于業(yè)務(wù)報(bào)表和分析的傳統(tǒng)數(shù)據(jù)儲(chǔ)存方式,使用OLAP、數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市降低數(shù)據(jù)消費(fèi)的復(fù)雜度并提供快速的交互式查詢和分析。數(shù)據(jù)消費(fèi)層(DataConsumptionLayer)數(shù)據(jù)消費(fèi)層提供所有最終用戶的接口,對(duì)于不同用戶對(duì)數(shù)據(jù)的需求,大量和多元化的工具和技術(shù)會(huì)被用于該層。業(yè)界主流公司對(duì)于數(shù)據(jù)湖的規(guī)劃

IBMIBM公司提出的數(shù)據(jù)湖架構(gòu),包括六大關(guān)鍵部件:一.?dāng)?shù)據(jù)湖資源庫(kù)按照數(shù)據(jù)特點(diǎn)進(jìn)行原始格式的分類存儲(chǔ)庫(kù)二.企業(yè)IT交互統(tǒng)一提供企業(yè)生產(chǎn)側(cè)系統(tǒng)與數(shù)據(jù)湖資源庫(kù)的靈活交互,快速配置能力三.原始數(shù)據(jù)交互為數(shù)據(jù)價(jià)值發(fā)現(xiàn)提供安全的資源分析訪問接口與試驗(yàn)環(huán)境四.目錄接口唯一權(quán)威的數(shù)據(jù)湖元數(shù)據(jù)發(fā)布和訪問模式五.基于可視化的交互統(tǒng)一可視化的業(yè)務(wù)應(yīng)用交互接口和沙箱環(huán)境六.信息集成與治理集成的數(shù)據(jù)湖運(yùn)營(yíng)管理工具與環(huán)境目錄12345背

景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念體

系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式共

享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃運(yùn)

營(yíng):大數(shù)據(jù)湖一體化運(yùn)營(yíng)管理建設(shè)大數(shù)據(jù)湖體系規(guī)劃生產(chǎn)型系統(tǒng)交互分析OLAP挖掘工具平臺(tái)工具應(yīng)用生態(tài)圈系統(tǒng)應(yīng)用構(gòu)建工具省分專區(qū)生態(tài)圈專區(qū)服務(wù)對(duì)象應(yīng)用專區(qū)外部系統(tǒng)互聯(lián)網(wǎng)合作伙伴分析型系統(tǒng)運(yùn)營(yíng)管控API數(shù)據(jù)沙箱訪問接口(JDBC、ODBC)跨架構(gòu)數(shù)據(jù)聯(lián)邦訪問共享統(tǒng)一數(shù)據(jù)服務(wù)代理(DataBroker)訪問接入規(guī)范統(tǒng)一數(shù)據(jù)接入邏輯化視圖數(shù)據(jù)同源異構(gòu)訪問安數(shù)據(jù)湖統(tǒng)一目錄<統(tǒng)一服務(wù)數(shù)據(jù)集>緩存加速數(shù)據(jù)共享標(biāo)準(zhǔn)全規(guī)范存儲(chǔ)計(jì)算加速計(jì)算側(cè)cache實(shí)時(shí)檢索和流處理引擎統(tǒng)一索引層交互式查詢引擎計(jì)算調(diào)度規(guī)范資源申請(qǐng)規(guī)范計(jì)算處理協(xié)同計(jì)算引擎離線批處理引擎TB級(jí)計(jì)算計(jì)算資源調(diào)度自動(dòng)調(diào)度

按需使用資源池化

彈性伸縮角色權(quán)限數(shù)據(jù)分類規(guī)范數(shù)據(jù)模型規(guī)范生產(chǎn)數(shù)據(jù)(1+N)

操作/臨時(shí)存儲(chǔ)原生數(shù)據(jù)(1+N)

就近/分域存儲(chǔ)MySql主數(shù)據(jù)(1)整合數(shù)據(jù)(1)

全網(wǎng)/分層支撐應(yīng)用數(shù)據(jù)(N)

分區(qū)建設(shè)規(guī)全網(wǎng)統(tǒng)一數(shù)據(jù)存儲(chǔ)范TXTOracleHDFSHbaseGreenplum…元字典規(guī)范PB級(jí)存儲(chǔ)存儲(chǔ)規(guī)范結(jié)構(gòu)化數(shù)據(jù)(數(shù)據(jù)庫(kù)/格式文件等)半結(jié)構(gòu)化數(shù)據(jù)(XML/TXT等)非結(jié)構(gòu)化數(shù)據(jù)(語(yǔ)音、視頻等)采集接入規(guī)范生產(chǎn)直采前置采集同步鏡像統(tǒng)一接入配置網(wǎng)絡(luò)爬蟲IOT接入生產(chǎn)系統(tǒng)駐留數(shù)據(jù)接入運(yùn)營(yíng)管源數(shù)據(jù)提供規(guī)范生產(chǎn)模型規(guī)范可視化定義

即配即用透明化部署

實(shí)時(shí)接入調(diào)度理大吞吐管道規(guī)范源端系統(tǒng)BSSOSSMSS網(wǎng)絡(luò)/平臺(tái)生態(tài)圈外部系統(tǒng)互聯(lián)網(wǎng)大數(shù)據(jù)湖存儲(chǔ)能力規(guī)劃——統(tǒng)一標(biāo)準(zhǔn)/分區(qū)存儲(chǔ)制定全集團(tuán)統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),采取分域分類的數(shù)據(jù)入湖策略,構(gòu)建生產(chǎn)、原生、整合/應(yīng)用、專區(qū)等分區(qū)數(shù)據(jù)存儲(chǔ)及計(jì)算能力,實(shí)現(xiàn)數(shù)據(jù)原生入湖、按需使用的宗旨,為全國(guó)1+31省提供應(yīng)用數(shù)據(jù)服務(wù)能力,注智生產(chǎn)激發(fā)生產(chǎn)力。數(shù)據(jù)訪問存儲(chǔ)分區(qū)原則:數(shù)據(jù)計(jì)算p

生產(chǎn)數(shù)據(jù)區(qū):遵循電信集團(tuán)數(shù)據(jù)建模標(biāo)準(zhǔn)及主數(shù)據(jù)規(guī)范要求;規(guī)范層面屬于大數(shù)據(jù)湖范疇,物理資源層面可采用湖資源也可自建;p

原生數(shù)據(jù)區(qū):分域分類存儲(chǔ)生產(chǎn)數(shù)據(jù);將非標(biāo)準(zhǔn)數(shù)據(jù)做標(biāo)準(zhǔn)化轉(zhuǎn)化;離線批量?jī)?nèi)存計(jì)算及緩存機(jī)器學(xué)習(xí)交互式查詢協(xié)同計(jì)算非結(jié)構(gòu)化計(jì)算實(shí)時(shí)流式資源池化,彈性技術(shù)計(jì)算資源管理自動(dòng)調(diào)度,按需使用主數(shù)據(jù)區(qū)省份專區(qū)生態(tài)圈

互聯(lián)網(wǎng)專區(qū)智能連接智慧家庭物聯(lián)網(wǎng)新興ICT內(nèi)蒙貴州

河北遼寧

寧夏…金融人員組織資源運(yùn)營(yíng)管理整合數(shù)據(jù)區(qū):采用大數(shù)據(jù)挖掘等技術(shù)進(jìn)行實(shí)體歸集補(bǔ)全;構(gòu)建實(shí)體關(guān)聯(lián)視圖;pBSS原

OSS原

MSS原網(wǎng)絡(luò)/平實(shí)體關(guān)聯(lián)視圖省份B/O側(cè)生產(chǎn)系統(tǒng)數(shù)據(jù)存儲(chǔ)集團(tuán)橫向系統(tǒng)生數(shù)據(jù)

生數(shù)據(jù)

生數(shù)據(jù)

臺(tái)數(shù)據(jù)客戶產(chǎn)品渠道營(yíng)銷資源服務(wù)自然人集團(tuán)橫

生態(tài)圈

生態(tài)圈產(chǎn)品客戶……向數(shù)據(jù)

-ICT-金融主數(shù)據(jù)區(qū):存儲(chǔ)企業(yè)級(jí)全網(wǎng)主數(shù)據(jù),大數(shù)據(jù)主數(shù)據(jù)唯一提供者;應(yīng)用專區(qū):本著數(shù)據(jù)不出湖,充分挖掘數(shù)據(jù)價(jià)值原則,為使用者提供基于自有、原生、整合數(shù)據(jù)的處理空間,面向應(yīng)用開展數(shù)據(jù)處理工作;網(wǎng)絡(luò)/平臺(tái)生產(chǎn)系統(tǒng)(前置預(yù)處理)p生態(tài)圈生產(chǎn)系統(tǒng)實(shí)體對(duì)齊編碼統(tǒng)一轉(zhuǎn)換生產(chǎn)數(shù)據(jù)區(qū)原生數(shù)據(jù)區(qū)整合數(shù)據(jù)區(qū)p存儲(chǔ)資源管理數(shù)據(jù)接入大數(shù)據(jù)湖原生數(shù)據(jù)區(qū)規(guī)劃——原生入湖/分類存儲(chǔ)/按需使用以原生入湖分類存儲(chǔ)按需使用為宗旨,分域分類存儲(chǔ)按周期存儲(chǔ)原生數(shù)據(jù),為云公司、集團(tuán)ODS、省份大數(shù)據(jù)平臺(tái)提供原生數(shù)據(jù)共享服務(wù),為湖內(nèi)整合數(shù)據(jù)區(qū)、應(yīng)用數(shù)據(jù)區(qū)提供原生數(shù)據(jù)服務(wù)。共享服務(wù)數(shù)據(jù)數(shù)據(jù)專區(qū)生產(chǎn)系統(tǒng)移動(dòng)/固網(wǎng)DPIHANA數(shù)OIDDMR/CDRCM/CP

計(jì)費(fèi)詳單ODMS翼支付集約積分…據(jù)省份專區(qū)BSS系統(tǒng)數(shù)據(jù)共享OSS系統(tǒng)MSS系統(tǒng)EDA系統(tǒng)生態(tài)圈專區(qū)…原生數(shù)據(jù)區(qū)CRM計(jì)費(fèi)客戶服務(wù)…采購(gòu)輔助ERP財(cái)務(wù)輔助工程輔助久其省+集團(tuán)電渠服務(wù)量BSSMSS數(shù)據(jù)OSS數(shù)據(jù)EDA數(shù)據(jù)綜合資源裝維EDA直采原生數(shù)據(jù)專區(qū)共享數(shù)據(jù)

PPMVSOP人力原生入湖主數(shù)據(jù)區(qū)日志留存DPI移動(dòng)感知實(shí)體關(guān)聯(lián)視圖共享悅ME行業(yè)短

ODMS集團(tuán)固網(wǎng)DPIOIDD集團(tuán)橫向系統(tǒng)電渠商機(jī)

微信易信量號(hào)百4G數(shù)據(jù)終端…DPI網(wǎng)絡(luò)/平橫向數(shù)據(jù)政企KPIMR/CDR臺(tái)數(shù)據(jù)4G分組域話單集約積分渠道PM/CM

智能網(wǎng)管信化數(shù)據(jù)整合區(qū)生態(tài)圈系統(tǒng)原生數(shù)據(jù)整合共享互聯(lián)網(wǎng)金融智能連接智慧家庭物聯(lián)網(wǎng)新興ICT應(yīng)用翼支付IWIFINFC產(chǎn)品云堤海洋衛(wèi)星寬帶天翼云盤

189郵箱翼機(jī)通+

旺鋪助手

號(hào)簿助手實(shí)體關(guān)聯(lián)視圖…智能

視頻

聚組網(wǎng)

通話

精彩車管天翼網(wǎng)關(guān)樂駕生態(tài)圈數(shù)據(jù)流量控專家企業(yè)云翼校通

天翼對(duì)講

外勤助手

手機(jī)看店安全辦公

加密通道

21CN

語(yǔ)音云甜橙欺詐盾愛音樂統(tǒng)一賬號(hào)

4G-QoS新視通4G預(yù)處理入湖枝繁葉茂類網(wǎng)絡(luò)/平臺(tái)系統(tǒng)地產(chǎn)大數(shù)

旅游大數(shù)據(jù)家庭云專屬云影像云天翼視訊天翼閱讀愛游戲愛動(dòng)漫天翼空間易信據(jù)實(shí)體對(duì)齊編碼標(biāo)準(zhǔn)化大數(shù)據(jù)湖整合數(shù)據(jù)區(qū)規(guī)劃——構(gòu)建企業(yè)級(jí)核心實(shí)體關(guān)聯(lián)視圖整合數(shù)據(jù)區(qū)完成數(shù)據(jù)清洗、編碼轉(zhuǎn)換、實(shí)體對(duì)齊及構(gòu)建企業(yè)級(jí)核心實(shí)體關(guān)聯(lián)視圖,為應(yīng)用專區(qū)提供整合數(shù)據(jù)服務(wù)。整合數(shù)據(jù)區(qū)保持?jǐn)?shù)據(jù)原子性粒度,不對(duì)數(shù)據(jù)做聚合處理,不影響業(yè)務(wù)專區(qū)業(yè)務(wù)指標(biāo)加工處理。實(shí)體關(guān)聯(lián)視圖p

保存原子性:整合數(shù)據(jù)區(qū)數(shù)據(jù)不做聚合操作,保持?jǐn)?shù)據(jù)原子性,不影響專區(qū)應(yīng)用指標(biāo)加工處理;p

實(shí)體補(bǔ)齊性:對(duì)核心實(shí)體根據(jù)不同原生數(shù)據(jù)進(jìn)行屬性補(bǔ)齊;llCP/SP訂購(gòu)位置信息p

實(shí)體關(guān)聯(lián)性:面向?qū)嶓w全業(yè)務(wù)流程數(shù)據(jù),整合各域數(shù)據(jù)實(shí)現(xiàn)實(shí)體跨域關(guān)聯(lián)視圖;p

共享一致性:按照湖應(yīng)用的使用需求進(jìn)行共性提煉,實(shí)現(xiàn)統(tǒng)一的公共寬表建設(shè);核心實(shí)體自然人…實(shí)體對(duì)齊數(shù)據(jù)清洗自然人聚合管理政企客戶沖突管理外部數(shù)據(jù)管理規(guī)則管理組織實(shí)體沉淀合作伙伴員工地域大數(shù)據(jù)湖應(yīng)用數(shù)據(jù)專區(qū)規(guī)劃——面向應(yīng)用的自建自維數(shù)據(jù)專區(qū)大數(shù)據(jù)湖為業(yè)務(wù)應(yīng)用場(chǎng)景提供具有數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)計(jì)算、數(shù)據(jù)服務(wù)及數(shù)據(jù)應(yīng)用訪問能力的應(yīng)用專區(qū),用戶可自行獲取數(shù)據(jù),面向特定應(yīng)用場(chǎng)景完成數(shù)據(jù)加工處理;大數(shù)據(jù)湖提供專區(qū)申請(qǐng)及監(jiān)控管理,以保證專區(qū)健康、有價(jià)運(yùn)營(yíng)。生態(tài)圈專區(qū)應(yīng)用其它專區(qū)應(yīng)用省份專區(qū)應(yīng)用p

獨(dú)立性:保證資源獨(dú)立性、數(shù)據(jù)獨(dú)立性、應(yīng)用獨(dú)立性;p

可用性:保證存儲(chǔ)、計(jì)算、數(shù)據(jù)資源高可用性及穩(wěn)定性;確保專區(qū)資源可在線、平滑擴(kuò)展;應(yīng)用數(shù)據(jù)專區(qū)運(yùn)營(yíng)監(jiān)控應(yīng)用成果評(píng)估資源利用率數(shù)據(jù)處理規(guī)范性使用頻度安全性監(jiān)控專區(qū)回收整合數(shù)據(jù)區(qū)原生數(shù)據(jù)區(qū)主數(shù)據(jù)區(qū)專區(qū)管理專區(qū)劃分專區(qū)申請(qǐng)自有數(shù)據(jù)專區(qū)審批專區(qū)變更p

易用性:提供豐富的可視化開發(fā)及專區(qū)運(yùn)營(yíng)工具;p

可管理性:大數(shù)據(jù)湖對(duì)專區(qū)具備監(jiān)控、審計(jì)能力;p

數(shù)據(jù)服務(wù)性:專區(qū)數(shù)據(jù)可以數(shù)據(jù)形式服務(wù),也可開發(fā)應(yīng)用直接鏈接調(diào)用;省份專區(qū)-內(nèi)蒙應(yīng)用數(shù)據(jù)生態(tài)圈專區(qū)-…省份專區(qū)-…整合區(qū)數(shù)據(jù)原生數(shù)據(jù)實(shí)時(shí)采集

批量采集

消息采集數(shù)據(jù)接入源端生產(chǎn)系統(tǒng)/數(shù)據(jù)倉(cāng)庫(kù)共享訪問大數(shù)據(jù)湖主數(shù)據(jù)區(qū)規(guī)劃

——

企業(yè)級(jí)核心/統(tǒng)一運(yùn)營(yíng)保障主數(shù)據(jù)區(qū)負(fù)責(zé)存儲(chǔ)全域主數(shù)據(jù),并確保與主數(shù)據(jù)生產(chǎn)者保持同步,為大數(shù)據(jù)湖各區(qū)提供唯一主數(shù)據(jù)源,以保證湖中企業(yè)級(jí)核心實(shí)體數(shù)據(jù)的一致性和完整性,提升大數(shù)據(jù)湖運(yùn)營(yíng)效率及效果。數(shù)據(jù)專區(qū)p

統(tǒng)一主數(shù)據(jù)標(biāo)準(zhǔn):面向全國(guó)各域各生產(chǎn)系統(tǒng)提供主數(shù)據(jù)標(biāo)準(zhǔn);省份

內(nèi)專區(qū)

蒙貴州河北遼寧寧夏生態(tài)圈專區(qū)智能連接智慧家庭物聯(lián)網(wǎng)新興ICT金融…主數(shù)據(jù)整合數(shù)據(jù)p

統(tǒng)一主數(shù)據(jù)存儲(chǔ):面向大數(shù)據(jù)湖提供統(tǒng)一主數(shù)據(jù)存儲(chǔ)能力;主數(shù)據(jù)區(qū)原生數(shù)據(jù)服務(wù)專區(qū)主數(shù)據(jù)客戶產(chǎn)品渠道訂單組織…主數(shù)據(jù)整合數(shù)據(jù)區(qū)主數(shù)據(jù)管理p

統(tǒng)一主數(shù)據(jù)整合:清洗整合各域主數(shù)據(jù),形成統(tǒng)一、標(biāo)準(zhǔn)、唯一主數(shù)據(jù);p

統(tǒng)一主數(shù)據(jù)服務(wù):為大數(shù)據(jù)湖中各區(qū)提供主數(shù)據(jù)服務(wù);主數(shù)據(jù)整合主數(shù)據(jù)目錄主數(shù)據(jù)共享主數(shù)據(jù)評(píng)估原生數(shù)據(jù)主數(shù)據(jù)入湖原生數(shù)據(jù)區(qū)生產(chǎn)數(shù)據(jù)入湖數(shù)據(jù)接入集團(tuán)橫向生產(chǎn)系統(tǒng)省份BMO生產(chǎn)系統(tǒng)網(wǎng)絡(luò)/平臺(tái)系統(tǒng)生態(tài)圈生產(chǎn)系統(tǒng)其他系統(tǒng)目錄12345背

景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念體

系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式共

享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃運(yùn)

營(yíng):大數(shù)據(jù)湖一體化運(yùn)營(yíng)管理建設(shè)基于大數(shù)據(jù)湖的生態(tài)圈建設(shè)模式生態(tài)圈應(yīng)用生態(tài)運(yùn)營(yíng)協(xié)同API生態(tài)資源互換生態(tài)精準(zhǔn)營(yíng)銷生態(tài)創(chuàng)新發(fā)現(xiàn)沙箱JDBCODBC智能連接互聯(lián)網(wǎng)金融智慧家庭新興ICTIPTV用戶流量軌跡客戶感知數(shù)據(jù)翼支付合作商戶

客戶金融特征支付風(fēng)險(xiǎn)識(shí)別物聯(lián)網(wǎng)

終端設(shè)備列表客戶故障記錄訪問共享生態(tài)圈統(tǒng)一共享目錄生態(tài)圈客戶數(shù)據(jù)

/

特征畫像數(shù)據(jù)

/

客戶感知數(shù)據(jù)

/…生態(tài)圈原生數(shù)據(jù)/主數(shù)據(jù)/整合數(shù)據(jù)/專區(qū)數(shù)據(jù)離線批處理引擎實(shí)時(shí)流處理引擎機(jī)器學(xué)習(xí)引擎協(xié)同計(jì)算引擎DataBroker內(nèi)存計(jì)算引擎大數(shù)據(jù)湖Spark計(jì)算處理數(shù)據(jù)存儲(chǔ)HiveMPPStromR圖數(shù)據(jù)庫(kù)Redisstreaming計(jì)算資源按需動(dòng)態(tài)調(diào)配計(jì)算需求分類

/

資源隊(duì)列管控

/

租戶任務(wù)管理計(jì)算規(guī)模

/

優(yōu)先級(jí)別

/

時(shí)間窗規(guī)劃智能連接智慧家庭統(tǒng)一賬號(hào)客戶特征行為軌跡新興ICT物聯(lián)網(wǎng)地產(chǎn)大金融欺詐分析專區(qū)車管專家營(yíng)銷云盤客戶洞察家庭圈畫像生產(chǎn)副本

生產(chǎn)正本(已建)

(新建)原生數(shù)據(jù)整合數(shù)據(jù)應(yīng)用數(shù)據(jù)數(shù)據(jù)專區(qū)互聯(lián)網(wǎng)金融共性基礎(chǔ)數(shù)據(jù)專業(yè)應(yīng)用數(shù)據(jù)天翼高清天翼網(wǎng)關(guān)天翼云盤189郵箱家庭云地產(chǎn)大數(shù)據(jù)生態(tài)圈系統(tǒng)iWIFI海洋寬帶智能組網(wǎng)翼支付甜橙欺詐盾物聯(lián)網(wǎng)卡車管專家已建新建生態(tài)圈入湖指導(dǎo)原則p

核心生態(tài)圈數(shù)據(jù)量龐大、繁雜,同時(shí)入庫(kù)對(duì)計(jì)算資源、并行處理能力、運(yùn)營(yíng)效率提出了極大的要求,基于此,應(yīng)構(gòu)建科學(xué)、完整的入湖流程及標(biāo)準(zhǔn),保證生態(tài)圈數(shù)據(jù)能夠順利、高效的入湖并發(fā)揮效果價(jià)值驅(qū)動(dòng)入湖邏輯目標(biāo)驅(qū)動(dòng)入湖原則業(yè)務(wù)驅(qū)動(dòng)數(shù)據(jù)分類生態(tài)核心資料生態(tài)經(jīng)營(yíng)數(shù)據(jù)生態(tài)營(yíng)銷數(shù)據(jù)權(quán)重系維度說(shuō)明優(yōu)先級(jí)數(shù)p

貼近實(shí)際:充分融合業(yè)務(wù)需求,遵循業(yè)務(wù)優(yōu)先原則準(zhǔn)確性

數(shù)據(jù)準(zhǔn)確無(wú)誤

0.282完整性

數(shù)據(jù)完整

0.213高中低中高高1

了解生態(tài)2掌握生態(tài)3開展生態(tài)業(yè)p

計(jì)算效率:充分保證數(shù)據(jù)質(zhì)量,讓計(jì)算效率顯著提升p

邊際效益:合理控制數(shù)據(jù)入湖速度、在成本控制的前提下,實(shí)現(xiàn)效益最大化業(yè)務(wù)關(guān)鍵概念整體經(jīng)營(yíng)狀況務(wù)數(shù)字化營(yíng)銷一致性

數(shù)據(jù)記錄規(guī)范

0.087及時(shí)性

數(shù)據(jù)獲取及時(shí)

0.234生態(tài)管理數(shù)據(jù)生態(tài)協(xié)同數(shù)據(jù)價(jià)值性復(fù)用性數(shù)據(jù)價(jià)值關(guān)聯(lián)性0.2350.3474

實(shí)現(xiàn)生態(tài)管5

開拓生態(tài)業(yè)p

生態(tài)創(chuàng)新:數(shù)據(jù)、業(yè)務(wù)、需求間的融會(huì)貫通,實(shí)現(xiàn)生態(tài)圈的關(guān)聯(lián)及衍生場(chǎng)景理運(yùn)營(yíng)一體化務(wù)智慧創(chuàng)新生態(tài)圈入湖建設(shè)思路與步驟解決生產(chǎn)經(jīng)營(yíng)看數(shù):以生態(tài)圈應(yīng)用和價(jià)值提升需求為導(dǎo)向,優(yōu)先將客戶、經(jīng)營(yíng)、階段一階段二營(yíng)銷、管理、生產(chǎn)方面的核心主數(shù)據(jù)入湖,滿足當(dāng)前業(yè)務(wù)發(fā)展和管理需求主數(shù)據(jù)經(jīng)營(yíng)數(shù)據(jù)?

收入數(shù)據(jù)?

發(fā)展數(shù)據(jù)?

繳費(fèi)數(shù)據(jù)?

…..營(yíng)銷數(shù)據(jù)?

業(yè)務(wù)訂購(gòu)數(shù)據(jù)

?

財(cái)務(wù)數(shù)據(jù)?

紅包數(shù)據(jù)?

金融消費(fèi)數(shù)據(jù)

?

資源/庫(kù)存數(shù)據(jù)管理數(shù)據(jù)業(yè)態(tài)生產(chǎn)數(shù)據(jù)?

原始數(shù)據(jù)?

生態(tài)協(xié)同數(shù)據(jù)?

業(yè)務(wù)流程數(shù)據(jù)?

…..?

客戶數(shù)據(jù)?

產(chǎn)品數(shù)據(jù)?

賬戶數(shù)據(jù)?

….?

成本/補(bǔ)貼數(shù)據(jù)?

…..?

……開展大數(shù)據(jù)價(jià)值挖掘:將各模塊未導(dǎo)入的全量數(shù)據(jù)入湖,同時(shí)豐富生態(tài)邊際和互聯(lián)網(wǎng)數(shù)據(jù),拓展應(yīng)用場(chǎng)景,實(shí)現(xiàn)大數(shù)據(jù)精準(zhǔn)營(yíng)銷和管理主數(shù)據(jù)?

渠道數(shù)據(jù)?

供應(yīng)商數(shù)據(jù)

?

交易類數(shù)據(jù)?

商客數(shù)據(jù)經(jīng)營(yíng)數(shù)據(jù)?

活動(dòng)數(shù)據(jù)營(yíng)銷數(shù)據(jù)?

業(yè)務(wù)感知數(shù)據(jù)

?

人力資源數(shù)據(jù)?

卡券數(shù)據(jù)?

保險(xiǎn)數(shù)據(jù)?

….管理數(shù)據(jù)業(yè)態(tài)生產(chǎn)數(shù)據(jù)?

互聯(lián)網(wǎng)數(shù)據(jù)?

用戶行為數(shù)據(jù)?

活動(dòng)數(shù)據(jù)?

….?

運(yùn)維數(shù)據(jù)?

網(wǎng)絡(luò)數(shù)據(jù)?

….?

….?

….生數(shù)據(jù)深度拓展:不斷豐富和拓展數(shù)據(jù)湖的數(shù)據(jù),包含數(shù)據(jù)的橫向范圍和縱向深度p

優(yōu)p

業(yè)補(bǔ)充采集數(shù)據(jù)?

….缺失的原生態(tài)數(shù)據(jù)?

….其他數(shù)據(jù)?

….p

先核心后邊p

先難后易?….?….?….p

先生態(tài)高于業(yè)務(wù)次高于運(yùn)營(yíng)管生態(tài)圈入湖建設(shè)要求與規(guī)范p

生態(tài)圈入湖要求ü

立足中國(guó)電信企業(yè)級(jí)視角ü

生產(chǎn)側(cè)與數(shù)據(jù)側(cè)建設(shè)協(xié)同?

生產(chǎn):原生接入保障?

數(shù)據(jù):共享服務(wù)保障püüüü運(yùn)營(yíng)原則前瞻性生態(tài)數(shù)據(jù)運(yùn)營(yíng)p

原生數(shù)據(jù)入湖方案全面性初始化全量上傳歷史全量同步后續(xù)變更采集周期增量采集全量合并整合全量合并整合ü

資料類:科學(xué)性ü

交易類:合理性ü

主數(shù)據(jù)/編碼類:實(shí)時(shí)全量同步p

運(yùn)營(yíng)規(guī)范要求(聯(lián)動(dòng)同步)生產(chǎn)源端規(guī)范入湖建設(shè)演進(jìn)ü

業(yè)務(wù)調(diào)整通知:新業(yè)務(wù)定義,生產(chǎn)約束變更、業(yè)務(wù)流程變更等ü

數(shù)據(jù)運(yùn)營(yíng)同步:模型結(jié)構(gòu)變更、歷史數(shù)據(jù)調(diào)整、口徑新增/調(diào)整等p

生態(tài)入湖步驟p

原生數(shù)據(jù)規(guī)范保障ü

依據(jù)數(shù)據(jù)價(jià)值推進(jìn)生態(tài)數(shù)據(jù)入湖ü

業(yè)務(wù)規(guī)范:業(yè)務(wù)指導(dǎo)、流程、制度等文檔ü

主數(shù)據(jù):范圍、內(nèi)容及管理規(guī)范ü

生產(chǎn)模型建設(shè)規(guī)范:新增/變更模型遵循大數(shù)據(jù)湖整體規(guī)范要求ü

生態(tài)圈需求驅(qū)動(dòng)原生數(shù)據(jù)的入湖ü

數(shù)據(jù)字典:數(shù)據(jù)模型、編碼約束、元數(shù)據(jù)等ü

數(shù)據(jù)流圖(DFD):生產(chǎn)數(shù)據(jù)流、加工數(shù)據(jù)流等ü

指標(biāo)口徑:術(shù)語(yǔ)定義、報(bào)表指標(biāo)說(shuō)明等p

原生入湖演進(jìn)ü

原則上遵循生態(tài)數(shù)據(jù)原生入湖ü

當(dāng)原生入湖存在海量采集(性價(jià)比低),理解/支撐困難等情況,允許按照如下原則進(jìn)行非原生數(shù)據(jù)入湖:①核心和經(jīng)營(yíng)入湖:非原生采集,匯入整合層②營(yíng)銷和運(yùn)營(yíng)入湖:根據(jù)需要采集原生并逐步替換③生態(tài)協(xié)同入湖:完全實(shí)現(xiàn)原生數(shù)據(jù)入湖p

生態(tài)能力入湖規(guī)劃ü

數(shù)據(jù)規(guī)模:生態(tài)全量、核心資料、經(jīng)營(yíng)數(shù)據(jù)等大小ü

更新頻率:交易頻率、業(yè)務(wù)變更頻率等ü

存儲(chǔ)結(jié)構(gòu):生產(chǎn)數(shù)據(jù)存儲(chǔ)模式、存儲(chǔ)周期、分層結(jié)構(gòu)等ü

接入要求:I/O帶寬、接入約束、生產(chǎn)備份情況等生態(tài)圈入湖ü

生態(tài)業(yè)務(wù)變動(dòng)大且原生結(jié)果滯后數(shù)據(jù),允許前瞻性獲取生產(chǎn)變化過(guò)程表,避免數(shù)據(jù)模型的大幅調(diào)整規(guī)范

價(jià)值

靈活生態(tài)圈數(shù)據(jù)整合處理原則及關(guān)鍵點(diǎn)大數(shù)據(jù)湖整合區(qū)建設(shè)原則①

基于共性化數(shù)據(jù)處理,支撐廣泛、穩(wěn)定的共享應(yīng)用;②

支撐湖標(biāo)準(zhǔn)化的數(shù)據(jù)規(guī)范轉(zhuǎn)換;③

跨域數(shù)據(jù)的關(guān)聯(lián)性和橫向?qū)R;生態(tài)圈數(shù)據(jù)整合關(guān)鍵點(diǎn)統(tǒng)一ID生態(tài)圈自然人實(shí)體歸集與對(duì)齊客戶資料歸集應(yīng)具備基于資料信息的規(guī)則匹配識(shí)別和基于客戶海量的通信相關(guān)信息的挖掘識(shí)別方法:1)通過(guò)規(guī)則匹配識(shí)別技術(shù),高效地完成準(zhǔn)確性較高的資料信息自然人識(shí)別;2)基于大數(shù)據(jù)技術(shù)構(gòu)建自然人識(shí)別模式,作為規(guī)則識(shí)別的有效補(bǔ)充,提高自然人識(shí)別成功率,減少人工核查確認(rèn)工作量。實(shí)體歸集數(shù)據(jù)流程實(shí)體歸集過(guò)程基于實(shí)體完整性原生數(shù)據(jù)自然人識(shí)別自然人沉淀專區(qū)應(yīng)用保證上層覆蓋性自然人黑名單信息自然人基本

自然人有效移網(wǎng)自然人用戶360信息差異數(shù)據(jù)下發(fā)…信息戶數(shù)信息智能連接智慧家庭新興ICT數(shù)據(jù)整合/加工規(guī)則整合歸集自然人基本信息自自底證件號(hào)碼姓名

地址聯(lián)系人工作單位

…餐自然人擴(kuò)展信息自然人用戶信息自然人用戶擴(kuò)展信息差異數(shù)據(jù)規(guī)則庫(kù)頂用戶向向綜合評(píng)價(jià)上自然人:客戶A下編碼標(biāo)準(zhǔn)化模型轉(zhuǎn)化/編碼統(tǒng)一餐用戶自然人用戶信息自然人用戶擴(kuò)展屬性表自然人基本信息自然人擴(kuò)展信息大數(shù)據(jù)識(shí)別照片留存交際圈位置軌跡虛擬身份繳費(fèi)信息終端信息客戶接觸

…物聯(lián)網(wǎng)原生數(shù)據(jù)用戶信息表用戶產(chǎn)品訂購(gòu)客戶信息客戶實(shí)名認(rèn)證互聯(lián)網(wǎng)金融客戶聯(lián)系人信用度用戶積分

郵寄信息基于業(yè)務(wù)邏輯關(guān)鍵能力要求:p

規(guī)則識(shí)別和大數(shù)據(jù)技術(shù)識(shí)別配合完成資料聚合;深度應(yīng)用大數(shù)據(jù)識(shí)別技術(shù),通過(guò)照片留存、交際圈、位置軌跡、虛擬身份等信息,識(shí)別出從資料層面不能反映出的同一自然人。p

大數(shù)據(jù)技術(shù)識(shí)別應(yīng)用到的技術(shù):文本分詞、文本匹配、似度計(jì)算、多音字庫(kù)、象形字庫(kù)、網(wǎng)絡(luò)圖譜算法、指紋權(quán)重、關(guān)系傳遞等;生態(tài)圈數(shù)據(jù)接入與存儲(chǔ)通過(guò)對(duì)五大生態(tài)圈數(shù)據(jù)采集入湖,統(tǒng)一規(guī)范轉(zhuǎn)換后,為各類專區(qū)應(yīng)用提供數(shù)據(jù)支撐。大數(shù)據(jù)湖原生數(shù)據(jù)區(qū)整合數(shù)據(jù)區(qū)應(yīng)用數(shù)據(jù)區(qū)生態(tài)收入貢獻(xiàn)互金業(yè)務(wù)訂購(gòu)用戶行為軌跡…智能連接智慧家庭互聯(lián)網(wǎng)金融專區(qū)物聯(lián)網(wǎng)專區(qū)p

生態(tài)圈入湖互聯(lián)網(wǎng)金融物聯(lián)網(wǎng)新興ICT…根據(jù)生態(tài)圈系統(tǒng)的建設(shè)情況,科學(xué)規(guī)劃多種采集方式入湖生態(tài)創(chuàng)新專區(qū)…主數(shù)據(jù)區(qū)p

生態(tài)圈數(shù)據(jù)規(guī)范圍繞大數(shù)據(jù)湖功能分區(qū),探索各類數(shù)據(jù)的存儲(chǔ)要求和能力建設(shè)統(tǒng)一客戶信息用戶關(guān)聯(lián)信息統(tǒng)一帳戶信息生態(tài)業(yè)務(wù)產(chǎn)品標(biāo)準(zhǔn)編碼信息新業(yè)務(wù)采集入湖模式探索數(shù)據(jù)分區(qū)規(guī)劃對(duì)接應(yīng)用需求湖存儲(chǔ)功能定義專區(qū)規(guī)范制定批量采集實(shí)時(shí)采集p

生態(tài)應(yīng)用服務(wù)生態(tài)采集支撐入湖采集能力驗(yàn)證準(zhǔn)實(shí)時(shí)采集針對(duì)生態(tài)業(yè)務(wù)應(yīng)用需求,五大生態(tài)確定大數(shù)據(jù)湖的應(yīng)用支撐模式,構(gòu)建專區(qū)建設(shè)規(guī)范智能連接智慧家庭互聯(lián)網(wǎng)金融新興ICT物聯(lián)網(wǎng)圈數(shù)據(jù)目錄12345背

景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念體

系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式共

享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃運(yùn)

營(yíng):大數(shù)據(jù)湖一體化運(yùn)營(yíng)管理建設(shè)大數(shù)據(jù)場(chǎng)景下數(shù)據(jù)服務(wù)的能力建設(shè)要求?

跨底層數(shù)據(jù)存儲(chǔ)平臺(tái)混搭架構(gòu)平臺(tái),如多種數(shù)據(jù)存儲(chǔ)體系,如關(guān)系型DB、KV-DB、文件系統(tǒng)等HDFS、MPP、SMP等?統(tǒng)一標(biāo)準(zhǔn)化數(shù)據(jù)查詢?跨數(shù)據(jù)結(jié)構(gòu)的邏輯化訪問通用的數(shù)據(jù)查詢語(yǔ)言,支持跨平臺(tái)訪問,如PL/SQL,HQL等多應(yīng)用系統(tǒng)的物理結(jié)構(gòu)透明化邏輯封裝,如OLTP、OLAP等統(tǒng)一標(biāo)準(zhǔn)化透明化安全?靈活安全的權(quán)限管控機(jī)制?外部應(yīng)用的便捷接入多種數(shù)據(jù)服務(wù)場(chǎng)景的權(quán)限管控,如查詢、分析等多種應(yīng)用接入能力,如JDBC、Socket等高效大數(shù)據(jù)場(chǎng)景:混搭架構(gòu)平臺(tái)、多系統(tǒng)共存、不同數(shù)據(jù)體系、各種應(yīng)用場(chǎng)景需求大數(shù)據(jù)湖統(tǒng)一訪問共享建設(shè)規(guī)劃

——

統(tǒng)一目錄/透明訪問訪問共享是湖中數(shù)據(jù)和應(yīng)用、能力之間的橋梁,任何功能/應(yīng)用模塊使用湖中數(shù)據(jù)時(shí),不需要關(guān)心數(shù)據(jù)的存儲(chǔ)方式、存儲(chǔ)介質(zhì)、存儲(chǔ)位置等信息,只要和訪問共享連接既可以實(shí)現(xiàn)湖中數(shù)據(jù)的訪問數(shù)統(tǒng)一訪問共享:管、用、看p

管:基于湖中數(shù)據(jù)構(gòu)建統(tǒng)一數(shù)據(jù)目錄,屏蔽湖中數(shù)據(jù)物理存儲(chǔ)地址,提供實(shí)現(xiàn)湖中可共享數(shù)據(jù)的管理?yè)?jù)能力數(shù)據(jù)采集數(shù)據(jù)加工數(shù)據(jù)挖掘數(shù)據(jù)服務(wù)封裝數(shù)據(jù)應(yīng)用可視化數(shù)據(jù)訪問接口數(shù)據(jù)服務(wù)中間件目錄管控?cái)?shù)據(jù)訪問接口數(shù)據(jù)緩存API接口JDBC/ODBC消息數(shù)據(jù)開放訪問共享p用:數(shù)據(jù)服務(wù)中間件為應(yīng)用提供多樣化數(shù)據(jù)接口訪問能力,如API、JDBC/ODBC、消息、訂閱等能力數(shù)據(jù)訪問引擎函數(shù)計(jì)算規(guī)則配置接口鑒權(quán)數(shù)據(jù)授權(quán)權(quán)限申請(qǐng)授權(quán)審批內(nèi)存計(jì)算統(tǒng)計(jì)分析統(tǒng)一數(shù)據(jù)目錄數(shù)據(jù)讀取p

看:目錄視圖為開發(fā)者提供湖中可共享數(shù)據(jù)的統(tǒng)一目錄視圖,并管理湖中數(shù)據(jù)訪問授權(quán)數(shù)據(jù)計(jì)算與存儲(chǔ)資源計(jì)算引擎數(shù)據(jù)存儲(chǔ)文本數(shù)據(jù)ORACLEHIVEHBASE…統(tǒng)一訪問共享典型應(yīng)用場(chǎng)景專區(qū)應(yīng)用開發(fā)者通過(guò)統(tǒng)一訪問引擎訪問湖中共享數(shù)據(jù),專區(qū)應(yīng)用直接訪問自有專區(qū)數(shù)據(jù),實(shí)現(xiàn)湖中數(shù)據(jù)統(tǒng)一共享管控和應(yīng)用訪問靈活訪問自有專區(qū)數(shù)據(jù)新建系統(tǒng)數(shù)據(jù)挖掘能力開放(API)專區(qū)應(yīng)用4123服務(wù)網(wǎng)關(guān)數(shù)據(jù)探索數(shù)據(jù)可視化共享數(shù)據(jù)訪問共享數(shù)據(jù)訪問專區(qū)數(shù)據(jù)訪問數(shù)據(jù)加工共享數(shù)據(jù)訪問數(shù)據(jù)挖掘數(shù)據(jù)挖掘結(jié)果服務(wù)封裝服務(wù)訂閱生產(chǎn)系統(tǒng)數(shù)據(jù)訪問數(shù)據(jù)訪問數(shù)據(jù)訪問訪問共享數(shù)據(jù)服務(wù)中間件目錄管控自有數(shù)據(jù)接口統(tǒng)一數(shù)據(jù)目錄遵循入湖規(guī)范數(shù)據(jù)計(jì)算與存儲(chǔ)資源生產(chǎn)數(shù)據(jù)原生數(shù)據(jù)整合數(shù)據(jù)專區(qū)數(shù)據(jù)統(tǒng)一數(shù)據(jù)目錄

——

共享列表/質(zhì)量保障/安全可控基于湖中具備共享?xiàng)l件的數(shù)據(jù)構(gòu)建統(tǒng)一數(shù)據(jù)目錄,通過(guò)訪問引擎為應(yīng)用開發(fā)者、數(shù)據(jù)運(yùn)營(yíng)者提供湖中數(shù)據(jù)訪問能力,是數(shù)據(jù)應(yīng)用、運(yùn)營(yíng)和價(jià)值實(shí)現(xiàn)的基礎(chǔ)。訪問共享數(shù)據(jù)服務(wù)中間件湖中數(shù)據(jù)只有經(jīng)過(guò)質(zhì)量和安全評(píng)估,符合應(yīng)用開發(fā)的條件后,在明確開放審批流程的前提下,進(jìn)入統(tǒng)一數(shù)據(jù)目錄對(duì)外共享目錄管控審核通過(guò)統(tǒng)一數(shù)據(jù)目錄結(jié)合元數(shù)據(jù)及數(shù)據(jù)統(tǒng)計(jì)信息開放流程定義數(shù)據(jù)描述及統(tǒng)計(jì)信息數(shù)據(jù)稽核開放范圍審核人工審核表、視圖數(shù)據(jù)安全審核數(shù)據(jù)質(zhì)量審核元數(shù)據(jù)管理運(yùn)營(yíng)者數(shù)據(jù)存儲(chǔ)大數(shù)據(jù)服務(wù)關(guān)鍵能力:統(tǒng)一數(shù)據(jù)接入/轉(zhuǎn)換/服務(wù)對(duì)接能力數(shù)據(jù)應(yīng)用數(shù)據(jù)服務(wù)能力開放工具報(bào)表、應(yīng)用等Query、API等查詢工具、挖掘工具、OLAP工具等統(tǒng)一對(duì)外接入(JDBC、Socket、Restful)緩存優(yōu)先內(nèi)存轉(zhuǎn)換訪問鑒權(quán)脫敏加密AQL解釋查詢數(shù)據(jù)聯(lián)邦數(shù)據(jù)集關(guān)聯(lián)統(tǒng)一數(shù)據(jù)服務(wù)代理Data

Broker格式轉(zhuǎn)換統(tǒng)一維表元數(shù)據(jù)性能優(yōu)化數(shù)據(jù)安全源端連接數(shù)據(jù)預(yù)覽性能安全統(tǒng)一數(shù)據(jù)連接(AgentPL/SQL

HQL

PostgresSQL…connector)SMP數(shù)據(jù)庫(kù)Oracle、Mysql、傳統(tǒng)文件系統(tǒng)Excel、XML、Json、…大數(shù)據(jù)系統(tǒng)Hive、Hbase、Impala、…MPP數(shù)據(jù)庫(kù)GreenPlum、Vertica、…OLAP引擎ApacheKylin、Cognos、…DB2、…統(tǒng)一數(shù)據(jù)服務(wù)中間件

——

跨域聯(lián)邦/標(biāo)準(zhǔn)查詢/統(tǒng)一訪問p

跨底層數(shù)據(jù)存儲(chǔ)平臺(tái)多種數(shù)據(jù)存儲(chǔ)體系,如關(guān)系型DB、KV-DB、文件系統(tǒng)等p

統(tǒng)一標(biāo)準(zhǔn)化數(shù)據(jù)查詢通用的數(shù)據(jù)查詢語(yǔ)言,支持跨平臺(tái)訪問,如PL/SQL,HQL等p

靈活安全的權(quán)限管控機(jī)制多種數(shù)據(jù)服務(wù)場(chǎng)景的權(quán)限管控,如查詢、分析等p

跨數(shù)據(jù)結(jié)構(gòu)的邏輯化訪問多應(yīng)用系統(tǒng)的物理結(jié)構(gòu)透明化邏輯封裝,如OLTP、OLAP等p

外部應(yīng)用的便捷接入多種應(yīng)用接入能力,如JDBC、Socket等各類跨架構(gòu)數(shù)據(jù)源端連接與訪問靈活自主的數(shù)據(jù)服務(wù)集定義39DataBroker查詢語(yǔ)法AQL語(yǔ)法(類SQL):常用函數(shù):40DataBroker查詢示例示例1:在用戶增長(zhǎng)數(shù)據(jù)集中,查詢2018年10月比9月的入網(wǎng)用戶增長(zhǎng)比例,按地區(qū)分組,按排序字段排序示例2:按照省份,將流量按照100M為步長(zhǎng)分檔統(tǒng)計(jì),并忽略小于10M的用戶數(shù)SELETROUND((month_ten-month_nine)/month_nine)as“增長(zhǎng)比例”,user_areaas“地區(qū)”FROMuser_in_month_detailSELECTarea_no,segm_step(data_flow,100,10)as"流量分檔",count(user_id)as"用戶數(shù)"FROMuser_used_flowGROUPBYuser_areaGROUPBYarea_no,SEGM_STEP(data_flow,100,10)as"流量分檔”O(jiān)RDERBYorder_code示例3:按照省,賬期,分組統(tǒng)計(jì)指標(biāo)1,指標(biāo)2值,同時(shí)統(tǒng)計(jì)行小計(jì),行總計(jì),列小計(jì),列合計(jì),并將省,賬期轉(zhuǎn)為交叉列,省份為河北與甘肅。SELECTgroup_typeAS"分組"FROMBIG_DATA_SETtACROSS(sum(指標(biāo)1)as“指標(biāo)1”,sum(指標(biāo)3)for(PROVINCE,ACCT_MONTH)WHEREt.PROVINCEin('河北','甘肅')ORDERBYgroup_typeASCROLLALL目錄12345背

景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念體

系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式共

享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃運(yùn)

營(yíng):大數(shù)據(jù)湖一體化運(yùn)營(yíng)管理建設(shè)大數(shù)據(jù)湖運(yùn)營(yíng)管理體系規(guī)劃大數(shù)據(jù)湖運(yùn)營(yíng)管理能夠?yàn)槿W(wǎng)提供統(tǒng)一的運(yùn)營(yíng)和協(xié)同管控,包括運(yùn)維支撐、運(yùn)營(yíng)監(jiān)控和數(shù)據(jù)生態(tài)評(píng)估等多個(gè)方面,實(shí)現(xiàn)各類數(shù)據(jù)風(fēng)險(xiǎn)和隱患的快速排查,提升運(yùn)營(yíng)效率,為智慧化的運(yùn)營(yíng)戰(zhàn)略奠定基礎(chǔ)。全面性規(guī)范化可視化統(tǒng)一運(yùn)營(yíng)管理運(yùn)營(yíng)監(jiān)控運(yùn)維支撐數(shù)據(jù)生態(tài)評(píng)估接入用戶監(jiān)控任務(wù)狀態(tài)監(jiān)控應(yīng)用稽核問題派單數(shù)據(jù)分布數(shù)據(jù)熱點(diǎn)冗余評(píng)估質(zhì)量評(píng)估采集監(jiān)控?cái)?shù)據(jù)分區(qū)監(jiān)控共享服務(wù)監(jiān)控問題跟蹤通知管理日志管理價(jià)值評(píng)估安全評(píng)估外圍系統(tǒng)交互監(jiān)控質(zhì)量探索工具已建設(shè)建設(shè)中未建設(shè)大數(shù)據(jù)湖統(tǒng)一運(yùn)營(yíng)監(jiān)控

——

全生命周期監(jiān)控/運(yùn)營(yíng)規(guī)范顯性化運(yùn)營(yíng)監(jiān)控主要為大數(shù)據(jù)湖提供數(shù)據(jù)生產(chǎn)監(jiān)控和數(shù)據(jù)運(yùn)營(yíng)監(jiān)控兩方面的能力。其中數(shù)據(jù)生產(chǎn)監(jiān)控主要提供從數(shù)據(jù)采集、數(shù)據(jù)分區(qū)存儲(chǔ)到共享的監(jiān)控;數(shù)據(jù)運(yùn)營(yíng)監(jiān)控實(shí)現(xiàn)對(duì)接入系統(tǒng)的用戶信息、任務(wù)執(zhí)行的狀態(tài),以及與外圍應(yīng)用系統(tǒng)的交互操作進(jìn)行監(jiān)控,并進(jìn)行全景展示。數(shù)據(jù)監(jiān)控視圖運(yùn)營(yíng)監(jiān)控視圖采集監(jiān)控:接入用戶監(jiān)控:對(duì)從各類數(shù)據(jù)源采集入湖數(shù)據(jù)是否符合接入規(guī)范進(jìn)行監(jiān)控對(duì)已接入大數(shù)據(jù)湖的用戶類型、操作權(quán)限,并發(fā)用戶量等信息進(jìn)行監(jiān)控?cái)?shù)據(jù)分區(qū)監(jiān)控:任務(wù)狀態(tài)監(jiān)控:對(duì)大數(shù)據(jù)湖中的原生數(shù)據(jù)、整合數(shù)據(jù)等各類數(shù)據(jù)是否按分區(qū)規(guī)范存儲(chǔ)進(jìn)行監(jiān)控對(duì)大數(shù)據(jù)湖中各類任務(wù)運(yùn)行的異常狀態(tài)進(jìn)行實(shí)時(shí)的監(jiān)控共享服務(wù)監(jiān)控:外圍系統(tǒng)交互監(jiān)控:對(duì)湖中可共享的各類數(shù)據(jù)是否符合共享標(biāo)準(zhǔn)和規(guī)范進(jìn)行監(jiān)控提供外圍應(yīng)用系統(tǒng)與大數(shù)據(jù)湖進(jìn)行各類交互操作的監(jiān)控?cái)?shù)據(jù)生命周期程序任務(wù)存儲(chǔ)分區(qū)用戶操作運(yùn)維支撐:打造閉環(huán)的數(shù)據(jù)質(zhì)量管控體系通過(guò)構(gòu)建數(shù)據(jù)質(zhì)量管控系統(tǒng),打通數(shù)據(jù)湖與數(shù)據(jù)源端的交互,建立起稽核問題任務(wù)派發(fā)、追蹤及結(jié)果反饋的保障機(jī)制,提升稽核效率,實(shí)現(xiàn)閉環(huán)的數(shù)據(jù)質(zhì)量管控體系。l

工作重點(diǎn):2.2.責(zé)任人通知運(yùn)營(yíng)管理系統(tǒng)?

異常問題閉環(huán)跟蹤針對(duì)入湖數(shù)據(jù)開展對(duì)賬、嵌入稽核和數(shù)據(jù)稽核。對(duì)于源端系統(tǒng)的數(shù)據(jù)質(zhì)量問題,實(shí)現(xiàn)異常問題派單和處理跟蹤反饋。ITSM數(shù)據(jù)質(zhì)量管控系統(tǒng)2.1.問題派單3.處理反饋派單管理工單追蹤處理反饋源端問題派單1.1.異常1.2.異常?

ITSM系統(tǒng)打通實(shí)現(xiàn)異常問題快速通知相關(guān)人員。4.重傳上傳共享源端嵌入稽核數(shù)據(jù)稽核采集對(duì)賬下游1.3.異常運(yùn)維支撐:增加數(shù)據(jù)質(zhì)量稽核能力提供自助化的數(shù)據(jù)分析和質(zhì)量探索服務(wù),基于分布式計(jì)算能力,通過(guò)探索分析工具和SQL調(diào)試器進(jìn)行數(shù)據(jù)質(zhì)量自助探索,增加對(duì)業(yè)務(wù)、關(guān)聯(lián)稽核的手段,并生成質(zhì)量報(bào)告和統(tǒng)計(jì)報(bào)表。應(yīng)用指標(biāo)驗(yàn)證由數(shù)據(jù)應(yīng)用方根據(jù)應(yīng)用需要和口徑進(jìn)行自主分析探索,探索結(jié)果可固化為專項(xiàng)稽核。分析探索方式數(shù)據(jù)源整改BSSMSS交互式可視化的數(shù)據(jù)剖析基于SQL的數(shù)據(jù)剖析質(zhì)量探索成果數(shù)據(jù)可用性反饋數(shù)據(jù)采集數(shù)據(jù)可用性驗(yàn)證報(bào)告數(shù)據(jù)質(zhì)量探索報(bào)告質(zhì)量探索分析報(bào)表稽核規(guī)則固化建議…分析探索內(nèi)容OSS評(píng)分驗(yàn)證反饋數(shù)據(jù)基礎(chǔ)質(zhì)量驗(yàn)證(空值統(tǒng)計(jì)、重復(fù)統(tǒng)計(jì)、主外鍵統(tǒng)計(jì)…)網(wǎng)絡(luò)數(shù)據(jù)橫向平臺(tái)互聯(lián)網(wǎng)數(shù)據(jù)關(guān)聯(lián)驗(yàn)證(跨域關(guān)聯(lián)、跨賬期關(guān)聯(lián)、跨省關(guān)聯(lián)…)稽核規(guī)則固化核心業(yè)務(wù)指標(biāo)驗(yàn)證(在網(wǎng)用戶數(shù)、出賬用戶數(shù)、傭金總額…)應(yīng)用指標(biāo)驗(yàn)證…運(yùn)維支撐:自助化數(shù)據(jù)質(zhì)量分析工具展示利用自助化數(shù)據(jù)質(zhì)量分析工具,應(yīng)用人員可對(duì)湖中數(shù)據(jù)質(zhì)量進(jìn)行自行分析和探索,而不必依賴專業(yè)技術(shù)人員,提前了解湖中數(shù)據(jù)特征。提供EXCEL方式的海量數(shù)據(jù)庫(kù)操作提供數(shù)據(jù)深度統(tǒng)計(jì)和分析方法數(shù)據(jù)生態(tài)評(píng)估:大數(shù)據(jù)湖生態(tài)健康評(píng)估與優(yōu)化價(jià)值評(píng)估數(shù)據(jù)分布數(shù)據(jù)熱點(diǎn)ü

生產(chǎn)區(qū):操作存儲(chǔ)/臨時(shí)數(shù)據(jù)ü

原生區(qū):就近存儲(chǔ)/分域數(shù)據(jù)ü

整合區(qū):存儲(chǔ)統(tǒng)一規(guī)范后數(shù)據(jù)ü

……ü

發(fā)現(xiàn):數(shù)據(jù)訪問頻率ü

優(yōu)化:優(yōu)化熱點(diǎn)配置ü

提升:支撐效率提升ü

……ü

從應(yīng)用的角度評(píng)估ü

從唯一性角度評(píng)估ü

從數(shù)據(jù)類型角度評(píng)估ü

從數(shù)據(jù)結(jié)構(gòu)角度評(píng)估質(zhì)量評(píng)估冗余評(píng)估安全評(píng)估ü

跨域共性存儲(chǔ)ü

系統(tǒng)口徑交叉與包容性檢查ü

檢查數(shù)據(jù)相似度ü

……ü

制定安全評(píng)估策略ü

數(shù)據(jù)分級(jí)安全評(píng)估ü

訪問操作安全評(píng)估ü

……üüüü前置稽核嵌入稽核專項(xiàng)稽核應(yīng)用稽核大數(shù)據(jù)湖數(shù)據(jù)規(guī)范標(biāo)準(zhǔn)體系數(shù)據(jù)湖的規(guī)范標(biāo)準(zhǔn)不是一個(gè)個(gè)獨(dú)立的規(guī)范或標(biāo)準(zhǔn),是有相互關(guān)系,互相作用的規(guī)范化、標(biāo)準(zhǔn)化體系。以滿足業(yè)務(wù)需求為基礎(chǔ),全面覆蓋數(shù)據(jù)在湖內(nèi)從生產(chǎn)、存儲(chǔ)、計(jì)算、應(yīng)用的生命周期,保障數(shù)據(jù)湖中數(shù)據(jù)的穩(wěn)定、安全、開放。業(yè)務(wù)需求數(shù)據(jù)湖要求標(biāo)準(zhǔn)規(guī)范IT保障?

訪問接入規(guī)范?

數(shù)據(jù)共享標(biāo)準(zhǔn)?

數(shù)據(jù)計(jì)算調(diào)度規(guī)范?

資源申請(qǐng)規(guī)范?

數(shù)據(jù)分類規(guī)范?

數(shù)據(jù)模型規(guī)范??????????需求管理?

可以信賴的數(shù)據(jù)?穩(wěn)定、可擴(kuò)展的數(shù)據(jù)架構(gòu)主數(shù)據(jù)管理元數(shù)據(jù)管理模型規(guī)范檢查采集管控?

標(biāo)準(zhǔn)的建模原則,保準(zhǔn)的命名規(guī)范,全面的數(shù)據(jù)項(xiàng)屬性?

融合數(shù)據(jù)的計(jì)算口徑、統(tǒng)一標(biāo)準(zhǔn)、可擴(kuò)展融合模型?

數(shù)據(jù)需求開發(fā)的標(biāo)準(zhǔn),命名規(guī)范、重要參數(shù)、標(biāo)準(zhǔn)字段名稱、數(shù)據(jù)類型、長(zhǎng)度、枚舉值,統(tǒng)一的技術(shù)選型?

數(shù)據(jù)質(zhì)量的標(biāo)準(zhǔn)管理、流程、考核、通報(bào)?

數(shù)據(jù)基礎(chǔ)及關(guān)聯(lián)信息的標(biāo)準(zhǔn)統(tǒng)一管理?

統(tǒng)一、標(biāo)準(zhǔn)的業(yè)務(wù)口徑?

能夠快速查詢的能力?

標(biāo)準(zhǔn)化的數(shù)據(jù)治理數(shù)據(jù)質(zhì)量保障運(yùn)營(yíng)管理?

數(shù)據(jù)間可以方便跨域融合?

數(shù)據(jù)安全且使用無(wú)風(fēng)險(xiǎn)?

數(shù)據(jù)需求的快速響應(yīng)?

數(shù)據(jù)方便查找、定位?

數(shù)據(jù)生成穩(wěn)定并持續(xù)更新角色權(quán)限規(guī)范??

元數(shù)據(jù)規(guī)范?

存儲(chǔ)規(guī)范安全保障?

數(shù)據(jù)的標(biāo)準(zhǔn)統(tǒng)一查看,訪問資源申請(qǐng)?多種的數(shù)據(jù)提取方式,數(shù)據(jù)訪問方式?

采集接入規(guī)范?

源數(shù)據(jù)提供規(guī)范生產(chǎn)模型規(guī)范共享訪問服務(wù)?

不同價(jià)值/分類數(shù)據(jù)的存儲(chǔ)形式/存儲(chǔ)介質(zhì)/存儲(chǔ)周期規(guī)范?

數(shù)據(jù)使用的租戶流程,資源要求???

數(shù)據(jù)安全的基本屬性,分級(jí),分類運(yùn)營(yíng)管理規(guī)范?

數(shù)據(jù)使用的監(jiān)控、評(píng)估,問題的管理流程、制度?

生產(chǎn)數(shù)據(jù)的標(biāo)準(zhǔn)業(yè)務(wù)口徑?

主數(shù)據(jù)規(guī)范?安全規(guī)范數(shù)據(jù)規(guī)范標(biāo)準(zhǔn)貫穿落地?cái)?shù)據(jù)規(guī)范標(biāo)準(zhǔn)貫穿數(shù)據(jù)的整個(gè)生命周期,從生產(chǎn)到應(yīng)用的全流程,實(shí)現(xiàn)有規(guī)可依,有法可循。?

數(shù)據(jù)模型規(guī)范?

數(shù)據(jù)運(yùn)營(yíng)標(biāo)準(zhǔn)?

數(shù)據(jù)目錄標(biāo)準(zhǔn)?

數(shù)據(jù)資產(chǎn)標(biāo)準(zhǔn)?

……?

數(shù)據(jù)開發(fā)規(guī)范?

元數(shù)據(jù)標(biāo)準(zhǔn)?

整合質(zhì)量標(biāo)準(zhǔn)?

……?

元數(shù)據(jù)規(guī)范?

數(shù)據(jù)模型標(biāo)準(zhǔn)?

數(shù)據(jù)轉(zhuǎn)換標(biāo)準(zhǔn)數(shù)據(jù)生產(chǎn)數(shù)據(jù)入湖原生存儲(chǔ)數(shù)據(jù)整合開放應(yīng)用運(yùn)營(yíng)監(jiān)控?

數(shù)據(jù)業(yè)務(wù)標(biāo)準(zhǔn)?

生產(chǎn)模型標(biāo)準(zhǔn)?

……?

主數(shù)據(jù)標(biāo)準(zhǔn)?

數(shù)據(jù)存儲(chǔ)標(biāo)準(zhǔn)?

原生質(zhì)量標(biāo)準(zhǔn)?

……?

數(shù)據(jù)開放標(biāo)準(zhǔn)?

數(shù)據(jù)應(yīng)用標(biāo)準(zhǔn)?

數(shù)據(jù)安全標(biāo)準(zhǔn)?

……感謝聆聽!大數(shù)據(jù)湖總體規(guī)劃及大數(shù)據(jù)湖一體化運(yùn)營(yíng)管理建設(shè)方案目錄背景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念1生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式3共享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃4運(yùn)營(yíng):大數(shù)據(jù)湖一體化運(yùn)營(yíng)管理建設(shè)5體系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路2數(shù)據(jù)架構(gòu)與承載體系的演變過(guò)程完整性、一致性、交互穩(wěn)定性,并發(fā)性,異??苫謴?fù)性數(shù)據(jù)庫(kù)時(shí)代關(guān)系型數(shù)據(jù)庫(kù)解決了信息時(shí)代的數(shù)據(jù)資源存儲(chǔ)和管理,實(shí)現(xiàn)了電子化的文件柜采用數(shù)據(jù)模型表示數(shù)據(jù)結(jié)構(gòu),冗余小面向事務(wù)管理,具有ACID特性數(shù)據(jù)統(tǒng)一管理和控制,易維護(hù)和擴(kuò)充程序與數(shù)據(jù)獨(dú)立,具有良好用戶接口1數(shù)據(jù)倉(cāng)庫(kù)時(shí)代DW研究和解決了從數(shù)據(jù)庫(kù)中獲取信息的問題,通過(guò)OLAP、數(shù)據(jù)挖掘等幫助企業(yè)決策分析,構(gòu)建商業(yè)智能(BI)面向主題的,關(guān)注用戶重點(diǎn)業(yè)務(wù)集成的,跨越歷史、區(qū)域、系統(tǒng)…穩(wěn)定的,具有只讀性質(zhì),以查詢?yōu)橹饕詴r(shí)間序列存儲(chǔ),非規(guī)范化管理2大數(shù)據(jù)平臺(tái)時(shí)代面對(duì)大數(shù)據(jù)5V特點(diǎn),采用分布式、并行化的存儲(chǔ)和計(jì)算架構(gòu),提升數(shù)據(jù)處理能力對(duì)象:PB級(jí),80%以上非結(jié)構(gòu)化數(shù)據(jù)技術(shù):分布式架構(gòu)、云計(jì)算、虛擬化等CAP原理:CAPBASE目標(biāo):線性擴(kuò)展、彈性計(jì)算、實(shí)時(shí)響應(yīng)、動(dòng)態(tài)調(diào)節(jié)31970’s1990’sBillInmon提出DW概念E.F.Codd發(fā)明DBMS2000’sGoogle發(fā)布三篇論文存儲(chǔ)經(jīng)濟(jì)性、高性能、高擴(kuò)展、高并發(fā)、靈活模型適配性企業(yè)級(jí)跨域整合、業(yè)務(wù)擴(kuò)展性、架構(gòu)設(shè)計(jì)合理性、流程規(guī)范性背景:數(shù)據(jù)快速入湖,分析更加智能,應(yīng)用更加多樣,服務(wù)更加開放更多企業(yè)數(shù)據(jù)將進(jìn)入數(shù)據(jù)湖,來(lái)自傳統(tǒng)系統(tǒng)的數(shù)據(jù)和傳感器等新型數(shù)據(jù)資源不斷融合,數(shù)據(jù)孤島將繼續(xù)被打破。隨著大數(shù)據(jù)分析能力的不斷提高,人工智能的重要性被逐步提升。當(dāng)今最先進(jìn)的機(jī)器學(xué)習(xí)和人工智能系統(tǒng)正在超越傳統(tǒng)的基于規(guī)則的算法,創(chuàng)建出能夠理解、學(xué)習(xí)、預(yù)測(cè)、適應(yīng),甚至可以自主操作的系統(tǒng)。數(shù)據(jù)服務(wù)數(shù)據(jù)應(yīng)用數(shù)據(jù)分析數(shù)據(jù)治理數(shù)據(jù)平臺(tái)以更加深度的數(shù)據(jù)開放,跨行業(yè)大數(shù)據(jù)關(guān)聯(lián)。以更多樣的應(yīng)用能力,構(gòu)建針對(duì)性行業(yè)解決方案。數(shù)據(jù)平臺(tái)存儲(chǔ)方式向數(shù)據(jù)湖模式轉(zhuǎn)變,多數(shù)據(jù)匯聚。支持結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)多數(shù)據(jù)入湖。入湖即治理,針對(duì)性對(duì)數(shù)據(jù)源系統(tǒng)輸入數(shù)據(jù)制定入湖標(biāo)準(zhǔn)數(shù)據(jù)驅(qū)動(dòng)治理規(guī)范,以數(shù)據(jù)為核心實(shí)時(shí)制定治理規(guī)范。從深度學(xué)習(xí)到機(jī)器學(xué)習(xí),從機(jī)器學(xué)習(xí)到人工智能?;跀?shù)據(jù)湖的大量的原始數(shù)據(jù),深度訓(xùn)練,快速分析智能應(yīng)用,基于AI與機(jī)器學(xué)習(xí)分析,個(gè)性化服務(wù)提供。應(yīng)用快速構(gòu)建,基于數(shù)據(jù)湖進(jìn)行細(xì)粒度的收集、探索和分析數(shù)據(jù)湖數(shù)據(jù)治理數(shù)據(jù)分析數(shù)據(jù)應(yīng)用數(shù)據(jù)服務(wù)數(shù)據(jù)驅(qū)動(dòng)規(guī)范,入湖標(biāo)準(zhǔn)制定人工智能分析,直引湖中數(shù)據(jù)大數(shù)據(jù)發(fā)展趨勢(shì)分析應(yīng)用更加智能,構(gòu)建更加快速深度數(shù)據(jù)開放,針對(duì)方案制定數(shù)據(jù)湖產(chǎn)生背景及概念提出企業(yè)現(xiàn)在正處于大數(shù)據(jù)的“焦慮期”存儲(chǔ)成本問題:海量數(shù)據(jù)需要在多環(huán)境、多級(jí)下重復(fù)存儲(chǔ),存儲(chǔ)開銷大數(shù)據(jù)形態(tài)問題:應(yīng)用大多聚焦在經(jīng)過(guò)加工后的再生數(shù)據(jù),原始數(shù)據(jù)無(wú)法得到充分利用業(yè)務(wù)響應(yīng)問題:必須事先進(jìn)行充分規(guī)劃和較長(zhǎng)周期加工,欠缺運(yùn)營(yíng)所需的靈活性和時(shí)效性數(shù)據(jù)集市數(shù)據(jù)湖問題?挑戰(zhàn)?變革!數(shù)據(jù)湖一詞是2011年由Pentaho首席技術(shù)官詹姆斯

迪克森最初提出的,參照“數(shù)據(jù)集市”得來(lái)。較小的數(shù)據(jù)存儲(chǔ)庫(kù)如同瓶裝水,經(jīng)過(guò)過(guò)濾包裝結(jié)構(gòu)化后以供使用數(shù)據(jù)來(lái)源于不同地方如同湖泊,存儲(chǔ)更自然狀態(tài)下的大量的水預(yù)先設(shè)定問題使用方式單一集中存儲(chǔ)+無(wú)限能力用戶各取所需把不同結(jié)構(gòu)的數(shù)據(jù)統(tǒng)一存儲(chǔ),使不同數(shù)據(jù)有一致的存儲(chǔ)方式,在使用時(shí)方便連接,真正解決數(shù)據(jù)集成問題。全部采集(CollectEverything)隨處研究(DiveInAnywhere)靈活訪問(FlexibleAccess)數(shù)據(jù)湖的定義與特性存儲(chǔ)一切,分析一切,創(chuàng)建所需數(shù)據(jù)湖(DataLake)核心思想

把你以前在磁帶上擁有的東西倒入到數(shù)據(jù)湖,然后開始探索該數(shù)據(jù)。重要的

只把需要的數(shù)據(jù)倒入到Hadoop;如果你想結(jié)合來(lái)自數(shù)據(jù)湖的信息和客戶關(guān)系

管理系統(tǒng)(CRM)里面的信息,我們就進(jìn)行連接,只有需要時(shí)才執(zhí)行這番數(shù)

據(jù)結(jié)合。

數(shù)據(jù)湖是一種在系統(tǒng)或存儲(chǔ)庫(kù)中以自然格式存儲(chǔ)數(shù)據(jù)的方法,它有助于以各種

模式和結(jié)構(gòu)形式配置數(shù)據(jù),通常是對(duì)象塊或文件。湖中的數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)

從關(guān)系數(shù)據(jù)庫(kù)(行和列),半結(jié)構(gòu)化數(shù)據(jù)(CSV、XML、JSON的日志),非

結(jié)構(gòu)化數(shù)據(jù)(電子郵件,文檔,PDF)和二進(jìn)制數(shù)據(jù)(圖像、音頻、視頻)從

而形成一個(gè)集中式數(shù)據(jù)存儲(chǔ)容納所有形式的數(shù)據(jù)。詹姆斯·迪克森維基百科從對(duì)比中理解數(shù)據(jù)湖概念—優(yōu)勢(shì)篇對(duì)比項(xiàng)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)湖支持?jǐn)?shù)據(jù)類型有限的數(shù)據(jù)類型支持,以結(jié)構(gòu)化為主支持結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)采集方式過(guò)程開始于業(yè)務(wù)流程識(shí)別,通常由數(shù)據(jù)管理者和業(yè)務(wù)負(fù)責(zé)人基于數(shù)據(jù)和業(yè)務(wù)的某種假設(shè)在數(shù)據(jù)湖世界里,沒有關(guān)于已經(jīng)取得的數(shù)據(jù)假設(shè)。一旦數(shù)據(jù)發(fā)生,即開始在細(xì)粒度級(jí)別收集數(shù)據(jù)。業(yè)務(wù)流程發(fā)現(xiàn)基于數(shù)據(jù)與輸入數(shù)據(jù)數(shù)據(jù)處理能力寫入模式,建立模型對(duì)數(shù)據(jù)進(jìn)行某類格式和結(jié)構(gòu)的處理,為了減少數(shù)據(jù)的復(fù)雜性,比較難于實(shí)現(xiàn)上卷(Rollup)和鉆取(Drilldown)分析,該設(shè)計(jì)可能需要妥協(xié)一定粒度的數(shù)據(jù)讀取模式,接受原始形式的數(shù)據(jù),在數(shù)據(jù)細(xì)粒度級(jí)別收集、探索和分析非常簡(jiǎn)單架構(gòu)重建能力數(shù)據(jù)庫(kù)架構(gòu)演變需要謹(jǐn)慎,過(guò)程耗時(shí),成本較高,影響較大,需要對(duì)原有數(shù)據(jù)進(jìn)行重構(gòu)不存在結(jié)構(gòu)問題,支持復(fù)雜數(shù)據(jù)類型,便于重置數(shù)據(jù)模型、查詢和應(yīng)用,并具有簡(jiǎn)單的重建關(guān)系的能力動(dòng)態(tài)性敏捷性差,采用靜態(tài)固定配置,基于業(yè)務(wù)流程驅(qū)動(dòng)而設(shè)計(jì)系統(tǒng)高度敏捷,動(dòng)態(tài)靈活配置,基于數(shù)據(jù)的業(yè)務(wù)流程定義擴(kuò)展性提供預(yù)定義的業(yè)務(wù)需求點(diǎn)燃創(chuàng)新和新的商業(yè)機(jī)會(huì)從對(duì)比中理解數(shù)據(jù)湖概念—劣勢(shì)篇對(duì)比項(xiàng)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)湖數(shù)據(jù)規(guī)劃體系具有周密的數(shù)據(jù)發(fā)現(xiàn)、采集、探索和轉(zhuǎn)換的數(shù)據(jù)計(jì)劃,易于突顯數(shù)據(jù)價(jià)值不太重視事先的數(shù)據(jù)規(guī)劃,允許存儲(chǔ)任何數(shù)據(jù),難以抓取數(shù)據(jù)價(jià)值數(shù)據(jù)利用效率數(shù)據(jù)利用率高,按數(shù)據(jù)優(yōu)先級(jí)和數(shù)據(jù)可用性的大小進(jìn)行組織,可以快速定位所需數(shù)據(jù)數(shù)據(jù)利用率低,缺少數(shù)據(jù)優(yōu)先級(jí)排序,需要花費(fèi)大量時(shí)間查找和分析前的準(zhǔn)備數(shù)據(jù)需求響應(yīng)能力具有較高的需求響應(yīng)能力,可以保證平穩(wěn)高效的數(shù)據(jù)訪問數(shù)據(jù)響應(yīng)延遲較高,整個(gè)分析過(guò)程容易中斷復(fù)雜性和難度較低,建設(shè)規(guī)模與成本可控很高,建設(shè)難度與規(guī)模呈線性增長(zhǎng)趨勢(shì),隱性成本較高邏輯可解釋性數(shù)據(jù)組織邏輯性強(qiáng),數(shù)據(jù)關(guān)系可解釋性較高欠缺語(yǔ)義一致性和嚴(yán)格的元數(shù)據(jù),數(shù)據(jù)關(guān)系較為松散,難以解釋安全性多年發(fā)展歷程,保護(hù)數(shù)據(jù)的能力比較成熟比較新的技術(shù),需要持續(xù)完善適用對(duì)象企業(yè)的業(yè)務(wù)行家和專業(yè)人員,技術(shù)門檻低面向熟練用戶、科學(xué)領(lǐng)域的數(shù)據(jù)科學(xué)家,技術(shù)門檻高潛在風(fēng)險(xiǎn)數(shù)據(jù)湖數(shù)據(jù)沼澤數(shù)據(jù)湖是大數(shù)據(jù)概念的延伸多樣化的數(shù)據(jù)存儲(chǔ)高效的數(shù)據(jù)處理存儲(chǔ)全部數(shù)據(jù)處理任何數(shù)據(jù)訪問任何數(shù)據(jù)數(shù)據(jù)能力要求支持所有用戶更容易適應(yīng)變化更快的洞悉能力IT能力要求數(shù)據(jù)湖的能力視圖數(shù)據(jù)湖并非是個(gè)全新概念“數(shù)據(jù)湖”是關(guān)于企業(yè)應(yīng)用大數(shù)據(jù)的概念,是面向企業(yè)的最佳的大數(shù)據(jù)的解決方案“數(shù)據(jù)湖”不僅是數(shù)據(jù)存儲(chǔ)和處理的單元,也是釋放數(shù)據(jù)價(jià)值的過(guò)程企業(yè)大數(shù)據(jù)應(yīng)用成功的關(guān)鍵并不是存儲(chǔ)所有的數(shù)據(jù),而是要?jiǎng)?chuàng)建一個(gè)更有意義的“數(shù)據(jù)湖”,幫助企業(yè)加速提取高價(jià)值數(shù)據(jù)的速度數(shù)據(jù)湖是大數(shù)據(jù)發(fā)展方向上的高級(jí)階段,是一種建設(shè)理念,而不是一種特定的實(shí)施方法“數(shù)據(jù)湖”是個(gè)架構(gòu)概念,是數(shù)據(jù)倉(cāng)庫(kù)的一種演進(jìn),是一種大數(shù)據(jù)概念下的延伸數(shù)據(jù)湖概念上的甄別1、用于安置企業(yè)所有數(shù)據(jù)的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市2、替代運(yùn)營(yíng)數(shù)據(jù)存儲(chǔ)(ODS)3、高性能的生產(chǎn)環(huán)境4、生產(chǎn)型報(bào)表的應(yīng)用程序5、一個(gè)專門建立的系統(tǒng)來(lái)解決一個(gè)特定的問題(盡管專門建立的數(shù)據(jù)集市可以從數(shù)據(jù)湖中提供)1、用戶可以訪問大量原始數(shù)據(jù)的環(huán)境2、一個(gè)開發(fā)和驗(yàn)證分析模型的環(huán)境,然后將其轉(zhuǎn)化為生產(chǎn)3、用于探索數(shù)據(jù)以獲得洞察力的分析沙箱4、企業(yè)級(jí)目錄,可幫助用戶查找數(shù)據(jù)并將業(yè)務(wù)術(shù)語(yǔ)與技術(shù)元數(shù)據(jù)鏈接起來(lái)5、一個(gè)支持重用數(shù)據(jù)轉(zhuǎn)換和查詢的環(huán)境數(shù)據(jù)湖是……數(shù)據(jù)湖不是……數(shù)據(jù)湖體系的架構(gòu)規(guī)劃Hadoop不一定是數(shù)據(jù)湖的組成部分,只是它是目前最理想的選擇!數(shù)據(jù)湖的邏輯架構(gòu)數(shù)據(jù)湖的數(shù)據(jù)架構(gòu)持久層(PersitentLayer):存放所有從和外部獲取的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)分析沙箱(AnalyticsSandbox):數(shù)據(jù)科學(xué)家和分析師被授予持久層的訪問權(quán)限并使用進(jìn)行數(shù)據(jù)研究和實(shí)驗(yàn)探索數(shù)據(jù)源(Curated):數(shù)據(jù)分析師會(huì)將有商業(yè)價(jià)值的數(shù)據(jù)進(jìn)行處理并創(chuàng)建新的數(shù)據(jù)源以提供給業(yè)務(wù)分析師可操作層(Operationallayer):業(yè)務(wù)分析師繼續(xù)精煉已處理過(guò)的數(shù)據(jù),和數(shù)據(jù)管理團(tuán)隊(duì)一起將這些數(shù)據(jù)轉(zhuǎn)換為更為容易操作和使用的數(shù)據(jù),存放之以便得到更廣泛的使用數(shù)據(jù)湖建設(shè)的四個(gè)階段整合數(shù)據(jù)湖基礎(chǔ)設(shè)施可擴(kuò)展的數(shù)據(jù)處理和攝入數(shù)據(jù)目錄管理趨于完善EDW與DataLake協(xié)作對(duì)外生產(chǎn)價(jià)值輸送能力數(shù)據(jù)服務(wù)和運(yùn)營(yíng)管理能力端到端的業(yè)務(wù)支撐能力穩(wěn)定的成熟度服務(wù)架構(gòu)靈活完善的企業(yè)運(yùn)營(yíng)模式分析能力增強(qiáng)優(yōu)化探索環(huán)境豐富價(jià)值發(fā)現(xiàn)模型價(jià)值挖掘階段基礎(chǔ)架構(gòu)階段成熟運(yùn)營(yíng)階段協(xié)作交互階段01020304大多數(shù)企業(yè)處于前三個(gè)階段的建設(shè)和完善過(guò)程中……建設(shè)難點(diǎn)與風(fēng)險(xiǎn)數(shù)據(jù)湖關(guān)鍵點(diǎn)數(shù)據(jù)湖體系的建設(shè)要點(diǎn)與風(fēng)險(xiǎn)分析靈活自動(dòng)化的采集與存儲(chǔ)組織和編目數(shù)據(jù)管理統(tǒng)一的透明訪問方式數(shù)據(jù)質(zhì)量和可靠性無(wú)感知的分布式架構(gòu)(存儲(chǔ)、計(jì)算、網(wǎng)絡(luò))企業(yè)全局?jǐn)?shù)據(jù)的掌握與預(yù)測(cè)統(tǒng)一元數(shù)據(jù)規(guī)范和管控能力業(yè)務(wù)關(guān)聯(lián)場(chǎng)景的數(shù)據(jù)理解系統(tǒng)化的質(zhì)量管控體系分布技術(shù)的規(guī)劃和擴(kuò)展能力參考:來(lái)自實(shí)踐中數(shù)據(jù)湖建設(shè)內(nèi)容目錄背景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念1生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式3共享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃4運(yùn)營(yíng):大數(shù)據(jù)湖一體化運(yùn)營(yíng)管理建設(shè)5體系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路2生產(chǎn)型系統(tǒng)分析型系統(tǒng)數(shù)據(jù)接入數(shù)據(jù)存儲(chǔ)生產(chǎn)數(shù)據(jù)(1+N)操作/臨時(shí)存儲(chǔ)原生數(shù)據(jù)(1+N)就近/分域存儲(chǔ)應(yīng)用數(shù)據(jù)(N)分區(qū)建設(shè)應(yīng)用計(jì)算處理整合數(shù)據(jù)(1)全網(wǎng)/分層支撐協(xié)同計(jì)算引擎實(shí)時(shí)檢索和流處理引擎結(jié)構(gòu)化數(shù)據(jù)(數(shù)據(jù)庫(kù)/格式文件等)半結(jié)構(gòu)化數(shù)據(jù)(XML/TXT等)非結(jié)構(gòu)化數(shù)據(jù)(語(yǔ)音、視頻等)統(tǒng)一索引層計(jì)算側(cè)cache生產(chǎn)系統(tǒng)駐留統(tǒng)一接入配置生態(tài)圈系統(tǒng)PB級(jí)存儲(chǔ)OracleMySqlHDFSHbaseGreenplumTXTTB級(jí)計(jì)算訪問共享API數(shù)據(jù)沙箱訪問接口(JDBC、ODBC)同源異構(gòu)訪問挖掘工具交互分析OLAP應(yīng)用構(gòu)建工具生產(chǎn)直采前置采集存儲(chǔ)計(jì)算加速離線批處理引擎交互式查詢引擎計(jì)算資源調(diào)度IOT接入BSSOSSMSS網(wǎng)絡(luò)/平臺(tái)生態(tài)圈同步鏡像運(yùn)營(yíng)管控采集接入規(guī)范源數(shù)據(jù)提供規(guī)范數(shù)據(jù)分類規(guī)范數(shù)據(jù)模型規(guī)范元字典規(guī)范資源申請(qǐng)規(guī)范計(jì)算調(diào)度規(guī)范訪問接入規(guī)范數(shù)據(jù)共享標(biāo)準(zhǔn)生產(chǎn)模型規(guī)范數(shù)據(jù)湖統(tǒng)一目錄<統(tǒng)一服務(wù)數(shù)據(jù)集>邏輯化視圖緩存加速統(tǒng)一數(shù)據(jù)服務(wù)代理(DataBroker)統(tǒng)一數(shù)據(jù)接入跨架構(gòu)數(shù)據(jù)聯(lián)邦存儲(chǔ)規(guī)范數(shù)據(jù)安全規(guī)范角色權(quán)限規(guī)范運(yùn)營(yíng)管理規(guī)范資源池化

彈性伸縮自動(dòng)調(diào)度

按需使用應(yīng)用專區(qū)省分專區(qū)生態(tài)圈專區(qū)…源端系統(tǒng)可視化定義

即配即用透明化部署

實(shí)時(shí)接入調(diào)度平臺(tái)工具外部系統(tǒng)互聯(lián)網(wǎng)合作伙伴大吞吐管道服務(wù)對(duì)象外部系統(tǒng)互聯(lián)網(wǎng)網(wǎng)絡(luò)爬蟲主數(shù)據(jù)(1)全網(wǎng)統(tǒng)一大數(shù)據(jù)湖體系規(guī)劃大數(shù)據(jù)湖存儲(chǔ)能力規(guī)劃——統(tǒng)一標(biāo)準(zhǔn)/分區(qū)存儲(chǔ)制定全集團(tuán)統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),采取分域分類的數(shù)據(jù)入湖策略,構(gòu)建生產(chǎn)、原生、整合/應(yīng)用、專區(qū)等分區(qū)數(shù)據(jù)存儲(chǔ)及計(jì)算能力,實(shí)現(xiàn)數(shù)據(jù)原生入湖、按需使用的宗旨,為全國(guó)1+31省提供應(yīng)用數(shù)據(jù)服務(wù)能力,注智生產(chǎn)激發(fā)生產(chǎn)力。數(shù)據(jù)存儲(chǔ)數(shù)據(jù)接入數(shù)據(jù)訪問運(yùn)營(yíng)管理數(shù)據(jù)計(jì)算計(jì)算資源管理資源池化,彈性技術(shù)自動(dòng)調(diào)度,按需使用實(shí)時(shí)流式離線批量?jī)?nèi)存計(jì)算及緩存機(jī)器學(xué)習(xí)交互式查詢協(xié)同計(jì)算非結(jié)構(gòu)化計(jì)算存儲(chǔ)資源管理結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)(日志/XML文件等)非結(jié)構(gòu)化數(shù)據(jù)(文件/圖片/音頻/視頻等)省份專區(qū)生態(tài)圈專區(qū)內(nèi)蒙生產(chǎn)數(shù)據(jù)區(qū)原生數(shù)據(jù)區(qū)整合數(shù)據(jù)區(qū)實(shí)體關(guān)聯(lián)視圖主數(shù)據(jù)區(qū)省份B/O側(cè)生產(chǎn)系統(tǒng)集團(tuán)橫向系統(tǒng)生態(tài)圈生產(chǎn)系統(tǒng)網(wǎng)絡(luò)/平臺(tái)生產(chǎn)系統(tǒng)(前置預(yù)處理)編碼統(tǒng)一轉(zhuǎn)換實(shí)體對(duì)齊客戶產(chǎn)品渠道營(yíng)銷資源服務(wù)自然人貴州河北遼寧寧夏…互聯(lián)網(wǎng)金融智能連接智慧家庭物聯(lián)網(wǎng)新興ICT人員組織資源產(chǎn)品客戶…BSS原生數(shù)據(jù)OSS原生數(shù)據(jù)MSS原生數(shù)據(jù)網(wǎng)絡(luò)/平臺(tái)數(shù)據(jù)集團(tuán)橫向數(shù)據(jù)生態(tài)圈-ICT生態(tài)圈-金融…存儲(chǔ)分區(qū)原則:生產(chǎn)數(shù)據(jù)區(qū):遵循電信集團(tuán)數(shù)據(jù)建模標(biāo)準(zhǔn)及主數(shù)據(jù)規(guī)范要求;規(guī)范層面屬于大數(shù)據(jù)湖范疇,物理資源層面可采用湖資源也可自建;原生數(shù)據(jù)區(qū):分域分類存儲(chǔ)生產(chǎn)數(shù)據(jù);將非標(biāo)準(zhǔn)數(shù)據(jù)做標(biāo)準(zhǔn)化轉(zhuǎn)化;整合數(shù)據(jù)區(qū):采用大數(shù)據(jù)挖掘等技術(shù)進(jìn)行實(shí)體歸集補(bǔ)全;構(gòu)建實(shí)體關(guān)聯(lián)視圖;主數(shù)據(jù)區(qū):存儲(chǔ)企業(yè)級(jí)全網(wǎng)主數(shù)據(jù),大數(shù)據(jù)主數(shù)據(jù)唯一提供者;應(yīng)用專區(qū):本著數(shù)據(jù)不出湖,充分挖掘數(shù)據(jù)價(jià)值原則,為使用者提供基于自有、原生、整合數(shù)據(jù)的處理空間,面向應(yīng)用開展數(shù)據(jù)處理工作;大數(shù)據(jù)湖原生數(shù)據(jù)區(qū)規(guī)劃——原生入湖/分類存儲(chǔ)/按需使用以原生入湖分類存儲(chǔ)按需使用為宗旨,分域分類存儲(chǔ)按周期存儲(chǔ)原生數(shù)據(jù),為云公司、集團(tuán)ODS、省份大數(shù)據(jù)平臺(tái)提供原生數(shù)據(jù)共享服務(wù),為湖內(nèi)整合數(shù)據(jù)區(qū)、應(yīng)用數(shù)據(jù)區(qū)提供原生數(shù)據(jù)服務(wù)。原生數(shù)據(jù)區(qū)生態(tài)圈數(shù)據(jù)網(wǎng)絡(luò)/平臺(tái)數(shù)據(jù)集團(tuán)橫向數(shù)據(jù)BSS數(shù)據(jù)OSS數(shù)據(jù)MSS數(shù)據(jù)EDA數(shù)據(jù)共享服務(wù)數(shù)據(jù)生產(chǎn)系統(tǒng)BSS系統(tǒng)OSS系統(tǒng)MSS系統(tǒng)EDA系統(tǒng)集團(tuán)橫向系統(tǒng)生態(tài)圈系統(tǒng)…網(wǎng)絡(luò)/平臺(tái)系統(tǒng)原生入湖預(yù)處理入湖數(shù)據(jù)共享原生數(shù)據(jù)專區(qū)共享原生數(shù)據(jù)整合共享數(shù)據(jù)整合區(qū)數(shù)據(jù)專區(qū)實(shí)體關(guān)聯(lián)視圖共享互聯(lián)網(wǎng)金融智能連接智慧家庭物聯(lián)網(wǎng)新興ICT應(yīng)用枝繁葉茂類翼支付甜橙欺詐盾IWIFI統(tǒng)一賬號(hào)NFC產(chǎn)品4G-QoS云堤流量控海洋衛(wèi)星寬帶天翼網(wǎng)關(guān)智能組網(wǎng)視頻通話聚精彩車管專家樂駕天翼云盤企業(yè)云189郵箱翼校通翼機(jī)通+天翼對(duì)講旺鋪助手外勤助手號(hào)簿助手手機(jī)看店愛音樂天翼視訊天翼閱讀愛游戲愛動(dòng)漫天翼空間易信新視通4G家庭云安全辦公專屬云加密通道影像云21CN地產(chǎn)大數(shù)據(jù)語(yǔ)音云旅游大數(shù)據(jù)移動(dòng)感知DPI4G分組域話單固網(wǎng)DPI日志留存DPIOIDDMR/CDRPM/CM智能網(wǎng)管電渠悅ME商機(jī)行業(yè)短信ODMS量化微信易信號(hào)百4G數(shù)據(jù)集約積分政企KPI渠道終端…CRM計(jì)費(fèi)客戶服務(wù)PPMVSOP…綜合資源采購(gòu)輔助財(cái)務(wù)輔助工程輔助ERP人力久其裝維EDA直采省+集團(tuán)電渠服務(wù)量省份專區(qū)生態(tài)圈專區(qū)…實(shí)體關(guān)聯(lián)視圖編碼標(biāo)準(zhǔn)化實(shí)體對(duì)齊移動(dòng)/固網(wǎng)DPIOIDDMR/CDRCM/CP計(jì)費(fèi)詳單HANA數(shù)據(jù)ODMS翼支付集約積分…主數(shù)據(jù)區(qū)大數(shù)據(jù)湖整合數(shù)據(jù)區(qū)規(guī)劃——構(gòu)建企業(yè)級(jí)核心實(shí)體關(guān)聯(lián)視圖保存原子性:整合數(shù)據(jù)區(qū)數(shù)據(jù)不做聚合操作,保持?jǐn)?shù)據(jù)原子性,不影響專區(qū)應(yīng)用指標(biāo)加工處理;實(shí)體補(bǔ)齊性:對(duì)核心實(shí)體根據(jù)不同原生數(shù)據(jù)進(jìn)行屬性補(bǔ)齊;實(shí)體關(guān)聯(lián)性:面向?qū)嶓w全業(yè)務(wù)流程數(shù)據(jù),整合各域數(shù)據(jù)實(shí)現(xiàn)實(shí)體跨域關(guān)聯(lián)視圖;共享一致性:按照湖應(yīng)用的使用需求進(jìn)行共性提煉,實(shí)現(xiàn)統(tǒng)一的公共寬表建設(shè);整合數(shù)據(jù)區(qū)完成數(shù)據(jù)清洗、編碼轉(zhuǎn)換、實(shí)體對(duì)齊及構(gòu)建企業(yè)級(jí)核心實(shí)體關(guān)聯(lián)視圖,為應(yīng)用專區(qū)提供整合數(shù)據(jù)服務(wù)。整合數(shù)據(jù)區(qū)保持?jǐn)?shù)據(jù)原子性粒度,不對(duì)數(shù)據(jù)做聚合處理,不影響業(yè)務(wù)專區(qū)業(yè)務(wù)指標(biāo)加工處理。實(shí)體對(duì)齊實(shí)體關(guān)聯(lián)視圖參與營(yíng)銷活動(dòng)產(chǎn)品訂購(gòu)資源配給上門服務(wù)用戶投訴修障維護(hù)用戶使用存量經(jīng)營(yíng)用戶出賬產(chǎn)品實(shí)體跨域關(guān)聯(lián)視圖構(gòu)建BSS數(shù)據(jù)客戶信息訂購(gòu)信息OSS數(shù)據(jù)MSS數(shù)據(jù)網(wǎng)絡(luò)/平臺(tái)裝維信息開通信息傭金結(jié)算成本信息用戶投訴率行為數(shù)據(jù)質(zhì)量數(shù)據(jù)消費(fèi)信息服務(wù)信息資源數(shù)據(jù)報(bào)障數(shù)據(jù)財(cái)務(wù)收入補(bǔ)貼數(shù)據(jù)客戶產(chǎn)品渠道營(yíng)銷資源服務(wù)合作伙伴核心實(shí)體自然人…CP/SP訂購(gòu)位置信息自然人員工組織地域政企客戶合作伙伴數(shù)據(jù)清洗外部數(shù)據(jù)管理規(guī)則管理實(shí)體沉淀聚合管理沖突管理大數(shù)據(jù)湖應(yīng)用數(shù)據(jù)專區(qū)規(guī)劃——面向應(yīng)用的自建自維數(shù)據(jù)專區(qū)獨(dú)立性:保證資源獨(dú)立性、數(shù)據(jù)獨(dú)立性、應(yīng)用獨(dú)立性;可用性:保證存儲(chǔ)、計(jì)算、數(shù)據(jù)資源高可用性及穩(wěn)定性;確保專區(qū)資源可在線、平

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論