大數(shù)據(jù)管理中心設(shè)計規(guī)劃方案相關(guān)兩份資料_第1頁
大數(shù)據(jù)管理中心設(shè)計規(guī)劃方案相關(guān)兩份資料_第2頁
大數(shù)據(jù)管理中心設(shè)計規(guī)劃方案相關(guān)兩份資料_第3頁
大數(shù)據(jù)管理中心設(shè)計規(guī)劃方案相關(guān)兩份資料_第4頁
大數(shù)據(jù)管理中心設(shè)計規(guī)劃方案相關(guān)兩份資料_第5頁
已閱讀5頁,還剩89頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)管理中心規(guī)劃設(shè)計方案目錄2整體規(guī)劃方案關(guān)鍵能力實現(xiàn)方案實施方案背景與需求分析大數(shù)據(jù)已成為城市治理的必要基礎(chǔ)大數(shù)據(jù)里有民意有民心用大數(shù)據(jù)改善政府服務(wù)、更好滿足群眾需求要依托互聯(lián)網(wǎng)、大數(shù)據(jù)優(yōu)化再造政府辦事流程同時也要加強(qiáng)數(shù)據(jù)安全保護(hù)智慧型政府善政惠民興業(yè)城市大數(shù)據(jù)科學(xué)管理精準(zhǔn)調(diào)控高效協(xié)同……服務(wù)民生拉動產(chǎn)業(yè)孵化創(chuàng)新……依托長遠(yuǎn)規(guī)劃

立足城市服務(wù)

構(gòu)建價值平臺?公共數(shù)據(jù)共享?社會數(shù)據(jù)協(xié)同?數(shù)據(jù)服務(wù)開放?社會治理?宏觀經(jīng)濟(jì)?市場監(jiān)管?生態(tài)保護(hù)?促進(jìn)產(chǎn)業(yè)發(fā)展?拉動數(shù)字經(jīng)濟(jì)優(yōu)化城市資源配給 促進(jìn)城市科學(xué)管理?應(yīng)急響應(yīng)?事件預(yù)防統(tǒng)一匯聚

推動業(yè)務(wù)數(shù)據(jù)協(xié)同?形成統(tǒng)一的跨部門、跨地域、跨層級的信息交換共享房產(chǎn)局房產(chǎn)交易所?購房資格審核?交易手續(xù)確認(rèn)?購房能力評估?……稅務(wù)局住建委人社公安?稅收審核?稅收繳納?社保年限?繳納金額?房產(chǎn)評估?人戶核實?戶口遷轉(zhuǎn)民政?婚姻狀況大數(shù)據(jù)平臺人社數(shù)據(jù)民政數(shù)據(jù)稅務(wù)數(shù)據(jù)金融信貸數(shù)據(jù)人員戶口數(shù)據(jù)……促進(jìn)數(shù)據(jù)聯(lián)動協(xié)同構(gòu)建數(shù)據(jù)支持體系?逐步實現(xiàn)立體化、多層次、全方位的數(shù)據(jù)服務(wù)體系?有效支持電子政務(wù)公共服務(wù)能力提升橫向協(xié)同縱向聯(lián)動市級單位區(qū)級單位社會企業(yè)價值提煉

支撐精準(zhǔn)服務(wù)與科學(xué)管理宏觀數(shù)據(jù)分析應(yīng)用城市人口分析規(guī)劃?人口遷移分析?人群特征分析?人群發(fā)展預(yù)測?……社會安防環(huán)保數(shù)據(jù)金融數(shù)據(jù)公共服務(wù)交通數(shù)據(jù)醫(yī)療數(shù)據(jù)社保數(shù)據(jù)公共安全分析預(yù)測?建筑安全評估?人流分析預(yù)警?……生態(tài)環(huán)境分析研判?大氣污染分析?水質(zhì)資源分析?…………大數(shù)據(jù)平臺資源領(lǐng)導(dǎo)決策政策研究資源投放算法算力存儲……實時感知

輔助城市治理高效運行市公安物業(yè)單位運營商市急救中心大數(shù)據(jù)平臺事件感知&實時處理消防部門?消防接警?消防出警?救護(hù)車資源調(diào)撥?急救醫(yī)護(hù)資源調(diào)撥?事故路段增派人手?沿途路線道路疏通?疏散建筑人群?檢查應(yīng)急通道?短信通知涉事區(qū)域人員?實時監(jiān)控區(qū)域人流實時感知策略研判實時傳遞協(xié)同處置數(shù)據(jù)互補(bǔ)

以數(shù)據(jù)供給促產(chǎn)業(yè)發(fā)展人口庫法人庫電子證照庫空間地理庫公共數(shù)據(jù)航空公司延誤旅客數(shù)據(jù)大數(shù)據(jù)平臺市級數(shù)據(jù)庫個人信用評級社會數(shù)據(jù)公共—社會數(shù)據(jù)相互促進(jìn)金融機(jī)構(gòu)出行數(shù)據(jù)個人征信數(shù)據(jù)保險公司航班延誤險定價小型金融機(jī)構(gòu)個人信用評估個人征信數(shù)據(jù)延誤旅客數(shù)據(jù)分析現(xiàn)有平臺現(xiàn)狀,補(bǔ)足能力短板BDACE數(shù)據(jù)歸集的頻度無法滿足業(yè)務(wù)協(xié)同需要未規(guī)劃數(shù)據(jù)實時采集技術(shù),無法支撐高效業(yè)務(wù)協(xié)同城市精細(xì)化管理缺乏基礎(chǔ)數(shù)據(jù)保障數(shù)據(jù)共享和開放能力不全面,應(yīng)用創(chuàng)新動能不足安全管控能力待提升數(shù)據(jù)授權(quán)、使用、審計的全生命周期管控存在短板,數(shù)據(jù)的安全防護(hù)有待提升未實現(xiàn)數(shù)據(jù)的統(tǒng)一運營,管理及維護(hù)難度過高設(shè)備、平臺、數(shù)據(jù)規(guī)模高速增長,難于實施高效數(shù)據(jù)治理,

無法及時發(fā)現(xiàn)、診斷及解決問題源端數(shù)據(jù)標(biāo)準(zhǔn)各異,加工存在技術(shù)壁壘湖&庫缺乏統(tǒng)一規(guī)劃,數(shù)據(jù)標(biāo)準(zhǔn)還需完善應(yīng)用支撐能力較為薄弱,容易形成數(shù)據(jù)沼澤目錄10整體規(guī)劃方案關(guān)鍵能力實現(xiàn)方案實施方案背景與需求分析大數(shù)據(jù)資源平臺目標(biāo)體系規(guī)劃數(shù)據(jù)標(biāo)準(zhǔn)資源目錄安全體系整合數(shù)據(jù)能力賦能智慧運營政策法規(guī)運營策略打造信息化樞紐平臺能力統(tǒng)一管控技術(shù)平臺逐步實現(xiàn)數(shù)據(jù)能力規(guī)模發(fā)展圍繞城市治理提供全產(chǎn)業(yè)鏈服務(wù)數(shù)據(jù)聯(lián)動數(shù)據(jù)匯聚管理制度大數(shù)據(jù)體系數(shù)據(jù)治理AI服務(wù)業(yè)務(wù)服務(wù)數(shù)據(jù)服務(wù)促進(jìn)大數(shù)據(jù)供給側(cè)改革,圍繞大數(shù)據(jù)各項能力開放,推動數(shù)據(jù)應(yīng)用創(chuàng)新發(fā)展,激發(fā)數(shù)據(jù)價值整合現(xiàn)有公共數(shù)據(jù)資源,布局行業(yè)數(shù)據(jù)引入,逐步形成城市數(shù)據(jù)樞紐搭建數(shù)據(jù),業(yè)務(wù),智慧三大中臺,與行業(yè)先進(jìn)技術(shù)保持同步演進(jìn);打造城市數(shù)據(jù)運營、事件管理等數(shù)字孿生技術(shù)能力1數(shù)據(jù)匯聚3服務(wù)賦能2技術(shù)驅(qū)動建設(shè)目標(biāo)與思路使能高效協(xié)同,全面優(yōu)化數(shù)據(jù)動態(tài)更新與同步機(jī)制推動公共數(shù)據(jù)完整歸集,按需及時同步和更新公共數(shù)據(jù),形成大數(shù)據(jù)樞紐,保證委辦間政務(wù)協(xié)同驅(qū)動數(shù)據(jù)應(yīng)用,進(jìn)一步完善大數(shù)據(jù)中心主題庫建設(shè)完成主題數(shù)據(jù)庫建設(shè),推動數(shù)據(jù)資源整合及數(shù)據(jù)分析應(yīng)用聚焦服務(wù)賦能,初步構(gòu)建中臺能力開放體系搭建統(tǒng)一流數(shù)據(jù)處理和業(yè)務(wù)中臺,并完善數(shù)據(jù)共享服務(wù)與數(shù)據(jù)分析和可視化服務(wù),提升數(shù)據(jù)共享與開放效能加強(qiáng)數(shù)據(jù)運營,推動全市數(shù)據(jù)統(tǒng)一標(biāo)準(zhǔn)化管理及運維構(gòu)建統(tǒng)一數(shù)據(jù)開發(fā)與調(diào)度,增強(qiáng)數(shù)據(jù)管理能力建立統(tǒng)一數(shù)據(jù)運維和自有的大數(shù)據(jù)組件技術(shù)棧,保障平臺穩(wěn)定運營確保安全可控,完善數(shù)據(jù)安全和平臺安全管控建立完整的平臺安全和數(shù)據(jù)安全管控體系,保障數(shù)據(jù)安全管控13市領(lǐng)導(dǎo)各委辦局分析人員區(qū)政府外部機(jī)構(gòu)公民開發(fā)者運維管理者數(shù)據(jù)層服務(wù)開放層門戶應(yīng)用層非結(jié)構(gòu)化數(shù)據(jù)區(qū)對外開放區(qū)對外數(shù)據(jù)開放脫敏區(qū)數(shù)據(jù)沙箱數(shù)據(jù)沙箱數(shù)據(jù)沙箱視頻數(shù)據(jù)音頻數(shù)據(jù)圖片數(shù)據(jù)……數(shù)據(jù)私有數(shù)據(jù)處理一期升級開放中心一網(wǎng)通辦城運系統(tǒng)運營中心分布式存儲分布式分析數(shù)據(jù)庫RDB存儲緩存存儲采集分發(fā)層數(shù)據(jù)管理元數(shù)據(jù)管理數(shù)據(jù)開發(fā)數(shù)據(jù)質(zhì)量管理數(shù)據(jù)安全安全合規(guī)管理安全配置檢查網(wǎng)絡(luò)安全分析安全事件響應(yīng)敏感數(shù)據(jù)加密敏感數(shù)據(jù)脫敏數(shù)據(jù)泄漏防護(hù)數(shù)據(jù)目錄任務(wù)調(diào)度統(tǒng)一運維數(shù)據(jù)運維平臺運維數(shù)據(jù)標(biāo)注共享中心業(yè)務(wù)中臺服務(wù)規(guī)則定義事件管理AI中臺服務(wù)邊緣計算存儲數(shù)據(jù)實驗區(qū)項目1數(shù)據(jù)項目2數(shù)據(jù)項目n數(shù)據(jù)項目3數(shù)據(jù)經(jīng)濟(jì)運行社會治理二期大數(shù)據(jù)區(qū)實時數(shù)據(jù)區(qū)應(yīng)用租戶應(yīng)用租戶應(yīng)用租戶實時模型實時指標(biāo)實時事件結(jié)構(gòu)化數(shù)據(jù)城市大腦……批量計算流計算挖掘計算計算AI能力(語音識別、人臉識別)深度學(xué)習(xí)(模型訓(xùn)練)離線采集實時采集數(shù)據(jù)采集數(shù)據(jù)源互聯(lián)網(wǎng)爬蟲政務(wù)數(shù)據(jù)(國家、市級、區(qū))公共事業(yè)數(shù)據(jù)行業(yè)數(shù)據(jù)(金融、電信)互聯(lián)網(wǎng)數(shù)據(jù)….物聯(lián)網(wǎng)數(shù)據(jù)(氣象、攝像頭…)流媒體采集數(shù)據(jù)導(dǎo)入上報物聯(lián)網(wǎng)網(wǎng)關(guān)采集準(zhǔn)實時采集圖數(shù)據(jù)庫大數(shù)據(jù)資源平臺功能框架事件服務(wù)數(shù)據(jù)中臺服務(wù)數(shù)據(jù)共享交換服務(wù)分發(fā) 消息查詢下載數(shù)據(jù)分析和可視化服務(wù)數(shù)據(jù)可視化工具數(shù)據(jù)探索工具文件數(shù)據(jù)開放服務(wù)申請/計量合作開發(fā)創(chuàng)新研究共享層(標(biāo)簽、指標(biāo))標(biāo)準(zhǔn)層(主題模型)數(shù)據(jù)湖目錄整體規(guī)劃方案關(guān)鍵能力實現(xiàn)方案實施方案背景與需求分析162.構(gòu)建數(shù)據(jù)中臺核心能力,賦能多樣化應(yīng)用場景統(tǒng)一匯聚推動數(shù)據(jù)共享協(xié)同實時感知支持城市智慧運營價值提煉支持宏觀管理決策數(shù)據(jù)互補(bǔ)政企數(shù)據(jù)互促互進(jìn)? 計算資源的讀寫分離:在TDC、KunDB等數(shù)據(jù)庫中對處理和訪問節(jié)點分離;? 庫的讀寫分離:數(shù)據(jù)處理庫和數(shù)據(jù)訪問庫分離。讀寫分離保障數(shù)據(jù)訪問性能各區(qū)物理隔離保障數(shù)據(jù)安全? 三大區(qū)物理隔離,實現(xiàn)大數(shù)據(jù)資源區(qū)、對外開放區(qū)、實驗區(qū)物理隔離;? 大數(shù)據(jù)資源區(qū)的數(shù)據(jù)湖和市級數(shù)據(jù)庫物理隔離。? 湖內(nèi)各委辦局邏輯隔離? 庫內(nèi)各主題層邏輯隔離數(shù)據(jù)分層,沉淀共性,形成數(shù)據(jù)中臺能力,賦能典型場景202.1.數(shù)據(jù)層整體實現(xiàn)方案-數(shù)據(jù)架構(gòu)? 大數(shù)據(jù)資源平臺支撐數(shù)據(jù)共享交換(生產(chǎn)職能)、數(shù)據(jù)分析、數(shù)據(jù)開放三大核心數(shù)據(jù)服務(wù),包括大數(shù)據(jù)資源區(qū)、對外開放區(qū)和實驗區(qū)三大數(shù)據(jù)區(qū)。? 大數(shù)據(jù)資源區(qū):包括市級數(shù)據(jù)湖和市級數(shù)據(jù)庫兩大數(shù)據(jù)資源- 數(shù)據(jù)湖:主要存放市級政府部門業(yè)務(wù)數(shù)據(jù)庫、未經(jīng)加工的原始業(yè)務(wù)數(shù)據(jù)庫,支持存儲結(jié)構(gòu)化、非結(jié)構(gòu)化等多種類型的數(shù)據(jù),以及用于點對點共享交換數(shù)據(jù)- 市級數(shù)據(jù)庫:主要用于存放經(jīng)過一系列清洗、轉(zhuǎn)換、加載、治理步驟后的高質(zhì)量的政務(wù)數(shù)據(jù)資源,以及全市各部門、各區(qū)政務(wù)共享交換過程中的數(shù)據(jù)。? 對外開放區(qū):主要用于存放對外開放的數(shù)據(jù),通過單獨的對外開發(fā)區(qū)與大數(shù)據(jù)資源區(qū)隔離,可以提供更高級別的數(shù)據(jù)安全保護(hù)。? 實驗區(qū):主要用于存放非正式的用于技術(shù)創(chuàng)新和技術(shù)驗證的實驗數(shù)據(jù)。大數(shù)據(jù)資源區(qū)離線數(shù)據(jù)區(qū)實時數(shù)據(jù)區(qū)市級數(shù)據(jù)庫對外開放區(qū)對外開放脫敏數(shù)據(jù)實驗區(qū)實驗數(shù)據(jù)安全沙箱數(shù)據(jù)市級數(shù)據(jù)湖基礎(chǔ)庫主題庫專題庫結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)指標(biāo)庫2.2.數(shù)據(jù)層整體實現(xiàn)方案-數(shù)據(jù)分層數(shù)據(jù)湖市級數(shù)據(jù)庫ODSDWDDWA基礎(chǔ)庫人口庫法人庫空間地理庫主題庫經(jīng)濟(jì)活動公共事業(yè)社會關(guān)系人口密度貼源數(shù)據(jù)ST專題庫經(jīng)濟(jì)運行監(jiān)測經(jīng)濟(jì)運行預(yù)測宏觀景氣指數(shù)市場主題發(fā)展人口和就業(yè)主體準(zhǔn)入分析產(chǎn)業(yè)結(jié)構(gòu)調(diào)整主體經(jīng)營分析大眾創(chuàng)業(yè)分析中小企業(yè)發(fā)展電子商務(wù)發(fā)展區(qū)域市場發(fā)展人口遷移老齡化及養(yǎng)老流動人口公共安全政務(wù)服務(wù)能力城市綜合體城市立方體城市綜合體-社區(qū)畫像明細(xì)數(shù)據(jù)? ODS層數(shù)據(jù):該層數(shù)據(jù)為數(shù)據(jù)湖落地的貼源數(shù)據(jù),其數(shù)據(jù)結(jié)構(gòu)與政務(wù)應(yīng)用等系統(tǒng)的原始數(shù)據(jù)結(jié)構(gòu)保持一致,是市級數(shù)據(jù)庫的數(shù)據(jù)來源。? DWD層數(shù)據(jù):該層數(shù)據(jù)為數(shù)據(jù)湖貼源數(shù)據(jù)清洗后的明細(xì)數(shù)據(jù)。根據(jù)數(shù)據(jù)標(biāo)準(zhǔn),對貼源數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換,實現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化和一致性。? DWA層數(shù)據(jù):在明細(xì)數(shù)據(jù)進(jìn)行上根據(jù)上層應(yīng)用需要進(jìn)行橫向關(guān)聯(lián)和縱向匯總的共享模型數(shù)據(jù)。? ST層數(shù)據(jù):面向不同應(yīng)用的應(yīng)用結(jié)果數(shù)據(jù)。? 大數(shù)據(jù)資源平臺市級數(shù)據(jù)庫面向不用數(shù)據(jù)應(yīng)用、行業(yè)領(lǐng)域及主題劃分為基礎(chǔ)庫、主題庫、指標(biāo)庫和專題庫,市級數(shù)據(jù)庫和數(shù)據(jù)湖從數(shù)據(jù)層次上劃分為ODS、DWD、DWA和ST等四個主要層次。指標(biāo)庫電子證照庫2.3.大數(shù)據(jù)資源區(qū)實現(xiàn)方案-市級數(shù)據(jù)湖? 市級數(shù)據(jù)湖歸集的數(shù)據(jù)范圍、種類和存儲方式等政務(wù)數(shù)據(jù)公共事業(yè)數(shù)據(jù)行業(yè)數(shù)據(jù)物聯(lián)網(wǎng)數(shù)據(jù)數(shù)據(jù)范圍? 國家政務(wù)數(shù)據(jù):國家下發(fā)的各類政務(wù)數(shù)據(jù);? 市級政務(wù)數(shù)據(jù):市級各委辦局履職過程的提供的各類政務(wù)數(shù)據(jù),包括公安、稅務(wù)等;? 區(qū)縣政務(wù)數(shù)據(jù):補(bǔ)充上報市級沒有的的各類政務(wù)數(shù)據(jù)。? 水電煤:采集城市自來水、電力、煤氣、供熱等公共事業(yè)數(shù)據(jù),此類數(shù)據(jù)是和百姓生活息息相關(guān)的重要民生資源。? 金融行業(yè):整合金融行業(yè)個人、企業(yè)征信數(shù)據(jù);? 電信行業(yè):整合電信運營商個人、企業(yè)位置數(shù)據(jù)、互聯(lián)網(wǎng)內(nèi)容數(shù)據(jù)等關(guān)鍵數(shù)據(jù);? 其它行業(yè):整合其它行業(yè)的優(yōu)質(zhì)數(shù)據(jù)資源。? 攝像頭傳感器:采集城市部署的攝像頭等各類感知設(shè)備提供的基礎(chǔ)數(shù)據(jù)。數(shù)據(jù)特性和數(shù)據(jù)庫數(shù)據(jù)特性數(shù)據(jù)量大數(shù)據(jù)量小結(jié)構(gòu)化數(shù)據(jù)InceptorKundb/ArgoDB非結(jié)構(gòu)化數(shù)據(jù)InceptorHyperbase實時性高KafkaKunDB實時性低Inceptor/KunDBKunDB人口庫學(xué)前階段教育階段工作階段退休階段出生死亡人口標(biāo)簽(出生信息、教育信息、就業(yè)信息、社保信息、納稅信息

…)簇群標(biāo)簽(家庭關(guān)系、交往圈、就業(yè)關(guān)系

…)2.4.大數(shù)據(jù)資源區(qū)實現(xiàn)方案-市級數(shù)據(jù)庫-公共基礎(chǔ)庫? 構(gòu)建全生命周期標(biāo)簽? 建立簇群關(guān)系? 通過對政務(wù)數(shù)據(jù)、社會數(shù)據(jù)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)整合及價值挖掘,構(gòu)建形成人口庫、法人庫、空間地理庫、電子證照庫四大基礎(chǔ)庫的標(biāo)簽體系。政務(wù)數(shù)據(jù)社會數(shù)據(jù)上傳個人電子證照上傳企業(yè)電子證照就業(yè),投資人工作地、活動地等信息注冊地、辦公地等信息電子證照庫提供全市個人電子證照信息空間地理庫法人庫全面立體的展示法人相關(guān)信息? 法人基本信息? 資本與資產(chǎn)? 生產(chǎn)經(jīng)營? 許可、資質(zhì)和榮譽(yù)提供地圖服務(wù)、影像服務(wù)、地名地址服務(wù)、三維服務(wù)與坐標(biāo)轉(zhuǎn)換等功能服務(wù)。? 基礎(chǔ)地理信息 ? 基礎(chǔ)覆被信息? 自然資源? 環(huán)境與生態(tài)AI中臺服務(wù)3.打造全方位的服務(wù)開放能力,使能城市智慧運營服務(wù)開放層數(shù)據(jù)中臺服務(wù)數(shù)據(jù)服

務(wù)數(shù)據(jù)授權(quán)服務(wù)數(shù)據(jù)在線探索數(shù)據(jù)開放服務(wù)同步 異步訂閱 消息智能推薦服務(wù)潛力商圈預(yù)測輿情洞察報表服務(wù)人口熱地圖經(jīng)濟(jì)指標(biāo)報表共享服務(wù)目錄醫(yī)療數(shù)據(jù)交通數(shù)據(jù)……社保數(shù)據(jù)標(biāo)簽服務(wù)基本特征標(biāo)簽消費特征標(biāo)簽互聯(lián)網(wǎng)偏好服務(wù)偏好標(biāo)簽指標(biāo)服務(wù)人口指標(biāo)經(jīng)濟(jì)指標(biāo)財政指標(biāo)業(yè)務(wù)中臺服務(wù)數(shù)據(jù)共享交換服務(wù)數(shù)據(jù)交換服務(wù)數(shù)據(jù)分析可視化服務(wù)自助可視化分析AI服務(wù)(規(guī)劃中)模型訓(xùn)練 模型應(yīng)用數(shù)據(jù)管理業(yè)務(wù)中臺服務(wù)策略中心協(xié)同中心事件中心洞察中心一網(wǎng)通辦公共數(shù)據(jù)同步輿情處置經(jīng)濟(jì)指標(biāo)報表…………一次性建設(shè)持續(xù)性沉淀3.1.5.數(shù)據(jù)分析和可視化服務(wù)實現(xiàn)方案數(shù)據(jù)可視化工具適配異構(gòu)數(shù)據(jù)源,比如:RDB,MPP,Hadoop,NOSQL類型數(shù)據(jù)庫;物理表關(guān)聯(lián)DACP元數(shù)據(jù),快速查詢數(shù)據(jù)字典;支持函數(shù),過程的開發(fā)變異、調(diào)用測試;支持PLSQL的高頻使用功能,比如:自動替換,代碼格式化,執(zhí)行計劃查詢,代碼注釋,事務(wù)提交/回滾,結(jié)果行列轉(zhuǎn)換查看等。支持可視化編輯數(shù)據(jù)庫對象;數(shù)據(jù)查詢跟結(jié)果窗口對應(yīng)展示,多語句多個結(jié)果集,可對敏感數(shù)據(jù)去隱私化;支持功能快捷鍵;支持開發(fā)腳本保存,記錄用戶查詢操作;查詢中斷,關(guān)聯(lián)hadoop資源管理,釋放資源;用戶對擁有權(quán)限的數(shù)據(jù)資源進(jìn)行在線的數(shù)據(jù)探索及數(shù)據(jù)可視化分析。?

數(shù)據(jù)可視化工具:專題數(shù)據(jù),主題數(shù)據(jù)加工完成后,用戶可利用可視化工具在線開發(fā)可視化報表,經(jīng)過測試發(fā)布上線后,對外提供可視化服務(wù);? 數(shù)據(jù)探索工具:用戶通過在線數(shù)據(jù)探索工具對擁有權(quán)限的數(shù)據(jù)進(jìn)行在線自助數(shù)據(jù)查詢,工具記錄訪問日志。

3.3.服務(wù)開放層-AI中臺服務(wù)? AI中臺采用分層設(shè)計方式,根據(jù)不同的業(yè)務(wù)屬性進(jìn)行劃分,保證整體架構(gòu)的合理性、可擴(kuò)展性、可維護(hù)性。? 基礎(chǔ)設(shè)施:提供平臺的所有基礎(chǔ)設(shè)施資源,包括計算資源、存儲資源等,為整個平臺提供基礎(chǔ)支持;? 平臺組件:包括大數(shù)據(jù)平臺、容器平臺,為整個AI云平臺提供基礎(chǔ)運營環(huán)境;? AI平臺:為AI中臺核心業(yè)務(wù)層,包含數(shù)據(jù)管理服務(wù)、模型訓(xùn)練服務(wù)、模型管理服務(wù)推理服務(wù)、資源調(diào)度服務(wù)和運營管理服務(wù)面向業(yè)務(wù)使用人員提供端到端人工智能研發(fā)生產(chǎn)通用能力;? A能力:包含各類人工智能A能力,例如圖像識別能力、視頻分析能力、自然語言理解能力、知識圖譜等;? 業(yè)務(wù)應(yīng)用:包含各類人工智能應(yīng)用,例如人流疏導(dǎo)、環(huán)境治理、智能安防等。業(yè)務(wù)應(yīng)用AI平臺權(quán)限管理運營管理服務(wù)系統(tǒng)管理運營分析安全管理日志管理資源管理應(yīng)用部署資源調(diào)度服務(wù)……基礎(chǔ)設(shè)施人流疏導(dǎo)環(huán)境治理智能安防智能養(yǎng)老……CPU服務(wù)器GPU服務(wù)器FPGA(定制化AI芯片)服務(wù)器存儲網(wǎng)絡(luò)平臺組件資源部署服務(wù)調(diào)度API網(wǎng)關(guān)服務(wù)鑒權(quán)推理服務(wù)……能力適配流量控制數(shù)據(jù)管理服務(wù)任務(wù)管理預(yù)處理數(shù)據(jù)標(biāo)注特征工程模型訓(xùn)練服務(wù)任務(wù)管理訓(xùn)練編排模型訓(xùn)練效果評估模型管理服務(wù)模型文件模型管理能力管理使用申請AI能力圖像能力視頻能力自然語言理解知識圖譜……大數(shù)據(jù)資源平臺容器平臺……4.

打造貫穿生產(chǎn)服務(wù)鏈的全景式數(shù)據(jù)管理體系數(shù)據(jù)管理對象數(shù)據(jù)目錄數(shù)據(jù)對象數(shù)據(jù)字段標(biāo)準(zhǔn)化單詞庫數(shù)據(jù)標(biāo)準(zhǔn)化管理數(shù)據(jù)管理流程數(shù)據(jù)質(zhì)量管理數(shù)據(jù)標(biāo)準(zhǔn)化流程數(shù)據(jù)模型管理流程數(shù)據(jù)質(zhì)量管理流程數(shù)據(jù)安全管理流程數(shù)據(jù)生命周期管理數(shù)據(jù)管理組織元數(shù)據(jù)管理數(shù)據(jù)架構(gòu)師數(shù)據(jù)模型人員運維人員數(shù)據(jù)管理員數(shù)據(jù)管理員數(shù)據(jù)管理工具數(shù)據(jù)規(guī)劃標(biāo)準(zhǔn)定義模型設(shè)計數(shù)據(jù)開發(fā)數(shù)據(jù)采集數(shù)據(jù)創(chuàng)建數(shù)據(jù)使用數(shù)據(jù)歸檔數(shù)據(jù)銷毀通過組織制度、流程、工具支撐全生命周期的數(shù)據(jù)管理4.1.數(shù)據(jù)管理-線上標(biāo)準(zhǔn)規(guī)范約束數(shù)據(jù)加工各個環(huán)節(jié)? 制定數(shù)據(jù)架構(gòu),規(guī)范數(shù)據(jù)分層分類;? 制定存儲架構(gòu),規(guī)范存儲策略。? 制定數(shù)據(jù)開發(fā)規(guī)范? 制定業(yè)務(wù)字段標(biāo)準(zhǔn)? 提供數(shù)據(jù)質(zhì)量檢查規(guī)范,可事中,事后進(jìn)行數(shù)據(jù)稽核,及異常告警。01.事前規(guī)劃03.數(shù)據(jù)運行階段02.數(shù)據(jù)開發(fā)階段數(shù)據(jù)架構(gòu)設(shè)計◆ 字段標(biāo)準(zhǔn),模型字段命名推薦? 英文名;? 中文名;? 業(yè)務(wù)口徑? 脫敏規(guī)則;? 字段類型,精度;……建立數(shù)據(jù)質(zhì)量規(guī)則庫及時性完整性唯一性一致性準(zhǔn)確性合理性存儲架構(gòu)設(shè)計開發(fā)規(guī)范說明唯一性檢查對象實體的唯一性長度檢查命名的長度格式檢查命名的格式檢查首字母約束是否以字母開關(guān)非空約束關(guān)鍵字段是否為空關(guān)系約束輸入關(guān)系檢查定義整體的數(shù)據(jù)架構(gòu)1、制定大數(shù)據(jù)中心數(shù)據(jù)架構(gòu),數(shù)據(jù)分層、分類標(biāo)準(zhǔn)化;2、創(chuàng)建業(yè)務(wù)架構(gòu)目錄樹,數(shù)據(jù)開發(fā)根據(jù)架構(gòu)標(biāo)準(zhǔn)分類元數(shù)據(jù)。4.1.1.數(shù)據(jù)管理-數(shù)據(jù)規(guī)劃定義數(shù)據(jù)的存儲架構(gòu)根據(jù)數(shù)據(jù)庫存儲特性,及業(yè)務(wù)數(shù)據(jù)的特性,制定每種數(shù)據(jù)庫,在層次/主題架構(gòu)下數(shù)據(jù)的存儲策略標(biāo)準(zhǔn);在開發(fā)模型元數(shù)據(jù)時,關(guān)聯(lián)存儲標(biāo)準(zhǔn)策略進(jìn)行數(shù)據(jù)存儲。HIVE:文件格式:

TEXTFILE、RCFILE、ORCFILE、SEQUENCEFILE等;壓縮類型:Gzip、Bzip2、Lzo、Snappy;? 數(shù)據(jù)存儲周期、及過期數(shù)據(jù)處理方式;……? 行列模式:行存儲、列存儲、行列混存;? 壓縮: (5,5)壓縮、(3,1)壓縮;? 數(shù)據(jù)存儲周期、及過期數(shù)據(jù)處理方式;……◆MPP:?表類型:哈希表,復(fù)制表等;1、線上制定大數(shù)據(jù)開發(fā)規(guī)范,在數(shù)據(jù)對象上線時檢查元數(shù)據(jù)開發(fā)質(zhì)量,不滿足則不予許發(fā)布。4.1.2.數(shù)據(jù)管理-標(biāo)準(zhǔn)規(guī)范制定2、制定業(yè)務(wù)字段標(biāo)準(zhǔn),模型開發(fā)時稽核字段標(biāo)準(zhǔn)是否滿足,以及前向做字段推薦命名;◆

字段標(biāo)準(zhǔn)信息:? 英文名;? 中文名;? 業(yè)務(wù)口徑? 脫敏規(guī)則;? 字段類型,精度;……① 從現(xiàn)有的業(yè)務(wù)系統(tǒng)采集數(shù)據(jù)表結(jié)構(gòu)信息存放到全量數(shù)據(jù)字典庫;② 梳理全量數(shù)據(jù)字典庫,剔除不規(guī)范字典庫數(shù)據(jù),如:命名不規(guī)范,無意義字段,濫用單復(fù)數(shù),同名不同意,同義不同名,基本元素不同意等。③ 評審,制定出標(biāo)準(zhǔn)數(shù)據(jù)字典:存放各種定義好的字段標(biāo)準(zhǔn)命名,業(yè)務(wù)口徑,及字段長度,精度等。規(guī)范策略說明唯一性檢查對象實體的唯一性長度檢查命名的長度格式檢查命名的格式檢查首字母約束是否以字母開關(guān)非空約束關(guān)鍵字段是否為空關(guān)系約束輸入關(guān)系檢查454.1.3.數(shù)據(jù)管理-數(shù)據(jù)目錄增強(qiáng)大數(shù)據(jù)資源區(qū)數(shù)據(jù)目錄自助分析多維透視摘要分析?

數(shù)據(jù)目錄分為大數(shù)據(jù)資源區(qū)數(shù)據(jù)目錄、對外數(shù)據(jù)開放數(shù)據(jù)目錄。?

數(shù)據(jù)目錄通過元數(shù)據(jù)定期稽核,保障數(shù)據(jù)目錄的數(shù)據(jù)字典的正確性。?

數(shù)據(jù)目錄集成數(shù)據(jù)工具服務(wù),驅(qū)動數(shù)據(jù)的采存管用各個環(huán)節(jié),提高數(shù)據(jù)管理和數(shù)據(jù)使用的效率,提升數(shù)據(jù)使用者的體驗。數(shù)據(jù)工具管理類工具血緣 變更處理類工具遷移 加工數(shù)據(jù)應(yīng)用類工具新增稽核授權(quán)摘要數(shù)據(jù)目錄工具注冊工具調(diào)用對外開放區(qū)數(shù)據(jù)目錄數(shù)據(jù)開放管理流程◆

大數(shù)據(jù)資源區(qū)數(shù)據(jù)目錄:由數(shù)據(jù)采集,處理后行程的基礎(chǔ)庫,主題庫,專題庫數(shù)據(jù)資源目錄;◆

對外開放區(qū)數(shù)據(jù)目錄:數(shù)據(jù)資源區(qū)的數(shù)據(jù)資源,經(jīng)過數(shù)據(jù)開放流程的管理審批后,進(jìn)入對外開放數(shù)據(jù)區(qū)數(shù)據(jù)目錄,展現(xiàn)的是可對外開放的數(shù)據(jù)資源;后向前向元數(shù)據(jù)管理46租戶分配數(shù)據(jù)源多租戶團(tuán)隊開通需要的工作團(tuán)隊注冊納入團(tuán)隊成員租戶賬號申請服務(wù)開通、資源分配數(shù)據(jù)源管理開發(fā)團(tuán)隊注冊注冊大數(shù)據(jù)平臺租戶賬號計算資源CPU/內(nèi)存/…..存儲資源存儲空間涉及流程分類:租戶開通:賬號申請,并在大數(shù)據(jù)平臺開通賬號服務(wù)開通、資源分配:給租戶分配需要的大數(shù)據(jù)平臺的服務(wù)組件,比如:Hive,Spark,HDFS,Hbase等。

數(shù)據(jù)源分配:把租戶綁定上自己申請的服務(wù)信息;開發(fā)團(tuán)隊注冊:新建開發(fā)團(tuán)隊,把用戶納入團(tuán)隊成為成員,并給成員綁定租戶信息。4.1.4.數(shù)據(jù)管理-租戶團(tuán)隊入駐組件服務(wù)授權(quán)Hive/Spark/kafka…..綁定租戶賬號474.1.5.數(shù)據(jù)管理-數(shù)據(jù)質(zhì)量管理?

建立數(shù)據(jù)質(zhì)量指標(biāo)庫,將系統(tǒng)數(shù)據(jù)質(zhì)量的稽核轉(zhuǎn)化為數(shù)據(jù)質(zhì)量指標(biāo)的稽核。數(shù)據(jù)質(zhì)量指標(biāo)由數(shù)據(jù)處理統(tǒng)一出數(shù)。?

對接工單系統(tǒng),完善異常數(shù)據(jù)處理流程;稽核方式事中稽核事后稽核場景:數(shù)據(jù)實時性、數(shù)據(jù)質(zhì)量要求高數(shù)據(jù)入庫、匯聚后,實時稽核場景:數(shù)據(jù)實時性需求低,數(shù)據(jù)質(zhì)量要求高周期性稽核建立數(shù)據(jù)質(zhì)量規(guī)則庫及時性完整性唯一性一致性準(zhǔn)確性合理性異常處理異常通知查看稽核問題報告、異常告警短信。異常處理生成問題工單,閉環(huán)處理;事中稽核,阻斷后續(xù)處理。?

大數(shù)據(jù)中心通過統(tǒng)一數(shù)據(jù)開發(fā)平臺,提供多租戶實現(xiàn)開發(fā)可視化,同時建立了數(shù)據(jù)開發(fā)上線發(fā)布流程,在開發(fā)完成后直接提交審核,第一時間實現(xiàn)模型和程序的發(fā)布上線,投入生產(chǎn)環(huán)境模型開發(fā)程序開發(fā)程序測試審核上線1-模型定義

創(chuàng)建模型基礎(chǔ)信息

定義模型的元數(shù)據(jù)2-構(gòu)建表結(jié)構(gòu)

添加模型字段信息提供手工/批量方式3-編輯模型應(yīng)用程序

固化常用程序命令,拖拽式使用圖形化界面,自由配置處理邏輯4-程序在線測試提供WEB界面可視化測試功能;查

看執(zhí)行時長、執(zhí)行狀態(tài)等信息,

方便開發(fā)人員調(diào)試,性能分析5-提交審核

開發(fā)人員建立上線任務(wù),提交審核6-上線運行

運維人員審核

通過,上線運行4.2.數(shù)據(jù)管理-一體化開發(fā),開發(fā)與生產(chǎn)的無縫銜接5.構(gòu)建面向“設(shè)備-數(shù)據(jù)-系統(tǒng)-業(yè)務(wù)”的統(tǒng)一運維管理能力體系?

構(gòu)建市級大數(shù)據(jù)中心統(tǒng)一運維管理能力體系,對大數(shù)據(jù)中心基礎(chǔ)設(shè)備、數(shù)據(jù)、應(yīng)用、業(yè)務(wù)進(jìn)行統(tǒng)一運營管理,提供IT運維監(jiān)控、業(yè)務(wù)可視化監(jiān)控、業(yè)務(wù)稽查分析、數(shù)據(jù)質(zhì)量保障等多個領(lǐng)域的綜合運維管理能力,促進(jìn)中心IT運營降本增效。決策者基層管理者大數(shù)據(jù)中心統(tǒng)一運維管理能力體系基礎(chǔ)設(shè)備數(shù)據(jù)源政務(wù)數(shù)據(jù)公用事業(yè)數(shù)據(jù)行業(yè)數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)大數(shù)據(jù)中心數(shù)據(jù)流數(shù)據(jù)流城市大腦一網(wǎng)通辦城運系統(tǒng)社會治理經(jīng)濟(jì)運行….◆ 城市大腦業(yè)務(wù)監(jiān)控◆ 城市大腦應(yīng)用系統(tǒng)監(jiān)控◆ 中心數(shù)據(jù)質(zhì)量保障◆ 底層基礎(chǔ)設(shè)備監(jiān)控統(tǒng)一運維管理范圍5.1.統(tǒng)一門戶場景定制化,全面感知系統(tǒng)健康度統(tǒng)一門戶以使用角色和場景為主線,個人工作臺定制化,面向不同使用者特定場景,實現(xiàn)對業(yè)務(wù)、生產(chǎn)、系統(tǒng)的資源或能力“可視”、

“可控”、“可追溯”,分角色分權(quán)限向決策層、管理層、基層工作人員展現(xiàn)統(tǒng)一運維視圖。數(shù)據(jù)可視化支持PC、大屏、手機(jī)等多端展示?;ヂ?lián)網(wǎng)化綜合門戶 數(shù)據(jù)可視化,全面感知場景定制 信息關(guān)聯(lián)移動APP,隨時隨地高效辦公內(nèi)容聚焦動態(tài)效果運維宣傳窗口消息欄應(yīng)用窗口菜單欄領(lǐng)導(dǎo)運維管理運維工作更便捷、更及時、更智能,優(yōu)化用戶工作習(xí)慣。5.3.全方位的監(jiān)控管理中心,實現(xiàn)高效集中監(jiān)控構(gòu)建面向IT系統(tǒng)的全方位監(jiān)控管理中心All-in-One

Monitor亮點特性監(jiān)控模板化?提供各類監(jiān)控對象的標(biāo)準(zhǔn)監(jiān)控模板,集中管理,統(tǒng)一監(jiān)控發(fā)布,策略發(fā)布。告警預(yù)處理策略多元化?通過告警升降級、告警合并、告警屏蔽、告警自動清除等多種策略對告警進(jìn)行預(yù)處理,確保告警準(zhǔn)確可靠。告警觸發(fā)方式多樣化?直接采集、數(shù)值判斷、變化判斷、字符串判斷、連續(xù)性判斷、表達(dá)式判斷

等多種告警觸發(fā)方式一網(wǎng)打盡所有告警。多種告警通知手段?聲音、短信、外呼等通知手段,讓維護(hù)人員第一時間了解系統(tǒng)故障監(jiān)控服務(wù)高可用、易擴(kuò)展?云計算分布式架構(gòu),單點故障無感知;支持動態(tài)增加服務(wù)節(jié)點,擴(kuò)展系統(tǒng)處理能力。高效數(shù)據(jù)處理?大數(shù)據(jù)量并發(fā)處理能力,準(zhǔn)實時告警設(shè)備數(shù)據(jù)系統(tǒng)業(yè)務(wù)集中監(jiān)控短信微信APP郵件工單診斷處理專業(yè)監(jiān)控監(jiān)控管理中心作為整個運營管理系統(tǒng)的一項基本管理功能,提供運營管理所必需的系統(tǒng)監(jiān)控功能,為其他運維流程、操作控制、運營分析等功能提供基礎(chǔ),為被管系統(tǒng)運行的可靠性、穩(wěn)定性、可用性提供基礎(chǔ)保障。6.對數(shù)據(jù)生命周期各階段相關(guān)過程安全提供技術(shù)保障數(shù)據(jù)使用授權(quán)管理數(shù)據(jù)處理環(huán)境安全數(shù)據(jù)使用合規(guī)審計統(tǒng)一安全配置基線提供能力對數(shù)據(jù)存儲組件進(jìn)行配置安全基線檢查識別脆弱性并提供加固建議統(tǒng)一敏感數(shù)據(jù)識別支持通過配置敏感數(shù)據(jù)識別規(guī)則,在靜態(tài)存儲和網(wǎng)絡(luò)流量中識別敏感數(shù)據(jù)并基于實現(xiàn)數(shù)據(jù)標(biāo)簽和異常外泄阻斷統(tǒng)一敏感數(shù)據(jù)加密提供國密算法SDK和統(tǒng)一密鑰管理能力,支持密鑰生成、存儲、使用、分發(fā)、更新、銷毀的全生存周期安全管理統(tǒng)一敏感數(shù)據(jù)脫敏提供能力各種存儲環(huán)境中的數(shù)據(jù)進(jìn)行靜態(tài)脫敏,進(jìn)行基于業(yè)務(wù)場景的動態(tài)脫敏,統(tǒng)一身份認(rèn)證提供能力對數(shù)據(jù)存儲組件進(jìn)行配置安全基線檢查識別脆弱性并提供加固建議集中權(quán)限管理提供能力確保各租戶僅可使用獲得授權(quán)的平臺模塊功能和數(shù)據(jù)統(tǒng)一用戶行為分析集中平臺操作審計信息,支持對用戶行為建立分析模型,發(fā)現(xiàn)數(shù)據(jù)濫用行為,對異常和高風(fēng)險操作識別與告警統(tǒng)一日志存儲檢索支持接入基礎(chǔ)環(huán)境和平臺各組件日志并保存至少6個月,支持日志檢索和安全事件下鉆到原始日志數(shù)據(jù)流轉(zhuǎn)授權(quán)支持通過技術(shù)手段落實到平臺內(nèi)置流程,確保在數(shù)據(jù)歸集、使用、共享、開放過程中,大數(shù)據(jù)中心和數(shù)據(jù)提供者對所有數(shù)據(jù)流動的充分授權(quán)。7.集成平臺服務(wù)能力,提供開放、共享、運營的統(tǒng)一入口運營管理門戶開放門戶共享門戶開放視圖租戶申請運營管理視圖租戶運營數(shù)據(jù)申請數(shù)據(jù)開發(fā)數(shù)據(jù)測試發(fā)布上線服務(wù)開通平臺資源分配數(shù)據(jù)服務(wù)授權(quán)共享視圖租戶申請數(shù)據(jù)申請數(shù)據(jù)開發(fā)數(shù)據(jù)測試發(fā)布上線租戶沙箱申請數(shù)據(jù)運營平臺運營數(shù)據(jù)規(guī)劃標(biāo)準(zhǔn)制定數(shù)據(jù)稽核數(shù)據(jù)評估問題整改監(jiān)督平臺監(jiān)控數(shù)據(jù)作業(yè)監(jiān)控異常處理過期數(shù)據(jù)清理7.1.門戶實現(xiàn)方案--門戶功能框架運營中心(運營管理者)開發(fā)者管理數(shù)據(jù)應(yīng)用管理數(shù)據(jù)服務(wù)管理運營統(tǒng)計待辦審核管理安全策略管理日志管理監(jiān)控管理門戶接入層數(shù)據(jù)接入頁面接入….應(yīng)用接入門戶功能層終端適配層Web終端適配移動終端適配(Phone/Pad)大屏終端適配系統(tǒng)管理公告管理數(shù)據(jù)沙箱管理數(shù)據(jù)產(chǎn)品運營開放中心(對外)數(shù)據(jù)開放視圖數(shù)據(jù)開放服務(wù)目錄數(shù)據(jù)開放查詢開放權(quán)限控制開放數(shù)據(jù)網(wǎng)關(guān)數(shù)據(jù)開放評價數(shù)據(jù)沙箱申請PaaS能力開放DaaS能力開放SaaS能力開放開放中心開發(fā)應(yīng)用開發(fā)環(huán)境應(yīng)用開發(fā)框架自動部署服務(wù)監(jiān)控告警服務(wù)推送服務(wù)WEB封裝工具資源數(shù)據(jù)目錄數(shù)據(jù)資源共享中心(對內(nèi))數(shù)據(jù)共享視圖數(shù)據(jù)共享服務(wù)目錄數(shù)據(jù)共享查詢共享權(quán)限控制共享數(shù)據(jù)網(wǎng)關(guān)數(shù)據(jù)共享評價PaaS能力開放DaaS能力開放SaaS能力開放共享中心開發(fā)應(yīng)用開發(fā)環(huán)境應(yīng)用開發(fā)框架自動部署服務(wù)監(jiān)控告警服務(wù)推送服務(wù)WEB封裝工具資源數(shù)據(jù)目錄數(shù)據(jù)資源7.2.門戶實現(xiàn)方案--開放中心1、共享公共數(shù)據(jù)下載與調(diào)用2、公共數(shù)據(jù)共享需求申請3、公共數(shù)據(jù)共享服務(wù)目錄4、公共數(shù)據(jù)共享查詢1、數(shù)據(jù)資產(chǎn)地圖展示2、整體運維監(jiān)控展示3、數(shù)據(jù)運營報告展示1、市民個人信息查詢與修正2、法人信息查詢3、空間地理信息查詢4、電子證照信息查詢與修正開放中心?

使用角色:市領(lǐng)導(dǎo)、各委辦局分析人員、區(qū)政府、外部機(jī)構(gòu)、公民。?

主要解決問題:通過統(tǒng)一入口,快捷、便利的獲得共享和開放數(shù)據(jù)服務(wù)。目錄64整體規(guī)劃方案關(guān)鍵能力實現(xiàn)方案實施方案背景與需求分析人口庫建設(shè)建議? 大數(shù)據(jù)中心制定人口庫技術(shù)架構(gòu)和技術(shù)標(biāo)準(zhǔn),并提供平臺、工具、數(shù)據(jù),各委辦對人口庫標(biāo)簽進(jìn)行認(rèn)責(zé),并負(fù)責(zé)責(zé)任范圍的標(biāo)簽開發(fā)。建立委辦標(biāo)簽責(zé)任認(rèn)領(lǐng)共建機(jī)制建立離線實時相結(jié)合的標(biāo)簽更新機(jī)制建立標(biāo)簽服務(wù)共享機(jī)制? 通過離線周期更新和實時更新相結(jié)合的標(biāo)簽更新機(jī)制,保障人口庫標(biāo)簽數(shù)據(jù)的及時性,以及各委辦業(yè)務(wù)數(shù)據(jù)的一致性。? 人口庫標(biāo)簽數(shù)據(jù)納入資源目錄,并以數(shù)據(jù)服務(wù)方式向各委辦共享。? 大數(shù)據(jù)中心搭建平臺,制定技術(shù)規(guī)范和技術(shù)標(biāo)準(zhǔn),各委辦通過責(zé)任認(rèn)領(lǐng)機(jī)制共同參與人口庫建設(shè),形成共建、共治和共享的數(shù)據(jù)生態(tài)?;橐鍪录?zhí)行公安局人口標(biāo)簽庫出生事件管理教育民政局公安數(shù)據(jù)民政數(shù)據(jù)離線周期批量采集實時增量采集離線周期批量處理大數(shù)據(jù)中心…教育數(shù)據(jù)…局靜安區(qū)責(zé)任認(rèn)領(lǐng)業(yè)務(wù)協(xié)同實時更新平臺技術(shù)支撐離線更新數(shù)據(jù)同步數(shù)據(jù)共享…區(qū)ODS? 委辦貼源數(shù)據(jù)69委辦局大數(shù)據(jù)中心共享數(shù)據(jù)委辦局確認(rèn)建設(shè)方案確認(rèn)責(zé)任清單和負(fù)面清單資源目錄編制共享數(shù)據(jù)推送市級數(shù)據(jù)湖? 主題庫/專題庫責(zé)任委辦局負(fù)責(zé):主題庫需求、建設(shè)方案(業(yè)務(wù)方案)、開發(fā)和主題應(yīng)用。? 大數(shù)據(jù)中心主要負(fù)責(zé):制定標(biāo)準(zhǔn)(技術(shù)方案)、提供平臺、數(shù)據(jù)和工具,并負(fù)責(zé)建成后的服務(wù)開放和運行維護(hù)。市級數(shù)據(jù)庫提出主題庫建設(shè)申請開始編制建設(shè)方案提出需求清單明確建庫需求核實建設(shè)申請三清單管理分配資源并建庫數(shù)據(jù)抽取入數(shù)據(jù)庫數(shù)據(jù)治理梳理轉(zhuǎn)換口徑實施數(shù)據(jù)轉(zhuǎn)換并存入主題庫設(shè)置主題庫管理規(guī)則提供數(shù)據(jù)服務(wù)開展主題應(yīng)用提供主題庫監(jiān)測等管理服務(wù)結(jié)束主題庫/專題庫建設(shè)建議基礎(chǔ)庫主題庫專題庫指標(biāo)庫數(shù)據(jù)倉庫? 人口庫、法人庫數(shù)據(jù)集市? 經(jīng)濟(jì)活動、公共事業(yè)數(shù)據(jù)應(yīng)用居住地社區(qū)?個人信息?居住地信息?……?數(shù)據(jù)獲取?狀態(tài)感知?策略協(xié)同1、特定人群關(guān)懷入駐時間駐留時長健康狀況關(guān)懷建議……大數(shù)據(jù)平臺遷徙地社區(qū)醫(yī)療機(jī)構(gòu)?健康狀況?醫(yī)療記錄?……通信運營商?實時位置?駐留時長?……跨領(lǐng)域數(shù)據(jù)2、路面積水應(yīng)急實時感知跨部門協(xié)同處理公安部門消防部門市政道路管理通信運營商?事發(fā)路段增派人手?沿途路線道路疏通?緊急排水處置?車輛救援準(zhǔn)備?積水應(yīng)急處理?檢查應(yīng)急通道?短信通知區(qū)域人員?實時監(jiān)控區(qū)域人流積水感知設(shè)備大數(shù)據(jù)平臺數(shù)據(jù)應(yīng)用3、外籍臨時醫(yī)療外籍人士展會入境平臺事件實時獲取出入境管理局?

人員信息?

入境時間?

簽證時長?

……市衛(wèi)生局志愿者協(xié)會?

國籍/語言?

……?

人員信息?

人臉信息?

證件信息?

……展會附近醫(yī)院?

綠色通道?

資源準(zhǔn)備?

……青年志愿者?

現(xiàn)場引導(dǎo)?

外語翻譯?

……管理機(jī)構(gòu)工作部署執(zhí)行單位現(xiàn)場支持?

信息匯聚?

構(gòu)成分析?

協(xié)同策略大數(shù)據(jù)平臺THANKS大

數(shù)

據(jù)

規(guī)

劃與

設(shè)

案目錄12345背

景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念體

系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式共

享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃運

營:大數(shù)據(jù)湖一體化運營管理建設(shè)數(shù)據(jù)架構(gòu)與承載體系的演變過程完整性、一致性、交互穩(wěn)定性,并發(fā)性,異??苫謴?fù)性企業(yè)級跨域整合、業(yè)務(wù)擴(kuò)展性、架構(gòu)設(shè)計合理性、流程規(guī)范性存儲經(jīng)濟(jì)性、高性能、高擴(kuò)展、高并發(fā)、靈活模型適配性E.F.Codd發(fā)明DBMSBillInmon提出DW概念Google發(fā)布三篇論文1970’s1990’s2000’s123數(shù)據(jù)庫時代數(shù)據(jù)倉庫時代大數(shù)據(jù)平臺時代關(guān)系型數(shù)據(jù)庫解決了信息時代的數(shù)據(jù)資源存儲和管理,實現(xiàn)了電子化的文件柜DW研究和解決了從數(shù)據(jù)庫中獲取信息的問題,通過OLAP、數(shù)據(jù)挖掘等幫助企業(yè)決策分析,構(gòu)建商業(yè)智能(BI)面對大數(shù)據(jù)5V特點,采用分布式、并行化的存儲和計算架構(gòu),提升數(shù)據(jù)處理能力ü

對象:PB級,80%以上非結(jié)構(gòu)化數(shù)據(jù)ü

技術(shù):分布式架構(gòu)、云計算、虛擬化等ü

CAP原理:CAP

BASEü

采用數(shù)據(jù)模型表示數(shù)據(jù)結(jié)構(gòu),冗余小ü

面向事務(wù)管理,具有ACID特性ü

面向主題的,關(guān)注用戶重點業(yè)務(wù)ü

集成的,跨越歷史、區(qū)域、系統(tǒng)…ü

穩(wěn)定的,具有只讀性質(zhì),以查詢?yōu)橹鳕?/p>

以時間序列存儲,非規(guī)范化管理ü

數(shù)據(jù)統(tǒng)一管理和控制,易維護(hù)和擴(kuò)充ü

程序與數(shù)據(jù)獨立,具有良好用戶接口ü

目標(biāo):線性擴(kuò)展、彈性計算、實時響應(yīng)、動態(tài)調(diào)節(jié)背景:數(shù)據(jù)快速入湖,分析更加智能,應(yīng)用更加多樣,服務(wù)更加開放u

更多企業(yè)數(shù)據(jù)將進(jìn)入數(shù)據(jù)湖,來自傳統(tǒng)系統(tǒng)的數(shù)據(jù)和傳感器等新型數(shù)據(jù)資源不斷融合,數(shù)據(jù)孤島將繼續(xù)被打破。u

隨著大數(shù)據(jù)分析能力的不斷提高,人工智能的重要性被逐步提升。當(dāng)今最先進(jìn)的機(jī)器學(xué)習(xí)和人工智能系統(tǒng)正在超越傳統(tǒng)的基于規(guī)則的算法,創(chuàng)建出能夠理解、學(xué)習(xí)、預(yù)測、適應(yīng),甚至可以自主操作的系統(tǒng)。大數(shù)據(jù)發(fā)展趨勢分析數(shù)據(jù)服務(wù)以更加深度的數(shù)據(jù)開放,跨行業(yè)大數(shù)據(jù)關(guān)聯(lián)。?

以更多樣的應(yīng)用能力,構(gòu)建針對性行業(yè)解決方案。?數(shù)據(jù)服務(wù)深度數(shù)據(jù)開放,針對方案制定數(shù)據(jù)應(yīng)用?智能應(yīng)用,基于AI與機(jī)器學(xué)習(xí)分析,個性化服務(wù)提供。數(shù)據(jù)應(yīng)用?

應(yīng)用快速構(gòu)建,基于數(shù)據(jù)湖進(jìn)行細(xì)粒度的收集、探索和分析應(yīng)用更加智能,構(gòu)建更加快速?

從深度學(xué)習(xí)到機(jī)器學(xué)習(xí),從機(jī)器學(xué)習(xí)到人工智能。數(shù)據(jù)分析數(shù)據(jù)分析?

基于數(shù)據(jù)湖的大量的原始數(shù)據(jù),深度訓(xùn)練,快速分析人工智能分析,直引湖中數(shù)據(jù)數(shù)據(jù)治理入湖即治理,針對性對數(shù)據(jù)源系統(tǒng)輸入數(shù)據(jù)制定入湖標(biāo)準(zhǔn)?數(shù)據(jù)治理?

數(shù)據(jù)驅(qū)動治理規(guī)范,以數(shù)據(jù)為核心實時制定治理規(guī)范。數(shù)據(jù)驅(qū)動規(guī)范,入湖標(biāo)準(zhǔn)制定數(shù)據(jù)平臺?

數(shù)據(jù)平臺存儲方式向數(shù)據(jù)湖模式轉(zhuǎn)變,多數(shù)據(jù)匯聚。?

支持結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)多數(shù)據(jù)入湖?

。數(shù)據(jù)湖數(shù)據(jù)湖產(chǎn)生背景及概念提出企業(yè)現(xiàn)在正處于大數(shù)據(jù)的“焦慮期”問題?挑戰(zhàn)?

p

存儲成本問題:海量數(shù)據(jù)需要在多環(huán)境、多級下重復(fù)存儲,存儲開銷大p

數(shù)據(jù)形態(tài)問題:應(yīng)用大多聚焦在經(jīng)過加工后的再生數(shù)據(jù),原始數(shù)據(jù)無法得到充分利用變革!p

業(yè)務(wù)響應(yīng)問題:必須事先進(jìn)行充分規(guī)劃和較長周期加工,欠缺運營所需的靈活性和時效性數(shù)據(jù)湖一詞是2011年由Pentaho首席技術(shù)官詹姆斯

迪克森最初提出的,參照“數(shù)據(jù)集市”得來。ü

較小的數(shù)據(jù)存儲庫ü

如同瓶裝水,經(jīng)過過濾包裝結(jié)構(gòu)化后以供使用ü

數(shù)據(jù)來源于不同地方ü

如同湖泊,存儲更自然狀態(tài)下的大量的水n

預(yù)先設(shè)定問題n

集中存儲+無限能力n

使用方式單一n

用戶各取所需數(shù)據(jù)集市數(shù)據(jù)湖數(shù)據(jù)湖的定義與特性把你以前在磁帶上擁有的東西倒入到數(shù)據(jù)湖,然后開始探索該數(shù)據(jù)。重要的只把需要的數(shù)據(jù)倒入到Hadoop;如果你想結(jié)合來自數(shù)據(jù)湖的信息和客戶關(guān)系管理系統(tǒng)(CRM)里面的信息,我們就進(jìn)行連接,只有需要時才執(zhí)行這番數(shù)詹姆斯·迪克森

據(jù)結(jié)合。數(shù)據(jù)湖是一種在系統(tǒng)或存儲庫中以自然格式存儲數(shù)據(jù)的方法,它有助于以各種模式和結(jié)構(gòu)形式配置數(shù)據(jù),通常是對象塊或文件。湖中的數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)從關(guān)系數(shù)據(jù)庫(行和列),半結(jié)構(gòu)化數(shù)據(jù)(CSV、XML、JSON的日志),非結(jié)構(gòu)化數(shù)據(jù)(電子郵件,文檔,PDF)和二進(jìn)制數(shù)據(jù)(圖像、音頻、視頻)從而形成一個集中式數(shù)據(jù)存儲容納所有形式的數(shù)據(jù)。維基百科把不同結(jié)構(gòu)的數(shù)據(jù)統(tǒng)一存儲,使不同數(shù)據(jù)有一致的存儲方式,在使用時方便連接,真正解決數(shù)據(jù)集成問題。數(shù)據(jù)湖(DataLake)核心思想n

全部采集(CollectEverything)n

隨處研究(DiveInAnywhere)n

靈活訪問(FlexibleAccess)存儲一切,分析一切,創(chuàng)建所需從對比中理解數(shù)據(jù)湖概念

優(yōu)勢篇對比項數(shù)據(jù)倉庫數(shù)據(jù)湖支持?jǐn)?shù)據(jù)類型

有限的數(shù)據(jù)類型支持,以結(jié)構(gòu)化為主支持結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)在數(shù)據(jù)湖世界里,沒有關(guān)于已經(jīng)取得的數(shù)據(jù)假設(shè)。一旦數(shù)據(jù)發(fā)生,即開始在細(xì)粒度級別收集數(shù)據(jù)。業(yè)務(wù)流程發(fā)現(xiàn)基于數(shù)據(jù)與輸入數(shù)據(jù)過程開始于業(yè)務(wù)流程識別,通常由數(shù)據(jù)管理者和業(yè)務(wù)負(fù)責(zé)人基數(shù)據(jù)采集方式于數(shù)據(jù)和業(yè)務(wù)的某種假設(shè)寫入模式,建立模型對數(shù)據(jù)進(jìn)行某類格式和結(jié)構(gòu)的處理,為了讀取模式,接受原始形式的數(shù)據(jù),在數(shù)據(jù)細(xì)粒度級別收集、數(shù)據(jù)處理能力

減少數(shù)據(jù)的復(fù)雜性,比較難于實現(xiàn)上卷(Rollup)和鉆取探索和分析非常簡單(Drilldown)分析,該設(shè)計可能需要妥協(xié)一定粒度的數(shù)據(jù)數(shù)據(jù)庫架構(gòu)演變需要謹(jǐn)慎,過程耗時,成本較高,影響較大,不存在結(jié)構(gòu)問題,支持復(fù)雜數(shù)據(jù)類型,便于重置數(shù)據(jù)模型、查詢和應(yīng)用,并具有簡單的重建關(guān)系的能力架構(gòu)重建能力需要對原有數(shù)據(jù)進(jìn)行重構(gòu)動態(tài)性擴(kuò)展性敏捷性差,采用靜態(tài)固定配置,基于業(yè)務(wù)流程驅(qū)動而設(shè)計系統(tǒng)提供預(yù)定義的業(yè)務(wù)需求高度敏捷,動態(tài)靈活配置,基于數(shù)據(jù)的業(yè)務(wù)流程定義點燃創(chuàng)新和新的商業(yè)機(jī)會從對比中理解數(shù)據(jù)湖概念

劣勢篇對比項數(shù)據(jù)倉庫數(shù)據(jù)湖數(shù)據(jù)規(guī)劃體系具有周密的數(shù)據(jù)發(fā)現(xiàn)、采集、探索和轉(zhuǎn)換的數(shù)據(jù)計劃,易于突顯數(shù)據(jù)價值

不太重視事先的數(shù)據(jù)規(guī)劃,允許存儲任何數(shù)據(jù),難以抓取數(shù)據(jù)價值數(shù)據(jù)利用率高,按數(shù)據(jù)優(yōu)先級和數(shù)據(jù)可用性的大小進(jìn)行組織,可以快速定

數(shù)據(jù)利用率低,缺少數(shù)據(jù)優(yōu)先級排序,需要花費大量時間查找和分?jǐn)?shù)據(jù)利用效率位所需數(shù)據(jù)析前的準(zhǔn)備數(shù)據(jù)需求響應(yīng)能力復(fù)雜性和難度邏輯可解釋性安全性具有較高的需求響應(yīng)能力,可以保證平穩(wěn)高效的數(shù)據(jù)訪問較低,建設(shè)規(guī)模與成本可控數(shù)據(jù)響應(yīng)延遲較高,整個分析過程容易中斷很高,建設(shè)難度與規(guī)模呈線性增長趨勢,隱性成本較高欠缺語義一致性和嚴(yán)格的元數(shù)據(jù),數(shù)據(jù)關(guān)系較為松散,難以解釋比較新的技術(shù),需要持續(xù)完善數(shù)據(jù)組織邏輯性強(qiáng),數(shù)據(jù)關(guān)系可解釋性較高多年發(fā)展歷程,保護(hù)數(shù)據(jù)的能力比較成熟企業(yè)的業(yè)務(wù)行家和專業(yè)人員,技術(shù)門檻低適用對象面向熟練用戶、科學(xué)領(lǐng)域的數(shù)據(jù)科學(xué)家,技術(shù)門檻高潛在風(fēng)險數(shù)據(jù)湖是大數(shù)據(jù)概念的延伸數(shù)據(jù)湖的能力視圖數(shù)據(jù)湖并非是個全新概念1.

“數(shù)據(jù)湖”是關(guān)于企業(yè)應(yīng)用大數(shù)據(jù)的概念,是面向企業(yè)的最佳的大數(shù)據(jù)的解決方案p

多樣化的數(shù)據(jù)存儲數(shù)據(jù)能力要求p

高效的數(shù)據(jù)處理p

存儲全部數(shù)據(jù)p

處理任何數(shù)據(jù)p

訪問任何數(shù)據(jù)2.

“數(shù)據(jù)湖”不僅是數(shù)據(jù)存儲和處理的單元,也是釋放數(shù)據(jù)價值的過程3.

企業(yè)大數(shù)據(jù)應(yīng)用成功的關(guān)鍵并不是存儲所有的數(shù)據(jù),而是要創(chuàng)建一個更有意義的“數(shù)據(jù)湖”,幫助企業(yè)加速提取高價值數(shù)據(jù)的速度4.

數(shù)據(jù)湖是大數(shù)據(jù)發(fā)展方向上的高級階段,是一種建設(shè)理念,而不是一種特定的實施方法IT能n

支持所有用戶力

n

更容易適應(yīng)變化要求5.

“數(shù)據(jù)湖”是個架構(gòu)概念,是數(shù)據(jù)倉庫的一種演進(jìn),是一種n

更快的洞悉能力大數(shù)據(jù)概念下的延伸數(shù)據(jù)湖概念上的甄別數(shù)據(jù)湖是……數(shù)據(jù)湖不是……1、用戶可以訪問大量原始數(shù)據(jù)的環(huán)境2、一個開發(fā)和驗證分析模型的環(huán)境,然后將其轉(zhuǎn)化為生產(chǎn)1、用于安置企業(yè)所有數(shù)據(jù)的一個數(shù)據(jù)倉庫或數(shù)據(jù)集市2、替代運營數(shù)據(jù)存儲(ODS)3、高性能的生產(chǎn)環(huán)境3、用于探索數(shù)據(jù)以獲得洞察力的分析沙箱4、企業(yè)級目錄,可幫助用戶查找數(shù)據(jù)并將業(yè)務(wù)術(shù)語與技術(shù)元數(shù)據(jù)鏈接起來4、生產(chǎn)型報表的應(yīng)用程序5、一個專門建立的系統(tǒng)來解決一個特定的問題(盡管專門建立的數(shù)據(jù)集市可以從數(shù)據(jù)湖中提供)5、一個支持重用數(shù)據(jù)轉(zhuǎn)換和查詢的環(huán)境數(shù)據(jù)湖體系的架構(gòu)規(guī)劃數(shù)據(jù)湖的邏輯架構(gòu)數(shù)據(jù)湖的數(shù)據(jù)架構(gòu)p

持久層(PersitentLayer):存放所有從和外部獲取的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)p

分析沙箱(AnalyticsSandbox):數(shù)據(jù)科學(xué)家和分析師被授予持久層的訪問權(quán)限并使用進(jìn)行數(shù)據(jù)研究和實驗p

探索數(shù)據(jù)源(Curated):數(shù)據(jù)分析師會將有商業(yè)價值的數(shù)據(jù)進(jìn)行處理并創(chuàng)建新的數(shù)據(jù)源以提供給業(yè)務(wù)分析師p

可操作層(Operationallayer):業(yè)務(wù)分析師繼續(xù)精煉已處理過的數(shù)據(jù),和數(shù)據(jù)管理團(tuán)隊一起將這些數(shù)據(jù)轉(zhuǎn)換為更為容易操作和使用的數(shù)據(jù),存放之以便得到更廣泛的使用Hadoop不一定是數(shù)據(jù)湖的組成部分,只是它是目前最理想的選擇!數(shù)據(jù)湖建設(shè)的四個階段p

端到端的業(yè)務(wù)支撐能力p

穩(wěn)定的成熟度服務(wù)架構(gòu)p

靈活完善的企業(yè)運營模式協(xié)作交互階段p

分析能力增強(qiáng)p

優(yōu)化探索環(huán)境0403p

豐富價值發(fā)現(xiàn)模型基礎(chǔ)架構(gòu)階段p

EDW與DataLake協(xié)作02p

對外生產(chǎn)價值輸送能力p

數(shù)據(jù)服務(wù)和運營管理能力成熟運營階段01價值挖掘階段p

整合數(shù)據(jù)湖基礎(chǔ)設(shè)施p

可擴(kuò)展的數(shù)據(jù)處理和攝入大多數(shù)企業(yè)處于前三個階段的建設(shè)和完善過程中……p

數(shù)據(jù)目錄管理趨于完善數(shù)據(jù)湖體系的建設(shè)要點與風(fēng)險分析數(shù)據(jù)湖關(guān)鍵點建設(shè)難點與風(fēng)險靈活自動化的采集與存儲企業(yè)全局?jǐn)?shù)據(jù)的掌握與預(yù)測組織和編目數(shù)據(jù)管理統(tǒng)一的透明訪問方式數(shù)據(jù)質(zhì)量和可靠性統(tǒng)一元數(shù)據(jù)規(guī)范和管控能力業(yè)務(wù)關(guān)聯(lián)場景的數(shù)據(jù)理解系統(tǒng)化的質(zhì)量管控體系無感知的分布式架構(gòu)(存儲、計算、網(wǎng)絡(luò))分布技術(shù)的規(guī)劃和擴(kuò)展能力參考:來自實踐中數(shù)據(jù)湖建設(shè)內(nèi)容業(yè)界主流公司的數(shù)據(jù)湖規(guī)劃

HortonworksHortonworks公司基于

Hadoop生態(tài)構(gòu)建的數(shù)據(jù)湖提出的現(xiàn)代化數(shù)據(jù)架構(gòu)(MordenDataArchitecture),從南向北包含四個層面:數(shù)據(jù)采集層(DataAcquisitionLayer)數(shù)據(jù)采集層負(fù)責(zé)從數(shù)據(jù)源抽取和移動數(shù)據(jù),并將數(shù)據(jù)存放到數(shù)據(jù)湖中。采集的數(shù)據(jù)源包括傳統(tǒng)的關(guān)系型或事務(wù)型系統(tǒng)、用戶獲取的數(shù)據(jù)、非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)、外部數(shù)據(jù)或流數(shù)據(jù)等。數(shù)據(jù)監(jiān)管層(DataCurationLayer)數(shù)據(jù)監(jiān)管層負(fù)責(zé)數(shù)據(jù)湖中的數(shù)據(jù)組織、定型并為其他層提供消費,包含數(shù)據(jù)標(biāo)準(zhǔn)化流程制定,數(shù)據(jù)創(chuàng)建、脫敏、清洗、轉(zhuǎn)換、維護(hù)、管理和展現(xiàn)等工作。數(shù)據(jù)供應(yīng)層(DataProvisioningLayer)數(shù)據(jù)供應(yīng)層采用更適用于業(yè)務(wù)報表和分析的傳統(tǒng)數(shù)據(jù)儲存方式,使用OLAP、數(shù)據(jù)倉庫和數(shù)據(jù)集市降低數(shù)據(jù)消費的復(fù)雜度并提供快速的交互式查詢和分析。數(shù)據(jù)消費層(DataConsumptionLayer)數(shù)據(jù)消費層提供所有最終用戶的接口,對于不同用戶對數(shù)據(jù)的需求,大量和多元化的工具和技術(shù)會被用于該層。業(yè)界主流公司對于數(shù)據(jù)湖的規(guī)劃

IBMIBM公司提出的數(shù)據(jù)湖架構(gòu),包括六大關(guān)鍵部件:一.?dāng)?shù)據(jù)湖資源庫按照數(shù)據(jù)特點進(jìn)行原始格式的分類存儲庫二.企業(yè)IT交互統(tǒng)一提供企業(yè)生產(chǎn)側(cè)系統(tǒng)與數(shù)據(jù)湖資源庫的靈活交互,快速配置能力三.原始數(shù)據(jù)交互為數(shù)據(jù)價值發(fā)現(xiàn)提供安全的資源分析訪問接口與試驗環(huán)境四.目錄接口唯一權(quán)威的數(shù)據(jù)湖元數(shù)據(jù)發(fā)布和訪問模式五.基于可視化的交互統(tǒng)一可視化的業(yè)務(wù)應(yīng)用交互接口和沙箱環(huán)境六.信息集成與治理集成的數(shù)據(jù)湖運營管理工具與環(huán)境目錄12345背

景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念體

系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式共

享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃運

營:大數(shù)據(jù)湖一體化運營管理建設(shè)大數(shù)據(jù)湖體系規(guī)劃生產(chǎn)型系統(tǒng)交互分析OLAP挖掘工具平臺工具應(yīng)用生態(tài)圈系統(tǒng)應(yīng)用構(gòu)建工具省分專區(qū)生態(tài)圈專區(qū)服務(wù)對象應(yīng)用專區(qū)外部系統(tǒng)互聯(lián)網(wǎng)合作伙伴分析型系統(tǒng)運營管控API數(shù)據(jù)沙箱訪問接口(JDBC、ODBC)跨架構(gòu)數(shù)據(jù)聯(lián)邦訪問共享統(tǒng)一數(shù)據(jù)服務(wù)代理(DataBroker)訪問接入規(guī)范統(tǒng)一數(shù)據(jù)接入邏輯化視圖數(shù)據(jù)同源異構(gòu)訪問安數(shù)據(jù)湖統(tǒng)一目錄<統(tǒng)一服務(wù)數(shù)據(jù)集>緩存加速數(shù)據(jù)共享標(biāo)準(zhǔn)全規(guī)范存儲計算加速計算側(cè)cache實時檢索和流處理引擎統(tǒng)一索引層交互式查詢引擎計算調(diào)度規(guī)范資源申請規(guī)范計算處理協(xié)同計算引擎離線批處理引擎TB級計算計算資源調(diào)度自動調(diào)度

按需使用資源池化

彈性伸縮角色權(quán)限數(shù)據(jù)分類規(guī)范數(shù)據(jù)模型規(guī)范生產(chǎn)數(shù)據(jù)(1+N)

操作/臨時存儲原生數(shù)據(jù)(1+N)

就近/分域存儲MySql主數(shù)據(jù)(1)整合數(shù)據(jù)(1)

全網(wǎng)/分層支撐應(yīng)用數(shù)據(jù)(N)

分區(qū)建設(shè)規(guī)全網(wǎng)統(tǒng)一數(shù)據(jù)存儲范TXTOracleHDFSHbaseGreenplum…元字典規(guī)范PB級存儲存儲規(guī)范結(jié)構(gòu)化數(shù)據(jù)(數(shù)據(jù)庫/格式文件等)半結(jié)構(gòu)化數(shù)據(jù)(XML/TXT等)非結(jié)構(gòu)化數(shù)據(jù)(語音、視頻等)采集接入規(guī)范生產(chǎn)直采前置采集同步鏡像統(tǒng)一接入配置網(wǎng)絡(luò)爬蟲IOT接入生產(chǎn)系統(tǒng)駐留數(shù)據(jù)接入運營管源數(shù)據(jù)提供規(guī)范生產(chǎn)模型規(guī)范可視化定義

即配即用透明化部署

實時接入調(diào)度理大吞吐管道規(guī)范源端系統(tǒng)BSSOSSMSS網(wǎng)絡(luò)/平臺生態(tài)圈外部系統(tǒng)互聯(lián)網(wǎng)大數(shù)據(jù)湖存儲能力規(guī)劃——統(tǒng)一標(biāo)準(zhǔn)/分區(qū)存儲制定全集團(tuán)統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),采取分域分類的數(shù)據(jù)入湖策略,構(gòu)建生產(chǎn)、原生、整合/應(yīng)用、專區(qū)等分區(qū)數(shù)據(jù)存儲及計算能力,實現(xiàn)數(shù)據(jù)原生入湖、按需使用的宗旨,為全國1+31省提供應(yīng)用數(shù)據(jù)服務(wù)能力,注智生產(chǎn)激發(fā)生產(chǎn)力。數(shù)據(jù)訪問存儲分區(qū)原則:數(shù)據(jù)計算p

生產(chǎn)數(shù)據(jù)區(qū):遵循電信集團(tuán)數(shù)據(jù)建模標(biāo)準(zhǔn)及主數(shù)據(jù)規(guī)范要求;規(guī)范層面屬于大數(shù)據(jù)湖范疇,物理資源層面可采用湖資源也可自建;p

原生數(shù)據(jù)區(qū):分域分類存儲生產(chǎn)數(shù)據(jù);將非標(biāo)準(zhǔn)數(shù)據(jù)做標(biāo)準(zhǔn)化轉(zhuǎn)化;離線批量內(nèi)存計算及緩存機(jī)器學(xué)習(xí)交互式查詢協(xié)同計算非結(jié)構(gòu)化計算實時流式資源池化,彈性技術(shù)計算資源管理自動調(diào)度,按需使用主數(shù)據(jù)區(qū)省份專區(qū)生態(tài)圈

互聯(lián)網(wǎng)專區(qū)智能連接智慧家庭物聯(lián)網(wǎng)新興ICT內(nèi)蒙貴州

河北遼寧

寧夏…金融人員組織資源運營管理整合數(shù)據(jù)區(qū):采用大數(shù)據(jù)挖掘等技術(shù)進(jìn)行實體歸集補(bǔ)全;構(gòu)建實體關(guān)聯(lián)視圖;pBSS原

OSS原

MSS原網(wǎng)絡(luò)/平實體關(guān)聯(lián)視圖省份B/O側(cè)生產(chǎn)系統(tǒng)數(shù)據(jù)存儲集團(tuán)橫向系統(tǒng)生數(shù)據(jù)

生數(shù)據(jù)

生數(shù)據(jù)

臺數(shù)據(jù)客戶產(chǎn)品渠道營銷資源服務(wù)自然人集團(tuán)橫

生態(tài)圈

生態(tài)圈產(chǎn)品客戶……向數(shù)據(jù)

-ICT-金融主數(shù)據(jù)區(qū):存儲企業(yè)級全網(wǎng)主數(shù)據(jù),大數(shù)據(jù)主數(shù)據(jù)唯一提供者;應(yīng)用專區(qū):本著數(shù)據(jù)不出湖,充分挖掘數(shù)據(jù)價值原則,為使用者提供基于自有、原生、整合數(shù)據(jù)的處理空間,面向應(yīng)用開展數(shù)據(jù)處理工作;網(wǎng)絡(luò)/平臺生產(chǎn)系統(tǒng)(前置預(yù)處理)p生態(tài)圈生產(chǎn)系統(tǒng)實體對齊編碼統(tǒng)一轉(zhuǎn)換生產(chǎn)數(shù)據(jù)區(qū)原生數(shù)據(jù)區(qū)整合數(shù)據(jù)區(qū)p存儲資源管理數(shù)據(jù)接入大數(shù)據(jù)湖原生數(shù)據(jù)區(qū)規(guī)劃——原生入湖/分類存儲/按需使用以原生入湖分類存儲按需使用為宗旨,分域分類存儲按周期存儲原生數(shù)據(jù),為云公司、集團(tuán)ODS、省份大數(shù)據(jù)平臺提供原生數(shù)據(jù)共享服務(wù),為湖內(nèi)整合數(shù)據(jù)區(qū)、應(yīng)用數(shù)據(jù)區(qū)提供原生數(shù)據(jù)服務(wù)。共享服務(wù)數(shù)據(jù)數(shù)據(jù)專區(qū)生產(chǎn)系統(tǒng)移動/固網(wǎng)DPIHANA數(shù)OIDDMR/CDRCM/CP

計費詳單ODMS翼支付集約積分…據(jù)省份專區(qū)BSS系統(tǒng)數(shù)據(jù)共享OSS系統(tǒng)MSS系統(tǒng)EDA系統(tǒng)生態(tài)圈專區(qū)…原生數(shù)據(jù)區(qū)CRM計費客戶服務(wù)…采購輔助ERP財務(wù)輔助工程輔助久其省+集團(tuán)電渠服務(wù)量BSSMSS數(shù)據(jù)OSS數(shù)據(jù)EDA數(shù)據(jù)綜合資源裝維EDA直采原生數(shù)據(jù)專區(qū)共享數(shù)據(jù)

PPMVSOP人力原生入湖主數(shù)據(jù)區(qū)日志留存DPI移動感知實體關(guān)聯(lián)視圖共享悅ME行業(yè)短

ODMS集團(tuán)固網(wǎng)DPIOIDD集團(tuán)橫向系統(tǒng)電渠商機(jī)

微信易信量號百4G數(shù)據(jù)終端…DPI網(wǎng)絡(luò)/平橫向數(shù)據(jù)政企KPIMR/CDR臺數(shù)據(jù)4G分組域話單集約積分渠道PM/CM

智能網(wǎng)管信化數(shù)據(jù)整合區(qū)生態(tài)圈系統(tǒng)原生數(shù)據(jù)整合共享互聯(lián)網(wǎng)金融智能連接智慧家庭物聯(lián)網(wǎng)新興ICT應(yīng)用翼支付IWIFINFC產(chǎn)品云堤海洋衛(wèi)星寬帶天翼云盤

189郵箱翼機(jī)通+

旺鋪助手

號簿助手實體關(guān)聯(lián)視圖…智能

視頻

聚組網(wǎng)

通話

精彩車管天翼網(wǎng)關(guān)樂駕生態(tài)圈數(shù)據(jù)流量控專家企業(yè)云翼校通

天翼對講

外勤助手

手機(jī)看店安全辦公

加密通道

21CN

語音云甜橙欺詐盾愛音樂統(tǒng)一賬號

4G-QoS新視通4G預(yù)處理入湖枝繁葉茂類網(wǎng)絡(luò)/平臺系統(tǒng)地產(chǎn)大數(shù)

旅游大數(shù)據(jù)家庭云專屬云影像云天翼視訊天翼閱讀愛游戲愛動漫天翼空間易信據(jù)實體對齊編碼標(biāo)準(zhǔn)化大數(shù)據(jù)湖整合數(shù)據(jù)區(qū)規(guī)劃——構(gòu)建企業(yè)級核心實體關(guān)聯(lián)視圖整合數(shù)據(jù)區(qū)完成數(shù)據(jù)清洗、編碼轉(zhuǎn)換、實體對齊及構(gòu)建企業(yè)級核心實體關(guān)聯(lián)視圖,為應(yīng)用專區(qū)提供整合數(shù)據(jù)服務(wù)。整合數(shù)據(jù)區(qū)保持?jǐn)?shù)據(jù)原子性粒度,不對數(shù)據(jù)做聚合處理,不影響業(yè)務(wù)專區(qū)業(yè)務(wù)指標(biāo)加工處理。實體關(guān)聯(lián)視圖p

保存原子性:整合數(shù)據(jù)區(qū)數(shù)據(jù)不做聚合操作,保持?jǐn)?shù)據(jù)原子性,不影響專區(qū)應(yīng)用指標(biāo)加工處理;p

實體補(bǔ)齊性:對核心實體根據(jù)不同原生數(shù)據(jù)進(jìn)行屬性補(bǔ)齊;llCP/SP訂購位置信息p

實體關(guān)聯(lián)性:面向?qū)嶓w全業(yè)務(wù)流程數(shù)據(jù),整合各域數(shù)據(jù)實現(xiàn)實體跨域關(guān)聯(lián)視圖;p

共享一致性:按照湖應(yīng)用的使用需求進(jìn)行共性提煉,實現(xiàn)統(tǒng)一的公共寬表建設(shè);核心實體自然人…實體對齊數(shù)據(jù)清洗自然人聚合管理政企客戶沖突管理外部數(shù)據(jù)管理規(guī)則管理組織實體沉淀合作伙伴員工地域大數(shù)據(jù)湖應(yīng)用數(shù)據(jù)專區(qū)規(guī)劃——面向應(yīng)用的自建自維數(shù)據(jù)專區(qū)大數(shù)據(jù)湖為業(yè)務(wù)應(yīng)用場景提供具有數(shù)據(jù)存儲、數(shù)據(jù)計算、數(shù)據(jù)服務(wù)及數(shù)據(jù)應(yīng)用訪問能力的應(yīng)用專區(qū),用戶可自行獲取數(shù)據(jù),面向特定應(yīng)用場景完成數(shù)據(jù)加工處理;大數(shù)據(jù)湖提供專區(qū)申請及監(jiān)控管理,以保證專區(qū)健康、有價運營。生態(tài)圈專區(qū)應(yīng)用其它專區(qū)應(yīng)用省份專區(qū)應(yīng)用p

獨立性:保證資源獨立性、數(shù)據(jù)獨立性、應(yīng)用獨立性;p

可用性:保證存儲、計算、數(shù)據(jù)資源高可用性及穩(wěn)定性;確保專區(qū)資源可在線、平滑擴(kuò)展;應(yīng)用數(shù)據(jù)專區(qū)運營監(jiān)控應(yīng)用成果評估資源利用率數(shù)據(jù)處理規(guī)范性使用頻度安全性監(jiān)控專區(qū)回收整合數(shù)據(jù)區(qū)原生數(shù)據(jù)區(qū)主數(shù)據(jù)區(qū)專區(qū)管理專區(qū)劃分專區(qū)申請自有數(shù)據(jù)專區(qū)審批專區(qū)變更p

易用性:提供豐富的可視化開發(fā)及專區(qū)運營工具;p

可管理性:大數(shù)據(jù)湖對專區(qū)具備監(jiān)控、審計能力;p

數(shù)據(jù)服務(wù)性:專區(qū)數(shù)據(jù)可以數(shù)據(jù)形式服務(wù),也可開發(fā)應(yīng)用直接鏈接調(diào)用;省份專區(qū)-內(nèi)蒙應(yīng)用數(shù)據(jù)生態(tài)圈專區(qū)-…省份專區(qū)-…整合區(qū)數(shù)據(jù)原生數(shù)據(jù)實時采集

批量采集

消息采集數(shù)據(jù)接入源端生產(chǎn)系統(tǒng)/數(shù)據(jù)倉庫共享訪問大數(shù)據(jù)湖主數(shù)據(jù)區(qū)規(guī)劃

——

企業(yè)級核心/統(tǒng)一運營保障主數(shù)據(jù)區(qū)負(fù)責(zé)存儲全域主數(shù)據(jù),并確保與主數(shù)據(jù)生產(chǎn)者保持同步,為大數(shù)據(jù)湖各區(qū)提供唯一主數(shù)據(jù)源,以保證湖中企業(yè)級核心實體數(shù)據(jù)的一致性和完整性,提升大數(shù)據(jù)湖運營效率及效果。數(shù)據(jù)專區(qū)p

統(tǒng)一主數(shù)據(jù)標(biāo)準(zhǔn):面向全國各域各生產(chǎn)系統(tǒng)提供主數(shù)據(jù)標(biāo)準(zhǔn);省份

內(nèi)專區(qū)

蒙貴州河北遼寧寧夏生態(tài)圈專區(qū)智能連接智慧家庭物聯(lián)網(wǎng)新興ICT金融…主數(shù)據(jù)整合數(shù)據(jù)p

統(tǒng)一主數(shù)據(jù)存儲:面向大數(shù)據(jù)湖提供統(tǒng)一主數(shù)據(jù)存儲能力;主數(shù)據(jù)區(qū)原生數(shù)據(jù)服務(wù)專區(qū)主數(shù)據(jù)客戶產(chǎn)品渠道訂單組織…主數(shù)據(jù)整合數(shù)據(jù)區(qū)主數(shù)據(jù)管理p

統(tǒng)一主數(shù)據(jù)整合:清洗整合各域主數(shù)據(jù),形成統(tǒng)一、標(biāo)準(zhǔn)、唯一主數(shù)據(jù);p

統(tǒng)一主數(shù)據(jù)服務(wù):為大數(shù)據(jù)湖中各區(qū)提供主數(shù)據(jù)服務(wù);主數(shù)據(jù)整合主數(shù)據(jù)目錄主數(shù)據(jù)共享主數(shù)據(jù)評估原生數(shù)據(jù)主數(shù)據(jù)入湖原生數(shù)據(jù)區(qū)生產(chǎn)數(shù)據(jù)入湖數(shù)據(jù)接入集團(tuán)橫向生產(chǎn)系統(tǒng)省份BMO生產(chǎn)系統(tǒng)網(wǎng)絡(luò)/平臺系統(tǒng)生態(tài)圈生產(chǎn)系統(tǒng)其他系統(tǒng)目錄12345背

景:大數(shù)據(jù)湖的發(fā)展背景與建設(shè)理念體

系:大數(shù)據(jù)湖體系規(guī)劃與建設(shè)思路生態(tài)圈:探索新興業(yè)務(wù)入湖建設(shè)模式共

享:大數(shù)據(jù)湖統(tǒng)一訪問共享規(guī)劃運

營:大數(shù)據(jù)湖一體化運營管理建設(shè)基于大數(shù)據(jù)湖的生態(tài)圈建設(shè)模式生態(tài)圈應(yīng)用生態(tài)運營協(xié)同API生態(tài)資源互換生態(tài)精準(zhǔn)營銷生態(tài)創(chuàng)新發(fā)現(xiàn)沙箱JDBCODBC智能連接互聯(lián)網(wǎng)金融智慧家庭新興ICTIPTV用戶流量軌跡客戶感知數(shù)據(jù)翼支付合作商戶

客戶金融特征支付風(fēng)險識別物聯(lián)網(wǎng)

終端設(shè)備列表客戶故障記錄訪問共享生態(tài)圈統(tǒng)一共享目錄生態(tài)圈客戶數(shù)據(jù)

/

特征畫像數(shù)據(jù)

/

客戶感知數(shù)據(jù)

/…生態(tài)圈原生數(shù)據(jù)/主數(shù)據(jù)/整合數(shù)據(jù)/專區(qū)數(shù)據(jù)離線批處理引擎實時流處理引擎機(jī)器學(xué)習(xí)引擎協(xié)同計算引擎DataBroker內(nèi)存計算引擎大數(shù)據(jù)湖Spark計算處理數(shù)據(jù)存儲HiveMPPStromR圖數(shù)據(jù)庫Redisstreaming計算資源按需動態(tài)調(diào)配計算需求分類

/

資源隊列管控

/

租戶任務(wù)管理計算規(guī)模

/

優(yōu)先級別

/

時間窗規(guī)劃智能連接智慧家庭統(tǒng)一賬號客戶特征行為軌跡新興ICT物聯(lián)網(wǎng)地產(chǎn)大金融欺詐分析專區(qū)車管專家營銷云盤客戶洞察家庭圈畫像生產(chǎn)副本

生產(chǎn)正本(已建)

(新建)原生數(shù)據(jù)整合數(shù)據(jù)應(yīng)用數(shù)據(jù)數(shù)據(jù)專區(qū)互聯(lián)網(wǎng)金融共性基礎(chǔ)數(shù)據(jù)專業(yè)應(yīng)用數(shù)據(jù)天翼高清天翼網(wǎng)關(guān)天翼云盤189郵箱家庭云地產(chǎn)大數(shù)據(jù)生態(tài)圈系統(tǒng)iWIFI海洋寬帶智能組網(wǎng)翼支付甜橙欺詐盾物聯(lián)網(wǎng)卡車管專家已建新建生態(tài)圈入湖指導(dǎo)原則p

核心生態(tài)圈數(shù)據(jù)量龐大、繁雜,同時入庫對計算資源、并行處理能力、運營效率提出了極大的要求,基于此,應(yīng)構(gòu)建科學(xué)、完整的入湖流程及標(biāo)準(zhǔn),保證生態(tài)圈數(shù)據(jù)能夠順利、高效的入湖并發(fā)揮效果價值驅(qū)動入湖邏輯目標(biāo)驅(qū)動入湖原則業(yè)務(wù)驅(qū)動數(shù)據(jù)分類生態(tài)核心資料生態(tài)經(jīng)營數(shù)據(jù)生態(tài)營銷數(shù)據(jù)權(quán)重系維度說明優(yōu)先級數(shù)p

貼近實際:充分融合業(yè)務(wù)需求,遵循業(yè)務(wù)優(yōu)先原則準(zhǔn)確性

數(shù)據(jù)準(zhǔn)確無誤

0.282完整性

數(shù)據(jù)完整

0.213高中低中高高1

了解生態(tài)2掌握生態(tài)3開展生態(tài)業(yè)p

計算效率:充分保證數(shù)據(jù)質(zhì)量,讓計算效率顯著提升p

邊際效益:合理控制數(shù)據(jù)入湖速度、在成本控制的前提下,實現(xiàn)效益最大化業(yè)務(wù)關(guān)鍵概念整體經(jīng)營狀況務(wù)數(shù)字化營銷一致性

數(shù)據(jù)記錄規(guī)范

0.087及時性

數(shù)據(jù)獲取及時

0.234生態(tài)管理數(shù)據(jù)生態(tài)協(xié)同數(shù)據(jù)價值性復(fù)用性數(shù)據(jù)價值關(guān)聯(lián)性0.2350.3474

實現(xiàn)生態(tài)管5

開拓生態(tài)業(yè)p

生態(tài)創(chuàng)新:數(shù)據(jù)、業(yè)務(wù)、需求間的融會貫通,實現(xiàn)生態(tài)圈的關(guān)聯(lián)及衍生場景理運營一體化務(wù)智慧創(chuàng)新生態(tài)圈入湖建設(shè)思路與步驟解決生產(chǎn)經(jīng)營看數(shù):以生態(tài)圈應(yīng)用和價值提升需求為導(dǎo)向,優(yōu)先將客戶、經(jīng)營、階段一階段二營銷、管理、生產(chǎn)方面的核心主數(shù)據(jù)入湖,滿足當(dāng)前業(yè)務(wù)發(fā)展和管理需求主數(shù)據(jù)經(jīng)營數(shù)據(jù)?

收入數(shù)據(jù)?

發(fā)展數(shù)據(jù)?

繳費數(shù)據(jù)?

…..營銷數(shù)據(jù)?

業(yè)務(wù)訂購數(shù)據(jù)

?

財務(wù)數(shù)據(jù)?

紅包數(shù)據(jù)?

金融消費數(shù)據(jù)

?

資源/庫存數(shù)據(jù)管理數(shù)據(jù)業(yè)態(tài)生產(chǎn)數(shù)據(jù)?

原始數(shù)據(jù)?

生態(tài)協(xié)同數(shù)據(jù)?

業(yè)務(wù)流程數(shù)據(jù)?

…..?

客戶數(shù)據(jù)?

產(chǎn)品數(shù)據(jù)?

賬戶數(shù)據(jù)?

….?

成本/補(bǔ)貼數(shù)據(jù)?

…..?

……開展大數(shù)據(jù)價值挖掘:將各模塊未導(dǎo)入的全量數(shù)據(jù)入湖,同時豐富生態(tài)邊際和互聯(lián)網(wǎng)數(shù)據(jù),拓展應(yīng)用場景,實現(xiàn)大數(shù)據(jù)精準(zhǔn)營銷和管理主數(shù)據(jù)?

渠道數(shù)據(jù)?

供應(yīng)商數(shù)據(jù)

?

交易類數(shù)據(jù)?

商客數(shù)據(jù)經(jīng)營數(shù)據(jù)?

活動數(shù)據(jù)營銷數(shù)據(jù)?

業(yè)務(wù)感知數(shù)據(jù)

?

人力資源數(shù)據(jù)?

卡券數(shù)據(jù)?

保險數(shù)據(jù)?

….管理數(shù)據(jù)業(yè)態(tài)生產(chǎn)數(shù)據(jù)?

互聯(lián)網(wǎng)數(shù)據(jù)?

用戶行為數(shù)據(jù)?

活動數(shù)據(jù)?

….?

運維數(shù)據(jù)?

網(wǎng)絡(luò)數(shù)據(jù)?

….?

….?

….生數(shù)據(jù)深度拓展:不斷豐富和拓展數(shù)據(jù)湖的數(shù)據(jù),包含數(shù)據(jù)的橫向范圍和縱向深度p

優(yōu)p

業(yè)補(bǔ)充采集數(shù)據(jù)?

….缺失的原生態(tài)數(shù)據(jù)?

….其他數(shù)據(jù)?

….p

先核心后邊p

先難后易?….?….?….p

先生態(tài)高于業(yè)務(wù)次高于運營管生態(tài)圈入湖建設(shè)要求與規(guī)范p

生態(tài)圈入湖要求ü

立足中國電信企業(yè)級視角ü

生產(chǎn)側(cè)與數(shù)據(jù)側(cè)建設(shè)協(xié)同?

生產(chǎn):原生接入保障?

數(shù)據(jù):共享服務(wù)保障püüüü運營原則前瞻性生態(tài)數(shù)據(jù)運營p

原生數(shù)據(jù)入湖方案全面性初始化全量上傳歷史全量同步后續(xù)變更采集周期增量采集全量合并整合全量合并整合ü

資料類:科學(xué)性ü

交易類:合理性ü

主數(shù)據(jù)/編碼類:實時全量同步p

運營規(guī)范要求(聯(lián)動同步)生產(chǎn)源端規(guī)范入湖建設(shè)演進(jìn)ü

業(yè)務(wù)調(diào)整通知:新業(yè)務(wù)定義,生產(chǎn)約束變更、業(yè)務(wù)流程變更等ü

數(shù)據(jù)運營同步:模型結(jié)構(gòu)變更、歷史數(shù)據(jù)調(diào)整、口徑新增/調(diào)整等p

生態(tài)入湖步驟p

原生數(shù)據(jù)規(guī)范保障ü

依據(jù)數(shù)據(jù)價值推進(jìn)生態(tài)數(shù)據(jù)入湖ü

業(yè)務(wù)規(guī)范:業(yè)務(wù)指導(dǎo)、流程、制度等文檔ü

主數(shù)據(jù):范圍、內(nèi)容及管理規(guī)范ü

生產(chǎn)模型建設(shè)規(guī)范:新增/變更模型遵循大數(shù)據(jù)湖整體規(guī)范要求ü

生態(tài)圈需求驅(qū)動原生數(shù)據(jù)的入湖ü

數(shù)據(jù)字典:數(shù)據(jù)模型、編碼約束、元數(shù)據(jù)等ü

數(shù)據(jù)流圖(DFD):生產(chǎn)數(shù)據(jù)流、加工數(shù)據(jù)流等ü

指標(biāo)口徑:術(shù)語定義、報表指標(biāo)說明等p

原生入湖演進(jìn)ü

原則上遵循生態(tài)數(shù)據(jù)原生入湖ü

當(dāng)原生入湖存在海量采集(性價比低),理解/支撐困難等情況,允許按照如下原則進(jìn)行非原生數(shù)據(jù)入湖:①核心和經(jīng)營入湖:非原生采集,匯入整合層②營銷和運營入湖:根據(jù)需要采集原生并逐步替換③生態(tài)協(xié)同入湖:完全實現(xiàn)原生數(shù)據(jù)入湖p

生態(tài)能力入湖規(guī)劃ü

數(shù)據(jù)規(guī)模:生態(tài)全量、核心資料、經(jīng)營數(shù)據(jù)等大小ü

更新頻率:交易頻率、業(yè)務(wù)變更頻率等ü

存儲結(jié)構(gòu):生產(chǎn)數(shù)據(jù)存儲模式、存儲周期、分層結(jié)構(gòu)等ü

接入要求:I/O帶寬、接入約束、生產(chǎn)備份情況等生態(tài)圈入湖ü

生態(tài)業(yè)務(wù)變動大且原生結(jié)果滯后數(shù)據(jù),允許前瞻性獲取生產(chǎn)變化過程表,避免數(shù)據(jù)模型的大幅調(diào)整規(guī)范

價值

靈活生態(tài)圈數(shù)據(jù)整合處理原則及關(guān)鍵點大數(shù)據(jù)湖整合區(qū)建設(shè)原則①

基于共性化數(shù)據(jù)處理,支撐廣泛、穩(wěn)定的共享應(yīng)用;②

支撐湖標(biāo)準(zhǔn)化的數(shù)據(jù)規(guī)范轉(zhuǎn)換;③

跨域數(shù)據(jù)的關(guān)聯(lián)性和橫向?qū)R;生態(tài)圈數(shù)據(jù)整合關(guān)鍵點統(tǒng)一ID生態(tài)圈自然人實體歸集與對齊客戶資料歸集應(yīng)具備基于資料信息的規(guī)則匹配識別和基于客戶海量的通信相關(guān)信息的挖掘識別方法:1)通過規(guī)則匹配識別技術(shù),高效地完成準(zhǔn)確性較高的資料信息自然人識別;2)基于大數(shù)據(jù)技術(shù)構(gòu)建自然人識別模式,作為規(guī)則識別的有效補(bǔ)充,提高自然人識別成功率,減少人工核查確認(rèn)工作量。實體歸集數(shù)據(jù)流程實體歸集過程基于實體完整性原生數(shù)據(jù)自然人識別自然人沉淀專區(qū)應(yīng)用保證上層覆蓋性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論