智慧高速公路大數(shù)據(jù)整體規(guī)劃建設解決方案 ()_第1頁
智慧高速公路大數(shù)據(jù)整體規(guī)劃建設解決方案 ()_第2頁
智慧高速公路大數(shù)據(jù)整體規(guī)劃建設解決方案 ()_第3頁
智慧高速公路大數(shù)據(jù)整體規(guī)劃建設解決方案 ()_第4頁
智慧高速公路大數(shù)據(jù)整體規(guī)劃建設解決方案 ()_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、智慧高速公路大數(shù)據(jù)建設與應用解決方案CONTENT1走進大數(shù)據(jù)時代2高速公路大數(shù)據(jù)應用淺析3大數(shù)據(jù)平臺、架構與實現(xiàn)走進大數(shù)據(jù)時代交通運輸運輸線路優(yōu)化交通信息服務數(shù)字媒休互聯(lián)網(wǎng)廣告用戶標簽零售業(yè)O2O營銷客流與商圈選址醫(yī)療與保健病歷分析疾病監(jiān)測政府政務網(wǎng)上辦事大廳政務熱線地產中介社區(qū)O2O運營客戶畫像電信運營商內部營銷決策對外拓展互聯(lián)網(wǎng)企業(yè)開放平臺應用產品銀行業(yè)精準營銷風險管控教育在線教育教育應用電信政務商業(yè)工業(yè)重點行業(yè)大數(shù)據(jù)應用生命周期數(shù)據(jù)源(管理、交易、事務、傳感、監(jiān)控、文件)數(shù)據(jù)獲取和治理大數(shù)據(jù)存儲大數(shù)據(jù)分析計算處理大數(shù)據(jù)可視化數(shù)據(jù)驅動決策數(shù)據(jù)提供服務大數(shù)據(jù)生態(tài)湖泊數(shù)據(jù)信息知識數(shù)據(jù)運維數(shù)據(jù)

2、之源數(shù)據(jù)生產區(qū)(原始數(shù)據(jù))結構化數(shù)據(jù)文本文件多媒體數(shù)據(jù)描述類數(shù)據(jù)信息發(fā)現(xiàn)區(qū)知識發(fā)現(xiàn)區(qū)知識挖掘區(qū)知識展現(xiàn)區(qū)知識交互區(qū)基于大數(shù)據(jù)的應用體系ODS數(shù)據(jù)魔方多維數(shù)據(jù)關聯(lián)主數(shù)據(jù)數(shù)據(jù)臺賬關鍵索引大數(shù)據(jù)挖掘行業(yè)規(guī)則大數(shù)據(jù)可視化數(shù)據(jù)多維報表大數(shù)據(jù)操縱數(shù)據(jù)APIS大數(shù)據(jù)檢索機構內部數(shù)據(jù)社會數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)數(shù)據(jù)安全數(shù)據(jù)審計數(shù)據(jù)標準元數(shù)據(jù)管理主數(shù)據(jù)管理數(shù)據(jù)質量管理數(shù)據(jù)治理流程元數(shù)據(jù)大數(shù)據(jù)關聯(lián)大數(shù)據(jù)分析大數(shù)據(jù)預測信息數(shù)據(jù)知識應用大數(shù)據(jù),不再是傳統(tǒng)的BI競爭優(yōu)勢數(shù)據(jù)可視化樣本數(shù)據(jù)關聯(lián)關系多維分析統(tǒng)計報表全體數(shù)據(jù)趨勢預測全體數(shù)據(jù)代替樣本數(shù)據(jù) 一般是基于KPI指標等的分析,無法有效支撐決策提供傳統(tǒng)的統(tǒng)計分析功能,提供報表等傳

3、統(tǒng)基于小數(shù)據(jù)量的數(shù)據(jù)分析,樣本數(shù)據(jù)注重關聯(lián)關系而非因果關系數(shù)據(jù)可視化變得尤為重要大數(shù)據(jù)的重點是關聯(lián)關系與趨勢預測大數(shù)據(jù)分析助力提升行業(yè)綜合數(shù)據(jù)應用能力大數(shù)據(jù)關注點 傳統(tǒng)數(shù)據(jù)分析局限數(shù)據(jù)獲取因子分析算法訓練數(shù)據(jù)呈現(xiàn)行業(yè)大數(shù)據(jù)應用面對的挑戰(zhàn)硬件無法跟進數(shù)據(jù)規(guī)模的指數(shù)級增長過于分散和原始成為大數(shù)據(jù)應用的障礙復雜數(shù)據(jù)算法與業(yè)務模型銜接諸多大數(shù)據(jù)并行計算架構的選擇大數(shù)據(jù)應用實現(xiàn)路徑:從哪里開始?專業(yè)人才匱乏CONTENT1走進大數(shù)據(jù)時代2高速公路大數(shù)據(jù)應用淺析3大數(shù)據(jù)平臺、架構與實現(xiàn)4成都四方偉業(yè)公司簡介交通構成的要素人車路交通的參與者(駕駛員、行人、乘客、居民)出行OD、停留時間、人口分布、交通工具、

4、異地通勤、交通負荷、事件分析、政策評估道路交通的主要載體物流車輛管理、車載終端(前后裝)、行車路線規(guī)劃、行車軌跡分析交通的重要組成部分交通路況、路況預測、物流園區(qū)周邊路況負荷評估區(qū)域間客流量交通分析區(qū)域間OD客流量。人口分布以熱圖方式實時展現(xiàn)區(qū)/市/省范圍內人口空間分布,常住人口,流動人口分析出行分析出行次數(shù)、距離、時長及時刻分布及平均數(shù)多路徑分析多分支路徑交通流量占比分析通勤分析職住地分析,通勤特征分析,通勤次數(shù),期望線等客流來源去向某個交通分析區(qū)域客流的來源、去向,出行方式高速公路大數(shù)據(jù)的主要特征數(shù)據(jù)資產=高速公路行業(yè)所有業(yè)務數(shù)據(jù)+信息化搜集手段技術手段=互聯(lián)網(wǎng)技術+數(shù)據(jù)分析模型+數(shù)據(jù)可視

5、化技術分析方法=高速公路運營管理經驗+數(shù)據(jù)建模分析經驗互聯(lián)網(wǎng)+大數(shù)據(jù) = 數(shù)據(jù)資產+技術手段+分析方法高速公路行業(yè)數(shù)據(jù)規(guī)模大、業(yè)務體量大。持續(xù)生產經營過程及其業(yè)務對象的統(tǒng)計頻率較高、信息迭代速度較快。現(xiàn)有業(yè)務領域較為廣泛以及未來的多元化發(fā)展,呈現(xiàn)出數(shù)據(jù)的多樣性 速度快真實性多樣性大價值體量大能夠為高速公路營運管理提供科學管理和科學決策的依據(jù),從而提高效率、降本增效 來自于高速公路行業(yè)真實的生產經營場景,能夠客觀反映其真實的生產經營情況 工業(yè)大數(shù)據(jù)能幫我們做什么投資 收費 稽查/追偷逃 決策支持 展示大屏 信息服務 人口流動 治超高速公路作為國家基礎設施高速公路內部管理運營高速公路社會服務屬性對

6、外展示決策支持高速公路經營盈利訴求收費額度排名,收費構成分析,ETC/MTC分析,通行量/通行費統(tǒng)計分析,偷逃費行為識別和預防路況與施工發(fā)布,特殊天氣提醒,輻射資源提示,交通旅游,人口流動與出行預測高速公路道路與設備的養(yǎng)護,成本效益評估分析,服務區(qū)評估,高速公路經營分析、高速公路工程建設與投融資堵點評估,疏導路徑,高速公路應急救援(交通疏導、人員救治、危化品應急處理),現(xiàn)場實時視頻,事故多發(fā)地關聯(lián)分析與事故預防運營提升資產 工程 養(yǎng)護 財務 營運 設施 擁堵治理 應急救援 物資調度 客運/貨運 高速公路公共屬性通行費征收出行服務分析BigData高速公路大數(shù)據(jù)來源與構成數(shù)據(jù)管理制度數(shù)據(jù)安全數(shù)據(jù)

7、/元數(shù)據(jù)標準人力財務辦公審批通行收費數(shù)據(jù)視頻監(jiān)控數(shù)據(jù)內部管理數(shù)據(jù)EMMS機電設備數(shù)據(jù)數(shù)據(jù)字典基礎資料高速公路IT運行規(guī)則定義與管理備品備件位置信息運行狀態(tài)與故障報修使用壽命與養(yǎng)護評估設備代碼管理工程投資信貸運營路面關鍵節(jié)點監(jiān)控收費站通行視頻監(jiān)控事故救援實時視頻車型出/入狀態(tài)通行時長通行里程圖片采集繳費金額繳費時間繳費方式高速公路大數(shù)據(jù):擁堵治理模型大數(shù)據(jù)高速治堵應用場景目標功能設計模型構建掌握車流量變化模式,提前預測車流量變化趨勢。掌握車流量變化模式,提前預測車流量變化趨勢。掌握車流量變化模式,提前預測車流量變化趨勢。123通過收費數(shù)據(jù)得到車輛信息,建立交通主題數(shù)據(jù)庫。分析交通流量日變特性、時

8、變特性,擬合出車流量變化模型,并基于此預測未來車流量?;陬A測車流量,計算最優(yōu)的人力資源配置。123車輛信息采集車流量分析及預測人力資源配置采用支持向量回歸(SVR)模型,由歷史車流量數(shù)據(jù)訓練出車流量模型用于預測。建立人力資源配置非線性優(yōu)化模型,利用遺傳規(guī)劃算法求出最優(yōu)解。12車流量預測模型車流量分析及預測高速公路大數(shù)據(jù):物流分析模型高速公路物流分析大數(shù)據(jù)應用場景目標功能設計模型構建挖掘通行數(shù)據(jù)的潛在價值,實現(xiàn)數(shù)據(jù)變現(xiàn)。提升通行數(shù)據(jù)的社會公眾服務的能力,擴大經營范圍。12通過收費站數(shù)據(jù)提取貨車OD信息,并計算載重變化,獲得貨源信息推送對象。通過微信、短信或APP等將與貨車匹配的貨源信息推送給空

9、載貨車車主,完成接單。12貨車載重變化計算貨源信息推送建立交通網(wǎng)絡圖模型,規(guī)劃單車最優(yōu)行駛路徑。利用兩階段聚類方法,求出多車輛物流合乘匹配優(yōu)化方案。12貨運配載的路徑匹配模型車輛合乘匹配模型3以物流信息推送為前提,發(fā)揮物流信息的深層價值。高速公路大數(shù)據(jù):輔助養(yǎng)護決策支持大數(shù)據(jù)輔助養(yǎng)護決策支持應用場景目標功能設計模型構建掌握道路上車輛的軸荷分布、相關機電設備歷史狀態(tài)信息。根據(jù)交通模型預測路面損毀程度,合理提出道路養(yǎng)護計劃。根據(jù)機電維護歷史數(shù)據(jù)建立設備養(yǎng)護評價體系。123通過收費數(shù)據(jù)得到交通量、軸荷歷史分布信息并預測未來分布。通過交通量、軸荷等信息預測路面使用性能,包括路面損毀程度等?;陬A測的路

10、面使用性能,計算最優(yōu)養(yǎng)護時機及成本。123交通量分析及預測路面使用性能預測路面養(yǎng)護成本預測建立神經網(wǎng)絡與馬爾科夫算法結合的組合預測模型,由各影響因素預測路面使用性能。通過最小二乘法擬合得到養(yǎng)護成本與載荷和非載荷因素的計量模型,從而進行成本預測。12路面使用性能預測模型路面養(yǎng)護成本預測模型主要應用方向高速公路運行指標體系高速公路大數(shù)據(jù)經濟高速公路群體要素大數(shù)據(jù)關鍵指標統(tǒng)計分析與展示客貨運量、周轉量及其時間和空間的分布,統(tǒng)計排名通行規(guī)費收入,及其時間和空間分布、統(tǒng)計排名各路段擁堵系數(shù)交通事故發(fā)生率及其時間空間分布,統(tǒng)計排名 具體車輛和事件分析擁堵分析,包括擁堵疏導和擁堵根因事故分析,指導路徑規(guī)劃和

11、警示標志設置車輛通行異常,包括速度時間不匹配、入口出口車牌不符、以及高速路違法行為,整治秩序,追捕逃費 挖掘高速公路通行宏觀規(guī)律總結交通事故規(guī)律,探索提升安全管理途徑通過高速公路出行數(shù)據(jù),分析人群流動方向和規(guī)律,出行規(guī)律與支付習慣分析高速機電設備故障損耗規(guī)律,提升養(yǎng)護效率,節(jié)約成本 探尋高速公路數(shù)據(jù)的經濟價值高速公路客運/貨運指數(shù)探索高速公路客貨物流與相關經濟要素的關系對比高速公路通行與其他交通方式的關聯(lián)關系經營分析:工程建設與道路養(yǎng)護等成本投入,經濟效益關聯(lián)分析高速公路建設企業(yè)信用評估 車輛行為分析展示門戶高速路網(wǎng)運行狀態(tài)基于GIS的全監(jiān)控高速路網(wǎng)運行全指標可視化結合GIS的故障、擁堵和交通

12、事故實時警示、視頻調取基于投資、運營、安全、服務多視角領導決策駕駛艙高速公路大數(shù)據(jù)頂層設計高速公路大數(shù)據(jù)系統(tǒng)架構(在大數(shù)據(jù)平臺基礎上畫一個架構)高速公路大數(shù)據(jù)應用剖析運行維護體系技術視角部署視角業(yè)務視角標準規(guī)范體系信息安全體系計算資源網(wǎng)絡資源存儲資源網(wǎng)絡資源業(yè)務管理地理決策元數(shù)據(jù)文檔虛擬化軟件數(shù)據(jù)庫軟件操作系統(tǒng)備份軟件治理流程數(shù)據(jù)審計數(shù)據(jù)標準數(shù)據(jù)臺賬機器學習人工智能深度學習實時分析GIS呈現(xiàn)貨運客運指數(shù)偷逃行為分析事故地點分析站點擁堵分析超速車輛識別車輛行為軌跡出入車牌不符機電設備養(yǎng)護高清設備投放電子支付分析站點設備異常內部門戶外部門戶決策分析系統(tǒng)三大業(yè)務職能內部精細化運營管理,降本增效面向管

13、理部門的信息化服務面向公眾的信息化服務123物理部署數(shù)據(jù)交換匯聚平臺數(shù)據(jù)治理平臺智能分析平臺可視化應用平臺數(shù)據(jù)安全數(shù)據(jù)質量資源目錄元數(shù)據(jù)管理基礎設施層: 規(guī)劃建設統(tǒng)一3個視角3大業(yè)務職能4類核心平臺數(shù) 據(jù) 層: 數(shù)據(jù)標準統(tǒng)一應用支撐層: 技術路線統(tǒng)一應 用 層: 業(yè)務規(guī)劃統(tǒng)一門 戶 層: 對外服務統(tǒng)一5個統(tǒng)一的建設思路高速公路大數(shù)據(jù)高速公路大數(shù)據(jù)CONTENT1走進大數(shù)據(jù)時代2高速公路大數(shù)據(jù)應用淺析3大數(shù)據(jù)平臺、架構與實現(xiàn)4成都四方偉業(yè)公司簡介WYDC大數(shù)據(jù)平臺總體架構用戶管理系統(tǒng)監(jiān)控資源管理部署管理資源調度安全管理日志審計運維平臺Manager數(shù)據(jù)交換匯集ETL網(wǎng)絡爬蟲(PySpider)實

14、時采集(Flume)數(shù)據(jù)遷移(Sqoop)數(shù)據(jù)治理Govern數(shù)據(jù)地圖數(shù)據(jù)共享數(shù)據(jù)質量數(shù)據(jù)治理銀行業(yè)務工商業(yè)務政務業(yè)務稅務稽查智能交通智慧醫(yī)療Hive(SQL)MapReduceHDFSYARNImpala(In-memory SQL)Mahout(Machine Learning)Spark(MLlib)Pig(Scripting)可視設計UE敏捷BI根因分析DE關聯(lián)分析XE搜索引擎推薦引擎輿情監(jiān)控反欺詐圖像識別語音識別用戶畫像智能管理APISDK應用&服務采集存儲&計算數(shù)據(jù)探索統(tǒng)計分析敏捷OLAP數(shù)據(jù)洞察Insight知識挖掘數(shù)據(jù)挖掘機器學習算法庫人工智能Miner模型庫實時分析實時數(shù)據(jù)庫

15、流數(shù)據(jù)處理流計算Streaming數(shù)據(jù)流規(guī)則分析WYDC大數(shù)據(jù)交換匯集平臺構造大數(shù)據(jù)的數(shù)據(jù)之源大數(shù)據(jù)交換匯集平臺原始數(shù)據(jù)源數(shù)據(jù)采集交換區(qū)數(shù)據(jù)湖分散、種類多樣化,時效性差異大多種技術手段,平臺化系統(tǒng),快速部署,統(tǒng)一管理為大數(shù)據(jù)應用提供全兼容數(shù)據(jù)存儲任務流程調度操作控制流程控制轉換流程數(shù)據(jù)抽取數(shù)據(jù)加載數(shù)據(jù)轉換子任務調度操作控制爬蟲系統(tǒng)流數(shù)據(jù)采集傳輸ETL核心架構ETL服務器認證授權監(jiān)控管理接口擴展接口ETL資源庫集成開發(fā)工具統(tǒng)一管理平臺數(shù)據(jù)資源庫文件資源庫數(shù)據(jù)源接入流程開發(fā)任務配置任務部署調試跟蹤任務執(zhí)行監(jiān)控輸出運行日志運行控制狀態(tài)監(jiān)控日志查看權限管理節(jié)點管理錯誤告警性能統(tǒng)計面板定制ETL引擎任務

16、調度元數(shù)據(jù)處理流程性能管理交換管理任務引擎轉換引擎轉換組件適配器組件轉換流程流程控制操作控制任務調度豐富的ETL構件庫ETL實現(xiàn)各種你所需的數(shù)據(jù)處理流程提高開發(fā)效率縮短開發(fā)周期圖形化拖拽方式快速集成實現(xiàn)復雜數(shù)據(jù)處理流程NoSQL接入 云化部署ETL的監(jiān)控管理單一業(yè)務的任務詳情圖形化展示任務執(zhí)行日志任務運行情況變化曲線全方位洞察一項任務執(zhí)行定義指定任務的報警規(guī)則定制指定任務的報警渠道指定報警信息的接收者根據(jù)需要控制告警規(guī)則的啟用與關閉告警幫你隨時把握任務異常可視化手段多角度作業(yè)監(jiān)控作業(yè)執(zhí)行狀態(tài)與成功率監(jiān)控對作業(yè)進行多角度排序ETL任務執(zhí)行一覽無余WYDC大數(shù)據(jù)應用駕駛艙大數(shù)據(jù)高速飛行的駕駛艙大數(shù)

17、據(jù)應用駕駛艙SqoopHiveHBaseZookepperPigMahoutMapReduceHDFS分布式網(wǎng)絡Cloud服務器/存儲物理安全FlumeHama超強計算能力更低建模門檻全景統(tǒng)一管理更低建設成本可信賴安全機制全方位輔助分析多達50+預置模型支持百億級數(shù)據(jù)量訓練多算法并行訓練支持算法組件,零編碼,拖拽式數(shù)十個流程設計組件用戶自定義算法組件算法庫行業(yè)分類跨平臺算法調用模型訓練結果分析報告參數(shù)化調優(yōu),簡化配置建模全生命周期流程管理可視化實時模型訓練監(jiān)控性能處理,比傳統(tǒng)架構節(jié)省資源1/3搭配智能部署,讓實施成本降低50%多種權限控制機制數(shù)據(jù)級別訪問權限控制資源級別訪問權限控制大數(shù)據(jù)應用流

18、程控制任務耗時情況總覽狀態(tài)監(jiān)控,隨時掌握任務執(zhí)行狀態(tài)的總體分布任務狀態(tài)情況總覽耗時的任務和步驟,需要得到我們的重點關照具體任務耗時追蹤耗時監(jiān)控,透視任務執(zhí)行的時間大數(shù)據(jù)分析流程監(jiān)控與調度大數(shù)據(jù)應用流程實現(xiàn)任務導航列表任務查詢任務創(chuàng)建拖拽算法,拼接數(shù)據(jù)分析流程定義任務基本屬性配置任務調度信息駕駛艙數(shù)據(jù)查詢數(shù)據(jù)圖表數(shù)據(jù)明細元數(shù)據(jù)信息查詢日志歷史記錄HDFS文件基礎計算架構運維管理WYDC大數(shù)據(jù)治理平臺大數(shù)據(jù)治理實現(xiàn)數(shù)據(jù)內升大數(shù)據(jù)治理流域原始業(yè)務數(shù)據(jù)原始業(yè)務數(shù)據(jù)原始業(yè)務數(shù)據(jù)原始業(yè)務數(shù)據(jù)基礎庫主題庫元數(shù)據(jù)數(shù)據(jù)標準數(shù)據(jù)字典目錄系統(tǒng)數(shù)據(jù)倉庫數(shù)據(jù)自由之海數(shù)據(jù)河流數(shù)據(jù)河流大數(shù)據(jù)存儲語義級主題數(shù)據(jù)檢索時間維空間

19、維對象維多維數(shù)據(jù)安全流程審計數(shù)據(jù)采集清洗比對閉環(huán)迭代數(shù)據(jù)梳理編目主數(shù)據(jù)管理多維數(shù)據(jù)檢索與服務大數(shù)據(jù)存儲訪問面向數(shù)據(jù)需求方原始數(shù)據(jù)元數(shù)據(jù)治理流程數(shù)據(jù)標準字典行業(yè)業(yè)務規(guī)則訪問條理安全質量數(shù)據(jù)接口共享開放數(shù)據(jù)檢索數(shù)據(jù)服務我是系統(tǒng)運維主管,要管理好所有數(shù)據(jù)資源的安全我的應用需要訪問和采集大量的數(shù)據(jù)我的大數(shù)據(jù)挖掘模型需要大量數(shù)據(jù)之源我的決策分析要涉及更全面的信息我是信息運營主管,希望隨時了解我有哪些數(shù)據(jù)資源能不能我想要什么都快速查到? 治理的開始:數(shù)據(jù)整合ETL數(shù)據(jù)處理流程數(shù)據(jù)轉換實現(xiàn)數(shù)據(jù)結構的轉變數(shù)據(jù)拼裝實現(xiàn)不同數(shù)據(jù)來源的匯總數(shù)據(jù)比對通過比對去除錯誤和冗余數(shù)據(jù)清洗去偽存真,保留正確數(shù)據(jù)數(shù)據(jù)載入根據(jù)中心

20、存儲裝載數(shù)據(jù)內容治理的脈絡:元數(shù)據(jù)在數(shù)據(jù)調研與業(yè)務中積累元數(shù)據(jù)調研表格與報告部門元數(shù)據(jù)收集數(shù)據(jù)調研梳理元數(shù)據(jù)定義與生成元數(shù)據(jù)存儲元數(shù)據(jù)應用與維護元數(shù)據(jù)標準元數(shù)據(jù)管理與服務自動對中心數(shù)據(jù)資源生成結構化元數(shù)據(jù)減小工作量投入可通過標準定義自動生成數(shù)據(jù)表自動偵測元數(shù)據(jù)本身也是一個體系元數(shù)據(jù)按規(guī)劃層級存儲選擇數(shù)據(jù)庫等載體以便于檢索為目標存儲元數(shù)據(jù)元數(shù)據(jù)準確性維護元數(shù)據(jù)完整性維護元數(shù)據(jù)分中心之間支持交換同步元數(shù)據(jù)維護便捷訪問元數(shù)據(jù)基于元數(shù)據(jù)輕松定位數(shù)據(jù)存儲與訪問便于數(shù)據(jù)組裝編制構成數(shù)據(jù)目錄元數(shù)據(jù)檢索治理的標尺:數(shù)據(jù)標準與質量數(shù)據(jù)比對規(guī)則行業(yè)規(guī)則數(shù)據(jù)/元數(shù)據(jù)標準數(shù)據(jù)質量報告數(shù)據(jù)清洗比對參照規(guī)則多源數(shù)據(jù)中心前

21、置緩存自動/人工比對反向清洗數(shù)據(jù)中心資源維護階段數(shù)據(jù)中心中心資源治理階段數(shù)據(jù)整合階段數(shù)據(jù)字典數(shù)據(jù)依標準的格式轉換數(shù)據(jù)采集數(shù)據(jù)傳輸數(shù)據(jù)標準管理數(shù)據(jù)質量管理數(shù)據(jù)分類與目錄規(guī)則定義與管理標準設計管理大數(shù)據(jù)治理平臺:段碼數(shù)據(jù)標準管理大數(shù)據(jù)治理平臺:信息類管理大數(shù)據(jù)治理平臺:質量管理系統(tǒng)規(guī)則定義大數(shù)據(jù)治理平臺:質量管理系統(tǒng)大數(shù)據(jù)治理平臺:質量管理系統(tǒng)大數(shù)據(jù)治理平臺:質量管理系統(tǒng)大數(shù)據(jù)治理平臺:數(shù)據(jù)資源目錄大數(shù)據(jù)治理平臺:信息類授權大數(shù)據(jù)治理平臺:數(shù)據(jù)臺賬大數(shù)據(jù)治理平臺核心價值更全面的數(shù)據(jù)質量保障提供數(shù)據(jù)標準梳理工具,使得元數(shù)據(jù)更合規(guī) 支持策略集的質量巡檢方式,保障數(shù)據(jù)的完整性全景化信息開放與檢索支持主題

22、的數(shù)據(jù)臺賬,基于元數(shù)據(jù)的信息管理,提供數(shù)據(jù)資源目錄與導航多渠道的數(shù)據(jù)訪問機制(目錄、API、Webservices)全過程信息安全支持交換全過程監(jiān)控、審計,并提供郵件、短信預警功能基于oAuth協(xié)議的第三方單點登陸集成的模塊支持通道安全,支持SSL傳輸通道加密功能支持數(shù)據(jù)及資源級別訪問安全控制,可靈活對脫敏數(shù)據(jù)進行管理更低的建設成本產品自主化量身定制適合應用的實踐路線智能部署,比同類產品實施節(jié)省一半時間基于大量實踐的,通用解決方案WYDC大數(shù)據(jù)智能分析平臺大數(shù)據(jù)知識挖掘的核心引擎大數(shù)據(jù)分析平臺關鍵能力開放彈性架構真正無共享的海量并行處理架構工業(yè)標準的X86平臺服務器資源按需分配,按需搭建集群,

23、按需縮放集群規(guī)模在線線性擴展增加節(jié)點可線性增加存儲、查詢和加載性能支持在線擴容,擴容期間保證系統(tǒng)繼續(xù)對外提供服務擁有成本可控保證用戶不被專有平臺鎖定企業(yè)初期投入和后續(xù)擴容的成本可控海量并行處理支持PB級的數(shù)據(jù)處理、存儲和訪問在數(shù)據(jù)加載、處理、訪問等各個環(huán)節(jié)最大化并行處理能力優(yōu)秀混合負載按需分配資源(CPU、內存、IO)動態(tài)調整資源平臺持續(xù)可用數(shù)據(jù)鏡像、硬件冗余等多種容錯技術保證系統(tǒng)高可用故障切換和恢復,對用戶透明擴容期間可持續(xù)對外服務易于管理維護直觀的圖形化界面,實時的狀態(tài)監(jiān)控最大限度降低管理員的日常管理和維護工作數(shù)據(jù)分析挖掘功能架構模型庫數(shù)據(jù)分析算法庫Mahout算法庫Spark Mlib自

24、定義算法算法審核模型評估模型發(fā)布模型訓練模型管理統(tǒng)計分析MOLAPROLAPKylin數(shù)據(jù)挖掘數(shù)據(jù)挖掘數(shù)據(jù)預處理算法選擇模型構建與評估結果預測數(shù)據(jù)探索知識庫知識分類管理版本與發(fā)布管理訂閱管理知識庫檢索數(shù)據(jù)源選擇R集成Python集成數(shù)據(jù)源選擇超強的計算能力多達50種以上的預置模型;支持百億級數(shù)據(jù)量訓練;輔助分析能力快速展現(xiàn)模型訓練結果;參數(shù)化模型調優(yōu);可信賴的安全控制提供多種權限控制設置;支持數(shù)據(jù)級別訪問安全控制;支持資源級別訪問安全控制;數(shù)據(jù)倉庫數(shù)據(jù)集市PetaBase支持數(shù)據(jù)庫類型:Oracle/DB2/MySQL/Teradata/GreenPlum/Netezza/SQL Server

25、/Sybase/支持數(shù)據(jù)庫類型:Oracle/DB2/MySQL/Teradata/GreenPlum/Netezza/SQL Server/Sybase/EssBaseHadoop分布式高性能交互式SQL數(shù)據(jù)挖掘Miner可視化環(huán)境簡單易用的可視化環(huán)境視覺呈現(xiàn)所有利益相關者之間的合作可以簡單高效設計更好的模型每一個分析是一個流程每種數(shù)據(jù)轉化或分析是一個節(jié)點操作界面強大的工程支撐流程可以當做模板再次使用支持項目工程建模1000多個節(jié)點可用于所有的數(shù)據(jù)轉化和分析基于客戶端/服務器架構可實現(xiàn)自動化建模和數(shù)據(jù)轉化可建立和評估模型,并與其他應用程序集成系統(tǒng)支持Miner數(shù)據(jù)分析建模與HadoopHiv

26、e(SQL)MapReduceHDFSYARNImpala(In-memory SQL)Mahout(Machine Learning)Spark(Mlib)Pig(Scripting)數(shù)據(jù)洞察MinerData preparationBuild modelTrain Predictive model數(shù)據(jù)分析建模全生命周期業(yè)務場景導入數(shù)學分析建模大數(shù)據(jù)模型發(fā)布應用大數(shù)據(jù)應用政務大數(shù)據(jù)應用工業(yè)大數(shù)據(jù)應用交通大數(shù)據(jù)應用旅游大數(shù)據(jù)應用 數(shù)據(jù)歸集與預處理算法選擇算法自定義分析建模設計模型訓練模型發(fā)布模型調度運行管理知識庫管理模型運行大數(shù)據(jù)運行服務大數(shù)據(jù)可視化展示知識庫共享大數(shù)據(jù)智能分析平臺大數(shù)據(jù)應用駕

27、駛艙大數(shù)據(jù)可視化平臺大數(shù)據(jù)算法庫Miner自動化流程及控制流程控制在子流程中管理分組并在其他項目中再利用可以重復執(zhí)行一部分流程支持的循環(huán):屬性、標簽、子集、值、樣本、集群、批量、數(shù)據(jù)結合、數(shù)據(jù)碎片、參數(shù)、文件、資源庫條目分支(If-Then-Else)基于:、數(shù)據(jù)值、屬性是否存在、樣本數(shù)量、性能值、文件和過程輸入是否存在、任意表達式創(chuàng)建同一類型的集合集合處理:選擇、扁平化或循環(huán)可以記憶并調用(中間件)過程結果用于復雜的流程設計處理預期或非預期的錯誤和異常自動化自動選取性能最好的子流程通過嵌套的交叉驗證或其他驗證衡量預處理步驟的效果自動選取最優(yōu)模型類型和參數(shù)自動選取最優(yōu)屬性子集自動優(yōu)化過程參數(shù),

28、包括建模參數(shù):Grid、二次方程的、漸進的日志在流程中的任意位置都可以引入日志日志可以收集參數(shù)值、性能值、或來自每個算子的特定值,例如漸進算法當前產生的結果數(shù)據(jù)值可以被日志記錄宏值可以被日志記錄日志值可以被轉化為其他幾種格式,包括數(shù)據(jù)集合和權重,權重可以和其他數(shù)據(jù)集合一樣被存儲、轉化或可視化報表在僅用日志不足夠的情況下,一個完整的基于流程的報告引擎允許在靜態(tài)報告中收集任意結果支持不同的格式,如PDF,Excel,HTML,或者RTF有不同的報告樣式,包括序列報告或者門戶網(wǎng)站任意過程結果和中間結果可以被轉化為不同類型的可視化圖形,如表格,圖標等持最多5層區(qū)域支持分頁和其他樣式信息與循環(huán)或者其他流程控制結構的結合可以讓人看到流程設計非常詳細的結果概覽,即使這個流程設計十分復雜導入數(shù)據(jù)建立工作空間關聯(lián)數(shù)據(jù)建立工作流數(shù)據(jù)預處理特征選擇模型訓練模型評估自動化及流程控制多人協(xié)作Miner的數(shù)據(jù)建模分析準備數(shù)據(jù)準備,支持屬性選取算子,分組結合多種功能:求和、平均、中間值,支持集合算子,處理原數(shù)據(jù),性值過濾行及樣本等,識別并移除冗余數(shù)據(jù);支撐數(shù)據(jù)取樣、數(shù)據(jù)分割、數(shù)據(jù)轉化等。 數(shù)據(jù)取樣絕對的、相對的、概率的、平均的、分層的、基于模型的等.數(shù)據(jù)分箱可基于計數(shù)、大小、頻率等進行交互式分箱,使引導區(qū)熵值最小化.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論