企業(yè)IT數(shù)字化運(yùn)維運(yùn)營平臺(總體架構(gòu)、總體藍(lán)圖)建設(shè)方案_第1頁
企業(yè)IT數(shù)字化運(yùn)維運(yùn)營平臺(總體架構(gòu)、總體藍(lán)圖)建設(shè)方案_第2頁
企業(yè)IT數(shù)字化運(yùn)維運(yùn)營平臺(總體架構(gòu)、總體藍(lán)圖)建設(shè)方案_第3頁
企業(yè)IT數(shù)字化運(yùn)維運(yùn)營平臺(總體架構(gòu)、總體藍(lán)圖)建設(shè)方案_第4頁
企業(yè)IT數(shù)字化運(yùn)維運(yùn)營平臺(總體架構(gòu)、總體藍(lán)圖)建設(shè)方案_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

企業(yè)IT數(shù)字化運(yùn)維運(yùn)營平臺(總體架構(gòu)、總體藍(lán)圖)建設(shè)方案整理制作:郎豐利1519制作時間:2023年睿利而行整理制作:郎豐利1519制作時間:2023年睿利而行整理制作:郎豐利1519制作時間:2023年睿利而行2023年目錄/Contents業(yè)務(wù)背景概述01解決方案概述02成功應(yīng)用案例03整理制作:郎豐利1519制作時間:2023年睿利而行整理制作:郎豐利1519制作時間:2023年睿利而行整理制作:郎豐利1519制作時間:2023年睿利而行業(yè)務(wù)背景概述1IT運(yùn)維趨勢·我們正在走入萬物互聯(lián)的數(shù)據(jù)時代運(yùn)維在人類未來的生產(chǎn)生活中的作用會越來越重要。預(yù)計(jì)到2020年全球?qū)⒂?00億到1000億的IT設(shè)備,這些設(shè)備會承載無數(shù)的服務(wù),涵蓋互聯(lián)網(wǎng)、金融、物聯(lián)網(wǎng)、智能制造、電信、電力網(wǎng)絡(luò)、政府等等的生產(chǎn)生活的方方面面。運(yùn)維要做的是保障業(yè)務(wù)能夠可靠高速高效安全的運(yùn)轉(zhuǎn),因?yàn)樗鼤苯佑绊懙綐I(yè)務(wù)的收益和成本。萬物互聯(lián)&數(shù)據(jù)時代IT運(yùn)維重要性·運(yùn)維是企業(yè)業(yè)務(wù)發(fā)展的基礎(chǔ)保障IT系統(tǒng)架構(gòu)機(jī)房環(huán)境硬件設(shè)備網(wǎng)絡(luò)中間件業(yè)務(wù)數(shù)據(jù)系統(tǒng)應(yīng)用IT監(jiān)控運(yùn)維業(yè)務(wù)運(yùn)營人員方法流程工具可用性成本連續(xù)性性能體驗(yàn)設(shè)備故障系統(tǒng)異常系統(tǒng)故障系統(tǒng)變更企業(yè)IT監(jiān)控運(yùn)維是企業(yè)業(yè)務(wù)正常與高效運(yùn)轉(zhuǎn)的基礎(chǔ)保障系統(tǒng)監(jiān)控維修更新業(yè)務(wù)保障應(yīng)用反饋IT運(yùn)維現(xiàn)狀·被動救火式運(yùn)維模式,業(yè)務(wù)風(fēng)險高、運(yùn)維人員疲于奔命基礎(chǔ)設(shè)施網(wǎng)絡(luò)存儲服務(wù)器虛擬化數(shù)據(jù)庫中間件業(yè)務(wù)應(yīng)用離散式人工化被動式高風(fēng)險低評價IT設(shè)備規(guī)模大且分散、管理非常困難缺少可視化管理&自動化管理手段IT環(huán)境異構(gòu)、業(yè)務(wù)系統(tǒng)繁多無法快速適應(yīng)復(fù)雜環(huán)境設(shè)備的監(jiān)管運(yùn)維人員能力層次不齊,服務(wù)范圍廣缺少規(guī)范的、自動的IT運(yùn)維流程化管理業(yè)務(wù)負(fù)載逐年增加,無法確定功能完整可用性業(yè)務(wù)形態(tài)更加多種多樣,部署環(huán)境愈加復(fù)雜為了適應(yīng)發(fā)展的需求,業(yè)務(wù)調(diào)整日趨頻繁大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)、人工智能等技術(shù)的快速演進(jìn)以及應(yīng)用,對運(yùn)維團(tuán)隊(duì)提出了更高的要求整理制作:郎豐利1519制作時間:2023年睿利而行整理制作:郎豐利1519制作時間:2023年睿利而行整理制作:郎豐利1519制作時間:2023年睿利而行IT運(yùn)維挑戰(zhàn)·隨著技術(shù)以及企業(yè)信息化與數(shù)字化的迅猛發(fā)展,給IT運(yùn)維帶來了全新的挑戰(zhàn)業(yè)務(wù)變化越來越快系統(tǒng)變更越來越頻新系統(tǒng)上線越來越多業(yè)務(wù)訪問量快速增長用戶體驗(yàn)要求越來越高業(yè)務(wù)處理時效性更高業(yè)務(wù)中斷容忍度更低高層對IT部門考核更嚴(yán)……系統(tǒng)架構(gòu)越來越復(fù)雜故障類型越來越多系統(tǒng)負(fù)載更大、故障風(fēng)險高故障排查、修復(fù)更難技術(shù)快速演進(jìn)與新技術(shù)應(yīng)用人員技術(shù)能力與經(jīng)驗(yàn)不足人員成本越來越高知識經(jīng)驗(yàn)無法沉淀……外部挑戰(zhàn)內(nèi)部挑戰(zhàn)規(guī)模更大要求更高變化更快排障更難外部挑戰(zhàn)內(nèi)部挑戰(zhàn)&&IT運(yùn)維需求·企業(yè)對IT運(yùn)維提出新的需求運(yùn)維視角研發(fā)視角業(yè)務(wù)視角技術(shù)棧越來越復(fù)雜,越來越難于監(jiān)控各產(chǎn)品線頻繁發(fā)布,各層面問題不斷,傳統(tǒng)的監(jiān)控系統(tǒng)無法提供問題定位能力多種類型的監(jiān)控、告警不統(tǒng)一,反而引出額外的關(guān)注點(diǎn)提供開箱即用的監(jiān)控平臺,不需要擠占研發(fā)成本提供應(yīng)用層面的監(jiān)控能力,幫助研發(fā)團(tuán)隊(duì)提高業(yè)務(wù)平臺質(zhì)量提供基于日志、鏈路的監(jiān)控、告警能力,從而能無侵入的添加業(yè)務(wù)監(jiān)控埋點(diǎn)面對激烈的市場競爭,希望業(yè)務(wù)系統(tǒng)更加穩(wěn)定、迭代更加快速提供業(yè)務(wù)監(jiān)控、告警能力,從而及時獲取業(yè)務(wù)增長、業(yè)務(wù)異常情況提供異常問題的全生命周期查看、跟蹤,從而評估業(yè)務(wù)損失等后續(xù)改進(jìn)措施提供統(tǒng)一的標(biāo)準(zhǔn),用于衡量業(yè)務(wù)平臺的質(zhì)量,從而有針對性的提出規(guī)范提供統(tǒng)一、開放、開箱即用的監(jiān)控、告警平臺,減少重復(fù)投資、提高監(jiān)控覆蓋面,提升整體運(yùn)維質(zhì)量,從而提高企業(yè)競爭力企業(yè)視角因此,構(gòu)建智能化、主動式的IT監(jiān)控與運(yùn)維能力將成為企業(yè)的必然選擇被動救火式維護(hù)智能主動式監(jiān)控定時粗略巡查等待故障報告人工故障處理實(shí)時全面監(jiān)控分散維護(hù)系統(tǒng)集中監(jiān)控系統(tǒng)自動故障處理提前故障預(yù)警隨著業(yè)務(wù)對IT運(yùn)維提出的要求越來越高,原來傳統(tǒng)的被動救火式的IT運(yùn)維模式已經(jīng)不能滿足企業(yè)的要求,無法為業(yè)務(wù)的發(fā)展提供保障只有借助當(dāng)前先進(jìn)的技術(shù),構(gòu)建主動巡防式的IT監(jiān)控與運(yùn)維體系,能夠提前預(yù)防并智能化處理系統(tǒng)的各類故障,才為業(yè)務(wù)的快速發(fā)展保駕護(hù)航,滿足企業(yè)對IT的要求高風(fēng)險低評價離散化人工化低風(fēng)險高價值一體化智能化解決方案概述2設(shè)計(jì)思路·通過體系化-自主化-自動化-智能化設(shè)計(jì),助力IT運(yùn)營降本增效企業(yè)IT統(tǒng)一智能運(yùn)營管理平臺一期二期遠(yuǎn)期業(yè)務(wù)網(wǎng)管日志平臺Zabbix大數(shù)據(jù)平臺機(jī)器學(xué)習(xí)平臺基于故障告警自動執(zhí)行修復(fù)命令周期性任務(wù)腳本執(zhí)行…基于趨勢自動運(yùn)維基于趨勢擴(kuò)容縮容……基于歷史重大事件的自動運(yùn)維基于歷史數(shù)據(jù)分析的主動運(yùn)維……智能化自主化自動化一體化基于告警及任務(wù)指令基于技術(shù)與業(yè)務(wù)規(guī)則基于機(jī)器學(xué)習(xí)模型根據(jù)故障告警及所配置的周期性任務(wù)等明確的指令自動執(zhí)行運(yùn)維工作基于趨勢型等規(guī)則,根據(jù)指標(biāo)數(shù)據(jù)自動發(fā)現(xiàn)故障并自動執(zhí)行修復(fù)工作基于歷史故障與日志等數(shù)據(jù),通過自學(xué)習(xí)模型發(fā)現(xiàn)潛在問題與風(fēng)險并自行處理構(gòu)建IT一體化運(yùn)營能力構(gòu)建從基礎(chǔ)設(shè)備、系統(tǒng)、業(yè)務(wù)的統(tǒng)一監(jiān)控,實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)全面運(yùn)營CMDB云管平臺工單系統(tǒng)一期管理體系·構(gòu)建面向業(yè)務(wù)的主動式統(tǒng)一運(yùn)營理體系構(gòu)建統(tǒng)一IT運(yùn)營管理體系,對基礎(chǔ)設(shè)備、系統(tǒng)、業(yè)務(wù)進(jìn)行統(tǒng)一運(yùn)營管理,提供IT運(yùn)維監(jiān)控、業(yè)務(wù)可視化監(jiān)控、業(yè)務(wù)端到端管理、應(yīng)用質(zhì)量保障等多個領(lǐng)域的綜合運(yùn)維管理能力,促進(jìn)中心IT運(yùn)營降本增效。統(tǒng)一資源管理能力資源數(shù)據(jù)采集日志統(tǒng)一監(jiān)控管理能力監(jiān)控規(guī)則告警推送統(tǒng)一運(yùn)維操作能力流程工具操作配置運(yùn)維人員綜合保障&精細(xì)化運(yùn)維能力業(yè)務(wù)級可視化運(yùn)維用戶感知統(tǒng)一運(yùn)維流程管理能力流程規(guī)范流程監(jiān)控全流程業(yè)務(wù)管理能力業(yè)務(wù)級運(yùn)維管理管理人員構(gòu)建面向業(yè)務(wù)的數(shù)據(jù)驅(qū)動的主動式運(yùn)維以數(shù)據(jù)驅(qū)動運(yùn)營管理,輔助運(yùn)營運(yùn)維決策;利用數(shù)據(jù)可視化技術(shù)展示綜合運(yùn)營情況,提供統(tǒng)一運(yùn)營管理視圖,掌握運(yùn)營態(tài)勢。構(gòu)建閉環(huán)運(yùn)維管理,明確職責(zé)分工,保障系統(tǒng)穩(wěn)定運(yùn)行;固話化運(yùn)維流程、實(shí)現(xiàn)運(yùn)維流程電子化、移動化;全鏈路質(zhì)量管控,業(yè)務(wù)服務(wù)實(shí)時監(jiān)控與分析,保障業(yè)務(wù)服務(wù)穩(wěn)定運(yùn)行。對物理、邏輯、應(yīng)用、業(yè)務(wù)資源的全面管理;實(shí)現(xiàn)對設(shè)備、數(shù)據(jù)、系統(tǒng)等統(tǒng)一監(jiān)控運(yùn)營保障;對日常運(yùn)維操作通過編排,任務(wù)定制形成操作場景,實(shí)現(xiàn)自動化處理故障恢復(fù)。決策人員統(tǒng)一運(yùn)營分析管理能力運(yùn)營分析統(tǒng)一運(yùn)維監(jiān)控管理視圖管理視圖綜合視圖個人視圖數(shù)據(jù)挖掘日常報表流程管理業(yè)務(wù)鏈管理建設(shè)目標(biāo)·實(shí)現(xiàn)IT運(yùn)維工作目標(biāo)與組織業(yè)務(wù)目標(biāo)的融合管理組織制度工具建設(shè)目標(biāo)統(tǒng)一監(jiān)控智能運(yùn)維IT運(yùn)營管理制度IT運(yùn)營管理流程IT運(yùn)營管理技術(shù)規(guī)范標(biāo)準(zhǔn)……IT服務(wù)臺服務(wù)支撐組服務(wù)協(xié)調(diào)組通過監(jiān)控運(yùn)維人員組織、制度及工具的建設(shè)和完善,構(gòu)建面向“設(shè)備-系統(tǒng)-業(yè)務(wù)”的主動式統(tǒng)一IT運(yùn)營管理體系,保障各信息系統(tǒng)穩(wěn)定性和業(yè)務(wù)的連續(xù)性,實(shí)現(xiàn)IT監(jiān)控運(yùn)維工作目標(biāo)與組織業(yè)務(wù)目標(biāo)的融合管理。運(yùn)維目標(biāo):系統(tǒng)穩(wěn)定性、數(shù)據(jù)完備性保障業(yè)務(wù)目標(biāo):業(yè)務(wù)持續(xù)、穩(wěn)定、高效運(yùn)轉(zhuǎn)總體定位·利用大數(shù)據(jù)與AI技術(shù),通過IT設(shè)備與系統(tǒng)運(yùn)行指標(biāo)數(shù)據(jù)的深度挖掘,實(shí)現(xiàn)智能化IT監(jiān)控與運(yùn)維預(yù)防查找潛在風(fēng)險,提供主動預(yù)防策略預(yù)測構(gòu)建模型,預(yù)測未來趨勢分析分析歷史數(shù)據(jù)輔助根源問題分析整合整合歷史監(jiān)控數(shù)據(jù),輔助IT系統(tǒng)綜合管理監(jiān)控監(jiān)控當(dāng)前IT系統(tǒng)整體運(yùn)行的狀態(tài)企業(yè)IT統(tǒng)一智能運(yùn)營管理以大數(shù)據(jù)分析能力支撐的智能IT監(jiān)控運(yùn)維管理平臺機(jī)器數(shù)據(jù)分析傳統(tǒng)ITSM、APM、NPM、SOC、CloudManagement保障業(yè)務(wù)、降低風(fēng)險、提升效率構(gòu)建智能化運(yùn)維體系自主化智能化多維度精細(xì)化一體化可視化總體藍(lán)圖IT統(tǒng)一智能運(yùn)營管理IT物聯(lián)網(wǎng)大數(shù)據(jù)云計(jì)算智能故障分析大屏統(tǒng)一監(jiān)控快速故障修復(fù)信息推送與告警故障報告數(shù)據(jù)匯集深度分析發(fā)現(xiàn)故障/風(fēng)險數(shù)據(jù)分析可視化展示信息推送報表管理資源管理智能監(jiān)控運(yùn)維流程管理操作管理運(yùn)營分析調(diào)整算法查收報告整體監(jiān)控信息配置處理告警處理故障設(shè)置任務(wù)數(shù)據(jù)采集主動探測告警、修復(fù)識別、預(yù)測實(shí)時任務(wù)定時全面多維智能基礎(chǔ)能力CPU、存儲、網(wǎng)絡(luò)資源數(shù)據(jù)中間件、數(shù)據(jù)庫、應(yīng)用服務(wù)企業(yè)IT統(tǒng)一智能運(yùn)營管理方案基于大數(shù)據(jù)技術(shù),參照ITSS、ITIL等技術(shù)與行業(yè)標(biāo)準(zhǔn),為企業(yè)(單位)注入業(yè)務(wù)化、規(guī)范化、智能化的系統(tǒng)運(yùn)營與維護(hù)能力,助力構(gòu)建完善、科學(xué)的平臺運(yùn)維體系,以確保整個業(yè)務(wù)的高效運(yùn)營。統(tǒng)一門戶設(shè)備網(wǎng)絡(luò)存儲主機(jī)中間件應(yīng)用日志鏈路業(yè)務(wù)總體架構(gòu)·基于“統(tǒng)一技術(shù)+業(yè)務(wù)中臺”架構(gòu)設(shè)計(jì),支撐“統(tǒng)一規(guī)劃+分步實(shí)施“的建設(shè)模式監(jiān)管對象設(shè)備網(wǎng)絡(luò)系統(tǒng)中間件業(yè)務(wù)/應(yīng)用日志…后臺計(jì)算資源存儲資源網(wǎng)絡(luò)資源標(biāo)準(zhǔn)接口中臺基礎(chǔ)能力核心能力平臺管理組織管理用戶管理角色管理權(quán)限管理配置管理日志管理運(yùn)維管理中心智能監(jiān)控中心資源管理中心運(yùn)營分析中心告警管理中心AI算法引擎流程管理引擎分布式框架分布式存儲搜索引擎分布式緩存服務(wù)調(diào)度流處理引擎消息引擎數(shù)據(jù)共享服務(wù)前臺統(tǒng)一門戶PC端移動端大屏統(tǒng)一運(yùn)維管控平臺采用中臺技術(shù)架構(gòu),整個架構(gòu)核心由基礎(chǔ)能力平臺、核心能力平臺及統(tǒng)一門戶組成。管理人員運(yùn)營人員運(yùn)維人員普通人員功能架構(gòu)用戶管理系統(tǒng)管理權(quán)限管理參數(shù)配置流程管理日志管理消息管理指標(biāo)采集數(shù)據(jù)管理數(shù)據(jù)清洗探傷管理數(shù)據(jù)管理數(shù)據(jù)模型算法管理任務(wù)調(diào)度設(shè)置配置管理清洗規(guī)則配置監(jiān)控模型配置告警規(guī)則配置診斷知識配置運(yùn)維知識配置業(yè)務(wù)管理監(jiān)控應(yīng)用管理資源管理監(jiān)控系統(tǒng)管理監(jiān)控對象管理監(jiān)控設(shè)備管理監(jiān)控任務(wù)管理監(jiān)控管理監(jiān)控模型管理監(jiān)控記錄管理監(jiān)控指標(biāo)管理告警消息管理告警管理告警事件管理告警處理分派告警規(guī)則管理診斷任務(wù)管理診斷管理診斷知識確認(rèn)診斷結(jié)果確認(rèn)診斷知識管理運(yùn)維任務(wù)處理運(yùn)維管理自動運(yùn)維管理運(yùn)維記錄管理運(yùn)維知識管理故障處理管理故障管理人工故障登記故障匯總管理告警故障確認(rèn)監(jiān)控告警處理應(yīng)用門戶故障管理分析運(yùn)維任務(wù)管理大屏監(jiān)控大屏監(jiān)控數(shù)據(jù)統(tǒng)計(jì)總體流程系統(tǒng)具備智能化的IT設(shè)備與系統(tǒng)(故障/風(fēng)險)智能化監(jiān)控,及自主化運(yùn)維能力,不僅可以及時發(fā)現(xiàn)各類故障以及潛在的故障風(fēng)險,還可以在確診故障后進(jìn)行主動的故障修復(fù)處理,實(shí)現(xiàn)IT運(yùn)維工作的智能化與自主化。監(jiān)控數(shù)據(jù)采集指標(biāo)數(shù)據(jù)清洗故障告警監(jiān)控設(shè)備故障告警故障風(fēng)險告警智能故障診斷故障原因確診自動故障修復(fù)人工故障修復(fù)人工風(fēng)險確認(rèn)告警事件庫故障庫人工故障處理發(fā)現(xiàn)故障識別風(fēng)險智能風(fēng)險診斷故障原因疑診人工執(zhí)行修復(fù)任務(wù)派送自動執(zhí)行任務(wù)派送任務(wù)派送確認(rèn)故障按照給出的解決方案執(zhí)行即可原因診斷,處理建議原因診斷,處理建議清洗規(guī)則監(jiān)控模型診斷知識庫機(jī)器學(xué)習(xí)素材庫自動生成監(jiān)控等規(guī)則指標(biāo)數(shù)據(jù)庫診斷知識庫統(tǒng)一門戶·面向不同角色與場景,提供可視化的集中監(jiān)控應(yīng)用,全面感知系統(tǒng)健康度統(tǒng)一門戶以使用角色和場景展現(xiàn)統(tǒng)為主線,面向不同使用者特定場景,實(shí)現(xiàn)對業(yè)務(wù)、系統(tǒng)資源或能力的“可視”、“可控”、“可追溯”,分角色分權(quán)限向決策層、管理、基層維護(hù)人員提供統(tǒng)一的運(yùn)維視圖。而數(shù)據(jù)可視化支持PC、大屏、手機(jī)等多端展示,讓不同人員可以實(shí)現(xiàn)隨時、隨地的可視化的平臺運(yùn)維管理。01統(tǒng)一門戶提升效率02數(shù)據(jù)可視化,全面感知03移動APP,隨時隨地高效辦公資源管理·對系統(tǒng)資源進(jìn)行全面、全過程規(guī)范管控,實(shí)現(xiàn)平臺資源的可控、可視、可靠平臺資源管理中心通過構(gòu)建CMDB,將企業(yè)/單位所涉及的資源數(shù)據(jù)集中、統(tǒng)一標(biāo)準(zhǔn)化管理,實(shí)現(xiàn)資源數(shù)據(jù)全生命周期的唯一性、準(zhǔn)確性、完整性和可維護(hù)性,為IT運(yùn)維提供準(zhǔn)確的基礎(chǔ)資源數(shù)據(jù),為業(yè)務(wù)的高效運(yùn)行與維護(hù)奠定基礎(chǔ)。Hypervisor虛擬化網(wǎng)絡(luò)中間件存儲服務(wù)器數(shù)據(jù)庫進(jìn)程資源各類IT與系統(tǒng)資源對象資源配置維護(hù)資源自動發(fā)現(xiàn)資源關(guān)系自動發(fā)現(xiàn)資源關(guān)系維護(hù)調(diào)整CMDB標(biāo)準(zhǔn)化唯一性準(zhǔn)確性完整性資源配置管理資源基線管理資源下線、報廢資源上線管控流程資源狀態(tài)變更管控資源自動稽核資源準(zhǔn)確性稽核資源合規(guī)性稽核智能監(jiān)控-多維監(jiān)控·從多個維度進(jìn)行運(yùn)行監(jiān)控,保障應(yīng)用與業(yè)務(wù)的可用和連續(xù)性系統(tǒng)A系統(tǒng)B系統(tǒng)C系統(tǒng)D系統(tǒng)E系統(tǒng)F系統(tǒng)…主機(jī)操作系統(tǒng)數(shù)據(jù)庫中間件

應(yīng)用服務(wù)部門A部門B部門C部門主管業(yè)務(wù)骨干技術(shù)專家技術(shù)業(yè)務(wù)管理T從技術(shù)角度發(fā)現(xiàn)問題從技術(shù)的角度來對系統(tǒng)運(yùn)行狀態(tài)進(jìn)行分析,識別、預(yù)測并排除故障,保障系統(tǒng)可用。B從業(yè)務(wù)視角排除故障從業(yè)務(wù)的視角來分析故障帶來的影響,排除故障,確保系統(tǒng)業(yè)務(wù)的可用與連續(xù)性。M從管理視角分析風(fēng)險從管理的視角來檢查使用狀態(tài)與分析問題和風(fēng)險,確保系統(tǒng)使用符合企業(yè)管理要求與規(guī)范。智能監(jiān)控-基礎(chǔ)監(jiān)控·對基礎(chǔ)IT資源進(jìn)行全覆蓋實(shí)時監(jiān)控,保障相關(guān)設(shè)備穩(wěn)定運(yùn)行IT統(tǒng)一智能運(yùn)營管理平臺Hypervisor虛擬化網(wǎng)絡(luò)SNMPSDK中間件JMX/CLI存儲SNMP/SMI-S服務(wù)器SNMPAgent數(shù)據(jù)庫JDBC新資源協(xié)議操作系統(tǒng)網(wǎng)絡(luò)流量流量分析硬件監(jiān)控存儲監(jiān)控基礎(chǔ)設(shè)施系統(tǒng)層中間層應(yīng)用層業(yè)務(wù)層vCenteNagiosCactiZabbixPRTG…對象內(nèi)容層級工具對IT系統(tǒng)所包含的對象、資源與內(nèi)容進(jìn)行細(xì)致的分層與分類全面連接、監(jiān)控各類IT資源與內(nèi)容,全面采集數(shù)據(jù)不同類型資源使用不同的監(jiān)控與管理工具通過精細(xì)化的數(shù)據(jù)采集,實(shí)現(xiàn)對It系統(tǒng)的多維度、全面監(jiān)控與運(yùn)維智能監(jiān)控-應(yīng)用系統(tǒng)監(jiān)控·分類分層一體化監(jiān)控實(shí)現(xiàn)系統(tǒng)全方位可視建立統(tǒng)一的應(yīng)用系統(tǒng)監(jiān)控視圖,實(shí)現(xiàn)貫穿物理層、邏輯層、應(yīng)用層等運(yùn)行狀況統(tǒng)一監(jiān)控;通過將關(guān)聯(lián)運(yùn)維數(shù)據(jù)(性能、告警、日志等)整合,支持運(yùn)維人員對于各IT應(yīng)用系統(tǒng)的整體運(yùn)行情況進(jìn)行一屏監(jiān)控。監(jiān)控范圍應(yīng)用系統(tǒng)A應(yīng)用系統(tǒng)B應(yīng)用系統(tǒng)C應(yīng)用系統(tǒng)D應(yīng)用系統(tǒng)E應(yīng)用系統(tǒng)F…..應(yīng)用全景監(jiān)控視圖,實(shí)現(xiàn)系統(tǒng)全方位可視應(yīng)用進(jìn)程中間件數(shù)據(jù)庫底層設(shè)備多層級:多數(shù)據(jù)源:性能、告警、日志…智能監(jiān)控-業(yè)務(wù)監(jiān)控·構(gòu)建服務(wù)鏈,實(shí)現(xiàn)對業(yè)務(wù)端到端全局監(jiān)控,精準(zhǔn)定位問題,保障業(yè)務(wù)穩(wěn)定業(yè)務(wù)/服務(wù)鏈A業(yè)務(wù)/服務(wù)鏈B業(yè)務(wù)/服務(wù)鏈C業(yè)務(wù)/服務(wù)鏈D通過構(gòu)建服務(wù)調(diào)用鏈,實(shí)現(xiàn)對業(yè)務(wù)全局節(jié)點(diǎn)所涉及的應(yīng)用和服務(wù)的實(shí)時監(jiān)控與分析,及時發(fā)現(xiàn)業(yè)務(wù)故障、迅速定位問題,全面保障業(yè)務(wù)可用性、及時性、準(zhǔn)確性等,并大幅提升運(yùn)維管理效率。支持調(diào)用鏈數(shù)據(jù)采集方式,實(shí)現(xiàn)在系統(tǒng)內(nèi)與系統(tǒng)間各個服務(wù)的數(shù)據(jù)采集支持業(yè)務(wù)鏈數(shù)據(jù)采集方式,實(shí)現(xiàn)在不同系統(tǒng)間采集應(yīng)用數(shù)據(jù)提供圖形化的界面來配置業(yè)務(wù)服務(wù)調(diào)用鏈關(guān)系模型(流程拓?fù)鋱D)告警管理-智能化監(jiān)控模型設(shè)計(jì),統(tǒng)一告警策略配置,自動故障與風(fēng)險告警配置統(tǒng)一的事件告警策略,在監(jiān)控過程中,一旦發(fā)現(xiàn)符合告警策略的事件,即會自動發(fā)出告警,并將告警事件進(jìn)行統(tǒng)一管理與分析??梢远x不同事件/風(fēng)險的等級,然后根據(jù)事件/風(fēng)險等級,設(shè)置不同的告警策略可以定義事件的告警方式,告警聯(lián)系人員范圍,告警內(nèi)容等可以集中配置、更新、管理告警策略實(shí)時監(jiān)控監(jiān)控模型庫故障告警風(fēng)險告警系統(tǒng)監(jiān)控數(shù)據(jù)實(shí)時數(shù)據(jù)監(jiān)控發(fā)現(xiàn)故障及時告警識別風(fēng)險潛在問題告警事件庫狀態(tài)預(yù)測趨勢預(yù)測事件匯總事件匯總?cè)藶樵O(shè)置機(jī)器學(xué)習(xí)告警事件告警規(guī)則庫告警方式告警內(nèi)容模版告警聯(lián)系人人為設(shè)置告警管理-建立標(biāo)準(zhǔn)、細(xì)致的IT監(jiān)控指標(biāo)庫,實(shí)現(xiàn)一體化、精細(xì)化IT監(jiān)控監(jiān)控指標(biāo)庫主機(jī)監(jiān)控CPU使用率內(nèi)存使用率網(wǎng)絡(luò)寫入I/O…磁盤使用率磁盤寫入I/O網(wǎng)絡(luò)丟包率前端監(jiān)控頁面性能監(jiān)控接口性能監(jiān)控數(shù)據(jù)庫/中間件監(jiān)控mysqlredismongonginxtomcathttps……oracle日志查詢應(yīng)用日志應(yīng)用錯誤日志組件日志服務(wù)器日志……監(jiān)控運(yùn)維管理·基于ITIL標(biāo)準(zhǔn),建立規(guī)范、標(biāo)準(zhǔn)化的運(yùn)維管理流程基于ITIL行業(yè)標(biāo)準(zhǔn),結(jié)合企業(yè)自身信息安全、IT運(yùn)維管理標(biāo)準(zhǔn)及制度,建立標(biāo)準(zhǔn)服務(wù)支撐流程,故障定級定界、配套應(yīng)急響應(yīng)流程,保障問題、故障的有序標(biāo)準(zhǔn)化處理。同時,利用各類支撐工具和手段輔助故障與應(yīng)急處理,實(shí)現(xiàn)故障的快速處理,并逐步形成運(yùn)維知識庫,不斷管理和技術(shù)優(yōu)化提升運(yùn)營服務(wù)能力。應(yīng)急響應(yīng)流程服務(wù)支撐流程工具&知識庫監(jiān)控工具操作工具集成工具經(jīng)驗(yàn)沉淀標(biāo)準(zhǔn)方案應(yīng)急預(yù)案運(yùn)維管理·構(gòu)建智能化的監(jiān)控分析能力,識別故障并預(yù)測風(fēng)險,實(shí)現(xiàn)主動、智能的運(yùn)維智能化標(biāo)準(zhǔn)化算法化模型化建立故障識別模型基于體系標(biāo)準(zhǔn)庫建立定義故障的數(shù)據(jù)模型確定每個故障、風(fēng)險、問題的識別數(shù)學(xué)模型可以從不同維度(技術(shù)/業(yè)務(wù)/管理)建立多種故障識別模型梳理故障指標(biāo)體系標(biāo)準(zhǔn)基于保障業(yè)務(wù),確保系統(tǒng)正常運(yùn)行的目標(biāo),梳理出金阿卡指標(biāo)與故障體系標(biāo)準(zhǔn)構(gòu)建監(jiān)控指標(biāo)庫構(gòu)建故障與風(fēng)險類型庫構(gòu)建事件、問題與任務(wù)類型庫設(shè)計(jì)故障分析算法基于故障模型設(shè)計(jì)自動故障與風(fēng)險分析的算法創(chuàng)建IT監(jiān)控與分析任務(wù)(監(jiān)控的系統(tǒng)與內(nèi)容)設(shè)置自動化算法的執(zhí)行與調(diào)度策略自動執(zhí)行算法,識別、預(yù)測故障與風(fēng)險基于實(shí)際效果技術(shù)優(yōu)化、調(diào)整算法運(yùn)維管理-自動運(yùn)維·實(shí)現(xiàn)系統(tǒng)自動巡檢,提升工作效率將日常運(yùn)營管理工作的常態(tài)操作與腳本通過技術(shù)編排固化形成自動化執(zhí)行的操作任務(wù),讓系統(tǒng)自動執(zhí)行、人工觸發(fā)、或供第三方系統(tǒng)直接調(diào)用等方式實(shí)現(xiàn)自動化操作處理,提升日常運(yùn)營工作效率,讓運(yùn)營工作更輕松。縮短操作執(zhí)行時間,提高執(zhí)行效率;減少人工失誤導(dǎo)致的系統(tǒng)故障;提高運(yùn)維自動化水平,減少人工投入,降低運(yùn)營成本。降低了關(guān)鍵崗位的技能要求;消除故障隱患、保證作業(yè)效率;降低日常運(yùn)維工作中人員的時間投入、精力投入。自動化操作運(yùn)營場景命令操作服務(wù)啟停集中配置系統(tǒng)巡檢安全檢測應(yīng)急切換故障預(yù)案……收到告警匹配預(yù)案執(zhí)行任務(wù)告警恢復(fù)故障處理驗(yàn)證通知預(yù)案管理預(yù)案定義預(yù)案編排預(yù)案定時調(diào)度預(yù)案手工調(diào)度預(yù)案執(zhí)行日志預(yù)案管理(審批、權(quán)限、增刪改查)預(yù)案庫周期作業(yè)調(diào)度&批量操作處理運(yùn)維管理-自主運(yùn)維·根據(jù)故障診斷結(jié)果,基于運(yùn)維操作預(yù)案,實(shí)現(xiàn)自主化的運(yùn)維作業(yè)與管理故障告警&日常巡檢自主化運(yùn)維實(shí)時任務(wù)觸發(fā)運(yùn)維作業(yè)預(yù)案可自動執(zhí)行需人工執(zhí)行需人工確認(rèn)疑似診斷故障確診巡檢任務(wù)重啟設(shè)備重啟服務(wù)執(zhí)行命令執(zhí)行腳本……進(jìn)行故障處理自動運(yùn)維作業(yè)確認(rèn)故障以及產(chǎn)生原因故障確診對于已經(jīng)確診的問題,部分可由系統(tǒng)自動進(jìn)行處理對于無法由系統(tǒng)直接進(jìn)行處理的問題,則會派發(fā)相應(yīng)的任務(wù)給到對應(yīng)的人員,由維護(hù)人員進(jìn)行處理而對于無法確診的問題或告警,系統(tǒng)也會派發(fā)相應(yīng)的任務(wù)給到對應(yīng)的維護(hù)人員進(jìn)行確認(rèn)并處理系統(tǒng)自動執(zhí)行自動派發(fā)任務(wù)自動派發(fā)任務(wù)按系統(tǒng)給出的診斷解決方案執(zhí)行如確定是個故障則需進(jìn)行處理故障確診處理方式解決方法執(zhí)行腳本故障描述經(jīng)驗(yàn)沉淀技術(shù)積累人為設(shè)置運(yùn)營分析·挖掘運(yùn)維數(shù)據(jù)潛在價值,輔助維護(hù)與運(yùn)營管理決策基于統(tǒng)一運(yùn)營管理的大量數(shù)據(jù),構(gòu)建運(yùn)維數(shù)據(jù)集中管理,統(tǒng)一運(yùn)營分析中心,通過各類型數(shù)據(jù)的關(guān)聯(lián)分析,基于場景的運(yùn)營分析,挖掘數(shù)據(jù)在運(yùn)營支撐方面潛在價值,實(shí)現(xiàn)數(shù)據(jù)變現(xiàn),從而全面保障生產(chǎn)系統(tǒng)安全、穩(wěn)定、健康,提升服務(wù)和客戶感知。企業(yè)IT統(tǒng)一智能運(yùn)營管理資源數(shù)據(jù)監(jiān)控數(shù)據(jù)告警數(shù)據(jù)故障數(shù)據(jù)操作數(shù)據(jù)日志…設(shè)備故障分析健康狀況分析系統(tǒng)性能分析設(shè)備質(zhì)量分析服務(wù)質(zhì)量分析故障預(yù)測分析方案核心價值被動式維護(hù)模式主動式監(jiān)控模式離散一體局部滯后人工緩慢快速全面提前自動監(jiān)控內(nèi)容故障發(fā)現(xiàn)運(yùn)維方式故障處理保障業(yè)務(wù)提升IT價值提升效率降低成本監(jiān)控模式成功案例分享3成功應(yīng)用案例·某系統(tǒng)集成商OMC平臺IT運(yùn)營管理平臺包括監(jiān)控管理中心、操作管理中心、業(yè)務(wù)管理中心、運(yùn)營管理中心、運(yùn)維管理中心等功能。數(shù)據(jù)采集會自動采集被監(jiān)控系統(tǒng)的各項(xiàng)運(yùn)行數(shù)據(jù),再由統(tǒng)一處理根據(jù)配置的規(guī)則對數(shù)據(jù)進(jìn)行分析。當(dāng)發(fā)現(xiàn)了故障或風(fēng)險時由告警引擎負(fù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論