版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
企業(yè)IT智能化統(tǒng)一運營管理解決方案--企業(yè)IT系統(tǒng)監(jiān)控運維管理平臺目錄/Contents業(yè)務(wù)背景概述01解決方案概述02業(yè)務(wù)背景概述1IT運維趨勢·我們正在走入萬物互聯(lián)的數(shù)據(jù)時代運維在人類未來的生產(chǎn)生活中的作用會越來越重要。預(yù)計到2020年全球?qū)⒂?00億到1000億的IT設(shè)備,這些設(shè)備會承載無數(shù)的服務(wù),涵蓋互聯(lián)網(wǎng)、金融、物聯(lián)網(wǎng)、智能制造、電信、電力網(wǎng)絡(luò)、政府等等的生產(chǎn)生活的方方面面。運維要做的是保障業(yè)務(wù)能夠可靠高速高效安全的運轉(zhuǎn),因為它會直接影響到業(yè)務(wù)的收益和成本。萬物互聯(lián)&數(shù)據(jù)時代IT運維重要性·運維是企業(yè)業(yè)務(wù)發(fā)展的基礎(chǔ)保障IT系統(tǒng)架構(gòu)機房環(huán)境硬件設(shè)備網(wǎng)絡(luò)中間件業(yè)務(wù)數(shù)據(jù)系統(tǒng)應(yīng)用IT監(jiān)控運維業(yè)務(wù)運營人員方法流程工具可用性成本連續(xù)性性能體驗設(shè)備故障系統(tǒng)異常系統(tǒng)故障系統(tǒng)變更企業(yè)IT監(jiān)控運維是企業(yè)業(yè)務(wù)正常與高效運轉(zhuǎn)的基礎(chǔ)保障系統(tǒng)監(jiān)控維修更新業(yè)務(wù)保障應(yīng)用反饋IT運維現(xiàn)狀·被動救火式運維模式,業(yè)務(wù)風(fēng)險高、運維人員疲于奔命基礎(chǔ)設(shè)施網(wǎng)絡(luò)存儲服務(wù)器虛擬化數(shù)據(jù)庫中間件業(yè)務(wù)應(yīng)用離散式人工化被動式高風(fēng)險低評價IT設(shè)備規(guī)模大且分散、管理非常困難缺少可視化管理&自動化管理手段IT環(huán)境異構(gòu)、業(yè)務(wù)系統(tǒng)繁多無法快速適應(yīng)復(fù)雜環(huán)境設(shè)備的監(jiān)管運維人員能力層次不齊,服務(wù)范圍廣缺少規(guī)范的、自動的IT運維流程化管理業(yè)務(wù)負(fù)載逐年增加,無法確定功能完整可用性業(yè)務(wù)形態(tài)更加多種多樣,部署環(huán)境愈加復(fù)雜為了適應(yīng)發(fā)展的需求,業(yè)務(wù)調(diào)整日趨頻繁大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)、人工智能等技術(shù)的快速演進以及應(yīng)用,對運維團隊提出了更高的要求IT運維挑戰(zhàn)·隨著技術(shù)以及企業(yè)信息化與數(shù)字化的迅猛發(fā)展,給IT運維帶來了全新的挑戰(zhàn)業(yè)務(wù)變化越來越快系統(tǒng)變更越來越頻新系統(tǒng)上線越來越多業(yè)務(wù)訪問量快速增長用戶體驗要求越來越高業(yè)務(wù)處理時效性更高業(yè)務(wù)中斷容忍度更低高層對IT部門考核更嚴(yán)……系統(tǒng)架構(gòu)越來越復(fù)雜故障類型越來越多系統(tǒng)負(fù)載更大、故障風(fēng)險高故障排查、修復(fù)更難技術(shù)快速演進與新技術(shù)應(yīng)用人員技術(shù)能力與經(jīng)驗不足人員成本越來越高知識經(jīng)驗無法沉淀……外部挑戰(zhàn)內(nèi)部挑戰(zhàn)規(guī)模更大要求更高變化更快排障更難外部挑戰(zhàn)內(nèi)部挑戰(zhàn)&&IT運維需求·企業(yè)對IT運維提出新的需求運維視角研發(fā)視角業(yè)務(wù)視角技術(shù)棧越來越復(fù)雜,越來越難于監(jiān)控各產(chǎn)品線頻繁發(fā)布,各層面問題不斷,傳統(tǒng)的監(jiān)控系統(tǒng)無法提供問題定位能力多種類型的監(jiān)控、告警不統(tǒng)一,反而引出額外的關(guān)注點提供開箱即用的監(jiān)控平臺,不需要擠占研發(fā)成本提供應(yīng)用層面的監(jiān)控能力,幫助研發(fā)團隊提高業(yè)務(wù)平臺質(zhì)量提供基于日志、鏈路的監(jiān)控、告警能力,從而能無侵入的添加業(yè)務(wù)監(jiān)控埋點面對激烈的市場競爭,希望業(yè)務(wù)系統(tǒng)更加穩(wěn)定、迭代更加快速提供業(yè)務(wù)監(jiān)控、告警能力,從而及時獲取業(yè)務(wù)增長、業(yè)務(wù)異常情況提供異常問題的全生命周期查看、跟蹤,從而評估業(yè)務(wù)損失等后續(xù)改進措施提供統(tǒng)一的標(biāo)準(zhǔn),用于衡量業(yè)務(wù)平臺的質(zhì)量,從而有針對性的提出規(guī)范提供統(tǒng)一、開放、開箱即用的監(jiān)控、告警平臺,減少重復(fù)投資、提高監(jiān)控覆蓋面,提升整體運維質(zhì)量,從而提高企業(yè)競爭力企業(yè)視角因此,構(gòu)建智能化、主動式的IT監(jiān)控與運維能力將成為企業(yè)的必然選擇被動救火式維護智能主動式監(jiān)控定時粗略巡查等待故障報告人工故障處理實時全面監(jiān)控分散維護系統(tǒng)集中監(jiān)控系統(tǒng)自動故障處理提前故障預(yù)警隨著業(yè)務(wù)對IT運維提出的要求越來越高,原來傳統(tǒng)的被動救火式的IT運維模式已經(jīng)不能滿足企業(yè)的要求,無法為業(yè)務(wù)的發(fā)展提供保障只有借助當(dāng)前先進的技術(shù),構(gòu)建主動巡防式的IT監(jiān)控與運維體系,能夠提前預(yù)防并智能化處理系統(tǒng)的各類故障,才為業(yè)務(wù)的快速發(fā)展保駕護航,滿足企業(yè)對IT的要求高風(fēng)險低評價離散化人工化低風(fēng)險高價值一體化智能化解決方案概述2設(shè)計思路·通過體系化-自主化-自動化-智能化設(shè)計,助力IT運營降本增效企業(yè)IT統(tǒng)一智能運營管理平臺一期二期遠期業(yè)務(wù)網(wǎng)管日志平臺Zabbix大數(shù)據(jù)平臺機器學(xué)習(xí)平臺基于故障告警自動執(zhí)行修復(fù)命令周期性任務(wù)腳本執(zhí)行…基于趨勢自動運維基于趨勢擴容縮容……基于歷史重大事件的自動運維基于歷史數(shù)據(jù)分析的主動運維……智能化自主化自動化一體化基于告警及任務(wù)指令基于技術(shù)與業(yè)務(wù)規(guī)則基于機器學(xué)習(xí)模型根據(jù)故障告警及所配置的周期性任務(wù)等明確的指令自動執(zhí)行運維工作基于趨勢型等規(guī)則,根據(jù)指標(biāo)數(shù)據(jù)自動發(fā)現(xiàn)故障并自動執(zhí)行修復(fù)工作基于歷史故障與日志等數(shù)據(jù),通過自學(xué)習(xí)模型發(fā)現(xiàn)潛在問題與風(fēng)險并自行處理構(gòu)建IT一體化運營能力構(gòu)建從基礎(chǔ)設(shè)備、系統(tǒng)、業(yè)務(wù)的統(tǒng)一監(jiān)控,實現(xiàn)業(yè)務(wù)系統(tǒng)全面運營CMDB云管平臺工單系統(tǒng)一期管理體系·構(gòu)建面向業(yè)務(wù)的主動式統(tǒng)一運營理體系構(gòu)建統(tǒng)一IT運營管理體系,對基礎(chǔ)設(shè)備、系統(tǒng)、業(yè)務(wù)進行統(tǒng)一運營管理,提供IT運維監(jiān)控、業(yè)務(wù)可視化監(jiān)控、業(yè)務(wù)端到端管理、應(yīng)用質(zhì)量保障等多個領(lǐng)域的綜合運維管理能力,促進中心IT運營降本增效。統(tǒng)一資源管理能力資源數(shù)據(jù)采集日志統(tǒng)一監(jiān)控管理能力監(jiān)控規(guī)則告警推送統(tǒng)一運維操作能力流程工具操作配置運維人員綜合保障&精細(xì)化運維能力業(yè)務(wù)級可視化運維用戶感知統(tǒng)一運維流程管理能力流程規(guī)范流程監(jiān)控全流程業(yè)務(wù)管理能力業(yè)務(wù)級運維管理管理人員構(gòu)建面向業(yè)務(wù)的數(shù)據(jù)驅(qū)動的主動式運維以數(shù)據(jù)驅(qū)動運營管理,輔助運營運維決策;利用數(shù)據(jù)可視化技術(shù)展示綜合運營情況,提供統(tǒng)一運營管理視圖,掌握運營態(tài)勢。構(gòu)建閉環(huán)運維管理,明確職責(zé)分工,保障系統(tǒng)穩(wěn)定運行;固話化運維流程、實現(xiàn)運維流程電子化、移動化;全鏈路質(zhì)量管控,業(yè)務(wù)服務(wù)實時監(jiān)控與分析,保障業(yè)務(wù)服務(wù)穩(wěn)定運行。對物理、邏輯、應(yīng)用、業(yè)務(wù)資源的全面管理;實現(xiàn)對設(shè)備、數(shù)據(jù)、系統(tǒng)等統(tǒng)一監(jiān)控運營保障;對日常運維操作通過編排,任務(wù)定制形成操作場景,實現(xiàn)自動化處理故障恢復(fù)。決策人員統(tǒng)一運營分析管理能力運營分析統(tǒng)一運維監(jiān)控管理視圖管理視圖綜合視圖個人視圖數(shù)據(jù)挖掘日常報表流程管理業(yè)務(wù)鏈管理建設(shè)目標(biāo)·實現(xiàn)IT運維工作目標(biāo)與組織業(yè)務(wù)目標(biāo)的融合管理組織制度工具建設(shè)目標(biāo)統(tǒng)一監(jiān)控智能運維IT運營管理制度IT運營管理流程IT運營管理技術(shù)規(guī)范標(biāo)準(zhǔn)……IT服務(wù)臺服務(wù)支撐組服務(wù)協(xié)調(diào)組通過監(jiān)控運維人員組織、制度及工具的建設(shè)和完善,構(gòu)建面向“設(shè)備-系統(tǒng)-業(yè)務(wù)”的主動式統(tǒng)一IT運營管理體系,保障各信息系統(tǒng)穩(wěn)定性和業(yè)務(wù)的連續(xù)性,實現(xiàn)IT監(jiān)控運維工作目標(biāo)與組織業(yè)務(wù)目標(biāo)的融合管理。運維目標(biāo):系統(tǒng)穩(wěn)定性、數(shù)據(jù)完備性保障業(yè)務(wù)目標(biāo):業(yè)務(wù)持續(xù)、穩(wěn)定、高效運轉(zhuǎn)總體定位·利用大數(shù)據(jù)與AI技術(shù),通過IT設(shè)備與系統(tǒng)運行指標(biāo)數(shù)據(jù)的深度挖掘,實現(xiàn)智能化IT監(jiān)控與運維預(yù)防查找潛在風(fēng)險,提供主動預(yù)防策略預(yù)測構(gòu)建模型,預(yù)測未來趨勢分析分析歷史數(shù)據(jù)輔助根源問題分析整合整合歷史監(jiān)控數(shù)據(jù),輔助IT系統(tǒng)綜合管理監(jiān)控監(jiān)控當(dāng)前IT系統(tǒng)整體運行的狀態(tài)企業(yè)IT統(tǒng)一智能運營管理以大數(shù)據(jù)分析能力支撐的智能IT監(jiān)控運維管理平臺機器數(shù)據(jù)分析傳統(tǒng)ITSM、APM、NPM、SOC、CloudManagement保障業(yè)務(wù)、降低風(fēng)險、提升效率構(gòu)建智能化運維體系自主化智能化多維度精細(xì)化一體化可視化總體藍圖IT統(tǒng)一智能運營管理IT物聯(lián)網(wǎng)大數(shù)據(jù)云計算智能故障分析大屏統(tǒng)一監(jiān)控快速故障修復(fù)信息推送與告警故障報告數(shù)據(jù)匯集深度分析發(fā)現(xiàn)故障/風(fēng)險數(shù)據(jù)分析可視化展示信息推送報表管理資源管理智能監(jiān)控運維流程管理操作管理運營分析調(diào)整算法查收報告整體監(jiān)控信息配置處理告警處理故障設(shè)置任務(wù)數(shù)據(jù)采集主動探測告警、修復(fù)識別、預(yù)測實時任務(wù)定時全面多維智能基礎(chǔ)能力CPU、存儲、網(wǎng)絡(luò)資源數(shù)據(jù)中間件、數(shù)據(jù)庫、應(yīng)用服務(wù)企業(yè)IT統(tǒng)一智能運營管理方案基于大數(shù)據(jù)技術(shù),參照ITSS、ITIL等技術(shù)與行業(yè)標(biāo)準(zhǔn),為企業(yè)(單位)注入業(yè)務(wù)化、規(guī)范化、智能化的系統(tǒng)運營與維護能力,助力構(gòu)建完善、科學(xué)的平臺運維體系,以確保整個業(yè)務(wù)的高效運營。統(tǒng)一門戶設(shè)備網(wǎng)絡(luò)存儲主機中間件應(yīng)用日志鏈路業(yè)務(wù)總體架構(gòu)·基于“統(tǒng)一技術(shù)+業(yè)務(wù)中臺”架構(gòu)設(shè)計,支撐“統(tǒng)一規(guī)劃+分步實施“的建設(shè)模式監(jiān)管對象設(shè)備網(wǎng)絡(luò)系統(tǒng)中間件業(yè)務(wù)/應(yīng)用日志…后臺計算資源存儲資源網(wǎng)絡(luò)資源標(biāo)準(zhǔn)接口中臺基礎(chǔ)能力核心能力平臺管理組織管理用戶管理角色管理權(quán)限管理配置管理日志管理運維管理中心智能監(jiān)控中心資源管理中心運營分析中心告警管理中心AI算法引擎流程管理引擎分布式框架分布式存儲搜索引擎分布式緩存服務(wù)調(diào)度流處理引擎消息引擎數(shù)據(jù)共享服務(wù)前臺統(tǒng)一門戶PC端移動端大屏統(tǒng)一運維管控平臺采用中臺技術(shù)架構(gòu),整個架構(gòu)核心由基礎(chǔ)能力平臺、核心能力平臺及統(tǒng)一門戶組成。管理人員運營人員運維人員普通人員功能架構(gòu)用戶管理系統(tǒng)管理權(quán)限管理參數(shù)配置流程管理日志管理消息管理指標(biāo)采集數(shù)據(jù)管理數(shù)據(jù)清洗探傷管理數(shù)據(jù)管理數(shù)據(jù)模型算法管理任務(wù)調(diào)度設(shè)置配置管理清洗規(guī)則配置監(jiān)控模型配置告警規(guī)則配置診斷知識配置運維知識配置業(yè)務(wù)管理監(jiān)控應(yīng)用管理資源管理監(jiān)控系統(tǒng)管理監(jiān)控對象管理監(jiān)控設(shè)備管理監(jiān)控任務(wù)管理監(jiān)控管理監(jiān)控模型管理監(jiān)控記錄管理監(jiān)控指標(biāo)管理告警消息管理告警管理告警事件管理告警處理分派告警規(guī)則管理診斷任務(wù)管理診斷管理診斷知識確認(rèn)診斷結(jié)果確認(rèn)診斷知識管理運維任務(wù)處理運維管理自動運維管理運維記錄管理運維知識管理故障處理管理故障管理人工故障登記故障匯總管理告警故障確認(rèn)監(jiān)控告警處理應(yīng)用門戶故障管理分析運維任務(wù)管理大屏監(jiān)控大屏監(jiān)控數(shù)據(jù)統(tǒng)計總體流程系統(tǒng)具備智能化的IT設(shè)備與系統(tǒng)(故障/風(fēng)險)智能化監(jiān)控,及自主化運維能力,不僅可以及時發(fā)現(xiàn)各類故障以及潛在的故障風(fēng)險,還可以在確診故障后進行主動的故障修復(fù)處理,實現(xiàn)IT運維工作的智能化與自主化。監(jiān)控數(shù)據(jù)采集指標(biāo)數(shù)據(jù)清洗故障告警監(jiān)控設(shè)備故障告警故障風(fēng)險告警智能故障診斷故障原因確診自動故障修復(fù)人工故障修復(fù)人工風(fēng)險確認(rèn)告警事件庫故障庫人工故障處理發(fā)現(xiàn)故障識別風(fēng)險智能風(fēng)險診斷故障原因疑診人工執(zhí)行修復(fù)任務(wù)派送自動執(zhí)行任務(wù)派送任務(wù)派送確認(rèn)故障按照給出的解決方案執(zhí)行即可原因診斷,處理建議原因診斷,處理建議清洗規(guī)則監(jiān)控模型診斷知識庫機器學(xué)習(xí)素材庫自動生成監(jiān)控等規(guī)則指標(biāo)數(shù)據(jù)庫診斷知識庫統(tǒng)一門戶·面向不同角色與場景,提供可視化的集中監(jiān)控應(yīng)用,全面感知系統(tǒng)健康度統(tǒng)一門戶以使用角色和場景展現(xiàn)統(tǒng)為主線,面向不同使用者特定場景,實現(xiàn)對業(yè)務(wù)、系統(tǒng)資源或能力的“可視”、“可控”、“可追溯”,分角色分權(quán)限向決策層、管理、基層維護人員提供統(tǒng)一的運維視圖。而數(shù)據(jù)可視化支持PC、大屏、手機等多端展示,讓不同人員可以實現(xiàn)隨時、隨地的可視化的平臺運維管理。01統(tǒng)一門戶提升效率02數(shù)據(jù)可視化,全面感知03移動APP,隨時隨地高效辦公資源管理·對系統(tǒng)資源進行全面、全過程規(guī)范管控,實現(xiàn)平臺資源的可控、可視、可靠平臺資源管理中心通過構(gòu)建CMDB,將企業(yè)/單位所涉及的資源數(shù)據(jù)集中、統(tǒng)一標(biāo)準(zhǔn)化管理,實現(xiàn)資源數(shù)據(jù)全生命周期的唯一性、準(zhǔn)確性、完整性和可維護性,為IT運維提供準(zhǔn)確的基礎(chǔ)資源數(shù)據(jù),為業(yè)務(wù)的高效運行與維護奠定基礎(chǔ)。Hypervisor虛擬化網(wǎng)絡(luò)中間件存儲服務(wù)器數(shù)據(jù)庫進程資源各類IT與系統(tǒng)資源對象資源配置維護資源自動發(fā)現(xiàn)資源關(guān)系自動發(fā)現(xiàn)資源關(guān)系維護調(diào)整CMDB標(biāo)準(zhǔn)化唯一性準(zhǔn)確性完整性資源配置管理資源基線管理資源下線、報廢資源上線管控流程資源狀態(tài)變更管控資源自動稽核資源準(zhǔn)確性稽核資源合規(guī)性稽核智能監(jiān)控-多維監(jiān)控·從多個維度進行運行監(jiān)控,保障應(yīng)用與業(yè)務(wù)的可用和連續(xù)性系統(tǒng)A系統(tǒng)B系統(tǒng)C系統(tǒng)D系統(tǒng)E系統(tǒng)F系統(tǒng)…主機操作系統(tǒng)數(shù)據(jù)庫中間件
應(yīng)用服務(wù)部門A部門B部門C部門主管業(yè)務(wù)骨干技術(shù)專家技術(shù)業(yè)務(wù)管理T從技術(shù)角度發(fā)現(xiàn)問題從技術(shù)的角度來對系統(tǒng)運行狀態(tài)進行分析,識別、預(yù)測并排除故障,保障系統(tǒng)可用。B從業(yè)務(wù)視角排除故障從業(yè)務(wù)的視角來分析故障帶來的影響,排除故障,確保系統(tǒng)業(yè)務(wù)的可用與連續(xù)性。M從管理視角分析風(fēng)險從管理的視角來檢查使用狀態(tài)與分析問題和風(fēng)險,確保系統(tǒng)使用符合企業(yè)管理要求與規(guī)范。智能監(jiān)控-基礎(chǔ)監(jiān)控·對基礎(chǔ)IT資源進行全覆蓋實時監(jiān)控,保障相關(guān)設(shè)備穩(wěn)定運行IT統(tǒng)一智能運營管理平臺Hypervisor虛擬化網(wǎng)絡(luò)SNMPSDK中間件JMX/CLI存儲SNMP/SMI-S服務(wù)器SNMPAgent數(shù)據(jù)庫JDBC新資源協(xié)議操作系統(tǒng)網(wǎng)絡(luò)流量流量分析硬件監(jiān)控存儲監(jiān)控基礎(chǔ)設(shè)施系統(tǒng)層中間層應(yīng)用層業(yè)務(wù)層vCenteNagiosCactiZabbixPRTG…對象內(nèi)容層級工具對IT系統(tǒng)所包含的對象、資源與內(nèi)容進行細(xì)致的分層與分類全面連接、監(jiān)控各類IT資源與內(nèi)容,全面采集數(shù)據(jù)不同類型資源使用不同的監(jiān)控與管理工具通過精細(xì)化的數(shù)據(jù)采集,實現(xiàn)對It系統(tǒng)的多維度、全面監(jiān)控與運維智能監(jiān)控-應(yīng)用系統(tǒng)監(jiān)控·分類分層一體化監(jiān)控實現(xiàn)系統(tǒng)全方位可視建立統(tǒng)一的應(yīng)用系統(tǒng)監(jiān)控視圖,實現(xiàn)貫穿物理層、邏輯層、應(yīng)用層等運行狀況統(tǒng)一監(jiān)控;通過將關(guān)聯(lián)運維數(shù)據(jù)(性能、告警、日志等)整合,支持運維人員對于各IT應(yīng)用系統(tǒng)的整體運行情況進行一屏監(jiān)控。監(jiān)控范圍應(yīng)用系統(tǒng)A應(yīng)用系統(tǒng)B應(yīng)用系統(tǒng)C應(yīng)用系統(tǒng)D應(yīng)用系統(tǒng)E應(yīng)用系統(tǒng)F…..應(yīng)用全景監(jiān)控視圖,實現(xiàn)系統(tǒng)全方位可視應(yīng)用進程中間件數(shù)據(jù)庫底層設(shè)備多層級:多數(shù)據(jù)源:性能、告警、日志…智能監(jiān)控-業(yè)務(wù)監(jiān)控·構(gòu)建服務(wù)鏈,實現(xiàn)對業(yè)務(wù)端到端全局監(jiān)控,精準(zhǔn)定位問題,保障業(yè)務(wù)穩(wěn)定業(yè)務(wù)/服務(wù)鏈A業(yè)務(wù)/服務(wù)鏈B業(yè)務(wù)/服務(wù)鏈C業(yè)務(wù)/服務(wù)鏈D通過構(gòu)建服務(wù)調(diào)用鏈,實現(xiàn)對業(yè)務(wù)全局節(jié)點所涉及的應(yīng)用和服務(wù)的實時監(jiān)控與分析,及時發(fā)現(xiàn)業(yè)務(wù)故障、迅速定位問題,全面保障業(yè)務(wù)可用性、及時性、準(zhǔn)確性等,并大幅提升運維管理效率。支持調(diào)用鏈數(shù)據(jù)采集方式,實現(xiàn)在系統(tǒng)內(nèi)與系統(tǒng)間各個服務(wù)的數(shù)據(jù)采集支持業(yè)務(wù)鏈數(shù)據(jù)采集方式,實現(xiàn)在不同系統(tǒng)間采集應(yīng)用數(shù)據(jù)提供圖形化的界面來配置業(yè)務(wù)服務(wù)調(diào)用鏈關(guān)系模型(流程拓?fù)鋱D)告警管理-智能化監(jiān)控模型設(shè)計,統(tǒng)一告警策略配置,自動故障與風(fēng)險告警配置統(tǒng)一的事件告警策略,在監(jiān)控過程中,一旦發(fā)現(xiàn)符合告警策略的事件,即會自動發(fā)出告警,并將告警事件進行統(tǒng)一管理與分析??梢远x不同事件/風(fēng)險的等級,然后根據(jù)事件/風(fēng)險等級,設(shè)置不同的告警策略可以定義事件的告警方式,告警聯(lián)系人員范圍,告警內(nèi)容等可以集中配置、更新、管理告警策略實時監(jiān)控監(jiān)控模型庫故障告警風(fēng)險告警系統(tǒng)監(jiān)控數(shù)據(jù)實時數(shù)據(jù)監(jiān)控發(fā)現(xiàn)故障及時告警識別風(fēng)險潛在問題告警事件庫狀態(tài)預(yù)測趨勢預(yù)測事件匯總事件匯總?cè)藶樵O(shè)置機器學(xué)習(xí)告警事件告警規(guī)則庫告警方式告警內(nèi)容模版告警聯(lián)系人人為設(shè)置告警管理-建立標(biāo)準(zhǔn)、細(xì)致的IT監(jiān)控指標(biāo)庫,實現(xiàn)一體化、精細(xì)化IT監(jiān)控監(jiān)控指標(biāo)庫主機監(jiān)控CPU使用率內(nèi)存使用率網(wǎng)絡(luò)寫入I/O…磁盤使用率磁盤寫入I/O網(wǎng)絡(luò)丟包率前端監(jiān)控頁面性能監(jiān)控接口性能監(jiān)控數(shù)據(jù)庫/中間件監(jiān)控mysqlredismongonginxtomcathttps……oracle日志查詢應(yīng)用日志應(yīng)用錯誤日志組件日志服務(wù)器日志……監(jiān)控運維管理·基于ITIL標(biāo)準(zhǔn),建立規(guī)范、標(biāo)準(zhǔn)化的運維管理流程基于ITIL行業(yè)標(biāo)準(zhǔn),結(jié)合企業(yè)自身信息安全、IT運維管理標(biāo)準(zhǔn)及制度,建立標(biāo)準(zhǔn)服務(wù)支撐流程,故障定級定界、配套應(yīng)急響應(yīng)流程,保障問題、故障的有序標(biāo)準(zhǔn)化處理。同時,利用各類支撐工具和手段輔助故障與應(yīng)急處理,實現(xiàn)故障的快速處理,并逐步形成運維知識庫,不斷管理和技術(shù)優(yōu)化提升運營服務(wù)能力。應(yīng)急響應(yīng)流程服務(wù)支撐流程工具&知識庫監(jiān)控工具操作工具集成工具經(jīng)驗沉淀標(biāo)準(zhǔn)方案應(yīng)急預(yù)案運維管理·構(gòu)建智能化的監(jiān)控分析能力,識別故障并預(yù)測風(fēng)險,實現(xiàn)主動、智能的運維智能化標(biāo)準(zhǔn)化算法化模型化建立故障識別模型基于體系標(biāo)準(zhǔn)庫建立定義故障的數(shù)據(jù)模型確定每個故障、風(fēng)險、問題的識別數(shù)學(xué)模型可以從不同維度(技術(shù)/業(yè)務(wù)/管理)建立多種故障識別模型梳理故障指標(biāo)體系標(biāo)準(zhǔn)基于保障業(yè)務(wù),確保系統(tǒng)正常運行的目標(biāo),梳理出金阿卡指標(biāo)與故障體系標(biāo)準(zhǔn)構(gòu)建監(jiān)控指標(biāo)庫構(gòu)建故障與風(fēng)險類型庫構(gòu)建事件、問題與任務(wù)類型庫設(shè)計故障分析算法基于故障模型設(shè)計自動故障與風(fēng)險分析的算法創(chuàng)建IT監(jiān)控與分析任務(wù)(監(jiān)控的系統(tǒng)與內(nèi)容)設(shè)置自動化算法的執(zhí)行與調(diào)度策略自動執(zhí)行算法,識別、預(yù)測故障與風(fēng)險基于實際效果技術(shù)優(yōu)化、調(diào)整算法運維管理-自動運維·實現(xiàn)系統(tǒng)自動巡檢,提升工作效率將日常運營管理工作的常態(tài)操作與腳本通過技術(shù)編排固化形成自動化執(zhí)行的操作任務(wù),讓系統(tǒng)自動執(zhí)行、人工觸發(fā)、或供第三方系統(tǒng)直接調(diào)用等方式實現(xiàn)自動化操作處理,提升日常運營工作效率,讓運營工作更輕松。縮短操作執(zhí)行時間,提高執(zhí)行效率;減少人工失誤導(dǎo)致的系統(tǒng)故障;提高運維自動化水平,減少人工投入,降低運營成本。降低了關(guān)鍵崗位的技能要求;消除故障隱患、保證作業(yè)效率;降低日常運維工作中人員的時間投入、精力投入。自動化操作運營場景
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度無人機研發(fā)與生產(chǎn)合同
- 無煙活動總結(jié)5篇
- 2024總裁助理年終工作總結(jié)范文(5篇)
- 2024年教育輔助人員服務(wù)合同
- 2024年新修訂:叉車操作員雇傭協(xié)議
- 2024年新型飛機買賣條款
- 2024年技術(shù)服務(wù)合同:人工智能輔助醫(yī)療系統(tǒng)
- 2024年房產(chǎn)過戶手續(xù)辦理委托書
- DB4106T 67-2022 數(shù)字鄉(xiāng)村建設(shè)指南
- 2024年建筑項目協(xié)調(diào)合同
- 2023年江門市基層公共就業(yè)創(chuàng)業(yè)服務(wù)崗位招聘考試真題
- 圖解《黑神話悟空》微課件
- 期中模擬測試卷3(試題)-2024-2025學(xué)年三年級上冊數(shù)學(xué)(福建)
- 全國大學(xué)英語六級詞匯表
- 數(shù)字媒體藝術(shù)與民族文化傳播智慧樹知到期末考試答案2024年
- 美國實時總統(tǒng)大選報告
- 《行政許可法培訓(xùn)》課件
- 大學(xué)體育理論(山東聯(lián)盟)智慧樹知到課后章節(jié)答案2023年下泰山學(xué)院
- 研究生二級學(xué)科證明
- 快易收口網(wǎng)工藝原理
- APC Smart-UPS 3000XL RM安裝及電池更換手冊
評論
0/150
提交評論