




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
項目綜述項目背景隨著社會經(jīng)濟及科學技術(shù)的飛速發(fā)展,計算機網(wǎng)絡(luò)的逐漸普及,XXX(建設(shè)單位)作為行業(yè)的領(lǐng)先者在IT建設(shè)方面投入大量的資金,建立起多種的業(yè)務(wù)系統(tǒng),為企業(yè)的長遠發(fā)展提供源動力及運營保障。伴隨著XXX(建設(shè)單位)業(yè)務(wù)系統(tǒng)的不斷增加,IT硬件和軟件應(yīng)用的也不斷增漲,其環(huán)境復雜,多系統(tǒng)、多數(shù)據(jù)庫和多應(yīng)用平臺、多廠商網(wǎng)絡(luò)及系統(tǒng)設(shè)備的網(wǎng)絡(luò)運行環(huán)境,使網(wǎng)絡(luò)維護難度成幾何倍數(shù)的增長,系統(tǒng)管理人員的工作壓力越來越大。在XXX(建設(shè)單位)網(wǎng)絡(luò)系統(tǒng)的日常管理中,IT基礎(chǔ)設(shè)施的故障和性能監(jiān)控是很重要的一個環(huán)節(jié),它是網(wǎng)絡(luò)系統(tǒng)穩(wěn)定、可靠的保證。如果XXX(建設(shè)單位)的網(wǎng)絡(luò)失效或運行狀態(tài)不佳,數(shù)據(jù)流就會受到阻塞,關(guān)鍵數(shù)據(jù)就不能得到有效共享,導致各項業(yè)務(wù)工作效率的下降,XXX(建設(shè)單位)對外提供的社會服務(wù)及內(nèi)部企業(yè)運行流程都將受到影響。為保證網(wǎng)絡(luò)暢通,網(wǎng)管人員需要對XXX(建設(shè)單位)現(xiàn)有網(wǎng)絡(luò)設(shè)備、鏈路和多種操作系統(tǒng)的服務(wù)器進行7X24的監(jiān)測,降低網(wǎng)絡(luò)管理工作的復雜性,提高網(wǎng)絡(luò)管理的工作效率。需求分析IT管理現(xiàn)狀隨著XXX(建設(shè)單位)業(yè)務(wù)系統(tǒng)的不斷完善,XXX(建設(shè)單位)缺少統(tǒng)一IT綜合監(jiān)控管理平臺,網(wǎng)絡(luò)運維人員經(jīng)常是在故障發(fā)生后,才能去進行處理,工作處于被動狀態(tài)。由于缺少及時有效了故障發(fā)現(xiàn)工具,需要花費很長時間去尋找和診斷故障,極大地影響了工作效率。缺少直觀的業(yè)務(wù)服務(wù)拓撲功能,應(yīng)用系統(tǒng)的監(jiān)測和管理顯得非常繁瑣。無法對各種應(yīng)用系統(tǒng)進行有效的監(jiān)測管理,如何不斷提高各種業(yè)務(wù)系統(tǒng)的服務(wù)質(zhì)量,是XXX(建設(shè)單位)系統(tǒng)管理人員急需解決的問題。網(wǎng)絡(luò)運維人員急需建立起一套IT統(tǒng)一綜合監(jiān)測管理平臺及時把握其業(yè)務(wù)系統(tǒng)的健康運行情況,對網(wǎng)絡(luò)運行狀態(tài)進行趨勢分析,做到及時防范、及時告警、及時處理,需要對網(wǎng)絡(luò)設(shè)備、服務(wù)器系統(tǒng)資源及應(yīng)用軟件的運行狀況進行實時監(jiān)測。形成對網(wǎng)絡(luò)的集中、統(tǒng)一的管理,從而在整體上把握各業(yè)務(wù)系統(tǒng)運行性能。存在的問題目前XXX(建設(shè)單位)的IT管理主要面臨以下問題:網(wǎng)絡(luò)管理的覆蓋范圍不足缺乏統(tǒng)一的網(wǎng)絡(luò)管理平臺IT系統(tǒng)運維的狀態(tài)無法全景的展現(xiàn)作為網(wǎng)絡(luò)管理員,必須有效地了解網(wǎng)絡(luò)中數(shù)據(jù)傳輸是否正常、服務(wù)器以及網(wǎng)絡(luò)設(shè)備是否過載運行、應(yīng)用系統(tǒng)是否可以正常使用、局域網(wǎng)內(nèi)部以及局域網(wǎng)與互聯(lián)網(wǎng)的連接是否正常、局域網(wǎng)是否受到非法者的攻擊、用戶之間的數(shù)據(jù)傳輸是否正常等等,同時,在遇到網(wǎng)絡(luò)時斷時續(xù)、網(wǎng)絡(luò)內(nèi)部用戶不能正常上網(wǎng)等網(wǎng)絡(luò)故障時,必須能快速定位故障點并將其排除。由于網(wǎng)絡(luò)之間的數(shù)據(jù)傳輸?shù)牟煌该餍?,管理手段落后,沒有統(tǒng)一的網(wǎng)絡(luò)管理平臺,無法實時掌握整體IT環(huán)境的運行狀態(tài),管理模式分散,無法了解整個IT環(huán)境的變化,經(jīng)常性的造成“一葉障目、不見泰山”的運維管理局面。網(wǎng)絡(luò)管理人員很難及時準確了解IT資源運行趨勢、網(wǎng)絡(luò)運維的瓶頸、突發(fā)事件的故障點等問題,造成事故處理過程冗長,無法滿足現(xiàn)代化IT運維工作的整體要求。網(wǎng)絡(luò)性能得不到充分發(fā)揮。由于沒有網(wǎng)絡(luò)性能方面的管理工具,網(wǎng)管人員不能對網(wǎng)絡(luò)進行有效的調(diào)整和優(yōu)化。機房動力環(huán)境運行監(jiān)測薄弱對機房場地的動力環(huán)境集中監(jiān)控薄弱,需對機房動力系統(tǒng)(包括主要配電設(shè)備、UPS電源監(jiān)控)、環(huán)境系統(tǒng)(機房專用精密空調(diào)系統(tǒng)、漏水系統(tǒng)、溫濕度)、保安系統(tǒng)(門禁)以及消防系統(tǒng)等實行完善的監(jiān)控和控制功能,能對發(fā)生的各種事件都結(jié)合機房的具體情況非常務(wù)實的給出處理信息,提示值班人員進行操作。實現(xiàn)機房設(shè)備的統(tǒng)一監(jiān)控,智能化實時聲光、短信、電話報警(聲光報警器連接至保安監(jiān)控室),實時記錄事件;減輕機房維護人員負擔,有效提高系統(tǒng)的可靠性,清理事件關(guān)系,實現(xiàn)機房可靠的科學管理。1)供配電系統(tǒng)通過由精密配電系統(tǒng)廠家提供的數(shù)字電表、通訊協(xié)議及智能通訊接口實時監(jiān)視機房市電三相電壓、電流,頻率、功率因數(shù)、有功功率等。一旦供配電系統(tǒng)工作狀態(tài)不正常,系統(tǒng)會實時報警,告知值班人員。2)UPS系統(tǒng)對機房內(nèi)UPS進行故障診斷,對UPS內(nèi)部整流器、逆變器、電池、旁路、負載等各部件的運行狀態(tài)進行實時監(jiān)視,一旦有部件發(fā)生故障,系統(tǒng)會自動報警。3)空調(diào)設(shè)備通過由空調(diào)廠家提供的通訊協(xié)議及智能通訊接口對機房的精密空調(diào)(艾默生)進行全面診斷監(jiān)控。對空調(diào)內(nèi)部的壓縮機、風機、冷凝器、加濕器、去濕器、加熱器等部件實時進行監(jiān)視。一旦部件發(fā)生故障,系統(tǒng)會直觀地在畫面上顯示出來并報警。4)漏水檢測系統(tǒng)漏水檢測系統(tǒng)采用帶漏水感應(yīng)線的漏水探測器,對五樓機房內(nèi)空調(diào)的四周進行漏水檢測。一旦有漏水發(fā)生,系統(tǒng)會實時告警,把報警信息告知值班人員及有關(guān)人員。5)溫濕度檢測在機房不同位置安裝溫濕度傳感器,其輸出連接到工控模塊,可實時地監(jiān)測現(xiàn)場溫濕度狀況,一旦溫濕度超出設(shè)定范圍,系統(tǒng)會彈出報警畫面以及聲光報警并發(fā)出短信,把報警信息告知值班人員及有關(guān)人員。6)機房門禁系統(tǒng)機房玻璃隔斷門和防火門加裝電子門禁系統(tǒng),可保存出入記錄并供查詢,門禁系統(tǒng)需單獨配電,當有緊急消防報警時,可通過發(fā)送系統(tǒng)電平信號,控制門鎖的空開,使其斷電,門鎖打開。對于XXX(建設(shè)單位)這個集生產(chǎn)業(yè)務(wù)網(wǎng)絡(luò)和電子政務(wù)外網(wǎng)混合組網(wǎng)并且跨越多省市縣等地區(qū)的廣域計算機網(wǎng)絡(luò)系統(tǒng)來講,如果沒有一個有效而集中的工具進行管理和分析網(wǎng)絡(luò)的運行趨勢,找到隱藏的性能瓶頸,IT運維的容量管理缺乏數(shù)據(jù)支撐,網(wǎng)絡(luò)系統(tǒng)管理的長期規(guī)劃缺乏數(shù)字依據(jù),將難以保證網(wǎng)絡(luò)及各項業(yè)務(wù)應(yīng)用的順利運行。項目建設(shè)目標本次IT綜合監(jiān)控管理平臺的建設(shè),我們最終實現(xiàn)以下管理目標:建設(shè)全面的監(jiān)控管理平臺,消除監(jiān)控死角。XXX(建設(shè)單位)信息技術(shù)中心的各個系統(tǒng)采用了多個廠家的網(wǎng)絡(luò)設(shè)備、服務(wù)器、中間件、數(shù)據(jù)庫、存儲設(shè)備、虛擬化、硬件監(jiān)控,因此本項目首先要解決的問題是通過建設(shè)全面的監(jiān)控管理平臺將目前各個業(yè)務(wù)系統(tǒng)中的各種設(shè)備、軟件、業(yè)務(wù)應(yīng)用均能夠納入到監(jiān)控平臺中來。消除管理對象之間的差別,消除管理軟件的差別,對各種不同數(shù)據(jù)來源統(tǒng)一處理、統(tǒng)一展現(xiàn)、統(tǒng)一用戶登錄、統(tǒng)一權(quán)限控制。建設(shè)看得見的IT運維模式,網(wǎng)絡(luò)運行透明化。IT綜合管理平臺應(yīng)建立全景拓撲的展示模式,將用戶的業(yè)務(wù)視圖、網(wǎng)絡(luò)視圖、應(yīng)用視圖、虛擬化視圖和存儲視圖融合在一起,完整展現(xiàn)用戶統(tǒng)一的IT架構(gòu),讓用戶一覽眾山小,全局掌握IT系統(tǒng)整體的運行情況。建設(shè)開放、具有良好擴展性的IT管理平臺。IT綜合監(jiān)控管理平臺應(yīng)具有很好的開放性,具備跟相關(guān)系統(tǒng)的集成能力。監(jiān)控管理平臺應(yīng)具有良好的擴展性,不僅可以滿足現(xiàn)階段XXX(建設(shè)單位)系統(tǒng)管理的需要,未來,隨著XXX(建設(shè)單位)業(yè)務(wù)的不斷發(fā)展,監(jiān)控功能添加,或管理節(jié)點數(shù)量增加時,IT綜合監(jiān)控管理平臺也可以很好滿足XXX(建設(shè)單位)的需求。IT綜合監(jiān)控管理平臺效益分析達到自動化運維模式:IT綜合監(jiān)控管理平臺建設(shè)完成后,可以將日常IT運維中大量的重復性工作,由過去的手工執(zhí)行轉(zhuǎn)為自動化操作,從而減少乃至消除運維中的延遲,實現(xiàn)“零延時”的IT運維。全天候自動巡檢與及時報警實現(xiàn)了IT運維的“全天候無人值守”,大大降低IT運維人員的工作負擔。自動化運維不僅僅是代替人工操作,更重要的是深層探知和全局分析,幫助用戶在現(xiàn)有條件下實現(xiàn)性能與服務(wù)最優(yōu)化,同時保障投資收益最大化。使網(wǎng)絡(luò)運維人員從繁重的日常巡檢、關(guān)注IT資源細節(jié)運行狀態(tài)的工作中解脫出來,做到故障的提前預測、及時告警、精確定位,提高XXX(建設(shè)單位)的信息中心的運行管理水平和服務(wù)保障能力。降低管理隨機性和盲目性:IT綜合監(jiān)控管理平臺建設(shè)完成后,實時監(jiān)控網(wǎng)絡(luò)運行狀態(tài)、記錄網(wǎng)絡(luò)運行數(shù)據(jù),當被管理對象的運行狀態(tài)發(fā)生變化時,超過預定義的閾值就會產(chǎn)生事件;如果該事件滿足故障級別定義,則會產(chǎn)生故障報警。將為XXX(建設(shè)單位)的網(wǎng)絡(luò)管理提供詳實的運行數(shù)據(jù),網(wǎng)管員可以根據(jù)運行狀態(tài)記錄及事件告警,對關(guān)鍵業(yè)務(wù)的關(guān)鍵問題進行有針對性的處理,真正做到網(wǎng)絡(luò)運行管理的把握全局、突出重點,從而保證XXX(建設(shè)單位)核心業(yè)務(wù)系統(tǒng)連續(xù)、穩(wěn)定的運行。同時為網(wǎng)絡(luò)運維的管理者提供真實網(wǎng)絡(luò)運行報告,為下一步網(wǎng)絡(luò)的的規(guī)劃、建設(shè)提供數(shù)據(jù)支撐;形成網(wǎng)絡(luò)的建設(shè)、維護工作以業(yè)務(wù)為中心,全力保障XXX(建設(shè)單位)利潤中心的業(yè)務(wù)系統(tǒng)穩(wěn)定運行,減少管理的隨機性和盲目性,為XXX(建設(shè)單位)業(yè)務(wù)的長遠發(fā)展獻計獻策、保駕護航。總體分析總體需求通過對目前IT系統(tǒng)環(huán)境和管理現(xiàn)狀的分析,我們需要建設(shè)一套統(tǒng)一的網(wǎng)絡(luò)、業(yè)務(wù)系統(tǒng)監(jiān)測和機房動力環(huán)境監(jiān)測平臺,這個平臺應(yīng)該包括以下的管理需求:基于統(tǒng)一、集中的管理體系,統(tǒng)一的數(shù)據(jù)處理和展現(xiàn),統(tǒng)一的告警平臺。統(tǒng)一的數(shù)據(jù)處理和展現(xiàn),消除各個監(jiān)控工具之間各自為政、系統(tǒng)管理員在各個界面間頻繁切換的情況,擺脫舊監(jiān)控工具的數(shù)據(jù)和事件的現(xiàn)狀,統(tǒng)一在新的監(jiān)控平臺中實現(xiàn),并通過統(tǒng)一的展現(xiàn)界面進行展現(xiàn)。統(tǒng)一的告警平臺,將所有告警納入監(jiān)控管理監(jiān)控平臺,并通過短信、郵件和桌面客戶端統(tǒng)一告警。將建立全景視圖,用戶的業(yè)務(wù)視圖、網(wǎng)絡(luò)視圖、應(yīng)用視圖、虛擬化視圖、存儲視圖和動力環(huán)境視圖融合在一起,完整展現(xiàn)用戶統(tǒng)一的IT架構(gòu)。實時掌握整體IT環(huán)境的運行狀態(tài),并且通過線路和設(shè)備的顏色、指標可以清楚的看到整個IT環(huán)境的變化,采用的技術(shù)成熟、先進,并具有較強的集成性和可擴充性的管理平臺。建立CMDB關(guān)系網(wǎng),全景展現(xiàn)網(wǎng)絡(luò)設(shè)備、虛擬架構(gòu)、SAN架構(gòu)、服務(wù)器、應(yīng)用的關(guān)聯(lián)與配置關(guān)系、動力環(huán)境的運行狀況,快速精確定位故障源頭,完成事件的深入關(guān)聯(lián)分析。易于使用和維護。統(tǒng)一的中文界面,瀏覽器管理方式,可以多人同時通過瀏覽器進行訪問和操作。解放人力,依靠智能化技術(shù)化的管理手段,降低故障發(fā)生率,降低維護成本,并同時提高維護效率。對主機系統(tǒng)資源的占用比較少的情況下,實現(xiàn)對各種服務(wù)器(Linux、AIX、Windows2003等)監(jiān)控管理。包括主機硬件、操作系統(tǒng)、文件系統(tǒng)、進程和應(yīng)用等。主機監(jiān)控的重點是對操作系統(tǒng)關(guān)鍵指標,如CPU、內(nèi)存、進程、文件系統(tǒng)等進行全面的監(jiān)控管理,要求不僅能夠在狀態(tài)改變或性能指標超越門限值時生成告警,同時還應(yīng)該提供實時和歷史的性能數(shù)據(jù)展現(xiàn),并能夠保存歷史性能數(shù)據(jù),以形成統(tǒng)計分析報表。各種數(shù)據(jù)庫(Oracle,Sqlserver等)監(jiān)控管理,包括數(shù)據(jù)庫的重要配置參數(shù)以及運行狀況的監(jiān)控。主要關(guān)注數(shù)據(jù)庫的關(guān)鍵指標,如SGA使用率、表空間占用情況、鎖競爭和使用情況、緩沖區(qū)命中率等。其它應(yīng)用的監(jiān)控管理。比如IIS,Tomcat,Weblogic監(jiān)控,重點保證服務(wù)的可用性和性能。實現(xiàn)對存儲架構(gòu)的管理??梢詫崿F(xiàn)對光纖通道交換機、存儲陣列、磁帶庫、HBA卡等存儲資源的全面監(jiān)控實現(xiàn)對虛擬化的管理??梢詫mware的VCenter、DataCenter、Cluster、ESXi服務(wù)器、虛擬機進行監(jiān)控,針對虛擬化系統(tǒng)提供了性能、可用性、配置的監(jiān)控。直觀展現(xiàn)虛擬化系統(tǒng)的狀態(tài),以及被虛擬主機的可用性。實現(xiàn)IT資源管理和業(yè)務(wù)系統(tǒng)的關(guān)聯(lián),可以從業(yè)務(wù)的視角進行IT管理。當某臺主機或者應(yīng)用發(fā)生問題、產(chǎn)生告警時,系統(tǒng)管理員可以在第一時間發(fā)現(xiàn)該設(shè)備影響了哪個應(yīng)用的正常運行。實現(xiàn)動力環(huán)境運行的可視化管理,包括主要配電設(shè)備、UPS電源監(jiān)控、環(huán)境系統(tǒng)(機房專用精密空調(diào)系統(tǒng)、漏水系統(tǒng)、溫濕度)、保安系統(tǒng)(門禁)以及消防系統(tǒng)等運行狀況的管理和控制。實現(xiàn)自動化巡檢。能夠根據(jù)預設(shè)時間點,對監(jiān)控資源的實時運行數(shù)據(jù)進行提取,形成報表,代替手工巡檢。統(tǒng)一的報告和報表,多臺設(shè)備性能比較,支持多種格式導出,柱圖、XY坐標、餅圖、折線圖,定期的運維報告等等機房設(shè)備統(tǒng)計序號產(chǎn)品名稱規(guī)格型號品牌數(shù)量12345678功能需求具備事件管理功能當被管理對象的運行狀態(tài)發(fā)生變化時,超過預定義的閾值就會產(chǎn)生事件。如果該事件滿足故障級別定義,則會產(chǎn)生故障報警。系統(tǒng)提供告警管理功能,應(yīng)包含兩部分,一部分為“當前告警”,指當前正在發(fā)生的,還沒有解決的告警;另一部分為“歷史告警”,指已經(jīng)解決或自恢復的告警。這兩部分都應(yīng)支持查詢功能,并支持將查詢的告警內(nèi)容導出為其他格式(如EXCEL、PDF)的文件。系統(tǒng)提供告警事件的處理功能。主要記錄報警發(fā)生的時間、事件信息、事件分類、處理狀態(tài)、處理評注及建議等功能,使運維管理人員清楚了解系統(tǒng)故障的處理狀態(tài),及時掌握系統(tǒng)運行的故障和警報,及時進行處理,保障系統(tǒng)的正常、穩(wěn)定運行。靈活、直觀的管理視圖操作人員可以根據(jù)自己管理的需要,靈活定制管理視圖。例如,業(yè)務(wù)人員可以定制業(yè)務(wù)視圖、網(wǎng)絡(luò)管理人員可以靈活定制全景拓撲圖、管理員可以靈活定制首頁展示內(nèi)容等。監(jiān)控系統(tǒng)控制臺提供遠程訪問功能。提供統(tǒng)一的管理和展現(xiàn)頁面。在系統(tǒng)管理范圍內(nèi)的所有主機、應(yīng)用系統(tǒng)、存儲架構(gòu)、虛擬架構(gòu)、中間件以及應(yīng)用系統(tǒng)都可以按照多種方式進行展現(xiàn),并且在展現(xiàn)視圖中以明顯的顏色來表示被管資源的狀態(tài)、主要性能信息以及當前的告警狀態(tài)等。系統(tǒng)提供的視圖,要求分層次地展現(xiàn)所有應(yīng)用系統(tǒng)所涉及的所有被管理資源,并在視圖中動態(tài)反映被管資源的性能、告警、配置等方面的變化。提供對重要資源的特殊展現(xiàn)視圖,對重要的服務(wù)器、數(shù)據(jù)庫、中間件等資源,實現(xiàn)可視化監(jiān)控管理視圖,可支持全屏,以實時動態(tài)的方式,用不同顏色和動態(tài)效果,醒目的展現(xiàn)當前該資源的運行情況。在全景拓撲的管理將用戶的業(yè)務(wù)視圖、網(wǎng)絡(luò)視圖、應(yīng)用視圖、虛擬化視圖和存儲視圖融合在一起,完整展現(xiàn)用戶統(tǒng)一的IT架構(gòu),需支持多個子拓撲的雙擊關(guān)聯(lián)操作,可以定義展現(xiàn)指標,對用戶關(guān)注的數(shù)據(jù)直接展示。提高拓撲的可操作性,適合復雜拓撲結(jié)構(gòu)的個性化排布,滿足不同用戶對拓撲美學和行業(yè)習慣的要求可通過建立多種業(yè)務(wù)視圖的方式對拓撲資源進行查看,實現(xiàn)對網(wǎng)絡(luò)運行環(huán)境的全盤掌控。提供業(yè)務(wù)服務(wù)綜合展現(xiàn)界面,可將業(yè)務(wù)用戶、應(yīng)用系統(tǒng)、IT資源形成有效的影響度關(guān)聯(lián)視圖,并支持以大屏方式展現(xiàn),一目了然地了解當前應(yīng)用系統(tǒng)的運行狀態(tài)、用戶影響范圍以及相關(guān)IT資源的運行情況等。靈活的查詢功能系統(tǒng)應(yīng)能對系統(tǒng)各類信息進行靈活查詢,并能將結(jié)果以文本列表、圖形方式(直方圖、曲線圖、面積圖等)顯示、打印或轉(zhuǎn)存為Excel、PDF報表方式輸出。信息查詢應(yīng)能夠?qū)π畔⒌膯雾梼?nèi)容條目設(shè)置查詢條件,也能夠?qū)χ饕臈l目進行組合過濾查詢,在用戶設(shè)置如時間、日期等查詢條件時,應(yīng)能提供對輸入內(nèi)容的合法性檢查功能。可自行指定需要查詢的IT資源以及指標名稱,按需產(chǎn)生對應(yīng)的查詢操作。嚴格的權(quán)限控制具備監(jiān)控各個應(yīng)用系統(tǒng)用戶和角色授權(quán)管理機制,對于不同角色,可以設(shè)置對被監(jiān)測設(shè)備與被監(jiān)測業(yè)務(wù)的讀取和操作權(quán)限。并記錄用戶對系統(tǒng)的訪問過程,對于非法訪問、濫用授權(quán)及時報警,確保應(yīng)用系統(tǒng)的安全。并且,由于監(jiān)控管理平臺自身是集中統(tǒng)一的監(jiān)控管理中心,因此應(yīng)提供較高的安全保障。提供多種告警方式各類告警信息均報送到統(tǒng)一的報警平臺上。提供多種告警策略和告警方式,須提供短消息、郵件、頁面告警等方式。管理人員可以根據(jù)自己的需要定制告警方式。采用基于角色的處理和分發(fā)機制,根據(jù)告警事件類型分發(fā)給相應(yīng)運維人員,結(jié)合完整的事件處理流程,確保各種事件和故障信息的快速、有效解決,要求對報警能夠過濾并能夠按照應(yīng)用系統(tǒng)關(guān)聯(lián)多個事件,以避免報警風暴的產(chǎn)生。完善的報表工具系統(tǒng)應(yīng)能夠?qū)Ω鞣N查詢結(jié)果進行某一維度的統(tǒng)計分析,并能將統(tǒng)計分析以結(jié)果文本列表、圖形方式(直方圖、曲線圖、面積圖等)或報表方式顯示、打印或轉(zhuǎn)存為Excel、PDF報表方式輸出,報表須采用中文格式。報表功能應(yīng)具有報表生成的靈活性和呈現(xiàn)的多樣性,并能夠根據(jù)用戶需要進行報表自定義,以適應(yīng)用戶不斷變化的需求,并可通過報表模板的方式實現(xiàn)。系統(tǒng)應(yīng)提供操作員增加、編輯自動生成報表任務(wù)的功能,能夠確定任務(wù)自動執(zhí)行時間,以及對任務(wù)隊列進行查詢、刪除等管理操作。系統(tǒng)自動生成的報表可基于系統(tǒng)已有的報表模板,自動生成任務(wù)中包括一個或多個報表模板,以及用戶預設(shè)的報表生成條件。IT統(tǒng)一綜合監(jiān)測管理平臺建設(shè)方案IT運維管理平臺IT運維系統(tǒng)價值IT運維系統(tǒng)能夠輔助IT部門進行如下工作:IT部門具有對IT資產(chǎn)和配置的掌控能力。需要對每一個IT組件的配置,以及IT組件之間,IT組件與業(yè)務(wù)應(yīng)用之間的關(guān)系進行梳理,形成配置的邏輯關(guān)系,并形成配置基線。IT部門對IT系統(tǒng)具有整合管理能力。IT系統(tǒng)本身是一個有機的整體,各個系統(tǒng)之間圍繞著業(yè)務(wù)形成了關(guān)聯(lián)和互動,所以對于IT系統(tǒng)的監(jiān)測和管理也應(yīng)當是整體全面的,使IT部門始終保持對IT系統(tǒng)完整巡視的能力。IT應(yīng)用服務(wù)運行狀態(tài)的感知能力。IT系統(tǒng)的建設(shè)是圍繞著業(yè)務(wù)應(yīng)用進行的,所以針對業(yè)務(wù)應(yīng)用應(yīng)當具有可用性的統(tǒng)計,以及容量的負載統(tǒng)計。IT運維流程的管控能力。IT部門通過IT運維流程管理,使得IT運維工作變得更加規(guī)范,但同時需要對運維流程本身的效率和效能進行監(jiān)控,以便能夠管理運維流程。同時IT部門需要的是一個系統(tǒng)化的管理體系,而不是割裂的,獨立的運維流程。IT運維系統(tǒng)架構(gòu)IT運維系統(tǒng)通過四個層面的功能實現(xiàn)完整的IT運維管理。配置管理層面:實現(xiàn)對IT組件及其配置的識別,并形成具有邏輯關(guān)系視圖的配置管理數(shù)據(jù)庫(CMDB)和配置基線。在配置管理層面形成了對上層流程的信息支持,并通過上層的變更管理流程形成對配置管理數(shù)據(jù)庫(CMDB)的管控。整合管理層面:依據(jù)配置管理數(shù)據(jù)庫(CMDB)的邏輯信息,對IT系統(tǒng)進行整合監(jiān)測,形成完整的IT系統(tǒng)事態(tài)管理(EventMgmt)。IT系統(tǒng)的整合管理包括:網(wǎng)絡(luò)系統(tǒng)、服務(wù)器主機系統(tǒng)、數(shù)據(jù)庫及中間件系統(tǒng)、存儲系統(tǒng)。業(yè)務(wù)服務(wù)管理層面:依據(jù)配置管理數(shù)據(jù)庫(CMDB)的邏輯信息,形成組織機構(gòu)的業(yè)務(wù)應(yīng)用與IT組件的支撐關(guān)系,同時依靠IT組件的整合管理數(shù)據(jù),完成對業(yè)務(wù)應(yīng)用的可用性狀態(tài)感知和容量管理。流程管理層面:在具有了配置管理數(shù)據(jù)庫(CMDB)的基礎(chǔ)上,可為IT部門提供依據(jù)ISO\IEC20000標準的IT運維管理體系,為用戶形成“服務(wù)支持中心”和“服務(wù)交付中心”。IT運維管理成熟度模型通過IT運維管理模型的規(guī)劃逐步提升對IT系統(tǒng)運維的效率和質(zhì)量:階段一初始階段:沒有自動化工具進行監(jiān)測,IT系統(tǒng)故障依靠技術(shù)人員發(fā)現(xiàn)。對于故障的處理、配置的變更等沒有明確的流程定義。階段二被動階段:強化主動監(jiān)控,實現(xiàn)集中管理。通過實施對IT系統(tǒng)的集中自動化監(jiān)控,提高了對IT系統(tǒng)故障監(jiān)測的效率幫助定位故障。通過建立“事態(tài)管理管理流程”快速恢復系統(tǒng)運行。階段三主動階段:規(guī)范運行管理,有序開展IT運維。通過建立“知識和問題管理流程”共享運維經(jīng)驗,完善知識庫。通過建立“變更管理流程“和”發(fā)布管理流程“避免或降低因為人為操作因素而導致的故障,從而形成對IT基礎(chǔ)設(shè)施的主動保障流程。階段四面向服務(wù)階段:形成面向業(yè)務(wù)服務(wù)的IT服務(wù)管理。通過對業(yè)務(wù)應(yīng)用的優(yōu)先級設(shè)置,確定服務(wù)響應(yīng)的標準,以確保最關(guān)鍵的業(yè)務(wù)得到最大程度的保障。通過對業(yè)務(wù)應(yīng)用的可用性管理,當系統(tǒng)資源(如服務(wù)器、網(wǎng)絡(luò)等)發(fā)生故障時,能快速定位受影響的業(yè)務(wù)區(qū)域。。通過對業(yè)務(wù)應(yīng)用的容量管理,對IT系統(tǒng)資源(如服務(wù)器、網(wǎng)絡(luò)等)進行合理利用。階段五價值階段:IT部門與業(yè)務(wù)部門的協(xié)作改善了業(yè)務(wù)流程。IT運維管理系統(tǒng)解決方案IT運維管理解決方案,圍繞人、流程、技術(shù)為核心,進行整體規(guī)劃、分步實施:人:關(guān)注人員角色的定位和職責劃分。流程:逐步建立基于流程化的工作機制,提高運維工作規(guī)范性,提高IT服務(wù)交付質(zhì)量。技術(shù):以IT系統(tǒng)監(jiān)測技術(shù)為依托,強化集中監(jiān)控,提高運維效率。通過四個主要功能模塊,采用里程碑式的方法,逐步實現(xiàn)完整的IT運維管理:IT資產(chǎn)及配置管理:對IT資產(chǎn)和配置有掌控能力。IT基礎(chǔ)設(shè)施的事態(tài)整合管理:對IT系統(tǒng)有整合管理能力。業(yè)務(wù)服務(wù)管理:對IT業(yè)務(wù)應(yīng)用的運行狀態(tài)和容量有感知能力。運行維護:以流程為基礎(chǔ)進行運維工作,對運維流程有管控能力。IT系統(tǒng)資產(chǎn)及配置管理IT系統(tǒng)資產(chǎn)及配置管理的目標和價值IT系統(tǒng)資產(chǎn)及配置管理的目標:定義并控制服務(wù)和基礎(chǔ)架構(gòu)的組件,并維護準確的配置信息。IT系統(tǒng)資產(chǎn)及配置管理的價值:通過識別IT系統(tǒng)的資產(chǎn)和配置,為自動化監(jiān)測IT系統(tǒng)提供有關(guān)IT基礎(chǔ)架構(gòu)配置的準確信息,從而反映了哪些IT組件出現(xiàn)故障將會影響哪些業(yè)務(wù)和客戶的信息。通過配置管理數(shù)據(jù)庫為事態(tài)管理管理、問題管理、變更管理和發(fā)布管理等運維流程提供了的運作基礎(chǔ)。由于配置管理數(shù)據(jù)庫中記錄了IT組件和業(yè)務(wù)應(yīng)用系統(tǒng)之間的邏輯關(guān)系,所以配置管理數(shù)據(jù)庫是業(yè)務(wù)服務(wù)管理的基礎(chǔ)。計量組織和服務(wù)中所使用的所有IT資產(chǎn)和配置項的價值。IT系統(tǒng)資產(chǎn)及配置管理概述IT環(huán)境是一個蘊含眾多依存關(guān)系的高度復雜環(huán)境,而這些依存性正日益成為關(guān)乎組織成敗的重要因素。在IT運維的過程中需要一個精確的“地圖”。IT運維人員可以通過電子表格和拓撲等文件對IT系統(tǒng)的配置進行了記錄,例如、共有多少臺服務(wù)器,哪些應(yīng)用安裝于哪些服務(wù)器,網(wǎng)絡(luò)中共有多少個VLAN等。這對于IT運維人員會帶來兩個挑戰(zhàn):對于IT系統(tǒng)的配置通過手動記錄的方式,工作量很大,如何保證準確性,同時如何保證這些配置文件能夠與未來的變更保持同步。在出現(xiàn)需要配置信息的時候,例如、當故障出現(xiàn)需要排錯或需要判斷某個系統(tǒng)變更是否可行時,都需要配置信息作為故障根源和變更影響度判斷的依據(jù)。而通過查閱文件形式的記錄將會降低信息查閱的效率。在IT服務(wù)管理中,配置管理的任務(wù)就是提供精確的系統(tǒng)基礎(chǔ)結(jié)構(gòu)信息。而IT系統(tǒng)資源配置管理數(shù)據(jù)庫(CMDB)由于存儲了組織機構(gòu)里用于提供和管理IT服務(wù)的細節(jié)信息。因此,實施IT系統(tǒng)資源配置管理數(shù)據(jù)庫(CMDB)是配置管理的核心。IT運維系統(tǒng)方案中的IT系統(tǒng)資產(chǎn)及配置管理模塊,通過自動識別形成的配置管理數(shù)據(jù)庫首先極大提高了配置管理數(shù)據(jù)庫的構(gòu)建效率及識別的準確度,同時在今后需要配置管理信息的時候可以做到聯(lián)動查詢。IT運維能否滿足業(yè)務(wù)運作的要求很大程度上取決于支持IT運維的IT基礎(chǔ)架構(gòu)的配置及運行情況。配置管理數(shù)據(jù)庫不僅保存IT基礎(chǔ)架構(gòu)中特定組件的配置信息,而且還包括各配置項相互關(guān)系的信息。配置管理數(shù)據(jù)庫需要根據(jù)變更實施情況將進行不斷的更新,以保證配置管理中保存的信息總能反映IT基礎(chǔ)架構(gòu)的現(xiàn)實配置情況,以及配置項之間的相互關(guān)系。IT系統(tǒng)資產(chǎn)管理和配置管理的區(qū)別:IT系統(tǒng)資產(chǎn)管理主要面向資產(chǎn)類信息的管理,而配置管理主要面向運維信息的管理。IT運維系統(tǒng)應(yīng)當同時具備以下兩類信息的整合管理。IT系統(tǒng)資產(chǎn)管理中記錄了IT組件以及IT設(shè)備的資產(chǎn)屬性,例如、IT組件的生命周期、購買價格和維護費用信息、IT組件的位置等。IT配置管理中記錄了該IT組件在運維過程中的一系列運維屬性,例如、IT組件與IT組件之間的關(guān)系、IT組件的故障處理記錄、IT組件的變更記錄、IT組件的發(fā)布記錄、IT組件的軟硬件配置等。IT運維系統(tǒng)資產(chǎn)及配置管理的具體功能IT運維系統(tǒng)資產(chǎn)及配置管理的范圍IT運維系統(tǒng)資產(chǎn)及配置管理的范圍包括:各個生命周期中的IT組件,包括:在線使用中的、備件、保修、訂購及開發(fā)中的。各個生命周期中的IT服務(wù),例如、各類業(yè)務(wù)應(yīng)用系統(tǒng)。與IT服務(wù)有關(guān)的人員和機構(gòu),包括:IT服務(wù)的客戶和供應(yīng)商,以及IT部門。與IT服務(wù)運維有關(guān)的文檔,包括:受控文檔、質(zhì)量文檔、手冊等。IT組件的識別與控制IT組件是一系列構(gòu)成組織機構(gòu)IT系統(tǒng)的基本元素,例如數(shù)據(jù)庫系統(tǒng)、服務(wù)器、路由器。根據(jù)組織機構(gòu)的具體情況一個IT組件的定義可以是一個完整的系統(tǒng)(包括所有硬件、軟件和文檔),也可能是一個模塊或較小的硬件組件。IT運維系統(tǒng)可實現(xiàn)40%到80%的IT組件自動識別和歸類。IT組件識別步驟:發(fā)現(xiàn)IP網(wǎng)段配置信息如下圖,首先在向?qū)е信渲每捎糜诠芾砗褪占畔⒌腟NMP團體名,根據(jù)實際情況可配置多個SNMP團體名,系統(tǒng)可自動匹配共同體名稱。如下圖,通過從“網(wǎng)關(guān)為起點學習”或“手動指定起點學習”,IT運維系統(tǒng)將自動發(fā)現(xiàn)網(wǎng)段配置信息,從而確定IT系統(tǒng)的管理范圍。同時系統(tǒng)支持手動填寫網(wǎng)段地址。IT組件識別步驟:識別IT組件及類型如下圖,系統(tǒng)可自動發(fā)現(xiàn)IT組件,并識別和歸類IT組件類型,以便確定對IT組件的監(jiān)測方式。IT組件識別步驟:識別IT組件配置如下圖,將IT組件的軟硬件配置進行獲取,形成歷史基線。同時與新獲取的IT組件配置進行比對,以便發(fā)現(xiàn)IT組件軟硬件配置變化。IT組件識別步驟:識別IT組件關(guān)系自動化識別IT組件關(guān)系,將提高IT組件關(guān)系準確度和構(gòu)建配置管理數(shù)據(jù)庫的效率。通過識別IT組件關(guān)系,形成配置管理的基礎(chǔ)關(guān)系數(shù)據(jù)。IT組件關(guān)系為兩部分:物理關(guān)系:“組成關(guān)系”、“連接關(guān)系”、“使用關(guān)系”。邏輯關(guān)系:“復制關(guān)系”、“涉及關(guān)系”、“被用于關(guān)系”。如下圖,自動識別IT組件關(guān)系及配置。如下圖,圖形化呈現(xiàn)IT組件配置及關(guān)系。手動添加IT組件IT運維系統(tǒng)在支持自動化構(gòu)建配置管理數(shù)據(jù)庫的同時也支持手動添加IT組件,并配置相應(yīng)的管理憑證和類別。運維相關(guān)配置項的管理在IT系統(tǒng)中除了硬件和軟件設(shè)施以外,還有“文檔”、“IT運維中的角色”、“組織機構(gòu)”等,同樣需要管理。管理IT運維相關(guān)文檔文檔管理是針對文檔創(chuàng)建和管理的過程,用以確保服務(wù)特性、管理政策、計劃被適時的、恰當?shù)拿枋?,以便控制和管理與質(zhì)量體系有關(guān)的文檔資料,確保對質(zhì)量管理體系有效運行起重要作用的各個場所都能得到和使用相應(yīng)體系文檔的有效版本。IT運維的角色管理角色的定義:角色是人員和職責的集合,根據(jù)需要,一個角色可以包含多個人員,也可以一個人員承擔多個角色的任務(wù)。角色與IT業(yè)務(wù)服務(wù):由于角色定義了明確的職責(職責由任務(wù)和任務(wù)的周期組成),所以根據(jù)服務(wù)目錄的需要,一個IT業(yè)務(wù)服務(wù)可以由一個或多個角色共同承擔支撐運維工作。例如、某人即是網(wǎng)絡(luò)二線小組的成員,同時又是組織運維知識管理的負責人。IT運維系統(tǒng)中設(shè)置了技術(shù)職能角色和流程管理兩類角色。組織機構(gòu)管理組織機構(gòu):基本包括服務(wù)實體和用戶兩大類。服務(wù)實體是專門對應(yīng)某功能模塊服務(wù)的一個人或者一個團隊。用戶是IT服務(wù)的最終使用者,用戶不參與IT系統(tǒng)的具體運行維護工作而更加關(guān)注IT系統(tǒng)的使用性和功能,例如:財務(wù)部、人力資源部。圖形化呈現(xiàn)IT組件及關(guān)系配置項關(guān)系:配置管理中體現(xiàn)業(yè)務(wù)系統(tǒng)與IT環(huán)境的關(guān)系,業(yè)務(wù)系統(tǒng)之間的關(guān)系,在業(yè)務(wù)系統(tǒng)變更的時候能夠直觀的指導會影響到那些其他的系統(tǒng)。IT基礎(chǔ)設(shè)施的整合監(jiān)測管理IT基礎(chǔ)設(shè)施整合監(jiān)測的目標和價值IT基礎(chǔ)設(shè)施整合監(jiān)測管理的目標:通過實時的監(jiān)測IT服務(wù)健康狀況并進行前瞻的預警及報警,以降低服務(wù)事故和系統(tǒng)事件的所造成的影響。IT基礎(chǔ)設(shè)施整合監(jiān)測管理的價值:整合的管理IT系統(tǒng)運行狀態(tài),為IT部門提供整體IT系統(tǒng)的完整信息。通過自動化監(jiān)測,提高對IT系統(tǒng)中潛在和存在的故障偵測效率,縮短處理事態(tài)管理的時間。監(jiān)測信息為事態(tài)管理管理和問題管理提供客觀依據(jù)。IT基礎(chǔ)設(shè)施整合監(jiān)測概述IT系統(tǒng)是由各個相互獨立且有相互依賴的技術(shù)模塊組成,這些技術(shù)模塊包括服務(wù)器主機、網(wǎng)絡(luò)系統(tǒng)、安全系統(tǒng)、中間件及應(yīng)用系統(tǒng)、數(shù)據(jù)庫及文件系統(tǒng)、存儲系統(tǒng)等。面對異構(gòu)化的IT環(huán)境,更加需要整合的管理,既一個管理平臺監(jiān)測整體IT系統(tǒng),打破異構(gòu)IT系統(tǒng)管理壁壘。IT基礎(chǔ)設(shè)施整合監(jiān)測的具體功能網(wǎng)絡(luò)系統(tǒng)管理IT運維系統(tǒng)支持對國內(nèi)外的主流產(chǎn)品的自動化監(jiān)測、具體包括:H3C、Tippingpoint、CiscoPIX/ASA、天融信、Fortinet、StoneSoft、Juniper/Netscreen、MicrosoftISA、CheckPoint/Nokia、Extreme、網(wǎng)域神州、F5、Radware、FoundryServerIron/Broadcade等。網(wǎng)絡(luò)拓撲管理可通過拓撲的方式對網(wǎng)絡(luò)進行管理,在拓撲中呈現(xiàn)每條鏈路的暢通和網(wǎng)絡(luò)協(xié)議的運行狀態(tài)是體現(xiàn)網(wǎng)絡(luò)整體運行狀態(tài)的關(guān)鍵指標。如下圖,通過拓撲圖可呈現(xiàn)各個區(qū)域IT組件的連通及運行狀態(tài)。如下圖,在拓撲圖上可快速統(tǒng)計當前的故障信息、IT組件負載信息、線路負載信息,并以TopN的形式排列。如下圖,拓撲圖的IT組件可按照實際業(yè)務(wù)情況進行合并成為“區(qū)域”概念。IT運維系統(tǒng)可針對“區(qū)域”進行Vlan配置、VTP配置、STP配置的分析。如下圖,在形成了“區(qū)域”的網(wǎng)絡(luò)中,分析Vlan配置。為便于更加直觀的呈現(xiàn)IT系統(tǒng)狀態(tài),根據(jù)IT系統(tǒng)的規(guī)模大小,用戶可創(chuàng)建拓撲子圖,并進行切換或鏈接。如下圖,將部分服務(wù)器和網(wǎng)絡(luò)設(shè)備組合成為拓撲子圖,并可進行切換或鏈接。網(wǎng)絡(luò)設(shè)備相關(guān)端口的流入流量、流出流量、流出速率、流入速率,端口利用率、端口丟包率、端口誤碼率。監(jiān)控的信息可以按照天、周、月、年等方式以圖形和報表的方式展示。終端接入管理IT運維系統(tǒng)支持對終端內(nèi)部接入的監(jiān)測,能夠發(fā)現(xiàn)接入近來的無線控制器和集線器。同時通過設(shè)置終端合法性,可識別接入網(wǎng)絡(luò)的外部設(shè)備。如下圖,可圖形化呈現(xiàn)終端接入情況。網(wǎng)絡(luò)設(shè)備管理網(wǎng)絡(luò)設(shè)備的管理可對每臺網(wǎng)絡(luò)設(shè)備的控制層面、轉(zhuǎn)發(fā)層面、基礎(chǔ)環(huán)境層面進行管理??刂茖用娴奶幚砟芰Γ篊PU利用率、內(nèi)存利用率、防火墻等網(wǎng)絡(luò)安全設(shè)備的連接數(shù)。數(shù)據(jù)層面的轉(zhuǎn)發(fā)能力:鏈路的帶寬利用率、丟包率、錯包率、CRC校驗錯誤包率、網(wǎng)絡(luò)協(xié)議的運行性能等。設(shè)備的基礎(chǔ)環(huán)境:溫度、電源、風扇。服務(wù)器主機系統(tǒng)管理IT運維系統(tǒng)本身支持對Windows服務(wù)器系統(tǒng)和Linux及Unix服務(wù)器系統(tǒng)的監(jiān)測。同時通過各類報表,可以進行容量的趨勢分析,查詢系統(tǒng)的性能瓶頸。操作系統(tǒng)監(jiān)控參數(shù):服務(wù)器系統(tǒng)的連通性:監(jiān)測網(wǎng)絡(luò)設(shè)備是否可連通,連通的耗時。服務(wù)器系統(tǒng)的處理能力:監(jiān)測網(wǎng)絡(luò)設(shè)備的CPU、內(nèi)存、磁盤容量、磁盤性能,每秒的平均讀取數(shù),及當前隊列數(shù)。服務(wù)器系統(tǒng)的服務(wù)能力:監(jiān)測網(wǎng)絡(luò)設(shè)備的服務(wù)支撐系統(tǒng)能力和重要進程是否存在,進程[進程運行實例數(shù),占CPU、內(nèi)存量,線程數(shù),I/O讀寫、句柄數(shù)]。備注:本文僅羅列了基本的監(jiān)測參數(shù),具體監(jiān)測內(nèi)容請見詳細指標。數(shù)據(jù)庫系統(tǒng)監(jiān)控IT運維系統(tǒng)的數(shù)據(jù)中心管理模塊用于幫助用戶保證Oracle、IBMDB2?、Microsoft?SQLServer、Sybase、IBMInformix?服務(wù)器的可用性和最優(yōu)性能。消除數(shù)據(jù)庫管理員(DBA)時常遇到的決定監(jiān)控什么、如何監(jiān)控、如何解釋監(jiān)控結(jié)果并給出對策等難題,給DBA留出更多時間來關(guān)注更復雜、重復率更低的任務(wù)。數(shù)據(jù)庫系統(tǒng)的基本監(jiān)測參數(shù):數(shù)據(jù)庫系統(tǒng)監(jiān)視器Oracle、MSSQLServer、MySQL、DB2、Sybase、Informix事務(wù)/秒、事務(wù)數(shù)數(shù)據(jù)庫內(nèi)存占用率緩沖池命中率連接數(shù)/會話數(shù)游標數(shù)接受字節(jié)速率、發(fā)送字節(jié)速率連續(xù)工作總秒數(shù)用戶連接數(shù)批注請求數(shù)/秒數(shù)據(jù)庫文件對磁盤的占用率鎖的數(shù)量平均鎖等待時間數(shù)據(jù)庫增量表空間增長率、表空間利用率數(shù)據(jù)庫訪問安全備注:本文僅羅列了基本的監(jiān)測參數(shù),具體監(jiān)測內(nèi)容請見詳細指標。中間件及應(yīng)用系統(tǒng)管理IT運維系統(tǒng)支持對中間件系統(tǒng)和應(yīng)用系統(tǒng)的監(jiān)測管理,具體包括對:WebSphere系統(tǒng)、WebLogic系統(tǒng)、Tuxedo系統(tǒng)、IIS系統(tǒng)、Apache系統(tǒng)、Exchange系統(tǒng)、Mirapoint系統(tǒng)、Lotus系統(tǒng)的可用性。部分中間件系統(tǒng)的基本監(jiān)測內(nèi)容:層面監(jiān)視器中間件及應(yīng)用平臺能力層面WebSphere[JVM內(nèi)存使用率、CPU利用率、用戶會話及相關(guān)信息、EnterpriseJavaBeans、ThreadPool、JavaDatabaseConnectivityPool]IIS[總用戶數(shù)、每秒用戶訪問數(shù)、每秒接收字節(jié)數(shù)、每秒發(fā)送字節(jié)數(shù)、當前用戶數(shù)、當前連接數(shù)、鎖總數(shù)]Tomcat[連接響應(yīng)時間、傳輸字節(jié)速率、每秒請求數(shù)、以用內(nèi)存、剩余內(nèi)存、內(nèi)存總數(shù)]Apache[連接響應(yīng)時間、CPU負載、每秒傳輸字節(jié)、每個請求傳輸字節(jié)數(shù)、正常運行持續(xù)時間、被訪問次數(shù)、活動線程數(shù)、非激活線程數(shù)、每秒請求數(shù)]IBMWebSphere[連接響應(yīng)時間、CPU負載、每秒傳輸字節(jié)、每個請求傳輸字節(jié)數(shù)、正常運行持續(xù)時間、被訪問次數(shù)、活動線程數(shù)、非激活線程數(shù)、每秒請求數(shù)]Exchange[系統(tǒng)平臺[用戶連接數(shù)、動態(tài)連接數(shù)、活動線程數(shù)、工作隊列線程數(shù)、地址堆棧長度]Mirapoint[UCE、每秒接收郵件數(shù)、發(fā)送郵件數(shù)、垃圾郵件數(shù)、病毒郵件數(shù)、隊列數(shù)、內(nèi)存、溫度、Touch、CPU、POP連接數(shù)、SMTP連接數(shù)、SSL連接數(shù)、活動數(shù)、寫入延遲、讀取延遲、]WebLogic[WebLogicopenedsockets、WebLogic當前JVM堆中內(nèi)存狀況、WebLogic運行狀態(tài)、WebLogic性能]Tuxdeo[Serverstatus、完成的transaction數(shù)]備注:本文僅羅列了基本的監(jiān)測參數(shù),具體監(jiān)測內(nèi)容請見詳細指標。日志中心日志的收集和分析工作是IT運維人員的重要維護手段,而在整個IT系統(tǒng)中一套統(tǒng)一的日志收集平臺是提高效率和及時性的至關(guān)重要的工具。日志是一種工業(yè)標準的功能,允許一個設(shè)備通過IP網(wǎng)絡(luò)把通告信息傳遞給日志服務(wù)器。在日志整合方案中,IT運維系統(tǒng)即是統(tǒng)一的日志存貯中心,也是分析中心。通過收集IT系統(tǒng)中各個IT組件的日志,IT運維系統(tǒng)會自動進行優(yōu)先級的歸類和趨勢的分析。IT運維人員需要通過根據(jù)優(yōu)先級的趨勢發(fā)展來進行相應(yīng)的動作,例如:嚴格審核來自網(wǎng)絡(luò)設(shè)備的配置命令日志,如果有“系統(tǒng)不可用”級別的日志則應(yīng)當立即檢查相應(yīng)的IT組件和IT服務(wù)的工作情況。信息中心可以根據(jù)重點的IT組件或者IT服務(wù)以及以往的經(jīng)驗,進行自定義的日志策略的設(shè)置。自定義日志策略設(shè)置可以包括“IP”,”關(guān)鍵字”,“優(yōu)先級”,“報警動作”,“緊急度”,“優(yōu)先級”字段。IT運維人員可以通過IT運維系統(tǒng)查看自定義的日志策略趨勢分析。在對日志歸類策略進行計劃和配置后,應(yīng)當對配置后的重要策略編輯報警功能。例如當某一重要服務(wù)器出現(xiàn)了Emergency級別的日志信息,則IT運維系統(tǒng)立即觸發(fā)故障管理系統(tǒng)并觸發(fā)報警系統(tǒng),使得IT運維人員第一時間得知該系統(tǒng)問題??焖俦葘Ψ治龊徒y(tǒng)計IT運維系統(tǒng)支持對網(wǎng)絡(luò)接口的流量、服務(wù)器性能的快速分析比對,協(xié)助IT運維人員分析IT組件的性能比對。如下圖,IT運維系統(tǒng)支持對接口流量的快速統(tǒng)計比對。如下圖,IT運維系統(tǒng)支持對IT組件按照CPU使用率、內(nèi)存使用率等進行的快速排列。如下圖,IT運維系統(tǒng)支持對多臺服務(wù)器主機的性能進行比對:報表提供統(tǒng)計分析和決策支持報表系統(tǒng)是協(xié)助IT運維人員周期性統(tǒng)計IT系統(tǒng)總體運行能力趨勢的功能模塊,為IT部門提供統(tǒng)計分析和決策支持。統(tǒng)計報表能夠自動的按照日、周、月、年生成報告,報告的監(jiān)測器范圍可以任意指定。全面的展示監(jiān)測目標的運行情況和統(tǒng)計信息,為系統(tǒng)擴容和企業(yè)決策提供科學的依據(jù)。IT系統(tǒng)巡檢針對IT系統(tǒng)的主動巡檢工作是信息中心IT運維人員必備的日常運維工作之一,而在巡檢的過程中,往往尋找異常信息或者故障是占用時間最多的內(nèi)容,并且根據(jù)組織機構(gòu)人員及工作職責不同,很難保障每一次的巡檢工作都完全按照既定的巡檢標準準確的被執(zhí)行。IT運維系統(tǒng)的巡檢職能可以輔助IT運維人員巡檢工作,以達到提高效率,降低錯誤的效果。如下圖,每一次的巡檢工作都是由IT運維人員手動發(fā)起的,IT運維系統(tǒng)可以清晰的記錄巡檢的工作執(zhí)行情況并形成分析報告。閥值配置根據(jù)IT組件及業(yè)務(wù)運行的實際情況制定相應(yīng)的閾值,當IT組件在運行過程中指標超過規(guī)定的閾值后,系統(tǒng)進行多種方式的報警。IT運維系統(tǒng)提供用戶根據(jù)系統(tǒng)的性能和服務(wù)級別管理對閥值進行設(shè)定:錯誤閥值:反映如果所收集到的數(shù)據(jù)與該閥值匹配則反映用戶系統(tǒng)已出現(xiàn)嚴重故障,用戶看到此狀態(tài)應(yīng)立即解決此類問題。告警閥值:反映如果所收集到的數(shù)據(jù)與該閥值匹配則反映用戶系統(tǒng)已出現(xiàn)故障的趨勢,當用戶看到此狀態(tài)應(yīng)進行關(guān)注并采取適當措施。正常閥值:反映如果所收集到的數(shù)據(jù)與該閥值匹配則反映用戶系統(tǒng)此時正常,用戶只需要在報告系統(tǒng)中關(guān)注該閥值的趨勢。在不增加操作復雜度的同時,保障閥值配置的靈活度,IT運維系統(tǒng)提供了多種閥值配置的方式。如下圖,批量配置單個IT組件的閥值策略。如下圖,批量配置一組IT組件的閥值策略。如下圖,配置單個配置項的閥值策略。故障預警和告警模塊故障報警旨在將業(yè)務(wù)以及全網(wǎng)產(chǎn)生的故障作為事件報告給IT管理員,使IT的健康狀態(tài)第一時間被管理員發(fā)現(xiàn),而并非客戶或者友鄰部門。監(jiān)控數(shù)據(jù)收集的頻率直接影響到數(shù)據(jù)收集的有效性,同時也很大程度關(guān)系到IT運維系統(tǒng)的負載。為保證對IT系統(tǒng)數(shù)據(jù)收集的有效性,在IT運維系統(tǒng)中我們可以對每一個監(jiān)測器的輪詢間隔做自由定制,單位最密可達1分鐘/次。建議對鏈路流量等對時間敏感的數(shù)據(jù)信息采用每分鐘一次的收集方式,對磁盤容量等對時間不敏感的數(shù)據(jù)信息采用30分鐘或者更長的時間進行收集。故障告警IT運維系統(tǒng)系統(tǒng)提供如下幾種報警方式:短信:目前支持移動、聯(lián)通網(wǎng)關(guān)、小靈通短信網(wǎng)關(guān)和短信發(fā)送終端。報警通過手機短信的方式發(fā)送。實時性好,送達性強,能夠滿足大多數(shù)用戶的需求。郵件:報警通過電子郵件的方式發(fā)送給用戶。此方法的特點是成本低,操作方便,但用戶接收電子郵件的時間不固定,不能保證報警消息的實時送達。聲音:報
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)開戶銀行合同范本
- 個體老板合同范本
- vr公司合同范本
- 2025年煙臺駕駛資格證模擬考試
- 化妝店轉(zhuǎn)租上海合同范本
- 獸醫(yī)診所轉(zhuǎn)讓合同范本
- 副業(yè)兼職合同范本
- 二手車行業(yè)勞動合同范本
- 軍旅衣服租賃合同范本
- 農(nóng)村房屋場地出租合同范本
- 無子女離婚協(xié)議書范本2025年
- 2023年湖南長沙自貿(mào)投資發(fā)展集團有限公司招聘筆試真題
- 記賬實操-產(chǎn)業(yè)園管理有限公司賬務(wù)處理示例
- 11.2化學與可持續(xù)發(fā)展教學設(shè)計-2024-2025學年九年級化學人教版(2024)下冊
- 《學術(shù)不端》課件
- 《電子技能與實訓》課件
- 基礎(chǔ)攝影培訓
- 高一政治學科期末考試質(zhì)量分析報告(7篇)
- 《面試官培訓》課件
- 導管相關(guān)性血流感染-7
- 汽車維修保養(yǎng)協(xié)議三篇
評論
0/150
提交評論