系統(tǒng)運行管理方案_第1頁
系統(tǒng)運行管理方案_第2頁
系統(tǒng)運行管理方案_第3頁
系統(tǒng)運行管理方案_第4頁
系統(tǒng)運行管理方案_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

系統(tǒng)運行管理方案1.監(jiān)控管理監(jiān)控管理主要是通過對被管對象的配置數(shù)據(jù)、性能數(shù)據(jù)、告警數(shù)據(jù)的統(tǒng)一采集,實現(xiàn)對IT基礎(chǔ)設施、應用軟件以及業(yè)務的監(jiān)控,主動發(fā)現(xiàn)被管對象當前的故障或告警信息并進行處理,保障系統(tǒng)的穩(wěn)定運營。基礎(chǔ)設施監(jiān)控基礎(chǔ)設施監(jiān)控是指對所有主機、數(shù)據(jù)庫、中間件、網(wǎng)絡、存儲、備份等設備及軟件進行統(tǒng)一監(jiān)控,及時發(fā)現(xiàn)平臺類的告警。統(tǒng)一采集與控制根據(jù)運維監(jiān)控管理平臺技相關(guān)的要求,基礎(chǔ)設施監(jiān)控數(shù)據(jù)采集的范圍包括各種設備的告警、性能、配置數(shù)據(jù)。數(shù)據(jù)采集★信息點采集模板界面化配置根據(jù)監(jiān)控對象可靈活配置改對象需要監(jiān)控的信息點、采集頻率等信息,并支持模板的遠程下發(fā)、更新?!锊杉磉h程下發(fā)、啟停與集中監(jiān)控可在下發(fā)采集模板時同步下發(fā)采集代理并進行友好的下發(fā)過程的可視化能力,下發(fā)后可自動啟動采集代理。提供集中的采集設備監(jiān)控代理運行監(jiān)控界面,便于維護人員實時監(jiān)測各個代理的運行情況,并提供便捷的重啟、模板和代理

程序更新功能?!锊杉斫M件化封裝根據(jù)不同的監(jiān)控對象和采集方式的差異化,對目前的監(jiān)控代理進行組件化封裝:>主機設備監(jiān)控代理>數(shù)據(jù)庫庫監(jiān)控代理>中間件監(jiān)控代理>網(wǎng)絡設備監(jiān)控代理>日志監(jiān)控代理>存儲設備監(jiān)控代理>備份設備監(jiān)控代理告警處理告警處理是針對來自IT基礎(chǔ)設施的告警信息進行統(tǒng)一處理,以便快速確認故障,縮短排障時間,為及時恢復系統(tǒng)運行打下良好基礎(chǔ)。包括:告警定位、告警過濾、重復告警壓縮、告警信息豐富、告警前轉(zhuǎn)、告警操作等?!龈婢ㄎ桓婢ㄎ皇峭ㄟ^對告警信息的查看確定故障可能發(fā)生的位置?!龈婢^濾告警過濾是指對大量重復的告警信息和次要、無意義的告警信息進行過濾,以避免告警風暴和無效告警或非關(guān)心告警的干擾,

以提高監(jiān)控與處理的效率?!龈婢瘔嚎s告警壓縮是對不同時間產(chǎn)生的相同告警,將其合并成一條告警信息,同時累計該告警的次數(shù),更新最后發(fā)生時間等。■告警信息豐富告警豐富功能主要是對告警信息增加描述,使得告警信息更加詳細和直白,方便系統(tǒng)維護人員更快的了解告警信息。■告警前轉(zhuǎn)告警前轉(zhuǎn)將告警信息以各種手段(手機短信、EMAIL等)轉(zhuǎn)至指定的維護人員。■告警操作告警操作主要包括告警確認、告警清除、告警級別調(diào)整、轉(zhuǎn)事件單等。性能處理■性能數(shù)據(jù)計算與匯總對預處理后的數(shù)據(jù)進行必要的計算、匯總形成所需的性能指標。處理后的性能數(shù)據(jù)保存到數(shù)據(jù)庫中,供分析和呈現(xiàn)使用,性能數(shù)據(jù)的保留時間可配置。針對部分不需要保留較長時間的性能數(shù)據(jù),在統(tǒng)計匯總后,可將歷史數(shù)據(jù)進行清理,減少系統(tǒng)對存儲空間的浪費。

■性能數(shù)據(jù)閥值預警性能數(shù)據(jù)反映了系統(tǒng)及應用的運行狀況,是判別被管資源運行是否正常的關(guān)鍵數(shù)據(jù)。性能數(shù)據(jù)一旦超出預先設定的閥值時,可及時觸發(fā)性能閥值越限告警,該告警稱為性能閥值告警。提供基于應用系統(tǒng)性能指標趨勢數(shù)據(jù)的分析處理功能,實現(xiàn)性能預警,并為分析優(yōu)化工作提供必要的依據(jù)。提供設定、查詢、修改、刪除性能閥值的工具,針對統(tǒng)一性能指標,可設多個閥值進行分級告警。性能閥值告警的內(nèi)容應能比較全面地描述該性能數(shù)據(jù)超出閥值的情況,方便分析、排除事件?!鲂阅軘?shù)據(jù)梯度預警系統(tǒng)提供梯度告警的功能,也就是兩個時間點的性能數(shù)據(jù)差值如果超過了門限,則應該上報告警。這種告警不同于性能數(shù)據(jù)的閥值告警,性能數(shù)據(jù)的閥值告警只是對一個時間點上的性能數(shù)據(jù)設定了門限,而梯度告警則是對兩個時間點的性能數(shù)據(jù)的差值設定了門限。梯度告警能夠迅速發(fā)現(xiàn)性能數(shù)據(jù)的異常變化。■性能數(shù)據(jù)匯總統(tǒng)計為了性能數(shù)據(jù)分析和呈現(xiàn),以及事件的分析,系統(tǒng)應能定期生成統(tǒng)計數(shù)據(jù)。通過分析歷史指標的情況,預測未來的發(fā)展,提升管理層次,達到面向服務品質(zhì)的管理。

拓撲處理拓撲圖的生成可支持手工配置或?qū)?,也可通過系統(tǒng)自動發(fā)現(xiàn)并注冊實現(xiàn),以上幾種方式都是以CMDB為基礎(chǔ),進而獲取每個節(jié)點在拓撲圖中的位置和它們間的依存關(guān)系,從而構(gòu)建出整個IT運營網(wǎng)路,通過實時刷新拓撲圖,可反映出當前網(wǎng)絡中節(jié)點的最新狀態(tài),幫助運維人員從宏觀上對對整個IT支撐系統(tǒng)的運行情況有直觀的掌握,進一步提高運維的效率。拓撲管理通過CMDB對象實例樹,可方便的對拓撲圖中的節(jié)點,及節(jié)點間的關(guān)系進行維護,系統(tǒng)支持對節(jié)點的增加、刪除、修改屬性,狀態(tài)及更改不同節(jié)點間的依附關(guān)系等。拓撲監(jiān)測拓撲監(jiān)測是根據(jù)拓撲模型,對在模型上定義的關(guān)鍵節(jié)點,節(jié)點關(guān)鍵性能、質(zhì)量指標數(shù)據(jù)進行實時監(jiān)控,將業(yè)務系統(tǒng)運行中出現(xiàn)的告警、預警信息直觀呈現(xiàn)在拓撲模型中,來實現(xiàn)對應用系統(tǒng)運行狀態(tài)的專題式監(jiān)控,及時發(fā)現(xiàn)用戶關(guān)注的異常。支持通過拓撲圖關(guān)聯(lián)到應用節(jié)點詳細信息頁面,可根據(jù)時間段來查詢該節(jié)點的告警信息列表,進而進行相關(guān)告警處理如告警確認、告警級別調(diào)整、告警清除等操作;支持通過拓撲圖關(guān)聯(lián)到應用節(jié)點詳細信息頁面,可根據(jù)時間段來查詢該節(jié)點的歷史指標數(shù)據(jù),以表格或走勢圖的方式展現(xiàn),

支持業(yè)務指標數(shù)據(jù)導出功能,導出格式包括但不限于文本、EXCEL等文件格式;拓撲視圖支持定時無閃爍刷新功能,刷新頻率不宜過高,以不影響系統(tǒng)性能和展現(xiàn)效果為基準,也不宜過低,否則無法達到監(jiān)測的實時性要求。■應用拓撲以IT系統(tǒng)內(nèi)的業(yè)務類型作為索引來組織被管資源的業(yè)務拓撲結(jié)構(gòu)。典型的業(yè)務拓撲圖是一個樹型結(jié)構(gòu),實現(xiàn)業(yè)務與IT基礎(chǔ)設施關(guān)聯(lián)關(guān)系的直觀展現(xiàn)。系統(tǒng)提供方便的圖形化配置修改工具,允許管理維護人員靈活修改相關(guān)聯(lián)資源等基本配置信息。以應用系統(tǒng)作為索引來組織應用軟件包含的被管資源的拓撲結(jié)構(gòu)。應用拓撲體現(xiàn)應用軟件被管資源的分布和關(guān)聯(lián)情況系統(tǒng)通過提供方便的圖形化配置修改工具允許管理維護人員靈活修改組成應用系統(tǒng)的相關(guān)聯(lián)資源等基本配置信息拓撲圖能夠展現(xiàn)應用軟件被管資源的運行狀態(tài),包括應用軟件的配置信息、告警信息和性能信息,且可以實現(xiàn)相關(guān)拓撲圖的自動生成。操作控制主要完成運維監(jiān)控管理平臺控制模塊與被監(jiān)控對象之間的操作指令傳遞與結(jié)果反饋通道,以便完成對被管對象的自動化控制,在運維監(jiān)控管理平臺中的主要應用為進程、服務的啟停和調(diào)用等。

操作控制主要是通過以下方式登錄到設備上執(zhí)行操作。SNMP方式:支持SNMP接口的系統(tǒng),可以此方式得到;telnet方式:通過telnet等方式對網(wǎng)元進行操作;Agent方式:通過在服務器上安裝Agent控制服務器的操作;ssh方式:大量操作控制采用安全的ssh執(zhí)行;FTP/TFTP方式:FTP等文件方式傳輸配置文件;rlogin方式:遠程登錄后執(zhí)行;Rsh、rexec方式:直接遠程執(zhí)行相應的操作;NT登錄方式:登錄到NT上執(zhí)行相應的操作;HTTPS方式:通過HTTPS對相應的網(wǎng)元執(zhí)行操作;Webservice方式:對于支持webservice的應用系統(tǒng)采用本方式;1.2.應用軟件監(jiān)控應用軟件監(jiān)控是通過對各IT應用(進程池、進程、接口和數(shù)據(jù)文件、日志等)進行監(jiān)控,及時發(fā)現(xiàn)系統(tǒng)應用軟件的異常,并確定故障原因,進行故障定位和處理,保證應用軟件正常運行,提高IT應用軟件運行管理水平。進程監(jiān)控提供對應用進程的監(jiān)控管理,確保系統(tǒng)可靠、穩(wěn)定地運行。支持對各進程運行狀態(tài)進行監(jiān)視,能夠?qū)崟r查看進程名稱、進程

號、進程啟動路徑、進程狀態(tài)、進程說明信息等相關(guān)運行信息。當進程異常終止時,能夠生成相應告警。在UNIX操作系統(tǒng)上,經(jīng)常出現(xiàn)由于資源競爭而導致死鎖的一些進程,從操作系統(tǒng)的進程狀態(tài)上看這些進程是正常的,但從業(yè)務功能角度,這些進程實際已處于僵死狀態(tài),因為它們已不能處理任何業(yè)務邏輯。運維監(jiān)控管理平臺支持對進程日志是否增長等方式發(fā)現(xiàn)僵死進程并告警。系統(tǒng)支持對某一時刻的進程狀態(tài)進行記錄拍照,在后續(xù)時刻發(fā)現(xiàn)與拍照記錄不一致時,可按拍照狀態(tài)復原;發(fā)現(xiàn)進程運行狀態(tài)與拍照狀態(tài)不符時的及時告警,通知運維人員。進程池監(jiān)控進程池監(jiān)測是指對若干個具有相關(guān)性的應用進程進行集中管理監(jiān)控,進程池的主要作用是在有多個客戶端并發(fā)請求時提高服務器的處理效率。■系統(tǒng)能夠進程池的配置信息進行管理,包括最大進程數(shù)量、最小進程數(shù)量以及進程池對應的日志文件?!鱿到y(tǒng)能夠通過進程池所應當包含的進程數(shù)量等性能數(shù)據(jù)的處理與分析,及時發(fā)現(xiàn)進程池的異常情況保障系統(tǒng)正常運行,并為分析優(yōu)化工作提供必要的依據(jù)。在性能數(shù)據(jù)處理過程中,保證處理的完整性和連續(xù)性?!霎敵霈F(xiàn)異常情況時,應能夠生成相應告警并轉(zhuǎn)發(fā)對應處理人員。

文件積壓監(jiān)控對應用系統(tǒng)間文件類傳輸接口進行積壓監(jiān)控,及時發(fā)現(xiàn)進程異常和接口異常。應用服務監(jiān)控提供對中間件的應用服務和ORACLE的job進行監(jiān)控,當中間件的應用服務異常,或者ORACLE的job異常時,能夠生成相應告警。偵聽監(jiān)測可集中監(jiān)測CRM、服務開通等系統(tǒng)后臺偵聽的運行狀態(tài)信息,當偵聽異常時,系統(tǒng)可提供集中的操作功能,重啟目標偵聽進程。隊列監(jiān)測可集中監(jiān)測服務開通后臺消息隊列的實時運行信息,當當前隊列深度接近系統(tǒng)設置的最大隊列深度時時,系統(tǒng)可及時觸發(fā)告警,提醒業(yè)務支撐人員進行及時處理。Web應用監(jiān)測可集中監(jiān)測前臺Web應用的運行狀態(tài)、掛起線程數(shù)、超時時長,當掛起線程數(shù)較多時,系統(tǒng)可及時觸發(fā)告警,提醒業(yè)務支撐人員進行及時處理。接口平臺監(jiān)測系統(tǒng)可及時監(jiān)測各個接口平臺運行服務的運行狀態(tài)和響應性能信息,針對運行異常和性能較差的服務系統(tǒng)可及時觸發(fā)告警,

并能夠?qū)Ψ债斕斓奶綔y性能和歷史響應能力進行圖形化的展示。1.3.業(yè)務監(jiān)控業(yè)務監(jiān)控主要是對業(yè)務受理、充值繳費、停復機等端到端的客戶感知度強的業(yè)務流程進行監(jiān)控,主動發(fā)現(xiàn)這些業(yè)務流程中影響客戶感知度的因素,如開通時長、充值可用性等,并不斷優(yōu)化系統(tǒng),逐步提升內(nèi)外部客戶的滿意度。業(yè)務監(jiān)控主要包括對業(yè)務建模、業(yè)務運營指標實時監(jiān)控、業(yè)務運營質(zhì)量分析、業(yè)務可用性探測等。業(yè)務建模業(yè)務活動模型的要素包括業(yè)務關(guān)鍵點、業(yè)務指標、關(guān)鍵點間的關(guān)聯(lián)關(guān)系,業(yè)務活動模型是指通過對業(yè)務進行梳理,建立業(yè)務過程模型描述關(guān)鍵點間的邏輯關(guān)系,并以過程模型為基礎(chǔ)描述業(yè)務關(guān)鍵點與指標的關(guān)系,關(guān)鍵點間的關(guān)聯(lián)關(guān)系。構(gòu)成業(yè)務關(guān)鍵點、業(yè)務指標、關(guān)鍵點間關(guān)聯(lián)關(guān)系的多維關(guān)系模型。業(yè)務活動建模采用從業(yè)務活動監(jiān)控需求出發(fā)、至上而下的方法,建模從過程上大體可以分為以下幾個步驟:梳理需求、建立過程模型、建立關(guān)鍵點與指標的關(guān)系、建立關(guān)鍵點間的關(guān)聯(lián)關(guān)系?!鰳I(yè)務過程建模業(yè)務過程建模首先通過對關(guān)鍵業(yè)務的流程梳理,確定業(yè)務處理過程中的監(jiān)測關(guān)鍵點,以業(yè)務處理過程的視角描述關(guān)鍵點之間

的關(guān)系,形成業(yè)務處理過程模型。然后根據(jù)監(jiān)測需要建立相應的監(jiān)測指標體系,指標通過對業(yè)務基礎(chǔ)數(shù)據(jù)的抽取和計算,來體現(xiàn)業(yè)務關(guān)鍵點的業(yè)務狀態(tài)?!鍪崂硇枨蠼5氖滓ぷ魇峭ㄟ^業(yè)務活動監(jiān)控的需求分析,明確監(jiān)控的業(yè)務范圍和要點,然后對范圍內(nèi)的業(yè)務及監(jiān)控要點間關(guān)系進行高度概括性的描述,把相關(guān)監(jiān)控要點與業(yè)務處理過程的具體環(huán)節(jié)進行映射,形成業(yè)務活動監(jiān)控的需求模型。需求模型梳理是為過程建模做準備,它沒有統(tǒng)一的標準,主要依據(jù)是業(yè)務過程的實際情況及業(yè)務人員的經(jīng)驗。■建立過程模型業(yè)務活動監(jiān)控的基本任務是監(jiān)控平臺完成的業(yè)務交易和信息處理情況,控制業(yè)務差錯,保障業(yè)務質(zhì)量,為業(yè)務流程優(yōu)化提供依據(jù),提高業(yè)務運營能力和管理水平。而業(yè)務交易和信息處理是以業(yè)務流程的方式進行的,因此將業(yè)務處理過程作為業(yè)務活動監(jiān)控的視角,對關(guān)鍵業(yè)務進行深層次的信息整理和展現(xiàn),將業(yè)務監(jiān)控深入到業(yè)務過程內(nèi)部,關(guān)注業(yè)務處理過程的細節(jié),通過細節(jié)信息的展現(xiàn),展示關(guān)鍵環(huán)節(jié)的業(yè)務處理狀態(tài),找出業(yè)務流程瓶頸,進而發(fā)現(xiàn)業(yè)務存在或潛在的問題,是業(yè)務活動監(jiān)控的有效手段。業(yè)務過程建模作為業(yè)務活動監(jiān)控的實現(xiàn)基礎(chǔ),通過對關(guān)鍵業(yè)務流程的梳理,將關(guān)鍵的業(yè)務流程展開,確定業(yè)務處理過程的監(jiān)控關(guān)鍵點,以業(yè)務處理過程的視角描述關(guān)鍵點之間的關(guān)系。

業(yè)務過程建模的主要工作為:基于需求梳理的結(jié)果,根據(jù)功能綜述、分類和規(guī)則,確定業(yè)務過程的關(guān)鍵點(即為業(yè)務過程的關(guān)鍵處理環(huán)節(jié)),定義關(guān)鍵點之間的關(guān)系,并繪制業(yè)務流程圖,體現(xiàn)關(guān)鍵點間的過程與邏輯關(guān)系。■建立關(guān)鍵點與指標的關(guān)系根據(jù)過程模型,遵照規(guī)范化思想建立關(guān)鍵點與業(yè)務指標之間的關(guān)聯(lián)關(guān)系。對于所抽取的業(yè)務過程關(guān)鍵點,抽取關(guān)鍵業(yè)務指標,如業(yè)務處理量、積壓量、處理效率及業(yè)務準確性指標,抽取的關(guān)鍵業(yè)務指標能夠?qū)﹃P(guān)鍵點的業(yè)務處理狀態(tài)進行直觀準確反映?!鼋㈥P(guān)鍵點間的關(guān)聯(lián)關(guān)系關(guān)鍵點間的關(guān)聯(lián)關(guān)系包含某幾個關(guān)鍵點間的關(guān)聯(lián)關(guān)系、具體的關(guān)鍵點與整個業(yè)務過程的關(guān)聯(lián)關(guān)系。關(guān)鍵點間的關(guān)聯(lián)關(guān)系,具體體現(xiàn)為不同關(guān)鍵點的同類指標間的關(guān)系,通過對關(guān)鍵點指標進行分類及規(guī)整,形成相關(guān)指標類,根據(jù)過程模型,并結(jié)合業(yè)務經(jīng)驗積累定義相關(guān)關(guān)鍵點同類指標的關(guān)聯(lián)關(guān)系,進而建立關(guān)鍵點間的關(guān)聯(lián)關(guān)系。關(guān)鍵點間的關(guān)聯(lián)關(guān)系是業(yè)務活動監(jiān)控的分析要點,如某業(yè)務過程的關(guān)鍵點一的業(yè)務處理量和關(guān)鍵點二的業(yè)務處理量存在固定比值關(guān)系,某業(yè)務過程的關(guān)鍵點一的處理時長指標和關(guān)鍵點二的處理時長指標存在構(gòu)成關(guān)系。關(guān)鍵點與業(yè)務過程的關(guān)聯(lián)關(guān)系具體體現(xiàn)為關(guān)鍵點業(yè)務指標

與整個業(yè)務過程同類業(yè)務指標間的關(guān)系,通過對關(guān)鍵點業(yè)務指標的歸并形成整個業(yè)務過程的關(guān)健業(yè)務指標,定義具體關(guān)鍵點指標與業(yè)務過程關(guān)鍵指標的關(guān)聯(lián)關(guān)系,進而建立某一關(guān)鍵點與整個業(yè)務過程的關(guān)聯(lián)關(guān)系。如某業(yè)務過程的關(guān)鍵點1的處理時長指標和整個業(yè)務過程的處理時長指標存在占比關(guān)系?!鰳I(yè)務支撐關(guān)系建模業(yè)務支撐關(guān)系建模主要是指對業(yè)務與模塊、業(yè)務與底層的IT基礎(chǔ)設施以及應用之間的關(guān)系進行梳理,建立業(yè)務的支撐關(guān)系模型,描述不同層次之間的物理和邏輯支撐關(guān)系,從而把業(yè)務的可用性和業(yè)務狀態(tài),與支撐業(yè)務的模塊以及底層IT基礎(chǔ)設施和應用的狀態(tài)關(guān)聯(lián)起來,構(gòu)成業(yè)務與模塊的支撐關(guān)系模型以及業(yè)務與應用、IT基礎(chǔ)設施支撐關(guān)系的模型。業(yè)務支撐關(guān)系建模主要包括支撐關(guān)系模型管理、指標聚合規(guī)則管理、告警影響規(guī)則管理、告警關(guān)聯(lián)規(guī)則管理等?!鲋侮P(guān)系模型管理關(guān)系模型管理是以數(shù)據(jù)模型的方式在系統(tǒng)中建立業(yè)務與應用及IT基礎(chǔ)設施的關(guān)系模型,并在系統(tǒng)中以模型的方式進行存儲?!鲋笜司酆弦?guī)則管理指標聚合規(guī)則管理指在業(yè)務與模塊的業(yè)務支撐關(guān)系模型中設置基本監(jiān)測指標向父元素聚合的規(guī)則管理功能父元素根據(jù)聚合生成的新指標的數(shù)據(jù)取值以及該新指標設置的告警規(guī)則得到

影響該元素可用性狀態(tài)的告警數(shù)據(jù),呈現(xiàn)在業(yè)務支撐關(guān)系模型展現(xiàn)視圖中,直觀的反映父元素的業(yè)務狀態(tài)以及底層元素狀態(tài)之間的支撐關(guān)系。■告警影響規(guī)則管理告警影響規(guī)則管理指設置業(yè)務支撐關(guān)系模型中監(jiān)控對象的告警狀態(tài)變化,引起其父元素狀態(tài)發(fā)生變化的影響規(guī)則。如支撐業(yè)務的服務器或者應用出現(xiàn)影響業(yè)務的嚴重告警時可直接或間接的影響到該業(yè)務的出現(xiàn)預警,在業(yè)務監(jiān)控視圖中體現(xiàn)出父關(guān)鍵點的狀態(tài)變化,以顏色、文字等方式給以提示?!龈婢P(guān)聯(lián)關(guān)系管理告警關(guān)聯(lián)規(guī)則管理指設置不同業(yè)務之間業(yè)務與應用以及底層基礎(chǔ)設施被管對象之間的告警關(guān)聯(lián)關(guān)系,當不同層面的多個告警同時出現(xiàn)時,系統(tǒng)會根據(jù)告警關(guān)聯(lián)規(guī)則進行處理,自動定位出根源告警并突出顯示。能夠提供可視化界面新建、編輯、刪除構(gòu)成業(yè)務支撐關(guān)系模型的各類監(jiān)控對象的告警信息關(guān)聯(lián)關(guān)系,告警關(guān)聯(lián)關(guān)系:關(guān)聯(lián)關(guān)系、從屬關(guān)系等,以支持告警數(shù)據(jù)的關(guān)聯(lián)過濾與分析。業(yè)務數(shù)據(jù)采集數(shù)據(jù)采集功能統(tǒng)一走統(tǒng)一采集與控制模塊。針對端到端業(yè)務數(shù)據(jù)的采集,本產(chǎn)品主要提供兩種數(shù)據(jù)采集方式:(1)JSON文件方式:由被監(jiān)控業(yè)務系統(tǒng)按照運維監(jiān)控管理

平臺的約定要求,定時生成JSON文件信息點,并主動ftp到運維監(jiān)控管理平臺指定的采集目錄,由運維監(jiān)控管理平臺負責實時解析、預警、入庫;(2)JDBC方式:由業(yè)務系統(tǒng)提供特定權(quán)限的數(shù)據(jù)庫訪問用戶,運維監(jiān)控管理平臺通過JDBC使用該用戶連接到業(yè)務系統(tǒng)數(shù)據(jù)庫,利用JOB并通過SQL語句或者存儲過程實現(xiàn)對業(yè)務數(shù)據(jù)的定時采集。業(yè)務運營指標監(jiān)控業(yè)務運營指標監(jiān)測是通過業(yè)務監(jiān)控視圖將業(yè)務運行中的各個關(guān)鍵點的業(yè)務指標數(shù)據(jù)以及支撐業(yè)務的底層IT基礎(chǔ)設施和應用的性能指標數(shù)據(jù)加載到業(yè)務模型上,并對這些指標數(shù)據(jù)進行預警分析生成告警數(shù)據(jù),將告警狀態(tài)呈現(xiàn)在業(yè)務模型中,來實現(xiàn)對業(yè)務運行狀態(tài)的實時監(jiān)測。業(yè)務運營指標監(jiān)測按照功能可以劃分為:業(yè)務過程指標監(jiān)測、業(yè)務支撐關(guān)系監(jiān)測。■業(yè)務過程指標監(jiān)測業(yè)務過程指標監(jiān)測是指根據(jù)業(yè)務過程模型對各關(guān)鍵點上定義的關(guān)鍵業(yè)務指標以及整個業(yè)務過程的關(guān)鍵質(zhì)量指標數(shù)據(jù)進行監(jiān)控,如訂單處理失敗率、平均處理時長等數(shù)據(jù),并對這些業(yè)務數(shù)據(jù)進行預警分析生成告警信息,將告警狀態(tài)呈現(xiàn)在業(yè)務過程模型中,來實現(xiàn)對業(yè)務流程運行狀態(tài)的實時監(jiān)控,及時發(fā)現(xiàn)業(yè)務流程中出現(xiàn)的異常。

■業(yè)務支撐關(guān)系監(jiān)測業(yè)務支撐關(guān)系監(jiān)測是指根據(jù)業(yè)務支撐關(guān)系模型對業(yè)務以及支撐該業(yè)務的業(yè)務模塊、底層IT基礎(chǔ)設施和應用的狀態(tài)進行監(jiān)控,并對這些業(yè)務數(shù)據(jù)進行預警分析生成告警信息,將告警狀態(tài)呈現(xiàn)在業(yè)務支撐關(guān)系模型中,根據(jù)定義的業(yè)務影響規(guī)則來實現(xiàn)對業(yè)務的影響性分析。業(yè)務運營質(zhì)量分析業(yè)務運營質(zhì)量分析是在業(yè)務建模和業(yè)務運營指標監(jiān)測的基礎(chǔ)上對業(yè)務過程的狀態(tài)變化情況進行跟蹤,對各關(guān)鍵點指標數(shù)據(jù)以及業(yè)務過程關(guān)鍵質(zhì)量指標數(shù)據(jù)通過異動、趨勢、對比、構(gòu)成等分析方法來實時或準實時地發(fā)現(xiàn)業(yè)務異常,及時掌握業(yè)務運營質(zhì)量,并對業(yè)務未來變化趨勢進行預測,提前發(fā)現(xiàn)業(yè)務可能出現(xiàn)的問題并及早做出預防措施,找出影響業(yè)務的主要因素,解決問題。全流程可用性探測全流程可用性探測是通過模擬客戶端運行全流程業(yè)務的過程以及模擬外部系統(tǒng)調(diào)用服務的過程,以界面、短信、服務調(diào)用等方式針對全流程業(yè)務進行探測,從而對業(yè)務可用性狀態(tài)、響應時間及其他指標進行實時監(jiān)視。全流程可用性探測使用業(yè)務建模中已經(jīng)設置好的業(yè)務流程順序,采用仿真Socket、Http、WebService、短信、客戶端程序等數(shù)據(jù)交易的方式直接對全業(yè)務過程發(fā)起模擬探測,模擬產(chǎn)生

業(yè)務交易并分析交易最終結(jié)果,從而發(fā)現(xiàn)關(guān)鍵業(yè)務流程潛在的性能和可用性問題,建立預警機制,并通過系統(tǒng)監(jiān)測生成告警事件。通過分析探測結(jié)果,發(fā)現(xiàn)關(guān)鍵業(yè)務流程中潛在的性能及可用性問題;同時建立預警機制,生成可用性探測告警事件。通過模擬端到端的請求,替代傳統(tǒng)的人工檢查,彌補系統(tǒng)監(jiān)控管理的缺陷,先于系統(tǒng)使用者找出業(yè)務流程的隱患?!鎏綔y用例管理探測用例管理提供對探測用例和探測動作的定制、修改、刪除。每個探測用例包含若干探測動作,每一個探測動作表示探測時對相應服務接口發(fā)起一次服務請求,針對每一探測動作都要記錄其探測結(jié)果,并對每個探測結(jié)果依照參照標準進行判斷分析出告警。■探測處理功能探測的處理功能包括業(yè)務活動模擬功能、手動探測與定時探測、探測點部署、探測告警、探測回退。1.4.監(jiān)控展現(xiàn)網(wǎng)絡拓撲展現(xiàn)拓撲是實現(xiàn)將各種配置項(CI)及各種配置項間的關(guān)聯(lián)關(guān)系以拓撲圖的方式展現(xiàn),使用戶能夠在拓撲圖上直觀的掌握整個配置項的拓撲結(jié)構(gòu)及各種配置項狀態(tài),并能夠通過拓撲圖靈活建立配置項間的關(guān)聯(lián)關(guān)系。網(wǎng)絡拓撲視圖支持以地理分布、網(wǎng)段或應用系統(tǒng)劃分作為索

引來組織被管網(wǎng)絡的邏輯拓撲。分級展現(xiàn)系統(tǒng)支持按照資源利用率分級顯示設備運行狀況。如空閑(<50%)、一般(50%-70%)、繁忙(70%-90%),超負荷(>90%),可根據(jù)客戶需求進行利用率的范圍設定。系統(tǒng)支持按照資源的使用率如CPU使用率、內(nèi)存使用率、SWAP使用率、文件系統(tǒng)使用率等,按照上述分級要求,顯示設備的總體運營狀態(tài)。告警展現(xiàn)拓撲圖在結(jié)合網(wǎng)絡的性能數(shù)據(jù)和事件數(shù)據(jù)后,用于監(jiān)視網(wǎng)絡的設備運行狀態(tài)和運行狀況,反映網(wǎng)絡設備配置的變更情況,及時呈現(xiàn)網(wǎng)元的告警信息和性能數(shù)據(jù),為運維人員提供直觀的對網(wǎng)絡的觀察和處理手段。拓樸圖監(jiān)視能夠?qū)崟r反映網(wǎng)元告警類別與告警級別,告警要以可視、可聞的形式提醒維護人員。告警信息未確認則相應的網(wǎng)元圖標一直閃爍?!龈婢@示告警監(jiān)視界面能顯示所有的活動告警事件,每條告警事件以不同得顏色標識相應的告警級別。告警事件的顏色標識與拓撲顯示保持一致。在根據(jù)管理需要定制增加警告級別時,告警監(jiān)視界面能夠定

制或增加警告級別,并以適當?shù)念伾硎尽DJ顏色:告警級別顏色緊急告警紅色嚴重告警橙色重要告警黃色一般告警藍色提醒告警青色聲音告警定義系統(tǒng)可以根據(jù)告警級別和告警類別的不同組合設置告警音??勺远x每種報警聲音的聲音類型、開關(guān)狀態(tài),系統(tǒng)提供修改維護界面?!龈婢录霂焖袛?shù)據(jù)采集層告警事件和數(shù)據(jù)處理層的性能超門限告警事件/相關(guān)處理事件全部存在數(shù)據(jù)庫中,以便于審計、分析和統(tǒng)計。顯示過濾對單位時間內(nèi)發(fā)生的大量告警,系統(tǒng)能夠按定制的條目(可包含告警元素、告警級別、告警類別或告警節(jié)點等)進行過濾,過濾信息是用戶自定義的,可以根據(jù)多種情況組合。告警過濾提供靈活的過濾規(guī)則:可按告警網(wǎng)元、告警級別、告警類別或告警標題等設置過濾規(guī)則;可根據(jù)某一具體告警設置

過濾規(guī)則。告警數(shù)據(jù)過濾用于過濾掉從底層提取的告警信息中監(jiān)控人員認為不重要的信息,從而減少輕微告警的干擾,以提高監(jiān)控與處理的效率。2.運維管理運維管理主要為IT人員提供統(tǒng)一的協(xié)同式工作環(huán)境。通過IT流程的梳理及固化,實現(xiàn)IT內(nèi)部縱向、橫向,以及其他專業(yè)的有效協(xié)同。通過與各類IT專業(yè)工具的集成,為IT人員提供日常工作的集中處理環(huán)境,實現(xiàn)各項IT工作的規(guī)范化、標準化、集中化處理,提高IT人員工作的效率質(zhì)量。流程引擎流程設計流程設計的靈活性和可配置性是運維管理流程實施的基礎(chǔ)和保障,目前在建系統(tǒng)的工作流引擎由本系統(tǒng)公司自主研發(fā)在靈活性和可配置性上已可滿足當前運維管理的需要并可根據(jù)特殊要求進行相應的定制化功能開發(fā)。圖形化、拖拽式的流程繪制可從畫板上拖拽流程的起始節(jié)點、流程環(huán)節(jié)、子流程、連接線到畫板區(qū)進行流程圖的繪制。流程數(shù)據(jù)項管理流程數(shù)據(jù)項定義

可針對每個流程設計獨立的流程數(shù)據(jù)項,流程數(shù)據(jù)項是構(gòu)成流程表單的基本要素。離散值為了規(guī)范特定數(shù)據(jù)項的取值范圍并實現(xiàn)與集團編碼的一致性,系統(tǒng)還提供離散值定義功能,管理員可按照集團和業(yè)務的要求,自主定義離散值,具備離散值的數(shù)據(jù)項一般采用下拉框的方式進行展示。數(shù)據(jù)項聯(lián)動機制系統(tǒng)同時支持兩個數(shù)據(jù)項之間的聯(lián)動功能,當A數(shù)據(jù)項選值發(fā)生變動時,聯(lián)動數(shù)據(jù)項B的顯示數(shù)據(jù)將隨之發(fā)生變化。計算數(shù)據(jù)項針對需要根據(jù)某兩個數(shù)據(jù)項的取值自動計算的數(shù)據(jù)項,如下圖所示,預算可根據(jù)工作人日和單價的運算自動生成對應的值?!隽鞒涛臋n模板管理為了簡化操作人員填寫流程表單的復雜度,并將現(xiàn)有的管理機制與流程引擎進行結(jié)合,系統(tǒng)可靈活定義當前流程在流程實際運轉(zhuǎn)過程中的各類文檔,如:需求說明書、發(fā)布測試、測試報告等,并根據(jù)各類文檔的重要性設置文檔的必要性,以便在流程運轉(zhuǎn)過程中進行必要性限制。■子流程管理為方便省、市之間的工作互動需要,系統(tǒng)支持在主流程中嵌套子流程的功能,子流程作為主流程的環(huán)節(jié)出現(xiàn),在設計流程時,

可指定子流程引用的目標流程。換言之,針對需求管理我們可以設計省級需求管理流程和地市級需求管理流程,當省級需求管理流程涉及地市需求的時候可以在對應的環(huán)節(jié)中引用地市級需求管理流程,流程在流轉(zhuǎn)時,可在對應的環(huán)節(jié)和條件下創(chuàng)建地市級需求單,該需求單在地市級需求管理流程中進行獨立的閉環(huán)管理,當對應的工單流轉(zhuǎn)完畢后,可返回給省級需求管理流程對應的觸發(fā)點,省級需求管理單則繼續(xù)向下繼續(xù)流程,這樣既實現(xiàn)了省、市兩級工作的互動,又保障了兩級管理流程的獨立性和閉環(huán)性。子流程在滿足“一級平臺、兩級應用”的基礎(chǔ)上,也可實現(xiàn)多個流程之間的嵌套情形,如:在需求管理流程中可能會觸發(fā)發(fā)布管理流程,發(fā)布管理流程中可以觸發(fā)測試管理流程。這樣可以保障多個管理流程的串行執(zhí)行和制約性管理措施的落地,為規(guī)范日常的IT運營提供了充分的平臺保障。■流程任務管理>流程任務定義流程任務是流程參與人在流程流轉(zhuǎn)環(huán)節(jié)需要辦理的事情,參與人需要在流程執(zhí)行時填寫相關(guān)的任務反饋信息,流程任務填寫的數(shù)據(jù)項信息在一定程度上影響著流程的流轉(zhuǎn)。流程任務也可以定義對應的任務數(shù)據(jù)項,任務數(shù)據(jù)項可與流程數(shù)據(jù)項建立關(guān)聯(lián)關(guān)系,以方便任務執(zhí)行后可直接影響流程的流轉(zhuǎn)狀態(tài)。>流程任務參與者

流程任務參與者為流程任務的執(zhí)行人,當符合對應的條件時,相應的任務將會分配給對應的執(zhí)行人。人員參與的方式可選擇“推方式''和“拉方式”,“推方式”為符合條件的員工必須辦理的任務,“拉方式''為共享任務,只要工作組內(nèi)的人員辦理即可。>流程任務文檔根據(jù)管理的需要,流程執(zhí)行人在辦理具體任務時需要提交對應的文檔,以方便時候查驗。>任務超時配置當任務分配給執(zhí)行人后,當對應的任務在規(guī)定時間內(nèi)仍未辦理的,系統(tǒng)需要進行超時提醒,并將相應的工單升級或轉(zhuǎn)派給相關(guān)人員進行處理。【不處理】超時后不采取任何行動?!咎嵝选窟M行郵件或短信提醒【終止】超時后直接終止工單的流轉(zhuǎn)【轉(zhuǎn)辦】 由其他人員進行處理,一般由處理人的上級主管處理>任務關(guān)聯(lián)動作為體現(xiàn)流程間的差異和較少流程執(zhí)行時不必要的操作,系統(tǒng)支持定義在執(zhí)行具體任務時可出現(xiàn)的動作選項,如“工單合并”、“工單拆分”、“工單關(guān)聯(lián)”、“回訪標志”、“通知標志”等功能,在流程執(zhí)行時,涉及到的任務才會出現(xiàn)對應的動作,不涉及的則

不予以體現(xiàn)。用戶通知:在流程執(zhí)行過程中需要通過郵件、短信、公告的方式通知本工單的關(guān)聯(lián)方,為落實相關(guān)事宜提供及時、便捷的手段,如應用更新時可能會影響到關(guān)聯(lián)系統(tǒng)在某段時間內(nèi)與本次發(fā)布相關(guān)的應用、接口無法正常使用時,則可通過此方式在制定發(fā)布計劃時發(fā)起相應的通知信息。用戶回訪:針對發(fā)起請求或流程的人員進行郵件回訪,對應環(huán)節(jié)的執(zhí)行人員可查看受訪人反饋的郵件信息,以便對相關(guān)事宜的執(zhí)行效果得到真實、有效的反饋。工單拆分:在需求管理及測試管理過程中因業(yè)務和管理的需要,存在將一張需求單或測試單拆分為多張流程單進行流轉(zhuǎn)的情形,為適應該要求,系統(tǒng)支持在流程需要的環(huán)節(jié)上出現(xiàn)“工單拆分”動作,以方便使用人員操作,拆分后的工單自動建立與原單的關(guān)聯(lián)關(guān)系,拆分單的內(nèi)容可根據(jù)業(yè)務的需要進行內(nèi)容的調(diào)整和修改,并可指定人員進行向下繼續(xù)處理,當拆分單都完成后,原單也將自動關(guān)閉,同時系統(tǒng)提供從拆分單、原單多個角度的關(guān)聯(lián)工單查看功能。工單合并:對不同部門提出的類似的多張需求單、問題單進行合并,合并后的工單將合并原單的關(guān)鍵要素,并可進行修改,并作為新單繼續(xù)流轉(zhuǎn),當合并單流轉(zhuǎn)關(guān)閉后原單自動關(guān)閉。>接口條件向集團或其他外圍接口上報或發(fā)送工單信息的條件,當流程

執(zhí)行過程中一旦流程數(shù)據(jù)符合預設的接口觸發(fā)條件時系統(tǒng)即可自動調(diào)用接口將對應的工單信息自動進行上報或發(fā)送系統(tǒng)支持定義觸發(fā)的目標服務以及調(diào)用的條件信(可基于任意流程數(shù)據(jù)項進行配置)?!隽鞒坛瑫r提醒機制當流程在規(guī)定的時間內(nèi)還未處理完成時,需要進行提醒和轉(zhuǎn)辦處理,任務超時只是對當前環(huán)節(jié)的任務辦理情況進行超時判斷?!隽鞒剃P(guān)注人配置流程關(guān)注人為流程超時的短信、郵件、工單的接收人,可以為具體的某一個或某幾個人,也可以是某個工作組。流程角色權(quán)限管理>流程發(fā)起權(quán)限根據(jù)管理和業(yè)務需要的不同,系統(tǒng)可設置不同人員發(fā)使用的流程,以減少誤發(fā)單和規(guī)范管理的目的。>流程角色管理系統(tǒng)支持針對流程設置角色的機制,不同流程各定義管理上需要的角色,流程角色作為流程環(huán)節(jié)的參與者進行配置。表單管理系統(tǒng)可基于流程數(shù)據(jù)項進行圖形化拖拽方式進行排版,自定

義一個流程表單,可根據(jù)管理上的要求對數(shù)據(jù)項進行的排序和調(diào)整,以便更好地方便操作人員使用。流程控制控制流程的實例運轉(zhuǎn),產(chǎn)生和流轉(zhuǎn)用戶的任務工單。支持以下流程的流轉(zhuǎn)方式:?正常流轉(zhuǎn):表示流程的正常向下一環(huán)節(jié)流轉(zhuǎn),即用戶選擇“完成”的情況。?回退:流程往上一環(huán)節(jié)流轉(zhuǎn),即用戶選擇“回退“的情況。?轉(zhuǎn)辦:表示用戶操作時請求其他用戶協(xié)同辦理。即用戶選擇“轉(zhuǎn)辦“的情況。轉(zhuǎn)辦的時候環(huán)節(jié)實例表的狀態(tài)不會改變。?撤回:當流程實例的當前實例尚未被“執(zhí)行“時,前面環(huán)節(jié)的用戶可以撤回。?接收:支持對于共享任務和非必辦任務提供“接收“功能,共享任務一旦接收則其他用戶不能辦理,非必辦任務一旦接收,變成必辦。流程監(jiān)控通過收集和分析流程運行實例的統(tǒng)計分析數(shù)據(jù),實現(xiàn)對流程運行實例運轉(zhuǎn)情況的監(jiān)控、分析。統(tǒng)計分析可針對某一個流程實例進行,也可以對基于同一模板的某一類流程進行,通過對流程執(zhí)行時長,執(zhí)行數(shù)量及超時時長,超時數(shù)量等指標的統(tǒng)計分析,

可有助于流程管理者監(jiān)督流程的運行情況,制定流程優(yōu)化方案等。圖形化的流程流程流轉(zhuǎn)軌跡查看:亮色表示流經(jīng)環(huán)節(jié),灰色表示沒有流經(jīng)的環(huán)節(jié),綠色表示當前駐留的環(huán)節(jié)。執(zhí)行明細集中展現(xiàn):按流經(jīng)的先后順序展示各個環(huán)節(jié)任務的辦理用時、辦理人以及提交的附件信息,并提供查看對應任務辦理明細。流程查詢提供所有流程對應的流程單信息,系統(tǒng)提供“基本查詢”和“高級查詢”功能,前者可提供基于工單編號、工單標題、工單創(chuàng)建時間、創(chuàng)建人信息進行查詢,后者可提供基于流程表單項的多個條件的組合查詢功能,查詢條件可自定義。2.2.運維管理流程2.2.1.事件管理事件管理流程是對IT生產(chǎn)環(huán)境中導致IT服務中斷或潛在中斷的事件進行管理,快速恢復IT服務能力的管理流程。事件的來源包括IT用戶報告的事件、監(jiān)控系統(tǒng)自動轉(zhuǎn)發(fā)的事件、客服系統(tǒng)自動轉(zhuǎn)發(fā)的IT類事件等。它的目的是盡快恢復被中斷或受到影響的IT服務,是以恢復服務為首要目的,可能采取臨時解決方案,而不在于查找根本原因。主要業(yè)務環(huán)節(jié)包括事件的登記、事件的分配、事件的處理、事件的升級和事件關(guān)閉等。

.管理目標事件管理流程的主要功能是盡快解決出現(xiàn)的事件,保持業(yè)務支撐系統(tǒng)的穩(wěn)定性,其目的包括:確保各類IT事件能夠在成本允許的范圍內(nèi),按照事件的優(yōu)先級,快速、有序地解決,從而減少IT服務中斷造成的影響。1) 多渠道快速響應服務請求(電話/Web/郵件/即時通信工具等)。2) 根據(jù)事件的優(yōu)先級,影響度進行綜合分類排序,如果判斷事件優(yōu)先級是緊急,則啟動緊急事件管理流程進行處理。3) 為客戶提供及時的事件處理狀態(tài)信息。4) 監(jiān)控事件處理過程,必要時進行管理和技術(shù)升級。確保IT事件處理過程中的關(guān)鍵信息能正確記錄,為后續(xù)事件處理提供知識支持,為流程持續(xù)優(yōu)化提供準確的數(shù)據(jù)信息。1) 按規(guī)范記錄事件信息及解決過程信息。2) 服務臺及后臺技術(shù)資源利用情況。3) 服務臺、技術(shù)支持團隊的工作效率。.業(yè)務需求點登記各種渠道上報的事件,并對其進行分類和分級;按照對業(yè)務的影響程度和優(yōu)先級分配事件;支持工程師解決該事件,并記錄詳細的解決方案;對超期事件進行升級處理;事件處理的解決方案可以形成知識,為后續(xù)工作提供參考;對歷史事件進行趨勢分析,形成問題;根據(jù)事件記錄考核相關(guān)人員的績效;對于重

復上報的事件,能夠進行關(guān)聯(lián)處理;對事件處理的過程進行跟蹤審計;事件單能夠和問題單、故障單等其他流程工單關(guān)聯(lián)。.流程設計角色及職責說明事件經(jīng)理事件經(jīng)理負責事件解決過程中的協(xié)調(diào)和監(jiān)控,事件升級的判斷和具體執(zhí)行。職責:負責對事件的解決協(xié)調(diào)資源,保證事件的最終排除。確保和問題管理流程經(jīng)理的有效合作。確保正確和廣泛地收集和分析事件數(shù)據(jù),發(fā)現(xiàn)IT和業(yè)務相關(guān)的問題。服務臺人員服務臺人員負責接收所有的事件,對事件進行初步的處理,并根據(jù)實際情況將事件分派到合適的二線支持工程師。與服務臺一起工作進行事件處理的技術(shù)人員定義為一線人員。職責:負責24X7的值班和系統(tǒng)監(jiān)控。響應客戶投訴工單、熱線電話、郵件、傳真等事件報告。完整記錄所有接收的事件信息,包括:記錄事件報告人的詳細聯(lián)系方式、事件特征表現(xiàn)、描述、發(fā)生時間等。

對事件進行適當?shù)姆诸?、為事件分配?yōu)先級等。嘗試使用工具對事件進行初步診斷,分析相關(guān)信息并解決問題。對服務臺解決不了的事件,分配給最合適的二線支持小組/人員來處理。檢查事件的處理進度,保持與事件報告人的聯(lián)系,適時通知事件處理進展。與用戶確認事件解決結(jié)果,關(guān)閉事件。二線支持人員二線支持人員是內(nèi)部相關(guān)問題領(lǐng)域的專家。負責提供對一線支持人員無法解決的問題進一步進行調(diào)研,找出解決方案并盡快恢復服務。職責:驗證事件的描述和信息,進一步收集相關(guān)信息。進行深入調(diào)查研究或協(xié)調(diào)廠商支持,提供有效的解決方案。實施事件解決方案。更新事件解決信息,將已解決的事件轉(zhuǎn)回服務臺。三線支持人員包括應用開發(fā)廠商的后端研發(fā)團隊、提供遠程支持的設備廠商、或廠商的現(xiàn)場服務。職責:

提供遠程接入方式的支持,協(xié)助進行事件診斷及恢復。必要時提供現(xiàn)場支持和深入調(diào)查研究,提供有效的解決方案。參與重大事件解決方案的實施。.流程功能各種渠道事件登記登記各種渠道上報的事件工單,并對其進行分類和分級。WEB方式,由請求人通過運維監(jiān)控管理平臺自助填寫事件工單并提交,并在表單上填寫請求分類和緊急程度。電話方式,請求人撥打服務臺統(tǒng)一熱線,由服務臺受理后代發(fā)事件工單。郵件方式,請求人可編寫固定格式的請求郵件發(fā)送到運維監(jiān)控管理平臺的系統(tǒng)郵箱中,郵件接口程序解析后生成事件工單。即時通信,請求人通過在線客服模塊與服務臺工作人員在線點對點溝通并由服務臺人員代發(fā)事件工單。根據(jù)影響程度和優(yōu)先級分配事件根據(jù)事件工單填寫的影響程度和優(yōu)先級,分配緊急的和影響范圍大的事件單給專人優(yōu)先處理。事件處理過程記錄流程引擎對事件的每個處理環(huán)節(jié)保存該環(huán)節(jié)的處理信息,包括環(huán)節(jié)派發(fā)時間、處理開始時間、處理結(jié)束時間、處理人、處理結(jié)果、處理意見。并以圖形的方式展示整個事件的處理過程。

對超期事件進行升級處理根據(jù)事件的緊急程度,設定事件工單業(yè)務超時時間,在達到超時時間時可根據(jù)預設規(guī)則進行升級,包括:通知當前人、通知服務請求管理員、通知當前人上級領(lǐng)導、將工單轉(zhuǎn)辦其他人。事件處理的解決方案可以形成知識在事件回顧環(huán)節(jié)配置知識庫關(guān)聯(lián)規(guī)則,回顧人可點擊“入知識庫”按鈕對事件處理結(jié)果進行知識入庫。對歷史事件進行趨勢分析,形成問題可定期統(tǒng)計歷史事件單,獲取還存在問題的事件并發(fā)起問題工單進行關(guān)聯(lián)跟蹤,分析角度包括:統(tǒng)計長期未處理完成的事件、統(tǒng)計大量重復發(fā)生的事件、統(tǒng)計影響嚴重的事件單、統(tǒng)計解決方案為變通解決的事件??己酥С止こ處煹目冃渲檬录己藞蟊?,統(tǒng)計支持工程師的績效,包括:支持工作量、支持效率、重復處理情況、請求人反饋滿意度關(guān)聯(lián)處理重復事件單在每個辦理環(huán)節(jié),均可以對當前工單進行重復關(guān)聯(lián),當選擇重復關(guān)聯(lián)時,本單將同步原重復單的處理狀態(tài):原單正在處理,則本單鎖定等待原單處理完成后本單同步完成,并通知請求人原單已處理完成,則本單直接結(jié)束并通知處理結(jié)果給請求人對事件處理的過程進行跟蹤審計

在事件管理流程最后增加“處理審批”環(huán)節(jié),進行事后跟蹤審核處理。事件單能夠和問題單、故障單等其他流程工單關(guān)聯(lián)事件處理結(jié)果,可選擇“發(fā)起問題跟蹤”或者“發(fā)起變更解決"的選項,當選擇該兩個選項的其中之一后,進入子工單啟動環(huán)節(jié),可設置為人工啟動也可以設置為自動啟動,從而啟動關(guān)聯(lián)的問題單或者故障單進行關(guān)聯(lián)處理。故障管理主要由事件/問題人工升級到故障管理流程,分配給故障經(jīng)理進行跟進處理,由系統(tǒng)自動記錄故障處理/分派過程,故障的關(guān)閉由升級人進行。故障管理流程即上節(jié)事件管理流程圖中的緊急事件處理子流程。故障處理過程記錄流程引擎對故障的每個處理環(huán)節(jié)保存該環(huán)節(jié)的處理信息,包括環(huán)節(jié)派發(fā)時間、處理開始時間、處理結(jié)束時間、處理人、處理結(jié)果、處理意見。并以圖形的方式展示整個故障的處理過程。對超期故障進行升級處理根據(jù)故障的緊急程度,設定故障工單業(yè)務超時時間,在達到超時時間時可根據(jù)預設規(guī)則進行升級,包括:通知當前人、通知服務請求管理員、通知當前人上級領(lǐng)導、將工單轉(zhuǎn)辦其他人。故障處理的解決方案可以形成知識

在故障回顧環(huán)節(jié)配置知識庫關(guān)聯(lián)規(guī)則,回顧人可點擊“入知識庫”按鈕對事件處理結(jié)果進行知識入庫。對歷史故障進行趨勢分析,形成問題可定期統(tǒng)計歷史故障單,獲取還存在問題的事件并發(fā)起問題工單進行關(guān)聯(lián)跟蹤,分析角度包括:統(tǒng)計大量重復發(fā)生的故障、統(tǒng)計影響嚴重的故障單、統(tǒng)計解決方案為變通解決的故障??己酥С止こ處煹目冃渲霉收峡己藞蟊?,統(tǒng)計支持工程師的績效,包括:支持工作量、支持效率、重復處理情況、請求人反饋滿意度關(guān)聯(lián)處理重復故障單在每個辦理環(huán)節(jié),均可以對當前工單進行重復關(guān)聯(lián),當選擇重復關(guān)聯(lián)時,本單將同步原重復單的處理狀態(tài):原單正在處理,則本單鎖定等待原單處理完成后本單同步完成,并通知請求人原單已處理完成,則本單直接結(jié)束并通知處理結(jié)果給請求人對故障處理的過程進行跟蹤審計在故障管理流程最后增加“處理審批”環(huán)節(jié),進行事后跟蹤審核處理。故障單能夠和問題單等其他流程工單關(guān)聯(lián)故障處理結(jié)果,可選擇“發(fā)起故障跟蹤”的選項,當選擇該兩個選項的其中之一后,進入子工單啟動環(huán)節(jié),可設置為人工啟動也可以設置為自動啟動,從而啟動關(guān)聯(lián)的問題單進行關(guān)聯(lián)處理。

問題管理問題管理流程是確定某一事件或具有相同癥狀的一組事件的根本原因,制定和實施解決方案,從而防止事件再次發(fā)生的管理流程。問題管理流程的目的是找出事件根本原因,盡可能的給出解決方案或者臨時應對措施。主要業(yè)務環(huán)節(jié)包括問題的登記、問題的審核、問題的分配、問題的處理、問題回顧和問題關(guān)閉等。管理目標問題管理流程的目標是降低生產(chǎn)環(huán)境中事件發(fā)生的數(shù)量和嚴重程度,從而為企業(yè)建立一個穩(wěn)定的IT環(huán)境,提高IT服務的可用性。其目的包括:分析并確定事件的根本原因,找到最終解決方案,以防止此類事件再次發(fā)生。通過對已知錯誤進行標識,最小化不能被消除事件的影響。提高IT服務的可靠性,降低IT支持成本。問題管理過程得到正確記錄,滿足審核和統(tǒng)計的管理要求。業(yè)務需求點登記緊急事件和事件分析整理出來的問題,并對其進行分類和分級;按照對業(yè)務的影響程度和優(yōu)先級分配問題;分析該問

題的根本原因,并記錄已知錯誤、詳細變通方案或者生成變更請求單;對超期問題進行升級處理;問題處理的解決方案或者變通方案可以形成知識庫,為后續(xù)工作提供參考;能夠?qū)栴}分析產(chǎn)生的變通方案發(fā)布到幫助臺和所有用戶;能夠分析回顧問題解決方案的效果;根據(jù)問題記錄考核支持工程師的績效;對問題處理的過程進行跟蹤審計;問題單能夠和事件單、變更單等其他流程工單關(guān)聯(lián);支持問題信息在集團和省公司IT服務管理系統(tǒng)之間的縱向傳遞。.流程設計角色及職責說明問題管理流程主要包括問題請求人、問題經(jīng)理、問題處理專家三個角色。問題請求人問題請求人主要負責問題的提出。問題經(jīng)理問題經(jīng)理負責協(xié)調(diào)日常的問題管理工作,包括對問題的審核、監(jiān)控、所需資源的協(xié)調(diào)、定期產(chǎn)生報表等。職責:確認、審核和監(jiān)視問題處理過程。必要時協(xié)調(diào)所需資源。3)問題處理專家問題處理專家通常由各專業(yè)組技術(shù)人員、廠商人員承擔,負

責問題的診斷和解決。職責:定期對事件記錄進行分析,發(fā)現(xiàn)潛在問題,發(fā)起問題管理流程。進行問題診斷和分析。開發(fā)、確認、實施解決方案。關(guān)閉問題、整理解決方案并提交知識庫。與其他流程關(guān)系與事件管理的交互對于重大事件或者統(tǒng)計分析得到的事件發(fā)生趨勢,可以產(chǎn)生相應的問題記錄。主要功能包括:支持通過重大事件生成問題記錄單,將事件中的相應信息自動

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論