事件管理過程_第1頁
事件管理過程_第2頁
事件管理過程_第3頁
事件管理過程_第4頁
事件管理過程_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、目錄1事件管理的定義. . 22事件管理的目的. . 23事件管理的范圍. . 34事件的優(yōu)先級定義. . 35事件升級 .46事件管理的流程. . 57事件管理流程的主要角色. . 108績效指標 .119事件管理改進的問題提出. . 12。11事件管理的定義突發(fā)事件是指在IT服務中的一個無計劃中斷或IT服務本身服務性能的降低, 包括系統(tǒng) 崩潰、硬件或軟件故障、 任何影響用戶當前業(yè)務使用和系統(tǒng)正常運作的故障以及影響業(yè)務流 程或違背服務級別協(xié)議的情況。突發(fā)事件管理流程是為企業(yè)業(yè)務系統(tǒng)盡快恢復正常工作狀態(tài)而設計的, 其所關心的重點 是如何達到快速響應、快速恢復,使故障對企業(yè)業(yè)務的影響最小化。事件

2、管理的責任是記錄、分類、調(diào)查與診斷、解決已知問題、監(jiān)控跟蹤事件,與用戶和 問題管理流程交互并最終解決事件。2事件管理的目的事件管理流程的主要功能是盡快解決出現(xiàn)的事件,保持企業(yè)業(yè)務系統(tǒng)的穩(wěn)定性。例如, 中國移動10086的服務控制臺接線員會去負責記錄突發(fā)事件的相關信息, 并向用戶提供對已 知問題的處理方法,報告事件到相關的技術(shù)支持部門和盡快恢復用戶的服務。 解決突發(fā)事件 的目的是獲得盡可能高的事件解決率,其主要目的包括:(1)在成本允許的范圍內(nèi)盡快恢復服務提供電話或網(wǎng)絡在線溝通與幫助, 通過自動監(jiān)控和快速響應系統(tǒng)對故障進行及時告警等 環(huán)節(jié)來保證服務能夠盡快被恢復。(2)事件控制和監(jiān)控記錄任何事件

3、,并對事件的優(yōu)先級進行分類和處理。服務控制臺工作人員要對當前事件 進行分析和診斷, 必要時把事件升級到相關的技術(shù)部門去處理, 而且服務控制臺工作人員要 對事件的全稱進行監(jiān)控,直到事件得到圓滿的解決。(3)提供事件統(tǒng)計信息給IT管理層可以對事件進行分類統(tǒng)計,比如可以通過Parato分析法分析出哪些事件是經(jīng)常發(fā)生的,這些信息可以提供給管理層進行決策分析。 管理者會關注那些主要的事件或缺失環(huán)節(jié), 并采 取相應的措施對服務環(huán)節(jié)進行調(diào)整和提高。23事件管理的范圍事件管理是和該公司的IT基礎架構(gòu)與具體的商業(yè)業(yè)務相關的。突發(fā)事件可以包括服務 故障申告、業(yè)務咨詢、業(yè)務投訴和業(yè)務處理等。一般的事件產(chǎn)生會有兩類:

4、一類是由監(jiān)控管理平臺(如Tivoli監(jiān)控軟件)自動發(fā)現(xiàn)并產(chǎn)生的告警事件,另一類是由用戶/IT運維人員報告的事件。突發(fā)事件管理流程不一定必須找到問題發(fā)生的根本原因,其重點在于如何在盡量短的時間內(nèi),恢復已經(jīng)中斷的IT服務,并提高服務的可用性。4事件的優(yōu)先級定義優(yōu)先級是事件管理的一個關鍵要素,優(yōu)先級決定處理事件的順序及所需的資源。事件優(yōu)先級可分為四類,如下表1所示:表1事件優(yōu)先級定義級別定義描述一級IT系統(tǒng)/設備宕機,服務網(wǎng)絡不可用,業(yè)務不可用,或大批用戶在使用上 出現(xiàn)問題二級服務業(yè)務或服務網(wǎng)絡的性能出現(xiàn)問題,一個以上的設備出現(xiàn)嚴重警告信息三級緊急的用戶請求或投訴處理四級一般常規(guī)的用戶受理或服務請求

5、服務控制臺的工作人員在接到來及監(jiān)控管理平臺的告警事件或終端用戶報告的事件時,迅速根據(jù)事件相關IT系統(tǒng)/設備、網(wǎng)絡的關鍵級別及事件的性質(zhì),定義該事件的優(yōu)先級別。如果為緊急和棘手的事件, 應立即升級到相關的技術(shù)或業(yè)務部門。事件升級的目的的是確保事件在解決時限內(nèi)及時通知有關技術(shù)人員和領導,引起更多的重視,提供合適的資源,從而快速找到解決事件的方案??筛鶕?jù)所要求的處理時間定義事件優(yōu)先級升級規(guī)則,包括不同等級的事件在不同的事件被升級到不同級別的人員。當技術(shù)或業(yè)務部門接受到服務控制臺升級上來的事件后,會根究具體的事件級別在規(guī)定的事件內(nèi)解決。與事件優(yōu)先級對應的事件解決時限參考表如下表2所示:表2事件解決時限

6、參考表優(yōu)先級一級二級三級四級解決時限(小時)4824485事件升級如果某一事件不能在規(guī)定的時間內(nèi)由一線支持小組解決,那么更多有經(jīng)驗的人員和有更高權(quán)限的人員將不得不參與進來。這就是升級,它可能發(fā)生在時間解決過程的任何時間和任何支持級別。升級分為職能性升級和結(jié)構(gòu)性升級。兩者的區(qū)別如下:職能性升級(又稱為水平升級、技術(shù)升級):職能性升級意味著需要具有更多時間、專業(yè)技能或訪問權(quán)限(技術(shù)授權(quán))的人員來參與事件的解決。這種升級可能會超越部門界限而 且可能會包括外部支持著。結(jié)構(gòu)性升級(又稱為垂直升級、管理升級):結(jié)構(gòu)性升級意味著當經(jīng)授權(quán)的當前級別的機構(gòu)不足以保證事件能及時、滿意地得到解決時,需要更高級別的機

7、構(gòu)參與進來。事件管理經(jīng)理對事件管理流程負有全部責任,他的目標是要為滿足一個事件的職能性升級的需要做好預備工作,以避免結(jié)構(gòu)性升級的發(fā)生。事件的處理流程線路是由所需的專業(yè)等級、緊急度和權(quán)限等因素決定的。1線支持通常由服務臺來提供、而2線支持則通常由管理部門提供;3線支持則多由軟件開發(fā)人員和系統(tǒng)結(jié)構(gòu)人員提供;4線支持由供應商提供。公司(組織)越小,則可供升級的級別數(shù)就越少。 在較大的公司(組織)里,事件管理經(jīng)理可在相關部門指定故障協(xié)調(diào)人來支持自己的工作。例如,協(xié)調(diào)人在整個事件管理過程與處于各線的支持機構(gòu)之間可充當接口的角色。每一個協(xié)調(diào)人協(xié)調(diào)他本身所在的支持團隊。圖5-1描述了升級的過程。第3線支內(nèi)檢

8、沓并記錄圖5-1事件升級過程6事件管理的流程事件管理流程應起始于事件的接受和報告,結(jié)束于事件的解決和關閉。 該流程包含下述主要內(nèi)容:(1)記錄和接受事件是事件流程的起點,所有用戶或系統(tǒng)報告的IT事件必須由此開始,目的是快速準確地發(fā)現(xiàn)事件,以協(xié)助事件的診斷和解決并通知相關人員。在此步驟中將會收集創(chuàng)建事件記錄所需的信息。該環(huán)節(jié)的關鍵是信息的準確性和完整性。在執(zhí)行突發(fā)事件管理流程時,所需要記錄的事件信息項如下表6-3所示:表6-3事件信息表項信息項信息項具體說明錄入方式時間流水號事件工單號碼系統(tǒng)生成的唯一編號用戶信息本次事件報告人的聯(lián)絡信息,包括:姓名、省份、城市、電子郵件、手機根據(jù)用戶呼入號碼或名

9、字信息來自動獲取用戶的詳細信息生成時間在服務控制臺生成事件記錄的時間系統(tǒng)抓取當前的系統(tǒng)地點事件發(fā)生的地點手工錄入發(fā)生時間事件發(fā)生的實際時間手工錄入事件性質(zhì)從事件所屬性質(zhì)的角度來確定其處理流程,如故障申告、業(yè)務咨詢、業(yè)務投訴等手工選擇事件來源指事件工單產(chǎn)生的途徑,有人工產(chǎn)生、系統(tǒng)自動產(chǎn)生兩類由監(jiān)控管理平臺自動產(chǎn)生的,可自動填寫事件影響度事件影響度用于衡量事件所影響業(yè)務的嚴 重程度。嚴重程度通常通過事件所影響的人 數(shù)、關鍵系統(tǒng)數(shù)以及服務故障所造成的損失 來設定。手工選擇事件優(yōu)先級事件優(yōu)先級決定了事件的解決時限和處理 次序,通過綜合衡量配置項的關鍵級別和其 他相關信息得出手工選擇事件分類從事件從屬的

10、系統(tǒng)或技術(shù)架構(gòu)的類型來進行分類,如數(shù)據(jù)庫、服務器和網(wǎng)絡等手工選擇事件標題事件的標題有監(jiān)控管理平臺自動產(chǎn)生的,可自動填寫事件描述對于整個事件內(nèi)容的詳細描述有監(jiān)控管理平臺自動產(chǎn)生的,可自動填寫事件解決確認人在服務控制臺得到用戶確認的有關人員手工選擇事件狀態(tài)整個事件在處理的生命周期中的不冋狀態(tài),比如觸發(fā)事件、解決事件和關閉事件等狀態(tài)手工選擇指定人被分配的技術(shù)支持組或人員手工選擇事件日志反映事件處理過程中的事件處理信息,包括任何的歷史處理記錄、人員和時間等信息手工錄入是否超時事件處理時間是否超出解決時限系統(tǒng)生成解決時間事件得到解決的時間手工錄入解決方案描述事件解決方案的描述手工錄入關聯(lián)配置項關聯(lián)問題單

11、號關聯(lián)變更單號備注:事件性質(zhì)、事件來源、所屬系統(tǒng)類型、事件分類、事件優(yōu)先級、事件響應時限和解決時限、事件影響度、事件狀態(tài)、事件結(jié)束代碼、事件解決人角色等字段定義可參考中國移動IT管理流程手冊(2)分類和初步支持事件可以是一個服務請求、信息請求或故障,對于每個事件,需要確立優(yōu)先級和分類。若沒有發(fā)現(xiàn)現(xiàn)成的解決方案或臨時解決措施,該事件將分配給合適的支持人員對此進行調(diào)查。而該環(huán)節(jié)的關鍵是需要事件知識庫的支持和正確的事件派分。(3)匹配檢查一下事件是否是已知的, 或是可能與某一現(xiàn)存事件、問題或已知錯誤有關的, 看看是否有解決方案或應急措施。(4)調(diào)查和診斷若支持人員無法解決事件,可運用自身技能、知識庫

12、、診斷工具等進行更加深入地分析, 以找到恢復服務的臨時措施,必要時將尋求很多支持人員的參與,以尋求有效的解決措施。(5)解決和恢復支持人員實施事件的解決方案,并將解決完畢的事件轉(zhuǎn)回服務控制臺;由服務控制臺通知用戶解決的結(jié)果,并得到用戶的最終確認信息。(6)緊急事件和事件升級對于緊急事件,服務控制臺應立即提交給二線或三線的技術(shù)/業(yè)務支持人員,由二線或三線人員就目前的事件情況進行合理的判斷,在必要的時候上報給事件經(jīng)理。由事件經(jīng)理決定緊急處理的方式,以確保緊急事件能夠得到最快速的解決。當事件處理超過預期時限,將自動升級或由運維人員升級,以引起相關人員和高層管理人員的重視并參與事件的處理。(7)結(jié)束事

13、件 當用戶確認事件解決后,此時可結(jié)束該事件的處理,并在事件處理系統(tǒng)中關閉該事件, 若用戶對此解決方案不滿意,則對該事件繼續(xù)進行處理,不能關閉。對一個比較有價值的事件解決方案,要放到事件知識庫中,以備以后事件處理時參考。 事件管理過程的流程如圖6-2所示:。8圖6-2事件管理的流程7事件管理流程的主要角色在執(zhí)行事件管理流程之前,就要先明確定義執(zhí)行該事件流程的主要角色。下面對以下幾 個職責/角色進行分別描述。(1)服務臺工作人員a)在指定的時間內(nèi)響應所有服務控制臺熱線電話、郵件、 傳真、 網(wǎng)絡即時聊天等事件請求;b)完整地記錄所有接受的事件信息;c)對事件進行適當?shù)姆诸悾?并根據(jù)已定義好的優(yōu)先級別

14、來為事件設定合適的優(yōu)先級別;d)通過使用相關診斷工具或查閱歷史經(jīng)驗數(shù)據(jù)庫去分析和解決當前的事件;e)如果不能做到及時解決這個事件, 服務控制臺工作人員應將該事件升級到二級技術(shù) 或業(yè)務部門去處理;f)定期檢查事件記錄的處理進度, 保持與事件報告人的緊密聯(lián)系, 適時向事件報告人 通知事件處理進展情況;g)在與事件報告人或用戶確認事件已經(jīng)解決后,關閉事件。(2)二線技術(shù)/業(yè)務支持人員二線技術(shù)/業(yè)務支持人員負責對服務控制臺工作人員無法解決的事件進行快速有效的分 析,并提出解決方案以確保能夠盡快地恢復服務。a)驗證從服務控制臺工作人員那里升級過來的事件的描述信息, 并進一步收集相關數(shù) 據(jù)或信息來界定事件

15、發(fā)生的根源;b)根據(jù)事件的根源分析來決定需要采取何種措施恢復服務;c)根據(jù)事件的優(yōu)先級來決定具體措施或解決方案的執(zhí)行時間;d)實施事件解決方案,在必要的時候提供現(xiàn)場支持;e)更新事件解決信息, 并將已解決的事件轉(zhuǎn)回給服務控制臺, 由服務控制臺工作人員 通知事件報告人或用戶,并關閉事件;f)如果二線技術(shù)人員不能解決這個事件, 應當選擇把事件轉(zhuǎn)給三線技術(shù)或業(yè)務支持人 員去處理。(3)三線技術(shù)/業(yè)務支持人員三線技術(shù)/業(yè)務支持人員是相關問題領域的專家,負責提供對二線支持人員無法解決的 問題進行更深入的調(diào)研, 找出解決方案并盡快恢復服務。 當然不是所有的三線支持人員對所1。0有的問題都很精通, 所以可以

16、考慮按照所維護的應用、 系統(tǒng)進行分組, 如網(wǎng)絡組、 服務器組、 存儲組等。a)進行事件的深入調(diào)查研究;b)根據(jù)以往的經(jīng)驗和專業(yè)技能來決定需要采取何種措施恢復服務;c)及時提供和實施有效的解決方案;d)必要時尋求服務供應商的維保支持;e)更新事件解決信息, 并將已解決的事件轉(zhuǎn)回給服務控制臺, 由服務控制臺工作人員 通知事件報告人或用戶,并關閉事件;f)如果三線不能在解決時限內(nèi)解決這個問題,應當將事件及時升級到管理層。(4)事件經(jīng)理事件經(jīng)理是管理層對事件管理的直接授權(quán)人。 作為事件管理流程的負責人, 具體職責如 下:a)負責制定流程的策略、規(guī)范和具體實施辦法;b)調(diào)度有效資源,并協(xié)調(diào)解決跨部門的事

17、件;c)指導并監(jiān)管日常業(yè)務操作服務,以確保流程的執(zhí)行符合預定的要求和規(guī)范;d)建立對流程執(zhí)行的度量指標;e)根據(jù)已定義的度量指標來采集數(shù)據(jù),并進行報表分析;f)定期與用戶、服務提供商和管理層溝通流程的使用情況;g)對流程的變更和服務流程改進計劃負有完全責任。8績效指標評估流程的績效需要明確定義目標以及為實現(xiàn)這些目標所設定的可測量的指標。這些指 標通常被稱為績效指標。 績效指標由事件經(jīng)理定期 (如每周) 報告, 以獲得一些可據(jù)此判斷 事件發(fā)展趨勢的歷史數(shù)據(jù)。事件管理流程的關鍵績效指標舉例如下:事件的總數(shù); 平均解決時間; 按優(yōu)先級計算的平均解決時間; 在SLA的目標之內(nèi)解決的時間所占的百分比;1

18、。1由一線支持解決(不將事件轉(zhuǎn)交)的時間所占的百分比; 每個事件的平均支持成本; 每個服務臺工作站或每個服務臺員工平均解決的事件數(shù); 不需拜訪用戶就解決的事件數(shù);初步分類正確的事件數(shù)量(或所占比例) ; 正確轉(zhuǎn)交的時間數(shù)量(或所占的比例) 。9事件管理改進的問題提出事件管理的最主要目的就是通過對所有事件的生命周期的管理,盡快把由于突發(fā)事件所 造成的非正常的服務恢復正常,從而把突發(fā)事件對商業(yè)服務的影響最小化。如何迅速有效的 對各種情況下的突發(fā)事件進行響應, 并以適合的能力和資源進行處理, 是事件管理過程的關 鍵點?,F(xiàn)有的數(shù)據(jù)庫技術(shù), 可以高效的實現(xiàn)數(shù)據(jù)的錄入、 查詢、 初步統(tǒng)計等功能, 但無法發(fā)現(xiàn) 數(shù)據(jù)中存在的關系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的發(fā)展趨勢,無法從海量的數(shù)據(jù)中 發(fā)現(xiàn)減少事件發(fā)生次數(shù)、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論