運維系統(tǒng)及中心機房應急預案(共12頁)_第1頁
運維系統(tǒng)及中心機房應急預案(共12頁)_第2頁
運維系統(tǒng)及中心機房應急預案(共12頁)_第3頁
運維系統(tǒng)及中心機房應急預案(共12頁)_第4頁
運維系統(tǒng)及中心機房應急預案(共12頁)_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上運維小組應急預案隨著網(wǎng)絡信息化建設的不斷深入,加強機房各類設備、系統(tǒng)以及信息與網(wǎng)絡安全等方面應對突發(fā)事件的處理能力將是我們目前面臨的一項重要任務。為確保系統(tǒng)及機房安全與穩(wěn)定,以保證正常運行為宗旨,按照“預防為主,積極處置”的原則,本著建立一個有效處置突發(fā)事件,建立統(tǒng)一指揮、職責明確運轉(zhuǎn)有序、反應迅速處置有力的機房安全體系的目標,將正在發(fā)生或已發(fā)生事故的損害程度減輕到最低,確保員工安全,特制定本應急處置預案。本預案共分為應用系統(tǒng)故障應急流程和機房突發(fā)事件應急流程系統(tǒng)故障應急流程 一、系統(tǒng)故障應急流程說明1、故障發(fā)生系統(tǒng)運維服務小組可從以下途徑得知故障的發(fā)生:1.1、運維

2、服務中心通過網(wǎng)管告警發(fā)現(xiàn)故障1.2、維護站點通過維護巡檢發(fā)現(xiàn)故障1.3、用戶發(fā)現(xiàn)故障,報給呼叫中心1.4、駐場工程師發(fā)現(xiàn)故障2、報障受理監(jiān)控系統(tǒng)運維服務小組得知系統(tǒng)故障發(fā)生后,立即響應,并向報障人或單位詳細了解系統(tǒng)故障情況。3、信息研判運維服務小組根據(jù)了解到的系統(tǒng)故障情況進行分析判斷,以確定采用一般故障處理流程還是立即啟動系統(tǒng)突發(fā)故障應急處理預案。4、預案啟動如需啟動應急預案,則立刻通知系統(tǒng)突發(fā)故障應急領導小組,由領導小組啟動應急預案,對系統(tǒng)突發(fā)故障應急事件進行全面管控處理。5、資源確認系統(tǒng)突發(fā)故障應急預案啟動后,首先是根據(jù)現(xiàn)場突發(fā)故障實際狀況、緊急程度、技術難度、備品備件等情況對相關資源(主

3、要是參與人員)依據(jù)經(jīng)驗進行調(diào)度和確認,主要有以下資源:我公司技術支持人員;相關廠家技術支持人員;我公司聘請的技術專家6、預案執(zhí)行按照既定的預案進行突發(fā)故障搶修,如遇到問題及時向系統(tǒng)突發(fā)故障應急領導小組匯報。7、預案終止預案的終止時間由故障現(xiàn)場技術人員根據(jù)現(xiàn)場的實際進展情況,在與用戶單位有關部門協(xié)調(diào)后報系統(tǒng)突發(fā)故障應急領導小組決定。8、結果上報預案中止后,相關預案參與人員將整個事件過程中的經(jīng)驗和教訓,修改、完善事件應急預案。然后集中上報至系統(tǒng)突發(fā)故障應急領導小組。二、 系統(tǒng)故障應急處理流程圖機房突發(fā)事件應急流程一、機房突發(fā)事件分類1、自然災害:指地震、火災等因自然因素引起的網(wǎng)絡與信息系統(tǒng)的損壞。

4、2、事故災難:指電力中斷、網(wǎng)絡損壞、軟件、硬件設備故障等引起的網(wǎng)絡與信息系統(tǒng)的損壞。3、人為破壞:指人為破壞網(wǎng)絡線路、通信設施,黑客攻擊、病毒攻擊、恐怖襲擊等引起的網(wǎng)絡與信息系統(tǒng)的損壞。二、 應急處理人員組織機構三、 應急機構人員崗位職責1、應急總指揮職責1.1、保證在任何時間,及時協(xié)調(diào)應急行動所有涉及的崗位人員;1.2、提供必須的緊急響應設備;1.3、在緊急情況下全面負責緊急行動;1.4、在必要時向外界求救,例如:119、110、120等。2、應急副總指揮職責2.1、在總指揮領導下具體開展工作,當總指揮不在時履行總指揮職責;2.2、根據(jù)獲得的應急信息下達命令。3、各相關設備負責人職責3.1、

5、負責盡快收集信息向應急總指揮匯報事故情況;3.2、負責現(xiàn)場臨時設備搶救和對事態(tài)的控制;3.3、聽從上級指揮人員的指揮。四、突發(fā)事件處理原則1.預防為主。立足安全防護,加強預警,重點保護基礎信息網(wǎng)絡和關系信息安全、穩(wěn)定的重要信息系統(tǒng),從預防、監(jiān)控、應急處理、應急保障等環(huán)節(jié),在管理、技術、人員等方面采取多種措施充分發(fā)揮各方面的作用,共同構筑安全保障體系。2.快速反應。突發(fā)事件發(fā)生時,按照快速反應機制,及時獲取充分而準確的信息,跟蹤研判,果斷決策,迅速處置,最大程度地減少危害和影響。3.分級負責。按照“誰主管,誰負責”的原則,建立和完善安全責任制及聯(lián)動工作機制。根據(jù)各負責人的職能,各司其職,加強各負

6、責人的協(xié)調(diào)與配合,共同履行應急處置工作的管理職責。4.以人為本。把保障人員以及公共利益的安全作為首要任務。5.常備不懈。加強技術儲備,規(guī)范應急處置措施與操作流程,定期進行預案演練,確保應急預案切實有效,實現(xiàn)網(wǎng)絡與信息安全突發(fā)公共事件應急處置的科學化、程序化與規(guī)范化。五、機房應急開關機具體措施機房各設備關閉順序如下:六、機房日常維護1、建立健全機房管理制度  1.1在正常工作日內(nèi),信息技術部人員負責對機房進行監(jiān)控,主要職責是:巡視網(wǎng)絡設備及系統(tǒng)的運行情況,發(fā)生異常情況及時處理,消除網(wǎng)絡故障隱患。  1.2節(jié)假日期間技術人員輪流值班,負責處理有關異常情況。&

7、#160; 1.3機房采取來人來訪登記制度,未經(jīng)允許,無關人員不得進入公司機房區(qū)域。 2、機房內(nèi)嚴格采取防雷、防火、防塵、防靜電等措施以及機房24小時監(jiān)控等措施。 3、認真做好數(shù)據(jù)備份工作,定期做一次數(shù)據(jù)庫完全備份,每月檢查服務器運行和備份情況。 4、對機房的主要網(wǎng)絡設備(路由器、主干交換機等)進行工作時間內(nèi)全程監(jiān)控,發(fā)現(xiàn)異常情況應及時進行處理,確保整個網(wǎng)絡的正常運行。七、服務器及存儲設備故障處理1、排錯流程2、應急處置具體措施2.1 機房漏水應急預案 (1)發(fā)生機房漏水時,第一目擊者應立即通知運維服務小組,并及時報告監(jiān)控系統(tǒng)突發(fā)故障應急領導小組。(2)

8、若空調(diào)系統(tǒng)出現(xiàn)滲漏水,運維服務小組負責人應立即安排停用故障空調(diào),清除機房積水,并及時聯(lián)系設備供應方處理,同時啟動備用空調(diào),必要情況下可臨時用備用空調(diào)對服務器進行降溫。(3)若為墻體或機房門滲漏水,運維服務小組負責人應立即采取有效措施確保機房安全,及時清除積水,維修墻體或門窗,消除滲漏水隱患。2.2 設備發(fā)生被盜或人為損害事件應急預案 (1)發(fā)生設備被盜或人為損害設備情況時,使用者或管理者應立即報告系統(tǒng)突發(fā)故障應急領導小組,同時保護好現(xiàn)場。(2)系統(tǒng)突發(fā)故障應急領導小組接報后,通知用戶保衛(wèi)部門、相關領導,一同核實審定現(xiàn)場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。(3)事

9、發(fā)單位和當事人應當積極配合公安部門進行調(diào)查, 并將有關情況向系統(tǒng)突發(fā)故障應急領導小組匯報。(4)系統(tǒng)突發(fā)故障應急領導小組安排運維服務小組、事發(fā)單位及時恢復系統(tǒng)正常運行,并對事件進行調(diào)查。運維服務小組和事發(fā)單位應在調(diào)查結束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應急領導小組。事態(tài)或后果嚴重的,應向相關領導匯報。2.3 機房長時間停電應急預案 (1)定期檢查機房供電設備的運行狀況和電路線纜器材情況,當發(fā)生下列突發(fā)事件時,按照以下方案進行處置:  (2)當機房發(fā)生市電供電突然停電或是電源異常時。首先應和后勤部門聯(lián)系確認正常停電以及預計停電時間。檢查不間斷電源的電池可供電時間,確保設備正常運行

10、,如遇到突然斷電,應及時將空調(diào)等不在UPS電源供電范圍內(nèi)的設備及時斷電,預防突然來電時瞬間電流過大導致設備損壞等現(xiàn)象。  (3)當確定停電時間超出機房UPS承載范圍后,首先確定停電的范圍以及受影響的設備范圍。并及時通知各部門做好停電應急準備。然后通知機房電源維護人和設備的負責人到達現(xiàn)場,做好各設備的電源停電準備。在UPS供電電量僅剩10%之后,嚴格按操作手冊停掉各服務器的電源,最后停核心交換機和路由器,等待電力恢復。 (4)當確定停電原因是在本身供電系統(tǒng)范圍內(nèi),立即匯報給負責領導,并及時聯(lián)系相關維護人員達到現(xiàn)場檢修。對于恢復時間無法預計的,要通知后勤部門做好柴油機

11、發(fā)電及移動電源車供電準備(5)恢復供電后,嚴格按照操作程序逐步恢復機房設備和UPS的供電,以防瞬間電流過大造成設備損壞。 2.4 通信網(wǎng)絡故障應急預案 (1)發(fā)生通信線路中斷、路由故障、流量異常、域名系統(tǒng)故障后,操作員應及時通知本單位信息系統(tǒng)管理員,經(jīng)初步判斷后及時上報運維服務小組和系統(tǒng)突發(fā)故障應急領導小組。(2) 運維服務小組接報告后,應及時查清通信網(wǎng)絡故障位置,隔離故障區(qū)域,并將事態(tài)及時報告系統(tǒng)突發(fā)故障應急領導小組,通知相關通信網(wǎng)絡運營商查清原因;同時及時組織相關技術人員檢測故障區(qū)域,逐步恢復故障區(qū)與服務器的網(wǎng)絡聯(lián)接,恢復通信網(wǎng)絡,保證正常運轉(zhuǎn)。(3) 事態(tài)或后果嚴重的,應向應急

12、指揮辦公室和相關領導匯報。(4)應急處置結束后,運維服務小組應將故障分析報告,在調(diào)查結束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應急領導小組。2.5 不良信息和網(wǎng)絡病毒事件應急預案 (1)發(fā)現(xiàn)不良信息或網(wǎng)絡病毒時,信息系統(tǒng)管理員應立即斷開網(wǎng)線,終止不良信息或網(wǎng)絡病毒傳播,并報告指揮調(diào)度中心運維服務小組和系統(tǒng)突發(fā)故障應急領導小組。(2)運維服務小組應根據(jù)系統(tǒng)突發(fā)故障應急領導小組指令,采取隔離網(wǎng)絡等措施,及時殺毒或清除不良信息,并追查不良信息來源。(3)事態(tài)或后果嚴重的,應向監(jiān)控中心辦公室和相關領導匯報。(4)處置結束后 ,運維服務小組應將事發(fā)經(jīng)過、造成影響、處置結果在調(diào)查工作結束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障

13、應急領導小組。2.6 服務器軟件系統(tǒng)故障應急預案 (1)發(fā)生服務器軟件系統(tǒng)故障后,運維服務小組負責人應立即組織啟動備份服務器系統(tǒng),由備份服務器接管業(yè)務應用,并及時報告系統(tǒng)突發(fā)故障應急領導小組;同時安排相關責任人將故障服務器脫離網(wǎng)絡,保存系統(tǒng)狀態(tài)不變,取出系統(tǒng)鏡像備份磁盤,保持原始數(shù)據(jù)。(2)運維服務小組應根據(jù)系統(tǒng)突發(fā)故障應急領導小組的指令,在確認安全的情況下,重新啟動故障服務器系統(tǒng);重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復;若重啟失敗,立即聯(lián)系相關廠商和上級單位,請求技術支援,作好技術處理。(3)事態(tài)或后果嚴重的,應向監(jiān)控中心應急指揮辦公室和相關領導匯報。(4)處置結束后,運維服務小

14、組應將事發(fā)經(jīng)過、處置結果等在調(diào)查工作結束后一日內(nèi)報告系統(tǒng)突發(fā)故障應急領導小組。2.7 黑客攻擊事件應急預案 (1)當發(fā)現(xiàn)網(wǎng)絡被非法入侵、網(wǎng)頁內(nèi)容被篡改,應用服務器上的數(shù)據(jù)被非法拷貝、修改、刪除,或通過入侵檢測系統(tǒng)發(fā)現(xiàn)有黑客正在進行攻擊時,使用者或管理者應斷開網(wǎng)絡,并立即報告系統(tǒng)突發(fā)故障應急領導小組。(2)接報告后,系統(tǒng)突發(fā)故障應急領導小組應立即指令運維服務小組核實情況,關閉服務器或系統(tǒng),修改防火墻和路由器的過濾規(guī)則,封鎖或刪除被攻破的登陸帳號,阻斷可疑用戶進入網(wǎng)絡的通道。(3)運維服務小組應及時清理系統(tǒng),恢復數(shù)據(jù)、程序,恢復系統(tǒng)和網(wǎng)絡正常;情況嚴重的,應向監(jiān)控中心應急指揮辦公室和相關領導匯報,

15、并請求支援。(4)處置結束后 ,運維服務小組應將事發(fā)經(jīng)過、處置結果等在調(diào)查工作結束后一日內(nèi)報告系統(tǒng)突發(fā)故障應急領導小組。2.8 核心設備硬件故障應急預案 (1)發(fā)生核心設備硬件故障后,運維服務小組應及時報告系統(tǒng)突發(fā)故障應急領導小組,并組織查找、確定故障設備及故障原因,進行先期處置。(2)若故障設備在短時間內(nèi)無法修復運維服務小組應啟動備份設備,保持系統(tǒng)正常運行;將故障設備脫離網(wǎng)絡,進行故障排除工作。(3)運維服務小組故障排除后,在網(wǎng)絡空閑時期,替換備用設備;若故障仍然存在,立即聯(lián)系相關廠商,認真填寫設備故障報告單備查。(4)事態(tài)或后果嚴重的,應向監(jiān)控中心應急指揮辦公室和相關領導匯報。2.9 業(yè)務

16、數(shù)據(jù)損壞應急預案 (1) 發(fā)生業(yè)務數(shù)據(jù)損壞 時,運維服務小組應及時報告系統(tǒng)突發(fā)故障應急領導小組,檢查、備份業(yè)務系統(tǒng)當前數(shù)據(jù)。(2)運維服務小組負責調(diào)用備份服務器備份數(shù)據(jù),若備份數(shù)據(jù)損壞,則調(diào)用磁帶機中歷史備份數(shù)據(jù),若磁帶機數(shù)據(jù)仍不可用,則調(diào)用異地備份數(shù)據(jù)。(3)業(yè)務數(shù)據(jù)損壞事件超過 2小時后,運維服務小組應及時報告系統(tǒng)突發(fā)故障應急領導小組,及時通知業(yè)務部門以手工方式開展業(yè)務。(4)運維服務小組應待業(yè)務數(shù)據(jù)系統(tǒng)恢復后,檢查歷史數(shù)據(jù)和當前數(shù)據(jù)的差別,由相關系統(tǒng)業(yè)務員補錄數(shù)據(jù);重新備份數(shù)據(jù),并在工作結束后一日內(nèi)報告系統(tǒng)突發(fā)故障應急領導小組。2.10 雷擊事故應急預案 (1) 遇雷暴天氣或接上級部門雷

17、暴氣象預警,運維服務小組應及時報告系統(tǒng)突發(fā)故障應急領導小組,經(jīng)請示同意后關閉部分服務器,切斷電源,暫停內(nèi)部計算機部分網(wǎng)絡工作。(2) 雷暴天氣結束后,運維服務小組報經(jīng)系統(tǒng)突發(fā)故障應急領導小組同意,及時開通服務器,恢復內(nèi)部計算機網(wǎng)絡工作,對設備和數(shù)據(jù)進行檢查。(3) 因雷擊造成損失的,運維服務小組應會同相關部門進行核實、報損,并在調(diào)查工作結束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應急領導小組。必要時,應向監(jiān)控中心應急指揮辦公室和相關領導匯報。2.11 空調(diào)設備故障應急預案 若機房專用空調(diào)損壞,應第一時間啟用機房備用空調(diào),并通知廠家上門進行維修,并及時報告信息部相關領導請示,獲得授權后按機房設備關閉順序關閉各類設備。2.12 火災事故應急預案(1)一旦機房發(fā)生火災,應遵照下列原則:首先確保人員安全;其次保護關鍵設備、數(shù)據(jù)安全;三是保護一般設備安全;(2)人員疏散的程序是:機房工作人員立即按響火警警報,并通過119電話向公安消防請求支援,所有人員戴上防毒面具,所有不參與滅火的人員按照預先確定的線路,迅速從機房

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論