機房搬遷服務應急預案_第1頁
機房搬遷服務應急預案_第2頁
機房搬遷服務應急預案_第3頁
機房搬遷服務應急預案_第4頁
機房搬遷服務應急預案_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一節(jié)應急體系 1一、應急體系 1二、應急響應 2三、應急預案 3第二節(jié)搬遷過程中的應急預案 5一、搬遷過程中設備硬件損壞 5二、設備開機無法正常運行 6第三節(jié)機房應急處理預案 7一、基本原則 7二、應急事件級別定義 7三、組織機構及職責 8四、應急響應機制 10五、應急方案 11六、后期處置 15七、應急保障 15第一節(jié)應急體系一、應急體系應急體系是招標人管理維護體系的重要組成部分。應急體系建設的目的是保證業(yè)務的連續(xù)性,消除數(shù)據(jù)中心系統(tǒng)出現(xiàn)的各種意外的中斷,尤其是保護關鍵業(yè)務免受重大故障或災難的影響。應急響應體系通過預防措施和恢復控制相結合的方式,使由意外事故(如:自然災害、事故、設備故障和故意行為)引起的破壞減少至可接受的水平。應急體系包括事件定位、影響分析、控制風險、限制損害事故的后果、并經(jīng)過演練后加以執(zhí)行、以確保在所要求的時間期限內恢復業(yè)務處理、減少事件的影響,降低系統(tǒng)的風險。二、應急響應本投標人針對本項目可能出現(xiàn)的故障和問題,提供一般性響應和緊急響應兩套方案。(一)一般性響應在系統(tǒng)正常運行后,對于一般的故障情況,將由本投標人駐廠工程師進行診斷和解決,1小時內解決故障。若故障排除困難,將在接到故障申報后本地服務機構工程師將給予支持,1小時內提出解決方案,2小時(平均時間)內到達招標人故障現(xiàn)場(部分節(jié)點需依照其交通實際情況有所延誤),故障排除時間為2小時;如再次出現(xiàn)故障排除困難的情況下,本投標人將再派高級技術人員予以徹底排除,排除時間為12小時;本投標人考慮到招標人對系統(tǒng)的使用情況,對于一般的故障情況下為招標人提供7×24小時的響應服務。(二)緊急響應對于重要及關鍵的故障,本投標人在1分鐘內進行響應,4小時解決故障。對于重要及關鍵緊急故障本投標人將提供24小時全天候響應服務。本投標人針對上述兩套方案,同樣分為多級技術支持體系為招標人提供多層次的技術支持,借助招標人多年以來服務積累的雄厚的技術力量及經(jīng)驗,本投標人的技術支持隊伍提供對口技術服務,迅速響應招標人的疑問和問題,并提供恰當和準確的解答。1.現(xiàn)場代表:是招標人在需要技術支持時接觸到的第一個層面,是實施招標人項目的直接參與者?,F(xiàn)場代表都接受過嚴格的專業(yè)技術訓練,完全能夠處理絕大部分現(xiàn)場問題。如果遇到短時間內無法解決的問題,現(xiàn)場代表會將其轉交給高級技術人員處理;2.高級技術人員:更是由專精于某一種硬件或軟件,并經(jīng)過工程實施和現(xiàn)場維護鍛煉,在解釋和解答問題等支持服務方面具有豐富經(jīng)驗的高級技術工程師組成;3.技術專家:本投標人擁有多名大型項目實施經(jīng)驗的計算機硬件、軟件、應用方面的專家、博士,他們不僅具有很高的理論水平,而且經(jīng)過多年的實踐,掌握了豐富的項目管理、實施以及系統(tǒng)維護的現(xiàn)場經(jīng)驗。三、應急預案應急預案的設計應當包括IT應急措施、非IT應急措施、相關部門的協(xié)調、應急資源的保證、應急預案啟動條件等。(一)IT應急措施對關鍵業(yè)務的應急保護,首先應該通過IT內部的應急措施加以實現(xiàn)。這些IT措施主要是數(shù)據(jù)備份、網(wǎng)路備份以及系統(tǒng)和網(wǎng)絡的應急調用等。IT應急措施的設計應當具有可操作性。(二)非IT應急措施的設計對關鍵業(yè)務的應急保護,尤其是與計算機信息網(wǎng)絡系統(tǒng)關聯(lián)程度一般或者與計算機信息網(wǎng)絡系統(tǒng)關聯(lián)程度極高的核心關鍵業(yè)務的應急保護,應當考慮采用非IT應急措施加以實現(xiàn)。非IT應急措施是在關于計算機信息網(wǎng)絡系統(tǒng)短期內無法恢復的假設基礎上進行關鍵業(yè)務連續(xù)性設計的。如,切換到手工的方式進行業(yè)務的操作,或通過介質傳輸?shù)姆绞竭M行辦自動業(yè)務操作等。(三)相關部門的協(xié)調網(wǎng)絡系統(tǒng)的應急預案設計是從保護整體利益,降低網(wǎng)絡整體風險為基本出發(fā)點,因此,對關鍵業(yè)務的應急保護涉及組織的各個部門和各個方面的配合和支持。關于關鍵業(yè)務應急保護相關部門的關聯(lián)方式是組織應急預案設計的關鍵。(四)應急資源的保證應急預案設計應當將應急活動程序化,并通過程序化確定執(zhí)行應急預案所許的組織資源,包括人員、設備、資金和其他物資,尤其是人員的保證和其他資源的同意指揮調度等。應急資源的保證還包括供應商、開發(fā)商、系統(tǒng)集成商,以及其它外協(xié)和相關單位支持。(五)應急預案的啟動條件組織應急預案的啟動條件是組織應急預案設計的重要內容,也是實施應急預案的必要條件。組織應當嚴格規(guī)定應急措施的實施和應急資源調用的程序、決策者和責任人。同時,啟動應急預案的決策信息必須來自組織規(guī)范的報告制度,并有記錄及可追溯。(六)應急預案的演練組織的應急預案正式批準之前都必須進行演練。演練也可以在仿真條件下進行,但參加演練的人員必須與實際執(zhí)行應急預案的人員的組成相近。應急預案演練是組織應急預案完善的重要工作,包括應急預案演練的計劃安排、演練過程和效果的詳細記錄,演練活動的評估報告和應急預案改進建議等。第二節(jié)搬遷過程中的應急預案一、搬遷過程中設備硬件損壞針對系統(tǒng)運輸過程中硬件損壞,我們采用加強運輸管理來規(guī)避此處風險。另外對網(wǎng)絡設備采用備份操作系統(tǒng)文件、配置文件進行應急,應用系統(tǒng)采用數(shù)據(jù)級備份進行系統(tǒng)應急,同時準備相應備機、備件,緊急時進行硬件或系統(tǒng)替換,并及時聯(lián)系進行設備維修。二、設備開機無法正常運行在搬遷前進行設備開關機測試及搬遷后設備開機過程中,如果發(fā)生設備無法正常運行故障時,按照下圖所示流程進行處理:第三節(jié)機房應急處理預案一、基本原則1.居安思危,預防為主。實行突發(fā)事件統(tǒng)一管理、統(tǒng)一指揮、各級負責的原則;2.統(tǒng)一領導,分級負責,全面規(guī)劃、及時發(fā)現(xiàn)、快速反應、措施果斷的原則,并按照事件級別迅速上報相關領導和責任人。3.制度規(guī)范,加強管理。嚴格按照事件處理流程規(guī)范操作,使突發(fā)應急的工作規(guī)范事件化、制度化。4.快速反應,協(xié)同應對。當突發(fā)事件發(fā)生時,各級要立即按應急預案,投入應急工作;加強各個部門配合協(xié)作。形成統(tǒng)一指揮、反應靈敏、功能齊全、協(xié)調有序、運轉高效的應急管理機制。5.主動報告原則:當突發(fā)事件發(fā)生后,要及時報告應急預案實施情況。二、應急事件級別定義根據(jù)網(wǎng)絡與信息安全突發(fā)公共事件的可控性、嚴重程度和影響范圍,一般分為四級:I級(特別重大)、II級(重大)、III級(較大)、IV級(一般)。國家有關法律法規(guī)有明確規(guī)定的,按國家有關規(guī)定執(zhí)行。1.I級(特別重大):重要網(wǎng)絡與信息安全系統(tǒng)發(fā)生全市性大規(guī)模癱瘓,事態(tài)發(fā)展超出相關主管部門的控制能力,對國家安全、社會秩序、經(jīng)濟建設和公共利益造成特別嚴重損害的突發(fā)公共事件。2.II級(重大):重要網(wǎng)絡與信息安全系統(tǒng)造成全市性癱瘓,對國家安全、社會秩序、經(jīng)濟建設和公共利益造成嚴重損害,需要跨部門、跨地區(qū)協(xié)同處置的突發(fā)公共事件。3.III級(較大):某一區(qū)域的重要網(wǎng)絡與信息安全系統(tǒng)癱瘓,對國家安全、社會秩序、經(jīng)濟建設和公共利益造成一定損害,但不需要跨部門、跨地區(qū)協(xié)同處置的突發(fā)公共事件。4.IV級(一般):重要的網(wǎng)絡與信息安全系統(tǒng)受到一定程度的損壞,對公民、法人和其他組織的權益有一定影響,但不危害國家安全、社會秩序、經(jīng)濟建設和公共利益的突發(fā)公共事件。三、組織機構及職責(一)應急領導小組組織機構(二)應急領導小組職責1.應急總指揮職責(1)保證在任何時間,及時協(xié)調應急行動所有涉及的崗位人員;(2)提供必須的緊急響應設備;(3)在緊急情況下全面負責緊急行動;(4)在必要時向外界求救,例如:119、110、120等。2.應急副總指揮職責(1)在總指揮領導下具體開展工作,當總指揮不在時履行總指揮職責;(2)根據(jù)獲得的應急信息下達命令。3.各相關設備負責人職責(1)負責盡快收集信息向應急總指揮匯報事故情況;(2)負責現(xiàn)場臨時設備搶救和對事態(tài)的控制;(3)聽從上級指揮人員的指揮。4.應急小組成員職責(1)值班人員平時應做好應急事件的監(jiān)控、預警工作,當應急事件發(fā)生后,迅速生產(chǎn)事件上報相關領導,并進行先期處置,如有必要通知二、三線工程師。(2)二線、三線工程師在接到應急信息后,應積極配合值班人員進行先期處置,迅速趕往故障現(xiàn)場提供技術援助。(3)對于在應急故障處理期間發(fā)生的新問題、新情況,應認真登記,及時上報。對于超出《應急預案》界定的應急事件,應及時匯報應急領導小組,爭取盡早提出補救措施進行恢復。四、應急響應機制(一)基本處理流程1.值班人員平時應做好應急事件的監(jiān)控工作,對于突發(fā)事件應認真分析、準確判定故障發(fā)生的數(shù)據(jù)域,負責跟蹤該事件直至其結束。對于不在運維中心的故障,應在第一時間內通知負責人去現(xiàn)場處理,密切關注事件流程及進展情況,并做好登記工作上報領導。2.正常情況下,要求值班人員在30分鐘內進行事件確認。如果屬于一般事件則按照事件流程進行分派處理,否則應迅速啟動《應急預案》,并嚴格按照《應急預案》所規(guī)定的步驟快速實施應急處置,及時匯報上級領導,掌握實時處理情況。3.在處理過程中,如需其他部門去現(xiàn)場增援處理,應及時向上級領導部門匯報,協(xié)調溝通,盡快聯(lián)系技術工程師或廠家技術支持趕赴現(xiàn)場援助處理。(二)機房應急開關機具體措施機房各設備關閉順序如下:(三)服務器及存儲設備故障處理五、應急方案(一)網(wǎng)絡故障事件應急預案1.發(fā)生網(wǎng)絡故障事件后,系統(tǒng)使用人員應及時報告應急小組。2.應急小組及時查清網(wǎng)絡故障位置和原因,并予以解決。3.不能確定故障的解決時間或解決故障的期限并屬較大(III級)及其以上的,應急小組應報告所領導。4.網(wǎng)絡系統(tǒng)故障突發(fā)事件分級:故障等級故障現(xiàn)象1級網(wǎng)絡完全擁塞或設備宕機網(wǎng)絡或設備處理能力嚴重受影響,對最終客戶的業(yè)務運作有嚴重影響網(wǎng)絡或設備故障對重要的客戶(公司經(jīng)理級或重要的部門)造成嚴重影響2級網(wǎng)絡或設備的性能嚴重下降,對最終客戶的業(yè)務運作產(chǎn)生重要影響部分區(qū)域網(wǎng)絡故障一般網(wǎng)絡節(jié)點發(fā)生故障大部分客戶的網(wǎng)絡通訊質量下降3級網(wǎng)絡或設備性能受損,但最終客戶大部分業(yè)務仍可正常工作報警出錯和操作命令反常4級其它一般的故障,不影響系統(tǒng)的整體運行,不影響大部分客戶的使用(二)服務器故障應急預案1.服務器故障后,應急小組確定故障設備及故障原因,并通知相關廠商。2.根據(jù)服務器修復和恢復系統(tǒng)所需時間,由所領導決定是否啟用備份設備。3.如啟用備份設備,在服務器故障排除后,應急小組在確保不影響正常業(yè)務工作的前提下,利用網(wǎng)絡空閑時期替換備用設備。如不啟用備份設備,應急小組應積極配合相關廠商解決服務器故障事件。(三)空調設備故障處理若空調損壞,應第一時間通知廠家上門進行維修,并及時報告信息部相關領導請示,獲得授權后按機房設備關閉順序關閉各類設備。(四)消防設備故障處理一旦機房發(fā)生火災,應遵照下列原則:首先確保人員安全;其次保護關鍵設備、數(shù)據(jù)安全;三是保護一般設備安全;人員疏散的程序是:機房工作人員立即按響火警警報,并通過119電話向公安消防請求支援,所有人員戴上防毒面具,所有不參與滅火的人員按照預先確定的線路,迅速從機房中撤出;人員滅火的程序是:首先切斷所有電源,啟動自動噴淋系統(tǒng)或使用滅火器,滅火值班人員戴好防毒面具,從指定位置取出泡沫滅火器進行滅火。(五)電源設備故障處理在緊急情況發(fā)生時,應按如下步驟進行關機:1.確認所有負載均已安全關機。2.關閉UPS負載電源。3.將UPS的系統(tǒng)啟用開關切換到off的狀態(tài)。4.將DC電池連接斷路器切換到off的位置。5.將所有電池拉出到紅色電池斷開線以外。6.斷開PDU上的斷路器。7.將PDU后面總輸入斷路器切換到斷開位置。8.將每個上行主電路斷路器切換到斷開位置。(六)災害性事件應急預案1.一旦發(fā)生災害性事件,應急小組每一位成員都應有責任在第一時間進入機房搶救服務器及存儲設備。2.應急小組對服務器及存儲設備的損壞程序進行評估。如服務器損壞或存儲設備損壞無法使用,立即聯(lián)系相關廠商,進入維保服務程序。3.根據(jù)服務器或存儲設備修復和恢復系統(tǒng)所需時間,由所領導小組決定是否啟用備份設備。(七)其他突發(fā)事件應急預案應急小組立刻派出技術人員進入現(xiàn)場,制定相應措施,根據(jù)實際情況靈活處理,并按要求報告所領導小組。六、后期處置1.故障排除后,應急小組向各部室發(fā)出故障解除、系統(tǒng)恢復正常運行通知。2.系統(tǒng)恢復運行后,相關操作人員盡快通知參保單位和個人辦理社會保險業(yè)務事項,并對故障發(fā)生前所進行過的業(yè)務操作進行檢查,核對業(yè)務數(shù)據(jù)是否正確或有無丟失,不正確或有丟失的應馬上更正或補錄,確保數(shù)據(jù)的正確和完整。對在故障期間采用手工受理的事項,應及時在系統(tǒng)中補充完善。3.所領導組織有關人員及有關技術專家組成事件調查組,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論