機房運營應(yīng)急保障方案_第1頁
機房運營應(yīng)急保障方案_第2頁
機房運營應(yīng)急保障方案_第3頁
機房運營應(yīng)急保障方案_第4頁
機房運營應(yīng)急保障方案_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章應(yīng)急保障方案 2第一節(jié)系統(tǒng)故障應(yīng)急流程 2一、系統(tǒng)故障應(yīng)急流程說明 2二、系統(tǒng)故障應(yīng)急處理流程圖 4第二節(jié)機房突發(fā)事件應(yīng)急流程 4一、機房突發(fā)事件分類 4二、應(yīng)急處理人員組織機構(gòu) 5三、應(yīng)急機構(gòu)人員崗位職責(zé) 5四、突發(fā)事件處理原則 6五、機房應(yīng)急開關(guān)機具體措施 6六、機房日常維護 7七、服務(wù)器及存儲設(shè)備故障處理 7第三節(jié)應(yīng)急處置具體措施 8一、機房漏水應(yīng)急預(yù)案 8二、設(shè)備發(fā)生被盜或人為損害事件應(yīng)急預(yù)案 9三、機房長時間停電應(yīng)急預(yù)案 9四、通信網(wǎng)絡(luò)故障應(yīng)急預(yù)案 五、不良信息和網(wǎng)絡(luò)病毒事件應(yīng)急預(yù)案 六、服務(wù)器軟件系統(tǒng)故障應(yīng)急預(yù)案 七、攻擊事件應(yīng)急預(yù)案 八、核心設(shè)備硬件故障應(yīng)急預(yù)案 九、業(yè)務(wù)數(shù)據(jù)損壞應(yīng)急預(yù)案 十、雷擊事故應(yīng)急預(yù)案 十一、空調(diào)設(shè)備故障應(yīng)急預(yù)案 十二、火災(zāi)事故應(yīng)急預(yù)案 第二章設(shè)備維保管理方案 1、機房維護的必要性 2、維護內(nèi)容 3、維護具體需求 4、維護服務(wù)質(zhì)量 2第一章應(yīng)急保障方案隨著網(wǎng)絡(luò)信息化建設(shè)的不斷深入,加強機房各類設(shè)備、系統(tǒng)以及信息與網(wǎng)絡(luò)安全等方面應(yīng)對突發(fā)事件的處理能力將是我們目前面臨的一項重要任務(wù)。為確保系統(tǒng)及機房安全與穩(wěn)定,以保證正常運行為宗旨,按照“預(yù)防為主,積極處置”的原則,本著建立一個有效處置突發(fā)事件,建立統(tǒng)一指揮、職責(zé)明確運轉(zhuǎn)有序、反應(yīng)迅速處置有力的機房安全體系的目標,將正在發(fā)生或已發(fā)生事故的損害程度減輕到最低,確保員工安全,特制定本應(yīng)急處置預(yù)案。本預(yù)案共分為應(yīng)用系統(tǒng)故障應(yīng)急流程和機房突發(fā)事件應(yīng)急流程第一節(jié)系統(tǒng)故障應(yīng)急流程一、系統(tǒng)故障應(yīng)急流程說明監(jiān)控系統(tǒng)運維服務(wù)小組得知系統(tǒng)故障發(fā)生后,立即響應(yīng),并向報障人或單位詳細了解系統(tǒng)故障情況。3、信息研判運維服務(wù)小組根據(jù)了解到的系統(tǒng)故障情況進行分析判斷,以確定采用一般故障處理流程還是立即啟動系統(tǒng)突發(fā)故障應(yīng)急處理預(yù)案。如需啟動應(yīng)急預(yù)案,則立刻通知系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)3導(dǎo)小組,由領(lǐng)導(dǎo)小組啟動應(yīng)急預(yù)案,對系統(tǒng)突發(fā)故障應(yīng)急事件進行全面管控處理。系統(tǒng)突發(fā)故障應(yīng)急預(yù)案啟動后,首先是根據(jù)現(xiàn)場突發(fā)故障實際狀況、緊急程度、技術(shù)難度、備品備件等情況對相關(guān)資源(主要是參與人員)依據(jù)經(jīng)驗進行調(diào)度和確認,主要有以下資源:我公司技術(shù)支持人員;相關(guān)廠家技術(shù)支持人員;按照既定的預(yù)案進行突發(fā)故障搶修,如遇到問題及時向系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組匯報。預(yù)案的終止時間由故障現(xiàn)場技術(shù)人員根據(jù)現(xiàn)場的實際進展情況,在與用戶單位有關(guān)部門協(xié)調(diào)后報系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組決定。預(yù)案中止后,相關(guān)預(yù)案參與人員將整個事件過程中的經(jīng)驗和教訓(xùn),修改、完善事件應(yīng)急預(yù)案。然后集中上報至系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。4二、系統(tǒng)故障應(yīng)急處理流程圖運維服務(wù)中心值班發(fā)現(xiàn)故障駐場工程師發(fā)現(xiàn)故障運維服務(wù)中心值班發(fā)現(xiàn)故障駐場工程師發(fā)現(xiàn)故障呼叫中心接障故障運維服務(wù)中心受理判斷分析故障類別否正常故障處理流程是否需要啟動應(yīng)急搶修處理預(yù)案是否正常故障處理流程是否需要啟動應(yīng)急搶修處理預(yù)案廠家技術(shù)支持我司廠家技術(shù)支持我司技術(shù)支持預(yù)案資源確認資源應(yīng)急預(yù)案資源確認調(diào)度流程應(yīng)急故障搶修處理信息整理結(jié)果上報故障排除信息整理結(jié)果上報第二節(jié)機房突發(fā)事件應(yīng)急流程一、機房突發(fā)事件分類1、自然災(zāi)害:指地震、火災(zāi)等因自然因素引起的網(wǎng)絡(luò)與信息系統(tǒng)的損壞。2、事故災(zāi)難:指電力中斷、網(wǎng)絡(luò)損壞、軟件、硬件設(shè)備故障等引起的網(wǎng)絡(luò)55與信息系統(tǒng)的損壞。3、人為破壞:指人為破壞網(wǎng)絡(luò)線路、通信設(shè)施,黑客攻擊、病毒攻擊、恐怖襲擊等引起的網(wǎng)絡(luò)與信息系統(tǒng)的損壞。組織機構(gòu)框架圖信息部領(lǐng)導(dǎo)(總指揮)機房負責(zé)人(副總指揮)服務(wù)器及存儲設(shè)備負責(zé)人網(wǎng)絡(luò)設(shè)備負責(zé)人空調(diào)及消防設(shè)備電源設(shè)備負責(zé)人三、應(yīng)急機構(gòu)人員崗位職責(zé)1、應(yīng)急總指揮職責(zé)1.1保證在任何時間,及時協(xié)調(diào)應(yīng)急行動所有涉及的崗位人員;1.2提供必須的緊急響應(yīng)設(shè)備;1.3在緊急情況下全面負責(zé)緊急行動;1.4在必要時向外界求救,例如:119、110、120等。2、應(yīng)急副總指揮職責(zé)2.1在總指揮領(lǐng)導(dǎo)下具體開展工作,當(dāng)總指揮不在時履行總指揮職責(zé);2.2根據(jù)獲得的應(yīng)急信息下達命令。3、各相關(guān)設(shè)備負責(zé)人職責(zé)6 3.1負責(zé)盡快收集信息向應(yīng)急總指揮匯報事故情況;3.2負責(zé)現(xiàn)場臨時設(shè)備搶救和對事態(tài)的控制;3.3聽從上級指揮人員的指揮。四、突發(fā)事件處理原則1、預(yù)防為主。立足安全防護,加強預(yù)警,重點保護基礎(chǔ)信息網(wǎng)絡(luò)和關(guān)系信息安全、穩(wěn)定的重要信息系統(tǒng),從預(yù)防、監(jiān)控、應(yīng)急處理、應(yīng)急保障等環(huán)節(jié),在管理、技術(shù)、人員等方面采取多種措施充分發(fā)揮各方面的作用,共同構(gòu)筑安2、快速反應(yīng)。突發(fā)事件發(fā)生時,按照快速反應(yīng)機制,及時獲取充分而準確的信息,跟蹤研判,果斷決策,迅速處置,最大程度地減少危害和影響。3、分級負責(zé)。按照“誰主管,誰負責(zé)”的原則,建立和完善安全責(zé)任制及聯(lián)動工作機制。根據(jù)各負責(zé)人的職能,各司其職,加強各負責(zé)人的協(xié)調(diào)與配合,共同履行應(yīng)急處置工作的管理職責(zé)。4、以人為本。把保障人員以及公共利益的安全作為首要任務(wù)。5、常備不懈。加強技術(shù)儲備,規(guī)范應(yīng)急處置措施與操作流程,定期進行預(yù)案演練,確保應(yīng)急預(yù)案切實有效,實現(xiàn)網(wǎng)絡(luò)與信息安全突發(fā)公共事件應(yīng)急處置的科學(xué)化、程序化與規(guī)范化。五、機房應(yīng)急開關(guān)機具體措施機房各設(shè)備關(guān)閉順序如下:設(shè)備空調(diào)設(shè)備空調(diào)網(wǎng)絡(luò)設(shè)備存儲設(shè)備7六、機房日常維護1、建立健全機房管理制度1.1在正常工作日內(nèi),信息技術(shù)部人員負責(zé)對機房進行監(jiān)控,主要職責(zé)是:巡視網(wǎng)絡(luò)設(shè)備及系統(tǒng)的運行情況,發(fā)生異常情況及時處理,消除網(wǎng)絡(luò)故障1.2節(jié)假日期間技術(shù)人員輪流值班,負責(zé)處理有關(guān)異常情況。1.3機房采取來人來訪登記制度,未經(jīng)允許,無關(guān)人員不得進入公司機房1.4機房內(nèi)嚴格采取防雷、防火、防塵、防靜電等措施以及機房24小時監(jiān)控等措施。1.5認真做好數(shù)據(jù)備份工作,定期做一次數(shù)據(jù)庫完全備份,每月檢查服務(wù)器運行和備份情況。1.6對機房的主要網(wǎng)絡(luò)設(shè)備(路由器、主干交換機等)進行工作時間內(nèi)全程監(jiān)控,發(fā)現(xiàn)異常情況應(yīng)及時進行處理,確保整個網(wǎng)絡(luò)的正常運行。七、服務(wù)器及存儲設(shè)備故障處理8判定硬伴故摩軟伴故摩康務(wù)器前后面板相關(guān)指示燈異常顯示出原因解決故摩結(jié)束第三節(jié)應(yīng)急處置具體措施(1)發(fā)生機房漏水時,第一目擊者應(yīng)立即通知運維服務(wù)小組,并及時報告監(jiān)控系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。(2)若空調(diào)系統(tǒng)出現(xiàn)滲漏水,運維服務(wù)小組負責(zé)人應(yīng)立即安排停用故障空調(diào),清除機房積水,并及時聯(lián)系設(shè)備供應(yīng)方處理,同時啟動備用空調(diào),必要情況下可臨時用備用空調(diào)對服務(wù)器進行降溫。9(3)若為墻體或機房門滲漏水,運維服務(wù)小組負責(zé)人應(yīng)立即采取有效措施確保機房安全,及時清除積水,維修墻體或門窗,消除滲漏水隱患。二、設(shè)備發(fā)生被盜或人為損害事件應(yīng)急預(yù)案(1)發(fā)生設(shè)備被盜或人為損害設(shè)備情況時,使用者或管理者應(yīng)立即報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,同時保護好現(xiàn)場。(2)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組接報后,通知用戶保衛(wèi)部門、相關(guān)領(lǐng)導(dǎo),一同核實審定現(xiàn)場情況,清點被盜物資或盤查人為損害情況,做好必要的影像記錄和文字記錄。(3)事發(fā)單位和當(dāng)事人應(yīng)當(dāng)積極配合公安部門進行調(diào)查,并將有關(guān)情況向系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組匯報。(4)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組安排運維服務(wù)小組、事發(fā)單位及時恢復(fù)系統(tǒng)正常運行,并對事件進行調(diào)查。運維服務(wù)小組和事發(fā)單位應(yīng)在調(diào)查結(jié)束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。事態(tài)或后果嚴重的,應(yīng)向相關(guān)領(lǐng)導(dǎo)三、機房長時間停電應(yīng)急預(yù)案(1)定期檢查機房供電設(shè)備的運行狀況和電路線纜器材情況,當(dāng)發(fā)生下列突發(fā)事件時,按照以下方案進行處置:(2)當(dāng)機房發(fā)生市電供電突然停電或是電源異常時。首先應(yīng)和后勤部門聯(lián)系確認正常停電以及預(yù)計停電時間。檢查不間斷電源的電池可供電時間,確保設(shè)備正常運行,如遇到突然斷電,應(yīng)及時將空調(diào)等不在UPS電源供電范圍內(nèi)的設(shè)備及時斷電,預(yù)防突然來電時瞬間電流過大導(dǎo)致設(shè)備損壞等現(xiàn)象。(3)當(dāng)確定停電時間超出機房UPS承載范圍后,首先確定停電的范圍以及受影響的設(shè)備范圍。并及時通知各部門做好停電應(yīng)急準備。然后通知機房電源維護人和設(shè)備的負責(zé)人到達現(xiàn)場,做好各設(shè)備的電源停電準備。在UPS供電電量僅剩10%之后,嚴格按操作手冊停掉各服務(wù)器的電源,最后停核心交換機和路由器,等待電力恢復(fù)。(4)當(dāng)確定停電原因是在本身供電系統(tǒng)范圍內(nèi),立即匯報給負責(zé)領(lǐng)導(dǎo),并及時聯(lián)系相關(guān)維護人員達到現(xiàn)場檢修。對于恢復(fù)時間無法預(yù)計的,要通知后勤部門做好柴油機發(fā)電及移動電源車供電準備(5)恢復(fù)供電后,嚴格按照操作程序逐步恢復(fù)機房設(shè)備和UPS的供電,以防瞬間電流過大造成設(shè)備損壞。四、通信網(wǎng)絡(luò)故障應(yīng)急預(yù)案(1)發(fā)生通信線路中斷、路由故障、流量異常、域名系統(tǒng)故障后,操作員應(yīng)及時通知本單位信息系統(tǒng)管理員,經(jīng)初步判斷后及時上報運維服務(wù)小組和系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。(2)運維服務(wù)小組接報告后,應(yīng)及時查清通信網(wǎng)絡(luò)故障位置,隔離故障區(qū)域,并將事態(tài)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,通知相關(guān)通信網(wǎng)絡(luò)運營商查清原因;同時及時組織相關(guān)技術(shù)人員檢測故障區(qū)域,逐步恢復(fù)故障區(qū)與服務(wù)器的網(wǎng)絡(luò)聯(lián)接,恢復(fù)通信網(wǎng)絡(luò),保證正常運轉(zhuǎn)。(3)事態(tài)或后果嚴重的,應(yīng)向應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報。(4)應(yīng)急處置結(jié)束后,運維服務(wù)小組應(yīng)將故障分析報告,在調(diào)查結(jié)束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。五、不良信息和網(wǎng)絡(luò)病毒事件應(yīng)急預(yù)案(1)發(fā)現(xiàn)不良信息或網(wǎng)絡(luò)病毒時,信息系統(tǒng)管理員應(yīng)立即斷開網(wǎng)線,終止不良信息或網(wǎng)絡(luò)病毒傳播,并報告指揮調(diào)度中心運維服務(wù)小組和系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。(2)運維服務(wù)小組應(yīng)根據(jù)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組指令,采取隔離網(wǎng)絡(luò)等措施,及時殺毒或清除不良信息,并追查不良信息來源。(3)事態(tài)或后果嚴重的,應(yīng)向監(jiān)控中心辦公室和相關(guān)領(lǐng)導(dǎo)匯報。(4)處置結(jié)束后,運維服務(wù)小組應(yīng)將事發(fā)經(jīng)過、造成影響、處置結(jié)果在調(diào)查工作結(jié)束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。(1)發(fā)生服務(wù)器軟件系統(tǒng)故障后,運維服務(wù)小組負責(zé)人應(yīng)立即組織啟動備份服務(wù)器系統(tǒng),由備份服務(wù)器接管業(yè)務(wù)應(yīng)用,并及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組;同時安排相關(guān)責(zé)任人將故障服務(wù)器脫離網(wǎng)絡(luò),保存系統(tǒng)狀態(tài)不變,取出系統(tǒng)鏡像備份磁盤,保持原始數(shù)據(jù)。(2)運維服務(wù)小組應(yīng)根據(jù)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組的指令,在確認安全的情況下,重新啟動故障服務(wù)器系統(tǒng);重啟系統(tǒng)成功,則檢查數(shù)據(jù)丟失情況,利用備份數(shù)據(jù)恢復(fù);若重啟失敗,立即聯(lián)系相關(guān)廠商和上級單位,請求技術(shù)支援,作好技術(shù)處理。(3)事態(tài)或后果嚴重的,應(yīng)向監(jiān)控中心應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報。(4)處置結(jié)束后,運維服務(wù)小組應(yīng)將事發(fā)經(jīng)過、處置結(jié)果等在調(diào)查工作結(jié)束后一日內(nèi)報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。七、攻擊事件應(yīng)急預(yù)案(1)當(dāng)發(fā)現(xiàn)網(wǎng)絡(luò)被非法入侵、網(wǎng)頁內(nèi)容被篡改,應(yīng)用服務(wù)器上的數(shù)據(jù)被非法拷貝、修改、刪除,或通過入侵檢測系統(tǒng)發(fā)現(xiàn)有黑客正在進行攻擊時,使用者或管理者應(yīng)斷開網(wǎng)絡(luò),并立即報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。(2)接報告后,系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組應(yīng)立即指令運維服務(wù)小組核實情況,關(guān)閉服務(wù)器或系統(tǒng),修改防火墻和路由器的過濾規(guī)則,封鎖或刪除被攻破的登陸帳號,阻斷可疑用戶進入網(wǎng)絡(luò)的通道。(3)運維服務(wù)小組應(yīng)及時清理系統(tǒng),恢復(fù)數(shù)據(jù)、程序,恢復(fù)系統(tǒng)和網(wǎng)絡(luò)正常;情況嚴重的,應(yīng)向監(jiān)控中心應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報,并請求支(4)處置結(jié)束后,運維服務(wù)小組應(yīng)將事發(fā)經(jīng)過、處置結(jié)果等在調(diào)查工作結(jié)束后一日內(nèi)報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。八、核心設(shè)備硬件故障應(yīng)急預(yù)案(1)發(fā)生核心設(shè)備硬件故障后,運維服務(wù)小組應(yīng)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,并組織查找、確定故障設(shè)備及故障原因,進行先期處置。(2)若故障設(shè)備在短時間內(nèi)無法修復(fù)運維服務(wù)小組應(yīng)啟動備份設(shè)備,保持系統(tǒng)正常運行;將故障設(shè)備脫離網(wǎng)絡(luò),進行故障排除工作。(3)運維服務(wù)小組故障排除后,在網(wǎng)絡(luò)空閑時期,替換備用設(shè)備;若故障仍然存在,立即聯(lián)系相關(guān)廠商,認真填寫設(shè)備故障報告單備查。(4)事態(tài)或后果嚴重的,應(yīng)向監(jiān)控中心應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報。九、業(yè)務(wù)數(shù)據(jù)損壞應(yīng)急預(yù)案(1)發(fā)生業(yè)務(wù)數(shù)據(jù)損壞時,運維服務(wù)小組應(yīng)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,檢查、備份業(yè)務(wù)系統(tǒng)當(dāng)前數(shù)據(jù)。(2)運維服務(wù)小組負責(zé)調(diào)用備份服務(wù)器備份數(shù)據(jù),若備份數(shù)據(jù)損壞,則調(diào)用磁帶機中歷史備份數(shù)據(jù),若磁帶機數(shù)據(jù)仍不可用,則調(diào)用異地備份數(shù)據(jù)。(3)業(yè)務(wù)數(shù)據(jù)損壞事件超過2小時后,運維服務(wù)小組應(yīng)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,及時通知業(yè)務(wù)部門以手工方式開展業(yè)務(wù)。(4)運維服務(wù)小組應(yīng)待業(yè)務(wù)數(shù)據(jù)系統(tǒng)恢復(fù)后,檢查歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)的差別,由相關(guān)系統(tǒng)業(yè)務(wù)員補錄數(shù)據(jù);重新備份數(shù)據(jù),并在工作結(jié)束后一日內(nèi)報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。(1)遇雷暴天氣或接上級部門雷暴氣象預(yù)警,運維服務(wù)小組應(yīng)及時報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,經(jīng)請示同意后關(guān)閉部分服務(wù)器,切斷電源,暫停內(nèi)部部分網(wǎng)絡(luò)工作。(2)雷暴天氣結(jié)束后,運維服務(wù)小組報經(jīng)系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組同意,及時開通服務(wù)器,恢復(fù)內(nèi)部計算機網(wǎng)絡(luò)工作,對設(shè)備和數(shù)據(jù)進行檢查。(3)因雷擊造成損失的,運維服務(wù)小組應(yīng)會同相關(guān)部門進行核實、報損,并在調(diào)查工作結(jié)束后一日內(nèi)書面報告系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。必要時,應(yīng)向監(jiān)控中心應(yīng)急指揮辦公室和相關(guān)領(lǐng)導(dǎo)匯報。十一、空調(diào)設(shè)備故障應(yīng)急預(yù)案若機房專用空調(diào)損壞,應(yīng)第一時間啟用機房備用空調(diào),并通知廠家上門進行維修,并及時報告信息部相關(guān)領(lǐng)導(dǎo)請示,獲得授權(quán)后按機房設(shè)備關(guān)閉順序關(guān)(1)一旦機房發(fā)生火災(zāi),應(yīng)遵照下列原則:首先確保人員安全;其次保護關(guān)鍵設(shè)備、數(shù)據(jù)安全;三是保護一般設(shè)備安全;(2)人員疏散的程序是:機房工作人員立即按響火警警報,并通過119電話向公安消防請求支援,所有人員戴上防毒面具,所有不參與滅火的人員按照預(yù)先確定的線路,迅速從機房中撤出;(3)人員滅火的程序是:首先切斷所有電源,啟動自動噴淋系統(tǒng)或使用滅火器,滅火值班人員戴好防毒面具,從指定位置取出泡沫滅火器進行滅火。3.13電源設(shè)備故障應(yīng)急預(yù)案機房目前使用UPS系統(tǒng),在緊急情況發(fā)生時,應(yīng)按如下步驟進行關(guān)機:(1)確認所有負載均已安全關(guān)機。(3)將UPS的系統(tǒng)啟用開關(guān)切換到off的狀態(tài)。(4)將電池連接斷路器切換到off的位置。第二章設(shè)備維保管理方案機房內(nèi)的設(shè)備對工作環(huán)境有著非同一般的要求。1.1機房設(shè)備十分愛干凈,對灰塵特別“感冒”。如果設(shè)備長期處于灰塵漫舞的環(huán)境中工作,很容易發(fā)生故障,因為灰塵會不知不覺地滲入設(shè)備的控制框中,并直接覆蓋到它的電子線路中。時間一長,設(shè)備內(nèi)部的工作電路就會散熱不良,長此以往自然就容易出現(xiàn)故障。1.2設(shè)備都害怕潮濕。設(shè)備內(nèi)部有電子線路,如果電子線路中的各個元器件長期在潮濕環(huán)境中工作,其電氣性能會逐步下降,而且還有可能產(chǎn)生漏電現(xiàn)象,引發(fā)火災(zāi)事故。1.3設(shè)備對環(huán)境溫度十分敏感。高于40℃的環(huán)境或低于0℃的環(huán)境會降低設(shè)備的工作效率,使它的潛能得不到充分發(fā)揮,從而減少使用壽命。1.4機房的硬件設(shè)備品牌過多、產(chǎn)品供應(yīng)商過多,廠家售后保障措施不到位等等原因,導(dǎo)致設(shè)備使用一段時間后,設(shè)備故障不斷、損壞率不斷攀升,最終不得不對原有設(shè)備進行大面積更新,出現(xiàn)重復(fù)投資、浪費嚴重的現(xiàn)象。1.5對于客戶而言,往往因為專注于業(yè)務(wù)或者受成本所限,缺乏專業(yè)的機房維護人員以及充足的備件。如果說小故障尚可解決,那么,一旦機房發(fā)生突如其來的大故障,客戶便會措手不及,或者無法找到癥結(jié)所在,或者沒有可更換的備件。此時,損失已經(jīng)造成了。1.6為了做好機房設(shè)備的維護工作,我公司維修中心配備相應(yīng)的人力、物力(工具、通訊設(shè)備等),確保中心機房正常運作,通過對機房環(huán)境支撐系統(tǒng)、監(jiān)控設(shè)備、計算機主機設(shè)備定期檢測、維護和保養(yǎng),保障機房設(shè)備運行穩(wěn)定,通過保養(yǎng)延長設(shè)備生命周期,降低故障率。1.7確保機房在突發(fā)事故導(dǎo)致硬件設(shè)備故障,影響機房正常運作情況下,可及時得到設(shè)備供應(yīng)商或機房服務(wù)維護公司的產(chǎn)品維修和技術(shù)支持,并快速解2.1機房監(jiān)控設(shè)備維護管理:供配電監(jiān)測系統(tǒng)、空調(diào)環(huán)境檢測系統(tǒng)、門禁設(shè)備系統(tǒng)、漏水檢測、保安監(jiān)控設(shè)備(包含攝像頭、硬盤錄像機)、監(jiān)控主機;2.2機房空調(diào)與配電設(shè)備維護管理:精密空調(diào)機組、新風(fēng)設(shè)備;UPS及電2.3機房消防設(shè)備維護管理:各種探測器、手動報警按鈕和報警控制器,滅火劑的控制裝置;2.4機房供水水路、電路及照明線路的維護管理:水、電路管線及接口的檢查維修。2.5機房基礎(chǔ)維護管理:機柜線路的整理、標簽檢查更換、機房除塵清潔、地板、墻面、吊頂、門窗及有關(guān)配套的維護管理2.6機房主機設(shè)備維護管理:計算機服務(wù)器(包括PC服務(wù)器、存儲服務(wù)器);網(wǎng)絡(luò)設(shè)備(路由及交換設(shè)備等);KVM系統(tǒng);2.7機房運維管理體系建設(shè):完善機房運維規(guī)范,優(yōu)化機房運維體系;3.1機房監(jiān)控設(shè)備:1)每季度一次設(shè)備的除塵、清理,掃凈監(jiān)控設(shè)備顯露的塵土,對攝像機、防護罩、門禁、監(jiān)控采集模塊等部件要卸下徹底吹風(fēng)除塵,之后用無水酒精棉將各個擦干凈,調(diào)整攝像頭清晰度,防止由于機器運轉(zhuǎn)、靜電等因素將塵土吸入監(jiān)控設(shè)備機體內(nèi),確保機器正常運行。同時檢查監(jiān)控機房通風(fēng)、散熱、凈塵、供電等設(shè)施。室外溫度應(yīng)在-20℃~+60℃,相對濕度應(yīng)在10%~100%;室內(nèi)溫度應(yīng)控制在+5℃~+35℃,相對濕度應(yīng)控制在10%~80%,留給機房監(jiān)控設(shè)備一個良好的運行環(huán)境。2)根據(jù)監(jiān)控系統(tǒng)各部份設(shè)備的使用說明,每月檢測其各項技術(shù)參數(shù)及監(jiān)控系統(tǒng)傳輸線路質(zhì)量,處理故障隱患,協(xié)助監(jiān)控主管設(shè)定使用級別等各種數(shù)據(jù),確保各部份設(shè)備各項功能良好,能夠正常運行。3)對容易老化的監(jiān)控設(shè)備部件每月一次進行全面檢查,一旦發(fā)現(xiàn)老化現(xiàn)象應(yīng)及時更換、維修,如視頻頭、采集模塊等。4)對易吸塵部份每季度定期清理一次,如監(jiān)視器、漏水檢測主機、門禁主機等暴露在空氣中,由于屏幕的靜電作用,會有許多灰塵被吸附在監(jiān)視器表面,影響畫面的清晰度,要定期擦拭監(jiān)視器,校對監(jiān)視器的顏色及亮度。5)對長時間工作的監(jiān)控設(shè)備每月定期維護一次,如硬盤錄像機長時間工作會產(chǎn)生較多的熱量,一旦其電風(fēng)扇有故障,會影響排熱,以免硬盤錄像機工作6)對監(jiān)控系統(tǒng)及設(shè)備的運行情況進行監(jiān)控,分析運行情況,及時發(fā)現(xiàn)并排除故障。如:網(wǎng)絡(luò)設(shè)備、服務(wù)器系統(tǒng)、監(jiān)控終端及各種終端外設(shè)。桌面系統(tǒng)的運行檢查,網(wǎng)絡(luò)及桌面系統(tǒng)的病毒防御。7)每月定期對監(jiān)控系統(tǒng)和設(shè)備進行優(yōu)化:合理安排監(jiān)控中心的監(jiān)控網(wǎng)絡(luò)需求,如帶寬、IP地址等限制。提供每月一次的監(jiān)控系統(tǒng)網(wǎng)絡(luò)性能檢測,包括網(wǎng)絡(luò)的連通性、穩(wěn)定性及帶寬的利用率等;實時檢測所有可能影響監(jiān)控網(wǎng)絡(luò)設(shè)備的外來網(wǎng)絡(luò)攻擊,實時監(jiān)控各服務(wù)器運行狀態(tài)、流量及入侵監(jiān)控等。對異常情況,進行核查,并進行相關(guān)的處理。根據(jù)用戶需要進行監(jiān)控網(wǎng)絡(luò)的規(guī)劃、優(yōu)化;協(xié)助處理服務(wù)器軟硬件故障及進行相關(guān)硬件軟件的拆裝等。8)提供每月一次的定期信息服務(wù):每月第一個工作日,將上月?lián)屝?、維修、維護、保養(yǎng)記錄表以電子文檔的形式報送監(jiān)控中心負責(zé)人。3.2、機房空調(diào)與配電設(shè)備3.2.1機房空調(diào)及新風(fēng)維護3.2.1.1控制系統(tǒng)的維護對空調(diào)系統(tǒng)的維護人員而言,在巡視時第一步就是看空調(diào)系統(tǒng)是否在正常運行,因此我們首先要做以下的一些工作。1)從空調(diào)系統(tǒng)的顯示屏上檢查空調(diào)系統(tǒng)的各項功能及參數(shù)是否正常;2)如有報警的情況要檢查報警記錄,并分析報警原因;3)檢查溫度、濕度傳感器的工作狀態(tài)是否正常;4)對壓縮機和加濕器的運行參數(shù)要做到心中有數(shù),特別是在每天早上的第一次巡檢時,要把前一天晚上壓縮機的運行參數(shù)和以前的同一時段的參數(shù)進行對比,看是否有大的變化,根據(jù)參數(shù)的變化可以判斷機房中的計算機設(shè)備運行狀況是否有較大的變化,以便合理地調(diào)配空調(diào)系統(tǒng)的運行臺次和調(diào)整空調(diào)的運行參數(shù)。當(dāng)然,對目前而言有些比較老的空調(diào)系統(tǒng)還不能夠讀出這些參數(shù),這就需要晚上值班的工作人員多觀察和記錄。3.2.1.2壓縮機的巡回檢查及維護1)聽一用聽聲音的方法,能較正確的判斷出壓縮機的運轉(zhuǎn)情況。因為壓縮機運轉(zhuǎn)時,它的響聲應(yīng)是均勻而有節(jié)奏的。如果它的響聲失去節(jié)奏聲,而出現(xiàn)了不均勻噪音時,即表示壓縮機的內(nèi)部機件或氣缸工作情況有了不正常的變2)摸一用手摸的方法,可知其發(fā)熱程度,能夠大概判斷是否在超過規(guī)定壓力、規(guī)定溫度的情況下運行壓縮機。3)看—主要是從視鏡觀察制冷劑的液面,看是否缺少制冷劑。4)量—主要是測量在壓縮機運行時的電流及吸、排氣壓力,能夠比較準確判斷壓縮機的運行狀況。當(dāng)然對壓縮機我們還需要檢查高、低壓保護開關(guān)、干燥過濾器等其他附3.2.1.3冷凝器的巡回檢查及維護1)對專業(yè)空調(diào)冷凝器的維護相當(dāng)于對空調(diào)室外機的維護,因此我們首先需要檢查冷凝器的固定情況,看對冷凝器的固定件是否有松動的跡象,以免對冷媒管線及室外機造成損壞。2)檢查冷媒管線有無破損的情況(當(dāng)然從壓縮機的工作狀況及其它的一些性能參數(shù)也能夠判斷冷媒管線是否破損),檢查冷媒管線的保溫狀況,特別是在北方地區(qū)的冬天,這是一件比較重要的工作,如果環(huán)境溫度太低而冷媒管線的保溫狀況又不好的話,對空調(diào)系統(tǒng)的正常運轉(zhuǎn)有一定的影響。3)檢查風(fēng)扇的運行狀況:主要檢查風(fēng)扇的軸承、底座、電機等的工作情況,在風(fēng)扇運行時是否有異常震動機風(fēng)扇的扇也在轉(zhuǎn)動時是否在同一個平面4)檢查冷凝器下面是否有雜物影響風(fēng)道的暢通,從而影響冷凝器的冷凝效果;檢查冷凝器的翅片有無破損的狀況。5)檢查冷凝器工作時的電流是否正常,從工作電流也能夠進一步判斷風(fēng)扇的工作情況是否正常。6)檢查調(diào)速開關(guān)是否正常,一般的空調(diào)的冷凝器都有兩個調(diào)速開關(guān),分為溫度和壓力調(diào)速,現(xiàn)在比較新的控制技術(shù)采用雙壓力調(diào)速控制,因此我們在檢查調(diào)速開關(guān)時主要是看在規(guī)定的壓力范圍內(nèi),調(diào)速開關(guān)能否正??刂骑L(fēng)扇的啟3.2.1.4蒸發(fā)器、膨脹閥的巡回檢查及維護蒸發(fā)器、膨脹閥的維護主要是檢查蒸發(fā)器盤管是否清潔,是否有結(jié)霜的現(xiàn)象出現(xiàn),以及蒸發(fā)器排水托盤排水是否暢通,如蒸發(fā)器盤管上有比較嚴重的結(jié)霜現(xiàn)象或在壓縮機運轉(zhuǎn)時盤管上的溫度較高的話(通常狀況下,蒸發(fā)器盤管的溫度應(yīng)該比環(huán)境溫度低10℃左右),就應(yīng)當(dāng)檢查壓縮機的高、低壓,如果壓力正常的話,就應(yīng)考慮膨脹閥的開啟量是否合適。當(dāng)然出現(xiàn)這種現(xiàn)象也有可能是其它環(huán)境的原因引起的,比如空調(diào)的制冷量不夠、風(fēng)機故障引起風(fēng)速過慢等原3.2.1.5加濕系統(tǒng)的巡檢及維護1)由于各個地方的空氣環(huán)境不同,對加濕器的使用和影響也不一樣,但我們在日常的維護工作中同樣要做的事情是觀察加上罐內(nèi)是否有沉淀物質(zhì),如有就要及時沖洗,因為現(xiàn)在空調(diào)的加濕罐一般都是電極式的,如沉淀物過多而又不及時沖洗的話,就容易在電極上結(jié)垢從而影響加濕罐的使用壽命。當(dāng)然現(xiàn)在有些加濕罐的電極是可以更換的。2)檢查上水和排水電磁閥的工作情況是否正常。在加濕系統(tǒng)工作的過程中,有一種情況經(jīng)常出現(xiàn),但又不容易判斷,即在空調(diào)系統(tǒng)正常工作的時候,由于某種原因出現(xiàn)了一段時間的停水,后又恢復(fù)供水,在恢復(fù)供水后加濕罐不能夠正常上水,出現(xiàn)這種現(xiàn)象的原因有多種,并且在大多數(shù)空調(diào)器的控制系統(tǒng)中直接對加濕系統(tǒng)復(fù)位通常是不能夠解決問題的;根據(jù)我們多年來的維護來看,引起這種現(xiàn)象的主要原因是停水后的空氣進到進水電磁閥前端,對進水電磁閥的正常開啟造成了一定的影響,解決這種現(xiàn)象有兩種比較有用的辦法,一是卸開進水口,排掉空氣,二是關(guān)掉加濕系統(tǒng)的電源,重新給電磁閥上電也基本上能夠解決這類問題。3)檢查加濕罐排水管道是否暢通,以便在需要排水和對加濕罐進行維修時順利進行。4)檢查蒸汽管道是否暢通,保證加濕系統(tǒng)的水蒸汽能夠正常為計算機設(shè)備5)檢查漏水探測器是否正常,這對加濕系統(tǒng)來說是比較重要的一環(huán),因為排水管道如果不暢通的話就容易形成出現(xiàn)漏水的情況,如漏水探測器不正常的話,就易出現(xiàn)事故。當(dāng)然,對一般的空調(diào)系統(tǒng)而言,漏水探測器是選件,如空調(diào)系統(tǒng)未配有漏水探測器,那么我們更要注意監(jiān)測排水管道是否暢通,同時也要做好機房防水墻的維護工作。3.2.1.6空氣循環(huán)系統(tǒng)的巡回檢查及維護對空氣循環(huán)系統(tǒng)我們主要是考慮空調(diào)系統(tǒng)的過濾器、風(fēng)機、隔風(fēng)柵及到計算機設(shè)備的風(fēng)道等因素。因此我們在日常維護工作中要做好以下的一些工作:1)機房的設(shè)備經(jīng)常有設(shè)備移動的現(xiàn)象,而設(shè)備的移動一般又不是由空調(diào)設(shè)備的維護人員去完成,因此我們在設(shè)備移動后應(yīng)及時檢查機房內(nèi)的氣流狀況,看是否有氣流短路的現(xiàn)象發(fā)生,同時在新設(shè)備的位置是否存在送風(fēng)阻力過大的情況。如有上述現(xiàn)象應(yīng)及時調(diào)整,如果實在調(diào)整不過來,應(yīng)建議設(shè)備移到新的2)檢查空調(diào)過濾器是否干凈,如臟了就應(yīng)及時更換或清洗。3)檢查風(fēng)機的運行狀況:主要是檢查風(fēng)機各部件的緊固情況及平衡,檢查軸承、皮帶、共振等情況;對風(fēng)機的檢查應(yīng)該特別仔細,因為蒸發(fā)器的熱交換過程主要是由在風(fēng)機的作用下使快速流動的氣流經(jīng)過低溫的蒸發(fā)器盤管來完成的,從而使空調(diào)達到制冷的效果,所以風(fēng)機的是否正常運行是空調(diào)系統(tǒng)是否正常運行的最后體現(xiàn);對風(fēng)機而言當(dāng)然最重要的就是電機了,因此我們在日常維護中首先就應(yīng)查看其皮帶的狀況、主從動輪是否在同一面上等;皮帶調(diào)整的松緊程度要合適,太松容易打滑,太緊對皮帶的磨損太快,皮帶的松緊跟外部對靜壓得需求也有比較大的關(guān)系,當(dāng)然這種調(diào)整是在空調(diào)系統(tǒng)控制的范圍之內(nèi)進行的;現(xiàn)在部分比較先進的空調(diào)系統(tǒng)采用了一體化的風(fēng)機,就解決了皮帶調(diào)整的問4)測量電機運轉(zhuǎn)電流,看是否在規(guī)定的范圍內(nèi),根據(jù)測得的參數(shù)也能夠判斷電機是否是正常運轉(zhuǎn)。5)測量溫、濕度值,與面板上顯示得值進行比較,如有較大的誤差,應(yīng)進行溫度、濕度的校正,如誤差過大應(yīng)分析原因。出現(xiàn)這種情況從我們的維和經(jīng)驗來看有兩種原因:一是控制板出現(xiàn)故障,二是溫度、濕度探頭出現(xiàn)故障需要6)檢查隔風(fēng)柵的關(guān)閉情況是針對已經(jīng)停機的空調(diào)而言的,這也是我們在日常維護工作中比較容易遺漏的一個環(huán)節(jié),但也是一個比較重要的環(huán)節(jié),因為一臺空調(diào)停止運行,如果隔風(fēng)柵未關(guān)閉其溫度、濕度探頭檢測到的是其它空調(diào)的出口的溫度和濕度,在空調(diào)下一次開啟時控制系統(tǒng)就會根據(jù)其先前檢測到的參數(shù)而對空調(diào)系統(tǒng)的運行情況做出控制,這時空調(diào)控制系統(tǒng)就會對壓縮機、加濕、除濕系統(tǒng)地運行情況做出錯誤的指令?,F(xiàn)在大多數(shù)空調(diào)設(shè)計時都沒有考慮這種狀況對空調(diào)系統(tǒng)的影響,因為這種影響的時間較短,在較短的時間內(nèi)系統(tǒng)會根據(jù)新的信息達到正常的運行狀況,所以沒有設(shè)計隔風(fēng)柵,這種影響雖然較小,但我們認為在要求很高的機房中我們最好不要讓系統(tǒng)出現(xiàn)一段時間的錯誤運行,因此我們可以為空調(diào)系統(tǒng)人為地增加隔風(fēng)柵。7)檢查計算機及其它需要制冷的設(shè)備進風(fēng)側(cè)的風(fēng)壓是否正常,因為隨著計算機設(shè)備的搬遷和增加,地板下面的線纜的增加有可能就影響空調(diào)系統(tǒng)的風(fēng)壓,從而造成計算機及其它設(shè)備跟前的靜壓不夠,這就需要我們設(shè)備維護和管理人員對空調(diào)系統(tǒng)的風(fēng)道做出相應(yīng)的調(diào)整或增加空調(diào)設(shè)備。3.2.2UPS及電池維護3.2.2.1測試及記錄主機運行參數(shù),3.2.2.2根據(jù)實際情況進行電池核對性容量測試;3.2.2.3用專用儀器對后備用蓄電池組逐個測量,進行充放電維護及調(diào)整充電電流,確保電池正常工作;3.2.2.4檢查風(fēng)機及風(fēng)道情況并清潔,主機外觀清潔、內(nèi)部除塵;3.2.2.5檢查記錄輸出波形、諧波含量、零地電壓等,3.2.2.6清潔系統(tǒng)主設(shè)備及電池等,3.2.2.7查清各參數(shù)是否正確或切合實際,能及時發(fā)現(xiàn)事故隱患3.2.2.8UPS各項功能測試,如檢查逆變器、整流器等啟停、電池管理功能,有條件進行UPS同市電的切換試驗。 3.2.2.9檢查主機、電池及相關(guān)配電引線及端子的接觸情況是否可靠,并測量記錄壓降及溫升,有條件地進行相關(guān)緊固工作等。3.2.2.10觀察可能出現(xiàn)的元件老化或損壞現(xiàn)象、電容是否有膨脹或漏液跡象、磁性元件是否過熱或分層跡象3.2.2.11并機系統(tǒng)進行單機運行測試,熱備份系統(tǒng)負荷切換測試等3.2.3低壓配電柜維護3.3.2.3.1低壓配電柜帶電清洗維護:3.2.3.2檢查電氣盤柜的部分觸點、接線柱等有氧化銹蝕;3.2.3.3電氣設(shè)備外殼用手觸摸感覺溫度異常高;3.2.3.4檢查有些電氣設(shè)備的內(nèi)部有無聲音異常;3.2.3.5清理絕緣子表面沉積了污穢物質(zhì)等;3.2.3.6接線柱加固,標簽更換。3.2.3.7測試輸入輸出頻率;電流電壓等3.3.3消防設(shè)備的維護3.3.3.1檢查火災(zāi)報警控制器的自檢、消音、復(fù)位功能以及主備電源切換3.3.3.2檢查報警探測器、手動報警按鈕、火災(zāi)警報裝置外觀;3.3.3.3氣體滅火控制器工作狀態(tài);3.3.3.4儲瓶間環(huán)境、氣體瓶組或儲罐、選擇閥、驅(qū)動裝置等組件外觀;3.3.3.5應(yīng)急燈和疏散指示標志工作狀態(tài)。3.3.3.6火災(zāi)報警探測器、手動報警按鈕、報警控制器、聯(lián)動控制設(shè)備的試驗報警功能。 3.3.3.7氣體滅火控制設(shè)備的試驗?zāi)M自動啟動3.3.4供水水路、電路及照明線路的維護3.3.4.1鎮(zhèn)流器、燈管更換;燈盤校正,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論