服務(wù)器運(yùn)維應(yīng)急預(yù)案_第1頁
服務(wù)器運(yùn)維應(yīng)急預(yù)案_第2頁
服務(wù)器運(yùn)維應(yīng)急預(yù)案_第3頁
服務(wù)器運(yùn)維應(yīng)急預(yù)案_第4頁
服務(wù)器運(yùn)維應(yīng)急預(yù)案_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

精品文檔服務(wù)器運(yùn)維應(yīng)急預(yù)案篇一:數(shù)據(jù)中心日常運(yùn)維及應(yīng)急處理方案四、數(shù)據(jù)中心日常運(yùn)維及應(yīng)急處理方案數(shù)據(jù)中心要保持穩(wěn)定的運(yùn)行,需要大量的專業(yè)技術(shù)人員。一般承擔(dān)重要業(yè)務(wù)的數(shù)據(jù)中心都是有人24小時值守,無人值守的數(shù)據(jù)中心一般只能承擔(dān)不重要業(yè)務(wù),完全無人管理運(yùn)維的數(shù)據(jù)中心幾乎沒有。所以數(shù)據(jù)中心日常運(yùn)維工作煩瑣,但又很重要。隨著人們的工作生活對數(shù)據(jù)的完全依賴,承載數(shù)據(jù)計算、運(yùn)行的數(shù)據(jù)中心正發(fā)揮著越來越重要的作用,這更突顯出運(yùn)維工作的重要。當(dāng)一個數(shù)據(jù)中心建成投產(chǎn)后,運(yùn)維工作就開始了,一直到數(shù)據(jù)中心的生命周期結(jié)束。一般我們可以將數(shù)據(jù)中心的運(yùn)維工作分為四大類:一是日常檢查類;二是應(yīng)用變更、部署類;三是軟、硬件升級類;四是突發(fā)故障處理類,下面就來詳細(xì)說一說這些運(yùn)維工作,讓大家對運(yùn)維工作有個了解。1、數(shù)據(jù)中心日常運(yùn)維工作、日常檢查“千里之堤,潰于蟻穴”。任何的故障在出現(xiàn)之前都可能會有所表現(xiàn),小的隱患不消除,可能導(dǎo)致重大的故障出現(xiàn),所以數(shù)據(jù)中心日常的例行檢查工作枯燥,但也很重要,可以及時發(fā)現(xiàn)一些運(yùn)行中的隱患。根據(jù)數(shù)據(jù)中心承載業(yè)務(wù)重要性的不同,要對數(shù)據(jù)中心里的所有運(yùn)行的設(shè)備進(jìn)行例行檢查。一些數(shù)據(jù)中心設(shè)備廠商提供了檢查軟件,比如管軟件,安全防護(hù)軟件等??梢岳眠@些軟件對數(shù)據(jù)中心絡(luò)[注]進(jìn)行檢查,看日志是否有異常告警,絡(luò)是否出現(xiàn)過短時中斷,端口是否出現(xiàn)UP/DOWN等。通過絡(luò)探測軟件看絡(luò)質(zhì)量如何。檢查服務(wù)器應(yīng)用服務(wù)是否正常,CPU內(nèi)存等利用率是否正常。對應(yīng)用業(yè)務(wù)進(jìn)行檢查,比如如果有搜索業(yè)務(wù),就可以通過服務(wù)器進(jìn)行單詞搜索,看搜索的結(jié)果和延遲是否在正常的范圍之內(nèi)。這些檢查每日都要重復(fù)檢查,一旦有異常及時處理與消除,必要時將重要業(yè)務(wù)切換到備用環(huán)境中,然后排除后再切回。對數(shù)據(jù)中心的機(jī)房環(huán)境也要進(jìn)行檢查,環(huán)境的溫度、濕度、灰塵是否合乎要求??照{(diào)、供電系統(tǒng)進(jìn)行運(yùn)行良好,設(shè)備運(yùn)行是否過熱,地板、天窗、消防、監(jiān)控都是檢查的部分。不合理的地方要及時進(jìn)行整改,而不應(yīng)該偷懶。經(jīng)常到一些數(shù)據(jù)中心,就會發(fā)現(xiàn)值班運(yùn)維人員很多都抱著電腦在瀏覽頁,打游戲。對于日常檢查應(yīng)付一下,甚至根本不去檢查,只要沒有出現(xiàn)故障,就打游戲消耗時間,這樣數(shù)據(jù)中心出現(xiàn)故障是遲早的事。一旦出現(xiàn)故障就毛手毛腳,甚至哪個業(yè)務(wù)走的哪個設(shè)備,哪個端口哪個線都不清楚,本來一個小故障可能因為不熟悉導(dǎo)致大故障,因此日常檢查絕不能應(yīng)付,雖然需要不斷重復(fù),但卻很重要,在持續(xù)的檢查過程中,將會對數(shù)據(jù)中心的理解越來越深,這樣每次檢查都會有新的發(fā)現(xiàn),在檢查中進(jìn)行學(xué)習(xí)。2、 數(shù)據(jù)中心日常運(yùn)維工作、應(yīng)用變更數(shù)據(jù)中心承載的業(yè)務(wù)不會是一成不變的,隨著業(yè)務(wù)的多樣化,經(jīng)常要對業(yè)務(wù)進(jìn)行調(diào)整,包括服務(wù)器和絡(luò)的設(shè)置。因此要對服務(wù)器和絡(luò)設(shè)備操作很熟悉,主要需要掌握服務(wù)器命令和絡(luò)協(xié)議。要根據(jù)應(yīng)用的需要,做出變更。這時就對運(yùn)維人員提出了更高的要求,不僅是對數(shù)據(jù)中心原有業(yè)務(wù)要非常熟悉,還要對新上的應(yīng)用業(yè)務(wù)有正確的理解,這樣才能在不影響原有業(yè)務(wù)的基礎(chǔ)上做調(diào)整。這樣的應(yīng)用變更每個月可能都要做幾次,是數(shù)據(jù)中心、運(yùn)維人員的必修課,突顯了一個技術(shù)人員的基本技能水平。這時要對設(shè)備操作命令比較熟悉,懂得如何實現(xiàn)業(yè)務(wù),要經(jīng)常和設(shè)備廠商的技術(shù)人員打交道,通過交流盡快掌握設(shè)備操作方法。同時,由于設(shè)備廠商對應(yīng)用業(yè)務(wù)缺乏了解,這就需要運(yùn)維人員在應(yīng)用業(yè)務(wù)和設(shè)備具體實現(xiàn)之間做好協(xié)調(diào),處理。以最快的時間和最小的代價完成應(yīng)用業(yè)務(wù)部署。3、 數(shù)據(jù)中心日常運(yùn)維工作、軟硬件升級數(shù)據(jù)中心的設(shè)備一般運(yùn)行周期是五年,不斷地有設(shè)備需要逐漸淘汰進(jìn)行更換,也有一些設(shè)備因為存在軟件缺陷需要升級,因此軟硬件升級也是運(yùn)維工作的一部分,尤其是軟硬件出現(xiàn)故障時,就必須要進(jìn)行更換。有時為了不影響業(yè)務(wù),往往還需要設(shè)備廠商提供軟件補(bǔ)丁來解決問題。數(shù)據(jù)中心的設(shè)備成百上千,出現(xiàn)軟硬件故障很正常,所以要不斷地進(jìn)行軟硬件升級,這類工作往往都要在業(yè)務(wù)量最少的凌晨之后進(jìn)行,運(yùn)維人員通宵熬夜是常有的事,運(yùn)維人員要有一個良好的身體素質(zhì),否則會吃不消。軟硬件升級時需要做好回退機(jī)制,以防升級出現(xiàn)問題時無法回退,業(yè)務(wù)長時間無法恢復(fù)。當(dāng)接手?jǐn)?shù)據(jù)中心、運(yùn)維工作就會發(fā)現(xiàn),怎么會有那么多的升級,幾乎每個月都要有升級操作,熬夜升級工作成了運(yùn)維人員的家常便飯。4、數(shù)據(jù)中心日常運(yùn)維工作、突發(fā)故障沒有任何一個數(shù)據(jù)中心是不出故障的,在數(shù)據(jù)中心運(yùn)行的過程中都會出現(xiàn)這樣那樣的問題。這時就顯示出運(yùn)維人員的高技能水平,根據(jù)統(tǒng)計百分之八十的故障都是人為故障,所以運(yùn)維人員的水平高低往往決定了一個數(shù)據(jù)中心、運(yùn)行的穩(wěn)定程度。另外對于突發(fā)故障,高水平的運(yùn)維人員可以靜下心來冷靜分析故障的觸發(fā)原因,迅速找到解決的方法,如果在短時間內(nèi)找不到解決方法,也可以通過切換到備用設(shè)備上先恢復(fù)業(yè)務(wù),再進(jìn)行分析。這時擁有高水平的運(yùn)維人員對于一個數(shù)據(jù)中心至關(guān)重要,在關(guān)鍵時刻就能派上用場。雖然這些工作看起來有些平常,但千萬別小看它們。數(shù)據(jù)中心運(yùn)維工作實際上非常重要,關(guān)乎著整個數(shù)據(jù)中心業(yè)務(wù)的正常運(yùn)行。目前市場上這類專業(yè)人才非常搶手,尤其對于具有較深故障排查水平的人才比較缺乏。只有重視數(shù)據(jù)中心的運(yùn)維工作,才能給數(shù)據(jù)中心一個平安。篇二:運(yùn)維應(yīng)急方案運(yùn)維應(yīng)急方案目錄1234-^-4-刖言 3 目標(biāo) 3組織結(jié)構(gòu) 3 應(yīng)急預(yù) 3 4.14.2應(yīng)急預(yù)警級別 3應(yīng)急預(yù)警處理流程 TOC\o"1-5"\h\z 4 4.2.1級 預(yù) 警 處理 4 4.2.2級 預(yù) 警 處理 5 4.2.3級 預(yù) 警 處理 55附件 65.1.1故 障報告單 61前言運(yùn)維部負(fù)責(zé)公司業(yè)務(wù)系統(tǒng)運(yùn)行維護(hù)工作。為了保障公司因業(yè)務(wù)系統(tǒng)的安全、平穩(wěn)運(yùn)行,運(yùn)維部特此指定運(yùn)維應(yīng)急方案,通過此方案來保證系統(tǒng)的安全。2目標(biāo)?保障公司游戲服務(wù)器的正常運(yùn)行、絡(luò)的暢通。?嚴(yán)格崗位制度、明確工作職責(zé),規(guī)范工作流程。?工作規(guī)范化,制度化,加強(qiáng)文檔管理力度。3組織結(jié)構(gòu)根據(jù)運(yùn)維工作的范圍和性質(zhì),下設(shè)三個小組:系統(tǒng)維護(hù)組應(yīng)用維護(hù)組技術(shù)值班組4應(yīng)急預(yù)警4.1應(yīng)急預(yù)警級別4.2應(yīng)急預(yù)警處理流程運(yùn)維過程中出現(xiàn)重要故障或緊急情況時,按以下規(guī)定流程進(jìn)行處理及匯報。在遇到故障時,及時匯報上級領(lǐng)導(dǎo)并采取措施及時解決,具體匯報流程如下:4.2.1一級預(yù)警處理運(yùn)維過程中,如果遇到一級預(yù)警,按以下流程進(jìn)行處理:當(dāng)通過監(jiān)控或得知系統(tǒng)出現(xiàn)故障時,首先在最短的時間查看故障點狀態(tài),并分析故障原因。運(yùn)維工程師在排查出故障后,立即著手解決。3.在故障排除后,對所發(fā)生故障的設(shè)備進(jìn)行事后跟蹤。在故障排除后,運(yùn)維工程師應(yīng)對故障原因及解決辦法進(jìn)行詳細(xì)說明。4.2.2二級預(yù)警處理運(yùn)維過程中,如果遇到二級預(yù)警,按以下流程進(jìn)行處理:當(dāng)通過監(jiān)控或得知系統(tǒng)出現(xiàn)故障時,首先在最短的時間內(nèi)查看故障點狀態(tài),并分析故障原因。立即報告給組長,運(yùn)維小組長應(yīng)通過電話或當(dāng)面把故障報告相關(guān)部門領(lǐng)導(dǎo),在故障完全排查清楚后以書面形式遞交“故障報告單”。運(yùn)維工程師在排查出故障后,如能夠立即解決,則立刻解決故障,如需要設(shè)備廠商的技術(shù)人員到現(xiàn)場,應(yīng)立即撥打技術(shù)廠商的技術(shù)工程師聯(lián)系電話,請求立即到現(xiàn)場進(jìn)行故障排除。在故障排除后,運(yùn)維工程師應(yīng)對故障原因及解決辦法進(jìn)行詳細(xì)說明。4.2.3三級預(yù)警處理運(yùn)維過程中,如果遇到三級預(yù)警,按以下流程進(jìn)行處(本文來自:WwW.cSpengBo.cOm蓬勃范文:服務(wù)器運(yùn)維應(yīng)急預(yù)案)理:當(dāng)通過監(jiān)控或得知系統(tǒng)出現(xiàn)故障時,首先在最短的時間查看故障點狀態(tài),并分析故障原因。立即報告給運(yùn)維中心、主管人員,主管人員應(yīng)通過電話或當(dāng)面把故障報告給相關(guān)領(lǐng)導(dǎo)部門,在故障完全排查清楚后以書面形式遞交“故障報告單”。3.運(yùn)維工程師在排查出故障后,如能夠立即解決,則立刻解決故障,如需要設(shè)備廠商的技術(shù)人員到現(xiàn)場,應(yīng)立即撥打技術(shù)廠商的技術(shù)工程師聯(lián)系電話,請求立即到現(xiàn)場進(jìn)行故障排除。如果因硬件設(shè)備出現(xiàn)故障而無法修復(fù),需要更換時,應(yīng)報運(yùn)維中心主管人員,主管人員辦理硬件更換事宜。在故障排除后,運(yùn)維工程師應(yīng)對故障原因及解決辦法進(jìn)行詳細(xì)說明。篇三:絡(luò)運(yùn)維與機(jī)房應(yīng)急預(yù)案絡(luò)運(yùn)維小組應(yīng)急預(yù)案隨著絡(luò)信息化建設(shè)的不斷深入,加強(qiáng)機(jī)房各類設(shè)備、系統(tǒng)以及信息與絡(luò)安全等方面應(yīng)對突發(fā)事件的處理能力將是我們目前面臨的一項重要任務(wù)。為確保系統(tǒng)及機(jī)房安全與穩(wěn)定,以保證正常運(yùn)行為宗旨,按照“預(yù)防為主,積極處置”的原則,本著建立一個有效處置突發(fā)事件,建立統(tǒng)一指揮、職責(zé)明確運(yùn)轉(zhuǎn)有序、反應(yīng)迅速處置有力的機(jī)房安全體系的目標(biāo),將正在發(fā)生或已發(fā)生事故的損害程度減輕到最低,確保員工安全,特制定本應(yīng)急處置預(yù)案。本預(yù)案共分為應(yīng)用系統(tǒng)故障應(yīng)急流程和機(jī)房突發(fā)事件應(yīng)急流程系統(tǒng)故障應(yīng)急流程一、系統(tǒng)故障應(yīng)急流程說明1、 故障發(fā)生系統(tǒng)運(yùn)維服務(wù)小組可從以下途徑得知故障的發(fā)生:1.1、 運(yùn)維服務(wù)中心通過管告警發(fā)現(xiàn)故障1.2、 維護(hù)站點通過維護(hù)巡檢發(fā)現(xiàn)故障1.3、 用戶發(fā)現(xiàn)故障,報給呼叫中心1.4、 駐場工程師發(fā)現(xiàn)故障2、 報障受理監(jiān)控系統(tǒng)運(yùn)維服務(wù)小組得知系統(tǒng)故障發(fā)生后,立即響應(yīng),并向報障人或單位詳細(xì)了解系統(tǒng)故障情況。3、 信息研判運(yùn)維服務(wù)小組根據(jù)了解到的系統(tǒng)故障情況進(jìn)行分析判斷,以確定采用一般故障處理流程還是立即啟動系統(tǒng)突發(fā)故障應(yīng)急處理預(yù)案。4、 預(yù)案啟動如需啟動應(yīng)急預(yù)案,則立刻通知系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組,由領(lǐng)導(dǎo)小組啟動應(yīng)急預(yù)案,對系統(tǒng)突發(fā)故障應(yīng)急事件進(jìn)行全面管控處理。5、 確認(rèn)系統(tǒng)突發(fā)故障應(yīng)急預(yù)案啟動后,首先是根據(jù)現(xiàn)場突發(fā)故障實際狀況、緊急程度、技術(shù)難度、備品備件等情況對相關(guān)(主要是參與人員)依據(jù)經(jīng)驗進(jìn)行調(diào)度和確認(rèn),主要有以下:我公司技術(shù)支持人員;相關(guān)廠家技術(shù)支持人員;我公司聘請的技術(shù)專家6、 預(yù)案執(zhí)行按照既定的預(yù)案進(jìn)行突發(fā)故障搶修,如遇到問題及時向系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組匯報。7、 預(yù)案終止預(yù)案的終止時間由故障現(xiàn)場技術(shù)人員根據(jù)現(xiàn)場的實際進(jìn)展情況,在與用戶單位有關(guān)部門協(xié)調(diào)后報系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組決定。8、 結(jié)果上報預(yù)案中止后,相關(guān)預(yù)案參與人員將整個事件過程中的經(jīng)驗和教訓(xùn),修改、完善事件應(yīng)急預(yù)案。然后集中上報至系統(tǒng)突發(fā)故障應(yīng)急領(lǐng)導(dǎo)小組。二、系統(tǒng)故障應(yīng)急處理流程圖機(jī)房突發(fā)事件應(yīng)急流程一、 機(jī)房突發(fā)事件分類1、 自然災(zāi)害:指地震、火災(zāi)等因自然因素引起的絡(luò)與信息系統(tǒng)的損壞。2、 事故災(zāi)難:指電力中斷、絡(luò)損壞、軟件、硬件設(shè)備故障等引起的絡(luò)與信息系統(tǒng)的損壞。3、 人為破壞:指人為破壞絡(luò)線路、通信設(shè)施,黑客攻擊、病毒攻擊、恐怖襲擊等引起的絡(luò)與信息系統(tǒng)的損壞。二、 應(yīng)急處理人員組織機(jī)構(gòu)三、 應(yīng)急機(jī)構(gòu)人員崗位職責(zé)1、 應(yīng)急總指揮職責(zé)1.1、 保證在任何時間,及時協(xié)調(diào)應(yīng)急行動所有涉及的崗位人員;1.2、 提供必須的緊急響應(yīng)設(shè)備;1.3、 在緊急情況下全面負(fù)責(zé)緊急行動;1.4、 在必要時向外界求救,例如:119、110、120等。2、 應(yīng)急副總指揮職責(zé)2.1、 在總指揮領(lǐng)導(dǎo)下具體開展工作,當(dāng)總指揮不在時履行總指揮職責(zé);2.2、 根據(jù)獲得的應(yīng)急信息下達(dá)命令。3、 各相關(guān)設(shè)備負(fù)責(zé)人職責(zé)1、負(fù)責(zé)盡快收集信息向應(yīng)急總指揮匯報事故情況;3.2、 負(fù)責(zé)現(xiàn)場臨時設(shè)備搶救和對事態(tài)的控制;3.3、 聽從上級指揮人員的指揮。四、突發(fā)事件處理原則預(yù)防為主。立足安全防護(hù),加強(qiáng)預(yù)警,重點保護(hù)基礎(chǔ)信息絡(luò)和關(guān)系信息安全、穩(wěn)定的重要信息系統(tǒng),從預(yù)防、監(jiān)控、應(yīng)急處理、應(yīng)急保障等環(huán)節(jié),在管理、技術(shù)、人員等方面采取多種措施充分發(fā)揮各方面的作用,共同構(gòu)筑安全保障體系。快速反應(yīng)。突發(fā)事件發(fā)生時,按照快速反應(yīng)機(jī)制,及時獲取充分而準(zhǔn)確的信息,跟蹤研判,果斷決策,迅速處置,最大程度地減少危害和影響。分級負(fù)責(zé)。按照“誰主管,誰負(fù)責(zé)”的原則,建立和完善安全責(zé)任制及聯(lián)動工作機(jī)制。根據(jù)各負(fù)責(zé)人的職能,各司其職,加強(qiáng)各負(fù)責(zé)人的協(xié)調(diào)與配合,共同履行應(yīng)急處置工作的管理職責(zé)。以人為本。把保障人員以及公共利益的安全作為首要任務(wù)。常備不懈。加強(qiáng)技術(shù)儲備,規(guī)范應(yīng)急處置措施與操作流程,定期進(jìn)行預(yù)案演

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論