故障處理流程規(guī)定_第1頁
故障處理流程規(guī)定_第2頁
故障處理流程規(guī)定_第3頁
故障處理流程規(guī)定_第4頁
故障處理流程規(guī)定_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)Revision Change HistoryRev Creation Date (YYYY/MM/DD)Originator Originators functionDescription of Change (ECO#, Brief description)Note 1: Can keep the latest three revision change records;Note 2: Use red triangle marked in the changing

2、area. Printed copies are NOT controlled unless marked CONTROLLEDThe information in this document is the property of Boston Power. No part of this document may be disclosed, reproduced, or distributed without the express written permission of Boston Power. Boston Power reserves the right to alter the

3、 design and specifications of its products at any time without notice, as part of its continuing program of product development.“Boston-Power”, “Sonata” and “Swing” are registered trademarks of Boston-Power, Inc., which retains sole rights to their use. Boston-Power, Inc., 2009. All rights reserved.

4、 目錄 TOC o 1-3 h z u 目的:加強和規(guī)范IT事故/故障的處理和報告流程,保證事故/故障的快速恢復(fù),使損失降低到最低。 范圍:IT部提供但不限于以下設(shè)備、系統(tǒng)和區(qū)域的事故/故障2.1硬件類:IT辦公設(shè)備(包括復(fù)印機、打印機、傳真、掃描儀、投影儀、一體機、主機、顯示器等)語音通信設(shè)備(但不包含移動智能手機、平板電腦)2.2網(wǎng)絡(luò)類:企業(yè)互聯(lián)網(wǎng)(泛指公司與ISP連接的Internet線路)MPLS、VPN專線網(wǎng)絡(luò)/線纜接口2.3應(yīng)用和業(yè)務(wù)系統(tǒng)類應(yīng)用服務(wù)器(包括硬件和操作系統(tǒng))、業(yè)務(wù)型ERP、生產(chǎn)型MESIT監(jiān)控與門禁系統(tǒng)數(shù)據(jù)庫系統(tǒng)互普準(zhǔn)入系統(tǒng)視頻會議系統(tǒng)考勤就餐系統(tǒng)防計算機病毒系統(tǒng)定義

5、:3.1一般事故/故障:影響范圍限于單個或者少量用戶(不超過10人)的IT故障,不會對其它用戶的IT系統(tǒng)使用造成大的影響和業(yè)務(wù)的中斷。3.2中等事故/故障: 關(guān)鍵系統(tǒng)小面積中斷,不會造成重大業(yè)務(wù)影響,不會造成關(guān)鍵系統(tǒng)數(shù)據(jù)大量丟失或者錯誤。3.3重大事故/故障:關(guān)鍵系統(tǒng)全局性或者大面積中斷,或者造成關(guān)鍵系統(tǒng)數(shù)據(jù)大量丟失或者錯誤的,并且無法在短時間(30分鐘)內(nèi)恢復(fù)。3.4關(guān)鍵系統(tǒng)主要指中斷后會造成業(yè)務(wù)和管理無法進行的系統(tǒng):如AD、DHCP、DNS、核心交換、路由、VPN系統(tǒng)、ERP系統(tǒng)、MES系統(tǒng)、存儲系統(tǒng)、虛擬服務(wù)應(yīng)用。職責(zé)與權(quán)限:IT部所有員工均負有處理緊急事件的責(zé)任;面對緊急事件,一切以公

6、司利益和人身安全為重;IT經(jīng)理包括IT各組(Infra系統(tǒng)、ERP業(yè)務(wù)支持、CIM)經(jīng)理;IT經(jīng)理作為IT流程中的控制結(jié)點,主要負責(zé)對其所轄關(guān)鍵IT系統(tǒng)的重大事情進行審批、管理和監(jiān)控;IT部門主要負責(zé)IT事故/故障發(fā)生后的事故處理和故障的排除,故障排除過程的記錄,故障排除后事故發(fā)生原因的調(diào)查,后續(xù)改進或者預(yù)防措施的落實;用戶按要求途徑報告事故/故障(IT故障申請單)。系統(tǒng)管理員的職責(zé)和權(quán)限系統(tǒng)管理人員包括網(wǎng)絡(luò)管理員、服務(wù)器管理員、數(shù)據(jù)庫管理員和客戶端管理員。網(wǎng)絡(luò)管理員提供網(wǎng)絡(luò)運行保障,確保網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定與正常運轉(zhuǎn),及時解決網(wǎng)絡(luò)故障;負責(zé)網(wǎng)絡(luò)系統(tǒng)的管理和維護,確保高效、可靠地管理網(wǎng)絡(luò)資源;負責(zé)對

7、網(wǎng)絡(luò)設(shè)備操作系統(tǒng)和配置信息進行備份及恢復(fù);負責(zé)或協(xié)助服務(wù)提供商進行網(wǎng)絡(luò)設(shè)備的調(diào)試和安裝;負責(zé)或參與網(wǎng)絡(luò)工程的設(shè)計和網(wǎng)絡(luò)設(shè)備的選型。系統(tǒng)管理員負責(zé)安裝和配置服務(wù)器操作系統(tǒng)及其它相關(guān)軟件;負責(zé)監(jiān)控并優(yōu)化服務(wù)器系統(tǒng)資源的使用;負責(zé)計劃和實施服務(wù)器系統(tǒng)備份及恢復(fù)方案;負責(zé)服務(wù)器操作系統(tǒng)及程序的升級;負責(zé)服務(wù)器系統(tǒng)用戶和安全管理;負責(zé)為服務(wù)器操作系統(tǒng)打補?。回撠?zé)或協(xié)助供應(yīng)商進行服務(wù)器硬件管理和故障診斷。數(shù)據(jù)庫管理員負責(zé)確定數(shù)據(jù)庫的信息內(nèi)容和結(jié)構(gòu),并可操作數(shù)據(jù)庫;負責(zé)制定數(shù)據(jù)庫的存儲結(jié)構(gòu)和存取策略;負責(zé)定義數(shù)據(jù)的安全性要求和完整性約束條件;負責(zé)監(jiān)控數(shù)據(jù)庫的使用和運行,分析數(shù)據(jù)庫的性能并進行問題診斷;負責(zé)數(shù)

8、據(jù)庫的改進和重組重構(gòu); 負責(zé)數(shù)據(jù)庫的安全與日常維護,制定并實施數(shù)據(jù)庫系統(tǒng)的備份和恢復(fù)方案??蛻舳斯芾韱T負責(zé)客戶端用戶(網(wǎng)絡(luò)終端結(jié)點的用戶)設(shè)備的維護;負責(zé)客戶端用戶的安全管理、軟件維護和設(shè)備的配置及環(huán)境管理等。內(nèi)容異常情況和緊急事件一般處理流程和響應(yīng)機制員工發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備相關(guān)的異常情況和緊急事件,直接聯(lián)系IT相關(guān)經(jīng)理。同時,對網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備均有監(jiān)控系統(tǒng)對其工作狀態(tài)進行監(jiān)控,一旦發(fā)生服務(wù)不可用事件,監(jiān)控系統(tǒng)會及時監(jiān)測并就異常情況報警;對于員工電腦或信息系統(tǒng)使用問題,通過提交IT故障申請單或通過撥打IT熱線 3155、3565、3576電話向IT Helpdesk進行報修故障,IT

9、 Helpdesk人員會根據(jù)故障現(xiàn)象直接處理問題,或指派專人進行處理;對異常情況和緊急事件應(yīng)進行分類和記錄,應(yīng)在事后對事件進行分析和匯報。常見異常情況的安全控制措施電力故障應(yīng)急方案在非正常工作時間,任何人發(fā)現(xiàn)電力系統(tǒng)出現(xiàn)異常,有義務(wù)及時通知廠務(wù)部和安保。廠務(wù)部和安保部負責(zé)馬上聯(lián)系IT部員工說明情況;電力系統(tǒng)出現(xiàn)故障,廠務(wù)部安排人員負責(zé)檢查處理電路故障,同時向IT部提供估計停電持續(xù)時間和恢復(fù)時間;IT部為機房配備UPS(不間斷電源)并定期對UPS進行充放電測試;發(fā)生電力系統(tǒng)異常后,在UPS第一次報警后(估計還能維持半個小時),電話通知正在使用業(yè)務(wù)系統(tǒng)的key user 后,開始關(guān)閉服務(wù)器和網(wǎng)絡(luò)設(shè)

10、備,以防止UPS耗光損壞計算機設(shè)備;IT部跟蹤停電詳細情況及處理情況,并做好記錄,上報給公司安全管理責(zé)任負責(zé)人?;馂?zāi)應(yīng)急方案在機房門口(里外各一個)部署專用氣體滅火器(二氧化碳滅火器);當(dāng)出現(xiàn)火情、火災(zāi)時,任何人員都應(yīng)保持鎮(zhèn)靜,應(yīng)及時采用一些簡單可行的方法作初步處理,如:使用滅火器、水源、或采用一些滅火措施、手段。如果火情危機機房或在機房發(fā)生,必須使用機房專用氣體滅火器(二氧化碳滅火器);在對火情、火災(zāi)進行初步處理的同時,應(yīng)在最短時間內(nèi)通知設(shè)施部EHS和保安部;若火情較嚴(yán)重時應(yīng)迅速打電話報警,同時注意個人人身安全。在判斷到火情失控情況下,應(yīng)馬上撤離火災(zāi)現(xiàn)場到安全的區(qū)域;IT部了解火災(zāi)情況并做好

11、詳細記錄,上報給公司安全責(zé)任負責(zé)人;機房均為電器設(shè)備,應(yīng)定期檢查這些設(shè)備,減少由于電器故障引發(fā)火災(zāi)。網(wǎng)絡(luò)系統(tǒng)癱瘓應(yīng)急處理方案發(fā)現(xiàn)網(wǎng)絡(luò)故障,立即通知網(wǎng)絡(luò)管理員;網(wǎng)絡(luò)管理員檢查網(wǎng)絡(luò)情況,初步確定故障原因;如網(wǎng)絡(luò)設(shè)備發(fā)生嚴(yán)重故障,導(dǎo)致網(wǎng)絡(luò)無法正常運轉(zhuǎn),應(yīng)立即通知相關(guān)人員或設(shè)備供應(yīng)商,同時啟用網(wǎng)絡(luò)備用設(shè)備;如果是線路故障,應(yīng)立即啟用備用線路;如果是網(wǎng)絡(luò)協(xié)議或設(shè)備配置故障,應(yīng)聯(lián)系供應(yīng)商及外部技術(shù)支持進行診斷,及時確定故障原因并排除故障。病毒應(yīng)急方案在計算機發(fā)生病毒感染情況時應(yīng)立即拔掉網(wǎng)線,并立即通知網(wǎng)絡(luò)管理員和安全管理員,對受感染計算機上的病毒進行分析和處理;如果服務(wù)器被病毒感染,立即停止服務(wù)器的程序和

12、服務(wù),防止病毒進一步擴散。如發(fā)現(xiàn)對網(wǎng)絡(luò)性能或其他應(yīng)用運行造成影響,應(yīng)及時拔掉網(wǎng)線后進行處理;使用最新的病毒引擎和病毒庫,查殺受感染服務(wù)器上的病毒,同時查殺受感染服務(wù)器管理的計算機上的病毒;從防病毒中心控制臺檢查確保所有公司電腦已經(jīng)更新到最新的病毒引擎和病毒庫,防止再次感染相同病毒;如果病毒將系統(tǒng)破壞,導(dǎo)致系統(tǒng)無法恢復(fù),應(yīng)將受感染計算機上的數(shù)據(jù)備份到其它存儲介質(zhì),確保數(shù)據(jù)不會丟失。對備份的數(shù)據(jù)也要進行病毒檢測,防止病毒再次感染其它計算機;應(yīng)記錄整個事件的分析和處理過程,并形成報告向信息安全負責(zé)人匯報。資料備份應(yīng)急方案發(fā)現(xiàn)數(shù)據(jù)丟失,首先記錄故障時間和相關(guān)信息,報至IT相關(guān)業(yè)務(wù)部門經(jīng)理;IT部分析故

13、障原因,并采取相關(guān)措施;如果是硬件錯誤,馬上啟用備用硬件或聯(lián)系硬件廠商提供服務(wù)。如果是硬盤數(shù)據(jù)丟失,首先盡力采取措施修復(fù)并恢復(fù)數(shù)據(jù),確實無法挽救數(shù)據(jù)后,作廢棄處理。根據(jù)記錄,找出距發(fā)生故障時點最近的備份,恢復(fù)最近時間的備份數(shù)據(jù),盡可能降低風(fēng)險。IT部做好處理災(zāi)難恢復(fù)記錄。IT部只負責(zé)保存在文件服務(wù)器的用戶數(shù)據(jù),不承擔(dān)個人計算機和個人備份介質(zhì)上的數(shù)據(jù)安全責(zé)任。故障上報方式和故障升級涉及適用范圍內(nèi)的所有事故或故障采取先上報后處理的原則,各級人員應(yīng)嚴(yán)格如下規(guī)定在規(guī)定時間內(nèi)向相應(yīng)管理層上報處理情況。(日常應(yīng)用業(yè)務(wù)系統(tǒng)維護除外,該故障升級主要范圍指影響全局用戶使用業(yè)務(wù)系統(tǒng)時發(fā)生的故障)可參考以下表格方式

14、(可根據(jù)故障事件的實際發(fā)生情況判定)事故/故障類別上報時限上報方式上報對象上報/通報對象事件升級時限一般事故任意方式IT部員工IT相關(guān)經(jīng)理根據(jù)具體事件處中等事故30分鐘任意方式IT相關(guān)經(jīng)理IT相關(guān)經(jīng)理/總監(jiān)8小時重大事故15分鐘任意方式IT相關(guān)經(jīng)理/IT相關(guān)經(jīng)理/總監(jiān)注:表中“上報時限”列中規(guī)定的時間均為從發(fā)現(xiàn)事故時刻起計算,“事件升級時限”按照上報時間起計算。對有應(yīng)急處理預(yù)案的事故或故障,相關(guān)IT人員應(yīng)嚴(yán)格按照應(yīng)急預(yù)案處理。事件上報后,超過事件升級時限,此次事件將自動升級,并進入相應(yīng)的事件通報和處理流程。緊急支持聯(lián)系方式IT服務(wù)熱線:3155、3576、3565直接電話聯(lián)系相關(guān)IT經(jīng)理或者任

15、何一位IT部員工。可參考以下流程導(dǎo)向,進行中等及以上的故障事件處理流程應(yīng)急措施與行動計劃 關(guān)鍵IT系統(tǒng)管理責(zé)任人沒有在第一時間內(nèi)到達現(xiàn)場的情況下的處理流程:聯(lián)系系統(tǒng)管理員,得到針對此次緊急事件處理的建議;根據(jù)緊急事件的具體情況,選擇相應(yīng)的操作步驟。主要包括如下3種情況的處理方法:因具體情況,需要立即停止應(yīng)用服務(wù)或環(huán)境,必須立即關(guān)閉系統(tǒng)服務(wù)或電源的情況;緊急關(guān)閉電源后,需要重新開機的情況;因電源、網(wǎng)絡(luò)故障或其他未知的故障,造成ERP、MES的操作系統(tǒng)無法運行,需要盡快恢復(fù)關(guān)鍵的IT系統(tǒng)運行;在執(zhí)行過程中,盡量記錄屏幕上所顯示的信息提示(特別是錯誤或警告的信息);處理之后,將此緊急事件處理過程、錯

16、誤信息記錄發(fā)送給系統(tǒng)管理員;系統(tǒng)管理員按照事件級別分別分類(紅、黃、藍)通報相關(guān)人員:緊急級別:紅第一時間內(nèi)通知應(yīng)用業(yè)務(wù)的相關(guān)IT經(jīng)理,另外根據(jù)整個故障的影響程度,通知相關(guān)范圍的人員,比如關(guān)鍵IT系統(tǒng)的用戶(例如財務(wù)、生產(chǎn)和HR部門),或者全公司;緊急級別:黃及時與業(yè)務(wù)應(yīng)用的相關(guān)IT經(jīng)理聯(lián)系,并對處理過程做詳細記錄。將整個故障的情況記錄總結(jié),并郵件發(fā)送其IT經(jīng)理;緊急級別:藍對發(fā)生的問題,做詳細記錄。 之后將整個故障的處理過程,整理后存檔;如果處理應(yīng)急情況中,需要重新啟動ERP、MES的服務(wù)或者其它原因,導(dǎo)致關(guān)鍵IT系統(tǒng)或者數(shù)據(jù)庫不可用的情況,需要發(fā)郵件告知相關(guān)系統(tǒng)的使用人員;系統(tǒng)管理員的處理

17、流程:如果系統(tǒng)管理員在場、或者能夠及時到達現(xiàn)場,由其負責(zé)處理此緊急情況,并同時記錄整個執(zhí)行過程系的警告和錯誤;按照事件級別分類的 關(guān)鍵IT系統(tǒng)緊急事件,郵件通知相關(guān)人員;需要啟動的其它緊急管理計劃如果在公司業(yè)務(wù)應(yīng)用需要很快恢復(fù)系統(tǒng)的時期發(fā)生硬件故障,請緊急聯(lián)系DELL或HP的售后服務(wù)工程師,在最短的時間內(nèi)更換硬件;如果是軟件故障,可以通過恢復(fù)操作系統(tǒng)和數(shù)據(jù)庫的辦法盡快使系統(tǒng)可用,參考數(shù)據(jù)備份流程。緊急計劃的終止查明此次故障發(fā)生的原因,解決并采取相關(guān)預(yù)防措施后才能算本次處理完全完成;故障處理完畢后,需要填寫信息系統(tǒng)故障表。中等故障以上事件處理完成通報和事后總結(jié)IT工程師在處理完成后應(yīng)立即向相關(guān)業(yè)務(wù)IT經(jīng)理、總監(jiān)通報情況,內(nèi)容包括事故/故障發(fā)生時間和內(nèi)容、各級上報時間、上報人、上報/通報對象、事故處理方式等;IT相關(guān)經(jīng)理和總監(jiān)在上報工作完成后應(yīng)及時組織事故分析會(內(nèi)容包括:追查事故原因、檢討和總結(jié)處理過程、研究

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論