IT基礎(chǔ)設(shè)施運維管理規(guī)范_第1頁
IT基礎(chǔ)設(shè)施運維管理規(guī)范_第2頁
IT基礎(chǔ)設(shè)施運維管理規(guī)范_第3頁
IT基礎(chǔ)設(shè)施運維管理規(guī)范_第4頁
IT基礎(chǔ)設(shè)施運維管理規(guī)范_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、IT基礎(chǔ)設(shè)施運維管理規(guī)范文件編號:版本號:一i、總則能夠支為了規(guī)范本部門的運維管理工作,使得相關(guān)工作具有持續(xù)改善性及相互協(xié)作性,撐公司系統(tǒng)的健康可靠的運行,由此制定本規(guī)范。本規(guī)范適用于信息管理中心技術(shù)保障部所有崗位人員。二、部門職能(1) 負責(zé)信息化基礎(chǔ)設(shè)施的技術(shù)保障,包括網(wǎng)絡(luò)、電話、機房、服務(wù)器系統(tǒng)、數(shù)據(jù)安全等技術(shù)支持;(2) 負責(zé)所有服務(wù)器系統(tǒng)的技術(shù)運維工作(3) 負責(zé)核心數(shù)據(jù)庫的性能調(diào)優(yōu)及技術(shù)運維工作(4) 負責(zé)各種網(wǎng)絡(luò)設(shè)施、線路的技術(shù)運維保障工作(5) 負責(zé)其他設(shè)施的運維保障工作,如機房設(shè)施、一卡通、考勤機等智能化設(shè)施。(6) 負責(zé)信息化安全的建設(shè)與執(zhí)行;三、崗位職責(zé)(1) 經(jīng)理:負責(zé)

2、信息化基礎(chǔ)設(shè)施的技術(shù)保障,包括,電腦終端、網(wǎng)絡(luò)、電話、機房、服務(wù)器系統(tǒng)、數(shù)據(jù)安全等技術(shù)支持;負責(zé)信息化安全的建設(shè)與執(zhí)行;負責(zé)本部門的組織管理,包括,修訂組織職責(zé)、架構(gòu)編制、崗位職級、分工授權(quán)等;負責(zé)本部業(yè)務(wù)制度流程規(guī)范的制定和監(jiān)督執(zhí)行;負責(zé)本部團隊建設(shè),包括,新員工入職、員工培訓(xùn)、績效考核、員工心政、團隊活動等;負責(zé)本部門工作管理,包括,預(yù)算編制與管控、計劃管理、匯報管理、會議管理等;(2) 系統(tǒng)工程師:負責(zé)所有服務(wù)器系統(tǒng)的技術(shù)運維工作負責(zé)核心數(shù)據(jù)庫的性能調(diào)優(yōu)及技術(shù)運維工作(3) 網(wǎng)絡(luò)工程師:負責(zé)各種網(wǎng)絡(luò)設(shè)施、線路的技術(shù)運維保障工作負責(zé)其他設(shè)施的運維保障工作,如機房設(shè)施、一卡通、考勤機等智能化

3、設(shè)施(4) 安全工程師:負責(zé)信息化安全的建設(shè)與執(zhí)行;(5) 其他說明事項:系統(tǒng)工程師、DBA網(wǎng)絡(luò)工程師、安全工程師,以下統(tǒng)稱運維工程師;權(quán)限控制:除負責(zé)基礎(chǔ)設(shè)施的網(wǎng)絡(luò)工程師,其余工程師不得擁有進入數(shù)據(jù)中心機房的權(quán)限。網(wǎng)絡(luò)工程師不得擁有系統(tǒng)工程師的管理權(quán)限。各崗位周期性工作清單見附一。四、管理對象IT基礎(chǔ)設(shè)施管理對象包括網(wǎng)絡(luò)、電話、機房、服務(wù)器、系統(tǒng)、信息安全等,具體內(nèi)容如下:(1) 網(wǎng)絡(luò):XXX運營中心、JJJJ工業(yè)園、WWWW園、數(shù)據(jù)中心、北京辦事處的網(wǎng)絡(luò)建設(shè)與維護。(2) 電話:XXXX1營中心、JJJJ工業(yè)園、WWWW園的電話網(wǎng)絡(luò)建設(shè)與維護。(3) 機房:數(shù)據(jù)中心機房的建設(shè)與日常維護。(

4、4) 服務(wù)器:服務(wù)器軟硬件的采購、建設(shè)與日常維護。(5) 系統(tǒng):操作系統(tǒng)、數(shù)據(jù)庫、應(yīng)用系統(tǒng)、虛擬化的日常維護。(6) 信息安全:信息安全建設(shè)與維護。五、運維規(guī)范內(nèi)部運維(1) 運維工程師,負責(zé)崗位職責(zé)內(nèi)相應(yīng)的IT設(shè)施的維護手冊的制定和完善、并按照本運維規(guī)范執(zhí)行維護管理工作和巡檢工作。(2) 運維工程師應(yīng)當(dāng)依據(jù)運維過程收集的記錄信息,每月整理出當(dāng)月的月度運維報告提報部門經(jīng)理,報告中要重點關(guān)注IT設(shè)施的問題和改進分析,并提出改進措施和建議。(3) 部門經(jīng)理,負責(zé)保障運維管理體系的有效執(zhí)行,包括本運維管理規(guī)范的制定和完善,督導(dǎo)維護工程師完善各設(shè)施維護手冊。(4) 部門經(jīng)理在月度工作會議上就當(dāng)月各個運

5、維工作報告與團隊溝通共識出整改措施,并形成新的工作計劃,推動落實執(zhí)行。參考運維手冊:網(wǎng)絡(luò)維護手冊系統(tǒng)維護手冊巡檢管理(1) 巡檢對象:機房、數(shù)據(jù)備份、網(wǎng)絡(luò)、服務(wù)器、系統(tǒng)的運行狀態(tài)。(2) 巡檢周期:每日、每周、每月,詳見附一周期性工作清單。(3) 每位運維工程師依據(jù)各自維護設(shè)施,按時對檢核內(nèi)容進行檢查。每日:當(dāng)日下班前要把當(dāng)天檢查情況填報檢核表。(4) 部門經(jīng)理將不定期檢查巡檢的完成情況。(5) 巡檢期間,如果發(fā)現(xiàn)設(shè)備或系統(tǒng)異常,應(yīng)立即上報部門經(jīng)理并展開調(diào)查,確認故障的應(yīng)立即進入故障處理環(huán)節(jié)。監(jiān)控告警(1) 使用*作為統(tǒng)一的監(jiān)控中心,提供在線監(jiān)控、流量分析、故障告警;(2) 設(shè)定告警閥值:磁盤

6、閥值95%非數(shù)據(jù)庫系統(tǒng)內(nèi)存閥值70%CPU閥彳170%(3) 告警:達到閥值或系統(tǒng)中斷時,平臺通過短信通知到運維工程師,運維工程師收到告警后,應(yīng)該立即檢查系統(tǒng)的健康狀況,并在應(yīng)急預(yù)案規(guī)定時間內(nèi)恢復(fù)正常;故障處理(1) 根據(jù)公司應(yīng)急預(yù)案的要求,在規(guī)定時限內(nèi)進行故障恢復(fù);(2) 預(yù)案的安全等級:(詳細系統(tǒng)的安全要求,見應(yīng)急預(yù)案)安全等級非常重要重要RTO不間斷1小時以內(nèi)24小時以內(nèi)RPO不間斷1小時以內(nèi)24小時以內(nèi)(3)故障發(fā)生時,運維工程師在無法鎖定問題根源時,應(yīng)該立即啟動應(yīng)急機制,在規(guī)定時間內(nèi)先恢復(fù)業(yè)務(wù)使用,并在非工作時間進行詳細的故障排查;(4)經(jīng)過排查仍然無法解決時,應(yīng)立即向部門經(jīng)理匯報,

7、并尋求外部資源直至問題解決;運維審計(1) 三權(quán)分立:角色分為審計員、設(shè)備管理員、運維人員,審計員僅能進行審計工作,對設(shè)備管理員和運維人員的行為進行審計,不能創(chuàng)建運維賬號,沒有系統(tǒng)權(quán)限和賬號,無法進行運維工作。設(shè)備管理員保管系統(tǒng)賬號及權(quán)限分配,但不能創(chuàng)建運維賬號,也無法進行運維工作。運維人員只能進行運維工作,沒有系統(tǒng)賬號及設(shè)備管理權(quán)限;(2) 內(nèi)部運維工程師使用AD賬號登錄堡壘機,進行日常的運維工作;(3) 外協(xié)人員通過臨時創(chuàng)建的運維賬號登錄堡壘機,進行相關(guān)工作;(4) 任何人員都嚴禁擅自更改系統(tǒng)的密碼、端口等配置;(5) 審計記錄保留一年,審計人員不定期進行抽檢;跨部門協(xié)作各運維工程師做為信

8、息服務(wù)部的二線支持,收到服務(wù)部門的工單請求時應(yīng)及時對請求進行反饋或處理。在半小時內(nèi)反饋、在4小時內(nèi)處理完成視為及時。詳細流程參見信息服務(wù)部的IT設(shè)施服務(wù)管理制度。六、運維流程IT基礎(chǔ)設(shè)施運維作業(yè)過程中,出現(xiàn)問題需要用到的流程:事件管理、問題管理、變更管理,隨著運維活動的不斷深入和持續(xù)改進,其他流程可能會逐步獨立并規(guī)范。事件管理事件管理流程的主要目標是盡快恢復(fù)IT服務(wù),并減少其對業(yè)務(wù)的不利影響,盡可能保證最好的IT服務(wù)質(zhì)量和可用性。(1) 事件流程:事件管理流程經(jīng)理處理人ilalfr錄用th蹄受理故障并解決事件記錄結(jié)束并輸出問題管理(2) 事件表單處理人事件分類網(wǎng)絡(luò)、電話、機房、服務(wù)器、系統(tǒng)、虛

9、擬化、數(shù)據(jù)庫、信息安全標題事件編號系統(tǒng)自動生成事件描述事件描述:錯誤代碼:如果有請?zhí)顚懡鉀Q方案事件開始時間事件結(jié)束時間事件原因分析口人為過失口設(shè)備故障口外部原因(3)流程說明任何引起服務(wù)中斷和服務(wù)質(zhì)量下降的現(xiàn)象,統(tǒng)稱事件。處理人:表示事件的受理人,并負責(zé)整個事件的解決,直到事件結(jié)束。受理人負責(zé)事件流程的發(fā)起,經(jīng)理負責(zé)審核事件的狀態(tài)及表單信息的完整性。事件結(jié)束自動轉(zhuǎn)入問題管理。問題管理問題管理流程的主要目標是預(yù)防問題和事故的再次發(fā)生,并且在事故的再次發(fā)生時,可以找到有效的處理方法。問題管理流程包括診斷事件根本原因和確定問題解決方案所需要的活動,問題管理還將維護有關(guān)問題、應(yīng)急方案和解決方案的信息。

10、(1)問題流程問題管理流程逑起人鯉理tt1*in.%jm.問減識別不同意未解決提交解決方案方案評佶審批影響較小問題解決同宣麻決問題關(guān)閉(2) 問題表單發(fā)起人問題分類網(wǎng)絡(luò)、電話、機房、服務(wù)器、系統(tǒng)、虛擬化、數(shù)據(jù)庫、信息安全標題問題編號系統(tǒng)自動生成影響范圍口影響較大口影響較小主要影響用戶:問題描述問題描述:影響范圍:受影響的用戶及系統(tǒng)解決方案計劃開始日期計劃結(jié)束日期用戶通知通知受影響用戶(3) 流程說明所有問題都應(yīng)該被完整準確的記錄下來,并保證相關(guān)信息應(yīng)盡可能詳細。明確問題管理的問題信息來源,問題可能來源于某些事件的進一步調(diào)查,也可能來源于主動巡檢和事件報表分析。問題發(fā)起人首先識別問題,分析可能造

11、成的危害,提出解決方案,計劃好問題的處置時間,并通知受影響的用戶。經(jīng)理負責(zé)評估方案的合理性。影響較大:涉及全公司使用、門店使用,用戶范圍較廣的系統(tǒng)或關(guān)鍵業(yè)務(wù)系統(tǒng),需總監(jiān)審核。影響較小:局部用戶使用、非關(guān)鍵業(yè)務(wù)系統(tǒng)。變更管理變更管理實現(xiàn)所有IT基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的變更,變更管理應(yīng)記錄并對所有要求的變更進行分類,應(yīng)評估變更請求的風(fēng)險、影響和業(yè)務(wù)收益。其主要目標是以對服務(wù)最小的干擾實現(xiàn)有益的變更。(1)變更流程變更管理流程發(fā)擔(dān)人w住孤鋼塔住祁區(qū)糕陽田驗證關(guān)閉擾行變走不同京不同意先更委員會叁理方案產(chǎn)怙變更專兄提交變更方案審批孌更委員A(2)變更表單發(fā)起人變更分類網(wǎng)絡(luò)、電話、機房、服務(wù)器、系統(tǒng)、虛擬化、

12、數(shù)據(jù)庫、信息安全標題變更編號系統(tǒng)自動生成影響范圍口影響較大口影響較小主要影響用戶:變更描述變更描述:影響范圍:受影響的用戶及系統(tǒng)變更方案變更方案:方案測試:如果有變更后測試方案:變更失敗回滾方案:計劃開始日期計劃結(jié)束日期用戶通知通知受影響用戶(3)流程說明所有涉及運維生產(chǎn)環(huán)境的變化,都必須走變更流程。變更的發(fā)起人,負責(zé)發(fā)起變更,提交變更方案,并負責(zé)變更的執(zhí)行。經(jīng)理負責(zé)評估變更方案的可行性。變更委員會:變更發(fā)起部門經(jīng)理及各部門指定對接人員組成,變更發(fā)起部門經(jīng)理主持變更會議,評估變更對各部門業(yè)務(wù)的影響,各部門委員負責(zé)協(xié)調(diào)相關(guān)資源和用戶,以及安排變更后的測試工作。七、IT運維服務(wù)質(zhì)量指標IT運維服務(wù)

13、質(zhì)量指標體系是用來衡量整個運維服務(wù)工作質(zhì)量的標準規(guī)范,指標標準如下:運維服務(wù)體系質(zhì)量指標衡量指標指標說明指標公式用戶投訴次數(shù)IT故障服務(wù)投訴投訴一次扣20分,扣完為止。本項總分100分,權(quán)重20%事故在應(yīng)急預(yù)案當(dāng)物恢復(fù)時間范圍之內(nèi)恢復(fù)的,屬于正常事故,公司應(yīng)急預(yù)案范圍外的系統(tǒng),按一般安全級別考核。超過4小時不能恢復(fù),TE義為次重大事故;1-4小時之間定義為中等事故;1小時以內(nèi)定義升-般事故??己似趦?nèi)無事故100分,重大事故一次扣100分,中等事故一次扣50分,一般事故一次扣20分,扣完為止。本項總分100分,權(quán)重20%安全1)公司網(wǎng)絡(luò)被黑客攻擊導(dǎo)致中斷;2)被非授權(quán)終端設(shè)備登入公司內(nèi)網(wǎng);3)公

14、司內(nèi)部發(fā)生已知病毒大范圍感染(5臺以上電腦同時爆發(fā)病毒);一次扣10分,扣完為止。本項總分100分,權(quán)重20%附一:周期性工作清單周期工作內(nèi)容角色范圍或行為日機房環(huán)境巡檢網(wǎng)絡(luò)工程師配電、室內(nèi)環(huán)境、設(shè)備狀態(tài)設(shè)備健康巡檢網(wǎng)絡(luò)工程師網(wǎng)絡(luò)設(shè)備、信息安全設(shè)備、服務(wù)器、系統(tǒng)備份狀態(tài)檢查系統(tǒng)工程師業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫每日備份計劃的完成情況OA單據(jù)處理ALL各日常運維單據(jù)周周例會ALL組織每周例會備份狀態(tài)檢查系統(tǒng)工程師業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫每周備份計劃的完成情況運維周報ALL各自動負責(zé)系統(tǒng)的周運維報告月月運維報告ALL每月第一周,各系統(tǒng)工程師提交上月運維報告運營商付費及對賬網(wǎng)絡(luò)工程師3G卡,聯(lián)通帶寬付費跟蹤網(wǎng)絡(luò)設(shè)備備份網(wǎng)絡(luò)工程師每月第一周備份所有設(shè)備配置流量統(tǒng)計網(wǎng)絡(luò)工程師每月5號前,提交各中心流量統(tǒng)計季機房UPS放電檢測網(wǎng)絡(luò)工程師每季度第一個月A周放電備份數(shù)據(jù)有效性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論