IT運維服務整體方案_第1頁
IT運維服務整體方案_第2頁
IT運維服務整體方案_第3頁
IT運維服務整體方案_第4頁
IT運維服務整體方案_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、IT運維服務整體方案 本文主要內容: IT運維服務內容 IT運維服務流程 IT運維服務管理制度規(guī)范 IT運維應急服務響應措施 一、服務內容 1.1服務目標 運行維護服務包括,信息系統相關的主機設備、操作系統、數據庫和存儲 設備及其他信息系統的運行維護與安全防范服務,保證用戶現有的信息系統的 正常運行,降低整體管理成本,提高網絡信息系統的整體服務水平。同時根據 日常維護的數據和記錄,提供用戶信息系統的整體建設規(guī)劃和建議,更好的為 用戶的信息化發(fā)展提供有力的保障。 用戶信息系統的組成主要可分為兩類:硬件設備和軟件系統。硬件設備包 括網絡設備、安全設備、主機設備、存儲設備等;軟件設備可分為操作系統軟

2、 件、典型應用軟件(如:數據庫軟件、中間件軟件等)、業(yè)務應用軟件等。 通過運行維護服務的有效管理來提升用戶信息系統的服務效率,協調各業(yè) 務應用系統的內部運作,改善網絡信息系統部門與業(yè)務部門的溝通,提高服務 質量。結合用戶現有的環(huán)境、組織結構、IT資源和管理流程的特點,從流程、 人員和技術三方面來規(guī)劃用戶的網絡信息系統的結構。將用戶的運行目標、業(yè) 務需求與IT服務的相協調一致。 信息系統服務的目標是,對用戶現有的信息系統基礎資源進行監(jiān)控和管理, 及時掌握網絡信息系統資源現狀和配置信息,反映信息系統資源的可用性情況 和健康狀況,創(chuàng)建一個可知可控的IT環(huán)境,從而保證用戶信息系統的各類業(yè) 務應用系統的

3、可靠、高效、持續(xù)、安全運行。 服務項目范圍覆蓋的信息系統資源以下方面的關鍵狀態(tài)及參數指標: 運行狀態(tài)、故障情況 配置信息 可用性情況及健康狀況性能指標 統計運維數椐、提供信息系統管理和工作報告、歸納總結并提供用戶想了 解的數椐報告 1.2信息資產統計服務 此項服務為基本服務,包含在運行維護服務中,幫助我們對用戶現有的信 息資產情況進行了解,更好的提供系統的運行維護服務。 服務內容包括: 硬件設備型號、數量、版本等信息統計記錄 軟件產品型號、版本和補丁等信息統計記錄 網絡結構、網絡路由、網絡IP地址統計記錄 綜合布線系統結構圖的繪制 其它附屬設備的統計記錄 硬件設備清單統計 1.3網絡、安全系統

4、運維服務 從網絡的連通性、網絡的性能、網絡的監(jiān)控管理三個方面實現對網絡系統 的運維管理。網絡、安全系統基本服務內容: 序號 服務模塊 內容描述 提供方 1 現場備件安裝 配合用戶進行,按備件到達現場時 間工程師到達現場 2 現場軟件升級 首先分析軟件升級的必要性和風 險,配合用戶進行軟件升級 3 現場故障診斷 按服務級別:7X 24小時 5X 8小 時 4 電話遠程技術支持 7 X 24小時 5 問題管理系統 對遇到的問題進行匯總和發(fā)布 網絡核心交換機巡視典型作業(yè)計劃書 系統管理單位: 維保單位: 設備名: 設備型號: 管理IP : 檢查內容 參考標準 檢查 結果 檢查結論 巡視方法描述 巡檢

5、 周期 硬件 電源運行狀態(tài) 正常 異常 運行 風扇運行狀態(tài) 正常 異常 狀態(tài) 模塊運行狀態(tài) 正常 異常 系統 運行 狀態(tài) 檢杳 VLAN 狀態(tài) 正常異常 配置狀態(tài) 正常異常 OSPF 狀態(tài) 正常異常 日志 檢杳 日志狀態(tài) 正常異常 其他 檢杳 內容 正常異常 正常異常 正常異常 (1)用戶現場技術人員值守 根據用戶的需求提供長期的用戶現場技術人員值守服務,保證網絡的實時 連通和可用,保障接入交換機、匯聚交換機和核心交換機的正常運轉。 現場值守的技術人員每天記錄網絡交換機的端口是否可以正常使用,網絡 的轉發(fā)和路由是否正常進行,交換機的性能檢測,進行整體網絡性能評估,針 對網絡的利用率進行優(yōu)化并提

6、出網絡擴容和優(yōu)化的建議。 現場值守人員還進行安全設備的日常運行狀態(tài)的監(jiān)控,對各種安全設備的 日志檢查,對重點事件進行記錄,對安全事件的產生原因進行判斷和解決,及 時發(fā)現問題,防患于未然。 同時能夠對設備的運行數據進行記錄,形成報表進行統計分析,便于進行 網絡系統的分析和故障的提前預知。具體記錄的數據包括: 配置數據 性能數據 故障數據 (2) 現場巡檢服務 現場巡檢服務是對客戶的設備及網絡進行全面檢查的服務項目,通過該服 務可使客戶獲得設備運行的第一手資料,最大可能地發(fā)現存在的隱患,保障設 備穩(wěn)定運行。 同時,將有針對性地提出預警及解決建議,使客戶能夠提早預防,最大限 度降低運營風險。 巡檢包

7、括的內容如下: 編號 巡檢內容 1 硬件運行狀態(tài)檢杳項目 單板狀態(tài)檢杳 電源模塊狀態(tài)檢杳 風扇狀態(tài)檢杳 整機指示燈狀態(tài)檢杳 機框防塵網檢杳 機房溫度、濕度檢杳 設備地線檢查 2 軟件運行情況檢查項目 設備運行情況檢查 網絡報文分析 設備對接運行狀況檢查 路由運行情況檢查 3 網絡整體運行情況調查 網絡運行冋題調查 網絡變更情況調查網絡歷史故障調查 (3)網絡運行分析與管理服務 網絡運行分析與管理服務是指工程師通過對網絡運行狀況、網絡問題進行 周期性檢查、分析后,為客戶提出指導性建議的一種綜合性高級服務,其內容 包括: 服務內容 服務優(yōu)點 向客戶提供網絡專家電話號碼。 保證重大冋題第一連線至網絡

8、專家。 網絡專家組每周與客戶進行不少于2小時的 電話技術交流 以最小成本保證及時解答客戶關心的技 術問題,并就某一領域技術問題展開深層 次溝通。 每月向客戶提交 CASE匯總分析報告,并可擴 展到每年17次(月度、季度、年度) 使客戶了解網絡歷史故障情況以及故障 預防建議,最大程度減少網絡故障隱患, 更咼效的進行網絡管理。 (4)重要時刻專人值守服務 保證重要時刻設備穩(wěn)定運行對客戶成功尤為關鍵,因此,可對客戶提供重 要時刻的專人現場值守支持,包括政府客戶的重大會議期間、金融客戶的年終 結算日、運營商客戶的生產網重大割接或其它任何客戶認為可能對其業(yè)務運營 產生重大影響的時刻。 如需專人值守,客戶

9、需至少提前3周與授權服務商客戶服務經理聯系。對 每位合約客戶,授權服務商均需按事先合同約定提供專人值守服務。客戶如需 超出合同約定范圍的更多值守支持,需額外支付相應人力和差旅費用。 1.4主機、存儲系統運維服務 主機、存儲系統的運維服務包括:主機、存儲設備的日常監(jiān)控,設備的運 行狀態(tài)監(jiān)控,故障處理,操作系統維護,補丁升級等內容。 主機存儲系統基本服務內容: 序號 服務模塊 內容描述 提供方 1 現場備件安裝 配合用戶進行。按備件到達現場時間工程師 到達現場 2 補丁服務 消除軟件漏洞給系統帶來的安全隱患, 并對 安裝補丁所引起的系統連鎖反應進行合理 的平衡。 3 升級服務 對系統進行軟件或硬件

10、的升級,以改進、完 善現有系統或消除現有系統的漏洞。 4 現場故障診斷 按服務級別:7X 24小時 5X 8小時 5 電話遠程技術支持 7 X 24小時 6 問題管理系統 對遇到的問題進行匯總和發(fā)布 7 系統優(yōu)化 對客戶系統的括主機、 存儲設備、操作系統、 提供優(yōu)化服務。 現場值守人員可進行監(jiān)控管理的內容包括: CPU性能管理; 內存使用情況管理; 硬盤利用情況管理; 系統進程管理; 主機性能管理; 實時監(jiān)控主機電源、風扇的使用情況及主機機箱內部溫度; 監(jiān)控主機硬盤運行狀態(tài); 監(jiān)控主機網卡、陣列卡等硬件狀態(tài); 監(jiān)控主機HA運行狀況; 主機系統文件系統管理; 監(jiān)控存儲交換機設備狀態(tài)、端口狀態(tài)、傳

11、輸速度; 監(jiān)控備份服務進程、備份情況(起止時間、是否成功、出錯告警); 監(jiān)控記錄磁盤陣列、磁帶庫等存儲硬件故障提示和告警,并及時解決故障 問題; 對存儲的性能(如高速緩存、光纖通道等)進行監(jiān)控。 小型機系統巡檢典型作業(yè)計劃書 系統管理單位: 設備名: 設備型號 設備序列號 管理IP : 檢查內容 參考標準 檢查結果 狀態(tài)是否止常 巡 檢 方 法 描 述 巡 檢 周 期 硬件 運行 狀態(tài) 電源指示燈 正常異常 面板指示燈 正常異常 內置磁帶機 正常異常 CPU狀態(tài) 正常異常 內存狀態(tài) 正常異常 磁盤狀態(tài) 正常異常 網卡狀態(tài) 正常異常 HBA卡運行狀 態(tài) 正常異常 系統 檢查 系統日志 正常異常

12、Mail 正常異常 文件系統,包 括磁盤卷剩 余空間 正常異常 硬件檢測 正常異常 交換分區(qū) 正常異常 固件版本 正常異常 補丁包版本 正常異常 系統鏡像 正常異常 存儲磁盤 正常異常 存儲驅動 正常異常 進程狀態(tài) 正常異常 系統 性能 檢查 CPU利用率 正常異常 內存利用率 正常異常 磁盤I/O 性 能 正常異常 數據 庫運 行狀 態(tài) 數據庫安裝 目錄 正常異常 數據庫進程 狀態(tài) 正常異常 集群 檢查 集群進程狀 態(tài) 正常異常 集群日志 正常異常 存儲 檢查 存儲設備故 障燈狀態(tài) 正常異常 SAN交換機端 口狀態(tài) 正常異常 存儲交換機 環(huán)境狀態(tài) 正常異常 系統故障報 告 正常異常 1.5數

13、據庫系統運維服務 數據庫運行維護服務是包括主動數據庫性能管理,數據庫的主動性能管理 對系統運維非常重要。通過主動式性能管理可了解數據庫的日常運行狀態(tài),識 別數據庫的性能問題發(fā)生在什么地方,有針對性地進行性能優(yōu)化。同時,密切 注意數據庫系統的變化,主動地預防可能發(fā)生的問題。 數據庫運行維護服務還包括快速發(fā)現、診斷和解決性能問題,在出現問題 時,及時找出性能瓶頸,解決數據庫性能問題,維護高效的應用系統。 數據庫運行維護服務,主要工作是使用技術手段來達到管理的目標,以系 統最終的運行維護為目標,提高用戶的工作效率。 具體數據庫運行維護監(jiān)控的基本服務內容包括: 序號 服務模塊 內容描述 提供 方 1

14、Oracle數據庫 7*24電話支持服務 每周7天,每天24小時支持中心電話,電子郵件答 詢,以滿足業(yè)務發(fā)展的需要。 Oracle產品技術專豕直接同客戶對話,幫助解決客 戶提出的疑難問題。 根據問題的嚴重程度,將優(yōu)先解決客戶認為是關鍵 而緊急的任務。 對客戶提出的一般性問題進行技術咨詢、指導。 定期的客戶管理報告,避免問題再度發(fā)生。 2 Oracle數據庫產品 現場服務響應 數據庫宕機 數據壞塊 影響業(yè)務不能進行的產品問題 軟件產品的更新及維護。 3 Oracle數據庫產品 系統健康檢查 對系統的配置及運作框架提出建議,以幫助您得到 一個更堅強可靠的運作環(huán)境 降低系統潛在的風險,包括數據丟失、

15、安全漏洞、 系統崩潰、性能降低及資源緊張 檢查并分析系統日志及跟蹤文件,發(fā)現并排除數據 庫系統錯誤隱患 檢查數據庫系統是否需要應用最新的補丁集 檢查數據庫空間的使用情況 協助進行數據庫空間的規(guī)劃管理 檢查數據庫備份的完整性 監(jiān)控數據庫性能 確認系統的資源需求 明確您系統的能力及不足 優(yōu)化Oracle Server 的表現 通過改善系統環(huán)境的穩(wěn)定性來降低潛在的系統宕機 時間 4 Oracle數據庫產品 性能調優(yōu) 分析用戶的應用類型和用戶行為 評價并修改ORACLE數據庫的參數設置 評價并調整ORACLE數據庫的數據分布 評價應用對硬件和系統的使用情況,并提出建議 利用先進的性能調整工具實施數據庫

16、的性能調整 培訓用戶有關性能調整的概念 提供用戶完整的性能調整報告和解決方法 1.6中間件運維服務 中間件管理是指對BEA Weblogic、MQ等中間件的日常維護管理和監(jiān)控工 作,提高對中間件平臺事件的分析解決能力,確保中間件平臺持續(xù)穩(wěn)定運行。 中間件監(jiān)控指標包括配置信息管理、故障監(jiān)控、性能監(jiān)控。 執(zhí)行線程:監(jiān)控 WebLogic配置執(zhí)行線程的空閑數量。 JVM內存:JVM內存曲線正常,能夠及時的進行內存空間回收。JDBC連接 池:連接池的初始容量和最大容量應該設置為相等,并且至少等于執(zhí)行線程的 數量,以避免在運行過程中創(chuàng)建數據庫連接所帶來的性能消耗。 檢查WEBLO(日志文件是否有異常報錯

17、 如果有WEBLO(集群配置,需要檢查集群的配置是否正常。 二、運維服務流程 建議用戶采用的服務方式為兩種:一種為技術人員現場值守,另一種是定 期巡檢結合故障現場服務。 技術人員現場值守運行維護服務的基本操作流程如下圖所示: 精選word范本! 定期巡檢結合故障現場運行維護服務的基本操作流程如下圖所示: IP T氓宅桁就乙密 占卩ij; m. 說沖H. -i: 琳壇懺址耶能則盃 ft 最梵繪用戶倆矗雨壇壇布第箏幫背 Ml載垢迄肛好前擔壺 三、服務管理制度規(guī)范 3.1服務時間 (1) 接收服務請求和咨詢:在 5*8小時工作時間內設置由專人職守的熱線電 話,接聽內部的服務請求,并記錄服務臺事件處理

18、結果。 (2) 在非工作時間設置有專人 7*24小時接聽的移動電話熱線,用于解決內部 的技術問題以及接聽7*24小時機房監(jiān)控人員的機房突發(fā)情況匯報。 (3) 服務響應時間: 故障級別 響應時間 故障解決時間 1級:屬于緊急問題;其具體現象為:系統崩潰 導致業(yè)務停止、數據丟失。 30分鐘,2小時內提 交故障處理方案 12小時以內 II級:屬于嚴重問題;其具體現象為:出現部分 部件失效、系統性能下降但能正常運行,不影響 正常業(yè)務運作。 30分鐘,2小時內提 交故障處理方案 24小時以內 III級:屬于較嚴重問題;其具體現象為:出現 系統報錯或警告,但業(yè)務系統能繼續(xù)運行且性能 不受影響。 30分鐘,

19、2小時內提 交故障處理方案 48小時以內 IV級:屬于普通問題;其具體現象為:系統技術 功能、安裝或配置咨詢,或其他顯然不影響業(yè)務 的預約服務。 30分鐘,2小時內提 交故障處理方案 5天內 技術支持人員在解決故障時,會最大限度保護好數據,做好故障恢復的文 檔,力爭恢復到故障點前的業(yè)務狀態(tài)。 對于 系統癱瘓,業(yè)務系統不能運轉 的故障級別,如果不能于12小時 內解決故障,將在16小時內提出應急方案,確保業(yè)務系統的運行。故障解決 后24小時內,提交故障處理報告。說明故障種類、故障原因、故障解決中使 用的方法及故障損失等情況。 3.2行為規(guī)范 (1) 遵守用戶的各項規(guī)章制度,嚴格按照用戶相應的規(guī)章制

20、度辦事。 (2) 與用戶運行維護體系其他部門和環(huán)節(jié)協同工作,密切配合,共同開展技術 支持工作。 (3) 出現疑難技術、業(yè)務問題和重大緊急情況時,及時向負責人報告。 (4) 現場技術支持時要精神飽滿,穿著得體,談吐文明,舉止莊重。接聽電話 時要文明禮貌,語言清晰明了,語氣和善。 (5) 遵守保密原則。對被支持單位的網絡、主機、系統軟件、應用軟件等的密 碼、核心參數、業(yè)務數據等負有保密責任,不得隨意復制和傳播。 3.3現場服務支持規(guī)范 運維服務人員要做到耐心、細心、熱心的服務。工作要做到事事有記錄、 事事有反饋、重大問題及時匯報。嚴格遵守工作作息時間,嚴格按照服務工作 流程操作。 (1) 現場支持

21、工程師應著裝整潔、言行禮貌大方, 技術專業(yè),操作熟練、 嚴謹、規(guī)范;現場支持時必須遵守用戶單位的相關規(guī)章制度。 (2) 現場支持工程師在進行現場支持工作時必須在保證數據和系統安全 的前提下開展工作。 (3) 現場支持時出現暫時無法解決的故障或其他新的故障時,應告知用 戶并及時上報負責人,尋找其他解決途徑。 (4) 故障解決后,現場支持工程師要詳細記錄問題的發(fā)生時間、地點、 提出人和問題描述,并形成書面文檔,必要時應向用戶介紹故障出現的原因及 預防方法和解決技巧。 3.4冋題記錄規(guī)范 根據使用人員提出問題的類別,將問題分為咨詢類問題和系統缺陷類問題 二類:咨詢類問題是指通過服務熱線或現場解疑等方

22、式能夠當場解決用戶提出 的問題,具有問題解答直接、快速和實時的特點,該問題到現場支持人員處即 可中止,對于該類問題的記錄可使用咨詢類問題記錄模版進行記錄。系統缺陷 類問題是指使用人員提出的問題涉及到系統相應環(huán)節(jié)的確認修改,需要經過逐 級提交、診斷、確認、處理和回復等環(huán)節(jié),處理解決需要項目組的分析確認, 問題有解決方案后,將解決方案反饋給用戶。具體提交流程如下: (1) 問題提交。應用信息系統的用戶發(fā)現屬于系統缺陷類的問題時,填 寫系統缺陷類問題提交單,提交服務支持中心。 (2) 問題分析。服務中心接到用戶提交的問題單,要組織相應人員對問 題單中描述的問題進行分析研判,確定問題的類型(技術問題、

23、業(yè)務問題或者 操作問題)。 屬于技術問題,提交服務中心技術人員對存在的問題提出具體的處理意見 和建議;屬于業(yè)務問題,提交服務中心業(yè)務人員進行處理;屬于操作問題,可 安排相關人員對問題提出人進行解釋,并將系統缺陷類問題提交單轉為系統咨 詢類問題提交單。 (3) 問題確認、解決。服務中心的技術人員和業(yè)務人員收到系統缺陷類 問題提交單后,對提交的問題進行歸類匯總和分析、確認。 可以解決的,明確問題解決的具體處理建議和措施,經主管領導簽字同意 后,交實施人員進行解決方案的實施。服務人員確認是否解決,并將解決方法 附在系統缺陷類問題提交單上反饋給問題提出人員。 (4) 問題上報。服務人員收到經業(yè)務或技術

24、人員確認的系統缺陷類問題 提交單后,上報服務中心。 (5) 問題回復。服務中心根據提交問題的進行分析,制定解決方案并進 行實施的解決,同時做好變更記錄。將解決方案匯總后及時向問題提交單位或 問題交辦單位作出回復,并將分析過程和問題產生原因一并提交。 四、應急服務響應措施 針對項目制定了詳盡的設計、應急處理預案,整個流程嚴謹而有序。 但是, 在服務維護過程中,意外情況將難以完全避免。 下面,我們將對項目實施的突發(fā)風險進行詳細分析,并且針對各類突發(fā)事 件,設計了相應的預防與解決措施,同時提供了完整的應急處理流程。 4.1應急基本流程 維護服務應急處理流程 4.2預防措施 針對上門服務過程中可能遇到

25、的各種各樣的風險,針對一些可能出現的情 況,制定了一系列預防處理措施,舉例如下: 類型 事件 預防措施 處理 應用軟件 無法啟動軟件可執(zhí)行文件 上門人員提前準備好各類 需維護軟件安裝程序 將應用軟件數據文 件備份后,重新安裝 軟件打開過程中或運行中 異常錯誤關閉 上門人員準備好安裝程 序,操作系統優(yōu)化和修補 軟件,查殺病毒軟件 判斷出錯原因,備份 數據,采取相關修復 措施 操作系統 使用者本機操作系統異常 或系統資源占用嚴重 準備好系統檢查程序及修 補程序,以及查殺病毒軟 件 告知使用者錯誤原 因可能類型,提出解 決方案,經使用者認 可后采取相應措施 B/S結構系統,IE瀏覽器 異?;驘o法下載控件 準備流氓軟件清理程序、 修復瀏覽器軟件、查殺病 毒軟件 檢查IE瀏覽器選項 設置,分析原因進行 修復 網絡或服務 器 B/S結構系統網絡流量異 ?;蚍掌鞯卿洰惓?判斷服務器是否異常,否 則準備殺毒軟件 檢查網絡流量,流量 異常小則報修網絡 服務商,流量異常大 則查殺病毒

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論