軟件平臺運維技術方案1總體方案_第1頁
軟件平臺運維技術方案1總體方案_第2頁
軟件平臺運維技術方案1總體方案_第3頁
軟件平臺運維技術方案1總體方案_第4頁
軟件平臺運維技術方案1總體方案_第5頁
免費預覽已結束,剩余8頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、軟件平臺運維技術方案1.1 總體維護方案全面保障招標人信息、應用系統平穩(wěn)運行及有效應用,總體目標如下:建立系統運維機制。提供全程運維服務,出現故障應能及時告警。必須建立完善的運維機制,包括運維團隊、運維方案、運維制度、應急預案等:不發(fā)生六級及以上通信設備事件。不發(fā)生因云平臺環(huán)境原因造成的系統故障、停機等事件。信息安全。運維人員嚴格遵守有關信息安全與保密管理規(guī)定,運維期不得發(fā)生六級及以上信息安全事件。運行指標要求。主機系統(包括存儲)可用率不低于99.99%。主機系統可用率=(總時間-主機計劃外停機時間)/ 總時間*100%。 應用系統可用率不低于99.99%。 應用系統可用率=(總時間 - 計

2、劃外停機時間)/ 總時間*100%。網絡可用率不低于99.99%。信息網絡可用率=(總時間 -計劃外網絡中斷時間)/總時間 *100%服務滿意度。服務態(tài)度端正,有問必答,用語規(guī)范,態(tài)度誠懇,耐心解答用戶疑難,虛心聽取用戶意見,處理業(yè)務不拖拉,不推諉。客戶服務滿意度達到99%以上??蛻舴漳晖对V次數小于 4 次。問題響應效率。從開始處理后3 個小時內解決的問題占全部問題的比重不得低于80%;在一個小時內響應的問題占全部問題的比重不得低于95%; 客戶端、 網絡、 用戶管理、權限變更、操作類問題一個工作日內解決,業(yè)務流程、系統配置、權限設計類問題視問題的情況,一般在 5 個工作日內解決,系統變更業(yè)

3、務審批在5 個工作日內完成,新需求、開發(fā)類問題需視開發(fā)及測試情況盡快解決。恢復措施。具備自動或手動恢復措施,以便在發(fā)生錯誤時能夠快速地恢復正常運行。軟件系統故障時,自動恢復時間< 30 分鐘,手工恢復時間< 4 小時。1.1.1 信息資產統計服務此項服務為基本服務,包含在運行維護服務中,幫助我們對用戶現有的信息資產情況進行了解,更好的提供系統的運行維護服務。服務內容包括:? 后臺管理系統數據信息統計記錄? 門戶網站信息發(fā)布安全管理? 系統新增功能接口對接及研發(fā)?軟件產品型號、版本和補丁等信息統計記錄?網絡結構、網絡路由、網絡 IP地址統計記錄?其它附屬數據的統計記錄1.1.2 網絡

4、、安全系統運維服務從網絡的連通性、網絡的性能、網絡的監(jiān)控管理三個方面實現對網絡系統的運維管理。網絡、安全系統基本服務內容:序號服務模塊內容描述1云服務器配置配合用戶進行,云服務器后買,安裝部 署,調試等工作2系統故障診斷按服務級別:7X24小時5X 8小時3電話遠程技術支持7X24小時4系統問題管理對遇到的問題進行匯總和發(fā)布(1)用戶現場技術人員值守*公司可根據用戶的需求提供長期的用戶現場技術人員值守服務,保證網絡的實時連通和可用,保障系統正常運作?,F場值守的技術人員每天記錄信息系統是否存在安全性及健壯性問題,網絡的轉發(fā)和路由是否正常進行,進行整體網絡性能評估, 針對網絡的利用率進行優(yōu)化并提出

5、網絡擴容和優(yōu)化的建議?,F場值守人員還進行信息系統的日常運行狀態(tài)的監(jiān)控,對各種安全設備的日志檢查,對重點事件進行記錄,對安全事件的產生原因進行判斷和解決,及時發(fā)現問題,防患于未然。同時能夠對信息系統的運行數據進行記錄,形成報表進行統計分析, 便于進行網絡系統的分析和故障的提前預知。具體記錄的數據包括:?配置數據?性能數據?故障數據(2)網絡運行分析與管理服務網絡運行分析與管理服務是指 *公司工程師通過對網絡運行狀況、網絡問題進行周期性檢查、分析后,為客戶提出指導性建議的一種綜合性高級服務,其內容包括:服務內容服務優(yōu)點向客戶提供網絡專家電話號碼。保證重大問題A連線至網絡專家。網絡專家與客戶進行電話

6、技術交流以最小成本保證及時解答客戶關心的技術問 題,并就某一領域技術問題展開深層次溝通。向客戶提交網絡問題匯總分析報告使客戶了解網絡歷史故障情況以及故障預防 建議,最大程度減少網絡故障隱患,更高效 的進行網絡管理。(3)重要時刻專人值守服務*公司深刻知道保證重要時刻系統穩(wěn)定運行對客戶成功尤為關鍵,因此,*公司可對客戶提供重要時刻的專人現場值守支持,包括政府客戶的重大會議期間、金融客戶的年終結算日、運營商客戶的生產網重大割接或其它任何客戶認為可能對其業(yè)務運營產生重大影響的時刻。如需專人值守,客戶需至少提前3周與授權服務商客戶服務經理聯系。對每位合約客戶,授權服務商均需按事先合同約定提供專人值守服

7、務??蛻羧缧璩龊贤s定范圍的更多值守支持,需額外支付相應人力和差旅費用。1.1.3 云服務器運維服務*公司提供云服務器運維服務包括: 存儲設備的日常監(jiān)控,設備的運行狀態(tài)監(jiān)控,故障處理, 操作系統維護,補丁升級等內容。云服務器基本服務內容:序號服務模塊內容描述1云服務器配置配合用戶進行,云服務器后買,安裝部署,調試等工作2補丁服務消除軟件漏洞給系統帶來的安全隱患,并對安裝補丁 所引起的系統連鎖反應進行合理的平衡。3升級服務對系統進行軟件或硬件的升級,以改進、完善現有系 統或消除現有系統的漏洞。4系統故障診斷按服務級別:7X 24小時5X 8小時5電話遠程技術支持7 X 24小時6系統問題管理對

8、遇到的問題進行匯總和發(fā)布7系統優(yōu)化對客戶系統的存儲設備、操作系統、提供優(yōu)化服務。*公司現場值守人員可進行監(jiān)控管理的內容包括:? CPU性能管理;?內存使用情況管理;?硬盤利用情況管理;12? 系統進程管理; ? 服務器性能管理; ? 監(jiān)控硬盤運行狀態(tài); ? 監(jiān)控網卡狀態(tài); ? 系統文件系統管理; ? 監(jiān)控存儲交換機設備狀態(tài)、端口狀態(tài)、傳輸速度; ? 監(jiān)控備份服務進程、備份情況(起止時間、是否成功、出錯告警) ? 對存儲的性能(如高速緩存、光纖通道等)進行監(jiān)控。服務器巡檢作業(yè)計劃書系統管理單位:設備名:設備型號設備序列號管理IP:檢查內容參考標準檢查結果狀態(tài)是否止常巡檢方法描述巡檢周期運行狀態(tài)C

9、PU狀態(tài)正??诋惓却鏍顟B(tài)正??诋惓4疟P狀態(tài)正??诋惓>W卡狀態(tài)正??诋惓O到y檢查系統日志正??诋惓N募到y,包括 磁盤卷剩余空間正??诋惓=粨Q分區(qū)正??诋惓9碳姹菊?诋惓Qa丁包版本正??诋惓O到y鏡像正??诋惓4鎯Υ疟P正??诋惓4鎯︱寗诱?诋惓_M程狀態(tài)正??诋惓3?匕匕胡 育 1:查 系 性 梳CPU利用率正??诋惓却胬寐收?诋惓4疟PI/O性能正??诋惓祿?庫運 行狀 態(tài)數據庫安裝目錄正常口異常數據庫進程狀態(tài)正??诋惓<簷z查集群進程狀態(tài)正??诋惓<喝罩菊?诋惓4鎯z查存儲環(huán)境狀態(tài)正??诋惓O到y故障報告正常口異常1.1.4 短信平臺維護服務應用系統在運行期間,* 公司需要有專人

10、職守,定期檢測,保證短信平臺能夠正常運行。維護要求為:通過對短信平臺的維護,分析用戶的不斷更新的需求,分析應用系統對服務平臺性能的要求,提出系統優(yōu)化擴容解決方案,保障應用系統的處理服務性能。主要維護內容包括:? 短信數據維護;? 短信數據備份;? 日常維護;? 軟件更新服務;? 對短信平臺健康狀態(tài)檢查與分析報告;? 對系統用戶信息進行維護和修改,添加系統用戶、更改系統用戶信息、權限,負責系統中管理人員、操作人員、監(jiān)督人員名單的調整,以及數據同步。1.1.5 系統運行保障服務( 1 )從運行值班人員及時了解應用系統的運行狀況,配合日常運行監(jiān)測,處理突發(fā)事件, 組織編寫事故報告、查明事故原因。(

11、2)對應用系統出現的故障進行及時處理;對用戶使用過程中存在的技術問題提出可行的 解決方案。( 3)研究制定系統的應急預案,并安排相關人員定期演練;( 4)負責編寫規(guī)劃、計劃系統運行情況的總結;( 5)建立聯絡機制,做好和系統實施單位以及原廠商的溝通;( 6)對應用系統運行中出現的問題及時與系統實施單位和原廠商聯系支持解決,以保持系 統的穩(wěn)定運行。1.1.6 基本要求( 1 )日常運維服務針對招標公司的工作日制度,為客戶提供系統級的日常維護、定期巡檢、性能測試、故障排查等服務。具體內容包括:a. 工作日服務主要指現場值守服務,維護團隊需要指派3 名資深服務技術服務工程師長期值守在現場,負責對現場

12、設備運行狀態(tài)進行監(jiān)視、管理和維護以及工作終端的管理和維護,通過對系統運行日志的分析提前發(fā)現并排除可能發(fā)生的潛在故障,并在全部維護服務團隊支持下,在 1 小時內排除普通故障,2 小時內排除較大故障,4 小時內排除重大故障,24 小時內排除特大故障。維護期內提供技術人員進行現場監(jiān)控服務。b. 故障響應服務除了現場值守服務方式外,同時,提供7X24小時故障響應服務具體包括:維護期內提供電話、傳真、電子郵件等方式的咨詢和支持服務。主要系統設備出現故障時,15 分鐘內響應,當現場維護工程師或節(jié)假日值班維護工程師無法排除故障時,1 小時內中心派專業(yè)工程師趕赴現場進行故障診斷及處理,在1 小時內排除普通故障

13、,2 小時內排除較大故障,4 小時內排除重大故障,24 小時內排除特大故障。一般故障,正常工作日內響應。( 2)其他時間及夜間服務當系統在非工作日出現異常時,維護團隊現場人員將在1 小時內趕赴現場并排除系統普通故障,特大故障將在24 小時內處理完畢。具體聯系方式包括: 通過維護團隊提供的 7X24小時響應服務熱線; 現場維護人員通過移動通信網絡(當運維管理系統具備短信故障報警通知功能時)接收到系統報警信息;或維護人員接到服務請求電話時。( 3)臨時保障服務當遇到重大活動需要提供臨時保障服務時,維護團隊須在需要保障服務的前三天進駐現場,并對所有設備進行臨時性安全檢查,排除安全隱患,以做到萬無一失

14、。( 4)月度檢查每月對各系統及設備進行檢查,進行安全系統、防病毒系統檢查,進行漏洞掃描,并對檢查中存在的故障及安全隱患進行處理。每月第一周向用戶單位提交上月的月度巡檢報告,報請用戶單位審批簽署。( 5)季度檢查每季度對由維護團隊的專業(yè)維護隊伍對所有設備進行安全評估和風險分析,提交完整的安全狀況評估報告,分析存在的安全漏洞情況,提出整改方案和建議。( 6)年度檢查每年由維護團隊組織相關的專家(含硬件和軟件)對整個系統進行安全檢查,對每個硬件設備使用狀態(tài)進行風險評估,并對下一年可能存在的問題進行風險預測,對每個設備的狀態(tài)出具使用報告。1.1.7 服務要求1.1.7.1 服務隊伍要求維護團隊擁有強

15、大的技術支持力量,擁有穩(wěn)定的專業(yè)化的技術支持服務隊伍,完善的技術支持服務體系?,F場服務人員負責網絡的監(jiān)控、簡單故障的解決,接聽技術熱線?,F場服務人員按照計劃對現場工作終端、樓層設備、機房及機房設備等進行例行巡檢。技術專家負責重大故障的處理,定期對運行情況進行分析,并提出整改或優(yōu)化方案和建議。1.1.7.2 服務響應(1)日常服務響應時間由于針對本項目采用的駐留現場服務方式,維護團隊需指派駐 3名資深工程師采取同步的作息時間,因此,現場服務的響應時間為及時響應。(2)事故分級響應服務時間各級故障事件的最晚響應時間為:確認時間一級故障事件二級故障事件二級故障事件四級故障事件1小時技術服務人員4小時

16、專業(yè)工程師技術服務人員24小時技術支持專家專業(yè)工程師技術服務人員48小時服務項目經理服務項目經理專業(yè)工程師技術服務人員故障事件等級劃分如下:一級故障事件:現有的網絡或系統停機, 或遭到嚴重攻擊行為或安全事件,對信息系統的業(yè)務運作有重大影響;二級故障事件:現有網絡或系統的操作性能嚴重降級,或由于網絡性能失?;虬踩录乐赜绊懶畔⑾到y用戶業(yè)務運作;三級故障事件:網絡或系統的操作性能受損,安全事件(例如病毒在小范圍內發(fā)作),但大部分業(yè)務運作仍可正常工作;四級故障事件:在網絡、服務器、存儲、安全設備功能、安裝或配置方面需要調整或優(yōu)化。本級故障事件對信息系統的業(yè)務運作幾乎無影響,或影響很小。依據事故重要

17、性和緊急性的原則,每一級事故嚴格定義升級時間為2小時,其中在二級事故和一級事故應急處理過程中,要及時考慮替代恢復方案,盡可能在最短的時間內恢復業(yè)務系統。其中三級事故的處理, 駐場服務人員在事故響應 1個小時內,如果不能快速判斷問題所 在,可以尋求整個服務團隊的支持。在一、二級事故判斷中,服務人員在監(jiān)控中發(fā)現問題,一方面應迅速將問題向部門領導進行反應,一方面須快速判斷問題和收集事故信息,涉及到具體產品提供商或服務商內,及時告知客戶協調相關廠商現場支持。為保障業(yè)務平臺的正常運行, 除對突發(fā)故障的應急支持外,要充分保障日常對業(yè)務系統軟硬件的應急災備恢復預案,并通過定期的演練加強應對突發(fā)事故的意識和流

18、程。1.1.7.3 服務報告維護團隊定期提供服務報告,服務期結束前應提供服務年報,并對每一次重大故障和問題的原因、解決方法、完成情況等形成專門報告,及時報送用戶部門和服務管理部門。在運維服務過程中將產生不限于以下的記錄和報告:? 日常維護報告? 系統巡檢日志? 系統維護記錄? 系統優(yōu)化記錄? 各類優(yōu)化的管理制度? 故障分析處理記錄? 故障整改方案和建議? 交接班登記表? 重大故障記錄報告1.1.7.4 運維保障資源庫建設在運維工作開展前期,把有助于用戶運維的相關資料進行收集整理,以確保在實際運維過程中不會由于缺少溝通或者遺漏部分環(huán)節(jié)導致的問題處理延遲,具體保障資源如下:主機設備相關資料收集:整理各設備相關管理人員聯系方式、設備物理位置等,書面文檔與電子文檔相結合,以確保出現設備故障或需要遠程支持時能在第一時間聯系到具體負責人,及早完成設備故障處理工作。設備操作文檔收集:整理設備有關的操作文檔,并整理成冊,書面文檔與電子文檔相結合,輔助工程師處理相關問題。設備配置庫整理匯總:整理所有設備原始配置資料,整理入庫,且在修改設備配置后及時對錄入的數據進行更新, 以確保設備配置的準確性及安全性。運維知識庫的建立和維護:收集維護過程中出現的各類資料,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論