運維規(guī)章制度及流程_第1頁
運維規(guī)章制度及流程_第2頁
運維規(guī)章制度及流程_第3頁
運維規(guī)章制度及流程_第4頁
運維規(guī)章制度及流程_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、運行維護(hù)管理制度2017年8月目錄1、 總則32、 編制方法 33、 運維工作職責(zé)34、 運維服務(wù)管理體系54.1運維服務(wù)管理對象 64.2運維系統(tǒng)功能框架64.3運維管理組織結(jié)構(gòu) 74.3.1項目負(fù)責(zé)人 84.3.2項目經(jīng)理 84.3.3技術(shù)主管 94.3.4服務(wù)臺 9435網(wǎng)絡(luò)管理員 104.3.5應(yīng)用、數(shù)據(jù)庫管理員 104.3.7終端管理員 114.4運維服務(wù)流程 11441項目運維服務(wù)工作流程圖 442服務(wù)臺124.4.4工單管理錯誤!未定義書簽。4.4.5問題管理4.4.6變更管理4.4.7配置管理4.4.8知識庫管理4.4.9統(tǒng)計及工作報告 5、運維服務(wù)內(nèi)容5.1服務(wù)目標(biāo)5.2資產(chǎn)

2、統(tǒng)計服務(wù)5.3網(wǎng)絡(luò)、安全系統(tǒng)運維服務(wù) 5.4主機(jī)、存儲系統(tǒng)運維服務(wù) 5.5數(shù)據(jù)庫系統(tǒng)運維服務(wù)5.6中間件運維服務(wù)5.7終端、外設(shè)運維服務(wù) -18-6、應(yīng)急服務(wù)響應(yīng)措施6.1應(yīng)急預(yù)案實施基本流程206.2突發(fā)事件應(yīng)急策略207、服務(wù)管理制度規(guī)范 217.1服務(wù)時間 217.2行為規(guī)范 221、總則第一條為保障公司信息系統(tǒng)軟硬件設(shè)備的良好運行,使員工的 運維工作制度化、流程化、規(guī)范化,特制訂本制度。第二條 運維工作總體目標(biāo):立足根本促發(fā)展,開拓運維新局面。 在企業(yè)發(fā)展壯大時期,通過網(wǎng)絡(luò)、桌面、系統(tǒng)等的運維,促進(jìn)企業(yè)穩(wěn) 定可持續(xù)性發(fā)展。第三條 運維管理制度的適用范圍:運維部全體人員。2、編制方法本實

3、施細(xì)則包括運維服務(wù)全生命周期管理方法、管理標(biāo)準(zhǔn) /規(guī)范、 管理模式、管理支撐工具、管理對象以及基于流程的管理方法。本實施細(xì)則以ITIL/IS020000為基礎(chǔ),以信息化項目的運維為目 標(biāo),以管理支撐工具為手段,以流程化、規(guī)范化、標(biāo)準(zhǔn)化管理為方法, 以全生命周期的PDCA循環(huán)為提升途徑,體現(xiàn)了對運維服務(wù)全過程的 體系化管理。3、運維部工作職責(zé)一、負(fù)責(zé)網(wǎng)站運維和技術(shù)支持(一)根據(jù)網(wǎng)站運營戰(zhàn)略和目標(biāo) ,負(fù)責(zé)網(wǎng)站整體架構(gòu)、欄目、應(yīng) 用系統(tǒng)等技術(shù)開發(fā)方案制定和組織開發(fā), 保障網(wǎng)站技術(shù)的穩(wěn)定性和先 進(jìn)性。(二)負(fù)責(zé)網(wǎng)站欄目和應(yīng)用系統(tǒng)的使用培訓(xùn)和操作使用指南編 寫,對用戶使用過程中出現(xiàn)問題的溝通和解決;(三

4、)網(wǎng)站設(shè)備和軟件購買計劃書的擬定,包括采購數(shù)量、品牌 規(guī)格、技術(shù)參數(shù)。會同行政部進(jìn)行采購。(四)網(wǎng)站設(shè)備和軟件操作規(guī)程和應(yīng)用管理制度的制定, 并負(fù)責(zé) 監(jiān)督執(zhí)行。(五)網(wǎng)站設(shè)備和軟件安裝、 調(diào)試和驗收, 使用培訓(xùn)和維修保養(yǎng)。(六)網(wǎng)站日常運行過程中信息安全和技術(shù)問題的協(xié)調(diào)解決, 保 障網(wǎng)站 24 小時安全穩(wěn)定運行。(七)網(wǎng)站技術(shù)服務(wù)外包管理,主要包括技術(shù)外包開發(fā)、運行服 務(wù)托管和空間域名管理。(八)負(fù)責(zé)網(wǎng)站管理系統(tǒng)及設(shè)備保密口令的設(shè)置和保存, 保密口 令設(shè)置后報中心主任備案, 保密口令設(shè)定后任何人不得隨意更改, 保 密口令每季度更新一次。(九)負(fù)責(zé)網(wǎng)站新程序、 新系統(tǒng)和網(wǎng)站改版升級方案技術(shù)的設(shè)計

5、 開發(fā)。二、負(fù)責(zé)網(wǎng)站信息和技術(shù)安全(一) 執(zhí)行國家和省上有關(guān)網(wǎng)絡(luò)信息技術(shù)安全的法律法規(guī), 與通 信管理和網(wǎng)絡(luò)安全監(jiān)管部門聯(lián)絡(luò), 及時處理網(wǎng)站信息技術(shù)安全方面存 在的問題,確保網(wǎng)站安全、穩(wěn)定、可靠運行。(二)網(wǎng)站信息技術(shù)安全保密制度和工作流程的制定, 落實信息 技術(shù)安全保密責(zé)任制,執(zhí)行“誰主管、誰負(fù)責(zé),誰主辦、誰負(fù)責(zé)”的原 則,責(zé)任到人。( 三 ) 在服務(wù)器和計算機(jī)之間設(shè)置硬件防火墻,在服務(wù)器及工作 站上均安裝防病毒軟件, 進(jìn)行硬件和技術(shù)雙保護(hù), 確保網(wǎng)站不受病毒 和黑客攻擊。(四)負(fù)責(zé)網(wǎng)站信息技術(shù)安全應(yīng)急處理預(yù)案制定和實施。(五)安排專人監(jiān)控網(wǎng)站各頻道,各頁面,各版塊,各欄目信息 內(nèi)容,建立網(wǎng)

6、站信息技術(shù)安全監(jiān)控值班登記制度, 發(fā)現(xiàn)問題及時處理, 并登記問題和處理結(jié)果登記;(六)建立多機(jī)備份網(wǎng)站信息服務(wù)系統(tǒng)機(jī)制, 一旦主系統(tǒng)遇到故 障或受到攻擊導(dǎo)致不能正常運行, 可以在最短的時間內(nèi)替換主系統(tǒng)提 供服務(wù)。(七)建立網(wǎng)站系統(tǒng)集中式權(quán)限管理, 按照崗位職責(zé)設(shè)定工作人 員操作權(quán)限,針對不同應(yīng)用系統(tǒng)、終端、操作人員,設(shè)置共享數(shù)據(jù)庫 信息的訪問權(quán)限,并設(shè)置密碼。不同的操作人員設(shè)定不同的用戶名, 且定期更換,嚴(yán)禁操作人員泄漏密碼。4、運維服務(wù)管理體系運維服務(wù)管理體系規(guī)定了運維活動涉及的各類實體,以及這些實 體間的相互關(guān)系。相關(guān)的實體按照運維服務(wù)管理體系進(jìn)行有機(jī)組織, 并協(xié)調(diào)工作,按照服務(wù)協(xié)議要求提

7、供不同級別的IT運維服務(wù)。4.1 運維服務(wù)管理對象運維服務(wù)管理對象包括基礎(chǔ)設(shè)施、應(yīng)用系統(tǒng)、用戶、供應(yīng)商、以及IT運維部門和人員,具體內(nèi)容如下:(1) 基礎(chǔ)設(shè)施包括網(wǎng)絡(luò)、主機(jī)系統(tǒng)、存儲 /備份系統(tǒng)、終端系統(tǒng)、安 全系統(tǒng)、以及機(jī)房動力環(huán)境等。(2) 應(yīng)用系統(tǒng)包括內(nèi)部辦公系統(tǒng)、門戶網(wǎng)站、面向公眾的應(yīng)用系統(tǒng) 等。(3) 用戶包括使用如上應(yīng)用系統(tǒng)的用戶。(4) 供應(yīng)商包括基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的供應(yīng)商以及IT運維服務(wù)的供 應(yīng)商。(5) 運維部門和人員包括內(nèi)部參與運維活動的相關(guān)部門和人員,以 及提供運維服務(wù)的企業(yè)和相關(guān)人員。4.2 運維系統(tǒng)功能框架根據(jù)建設(shè)單位的系統(tǒng)結(jié)構(gòu)和業(yè)務(wù)開展需要,運維項目組將項目的 維護(hù)

8、框架分為 9個具體組成部分,分別為:服務(wù)臺、時間管理。工單 管理、問題管理、變更管理、配置管理、工程師考核、知識庫管理、 統(tǒng)計、系統(tǒng)管理等 9個子項。而具體運維流程將以此為依據(jù)開展工作。4.3 運維管理組織結(jié)構(gòu)本運維項目的運維管理結(jié)構(gòu)位三層模式, 具體如下圖所示。 由項 目負(fù)責(zé)人與甲方進(jìn)行業(yè)務(wù)范圍接洽, 并將溝通結(jié)果向下傳遞。 項目經(jīng) 理負(fù)責(zé)項目的整體運維工作, 包括各種制度的制定和實施。 運維工程 師則在項目經(jīng)理的指導(dǎo)下開展維護(hù)工作。4.3.1 項目負(fù)責(zé)人職責(zé):負(fù)責(zé)項目商務(wù)、整體協(xié)調(diào)事宜。職位描述:1)、整體負(fù)責(zé)建設(shè)單位運維項目服務(wù)計劃的制定,領(lǐng)導(dǎo)項目經(jīng) 理并安排項目工作, 指導(dǎo)項目經(jīng)理完成

9、具體維護(hù)工作, 每周聽取項目 經(jīng)理的工作匯報,負(fù)責(zé)考核項目經(jīng)理工作完成情況。2)、協(xié)助建設(shè)單位完成新增項目的調(diào)研、方案設(shè)計并指導(dǎo)項目經(jīng)理進(jìn)行具體實施4.3.2 項目經(jīng)理職責(zé):規(guī)劃、執(zhí)行、完善信息化項目的運維工作,指導(dǎo)網(wǎng)絡(luò)、數(shù) 據(jù)庫維護(hù)工程師開展工作。職位描述:1、根據(jù)公司戰(zhàn)略目標(biāo),指導(dǎo)下屬工程師開展客戶服務(wù)工作,確 保運維工作能夠滿足客戶的實際需要;2、建立和持續(xù)完善運維管理體系,優(yōu)化運維流程流程,解決運 維服務(wù)中出現(xiàn)的特殊問題;3、規(guī)劃并提升運維工程師專業(yè)服務(wù)能力,在整體上提高客戶滿 意度;4、制定和持續(xù)完善績效考核體系;5、制定整理運維項目的應(yīng)急預(yù)案系統(tǒng), 并指導(dǎo)運維工程師實施;6、提高自

10、身專業(yè)技能,在業(yè)務(wù)方面給予網(wǎng)絡(luò)管理員和數(shù)據(jù)庫管 理員指導(dǎo)。4.3.3 技術(shù)主管職責(zé):應(yīng)用、數(shù)據(jù)庫管理,oracle性能調(diào)優(yōu),實現(xiàn)應(yīng)用負(fù)載均衡(職位描述:1、技術(shù)主管非項目常駐人員,根據(jù)項目需要進(jìn)行專業(yè)方面指導(dǎo);2、負(fù)責(zé)數(shù)據(jù)庫性能分析與調(diào)優(yōu),數(shù)據(jù)庫運行狀態(tài)監(jiān)控,及時發(fā)現(xiàn)異常并快速處理。3、熟練掌握OraclelOG的RAC技術(shù),能夠?qū)崿F(xiàn)部署及調(diào)優(yōu)。4、掌握 WAS、Weblogic、Tomcat、websphere 等中間件的工 作原理,能夠?qū)崿F(xiàn)部署調(diào)優(yōu)及故障解決。5、熟練掌握red-flag、redhat等linux操作系統(tǒng),部署 oracle1Og 、 mysql 數(shù)據(jù)庫。熟練掌握 data

11、guard 技術(shù),保證 oracle數(shù)據(jù)庫冗災(zāi)、數(shù)據(jù)保護(hù)、故障恢復(fù)。6、負(fù)責(zé)應(yīng)用負(fù)載均衡的部署和調(diào)試。7、負(fù)責(zé)指導(dǎo)數(shù)據(jù)庫工程師管理員開展工作。4.3.4 服務(wù)臺職責(zé):故障電話受理,文檔管理。職位描述1 、 負(fù)責(zé)業(yè)務(wù)的救助電話的受理工作;2、故障處理的發(fā)起人,同時進(jìn)行維護(hù)工程師指派,跟蹤事件 處理狀態(tài);3、進(jìn)行維護(hù)故障統(tǒng)計、用戶滿意度統(tǒng)計、工作報表輸出等工 作;4、協(xié)助項目經(jīng)理,進(jìn)行文檔整理、歸類、保存等工作。4.3.5 網(wǎng)絡(luò)管理員職責(zé):維護(hù)建設(shè)單位網(wǎng)絡(luò)系統(tǒng)正常,解決網(wǎng)絡(luò)相關(guān)故障。 職位描述:1、對現(xiàn)有服務(wù)器、局域網(wǎng)絡(luò)及機(jī)房、配線間的日常管理維護(hù);2、對信息安全建設(shè)提出相關(guān)建議,確保網(wǎng)絡(luò)的安全;

12、3、保證外網(wǎng)光纖線路正常,保證局域網(wǎng)運行正常;4、對網(wǎng)絡(luò)系統(tǒng)和網(wǎng)絡(luò)設(shè)備的運行狀態(tài)進(jìn)行監(jiān)控;5、熟練掌握域策略設(shè)置、 DHCP、DNS、FTP 服務(wù)器、 NTFS 權(quán)限設(shè)置等;6、編寫網(wǎng)絡(luò)部分的應(yīng)用處理預(yù)案并實施。7、工作認(rèn)真、細(xì)致,積極主動有條理性,具有良好的溝通能力 及團(tuán)隊合作精神 .4.3.5 應(yīng)用、數(shù)據(jù)庫管理員職責(zé):維護(hù)建設(shè)單位業(yè)務(wù)系統(tǒng)運行正常, 解決應(yīng)用和數(shù)據(jù)庫故障。 職位描述:1、監(jiān)測業(yè)務(wù)系統(tǒng)運行狀況,應(yīng)用、數(shù)據(jù)庫性能監(jiān)視及優(yōu)化,作 必要調(diào)整;2、規(guī)劃不同數(shù)據(jù)的生命周期,制訂備份、恢復(fù)、遷移和災(zāi)備策 略,根據(jù)業(yè)務(wù)的需要執(zhí)行數(shù)據(jù)轉(zhuǎn)換及遷移等操作;3、保證應(yīng)用和數(shù)據(jù)庫系統(tǒng)的安全性、完整性

13、和運行效率。4、負(fù)責(zé)數(shù)據(jù)庫平臺的整體架構(gòu)及解決方案的制定和實施;5、工作認(rèn)真、細(xì)致,積極主動有條理性,具有良好的溝通能力 及團(tuán)隊合作精神 .4.3.7 終端管理員職責(zé):維護(hù)建設(shè)單位桌面系統(tǒng)運行正常,解決終端、外設(shè)故障。職位描述 :1、各部門電腦、打印機(jī)、傳真機(jī)的維護(hù);2、對各部門職員進(jìn)行電腦相關(guān)的技術(shù)支持及培訓(xùn)工作;3、精通Windows XP及Office的使用,能夠熟練使用Excel2003、Excel2007 及以上版本,能夠制作相應(yīng)教程對其他部門員工進(jìn)行培訓(xùn)4.4 運維服務(wù)流程IT 運維服務(wù)管理流程涉及服務(wù)臺、事件管理、問題管理、配置管 理、變更管理、發(fā)布管理、服務(wù)級別管理、財務(wù)管理、

14、能力管理、可 用性管理、服務(wù)持續(xù)性管理、知識管理及供應(yīng)商管理等,隨著運維活 動的不斷深入和持續(xù)改進(jìn),其他流程可能會逐步獨立并規(guī)范。4.4.1 項目運維服務(wù)工作流程圖4.4.2 服務(wù)臺服務(wù)臺是支持運維服務(wù)的核心功能,與各個流程聯(lián)系密切。所有 管理流程都要通過服務(wù)臺為用戶提供單點聯(lián)系, 解答用戶的相關(guān)問題 和需求,或為用戶尋求相應(yīng)的支持人員。在本系統(tǒng)中 ,服務(wù)臺是接收各種來源服務(wù)請求和相關(guān)信息反饋的 唯一入口和出口,同時服務(wù)臺還負(fù)責(zé)一般請求、通過知識庫(歷史事 件)能夠解決的請求;他也是復(fù)雜問題二線處理的橋梁。4.4.3 事件管理事件管理流程的主要目標(biāo)是盡快恢復(fù)服務(wù)提供并減少其對業(yè)務(wù)的 不利影響,

15、 盡可能保證最好的服務(wù)質(zhì)量和可用性等級。 事件管理流程 通常涉及事件的偵測和記錄、 事件的分類和支持、 事件的調(diào)查和診斷、 事件的解決和恢復(fù)以及事件的關(guān)閉。本系統(tǒng)把所有服務(wù)請求和報警歸結(jié)為事件。事件管理是提供服務(wù) 臺和事件管理者對于事件記錄、處理、查詢、審核、派發(fā)等功能。它 也包括通過和第三方監(jiān)控系統(tǒng)對接,把其發(fā)送報警形成事件的功能。4.4.4 工單管理工單管理:工單是現(xiàn)場運維、二線支持的任務(wù)載體,運維工程依 據(jù)所接收工單進(jìn)行運維工作。工單管理是對工單實現(xiàn)創(chuàng)建、變更、查 詢?yōu)g覽、派發(fā)、監(jiān)督等功能的模塊。4.4.5 問題管理問題管理流程的主要目標(biāo)是預(yù)防問題和事故的再次發(fā)生,并將未 能解決的事件的

16、影響降低到最小。 問題管理流程包括診斷事件根本原 因和確定問題解決方案所需要的活動, 通過合適的控制過程, 尤其是 變更管理和發(fā)布管理, 負(fù)責(zé)確保解決方案的實施。 問題管理還將維護(hù) 有關(guān)問題、應(yīng)急方案和解決方案的信息。問題管理是針對已處理事件的遺留問題或處理事件的方案只是治 標(biāo)不治本的不能徹底解決問題而考慮的模塊。 根據(jù)事件、及處理方案, 問題處理人經(jīng)過調(diào)查、診斷并提出最終解決方法。4.4.6 變更管理變更管理實現(xiàn)所有基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)的變更,變更管理應(yīng)記錄 并對所有要求的變更進(jìn)行分類, 應(yīng)評估變更請求的風(fēng)險、 影響和業(yè)務(wù) 收益。其主要目標(biāo)是以對服務(wù)最小的干擾實現(xiàn)有益的變更。變更管理是要對重大

17、資源的新增、變更、升級等運維活動進(jìn)行審 核的功能,以免這些活動對現(xiàn)有資源的可用性造成沒有必要的影響和 破壞;同時,他還要實現(xiàn)在工單中產(chǎn)生的變化進(jìn)行后審計的功能。4.4.7 配置管理配置管理流程負(fù)責(zé)核實基礎(chǔ)設(shè)施和應(yīng)用系統(tǒng)中實施的變更以及配 置項之間的關(guān)系是否已經(jīng)被正確記錄下來; 確保配置管理數(shù)據(jù)庫能夠 準(zhǔn)確地反映現(xiàn)存配置項的實際版本狀態(tài)。配置管理實際上是全部資源的統(tǒng)一管理的功能,包括資源整個生 命周期的參數(shù)或配置的變化記錄的管理。 管理信息主要涉及分類、 型 號、版本、位置,狀態(tài)、相關(guān)資料等基本信息還包括核心參數(shù)等4.4.8 知識庫管理知識庫管理:知識庫是提供給運維人員重要的技術(shù)資料內(nèi)容,他 匯

18、集在工作的遇到的典型案例歸納總結(jié)的知識要點和全面實用資料 手冊。在本系統(tǒng)中,知識庫管理提供便于使用的人機(jī)接口、快速查詢 的技術(shù)手段和維護(hù)手段。4.4.9 統(tǒng)計及工作報告運維管理系統(tǒng)提供一線解決率統(tǒng)計、客戶滿意度統(tǒng)計、按分類的 事件匯總統(tǒng)計、工作報告生成的功能,按照一定格式根據(jù)事件數(shù)據(jù)、 工單數(shù)據(jù)、問題數(shù)據(jù)、配置數(shù)據(jù)、變更數(shù)據(jù)可以幫助運維管理者能把 運維的所做的工作內(nèi)容清晰的羅列出來。5、運維服務(wù)內(nèi)容5.1 服務(wù)目標(biāo)運維項目組提供的運行維護(hù)服務(wù)包括, 信息系統(tǒng)相關(guān)的主機(jī)設(shè)備、 操作系統(tǒng)、 數(shù)據(jù)庫和存儲設(shè)備的運行維護(hù)服務(wù), 保證用戶現(xiàn)有的信息 系統(tǒng)的正常運行, 降低整體管理成本, 提高網(wǎng)絡(luò)信息系統(tǒng)

19、的整體服務(wù) 水平。同時根據(jù)日常維護(hù)的數(shù)據(jù)和記錄, 提供用戶信息系統(tǒng)的整體建 設(shè)規(guī)劃和建議,更好的為用戶的信息化發(fā)展提供有力的保障。用戶信息系統(tǒng)的組成主要可分為兩類:硬件設(shè)備和軟件系統(tǒng)。硬 件設(shè)備包括網(wǎng)絡(luò)設(shè)備、安全設(shè)備、主機(jī)設(shè)備、存儲設(shè)備等;軟件設(shè)備 可分為操作系統(tǒng)軟件、典型應(yīng)用軟件(如:數(shù)據(jù)庫軟件、中間件軟件 等)、業(yè)務(wù)應(yīng)用軟件等。服務(wù)項目范圍覆蓋的信息系統(tǒng)資源以下方面的關(guān)鍵狀態(tài)及參數(shù)指 標(biāo):? 運行狀態(tài)、故障情況? 配置信息? 可用性情況及健康狀況性能指標(biāo)5.2 IT 資產(chǎn)統(tǒng)計服務(wù)服務(wù)內(nèi)容包括:? 硬件設(shè)備型號、數(shù)量、版本等信息統(tǒng)計記錄? 軟件產(chǎn)品型號、版本和補丁等信息統(tǒng)計記錄? 網(wǎng)絡(luò)結(jié)構(gòu)、

20、網(wǎng)絡(luò)路由、網(wǎng)絡(luò) IP 地址統(tǒng)計記錄? 綜合布線系統(tǒng)結(jié)構(gòu)圖的繪制? 其它附屬設(shè)備的統(tǒng)計記錄5.3 網(wǎng)絡(luò)、安全系統(tǒng)運維服務(wù)從網(wǎng)絡(luò)的連通性、網(wǎng)絡(luò)的性能、網(wǎng)絡(luò)的監(jiān)控管理三個方面實現(xiàn)對 網(wǎng)絡(luò)系統(tǒng)的運維管理。? 設(shè)備基礎(chǔ)性能檢測: cpu 、內(nèi)存使用情況監(jiān)測;? 設(shè)備日志查看;? 設(shè)備 snmp 狀態(tài);? 測試 Ping , tracert 等工具的連通性;? 網(wǎng)絡(luò)安全策略應(yīng)用是否正常;? Internet 帶寬流量的實時監(jiān)測;? 網(wǎng)絡(luò)拓?fù)滏溌窢顟B(tài)監(jiān)測;? 異常網(wǎng)絡(luò)數(shù)據(jù)包流量;? Dos 、ddos 等網(wǎng)絡(luò)攻擊情況監(jiān)測;? Internet 線路的誤碼率、丟包率監(jiān)測;5.4 主機(jī)、存儲系統(tǒng)運維服務(wù)提供的主

21、機(jī)、存儲系統(tǒng)的運維服務(wù)包括:主機(jī)、存儲設(shè)備的日常 監(jiān)控,設(shè)備的運行狀態(tài)監(jiān)控,故障處理,操作系統(tǒng)維護(hù),補丁升級等 內(nèi)容。進(jìn)行監(jiān)控管理的內(nèi)容包括:? CPU 性能管理;? 內(nèi)存使用情況管理;? 硬盤利用情況管理;? 系統(tǒng)進(jìn)程管理;? 主機(jī)性能管理;? 實時監(jiān)控主機(jī)電源、風(fēng)扇的使用情況及主機(jī)機(jī)箱內(nèi)部溫度;? 監(jiān)控主機(jī)硬盤運行狀態(tài);? 監(jiān)控主機(jī)網(wǎng)卡、陣列卡等硬件狀態(tài);? 監(jiān)控主機(jī) HA 運行狀況;? 主機(jī)系統(tǒng)文件系統(tǒng)管理;? 監(jiān)控存儲交換機(jī)設(shè)備狀態(tài)、端口狀態(tài)、傳輸速度;? 監(jiān)控備份服務(wù)進(jìn)程、備份情況(起止時間、是否成功、出錯告 警);? 監(jiān)控記錄磁盤陣列、 磁帶庫等存儲硬件故障提示和告警, 并及 時解

22、決故障問題;? 對存儲的性能(如高速緩存、光纖通道等)進(jìn)行監(jiān)控。5.5 數(shù)據(jù)庫系統(tǒng)運維服務(wù)提供的數(shù)據(jù)庫運行維護(hù)服務(wù)是包括主動數(shù)據(jù)庫性能管理,數(shù)據(jù)庫 的主動性能管理對系統(tǒng)運維非常重要。 通過主動式性能管理可了解數(shù) 據(jù)庫的日常運行狀態(tài), 識別數(shù)據(jù)庫的性能問題發(fā)生在什么地方, 有針 對性地進(jìn)行性能優(yōu)化。同時,密切注意數(shù)據(jù)庫系統(tǒng)的變化,主動地預(yù) 防可能發(fā)生的問題。進(jìn)行監(jiān)控管理的內(nèi)容包括:? 數(shù)據(jù)庫基本信息:文件系統(tǒng)、碎片、死鎖、 CPU 占用率較大或時間較長的 SQL 語句。? 表空間使用信息監(jiān)測;? 數(shù)據(jù)庫文件 I/0 讀寫情況;? Session 連接數(shù)量監(jiān)控;? 數(shù)據(jù)庫監(jiān)聽運行狀態(tài)監(jiān)測;? 查看

23、每日數(shù)據(jù)備份、數(shù)據(jù)同步是否正常;? 報警日志監(jiān)測;? 對表和索引進(jìn)行 Analyze, 檢查表空間碎片;? 檢測數(shù)據(jù)庫后臺進(jìn)程;? 數(shù)據(jù)庫對象的空間擴(kuò)展情況監(jiān)測;5.6 中間件運維服務(wù)中間件管理是指對 BEA Weblogic 、tomcat 、MQ 等中間件的日常 維護(hù)管理和監(jiān)控工作, 提高對中間件平臺事件的分析解決能力, 確保 中間件平臺持續(xù)穩(wěn)定運行。 中間件監(jiān)控指標(biāo)包括配置信息管理、 故障 監(jiān)控、性能監(jiān)控。? 執(zhí)行線程:監(jiān)控中間件配置執(zhí)行線程的空閑數(shù)量。? JVM 內(nèi)存: JVM 內(nèi)存曲線正常,能夠及時的進(jìn)行內(nèi)存空間回? JDBC 連接池:連接池的初始容量和最大容量應(yīng)該設(shè)置為相等,并且至

24、少等于執(zhí)行線程的數(shù)量, 以避免在運行過程中創(chuàng)建 數(shù)據(jù)庫連接所帶來的性能消耗。? 檢查中間件日志文件是否有異常報錯? 如果有中間件集群配置,需要檢查集群的配置是否正常。5.7 終端、外設(shè)運維服務(wù)負(fù)責(zé)對終端 PC 、筆記本以及工作站的操作系統(tǒng)、 應(yīng)用軟件和硬件 的維護(hù), 解決使用人員在應(yīng)用過程中遇到的問題并進(jìn)行簡單培訓(xùn), 完 成打印機(jī)等其他外設(shè)的故障處理工作。6、應(yīng)急服務(wù)響應(yīng)措施運維項目組制定了詳盡的應(yīng)急處理預(yù)案,整個流程嚴(yán)謹(jǐn)而有序。 但在服務(wù)維護(hù)過程中, 意外情況將難以完全避免。 我們將對項目實施 的突發(fā)風(fēng)險進(jìn)行詳細(xì)分析, 并且針對各類突發(fā)事件, 設(shè)計了相應(yīng)的預(yù) 防與解決措施,同時提供了完整的應(yīng)急處理流程。6.1應(yīng)急預(yù)案實施基本流程6.2突發(fā)事件應(yīng)急策略(1) 值班人員平時應(yīng)做好應(yīng)急事件的監(jiān)控工作, 對于突發(fā)事件應(yīng) 認(rèn)真分析、準(zhǔn)確判定故障發(fā)生的數(shù)據(jù)域,負(fù)責(zé)跟蹤該事件直至其結(jié)束。 對于不在運維中心的故障,應(yīng)在第一時間內(nèi)通知負(fù)責(zé)人去現(xiàn)場處理, 密切關(guān)注事件流程及進(jìn)展情況,并做好登記工作上報領(lǐng)導(dǎo)。(2) 正常情況下,要求值班人員在10分鐘內(nèi)進(jìn)行事件確認(rèn)。如 果屬于

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論