版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
信息技術(shù)服務(wù)運行維護第4部分:數(shù)據(jù)中心規(guī)范信息技術(shù)服務(wù)運行維護第4部分:數(shù)據(jù)中心規(guī)范1范圍SJ/TXXXXX的本部分規(guī)定了數(shù)據(jù)中心運行維護服務(wù)的對象、服務(wù)策略、交付內(nèi)容等要求。SJ/TXXXXX的本部分適用于規(guī)范供方針對數(shù)據(jù)中心服務(wù)對象提供的運行維護服務(wù)內(nèi)容,也可供需方參考使用。2規(guī)范性引用文件下列文件對于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T22080信息技術(shù)安全技術(shù)信息安全管理體系要求GB/T22081信息技術(shù)安全技術(shù)信息安全管理實用規(guī)則GB/T24405.1-2009信息技術(shù)服務(wù)管理第1部分:規(guī)范SJ/TXXXXX.3信息技術(shù)服務(wù)運行維護第3部分:應(yīng)急響應(yīng)規(guī)范3術(shù)語、定義和縮略語3.1術(shù)語和定義下列術(shù)語和定義適用于本文件。3.1.1
數(shù)據(jù)中心datacenter以信息技術(shù)為支撐,實現(xiàn)應(yīng)用集中處理和數(shù)據(jù)集中存放,提供數(shù)據(jù)的構(gòu)建、交換、集成、共享等信息服務(wù)的基礎(chǔ)環(huán)境。3.1.2
配置管理數(shù)據(jù)庫configurationmanagementdatabase包含每一個配置以及配置項之間重要關(guān)系的詳細(xì)情況的數(shù)據(jù)庫。[GB/T24405.1-2009信息技術(shù)服務(wù)管理-規(guī)范,定義2.5]3.1.3
工作說明書statementofwork合同的重要附件之一,詳細(xì)規(guī)定了合同雙方在合同期內(nèi)應(yīng)完成的工作,如項目范圍、工作描述、進度表、風(fēng)險、需方責(zé)任等。3.1.4
服務(wù)級別協(xié)議serviceLevelagreement服務(wù)提供商與服務(wù)需方之間簽署的記錄了服務(wù)和約定服務(wù)級別的協(xié)議。[GB/T24405.1-2009信息技術(shù)服務(wù)管理-規(guī)范,定義2.13]3.1.5
外部事件externalevents為服務(wù)對象運行提供支撐的、協(xié)議獲得的、不可控、非自主運維的服務(wù)資源(例如互聯(lián)網(wǎng)、市電、租賃的機房等等)中斷引發(fā)的事件。3.1.6
系統(tǒng)事件systemevents在服務(wù)對象范圍內(nèi)的、自主管理或運維的系統(tǒng)資源服務(wù)中斷引發(fā)的事件。3.1.7
安全事件securityevents由于安全邊界破壞、安全措施或安全設(shè)施失效,造成的安全等級下降或信息被非法盜用等需方(數(shù)據(jù)中心)利益被侵害的事件。3.1.8
虛擬資源池Virtualresourcepool指通過使用虛擬化技術(shù)對數(shù)據(jù)中心的計算、存儲、網(wǎng)絡(luò)等物理資源進行虛擬化,通過管理軟件來動態(tài)部署給用戶使用,這些被虛擬化集中管理的資源叫做虛擬資源池VirtualResourcepool。3.1.9
虛擬機virtualmachine指通過軟件模擬的具有完整硬件系統(tǒng)功能的、運行在一個完全隔離環(huán)境中的完整計算機系統(tǒng)。3.1.10
宿主機hypervisor指運行虛擬化軟件,并為虛擬機運行提供環(huán)境的物理機器。3.1.11
電源使用效率
PowerUsageEffectiveness數(shù)據(jù)中心消耗的所有能源與IT負(fù)載使用的能源之比,簡稱PUE。3.2縮略語ACL
訪問控制列表(AccessControlList)
APU
輔助(或備用)電源設(shè)備(AuxiliaryPowerUnits)ATS
自動轉(zhuǎn)換開關(guān)(AutomaticTransferSwitch)CMDB
配置管理數(shù)據(jù)庫(ConfigurationManagementDatabase)CPU
中央處理器(CentralProcessingUnit)HBA
主機總線適配器(HostBusAdapter)IO
輸入/輸出(Input/Output)IOPS
每秒進行讀寫(I/O)操作的次數(shù)(Input/OutputOperationsPerSecond)IP
互聯(lián)網(wǎng)協(xié)議(InternetProtocol)LED
發(fā)光二極管(LightEmittingDiode)PUE
電源使用效率(PowerUsageEffectiveness)QOS
服務(wù)質(zhì)量(QualityOfServices)RAID
廉價冗余磁盤陣列(RedundantArraysofInexpensiveDisks)SAN
存儲區(qū)域網(wǎng)絡(luò)(StorageAreaNetwork)SLA
服務(wù)級別協(xié)議(ServiceLevelAgreement)SOW
工作說明書(StatementOfWork)UPS
不間斷電源(UninterruptedPowerSupply)VDC
虛擬設(shè)備上下文(VirtualDeviceContext)
VLAN
虛擬局域網(wǎng)(VirtualLocalAreaNetwork)
VPC
虛擬端口通道(VirtualPortChannel)
VPN
虛擬專用網(wǎng)(VirtualPrivateNetwork)
VRF
虛擬路由轉(zhuǎn)發(fā)(VirtualRoutingandForwarding)
VSS
虛擬交換系統(tǒng)(VirtualSwitchingSystem)
VSwitch
虛擬交換機(VirtualSwitch)4服務(wù)對象與交付內(nèi)容4.1服務(wù)對象與交付內(nèi)容的對應(yīng)關(guān)系服務(wù)對象和交付內(nèi)容的關(guān)系如圖2所示:圖1服務(wù)對象和交付內(nèi)容的關(guān)系4.2服務(wù)對象根據(jù)數(shù)據(jù)中心的特點,數(shù)據(jù)中心的服務(wù)對象分為機房基礎(chǔ)設(shè)施、物理資源、虛擬資源、平臺資源、應(yīng)用資源和數(shù)據(jù)六類。這六類對象的集合構(gòu)成應(yīng)用系統(tǒng):a)
機房基礎(chǔ)設(shè)施:指確保機房環(huán)境滿足計算機相關(guān)設(shè)備正常運行要求的各類設(shè)施,包括機房電力
系統(tǒng)(供配電系統(tǒng)、UPS系統(tǒng)、發(fā)電機系統(tǒng))、空調(diào)系統(tǒng)(精密空調(diào)系統(tǒng)、新風(fēng)系統(tǒng))、安防系統(tǒng)(防雷接地系統(tǒng)、消防系統(tǒng)、視頻監(jiān)控系統(tǒng)、門禁系統(tǒng))、綜合布線系統(tǒng)等;b)
物理資源(網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備、存儲設(shè)備)1)
網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備:指保持?jǐn)?shù)據(jù)中心內(nèi)部各系統(tǒng)之間、數(shù)據(jù)中心與外部系統(tǒng)連接的網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備,包括內(nèi)部局域網(wǎng)、外部廣域網(wǎng)、互聯(lián)網(wǎng)、網(wǎng)絡(luò)線路(包括專線、撥號網(wǎng)絡(luò)、VPN)和網(wǎng)絡(luò)設(shè)備(包括路由器、交換機、防火墻、入侵檢測、負(fù)載均衡、語音以及通信傳輸設(shè)備等);2)
服務(wù)器設(shè)備:實現(xiàn)各種計算服務(wù)的硬件設(shè)備,包含PC服務(wù)器、小型機和主機等;3)
存儲設(shè)備:實現(xiàn)數(shù)據(jù)存放的各種存儲設(shè)備,包括磁盤陣列和磁帶庫等。c)
虛擬資源(虛擬網(wǎng)絡(luò)資源池、虛擬計算資源池、虛擬存儲資源池)1)
虛擬網(wǎng)絡(luò)資源池:通過各種網(wǎng)絡(luò)虛擬化技術(shù)(如:VLAN、VPN、VDC、VPC、VRF、VSwitch、VSS等),將數(shù)據(jù)中心內(nèi)網(wǎng)絡(luò)設(shè)備進行統(tǒng)一管理和調(diào)度,構(gòu)成網(wǎng)絡(luò)資源池,對業(yè)務(wù)系統(tǒng)需要的網(wǎng)絡(luò)資源進行合理、靈活的分配;2)
虛擬計算資源池:指通過虛擬化技術(shù),將數(shù)據(jù)中心內(nèi)計算設(shè)備進行統(tǒng)一管理和調(diào)度,構(gòu)成計算資源池,對需要不同計算能力的業(yè)務(wù)系統(tǒng)進行合理、靈活的分配;3)
虛擬存儲資源池:通過虛擬化技術(shù),將數(shù)據(jù)中心存儲存儲設(shè)備進行統(tǒng)一管理和調(diào)度,構(gòu)成存儲資源池,對業(yè)務(wù)系統(tǒng)需要的存儲空間容量進行合理、靈活的分配。d)
平臺資源(操作系統(tǒng)、數(shù)據(jù)庫、中間件等):指支持應(yīng)用軟件運行的系統(tǒng)軟件,包括操作系統(tǒng)、
數(shù)據(jù)庫、中間件等;e)
應(yīng)用資源:指實現(xiàn)用戶特定需求的應(yīng)用軟件;f)
數(shù)據(jù):指由應(yīng)用軟件產(chǎn)生、處理、并存儲于數(shù)據(jù)中心的業(yè)務(wù)數(shù)據(jù)。4.3交付內(nèi)容數(shù)據(jù)中心的服務(wù)交付內(nèi)容包括調(diào)研評估、例行操作、響應(yīng)支持和優(yōu)化改善四類,其中:a)
調(diào)研評估服務(wù):根據(jù)需方、服務(wù)相關(guān)方或系統(tǒng)運行的需求,對服務(wù)對象的運行狀況、運行環(huán)境進行現(xiàn)狀調(diào)研、系統(tǒng)分析和評估并提出相應(yīng)的建議和服務(wù)方案;b)
例行操作服務(wù):按照約定條件觸發(fā)或預(yù)先規(guī)定的常態(tài)服務(wù),分為監(jiān)控、預(yù)防性檢查和常規(guī)作業(yè);1)
監(jiān)控:指采用各類工具和技術(shù),對數(shù)據(jù)中心服務(wù)對象的動態(tài)指標(biāo)、靜態(tài)指標(biāo)、運行狀況和發(fā)展趨勢等進行記錄、分析和告警;2)
預(yù)防性檢查:指為保證服務(wù)對象的持續(xù)正常運行,供方根據(jù)服務(wù)對象的監(jiān)控記錄、運行條件和運行狀況進行檢查和趨勢分析,發(fā)現(xiàn)其脆弱性,以便消除或改進;3)
常規(guī)作業(yè):指供方對數(shù)據(jù)中心服務(wù)對象進行的日常維護,包括定期保養(yǎng)、配置備份、數(shù)據(jù)備份、恢復(fù)、定期重啟等活動,以保證服務(wù)對象的穩(wěn)定運行。c)
響應(yīng)支持服務(wù):根據(jù)響應(yīng)的前提不同,分為事件驅(qū)動響應(yīng)、服務(wù)請求響應(yīng)和應(yīng)急響應(yīng);1)
事件驅(qū)動響應(yīng):由于不可預(yù)測原因?qū)е路?wù)對象整體或部分性能下降、功能喪失,觸發(fā)將服務(wù)對象恢復(fù)到正常狀態(tài)的服務(wù)活動。事件驅(qū)動響應(yīng)的處理過程首先應(yīng)爭取在最短的時間內(nèi)恢復(fù)服務(wù)或啟用備份資源,維持服務(wù)的持續(xù)提供,并應(yīng)對事件做出分析、明確誘發(fā)事件的原因和影響的范圍,采取有效的防控措施,減少類似事件的再次發(fā)生。事件驅(qū)動響應(yīng)的觸發(fā)條件包括外部事件、系統(tǒng)事件和安全事件三種;2)
服務(wù)請求響應(yīng):由于需方提出各類服務(wù)請求,引發(fā)的需要針對服務(wù)對象、服務(wù)等級做出調(diào)整或修改的響應(yīng)型服務(wù)。服務(wù)請求響應(yīng)需要根據(jù)總體服務(wù)策略并參考已有的SLA/SOW做出判斷,對服務(wù)的實施進行影響評估,制定詳細(xì)的實施方案和回退措施,并在條件允許的情況下執(zhí)行實施方案和回退方案的測試。變更型響應(yīng)服務(wù)實施完成后,應(yīng)進行總結(jié),確認(rèn)已達(dá)到預(yù)期的目標(biāo)。此類響應(yīng)可能涉及服務(wù)等級變更、服務(wù)范圍變更、技術(shù)資源變更、服務(wù)提供方式變更等;3)
應(yīng)急響應(yīng):指在數(shù)據(jù)中心出現(xiàn)跨越預(yù)定的應(yīng)急響應(yīng)閾值的重大事件、發(fā)生重大自然災(zāi)害、由于政府部門發(fā)出行政指令或需方提出要求時,應(yīng)當(dāng)啟動應(yīng)急處理程序。應(yīng)急響應(yīng)的服務(wù)實施及相關(guān)要求見SJ/TXXXXX.3。d)
優(yōu)化改善服務(wù):包括適應(yīng)性改進、增強性改進和預(yù)防性改進三種類型;1)
適應(yīng)性改進:為保持?jǐn)?shù)據(jù)中心服務(wù)對象在已變化或正在變化的環(huán)境中可持續(xù)運行而實施的改造;2)
增強性改進:根據(jù)數(shù)據(jù)中心的運行需求或由于服務(wù)對象的缺陷,采取相應(yīng)改進措施增強數(shù)據(jù)中心的安全性、可用性和可靠性;3)
預(yù)防性改進:檢測和糾正數(shù)據(jù)中心服務(wù)對象運行過程中潛在的問題或缺陷,以降低系統(tǒng)風(fēng)險,滿足數(shù)據(jù)中心未來可靠運行的需求。5運行維護服務(wù)基本策略5.1總則為保證數(shù)據(jù)中心的業(yè)務(wù)連續(xù)性和信息安全性,應(yīng)制定有效的運行維護策略來保證服務(wù)交付的質(zhì)量,兼顧運行維護過程(及時和規(guī)范)和運行維護結(jié)果(可用和安全),實現(xiàn)“事前防范,風(fēng)險前移;事中控制,快速響應(yīng);事后改進,持續(xù)評估”的持續(xù)改進原則。5.2可用性供方應(yīng)采取適當(dāng)措施,確保按服務(wù)協(xié)議提供長期、持續(xù)的滿足需求的優(yōu)質(zhì)服務(wù),保持服務(wù)對象符合SLA的可用性要求。包括:a)
供方在服務(wù)實施時,應(yīng)建立相關(guān)的作業(yè)流程和響應(yīng)機制,必要時按需方要求制定系統(tǒng)冗余和備份規(guī)范,以滿足需方對可用性的要求;b)
進行合理的人員崗位設(shè)置和職責(zé)定義,應(yīng)保證專人專崗并設(shè)置人員備份;c)
應(yīng)配備具有相應(yīng)能力的人員和必要的工具,并定期進行專業(yè)培訓(xùn),以提高服務(wù)可用性。人員能力具體要求見附錄A;d)
應(yīng)選擇適用的運行維護技術(shù),以保證服務(wù)的可用性;e)
根據(jù)運行維護服務(wù)級別要求,必要時應(yīng)建立體系架構(gòu)的關(guān)鍵健康檢查點,并配備相應(yīng)的運行維護工具,以保證服務(wù)水平。運行維護工具等級見附錄B;f)
供方應(yīng)根據(jù)服務(wù)要求配備足夠的資源,避免由于資源的缺失導(dǎo)致對服務(wù)的可用性帶來影響。5.3安全性服務(wù)的供、需雙方應(yīng)采取各種安全手段或措施,有效控制數(shù)據(jù)中心運行維護服務(wù)的各個環(huán)節(jié),保護數(shù)據(jù)中心運行維護服務(wù)中的物理安全、網(wǎng)絡(luò)安全、系統(tǒng)安全、應(yīng)用安全和數(shù)據(jù)安全。包括:a)
建立適當(dāng)?shù)男畔踩芾頇C制,以規(guī)范數(shù)據(jù)中心運行維護服務(wù)人員的信息安全行為。信息安全管理可參照GB/T22080、GB/T22081等標(biāo)準(zhǔn)的有關(guān)規(guī)定執(zhí)行;b)
應(yīng)對數(shù)據(jù)中心運行維護服務(wù)人員采取有效的信息安全管理措施,如進行人員背景調(diào)查、簽訂安全保密協(xié)議等;c)
應(yīng)對數(shù)據(jù)中心運行維護服務(wù)人員進行相關(guān)安全管理及安全要求培訓(xùn),并進行適當(dāng)?shù)臋z查,以確保服務(wù)人員了解并遵守數(shù)據(jù)中心安全、保密相關(guān)規(guī)定;d)
應(yīng)充分關(guān)注數(shù)據(jù)中心業(yè)務(wù)安全需求,結(jié)合信息安全技術(shù)與管理標(biāo)準(zhǔn),進行適當(dāng)?shù)陌踩u估,提供相應(yīng)的安全建議,并對服務(wù)對象進行適當(dāng)?shù)谋O(jiān)控和保護;e)
應(yīng)對數(shù)據(jù)中心安全進行監(jiān)控、分析,把安全風(fēng)險控制在可接受范圍內(nèi),防止安全事件發(fā)生;f)
應(yīng)建立有效的安全通報機制,以及時通報安全事件相關(guān)情況和相應(yīng)防范處理措施等。5.4及時性供方應(yīng)采取適當(dāng)?shù)氖侄未_保提供滿足SLA時間指標(biāo)要求的運行維護服務(wù)。包括:a)
對事件、問題、變更建立明確的分級策略,并與服務(wù)窗口時間、響應(yīng)時間等指標(biāo)相匹配;b)
建立可確保滿足需方要求的溝通聯(lián)絡(luò)機制,保持溝通渠道通暢,以實現(xiàn)對服務(wù)需求的及時響應(yīng);c)
建立有效的服務(wù)資源調(diào)度機制及與服務(wù)相關(guān)方的協(xié)同機制,配置必要的備品備件,以提供及時的服務(wù)保障;d)
特殊時間段(如法定節(jié)假日或重大事件等),應(yīng)提升響應(yīng)級別,提供必要的現(xiàn)場支持;e)
建立有效機制,周期性對事件級別定義進行更新,以確保定義準(zhǔn)確有效。5.5規(guī)范性供方應(yīng)建立適當(dāng)?shù)姆?wù)管理流程、服務(wù)活動指導(dǎo)文件或?qū)嵤┮?guī)則,以保證服務(wù)過程的規(guī)范運作。包括:a)
建立有效的服務(wù)管理流程文件,以保證服務(wù)過程實施規(guī)范性;b)
建立或遵循需方的數(shù)據(jù)中心相關(guān)管理制度,如出入場管理制度、安??刂浦贫鹊龋籧)
對于例行操作服務(wù),應(yīng)制定詳細(xì)、可操作的技術(shù)手冊,以降低操作風(fēng)險;d)
對于非例行操作服務(wù)(響應(yīng)支持、優(yōu)化改善、調(diào)研評估),應(yīng)在實施前,制定詳細(xì)的實施方案,并進行風(fēng)險評估及分析,采取相應(yīng)的風(fēng)險規(guī)避措施和回退手段;e)
在服務(wù)過程中進行的任何活動,應(yīng)建立服務(wù)檔案,可形成服務(wù)報告(見附錄C),保留完整的服務(wù)記錄。6運行維護交付內(nèi)容6.1機房基礎(chǔ)設(shè)施6.1.1服務(wù)對象服務(wù)對象包括空調(diào)系統(tǒng)(精密空調(diào)系統(tǒng)、新風(fēng)系統(tǒng))、電力系統(tǒng)(供配電系統(tǒng)、UPS系統(tǒng)、發(fā)電機系統(tǒng))、安防系統(tǒng)(防雷接地系統(tǒng)、消防系統(tǒng)、視頻監(jiān)控系統(tǒng)和門禁系統(tǒng))以及綜合布線系統(tǒng)。6.1.2調(diào)研評估機房基礎(chǔ)設(shè)施調(diào)研評估服務(wù)內(nèi)容包含但不限于:a)
空調(diào)系統(tǒng)(精密空調(diào)系統(tǒng)、新風(fēng)系統(tǒng)):機房環(huán)境指標(biāo)分析及改進建議、機房熱點分析及布置改進建議、機房送風(fēng)、回風(fēng)方式改進建議,新風(fēng)風(fēng)量、風(fēng)壓指標(biāo)分析及改進建議;輔助制冷單元配置建議等;b)
電力系統(tǒng)(供配電系統(tǒng)、UPS系統(tǒng)、發(fā)電機系統(tǒng)):機柜供電分析及改進建議、機房回路調(diào)整分析調(diào)整建議、機房擴容建議等;發(fā)電機負(fù)荷分析及調(diào)整建議等;UPS運行分析及擴容建議,超過設(shè)計使用壽命的電池更換建議、整流直流電容、逆變交流電容等;c)
安防系統(tǒng)(防雷接地系統(tǒng)、消防系統(tǒng)、視頻監(jiān)控系統(tǒng)和門禁系統(tǒng)):防雷接地系統(tǒng)分析及改進建議、消防系統(tǒng)現(xiàn)狀分析和改進建議(按照當(dāng)?shù)叵拦芾聿块T管理要求)、視頻監(jiān)控系統(tǒng)的分析和改進建議、門禁系統(tǒng)的分析和改進建議等;d)
綜合布線系統(tǒng)等:光纖、銅纜容量、使用效率分析;應(yīng)用環(huán)境及性能分析;數(shù)量、路由改進或擴容建議;級別提升建議等。e)
機房電源使用效率:通過對機房PUE連續(xù)監(jiān)測分析,提供機房能效改進建議,包括但不限于:空調(diào)系統(tǒng)優(yōu)化(消除機房熱點、冷熱通道遏制、改善送回風(fēng)、使用節(jié)能型設(shè)備等)、電力系統(tǒng)優(yōu)化(回路優(yōu)化、使用節(jié)能型設(shè)備等)、實施容量管理(對機柜的電力容量、制冷容量及空間容量進行統(tǒng)籌管理,以充分利用資源)等。6.1.3例行操作機房基礎(chǔ)設(shè)施的例行操作服務(wù)包括:監(jiān)控、預(yù)防性檢查、常規(guī)作業(yè)。6.1.3.1監(jiān)控對機房基礎(chǔ)設(shè)施的監(jiān)控內(nèi)容參見表1,包括但不限于:表1機房基礎(chǔ)設(shè)施監(jiān)控內(nèi)容表服務(wù)對象監(jiān)控內(nèi)容空調(diào)系統(tǒng)(精密空調(diào)系統(tǒng)、新風(fēng)系統(tǒng))環(huán)境溫度、環(huán)境濕度、出風(fēng)溫度、回風(fēng)溫度,告警情況等電力系統(tǒng)(供配電系統(tǒng)、UPS系統(tǒng)、發(fā)電機系統(tǒng))供配電系統(tǒng):電流、電壓、功率因數(shù)、有功功率、無功功率、諧波等發(fā)電機:啟停情況、電流、電壓、負(fù)載率、控制系統(tǒng)供電情況等UPS:輸入電流電壓、輸出電流電壓、頻率、負(fù)載率、溫度、報警情況、電池充電/放電電壓等電源使用效率:PUE值(通過監(jiān)控軟件監(jiān)測或計算得出)安防系統(tǒng)(防雷接地系統(tǒng)、消防系統(tǒng)、視頻監(jiān)控系統(tǒng)和門禁系統(tǒng))防雷接地系統(tǒng):浪涌保護器、避雷器狀態(tài)等消防系統(tǒng):消防控制系統(tǒng)狀態(tài)、氣體滅火鋼瓶壓力、滅火器有效期檢查視頻監(jiān)控系統(tǒng):告警情況、監(jiān)控錄像等門禁系統(tǒng):門禁狀態(tài)、告警情況6.1.3.2預(yù)防性檢查應(yīng)在監(jiān)控服務(wù)的基礎(chǔ)上對機房基礎(chǔ)設(shè)施進行預(yù)防性檢查。包括:性能檢查和脆弱性檢查。機房基礎(chǔ)設(shè)施預(yù)防性檢查內(nèi)容參見表2,包括但不限于:表2機房基礎(chǔ)設(shè)施預(yù)防性檢查內(nèi)容表服務(wù)對象性能檢查內(nèi)容脆弱性檢查內(nèi)容空調(diào)系統(tǒng)精密空調(diào)高壓壓力、低壓壓力(風(fēng)冷系統(tǒng)),冷凍水壓力、溫度,冷卻水壓力、溫度(水冷系統(tǒng)),風(fēng)機運行情況,灰塵情況等機房熱點情況、室內(nèi)機漏水檢查、室外風(fēng)機運轉(zhuǎn)情況、加濕罐陽極棒檢查、過濾網(wǎng)檢查等新風(fēng)系統(tǒng)風(fēng)機運行情況、風(fēng)速,預(yù)處理系統(tǒng)工作狀態(tài),上下水情況等過濾網(wǎng)檢查、風(fēng)壓差檢查電力系統(tǒng)配電系統(tǒng)接地電阻、零序電流、器件發(fā)熱情況等導(dǎo)線、器件發(fā)熱情況,防浪涌器件情況等發(fā)電機轉(zhuǎn)速、發(fā)熱情況等油位,吸氣、排煙通道等UPS系統(tǒng)器件發(fā)熱情況、電池情況(外觀、非免維護電池檢查液位、接線柱)、檢查通風(fēng)情況(風(fēng)扇、入氣口、出氣口)等器件、導(dǎo)線發(fā)熱情況,電池放電時間、通風(fēng)情況等安防系統(tǒng)防雷接地系統(tǒng)接地電阻測試引下線檢查、接地匯接排檢查消防系統(tǒng)鋼瓶壓力、有效期、探頭污染等啟動瓶、管道開關(guān)、氣體壓力等視頻監(jiān)控系統(tǒng)畫面清晰度(不同照度情況下)、錄像硬盤(磁帶)容量、云臺運行等監(jiān)控系統(tǒng)運行狀態(tài)、監(jiān)控死角問題等門禁系統(tǒng)服務(wù)器、控制器、讀卡器、門磁等工作狀態(tài)門禁系統(tǒng)與消防系統(tǒng)和視頻監(jiān)控系統(tǒng)的聯(lián)動檢查(如果有此功能),異常情況報警檢查綜合布線系統(tǒng)光纖、銅纜鏈路測試,性能測試等線纜兩端應(yīng)貼有識別標(biāo)簽,標(biāo)志要與實際拓?fù)鋱D完全一致6.1.3.3常規(guī)作業(yè)機房基礎(chǔ)設(shè)施的常規(guī)作業(yè)包括基礎(chǔ)類操作、測試類操作和數(shù)據(jù)類操作,其中:a)
基礎(chǔ)類操作:按服務(wù)管理手冊的有關(guān)規(guī)定,執(zhí)行設(shè)備的日常運行、維護和保養(yǎng);b)
測試類操作:按服務(wù)管理手冊的有關(guān)規(guī)定,對機房基礎(chǔ)設(shè)施各系統(tǒng)功能、性能進行測試;c)
數(shù)據(jù)類操作:按事先規(guī)定的程序,對機房基礎(chǔ)設(shè)施運行日志、記錄等數(shù)據(jù)進行操作。機房基礎(chǔ)設(shè)施常規(guī)作業(yè)內(nèi)容參見表3,包括但不限于:表3機房基礎(chǔ)設(shè)施常規(guī)作業(yè)內(nèi)容表服務(wù)對象基礎(chǔ)類操作測試類操作數(shù)據(jù)類操作空調(diào)系統(tǒng)精密空調(diào)啟停機、清洗更換濾網(wǎng)、清洗更換加濕系統(tǒng)、清潔冷凝器等漏水報警測試、周期性主備切換/應(yīng)急演練等運行日志備份,報警記錄備份、清除等新風(fēng)系統(tǒng)啟停機、清洗更換濾網(wǎng)等消防聯(lián)動測試運行記錄備份(如果有)電力系統(tǒng)配電系統(tǒng)除塵、合閘、分閘等互投測試等運行記錄備份發(fā)電機更換三濾、清潔等空載測試、帶載測試、切換演練等運行日志備份,報警記錄備份、清除等UPS系統(tǒng)旁路、清潔等旁路測試、電池放電測試、周期性主備切換/應(yīng)急演練等運行日志備份,報警記錄備份、清除等安防系統(tǒng)防雷接地系統(tǒng)接地端子、匯流排緊固,浪涌、防雷保護器復(fù)原等接地電阻測試運行記錄備份(如果有)消防系統(tǒng)探頭清洗等啟動測試、探頭測試等報警記錄備份、清除視頻監(jiān)控系統(tǒng)視頻監(jiān)控頭清潔,云臺保養(yǎng)器件靈敏度、畫面清晰度(不同照度情況下)、云臺運行等出入記錄導(dǎo)出、備份,監(jiān)控圖像記錄備份、清除,報警記錄備份、清除等門禁系統(tǒng)門禁授權(quán)等門禁系統(tǒng)與消防系統(tǒng)和視頻監(jiān)控系統(tǒng)的聯(lián)動檢查測試(如果有此功能),掉電測試運行日志備份,報警記錄備份、清除等綜合布線系統(tǒng)線路跳接等鏈路測試、性能測試布線系統(tǒng)拓?fù)鋱D數(shù)據(jù)更新6.1.4響應(yīng)支持6.1.4.1事件驅(qū)動響應(yīng)針對設(shè)備的軟、硬件故障引起的業(yè)務(wù)中斷或運行效率無法滿足正常運行要求,而進行的響應(yīng)服務(wù),包括但不限于:a)
空調(diào)系統(tǒng):故障排查、關(guān)閉部分機組以維持機房最低溫濕度指標(biāo)、關(guān)閉新風(fēng)系統(tǒng)等;b)
電力系統(tǒng):配電系統(tǒng)包括故障排查、投入備用電源回路、關(guān)閉非重要回路等;發(fā)電機系統(tǒng)包括故障排查、啟動發(fā)電機、油料補充等;UPS系統(tǒng)包括故障排查、旁路系統(tǒng)、關(guān)閉非重要輸出等;c)
安防系統(tǒng):防雷接地系統(tǒng)包括浪涌保護器復(fù)原、更換,接地電阻降阻等;消防系統(tǒng)包括故障排查、系統(tǒng)啟動、報警聯(lián)動、疏散警示等;視頻監(jiān)控系統(tǒng)包括故障排查、監(jiān)控頭或硬盤更換、檢查告警、數(shù)據(jù)恢復(fù)等;門禁系統(tǒng)包括故障排查、手動開啟或關(guān)閉門禁系統(tǒng)、檢查告警或監(jiān)控記錄等;d)
綜合布線系統(tǒng):線纜更換等。6.1.4.2服務(wù)請求響應(yīng)根據(jù)應(yīng)用系統(tǒng)運行需要或需方、服務(wù)相關(guān)方的請求,而進行的響應(yīng)服務(wù),包括但不限于:a)
空調(diào)系統(tǒng):調(diào)整溫度、濕度參數(shù)等,調(diào)整新風(fēng)量等;b)
電力系統(tǒng):配電系統(tǒng)包括增減回路、增減供電類型(如直流、110V)等;分支回路相位調(diào)整等;發(fā)電機為指定負(fù)載供電等;UPS系統(tǒng)包括旁路操作、為指定負(fù)載供電等;c)
安防系統(tǒng):防雷接地系統(tǒng)包括新設(shè)備接地等;消防系統(tǒng)包括增減終端設(shè)備、檢查及提供告警及監(jiān)控記錄、備份或清除記錄等;視頻監(jiān)控系統(tǒng)包括調(diào)整攝像機位置、增加攝像機,增加錄像機容量等;門禁系統(tǒng)包括增加、刪減、變更門禁權(quán)限等;d)
綜合布線系統(tǒng):鏈路跳接、跳線更換,布線擴容等。6.1.5優(yōu)化改善6.1.5.1適應(yīng)性改進根據(jù)應(yīng)用系統(tǒng)特點和運行需求,對機房基礎(chǔ)設(shè)施進行調(diào)整,包括但不限于:a)
空調(diào)系統(tǒng):調(diào)整溫濕度參數(shù)等、調(diào)整機組位置、增減新風(fēng)風(fēng)量等;b)
電力系統(tǒng):配電系統(tǒng)包括更換開關(guān)、導(dǎo)線以適配負(fù)載容量等,發(fā)電機包括調(diào)整啟動方式等;c)
安防系統(tǒng):調(diào)整防雷接地系統(tǒng)、消防系統(tǒng)、視頻監(jiān)控系統(tǒng)和門禁系統(tǒng),以適應(yīng)應(yīng)用系統(tǒng)的變化;d)
綜合布線系統(tǒng):調(diào)整綜合布線系統(tǒng),以適應(yīng)應(yīng)用系統(tǒng)的變化。6.1.5.2增強性改進根據(jù)應(yīng)用系統(tǒng)的特點和運行需求,通過對機房基礎(chǔ)設(shè)施的運行記錄、趨勢的分析,對機房基礎(chǔ)設(shè)施進行調(diào)整、擴容或升級,包括但不限于:a)
空調(diào)系統(tǒng):增減精密空調(diào)機組、增減APU單元,增加新風(fēng)機組、預(yù)處理裝置等;b)
電力系統(tǒng):配電系統(tǒng)包括增加回路、增加ATS設(shè)備等;UPS系統(tǒng)包括增加主機數(shù)量、增加電池數(shù)量等;c)
安防系統(tǒng):防雷接地系統(tǒng)包括增加冗余引下線、接地裝置,降低接地電阻阻值等;消防系統(tǒng)包括增加傳感器和噴頭數(shù)量,更換高性能控制主機;視頻監(jiān)控和門禁系統(tǒng)包括增加報警聯(lián)動、增加終端數(shù)量、增加存儲容量等;d)
綜合布線系統(tǒng):線路擴容、更換高性能布線等。6.1.5.3預(yù)防性改進根據(jù)對機房基礎(chǔ)設(shè)施的運行記錄、趨勢的分析,結(jié)合應(yīng)用系統(tǒng)的需求,發(fā)現(xiàn)機房基礎(chǔ)設(shè)施的脆弱點,有針對性地進行改進性作業(yè),包括但不限于:a)
空調(diào)系統(tǒng):調(diào)整機組位置,調(diào)整出回風(fēng)方式等;b)
電力系統(tǒng):配電系統(tǒng)包括更換開關(guān)、更換導(dǎo)線、調(diào)整回路等;發(fā)電機包括更換或添加高標(biāo)號油料等;c)
安防系統(tǒng):防雷接地系統(tǒng)包括焊接點加固、防腐處理等;消防系統(tǒng)包括消防系統(tǒng)預(yù)防性改進(按照當(dāng)?shù)叵拦芾聿块T管理要求);視頻監(jiān)控和門禁系統(tǒng)包括門禁系統(tǒng)支持與消防系統(tǒng)和視頻監(jiān)控系統(tǒng)的聯(lián)動;d)
綜合布線系統(tǒng):弱電線纜與強電線纜的物理隔離,鼠患排查等。6.2物理資源6.2.1服務(wù)對象服務(wù)對象包括1)網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備;2)PC服務(wù)器、小型機等服務(wù)器;3)磁盤陣列、磁帶庫等存儲設(shè)備。6.2.2調(diào)研評估通過對物理資源的運行記錄、運行趨勢進行分析,根據(jù)應(yīng)用系統(tǒng)的特點和運行需求,提出物理資源的改進建議和方案,調(diào)研評估服務(wù)包括但不限于:a)
網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備調(diào)研評估1)
(整體或局部)網(wǎng)絡(luò)實際負(fù)荷與承載能力分析;2)
(整體或局部)網(wǎng)絡(luò)預(yù)期負(fù)荷與承載能力分析與建議;3)
(整體或局部)網(wǎng)絡(luò)架構(gòu)分析與建議;4)
(整體或局部)網(wǎng)絡(luò)路由策略分析與建議;5)
(整體或局部)網(wǎng)絡(luò)安全策略分析與建議;6)
(整體或局部)網(wǎng)絡(luò)配置調(diào)優(yōu)分析與建議等。b)
服務(wù)器調(diào)研評估1)
服務(wù)器負(fù)載情況分析;2)
服務(wù)器安全策略分析;3)
服務(wù)器的高可用性分析;4)
服務(wù)器性能分析及調(diào)整建議。c)
存儲調(diào)研評估1)
存儲的負(fù)載情況分析;2)
存儲的空間使用分析;3)
存儲的性能及調(diào)整建議;4)
存儲的鏈路連接分析;5)
存儲的高可用性分析。6.2.3例行操作6.2.3.1監(jiān)控重點是對物理資源(網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備、服務(wù)器設(shè)備、存儲設(shè)備)的運行狀態(tài)、運行性能、資源分配使用情況進行監(jiān)控,以便了解其是否滿足運行要求。監(jiān)控應(yīng)當(dāng)采用合適的裝備與手段,分配專門人員定期或全時段進行監(jiān)控。監(jiān)控內(nèi)容參見表4,包括但不限于:表4物理資源監(jiān)控內(nèi)容表服務(wù)對象監(jiān)控內(nèi)容網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備網(wǎng)絡(luò)設(shè)備的健康狀況、整體運行狀態(tài)、各項硬件資源開銷狀況鏈路健康狀況如端到端時延變化、鏈路端口工作穩(wěn)定性、鏈路負(fù)載百分比、部署路由策略情況下端到端選路變化、路由條目變化管理權(quán)限用戶的行為審計設(shè)備軟件配置變動審計設(shè)備日志審計安全事件審計服務(wù)器服務(wù)器整體運行狀態(tài)服務(wù)器電源工作狀態(tài)服務(wù)器CPU工作狀態(tài)服務(wù)器內(nèi)存工作狀態(tài)服務(wù)器硬盤工作狀態(tài)服務(wù)器網(wǎng)絡(luò)端口工作狀態(tài)存儲存儲設(shè)備控制器工作狀態(tài)存儲設(shè)備電源工作狀態(tài)存儲設(shè)備數(shù)據(jù)存儲介質(zhì)工作狀態(tài)存儲設(shè)備接口卡工作狀態(tài)存儲設(shè)備數(shù)據(jù)存儲介質(zhì)空間使用情況存儲設(shè)備讀寫速率情況存儲設(shè)備讀寫命中率情況6.2.3.2預(yù)防性檢查在監(jiān)控服務(wù)的基礎(chǔ)上,對物理資源(網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲)進行預(yù)防性檢查。包括:性能檢查、脆弱性檢查。物理資源(網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲)預(yù)防性檢查內(nèi)容參見表5,包括但不限于:表5物理資源預(yù)防性檢查內(nèi)容表服務(wù)對象性能檢查內(nèi)容脆弱性檢查內(nèi)容網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備設(shè)備機身、板卡或模塊的工作情況CPU使用峰值情況內(nèi)存使用峰值情況主要端口的利用率鏈路的健康狀態(tài),包括IP包傳輸時延、IP包丟失率、IP包誤差率、無效IP包(包括攻擊性IP包、欺騙性IP包、垃圾IP包等)檢查其它的關(guān)鍵指標(biāo)項,例如各類關(guān)鍵表項、會話連接數(shù)等是否需要升級系統(tǒng)微碼設(shè)備鏈路的冗余度要求安全事件周期性整理分析設(shè)備生命周期評估備件可用性周期性檢查服務(wù)器服務(wù)器的資源分配情況和策略CPU使用峰值情況內(nèi)存使用峰值情況文件系統(tǒng)空間使用情況IO讀寫情況網(wǎng)絡(luò)流量情況等與存儲的鏈路性能測試服務(wù)器資源分配是否超過預(yù)定閥值服務(wù)器關(guān)鍵部件是否滿足運行冗余度要求服務(wù)器關(guān)鍵部件的微碼版本是否需要升級服務(wù)器關(guān)鍵部件鏈路的冗余度要求服務(wù)器硬盤是否RAID保護服務(wù)器文件空間使用是否達(dá)到預(yù)定閥值存儲IO讀寫速率情況讀、寫緩存分配比例情況數(shù)據(jù)讀、寫命中率情況存儲硬盤空間使用情況存儲系統(tǒng)日志情況磁帶讀取和寫入速率情況磁帶池使用情況存儲關(guān)鍵硬件部件是否滿足運行冗余度要求當(dāng)前微碼版本是否需要升級存儲配置備份機制是否完善存儲管理軟件是否需要升級或打補丁存儲空間使用比例是否達(dá)到預(yù)定告警閥值存儲設(shè)備的離線記錄檢查存儲介質(zhì)的壞塊記錄檢查6.2.3.3常規(guī)作業(yè)物理資源(網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備、服務(wù)器、存儲)的常規(guī)作業(yè)內(nèi)容參見表6,包括但不限于:表6物理資源常規(guī)作業(yè)內(nèi)容表服務(wù)對象常規(guī)作業(yè)內(nèi)容網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備設(shè)備操作系統(tǒng)軟件備份及存檔系統(tǒng)微碼升級設(shè)備軟件配置備份及存檔監(jiān)控系統(tǒng)日志備份及存檔監(jiān)控系統(tǒng)日志數(shù)據(jù)分析與報告生成網(wǎng)絡(luò)配置變更文件的審核網(wǎng)絡(luò)配置變更的操作網(wǎng)絡(luò)配置變更的記錄周期性關(guān)鍵設(shè)備主備切換/應(yīng)急演練服務(wù)器系統(tǒng)微碼升級配置文件備份過期日志和文件系統(tǒng)空間清理服務(wù)器硬盤RAID配置檢查(如有RAID控制器)更換控制器電池(如有RAID控制器)存儲系統(tǒng)微碼升級更換控制器電池介質(zhì)讀、寫正常性測試配置文件備份過期運行日志清理端口訪問測試6.2.4響應(yīng)支持6.2.4.1事件驅(qū)動響應(yīng)針對物理資源的故障引起的業(yè)務(wù)中斷或運行效率無法滿足正常運行要求,而進行的響應(yīng)服務(wù),包括但不限于:a)
網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備事件驅(qū)動響應(yīng)1)
故障定位;2)
停止、啟動進程;3)
中斷、連通網(wǎng)絡(luò)連接;4)
關(guān)閉、啟動端口;5)
網(wǎng)絡(luò)備件更換;6)
更改、恢復(fù)配置。b)
服務(wù)器事件驅(qū)動響應(yīng)1)
服務(wù)器重啟;2)
更換故障部件,包括主板、電源、CPU、內(nèi)存、硬盤等;3)
服務(wù)器關(guān)鍵部件微碼升級;4)
服務(wù)器硬盤RAID配置修復(fù)。c)
存儲事件驅(qū)動響應(yīng)1)
存儲重啟;2)
配置文件恢復(fù);3)
更換故障部件,包括電源、硬盤等;4)
微碼升級;5)
存儲管理軟件補丁安裝;6)
數(shù)據(jù)修復(fù)。6.2.4.2服務(wù)請求響應(yīng)根據(jù)應(yīng)用系統(tǒng)運行需要或需方、服務(wù)相關(guān)方的請求,而進行的響應(yīng)服務(wù),包括但不限于:a)
網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備服務(wù)請求響應(yīng)1)
增加、降低網(wǎng)絡(luò)接入的數(shù)量或速度;2)
更改網(wǎng)絡(luò)設(shè)備配置;3)
啟動、關(guān)閉端口或服務(wù);4)
更換、更新或升級設(shè)備硬件或軟件。b)
服務(wù)器服務(wù)請求響應(yīng)1)
服務(wù)器設(shè)備搬遷;2)
服務(wù)器設(shè)備停機演練;3)
服務(wù)器設(shè)備清潔維護等。c)
存儲服務(wù)請求響應(yīng)1)
存儲設(shè)備搬遷;2)
存儲設(shè)備停機演練;3)
存儲設(shè)備清潔維護;4)
存儲硬盤空間擴容;5)
存儲結(jié)構(gòu)調(diào)整;6)
新增主機分配存儲空間;7)
主機端多路徑軟件的安裝配置。6.2.5優(yōu)化改善6.2.5.1適應(yīng)性改進根據(jù)應(yīng)用系統(tǒng)特點和運行需求,對物理資源進行調(diào)整,包括但不限于:a)
網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備適應(yīng)性改進1)
路由策略調(diào)整;2)
設(shè)備或鏈路負(fù)載調(diào)整;3)
安全策略調(diào)整;4)
監(jiān)控對象覆蓋范圍調(diào)整;5)
局部交換優(yōu)化;6)
局部冗余優(yōu)化。b)
服務(wù)器適應(yīng)性改進1)
服務(wù)器硬盤RAID配置調(diào)整;2)
服務(wù)器網(wǎng)絡(luò)、光纖鏈路冗余調(diào)整;3)
服務(wù)器電源供電接入冗余調(diào)整。c)
存儲適應(yīng)性改進1)
存儲設(shè)備讀寫Cache比例調(diào)整;2)
存儲設(shè)備RAID保護級別調(diào)整;3)
存儲設(shè)備新增硬盤,包括新增磁盤擴展柜;4)
存儲設(shè)備邏輯盤的容量調(diào)整;5)
存儲設(shè)備分配主機的調(diào)整;6)
光纖交換機ZONE規(guī)劃調(diào)整。6.2.5.2增強性改進根據(jù)應(yīng)用系統(tǒng)的特點和運行需求,通過對物理資源的運行記錄、趨勢的分析,對物理資源進行調(diào)整、擴容或升級,包括但不限于:a)
網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備增強性改進1)
硬件容量變化,如網(wǎng)絡(luò)設(shè)備硬件、軟件升級、帶寬升級等;2)
整體網(wǎng)絡(luò)架構(gòu)變動;3)
網(wǎng)絡(luò)架構(gòu)容量變化,如網(wǎng)絡(luò)子系統(tǒng)的增減等;4)
系統(tǒng)功能變化,如新增功能區(qū)、新增安全系統(tǒng)、新增審計系統(tǒng)等;5)
路由協(xié)議應(yīng)用及部署調(diào)整;6)
整體安全策略收緊;7)
交換優(yōu)化;8)
冗余優(yōu)化。b)
服務(wù)器增強性改進1)
為本服務(wù)器從存儲系統(tǒng)上分配更大空間;2)
服務(wù)器CPU個數(shù)增加;3)
服務(wù)器內(nèi)存容量增加;4)
服務(wù)器磁盤空間擴容;5)
服務(wù)器網(wǎng)卡和HBA接口卡增加等。c)
存儲增強性改進1)
存儲設(shè)備控制器、硬盤等部件的微碼升級;2)
存儲設(shè)備新增硬盤擴容,包括新增磁盤擴展柜;3)
存儲設(shè)備Cache容量增加;4)
存儲設(shè)備光纖模塊的升級;5)
光纖交換機的光纖模塊升級;6)
存儲設(shè)備管理軟件的版本升級。6.2.5.3預(yù)防性改進根據(jù)對物理資源的運行記錄、趨勢的分析,結(jié)合應(yīng)用系統(tǒng)的需求,發(fā)現(xiàn)物理資源的脆弱點及潛在的隱患,有針對性地進行改進性作業(yè),包括但不限于:a)
網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備預(yù)防性改進1)
配置參數(shù)優(yōu)化,例如關(guān)閉不必要的服務(wù)、打開缺省的增強功能、加快三層網(wǎng)絡(luò)路由收斂速度、加快二層網(wǎng)絡(luò)生成樹收斂速度等;2)
安全優(yōu)化,例如密碼加密,TELNET控制等;3)
提高軟件配置命令可讀性。b)
服務(wù)器預(yù)防性改進1)
檢查服務(wù)器硬盤RAID配置,及時修復(fù)或更換故障硬盤;2)
增加服務(wù)器網(wǎng)卡、光纖卡以及鏈路冗余情況;3)
增加服務(wù)器電源供電模塊冗余。c)
存儲預(yù)防性改進1)
收集磁盤空間的使用情況,及時清理垃圾數(shù)據(jù)或增加存儲設(shè)備容量;2)
查看存儲控制器電池的使用情況,及時更換新的電池;3)
檢查存儲設(shè)備的電源是否老化,及時更換新的電源;4)
查看存儲設(shè)備的讀寫性能,適時調(diào)整存儲控制器的Cache容量。6.3虛擬資源6.3.1服務(wù)對象服務(wù)對象包括虛擬網(wǎng)絡(luò)資源、虛擬計算資源、虛擬存儲資源。其中虛擬網(wǎng)絡(luò)資源含虛擬網(wǎng)卡、虛擬網(wǎng)絡(luò)設(shè)備、虛擬鏈路、虛擬機網(wǎng)絡(luò)和網(wǎng)絡(luò)設(shè)備等;虛擬計算資源包括虛擬機、虛擬機宿主機、虛擬計算資源池(ResourcePool)集群等;虛擬存儲資源包括虛擬存儲卷、存儲資源池、服務(wù)控制器等。6.3.2調(diào)研評估通過對虛擬資源的運行記錄、運行趨勢進行分析,根據(jù)應(yīng)用系統(tǒng)的特點和運行需求,提出物理設(shè)備、虛擬資源的改進建議和方案,調(diào)研評估服務(wù)包括但不限于:a)
(整體或局部)虛擬資源實際負(fù)荷與承載能力分析;b)
(整體或局部)虛擬資源預(yù)期負(fù)荷與承載能力分析與建議;c)
(整體或局部)虛擬資源架構(gòu)分析與建議;d)
(整體或局部)虛擬資源安全策略分析與建議;e)
(整體或局部)虛擬資源配置調(diào)優(yōu)分析與建議等。6.3.3例行操作6.3.3.1監(jiān)控對虛擬資源的監(jiān)控內(nèi)容參見表7,包括但不限于:表7虛擬資源監(jiān)控內(nèi)容表服務(wù)對象監(jiān)控內(nèi)容虛擬網(wǎng)絡(luò)資源虛擬網(wǎng)絡(luò)資源池分配狀況虛擬網(wǎng)絡(luò)資源的健康狀態(tài)虛擬網(wǎng)絡(luò)資源的鏈路狀況如端到端時延變化、鏈路端口工作穩(wěn)定性、鏈路負(fù)載百分比虛擬網(wǎng)絡(luò)資源配置變動虛擬網(wǎng)絡(luò)資源操作日志虛擬網(wǎng)絡(luò)資源安全事件虛擬計算資源虛擬計算資源池資源分配狀況虛擬機宿主機及虛擬機CPU負(fù)荷虛擬機宿主機及虛擬機磁盤IO負(fù)荷虛擬機宿主機及虛擬機內(nèi)存負(fù)荷虛擬機宿主機及虛擬機網(wǎng)絡(luò)IO負(fù)荷虛擬機宿主機及虛擬機網(wǎng)絡(luò)鏈路狀態(tài)虛擬機宿主機及虛擬機服務(wù)進程虛擬機宿主機及虛擬機計算資源分配虛擬機宿主機及虛擬機系統(tǒng)日志異常虛擬存儲資源虛擬存儲資源池分配策略與空間使用狀況服務(wù)控制器CPU負(fù)載情況服務(wù)控制器內(nèi)存消耗情況服務(wù)控制器整體數(shù)據(jù)吞吐帶寬、IOPS、響應(yīng)時間和請求隊列時間服務(wù)控制器后端數(shù)據(jù)吞吐帶寬、IOPS、響應(yīng)時間和請求隊列時間服務(wù)控制器Cache利用情況虛擬存儲卷訪問吞吐率、IOPS、響應(yīng)時間和請求隊列時間仲裁控制點(磁盤、光纖鏈路、服務(wù)器等)健康性服務(wù)控制器前后端IO鏈路服務(wù)控制器后端分布式物理存儲健康性服務(wù)控制器各服務(wù)網(wǎng)絡(luò)端口監(jiān)聽情況服務(wù)控制器服務(wù)進程的運行狀態(tài)服務(wù)控制器日志6.3.3.2預(yù)防性檢查應(yīng)在監(jiān)控服務(wù)的基礎(chǔ)上,對虛擬資源進行預(yù)防性檢查。包括:性能檢查、脆弱性檢查。對虛擬資源的預(yù)防性檢查內(nèi)容參見表8,包括但不限于:表8虛擬資源預(yù)防性檢查內(nèi)容表服務(wù)對象性能檢查內(nèi)容脆弱性檢查內(nèi)容虛擬網(wǎng)絡(luò)資源虛擬網(wǎng)絡(luò)的資源分配情況虛擬網(wǎng)絡(luò)資源健康狀態(tài)虛擬網(wǎng)絡(luò)資源CPU使用峰值情況虛擬網(wǎng)絡(luò)資源內(nèi)存使用峰值情況虛擬網(wǎng)絡(luò)資源端口的吞吐率虛擬網(wǎng)絡(luò)資源鏈路的健康狀況,包括IP包傳輸延時、IP包丟失率、IP包誤差率、無效IP包(包括攻擊性IP包、欺騙性IP包、垃圾IP包等)虛擬網(wǎng)絡(luò)資源的鏈路冗余度要求虛擬網(wǎng)絡(luò)資源使用度和調(diào)度情況評估虛擬網(wǎng)絡(luò)資源可用性周期性檢查虛擬網(wǎng)絡(luò)資源安全事件周期性整理分析虛擬計算資源虛擬計算資源的資源分配情況計算資源池的資源分配情況與分配策略虛擬機宿主機及虛擬機CPU使用峰值情況虛擬機宿主機及虛擬機內(nèi)存使用峰值情況虛擬機宿主機及虛擬機文件系統(tǒng)空間使用情況虛擬機宿主機及虛擬機IO讀寫情況虛擬機宿主機及虛擬機網(wǎng)絡(luò)流量情況等
物理服務(wù)器關(guān)鍵硬件部件是否存在故障計算資源池資源分配是否超過預(yù)定閥值當(dāng)前虛擬機宿主機版本是否安裝相關(guān)風(fēng)險補丁虛擬機宿主機服務(wù)進程的健康狀態(tài)虛擬機宿主機文件空間使用是否達(dá)到預(yù)定閥值虛擬機宿主機系統(tǒng)數(shù)據(jù)安全防護設(shè)置是否滿足要求虛擬計算資源安全隔離有效性虛擬存儲資源存儲資源池分配策略與空間使用率服務(wù)控制器的數(shù)據(jù)吞吐帶寬、IOPS、響應(yīng)時間和請求排隊時間虛擬存儲卷訪問吞吐率、IOPS、響應(yīng)時間和請求隊列時間各服務(wù)控制器Cache利用率,做為后端存儲優(yōu)化依據(jù)虛擬存儲卷后端存儲的性能匹配服務(wù)控制器日志用戶請求的錯誤率所有服務(wù)所接受的請求錯誤率服務(wù)控制器冗余度服務(wù)仲裁控制點健康性服務(wù)控制器微碼版本存儲資源池分配策略避免過度分配控制器存儲虛擬化軟件版本一致性虛擬存儲資源授權(quán)的全局性和統(tǒng)一性數(shù)據(jù)副本數(shù)數(shù)據(jù)保存的出錯率數(shù)據(jù)傳輸?shù)某鲥e率數(shù)據(jù)副本的一致性統(tǒng)計數(shù)據(jù)恢復(fù)的時間6.3.3.3常規(guī)作業(yè)虛擬資源的常規(guī)作業(yè)內(nèi)容參見表9,包括但不限于:表9虛擬資源常規(guī)作業(yè)內(nèi)容表服務(wù)對象常規(guī)作業(yè)內(nèi)容虛擬網(wǎng)絡(luò)資源虛擬網(wǎng)絡(luò)資源的分配與回收虛擬網(wǎng)絡(luò)資源配置備份及存檔監(jiān)控虛擬網(wǎng)絡(luò)資源日志備份及分析虛擬網(wǎng)絡(luò)資源日志數(shù)據(jù)分析與報告生成虛擬網(wǎng)絡(luò)資源配置變更文件的審核虛擬網(wǎng)絡(luò)資源配置變更的操作虛擬網(wǎng)絡(luò)資源配置變更的記錄虛擬計算資源虛擬計算資源的分配與回收虛擬計算資源池擴容與配置更改虛擬機模板的創(chuàng)建、存儲、部署、維護虛擬機映像的設(shè)計、創(chuàng)建、存儲、部署、維護、銷毀虛擬化軟件升級及許可管理虛擬機遷移與腳本維護虛擬機備份、克隆與恢復(fù)表9虛擬資源常規(guī)作業(yè)內(nèi)容表(續(xù))
虛擬機創(chuàng)建及啟動、停止、刪除、回收、轉(zhuǎn)換虛擬計算資源日志文件備份和分析虛擬計算資源的訪問控制與權(quán)限管理可靠性計劃制定與演習(xí)虛擬存儲資源虛擬存儲資源的分配與回收SAN拓?fù)洌丝?,Zone配置維護服務(wù)控制器配置備份和恢復(fù)虛擬存儲資源映射配置存儲資源池容量配置制定和實施異構(gòu)存儲資源池數(shù)據(jù)快照,鏡像,容災(zāi)計劃存儲資源池內(nèi)數(shù)據(jù)在線遷移數(shù)據(jù)分層管理數(shù)據(jù)副本數(shù)管理資源使用情況統(tǒng)計用戶使用情況統(tǒng)計服務(wù)控制器微碼升級存儲虛擬化軟件版本升級日志文件分析和備份6.3.4響應(yīng)支持6.3.4.1事件驅(qū)動響應(yīng)針對虛擬資源及所依賴的硬件故障引起的業(yè)務(wù)中斷或運行效率無法滿足正常運行要求,而進行的響應(yīng)服務(wù),包括但不限于:a)
故障定位;b)
虛擬資源重新調(diào)配、緊急遷移、緊急擴容;c)
解決虛擬資源所依賴的物理資源故障和缺陷,包括:服務(wù)器、網(wǎng)絡(luò)及網(wǎng)絡(luò)設(shè)備、存儲、仲裁控制點(磁盤、光纖鏈路、服務(wù)器等)等;d)
虛擬資源緊急操作,如更換、中斷、連通網(wǎng)絡(luò)連接、關(guān)閉、啟動端口、更改、恢復(fù)配置、停止及啟動進程、重啟等。6.3.4.2服務(wù)請求響應(yīng)根據(jù)應(yīng)用系統(tǒng)運行需要或需方、服務(wù)相關(guān)方的請求,而進行的響應(yīng)服務(wù),包括但不限于:a)
虛擬機、配置信息、數(shù)據(jù)的備份與恢復(fù);b)
虛擬機遷移、回收、變更;c)
虛擬資源池的容災(zāi)、高可用配置、計劃實施與演練;d)
數(shù)據(jù)統(tǒng)一存儲;e)
數(shù)據(jù)訪問性能優(yōu)化;f)
數(shù)據(jù)在線遷移與分級存儲;g)
新增主機分配存儲空間;h)
現(xiàn)有主機存儲空間調(diào)整;i)
主機端多路徑軟件的安裝配置;j)
虛擬資源池的擴容、調(diào)配、變更;k)
增加、降低虛擬網(wǎng)絡(luò)資源網(wǎng)絡(luò)接入數(shù)量或速率;l)
更改虛擬網(wǎng)絡(luò)資源配置;m)
啟動、關(guān)閉端口或服務(wù);n)
更換、更新或升級虛擬網(wǎng)絡(luò)資源硬件或軟件。6.3.5優(yōu)化改善6.3.5.1適應(yīng)性改進根據(jù)應(yīng)用系統(tǒng)特點和運行需求,對虛擬資源進行調(diào)整,包括但不限于:a)
虛擬網(wǎng)絡(luò)設(shè)備或鏈路負(fù)載調(diào)整;b)
虛擬網(wǎng)絡(luò)安全策略調(diào)整;c)
虛擬網(wǎng)絡(luò)監(jiān)控對象覆蓋范圍調(diào)整;d)
虛擬網(wǎng)絡(luò)路由策略調(diào)整;e)
虛擬網(wǎng)絡(luò)交換及冗余優(yōu)化;f)
虛擬網(wǎng)絡(luò)資源調(diào)配;g)
虛擬機計算資源CPU、內(nèi)存容量、硬盤容量、網(wǎng)絡(luò)的調(diào)整;h)
虛擬機計算資源遷移;i)
虛擬化計算資源調(diào)度的算法;j)
虛擬存儲服務(wù)控制器前后端網(wǎng)絡(luò)(SAN或IP)端口吞吐速率的調(diào)整;k)
根據(jù)數(shù)據(jù)生命周期,進行存儲資源分層調(diào)整;l)
數(shù)據(jù)存儲平衡算法調(diào)整;m)
虛擬存儲卷保留份數(shù)調(diào)整;n)
虛擬存儲卷鏡像復(fù)制級別調(diào)整。6.3.5.2增加性改進根據(jù)應(yīng)用系統(tǒng)的特點和運行需求以及數(shù)據(jù)量處理能力要求,通過對虛擬資源的運行記錄、趨勢的分析,對虛擬資源進行調(diào)整、擴容或升級,包括但不限于:a)
虛擬網(wǎng)絡(luò)資源調(diào)整,如CPU、內(nèi)存、端口的調(diào)配、擴容回收;b)
虛擬網(wǎng)絡(luò)資源網(wǎng)絡(luò)架構(gòu)變動;c)
虛擬網(wǎng)絡(luò)架構(gòu)容量變化,如網(wǎng)絡(luò)子系統(tǒng)的增減等;d)
虛擬網(wǎng)絡(luò)系統(tǒng)功能變化,如新增安全系統(tǒng)、新增審計系統(tǒng)等;e)
虛擬網(wǎng)絡(luò)路由協(xié)議應(yīng)用及部署調(diào)整;f)
虛擬網(wǎng)絡(luò)整體安全策略收緊;g)
虛擬網(wǎng)絡(luò)資源冗余優(yōu)化;h)
虛擬計算資源宿主機服務(wù)器和虛擬機計算能力擴容;i)
虛擬計算資源宿主機服務(wù)器和虛擬機內(nèi)存擴容;j)
虛擬計算資源宿主機服務(wù)器和虛擬機網(wǎng)絡(luò)吞吐能力擴容;k)
虛擬計算資源高可用性增強與演練;l)
虛擬計算資源容錯機制增強與演練;m)
虛擬計算資源備份恢復(fù)測試;n)
虛擬存儲服務(wù)控制器節(jié)點數(shù)量增加;o)
虛擬存儲服務(wù)控制器內(nèi)存容量增加;p)
虛擬存儲服務(wù)控制器CPU性能增強;q)
虛擬存儲服務(wù)控制器前后端網(wǎng)絡(luò)(SAN或IP)端口增加;r)
虛擬存儲服務(wù)控制器后端分布式物理存儲的Cache、容量等增加;s)
虛擬存儲服務(wù)控制器微碼升級;t)
存儲虛擬化軟件升級。6.3.5.3預(yù)防性改進根據(jù)對虛擬資源的運行記錄、趨勢的分析,結(jié)合應(yīng)用系統(tǒng)的需求,發(fā)現(xiàn)虛擬資源的脆弱點及潛在的隱患,有針對性地進行改進性作業(yè),包括但不限于:a)
虛擬網(wǎng)絡(luò)配置參數(shù)優(yōu)化,例如虛擬網(wǎng)絡(luò)資源的VLAN、QoS、ACL、帶寬等;b)
虛擬網(wǎng)絡(luò)部署路由策略情況下端到端選路變化、端口流量變化、路由條目變化;c)
根據(jù)系統(tǒng)監(jiān)控得到的信息替換可能存在問題的內(nèi)存,CPU,硬盤,網(wǎng)絡(luò)設(shè)備等;d)
根據(jù)系統(tǒng)的壓力增長趨勢主動對物理服務(wù)器的數(shù)量進行必要的擴容;e)
根據(jù)系統(tǒng)的發(fā)展趨勢對網(wǎng)絡(luò)系統(tǒng)采取必要的擴容;f)
收集存儲資源池空間的使用情況,及時清理垃圾數(shù)據(jù)或增加存儲資源池的容量;g)
監(jiān)控服務(wù)控制器的負(fù)載情況,必要時增加硬件數(shù)量,或提高硬件規(guī)格;h)
監(jiān)控服務(wù)控制器的硬件出錯率,替換存在問題的硬件;i)
監(jiān)控服務(wù)控制器后端分布式物理存儲的硬件出錯率,替換存在問題的硬件;j)
監(jiān)控仲裁控制點(磁盤、光纖鏈路、服務(wù)器等)的運行情況;k)
服務(wù)控制器微碼升級;l)
存儲虛擬化軟件升級。6.4平臺資源6.4.1服務(wù)對象服務(wù)對象包括操作系統(tǒng)、數(shù)據(jù)庫、中間件等系統(tǒng)軟件。6.4.2調(diào)研評估通過對平臺資源軟件的運行記錄、運行趨勢進行分析,根據(jù)應(yīng)用系統(tǒng)的特點和運行需求,提出處理或改進的建議和方案。6.4.3例行操作6.4.3.1監(jiān)控重點是對平臺資源(操作系統(tǒng)、數(shù)據(jù)庫、中間件等)的運行狀態(tài)、運行性能、資源使用分配情況進行監(jiān)控,以便了解其是否滿足運行要求。監(jiān)控應(yīng)當(dāng)采用合適的裝備與手段,分配專門人員定期或全時段進行監(jiān)控。對平臺資源的監(jiān)控內(nèi)容參見表10,包括但不限于:表10平臺資源監(jiān)控內(nèi)容表服務(wù)對象監(jiān)控內(nèi)容操作系統(tǒng)操作系統(tǒng)CPU使用情況操作系統(tǒng)內(nèi)存使用情況操作系統(tǒng)磁盤使用情況操作系統(tǒng)網(wǎng)絡(luò)端口狀態(tài)和流量操作系統(tǒng)光纖端口狀態(tài)和流量操作系統(tǒng)重要文件系統(tǒng)空間使用情況操作系統(tǒng)日志情況數(shù)據(jù)庫數(shù)據(jù)庫主要進程運行情況數(shù)據(jù)庫連接是否正常數(shù)據(jù)庫表空間使用情況數(shù)據(jù)庫日志是否有異常數(shù)據(jù)庫日常備份是否正常等中間件中間件運行狀態(tài)主要進程運行狀態(tài)應(yīng)用服務(wù)運行情況中間件通信網(wǎng)絡(luò)連接情況中間件日志是否有報錯信息6.4.3.2預(yù)防性檢查應(yīng)在監(jiān)控服務(wù)的基礎(chǔ)上,對平臺資源(數(shù)據(jù)庫、中間件等)進行預(yù)防性檢查。包括:性能檢查、脆弱性檢查。對數(shù)據(jù)庫的預(yù)防性檢查內(nèi)容參見表11,包括但不限于:表11平臺資源預(yù)防性檢查內(nèi)容表服務(wù)對象性能檢查內(nèi)容脆弱性檢查內(nèi)容操作系統(tǒng)操作系統(tǒng)CPU使用峰值情況操作系統(tǒng)內(nèi)存使用峰值情況操作系統(tǒng)硬盤使用情況操作系統(tǒng)重要文件系統(tǒng)空間使用情況操作系統(tǒng)IO讀寫情況數(shù)據(jù)流網(wǎng)絡(luò)流量情況等當(dāng)前操作系統(tǒng)版本是否安裝相關(guān)風(fēng)險補丁是否需要升級系統(tǒng)微碼是否關(guān)閉不必要的服務(wù)進程重要業(yè)務(wù)數(shù)據(jù)文件或操作系統(tǒng)文件空間使用是否達(dá)到預(yù)定閥值關(guān)鍵機密系統(tǒng)數(shù)據(jù)安全防護設(shè)置是否滿足要求系統(tǒng)使用資源是否超過預(yù)定閥值數(shù)據(jù)庫數(shù)據(jù)庫的TOPSQL情況(如果數(shù)據(jù)庫支持)數(shù)據(jù)庫CPU使用情況數(shù)據(jù)庫內(nèi)存使用情況數(shù)據(jù)庫表空間使用情況數(shù)據(jù)庫鎖情況數(shù)據(jù)庫會話數(shù)和操作系統(tǒng)進程數(shù)情況數(shù)據(jù)庫BUFFER等命中率情況數(shù)據(jù)庫等待事件情況(如果數(shù)據(jù)庫支持)當(dāng)前數(shù)據(jù)庫版本是否安裝相關(guān)風(fēng)險補丁表空間的使用是否達(dá)到了預(yù)定閥值數(shù)據(jù)庫關(guān)鍵文件是否做了鏡像數(shù)據(jù)庫備份策略是否合理數(shù)據(jù)庫是否存在異常用戶(如果數(shù)據(jù)庫支持)中間件中間件服務(wù)器業(yè)務(wù)CPU使用峰值情況中間件服務(wù)器業(yè)務(wù)內(nèi)存使用峰值情況中間件服務(wù)器業(yè)務(wù)會話連接數(shù)情況中間件是否滿足運行冗余度要求當(dāng)前中間件版本是否安裝相關(guān)風(fēng)險補丁中間件的數(shù)據(jù)庫連接密碼配置文件是否存在明碼相關(guān)重要運行程序是否有保留備份操作系統(tǒng)配置是否符合中間件運行的要求系統(tǒng)使用資源是否超過預(yù)定閥值等6.4.3.3常規(guī)作業(yè)對平臺資源(數(shù)據(jù)庫、中間件)的常規(guī)作業(yè)內(nèi)容參見表12,包括但不限于:表12平臺資源常規(guī)作業(yè)內(nèi)容表服務(wù)對象常規(guī)作業(yè)內(nèi)容操作系統(tǒng)操作系統(tǒng)版本升級操作系統(tǒng)磁盤讀、寫正常性測試操作系統(tǒng)輸入、輸出設(shè)備讀寫測試(光驅(qū)、內(nèi)置磁帶機)操作系統(tǒng)配置文件備份操作系統(tǒng)備份操作系統(tǒng)過期運行日志清理網(wǎng)絡(luò)通信正常性測試操作系統(tǒng)臨時文件清理操作系統(tǒng)端口訪問測試周期性關(guān)鍵設(shè)備主備切換/應(yīng)急演練數(shù)據(jù)庫偵聽連接正常性測試數(shù)據(jù)庫正常登陸測試SQL執(zhí)行正常性測試表空間正常訪問測試表讀寫正常性測試客戶端連接測試數(shù)據(jù)庫備份過期歸檔日志清除中間件備份配置文件備份重要運行日志清除過期日志交易連接正常性測試6.4.4響應(yīng)支持6.4.4.1事件驅(qū)動響應(yīng)針對設(shè)備的軟、硬件故障、誤操作等引起的業(yè)務(wù)中斷或運行效率無法滿足正常運行要求,而進行的響應(yīng)服務(wù)。包括但不限于:a)
操作系統(tǒng)事件驅(qū)動響應(yīng):1)
操作系統(tǒng)損壞;2)
操作系統(tǒng)CPU、內(nèi)存等資源耗盡;3)
操作系統(tǒng)服務(wù)進程無效;4)
操作系統(tǒng)文件系統(tǒng)空間不夠;5)
操作系統(tǒng)網(wǎng)口無法通訊;6)
操作系統(tǒng)無法識別外置存儲空間。b)
數(shù)據(jù)庫事件驅(qū)動響應(yīng):1)
數(shù)據(jù)文件壞塊修復(fù);2)
數(shù)據(jù)庫重啟;3)
網(wǎng)絡(luò)偵聽重啟;4)
數(shù)據(jù)庫備份恢復(fù);5)
數(shù)據(jù)庫解鎖。c)
中間件事件響應(yīng)驅(qū)動:1)
程序恢復(fù);2)
應(yīng)用服務(wù)重啟;3)
配置文件恢復(fù);4)
守護服務(wù)調(diào)整。6.4.4.2服務(wù)請求響應(yīng)根據(jù)應(yīng)用系統(tǒng)運行需要或需方、服務(wù)相關(guān)方的請求,而進行的響應(yīng)服務(wù)。包括但不限于:a)
操作系統(tǒng)服務(wù)請求響應(yīng):1)
操作系統(tǒng)版本升級;2)
操作系統(tǒng)死機修復(fù);3)
操作系統(tǒng)文件系統(tǒng)損壞修復(fù);4)
操作系統(tǒng)文件系統(tǒng)空間擴容;5)
操作系統(tǒng)IP地址修改;6)
操作系統(tǒng)參數(shù)調(diào)整;7)
操作系統(tǒng)日志清理。b)
數(shù)據(jù)庫服務(wù)請求響應(yīng):1)
數(shù)據(jù)庫版本升級;2)
數(shù)據(jù)庫災(zāi)難恢復(fù);3)
數(shù)據(jù)清理和維護。c)
中間件服務(wù)請求響應(yīng):1)
中間件服務(wù)器更換;2)
中間件參數(shù)調(diào)整;3)
中間件軟件版本升級。6.4.5優(yōu)化改善6.4.5.1適應(yīng)性改進根據(jù)應(yīng)用系統(tǒng)特點和運行需求,分析平臺資源軟件的運行情況,調(diào)整平臺資源軟件不合理的初始容量配置、參數(shù)配置等,以滿足應(yīng)用系統(tǒng)的運行需求,包括但不限于:a)
操作系統(tǒng)適應(yīng)性改進:1)
操作系統(tǒng)交換區(qū)容量調(diào)整;2)
操作系統(tǒng)內(nèi)核參數(shù)調(diào)整;3)
操作系統(tǒng)文件系統(tǒng)使用空間調(diào)整劃分;4)
操作系統(tǒng)IP地址調(diào)整。b)
數(shù)據(jù)庫適應(yīng)性改進:1)
數(shù)據(jù)庫資源使用調(diào)整;2)
數(shù)據(jù)庫執(zhí)行SQL計劃調(diào)整;3)
數(shù)據(jù)表參數(shù)調(diào)整;4)
數(shù)據(jù)庫對象的調(diào)整;5)
主機操作系統(tǒng)內(nèi)核參數(shù)調(diào)整;6)
數(shù)據(jù)庫參數(shù)調(diào)整;7)
臨時表空間、用戶表空間調(diào)整;8)
數(shù)據(jù)庫物理部署的調(diào)整(遷移至新服務(wù)器或者數(shù)據(jù)庫存儲陣列調(diào)整);9)
調(diào)整數(shù)據(jù)庫備份策略。c)
中間件適應(yīng)性改進:1)
中間件參數(shù)配置優(yōu)化;2)
數(shù)據(jù)庫連接參數(shù)調(diào)整;3)
連接池參數(shù)調(diào)整;4)
相關(guān)操作系統(tǒng)參數(shù)調(diào)整。6.4.5.2增強性改進根據(jù)應(yīng)用系統(tǒng)的特點和運行需求,通過對平臺資源軟件的運行記錄、趨勢的分析,對平臺資源軟件進行調(diào)整、擴容或升級,包括但不限于:a)
操作系統(tǒng)增強性改進:1)
操作系統(tǒng)版本升級;2)
操作系統(tǒng)內(nèi)容擴容;3)
操作系統(tǒng)磁盤空間擴容;4)
操作系統(tǒng)增加網(wǎng)卡、光纖卡數(shù)量;5)
操作系統(tǒng)參數(shù)調(diào)優(yōu)。b)
數(shù)據(jù)庫增強性改進:1)
數(shù)據(jù)庫版本升級、打補丁;2)
由于主機CPU個數(shù)、內(nèi)存容量增加調(diào)整數(shù)據(jù)庫相應(yīng)的參數(shù);3)
由于主機存儲的增加調(diào)整數(shù)據(jù)庫表空間容量;4)
數(shù)據(jù)庫安全備份架構(gòu)構(gòu)建以提高可用性;5)
數(shù)據(jù)庫調(diào)優(yōu)等。c)
中間件增強性改進:1)
中間件版本升級、打補丁;2)
由于主機CPU個數(shù)、內(nèi)存容量增加調(diào)整中間件相應(yīng)的參數(shù)。6.4.5.3預(yù)防性改進根據(jù)對平臺資源軟件的運行記錄、趨勢的分析,結(jié)合應(yīng)用系統(tǒng)的需求,發(fā)現(xiàn)資源平臺軟件存在的脆弱點,有針對性地進行改進性作業(yè),包括但不限于:a)
操作系統(tǒng)預(yù)防性改進:1)
操作系統(tǒng)刪除垃圾數(shù)據(jù),釋放數(shù)據(jù)空間;2)
操作系統(tǒng)文件系統(tǒng)擴容;3)
操作系統(tǒng)增加網(wǎng)卡、光纖卡冗余;4)
操作系統(tǒng)用戶權(quán)限合理分配;5)
操作系統(tǒng)服務(wù)端口調(diào)整。b)
數(shù)據(jù)庫預(yù)防性改進:1)
增加數(shù)據(jù)庫表空間數(shù)據(jù)文件空間使用范圍;2)
對數(shù)據(jù)庫存在的無效對象處理;3)
數(shù)據(jù)庫用戶的權(quán)限合理分配。c)
中間件預(yù)防性改進:1)
刪除臨時文件,釋放數(shù)據(jù)空間;2)
監(jiān)控主要參數(shù)以及時調(diào)優(yōu);3)
應(yīng)用備份策略調(diào)整;4)
定期備份。6.5應(yīng)用資源6.5.1服務(wù)對象服務(wù)對象是應(yīng)用資源。6.5.2調(diào)研評估通過對應(yīng)用資源的運行記錄、運行趨勢進行分析,根據(jù)應(yīng)用系統(tǒng)的特點和運行需求,提出處理或改進的建議和方案。6.5.3例行操作6.5.3.1監(jiān)控對應(yīng)用資源的監(jiān)控內(nèi)容參見表13,包括但不限于:表13應(yīng)用資源監(jiān)控內(nèi)容表服務(wù)對象監(jiān)控內(nèi)容應(yīng)用資源應(yīng)用的請求和反饋響應(yīng)時間資源消耗情況進程狀態(tài)服務(wù)或端口響應(yīng)情況會話內(nèi)容情況日志和告警信息數(shù)據(jù)庫連接情況存儲連接情況作業(yè)執(zhí)行情況6.5.3.2預(yù)防性檢查應(yīng)在監(jiān)控服務(wù)的基礎(chǔ)上,對應(yīng)用資源進行預(yù)防性檢查。包括:性能檢查、脆弱性檢查。對應(yīng)用資源的預(yù)防性檢查內(nèi)容參見表14,包括但不限于:表14應(yīng)用資源預(yù)防性檢查內(nèi)容表服務(wù)對象預(yù)防性檢查內(nèi)容應(yīng)用資源應(yīng)用的請求和反饋響應(yīng)情況關(guān)鍵進程及資源消耗檢查、分析主機操作系統(tǒng)的漏洞掃描、補丁檢查系統(tǒng)病毒定期查殺應(yīng)用軟件的口令安全情況應(yīng)用軟件的日志審計、分析6.5.3.3常規(guī)作業(yè)應(yīng)用資源的常規(guī)作業(yè)內(nèi)容參見表15,包括但不限于:表15應(yīng)用資源常規(guī)作業(yè)內(nèi)容表服務(wù)對象常規(guī)作業(yè)內(nèi)容應(yīng)用資源版本升級日志清理啟動或停止服務(wù)或進程增加或刪除用戶賬號更新系統(tǒng)或用戶密碼建立或終止會話連接作業(yè)提交軟件備份6.5.4響應(yīng)支持6.5.4.1事件驅(qū)動響應(yīng)針對應(yīng)用資源故障而進行的響應(yīng)服務(wù)。包括但不限于:a)
應(yīng)用級啟停;b)
系統(tǒng)級啟停等。6.5.4.2服務(wù)請求響應(yīng)根據(jù)應(yīng)用系統(tǒng)運行需要或需方、服務(wù)相關(guān)方的請求,進行及時響應(yīng)和處理。例如:a)
按服務(wù)請求指示進行用戶增加;b)
口令修改;c)
參數(shù)調(diào)整等。6.5.5優(yōu)化改善應(yīng)用資源的優(yōu)化改善服務(wù)包括但不限于:a)
應(yīng)用消息隊列、共享內(nèi)存優(yōu)化;b)
應(yīng)用服務(wù)能力優(yōu)化,例如應(yīng)用進程數(shù)、應(yīng)用線程數(shù)的優(yōu)化;c)
應(yīng)用日志級別及日志空間的調(diào)整;d)
應(yīng)用版本升級、打補丁。注:本部分中應(yīng)用資源的優(yōu)化改善服務(wù)通常指在軟件運行中對軟件有關(guān)性能、維護參數(shù)調(diào)整,對于應(yīng)用資源自身功能增加、變動等引起的優(yōu)化改善活動不在本部分范圍內(nèi),具體詳見《信息技術(shù)軟件維護》。6.6數(shù)據(jù)6.6.1服務(wù)對象和活動服務(wù)對象是數(shù)據(jù)。6.6.2調(diào)研評估見本部分6.4.2和6.5.2的要求。6.6.3例行操作6.6.3.1監(jiān)控監(jiān)控應(yīng)當(dāng)采用合適的裝備與手段,分配專門人員定期或全時段進行監(jiān)控。數(shù)據(jù)的監(jiān)控內(nèi)容參見表16,包括但不限于:表16數(shù)據(jù)監(jiān)控內(nèi)容表服務(wù)對象監(jiān)控內(nèi)容數(shù)據(jù)數(shù)據(jù)的完整性數(shù)據(jù)變化的速率數(shù)據(jù)存儲數(shù)據(jù)對象應(yīng)用頻度數(shù)據(jù)引用的合法性數(shù)據(jù)備份的有效性數(shù)據(jù)產(chǎn)生、存儲、備份、分發(fā)、應(yīng)用過程數(shù)據(jù)安全事件6.6.3.2預(yù)防性檢查應(yīng)在監(jiān)控服務(wù)的基礎(chǔ)上,對數(shù)據(jù)進行預(yù)防性檢查。包括:性能檢查、脆弱性檢查。對數(shù)據(jù)的預(yù)防性檢查內(nèi)容參見表17,包括但不限于:表17數(shù)據(jù)預(yù)防性檢查內(nèi)容表服務(wù)對象預(yù)防性檢查內(nèi)容數(shù)據(jù)檢查數(shù)據(jù)完整性的要求檢查數(shù)據(jù)的冗余數(shù)據(jù)的脆弱性檢查6.6.3.3常規(guī)作業(yè)對數(shù)據(jù)的常規(guī)作業(yè)內(nèi)容參見表18,包括但不限于:表18數(shù)據(jù)常規(guī)作業(yè)內(nèi)容表服務(wù)對象常規(guī)作業(yè)內(nèi)容數(shù)據(jù)對數(shù)據(jù)產(chǎn)生、存儲、備份、分發(fā)、銷毀等過程進行的操作對數(shù)據(jù)的應(yīng)用范圍、應(yīng)用權(quán)限、數(shù)據(jù)優(yōu)化、數(shù)據(jù)安全等內(nèi)容按事先規(guī)定的程序進行的例行性的作業(yè)數(shù)據(jù)備份數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)分發(fā)數(shù)據(jù)清洗6.6.4響應(yīng)支持見6.4.4和6.5.4的要求。6.6.5優(yōu)化改善見6.4.5和6.5.5的要求。附錄A(資料性附錄)數(shù)據(jù)中心運行維護服務(wù)人員要求表A.1數(shù)據(jù)中心運行維護服務(wù)人員要求維護對象管理人員技術(shù)支持人員操作人員能力要求崗位要求能力要求崗位要求能力要求崗位要求數(shù)據(jù)基于豐富的數(shù)據(jù)應(yīng)用和設(shè)計經(jīng)驗,熟悉各種主流數(shù)據(jù)處理技術(shù)和性能調(diào)優(yōu)經(jīng)驗,熟悉各種數(shù)據(jù)庫設(shè)計工具和設(shè)計方法;規(guī)劃、設(shè)計IT項目的數(shù)據(jù)解決方案;具備項目管理經(jīng)驗,信息安全規(guī)劃控制管理能力,制定應(yīng)急預(yù)案1.具有良好的溝通協(xié)調(diào)能力;2.具有良好的組織能力、與客戶溝通的能力;需要保持與客戶的良好溝通,保障客戶滿意度,并且需要協(xié)調(diào)內(nèi)部資源實施各項服務(wù);3.具備項目管理經(jīng)驗,熟練掌握運行維護服務(wù)項目管理的知識;4.具備團隊合作精神,較強的組織協(xié)調(diào)能力;5.較強的表達(dá)能力;6.具備5年以上的從業(yè)經(jīng)驗基于豐富的數(shù)據(jù)庫應(yīng)用和部署經(jīng)驗,具有數(shù)據(jù)庫安裝、部署、開發(fā)、調(diào)優(yōu)、能力和數(shù)據(jù)遷移、數(shù)據(jù)交換、數(shù)據(jù)轉(zhuǎn)換等相關(guān)工作經(jīng)驗;對運行維護過程中的請求、事件和問題作出響應(yīng),保障信息安全并對處理結(jié)果負(fù)責(zé)1.具備行業(yè)項目實施經(jīng)驗;2.具備流程管理經(jīng)驗;3.較強的文字表達(dá)能力,具有豐富項目文檔經(jīng)驗;4.擁有服務(wù)對象包括平臺操作系統(tǒng)、數(shù)據(jù)庫、應(yīng)用系統(tǒng)等專業(yè)認(rèn)證證書;5.良好的溝通能力與團隊合作精神;6.具備3年以上的從業(yè)經(jīng)驗管理、監(jiān)控、備份、恢復(fù)、維護數(shù)據(jù),確保數(shù)據(jù)系統(tǒng)的完整性、準(zhǔn)確性和安全性;執(zhí)行交付,并對結(jié)果負(fù)責(zé)1.熟練掌握服務(wù)對象的相關(guān)操作文檔;2.經(jīng)過相應(yīng)的培訓(xùn)/認(rèn)證;3.良好的溝通能力與團隊合作精神;4.具備1年以上的從業(yè)經(jīng)驗應(yīng)用資源豐富的軟件設(shè)計和應(yīng)用經(jīng)驗,分析、評估應(yīng)用系統(tǒng)整體架構(gòu),優(yōu)化系統(tǒng)結(jié)構(gòu),選擇適宜的實踐參考模型,構(gòu)建適用的應(yīng)用架構(gòu)。制定應(yīng)急預(yù)案,根據(jù)需求更新或變更系統(tǒng)架構(gòu);具備項目管理經(jīng)驗,信息安全規(guī)劃控制管理能力,制定應(yīng)急預(yù)案定期評估系統(tǒng)平臺的性能和應(yīng)用軟件系統(tǒng)的性能、功能缺陷、用戶滿意度等,執(zhí)行系統(tǒng)故障處理應(yīng)急預(yù)案,及時消除可能存在的安全隱患和威脅、根
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《大學(xué)計算機基礎(chǔ)》課件-第5章 電子表格處理軟件
- 填報志愿 合同
- 《正向間接血凝試驗》課件
- 2025年吐魯番道路貨運駕駛員從業(yè)資格考試題庫
- 2025年湖北貨運從業(yè)資格證考試模擬考試題目
- 2025年長沙貨運從業(yè)資格證考試題目和答案
- 2025年張掖駕??荚囏涍\從業(yè)資格證模擬考試
- 2025年河源考貨運資格證考試內(nèi)容
- 工業(yè)用地交易中介合同樣本
- 水利工程機械施工安全協(xié)議
- 脊柱外科臨床指南
- 萬千教育學(xué)前透視幼兒的戶外學(xué)習(xí)
- 《抗菌藥物知識培訓(xùn)》課件
- 2024年北京市安全員A證考試題庫附答案
- 醫(yī)療專業(yè)人員的情緒管理培訓(xùn)
- 森林法培訓(xùn)課件
- 儀器分析題庫(含答案)
- 招標(biāo)法律法規(guī)匯總
- 湖北省黃岡市2022-2023學(xué)年高一上學(xué)期元月期末數(shù)學(xué)試題(原卷版)
- 2023配電網(wǎng)線損理論計算導(dǎo)則
- 審計人員保密守則
評論
0/150
提交評論