機(jī)房運(yùn)維專項(xiàng)方案_第1頁
機(jī)房運(yùn)維專項(xiàng)方案_第2頁
機(jī)房運(yùn)維專項(xiàng)方案_第3頁
機(jī)房運(yùn)維專項(xiàng)方案_第4頁
機(jī)房運(yùn)維專項(xiàng)方案_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

機(jī)房運(yùn)行維護(hù)工作提議書

為加強(qiáng)********單位數(shù)據(jù)中心機(jī)房各系統(tǒng)運(yùn)行維護(hù)和管理工作,確保系統(tǒng)長(zhǎng)久穩(wěn)定、高效運(yùn)行。依據(jù)**************信息化工作管理要求,編制適合于******機(jī)房運(yùn)維方案。運(yùn)維現(xiàn)實(shí)狀況分析******數(shù)據(jù)中心機(jī)房現(xiàn)在由*******部門管理,由指定外協(xié)企業(yè)承接基礎(chǔ)運(yùn)維工作,其職能限定于出入安全、配件管理、設(shè)備管理、運(yùn)行物理環(huán)境管理。對(duì)于設(shè)備本身及其運(yùn)行維護(hù)、軟件運(yùn)行維護(hù)等工作,仍由各個(gè)供給商按項(xiàng)目簽署協(xié)議提供無償服務(wù),現(xiàn)在這些無償服務(wù)大部分處于過期或立即到期狀態(tài)?,F(xiàn)在機(jī)房運(yùn)維沒有涵蓋桌面終端、大樓綜合布線、樓層配線間和設(shè)備間等,未組成一個(gè)完整運(yùn)維體系。故障連帶現(xiàn)象多方運(yùn)維造成機(jī)房出現(xiàn)中止或服務(wù)不良情況時(shí)有發(fā)生。********企業(yè)機(jī)房因?yàn)橐恢蔽茨苁艿揭?guī)范統(tǒng)一運(yùn)維管理,加上機(jī)房作為數(shù)據(jù)關(guān)鍵,由多種外部單位組成運(yùn)維團(tuán)體不管在數(shù)據(jù)安全性、人員責(zé)任感、技術(shù)全方面性等方面,全部難以保持機(jī)房連續(xù)性運(yùn)轉(zhuǎn)。我們沒有正確數(shù)據(jù)來說明機(jī)房運(yùn)行情況,這也是現(xiàn)在運(yùn)維工作還未達(dá)標(biāo)一個(gè)表現(xiàn),一樣,這也造成我們對(duì)現(xiàn)實(shí)狀況無法進(jìn)行正確描述。不過,經(jīng)過部分現(xiàn)象仍然能夠發(fā)覺機(jī)房運(yùn)維工作應(yīng)該大幅度改善。長(zhǎng)時(shí)間斷網(wǎng)具體原因不詳,但因?yàn)闄C(jī)房服務(wù)器大部分無法接通,成全部地域二級(jí)單位網(wǎng)絡(luò)依靠DHCP服務(wù)無法使用等現(xiàn)象連續(xù)多個(gè)小時(shí),發(fā)覺晚,響應(yīng)慢。上班時(shí)間網(wǎng)速慢具體原因不詳,但簡(jiǎn)單歸結(jié)為SEP或人多并不能完全解釋網(wǎng)速慢問題,因?yàn)榫W(wǎng)絡(luò)是信息化建設(shè)基礎(chǔ),充足發(fā)揮機(jī)房?jī)?nèi)部和外部資源是運(yùn)維工作關(guān)鍵職責(zé)。服務(wù)意外退出當(dāng)虛擬機(jī)系統(tǒng)開始引入后,我們時(shí)常發(fā)覺掛載在虛擬機(jī)系統(tǒng)上部分服務(wù)器無故宕機(jī)且不知道任何原因,當(dāng)用戶需要使用時(shí),因?yàn)闊o法自動(dòng)恢復(fù),影響正常工作。不易尋求責(zé)任人機(jī)房是一完整整體,包含到環(huán)境、網(wǎng)絡(luò)、服務(wù)器、存放、操作系統(tǒng)、數(shù)據(jù)庫、應(yīng)用軟件等,當(dāng)一個(gè)故障發(fā)生時(shí),難以判定故障原因,而現(xiàn)在機(jī)房是各個(gè)外協(xié)單位各施其責(zé),最終造成故障排除時(shí)間緩慢,相互推諉情況時(shí)有發(fā)生。半自動(dòng)化運(yùn)維現(xiàn)實(shí)狀況現(xiàn)在很多企業(yè)IT運(yùn)維已經(jīng)實(shí)現(xiàn)從人工運(yùn)維到計(jì)算機(jī)管理,但延展咨詢?cè)谕脩艚涣髦邪l(fā)覺其中很多企業(yè)IT運(yùn)維管理還只是處于“半自動(dòng)化”運(yùn)維狀態(tài)。因?yàn)檫@種IT運(yùn)維仍然是等到IT故障出現(xiàn)后再由運(yùn)維人員采取對(duì)應(yīng)補(bǔ)救方法。這些傳統(tǒng)式被動(dòng)、孤立、半自動(dòng)式IT運(yùn)維管理模式常常讓IT部門疲憊不堪,關(guān)鍵表現(xiàn)在以下三個(gè)方面:運(yùn)維人員被動(dòng)、效率低在IT運(yùn)維過程中,只有當(dāng)事件已經(jīng)發(fā)生并已造成業(yè)務(wù)影響時(shí)才能發(fā)覺和著手處理,這種被動(dòng)“救火”不僅使IT運(yùn)維人員終日忙碌,也使IT運(yùn)維本身質(zhì)量極難提升,造成IT部門和業(yè)務(wù)部門對(duì)IT運(yùn)維服務(wù)滿意度全部不高。現(xiàn)在絕大多數(shù)企業(yè)IT運(yùn)維人員日常大部分時(shí)間和精力是處理部分簡(jiǎn)單反復(fù)問題,而且因?yàn)楣收项A(yù)警機(jī)制不完善,往往是故障發(fā)生后或報(bào)警后才會(huì)進(jìn)行處理,,使到IT運(yùn)維人員工作常常是處于被動(dòng)“救火”狀態(tài),不僅事倍功半而且常常會(huì)出現(xiàn)惡性連鎖反應(yīng)。缺乏一套高效IT運(yùn)維機(jī)制現(xiàn)在很多企業(yè)在IT運(yùn)維管理過程中缺乏自動(dòng)化運(yùn)維管理模式,也沒有明確角色定義和責(zé)任劃分,使到問題出現(xiàn)后極難快速、正確地找到根本原因,無法立即地找到對(duì)應(yīng)人員進(jìn)行修復(fù)和處理,或是在問題找到后缺乏步驟化故障處理機(jī)制,而在處理問題時(shí)不僅欠缺規(guī)范化處理方案,也缺乏全方面跟蹤統(tǒng)計(jì)。缺乏高效IT運(yùn)維技術(shù)工具伴隨信息化建設(shè)深入,企業(yè)IT系統(tǒng)日趨復(fù)雜,林林總總網(wǎng)絡(luò)設(shè)備、服務(wù)器、中間件、業(yè)務(wù)系統(tǒng)等讓IT運(yùn)維人員難以從容應(yīng)對(duì),即使加班加點(diǎn)地維護(hù)、布署、管理也常常會(huì)因設(shè)備出現(xiàn)故障而造成業(yè)務(wù)中止,嚴(yán)重影響企業(yè)正常運(yùn)轉(zhuǎn)。出現(xiàn)這些問題部分原因是企業(yè)缺乏事件監(jiān)控和診療工具等IT運(yùn)維技術(shù)工具,因?yàn)樵跊]有高效技術(shù)工具支持下故障事件極難得到主動(dòng)、快速處理?,F(xiàn)在伴隨IT運(yùn)維管理工作復(fù)雜度和難度大大增加,僅靠過去多個(gè)“運(yùn)維英雄”或“技術(shù)大拿”來包打天下已經(jīng)行不通了,企業(yè)開始需要利用專業(yè)化、標(biāo)準(zhǔn)化和步驟化手段來實(shí)現(xiàn)運(yùn)維工作自動(dòng)化管理。因?yàn)榻?jīng)過自動(dòng)化監(jiān)控系統(tǒng)能立即發(fā)覺故障隱患,主動(dòng)告訴用戶需要關(guān)注資源,以達(dá)成防患于未然。比如,全天候自動(dòng)檢測(cè)和立即報(bào)警能實(shí)現(xiàn)IT運(yùn)維“全天候無人值守”,大大降低IT運(yùn)維人員工作負(fù)擔(dān)。而且,經(jīng)過自動(dòng)化診療能最大程度地降低維修時(shí)間,提升服務(wù)質(zhì)量。所以,對(duì)于越來越復(fù)雜IT運(yùn)維來說,將純粹人工操作變?yōu)橐欢ǔ潭茸詣?dòng)化管理是一個(gè)關(guān)鍵發(fā)展趨勢(shì)。規(guī)范制度不健全I(xiàn)T系統(tǒng)三分建、七分管,運(yùn)維管理十分復(fù)雜,技術(shù)要求高,包含范圍廣,實(shí)施難度大,突出有“三難”。職責(zé)難明IT系統(tǒng)運(yùn)維管理離不開使用、建設(shè)、運(yùn)維三方共同努力。不能將全部運(yùn)維責(zé)任歸于運(yùn)維部門,運(yùn)維部門和其它部門相互配合程度低,造成運(yùn)維人員壓力大,處理事務(wù)多。哪些由使用部門負(fù)責(zé),哪些由運(yùn)維部門負(fù)責(zé),難有明確職責(zé)界定。資料難全網(wǎng)絡(luò)設(shè)備價(jià)格和系統(tǒng)集成復(fù)雜度不停降低,部門自建“網(wǎng)中網(wǎng)”、“小系統(tǒng)”現(xiàn)象愈加普遍,資料正確性和完整性不停降低,給清查設(shè)備和排查故障帶來很大困難,運(yùn)維部門掌控系統(tǒng)資源越來越難,運(yùn)維管理資料難求完整???jī)效難估運(yùn)維部門有個(gè)“兩難”境界:系統(tǒng)問題越多,工作量越多,但有些人認(rèn)為維護(hù)水平越低;維護(hù)水平越高,問題越少,但她人認(rèn)為工作量越少。運(yùn)維部門績(jī)效評(píng)定難以用業(yè)務(wù)部門類似指標(biāo)來衡量,不能受到公平評(píng)定。所以運(yùn)維人員主動(dòng)性越來越低,人員流失率高。總體目標(biāo)機(jī)房運(yùn)維管理規(guī)范化、步驟化、制度化鑒于最終用戶對(duì)信息化服務(wù)連續(xù)性供給要求,******數(shù)據(jù)中心機(jī)房運(yùn)維工作急需由被動(dòng)式變更為主動(dòng)式,針對(duì)以下內(nèi)容進(jìn)行規(guī)范化管理,確保其連續(xù)運(yùn)行時(shí)間和工作性能滿足生產(chǎn)需求。機(jī)房環(huán)境,包含溫度、濕度、供電、防雷、消防、承重等;機(jī)房設(shè)備,包含服務(wù)器、交換機(jī)、存放、網(wǎng)絡(luò)安全、通訊等設(shè)備;機(jī)房鏈路,包含骨干光纜、機(jī)房跳線、收發(fā)和中繼等;機(jī)房應(yīng)用軟件運(yùn)行監(jiān)控,包含門戶、辦公、生產(chǎn)、財(cái)務(wù)、網(wǎng)絡(luò)等應(yīng)用軟件等;機(jī)房軟性資源,包含IP地址、VLAN等。對(duì)于以上各個(gè)項(xiàng)目類別,基礎(chǔ)上全部包含監(jiān)察、報(bào)警、故障排除、優(yōu)化等工作,因?yàn)閼?yīng)用軟件等受到供給商限制,其故障排除和優(yōu)化往往只能由供給商提供,但對(duì)其運(yùn)行進(jìn)行實(shí)時(shí)監(jiān)控仍然是機(jī)房運(yùn)維職責(zé)范圍內(nèi)工作。統(tǒng)一管理和集中授權(quán)機(jī)房運(yùn)維現(xiàn)在存在很多問題,造成工作較為混亂,職責(zé)不清,相互推諉時(shí)有發(fā)生,這和運(yùn)維本身所需要快速排除事故,綜合性根本性處理潛在問題要求是不一致。除了技術(shù)上需要一個(gè)中央平臺(tái)以外,顯然管理上也應(yīng)該形成一個(gè)統(tǒng)一運(yùn)維團(tuán)體,這個(gè)團(tuán)體應(yīng)該對(duì)機(jī)房?jī)?nèi)各項(xiàng)內(nèi)容全部負(fù)擔(dān)對(duì)應(yīng)職責(zé),這種職責(zé)是深入,而不僅僅是簡(jiǎn)單碰到事故時(shí)一個(gè)通知者角色。設(shè)備廠商、應(yīng)用軟件開發(fā)商全部是在不停改變中,而運(yùn)維管理團(tuán)體卻是不變。地研院信息中心認(rèn)為,運(yùn)維管理團(tuán)體應(yīng)該保障運(yùn)維行為合理性。不許可在事故排除、問題診療、連續(xù)改善過程中,出現(xiàn)互不負(fù)擔(dān)責(zé)任,尤其在部分業(yè)務(wù)交叉點(diǎn)上;對(duì)運(yùn)維配置項(xiàng)識(shí)別方法是統(tǒng)一,工作單、知識(shí)庫等格式是標(biāo)準(zhǔn)一致;對(duì)石油鉆探行業(yè)知識(shí)了解是一致,包含不一樣應(yīng)用關(guān)鍵性等級(jí)、不一樣部室數(shù)據(jù)安全性等級(jí)等;團(tuán)體內(nèi)應(yīng)共同對(duì)運(yùn)維服務(wù)工作推進(jìn)負(fù)擔(dān)責(zé)任;內(nèi)部區(qū)分不一樣安全等級(jí),比如管理員賬號(hào)和密碼屬于高安全級(jí),而外部人員工作則是適度授權(quán)。在業(yè)務(wù)和管理上達(dá)成集中統(tǒng)一要求后,就形成了“******數(shù)據(jù)中心機(jī)房運(yùn)維一體化”工作模式,因?yàn)檫@種模式加強(qiáng)了運(yùn)維內(nèi)部凝聚力,所以易于在運(yùn)維步驟、技術(shù)等方面進(jìn)行連續(xù)改善,從而不停提升********企業(yè)在信息化運(yùn)維工作上能力,也就為********企業(yè)信息化建設(shè)解除了后顧之憂。那么,我們?cè)倏匆豢船F(xiàn)在現(xiàn)實(shí)狀況,能夠反射出多方運(yùn)維所形成部分后果。集中監(jiān)控平臺(tái)機(jī)房是企業(yè)信息化關(guān)鍵,不管是應(yīng)用服務(wù)、關(guān)鍵網(wǎng)絡(luò)、骨干鏈路,全部將牽動(dòng)全企業(yè)信息化使用。而機(jī)房軟硬件通常全部是由不一樣渠道采購,這就造成了多廠商和多供給商共同維護(hù)局面,因?yàn)椴灰粯訌S商有不一樣管理平臺(tái),不一樣集成商有不一樣運(yùn)維方法,運(yùn)維隊(duì)伍良莠不齊,在運(yùn)維立即性、有效性、安全性上,全部無法滿足********企業(yè)業(yè)務(wù)需要。實(shí)際上,我們需要以下所述一個(gè)平臺(tái)。統(tǒng)一而且固化可實(shí)施步驟,確保不管何人來全部能夠按標(biāo)準(zhǔn)實(shí)施,以降低運(yùn)維風(fēng)險(xiǎn);集中監(jiān)控預(yù)警系統(tǒng),經(jīng)過集成機(jī)房環(huán)境、網(wǎng)絡(luò)、服務(wù)器等系統(tǒng),任何系統(tǒng)出現(xiàn)故障,全部將在第一時(shí)間發(fā)覺并報(bào)警,同時(shí),管理人員也只需在一個(gè)統(tǒng)一門戶上進(jìn)行操作管理,而無需面對(duì)多種多樣管理體系,在減緩學(xué)習(xí)曲線同時(shí)也提升運(yùn)維品質(zhì);集中知識(shí)庫,知識(shí)包含歷史實(shí)施過程、技術(shù)方案、原始資料等,因?yàn)檫\(yùn)維延續(xù)性很關(guān)鍵,所以,含有高度參考價(jià)值歷史運(yùn)維資料是一筆相當(dāng)寶貴財(cái)富;集中運(yùn)維隊(duì)伍管理;統(tǒng)一規(guī)范基礎(chǔ)配置項(xiàng)數(shù)據(jù)庫。只有經(jīng)過一個(gè)中心平臺(tái),封裝不一樣廠商和集成商所提供不一樣內(nèi)容,最終達(dá)成運(yùn)維工作可實(shí)施,業(yè)務(wù)延續(xù)而不受到廠商或集成商過分牽制。不過,業(yè)務(wù)上或說技術(shù)上只是提供了一個(gè)系統(tǒng),而運(yùn)維要落地仍然需要各類人員來完成,那么,確保運(yùn)維工作實(shí)施和落地就需要統(tǒng)一管理。運(yùn)維自動(dòng)化首先,IT運(yùn)維步驟自動(dòng)化能夠提升步驟可控性,能夠基于業(yè)務(wù)需求來制訂個(gè)性化步驟,使企業(yè)領(lǐng)導(dǎo)有機(jī)會(huì)看見她們業(yè)務(wù)步驟,對(duì)企業(yè)步驟有一個(gè)深刻分析和了解,進(jìn)而改造和優(yōu)化步驟。其次,IT運(yùn)維步驟自動(dòng)化能提升透明度。因?yàn)榘殡S業(yè)務(wù)需求改變可能會(huì)有多個(gè)版本出現(xiàn),手工步驟不透明將會(huì)給步驟定制和優(yōu)化帶來相當(dāng)大困難,而自動(dòng)化步驟能夠使用戶能夠一目了然看到整個(gè)步驟各個(gè)節(jié)點(diǎn)運(yùn)轉(zhuǎn)情況,自動(dòng)化工具潛移默化地提升業(yè)務(wù)保障能力。再者,運(yùn)維系統(tǒng)實(shí)施了自動(dòng)化監(jiān)控以后,經(jīng)過工具自動(dòng)監(jiān)控對(duì)人工作是一個(gè)減負(fù),也是一個(gè)降低成本表現(xiàn)。建設(shè)方案******數(shù)據(jù)中心機(jī)房運(yùn)維是一個(gè)整體化工作,不管在電信、金融等信息化程度較高行業(yè),全部是由一個(gè)運(yùn)維團(tuán)體來負(fù)擔(dān)運(yùn)維工作,鑒于行業(yè)信息安全需求,通常是由一個(gè)內(nèi)部服務(wù)機(jī)構(gòu)進(jìn)行統(tǒng)一管理,外協(xié)單位輔助來統(tǒng)一開展工作。地研院信息中心作為距離******數(shù)據(jù)中心機(jī)房較近,信息化人員有一定運(yùn)維經(jīng)驗(yàn),有足夠意愿為******數(shù)據(jù)中心機(jī)房運(yùn)維提供良好支持,現(xiàn)在地研院信息中心和部分有經(jīng)驗(yàn)外協(xié)單位通力合作,正在努力向ISO/0標(biāo)準(zhǔn)所要求運(yùn)維服務(wù)規(guī)范化步驟化方向前進(jìn),并依據(jù)本身對(duì)機(jī)房運(yùn)維工作了解,已經(jīng)開發(fā)出部分步驟和制度,為機(jī)房運(yùn)維奠定足夠基礎(chǔ)。自頂向下設(shè)計(jì)機(jī)房運(yùn)維涉眾自頂向下牽系到各個(gè)層面訴求,******數(shù)據(jù)中心機(jī)房運(yùn)維是一個(gè)分層次服務(wù),整個(gè)運(yùn)維過程將會(huì)包含多類人員。依據(jù)********企業(yè)現(xiàn)實(shí)狀況和實(shí)際情況,我們分析以下人員將組成整個(gè)運(yùn)維生命周期中干系人,并行使各自角色權(quán)利。終端用戶終端用戶是我們最終用戶,其滿意度是我們運(yùn)維工作是否良好關(guān)鍵評(píng)判標(biāo)準(zhǔn)。終端用戶不局限于大樓內(nèi)辦公用戶,也包含骨干網(wǎng)絡(luò)聯(lián)通對(duì)端用戶、機(jī)房服務(wù)器上各類應(yīng)用使用者、集團(tuán)企業(yè)遠(yuǎn)程網(wǎng)絡(luò)管理者,等等。終端用戶也是運(yùn)維費(fèi)用負(fù)擔(dān)者,我們職責(zé)就是讓其滿意度逐步提升。內(nèi)部服務(wù)管理部門企業(yè)信息管理部作為內(nèi)部服務(wù)管理部門,負(fù)擔(dān)了確保終端用戶滿意度責(zé)任。因?yàn)閮?nèi)部服務(wù)管理部門負(fù)擔(dān)了大量管理工作,再負(fù)擔(dān)運(yùn)維服務(wù)工作實(shí)際上不含有可行性。所以,信息管理部應(yīng)負(fù)擔(dān)運(yùn)維管理工作,包含選擇運(yùn)維工作負(fù)擔(dān)單位、審批管理步驟、傳輸集團(tuán)企業(yè)管理規(guī)范或制訂企業(yè)內(nèi)部企業(yè)規(guī)范,等等。內(nèi)部服務(wù)管理部門也是運(yùn)維費(fèi)用評(píng)定方和支付方,為整個(gè)運(yùn)維工作推行管理職責(zé)。運(yùn)維承接單位地研院將作為運(yùn)維工作承接單位,將落實(shí)落實(shí)服務(wù)管理部各項(xiàng)指標(biāo),并為終端用戶提供服務(wù)界面。運(yùn)維承接單位必需是中石油內(nèi)部單位,其一是因?yàn)樾畔踩?,其二是為了愈加好遵照企業(yè)規(guī)范,其三是不停提升內(nèi)部隊(duì)伍運(yùn)維水平。運(yùn)維承接單位本質(zhì)上還是一個(gè)內(nèi)部服務(wù)單位,在部分技術(shù)和業(yè)務(wù)無法支撐情況下,需要外部協(xié)作單位提供運(yùn)維技術(shù)工作支撐。外部協(xié)作單位外部協(xié)作單位為運(yùn)維工作提供了附加人力資源和技術(shù)教授服務(wù),是整個(gè)運(yùn)維工作關(guān)鍵組成部分,其通常會(huì)負(fù)擔(dān)實(shí)際工作實(shí)施者角色。作為外部協(xié)作單位,必需遵守企業(yè)規(guī)范和要求,并按需提供對(duì)應(yīng)數(shù)據(jù)資料和過程文檔。因?yàn)闄C(jī)房技術(shù)復(fù)雜性,外部協(xié)作單位可能不只一家,這些外協(xié)單位將由運(yùn)維承接單位進(jìn)行統(tǒng)一管理,形成統(tǒng)一運(yùn)維團(tuán)體。供給商和廠商供給商和廠商,包含軟件和硬件,這兩部分全部需要她們提供配件服務(wù)和修復(fù)服務(wù),不管在無償服務(wù)期還是收費(fèi)服務(wù)期,這些商家全部屬于運(yùn)維體系中一部分。供給商和廠商,也包含部分項(xiàng)目研究和測(cè)試階段參與者,這些商家也必需遵守機(jī)房對(duì)應(yīng)管理要求。采取自底向上和自頂向下相結(jié)合******數(shù)據(jù)中心機(jī)房運(yùn)維現(xiàn)在處于一個(gè)被動(dòng)式工作狀態(tài),距離主動(dòng)式運(yùn)維還有很長(zhǎng)一段距離,這是因?yàn)楦鱾€(gè)運(yùn)維單位沒有標(biāo)準(zhǔn)工作步驟和數(shù)據(jù)規(guī)范,造成基礎(chǔ)數(shù)據(jù)極度欠缺,這些工作現(xiàn)在全部必需一步一步經(jīng)過堅(jiān)實(shí)工作來逐步補(bǔ)充和完善。同時(shí),我們不能將運(yùn)維工作簡(jiǎn)單看成一個(gè)軟件系統(tǒng)或平臺(tái),我們必需要根據(jù)ITILv3等國(guó)際標(biāo)準(zhǔn),結(jié)合********企業(yè)實(shí)際,制訂自已標(biāo)準(zhǔn),這么展開工作才有章可循,有法可依。根據(jù)這自底向上和自頂向下結(jié)合標(biāo)準(zhǔn),我們提議采取以下步驟來實(shí)施******數(shù)據(jù)中心機(jī)房運(yùn)維。建設(shè)運(yùn)維團(tuán)體運(yùn)維團(tuán)體建設(shè)主旨,就是滿足運(yùn)維工作PDCA循環(huán),結(jié)合內(nèi)部和外部工作人員,構(gòu)建一個(gè)良性不停自我成長(zhǎng)運(yùn)維生態(tài)圈。因?yàn)閷?duì)IT運(yùn)維不夠重視,很多企業(yè)并沒有建立良好運(yùn)維團(tuán)體來系統(tǒng)而規(guī)范進(jìn)行運(yùn)維管理,這在一定程度上引發(fā)了IT運(yùn)維人員流失,使得企業(yè)IT運(yùn)維無法在質(zhì)量上得到最大程度提升。另外,伴隨企業(yè)IT應(yīng)用深入,運(yùn)維已無法單純依靠多個(gè)“運(yùn)維先鋒”和“技術(shù)大鱷”來處理。運(yùn)維專業(yè)化細(xì)分,需要企業(yè)能夠充足了解IT運(yùn)維和運(yùn)維人員特征,才能讓運(yùn)維人員在適宜細(xì)分空間不停進(jìn)行運(yùn)維經(jīng)驗(yàn)積累,從而提升運(yùn)維質(zhì)量。而這恰恰是很多企業(yè)無法正視問題,運(yùn)維中總是采取消極應(yīng)正確態(tài)度,使得眾多“運(yùn)維先鋒”和“技術(shù)大鱷”也因?yàn)槭苤匾暢潭炔粔虻群芏嘣蜻x擇離開。在運(yùn)維管理中,團(tuán)體質(zhì)量直接影響著服務(wù)質(zhì)量,只有連續(xù)投入管理精力,建立對(duì)應(yīng)晉升培訓(xùn)機(jī)制方能確保較高服務(wù)水平和較穩(wěn)定服務(wù)質(zhì)量。我們將在后續(xù)章節(jié)詳解我們運(yùn)維團(tuán)體組成計(jì)劃,因?yàn)楣ぷ魅渴怯扇碎_展,所以這是最緊迫工作,也是******數(shù)據(jù)中心機(jī)房運(yùn)維工作關(guān)鍵部分。因?yàn)橹惺蛯儆趪?guó)家戰(zhàn)略行業(yè),我們必需在考慮到人員技術(shù)性同時(shí),也要考慮到內(nèi)外部人員信息安全性。建立規(guī)章制度加強(qiáng)IT系統(tǒng)運(yùn)維制度建設(shè)事半功倍,經(jīng)過運(yùn)維工作制度化,全方面落實(shí)各項(xiàng)管理責(zé)任,可有效確保IT系統(tǒng)安全、穩(wěn)定、可靠運(yùn)行。伴隨IT系統(tǒng)在各行各業(yè)迅猛普及,IT部門工作關(guān)鍵,逐步由系統(tǒng)建設(shè)轉(zhuǎn)向運(yùn)維管理,確保IT系統(tǒng)高效穩(wěn)定運(yùn)行、提升服務(wù)水平成為重心。多年來,IT系統(tǒng)運(yùn)維管剪發(fā)展了部分優(yōu)異理論方法,諸如以ITIL為關(guān)鍵IT服務(wù)管理十大步驟、IT外包等,推進(jìn)了信息化服務(wù)水平提升。不過,對(duì)于IT系統(tǒng)規(guī)模較小、功效簡(jiǎn)單單位來說,運(yùn)維部門人力弱,經(jīng)費(fèi)投入少,利用實(shí)施這些理論措施存在著較大難度。所以,處理運(yùn)維管理“三難”問題,惟一措施就是建立較為完整運(yùn)維管理制度,形成一套職責(zé)、步驟和指標(biāo),做到事事有章可循、有規(guī)可依。依據(jù)********實(shí)際情況,參考行業(yè)內(nèi)部分經(jīng)驗(yàn),我們已經(jīng)確定了部分規(guī)章制度初稿,能夠在后續(xù)章節(jié)中看到。不過仍需要在實(shí)踐過程中不停改善,以適應(yīng)我們實(shí)際情況。采集基礎(chǔ)配置項(xiàng)數(shù)據(jù)庫******數(shù)據(jù)中心機(jī)房運(yùn)維基礎(chǔ)工作欠缺較多,尤其是在基礎(chǔ)數(shù)據(jù)方面,一直難以提供一份完整資料,對(duì)運(yùn)維工作開展造成巨大障礙。配置項(xiàng)管理數(shù)據(jù)庫即CMDB,經(jīng)過識(shí)別、控制、維護(hù),檢驗(yàn)企業(yè)IT資源,從而高效控制和管理不停改變IT基礎(chǔ)架構(gòu)和IT服務(wù),并為其它步驟,比如事故管理、問題管理、變更管理、公布管理等步驟提供正確配置信息。伴隨IT技術(shù)進(jìn)步和發(fā)展,企業(yè)IT環(huán)境越來越復(fù)雜。數(shù)量龐大、品種繁多IT設(shè)備極難被有效管理,更不用說管理以這些IT設(shè)備為基礎(chǔ)多種IT服務(wù)。同時(shí),企業(yè)IT環(huán)境在不停改變,怎樣評(píng)定某個(gè)設(shè)備或服務(wù)發(fā)生事故或變更所造成影響,和怎樣為其它步驟提供IT資源目前正確配置信息全部是企業(yè)面臨重大挑戰(zhàn)。CMDB正是為了處理以下這些問題而誕生。信息整合怎樣將眾多IT設(shè)備、IT服務(wù)、甚至使用它們部門和人員整合在一個(gè)完整庫中?這么整合信息將使有效和高效管理IT設(shè)備和服務(wù)成為可能??勺詣?dòng)發(fā)覺多種主機(jī)、網(wǎng)絡(luò)設(shè)備、應(yīng)用。同時(shí)支持全網(wǎng)發(fā)覺、指定子網(wǎng)、指定配置項(xiàng)三種發(fā)覺方法。關(guān)系映射怎樣將硬件、軟件和IT服務(wù)之間物理和邏輯關(guān)系映射可視化?使得IT人員能夠看到其相互之間依靠關(guān)系,并確定該IT組件對(duì)用戶帶來潛在影響。若IT人員能夠?qū)崟r(shí)看到其對(duì)企業(yè)或用戶業(yè)務(wù)影響,將大大有利于提升IT服務(wù)水平。展示IT資源、部門、人員之間關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)關(guān)聯(lián)關(guān)系定義和維護(hù)。CMDB不僅僅存放IT資源屬性和關(guān)聯(lián)關(guān)系,還自動(dòng)關(guān)聯(lián)IT資源和其發(fā)生過事故、問題、變更、公布。步驟支持怎樣為其它IT運(yùn)維步驟提供正確IT設(shè)備、IT服務(wù)配置信息(包含目前設(shè)備或服務(wù)發(fā)生過事故、問題、變更、公布等信息)對(duì)服務(wù)臺(tái)、事故管理、問題管理、變更管理、公布管理來說,正確配置信息將極大提升步驟運(yùn)作效率。在服務(wù)臺(tái)、事故、問題、變更、公布步驟中,均能夠快速查看目前步驟包含到IT資源全方面、正確信息。軟件庫和硬件庫怎樣確保應(yīng)用到IT環(huán)境軟件和硬件均是經(jīng)過授權(quán)和測(cè)試?這是確保IT環(huán)境質(zhì)量和提供穩(wěn)定IT服務(wù)前提條件。經(jīng)過支持DSL(DefinitiveSoftwareLibrary,最終軟件庫)和DHS(DefinitiveHardwareStore,最終硬件庫),確保在公布管理中使用軟件和硬件均是經(jīng)過授權(quán)和測(cè)試。CMDB是IT運(yùn)維一個(gè)關(guān)鍵,不過因?yàn)槊總€(gè)企業(yè)對(duì)CMDB要求全部會(huì)有些差異,所以CMDB靈活性很關(guān)鍵。********企業(yè)機(jī)房配置項(xiàng)即使不比電信或互聯(lián)網(wǎng)應(yīng)用服務(wù)商,但因?yàn)槠浜羞h(yuǎn)比電信、互聯(lián)網(wǎng)應(yīng)用復(fù)雜性,在分析、采集CMDB資料時(shí),將面臨更多挑戰(zhàn)。研發(fā)********運(yùn)維平臺(tái)******數(shù)據(jù)中心機(jī)房運(yùn)維,假如仍然延續(xù)大量人工,規(guī)章制度、業(yè)務(wù)步驟難以落地,實(shí)施時(shí)輕易偏離,大量基礎(chǔ)數(shù)據(jù)無法采集或采集困難,造成好運(yùn)維理念最終仍然無法落實(shí)。伴隨信息時(shí)代連續(xù)發(fā)展,IT運(yùn)維已經(jīng)成為IT服務(wù)內(nèi)涵中關(guān)鍵組成部分。面對(duì)越來越復(fù)雜業(yè)務(wù),面對(duì)越來越多樣化用戶需求,不停擴(kuò)展IT應(yīng)用需要越來越合理模式來保障IT服務(wù)能靈活便捷、安全穩(wěn)定地連續(xù)保障,這種模式中保障原因就是IT運(yùn)維(其它原因是愈加優(yōu)越IT架構(gòu)等)。從早期幾臺(tái)服務(wù)器發(fā)展到龐大數(shù)據(jù)中心,單靠人工已經(jīng)無法滿足在技術(shù)、業(yè)務(wù)、管理等方面要求,那么標(biāo)準(zhǔn)化、自動(dòng)化、架構(gòu)優(yōu)化、過程優(yōu)化等降低IT服務(wù)成本原因越來越被大家所重視。其中,自動(dòng)化最開始作為替換人工操作為出發(fā)點(diǎn)訴求被廣泛研究和應(yīng)用。IT運(yùn)維從誕生發(fā)展至今,自動(dòng)化作為其關(guān)鍵屬性之一已經(jīng)不僅僅只是替換人工操作,更關(guān)鍵是深層探知和全局分析,關(guān)注是在目前條件下怎樣實(shí)現(xiàn)性能和服務(wù)最優(yōu)化,同時(shí)保障投資收益最大化。自動(dòng)化對(duì)IT運(yùn)維影響,已經(jīng)不僅僅是人和設(shè)備之間關(guān)系,已經(jīng)發(fā)展到了面向用戶服務(wù)驅(qū)動(dòng)IT運(yùn)維決議層面,IT運(yùn)維團(tuán)體組成,也從各級(jí)技術(shù)人員占大多數(shù)發(fā)展到業(yè)務(wù)人員甚至用戶占大多數(shù)局面。所以,IT運(yùn)維自動(dòng)化是一組將靜態(tài)設(shè)備結(jié)構(gòu)轉(zhuǎn)化為依據(jù)IT服務(wù)需求動(dòng)態(tài)彈性響應(yīng)策略,目標(biāo)就是實(shí)現(xiàn)IT運(yùn)維質(zhì)量,降低成本。能夠說自動(dòng)化一定是IT運(yùn)維最高層面關(guān)鍵屬性之一,但不是全部。運(yùn)維團(tuán)體最低配置滿足PDCA循環(huán)運(yùn)維團(tuán)體組成和職責(zé)分配是******數(shù)據(jù)中心機(jī)房運(yùn)維是否能夠達(dá)成預(yù)期目標(biāo)一個(gè)保障,依據(jù)********企業(yè)組織結(jié)構(gòu)和信息化建設(shè)現(xiàn)實(shí)狀況,結(jié)合ISO/0標(biāo)準(zhǔn),我們以一個(gè)完整PDCA循環(huán)作為建立團(tuán)體組織組成依據(jù),建立一個(gè)完整成體系運(yùn)維隊(duì)伍。以上圖示表示了整個(gè)團(tuán)體基礎(chǔ)配置情況,每個(gè)步驟全部負(fù)擔(dān)對(duì)應(yīng)職責(zé)不可或缺,在圖中并未表示在機(jī)房運(yùn)維過程中可能出現(xiàn)供給商和廠商人員,但一旦出現(xiàn),也一樣納入團(tuán)體管理規(guī)程中,并形成對(duì)應(yīng)制度和評(píng)定考評(píng)體系。客服人員客服工作人員是和用戶溝通關(guān)鍵渠道之一,需含有一定話術(shù)要求和基礎(chǔ)技能。要保障7x二十四小時(shí)不間斷服務(wù)質(zhì)量,需要最少4名職員進(jìn)行輪班工作,人員需求量相當(dāng)較大。鑒于******數(shù)據(jù)中心機(jī)房現(xiàn)在運(yùn)行需求,能夠安排2名客服人員輪值,每日12小時(shí),其它時(shí)間由駐點(diǎn)運(yùn)維工程師提供客服服務(wù)。依據(jù)實(shí)際運(yùn)行情況進(jìn)行人員調(diào)整。運(yùn)維工程師運(yùn)維工程師是一線工作人員,包含駐點(diǎn)工程師和移動(dòng)工程師,運(yùn)維工程師是和用戶交流零距離界面,溝通關(guān)鍵渠道之一,需含有一定話術(shù)要求和基礎(chǔ)技能。接收工作任務(wù)單,登記處理過程和結(jié)果現(xiàn)場(chǎng)故障排除遠(yuǎn)程故障排除提出步驟改善提議每日工作匯總提供技術(shù)知識(shí)和業(yè)務(wù)知識(shí)積淀幫助用戶工作,提供技術(shù)支援運(yùn)維工程師屬于一線職員,在接人待物、溝通和基礎(chǔ)技術(shù)水準(zhǔn)全部需要達(dá)成一定要求。運(yùn)維工程師在排除故障或技術(shù)支援時(shí)候,必需嚴(yán)格按步驟進(jìn)行,對(duì)于無法處理問題,需要通知客服中心,加派或另派技術(shù)教授幫助。******數(shù)據(jù)中心機(jī)房運(yùn)維現(xiàn)在需要2-4名工程師輪班,這些人員可能由運(yùn)維承接單位和外部協(xié)作單位共同組成。行為督查員行為督查員關(guān)鍵工作是檢驗(yàn)步驟符合度和運(yùn)維最終效果,同時(shí)也起到一個(gè)工作過程監(jiān)管作用,形成運(yùn)維工作連續(xù)改善依據(jù)。檢驗(yàn)工作步驟實(shí)施情況,派發(fā)工作整改單實(shí)施用戶滿意度調(diào)查實(shí)施用戶新需求調(diào)研工作檢驗(yàn)情況匯總統(tǒng)計(jì)運(yùn)維KPI指標(biāo),提供改善依據(jù)運(yùn)維質(zhì)量確保體系內(nèi)部評(píng)審現(xiàn)在,行為督查員同時(shí)負(fù)擔(dān)了勞動(dòng)監(jiān)察和用戶反饋雙重角色,作為PDCA循環(huán)中“檢驗(yàn)”這一關(guān)鍵步驟,行為督查擔(dān)負(fù)了為運(yùn)維工作連續(xù)改善提供量化依據(jù)職責(zé)。行為督查員需要1-2人,無需輪班。技術(shù)教授作為運(yùn)維工作關(guān)鍵,技術(shù)教授將負(fù)擔(dān)對(duì)整個(gè)運(yùn)維技術(shù)、步驟、規(guī)范制訂和改善工作,同時(shí),當(dāng)一線人員碰到難以處理問題時(shí),技術(shù)教授會(huì)從二線轉(zhuǎn)為一線,為用戶排除故障。制訂和改善運(yùn)維步驟和規(guī)章制度幫助運(yùn)維工程師處理技術(shù)難題研制新服務(wù)內(nèi)容追蹤問題及處理方案研發(fā)運(yùn)維自動(dòng)化產(chǎn)品研發(fā)運(yùn)維配套軟件維護(hù)配置數(shù)據(jù)庫技術(shù)教授是一個(gè)團(tuán)體,通常依據(jù)各自熟悉業(yè)務(wù),分為多個(gè)技術(shù)教授。技術(shù)教授通常集中辦公,按需提供技術(shù)支撐保障。技術(shù)教授是PDCA循環(huán)中計(jì)劃制訂者,也是改善實(shí)施者,承前啟后,而且為工程師和用戶提供專業(yè)技術(shù)支持,是整個(gè)團(tuán)體靈魂?,F(xiàn)在,在******數(shù)據(jù)中心機(jī)房運(yùn)維教授團(tuán)體中,需要機(jī)房環(huán)境、IT設(shè)備、數(shù)字網(wǎng)絡(luò)、操作系統(tǒng)和數(shù)據(jù)庫、軟件研發(fā)方面教授,因?yàn)楦髂芤蝗硕囗?xiàng),所以教授人數(shù)約在3-5人左右不等。文檔管理員文檔管理員是為了確保運(yùn)維工作受控,建立企業(yè)知識(shí)庫,提升運(yùn)維水平所必需配置。文檔管理員首先是實(shí)現(xiàn)了紙質(zhì)文檔和電子文檔歸類方便于查詢,其次則是整理出知識(shí)形成知識(shí)庫。搜集運(yùn)維過程文件,分類歸檔搜集外來文件,分類歸檔電子檔案歷史版本管理維護(hù)運(yùn)維知識(shí)庫業(yè)務(wù)資料查詢文檔規(guī)范化管理******數(shù)據(jù)中心機(jī)房運(yùn)維文檔管理員需要1名專職或兼職人員。管理人員為了團(tuán)體管理和實(shí)際工作擴(kuò)展,可能還需要增加部分人員配置,方便于工作開展。這些人員通常能夠在前述角色中尋求人員兼任。運(yùn)維團(tuán)體總責(zé)任人,關(guān)鍵進(jìn)行管理工作,調(diào)配人員運(yùn)維管理人員,負(fù)責(zé)運(yùn)維工作中日常管理,跟幫助配全等工作。其中運(yùn)維團(tuán)體總責(zé)任人可能會(huì)由運(yùn)維承接單位人員兼任。自動(dòng)化建設(shè)自動(dòng)化建設(shè)依據(jù)(基礎(chǔ)設(shè)施類、業(yè)務(wù)系統(tǒng)類、應(yīng)用能力類)進(jìn)行劃分。提供自動(dòng)告警提供短信、郵件和聲光等手段通知監(jiān)控人員。監(jiān)控人員能夠看到業(yè)務(wù)系統(tǒng)實(shí)時(shí)未處理告警數(shù)目、告警詳情。并能夠?qū)Ω婢M(jìn)行故障預(yù)判,系統(tǒng)會(huì)統(tǒng)計(jì)下告警處理過程,對(duì)有通用性處理方案能夠歸入知識(shí)庫。建立集中日志動(dòng)態(tài)監(jiān)控和分析系統(tǒng),為了提升故障綜合分析能力、經(jīng)過關(guān)聯(lián)關(guān)系分析故障原因;提供特定場(chǎng)景監(jiān)控分析,比如關(guān)鍵商品下載性能、VIP用戶使用性能分析等等;并快速響應(yīng)新、甚至是自定義監(jiān)控和分析需求。經(jīng)過可視化界面從業(yè)務(wù)系統(tǒng)內(nèi)部組成角度,即經(jīng)過拓?fù)潢P(guān)系來對(duì)告警進(jìn)行展示和處理,經(jīng)過業(yè)務(wù)系統(tǒng)組成配置,能夠把業(yè)務(wù)系統(tǒng)各個(gè)組成部分,各部分之間聯(lián)絡(luò)經(jīng)過圖形化界面方法直觀展示。當(dāng)其中某一點(diǎn)發(fā)生告警時(shí),對(duì)應(yīng)部分將會(huì)有顏色改變,監(jiān)控人員能夠看到該告警可能影響業(yè)務(wù),從而有針對(duì)性加強(qiáng)監(jiān)控?,F(xiàn)有自動(dòng)化軟件及遠(yuǎn)景也伴隨信息化管理********也邁向自動(dòng)化設(shè)計(jì)及管理,現(xiàn)集團(tuán)企業(yè)、各機(jī)關(guān)也在利用自動(dòng)化工作及軟件,如SEP、安全監(jiān)控軟件、包含輔助辦公軟件等。為完善更高運(yùn)維要求,做到IT運(yùn)維自動(dòng)化監(jiān)控和管理平臺(tái)??偠灾瑢?shí)現(xiàn)IT運(yùn)維自動(dòng)化管理是指經(jīng)過將IT運(yùn)維中日常、大量反復(fù)性工作自動(dòng)化,把過去手工實(shí)施轉(zhuǎn)為自動(dòng)化操作。自動(dòng)化是IT運(yùn)維工作升華,IT運(yùn)維自動(dòng)化不單純是一個(gè)維護(hù)過程,更是一個(gè)管理提升過程,是IT運(yùn)維最高層次,也是未來發(fā)展趨勢(shì)。運(yùn)維工具介紹NagiosNagios是一款開源無償網(wǎng)絡(luò)監(jiān)視工具,能有效監(jiān)控Windows、Linux和Unix主機(jī)狀態(tài),交換機(jī)、路由器等網(wǎng)絡(luò)設(shè)置,打印機(jī)等。在系統(tǒng)或服務(wù)狀態(tài)異常時(shí)發(fā)出郵件或短信報(bào)警第一時(shí)間通知網(wǎng)站運(yùn)維人員,在狀態(tài)恢復(fù)后發(fā)出正常郵件或短信通知。Nagios能夠監(jiān)控功效有:監(jiān)控網(wǎng)絡(luò)服務(wù)(SMTP、POP3、HTTP、NNTP、PING等);監(jiān)控主機(jī)資源(處理器負(fù)荷、磁盤利用率等);簡(jiǎn)單地插件設(shè)計(jì)使得用戶能夠方便地?cái)U(kuò)展自己服務(wù)檢測(cè)方法;并行服務(wù)檢驗(yàn)機(jī)制;含有定義網(wǎng)絡(luò)分層結(jié)構(gòu)能力,用"parent"主機(jī)定義來表示網(wǎng)絡(luò)主機(jī)間關(guān)系,這種關(guān)系可被用來發(fā)覺和明晰主機(jī)宕機(jī)或不可達(dá)狀態(tài);當(dāng)服務(wù)或主機(jī)問題產(chǎn)生和處理時(shí)將告警發(fā)送給聯(lián)絡(luò)人(經(jīng)過EMail、短信、用戶定義方法);能夠定義部分處理程序,使之能夠在服務(wù)或主機(jī)發(fā)生故障時(shí)起到預(yù)防作用;自動(dòng)日志滾動(dòng)功效;能夠支持并實(shí)現(xiàn)對(duì)主機(jī)冗余監(jiān)控;可選WEB界面用于查看目前網(wǎng)絡(luò)狀態(tài)、通知和故障歷史、日志文件等。PUPPETpuppet是一個(gè)Linux、Unix、windows平臺(tái)集中配置管理系統(tǒng),使用自有puppet描述語言,可管理配置文件、用戶、cron任務(wù)、軟件包、系統(tǒng)服務(wù)等。puppet把這些系統(tǒng)實(shí)體稱之為資源,puppet設(shè)計(jì)目標(biāo)是簡(jiǎn)化對(duì)這些資源管理和妥善處理資源間依靠關(guān)系。puppet采取C/S星狀結(jié)構(gòu),全部用戶端和一個(gè)或多個(gè)服務(wù)器交互。每個(gè)用戶端周期(默認(rèn)半個(gè)小時(shí))向服務(wù)器發(fā)送請(qǐng)求,取得其最新配置信息,確保和該配置信息同時(shí)。每個(gè)puppet用戶端每半小時(shí)(能夠設(shè)置)連接一次服務(wù)器端,下載最新配置文件,而且嚴(yán)格根據(jù)配置文件來配置服務(wù)器。配置完成以后,puppet用戶端能夠反饋給服務(wù)器端一個(gè)消息。假如犯錯(cuò),也會(huì)給服務(wù)器端反饋一個(gè)消息。開發(fā)puppet是為了讓系統(tǒng)管理員能夠相互交流和共享成熟工具,避免反復(fù)勞動(dòng).經(jīng)過以下兩個(gè)特征來實(shí)現(xiàn)這一目標(biāo):提供一個(gè)簡(jiǎn)練不過強(qiáng)大框架來完成系統(tǒng)管理任務(wù)系統(tǒng)管理任務(wù)能夠描述成puppet語言,所以能夠相互分享代碼,就像分享其它語言代碼一樣,比如python,c等所以,作為系統(tǒng)管理員你能夠愈加快完成工作,因?yàn)槟隳軌蛴胮uppet來處理全部管理細(xì)節(jié),甚至你還能夠下載其它管理員puppet代碼來讓你工作完成愈加快。CACTICacti是經(jīng)過snmpget來獲取數(shù)據(jù),使用RRDTool繪畫圖形,而且你完全能夠不需要了解RRDTool復(fù)雜參數(shù)。它提供了很強(qiáng)大數(shù)據(jù)和用戶管理功效,能夠指定每一個(gè)用戶能查看樹狀結(jié)構(gòu)、host和任何一張圖,還能夠和LDAP結(jié)合進(jìn)行用戶驗(yàn)證,同時(shí)也能自己增加模板,功效很強(qiáng)大完善。界面友好。Cacti發(fā)展是基于讓RRDTool使用者更方便使用該軟件,除了基礎(chǔ)SNMP流量跟系統(tǒng)資訊監(jiān)控外,Cacti也可外掛Scripts及加上Templates來作出各式各樣監(jiān)控圖。Cacti是用php語言實(shí)現(xiàn)一個(gè)軟件,它關(guān)鍵功效是用snmp服務(wù)獲取數(shù)據(jù),然后用rrdtool儲(chǔ)存和更新數(shù)據(jù),當(dāng)用戶需要查看數(shù)據(jù)時(shí)候用rrdtool生成圖表展現(xiàn)給用戶。所以,snmp和rrdtool是cacti關(guān)鍵。snmp關(guān)系著數(shù)據(jù)搜集,rrdtool關(guān)系著數(shù)據(jù)存放和圖表生成。Mysql配合PHP程序存放部分變量數(shù)據(jù)并對(duì)變量數(shù)據(jù)進(jìn)行調(diào)用,如:主機(jī)名、主機(jī)ip、snmp團(tuán)體名、端口號(hào)、模板信息等變量。自主軟件工具研發(fā)現(xiàn)在,地研院正在和外部相關(guān)企業(yè)共同組成研發(fā)隊(duì)伍,在充足了解市場(chǎng)已經(jīng)有產(chǎn)品(如北塔、摩卡等)優(yōu)勢(shì)和缺點(diǎn)后,結(jié)合中石油和********本身實(shí)際情況,研發(fā)符合需要運(yùn)維軟件工具?,F(xiàn)在正在研發(fā)和計(jì)劃研發(fā)內(nèi)容包含:工單系統(tǒng),跟蹤任務(wù)步驟,實(shí)現(xiàn)在線知識(shí)采集、用戶反饋,由此來固化操作步驟、搜集運(yùn)維數(shù)據(jù)基礎(chǔ)配置項(xiàng)數(shù)據(jù)庫系統(tǒng),整理機(jī)房運(yùn)維資源和對(duì)象,是運(yùn)維工作基礎(chǔ)中基礎(chǔ)知識(shí)庫系統(tǒng),是業(yè)務(wù)知識(shí)和技術(shù)步驟固化關(guān)鍵手段運(yùn)維數(shù)據(jù)統(tǒng)計(jì)分析系統(tǒng)中央運(yùn)維門戶平臺(tái),集成各個(gè)不一樣廠商運(yùn)維或監(jiān)控系統(tǒng)數(shù)據(jù),并采取門戶方法集中展現(xiàn)現(xiàn)在我們已經(jīng)在開展部分工作,如工單創(chuàng)建和跟蹤,以逐步規(guī)范運(yùn)維管理工作。運(yùn)維實(shí)施運(yùn)維規(guī)范步驟我們遵照ISO/0標(biāo)準(zhǔn)規(guī)范提出十大步驟,其中一線職員通常提供巡檢、排障、技術(shù)支持等工作,是用戶可見部分,而客服中心、教授、督查、后勤等角色,和用戶也會(huì)有接觸,但其關(guān)鍵工作是不可見。鑒于步驟和表單是運(yùn)維服務(wù)工作關(guān)鍵組成部分,在此我們以數(shù)個(gè)規(guī)范步驟作為示例,表述在ITILv3和ISO/0指導(dǎo)思想下,怎樣結(jié)合******數(shù)據(jù)中心機(jī)房運(yùn)維實(shí)際需求,開發(fā)滿足本身需要操作步驟。服務(wù)分工序號(hào)服務(wù)模塊內(nèi)容描述提供方1機(jī)房環(huán)境依據(jù)標(biāo)準(zhǔn)規(guī)范,對(duì)機(jī)房環(huán)境進(jìn)行檢驗(yàn),是否防潮防塵地研院,外協(xié)2機(jī)房衛(wèi)生對(duì)機(jī)房衛(wèi)生檢驗(yàn),是否四處是垃圾地研院,外協(xié)3UPS檢驗(yàn)UPS情況地研院,外協(xié),廠商4綜合布線、網(wǎng)絡(luò)檢驗(yàn)各電纜線、光纖、網(wǎng)線等是否有損壞地研院,外協(xié)5機(jī)房供電制冷設(shè)施確保機(jī)房供電和制冷正常工作地研院,外協(xié),廠商6設(shè)備上架和更換操作設(shè)備上架實(shí)施,被放置位置列柜、機(jī)架等地研院,外協(xié)7系統(tǒng)安裝依據(jù)需求對(duì)設(shè)備操作系統(tǒng)規(guī)范安裝地研院,外協(xié)應(yīng)用系統(tǒng)依據(jù)需求對(duì)系統(tǒng)應(yīng)用系統(tǒng)維護(hù)地研院,外協(xié)8現(xiàn)場(chǎng)軟件升級(jí)業(yè)務(wù)維護(hù)方負(fù)責(zé)對(duì)舊版本、低版本軟件升級(jí)操作地研院,外協(xié),廠商9現(xiàn)場(chǎng)故障診療對(duì)出現(xiàn)問題進(jìn)行分析、診療地研院,外協(xié)10電話遠(yuǎn)程支撐對(duì)駐點(diǎn)工作人員不能處理問題進(jìn)行給幫助地研院,外協(xié)技術(shù)支撐對(duì)疑難問題技術(shù)分析、探討、總結(jié)處理問題外協(xié),廠家11問題管理系統(tǒng)負(fù)責(zé)對(duì)日常故障統(tǒng)計(jì)和分析、總結(jié)地研院,外協(xié)12門禁管理負(fù)責(zé)對(duì)外來人員登記管理地研院,外協(xié)設(shè)備上架步驟設(shè)備上架步驟,首先需求方提起需求申請(qǐng),提議工單到運(yùn)維服務(wù)臺(tái),填寫需求申請(qǐng)表,相關(guān)領(lǐng)導(dǎo)審核經(jīng)過后,步驟提交到運(yùn)維部門,到上架實(shí)施,上架驗(yàn)證,日常維護(hù)等工作。步驟說明需求方提出新增服務(wù)器需求。服務(wù)臺(tái)派發(fā)工單,判定上架設(shè)備類型,讓申請(qǐng)需求全部填寫申請(qǐng)表,并將申請(qǐng)資源發(fā)給資產(chǎn)管理員。物理服務(wù)器由資產(chǎn)管理員指定特定物理位置組織人員服務(wù)器上架(安裝電源線、網(wǎng)線)維護(hù)人員按需求安裝操作系統(tǒng)。把回單回執(zhí)給需求方。資產(chǎn)管理員更新資產(chǎn)列表。由需求方自于安裝應(yīng)用軟件。軟件運(yùn)行正常后,由運(yùn)維中心按需求進(jìn)行安全檢驗(yàn)。試運(yùn)行正常,投入生產(chǎn),納入IT監(jiān)控、業(yè)務(wù)監(jiān)控、投入維護(hù)工作。設(shè)備申請(qǐng)如服務(wù)器、網(wǎng)絡(luò)上架需要申請(qǐng)人或申請(qǐng)部門填寫設(shè)備申請(qǐng)表,得到簽字同意后方可根據(jù)步驟繼續(xù)進(jìn)行。資源核查本階段關(guān)鍵包含以下工作需求確定和資源檢驗(yàn)。申請(qǐng)部門填寫《設(shè)備資源申請(qǐng)表》,設(shè)備申請(qǐng)部門各表單所填寫用戶信息、設(shè)備信息必需一致,經(jīng)部門經(jīng)理審核后,和《設(shè)備上架申請(qǐng)書》一并提交至運(yùn)維部門備檔管理,并對(duì)需求進(jìn)行歸口管理。資料檢驗(yàn)包含被分配資源信息進(jìn)行查對(duì),詳情見《設(shè)備驗(yàn)收上架表》,如檢驗(yàn)合格后,需要簽字確定,運(yùn)維部分需存檔。上架實(shí)施資源申請(qǐng)到位后,則實(shí)施上架實(shí)施工作,上架實(shí)施前,由維護(hù)人員提議上架實(shí)施工單至服務(wù)臺(tái),服務(wù)臺(tái)進(jìn)行統(tǒng)計(jì),納入到工單系統(tǒng)。對(duì)信息事件進(jìn)行備檔處理。上架后,需要維護(hù)人員依據(jù)上架信息表進(jìn)行補(bǔ)充工單信息,包含上架位置、電源接口,所占U數(shù)據(jù),上架時(shí)間,上架人員,維護(hù)人員等,而且需要需求方和設(shè)備方簽字確定簽字上架完成后,即完結(jié)工單。上架信息歸檔維護(hù)中心依據(jù)已經(jīng)上架設(shè)備信息進(jìn)行整理歸檔,上架信息表是對(duì)服務(wù)器已經(jīng)上架后確實(shí)定信息表,確保上架設(shè)備信息完備性,便于運(yùn)維資產(chǎn)信息管理。納入日常運(yùn)維從設(shè)備上架之日起,確定了責(zé)任部門及運(yùn)維部分,就根據(jù)運(yùn)維步驟開始日常維護(hù)工作,包含日常巡檢、故障處理、優(yōu)化建設(shè)、作業(yè)計(jì)劃等。過程表單********設(shè)備上架申請(qǐng)書項(xiàng)目名稱聯(lián)絡(luò)人聯(lián)絡(luò)電話所屬部門工作郵箱申請(qǐng)時(shí)間上架時(shí)間注:如特殊需求內(nèi)容為加急或臨時(shí)(測(cè)試),則上架時(shí)間和申請(qǐng)時(shí)間間隔不得超出要求時(shí)間。需求事項(xiàng)1.加急上架(不超出要求時(shí)限);2.臨時(shí)上架(需給出下架時(shí)間);3.其它需求原因及操作內(nèi)容:設(shè)備內(nèi)容設(shè)備型號(hào)大?。║數(shù))服務(wù)器配置數(shù)量資產(chǎn)編碼IP需求核定功耗產(chǎn)權(quán)歸屬上架進(jìn)機(jī)房人員姓名電話身份證號(hào)碼姓名電話身份證號(hào)碼姓名電話身份證號(hào)碼姓名電話身份證號(hào)碼申請(qǐng)部門經(jīng)理簽字:運(yùn)維部經(jīng)理意見:備注:

服務(wù)器類型請(qǐng)假依據(jù)用戶自己服務(wù)器類型在對(duì)應(yīng)位置做以下標(biāo)識(shí)

設(shè)備需求和《******數(shù)據(jù)中心機(jī)房設(shè)備申請(qǐng)表》內(nèi)容相對(duì)應(yīng)******數(shù)據(jù)中心機(jī)房設(shè)備申請(qǐng)表項(xiàng)目名稱使用周期編號(hào)申請(qǐng)事由申請(qǐng)內(nèi)容項(xiàng)目類型□中大型申請(qǐng)環(huán)境□正式環(huán)境□小型□測(cè)試環(huán)境設(shè)備類型設(shè)備型號(hào)配置需求申請(qǐng)數(shù)量設(shè)備編號(hào)其它物資申請(qǐng)人(署名):審核人意見:申請(qǐng)人單位:審核人(署名):年月日年月日備注為確保******數(shù)據(jù)中心機(jī)房運(yùn)維規(guī)范化、步驟化、高效化、及上線應(yīng)用穩(wěn)定,控制項(xiàng)目應(yīng)用上線質(zhì)量,提升成功公布率,運(yùn)維需依據(jù)項(xiàng)目新上線(步驟控制)進(jìn)行上線。注:

1)“中大型”項(xiàng)目必需填寫此表,并以紙張形式走申請(qǐng)步驟,書面簽字確定,而且交由檔案部備紙質(zhì)管理;

2)“小型”項(xiàng)目填寫此表后,以電子郵件系統(tǒng)審批確定,生成電子備檔;設(shè)備驗(yàn)收上架表時(shí)間廠商防偽查詢是□否□設(shè)備型號(hào)是□否□合格證有□無□序列號(hào)╱服務(wù)號(hào)設(shè)備類型服務(wù)器交換機(jī)╱路由器防火墻存放設(shè)備□□□□設(shè)備配置參數(shù)設(shè)備包裝清單設(shè)備上架計(jì)劃書上架時(shí)間上架人員上架位置設(shè)備開機(jī)測(cè)試質(zhì)保周期工程監(jiān)理(簽字)乙方承包商(簽字)甲方人員(簽字)備注上架信息表服務(wù)器名稱確定檢驗(yàn)上架服務(wù)器名稱,型號(hào),占用空間大小,額定功率。上架服務(wù)器在試驗(yàn)臺(tái)上電,是否能正常開機(jī);能正常開機(jī)進(jìn)入第三步,不能正常開機(jī)返廠。機(jī)房工作人員檢驗(yàn)機(jī)柜空余空間,空余PDU插座。符合機(jī)柜安全用電、空余空間、空余PDU插座情況下,上架服務(wù)器在此機(jī)柜。安裝服務(wù)器完成后,在此服務(wù)器貼標(biāo)簽(使用單位,維護(hù)單位,安裝日期),電源線貼標(biāo)簽(使用了哪個(gè)PDU插座)。特殊情況:機(jī)柜空間滿,不能安裝服務(wù)器。機(jī)柜空間有余量,但用電超出機(jī)柜安全用電,提議不在此機(jī)柜安裝。機(jī)柜空間有余量,PDU插座用完,服務(wù)器用電在機(jī)柜安全用電范圍內(nèi),機(jī)房工作人員向管理中心申請(qǐng),能否在增加一個(gè)PDU,能增加此服務(wù)器安裝在此,不能增加PDU,此服務(wù)器不能安裝在此。返回到第三步。機(jī)房工作人員統(tǒng)計(jì)此次上架情況在表單中。型號(hào)功率驗(yàn)電情況所在機(jī)房所在列柜所在U數(shù)所占U數(shù)PDU插座服務(wù)器標(biāo)簽使用單位維護(hù)單位安裝日期安裝人員確定人員云桌面管理機(jī)關(guān)個(gè)人(調(diào)入、借用、項(xiàng)目合作)等相關(guān)人員需要新增云終端時(shí),由所在人員綜合科在《協(xié)同辦公系統(tǒng)》填寫《********企業(yè)桌面云終端申請(qǐng)表》,并由所在部門主管領(lǐng)導(dǎo)審批后,報(bào)送機(jī)關(guān)事務(wù)辦及信息管理部,由機(jī)關(guān)事務(wù)辦發(fā)放物理終端設(shè)備,信息管理部負(fù)責(zé)數(shù)據(jù)配置,運(yùn)維組負(fù)責(zé)云桌面實(shí)施。云桌面申請(qǐng)步驟由業(yè)務(wù)需求者提議云桌面申請(qǐng)需求使用者填寫業(yè)務(wù)申請(qǐng)單模版經(jīng)過OA系統(tǒng)提交至部門文書審核部門文書審核經(jīng)過后步驟轉(zhuǎn)至部門領(lǐng)導(dǎo)審批。部門領(lǐng)導(dǎo)審批經(jīng)過后步驟轉(zhuǎn)至信息管理部。信息管理部審批經(jīng)過后,步驟轉(zhuǎn)至運(yùn)維組及機(jī)關(guān)事務(wù)辦運(yùn)維實(shí)施制作虛擬桌面,同時(shí)機(jī)關(guān)事務(wù)辦發(fā)放設(shè)備及制卡最終申請(qǐng)者進(jìn)行確定和驗(yàn)證云資源申請(qǐng)書云桌面申請(qǐng)表要包含使用信息,及申請(qǐng)業(yè)務(wù)介紹及所需資源信息等。申請(qǐng)中依據(jù)職員編號(hào)時(shí)行唯一索引。申請(qǐng)信息需由申請(qǐng)人部門領(lǐng)導(dǎo)、信息管理部簽字審核經(jīng)過后,運(yùn)維組需保留申請(qǐng)表進(jìn)行備檔云桌面撤銷步驟若工作人員已申請(qǐng)桌面云資源因工作調(diào)動(dòng)、離職或其它原因,致使資源閑置,需提出桌面資源注銷申請(qǐng)。并由所在部門填寫《機(jī)關(guān)辦公用戶資源回收表》,由注銷所在存放資源并系統(tǒng)回收,并走云資源撒銷步驟。部門提交離職人員名單,提交至部門領(lǐng)導(dǎo)審批。審批通知后步驟轉(zhuǎn)至信息管理部審批信息管理部審批審核經(jīng)過后,步驟轉(zhuǎn)至機(jī)關(guān)事務(wù)辦,機(jī)關(guān)事務(wù)辦時(shí)行對(duì)變更人員確定是否歸還設(shè)備各IC卡機(jī)關(guān)事務(wù)辦確定后,由運(yùn)維組進(jìn)行實(shí)施,注銷虛擬桌面云桌面統(tǒng)一安裝云桌面安裝由運(yùn)維部指定運(yùn)維工程師負(fù)責(zé)安裝和事件協(xié)調(diào)云桌面安裝應(yīng)該依據(jù)云桌面數(shù)據(jù)配置規(guī)范進(jìn)行默認(rèn)需求安裝。如申請(qǐng)者有特殊需求,填寫申請(qǐng)表,備注清楚需求安裝需求信息云桌面分配要符合安全基線要求,確保數(shù)據(jù)安全、信息安全、系統(tǒng)安全、帳戶安全安裝完成后,運(yùn)維工程師需要填寫工單信息,包含具體步驟及安裝說明等信息工單完成后更新日常知識(shí)庫內(nèi)容云桌面信息歸檔云桌面回單完成后,由指定運(yùn)維中心檔案角色負(fù)責(zé)云桌面信息管理,便于信息檢索和更新,包含日常版本信息、變更等。云資源分配時(shí)間業(yè)務(wù)介紹IP地址使用人責(zé)任人維護(hù)人變更信息備注操作系統(tǒng)規(guī)范步驟為避免救火式運(yùn)維服務(wù),運(yùn)維工作面對(duì)以后膨脹業(yè)務(wù)量,須要有一套完善操作系統(tǒng)安裝規(guī)范,從而降低人力、物力、財(cái)力成本,達(dá)成高性能運(yùn)維服務(wù),另外建立此安裝規(guī)范,對(duì)于知識(shí)繼承達(dá)成了極好效果。web服務(wù)器操作系統(tǒng)安裝前需做具體調(diào)研,方便運(yùn)維部門完善地計(jì)劃和安裝服務(wù)器。服務(wù)器安裝操作系統(tǒng)前需調(diào)研計(jì)劃以下方面:服務(wù)器物理硬件配置計(jì)劃需要進(jìn)行安裝操作系統(tǒng)和版本是否集成虛擬化,和虛擬化主機(jī)相關(guān)硬件資源分配登陸用戶和口令管理所需業(yè)務(wù)和相關(guān)應(yīng)用網(wǎng)絡(luò)、域名和IP計(jì)劃計(jì)算機(jī)域計(jì)劃備注相關(guān)聯(lián)業(yè)務(wù)、虛擬機(jī)、服務(wù)器之間網(wǎng)絡(luò)聯(lián)絡(luò)和鏈路數(shù)據(jù)服務(wù)器硬件配置調(diào)研和操作系統(tǒng)、虛擬機(jī)計(jì)劃安裝基于windows操作系統(tǒng),服務(wù)器磁盤最少分成三個(gè)區(qū),用途分別為系統(tǒng)分區(qū)、安裝軟件分區(qū)、數(shù)據(jù)備份分區(qū),每個(gè)分區(qū)格式大小依據(jù)服務(wù)器空間而定,類型必需為NTFS。Linux自定義分區(qū)(注意:一定把下列分區(qū)安裝到第一塊默認(rèn)盤上面)分區(qū):分區(qū)名大小說明Swap內(nèi)存x2虛擬磁盤空間/2G根目錄/usr5G安裝應(yīng)用程序/var5G臨時(shí)文件存放,日志等/boot100M系統(tǒng)引導(dǎo)文件/home余下全部存放用戶數(shù)據(jù)依據(jù)運(yùn)維要求,各目錄要根據(jù)統(tǒng)一目錄規(guī)范進(jìn)行配置和管理。對(duì)于windows操作系統(tǒng)安全策略和帳號(hào)策略全部應(yīng)根據(jù)********服務(wù)器運(yùn)維規(guī)范《********服務(wù)運(yùn)維安全基線》進(jìn)行配置。對(duì)于Linux安全策略,如root登錄漏洞等,必需修改配置文件進(jìn)行保護(hù)。日常行為準(zhǔn)則必需注意環(huán)境衛(wèi)生。嚴(yán)禁在機(jī)房?jī)?nèi)吃食物,抽煙,隨地吐痰;對(duì)于意外或工作過程中弄污機(jī)房地板和其它物品,必需立即采取方法清理潔凈,保持機(jī)房無塵潔凈環(huán)境定時(shí)檢驗(yàn)工作區(qū)操作終端運(yùn)行情況定時(shí)對(duì)辦公區(qū)和桌椅進(jìn)行清潔和消毒機(jī)房用具要各歸其位,不能隨意亂放注意檢驗(yàn)機(jī)房防曬,防水,防潮,維持機(jī)房溫度在攝氏20~24度機(jī)房工作人員應(yīng)有義務(wù)安全和小心使用機(jī)房任何設(shè)備,儀器等物品,在使用完成后應(yīng)將物品歸還并存放于原處,不應(yīng)隨意擺放對(duì)于使用過程中損壞,遺失物品應(yīng)匯報(bào)登記,并對(duì)責(zé)任人追究相關(guān)責(zé)任未經(jīng)上級(jí)領(lǐng)導(dǎo)同意,不許可向她人外借或提供機(jī)房設(shè)備和物品運(yùn)維制度監(jiān)控值班制度********中心機(jī)房運(yùn)維建立7x二十四小時(shí)監(jiān)控值班制度機(jī)房監(jiān)控人員在值班時(shí)間內(nèi)要堅(jiān)守崗位,集中精力。要求監(jiān)控值班人員對(duì)告警系統(tǒng)實(shí)時(shí)監(jiān)控,并對(duì)設(shè)備和各業(yè)務(wù)系統(tǒng)使用情況進(jìn)行巡視和測(cè)試,機(jī)房監(jiān)控人員若發(fā)覺異常情況,應(yīng)立即處理,并立即上報(bào)。異常情況包含但不限于:日常巡檢異常(如設(shè)備指示燈異常、資源占用超出閥值、平臺(tái)業(yè)務(wù)系統(tǒng)宕機(jī)、業(yè)務(wù)鏈接失效等)、IT監(jiān)控系統(tǒng)告警、機(jī)房環(huán)境惡化、硬件故障、大量用戶投訴等監(jiān)控人員必需遵守業(yè)務(wù)和障礙處理步驟,正確快速地處理業(yè)務(wù)和障礙,不得以任何理由推諉、拖延、隱瞞故障監(jiān)控人員必需立即、正確、完整地填寫值班日志和交接班統(tǒng)計(jì)等多種要求統(tǒng)計(jì)文檔監(jiān)控人員不得隨意關(guān)閉設(shè)備告警,不得人為切斷和私人占用業(yè)務(wù)電話,不得做和工作無關(guān)事情監(jiān)控人員必需按時(shí)完成作業(yè)計(jì)劃和上級(jí)交辦其它事項(xiàng)監(jiān)控人員必需嚴(yán)格遵守通信紀(jì)律、安全保密制度和其它各項(xiàng)規(guī)章制度交接班制度交接班必需按時(shí),接班人未到崗,交班人不得離崗交接班內(nèi)容:統(tǒng)合布線、障礙情況,備品備件、文件資料、工具儀表,相關(guān)通知,上級(jí)指示和需由接班人繼續(xù)處理問題交接方法:交接班人員應(yīng)將交接內(nèi)容逐項(xiàng)檢驗(yàn)核實(shí)并確定無誤,在值班交接班日志上簽字后,交班人方可離崗。并由維護(hù)主管定時(shí)審核交接內(nèi)容交接班過程中發(fā)生障礙或事故,應(yīng)暫停交接,以交班人員為主,接班人幫助共同處理,直至障礙或事故消除,或處理告一段落后再繼續(xù)交接因漏交或錯(cuò)交產(chǎn)生問題,由交班人員負(fù)擔(dān)責(zé)任;因漏接或錯(cuò)接而產(chǎn)生問題,由接班人負(fù)擔(dān)責(zé)任;交接雙方均未發(fā)覺問題,由雙方負(fù)擔(dān)責(zé)任日常維護(hù)制度設(shè)備要清潔潔凈,防塵防潮系統(tǒng)軟件維護(hù)要求嚴(yán)禁在服務(wù)器上安裝和運(yùn)行和工作無關(guān)軟件軟件維護(hù)須由專員負(fù)責(zé),并嚴(yán)格做好日常維護(hù)工作軟件版本更新(升級(jí))、軟件修改必需遵守先審批后實(shí)施標(biāo)準(zhǔn)檢驗(yàn)?zāi)壳斑\(yùn)行系統(tǒng)是否為最新版本,立即更新操作系統(tǒng)需要補(bǔ)丁程序包采取防病毒方法并定時(shí)查毒、殺毒數(shù)據(jù)維護(hù)要求 嚴(yán)禁隨意改動(dòng)數(shù)據(jù),假如要修改數(shù)據(jù),必需要取得主管人員同意,而且修改前要做好數(shù)據(jù)備份,修改后要做好修改統(tǒng)計(jì),并在一周內(nèi)確定設(shè)備運(yùn)行正常維護(hù)人員應(yīng)立即清理磁盤文件和數(shù)據(jù)庫空間,刪除過時(shí)或無用數(shù)據(jù)和文件,應(yīng)隨時(shí)確保磁盤空閑空間≥20%和數(shù)據(jù)庫空間充足系統(tǒng)備份要求各業(yè)務(wù)維護(hù)平臺(tái)負(fù)責(zé)制訂備份計(jì)劃,備份時(shí)間分為日備份、周備份、月備份備份數(shù)據(jù)選擇磁盤、磁帶或光盤存放,同時(shí)采取在線和離線存放方法。介質(zhì)需用標(biāo)簽注明備份內(nèi)容、備份時(shí)間在做系統(tǒng)割接、版本升級(jí)、參數(shù)變更之前,必需進(jìn)行相關(guān)系統(tǒng)、數(shù)據(jù)配置備份,方便在變更失敗時(shí)立即恢復(fù)每三個(gè)月檢驗(yàn)一次備份數(shù)據(jù)有效性系統(tǒng)安全要求平臺(tái)設(shè)備口令要求專員負(fù)責(zé),對(duì)于root用戶密碼,要求最少每個(gè)月修改一次,并建檔備查平臺(tái)要求含有容災(zāi)系統(tǒng),每六個(gè)月或重大通信保障任務(wù)之前進(jìn)行倒換測(cè)試每三個(gè)月對(duì)平臺(tái)進(jìn)行安全掃描和巡檢維護(hù)人員要求維護(hù)人員要求專員專崗,不得兼做和本職員作無關(guān)其它事務(wù)維護(hù)人員要求技術(shù)過硬,全方面深入掌握所維護(hù)系統(tǒng)系統(tǒng)架構(gòu)和技術(shù)細(xì)節(jié)全部維護(hù)人員,必需7X二十四小時(shí)手機(jī)開機(jī),若手機(jī)故障或較長(zhǎng)時(shí)間(2小時(shí)以上)進(jìn)入無信號(hào)區(qū),應(yīng)立即通知上級(jí)主管人員聯(lián)絡(luò)方法,維護(hù)人員對(duì)于未接聽工作電話,必需在20分鐘內(nèi)回?fù)芄?jié)假日工作制度在關(guān)鍵法定假日前一周內(nèi)須開展安全巡檢巡檢內(nèi)容包含但不限于:桌面、綜合布線、機(jī)房環(huán)境、硬件設(shè)施、操作系統(tǒng)、數(shù)據(jù)庫、磁盤陣列、應(yīng)用軟件、配置數(shù)據(jù)、數(shù)據(jù)備份等節(jié)假日前準(zhǔn)備工作值班表:在節(jié)假日前5個(gè)工作日,服務(wù)臺(tái)、維護(hù)中心應(yīng)制訂值班安排表,并報(bào)送各相關(guān)部門,節(jié)假日值班表,包含客服中心值班表和維保廠商值班表安全檢驗(yàn):在關(guān)鍵節(jié)假日或重大生產(chǎn)保障前3-5天,進(jìn)行一次設(shè)備現(xiàn)場(chǎng)安全檢驗(yàn),如發(fā)覺隱患應(yīng)立即排除自檢:在重大節(jié)假日應(yīng)提前3天內(nèi)提前做好自檢工作,以確保穩(wěn)定性、可用性在節(jié)假日期間監(jiān)控人員和當(dāng)班維護(hù)工程師要嚴(yán)格實(shí)施各項(xiàng)維護(hù)步驟,嚴(yán)守值班紀(jì)律,盡職盡責(zé),維護(hù)工程師在當(dāng)班期間必需留守在當(dāng)?shù)?,以確保能第一時(shí)間趕至現(xiàn)場(chǎng)全部維護(hù)人員在任何時(shí)間、任何地點(diǎn)全部必需確保二十四小時(shí)通訊通暢,若通訊工具存在障礙(無信號(hào)、無電等),必需要第一時(shí)間通知上級(jí)主管有效聯(lián)絡(luò)方法巡檢制度生產(chǎn)維護(hù)單位每三個(gè)月對(duì)系統(tǒng)巡檢一次,在重大生產(chǎn)保障期和關(guān)鍵節(jié)假日前,也應(yīng)對(duì)系統(tǒng)進(jìn)行巡檢,巡檢后一周內(nèi)出具巡檢匯報(bào)巡檢內(nèi)容機(jī)器運(yùn)行環(huán)境:散熱性能、清潔度、電源硬件設(shè)備完好情況:指示燈有沒有告警、系統(tǒng)有沒有硬件報(bào)錯(cuò)硬件資源占用情況:CPU、內(nèi)存、磁盤空間、I/0、網(wǎng)絡(luò)帶寬等軟件資源占用情況:表空間、文件系統(tǒng)、卷組、交換區(qū)、license等使用情況系統(tǒng)日志、root用戶郵件、hacmp.out、smit.log、bootlog等關(guān)鍵日志分析數(shù)據(jù)備份情況:系統(tǒng)自動(dòng)備份任務(wù)是否正常運(yùn)行網(wǎng)絡(luò)狀態(tài):網(wǎng)卡、IP、DNS、路由表、hosts等檢驗(yàn)磁盤陣列是否運(yùn)行正常,有沒有損壞盤系統(tǒng)補(bǔ)丁及安全軟件更新各應(yīng)用模塊檢驗(yàn)每三個(gè)月對(duì)平臺(tái)系統(tǒng)進(jìn)行一次安全掃描,由業(yè)務(wù)維護(hù)平臺(tái)對(duì)發(fā)覺安全隱患立即整改。對(duì)于平臺(tái)系統(tǒng)存在關(guān)鍵問題,建立教授會(huì)診制度,教授組員由信息管理部組織相關(guān)部門及支撐廠家維護(hù)部門等組成技術(shù)教授負(fù)責(zé)作業(yè)計(jì)劃制訂,作業(yè)計(jì)劃制訂后,報(bào)上級(jí)單位審核,審核經(jīng)過后,由相關(guān)維護(hù)工程師嚴(yán)格實(shí)施,維護(hù)作業(yè)計(jì)劃分為日作業(yè)計(jì)劃、周作業(yè)計(jì)劃、月作業(yè)計(jì)劃、季度和六個(gè)月作業(yè)計(jì)劃維護(hù)作業(yè)計(jì)劃內(nèi)容設(shè)備廠商維護(hù)手冊(cè)提議預(yù)定義作業(yè)計(jì)劃系統(tǒng)告警、資源占用狀態(tài)觀察性能指標(biāo)觀察和統(tǒng)計(jì)用戶權(quán)限、安全日志審核,系統(tǒng)密碼定時(shí)修改業(yè)務(wù)平臺(tái)備份統(tǒng)計(jì)機(jī)房設(shè)備現(xiàn)場(chǎng)檢驗(yàn):溫度、濕度、指示燈狀態(tài)各系統(tǒng)頁面連接測(cè)試,業(yè)務(wù)可用性測(cè)試各項(xiàng)作業(yè)計(jì)劃必需按時(shí)完成,并認(rèn)真檢驗(yàn)分析作業(yè)計(jì)劃結(jié)果,并留下作業(yè)計(jì)劃原始數(shù)據(jù)備查運(yùn)維管理措施規(guī)章制度嚴(yán)格根據(jù)ISO/0規(guī)范制訂并進(jìn)行自我完善機(jī)房運(yùn)維團(tuán)體必需遵照依據(jù)我們管理措施,遵照已定制度,大到巡檢周期,小到水杯放置位置,全部屬于規(guī)章制度范圍。經(jīng)過制度來確保步驟實(shí)施符合性,為連續(xù)改善提供保障。以下示例我們估計(jì)要實(shí)施部分規(guī)章制度,制度也屬于文檔范圍,將在實(shí)際運(yùn)維過程中不停演進(jìn)和增補(bǔ)。故障處理要求各故障處理應(yīng)遵照“先本端后對(duì)端,先全網(wǎng)后當(dāng)?shù)兀汝P(guān)鍵后通常,先搶通業(yè)務(wù)后處理故障”標(biāo)準(zhǔn),可采取緊急替換,迂回路由,第三方轉(zhuǎn)接等方法,在最短時(shí)間內(nèi)恢復(fù)服務(wù)故障等級(jí)一級(jí)故障:指重大故障一個(gè)或一個(gè)以上點(diǎn)發(fā)生故障,造成服務(wù)大部分中止和某一外部(如關(guān)鍵接口)交互中止,造成業(yè)務(wù)步驟不能正常運(yùn)行因平臺(tái)技術(shù)原因,引發(fā)用戶群體性投訴事件關(guān)鍵資料或系統(tǒng)數(shù)據(jù)被損毀,比如,用戶數(shù)據(jù)、計(jì)費(fèi)數(shù)據(jù)、配置數(shù)據(jù)丟失或紊亂二級(jí)故障:指嚴(yán)重故障設(shè)備宕機(jī)或硬件損壞,造成系統(tǒng)單路運(yùn)行設(shè)備資源占用超出閥值,對(duì)系統(tǒng)穩(wěn)定運(yùn)行產(chǎn)生實(shí)質(zhì)性威脅系統(tǒng)業(yè)務(wù)擁塞,造成性能指標(biāo)大幅下降三級(jí)故障:指通常故障不影響業(yè)務(wù),不對(duì)系統(tǒng)正常運(yùn)行產(chǎn)生實(shí)質(zhì)性威脅故障用戶級(jí)故障四級(jí)故障:指未定級(jí)故障未造成業(yè)務(wù)中止,且用戶不能感知性能下滑故障處理時(shí)限重大故障(一級(jí)故障):處理時(shí)限60分鐘嚴(yán)重故障(二級(jí)故障):處理時(shí)限4小時(shí)通常故障(三級(jí)故障):處理時(shí)限1天未定級(jí)(四級(jí)故障):處理時(shí)限48小時(shí)應(yīng)急預(yù)案管理要求必需建立切實(shí)可行應(yīng)急預(yù)案,有效預(yù)防、立即控制和最大程度消除突發(fā)事件帶來危害和影響,應(yīng)急預(yù)案總體標(biāo)準(zhǔn)是“先搶通,后修復(fù)”,在管轄內(nèi)服務(wù)出現(xiàn)故障后,由信息管理部決定是否開啟應(yīng)急預(yù)案預(yù)案關(guān)鍵內(nèi)容包含應(yīng)急預(yù)案觸發(fā)條件、組織機(jī)構(gòu)、職責(zé)分工、通報(bào)步驟、系統(tǒng)拓?fù)浣Y(jié)構(gòu)、設(shè)備具體列表、應(yīng)急處理步驟、備品備件管理、軟件備份情況、外部災(zāi)難應(yīng)急方法等,若平臺(tái)系統(tǒng)做了重大調(diào)整,應(yīng)急預(yù)案也應(yīng)隨之做出調(diào)整,以確保應(yīng)急預(yù)案有效性應(yīng)急預(yù)案應(yīng)每十二個(gè)月依據(jù)上年度實(shí)施情況進(jìn)行修訂,在遇重大系統(tǒng)變更或重大平臺(tái)事件發(fā)生后必需立即修訂,以適應(yīng)新系統(tǒng)環(huán)境每十二個(gè)月或重大生產(chǎn)保障任務(wù)前進(jìn)行一次應(yīng)急預(yù)案演練,演練結(jié)束后進(jìn)行總結(jié)分析,對(duì)存在問題立即整改應(yīng)急演練包含到設(shè)備倒換測(cè)試等操作,可能會(huì)影響用戶業(yè)務(wù),須報(bào)送********信息管理部門同意檔案及原始統(tǒng)計(jì)管理要求設(shè)備廠商進(jìn)行工程移交時(shí),需要提供具體、完整技術(shù)檔案和資料系統(tǒng)設(shè)計(jì)文件各設(shè)備軟硬件配置,各軟件介質(zhì)系統(tǒng)數(shù)據(jù)配置賬號(hào)、口令表,包含賬號(hào)用途、屬性、權(quán)限等系統(tǒng)測(cè)試文檔作業(yè)計(jì)劃維護(hù)手冊(cè)應(yīng)急預(yù)案系統(tǒng)上線以來,重大故障匯報(bào)和原始統(tǒng)計(jì)各設(shè)備機(jī)歷卡備品備件及剩下工程物資其它遺留事宜備忘錄各業(yè)務(wù)平臺(tái)日常維護(hù)工作,必需有具體工作日志值班日志(包含巡視統(tǒng)計(jì)及交接班統(tǒng)計(jì)簿)機(jī)歷本、設(shè)備及部件更換統(tǒng)計(jì),障礙統(tǒng)計(jì)維護(hù)作業(yè)計(jì)劃設(shè)備日常檢驗(yàn)和定時(shí)檢修統(tǒng)計(jì)業(yè)務(wù)開通原始統(tǒng)計(jì)版本升級(jí)統(tǒng)計(jì)數(shù)據(jù)修改統(tǒng)計(jì)由檔案管理員對(duì)所運(yùn)維平臺(tái)技術(shù)檔案和資料,確保資料安全、完整、正確、有效備品備件管理制度應(yīng)根據(jù)實(shí)際需要,配置足夠備品備件,并指定專員負(fù)責(zé)備品備件管理備品備件管理要求確保備品備件版本、功效正常建立備品備件臺(tái)賬,要求帳、物相符備品備件取用方便,在發(fā)生故障時(shí)能快速更換定時(shí)檢驗(yàn)備品備件可用性,軟件版本要求和現(xiàn)網(wǎng)運(yùn)行一致,不一致時(shí)立即通知廠家升級(jí)備品備件種類和數(shù)量考慮原因足以確保平臺(tái)穩(wěn)定運(yùn)行,確保取用立即快捷備品備件價(jià)格昂貴程度備品備件易損性資源管理制度運(yùn)維團(tuán)體應(yīng)負(fù)責(zé)網(wǎng)絡(luò)平臺(tái)資源管理,建立資源申請(qǐng)、分配、使用和回收機(jī)制,資源關(guān)鍵包含:IP地址、數(shù)據(jù)設(shè)備端口、傳輸端口、綜合布線資源、硬件設(shè)備資源、及各設(shè)備所屬機(jī)架等,并具體唯一資產(chǎn)編號(hào)所需大網(wǎng)資源,如大網(wǎng)業(yè)務(wù)接入、網(wǎng)絡(luò)出口、IP地址等,由上級(jí)部門分配或協(xié)調(diào)處理分配資源,不得私自挪作她用,若需變更,由資源使用部門提出需求,經(jīng)上級(jí)主管部門審批經(jīng)過后方可變更設(shè)備資產(chǎn)管理,標(biāo)準(zhǔn)上由運(yùn)維承接單位責(zé)任人為直接責(zé)任人需要新購設(shè)備參考物資采購業(yè)務(wù)步驟實(shí)施,需要維修或升級(jí)現(xiàn)有設(shè)備根據(jù)固定資產(chǎn)維修業(yè)務(wù)步驟實(shí)施每十二個(gè)月應(yīng)依據(jù)實(shí)際需要,單列維修資金,專用于設(shè)備損壞件維修或更換信息安全管理制度主機(jī)、網(wǎng)絡(luò)設(shè)備、軟硬件安全維護(hù)要求嚴(yán)禁在服務(wù)器上安裝和運(yùn)行和工作無關(guān)軟件主機(jī)應(yīng)采取防病毒、入侵檢測(cè)等安全方法實(shí)時(shí)監(jiān)控進(jìn)程和系統(tǒng)資源占用情況,發(fā)覺異常立即處理不許可任何人在服務(wù)器,交換設(shè)備等關(guān)鍵設(shè)備上進(jìn)行和工作范圍無關(guān)任何操作值班人員對(duì)保密信息嚴(yán)加看管,不得遺失、私自傳輸未經(jīng)許可,任何人不得攜入軟件、光盤使用,U盤、預(yù)防病毒傳染。使用維護(hù)電腦或監(jiān)控終端玩游戲,觀看和工作無關(guān)電子書籍,看VCD,登陸暴力、黃色非法網(wǎng)站嚴(yán)禁使用維護(hù)電腦私自下載、安裝非法軟件、維護(hù)電腦必需安全殺毒軟件并定時(shí)更新、殺毒,未經(jīng)允計(jì)不得將電腦接入生產(chǎn)網(wǎng)絡(luò)中接入生產(chǎn)網(wǎng)絡(luò)需要事先向維護(hù)中心申請(qǐng),經(jīng)相關(guān)領(lǐng)導(dǎo)或安全管理員同意方可接入,接入需按網(wǎng)絡(luò)管理指定IP及網(wǎng)絡(luò)端口接入嚴(yán)禁職員私自將和工作無關(guān)文件信息以光盤、活動(dòng)硬盤局域網(wǎng)及其它任何形式拷貝至硬盤及在生產(chǎn)網(wǎng)絡(luò)中傳輸賬號(hào)及口令安全管理要求多種帳號(hào)及口令,要按等級(jí)分配權(quán)限,嚴(yán)格管理,口令定時(shí)更改,超級(jí)賬號(hào)口令每個(gè)月修改一次系統(tǒng)割接上線后,運(yùn)維團(tuán)體收回各系統(tǒng)超級(jí)賬號(hào),為便于廠家和外協(xié)單位工作,另行為設(shè)備廠商分配專用賬號(hào),并在工程驗(yàn)收移交后,全部收回賬號(hào)廠商對(duì)系統(tǒng)進(jìn)行重大操作時(shí),需要使用超級(jí)賬號(hào)時(shí)必需以郵件或書面方法向電信提起申請(qǐng),操作完成后運(yùn)維團(tuán)體更改密碼,操作過程中信息管理部全程監(jiān)督;標(biāo)準(zhǔn)上,不許可廠商經(jīng)過遠(yuǎn)程接入方法進(jìn)行操作,若確需遠(yuǎn)程操作,需上級(jí)主管領(lǐng)導(dǎo)書面確定(緊急狀態(tài)下應(yīng)口頭申請(qǐng)、事后補(bǔ)文字確定說明)方可開啟合適權(quán)限臨時(shí)帳號(hào),事后立即關(guān)閉帳號(hào)、修改臨時(shí)密碼并登記最少每個(gè)月審閱一次賬號(hào)操作日志統(tǒng)計(jì)在職員調(diào)動(dòng)或離職等工作職能發(fā)生改變時(shí),立即收回其擁有系統(tǒng)賬號(hào),并更改密碼數(shù)據(jù)保密要求全部維護(hù)人員,要嚴(yán)格保密系統(tǒng)數(shù)據(jù)和用戶數(shù)據(jù)系統(tǒng)管理員要定時(shí)備份操作日志統(tǒng)計(jì),并進(jìn)行交叉審核資料,文檔,數(shù)據(jù)等必需有效組織,整理和歸檔立案嚴(yán)禁任何人員將機(jī)房?jī)?nèi)資料,文檔,數(shù)據(jù),配置參數(shù)等信息私自以任何形式提供給其它無關(guān)人員或向外隨意

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論