IDC運(yùn)營的大數(shù)據(jù)分析與DCIM_第1頁
IDC運(yùn)營的大數(shù)據(jù)分析與DCIM_第2頁
IDC運(yùn)營的大數(shù)據(jù)分析與DCIM_第3頁
IDC運(yùn)營的大數(shù)據(jù)分析與DCIM_第4頁
IDC運(yùn)營的大數(shù)據(jù)分析與DCIM_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

IDC運(yùn)行大數(shù)據(jù)分析與DCIM

作者:任華華

起源:《中國信息化》第03期

伴隨移動(dòng)互聯(lián)快速發(fā)展和大數(shù)據(jù)和云計(jì)算出現(xiàn),成百上千棟數(shù)據(jù)中心拔地而起,海量數(shù)據(jù)已悄然產(chǎn)生,并潛移默化地影響著我們生活中點(diǎn)點(diǎn)滴滴。當(dāng)我們出行時(shí),參考高德地圖交通數(shù)據(jù);當(dāng)我們餐飲時(shí),打開大眾點(diǎn)評查看評論數(shù)據(jù);當(dāng)我們購物時(shí),淘寶網(wǎng)消費(fèi)數(shù)據(jù)分析會(huì)推送符合我們傾向商品。生活中小事尚且需要大數(shù)據(jù)分析,IDC運(yùn)行這么一件嚴(yán)厲而又嚴(yán)謹(jǐn)工作,一樣需要大數(shù)據(jù)分析。

一、IDC運(yùn)行需要大數(shù)據(jù)分析

所謂IDC,就是為電子信息設(shè)備提供運(yùn)行環(huán)境場所,包含數(shù)據(jù)處理、數(shù)據(jù)傳輸和網(wǎng)絡(luò)通訊等IT基礎(chǔ)設(shè)施,同時(shí)包含為IT設(shè)備服務(wù)電力、空調(diào)、傳輸管路等場地基礎(chǔ)設(shè)施。經(jīng)過合理IT架構(gòu)和對場地基礎(chǔ)設(shè)施完善管理,提供良好IT環(huán)境,保障IT設(shè)備正常有效運(yùn)轉(zhuǎn)、保障業(yè)務(wù)順暢進(jìn)行和服務(wù)及時(shí)提供。

一個(gè)經(jīng)典IDC以下列圖1-1:

從圖1-1能夠看出,IDC是一個(gè)復(fù)雜綜合體系,需要進(jìn)行科學(xué)管理,以確保其能正常運(yùn)行。能夠這么了解“管理”二字,“管”意味著決議與執(zhí)行,“理”意味著整合與分析數(shù)據(jù)。“理”是伎倆,“理”功效為采集數(shù)據(jù);“管”是目標(biāo),“管”功效是依照“理”數(shù)據(jù)分析結(jié)果進(jìn)行決議和執(zhí)行,進(jìn)行運(yùn)維操作。

管理需要數(shù)據(jù),怎樣獲取IDC運(yùn)行數(shù)據(jù)呢?如圖1-2所表示,IDC電力監(jiān)控系統(tǒng)會(huì)得到到柴油發(fā)電機(jī)、燃油、市電、變壓器、UPS、電池、高壓直流、開關(guān)狀態(tài)、PDU電量等系列數(shù)據(jù);制冷空調(diào)監(jiān)控系統(tǒng)會(huì)得到冷機(jī)、冷塔、水泵、板換、精密空調(diào)、冷熱通道溫度、自然冷卻運(yùn)行時(shí)間、PUE、WUE等系列數(shù)據(jù);消防與安防監(jiān)控會(huì)得到人流、物流等系列數(shù)據(jù);ITSM系統(tǒng)得到服務(wù)器上架、流程進(jìn)度等數(shù)據(jù)。

這些數(shù)據(jù)有進(jìn)行了分析,形成了報(bào)表,如圖1-2中左一圖片所表示設(shè)備電量波動(dòng)趨勢,左二圖片所表示自然冷卻分析,不過大量數(shù)據(jù)還停留在初級采集階段,并未形成綜合分析與報(bào)表。比如,冷凍水泵變頻器發(fā)生故障,可能會(huì)直接影響冷機(jī)運(yùn)行,但報(bào)警信息只顯示在電力監(jiān)控界面上,不對制冷運(yùn)維人員開放,造成制冷運(yùn)維人員不能在第一時(shí)間得到通知,無法快速響應(yīng)故障。又如,制冷系統(tǒng)中蓄冷罐溫度異常可能由冷機(jī)故障引發(fā),也可能由冷機(jī)專用變壓器或開關(guān)故障引發(fā),此時(shí)只分析蓄冷罐溫度數(shù)據(jù)或者只分析冷機(jī)狀態(tài)數(shù)據(jù)是不夠,還需要跨系統(tǒng)分析電氣系統(tǒng)冷機(jī)配電開關(guān)和變壓器狀態(tài)數(shù)據(jù)庫。

所以,IDC有效運(yùn)行迫切需要對獲取到大量獨(dú)立、離散數(shù)據(jù)進(jìn)行分析,需要對數(shù)據(jù)進(jìn)行跨系統(tǒng)整合、關(guān)聯(lián)、統(tǒng)計(jì)與挖掘。

二、大數(shù)據(jù)分析有效工具--DCIM

為了順應(yīng)IDC運(yùn)行跨系統(tǒng)數(shù)據(jù)關(guān)聯(lián)、分析需要,DCIM(DataCenterInfrastructureManagement數(shù)據(jù)中心基礎(chǔ)設(shè)施管理)應(yīng)運(yùn)而生。DCIM概念起源于國外,不一樣機(jī)構(gòu)對其有不一樣定義,但得到基本認(rèn)同觀點(diǎn)是:DCIM是一座溝通場地基礎(chǔ)設(shè)施和IT基礎(chǔ)設(shè)施之間關(guān)系橋梁,能夠幫助數(shù)據(jù)中心管理人員更高效運(yùn)行數(shù)據(jù)中心。

Gartner對DCIM定義:Datacenterinfrastructuremanagement(DCIM)toolsmonitor,measure,manageand/orcontroldatacenterutilizationandenergyconsumptionofallIT-relatedequipment(suchasservers,storageandnetworkswitches)andfacilityinfrastructurecomponents(suchaspowerdistributionunits[PDUs]andcomputerroomairconditioners[CRACs]).數(shù)據(jù)中心基礎(chǔ)設(shè)施管理(DCIM)工具能夠監(jiān)控、測量、管理和控制數(shù)據(jù)中心全部IT相關(guān)設(shè)備(比如服務(wù)器、存放和交換機(jī))和基礎(chǔ)設(shè)施相關(guān)設(shè)備(比如PDU和精密空調(diào))使用情況及能耗水平。

451Group對DCIM定義是:Adatacenter

infrastructuremanagementsystemcollectsandmanagesinformationaboutadatacenter’sassets,resourceuseandoperationalstatus.Thisinformationisthendistributed,integrated,analyzedandappliedinwaysthathelpmanagersmeetbusinessandservice-orientedgoalsandoptimizethedatacenter’sperformance.數(shù)據(jù)中心基礎(chǔ)設(shè)施管理系統(tǒng)搜集和管理數(shù)據(jù)中心資產(chǎn)、資源使用以及運(yùn)行狀態(tài)信息,然后分發(fā)、整合、分析、使用以幫助數(shù)據(jù)中心管理者滿足業(yè)務(wù)和服務(wù)導(dǎo)向目標(biāo),優(yōu)化數(shù)據(jù)中心運(yùn)行。

DCIM定義中Infrastructure,業(yè)內(nèi)比較通用認(rèn)知是:基礎(chǔ)設(shè)施(infrastructure)=場地基礎(chǔ)設(shè)施(sitefacilityinfrastructure)+IT基礎(chǔ)設(shè)施(ITinfrastructure)

三、DCIM為IDC運(yùn)行帶來價(jià)值

DCIM主要價(jià)值就是在于打通場地基礎(chǔ)設(shè)施和IT基礎(chǔ)設(shè)施(硬件層)組織和信息斷層、打通場地基礎(chǔ)設(shè)施各子系統(tǒng)數(shù)據(jù)庫,采取統(tǒng)一平臺(tái)管理場地基礎(chǔ)設(shè)施如UPS、空調(diào)以及IT基礎(chǔ)設(shè)施如服務(wù)器,并經(jīng)過數(shù)據(jù)分析和聚合,最大化數(shù)據(jù)中心運(yùn)行效率以確保數(shù)據(jù)中心可用性和業(yè)務(wù)連續(xù)性。

(一)可靠運(yùn)維

IDC運(yùn)行第一要?jiǎng)?wù)是確保7×24×365不間斷可靠運(yùn)行,假如出現(xiàn)故障須即時(shí)處理,以降低事故歷時(shí)、降低故障帶來損失和風(fēng)險(xiǎn),所以IDC運(yùn)行需要重點(diǎn)關(guān)注設(shè)備故障。DCIM可對故障期間數(shù)據(jù)進(jìn)行統(tǒng)計(jì)、整理、統(tǒng)計(jì)、分析,尋找故障發(fā)生誘因和共性,探討縮短故障歷時(shí)路徑;經(jīng)過利用DCIM對數(shù)據(jù)進(jìn)行分析,能夠幫助運(yùn)維人員提前診療哪些設(shè)備處于亞健康狀態(tài),進(jìn)而可預(yù)測故障、提醒運(yùn)維人員提前排查故障,降低風(fēng)險(xiǎn)。

如表3-1所表示,DCIM可匯總、統(tǒng)計(jì)、分析關(guān)鍵設(shè)備如冷機(jī)、冷塔、水泵、開關(guān)、變壓器、UPS等平均維護(hù)時(shí)間、平均無故障時(shí)間和每個(gè)月實(shí)際運(yùn)行累計(jì)故障率。假如數(shù)據(jù)分析顯示某一組電池月故障率突然高于平均值,則有理由懷疑這組電池近期可能出現(xiàn)故障,提醒運(yùn)維人員提前對這組電池進(jìn)行維護(hù)和更換,從而防止故障發(fā)生,降低宕機(jī)可能。

關(guān)于可靠性,圖3-2是著名海恩法則,即一次嚴(yán)重事故之前可能有1000起事故隱患、300起未遂先兆、29次輕微事故。DCIM橫向數(shù)據(jù)分析能夠幫助運(yùn)維人員在隱患階段排除故障可能。如制冷空調(diào)系統(tǒng)環(huán)境溫度監(jiān)測,當(dāng)溫度超出限定值時(shí),系統(tǒng)告警,不過等到系統(tǒng)告警往往為時(shí)過晚,局部熱點(diǎn)極易造成宕機(jī);然而電氣系統(tǒng)PDU電量監(jiān)測可預(yù)警告空調(diào)局部熱點(diǎn),比如某列機(jī)柜PDU電量連續(xù)徘徊在高位,則運(yùn)維人員能夠預(yù)判附近可能出現(xiàn)局部熱點(diǎn);經(jīng)過提前加速周圍空調(diào)EC風(fēng)機(jī),防止局部熱點(diǎn)出現(xiàn),降低宕機(jī)風(fēng)險(xiǎn)。

運(yùn)維可靠性經(jīng)常需要多個(gè)子系統(tǒng)聯(lián)合保障。比如暖通制冷監(jiān)控系統(tǒng)(BMS)須準(zhǔn)確感知電氣系統(tǒng)中冷機(jī)配電情況,并在冷機(jī)掉電或其余緊急工況時(shí),平穩(wěn)切換至應(yīng)急冷源供冷,保障服務(wù)器冷量連續(xù)供給;在應(yīng)急冷源放冷完成時(shí),BMS須自動(dòng)切換應(yīng)急冷源至再次充冷。DCIM可橫向整合電力監(jiān)控、暖通制冷監(jiān)控?cái)?shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)互聯(lián)互通,防止各子系統(tǒng)監(jiān)控自成體系,執(zhí)行子系統(tǒng)命令時(shí)影響到其余子系統(tǒng)安全運(yùn)行,從而影響整個(gè)IT環(huán)境穩(wěn)定可靠。

DCIM經(jīng)過對連續(xù)監(jiān)測IT電量數(shù)據(jù)進(jìn)行匯總、分析和比較,發(fā)覺某IDC大部分機(jī)柜服務(wù)器運(yùn)行在5kW左右平均值,而個(gè)別機(jī)柜服務(wù)器電量維持在2kW左右(如圖3-3所表示)。可想而知,這么服務(wù)器對計(jì)算資源貢獻(xiàn)非常有限,極有可能是僵尸服務(wù)器。運(yùn)維人員可據(jù)此優(yōu)化服務(wù)器配置及軟件架構(gòu),或移除服務(wù)器另作他用??梢?,DCIM數(shù)據(jù)分析可幫助IDC運(yùn)維人員優(yōu)化IT資源配置。

(二)綠色節(jié)能

IDC能耗巨大,綠色節(jié)能是IDC運(yùn)行主要課題。經(jīng)過DCIM進(jìn)行橫向數(shù)據(jù)分析,能夠幫助IDC運(yùn)行優(yōu)化,達(dá)成節(jié)能目標(biāo)。比如,某IDC設(shè)計(jì)IT負(fù)荷為5000kW,采取冷卻塔串聯(lián)板換水側(cè)節(jié)能,如圖3-4,滿載時(shí)濕球溫度4℃開始自然冷卻。鑒于服務(wù)器是分批上架,IDC也是分期布署,假如一期IT負(fù)載率低于某設(shè)定值如3000kW,則DCIM可提議運(yùn)維人員設(shè)定濕球溫度6℃或7℃開始自然冷卻,從而延長自然冷卻時(shí)間,縮短電制冷運(yùn)行時(shí)間,達(dá)成節(jié)約制冷系統(tǒng)電耗、降低PUE、節(jié)能運(yùn)行目標(biāo)。

IDC規(guī)劃、設(shè)計(jì)、建造都是按照IT滿載做,實(shí)際運(yùn)行往往是變工況運(yùn)行,經(jīng)過DCIM進(jìn)行綜合數(shù)據(jù)分析,可依照運(yùn)行動(dòng)態(tài)數(shù)據(jù)分析結(jié)果改變設(shè)定值。如最初空調(diào)送風(fēng)溫度設(shè)定為18℃,冷通道溫度上限設(shè)定為22℃,運(yùn)行一段時(shí)間后,系統(tǒng)監(jiān)測到機(jī)房冷通道溫度普遍連續(xù)低于22℃,則能夠提醒運(yùn)維人員嘗試提升送風(fēng)溫度設(shè)定值為20℃,甚至冷水機(jī)組供水溫度也可提升。冷凍水供水溫度每提升1℃,冷機(jī)效率提升2~3%,自然冷卻運(yùn)行時(shí)間也可對應(yīng)延長,如此可實(shí)現(xiàn)節(jié)約制冷系統(tǒng)電耗、節(jié)能運(yùn)行目標(biāo)。

(三)決議依據(jù)

DCIM經(jīng)過對運(yùn)維數(shù)據(jù)動(dòng)態(tài)搜集、分析以及監(jiān)測,為新建IDC決議提供輸入。

IDC管理三元素SPC中,S指空間、P指供電、C指冷卻。DCIM搜集到U位總數(shù)據(jù),已占用U位數(shù)據(jù),二者相減就可得到可用U位空間;一樣操作依次能夠得到可用電力、可用冷量,詳見圖3-5。經(jīng)過對SPC三個(gè)數(shù)據(jù)庫聯(lián)合分析,運(yùn)維人員能夠確定上多少臺(tái)服務(wù)器,在哪些U位空間進(jìn)行擺放。由此可見DCIM可幫助IDC運(yùn)行工作科學(xué)決議。

類似案例很多,如某企業(yè)某類業(yè)務(wù)IDC,一期規(guī)劃設(shè)計(jì)采取百分之百滿負(fù)荷進(jìn)行基礎(chǔ)設(shè)施容量規(guī)劃和平面設(shè)定。然而DCIM監(jiān)控到常年運(yùn)行數(shù)據(jù)表明,這類業(yè)務(wù)平均運(yùn)行在70%左右負(fù)荷,峰值也不會(huì)超出80%。一樣業(yè)務(wù)下一個(gè)IDC規(guī)劃中,就能夠把IT負(fù)載率設(shè)定為80%,則能夠縮減基礎(chǔ)設(shè)施容量、節(jié)約基礎(chǔ)設(shè)施初投資??梢姡珼CIM可幫助IDC優(yōu)化配置,節(jié)約成本。

又如某企業(yè)某類業(yè)務(wù)在某一線城市采取雙路市電加柴油發(fā)電機(jī)冗余方案,但DCIM多年運(yùn)行數(shù)據(jù)表明市電從未斷電,電網(wǎng)可靠性達(dá)成5個(gè)9,甚至更高,則在下一個(gè)IDC規(guī)劃中可考慮優(yōu)化架構(gòu)為一路市電加柴油發(fā)電機(jī)方案??梢姡珼CIM可幫助IDC規(guī)劃優(yōu)化設(shè)計(jì)方案。

四、DCIM大數(shù)據(jù)分析前景展望

大規(guī)模IDC存在多套監(jiān)控管理子系統(tǒng),如電力監(jiān)控(EPMS)、暖通制冷監(jiān)控(BMS)、消防與安防監(jiān)控、ITSM等,每個(gè)子系統(tǒng)都有自己獨(dú)立數(shù)據(jù)采集、統(tǒng)計(jì)、分析和執(zhí)行等裝置,完成某項(xiàng)獨(dú)立功效;不過IDC整體運(yùn)行需要這些子系統(tǒng)數(shù)據(jù)橫向整合、縱向挖掘、綜合分析;數(shù)據(jù)不進(jìn)行分析,就只是數(shù)據(jù),無法對運(yùn)行產(chǎn)生價(jià)值;DCIM對各子系統(tǒng)數(shù)據(jù)進(jìn)行篩選、整合并加以關(guān)聯(lián)、挖掘、分析,進(jìn)而依照大數(shù)據(jù)分析結(jié)果提出運(yùn)維提議、優(yōu)化運(yùn)行能效、降低故障風(fēng)險(xiǎn)、提升IDC運(yùn)行效率,為運(yùn)維人員提供科學(xué)決議依據(jù)。

另外,經(jīng)過DCIM進(jìn)行數(shù)據(jù)分析,能夠?qū)崿F(xiàn)其余更多功效。如圖4-1所表示,能夠?qū)崿F(xiàn)成本管理、規(guī)劃管理、工單管理、容量管理、可靠性管理、能效管理。如圖4-2所表示,能夠關(guān)聯(lián)故障與應(yīng)急預(yù)案實(shí)現(xiàn)告警管

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論