(報批稿)信息技術(shù) 高性能計算系統(tǒng) 管理監(jiān)控平臺技術(shù)要求_第1頁
(報批稿)信息技術(shù) 高性能計算系統(tǒng) 管理監(jiān)控平臺技術(shù)要求_第2頁
(報批稿)信息技術(shù) 高性能計算系統(tǒng) 管理監(jiān)控平臺技術(shù)要求_第3頁
(報批稿)信息技術(shù) 高性能計算系統(tǒng) 管理監(jiān)控平臺技術(shù)要求_第4頁
(報批稿)信息技術(shù) 高性能計算系統(tǒng) 管理監(jiān)控平臺技術(shù)要求_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

I 1 13術(shù)語和定義 14縮略語 5管理監(jiān)控平臺架構(gòu) 26功能模塊技術(shù)要求 36.1IT設(shè)備管理 6.2設(shè)備監(jiān)控 5 6.5可視化管理 6.7訪問控制管理 6.8安全防范管理 7系統(tǒng)性能技術(shù)要求 7.1兼容性 7.3高性能 附錄A(資料性)管理監(jiān)控平臺高性能測試 Ⅲ1管理監(jiān)控平臺技術(shù)要求本文件適用于含有10000個及以上計算單元的高性能計算系統(tǒng)的管理監(jiān)控平臺(以下簡稱ACL:訪問控制列表(AccessControlList)BBU:電池備份單元(BatteryBackupUnit)BMC:基板管理控制器(BaseboardManagementController)CPU:中央處理單元(CentralProcessingUnit)FC:光纖通道(FibreChannel)2ID:身份識別(Identification)IPMI:智能平臺管理接口(IntelligentPlatformManagementInterNTP:網(wǎng)絡(luò)時間協(xié)議(NetworkTimeProtocol)RAID:冗余磁盤陣列(RedundantArrayofIndependentDisks)SWAP:交換空間(SwapSpace)VIP:虛擬IP地址(VirtualIP)告警管理配置基線告警用戶管理碳排放門禁系統(tǒng)視頻系統(tǒng)計算設(shè)備功能模塊34b)應(yīng)支持部件信息的批量導(dǎo)入、手動錄入和自動發(fā)現(xiàn),例如,磁陣的部件信息可包含機框、號、投入運行時間、軟件版本、設(shè)備類型、最大功率(W)、額定功率(W)5(Mb/s)、包轉(zhuǎn)發(fā)能力(Mp/s)。b)應(yīng)支持部件信息的批量導(dǎo)入、手動錄入和自動發(fā)現(xiàn),網(wǎng)絡(luò)設(shè)備部件信息可包含端口、風(fēng)扇、電1)端口包括:名稱、描述、速率(Mb/s)、類型、VLAN、MAC、對端端口ID、對端2)風(fēng)扇包括:名稱、轉(zhuǎn)速、槽位、模式、狀態(tài)等;3)電源包括:名稱、型號、狀態(tài)、模式等;4)單板包括:名稱、型號、序列號、槽位、狀態(tài)等。d)應(yīng)支持網(wǎng)絡(luò)設(shè)備全生命周期的資產(chǎn)追溯,從采購、入庫、出庫、上架、下架、退庫、報廢等每a)平臺對智能機柜管理要求如下:應(yīng)支持基本信息的批量導(dǎo)入、手動錄入和自動發(fā)現(xiàn),基本信息包含但不限于智能機柜名稱、廠商、型號、產(chǎn)品序列號、主板產(chǎn)品號、主板序列號、所屬機1)電源包括:名稱、廠商、型號、序列號、固件版本、輸入模式、狀態(tài)等;2)風(fēng)扇包括:名稱、轉(zhuǎn)速、槽位、模式、狀態(tài)等。e)應(yīng)支持機柜資源全生命周期的資產(chǎn)追溯,從采購、入庫、出庫、柜內(nèi)設(shè)備上架、柜內(nèi)設(shè)備移c)應(yīng)支持計算服務(wù)器部件的狀態(tài)監(jiān)控,部件包括但不限于CPU、GPU、內(nèi)存、電源、風(fēng)扇、網(wǎng)2)GPU的部件狀態(tài)監(jiān)控包含:GPU不在位檢測、GPU狀態(tài)異常、GPU利用率超出閾值、3)風(fēng)扇的部件狀態(tài)監(jiān)控包含:風(fēng)扇不在位檢測、風(fēng)扇冗余丟失、風(fēng)扇轉(zhuǎn)速異常等;4)內(nèi)存的部件狀態(tài)監(jiān)控包含:內(nèi)存不在位檢測、內(nèi)存故障、內(nèi)存ECC(糾錯碼)錯誤、奇偶5)電源的部件狀態(tài)監(jiān)控包含:電源不在位檢測、電源故障、電源冗余丟失、電源輸入缺失、69)其他狀態(tài)監(jiān)控包含:溫度監(jiān)控,如入風(fēng)口、出風(fēng)口溫度異常監(jiān)控,電壓、電流監(jiān)控,如整1)應(yīng)支持實時監(jiān)控存儲設(shè)備的整體性能狀態(tài),如I/O吞吐量、響應(yīng)時間等;2)應(yīng)支持實時監(jiān)控存儲設(shè)備的總?cè)萘亢涂捎萌萘浚粤私獯鎯臻g的使用情況;3)應(yīng)支持實時監(jiān)控存儲設(shè)備的故障狀態(tài),及時發(fā)現(xiàn)并處理故障問題;4)應(yīng)支持實時監(jiān)控存儲設(shè)備的配置信息,包括系統(tǒng)版本、設(shè)7數(shù))、冷源監(jiān)控(溫度、壓力、流量);(℃)/相對濕度(%),橫坐標根據(jù)時間選項拉放時間軸;8HTMLd)應(yīng)支持顯示所有性能采集任務(wù)的狀態(tài),如運行中、運行成功、運行失敗等,對于失敗的任務(wù),r)應(yīng)支持計算設(shè)備的GPU性能監(jiān)控,包括GPU溫度、GPU功耗、GPU顯存使用率、GPU利用9d)應(yīng)支持顯示所有性能采集任務(wù)的狀態(tài),如運行中、運行成功、運行失敗等,對于失敗的任務(wù),f)應(yīng)支持歸一化負載計算方式,支持多種指標類型,包括CPU、內(nèi)存、I/O、網(wǎng)絡(luò)、電源負u)應(yīng)支持存儲設(shè)備的節(jié)點I/O性能監(jiān)控,指b)應(yīng)支持用戶自定義時間范圍的歷史性能數(shù)據(jù)導(dǎo)出,格式包括但不限于CSV、PDF、d)應(yīng)支持顯示所有性能采集任務(wù)的狀態(tài),如運行中、運行成功、運行失敗等,對于失敗的任務(wù),a)應(yīng)支持實時日志監(jiān)控:實時地收集、分析計算設(shè)備的運行日志,在設(shè)備發(fā)生故障或異常時立即b)應(yīng)支持歷史日志回溯:能夠存儲和查詢計算設(shè)備的歷史運行日志,可追蹤設(shè)備在特定時間段內(nèi)d)應(yīng)支持可視化監(jiān)控:能夠?qū)⒂嬎阍O(shè)備的運行數(shù)據(jù)以圖表、圖形等形式展示出來,便于了解設(shè)備f)應(yīng)支持自動巡檢和報告生成:能夠定期對計算設(shè)備進行自動巡檢,并生成詳細的巡檢報告,便g)應(yīng)支持日志聚合和歸檔:能夠?qū)⒂嬎阍O(shè)備的日志數(shù)據(jù)聚合到一起,進行長期歸檔存儲,以備后1)支持的日志類型包括但不限于BMC、BIOS、CPU、Memory、NIC(網(wǎng)絡(luò)接口卡)c)應(yīng)支持邏輯運算符:在設(shè)置閾值觸發(fā)規(guī)d)應(yīng)支持比較運算符:在設(shè)置閾值觸發(fā)規(guī)則時,可使用比較運算符,如大于、小于、等于來比較e)應(yīng)支持基于時間或事件的閾值觸發(fā)規(guī)則:應(yīng)能夠基于時間或事件的數(shù)量來設(shè)置告警閾值觸發(fā)規(guī)c)應(yīng)支持預(yù)測/定位RAID卡故障狀態(tài),包括邏輯盤的狀態(tài)預(yù)測、掉盤預(yù)測、異常物理位置定i)應(yīng)支持檢測設(shè)備整體的故障狀態(tài),包括硬件故障、電源故障、緩存故障、網(wǎng)絡(luò)故障預(yù)測以及硬a)應(yīng)支持計算設(shè)備BMC的功能的批量配置能力,能夠基于某一BMC和BIOS創(chuàng)建通用配置模板并c)應(yīng)支持計算設(shè)備SNMPTrap批量配置,配置項包括Trap版本、團體名、策略、e)應(yīng)支持計算設(shè)備NTP批量設(shè)置,設(shè)置項包括模式(自動/手工)、時區(qū)、NTP服務(wù)器等;2)選擇執(zhí)行目標操作系統(tǒng)類型和架構(gòu),指定從安裝源或軟件包安裝軟件;3)從安裝包安裝:支持指定待安裝軟件類型、軟件包文件、軟件安裝目的路徑、是否卸載原2)支持立即上傳本地服務(wù)編排,支持在系統(tǒng)指定路徑查看各主機的服務(wù)編排執(zhí)行日志。h)應(yīng)支持交換機網(wǎng)絡(luò)配置,宜包括VRF(虛擬路由轉(zhuǎn)發(fā))、MLAG(跨設(shè)備鏈路聚合組)b)應(yīng)支持配置基線策略管理,包括基線策略的查詢、展示、新增、刪除、編輯、啟用和禁用等,g)應(yīng)支持動力環(huán)境供電系統(tǒng)聯(lián)動,根據(jù)設(shè)備的負載情況實時調(diào)整電力供應(yīng),如降低或增加6.5可視化管理20a)應(yīng)支持電子地圖點播瀏覽各路實時視頻圖像,通過在電子地圖上點擊相應(yīng)的圖標即可查看該攝c)應(yīng)支持歷史視頻檢索回放功能,可根據(jù)錄像的類型、通道、時間等條件進行檢索,回放速平臺對服務(wù)器兼容要求如下:2122b)應(yīng)支持可實現(xiàn)吞吐量達到理論吞吐量80%;c)應(yīng)支持聚合吞吐量達到網(wǎng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論