校園決策分析平臺計算資源建設(shè)需求_第1頁
校園決策分析平臺計算資源建設(shè)需求_第2頁
校園決策分析平臺計算資源建設(shè)需求_第3頁
校園決策分析平臺計算資源建設(shè)需求_第4頁
校園決策分析平臺計算資源建設(shè)需求_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

校園決策分析平臺計算資源建設(shè)需求一、設(shè)備清單序號設(shè)備名稱建設(shè)內(nèi)容數(shù)量(臺)1※高性能服務器采購一批高密度高性能服務器用于擴容校園決策分析平臺的計算資源池;用于大學校園各項數(shù)字化應用系統(tǒng)的應用計算資源保障;服務器需配置虛擬化軟件和新購一套校園虛擬化資源管理平臺。182一卡通數(shù)據(jù)庫服務器采購2臺服務器用于平行替換已經(jīng)過期的一卡通數(shù)據(jù)庫服務器,確保大學校園決策分析平臺中一卡通數(shù)據(jù)庫服務運營通暢和保障。23一卡通應用虛擬化服務器采購兩臺虛擬化服務器,專門用于大學校園決策分析平臺中的一卡通系統(tǒng)所涉及的各項應用支撐。24GPU算力服務器采購2臺高性能服GPU算力服務器,用來支撐大學校園決策分析平臺中設(shè)計相關(guān)視頻及行為分析等AI輔助計算資源。25數(shù)據(jù)中心交換機采購2臺48口萬兆光口、8口40G/100G的數(shù)據(jù)中心接入交換機用于大學校園決策分析平臺中各服務器的網(wǎng)絡(luò)及數(shù)據(jù)訪問互聯(lián)互通要求。2二、設(shè)備技術(shù)參數(shù)序號設(shè)備名稱技術(shù)參數(shù)1高性能服務器1、規(guī)格:不低于2U機架式服務器,要求本次投標機型硬件需要支持vLCM功能,便于管理員都可以通過vLCM來管理主機。2、芯片組:IntelC621A芯片組,支持Intel至強可擴展處理器。3、主要指標:配置2顆InteLIceLakeXeonSilver系列20C2.3GHzCPU或更高,最大可支持至40核270W處理器;配置20*32GBTruDDR43200MHz內(nèi)存或更高,主機實配32條內(nèi)存插槽;配置雙OCP3.0網(wǎng)卡插槽,配置2塊萬兆OCP網(wǎng)卡含光模塊,配置1塊4口千兆電PCIe網(wǎng)卡。配置2塊單口不低于16GbHBA卡。實配2個輸出功率大于等于700W電源,支持1+1冗余熱插拔,支持336V高壓直流。4、硬盤:配置2*480GBSSD熱插拔固態(tài)硬盤,最大可支持28個硬盤擴展,支持前置直連8個U.2NVMeSSD硬盤,支持內(nèi)置兩個M.2且支持RAID0/1。5、配置1塊12GbSASRaid卡,支持1/5RAID級別。6、I/O擴展:最大可支持10個PCIe插槽,包括兩個專用的OCP插槽和8個PCIe4.0標準插槽。

7、冷卻系統(tǒng):冗余熱插拔系統(tǒng)風扇。

8、可靠性:由于系統(tǒng)的關(guān)鍵性,避免硬件引起的重大停機,投標服務器型號產(chǎn)品具備較高可靠性。投標產(chǎn)品應通過國家標準GB/T9813.3-2017的振動檢驗測試和國家標準GB/T9254-2008的輻射騷擾檢驗測試。9、虛擬化軟件:要求配置適用于本服務器同的正版VMwarevSphere標準版許可三年技術(shù)支持服務虛擬化軟件授權(quán),授權(quán)數(shù)量應適用于本次投標的服務器產(chǎn)品,禁止使用盜版、試用版、部分正版等行為;能與學校原有的虛擬化平臺向下兼容,可轉(zhuǎn)移至其他虛擬化集群。同時本次系統(tǒng)集成共計需要提供一套正版的VMwarevCenter8.0來集中管理VMwarevSphere主機;提供2-4人次的VMwarevSphere認證培訓服務。

10、安全認證:要求符合IT產(chǎn)品信息安全認證,要求投標產(chǎn)品帶外管理組件通過EAL4級認證,提供IT產(chǎn)品信息安全認證EAL4級認證證書;投標產(chǎn)品應通過國家標準GB16796-2009的高溫和低溫工作檢驗測試和國家標準GB16796-2009的鹽霧檢驗測試。11、配置5年7x24x2小時保修服務。大市范圍內(nèi)2小時上門服務,原廠上架安裝、系統(tǒng)安裝服務,原廠3年故障硬盤免回收服務,原廠硬盤數(shù)據(jù)丟失拯救服務;為保證設(shè)備的可靠性服務,簽合同時要求提供原廠針對本項目的售后服務承諾函原件(含以上服務內(nèi)容),在國內(nèi)擁有備件庫。2一卡通數(shù)據(jù)庫服務器1、規(guī)格:不低于2U機架式服務器,和高性能服務器同品牌。2、芯片組:Intel專用服務器芯片組,支持Intel至強第三代或者第四代產(chǎn)品,最大可支持單機擴展4路處理器。3、主要指標:配置至少2顆IntelXeon第3或4代可擴展處理器,每處理器要求核心數(shù)18C或更高,基礎(chǔ)主頻2.5GHz或更高,最大可擴展4個處理器。配置8*32GBTruDDR43200MHz內(nèi)存或更高,主機實配48條內(nèi)存插槽。配置1個OCP3.0網(wǎng)卡插槽,配置1塊2口萬兆OCP網(wǎng)卡含光模塊,配置1塊4口千兆電PCIe網(wǎng)卡。配置2塊單口不低于16GbHBA卡。配置4個或以上輸出功率大于等于1100W的模塊化自適應白金級電源,支持N+N冗余熱插拔。4、硬盤:配置2*480GBSSD熱插拔固態(tài)硬盤;4塊6T3.5寸NL-SAS盤,盤速不低于7.2Krpm。支持前置直連8個U.2NVMeSSD硬盤,支持內(nèi)置兩個M.2且支持RAID0/1;提供ANYBAY技術(shù)可切換,SAS/SATA/U.2等硬盤不用更換背板最大可支持28個NVMe硬盤及VROC陣列;5、配置1塊12GbSASRaid卡,支持1/5RAID級別。6、I/O擴展:最大可支持15個PCIe插槽,包括一個專用的OCP插槽和14個PCIe3.0標準插槽。7、冷卻系統(tǒng):冗余熱插拔系統(tǒng)風扇。8、可靠性:由于系統(tǒng)的關(guān)鍵性,避免硬件引起的重大停機,投標服務器型號產(chǎn)品具備較高可靠性;投標產(chǎn)品應符合國家標準GB/T17626.2-2006的靜電抗擾度檢驗測試和國家標準GB/T17626.5-2008的浪涌防雷檢驗測試。9、安全認證:通過噪聲A級測試。10、配置5年7x24x2小時保修服務。大市范圍內(nèi)2小時上門服務,原廠上架安裝、系統(tǒng)安裝服務,原廠3年故障硬盤免回收服務,原廠硬盤數(shù)據(jù)丟失拯救服務;為保證設(shè)備的可靠性服務,簽合同時要求提供原廠針對本項目的售后服務承諾函原件(含以上服務內(nèi)容),在國內(nèi)擁有備件庫。3一卡通應用虛擬化服務器1、規(guī)格:不低于2U機架式服務器,要求本次投標機型硬件需要支持vLCM功能,便于管理員都可以通過vLCM來管理主機。和高性能服務器同品牌。2、芯片組:IntelC621A芯片組,支持Intel至強可擴展處理器。3、主要指標:配置2顆IntelXeonsliver4310(12核,2.1GHz,18MBL3Cache)或更高CPU。配置12*32GBTruDDR43200MHz內(nèi)存或更高,主機實配32條內(nèi)存插槽。配置雙OCP3.0網(wǎng)卡插槽,配置2塊萬兆OCP網(wǎng)卡含光模塊,配置1塊4口千兆電PCIe網(wǎng)卡。配置2塊單口不低于16GbHBA卡。配置2個輸出功率大于等于700W80+電源,支持1+1冗余熱插拔,支持336V高壓直流。4、硬盤:配置2*240GBSSD熱插拔固態(tài)硬盤,最大可支持28個硬盤擴展,支持前置直連8個U.2NVMeSSD硬盤,支持內(nèi)置兩個M.2且支持RAID0/1。5、配置1塊12GbSASRaid卡,支持1/5RAID級別。6、I/O擴展:最大可支持10個PCIe插槽,包括兩個專用的OCP插槽和8個PCIe4.0標準插槽。7、冷卻系統(tǒng):冗余熱插拔系統(tǒng)風扇。8、可靠性:由于系統(tǒng)的關(guān)鍵性,避免硬件引起的重大停機,投標服務器型號產(chǎn)品具備較高可靠性;投標產(chǎn)品應通過國家標準GB/T9813.3-2017的振動檢驗測試和國家標準GB/T9254-2008的輻射騷擾檢驗測試。9、虛擬化軟件:要求配置適用于本服務器同的正版VMwarevSphere標準版許可三年技術(shù)支持服務虛擬化軟件授權(quán),授權(quán)數(shù)量應適用于本次投標的服務器產(chǎn)品,禁止使用盜版、試用版、部分正版等行為;能與學校原有的虛擬化平臺向下兼容,可轉(zhuǎn)移至其他虛擬化集群。10、安全認證:要求符合IT產(chǎn)品信息安全認證,要求投標產(chǎn)品帶外管理組件通過EAL4級認證,提供IT產(chǎn)品信息安全認證EAL4級認證證書;投標產(chǎn)品應通過國家標準GB16796-2009的高溫和低溫工作檢驗測試和國家標準GB16796-2009的鹽霧檢驗測試。11、配置5年7x24x2小時保修服務。大市范圍內(nèi)2小時上門服務,原廠上架安裝、系統(tǒng)安裝服務,原廠3年故障硬盤免回收服務,原廠硬盤數(shù)據(jù)丟失拯救服務;為保證設(shè)備的可靠性服務,簽合同時要求提供原廠針對本項目的售后服務承諾函原件(含以上服務內(nèi)容),在國內(nèi)擁有備件庫。4GPU算力服務器一:硬件規(guī)格,每臺服務器的硬件技術(shù)要求如下:1、規(guī)格:不高于3U機架式服務器,和高性能服務器同品牌。2、芯片組:IntelC621A芯片組,支持第三代Intel至強可擴展處理器。3、主要指標:配置2顆IntelIceLakeCPU,XeonGold系列CPU16核,標稱主頻2.9GHz或更高。配置16*32GBTruDDR43200MHz內(nèi)存或更高,支持32根內(nèi)存插槽;支持IntelOptane內(nèi)存。配置8個雙寬GPU安裝槽位,接口對應PCIe4.0x16帶寬;要求支持4個SXMA100NVLinkGPU;配置4塊NvidiaA4048GBGPU卡。配置1塊雙口10/25GEOCP網(wǎng)卡含10Gb光模塊,2個1G網(wǎng)卡。配置1塊雙口16GbHBA卡。配置不少于4個輸出功率大于等于2000W80+電源,支持N+N冗余熱插拔。4、能支持配置2.5寸硬盤托架、3.5寸硬盤托架、7mm硬盤托架,并且支持不少于6個NVMeSSD,配置4塊960GBSSD。5、陣列卡:配置1塊4GB緩存Raid卡。6、冷卻系統(tǒng):要求GPU散熱優(yōu)先設(shè)計,避免GPU溫度過高;要求GPU散熱位置位于CPU、內(nèi)存之前,冷空氣首先經(jīng)過GPU進行散熱,提供投標對應產(chǎn)品圖片;支持通過內(nèi)循環(huán)水冷系統(tǒng)冷卻GPU卡,以支持更高功耗GPU環(huán)境,提供水冷散熱模塊圖片;雙轉(zhuǎn)子風扇,N+1冗余。7、I/O擴展:最大可支持4個用于非GPU的PCIe插槽;要求包括一個專用的OCP插槽,支持配置為前部PCIe插槽方便線纜管理。8、故障定位:支持針對處理器,內(nèi)存,內(nèi)部存儲,風扇,電源,陣列卡等關(guān)鍵部件的故障預告警機制;支持針對風扇,電源的LED故障告警指示燈。9、服務器穩(wěn)定性:由于系統(tǒng)的關(guān)鍵性,避免硬件引起的重大停機,投標服務器型號產(chǎn)品具備較高可靠性10、穩(wěn)定性認證:抗干擾性,正常工作承受的浪涌(沖擊)抗擾度≥4kV(線線/線地);正常工作所承受的連續(xù)波輻射騷擾抗擾度≥10V/m;正常工作所承受的工頻磁場抗擾度≥10A/m。11、可靠性認證:所投服務器產(chǎn)品平均無故障時間MTBF值不低于150000小時。12、安全數(shù)據(jù)擦除:為保證數(shù)據(jù)安全,服務器原廠商需提供可兼容帶有托架的服務器和存儲設(shè)備硬盤的數(shù)據(jù)擦除服務。提供電壓監(jiān)控、場強監(jiān)控、增壓補償三種監(jiān)控措施,確保消磁的可靠性和安全性??赏ㄟ^消磁設(shè)備日志進行消磁記錄和查看擦除信息,提供相關(guān)證明材料并安排培訓。13、服務要求:配置5年7x24x2小時保修服務。大市范圍內(nèi)2小時上門服務,原廠上架安裝、系統(tǒng)安裝服務,原廠3年故障硬盤免回收服務,原廠硬盤數(shù)據(jù)丟失拯救服務;為保證設(shè)備的可靠性服務,簽合同時要求提供原廠針對本項目的售后服務承諾函原件(含以上服務內(nèi)容),在國內(nèi)擁有備件庫;提供2-4人次GPU操作和管理軟件使用的培訓服務。二、配置GPU作業(yè)集群管理調(diào)度系統(tǒng)一套,要求具備以下功能:1、系統(tǒng)基礎(chǔ)要求:集群軟件包括集群管理軟件,集群監(jiān)控軟件,作業(yè)調(diào)度軟件,分布式文件系統(tǒng)軟件等功能。2、提供一個統(tǒng)一的圖形界面來簡化高性能或AI計算的操作:圖形化界面分為管理員界面,用戶界面和操作員界面;提供對應界面截圖并加蓋公章。3、集群管理提供了集群硬件系統(tǒng)發(fā)現(xiàn),硬件配置和控制,遠程開機/關(guān)機,遠程登錄,遠程查看硬件警告信息;提供并行shell和并行拷貝,支持查看集群操作日志。4、系統(tǒng)主頁提供集群狀態(tài)的監(jiān)控和查看:集群cpu使用率,內(nèi)存使用率,硬盤使用率,網(wǎng)絡(luò)吞吐,集群節(jié)點開關(guān)機和忙閑狀態(tài),集群隊列狀態(tài),集群作業(yè)狀態(tài)等。5、系統(tǒng)支持服務器各種監(jiān)控指標:load,cpu使用率,內(nèi)存使用率,硬盤使用率,網(wǎng)絡(luò)吞吐,溫度,能耗等。6、支持GPU監(jiān)控:實時顯示集群中節(jié)點GPU的使用率、GPU內(nèi)存使用率、GPU溫度等;提供對應界面截圖。7、系統(tǒng)提供各種監(jiān)控視圖:系統(tǒng)提供了物理機架視圖,視圖以機架物理視圖的方式顯示機架中的節(jié)點。視圖形象的以節(jié)點顏色的深淺表示監(jiān)控指標數(shù)值的高低,點擊視圖的一個節(jié)點,可以查看節(jié)點詳情。系統(tǒng)提供熱力圖,直觀地通過顏色深淺表示節(jié)點組中所有節(jié)點監(jiān)控指標的實時值的大小,系統(tǒng)支持在熱力圖上根據(jù)值區(qū)間進行節(jié)點的過濾。節(jié)點詳情視圖,節(jié)點詳細列出了節(jié)點的靜態(tài)配置信息(cpu,內(nèi)存,硬盤,節(jié)點名等);節(jié)點詳情顯示節(jié)點各個監(jiān)控指標的歷史趨勢圖;節(jié)點詳細列出了節(jié)點正在運行的作業(yè)列表;節(jié)點詳細列出了節(jié)點的當前告警記錄。8、系統(tǒng)提供了作業(yè)監(jiān)控頁面,可以直觀查看集群中正在運行,等待以及結(jié)束的作業(yè)。作業(yè)詳細信息包括:作業(yè)名,提交時間,結(jié)束時間,CPU數(shù),CPU使用時間,GPU數(shù),GPU使用時間,用戶名,作業(yè)狀態(tài),隊列等。9、系統(tǒng)支持自定義各種的告警策略,通過對監(jiān)控指標(load,cpu使用率,內(nèi)存使用率,硬盤使用率,網(wǎng)絡(luò)吞吐,溫度,能耗)的監(jiān)測來觸發(fā)告警,生成告警記錄。告警記錄包括告警事件,告警時間,告警節(jié)點,告警等級,狀態(tài)等;靈活的告警觸發(fā)機制,支持多種告警通知方式(郵件、短信、微信);提供實時和歷史告警記錄的查詢,確認,解決,刪除等操作,支持批量的操作。10、作業(yè)調(diào)度:支持Slurm調(diào)度器;隊列管理:包括隊列創(chuàng)建,顯示,修改,移除;隊列資源管理:包括添加新節(jié)點到隊列,設(shè)置節(jié)點在隊列中屬性,顯示隊列中節(jié)點狀態(tài),節(jié)點的健康狀態(tài)檢查等;調(diào)度策略:支持先進先出,公平共享,回填,搶占,資源預留,節(jié)點訪問限制等多種策略,并支持自定義策略。11、用戶和賬戶管理功能:支持搭建LDAP用戶管理系統(tǒng),提供web界面進行用戶/組管理,包括集群用戶/用戶組的創(chuàng)建,顯示,修改和刪除;支持與現(xiàn)有用戶系統(tǒng)的集成,將現(xiàn)有LDAP賬號導入軟件;支持通過web界面進行賬戶的管理,包括賬戶的創(chuàng)建,顯示,修改和刪除;提供對應界面截圖。12、AI作業(yè):在同一個集群中通過統(tǒng)一的資源調(diào)度,可以同時運行HPC作業(yè)和AI作業(yè)。平臺支持多種AI計算框架,平臺支持TensorFlow、Caffe、MXNet、IntelCaffe、PyTorch等AI框架。13、平臺支持集群資源統(tǒng)一調(diào)度,支持多用戶,多作業(yè)同時運行,通過調(diào)度器來給作業(yè)動態(tài)分配資源,支持單節(jié)點單GPU,單節(jié)點多GPU,多節(jié)點多GPU以及多節(jié)點GPU,以及CPU/GPU混合等多種調(diào)度方式;提供對應界面截圖。14、支持分布式訓練,針對平臺支持的各種AI框架(TensorFlow,Caffe,MXNet,Intel-Caffe、PyTorch等),支持AI模型的多機分布式訓練。軟件提供的多機分布式的模板可以方便地提交分布式訓練的作業(yè)。15、基于容器實現(xiàn)對多種框架和一個框架多種版本的支持。比如支持TensorFlow,Caffe,MXNet、PyTorch等多種AI框架,支持TensorFlow1.9,1.10等多個版本。用戶在平臺上能創(chuàng)建和使用自定義鏡像。16、基于Jupyter的模型開發(fā):系統(tǒng)自帶Jupyter鏡像,鏡像里面除了Jupyter還自帶常用的AI框架和庫。通過平臺可以創(chuàng)建Jupyter運行實例,并訪問和使用Jupyter。Jupyter實例可以使用CPU資源也可以使用GPU資源。平臺支持JupyterPython2,Python3和R等。平臺支持Jupyter實例的持久化,實例可以操作共享存儲上的文件和程序,在Jupyter實例中安裝的軟件包在下次啟動后可以繼續(xù)使用。17、作業(yè)監(jiān)控和管理:AI平臺支持實時查看AI作業(yè)運行狀態(tài)和作業(yè)輸出等,支持停止正在運行的作業(yè),支持通過平臺的web文件管理系統(tǒng)上傳作業(yè)程序和下載作業(yè)運行結(jié)果。18、AIStudio支持端到端的模型訓練:AIStudio提供了數(shù)據(jù)集管理,模型訓練,模型發(fā)布端到端的支持,數(shù)據(jù)集管理:支持圖片分類,物體識別,物體分割三種類型數(shù)據(jù)集的管理,提供在線標注工具,支持這三種類型數(shù)據(jù)集的在線標注。模型訓練:AIStudio內(nèi)置了圖片分類、物體識別、物體分割用到的模型,用戶不需要寫程序,使用AIStudio內(nèi)置的模型,發(fā)起一個模型訓練。一個模型訓練會發(fā)起多個并行作業(yè),每一個作業(yè)對應一組超參,這樣可以加快找到最好的一組超參。一個模型訓練的不同作業(yè)的訓練結(jié)果可以實時展示和比較。模型發(fā)布:從模型訓練的結(jié)果中選擇要發(fā)布的模型,模型發(fā)布在軟件平臺上,發(fā)布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論