版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
實驗教學(xué)存儲算力基礎(chǔ)服務(wù)平臺需求一、項目概況建設(shè)本項目主要為提高學(xué)院計算機專業(yè)實驗教學(xué)的水平和質(zhì)量,增強學(xué)生的實踐能力和就業(yè)競爭力。推動學(xué)院在網(wǎng)絡(luò)通信、大數(shù)據(jù)、云計算等領(lǐng)域的實驗教學(xué)發(fā)展,提升學(xué)院的科研和學(xué)術(shù)水平。加強與企業(yè)合作,共同開展科研項目、提供實習(xí)機會等,有利于提升學(xué)生的實踐能力和就業(yè)競爭力。通過本項目的實施,可以獲得更多的實踐成果和實踐經(jīng)驗,包括優(yōu)秀實驗作品、學(xué)術(shù)論文、專利等。(一)本項目的實施需具有可持續(xù)性,主要體現(xiàn)在以下幾個方面:1、技術(shù)可持續(xù)性:本項目所采用的CPU+GPU架構(gòu)是當(dāng)今大數(shù)據(jù)處理和AI技術(shù)通用方案,大部分教師熟悉此系統(tǒng),而C86+DCU架構(gòu)是目前國內(nèi)較為先進(jìn)的具有開放平臺和接口的計算機產(chǎn)品,具有較長的生命周期和良好的技術(shù)兼容性。2、服務(wù)可持續(xù)性:本項目所提供的存儲算力基礎(chǔ)服務(wù)項目可以不斷升級和更新,持續(xù)優(yōu)化服務(wù)體驗,滿足學(xué)院和學(xué)生的多樣化需求。3、成果可持續(xù)性:通過本項目的實施,學(xué)生可以不斷提升實踐能力和創(chuàng)新能力,獲得更多的實踐成果和實踐經(jīng)驗,為未來的職業(yè)發(fā)展打下堅實的基礎(chǔ)。4、合作可持續(xù)性:本項目可以進(jìn)一步拓展應(yīng)用領(lǐng)域,加強與企業(yè)合作,共同開展科研項目、提供實習(xí)機會等,有利于提升學(xué)生的實踐能力和就業(yè)競爭力。同時也可以與更多的高校和企業(yè)合作,共同推進(jìn)技術(shù)的發(fā)展和應(yīng)用。(二)本項目的實施將產(chǎn)生以下影響和成果:1、提升實驗教學(xué)水平:通過建設(shè)基于網(wǎng)絡(luò)通信和CPU+GPU混合C86+DCU架構(gòu)的計算機專業(yè)實驗教學(xué)存儲算力基礎(chǔ)服務(wù)項目,可以大幅提升實驗教學(xué)的水平和技術(shù)含量。2、增強學(xué)生實踐能力:本項目將為學(xué)生提供更多的實踐機會和創(chuàng)新能力提升的機會,從而增強他們的實踐能力和就業(yè)競爭力。3、推動學(xué)院產(chǎn)學(xué)研發(fā)展:本項目的實施將促進(jìn)學(xué)院在網(wǎng)絡(luò)、大數(shù)據(jù)、云計算等領(lǐng)域的實驗教學(xué)水平提升,為學(xué)院的產(chǎn)學(xué)研發(fā)展提供有力支持。4、促進(jìn)校企合作:本項目可以進(jìn)一步拓展應(yīng)用領(lǐng)域,加強與企業(yè)合作,共同開展科研項目、提供實習(xí)機會等,有利于提升學(xué)生的實踐能力和就業(yè)競爭力。本項目建設(shè)后,師生可以通過本平臺獲得更多實踐成果:通過本項目的實施,學(xué)生將獲得更多的實踐成果和實踐經(jīng)驗,包括優(yōu)秀實驗作品、學(xué)術(shù)論文、專利等,展示了他們在實踐中的能力和成果。二、采購清單序號采購內(nèi)容數(shù)量單位是否適宜面向中小企業(yè)采購01GPU計算節(jié)點1臺否02推理計算節(jié)點11臺是03推理計算節(jié)點22臺是04訓(xùn)練節(jié)點1臺是05高性能存儲1臺是06管理節(jié)點服務(wù)器1臺否07異構(gòu)算力管理平臺1套是08萬兆核心交換機1臺否09千兆交換機1臺否10機柜1項是11散力承重架建設(shè)1項是12入室電纜改造1項是13在線式UPS接入1項否14精密空調(diào)1臺否15定溫懸掛七氟丙烷滅火裝置1套是16機柜七氟丙烷氣體滅火裝置1套是17施工和其他1項是三、清單參數(shù)序號采購內(nèi)容技術(shù)參數(shù)要求數(shù)量單位備注01GPU計算節(jié)點1、采用≥4U機架式GPU服務(wù)器,附帶導(dǎo)軌,可放入42U標(biāo)準(zhǔn)機柜。2、配置≥2顆X86處理器,每顆CPU核心數(shù)≥20核,每顆CPU線程≥40線程,基準(zhǔn)主頻≥2.0GHz,L3Cache≥37.5M,支持AVX512指令集。3、配置≥16條32GBDDR5RDIMM內(nèi)存,支持≥32個內(nèi)存插槽。4、配置≥2塊480GB2.5寸SATASSD,配置≥1塊3.84T2.5NVMESSD,配置≥4塊8TB3.5寸7.2KSATA硬盤。5、前置最高支持24LFF/SFF、最高支持16個NVMeSSD,內(nèi)置2個M.2。6、配置4GBSAS8口RAID卡,支持Raid0/1/5/6。7、配置≥1塊雙口10G光纖網(wǎng)卡(含模塊),配置≥1塊雙口1G網(wǎng)口。8、可支持12個PCIe5.0x16插槽,可擴(kuò)展到8個雙寬GPU卡。9、配置GPU數(shù)量≥4張GPU卡,F(xiàn)P16≥73.5Tflops,F(xiàn)P32≥73.5Tflops,兼容CUDA生態(tài),顯存≥24GB。支持FP32、FP16、INT8等數(shù)據(jù)格式。10、為滿足不同場景下使用達(dá)到最優(yōu)性能,GPU的PCIe連接拓?fù)渲С终{(diào)整為CPU:GPU=1:4或者CPU:GPU=1:8。11、支持8個8080風(fēng)扇,支持N+1冗余。風(fēng)扇分上下2層可以對CPU和GPU進(jìn)行分層散熱。12、故障診斷,支持離線光診斷功能,可斷電環(huán)境下診斷主板關(guān)鍵信息故障。13、支持?jǐn)U展機箱防入侵功能,確保系統(tǒng)安全。14、提供面向科研人員學(xué)習(xí)交流及實訓(xùn)的綜合社區(qū)平臺。圍繞所投的GPU卡,涵蓋行業(yè)動態(tài)、資源下載、學(xué)習(xí)中心、業(yè)內(nèi)專家分享課程、在線實訓(xùn)平臺、代碼倉庫等。15、配置≥4個2000W鉑金級電源,任意兩個電源功率需保證滿足服務(wù)器滿負(fù)荷運行需要,支持3+1/2+2冗余。1臺02推理計算節(jié)點11、采用≥4U機架式GPU服務(wù)器,附帶導(dǎo)軌,可放入42U標(biāo)準(zhǔn)機柜。2、配置≥2顆X86處理器,每顆≥32核,線程≥64線程,基準(zhǔn)主頻≥2.0GHz,L3Cache≥64M,支持硬件加解密引擎。3、支持遠(yuǎn)程關(guān)機和重新啟動功能。4、配置≥16條內(nèi)存單條容量不低于32GBDDR4RDIMM內(nèi)存,支持≥32個內(nèi)存插槽。5、配置≥2塊480GB2.5寸SATASSD。6、前置最高支持24LFF/SFF、最高支持16個NVMeSSD,內(nèi)置2個M.2。7、M.2板載支持2個SATA/PCIeM.2,支持組硬RAID。8、配置4GBSAS8口RAID卡,支持Raid0/1/5/6等模式。9、配置≥2塊雙口10G光纖網(wǎng)卡(含模塊),配置≥1塊雙口1G網(wǎng)口。10、可支持12個PCIe4.0x16插槽,可擴(kuò)展到8個雙寬GPU卡。11、配置GPU數(shù)量≥2張GPU卡,F(xiàn)P32算力≥45TFLOPS,TF32算力≥95TFLOPS,BF16算力≥190TFLOPS,顯存容量≥64GB,顯存帶寬≥896GB/s。12、為滿足不同場景下使用達(dá)到最優(yōu)性能,GPU的PCIe連接拓?fù)渲С终{(diào)整為CPU:GPU=1:4或者CPU:GPU=1:8。13、故障診斷,支持離線光診斷功能,可斷電環(huán)境下診斷主板關(guān)鍵信息故障。14、配置≥4個2000W鉑金級電源,,任意兩個電源功率需保證滿足服務(wù)器滿負(fù)荷運行需要,支持3+1/2+2冗余。15、提供面向科研人員學(xué)習(xí)交流及實訓(xùn)的綜合社區(qū)平臺。圍繞所投的GPU卡,涵蓋行業(yè)動態(tài)、資源下載、學(xué)習(xí)中心、業(yè)內(nèi)專家分享課程、在線實訓(xùn)平臺、代碼倉庫等。1臺03推理計算節(jié)點21、采用≥4U機架式GPU服務(wù)器,附帶導(dǎo)軌,可放入42U標(biāo)準(zhǔn)機柜。2、配置≥2顆X86處理器,每顆≥32核,線程≥64線程,基準(zhǔn)主頻≥2.0GHz,L3Cache≥64M,支持硬件加解密引擎。3、支持故障檢測功能,可以檢測到具體的FRU(內(nèi)存、硬盤等)的故障并發(fā)出告警。4、配置≥16條32GBDDR4RDIMM內(nèi)存,支持≥32個內(nèi)存插槽。5、配置≥2塊480GB2.5寸SATASSD。6、前置最高支持24LFF/SFF、最高支持16個NVMeSSD,內(nèi)置2個M.2。7、M.2板載支持2個SATA/PCIeM.2,支持組硬RAID。8、配置4GBSAS8口RAID卡,支持Raid0/1/5/6。9、配置≥2塊雙口10G光纖網(wǎng)卡(含模塊),配置≥1塊雙口1G網(wǎng)口。10、可支持≥12個PCIe4.0x16插槽,可擴(kuò)展到8個雙寬GPU卡。11、數(shù)量≥2張GPU卡,每卡FP64≥9.7TFPLOPS,同時支持混合精度計算(含F(xiàn)P64、FP32、FP16、INT8)。12、為滿足不同場景下使用達(dá)到最優(yōu)性能,GPU的PCIe連接拓?fù)渲С终{(diào)整為CPU:GPU=1:4或者CPU:GPU=1:8。13、故障診斷,支持離線光診斷功能,可斷電環(huán)境下診斷主板關(guān)鍵信息故障。14、支持?jǐn)U展機箱防入侵功能,確保系統(tǒng)安全。15、配置≥4個2000W鉑金級電源,,任意兩個電源功率需保證滿足服務(wù)器滿負(fù)荷運行需要,支持3+1/2+2冗余。16、外設(shè)兼容性:兼容多種主流生產(chǎn)商的外部設(shè)備,包括顯示器、鍵盤、鼠標(biāo)、閃存盤、移動硬盤、USB光驅(qū)及KVM等,要求使用不同廠商的外部設(shè)備時,系統(tǒng)均能正常識別和安裝驅(qū)動。17、故障檢測:支持故障檢測功能,可以檢測到具體的FRU(內(nèi)存、硬盤等)的故障并發(fā)出告警。18、內(nèi)存故障智能預(yù)測和自愈修復(fù):支持內(nèi)存故障智能預(yù)測和自愈修復(fù),提前自動硬隔離,避免內(nèi)存故障引起的非預(yù)期宕機以及內(nèi)存壽命的降低。19、主板防燒板設(shè)計:支持主板防燒板設(shè)計,保證電源故障后不擴(kuò)散。20、主機、處理器和GPU卡部件需與序號02對應(yīng)部件同一品牌。2臺04訓(xùn)練節(jié)點1、采用≥4U機架式GPU服務(wù)器,附帶導(dǎo)軌,可放入42U標(biāo)準(zhǔn)機柜。2、配置≥2顆X86處理器,每顆≥32核,線程≥64線程,基準(zhǔn)主頻≥2.0GHz,L3Cache≥64M,支持硬件加解密引擎。3、部件可靠性:支持硬盤、電源、風(fēng)扇熱插拔(內(nèi)置風(fēng)扇除外)。4、配置≥16條32GBDDR4RDIMM內(nèi)存,支持≥32個內(nèi)存插槽。5、配置≥2塊480GB2.5寸SATASSD,配置≥1塊3.84T2.5NVMESSD,配置≥4塊8TB3.5寸7.2KSATA硬盤。6、前置最高支持24LFF/SFF、最高支持16個NVMeSSD。7、M.2板載支持2個SATA/PCIeM.2,支持組硬RAID。8、配置4GBSAS8口RAID卡,支持Raid0/1/5/69、配置≥2塊雙口25G光纖網(wǎng)卡(含模塊),配置≥1塊雙口1G網(wǎng)口。10、可支持≥12個PCIe4.0x16插槽,可擴(kuò)展到8個雙寬GPU卡。11、配置GPU數(shù)量≥2張GPU卡,F(xiàn)P16≥196Tflops,F(xiàn)P32≥49Tflops,顯存≥64GB。支持FP32、FP16、BF16、INT8等數(shù)據(jù)格式。12、為滿足不同場景下使用達(dá)到最優(yōu)性能,GPU的PCIe連接拓?fù)渲С终{(diào)整為CPU:GPU=1:4或者CPU:GPU=1:8。13、故障診斷,支持離線光診斷功能,可斷電環(huán)境下診斷主板關(guān)鍵信息故障。14、配置≥4個2000W鉑金級電源,任意兩個電源功率需保證滿足服務(wù)器滿負(fù)荷運行需要。支持3+1/2+2冗余。15、圍繞本方案GPU卡,提供Pytorch、TensorFlow、Jupyter、VSCode等鏡像資源下載。提供pytorch、deepspeed、vllm等常用深度學(xué)習(xí)python包下載。提供qwen2、llama3、StableDiffusion等模型下載。16、供應(yīng)商須確保產(chǎn)品的部件在產(chǎn)品服務(wù)周期內(nèi)穩(wěn)定供貨。17、供應(yīng)商提供設(shè)置服務(wù)器硬件、輔助操作系統(tǒng)安裝等功能的輔助工具和管理軟件。且隨附軟件應(yīng)具有合法授權(quán)或版權(quán)。18、支持主板防燒板設(shè)計,保證電源故障后不擴(kuò)散。19、支持USB、顯示、管理等接口,如:VGA、DP、HDMI、USB3.0、PS/2接口、BMC管理端口。20、配備前后VGA顯示接口,且VGA接口≥2個。21、主機、處理器和GPU卡部件需與序號02對應(yīng)部件同一品牌。1臺05高性能存儲1、多控制器架構(gòu),最大支持8個控制器,控制器之間支持緩存鏡像,主控高度≥3U。2、存儲系統(tǒng)支持IPSAN、FCSAN、NAS等組網(wǎng)方式,本次提供iSCSI、FC、NFS、CIFS、HTTP、FTP等多種協(xié)議許可。NAS功能應(yīng)為非網(wǎng)關(guān)實現(xiàn)方式。硬件采用全模塊架構(gòu)冗余設(shè)計,無單一故障點。3、本次配置≥2個存儲控制器,且單機箱兩控制器間采用PCI-E互聯(lián)。4、雙控制器緩存規(guī)格:本次配置≧128GBCache,緩存不包含SSD磁盤、高速Flash及NAS控制器緩存。5、配置SSD緩存加速功能,要求同時支持讀寫性能加速,降低應(yīng)用延遲。不接受通過存儲分層方式實現(xiàn)。6、配置BBU+Flash永久電池保護(hù)模組,不存在斷電時間限制。7、本次配置8個1GbE接口,4個10GbE接口。2個12GbSAS3.04X磁盤通道。8、支持3.5寸7.2KNL-SAS,2.5寸10KSAS,SSD等多種類型磁盤。支持三種磁盤在同一磁盤柜中混插。9、本次配置≥16塊16TB3.5寸7.2K12GbSAS硬盤。10、支持RAID0/1/5/6/10/50/60等RAID級別。12、配置SAN、NAS快照功能:單卷支持快照數(shù)≥512個。支持系統(tǒng)定時自動創(chuàng)建快照,且定時快照策略可通過存儲自身管理軟件配置,定時快照最小時間間隔≤5分鐘。13配置SAN、NAS克隆功能,要求瞬時完成,并對克隆的數(shù)據(jù)可以進(jìn)行讀寫更改。14、支持?jǐn)?shù)據(jù)預(yù)遷移功能,即將預(yù)故障硬盤的數(shù)據(jù)遷移至熱備盤。通過介質(zhì)巡檢功能,自動檢測邏輯磁盤中的物理硬盤狀況,根據(jù)檢測結(jié)果和硬盤的Smart信息進(jìn)一步判斷硬盤故障和硬盤潛在故障,并且能夠自動啟動數(shù)據(jù)預(yù)遷移程序,將即將故障盤的數(shù)據(jù)遷移到熱備盤。15、配置自動精簡功能,實現(xiàn)存儲設(shè)備的容量按需動態(tài)擴(kuò)展。16、支持智能日志導(dǎo)出功能,即通過USB端口自動將日志導(dǎo)出到U盤,且導(dǎo)出的日志內(nèi)容需與存儲界面的日志內(nèi)容一致。17、系統(tǒng)具有完全在線、無需停機的微碼升級以及容量擴(kuò)充能力,支持GUI升級。18、支持MAID2.0磁盤節(jié)能技術(shù),當(dāng)磁盤不用的時候,支持磁盤降速和停轉(zhuǎn),節(jié)省功耗。19、供應(yīng)能力證明:供應(yīng)商須確保產(chǎn)品的部件在產(chǎn)品服務(wù)周期內(nèi)穩(wěn)定供貨。20、配置熱插拔1+1冗余電源,任意一個電源功率需保證滿足服務(wù)器滿負(fù)荷運行需要。1臺06管理節(jié)點服務(wù)器1、機型:2U機架式服務(wù)器,附帶導(dǎo)軌,可放入42U標(biāo)準(zhǔn)機柜,支持GPU擴(kuò)展。2、配置≥2顆X86處理器,每顆≥16核,線程≥32線程,基準(zhǔn)主頻≥2.4GHz,L3Cache≥24M,支持AVX512指令集。3、內(nèi)存:配置≥16條32GBDDR44800內(nèi)存,支持≥32個內(nèi)存插槽,支持內(nèi)存ECC保護(hù)、內(nèi)存鏡像、內(nèi)存熱備。4、配置≥2塊480GB2.5寸SATASSD,配置≥4塊8TB3.5寸7.2K轉(zhuǎn)速SATA硬盤。5、M.2擴(kuò)展:主板板載2個M.2接口并提供主板實物及證明文件。6、配置4GBSAS8口RAID卡,支持Raid0/1/5/6。7、配置≥1塊雙口10G光纖網(wǎng)卡(含模塊),配置≥1塊雙口1G網(wǎng)口。8、系統(tǒng)風(fēng)扇:配置6個熱插拔風(fēng)扇模組,支持N+2冗余。9、PCIE擴(kuò)展:支持8個PCIe5.0槽位,至少6個PCIe5.0x16。10、配置熱插拔鉑金1+1冗余電源,單個電源功率不低于800W白金電源,任意一個電源功率需保證滿足服務(wù)器滿負(fù)荷運行需要。1臺07異構(gòu)算力管理平臺1、提供一套滿足本次集群建設(shè)的人工智能管理及調(diào)度平臺。2、運行信息查看:支持集群信息快速查看包括:①顯示集群CPU平均利用率。②集群內(nèi)存平均利用率。③集群負(fù)載等。④大屏幕視圖顯示集群總覽(顯示算力峰值、存儲用量統(tǒng)計等)。⑤集群作業(yè)監(jiān)控概覽(顯示作業(yè)列表、作業(yè)狀態(tài)、告警記錄等)。⑥集群監(jiān)控概覽(顯示資源使用情況。⑦相對一分鐘負(fù)載、資產(chǎn)統(tǒng)計等)。3、開發(fā)環(huán)境提供①人工智能Notebook。②支持一站式開發(fā)環(huán)境服務(wù)。③TensorFlow。④提供PyTorch等開發(fā)框架。⑤JupyterLab。⑥VSCode。⑦支持RStudio等開發(fā)工具。⑧服務(wù)實例的暫停和重啟。⑨支持開發(fā)環(huán)境自定義。4、可以進(jìn)行用戶數(shù)據(jù)集更新,刪除、克隆等。5、集成Winscp客戶端軟件,提供軟件下載鏈接,調(diào)用客戶端軟件時自動設(shè)置服務(wù)端地址、服務(wù)端目標(biāo)目錄和登錄用戶。6、提供基于Web的文件管理功能,支持文件和文件夾的創(chuàng)建、刪除、重命名、在線編輯、權(quán)限設(shè)置,支持文件的節(jié)點間同步,支持文件批量上傳和打包下載。7、支持模型創(chuàng)建、模型克隆、模型刪除和展示模型狀態(tài)等,通過模型管理可以更方便的對不同模型進(jìn)行處理、更直觀的了解當(dāng)前模型的運行情況以支持訓(xùn)練管理。8、提供基于Caffe的數(shù)據(jù)集預(yù)處理,用戶可自行選擇lmdb和leveldb等不同后端格式。9、支持基于docker容器的模型訓(xùn)練功能。對Caffe、TensorFlow、PyTorch等框架提供在線模型編輯功能,用戶可自定義訓(xùn)練使用的框架版本,容器數(shù)量,GPU數(shù)量,內(nèi)存,GPU型號等資源,并且可以實時查看訓(xùn)練曲線輸出,監(jiān)控各容器內(nèi)資源使用狀況。10、支持告警管理:①支持自定義告警策略。②實現(xiàn)頁面預(yù)警。③郵件告警等通知方式。符合。④告警策略條件將會產(chǎn)生相應(yīng)告警信息并通過郵件、短信方式通知負(fù)責(zé)人。11、對TensorFlow和Pytorch等框架下的訓(xùn)練任務(wù)提供Horovod訓(xùn)練模式,支持通過Horovod進(jìn)行大規(guī)模RingAllReduce訓(xùn)練。12、支持基于docker容器的在線推理功能。支持Caffe、TensorFlow、PyTorch等框架,用戶可自定義推理使用的框架版本,模型路徑,模型輸出層及前后處理腳本。集成圖像分類,目標(biāo)檢測、語義分割等推理應(yīng)用類型,可進(jìn)行數(shù)據(jù)批量推理,顯示原始圖片、推理結(jié)果及必要標(biāo)注信息。13、支持基于容器的分布式超參數(shù)自動調(diào)優(yōu)功能。支持TPE自動搜索算法,多參數(shù)同時調(diào)優(yōu),分布式調(diào)優(yōu)等功能。用戶可自定義調(diào)參任務(wù)的調(diào)優(yōu)參數(shù)類型、調(diào)參范圍,使用的框架版本、容器數(shù)量、GPU數(shù)量、內(nèi)存、GPU型號等內(nèi)容,并可以實時查看調(diào)參曲線輸出,監(jiān)控各容器內(nèi)資源使用狀況。14、支持TensorFlow和PyTorch框架下的可視化的TensorBoard應(yīng)用。15、支持公有鏡像管理,用戶可以訂閱平臺公有的容器鏡像資源進(jìn)行使用。管理員可以向公有鏡像庫上傳鏡像資源。16、支持私有鏡像管理,將私有鏡像分享至公有鏡像庫,供其他用戶訂閱和使用。支持本地鏡像上傳和自定義。17、支持用戶自定義鏡像,包括在線固化,本地上傳,從DockerHub拉取,基于Dockerfile在線制作等模式。提供鏡像制作進(jìn)度和日志查詢功能。18、支持鏡像推送,支持用戶將自定義鏡像或訂閱鏡像推送至訓(xùn)練、調(diào)優(yōu)、推理等圖形化流程進(jìn)行使用。用戶推送的鏡像僅對自身生效,不影響平臺其他用戶。19、①支持鏡像管理。②支持構(gòu)建鏡像。③去鏡像倉庫克隆??梢詫㈢R像共享給所有人活指定用戶組。管理可以發(fā)布鏡像和上次鏡像,支持鏈接第三方鏡像倉庫,下載鏡像使用,涵蓋容器鏡像、鏡像倉庫等。20、支持用戶自定義容器的服務(wù)端口,支持http和socket等端口模式。21、支持以遠(yuǎn)程后端形式對接Pycharm等本地IDE工具。22、支持用戶申請自定義容器任務(wù),用戶可以自定義容器任務(wù)使用的鏡像版本、容器實例數(shù)量、GPU數(shù)量、GPU類型、CPU數(shù)量、內(nèi)存大小等資源,并可通過頁面嵌入的SSH和Jupyter方式對容器進(jìn)行訪問。23、支持容器跨節(jié)點進(jìn)行調(diào)度計算。Caffe/TensorFlow/PyTorch等分布式計算方式。24、支持公有鏡像管理,用戶可以訂閱平臺公有的容器鏡像資源進(jìn)行使用。管理員可以向公有鏡像庫上傳鏡像資源。支持私有鏡像管理,將私有鏡像分享至公有鏡像庫,供其他用戶訂閱和使用。支持本地鏡像上傳和自定義。支持用戶自定義鏡像,包括在線固化,本地上傳,從DockerHub拉取,基于Dockerfile在線制作等模式,提供鏡像制作進(jìn)度和日志查詢功能。25、用戶可在分享中心分享和訂閱數(shù)據(jù)集、模型、代碼和文檔等內(nèi)容。用戶可獲得訂閱內(nèi)容的訪問權(quán)限,其中數(shù)據(jù)集和模型可在編輯訓(xùn)練任務(wù)時直接訪問。26、支持自定義用戶主頁,可按需將常用或重要應(yīng)用添加至主頁快捷訪問。27、支持添加數(shù)據(jù)集,包括圖像分類、目標(biāo)檢測、語義分割等場景。支持算法管理,能夠進(jìn)行算法克隆。支持創(chuàng)建訓(xùn)練、調(diào)優(yōu)及推理任務(wù)。28、支持Restful二次開發(fā)接口,用戶可基于現(xiàn)有平臺功能進(jìn)行二次開發(fā)。29、支持將Caffe/Tensorflow/PyTorch等應(yīng)用軟件預(yù)設(shè)配置到容器中。并且可以在容器中使用IB網(wǎng)絡(luò)進(jìn)行計算。30、支持按節(jié)點進(jìn)行分區(qū),不同的分區(qū)進(jìn)行不同的訪問控制和調(diào)度策略。31、支持基于隊列、用戶、用戶組等多個維度的優(yōu)先級定義策略,根據(jù)作業(yè)的靜態(tài)(如資源請求、所屬用戶等)和動態(tài)指標(biāo)(如入隊時間、公平共享份額等),通過不同的權(quán)重設(shè)置,靈活控制作業(yè)優(yōu)先級。32、支持基于隊列、用戶、用戶組等不同維度的資源限額(即可用處理器數(shù)、內(nèi)存數(shù)、節(jié)點數(shù)、作業(yè)數(shù)、GPU數(shù)等),方便管理員控制資源分配。33、支持針對不同用戶(或用戶組、隊列)設(shè)置資源使用的份額,保證公平合理的使用資源34、允許作業(yè)獨占計算節(jié)點,支持集群、隊列、作業(yè)三級的的節(jié)點獨占策略設(shè)置。35、支持對高優(yōu)先級作業(yè)進(jìn)行資源預(yù)留,有效解決在集群高負(fù)載情況下的大作業(yè)“饑餓”問題。36、支持靈活可配置的節(jié)點可用性判定策略。檢查作業(yè)的可用節(jié)點時,需要考慮多種資源請求(如處理器、內(nèi)存、磁盤)進(jìn)行判定,允許針對不同的資源使用不同的判定算法(如按照實際使用量、按照調(diào)度分配量,或者綜合兩者進(jìn)行判定)。37、支持將作業(yè)均衡的分配到所有計算節(jié)點上,避免任務(wù)堆積在個別節(jié)點,因爭搶CPU、內(nèi)存等資源導(dǎo)致計算變慢。38、支持隨機選擇作業(yè)的計算節(jié)點,解決特定場景和固定調(diào)度算法下某些計算節(jié)點被頻繁使用的問題。39、支持作業(yè)回填,有效平衡大作業(yè)和小作業(yè)的調(diào)度,提高集群作業(yè)吞吐量。40、支持作業(yè)多級搶占,支持對被搶占作業(yè)進(jìn)行“掛起”、“重新入隊”等處理操作。41、支持對于CPU+GPU(包括GPU、MIC)異構(gòu)集群的調(diào)度。支持CPU作業(yè)和GPU作業(yè)共用GPGPU節(jié)點,支持為GPU/MIC按比例預(yù)留一定的CPU,保證GPU/MIC作業(yè)調(diào)度的成功率。1套08萬兆核心交換機1、交換容量≥2.56Tbps,包轉(zhuǎn)發(fā)率≥1080Mpps。2、端口≥48個萬兆SFP+口,≥2個QSFP+光口。3、支持VxLAN二層交換,支持VxLAN路由交換,支持VxLAN網(wǎng)關(guān)。4、支持前后、后前風(fēng)道,支持雙電源,風(fēng)扇模塊冗余設(shè)計。5、支持虛擬化堆疊,最大堆疊臺數(shù)≥9。6、支持Macsec鏈路保護(hù)協(xié)議,保障業(yè)務(wù)的安全可靠。7、支持IPv4、IPv6靜態(tài)路由,RIP等三層動態(tài)路由協(xié)議,支持等價路由、VRRP、OSPFv1/v2、OSPFv3、BGP、ISIS等增強三層路由協(xié)議。8、支持智能網(wǎng)絡(luò)質(zhì)量分析(iNQA)技術(shù),快速測量網(wǎng)絡(luò)性能的檢測機制。9、支持STP/RSTP/MSTP協(xié)議,支持ERPS以太環(huán)保護(hù)協(xié)議(G.8032)。10、支持集中MAC認(rèn)證,支持802.1X,支持AAA認(rèn)證,支持IP+MAC+端口綁定,支持CPU防護(hù)。11、支持安全啟動,在系統(tǒng)啟動過程中支持安全檢測,防止對系統(tǒng)鏡像進(jìn)行修改和偽造數(shù)據(jù)。12、支持命令行接口(CLI)配置,Telnet遠(yuǎn)程配置,SNMP管理協(xié)議。1臺09千兆交換機1、性能:整機交換容量≥336Gbps。轉(zhuǎn)發(fā)性能≥144Mpps。2、端口≥48千兆電,≥4萬兆SFP+。3、支持IPv4/IPv6靜態(tài)路由,支持RIP/RIPng,OSPFV2/V3。4、支持虛擬化堆疊,最大堆疊臺數(shù)≥9。5、支持ERPS功能,能夠快速阻斷環(huán)路,鏈路收斂時間≤50ms。6、支持CPU保護(hù)功能,能限制非法報文對CPU的攻擊,保護(hù)交換機在各種環(huán)境下穩(wěn)定工作。7、支持IGMPv1/v2/v3,MLDv1/v2等組播協(xié)議。8、支持SNMPV1/V2/V3、RMON、SSHV2等協(xié)議。9、支持10KV業(yè)務(wù)端口防雷能力。10、支持IEEE802.3az節(jié)能標(biāo)準(zhǔn),關(guān)閉沒有應(yīng)用的端口,節(jié)省能源。11、與序號08產(chǎn)品同一品牌。1臺10機柜1、42U標(biāo)準(zhǔn)服務(wù)器機柜。2、前后單開網(wǎng)孔門,標(biāo)配≥3塊層板,≥2組風(fēng)扇,≥1個八位電源PDU,4個腳輪,4個支腳,≥40套螺母螺釘。
3、承重≥800KG。4、提供1年質(zhì)保服務(wù)。1項11散力承重架建設(shè)1、機列位置貼地加兩根10#槽鋼,橫向貫通100mm*50mm角鋼,機柜采用底部進(jìn)線方式。具體按現(xiàn)場需求定制。2、提供1年質(zhì)保服務(wù)。1項12入室電纜改造1、從電井引一組電纜主線不少于30米、25平方電源。保證本次所購服務(wù)器和舊有服務(wù)器等設(shè)備的使用,并預(yù)留后續(xù)升級量。更換配電柜及電纜等按現(xiàn)場需求定制。2、配置本項目設(shè)備所需的電源PDU、連接電纜、電控箱等輔材。3、提供1年質(zhì)保服務(wù)。1項13在線式UPS接入1、主機容量≥10KVA。采用在線式雙變換技術(shù)。
2、輸入電壓110-300V。頻率跟蹤范圍(50±6)Hz。
3、輸入功率因數(shù)(100%負(fù)載)>0.99。
4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 創(chuàng)業(yè)投資信托協(xié)議書(2篇)
- 2024年草船借箭教學(xué)設(shè)計(53篇)
- 2024年福建省莆田市涵江區(qū)三江口鎮(zhèn)招聘社區(qū)工作者考前自測高頻考點模擬試題(共500題)含答案
- 2024年福建省《消防員資格證之一級防火考試》必刷500題標(biāo)準(zhǔn)卷
- 黃金卷3-【贏在中考·黃金八卷】(原卷版)
- 2024屆四川省綿陽市高三上學(xué)期第二次診斷性考試(二模)文綜試題
- 2025屆南開中學(xué)初中考生物押題試卷含解析
- 互補發(fā)電系統(tǒng)行業(yè)深度研究報告
- 2025公司質(zhì)押借款合同范本
- 2024年度天津市公共營養(yǎng)師之二級營養(yǎng)師綜合檢測試卷A卷含答案
- 工業(yè)互聯(lián)網(wǎng)標(biāo)準(zhǔn)體系(版本3.0)
- 初中生物老師經(jīng)驗交流課件
- 柴油發(fā)電機組采購施工 投標(biāo)方案(技術(shù)方案)
- 股權(quán)招募計劃書
- 創(chuàng)業(yè)之星學(xué)創(chuàng)杯經(jīng)營決策常見問題匯總
- 安徽省合肥市蜀山區(qū)2023-2024學(xué)年五年級上學(xué)期期末質(zhì)量檢測科學(xué)試題
- 公豬站工作總結(jié)匯報
- 醫(yī)學(xué)專業(yè)醫(yī)學(xué)統(tǒng)計學(xué)試題(答案見標(biāo)注) (三)
- 新教材蘇教版三年級上冊科學(xué)全冊單元測試卷
- 膠囊內(nèi)鏡定位導(dǎo)航技術(shù)研究
- 溫病護(hù)理查房
評論
0/150
提交評論