




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
醫(yī)療中心計(jì)算平臺(tái)需求說明現(xiàn)狀與背景生命科學(xué)作為目前最重要的科學(xué)分支之一,高性能計(jì)算在生命科學(xué)的研究和發(fā)展中起到非常重要的作用。隨著信息技術(shù)的飛速發(fā)展,大數(shù)據(jù)開始沖擊著各個(gè)行業(yè),尤其是在生物醫(yī)領(lǐng)域,基因測(cè)序技術(shù)的革新使得測(cè)序速度快、低成本、高通量,與此同時(shí)產(chǎn)生了海量的數(shù)據(jù),已然進(jìn)入大數(shù)據(jù)行列,因此更加迫切需要高性能計(jì)算技術(shù)來處理這些信息,助力生物醫(yī)藥的快速發(fā)展。醫(yī)療中心擬建設(shè)生信計(jì)算平臺(tái),為生信計(jì)算相關(guān)科學(xué)研究提供高性能的算力及大容量、高性能存儲(chǔ)資源,滿足醫(yī)院科研創(chuàng)新和關(guān)鍵技術(shù)研究需要,提升科研能力,以期能夠在人才、基礎(chǔ)科學(xué)研究、應(yīng)用科技創(chuàng)新、科技成果轉(zhuǎn)化等方面引領(lǐng)醫(yī)療中心的戰(zhàn)略建設(shè)。高性能硬件平臺(tái)的系統(tǒng)在部署時(shí),采用物理機(jī)部署高性能計(jì)算節(jié)點(diǎn),搭建集群管理軟件,方便管理和擴(kuò)容。為確保平臺(tái)能順利搭建,需在建設(shè)周期內(nèi)安裝部署調(diào)測(cè)相關(guān)硬件設(shè)備,滿足業(yè)務(wù)發(fā)展的需要,總體目標(biāo)如下:1、搭建滿足具備高性能計(jì)算能力以及可靠性基礎(chǔ)硬件設(shè)施。2、實(shí)現(xiàn)所有資源統(tǒng)一管理、統(tǒng)一維護(hù)、避免資源浪費(fèi)。計(jì)算資源需求分析1)生信領(lǐng)域CPU節(jié)點(diǎn)需求分析:近20年來,隨著人類基因組計(jì)劃的相繼完成和各種模式生物的基因組計(jì)劃的順利實(shí)施,以及基因測(cè)序技術(shù)的不斷進(jìn)步,生命科學(xué)研究得到了巨大的發(fā)展。同時(shí),海量的有關(guān)生物序列的數(shù)據(jù)不斷涌現(xiàn)。這些數(shù)據(jù)具有豐富的內(nèi)涵,其中蘊(yùn)含著大量的人類尚且不知道的生物學(xué)奧秘。生物信息學(xué)是研究生物信息的采集、處理、存儲(chǔ)、傳播、分析和解釋等各方面的一門學(xué)科,與以觀察和實(shí)驗(yàn)為主的傳統(tǒng)生物學(xué)研究不同,它通過綜合利用生物學(xué)、計(jì)算機(jī)科學(xué)和信息技術(shù)而揭示大量而復(fù)雜的生物數(shù)據(jù)所蘊(yùn)含的生物學(xué)奧秘。針對(duì)高通量測(cè)序數(shù)據(jù)的各組學(xué)的生物信息分析,依賴于高性能的設(shè)備,在生物信息分析過程中對(duì)設(shè)備的性能要求很高。本次配置常規(guī)CPU計(jì)算節(jié)點(diǎn)、胖節(jié)點(diǎn)。2)人工智能GPU節(jié)點(diǎn)需求分析:利用GPU開展深度學(xué)習(xí)方面相關(guān)科學(xué)研究工作。該領(lǐng)域是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)新的方向,由于在諸多應(yīng)用中,尤其是圖像識(shí)別、計(jì)算機(jī)視覺和語音識(shí)別等方面有著比傳統(tǒng)機(jī)器學(xué)習(xí)更好的學(xué)習(xí)效果,越來越受到科研人員和企業(yè)工作者的青睞。影像數(shù)據(jù)對(duì)深度學(xué)習(xí)的理論研究解決了深度學(xué)習(xí)在訓(xùn)練過程中所遇到的梯度消失或者爆炸,容易過擬合等理論問題,互聯(lián)網(wǎng)大數(shù)據(jù)和數(shù)據(jù)共享平臺(tái)的發(fā)展解決了數(shù)據(jù)不充足的問題,而由于深度學(xué)習(xí)的網(wǎng)絡(luò)模型復(fù)雜、參數(shù)多、收斂困難和樣本數(shù)量龐大等特點(diǎn),相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的另一個(gè)重要區(qū)別就是需要海量的計(jì)算,這就對(duì)深度學(xué)習(xí)硬件系統(tǒng)的計(jì)算能力提出了更高的要求。為滿足這些需求特配置GPU計(jì)算節(jié)點(diǎn)。3)分布式存儲(chǔ)系統(tǒng)需求分析:在生信計(jì)算領(lǐng)域的高性能計(jì)算,既有大文件存儲(chǔ)場(chǎng)景(要求高聚合帶寬),又有小文件存儲(chǔ)場(chǎng)景(要求高IOPS)。隨著相關(guān)儀器設(shè)備和數(shù)據(jù)獲取手段進(jìn)步,產(chǎn)生的原始數(shù)據(jù)量也迅速增長(zhǎng),需要容量巨大的存儲(chǔ)系統(tǒng)。此外,數(shù)據(jù)處理過程中產(chǎn)生的臨時(shí)數(shù)據(jù)和最終結(jié)果也隨之不斷增長(zhǎng)。數(shù)據(jù)處理中,數(shù)據(jù)處理節(jié)點(diǎn)需要不斷的讀寫存儲(chǔ),來讀取原始數(shù)據(jù)和保存處理結(jié)果。這就要求存儲(chǔ)系統(tǒng)不僅要有巨大的存儲(chǔ)容量,還要有良好的擴(kuò)展性和聚合帶寬。為滿足這些需求,分別配置大容量分布式存儲(chǔ)及高性能存儲(chǔ)。4)計(jì)算網(wǎng)絡(luò)需求分析:高性能計(jì)算集群是一個(gè)通過內(nèi)部互聯(lián)網(wǎng)絡(luò)將松散的計(jì)算節(jié)點(diǎn)有效整合起來的系統(tǒng)架構(gòu),內(nèi)部互聯(lián)網(wǎng)絡(luò)是高性能計(jì)算集群的核心技術(shù)之一。集群系統(tǒng)內(nèi)部互聯(lián)網(wǎng)絡(luò)主要用于以MPI為代表的并行計(jì)算程序節(jié)點(diǎn)間的數(shù)據(jù)網(wǎng)絡(luò)通信,即作為計(jì)算網(wǎng)絡(luò)使用。不同計(jì)算方法和計(jì)算程序的數(shù)據(jù)通信特征不盡相同,從類型看,有的數(shù)據(jù)交換以小數(shù)據(jù)包為主,有的大數(shù)據(jù)包交換較多。小數(shù)據(jù)包交換較多時(shí),計(jì)算性能和效率對(duì)計(jì)算網(wǎng)絡(luò)的延遲非常敏感,大數(shù)據(jù)包交換較多時(shí),計(jì)算網(wǎng)絡(luò)的帶寬有關(guān)鍵性影響;從數(shù)據(jù)通信的頻率看,有的計(jì)算方法和程序數(shù)據(jù)通信不頻繁,對(duì)計(jì)算網(wǎng)絡(luò)的性能要求不高,有的數(shù)據(jù)通信密集,對(duì)計(jì)算網(wǎng)絡(luò)的性能要求很高??偟膩碚f,高性能計(jì)算機(jī)計(jì)算網(wǎng)絡(luò)的性能對(duì)并行計(jì)算程序的并行加速比和并行擴(kuò)展性有重要的影響。計(jì)算網(wǎng)絡(luò)需要有高帶寬、低延遲的特點(diǎn)。本次高速計(jì)算網(wǎng)絡(luò)及存儲(chǔ)網(wǎng)絡(luò)采用200Gb/sHDRInfiniBand網(wǎng)絡(luò)。詳細(xì)清單如下項(xiàng)目類別數(shù)量(臺(tái)/套)項(xiàng)目管理登錄節(jié)點(diǎn)1CPU計(jì)算節(jié)點(diǎn)4胖節(jié)點(diǎn)3GPU計(jì)算節(jié)點(diǎn)12GPU計(jì)算節(jié)點(diǎn)24高性能分布式存儲(chǔ)4大容量分布式存儲(chǔ)9千兆交換機(jī)1萬兆交換機(jī)1高速網(wǎng)絡(luò)交換機(jī)1集群管理與作業(yè)調(diào)度系統(tǒng)1集成實(shí)施服務(wù)1為確保集群管理軟件能夠進(jìn)行正常權(quán)限管理、配額管理、以及計(jì)費(fèi)管理,投標(biāo)人所投高性能分布式存儲(chǔ)、大容量分布式存儲(chǔ)、集群管理與作業(yè)調(diào)度系統(tǒng)應(yīng)為統(tǒng)一品牌??紤]生物信息學(xué)領(lǐng)域計(jì)算特點(diǎn),對(duì)算力集群的大規(guī)模數(shù)據(jù)處理能力、高效的計(jì)算能力、可擴(kuò)展性和靈活性、可靠性和穩(wěn)定性均有要求。具備在高性能計(jì)算和生物信息學(xué)領(lǐng)域的深厚技術(shù)背景和實(shí)踐經(jīng)驗(yàn)尤為重要。為保證所投產(chǎn)品在生物信息領(lǐng)域的運(yùn)用,投標(biāo)人需提供分布式存儲(chǔ)生產(chǎn)廠商生物信息相關(guān)的測(cè)試報(bào)告,報(bào)告應(yīng)涵蓋二代測(cè)序或三代測(cè)序相關(guān)的測(cè)試內(nèi)容。技術(shù)要求4.1、管理登錄節(jié)點(diǎn)序號(hào)技術(shù)要求1機(jī)型:2U。2處理器:配置≥2顆CPU,核心數(shù)≥12核,每顆CPU主頻≥2.0GHz,L3緩存≥30M。3內(nèi)存:配置≥16條16GBDDR54800內(nèi)存,支持≥32個(gè)內(nèi)存插槽,支持內(nèi)存ECC保護(hù)、內(nèi)存鏡像、內(nèi)存熱備。4硬盤:配置≥2塊480GSATASSD,系統(tǒng)盤做Raid1。5M.2擴(kuò)展:主板板載2個(gè)M.2接口并提供主板實(shí)物照片及證明文件。6Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。7網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。8GPU卡:配置2張雙寬GPU卡,F(xiàn)P64≥9.7TFPLOPS,同時(shí)支持混合精度計(jì)算(含F(xiàn)P64、FP32、FP16、INT8)算力。9系統(tǒng)風(fēng)扇:配置6個(gè)熱插拔風(fēng)扇模組,支持N+2冗余。10PCIE擴(kuò)展:支持8個(gè)PCIe5.0槽位,至少6個(gè)PCIe5.0x16。11電源:配置熱插拔鉑金1+1冗余電源,單個(gè)電源功率不低于1300W白金電源。12可靠性檢測(cè)報(bào)告:提供產(chǎn)品可靠性測(cè)試報(bào)告,溫度測(cè)試,濕度測(cè)試,低氣壓試驗(yàn)、鹽霧試驗(yàn)、振動(dòng)試驗(yàn)、重啟試驗(yàn)、運(yùn)輸包裝試驗(yàn)等,提供第三方評(píng)測(cè)機(jī)構(gòu)簽字蓋章的測(cè)試報(bào)告作為證明。4.2、CPU計(jì)算節(jié)點(diǎn)序號(hào)技術(shù)要求1機(jī)型:2U。2處理器:配置≥2顆CPU,核心數(shù)≥32核,每顆CPU主頻≥2.1GHz,L3緩存≥60M,含超融合云平臺(tái)軟件授權(quán)許可。3內(nèi)存:配置≥16條32GBDDR54800內(nèi)存,支持≥32個(gè)內(nèi)存插槽,支持內(nèi)存ECC保護(hù)、內(nèi)存鏡像、內(nèi)存熱備。4硬盤:配置≥2塊960GSATASSD(讀寫混合型),配置≥2塊1.92TSATASSD,配置≥4塊8T7.2kSATAHDD。5Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。6網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。7電源:配置熱插拔鉑金1+1冗余電源,單個(gè)電源功率不低于1300W白金電源。8自主知識(shí)產(chǎn)權(quán):云平臺(tái)為國(guó)產(chǎn)自研產(chǎn)品,即不基于OpenStack、CloudStack等開源項(xiàng)目進(jìn)行商業(yè)化二次開發(fā)。9超融合產(chǎn)品通過《信息技術(shù)云計(jì)算超融合系統(tǒng)通用技術(shù)要求》標(biāo)準(zhǔn)符合性測(cè)試,測(cè)評(píng)等級(jí)為擴(kuò)展級(jí)或擴(kuò)展及以上。10云主機(jī)管理:支持在3臺(tái),5分鐘內(nèi)完成200臺(tái)云主機(jī)批量創(chuàng)建云主機(jī)(規(guī)格4C8G)。云平臺(tái)支持在線跨大版本升級(jí),升級(jí)過程≤15分鐘,升級(jí)過程不影響云主機(jī)業(yè)務(wù)。11啟動(dòng)方式:支持云主機(jī)的啟動(dòng)順序調(diào)整,支持網(wǎng)絡(luò)、硬盤和光驅(qū)3種啟動(dòng)方式,支持在圖形界面對(duì)啟動(dòng)順序進(jìn)行調(diào)整,支持網(wǎng)絡(luò)啟動(dòng)優(yōu)先、硬盤啟動(dòng)優(yōu)先等設(shè)置。12雙棧網(wǎng)絡(luò):支持云主機(jī)配置IPv4、IPv6或雙棧(IPv4+IPv6)類型的網(wǎng)絡(luò),并可使用多種網(wǎng)絡(luò)服務(wù)。13VPC路由器:支持配置OSPF動(dòng)態(tài)路由協(xié)議,實(shí)現(xiàn)和物理交換機(jī)建立OSPF鄰接關(guān)系。14數(shù)據(jù)冗余模式:支持多副本與EC糾刪碼兩種數(shù)據(jù)保護(hù)方式。15故障域收斂:支持磁盤分組、節(jié)點(diǎn)分區(qū)等技術(shù),縮小故障域,進(jìn)一步保障數(shù)據(jù)安全。16QoS:配置基于LUN的QoS設(shè)置功能,同時(shí)支持?jǐn)?shù)據(jù)修復(fù)QoS設(shè)置。當(dāng)磁盤或節(jié)點(diǎn)故障時(shí),可靈活調(diào)整數(shù)據(jù)修復(fù)性能與前端業(yè)務(wù)性能的優(yōu)先級(jí)。17熱度分級(jí):塊存儲(chǔ)支持基于IO熱度的分級(jí)功能,可自動(dòng)將高頻訪問的數(shù)據(jù)遷移至高性能介質(zhì)層級(jí)中,提升系統(tǒng)整體性能。各性能介質(zhì)層級(jí)的容量均可計(jì)入存儲(chǔ)池總?cè)萘?,不接受SSD緩存加速方式。18一致性組:配置卷的一致性組功能,可將多個(gè)卷加入同一個(gè)一致性組中,支持對(duì)一致性組創(chuàng)建主機(jī)映射、快照等功能。19云平臺(tái)升級(jí):支持云平臺(tái)從低版本到高版本的無縫升級(jí),支持任意跨多版本升級(jí),半小時(shí)內(nèi)完成,中標(biāo)7天內(nèi)提供測(cè)試,擴(kuò)展不受副本限制,可按節(jié)點(diǎn)擴(kuò)展。20監(jiān)控告警:支持對(duì)云主機(jī)、路由器、鏡像、系統(tǒng)數(shù)據(jù)目錄、物理機(jī)、三層網(wǎng)絡(luò)、云盤、虛擬IP、主存儲(chǔ)、監(jiān)聽器和項(xiàng)目資源等多種監(jiān)控對(duì)象的單個(gè)資源或全部資源進(jìn)行監(jiān)控:支持創(chuàng)建告警器自定義告警級(jí)別,方便云平臺(tái)用戶關(guān)注最緊急的告警消息。21監(jiān)控大屏:支持對(duì)云主機(jī)、VPC路由器、物理機(jī)、三層網(wǎng)絡(luò)、云盤、虛擬IP、主存儲(chǔ)、監(jiān)聽器等多種監(jiān)控對(duì)象的單個(gè)資源或全部資源進(jìn)行監(jiān)控。22平臺(tái)功能:支持第三方用戶/平臺(tái)在云平臺(tái)上通過AccessKey訪問云資源,支持配置AccessKeyID和AccessKeySecret作為用戶身份標(biāo)識(shí)信息,提供應(yīng)用中心管理功能,支持添加包括存儲(chǔ)、數(shù)據(jù)庫(kù)、安全、IaaS、PaaS、SaaS類型在內(nèi)的應(yīng)用插件,支持一鍵設(shè)置安全場(chǎng)景。4.3、胖節(jié)點(diǎn)序號(hào)技術(shù)要求1采用第四代處理器,機(jī)型:4U,附帶導(dǎo)軌,可放入42U標(biāo)準(zhǔn)機(jī)柜,機(jī)箱長(zhǎng)不超過800mm。2處理器:配置≥4顆CPU,核心數(shù)≥32核,每顆CPU主頻≥2.4GHz,L3緩存≥60M。3內(nèi)存:配置≥24條64GBDDR54800內(nèi)存,最大顆支持64個(gè)DDR5內(nèi)存插槽,支持內(nèi)存ECC、內(nèi)存鏡像、內(nèi)存熱備等多種保護(hù)模式。4硬盤:配置≥2塊960GSATASSD,配置≥1塊1.92TSATASSD。5硬盤擴(kuò)展:前置支持≥48個(gè)2.5寸硬盤擴(kuò)展,后置支持≥2個(gè)2.5及4個(gè)3.5擴(kuò)展,內(nèi)置≥2個(gè)M.2擴(kuò)展。6Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。7網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。8最大可配置21個(gè)PCIe擴(kuò)展插槽,包括1個(gè)OCP插槽。9維護(hù):支持ID燈及按鍵,隱藏式標(biāo)簽抽條,2個(gè)VGA接口,4個(gè)USB3.0,1個(gè)TypeC接口。10電源模塊:配置≥4個(gè)電源功率不低于1300W白金電源,并可最大支持N+N冗余供電。11集成系統(tǒng)管理芯片:支持iKVM和KVMOverIP高級(jí)管理功能,本地固件更新、錯(cuò)誤日志,提供系統(tǒng)狀況的可視顯示;配置獨(dú)立的遠(yuǎn)程管理控制端口,支持遠(yuǎn)程監(jiān)控圖形界面,可實(shí)現(xiàn)與操作系統(tǒng)無關(guān)的遠(yuǎn)程對(duì)設(shè)備的完全控制,包括遠(yuǎn)程的開機(jī)、關(guān)機(jī)、重啟、虛擬設(shè)備掛載等操作;可實(shí)現(xiàn)監(jiān)控設(shè)備內(nèi)部主要部件的狀態(tài),包括CPU、內(nèi)存、硬盤、風(fēng)扇、電源、功率、溫度等信息;可實(shí)現(xiàn)遠(yuǎn)程Web界面下查詢及配置BIOS選項(xiàng),支持黑盒子功能。12產(chǎn)品環(huán)境適應(yīng)性檢測(cè):所投產(chǎn)品通過貯存溫度測(cè)試、工作溫度上下限測(cè)試、變交濕熱測(cè)試、鹽霧測(cè)試等。13產(chǎn)品性能檢測(cè):所投產(chǎn)品通過性能測(cè)試,測(cè)試內(nèi)容包括整型性能測(cè)試、浮點(diǎn)性能測(cè)試、LMbench測(cè)試、Stream測(cè)試、Iozone測(cè)試、數(shù)據(jù)盤讀寫性能測(cè)試、SpecPower測(cè)試、Netperf測(cè)試等。14產(chǎn)品可靠性檢測(cè):所投產(chǎn)品外觀設(shè)計(jì)合理,穩(wěn)定可靠,提供第三方評(píng)測(cè)機(jī)構(gòu)簽字蓋章的測(cè)試報(bào)告,內(nèi)容包括外觀和結(jié)構(gòu)試驗(yàn)、噪聲試驗(yàn)和電源能耗試驗(yàn)報(bào)告。4.4、GPU計(jì)算節(jié)點(diǎn)1序號(hào)技術(shù)要求1機(jī)型:2U。2處理器:配置≥2顆CPU,核心數(shù)≥96核,每顆CPU主頻≥2.4GHz,L3緩存≥384M。3內(nèi)存:配置≥24條96GBDDR54800內(nèi)存,支持≥24個(gè)內(nèi)存插槽,支持內(nèi)存ECC保護(hù)、內(nèi)存鏡像、內(nèi)存熱備。4硬盤:配置≥2塊960GSATASSD,系統(tǒng)盤做Raid1。5Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。6網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。7系統(tǒng)風(fēng)扇:配置6個(gè)熱插拔風(fēng)扇模組,支持N+2冗余。8GPU卡擴(kuò)展:最大支持4雙寬GPU/8單寬GPU。9電源:配置熱插拔鉑金1+1冗余電源,單個(gè)電源功率不低于2200W白金電源。10安全:用戶可以設(shè)定想要阻止訪問BMC的黑名單,或者設(shè)定允許訪問BMC的白名單,提升安全性。11智能管控:BMC監(jiān)控CPU、內(nèi)存、HDD、PCIE設(shè)備和風(fēng)扇功耗,通過BMCWEB設(shè)定整機(jī)功耗封頂值,當(dāng)實(shí)際功耗超過封頂值,自動(dòng)對(duì)CPU做降功耗處理從而實(shí)現(xiàn)整機(jī)功耗剎車功能;CPLD可實(shí)時(shí)偵測(cè)BMC相關(guān)信號(hào)以判斷BMC是否響應(yīng)正常,如果不正常一定時(shí)間后自動(dòng)恢復(fù)BMC。4.5、GPU計(jì)算節(jié)點(diǎn)2序號(hào)技術(shù)要求1機(jī)型:2U。2處理器:配置≥2顆CPU,核心數(shù)≥96核,每顆CPU主頻≥2.4GHz,L3緩存≥384M。3內(nèi)存:配置≥16條64GBDDR54800內(nèi)存,支持≥24個(gè)內(nèi)存插槽,支持內(nèi)存ECC保護(hù)、內(nèi)存鏡像、內(nèi)存熱備。4硬盤:配置≥2塊960GSATASSD,系統(tǒng)盤做Raid1。5Riad卡:配置4GBCache、12GbRAID控制器,支持RAID0/1/5/10/50。6網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。7GPU卡:配置1張雙寬GPU卡,單塊GPU卡計(jì)算核心數(shù)量≥18176,單塊GPU卡顯存容量≥48GB。8系統(tǒng)風(fēng)扇:配置6個(gè)熱插拔風(fēng)扇模組,支持N+2冗余。9GPU卡擴(kuò)展:最大支持4雙寬GPU/8單寬GPU。10電源:配置熱插拔鉑金1+1冗余電源,單個(gè)電源功率不低于2200W白金電源。11安全:用戶可以設(shè)定想要阻止訪問BMC的黑名單,或者設(shè)定允許訪問BMC的白名單,提升安全性。12智能管控:BMC監(jiān)控CPU、內(nèi)存、HDD、PCIE設(shè)備和風(fēng)扇功耗,通過BMCWEB設(shè)定整機(jī)功耗封頂值,當(dāng)實(shí)際功耗超過封頂值,自動(dòng)對(duì)CPU做降功耗處理從而實(shí)現(xiàn)整機(jī)功耗剎車功能;CPLD可實(shí)時(shí)偵測(cè)BMC相關(guān)信號(hào)以判斷BMC是否響應(yīng)正常,如果不正常一定時(shí)間后自動(dòng)恢復(fù)BMC。4.6、高性能分布式存儲(chǔ)序號(hào)技術(shù)要求1產(chǎn)品形態(tài):支持3~4096節(jié)點(diǎn)的彈性無縫擴(kuò)展,單一存儲(chǔ)空間容量可擴(kuò)展至EB級(jí)。支持文件存儲(chǔ)、對(duì)象存儲(chǔ)、塊存儲(chǔ)、大數(shù)據(jù)存儲(chǔ)服務(wù)。2產(chǎn)品自研能力:具有完全自主知識(shí)產(chǎn)權(quán),廠商具備存儲(chǔ)產(chǎn)品軟硬件平臺(tái)設(shè)計(jì)開發(fā)能力、服務(wù)器生產(chǎn)制造能力。3處理器:配置≥2顆CPU,核心數(shù)≥12核,每顆CPU主頻≥2.1GHz。4內(nèi)存配置≥4條16GDDR4。5存儲(chǔ)空間:配置≥24個(gè)2.5寸熱插拔硬盤槽位,系統(tǒng)盤:≥2塊960GB2.5SATASSD,數(shù)據(jù)盤:≥16塊7.68T2.5U.2NvmeSSD。6存儲(chǔ)協(xié)議:LinuxPOSIX、NFS、SMB、FTP、S3、HDFS。7網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。8產(chǎn)品架構(gòu):采用Scale-Out分布式集群存儲(chǔ)架構(gòu),支持全局單一文件系統(tǒng)和統(tǒng)一命名空間,不接受IO節(jié)點(diǎn)+擴(kuò)展柜或JBOD的模式,同時(shí)支持全對(duì)稱式、非對(duì)稱式部署兩種方式,全冗余架構(gòu),無單點(diǎn)故障,支持多種網(wǎng)絡(luò)類型,包括1GbE、10GbE、25GbE、100GbInfiniband等。9存儲(chǔ)協(xié)議:本次采用POSIX協(xié)議接口部署,在計(jì)算節(jié)點(diǎn)部署POSIX內(nèi)核態(tài)安裝包,POSIX接口數(shù)據(jù)共享訪問延遲低于10ms。支持單個(gè)客戶端掛載多套存儲(chǔ)集群文件系統(tǒng)。10目錄QoS功能:可設(shè)置目錄承載的最大帶寬及IOPS,保證關(guān)鍵業(yè)務(wù)的性能資源。11MPI-IO融合:分布式存儲(chǔ)支持MPI-IO。12回收站功能:支持?jǐn)?shù)據(jù)回收站功能,回收站過期時(shí)間支持不少于25天。13數(shù)據(jù)策略:支持在線修改糾刪碼、數(shù)據(jù)副本配置功能。14IO可視化:本地存儲(chǔ)系統(tǒng)支持部署IO可視化分析工具,提供IO讀寫分布統(tǒng)計(jì)、IO塊大小統(tǒng)計(jì)、隨機(jī)程度統(tǒng)計(jì)、客戶端帶寬IOPS、獨(dú)立緩存節(jié)點(diǎn)特性等分析等。15分級(jí)存儲(chǔ):支持?jǐn)?shù)據(jù)再快速和低速存儲(chǔ)介質(zhì)上流動(dòng),可以根據(jù)文件名、文件大小、訪問時(shí)間、修改時(shí)間等設(shè)置數(shù)據(jù)遷移策略。16數(shù)據(jù)遷移:產(chǎn)品原生支持?jǐn)?shù)據(jù)遷移功能(子模塊),與產(chǎn)品同品牌,非第三方OEM軟件產(chǎn)品或功能,遷移過程可視化。17運(yùn)維管理:提供GUI管理界面,支持運(yùn)維可視化,無需第三方軟件或插件,即可支持同一Web界面管理多套存儲(chǔ)集群。4.7、大容量分布式存儲(chǔ)序號(hào)技術(shù)要求1本次配置分布式存儲(chǔ)劃分為2個(gè)存儲(chǔ)池。其中3節(jié)點(diǎn)用于HPC集群,6節(jié)點(diǎn)用戶GPU集群。2產(chǎn)品形態(tài):支持3~4096節(jié)點(diǎn)的彈性無縫擴(kuò)展,單一存儲(chǔ)空間容量可擴(kuò)展至EB級(jí)。支持文件存儲(chǔ)、對(duì)象存儲(chǔ)、塊存儲(chǔ)、大數(shù)據(jù)存儲(chǔ)服務(wù)。3產(chǎn)品自研能力:具有完全自主知識(shí)產(chǎn)權(quán),廠商具備存儲(chǔ)產(chǎn)品軟硬件平臺(tái)設(shè)計(jì)開發(fā)能力、服務(wù)器生產(chǎn)制造能力。4處理器:配置≥2顆CPU,核心數(shù)≥12核,每顆CPU主頻≥2.1GHz。5內(nèi)存配置≥4條16GDDR4。6存儲(chǔ)空間:配置≥36個(gè)3.5寸熱插拔硬盤槽位,≥4個(gè)2.5寸后置熱插拔硬盤槽位。系統(tǒng)盤:≥2塊480G2.5SATASSD,元數(shù)據(jù)盤:≥2塊960GB2.5SATASSD,緩存盤:≥2塊3.84TNVME硬盤,數(shù)據(jù)盤:≥32塊18TB3.5寸7.2KSATA硬盤。7存儲(chǔ)協(xié)議:LinuxPOSIX、NFS、SMB、FTP、S3、HDFS。8網(wǎng)絡(luò):配置≥1張雙口1GRJ45網(wǎng)卡,配置≥1張雙口10G光纖網(wǎng)卡(含SFP+多模光模塊),配置≥1單端口100GHDRHCA卡。9產(chǎn)品架構(gòu):采用Scale-Out分布式集群存儲(chǔ)架構(gòu),支持全局單一文件系統(tǒng)和統(tǒng)一命名空間,不接受IO節(jié)點(diǎn)+擴(kuò)展柜或JBOD的模式,同時(shí)支持全對(duì)稱式、非對(duì)稱式部署兩種方式,全冗余架構(gòu),無單點(diǎn)故障,支持多種網(wǎng)絡(luò)類型,包括1GbE、10GbE、25GbE、100GbInfiniband等。10存儲(chǔ)快照:支持文件/目錄級(jí)快照,存儲(chǔ)系統(tǒng)支持快照≥20000;存儲(chǔ)系統(tǒng)的Web界面可實(shí)現(xiàn)快照的回滾,以上功能提供Web界面功能截圖證明,投標(biāo)時(shí)提供第三方檢測(cè)機(jī)構(gòu)提供的測(cè)試報(bào)告掃描件。11回收站功能:支持?jǐn)?shù)據(jù)回收站功能,回收站過期時(shí)間支持不少于25天,投標(biāo)時(shí)提供Web界面功能截圖作為證明。12數(shù)據(jù)策略:支持在線修改糾刪碼、數(shù)據(jù)副本配置功能。13遠(yuǎn)程復(fù)制:支持文件級(jí)遠(yuǎn)程復(fù)制(非分布式塊級(jí)),基于目錄級(jí)異步復(fù)制,支持1對(duì)1復(fù)制、1對(duì)多復(fù)制、多對(duì)1復(fù)制、雙向復(fù)制;支持Failover、Failback,實(shí)現(xiàn)遠(yuǎn)程容災(zāi)備份;可實(shí)時(shí)顯示復(fù)制進(jìn)度,復(fù)制占用帶寬,可對(duì)復(fù)制網(wǎng)絡(luò)帶寬進(jìn)行限制。14分級(jí)存儲(chǔ):支持?jǐn)?shù)據(jù)再快速和低速存儲(chǔ)介質(zhì)上流動(dòng),可以根據(jù)文件名、文件大小、訪問時(shí)間、修改時(shí)間等設(shè)置數(shù)據(jù)遷移策略。15數(shù)據(jù)遷移:產(chǎn)品原生支持?jǐn)?shù)據(jù)遷移功能(子模塊),與產(chǎn)品同品牌,非第三方OEM軟件產(chǎn)品或功能,遷移過程可視化。16運(yùn)維管理:提供GUI管理界面,支持運(yùn)維可視化,無需第三方軟件或插件,即可支持同一Web界面管理多套存儲(chǔ)集群。17第三方系統(tǒng)兼容性:兼容OpenStack、Kubernetes、VMware等主流架構(gòu)云、容器和虛擬化平臺(tái);本地存儲(chǔ)系統(tǒng)兼容紅旗、中科方德等常見國(guó)產(chǎn)OS操作系統(tǒng)。4.8、千兆交換機(jī)序號(hào)技術(shù)要求1配置48個(gè)10/100/1000M自適應(yīng)電口,4個(gè)1G/10GSFP+光口,交換容量≥672Gbps/6.72Tbps、包轉(zhuǎn)發(fā)率≥207Mpps/260Mpps。4.9、萬兆交換機(jī)序號(hào)技術(shù)要求1配置48個(gè)10GSFP+接口、8個(gè)100GQSFP28接口,交換容量≥4.8Tbps,包轉(zhuǎn)發(fā)速率≥2000Mpps。配置滿足本項(xiàng)目的所需的線纜。4.10、高速交換機(jī)序號(hào)技術(shù)要求1≥40個(gè)200GB端口IB交換機(jī),配齊本次所需IB光纜。4.11、集群管理與作業(yè)調(diào)度系統(tǒng)序號(hào)技術(shù)要求1商業(yè)版產(chǎn)品:軟件界面必須實(shí)現(xiàn)完全中文化。2API接口:提供開發(fā)接口API及文檔,允許在該套系統(tǒng)基礎(chǔ)上做二次開發(fā)。提供API示例文檔。3物理視圖:提供設(shè)備詳細(xì)狀態(tài)監(jiān)控視圖,分類展示該節(jié)點(diǎn)的靜態(tài)信息和運(yùn)行狀態(tài)。靜態(tài)配置信息包括CPU型號(hào)、內(nèi)存大小、管理IP、操作系統(tǒng)版本等,動(dòng)態(tài)信息包括磁盤分區(qū)狀態(tài)、網(wǎng)卡狀態(tài)、進(jìn)程狀態(tài)、IPMI傳感器狀態(tài)、GPU/MIC狀態(tài)等。支持iKVM遠(yuǎn)程管理。4支持圖形可視化方式集中展現(xiàn)集群中所有服務(wù)器的關(guān)鍵指標(biāo),如CPU利用率、內(nèi)存利用率、網(wǎng)絡(luò)可用性、電源狀態(tài)、溫度等,支持指標(biāo)快速切換。5數(shù)據(jù)分析:支持節(jié)點(diǎn)健康度按照(關(guān)機(jī)時(shí)間,管理網(wǎng)不可用,告警數(shù)量)進(jìn)行統(tǒng)計(jì)分析節(jié)點(diǎn)用量統(tǒng)計(jì)分析(相對(duì)一分鐘負(fù)載,內(nèi)存利用率,磁盤利用率,磁盤增長(zhǎng)量,功耗)。6監(jiān)控首頁(yè):支持集群負(fù)載,集群功耗,健康度,共享存儲(chǔ)等統(tǒng)計(jì)分析。7GPU監(jiān)控:支持監(jiān)控GPU資源總量/使用量、核心平均利用率、顯存平均利用率、溫度、顯存頻率、核心頻率、型號(hào)、SN號(hào)、負(fù)載進(jìn)程、功耗、風(fēng)扇轉(zhuǎn)速、PCIE寬度、PCIEgen、PCIE接收與發(fā)送速率、GPU驅(qū)動(dòng)版本等指標(biāo)。8大規(guī)模監(jiān)控:集群管理和作業(yè)調(diào)度軟件針對(duì)HPC深度優(yōu)化,具有支持大規(guī)模調(diào)度能力,支持3000節(jié)點(diǎn)或以上調(diào)度。9集群配置管理運(yùn)維工具:提供一套基于命令行的集群環(huán)境配置工具軟件,實(shí)現(xiàn)一鍵配置所有節(jié)點(diǎn)的SSH無密碼訪問、RSH無密碼訪問、網(wǎng)絡(luò)連通檢測(cè)、IPMI配置、NFS配置、添加及刪除用戶、同步文件,實(shí)現(xiàn)所有節(jié)點(diǎn)并行執(zhí)行命令等功能,方便集群運(yùn)維管理。10軟件環(huán)境自動(dòng)化部署工具:提供一套自動(dòng)化部署工具,工具具有常用MPI、數(shù)學(xué)函數(shù)庫(kù)、GPU開發(fā)環(huán)境、HPC基準(zhǔn)測(cè)試程序、常用開源HPC應(yīng)用軟件的一鍵部署功能,可選擇性或一鍵安裝。11日志管理:提供平臺(tái)操作日志管理功能,允許管理員查看登陸用戶的歷史操作記錄。12調(diào)度系統(tǒng):支持基于支持PBS和SLURM雙擎計(jì)算調(diào)度系統(tǒng)。13作業(yè)優(yōu)先級(jí)策略:支持基于隊(duì)列、用戶、用戶組等多個(gè)維度的優(yōu)先級(jí)定義策略,根據(jù)作業(yè)的靜態(tài)(如資源請(qǐng)求、所屬用戶等)和動(dòng)態(tài)指標(biāo)(如入隊(duì)時(shí)間、公平共享份額等),通過不同的權(quán)重設(shè)置,靈活控制作業(yè)優(yōu)先級(jí)。14作業(yè)回填策略:支持作業(yè)回填,有效平衡大作業(yè)和小作業(yè)的調(diào)度,提高集群作業(yè)吞吐量;支持作業(yè)多級(jí)搶占,支持對(duì)被搶占作業(yè)進(jìn)行“掛起”、“重新入隊(duì)”等處理操作;允許作業(yè)獨(dú)占計(jì)算節(jié)點(diǎn),支持集群、隊(duì)列、作業(yè)三級(jí)的的節(jié)點(diǎn)獨(dú)占策略設(shè)置。15瞬時(shí)提交性能:支持大批量作業(yè)的實(shí)時(shí)調(diào)度,支持最大瞬時(shí)大規(guī)模作業(yè)(超過1000+個(gè))的同時(shí)提交。16殘留進(jìn)程和非法進(jìn)程清理:支持對(duì)作業(yè)殘留進(jìn)程和非法作業(yè)(即未提交調(diào)度系統(tǒng)、手動(dòng)運(yùn)行的作業(yè))進(jìn)程的自動(dòng)清理。支持基于節(jié)點(diǎn)、用戶、進(jìn)程等不同維度的白名單和黑名單設(shè)置,支持多維復(fù)合過濾條件設(shè)置,支持對(duì)殘留作業(yè)進(jìn)程、非法作業(yè)進(jìn)程的自動(dòng)清理。17用戶資源配置:支持基于Web的用戶管理,設(shè)置不同用戶的用戶類型、用戶優(yōu)先級(jí)、資源配額、可訪問隊(duì)列等。18應(yīng)用特征采集:支持應(yīng)用特征分析工具,結(jié)合軟硬件平臺(tái),用于分析軟件及硬件的調(diào)優(yōu)。19應(yīng)用瓶頸分析:通過應(yīng)用特征的實(shí)時(shí)監(jiān)控可以更加清晰的了解應(yīng)用程序在運(yùn)行時(shí)所需要的硬件資源,從而可以給出針對(duì)不同應(yīng)用程序的更優(yōu)的解決方案,同時(shí)可以了解硬件環(huán)境的實(shí)時(shí)運(yùn)行現(xiàn)狀,發(fā)現(xiàn)某些程序在運(yùn)行時(shí)的瓶頸所在,更好的優(yōu)化并行應(yīng)用程序。20應(yīng)用分析示例:提供軟件運(yùn)行特征示例截圖。提供硬件CPU利用率、CPU軟中斷、網(wǎng)絡(luò)監(jiān)控、系統(tǒng)服務(wù)監(jiān)控、應(yīng)用程序監(jiān)控、用戶組監(jiān)控、微架構(gòu)&GPU監(jiān)控、統(tǒng)計(jì)分析等。項(xiàng)目實(shí)施、售后服務(wù)和質(zhì)量要求為使項(xiàng)目按質(zhì)、按量、按時(shí)及有序?qū)嵤?,供?yīng)商應(yīng)建立完善、穩(wěn)定的協(xié)調(diào)機(jī)制、制定包括但不限于安裝、調(diào)試、培訓(xùn)等方面的規(guī)劃計(jì)劃,從各方面創(chuàng)造良好的服務(wù)環(huán)境,確保項(xiàng)目的順利實(shí)施。(一)項(xiàng)目實(shí)施要求1、人員組織管理(1)項(xiàng)目經(jīng)理配備:負(fù)責(zé)本項(xiàng)目的項(xiàng)目經(jīng)理,5年或以上工作經(jīng)驗(yàn),具備信息系統(tǒng)項(xiàng)目管理師證書,需掌握計(jì)算機(jī)系統(tǒng)、網(wǎng)絡(luò)、安全等方面的知識(shí),能夠快速熟悉并掌握醫(yī)院的業(yè)務(wù)運(yùn)作模式,承擔(dān)起項(xiàng)目質(zhì)量、安全、管理的責(zé)任。負(fù)責(zé)處理項(xiàng)目日常事務(wù)工作,在項(xiàng)目計(jì)劃、組織和控制活動(dòng)中做好領(lǐng)導(dǎo)工作,起到上傳下達(dá)的作用,配合協(xié)調(diào)采購(gòu)安裝、軟件廠商部署、調(diào)試事宜,確保項(xiàng)目按照約定工期完成,達(dá)到項(xiàng)目順利完成的目的。(2)技術(shù)人員配備:負(fù)責(zé)本項(xiàng)目的技術(shù)人員,3年或以上工作經(jīng)驗(yàn),具備系統(tǒng)集成項(xiàng)目管理工程師或系統(tǒng)架構(gòu)設(shè)計(jì)師或者軟件測(cè)評(píng)師一項(xiàng)或多項(xiàng)證書,必須熟悉系統(tǒng)軟件、集群管理等,具備相關(guān)的網(wǎng)絡(luò)、集成等知識(shí),確保項(xiàng)目按照約定工期完成,達(dá)到項(xiàng)目順利完成的目的。(3)在系統(tǒng)實(shí)施期間,承諾的項(xiàng)目經(jīng)理及實(shí)施人員未經(jīng)采購(gòu)人同意不得調(diào)整,如中途更換項(xiàng)目經(jīng)理,必須征得采購(gòu)人同意。如在項(xiàng)目實(shí)施過程中出現(xiàn)資源、進(jìn)度、質(zhì)量協(xié)調(diào)控制不力的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 中秋節(jié)融情教育
- 文本效果教程03填充字效果
- 社會(huì)安全風(fēng)險(xiǎn)的防范
- 2025年護(hù)士執(zhí)業(yè)資格考試題庫(kù)-急危重癥護(hù)理學(xué)護(hù)理安全試題
- 2025年成人高考《語文》語言表達(dá)與運(yùn)用題型全解試卷
- 2025年統(tǒng)計(jì)學(xué)期末考試題庫(kù):統(tǒng)計(jì)學(xué)術(shù)論文寫作研究方法選擇與運(yùn)用試題
- 2025年西式面點(diǎn)師職業(yè)資格考試模擬試題全解集錦本集錦集
- 2025年成人高等學(xué)校招生考試《語文》作文立意與技巧模擬試卷
- 湖心亭看雪說課
- 公共建筑空調(diào)運(yùn)行節(jié)能策略
- 部編版三年級(jí)語文下冊(cè)教學(xué)計(jì)劃(含進(jìn)度表)
- DB11∕T1082-2024工業(yè)γ射線移動(dòng)探傷治安防范要求
- 2025年常州機(jī)電職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性考試題庫(kù)及答案1套
- 肺動(dòng)脈栓塞溶栓治療個(gè)體化方案探討-深度研究
- 2025年中考英語熱點(diǎn)話題預(yù)測(cè)-哪吒(含答案)
- 【2025新教材】教科版一年級(jí)科學(xué)下冊(cè)全冊(cè)教案【含反思】
- 上海市建設(shè)工程施工圖設(shè)計(jì)文件勘察設(shè)計(jì)質(zhì)量疑難問題匯編(2024 版)
- 律師執(zhí)業(yè)風(fēng)險(xiǎn)防范研究-深度研究
- 2024年全國(guó)職業(yè)院校技能大賽中職組(母嬰照護(hù)賽項(xiàng))考試題庫(kù)(含答案)
- 2025年春新人教版語文一年級(jí)下冊(cè)教學(xué)課件 語文園地二
- 危險(xiǎn)化學(xué)品生產(chǎn)企業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化標(biāo)準(zhǔn)2024
評(píng)論
0/150
提交評(píng)論