版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
證券研究報(bào)告|
2024年7月4日新型智算中心改造系列報(bào)告二:拉動全球電力消耗增長,液冷滲透率快速提升行業(yè)研究·
行業(yè)專題計(jì)算機(jī)·
人工智能投資評級:優(yōu)于大市(維持評級)摘要?
能源測:智算中心電力消耗測算。1)單POD功率:以目前最常用的英偉達(dá)DGXH100計(jì)算集群(POD)為例,單POD(127節(jié)點(diǎn))功率合計(jì)為1411.176kw,其中計(jì)算部分占比最高(為89.83%,即DGXH100服務(wù)器),其次為計(jì)算用交換機(jī)(為5.72%);2)單位算力能耗模型:以英偉達(dá)DGXH100服務(wù)器為例,假設(shè)利用率為80%,PUE為1.25,可知單臺服務(wù)器對應(yīng)智算中心功率消耗為11,112w,對應(yīng)年度用電量為97,338KWh;TF32下單位petaFLOPS算力對應(yīng)智算中心年度用電量為12,167Kwh,F(xiàn)P16下單位petaFLOPS算力對應(yīng)智算中心年度用電量為6,084Kwh;3)對全球電力影響:根據(jù)
GIV發(fā)布的《智能世界2030》預(yù)測,預(yù)計(jì)2030年全球AI算力將超過105ZFLOPS(FP16),對應(yīng)每年638.82太瓦時(shí)用電量,以22年為基年,額外帶來2.4%的全球用電增量。?
供電側(cè):多種配電方案并存。目前主流的供電方案包括交流UPS架構(gòu)、高壓直流架構(gòu)、機(jī)架式直流架構(gòu),智能算力(單一服務(wù)器加裝8張GPU算力卡)帶來高功率需求,對供電側(cè)零部件提出更高要求。?
冷卻側(cè):液冷將替代傳統(tǒng)風(fēng)冷方案。1)國內(nèi)液冷滲透率將進(jìn)入加速期:AI算力芯片功率持續(xù)提升,設(shè)備功率密度接近風(fēng)冷極限,同時(shí)疊加智算中心PUE考核趨緊,24年國內(nèi)液冷滲透率將進(jìn)入加速期;2)液冷市場規(guī)模快速增長:據(jù)研究院披露數(shù)據(jù),預(yù)計(jì)24年中國液冷服務(wù)器市場規(guī)模將達(dá)到201億人民幣,預(yù)計(jì)27年將增長至682億人民幣,對應(yīng)24-27年CAGR為50.3%,市場規(guī)??焖僭鲩L。?
投資建議:隨著中國智能人工智能算力的快速發(fā)展,將拉動全社會用電量的增長;根據(jù)我們測算,F(xiàn)P16精度下智算中心單PetaFLOPS算力對應(yīng)1年耗電量為6,084Kwh(以英偉達(dá)DGXH100服務(wù)器為例),若替換成國產(chǎn)算力芯片,單PetaFLOPS耗電量仍將提升(受制于芯片制程);同時(shí),智能算力(單一服務(wù)器加裝8張GPU算力卡)帶來高功率需求,對配電側(cè)提出更高要求,建議關(guān)注虛擬電廠和配網(wǎng)側(cè)方向,重點(diǎn)關(guān)注朗新集團(tuán)、國網(wǎng)信通。?
風(fēng)險(xiǎn)提示:宏觀經(jīng)濟(jì)波動、互聯(lián)網(wǎng)及運(yùn)營商資本開支不及預(yù)期、美國繼續(xù)收縮對華算力芯片出口政策、國產(chǎn)算力卡研發(fā)進(jìn)展不及預(yù)期險(xiǎn)等。目錄能源側(cè):智算中心電力消耗測算01供電側(cè):多種配電方案并存冷卻側(cè):液冷將替代傳統(tǒng)風(fēng)冷方案案例研究:新型綠色智算中心分析投資建議及風(fēng)險(xiǎn)提示02030405智算中心:服務(wù)器機(jī)柜內(nèi)外組成結(jié)構(gòu)?
服務(wù)器機(jī)柜內(nèi):主要包括GPU、CPU、內(nèi)存(RAM)、硬盤(HardDrive)、網(wǎng)絡(luò)交換機(jī)(NetworkSwitch)、配電單元(PDU)等;?
服務(wù)器機(jī)柜外:主要包括供電系統(tǒng)(功率轉(zhuǎn)化器、功率分配器等)、冷卻系統(tǒng)(制冷機(jī)、冷卻塔、氣/水分配系統(tǒng))、安全及監(jiān)控系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)(連接件)等。圖1:服務(wù)器機(jī)柜內(nèi)主要包括CPU、GPU、存儲、硬盤、交換機(jī)、電源分配單元圖2:服務(wù)器機(jī)柜外部包括供電系統(tǒng)、冷卻系統(tǒng)、安全及監(jiān)控系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)資料:Konstantin等著-《ComputeatScale-Abroadinvestigationintothedatacenterindustry》資料:Konstantin等著-《ComputeatScale-Abroadinvestigationintothedatacenterindustry》-ArXiV(2023)-P5,國信證券經(jīng)濟(jì)研究所整理-ArXiV(2023)-P6,國信證券經(jīng)濟(jì)研究所整理智算中心:單一POD(集群)拆解-外部?
單一POD(集群)組成:由服務(wù)器(例如英偉達(dá)DGX系統(tǒng))、InfiniBand和
網(wǎng)絡(luò)、管理節(jié)點(diǎn)(ManagementNode/ManagementRacks)、存儲(Storage)、電纜橋架(CableTray)、冷通道(ColdAisleContainment)、跨橋通道(AisleCrossingBridge)組成;圖3:單一Pod(集群)結(jié)構(gòu)圖4:英偉達(dá)典型單一SU組成資料:《NVIDIADGXSuperPODDataCenterDesign》,國信證券經(jīng)濟(jì)研究所整理資料:《NVIDIADGXSuperPODDataCenterDesign》,國信證券經(jīng)濟(jì)研究所整理智算中心:單一POD(集群)拆解-內(nèi)部?
單個(gè)SU架構(gòu):由8個(gè)服務(wù)器機(jī)柜組成,每個(gè)服務(wù)器機(jī)構(gòu)中放置4臺DGXH100服務(wù)器(包含8顆H100GPU芯片)和3個(gè)配電單元(PDU),即單一SU包含32臺DGXH100服務(wù)器(對應(yīng)256顆H100芯片)和24個(gè)配電單元(PDU);?
管理機(jī)柜(ManagementRack):包含網(wǎng)絡(luò)交換機(jī)、管理服務(wù)器、存儲陣列(StorageArray)和UFM控制器(UnifiedFabricManager);以英偉達(dá)管理機(jī)柜為例,其包含32個(gè)QM9700ComputeLeaves、16個(gè)QM9700ComputeSpines、2個(gè)ComputeUFMs、6個(gè)SN4600cIn-BandLeaves、2個(gè)SN4600cIn-BandLeaves、4個(gè)BCMNodes、8個(gè)QM9700StorageLeaves、4個(gè)QM9700StorageSpines、8個(gè)SN2201Outof-BandLeaves。圖5:英偉達(dá)單個(gè)SU(ScalableUnit)架構(gòu)圖6:英偉達(dá)管理機(jī)柜(ManagementRack)架構(gòu)資料
:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理資料
:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理單一POD(集群)網(wǎng)絡(luò)結(jié)構(gòu)(Network
Fabrics)?
單個(gè)POD(集群)網(wǎng)絡(luò)結(jié)構(gòu)(Network
Fabrics)通常包括計(jì)算網(wǎng)絡(luò)、存儲網(wǎng)絡(luò)、In-Band管理網(wǎng)絡(luò)、Out-of-Band管理網(wǎng)絡(luò)。?
計(jì)算網(wǎng)絡(luò)(ComputeFabrics):主板中間的4個(gè)OSFD端口留給計(jì)算網(wǎng)絡(luò),每個(gè)端口直連到2顆Connect-7X卡(共計(jì)8×400Gb/s端口);?
存儲網(wǎng)絡(luò)(StorageFabrics):主板兩側(cè)各1個(gè)QSFP單向存儲端口,連接內(nèi)部ConnectX-7card;?
In-Band管理網(wǎng)絡(luò)(In-BandManagementNetwork):主板兩側(cè)各1個(gè)In-Band管理端口,連接內(nèi)部ConnectX-7card;?
Out-of-Band管理網(wǎng)絡(luò)(Out-of-BandManagementNetwork):主板中間下部1個(gè)Out-of-Band管理端口(1GbERJ-45端口);圖7:英偉達(dá)DGXH100網(wǎng)絡(luò)端口(服務(wù)器背面)資料:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》、英偉達(dá),國信證券經(jīng)濟(jì)研究所整理單一POD(集群)網(wǎng)絡(luò)結(jié)構(gòu)-計(jì)算網(wǎng)絡(luò)?
計(jì)算網(wǎng)絡(luò):AI大模型的訓(xùn)練,通常需要多個(gè)GPU協(xié)同工作,計(jì)算網(wǎng)絡(luò)可實(shí)現(xiàn)數(shù)據(jù)跨GPU計(jì)算;?
計(jì)算網(wǎng)絡(luò)層數(shù):通常POD(集群)計(jì)算網(wǎng)絡(luò)可包含三層交換機(jī),分別是Leaf交換機(jī)、Spine交換機(jī)和Core交換機(jī);在英偉達(dá)127節(jié)點(diǎn)計(jì)算網(wǎng)絡(luò)中,僅使用兩層交換機(jī)(Leaf和Spine,型號為MellanoxQM9700),且每個(gè)SU中有8臺交換機(jī)和32臺DGXH100服務(wù)器,則每臺服務(wù)器應(yīng)和8臺交換機(jī)相連,而如前文所述,單臺服務(wù)器背面僅4個(gè)800GOSFP端口(用于計(jì)算網(wǎng)絡(luò)),則需要在端口接入光模塊后,通過拓展端口將1個(gè)OSFP端口拓展成2個(gè)QSFD端口,進(jìn)而實(shí)現(xiàn)連接。圖8:127節(jié)點(diǎn)計(jì)算網(wǎng)絡(luò)(ComputeFabrics)架構(gòu)表1:計(jì)算網(wǎng)絡(luò)節(jié)點(diǎn)測算InfiniBandSwitch數(shù)量電纜CountSU數(shù)量節(jié)點(diǎn)數(shù)量GPU數(shù)量Compute+UFMSpine-LeafLeafSpine12343163248504848252256512162432508764957601616768127101610201024資料
:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理資料:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理(注:通常需要1個(gè)服務(wù)器用于UFM連接,所以1個(gè)SU對應(yīng)31個(gè)節(jié)點(diǎn))單一POD(集群)網(wǎng)絡(luò)結(jié)構(gòu)-存儲網(wǎng)絡(luò)?
存儲網(wǎng)絡(luò):英偉達(dá)SuperPOD使用InfiniBand網(wǎng)絡(luò)(每節(jié)點(diǎn)I/O速率要超過40GBps),以滿足服務(wù)器集群共享存儲的需要;?
存儲網(wǎng)絡(luò)層數(shù):A100和H100超級集群均采用兩層交換機(jī),以140節(jié)點(diǎn)的A100超級集群存儲網(wǎng)絡(luò)為例,共使用26臺交換機(jī)(包括18臺leaf交換機(jī)和8臺Spine交換機(jī))。圖9:140節(jié)點(diǎn)存儲網(wǎng)絡(luò)(StorageFabrics)架構(gòu)-DGXSuperPOD-A100圖10:存儲網(wǎng)絡(luò)架構(gòu)(StorageFabrics)架構(gòu)-DGXSuperPOD-H100資料究所整理:《NVIDIADGXSuperPOD:ScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研資料
:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理表2:DGXSuperPOD-A100存儲網(wǎng)絡(luò)交換機(jī)和線纜數(shù)測算圖11:MQM9700-NS2F交換機(jī)QM8790Switches數(shù)量電纜SU數(shù)量節(jié)點(diǎn)數(shù)量存儲端口Leaf4SpineTo-Node40To-StorageSpine6412346720402440405680802448883652526892926809660812016024028012819225628880121618120140資料究所整理:《NVIDIADGXSuperPOD:ScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研資料
:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理單一POD(集群)網(wǎng)絡(luò)結(jié)構(gòu)-In-Band管理網(wǎng)絡(luò)?
In-Band管理網(wǎng)絡(luò)(In-BandManagementFabrics):In-Band管理網(wǎng)絡(luò)連接計(jì)算節(jié)點(diǎn)和管理節(jié)點(diǎn)(基于
網(wǎng)),主要為集群提供以下功能:1)連接管理集群的所有服務(wù);2)管控集群中節(jié)點(diǎn)訪問主文件系統(tǒng)和存儲池;3)連接集群內(nèi)外服務(wù)(集群內(nèi)服務(wù):BaseCommondManager、Slurm等;集群外服務(wù):NGC登記、代碼倉庫、數(shù)據(jù)資源等)。以DGXSuperPOD-A100In-Band管理網(wǎng)絡(luò)架構(gòu)為例,140個(gè)節(jié)點(diǎn)對應(yīng)8臺交換機(jī)(6臺Leaf交換機(jī)、2臺Spine交換機(jī))。圖12:2個(gè)SU的In-Band管理網(wǎng)絡(luò)架構(gòu)-DGXSuperPOD-A100圖13:In-Band管理網(wǎng)絡(luò)架構(gòu)-DGXSuperPOD-H100資料究所整理:《NVIDIADGXSuperPOD:ScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研資料
:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理表3:DGXSuperPOD-A100帶內(nèi)管理網(wǎng)絡(luò)交換機(jī)測算圖14:AS4610交換機(jī)SU數(shù)量節(jié)點(diǎn)數(shù)量Leaf交換機(jī)Spine交換機(jī)12346720(SingleSU)224466002222406080120140(DGXSuperPOD)資料究所整理:《NVIDIADGXSuperPOD:ScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研資料
:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理單一POD(集群)網(wǎng)絡(luò)結(jié)構(gòu)-Out-of-Band管理網(wǎng)絡(luò)?
Out-of-Band管理網(wǎng)絡(luò):使用
網(wǎng)絡(luò),連接所有設(shè)備的管理端口,包括DGX服務(wù)器、管理服務(wù)器、存儲、網(wǎng)絡(luò)設(shè)備(Networkinggear)、機(jī)柜PDUs以及其他設(shè)備,140個(gè)節(jié)點(diǎn)對應(yīng)10臺交換機(jī)(使用SN2201交換機(jī))。圖15:Out-of-Band管理網(wǎng)絡(luò)架構(gòu)-DGXSuperPOD-H100圖4:Out-of-Band管理網(wǎng)絡(luò)交換機(jī)測算SU數(shù)量節(jié)點(diǎn)數(shù)量Leaf交換機(jī)12346720(SingleSU)23406048012058140(DGXSuperPOD)10資料究所整理:《NVIDIADGXSuperPOD:ScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研圖16:SN2201交換機(jī)資料
:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理資料
:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理智算中心超級POD(集群)拓展測算?
超級POD(集群)可根據(jù)計(jì)算要求進(jìn)行拓展。目前,常見的POD由4個(gè)SU組成,對應(yīng)128個(gè)計(jì)算節(jié)點(diǎn)(服務(wù)器)和1024顆GPU芯片,包含32個(gè)InfiniBandSwitch-Leaf和16個(gè)InfiniBandSwitch-Spine;目前最大可拓展至64個(gè)SU,對應(yīng)2048個(gè)計(jì)算節(jié)點(diǎn)(服務(wù)器)和16,348顆GPU芯片,包含512個(gè)InfiniBandSwitch-Leaf&Spine和256個(gè)InfiniBandSwitchCore。表5:超級POD(集群)拓展測算InfiniBandSwitch數(shù)量電纜CountLeaf-Spine1024節(jié)點(diǎn)(服務(wù)器)數(shù)量SU數(shù)量GPU數(shù)量Leaf32Spine16Core-Node-Leaf1024Spine-Core1024412825610242048409681921634886432-2048204820481632645121282565121282565126440964096409610242048128256819281928192163841638416384資料:《NVIDIADGXSuperPOD:NextGenerationScalableInfrastructureforAILeadership》,國信證券經(jīng)濟(jì)研究所整理智算中心:服務(wù)器拆解(以DGX
H100為例)?
服務(wù)器拆解:以英偉達(dá)DGXH100為例,服務(wù)器通常包括GPU板組、主板、電源、風(fēng)扇模塊、結(jié)構(gòu)件板塊(前框、底架、前結(jié)構(gòu)架)等,其中服務(wù)器正面提供電源按鍵、2個(gè)USB接口和1個(gè)VGA接口,背面提供6個(gè)電源接口以及網(wǎng)絡(luò)端口(鏈接主板,實(shí)現(xiàn)POD內(nèi)數(shù)據(jù)傳輸)。圖17:英偉達(dá)DGXH100服務(wù)器拆解前框(Bezel)電源按鍵/狀態(tài)LED用戶身份證明按鈕/LED報(bào)錯(cuò)LED指示燈GPU板組GPU板組(GPUTray)12×風(fēng)扇模組主板(Motherboard)風(fēng)扇模塊(FanModules)主板板組底架(Chassis)電源裝置(PowerSupplies)6×機(jī)柜固定螺絲6×電源裝置前結(jié)構(gòu)架(FrontCage)前控制板2×USB,1×VGA,空氣溫度傳感器前控制板(FrontConsoleBoard)安全擦除設(shè)備(SecureEraseDrives)8×3.84TBU.2NVMe安全擦除設(shè)備(SED)拆解圖正面背面資料:英偉達(dá),國信證券經(jīng)濟(jì)研究所整理智算中心:服務(wù)器拆解(以DGX
H100為例)?
服務(wù)器內(nèi)部:包括2顆CPU和8顆GPU、2個(gè)網(wǎng)絡(luò)模組(每個(gè)包含4顆ConnectX-7)、32顆內(nèi)存(64GB)、PCIeSwitches、NvSwitch、線纜等。?
負(fù)載數(shù)據(jù)流:1)當(dāng)執(zhí)行AI工作負(fù)載時(shí),數(shù)據(jù)通過存儲網(wǎng)絡(luò)進(jìn)入機(jī)器,經(jīng)CPU處理后,送到GPU進(jìn)行計(jì)算;2)GPU計(jì)算完成后,數(shù)據(jù)會被發(fā)回存儲或進(jìn)行進(jìn)一步處理。圖18:服務(wù)器內(nèi)部網(wǎng)絡(luò)連接網(wǎng)卡網(wǎng)絡(luò)模塊存儲資料:英偉達(dá),國信證券經(jīng)濟(jì)研究所整理智算中心:單POD耗能測算?
單PODIT耗能測算:根據(jù)英偉達(dá)披露數(shù)據(jù),127節(jié)點(diǎn)POD功率合計(jì)為1411.176kw,其中計(jì)算部分占比最高(為89.83%,即DGXH100服務(wù)器),其次為計(jì)算用交換機(jī)(為5.72%)。表6:單POD耗能測算服務(wù)器交換機(jī)計(jì)算
存儲(Compute)
(Storage)網(wǎng)絡(luò)計(jì)算存儲(Fabric)
(Compute)
(Storage)In-Band管理Out-of-Band管理管理(Mgmt)PowerEdgeR750NVIDIAUFM對應(yīng)產(chǎn)品數(shù)量DGXH100多種QM9700QM9700SN4600CSN22013.14127/5481688單一加總單一加總單一加總10,20028807046001,37666,0481,72082,5605,869281,7065.72%1,37622,0161,72027,5205,86993,9021.91%46698平均功率(Watts)1,295,40010,20017,2803,60021,60012,28473,7021.50%3,5208802,4007503,728820784135峰值功率(Watts)1,295,40034,8044,4003,00315,0130.31%3,0002,55910,2360.21%6,5602,79822,3840.45%1080461峰值熱負(fù)荷(BTU/h)4,420,08889.83%3,6850.07%系統(tǒng)占比資料:《NVIDIADGXSuperPODDataCenterDesign》,國信證券經(jīng)濟(jì)研究所整理智算中心:單位算力能耗模型?單臺服務(wù)器對應(yīng)IT設(shè)備功率:以英偉達(dá)DGXH100服務(wù)器為例,單臺服務(wù)器功率為10,200w;如前文所述,已知127節(jié)點(diǎn)SuperPOD中服務(wù)器部分(存儲、網(wǎng)絡(luò)、管理)和交換機(jī)部分(計(jì)算、存儲、In-Band管理、Out-of-Band管理)功率,則對應(yīng)單臺服務(wù)器為911.62w,加總可知單臺服務(wù)器對應(yīng)IT設(shè)備功率要求為11,112w;??單臺服務(wù)器對應(yīng)智算中心用電量:假設(shè)利用率為80%,PUE為1.25,可知單臺服務(wù)器對應(yīng)智算中心功率消耗為11,112w,對應(yīng)年度用電量為97,338KWh;單位算力對應(yīng)智算中心用電量:已知單臺DGXH100服務(wù)器算力為8petaFLOPS(TF32)和16petaFLOPS(FP16),則TF32下單位petaFLOPS算力對應(yīng)智算中心年度用電量為12,167Kwh,F(xiàn)P16下單位petaFLOPS算力對應(yīng)智算中心年度用電量為6,084Kwh。表7:單位算力能耗模型功率(W)DGXH100服務(wù)器10,2005600700單臺服務(wù)器對應(yīng)IT設(shè)備功率要求11,112
(加總)80%
(假設(shè))8,889AI算力-GPUH100SXM利用率單臺服務(wù)器對應(yīng)IT設(shè)備功率消耗PUE(=數(shù)據(jù)中心總能耗/IT設(shè)備能耗)單臺服務(wù)器對應(yīng)智算中心功率消耗單臺服務(wù)器對應(yīng)智算中心年度用電量數(shù)量(顆)81.25
(假設(shè))11,112其他-CPU、網(wǎng)絡(luò)模組、PCIeSwitch、NVSwitch等460097,338
(KWh)127節(jié)點(diǎn)服務(wù)器-存儲部分對應(yīng)單節(jié)點(diǎn)服務(wù)器存儲127節(jié)點(diǎn)服務(wù)器-管理部分對應(yīng)單節(jié)點(diǎn)服務(wù)器管理127節(jié)點(diǎn)服務(wù)器-網(wǎng)絡(luò)部分對應(yīng)單節(jié)點(diǎn)服務(wù)器網(wǎng)絡(luò)17,280136單臺DGXH100服務(wù)器對應(yīng)算力3,52028TF328
petaFLOPS12,167Kwh/petaFLOPS16
petaFLOPS單petaFLOPS對應(yīng)智算中心年度用電量(TF32)FP162,40019單petaFLOPS對應(yīng)智算中心年度用電量(FP16)6,084Kwh/petaFLOPS127節(jié)點(diǎn)對應(yīng)交換機(jī)-計(jì)算部分66,048520對應(yīng)單節(jié)點(diǎn)服務(wù)器對應(yīng)交換機(jī)-計(jì)算部分127節(jié)點(diǎn)對應(yīng)交換機(jī)-存儲部分22,016173對應(yīng)單節(jié)點(diǎn)服務(wù)器對應(yīng)交換機(jī)-存儲部分127節(jié)點(diǎn)對應(yīng)交換機(jī)-In-Band管理部分對應(yīng)單節(jié)點(diǎn)服務(wù)器對應(yīng)交換機(jī)-In-Band管理部分127節(jié)點(diǎn)對應(yīng)交換機(jī)-Out-of-Band管理部分對應(yīng)單節(jié)點(diǎn)服務(wù)器對應(yīng)交換機(jī)-Out-of-Band管理部分3,728297846單臺服務(wù)器對應(yīng)IT設(shè)備功率要求11,112
(加總)資料:英偉達(dá),《NVIDIADGXSuperPODDataCenterDesign》,國信證券經(jīng)濟(jì)研究所測算智算中心:對電力的影響?智算中心對全球用電量的影響:根據(jù)GIV發(fā)布的《智能世界2030》預(yù)測,預(yù)計(jì)2030年全球通用算力將達(dá)到3.3ZFLOPS(FP32),其中AI算力將超過105ZFLOPS(FP16),增長500倍。根據(jù)上文測算結(jié)果,F(xiàn)P16下單位petaFLOPS算力對應(yīng)智算中心一年用電量為6,084kWh,則105ZFLOPS對應(yīng)每年638.82太瓦時(shí)用電量,以22年為基年,額外帶來2.4%的全球用電增量。但是由于智算中心全球分布不均勻,主要集中在美國、中國等地區(qū),根據(jù)Wind數(shù)據(jù),美國23年總計(jì)用電量為4,000.22太瓦時(shí),假設(shè)全球智算中心美國占比60%(對應(yīng)383.29太瓦時(shí)用電),則額外帶來9.6%的用電增量(以23年為基年)。?智算中心對中國用電量的影響:根據(jù)IDC和浪潮聯(lián)合發(fā)布的《2023-2024年中國人工智能計(jì)算力發(fā)展評估報(bào)告》數(shù)據(jù),預(yù)計(jì)27年中國智能算力規(guī)模將達(dá)到1117.4EFLOPS(FP16),根據(jù)上文測算結(jié)果,對應(yīng)67.98億千瓦時(shí)增量。圖19:全球用電量情況(單位:太瓦時(shí))圖20:中國用電量情況(單位:億千瓦時(shí))中國用電量(億千瓦時(shí))yoy全球用電量(太瓦時(shí))yoy100,00090,00080,00070,00060,00050,00040,00030,00020,00010,000012%10%8%92,24130,00025,00020,00015,00010,0005,00007%6%5%4%26,57386,37283,12810.7%25,78924,437
24,35724,0925.9%23,31175,11022,61622,07872,25521,81321,20968,4498.5%20,47320,03763,07759,19855,213
55,50053,2257.2%3.6%49,6576.7%6.8%6.6%3.3%47,0263.1%3.03%%2%6%4%2%0%2.8%5.6%5.6%2.4%2.2%4.0%3.9%3.7%1.4%1.2%1%0%-0.3%0.5%-1%2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
20222011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
2023資料:Wind,國信證券經(jīng)濟(jì)研究所整理資料:Wind,國信證券經(jīng)濟(jì)研究所整理目錄能源側(cè):智算中心電力消耗測算01供電側(cè):多種配電方案并存冷卻側(cè):液冷將替代傳統(tǒng)風(fēng)冷方案案例研究:新型綠色智算中心分析投資建議及風(fēng)險(xiǎn)提示02030405供電側(cè):主流供電方案?
供電方案:目前主流的供電方案包括交流UPS架構(gòu)、高壓直流架構(gòu)、機(jī)架式直流架構(gòu)。?
交流UPS架構(gòu):當(dāng)市電正常供電時(shí),UPS為電池組充電;當(dāng)市電中斷時(shí),電池組放電,經(jīng)逆變電路為服務(wù)器機(jī)柜提供持續(xù)的電力供應(yīng)。目前該架構(gòu)為行業(yè)內(nèi)最成熟的供電技術(shù),但也存在單點(diǎn)故障、電能變換效率低、設(shè)備拓展性差、多機(jī)并聯(lián)易出現(xiàn)環(huán)流等問題;?
高壓直流架構(gòu):
其具備效率高、并機(jī)方便等優(yōu)勢,在智算中心占比逐步提升,例如阿里巴巴杭州東冠機(jī)房采用高壓直流架構(gòu),但仍存在單點(diǎn)故障問題,且對器件可靠性和直流斷路器等設(shè)備要求較高;?
機(jī)架式直流架構(gòu):谷歌等公司最早提出了機(jī)架式UPS架構(gòu),將服務(wù)器、UPS設(shè)備和電池組集成到服務(wù)器機(jī)柜內(nèi)部,避免了單點(diǎn)故障。圖21:智算中心常見供電方案資料:葉桂森著-《數(shù)據(jù)中心供電-負(fù)載協(xié)同優(yōu)化運(yùn)行技術(shù)研究》-山東大學(xué)(2023年)-P7,國信證券經(jīng)濟(jì)研究所整理供電側(cè):主流供電方案-交流UPS供電架構(gòu)?交流UPS供電架構(gòu):由整流器、逆變器、蓄電池組、靜態(tài)STS切換開關(guān)組成,實(shí)際應(yīng)用中主要分為UPS2N架構(gòu)和市電+UPS架構(gòu)。?????1)市電正常:市電通過整流器、逆變器向負(fù)載供電,同時(shí)為蓄電池充電;2)市電異?;蛑袛啵盒铍姵刈鳛殡娫?,通過逆變器向負(fù)載供電;3)逆變器、蓄電池等中間環(huán)節(jié)故障:通過STS切換開關(guān),改由交流旁路向負(fù)載供電;優(yōu)勢:1)輸出電能品質(zhì)高:對負(fù)載供電均由逆變器提供,能消除市網(wǎng)電壓波動和干擾,實(shí)現(xiàn)無干擾穩(wěn)壓供電;2)無轉(zhuǎn)換時(shí)間:市電供電或蓄電池供電,UPS內(nèi)部無轉(zhuǎn)化運(yùn)作;劣勢:1)供電效率低,電能損失嚴(yán)重:電能自輸入系統(tǒng)到IT設(shè)備主板,需反復(fù)多次AC和DC轉(zhuǎn)換,產(chǎn)生損耗;2)結(jié)構(gòu)復(fù)雜,維護(hù)困難:為提高可靠性,通常采用冗余供電,導(dǎo)致結(jié)構(gòu)負(fù)載,同時(shí)逆變、蒸餾任何環(huán)節(jié)出現(xiàn)故障,導(dǎo)致系統(tǒng)故障,維修難度較大;3)可靠性差:市電中斷,蓄電池放電通過逆變模塊輸出,若其損壞,則無法供電給負(fù)載。??UPS2N架構(gòu):由兩套完全獨(dú)立的UPS系統(tǒng)、同步LBS控制器、靜態(tài)STS切換開關(guān)、變壓器等設(shè)備組成;兩套UPS系統(tǒng)從不同的低壓配電系統(tǒng)引電,平時(shí)每套系統(tǒng)帶載一半電荷,當(dāng)一套系統(tǒng)出現(xiàn)故障時(shí),另外一套系統(tǒng)帶載全部電荷。市電+UPS架構(gòu):由一路市電和一路UPS系統(tǒng)組成;平時(shí)市電作為主用電源帶載全部電荷,當(dāng)市電斷電或者質(zhì)量不滿足要求時(shí)轉(zhuǎn)由UPS供電。圖22:交流UPS供電架構(gòu)圖23:UPS2N架構(gòu)圖24:市電+UPS架構(gòu)資料:周京華、王江博著-《數(shù)據(jù)中心供電架構(gòu)概述與展望》-資料:周京華、王江博著-《數(shù)據(jù)中心供電架構(gòu)概述與展望》-資料:周京華、王江博著-《數(shù)據(jù)中心供電架構(gòu)概述與展望》-電源學(xué)報(bào)(2023)-P3,國信證券經(jīng)濟(jì)研究所整理電源學(xué)報(bào)(2023)-P3,國信證券經(jīng)濟(jì)研究所整理電源學(xué)報(bào)(2023)-P4,國信證券經(jīng)濟(jì)研究所整理供電側(cè):主流供電方案-高壓直流供電架構(gòu)?
高壓直流供電架構(gòu):由交流配電模塊、整流器、直流配電模塊、蓄電池組和監(jiān)控裝置組成,包括336V高壓直流和240V高壓直流兩種標(biāo)準(zhǔn),336V為中國移動標(biāo)準(zhǔn),需要改造設(shè)備和定制電源模塊,240V為中國電信標(biāo)準(zhǔn),配置時(shí)基本不需要進(jìn)行設(shè)備改造和電源定制,應(yīng)用范圍更廣,實(shí)際應(yīng)用中主要分為240V2N直流供電架構(gòu)和市電+240V直流供電架構(gòu)。?
工作原理:整流器為核心部件,交流電通過整流器、直流配電模塊為IT設(shè)備供電,且為蓄電池充電,保障在市電中斷或市電質(zhì)量不滿足要求時(shí),通過蓄電池實(shí)現(xiàn)不間斷供電;?
優(yōu)勢:1)節(jié)能:沒有逆變環(huán)節(jié),減少轉(zhuǎn)換步驟和電路設(shè)備,且高壓直流集膚效應(yīng)小于交流電,輸電損耗小;2)可靠性高:蓄電池為負(fù)載直接供電且沒有逆變環(huán)節(jié),設(shè)備數(shù)量少,故障點(diǎn)減少,可靠性提高;3)無“零地”電壓問題:直流輸入,系統(tǒng)無零線,避免不明故障;4)利于新能源接入:減少分布式發(fā)電系統(tǒng)(如光伏)及直流負(fù)荷接入電網(wǎng)的中間環(huán)節(jié),進(jìn)而降低接入成本,提高功率轉(zhuǎn)換效率和電能質(zhì)量;?
劣勢:1)對配電開關(guān)滅弧性能要求高:由于直流電不存在零點(diǎn),滅弧相對困難,直流配電所需開關(guān)性能要求高;2)換流設(shè)備成本高:直流換流站比交流變電所的設(shè)備多,結(jié)構(gòu)負(fù)載,造價(jià)高,損耗大,運(yùn)行費(fèi)用高。?
240V2N直流供電架構(gòu):由兩套完全獨(dú)立的2套240V直流系統(tǒng)組成,2套直流系統(tǒng)從不同的低壓配電系統(tǒng)引電,平時(shí)每套240V直流系統(tǒng)帶一半負(fù)載,當(dāng)一套系統(tǒng)出現(xiàn)故障時(shí),另一套系統(tǒng)帶全部負(fù)載。?
市電+240V直流供電架構(gòu):由一路市電供電和一路240V直流系統(tǒng)供電組成,平時(shí)市電供電作為主用電源帶全部負(fù)載,當(dāng)市電斷電或質(zhì)量不滿足要求時(shí),轉(zhuǎn)由240V直流系統(tǒng)供電。圖25:高壓直流供電架構(gòu)圖26:240V2N架構(gòu)圖27:市電+240V直流架構(gòu)市電輸入市電輸入市電輸入交流配電整流器直流配電IT負(fù)載變壓器A240V高壓直流系統(tǒng)A變壓器A240V高壓直流系統(tǒng)AIT負(fù)載IT負(fù)載蓄電池組市電輸入市電輸入監(jiān)控裝置變壓器B240V高壓直流系統(tǒng)B變壓器B資料:周京華、王江博著-《數(shù)據(jù)中心供電架構(gòu)概述與展望》-資料:周京華、王江博著-《數(shù)據(jù)中心供電架構(gòu)概述與展望》-資料:周京華、王江博著-《數(shù)據(jù)中心供電架構(gòu)概述與展望》-電源學(xué)報(bào)(2023)-P4,國信證券經(jīng)濟(jì)研究所整理電源學(xué)報(bào)(2023)-P5,國信證券經(jīng)濟(jì)研究所整理電源學(xué)報(bào)(2023)-P5,國信證券經(jīng)濟(jì)研究所整理供電側(cè):DGX
H100機(jī)架配電要求?
DGXH100機(jī)架配電要求:DGXH100機(jī)架可在全球范圍內(nèi)部署,其機(jī)架式配電單元(rPDUs)將三相輸入電路轉(zhuǎn)化為200-240VAC的單項(xiàng)電路;通常高密度部署模式下,首選415VAC、32A、三相、N+1部署規(guī)格。?
配電冗余:DGXH100系統(tǒng)擁有6個(gè)內(nèi)部電源接口,至少4個(gè)電源接口通電才可以保證服務(wù)器運(yùn)行;從輸入電路(PowerSource)來看,計(jì)算機(jī)架(DGXH100服務(wù)器機(jī)架)使用N+1冗余方案(此處N=2),管理機(jī)架可以使用2N冗余方案(此處N=2)。表8:SU部署電壓、電流要求配電電壓(DistributionVoltage,V)斷路器折減(BreakerDerating)電路容量(CircuitCapacity,kW)
務(wù)器數(shù)量(個(gè))最大單機(jī)柜承載DGXH100服線路電壓(LineVoltage,V)
(Amps)電流單電路服務(wù)器峰值需求(kW)
(峰值需求,kW)標(biāo)準(zhǔn)容量相(Phase)1Φ3ΦDelta3ΦWye3ΦWye3ΦWye注:2302084004154152302082302402406360323260100%80%13.732.8212444410.220.420.420.420.43.512.40.6100%100%80%21.832.71.412.31)電路容量計(jì)算使用0.95功率因數(shù)(Powerfactor);2)以上計(jì)算基于三電路N+1供電方案,沒有電路承載超過50%的負(fù)載;3)從熱力學(xué)角度考慮,不推薦單機(jī)柜服務(wù)器數(shù)量超過4;資料:《NVIDIADGXSuperPODDataCenterDesign》,國信證券經(jīng)濟(jì)研究所整理供電側(cè):DGX
H100機(jī)架配電要求-傳統(tǒng)2N冗余方案(管理機(jī)柜)?傳統(tǒng)2N冗余方案:兩路輸入電路經(jīng)由UPS(即UPSASource和UPSBSource)進(jìn)入FloorPDU,再接入rPDU(機(jī)架式PDU);在2個(gè)rPUD中每一相中選擇1個(gè)電源接口連入服務(wù)器,為服務(wù)器供電。??優(yōu)勢:傳統(tǒng)的2N冗余方案適用于傳統(tǒng)的IT設(shè)備和網(wǎng)絡(luò)設(shè)備,亦適用于管理機(jī)柜,同絕大多數(shù)數(shù)據(jù)中心適配;劣勢:若其中1個(gè)輸入電路(Power
Source)中斷,則服務(wù)器通電的電源接口則少于4個(gè),進(jìn)而導(dǎo)致整個(gè)系統(tǒng)的中斷,AI工作負(fù)載將中止。圖28:傳統(tǒng)2N冗余方案(管理機(jī)柜)資料:《NVIDIADGXSuperPODDataCenterDesign》,國信證券經(jīng)濟(jì)研究所整理供電側(cè):DGX
H100機(jī)架配電要求-N+1冗余方案(計(jì)算機(jī)柜)?N+1冗余方案:兩個(gè)UPS向電源提供三條電源通路,如下圖所示,該機(jī)架承接兩路來自UPSB的饋電,下一個(gè)機(jī)架將承接兩路來自UPSA的饋電,將最小化對指定UPS源的依賴,并平衡其間負(fù)載。?
優(yōu)勢:提供基本的電池冗余,在系統(tǒng)PSU、單個(gè)rPDU或單個(gè)Floor
PDU/RPP損害情況下,仍能支持AI負(fù)載工作;與大多數(shù)數(shù)據(jù)中心兼容;?
劣勢:成本上升,結(jié)構(gòu)更加復(fù)雜,3個(gè)rPDU中2個(gè)由相同的UPS供電,則主UPS(例如下圖UPS
B)損害或故障,將導(dǎo)致系統(tǒng)斷電。?增長N+1冗余方案:使用3個(gè)離散的UPS系統(tǒng)供電,提供3條離散的配電路徑;?
優(yōu)勢:每個(gè)rPDU由離散的UPS供電,單一UPS損壞或中斷,系統(tǒng)仍能支持AI負(fù)載工作;?
劣勢:兼容性較差,很多數(shù)據(jù)中心的設(shè)計(jì)不支持。圖29:N+1冗余方案圖30:增強(qiáng)N+1冗余方案資料:《NVIDIADGXSuperPODDataCenterDesign》,國信證券經(jīng)濟(jì)研究所整理資料:《NVIDIADGXSuperPODDataCenterDesign》,國信證券經(jīng)濟(jì)研究所整理供電側(cè):弧閃危險(xiǎn)及上游斷路器脫扣風(fēng)險(xiǎn)?弧閃危險(xiǎn)增加:弧閃指電流擊穿空氣形成短路電弧時(shí)的情況,發(fā)生弧閃時(shí),電流穿過空氣從一點(diǎn)流向另一點(diǎn),在一秒鐘的時(shí)間內(nèi)釋放出大量的能量(即入射能量),能量以熱、聲、光和爆炸壓力的形式釋放出來,可能對工作人員造成傷害(燒傷、失明、觸電、聽力喪失和骨折等)。智算中心的高功率對應(yīng)更大的額定電流,弧閃的風(fēng)險(xiǎn)隨rPDU額定電流值提升而增加。?解決方案:首先進(jìn)行弧閃風(fēng)險(xiǎn)評估,配置阻抗電壓更高的上游變壓器,使用線路電抗器來阻止短路電流的流動,使用限流器、限流斷路器等;?上游斷路器脫扣風(fēng)險(xiǎn):數(shù)據(jù)中心不同工作負(fù)載通常會隨機(jī)達(dá)到峰值,這些峰值同時(shí)出現(xiàn)的概率極低,典型數(shù)據(jù)中心的峰均值(=所有單個(gè)工作負(fù)載峰值相加/總平均功耗)達(dá)到1.5到2或者更高,但人工智能負(fù)載缺乏變化(人工智能集群中的于其峰值耗電量,峰均比≈1),增加了上游大型斷路器脫扣的可能性。在大部分訓(xùn)練時(shí)間內(nèi)都以接近100%的利用率運(yùn)行,訓(xùn)練集群的平均耗電量幾乎等?解決方案:如果數(shù)據(jù)中心AI訓(xùn)練工作負(fù)載超過60%-70%,應(yīng)根據(jù)下游各饋線斷路器總和來確定主斷路器的大小。圖31:從100%傳統(tǒng)工作負(fù)載轉(zhuǎn)向100%人工智能工作負(fù)載資料:《人工智能帶來的顛覆:數(shù)據(jù)中心設(shè)計(jì)的挑戰(zhàn)及相關(guān)指南》,國信證券經(jīng)濟(jì)研究所整理供電側(cè):機(jī)架溫度過高,增加了故障和安全隱患?機(jī)架溫度過高,增加了故障和安全隱患:隨著機(jī)柜功率密度的提升,IT環(huán)境的溫度升高,對元器件造成更大壓力;當(dāng)元器件暴露在非額定溫度下時(shí),可能導(dǎo)致元器件過早故障以及安全隱患。??元器件過早故障:元器件暴露在規(guī)定范圍之外,預(yù)期壽命會大幅縮短;安全隱患:使用不符合額定工作范圍的電線可能導(dǎo)致線纜融化等安全隱患。?解決方案:AI服務(wù)器通常配備高溫額定值的線纜/插座,但機(jī)柜上其他設(shè)備(例如機(jī)柜頂部的交換機(jī))可能沒有,應(yīng)了解設(shè)備的運(yùn)行環(huán)境,確保所有設(shè)備都達(dá)到相應(yīng)額定值;建議在機(jī)柜后面放置溫度傳感器(由DCIM監(jiān)控),驗(yàn)證工作條件是否符合預(yù)期。圖32:標(biāo)準(zhǔn)C19/C20連接器和高溫C21/C22連接器對比母頭公頭限值65℃?zhèn)渥?biāo)配高溫C20常用作跳線,從機(jī)架式PUD向大功率IT設(shè)備供電155℃C21可與C22或C20連接器配接,在溫度超過C19額定值時(shí)使用資料:《人工智能帶來的顛覆:數(shù)據(jù)中心設(shè)計(jì)的挑戰(zhàn)及相關(guān)指南》,國信證券經(jīng)濟(jì)研究所整理UPS:市場規(guī)模穩(wěn)步增長,科華數(shù)據(jù)、
、Vertiv市占率較高?
UPS市場規(guī)模穩(wěn)步增長。UPS是信息化基礎(chǔ)設(shè)施建設(shè)的重要組成部分,下游可應(yīng)用于數(shù)據(jù)中心、通信基站、制造業(yè)設(shè)備等領(lǐng)域,UPS需求持續(xù)增長;根據(jù)智研咨詢披露數(shù)據(jù),23年中國UPS市場規(guī)模為152億人民幣,對應(yīng)13-23年CAGR為15.73%,預(yù)計(jì)25年市場規(guī)模將增長至191億人民幣,對應(yīng)CAGR為12.1%,市場規(guī)模穩(wěn)步增長。?
科華數(shù)據(jù)、
、Vertiv占據(jù)主要市場份額。根據(jù)智研咨詢披露數(shù)據(jù),23年中國UPS市場市占率前三廠商分別為科華數(shù)據(jù)(15.6%)、(14.2%)和Vertiv(12.1%),三家合計(jì)為41.9%,占據(jù)主要市場份額。圖33:23年中國UPS市場規(guī)模為152億元,預(yù)計(jì)25年為191億元,對應(yīng)CAGR為12.1%圖34:科華數(shù)據(jù)、、Vertiv市占率較高(2023年)中國UPS市場規(guī)模(億元)19120018016014012010080152科華數(shù)據(jù),15.6%,14.2%其他,58.1%Vertiv,12.1%604020020232025E資料:智研咨詢,國信證券經(jīng)濟(jì)研究所整理資料:智研咨詢,國信證券經(jīng)濟(jì)研究所整理目錄能源側(cè):智算中心電力消耗測算01供電側(cè):多種配電方案并存冷卻側(cè):液冷將替代傳統(tǒng)風(fēng)冷方案案例研究:新型綠色智算中心分析投資建議及風(fēng)險(xiǎn)提示02030405傳統(tǒng)冷卻方式:風(fēng)冷-直膨式精密空調(diào)?
直膨式(DX)精密空調(diào)風(fēng)冷:通過直膨式(DX)精密空調(diào)對數(shù)據(jù)中心進(jìn)行制冷,先冷環(huán)境,再冷設(shè)備,設(shè)備構(gòu)成簡單、部署靈活,能滿足低功率的制冷需求,早期多用于運(yùn)營商、互聯(lián)網(wǎng)等小規(guī)模機(jī)房。精密空調(diào)的蒸發(fā)器置于數(shù)據(jù)中心機(jī)房內(nèi),為服務(wù)器等IT設(shè)備提供冷量;冷凝器置于機(jī)房外,與環(huán)境空氣進(jìn)行換熱,其中冷凝器形式多樣化(可一對一或集中式部署)。圖35:直膨式精密空調(diào)風(fēng)冷機(jī)房內(nèi)布局圖36:直膨式精密空調(diào)風(fēng)冷送風(fēng)形式圖37:直膨式精密空調(diào)風(fēng)冷結(jié)構(gòu)設(shè)計(jì)資料:劉宏偉等著-《風(fēng)冷精密空調(diào)數(shù)據(jù)中心的能耗分析研究》資料:劉宏偉等著-《風(fēng)冷精密空調(diào)數(shù)據(jù)中心的能耗分析研究》資料:劉宏偉等著-《風(fēng)冷精密空調(diào)數(shù)據(jù)中心的能耗分析研究》-制冷技術(shù)(2023)-P67,國信證券經(jīng)濟(jì)研究所整理-制冷技術(shù)(2023)-P67,國信證券經(jīng)濟(jì)研究所整理-制冷技術(shù)(2023)-P68,國信證券經(jīng)濟(jì)研究所整理傳統(tǒng)冷卻方式:風(fēng)冷-直接自然冷卻&間接自然冷卻?
風(fēng)側(cè)自然冷卻技術(shù):利用室外冷風(fēng)對數(shù)據(jù)中心進(jìn)行冷卻,使用自然冷源代替制冷機(jī)為空調(diào)系統(tǒng)提供部分或全部冷量,實(shí)現(xiàn)空調(diào)系統(tǒng)節(jié)能,目前主要分為直接風(fēng)側(cè)自然冷卻和間接風(fēng)側(cè)自然冷卻。??直接風(fēng)側(cè)自然冷卻:將室外低溫空氣直接引進(jìn)機(jī)房與室內(nèi)氣體混合,室外冷空氣通過側(cè)墻百葉窗流入機(jī)房,室內(nèi)熱空氣上升至建筑頂部從窗流出,形成熱空氣的自然對流;其適用于寒冷、干燥氣候條件,對空氣質(zhì)量要求嚴(yán)格(潮濕、顆粒物、污染物會限制其使用);由于不需要輔助冷卻系統(tǒng),可以將數(shù)據(jù)中心PUE大幅降低。間接風(fēng)側(cè)自然冷卻:同直接風(fēng)側(cè)自然冷卻相比,增加了換熱器設(shè)備,通過換熱器實(shí)現(xiàn)對室外冷空氣的利用,保證數(shù)據(jù)中心不受室外環(huán)境的干擾(外部氣流不會進(jìn)入機(jī)房,降低室外空氣污染物對數(shù)據(jù)中心的影響)。由于該系統(tǒng)增加了額外介質(zhì)換熱過程,系統(tǒng)效率會降低,數(shù)據(jù)中心PUE高于直接風(fēng)側(cè)自然冷卻。圖38:直接風(fēng)側(cè)自然冷卻系統(tǒng)圖39:間接風(fēng)側(cè)自然冷卻系統(tǒng)資料究所整理:趙曉等著-《自然冷源技術(shù)研究綜述》-暖通空調(diào)(2023)-P3,國信證券經(jīng)濟(jì)研資料究所整理:趙曉等著-《自然冷源技術(shù)研究綜述》-暖通空調(diào)(2023)-P4,國信證券經(jīng)濟(jì)研功率密度持續(xù)提升,對數(shù)據(jù)中心散熱提出更高要求?
單臺服務(wù)器功率密度持續(xù)提升:1)處理器核數(shù)增長:CPU核心數(shù)持續(xù)增長,單卡功率及芯片發(fā)熱隨之提升;2)異構(gòu)并行:為滿足AI工作需求,服務(wù)器加裝GPU/Asic等AI加速卡,單臺服務(wù)器功率提升;3)單服務(wù)器內(nèi)部AI加速卡數(shù)量增長:目前,單臺服務(wù)器內(nèi)部通常配置8張GPU卡,24年3月英偉達(dá)發(fā)布的GB200-NVL72服務(wù)器,配置72顆BlackwellGPU芯片,未來單臺服務(wù)器內(nèi)部加速卡數(shù)量有望持續(xù)增長。?
不同發(fā)熱器件功率梯度不同,對數(shù)據(jù)中心散熱提出更高要求。傳統(tǒng)風(fēng)冷式方案僅能對機(jī)房整體或局部環(huán)境溫度進(jìn)行調(diào)節(jié),但機(jī)柜內(nèi)服務(wù)器不同發(fā)熱期間功率梯度不同(例如CPU、GPU功率遠(yuǎn)高于其他器件,而內(nèi)存、PSU僅占服務(wù)器功耗的20%-30%),則傳統(tǒng)風(fēng)冷方案會導(dǎo)致不同器件“過冷”或“過熱”,無法實(shí)現(xiàn)精確制冷,若通過加大制冷量等方式降低“過熱”器件溫度,則會導(dǎo)致能源浪費(fèi)。圖40:數(shù)據(jù)中心處理器核數(shù)增加、異構(gòu)并行,單臺服務(wù)器功率上升圖41:機(jī)柜平均功率持續(xù)提升資料:《中國數(shù)據(jù)中心產(chǎn)業(yè)低碳發(fā)展實(shí)踐研究(2023年,華信咨詢)》,柯媛華-《數(shù)資料
:《中國數(shù)據(jù)中心產(chǎn)業(yè)低碳發(fā)展實(shí)踐研究(2023年,華信咨詢)》,國信證券經(jīng)濟(jì)研究所整理據(jù)中心液冷技術(shù)研究》-郵電設(shè)計(jì)技術(shù)(2023)-P36,國信證券經(jīng)濟(jì)研究所整理各地對新建數(shù)據(jù)中心PUE提出要求,液冷滲透率有望提升?
各地對新建數(shù)據(jù)中心PUE提出要求。近期北京、上海、深圳、江蘇等地區(qū)發(fā)布相關(guān)文件,對新建數(shù)據(jù)中心的PUE指標(biāo)提出要求,其中上海、深圳、江蘇等地區(qū)將新家數(shù)據(jù)中心的PUE值限制在1.25以下。?
液冷技術(shù)可顯著降低PUE,滲透率有望提升。液冷技術(shù)制冷效果出色,可以支撐更高功率密度機(jī)柜;同時(shí),根據(jù)Intel發(fā)布的《綠色數(shù)據(jù)中心創(chuàng)新實(shí)踐-冷板液冷系統(tǒng)設(shè)計(jì)參考白皮書》披露數(shù)據(jù),采用液冷散熱方案的數(shù)據(jù)中心PUE比采用風(fēng)冷的常規(guī)冷凍水系統(tǒng)降低0.15以上,全年P(guān)UE可達(dá)到1.2以下。表9:各地對新建數(shù)據(jù)中心PUE指標(biāo)提出要求省市日期文件部門內(nèi)容全國北京2022年6月2024年3月《工業(yè)能效提升行動計(jì)劃》工業(yè)和信息化部等六部門
到2025年,新建大型、超大型數(shù)據(jù)中心電能利用效率(PUE)優(yōu)于1.3;《北京市算力基礎(chǔ)設(shè)施建設(shè)實(shí)施方案(2024—
北京市經(jīng)濟(jì)和信息化局、通信
本市新建和改擴(kuò)建智算中心PUE值一般不超過1.25,年能耗超過3萬噸標(biāo)煤的大規(guī)模先進(jìn)智算中心PUE值一般不超過1.15;2027年)》管理局新建、擴(kuò)建數(shù)據(jù)中心,年能源消費(fèi)量小于1萬噸標(biāo)準(zhǔn)煤(電力按等價(jià)值計(jì)算,下同)的項(xiàng)目PUE值不應(yīng)高于1.3;年能源消費(fèi)量大于等于1萬噸標(biāo)準(zhǔn)煤且小于2萬噸標(biāo)準(zhǔn)煤的項(xiàng)目,PUE值不應(yīng)高于1.25;年能源消費(fèi)量大于等于2萬噸標(biāo)準(zhǔn)煤且小于3萬噸標(biāo)準(zhǔn)煤的項(xiàng)目,PUE值不應(yīng)高于1.2;年能源消費(fèi)量大于等于3萬噸標(biāo)準(zhǔn)煤的項(xiàng)目,PUE值不應(yīng)高于1.15;《北京市發(fā)展和改革委員會關(guān)于印發(fā)進(jìn)一步加強(qiáng)數(shù)據(jù)中心項(xiàng)目節(jié)能審查若干規(guī)定的通知》北京上海2023年7月2024年4月北京市新建數(shù)據(jù)中心能源利用效率(PUE)不高于1.25;加快既有數(shù)據(jù)中心升級改造,加大高效制冷技術(shù)和新能源推廣應(yīng)用力度,力爭改造后能源利用效率(PUE)不高于1.4;《上海市推動大規(guī)模設(shè)備更新和消費(fèi)品以舊換新行動計(jì)劃(2024-2027年)》上海市人民政府《深圳市算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計(jì)劃(2024-2025)》深圳江蘇2023年12月2023年12月深圳市工業(yè)和信息化局安徽省人民政府辦公廳到2025年,新建數(shù)據(jù)中心電能利用效率(PUE)降低到1.25以下;平均上架率不低于65%,數(shù)據(jù)中心電能利用效率(PUE)小于1.25;《推進(jìn)長三角樞紐節(jié)點(diǎn)蕪湖數(shù)據(jù)中心集群建設(shè)若干舉措》資料:政府文件,國信證券經(jīng)濟(jì)研究所整理液冷:主要包括冷板式液冷、浸沒式液冷、噴淋式液冷?液冷的優(yōu)勢:同傳統(tǒng)制冷方式相比,液冷具有高效能、高可靠、超靜音、節(jié)省空間等優(yōu)勢,根據(jù)《數(shù)據(jù)中心液冷技術(shù)研究(柯媛華等著,2023年)》披露數(shù)據(jù),CPU芯片熱設(shè)計(jì)功耗(TDP)超過200W時(shí),建議采用液冷散熱。???高效能:末端或冷卻液更靠近發(fā)熱源,能直接把熱量進(jìn)行轉(zhuǎn)移,實(shí)現(xiàn)精準(zhǔn)制冷,減少沿程冷損耗;高可靠:特別是直接液冷技術(shù),將發(fā)熱設(shè)備完全浸沒在不導(dǎo)電冷卻液中,使發(fā)熱設(shè)備完全脫離空氣,避免了風(fēng)機(jī)震動及空氣灰塵影響;超靜音:對于直接液冷服務(wù)器,需拆除風(fēng)扇組件,使系統(tǒng)運(yùn)行時(shí),無氣流及風(fēng)扇震動噪聲;間接式液冷通過冷板解決主要器件發(fā)熱問題,其他熱量通過風(fēng)扇組件進(jìn)行氣流循環(huán)換熱,該情境下風(fēng)扇轉(zhuǎn)速低,降低了氣流流速及震動噪聲;?節(jié)省空間:針對AI場景,采用液冷技術(shù)可以在同等空間里部署更高算力;同時(shí),無壓縮機(jī)配置,無需專用動力機(jī)房配置,降低空調(diào)系統(tǒng)占地面積;?液冷的分類:根據(jù)冷卻液是否與發(fā)熱器件接觸,將液冷劃分為直接式液冷技術(shù)和間接式液冷技術(shù),其中直接式液冷技術(shù)包括浸沒式液冷和噴淋式液冷,間接式液冷技術(shù)以冷板式液冷為主。圖42:冷板式液冷圖43:浸沒式液冷圖44:噴淋式液冷資料
:《中國數(shù)據(jù)中心產(chǎn)業(yè)低碳發(fā)展實(shí)踐研究(2023年,華信咨詢)》,國信證券經(jīng)濟(jì)研究所整理資料
:《中國數(shù)據(jù)中心產(chǎn)業(yè)低碳發(fā)展實(shí)踐研究(2023年,華信咨詢)》,國信證券經(jīng)濟(jì)研究所整理資料
:《中國數(shù)據(jù)中心產(chǎn)業(yè)低碳發(fā)展實(shí)踐研究(2023年,華信咨詢)》,國信證券經(jīng)濟(jì)研究所整理液冷:冷板式液冷?
冷板式液冷:1)類別:屬于間接式液冷,通過換熱冷板將發(fā)熱器件的熱量傳遞給封閉在循環(huán)管路中的冷卻液體,完成換熱;2)作用器件:主要解決了高功率密度發(fā)熱器散熱問題,對于低功率密度發(fā)熱器(例如服務(wù)器內(nèi)存、PSU等)仍采用風(fēng)冷散熱;3)分類:按熱傳遞過程不同,可以分為溫水式冷板和熱管式冷板;目前常用冷板式服務(wù)器有1U單節(jié)點(diǎn)服務(wù)器、2U4節(jié)點(diǎn)服務(wù)器等。?
溫水式冷板:存在多個(gè)發(fā)熱器件連路管路,連通管路可采用硬接(紫銅或無氧銅進(jìn)行焊接,安裝難度較大)和軟接(波紋管、橡膠管,安裝要求低),通常供回液溫度采用40℃/45℃,則在大部分區(qū)域內(nèi)可實(shí)現(xiàn)全年自然冷,進(jìn)一步降低數(shù)據(jù)中心功耗;?
熱管式冷板:通過熱管實(shí)現(xiàn)發(fā)熱器件和水環(huán)路之間的熱傳導(dǎo);相比于溫水式冷板,其水環(huán)路不進(jìn)服務(wù)器,避免了滲水導(dǎo)致的PCB短路風(fēng)險(xiǎn)。圖45:溫水式冷板液冷圖46:熱管式冷板液冷圖47:冷板結(jié)構(gòu)資料:柯媛華-《數(shù)據(jù)中心液冷技術(shù)研究》-郵電設(shè)計(jì)技術(shù)資料:柯媛華-《數(shù)據(jù)中心液冷技術(shù)研究》-郵電設(shè)計(jì)技術(shù)資料:柯媛華-《數(shù)據(jù)中心液冷技術(shù)研究》-郵電設(shè)計(jì)技術(shù)(2023)-P37,國信證券經(jīng)濟(jì)研究所整理(2023)-P38,國信證券經(jīng)濟(jì)研究所整理(2023)-P38,國信證券經(jīng)濟(jì)研究所整理液冷:浸沒式液冷?浸沒式液冷:1)類別:屬于直接式液冷,通過發(fā)熱期間浸沒在冷卻液中進(jìn)行熱量交換;2)作用器件:所有高功率密度發(fā)熱器件和低功率密度發(fā)熱器件完全浸沒在冷卻液中,服務(wù)器本身結(jié)構(gòu)設(shè)計(jì)及特殊器件(例如光模塊、機(jī)械硬盤等)均需要特殊處理;3)分類:根據(jù)所使用冷卻液在冷卻電子器件的過程中是否發(fā)生狀態(tài)變化,可分為單相浸沒式液冷和相變浸沒式液冷。?單相浸沒式液冷:通過循環(huán)冷卻液消除設(shè)備產(chǎn)生的熱量,熱量從設(shè)備傳遞到液體中,使用循環(huán)泵將帶有熱量的冷卻液送到熱交換器進(jìn)行換熱,達(dá)到持續(xù)為設(shè)備降溫的目的;單相浸沒式液冷冷卻液揮發(fā)控制相對簡單,在密封性良好的情況下,冷卻液損失較小,無需頻繁補(bǔ)充。?相變浸沒式液冷:將設(shè)備浸入到易揮發(fā)冷卻液(沸點(diǎn)低)中,在環(huán)境熱量達(dá)到一定條件時(shí),會利用潛熱吸收熱量并發(fā)生沸騰相變,從而為設(shè)備降溫,冷卻液再被冷凝管冷凝為液態(tài),回到液冷槽內(nèi)循環(huán)換熱;相變浸沒式液冷可以滿足更高的服務(wù)器功率,去除風(fēng)扇噪音,并減少制冷設(shè)備的占地面積,但對冷卻液蒸發(fā)損失的控制相對復(fù)雜,且易受到污染,施工難度和成本有所增加。圖48:單相浸沒式液冷圖49:相變浸沒式液冷資料
:柯媛華-《數(shù)據(jù)中心液冷技術(shù)研究》-郵電設(shè)計(jì)技術(shù)(2023)-P38,國信證券經(jīng)濟(jì)研究所整理資料
:柯媛華-《數(shù)據(jù)中心液冷技術(shù)研究》-郵電設(shè)計(jì)技術(shù)(2023)-P38,國信證券經(jīng)濟(jì)研究所整理液冷:噴淋式液冷?噴淋式液冷:1)類別:屬于直接式液冷,采用噴淋式結(jié)構(gòu)設(shè)計(jì),噴射的冷卻液同發(fā)熱器件接觸進(jìn)行熱量交換;2)作用:噴淋液體可以完全覆蓋服務(wù)器發(fā)熱器件,同時(shí)根據(jù)不同發(fā)熱器件的功率密度,對噴淋板的液孔進(jìn)行精準(zhǔn)化開孔,滿足不同功率發(fā)熱器件的散熱需求。3)冷卻液:通常選擇硅油、礦物油或植物油等;4)優(yōu)勢:不需要改變服務(wù)器部署形態(tài)(每臺服務(wù)器獨(dú)立化液冷設(shè)計(jì))以及成本較低(冷卻液價(jià)格低)。圖50:噴淋式液冷原理圖51:噴淋式液冷服務(wù)器資料
:柯媛華-《數(shù)據(jù)中心液冷技術(shù)研究》-郵電設(shè)計(jì)技術(shù)(2023)-P39,國信證券經(jīng)濟(jì)研究所整理資料
:柯媛華-《數(shù)據(jù)中心液冷技術(shù)研究》-郵電設(shè)計(jì)技術(shù)(2023)-P39,國信證券經(jīng)濟(jì)研究所整理液冷產(chǎn)業(yè)鏈?zhǔn)崂?液冷產(chǎn)業(yè)鏈:主要包括上游(零部件)、中游(液冷服務(wù)器相關(guān))、下游(應(yīng)用)。??上游(零部件):包括液冷服務(wù)器接頭(英維克、中航光電)、CDU(科華數(shù)據(jù)、同飛股份)、冷卻液(巨化股份、新宙邦)、電磁閥、TANK、Manifold等;中游(液冷服務(wù)器相關(guān)):包括液冷服務(wù)器制造商、液冷集成設(shè)施、芯片、模塊和機(jī)柜等,其中曙光數(shù)創(chuàng)、高瀾股份、阿里巴巴、英維克以浸沒式液冷服務(wù)器為主;中國長城、廣東合一以噴淋式液冷服務(wù)器為主;中科曙光、浪潮信息、通訊、以冷板式液冷服務(wù)器為主;?下游(行業(yè)應(yīng)用):液冷主要應(yīng)用與電信信息(例如基站、路由、服務(wù)器)、互聯(lián)網(wǎng)(服務(wù)器等)、政府、金融、交通、能源等領(lǐng)域。圖52:液冷產(chǎn)業(yè)鏈上游:零部件中游:液冷服務(wù)器下游:應(yīng)用液冷服務(wù)器電信信息政府互聯(lián)網(wǎng)金融接頭CDU浸沒式噴淋式冷板式曙光數(shù)創(chuàng)、高瀾股份、阿里巴巴、英維克英維克、中航光電科華數(shù)據(jù)、同飛股份中國長城、廣東合一交通能源冷卻液電磁閥TANK中科曙光、浪潮信息、通訊、巨化股份、新宙邦Manifold液冷集成設(shè)施模塊芯片機(jī)柜等資料:研究院,國信證券經(jīng)濟(jì)研究所整理液冷:以冷板式液冷為主,其他液冷方案快速發(fā)展?
冷板式液冷方案起步較早,相對成熟。相比于其他液冷方案,冷板式液冷方案在我國起步較早,在可靠性、可維護(hù)性、技術(shù)成熟度等方面具備優(yōu)勢,且對服務(wù)器與動力系統(tǒng)改造較小,IT設(shè)備維護(hù)較為簡單;浸沒式液冷方案散熱能力強(qiáng),噪音小,但定制化程度較高(例如IT設(shè)備需要定制),且其他部件(例如光模塊)的兼容性仍在驗(yàn)證;噴淋式液冷方案噪音低,且節(jié)省冷卻液,但目前生態(tài)建設(shè)仍不完善,供應(yīng)商較少。?
目前國內(nèi)以冷板式液冷為主。根據(jù)賽迪顧問披露數(shù)據(jù),22年冷板式液冷占比達(dá)65%,其次為浸沒式液冷(占比為34%),噴淋式液冷占比較低,僅1%。表10:三種液冷方式比較圖54:22年中國液冷技術(shù)市場占比浸沒式液冷分類冷板式液冷噴淋式液冷相變浸沒式單相浸沒式ü
冷板貼近服務(wù)器芯片等高發(fā)熱元件,利用
ü
服務(wù)器完全浸沒在冷ü
服務(wù)器完全浸沒在冷
ü
冷卻液從服務(wù)器機(jī)箱冷板中冷卻液帶走熱量;卻液中,冷卻液產(chǎn)生蒸發(fā)冷凝相變,并帶走熱量;噴淋式液冷,1%原理卻液中,冷卻液循環(huán)流動并帶走熱量;頂部噴淋下來,通過對流換熱為器件降溫;ü
同時(shí)增設(shè)風(fēng)冷單元帶走低發(fā)熱元件散熱;浸沒式液冷,34%ü
散熱能力強(qiáng)、功率密
ü
散熱能力強(qiáng)、功率密
ü
IT設(shè)備靜音,節(jié)省液ü
服務(wù)器與動力系統(tǒng)改造較小,IT設(shè)備維護(hù)較為簡單;ü
管路接頭、密封件較多,漏液維護(hù)復(fù)雜;度高,IT設(shè)備無風(fēng)扇,靜音;度高,IT設(shè)備無風(fēng)扇,靜音;體;ü
需保證冷卻液按需分配,運(yùn)維復(fù)雜,排液、補(bǔ)液,維護(hù)時(shí)破壞服務(wù)器原有密封結(jié)構(gòu);技術(shù)特點(diǎn)ü
服務(wù)器改為刀片式,
ü
機(jī)械式吊臂拆裝,液冷板式液冷,65%專用機(jī)柜,管理要求高,控制復(fù)雜;體清理和拆卸難、運(yùn)維經(jīng)驗(yàn)少;ü
IT設(shè)備、冷卻液、管路、供配電等不統(tǒng)一,服務(wù)器多與機(jī)柜深耦合,支持廠家較多;ü
IT設(shè)備需定制化,普通光模塊等兼容性待驗(yàn)證;ü
IT設(shè)備需定制化,普通光模塊等兼容性待驗(yàn)證;生態(tài)ü
目前廠商較少ü
國產(chǎn)冷媒待驗(yàn)證;、浪潮、曙光、新華三、英維克等主流廠商曙光、諾亞等阿里、綠色云圖、云酷等廣東合一資料:《電信運(yùn)營商液冷技術(shù)白皮書(2023年)》,國信證券經(jīng)濟(jì)研究所整理資料:賽迪顧問,研究院,國信證券經(jīng)濟(jì)研究所整理液冷:市場規(guī)??焖僭鲩L,浪潮、超聚變市占率較高?
液冷服務(wù)器市場規(guī)??焖僭鲩L。根據(jù)研究院披露數(shù)據(jù),預(yù)計(jì)24年中國液冷服務(wù)器市場規(guī)模將達(dá)到201億人民幣,預(yù)計(jì)27年將增長至682億人民幣,對應(yīng)24-27年CAGR為50.3%,市場規(guī)??焖僭鲩L。?
浪潮、超聚變占據(jù)主要中國液冷服務(wù)器份額。根據(jù)研究院披露數(shù)據(jù),22年浪潮、超聚變市占率分別為34%、32%,合計(jì)為66%,占據(jù)中國液冷服務(wù)器市場主要份額。圖55:預(yù)計(jì)24年中國液冷服務(wù)器市場規(guī)模達(dá)201億人民幣,市場規(guī)??焖僭鲩L圖56:浪潮、超聚變占據(jù)主要中國液冷服務(wù)器份額(22年)中國液冷服務(wù)器市場規(guī)模(億元)75%yoy(右軸)800700600500400300200100080%68271%50370%60%50%40%30%20%10%0%58%其他,29%浪潮,34%46%29436%聯(lián)想,1%寧暢,4%201115超聚變,32%732022:2023E2024E2025E2026E2027E資料研究院,國信證券經(jīng)濟(jì)研究所整理資料:研究院,國信證券經(jīng)濟(jì)研究所整理目錄能源側(cè):智算中心電力消耗測算01供電側(cè):多種配電方案并存冷卻側(cè):液冷將替代傳統(tǒng)風(fēng)冷方案案例研究:新型綠色智算中心分析投資建議及風(fēng)險(xiǎn)提示02030405綠色智算中心設(shè)計(jì)-英偉達(dá):硬件側(cè)持續(xù)迭代?
英偉達(dá)GPU快速迭代,能源使用效率持續(xù)提升。1)H100:22年3月,英偉達(dá)發(fā)布H100芯片,單卡算力TF32989TFLOPS、FP163,958TFLOPS,功率700W,相比于上一代A100芯片,在運(yùn)行60億GPT-J模型、700億Llama2模型時(shí),能耗分別下降5.6倍、3.2倍;2)GB200:24年3月,英偉達(dá)發(fā)布GB200NVL72方案,同H100相比,同樣完成訓(xùn)練1.8萬億參數(shù)模型,能源使用效率提升25倍。圖57:H100相較于A100能耗大幅下降圖58:GB200相較于H100,能效提升25倍資料:英偉達(dá),國信證券經(jīng)濟(jì)研究所整理資料:英偉達(dá),國信證券經(jīng)濟(jì)研究所整理綠色智算中心設(shè)計(jì)-英偉達(dá):逐步引入液冷方案?
英偉達(dá)智算中心將逐步引入液冷方案。傳統(tǒng)的英偉達(dá)SuperPOD智算中心采用風(fēng)冷技術(shù),內(nèi)部包括服務(wù)器機(jī)柜、管理機(jī)柜、存儲、InfiniBandLeaf/Spine、跨道橋架(AisleCrossingBridge)、電纜橋架(CableTray)、冷通道(ColdAisleContainment)等,24年3月英偉達(dá)CEO黃仁勛在2024SIEPR經(jīng)濟(jì)峰會上透露,下一代DGXAI系統(tǒng)將采用液冷散熱。圖59:英偉達(dá)智算中心設(shè)計(jì)資料:《NVIDIADGXSuperPODDataCenterDesign》,國信證券經(jīng)濟(jì)研究所整理綠色智算中心設(shè)計(jì)-AMD:芯片制程持續(xù)迭代,降低功耗?
AMD算力卡制程持續(xù)迭代,降低功耗。21年AMD發(fā)布圖60:AMDMI300XInfinity平臺架構(gòu)(8GPU型)MI250和MI250X算力卡,采用6nmFinFET工藝;23年發(fā)布MI300A和MI300X算力卡,采用5nm|6nmFinFET工藝,24年6月,AMD宣布將在25年發(fā)布MI350系列,采用3nm工藝制程,芯片制程持續(xù)提升,晶體管間距離縮小,芯片能效比提升。?
AMD互聯(lián)方式:1)GPU互聯(lián):8顆通過AMDInfinityFabric雙向連接技術(shù)互聯(lián);2)GPU同CPU連接:每個(gè)MI300X芯片通過第五代Pcie與CPU進(jìn)行連接,采用OCP制定的UBB通用方案,同網(wǎng)絡(luò)設(shè)備廣泛設(shè)配;3)CPU互聯(lián):2顆CPU通過AMDInfinityFabric
雙向連接技術(shù)互聯(lián)。表11:AMD算力芯片制程持續(xù)迭代產(chǎn)品MI250MI250XMI300AMI300XMI325XMI350系列MI400系列發(fā)布時(shí)間2021年11月6nmFinFET2021年11月6nmFinFET2023年12月2023年12月2024年6月\2025年3nm2026年\5nm|6nmFinFET5nm|6nmFinFET制程資料:AMD,國信證券經(jīng)濟(jì)研究所整理資料:AMD,國信證券經(jīng)濟(jì)研究所整理綠色智算中心設(shè)計(jì)-AMD:服務(wù)器開始引入液冷?
AMD服務(wù)器開始引入液冷。根據(jù)AMD披露的服務(wù)器合作方及其產(chǎn)品情況,其同HPECray和超微電腦合作的服務(wù)器SCXD675和AS-4125CS-TNMR2開始引入液冷方案,分別為8U、4U機(jī)架數(shù),配置EPYC9004CPU及8顆MI300XGPU芯片,I/O采用PCIeGen5OAM。表12:AMD服務(wù)器開始引入液冷合作方產(chǎn)品AceleMaxA-528XServerAceleMaxA-828XServerCX8850s-EI9機(jī)架數(shù)5U冷卻方式風(fēng)冷CPU系列EPYC9004EPYC90044thGenXeonEPYC90044thGenXeonEPYC9004EPYC9004EPYC9004EPYC9004EPYC9004EPYC9004EPYC9004最大GPU數(shù)8(UBB)8(UBB)8(UBB)8(UBB)8(UBB)8(UBB)8(UBB)8(UBB)8(UBB)8(UBB)8(UBB)8(UBB)AMDInstinctModelMI300XI/0PCIeGen5OAMPCIeGen5OAMPCIeGen5OAMPCIeGen5OAMPCIeGen5OAMPCIeGen5OAMPCIeGen5OAMPCIeGen5OAMPCIeGen5OAMPCIeGen5OAMPCIeGen5OAMPCIeGen5OAMAMAX8U風(fēng)冷MI300XColfaxDell8U風(fēng)冷MI300XPowerEdgeXE9680RackServerTensorEXTS4-185328443G593-SX1Server6U風(fēng)冷MI300XExxact8U風(fēng)冷MI300X5U風(fēng)冷MI300XGIGABYTEG593-ZX1Server5U風(fēng)冷MI300XHPECrayKOISCXD6758U風(fēng)冷/液冷風(fēng)冷MI300XXC22-5UDPZX1/ZX2ThinkSystemSR685aV3AS-8125CS-TNMR25UMI300XLenovo8U風(fēng)冷MI300X8U風(fēng)冷MI300XSupermicroAS-4125CS-TNMR24U液冷MI300X資料:AMD,國信證券經(jīng)濟(jì)研究所整理綠色智算中心設(shè)計(jì)-Intel:高算力密度、低PUE方案?
Intel高算力密度、低PUE智算中心方案。Intel的智算中心可以實(shí)現(xiàn)高功率密度(單機(jī)柜達(dá)43kW)、低PUE值(PUE達(dá)1.06),主要通過以下方式:?
a)定制機(jī)架設(shè)計(jì):更好地優(yōu)化空間和機(jī)柜功率密度,其可以在相同的占地面積下額外提供70%以上的空間;?
b)先進(jìn)的配電系統(tǒng):使用800A、415/240VAC配電,實(shí)現(xiàn)單機(jī)架單路25-43kW功率密度;使用定制高效變壓器,損失僅有1%;?
c)出色的冷卻方案:采用緊耦合蒸發(fā)冷卻方案和自然風(fēng)冷方案,降低PUE值。圖61:Intel智算中心可實(shí)現(xiàn)高算力密度、低PUE值資料:Intel,國信證券經(jīng)濟(jì)研究所整理綠色智算中心設(shè)計(jì)-Intel:緊耦合(Close-Coupled)冷卻?
緊耦合(Close-Coupled)冷卻設(shè)計(jì):1)數(shù)據(jù)中心內(nèi)部:水冷通道置于室內(nèi)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023-2024學(xué)年泰山版信息技術(shù)(2018)第五冊 《第三單元 創(chuàng)作動畫故事 10 笑臉?biāo)透1硇脑浮氛f課稿
- Unit 3 Making Contact Lesson 3(說課稿)-2023-2024學(xué)年人教新起點(diǎn)版英語五年級下冊
- 2023九年級數(shù)學(xué)上冊 第一章 特殊平行四邊形1 菱形的性質(zhì)與判定第2課時(shí) 菱形的判定說課稿 (新版)北師大版
- 浙江省現(xiàn)代物流中心可行性研究報(bào)告
- 4花之歌 說課稿-2024-2025學(xué)年統(tǒng)編版語文六年級上冊
- 中國可穿戴設(shè)備行業(yè)市場發(fā)展現(xiàn)狀及前景趨勢與投資分析研究報(bào)告(2024-2030版)
- 2025年開關(guān)變壓器項(xiàng)目可行性研究報(bào)告
- 2025年度智能電動汽車車輛承包合同參考模板4篇
- 2021-2026年中國側(cè)面貼標(biāo)機(jī)行業(yè)全景評估及投資規(guī)劃建議報(bào)告
- 2023九年級數(shù)學(xué)下冊 第26章 概率初步26.1 隨機(jī)事件說課稿 (新版)滬科版
- 人力資源 -人效評估指導(dǎo)手冊
- 大疆80分鐘在線測評題
- 2024屆廣東省廣州市高三上學(xué)期調(diào)研測試英語試題及答案
- 中煤平朔集團(tuán)有限公司招聘筆試題庫2024
- 2023年成都市青白江區(qū)村(社區(qū))“兩委”后備人才考試真題
- 不付租金解除合同通知書
- 區(qū)域合作伙伴合作協(xié)議書范本
- 中學(xué)數(shù)學(xué)教學(xué)設(shè)計(jì)全套教學(xué)課件
- 環(huán)衛(wèi)公司年終工作總結(jié)
- 2023年德宏隴川縣人民法院招聘聘用制書記員考試真題及答案
- 2024中考復(fù)習(xí)必背初中英語單詞詞匯表(蘇教譯林版)
評論
0/150
提交評論