版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
行業(yè)報告:行業(yè)深度研究電力設備AI技術高速發(fā)展帶來高性能服務器電源增長機遇行業(yè)評級:
強于大市(維持評級)上次評級:
強于大市證券研究報告2024年09月06日請務必閱讀正文之后的信息披露和免責申明1摘要一
、服務器電源:AI時代迎來新增長動力?服務器是在網絡環(huán)境中提供計算能力并運行軟件應用程序的特定IT設備,
內部結構復雜,應用場景十分廣泛;其中電源價值占比約為3%。?AI服務器分為訓練和推理兩種,訓練對芯片算力要求更高,推理對算力的要求偏低;推理負載占比有望持續(xù)提升。AI服務器目前在服務器當中出貨量占比小,2022年全球
AI服務器出貨量約占整體服務器比重1%,約為
14.5萬臺,有望持續(xù)增長。?服務器電源就是指使用在服務器上的一種開關電源,將交流電轉換為計算機所需的直流電,主要應用在數據中心場景中,用于服務器、存儲及交換機等IT設備的供電,以提供穩(wěn)定的電力保障。二、隨AI技術發(fā)展,AI服務器電源性能多方面改善,市場需求量快速上漲?芯片龍頭英偉達2024GTC發(fā)布更高性能、算力的GPU及相關產品?AI模型發(fā)展,算力需求大增,AI用電需求上漲。AI模型的耗電量劇增源于模型規(guī)模擴大、算力需求增加。?AI服務器電源電源結構分為UPS
、AC/DC
、DC/DC三層,各司其職確保電力供應的連續(xù)性和穩(wěn)定性
。UPS(不間斷電源)負責在電網中斷時提供臨時電力,保護數據免受損失。AC-DC負責將電網的交流電轉換為適合服務器使用的48V直流電。DC-DC負責進一步將48V直流電降至芯片可接受的1V左右。?與普通服務器電源相比,
AI服務器電源架構(power
shelf)除了功率數倍提高外,在其他方面的性能進一步提升,包括:功率密度大幅提高、轉換效率提高,冗余系統(tǒng)發(fā)展、液體冷卻系統(tǒng)出現(xiàn)等。三、
AI服務器電源(PSU
)面臨廣闊的發(fā)展空間?普通服務器電源增速緩慢,預計2024-2026年市場規(guī)模僅將在40億美元上下;而AI服務器電源成為服務器電源市場新增量,2026年AC-DC市場規(guī)模有望達53億美元。四、臺企領先電源市場,內資麥格米特借AI風口持續(xù)追趕?全球電源市場中,臺灣廠商占據主要市場份額。全球前16大電源廠商中,臺系廠商上榜7家,其中前五大有四家為臺企。中國大陸電源廠商在成本控制和服務能力方面具有優(yōu)勢,未來有望快速搶占市場
份額
。?臺達提供全系列AI電源全方位整合方案,成為英偉達新AI芯片的電源大贏家;AC/DC電源與DC/DC轉換器上技術領先。臺達是AC/DC電源供應器龍頭,市占率過半。?光寶云端電源營收年成長迅速,AI服務器電源的營收相較服務器電源規(guī)模可望從2023年的個位數占比大幅提升至兩位數。2023年光寶領先市場推出適用于AI服務器的電源產品,目前正開發(fā)8KW及更高功率密度和轉換效率的電源解決方案。?
大功率+多海外廠+頭部客戶合作助力麥格米特拿到國際頭部公司AI服務器電源供貨資格,與其他大陸電源企業(yè)相比,綜合優(yōu)勢明顯。
?
麥格米特與臺達、光寶相比在收入、技術、英偉達合作方面均存在一定差距,但研發(fā)費用超收入的10%,有望縮小技術差距。五、投資建議:重點推薦目前已進入英偉達B系列服務器電源合格供應商名單的【麥格米特】,建議關注服務器電源領先企業(yè)【歐陸通】。風險提示:AI服務器電源需求不及預期;原材料價格波動風險;競爭加劇風險;測算具有主觀性。請務必閱讀正文之后的信息披露和免責申明2一
、服務器電源:
AI時代迎來新增長動力
服務器架構復雜應用場景廣泛,電源價值占比約為3%;
服務器電源:用于服務器、存儲及交換機等IT設備供電的開關電源;請務必閱讀正文之后的信息披露和免責申明3構件名稱作用價值占比處理器(CPU
)及芯片組處理器是計算機的大腦,
執(zhí)行計算、任務和功能。服務器處理器
與電腦處理器的不同之處在于,
它們通常設計用于處理更重、更
復雜的工作負載。32%-83%(高端服務器
中GPU的價值
占比大幅提升內存內存是服務器中的重要部件之一,是與
CPU
進行通信的橋梁。計算
機中的所有程序都在內存中執(zhí)行,
因此內存的性能對計算機的影響
很大。-外部存儲外部存儲通常是指連接到服務器
的額外存儲設備,如硬盤驅動器、
網絡附加存儲
(NAS)
或云存儲。
在服務器上配置外部存儲可以擴
展服務器的存儲容量,提供更多
的數據存儲空間。-電源服務器電源主要應用在數據中心
場景中,用于服務器、存儲及交換機等
IT設備的供電,以提供穩(wěn)定的電力保障。其中電源約3%風扇服務器內高功耗、高熱量的電子
元器件更多,服務器內部的發(fā)熱
量也大幅增加,此時需要布局高
轉速的服務器散熱風扇進行散熱。其他配件不一一列舉
服務器是在網絡環(huán)境中提供計算能力并運行軟件應用程序的特定IT設備,它在網絡中為其他客戶機(如個人計算機、智能手機、ATM機等終端設
備)提供計算或者應用服務,一般來說服務器都具備承擔響應服務請求、承擔服務、保障服務的能力。
服務器內部結構復雜,主要構件為處理器。相比普通計算機,服務器具有高速的CPU運算能力;長時間可靠運行能力;強大的I/O數據吞吐能力以
及具備高擴展性。應用場景十分廣泛,包括網絡存儲、網絡通信、網站托
管、數據庫管理、游戲服務器等。資料來源:
萬方數據知識服務平臺,
IDC
,立鼎產業(yè)研究網,
英特爾官網,
強川科技官網,
PingCode
,CNtronicsBusiness
Research
Insights,
Counterpoint,華經情報網,光寶科技官網,天風證券研究所服務器架構復雜應用場景廣泛,電源價值占比約為3%,華夏恒泰官網,
4圖:
服務器架構與主要構件
AI服務器是一種能夠提供人工智能(AI)的數據服務器。它既可以用來支持本地應用程序和網頁,也可以為云和本地服務器提供復雜的AI模型和服務。AI服務器有助于為各種實時AI應用提供實時計算服務。
AI服務器按應用場景可分為訓練和推理兩種,訓練對芯片算力要
求更高
,推理對算力的要求偏低。推理負載占比有望持續(xù)提升
。
據華經情報網的數據,2021年我國AI服務器推理負載占比約55.5%,預計到2025年我國AI服務器推理負載占比將提高到
60.8%。
AI服務器行業(yè)產業(yè)鏈上游主要包括芯片、
PCB、連接器、線
纜、電源和各類接口等
。中游主要包括服務器品牌商和OEM/ODM廠商,未來OEM/ODM或將逐步向JDM模式轉變。
下游主要是采購服務器的各類客戶群體。此處列舉的服務器下游終端客戶群體主要是B端和G端客戶,主要包括互聯(lián)網廠商、
云服務商、運營商、政府機構、金融機構等。
2022年全球AI服務器出貨量約占整體服務器比重近1%,約為
14.5萬臺。訓練推理概念指借助已有的大量數據樣本
進行學習,獲得諸如更準確
的識別和分類等能力的過程對于新的數據,使用經過訓練的算法完成特定任務算力要求要求訓練芯片應具有強大的
單芯片計算能力對算力的要求較低部署位置訓練芯片大多部署于云端推理芯片大多會部署于云端和邊緣側AI服務器分為訓練和推理兩種,目前出貨量占比小但持續(xù)增長資料來源:華經情報網,
中商情報網,
縱橫數據官網,天風證券研究所圖:AI服務器行業(yè)產業(yè)鏈圖:AI服務器分類5
服務器電源就是指使用在服務器上的一種開關電源,將交流電轉換為計算機所需的直流電。
開關電源是一種利用現(xiàn)代電力電子技術,通過控制開關器件在高頻狀態(tài)下的工作,從而實現(xiàn)電能的轉換和穩(wěn)定輸出的電源設備。與傳統(tǒng)線性電源相比開關電源具有高效率、體積小、重量輕、熱損耗低、輸出穩(wěn)定、適應性強、高頻操作等特點。按照應用領域不同,開關電源可分為服務器電源、適配器電源,用于新能源汽車充電柱的充電模塊以及用于便攜式儲能設備等的其他電源。
服務器電源按照標準可以分為ATX電源和SSI電源兩種
。ATX標準使用較為普遍,
主要用于臺式機、工作站和低端服務器;而SSI標準是隨著服務器技術的發(fā)展而產生的,適用于各種檔次的服務器。
服務器電源主要應用在數據中心場景中,用于服務器、存儲及交換機等IT設備的供電,
以提供穩(wěn)定的電力保障。服務器電源:用于服務器、存儲及交換機等IT設備供電的開關電源資料來源:安托森官網,CNtronics
,臺達官網,
天風證券研究所6圖:
服務器電源二、隨AI技術發(fā)展,
AI服務器電源性能多方面改善,市場需求量快速上漲
2.1GPU龍頭英偉達2024GTC發(fā)布更高性能、算力的GPU及相關產品
2.2AI技術精進導致電力消耗增加,拉動AI服務器電源的需求上漲
2.3AI服務器電源電源結構分為UPS
、AC/DC
、
DC/DC三層,各司其職確保電力
供應的連續(xù)性和穩(wěn)定性
2.4與普通服務器電源相比,AI服務器電源的性能在多方面進一步提升請務必閱讀正文之后的信息披露和免責申明72.1芯片龍頭英偉達2024GTC發(fā)布更高性能、算力的GPU及相關產品請務必閱讀正文之后的信息披露和免責申明8
當前,AI服務器需求快速增長,已經使得數據中心GPU相關產品成為英偉達最大的收入來源,且相關產品收入增速驚人:
曾經很長一段時間里,游戲GPU及相關產品也確實是英偉達的主要收入來源。2016財年,
公司總營收
50.1億美元,其中游戲
GPU業(yè)務達到
28.18億美
元,數據中心業(yè)務則為3.39億美元。
但近幾年,隨著云計算的逐漸興起,
遠程辦公、挖礦熱潮等推動英偉達數據中心GPU業(yè)務相關的收入快速增長。
2023財年(2022年
2月-
2023年1
月),英偉達數據中心業(yè)務首度營收超過游戲,成為公司的第一大業(yè)務,
當年英偉達總營收
269.74億美元,數據中心產品150.05億美元。
2024財年,在大模型對GPU需求快速提升的背景下,
英偉達總營收增長126%
至609.22億美元,數據中心業(yè)務的營收同比則增長217%至475.25億美
元,在營收結構的占比接近80%
。在最新的
2025財年第一財季,英偉達錄得營收260.4億美元,同比增長262%,其中數據中心業(yè)務營收
226億美元,
同比增長427%,營收占比87%;
與此同時,受益于數據中心業(yè)務的高利潤驅動,
25財年第一財季公司錄得凈利潤
148.8億美元,同比增長
628%
。
數據中心GPU業(yè)務的持續(xù)放量,推動英偉達身份屬性從硬件廠商向AI算力龍頭轉變。
新的定位為其在資本市場帶來了估值想象空間,推升公司股價
創(chuàng)下兩年五倍的神話,總市值更是躍升到
2萬億美元之上。2023財年(2022.2-2023.1)
,
英偉達數據中心業(yè)務首度超過游戲,成為公司第一大業(yè)務資料來源:英偉達官網
,美國證券交易委員會官網SEC,芯師爺公眾號,天風證券研究所
9圖:英偉達數據中心產品收入(單位:
億美元)
圖:英偉達數據中心業(yè)務占比
根據英偉達官網披露,在每一代的GPU架構下,公司會將旗下的
GPU按品牌分類進入GeForce
、NVIDIA
RTX/Quadro
、數據中心三個品
類。其中,
GeForce系列主要應用于游戲行業(yè),屬于消費級GPU;
NVIDIA
RTX/Quadro主要應用于工業(yè)設計、媒體開發(fā)等專業(yè)級別領域;
從GPU的性能橫向對比來看,分類進入數據中心相關的GPU往往是英偉達的王牌產品。
此外英偉達從GPU向AI服務器整機的業(yè)務衍生,
也給公司的營收帶來了增量。
近年來,其不斷圍繞GPU拓展數據中心相關的衍生業(yè)務,
力圖為數據中心提供一站式的產品服務與綜合解決方案。其中最典型的產品有兩款:(一)
英偉達利用多塊GPU構建的
DGX
系列服務器,以及多個DGX服務器組成的機架級服務器。(二)可滿足客戶定制化需求的
HGX服務器平臺。
根據TrendForce數據,
2022年全球AI服務器出貨量達到85.5萬臺,預計
2026年全球AI服務器出貨量為
236.9萬臺,
2022-
2026年CAGR高
達29.02%,遠超全球整體服務器市場增速。
就中國市場而言,根據
IDC
和浪潮信息聯(lián)合發(fā)布的《
2022-2023年中國人工智能計算力發(fā)展評估報告》
,
2021年中國AI服務器市場規(guī)
模59.2億美元,預計到
2026年將達到123.4億美元,
2021-
2026年CAGR達15.82%
。
在2024的GTC大會上,英偉達發(fā)布了以下產品:(
1)BlackwellB200GPU芯片:
產品結構層面:作為NVIDIA
Blackwell架構首款新產品,Blackwell
B200基于臺積電的4nm工藝打造,
采用了將兩個die連接成一個GPU的雙芯設計,
因此每個GPU芯片上擁有
2080億個晶體管,可以支持多達
10萬億個參數的AI模型。黃仁勛表示,在這樣的架構升級下,
Blackwell
B200的AI性能可達20PFLOPS
,而H100僅為4PFLOPS
,理論上可以為LLM(大語言模型)
的推理提升30
倍的工作效率,額外
的處理能力將使人工智能公司能夠訓練更大、更復雜的模型。而目前據George
Hotz采訪稱OpenAI的GPT-4使用了約
1.76萬億個參數來
訓練系統(tǒng)。
商業(yè)化層面:英偉達未來計劃用Blackwell
向世界各地的人工智能公司進軍,
與世界各地的所有OEM
、區(qū)域云、國家主權AI
、電信公
司簽約。目前,亞馬遜、戴爾、谷歌、
Meta
、微軟、
OpenAI
、特斯拉都已經計劃使用
Blackwell
GPU。資料來源:芯師爺公眾號,雷科技公眾號,AI前線公眾號,新智元公眾號,
36氪公眾號,天風證券研究所
10英偉達的數據中心業(yè)務的重點產品有GPU及相關衍生產品(2
)Grace
Blackwell
GB200
超級芯片:由一個Grace
CPU
、和兩組BlackwellGPU組合而成。在參數為1750億的GPT-3
LLM基準測試中,英偉達稱GB200的性能是H100的7倍,而訓練速度是H100的4倍。(3
)GB200NVL72機架服務器(也稱為DGX
GB200
):如果GB200還不能滿足需求的話,
英偉達還準備了一系列由Blackwell
GB200組成的服務器陣
列。最高可以實現(xiàn)GB200
NVL72
系統(tǒng),擁有72個Blackwell
GPU和36個Grace
CPU
,全部集成到單個NVLink域中,提供了前所未有的計算能力,使得單
個機架能夠實現(xiàn)高達720PFlops的FP8精度訓練算力,直逼前代DGX
SuperPod超級計算機集群的水平。(4)
DGX
SuperPOD:
由
8
個或以上的
DGX
GB200系統(tǒng)構建而成,
這些系統(tǒng)通過NVIDIAQuantumInfiniBand
網絡連接,可擴展到數萬個
GB200超
級芯片。采用新型高效液冷機架級擴展架構,可以用于處理萬億參數模型,能夠保證超大規(guī)模生成式AI
訓練和推理工作負載的持續(xù)運行。(
5
)此外還推出了一系列ai情景應用,
如ai服務器NIM助力醫(yī)療場景,Omniverse云平臺打開數字孿生新境界、
GR00T人型機器人通用基礎模型進軍
具身智能、
6G研究平臺推進下一代無線技術等。圖:B200芯片圖:GB200超級芯片圖:Gb200
NVL72服務器圖:DGX
SuperPOD資料來源:
36氪公眾號,
infoQ公眾號,半導體行業(yè)觀察公眾號,英偉達公眾號,機器之心公眾號,小雷嗶嗶公眾號,天風證券研究所11
目前,在PC及服務器GPU領域,全球GPU市場呈現(xiàn)“美國芯片三巨頭”——英特爾、AMD和英偉達壟斷的局面。
研究機構Jon
Peddie
Research數據顯示,
2021年第一季度全球獨立GPU領域中,英偉達是數據中心
GPU市場領導者,占據81%
的市場
份額,擁有領先優(yōu)勢,
AMD則以占比
19%位居第二。
2023年,根據富國銀行的統(tǒng)計,
英偉達目前在數據中心AI市場擁有98%
的市場份額,而AMD僅有
1.2%
的市場份額,
英特爾則只有不
到1%
。
2024年,根據富國銀行的預測,
AMD雖然在
2023年的AI芯片的營收僅為4.61億美元,
但是
2024年將有望增長到
21億美元,將有望拿
到4.2%
的市場份額。英特爾也可能拿到將近2%
的市場份額。這將導致英偉達的市場份額可能將小幅下滑到94%
。資料來源:
未來半導體公眾號,鈦媒體公眾號,天風證券研究所
12英偉達成為數據中心人工智能芯片領域(
AI
)龍頭圖:芯片領域三大龍頭市場份額占比2.2AI模型發(fā)展,算力需求大增,
AI用電需求上漲請務必閱讀正文之后的信息披露和免責申明13
服務器的功率是指服務器在工作過程中消耗的能量,通常以瓦特(W
)為單位表示,表
示單位時間內消耗的能量。服務器的功率由多個方面的因素決定:
首先是服務器的硬件配置,包括處理器、內存、硬盤等組件的功耗。不同型號和品牌的服務器在相同工作負載下的功耗也會有差異。在AI服務器中,CPU需要供電,GPU板卡需
要供電,內存(DDR4
、DDR5
、HBM
)需要供電,各種接口也需要供電。
其次是服務器的工作負載,即服務器在運行各種應用程序和服務時的負荷程度。高負荷工作負載需要更多的處理能力,因此會產生更高的功耗。
此外,服務器的能源管理策略也會影響功率。例如,服務器可以配置為在空閑時自動進入低功耗模式或關機,以節(jié)省能源。此外,服務器的散熱系統(tǒng)也會對功率產生影響。散熱系統(tǒng)的效果不佳可能導致服務器溫度過高,進而增加功耗。
AI大模型發(fā)展,用電量大增。
數字化和云服務的快速部署推動了全球數據中心的增長。
據高盛預估,目前,全球數據中心消耗的電力占總電力的1-2%,但到本世紀末,這一比
例可能會上升至3-4%
。元宇宙、增強現(xiàn)實和虛擬現(xiàn)實等行業(yè)趨勢將繼續(xù)消耗超出地球可
持續(xù)生產的能源。隨著AI服務器的市場規(guī)模不斷擴大,其核心處理器,包括CPU
、GPU、
NPU
、ASIC
、FPGA等,以及內存、網絡通信等芯片元器件的性能和功耗水平都在提升。
耗能方面,中興通訊股份有限公司研發(fā)總工熊勇表示,由于AI服務器的功率較普通服務器高6-8倍,電源的需求也將同步提升6-8倍。通用型服務器原來只需要2顆800W服務器電源,而AI
服務器的需求直接提升為4顆1800W高功率電源,服務器能耗成本從3100元直接飆升到12400元,大漲3倍。資料來源:
worktile官網,半導體產業(yè)縱橫公眾號,化合物半導體官網,高盛公眾號,AI月球圈公眾號,
navitas公眾號、半導體產業(yè)縱橫公眾號、
Bit-Bit商務網公眾號,納微芯球公眾號,天風證券研究所AI模型改進,耗電量上漲圖:
AI服務器電源功率發(fā)展趨勢14
7月15
日,根據Digital
Information
World發(fā)布的最新報告,數據中心為訓練AI模型產生的能耗將為常規(guī)云工作的三倍,預計到2030年,美國數據中心的電力需求將以每年約10%的速度增長。
據咨詢機構Tirias
Research建模預測,到2028年數據中心功耗將接近4250兆瓦,比2023年增加212倍,數據中心基礎設施加上運營成本
總額或超760億美元。
谷歌方面曾在去年2月表示,AI響應請求的成本可能是普通搜索的10倍。搜索引擎如果用上AI
,耗電量還會更高。數據顯示,使用一次谷歌搜索消耗的電量是0.3瓦時。如果要將大模型能力植入到谷歌搜索中,預計需要512821個HGX
A100
,按照每臺設備功耗為6.5千瓦來計算,每天將需要80吉瓦時的電力消耗,一年需要29.2太瓦時。目前谷歌每天需要處理高達90億次搜索,換算一下,平均每個請求要消耗6.9-8.9瓦時,已經是普通搜索的20倍+。資料來源:華爾街見聞公眾號,
量子位公眾號,天風證券研究所
15圖:
美國數據中心耗電量預測
圖:不同請求方式的耗電量對比
英偉達芯片的額定功率呈遞增趨勢。
在2024年的GTC上,英偉達發(fā)布的基于Blackwell架構的B200GPU功率則首次達到了1000W,超
級芯片GB200功率最高達到2700w。
而此前的芯片B100功率在700W,和上代H100完全一致,更早的
A100功率為400W。
英偉達基于不同芯片搭建的服務器電源功率也在上升。
DGX
A100
額定功率為6*3kw
,DGXH100/H200額定功率為6*3.3kw。
而今年英偉達GTC大會上,發(fā)布了
基于GB200芯片的NVL72架構,
NVL72機架功耗120KW左右,考慮
冗余后的總功率可達198KW
;總
功率提升至上一代產品的10倍左
右
。
圖:DGX
A100圖:英偉達不同芯片功率對比(單位:
w)300025002000150010005001000700
700
700400行業(yè)龍頭英偉達芯片和服務器的電源功率呈數倍上升趨勢資料來源:硬件世界公眾號,麗科星公眾號,
東方財富網,
英偉達官網、華碩官網,天風證券研究所0
A100H100H200
B100B200GB200圖:DGX
H100/H200圖:NVL72270016隨著AI技術的發(fā)展,模型規(guī)模不斷擴大,從千萬級參數到萬億級參數的模型,這導致訓練和推理過程中的能耗顯著增加。當下人工智能大模型的競爭,各公司不斷增加模型參數和數據量,相應地,算力需求也成倍增加。算力是對數據或信息的處理能力,算力是
抽象的,它的載體卻實在可見,就是以數據中心、智算中心為代表的算力基礎設施。算力的背后,是電力在支撐。2022年底,ChatGPT的面世,正式將AI帶入大模型時代。海內外大語言模型的快速涌現(xiàn)和迭代、模型性能的提升,使得訓練和推理持續(xù)擴張,帶動算力需求呈現(xiàn)出指
數級增長趨勢。
例如,在GPT-3的訓練階段,GPT-3有1750億個參數,
據估計,訓練過程使用了大約1287兆瓦時(也就是128.7萬度)的電力。這個耗電量相
當于美國約121個家庭一整年的用電量,也大概相當于3000輛特斯拉電動汽車共同開跑,每輛車跑20萬英里。而GPT-4曾被曝包含1.8萬億參
數,
隨著參數的翻倍,能耗也會大幅增加。另外,當下訓練AI大模型使用的主流算力芯片英偉達H100芯片,一張最大功耗為700瓦,這意味著運行一小時就要耗電0.7度。據稱OpenAI訓
GPT-5
,需要數萬張H100芯片,耗電量可謂相當可觀。完成訓練階段后,AI進入推理使用階段,即人們使用AI輸出結果的過程。AI的訓練是一次性事件,而使用卻是長期過程,隨著應用的普及、
使用人數的增加,耗電量將不斷疊加。國際能源署(IEA
)在今年1月的一份報告中曾表示,ChatGPT響應一個請求平均耗電2.9瓦時——相當
于將一個60瓦的燈泡點亮略少于三分鐘。而ChatGPT每天響應約2億個需求,消耗超過50萬度電力,相當1.7萬個美國家庭平均一天的用電量。圖:
數據中心或智算中心,成千上萬臺服務器和芯片晝夜運轉,算力需求拉動電力需求資料來源:鈦媒體公眾號,新聞聯(lián)播公眾號,天風證券研究所
17AI服務器耗電量上漲源于模型規(guī)模擴大、算力需求增加
練
以芯片龍頭英偉達為例,NERSC發(fā)現(xiàn),與一臺雙插槽x86服務器相比,一臺配備四個A100
GPU的服務器的速度提升了高達12倍。這意味著,
在相同的性能水平下,GPU加速系統(tǒng)每月的能耗比僅使用CPU的系統(tǒng)少消耗588兆瓦時的能源。與僅使用CPU的系統(tǒng)相比,在四路NVIDIA
A100云實例上運行相同的工作負載一個月,科研人員可以節(jié)省400多萬美元。
另外,
從縱向英偉達產品的發(fā)展來看,
比起H100,
GB200的成本和能耗最多可降低25倍。過去,訓練一個1.8萬億參數的模型,需要8000個
Hopper
GPU和15MW的電力。如今,2000個Blackwell
GPU就能完成這項工作,耗電量僅為4MW。 AI電力消耗主要集中于服務器和冷卻系統(tǒng)。數據中心包括IT設備和軟件以及配套的輔助基礎設施,輔助設施包括制冷系統(tǒng)、供配電系統(tǒng)等。從能耗構成看,數據中心能耗集中在這三大領域,其中,
IT設備和軟件耗電量占42%,冷卻系統(tǒng)占數據中心總電力消耗的40%,是僅次于服務器本身的第二大電力消耗來源,電氣系統(tǒng)能耗占比較小。隨著技術發(fā)展,
GPU的能耗水平在不斷改善資料來源:
半導體產業(yè)縱橫公眾號,新智元公眾號,
NVIDIA英偉達公眾號,蘭洋科技https://www.blueocean-china.net/faq3/234.html
,天風證券研
究所AI電力消耗主要集中于服務器和冷卻系統(tǒng)圖:GPU
、CPU電力消耗對比圖:
AI服務器電力消耗18
AI服務器電源作為高性能計算和數據中心的基礎設備,擔負著為服務器集群提供穩(wěn)定、高效電能供應的任務。目前,AI服務器電源產品已經具備高效率、低諧波、智能管理等特性,但在滿足AI計算平臺大規(guī)模、高并發(fā)、動態(tài)負載變化的需求方面,仍有改進空間。未來,AI服務器電源將朝著更高功率密度、更優(yōu)能效比、更強動態(tài)響應能力的方向發(fā)展。
同時,隨著邊緣計算和分布式計算的興起,電源模塊的小型化和標準化設計將變得尤為重要。此外,電源管理系統(tǒng)將與AI算法深度融合,實現(xiàn)電源的智能預測、動態(tài)調度和故障預警,從而為數據中心的綠色運營和可持續(xù)發(fā)展提供強大支撐。
隨著對更高計算能力的需求,服務器電源需要在有限空間內提供更多功率,這對功率密度提出了更高要求,對散熱設計、元器件布局和效率提出了更高要求。常見的主要策略見2.3章節(jié)。
此外,隨著服務器性能的改進,如何降低AI系統(tǒng)的能耗保證系統(tǒng)穩(wěn)定工作成為產業(yè)難題。目前降低AI系統(tǒng)能耗主要兩種思路:
一、降低AI系統(tǒng)核心處理器的能耗;
二、優(yōu)化電源管理系統(tǒng),提高AI核心處理器電源管理的效率。除了通過傳統(tǒng)計算系統(tǒng)用到的AC/DC
、DC/DC
、多相電源控制器和
DrMOS功率級組合等方案來改進效率,也可以開發(fā)更先進的電源管理方案——如改進電源管理系統(tǒng)當中用到的無源器件(以電感和電容為主),性能優(yōu)異的無源器件可以提供更加穩(wěn)定的電壓和電流,以確保AI服務器等HPC系統(tǒng)正常運行,保證快速的瞬態(tài)響應和較低的紋波。低損耗的無源器件可以提高AI服務器的能效,提升關鍵零部件的效率,節(jié)能環(huán)保。未來高性能服務器電源為發(fā)展方向資料來源:中國產業(yè)調研網,半導體產業(yè)縱橫公眾號、天風證券研究所192.3AI服務器電源架構分為UPS
、AC/DC
、
DC/DC三層,各司其職確保電力供應的連續(xù)性和穩(wěn)定性請務必閱讀正文之后的信息披露和免責申明20
要驅動一臺AI服務器,需經過數次電壓轉換
。高壓電從電網進入數據中心后,服務器電源供應器會先將交流電轉為直流電,并降壓到48伏特;接著主板上的DC/DC轉換器,再將電壓轉換成CPU用的12伏
特和GPU用的0.8伏特低電壓。在此過程中數據中心電源架構主要涵蓋保障電路
UPS、機架電源
AC/DC、芯片電源
DC/DC三個層級。
AI服務器電源組件分3層結構:
UPS(不間斷電源):
即不間斷電源(Uninterruptible
PowerSupply)是一種含有儲能裝置的不間斷電源。當市電輸入正常時,UPS將市電穩(wěn)壓后供應給負載使用,此時的UPS就是一臺電穩(wěn)壓器,同時它還向機內電池
充電;當市電意外中斷時,UPS立即將電池的直流電能,通過逆變器切換轉換的方法向負載繼續(xù)供應電能,使負載維持正常工作并保護負載軟、硬件不受電網波動而造成損壞。
AC-DC(powershelf):
將電網的交流電轉換為適合服務器使用的50V直流電。在ACDC電源中,輸入電
壓一般是來自電網的85V~265V交流高壓,而輸出電壓為3.3V
、5V
、12V等直流低壓。與一般服務器相
比,AI服務器需要更高性能的處理器,如圖形處理器(
GPU
)、張量處理單元(
TPU
)和現(xiàn)場可編程邏
輯門陣列(FPGA
),其功耗可能高出兩倍到十倍。為了降低不必要的能耗損失,需要提高整個服務器機柜的能源利用效率,將供電電壓從傳統(tǒng)的12V提高到48V
。然而,服務器內部的某些組件仍需要使用
12V或更低電壓,因此需要DC-DC轉換器進行調整。
DC-DC:進一步將50V直流電降至芯片可接受的0.8V
。
DC-DC電源電路又稱為DC-DC轉換電路,其主
要功能就是進行輸入輸出電壓轉換。一般把輸入電源電壓在72V以內的電壓變換過程稱為DC-DC轉換?!咀ⅰ科渲?/p>
AC/DC
電源的難點在于在有限的體積內提高功率密度,而
DC/DC
則在于如何盡可能降低板路損耗。AI服務器電源電源架構分為
UPS
、AC/DC
、
DC/DC三層,
各司其職確保電力供應的連續(xù)性和穩(wěn)定性資料來源:臺達公眾號、G9HUB香港科創(chuàng)匯公眾號,芝能科技公眾號,泰高系統(tǒng)公眾號,晶豐明源公眾號,天風證券研究所
21AC/DC(power
shelf
注:
power
shelf是用于安裝PSU的金屬殼體)
AC/DC電源模塊包含電源模塊(PSU)和電源管理控制器(PMC)1.PSU(電源供應單元)
:
AI伺服器要能穩(wěn)定工作,
PSU是一個關鍵的組件,負責將來自電網的交流電(
AC
)
轉換為伺服器電子組件所需的直流電(DC)。對於高性能的AI伺服器,
PSU需要提供足夠且穩(wěn)定的電力來驅動CPU
、GPU或AI加速器。此外,
PSU的效率也很關鍵,它會直接影響整體的能源消耗和散熱需求,一個效率高的PSU可以最小化能源浪費,并減少散熱需求,從而使伺服器在高負載運行時仍能保持穩(wěn)定。同時,高效的PSU也可以延長電源供應器的壽命,并降低由於電源問題導致的伺服器停機時間。
選擇一個好的PSU
。首先要確保其提供足夠的功率以供應所有硬體的需求以防止任何可能導致系統(tǒng)故障的電力波動或中斷。其次,要檢查電源供應器的效能和穩(wěn)定性。最后,要確保電源供應器具有良好的保護功能,如過載保護(OCP
)、過熱保護(
OTP
)和過壓保護(
OVP
)。這叁種保護功能都是電源供應器(PSU
)內建的安全特性,用於防止硬體損壞并確保系統(tǒng)穩(wěn)定運行。其中,過載保護(
OCP
)為當輸出電
流超限時,會關閉或限制電源供應器,以防止硬體損壞;過熱保護(OTP
)指的是當內部溫度過高時,電
源供應器會自動關閉,防止過熱;過壓保護(OVP
)功能為當輸出電壓超限時,會關閉或限制電源供應器,
以保護硬體不受高電壓毀損。2.PMC(電源管理控制器)是一種用于管理和優(yōu)化服務器電源的控制器。它通常是一塊硬件設備,安裝在服務器主板上或者作為獨立設備安裝在服務器機柜中。
PMC通過監(jiān)控和調整服務器電源的供應和消耗來實現(xiàn)最佳的電源管理,以提高服務器的能效和性能。
基于GB200搭建的計算平臺GB200
NVL72,
目前臺達是英偉達最大的電源供應商。根據臺達給英偉達設計
的電源模組來看,為了供應一臺GB200機柜的耗電量,臺達設計了單個Power
shelf為33kw的電源模組(
6
個電源構成),其中NVL
72需要6個power
shelf構成,單臺機柜需要電源200kw左右,NVL
36需要4個power
shelf,單臺需要電源130kw左右,因此,電源也占據了GB200機柜不少的價值量。資料來源:芝能科技公眾號,中邦電氣官網,
worktile官網,華碩官網、新智元公眾號,天風證券研究所圖:
AINVIDIA
GB200
NVL72機柜電
源(最上方和最下方是電源模具區(qū)域)圖:英偉達
B系列NVL72在AC-DC(
power
shelf)的電源布局22
DC/DC轉換器:
用于轉換CPU/GPU的電壓級別。與一般服務器相比,AI服務器需要更高性能的處理器,如圖形處理器(
GPU
)、張量處理單
元(
TPU
)和現(xiàn)場可編程邏輯門陣列(FPGA
),其功耗可能高出兩倍到十倍。為了降低不必要的能耗損失,需要提高整個服務器機柜的能源利用效率,將供電電壓從傳統(tǒng)的12V提高到48V
。然而,服務器內部的某些組件,如GPU/CPU,
仍需要使用12V或更低電壓,因此需要DC-DC轉換器進行調整。DC-DC轉換器便是反復導通電源開關,把直流電壓或電流量轉化成高頻率波形工作電壓或電流量,再經整流器光滑變成直流電壓輸出。
DC-DC轉換器一般由控制集成ic,電感,二極管,三極管,電力電容器組成。現(xiàn)如今運用目前的部件、參照設計方案、專用工具和資源設計制作一個基本且功能強大的DC/DC
電源穩(wěn)壓電源(或稱之為開關電源轉換器)早已并不是一件難題了,設計師需要將適合的控制IC
、MOSFET
晶體三極管、光耦電路及其一些無源器件組成起來,理論上全部設計方案就完成了,可以對鍵入
DC直流電壓開展變換和穩(wěn)壓管另
外輸出DC直流電壓。正常情況下講穩(wěn)壓電源的作用十分的簡潔明了:選用平穩(wěn)的DC鍵入開關電源,歷經嚴苛的調整后輸出直流電壓給予給
系統(tǒng)軟件應用。
殊不知這僅僅理論上的,大家還遭遇著嚴苛的實際,作一個“相對性好的”設計方案早已不會再足夠了,盡管那樣的設計方案可以達到一些基本上的技術參數,例如輸出精密度、穩(wěn)壓管實際效果等,可是要記牢這種“基本上的”主要參數僅僅當代穩(wěn)壓電源務必具有的一小部分,除此之外對動態(tài)性特性、各種各樣負載的高效率及其干擾信號/頻射影響(
EMI
/RFI
)等層面日益嚴苛的規(guī)定也愈來愈不容樂觀。DC/DC轉換器:用于轉換CPU/GPU的電壓級別資料來源:臺達官網,深圳市惠新晨電子有限公司官網,能利芯公司官網,天風證券研究所圖:
AI服務器電源DC-DC轉化電源(48V-12V;
12V-1V
)232.4與普通服務器電源相比,
AI服務器電源架構在多方面的性能得到提升AI算力的龍頭企業(yè)——英偉達相比普通服務器電源,AI服務器電源多方面的性能改善,包括:功率和功率密度大幅提高、冗余系統(tǒng)發(fā)展、液體冷卻系統(tǒng)出現(xiàn)等。請務必閱讀正文之后的信息披露和免責申明24
隨著對更高計算能力的需求,服務器電源需要在有限空間內提供更多功率,這使得電源設計人員需要創(chuàng)建具有高效率和高功率密度的最新電源解決方案,可以滿足快速增長的AI市場當前與未來的高功率需求。
AI市場迅速擴張,電源需求增加,空間成本也在不斷上升。現(xiàn)代數據中心包含成
百上千個處理單元,因此設備大小非常重要。減小單個單元的尺寸會引發(fā)連鎖反
應
:(
1
)可以在與大型解決方案相同的空間中應用更多設備,從而實現(xiàn)更高的
處理能力密度;(
2
)可以極大地提高功率密度,并減小散熱面積;(
3
)還可以使得物理材料更少、組件更少、成本結構更好、解決方案集成更多以及
總體擁有成本更低,從而實現(xiàn)成本的節(jié)省。
功率密度是在給定空間內可處理多少功率的度量,可量化為每單位體積處理的功
率量。功率密度越高,表示在相同的體積內可以提供更多的功率。功率密度的概
念在服務器電源設計中非常重要,原因在于:
第一,數據中心和服務器機架的空間有限,隨著處理器和服務器功率的增加,數據中心每個機架也將使用更多的電源。隨著更高功率密度的發(fā)展趨勢,數據中心每個模塊在2-4kW。高功率密度的電源可以在有限的空間內提供更多的電力,從
而支持更多的計算硬件。
第二,功率密度和效率是緊密耦合的。功率密度越高,通常意味著電源轉換效率越高,從而減少能量損耗和散熱需求,有助于提高整個服務器系統(tǒng)的能效比。資料來源:
MPS官網,
wolfspeed公眾號,德州儀器官網,芝能科技公眾號,天風證券研究所AI電源功率密度不斷提升圖:
AI服務器電源功率密度發(fā)展趨勢25 AI行業(yè)研究人員一直致力于尋找提高功率密度的方法,這是一項艱巨的任務
。
影響總體功率密度的關鍵因素有開關頻率、系統(tǒng)的熱性能等。要實現(xiàn)在更小的空間內實現(xiàn)更大的功率,并以更低的系統(tǒng)成本增強系統(tǒng)功能,必須在開關性能、
IC封裝、電路設計和集成方面多措
并舉。
(1)開關損耗創(chuàng)新:
為了獲得出色的器件性能和FoM
,對半導體技術進行投資
很必要。這可能包括用于改進現(xiàn)有技術的創(chuàng)新,或者開發(fā)本
質上性能更好的新材料,例如用于更高電壓開關的氮化鎵(GaN)
技術。(
2
)封裝散熱創(chuàng)新
:
將熱量從集成電路(IC)封裝中散發(fā)出來的能力將直接影響功率密度。隨著封裝尺寸的不斷縮
小,散熱問題變得越來越重要。在典型的電源轉換器中,半導體器件通常是解決方案中最熱的部分。例如,德州儀器的投資開發(fā)并引入了
HotRod封裝,它用倒裝
芯片式封裝(圖1
)取代了典型的鍵合線四方扁平無引線封裝QFN(圖
2
),這樣可以大大降低倒裝芯片式封裝中常見的寄生環(huán)路電感,同時
還保留了QFN封裝熱性能的部分優(yōu)勢。(
3
)先進的電路設計創(chuàng)新:
除了先進的柵極驅動器技術以外,還有大量機會可以通過
拓撲創(chuàng)新來提高功率密度。例如飛跨電容四電平(FC4L)
(圖
3
)轉換器拓撲實現(xiàn)了許多關鍵的功率密度優(yōu)勢,包括通過降低器件額定電壓、減小磁濾波器尺寸和改善熱分布來提高器件FoM
。
這些優(yōu)勢可轉化為更高的功率密度。(
4
)集成創(chuàng)新:
具有高性價比的集成減少了寄生效應,減少了物料清單,提高了效率并節(jié)省了空間。集成可適用于電源管理的多個方面,它可能需要在集成電路IC
中添加更多的電路,在封裝中添加更多的組件。圖
1:
HotRod
互連封裝(引線框上倒裝芯片)QFN
封裝
圖
2:
帶有外露焊盤的標準鍵合線
QFN
封裝通過組合開關性能、
IC
封裝、電路設計和集成等技術,可以顯著提高功率密度資料來源:德州儀器官網,天風證券研究所
26圖3
:使用
GaN開關的飛跨電容四電平轉換器拓撲
轉換效率是指服務器電源將輸入的電能轉換為實際輸出電能的比例。它是衡量服務器能源利用效率的關鍵指標,
直接影響服務器的運行成本和能源消耗。高效率的電源轉化不僅可以減少能源浪費,降低運營成本,
還能減少熱量產生,
提高服務器的可靠性和穩(wěn)定性。80PLUS認證是衡量電源轉換效率的一個重要標準,
它由
Ecos
Consulting組織和美國EPRI
電力研究所推行,目的是推廣高效率節(jié)能電源。認證
根據電源在不同負載(如10%、20%、50%
和100%額定功率)下的轉換效率和功率因數(PF值)
來評定等級,
包括白牌、銅牌、銀牌、金
牌、白金牌和鈦金牌,其中鈦金牌為最高等級。能源政策機構Energy
Innovation
數據顯示,效率每提升1%
,相當于每個數據中心節(jié)省了
1兆瓦(或
800
戶家庭用電)的總所有成本。
隨著AI服務器的發(fā)展,
AI
電源系統(tǒng)設計人員除了面臨千瓦功率的挑戰(zhàn),
轉換效率也至關重要。因為計算系統(tǒng)是以全功率運行的復雜負載,
系統(tǒng)必須在整個電力需求中保持盡可能高的效率。浪費的每一瓦能量都會作為熱量消散,
并轉化為數據中心對散熱系統(tǒng)的更高要求,
這
會增加運營成本以及碳足跡。
圖:80PLUS等級標準資料來源:
MPS
,電子工程世界,超能網,
Zol,倍科看世界公眾號,A5互聯(lián),
天風證券研究所
27轉換效率逐漸提高
可以通過以下方法來提高服務器電源的轉換效率:(1
)使用高性能半導體功率器件:
功率半導體是控制電力設備電能變換和進行電路控制的核心半導體器件,可對電路進行整流、分流、變壓、
逆變、穩(wěn)壓、變頻、功率控制等。
按集成類別主要可以分為功率IC
、功率模組、功率分立器件三大類,功率IC主要用于將功率分立器件與外圍驅動、控制、保護等電路集成,
功率模組是將功率分立器件根據下游的特定需求封裝組成特定的模塊,而功率分立器件(IGBT
、MOSFET等)是對電路特定進行變化的核心。
功率器件主要經歷了工藝進步、器件結構改進與使用寬帶隙材料三大方面的演進,以MOFSET為例,MOSFET屬于單極型功率半導體,朝著“更高的開關頻率、更高的功率密度和更低的功耗”方向演進:(
1
)未來溝槽MOSFET將替代部分平面MOSFET;(
2
)屏蔽柵MOSFET將進一步替代溝槽MOSFET;高壓領域下,超級結MOSFET將替代更多傳統(tǒng)的VDMOS;(
3
)以SiC
、GaN為主的第三代半導體在高溫、高壓、高功率和高頻的領域將取代部分硅材料。
Si(硅)在過去60多年一直是半導體電源管理元件的基礎。在過去的幾十年中,硅基MOSFET改變了
從基本電源和逆變器到電機驅動的電源系統(tǒng)的設計。如今在不增加尺寸的前提下,硅已無法在所需的頻率下提供更高功率。
而SiC和GaN
相比Si適用于高功率和高頻率的應用,使用GaN等寬帶隙材料的MOSFET可以提高轉換效率。例如,與相同功率等級的Si
MOSFET
相比,SiCMOSFET
導通電阻、開關損耗大幅降低,適用于更高的工作頻率,另由于其高溫工作特性,大大提高了高溫穩(wěn)定性
,SiC
MOSFET主要用于1200V應用領域,取代目標是硅基IGBT?!咀ⅰ縂aN技術是一個廣泛的領域,它包括使用氮化鎵材料的各種電子器件和應用,而GaN
MOSFET是是GaN技術的一種具體應用。從晶閘管、晶體管、
IGBT
、到SiC
、GaN,功率密度在逐步增加,也就是說單位面積的芯片可以承載更大的功率和能量。資料來源:華經情報網
,digikey,中國科學院微電子研究所,
德州儀器官網,至信微電子公眾號,天風證券研究所圖:半導體分類
圖:MOFSET技術迭代發(fā)展歷程圖:各功率器件的適用范圍28
功率的集成解決方案也越來越關鍵。例如,DrMOS(Driver+MOSFET)技術的出現(xiàn)極大地改進了功率轉換和管理領域的設計和性能。
DrMOS
是一種集成式的功率模塊,由驅動器driver和MOSFET的緊密集成,它既降低了系統(tǒng)的復雜性,節(jié)省了PCB板上的空間,也具有更低的電感和
電阻,從而降低了功率轉換過程中的損耗。此外,DrMOS的高集成度還提供了更好的熱管理能力。
例如,英飛凌近日公布了新的數據中心電源路線圖,計劃推出8kW和12kW
的超高功率服務器電源解決方案,以滿足AI服務器對電力的強
勁需求。英飛凌將推出的兩款服務器電源將從服務器端滿足
AI
芯片的需求,簡化AI服務器的供電設計。這兩款電源均將混合使用硅、氮化
鎵、碳化硅三類晶體管開關,以實現(xiàn)100W/in3的高功率密度和
97.5%的高轉換效率。
(2
)采用更高效率的電路拓撲結構:
拓撲結構是服務器電源中的另一個重要因素。合理的拓撲結構可以提高電源的效率,降低能耗,同時也能保證服務器的穩(wěn)定運行。常見的服務器電源拓撲結構有單端正激式、雙端正激式、半橋式、全橋式。此外,無橋功率因數校正(PFC)通過減少導通路徑的器件數來減小導通損耗,可以顯著提高效率。無橋圖騰柱(Totem-Pole)
PFC作為最簡潔的無橋PFC拓撲,可以減少尺寸和元器件數量,
以簡化PCB
電路,從而減小體積,提高功率密度。資料來源:
IT之家,與非網,
至信微電子,天風證券研究所
29圖:英飛凌8kw電源渲染圖
AI產業(yè)快速發(fā)展,
驅動液冷服務器滲透率逐步抬升。受限于數據中心建設面積及環(huán)保要求,傳
統(tǒng)風冷難以滿足散熱需求,需要液冷技術提升服務器使用效率及穩(wěn)定性。從發(fā)展趨勢來看,
預
計到2025年液冷服務器滲透率大約保持在20%-
30%的水平。
英偉達最新的
B系列GPU,
因為效能太高而容易過熱,將從傳統(tǒng)的風冷散熱改為昂貴復雜的液冷。
臺達在發(fā)展液冷解決方案。
臺達的散熱業(yè)務本過去以生產數據中心維持氣流循環(huán)的大型風扇和
服務器主機版的散熱風扇等為主,有年營收數百億規(guī)模,
近來也持續(xù)投入新技術:從風扇、3DVC(風冷技術)、液冷到浸沒式解決方案。新一代的服務器機柜電源線與液冷的水管日益復
雜,臺達正將電源、液冷模塊與機柜整合設計形成解決方案,便于縮小體積與維修。
冷卻系統(tǒng)占數據中心總電力消耗的
40%,
是僅次于服務器本身的第二大電力消耗來源。
研究公
司Global
Market
Insights
預測,全球數據中心液體冷卻市場規(guī)模將從2022年的
21
億美元增長到
2032年的122億美元。
UptimeInstitute
的一項調查發(fā)現(xiàn),
16%
的數據中心經理認為液體冷卻將
在1-3
年內成為數據中心的主要冷卻方法,而41%的人認為這將需要
4-6
年。因此,混合冷卻
方法在短期內更有可能出現(xiàn)。數據中心的液體冷卻系統(tǒng)新技術包括浸入式冷卻(將整個服務器
機架浸入非導電液體中)和直接液體冷卻(在服務器周圍循環(huán)水)。
雖然目前比空氣冷卻系統(tǒng)
更昂貴,
但液體冷卻可以將數據中心的功耗降低
10%
或更多。數據中心風冷系統(tǒng)管理領域的領
導者Upsite
Technologies指出,雖然技術在不斷進步,但短期內不太可能大規(guī)模實施液體冷卻,而且需要大量的前期投資,液冷設備仍然需要風冷來散熱??諝饫鋮s成本較低但效率較低。因
此,混合冷卻設施正變得越來越受歡迎,以最大限度地發(fā)揮液體和空氣冷卻的優(yōu)勢。服務器ODM廠商指出,
Nvidia的BlackwellAI芯片,包括B100和B200,
將于今年開始出貨,
但GB200解決
方案要到2024年底或2025年才會開始量產。
B100
、B200客戶目前大多仍采用風冷散熱設計。資料來源:臺達公眾號,半導體產業(yè)縱橫公眾號,
云上芯世界公眾號,天風證券研究所
30使用水或冷卻劑來冷卻服務器的液體冷卻正在興起圖:浸沒式液冷原理圖圖:噴淋式液冷原理圖
服務器系統(tǒng)的可靠性和可用性非常重要,因此需要冗余PSU
?!癗+1”冗余系統(tǒng)是一種設計方法,“N”代表正常運行所需的電源模塊數量,而“+1”表示額外的備用電源模塊,以確保系統(tǒng)的可靠性和容錯能力。這種設計允許在其中一個組件發(fā)生故障時,系統(tǒng)仍然能夠繼續(xù)運行,而不會對服務或性能產生顯著影響。
AI服務器系統(tǒng)可能具有N+1或N+N(N>2)冗余,具體取決于系統(tǒng)可靠性和成本考量。
為了在需要更換PSU
時保持系統(tǒng)正常運行,系統(tǒng)需要熱插拔
(
ORing控制)
技術。由于在N+1
或N+N
系統(tǒng)中
有多個PSU
同時供電,因此服務器PSU也需要使
用電流共享技術。
即使處于待機模式(
未從其主電源軌向輸出端供電)的PSU也需要在熱插拔事件后即時提供全功率,因此需要功率級持續(xù)激活。為了降低待機模式下冗余電源的功耗,
“冷冗余”功能正成為一種趨勢。冷冗余旨在關閉主電源運行或在突發(fā)模式下運行,
從而使冗余PSU更大限度減少待機功耗。
服務器電源市場和服務器的配比不斷提升,服務器電源市場數量的增長會快于服務器市場。服務器電源市場和服務器的配比不斷提升:從通用服務器的單臺服務是1:2左右,到AI服務器(推理、訓練)是
1:3或1:4,高端訓練是1:6,英偉達目前和服務器廠商聯(lián)合開發(fā)未來高功率電源可能是1:10。AI服務器電源具有N+1或
N+N冗余,具體取決于系統(tǒng)可靠性和成本考量圖:冗余電源布局示例圖(每個刀片服務器由A、B總線共同供電,這兩個電源總線由N+1只電源組成)AI服務器和電源的配比不斷提升資料來源:
德州儀器官網,東方財富網,天風證券研究所31三、AI服務器電源面臨廣闊的發(fā)展空間
AI服務器電源成為服務器電源市場新增量,
2026年AC-DC市場規(guī)模有望達53億美元。請務必閱讀正文之后的信息披露和免責申明32
AI服務器電源仍然是電源組件市場的關鍵增長部分,而英偉達在AI服務器GPU市場占有率超90%,占據絕對主導地位。我們據此測算AI服務器電源市場增量。根據TechInsights
報告,英偉達在
2023
年數據中心GPU
總計出貨量約為376萬塊,相比于2022年的264萬塊增長了超百萬塊。
英偉達B系列服務器電源2026年市場空間有望達53億美元。
隨著AI服務器電源功率密度提升,預計單瓦價值量會有明顯提升;假設未來兩年出貨的AC-DC產品單瓦價格為2-3人民幣/瓦,同時假設25/26年GB200NVL36出貨量分別為6-8/9-14萬臺(根據GB200芯片出貨量預期全部折算為NVL36),我們預計25年AC-DC市場空間可達238-317億元人民幣,26年AC-DC市場空
間可達297-462億元人民幣;AI服務器電源呈高速增長趨勢(25-26年按照均值測算),未來增量廣闊。2025E2026E功率單價(人民幣/瓦)332.52.5CB200
NVL36出貨量(萬臺)68914GB200
NVL36功耗(kw/臺)132132132132單臺價格(萬人民幣/臺)39.639.63333AC-DC空間(億人民幣)238317297462AI服務器電源成為服務器電源市場新增量,
2026年AC-DC市場空間有望達53億美元資料來源:IT之家,TechInsights
,
DIGT
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024司機聘用合同
- 挖掘機租賃市場合同樣本
- 2024年房屋經紀服務合同
- 2024競價房屋買賣合同范本
- 江蘇省徐州市七年級上學期語文期中試卷5套【附答案】
- 2024【股權投資信托合同】股權投資合同
- 施工安全協(xié)議書案例分析
- 專業(yè)咨詢委托協(xié)議參考
- 房屋買賣合同協(xié)議書委托人2024年
- 標準的汽車租賃合同范本
- 2024-2030年中國演藝行業(yè)發(fā)展分析及發(fā)展前景與趨勢預測研究報告
- 2024年重慶市渝北區(qū)數據谷八中小升初數學試卷
- 凝中國心鑄中華魂鑄牢中華民族共同體意識-小學民族團結愛國主題班會課件
- 2024年AI大模型場景探索及產業(yè)應用調研報告-前瞻
- 北師大版六年級數學上冊-第一單元《圓》復習課件
- 盛世華誕慶祝祖國成立75周年共筑中國夢同慶國慶節(jié)課件
- 2024年廣州市少年宮公開招聘工作人員歷年高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 全過程工程咨詢管理服務方案投標方案(技術方案)
- 景觀水處理技術介紹
- 6.2反比例函數的圖象與性質(第一課時)教學設計2024-2025學年北師大版數學九年級上冊
- 了解紅旗渠學習紅旗渠精神
評論
0/150
提交評論