人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析_第1頁(yè)
人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析_第2頁(yè)
人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析_第3頁(yè)
人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析_第4頁(yè)
人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析01算力是智能世界的基礎(chǔ),產(chǎn)業(yè)生態(tài)和投資圖譜逐步清晰算力是智能世界的基礎(chǔ),基礎(chǔ)設(shè)施從云向算泛在演進(jìn)智能世界三要素:數(shù)據(jù)、算力、算法是智能世界三要素,其中算力平臺(tái)是核心基礎(chǔ)。算力兩大類:通用算力、HPC(高性能計(jì)算,High-performancecomputing)算力。其中通用算力計(jì)算量小,用于常規(guī)應(yīng)用。HPC算力是一個(gè)計(jì)算機(jī)集群系統(tǒng),通過(guò)各種互聯(lián)技術(shù)將多個(gè)計(jì)算機(jī)系統(tǒng)連接在一起,利用所有被連接系統(tǒng)的綜合計(jì)算能力來(lái)處理大型計(jì)算問(wèn)題。算力基礎(chǔ)設(shè)施從云向算泛在演進(jìn),其位置的分布從中心向邊緣和端側(cè)泛在延伸,將出現(xiàn)云、邊、端三級(jí)算力架構(gòu)。AI大模型帶動(dòng)算力需求超越摩爾定律增長(zhǎng)AI模型訓(xùn)練算力增長(zhǎng)速度超越芯片摩爾定律。AI訓(xùn)練任務(wù)中的算力增長(zhǎng)(所需算力每3.5個(gè)月翻一倍)已經(jīng)超越摩爾定律(晶體管數(shù)量每18月翻一倍)。ChatGPT僅推出兩個(gè)月,月活躍用戶數(shù)預(yù)計(jì)已達(dá)1億。ChatGPT在2023年1月達(dá)到1億月活躍用戶,平均每天有1,300多萬(wàn)訪客,用2個(gè)月時(shí)間達(dá)到1億月活數(shù),成為史上最快達(dá)到1億月活躍用戶的應(yīng)用,TikTok、Instagram、Facebook、Twitter則分別用了9個(gè)月、2年半、4年半、5年的時(shí)間。MR、車載等數(shù)字經(jīng)濟(jì)新型應(yīng)用場(chǎng)景帶來(lái)新的算力需求MR的推出更帶來(lái)對(duì)低延時(shí)網(wǎng)絡(luò)傳輸和底層算力技術(shù)升級(jí)的需求。虛擬世界需要強(qiáng)大的圖像實(shí)時(shí)渲染能力、計(jì)算和存儲(chǔ)海量數(shù)據(jù)資源,頭顯交互設(shè)備的出現(xiàn)將進(jìn)一步增加對(duì)云計(jì)算和邊緣計(jì)算的應(yīng)用需求。云計(jì)算能將終端渲染逐步遷移至云端,基于規(guī)模效應(yīng)攤低運(yùn)算成本,提升服務(wù)器使用效率,提升虛擬世界的可進(jìn)入性。而邊緣計(jì)算則更能滿足實(shí)時(shí)數(shù)據(jù)分析需求、緩解中心云的計(jì)算負(fù)載。汽車智能化需求持續(xù)升級(jí)帶來(lái)數(shù)據(jù)流量的急劇飆升。隨著自動(dòng)駕駛等級(jí)提升,車載信息娛樂(lè)系統(tǒng)、長(zhǎng)續(xù)航電池及5G網(wǎng)絡(luò)的引入,車輛要面對(duì)的計(jì)算量越來(lái)越大,網(wǎng)絡(luò)架構(gòu)升級(jí)、本地實(shí)時(shí)處理能力、“大容量緩存和存儲(chǔ)”規(guī)格將成為硬需求。中美算力布局較為領(lǐng)先,中國(guó)智能算力在追趕智能算力規(guī)模和增速亮眼。根據(jù)信通院算力白皮書,2021年全球算力增速超過(guò)40%,華為GIV預(yù)測(cè)2030年人類將迎來(lái)YB數(shù)據(jù)時(shí)代,全球算力平均年增速達(dá)到65%,其中基礎(chǔ)算力平均年增速達(dá)27%;智能算力占大頭,平均年增速超過(guò)80%;超算算力平均年增速超過(guò)34%。中美算力在全球?qū)儆陬I(lǐng)先地位。美國(guó)、中國(guó)、歐洲、日本在全球算力規(guī)模中的份額分別為34%、33%、14%和5%,其中全球基礎(chǔ)算力美國(guó)份額達(dá)37%,中國(guó)以26%份額排名第二;智能算力方面,中國(guó)、美國(guó)分別占比為45%和28%;美國(guó)、日本、中國(guó)在超級(jí)計(jì)算綜合性能指標(biāo)方面份額分別為48%、22%、18%。02基礎(chǔ)設(shè)備:數(shù)據(jù)中心加速升級(jí),芯片PCB等上游部件量?jī)r(jià)齊升AI服務(wù)器采用異構(gòu)式架構(gòu),GPU數(shù)量遠(yuǎn)高于普通服務(wù)器。AI服務(wù)器和普通服務(wù)器的主要區(qū)別在于:1)架構(gòu)不同,AI服務(wù)器采用CPU+GPU/FPGA/ASIC等異構(gòu)式架構(gòu),而普通服務(wù)器一般是CPU架構(gòu);2)GPU數(shù)量差別巨大,AI服務(wù)器單服務(wù)器GPU用量通常在4顆以上。例如:NVIDIADGXA100包括8個(gè)A100GPU+2個(gè)AMDRomeCPU,而浪潮英信服務(wù)器NF5280M6僅配置1-2個(gè)英特爾第三代Xeon處理器。GPU架構(gòu)為主流加速架構(gòu),是服務(wù)器核心成本構(gòu)成。GPU采用并行計(jì)算,適用于處理密集型運(yùn)算,如圖形渲染、機(jī)器學(xué)習(xí)等場(chǎng)景,AI算力需求的提升推動(dòng)了GPU卡的運(yùn)算速度和用量需求進(jìn)一步增長(zhǎng)。根據(jù)IDC數(shù)據(jù),2022年GPU加速卡占據(jù)AI市場(chǎng)89%的份額,在機(jī)器學(xué)習(xí)型服務(wù)器中GPU成本占比達(dá)72.8%。高速互連技術(shù)開創(chuàng)者,多卡互聯(lián)優(yōu)勢(shì)顯著。為實(shí)現(xiàn)超算模型的高速通信需求,英偉達(dá)開創(chuàng)式提出NVLink和NVSwitch技術(shù):NVLink主要用于連接多個(gè)GPU,以加速高性能計(jì)算和深度學(xué)習(xí)等應(yīng)用;NVSwitch用于連接多個(gè)GPU和CPU,形成高性能計(jì)算系統(tǒng),適用于更復(fù)雜和大規(guī)模的場(chǎng)景,用戶可根據(jù)具體應(yīng)用需求和系統(tǒng)配置來(lái)決定使用NVLink或NVSwitch。GH200超級(jí)芯片所采用的NVLink-C2C技術(shù),通過(guò)Chiplet工藝將CPU+GPU組合到同一封裝,相比于PCIe5在能效方面提升25倍,面積效率提升90倍。CUDA生態(tài)不斷演進(jìn),滿足各類行業(yè)需求。英偉達(dá)依托于CUDA軟件棧進(jìn)行第三方應(yīng)用及工具的擴(kuò)展,形成了廣義的CUDA生態(tài),并在此基礎(chǔ)上向上擴(kuò)展出CUDA-X,以對(duì)接不同的行業(yè)應(yīng)用需求,分為面向AI計(jì)算的CUDA-XAI和面向HPC計(jì)算的CUDA-XHPC。受益大模型熱潮,國(guó)內(nèi)AI服務(wù)器市場(chǎng)增量明顯。ChatGPT橫空出世,引發(fā)科技企業(yè)大模型競(jìng)賽,全球算力需求呈指數(shù)級(jí)增加,帶動(dòng)國(guó)內(nèi)AI服務(wù)器市場(chǎng)快速增長(zhǎng),以浪潮信息為主的國(guó)內(nèi)廠家占據(jù)國(guó)內(nèi)AI服務(wù)器主要市場(chǎng)。頭部廠商持續(xù)加單,國(guó)內(nèi)AI芯片需求強(qiáng)勁。全球頭部互聯(lián)網(wǎng)廠商相繼入局大模型賽道,以英偉達(dá)GPU為代表的算力核心產(chǎn)品訂單暴增,一批中國(guó)AI芯片企業(yè)立足于不同技術(shù)路徑開展研發(fā),面向云計(jì)算、汽車、智能家居等領(lǐng)域,國(guó)內(nèi)AI芯片市場(chǎng)同樣前景廣闊。大力發(fā)展硬件的同時(shí),軟件也是及其重要的一環(huán)。英偉達(dá)不僅在硬件方面具有統(tǒng)治力,在軟件平臺(tái)也具有很強(qiáng)的競(jìng)爭(zhēng)力,CUDA生態(tài)已成為行業(yè)標(biāo)的。對(duì)國(guó)內(nèi)企業(yè)而言,兼顧軟硬的發(fā)展路徑至關(guān)重要,大力發(fā)展算力的同時(shí),國(guó)產(chǎn)軟件生態(tài)的建立刻不容緩。共建生態(tài)開發(fā)平臺(tái),加速AI芯片落地。寒武紀(jì)不僅實(shí)現(xiàn)了終端、云端、邊緣端產(chǎn)品的完整布局,還為云邊端全系列智能芯片與處理器產(chǎn)品提供統(tǒng)一的平臺(tái)級(jí)基礎(chǔ)系統(tǒng)軟件CambriconNeuware,使開發(fā)的應(yīng)用可以在云邊端互相兼容,大幅減少云邊端不同平臺(tái)的開發(fā)和應(yīng)用遷移成本。華為同樣致力于“一平臺(tái)雙驅(qū)動(dòng)”為核心的昇騰AI生態(tài),已有200多家合作伙伴經(jīng)過(guò)認(rèn)證,圍繞昇騰的開發(fā)者超30萬(wàn),其中核心開發(fā)者超2000,并在100多所高校開展了昇騰的人工智能課程。HBM:需求暴增,產(chǎn)能緊缺HBM內(nèi)存技術(shù):新型高性能存儲(chǔ)產(chǎn)品的競(jìng)爭(zhēng)與短缺。HBM(HighBandwidthMemory,高帶寬內(nèi)存)是一款新型的CPU/GPU內(nèi)存芯片,是將多個(gè)DDR芯片堆疊在一起后和GPU封裝在一起,實(shí)現(xiàn)大容量和高位寬的DDR組合陣列。目前HBM占整個(gè)DRAM市場(chǎng)比重約1.5%,為新型高性能存儲(chǔ)產(chǎn)品,處于缺貨低庫(kù)存階段。SK海力士、三星、美光等存儲(chǔ)巨頭都在HBM領(lǐng)域展開了升級(jí)競(jìng)賽。SerDes作為底層接口技術(shù),是充分發(fā)揮AI硬件算力效能的關(guān)鍵。SerDes是Serializer/Deserializer的縮寫,即串行器和解串器,是目前主流的串行通信技術(shù)。通過(guò)數(shù)據(jù)在發(fā)送端并轉(zhuǎn)串—串行傳輸—在接收端串轉(zhuǎn)并,實(shí)現(xiàn)芯片間信號(hào)的有線傳輸。相比于傳統(tǒng)并行接口傳輸,SerDes具有更高的速率(Gbps級(jí))、更低的功耗,以及顯著的成本優(yōu)勢(shì),能夠滿足AI訓(xùn)練&推理等場(chǎng)景下高帶寬、低延遲的數(shù)據(jù)傳輸要求,適用于電信、汽車、工業(yè)等領(lǐng)域。PCB及載板:規(guī)格加速升級(jí),單機(jī)ASP持續(xù)上升OAM卡,是承載GPU加速卡片的PCB板,以NVIDIADGXH100服務(wù)器為例,其可搭載8顆GPU,顯著高于普通服務(wù)器,因此其PCB用量顯著高于普通服務(wù)器。AI服務(wù)器的OAM卡需要用更高層數(shù)的PCB板,價(jià)值量更大。由于AI服務(wù)器電路更加復(fù)雜,需要更大帶寬和更高傳輸速率,因此OAM需要更高層數(shù)PCB。NVIDIAOAM共兩個(gè)版本,SXM約需要20層PCB,而Pcle版本層數(shù)相對(duì)較少;相比傳統(tǒng)服務(wù)器,AI服務(wù)器的PCB層數(shù)更高,單臺(tái)PCB價(jià)值量大幅提升。AI服務(wù)器的OAM由于芯片性能的提升,對(duì)布線密度提出了更高要求。其需要4階及以上HDI加工工藝,根據(jù)靖邦電子,HDI板增加一階,成本增加18%左右,因此帶動(dòng)OAM的ASP上升。目前國(guó)內(nèi)企業(yè)鵬鼎控股、滬電股份、奧士康、勝宏科技等均有領(lǐng)先布局。交換機(jī):速率需求升級(jí),銳捷和新華三競(jìng)爭(zhēng)力提升數(shù)據(jù)流量快速增長(zhǎng)和人工智能快速發(fā)展推動(dòng)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)轉(zhuǎn)型,有望驅(qū)動(dòng)交換機(jī)數(shù)量和端口速率上行,高速以太網(wǎng)交換機(jī)市場(chǎng)有望實(shí)現(xiàn)強(qiáng)勁增長(zhǎng)。根據(jù)IDC預(yù)測(cè),中國(guó)25G端口交換機(jī)市場(chǎng)規(guī)模到2022年將達(dá)到4.4億美元,而100G交換機(jī)市場(chǎng)規(guī)模將達(dá)到13.87億美元。國(guó)內(nèi)交換機(jī)市場(chǎng)集中度較高,銳捷和新華三市場(chǎng)份額提升。根據(jù)IDC測(cè)算,2022前三個(gè)季度新華三、華為、星網(wǎng)銳捷三家市占率已經(jīng)超過(guò)80%,國(guó)產(chǎn)份額持續(xù)保持領(lǐng)先。03網(wǎng)絡(luò)連接:算力配套的核心,兼顧800G主線和擴(kuò)散行情800G主線:互聯(lián)帶寬快速提升,催化800G模塊需求網(wǎng)絡(luò)性能是決定AI集群算力效率的核心要素。根據(jù)阿姆達(dá)爾定律,并行系統(tǒng)節(jié)點(diǎn)數(shù)越多,而其通信占比越高,對(duì)整體系統(tǒng)運(yùn)行效率的影響越大。因此AI芯片的互聯(lián)帶寬都需要非常巨大,如H100互聯(lián)達(dá)到了900GB(1B=8bps)。以Nvidia歷代GPU為例,芯片互聯(lián)速率顯著提升,GPU互聯(lián)速率提升=nvlink自身單通道的升級(jí)*link的數(shù)量。芯片互聯(lián)性能持續(xù)提升,對(duì)于節(jié)點(diǎn)外的芯片互聯(lián),需要經(jīng)過(guò)數(shù)據(jù)中心網(wǎng)絡(luò),帶來(lái)網(wǎng)絡(luò)架構(gòu)的變革。以Nvidia的DGXH100集群為例,單節(jié)點(diǎn)服務(wù)器側(cè)(8卡)接入帶寬為3.2T,交換機(jī)側(cè)采用32*800G的交換機(jī)。核心要點(diǎn):1)在非Nvlink組網(wǎng)中,接入帶寬是由網(wǎng)卡的速率*網(wǎng)卡的個(gè)數(shù)決定的。2)Nvidia構(gòu)建的基本都是無(wú)阻塞的收斂比為1:1的架構(gòu)。3)實(shí)際上Nvidia的推薦方案中部分端口是閑置的,不能直接數(shù)交換機(jī)端口數(shù)。4)對(duì)于谷歌TPU、MI300等,也取決于接入網(wǎng)絡(luò)的帶寬到底是多少,有一個(gè)初始值,我們既可以算出不同層數(shù)下需要的800G端口數(shù)。數(shù)據(jù)中心底層硬件,保障高速高質(zhì)量信號(hào)傳輸。連接器作為連接系統(tǒng)、實(shí)現(xiàn)光/電信號(hào)傳輸交換所必需的基礎(chǔ)配件,廣泛應(yīng)用于通信、汽車、消費(fèi)電子、工業(yè)交通、航空航天、軍事等領(lǐng)域。傳輸高速高頻數(shù)據(jù)信號(hào)的同時(shí)須保證電路阻抗連續(xù)性好、串?dāng)_小、時(shí)延低、信號(hào)完整性高。數(shù)據(jù)中心連接新趨勢(shì)不斷涌現(xiàn),對(duì)連接器&線束性能要求持續(xù)提升。隨著數(shù)據(jù)中心規(guī)模不斷擴(kuò)大、組網(wǎng)模式日益復(fù)雜,研發(fā)更快速度、更高密度和更小型化的連接器以及更高集成度的線束成為行業(yè)技術(shù)發(fā)展的趨勢(shì)。連接器順應(yīng)光模塊迭代趨勢(shì)實(shí)現(xiàn)用量增長(zhǎng)。根據(jù)集成光纖數(shù)量的不同,常見的光模塊連接器可分為L(zhǎng)C接口和MPO/MTP接口,100G以下光模塊多使用LC接口,100G以上光模塊則需要光纖集成度更高的MPO/MTP接口(常用2~48芯)。隨著光模塊速率從100G/200G向400G/800G躍升,單個(gè)光模塊的通道數(shù)量增加,所需使用的單個(gè)連接器的通道密度&分支端連接器數(shù)量也增加,即需要更多的MPO/MTP連接器。04終端:邊緣算力建設(shè)加速,MR是最具潛力的Al終端谷歌PaLM2全面進(jìn)化,“大語(yǔ)言模型的小型化”迎重大突破。在谷歌I/O2023大會(huì)上,推出PaLM2,改進(jìn)了數(shù)學(xué)、代碼、推理、多語(yǔ)言翻譯和自然語(yǔ)言生成能力。PaLM2包含了4個(gè)不同參數(shù)的模型,包括壁虎(Gecko)、水獺(Otter)、野牛(Bison)和獨(dú)角獸(Unicorn。其中,PaLM2最輕量版本Gecko小到可以在手機(jī)上運(yùn)行。小型化模型將打破智能終端性能冗余窘境,終端接口的硬件性能將迎大升級(jí)。目前,以手機(jī)為代表的智能終端性能冗余,算力需求基本滿足目前應(yīng)用需求場(chǎng)景,導(dǎo)致終端消費(fèi)者換機(jī)動(dòng)力不足。而AI大語(yǔ)言模型的小型化發(fā)展,將帶來(lái)智能終端的再升級(jí)。在手機(jī)、MR、機(jī)器人等終端應(yīng)用上內(nèi)嵌部署AI模型,將迎來(lái)終端的核心架構(gòu)的變化,終端推理計(jì)算能力要求將大升級(jí),對(duì)應(yīng)存儲(chǔ)、傳輸、執(zhí)行、感知等硬件需求也將同步升級(jí)。MR:蘋果VisionPro震撼發(fā)布,最具潛力的AI終端VisionPro通過(guò)VST(videoseethrough)實(shí)現(xiàn)MR(數(shù)字與現(xiàn)實(shí)的混合)。VisionPro通過(guò)傳感器實(shí)時(shí)感知現(xiàn)實(shí)環(huán)境,將數(shù)字化的現(xiàn)實(shí)運(yùn)算后發(fā)給顯示屏

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論