人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析

上傳人：白*** IP屬地：湖南上傳時(shí)間：2023-09-30 格式：DOCX 頁(yè)數(shù)：9 大?。?8.45KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩4頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析01算力是智能世界的基礎(chǔ)，產(chǎn)業(yè)生態(tài)和投資圖譜逐步清晰算力是智能世界的基礎(chǔ)，基礎(chǔ)設(shè)施從云向算泛在演進(jìn)智能世界三要素：數(shù)據(jù)、算力、算法是智能世界三要素，其中算力平臺(tái)是核心基礎(chǔ)。算力兩大類：通用算力、HPC（高性能計(jì)算，High-performancecomputing）算力。其中通用算力計(jì)算量小，用于常規(guī)應(yīng)用。HPC算力是一個(gè)計(jì)算機(jī)集群系統(tǒng)，通過(guò)各種互聯(lián)技術(shù)將多個(gè)計(jì)算機(jī)系統(tǒng)連接在一起，利用所有被連接系統(tǒng)的綜合計(jì)算能力來(lái)處理大型計(jì)算問(wèn)題。算力基礎(chǔ)設(shè)施從云向算泛在演進(jìn)，其位置的分布從中心向邊緣和端側(cè)泛在延伸，將出現(xiàn)云、邊、端三級(jí)算力架構(gòu)。AI大模型帶動(dòng)算力需求超越摩爾定律增長(zhǎng)AI模型訓(xùn)練算力增長(zhǎng)速度超越芯片摩爾定律。AI訓(xùn)練任務(wù)中的算力增長(zhǎng)（所需算力每3.5個(gè)月翻一倍）已經(jīng)超越摩爾定律（晶體管數(shù)量每18月翻一倍）。ChatGPT僅推出兩個(gè)月，月活躍用戶數(shù)預(yù)計(jì)已達(dá)1億。ChatGPT在2023年1月達(dá)到1億月活躍用戶，平均每天有1,300多萬(wàn)訪客，用2個(gè)月時(shí)間達(dá)到1億月活數(shù)，成為史上最快達(dá)到1億月活躍用戶的應(yīng)用，TikTok、Instagram、Facebook、Twitter則分別用了9個(gè)月、2年半、4年半、5年的時(shí)間。MR、車載等數(shù)字經(jīng)濟(jì)新型應(yīng)用場(chǎng)景帶來(lái)新的算力需求MR的推出更帶來(lái)對(duì)低延時(shí)網(wǎng)絡(luò)傳輸和底層算力技術(shù)升級(jí)的需求。虛擬世界需要強(qiáng)大的圖像實(shí)時(shí)渲染能力、計(jì)算和存儲(chǔ)海量數(shù)據(jù)資源，頭顯交互設(shè)備的出現(xiàn)將進(jìn)一步增加對(duì)云計(jì)算和邊緣計(jì)算的應(yīng)用需求。云計(jì)算能將終端渲染逐步遷移至云端，基于規(guī)模效應(yīng)攤低運(yùn)算成本，提升服務(wù)器使用效率，提升虛擬世界的可進(jìn)入性。而邊緣計(jì)算則更能滿足實(shí)時(shí)數(shù)據(jù)分析需求、緩解中心云的計(jì)算負(fù)載。汽車智能化需求持續(xù)升級(jí)帶來(lái)數(shù)據(jù)流量的急劇飆升。隨著自動(dòng)駕駛等級(jí)提升，車載信息娛樂(lè)系統(tǒng)、長(zhǎng)續(xù)航電池及5G網(wǎng)絡(luò)的引入，車輛要面對(duì)的計(jì)算量越來(lái)越大，網(wǎng)絡(luò)架構(gòu)升級(jí)、本地實(shí)時(shí)處理能力、“大容量緩存和存儲(chǔ)”規(guī)格將成為硬需求。中美算力布局較為領(lǐng)先，中國(guó)智能算力在追趕智能算力規(guī)模和增速亮眼。根據(jù)信通院算力白皮書，2021年全球算力增速超過(guò)40%，華為GIV預(yù)測(cè)2030年人類將迎來(lái)YB數(shù)據(jù)時(shí)代，全球算力平均年增速達(dá)到65%,其中基礎(chǔ)算力平均年增速達(dá)27%;智能算力占大頭,平均年增速超過(guò)80%;超算算力平均年增速超過(guò)34%。中美算力在全球?qū)儆陬I(lǐng)先地位。美國(guó)、中國(guó)、歐洲、日本在全球算力規(guī)模中的份額分別為34%、33%、14%和5%，其中全球基礎(chǔ)算力美國(guó)份額達(dá)37%，中國(guó)以26%份額排名第二;智能算力方面，中國(guó)、美國(guó)分別占比為45%和28%；美國(guó)、日本、中國(guó)在超級(jí)計(jì)算綜合性能指標(biāo)方面份額分別為48%、22%、18%。02基礎(chǔ)設(shè)備：數(shù)據(jù)中心加速升級(jí)，芯片PCB等上游部件量?jī)r(jià)齊升AI服務(wù)器采用異構(gòu)式架構(gòu)，GPU數(shù)量遠(yuǎn)高于普通服務(wù)器。AI服務(wù)器和普通服務(wù)器的主要區(qū)別在于：1）架構(gòu)不同，AI服務(wù)器采用CPU+GPU/FPGA/ASIC等異構(gòu)式架構(gòu)，而普通服務(wù)器一般是CPU架構(gòu)；2）GPU數(shù)量差別巨大，AI服務(wù)器單服務(wù)器GPU用量通常在4顆以上。例如：NVIDIADGXA100包括8個(gè)A100GPU+2個(gè)AMDRomeCPU，而浪潮英信服務(wù)器NF5280M6僅配置1-2個(gè)英特爾第三代Xeon處理器。GPU架構(gòu)為主流加速架構(gòu)，是服務(wù)器核心成本構(gòu)成。GPU采用并行計(jì)算，適用于處理密集型運(yùn)算，如圖形渲染、機(jī)器學(xué)習(xí)等場(chǎng)景，AI算力需求的提升推動(dòng)了GPU卡的運(yùn)算速度和用量需求進(jìn)一步增長(zhǎng)。根據(jù)IDC數(shù)據(jù)，2022年GPU加速卡占據(jù)AI市場(chǎng)89%的份額，在機(jī)器學(xué)習(xí)型服務(wù)器中GPU成本占比達(dá)72.8%。高速互連技術(shù)開創(chuàng)者，多卡互聯(lián)優(yōu)勢(shì)顯著。為實(shí)現(xiàn)超算模型的高速通信需求，英偉達(dá)開創(chuàng)式提出NVLink和NVSwitch技術(shù)：NVLink主要用于連接多個(gè)GPU，以加速高性能計(jì)算和深度學(xué)習(xí)等應(yīng)用；NVSwitch用于連接多個(gè)GPU和CPU，形成高性能計(jì)算系統(tǒng)，適用于更復(fù)雜和大規(guī)模的場(chǎng)景，用戶可根據(jù)具體應(yīng)用需求和系統(tǒng)配置來(lái)決定使用NVLink或NVSwitch。GH200超級(jí)芯片所采用的NVLink-C2C技術(shù)，通過(guò)Chiplet工藝將CPU+GPU組合到同一封裝，相比于PCIe5在能效方面提升25倍，面積效率提升90倍。CUDA生態(tài)不斷演進(jìn)，滿足各類行業(yè)需求。英偉達(dá)依托于CUDA軟件棧進(jìn)行第三方應(yīng)用及工具的擴(kuò)展，形成了廣義的CUDA生態(tài)，并在此基礎(chǔ)上向上擴(kuò)展出CUDA-X，以對(duì)接不同的行業(yè)應(yīng)用需求，分為面向AI計(jì)算的CUDA-XAI和面向HPC計(jì)算的CUDA-XHPC。受益大模型熱潮，國(guó)內(nèi)AI服務(wù)器市場(chǎng)增量明顯。ChatGPT橫空出世，引發(fā)科技企業(yè)大模型競(jìng)賽，全球算力需求呈指數(shù)級(jí)增加，帶動(dòng)國(guó)內(nèi)AI服務(wù)器市場(chǎng)快速增長(zhǎng)，以浪潮信息為主的國(guó)內(nèi)廠家占據(jù)國(guó)內(nèi)AI服務(wù)器主要市場(chǎng)。頭部廠商持續(xù)加單，國(guó)內(nèi)AI芯片需求強(qiáng)勁。全球頭部互聯(lián)網(wǎng)廠商相繼入局大模型賽道，以英偉達(dá)GPU為代表的算力核心產(chǎn)品訂單暴增，一批中國(guó)AI芯片企業(yè)立足于不同技術(shù)路徑開展研發(fā)，面向云計(jì)算、汽車、智能家居等領(lǐng)域，國(guó)內(nèi)AI芯片市場(chǎng)同樣前景廣闊。大力發(fā)展硬件的同時(shí)，軟件也是及其重要的一環(huán)。英偉達(dá)不僅在硬件方面具有統(tǒng)治力，在軟件平臺(tái)也具有很強(qiáng)的競(jìng)爭(zhēng)力，CUDA生態(tài)已成為行業(yè)標(biāo)的。對(duì)國(guó)內(nèi)企業(yè)而言，兼顧軟硬的發(fā)展路徑至關(guān)重要，大力發(fā)展算力的同時(shí)，國(guó)產(chǎn)軟件生態(tài)的建立刻不容緩。共建生態(tài)開發(fā)平臺(tái)，加速AI芯片落地。寒武紀(jì)不僅實(shí)現(xiàn)了終端、云端、邊緣端產(chǎn)品的完整布局，還為云邊端全系列智能芯片與處理器產(chǎn)品提供統(tǒng)一的平臺(tái)級(jí)基礎(chǔ)系統(tǒng)軟件CambriconNeuware，使開發(fā)的應(yīng)用可以在云邊端互相兼容，大幅減少云邊端不同平臺(tái)的開發(fā)和應(yīng)用遷移成本。華為同樣致力于“一平臺(tái)雙驅(qū)動(dòng)”為核心的昇騰AI生態(tài)，已有200多家合作伙伴經(jīng)過(guò)認(rèn)證，圍繞昇騰的開發(fā)者超30萬(wàn)，其中核心開發(fā)者超2000，并在100多所高校開展了昇騰的人工智能課程。HBM：需求暴增，產(chǎn)能緊缺HBM內(nèi)存技術(shù)：新型高性能存儲(chǔ)產(chǎn)品的競(jìng)爭(zhēng)與短缺。HBM（HighBandwidthMemory，高帶寬內(nèi)存）是一款新型的CPU/GPU內(nèi)存芯片，是將多個(gè)DDR芯片堆疊在一起后和GPU封裝在一起，實(shí)現(xiàn)大容量和高位寬的DDR組合陣列。目前HBM占整個(gè)DRAM市場(chǎng)比重約1.5%，為新型高性能存儲(chǔ)產(chǎn)品，處于缺貨低庫(kù)存階段。SK海力士、三星、美光等存儲(chǔ)巨頭都在HBM領(lǐng)域展開了升級(jí)競(jìng)賽。SerDes作為底層接口技術(shù)，是充分發(fā)揮AI硬件算力效能的關(guān)鍵。SerDes是Serializer/Deserializer的縮寫，即串行器和解串器，是目前主流的串行通信技術(shù)。通過(guò)數(shù)據(jù)在發(fā)送端并轉(zhuǎn)串—串行傳輸—在接收端串轉(zhuǎn)并，實(shí)現(xiàn)芯片間信號(hào)的有線傳輸。相比于傳統(tǒng)并行接口傳輸，SerDes具有更高的速率（Gbps級(jí)）、更低的功耗，以及顯著的成本優(yōu)勢(shì)，能夠滿足AI訓(xùn)練&推理等場(chǎng)景下高帶寬、低延遲的數(shù)據(jù)傳輸要求，適用于電信、汽車、工業(yè)等領(lǐng)域。PCB及載板：規(guī)格加速升級(jí)，單機(jī)ASP持續(xù)上升OAM卡，是承載GPU加速卡片的PCB板，以NVIDIADGXH100服務(wù)器為例，其可搭載8顆GPU，顯著高于普通服務(wù)器，因此其PCB用量顯著高于普通服務(wù)器。AI服務(wù)器的OAM卡需要用更高層數(shù)的PCB板，價(jià)值量更大。由于AI服務(wù)器電路更加復(fù)雜，需要更大帶寬和更高傳輸速率，因此OAM需要更高層數(shù)PCB。NVIDIAOAM共兩個(gè)版本，SXM約需要20層PCB，而Pcle版本層數(shù)相對(duì)較少；相比傳統(tǒng)服務(wù)器，AI服務(wù)器的PCB層數(shù)更高，單臺(tái)PCB價(jià)值量大幅提升。AI服務(wù)器的OAM由于芯片性能的提升，對(duì)布線密度提出了更高要求。其需要4階及以上HDI加工工藝，根據(jù)靖邦電子，HDI板增加一階，成本增加18%左右，因此帶動(dòng)OAM的ASP上升。目前國(guó)內(nèi)企業(yè)鵬鼎控股、滬電股份、奧士康、勝宏科技等均有領(lǐng)先布局。交換機(jī)：速率需求升級(jí)，銳捷和新華三競(jìng)爭(zhēng)力提升數(shù)據(jù)流量快速增長(zhǎng)和人工智能快速發(fā)展推動(dòng)數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)轉(zhuǎn)型，有望驅(qū)動(dòng)交換機(jī)數(shù)量和端口速率上行，高速以太網(wǎng)交換機(jī)市場(chǎng)有望實(shí)現(xiàn)強(qiáng)勁增長(zhǎng)。根據(jù)IDC預(yù)測(cè)，中國(guó)25G端口交換機(jī)市場(chǎng)規(guī)模到2022年將達(dá)到4.4億美元，而100G交換機(jī)市場(chǎng)規(guī)模將達(dá)到13.87億美元。國(guó)內(nèi)交換機(jī)市場(chǎng)集中度較高，銳捷和新華三市場(chǎng)份額提升。根據(jù)IDC測(cè)算，2022前三個(gè)季度新華三、華為、星網(wǎng)銳捷三家市占率已經(jīng)超過(guò)80%，國(guó)產(chǎn)份額持續(xù)保持領(lǐng)先。03網(wǎng)絡(luò)連接：算力配套的核心，兼顧800G主線和擴(kuò)散行情800G主線：互聯(lián)帶寬快速提升，催化800G模塊需求網(wǎng)絡(luò)性能是決定AI集群算力效率的核心要素。根據(jù)阿姆達(dá)爾定律，并行系統(tǒng)節(jié)點(diǎn)數(shù)越多，而其通信占比越高，對(duì)整體系統(tǒng)運(yùn)行效率的影響越大。因此AI芯片的互聯(lián)帶寬都需要非常巨大，如H100互聯(lián)達(dá)到了900GB（1B=8bps）。以Nvidia歷代GPU為例，芯片互聯(lián)速率顯著提升，GPU互聯(lián)速率提升=nvlink自身單通道的升級(jí)*link的數(shù)量。芯片互聯(lián)性能持續(xù)提升，對(duì)于節(jié)點(diǎn)外的芯片互聯(lián)，需要經(jīng)過(guò)數(shù)據(jù)中心網(wǎng)絡(luò)，帶來(lái)網(wǎng)絡(luò)架構(gòu)的變革。以Nvidia的DGXH100集群為例，單節(jié)點(diǎn)服務(wù)器側(cè)（8卡）接入帶寬為3.2T，交換機(jī)側(cè)采用32*800G的交換機(jī)。核心要點(diǎn)：1）在非Nvlink組網(wǎng)中，接入帶寬是由網(wǎng)卡的速率*網(wǎng)卡的個(gè)數(shù)決定的。2）Nvidia構(gòu)建的基本都是無(wú)阻塞的收斂比為1:1的架構(gòu)。3）實(shí)際上Nvidia的推薦方案中部分端口是閑置的，不能直接數(shù)交換機(jī)端口數(shù)。4）對(duì)于谷歌TPU、MI300等，也取決于接入網(wǎng)絡(luò)的帶寬到底是多少，有一個(gè)初始值，我們既可以算出不同層數(shù)下需要的800G端口數(shù)。數(shù)據(jù)中心底層硬件，保障高速高質(zhì)量信號(hào)傳輸。連接器作為連接系統(tǒng)、實(shí)現(xiàn)光/電信號(hào)傳輸交換所必需的基礎(chǔ)配件，廣泛應(yīng)用于通信、汽車、消費(fèi)電子、工業(yè)交通、航空航天、軍事等領(lǐng)域。傳輸高速高頻數(shù)據(jù)信號(hào)的同時(shí)須保證電路阻抗連續(xù)性好、串?dāng)_小、時(shí)延低、信號(hào)完整性高。數(shù)據(jù)中心連接新趨勢(shì)不斷涌現(xiàn)，對(duì)連接器&線束性能要求持續(xù)提升。隨著數(shù)據(jù)中心規(guī)模不斷擴(kuò)大、組網(wǎng)模式日益復(fù)雜，研發(fā)更快速度、更高密度和更小型化的連接器以及更高集成度的線束成為行業(yè)技術(shù)發(fā)展的趨勢(shì)。連接器順應(yīng)光模塊迭代趨勢(shì)實(shí)現(xiàn)用量增長(zhǎng)。根據(jù)集成光纖數(shù)量的不同，常見的光模塊連接器可分為L(zhǎng)C接口和MPO/MTP接口，100G以下光模塊多使用LC接口，100G以上光模塊則需要光纖集成度更高的MPO/MTP接口（常用2~48芯）。隨著光模塊速率從100G/200G向400G/800G躍升，單個(gè)光模塊的通道數(shù)量增加，所需使用的單個(gè)連接器的通道密度&分支端連接器數(shù)量也增加，即需要更多的MPO/MTP連接器。04終端：邊緣算力建設(shè)加速，MR是最具潛力的Al終端谷歌PaLM2全面進(jìn)化，“大語(yǔ)言模型的小型化”迎重大突破。在谷歌I/O2023大會(huì)上，推出PaLM2，改進(jìn)了數(shù)學(xué)、代碼、推理、多語(yǔ)言翻譯和自然語(yǔ)言生成能力。PaLM2包含了4個(gè)不同參數(shù)的模型，包括壁虎（Gecko）、水獺（Otter）、野牛（Bison）和獨(dú)角獸（Unicorn。其中，PaLM2最輕量版本Gecko小到可以在手機(jī)上運(yùn)行。小型化模型將打破智能終端性能冗余窘境，終端接口的硬件性能將迎大升級(jí)。目前，以手機(jī)為代表的智能終端性能冗余，算力需求基本滿足目前應(yīng)用需求場(chǎng)景，導(dǎo)致終端消費(fèi)者換機(jī)動(dòng)力不足。而AI大語(yǔ)言模型的小型化發(fā)展，將帶來(lái)智能終端的再升級(jí)。在手機(jī)、MR、機(jī)器人等終端應(yīng)用上內(nèi)嵌部署AI模型，將迎來(lái)終端的核心架構(gòu)的變化，終端推理計(jì)算能力要求將大升級(jí)，對(duì)應(yīng)存儲(chǔ)、傳輸、執(zhí)行、感知等硬件需求也將同步升級(jí)。MR：蘋果VisionPro震撼發(fā)布，最具潛力的AI終端VisionPro通過(guò)VST（videoseethrough）實(shí)現(xiàn)MR（數(shù)字與現(xiàn)實(shí)的混合）。VisionPro通過(guò)傳感器實(shí)時(shí)感知現(xiàn)實(shí)環(huán)境，將數(shù)字化的現(xiàn)實(shí)運(yùn)算后發(fā)給顯示屏

人人文庫(kù)> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

人工智能行業(yè)AI算力市場(chǎng)簡(jiǎn)析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔