




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
正文目錄TOC\o"1-2"\h\z\u一、 數(shù)字經(jīng)濟、AI、智能駕駛視角下看算力需求 5演變趨勢:從通用計算到智能計算,從分散獨立到云網(wǎng)邊協(xié)同 5戰(zhàn)略地位:算力屬于基礎(chǔ)設施建設,是智能時代發(fā)展的物理承載 6應用驅(qū)動:數(shù)字經(jīng)濟搭建整體框架,AI大模型、智能駕駛持續(xù)拉升 7優(yōu)化路徑:提升芯片性能及創(chuàng)新存算架構(gòu)是研究主流 10二、 算力需求視角下看GPU發(fā)展的必然趨勢 12性能:GPU技術(shù)發(fā)展迅速,高并發(fā)計算能力契合算力需求 12靈活性:GPU可編程優(yōu)勢明顯,通用靈活性適配AI應用端拓展 15三、 GPU市場:供給推動市場,技術(shù)及產(chǎn)能是核心驅(qū)動力 18需求端:移動端兜底,自動駕駛及數(shù)據(jù)中心建設貢獻增量 18供給端:英偉達獨占鰲頭,國內(nèi)技術(shù)追趕空間廣闊 24GPU產(chǎn)業(yè)鏈概況及國內(nèi)重點公司介紹 31風險提示 35圖表目錄圖1:算力建設已成為經(jīng)濟發(fā)展的重要競爭策略 5圖2:各類高性能計算、智能計算可以通過云邊端架構(gòu)形成算力網(wǎng)絡 6圖3:人工智能三要素為算法、算力、數(shù)據(jù) 6圖4:算力發(fā)展的核心要素、產(chǎn)品及應用 6圖5:全球數(shù)據(jù)產(chǎn)生量高速增長 7圖6:全球算力規(guī)模將高速增長 7圖7:2017-2023年中國數(shù)字經(jīng)濟規(guī)模變化 8圖8:我國在用數(shù)據(jù)中心機架規(guī)模保持增長 8圖9:AI大模型尺寸快速增長 9圖10:大模型時代的GPU算力快速增長 9圖11:智能駕駛車輛的滲透率 10圖12:L5智能駕駛算力需求超1000TOPS 10圖13:我國智能駕駛市場算力需求測算 10圖14:算力性能主要受處理器性能及數(shù)據(jù)傳輸制約 11圖15:2016-2018年,CPU性能每年提升僅3.5 12圖16:CPU架構(gòu) 13圖17:GPU架構(gòu)擁有更多的邏輯核心 13圖18:第一款以GPU命名的芯片GEFORCE256 14圖19:GPU經(jīng)典工作流程 14圖20:V100混合精度運算速度提高了9倍 15圖21:英偉達第四代FP8TENSORCORE 15圖22:常用的主流計算平臺靈活性及性能的比較 16圖23:芯片研發(fā)成本 17圖24:不同部署位置的AI芯片要求 17圖25:英偉達CUDA-XAI生態(tài)支持多種框架、云計算服務、部署 18圖26:GPU市場下游需求 19圖27:PC市場處于下行周期(含平板) 19圖28:PC端桌面顯卡出銷量及同比 19圖29:全球移動游戲市場占比增加(十億美元) 20圖30:基于終端感知的混合AI 21圖31:部分AI模型可從云端分流到終端 21圖32:車載芯片的演變 21圖33:中央計算平臺須采用高算力芯片以進行整車功能、算力/存儲等資源部署 22圖34:2025年芯片平均算力將超2000TOPS 23圖35:2025年全球高性能計算市場規(guī)模達199億美元 23圖36:TOP500超算中心56算力由GPU提供 23圖37:AI服務器對于GPU需求更高 24圖38:2025年全球AI服務器市場規(guī)模激增至1350億美元 24圖39:全球GPU市場格局變化 25圖40:國內(nèi)部分GPU廠商市場布局 25圖41:英偉達游戲產(chǎn)品矩陣 25圖42:英偉達游戲業(yè)務營收增長 26圖43:2023Q2全球PC顯卡市場份額 26圖44:英偉達數(shù)據(jù)中心產(chǎn)品矩陣 27圖45:英偉達第四代NVLINK能為H100提升1.5倍帶寬 28圖46:英偉達數(shù)據(jù)中心業(yè)務營收增長 29圖47:高性能計算芯片下游需求 29圖48:英偉達自動駕駛產(chǎn)品矩陣 30圖49:英偉達THOR芯片計算性能提升 30圖50:英偉達智能駕駛業(yè)務營收增長 31圖51:2023年度H1中國市場乘用車自動駕駛計算方案市場份額 31圖52:GPU產(chǎn)業(yè)中下游分別為芯片設計、制造、封裝與測試 32圖53:公司營收及同比增速 33圖54:公司歸母凈利潤及同比增速 33圖55:公司營收及同比增速 34圖56:公司歸母凈利潤及同比增速 34表格1:我國出臺多項算力建設政策支持數(shù)字經(jīng)濟發(fā)展 8表格2:不同語言模型的算力需求及參數(shù)數(shù)量 9表格3:英偉達GPU架構(gòu)調(diào)整演進方向 14表格4:GPU、DSA、ASIC比較(以CPU為基準) 17表格5:SOC推動高性能GPU移動端應用 20表格6:目前主流的車規(guī)級芯片架構(gòu) 23表格7:游戲產(chǎn)品增強技術(shù) 25表格8:國內(nèi)廠商桌面級顯卡產(chǎn)品參數(shù)對比 26表格9:英偉達H100產(chǎn)品技術(shù) 27表格10:國內(nèi)廠商高性能計算GPU產(chǎn)品參數(shù)對比 28表格11:國內(nèi)部分車型搭載芯片型號 30表格12:國內(nèi)重點GPU公司及技術(shù) 32表格13:景嘉微定向增發(fā)擬建設項目 33表格14:相關(guān)公司可比估值 34一、數(shù)字經(jīng)濟、AI、智能駕駛視角下看算力需求演變趨勢:從通用計算到智能計算,從分散獨立到云網(wǎng)邊協(xié)同1964年戈登CPU的競爭焦點。圖1:算力建設已成為經(jīng)濟發(fā)展的重要競爭策略資料來源:數(shù)字電子技術(shù),資源服務可以分為云計算、混合計算及算力網(wǎng)絡。科學、工程計算。這類計算主要利用超級計算機實現(xiàn)并行計算,是一種算法優(yōu)化和支持人工智能、智慧城市等新興領(lǐng)域。AI領(lǐng)域模型訓練WorldWide萬維網(wǎng)任務的分解及高效調(diào)度。圖2:各類高性能計算、智能計算可以通過云邊端架構(gòu)形成算力網(wǎng)絡資料來源:華為官網(wǎng),金融界,戰(zhàn)略地位:算力屬于基礎(chǔ)設施建設,是智能時代發(fā)展的物理承載整體架構(gòu)層面,算法、算力及數(shù)據(jù)是實現(xiàn)人工智能的三要素,其中算力是構(gòu)筑智能時代的物理基礎(chǔ)。人工智能離不開算力、算法及數(shù)據(jù),其發(fā)展需要在建立在龐大的數(shù)據(jù)集、優(yōu)秀的深度學習算法及強大的計算能力基礎(chǔ)之上,而算力作為底層基礎(chǔ)設施,是開啟智能時代的關(guān)鍵因素,其核心于智能芯片的技術(shù)進步。圖3:人工智能三要素為算法、算力、數(shù)據(jù)圖4:算力發(fā)展的核心要素、產(chǎn)品及應用資料來源:中國科普網(wǎng), 資料來源:中國電子商會,算力荒”IDC顯示,2018201933ZB、41ZB2020年全球數(shù)據(jù)60ZB46%求宏觀算力快速發(fā)展,NTCysd2021-202840%的速度增長,20287510EFlops。圖5:全球數(shù)據(jù)產(chǎn)生量高速增長 圖6:全球算力規(guī)模將高速增長0
全球數(shù)據(jù)量變化趨勢(ZB,左軸同比增長(,右軸)2015201620172018201920202025E
100%80%60%40%20%0%
0
全球算力規(guī)模(Eflops,左軸同比增速(,右軸)2023E2024E2025E2026E2027E2028E
60%50%40%30%20%10%0%資料來源:IDC, 資料來源:NTCysd,應用驅(qū)動:數(shù)字經(jīng)濟搭建整體框架,AIAI率先落地,成為拉動算力需求的核心驅(qū)動力。全球正加快數(shù)字經(jīng)濟建設,算力發(fā)展成為主要戰(zhàn)略競爭點之一。目前,全球正處于經(jīng)濟數(shù)字化轉(zhuǎn)型階段GDP的核心戰(zhàn)略,具體數(shù)據(jù)來看,202047個國家數(shù)字經(jīng)濟增32.6GDP43.7%3%2022國數(shù)字經(jīng)濟規(guī)模已達50.2億元,數(shù)字基礎(chǔ)設施規(guī)模能級大幅提升,在用數(shù)據(jù)中心算例總規(guī)模超180EFlops,位居世界第二。圖7:2017-2023年中國數(shù)字經(jīng)濟規(guī)模變化 圖8:我國在用數(shù)據(jù)中心機架規(guī)模保持增長市場規(guī)模(萬億元,左軸同比增長(,右軸)60504030201002017201820192020202120222023E
20%16%12%8%4%0%
0
數(shù)量(萬架,左軸)同比增長(,右軸201720182019202020212022
50%40%30%20%10%0%資料來源:中國信通院,國家網(wǎng)信辦《數(shù)字中國發(fā)展報告(2022年)》,中商產(chǎn)業(yè)研究院,
資料來源:工信部,表格1:我國出臺多項算力建設政策支持數(shù)字經(jīng)濟發(fā)展時間 文件 算力建設內(nèi)容時間 文件 算力建設內(nèi)容2021.05
新體系算力樞紐實施方案》
量供給、數(shù)據(jù)高效率流通的大數(shù)據(jù)發(fā)展高地。2021.072021.112021.122021.12
劃(2021-2023)》規(guī)劃》劃》劃》
3碳、算力規(guī)模與數(shù)字經(jīng)濟增長相適應的新型數(shù)據(jù)中心發(fā)展格局。2025(每秒百億億次浮點運算)300,27。推進云網(wǎng)協(xié)同和算網(wǎng)融合發(fā)展。加快構(gòu)建算力、算法、數(shù)據(jù)、應用資源協(xié)同的全國一體化大數(shù)據(jù)中心體系。3。系統(tǒng)優(yōu)化算力基礎(chǔ)設施布局,促進東西部算力高效2023.02 《數(shù)字中國建設整體布局規(guī)劃》資料來源:國務院,工信部,
能計算中心、邊緣數(shù)據(jù)中心等合理梯次布局。AI大模型的快速擴張是算力需求的關(guān)鍵驅(qū)動力。AIAI膨脹,GPUOpenAI175B相比Small(Flops)1400倍;而據(jù)Semianalysis最1201.8萬億參175B10倍。圖9:AI大模型尺寸快速增長 圖10:大模型時代的GPU算力快速增長 資料來源:《ASurveyofLarge-ScaleDeepLearningServingSystemOptimization:ChallengesandOpportunities》,
資料來源:《ASurveyofLarge-ScaleDeepLearningServingSystemOptimization:ChallengesandOpportunities》,表格2:不同語言模型的算力需求及參數(shù)數(shù)量模型 總計算力(模型 總計算力(PFlops- 總計算力(Flops) 參數(shù)量(百萬)day)Small2.08E+001.80E+2060Base7.64E+006.60E+20220T5 Large2.67E+012.31E+217703B1.04E+029.00E+21300011B3.82E+023.30E+2211000Base1.89E+001.64E+20109Large6.16E+005.33E+20355Base1.74E+011.50E+21125Large4.93E+014.26E+21355Small2.60E+002.25E+20125Medium7.42E+006.41E+20356GPT-3 Large1.58E+011.37E+21760XL2.75E+012.28E+211320175B3.64E+033.14E+23174600資料來源:OpenAI《LanguageModelsareFew-ShotLearners》,汽車智能化功能升級,智能駕駛將貢獻算力需求的全新增量。L3L5級14%、1%203040%、12%。而L330-60TOPS、100TOPS,未來隨著智能駕駛汽車滲透率的提升,將會持續(xù)帶動智能駕駛市場整體算202520301.9萬、19TOPS,2021-2025CAGR。圖11:智能駕駛車輛的滲透率 圖12:L5智能駕駛算力需求超1000TOPS
L3L4/L5L3L4/L5
0
400040003201000100L1 L2 L3 L4 L5資料來源:華經(jīng)產(chǎn)業(yè)研究院, 資料來源:億歐智庫,地平線官網(wǎng),圖13:我國智能駕駛市場算力需求測算0
算力需求(萬TOPS) 同比增長()2020 2021 2022E 2023E 2024E 2025E
350%300%250%200%150%100%50%0%資料來源:中汽協(xié),華經(jīng)產(chǎn)業(yè)研究院,億歐智庫,優(yōu)化路徑:提升芯片性能及創(chuàng)新存算架構(gòu)是研究主流系統(tǒng)算力主要受處理器性能與數(shù)據(jù)傳輸能力影響,當數(shù)據(jù)處理能力與傳輸能力不匹配時,計算能力由兩者中較低者決定。處理性能主要與指令復雜程度、頻率、并行度有關(guān),一般來說,指令越復雜、計算頻率越高、并行程度越大,處理器性能就越好;而數(shù)據(jù)傳輸?shù)哪芰εc處理器內(nèi)部存算架構(gòu)有關(guān),在計算機體系里,根據(jù)訪問延遲及容量大小將存儲結(jié)構(gòu)分為寄存器、緩存、內(nèi)存、外存與遠程存儲,而這種存算分離的架構(gòu)形式,通常使得數(shù)據(jù)傳輸成為限制系統(tǒng)算力的因素。圖14:算力性能主要受處理器性能及數(shù)據(jù)傳輸制約資料來源:SDNLAB,指令的復雜程度。指令系統(tǒng)是連接計算機軟件和硬件的橋梁,一般來說,指令的復CPUGPUFPGADSACPU硬件加速平臺,用于執(zhí)行各類復雜指令。CPU數(shù)據(jù)傳輸能力。數(shù)據(jù)傳輸能力并不直接影響處理器性能,但復雜的存儲分層結(jié)構(gòu)會據(jù)傳輸能力的優(yōu)化方向主要包括近存計算及存算一體化架構(gòu)。二、算力需求視角下看GPU發(fā)展的必然趨勢性能:GPU橫向比較,GPUCPU而言,更符合深度學習算法的高度并行計算需求。一方面,CPU性能提升已達到瓶頸,與高速增長的算力需求脫節(jié)。CPU作為第一代高效計算平臺,目前無論從不管是從架構(gòu)/微架構(gòu)設計、工藝、多核并行等各種角度出發(fā),其性能都難以提升,2016年之后,CPU性能每年提升僅3.5%。隨著數(shù)字經(jīng)濟、AI大模型、智能駕駛等算力需求的推動,CPU性能已無法滿足上層軟件算力需求。15:2016-2018CPU3.5資料來源:computerarchitecture:Aquantitativeapproach,CPUSIMD架CPUMIMD可以用來處理復雜的控制邏輯、預測分支、亂序執(zhí)行、多級流水等,而GPU為數(shù)據(jù)級并行的SIMD架構(gòu),其核心多但性能弱,用于優(yōu)化具有簡單控制邏輯的數(shù)據(jù)并行任務。GPUGPU,不僅能夠更快的完成數(shù)據(jù)的讀取與寫入,還能實行多條指令并行計算。圖16:CPU架構(gòu) 圖17:GPU架構(gòu)擁有更多的邏輯核心資料來源:Imagination官網(wǎng), 資料來源:Imagination官網(wǎng),縱向比較,GPU架構(gòu)技術(shù)仍在演進,其高性能計算與智能計算能力不斷優(yōu)化GPUProcessingUnit),1999GeForce256圖形處理芯片時首GPU的概念,GeForce256T&LCPU的依賴。GPU組成中通常包含一VRAM、一個顯存速率以及一個顯存位寬。圖第一款以GPU命名的芯片GeForce256 圖19:GPU經(jīng)典工作流程資料來源:電動星球News, 資料來源:電子發(fā)燒友,GPUGPUGPUGPGPU。2008-202282010GPUFermi2017HopperGPUAI大模型訓練與推理環(huán)節(jié)。表格3:英偉達GPU架構(gòu)調(diào)整演進方向構(gòu)架代號 時間 納米制程 核心參數(shù) 特點 代表型號構(gòu)架代號 時間 納米制程 核心參數(shù) 特點 代表型號Fermi2010 完整GPU架構(gòu) Quadro700030億晶體管 個Cuda內(nèi)核Kepler28nm 15個SMFermi2010 完整GPU架構(gòu) Quadro700030億晶體管 個Cuda內(nèi)核Kepler28nm 15個SM,每個SM包括 支持GPUDirect技 K80201271億晶體管 192個FP32和64個FP64 術(shù) K40MMaxwell28nm 24個SM,每個SM包括 M50002014 -80億晶體管 128個FP32與4個FP64 M4000PascalP10016nm 56個MM包括642016 NVlink一代 GTX1080152億晶體管 個FP32與32個FP64P6000Volta80個M每個M包括32 推出Tenor內(nèi)核,12nm V1002017 個FP64、64個INT32、64 滿足深度學習與AI211億晶體管個FP32、8個Tensor內(nèi)核運算TiTanVTU10272SM,每個Turing 2018 SM64INT32、64個FP32、8個Tensor內(nèi)核二代Tensor內(nèi)核T42080TIRTX500012nm186億晶體管Ampere 2020Hopper
7nm283億晶體管4nm800億晶體管
A100108SMSM32FP6464INT32、64FP32、4Tensor內(nèi)核H100132SMSM64FP6464INT32、128FP32、4Tensor內(nèi)核
Tensor結(jié)構(gòu)稀疏性MIG1.04nm工藝Tensor內(nèi)核結(jié)構(gòu)稀疏性矩陣MIG2.0
A100A303090H100資料來源:英偉達官網(wǎng)歷代架構(gòu)白皮書,AI模型推理的關(guān)鍵張量核心。英偉達架構(gòu)上推出,在后續(xù)推出的TuringAmpereHopperV100P1009核心其FP8性能較AmpereFP616倍,AIAmpere30倍。圖20:V100混合精度運算速度提高了9倍圖21:英偉達第四代FP8Tensorcore 資料來源:微型計算機雜志, 資料來源:英偉達官網(wǎng),靈活性:GPUAIGPU擁有相對較優(yōu)的性能及靈活性。CPU、FPGA、GPU、DSACPU為軟件加速CPU平臺的硬件實現(xiàn)與軟件編程完全解耦,靈活性最高;ASIC圖22:常用的主流計算平臺靈活性及性能的比較資料來源:SDNLAB,ASICDSADSAASICASICASICASICDSAASICDSA的應用領(lǐng)域,與芯片高企的研發(fā)成本相矛盾。5ASICDSAAI應用領(lǐng)域,ASICDSAAI應用及算法迭代優(yōu)化的速度。特點算力通用性()芯片圖23:芯片研發(fā)成本 表格4:GPU、DSA、ASIC特點算力通用性()芯片600500
研發(fā)成本(百萬美元)
CPU(基100 1 極度靈活的可編程能力準)0
65nm40nm28nm22nm16nm10nm7nm5nm
GPU 10DSA5(TPU)ASIC 1
>10倍>100倍>100倍
用廣泛能力性能極致但無靈活性,應用拓展力不強資料來源:軟硬件融合, 資料來源:騰訊云,ASICDSA芯片與算力融合的宏架構(gòu)趨勢相矛盾。數(shù)字經(jīng)濟的建DSAASIC芯片難以成為數(shù)字經(jīng)濟時代的整體解決方案。圖24:不同部署位置的AI芯片要求資料來源:集微咨詢,CUDA、OpenCLGPU賦能,GPU性能提升潛力大、應用拓展力強。GPUMXNet在內(nèi)的所有深度學習框架;另一方面,隨著深度學習算法和模型的收斂,GPU可以通過對算法進行手工優(yōu)化實現(xiàn)CUDA10-20%的性能提升。圖25:英偉達CUDA-XAI生態(tài)支持多種框架、云計算服務、部署資料來源:英偉達官網(wǎng),三、GPU市場:供給推動市場,技術(shù)及產(chǎn)能是核心驅(qū)動力3.1需求端:移動端兜底,自動駕駛及數(shù)據(jù)中心建設貢獻增量GPU下游目前主要應用于移動端、數(shù)據(jù)中心服務器以及車規(guī)級芯片。其中,移動端應PCGPUGPU,主要用于加速圖形處理,以提高計算機游戲的圖GPU度學習、計算機視覺和自然語言處理等人工智能應用;數(shù)據(jù)中心服務器又可以分為高GPU用于數(shù)據(jù)中心建設;在汽車領(lǐng)域,GPU主要應用于車端及其配套設施智能芯片,負責處理來自攝像頭、普通雷達、激光雷達等傳感器數(shù)據(jù),實現(xiàn)智能駕駛。圖26:GPU市場下游需求資料來源:英偉達官網(wǎng),高通官網(wǎng),中商產(chǎn)業(yè)研究院,觀研報告,1)GPU移動端主要市場,智能手機及可穿戴設備有望滲透。GPU作為圖尤其是個人電腦市場下滑的影響,PC端顯卡需求處于下行區(qū)間,據(jù)JonPeddieResearch數(shù)據(jù)統(tǒng)計,2023PC630萬塊,同比下降52.9%。圖27:PC市場處于下行周期(含平板) 圖28:PC端桌面顯卡出銷量及同比0
出貨量(百萬臺,左軸同比增速(,右軸)2017 2019 2021 2023E
20%15%10%5%0%-5%-10%-15%
銷量(百萬塊,左軸同比增速(,右軸)60504030201002014 2016 2018 2020 2022
0-0.1-0.2-0.3-0.4-0.5-0.6資料來源:Canalys, 資料來源:JonPeddieResearch,AIGPUEZOO202103553%GPUGPU性能要求將逐漸增加,目前高通、AMDARM擴量。圖29:全球移動游戲市場占比增加(十主要內(nèi)容聯(lián)合GPU品牌SoC廠商億美元) 表格5:SoC推動高性能GPU主要內(nèi)容聯(lián)合GPU品牌SoC廠商250200150100
主機游戲 移動游數(shù)字版/盒裝PC游戲 網(wǎng)頁游
三星電子 Exynos AMD高通 驍龍 自研
級圖形技術(shù)和解決方案。高通人工智能引擎,AdrenoGPU25,能效提升451047710477919302020 2021 2022 2023E
雙方合作將NVIDIA圖形聯(lián)發(fā)科 天璣 英偉達解決方案引入安卓海思 麒麟 - -資料來源:NEWZOO, 資料來源:福布斯中國,中國日報網(wǎng),AIAIAI技術(shù)的快速發(fā)展,以及計算需求的提升,AIAI架構(gòu)可以根據(jù)模AIXR等便攜設AIGPU需求的提升。圖30:基于終端感知的混合AI 圖31:部分AI模型可從云端分流到終端資料來源:高通《混合AI是AI的未來》, 資料來源:高通《混合AI是AI的未來》,GPU車載芯片的架構(gòu)模式經(jīng)歷分布式架構(gòu)向混CPUGPU來輔助計算;而中央計算架構(gòu)圖32:車載芯片的演變資料來源:博世官網(wǎng),有駕官網(wǎng),ECUECU構(gòu)復雜,不利于汽車架構(gòu)及功能擴展。ECU數(shù)量,根據(jù)汽車各部分功能進行劃分,如博世將汽車控制(每個功能域設置域CANFD域由于要滿足人機交互、機器視覺等需求,其算力要求較高,通常通過DPU(CPU+GPU+FPGA)架構(gòu)來滿足算力需求。ECU圖33:中央計算平臺須采用高算力芯片以進行整車功能、算力/存儲等資源部署資料來源:汽車測試網(wǎng),GPUGPU需V2XAIGPUORINCPU+GPU+ACCELGPUDLA提供。根據(jù)測算,預2023GPU24億美元。圖34:2025年芯片平均算力將超2000算力(TOPS)架構(gòu)產(chǎn)品廠商算力(TOPS)架構(gòu)產(chǎn)品廠商250020001500
市場加權(quán)平均算力(TOPS)
英偉達 ORIN CPU+GPU+ACCEL 254INT8地平線 征程5 CPU+BPU+DSP+ISP 1281000
芯擎科技 龍鷹一號 CPU+GPU+NPU -5000
2023E 2024E 2025E
Mobileye
EyeQULTRACPU+GPU+VPU+ISP 176(未量產(chǎn))研究所
特斯拉 FSD CPU+GPU+NPU 144資料來源:有駕,自動駕駛與AI,地平線官網(wǎng),GPUGPUHyperion研究顯示,2025199億美元,2022-2025CAGR5.5%top50050056%GPU2023年全球高性能計算中GUP21億美元。圖352025年全球高性能計算市場規(guī)模達199億美元
圖36:TOP500超算中心56算力由GPU提供0
HPC市場規(guī)模(億美元,左軸同比增速(,右軸)2020 2021 20222023E2024E2025E
20%16%12%8%4%0%-4%資料來源:Hyperion, 資料來源:官網(wǎng),不同于高性能計算中心,智算中心是利是用先進的人工智能算法和芯片進行智能算法模型訓練和推理??偭糠矫?,根據(jù)IDC及數(shù)據(jù)預測,2023年全球AI服務器市場規(guī)模將達到211億美元,同比增長15%,而據(jù)AletheiaCapital最新報告分析,2025年AI服務器市場規(guī)模將激增至1350億美元,2023-2025CAGR高達152%;價值方面,由于智能算法具有計算難度小、計算量大等特點,對于計算任務的高并發(fā)能力及吞吐量要求較高,因此對于GPU的需求更大,據(jù)統(tǒng)計,機器學習型AI服務器中,GPU成本占比約為72.8%。未來,隨著智算中心建設有序推進,GPU有望迎來量價齊升,預計2023年AI服務器領(lǐng)域GUP市場空間約為187.8億美元。37:AIGPU
圖38:2025年全球AI服務器市場規(guī)模激增至1350億美元
其他 網(wǎng)絡 存儲器 內(nèi)存 GPU CPU73%25%73%25%27%基礎(chǔ)型 推理型 高性能型 機器學型資料來源:IDC,ARK,華經(jīng)情報網(wǎng),樂晴智庫,注:高性能及機器學習型服務器中存儲器、網(wǎng)絡合并為其他項
資料來源:AletheiaCapital3.2供給端:英偉達獨占鰲頭,國內(nèi)技術(shù)追趕空間廣闊英偉達市場份額獨占鰲頭,國際呈現(xiàn)三強格局,國內(nèi)廠商加速布局。英偉達憑借技術(shù)及產(chǎn)能優(yōu)勢,在移動端、AI服務器、自動駕駛領(lǐng)域具有較大話語權(quán)。國際市場方面,根據(jù)JonPeddieResearch調(diào)查數(shù)據(jù)顯示,2023年第一季度,全球桌面級顯卡銷量約為630萬塊,其中英偉達顯卡銷量約為529萬張,以84%的市場份額占據(jù)領(lǐng)先地位,此外銷量位居前三的GUP供應商還包括AMD及Intel,其銷量分別為76萬張、25萬張;國內(nèi)市場方面,我國廠商GPU市場份額較小,正處于技術(shù)追趕及自主研發(fā)環(huán)節(jié),目前國產(chǎn)GPU在數(shù)據(jù)中心、人工智能以及通用計算型GPU領(lǐng)域均實現(xiàn)產(chǎn)品布局,未來隨著國內(nèi)數(shù)據(jù)中心、智能駕駛及終端側(cè)GPU市場需求的提升,國產(chǎn)GPU市場份額有望實現(xiàn)滲透。圖39:全球GPU市場格局變化 圖40:國內(nèi)部分GPU廠商市場布局Intel AMD NVIDIA75%86%75%86%84%80%60%40%20%0%22Q1
22Q4
23Q1資料來源:JonPeddieResearch, 資料來源:公司官網(wǎng),GeForceGeForce2RTX40SMCoreAI增強圖形渲染,多項技術(shù)業(yè)界領(lǐng)先。技術(shù) 功能圖41:英偉達游戲產(chǎn)品矩陣 表格7:游戲產(chǎn)品增強技術(shù)技術(shù) 功能BatteryBoost 提升游戲時電腦續(xù)航時間DLSS 幫助玩家增強圖形設置并提升分辨率GameWorks
游戲開發(fā)者帶來視覺計算領(lǐng)域的頂尖技術(shù)G-SYNC 減少顯示器卡頓現(xiàn)象和輸入延遲GPUBoost GPUWhisperMode 智能調(diào)整游戲幀速率資料來源:英偉達官網(wǎng), 資料來源:英偉達官網(wǎng),12產(chǎn)品支持包括智能座艙、桌面辦公、筆記本、服務器等應用在內(nèi)的各個領(lǐng)域以及Linux、ows、Android等系統(tǒng);而摩爾線程首款桌面級游戲顯卡MTTS80,在1.8GHz的主頻下,能夠提供14.4TFLOPS的單精度浮點算力,根據(jù)PassMark的測試結(jié)果,MTTS80顯卡的性能已達到英偉達中端顯卡GeForceGTX750Ti的性能水平。表格8:國內(nèi)廠商桌面級顯卡產(chǎn)品參數(shù)對比摩爾線程資料來源:公司官網(wǎng),站長之家,注:FP32(單精度浮點算力,單位:TFLOPS)、INT8(整型算力,單位:TOPS)202424.9億美元,同比增長22%PC財年英偉達22.438%,隨著疫情影響退出,游戲業(yè)務迎來回JonPeddieResearchGPU2023第二季度英偉達以68%PC圖42:英偉達游戲業(yè)務營收增長 圖43:2023Q2全球PC顯卡市場份額0
游戲業(yè)務(億美元,左軸)同比增長(,右軸)2021 2022 2023Q1
80%60%40%20%0%-20%-40%-60%
NVIDIA18%14%68%AMD18%14%68%Intel資料來源:英偉達官網(wǎng), 資料來源:JonPeddieResearch,GUPGPUGPU2022H1004N工藝,集成最高184329216CUDA576核心,AIFP16TF32FP64A10032000TFLOPS、1000TFLOPS60TFLOPS。技術(shù) 功能圖44:英偉達數(shù)據(jù)中心產(chǎn)品矩陣 表格9:英偉達H100產(chǎn)品技術(shù)技術(shù) 功能Transformer引擎 加速AI模型訓練NVLinkSwitch系統(tǒng)
縱向擴展互聯(lián)技術(shù),跨服務器拓展GPUNVIDIA機密計算 保護使用中的數(shù)據(jù)和應用MIGDPX指令
GPU全獨立的實例,并擁有自己的內(nèi)存、緩存和計算核心速度資料來源:英偉達官網(wǎng), 資料來源:英偉達官網(wǎng),此外,英偉達還在軟件及技術(shù)產(chǎn)品方面提供支持,通過其豐富的產(chǎn)品矩陣搭建數(shù)據(jù)中心一站式解決方案。AI及高性能計算市場計算需求的不斷增長,GPU之NVLinkGPU系統(tǒng)配置高更的寬帶及增強的可擴展能力,NVLinkSwitchNVLink的高級通信能力構(gòu)建,可為計算密集型工作負載提供更高帶寬和更低延遲,從而顯著增強服務器內(nèi)GPU通信能力。圖45:英偉達第四代NVLink能為H100提升1.5倍帶寬資料來源:英偉達官網(wǎng),GPU布局者較多,產(chǎn)品性能逐漸向英偉達靠攏。以英偉達最新GPU為參考,H100SXM4N工藝,其單精度浮點算力已673958的AIHPC307倍;而目前國內(nèi)算力較高的產(chǎn)品為壁仞科技推出的B10P7nm240TFLPS,1920TOPS,BR100A1003倍以上,向H100產(chǎn)品靠攏。表格10:國內(nèi)廠商高性能計算GPU產(chǎn)品參數(shù)對比廠商 產(chǎn)品 算力 制程 顯存 架構(gòu)廠商 產(chǎn)品 算力 制程 顯存 架構(gòu)英偉達
H100SXMH100PCLe
FP32:67INT8:3958FP32:51INT8:3026
4nm 帶寬:3.35TB/s Hopper4nm 帶寬:2TB/s Hopper位寬:256位摩爾線程
MTTS3000 FP32:15.2 -FP32:10.6
帶寬:448GB/s
MUSA(自研)MTTS2000
INT8:42.4
- 位寬:256位 MUSA(自研)瀚博半導體 載天VA10 INT8:400+ - - VUCA(自研)FP32:24寒武紀 MLU370-X8
INT8:256
7nm 帶寬:614.4GB/s -壁仞科技 壁礪?100P
FP32:240INT8:1920
7nm
位寬:4096位帶寬:1.64TB/s
BIRENSUPA(自研)壁礪?104P壁礪?104S
FP32:256INT8:1024FP32:170.5INT8:682
7nm7nm
位寬:2048位帶寬:819GB/s位寬:2048位帶寬:819GB/s
BIRENSUPA(自研)BIRENSUPA(自研)資料來源:英偉達、摩爾線程等公司官網(wǎng),注:英偉達產(chǎn)品參數(shù)采用稀疏技術(shù)顯示,在不采用稀疏技術(shù)的情況下,規(guī)格降低一半注:FP32(單精度浮點算力,單位:TFLOPS)、INT8(整型算力,單位:TOPS)盈利能力及產(chǎn)能方面,數(shù)據(jù)中心業(yè)務營收已超游戲業(yè)務,成為英偉達最高收入來源,但其產(chǎn)能受限于臺積電工藝,短期供需缺口較大。據(jù)英偉達2024財年Q2報告,其數(shù)據(jù)中心營收已達到103.2億美元,同比增長171%,約占總營收比例為76%;產(chǎn)能方面,英偉達H100均由臺積電代工,其產(chǎn)能受到臺積電工藝限制,據(jù)英偉達預計,H100芯片2023年全年全球范圍出貨量約為55萬顆,但據(jù)GPUUtils數(shù)據(jù)統(tǒng)計,保守估計情況下,H100的供給缺口將達到43萬顆。壁仞科技BR100P系列芯片同樣由臺積電代工,預計于2023年量產(chǎn),若量產(chǎn)計劃順利推進,自主研發(fā)有望滲透。圖46:英偉達數(shù)據(jù)中心業(yè)務營收增長 圖47:高性能計算芯片下游需求0
數(shù)據(jù)中心(億美元,左軸同比增長(,右軸)2021 2022 2023Q1
180%160%140%120%100%80%60%40%20%0%資料來源:英偉達官網(wǎng), 資料來源:GPUUtils官網(wǎng),公司官網(wǎng),3)智能駕駛。Thor英20229Thor,ThorCPUGPU2000Orin8加固自動駕駛領(lǐng)域護城河。圖48:英偉達自動駕駛產(chǎn)品矩陣 圖49:英偉達Thor芯片計算性能提升算力2000250200025013020001500100050002018PARKER
2020XAVIER
2022ORIN
2024THOR資料來源:英偉達官網(wǎng), 資料來源:英偉達官網(wǎng),目前,國內(nèi)大多數(shù)智能駕駛車型選用英偉達產(chǎn)品,地平線與華為自研市場份額正在逐步擴大。ORIN產(chǎn)品,比5MaxORIN芯片,除此之外華為在自動駕駛領(lǐng)域同樣具有布局,華為610、MDC810已經(jīng)量產(chǎn),MDC610平200TOPSORIN產(chǎn)品差距較小。表格11:國內(nèi)部分車型搭載芯片型號車企 車型搭載芯片車企 車型搭載芯片芯片制造商 備注G9ORIN英偉達 兩組ORIN芯片G6ORIN英偉達P7Xavier新款P7升級為兩組英偉達ORIN芯英偉達片L7MaxORIN英偉達L7PRO征程5地平線L8MaxORIN英偉達理想L8PRO征程5地平線L9MaxORIN英偉達L9PRO征程5地平線---ES6 ORIN
搭載四顆OrinX芯片,總算力高達1016TOPS蔚來ET7ORIN英偉達AQUILA自動駕駛系統(tǒng)ET5ORIN英偉達AQUILA自動駕駛系統(tǒng)威馬M7ORIN英偉達-極狐 阿爾法S-華為HI MDC610 華
單組算力為200TOPS,綜合算力為400TOPS吉利 極氪001 EyeQ5H Mobileye 單顆EyeQ5H的算力為24Tops資料來源:蔚來官網(wǎng),汽車之家,20242季度營收較一季度出現(xiàn)下15%2.53億美元。市場結(jié)構(gòu)上,2023H1中國市場乘用車自動駕駛計算方案市場份額中,英偉達仍以52.57%的份額占據(jù)第一,地平線以30.71%的市場份額占據(jù)第二,華為海思則占據(jù)4.05%的市場份額。圖50:英偉達智能駕駛業(yè)務營收增長
H1計算方案市場份額智能駕駛(億美元,左軸同比增長(,右軸)1098765432102021 2022 2023Q1
120%100%80%60%40%20%0%
31%
52%
英偉達地平線德州儀器Mobileye華為海思資料來源:英偉達官網(wǎng), 資料來源:高工智能汽車,GPUGPU4nm7nmCoWoS富微電及賽微電子等具有布局。202210.7%的6.5%圖52:GPU產(chǎn)業(yè)中下游分別為芯片設計、制造、封裝與測試資料來源:公司官網(wǎng),超能網(wǎng),集微網(wǎng),公司主要GPU產(chǎn)品市值(億元)技術(shù)背景主要應用領(lǐng)域景嘉微JM5/7/9/7200343.04完全自主知識產(chǎn)權(quán)航天軍工、通用計算海光信息公司主要GPU產(chǎn)品市值(億元)技術(shù)背景主要應用領(lǐng)域景嘉微JM5/7/9/7200343.04完全自主知識產(chǎn)權(quán)航天軍工、通用計算海光信息海光81001349.98AMDx86授權(quán)服務器、通用計算壁仞科技BR100、BR104未上市 Imagination授權(quán)IP+ 服務器、信創(chuàng)自主研發(fā)凌久電子GP101、GP102未上市 完全自主知識產(chǎn)權(quán) 桌面、軍工芯原股份VivanteGPUIP收購自美國圖芯322.34 IP(Vivante)芯動科技風華1號/2號Imagination授權(quán)IP+未上市 服務器表格12:國內(nèi)重點GPU公司及技術(shù)自主研發(fā)摩爾線程
MTTS80/60/30/10MTTS3000
未
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025河南省建筑安全員C證考試(專職安全員)題庫附答案
- 2024-2025學年浙江省強基聯(lián)盟高二上學期11月聯(lián)考歷史試卷
- 2024-2025學年新疆烏魯木齊市第六十一中學高二上學期12月月考歷史試卷
- 廣州華商學院《數(shù)據(jù)庫應用》2023-2024學年第二學期期末試卷
- 運城學院《算法設計與分析II》2023-2024學年第二學期期末試卷
- 2025四川省建筑安全員-C證考試題庫
- 蘭州科技職業(yè)學院《試驗設計與數(shù)據(jù)處理》2023-2024學年第二學期期末試卷
- 上海對外經(jīng)貿(mào)大學《項目開發(fā)》2023-2024學年第二學期期末試卷
- 唐山學院《葡萄牙語視聽說(III)》2023-2024學年第二學期期末試卷
- 2021年電力工程圍墻施工作業(yè)指導書
- 亞朵酒店前臺述職報告
- 《肝衰竭診治指南(2024版)》解讀
- 數(shù)據(jù)安全重要數(shù)據(jù)風險評估報告
- 孝悌課件教學課件
- 《期末總結(jié)》課件
- 《企業(yè)安全生產(chǎn)費用提取和使用管理辦法》專題培訓
- 母嬰護工培訓完整方案
- 第17講 新高考新結(jié)構(gòu)命題下的導數(shù)解答題綜合訓練(教師版)-2025版高中數(shù)學一輪復習考點幫
- 01-衛(wèi)生法學與衛(wèi)生法概述課件
- 2024年世界職業(yè)院校技能大賽高職組“新型電力系統(tǒng)技術(shù)與應用組”參考試題庫(含答案)
- 幼兒園家長會安全保健
評論
0/150
提交評論