人工智能行業(yè)市場前景及投資研究報(bào)告:英偉達(dá)2024 GTC大會(huì)要點(diǎn)新質(zhì)生產(chǎn)力OpenAIkimieVTOL_第1頁
人工智能行業(yè)市場前景及投資研究報(bào)告:英偉達(dá)2024 GTC大會(huì)要點(diǎn)新質(zhì)生產(chǎn)力OpenAIkimieVTOL_第2頁
人工智能行業(yè)市場前景及投資研究報(bào)告:英偉達(dá)2024 GTC大會(huì)要點(diǎn)新質(zhì)生產(chǎn)力OpenAIkimieVTOL_第3頁
人工智能行業(yè)市場前景及投資研究報(bào)告:英偉達(dá)2024 GTC大會(huì)要點(diǎn)新質(zhì)生產(chǎn)力OpenAIkimieVTOL_第4頁
人工智能行業(yè)市場前景及投資研究報(bào)告:英偉達(dá)2024 GTC大會(huì)要點(diǎn)新質(zhì)生產(chǎn)力OpenAIkimieVTOL_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

證券研究報(bào)告

行業(yè)動(dòng)態(tài)研究英偉達(dá)2024

GTC大會(huì)要點(diǎn)梳理發(fā)布日期:2024年3月28日摘要

核心觀點(diǎn):英偉達(dá)2024

GTC大會(huì)展望了人工智能帶來的新式產(chǎn)業(yè)革命,同時(shí)推出了Blackwell計(jì)算架構(gòu)、GR00T項(xiàng)目等多項(xiàng)重磅更新。英偉達(dá)正式推出B200和GB200等系列芯片,互聯(lián)能力大幅提升,多款不同層級(jí)的AI服務(wù)器也同時(shí)亮相。英偉達(dá)開啟GR00T項(xiàng)目,發(fā)布人形機(jī)器人的通用基礎(chǔ)模型,利用NVIDIA

AI、Omniverse、ISAAC三大平臺(tái)加速人型機(jī)器人產(chǎn)業(yè)。在自動(dòng)駕駛領(lǐng)域,發(fā)布搭載BlackwellGPU的新一代集中式車載計(jì)算平臺(tái)Thor。英偉達(dá)人工智能技術(shù)賦能醫(yī)藥、生物、氣象等多行業(yè)發(fā)展,擴(kuò)大AI技術(shù)的應(yīng)用范圍。

英偉達(dá)推出新一代計(jì)算平臺(tái)Blackwell,AI計(jì)算能力全面升級(jí)。英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛在會(huì)上正式發(fā)布全新GPU平臺(tái)架構(gòu)Blackwell,推出基于Blackwell的B200和GB200超級(jí)芯片,AI計(jì)算能力大幅提升。第五代NVLink和NVLink

Switch

7.2T正式更新,極大提高GPU系統(tǒng)的可擴(kuò)展性。英偉達(dá)推出GB200

NVL72服務(wù)器,提供了36個(gè)CPU和72個(gè)Blackwell構(gòu)架GPU,并完善提供一體水冷散熱方案,內(nèi)部使用高速銅纜進(jìn)行GPU互連。硬件層面,英偉達(dá)的GPU芯片、NVLink互聯(lián)和服務(wù)器實(shí)現(xiàn)全面提升,在軟件層面,英偉達(dá)升級(jí)了Transformer

engine技術(shù),推出RAS引擎建立智能可靠技術(shù),實(shí)現(xiàn)了AI計(jì)算能力的大幅提升。

英偉達(dá)開啟GR00T項(xiàng)目,發(fā)布人形機(jī)器人的通用基礎(chǔ)模型。英偉達(dá)發(fā)布人形機(jī)器人基礎(chǔ)大模型GR00T,將推進(jìn)機(jī)器人在具身智能方面的突破進(jìn)展。英偉達(dá)目前正在構(gòu)建包括NVIDIA

AI、Omniverse、ISAAC三大平臺(tái),三大平臺(tái)均與機(jī)器人產(chǎn)業(yè)高度關(guān)聯(lián)。其中NVIDIA

AI用于模擬物理世界;Omnivese搭載RTX和OVX系列產(chǎn)品,用于驅(qū)動(dòng)數(shù)字孿生的計(jì)算系統(tǒng);ISAAC搭載AGX系列,用于驅(qū)動(dòng)人工智能機(jī)器人。

英偉達(dá)發(fā)布新一代集中式車載計(jì)算平臺(tái)Thor,搭載Blackwell

GPU。DRIVE

Thor是專為生成式AI打造的車載計(jì)算平臺(tái),加載NVIDIABlackwell

GPU,將自動(dòng)駕駛、自動(dòng)泊車、智能座艙等功能集成到單一的中央計(jì)算平臺(tái)中,實(shí)現(xiàn)車內(nèi)計(jì)算單元的大一統(tǒng)。大會(huì)上,英偉達(dá)宣布擴(kuò)大與比亞迪、小鵬和廣汽埃安等多家中國車企的合作。

英偉達(dá)人工智能技術(shù)賦能多行業(yè)發(fā)展,擴(kuò)大AI技術(shù)應(yīng)用范圍。在生物醫(yī)藥領(lǐng)域,英偉達(dá)通過

Clara

Discovery

BioNemo加速藥物研發(fā)和生物研究;在氣象領(lǐng)域,NVIDIA

Earth-2平臺(tái)優(yōu)化氣候模擬,實(shí)現(xiàn)天氣可視化。英偉達(dá)在多行業(yè)實(shí)現(xiàn)AI應(yīng)用的百花齊放。

風(fēng)險(xiǎn)提示:大模型技術(shù)發(fā)展不及預(yù)期、互聯(lián)網(wǎng)廠商資本開支不及預(yù)期、參與廠商眾多導(dǎo)致競爭格局惡化、自動(dòng)駕駛進(jìn)展不及預(yù)期、政策監(jiān)管力度不及預(yù)期。第一章第二章第三章第四章第五章英偉達(dá)推出新一代計(jì)算平臺(tái)Blackwell人形機(jī)器人基礎(chǔ)大模型GR00T自動(dòng)駕駛Thor平臺(tái)搭載全新Blackwell

GPU英偉達(dá)AI應(yīng)用百花齊放417252838風(fēng)險(xiǎn)提示第一章英偉達(dá)推出新一代計(jì)算平臺(tái)Blackwell4英偉達(dá)GTC大會(huì)概述

英偉達(dá)2024

GTC大會(huì)于2024年3月18日舉行,英偉達(dá)CEO黃仁勛發(fā)表主題演講,發(fā)布加速計(jì)算、生成式AI以及機(jī)器人領(lǐng)域的突破性成果,同時(shí)英偉達(dá)的高級(jí)研發(fā)、管理人員以及其他AI領(lǐng)域的專家共同出席討論人工智能在生物醫(yī)療、機(jī)器人、游戲等領(lǐng)域的研發(fā)成果和應(yīng)用前景,重點(diǎn)聚焦在生成式AI、AI生物醫(yī)療和機(jī)器人,展示最新成果,展望技術(shù)趨勢。

英偉達(dá)CEO黃仁勛在GTC大會(huì)展望了新式產(chǎn)業(yè)革命:一是新工業(yè)革命,生成式人工智能將完成現(xiàn)代化;二是此次革命的Blackwell計(jì)算機(jī),具有強(qiáng)大的計(jì)算能力;三是Nims,允許隨身攜帶的新類型軟件;四是Nemo

and

Nvidia

AI

Foundary,幫助創(chuàng)建新型應(yīng)用程序和聊天機(jī)器人并完成集成;五是Omniverse

and

ISAAC機(jī)器人,搭建數(shù)字孿生平臺(tái)全宇宙。圖:英偉達(dá)2024GTC大會(huì)特色主題.圖:英偉達(dá)2024GTC大會(huì)展望新式產(chǎn)業(yè)革命資料:英偉達(dá)官網(wǎng),中信建投2024

GTC正式推出Blackwell計(jì)算架構(gòu)

英偉達(dá)從2006年進(jìn)軍AI計(jì)算之后,其計(jì)算架構(gòu)基本保持兩年一代的迭代速度。2024春季GTC上,英偉達(dá)CEO黃仁勛正式推出了Blackwell計(jì)算架構(gòu),Blackwell產(chǎn)品使用兩塊4nm光刻極限尺寸的裸片,通過10

TB/s的片間互聯(lián)技術(shù)連接成一塊統(tǒng)一的

GPU,以出眾的性能、效率和規(guī)模揭開了生成式AI領(lǐng)域的新篇章。

Blackwell產(chǎn)品同時(shí)取得多項(xiàng)技術(shù)突破,其采用第五代Tensor

Core技術(shù),支持FP4/FP6的數(shù)據(jù)格式,其互聯(lián)技術(shù)整體升級(jí),NVLink技術(shù)和NVSwitch芯片技術(shù)均得到提升,引入可靠性、可用性和可服務(wù)性引擎(RAS)。圖:英偉達(dá)GPU微架構(gòu)演進(jìn)歷程TeslaKeplerPascalTuring

配備專用的RT

Core

深度學(xué)習(xí)超采樣

(DLSS)

GDDR6顯存Hopper

第四代

TensorCore

FP8浮點(diǎn)格式

Transformer

引擎

四代NVLink互連技術(shù)

4nm

第一個(gè)統(tǒng)一著色器微架構(gòu)

支持PCIe3.0

動(dòng)態(tài)并行計(jì)算

28

nm

HBM2的CoWoS技術(shù)

GPU動(dòng)態(tài)超頻3.0

引入CUDA

90/65/55

nm

16

nm

12

nm2010201420172020202420062016201820222012FermiMaxwellVoltaAmpere

二代RT

Core

PCIe4.0Blackwell

支持ECC

SMM流處理器

引入Tensor

Core

改進(jìn)MPS

第五代

TensorCore

FP4浮點(diǎn)格式

流式多處理器

支持GDDR5顯存

40/28

nm

動(dòng)態(tài)高分辨率技術(shù)

28

nm

12

nm

8/7

nm

第二代Transformer

引擎

五代NVLink互連技術(shù)

4nm資料:CSDN,中信建投Blackwell系列平臺(tái)及相關(guān)產(chǎn)品

按照英偉達(dá)技術(shù)路線圖,Blackwell系列應(yīng)于2024-2025年中間發(fā)布,春季GTC大會(huì)上英偉達(dá)正式發(fā)布B系列平臺(tái)及相關(guān)產(chǎn)品。

HGX

B100:HGX

B100由一個(gè)x86

CPU和八個(gè)B100

GPU組成,與現(xiàn)有的HGX

H100基礎(chǔ)設(shè)施兼容。

NVLink

Switch:NVLink

Switch芯片具有四條1.8TB/s的全對(duì)全雙向帶寬,支持576

GPU

NVLink域。

GB200

Superchip:GB200通過900GB/s帶寬的NVLink將兩個(gè)B200連接到一個(gè)Grace

CPU。

Quantum

X800

Switch:適用于InfiniBand的X800服務(wù)器,用于最高性能的AI專用基礎(chǔ)設(shè)施。

Spectrum

X800

Switch:結(jié)合Spectrum

SN5600

800GB/s與NVIDIA

BlueField-3

SuperNIC的X800服務(wù)器。圖:英偉達(dá)技術(shù)路線圖圖:Blackwell系列產(chǎn)品平臺(tái)資料:英偉達(dá)官網(wǎng),中信建投英偉達(dá)推出新一代計(jì)算平臺(tái)Blackwell和B200芯片

英偉達(dá)推出全新GPU平臺(tái)Blackwell,配備B200芯片。Blackwell架構(gòu)GPU具有2080億個(gè)晶體管,采用專門定制的臺(tái)積電4NP工藝制造。Blackwell產(chǎn)品均采用兩塊光刻極限尺寸的裸片,通過10TB/s的片間互聯(lián)技術(shù)連接成統(tǒng)一的GPU。Blackwell構(gòu)架B200

GPU的AI運(yùn)算性能是前一代Hopper構(gòu)架H100的2.3倍,功耗顯著優(yōu)化,配備192GBHBM3E內(nèi)存。圖:Blackwell技術(shù)優(yōu)勢圖:Blackwell平臺(tái)性能比對(duì)B200B1002024H1002022A1002020Blackwell技術(shù)創(chuàng)新發(fā)布時(shí)間制程2024TSMC

4NPTSMC

4NPTSMC

4NTSMC

7N2080億個(gè)晶體管,雙倍光刻極限尺寸4NP

TSMC工藝,10TB/s的片間互聯(lián)全球最強(qiáng)大的芯片架構(gòu)BlackwellBlackwellHopperAmpere顯存類型顯存帶寬8Gbps

HBM3E8Gbps

HBM3E5.23Gbps

HBM33.35TB/s80GB3.2Gbps

HBM2e1.99

TB/s80

GB第二代transformer引擎將在新型4位浮點(diǎn)AI推理能力下實(shí)現(xiàn)算力和模型大小翻倍8TB/s8TB/sec顯存容量192GB(2x96GB)192GB(2x96GB)FP32

VectorFP64

VectorFP4

Tensor----67

TFLOPS34

TFLOPS-19.5

TFLOPS9.7

TFLOPS-為每塊GPU提供突破性的1.8TB/s雙向吞吐量,確保多達(dá)576塊GPU之間的無縫高速通信第五代NVLinkRAS引擎9PFLOPS7PFLOPSINT8/FP8Tensor4500

T(FL)OPS3500

T(FL)OPS1980

T(FL)OPS624

TOPS包含一個(gè)用于保障可靠性、可用性和可維護(hù)性的專用引擎,提高大規(guī)模AI部署的彈性,同時(shí)降低運(yùn)營成本FP16

TensorTF32

TensorFP64

Tensor2250

TFLOPS1120

TFLOPS40

TFLOPS1800

TFLOPS900

TFLOPS30

TFLOPS990

TFLOPS495

TFLOPS312

TFLOPS156

TFLOPS先進(jìn)的機(jī)密計(jì)算功能可以在不影響性能的情況下保護(hù)AI模型和客戶數(shù)據(jù),并且支持全新本地接口加密協(xié)議安全AI67

TFLOPSNVLink

419.5

TFLOPSNVLink

3NVLink

518Links

(1800GB/s)NVLink

5NVLinkTDP專用的解壓縮引擎支持最新格式,通過加速數(shù)據(jù)庫查詢提供極其強(qiáng)大的數(shù)據(jù)分析和數(shù)據(jù)科學(xué)性能18

Links(1800GB/s)

18

Links(900GB/s)

12

Links(600GB/s)解壓縮引擎1000W700W700W400W資料:英偉達(dá)官網(wǎng),中信建投B200由兩顆緊密耦合的GPU組成

B200并不是傳統(tǒng)意義上的單一GPU,B200由兩個(gè)全掩模尺寸的GPU芯片緊密耦合形成,兩個(gè)芯片通過10

TB/s的NV-HBI(高帶寬接口)連接,以確保它們能夠作為一個(gè)完全一致的芯片正常工作,單芯片面積理論上的最大值為858

mm2。每個(gè)管芯周圍有八個(gè)HBM3e堆棧,每個(gè)堆棧為24GB,每個(gè)堆棧在1024

bit接口上具有1TB/s的帶寬。

Blackwell支持第二代Transformer

engine,支持FP4精度與FP6精度。Transformer

engine在計(jì)算工作負(fù)載時(shí),會(huì)不斷跟蹤整個(gè)神經(jīng)網(wǎng)絡(luò)中每個(gè)層、每個(gè)張量的精度動(dòng)態(tài)范圍,它將幫助用戶自動(dòng)將模型轉(zhuǎn)換為適當(dāng)?shù)木雀袷?,以達(dá)到最大性能。圖:B200芯片圖:新思科技的HBI設(shè)計(jì)資料:英偉達(dá)官網(wǎng),新思科技,中信建投GB200超級(jí)芯片=兩個(gè)B200

GPU+一個(gè)Grace

CPU

英偉達(dá)推出GB200超級(jí)芯片,它基于兩個(gè)B200

GPU,外加一個(gè)Grace

CPU,使用

NVIDIA

NVLink-C2C連接B200

GPU和GraceCPU,整個(gè)超級(jí)芯片的TDP功耗高達(dá)2700W。

訓(xùn)練一個(gè)1.8萬億個(gè)參數(shù)的模型以前需要8000個(gè)Hopper

GPU和15兆瓦的電力?,F(xiàn)在2000個(gè)Blackwell

GPU就能完成這項(xiàng)工作,耗電量僅為

4

兆瓦。在參數(shù)為1750億的GPT-3

LLM基準(zhǔn)測試中,Nvidia稱GB200的推理性能是H100的7倍,而訓(xùn)練速度是

H100的4倍。圖:GB200芯片圖:GB200性能提升圖:B系列芯片性能列表GB200B200B1002x

B200GPU,GPUBlackwell

GPUBlackwell

GPU1x

GraceCPU20

petaflops10

petaflops10

petaopsFP4

TensorFP6/FP8

TensorINT8

TensorFP16/BF16

TensorTF32

TensorFP64

Tensor容量9petaflops4.5

petaflops4.5

petaops2.25

petaflops1.12

petaflops40

teraflops192GB(8x24GB)8TB/s7petaflops3.5

petaflops3.5

petaops1.8

petaflops0.9

petaflops30

teraflops192GB(8x24GB)8TB/S5petaflops2.5

petaflops90

teraflops384GB(2x8x24GB)16TB/s帶寬NVLink

帶寬功率2x1.8

TB/s1.8

TB/s1.8

TB/sUp

to

2700W1000W700W資料:英偉達(dá)官網(wǎng),中信建投英偉達(dá)Blackwell采用第二代transformer

engine和RAS引擎

第二代transformer引擎助力Blackwell實(shí)現(xiàn)性能和效率翻倍。第二代Transformer引擎將定制的Blackwell

Tensor

Core技術(shù)與NVIDIATensorRT-LLM和NeMo框架創(chuàng)新相結(jié)合,加速大語言模型和專家混合模型(MoE)的推理和訓(xùn)練。BlackwellTransformer引擎利用微張量縮放的細(xì)粒度縮放技術(shù),優(yōu)化性能和準(zhǔn)確性,支持4位浮點(diǎn)(FP4)AI??梢灾С值男乱淮P偷男阅芎痛笮》?,同時(shí)保持高精度,未來在移動(dòng)設(shè)備和邊緣計(jì)算場景有大規(guī)模使用的潛力。

Blackwell通過專用的RAS(可靠性、可用性、可維護(hù)性)引擎建立智能可靠技術(shù)。RAS引擎增加了智能恢復(fù)能力,可以識(shí)別早期可能發(fā)生的潛在故障,從而更大限度地減少停機(jī)時(shí)間。NVIDIA

AI驅(qū)動(dòng)的預(yù)測管理功能持續(xù)監(jiān)控硬件和軟件中數(shù)千個(gè)數(shù)據(jù)點(diǎn)的整體運(yùn)行狀況,以預(yù)測和攔截停機(jī)時(shí)間和低效的,從而節(jié)省時(shí)間、能源和計(jì)算成本。圖:第二代transformer引擎資料:英偉達(dá)官網(wǎng),中信建投英偉達(dá)發(fā)布第五代NVLink和NVLinkSwitch7.2T

人工智能領(lǐng)域算力需求不斷增長,對(duì)于能夠在GPU之間實(shí)現(xiàn)無縫高速通信的多節(jié)點(diǎn)、多GPU系統(tǒng)的需求與日俱增。此前英偉達(dá)已經(jīng)陸續(xù)發(fā)展出四代NVLink、三代NVLink

Switch,構(gòu)建出強(qiáng)大的端到端人工智能和高性能計(jì)算平臺(tái),推動(dòng)人工智能加速。

第五代NVLink極大地提高了大型GPU系統(tǒng)的可擴(kuò)展性。單個(gè)NVIDIA

Blackwell

Tensor

Core

GPU支持多達(dá)18個(gè)NVLink

100GB/s連接,總帶寬為1.8TB/s,比上一代Hopper帶寬增加2倍,是PCIe

Gen5帶寬的14倍以上。

英偉達(dá)發(fā)布NVLink

Switch

7.2T。新的NVLink芯片具有1.8TB/s的全對(duì)全雙向帶寬,支持576

GPU

NVLink域,適用于萬億級(jí)參數(shù)和混合專家AI模型;基于臺(tái)積電N4P節(jié)點(diǎn)制造,擁有500億個(gè)晶體管。第四代NVSwitch可在含有72個(gè)GPU的NVLink域中實(shí)現(xiàn)130TB/s的GPU帶寬,通過NVIDIA

SHARP技術(shù)對(duì)FP8的支持提供4倍于原來的帶寬效率。采用NVLink的多服務(wù)器集群可以在計(jì)算量增加的情況下同步擴(kuò)展GPU通信,因此NVL72可支持的GPU吞吐量為單個(gè)8-GPU系統(tǒng)的9倍。圖表:NVLink技術(shù)躍遷路徑圖表:NVLink互聯(lián)圖表:NVSwitch互聯(lián)NVLink

第二代第三代

第四代第五代NVSwitch第一代第二代第三代第四代直連或節(jié)點(diǎn)中最多8個(gè)最多8個(gè)最多8個(gè)最多8個(gè)總帶寬

300GB/s

600GB/s

900GB/s

1800GB/s單GPU最GPU數(shù)量NVSwitch

GPU300GB/s600GB/s900GB/s1800GB/s之間帶寬6121818大鏈路數(shù)聚合總帶寬

2.4TB/s架構(gòu)支持

Volta4.8TB/sAmpere7.2TB/sHopper1PB/s架構(gòu)支持

Volta

Ampere

Hopper

BlackwellBlackwell資料:英偉達(dá)官網(wǎng),中信建投英偉達(dá)推出第四代NVLinkSwitch芯片

NVLink

Switch芯片性能顯著提升,通信能力迭代升級(jí)。NVIDIA

NVSwitch基于NVLink的高級(jí)通信能力構(gòu)建,可為計(jì)算密集型工作負(fù)載提供更高帶寬和更低延遲。為了支持高速集合運(yùn)算,第四代NVSwitch

Tray包含144個(gè)NVLink端口,并配有NVIDIA

SHARP引擎,可用于網(wǎng)絡(luò)內(nèi)歸約和組播加速。NVIDIA

NVSwitch芯片在一個(gè)72-GPU的NVLink

domain(NVL72)中實(shí)現(xiàn)130TB/s的GPU帶寬,并提供4倍的帶寬效率。第四代NVSwitch

System可以支持多達(dá)576個(gè)GPU,總的帶寬上限可達(dá)1PB/s。

NVLink

Switch與NVLink協(xié)同,提升GPU工作效率。借助NVSwitch,NVLink連接可在節(jié)點(diǎn)間擴(kuò)展,以創(chuàng)建無縫、高帶寬的多節(jié)點(diǎn)GPU集群,從而有效地形成數(shù)據(jù)中心大小的GPU。圖:新一代NVLinkSwitch性能指標(biāo)圖:NVLinkSwitch集成

GPU圖示資料:英偉達(dá)官網(wǎng),中信建投多種形式的服務(wù)器類型

HGX

B200:英偉達(dá)發(fā)布了面向服務(wù)器的解決方案HGX

B200,它基于在單個(gè)服務(wù)器節(jié)點(diǎn)中使用八個(gè)B200

GPU和x86

CPU。TDP配置為每個(gè)B200

GPU

1000W,GPU可提供高達(dá)18

petaflops的FP4吞吐量。

HGXB100:它與HGX

B200的基本架構(gòu)相同,有一個(gè)x86

CPU和八個(gè)B100

GPU,HGXB100與現(xiàn)有的HGX

H100基礎(chǔ)設(shè)施兼容,允許最快速地部署B(yǎng)lackwell

GPU。

GB200

NVL72服務(wù)器:提供了36個(gè)CPU和72個(gè)Blackwell構(gòu)架GPU,并完善提供一體水冷散熱方案,可實(shí)現(xiàn)總計(jì)720petaflops的AI訓(xùn)練性能或1440petaflops的推理性能。它內(nèi)部使用電纜長度累計(jì)接近2英里,共有5000條獨(dú)立電纜。圖:HGXB200服務(wù)器圖:GB200服務(wù)器圖:GB200NVL72服務(wù)器資料:英偉達(dá)官網(wǎng),中信建投GB200

NVL72服務(wù)器

GB200NVL72在一個(gè)機(jī)架中配置了72個(gè)GPU,或者在兩個(gè)機(jī)架中配置了72個(gè)GPU,包含18個(gè)單個(gè)GB200計(jì)算節(jié)點(diǎn)。

GB200NVL72使用高速銅纜進(jìn)行GPU互連,無源DAC僅使用銅線,沒有電子器件,功耗為零,延遲和插入損耗最低,是高速、低延遲鏈路的成本最低的方式。

GB200

NVL72使用液體冷卻系統(tǒng)設(shè)計(jì),GB200

NVL72由18個(gè)Tray組成,每個(gè)Tray均包含2塊GraceCPU及4

塊Blackwell

GPU并配置液體冷卻,能耗降低25倍。圖:GB200實(shí)現(xiàn)更快的推理速度圖:GB200

NVL72廣泛使用高速銅纜圖:InfiniBandDAC銅纜資料:英偉達(dá)官網(wǎng),中信建投Omniverse解密下一代數(shù)據(jù)中心的數(shù)字藍(lán)圖

GTC大會(huì)上,英偉達(dá)使用Omniverse模擬了AI時(shí)代“下一代”數(shù)據(jù)中心的數(shù)字藍(lán)圖。打造數(shù)據(jù)中心過程極其復(fù)雜,涉及到性能、能效和可拓展性等多重因素,需要精通各領(lǐng)域工程師的協(xié)作。工程師可利用由Omniverse

API提供支持的數(shù)字孿生平臺(tái),以逼真的方式組合和可視化多個(gè)CAD數(shù)據(jù)集,規(guī)劃GPU集群部署。

Omniverse

Cloud

API

還促進(jìn)了與其他工具的互操作性,可實(shí)現(xiàn)設(shè)計(jì)集群和網(wǎng)絡(luò)基礎(chǔ)設(shè)施的物理布局、優(yōu)化布線長度和路由配置以及氣流和液體冷卻系統(tǒng)性能仿真等任務(wù)。圖:下一代數(shù)據(jù)中心數(shù)字藍(lán)圖圖:利用數(shù)字孿生技術(shù)規(guī)劃GPU集群部署資料:英偉達(dá),中信建投第二章人形機(jī)器人基礎(chǔ)大模型GR00T17GR00T項(xiàng)目:用于人形機(jī)器人的通用基礎(chǔ)模型

GR00T項(xiàng)目:英偉達(dá)發(fā)布人形機(jī)器人基礎(chǔ)大模型GR00T,將推進(jìn)機(jī)器人在具身智能方面的突破進(jìn)展。該模型采用語言、視頻、人類示教等多模態(tài)指令作為輸入,直接生成機(jī)器人需要執(zhí)行的下一個(gè)動(dòng)作,搭載全新計(jì)算平臺(tái)Jetson

Thor,在模擬環(huán)境的對(duì)GR00T進(jìn)行訓(xùn)練。大模型通過學(xué)習(xí)人類視頻,學(xué)習(xí)人類動(dòng)作,提升動(dòng)作流暢性與擬人性,真正實(shí)現(xiàn)人機(jī)交互,提升其智能性?;贕R00T人型機(jī)器人基礎(chǔ)模型,可以實(shí)現(xiàn)通過語言、視頻和人類演示,來理解自然語言,模仿人類動(dòng)作,進(jìn)而快速學(xué)習(xí)協(xié)調(diào)性、靈活性以及其他的技能,進(jìn)而能夠融入現(xiàn)實(shí)世界并與人類進(jìn)行互動(dòng)。圖:GR00T驅(qū)動(dòng)的機(jī)器人圖:GR00T模型訓(xùn)練工作流程資料:英偉達(dá),中信建投GR00T項(xiàng)目:兼具底層硬件與軟件的強(qiáng)力支持

GR00T的硬件支持:人形機(jī)器人作為一個(gè)結(jié)構(gòu)復(fù)雜的系統(tǒng),具有在高頻低級(jí)控制、任務(wù)規(guī)劃、傳感器融合與感知以及人機(jī)交互方面等的多樣化需求,必須采用異構(gòu)計(jì)算。英偉達(dá)已經(jīng)對(duì)外公布,針對(duì)機(jī)器人的邊緣計(jì)算將依托Jetson

Thor平臺(tái),并配備一系列預(yù)先訓(xùn)練好的機(jī)器人模型、庫以及參考硬件。Jetson

Thor內(nèi)置高性能的Blackwell

GPU,帶寬高達(dá)100GB/s,具備每秒800萬億次8位浮點(diǎn)運(yùn)算的AI處理能力,不僅能流暢運(yùn)行諸如GR00T等多模態(tài)模型,而且能顯著簡化設(shè)計(jì)與集成的工作流程。

軟件支持:為了提升GR00T大模型在端到端網(wǎng)絡(luò)應(yīng)用中的開發(fā)和訓(xùn)練效率,NVIDIA全面升級(jí)了Isaac

Lab機(jī)器人平臺(tái),并提供了預(yù)訓(xùn)練的機(jī)器人模型、參考硬件和庫,使開發(fā)者能更便捷地開展工作。

GR00T開展實(shí)踐合作:GTC大會(huì)展示了九個(gè)由GR00T驅(qū)動(dòng)的人形機(jī)器人,分別來自Figure

AI、Agility

Robotics、Apptronik、傅利葉智能、宇樹科技、1x、Sanctuary

AI、波士頓動(dòng)力、小鵬鵬行。迪士尼基于Jetson“復(fù)活了”瓦力機(jī)器人,引發(fā)全場轟動(dòng)。圖:基于jetson

thor的機(jī)器人模型圖圖:GTC大會(huì)人形機(jī)器人資料:36Kr,英偉達(dá),中信建投GR00T項(xiàng)目:英偉達(dá)搭建“三大平臺(tái)”助力人工智能機(jī)器人發(fā)展

英偉達(dá)目前正在構(gòu)建NVIDIA

AI、Omniverse、ISAAC三大平臺(tái),三大平臺(tái)均與機(jī)器人產(chǎn)業(yè)高度關(guān)聯(lián)。

NVIDIA

AI搭載DGX系列產(chǎn)品,用于模擬物理世界

Omnivese搭載RTX和OVX系列產(chǎn)品,用于驅(qū)動(dòng)數(shù)字孿生的計(jì)算系統(tǒng)

ISAAC搭載AGX系列,用于驅(qū)動(dòng)人工智能機(jī)器人

三大平臺(tái)助力機(jī)器人自適應(yīng):傳統(tǒng)機(jī)器人需要對(duì)任務(wù)進(jìn)行預(yù)先規(guī)劃,未來只需要對(duì)路徑點(diǎn)提出要求,機(jī)器人路線可以實(shí)現(xiàn)自適應(yīng),機(jī)器人操作及編程更加簡單。圖:為開發(fā)者搭建的Robotics

Platform圖:應(yīng)用omniverse于自動(dòng)駕駛資料:

NVIDIA,中信建投機(jī)器人學(xué)習(xí)和擴(kuò)展開發(fā):NVIDIAIsaaclab

和NVIDIAOSMO

機(jī)器人學(xué)習(xí)和擴(kuò)展開發(fā)的利器:GR00T

使用的Isaac工具可以為任何環(huán)境中的機(jī)器人創(chuàng)建新的基礎(chǔ)模型。這些工具包括用于強(qiáng)化學(xué)習(xí)的

Isaac

Lab和用于計(jì)算編排服務(wù)的

OSMO。

NVIDIA

Isaac

lab:高級(jí)運(yùn)動(dòng)技能的機(jī)器人,如行走和抓取,均需在模擬環(huán)境中運(yùn)用深度強(qiáng)化學(xué)習(xí),并在虛擬世界反復(fù)訓(xùn)練以掌握技能。作為Isaac

Gym的升級(jí)版,Isaac

lab為開發(fā)者提供了一個(gè)強(qiáng)大的端到端平臺(tái),助力開發(fā)、模擬及部署人工智能機(jī)器人。在GTC2024主題演講中,黃仁勛宣布了對(duì)Isaac

lab機(jī)器人平臺(tái)的升級(jí),包括新增的機(jī)器人預(yù)訓(xùn)練模型、庫及參考硬件集合,旨在加速學(xué)習(xí)進(jìn)程并提升效率。更新內(nèi)容支持探索新的機(jī)器人模型,包括FANUC和Techman,以及支持Orbbec、Sensing、Zvision、Ouster和Real-Sense的傳感器生態(tài)系統(tǒng);獲取對(duì)自定義ROS消息的支持,允許獨(dú)立腳本手動(dòng)控制模擬步驟;探索為機(jī)械臂和移動(dòng)基座用例添加的模擬中的隨機(jī)化。圖:Isaac

lab在機(jī)器人模擬人類行為的示范(中間步驟)資料:NVIDIA,中信建投機(jī)器人學(xué)習(xí)和擴(kuò)展開發(fā):NVIDIAIsaaclab

和NVIDIAOSMO

NVIDIA

OSMO:OSMO是一個(gè)云原生工作流程編排平臺(tái),可以輕松跨分布式環(huán)境(從本地到私有云和公共云資源集群)擴(kuò)展工作負(fù)載。它提供單一管理平臺(tái)來調(diào)度復(fù)雜的多階段和多容器異構(gòu)計(jì)算工作流程。

工作負(fù)載包括以下內(nèi)容:綜合數(shù)據(jù)生成

(SDG);DNN

訓(xùn)練和驗(yàn)證;強(qiáng)化學(xué)習(xí);SIL或

HIL

中的機(jī)器人(重新)仿真;SIM或真實(shí)數(shù)據(jù)的感知評(píng)估。得益于以上英偉達(dá)強(qiáng)大的人工智能生態(tài)構(gòu)建,osmo的調(diào)度作用能夠被最大化發(fā)揮。

NVDIVIA賦能機(jī)器人模型訓(xùn)練:得益于NVIDIA

Isaac

lab和NVIDIA

OSMO的不斷發(fā)展更新,英偉達(dá)通過在計(jì)算機(jī)芯片,大模型和云端智能訓(xùn)練等諸多領(lǐng)域的協(xié)同發(fā)力,加速了人形機(jī)器人發(fā)展的歷史進(jìn)程。圖:NVIDIA

OSMO工作負(fù)載內(nèi)容和技術(shù)支持圖:OSMO編排平臺(tái)方便開發(fā)者共享工作流的加速計(jì)算集群資料:

NVIDIA,中信建投機(jī)械臂和感知器的大升級(jí):IsaacManipulato和IsaacPercepto

Isaac

Manipulato:NVIDIA

Isaac

Manipulator

為機(jī)械臂提供了一系列最先進(jìn)的運(yùn)動(dòng)生成和模塊化AI功能,以及一系列強(qiáng)大的基礎(chǔ)模型和GPU加速庫。它在路徑規(guī)劃方面提供高達(dá)80倍的加速;零樣本感知提高了效率和吞吐量,使開發(fā)人員能夠自動(dòng)執(zhí)行更多新的機(jī)器人任務(wù)。目前,領(lǐng)先的機(jī)器人公司Yaskawa、Solomon、PickNik

Robotics、READY

Robotics、FrankaRobotics和

Teradyne旗下的

UniversalRobots正在與

NVIDIA合作,為客戶帶來

Isaac

Manipulator的應(yīng)用設(shè)備。

Isaac

Percepto:該感知器提供多攝像頭、3D環(huán)繞視覺功能,這些功能越來越多地用于制造和履行操作中采用的自主移動(dòng)機(jī)器人,以提高效率和工人安全,并降低錯(cuò)誤率和成本。

早期采用者包括ArcBest、比亞迪和凱傲集團(tuán),他們的目標(biāo)是在物料搬運(yùn)操作等方面實(shí)現(xiàn)新的自主水平。黃仁勛認(rèn)為,所有移動(dòng)的東西都將是機(jī)器人。部分考慮到技術(shù)的落地是逐層遞進(jìn)的,工廠內(nèi)的搬運(yùn)操作相對(duì)比較常規(guī)可控會(huì)被優(yōu)先應(yīng)用,而未來將近的更大的市場可能就是自動(dòng)駕駛和家用人形機(jī)器人等路徑規(guī)劃能力和視覺系統(tǒng)要求高的行業(yè)。圖:IsaacManipulator內(nèi)部原理圖圖:IsaacPercepto

更強(qiáng)的幾何識(shí)別能力資料:

NVIDIA,中信建投GR00T項(xiàng)目加速人型機(jī)器人產(chǎn)業(yè)化落地

從供給端看,具備更加強(qiáng)大的技術(shù)支持:人形機(jī)器人大規(guī)模應(yīng)用的一大難題是它們還不夠“聰明”,常常只能執(zhí)行預(yù)先設(shè)定的任務(wù),人機(jī)交互能力欠佳。最新的人形機(jī)器人通用基礎(chǔ)模型和高性能GPU,為人形機(jī)器人變得更聰明提供了強(qiáng)大的軟硬件支持,有望讓人形機(jī)器人更好地理解并執(zhí)行復(fù)雜任務(wù),從而推動(dòng)其大規(guī)模應(yīng)用。這意味著人形機(jī)器人將有可能實(shí)現(xiàn)自主式模仿學(xué)習(xí),只需要較少的數(shù)據(jù)輸入(如觀察人疊衣服的動(dòng)作)便能實(shí)現(xiàn)模仿,而不需要預(yù)先的任務(wù)設(shè)定。

從應(yīng)用端看,將加速人形機(jī)器人產(chǎn)業(yè)化進(jìn)程:GR00T大模型完善了人形機(jī)器人的產(chǎn)業(yè)生態(tài),從模型訓(xùn)練到模型應(yīng)用場景都給予了強(qiáng)有力的支撐,降低了應(yīng)用開發(fā)的進(jìn)入壁壘,在上游對(duì)口模型開發(fā)訓(xùn)練和下游機(jī)器人商品制造環(huán)節(jié)都將可能涌現(xiàn)更多的新興科技企業(yè),有望促進(jìn)人形機(jī)器人產(chǎn)業(yè)化加速落地。圖:人形機(jī)器人在Isaac

lab中模擬訓(xùn)練資料:

NVIDIA,中信建投第三章自動(dòng)駕駛Thor平臺(tái)搭載全新Blackwell

GPU25英偉達(dá)發(fā)布新一代集中式車載計(jì)算平臺(tái)Thor

DRIVEThor是專為生成式AI打造的車載計(jì)算平臺(tái)。2023年9月,英偉達(dá)Thor芯片首次發(fā)布,該芯片可提供高達(dá)2000TFLOP高性能算力,將自動(dòng)駕駛、自動(dòng)泊車、智能座艙等功能集成到一個(gè)單一的中央計(jì)算平臺(tái)中,實(shí)現(xiàn)車內(nèi)計(jì)算單元的大一統(tǒng)。同時(shí),Thor兼容Linux、Android和QNX三種系統(tǒng),有效解決車機(jī)系統(tǒng)碎片化問題。Thor車載計(jì)算平臺(tái)分為兩個(gè)版本,分別是單片1000TOPS算力版本和雙片2000TOPS算力版本。Thor預(yù)計(jì)最早明年開始量產(chǎn),同年上車。

DRIVEThor具有超級(jí)計(jì)算架構(gòu),技術(shù)優(yōu)勢顯著。DRIVE

Thor支持多域計(jì)算、自動(dòng)駕駛隔離功能和IVI,可以幫助制造商有效地將許多功能整合到單個(gè)片上系統(tǒng)(SoC)上。DRIVE

Thor是第一個(gè)集成推理轉(zhuǎn)換器引擎的AV平臺(tái),可以將Transformer

深度神經(jīng)網(wǎng)絡(luò)的推理性能提高多達(dá)9倍。新的超級(jí)芯片還采用了最新的NVLink-C2C芯片互連技術(shù),它能夠以最小的開銷跨鏈路共享、調(diào)度和分配工作。圖:NVIDIA車載計(jì)算路線圖圖:主流智駕芯片性能對(duì)比AI算力(TOPS@int8)CPU算力(KDMIPS)廠家型號(hào)存儲(chǔ)帶寬(GB/s)制造工藝(納米)英偉達(dá)特斯拉蔚來Thor20004755二代FSD480600750256448-900276300615220天璣NX9031CV3-AD685昆侖芯2安霸224百度512英偉達(dá)Orin27517616020513768220110220857Mobileye

EyeQUltraMDC610資料:英偉達(dá)官網(wǎng),中信建投英偉達(dá)全新車載計(jì)算平臺(tái)THOR合作需求旺盛

多家頭部電動(dòng)汽車制造商在GTC上宣布其搭載DRIVE

Thor的下一代AI車型

比亞迪、昊鉑、小鵬、Plus、Nuro、Waabi和文遠(yuǎn)知行紛紛采用DRIVE

Thor。比亞迪正在將與NVIDIA的長期協(xié)作從車端延伸到云端,除了在DRIVE

Thor上構(gòu)建下一代電動(dòng)車型外,比亞迪還計(jì)劃將NVIDIA的AI基礎(chǔ)設(shè)施用于云端AI開發(fā)和訓(xùn)練技術(shù),并使用NVIDIA

Isaac與NVIDIA

Omniverse平臺(tái)來開發(fā)用于虛擬工廠規(guī)劃和零售配置器的工具與應(yīng)用。新能源汽車品牌廣汽埃安宣布旗下高端豪華品牌昊鉑下一代電動(dòng)汽車將采用DRIVE

Thor平臺(tái),新車型將于2025年開始量產(chǎn),可實(shí)現(xiàn)L4級(jí)自動(dòng)駕駛,于2025年量產(chǎn)。小鵬也將Thor平臺(tái)作為“智能大腦”,助力自研XNGP智能輔助駕駛系統(tǒng)的開發(fā)。理想汽車和吉利旗下的極氪汽車均宣布將采用英偉達(dá)的DriveThor技術(shù)。

Thor賦能長途卡車、配送車和自動(dòng)駕駛出租車

除乘用車外,DRIVE

Thor還能夠滿足卡車、自動(dòng)駕駛出租車、配送車等其他細(xì)分領(lǐng)域的不同需求。在這些領(lǐng)域中,高性能計(jì)算和AI對(duì)于確保安全、可靠的駕駛操作至關(guān)重要。圖:DRIVE

Thor在單個(gè)SoC上整合智能汽車所有功能圖:THOR官宣與比亞迪合作資料:英偉達(dá)官網(wǎng),中信建投第四章英偉達(dá)AI應(yīng)用百花齊放28NVIDIA

GPU

加速計(jì)算藥物研發(fā)和應(yīng)用

NVIDIA

Clara

Discovery集GPU加速及優(yōu)化的框架、工具、應(yīng)用和預(yù)訓(xùn)練模型于一體,可為醫(yī)學(xué)影像、醫(yī)療器械、基因組學(xué)、藥物研發(fā)等醫(yī)療健康和生命科學(xué)領(lǐng)域的AI解決方案提供強(qiáng)勁助力。GPU助力的深度學(xué)習(xí)算法和Transformer模型將加速藥物研發(fā)的每個(gè)階段,從訓(xùn)練能夠理解化學(xué)空間的大型語言模型

(LLM),到分子動(dòng)力學(xué)模擬、蛋白質(zhì)結(jié)構(gòu)預(yù)測以及生成藥物設(shè)計(jì),新型深度學(xué)習(xí)技術(shù)正在改變科學(xué)家探索不斷擴(kuò)展的化學(xué)領(lǐng)域的方式。

Clara

Discovery經(jīng)過優(yōu)化,可基于

NVIDIA

DGX

A100(提供

5

petaFLOPS的性能)運(yùn)行。DGX

A100專為各種大規(guī)模加速計(jì)算工作負(fù)載而打造,可幫助研究人員更快地解決問題,并為IT提供統(tǒng)一的、易于部署的基礎(chǔ)設(shè)施,以支持新一代藥物研發(fā)。圖:GPU與CPU在生物醫(yī)藥各領(lǐng)域的性能對(duì)比圖:Clara

生態(tài)系統(tǒng)資料:英偉達(dá),中信建投英偉達(dá)宣布推出BioNemo,部署生物大模型

在GTC大會(huì)上,英偉達(dá)宣布推出BioNemo,這是一款基于NVIDIA

NeMo

Megatron構(gòu)建的應(yīng)用框架和云服務(wù),用于在超級(jí)計(jì)算規(guī)模下訓(xùn)練和部署大型生物分子Transformer

AI模型。BioNeMo隨附預(yù)訓(xùn)練的大型語言模型,專為蛋白質(zhì)、DNA和簡化分子線性輸入規(guī)范(SMILES)的語言而設(shè)計(jì)。BioNeMo可以用于在超級(jí)計(jì)算規(guī)模下訓(xùn)練和部署基于NeMo

Megatron的生物分子LLM,該框架包含Transformer模型MegaMolBART、ESM-1b和ProtT5,基于Transformer的大型語言模型正在為實(shí)時(shí)探索化學(xué)領(lǐng)域創(chuàng)造新的可能。

BioNeMo已在制藥公司、科技生物公司和軟件公司得到廣泛采用。它提供了一種全新的計(jì)算方法,使科學(xué)家能夠在低代碼、用戶友好的環(huán)境進(jìn)行生成式AI研究,從而減少甚至在某些情況下完全取代實(shí)驗(yàn)。除了通過BioNeMo開發(fā)、優(yōu)化和托管AI模型之外NVIDIA還通過對(duì)創(chuàng)新型科技生物公司的投資來推動(dòng)計(jì)算機(jī)輔助藥物發(fā)現(xiàn)生態(tài)系統(tǒng)的發(fā)展。圖表:BioNemo應(yīng)用框架圖表:使用

BioNeMo

框架的不同

GPU的

ESM2訓(xùn)練時(shí)間示例資料:英偉達(dá),中信建投NVIDIA

Earth-2平臺(tái)優(yōu)化氣候模擬,實(shí)現(xiàn)天氣可視化

NVIDIA

DGX

Cloud上的全新

Earth-2

API

能夠支持所有用戶創(chuàng)建基于

AI

的仿真,從而加快實(shí)現(xiàn)交互式、高分辨率模擬的速度,模擬范圍從全球大氣和局部云層到臺(tái)風(fēng)和湍流。當(dāng)前氣候技術(shù)行業(yè)的規(guī)模已達(dá)200億美元,Earth-2應(yīng)用編程接口通過結(jié)合該行業(yè)的公司所擁有的專有數(shù)據(jù),可幫助用戶在數(shù)秒內(nèi)發(fā)布預(yù)警和最新預(yù)報(bào)。

Earth-2

API提供各種AI模型,并且新添加一種名為

CorrDiff

的全新

NVIDIA

生成式

AI

模型。該模型基于領(lǐng)先的擴(kuò)散模型技術(shù),能將當(dāng)前數(shù)值模擬的分辨率提升

12.5

倍,相比傳統(tǒng)方法,速度和能效分別提升了

1000

倍和

3000

倍。它不僅可以糾正粗分辨率預(yù)報(bào)中的錯(cuò)誤,還能夠生成對(duì)決策至關(guān)重要的指標(biāo)。Earth-2云API的另一個(gè)關(guān)鍵組成部

NVIDIAOmniverse,該計(jì)算平臺(tái)可幫助個(gè)人和團(tuán)隊(duì)開發(fā)基于通用場景描述

(OpenUSD)的

3D工作流與應(yīng)用。圖表:EARTH-2氣候數(shù)字孿生平臺(tái)圖表:Earth-2交互式可視化界面展示資料:英偉達(dá),中信建投TSMC和Synopsys將NVIDIA計(jì)算光刻平臺(tái)投入生產(chǎn)

NVIDIA于GTC大會(huì)宣布,TSMC和Synopsys將在生產(chǎn)中使用NVIDIA計(jì)算光刻平臺(tái),可以加快下一代半導(dǎo)體芯片的制造速度。TSMC

與Synopsys

已將

NVIDIA

cuLitho

集成到其軟件、制造工藝和系統(tǒng)中,在加速芯片制造速度的同時(shí),也加快了對(duì)未來最新一代

NVIDIA

Blackwell

架構(gòu)

GPU

的支持。

NVIDIA還推出了能夠增強(qiáng)GPU加速計(jì)算光刻軟件庫

cuLitho的全新生成式AI算法。與當(dāng)前基于

CPU

的方法相比,新方法大幅改進(jìn)了半導(dǎo)體制造工藝。與目前基于

CPU

的方法相比,在

NVIDIA

cuLitho

軟件庫上運(yùn)行的

SynopsysProteus

光學(xué)鄰近效應(yīng)校正軟件顯著加快了計(jì)算工作負(fù)載。NVIDIA

開發(fā)的生成式

AI

應(yīng)用算法進(jìn)一步提高了

cuLitho

平臺(tái)的價(jià)值,在

cuLitho

加快流程速度的基礎(chǔ)上,這一全新生成式

AI

工作流將速度又提升了

2

倍。圖:cuLITHO構(gòu)成元素圖:GPU升級(jí)促使OPC加速資料:英偉達(dá),中信建投6G研究云平臺(tái)推出,以AI推動(dòng)無線通信的發(fā)展

NVIDIA于GTC大會(huì)上宣布推出一個(gè)6G研究平臺(tái),該平臺(tái)為研究人員提供了一種開發(fā)下一階段無線技術(shù)的新方法。NVIDIA6G研究云平臺(tái)具有開放、靈活和互聯(lián)的特征,它為研究人員提供了一整套全面的工具,以推進(jìn)AI應(yīng)用在無線接入網(wǎng)絡(luò)(RAN)

技術(shù)。該平臺(tái)使企業(yè)能夠加快開發(fā)

6G

技術(shù),從而將數(shù)萬億臺(tái)設(shè)備與云基礎(chǔ)設(shè)施連接起來,為建立一個(gè)以自動(dòng)駕駛汽車、智能空間以及各種擴(kuò)展現(xiàn)實(shí)和沉浸式教育體驗(yàn)與協(xié)作機(jī)器人為依托的超級(jí)智能世界奠定基礎(chǔ)。

該平臺(tái)由三部分構(gòu)成:適用于

6G

NVIDIA

Aerial

Omniverse

數(shù)字孿生、NVIDIA

Aerial

CUDA

加速的無線接入網(wǎng)絡(luò)和NVIDIA

Sionna神經(jīng)無線電框架。平臺(tái)首批采用者和生態(tài)系統(tǒng)合作伙伴包括Ansys、Arm、蘇黎世聯(lián)邦理工學(xué)院、富士通、是德科技、諾基亞、美國東北大學(xué)、羅德與施瓦茨公司、三星、軟銀公司和Viavi等。圖:英偉達(dá)

6G研究云平臺(tái)圖:主要

6G

用例及其要求用例子類別數(shù)據(jù)速率延遲變量覆蓋范圍從

Wide到沉浸式

XR

AR、VR、MR、全息通信

中到非常高

(10sGbps)Local遠(yuǎn)程傳輸、遠(yuǎn)程教育、觸覺互聯(lián)網(wǎng)低到中

(約

1Gbps)低寬電子健康Real-TimeDigitalTwins,實(shí)時(shí)數(shù)字孿生,In-Robost子網(wǎng),SmartFactory,智能工廠,SmartCity,智慧城市大規(guī)模智能物聯(lián)網(wǎng)從低到非常高

(10s從

Wide到輕松至超低從低到超低Gbps)Local高保真移動(dòng)通

沉浸式協(xié)作、社交網(wǎng)絡(luò)元宇宙高

(1Gbps以上)本地信資料:英偉達(dá),中信建投NVIDIA

推出云量子計(jì)算機(jī)模擬微服務(wù)

NVIDIA

量子云基于

NVIDIA

開源

CUDA-Q

量子計(jì)算平臺(tái),部署量子處理器(QPU)的公司有四分之三都在使用該平臺(tái)。量子云作為一項(xiàng)微服務(wù),首次支持用戶在云端構(gòu)建并測試新的量子算法和應(yīng)用,包括支持量子-經(jīng)典混合算法編程的功能強(qiáng)大的模擬器和工具等,旨在幫助研究人員和開發(fā)人員在化學(xué)、生物學(xué)、材料科學(xué)等關(guān)鍵科學(xué)領(lǐng)域的量子計(jì)算研究中取得突破。

相較于其他量子框架,NVIDIA

量子云可顯著加速量子算法。量子電路模擬在多個(gè)

H100

GPU

上可實(shí)現(xiàn)加速高達(dá)多線程

CPU的

60倍。模擬還可以使用在多個(gè)

GPU上運(yùn)行的

NVIDIA量子云擴(kuò)大量子位的數(shù)量,同時(shí)保持幾乎恒定的運(yùn)行時(shí)。

NVIDIA量子計(jì)算生態(tài)系統(tǒng)目前有160多家合作伙伴,

括Google

Cloud、Microsoft

Azure、Oracle

Cloud

Infrastructure等領(lǐng)先云服務(wù)提供商,以及IQMQuantumComputers、OQC、ORCAComputing、qBraid和Quantinuum等量子領(lǐng)域領(lǐng)先企業(yè)。圖表:NVIDIAQuantumCloud

顯著加快量子算法速度圖表:NVIDIA量子云工作流程資料:英偉達(dá),中信建投NVIDIA

NIMs微服務(wù)優(yōu)化

AI推理

在軟件服務(wù)方面,英偉達(dá)發(fā)布了NIM,一款針對(duì)AI推理系統(tǒng)的新軟件。傳統(tǒng)企業(yè)開發(fā)者可通過調(diào)動(dòng)一系列NIMs,簡單訓(xùn)練和部署完全利用自己數(shù)據(jù)的專屬行業(yè)模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論