數(shù)據(jù)中心AI芯片市場(chǎng)有多大

上傳人：1*** IP屬地：湖南上傳時(shí)間：2024-09-26 格式：DOCX 頁(yè)數(shù)：8 大小：2MB 積分：9.6 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩3頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2024年很有可能成為AI芯片的元年。有預(yù)測(cè)稱，今年AI芯片可能會(huì)迎來(lái)強(qiáng)勁甚至迅猛的增長(zhǎng)。然而，一個(gè)令人關(guān)注的問(wèn)題是，這種上升趨勢(shì)能夠持續(xù)多久呢？2023年底，AMD大膽地宣稱，到2027年，數(shù)據(jù)中心AI芯片的總潛在市場(chǎng)（TAM）將達(dá)到4000億美元，復(fù)合年增長(zhǎng)率（CAGR）超過(guò)70%。這一預(yù)測(cè)引起了不同的反應(yīng)，但也從側(cè)面說(shuō)明了大型語(yǔ)言模型（LLM）作為處理生成式人工智能（GenAI）應(yīng)用核心的驅(qū)動(dòng)力。作為圖形處理單元（GPU）市場(chǎng)的領(lǐng)導(dǎo)者，英偉達(dá)的成功證明了這些芯片的潛在市場(chǎng)規(guī)模。英偉達(dá)過(guò)去一年的股價(jià)上漲了217%，在過(guò)去三年增長(zhǎng)了140%。在最新的11月財(cái)報(bào)中，英偉達(dá)公布的營(yíng)收為181.2億美元，其中數(shù)據(jù)中心營(yíng)收為145.1億美元。整體銷售額同比增長(zhǎng)206%，而數(shù)據(jù)中心銷售額同期增長(zhǎng)了279%。所有這些都證實(shí)了數(shù)據(jù)中心芯片的銷售正經(jīng)歷急劇上升的趨勢(shì)。然而，關(guān)鍵問(wèn)題是，這個(gè)增長(zhǎng)趨勢(shì)是否能夠達(dá)到4000億美元的高度。英偉達(dá)在數(shù)據(jù)中心AIGPU市場(chǎng)至少占據(jù)80%的份額，未來(lái)三年預(yù)計(jì)將迎來(lái)巨大增長(zhǎng)。然而，要實(shí)現(xiàn)高達(dá)4000億美元的市場(chǎng)規(guī)模，英偉達(dá)的表現(xiàn)需要比目前更出色，同時(shí)其他廠商也需要超出預(yù)期。競(jìng)爭(zhēng)者不甘示弱AMDAMD認(rèn)為其將在未來(lái)三年內(nèi)實(shí)現(xiàn)大幅增長(zhǎng)。2023年12月，AMD發(fā)布了MI300系列芯片，旨在在推理方面超越英偉達(dá)的GPU。同時(shí)發(fā)布的另一款產(chǎn)品AMDInstinctMI300A加速處理單元(APU)，將CPU和GPU核心與內(nèi)存集成在一個(gè)平臺(tái)中。MI300X專為云提供商和企業(yè)設(shè)計(jì)，專為生成式AI應(yīng)用而打造，MI300XGPU擁有超過(guò)1500億個(gè)晶體管，以2.4倍的內(nèi)存超越了英偉達(dá)的H100。峰值內(nèi)存帶寬達(dá)到5.3TB/s，是H1003.3TB/s的1.6倍。AMDInstinctMI300AAPU配備128GBHBM3內(nèi)存。據(jù)稱，與之前的M250X處理器相比，MI300A在HPC和AI工作負(fù)載上的每瓦性能提高了1.9倍。

AMD總裁兼首席執(zhí)行官蘇姿豐(LisaSu)在去年10月的公司第三季度電話會(huì)議上表示：“隨著2024年的到來(lái)，我們預(yù)計(jì)收入將持續(xù)增長(zhǎng)，而且主要來(lái)源將是AI?！薄霸贏I領(lǐng)域，我們的客戶覆蓋面很廣，包括從超大規(guī)模企業(yè)到原始設(shè)備制造商、企業(yè)客戶以及一些新的人工智能初創(chuàng)企業(yè)。從工作負(fù)載的角度來(lái)看，我們希望MI300能夠同時(shí)處理訓(xùn)練和推理工作負(fù)載?！庇⑻貭栍⑻貭柹蟼€(gè)月推出了AI芯片Gaudi3以及第五代Xeon處理器，作為進(jìn)一步進(jìn)軍數(shù)據(jù)中心AI市場(chǎng)的一部分。

英特爾表示，Gaudi3是專為深度學(xué)習(xí)和創(chuàng)建大規(guī)模生成人工智能模型而設(shè)計(jì)的下一代人工智能加速器，將與英偉達(dá)的H100和AMD的MI300X展開(kāi)競(jìng)爭(zhēng)。英特爾聲稱Xeon是唯一內(nèi)置AI加速的主流數(shù)據(jù)中心處理器，全新第五代Xeon在多達(dá)200億個(gè)參數(shù)的模型上提供高達(dá)42%的推理和微調(diào)能力。它也是唯一一款具有一致且不斷改進(jìn)的MLPerf訓(xùn)練和推理基準(zhǔn)測(cè)試結(jié)果的CPU。Xeon的內(nèi)置人工智能加速器，加上優(yōu)化的軟件和增強(qiáng)的遙測(cè)功能，可以為通信服務(wù)提供商、內(nèi)容交付網(wǎng)絡(luò)和包括零售、醫(yī)療保健和制造在內(nèi)的廣泛垂直市場(chǎng)實(shí)現(xiàn)更易于管理、更高效的高要求網(wǎng)絡(luò)和邊緣工作負(fù)載部署。云廠商各顯神通AWS、谷歌等云廠商一直在為自己的大型數(shù)據(jù)中心打造定制芯片。一方面是不想過(guò)度依賴英偉達(dá)，另外針對(duì)自身需求定制芯片也有助于提高性能和降低成本。AWS亞馬遜的AI芯片Trainium和Inferentia專為訓(xùn)練和運(yùn)行大型人工智能模型而設(shè)計(jì)。AWSTrainium2是AWS專門為超過(guò)1000億個(gè)參數(shù)模型的深度學(xué)習(xí)訓(xùn)練打造的第二代機(jī)器學(xué)習(xí)(ML)加速器。AWSCEOAdamSelipsky表示，近期推出的Trainium2的速度是其前身的4倍，能源效率是其之前的2倍。Tranium2將在AWS云中由16個(gè)芯片組成的集群中的ECTrn2實(shí)例中使用，在AWS的EC2UltraCluster產(chǎn)品中可擴(kuò)展到多達(dá)10萬(wàn)個(gè)芯片。AWS表示，10萬(wàn)個(gè)Trainium芯片可提供65exaflops的計(jì)算能力，相當(dāng)于每個(gè)芯片可提供650teraflops的計(jì)算能力。AWSInferentia2加速器與第一代相比在性能和功能方面實(shí)現(xiàn)了重大飛躍。Inferentia2的吞吐量提高了4倍，延遲低至1/10。AWSInferentia2支持多種數(shù)據(jù)類型，包括FP32、TF32、BF16、FP16和UINT8，還支持新的可配置FP8(cFP8)數(shù)據(jù)類型，因?yàn)樗鼫p少了模型的內(nèi)存占用和I/O要求。AWSInferentia2具有嵌入式通用數(shù)字信號(hào)處理器(DSP)，可實(shí)現(xiàn)動(dòng)態(tài)執(zhí)行，因此無(wú)需在主機(jī)上展開(kāi)或執(zhí)行控制流運(yùn)算符。AWSInferentia2還支持動(dòng)態(tài)輸入形狀，這對(duì)于輸入張量大小未知的模型（例如處理文本的模型）至關(guān)重要。AWSInferentia2支持用C++編寫的自定義運(yùn)算符。谷歌2023年12月，谷歌發(fā)布最新的CloudTPUv5p，并號(hào)稱是迄今最強(qiáng)大的TPU。每個(gè)TPUv5pPod由8,960個(gè)芯片組成，采用3D環(huán)面拓?fù)洌ミB速度達(dá)4,800Gbps。與TPUv4相比，TPUv5p的FLOPS提高了2倍以上，高帶寬內(nèi)存(HBM)提高了3倍以上。TPUv5p專為性能、靈活性和規(guī)模而設(shè)計(jì)，訓(xùn)練大型LLM模型的速度比上一代TPUv4快2.8倍。此外，借助第二代SparseCores，TPUv5p訓(xùn)練嵌入密集模型的速度比TPUv42快1.9倍。除了性能改進(jìn)之外，TPUv5p在每個(gè)pod的總可用FLOP方面的可擴(kuò)展性也比TPUv4高4倍。與TPUv4相比，每秒浮點(diǎn)運(yùn)算次數(shù)(FLOPS)加倍，并且單個(gè)Pod中的芯片數(shù)量加倍，可顯著提高訓(xùn)練速度的相對(duì)性能。微軟2023年11月，微軟推出了AI芯片AzureMaia100。Maia100是MaiaAI加速器系列中的首款產(chǎn)品。Maia采用5nm臺(tái)積電工藝制造，擁有1050億個(gè)晶體管，比AMDMI300XAIGPU的1530億個(gè)晶體管少約30%。微軟表示，“Maia支持我們首次實(shí)現(xiàn)低于8位數(shù)據(jù)類型（MX數(shù)據(jù)類型），以便共同設(shè)計(jì)硬件和軟件，這有助于我們支持更快的模型訓(xùn)練和推理時(shí)間。”Maia100目前正在GPT3.5Turbo上進(jìn)行測(cè)試，該模型也為ChatGPT、BingAI工作負(fù)載和GitHubCopilot提供支持。微軟正處于部署的早期階段，還不愿意發(fā)布確

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

數(shù)據(jù)中心AI芯片市場(chǎng)有多大

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

數(shù)據(jù)中心AI芯片市場(chǎng)有多大

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔