版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
目
錄ChatGPT:生成式AI引爆技術(shù)奇點(diǎn)AI+Chiplet:信息革命的基石AI還可以買什么?0102030501ChatGPT:生成式AI引爆技術(shù)奇點(diǎn)ChatGPT:生成式AI引爆技術(shù)奇點(diǎn)01?
AIGC全稱為AI-Generated
Content,指基于生成對(duì)抗網(wǎng)絡(luò)GAN、大型預(yù)訓(xùn)練模型等人工智能技術(shù),通過已有數(shù)據(jù)尋找規(guī)律,并通過適當(dāng)?shù)姆夯芰ι上嚓P(guān)內(nèi)容的技術(shù)。與之相類似的概念還包括Synthetic
media,合成式媒體,主要指基于AI生成的文字、圖像、音頻等?
2020年,1750億參數(shù)的GPT-3在問答、摘要、翻譯、續(xù)寫等語言類任務(wù)上均展現(xiàn)出了優(yōu)秀的通用能力,證明了“大力出奇跡”在語言類模型上的可行性。自此之后,海量數(shù)據(jù)、更多參數(shù)、多元的數(shù)據(jù)采集渠道等成為國內(nèi)清華大學(xué)、智源研究院、達(dá)摩院、、北京大學(xué)、百度等參與者的關(guān)注點(diǎn)。?
2022年12月,ChatGPT
3.5令人驚艷的使用體驗(yàn)引爆社會(huì)熱潮,搜索熱度和用戶增長都出現(xiàn)了極為明顯的提升。?
目前,大型文本預(yù)訓(xùn)練模型作為底層工具,商業(yè)變現(xiàn)能力逐漸清晰。以GPT-3為例,其文本生成能力已被直接應(yīng)用于Writesonic、
Conversion.ai、
Snazzy
AI、Copysmith、
Copy.ai、
Headlime等文本寫作/編輯工具中。同時(shí)也被作為部分文本內(nèi)容的提供方,服務(wù)于AI
dungeon等文本具有重要意義的延展應(yīng)用領(lǐng)域。ChatGPT搜索熱度居高不下各應(yīng)用1億用戶達(dá)成時(shí)長(月)120100806040200807060504030201009080706050403020100ChatGPT
TikTok
Spotify
TelegramUberGoogleTranslate2022/12/12023/1/12023/2/17日均線2023/3/1ChatGPTSpotifyTikTokInstagramUberPinterestGoogleTranslate搜索熱度Telegram資料:Google
Trends,甲子光年,長江證券研究所ChatGPT:生成式AI引爆技術(shù)奇點(diǎn)01?
過去傳統(tǒng)的人工智能偏向于分析能力,即通過分析一組數(shù)據(jù),發(fā)現(xiàn)其中的規(guī)律和模式并用于其他多種用途,比如應(yīng)用最為廣泛的個(gè)性化推薦算法。而現(xiàn)在人工智能正在生成新的東西,而不是僅僅局限于分析已經(jīng)存在的東西,實(shí)現(xiàn)了人工智能從感知理解世界到生成創(chuàng)造世界的躍遷。因此,從這個(gè)意義上來看,廣義的AIGC
可以看作是像人類一樣具備生成創(chuàng)造能力的Al技術(shù),即生成式AI它可以基于訓(xùn)練數(shù)據(jù)和生成算法模型,自主生成創(chuàng)造新的文本、圖像、音樂、視頻、3D
交互內(nèi)容(如虛擬化身、虛擬物品、虛擬環(huán)境)等各種形式的內(nèi)容和數(shù)據(jù),以及包括開啟科學(xué)新發(fā)現(xiàn)創(chuàng)造新的價(jià)值和意義等。因此,AIGC
已經(jīng)加速成為了AI
領(lǐng)域的新疆域,推動(dòng)人工智能迎來下一個(gè)時(shí)代。內(nèi)容創(chuàng)作模式的四個(gè)發(fā)展階段生成式AI技術(shù)的成熟應(yīng)用進(jìn)程時(shí)間表2020年之前202020222023?2025?2030?詐騙垃圾信息識(shí)別垂直領(lǐng)域的文案撰寫實(shí)現(xiàn)可精調(diào)(論文等)文本領(lǐng)域代碼領(lǐng)域圖像領(lǐng)域更長的文本二稿終稿,水平高于人類平均值終稿,水平高于專業(yè)寫手基礎(chǔ)文案撰寫初稿翻譯基礎(chǔ)問答回應(yīng)根據(jù)文本生成終版應(yīng)用程序,比全職開發(fā)者水平更高更長的代碼更精確的表達(dá)支持更多語種領(lǐng)域更垂直根據(jù)文本生成初版應(yīng)用程序單行代碼補(bǔ)足多行代碼生成藝術(shù)圖標(biāo)攝影終稿,水平高于專職藝術(shù)家、設(shè)計(jì)師等模仿(產(chǎn)品設(shè)計(jì)、建筑等)終稿(產(chǎn)品設(shè)計(jì)、建筑等)視頻/3D/游戲領(lǐng)域AI版Roblox可依個(gè)人夢(mèng)想定制的游戲與電影視頻和3D文件的基礎(chǔ)版/初稿3D/視頻模型的初步嘗試二稿大模型可用情況初步嘗試基本實(shí)現(xiàn)未來潛力資料:《AIGC發(fā)展趨勢(shì)報(bào)告2023》騰訊研究院,長江證券研究所人工智能帶來的生產(chǎn)力變革風(fēng)聲已近01?
追求生產(chǎn)力的提升和生產(chǎn)關(guān)系的優(yōu)化,是人類社會(huì)發(fā)展的根源動(dòng)力和核心目標(biāo),而生產(chǎn)力升級(jí)的最本質(zhì)目標(biāo)就是效率提升和成本降低。從人類社會(huì)四次工業(yè)/科技革命來看,第一次工業(yè)革命的核心成果是以蒸汽機(jī)為代表的機(jī)械替代人力,第二次工業(yè)革命是以電力、燃油為代表的能源突破,第三次是以計(jì)算機(jī)及信息技術(shù)為代表的信息結(jié)構(gòu)性變革和自動(dòng)化生產(chǎn),其共同的特征就是生產(chǎn)規(guī)模的不斷擴(kuò)大、生產(chǎn)方式上科技應(yīng)用不斷地向工業(yè)和社會(huì)的更高層結(jié)構(gòu)滲透。底層的、低技術(shù)含量的、規(guī)模龐大的生產(chǎn)模塊不斷被機(jī)器替代,人力生產(chǎn)持續(xù)向高層的、復(fù)雜的、尖端的生產(chǎn)方式和技術(shù)模塊演進(jìn),是一個(gè)不變的趨勢(shì)。歷次工業(yè)革命中國人工智能場(chǎng)景發(fā)展程度第一次工業(yè)革命機(jī)械時(shí)代第二次工業(yè)革命電氣時(shí)代信息革命信息時(shí)代智能革命(進(jìn)行中)智能時(shí)代核心成果標(biāo)志事件機(jī)械織布機(jī)、蒸汽機(jī)發(fā)電機(jī)、內(nèi)燃機(jī)計(jì)算機(jī)、互聯(lián)網(wǎng)人工智能19世紀(jì)70年代:傳送帶、
20世紀(jì)40-90年代:計(jì)算機(jī)1784年第一臺(tái)機(jī)械織布機(jī)
電燈、發(fā)電機(jī)、內(nèi)燃機(jī)、
、航天技術(shù)、原子能(核
高效能運(yùn)算、智能手機(jī)、無線電報(bào)
能)、互聯(lián)網(wǎng)、材料技術(shù)網(wǎng)絡(luò)升級(jí)(5G)、物聯(lián)網(wǎng)、20世紀(jì)初:流水線、飛機(jī)
、移動(dòng)終端、移動(dòng)互聯(lián)網(wǎng)人工智能1785年蒸汽機(jī)、汽車等第一次工業(yè)革命的新增工業(yè)部門如鋼鐵、煤炭、機(jī)械加工等的發(fā)展電力驅(qū)動(dòng)多種工業(yè)部分發(fā)展手工業(yè)發(fā)展瓶頸數(shù)據(jù)在社會(huì)中的全面滲透多種科學(xué)的理論和應(yīng)用發(fā)展連攜提速,科學(xué)技術(shù)轉(zhuǎn)
在材料等多種基礎(chǔ)工業(yè)突化為直接生產(chǎn)力的速度加快以法拉第的電磁學(xué)為代表學(xué)等自然科學(xué)積累
的自然科學(xué)開始引領(lǐng)工業(yè)進(jìn)步發(fā)展基礎(chǔ)(技術(shù)層面)牛破下算力的指數(shù)增長信息傳遞的廣覆蓋、高精度、低延遲智能擬人化、計(jì)算規(guī)?;?、數(shù)據(jù)滲透全面化,智能應(yīng)用覆蓋社會(huì)全場(chǎng)景機(jī)械制造,人力解放進(jìn)程
能源升級(jí),機(jī)械應(yīng)用基礎(chǔ)
信息處理與傳遞演進(jìn),科意義特征開始夯實(shí)技應(yīng)用指數(shù)增長科技革命形態(tài)轉(zhuǎn)變,出現(xiàn)較強(qiáng)民用傾向工業(yè)革命主要圍繞生產(chǎn)工業(yè)革命向軍事蔓延尖端科技向民用下沉的速度開始加快,尖端、軍用科技研究方向外開始出現(xiàn)專業(yè)的科技民用化的研究方向智能革命浪卷人類社會(huì)全方面蒸汽機(jī)、機(jī)械使得制造業(yè)中工廠開始替代原始私人作坊流水線使得單一工廠生產(chǎn)向產(chǎn)業(yè)鏈分工生產(chǎn)轉(zhuǎn)變資料:IDC,長江證券研究所人工智能三要素逐步成熟,推動(dòng)行業(yè)進(jìn)入爆發(fā)期01?
AIGC的本質(zhì)是內(nèi)容與場(chǎng)景,其發(fā)展需要AI與后端基建,算法、算據(jù)和算力三要素耦合共振。AIGC的三大發(fā)展階段是:?
模型賦智階段(從現(xiàn)實(shí)生成數(shù)字):AIGC利用AI技術(shù)構(gòu)建模擬現(xiàn)實(shí)世界的數(shù)字孿生模型;?
認(rèn)知交互階段(從數(shù)字生成數(shù)字):A能夠?qū)W習(xí)并創(chuàng)作更豐富的內(nèi)容
;?
空間賦能階段(從數(shù)字生成現(xiàn)實(shí)):AIGC基于物聯(lián)網(wǎng),多模態(tài)技術(shù)獲取多維信息,實(shí)現(xiàn)更加智能的人與機(jī)器互動(dòng)。?
市場(chǎng)規(guī)模:2021
年,全球人工智能市場(chǎng)收支規(guī)模(含硬件、軟件及服務(wù))達(dá)
850
億美元。IDC
預(yù)測(cè),2022
年該市場(chǎng)規(guī)模將同比增長約
20%至1017億美元,并將于
2025
年突破
2000
億美元大關(guān),CAGR
達(dá)24.5%,顯示出強(qiáng)勁的產(chǎn)業(yè)化增長勢(shì)頭。2021年,中國人工智能市場(chǎng)收支規(guī)模達(dá)到
82億美元,占全球市場(chǎng)規(guī)模的9.6%,在全球人工智能產(chǎn)業(yè)化地區(qū)中僅次于美國及歐盟,位居全球第三。IDC
預(yù)測(cè),2022
年該市場(chǎng)規(guī)模將同比增長約
24%至
102
億美元,并將于
2025
年突破
160
億美元。人工智能三要素逐步成熟,推動(dòng)行業(yè)進(jìn)入爆發(fā)期全球及我國人工智能市場(chǎng)收支規(guī)模及預(yù)測(cè)(億美元)數(shù)據(jù)層面標(biāo)注大數(shù)據(jù)語料庫高精度訓(xùn)練集2500200015001000500投喂計(jì)算任務(wù)2042訓(xùn)練算力層面算法層面1017核心技術(shù)突破多模態(tài)認(rèn)知計(jì)算850數(shù)據(jù)數(shù)據(jù)巨量化硬件算力-本地化16182102AIGC0實(shí)時(shí)算力-云計(jì)算20212022E全球
中國2025E認(rèn)知交互力算法跨模態(tài)融合算力內(nèi)容創(chuàng)造力感知+交互數(shù)字孿生虛擬現(xiàn)實(shí)全息立體應(yīng)用場(chǎng)景智能交互-邊緣計(jì)算資料:甲子光年,IDC
Global,IDC
China,上海數(shù)字大腦研究院,長江證券研究所大模型參數(shù)量快速提升,算力需求大幅增加01?
大模型主要由各大龍頭企業(yè)推動(dòng),在國內(nèi)科技公司中,阿里巴巴達(dá)摩院在2020年推出了M6大模型,百度在2021年推出了文心大模型,騰訊在2022年推出了混元AI大模型。?
大模型最核心的除了算法外主要是參數(shù)的設(shè)置,其中參數(shù)量(Params)形容模型的大小程度,類似于算法中的空間復(fù)雜度,往往參數(shù)量越大(復(fù)雜程度越高)的神經(jīng)網(wǎng)絡(luò)模型對(duì)算力的需求程度更高,復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型的算法參數(shù)量約千億級(jí)別甚至萬億級(jí)別,與已知應(yīng)用級(jí)別的呈現(xiàn)指數(shù)級(jí)別的差異。這些模型不僅在參數(shù)量上達(dá)到了千億級(jí)別,而且數(shù)據(jù)集規(guī)模也高達(dá)TB級(jí)別,想要完成這些大模型的訓(xùn)練,就至少需要投入超過1000PetaFlop/s-day的計(jì)算資源。主要大模型建設(shè)情況各大主要模型的參數(shù)量巨大廠商預(yù)訓(xùn)練模型BERT應(yīng)用語言理解與生成對(duì)話系統(tǒng)參數(shù)量(億)4810-LaMDA谷歌PaLMImagenParti語言理解與生成、推理、代碼生成語言理解與圖像生成語言理解與圖像生產(chǎn)視覺識(shí)別54001102006.417017501501228004141750120FlorenceTuring-NLGOPT-1758M2M-100GatoGopherAlphaCodeGPT3微軟語言理解、生成語言模型100種語言互譯多面手的智能體語言理解與生成代碼生成FacebookDeepMindOpen
AI語言理解與生成、推理等圖像生成、跨模態(tài)檢索代碼生成CLIP&DALL-ECodex120ChatGPT語言理解與生成、推理等-英偉達(dá)
Megatron-Turing
NLGStability
AI
Stable
Diffusion語言理解與生成、推理等5300-語言理解與圖像生產(chǎn)資料:StarLab,《AIGC發(fā)展趨勢(shì)報(bào)告2023》騰訊研究院,長江證券研究所大模型參數(shù)量快速提升,算力需求大幅增加01?
大模型主要由各大龍頭企業(yè)推動(dòng),在國內(nèi)科技公司中,阿里巴巴達(dá)摩院在2020年推出了M6大模型,百度在2021年推出了文心大模型,騰訊在2022年推出了混元AI大模型。?
大模型最核心的除了算法外主要是參數(shù)的設(shè)置,其中參數(shù)量(Params)形容模型的大小程度,類似于算法中的空間復(fù)雜度,往往參數(shù)量越大(復(fù)雜程度越高)的神經(jīng)網(wǎng)絡(luò)模型對(duì)算力的需求程度更高,復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型的算法參數(shù)量約千億級(jí)別甚至萬億級(jí)別,與已知應(yīng)用級(jí)別的呈現(xiàn)指數(shù)級(jí)別的差異。這些模型不僅在參數(shù)量上達(dá)到了千億級(jí)別,而且數(shù)據(jù)集規(guī)模也高達(dá)TB級(jí)別,想要完成這些大模型的訓(xùn)練,就至少需要投入超過1000PetaFlop/s-day的計(jì)算資源。大模型的基礎(chǔ)是龐大的算力基建2018年后大模型訓(xùn)練算力需求顯著提升資料:甲子光年,英偉達(dá),長江證券研究所大模型參數(shù)量快速提升,算力需求大幅增加01?
1、算力總需求量=參數(shù)量*詞條長度(單個(gè)詞語計(jì)算次數(shù),單精度)*訓(xùn)練詞數(shù)?
2、GPU總需求量=算力總需求量/單張加速卡算力/計(jì)算用時(shí)?
按照175B的參數(shù)規(guī)模測(cè)算,若訓(xùn)練時(shí)長為1個(gè)月,則英偉達(dá)A100
GPU需要張數(shù)超6000張,A100加速卡成本1.56億美元;若參數(shù)量提升至481B,則加速卡成本上升至4.28億美元;若481B模型的計(jì)算時(shí)間限制為一周,則僅加速卡成本將達(dá)到18.35億美元。又好(參數(shù)量大)、又快(迭代時(shí)間短)的需求將大幅推升龍頭廠商的硬件軍備競賽。?
同時(shí),由于22.10的新制裁方案,A100對(duì)國內(nèi)是禁售的,需要申請(qǐng)新的出口許可,因此保質(zhì)保量的國內(nèi)供應(yīng)商是國內(nèi)龍頭廠商正在迫切尋找的。主要大模型算力加速卡需求情況參數(shù)量(億)訓(xùn)練詞數(shù)
單個(gè)詞語計(jì)算計(jì)算用時(shí)(h)僅考慮A100GPU成本
A100成本(億美廠商預(yù)訓(xùn)練模型應(yīng)用總計(jì)算量(萬億億次)
算力(TFLOP/s)GPU需要數(shù)量(顆)(億)次數(shù)(億美元)元)BERT語言理解與生成481030006865819.5720171301.714.28LaMDA對(duì)話系統(tǒng)---------PaLM語言理解與生成、推理、代碼生成540030006972019.5720192311.924.81谷歌ImagenParti語言理解與圖像生成語言理解與圖像生產(chǎn)110200300030006619836019.519.57207203927120.040.070.100.18FlorenceTuring-NLGOPT-1758M2M-100Gato視覺識(shí)別語言理解、生成語言模型100種語言互譯多面手的智能體語言理解與生成代碼生成6.41701750150123000300030003000300030003000666666611.52306315027021.65040745.219.519.519.519.519.519.519.572072072072072072072023605623253443997214740.000.060.620.050.001.000.150.010.151.560.130.012.490.37微軟FacebookDeep
MindOpenAIGopherAlphaCode2800414GPT3語言理解與生成、推理等175030006315019.572062320.621.56CLIP&DALL-ECodex圖像生成、跨模態(tài)檢索代碼生成120120-30003000-66-216216-19.519.5-720720-427427-0.040.04-0.110.11-ChatGPT語言理解與生成、推理等英偉達(dá)Megatron-Turing
NLG語言理解與生成、推理等530030006954019.5720188751.894.72StabilityAIStableDiffusion語言理解與圖像生產(chǎn)---------資料:《AIGC發(fā)展趨勢(shì)報(bào)告2023》騰訊研究院,長江證券研究所(單個(gè)詞語計(jì)算次數(shù)即單精度假設(shè)為均為6次;算力假設(shè)為英偉達(dá)Tesla
A100
GPU算力19.5TFLOPS;A100成本為包含8張Tesla
A100及配套芯片,即整機(jī)價(jià)格)大模型參數(shù)量快速提升,算力需求大幅增加01?
人工智能技術(shù)將全面賦能各行各業(yè)。預(yù)計(jì)到2025年,人工智能涉及的場(chǎng)景規(guī)模將達(dá)到2,081億美金,并在無人駕駛、智慧金融、智慧醫(yī)療、智慧零售、文娛等領(lǐng)域大顯身手。人工智能技術(shù)對(duì)于算力的核心拉動(dòng)點(diǎn)在于未來各應(yīng)用場(chǎng)景內(nèi)單設(shè)備芯片算力的增長和人工智能技術(shù)的行業(yè)滲透率的進(jìn)一步提升,帶動(dòng)對(duì)云計(jì)算中心、邊緣設(shè)備和終端NPU的巨大需求。整體預(yù)計(jì)在
2030
年,人工智能相關(guān)領(lǐng)域?qū)τ谒懔Φ男枨髮⑦_(dá)到~16,000
EFLOPS,相當(dāng)于1,600億顆高通驍龍855內(nèi)置的人工智能芯片所能提供的算力。大模型的基礎(chǔ)是龐大的算力基建僅人工智能相關(guān)應(yīng)用就將帶來海量算力需求14001200100080060040020001271.4922.8640.7427268155.247.795.5111.37539.667.980.356.530.311.72019202020212022E2023E2024E2025E2026E中國通用算力規(guī)模(EFLOPS)中國智能算力規(guī)模(EFLOPS)資料:IDC,《泛在算力:智能社會(huì)的基石》,長江證券研究所02AI+Chiplet:信息革命的基石應(yīng)用-軟件-硬件循環(huán)向上,AI芯片發(fā)展多元變化02AI芯片相關(guān)技術(shù)關(guān)鍵技術(shù)對(duì)算力的具體要求資料:《人工智能芯片技術(shù)白皮書(2018》清華大學(xué),北京未來芯片技術(shù)高精尖創(chuàng)新中心,《泛在算力:智能社會(huì)的基石》,長江證券研究所應(yīng)用-軟件-硬件循環(huán)向上,AI芯片發(fā)展多元變化02中國AI芯片市場(chǎng)規(guī)模占比(IDC)AI芯片的目標(biāo)領(lǐng)域1.0%
0.4%9.6%GPUNPUASICFPGA89.0%主要AI相關(guān)芯片的市場(chǎng)規(guī)模及增速(百萬美元,Gartner)202020212022E2023E2024E2025E2026ECAGR
2021-2026E應(yīng)用處理器(分立或嵌入式)17,77326,81033,03738,22943,13445,95648,64013%DSPFPGAGPU614326910214398,8971521870216239872%58%21%1152609241442912478658697,23110,55912,166MCU/SoC微處理器191,12840492,107861063,5101562125,8362912867,6694754729,45568375411,36088173%40%59%70%嵌入式微處理器其他ASIC3376841,2882,5354,6606,8959,663資料:Gartner,《人工智能芯片技術(shù)白皮書(2018》清華大學(xué),北京未來芯片技術(shù)高精尖創(chuàng)新中心,IDC,長江證券研究所(注:Gartner統(tǒng)計(jì)AI芯片口徑包含服務(wù)器以外如AIoT、手機(jī)、筆電等應(yīng)用;IDC口徑則以服務(wù)器AI相關(guān)芯片為主)應(yīng)用-軟件-硬件循環(huán)向上,AI芯片發(fā)展多元變化02?
以人工智能芯片為例,目前主要有兩種發(fā)展路徑:一種是延續(xù)傳統(tǒng)計(jì)算架構(gòu),加速硬件計(jì)算能力,主要以CPU、GPU、FPGA、ASIC為代表。當(dāng)前階段,GPU配合CPU是AI芯片的主流,而后隨著視覺、語音、深度學(xué)習(xí)的算法在FPGA以及ASIC芯片上的不斷優(yōu)化,此兩者也將逐步占有更多的市場(chǎng)份額,從而與GPU達(dá)成長期共存的局面。?
深度神經(jīng)網(wǎng)絡(luò)算法是大型多層的網(wǎng)絡(luò)模型,典型的有循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),模型單次推斷通常需要數(shù)十億甚至上百億次的運(yùn)算,對(duì)芯片的計(jì)算力提出了更高要求,同時(shí)對(duì)器件的體積、功耗還有一定的約束。四類邏輯芯片特性比較主要AI芯片的功能特性比較GPU通用型好FPGA半定制化好ASIC定制化不好低定制化程度靈活性成本高較高Verilog/VHDL等硬件描述語言,編程語言/架構(gòu)功耗CUDA、OpenCL等/OpenCL、HLS大較大小峰值計(jì)算能力強(qiáng)、產(chǎn)品成
平均性能較高、功耗較低、靈活性
平均性能很強(qiáng),功耗很低、體積小主要優(yōu)點(diǎn)熟強(qiáng)效率不高、不可編輯、功
量產(chǎn)單價(jià)高、峰值計(jì)算能力較強(qiáng)、
前期投入成本高、不可編輯、主要缺點(diǎn)性能功能效率靈活性FPGA
ASIC延遲耗高編程語言難度大研發(fā)時(shí)間長、技術(shù)風(fēng)險(xiǎn)大云端訓(xùn)練、云端推斷、終端推主要應(yīng)用場(chǎng)景代表企業(yè)芯片云端訓(xùn)練、云端推斷云端推理、終端推斷CPUGPU斷英偉達(dá)Tesla、高通Adreno等谷歌TPU、寒武紀(jì)CambriconXilinxVersal、英特爾Arria等等資料:與非網(wǎng),賽迪智庫,長江證券研究所GPU:并行運(yùn)算帶來對(duì)AI應(yīng)用的高度適配02?
在架構(gòu)上GPU由數(shù)以千計(jì)的更小、更高效的核心(類似于CPU中的ALU)組成,這些核心專為同時(shí)處理多任務(wù)而設(shè)計(jì)。現(xiàn)在的CPU,一般是多核(multi-core)結(jié)構(gòu);而
GPU
一般是眾核(many-core)結(jié)構(gòu)。?
為充分利用GPU的計(jì)算能力,NVIDIA在2006年推出了CUDA(Computer
Unifie
Device
Architecture,統(tǒng)一計(jì)算設(shè)備架構(gòu))這一編程架構(gòu)。該架構(gòu)使GPU能夠解決復(fù)雜的計(jì)算問題。它包含了CUDA指令集架構(gòu)(ISA)以及GPU內(nèi)部的并行計(jì)算引擎。英偉達(dá)在GPU里面增加了Tensor
Core為AI服務(wù),它的并行力度就從基本的數(shù)據(jù)點(diǎn)進(jìn)化到以小矩陣快來進(jìn)行計(jì)算。所以Tensor
Core最基本的并行單元是一個(gè)4×4的矩陣塊,能夠在一個(gè)時(shí)鐘周期里面算出一個(gè)4×4矩陣和另一個(gè)4×4矩陣相乘的結(jié)果。原來用數(shù)據(jù)點(diǎn)來并行的話,它需要16次這樣的計(jì)算,才能算出一個(gè)4×4的矩陣。相比之下Tensor
Core的算力比原來的GPU要高,等價(jià)的功耗等比原來GPU的要低,這就是Tensor
Core用來做矩陣一個(gè)顯著的進(jìn)化。CPU和GPU架構(gòu)對(duì)比CUDA
Core做卷積(以點(diǎn)為基本粒度進(jìn)行)資料:《AI芯片設(shè)計(jì):原理與實(shí)踐》(陳巍,2022),匯芯投資,長江證券研究所GPU:并行運(yùn)算帶來對(duì)AI應(yīng)用的高度適配02Ampere架構(gòu)H100可大幅加速大模型訓(xùn)練時(shí)間?
英偉達(dá)Ampere
GA100是迄今為止設(shè)計(jì)的最大的7nm
GPU。GPU完全針對(duì)HPC市場(chǎng)而設(shè)計(jì),具有科學(xué)研究,人工智能,深度神經(jīng)網(wǎng)絡(luò)和AI推理等應(yīng)用程序。NVIDIA
A100基于7nmAmpere
GA100
GPU,具有6912CUDA
內(nèi)
核
和
432
Tensor
Core
,540億個(gè)晶體管數(shù),108個(gè)流式多處理器。采用第三代NVLINK,GPU和服務(wù)器雙向帶寬為4.8
TB/s,GPU間的
互
連
速
度
為
600
GB/s
。
另
外
,Tesla
A100在5120條內(nèi)存總線上的HBM2內(nèi)存可達(dá)40GB。從5天加速到19小時(shí)(GPT-3,1750億參數(shù))從7天加速到20小時(shí)(MoE,3950億參數(shù))?
2022年,NVIDIA推出了具有采用全新Hopper架構(gòu)的,
800億個(gè)晶體管的H100,這是首款支持Pcle5.0標(biāo)準(zhǔn)的GPU,單個(gè)H100就支持40Tb/s的IO帶寬。資料:面包板,英偉達(dá),長江證券研究所英偉達(dá):三重壁壘構(gòu)造AI時(shí)代軟硬件一體化龍頭02AI的核心驅(qū)動(dòng)與英偉達(dá)的三重壁壘?
第一層壁壘:硬件層。GPU奠定圖形渲染和AI算力基礎(chǔ),英偉達(dá)硬件層的三芯戰(zhàn)略已逐步成型:GPU解決AI大規(guī)模并行運(yùn)算痛點(diǎn),DPU解決AI訓(xùn)練推理中設(shè)備網(wǎng)絡(luò)通信與CPU負(fù)荷問題,CPU填上三芯戰(zhàn)略最后一塊拼圖,GPU強(qiáng)耦
合
設(shè)
計(jì)
構(gòu)
造
完
整
AI
解
決
方
案
,NVlink+NVSwitch+ConnectX突破芯片直連和設(shè)備網(wǎng)絡(luò)連接限制,GPUDirect
Storage
技術(shù)實(shí)現(xiàn)高性能存儲(chǔ)和數(shù)訪問CIS、激光、5GGPUDPUCPU視頻流、社交媒體……多芯配合算力迭代突破硬件摩爾定律限制數(shù)據(jù)持續(xù)高增,算力需求遠(yuǎn)超現(xiàn)存三芯戰(zhàn)略數(shù)據(jù)多芯互聯(lián)瓶頸打開算力上限硬件層軟件層NVlinkConnectXCUDA互聯(lián)網(wǎng)絡(luò)AI發(fā)展關(guān)鍵瓶頸算力、功耗、體積與成本以及如何發(fā)揮軟硬件強(qiáng)耦合充分發(fā)揮硬件優(yōu)勢(shì)芯片應(yīng)用軟件?
第二層壁壘:軟件層。CUDA釋放GPU潛力引航AI發(fā)展DOCA、Omniverse等軟件層進(jìn)一步填充生態(tài),增強(qiáng)AI業(yè)對(duì)英偉達(dá)的粘性。CUDA從底層代碼出發(fā)發(fā)揮GPU并行算
優(yōu)
勢(shì)
,
奠
定
近
十
年
人
工
智
能
發(fā)
展
基
礎(chǔ)
,
DOCABlueField
DPU量身定做軟件開發(fā)平臺(tái),復(fù)刻GPU+CUD的強(qiáng)耦合成功路徑,Omniverse初試工業(yè)共享虛擬空間,從硬件→軟件→云上社區(qū),在強(qiáng)勁軟硬件基礎(chǔ)上打造系統(tǒng)級(jí)AI生態(tài)圈,NVIDIA
AI
Enterprise加速AI模型開發(fā),未來或有望助力實(shí)現(xiàn)以AI開發(fā)AIAIDOCA算力下沉應(yīng)用層提供更完整解決方案OmniverseAI
Enterprise行業(yè)應(yīng)用軟件從消費(fèi)到數(shù)據(jù)基建再到AI完整領(lǐng)域游戲生產(chǎn)力算法數(shù)字孿生應(yīng)用層數(shù)據(jù)中心自動(dòng)駕駛專業(yè)視覺算法經(jīng)歷超半世紀(jì)發(fā)展主流模型逐步成熟元宇宙社會(huì)效益?
第三層壁壘:應(yīng)用層。游戲顯卡、數(shù)據(jù)中心、自動(dòng)駕駛、元宇宙先后接力,十年成長曲線浪潮疊加。資料:長江證券研究所景嘉微:構(gòu)造圖形GPU國產(chǎn)化基礎(chǔ)02?
景嘉微在圖形處理芯片領(lǐng)域經(jīng)過多年的技術(shù)鉆研,成功自主研發(fā)了一系列具有自主知識(shí)產(chǎn)權(quán)的GPU芯片,是公司圖形顯控模塊產(chǎn)品的核心部件并以此在行業(yè)內(nèi)形成了核心技術(shù)優(yōu)勢(shì)。公司以JM5400研發(fā)成功為起點(diǎn),不斷研發(fā)更為先進(jìn)且適用更為廣泛的一系列GPU芯片,隨著公司JM7200和JM9系列圖形處理芯片的成功研發(fā),公司聯(lián)合國內(nèi)主要CPU、整機(jī)廠商、操作系統(tǒng)、行業(yè)應(yīng)用廠商等開展適配與調(diào)試工作,共同構(gòu)建國產(chǎn)化計(jì)算機(jī)應(yīng)用生態(tài),在通用領(lǐng)域成功實(shí)現(xiàn)廣泛應(yīng)用。2022年5月,公司JM9系列第二款圖形處理芯片成功研發(fā),可以滿足地理信息系統(tǒng)、媒體處理、CAD輔助設(shè)計(jì)、游戲、虛擬化等高性能顯示需求和人工智能計(jì)算需求,可廣泛應(yīng)用于用于臺(tái)式機(jī)、筆記本、一體機(jī)、服務(wù)器、工控機(jī)、自助終端等設(shè)備。景嘉微JM9圖形顯示卡功能參數(shù)景嘉微Wind一致預(yù)期情況參數(shù)指標(biāo)描述關(guān)鍵指標(biāo)營業(yè)收入(百萬)
530.79增長率(%)
33.63歸母凈利潤(百萬)175.972019A2020A653.7723.172021A2022E2023E1,776.9254.812024E2,490.3840.15視頻解碼支持
H.265/H.264/VP9/AVS2/AVS/JPEG/MPEG4
等主流格式;1,093.20
1,147.802D圖形生成功能3D圖形生成功能像素填充率內(nèi)核性能總線接口顯存帶寬顯存容量支持
DirectFB
1.7.7;支持
OpenVG1.1
矢量圖形加速;67.214.99支持
OpenGL4.0、OpenCL3.0、Vulkan1.1、OpenGLES3.2;8GPixels/s;32
位單精度浮點(diǎn)性能
512GFlops;207.63292.74288.88423.34577.48增長率(%)EPS(攤薄)23.670.5817.990.6940.990.97-1.320.6346.540.9336.411.27內(nèi)核時(shí)鐘頻率
1GHz(支持動(dòng)態(tài)調(diào)頻);PCIE
4.0X825.6GB/s8GB基準(zhǔn)股本(百萬股)301.27ROE(攤薄)(%)
7.46301.258.20301.2410.22455.139.36455.1312.35455.1314.78支持
2路獨(dú)立的圖形顯示控制器,支持
2路
HDMI2.0、1
路
eDP1.2、1路
VGA輸出;顯示接口ROA(%)PE7.037.379.207.979.6211.0789.102.45支持
X86、ARM、MIPS
處理器和
Linux、中標(biāo)麒麟、銀河麒
麟、統(tǒng)信軟件、翼輝、天脈等操作系統(tǒng);?15W支持平臺(tái)功耗100.304.24101.435.64156.623.82178.11-135.20121.542.61PEG資料:景嘉微公司公告,Wind,長江證券研究所(注:Wind一致預(yù)期數(shù)據(jù)更新至2023年3月25日)沐曦:頂級(jí)團(tuán)隊(duì)布局全棧解決方案02?
沐曦2020年9月成立于上海,擁有技術(shù)完備、設(shè)計(jì)和產(chǎn)業(yè)化經(jīng)驗(yàn)豐富的團(tuán)隊(duì),核心成員平均擁有近20年高性能GPU產(chǎn)品端到端研發(fā)經(jīng)驗(yàn),曾主導(dǎo)過十多款世界主流高性能GPU產(chǎn)品研發(fā),包括GPU架構(gòu)定義、GPU
IP設(shè)計(jì)、GPU
SoC設(shè)計(jì)及GPU系統(tǒng)解決方案的量產(chǎn)交付全流程。?
打造全棧GPU芯片產(chǎn)品,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI訓(xùn)練及通用計(jì)算,以及MXG系列GPU(曦彩)用于圖形渲染,滿足數(shù)據(jù)中心對(duì)“高能效”和“高通用性”的算力需求。沐曦產(chǎn)品均采用完全自主研發(fā)的GPU
IP,擁有完全自主知識(shí)產(chǎn)權(quán)的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢(shì),能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動(dòng)數(shù)據(jù)中心建設(shè)和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型升級(jí)的算力基石。曦思N100人工智能推理GPU曦思N100已完成百度飛槳I級(jí)兼容性測(cè)試資料:沐曦集成官網(wǎng),長江證券研究所壁仞科技:訓(xùn)推一體化劍指全球龍頭02?
壁仞科技創(chuàng)立于2019年,團(tuán)隊(duì)由國內(nèi)外芯片和云計(jì)算領(lǐng)域核心專業(yè)人員、研發(fā)人員組成,在GPU、DSA(專用)和計(jì)算機(jī)體系結(jié)構(gòu)等領(lǐng)域具有深厚的技術(shù)積累。從發(fā)展路徑上,壁仞科技將首先聚焦云端通用智能計(jì)算,逐步在人工智能訓(xùn)練和推理、圖形渲染等多個(gè)領(lǐng)域趕超現(xiàn)有解決方案,實(shí)現(xiàn)國產(chǎn)高端通用智能計(jì)算芯片的突破。?
壁仞科技BR100系列通用GPU芯片針對(duì)人工智能(AI)訓(xùn)練、推理,及科學(xué)計(jì)算等更廣泛的通用計(jì)算場(chǎng)景開發(fā),主要部署在大型數(shù)據(jù)中心,依托“壁立仞”原創(chuàng)架構(gòu),可提供高能效、高通用性的加速計(jì)算算力。BR100系列通用GPU芯片BR100系列產(chǎn)品與英偉達(dá)H100、A100產(chǎn)品參數(shù)對(duì)比BR104-300WPCIeNVIDIA
H100
NVIDIA
H100
NVIDIA
A100BR100-OAMSXM5PClePCle產(chǎn)品形態(tài)OAM雙FHFL
PClePClePClePCle256
TFLOPS(Tensor
Core)128
TFLOPS(Tensor
Core)FP3260
TFLOPS48
TFLOPS19.5
TFLOPS峰值性能TF32+500
TFLOPS400
TFLOPS156
TFLOPS512
TFLOPS256
TFLOPS512
TFLOPS(TF32)(TF32)(TF32)(TF32)312
TFLOPS(FP16)BF161024
TFLOPS1000
TFLOPS800
TFLOPS1600
TOPSINT82048
TOPS1024
TOPS2000
TOPS624
TOPS顯存64GB
HBM2E32GB
HBM2E80GB
HMB380GB
HBM2E
80GB
HBM2EPCle
5.0PCle
5.0接口SXM5900
GB/s700WPCIe
5.0600
GB/s350WPCIe
4.0600
GB/s400W支持CXL
2.0支持CXL
2.0互連帶寬512
GB/s500W192
GB/s300W最大熱設(shè)計(jì)功耗(TDP)資料:壁仞科技官網(wǎng),芯東西,長江證券研究所(注:NVIDIA
H100僅計(jì)入未采用稀疏技術(shù)的規(guī)格)芯原股份:GPU+NPU的IP賣水人02?
芯原股份自2016年收購圖芯美國增加GPU
IP后持續(xù)推進(jìn)在GPU、NPU領(lǐng)域的研發(fā),目前已具備多款3D/2.5D
GPU/GPGPU
IP,是國內(nèi)GPU
IP的核心供應(yīng)商之一。芯原Vivante的神經(jīng)網(wǎng)絡(luò)處理器
(NPU)
IP是高度可擴(kuò)展、可編程的計(jì)算機(jī)視覺和人工智能處理器,支持終端、邊緣端及云端設(shè)備的人工智能運(yùn)算升級(jí)。Vivante
NPU
IP可滿足多種芯片尺寸和功耗預(yù)算,是具成本效益的優(yōu)質(zhì)神經(jīng)網(wǎng)絡(luò)加速引擎解決方案,芯原業(yè)界領(lǐng)先的
NPU
在過去幾年已經(jīng)向60多個(gè)客戶交付,被應(yīng)用于110多個(gè)系統(tǒng)級(jí)芯片(SoC)中。?
2023年3月15日,芯原股份宣布與微軟就Windows
10
IoT企業(yè)版操作系統(tǒng)開展合作,合作內(nèi)容涵蓋硬件,以及對(duì)功能強(qiáng)大的嵌入式平臺(tái)的長期支持。芯原將利用自身的嵌入式軟件設(shè)計(jì)能力和數(shù)十年推出成功產(chǎn)品的經(jīng)驗(yàn),使嵌入式應(yīng)用開發(fā)人員和原始設(shè)備制造商(OEM)能夠基于可信賴的操作系統(tǒng),使用熟悉的開發(fā)和管理工具快速創(chuàng)建、部署和擴(kuò)展物聯(lián)網(wǎng)解決方案,并通過微軟Azure
IoT將設(shè)備無縫連接到云端。?
值得重視的是,芯原代理了全球高速Serdes
IP的龍頭廠商Alphawave在大中華區(qū)的銷售和芯片定制設(shè)計(jì)應(yīng)用,高速Serdes接口或?qū)⒊蔀樗懔σ酝庾顬殛P(guān)鍵的結(jié)構(gòu)。芯原VivanteGPU
IP產(chǎn)品線及其應(yīng)用芯原VivanteNPUIP產(chǎn)品線及其應(yīng)用資料:芯原股份官網(wǎng),長江證券研究所FPGA:AI應(yīng)用的加速卡02數(shù)據(jù)中心中FPGA可配合多種芯片實(shí)現(xiàn)性能的大幅提升?
以賽靈思FPGA
ACAP(自適應(yīng)平臺(tái))產(chǎn)品為例,其可以搭配CPU、存儲(chǔ)、網(wǎng)絡(luò)接口等,大幅提升整體性能:網(wǎng)絡(luò)NIC?
搭配CPU:傳統(tǒng)的數(shù)據(jù)中心服務(wù)器有1個(gè)CPU連接網(wǎng)絡(luò),通過NIC(網(wǎng)絡(luò)接口控制器)和PCIe連接到存儲(chǔ)設(shè)備。搭配Xilinx
Versal
ACAP可會(huì)實(shí)現(xiàn)速度的巨大提升。以生命科學(xué)公司lllumina基因組計(jì)算為例,Xilinx的加速組件為其基因組分析應(yīng)用提速了90倍;使用FPGA數(shù)量對(duì)QUERYPerformance影響13XPCIe1412108CPU加速效果:1.5X數(shù)據(jù)包處理吞吐量:3-6X7X64X4?
搭配存儲(chǔ)器:可以加速數(shù)據(jù)的壓縮/解壓縮、解密;1X2SSD00124?
搭配NIC:Smart
NIC可以通過移除惡意數(shù)據(jù)包提供更好的安全性,并通過將網(wǎng)絡(luò)堆棧從CPU卸載到Smart
NIC來加速數(shù)據(jù)包處理。使用基于Xilinx的智能網(wǎng)卡,數(shù)據(jù)吞吐量加快了3~6倍,CPU利用率提高了1.5倍。相關(guān)性能計(jì)算加速用于TWITCH
VP9網(wǎng)絡(luò)直播的視頻轉(zhuǎn)碼技術(shù)用于illumine基因組數(shù)據(jù)分析用于TEND實(shí)時(shí)最大似然推理100X30X90XFPGAGPUCPUFPGACPUFPGACPU20X1X1X1X010203040020406080100020406080100資料:與非網(wǎng),長江證券研究所國產(chǎn)FPGA替代先鋒——紫光同創(chuàng)02?
紫光國微民用可重構(gòu)系統(tǒng)芯片業(yè)務(wù)由參股子公司深圳紫光同創(chuàng)電子承擔(dān)。紫光同創(chuàng)是中國FPGA領(lǐng)導(dǎo)廠商,總投資超過20億元,主要從事可編程邏輯器件(FPGA、CPLD等)的研發(fā)與銷售、EDA設(shè)計(jì)工具的開發(fā),產(chǎn)品覆蓋通信、工業(yè)控制、視頻監(jiān)控、消費(fèi)電子、數(shù)據(jù)中心等應(yīng)用領(lǐng)域。正積極推進(jìn)高中低端全系列FPGA產(chǎn)品的研制開發(fā)工作。公司研發(fā)實(shí)力深厚,職工人數(shù)超過500人、研發(fā)人員占比為85%,擁有專利超300項(xiàng)、核心專利占比超過80%。
紫光同創(chuàng)2020年已實(shí)現(xiàn)3.16億元銷售收入,同比大幅增長超210%,未來有望進(jìn)一步釋放公司FPGA產(chǎn)品及IP、軟件等解決方案盈利能力。公司還可提供圍繞FPGA器件的系統(tǒng)解決方案、板卡外包設(shè)計(jì)服務(wù)以及IP模塊解決方案,正在逐步從FPGA產(chǎn)品提供商向提供FPGA平臺(tái)和系統(tǒng)解決方案的平臺(tái)型企業(yè)發(fā)展。紫光同創(chuàng)發(fā)展歷程紫光同創(chuàng)FPGA開發(fā)軟件平臺(tái)資料:紫光同創(chuàng)官網(wǎng),長江證券研究所邊緣計(jì)算:云-端-邊的下一個(gè)發(fā)展方向02?
從性能方面來看,由網(wǎng)絡(luò)帶寬對(duì)云端算力的全量發(fā)揮的限制和網(wǎng)絡(luò)時(shí)延的影響所帶來的算力錯(cuò)配要通過增設(shè)邊緣端來彌補(bǔ),因此未來形成“云、邊、端”多層級(jí)算力部署方案是必然趨勢(shì),部分中低功耗的邊緣端AI芯片有望成為行業(yè)下一個(gè)發(fā)展的關(guān)鍵趨勢(shì),如AI
SoC在智能音箱、智能家居、智能穿戴、智慧安防等領(lǐng)域的應(yīng)用。網(wǎng)絡(luò)傳輸帶寬和時(shí)延導(dǎo)致算力錯(cuò)配,需要邊緣算力支撐資料:《泛在算力:智能社會(huì)的基石》,長江證券研究所Chiplet:芯片集成的新形態(tài),規(guī)避限制的關(guān)鍵技術(shù)02?目前,主流系統(tǒng)級(jí)單芯片(SoC)都是將多個(gè)負(fù)責(zé)不同類型計(jì)算任務(wù)的計(jì)算單元,通過光刻的形式制作到同一塊晶圓上。比如,目前旗艦級(jí)的智能手機(jī)的SoC芯片上,基本都集成了CPU、GPU、DSP、ISP、NPU、Modem等眾多的不同功能的計(jì)算單元,以及諸多的接口IP,其追求的是高度的集成化,利用先進(jìn)制程對(duì)于所有的單元進(jìn)行全面的提升,缺點(diǎn)則是設(shè)計(jì)時(shí)間漫長、成本高昂。?而Chiplet技術(shù)是SoC集成發(fā)展到一定程度之后的一種新的芯片設(shè)計(jì)方式,它通過將SoC分成較小的裸片(Die),然后每個(gè)單元選擇最適合的工藝制程進(jìn)行制造,再將這些模塊化的小芯片(裸片)互聯(lián)起來,采用新型封裝技術(shù),將不同功能不同工藝制造的小芯片封裝在一起,成為一個(gè)異構(gòu)集成芯片?;贑hiplet的異構(gòu)架構(gòu)應(yīng)用處理器的示意圖Chiplet可靈活實(shí)現(xiàn)集成各類功能的芯片設(shè)計(jì)資料:芯原股份業(yè)績說明會(huì),長江證券研究所Chiplet實(shí)現(xiàn)的方式:SIP/2.5D/3D02?目前來看,可應(yīng)用于Chiplet的封裝解決方案主要是SIP、2.5D和3D封裝。其中,2.5D封裝技術(shù)發(fā)展已經(jīng)非常成熟,并且已經(jīng)廣泛應(yīng)用于FPGA、CPU、GPU等芯片當(dāng)中,近年來,隨著Chiplet架構(gòu)的興起,2.5D封裝也成為了Chipet架構(gòu)產(chǎn)品主要的封裝解決方案。其最大特色是采用Interposer
(中介層)做為整合媒介,主要用來做為放置于其上的小芯片們間的通訊互聯(lián),以及芯片們與載板間的聯(lián)結(jié)。?此外,還有HD-FO(Highdensity
Fan-out)封裝技術(shù),目前雖仍僅應(yīng)用在較基礎(chǔ)的異質(zhì)元件整合
(如邏輯IC與HBM的整合),但隨技術(shù)持續(xù)進(jìn)步搭配其低成本優(yōu)勢(shì),未來可能有機(jī)會(huì)進(jìn)一步成為Chiplet采用者的另一封裝選擇。?
3D封裝能夠幫助實(shí)現(xiàn)3DIC,即芯粒間的堆疊和高密度互聯(lián),可以提供更為靈活的設(shè)計(jì)選擇。但是,3D封裝的技術(shù)難度也更高,目前主要有英特爾和臺(tái)積電掌握3D封裝技術(shù)并有商用。Chiplet實(shí)現(xiàn)的主要方式:SIP/2.5D/3D封裝芯片內(nèi)部互聯(lián)網(wǎng)絡(luò)是小芯片以外最為重要的組成資料:SiP
與先進(jìn)封裝技術(shù),長江證券研究所下游需求加速擴(kuò)圍,產(chǎn)業(yè)鏈價(jià)值重構(gòu)02?
早在2014年,國內(nèi)某核心設(shè)計(jì)公司與臺(tái)積電的CoWoS(Chip-on-Wafer-on-Substrate)合作產(chǎn)品已經(jīng)發(fā)布,在2019年推出了基于Chiplet技術(shù)的7nm鯤鵬920處理器,Chiplet技術(shù)逐步走向成熟。目前,已有AMD、英特爾、臺(tái)積電為代表的多家集成電路產(chǎn)業(yè)鏈領(lǐng)導(dǎo)廠商先后發(fā)布了量產(chǎn)可行的Chiplet解決方案、接口協(xié)議或封裝技術(shù)。其中,AMD、Intel已經(jīng)率先實(shí)現(xiàn)Chiplet量產(chǎn)。Chiplet方案產(chǎn)品梳理圖:公司產(chǎn)品概述?
拓寬下游產(chǎn)業(yè)鏈加速Chiplet生態(tài)發(fā)展。預(yù)計(jì)至2024年,全球基于Chiplet的器件市場(chǎng)規(guī)??蛇_(dá)到59億美元左右。高性能服務(wù)器/數(shù)據(jù)中心、自動(dòng)駕駛、筆記本/臺(tái)式電腦、高端智能手機(jī)等將在未來幾年成為Chiplet的主要應(yīng)用場(chǎng)景,引領(lǐng)該市場(chǎng)增長。每個(gè)EPYC處理包括4個(gè)Zeppelin
die,使用2D
MCM
(Multi-chip
module)封裝。Zeppelin
die
包含2
個(gè)core
complex-CCX。單獨(dú)看,
每個(gè)Zeppelin
die都包括單獨(dú)的memory、IO
complex、infinity
Fabric的控制與接口;從公司層面看,對(duì)于研發(fā)成本,一個(gè)Zeppelin
die可以覆蓋服務(wù)器和桌面兩個(gè)市場(chǎng),收益明顯。有一個(gè)中央集中式I/O和內(nèi)存控制器die,而且這個(gè)集中IOD仍然有14nm工藝,CCD
仍然保持8個(gè)核的設(shè)計(jì)。8個(gè)CCD
die,
一個(gè)IOD,最高核數(shù)為64個(gè)。每個(gè)CCD
上的核數(shù)可以根據(jù)良率變化,每個(gè)SKU上的Chiplet數(shù)目也可以選擇。Ryzen
產(chǎn)品線重用了
EYPC
Rome
的CCD。只是單獨(dú)配了一個(gè)Client
IOD。對(duì)于產(chǎn)品線復(fù)雜的公司,Chiplet
設(shè)計(jì),極好地降低了總研發(fā)費(fèi)用。Stratix
10是Intel第一款使用EMIB的設(shè)計(jì),中心是FPGA
die,周圍是6個(gè)Chiplet。4個(gè)高速EPYC(Naples)AMDEPYC(Rome)Ryzen(Matisse)全球基于Chiplet的器件市場(chǎng)規(guī)模(分下游應(yīng)用,百萬美元)Altera
Stratix10
FPGA
transceiver
Chiplet
和2個(gè)高帶寬memory
Chiplet。這6個(gè)Chiplet是來自三個(gè)不同fab的6個(gè)不同工藝Chiplet,證明了不同fab之間的強(qiáng)大互操作性。Lakefield使用3D封裝,運(yùn)用不同核的混合架構(gòu)和Chiplet
設(shè)計(jì),一個(gè)compute
die,一個(gè)base
die。Lakefield
SoCBase
die主要是I/O
功能,性能不敏感,因此可以用22nm
工藝,而混合了大小CPU
核、IPU、GPUcompute
die,會(huì)持續(xù)演進(jìn),用7-5nm
工藝。IntelEthernet
Switch市場(chǎng)的第一款分離為Chiplet
的設(shè)計(jì)。Switch
ASIC長期以來都是把模擬和邏輯部分Barefoot
the
Tofino
2
放在一起設(shè)計(jì)的,模擬部分其實(shí)和邏輯部分演進(jìn)的時(shí)間表完全不同。如果是單芯片設(shè)計(jì),模擬部分chip7nm+
Chipletswitch
ASIC也不得不隨著邏輯部分的工藝演進(jìn)前進(jìn)。如果采用Chiplet
分離設(shè)計(jì),邏輯部分可采用最新工藝,模擬部分可保留傳統(tǒng)工藝。Chiplet帶動(dòng)模擬部分的工藝節(jié)省,而且還可以通過不同的Chiplet
配置,來提供不同的SKU。蘋果將兩枚
M1
Max
芯片通過
Chiplet
技術(shù)拼接。M1
Ultra
芯片采用了
UltraFusion
封裝架構(gòu),通過兩枚
M1
Max晶粒的內(nèi)部互連。架構(gòu)上,M1
Ultra
采用了
20
核中央處理器,由
16
個(gè)高性能核心和
4個(gè)高能效核心組成。AppleM1MaxXlinix2011
Virtex-72000T
4個(gè)die的Chiplet設(shè)計(jì)。Marvell
提出Mochi
概念,最大的驅(qū)動(dòng)力是降低成本,模塊化芯片設(shè)計(jì),像LEGO
那樣,提高模塊的重用性。借助基本模塊的重用,還能在保持靈活性的同時(shí),加快新產(chǎn)品的上市時(shí)間。MarvellMochi8個(gè)Chiplet
設(shè)計(jì),融合了HBM
die,邏輯部分與I/O
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《安全感悟分享》課件
- 《職業(yè)適應(yīng)與發(fā)展》課件
- 《生產(chǎn)安全事故應(yīng)急》課件
- 2024教師發(fā)言稿(34篇)
- 藝術(shù)與人生和社會(huì)的關(guān)系
- 單位管理制度匯編大全【人事管理】
- 單位管理制度分享合集【人員管理篇】十篇
- 單位管理制度分享大合集【人員管理】十篇
- 單位管理制度范文大合集【員工管理篇】十篇
- 單位管理制度呈現(xiàn)大全【人員管理】
- 施工現(xiàn)場(chǎng)鐵皮圍擋承包合同
- 管理學(xué)案例分析(超全有答案)(已處理)
- ICU病人早期康復(fù)-ppt課件
- 藥品開發(fā)與上量-宿家榮
- 海商法術(shù)語中英對(duì)照
- 北京海淀區(qū)初一上數(shù)學(xué)期末試題(帶標(biāo)準(zhǔn)答案)_
- 化工原理課程設(shè)計(jì)空氣中丙酮的回收工藝操作
- 【家庭自制】 南北香腸配方及28種制作方法
- 廠房施工總結(jié)報(bào)告
- 先進(jìn)物流理念主導(dǎo)和先進(jìn)物流技術(shù)支撐下的日本現(xiàn)代物流
- 建筑小區(qū)生雨水排水系統(tǒng)管道的水力計(jì)算
評(píng)論
0/150
提交評(píng)論