下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
FPGA如何擁抱AI大時(shí)代呢?導(dǎo)讀FPGA自上世紀(jì)80年代被發(fā)明以來(lái),已經(jīng)在通信、數(shù)字信號(hào)處理、集成電路設(shè)計(jì)、視頻圖像處理等領(lǐng)域大放異彩。近年來(lái),隨著AI的飛速發(fā)展,這一擁有低延遲、低功耗、靈活高效等優(yōu)勢(shì)的可編程硬件,已經(jīng)成為算法加速中的重要一環(huán),為AI算法的部署提供了更多的可能性。隨著海量數(shù)據(jù)的算力需求越來(lái)越高,F(xiàn)PGA芯片將繼續(xù)向更高密度、更高通信帶寬方向發(fā)展,此外,異構(gòu)計(jì)算融合等形式將越來(lái)越受推崇。并且從軟件發(fā)展角度,也更注重配套的工具能力,提供高性能的AI加速能力。01.
FPGA在AI芯片市場(chǎng)占比不足1%高算力需求催生了AI芯片興起,“無(wú)芯片,不AI”,以AI芯片為載體實(shí)現(xiàn)的算力成為人工智能發(fā)展水平的重要衡量標(biāo)準(zhǔn)。廣義上,AI算力芯片指的是專門用于處理AI應(yīng)用中大量計(jì)算任務(wù)的芯片,包括GPU、FPGA、ASIC、NPU等AI加速芯片。其中,GPU基于強(qiáng)大的并行計(jì)算能力,在圖形圖像處理、復(fù)雜的數(shù)學(xué)計(jì)算等場(chǎng)景,可較好支持高度并行的工作負(fù)載。
IDC數(shù)據(jù)顯示,2022年中國(guó)AI芯片市場(chǎng),GPU占比約89.0%,ASIC、FPGA、NPU等芯片市場(chǎng)占有率共計(jì)超過(guò)10%,其中,F(xiàn)PGA占比僅為0.4%。
圖:中國(guó)人工智能芯片市場(chǎng)規(guī)模占比
在前景廣闊的AI芯片領(lǐng)域,F(xiàn)PGA作為一種靈活可編程的硬件平臺(tái),具備較高的計(jì)算性能和可定制性,能夠提供對(duì)AI算法的加速和優(yōu)化;在AI應(yīng)用中,可以用于實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)加速器、高性能計(jì)算單元等,為計(jì)算密集型的AI任務(wù)提供高性能和低延遲的計(jì)算能力。但為什么占有率如此低?未來(lái)的增長(zhǎng)點(diǎn)有哪些?
一直以來(lái),F(xiàn)PGA的設(shè)計(jì)和開發(fā)相對(duì)復(fù)雜,需要專門的硬件設(shè)計(jì)和編程技能;此外,與專用AI芯片相比,F(xiàn)PGA在功耗和性能比方面并無(wú)顯著優(yōu)勢(shì),這在一定程度上影響了FPGA在AI方案中的采用。
不過(guò),F(xiàn)PGA廠商逐年加大在AI領(lǐng)域的發(fā)力,例如推出專門針對(duì)AI應(yīng)用的平臺(tái)和解決方案,提供了更加易用和高性能的產(chǎn)品。同時(shí),開發(fā)工具和框架的不斷完善,也降低了使用FPGA實(shí)現(xiàn)AI特性的門檻,吸引了更多的開發(fā)者和企業(yè)采用FPGA技術(shù)。
02.
面向AI,F(xiàn)PGA軟硬兼修
還在2018年左右,Xilinx(現(xiàn)已被AMD收購(gòu))已經(jīng)洞察到了FPGA在算力市場(chǎng)的巨大價(jià)值,提出了“數(shù)據(jù)中心優(yōu)先”的戰(zhàn)略,隨后發(fā)布了自適應(yīng)計(jì)算加速平臺(tái)(AdaptiveComputeAccelerationPlatform,ACAP)Versal。這一產(chǎn)品形態(tài)已經(jīng)脫離了傳統(tǒng)的FPGA范疇,通過(guò)內(nèi)部的可編程引擎,它引入多個(gè)以自適應(yīng)數(shù)據(jù)流的方式來(lái)組織的AICore,作為承載AI等數(shù)據(jù)密集型運(yùn)算的主體。
也就是說(shuō),XilinxFPGA的AI路線相當(dāng)于是設(shè)計(jì)了一套專門的硬件體系來(lái)承載AI等數(shù)據(jù)密集型運(yùn)算,VersalACAP整合了標(biāo)量處理引擎、自適應(yīng)硬件引擎和智能引擎以及前沿的存儲(chǔ)器和接口技術(shù),從而在異構(gòu)加速性能方面得以提升。
不同于Xilinx通過(guò)獨(dú)立于傳統(tǒng)FPGA結(jié)構(gòu)之外的獨(dú)立硬件組成單元(AICore陣列)承載AI,IntelFPGA的AI技術(shù)路線相對(duì)保守,主要是將嵌入在FPGA內(nèi)部的DSP模塊直接升級(jí)為AI張量模塊,但它依然是FPGA內(nèi)部的組成模塊之一。
在傳統(tǒng)的FPGA中,乘累加主要依靠DSP模塊實(shí)現(xiàn)。為了追求較高的靈活性,普通的DSP模塊就是一兩個(gè)乘法器、外加一個(gè)加法器構(gòu)成。這樣就可以基于這種基本的DSP模塊配合FPGA的其它部分構(gòu)成各種不同的運(yùn)算算法。
由于AI算法的核心是大量的乘加/乘累加,不是一般的乘加,而是一種“張量”運(yùn)算。因此提升FPGA執(zhí)行AI算法的方法,自然就是把DSP模塊升級(jí)為更加適應(yīng)AI張量運(yùn)算的模塊,這也正是Intel的技術(shù)路線。
Intel第一款采用張量模塊的FPGA是2020年推出的Stratix10NX,其張量模塊架構(gòu)主要針對(duì)AI計(jì)算中常用的矩陣-矩陣或矢量-矩陣乘法和加法運(yùn)算進(jìn)行了優(yōu)化,當(dāng)時(shí)可支持INT8和INT4數(shù)據(jù)計(jì)算,并通過(guò)共享指數(shù)支持FP16和FP12塊浮點(diǎn)的數(shù)字格式。
采用AI張量模塊的增強(qiáng)型DSP引入了兩種全新的重要運(yùn)算:面向AI的張量處理能力和面向信號(hào)處理應(yīng)用的復(fù)數(shù)支持,此類應(yīng)用包括快速傅里葉變換(FFT)和復(fù)雜有限脈沖響應(yīng)(FIR)濾波器等。第一種模式可通過(guò)INT8張量模式增強(qiáng)AI。
第二種新模式是復(fù)數(shù)運(yùn)算,過(guò)去復(fù)數(shù)乘法需要兩個(gè)DSP模塊,但優(yōu)化后,一個(gè)采用AI張量模塊的增強(qiáng)型DSP就可以進(jìn)行16位定點(diǎn)復(fù)數(shù)乘法運(yùn)算。這些創(chuàng)新不僅為IntelFPGA的發(fā)展奠定基礎(chǔ),也成為Intel近年來(lái)面向邊緣AI領(lǐng)域的重要支撐。
Xilinx和Intel這兩種路線也是FPGAAI化的主要技術(shù)路徑,特別是Xilinx這種高度可配置、可擴(kuò)展的架構(gòu)設(shè)計(jì),成為FPGA當(dāng)前進(jìn)行異構(gòu)融合設(shè)計(jì)的主流方式。
軟件方面,HLS(HighLevelSynthesis,高層次綜合)技術(shù)是近年來(lái)各大FPGA學(xué)術(shù)會(huì)議上,學(xué)術(shù)界和工業(yè)界研究最集中的領(lǐng)域之一。HLS將諸如C++、OpenCL等高層語(yǔ)言,通過(guò)特定編譯工具可以直接轉(zhuǎn)化成FPGA上可以運(yùn)行的硬件代碼,AMD和Intel都有各自的HLS工具和開發(fā)套件。
此外,開發(fā)工具鏈近年來(lái)也越來(lái)越豐富,包括集成開發(fā)環(huán)境(IDE)、仿真器、調(diào)試器等,這些工具可以幫助開發(fā)者在FPGA上開發(fā)、調(diào)試和驗(yàn)證AI應(yīng)用,提高開發(fā)效率和質(zhì)量。
03.
邊緣AI,中端FPGA潛能巨大
根據(jù)性能、成本、尺寸等因素,可以將FPGA產(chǎn)品劃分為分為小型、中型和大型FPGA,對(duì)應(yīng)市場(chǎng)上通常所說(shuō)的低、中、高端應(yīng)用。低端FPGA具有低功耗、低成本和小體積優(yōu)勢(shì),適用于邊緣計(jì)算和IoT設(shè)備中。由于邊緣計(jì)算要求在設(shè)備端進(jìn)行實(shí)時(shí)的數(shù)據(jù)處理和決策,低端FPGA適合在邊緣設(shè)備中實(shí)現(xiàn)AI推理任務(wù)。例如,用于智能攝像頭、智能家居設(shè)備、傳感器節(jié)點(diǎn)等,實(shí)現(xiàn)圖像識(shí)別、語(yǔ)音識(shí)別和運(yùn)動(dòng)檢測(cè)等功能。此外,低端FPGA還可以用于小規(guī)模的機(jī)器學(xué)習(xí)模型訓(xùn)練和優(yōu)化。
中端FPGA在AI領(lǐng)域的機(jī)會(huì)較為廣泛,由于具有較高的性能和資源,它適合處理更復(fù)雜的AI任務(wù),例如在圖像和視頻處理、自動(dòng)駕駛、工業(yè)自動(dòng)化等領(lǐng)域,可用于加速計(jì)算、優(yōu)化算法和實(shí)現(xiàn)實(shí)時(shí)推理。同時(shí),中端FPGA還可以與其他硬件加速器結(jié)合使用,構(gòu)建混合加速平臺(tái),實(shí)現(xiàn)更高效的AI計(jì)算。
高端FPGA在AI領(lǐng)域的機(jī)會(huì)則主要集中在高性能計(jì)算和數(shù)據(jù)中心加速方面,它具有大規(guī)模的邏輯資源、高存儲(chǔ)容量和高時(shí)鐘頻率,能夠支持更復(fù)雜和大規(guī)模的AI模型訓(xùn)練和推理任務(wù)。
隨著AI應(yīng)用越來(lái)越多轉(zhuǎn)向比集中式云數(shù)據(jù)中心更低的延遲、更安全和私密的處理,高端FPGA特性延伸到中端應(yīng)用的趨勢(shì)非常明顯,網(wǎng)絡(luò)邊緣計(jì)算、智能終端設(shè)備等市場(chǎng)呈現(xiàn)出巨大的發(fā)展?jié)摿?,?guó)內(nèi)外相關(guān)廠商紛紛加大了中端FPGA領(lǐng)域的布局。
工業(yè)攝像頭就是很好的應(yīng)用案例之一。工業(yè)攝像頭由于體積小、散熱條件不佳,但對(duì)帶寬要求越來(lái)越高,屬于典型的“既需要一定性能、又要求低功耗”的應(yīng)用。此外還有汽車ADAS包括MDC方面的應(yīng)用,以及汽車顯示等方面,都越來(lái)越需要更強(qiáng)的處理能力、更高的處理帶寬。中端FPGA的低功耗、高性能就非常適合這類應(yīng)用。
之前專注于低功耗FPGA的Lattice,近年來(lái)就在加大中端FPGA的布局,其策略可以解讀為“通過(guò)基于專用平臺(tái)的方法來(lái)滿足市場(chǎng)需求”。在該公司看來(lái),市場(chǎng)上的許多中端FPGA器件都是采用大型FPGA的架構(gòu)開發(fā)的,其底層架構(gòu)保持不變,只是某些功能發(fā)生了變化。由于這些架構(gòu)主要是為高性能計(jì)算應(yīng)用而設(shè)計(jì)的,因此這種方法會(huì)導(dǎo)致優(yōu)化不佳,尤其是在功耗和物理尺寸方面。
相比以前擁有100K~150K邏輯單元的FPGA產(chǎn)品,Lattice推出了邏輯單元數(shù)量500K的FPGA產(chǎn)品,同時(shí)在互聯(lián)性能、封裝尺寸、性能方面進(jìn)行了優(yōu)化,使之更適合中端應(yīng)用需求。
Intel也開始重視中端FPGA的市場(chǎng)機(jī)會(huì),盡管前幾年,英特爾推出的FPGA產(chǎn)品都更側(cè)重高端應(yīng)用市場(chǎng),但隨著AgilexD系列FPGA和代號(hào)SundanceMesa的AgilexFPGA的推出,Intel將會(huì)更多關(guān)注中端應(yīng)用市場(chǎng)。
還有一個(gè)值得注意的趨勢(shì),就是“高端和中端FPGA之間的界限越來(lái)越趨于模糊。過(guò)去幾年,中端FPGA應(yīng)用發(fā)生了很大變化,目前已經(jīng)演進(jìn)為需要更高的性能和更低的功耗,高端FPGA將延伸到中端應(yīng)用中;與此同時(shí),一些低端應(yīng)用又對(duì)產(chǎn)品有更高需求。這就意味著,需要打造具備更低功耗和密度的產(chǎn)品。
國(guó)產(chǎn)FPGA廠商也開始面向AI進(jìn)行創(chuàng)新。京微齊力近期就宣布在其FPGA中采用了Imagination的Series3NXAI核,以適用于AIoT應(yīng)用、邊緣端AI視頻分析處理應(yīng)用等。京微齊力這一做法是將FPGA、CPU、AI等多種異構(gòu)計(jì)算單元集成在同一個(gè)芯片上,強(qiáng)調(diào)了“硬件的可重構(gòu)特性”,這種混合架構(gòu)的平臺(tái)芯片比單一架構(gòu)更能支持高定制水平和能效提升。
04.
寫在最后
FPGA的關(guān)鍵價(jià)值在于可編程性、靈活性,AI發(fā)展初期,很多新興應(yīng)用還在醞釀中,各類標(biāo)準(zhǔn)仍在演進(jìn),AI算法也在不斷推陳出新,對(duì)于硬件的算力和靈活度要求很高,F(xiàn)PGA剛好契合這些需求。此外,在推理環(huán)節(jié)的小批量數(shù)據(jù)處理中,F(xiàn)P
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度圖書印刷與印刷材料研發(fā)合作合同3篇
- DIY音樂(lè)器材制作與演奏技巧分享
- 以市場(chǎng)為導(dǎo)向的學(xué)校設(shè)施設(shè)備采購(gòu)策略研究
- 2024年工程推介服務(wù)協(xié)議模板簡(jiǎn)版下載版B版
- 2024年度商鋪離婚及經(jīng)營(yíng)權(quán)益轉(zhuǎn)讓合同3篇
- 2024年度精密電子元件委托加工合同范文3篇
- 大象數(shù)學(xué)課程設(shè)計(jì)
- 瑜伽兒童私教課程設(shè)計(jì)
- 油氣集輸工程課程設(shè)計(jì)
- 油畫棒課程設(shè)計(jì)模板
- 登高作業(yè)錯(cuò)題解析
- 昌樂(lè)二中271高效課堂培訓(xùn)與評(píng)價(jià)ppt課件
- 《國(guó)際經(jīng)濟(jì)法》案例思考題
- 省部聯(lián)合減鹽防控高血壓項(xiàng)目培訓(xùn)教材
- 【作文素材】他被故宮開除,卻成為“京城第一玩家”!——王世襄剖析
- 開發(fā)商退房通知書
- 模特的基礎(chǔ)訓(xùn)練
- 藥品招商流程
- 混凝土配合比檢測(cè)報(bào)告
- 100道遞等式計(jì)算(能巧算得要巧算)
- 【2019年整理】園林景觀設(shè)計(jì)費(fèi)取費(fèi)標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論