FPGA加速卡的發(fā)展歷程與展望_第1頁
FPGA加速卡的發(fā)展歷程與展望_第2頁
FPGA加速卡的發(fā)展歷程與展望_第3頁
FPGA加速卡的發(fā)展歷程與展望_第4頁
FPGA加速卡的發(fā)展歷程與展望_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

從芯片到系統(tǒng):FPGA加速卡的發(fā)展歷程與展望一個重要的趨勢作為加速云數(shù)據(jù)中心的重要組件,F(xiàn)PGA已經(jīng)開始了它在數(shù)據(jù)中心領(lǐng)域的廣泛使用。除了像微軟、亞馬遜這樣的大型云服務(wù)提供商之外,F(xiàn)PGA也逐漸開始進入其他類型和規(guī)模的數(shù)據(jù)中心,并在大數(shù)據(jù)處理、AI、網(wǎng)絡(luò)功能加速等領(lǐng)域扮演者重要的角色。DataAnalyticsGenomic^老石談芯CyberSecurityArtificialIrtelligenceIvtdeoTranscodingFinancialAccelerationDataAnalyticsGenomic^老石談芯CyberSecurityArtificialIrtelligenceIvtdeoTranscodingFinancialAccelerationFPGASCANHELP:TARGETAPPLICATIONS(圖片來自英特爾)在這些基于大數(shù)據(jù)浪潮的全新應(yīng)用中,F(xiàn)PGA廠商也在不斷的探索和嘗試新的FPGA推廣方法。他們的最終目的非常簡單,就是讓更多的用戶使用自己的FPGA產(chǎn)品。但在這個過程中,我們可以發(fā)現(xiàn)一個重要的發(fā)展趨勢,那就是FPGA廠商正在逐漸的從單純的芯片提供商,轉(zhuǎn)變?yōu)橄到y(tǒng)級解決方案提供商。回首過去,在傳統(tǒng)的FPGA業(yè)務(wù)模型里,F(xiàn)PGA廠商通常只負(fù)責(zé)賣給客戶兩樣?xùn)|西:一個是FPGA芯片,另外一個是FPGA的開發(fā)工具。兩件東西一旦售出,客戶開發(fā)何種應(yīng)用就與廠商無關(guān)。雖然廠商也會提供詳盡的技術(shù)支持,但主要的開發(fā)過程往往還是由客戶完成。如今,F(xiàn)PGA廠商更傾向于提供給客戶一個完整的系統(tǒng)級解決方案。兩大FPGA廠商英特爾和賽靈思目前紛紛推出的各類FPGA加速卡,就是這個趨勢的典型代表??傮w而言,F(xiàn)PGA廠商在硬件層面已經(jīng)不單單提供芯片級的產(chǎn)品,而是進一步提供板卡級的產(chǎn)品組合。與開發(fā)板不同,F(xiàn)PGA加速卡是針對特定領(lǐng)域和應(yīng)用的專業(yè)板卡,通常以PCIe擴展卡的方式進行部署。板卡上設(shè)計有豐富的高速I/O接口與存儲資源,但往往不會配備太多開發(fā)板上常見的調(diào)試功能與資源,例如通用I/O等。在軟件層面,F(xiàn)PGA廠商除了提供傳統(tǒng)的開發(fā)套件之外,現(xiàn)在還會提供與FPGA加速卡配套的驅(qū)動、各類軟件庫、編程接口(API),甚至還有下文會提到的完整的軟件開發(fā)棧以及軟硬件參考設(shè)計。通過提供這些完整的開發(fā)環(huán)境,大大簡化了FPGA的開發(fā)難度,使得軟件開發(fā)人員也能在短時間內(nèi)完成算法模型的FPGA實現(xiàn)。FPGA廠商的主要目的,是在不斷提供原廠軟硬件解決方案的同時,也在不斷吸收第三方的IP與應(yīng)用,從而構(gòu)建一個完整的FPGA生態(tài)系統(tǒng)。同時我們也注意到,除了FPGA原廠的加速卡方案之外,很多第三方廠家,比如華為、浪潮和Mellanox等,也相繼推出了各自的FPGA加速卡產(chǎn)品。這些第三方加速卡雖然采用的都是英特爾或賽靈思的FPGA芯片,但都針對各自的細(xì)分領(lǐng)域做了優(yōu)化設(shè)計,以適應(yīng)目標(biāo)應(yīng)用的需要。在下文中,我將詳細(xì)介紹一下當(dāng)前在市場上主要的FPGA加速卡產(chǎn)品,以及各個廠商基于加速卡的FPGA生態(tài)系統(tǒng)布局。英特爾的FPGA加速卡布局早在2017年10月,英特爾就官宣了旗下的首款FPGA加速卡產(chǎn)品,名為“ProgrammableAccelerationCard”,簡稱PAC。同時發(fā)布的,還有與之配套的軟硬件開發(fā)框架與加速棧系統(tǒng)。這不僅是英特爾FPGA的首款通用FPGA加速卡產(chǎn)品,也是當(dāng)時市場上的首款面向大數(shù)據(jù)、AI、高新能計算等新興領(lǐng)域的數(shù)據(jù)中心FPGA加速卡,因此PAC的意義非同小可。圖片來自英特爾)在硬件規(guī)格方面,PAC使用了英特爾的Arria10GXFPGA,它基于英特爾的20納米工藝制造,擁有115萬個可編程邏輯單元,是當(dāng)時性能和容量最強大的英特爾FPGA。PAC集成了8GB的DDR4內(nèi)存和128MB閃存,有一個QSFP+接口,能滿足最高40Gbps的網(wǎng)絡(luò)連接帶寬,同時有PCIeGen3x8接口與主機CPU互聯(lián)。(圖片來自英特爾)值得注意的是,PAC的板級功耗約為45W~60W,因此得以采用了被動散熱設(shè)計,從而將板卡的尺寸控制在了半高半長,方便在各類服務(wù)器的部署。PAC的主要應(yīng)用場景是加速數(shù)據(jù)中心的各類應(yīng)用,作為英特爾的原廠產(chǎn)品,PAC在數(shù)據(jù)中心里有著得天獨厚的優(yōu)勢。它天生可以作為英特爾Xeon處理器的硬件加速單元,用于卸載和加速原本在CPU上實現(xiàn)的各類應(yīng)用,從而構(gòu)成英特爾CPU+FPGA的高性能數(shù)據(jù)處理組合。作為生態(tài)系統(tǒng)構(gòu)建的重要組成部分,英特爾還發(fā)布了面向Xeon和FPGA的加速堆棧(AccelerationStack),見下圖。這個加速堆棧本質(zhì)上是一個軟件開發(fā)框架,包含了FPGA板卡的驅(qū)動、API、接口管理、軟件庫與開發(fā)工具等,從而為CPU與FPGA的聯(lián)合開發(fā)提供了通用的編程接口,簡化了開發(fā)流程,縮短了開發(fā)時間。

圖片來自英特爾)為了向軟件開發(fā)者進一步抽象底層的FPGA硬件資源,英特爾開源了名為“開放可編程加速引擎(OpenProgrammableAccelerationEngine-OPAE)”的技術(shù)。OPAE是一個層次化模型,提供了一系列標(biāo)準(zhǔn)的軟件接口,以及常見硬件功能的FPGA實現(xiàn),比如各類寄存器與內(nèi)存分配邏輯等等。同時,也提供了很多操作系統(tǒng)內(nèi)核空間的FPGA支持,使得開發(fā)者可以專注于用戶空間的應(yīng)用開發(fā)。圖片來自英特爾)PAC發(fā)布一年后,英特爾在2018年10月發(fā)布了另一款基于StatixlOSXFPGA的加速卡。相比前一代產(chǎn)品,這款加速卡在硬件性能上有了質(zhì)的飛越。Stratix10作為英特爾的高端FPGA系列,基于英特爾的14納米工藝制造,并采用了3D系統(tǒng)級封裝技術(shù),有著更高的集成度。在這款PAC采用的Stratix10FPGA上,有280萬可編程邏輯單元,244Mb片上內(nèi)存以及高達26Gbps的串行收發(fā)器。圖片來自英特爾)板上資源方面,這款PAC包含32GBDDR4內(nèi)存、兩個最高支持100Gbps網(wǎng)絡(luò)帶寬的QSFP28接口,以及PCIeGen3x16接口。由于這個板卡面向更高性能的數(shù)據(jù)中心應(yīng)用,因此在功耗和尺寸方面都有所增加,其中板級功耗約為225W,尺寸為全高、3/4長的雙槽設(shè)計。

USBDDR4w/ECCDDR4w/ECCDDR4w/ECCDDR4w/ECCIntelProgramtrisbleAccGl&ration匚ardwithInterStratix'10SXFPGAFLASHIntelStratix1OSXFPGAUSBDDR4w/ECCDDR4w/ECCDDR4w/ECCDDR4w/ECCIntelProgramtrisbleAccGl&ration匚ardwithInterStratix'10SXFPGAFLASHIntelStratix1OSXFPGA28MLogicElementsBlexPCiertQSFP284x25GbNetworkingInterfaceQSFP284x25GbNetworkinginterfaceBMCUSBIntelMAX"10…HubFPGAIntelEnpirion*PowerSolutions圖片來自英特爾)在2019年MWC大會的第一天,英特爾又推出了一款針對5G應(yīng)用的FPGA加速卡PACN3000,見下圖。這款加速卡可以實現(xiàn)高達100Gbps的網(wǎng)絡(luò)流量的加速處理,同時支持9GBDDR4和144MBQDRIV板上內(nèi)存。圖片來自英特爾)對于英特爾的FPGA加速卡產(chǎn)品而言,它們最大的優(yōu)勢之一就是英特爾在數(shù)據(jù)中心處理器領(lǐng)域的核心支配地位。由于英特爾Xeon處理器占據(jù)了數(shù)據(jù)中心市場的x86處理器的絕大部分市場份額,因此無論何家的FPGA加速卡都必須針對Xeon處理器做大量的兼容性設(shè)計和優(yōu)化,而英特爾FPGA在這方面有著先天的血統(tǒng)優(yōu)勢。這也使得英特爾成為目前唯一一個能夠提供全棧式數(shù)據(jù)中心解決方案的公司。此外,英特爾與各大服務(wù)器制造商保持著良好的合作關(guān)系,因此包括戴爾、HPE、富士通等服務(wù)器制造商會很自然的在自家的服務(wù)器產(chǎn)品中加入并銷售基于英特爾FPGA的加速卡。然而,這對于其他FPGA廠商而言就沒有那么水到渠成,他們往往很難說服服務(wù)器廠商或者客戶在已經(jīng)內(nèi)置了FPGA的服務(wù)器中,再花費額外的成本,并冒著兼容性的風(fēng)險去添加其他的FPGA加速器。賽靈思的FPGA加速卡布局賽靈思的FPGA加速卡產(chǎn)品起步相對較晚。在2018年10月,賽靈思才正式發(fā)布了旗下首款面向數(shù)據(jù)中心應(yīng)用加速的FPGA加速卡產(chǎn)品,名為Alveo。首批推出的AlveoU200和U250板卡均基于賽靈思的16納米UltraScaleFPGA器件,分別擁有89.2萬和134.1萬個可編程邏輯單元。在FPGA器件方面,這兩款A(yù)lveo卡與英特爾的PAC相比,可以說在伯仲之間。這兩款板卡主要針對的都是大型數(shù)據(jù)中心應(yīng)用,因此板上集成了64GBDDR4內(nèi)存,以及兩個QSFP28網(wǎng)絡(luò)接口和一個PCIeGen3接口。與PAC相比,這兩款板卡的板級資源要豐富的多。然而,這也導(dǎo)致Alveo板卡的外形尺寸和功耗都比較大。當(dāng)采用主動散熱時,板卡尺寸為全高全長,標(biāo)準(zhǔn)功耗為100瓦~110瓦,功耗峰值可達225W,遠(yuǎn)超過PAC的45W~60W。(圖片來自賽靈思)在生態(tài)系統(tǒng)建設(shè)方面,Alveo加速卡將主要基于賽靈思的SDAccel軟件進行開發(fā)。SDAccel是一個集成的開發(fā)環(huán)境,它的主要結(jié)構(gòu)層次如下圖所示。SDAccel最主要的特點之一是包含針對諸如C/C++和OpenCL等高層次語言的FPGA編譯器、軟件庫和API等基礎(chǔ)架構(gòu),以期幫助軟件開發(fā)者更快的對FPGA硬件進行開發(fā)。這一點,與英特爾的面向Xeon和FPGA的加速堆棧有異曲同工之妙。這也印證了當(dāng)前FPGA軟件系統(tǒng)發(fā)展的趨勢,就是需要不斷降低FPGA開發(fā)的門檻,通過盡量多的提供高層次語言的支持,以提高FPGA的開發(fā)效率,縮短產(chǎn)品面世時間。RurilirrioRaif&nnS^MjrcecodeEmm-lalionfMbuig□pHrm-zattoPi/Dobbj^BuardOeployrrifnillenIM亡drdnErtrniiKIExecutiwu^ic^ish@ilI4NHIwr*?tAroundd*w^Qp?rnrwtf^t-HUnE.h^$4iElincipmmLfiK^EiDnifrrt*fcrth*dnv?n3RurilirrioRaif&nnS^MjrcecodeEmm-lalionfMbuig□pHrm-zattoPi/Dobbj^BuardOeployrrifnillenIM亡drdnErtrniiKIExecutiwu^ic^ish@ilI4NHIwr*?tAroundd*w^Qp?rnrwtf^t-HUnE.h^$4iElincipmmLfiK^EiDnifrrt*fcrth*dnv?n3圖片來自賽靈思)第三方的FPGA加速卡除了英特爾和賽靈思推出的原廠FPGA加速卡之外,很多第三方廠商也在近年相繼推出了基于FPGA的硬件加速卡產(chǎn)品。其中比較典型的有我國浪潮、華為等公司推出的加速卡,以及國外Mellanox公司推出的基于FPGA的智能網(wǎng)卡浪潮的F10AFPGA加速卡是目前在售的一款FPGA加速卡產(chǎn)品,見下圖。它采用了英特爾Arria10FPGA,最多包含115萬個片上可編程邏輯單元。加速卡上提供了兩個SFP+10Gbps以太網(wǎng)端口,PCIeGen3x8接口,以及最高32GB板載DDR內(nèi)存。

(圖片來自浪潮)在2018年10月底的賽靈思開發(fā)者大會上,浪潮和華為都發(fā)布了自己的新FPGA加速卡產(chǎn)品,分別叫做浪潮F37X和華為FX系列,如下圖所示。圖片來自浪潮)

FX600FX300<■.老石參站圖片來自華為)這兩款加速卡都采用了賽靈思的16納米UltraScale+FPGA器件。相比賽靈思的原廠Alveo加速卡,這兩款加速卡產(chǎn)品的主要特點是功耗得到了進一步削減,這可能得益于FPGA芯片規(guī)格的提升。例如,浪潮的F37X加速卡的典型功耗只有75瓦左右,而華為的FX系列的中端加速卡的典型功耗最大為75瓦,高端卡為200瓦。在其他技術(shù)規(guī)格方面,浪潮F37X加速卡使用的FPGA集成了8GB的HBM2片上高速緩存,相比DDR而言,能大幅提高存儲帶寬和訪存效率。相比Alveo,新推出的這兩類第三方加速卡都有著更高的片上邏輯單元數(shù)量,足以應(yīng)對各種新興的數(shù)據(jù)中心計算與應(yīng)用場景,比如機器學(xué)習(xí)、視頻編解碼、NFV、圖像與語音識別等等。老石在之前的文章《Mellanox為何讓多家巨頭公司趨之若鶩》中介紹過,Mellanox是一家總部位于以色列的著名的網(wǎng)絡(luò)設(shè)備供應(yīng)商,旗下產(chǎn)品包括網(wǎng)絡(luò)控制芯片、網(wǎng)卡、線纜、交換機、軟件等等,可以說幾乎涵蓋了數(shù)據(jù)中心網(wǎng)絡(luò)產(chǎn)品的各大門類。Mellanox的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論