支持硬核浮點DSP的FPGA或可取代高性能計算GPGPU_第1頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、支持硬核浮點dsp的fpga或可取代高性能計算gpgpu 近來,公司推出業(yè)界首款浮點,它集成了硬核ieee 754兼容浮點運算功能,提高了性能、設(shè)計人員的效能和規(guī)律效率。據(jù)悉,硬核浮點dsp模塊集成在altera 20nm arria 10 fpga和中,以及14nm stratix 10 fpga和soc中。該新功能支持設(shè)計人員以相同的定點性能和效率在浮點中實現(xiàn)其算法,且不會對功耗、面積或者密度產(chǎn)生任何影響,也不會損失定點特性或功能。用戶可以用法altera的fpga和soc來滿足大計算量應(yīng)用需求,例如應(yīng)用在高性能計算(hpc)、雷達、科學(xué)和醫(yī)療成像等領(lǐng)域。精度可調(diào)dsp體系結(jié)構(gòu)“精彩的性能

2、歸功于我們創(chuàng)新的精度可調(diào)dsp體系結(jié)構(gòu)(圖)。”altera公司首席dsp產(chǎn)品規(guī)劃經(jīng)理michael parker表示,“該技術(shù)在每一dsp模塊中包含了一個高精度加法器和單精度乘法器。這些硬核dsp模塊中內(nèi)置了數(shù)千個浮點運算器,在20nm系列中,arria 10 fpga性能從140 gigaflops(gflops)提升至1.5 teraflops(tflops);altera的14nm stratix 10 fpga系列將用法相同的體系結(jié)構(gòu),性能擴展到10 tflops。這是單個器件有史以來最高的性能指標。”圖:具有硬核浮點dsp模塊的首款fpga。該浮點計算單元與現(xiàn)有精度可調(diào)定點模式實現(xiàn)

3、了無縫集成。設(shè)計人員可以在其設(shè)計中用法全部定點dsp處理特性,還可以按照需要將所有設(shè)計或者部分設(shè)計更新到單精度浮點。ieee 754浮點全部復(fù)數(shù)都位于dsp模塊的硬核規(guī)律中,不占用可編程規(guī)律,即使是100%用法了dsp模塊,浮點也支持定點設(shè)計中相像的時鐘速率。大幅縮短開發(fā)時光michael parker稱,自然支持浮點功能對于設(shè)計人員在fpga中實現(xiàn)復(fù)雜的高性能算法十分重要。構(gòu)建系統(tǒng)之前,在浮點中完成全部算法開發(fā)和。完成算法后,通常還需要612個月的時光在定點實現(xiàn)中舉行分析、轉(zhuǎn)換并驗證浮點算法。這一過程需要克服以下三個問題:(1)必需手動將浮點設(shè)計轉(zhuǎn)換為定點,這需要工程師十分有閱歷,而且其實現(xiàn)

4、的精度沒有仿真高;(2)假如以后對算法舉行任何修改,還需要再次舉行手動轉(zhuǎn)換,而且優(yōu)化系統(tǒng)中定點算法的任何步驟都不會反映在仿真中;(3)假如系統(tǒng)集成和測試過程中浮現(xiàn)問題,要隔離問題會十分困難。用法altera浮點fpga能夠協(xié)助設(shè)計人員克服上述問題,它們可以將dsp設(shè)計挺直轉(zhuǎn)譯成浮點硬件,而不是轉(zhuǎn)換為定點,從而大幅縮短了時序收斂和驗證時光。相比之前的系列,硬核浮點dsp模塊能夠縮短近12個月的開發(fā)時光。將與gpgpu綻開競爭據(jù)altera方面透露,與altera浮點fpga競爭的并非fpga,而是gpgpu(general purpose gpu,即通用圖形處理單元,它不是容易的圖形引擎,而是通

5、用計算加速器)。michael parker表示,這是由于其他fpga供給商提供的“軟核”浮點用法規(guī)律來實現(xiàn)復(fù)數(shù)浮點的效率不高,還不具競爭力。fpga和gpgpu都可以用法opencl舉行設(shè)計,但它們在算法實現(xiàn)上有很大的不同。gpgpu用法并行處理器體系結(jié)構(gòu),并行運行數(shù)千個浮點乘加小單元。算法被分成數(shù)萬個線程,數(shù)據(jù)預(yù)備好后,映射到計算單元中。altera浮點fpga在高性能計算方面具有突出優(yōu)勢。首先,因為其流水線規(guī)律體系結(jié)構(gòu),數(shù)據(jù)流的處理延時要比gpgpu低得多;第二,fpga的gflops/w性能要優(yōu)于gpgpu,這也意味著對于所要求的功率預(yù)算,fpga完成的計算量普通要多于gpgpu;第三,fpga具有很好的通用性和廣泛的連通性,能夠挺直放在數(shù)據(jù)通路中處理通過的數(shù)據(jù)。altera還特地增強了數(shù)據(jù)流至其opencl工具的選項,以符合opencl供給商的擴展要求。altera公司軟件和dsp產(chǎn)品市場經(jīng)理albert chang介紹,2014年下半年,altera將提供面對arria 10器件中硬核浮點dsp模塊的浮點設(shè)計流程,包括演示和基準測試。在此之前,用戶可以采納arria 10 f

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論