基于FPGA的自主可控SOC設(shè)計 課件 第八講 SoC典型實例及技術(shù)展望_第1頁
基于FPGA的自主可控SOC設(shè)計 課件 第八講 SoC典型實例及技術(shù)展望_第2頁
基于FPGA的自主可控SOC設(shè)計 課件 第八講 SoC典型實例及技術(shù)展望_第3頁
基于FPGA的自主可控SOC設(shè)計 課件 第八講 SoC典型實例及技術(shù)展望_第4頁
基于FPGA的自主可控SOC設(shè)計 課件 第八講 SoC典型實例及技術(shù)展望_第5頁
已閱讀5頁,還剩51頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第八講邏輯設(shè)計基礎(chǔ)

1

第八講SoC典型實例及技術(shù)展望

基于ARM的SoC系統(tǒng)圖形圖像處理與GPU系統(tǒng)基于PowerPC的SoC系統(tǒng)多核處理器、眾核處理器及并行處理器系統(tǒng)片上網(wǎng)絡(luò)系統(tǒng)8.1基于ARM的SoC系統(tǒng)

ARMcore:ARM966E

AMBA總線:AHB+APB

外設(shè)IP(PeripheralIPs):VIC(VectorInterruptController),DMA,UART,RTC,SSP,WDT……

Memoryblocks:SRAM,FLASH……

模擬IP:ADC,PLL……8.1基于ARM的SoC設(shè)計1.ARM內(nèi)核選擇8.1基于ARM的SoC設(shè)計2.ARM總線結(jié)構(gòu)選擇ASB,AHB,AHBlite,AXI總線評估總線頻率是否滿足需求,同時不會消耗過多的功耗和片上面積。抽象級別很高的TLM(TransactionLevelModels)模型建模。TLM模型提供了比RTL仿真快100~10000倍的軟硬聯(lián)仿性能,并提供系統(tǒng)的分析功能。8.1基于ARM的SoC設(shè)計3.外設(shè)IP核選擇現(xiàn)成的IP?自己定制?8.1基于ARM的SoC設(shè)計4.自設(shè)計IP核與AMBA總線驗證基于元件的驗證方法8.1基于ARM的SoC設(shè)計5.平臺驗證ARMcore的DSM(DesignSimulationModel)模型驗證硬件加速器FPGA原型驗證8.1基于ARM的SoC設(shè)計6.FPGA原型驗證ARM公司提供的Integratorprototypingboard第三方供應(yīng)商提供的FPGA驗證平臺自己開發(fā)FPGA原型板8.1基于ARM的SoC設(shè)計7.集成ARM硬核的FPGAXilinx的ZYNQ7000系列ZYNQ7020Intel的CycloneV系列Cyclone?

VSoC925MHz,dual-coreARM?Cortex?-A9

ZYNQ架構(gòu)ZYNQ架構(gòu)

CycloneVSXSoCFPGA系列器件5CSXC45CSXC55CSXC6LE40,00085,000110,000ALM15,09432,07541,509M10K存儲器模塊224397514M10K存儲器(Kb)2,2403,9725,140MLAB(Kb)22048062118位x19位乘法器116174224精度可調(diào)DSP模塊5887112收發(fā)器最大數(shù)量699PCIe硬核IP模塊222FPGAPLL566HPSPLL333FPGA用戶I/O最大數(shù)量124288288HPSI/O最大數(shù)量188188188FPGA硬核存儲器控制器111HPS硬核存儲器控制器111處理器內(nèi)核(ARMCortexTM-A9MPCoresTM)兩個兩個兩個集成ARM硬核的FPGA中PS與PL通信總線為AXIAHBWishboneAvalonABCD提交單選題1分8.2GPU系統(tǒng)圖形處理器(GraphicProcessingUnit,GPU),是相對于CPU的一個概念。8.2.1GPU應(yīng)用范圍8.2.2GPU性能優(yōu)勢(1)高效的并行性。通過GPU多條繪制流水線的并行計算來體現(xiàn)的。在目前主流的GPU中,配置多達16個片段處理流水線,6個頂點處理流水線。(2)高密集的運算。GPU通常具有128位或256位的內(nèi)存位寬。(3)超長圖形流水線。GPU超長圖形流水線的設(shè)計以吞吐量的最大化為目標(biāo)(如NVIDIAGeForce3流水線有800個階段)。8.2.3GPU與CPU比較CPU中的大部分晶體管主要用于構(gòu)建控制電路(如分支預(yù)測等)和Cache,只有少部分的晶體管來完成實際的運算工作。GPU大部分晶體管可以組成各類專用電路和多條流水線,使GPU的計算速度有了突破性的飛躍,擁有驚人的處理浮點運算的能力。CPU與GPU的區(qū)別CPU控制資源多CPU存儲資源多GPU計算資源多GPU對Cache需求小ABCD提交多選題1分8.3基于PowerPC的SoC系統(tǒng)PowerPC(PerformanceOptimizedWithEnhancedRISC)是一種RISC架構(gòu)的CPU,Apple、IBM、Motorola組成的AIM聯(lián)盟所發(fā)展出的微處理器架構(gòu)。PowerPC處理器有32個(32位或64位)GPR(通用寄存器)以及諸如PC(程序計數(shù)器)、LR(鏈接寄存器)、CR(條件寄存器)等各種其它寄存器。8.3.1PowerPC產(chǎn)品系列IBM主要的PowerPC產(chǎn)品有PowerPC604s,PowerPC405,PowerPC750,PowerPCG3。Motorola主要有MC和MPC系列。(1)Motorola

MPC860MPC860PowerQUICC(QuadIntegratedCommunicationsController)內(nèi)部集成了微處理器和一些控制領(lǐng)域的常用外圍組件,特別適用于通信產(chǎn)品。集成了兩個處理塊(PowerPC核,通信處理模塊(CPM,CommunicationsProcessorModule))通信處理模塊支持四個串行通信控制器(SCC,SerialCommunicationController):4個SCC,2個串行管理控制器(SMC),一個串行外圍接口電路(SPI)和一個I2C接口。(2)IBMPowerPC405GP32位RISC嵌入式CPU,內(nèi)核主頻達到200MHz;SDRAM接口(SynchronousDRAMInterface);100MHz外圍設(shè)備總線(ExternalPeripheralBus)4個通道DMA控制,支持外設(shè),內(nèi)部UART和內(nèi)存;PCI總線接口---可設(shè)置同步,異步內(nèi)置時鐘;以太網(wǎng)(Ethernet)----支持10/100Mbps全雙工。媒介獨立接口(MediumIndependentInterface(MII)(3)IBMPowerPC405GP主要控制器包括:SDRAM存儲控制器,外部設(shè)備總線控制器(EBC),DMA控制器,UART,IIC總線接口,通用寄存器控制器(GeneralPurposeI/OController),通用中斷控制器(UniversalInterruptController,UIC),

JTAG。

XilinxVirtex-4FX系列平臺FPGA內(nèi)嵌PowerPC405硬處理器8.4多核處理器物理限制是多核以及未來眾核處理器出現(xiàn)和發(fā)展的動力。一個經(jīng)驗定律(摩爾定律)三個限制(功耗、互連線延時和設(shè)計復(fù)雜度)一個多核處理器本身沒有什么有深度的挑戰(zhàn),難點其實是互連和編程的問題。8.4.1學(xué)術(shù)界典型多核系統(tǒng)斯坦福的Hydra(1996)斯坦福的Imagine(2000)MIT的RAW(2002)UT奧斯丁的TRIPS(2003)8.4.2多核處理器分類多核處理器的設(shè)計依照大致可以分為三類:總線或者交換開關(guān)互連的處理器流處理器和圖形處理器網(wǎng)絡(luò)互連的處理器(1)總線或交換開關(guān)架構(gòu)多核

設(shè)計統(tǒng)一的訪問存儲路徑各個處理器核類似于傳統(tǒng)的單核處理器,具有較為強大的計算功能,只是作了一些裁剪來優(yōu)化功耗等要素。從編程上來講類似于傳統(tǒng)的多處理器編程,內(nèi)存空間共享,并控制了多線程編程的復(fù)雜度。(1)總線或交換開關(guān)架構(gòu)多核

設(shè)計系統(tǒng)瓶頸體現(xiàn)在系統(tǒng)性能和功耗兩個方面系統(tǒng)性能總線或者交換開關(guān)仍舊依賴全局金屬互聯(lián)線,其性能并不能隨著半導(dǎo)體技術(shù)進步而提高。全局性地互連要求,效率低。從延遲上講,電阻電容大,充電時間長,信號延遲很大;從吞吐率上來講,其帶寬是無法適應(yīng)處理器核數(shù)量的增長的。(1)總線或交換開關(guān)架構(gòu)多核

設(shè)計系統(tǒng)瓶頸體現(xiàn)在系統(tǒng)性能和功耗兩個方面功耗

功耗的不可擴展性決定了總線結(jié)構(gòu)不能支持片上多核隨著摩爾定律而擴展到片上眾核,需要選擇流處理器或者片上網(wǎng)絡(luò)等較為復(fù)雜的體系結(jié)構(gòu)。SoC總線結(jié)構(gòu)不足SoC的總線結(jié)構(gòu)在性能、功耗、延遲信號完整性、時鐘同步和可靠性等方面面臨著巨大的挑戰(zhàn),成為限制MPSoC發(fā)展的主要瓶頸[(1)設(shè)備擴展性(2)信號完整性(3)信號延遲(4)全局同步8.5片上網(wǎng)絡(luò)系統(tǒng)片上網(wǎng)絡(luò)(NetworkonChip,NoC)借鑒了分布式計算系統(tǒng)的通信方式,采用路由和分組交換技術(shù)替代傳統(tǒng)總線,是最有希望解決復(fù)雜片上通信問題的新方法。NoC技術(shù)從體系結(jié)構(gòu)上解決了SoC的總線結(jié)構(gòu)所固有的三大問題:由于地址空間有限而引起的可擴展性問題,由于分時通訊而引起的通訊效率問題,以及由于全局同步而引起的功耗和面積問題。SOC總線結(jié)構(gòu)的不足設(shè)備擴展性全局同步信號延遲信號完整性ABCD提交多選題1分8.5.1NoC結(jié)構(gòu)NoC由計算資源和通信網(wǎng)絡(luò)兩部分組成。計算資源一般由IP核和本地內(nèi)存組成,完成廣義的“計算”任務(wù)。IP核可以是CPU、DSP、RAM、高帶寬的I/O設(shè)備、可重構(gòu)硬件單元等。通信網(wǎng)絡(luò)實現(xiàn)計算資源之間高速通信,主要包含路由器、鏈路和網(wǎng)絡(luò)適配器模塊。8.5.1NoC結(jié)構(gòu)8.5.2NoC分層和OSI之間對應(yīng)關(guān)系8.5.3NoC優(yōu)勢可擴展性可重用性可預(yù)測性可定制性設(shè)計靈活性模塊化高性能8.5.4NoC關(guān)鍵技術(shù)(1)NoC拓?fù)浣Y(jié)構(gòu)NoC研究借鑒了并行計算機體系結(jié)構(gòu)中的靜態(tài)網(wǎng)絡(luò)結(jié)構(gòu),包括規(guī)則拓?fù)浜筒灰?guī)則拓?fù)?。?guī)則拓?fù)渲饕?DMesh、2DTorus、3DMesh、Octagon、ClusterMesh、Spidergon、超立方、蜂窩式、樹形和蝶形等拓?fù)浣Y(jié)構(gòu)。不規(guī)則拓?fù)浒▽S镁W(wǎng)絡(luò)、分層網(wǎng)絡(luò)、網(wǎng)絡(luò)-總線混合拓?fù)湟约坝梢?guī)則拓?fù)浣M合而成的拓?fù)浣Y(jié)構(gòu)。規(guī)則拓?fù)渚哂辛己玫木W(wǎng)絡(luò)參數(shù),容易進行規(guī)模擴展,能夠有效降低設(shè)計時間和成本,受到了廣泛的應(yīng)用。(1)NoC拓?fù)浣Y(jié)構(gòu)2Dmesh與2DTorus拓?fù)?1)NoC拓?fù)浣Y(jié)構(gòu)Octagon與3DMesh拓?fù)浣Y(jié)構(gòu)(1)NoC拓?fù)浣Y(jié)構(gòu)Spidergon與ClusterMesh拓?fù)浣Y(jié)構(gòu)(1)NoC拓?fù)浣Y(jié)構(gòu)傳統(tǒng)K叉樹的主要問題是單個父節(jié)點尤其是根節(jié)點,容易成為通信瓶頸。一種可擴展的基于4叉胖樹結(jié)構(gòu)的SPIN拓?fù)浣Y(jié)構(gòu)(1)NoC拓?fù)浣Y(jié)構(gòu)在給定的2×2交叉開關(guān)中,通過在線對中各引出一根線簡單地交叉相連就能獲得蝶網(wǎng)的基本構(gòu)造模塊。典型拓?fù)浣Y(jié)構(gòu)特性NOC拓?fù)浣Y(jié)構(gòu)包括MeshTorusSPINOctagonABCD提交多選題1分(2)路由算法路由算法用來確定數(shù)據(jù)包從源節(jié)點到目的節(jié)點所經(jīng)過的路徑。依據(jù)路由算法能否根據(jù)網(wǎng)絡(luò)通信量或拓?fù)浣Y(jié)構(gòu)自適應(yīng)地調(diào)整變化,路由算法可以分為靜態(tài)(確定性)路由算法和動態(tài)(自適應(yīng))路由算法。

根據(jù)不同的研究重點,有些側(cè)重于路由算法的性能,有些側(cè)重于路由算法損耗的能量。無論是哪類路由,算法應(yīng)該有效地解決死鎖、活鎖以及饑餓問題,提高通信的可靠性以及算法的健壯性。(2)路由算法死鎖是指兩個以上數(shù)據(jù)包被阻塞在中間路由節(jié)點,對網(wǎng)絡(luò)資源的釋放和請求之間出現(xiàn)循環(huán)等待的情況,數(shù)據(jù)包之間相互阻塞則引起死鎖?;铈i是指一個數(shù)據(jù)包在其目的節(jié)點周圍環(huán)繞傳輸,但無法到達目的節(jié)點的情況。饑餓是指當(dāng)傳輸過程中存在多種不同優(yōu)先級的數(shù)據(jù)包,可能出現(xiàn)高優(yōu)先級的數(shù)據(jù)包始終占用資源,使得低優(yōu)先級的數(shù)據(jù)包無法獲得資源使用權(quán),不能到達目的節(jié)點的情況。(2)路由算法常用路由算法確定性XY路由算法自適應(yīng)的Nonh_1ast、South_last、Odd_even和DyAD路由算法。確定性XY路由算法確定性XY路由算法取決于源節(jié)點和目的節(jié)點的地址,與網(wǎng)絡(luò)狀況無關(guān)。數(shù)據(jù)包首先在X方向進行傳輸,當(dāng)數(shù)據(jù)包到達與目的節(jié)點同一列時,轉(zhuǎn)向Y方向傳輸,最后到達目的節(jié)點。Odd_even路由算法禁止奇數(shù)列節(jié)點發(fā)生NW和SW的轉(zhuǎn)向;禁止偶數(shù)列節(jié)點發(fā)生EN和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論