基于FPGA的自主可控SOC設(shè)計課件第八講 SoC典型實例及技術(shù)展望

上傳人：y*** IP屬地：山東上傳時間：2024-12-27 格式：PPT 頁數(shù)：56 大?。?.74MB 積分：15 舉報 版權(quán)申訴

基于FPGA的自主可控SOC設(shè)計課件第八講 SoC典型實例及技術(shù)展望_第2頁

基于FPGA的自主可控SOC設(shè)計課件第八講 SoC典型實例及技術(shù)展望_第3頁

基于FPGA的自主可控SOC設(shè)計課件第八講 SoC典型實例及技術(shù)展望_第4頁

基于FPGA的自主可控SOC設(shè)計課件第八講 SoC典型實例及技術(shù)展望_第5頁

已閱讀5頁，還剩51頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

第八講邏輯設(shè)計基礎(chǔ)

第八講SoC典型實例及技術(shù)展望

基于ARM的SoC系統(tǒng)圖形圖像處理與GPU系統(tǒng)基于PowerPC的SoC系統(tǒng)多核處理器、眾核處理器及并行處理器系統(tǒng)片上網(wǎng)絡(luò)系統(tǒng)8.1基于ARM的SoC系統(tǒng)

ARMcore：ARM966E

AMBA總線：AHB+APB

外設(shè)IP(PeripheralIPs)：VIC(VectorInterruptController),DMA,UART,RTC,SSP,WDT……

Memoryblocks：SRAM,FLASH……

模擬IP：ADC,PLL……8.1基于ARM的SoC設(shè)計1.ARM內(nèi)核選擇8.1基于ARM的SoC設(shè)計2.ARM總線結(jié)構(gòu)選擇ASB，AHB，AHBlite，AXI總線評估總線頻率是否滿足需求，同時不會消耗過多的功耗和片上面積。抽象級別很高的TLM（TransactionLevelModels）模型建模。TLM模型提供了比RTL仿真快100～10000倍的軟硬聯(lián)仿性能，并提供系統(tǒng)的分析功能。8.1基于ARM的SoC設(shè)計3.外設(shè)IP核選擇現(xiàn)成的IP？自己定制？8.1基于ARM的SoC設(shè)計4.自設(shè)計IP核與AMBA總線驗證基于元件的驗證方法8.1基于ARM的SoC設(shè)計5.平臺驗證ARMcore的DSM（DesignSimulationModel）模型驗證硬件加速器FPGA原型驗證8.1基于ARM的SoC設(shè)計6.FPGA原型驗證ARM公司提供的Integratorprototypingboard第三方供應(yīng)商提供的FPGA驗證平臺自己開發(fā)FPGA原型板8.1基于ARM的SoC設(shè)計7.集成ARM硬核的FPGAXilinx的ZYNQ7000系列ZYNQ7020Intel的CycloneV系列Cyclone?

VSoC925MHz，dual-coreARM?Cortex?-A9

ZYNQ架構(gòu)ZYNQ架構(gòu)

CycloneVSXSoCFPGA系列器件5CSXC45CSXC55CSXC6LE40,00085,000110,000ALM15,09432,07541,509M10K存儲器模塊224397514M10K存儲器(Kb)2,2403,9725,140MLAB(Kb)22048062118位x19位乘法器116174224精度可調(diào)DSP模塊5887112收發(fā)器最大數(shù)量699PCIe硬核IP模塊222FPGAPLL566HPSPLL333FPGA用戶I/O最大數(shù)量124288288HPSI/O最大數(shù)量188188188FPGA硬核存儲器控制器111HPS硬核存儲器控制器111處理器內(nèi)核(ARMCortexTM-A9MPCoresTM)兩個兩個兩個集成ARM硬核的FPGA中PS與PL通信總線為AXIAHBWishboneAvalonABCD提交單選題1分8.2GPU系統(tǒng)圖形處理器（GraphicProcessingUnit，GPU），是相對于CPU的一個概念。8.2.1GPU應(yīng)用范圍8.2.2GPU性能優(yōu)勢（1）高效的并行性。通過GPU多條繪制流水線的并行計算來體現(xiàn)的。在目前主流的GPU中，配置多達16個片段處理流水線，6個頂點處理流水線。（2）高密集的運算。GPU通常具有128位或256位的內(nèi)存位寬。（3）超長圖形流水線。GPU超長圖形流水線的設(shè)計以吞吐量的最大化為目標(biāo)（如NVIDIAGeForce3流水線有800個階段）。8.2.3GPU與CPU比較CPU中的大部分晶體管主要用于構(gòu)建控制電路（如分支預(yù)測等）和Cache，只有少部分的晶體管來完成實際的運算工作。GPU大部分晶體管可以組成各類專用電路和多條流水線，使GPU的計算速度有了突破性的飛躍，擁有驚人的處理浮點運算的能力。CPU與GPU的區(qū)別CPU控制資源多CPU存儲資源多GPU計算資源多GPU對Cache需求小ABCD提交多選題1分8.3基于PowerPC的SoC系統(tǒng)PowerPC（PerformanceOptimizedWithEnhancedRISC）是一種RISC架構(gòu)的CPU，Apple、IBM、Motorola組成的AIM聯(lián)盟所發(fā)展出的微處理器架構(gòu)。PowerPC處理器有32個（32位或64位）GPR（通用寄存器）以及諸如PC（程序計數(shù)器）、LR（鏈接寄存器）、CR（條件寄存器）等各種其它寄存器。8.3.1PowerPC產(chǎn)品系列IBM主要的PowerPC產(chǎn)品有PowerPC604s，PowerPC405,PowerPC750,PowerPCG3。Motorola主要有MC和MPC系列。(1)Motorola

MPC860MPC860PowerQUICC(QuadIntegratedCommunicationsController)內(nèi)部集成了微處理器和一些控制領(lǐng)域的常用外圍組件,特別適用于通信產(chǎn)品。集成了兩個處理塊（PowerPC核，通信處理模塊（CPM,CommunicationsProcessorModule））通信處理模塊支持四個串行通信控制器(SCC,SerialCommunicationController)：4個SCC，2個串行管理控制器(SMC),一個串行外圍接口電路(SPI)和一個I2C接口。(2)IBMPowerPC405GP32位RISC嵌入式CPU,內(nèi)核主頻達到200MHz；SDRAM接口(SynchronousDRAMInterface)；100MHz外圍設(shè)備總線(ExternalPeripheralBus)4個通道DMA控制,支持外設(shè),內(nèi)部UART和內(nèi)存；PCI總線接口---可設(shè)置同步,異步內(nèi)置時鐘；以太網(wǎng)(Ethernet)----支持10/100Mbps全雙工。媒介獨立接口(MediumIndependentInterface(MII)(3)IBMPowerPC405GP主要控制器包括:SDRAM存儲控制器,外部設(shè)備總線控制器(EBC),DMA控制器,UART,IIC總線接口,通用寄存器控制器(GeneralPurposeI/OController),通用中斷控制器(UniversalInterruptController,UIC),

JTAG。

XilinxVirtex-4FX系列平臺FPGA內(nèi)嵌PowerPC405硬處理器8.4多核處理器物理限制是多核以及未來眾核處理器出現(xiàn)和發(fā)展的動力。一個經(jīng)驗定律（摩爾定律）三個限制（功耗、互連線延時和設(shè)計復(fù)雜度）一個多核處理器本身沒有什么有深度的挑戰(zhàn)，難點其實是互連和編程的問題。8.4.1學(xué)術(shù)界典型多核系統(tǒng)斯坦福的Hydra（1996）斯坦福的Imagine(2000)MIT的RAW（2002）UT奧斯丁的TRIPS（2003）8.4.2多核處理器分類多核處理器的設(shè)計依照大致可以分為三類:總線或者交換開關(guān)互連的處理器流處理器和圖形處理器網(wǎng)絡(luò)互連的處理器(1)總線或交換開關(guān)架構(gòu)多核

設(shè)計統(tǒng)一的訪問存儲路徑各個處理器核類似于傳統(tǒng)的單核處理器，具有較為強大的計算功能，只是作了一些裁剪來優(yōu)化功耗等要素。從編程上來講類似于傳統(tǒng)的多處理器編程，內(nèi)存空間共享，并控制了多線程編程的復(fù)雜度。(1)總線或交換開關(guān)架構(gòu)多核

設(shè)計系統(tǒng)瓶頸體現(xiàn)在系統(tǒng)性能和功耗兩個方面系統(tǒng)性能總線或者交換開關(guān)仍舊依賴全局金屬互聯(lián)線，其性能并不能隨著半導(dǎo)體技術(shù)進步而提高。全局性地互連要求，效率低。從延遲上講，電阻電容大，充電時間長，信號延遲很大；從吞吐率上來講，其帶寬是無法適應(yīng)處理器核數(shù)量的增長的。(1)總線或交換開關(guān)架構(gòu)多核

設(shè)計系統(tǒng)瓶頸體現(xiàn)在系統(tǒng)性能和功耗兩個方面功耗

功耗的不可擴展性決定了總線結(jié)構(gòu)不能支持片上多核隨著摩爾定律而擴展到片上眾核，需要選擇流處理器或者片上網(wǎng)絡(luò)等較為復(fù)雜的體系結(jié)構(gòu)。SoC總線結(jié)構(gòu)不足SoC的總線結(jié)構(gòu)在性能、功耗、延遲信號完整性、時鐘同步和可靠性等方面面臨著巨大的挑戰(zhàn)，成為限制MPSoC發(fā)展的主要瓶頸[（1）設(shè)備擴展性（2）信號完整性（3）信號延遲（4）全局同步8.5片上網(wǎng)絡(luò)系統(tǒng)片上網(wǎng)絡(luò)（NetworkonChip,NoC）借鑒了分布式計算系統(tǒng)的通信方式，采用路由和分組交換技術(shù)替代傳統(tǒng)總線，是最有希望解決復(fù)雜片上通信問題的新方法。NoC技術(shù)從體系結(jié)構(gòu)上解決了SoC的總線結(jié)構(gòu)所固有的三大問題：由于地址空間有限而引起的可擴展性問題，由于分時通訊而引起的通訊效率問題，以及由于全局同步而引起的功耗和面積問題。SOC總線結(jié)構(gòu)的不足設(shè)備擴展性全局同步信號延遲信號完整性ABCD提交多選題1分8.5.1NoC結(jié)構(gòu)NoC由計算資源和通信網(wǎng)絡(luò)兩部分組成。計算資源一般由IP核和本地內(nèi)存組成，完成廣義的“計算”任務(wù)。IP核可以是CPU、DSP、RAM、高帶寬的I/O設(shè)備、可重構(gòu)硬件單元等。通信網(wǎng)絡(luò)實現(xiàn)計算資源之間高速通信，主要包含路由器、鏈路和網(wǎng)絡(luò)適配器模塊。8.5.1NoC結(jié)構(gòu)8.5.2NoC分層和OSI之間對應(yīng)關(guān)系8.5.3NoC優(yōu)勢可擴展性可重用性可預(yù)測性可定制性設(shè)計靈活性模塊化高性能8.5.4NoC關(guān)鍵技術(shù)(1)NoC拓?fù)浣Y(jié)構(gòu)NoC研究借鑒了并行計算機體系結(jié)構(gòu)中的靜態(tài)網(wǎng)絡(luò)結(jié)構(gòu)，包括規(guī)則拓?fù)浜筒灰?guī)則拓?fù)?。?guī)則拓?fù)渲饕?DMesh、2DTorus、3DMesh、Octagon、ClusterMesh、Spidergon、超立方、蜂窩式、樹形和蝶形等拓?fù)浣Y(jié)構(gòu)。不規(guī)則拓?fù)浒▽Ｓ镁W(wǎng)絡(luò)、分層網(wǎng)絡(luò)、網(wǎng)絡(luò)-總線混合拓?fù)湟约坝梢?guī)則拓?fù)浣M合而成的拓?fù)浣Y(jié)構(gòu)。規(guī)則拓?fù)渚哂辛己玫木W(wǎng)絡(luò)參數(shù)，容易進行規(guī)模擴展，能夠有效降低設(shè)計時間和成本，受到了廣泛的應(yīng)用。(1)NoC拓?fù)浣Y(jié)構(gòu)2Dmesh與2DTorus拓?fù)?1)NoC拓?fù)浣Y(jié)構(gòu)Octagon與3DMesh拓?fù)浣Y(jié)構(gòu)(1)NoC拓?fù)浣Y(jié)構(gòu)Spidergon與ClusterMesh拓?fù)浣Y(jié)構(gòu)(1)NoC拓?fù)浣Y(jié)構(gòu)傳統(tǒng)K叉樹的主要問題是單個父節(jié)點尤其是根節(jié)點，容易成為通信瓶頸。一種可擴展的基于4叉胖樹結(jié)構(gòu)的SPIN拓?fù)浣Y(jié)構(gòu)(1)NoC拓?fù)浣Y(jié)構(gòu)在給定的2×2交叉開關(guān)中，通過在線對中各引出一根線簡單地交叉相連就能獲得蝶網(wǎng)的基本構(gòu)造模塊。典型拓?fù)浣Y(jié)構(gòu)特性NOC拓?fù)浣Y(jié)構(gòu)包括MeshTorusSPINOctagonABCD提交多選題1分(2)路由算法路由算法用來確定數(shù)據(jù)包從源節(jié)點到目的節(jié)點所經(jīng)過的路徑。依據(jù)路由算法能否根據(jù)網(wǎng)絡(luò)通信量或拓?fù)浣Y(jié)構(gòu)自適應(yīng)地調(diào)整變化，路由算法可以分為靜態(tài)（確定性）路由算法和動態(tài)（自適應(yīng)）路由算法。

根據(jù)不同的研究重點，有些側(cè)重于路由算法的性能，有些側(cè)重于路由算法損耗的能量。無論是哪類路由，算法應(yīng)該有效地解決死鎖、活鎖以及饑餓問題，提高通信的可靠性以及算法的健壯性。(2)路由算法死鎖是指兩個以上數(shù)據(jù)包被阻塞在中間路由節(jié)點，對網(wǎng)絡(luò)資源的釋放和請求之間出現(xiàn)循環(huán)等待的情況，數(shù)據(jù)包之間相互阻塞則引起死鎖?；铈i是指一個數(shù)據(jù)包在其目的節(jié)點周圍環(huán)繞傳輸，但無法到達目的節(jié)點的情況。饑餓是指當(dāng)傳輸過程中存在多種不同優(yōu)先級的數(shù)據(jù)包，可能出現(xiàn)高優(yōu)先級的數(shù)據(jù)包始終占用資源，使得低優(yōu)先級的數(shù)據(jù)包無法獲得資源使用權(quán)，不能到達目的節(jié)點的情況。(2)路由算法常用路由算法確定性XY路由算法自適應(yīng)的Nonh_1ast、South_last、Odd_even和DyAD路由算法。確定性XY路由算法確定性XY路由算法取決于源節(jié)點和目的節(jié)點的地址，與網(wǎng)絡(luò)狀況無關(guān)。數(shù)據(jù)包首先在X方向進行傳輸，當(dāng)數(shù)據(jù)包到達與目的節(jié)點同一列時，轉(zhuǎn)向Y方向傳輸，最后到達目的節(jié)點。Odd_even路由算法禁止奇數(shù)列節(jié)點發(fā)生NW和SW的轉(zhuǎn)向；禁止偶數(shù)列節(jié)點發(fā)生EN和

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于FPGA的自主可控SOC設(shè)計課件第八講 SoC典型實例及技術(shù)展望

文檔簡介

溫馨提示

最新文檔

評論

基于FPGA的自主可控SOC設(shè)計 課件 第八講 SoC典型實例及技術(shù)展望

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

基于FPGA的自主可控SOC設(shè)計課件第八講 SoC典型實例及技術(shù)展望