版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第38卷第2期2008年4月微電子學Microelect ronicsVol 138, No. 2Apr 1 2008一種嵌入式DSP 核的設(shè)計及FPGA 驗證李輝, 李平(電子科技大學電子薄膜與集成器件國家重點實驗室, 成都610054摘要:設(shè)計了一個4級流水線的16位定點DSP 核。該DSP 核支持151條指令指令需要兩個機器周期外, Cy 2clo ne EP1C12Q240C8FP GA 器件實現(xiàn), 可工作在集成開發(fā)環(huán)境QUAR YU S II 和FP GA , 結(jié)果表明, 該DSP 核能。關(guān)鍵詞:; FP ; IMA ADPCM中圖分類號:文獻標識碼:A 文章編號:100423365
2、(2008 0220302204Design and FPGA V erif ication of an Embedded DSP CoreL I Hui , L I Ping(S tate Key L aboratory of Elect ronic T hin Fil ms and I ntegrated Devices , Univ. of Elec. Sci. &Technol. of China , Cheng du 610054, P. R. China A 162bit fixed 2point DSP core with 4pipeline stages is prop
3、osed. The instruction set of the DSP con 2Abstract :tains 138instructions , and all instructions take only one machine cycle except RET instruction , where 2cycles are necessary. The DSP core prototype was realized using Altera s EP1C12Q240C8FP GA with operation f requency of 18. 6M Hz. Based on QUA
4、R TUS II software and FP GA board , the prototype was verified , which indicated that all instructions executed correctly and the codec f unction of IMA ADPCM was also realized as expected.K ey w ords :DSP core ; FP GA ; RAW dependence ; IMA ADPCM EEACC :1265F計、指令集、FP GA 驗證及結(jié)論。1引言2系統(tǒng)設(shè)計DSP 已經(jīng)廣泛地應(yīng)用到數(shù)字
5、信號處理領(lǐng)域, 它或者以獨立的器件形式在系統(tǒng)中出現(xiàn), 或者以IP 核的形式嵌入到SOC 。常見的16位通用DSP 有AD 公司的ADSP21系列、TI 公司的TMS320C54系列, 它們主要應(yīng)用于語音處理和實時控制等領(lǐng)域。然而, 通用的DSP 核會占用較大的芯片面積, 增加芯片成本。因此, 需要設(shè)計專用的DSP 核326來提高性能、降低成本。本文設(shè)計了一個16位嵌入式DSP 核, 用FP 2GA 實現(xiàn)并進行了驗證。結(jié)果表明, 該DSP 核能正確實現(xiàn)其指令集。詳細描述了該DSP 核的系統(tǒng)設(shè)收稿日期:2007207228; 定稿日期:2007209220存儲器在基于DSP 核的系統(tǒng)中總是必需的,
6、 為了清楚描述DSP 核的指令流、數(shù)據(jù)流, 圖1所示的結(jié)構(gòu)框圖包括了DSP 核和存儲器。整個DSP 核的設(shè)計基于數(shù)據(jù)通道和控制器的結(jié)構(gòu)1, 譯碼段(ID 的控制器(Co nt roller 是DSP 核的控制器,DSP 核的其他部分是數(shù)據(jù)通道。下面分別介紹DSP 核的各部分設(shè)計思想。2. 1取指段取指段(IF 完成取指令的功能, 并計算出下次程序計數(shù)器(PC 的值。下次的PC 值有3個來源: 執(zhí)行跳轉(zhuǎn)或者調(diào)用指令時,PC 值是來自程序存儲器的立即數(shù); 執(zhí)行返回指令時, PC 值來自數(shù)據(jù)存儲器中的堆棧; 執(zhí)行其他指令時,PC 值自動加1。2. 2譯碼段譯碼段(ID 的控制器(Controller
7、 根據(jù)指令寄存器(IR 的內(nèi)容和DSP 核的狀態(tài)信息, 譯碼產(chǎn)生DSP 核各部分所需的控制信號。2. 3執(zhí)行段執(zhí)行段(EX 的任務(wù)是傳送數(shù)據(jù)和進行運算。與文獻2中描述的load 2store 結(jié)構(gòu)不同, 這里設(shè)計的數(shù)據(jù)傳送方式靈活, 數(shù)據(jù)處理單元的源操作數(shù)來源豐富, 非常適合需要大量數(shù)據(jù)操作的數(shù)字信號處理任務(wù)。該設(shè)計把大部分的數(shù)據(jù)傳送和運算集中在執(zhí)行段完成, 可以避免出現(xiàn)復雜的數(shù)據(jù)相關(guān)情況。這將有效地減小編譯器的設(shè)計難度或者匯編程序員的編程難度。2. 4, 分析數(shù)據(jù)。圖2為一個單端口隨機存儲器的功能框圖。該存儲器的讀寫時序和設(shè)計中的存儲器讀寫時序相同。讀存儲器中某個單元的內(nèi)容時, 讀控制信號(
8、wr =0 、地址信號(address 在時鐘上升沿載入寄存器, 經(jīng)過一段時間, 相應(yīng)存儲單元的內(nèi)容穩(wěn)定地輸出到數(shù)據(jù)端口(data ; 向存儲器中某個單元寫內(nèi)容時, 寫控制信號(wr =1 、地址信號(address 、待寫數(shù)據(jù)(data 在時鐘上升沿載入寄存器, 經(jīng)過一段時間, 待寫數(shù)據(jù)寫入相應(yīng)的存儲單元 。數(shù)據(jù)傳送的類型包括:寄存器(Registers 之間的數(shù)據(jù)傳送、數(shù)據(jù)存儲單元(Data Mem 送、器(Program 送。(DPU 完成的, 運算類型參考指令集部分。數(shù)據(jù)處理單元包括算術(shù)邏輯運算單元、乘法器和移位器 。圖2單端口隨機存儲器的功能框圖Fig. 2Block diagram
9、 of a single port RAM按照該存儲器的讀寫時序, 不可能在流水線的一級中完成數(shù)據(jù)存儲單元之間的數(shù)據(jù)傳送。因此, 設(shè)計中是在流水線的相鄰兩級分別完成數(shù)據(jù)存儲器的讀和寫。圖1中的數(shù)據(jù)存儲器(Data Mem 是一個雙端口存儲器,1口是只讀端口,2口是讀寫端口。1口的讀控制信號(D_R1 不經(jīng)過控制信號寄存器(CON 2SR , 直接連到數(shù)據(jù)存儲器的1口控制信號圖1DSP 核與存儲器的結(jié)構(gòu)框圖Fig. 1Block diagram of DSP core and memory輸入端;2口的寫控制信號(D_W2 經(jīng)過控制信號寄存器(CON 2SR 后連接到數(shù)據(jù)存儲器的2口控制信號輸入
10、端, 因此數(shù)據(jù)存儲器的寫操作滯后讀操作一個時鐘周期。 考慮到圖1中的數(shù)據(jù)存儲器與圖2類似, 也有一組輸入寄存器, 那么數(shù)據(jù)存儲器的讀操作實際位于流水線的執(zhí)行段(EX , 寫操作位于執(zhí)行段的下一級。也就是說, 圖1中, 的流水線實際為四級, 隱含了寫存儲器這一級。圖1中, 數(shù)據(jù)存儲器、程序存儲器、寄存器堆、數(shù)據(jù)總線(BU S1、BU S2 是16位的, 乘法器是16位的, 算術(shù)邏輯運算單元、移位器、累加器是40位的。因此, 圖1中的DSP 核是由四級流水線構(gòu)成的16位DSP 核。者程序存儲器; 因此僅加法指令就對應(yīng)12條指令。本文設(shè)計的DSP 核共實現(xiàn)151條指令。所有指令中, 只有RET 指令
11、需要兩個機器周期, 其他指令都在1個機器周期內(nèi)完成。由于寫存儲器操作在流水線的第4級完成, 而讀存儲器的操作在流水線的第3級進行, 因此有可能出現(xiàn)存儲器的寫后讀(RA W 相關(guān)。匯編程序員和編譯器均可3指令集4大類的指令, 如表。表1指令集T able 1I nstruction Set Overview本文設(shè)計的DSP 核用可綜合的Verilog HDL描述, 通過Altera 公司的FP GA 集成開發(fā)環(huán)境QUAR TU S II 進行綜合、適配并下載到型號為Cy 2clone EP1C12Q240C8的FP GA 器件進行了驗證。驗證過程中, 主要使用QUA R TU S II 中的Si
12、gnal Tap Logic Analyzer 和In 2System Memory Content Editor 兩個工具。助記符算術(shù)邏輯運算AND OR NO T XOR ADD SUB COMP AS N EG RND ABS功能描述邏輯與邏輯或邏輯非邏輯異或加法計算減法計算比較大小算術(shù)移位取相反數(shù)四舍五入取絕對值乘法運算有符號數(shù)乘以有符號數(shù)有符號數(shù)乘以無符號數(shù)無符號數(shù)乘以有符號數(shù)無符號數(shù)乘以無符號數(shù)數(shù)據(jù)傳送傳送數(shù)據(jù)控制指令無條件跳轉(zhuǎn)條件跳轉(zhuǎn)調(diào)用子程序返回該DSP 核在綜合、適配后, 使用2750個邏輯單元, 最高時鐘頻率可以達到18. 6M Hz 。對DSP 核的驗證分為三步。4. 1
13、單條指令的驗證這個過程驗證由程序存儲器向寄存器傳送數(shù)據(jù)指令, 為驗證其他指令打下了基礎(chǔ)。該指令可以為其他指令提供必要的源操作數(shù)。4. 2幾條指令的組合驗證指令集中的多數(shù)指令是采用這種方式進行驗證的。例如:驗證兩個寄存器相加的指令, 就需要先用程序存儲器向寄存器傳送數(shù)據(jù)的指令為寄存器賦初值。圖3是從Signal Tap Logic Analyzer 中截取的圖形。它顯示了一條加法指令的運算結(jié)果,reg_8_16_REG0、reg_8_16_REG1分別對應(yīng)兩個寄存器, 它們相加的結(jié)果送到累加器Q31:16 。MP Y MP YSU MP YUS MP YUU MOV E BR BRC CALL
14、RET其中, 算術(shù)邏輯運算類、乘法運算類指令的源操作數(shù)有多個可選項; 數(shù)據(jù)傳送類指令的源操作數(shù)和目的操作數(shù)均有多個可選項。例如, 加法指令的第一個源操作數(shù)來自累加器、寄存器或者數(shù)據(jù)存儲器; 第二個源操作數(shù)來自累加器、寄存器、數(shù)據(jù)存儲器或圖3一條加法指令的運算結(jié)果Fig. 3Verification of an ADD instruction 4. 3軟件實現(xiàn)IMA ADPCM 的編解碼D/A 轉(zhuǎn)3 直接將原始的PCM 語音數(shù)據(jù)送到2換器的輸入端。實驗1結(jié)果表明, 編碼后的數(shù)據(jù)變?yōu)?位, 實現(xiàn)了IMA ADPCM 編碼的41壓縮; 對比2、3兩個實驗, 結(jié)果顯示, 二者具有相同的收聽效果。以上實
15、驗結(jié)果說明, 本文設(shè)計的DSP 核能正確實現(xiàn)IMA ADPCM 的編解碼。為了進一步驗證指令的正確性和DSP 核的實用性, 提出了一個基于DSP 核的指令集軟件實現(xiàn)IMA ADPCM 的編解碼實驗方案。圖4為實驗系統(tǒng)的方框圖, 圖5為實物圖 。5DSP 核, 并用Altera 公EP1C12Q240C8FP GA 器件實現(xiàn)。該DSP 總共消耗了2750個邏輯單元, 最高工作時鐘頻率可達18. 6M Hz 。FP GA 驗證表明, 該DSP 核可以正確實現(xiàn)151條指令, 并能完成IMA ADPCM 的編解碼。本文設(shè)計的DSP 核可以廣泛應(yīng)用于語音處理和實時控制領(lǐng)域。參考文獻:123CIL ET
16、TI M D. Verilog HDL 高級數(shù)字設(shè)計M .張雅綺, 李鏘, 譯. 北京:電子工業(yè)出版社, 2005. 朱子玉, 李亞民. CPU 芯片邏輯設(shè)計技術(shù)M .北京:清華大學出版社, 2005.YOON S H , SUNWOO M H , MOON , et al. Design of a high 2quality audio 2specific DSP core C /IEEE Workshop on Signal Processing Systems Design and Implementation. 2005:5092513. 4R YUC W , L EE D H , C
17、HI H J , et al. Design of digit 2al audio DSP core C/The 1st Int Forum Strategic Technology. 2006:59262. 5L A ID S , L IN Q , CH EN S Z , et al. A low power DSP core for an embedded MP3decoder C /The 27th Ann Conf IEEE Industrial Electronics Society. 2001:189221897. 6BAN G K H , J EON G N H , KIM J S , et al. Design and VL SI implementation of a digital audio 2specific DSP core for mp3/AAC J.IEEE Trans Consumer Electronics , 2002, 48(3 :7902795.圖4的FP GA 包括兩部分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024中國智慧城市AIOT應(yīng)用
- 實習面試自我介紹范文(15篇)
- 關(guān)注民生加強公共安全構(gòu)建和諧社會
- 市場方案策劃范文15篇
- 初級會計經(jīng)濟法基礎(chǔ)-初級會計《經(jīng)濟法基礎(chǔ)》模擬試卷320
- 二零二五年度房地產(chǎn)投資基金投資居間協(xié)議3篇
- 排煙基礎(chǔ)知識
- 2025版高校食堂食品原料集中采購協(xié)議2篇
- 基于手部姿態(tài)估計和手形重建的虛擬手構(gòu)建及在沉浸式實驗室的應(yīng)用
- 二零二五年度國有企業(yè)并購融資擔保服務(wù)合同3篇
- 2025年度高端商務(wù)車輛聘用司機勞動合同模板(專業(yè)版)4篇
- GB/T 45107-2024表土剝離及其再利用技術(shù)要求
- 《古希臘文明》課件
- 2025年高考語文作文滿分范文6篇
- 零售業(yè)連鎖加盟合同
- 維吾爾醫(yī)優(yōu)勢病種
- 全國教學設(shè)計大賽一等獎英語七年級上冊(人教2024年新編)《Unit 2 Were Family!》單元教學設(shè)計
- 【獨家揭秘】2024年企業(yè)微信年費全解析:9大行業(yè)收費標準一覽
- 1-1 擁抱夢想:就這樣埋下一顆種子【2022中考作文最熱8主題押題24道 構(gòu)思點撥+范文點評】
- 職業(yè)暴露與防護
- 酒店行業(yè)客源渠道分析
評論
0/150
提交評論