第2章DSP處理器的發(fā)展及典型芯片介紹ppt課件_第1頁
第2章DSP處理器的發(fā)展及典型芯片介紹ppt課件_第2頁
第2章DSP處理器的發(fā)展及典型芯片介紹ppt課件_第3頁
第2章DSP處理器的發(fā)展及典型芯片介紹ppt課件_第4頁
第2章DSP處理器的發(fā)展及典型芯片介紹ppt課件_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、DSP技術(shù)的發(fā)展與應(yīng)用技術(shù)的發(fā)展與應(yīng)用鄧賢君鄧賢君南華大學(xué)通信工程系南華大學(xué)通信工程系第二章第二章 DSP處理器的發(fā)展及典型芯片介紹處理器的發(fā)展及典型芯片介紹n2.1DSP處理器實現(xiàn)高速運算的途徑處理器實現(xiàn)高速運算的途徑n2.2當(dāng)前當(dāng)前DSP處理器結(jié)構(gòu)的發(fā)展趨勢處理器結(jié)構(gòu)的發(fā)展趨勢n2.3新近推出的新近推出的DSP核和核和DSP處理器處理器n2.4系統(tǒng)的芯片集成系統(tǒng)的芯片集成SoC)2.1 DSP處理器實現(xiàn)高速運算的途徑處理器實現(xiàn)高速運算的途徑n2.1.1硬件乘法器及乘加單元硬件乘法器及乘加單元n2.1.2多個并行單元多個并行單元n2.1.3高效的存儲器訪問高效的存儲器訪問n2.1.4數(shù)據(jù)格式

2、數(shù)據(jù)格式n2.1.5零開銷循環(huán)零開銷循環(huán)n2.1.6數(shù)據(jù)流的線性數(shù)據(jù)流的線性I/On2.1.7專門的指令集專門的指令集2.1.1硬件乘法器及乘加單元硬件乘法器及乘加單元n乘法和乘積的累加是數(shù)字信號處理中最常見的運乘法和乘積的累加是數(shù)字信號處理中最常見的運算之一,在卷積、向量、矩陣運算、算之一,在卷積、向量、矩陣運算、IIR濾波器、濾波器、FIR濾波器、傅里葉變換等用得很多。濾波器、傅里葉變換等用得很多。n通用微處理器做乘法的原理:用一系列移位和加通用微處理器做乘法的原理:用一系列移位和加法運算來實現(xiàn)。因而,每一步需要一到幾個時鐘法運算來實現(xiàn)。因而,每一步需要一到幾個時鐘周期。周期。n現(xiàn)代現(xiàn)代D

3、SP處理器中都具有至少一個專門的硬件乘處理器中都具有至少一個專門的硬件乘法器或者組合的乘加單元法器或者組合的乘加單元MAC),這樣可以使),這樣可以使DSP算法更快實現(xiàn)。算法更快實現(xiàn)。返回首頁2.1.2 多個執(zhí)行單元多個執(zhí)行單元 由于DSP在應(yīng)用過程中都有繁重的計算任務(wù),因此DSP處理器通常包含若干個獨立的執(zhí)行單元,進(jìn)行并行處理。 例如:除了MAC單元外,還有ALU算術(shù)邏輯單元)、移位器、地址發(fā)生器等。返回本節(jié)2.1.3 高效的存儲器訪問高效的存儲器訪問1、在一個時鐘周期內(nèi)執(zhí)行一個、在一個時鐘周期內(nèi)執(zhí)行一個MAC,要求一個單,要求一個單周期的周期的MAC單元,也要求在一個周期內(nèi)從存儲器單元,也

4、要求在一個周期內(nèi)從存儲器提取提取MAC指令、數(shù)據(jù)樣本和濾波器系數(shù),因而,指令、數(shù)據(jù)樣本和濾波器系數(shù),因而,要求較高的存儲器帶寬。要求較高的存儲器帶寬。2、DSP處理器采用了程序空間和數(shù)據(jù)空間分開的處理器采用了程序空間和數(shù)據(jù)空間分開的哈佛結(jié)構(gòu),多總線結(jié)構(gòu),提高了存儲器的帶寬。哈佛結(jié)構(gòu),多總線結(jié)構(gòu),提高了存儲器的帶寬。3、高存儲器帶寬需要專門的硬件來支持存儲器地、高存儲器帶寬需要專門的硬件來支持存儲器地址計算,于是址計算,于是DSP中設(shè)計了中設(shè)計了DAG地址產(chǎn)生單地址產(chǎn)生單元),它的優(yōu)點在于支持專門的地址模式,使處元),它的優(yōu)點在于支持專門的地址模式,使處理器可以高效的訪問數(shù)據(jù)。理器可以高效的訪問

5、數(shù)據(jù)。返回本節(jié)2.1.4 數(shù)據(jù)格式數(shù)據(jù)格式1、DSP處理器可以分為定點和浮點兩種類型。大多數(shù)處理處理器可以分為定點和浮點兩種類型。大多數(shù)處理器采用定點數(shù)據(jù)格式。由于同樣的處理速度下,定點器采用定點數(shù)據(jù)格式。由于同樣的處理速度下,定點DSP比較便宜,功耗更小,而浮點比較便宜,功耗更小,而浮點DSP的格式要求比較復(fù)雜的的格式要求比較復(fù)雜的硬件才能實現(xiàn)。硬件才能實現(xiàn)。2、定點格式:二進(jìn)制的小數(shù)點位于數(shù)據(jù)字里的固、定點格式:二進(jìn)制的小數(shù)點位于數(shù)據(jù)字里的固 定位置;定位置; 浮點格式:數(shù)字用指數(shù)和尾數(shù)來表示,它能表示的值的浮點格式:數(shù)字用指數(shù)和尾數(shù)來表示,它能表示的值的范圍比定點格式要寬得多,從而避免了

6、溢出問題。范圍比定點格式要寬得多,從而避免了溢出問題。3、定點、定點DSP的數(shù)字寬度:的數(shù)字寬度:16bit、20bit、24bit、32bit;4、為了保證使用定點數(shù)據(jù)時的信號質(zhì)量,、為了保證使用定點數(shù)據(jù)時的信號質(zhì)量,DSP處理器都有處理器都有專門的硬件,以保證一系列運算后的數(shù)據(jù)精度。專門的硬件,以保證一系列運算后的數(shù)據(jù)精度。 返回本節(jié)2.1.5 零開銷循環(huán)零開銷循環(huán)n零開銷循環(huán):零開銷循環(huán):DSP往往提供專門的循環(huán)指令,在往往提供專門的循環(huán)指令,在無須花費任何時鐘周期的情況下,實現(xiàn)無須花費任何時鐘周期的情況下,實現(xiàn)FOR-NEXT循環(huán)。循環(huán)。n由于由于DSP的算法往往需要將大量的處理時間花

7、費的算法往往需要將大量的處理時間花費在反復(fù)執(zhí)行軟件中的一小部分,例如循環(huán),因此在反復(fù)執(zhí)行軟件中的一小部分,例如循環(huán),因此大多數(shù)大多數(shù)DSP都要對高效的循環(huán)提供專門的支持。都要對高效的循環(huán)提供專門的支持。2.1.6 數(shù)據(jù)流的線性數(shù)據(jù)流的線性I/On為了達(dá)到高性能低成本的輸入和輸出,多數(shù)為了達(dá)到高性能低成本的輸入和輸出,多數(shù)DSP都有一個或多個專門的串口或并口,并采用線性都有一個或多個專門的串口或并口,并采用線性的處理機制,使得數(shù)據(jù)的傳輸不影響或者盡可能的處理機制,使得數(shù)據(jù)的傳輸不影響或者盡可能少地影響處理器計算單元的工作。少地影響處理器計算單元的工作。2.1.7 專門的指令集專門的指令集nDSP

8、處理器的指令集的設(shè)計要達(dá)到兩個目標(biāo):處理器的指令集的設(shè)計要達(dá)到兩個目標(biāo):n(1最大限度地使用處理器的基本硬件,以提最大限度地使用處理器的基本硬件,以提高效率:傳統(tǒng)的高效率:傳統(tǒng)的DSP處理器的指令集都允許在單處理器的指令集都允許在單個指令里并行完成若干個操作;個指令里并行完成若干個操作;n(2將程序所使用的存儲空間減到最小,因為將程序所使用的存儲空間減到最小,因為DSP應(yīng)用對成本非常敏感,而存儲器的成本對處應(yīng)用對成本非常敏感,而存儲器的成本對處理器的成本和系統(tǒng)的成本影響很大:要求指令要理器的成本和系統(tǒng)的成本影響很大:要求指令要短、使用最少的存儲單元、盡可能使用寄存器來短、使用最少的存儲單元、盡

9、可能使用寄存器來完成操作、將多個操作合并在一條指令中。完成操作、將多個操作合并在一條指令中。2.1.7 專門的指令集續(xù))專門的指令集續(xù))nDSP程序不能單純的只用高級語言來實現(xiàn),因為:程序不能單純的只用高級語言來實現(xiàn),因為:n(1):以):以C語言為代表的高級語言不適合來描述語言為代表的高級語言不適合來描述DSP算法算法n(2):傳統(tǒng)):傳統(tǒng)DSP結(jié)構(gòu)如多個存儲器空間、多結(jié)構(gòu)如多個存儲器空間、多組總線、不規(guī)則的指令集、高度專門化的硬件),組總線、不規(guī)則的指令集、高度專門化的硬件),使得高級語言編譯效率的提高變得非常困難。使得高級語言編譯效率的提高變得非常困難。n 因而,在實際的應(yīng)用中,為了得到

10、高效的代碼,因而,在實際的應(yīng)用中,為了得到高效的代碼,往往需要使用匯編程序?qū)ψ铌P(guān)鍵的部分進(jìn)行優(yōu)化。往往需要使用匯編程序?qū)ψ铌P(guān)鍵的部分進(jìn)行優(yōu)化。2.2 當(dāng)前當(dāng)前DSP處理器結(jié)構(gòu)的發(fā)展趨勢處理器結(jié)構(gòu)的發(fā)展趨勢n2.2.1 傳統(tǒng)的傳統(tǒng)的DSP處理器處理器n2.2.2 強化的傳統(tǒng)結(jié)構(gòu)強化的傳統(tǒng)結(jié)構(gòu)DSP處理器處理器n2.2.3 并行結(jié)構(gòu)并行結(jié)構(gòu)n2.2.4 單指令多數(shù)據(jù)單指令多數(shù)據(jù)SIMD)n2.2.5 其他形式的其他形式的DSP處理器處理器返回首頁2.2.1 傳統(tǒng)的傳統(tǒng)的DSP處理器處理器傳統(tǒng)的傳統(tǒng)的DSP處理器的結(jié)構(gòu)特點:處理器的結(jié)構(gòu)特點:1、低成本的、低成本的DSP:包含一個乘法器或包含一個乘法

11、器或MAC,一個,一個ALU和若干個其他的執(zhí)行單元,每個時鐘周期執(zhí)和若干個其他的執(zhí)行單元,每個時鐘周期執(zhí)行一條指令,使用復(fù)雜的、多操作類型的指令。行一條指令,使用復(fù)雜的、多操作類型的指令。ADSP-21XX,TMS320C2000,DSP56000系列等。系列等。2、中等的、中等的DSP:提高了時鐘速率,使用了更先進(jìn)的提高了時鐘速率,使用了更先進(jìn)的結(jié)構(gòu),增加了一些硬件,如桶形移位器、指令高結(jié)構(gòu),增加了一些硬件,如桶形移位器、指令高速緩存,采用更深的流水線。速緩存,采用更深的流水線。返回本節(jié)2.2.2 強化的傳統(tǒng)結(jié)構(gòu)強化的傳統(tǒng)結(jié)構(gòu)DSP處理器處理器 這類處理器在傳統(tǒng)的這類處理器在傳統(tǒng)的DSP處理

12、器的結(jié)構(gòu)基礎(chǔ)上,處理器的結(jié)構(gòu)基礎(chǔ)上,增加了一些并行執(zhí)行單元,可以在每個時鐘周期內(nèi)做更增加了一些并行執(zhí)行單元,可以在每個時鐘周期內(nèi)做更多的操作。多的操作。2.2.3 并行結(jié)構(gòu)并行結(jié)構(gòu) n傳統(tǒng)傳統(tǒng)DSP與強化與強化DSP面臨的問題:用匯編語言編面臨的問題:用匯編語言編程困難,編譯器生成的目標(biāo)代碼效率不高。程困難,編譯器生成的目標(biāo)代碼效率不高。n針對以上問題,有些新的針對以上問題,有些新的DSP采用了并行結(jié)構(gòu):采用了并行結(jié)構(gòu):采用非常簡單的指令,即同時執(zhí)行一組并行的指采用非常簡單的指令,即同時執(zhí)行一組并行的指令,而不是一次執(zhí)行一條指令。令,而不是一次執(zhí)行一條指令。TI是第一個采用是第一個采用這種結(jié)構(gòu)

13、的廠商。這種結(jié)構(gòu)的廠商。n并行多指令并行多指令DSP的結(jié)構(gòu)分為兩類:超長指令字的結(jié)構(gòu)分為兩類:超長指令字VLIW和超標(biāo)量和超標(biāo)量Superscalar構(gòu)造構(gòu)造返回本節(jié)n超長指令字和超標(biāo)量結(jié)構(gòu)很類似,它們都提供許超長指令字和超標(biāo)量結(jié)構(gòu)很類似,它們都提供許多執(zhí)行單元,每個執(zhí)行單元都執(zhí)行各自的指令,多執(zhí)行單元,每個執(zhí)行單元都執(zhí)行各自的指令,區(qū)別在于并行執(zhí)行的指令如何分組。區(qū)別在于并行執(zhí)行的指令如何分組。nVLIW處理器將每個周期內(nèi)執(zhí)行的處理器將每個周期內(nèi)執(zhí)行的4-8條指令打包條指令打包成一個很長的指令,因此稱為超長指令。超標(biāo)量成一個很長的指令,因此稱為超長指令。超標(biāo)量結(jié)構(gòu)的指令一般為結(jié)構(gòu)的指令一般為

14、2-4個。個。nVLIW結(jié)構(gòu)中,匯編語言編程器決定哪些指令執(zhí)行,結(jié)構(gòu)中,匯編語言編程器決定哪些指令執(zhí)行,指令在匯編時才分組,而且在執(zhí)行過程中,分組指令在匯編時才分組,而且在執(zhí)行過程中,分組不會改變;超標(biāo)量結(jié)構(gòu)中,由專門的硬件來決定不會改變;超標(biāo)量結(jié)構(gòu)中,由專門的硬件來決定哪些指令將并行執(zhí)行;哪些指令將并行執(zhí)行;n當(dāng)前絕大多數(shù)的當(dāng)前絕大多數(shù)的DSP處理器都采用超長指令字結(jié)處理器都采用超長指令字結(jié)構(gòu)。構(gòu)。2.2.4 單指令多數(shù)據(jù)單指令多數(shù)據(jù)SIMD) nSIMD:通過使處理器并行地用不同的數(shù)據(jù),執(zhí)行通過使處理器并行地用不同的數(shù)據(jù),執(zhí)行多次同樣的操作,來改善處理器的性能。多次同樣的操作,來改善處理器

15、的性能。nSIMD不屬于結(jié)構(gòu)本身,是一種結(jié)構(gòu)技術(shù),可以用不屬于結(jié)構(gòu)本身,是一種結(jié)構(gòu)技術(shù),可以用于討論過的任何結(jié)構(gòu)中使用。于討論過的任何結(jié)構(gòu)中使用。nAD公司的公司的TigerSHARC處理器對處理器對SIMD做了很大做了很大的擴展,它屬于的擴展,它屬于VLIW結(jié)構(gòu),組合了兩種結(jié)構(gòu),組合了兩種SIMD:n (1一個指令可以控制兩組執(zhí)行單元的執(zhí)行;一個指令可以控制兩組執(zhí)行單元的執(zhí)行;n (2該指令還可以指定分開的執(zhí)行單元;該指令還可以指定分開的執(zhí)行單元;n要使要使SIMD能力有效發(fā)揮,程序員需要付出努力:能力有效發(fā)揮,程序員需要付出努力:n(1需要在存儲器里對數(shù)據(jù)作專門的安排,使需要在存儲器里對數(shù)

16、據(jù)作專門的安排,使SIMD處理處理能夠全速運行;能夠全速運行;n(2需要重新組織算法,以便最大限度的使用處理器資需要重新組織算法,以便最大限度的使用處理器資源,因為源,因為SIMD只有在可以并行處理數(shù)據(jù)的算法中才是有只有在可以并行處理數(shù)據(jù)的算法中才是有效的。效的。2.2.5 其他形式的其他形式的DSP處理器處理器(1高性能的高性能的CPU: 許多高端的許多高端的CPU,如,如Pentium和和PowerPC,強化了執(zhí)行信號處理任務(wù)時的計算速度,擴展了強化了執(zhí)行信號處理任務(wù)時的計算速度,擴展了基于基于SIMD的指令集,做的指令集,做DSP運算時,可能比最運算時,可能比最快的快的DSP處理器還要快

17、。處理器還要快。(2DSP/MCU的混合的混合: 許多微控制器廠商在其微控制器內(nèi)部強化許多微控制器廠商在其微控制器內(nèi)部強化DSP功能。功能。2.3 新近推出的新近推出的DSP核與核與DSP處理器處理器n2.3.1TI公司的新公司的新DSP處理器處理器n2.3.2AD公司的新公司的新DSP處理器處理器n2.3.3飛思卡爾的新飛思卡爾的新DSP處理器處理器2.4 系統(tǒng)的芯片集成系統(tǒng)的芯片集成SoC)n2.4.1 2G手機簡介手機簡介n2.4.2 TI的的OMAP-用于用于3G手機中的手機中的SoCn2.4.3 DaVinci技術(shù)技術(shù)n2.4.4 飛思卡爾的飛思卡爾的MXC2.4.1 2G手機簡介手

18、機簡介n2G移動電話采用的基帶體系結(jié)構(gòu)都是以兩個移動電話采用的基帶體系結(jié)構(gòu)都是以兩個可編程處理器一個可編程處理器一個DSP和一個和一個MCU為基為基礎(chǔ)的,目前,已經(jīng)將兩個處理器集成在一起。礎(chǔ)的,目前,已經(jīng)將兩個處理器集成在一起。n在在TDMA模式移動電話中,模式移動電話中,DSP負(fù)責(zé):負(fù)責(zé):n(1實現(xiàn)數(shù)據(jù)流的調(diào)制解調(diào);實現(xiàn)數(shù)據(jù)流的調(diào)制解調(diào);n(2利用編解碼實現(xiàn)傳輸誤碼糾正并維利用編解碼實現(xiàn)傳輸誤碼糾正并維n持通信鏈路的穩(wěn)定性;持通信鏈路的穩(wěn)定性;n(3對數(shù)據(jù)進(jìn)行加密解密以保證通信的安全對數(shù)據(jù)進(jìn)行加密解密以保證通信的安全性;性;n(4對語音數(shù)據(jù)進(jìn)行壓縮和解壓縮;對語音數(shù)據(jù)進(jìn)行壓縮和解壓縮;n在在

19、CDMA模式移動電話中,模式移動電話中,DSP負(fù)責(zé):實現(xiàn)負(fù)責(zé):實現(xiàn)符號級功能,如前向糾錯、加密以及語音壓符號級功能,如前向糾錯、加密以及語音壓縮和解壓縮,與此同時還要控制縮和解壓縮,與此同時還要控制ASIC硬件。硬件。n在在2G移動電話中,移動電話中,MCU負(fù)責(zé)支持移動電話的用負(fù)責(zé)支持移動電話的用戶界面話筒、耳機、鍵盤、顯示器等),并處戶界面話筒、耳機、鍵盤、顯示器等),并處理通信協(xié)議棧中的上層協(xié)議。理通信協(xié)議棧中的上層協(xié)議。2.4.2 TI的的OMAP-用于用于3G手機中的手機中的SoCn2G2G移動通信標(biāo)準(zhǔn)向更高的標(biāo)準(zhǔn)轉(zhuǎn)變的根本動力:為了實移動通信標(biāo)準(zhǔn)向更高的標(biāo)準(zhǔn)轉(zhuǎn)變的根本動力:為了實現(xiàn)包

20、括互聯(lián)網(wǎng)接入在內(nèi)的高級業(yè)務(wù),必須提供更高速率的現(xiàn)包括互聯(lián)網(wǎng)接入在內(nèi)的高級業(yè)務(wù),必須提供更高速率的數(shù)據(jù)傳輸能力。數(shù)據(jù)傳輸能力。n分組交換的價值在于:能夠為用戶提供一種分組交換的價值在于:能夠為用戶提供一種“始終在線始終在線的業(yè)務(wù),從而消除電路連接所必須的冗長的呼叫建立時間。的業(yè)務(wù),從而消除電路連接所必須的冗長的呼叫建立時間。GPRSGPRS通用分組無線業(yè)務(wù)是一個很好的例子。通用分組無線業(yè)務(wù)是一個很好的例子。n多媒體數(shù)據(jù)應(yīng)用在多媒體數(shù)據(jù)應(yīng)用在3G3G應(yīng)用中凸顯重要,為了將實時通信應(yīng)用中凸顯重要,為了將實時通信功能和用戶交互式應(yīng)用分開,需要將移動電話中的通信處功能和用戶交互式應(yīng)用分開,需要將移動電話中的通信處

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論