基于信號處理和嵌入式應(yīng)用的音頻處理系統(tǒng)的設(shè)計和實現(xiàn)_第1頁
基于信號處理和嵌入式應(yīng)用的音頻處理系統(tǒng)的設(shè)計和實現(xiàn)_第2頁
基于信號處理和嵌入式應(yīng)用的音頻處理系統(tǒng)的設(shè)計和實現(xiàn)_第3頁
基于信號處理和嵌入式應(yīng)用的音頻處理系統(tǒng)的設(shè)計和實現(xiàn)_第4頁
基于信號處理和嵌入式應(yīng)用的音頻處理系統(tǒng)的設(shè)計和實現(xiàn)_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基于信號處理和嵌入式應(yīng)用的音頻處理系統(tǒng)的設(shè)計和實現(xiàn)1引言隨著計算機技術(shù)、電子技術(shù)和通信技術(shù)的迅猛發(fā)展,音頻處理技術(shù)也在眾多領(lǐng)域得到廣泛應(yīng)用。如通信領(lǐng)域中的手機、IP電話,消費類電子產(chǎn)品中的MP3和CD播放器以及控制領(lǐng)域中的語音識別、聲控系統(tǒng)等[1]。針對DSP強大的數(shù)字信號處理能力和ARM處理器良好的實時性能,結(jié)合音頻編解碼芯片TLV320AIC23的接口特點,本文闡述了由三者組成的音頻處理系統(tǒng)的硬件接口設(shè)計和軟件編程,提供了有效和實用的音頻處理系統(tǒng)方案。TLV320AIC23(簡稱AIC23)是TI公司的一款高性能立體聲音頻編解碼器Codec芯片。其內(nèi)部集成的模數(shù)轉(zhuǎn)換器(ADCs)和數(shù)模轉(zhuǎn)換器(DACs)采用了帶有過采樣數(shù)字插補濾波的多位Sigma-Delta技術(shù)。數(shù)據(jù)傳輸字長為16、20、24、32位,支持采樣頻率范圍8kHz至96kHz.ADC和DAC的信噪比分別達到90dB和100dB.內(nèi)置耳機輸出放大器,支持MIC和LINEIN兩種輸入方式,且對輸入和輸出都具有可編程增益調(diào)節(jié)。另外,AIC23功耗低,回放模式下功率僅為23mW,省電模式下更是小于15uW.因此,AIC23成為數(shù)字音頻應(yīng)用領(lǐng)域中的理想選擇[2],在多種數(shù)碼產(chǎn)品中發(fā)揮著重要作用,比較典型的應(yīng)用如手機、MP3、DV攝像機中的音頻編解碼。TMS320VC5402(簡稱VC5402)是TI公司的一款優(yōu)秀16位定點DSP,運算速度快,指令執(zhí)行速度達到100MIPS.自帶片內(nèi)存儲器和多種片上外設(shè),廣泛應(yīng)用于語音編解碼和通信領(lǐng)域[3]。S3C4510B(簡稱4510B)是Samsung公司的一款低成本、高性能的16/32位精簡指令集微控制器,其出色的ARM7TDMI內(nèi)核以及通用微處理器宏單元使其成為用戶定制應(yīng)用開發(fā)的理想選擇[4]。2系統(tǒng)硬件設(shè)計本音頻處理系統(tǒng)主要由前述三個處理芯片組成:ARM控制單元,DSP信號處理單元以及AIC23音頻采集單元。系統(tǒng)原理框圖如圖1.圖1基于DSP和ARM的音頻處理系統(tǒng)原理框圖AIC23是可編程芯片,內(nèi)部有11個16位寄存器,編程設(shè)置這些寄存器可得到所需的采樣頻率、輸入輸出增益和傳輸數(shù)據(jù)格式等。該控制接口有SPI和I2C兩種工作模式,由芯片上的MODE引腳進行選擇:MODE=0為I2C模式,MODE=1為SPI模式。因ARM4510B上也有I2C接口,故選用I2C模式。AIC23的I2C接口地址由引腳的狀態(tài)決定,=0時地址為0011010,=1時地址為0011011.其中SDIN與SDA為數(shù)據(jù)線,SCLK與SCL為串行時鐘線。VC5402有兩個多通道緩沖串口,選用其中的McBSP0與AIC23進行通信,信號連接如圖1所示。圖中AIC23工作在主模式,時鐘信號、DAC和ADC的幀同步信號BFSX0和BFSR0都由AIC23提供。而DSPVC5402與ARM4510B的通訊是通過DSP上的HPI接口實現(xiàn)的。3系統(tǒng)軟件設(shè)計系統(tǒng)由ARM系統(tǒng)和DSP系統(tǒng)兩大部分組成,ARM作為主控制器管理整個系統(tǒng)的工作進程,運行相關(guān)的應(yīng)用程序,可對多個任務(wù)進行調(diào)度,完成與外部DSP系統(tǒng)或其他外設(shè)的通信。DSP則主要完成音頻數(shù)據(jù)的采集和信號處理,并將處理后的數(shù)據(jù)發(fā)送給ARM供應(yīng)用程序調(diào)用。這樣的設(shè)計可以大大提高系統(tǒng)的工作效率,這也是當前嵌入式系統(tǒng),各移動手持設(shè)備如PDA、手機等的典型設(shè)計方案。這里具體要做的是對AIC23的控制接口編程,使其工作在所需的模式下。然后初始化DSP的McBSP,進行AD、DA轉(zhuǎn)換和數(shù)據(jù)處理。3.1ARM編程部分系統(tǒng)中對ARM的編程主要涉及對AIC23的初始化,使其進入正常工作狀態(tài),對音頻數(shù)據(jù)進行采集和處理。這需要設(shè)置4510B的I2C總線特殊功能寄存器:控制狀態(tài)寄存器IICCON、預(yù)分頻寄存器IICPS和移位緩沖寄存器IICBUF,寄存器相關(guān)說明見表1[5]。表14510BI2C總線特殊功能寄存器AIC23的11個控制寄存器相關(guān)設(shè)置的詳細描述參見文獻2.這里的設(shè)置為:左右聲道線路輸入靜音;耳機左右聲道音量為6dB;使能DAC,麥克風音量為20dB作為ADC輸入;使能ADC高通濾波;芯片各部分電路供電使能;芯片工作在主模式,采樣數(shù)據(jù)長度16位,采用DSP數(shù)據(jù)格式(同步幀后跟隨兩個數(shù)據(jù)字);采樣率88.2KHz(外部晶振為11.2896MHz);使能數(shù)字接口。對AIC23編程時的I2C總線時序如圖2所示。設(shè)置好I2C的時鐘頻率后,首先發(fā)送開始條件(SCLK為高電平時,SDI從高電平向低電平切換),然后發(fā)送AIC23的器件地址,器件地址發(fā)出后發(fā)送AIC23相應(yīng)寄存器的地址,再發(fā)送對該寄存器設(shè)置的數(shù)據(jù),最后發(fā)送停止條件(SCLK為高電平時,SDI從低電平向高電平切換)。注意,這里的寄存器地址為7位,寄存器數(shù)據(jù)為9位,而I2C總線以字節(jié)為單位傳送數(shù)據(jù)。因此在對AIC23的寄存器編程時,第一個字節(jié)包括了前7位的寄存器地址B15-B9以及設(shè)置數(shù)據(jù)的最高位B8,第二個字節(jié)為設(shè)置數(shù)據(jù)的后8位B7-B0.圖2I2C時序3.2音頻數(shù)據(jù)采集與播放初始化AIC23后,再初始化DSP以及McBSP0,之后進行音頻數(shù)據(jù)的采集與播放。通過麥克風采集語音信號,經(jīng)過數(shù)字濾波處理后由耳機輸出。使用McBSP0的接收中斷保存數(shù)據(jù),通過FIR數(shù)字濾波子程序處理音頻數(shù)據(jù)。程序流程如圖3所示。圖3音頻數(shù)據(jù)處理程序流程圖初始化McBSP0使其與AIC23協(xié)調(diào)工作,這里要根據(jù)硬件設(shè)計和軟件要求來配置McBSP0的各個控制寄存器。本系統(tǒng)中串口的主要設(shè)置為:接收數(shù)據(jù)右對齊,帶符號擴展;接收中斷使能;由片外提供發(fā)送、接收幀信號和發(fā)送、接收時鐘信號;發(fā)送、接收幀同步信號低電平有效;在時鐘上升沿采樣發(fā)送、接收數(shù)據(jù);每幀發(fā)送、接收兩個16位字數(shù)據(jù)[6]。數(shù)據(jù)接收部分可在DSP中斷程序中用如下語句實現(xiàn):mvkddrr10,*ar5;保存數(shù)據(jù)pshd*ar5+%;數(shù)據(jù)壓入堆棧popdnew_ad;從堆棧彈出數(shù)據(jù)到自定義的寄存器FIR濾波的相關(guān)程序如下:ldnew_ad,a;新數(shù)據(jù)加載至累加器stm#1,ar0;雙操作數(shù)增量stm#N,bk;設(shè)置循環(huán)緩沖區(qū)長度,即FIR濾波級數(shù)(N為濾波級數(shù))stla,*ar3+%;新數(shù)據(jù)送至ar3指向的緩沖區(qū)rptza,#(N-1);重復執(zhí)行N-1級的乘加運算mac*ar2+0%,*ar3+0%,a;ar2為系數(shù)指針,結(jié)果在累加器高位中stha,temp;保存計算結(jié)果ldtemp,a;結(jié)果放入累加器低位……stlma,dxr10;將累加器地位中的數(shù)據(jù)送至串口發(fā)送寄存器……基于前述對AIC23和DSP的相應(yīng)設(shè)置,采用21級系數(shù)對稱FIR數(shù)字濾波,對經(jīng)由麥克風輸入的語音信號進行濾波處理,濾波結(jié)果由耳機輸出,實際效果良好。所采集到的音頻數(shù)據(jù)還可通過HPI接口傳送至ARM供應(yīng)用程序調(diào)用。3.3語音識別應(yīng)用測試語音識別的基本原理是對語音信號進行特征提取。目前常用的語音識別算法有基于模式匹配的動態(tài)時間規(guī)正法(DTW:DynamicTimeWarping)、基于統(tǒng)計模型的隱馬爾柯夫模型法(HMM:HiddenMarkovModel)以及基于神經(jīng)網(wǎng)絡(luò)的識別法(DNN、NPN、TDNN)等[7]。為便于系統(tǒng)應(yīng)用測試,本文采用一種最簡易的方法對系統(tǒng)進行調(diào)試,即對英文元音的識別?;驹硎翘崛≡糇帜傅念l率特征,各元音在其頻域響應(yīng)中都有三個明顯的共振峰頻率,而最容易識別的是第一共振峰,由此可進行有效的元音識別。在提取第一共振峰頻率特征時采用“零交越”法(統(tǒng)計單幀信號波形穿越零點的次數(shù)——過零率),將信號頻率特征的分析轉(zhuǎn)換為時域分析,計算得到的過零率與理論值進行比較即可實現(xiàn)元音的識別。圖4所示分別為元音“A”的時域和頻域圖。圖4元音A的時域圖和頻域圖由頻域采樣圖可以看到很明顯的第一共振峰,此時計算時域采樣中信號的過零率可較為準確的識別元音A,過零率的計算中近似等于零的采樣點通常是微弱的干擾,可以忽略不計。經(jīng)驗證,這種簡易單元音識別法的識別率在80%以上,由此證明本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論