基于TMS320C5416的G.729語音編解碼算法的優(yōu)化和實現_第1頁
基于TMS320C5416的G.729語音編解碼算法的優(yōu)化和實現_第2頁
基于TMS320C5416的G.729語音編解碼算法的優(yōu)化和實現_第3頁
基于TMS320C5416的G.729語音編解碼算法的優(yōu)化和實現_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、基于TMS320C5416的G.729語音編解碼算法的優(yōu)化和實現基于TMS320C5416的G.729語音編解碼算法的優(yōu)化和實現類別:消費電子隨著多媒體信息技術和網絡技術的飛速發(fā)展,信息量快速增長,使信道資源顯得越來越寶貴。為了在有限的信道資源下傳輸盡可能多的信息,語音壓縮成為必要手段。ITU組織(國際電信聯盟)在l996年制定了G.729協議,即共軛結構碼激勵線性預測編碼算法(CS-ACELP)。其編碼速率為8kb/s,可以滿足網絡通信的要求,具有良好的語音質量,對不同的應用環(huán)境有較強的適應性,是一種性能較好的語音壓縮國際標準,被廣泛應用在個人移動通信、衛(wèi)星通信等各個領域。1 G.729編解

2、碼算法的原理 語音信號的波形編碼力圖使重建語音波形保持原始語音信號的波形形狀。這類編碼器通常將語音信號作為一般的波形信號來處理,它具有適應能力強、語音質量好等優(yōu)點,但所需用的編碼速率高。參數編碼通過對語音信號特征參數的提取及編碼來降低編碼速率,力圖使重建語音信號盡可能保持原語音的語意,而重建信號的波形同原語音信號的波形可能會有相當大的差別。二十世紀70年代中期,特別是80年代以來,語音編碼技術有了突破性的進展,提出了一些非常有效的處理方法,如混合編碼。這種算法克服了原有波形編碼器與聲碼器的弱點,而結合了它們各自的長處,在4kb/s16kb/s速率上能夠得到高質量合成語音,而在本質上也具有波形編

3、碼的優(yōu)點。G.729所描述的CS-ACELP(Conjugate-Structure Al2gebraic-Coder-Excited Linear Prediction)聲碼器采用的CELP聲碼器就屬于這類編碼器。 CELP編碼基于合成分析(A-B-S)的搜索過程、感知加權矢量量化(VQ)和線性預測(LP)技術,采用這種編碼方案使傳輸的比特率大大降低。CS-ACELP的思想是由共軛結構碼線性預測(CS-CELP)和代數碼本激勵線性預測(ACELP)的思想整合而來的。在編碼端,主要進行有線譜對(LSP)參數的量化、基音分析、固定碼本搜索和增益量化四個步驟。編碼器首先對輸入信號(8kHz采樣16

4、bit PCM信號)進行預處理,然后對每幀語音信號進行線性預測,得到LPC系數,并把LPC參數轉換成LSP參數,最后對LSP參數進行矢量量化。在接下來的基音分析中,每一幀先搜索到最佳基音時延T的一個候選時延,然后依據候選時延搜索每一幀的最佳基音時延。最后還要對自適應碼本增益和固定碼本增益進行量化。在解碼端,首先由接收到的比特流得到各種參數標志進行解碼,得到10ms語音幀編碼參數。解碼器在每一子幀內,對LSP系數進行內插,并把它們變換成LP濾波器系數后,依次進行激勵生成、語音合成和后處理工作。2 算法優(yōu)化和DSP應用改進 G.729語音編解碼系統(tǒng)要求實時性高,需在有限的時間內對外部輸入的信號完成

5、指定處理,即信號處理的速度必須大于等于輸入信號更新的速度,因此需要進行算法的優(yōu)化改進。對C語言編寫的代碼進行優(yōu)化,同時使用內聯指令,又在C程序中嵌入匯編語句,盡量提高信號處理的速度。 2.1 算法的優(yōu)化改進 首先在算法上進行改進,如圖1所示,采用一種結合WD-LSP(Weighted Delta-LSP)1函數并結合次最優(yōu)部分碼本快速搜索的CS-ACELP語音編碼算法,同時采用基于聲學心理模型的知覺加權濾波器,使語音編碼在不降低語音質量的情況下降低計算復雜度。WD-LSP函數主要用于區(qū)分UV-V(unvoice-voice)/S-V(silence-voice)的邊界。其原理是:如果函數值大于

6、給定的極限值,則開環(huán)基音延遲Top重新估計,否則,開環(huán)基音延遲Top用前一幀自適應碼本延遲來更新。在第i幀Fi的WD-LSP函數和用于確定開環(huán)基音延遲Top的算法如下: 其中LSPi(k)是在第i幀中的k階LSP系數;wk是加權系數,它用于增強UV-V/S-V邊界的WD-LSP函數。為了獲取wk,一個包含23 014個UV-V邊界和9 519個S-V邊界的大型數據庫用于估計delta-LSP在UV-V/S-V邊界的平方根值(RMS)。因此,WD-LSP用于檢測VU-V/S-V邊界非常敏感。是一個設為0.01的極限值。整個計算可節(jié)省21的計算量,經過這種算法前后語音信號如圖2所示。2.2 進行C

7、語言優(yōu)化 基于G.729標準的聲碼器最終在定點TMS320C5416上實時實現。在定點TMS320C5416內,浮點數是通過將小數點固定在特定位置來表示的,這是定點TMS320C5416的局限之一。為了區(qū)分小數的不同值域,使用了Q-格式。不同的Q-格式在于小數點的位置不同,因此整數域也不同。當兩個數相乘時,會產生一個特殊的符號位。如:兩個Q4數相乘, 需要附加一個左移的操作以去除這個多余的符號位,乘積應該是一個Q9格式的。如果DSP中的FRST位被置位,這個去除多余符號位的移位操作能夠自動完成。對于16位數的乘法運算,應該得到32 位的乘積。但是,由于只需要16位的積,該32位乘積中只有高16

8、位被存儲下來,積的低16位被丟棄。為了達到高準確性,在連續(xù)的乘法運算過程中(如卷積),應該一直保持32位的計算結果,只對最終的計算結果進行丟棄低16位的截短操作。為了達到更高的準確性,在這一操作過程中會使用到一種雙重精度格式, 這種格式僅僅出現在使用單精度不夠,而又不必要使用32位精度的時候。兩個32位數相乘,只需要32位的乘積,而不是64位,不過注意到TMS320C5416是16位的,所以在雙重精度格式中,32位整數分為高位字和低位字。高、低位字中都含有符號位,以進行快乘運算。其格式如下: L_32=hi_word16+lo_word16 Lo_word=L_32-hi_word1 當累加器

9、中的數值超過一定范圍時將會產生溢出。在G.729算法標準中, 累加器的值被限定在800000007FFFFFFF之內即最小負數和最大正數。不過在TMS320C5416中,如果將PMST寄存器中的OVM置位,則溢出會得到自動處理。2.3 內聯指令的應用和C程序中嵌入匯編語句 由于語音編碼的特點,編解碼函數都是由一些基本的加減乘除簡單函數組織而成,這些函數定義在BASIC OP.C和OPER_32B.C兩個文件中,如果能夠對這些簡單函數進行內聯指令(intrinsic)的優(yōu)化,就能達到事半功倍的效果。內聯指令是匯編指令的直接映射,具有很高的效率。例如: #define muh_ r(varl,va

10、r2) _mpylir(varl,var2) #define L_ add(L_var1,L_var2) _sadd(L_var1,L_var2) #define L_ muh(var1,var2) _smpy(var1,var2) 在C程序中嵌入匯編語句的方法比較簡單,只需在匯編語句的左右加上一個引號,然后用小括弧將匯編語句括住,并在括弧前加上ASM標識符,例如ASM(“匯編語句”)。采用這種方法一方面可以在C程序中實現用C語言無法實現的一些硬件控制功能,如修改中斷控制寄存器、中斷使能或屏蔽、讀取狀態(tài)寄存器和中斷標志寄存器等;另一方面,也可以用這種方法在C程序中的關鍵部分用匯編語句代替C語言

11、以優(yōu)化程序。而采用這種方法的缺點是比較容易破壞C環(huán)境,因為C編譯器在編譯嵌入了匯編語句的C程序時并不檢查或分析所嵌入的匯編語句。采用這種方法需要注意以下幾點: (1)不要破壞C環(huán)境,因為C編譯器并不檢查和分析嵌入的匯編語句。 (2)匯編語句不要改變C程序中變量的值,不要在匯編語句中加入匯編器而改變匯編環(huán)境。 在簡化算法的基礎上,使用CCS提供的C優(yōu)化器進行C語言優(yōu)化,同時還使用內聯函數和匯編優(yōu)化。3 G.729在TMS320C5416上的實現3.1 TMS320C5416的體系結構和應用 TMS320C5416(以下簡稱C5416)是TI公司最近推出的一款高性價比的通用l6位定點DSP芯片,它

12、的內核CPU基本組成與TMS320C54X系列一樣。C5416的單指令周期為625 RS,每秒執(zhí)行的指令數為160106,指令系統(tǒng)豐富并具有很多多功能指令,使用了6級指令流水線結構,這些都很適合實現低時延的G729聲碼器。采用一個40bit ALU、128K16bit片內RAM(包括64KB的片內DARAM和64KB的片內SARAM)、3個獨立的l6bit數據內存總線、1個程序內存總線、3個MCBSP、6信道DMA控制器、1個8l6位并行增強主機端口接口及2個l6bit計時器。 在TMS320C5416中通過PCM3002進行語音信號的A/D和D/A轉換,PCM3002使用兩個串行通道,一個用

13、于控制內部寄存器,另外一個用于數據傳輸。在系統(tǒng)板TMS320C5416中默認的語音信號的抽樣率是48kHz,通過修改PCM3002的內部控制寄存器,設定PCM3002信號的抽樣率。為了滿足G.729編碼的要求,PCM3002信號的抽樣率為8 000Hz。為了充分利用DSP進行信號處理,通過使用MCBSP和DMA把抽樣的數據送入DMA的緩沖區(qū)中,當緩沖區(qū)滿時產生一次中斷,DSP把DMA的緩沖區(qū)中的數據讀入DSP中進行處理,然后把處理過的數據送入DMA發(fā)送緩沖區(qū)。3.2 G.729在TMS320C5416的實現 G.729的處理過程中采用塊處理技術如圖3所示。按照G.729標準,每塊(幀)由80個

14、樣本組成,最初80個樣本被存起來,處理過程中有兩個操作是同時進行的。在處理塊L中數據的同時,存儲L+1塊的數據。在G.729軟件仿真時發(fā)現運算量較大的部分是LSP系數的矢量量化與激勵碼本(自適應碼本和固定碼本)的搜索,這兩個部分的運算量大約占全部編解碼運算量的60%以上。所以在優(yōu)化過程中,著重對固定碼本Acelp_Code_A()、分數基音分析pitch_fr3()、開環(huán)基音分析pitch_ol_fast()、增益量化Qua_gain()等占據絕大多數運算量的函數進行了優(yōu)化;僅僅簡化算法不能滿足實時要求,還使用了CCS提供的C優(yōu)化器進行C語言優(yōu)化,同時還可以使用內聯函數和匯編語句。經過以上處理

15、后,輸出的信號滿足通信要求。通過分析優(yōu)化前后這些主要模塊的速度對照表(如表1所示),可以看出各個主要模塊的優(yōu)化效果是比較明顯的。一幀語音信號經過處理前后幅頻圖(如圖4所示),可以看出語音信號經過處理后保持良好的語音質量。系統(tǒng)運行主要分為四個過程:語音存儲,數據編碼壓縮,數據解壓縮,語音回放。將輸入的語音數據首先進行抗疊濾波,然后進行模數轉換,經DSP采集并存入RAM存儲器中,即是語音存儲過程;接著運行編碼程序,將前面存儲的信息進行壓縮并存儲,這是編碼過程;然后進行解碼,并將數據存回原來的位置;最后DSP執(zhí)行輸出指令,將解碼后的數據送到數模轉換器中,實現模擬輸出。 用C5416最終實時實現了G729聲碼器,用該聲碼器分別實

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論