AMBE算法及其實(shí)現(xiàn)方式

上傳人：t*** IP屬地：天津上傳時(shí)間：2022-10-29 格式：DOCX 頁(yè)數(shù)：7 大?。?27KB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩2頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

AMBEA算法及其實(shí)現(xiàn)方式在數(shù)字移動(dòng)通信系統(tǒng)中,語(yǔ)音編碼部分是很重要的一個(gè)環(huán)節(jié),它的性能直接關(guān)系到整個(gè)移動(dòng)通信系統(tǒng)的工作質(zhì)量。首先綜述在以數(shù)字集群為代表的移動(dòng)通信系統(tǒng)開(kāi)發(fā)的背景下,語(yǔ)音編碼的概念、分類和發(fā)展情況,并介紹目前世界上常見(jiàn)移動(dòng)通信系統(tǒng)所用的語(yǔ)音編碼方案,從而明確語(yǔ)音編碼算法的比較對(duì)象。今天我就自己手頭了解的一些知識(shí)對(duì)AMBE算法進(jìn)行初步的概括：1.MBE算法的概念A(yù)MBE是基于MBE技術(shù)的低比特率、高質(zhì)量的改進(jìn)語(yǔ)音壓縮算法，該技術(shù)在低比特率壓縮系統(tǒng)中能提供極優(yōu)的語(yǔ)音質(zhì)量,卻對(duì)指令執(zhí)行速度和存儲(chǔ)器容量的要求大大降低，在背景噪聲和信道誤碼方面也有極強(qiáng)的魯棒性，比基于線性預(yù)測(cè)編碼的CELP、RELP、VESLP、LPC-10等要優(yōu)越。那么了解AMBE之前我們先來(lái)了解下MBE算法：MBE編碼算法是用基音諧波處的譜抽樣來(lái)表示短時(shí)譜，并且在諧波間隔頻段上分別進(jìn)行清/濁音判決。合成端用一組正弦波合成譜，用噪聲譜的傅立葉反變換來(lái)合成清音譜。這種算法提出了一種由正弦模型引出的頻域模型—多帶激勵(lì)模型。MBE模型如圖1所示。首先按基音各諧波頻率，將一幀語(yǔ)音的頻譜分成若干個(gè)諧波帶，再以若干個(gè)諧波帶為一組進(jìn)行分帶，分別對(duì)各帶進(jìn)行清濁(V/U)判決，總的激勵(lì)信號(hào)由各帶激勵(lì)信號(hào)相加構(gòu)成。對(duì)于濁音帶，用以基音周期為周期的脈沖序列譜作為激勵(lì)信號(hào)譜對(duì)于清音帶，則使用白噪聲譜作為激勵(lì)信號(hào)譜。時(shí)變數(shù)字濾波器的作用是確定各諧波帶的相對(duì)幅度和相位，起到了將這種混合的激勵(lì)信號(hào)譜映射成語(yǔ)音譜的作用。這種模型使合成語(yǔ)音譜同原語(yǔ)音譜在細(xì)致結(jié)構(gòu)上能夠擬合得很好，其合成端的語(yǔ)音質(zhì)量必然較高。AMBE算法實(shí)現(xiàn)形式2.1AMBE編碼的基本方式AMBE編碼的基本方法為：首先將輸入的每幀160個(gè)數(shù)字話音取樣點(diǎn)分成交疊的段，經(jīng)模型分析后得出該幀的模型參數(shù)。編碼器量化這些模型參數(shù)，加上糾錯(cuò)碼，然后以4.8kbps的數(shù)據(jù)流發(fā)送。解碼器接收比特流，重構(gòu)模型參數(shù)，在利用這些產(chǎn)生合成的語(yǔ)音信息。流程如圖2所示。由此可知，AMBE算法的實(shí)現(xiàn)步驟可分為五步，即模型分析、量化、糾錯(cuò)(FEC)、重建及合成。下面簡(jiǎn)要說(shuō)明一下這五個(gè)步驟。1、模型分析MBE算法模型：設(shè)輸入信號(hào)S(n),定義窗口化的語(yǔ)音信號(hào)為：S(n)=S(n)?W(n)設(shè)S(n)是激勵(lì)e(n)經(jīng)過(guò)線性濾波器h(n)的響應(yīng),則w w wS(n)=h(n)*e(n)w w w將幀分成兩類：話音和非話音。對(duì)于話音e(n)是周期脈沖序列，w各脈沖間的距離為脈沖周期P0;對(duì)于非話音:e(n)為白噪聲oMBE將w激勵(lì)信號(hào)譜分成若干段，再對(duì)每一段進(jìn)行話音/非話音(V/UV)判決。因此，激勵(lì)信號(hào)是周期信號(hào)能量(V)和噪聲能量(UV)之和。2、量化在編碼之前，必須對(duì)譜高M(jìn)］(1WIWL)進(jìn)行量化。量化的過(guò)程為：先由預(yù)測(cè)的譜高得出預(yù)測(cè)的留數(shù)r(lWIWL)，然后將其分成8段，對(duì)每一段進(jìn)行離散余弦變換(DTC)，得到增益矢量R(lWiWiL)和高階DTC相關(guān)系數(shù)C。量化器的輸出就是編碼器的輸出，包括ik基帶頻率，不同頻率的話音/非話音判決門(mén)限和譜高［1］。3、糾錯(cuò)由于幀長(zhǎng)為20ms,傳輸速率為4.8kbps,所以每幀有96個(gè)比特。在AMBE算法中，72比特用來(lái)量化模型參數(shù)，而其余24比特用于前向糾錯(cuò)(FEC)。將72比特分為5個(gè)向量組：v,v,v,v,v，設(shè)輸出的501234個(gè)向量組為：u,u,u,u,u，則01234v=u?G000v=u?gH,forlWiW3iiv=u44其中，gG和gH分別為［24,12］格雷(Golay)碼和［15,11］漢明(Hamming)碼的生成器。這樣u為24比特，u,u,u均為15比特，u0 1 2 3 4為27比特，總的輸出為96比特。4、重建解碼時(shí)，需要重建譜高叫(1WIWL)首先，必須由b計(jì)算出L：l03=2n/(b+20)00L=0.9254(n/w+0.25)0然后，解碼和重建得到譜高。解碼和重建類似量化和編碼的逆過(guò)程：第一步先要將譜高分為8段，根據(jù)L決定每段的長(zhǎng)度J(1WiW8)1。這些段中的元素用C(1WiW8，表示段號(hào)，2WkWJ，表示段內(nèi)ik i的元素號(hào))表示。每一段的第一個(gè)元素設(shè)為解碼增益R，其余元素為i高階DCT相關(guān)系數(shù)。5、合成解碼斷輸入的比特經(jīng)過(guò)重建以后，得到的一系列模型參數(shù)包括基帶頻率3，不同頻率的話音/非話音(V/UV)判決門(mén)限vk和譜高M(jìn)。然0l后將這些模型參數(shù)合成話音。話音合成算法將每一組模型參數(shù)分為話音譜(V)和非話音譜(UV),用話音合成算法和非話音合成算法分別對(duì)這兩部分進(jìn)行話音合成，將話音譜的能量合成產(chǎn)生話音信號(hào)suv(n),而非話音譜的能量則合成產(chǎn)生非話音信號(hào)suv(n)。2.2AMBE-2000DVSI公司的AMBE-2000語(yǔ)音編碼芯片是一種非常靈活、高性能、單片的語(yǔ)音壓縮編碼器它提供了在低數(shù)據(jù)速率時(shí)出色的語(yǔ)音質(zhì)量,也提供了一個(gè)實(shí)時(shí)、全雙工的備有標(biāo)準(zhǔn)AMBE語(yǔ)音壓縮軟件算法設(shè)置的設(shè)備。DVSI享有專利權(quán)的AMBE語(yǔ)音壓縮技術(shù)已經(jīng)被證明是與同之前的ECELP,CELP,RELP,VSELP,MELP,MP-MLQ,LPCT0和其他壓縮技術(shù)有更好的性能⑵。AMBE語(yǔ)音壓縮算法在全世界有著廣泛的應(yīng)用，其中也包括下一代數(shù)字移動(dòng)通信系統(tǒng)的應(yīng)用。AMBE-2000語(yǔ)音編碼器在選擇語(yǔ)音和FEC(前向糾錯(cuò))數(shù)據(jù)速率上提供了很高的靈活性。用戶可以以

50bps為增量全速地從2.0kbps到9.6kbps單獨(dú)地選擇這些參數(shù)。對(duì)于更高的差錯(cuò)速率信道，用戶將被分配更大百分比的FEC編碼全比特速率。AMBE-2000語(yǔ)音編碼在每秒2.4kbps的低速下能保持自然聲音質(zhì)量和語(yǔ)音的可性性oAMBE算法的低復(fù)雜性允許它被完全地集成到一個(gè)低價(jià)格、低功耗的集成電路—AMBE-2000語(yǔ)音編碼芯片中。在最簡(jiǎn)易模型中,AMBE-2000被看作兩個(gè)分離元件:編碼器和解碼器。編碼器接收8kHz采樣語(yǔ)音數(shù)據(jù)流（16-bit線性、8-bitp率，或8-bitp率）并以所期望的速率將數(shù)據(jù)流輸出信道。相反地，解碼器接收信道數(shù)據(jù)流，合成語(yǔ)音流。對(duì)AMBE-2000編、解碼器接口的時(shí)間控制是完全異步的。語(yǔ)音接口是外圍的A/D-D/A芯片。輸入輸出語(yǔ)音數(shù)據(jù)流必須是相同的格式（16-bit線性,8-bitA率，或s-bitp率）。信道接口是普通的8或16位微處理器或其它相應(yīng)的在AMBE-2000信道格式和被設(shè)計(jì)的系統(tǒng)信道格式中能體現(xiàn)其基本功能的外圍元件。AMBE-2000 __: 7AMBE-2000玄AMBE-2000 __: 7AMBE-2000玄I1Z語(yǔ)音敵據(jù)2.2AMBE-1000AMBE-1000是DVSI公司開(kāi)發(fā)的基于AMBE算法的一種高性能的多速率語(yǔ)音編碼/解碼芯片，非常適合于數(shù)字語(yǔ)音通信及處理的場(chǎng)合。本文基于AMBE-1000設(shè)計(jì)了一個(gè)語(yǔ)音壓縮系統(tǒng)，該系統(tǒng)具有設(shè)計(jì)簡(jiǎn)便、語(yǔ)音編碼速率可變、音質(zhì)良好、功耗小等優(yōu)點(diǎn)，可應(yīng)用于多種需要。AMBE-1000是基于AMBE算法的語(yǔ)音編碼/解碼芯片，其語(yǔ)音編碼/解碼速率可以在2400?9600bps之間以50bits的間隔變化。在芯片內(nèi)部有相互獨(dú)立的語(yǔ)音編碼和解碼通道，可同時(shí)完成語(yǔ)音的編碼和解碼任務(wù)；并且所有的編碼和解碼操作都在芯片內(nèi)部完成，不需要外擴(kuò)的存儲(chǔ)器.AMBE-1000最基本的組成部分就是一個(gè)編碼器和一個(gè)解碼器，兩者相互獨(dú)立。編碼器接收8kHz采樣的語(yǔ)音數(shù)據(jù)流（16bit線性，8bitA律，8bitu律）并以一定的速率輸出信道數(shù)據(jù)。相反，解碼器接收信道數(shù)據(jù)并合成語(yǔ)音數(shù)據(jù)流。編碼器和解碼器接口的時(shí)序是完全異步的。AMBE-1000采用A/D-D/A芯片作為語(yǔ)音信號(hào)的接口。送往解碼器用于控制的數(shù)據(jù)和語(yǔ)音數(shù)據(jù)是不同的。輸入輸出的語(yǔ)音數(shù)據(jù)流的格式必

須是相同的（16bit線性的,8bitA律，8bitu律），信道接口采用8位或16位的微控制器。其工作原理如下圖：AMBE^lDOO解碼器 8KHZ吾音魏據(jù)雷音數(shù)據(jù)AMBE1000AMBE^lDOO解碼器 8KHZ吾音魏據(jù)雷音數(shù)據(jù)AMBE1000編碼器AMBE-2000聲碼器不同于AMBE-1000,AMBE-2000只有串行接口模式，沒(méi)有并行接口模式。AMBE算法與其它算法的優(yōu)勢(shì)3.1編碼速率和占用帶寬從編碼速率和占用帶寬角度來(lái)看,由于波形編碼為了能夠獲得較高的重建語(yǔ)音質(zhì)量,所以直接對(duì)時(shí)域波形或在變換域進(jìn)行編碼,所以壓縮比較低,編碼速率一般較高。而目前比較常用的一些語(yǔ)音壓縮算法，比如CELP、數(shù)字集群TETRA標(biāo)準(zhǔn)里用的ACELP編碼、MOTORLA的IDEN標(biāo)準(zhǔn)所用的編碼都屬于混合編碼。這些編碼方式將波形編碼的優(yōu)點(diǎn)與參量編碼的優(yōu)點(diǎn)結(jié)合起來(lái),使語(yǔ)音質(zhì)量有了明顯的提高,但是它們的編碼速率一般都在4.8kbps以上,試圖更大幅度地降低這些編碼方式的壓縮速率，如降到4kbps以下，由于沒(méi)有足夠的比特表示激勵(lì)矢量,余量信號(hào)的量化將產(chǎn)生較大的誤差,那么話音質(zhì)量將會(huì)急劇下降。MBE和CELP區(qū)別在于如果允許碼率提高，則CELP編碼器可令人信服地重現(xiàn)精確的原始語(yǔ)音，而MBE類編碼器則不能，因其僅僅捕獲了一些參數(shù)。這是混合編碼性能特點(diǎn)介于波形編碼與參數(shù)編碼之間的一個(gè)必然結(jié)果。3.2算法時(shí)延在算法時(shí)延方面，波形編碼的時(shí)延非常小，一般為零點(diǎn)幾個(gè)毫秒,4.8kbps的CELP編碼時(shí)延為30ms,基于CELP算法的其他編碼方案也多數(shù)在幾或二十毫秒左右,VSELP編碼時(shí)延相對(duì)較高。4.8kbps的AMBE算法時(shí)延為32ms,MBE類編碼處適中水平，小于VSELP編碼,但大于CELP和CE-ACEL編碼。3.3編碼原理方面

在編碼原理方面，MBE類與CELP類編碼的一個(gè)主要差別在于MBE將每一語(yǔ)音段分割成不同的頻帶并對(duì)每一頻帶進(jìn)行清濁音判決，這使得實(shí)際語(yǔ)音段的激勵(lì)信號(hào)成為周期〔濁音〕和類噪聲（清音）能量的混合。這樣，在激勵(lì)信號(hào)模型中增加的自由度使得MBE語(yǔ)音模型產(chǎn)生出比常規(guī)語(yǔ)音模型更高質(zhì)量的語(yǔ)音，甚至在速率低至2.4kbps時(shí)仍可維持語(yǔ)音的可理解度和自然度。此外，它使得MBE語(yǔ)音模型在存在背景噪聲時(shí)魯棒性強(qiáng)。H@tnH@tnLLISAsq擊僧醴卷盤(pán)10無(wú)哩環(huán)境交通干錢(qián)卡主噲聲唱車噪函備嘶細(xì)語(yǔ)ffl2兩種背瑪黑噪聲害祥性禪怙（MOS）線性預(yù)測(cè)聲碼器的固有問(wèn)題是線性預(yù)測(cè)模型在沒(méi)有附加的預(yù)測(cè)殘余時(shí)不產(chǎn)生高質(zhì)量的語(yǔ)音,預(yù)測(cè)殘余可看作糾錯(cuò)信號(hào),它糾正線性預(yù)測(cè)模型中的不精確度。線性預(yù)測(cè)類的各種編碼方式之間的主要差

人人文庫(kù)> 全部分類> 行業(yè)資料 > 各類標(biāo)準(zhǔn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

AMBE算法及其實(shí)現(xiàn)方式

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

AMBE算法及其實(shí)現(xiàn)方式

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔