版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
AMBEA算法及其實(shí)現(xiàn)方式在數(shù)字移動(dòng)通信系統(tǒng)中,語(yǔ)音編碼部分是很重要的一個(gè)環(huán)節(jié),它的性能直接關(guān)系到整個(gè)移動(dòng)通信系統(tǒng)的工作質(zhì)量。首先綜述在以數(shù)字集群為代表的移動(dòng)通信系統(tǒng)開(kāi)發(fā)的背景下,語(yǔ)音編碼的概念、分類和發(fā)展情況,并介紹目前世界上常見(jiàn)移動(dòng)通信系統(tǒng)所用的語(yǔ)音編碼方案,從而明確語(yǔ)音編碼算法的比較對(duì)象。今天我就自己手頭了解的一些知識(shí)對(duì)AMBE算法進(jìn)行初步的概括:1.MBE算法的概念A(yù)MBE是基于MBE技術(shù)的低比特率、高質(zhì)量的改進(jìn)語(yǔ)音壓縮算法,該技術(shù)在低比特率壓縮系統(tǒng)中能提供極優(yōu)的語(yǔ)音質(zhì)量,卻對(duì)指令執(zhí)行速度和存儲(chǔ)器容量的要求大大降低,在背景噪聲和信道誤碼方面也有極強(qiáng)的魯棒性,比基于線性預(yù)測(cè)編碼的CELP、RELP、VESLP、LPC-10等要優(yōu)越。那么了解AMBE之前我們先來(lái)了解下MBE算法:MBE編碼算法是用基音諧波處的譜抽樣來(lái)表示短時(shí)譜,并且在諧波間隔頻段上分別進(jìn)行清/濁音判決。合成端用一組正弦波合成譜,用噪聲譜的傅立葉反變換來(lái)合成清音譜。這種算法提出了一種由正弦模型引出的頻域模型—多帶激勵(lì)模型。MBE模型如圖1所示。首先按基音各諧波頻率,將一幀語(yǔ)音的頻譜分成若干個(gè)諧波帶,再以若干個(gè)諧波帶為一組進(jìn)行分帶,分別對(duì)各帶進(jìn)行清濁(V/U)判決,總的激勵(lì)信號(hào)由各帶激勵(lì)信號(hào)相加構(gòu)成。對(duì)于濁音帶,用以基音周期為周期的脈沖序列譜作為激勵(lì)信號(hào)譜對(duì)于清音帶,則使用白噪聲譜作為激勵(lì)信號(hào)譜。時(shí)變數(shù)字濾波器的作用是確定各諧波帶的相對(duì)幅度和相位,起到了將這種混合的激勵(lì)信號(hào)譜映射成語(yǔ)音譜的作用。這種模型使合成語(yǔ)音譜同原語(yǔ)音譜在細(xì)致結(jié)構(gòu)上能夠擬合得很好,其合成端的語(yǔ)音質(zhì)量必然較高。AMBE算法實(shí)現(xiàn)形式2.1AMBE編碼的基本方式AMBE編碼的基本方法為:首先將輸入的每幀160個(gè)數(shù)字話音取樣點(diǎn)分成交疊的段,經(jīng)模型分析后得出該幀的模型參數(shù)。編碼器量化這些模型參數(shù),加上糾錯(cuò)碼,然后以4.8kbps的數(shù)據(jù)流發(fā)送。解碼器接收比特流,重構(gòu)模型參數(shù),在利用這些產(chǎn)生合成的語(yǔ)音信息。流程如圖2所示。由此可知,AMBE算法的實(shí)現(xiàn)步驟可分為五步,即模型分析、量化、糾錯(cuò)(FEC)、重建及合成。下面簡(jiǎn)要說(shuō)明一下這五個(gè)步驟。1、 模型分析MBE算法模型:設(shè)輸入信號(hào)S(n),定義窗口化的語(yǔ)音信號(hào)為:S(n)=S(n)?W(n)設(shè)S(n)是激勵(lì)e(n)經(jīng)過(guò)線性濾波器h(n)的響應(yīng),則w w wS(n)=h(n)*e(n)w w w將幀分成兩類:話音和非話音。對(duì)于話音e(n)是周期脈沖序列,w各脈沖間的距離為脈沖周期P0;對(duì)于非話音:e(n)為白噪聲oMBE將w激勵(lì)信號(hào)譜分成若干段,再對(duì)每一段進(jìn)行話音/非話音(V/UV)判決。因此,激勵(lì)信號(hào)是周期信號(hào)能量(V)和噪聲能量(UV)之和。2、 量化在編碼之前,必須對(duì)譜高M(jìn)](1WIWL)進(jìn)行量化。量化的過(guò)程為:先由預(yù)測(cè)的譜高得出預(yù)測(cè)的留數(shù)r(lWIWL),然后將其分成8段,對(duì)每一段進(jìn)行離散余弦變換(DTC),得到增益矢量R(lWiWiL)和高階DTC相關(guān)系數(shù)C。量化器的輸出就是編碼器的輸出,包括ik基帶頻率,不同頻率的話音/非話音判決門(mén)限和譜高[1]。3、 糾錯(cuò)由于幀長(zhǎng)為20ms,傳輸速率為4.8kbps,所以每幀有96個(gè)比特。在AMBE算法中,72比特用來(lái)量化模型參數(shù),而其余24比特用于前向糾錯(cuò)(FEC)。將72比特分為5個(gè)向量組:v,v,v,v,v,設(shè)輸出的501234個(gè)向量組為:u,u,u,u,u,則01234v=u?G000v=u?gH,forlWiW3iiv=u44其中,gG和gH分別為[24,12]格雷(Golay)碼和[15,11]漢明(Hamming)碼的生成器。這樣u為24比特,u,u,u均為15比特,u0 1 2 3 4為27比特,總的輸出為96比特。4、重建解碼時(shí),需要重建譜高叫(1WIWL)首先,必須由b計(jì)算出L:l03=2n/(b+20)00L=0.9254(n/w+0.25)0然后,解碼和重建得到譜高。解碼和重建類似量化和編碼的逆過(guò)程:第一步先要將譜高分為8段,根據(jù)L決定每段的長(zhǎng)度J(1WiW8)1。這些段中的元素用C(1WiW8,表示段號(hào),2WkWJ,表示段內(nèi)ik i的元素號(hào))表示。每一段的第一個(gè)元素設(shè)為解碼增益R,其余元素為i高階DCT相關(guān)系數(shù)。5、合成解碼斷輸入的比特經(jīng)過(guò)重建以后,得到的一系列模型參數(shù)包括基帶頻率3,不同頻率的話音/非話音(V/UV)判決門(mén)限vk和譜高M(jìn)。然0l后將這些模型參數(shù)合成話音。話音合成算法將每一組模型參數(shù)分為話音譜(V)和非話音譜(UV),用話音合成算法和非話音合成算法分別對(duì)這兩部分進(jìn)行話音合成,將話音譜的能量合成產(chǎn)生話音信號(hào)suv(n),而非話音譜的能量則合成產(chǎn)生非話音信號(hào)suv(n)。2.2AMBE-2000DVSI公司的AMBE-2000語(yǔ)音編碼芯片是一種非常靈活、高性能、單片的語(yǔ)音壓縮編碼器它提供了在低數(shù)據(jù)速率時(shí)出色的語(yǔ)音質(zhì)量,也提供了一個(gè)實(shí)時(shí)、全雙工的備有標(biāo)準(zhǔn)AMBE語(yǔ)音壓縮軟件算法設(shè)置的設(shè)備。DVSI享有專利權(quán)的AMBE語(yǔ)音壓縮技術(shù)已經(jīng)被證明是與同之前的ECELP,CELP,RELP,VSELP,MELP,MP-MLQ,LPCT0和其他壓縮技術(shù)有更好的性能⑵。AMBE語(yǔ)音壓縮算法在全世界有著廣泛的應(yīng)用,其中也包括下一代數(shù)字移動(dòng)通信系統(tǒng)的應(yīng)用。AMBE-2000語(yǔ)音編碼器在選擇語(yǔ)音和FEC(前向糾錯(cuò))數(shù)據(jù)速率上提供了很高的靈活性。用戶可以以
50bps為增量全速地從2.0kbps到9.6kbps單獨(dú)地選擇這些參數(shù)。對(duì)于更高的差錯(cuò)速率信道,用戶將被分配更大百分比的FEC編碼全比特速率。AMBE-2000語(yǔ)音編碼在每秒2.4kbps的低速下能保持自然聲音質(zhì)量和語(yǔ)音的可性性oAMBE算法的低復(fù)雜性允許它被完全地集成到一個(gè)低價(jià)格、低功耗的集成電路—AMBE-2000語(yǔ)音編碼芯片中。在最簡(jiǎn)易模型中,AMBE-2000被看作兩個(gè)分離元件:編碼器和解碼器。編碼器接收8kHz采樣語(yǔ)音數(shù)據(jù)流(16-bit線性、8-bitp率,或8-bitp率)并以所期望的速率將數(shù)據(jù)流輸出信道。相反地,解碼器接收信道數(shù)據(jù)流,合成語(yǔ)音流。對(duì)AMBE-2000編、解碼器接口的時(shí)間控制是完全異步的。語(yǔ)音接口是外圍的A/D-D/A芯片。輸入輸出語(yǔ)音數(shù)據(jù)流必須是相同的格式(16-bit線性,8-bitA率,或s-bitp率)。信道接口是普通的8或16位微處理器或其它相應(yīng)的在AMBE-2000信道格式和被設(shè)計(jì)的系統(tǒng)信道格式中能體現(xiàn)其基本功能的外圍元件。AMBE-2000 __: 7AMBE-2000玄AMBE-2000 __: 7AMBE-2000玄I1Z語(yǔ)音敵據(jù)2.2AMBE-1000AMBE-1000是DVSI公司開(kāi)發(fā)的基于AMBE算法的一種高性能的多速率語(yǔ)音編碼/解碼芯片,非常適合于數(shù)字語(yǔ)音通信及處理的場(chǎng)合。本文基于AMBE-1000設(shè)計(jì)了一個(gè)語(yǔ)音壓縮系統(tǒng),該系統(tǒng)具有設(shè)計(jì)簡(jiǎn)便、語(yǔ)音編碼速率可變、音質(zhì)良好、功耗小等優(yōu)點(diǎn),可應(yīng)用于多種需要。AMBE-1000是基于AMBE算法的語(yǔ)音編碼/解碼芯片,其語(yǔ)音編碼/解碼速率可以在2400?9600bps之間以50bits的間隔變化。在芯片內(nèi)部有相互獨(dú)立的語(yǔ)音編碼和解碼通道,可同時(shí)完成語(yǔ)音的編碼和解碼任務(wù);并且所有的編碼和解碼操作都在芯片內(nèi)部完成,不需要外擴(kuò)的存儲(chǔ)器.AMBE-1000最基本的組成部分就是一個(gè)編碼器和一個(gè)解碼器,兩者相互獨(dú)立。編碼器接收8kHz采樣的語(yǔ)音數(shù)據(jù)流(16bit線性,8bitA律,8bitu律)并以一定的速率輸出信道數(shù)據(jù)。相反,解碼器接收信道數(shù)據(jù)并合成語(yǔ)音數(shù)據(jù)流。編碼器和解碼器接口的時(shí)序是完全異步的。AMBE-1000采用A/D-D/A芯片作為語(yǔ)音信號(hào)的接口。送往解碼器用于控制的數(shù)據(jù)和語(yǔ)音數(shù)據(jù)是不同的。輸入輸出的語(yǔ)音數(shù)據(jù)流的格式必
須是相同的(16bit線性的,8bitA律,8bitu律),信道接口采用8位或16位的微控制器。其工作原理如下圖:AMBE^lDOO解碼器 8KHZ吾音魏據(jù)雷音數(shù)據(jù)AMBE1000AMBE^lDOO解碼器 8KHZ吾音魏據(jù)雷音數(shù)據(jù)AMBE1000編碼器AMBE-2000聲碼器不同于AMBE-1000,AMBE-2000只有串行接口模式,沒(méi)有并行接口模式。AMBE算法與其它算法的優(yōu)勢(shì)3.1編碼速率和占用帶寬從編碼速率和占用帶寬角度來(lái)看,由于波形編碼為了能夠獲得較高的重建語(yǔ)音質(zhì)量,所以直接對(duì)時(shí)域波形或在變換域進(jìn)行編碼,所以壓縮比較低,編碼速率一般較高。而目前比較常用的一些語(yǔ)音壓縮算法,比如CELP、數(shù)字集群TETRA標(biāo)準(zhǔn)里用的ACELP編碼、MOTORLA的IDEN標(biāo)準(zhǔn)所用的編碼都屬于混合編碼。這些編碼方式將波形編碼的優(yōu)點(diǎn)與參量編碼的優(yōu)點(diǎn)結(jié)合起來(lái),使語(yǔ)音質(zhì)量有了明顯的提高,但是它們的編碼速率一般都在4.8kbps以上,試圖更大幅度地降低這些編碼方式的壓縮速率,如降到4kbps以下,由于沒(méi)有足夠的比特表示激勵(lì)矢量,余量信號(hào)的量化將產(chǎn)生較大的誤差,那么話音質(zhì)量將會(huì)急劇下降。MBE和CELP區(qū)別在于如果允許碼率提高,則CELP編碼器可令人信服地重現(xiàn)精確的原始語(yǔ)音,而MBE類編碼器則不能,因其僅僅捕獲了一些參數(shù)。這是混合編碼性能特點(diǎn)介于波形編碼與參數(shù)編碼之間的一個(gè)必然結(jié)果。3.2算法時(shí)延在算法時(shí)延方面,波形編碼的時(shí)延非常小,一般為零點(diǎn)幾個(gè)毫秒,4.8kbps的CELP編碼時(shí)延為30ms,基于CELP算法的其他編碼方案也多數(shù)在幾或二十毫秒左右,VSELP編碼時(shí)延相對(duì)較高。4.8kbps的AMBE算法時(shí)延為32ms,MBE類編碼處適中水平,小于VSELP編碼,但大于CELP和CE-ACEL編碼。3.3編碼原理方面
在編碼原理方面,MBE類與CELP類編碼的一個(gè)主要差別在于MBE將每一語(yǔ)音段分割成不同的頻帶并對(duì)每一頻帶進(jìn)行清濁音判決,這使得實(shí)際語(yǔ)音段的激勵(lì)信號(hào)成為周期〔濁音〕和類噪聲(清音)能量的混合。這樣,在激勵(lì)信號(hào)模型中增加的自由度使得MBE語(yǔ)音模型產(chǎn)生出比常規(guī)語(yǔ)音模型更高質(zhì)量的語(yǔ)音,甚至在速率低至2.4kbps時(shí)仍可維持語(yǔ)音的可理解度和自然度。此外,它使得MBE語(yǔ)音模型在存在背景噪聲時(shí)魯棒性強(qiáng)。H@tnH@tnLLISAsq擊僧醴卷盤(pán)10無(wú)哩環(huán)境交通干錢(qián)卡主噲聲唱車噪函備嘶細(xì)語(yǔ)ffl2兩種背瑪黑噪聲害祥性禪怙(MOS)線性預(yù)測(cè)聲碼器的固有問(wèn)題是線性預(yù)測(cè)模型在沒(méi)有附加的預(yù)測(cè)殘余時(shí)不產(chǎn)生高質(zhì)量的語(yǔ)音,預(yù)測(cè)殘余可看作糾錯(cuò)信號(hào),它糾正線性預(yù)測(cè)模型中的不精確度。線性預(yù)測(cè)類的各種編碼方式之間的主要差
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 專用焊接材料焊條買賣協(xié)議2024版版A版
- 二零二五年度知識(shí)產(chǎn)權(quán)授權(quán)居間代理合同3篇
- 2025貴州六盤(pán)水市水成交通建設(shè)(集團(tuán))限責(zé)任公司人才引進(jìn)高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年安徽馬鞍山市含山博物館招考1人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025秋季吉林省省屬國(guó)企業(yè)定向招聘高校畢業(yè)生465人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025福建莆田市“三支一扶”招募110人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025福建福州市倉(cāng)山區(qū)“智慧倉(cāng)山”管理服務(wù)中心招聘歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025福建省五建公司招聘73人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025福建泉州市豐澤區(qū)自然資源局公開(kāi)招聘2人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024生豬運(yùn)輸冷鏈物流服務(wù)合同模板
- 2020年醫(yī)師定期考核試題與答案(公衛(wèi)專業(yè))
- 2022年中國(guó)育齡女性生殖健康研究報(bào)告
- 教育金規(guī)劃ppt課件
- 開(kāi)封辦公樓頂發(fā)光字制作預(yù)算單
- 呼吸機(jī)波形分析及臨床應(yīng)用
- 安全生產(chǎn)標(biāo)準(zhǔn)化管理工作流程圖
- 德龍自卸車合格證掃描件(原圖)
- 藥店-醫(yī)療器械組織機(jī)構(gòu)和部門(mén)設(shè)置說(shuō)明-醫(yī)療器械經(jīng)營(yíng)組織機(jī)構(gòu)圖--醫(yī)療器械組織機(jī)構(gòu)圖
- 常用緊固件選用指南
- 自薦書(shū)(彩色封面)
- [國(guó)家公務(wù)員考試密押題庫(kù)]申論模擬925
評(píng)論
0/150
提交評(píng)論