




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 ILBC編碼算法及其在VOIP中的應(yīng)用 郭廷廷, 李 敬 時間:2008年05月08日 字 體: 大 中 小 關(guān)鍵詞:<"cblue" " target='_blank'>語音質(zhì)量<"cblue" " target=
2、9;_blank'>編解碼<"cblue" " target='_blank'>矢量量化<"cblue" " target='_blank'>網(wǎng)絡(luò)環(huán)境<"cblue" " target='_blank'>激勵信號 摘要: VOIP正在成為熱門的應(yīng)用領(lǐng)域,<&quo
3、t;cblue" " title="語音質(zhì)量">語音質(zhì)量的提高是其難點之一。ILBC算法是一種基于CELP(Code Excited Linear Predictive Coding)的新的低比特率語音編碼算法,其優(yōu)異的語音質(zhì)量、突出的長時預(yù)測方法1及丟包掩蔽2(PLC)技術(shù),很好地解決了互聯(lián)網(wǎng)上傳輸語音的問題。詳細(xì)探討了ILBC的實現(xiàn)原理,對其關(guān)鍵技術(shù)進(jìn)行了較深入的分析,給出了實驗結(jié)論,并對其應(yīng)用作了一些展望。關(guān)鍵詞: ILBC(Internet Low Bit Vate Codec) VOIP(Voice Over IP) PLC 丟包掩蔽 動
4、態(tài)碼本隨著互聯(lián)網(wǎng)的迅速發(fā)展,人們對通過互聯(lián)網(wǎng)進(jìn)行實時語音、視頻傳輸?shù)囊笤桨l(fā)強(qiáng)烈,VOIP正是在這一應(yīng)用背景下誕生的一門新技術(shù),它把數(shù)字語音編碼技術(shù)與分組交換網(wǎng)相結(jié)合,提供實時語音及其相關(guān)服務(wù),該技術(shù)要求占用盡可能小的網(wǎng)絡(luò)帶寬并擁有良好的語音質(zhì)量。由于當(dāng)前<"cblue" " title="網(wǎng)絡(luò)環(huán)境">網(wǎng)絡(luò)環(huán)境的特點,丟包現(xiàn)象不可避免,以往的低比特率編碼標(biāo)準(zhǔn)雖然可以解決帶寬問題,但丟包時語音質(zhì)量不能保證。因而,需要新的語音編碼算法來滿足這一要求。1 ILBC簡介ILBC是由Global IP Sound公司提出的一種專為包交換網(wǎng)絡(luò)通
5、信設(shè)計的<"cblue" " title="編解碼">編解碼,優(yōu)于目前流行的G.729A、G.723.1,對丟包進(jìn)行了特殊處理,既使在丟包率相當(dāng)高的網(wǎng)絡(luò)環(huán)境下,仍可獲得非常清晰的語音效果。ILBC是一種適用于窄帶網(wǎng)絡(luò)的編碼算法。根據(jù)網(wǎng)絡(luò)帶寬的不同,ILBC提供兩種編碼的格式,如表1。該算法使用了長時的預(yù)測技術(shù)和幀獨立編碼方法,使其非常適合在存在丟包的網(wǎng)絡(luò)環(huán)境中傳播。2 ILBC算法的原理2.1 ILBC編碼ILBC本質(zhì)上是一種基于幀的線性預(yù)測編碼方法,是對CELP(碼激勵線性預(yù)測編碼)的一種發(fā)展,其獨有的動態(tài)碼本更新技術(shù)、語音加強(qiáng)算
6、法和丟包掩蔽技術(shù)使其在VOIP中應(yīng)用時有更好的性能。對于每一個含有160/240(20ms/30ms) 樣點的輸入幀,ILBC算法將進(jìn)行以下主要操作:(1) 把該幀分為4/6 個子幀,每子幀40個樣點。對30ms的幀,進(jìn)行兩組10階的LPC分析,得到相應(yīng)的LPC系數(shù);對于20ms的幀,進(jìn)行一次10階LPC分析。(2)每次分析得到的LPC系數(shù)將轉(zhuǎn)化為LSF(線譜對)參數(shù),并對LSF系數(shù)進(jìn)行量化,內(nèi)插以得到各個子幀的LSF系數(shù);隨后,由各子幀的LSF系數(shù)得到各子幀對應(yīng)的分析器,對各個子幀進(jìn)行線性預(yù)測,計算各子幀的殘差。(3)從殘差中找到兩個能量最大的連續(xù)子幀,然后把能量值較小的首23/22個樣點(
7、30ms/20ms)或尾23/22樣點從連續(xù)子幀中去除,剩余的57/58個被選定為本次處理的初始狀態(tài)。對于濁音語音,這樣的選取方式將至少包含一個基音脈沖。(4)對初始狀態(tài)進(jìn)行基于DPCM的標(biāo)量量化,量化結(jié)果將作為編碼輸出的一部分。與此同時,初始狀態(tài)被存入碼本存儲區(qū),以構(gòu)成動態(tài)碼本的初始值,用于對本幀的剩余樣點進(jìn)行<"cblue" " title="矢量量化">矢量量化。(5)對于剩余的殘差,矢量量化將按下面順序進(jìn)行:(a)包含有初始狀態(tài)的兩個連續(xù)子幀中剩余的23/22個樣點;(b) 時間軸上處于初始狀態(tài)之后的各個子幀; (c)時間軸
8、上在初始狀態(tài)之前的各個子幀。對于此矢量量化,每次搜索碼本的范圍是動態(tài)碼本,其中存儲了已經(jīng)被解碼的對象,并隨著最新的解碼結(jié)果,該動態(tài)碼本被更新。(6)對編碼結(jié)果進(jìn)行封包處理。ILBC的編碼的框圖如圖1所示。2.2 ILBC解碼ILBC是一種運用了分析合成方法的編解碼算法,解碼部分的運算量相對要小一些,使其在功能不強(qiáng)的客戶端的實時解碼成為可能。解碼的主要過程如下:(1)解包,參數(shù)提取。(2)從得到的LSF參數(shù)進(jìn)行內(nèi)插,并轉(zhuǎn)化各個子幀的LPC系數(shù),以便進(jìn)行合成操作。(3) 對初始狀態(tài)進(jìn)行解碼,解碼結(jié)果一方面作為<"cblue" " title="激勵信號
9、">激勵信號暫存,另一方面存入碼本存儲區(qū),以構(gòu)成動態(tài)碼本的初始值。(4) 對剩余的子幀部分,按照與編碼相同的次序進(jìn)行殘差解碼,并用解碼結(jié)果更新動態(tài)碼本,重復(fù)(4)直到所有子幀完成譯碼。(5) 對于解碼得到的殘差信號,進(jìn)行語音增強(qiáng)的操作。該語音增強(qiáng)采用了條件限制的增強(qiáng)方法。(6) 進(jìn)行語音合成,形成解碼后的語音。(7) 高通濾波,以消除合成后的低頻語音。ILBC解碼的流程圖如圖2所示。2.3 ILBC的比特流定義對于20 ms的幀,共使用了304個比特來表示編碼后的語音信號,被封裝在38個字節(jié)中;對于30ms的幀,共使用了400個比特,封裝在50個字節(jié)中。在封裝的過程中,按照數(shù)據(jù)
10、對傳輸誤差的敏感程度不同,這些比特被分成三類,第一類代表了最敏感的數(shù)據(jù)3。表2 列出了ILBC編碼的比特流分配情況。3 ILBC的關(guān)鍵技術(shù)與以往的低比特率語音編解碼算法相比,ILBC除了采用經(jīng)典的線性預(yù)測分析法、LPC系數(shù)到LSF系數(shù)相互轉(zhuǎn)換、分裂矢量量化LSF參數(shù)和多級形狀-增益量化4殘差外,主要有下面特殊的方法。(1) 基于初始狀態(tài)的動態(tài)碼本的選取和更新。ILBC利用了基于初始狀態(tài)的動態(tài)碼本的更新方法,把最新的解碼結(jié)果加入碼本,以取代較老的碼矢。通過這種算法,可以較為方便地生成碼本,同時也提供了很好的碼本預(yù)測能力。(2) 幀間獨立的長時預(yù)測方法,在此基礎(chǔ)上的PLC(丟包掩蔽)技術(shù)。經(jīng)典的C
11、ELP方法是利用以往的激勵信號來對自適應(yīng)碼本進(jìn)行更新的,這樣的方法在分組交換網(wǎng)中有下面問題:如果過去的信號丟失或在傳輸過程中被污染,解碼用的碼本就會與編碼時不同,將導(dǎo)致解碼語音質(zhì)量變差;在語音建立階段,解碼端的自適應(yīng)碼本并不能很好地描述基音周期,導(dǎo)致解碼語音建立時間加長。ILBC采用了基于初始狀態(tài)的解碼方法,初始碼本是從初始狀態(tài)中得到的,通常都會包含至少一個基音脈沖,因而建立時間較快;同時,從初始狀態(tài)出發(fā),既有時間上前向的預(yù)測,也有向后的預(yù)測,因而體現(xiàn)了長時預(yù)測的概念,配合PLC技術(shù),即使出現(xiàn)丟幀,解碼語音質(zhì)量也不會有明顯下降。PLC技術(shù)的基本原則是:解碼端若收到正確的幀,則計算出的LPC系數(shù)
12、和激勵碼本被存儲; 若丟幀,則使用上一個正確幀中的激勵信號,利用基音同步重復(fù)的方法得到本幀解碼信號。(3) 利用有條件限制的優(yōu)化算法3加強(qiáng)殘差語音。該算法的主要思想是對要加強(qiáng)的殘差語音塊,尋找其前3個塊和后3個塊,用這6個塊的線性組合逼近當(dāng)前待加強(qiáng)的塊。計算待加強(qiáng)塊和逼近塊的均方誤差。若誤差足夠小,就把逼近塊作為加強(qiáng)塊;否則,加強(qiáng)塊為待加強(qiáng)塊和逼近塊的線性組合。4 實驗結(jié)果與性能評測 圖3是Dynstat公司在具有丟包情況的網(wǎng)絡(luò)環(huán)境下對ILBC、G729.A、G723.1幾種算法進(jìn)行測試后的MOS(平均意見得分)對比圖,可以看出ILBC編碼的語音質(zhì)量整體高于其余兩種編碼,尤其是當(dāng)丟包率較高時,
13、MOS得分遠(yuǎn)高于另外兩種編碼。為了對ILBC在丟幀時仍有良好語音質(zhì)量做出解釋,進(jìn)行了以下實驗:(1)在短時間內(nèi)對有丟包時的解碼片斷做分析,如圖4所示。實驗得出,僅有一幀丟失時,語音的損壞基本上不會被聽者察覺,當(dāng)出現(xiàn)連續(xù)兩幀以上丟失時,才會被察覺。在文獻(xiàn)2中有ILBC與G.729.A的丟幀對比。(2)初始狀態(tài)編碼是ILBC中的關(guān)鍵步驟,應(yīng)用了標(biāo)量編碼的方式。為使編碼更有效,實現(xiàn)時,先用一個全通濾波器將殘差的動態(tài)范圍壓縮,解碼時再通過逆濾波恢復(fù)。圖5是對某一幀語音的殘差分析的結(jié)果,經(jīng)過多幀測試發(fā)現(xiàn),該技術(shù)使殘差的動態(tài)范圍減小了約1/3。由于實時傳輸?shù)男枰?,算法的時間復(fù)雜度成為實際系統(tǒng)實現(xiàn)時重要的考
14、慮因素,在PC機(jī)(Celeron 2.7G, 512M內(nèi)存)上對用ANSI-C實現(xiàn)的ILBC浮點算法1進(jìn)行運算量統(tǒng)計,可以得到表3的結(jié)果,可以得到解碼的復(fù)雜度較小,是一種非對稱的編碼方案;編碼部分碼本搜索占用了最長的時間,成為算法優(yōu)化時要考慮的關(guān)鍵部分。?ILBC算法優(yōu)異的語音質(zhì)量及良好的丟包掩蔽技術(shù),使其在VOIP中的應(yīng)用前景非常廣闊。2002年2月,ILBC是IETF 接受的關(guān)于語音/音頻編解碼的第一個標(biāo)準(zhǔn)。2004年4月在關(guān)于多媒體終端適配器和媒體網(wǎng)關(guān)分布的CableLabsPacketCable1.1 Audio/Video編解碼規(guī)范中,被指定為強(qiáng)制的編解碼算法。軟件與系統(tǒng)方面, Skype、Hostip、Pandora Networks和Pingtel Instant都對該算法進(jìn)行支持,DSP及專用集成電路方面,TI 已經(jīng)推出相應(yīng)的定點DSP實現(xiàn)方案,AudioCodes已有專用芯片支持??梢灶A(yù)計,不久的將來, ILBC將在VOIP中得到更加廣泛的應(yīng)用。參考文獻(xiàn)1 Andersen S V. Internet low bit rate codec. IETF internet-draft, 20022 Andersen S V. ILBC- A linear predictive coder with robustn
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 凍貨購銷合同范例
- cif外貿(mào)合同范例
- 關(guān)于民間合同范例
- 中標(biāo)后電梯合同范例
- 農(nóng)田收購合同范例
- 做木工合同范例
- 公司離職合同范例
- 供貨花卉合同范例
- 供貨合同范本教程模板
- 國際法視域下的人權(quán)與氣候變化
- 常州2025年江蘇常州工程職業(yè)技術(shù)學(xué)院其他專技崗管理崗招聘筆試歷年參考題庫附帶答案詳解
- (二調(diào))武漢市2025屆高中畢業(yè)生二月調(diào)研考試 生物試卷(含標(biāo)準(zhǔn)答案)
- (一模)臨沂市2025屆高三高考第一次模擬考試政治試卷(含答案詳解)
- 2025年安徽職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性考試題庫含答案
- 2025年中考百日誓師大會校長發(fā)言稿(二)
- 1.2男生女生課件(共15張)-2024-2025學(xué)年統(tǒng)編版道德與法治七年級下冊
- 2025年安徽審計職業(yè)學(xué)院單招職業(yè)技能測試題庫附答案
- 2025年共青科技職業(yè)學(xué)院單招職業(yè)技能測試題庫學(xué)生專用
- 2025年黑龍江林業(yè)職業(yè)技術(shù)學(xué)院單招職業(yè)技能測試題庫含答案
- 2025年01月吉林白山市長白朝鮮族自治縣事業(yè)單位公開招聘工作人員(含專項)和邊境村穩(wěn)邊固邊工作專干84人(1號)筆試歷年典型考題(歷年真題考點)解題思路附帶答案詳解
- 2025河南中煙許昌卷煙廠招聘10人易考易錯模擬試題(共500題)試卷后附參考答案
評論
0/150
提交評論