itutg728標(biāo)準(zhǔn)學(xué)習(xí)資料_第1頁
itutg728標(biāo)準(zhǔn)學(xué)習(xí)資料_第2頁
itutg728標(biāo)準(zhǔn)學(xué)習(xí)資料_第3頁
itutg728標(biāo)準(zhǔn)學(xué)習(xí)資料_第4頁
itutg728標(biāo)準(zhǔn)學(xué)習(xí)資料_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

PAGE260PAGE261附錄A:ITU-TG.728標(biāo)準(zhǔn)16kbit/sLD-CELP語音編碼1.概述這個建議包含用低延遲碼激勵線性預(yù)測方法進(jìn)行16kbit/s語音編碼算法的描述。該建議由以下幾個部分組成。在第2節(jié)給出了LD-CELP算法的簡要原理。在第3節(jié)和第4節(jié),分別討論了LD-CELP編碼器和解碼器的原則。在第5節(jié),定義了與每個功能算法塊有關(guān)的計(jì)算細(xì)節(jié)。附件A、B、C和D包含了用于LD-CELP算法的常數(shù)表格。在附件E中,給出了可變自適應(yīng)序列及其用途。最后在附錄I(略)中提供了用于驗(yàn)證算法實(shí)現(xiàn)的信息。2.LD-CELP概述LD-CELP算法由一個編碼器和一個解碼器組成,分別在2.1節(jié)和2.2節(jié)描述它們,原理圖示于圖A.1。CELP技術(shù)的本質(zhì),是用分析—合成的方法對碼書進(jìn)行搜索,該方法被保留在LD-CELP中。但是,LD-CELP用反向自適應(yīng)預(yù)測器和增益來獲得一種延遲0.625ms的算法,只有激勵碼書的索引被傳送。預(yù)測器系數(shù)通過對以前量化語音的LPC分析來更新,激勵增益通過利用以前嵌入在量化激勵中的增益信息來修正。激勵矢量和增益自適應(yīng)塊的體積僅為5個采樣值。一個感覺加權(quán)濾波器利用未量化語音的LPC分析來更新。2.1LD-CELP編碼器從A-律或μ-律PCM變換到均勻PCM后,輸入信號被分成五個連續(xù)輸入信號樣值的各個塊,對每一個輸入塊,編碼器讓1024個候選碼書矢量(存儲在一個激勵碼書中)中的每一個通過一個增益調(diào)節(jié)單元和一個綜合濾波器。從這1024個候選量化信號矢量中,編碼器鑒別出一個使頻域加權(quán)均方誤差最小的量代表輸入信號矢量。對應(yīng)代表最佳候選量化信號矢量的最佳碼書矢量(或“碼矢量”)的10位碼書索引被傳送到解碼器。然后,最佳碼矢量通過增益調(diào)節(jié)單元和綜合濾波器準(zhǔn)備為下一個信號矢量而建立正確的濾波器存儲。綜合濾波器參數(shù)和增益被以反向自適應(yīng)的方式周期地更新,而這種反向自適應(yīng)的方式是以以前量化信號和增益調(diào)節(jié)激勵為基礎(chǔ)的。2.2LD-CELP解碼器解碼操作也是以一塊接一塊的方式被執(zhí)行。每接收到一個10bit索引,解碼器執(zhí)行一次查表操作以從激勵碼書中提取對應(yīng)的碼矢量。然后這個碼矢量通過一個增益調(diào)節(jié)單元和一個綜合濾波器以產(chǎn)生正確的解碼信號矢量。然后綜合濾波器系數(shù)和增益以與在編碼器中相同的方式被更新。接著,解碼信號矢量通過一個自適應(yīng)后濾波以提高聽覺質(zhì)量。后濾波器參數(shù)的周期更新是利用解碼器端的有效信息。后濾波器矢量的5個采樣值接著被變換成5個A-律或μ-律PCM輸出值。3.LD-CELP編碼原則圖A.2是LD-CELP編碼器的詳細(xì)方框原理圖。這個圖與前面的圖A.1信號在數(shù)學(xué)上是等價的,但對于實(shí)現(xiàn)更為有效。對圖A.2做下列說明:a.對每一個要描述的變量,k是采樣索引,樣值以125μs的間隔被采樣。b.在一個已給信號中,一組5個連續(xù)樣值被叫做這個信號的一個矢量。例如,5個連續(xù)語音采樣值形成一個語音矢量,5個連續(xù)激勵樣值形成一個激勵矢量等等。c.我們用n表示矢量索引,它不同于采樣索引k。d.四個連續(xù)的矢量構(gòu)成一個自適應(yīng)周期。在后面章節(jié)里,我們也把自適應(yīng)周期叫做幀,兩個名稱可互換使用。激勵矢量量化(VQ)碼書索引明顯地是從編碼器向解碼器傳送的唯一信息。三種其它參數(shù)被周期地更新,它們是:激勵增益、綜合濾波器和感覺加權(quán)濾波器參數(shù)。這些參數(shù)是從出現(xiàn)在當(dāng)前信號矢量以前的信號中以一種反向自適應(yīng)的方式推導(dǎo)出來的。激勵增益對每一個矢量更新一次,而綜合濾波器系數(shù)和感覺加權(quán)濾波器系數(shù)每四個矢量更新一次(即20個采樣值或2.5ms更新周期)。注意,雖然算法中的處理序列有4個矢量(20個采樣值)的自適應(yīng)周期,但基本緩沖器體積仍然是一個矢量(5個采樣值)。這樣小的緩沖體積使得到一個少于2ms的延遲方式成為可能。編碼器的每個方框的說明在下面給出。因?yàn)長D-CELP編碼器主要用于對語音編碼,為便于描述,在下面我們將假定輸入信號是語音,雖然實(shí)際上它也能用于非語音信號。3.1輸入PCM格式轉(zhuǎn)換這個方框把輸入A–律或–律PCM信號轉(zhuǎn)換成一個均勻PCM信號。3.1.1內(nèi)部線性PCM電平在從A–律或–律變換為線性PCM過程中,不同的內(nèi)部表示是可能的。這決定于儀器。例如,對于–律PCM標(biāo)準(zhǔn)表格定義的線性范圍是-4015.5~+4015.5。這對應(yīng)于A–律PCM的范圍是-2016~+2016。兩種表列出的某些輸出值有0.5的小數(shù)部分;這些小數(shù)部分在整數(shù)儀器中并不能表示出來。除非整個表格乘以2以使所有的值都成為整數(shù)。事實(shí)上,這一點(diǎn)在定點(diǎn)DSP芯片上是很普遍的。相反,浮點(diǎn)DSP芯片能表示列在表中同樣的值。這篇文章假定輸入信號有最大范圍-4095~+4095,這包括了–律和A–律的情況。在A–律的情況下,它意指當(dāng)線性變換的結(jié)果在-2016~+2016范圍時,在繼續(xù)對信號編碼之前,這些值應(yīng)被一個2的因子調(diào)節(jié)(乘2)。在–律情況下,對一個定點(diǎn)處理器,輸入范圍被變換到-8031~+8031。它意指在開始編碼處理以前,輸入值應(yīng)除以2。換句話說,這些值能被作為Q1格式來處理,意指有一位在十進(jìn)制小數(shù)點(diǎn)的右邊,那么所有涉及到這個數(shù)據(jù)的計(jì)算都應(yīng)把這一位考慮進(jìn)去。對于16-bit線性PCM輸入的情況,有滿動態(tài)范圍-32768~+32768,輸入值應(yīng)被考慮成Q3格式,這就是說,輸入值應(yīng)被除以8。在解碼器輸出端,這個因子8將被恢復(fù)。3.2矢量緩沖器這個方塊緩沖5個連續(xù)語音樣值以形成一個5維語音矢量。3.3感覺加權(quán)濾波器自適應(yīng)圖A.4顯示了感覺加權(quán)濾波器調(diào)節(jié)器的細(xì)節(jié)操作(塊3)。這個調(diào)節(jié)器對每四個語音矢量計(jì)算一次感覺加權(quán)濾波器的系數(shù),而這四個語音矢量是基于未量化語音的線性預(yù)測分析(常被叫做LPC分析)上的。系數(shù)更新出現(xiàn)在每四個矢量自適應(yīng)周期的第三個語音矢量處,這些系數(shù)在每兩次更新間保持為常數(shù)。參考圖A.4(a),這個計(jì)算按下列步驟執(zhí)行。首先,輸入(未量化)語音矢量通過一混合(hybrid)窗模塊(塊36)即加一窗在以前的語音矢量上,然后計(jì)算加窗語音信號的頭11個自相關(guān)系數(shù)。Levinson-Durbin遞推模塊(塊37)變換這些自相關(guān)系數(shù)成為預(yù)測器系數(shù)。以這些預(yù)測器系數(shù)為基礎(chǔ),權(quán)濾波器系數(shù)計(jì)算器(塊38)能得出期望的權(quán)濾波器系數(shù)。下面我們仔細(xì)討論這三部分。我們先描述混合窗的原理。因?yàn)檫@個混合窗技術(shù)將被用于三種不同的LPC分析中,我們先給出它的總體描述,然后再針對不同情況專門講述。假定LPC分析對每L個信號樣值執(zhí)行一次,為一般化,認(rèn)為對應(yīng)于當(dāng)前LD-CELP自適應(yīng)周期的信號樣值是。那么,對于反向自適應(yīng)LPC分析,混合窗被用于樣值索引小于m的所有以前的樣值,如圖A.4(b)。設(shè)在混合窗函數(shù)中有N個非遞歸樣值,則信號樣值全部被這個窗的非遞歸部分加權(quán)。從開始(包括這個樣值),樣值左邊的所有信號樣值被這個窗的遞歸部分加權(quán),有值b,這里,0<b<1和0<α<1。在時刻m,混合窗函數(shù)被定義為:(A.3.1)窗加權(quán)信號是:(A.3.2)非遞歸部分的樣值和遞歸部分的起始段對不同的混合窗在附件A中被專門說明。對一個M階LPC分析,我們需要計(jì)算M+1個自相關(guān)系數(shù),對當(dāng)前自適應(yīng)周期,第i個自相關(guān)系數(shù)能被表示為:(A.3.3)這里,(A.3.4)在方程(A.3.3)的右邊,第一項(xiàng)是的“遞歸部分”,而第二項(xiàng)是“非遞歸部分”,對于每個自適應(yīng)周期都要計(jì)算非遞歸部分的有限和。另一方面,遞歸部分被遞歸計(jì)算。下面來說明怎樣做。假定我們對于當(dāng)前的自適應(yīng)周期已經(jīng)計(jì)算和儲存了所有的,想要繼續(xù)下一個自適應(yīng)周期,它是從采樣)開始的?;旌洗氨挥乙芁個采樣,對下一個自適應(yīng)周期,這個新的窗加權(quán)信號變成:(A.3.5)的遞歸部分被寫作(A.3.6)或(A.3.7)因此,能從方程(A.3.7)遞歸計(jì)算。這個新計(jì)算出的送回存儲器以為下一個自適應(yīng)周期所使用。然后,自相關(guān)系數(shù)由下式計(jì)算:(A.3.8)迄今,我們已以一般方法描述了混合窗的計(jì)算方法。對圖A.4(a)中的模塊36中的混合窗,參數(shù)值是M=10,L=20,N=30,(因?yàn)椋┯蒙线吤枋龅幕旌洗胺椒ㄓ?jì)算了11個自相關(guān)系數(shù)R()后(,一個“白噪聲”相關(guān)方法被應(yīng)用,通過一個小量來增加能量R(0):(A.3.9)這樣做有一個作用,即用白噪聲來填充譜谷以便降低譜動態(tài)范圍和緩和后續(xù)Levinson-Durbin遞推的不良條件。白噪聲相關(guān)因子257/256對應(yīng)于大約24dB的白噪聲電平,這個電平低于平均語音能量。其次,應(yīng)用白噪聲修正自相關(guān)系數(shù),Levinson-Durbin遞推模塊37遞歸地計(jì)算了1~10階預(yù)測器的系數(shù)。令第i階預(yù)測器的第j個系數(shù)為,則遞歸方法可如下描述:(A.3.10)(A.3.11)(A.3.12)(A.3.13)(A.3.14)方程(A.3.11)到(A.3.14)對遞歸計(jì)算,最終的解可給出:(A.3.15)如果我們定義,則10階“預(yù)測誤差濾波器”(有時被稱作“分析濾波器”)有如下的傳遞函數(shù)(A.3.16)相應(yīng)地,10階線性預(yù)測器用下列傳遞函數(shù)定義:(A.3.17)感覺加權(quán)濾波器系數(shù)計(jì)算(塊38)根據(jù)下列方程來計(jì)算感覺加權(quán)濾波器系數(shù):(A.3.18)(A.3.19)(A.3.20)感覺加權(quán)濾波器是在方程(A.3.18)中用傳遞函數(shù)W(z)定義的一個10階零–極濾波器。和的值分別是0.9和0.6。參考圖A.2,感覺加權(quán)濾波器調(diào)節(jié)器(塊3)根據(jù)方程(A.3.17)至(A.3.20)周期地更新W(z)的系數(shù),再把這些系數(shù)饋送到?jīng)_激響應(yīng)矢量計(jì)算器(塊12)和感覺加權(quán)濾波器(塊4和塊10)。3.4感覺加權(quán)濾波器在圖A.2中,當(dāng)前輸入語音矢量s(n)通過感覺加權(quán)濾波器(塊4),成為加權(quán)的語音矢量v(n)。注意,除了在預(yù)置期間,濾波器存儲值(即內(nèi)部狀態(tài)變量,或被保留在濾波器延遲單元的值)在任何時間不應(yīng)再置為0。換句話說,感覺加權(quán)濾波器(塊10)的存儲器將需要下面描述的特殊處理。3.4.1非語音操作對調(diào)制解調(diào)器信號或其它非語音信號,CCITT測試結(jié)果表明,最好不用感覺加權(quán)濾波器,這等于置W(z)=1。如果在方程(A.3.18)中,和被設(shè)為0,就很容易地得到了這個結(jié)果。在語音方式下這些變量的標(biāo)稱值是0.9和0.6。3.5綜合濾波器在圖A.2中,有兩個具有同樣系數(shù)的綜合濾波器(塊9和塊22),這兩個濾波器被后向綜合濾波器調(diào)節(jié)器(塊23)更新。每一個綜合濾波器是一個50階全極點(diǎn)濾波器,該全極點(diǎn)濾波器由一個在反饋支路中具有50階LPC預(yù)測器的反饋環(huán)組成。綜合濾波器的傳遞函數(shù)是F(z)=1/[1-P(z)],這里的P(z)是50階LPC預(yù)測器的傳遞函數(shù)。如果已獲得加權(quán)語音矢量v(n),則用綜合濾波器(塊9)和感覺加權(quán)濾波器(塊10)產(chǎn)生一個零輸入響應(yīng)矢量r(n)。為做到這一點(diǎn),我們首先打開開關(guān)5,即把它指向節(jié)點(diǎn)6。這意味著從節(jié)點(diǎn)7到綜合濾波器9的信號將是零。然后我們讓綜合濾波器9和感覺加權(quán)濾波器10構(gòu)成5個采樣(1個矢量)的“環(huán)”。這意指我們繼續(xù)對五個采樣信號和節(jié)點(diǎn)7的零信號進(jìn)行操作。加權(quán)濾波器10的輸出結(jié)果就是期望的零輸入響應(yīng)矢量r(n)。3.6VQ目標(biāo)矢量計(jì)算這個塊從加權(quán)的語音矢量v(n)減去零輸入響應(yīng)矢量r(n),以獲得VQ碼書搜索目標(biāo)矢量x(n),即。3.7反向自適應(yīng)綜合濾波器這個調(diào)節(jié)器23調(diào)整綜合濾波器9和22的系數(shù)。它把量化的(合成的)語音做為輸入,產(chǎn)生一組綜合濾波器系數(shù)做為輸出。它的操作類似于感覺加權(quán)濾波器調(diào)節(jié)器3。這個調(diào)節(jié)器的流程說明示于圖A.5,混合窗模塊49和Levinson-Durbin遞推模塊50的操作除下列三點(diǎn)與圖A.4(a)中模塊36和37的計(jì)算部分不同外,其余完全相同:現(xiàn)在的輸入信號是量化(合成)語音,而不是未量化(原始)輸入語音;預(yù)測器階數(shù)是50而不是10;混合窗參數(shù)不同:N=35,注意:更新周期仍然是L=20,白噪聲相關(guān)因子仍然是257/256=1.00390625。令表示50階LPC預(yù)測器的傳遞函數(shù),則它有形式(A.3.21)這里是預(yù)測器系數(shù)。為改善信道對誤差的魯棒性,把這些系數(shù)作微小的改動,以便LPC譜的峰值寬度稍微增大。帶寬擴(kuò)張模塊51按下列方法執(zhí)行帶寬擴(kuò)張。已給LPC預(yù)測器系數(shù),一組新的根據(jù)下式得到:(A.3.22)這里(A.3.23)這樣,通過一個的因子,就能把綜合濾波器的所有極點(diǎn)快速地向原點(diǎn)移動。因?yàn)檫@些極點(diǎn)離開了單位圓,頻域響應(yīng)的峰就被加寬了。這樣的帶寬擴(kuò)張以后,變化了的LPC預(yù)測器的傳遞函數(shù)為:(A.3.24)接著,改變的系數(shù)被傳送到綜合濾波器9和22,這些系數(shù)也被傳送到?jīng)_激響應(yīng)矢量計(jì)算器12。綜合濾波器9和22有傳遞函數(shù)為:(A.3.25)類似于感覺加權(quán)濾波器,綜合濾波器9和22也是每4個矢量更新一次,更新也發(fā)生在每4個矢量自適應(yīng)周期的第三個語音矢量,但是,更新正是建立在一個自適應(yīng)周期的量化語音矢量基礎(chǔ)上,或者說,更新發(fā)生前引進(jìn)了兩個矢量的延遲。這是因?yàn)長evinson-Durbin遞推模塊50和能量表計(jì)算器15(后邊介紹)在計(jì)算上過于集中。結(jié)果,雖然以前量化語音的自相關(guān)在每4個矢量周期的第一個矢量是有效的,但計(jì)算可能要求不只一個矢量的時間,因此,為保持一個矢量的基本緩沖體積(為使編碼延遲短),和維持實(shí)時操作,在濾波器更新中,一個2-矢量延遲被引進(jìn),以利于實(shí)時實(shí)現(xiàn)。

3.8后向矢量增益調(diào)節(jié)器這個調(diào)節(jié)器更新激勵增益,n為每個矢量的索引,激勵增益是一個調(diào)節(jié)因子,用于調(diào)節(jié)選擇的激勵矢量y(n)。調(diào)節(jié)器20以增益調(diào)節(jié)的激勵矢量e(n)作為輸入,產(chǎn)生一個激勵增益作為它的輸出?;旧希M趯?shù)增益域用自適應(yīng)線性預(yù)測方法預(yù)測e(n)的增益,e(n)是基于e(n-1),e(n-2),...的。這個后向矢量增益調(diào)節(jié)器20被詳細(xì)地示于圖A.6中。參考圖A.6。這個增益調(diào)節(jié)器操作如下。1–矢量延遲單元67輸入為e(n),輸出為e(n-1),均方根計(jì)算器39計(jì)算這個矢量e(n-1)的RMS值,接著,對數(shù)計(jì)算器40計(jì)算RMS的對數(shù)值,首先計(jì)算以10為底的對數(shù),再把結(jié)果乘以20。在圖A.6中,一個32dB的對數(shù)增益補(bǔ)償值被儲存在對數(shù)增益補(bǔ)償值保持器中,這個值近似等于濁音語音平均激勵增益電平(dB值)。加法器42從對數(shù)增益計(jì)算器40中產(chǎn)生的對數(shù)增益減去這個對數(shù)補(bǔ)償值,得到。這個對數(shù)增益又被用于混合窗模塊43和Levinson-Durbin遞推模塊44。模塊43和44的操作與感覺加權(quán)濾波器調(diào)節(jié)器模塊(圖A.4(a))中的塊36和37的操作完全一樣,只是混合窗參數(shù)不同,而且現(xiàn)在分析的信號是移去偏移的對數(shù)增益而不是輸入語音。(注意對每5個語音樣值只產(chǎn)生一個增益值)。這時混合窗參數(shù)(塊43)是M=10,N=20,L=4和模塊44(Levinson-Durbin遞推模塊)的輸出是一個10階線性預(yù)測器的系數(shù),具有傳遞函數(shù):(A.3.26)接著,帶寬擴(kuò)展模塊45按照與圖A.5的模塊51相類似的方法向z平面的原點(diǎn)快速移動這個多項(xiàng)式的根。結(jié)果,帶寬擴(kuò)展增益預(yù)測器有如下的傳遞函數(shù)(A.3.27)這里系數(shù)用下式計(jì)算:(A.3.28)這個帶寬擴(kuò)展使增益調(diào)節(jié)器(圖A.2中的塊20)對信道誤差更具有魯棒性,這些接著被用作對數(shù)增益線性預(yù)測器(圖A.6中的塊46)的系數(shù)。這個預(yù)測器46每4個語音矢量更新一次,更新出現(xiàn)在每4個矢量自適應(yīng)周期的第二個語音矢量。這個預(yù)測器希望預(yù)測,是基于的一個線性組合。的預(yù)測值被表示成,以下式給出:(A.3.29)從對數(shù)增益線性預(yù)測器46得到后,我們把它加上在塊41中儲存的對數(shù)增益補(bǔ)償值32dB,然后對數(shù)增益限幅器47檢查得出的對數(shù)增益值,如果這個值不合理地大或小,就削去或省略。顯然,最低和最高限幅被設(shè)為0dB和60dB。然后,增益限幅器的輸出被傳遞到反對數(shù)計(jì)算器

48,它是對數(shù)計(jì)算器40的逆操作,把增益從dB值轉(zhuǎn)變?yōu)榫€性值。增益限幅器保證線性域的增益在1~1000之內(nèi)。3.9碼書搜索模塊在圖A.2中塊12到18構(gòu)成一碼書搜索模塊24。這個模塊在激勵矢量碼書19中的1024個候選碼矢量中進(jìn)行搜索,鑒別出一個最好的碼矢量索引,這個碼矢量對應(yīng)于一個與輸入語音矢量最接近的量化語音矢量。為了減少碼書搜索的復(fù)雜性,10bit、1024項(xiàng)的碼書被分解成兩個較小的碼書:一個7bit“波形碼書”含有128個獨(dú)立的碼矢量和一個3bit“增益碼書”包含8個標(biāo)量,這8個值以零為對稱(即1位是符號位,2位是幅度位),最終的輸出碼矢量是最佳波形碼矢量(來自7bit波形碼書)和最佳增益電平(來自3bit增益碼書)的積。7bit碼書表在附件B中給出,3bit增益碼書表也在附件B中給出。3.9.1碼書搜索原理原理上,碼書搜索模塊24通過當(dāng)前的激勵增益來標(biāo)定1024個候選碼矢量中的每一個,然后,讓這1024個結(jié)果一次一個地通過由綜合濾波器F(z)和感覺加權(quán)濾波器W(z)組成的級聯(lián)濾波器。每當(dāng)這個模塊傳送一個新的碼矢量給具有傳遞函數(shù)的級聯(lián)濾波器時,這個濾波器的存儲器都被預(yù)置為0。VQ碼矢量的濾波能用矩陣矢量乘法來表述。令是7bit波形碼書中的第j個碼矢量,是3bit增益碼書中的第i個電平。讓{h(n)}表示并行濾波器的沖激響應(yīng)序列,那么,當(dāng)由碼書下標(biāo)i和j給定的碼矢量被傳送到并行濾波器H(z)時,濾波器輸出可以表示為:(A.3.30)這里,(A.3.31)碼書搜索模塊24搜索下標(biāo)i和j的最佳組合,這種組合使下面的均方誤差最小:(A.3.32)這里,是歸一化的VQ目標(biāo)矢量。展開這些項(xiàng),得到(A.3.33)因?yàn)楹停╪)的值在碼書搜索期間是確定的,所以使D最小就等價于使下式最?。?A.3.34)這里,(A.3.35)并且(A.3.36)注意到實(shí)際上是第j個經(jīng)過濾波的波形碼矢量的能量,不依賴于VQ目標(biāo)矢量。也注意到波形碼矢量是確定的,矩陣H只依賴于綜合濾波器和加權(quán)濾波器,這兩個濾波器在經(jīng)過一個四矢量語音周期后被確定。結(jié)果,經(jīng)過四矢量的一個語音周期后也被確定。以這些結(jié)論為基礎(chǔ),當(dāng)兩個濾波器被更新時,我們能計(jì)算和儲存這128個可能的語音項(xiàng)(對應(yīng)于128個波形碼矢量),然后用這些能量項(xiàng)在下一個四矢量語音周期期間重復(fù)碼書搜索。這種處理減少了碼書搜索的復(fù)雜性。為進(jìn)一步減小計(jì)算量,我們可以先計(jì)算和儲存矩陣和因?yàn)槭枪潭ǖ?,這兩個矩陣也是固定的。我們可以把表示成:這里注意到,一旦、和值被預(yù)先計(jì)算和儲存,只依賴于j的內(nèi)積項(xiàng)就占有中最大的計(jì)算量。因此,碼書搜索方法通過波形碼書的改善,對每個波形碼矢量判別出最佳增益索引。對于一個已給定的波形碼矢量,找到最佳增益索引有以下幾種方法:第一種也是最明顯的方法是計(jì)算出8個可能的值對應(yīng)于8個可能的i值,然后找出對應(yīng)于最小的索引i。但是,對于每個i,這種方法要求2次乘法。第二種方法是首先計(jì)算最佳增益,然后把這個增益在3bit增益碼書中量化成8個增益電平之中的一個。最好的索引是最接近的增益電平的索引。但是這種方法對于128個波形碼矢量中的每一個要求一次除法,而除法很明顯對于使用DSP處理器是很無效的。第三種方法,是對第二種方法稍加修改,對于DSP實(shí)現(xiàn)是有效的。的量化能被看做在和“量化元邊界”(即兩相鄰增益電平的中點(diǎn))間的比較結(jié)果。令是有相同符號的增益電平和的中點(diǎn),那么檢驗(yàn)“?”就等價于檢驗(yàn)“?”。因此,通過利用后者檢驗(yàn),我們能避免除法操作。對每個索引,仍然只要求一次乘法。這就是用在碼書搜索中的方法。增益量化元邊界是固定的,能被預(yù)先計(jì)算和儲存一個表中,對八個增益電平,實(shí)際上只使用六個界限值。一旦最佳下標(biāo)和被鑒別出來,它們被聯(lián)系起來以形成碼書搜索模塊的輸出—唯一的10bit最佳碼書索引。3.9.2碼書搜索模塊的操作根據(jù)已經(jīng)介紹的碼書搜索原理,碼書搜索模塊24的操作在下面描述。參考圖A.2。每當(dāng)綜合濾波器9和感覺加權(quán)濾波器10被更新時,沖激響應(yīng)矢量計(jì)算器12計(jì)算級聯(lián)濾波器F(z)W(z)沖激響應(yīng)的頭5個樣值。為了計(jì)算沖激響應(yīng)矢量,我們首先置級聯(lián)濾波器的存儲器為0,然后用一個輸入序列{1,0,0,0,0}來激勵濾波器。對應(yīng)的5個輸出樣值是,它們組成了期望的沖激響應(yīng)矢量。這個沖激響應(yīng)矢量被計(jì)算后,它將保持為常數(shù)且被用于接著的四個語音矢量的碼書搜索,直到濾波器9和10被再次更新。接著,波形碼矢量卷積模塊14計(jì)算128個矢量,j=0,1,2,…,127?;蛘哒f,它對每個波形碼矢量和沖激響應(yīng)序列做卷積,在這里,卷積只對前5個采樣值有效。然后根據(jù)方程(A.3.36)通過能量表計(jì)算器15計(jì)算128個矢量的能量并儲存,一個矢量的能量定義為每個矢量元素平方值的和。注意到在塊12、14和15中的計(jì)算只是對每四個語音矢量進(jìn)行一次,而在碼書搜索模塊中的其它塊則是對每一個語音矢量執(zhí)行一次。也注意到表的更新與綜合濾波器的系數(shù)更新是同步的。也就是說,新的表將從每個自適應(yīng)周期的第三個語音矢量開始被使用。VQ目標(biāo)矢量歸一化模塊16計(jì)算歸一化增益VQ目標(biāo)矢量。在DSP實(shí)現(xiàn)中,首先計(jì)算是更有效的,然后再用乘以x(n)的每個元素。接著,逆時卷積模塊13計(jì)算矢量。這個操作等價于先把的元素倒序,然后把它與沖激響應(yīng)矢量卷積,最后再把輸出元素的序列顛倒。(因此命名為逆時卷積)。一旦和表被預(yù)先計(jì)算和存儲,矢量p(n)也被計(jì)算出來,那么誤差計(jì)算器17和最佳碼書索引選擇器18一起工作來完成下面有效的碼書搜索算法:預(yù)置為一個比可能最大的值還要大的數(shù)(或者用DSP數(shù)表示系統(tǒng)的最大的可能數(shù));b)設(shè)波形碼書索引j=0;c)計(jì)算內(nèi)積;d)如果,轉(zhuǎn)向步驟h)通過負(fù)增益搜索;否則,繼續(xù)步驟e)通過正增益搜索;e)如果置i=0,轉(zhuǎn)向步驟k);否則繼續(xù)f);f)如果置i=1,轉(zhuǎn)向步驟k);否則繼續(xù)g);g)如果置i=2,轉(zhuǎn)向步驟k);否則置i=3轉(zhuǎn)向k);h)如果置i=4,轉(zhuǎn)向步驟k);否則繼續(xù)i);i)如果置i=5,轉(zhuǎn)向步驟k);否則繼續(xù)j);j)如果置i=6,否則置i=7;k)計(jì)算;l)如果,那么置;m)如果j<127,置j=j+1,轉(zhuǎn)向步驟c);否則繼續(xù)n);n)當(dāng)這個算法執(zhí)行到這里時,全部1024個可能的增益和波形的組合已被搜索完畢。顯然,對增益和波形而言,得出的和是期望的碼書下標(biāo)。輸出最佳碼書索引(10位)是這兩個下標(biāo)的級聯(lián),對應(yīng)的最佳激勵碼矢量是。選擇的10bit碼書索引通過通信信道被發(fā)送到解碼器。3.10仿真解碼器迄今,雖然解碼器已經(jīng)鑒別和傳送了最佳碼矢量,但一些附加的任務(wù)必須在下面的語音矢量的編碼準(zhǔn)備中被執(zhí)行。首先,最佳碼書索引被傳送到激勵VQ碼書以提取對應(yīng)的最佳碼矢量;然后,這個最佳碼矢量被在增益段21中的當(dāng)前激勵增益所調(diào)節(jié),得到的增益調(diào)節(jié)矢量是e(n)=y(n)。這個矢量e(n)然后被送到綜合濾波器22以獲得當(dāng)前量化語音矢量。注意到塊19~23形成一仿真解碼器8。因此,實(shí)際上當(dāng)沒有信道誤差時量化語音矢量是仿真解碼語音矢量。在圖A.2中,后向綜合濾波器調(diào)節(jié)器23需要這個量化語音矢量以更新綜合濾波器系數(shù)。類似地,后向矢量增益調(diào)節(jié)器20需要增益調(diào)節(jié)激勵矢量e(n)以更新對數(shù)增益線性預(yù)測器的系數(shù)。在繼續(xù)對下一個語音矢量進(jìn)行編碼之前的一項(xiàng)任務(wù)是更新綜合濾波器9和感覺加權(quán)濾波器10的存儲器。為完成這項(xiàng)任務(wù),我們先保留濾波器9和10的存儲值,后者是完成零輸入響應(yīng)計(jì)算(在3.5節(jié)中描述)后被保留下來的。然后我們置濾波器9和10的存儲值為零并且合上開關(guān)5。也就是說,把它與結(jié)點(diǎn)7連接起來。接著,增益調(diào)節(jié)激勵矢量e(n)被傳送到兩個濾波器9和10的存儲器。注意到因?yàn)閑(n)只是5個樣值的長度,濾波器有零存儲值,乘加的數(shù)目對5個樣本的周期只從0上升到4,這在計(jì)算量上是一個很大的節(jié)省。因?yàn)槿绻麨V波器存儲值不是零,每個樣本將有70次乘加。然后,我們再把原先保留的存儲內(nèi)容與對e(n)濾波后新建立的濾波器存儲值相加。結(jié)果,這就是把濾波器9和10的零輸入響應(yīng)與零狀態(tài)響應(yīng)相加。這使得濾波器的存儲值按期望設(shè)置,它被用于計(jì)算在下一個語音矢量編碼期間的零輸入響應(yīng)。注意到濾波器存儲值更新后,綜合濾波器9的存儲器的頭5個元素與期望的語音矢量的元素完全相同。因此,實(shí)際上,我們能忽略綜合濾波器22而從綜合濾波器9的更新存儲器值來獲得,這意味著每秒節(jié)省50次乘–加運(yùn)算。到現(xiàn)在為止描述的編碼方法是針對一個單獨(dú)的輸入語音矢量的。整個語音波形的編碼通過對每個語音矢量重復(fù)上面的操作而獲得。3.11同步和帶內(nèi)信號傳送在上述對編碼器的描述中,假定解碼器知道接收的10-bit碼書索引的界限值,也知道什么時候綜合濾波器和對數(shù)增益預(yù)測器需要更新(回憶它們每4個矢量被更新一次)。實(shí)際上,這樣的同步信息通過在16kbit/s位流的頂部加一同步位就可有效。但是,在許多應(yīng)用中,有必要插入同步位或帶內(nèi)傳送信號位成為16kbit/s位流的一部分。這可以按下列方法辦到:認(rèn)為一個同步位每N個語音矢量被插入一次,那么,對每次第N個輸入語音矢量,我們可以只搜索波形碼書的一半而產(chǎn)生一個6bit波形碼書索引。用這種方法,我們每次從第N個傳送的碼書索引中得到1位,插入1個同步位或帶內(nèi)傳送信號位。注意到我們不能從一個已經(jīng)選出的7-bit波形碼書索引中任意得到一位,相反,編碼器必須知道哪一個語音矢量將被去掉一位,然后對于這些語音矢量只搜索一半碼書。否則,解碼器對這些語音矢量將沒有同樣的解碼激勵碼矢量。因?yàn)榫幋a算法有一個四矢量的基本自適應(yīng)周期,讓N是4的倍數(shù)是合理的,以便解碼器能容易地決定編碼自適應(yīng)周期的界限。對一個合理的N值(例如16,對應(yīng)于一個10ms的位擦除周期),在語音質(zhì)量上的降低基本上是可忽略的。特別是,我們發(fā)現(xiàn)N=16的值導(dǎo)致極小的偏差。這個位擦除速率僅是100bit/s。如果上述方法被采用,我們建議當(dāng)期望位是一個0時,波形碼書的前一半被搜索,也就是說,這些矢量具有下標(biāo)0到63。當(dāng)這個期望位是1時,那么,碼書的另一半被搜索,結(jié)果索引值在64到127之間,這種選擇的意義是期望位在碼字的最左邊。因?yàn)?位波形碼矢量先于3位符號和增益碼書,我們進(jìn)一步建議同步位從一個四矢量周期的最后一個矢量獲得。當(dāng)它被檢測的時候,接收的下一個碼字可以開始新的碼矢量周期。雖然,我們陳述了同步能引起極小的誤差,但我們注意到在包含這個同步方法的硬件上進(jìn)行非正式的檢測時,降低的質(zhì)量沒有測量出來。但是,我們特別建議在編碼器被重復(fù)接通和斷開的系統(tǒng)中不要為了同步而用同步位。例如沒有語音出現(xiàn)的一個系統(tǒng)可能用一臺語音活動檢測器來斷開編碼器。每當(dāng)編碼器被接通時,解碼器就需要確定同步序列。按100bit/s算,這可能要花費(fèi)幾百毫秒的時間;另外,從解碼狀態(tài)到跟蹤編碼狀態(tài)也需要時間。兩者時間的結(jié)合將導(dǎo)致一種稱作首尾削波的現(xiàn)象,這種現(xiàn)象是語音的起始點(diǎn)將被丟失。如果編碼器和解碼器在與語音起始時刻相同的時刻動作,那么就沒有語音丟失。要做到這一點(diǎn)唯一的可能是在系統(tǒng)中使用外部信號來確定起始時刻和進(jìn)行外部同步。

4.LD—CELP解碼原理圖A.3是LD—CELP解碼器的框圖,每個框的功能敘述在下面的章節(jié)中給出。4.1激勵VQ碼書這個框含有一個激勵矢量量化碼書(包括波形和增益碼書),它與在LD—CELP編碼器中的碼書19是一致的。它用接收到的最佳碼書索引來提取在LD—CELP編碼器中選擇的最佳碼矢量y(n)。4.2增益調(diào)節(jié)單元這個塊計(jì)算已調(diào)節(jié)的激勵矢量4.3綜合濾波器這個濾波器的傳遞函數(shù)與LD—CELP編碼器中的傳遞函數(shù)是相同的(假設(shè)沒有誤差傳輸)。它對已調(diào)節(jié)的激勵矢量e(n)濾波以產(chǎn)生解碼語音矢量。注意到在解碼期間為了避免任何可能的舍入誤差的積累,有時希望精確地復(fù)制用在編碼器中的方法。如果是這樣,那么若編碼器獲得是從綜合濾波器9的更新存儲中得到的,則解碼器也應(yīng)該把作為綜合濾波器的零輸入響應(yīng)和零狀態(tài)響應(yīng)來計(jì)算,就象在編碼器中那樣。4.4后向矢量增益自適應(yīng)這個塊的功能在3.8節(jié)中描述過。4.5后向綜合濾波器自適應(yīng)這個塊的功能在3.7節(jié)中描述過。4.6后濾波器這個塊對解碼語音進(jìn)行濾波以增強(qiáng)感覺質(zhì)量。這個塊在圖A.7基礎(chǔ)上進(jìn)一步擴(kuò)展以表示出更多的細(xì)節(jié)。參考圖A.7,這個后濾波器主要由三部分組成:長時后濾波器71,短時后濾波器72和輸出增益調(diào)節(jié)單元77。在圖A.7中的其余四個塊剛好是用于計(jì)算輸出增益調(diào)節(jié)單元77中的合適的調(diào)節(jié)因子的。長時后濾波器71,有時叫做基音后濾波器,是一個在將要進(jìn)行后濾波的語音基頻的整數(shù)倍處具有譜峰的梳齒濾波器?;l的倒數(shù)被叫做基音周期?;糁芷诳梢岳没魴z測器從解碼語音中提取。令p是通過基音檢測器獲得的基音周期,那么長時后濾波器的傳遞函數(shù)可以表示為:(A.4.1)在這里系數(shù),b和基音周期p每4個語音矢量更新一次(一個自適應(yīng)周期),實(shí)際的更新發(fā)生在每個自適應(yīng)周期的第三個語音矢量。為方便起見,從現(xiàn)在開始,我們稱一個自適應(yīng)周期為一幀。,b和p的推導(dǎo)將在后邊的4.7節(jié)描述。短時后濾波器72由一個10階零極濾波器和與之級聯(lián)的一個一階全零濾波器組成。10階零極濾波器對共振峰間的頻率部分進(jìn)行衰減,而一階全零濾波器試圖補(bǔ)償10階零極濾波器頻率響應(yīng)中的譜的傾斜。令是通過解碼語音的反向LPC分析而獲得的10階LPC預(yù)測器的系數(shù),是通過同樣的LPC分析而獲得的第一個反射系數(shù)。那么,和k可以通過50階反向LPC分析(圖A.5中的塊50)附帶地得到。我們需要做的事是使50階Levinson-Durbin遞推在10階時停下來,記錄下k1和,然后從11階到50階重新開始Levinson-Durbin遞推。短時后濾波器的傳遞函數(shù)為(A.4.2)這里系數(shù),和也是一幀調(diào)節(jié)一次,但調(diào)節(jié)發(fā)生在每一幀的第一個矢量處(也就是使盡快有效)??傊?,解碼語音通過長時濾波和短時濾波后,濾波語音將不再與未濾波語音有相同的數(shù)量級。為了避免有時有大的增益偏離,有必要使用增益控制來迫使后濾波的語音與未濾波的語音有大致相同的數(shù)量級,這項(xiàng)工作由塊73到塊77來完成。絕對值和計(jì)算器73對逐個矢量進(jìn)行操作,它取當(dāng)前的解碼語音矢量并計(jì)算它的五個語音樣點(diǎn)的絕對值之和。類似地,絕對值和計(jì)算器74執(zhí)行同類型的計(jì)算,但當(dāng)前語音是短時后濾波器的輸出語音矢量sf(n)。然后調(diào)節(jié)因子計(jì)算器75用塊74的輸出值除以塊73的輸出值獲得現(xiàn)行sf(n)矢量的一個調(diào)節(jié)因子。這個調(diào)節(jié)因子隨后通過一個一階低通濾波器76以得到對應(yīng)于sf(n)中的五個元素中每一個獨(dú)立的調(diào)節(jié)因子。一階低通濾波器76的傳遞函數(shù)為:輸出增益調(diào)節(jié)單元77利用低通濾波器的調(diào)節(jié)因子對短時后濾波器的輸出進(jìn)行逐個樣點(diǎn)的更新。注意到因?yàn)檎{(diào)節(jié)因子計(jì)算器75對每個矢量只產(chǎn)生一個調(diào)節(jié)因子,如果沒有低通濾波器,它將對塊77逐個樣點(diǎn)的調(diào)節(jié)操作有一個階梯的影響。低通濾波器76對這樣的階梯波能有效地平滑。4.6.1非語言操作CCITT客觀測試結(jié)果表明:對一些非語音信號,當(dāng)自適應(yīng)后濾波器被關(guān)閉時,這個編碼器的功能被改善,因?yàn)樽赃m應(yīng)后濾波器的輸入是綜合濾波器的輸出,所以這個信號總是有效的。在實(shí)際實(shí)現(xiàn)時,當(dāng)這個開關(guān)被置于使后濾波器無效位置時,這個未濾波的信號也就是輸出。4.7自適應(yīng)后濾波器這一塊一幀一次地計(jì)算和更新后濾波器的系數(shù)。這個自適應(yīng)后濾波器在圖A.8中被詳細(xì)說明。參考圖A.8,10階LPC逆濾波器模塊81和基音周期提取模塊82一起工作以從解碼語音中提取基音周期。實(shí)際上,具有合理功能的基音提取器(不引進(jìn)附加延遲)都可以用在這里。我們在這里描述的只是實(shí)現(xiàn)基音提取的一種可能方法。10階LPC逆濾波器81有如下傳遞函數(shù):在這里系數(shù)是從Levinson-Durbin遞推公式(圖A.5中的塊50)得到的,它在每一幀的第一個矢量處被更新。這個LPC逆濾波器以解碼語音作為它的輸入,產(chǎn)生LPC預(yù)測殘差序列{d(k)}作為它的輸出。我們使用100個樣點(diǎn)的基音分析窗和20到140個樣點(diǎn)的基音周期范圍?;糁芷谔崛∧K82保持一個長的緩沖區(qū)以保留LPC預(yù)測殘差的最后240個樣點(diǎn)。為方便檢索,這240個LPC殘差樣值被標(biāo)以d(-139),d(-138),…,d(100)而儲存在緩沖器里?;糁芷谔崛∧K82一幀一次地提取基音周期,在每幀的第三個矢量基音周期被提取。因此,LPC逆濾波器輸出矢量應(yīng)該以特殊的次序儲存在LPC殘差緩沖器里。對應(yīng)于上一幀的第四個矢量的LPC殘差矢量被儲存為d(81),d(82),d(83),…,d(85),現(xiàn)行幀的第一個LPC殘差矢量被儲存為d(86),d(87),…,d(90),現(xiàn)行幀的第二個LPC矢量被儲存為d(91),d(92),…,d(95),現(xiàn)行幀的第三個LPC殘差矢量被儲存為d(96),d(97),d(98),d(99),d(100)。樣點(diǎn)d(-139),d(-138),…,d(80)只是以現(xiàn)行的時間次序排列的以前的LPC殘差樣值。一旦LPC殘差緩沖區(qū)準(zhǔn)備好,基音周期提取模塊82就以下列方式工作:首先,LPC殘差的最后20個樣值[d(81)~d(100)]通過一個1kHz的三階橢圓低通濾波器(系數(shù)在附錄D中給出),然后按4:1壓縮采樣點(diǎn)數(shù)(也就是用因子4除采樣數(shù)),這形成5個低通濾波的,4:1抽取的LPC殘差樣值,標(biāo)以d(21),d(22),…,d(25)。儲存在壓縮后的LPC殘差緩沖器中,除這5個采樣外,其余55個采樣d(-34),d(-33),…,d(20)通過移動以前幀壓縮抽取后的LPC殘差樣值來獲得。接著,壓縮LPC殘差樣值的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論