版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
語(yǔ)音編碼(speechcoding)√概述√語(yǔ)音信號(hào)壓縮編碼的原理及其評(píng)價(jià)系統(tǒng)√語(yǔ)音信號(hào)的波形編碼√語(yǔ)音信號(hào)的參數(shù)編碼√語(yǔ)音信號(hào)的混合編碼√概述一、編碼(壓縮)的重要性二、編碼速率(信息容量)三、編碼的分類四、已經(jīng)標(biāo)準(zhǔn)化的語(yǔ)音編碼
編碼、傳輸、存儲(chǔ)和譯碼是語(yǔ)音數(shù)字傳輸和數(shù)字存儲(chǔ)的必要過(guò)程。隨著語(yǔ)音通信技術(shù)的發(fā)展,壓縮語(yǔ)音信號(hào)的傳輸帶寬,降低信道的傳輸速率,一直是人們追求的目標(biāo)。語(yǔ)音編碼在實(shí)現(xiàn)這一目標(biāo)的過(guò)程中擔(dān)當(dāng)重要的角色。語(yǔ)音編碼就是使表達(dá)語(yǔ)音信號(hào)的比特?cái)?shù)目最小。一、編碼(壓縮)的重要性數(shù)字傳輸系統(tǒng)模型信源信源編碼信道編碼調(diào)制傳輸通道用戶信源解碼信道解碼解調(diào)噪聲語(yǔ)音編碼應(yīng)用實(shí)例(IP電話)接收器模數(shù)轉(zhuǎn)換壓縮編碼IP封裝網(wǎng)絡(luò)IP解包解碼數(shù)模轉(zhuǎn)換播放器二、編碼速率(信息容量)
用比特/秒(b/s或bps)來(lái)度量,用I表示,有:I=R?fs,R代表每個(gè)語(yǔ)音采樣值編碼所需的比特?cái)?shù);fs是采樣頻率。當(dāng)fs=8kHz,每個(gè)采樣值用8比特位來(lái)編碼,則編碼速率為64kb/s。三、編碼的分類1.波形編碼(waveformcoding):基本原理是在時(shí)間軸上對(duì)模擬話音信號(hào)按照一定的速率來(lái)抽樣,然后將幅度樣本分層量化,并使用代碼來(lái)表示。在接收端將收到的數(shù)字序列經(jīng)過(guò)解碼恢復(fù)到原模擬信號(hào),保持原始語(yǔ)音的波形形狀。話音質(zhì)量高,編碼速率高。如PCM編碼類(a率或u率PCM、ADPCM、ADM),編碼速率為64-16kb/s,語(yǔ)音質(zhì)量好。2.參數(shù)編碼(聲源編碼parametriccoding):
根據(jù)語(yǔ)音信號(hào)產(chǎn)生的數(shù)學(xué)模型,通過(guò)對(duì)語(yǔ)音信號(hào)特征參數(shù)的提取后進(jìn)行編碼(將特征參數(shù)變換成數(shù)字代碼進(jìn)行傳輸)。在接收端將特征參數(shù),結(jié)合數(shù)學(xué)模型,恢復(fù)語(yǔ)音,力圖使重建語(yǔ)音保持盡可能高的可懂度,重建語(yǔ)音信號(hào)的波形同原始語(yǔ)音信號(hào)的波形可能會(huì)有相當(dāng)大的區(qū)別。如線性預(yù)測(cè)(LPC)編碼類。編碼速率低,2.4-1.2kb/s,自然度低,對(duì)環(huán)境噪聲敏感。3.混合編碼(Hybridcoding):
將波形編碼與參數(shù)編碼相結(jié)合,在2.4-1.2kb/s速率上能夠得到高質(zhì)量的合成語(yǔ)音。規(guī)則碼激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)編碼RPE—LPT即為混合編碼技術(shù)?;旌暇幋a包括若干語(yǔ)音特征參量又包括部分波形編碼信息,以達(dá)到波形編碼的高質(zhì)量和參量編碼的低速率的優(yōu)點(diǎn)。四、已經(jīng)標(biāo)準(zhǔn)化的語(yǔ)音編碼
指定組織:國(guó)際電信聯(lián)盟ITU-T,
標(biāo)準(zhǔn)編碼速率(kb/s)算法MOS得分應(yīng)用G.71164u律或a律PCM4.3公用網(wǎng)G.72132ADPCM4.1公用網(wǎng)G.723.15.3ACELP3.2無(wú)線網(wǎng)G.7298CS-ACELP3.8無(wú)線網(wǎng)GSM13RPE-LTP3.9無(wú)線網(wǎng)(5)RPE-LTP:長(zhǎng)時(shí)預(yù)測(cè)的規(guī)則脈沖激勵(lì)的線性預(yù)測(cè)Regular-PulseExcitedLPCwithaLong-TermPredictor(1)ADPCM:自適應(yīng)差分脈沖編碼adaptivedifferencepulsecodemodulation(2)CELP:碼本激勵(lì)線性預(yù)測(cè)(codeexcitedlinearprediction)(3)ACELP:代數(shù)碼本激勵(lì)線性預(yù)測(cè)Algebraic-Code-ExcitedLinear-Prediction(4)CS-ACELP:共軛結(jié)構(gòu)的代數(shù)碼本激勵(lì)線性預(yù)測(cè)ConjugateStructureAlgebraic-Code-ExcitedLinear-Prediction√語(yǔ)音信號(hào)壓縮編碼的原理及其評(píng)價(jià)系統(tǒng)一、語(yǔ)音壓縮的基本依據(jù)二、語(yǔ)音編碼的關(guān)鍵技術(shù)三、語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法一、語(yǔ)音壓縮的基本依據(jù)
是語(yǔ)音信號(hào)的冗余度和人的聽(tīng)覺(jué)感知機(jī)理。1.存在的時(shí)域冗余度:(1)幅度非均勻分布(2)語(yǔ)音信號(hào)樣本間的相關(guān)性很強(qiáng)(3)濁音具有準(zhǔn)周期(4)聲道的形狀及其變化緩慢(5)語(yǔ)音間隙(靜止系數(shù))2.存在的頻域冗余度:(1)非均勻的長(zhǎng)時(shí)功率譜密度(2)短時(shí)功率譜密度女聲英文a的功率譜3.人的聽(tīng)覺(jué)感知機(jī)理(1)人類的聽(tīng)覺(jué)特性具有掩蔽效應(yīng)(2)人耳對(duì)不同頻段聲音的敏感程度不同(3)人耳對(duì)語(yǔ)音相位不敏感4.語(yǔ)音編碼的極限速率語(yǔ)音中最基本的元素是音素,大約有128~256個(gè),如果按通常的說(shuō)話速度,每秒平均發(fā)出10個(gè)音素,則信息率為:I=[log2(256)10]bps=80bps把發(fā)音看成是以語(yǔ)音速率來(lái)傳送,則語(yǔ)音編碼的極限速率為80bps,從數(shù)字化標(biāo)準(zhǔn)的編碼速率64kbps,到極限速率80bps,之間的距離,對(duì)于理論研究和實(shí)踐有著極大的吸引力。二、語(yǔ)音編碼的關(guān)鍵技術(shù)語(yǔ)音信號(hào)中存在兩種類型的相關(guān)性:(1)樣點(diǎn)間的短時(shí)相關(guān)性(2)相鄰基音周期之間的長(zhǎng)時(shí)相關(guān)性e(n)x(n)短時(shí)預(yù)測(cè)濾波器語(yǔ)音信號(hào)的短時(shí)預(yù)測(cè)模型
D為基音周期,長(zhǎng)時(shí)預(yù)測(cè)系數(shù){bi}的個(gè)數(shù)取1(q=r=0)或3(q=r=1)。D、{bi}從語(yǔ)音信號(hào)中直接提取。語(yǔ)音信號(hào)通過(guò)長(zhǎng)時(shí)預(yù)測(cè),得出基音周期、增益(振幅大?。?。2.語(yǔ)音信號(hào)的長(zhǎng)時(shí)預(yù)測(cè)
長(zhǎng)時(shí)線性預(yù)測(cè)x(n-p),x(n-p+1),….x(n-1)x(n)長(zhǎng)時(shí)預(yù)測(cè)濾波器x(n)e(n)激勵(lì)發(fā)生器完整的語(yǔ)音信號(hào)的預(yù)測(cè)模型3.感覺(jué)加權(quán)濾波器
由于掩蔽效應(yīng),在語(yǔ)音頻譜中,能量較高的頻段(共振峰處)的噪聲相對(duì)于能量較低的頻段的噪聲不易被感覺(jué)。在度量原始語(yǔ)音和合成語(yǔ)音之間的誤差時(shí),在高能量段允許誤差大,因此引入一個(gè)頻域的感覺(jué)加權(quán)濾波器W(z)來(lái)衡量語(yǔ)音之間的誤差。加權(quán)因子在0~1之間,控制共振峰區(qū)域的誤差增加。輸入語(yǔ)音x(n)線性預(yù)測(cè)分析感覺(jué)加權(quán)濾波器后繼處理三、語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法1.語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)(1)編碼速率(2)編碼器的頑健性(3)編碼器的時(shí)延(4)算法的復(fù)雜度和可擴(kuò)展性編碼延時(shí)
一般地,編解碼算法越復(fù)雜,延時(shí)越大,會(huì)明顯感覺(jué)到通話對(duì)方反映“遲鈍”,甚至造成正常通信困難。另外一方面,延時(shí)造成回聲,傳統(tǒng)的電話系統(tǒng)中,在2-4線的轉(zhuǎn)換處(混合線圈)因阻抗不匹配,導(dǎo)致接收者的收話音信號(hào)泄露到其發(fā)送路徑上,返回給發(fā)送者,形成了回聲。當(dāng)延時(shí)小時(shí),回聲同房間交混,因此感覺(jué)不到;當(dāng)延遲超過(guò)了25ms,能明顯感覺(jué)到,從而嚴(yán)重影響通信。一般地,要求編解碼延時(shí)不超過(guò)5-10ms。A端的信號(hào)+B端經(jīng)混合線圈的回傳信號(hào)B端的信號(hào)+A端經(jīng)混合線圈的回傳信號(hào)A端B端2.語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法
語(yǔ)音質(zhì)量是衡量語(yǔ)音編碼算法優(yōu)劣的關(guān)鍵性能之一。語(yǔ)音質(zhì)量通常分為四類:(1)廣播級(jí)(2)網(wǎng)絡(luò)或電話級(jí)(3)通信級(jí)(4)合成級(jí)
語(yǔ)音質(zhì)量有主觀和客觀兩種評(píng)價(jià)方法。
評(píng)價(jià)指標(biāo):清晰度或可懂度、音質(zhì)。前者是指語(yǔ)音是否容易聽(tīng)清楚;后者指語(yǔ)音聽(tīng)起來(lái)有多自然。(1)可懂度評(píng)價(jià)DRT:DiagnosticRhymerTest(2)音質(zhì)評(píng)價(jià):MOS:MeanOpinionScore平均意見(jiàn)得分和DAM:DiagnosticAcceptabilityMeasure判斷滿意度得分。主觀評(píng)價(jià)方法
MOS得分為五級(jí):優(yōu)、良、可、差和壞。滿分為5分,相當(dāng)調(diào)頻廣播質(zhì)量;4分以上是長(zhǎng)途電話網(wǎng)標(biāo)準(zhǔn);3.5分為通信標(biāo)準(zhǔn);3.0分仍有較好的可懂度,保持自然度;2.5分只維持可懂度,是戰(zhàn)術(shù)通信標(biāo)準(zhǔn)。(1)波形失真度,用信噪比來(lái)度量(2)頻譜失真測(cè)量(3)譜包絡(luò)失真測(cè)量客觀評(píng)價(jià)方法語(yǔ)音信號(hào)的波形編碼一、非均勻量化的PCM編碼二、增量調(diào)制編碼三、自適應(yīng)增量調(diào)制編碼四、自適應(yīng)差分脈沖編碼ADPCM五、自適應(yīng)預(yù)測(cè)器六、自適應(yīng)量化器七、ADPCM的總結(jié)
均勻量化時(shí),無(wú)論大的輸入信號(hào)還是小的輸入信號(hào)一律采用相同的量化間隔,為了適應(yīng)大的輸入信號(hào),同時(shí)又要滿足精度要求,就需要增加樣本的位數(shù)。=2V/L=2V/2R,但是對(duì)話音信號(hào)來(lái)說(shuō),大信號(hào)出現(xiàn)的機(jī)會(huì)并不多,增加的樣本數(shù)就沒(méi)有充分利用。因此采用非均勻量化。一、非均勻量化的PCM編碼其基本思想是:大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔。在滿足精度要求的情況下用較少的位數(shù)來(lái)表示。譯碼時(shí),采用相同的規(guī)則。也可視為將信號(hào)進(jìn)行非線性變換后再作均勻量化,如對(duì)信號(hào)進(jìn)行對(duì)數(shù)壓縮,微弱的信號(hào)被放大,強(qiáng)的信號(hào)被壓縮。譯碼時(shí),指數(shù)擴(kuò)張。非線性壓縮均勻量化編碼xa(nT)解碼非線性擴(kuò)張x'(nT)
現(xiàn)在的非均勻量化中,一般采用兩種壓縮擴(kuò)張非均勻量化方法。采樣后信號(hào)幅度和量化數(shù)據(jù)之間有兩種對(duì)應(yīng)關(guān)系,一種稱為u律壓擴(kuò)(companding)算法,另一種稱為A律壓擴(kuò)算法。u律壓擴(kuò)主要用于北美和日本等地區(qū)的電話通信中。A律壓擴(kuò)主要用在歐洲和中國(guó)的地區(qū)的電話通信中。u律壓擴(kuò)(1)輸入xa(nT)的范圍歸一化為(-1~+1);(2)輸出FA(x(n))的范圍為(-1~+1);(3)A為壓擴(kuò)參數(shù),它反映最大量化間隔和最小量化間隔的比值。A=87.56A律壓擴(kuò)我國(guó)的PCM30/32路基群也采用A律13折線壓縮特性。μ律15折線主要用于美國(guó)、加拿大和日本等國(guó)的PCM24路基群中。CCITT建議G.711規(guī)定上述兩種折線近似壓縮律為國(guó)際標(biāo)準(zhǔn),且在國(guó)際間數(shù)字系統(tǒng)相互連接時(shí),要以A律為標(biāo)準(zhǔn)。因此這里重點(diǎn)介紹A律13折線。
FA(x)01116181321412164112817/86/85/84/83/82/81/8xa(nT)A律壓擴(kuò)編碼采用8位二進(jìn)制編碼:C7C6C5C4C3C2C1C0C7:表示信號(hào)的極性,稱為極性碼。0為正,1為負(fù)。C3C2C1C0:表示每一段落的16個(gè)均勻劃分的量化級(jí),稱為段內(nèi)碼。
0000000100100011010001010110011110001001101010111100110111101111C6C5C4:表示段落序號(hào),稱為段落碼。
000001010011100101110111對(duì)輸入動(dòng)態(tài)范圍為(-5v,+5v),用A律壓擴(kuò)編碼,有:1/1280.0390625v7654321015v1/22.5v1/41.25v1/80.625v1/160.3125v1/320.15625v1/640.078125v00v輸入信號(hào)為1.05v,則編碼為:極性碼:0段落碼:101段內(nèi)碼:=(1.25-0.625)/16=0.0390625(1.05-0.625)/=10.88取整數(shù)10,對(duì)應(yīng)第10量化間隔,編碼為1010最后完整的碼字為:01011010
I=8kHz*8bit=64kbit/s實(shí)際中,麥克風(fēng)采集信號(hào),量化為12/13/14/15/16位的輸入信號(hào),使用A律壓擴(kuò)編碼,每個(gè)樣本的量化位為8。
A律壓擴(kuò)編碼的速率:對(duì)輸入信號(hào)范圍(-1,1):A律壓擴(kuò)編碼的最小量階為
min=(1/128)/16=1/2048;在同樣的輸入信號(hào)范圍,均勻量化的線性PCM以A律壓擴(kuò)編碼的最小量階為量階進(jìn)行量化,得到線性PCM需要12比特編碼;
=2V/L=2V/2R=2/2R=1/20482R=2*2048R=12
A律壓擴(kuò)編碼則只需要8個(gè)比特位。A律壓擴(kuò)編碼與線性PCM編碼的對(duì)比A律壓擴(kuò)編碼與其他線性PCM編碼的快速轉(zhuǎn)換線性PCM(13bits,b12為符號(hào)位)b12b11b10b9b8b7b6b5b4b3b2b1b0A律壓擴(kuò)編碼M7=b12M7M6M5M4M3M2M1M0
0000000
abcd1
000
abcd
000000
1abcd100
1abcd
00000
1abcd1×0
10abcd
0000
1abcd1××
0
11abcd
000
1abcd1×××
100abcd
00
1abcd1××××101abcd
0
1abcd1×××××110abcd1abcd1××××××111abcd時(shí)分復(fù)用TimeDivisionMultiplexing原理:把時(shí)間分割成小的時(shí)間片,每個(gè)時(shí)間片分為若干個(gè)通道(時(shí)隙),每個(gè)用戶占用一個(gè)通道傳輸數(shù)據(jù)。
A2A1A3原始信號(hào)D2D1D3數(shù)字化信號(hào)MUX復(fù)用后數(shù)據(jù)時(shí)隙1234D3D2D1適用于數(shù)字信號(hào)傳輸
時(shí)間片復(fù)用概念:利用不同時(shí)隙在同一信道上同時(shí)傳輸各路不同信號(hào),且互不干擾,這就是時(shí)分復(fù)用(TDM)。(a)第1路;(b)第2路;(c)第3路;(d)3路合成的波形PCM30/32路介紹
1.基本特性話路數(shù)目:30抽樣頻率:8kHz壓擴(kuò)特性:A=87.6/13折線壓擴(kuò)律,編碼位數(shù)為8每幀時(shí)隙數(shù):32總數(shù)碼率:8×32×8000=2048kb/s
2時(shí)隙分配:在PCM30/32路的制式中,抽樣周期為1/8000=125μs,它被稱為一個(gè)幀周期,即125μs為一幀。一幀內(nèi)要時(shí)分復(fù)用32路,每路占用的時(shí)隙為125/32=3.9μs,稱為一個(gè)時(shí)隙。因此一幀有32個(gè)時(shí)隙,按順序編號(hào)為TS0、TS1、……、TS31。時(shí)隙的使用分配為:①TS1~TS15,TS17~
TS31為30個(gè)話路時(shí)隙;②TS0為幀同步碼,監(jiān)視碼時(shí)隙;③TS16為信令(振鈴、占線、摘機(jī)……等各種標(biāo)志信號(hào))時(shí)隙。E1-幀格式0121631125ms=32時(shí)隙=2.048Mbps幀同步信令信道30路話音數(shù)據(jù)信道+2路控制信道
話路比特的安排:每個(gè)話路時(shí)隙內(nèi)要將樣值編為8位二元碼,每個(gè)碼元占3.9μs/8=488ns復(fù)接等級(jí)和速率系列
二、增量調(diào)制編碼
1.增量調(diào)制的定義:
增量調(diào)制(DM)也稱為調(diào)制,是對(duì)輸入樣本s(k)和預(yù)測(cè)樣本值se(k)的差值d(k)量化的最簡(jiǎn)單的一種情況,只有兩種編碼輸出:0或1。一般情況下,如果差值大于0,則編碼為“0”,若差值小于0,則編碼為“1”。由于增量編碼只須用1位對(duì)語(yǔ)音信號(hào)進(jìn)行編碼,所以對(duì)增量調(diào)制編碼系統(tǒng)稱為“1位系統(tǒng)”。
2.增量調(diào)制(DM)的結(jié)構(gòu)se(k)-DM發(fā)送端s(k)+量化器預(yù)測(cè)器I(k)sr(k)++編碼Δd(k)s(k)輸入樣本se(k)預(yù)測(cè)樣本值d(k)差值sr(k)重建樣本值I(k)已量化的差值3.增量調(diào)制(DM)的編碼預(yù)測(cè)器采取簡(jiǎn)單的一階固定預(yù)測(cè)器。se(k)=asr(k-1)a為一個(gè)常數(shù),一般情況下取,即a=1。用重建信號(hào)的前一時(shí)刻來(lái)預(yù)測(cè)當(dāng)前時(shí)刻的預(yù)測(cè)樣本值。se(k)=sr(k-1)sr(k)=se(k)+I(k)=sr(k-1)+I(k)d(k)=s(k)-se(k)I(k)=Q[d(k)]=±Δd(k)I(k)Δ-Δ01se(k)=sr(k-1)se(k)=sr(k-1)d(k)=s(k)-se(k)>0d(k)=s(k)-se(k)<0I(k)=Q[d(k)]=+ΔI(k)=Q[d(k)]=-Δsr(k)=se(k)+I(k)sr(k)=se(k)+I(k)碼字為0碼字為1s(k)Δsr(0)se(1)sr(1)se(2)00sr(2)0001111011010104.增量調(diào)制(DM)的譯碼預(yù)測(cè)器I(k)sr(k)++譯碼Δse(k)se(k)=sr(k-1)sr(k)=se(k)+I(k)I(k)=±Δ5.量階固定的增量調(diào)制(線性增量調(diào)制LDM)的缺點(diǎn)(1)當(dāng)輸入信號(hào)變化快,用固定的量階量化,可能造成量化波形跟不上實(shí)際波形,這種現(xiàn)象稱為“斜率過(guò)載”。0000(2)當(dāng)輸入信號(hào)波形較平坦時(shí),編碼為0和1的交替序列,類似隨機(jī)噪聲的特性,這種現(xiàn)象稱為“顆粒噪聲”。101010三、自適應(yīng)增量調(diào)制編碼
采用自適應(yīng)的方法使量階的大小隨輸入信號(hào)的統(tǒng)計(jì)特性變化。一般都采用后向量化,由量化器輸出來(lái)自適應(yīng)地調(diào)整量階。通過(guò)推導(dǎo)有:
I(k)=Δ(k)=MΔ(k-1)M是關(guān)于碼字c(n)的函數(shù),有如下表達(dá)式:M=P>1若c(n)=c(n-1)M=Q<1若c(n)≠c(n-1)P=2若c(n)=c(n-1)Q=1/2若c(n)≠c(n-1)s(k)sr(0)se(1)sr(1)se(2)00sr(2)001101100110100Δ(k)=MΔ(k-1)
另一種調(diào)整量階方法是:如果碼字中連續(xù)出現(xiàn)三個(gè)相同的值,量階就加上一個(gè)大的增量,反之,就加一個(gè)小的增量。這種方法稱為連續(xù)可變斜率增量調(diào)制(CVSD)。Motorola公司的集成電路芯片,如MC3417/MC3517、MC3418/MC3518,采用了CVSD,前者檢測(cè)3位,后者檢測(cè)4位連續(xù)的編碼。
在PCM中,每個(gè)波形樣值都獨(dú)立編碼,與其他樣值無(wú)關(guān),這樣,樣值的整個(gè)幅值編碼需要較多位數(shù),比特率較高,造成數(shù)字化的信號(hào)帶寬大大增加。
然而,大多數(shù)以奈奎斯特或更高速率抽樣的信源信號(hào)在相鄰抽樣間表現(xiàn)出很強(qiáng)的相關(guān)性,有很大的冗余度。利用信源的這種相關(guān)性,一種比較簡(jiǎn)單的解決方法是對(duì)相鄰樣值的差值而不是樣值本身進(jìn)行編碼。編碼位數(shù)顯著減少,信號(hào)帶寬大大壓縮。這種利用差值的PCM編碼稱為差分PCM(DPCM)。如果將樣值之差仍用N位編碼傳送,則DPCM的量化信噪比顯然優(yōu)于PCM系統(tǒng)。四、自適應(yīng)差分脈沖編碼ADPCM
對(duì)于長(zhǎng)途傳輸系統(tǒng),64kb/s的速率占用的頻帶太寬,通信的費(fèi)用昂貴,因此人們尋找能夠在更低的速率上獲得高質(zhì)量語(yǔ)音編碼的方法,由此提出了G.72132kb/sADPCMAdaptiveDifferencePulseCodeModulation編碼標(biāo)準(zhǔn),利用語(yǔ)音信號(hào)樣點(diǎn)的相關(guān)性和非平穩(wěn)特點(diǎn),使用了自適應(yīng)預(yù)測(cè)和自適應(yīng)量化。1.ADPCM的基本思想
利用樣本(采樣值)與樣本之間的冗余信息進(jìn)行編碼。對(duì)實(shí)際樣本值與預(yù)測(cè)樣本值之差進(jìn)行量化編碼,從而減少了每個(gè)樣本信號(hào)的位數(shù)。ADPCM包括兩部分的功能:APCM和DPCM。APCM主要改變量化間隔;DPCM主要得到預(yù)測(cè)樣本和差值。
運(yùn)用自適應(yīng)的思想,用過(guò)去的樣本值估算下一個(gè)輸入樣本的值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。這部分功能稱為DPCM。2.DPCM量化器自適應(yīng)預(yù)測(cè)器逆量化器s(k)+se(k)-d(k)I(k)sr(k)+dq(k)+編碼DPCM發(fā)送端s(k)輸入樣本se(k)預(yù)測(cè)樣本值d(k)差值sr(k)重建樣本值dq(k)重建差值I(k)已量化的差值產(chǎn)生誤差產(chǎn)生誤差
e1(n)和e2(n)是量化器和逆量化器的量化噪聲。一般情況下,e1(n)和e2(n)的瞬時(shí)值不等,在忽略量化噪聲的情況下,d(k)=I(k)-e1(n)dq(k)=I(k)-e2(n)dq(k)≈d(k)d(k)=s(k)-se(k)sr(k)=se(k)+dq(k)≈se(k)+d(k)=se(k)+s(k)-se(k)=s(k)逆量化器自適應(yīng)預(yù)測(cè)器I(k)dq(k)sr(k)DPCM接收端+se(k)
+
發(fā)送端和接收端采用相同的預(yù)測(cè)器,進(jìn)行信號(hào)的重建。發(fā)送端和接收端中除了I(k)是數(shù)字信號(hào),其余信號(hào)均為時(shí)間離散,幅度未量化的物理量。sr(k)=se(k)+dq(k)差值量化系統(tǒng)的信噪比為:
要使SNR增大,可用增大SNRQ和
GP來(lái)達(dá)到。
(1)SNRQ為量化器的信噪比,取決于量化器的性質(zhì),一般采用自適應(yīng)量化和非均勻量化可使其增大。(2)GP為差值結(jié)構(gòu)產(chǎn)生的增益,對(duì)于給定的語(yǔ)音信號(hào),δs2是固定的,只有減小δd2,DPCM采用自適應(yīng)預(yù)測(cè)的思想使δd2最小的方法增大SNR。3.APCM
利用自適應(yīng)的思想改變量化間隔(量階)的大小,即用小的量化間隔去編碼小的差值,使用大的的量化間隔去編碼大的差值,這部分功能稱為APCM。量化器量階自適應(yīng)d(k)I(k)量階Δ(k)APCM發(fā)送端逆量化器量階自適應(yīng)I(k)dq(k)Δ(k)APCM接收端4.ADPCM的簡(jiǎn)單框圖
ADPCM編碼結(jié)合了APCM和DPCM兩者的特性,量化器和預(yù)測(cè)器均是自適應(yīng)。將I(k),已量化的樣值編碼為4個(gè)比特,編碼速率為32kb/s。s(k)+d(k)量化器自適應(yīng)預(yù)測(cè)器逆量化器se(k)-
I(k)sr(k)+
dq(k)+編碼發(fā)送端量階自適應(yīng)Δ(k)ADPCM接收端逆量化器自適應(yīng)預(yù)測(cè)器I(k)dq(k)sr(k)++se(k)量階自適應(yīng)發(fā)送端輸入樣本:s(k)=se(k)+d(k)接收端輸出重建樣本值:sr(k)=se(k)+dq(k)歸一化輸入差值dln(k)=log2|d(k)|-log2(k)量化電平(I(k)對(duì)應(yīng)的碼字)歸一化量化輸出In(k)=log2|I(k)|-log2(k)[3.16+∞]73.34[2.783.16]62.95[2.422.78]52.59[2.042.42]42.23[1.582.04]31.81[0.961.58]21.29[-0.050.96]10.53[-∞-0.05]0-1.05ADPCM的總結(jié)1.編碼方式
當(dāng)d(k)的符號(hào)為正,則編碼的碼字最高位b3為0;當(dāng)d(k)的符號(hào)為負(fù),則編碼的碼字最高位b3為1。碼字的b2b1b0由表中碼字決定。例如:一個(gè)負(fù)的d(k)值,歸一化后落在[3.16+∞],則編碼為1111,歸一化量化輸出為-3.34;若一個(gè)正的d(k)值,歸一化后落在[3.16,+∞],則編碼為0111,歸一化量化輸出為3.34。量化器逆量化器s(k)+-se(k)d(k)I(k)dq(k)++編碼sr(k)量階自適應(yīng)++Δ(k)ADPCM發(fā)送端2.ADPCM發(fā)送端工作過(guò)程:
輸入樣本s(k),與預(yù)測(cè)樣本值se(k)相減后產(chǎn)生差值d(k),對(duì)d(k)進(jìn)行自適應(yīng)量化,對(duì)量化器輸出I(k)進(jìn)行4個(gè)比特位的編碼。(1)碼字送給接收端的解碼器;(2)對(duì)其進(jìn)行本地解碼,進(jìn)行逆量化,得到差值信號(hào)dq(k),與預(yù)測(cè)信號(hào)se(k)相加得到本地重建信號(hào)sr(k),利用sr(k)、dq(k),對(duì)下一時(shí)刻輸入的s(k+1)進(jìn)行自適應(yīng)預(yù)測(cè),得到se(k+1)。自適應(yīng)預(yù)測(cè)器采用六階零點(diǎn)和二階極點(diǎn)。逆量化器I(k)dq(k)sr(k)+se(k)+++量階自適應(yīng)Δ(k)ADPCM接收端3.ADPCM接收端工作過(guò)程:
將接收的碼字進(jìn)行解碼,進(jìn)行逆量化,得到重建差值信號(hào)dq(k),與預(yù)測(cè)信號(hào)se(k)相加得到重建信號(hào)sr(k),利用sr(k)、dq(k)進(jìn)行自適應(yīng)預(yù)測(cè),得到se(k+1)。自適應(yīng)預(yù)測(cè)器和自適應(yīng)量化器采用發(fā)送端的同樣的對(duì)應(yīng)結(jié)構(gòu)和算法。根據(jù)碼字,查表得到編碼所對(duì)應(yīng)的In(k),一般地,In(k)≈dlqn(k)(歸一化重建差值)利用:dlqn(k)=In(k)=log2|dq(k)|-log2(k)log2|dq(k)|=In(k)+log2(k)
log2|dq(k)|的反對(duì)數(shù)變換就是dq(k),其符號(hào)由d(k)與一致。由接收的碼字決定。
逆量化過(guò)程:子帶-自適應(yīng)差分脈沖編碼調(diào)制
語(yǔ)音信號(hào)的參數(shù)編碼一、參數(shù)編碼的特點(diǎn)二、LPC-10編碼器低速率語(yǔ)音編碼的應(yīng)用:蜂窩移動(dòng)電臺(tái)網(wǎng);衛(wèi)星通訊;短波保密通信;
ISDN(IntegratedServiceDigitalNetwork);“語(yǔ)音郵件”、“語(yǔ)音存儲(chǔ)”等新型通信業(yè)務(wù)。一、參數(shù)編碼的特點(diǎn)
由于參數(shù)編碼是針對(duì)語(yǔ)音信號(hào)的特征參數(shù),所以與波形編碼不同,只是適用于語(yǔ)音信號(hào)。
常用的編碼器為線性預(yù)測(cè)編碼器。時(shí)間(樣點(diǎn))x(n)x(n-1)x(n-p)p個(gè)點(diǎn)線性預(yù)測(cè):LPC語(yǔ)音合成圖清/濁開(kāi)關(guān)聲道模擬濾波器基音周期脈沖序列發(fā)生器隨機(jī)噪聲發(fā)生器LPC系數(shù)增益Gu(n)輸出語(yǔ)音s(n)清音/濁音示意圖:a1語(yǔ)音輸出x’(n)線性預(yù)測(cè)分析基音頻率清/濁音判別參數(shù)合成a2ap基音頻率輸入語(yǔ)音x(n)清/濁音標(biāo)志G二、LPC-10編碼器
美國(guó)確定LPC-10作為2.4kb/s速率上的推薦編碼形式,用于第三代保密電話中。在其發(fā)送端,原始語(yǔ)音信號(hào)采用8kHz采樣,然后每180個(gè)采樣值分為一幀(22.5ms),提取語(yǔ)音特征參數(shù)并加以編碼傳送。每幀總共編碼為54bits,每秒傳輸44.4幀,因此總傳輸速率為2.4kb/s。s(n)采樣(8kHz)基音檢測(cè)(AMDF)清/濁音檢測(cè)預(yù)加重線性預(yù)測(cè)分析反射系數(shù)增益G參數(shù)編碼c(n)LPC-10編碼器發(fā)送端預(yù)加重:提高語(yǔ)音譜中的高頻共振峰,使得語(yǔ)音的頻譜較為平滑。短時(shí)平均幅度差函數(shù)(AMDF)c(n)解碼清/濁音開(kāi)關(guān)反射系數(shù)轉(zhuǎn)換為預(yù)測(cè)系數(shù)基音增益G合成器去加重噪聲產(chǎn)生s'(n)
LPC-10編碼器接收端語(yǔ)音信號(hào)的混合編碼一、混合編碼的特點(diǎn)二、CELP的編碼原理三、RPE-LPT編碼原理一、混合編碼的特點(diǎn)
混合編碼同參數(shù)編碼一樣,依據(jù)語(yǔ)音的線性預(yù)測(cè)模型,使用了與波形編碼相匹配的技術(shù),達(dá)到低速率上的高質(zhì)量的語(yǔ)音編碼。目前以CELP為基礎(chǔ)的多種算法已經(jīng)成為國(guó)際標(biāo)準(zhǔn)。二、CELP(CodeExcitedLinearPrediction)編碼原理
采用矢量量化技術(shù),對(duì)激勵(lì)信號(hào)進(jìn)行訓(xùn)練得到一個(gè)碼本,每幀語(yǔ)音信號(hào)從碼本中選出一個(gè)在感覺(jué)加權(quán)誤差最小意義上的最佳碼矢量作為激勵(lì)源。Hl(z)e(n)x(n)
CELP是近10年來(lái)最成功的語(yǔ)音編碼算法。CELP語(yǔ)音編碼算法用線性預(yù)測(cè)提取聲道參數(shù),用一個(gè)包含許多典型的激勵(lì)矢量的碼本作為激勵(lì)參數(shù),每次編碼時(shí)都在這個(gè)碼本中搜索一個(gè)最佳的激勵(lì)矢量,這個(gè)激勵(lì)矢量的編碼值就是這個(gè)序列的碼本中的序號(hào)。CELP已經(jīng)被許多語(yǔ)音編碼標(biāo)準(zhǔn)所采用,美國(guó)聯(lián)邦標(biāo)準(zhǔn)FS1016就是采用CELP的編碼方法,主要用于高質(zhì)量的窄帶語(yǔ)音保密通信。
其基本原理是用一個(gè)自適應(yīng)碼本中的碼字來(lái)逼近語(yǔ)音的長(zhǎng)時(shí)周期性結(jié)構(gòu),用一個(gè)固定隨機(jī)碼本中的碼字來(lái)逼近語(yǔ)音經(jīng)過(guò)短時(shí)和長(zhǎng)時(shí)預(yù)測(cè)后的余量信號(hào),從兩個(gè)碼本中搜索出來(lái)的最佳矢量乘以各自的最佳增益后相加,其和即為CELP激勵(lì)信號(hào)源。
將激勵(lì)信號(hào)輸入P階LP綜合濾波器1/A(Z),得到合成語(yǔ)音信號(hào),它與原始語(yǔ)音信號(hào)s(n)的誤差經(jīng)過(guò)感覺(jué)加權(quán)濾波器W(z),得到感覺(jué)加權(quán)誤差es(n)。CELP就是利用es(n)的最小平方預(yù)測(cè)誤差作為搜索最佳碼矢量及其增益的度量準(zhǔn)則。由于這種算法能最好地逼近原始語(yǔ)音,語(yǔ)音質(zhì)量較好,所以它優(yōu)于脈沖激勵(lì)線性預(yù)測(cè)。CELP語(yǔ)音編碼示意圖s(n)es(n)2550隨機(jī)碼本W(wǎng)(z)誤差最小化原始語(yǔ)音s(n)+-5110自適應(yīng)碼本線性預(yù)測(cè)濾波器g1ga++感覺(jué)加權(quán)濾波器感覺(jué)加權(quán)濾波器
由于掩蔽效應(yīng),在語(yǔ)音頻譜中,能量較高的頻段(共振峰處)的噪聲相對(duì)于能量較低的頻段的噪聲不易被感覺(jué)。在度量原始語(yǔ)音和合成語(yǔ)音之間的誤差時(shí),在高能量段允許誤差大,因此引入一個(gè)頻域的感覺(jué)加權(quán)濾波器W(z)來(lái)衡量語(yǔ)音之間的誤差。加權(quán)因子在0~1之間,控制共振峰區(qū)域的誤差增加。
CELP有參數(shù)編碼的特征,另一方面在感覺(jué)加權(quán)均方誤差最小時(shí),實(shí)際上是做了波形的最佳匹配,有波形編碼的特征,所以CELP又被稱為混合編碼。CELP語(yǔ)音編碼的特點(diǎn)
以碼本激勵(lì)線性預(yù)測(cè)(CELP)原理為基礎(chǔ)的G.729、G.723(G.723.1)話音壓縮編碼技術(shù),是IP電話技術(shù)的一個(gè)重要組成部分。以G.729為例,它可將經(jīng)過(guò)采樣的64kb/s話音以幾乎不失真的質(zhì)量壓縮至8kb/s。CELP語(yǔ)音編碼的應(yīng)用CELP
原始語(yǔ)音ComparisonAlgorithmBitRateComplexityDelayMeanOpinionScorePCM64Kb/s>1Mips.25ms4.4G.7298Kb/s20Mips10ms4.2ITU-TG.7298kb/sCS—ACELP簡(jiǎn)介
G.729是由美國(guó)、法國(guó)、日本和加拿大的幾家著名國(guó)際電信實(shí)體聯(lián)合開(kāi)發(fā)的。它需要符合一些嚴(yán)格的要求,比如在良好的信道條件下要達(dá)到長(zhǎng)話質(zhì)量,在有隨機(jī)比特誤碼、發(fā)生幀丟失和多次轉(zhuǎn)接等情況下要有很好的穩(wěn)健性等。這種語(yǔ)音壓縮算法可以應(yīng)用在很廣泛的領(lǐng)域中,包括IP電話、無(wú)線通信、數(shù)字衛(wèi)星系統(tǒng)和數(shù)字專用線路。
G.729算法采用“共軛結(jié)構(gòu)代數(shù)碼本激勵(lì)線性預(yù)測(cè)編碼方案”(CS-ACELP)算法。這種算法綜合了波形編碼和參數(shù)編碼的優(yōu)點(diǎn),以自適應(yīng)預(yù)測(cè)編
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣告合同談判策略
- 咖啡店承包經(jīng)營(yíng)合同樣本
- 吉林省大豆交易合同范本
- 2024年出租車勞動(dòng)合同
- 2024年電焊條采購(gòu)合同
- 建筑工程第三方責(zé)任保險(xiǎn)合同
- 個(gè)人簡(jiǎn)單借款協(xié)議書(shū)樣本
- 智能安防系統(tǒng)銷售合同
- 普洱茶買賣合同樣式
- 2024年小產(chǎn)權(quán)房房屋租賃合同
- 國(guó)開(kāi)作業(yè)《公共部門人力資源管理》形考任務(wù)4:撰寫(xiě)課程學(xué)習(xí)總結(jié)(第1-9章權(quán)重25%)參考882
- 五星級(jí)酒店工程部標(biāo)準(zhǔn)化管理資料
- 暈厥護(hù)理查房(與“暈厥”相關(guān)共28張)課件
- 民族團(tuán)結(jié)實(shí)踐活動(dòng)總結(jié)范文5篇
- 網(wǎng)店客服(第二版)整書(shū)電子教案完整版教學(xué)課件全套ppt教學(xué)教程最全課件最新
- 全國(guó)護(hù)士延續(xù)注冊(cè)體檢表-(正式)
- 小學(xué)校園污染防控管理制度
- 管理學(xué)-原理與方法(第七版)重點(diǎn)
- 危房封條格式
- (完整ppt)氣候?qū)n}課件
- J-STD-020D[1].1中文版
評(píng)論
0/150
提交評(píng)論