




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 語音編碼(speech coding)概述概述語音信號壓縮編碼的原理及其評價系統(tǒng)語音信號壓縮編碼的原理及其評價系統(tǒng)語音信號的波形編碼語音信號的波形編碼語音信號的參數(shù)編碼語音信號的參數(shù)編碼語音信號的混合編碼語音信號的混合編碼概述概述一、編碼(壓縮)的重要性一、編碼(壓縮)的重要性二、編碼速率(信息容量)二、編碼速率(信息容量)三、編碼的分類三、編碼的分類四、已經(jīng)標(biāo)準(zhǔn)化的語音編碼四、已經(jīng)標(biāo)準(zhǔn)化的語音編碼 編碼、傳輸、存儲和譯碼是語音數(shù)字傳輸和數(shù)編碼、傳輸、存儲和譯碼是語音數(shù)字傳輸和數(shù)字存儲的必要過程。字存儲的必要過程。 隨著語音通信技術(shù)的發(fā)展,壓縮語音信號的傳隨著語音通信技術(shù)的發(fā)展,壓縮語音信號
2、的傳輸帶寬,降低信道的傳輸速率,一直是人們追求的輸帶寬,降低信道的傳輸速率,一直是人們追求的目標(biāo)。語音編碼在實(shí)現(xiàn)這一目標(biāo)的過程中擔(dān)當(dāng)重要目標(biāo)。語音編碼在實(shí)現(xiàn)這一目標(biāo)的過程中擔(dān)當(dāng)重要的角色。的角色。 語音編碼就是使表達(dá)語音信號的比特數(shù)目最小。語音編碼就是使表達(dá)語音信號的比特數(shù)目最小。一、編碼(壓縮)的重要性一、編碼(壓縮)的重要性數(shù)字傳輸系統(tǒng)模型數(shù)字傳輸系統(tǒng)模型信源信源信源編碼信源編碼信道編碼信道編碼調(diào)制調(diào)制傳輸通道傳輸通道用戶用戶信源解碼信源解碼信道解碼信道解碼解調(diào)解調(diào)噪聲噪聲語音編碼應(yīng)用實(shí)例(語音編碼應(yīng)用實(shí)例(IPIP電話)電話)接收器接收器模數(shù)轉(zhuǎn)換模數(shù)轉(zhuǎn)換壓縮編碼壓縮編碼IPIP封裝封裝網(wǎng)
3、網(wǎng)絡(luò)絡(luò)IPIP解包解包解碼解碼數(shù)模轉(zhuǎn)換數(shù)模轉(zhuǎn)換播放器播放器二、編碼速率(信息容量)二、編碼速率(信息容量) 用比特用比特/ /秒(秒(b/sb/s或或bpsbps)來度量,用)來度量,用I I表示,有:表示,有: I=R I=R f fs s ,R,R代表每個語音采樣值編碼所需的比代表每個語音采樣值編碼所需的比特數(shù);特數(shù);f fs s是采樣頻率。是采樣頻率。 當(dāng)當(dāng)f fs s=8kHz=8kHz,每個采樣值用,每個采樣值用8 8比特位來編碼,則比特位來編碼,則編碼速率為編碼速率為64kb/s64kb/s。三、編碼的分類三、編碼的分類1.1.波形編碼波形編碼(waveform coding)(w
4、aveform coding):基本原理是在時基本原理是在時間軸上對模擬話音信號按照一定的速率來抽樣,然間軸上對模擬話音信號按照一定的速率來抽樣,然后將幅度樣本分層量化,并使用代碼來表示。在接后將幅度樣本分層量化,并使用代碼來表示。在接收端將收到的數(shù)字序列經(jīng)過解碼恢復(fù)到原模擬信號,收端將收到的數(shù)字序列經(jīng)過解碼恢復(fù)到原模擬信號,保持原始語音的波形形狀。話音質(zhì)量高,編碼速率保持原始語音的波形形狀。話音質(zhì)量高,編碼速率高。如高。如PCMPCM編碼類(編碼類(a a率或率或u u率率PCMPCM、ADPCM ADPCM 、ADM)ADM),編碼速率為編碼速率為646416kb/s16kb/s,語音質(zhì)量
5、好。,語音質(zhì)量好。2.2.參數(shù)編碼(聲源編碼參數(shù)編碼(聲源編碼 parametric codingparametric coding): 根據(jù)語音信號產(chǎn)生的數(shù)學(xué)模型,通過對語音信根據(jù)語音信號產(chǎn)生的數(shù)學(xué)模型,通過對語音信號特征參數(shù)的提取后進(jìn)行編碼(將特征參數(shù)變換成號特征參數(shù)的提取后進(jìn)行編碼(將特征參數(shù)變換成數(shù)字代碼進(jìn)行傳輸)。在接收端將特征參數(shù),結(jié)合數(shù)字代碼進(jìn)行傳輸)。在接收端將特征參數(shù),結(jié)合數(shù)學(xué)模型,恢復(fù)語音,力圖使重建語音保持盡可能數(shù)學(xué)模型,恢復(fù)語音,力圖使重建語音保持盡可能高的可懂度,重建語音信號的波形同原始語音信號高的可懂度,重建語音信號的波形同原始語音信號的波形可能會有相當(dāng)大的區(qū)別。如
6、線性預(yù)測(的波形可能會有相當(dāng)大的區(qū)別。如線性預(yù)測(LPCLPC)編碼類。編碼速率低,編碼類。編碼速率低,2.4-1.2kb/s2.4-1.2kb/s,自然度低,自然度低,對環(huán)境噪聲敏感。對環(huán)境噪聲敏感。3.3.混合編碼混合編碼(Hybrid coding)(Hybrid coding): 將波形編碼與參數(shù)編碼相結(jié)合,在將波形編碼與參數(shù)編碼相結(jié)合,在2.4-1.2kb/s2.4-1.2kb/s速率上能夠得到高質(zhì)量的合成語音。規(guī)則碼激勵長速率上能夠得到高質(zhì)量的合成語音。規(guī)則碼激勵長時預(yù)測編碼時預(yù)測編碼RPERPELPTLPT即為混合編碼技術(shù)?;旌暇幋a即為混合編碼技術(shù)?;旌暇幋a包括若干語音特征參量又
7、包括部分波形編碼信息,包括若干語音特征參量又包括部分波形編碼信息,以達(dá)到波形編碼的高質(zhì)量和參量編碼的低速率的優(yōu)以達(dá)到波形編碼的高質(zhì)量和參量編碼的低速率的優(yōu)點(diǎn)。點(diǎn)。四、已經(jīng)標(biāo)準(zhǔn)化的語音編碼四、已經(jīng)標(biāo)準(zhǔn)化的語音編碼 指定組織:國際電信聯(lián)盟指定組織:國際電信聯(lián)盟 ITU-TITU-T, 標(biāo)準(zhǔn)標(biāo)準(zhǔn)編碼速率編碼速率(kb/s)(kb/s)算法算法MOSMOS得得分分 應(yīng)用應(yīng)用G.711G.7116464u u律或律或a a律律PCMPCM4.34.3公用網(wǎng)公用網(wǎng) G.721G.7213232ADPCMADPCM4.14.1公用網(wǎng)公用網(wǎng)G
8、.723.1G.7ACELPACELP3.23.2無線網(wǎng)無線網(wǎng)G.729G.7298 8CS-ACELPCS-ACELP3.83.8無線網(wǎng)無線網(wǎng)GSMGSM1313RPE-LTPRPE-LTP3.93.9無線網(wǎng)無線網(wǎng)(5)RPE-LTP(5)RPE-LTP:長時預(yù)測的規(guī)則脈沖激勵的線性預(yù):長時預(yù)測的規(guī)則脈沖激勵的線性預(yù)測測Regular-Pulse Excited LPC with a Long-Term Regular-Pulse Excited LPC with a Long-Term PredictorPredictor (1)ADPCM (1)ADPCM:自適應(yīng)差分
9、脈沖編碼:自適應(yīng)差分脈沖編碼 adaptive adaptive difference pulse code modulationdifference pulse code modulation (2)CELP (2)CELP:碼本激勵線性預(yù)測:碼本激勵線性預(yù)測 (code excited code excited linear predictionlinear prediction) (3)ACELP (3)ACELP:代數(shù)碼本激勵線性預(yù)測:代數(shù)碼本激勵線性預(yù)測Algebraic-Algebraic-Code-Excited Linear-PredictionCode-Excited Lin
10、ear-Prediction (4)CS-ACELP (4)CS-ACELP:共軛結(jié)構(gòu)的代數(shù)碼本激勵線性預(yù)測:共軛結(jié)構(gòu)的代數(shù)碼本激勵線性預(yù)測Conjugate Structure Algebraic-Code-Excited Conjugate Structure Algebraic-Code-Excited Linear-PredictionLinear-Prediction語音信號壓縮編碼的原理及其評價系統(tǒng)語音信號壓縮編碼的原理及其評價系統(tǒng)一、語音壓縮的基本依據(jù)一、語音壓縮的基本依據(jù)二、語音編碼的關(guān)鍵技術(shù)二、語音編碼的關(guān)鍵技術(shù)三、語音壓縮系統(tǒng)的性能指標(biāo)和評測方法三、語音壓縮系統(tǒng)的性能指標(biāo)和
11、評測方法一、語音壓縮的基本依據(jù)一、語音壓縮的基本依據(jù) 是語音信號的冗余度和人的聽覺感知機(jī)理。是語音信號的冗余度和人的聽覺感知機(jī)理。1.1.存在的時域冗余度:存在的時域冗余度:(1 1)幅度非均勻分布)幅度非均勻分布(2 2)語音信號樣本間的相關(guān)性很強(qiáng))語音信號樣本間的相關(guān)性很強(qiáng)(3 3)濁音具有準(zhǔn)周期)濁音具有準(zhǔn)周期(4 4)聲道的形狀及其變化緩慢)聲道的形狀及其變化緩慢(5 5)語音間隙(靜止系數(shù))語音間隙(靜止系數(shù))2.2.存在的頻域冗余度:存在的頻域冗余度:(1 1)非均勻的長時功率譜密度)非均勻的長時功率譜密度(2 2)短時功率譜密度)短時功率譜密度女聲英文女聲英文a的功率譜的功率譜3
12、.3.人的聽覺感知機(jī)理人的聽覺感知機(jī)理(1 1)人類的聽覺特性具有掩蔽效應(yīng))人類的聽覺特性具有掩蔽效應(yīng)(2 2)人耳對不同頻段聲音的敏感程度不同)人耳對不同頻段聲音的敏感程度不同(3 3)人耳對語音相位不敏感)人耳對語音相位不敏感4. 4. 語音編碼的極限速率語音編碼的極限速率 語音中最基本的元素是音素,大約有語音中最基本的元素是音素,大約有128128256256個,個,如果按通常的說話速度,每秒平均發(fā)出如果按通常的說話速度,每秒平均發(fā)出1010個音素,則個音素,則信息率為:信息率為: I=logI=log2 2(256)(256)1010bps=80bpsbps=80bps把發(fā)音看成是以語
13、音速率來傳送,則語音編碼的極限把發(fā)音看成是以語音速率來傳送,則語音編碼的極限速率為速率為80bps,80bps,從數(shù)字化標(biāo)準(zhǔn)的編碼速率從數(shù)字化標(biāo)準(zhǔn)的編碼速率64kbps64kbps,到極,到極限速率限速率80bps80bps,之間的距離,對于理論研究和實(shí)踐有,之間的距離,對于理論研究和實(shí)踐有著極大的吸引力。著極大的吸引力。二、語音編碼的關(guān)鍵技術(shù)二、語音編碼的關(guān)鍵技術(shù)語音信號中存在兩種類型的相關(guān)性:語音信號中存在兩種類型的相關(guān)性:(1 1)樣點(diǎn)間的短時相關(guān)性)樣點(diǎn)間的短時相關(guān)性(2 2)相鄰基音周期之間的長時相關(guān)性)相鄰基音周期之間的長時相關(guān)性pkkkzazAzH111)(1)(e(n)e(n)
14、x(n)x(n)pkkknxanenx1)()()(短時預(yù)測濾波器短時預(yù)測濾波器1.1. 語音信號的短時預(yù)測模型語音信號的短時預(yù)測模型D D為基音周期,長時預(yù)測系數(shù)為基音周期,長時預(yù)測系數(shù)bbi i 的個數(shù)取的個數(shù)取1 1(q=r=0q=r=0)或)或3(q=r=1)3(q=r=1)。 D D、bbi i 從語音信號中從語音信號中直接提取。語音信號通過長時預(yù)測,得出基音周直接提取。語音信號通過長時預(yù)測,得出基音周期、增益(振幅大?。?。期、增益(振幅大小)。rqiiDizbzPzH)(11)(1)(長時長時 線性線性預(yù)測預(yù)測x(n-p),x(n-p+1),x(n-p),x(n-p+1),.x(n
15、-1).x(n-1)x x (n)(n)長時預(yù)測濾波器長時預(yù)測濾波器)(1zAx(n)x(n)(1zPe(n)e(n)激勵發(fā)生器激勵發(fā)生器完整的語音信號的預(yù)測模型完整的語音信號的預(yù)測模型3.3.感覺加權(quán)濾波器感覺加權(quán)濾波器由于掩蔽效應(yīng),在語音頻譜中,能量較高的頻由于掩蔽效應(yīng),在語音頻譜中,能量較高的頻段(共振峰處)的噪聲相對于能量較低的頻段的噪段(共振峰處)的噪聲相對于能量較低的頻段的噪聲不易被感覺。在度量原始語音和合成語音之間的聲不易被感覺。在度量原始語音和合成語音之間的誤差時,在高能量段允許誤差大,因此引入一個頻誤差時,在高能量段允許誤差大,因此引入一個頻域的感覺加權(quán)濾波器域的感覺加權(quán)濾波
16、器W(z)W(z)來衡量語音之間的誤差。來衡量語音之間的誤差。加權(quán)因子加權(quán)因子 在在0 01 1之間之間, ,控制共振峰區(qū)域的誤差增加控制共振峰區(qū)域的誤差增加pkkkkpkkkzazazAzAzW1111)/()()(輸入輸入語音語音x(n)x(n)線性線性預(yù)測預(yù)測分析分析感覺感覺加權(quán)加權(quán)濾波器濾波器后繼處理后繼處理三、語音壓縮系統(tǒng)的性能指標(biāo)和評測方法三、語音壓縮系統(tǒng)的性能指標(biāo)和評測方法1.1.語音壓縮系統(tǒng)的性能指標(biāo)語音壓縮系統(tǒng)的性能指標(biāo)(1 1)編碼速率)編碼速率(2 2)編碼器的頑健性)編碼器的頑健性(3 3)編碼器的時延)編碼器的時延(4 4)算法的復(fù)雜度和可擴(kuò)展性)算法的復(fù)雜度和可擴(kuò)展
17、性編碼延時編碼延時一般地,編解碼算法越復(fù)雜,延時越大,會明顯一般地,編解碼算法越復(fù)雜,延時越大,會明顯感覺到通話對方反映感覺到通話對方反映“遲鈍遲鈍”,甚至造成正常通信困,甚至造成正常通信困難。難。 另外一方面,延時造成回聲,傳統(tǒng)的電話系統(tǒng)中,另外一方面,延時造成回聲,傳統(tǒng)的電話系統(tǒng)中,在在2-4 2-4 線的轉(zhuǎn)換處(混合線圈)因阻抗不匹配,導(dǎo)致線的轉(zhuǎn)換處(混合線圈)因阻抗不匹配,導(dǎo)致接收者的收話音信號泄露到其發(fā)送路徑上,返回給發(fā)接收者的收話音信號泄露到其發(fā)送路徑上,返回給發(fā)送者,形成了回聲。當(dāng)延時小時,回聲同房間交混,送者,形成了回聲。當(dāng)延時小時,回聲同房間交混,因此感覺不到;當(dāng)延遲超過了因
18、此感覺不到;當(dāng)延遲超過了25ms25ms,能明顯感覺到,能明顯感覺到,從而嚴(yán)重影響通信。從而嚴(yán)重影響通信。 一般地,要求編解碼延時不超過一般地,要求編解碼延時不超過5 510ms10ms。A A端的信號端的信號B B端經(jīng)混端經(jīng)混合線圈的回傳信號合線圈的回傳信號B B端的信號端的信號A A端經(jīng)混端經(jīng)混合線圈的回傳信號合線圈的回傳信號A A端端B B端端2.2.語音壓縮系統(tǒng)的性能指標(biāo)和評測方法語音壓縮系統(tǒng)的性能指標(biāo)和評測方法 語音質(zhì)量是衡量語音編碼算法優(yōu)劣的關(guān)鍵性能之語音質(zhì)量是衡量語音編碼算法優(yōu)劣的關(guān)鍵性能之一。語音質(zhì)量通常分為四類:一。語音質(zhì)量通常分為四類:(1)廣播級)廣播級(2)網(wǎng)絡(luò)或電話級
19、)網(wǎng)絡(luò)或電話級(3)通信級)通信級(4)合成級)合成級 語音質(zhì)量語音質(zhì)量有主觀和客觀兩種評價方法。有主觀和客觀兩種評價方法。 評價指標(biāo):清晰度或可懂度、音質(zhì)。前者是指語音評價指標(biāo):清晰度或可懂度、音質(zhì)。前者是指語音是否容易聽清楚;后者指語音聽起來有多自然。是否容易聽清楚;后者指語音聽起來有多自然。(1 1)可懂度評價)可懂度評價 DRTDRT:Diagnostic RhymerDiagnostic Rhymer Test Test (2 2)音質(zhì)評價:)音質(zhì)評價: MOSMOS:Mean Opinion Score Mean Opinion Score 平均意平均意見得分和見得分和DAMDAM
20、:Diagnostic Acceptability Measure Diagnostic Acceptability Measure 判斷滿意度得分。判斷滿意度得分。主觀評價方法主觀評價方法 MOSMOS得分為五級得分為五級: :優(yōu)、良、可、差和壞。優(yōu)、良、可、差和壞。滿分為滿分為5 5分,相當(dāng)調(diào)頻廣播質(zhì)量;分,相當(dāng)調(diào)頻廣播質(zhì)量;4 4分以上是分以上是長途電話網(wǎng)標(biāo)準(zhǔn);長途電話網(wǎng)標(biāo)準(zhǔn);3.53.5分為通信標(biāo)準(zhǔn);分為通信標(biāo)準(zhǔn); 3.03.0分分仍有較好的可懂度,保持自然度;仍有較好的可懂度,保持自然度;2.52.5分只維分只維持可懂度,持可懂度, 是戰(zhàn)術(shù)通信標(biāo)準(zhǔn)。是戰(zhàn)術(shù)通信標(biāo)準(zhǔn)。 (1 1)波形失
21、真度,用信噪比來度量)波形失真度,用信噪比來度量(2 2)頻譜失真測量)頻譜失真測量(3 3)譜包絡(luò)失真測量)譜包絡(luò)失真測量客觀評價方法客觀評價方法MnMnnsnsnsSNR0202)()()(log*10語音信號的波形編碼語音信號的波形編碼一一、非均勻量化的、非均勻量化的PCMPCM編碼編碼二、增量調(diào)制編碼二、增量調(diào)制編碼三、自適應(yīng)增量調(diào)制編碼三、自適應(yīng)增量調(diào)制編碼四、自適應(yīng)差分脈沖編碼四、自適應(yīng)差分脈沖編碼ADPCMADPCM五、自適應(yīng)預(yù)測器五、自適應(yīng)預(yù)測器六、自適應(yīng)量化器六、自適應(yīng)量化器七、七、ADPCMADPCM的總結(jié)的總結(jié) 均勻量化時,無論大的輸入信號還是小的輸入均勻量化時,無論大的
22、輸入信號還是小的輸入信號一律采用相同的量化間隔,為了適應(yīng)大的輸入信號一律采用相同的量化間隔,為了適應(yīng)大的輸入信號,同時又要滿足精度要求,就需要增加樣本的信號,同時又要滿足精度要求,就需要增加樣本的位數(shù)位數(shù)。 =2V/L=2V/2=2V/L=2V/2R R,但是對話音信號來說,大但是對話音信號來說,大信號出現(xiàn)的機(jī)會并不多,增加的樣本數(shù)就沒有充分信號出現(xiàn)的機(jī)會并不多,增加的樣本數(shù)就沒有充分利用。因此采用非均勻量化。利用。因此采用非均勻量化。一、非均勻量化的一、非均勻量化的PCMPCM編碼編碼 其基本思想是:大的輸入信號采用大的量化其基本思想是:大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化
23、間隔。在滿足精間隔,小的輸入信號采用小的量化間隔。在滿足精度要求的情況下用較少的位數(shù)來表示。譯碼時,采度要求的情況下用較少的位數(shù)來表示。譯碼時,采用相同的規(guī)則。也可視為將信號進(jìn)行非線性變換后用相同的規(guī)則。也可視為將信號進(jìn)行非線性變換后再作均勻量化,如對信號進(jìn)行對數(shù)壓縮,再作均勻量化,如對信號進(jìn)行對數(shù)壓縮,微弱的信微弱的信號被放大,強(qiáng)的信號被壓縮。號被放大,強(qiáng)的信號被壓縮。譯碼時,指數(shù)擴(kuò)張。譯碼時,指數(shù)擴(kuò)張。非線性非線性壓縮壓縮均勻均勻量化量化編碼編碼x xa a(nT(nT) )解碼解碼非線性非線性擴(kuò)張擴(kuò)張x x (nT(nT) )現(xiàn)在的非均勻量化中,一般采用兩種壓縮擴(kuò)張非現(xiàn)在的非均勻量化中,
24、一般采用兩種壓縮擴(kuò)張非均勻量化方法。采樣后信號幅度和量化數(shù)據(jù)之間有兩均勻量化方法。采樣后信號幅度和量化數(shù)據(jù)之間有兩種對應(yīng)關(guān)系,一種稱為種對應(yīng)關(guān)系,一種稱為u u 律壓擴(kuò)(律壓擴(kuò)(compandingcompanding)算法,)算法,另一種稱為另一種稱為A A 律壓擴(kuò)算法。律壓擴(kuò)算法。 u u 律壓擴(kuò)主要用于北美律壓擴(kuò)主要用于北美和日本等地區(qū)的電話通信中。和日本等地區(qū)的電話通信中。 A A 律壓擴(kuò)主要用在歐律壓擴(kuò)主要用在歐洲和中國的地區(qū)的電話通信中。洲和中國的地區(qū)的電話通信中。)(sgn)1ln(| )(|1ln)(maxmaxnTxXnTxXnxFaaaau u 律壓擴(kuò)律壓擴(kuò)1| )(|1)
25、(sgnln1/ | )(|ln11| )(|0)(sgnln1/ | )(|)(maxmaxmaxmaxmaxAaaAaAAaaAaXnTxAntxAXnTxAXAXnTxntxAXnTxAnxF(1 1)輸入)輸入x xa a(nT(nT) )的范圍歸一化為(的范圍歸一化為(1 11 1); ; (2 2)輸出)輸出F FA A(x(n)(x(n)的范圍為(的范圍為(1 11 1););(3 3)A A為壓擴(kuò)參數(shù),它反映最大量化間隔和最小量化為壓擴(kuò)參數(shù),它反映最大量化間隔和最小量化間隔的比值。間隔的比值。A=87.56A=87.56A A 律壓擴(kuò)律壓擴(kuò) 我國的我國的PCM30/32PCM3
26、0/32路基群也采用路基群也采用A A律律1313折線壓折線壓縮特性。縮特性。律律1515折線主要用于美國、加拿大和日折線主要用于美國、加拿大和日本等國的本等國的PCM 24PCM 24路基群中。路基群中。 CCITTCCITT建議建議G.711G.711規(guī)定上述兩種折線近似壓縮規(guī)定上述兩種折線近似壓縮律為國際標(biāo)準(zhǔn),且在國際間數(shù)字系統(tǒng)相互連接時,律為國際標(biāo)準(zhǔn),且在國際間數(shù)字系統(tǒng)相互連接時,要以要以A A律為標(biāo)準(zhǔn)。律為標(biāo)準(zhǔn)。 因此這里重點(diǎn)介紹因此這里重點(diǎn)介紹A A律律1313折線。折線。 011161 81321 41 2164112817/86/85/84/83/82/81/8x xa a(n
27、T(nT) )A A律壓擴(kuò)編碼律壓擴(kuò)編碼采用采用8位二進(jìn)制編碼:位二進(jìn)制編碼:C7C6C5C4C3C2C1C0C7: 表示信號的極性,稱為極性碼。表示信號的極性,稱為極性碼。0為正為正,1為負(fù)。為負(fù)。C3C2C1C0 : 表示每一段落的表示每一段落的16個均勻劃分的量化個均勻劃分的量化級,稱為段內(nèi)碼。級,稱為段內(nèi)碼。 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111C6C5C4:表示段落序號,稱為段落碼。表示段落序號,稱為段落碼。 000 001 010 011 100 101 110
28、 111對輸入動態(tài)范圍為(對輸入動態(tài)范圍為(-5v,+5v-5v,+5v),), 用用A A律壓擴(kuò)編碼,有:律壓擴(kuò)編碼,有:1/128 0.0390625v76543210 1 5v1/2 2.5v1/4 1.25v1/8 0.625v1/16 0.3125v1/32 0.15625v1/64 0.078125v0 0v輸入信號為輸入信號為1.05v1.05v,則編碼為:,則編碼為:極性碼:極性碼: 0 0 段落碼:段落碼:101101段內(nèi)碼:段內(nèi)碼: =(1.25-0.625)/16=(1.25-0.625)/16 = 0.0390625 = 0.0390625 (1.05-0.625)/
29、(1.05-0.625)/ =10.88=10.88取整數(shù)取整數(shù)1010,對應(yīng)第,對應(yīng)第1010量化間隔,量化間隔,編碼為編碼為10101010最后完整的碼字為:最后完整的碼字為: 0101101001011010 I=8kHzI=8kHz* *8bit=64kbit/s8bit=64kbit/s 實(shí)際中,麥克風(fēng)采集信號,量化為實(shí)際中,麥克風(fēng)采集信號,量化為12/13/14/15/1612/13/14/15/16位的輸入信號,使用位的輸入信號,使用A A律壓擴(kuò)編碼,律壓擴(kuò)編碼,每個樣本的量化位為每個樣本的量化位為8 8。 A A律壓擴(kuò)編碼的速率:律壓擴(kuò)編碼的速率:對輸入信號范圍(對輸入信號范圍
30、(-1,1-1,1):): A A律壓擴(kuò)編碼的最小量階為律壓擴(kuò)編碼的最小量階為 minmin=(1/128)/16=1/2048;=(1/128)/16=1/2048; 在同樣的輸入信號范圍,均勻量化的線性在同樣的輸入信號范圍,均勻量化的線性PCMPCM以以A A律壓擴(kuò)編碼的最小量階為量階進(jìn)行量化,得到律壓擴(kuò)編碼的最小量階為量階進(jìn)行量化,得到線性線性PCMPCM需要需要1212比特編碼;比特編碼; =2V/L=2V/2=2V/L=2V/2R R2/22/2R R=1/2048 =1/2048 2 2R R2 2* *2048 R=122048 R=12 A A律壓擴(kuò)編碼則只需要律壓擴(kuò)編碼則只需
31、要8 8個比特位。個比特位。A A律壓擴(kuò)編碼與線性律壓擴(kuò)編碼與線性PCMPCM編碼的對比編碼的對比A A律壓擴(kuò)編碼與其他線性律壓擴(kuò)編碼與其他線性PCMPCM編碼的快速轉(zhuǎn)換編碼的快速轉(zhuǎn)換線性線性PCM(13bits,b12PCM(13bits,b12為符號位為符號位) )b12 b11 b10 b9 b8 b7 b6 b5 b4 b3 b2 b1 b0A A律壓擴(kuò)編碼律壓擴(kuò)編碼 M7=b12M7=b12M7 M6 M5 M4 M3 M2 M1 M0 0 0 0 0 0 0 0 a b c d 1 0 0 0 a b c d 0 0 0 0 0 0 1 a b c d 1 0 0 1 a b c
32、d 0 0 0 0 0 1 a b c d 1 0 1 0 a b c d 0 0 0 0 1 a b c d 1 0 1 1 a b c d 0 0 0 1 a b c d 1 1 0 0 a b c d 0 0 1 a b c d 1 1 0 1 a b c d 0 1 a b c d 1 1 1 0 a b c d 1 a b c d 1 1 1 1 a b c d 時分復(fù)用時分復(fù)用Time Division Multiplexing原理:把時間分割成小的時間片,每個時間片分原理:把時間分割成小的時間片,每個時間片分為若干個通道(時隙)為若干個通道(時隙) ,每個用戶占用一個通道,每個用
33、戶占用一個通道傳輸數(shù)據(jù)。傳輸數(shù)據(jù)。 A2A1A3原始信號原始信號D2D1D3數(shù)字化信號數(shù)字化信號MUX復(fù)用后數(shù)據(jù)復(fù)用后數(shù)據(jù)時隙時隙12 3 4D3D2D1適用于數(shù)字信號傳輸適用于數(shù)字信號傳輸 時間片時間片 復(fù)用概念:利用不同時隙在同一信道上同復(fù)用概念:利用不同時隙在同一信道上同時傳輸各路不同信號,且互不干擾,這就是時分時傳輸各路不同信號,且互不干擾,這就是時分復(fù)用(復(fù)用(TDMTDM)。)。( (a a) )第第1 1路;路;( (b b) )第第2 2路;路;( (c c) )第第3 3路;路;( (d d) 3) 3路合成的波形路合成的波形 PCM 30/32PCM 30/32路介紹路介紹
34、 1. 1. 基本特性基本特性話路數(shù)目:話路數(shù)目: 3030抽樣頻率:抽樣頻率: 8kHz8kHz 壓擴(kuò)特性:壓擴(kuò)特性: A=87.6/13A=87.6/13折線壓擴(kuò)律,編碼位數(shù)為折線壓擴(kuò)律,編碼位數(shù)為8 8每幀時隙數(shù):每幀時隙數(shù):32 32 總數(shù)碼率:總數(shù)碼率: 8 832328000=2048kb/s8000=2048kb/s 2 2 時隙分配:在時隙分配:在PCM 30/32PCM 30/32路的制式中,抽樣周期路的制式中,抽樣周期為為1/8000=1251/8000=125s s,它被稱為一個幀周期,即,它被稱為一個幀周期,即125125s s為一幀。一幀內(nèi)要時分復(fù)用為一幀。一幀內(nèi)要時
35、分復(fù)用3232路,每路占用的時隙為路,每路占用的時隙為125/32=3.9s125/32=3.9s,稱為一個時隙。因此一幀有,稱為一個時隙。因此一幀有3232個時個時隙,按順序編號為隙,按順序編號為TSTS0 0、TSTS1 1、 TSTS3131。時隙的使用。時隙的使用分配為:分配為: TSTS1 1TSTS1515, , TSTS17 17 TSTS3131為為3030個話路時隙;個話路時隙; TSTS0 0為幀同步碼,監(jiān)視碼時隙;為幀同步碼,監(jiān)視碼時隙; TSTS1616為信令為信令( (振鈴、占線、摘機(jī)振鈴、占線、摘機(jī)等各種標(biāo)等各種標(biāo)志信號志信號) )時隙。時隙。 E1-幀格式0121
36、631幀同步幀同步信令信道信令信道30 路話音數(shù)據(jù)信道路話音數(shù)據(jù)信道 + 2 路控制信道路控制信道 話路比特的安排:每個話路時隙內(nèi)話路比特的安排:每個話路時隙內(nèi)要將樣值編為要將樣值編為8 8位二元碼,每個碼元占位二元碼,每個碼元占3.9 s/8=488ns3.9 s/8=488ns市話局出入中繼放大低通放大低通群路譯碼12分路分離碼型反變換再生收群路編碼12抽樣(TS1)匯總碼型變換發(fā)(TS2)30(TS31)30信令收邏輯幀同步碼檢出收定時系統(tǒng)D1D8TS1TS31TS0TS16信令發(fā)邏輯幀同步碼發(fā)生發(fā)定時系統(tǒng)2048kHz時鐘TS1TS31D1D2D8TS16TS0D1 D8復(fù)接等級和速率
37、系列復(fù)接等級和速率系列 二、增量調(diào)制編碼二、增量調(diào)制編碼 1.1.增量調(diào)制的定義:增量調(diào)制的定義: 增量調(diào)制(增量調(diào)制(DMDM)也稱為)也稱為 調(diào)制,是對輸入樣本調(diào)制,是對輸入樣本s(k)s(k)和預(yù)測樣本值和預(yù)測樣本值s se e(k)(k)的差值的差值d(k)d(k)量化的最簡單的量化的最簡單的一種情況,只有兩種編碼輸出:一種情況,只有兩種編碼輸出:0 0或或1 1。一般情況下,。一般情況下,如果差值大于如果差值大于0 0,則編碼為,則編碼為“0”0”,若差值小于,若差值小于0 0,則,則編碼為編碼為“1”1”。 由于增量編碼只須用由于增量編碼只須用1 1位對語音信號進(jìn)行編碼,位對語音信
38、號進(jìn)行編碼,所以對增量調(diào)制編碼系統(tǒng)稱為所以對增量調(diào)制編碼系統(tǒng)稱為“1 1位系統(tǒng)位系統(tǒng)”。 2.增量調(diào)制增量調(diào)制(DM)(DM)的結(jié)構(gòu)的結(jié)構(gòu)s se e(k) -(k) -DM DM 發(fā)送端發(fā)送端s(k)+s(k)+量化器量化器預(yù)測器預(yù)測器 I(k) I(k)s sr r(k)(k)+ + +編碼編碼d(k)d(k)s(k) s(k) 輸入樣本輸入樣本s se e(k)(k)預(yù)測樣本值預(yù)測樣本值d(k) d(k) 差值差值s sr r(k)(k)重建樣本值重建樣本值I(k)I(k)已量化的差值已量化的差值3.3.增量調(diào)制增量調(diào)制(DM)(DM)的編碼的編碼預(yù)測器采取簡單的一階固定預(yù)測器。預(yù)測器采
39、取簡單的一階固定預(yù)測器。s se e(k)=as(k)=asr r(k-1) (k-1) a a為一個常數(shù),一般情況下取,即為一個常數(shù),一般情況下取,即a=1a=1。用重建信號。用重建信號的前一時刻來預(yù)測當(dāng)前時刻的預(yù)測樣本值。的前一時刻來預(yù)測當(dāng)前時刻的預(yù)測樣本值。 s se e(k)=s(k)=sr r(k-1) (k-1) s sr r(k)=s(k)=se e(k)+I(k)=s(k)+I(k)=sr r(k-1)+I(k)(k-1)+I(k) d(k)=s(k)-s d(k)=s(k)-se e(k)(k) I(k)=Qd(k)= I(k)=Qd(k)=d(k)I(k)-01s se e
40、(k)=s(k)=sr r(k-1) s(k-1) se e(k)=s(k)=sr r(k-1) (k-1) d(k)=s(k)-sd(k)=s(k)-se e(k)0 d(k)=s(k)-s(k)0 d(k)=s(k)-se e(k)0(k)1 M=P1 若若c(n)=c(n-1)c(n)=c(n-1) M=Q1 M=Q1 Mips.25 ms4.4G.7298 Kb/s20 Mips10 ms 4.2ITU-T G.729 8kb/s CSITU-T G.729 8kb/s CSACELPACELP簡介簡介 nG.729G.729是由美國、法國、日本和加拿大的幾家著名是由美國、法國、日本和
41、加拿大的幾家著名國際電信實(shí)體聯(lián)合開發(fā)的。它需要符合一些嚴(yán)格的國際電信實(shí)體聯(lián)合開發(fā)的。它需要符合一些嚴(yán)格的要求,比如在良好的信道條件下要達(dá)到長話質(zhì)量,要求,比如在良好的信道條件下要達(dá)到長話質(zhì)量,在有隨機(jī)比特誤碼、發(fā)生幀丟失和多次轉(zhuǎn)接等情況在有隨機(jī)比特誤碼、發(fā)生幀丟失和多次轉(zhuǎn)接等情況下要有很好的穩(wěn)健性等。這種語音壓縮算法可以應(yīng)下要有很好的穩(wěn)健性等。這種語音壓縮算法可以應(yīng)用在很廣泛的領(lǐng)域中,包括用在很廣泛的領(lǐng)域中,包括I I電話、無線通信、電話、無線通信、數(shù)字衛(wèi)星系統(tǒng)和數(shù)字專用線路。數(shù)字衛(wèi)星系統(tǒng)和數(shù)字專用線路。 nG.729G.729算法采用算法采用“共軛結(jié)構(gòu)代數(shù)碼本激勵線性預(yù)測編共軛結(jié)構(gòu)代數(shù)碼本激
42、勵線性預(yù)測編碼方案碼方案”(CS-ACELPCS-ACELP)算法。這種算法綜合了波形編)算法。這種算法綜合了波形編碼和參數(shù)編碼的優(yōu)點(diǎn),以自適應(yīng)預(yù)測編碼技術(shù)為基礎(chǔ),碼和參數(shù)編碼的優(yōu)點(diǎn),以自適應(yīng)預(yù)測編碼技術(shù)為基礎(chǔ),采用了矢量量化、合成分析和感覺加權(quán)等技術(shù)。采用了矢量量化、合成分析和感覺加權(quán)等技術(shù)。 編碼器編碼器10ms10ms長的語音幀進(jìn)行處理,每幀分為兩長的語音幀進(jìn)行處理,每幀分為兩個子幀。輸入語音首先要在預(yù)處理模塊中經(jīng)過高通濾個子幀。輸入語音首先要在預(yù)處理模塊中經(jīng)過高通濾波和幅度壓縮變換,以去除低頻干擾及防止在后面運(yùn)波和幅度壓縮變換,以去除低頻干擾及防止在后面運(yùn)算中出現(xiàn)溢出。每幀進(jìn)行一次線性
43、預(yù)測(算中出現(xiàn)溢出。每幀進(jìn)行一次線性預(yù)測(LPLP)分析,)分析,并將并將LPCLPC參數(shù)轉(zhuǎn)換到線譜,對(參數(shù)轉(zhuǎn)換到線譜,對(LSPLSP)形式進(jìn)行預(yù)測式)形式進(jìn)行預(yù)測式二階段矢量量化(二階段矢量量化(VQVQ)。然后使用分析合成法,按照)。然后使用分析合成法,按照合成信號和原始信號間感覺加權(quán)失真最小的準(zhǔn)則來提合成信號和原始信號間感覺加權(quán)失真最小的準(zhǔn)則來提取激勵參數(shù)。取激勵參數(shù)。 激勵參數(shù)(包括固定碼本和自適應(yīng)碼本參數(shù))激勵參數(shù)(包括固定碼本和自適應(yīng)碼本參數(shù))要每子幀(要每子幀(5ms5ms)計算一次。每幀要利用感覺加權(quán))計算一次。每幀要利用感覺加權(quán)語音進(jìn)行一次整數(shù)基值基音延時估計,然后進(jìn)行的
44、語音進(jìn)行一次整數(shù)基值基音延時估計,然后進(jìn)行的分?jǐn)?shù)值基音分析,確定自適應(yīng)碼本的延時和增益,分?jǐn)?shù)值基音分析,確定自適應(yīng)碼本的延時和增益,下面再進(jìn)行固定碼本的搜索。固定碼本是使用交織下面再進(jìn)行固定碼本的搜索。固定碼本是使用交織單脈沖排列設(shè)計的代數(shù)碼本。在搜索時使用迭代式單脈沖排列設(shè)計的代數(shù)碼本。在搜索時使用迭代式深度優(yōu)先樹型搜索算法。這種算法的運(yùn)算量比較小,深度優(yōu)先樹型搜索算法。這種算法的運(yùn)算量比較小,并且具有固定的運(yùn)算復(fù)雜度,比較有利于使用硬件并且具有固定的運(yùn)算復(fù)雜度,比較有利于使用硬件實(shí)現(xiàn)。自適應(yīng)碼本和固定碼本的增益使用預(yù)測式二實(shí)現(xiàn)。自適應(yīng)碼本和固定碼本的增益使用預(yù)測式二階段共軛結(jié)構(gòu)碼本進(jìn)行矢量
45、量化。階段共軛結(jié)構(gòu)碼本進(jìn)行矢量量化。 三、三、GSMGSM中的編碼技術(shù)中的編碼技術(shù)(global system for mobile communicationglobal system for mobile communication)(Regular Pulse Excited-Long Term PredictionRegular Pulse Excited-Long Term Prediction)RPE-LTPRPE-LTP是通用分組無線業(yè)務(wù)所采用的語音是通用分組無線業(yè)務(wù)所采用的語音編碼方案。編碼方案。W(z)W(z)誤差最小化誤差最小化+- -線性預(yù)測線性預(yù)測濾波器濾波器感覺加權(quán)感覺加權(quán)濾波器濾波器原始語音原始語音s(n)s(n)激勵激勵發(fā)生器發(fā)生器)(1zAs s (n)(n)e es s(n(n) )規(guī)則脈沖規(guī)則脈沖序列序列RPE-LTPRPE-LTP的原理框圖發(fā)送端的原理框圖發(fā)送端線性預(yù)測濾波器線性預(yù)測濾波器激勵激勵發(fā)生器發(fā)生器)(1zA規(guī)則脈沖規(guī)則脈沖序列序列合成語音合成語音s s (n)(n)RPE-LTPRPE-LTP的原理框圖接收端的原理框圖接收端 人們對激勵信號的研究
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 綠化工程高位水池施工方案
- 變電站避雷器安裝施工方案
- 海纜防護(hù)沉軟體排施工方案
- 黃山大理石欄桿施工方案
- 交房樣板施工方案
- 英語閱讀理解練習(xí)
- 四川廠房滲漏維修施工方案
- 鞍山8年級期中數(shù)學(xué)試卷
- 鹿寨縣國四道路施工方案
- 四川房地產(chǎn)開發(fā)施工方案
- JB T 10291-2013旱地栽植機(jī)械
- 蛋糕投標(biāo)書技術(shù)方案
- 通信網(wǎng)絡(luò)基礎(chǔ)-(李建東-盛敏-)課后習(xí)題答案
- 基本標(biāo)準(zhǔn):康復(fù)醫(yī)療中心的建設(shè)(試行)
- 智鼎在線測評IQT題庫
- 脊柱內(nèi)鏡應(yīng)用與進(jìn)展
- 鹿茸的現(xiàn)代藥理研究報告
- 化工行業(yè)儀表典型事故分析報告
- 2024年初級會計職稱《初級會計實(shí)務(wù)》真題匯編及答案
- 石塑地板鋪貼施工方案
- 醫(yī)用耗材配送服務(wù)方案
評論
0/150
提交評論