版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
關(guān)于信源數(shù)字編碼技術(shù)第一頁,共一百七十三頁,2022年,8月28日3.1概述
圖3.1為一個(gè)完整的數(shù)字通信系統(tǒng)框圖,在該系統(tǒng)中,有兩個(gè)編碼功能塊:信源編碼和信道編碼。
信源編碼:對(duì)信源的信號(hào)進(jìn)行變換,將其變換成適合數(shù)字傳輸系統(tǒng)的形式,進(jìn)而提高傳輸?shù)挠行浴?/p>
信道編碼:通過信道編碼將數(shù)字信號(hào)變換成與調(diào)制方式和傳輸信道匹配的形式,從而降低傳輸誤碼率,提高傳輸?shù)目煽啃?。第二頁,共一百七十三頁?022年,8月28日?qǐng)D3.1數(shù)字通信系統(tǒng)第三頁,共一百七十三頁,2022年,8月28日3.2模擬信號(hào)時(shí)域離散化與抽樣定理
信號(hào)時(shí)域離散化是用一個(gè)周期為T的脈沖信號(hào)控制抽樣電路對(duì)模擬信號(hào)進(jìn)行抽樣,如圖3.2所示。模擬信號(hào)f(t)通過一個(gè)由周期為T的抽樣脈沖信號(hào)s(t)控制的抽樣器得到抽樣后的信號(hào)fs(t)。抽樣定理:如果一個(gè)帶限的模擬信號(hào)f(t)的最高頻率分量為fm,當(dāng)抽樣頻率fs≥2fm時(shí),樣值序列fs(t)可以完全代表原模擬信號(hào)f(t)。第四頁,共一百七十三頁,2022年,8月28日
圖3.2模擬信號(hào)時(shí)域離散化過程(a)被抽樣的模擬信號(hào);(b)抽樣信號(hào);(c)抽樣后的信號(hào)第五頁,共一百七十三頁,2022年,8月28日3.3語音數(shù)字編碼技術(shù)
語音信源編碼主要分三類:波形信源編碼、參數(shù)信源編碼以及混合信源編碼。
波形編碼:直接對(duì)語音信號(hào)離散樣值編碼;
參數(shù)編碼:對(duì)離散語音信號(hào)中提取出來的反映語音的特征值編碼;
混合編碼:波形編碼和參數(shù)編碼的混合應(yīng)用。第六頁,共一百七十三頁,2022年,8月28日3.3.1波形編碼技術(shù)
波形編碼可以在時(shí)域進(jìn)行,也可以在頻域進(jìn)行。
時(shí)域編碼:脈沖編碼、差值脈沖編碼以及子帶編碼。頻域編碼:將語音信號(hào)的時(shí)域樣值通過某種變換在另一域編碼。第七頁,共一百七十三頁,2022年,8月28日1.脈沖編碼
脈沖編碼是在時(shí)域按照某種方法將離散的語音信號(hào)樣值變換成一個(gè)一定位數(shù)的二進(jìn)制碼組的過程,由量化和編碼兩部分構(gòu)成,如圖3.3所示。圖3.3脈沖編碼過程第八頁,共一百七十三頁,2022年,8月28日
量化:幅度取值連續(xù)的模擬信號(hào)變成幅度取值離散的數(shù)字信號(hào),分為標(biāo)量量化和矢量量化,其中標(biāo)量量化又分為均勻量化和非均勻量化。
編碼:量化后的信號(hào)電平值轉(zhuǎn)換為二進(jìn)制碼組,分為線性編碼和非線性編碼第九頁,共一百七十三頁,2022年,8月28日
1)線性編碼線性編碼是先對(duì)樣值進(jìn)行均勻量化,再對(duì)量化值進(jìn)行簡(jiǎn)單的二進(jìn)制編碼。均勻量化:以等間隔對(duì)任意信號(hào)值來量化,將信號(hào)樣值幅度的動(dòng)態(tài)范圍(-U~U)等分成N個(gè)量化級(jí)(間隔),記作Δ(3.3.1)樣值幅度落在某一量化級(jí)內(nèi),就由該級(jí)的量化值來代替第十頁,共一百七十三頁,2022年,8月28日?qǐng)D3.4均勻量化曲線第十一頁,共一百七十三頁,2022年,8月28日
量化器輸入與輸出間的差值稱為量化誤差,記作用n位二進(jìn)制碼對(duì)量化值進(jìn)行編碼,碼組長(zhǎng)度n與量化級(jí)數(shù)N之間的關(guān)系為線性編碼在輸入信號(hào)未過載時(shí)的量化信噪比為
其中:為量化噪聲功率,為信號(hào)功率,ue為輸入信號(hào)電壓有效值。
(3.3.2)(3.3.3)(3.3.4)第十二頁,共一百七十三頁,2022年,8月28日
2)非線性編碼均勻量化的小信號(hào)量化信噪比小,大信號(hào)的量化信噪比大,而語音信號(hào)中小信號(hào)是大概率事件,用非均勻量化來改善小信號(hào)的量化信噪比。(1)非均勻量化。語音信號(hào)中常用的非均勻量化方法是壓擴(kuò)量化。圖3.5(a)為壓擴(kuò)量化編碼的原理框圖,圖3.5(b)為壓擴(kuò)原理示意圖。信號(hào)先經(jīng)過具有壓擴(kuò)特性的放大系統(tǒng),再進(jìn)行均勻量化。第十三頁,共一百七十三頁,2022年,8月28日?qǐng)D3.5非均勻量化原理示意圖第十四頁,共一百七十三頁,2022年,8月28日壓擴(kuò)特性應(yīng)滿足以下對(duì)數(shù)方程:
圖3.6(a)為壓擴(kuò)特性曲線,對(duì)曲線作通過原點(diǎn)的切線,可得A壓擴(kuò)律方程
(3.3.6)式中
(3.3.7)(3.3.5)第十五頁,共一百七十三頁,2022年,8月28日?qǐng)D3.6理想對(duì)數(shù)壓擴(kuò)特性第十六頁,共一百七十三頁,2022年,8月28日
令式(3.3.5)中常數(shù),并將分子由修改為ln(1+μ|x|),分母由修改為ln(1+μ),得μ壓擴(kuò)律方程(3.3.8)第十七頁,共一百七十三頁,2022年,8月28日
(2)μ律、A律的折線實(shí)現(xiàn)通常用折線去逼近實(shí)現(xiàn)壓擴(kuò)律特性①用折線逼近非均勻量化壓擴(kuò)特性曲線;②各段折線的斜率應(yīng)隨x增大而減小;③相鄰兩折線段斜率之比保持為常數(shù);④相鄰的判定值或量化間隔成簡(jiǎn)單的整數(shù)比關(guān)系。條折線逼近律壓擴(kuò)曲線,相鄰兩折線斜率之比為m,各折線端點(diǎn)坐標(biāo)為:第十八頁,共一百七十三頁,2022年,8月28日(3.3.9)
圖3.7畫出了μ律255/15折線正半軸的折線圖,表3.1給出了μ律255/15折線各折線段的參數(shù)。第十九頁,共一百七十三頁,2022年,8月28日?qǐng)D3.7μ律255/15折線壓擴(kuò)律曲線第二十頁,共一百七十三頁,2022年,8月28日
表3.1μ律255/15折線段端點(diǎn)坐標(biāo)值和斜率
由上表可知,μ律各折線段端點(diǎn)之比不是m的倍數(shù)第二十一頁,共一百七十三頁,2022年,8月28日
NA條折線逼近A律壓擴(kuò)曲線,相鄰兩折線斜率之比為m,各折線段端點(diǎn)之比為m的倍數(shù)各折線段長(zhǎng)度之比為第二十二頁,共一百七十三頁,2022年,8月28日A律各折線段端點(diǎn)坐標(biāo)為:(3.3.12)
圖3.8畫出了A律87.6/13折線正半軸的折線圖,表3.2給出了A律87.6/13折線各折線段的參數(shù)。第二十三頁,共一百七十三頁,2022年,8月28日
圖3.813折線A壓擴(kuò)律曲線第二十四頁,共一百七十三頁,2022年,8月28日表3.2A(87.6)律曲線和13折線段端點(diǎn)坐標(biāo)和斜率
第二十五頁,共一百七十三頁,2022年,8月28日國際上主要采用的壓擴(kuò)律:A律13折線和μ律15折線,歐洲各國的PCM-30/32路系統(tǒng)采用A律13折線壓擴(kuò)律,美國、加拿大、日本等國的PCM-24路系統(tǒng)采用μ律15折線壓擴(kuò)律。(3)非線性編碼
非線性編碼以A律13折線為例。
碼字安排:用8位碼A1A2A3A4A5A6A7A8表示一個(gè)語音樣值:極性碼A1表示信號(hào)的極性(正信號(hào)為“1”,反之為“0”),段落碼A2A3A4表示13折線的8大段,段內(nèi)碼A5A6A7A8表示折線段內(nèi)的16個(gè)小段。
表3.3、表3.4分別給出了各段段落長(zhǎng)度和段內(nèi)量化級(jí)、段落與電平關(guān)系。第二十六頁,共一百七十三頁,2022年,8月28日表3.3各段段落長(zhǎng)度和段內(nèi)量化級(jí)
第一、二段長(zhǎng)度為1/128,16等分后每小段為1/2048,是所有段中的最小量化單位,稱為最小量化級(jí)()。第二十七頁,共一百七十三頁,2022年,8月28日
表3.4段落與電平關(guān)系第二十八頁,共一百七十三頁,2022年,8月28日
編碼方法:常用的非線性PCM編碼方法有代碼變換法和直接編碼法。
●代碼變換:先進(jìn)行12位線性編碼,然后將12位線性代碼變換為8位非線性代碼。表3.5給出了非線性與線性代碼電平關(guān)系。編碼步驟:①將樣值編成12位線性碼;②將11位線性幅度碼變換為7位非線性碼。
第二十九頁,共一百七十三頁,2022年,8月28日表3.5非線性與線性代碼電平關(guān)系表第三十頁,共一百七十三頁,2022年,8月28日
例1設(shè)語音樣值為+276Δ,用代碼變換法將其編成PCM碼。a)樣值極性為正,B0=1;b)將276轉(zhuǎn)換成二進(jìn)制碼(276)10=(100010100)2樣值的12位線性碼為100100010100。c)由表3.5知,線性代碼除第1段外,其幅度代碼的首位均為“1”。第三十一頁,共一百七十三頁,2022年,8月28日(3.3.13)(3.3.14)為了求得樣值所在的折線段D,先求得二進(jìn)制幅度碼有效位長(zhǎng)W,再由第三十二頁,共一百七十三頁,2022年,8月28日
由W=9可知k=11-9=2,(5)10=(101)2,所以樣值在第6段,段落碼為A2A3A4=101。d)由表3.5知,線性代碼的幅度碼的第一個(gè)“1”后緊接著的4位代碼就是非線性代碼中的段內(nèi)碼。所以段內(nèi)碼A5A6A7A8=0001。+276Δ的PCM碼字為11010001,量化電平為256Δ+16Δ=272Δ,編碼誤差為276Δ-272Δ=4Δ<Δ′=256Δ/16=16Δ,Δ′為第6段內(nèi)的量化級(jí)。第三十三頁,共一百七十三頁,2022年,8月28日●直接編碼:直接對(duì)信號(hào)樣值進(jìn)行非線性編碼。直接編碼法最常用的實(shí)現(xiàn)方法是逐次反饋比較法,圖3.9給出了逐次反饋編碼器的實(shí)現(xiàn)方框圖。
編碼步驟:①由極性判決電路確定極性碼A1;②對(duì)整流后的信號(hào)樣值幅度,用三次中值比較編出段落碼A2A3A4,求出對(duì)應(yīng)的段落起點(diǎn)電平;
③再用四次中值比較,確定段內(nèi)碼A5A6A7A8及相應(yīng)的電平;
④在各次比較編碼的同時(shí)輸出編出的碼組。第三十四頁,共一百七十三頁,2022年,8月28日?qǐng)D3.9逐次反饋編碼器原理方框圖第三十五頁,共一百七十三頁,2022年,8月28日
例2對(duì)語音信號(hào)樣值+276Δ,用逐次反饋比較法編出相應(yīng)的PCM碼組。
D1時(shí)刻,IC>0,極性碼A1=1。
D2時(shí)刻,本地解碼器輸出IS=128Δ(第4、5段的分界電平),IC>IS,A2=1,信號(hào)在第5~8段。
D3時(shí)刻,本地解碼器輸出IS=512Δ(第6、7段的分界電平),IC<IS,A3=0,信號(hào)在第5~6段。
D4時(shí)刻,本地解碼器輸出IS=256Δ(第5、6段的分界電平),IC>IS,A4=1,信號(hào)在第6段。第三十六頁,共一百七十三頁,2022年,8月28日D5時(shí)刻,本地解碼器輸出IS=256Δ+8*16Δ=384Δ,(第8、9小段的分界電平),IC<IS,A5=0;
D6時(shí)刻,本地解碼器輸出IS=256Δ+4*16Δ=320Δ,(第4、5小段的分界電平),IC<IS,A6=0。
D7時(shí)刻,本地解碼器輸出IS=256Δ+2*16Δ=288Δ,(第2、3小段的分界電平),IC<IS,A7=0。
D8時(shí)刻,本地解碼器輸出IS=256Δ+16Δ=272Δ,(第1、2小段的分界電平),IC>IS,A8=1。
+276Δ的編碼為“11010001”,量化電平為256Δ+16Δ=272Δ,編碼誤差276Δ-272Δ=4Δ<Δ′=256Δ/16=16Δ,Δ′為第6段內(nèi)的量化級(jí)。
第三十七頁,共一百七十三頁,2022年,8月28日
2.差值脈沖編碼差值脈沖編碼是對(duì)抽樣信號(hào)當(dāng)前樣值的真值與估值的幅度差值進(jìn)行量化編碼調(diào)制。圖2.10為差值編碼的原理框圖。圖3.10差值脈沖編碼的原理框圖第三十八頁,共一百七十三頁,2022年,8月28日
常用的差值編碼主要有增量調(diào)制(DM或ΔM
)、差值編碼調(diào)制(DPCM)以及自適應(yīng)差值脈沖編碼調(diào)制(ADPCM)1)增量調(diào)制對(duì)輸入信號(hào)樣值的增量(增加量或減少量)用一位二進(jìn)碼進(jìn)行編碼傳輸?shù)姆椒ǚQ作增量調(diào)制,簡(jiǎn)稱DM或ΔM。增量大于0時(shí)為“1”,增量小于0時(shí)為“0”。圖3.11為DM構(gòu)成原理框圖及編碼過程。第三十九頁,共一百七十三頁,2022年,8月28日
圖3.11簡(jiǎn)單DM原理與編碼過程第四十頁,共一百七十三頁,2022年,8月28日
DM調(diào)制原理框圖主要由減法電路,判決和碼形成以及本地解碼電路組成。圖中fs(t)為輸入信號(hào),本地解碼器(可用簡(jiǎn)單的RC積分電路實(shí)現(xiàn))預(yù)測(cè)輸出信號(hào)估值fdˊ(t),相減電路輸出e(t)=fs(t)-fdˊ(t),判決和碼形成電路判決e(t)極性并編碼,e(t)>0時(shí)判為“1”,輸出+E電平,e(t)<0時(shí)判為“0”,輸出-E電平。第四十一頁,共一百七十三頁,2022年,8月28日
圖32.11(b)~(d)說明了DM的工作過程。輸入信號(hào)為fs(t),積分器初始狀態(tài)為零,即,則有:當(dāng)t=0時(shí),預(yù)測(cè)值編碼為“1”;當(dāng)t=T時(shí),預(yù)測(cè)值編碼為“0”;第四十二頁,共一百七十三頁,2022年,8月28日當(dāng)t=2T時(shí),預(yù)測(cè)值編碼為“1”;當(dāng)t=3T時(shí),預(yù)測(cè)值編碼為“1”;當(dāng)t=4T時(shí),預(yù)測(cè)值編碼為“1”;當(dāng)t=5T時(shí),預(yù)測(cè)值編碼為“1”;第四十三頁,共一百七十三頁,2022年,8月28日當(dāng)t=6T時(shí),預(yù)測(cè)值
編碼為“0”;當(dāng)t=7T時(shí),預(yù)測(cè)值編碼為“0”;當(dāng)t=8T時(shí),預(yù)測(cè)值編碼為“1”。第四十四頁,共一百七十三頁,2022年,8月28日
2)差值脈沖編碼調(diào)制將輸入信號(hào)樣值的差值量化、編碼成n位二進(jìn)碼,稱為差值脈沖編碼調(diào)制(DPCM)。DM可看作DPCM的特例。圖3.12示出了基本的DPCM系統(tǒng)框圖,預(yù)測(cè)器產(chǎn)生預(yù)測(cè)信號(hào),差值信號(hào)e(t)=fs(t)-fdˊ(t)經(jīng)過多電平均勻量化器Q[·]量化為多電平信號(hào)eˊ(t)
,eˊ(t)一路送線性PCM編碼器編碼成DPCM碼,另一路與相加后反饋到預(yù)測(cè)器。第四十五頁,共一百七十三頁,2022年,8月28日?qǐng)D3.12DPCM系統(tǒng)原理框圖
第四十六頁,共一百七十三頁,2022年,8月28日
3)自適應(yīng)差值脈沖編碼調(diào)制自適應(yīng)差值脈沖編碼調(diào)制(ADPCM)系統(tǒng)是在DPCM系統(tǒng)基礎(chǔ)上,根據(jù)差值大小調(diào)整量化階大小(自適應(yīng)量化),使輸入信號(hào)與預(yù)測(cè)信號(hào)差值最?。ㄗ赃m應(yīng)預(yù)測(cè))。圖3.13為ADPCM系統(tǒng)的原理框圖。第四十七頁,共一百七十三頁,2022年,8月28日?qǐng)D3.13ADPCM系統(tǒng)原理框圖(a)編碼器;(b)解碼器第四十八頁,共一百七十三頁,2022年,8月28日(1)自適應(yīng)量化量化階距Δ(t)隨輸入信號(hào)能量變化。常用的自適應(yīng)量化實(shí)現(xiàn)方案有:前饋?zhàn)赃m應(yīng)量化(直接用輸入信號(hào)方差控制Δ(t)的變化,如圖3.13中雙虛線所示),反饋?zhàn)赃m應(yīng)量化(通過編碼器輸出碼流估算輸入信號(hào)方差,進(jìn)而控制Δ(t),如圖3.13中單虛線所示)。(2)自適應(yīng)預(yù)測(cè)輸入信號(hào)預(yù)測(cè)值隨輸入信號(hào)能量變化。常用的自適應(yīng)預(yù)測(cè)實(shí)現(xiàn)方案有:前饋?zhàn)赃m應(yīng)預(yù)測(cè)和反饋?zhàn)赃m應(yīng)預(yù)測(cè)。ADPCM是語音波形壓縮編碼傳輸廣泛采用的一種方式。第四十九頁,共一百七十三頁,2022年,8月28日
3.子帶編碼將語音信號(hào)頻帶分割成若干個(gè)帶寬較窄的子帶,分別對(duì)這些子帶信號(hào)進(jìn)行獨(dú)立編碼的方式,稱為子帶編碼(SBC—Sub-BandCoding)。1)SBC基本原理首先通過一組帶通濾波器把輸入信號(hào)頻帶分拆成若干個(gè)子帶信號(hào),每個(gè)子帶信號(hào)經(jīng)過調(diào)制后,被變換成低通信號(hào),然后進(jìn)行單獨(dú)的編碼,再將各路子帶碼流用合路器復(fù)接起來。圖3.15為子帶編碼原理方框圖。第五十頁,共一百七十三頁,2022年,8月28日?qǐng)D3.15子帶編碼原理框圖第五十一頁,共一百七十三頁,2022年,8月28日2)子帶的劃分語音信號(hào)通常分成4~6個(gè)子帶,各子帶的帶寬應(yīng)考慮到各頻段對(duì)主觀聽覺貢獻(xiàn)相等的原則做合理的分配,子帶間允許有小的間隙,如圖3.16所示。表3.6給出了一個(gè)16kb/s的子帶編碼器的典型參數(shù)(輸入信號(hào)取樣率為6400Hz)。第五十二頁,共一百七十三頁,2022年,8月28日?qǐng)D3.16子帶劃分頻域示意第五十三頁,共一百七十三頁,2022年,8月28日表3.616kb/sSBC系統(tǒng)典型參數(shù)第五十四頁,共一百七十三頁,2022年,8月28日
4.變換域編碼先將信號(hào)進(jìn)行某種函數(shù)變換(從一種描述空間變換到另一種描述空間),再對(duì)變換后的信號(hào)進(jìn)行編碼。1)數(shù)學(xué)模型
將一幀語音信號(hào)s(n),0≤n≤N-1,描述為一個(gè)矢量:若A為正交變換矩陣,即(3.3.16)(3.3.17)(3.3.18)(3.3.19)第五十五頁,共一百七十三頁,2022年,8月28日
例3設(shè),變換矩陣為輸出序列:接收端反變換后恢復(fù)序列:第五十六頁,共一百七十三頁,2022年,8月28日2)幾種常用變換(1)離散傅氏變換(DFT)正變換:
式中:(3.3.20)反變換:(3.3.21)第五十七頁,共一百七十三頁,2022年,8月28日
例4由DFT定義,4×4DFT變換矩陣為設(shè)信源信號(hào)的協(xié)方差矩陣為第五十八頁,共一百七十三頁,2022年,8月28日變換后信號(hào)的協(xié)方差矩陣:第五十九頁,共一百七十三頁,2022年,8月28日(2)沃爾什—哈德曼變換(WHT)變換矩陣:式中,AWH(1)=1。WHT變換公式為第六十頁,共一百七十三頁,2022年,8月28日
例5設(shè)N=4第六十一頁,共一百七十三頁,2022年,8月28日信源信號(hào)協(xié)方差矩陣同例4,變換后信號(hào)的協(xié)方差矩陣:第六十二頁,共一百七十三頁,2022年,8月28日
(3)離散余弦變換(DCT)正變換:(3.3.24)(3.3.25)逆變換(IDCT):第六十三頁,共一百七十三頁,2022年,8月28日
例64階DCT變換矩陣為
c、d為實(shí)數(shù),信源信號(hào)協(xié)方差矩陣同例4,變換后信號(hào)的協(xié)方差矩陣:第六十四頁,共一百七十三頁,2022年,8月28日
3)自適應(yīng)變換編碼(ATC)實(shí)現(xiàn)原理ATC系統(tǒng)的實(shí)現(xiàn)原理:利用正交變換把時(shí)域信號(hào)變換到另一域,再對(duì)變換域信號(hào)進(jìn)行最佳量化。圖3.17為ATC系統(tǒng)原理框圖,時(shí)域信號(hào)經(jīng)變換后,將表征信號(hào)譜的邊帶信息提取出來,邊帶信息一方面用來估計(jì)信號(hào)譜,從而控制量化間隔和編碼比特分配;另一方面被編碼傳送到收端用于重構(gòu)收端信源信號(hào)。第六十五頁,共一百七十三頁,2022年,8月28日?qǐng)D3.17ATC系統(tǒng)原理框圖緩存變換量化編碼提取邊帶信息計(jì)算量化間隔、比特分配譜估計(jì)合路器分路器解碼s(n)輸入信道輸出逆變換緩存s(n)計(jì)算量化間隔、比特分配譜估計(jì)第六十六頁,共一百七十三頁,2022年,8月28日
3.3.2參數(shù)編碼技術(shù)對(duì)語音參數(shù)編碼來傳輸語音的方式稱為語音參數(shù)編碼。
1語音產(chǎn)生模型及特征參數(shù)1)語音信號(hào)模型根據(jù)激勵(lì)源與聲道模型的不同,語音可分為濁音和清音。
第六十七頁,共一百七十三頁,2022年,8月28日
(1)濁音及基音濁音,又稱有聲音。發(fā)濁音時(shí)聲帶在氣流的作用下準(zhǔn)周期地開啟和閉合,在聲道中激勵(lì)起準(zhǔn)周期的聲波,如圖3.18所示。
圖3.18濁音聲波波形圖第六十八頁,共一百七十三頁,2022年,8月28日
語音信號(hào)具有非平穩(wěn)性和隨機(jī)性,只能用短時(shí)傅氏變換求它的頻譜。圖3.19為采用漢明窗函數(shù)截短的濁音段及典型頻譜。頻譜圖上小峰點(diǎn)對(duì)應(yīng)基音的諧波頻率,“尖峰”形狀頻譜說明濁音信號(hào)的能量集中在各基音諧波頻率附近,而且主要集中于低于3000Hz的范圍內(nèi)。第六十九頁,共一百七十三頁,2022年,8月28日
圖3.19濁音段窗取波形及典型頻譜(a)漢明窗取濁音波形;(b)濁音典型頻譜第七十頁,共一百七十三頁,2022年,8月28日
(2)清音清音又稱無聲音。氣流速度達(dá)到某一臨界速度時(shí)就會(huì)引起湍流,此時(shí)聲帶不振動(dòng),聲道相當(dāng)于被噪聲狀隨機(jī)波激勵(lì),產(chǎn)生較小幅度的聲波,其波形與噪聲很像,這就是清音,如圖3.20所示。第七十一頁,共一百七十三頁,2022年,8月28日
圖3.20清音波形圖第七十二頁,共一百七十三頁,2022年,8月28日?qǐng)D3.21清音典型頻譜第七十三頁,共一百七十三頁,2022年,8月28日
(3)共振峰及聲道參數(shù)聲道頻率特性(唇口聲速u出與聲門聲速u入之比)與諧振曲線類似,如圖3.22所示。頻率特性對(duì)應(yīng)的諧振點(diǎn)叫共振峰頻率。圖3.22聲道頻率特性第七十四頁,共一百七十三頁,2022年,8月28日
(4)語音信號(hào)產(chǎn)生模型語音信號(hào)發(fā)生過程可以抽象為圖3.23所示的物理模型。圖3.23語音信號(hào)產(chǎn)生模型第七十五頁,共一百七十三頁,2022年,8月28日
2)語音特征參數(shù)及提取方法基音周期、共振峰頻率、清/濁音判決和語音強(qiáng)度等都屬于語音信號(hào)的特征參數(shù)?;糁芷诤颓?濁音判決可以同時(shí)獲得,其方法主要有三大類:①時(shí)域法,直接用語音信號(hào)波形來估計(jì);②頻域法,將語音信號(hào)變換到頻域來估計(jì);③混合法,綜合語音信號(hào)的頻域和時(shí)域特性來估計(jì)。聲道參數(shù)和語音強(qiáng)度等特征參數(shù)通過語音分析器或合成器中的線性預(yù)測(cè)分析系統(tǒng)獲取。第七十六頁,共一百七十三頁,2022年,8月28日
2聲碼器簡(jiǎn)介及發(fā)展
語音信號(hào)的分析合成:發(fā)端分析提取表征音源和聲道的特征參數(shù),通過適當(dāng)量化編碼方式傳輸?shù)浇邮斩?,收端利用這些參數(shù)重新合成發(fā)端語音信號(hào)。聲碼器:實(shí)現(xiàn)語音信號(hào)分析合成的系統(tǒng)。常見的聲碼器有:相位聲碼器、通道聲碼器、共振峰聲碼器以及線性預(yù)測(cè)聲碼器。第七十七頁,共一百七十三頁,2022年,8月28日1)相位聲碼器
估計(jì)各通道信號(hào)的幅度和相位導(dǎo)數(shù),并對(duì)它們進(jìn)行編碼。圖3.24為相位聲碼器單通道實(shí)現(xiàn)框圖。圖中,ωk為該通道濾波器的中心頻率,Wk(n)是分析窗函數(shù),輸入信號(hào)s(n)經(jīng)分析窗后得到信號(hào)的實(shí)部和虛部,轉(zhuǎn)換成對(duì)應(yīng)的幅度信號(hào)和相位導(dǎo)數(shù)信號(hào),然后進(jìn)行量化編碼傳輸。第七十八頁,共一百七十三頁,2022年,8月28日?qǐng)D3.24相位聲碼器單通道實(shí)現(xiàn)框圖(a)發(fā)端;(b)收端第七十九頁,共一百七十三頁,2022年,8月28日2)通道聲碼器
圖3.25為通道聲碼器實(shí)現(xiàn)原理框圖。利用了人耳對(duì)相位特性的不敏感性,只傳送語音信號(hào)的幅度,而不考慮相位信息。圖3.25通道聲碼器原理方框圖第八十頁,共一百七十三頁,2022年,8月28日
3)共振峰聲碼器采用共振峰作為語音特征傳輸參數(shù)的聲碼器成為共振峰聲碼器。圖3.26為共振峰聲碼器原理框圖。發(fā)端提取的語音參數(shù)有基音周期(TP)、清/濁音判決(uv/v)、語音強(qiáng)度(G)和共振峰參數(shù)。F1~F3為共振峰頻率,A1~A3為相應(yīng)的共振峰強(qiáng)度。
第八十一頁,共一百七十三頁,2022年,8月28日?qǐng)D3.26共振峰聲碼器原理框圖(a)發(fā)端;(b)收端
第八十二頁,共一百七十三頁,2022年,8月28日
4)線性預(yù)測(cè)聲碼器
線性預(yù)測(cè)聲碼器(LPC聲碼器)建立在二元語音信號(hào)模型(圖3.23)基礎(chǔ)上。將語音用少量特征參數(shù):清/濁音判決、基音周期、聲道參數(shù)和語音強(qiáng)度G來表示。圖3.27為L(zhǎng)PC聲碼器的原理框圖。圖3.28為L(zhǎng)PC聲碼器中的合成器框圖。第八十三頁,共一百七十三頁,2022年,8月28日?qǐng)D3.27LPC聲碼器原理框圖(a)發(fā)端;(b)收端預(yù)加重反預(yù)加重自相關(guān)線性預(yù)測(cè)分析量化編碼s(n)Guv/vTP至信道解碼合成器自信道入合成語音加窗{ai}基音周期提取清/濁音判決(a)s(n)(b)第八十四頁,共一百七十三頁,2022年,8月28日?qǐng)D3.28LPC聲碼器中的合成器第八十五頁,共一百七十三頁,2022年,8月28日
3.3.3混合編碼技術(shù)1LPC聲碼器的主要缺陷及改進(jìn)方法
LPC聲碼器的缺點(diǎn):①損失了語音自然度。②降低了方案的可靠性。③易引起共振峰位置失真。④帶寬估值誤差大。第八十六頁,共一百七十三頁,2022年,8月28日
LPC聲碼器的改進(jìn)方案:
波形自適應(yīng)預(yù)測(cè)編碼(APC)在壓縮數(shù)碼率的同時(shí)能夠獲得較高質(zhì)量的重構(gòu)語音。圖3.29為APC與LPC的方案比較。圖(a)為APC原理框圖,線性預(yù)測(cè)分析估計(jì)出的M個(gè)LPC參數(shù)組成的M階FIR濾波器對(duì)語音樣值自適應(yīng)預(yù)測(cè)得預(yù)測(cè)誤差信號(hào)(余數(shù)信號(hào)),和量化編碼后送入信道。收端,解碼后的LPC參數(shù)和余數(shù)信號(hào)利用IIR濾波器恢復(fù)出語音信號(hào)。第八十七頁,共一百七十三頁,2022年,8月28日?qǐng)D3.29APC與LPC方案比較(a)APC方案;(b)LPC方案第八十八頁,共一百七十三頁,2022年,8月28日
2余數(shù)激勵(lì)線性預(yù)測(cè)編碼聲碼器(RELPC)
語音余數(shù)信號(hào)低頻譜中的一部分(基帶余數(shù)信號(hào))替代清/濁音判決和基音周期傳送到收端作為激勵(lì)信號(hào),圖3.30為RELPC系統(tǒng)原理框圖。發(fā)端用低通濾波器濾出基帶余數(shù)信號(hào),將預(yù)測(cè)參數(shù)和基帶余數(shù)信號(hào)量化編碼送入信道。收端,基帶余數(shù)信號(hào)通過插值、高頻再生得到全帶余數(shù)信號(hào),解碼后的LPC參數(shù)和全帶余數(shù)信號(hào)用IIR濾波器恢復(fù)出語音信號(hào)。
第八十九頁,共一百七十三頁,2022年,8月28日?qǐng)D3.30RELPC系統(tǒng)原理框圖(a)發(fā)端;(b)收端第九十頁,共一百七十三頁,2022年,8月28日3多脈沖激勵(lì)線性預(yù)測(cè)編碼聲碼器(MPC)通過研究語音模型的激勵(lì)形式可以發(fā)現(xiàn):無論是合成清音還是濁音,都采用一個(gè)數(shù)目有限、幅度和位置可以調(diào)整的脈沖序列作為激勵(lì)源,因而稱為多脈沖激勵(lì)LPC聲碼器。圖3.31為MPC算法原理框圖,根據(jù)合成語音與原始語音之間的均方誤差最小準(zhǔn)則,遞推分析出一組多脈沖參數(shù)(位置及幅度),然后與LPC參數(shù)量化編碼送入信道。第九十一頁,共一百七十三頁,2022年,8月28日?qǐng)D3.31MPC算法原理框圖(a)發(fā)端;(b)收端第九十二頁,共一百七十三頁,2022年,8月28日4規(guī)則激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)編碼(RPE-LTP)
用一組由余數(shù)信號(hào)獲得的間距相等、相位與幅度優(yōu)化的規(guī)則脈沖代替余數(shù)信號(hào),使得合成語音波形盡量逼近原始語音信號(hào)。圖3.32為GSMRPE-LTP編碼器原理框圖,主要由預(yù)處理、LPC分析、短時(shí)分析濾波、長(zhǎng)時(shí)預(yù)測(cè)和規(guī)則激勵(lì)碼編碼五大部分構(gòu)成。
第九十三頁,共一百七十三頁,2022年,8月28日?qǐng)D3.32GSMRPE-LTP編碼原理框圖第九十四頁,共一百七十三頁,2022年,8月28日
①預(yù)處理去除s0(n)中的支流分量;進(jìn)行高頻分量預(yù)加重(鑒頻器的輸出噪聲功率譜按頻率的平方規(guī)律增加)。
②LPC分析提取LPC參數(shù)。先求出信號(hào)的自相關(guān)系數(shù),然后求出LPC反射系數(shù),反射系數(shù)先取對(duì)數(shù)面積比參數(shù)(減小量化誤差)后再量化編碼。
③
短時(shí)分析濾波
對(duì)信號(hào)s(n)進(jìn)行LPC短時(shí)預(yù)測(cè)分析,產(chǎn)生余數(shù)信號(hào)d。
第九十五頁,共一百七十三頁,2022年,8月28日
④長(zhǎng)時(shí)預(yù)測(cè)
對(duì)余數(shù)信號(hào)進(jìn)行長(zhǎng)時(shí)預(yù)測(cè),分為長(zhǎng)時(shí)分析和長(zhǎng)時(shí)預(yù)測(cè)兩部分。長(zhǎng)時(shí)分析估計(jì)預(yù)測(cè)系數(shù)b和預(yù)測(cè)最佳延時(shí)樣點(diǎn)數(shù)N,編碼后傳送到收端;長(zhǎng)時(shí)預(yù)測(cè)利用恢復(fù)出的長(zhǎng)時(shí)預(yù)測(cè)系數(shù)N′、b′和短時(shí)余數(shù)信號(hào)d′預(yù)測(cè)當(dāng)前子幀的余數(shù)信號(hào)d"。
⑤
規(guī)則激勵(lì)碼編碼
先提取規(guī)則序列碼,然后對(duì)所確定的序列進(jìn)行量化編碼。第九十六頁,共一百七十三頁,2022年,8月28日
5矢量和激勵(lì)線性預(yù)測(cè)編碼(VSELP)對(duì)余數(shù)信號(hào)進(jìn)行矢量量化,從激勵(lì)矢量碼本中挑選出一個(gè)最佳序列(激勵(lì)矢量)代替余數(shù)信號(hào),使由其合成的語音波形與原始語音波形的加權(quán)均方誤差最小(只傳送激勵(lì)矢量在碼本中的序號(hào)和其他邊帶信息)。圖334為EIA/TIAVSELP方案實(shí)現(xiàn)原理框圖。
第九十七頁,共一百七十三頁,2022年,8月28日?qǐng)D3.34EIA/TIAVSELP方案實(shí)現(xiàn)原理框圖(a)編碼器原理框圖;(b)解碼器原理框圖
加權(quán)濾波器W(z)碼本Ⅰ碼本ⅡH(z)∑e2長(zhǎng)時(shí)預(yù)測(cè)狀態(tài)選擇I、L和H使總加權(quán)誤差最小LIHbg1加權(quán)綜合濾波器長(zhǎng)時(shí)預(yù)測(cè)狀態(tài)碼本Ⅰ碼本Ⅱ基音濾波器綜合濾波器A(z)頻譜后濾波Hqg1qex(n)總加權(quán)誤差+輸出語音s(n)g2+{ai}+I(xiàn)qLqbg2q+{aiq}(a)(b)p(n)p'(n)_第九十八頁,共一百七十三頁,2022年,8月28日
VSELP編碼器中除了提取LPC參數(shù)外,主要是確定長(zhǎng)時(shí)預(yù)測(cè)狀態(tài)和短時(shí)激勵(lì)失量。經(jīng)過短時(shí)、長(zhǎng)時(shí)預(yù)測(cè)后的語音余數(shù)信號(hào)s(n)通過加權(quán)濾波后得信號(hào)p(n),與由矢量和激勵(lì)信號(hào)通過加權(quán)綜合濾波器恢復(fù)的余數(shù)信號(hào)p′(n)相減得誤差信號(hào)e(n),再利用加權(quán)誤差和最小準(zhǔn)則來確定長(zhǎng)時(shí)預(yù)測(cè)狀態(tài)和短時(shí)激勵(lì)矢量。第九十九頁,共一百七十三頁,2022年,8月28日6低時(shí)延碼激勵(lì)線性預(yù)測(cè)編碼(LD―CELP)圖3.35為L(zhǎng)D―CELP原理框圖,輸入PCM信碼經(jīng)非線性/線性轉(zhuǎn)換變成均勻量化的PCM信號(hào)并以5個(gè)樣值組成一個(gè)信源矢量存入緩沖器;虛線框輸出一個(gè)與輸入語音樣值誤差最小的合成語音樣值;合成語音樣值與緩沖器中的輸入語音矢量的誤差信號(hào)經(jīng)感覺加權(quán)濾波,根據(jù)最小均方誤差準(zhǔn)則輸出對(duì)應(yīng)的碼字編號(hào)傳送到接收端。第一百頁,共一百七十三頁,2022年,8月28日?qǐng)D3.35LD―CELP原理框圖(a)發(fā)端編碼器;(b)收端編碼器非線性/線性轉(zhuǎn)換緩沖器5維激勵(lì)碼本增益控制50階綜合濾波器10階感覺加權(quán)濾波器均方誤差最小準(zhǔn)則后向LPC分析增益自適應(yīng)調(diào)節(jié)16kbit/s參數(shù)碼流+-5維激勵(lì)碼本增益控制50階綜合濾波器10階感覺加權(quán)濾波器線性/非線性轉(zhuǎn)換16kbit/s參數(shù)碼流后向LPC分析增益自適應(yīng)調(diào)節(jié)64kbit/sPCM碼流64kbit/sPCM碼流+(a)(b)第一百零一頁,共一百七十三頁,2022年,8月28日7多帶激勵(lì)線性預(yù)測(cè)編碼(MBE)
基于頻域的語音信號(hào)產(chǎn)生模型——多帶激勵(lì)模型,提高了合成語音的自然度。圖3.36為MBE語音信號(hào)產(chǎn)生模型,按基音各諧波頻率將語音頻譜分成若干個(gè)諧波帶,再將幾個(gè)諧波帶為一組進(jìn)行分帶,分別對(duì)各帶進(jìn)行清/濁音判決。濁音帶用以基音周期為周期的脈沖序列譜作為激勵(lì)信號(hào)譜,清音帶用白噪聲譜作為激勵(lì)信號(hào)譜。圖3.37、圖3.38分別MBE算法發(fā)端語音分析原理框圖和收端語音合成框圖。第一百零二頁,共一百七十三頁,2022年,8月28日?qǐng)D3.36MBE語音信號(hào)產(chǎn)生模型生器發(fā)生器T
/1AM12M2Sw)P脈沖序列發(fā)生器白噪聲發(fā)生器Σ濁音清音頻域分帶uvv開關(guān)A頻帶頻帶頻帶…A(第一百零三頁,共一百七十三頁,2022年,8月28日?qǐng)D3.37MBE模型參數(shù)分析提取過程第一百零四頁,共一百七十三頁,2022年,8月28日?qǐng)D3.38MBE方案語音合成過程第一百零五頁,共一百七十三頁,2022年,8月28日3.4數(shù)字音頻編碼標(biāo)準(zhǔn)
3.4.1話音音頻編碼標(biāo)準(zhǔn)
1G.711標(biāo)準(zhǔn)CCITT于1972年規(guī)范了模擬話音信號(hào)用PCM編碼時(shí)的特性,主要內(nèi)容:①模擬信號(hào)取樣率標(biāo)稱值為每秒8000個(gè)樣值,容差為±50ppm。②推薦A律和μ律兩種編碼率,量化值的數(shù)目由編碼律決定,每個(gè)樣值編碼為8位二進(jìn)制數(shù)碼。第一百零六頁,共一百七十三頁,2022年,8月28日
③A律(或μ律)的每一個(gè)“判決值”和“量化值”應(yīng)當(dāng)與一個(gè)“均勻的PCM值”相關(guān)聯(lián)。④串行傳輸時(shí)樣值編碼碼字中首先傳送極性比特,最后傳送最低有效位比特。⑤A律(或μ律)各規(guī)定了一個(gè)字符信號(hào)周期序列,周期序列加到PCM復(fù)用設(shè)備解碼器輸入端時(shí),任一音頻輸出端應(yīng)當(dāng)出現(xiàn)一個(gè)標(biāo)稱電平為0dBm0的1kHz正弦信號(hào)。⑥理論負(fù)載容量:A律為+3.14dBm0,μ律為+3.17dBm0。第一百零七頁,共一百七十三頁,2022年,8月28日
2G.721標(biāo)準(zhǔn)
CCITT于1988年為實(shí)現(xiàn)64kb/sA律或μ律PCM與32kb/sADPCM數(shù)字信道之間相互轉(zhuǎn)換而制訂的。協(xié)議中提出了一種PCMADPCM轉(zhuǎn)換編碼算法。3G.722標(biāo)準(zhǔn)
CCITT于1988年規(guī)范了一種音頻(50~7000Hz)編碼系統(tǒng)的特性,該系統(tǒng)可用于各種質(zhì)量比較高的語聲應(yīng)用,編碼系統(tǒng)使用比特率在64kb/s以內(nèi)的子帶自適應(yīng)差分脈沖編碼調(diào)制(SC-ADPCM)。圖3.39為64kb/s音頻編/解碼器的原理框圖。表3.12為G.722基本工作模式。第一百零八頁,共一百七十三頁,2022年,8月28日?qǐng)D3.39G.722編/解碼器原理框圖(a)發(fā)端編碼器;(b)收端解碼器第一百零九頁,共一百七十三頁,2022年,8月28日表3.12G.722基本工作模式第一百一十頁,共一百七十三頁,2022年,8月28日
4G.728標(biāo)準(zhǔn)CCITT于1992年制訂了G.728標(biāo)準(zhǔn),使用基于短時(shí)延碼本激勵(lì)線性預(yù)測(cè)編碼(LD―CELP)算法,標(biāo)準(zhǔn)對(duì)LD―CELP算法進(jìn)行了概述,并分別介紹了發(fā)端編碼器和收端解碼器的實(shí)現(xiàn)原理和功能,而且對(duì)各種計(jì)算方法和參數(shù)進(jìn)行了詳細(xì)規(guī)定。5G.729標(biāo)準(zhǔn)ITU-T于1995年制訂了G.729標(biāo)準(zhǔn),提出一種采用共軛結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測(cè)(CS―ACELP)方法,以8kb/s速率對(duì)語音信號(hào)編碼。圖3.40、圖3.41分別為G.729給出的發(fā)端編碼器、收端解碼器的原理框圖。第一百一十一頁,共一百七十三頁,2022年,8月28日?qǐng)D3.40CS―ACELP編碼器原理第一百一十二頁,共一百七十三頁,2022年,8月28日?qǐng)D3.41CS―ACELP譯碼器原理第一百一十三頁,共一百七十三頁,2022年,8月28日3.4.2高保真立體聲音頻編碼標(biāo)準(zhǔn)
目前的音頻信號(hào)分為三類:電話質(zhì)量的語音信號(hào)、調(diào)幅廣播質(zhì)量的音頻信號(hào)和高保真立體聲音頻信號(hào)。
1MPEG-1音頻編碼標(biāo)準(zhǔn)(ISO/IEC11172-3)ISO/IEC制訂了MPEG-1音頻編碼標(biāo)準(zhǔn),是國際上第一個(gè)高保真立體聲音頻編碼標(biāo)準(zhǔn),是以MUSICAM(MaskingPatternUniversalSubbandIntegratedCodingAndMultiplexing)為基礎(chǔ)的三層編碼結(jié)構(gòu),圖3.42為MUSICAM編碼器的原理框圖。
第一百一十四頁,共一百七十三頁,2022年,8月28日
濾波器組對(duì)信號(hào)進(jìn)行頻率變換,并將信號(hào)分成32個(gè)子帶,每個(gè)子帶中確定一段信號(hào)的最大電平,由此得到比例因子編碼參數(shù);根據(jù)人耳的掩蔽效應(yīng)確定掩蔽門限,比特分配模塊自適應(yīng)分配比特;最后將音頻壓縮數(shù)據(jù)、比例因子和比特分配信息組合在一起構(gòu)成模塊,形成音頻編碼比特流。第一百一十五頁,共一百七十三頁,2022年,8月28日?qǐng)D3.42MUSICAM編碼器框圖第一百一十六頁,共一百七十三頁,2022年,8月28日
圖3.43為MPEG-1音頻編碼的比特流幀結(jié)構(gòu)。幀標(biāo)志占32比特,由同步信息和狀態(tài)信息組成,同步碼由12比特全1碼組成;幀校驗(yàn)碼占16比特,采用CRC校驗(yàn),用于檢測(cè)比特流中的傳輸差錯(cuò);音頻數(shù)據(jù)由比特分配信息、比例因子信息和子帶音頻樣點(diǎn)組成,不同層的音頻樣點(diǎn)不同;輔助數(shù)據(jù)在音頻比特流中提供一個(gè)長(zhǎng)度可變的通道用于傳輸輔助數(shù)據(jù)。圖3.43MPEG―1音頻編碼比特流幀結(jié)構(gòu)第一百一十七頁,共一百七十三頁,2022年,8月28日
圖3.44為MPEG-1音頻解碼器的基本結(jié)構(gòu),幀分解進(jìn)行分解和解碼,恢復(fù)出各種信息段(若編碼時(shí)采用了CRC校驗(yàn),還進(jìn)行差錯(cuò)檢測(cè))。重建模塊重建一組變換樣點(diǎn)的量化形式;逆變換將這些變換樣點(diǎn)變換回均勻的PCM音頻樣點(diǎn)。圖3.44MPEG-1音頻解碼器基本結(jié)構(gòu)第一百一十八頁,共一百七十三頁,2022年,8月28日
2MPEG-2音頻編碼標(biāo)準(zhǔn)(ISO/IEC13818-3)
ISO/IEC于1994年制訂了MPEG-2音頻編碼標(biāo)準(zhǔn),在MPEG-1基礎(chǔ)上擴(kuò)展了低碼率多聲道編碼,稱為MUSICAM環(huán)繞聲。該方案將MPEG-1的2聲道擴(kuò)展至5.1個(gè),即3個(gè)前聲道(左L、中C和右R)、2個(gè)環(huán)繞聲道(左LS、右RS)和1個(gè)超低音聲道LFE(常稱為0.1聲道),多聲道擴(kuò)展信息加到MPEG-1音頻數(shù)據(jù)幀結(jié)構(gòu)的輔助數(shù)據(jù)段,圖3.45為MPEG-2音頻數(shù)據(jù)幀結(jié)構(gòu)。
第一百一十九頁,共一百七十三頁,2022年,8月28日?qǐng)D3.45MPEG―2音頻數(shù)據(jù)幀結(jié)構(gòu)
第一百二十頁,共一百七十三頁,2022年,8月28日MPEG-1音頻編碼的第一層,多聲道擴(kuò)展數(shù)據(jù)被分成三部分,在連續(xù)3幀MPEG-1音頻數(shù)據(jù)幀的輔助數(shù)據(jù)段傳送;在第二、三層,多聲道擴(kuò)展數(shù)據(jù)在1個(gè)MPEG-1音頻數(shù)據(jù)幀的輔助數(shù)據(jù)段傳送。完整的MPEG-2數(shù)據(jù)幀包括:32位幀標(biāo)志碼,可選的16位CRC循環(huán)冗余校驗(yàn)碼,音頻數(shù)據(jù)和輔助數(shù)據(jù)。MPEG-2音頻編碼能傳送多路音頻,并能確保比特流與MPEG-1前向和后向兼容。第一百二十一頁,共一百七十三頁,2022年,8月28日3MPEG-4音頻編碼標(biāo)準(zhǔn)(ISO/IEC14496)
ISO/IEC于1998年制訂了MPEG-4音頻編碼標(biāo)準(zhǔn),給利用窄帶ISDN實(shí)現(xiàn)交互式多媒體應(yīng)用提供支持,定義了3種類型的編碼器:①低速率音頻編碼,對(duì)8kHz取樣的語音2~4kb/s速率的編碼。②中速率音頻編碼,對(duì)8kHz或16kHz取樣的語音4~16~kb/s速率的編碼。③高速率音頻編碼,16kb/s以上速率的編碼。第一百二十二頁,共一百七十三頁,2022年,8月28日
4AC-3系統(tǒng)AC-3系統(tǒng)是新一代高保真立體聲音頻編碼系統(tǒng),為美國的全數(shù)字式高清晰度電視(HDTV)提供高質(zhì)量的伴音。1993年11月,美國高級(jí)電視系統(tǒng)委員會(huì)(ATSC)正式批準(zhǔn)其大聯(lián)盟高清晰度電視(GA-HDTV)系統(tǒng)采用AC-3音頻編碼方案。AC-3系統(tǒng)繼承了AC-2系統(tǒng)的許多優(yōu)點(diǎn)(變換編碼、自適應(yīng)量化和比特分配、人耳心理聽覺特性等),并采用了一些新技術(shù)(指數(shù)編碼、混合前/后向自適應(yīng)比特分配和耦合技術(shù)等)。圖3.46為AC-3系統(tǒng)的原理框圖。
第一百二十三頁,共一百七十三頁,2022年,8月28日?qǐng)D3.46AC-3系統(tǒng)音頻編碼原理第一百二十四頁,共一百七十三頁,2022年,8月28日分析濾波器組將音頻信號(hào)從時(shí)域變換到頻域;比特分配模塊決定可接受的信噪比;最后頻域參數(shù)粗糙量化到所需精度,并編碼形成音頻基本碼流。音頻基本碼流的基本單元是AC-3同步幀,圖3.47為AC-3音頻編碼比特流幀結(jié)構(gòu)。每個(gè)AC-3同步幀由一個(gè)16比特同步信息(SI)字、碼流信息(BSI)、32ms的音頻編碼流和一個(gè)CRC差錯(cuò)控制段(16比特)組成。圖3.47AC-3音頻編碼比特流幀結(jié)構(gòu)
第一百二十五頁,共一百七十三頁,2022年,8月28日3.5圖像編碼技術(shù)
3.5.1概述
目前,壓縮后的圖像信息傳輸主要采用兩類方式:模擬傳輸和數(shù)字傳輸。模擬傳輸采用某種調(diào)制方式將模擬圖像信號(hào)調(diào)制到相應(yīng)頻帶傳輸,抗干擾能力弱,傳輸中易造成波形失真;數(shù)字傳輸抗干擾能力強(qiáng),容易實(shí)現(xiàn)加密,與B-ISDN傳輸匹配,適合于未來的多媒體通信。第一百二十六頁,共一百七十三頁,2022年,8月28日3.5.2圖像壓縮編碼(預(yù)測(cè)、變換、熵編碼)
1預(yù)測(cè)編碼利用差分脈沖編碼調(diào)制去除圖像數(shù)據(jù)間的空域冗余度和時(shí)間冗余度,可以在一幀圖像內(nèi)進(jìn)行幀內(nèi)預(yù)測(cè)編碼,也可在多幀圖像間進(jìn)行幀間預(yù)測(cè)編碼。
空間冗余:在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,區(qū)域中所有點(diǎn)光強(qiáng)、色彩及色飽和度都相同,有很大的空間冗余。
時(shí)間冗余:動(dòng)畫等序列圖片中物體有位移時(shí),后一幀數(shù)據(jù)與前一幀數(shù)據(jù)有許多共同地方,只有部分相鄰幀改變的畫面,這種冗余稱為時(shí)間冗余。第一百二十七頁,共一百七十三頁,2022年,8月28日
①
幀內(nèi)預(yù)測(cè)編碼圖3.48為DPCM幀內(nèi)預(yù)測(cè)編碼原理框圖,發(fā)端線性預(yù)測(cè)器預(yù)測(cè)當(dāng)前樣值的估值,量化編碼對(duì)誤差信號(hào)進(jìn)行量化編碼傳輸;收端經(jīng)過DPCM解碼后利用一個(gè)與發(fā)端相同的預(yù)測(cè)器即可恢復(fù)發(fā)端原始信號(hào)x(n)的恢復(fù)近似值y(n)。第一百二十八頁,共一百七十三頁,2022年,8月28日
圖3.48DPCM原理框圖(a)編/解碼器;(b)一維預(yù)測(cè)與二維預(yù)測(cè)第一百二十九頁,共一百七十三頁,2022年,8月28日
②
幀間預(yù)測(cè)編碼
利用視頻信號(hào)相鄰幀間的相關(guān)性進(jìn)行幀間編碼,可獲得比幀內(nèi)預(yù)測(cè)編碼高得多的壓縮比。
1)幀間統(tǒng)計(jì)特性視頻信號(hào)相鄰幀之間的時(shí)間間隔很小,相鄰幀間圖像細(xì)節(jié)的變化很少
2)幀重復(fù)靜止或活動(dòng)很慢的視頻信號(hào),可以少傳一些幀,例如,隔幀傳輸。未傳輸?shù)膸媒邮斩说膸鎯?chǔ)器中保存的前一幀數(shù)據(jù)作為該幀數(shù)據(jù)。第一百三十頁,共一百七十三頁,2022年,8月28日3)閾值法對(duì)幀間亮度差值超過某一閾值的像素編碼傳送。4)幀內(nèi)插對(duì)于活動(dòng)緩慢的圖像,可使用前后兩幀圖像進(jìn)行內(nèi)插,得到實(shí)際幀圖像的預(yù)測(cè)圖像,然后對(duì)實(shí)際幀與預(yù)測(cè)幀的差值信號(hào)進(jìn)行編碼。5)運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)編碼知道了運(yùn)動(dòng)物體的運(yùn)動(dòng)規(guī)律,就可從前一幀圖像推算出它在當(dāng)前幀的位置,編碼器將物體的運(yùn)動(dòng)信息告知解碼器,解碼器就可根據(jù)此信息和前一幀圖像來更新當(dāng)前圖像。第一百三十一頁,共一百七十三頁,2022年,8月28日
2變換編碼降低信源空間冗余度,常采用某種正交變換,將圖像取樣值變換到變換域,去除視頻圖像信號(hào)相關(guān)性。正交變換數(shù)據(jù)壓縮原理:首先,正交變換產(chǎn)生的變換域系數(shù)之間的相關(guān)性很小,可分別獨(dú)立進(jìn)行處理;另外,正交變換后能量大多集中在少量變換域系數(shù),通過量化刪去對(duì)圖像信號(hào)貢獻(xiàn)小的系數(shù),用保留下來的系數(shù)恢復(fù)原始圖像。下面介紹數(shù)據(jù)壓縮中廣泛采用的離散余弦變換編碼。第一百三十二頁,共一百七十三頁,2022年,8月28日DCT編碼的主要步驟:(1)DCT變換(3.5.3)(3.5.4)第一百三十三頁,共一百七十三頁,2022年,8月28日
(2)系數(shù)量化系數(shù)量化是DCT編碼的關(guān)鍵,常用的方法有區(qū)域編碼、自適應(yīng)比特分配、門限控制和綜合法。區(qū)域編碼:將變換系數(shù)塊根據(jù)能量分布劃分成若干區(qū)域,對(duì)每個(gè)區(qū)域分別進(jìn)行量化編碼。自適應(yīng)比特分配:根據(jù)變換系數(shù)的能量大小自適應(yīng)地分配變換所需的比特?cái)?shù)。門限控制:小于門限的系數(shù)置0,增加無需編碼的系數(shù)個(gè)數(shù)。
第一百三十四頁,共一百七十三頁,2022年,8月28日
(3)系數(shù)排序通常按“Z”字形排列量化后的系數(shù)。
(4)熵編碼
通常的熵編碼方法:游程長(zhǎng)度編碼、霍夫曼編碼、香農(nóng)編碼和算術(shù)編碼。視頻編碼中常用游程長(zhǎng)度編碼和霍夫曼編碼。第一百三十五頁,共一百七十三頁,2022年,8月28日
3熵編碼去除信源的統(tǒng)計(jì)冗余。
1)游程長(zhǎng)度編碼最早用于二值圖像的壓縮編碼。二值圖像的每一掃描行總是由若干段連著的白像素和黑像素組成,即所謂的白長(zhǎng)和黑長(zhǎng),對(duì)不同的白長(zhǎng)和黑長(zhǎng),按其出現(xiàn)的概率分配以不同的碼字。
2)Shannon-Fano編碼(次最佳不等長(zhǎng)編碼)
第一百三十六頁,共一百七十三頁,2022年,8月28日第一百三十七頁,共一百七十三頁,2022年,8月28日3)Huffman編碼(最佳不等長(zhǎng)編碼)1952年霍夫曼(Huffman)提出的最佳不等長(zhǎng)編碼方法,是圖像壓縮編碼中最重要的編碼方法之一。霍夫曼編碼步驟:
①將輸入符號(hào)按出現(xiàn)概率從大到小順序排列(概率相同的符號(hào)可任意排列);②將最小的兩個(gè)概率相加,形成一個(gè)新的概率集合,再按第一步的方法重新排列,如此反復(fù)直到只有兩個(gè)概率為此;③為符號(hào)分配碼字。碼字分配從最后一步開始反向進(jìn)行,對(duì)最后兩個(gè)概率,一個(gè)賦“1”碼,一個(gè)賦“0”碼。
第一百三十八頁,共一百七十三頁,2022年,8月28日第一百三十九頁,共一百七十三頁,2022年,8月28日?qǐng)D3.49霍夫曼編碼結(jié)構(gòu)1S2S3碼長(zhǎng)概率符號(hào)10.5S20.2530.12530.125S400.5100.25011圖3.49為霍夫曼編碼步驟,表3.14為霍夫曼編碼示例,表3.15等長(zhǎng)編碼與霍夫曼編碼的比較。第一百四十頁,共一百七十三頁,2022年,8月28日
表3.14霍夫曼編碼示例第一百四十一頁,共一百七十三頁,2022年,8月28日表3.15等長(zhǎng)編碼與霍夫曼編碼的比較
第一百四十二頁,共一百七十三頁,2022年,8月28日3.6圖像壓縮編碼標(biāo)準(zhǔn)3.6.1二值圖像壓縮標(biāo)準(zhǔn)
二值圖像指只有黑、白兩個(gè)亮度值的圖像。
1G3、G4標(biāo)準(zhǔn)
1)G3傳真裝置的特征
●主要用于公用交換電話網(wǎng),93年后可使用ISDN;
●
98年規(guī)定了錯(cuò)誤校正方式(ECM)作為選用功能;
●采用編碼方式(MH方式)來削減傳真信號(hào)的冗余信息;
●不僅傳輸圖像,而且規(guī)定可選用功能傳輸二進(jìn)制文件、文檔文件及字符等。第一百四十三頁,共一百七十三頁,2022年,8月28日
2)G4傳真裝置的特征
●基本是數(shù)據(jù)網(wǎng)用的傳真裝置;
●高速傳輸編碼方式的MMR方式和錯(cuò)誤校正功能以標(biāo)準(zhǔn)功能裝在裝置中;
●
以O(shè)SI協(xié)議為準(zhǔn);
●三個(gè)級(jí)別:1類是能夠收/發(fā)編碼傳真文件的終端;2類是在1類的基礎(chǔ)上,還具備傳輸用戶電報(bào)編碼文件和混合方式文件的能力;3類是在2類功能上,增加傳輸電傳文件和混合方式文件的能力。第一百四十四頁,共一百七十三頁,2022年,8月28日
3)編碼方式MH方式:MH編碼是G3傳真的標(biāo)準(zhǔn)編碼方式,對(duì)行內(nèi)持續(xù)白(或黑)像素依次提取長(zhǎng)度進(jìn)行霍夫曼編碼,圖3.50為MH編碼示例。MR方式:MR編碼將已編碼的前一掃描線作為參考行,然后對(duì)其后的一條掃描線進(jìn)行編碼,將編碼行變化像素相對(duì)參考行變化像素的位置偏差進(jìn)行編碼,圖3.51為MR編碼示例。
MMR方式:MMR方式是G4傳真的標(biāo)準(zhǔn)編碼方式,對(duì)全部行都參照前面行進(jìn)行編碼。
第一百四十五頁,共一百七十三頁,2022年,8月28日?qǐng)D3.50MH編碼示例第一百四十六頁,共一百七十三頁,2022年,8月28日?qǐng)D3.51MR編碼示例第一百四十七頁,共一百七十三頁,2022年,8月28日
2JBIG標(biāo)準(zhǔn)G3/G4標(biāo)準(zhǔn)不適應(yīng)于中間色調(diào)圖像,當(dāng)用G3/G4壓縮二值中間色調(diào)圖像時(shí),不僅得不到壓縮,反而可能擴(kuò)展數(shù)據(jù)量,制訂JBIG標(biāo)準(zhǔn)的主要原因是改進(jìn)的壓縮性能。JBIG標(biāo)準(zhǔn)可以支持很高的分辨率,使用了與JPEG標(biāo)準(zhǔn)相同的自適應(yīng)無損編碼算法實(shí)現(xiàn)對(duì)二值圖像的無失真壓縮,其壓縮效率比G4標(biāo)準(zhǔn)提高30%。第一百四十八頁,共一百七十三頁,2022年,8月28日
3.6.2靜止圖像壓縮標(biāo)準(zhǔn)
1JPEG標(biāo)準(zhǔn)JPEG是JointPhotographicExpertsGroup(聯(lián)合圖片專家組)的縮寫。JPEG提供了四種算法模式:
●
基于DCT的順序模式(基本模式):適用于有損圖像壓縮的大多數(shù)場(chǎng)合,它不僅可用于靜止圖像,而且可用于活動(dòng)圖像;
●
基于DCT的遞增模式:適用于對(duì)傳輸時(shí)間要求不嚴(yán),用戶喜歡圖像由粗糙到清晰的場(chǎng)合;第一百四十九頁,共一百七十三頁,2022年,8月28日
●
無損編碼模式:適用于要求無失真壓縮的場(chǎng)合;
●
分層編碼模式:可按多種分辨率對(duì)圖像進(jìn)行編碼,適用于要求不同分辨率或圖像質(zhì)量的場(chǎng)合。JPEG編碼器和解碼器必須支持基本模式,基本模式基于DCT和可變長(zhǎng)編碼(VLC)壓縮技術(shù),提供高達(dá)100:1的壓縮比,但是重建圖像不能精確再現(xiàn)原始圖像,表3.16為JPEG基本模式壓縮舉例。第一百五十頁,共一百七十三頁,2022年,8月28日表3.16JPEG基本模式壓縮舉例第一百五十一頁,共一百七十三頁,2022年,8月28日2JPEG的發(fā)展趨勢(shì)JPEG壓縮算法主要從以下方面進(jìn)一步發(fā)展:(1)自適應(yīng)量化;(2)無損編碼的改進(jìn);(3)其他提高JPEG性能的可能途徑;(4)后向兼容。第一百五十二頁,共一百七十三頁,2022年,8月28日
3.6.3視頻壓縮標(biāo)準(zhǔn)按質(zhì)量分,視頻可分為三類:
●
低質(zhì)量視頻:畫面較小,通常為QCIF(CIF格式圖像像素的1/4)或CIF格式,幀速率低,可為黑白視頻也可為彩色視頻;
●
中等質(zhì)量視頻:中等大小的畫面,通常為CIF或CCIR601視頻格式;
●
高質(zhì)量視頻:畫面較大,通常為CCIR601視頻格式至高清晰度電視視頻格式。第一百五十三頁,共一百七十三頁,2022年,8月28日
1H.261標(biāo)準(zhǔn)H.261標(biāo)準(zhǔn)是CCITT制訂的國際上第一個(gè)視頻壓縮標(biāo)準(zhǔn),主要用于電視電話和會(huì)議電視,視頻算法的核心是運(yùn)動(dòng)估值預(yù)測(cè)和DCT編碼,圖3.52為H.261視頻編/解碼器原理框圖。信源編碼器先對(duì)視頻信號(hào)進(jìn)行DCT變換,然后將變換后的系數(shù)量化;圖象復(fù)用編碼器把每幀圖像數(shù)據(jù)編排成4個(gè)層次的數(shù)據(jù)結(jié)構(gòu),同時(shí)對(duì)交流DCT系數(shù)進(jìn)行可變長(zhǎng)度編碼(VLC),對(duì)直流DCT系數(shù)進(jìn)行固定長(zhǎng)度編碼(FLC);傳輸緩沖器將速變碼流變換為固定碼率碼流。第一百五十四頁,共一百七十三頁,2022年,8月28日?qǐng)D3.52H.261視頻編/解碼器第一百五十五頁,共一百七十三頁,2022年,8月28日
2MPEG-1視頻標(biāo)準(zhǔn)1991年通過的關(guān)于碼率為1.5Mb/s,用于數(shù)字存儲(chǔ)媒體的運(yùn)動(dòng)圖像和音頻的編碼標(biāo)準(zhǔn),MPE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 癲癇病人的急救護(hù)理
- 淺談制作課件教學(xué)課件
- 測(cè)量運(yùn)動(dòng)課件教學(xué)課件
- 部編版八年級(jí)地理上冊(cè)第四章第二節(jié)《農(nóng)業(yè)》課件
- 河南省2024九年級(jí)語文上冊(cè)第一單元3我愛這土地課件新人教版
- 2.3.1共價(jià)鍵的極性 課件 高二上學(xué)期化學(xué)人教版(2019)選擇性必修2
- 特殊藥品管理應(yīng)急演練
- 董氏奇穴治療頸椎病
- 初中語文教案教學(xué)反思
- 護(hù)理專業(yè)說課稿
- 2024航空工業(yè)集團(tuán)校園招聘筆試參考題庫附帶答案詳解
- 《中藥鑒定技術(shù)》課件-甘草的鑒定
- 燃?xì)庋簿€員專業(yè)知識(shí)考試題庫(附答案)
- 《如何做一名好教師》課件
- CORELDRAW 室內(nèi)平面布置圖課件
- WMT8-2022二手乘用車出口質(zhì)量要求
- 退役軍人技能培訓(xùn)課件
- 【川教版】《生命 生態(tài) 安全》四上第13課《預(yù)防凍瘡》課件
- 結(jié)構(gòu)力學(xué)試卷西南交通大學(xué)期中答案期中考試
- 廣東省佛山市2022-2023學(xué)年高二上學(xué)期期末數(shù)學(xué)試題(學(xué)生版+解析)
- 藥疹的健康宣教
評(píng)論
0/150
提交評(píng)論