版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第4章限失真信源編碼4.1連續(xù)信源的熵和互信息4.2信息率失真理論4.3標(biāo)量量化編碼4.4矢量量化編碼4.5語(yǔ)音壓縮編碼4.6圖像壓縮編碼4.1連續(xù)信源的熵和互信息前面研究的信源都是取值為有限或可數(shù)的離散信源,這些信源輸出的消息屬于時(shí)間離散、取值有限或可數(shù)的隨機(jī)序列,其統(tǒng)計(jì)特性可以用聯(lián)合概率分布來(lái)描述。而實(shí)際某些信源的輸出常常是時(shí)間和取值都連續(xù)的消息。例如,語(yǔ)音信號(hào)、電視信號(hào)等都是時(shí)間的連續(xù)波形,而且,在某一固定時(shí)刻,它們的可能取值也是連續(xù)的,這樣的信源稱為隨機(jī)波形信源。隨機(jī)波形信源輸出的消息是隨機(jī)的,因此,可用隨機(jī)過(guò)程來(lái)描述。用隨機(jī)過(guò)程描述其輸出消息的信源稱為隨機(jī)波形信源。若信源輸出用平穩(wěn)連續(xù)型隨機(jī)序列來(lái)描述,則此信源稱為連續(xù)平穩(wěn)信源。連續(xù)平穩(wěn)信源也可分為連續(xù)平穩(wěn)無(wú)記憶信源和連續(xù)平穩(wěn)有記憶信源。平穩(wěn)連續(xù)型隨機(jī)序列中每個(gè)自由度上的變量是連續(xù)隨機(jī)變量。用連續(xù)隨機(jī)變量描述其輸出消息的信源稱為連續(xù)信源。下面討論它們的信息測(cè)度。連續(xù)信源基本的數(shù)學(xué)模型為其中R是全實(shí)數(shù)集,是連續(xù)變量X的取值范圍,p(x)為x的概率密度。定義連續(xù)信源的熵(差熵)為(4―1)式(4―1)定義的連續(xù)信源的熵并不是實(shí)際信源輸出的絕對(duì)熵,連續(xù)信源的絕對(duì)熵應(yīng)該再加上一項(xiàng)無(wú)限大的常數(shù)項(xiàng)。因?yàn)檫B續(xù)信源的可能取值有無(wú)限多個(gè),若其取值是等概率分布的,那么,信源不確定性為無(wú)限大。當(dāng)確知輸出為某值后,所獲得的信息量也將為無(wú)限大??梢?jiàn),h(X)已不能代表信源的平均不確定性大小,也不能代表連續(xù)信源輸出的信息量。同理,可定義兩個(gè)連續(xù)變量X,Y的聯(lián)合熵和條件熵:(4―2)(4―3)(4―4)定義X和Y之間的平均互信息量為(4―8)(4―9)(4―10)連續(xù)信道的平均互信息量和離散信道下平均互信息量的關(guān)系式完全類似,且保留了離散信道平均互信息量的所有含義和性質(zhì)??梢?jiàn),將差熵定義為連續(xù)信源的熵是有重要實(shí)際意義的。單符號(hào)連續(xù)信道的信息傳輸率:R=I(X;Y),比特/自由度(4―11)多維連續(xù)信道平均互信息等相關(guān)內(nèi)容可參見(jiàn)有關(guān)文獻(xiàn)。4.2信息率失真理論4.2.1失真函數(shù)由于只涉及信源編碼問(wèn)題,所以可以將信道編碼和譯碼看成是信道的一部分。這樣信宿收到消息的失真(或誤差)只是由信源編碼帶來(lái)的。從直觀感覺(jué)可知,若允許失真越大,信息傳輸率可越小;若允許失真越小,信息傳輸率需越大。所以信息傳輸率與信源編碼所引起的失真(或誤差)是有關(guān)的。為了定量地描述信息傳輸率和失真的關(guān)系,可以略去廣義的無(wú)擾信道,所謂廣義無(wú)擾信道,是指把信道編碼、信道、信道譯碼這三部分看成一個(gè)沒(méi)有任何干擾的廣義信道。另一方面用虛擬手法拿信道來(lái)表示失真信源編碼的作用,把信源編碼和信源譯碼等價(jià)成一個(gè)信道,由于是失真編碼,所以信道不是一一對(duì)應(yīng)的,用信道傳遞概率描述編、譯碼前后關(guān)系,這樣通信系統(tǒng)可簡(jiǎn)化為如圖4―2所示。圖4―2設(shè)離散無(wú)記憶信源:信源符號(hào)通過(guò)信道傳輸?shù)浇邮斩?,則接收端接收變量為對(duì)應(yīng)于一對(duì)(u,v),定義一個(gè)非負(fù)函數(shù):d(ui,vj)≥0,i=1,2,…,n;j=1,2,…,m(4―12)稱此函數(shù)為失真函數(shù)(或稱單個(gè)符號(hào)失真度)。它用來(lái)測(cè)度信源發(fā)出一個(gè)符號(hào)ui,而接收端收到一個(gè)符號(hào)vj時(shí)所引起的誤差或失真。由于信源U有n個(gè)符號(hào),而接收變量V有m個(gè)符號(hào),所以d(ui,vj)就有n×m個(gè),這n×m個(gè)非負(fù)的函數(shù)可以排成矩陣形式,即:(4―13)稱它為失真矩陣D,它是n×m階矩陣。失真函數(shù)可有多種形式,但應(yīng)盡可能符合信宿的主觀特性,即主觀上的失真感覺(jué)應(yīng)與d(ui,vj)的值相對(duì)應(yīng)。D越大,所感覺(jué)到的失真也越大,而且最好成正比。當(dāng)ui=vj時(shí),d應(yīng)等于零,表示沒(méi)有失真,當(dāng)ui≠vj時(shí),d為正值。常用失真函數(shù)有:均方失真:絕對(duì)失真:相對(duì)失真:(4―14)(4―15)(4―16)誤碼失真:(4―17)式中:x——信源輸出消息;y——信宿收到消息。均方失真和絕對(duì)失真只與(x-y)有關(guān),而不是分別與x及y有關(guān),在數(shù)學(xué)處理上比較方便;相對(duì)失真與主觀特性比較匹配,因?yàn)橹饔^感覺(jué)往往與客觀量的對(duì)數(shù)成正比,但其數(shù)學(xué)處理困難得多。其實(shí)選擇一個(gè)與主觀特性完全匹配的失真函數(shù)已非常困難了,更不用說(shuō)還要便于數(shù)學(xué)處理了。前三種失真函數(shù)適用于連續(xù)信源,最后一種失真函數(shù)適用于離散信源。誤碼失真函數(shù)表明,當(dāng)接收符號(hào)與發(fā)送符號(hào)相同時(shí),就不存在失真和錯(cuò)誤,即失真度為零;當(dāng)接收符號(hào)與發(fā)送符號(hào)不同時(shí),就存在失真。
而且認(rèn)為只要發(fā)送符號(hào)與接收符號(hào)不同,由此引起的失真都相同,即失真度為常數(shù)。如果常數(shù)值為1,則稱為漢明失真。離散對(duì)稱信源的漢明失真矩陣
D為一方陣,且對(duì)角線上的元素為零:(4―18)【例4―1】二元對(duì)稱信源,信源U={0,1},接收變量V={0,1},在漢明失真定義下,失真函數(shù)為:d(0,0)=d(1,1)=0,d(0,1)=d(1,0)=1它表示當(dāng)信源發(fā)送符號(hào)0(或符號(hào)1)而信宿接收到符號(hào)0(或符號(hào)1)時(shí),則認(rèn)為無(wú)失真或無(wú)錯(cuò)誤存在;反之,若發(fā)送信源符號(hào)0(或符號(hào)1)而信宿接收符號(hào)1(或符號(hào)0)時(shí),則認(rèn)為有錯(cuò)誤,并認(rèn)為這兩種錯(cuò)誤的后果是等同的。其失真矩陣為【例4―2】設(shè)信源U={0,1},接收變量V={0,1,2},定義失真函數(shù)為d(0,0)=d(1,1)=0,d(0,1)=d(1,0)=1,d(0,2)=d(1,2)=0.5,則失真矩陣D為【例4―3】信源U={0,1,2},接收變量V={0,1,2},失真函數(shù)為d(ui,vj)=(ui-vj)2,求失真矩陣。由失真定義得:d(0,0)=d(1,1)=d(2,2)=0d(0,1)=d(1,0)=d(1,2)=d(2,1)=1d(0,2)=d(2,0)=4所以失真矩陣D為4.2.2平均失真因?yàn)樾旁碪和信宿接收量V都是隨機(jī)變量,因此單個(gè)符號(hào)失真度d(ui,vj)也是隨機(jī)變量。定義傳輸一個(gè)符號(hào)引起的失真為平均失真,即信源平均失真:(4―19)式中:ui——信源輸出符號(hào),i=1,2,…,n;p(ui)——信源輸出符號(hào)ui的概率;vj——信宿接收符號(hào),j=1,2,…,m;p(vj|ui)——廣義無(wú)擾信道傳遞概率。單個(gè)符號(hào)的失真度d(ui,vj)描述了某個(gè)信源符號(hào)通過(guò)傳輸后失真的大小。對(duì)于不同的信源符號(hào)和不同的接收符號(hào),其值是不同的。但平均失真度已對(duì)信源和信道進(jìn)行了統(tǒng)計(jì)平均,所以此值是描述某一信源在某一廣義無(wú)擾信道(或稱為試驗(yàn)信道)傳輸下的失真大小,是從總體上描述整個(gè)系統(tǒng)失真情況的。從單個(gè)符號(hào)失真度出發(fā),可以定義長(zhǎng)度為K的信源序列的失真函數(shù)和平均失真度。信源序列失真度(失真函數(shù)):(4―20)式中:S——信源的一個(gè)輸出序列;Y——信宿的一個(gè)接收序列;sl——信源輸出序列中的一個(gè)符號(hào);yl——信宿接收序列中的一個(gè)符號(hào)。式(4―20)表明,信源序列的失真度等于序列中對(duì)應(yīng)單個(gè)信源符號(hào)失真度之和。N維信源符號(hào)序列的平均失真度:(4―21)則單個(gè)信源符號(hào)平均失真度:(4―22)當(dāng)信源與信道都是無(wú)記憶時(shí),N維信源序列平均失真度為(4―23)式中:——信源序列中第l個(gè)分量平均失真度。此時(shí)單個(gè)信源符號(hào)平均失真度:(4―24)若平均失真度不大于所允許的失真D,即:(4―25)稱式(4―25)為保真度準(zhǔn)則。N維信源序列的保真度準(zhǔn)則是:平均失真度不大于允許失真ND,即:(4―26)
1.離散信源的信息率失真函數(shù)在信源給定,又定義了失真函數(shù)以后,總希望在滿足一定失真的情況下,使信源傳輸給信宿的信息傳輸率R盡可能地小?;蛘哒f(shuō),在滿足保真度準(zhǔn)則下,尋找信源必須傳輸給信宿的信息率R的下限值,這個(gè)下限值與D有關(guān)。從接收端來(lái)看,就是在滿足保真度準(zhǔn)則下,尋找再現(xiàn)信源消息所必須獲得的最低平均信息量。而接收端獲得的平均信息量可用平均互信息量I(U;V)來(lái)表示,這就變成了在滿足保真度準(zhǔn)則的條件下,尋找平均互信息量I(U;V)的最小值。BD是所有滿足保真度準(zhǔn)則的試驗(yàn)信道集合,可以在D失真許可的試驗(yàn)信道集合BD中尋找某一個(gè)信道p(vj|ui),使I(U;V)取最小值。由于平均互信息量I(u;v)是p(vj|ui)的U型凸函數(shù),所以在BD集合中,極小值存在。這個(gè)最小值就是在條件下,信源必須傳輸?shù)淖钚∑骄畔⒘?。?/p>
(4―27)式中:BD——所有滿足保真度準(zhǔn)則的試驗(yàn)信道的集合。稱R(D)為信息率失真函數(shù)(或率失真函數(shù)),其單位為奈特/信源符號(hào)或比特/信源符號(hào)。N維信源符號(hào)序列的信息率失真函數(shù)RN(D):(4―28)式中:x——信源的一個(gè)輸出序列;y——信宿的一個(gè)接收序列;——N維信源符號(hào)序列的平均失真度。
2.連續(xù)信源的信息率失真函數(shù)定義連續(xù)信源平均失真度為(4―29)式中:d(u,v)——連續(xù)信源失真函數(shù);p(u)——連續(xù)信源u的概率密度;p(v|u)——信道傳遞概率密度。根據(jù)連續(xù)信源平均失真度的定義,可求得平均互信息I(U;V)=h(V)-h(huán)(V|U),則連續(xù)信源的信息率失真函數(shù):(4―30)式中:BD——滿足≤D的所有廣義無(wú)擾信道集合;inf——指下確界。
3.保真度準(zhǔn)則下的信源編碼定理
定理4―1
(限失真信源編碼定理)設(shè)R(D)為離散無(wú)記憶信源X的信息率失真函數(shù),R為信宿傳輸率,則當(dāng)信息率R>R(D),只要信源序列長(zhǎng)度L足夠長(zhǎng),一定存在一種編碼方法,其譯碼失真小于或等于D+ε,ε為任意小的正數(shù);反之,若R<R(D),則無(wú)論采用什么樣的編碼方法,其譯碼失真必大于D。如果是二元信源,對(duì)于任意小的ε>0,每一個(gè)信源符號(hào)的平均碼長(zhǎng)滿足如下公式:(4―31)該定理指出,在失真限度內(nèi)使信息率任意接近R(D)的編碼方法存在,然而,若信息率小于R(D),平均失真一定會(huì)超過(guò)失真限度D。對(duì)于連續(xù)平穩(wěn)無(wú)記憶信源,雖然無(wú)法進(jìn)行無(wú)失真編碼,但在限失真情況下,有與該定理一樣的編碼定理。該定理說(shuō)明最佳編碼是存在的,但對(duì)于如何進(jìn)行編碼卻一無(wú)所知,因而就不能像無(wú)損編碼那樣從證明過(guò)程中引出概率匹配的編碼方法,一般只能從優(yōu)化的思路去求最佳編碼。
這個(gè)定理證明了允許失真D確定后,總存在一種編碼方法,使信息傳輸率R大于R(D)且可任意接近R(D),而平均失真小于允許失真D。反之,若R<R(D),那么該編碼的平均失真將大于D。如果用二進(jìn)制符號(hào)進(jìn)行編碼的話,在允許一定失真D的情況下,平均每個(gè)信源符號(hào)所需的二元碼符號(hào)的下限值就是
R(D)。由此可見(jiàn),信息率失真函數(shù)R(D)確實(shí)是在允許失真度為D的情況下信源信息壓縮的下限值。當(dāng)信源給定后,無(wú)失真信源壓縮的極限值是信源熵H(U);有失真信源壓縮的極限值是信息率失真函數(shù)H(D)。
在給定某D后,一般R(D)<H(U)。同樣,該定理只是一個(gè)存在定理。至于如何尋找最佳壓縮編碼方法,定理中并沒(méi)有給出。在實(shí)際應(yīng)用中,該定理主要存在以下兩大類問(wèn)題。第一類問(wèn)題是,符合實(shí)際信源的R(D)函數(shù)的計(jì)算相當(dāng)困難。首先,需要對(duì)實(shí)際信源的統(tǒng)計(jì)特性有確切的數(shù)學(xué)描述。其次,需要對(duì)符合主客觀實(shí)際的失真給予正確的度量,否則不能求得符合主客觀實(shí)際的R(D)函數(shù)。例如,通常采用均方誤差來(lái)表示信源的平均失真度。但對(duì)于圖像信源來(lái)說(shuō),均方誤差較小的編碼方法,人們視覺(jué)感到失真較大。所以,人們?nèi)圆捎弥饔^觀察來(lái)評(píng)價(jià)編碼方法的好壞。因此,如何定義符合主客觀實(shí)際情況的失真測(cè)度就是件較困難的事。第三,即便對(duì)實(shí)際信源有了確切的數(shù)學(xué)描述,又有符合主客觀實(shí)際情況的失真測(cè)度,而信息率失真函數(shù)R(D)的計(jì)算還是比較困難的。第二類問(wèn)題是,即便求得了符合實(shí)際的信息率失真函數(shù),還需研究采用何種實(shí)用的最佳編碼方法才能達(dá)到R(D)。目前,這兩方面工作都有進(jìn)展。尤其是對(duì)實(shí)際信源的各種壓縮方法,如對(duì)語(yǔ)音信號(hào)、電視信號(hào)和遙感圖像等信源的各種壓縮方法有了較大進(jìn)展。相信隨著數(shù)據(jù)壓縮技術(shù)的發(fā)展,限失真編碼理論中存在的問(wèn)題將會(huì)得到解決。4.3標(biāo)量量化編碼連續(xù)信源限失真編碼的主要方法是量化,就是把連續(xù)的樣值離散化為某些量化級(jí)數(shù),所以量化也可稱為數(shù)字化。量化后的信號(hào)也可稱為數(shù)字信號(hào),這種轉(zhuǎn)換必將引入失真,量化時(shí)必須使這些失真最小。常用的量化方法有標(biāo)量量化和矢量量化兩種,所謂標(biāo)量量化是指每次只量化一個(gè)模擬樣本值,故又叫做零記憶量化。4.3.1均勻量化標(biāo)量量化中最簡(jiǎn)單的方法是均勻量化,也叫做線性量化。設(shè)量化器輸入為x,對(duì)應(yīng)實(shí)數(shù)值域空間為R,量化器輸出為y,對(duì)應(yīng)的實(shí)數(shù)值域空間為Rc,x和y的關(guān)系為y=Q(x)(4―32)設(shè)Rc對(duì)應(yīng)取值范圍[a0,an],a0可為負(fù)無(wú)限。an可為正無(wú)限。所謂均勻量化就是將區(qū)間[a0,an]分割為n個(gè)相等距離且互不重疊的子區(qū)間[ai,ai+1],取每個(gè)小區(qū)間的中點(diǎn)值作為量化值yi,即ai≤x≤ai+1時(shí),yi=(ai+1+ai)/2,若x的概率分布函數(shù)為p(x),則:均勻量化的量化誤差:(4―33)(4―34)量化器均方誤差:量化器輸入方差:(4―35)(4―36)量化器的信噪比SNR(SignalNoiseRate):量化器的工作區(qū)域有三個(gè)。
1.正常量化區(qū)當(dāng)輸入x∈[a0,an]時(shí),量化器能得到正常的量化輸出。2.限幅區(qū)當(dāng)x<a0或x>an時(shí),量化器分別輸出常量a0+Δ/2和an-Δ/2。量化器此時(shí)處于限幅或過(guò)載工作狀態(tài),將會(huì)產(chǎn)生較大的失真。
3.空載區(qū)當(dāng)-Δ/2<x-ai<Δ/2時(shí),將有兩種情況:(1)當(dāng)輸入x=ai時(shí),由于某種因素,使得x稍高于ai,則量化器輸出上一級(jí)量化值yi+1;當(dāng)輸入x稍低于ai時(shí);則輸出下一級(jí)量化值yi-1,這時(shí)的誤差為±Δ,量化器輸出在兩個(gè)量化級(jí)間往返跳動(dòng),形成一個(gè)矩形波輸出,結(jié)果將產(chǎn)生點(diǎn)狀噪聲。(2)輸入x在ai之上或之下,量化輸出分別為恒定值yi=ai+Δ/2或yi-1=ai-Δ/2。4.3.2最優(yōu)量化將樣本值量化總要帶來(lái)誤差,因此,人們?cè)谠O(shè)計(jì)量化器時(shí),總希望其誤差越小越好,即尋求最優(yōu)量化誤差。所謂最優(yōu)量化就是使量化器的均方誤差σ2e最小或信噪比SNR最大的量化。根據(jù)信息熵的理論可以推斷,量化誤差最小的最優(yōu)量化器,對(duì)量化器輸入?yún)^(qū)間的分割應(yīng)該是非均勻的。由于最優(yōu)量化與p(x)有關(guān),因而區(qū)間分割也與p(x)有關(guān),尤其當(dāng)N足夠大時(shí),可以近似認(rèn)為在各個(gè)子區(qū)間[ai,ai+1]上的概率分布p(x)為一常數(shù),也就是說(shuō),在各子區(qū)間上可被視為均勻分布,即:p(x)≈p(yi),x∈[ai,ai+1](4―37)因此,如果輸入x的概率分布在R上是均勻分布,其量化和最優(yōu)量化是比較容易實(shí)現(xiàn)和討論的,但對(duì)于一般標(biāo)量量化的最優(yōu)設(shè)計(jì)就不這樣容易了。下面介紹MaxLivod兩人提出的標(biāo)量量化器的設(shè)計(jì)算法。最優(yōu)量化就是使量化器的均方誤差σ2e為最小,將式(4―35)分別對(duì)ai和yi求導(dǎo),并令其為零,即(4―38)(4―39)則(4―40)(4―41)這里求出的ai和yi的值,就是最優(yōu)量化時(shí)的值??梢?jiàn)ai的最佳位置是輸出yi-1和yi的中點(diǎn),yi最佳位置在ai和ai+1區(qū)間的概率中心。一般情況下,ai和yi是互相制約、相互依賴的,不容易求出解析解,所以只能用遞推公式獲得近似解。MaxLivod采用的迭代方法如下:(1)任取y0;(2)由計(jì)算a1;(3)根據(jù)公式(4―40)計(jì)算y1;(4)重復(fù)步驟(2)、(3),分別計(jì)算出a2,y2,a3,y3,…,直至最后求得yn-1;(5)檢驗(yàn)yn是否為[an-1,an]的概率中心,即式是否成立,或在允許的一定誤差范圍內(nèi)成立;
(6)若步驟(5)滿足,則過(guò)程結(jié)束,否則,重新選y0,重復(fù)上述操作步驟。
4.4矢量量化編碼要想得到性能好的編碼,僅采用標(biāo)量量化是不可能的。在最佳編碼中,如將離散信源的多個(gè)符號(hào)進(jìn)行聯(lián)合編碼可提高效率,這對(duì)連續(xù)信源也是如此。當(dāng)把多個(gè)信源符號(hào)聯(lián)合起來(lái)形成多維矢量,再對(duì)矢量進(jìn)行標(biāo)量量化時(shí),自由度將更大,同樣的失真下,量化級(jí)數(shù)可進(jìn)一步減少,碼率可進(jìn)一步壓縮。這種量化叫做矢量量化。實(shí)驗(yàn)證明,即使各信源符號(hào)相互獨(dú)立,多維量化通常也可壓縮信息率。因而矢量量化引起人們的興趣而成為當(dāng)前連續(xù)信源編碼的一個(gè)熱點(diǎn)??墒钱?dāng)維數(shù)較大時(shí),矢量量化尚無(wú)解析方法,只能求助于數(shù)值計(jì)算;而且聯(lián)合概率密度也不易測(cè)定,還需采用諸如訓(xùn)練序列的方法。一般來(lái)說(shuō),高維矢量的聯(lián)合是很復(fù)雜的,雖已有不少方法,但其實(shí)現(xiàn)尚有不少困難,有待進(jìn)一步研究。設(shè)矢量量化器輸入集為X={X1,X2,…,XN},Xj∈X,Xj=(xj1,xj2,…,xjk),X∈R
k(k維歐幾里德空間),把R
k劃分成J=2n個(gè)互不相交的子空間R1,R2,…,RJ,求出每個(gè)子空間的質(zhì)心Yi,所有的Yi構(gòu)成Y={Y1,Y2,…,YJ},Y為量化器的輸出空間,也叫碼書(shū)(或碼本),Yi叫碼字或碼矢,J叫碼書(shū)的長(zhǎng)度。
對(duì)J階K維的矢量量化,實(shí)質(zhì)上是判斷輸入Xj∈Rk屬于哪個(gè)子空間Ri,然后輸出該子空間代表碼字Yi,即:Yi=Q(Xj),1≤i≤J,1≤j≤N(4―42)這里Yi就是Xj的編碼。實(shí)際編碼時(shí),在發(fā)送端只需記錄代表碼字Yi的下標(biāo)i,所以編碼過(guò)程是把X映射到I={1,2,…,J};而譯碼過(guò)程是在接收端依據(jù)收到的I代碼,查找碼書(shū)Y,獲得碼字Yi,用來(lái)代替Xj。由于總的碼字個(gè)數(shù)J一般遠(yuǎn)小于總的輸入信號(hào)N×K,所以矢量量化的壓縮能力非常大。
傳輸或存儲(chǔ)一個(gè)矢量所需比特為lbJ(一般
J=2n),它是一個(gè)K維矢量,就是K個(gè)輸入信號(hào),所以每個(gè)輸入信號(hào)的平均比特只有l(wèi)bJ/K,稱之為壓縮比。適當(dāng)選取碼書(shū)長(zhǎng)度J和碼字維數(shù)K,可以獲得很大壓縮比。矢量量化中碼書(shū)的碼字越多,維數(shù)越大,失真就越小。只要適當(dāng)?shù)剡x擇碼字?jǐn)?shù)量,就能控制失真量不超過(guò)某一給定值,因此碼書(shū)控制著矢量的大小。矢量量化時(shí)每輸入一個(gè)Xj,都要和J個(gè)碼字Yi逐一比較,搜索與其最接近的碼字Yi。由于兩者均為K維矢量,所以工作量很大。矢量量化是定長(zhǎng)碼,容易處理。
矢量量化由碼書(shū)Y和劃分Ri的條件惟一確定。當(dāng)碼書(shū)確定后,通過(guò)最近鄰域準(zhǔn)則可以惟一確定區(qū)域分割。因此,最佳量化器的設(shè)計(jì)也就是最佳碼書(shū)Y的設(shè)計(jì)。前面,在討論一維標(biāo)量的最佳設(shè)計(jì)時(shí),引入了MaxLivod的迭代算法,1980年Linde、Buzo和Gray將此算法推廣到了多維空間,稱作LBG算法。因LBG算法由于理論上的嚴(yán)密性和實(shí)現(xiàn)的簡(jiǎn)便性以及較好的設(shè)計(jì)效果而得到了廣泛的應(yīng)用,并成為各種改進(jìn)算法的基礎(chǔ)。有關(guān)LBG算法等知識(shí)請(qǐng)參閱有關(guān)文獻(xiàn)。4.5語(yǔ)音壓縮編碼對(duì)語(yǔ)音信號(hào)的壓縮,人們有較強(qiáng)的興趣,因?yàn)殡娫掃€是當(dāng)前主要的通信手段之一,業(yè)務(wù)量也很大,尤其在移動(dòng)通信中,由于無(wú)線頻帶有限,更需以低比特率傳送。眾所周知,語(yǔ)音壓縮編碼可劃分為波形編碼、參量編碼和混合編碼三大類型。波形編碼的目的是在接收端恢復(fù)發(fā)端原語(yǔ)音的波形,并以波形的保真度即自然度為主要度量指標(biāo)。參量編碼不同于波形編碼,它主要跟蹤波形產(chǎn)生的過(guò)程,并且僅傳送反映波形變化的主要參量,在接收端根據(jù)語(yǔ)音產(chǎn)生過(guò)程,利用這些參量恢復(fù)語(yǔ)音。它又稱為聲碼器,其主要度量指標(biāo)是可懂度?;旌暇幋a則介于波形編碼與參量編碼之間,即在參量編碼的基礎(chǔ)上,引入了波形編碼的特征,以達(dá)到改善自然度的目的,因此,它一般也稱混合編碼為軟聲碼器。由于語(yǔ)音信源是屬于連續(xù)的限失真信源,可以根據(jù)R(D)函數(shù)理論探討波形編碼的理論壓縮極限。
由信息論可知,若要語(yǔ)音基本達(dá)到公用網(wǎng)入網(wǎng)信噪比標(biāo)準(zhǔn),且大于26dB,那么理論壓縮倍數(shù)大約為3.4,若進(jìn)一步考慮到實(shí)際語(yǔ)音分布和主觀因素影響后,大約為4倍左右。對(duì)于參量編碼,度量其質(zhì)量的指標(biāo)不再是保真度,而是可懂度。若不考慮講話人音質(zhì)和情緒等因素,僅從可懂度出發(fā),在理論上,語(yǔ)音最低信息率大約為70~80b/s。它與目前常用的PCM語(yǔ)音64kb/s相比,理論壓縮比大約為800~900倍。限于篇幅本節(jié)只討論語(yǔ)音壓縮編碼的基本原理。
4.5.1波形編碼基本原理自適應(yīng)差分脈碼調(diào)制(ADPCM)是在差分脈碼調(diào)制(DPCM)的基礎(chǔ)上發(fā)展起來(lái)的。DPCM根據(jù)信號(hào)的過(guò)去樣值預(yù)測(cè)下一個(gè)樣值,并將預(yù)測(cè)誤差加以量化、編碼,而后進(jìn)行傳輸,由于預(yù)測(cè)誤差的幅度變化范圍小于原信號(hào)的幅度變化范圍,因此在相同量化噪聲條件下,DPCM的量化比特?cái)?shù)小于PCM,從而達(dá)到語(yǔ)音壓縮編碼的目的。ADPCM與DPCM比較,兩者主要區(qū)別在于ADPCM中的量化器和預(yù)測(cè)器采用了自適應(yīng)控制。同時(shí),在譯碼器中多了一個(gè)同步編碼調(diào)整,其作用是為了在同步級(jí)連時(shí)不產(chǎn)生誤差積累。
20世紀(jì)80年代以來(lái),32kb/sADPCM技術(shù)已日趨成熟,并接近PCM的質(zhì)量,但卻節(jié)省一半的信道容量,因而受到重視。1984年CCITT提出G721建議,采用動(dòng)態(tài)鎖定量化器,這是一種具有自適應(yīng)速度控制32kb/s的自適應(yīng)量化器,并將它作為國(guó)際標(biāo)準(zhǔn)化的語(yǔ)音編碼方法。1986年又對(duì)G721建議進(jìn)行了修正,稱G726建議,詳細(xì)內(nèi)容請(qǐng)參見(jiàn)相關(guān)的文獻(xiàn)。4.5.2參量編碼參量編碼的出發(fā)點(diǎn)在于跟蹤波形的產(chǎn)生過(guò)程,而不是傳輸波形本身。它傳遞的是反映這一變化過(guò)程的參量。根據(jù)線性預(yù)測(cè)原理,語(yǔ)音信號(hào)可用一系列預(yù)測(cè)變化的參量和其他與變化有關(guān)的參量來(lái)表征。在接收端,收到的這些語(yǔ)音參量通過(guò)一個(gè)時(shí)變數(shù)字濾波器,它根據(jù)發(fā)聲原理合成原來(lái)的語(yǔ)音。稱實(shí)現(xiàn)參量編碼的編碼器為語(yǔ)音編碼器或聲碼器。所謂聲碼器,就是在充分研究音發(fā)音系統(tǒng)特點(diǎn)的基礎(chǔ)上,設(shè)法提取語(yǔ)音信號(hào)的要素。這樣就可以只傳送這些要素而不再傳送語(yǔ)音信號(hào)的波形。在接收端利用這些要素重建語(yǔ)音信號(hào),稱為合成語(yǔ)音。只要這些要素選擇得恰當(dāng),所需碼率就可很小而仍能保持良好的語(yǔ)音質(zhì)量?,F(xiàn)在簡(jiǎn)要地說(shuō)明人的發(fā)音過(guò)程。當(dāng)人發(fā)聲時(shí),空氣由肺部排出,在聲帶間受壓而使聲帶振動(dòng),振動(dòng)頻率由聲帶的張力和聲帶的厚度等因素所決定,因而因人、內(nèi)容而異。壓出的氣流強(qiáng)弱決定聲音的強(qiáng)度。該氣流經(jīng)過(guò)由口腔等組成的聲道時(shí)而被調(diào)制,形成不同的音色。聲道包括口腔中的舌、齒、唇等,發(fā)鼻音時(shí)還要利用鼻腔。以上均指發(fā)濁音和母音的情況。當(dāng)發(fā)清音時(shí),聲帶只有收縮和放開(kāi),不作周期性振動(dòng);發(fā)爆破音時(shí),主要靠唇部動(dòng)作,也屬于清音類型。實(shí)際發(fā)聲過(guò)程當(dāng)然要比上述過(guò)程復(fù)雜得多,最常用的簡(jiǎn)化原理圖如圖4―3所示。圖4―3語(yǔ)音產(chǎn)生模型圖4―3中,u(n)是波形產(chǎn)生的激勵(lì)參量,c(n)是輸出的語(yǔ)音。激勵(lì)分為兩種:A路是發(fā)濁音或母音時(shí)的情況,可用周期性信號(hào)來(lái)代表,其周期大小和強(qiáng)度可隨時(shí)調(diào)整;B路是發(fā)清音時(shí)的情況,可用近似于白噪聲的隨機(jī)信號(hào)來(lái)代表。圖中的雙擲開(kāi)關(guān)表示發(fā)音不同時(shí)可上、下轉(zhuǎn)換。濾波部分一般用線性濾波器來(lái)近似地代表聲音在聲道中被調(diào)制的過(guò)程。而線性時(shí)變?yōu)V波器的系數(shù)可以通過(guò)線性預(yù)測(cè)等技術(shù)獲得。在一般情況下需要有12個(gè)系數(shù){ai}(i=1,2,…,12)。此外,還有三個(gè)重要參量即音調(diào)(基音)周期P、清濁音判決u/v和代表語(yǔ)音強(qiáng)弱的增益參量G??梢?jiàn),語(yǔ)音信號(hào)中所包含的主要信息就由這15個(gè)參量所決定。通過(guò)對(duì)每幀語(yǔ)音進(jìn)行分析求出這15個(gè)參量,然后將它們量化、編碼傳送給收端。接收端用收到的這15個(gè)參量和發(fā)聲模型,綜合、復(fù)制出語(yǔ)音信號(hào)。這里線性時(shí)變?yōu)V波器的系數(shù)由收到的12個(gè)參量{ai},i=1,2,…,12控制,激勵(lì)器幅度受到增益G的控制。具體采用哪一類信號(hào)源則由收到的清濁音u/v來(lái)決定。發(fā)清音時(shí),激勵(lì)為偽隨機(jī)的白噪聲源,發(fā)濁音時(shí),激勵(lì)為基音周期控制的準(zhǔn)周期脈沖源。采用這種編碼方式進(jìn)行語(yǔ)音有效傳輸?shù)南到y(tǒng)稱為線性預(yù)測(cè)器(LPC)。
線性預(yù)測(cè)分析仍是目前聲碼器技術(shù)的主流。近年來(lái)值得注意的有三個(gè)方面。首先是提高合成語(yǔ)音質(zhì)量的措施,如采用余數(shù)激勵(lì)聲碼器RELP、多脈沖激勵(lì)聲碼器MELP以及聲道參數(shù)模型的改善等。其次是進(jìn)一步降低速率,如采用變換技術(shù),優(yōu)化編碼、矢量量化技術(shù)等等。顯然,這兩方面的技術(shù)都與復(fù)雜性成正比,所以用復(fù)雜性換取技術(shù)性是今后的一個(gè)方向。最后是參數(shù)的自適應(yīng)特性。一般預(yù)測(cè)系數(shù)自適應(yīng)范圍大致在30次/s至400次/s,而對(duì)音調(diào)基音周期和增益的自適應(yīng)范圍大致在100次/s至200次/s。
4.5.3混合編碼余數(shù)激勵(lì)聲碼器(RELPC)將余數(shù)低頻譜中的一小部分(基帶余數(shù)信號(hào))所攜帶的激勵(lì)信息傳送給收端,它避免了清、濁音判決及基音提取??梢?jiàn),它是在LPC聲碼器基礎(chǔ)上發(fā)展起來(lái)的,從而是一種混合編碼的方法。在接收端,用高頻再生技術(shù)來(lái)恢復(fù)完整的余數(shù)信號(hào),其實(shí)現(xiàn)方框圖如圖4―4所示。圖4―4RELPC原理方框圖圖中語(yǔ)音帶寬為ωH2,而余數(shù)信號(hào)的基帶帶寬是BH2,且它僅是全頻帶余數(shù)信號(hào)頻譜的一部分(1/L),采樣以原采樣率Fs的1/L進(jìn)行采樣,然后對(duì)采樣信號(hào)進(jìn)行編碼。下支路LPC分析提取參量并編碼,將兩路編碼合并后送入信道。在接收端,上支路經(jīng)過(guò)譯碼,輸出基帶余數(shù)信號(hào),對(duì)基帶余數(shù)信號(hào)進(jìn)行高頻再生處理,然后該信號(hào)通過(guò)下端截止頻率為BH2的高通濾波器輸出,再與基帶余數(shù)信號(hào)相加產(chǎn)生全頻帶余數(shù)信號(hào)去激勵(lì)LPC合成器產(chǎn)生合成語(yǔ)音輸出。
可見(jiàn),RELPC方法在發(fā)送端用余數(shù)信號(hào)中低頻信息取代寬帶余數(shù)信號(hào)信息,而在接收端對(duì)基帶余數(shù)信號(hào)進(jìn)行高頻再生處理,產(chǎn)生全頻帶余數(shù)信號(hào)去激勵(lì)LPC合成器。
4.6圖像壓縮編碼在20世紀(jì)90年代,計(jì)算機(jī)技術(shù)、微電子技術(shù)和通信技術(shù)得到迅猛發(fā)展。多媒體計(jì)算機(jī)、多媒體數(shù)據(jù)庫(kù)、多媒體通信、多媒體表現(xiàn)技術(shù)等多媒體研究領(lǐng)域也成為計(jì)算機(jī)和通信發(fā)展中的一個(gè)重要研究熱點(diǎn)。其中面臨最大的問(wèn)題是數(shù)據(jù)量巨大的“爆炸”。文件、表格、工程圖紙等二值圖像的數(shù)據(jù)已較大。但相比之下,語(yǔ)音信號(hào)、靜止灰值圖像、彩色靜止圖像電視圖像、高清晰電視圖像等的數(shù)據(jù)量更是巨大。特別是高清晰電視圖像。一般電視圖像的數(shù)據(jù)量要比語(yǔ)音的數(shù)據(jù)量大上千倍。因此,研究有效的數(shù)據(jù)壓縮和解壓縮的技術(shù)成為重要的、關(guān)鍵的研究方向。信息率失真理論從理論上指出,解決這種問(wèn)題的途徑是存在的、可能的。4.6.1靜止圖像壓縮編碼新聞圖片、醫(yī)療圖片、衛(wèi)星圖片以及圖像文獻(xiàn)資料等均屬于靜止圖像。這類靜止圖片的壓縮,對(duì)傳輸和存儲(chǔ)都具有重要的應(yīng)用價(jià)值。靜止圖像壓縮編碼一般可劃分為無(wú)失真編碼與限失真編碼兩大類。對(duì)無(wú)失真編碼一般采用霍夫曼編碼或者算術(shù)編碼。限失真編碼主要有:幀內(nèi)、幀間的預(yù)測(cè)編碼;二維變換編碼:KLT、DFT、DCT、HRT、SLT等等,以及子帶編碼、分層編碼、輪廓編碼、分形編碼、小波變換等等,但主要以預(yù)測(cè)編碼和正交變換編碼為主,JPEG標(biāo)準(zhǔn)是用于多個(gè)灰度及色度連續(xù)變化的靜止圖像編碼的國(guó)際標(biāo)準(zhǔn)。
4.6.2活動(dòng)圖像壓縮編碼廣播電視、會(huì)議電視和可視電話等運(yùn)動(dòng)圖像信號(hào),除幀內(nèi)像素間有相關(guān)性而外,幀與幀之間也有很強(qiáng)的相關(guān)性,所以對(duì)這類信號(hào)的處理常用幀間預(yù)測(cè)技術(shù)。幀間預(yù)測(cè)不僅要利用本行的前幾個(gè)樣值和前幾行的相鄰取樣值,而且要利用上一幀或前幾幀的取樣值來(lái)估計(jì)當(dāng)前幀內(nèi)的像素值,因此幀間預(yù)測(cè)是一種三維預(yù)測(cè)方法。它在幀內(nèi)預(yù)測(cè)的基礎(chǔ)上,再利用幀間的時(shí)間相關(guān)性進(jìn)一步消除圖像信號(hào)的冗余度,提高壓縮比。
為了達(dá)到實(shí)時(shí)幀間預(yù)測(cè),前幾幀的圖像數(shù)據(jù)必須儲(chǔ)存在幀存儲(chǔ)器(VRAM)中。超大規(guī)模集成電路技術(shù)(VLSl)日趨成熟,使幀間預(yù)測(cè)技術(shù)變?yōu)楝F(xiàn)實(shí),因此,幀間預(yù)測(cè)技術(shù)正在成為會(huì)議電視、可視電話、數(shù)字電視、HDTV的壓縮數(shù)據(jù)的主要方法之一。在介紹幀間預(yù)測(cè)技術(shù)之前,先研究一下電視圖像等幀間差值的統(tǒng)計(jì)特性。er(i,j)=ur(i,j)-ur-1(i,j)(4―43)實(shí)際統(tǒng)計(jì)結(jié)果表明,該差值不大。對(duì)于變化緩慢的黑白圖像序列,如可視電話、會(huì)議電視的圖像信號(hào),如果對(duì)其進(jìn)行256級(jí)量化,只有4%像素的幀間差值超過(guò)閾值3;對(duì)于亮度值變化較為劇烈的256級(jí)的彩色電視圖像序列,也只有7.5%像素的幀間差值越過(guò)閾值6??梢?jiàn)幀與幀之間,信號(hào)的相關(guān)性是很強(qiáng)的,即冗余度很大。這一統(tǒng)計(jì)特性就是幀間預(yù)測(cè)編碼的基礎(chǔ)。幀間差值從總體上來(lái)看雖然不大,但從活動(dòng)的局部圖像像素或子塊間看,有時(shí)還是比較大的,因此根據(jù)具體情況可采用兩種幀間預(yù)測(cè)方法處理。
1.狹義幀間預(yù)測(cè)狹義幀間預(yù)測(cè)就是用某點(diǎn)前一幀的像素值ur-1(i,j)作為該點(diǎn)當(dāng)前幀的像素值ur(i,j)的預(yù)測(cè)值。這種誤差為e(i,j)=ur(i,j)-ur-1(i,j)(4―44)
2.復(fù)合差值預(yù)測(cè)當(dāng)幀間某點(diǎn)的像素差值比較大,且圖況較為復(fù)雜時(shí),顯然就不能簡(jiǎn)單地傳輸鄰近兩幀間對(duì)應(yīng)像素的幀間差值,而應(yīng)按一定準(zhǔn)則,先估計(jì)一個(gè)像素或一個(gè)圖像子塊的運(yùn)動(dòng),然后根據(jù)預(yù)測(cè)出的運(yùn)動(dòng)位移確定對(duì)應(yīng)像素,從而獲得相鄰兩幀間的幀間差值。復(fù)合差值預(yù)測(cè)與狹義幀間預(yù)測(cè)相比,對(duì)活動(dòng)圖像,其預(yù)測(cè)的幀間差值要小得多,且準(zhǔn)確性高。在發(fā)送端稱為運(yùn)動(dòng)估計(jì),在接收端則稱為運(yùn)動(dòng)補(bǔ)償,一般簡(jiǎn)稱運(yùn)動(dòng)補(bǔ)償(MC)預(yù)測(cè)技術(shù)。根據(jù)參加運(yùn)動(dòng)估計(jì)的對(duì)象不同,有條件幀間修補(bǔ)法和運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)兩種估計(jì)方法。1)條件幀間修補(bǔ)法幀間預(yù)測(cè)誤差為(4―45)式中:e(i,j)——當(dāng)前像素ur(i,j)幀間差值;——第r幀中當(dāng)前像素值;——第r幀中當(dāng)前像素ur(i,j)的預(yù)測(cè)值;——前一幀中對(duì)應(yīng)像素ur-1(i,j)復(fù)原值。對(duì)電視圖像編碼Mounts、Pease等人提出的條件像素修補(bǔ)法規(guī)定:若幀間誤差e(i,j)超過(guò)閾值,則把這些像素存在緩沖存儲(chǔ)器中,并以恒定的傳輸速度傳送或者只傳送誤差e(i,j);對(duì)低于閾值的像素則不傳送,在接收端用上一幀圖像的相應(yīng)像素值來(lái)代替。這樣,一幅電視圖像只要傳送其中很少部分的像素,或只傳送幀間差值,所以能得到較高的壓縮比。2)運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)技術(shù)正處于研究和發(fā)展中,重點(diǎn)是尋找一些簡(jiǎn)單而又實(shí)用的幀內(nèi)和幀間復(fù)合的自適應(yīng)預(yù)測(cè)方法,但是至今沒(méi)有取得特別有效的方案。下面簡(jiǎn)單介紹在國(guó)際標(biāo)準(zhǔn)化視頻編碼方案MPEG中,使用的運(yùn)動(dòng)補(bǔ)償技術(shù)。運(yùn)動(dòng)補(bǔ)償技術(shù)的基本原理是,運(yùn)動(dòng)補(bǔ)償技術(shù)對(duì)占整個(gè)畫(huà)面有較小的運(yùn)動(dòng)部分的圖像,其壓縮數(shù)據(jù)效果特別好,如會(huì)議電視、可視電話等。用運(yùn)動(dòng)補(bǔ)償技術(shù)計(jì)算圖像中運(yùn)動(dòng)部分位移的兩個(gè)分量可使預(yù)測(cè)效果大大提高,運(yùn)動(dòng)補(bǔ)償法跟蹤畫(huà)面內(nèi)的活動(dòng)情況,先對(duì)其加以補(bǔ)償之后,再進(jìn)行幀間預(yù)測(cè)。運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)方案的使用規(guī)則是,首先把圖像分割為靜止的和運(yùn)動(dòng)的兩部分。這里假設(shè)運(yùn)動(dòng)物體只作平移運(yùn)動(dòng),即把物體的復(fù)雜運(yùn)動(dòng)化成一段段簡(jiǎn)單的平移,使算法簡(jiǎn)單易于實(shí)現(xiàn)。然后計(jì)算物體的位移值;接著用位移估值(即運(yùn)動(dòng)矢量)進(jìn)行運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)。最后對(duì)預(yù)測(cè)信息進(jìn)行編碼。這項(xiàng)技術(shù)的關(guān)鍵是運(yùn)動(dòng)矢量的計(jì)算。從運(yùn)動(dòng)補(bǔ)償技術(shù)中已看到,如何把圖像分割成靜、動(dòng)兩部分是運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)的基礎(chǔ),但這也是困難的。兩幀圖像間的運(yùn)動(dòng)估計(jì)是運(yùn)動(dòng)圖像處理的關(guān)鍵。通常采用兩種較簡(jiǎn)單的方法處理:一種方法是把圖像分成若干矩形子塊;另一種方法是像素遞歸法。第一種方法將分成的子塊分為動(dòng)和不動(dòng)兩種,然后估計(jì)運(yùn)動(dòng)子塊的位移,再進(jìn)行預(yù)測(cè)傳輸;后一種方法則是對(duì)每個(gè)像素的位移進(jìn)行遞歸估計(jì)。4.6.3視頻壓縮編碼電視信號(hào)具有很強(qiáng)的相關(guān)性和巨大的數(shù)據(jù)量,因此電視信號(hào)需要進(jìn)行數(shù)據(jù)壓縮,數(shù)字電視和高分辨率的電視(HDTV)將是21世紀(jì)人類使用的主要電視系統(tǒng),這是由于數(shù)字電視比模擬電視具有很多突出優(yōu)點(diǎn)而決定的。1.數(shù)字電視的特點(diǎn)數(shù)字圖像的質(zhì)量遠(yuǎn)高于模擬電視圖像。例如,數(shù)字電視信號(hào)的抗噪聲干擾及克服非線性失真都明顯地優(yōu)于模擬電視信號(hào),能克服高樓大廈對(duì)電波反射所造成的重影問(wèn)題。數(shù)字電視信號(hào)經(jīng)過(guò)多次中繼再生。數(shù)字電視廣播,在廣闊范圍內(nèi)具有同等優(yōu)良的圖像質(zhì)量。數(shù)字電視可以實(shí)現(xiàn)模擬電視難于實(shí)現(xiàn)的復(fù)雜的電視信號(hào)處理和加工,如數(shù)字視頻特技效果。數(shù)字電視能克服全球各種模擬電視制式難于統(tǒng)一的問(wèn)題,實(shí)現(xiàn)不同電視制式的自動(dòng)轉(zhuǎn)換等。數(shù)字電視信號(hào)易于實(shí)現(xiàn)計(jì)算機(jī)控制和自動(dòng)化操作、管理,易于實(shí)現(xiàn)廣播電視與計(jì)算機(jī)網(wǎng)絡(luò)和電話網(wǎng)的三網(wǎng)合一,為多媒體信息的傳輸、存儲(chǔ)、同步、交互和融合創(chuàng)造條件。數(shù)字電視系統(tǒng)采用大規(guī)模數(shù)字集成電路,大大提高了電視設(shè)備的穩(wěn)定性、可靠性。電視信號(hào)數(shù)字化后也存在幾個(gè)問(wèn)題:數(shù)碼率太高,傳輸一路PCM數(shù)字電視信號(hào)所需要的帶寬要比傳輸一路模擬電視信號(hào)大10倍左右,信道利用很不經(jīng)濟(jì);由于數(shù)字電視的數(shù)據(jù)量龐大,對(duì)存儲(chǔ)器的容量、元件的速度、數(shù)字電路的集成度要求很高。因此,在經(jīng)濟(jì)上、技術(shù)上實(shí)現(xiàn)全數(shù)字化的廣播電視尚有較大的難度。但經(jīng)過(guò)最近10年的研究,基本上找到了解決問(wèn)題的方法。這些解決的方法是,采用業(yè)已成熟的帶寬壓縮編碼技術(shù),如預(yù)測(cè)編碼法(如DPCM)、正交變換編碼法、自適應(yīng)編碼等。但是人們還在探求更有效的活動(dòng)圖像的數(shù)據(jù)壓縮編碼技術(shù)。對(duì)于傳輸信道,已開(kāi)始采用寬帶傳輸載體,如光纖等。目前,超高速、超大規(guī)模數(shù)字集成電路技術(shù)已很成熟,且其成本不斷降低。發(fā)達(dá)的西方國(guó)家已經(jīng)在局部范圍里采用全數(shù)字電視廣播系統(tǒng)發(fā)送和接收數(shù)字電視信號(hào),我國(guó)已于1998年試制成功了全數(shù)字電視接收機(jī),可以預(yù)料在今后幾年內(nèi),全數(shù)字電視設(shè)備將取代目前的模擬電視系統(tǒng)。2.數(shù)字電視系統(tǒng)的結(jié)構(gòu)數(shù)字電視系統(tǒng)的組成,如圖4―5所示。圖中,攝像機(jī)輸出的模擬電視信號(hào)經(jīng)過(guò)模/數(shù)轉(zhuǎn)換器(ADC)轉(zhuǎn)換成脈沖編碼調(diào)制(PCM)的數(shù)字電視信號(hào)。PCM數(shù)字電視信號(hào)可以作為數(shù)字電視圖像信號(hào)處理的信源,也可以直接通過(guò)寬帶信道(如光纖等)進(jìn)行傳輸(這種情況就是PCM的基帶傳輸,適合近距離傳輸)。圖4―5數(shù)字電視系統(tǒng)方框圖由于PCM電視信號(hào)的數(shù)碼率過(guò)高,例如PAL制全電視信號(hào)用三倍副載波采樣,8位量化的PCM信號(hào)的數(shù)碼率達(dá)106Mb/s,所以要對(duì)它進(jìn)行壓縮編碼,去除信號(hào)中的冗余度,減少傳輸數(shù)碼率。經(jīng)數(shù)碼率壓縮后的數(shù)字電視信號(hào)可供記錄或存儲(chǔ),同時(shí)送去進(jìn)行信道編碼。信道編碼主要是糾錯(cuò)、檢錯(cuò)編碼。信道編碼的作用是提高數(shù)字電視信號(hào)在信道傳輸中的抗干擾能力,降低誤碼率。信道傳輸時(shí)不可避免地受噪聲源干擾。信道編碼后的數(shù)字電視信號(hào),在發(fā)射機(jī)中對(duì)射頻信號(hào)進(jìn)行數(shù)字調(diào)制后,便能在信道中進(jìn)行遠(yuǎn)距離傳輸。傳輸信道可以是同軸電纜、微波線路、光纖等。接收端將數(shù)字電視的射頻調(diào)制信號(hào),經(jīng)過(guò)解調(diào)、信道譯碼、信源譯碼后重現(xiàn)模擬電視信號(hào)以供顯像用。3.電視信號(hào)數(shù)碼率的壓縮在保證圖像傳輸質(zhì)量一定的情況下,盡量降低數(shù)字電視信號(hào)的傳輸碼率是人們一直研究的重要內(nèi)容。下面介紹幾種壓縮數(shù)碼率的主要途徑。1)利用電視圖像信號(hào)的相關(guān)性電視信號(hào)的相關(guān)性主要表現(xiàn)在空間和時(shí)間上的相關(guān)性,電視信號(hào)的空間相關(guān)性是指幀內(nèi)相關(guān)或同一幀內(nèi)相鄰行間相鄰像素的相關(guān);電視信號(hào)的時(shí)間相關(guān)性主要表現(xiàn)為相繼幀之間的相關(guān)上,而且其相關(guān)性較強(qiáng)。2)利用人的生理特性充分利用人的視覺(jué)、生理、心理學(xué)的特性,適當(dāng)降低空間分辨率(P)、灰度分辨率(R)、時(shí)間分辨率(fZ)中的某一個(gè)分辨率的具體要求,可望進(jìn)一步降低數(shù)碼率。因?yàn)殡娨晥D像是給人看的,而人的視覺(jué)在某些條件下可容忍某些失真(對(duì)某些變化或情況不敏感),甚至于肉眼對(duì)有些失真根本辨別不出來(lái),因此,超過(guò)視覺(jué)分辨能力的高保真度就沒(méi)有必要了。這樣做并不涉及電視信號(hào)內(nèi)在的相關(guān)性,所以稱之為非相關(guān)性壓縮,或稱為HVS壓縮。因此,可以從下面幾方面采取措施來(lái)壓縮數(shù)碼率。對(duì)靜態(tài)圖像需要觀察的全部像素大約有幾十萬(wàn)個(gè),而對(duì)運(yùn)動(dòng)圖像,肉眼分辨不出如此之多的像素。那么對(duì)電視圖像信號(hào)就可以適當(dāng)減少一些像素,但要保證畫(huà)面切換速度(fZ不低于25幀/s)足夠高,否則肉眼就不能連續(xù)地分辨圖像畫(huà)面,將出現(xiàn)圖像的跳動(dòng)、閃動(dòng)、模糊等情況。因此,可以根據(jù)圖像的活動(dòng)程度,適當(dāng)調(diào)整時(shí)間分辨率(fZ)和空間分辨率(P),達(dá)到降低圖像數(shù)碼率的目的。這就是空間—時(shí)間分辨率轉(zhuǎn)換,實(shí)踐證明,fZ—P間呈現(xiàn)雙曲線關(guān)系。由人的視覺(jué)、生理、心理學(xué)的論證可知,肉眼對(duì)大面積圖像能分辨出的灰度等級(jí)比對(duì)小塊圖像或細(xì)節(jié)部分的灰度等級(jí)大得多。由人的視覺(jué)、生理、心理學(xué)的論證可知,肉眼對(duì)大面積圖像能分辨出的灰度等級(jí)比對(duì)小塊圖像或細(xì)節(jié)部分的灰度等級(jí)大得多。例如,在急劇的黑白跳動(dòng)處,肉眼難以分辨灰度差別,因此可降低量化級(jí)數(shù),使P位數(shù)變少。而對(duì)于圖像中的平坦區(qū)域可以降低采樣頻率,但要保持每一個(gè)樣本值有較多的灰度等級(jí);反之,對(duì)于圖像的邊緣和細(xì)節(jié)部分,應(yīng)保持較高的采樣率,但對(duì)每一個(gè)樣本值只需要分配較少的量化比特?cái)?shù),這就是空間-灰度分辨率轉(zhuǎn)換,實(shí)踐證明,P-R間也呈現(xiàn)雙曲線關(guān)系。因?yàn)槿庋蹖?duì)快速運(yùn)動(dòng)圖像的灰度等級(jí)R的分辨能力較差,只能分辨較少的量化級(jí)數(shù),因此,可以減少量化階數(shù),但要保證較高的畫(huà)面切換速度,即保證圖像有足夠的運(yùn)動(dòng)速度;反之,對(duì)靜止圖像,則要保證有足夠多的灰度級(jí)數(shù),這就是灰度-時(shí)間分辨率轉(zhuǎn)換,
R-fZ間也呈現(xiàn)雙曲線關(guān)系。如果將電視信號(hào)的三種分辨率視為長(zhǎng)方體的三條邊,若不考慮人的視覺(jué)、生理、心理學(xué)關(guān)系,該長(zhǎng)方體的體積就由P,R,fZ的最高分辨率確定,且其體積最大。若采用這種非相關(guān)壓縮方法,因受到人的視覺(jué)、生理、心理學(xué)關(guān)系的約束,其分辨率可大為減小。有人估計(jì),若真的能充分利用上述因素之間的關(guān)系,適時(shí)地按圖像的局部性質(zhì)最佳來(lái)調(diào)整三者(P、R、fZ)之間的關(guān)系,可使黑白電視信號(hào)的數(shù)據(jù)壓縮到大約1Mb/s。雖然效果十分可觀,但實(shí)現(xiàn)起來(lái)是十分困難的。利用視覺(jué)對(duì)色差信號(hào)不敏感的特性可以降低其帶寬和采樣頻率。
3)利用自適應(yīng)技術(shù)在預(yù)測(cè)編碼系統(tǒng)中,預(yù)測(cè)器、量化器和編碼器是實(shí)現(xiàn)數(shù)據(jù)壓縮的主要部件,而自適應(yīng)技術(shù)是實(shí)現(xiàn)數(shù)據(jù)壓縮的優(yōu)良方法。預(yù)測(cè)器的自適應(yīng)技術(shù)已在其他章節(jié)介紹了,這里只介紹自適應(yīng)量化器降低數(shù)碼率的方法。利用自適應(yīng)量化器壓縮數(shù)碼率的基本思想,就是當(dāng)量化器的輸入(誤差信號(hào)e)較小時(shí),使量化階(量化當(dāng)量)減??;當(dāng)誤差信號(hào)較大時(shí),表示圖像的亮度差或灰度差很大,這時(shí)肉眼的靈敏度將降低,可采用粗量化(量化當(dāng)量增大)。也就是說(shuō),根據(jù)偏差的大小采用不同的量化階數(shù),或固定量化階數(shù),而改變量化當(dāng)量的大小,進(jìn)行自適應(yīng)量化。自適應(yīng)量化器的種類很多,常用的有浮動(dòng)式量化器和利用HVS效應(yīng)而設(shè)計(jì)的自適應(yīng)量化器兩種。4.6.4H.261建議1.H.261建議H.261視頻壓縮編碼標(biāo)準(zhǔn)是CCITT在1990年7月通過(guò)的建議,它主要用于可視電話和會(huì)議電視。該建議視頻編碼信號(hào)的傳輸速率為64kb/s~1.92Mb/s。該建議利用CIF圖像分辨率格式和QCIF分辨率格式,以解決不同制式通信間的矛盾。建議采用運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)算法,以消除電視圖像時(shí)間域上的相關(guān)性;對(duì)預(yù)測(cè)誤差進(jìn)行DCT變換,以消除圖像空間域上的相關(guān)性;然后自適應(yīng)量化DCT系數(shù),以充分利用人的視覺(jué)特性;接著進(jìn)行熵編碼,以實(shí)現(xiàn)統(tǒng)計(jì)匹配編碼;最后采用輸出緩沖存儲(chǔ)器,以平滑數(shù)碼流,達(dá)到輸出數(shù)碼率保持恒定的目的。圖像幀編碼模式有三類:I幀,采用幀內(nèi)方式編碼的圖像幀;P幀,采用幀間方式編碼的圖像幀,P幀先對(duì)I幀或前面的P幀進(jìn)行運(yùn)動(dòng)估值補(bǔ)償,再對(duì)預(yù)測(cè)誤差進(jìn)行編碼;B幀,是雙向內(nèi)插幀,它本身不進(jìn)行編碼傳輸,而是在譯碼端直接由I幀或P幀或者P幀與P幀插值得到。H.261標(biāo)準(zhǔn)編碼的數(shù)據(jù)結(jié)構(gòu)從高層到低層定義了四個(gè)層次,即幀層、片層、宏塊層和塊層。H.261的運(yùn)動(dòng)估值、補(bǔ)償是以宏塊為單位進(jìn)行的。對(duì)某一宏塊是選擇幀間還是幀內(nèi)編碼方式,首先需要經(jīng)過(guò)判斷。若它與匹配宏塊相關(guān)性強(qiáng),則可采用幀間編碼方式,反之則采用幀內(nèi)編碼方式。H.261計(jì)劃用于會(huì)話型業(yè)務(wù),對(duì)由編譯碼附加的延時(shí)很敏感,希望盡量減少延時(shí)。這在實(shí)際系統(tǒng)設(shè)計(jì)時(shí)應(yīng)加以注意。H.261有很多“開(kāi)放”部分,建議對(duì)這些部分沒(méi)有作出硬性規(guī)定。建議只對(duì)與兼容性有關(guān)的部分作了詳細(xì)嚴(yán)格的限制性規(guī)定,而對(duì)許多與復(fù)原圖像質(zhì)量有很大影響的重要指標(biāo),但不影響兼容性的不作限制性規(guī)定。這是一種非常明智的做法,在不損害兼容性的前提下為開(kāi)發(fā)者、廠商和用戶提供了很大的選擇余地。如對(duì)編碼器中的運(yùn)動(dòng)估計(jì)部分,就可采用快速運(yùn)動(dòng)估計(jì)算法使運(yùn)算量成倍下降,也可采用低分辨率的QCIF格式、抽幀等方法,使編譯碼器的復(fù)雜度大大下降。2.H.263建議
ITU―T通過(guò)的H.263建議的目的是提供比H.261有很大改進(jìn)的圖像質(zhì)量。H.263建議與H.261建議的不同之處主要表現(xiàn)在以下幾個(gè)方面:(1)H.263建議使用的視頻比特率小于64kb/s,且傳輸比特率不固定;而H.261建議最初計(jì)劃使用的視頻比特率大約在40kb/s~2Mb/s。(2)H.263信源編碼器可用五種標(biāo)準(zhǔn)化格式工作,即SubQCIF、QCIF、CIF、4CIF和16CIF,其中后三種格式為可選擇的,譯碼器要支持前兩種格式,而編碼器要支持前兩種格式中的一種,而H.261建議規(guī)定了QCIF和CIF兩種圖像掃描格式。(4)H.263建議在信源編碼器中取消了環(huán)路濾波器,但在H.261建議中可以使用環(huán)路濾波器來(lái)修正預(yù)測(cè)過(guò)程。(5)H.263建議專門(mén)設(shè)置了多種可選模式。(6)H.263使用半像素精度進(jìn)行運(yùn)動(dòng)補(bǔ)償,而H.261使用全像素精度。H.263具有塊運(yùn)動(dòng)補(bǔ)償能力,以改進(jìn)幀間預(yù)測(cè)。塊運(yùn)動(dòng)補(bǔ)償?shù)闹饕硎?,?dāng)預(yù)測(cè)塊取自前一幀不同位置時(shí),可以改進(jìn)幀間預(yù)測(cè)。而且,每一個(gè)宏塊都傳送一個(gè)平移矢量,這樣,簡(jiǎn)單的平移運(yùn)動(dòng)就會(huì)被補(bǔ)償。另外,H.263還使用更高級(jí)的運(yùn)動(dòng)矢量預(yù)測(cè)方法。除核心算法外,H.263還包含四種高級(jí)的編碼方式可供選擇,即無(wú)限制運(yùn)動(dòng)矢量方式、高級(jí)預(yù)測(cè)方式、PB幀方式和基于語(yǔ)法的算術(shù)編碼方式。在無(wú)限制運(yùn)動(dòng)矢量方式中取消了作為基準(zhǔn)的像素必須在編碼圖像區(qū)域內(nèi)的限制。在高級(jí)預(yù)測(cè)方式中使用了重迭塊運(yùn)動(dòng)補(bǔ)償,而且還允許運(yùn)動(dòng)矢量穿過(guò)圖像邊界。在PB幀方式中,B幀通過(guò)前一個(gè)譯碼P幀和當(dāng)前的一個(gè)譯碼P幀進(jìn)行雙向預(yù)測(cè)得到,這樣就提高了幀速率但并未明顯增加比特率。總之,以上三種方式主要是為了改進(jìn)幀間預(yù)測(cè)?;谡Z(yǔ)法算術(shù)編碼方式的采用是為了進(jìn)一步降低傳輸?shù)谋忍芈?。在這種方式中,所有的變長(zhǎng)碼的編譯碼運(yùn)算都用算術(shù)編譯碼運(yùn)算來(lái)代替。采用這些選擇雖然增加了編碼器的復(fù)雜度,但圖像質(zhì)量得到很大的改善。4.6.5JPEG標(biāo)準(zhǔn)
JPEG標(biāo)準(zhǔn)是國(guó)際標(biāo)準(zhǔn)化組織ISO、原國(guó)際電報(bào)電話咨詢委員會(huì)CCITT以及國(guó)際電工委員會(huì)IEC共同組織了一個(gè)專家小組(JointphotographicExpertsGroup)共同研究并制定的一個(gè)標(biāo)準(zhǔn),是用于多個(gè)灰度及色度連續(xù)變化的自然圖像編碼的國(guó)際標(biāo)準(zhǔn),適用于靜止圖像。JPEG聯(lián)合圖片專家小組在1991年3月提出的標(biāo)準(zhǔn)“連續(xù)色調(diào)靜止圖像的數(shù)字壓縮編碼”,即JPEG標(biāo)準(zhǔn)采用ADCT作為彩色靜止圖像壓縮的標(biāo)準(zhǔn)化算法。該算法有DCT方式(非可逆編碼)和空間方式(可逆編碼)兩種方法。在DCT方式中,又分為基本系統(tǒng)和擴(kuò)展系統(tǒng)?;鞠到y(tǒng)采用順序模式、霍夫曼編碼、輸入圖像精度8bit/像素/色;擴(kuò)展系統(tǒng)采用漸近模式、霍夫曼編碼,算術(shù)編碼,輸入圖像精度12bit/像素/色??臻g方式對(duì)于基本系統(tǒng)和擴(kuò)展系統(tǒng)來(lái)說(shuō),稱為功能獨(dú)立的,它采用序列模式、霍夫曼編碼、算術(shù)編碼,輸入圖像精度2~16Kb/s/像素/色。
JPEG的應(yīng)用面很寬,因此,對(duì)所需編碼圖像的性質(zhì),如大小、彩色、彩色分量的數(shù)量、編碼的方式等等,均不能預(yù)先規(guī)定。在具體應(yīng)用時(shí)需靠“通信”臨時(shí)傳遞。當(dāng)然,“通信”方式必須規(guī)定,不能有二義性。為了適應(yīng)各種不同的場(chǎng)合,JPEG提供了幾種編碼方法以供選用。量化表、碼表等也末加規(guī)定,僅提供推薦表。若效果不理想,用戶可自己定義量化表和碼表,并將這些表同數(shù)據(jù)一起傳到譯碼器,供正確譯碼使用。JPEG支持順序型和漸進(jìn)型兩種圖像建立模式,以滿足用戶對(duì)應(yīng)用的不同需求。JPEG壓縮算法分為兩大類:基于DPCM的無(wú)失真編碼系統(tǒng)和基于DCT的限失真編碼系統(tǒng)。使用無(wú)失真壓縮算法將信源圖像數(shù)據(jù)轉(zhuǎn)變?yōu)閴嚎s數(shù)據(jù),該壓縮數(shù)據(jù)經(jīng)對(duì)應(yīng)的解壓縮算法處理后可獲得與源圖像完全一致的重建圖像。有失真壓縮算法基于離散余弦變換,所生成的壓縮圖像數(shù)據(jù)經(jīng)解壓縮生成的重建圖像與源圖像在視覺(jué)上保持一致。一般來(lái)說(shuō),壓縮比越大,視覺(jué)上的一致性越差。1.JPEG工作模式
JPEG有四種工作模式:順序型編碼模式、漸進(jìn)型編碼模式、無(wú)失真編碼模式和分層編碼模式。
1)順序型編碼工作模式圖像的所有8像素×8像素的圖像子塊從左到右、從上到下依次輸入。圖像子塊經(jīng)DCT變換后形成8×8DCT系數(shù)陣列,每一個(gè)系數(shù)陣列被量化后立即進(jìn)行熵編碼并作為壓縮圖像數(shù)據(jù)的一部分輸出,從而盡可能地降低了對(duì)系數(shù)存儲(chǔ)的要求。
2)漸進(jìn)型編碼工作模式所有8像素×8像素的圖像子塊仍然按照上述順序編碼,但對(duì)圖像需進(jìn)行多趟掃描。這通過(guò)在量化和熵編碼之間增加一個(gè)與圖像大小一樣的系數(shù)緩存來(lái)實(shí)現(xiàn)。當(dāng)一個(gè)8×8DCT系數(shù)陣列被量化后,它的系數(shù)存入該緩存。所有系數(shù)陣列均完成量化并存入緩存后,分幾次掃描來(lái)編碼,每次只對(duì)部分系數(shù)編碼。因此譯碼時(shí)輸出圖像也是分幾次完成的。掃描處理緩存中量化后的DCT系數(shù)方式有兩種。一種是頻譜選擇法;另一種是逐次逼近法。在頻譜選擇法中,每次掃描Z形序列中的指定段并進(jìn)行編碼,每一段位于8×8DCT系數(shù)陣列頻譜的高頻或低頻部分。在逐次逼近法中,每次掃描的系數(shù)的各個(gè)位不全部參與編碼,而是從高到低按指定的位數(shù)逐次編碼。兩種過(guò)程可以單獨(dú)使用,也可以靈活地組合使用。
3)無(wú)失真編碼工作模式這種編碼模式可以完全無(wú)失真地恢復(fù)原圖像。
4)分層編碼工作模式一幅圖像被編碼成一些幀的序列。這些幀給出參考重建分量以用作后繼幀的預(yù)測(cè)。對(duì)于給定分量,除了第一幀外,差分幀是對(duì)源分量和參考重建分量的差值進(jìn)行編碼的結(jié)果。差值的編碼可以使用基于DCT的處理,或使用無(wú)失真處理,或使用基于DCT的但最后對(duì)每一分量進(jìn)行無(wú)失真處理。分層編碼還提供了逐步變換到無(wú)失真階段的能力。可見(jiàn),JPEG提供了多種工具,以應(yīng)付各種應(yīng)用場(chǎng)合,這樣的通用系統(tǒng)成本較高。為此,將JPEG系統(tǒng)分成基本系統(tǒng)和擴(kuò)展系統(tǒng),基本系統(tǒng)由DCT的順序型工作模式及霍夫曼編碼組成,所有符合JPEG標(biāo)準(zhǔn)的設(shè)備必須具備基本系統(tǒng)。擴(kuò)展系統(tǒng)提供不同的選項(xiàng),即除基本系統(tǒng)外的其他編碼方式,如漸進(jìn)型編碼、算術(shù)編碼、無(wú)失真編碼、分層編碼等等。圖4―6基于DCT的編、譯碼器示意圖2.基本系統(tǒng)JPEG建議的基本系統(tǒng)框圖如圖4―6所示。首先將要壓縮的圖像分割成一定的8像素×8像素的圖像子塊,例如,對(duì)于576行×720列的CCIR601分辨率的彩色圖像,其亮度分量可分割成576/8×720/8=6480(個(gè))子塊,而兩個(gè)色差分量都可分割成兩組:576/8×360/8=3240(個(gè))子塊;再用FDCT將各子塊I變換為8×8的DCT系數(shù)陣列。然后,用一個(gè)8×8的量化值陣列對(duì)這些系數(shù)進(jìn)行量化。最后用熵編碼器將量化后的系數(shù)編碼成一串比特?cái)?shù)據(jù)流C。經(jīng)過(guò)傳輸或存儲(chǔ),比特?cái)?shù)據(jù)流C以C1表示,C1經(jīng)過(guò)熵譯碼器譯碼,重新生成一組量化了的DCT系數(shù),使用編碼時(shí)采用的量化值陣列對(duì)這些量化了的系數(shù)進(jìn)行反量化。最后利用IDCT將此8×8DCT系數(shù)陣列變換回空間域的8×8圖像子塊I1。一般來(lái)說(shuō),I與I1之間存在誤差,這個(gè)誤差是由量化、反量化過(guò)程引入的,熵編碼、譯碼過(guò)程沒(méi)有信息損失。在某些傳輸環(huán)境下,由于噪聲等因素的干擾會(huì)引起信道誤碼,即C不等于C1。為此,標(biāo)準(zhǔn)規(guī)定了某些方法,允許在比特?cái)?shù)據(jù)流C中添加額外的冗余度,即采用編碼糾錯(cuò)以便從某些誤碼中恢復(fù)C。3.擴(kuò)展系統(tǒng)在基本系統(tǒng)之上擴(kuò)充一些其他的編碼方法,以提高編碼效率且滿足不同的應(yīng)用需求。
1)漸進(jìn)型編碼工作模式漸進(jìn)型編碼工作模式把一幀分解成幾個(gè)掃描,第一次掃描傳輸全局信息,以后的各個(gè)掃描逐步補(bǔ)充細(xì)節(jié)信息,將所有的掃描結(jié)果合成,所得到的結(jié)果與順序型方法完全相同。漸進(jìn)型編碼工作模式是針對(duì)DCT而言的,它有兩種實(shí)現(xiàn)方法:逐次逼近法和頻譜選擇法。
2)分層編碼工作模式分層編碼工作模式將源圖像用不同的空間分辨率表示,每一種分辨率對(duì)應(yīng)一個(gè)掃描。其主要的編碼步驟可概括為,將原始圖像的空間分辨率按2的倍數(shù)降低;對(duì)已降低了分辨率的“小”圖像可采用基于DCT的順序方式、漸進(jìn)方式或無(wú)失真預(yù)測(cè)編碼中的任何一種方式進(jìn)行編碼;對(duì)壓縮數(shù)據(jù)譯碼,重建低分辨率圖像,使用插值濾波器對(duì)其內(nèi)插,恢復(fù)源圖像的水平和垂直分辨率;把相同分辨率的插值圖像作為原始圖像的預(yù)測(cè)值,對(duì)兩者的差值采用基于DCT的順序方式、漸進(jìn)方式或無(wú)失真預(yù)測(cè)編碼中的任何一種方式進(jìn)行編碼。4.6.6MPEG標(biāo)準(zhǔn)
1.MPEG-2標(biāo)準(zhǔn)
MPEG-2標(biāo)準(zhǔn)可理解為在MPEG-1基礎(chǔ)上的進(jìn)一步擴(kuò)展和改進(jìn):(1)針對(duì)隔行掃描的常規(guī)電視圖像專門(mén)設(shè)置了“按幀編碼”和“按場(chǎng)編碼”兩種模式,并相應(yīng)地對(duì)運(yùn)動(dòng)補(bǔ)償作了擴(kuò)展。(2)為了適應(yīng)不同應(yīng)用的要求并保證數(shù)據(jù)的可交換性,MPEG-2定義了不同的功能集合和參數(shù)集合。(3)支持可延展性(Scalability),目前定義了空間延展性、信噪比延展性、數(shù)據(jù)分割、時(shí)間域延展性四種延展性。(4)亮度分量和色度分量的比例分別從原來(lái)的4∶1∶1擴(kuò)展為4∶2∶2或4∶4∶4。宏塊相應(yīng)擴(kuò)展,每像素8bit增至10bit。(5)系統(tǒng)層語(yǔ)法有較大擴(kuò)展。目前,MPEG-2已經(jīng)為世界所承認(rèn),是聲音和圖像信號(hào)數(shù)字化的基礎(chǔ)標(biāo)準(zhǔn),將廣泛用于數(shù)字電視(包括HDTV)、數(shù)字音頻廣播、數(shù)字視頻與音頻信號(hào)的傳輸,以及未來(lái)的多媒體領(lǐng)域等。MPEG-2系統(tǒng)部分涉及如何將一個(gè)或多個(gè)圖像、聲音及其他數(shù)據(jù)的基本碼流組合成單個(gè)碼流使之便于存儲(chǔ)和傳輸。它包括五種基本功能,分別為碼流譯碼時(shí)的同步、多個(gè)壓縮碼流譯碼時(shí)的交織、開(kāi)始譯碼的緩沖設(shè)置、緩沖器的連續(xù)控制和時(shí)間識(shí)別。系統(tǒng)規(guī)定編碼為節(jié)目碼流和傳送碼流兩種方式,它們各自為不同的應(yīng)用而最佳化,即其標(biāo)準(zhǔn)所定的編碼句法都是為實(shí)現(xiàn)圖像和聲音信息的同步譯碼和顯示所必需和充分的,并保證譯碼器中已編碼數(shù)據(jù)緩沖器不會(huì)上溢和下溢。在這些信息的編碼中采用了有關(guān)已編碼聲音和圖像數(shù)據(jù)的譯碼和顯示的時(shí)間標(biāo)記以及有關(guān)數(shù)據(jù)流本身的傳送的時(shí)間標(biāo)記。兩種碼流都采用打包多工方式。一個(gè)視頻和一個(gè)音頻基本碼流的基本多工方式如圖4―7所示。壓縮后的基本碼流與系統(tǒng)的信息一起組合、打包,產(chǎn)生打包基本碼流。然后這些碼流又組合形成節(jié)目碼流和傳送碼流。系統(tǒng)標(biāo)準(zhǔn)包括了圖4―7中垂直線的右邊各部分。圖4―7MPEG-2系統(tǒng)框圖節(jié)目碼流類似于MPEG-1的系統(tǒng)多工方式。它由有共同時(shí)間基準(zhǔn)的一個(gè)或多個(gè)PES組合而成,也可由多個(gè)有共同時(shí)間基準(zhǔn)的音頻和視頻基本碼流編碼成多節(jié)目碼流。如同單一節(jié)目碼流一樣,所有的基本碼流都能在同步情況下譯碼。節(jié)目碼流用于相對(duì)無(wú)誤碼的環(huán)境中,適合支持節(jié)目信息的軟件處理以及適用于CD―ROM上的多媒體應(yīng)用。節(jié)目碼流包是可變長(zhǎng)的,相對(duì)較長(zhǎng)。傳送碼流是由帶一個(gè)或多個(gè)獨(dú)立時(shí)間基準(zhǔn)的一個(gè)或多個(gè)節(jié)目碼流組合而成的碼流。傳送碼流用于有誤碼的環(huán)境,例如在有損耗或噪聲的媒體中存儲(chǔ)或傳輸。傳送碼流包的長(zhǎng)度是固定的,為188B。對(duì)傳送碼流可以進(jìn)行以下操作:恢復(fù)傳送碼流中一個(gè)節(jié)目的編碼數(shù)據(jù),并譯碼;把含有多個(gè)節(jié)目的傳送碼流轉(zhuǎn)換成一個(gè)含有單一節(jié)目的傳送碼流;把多節(jié)目傳送碼流先分工,然后轉(zhuǎn)換成節(jié)目碼流;由一個(gè)或多個(gè)傳送碼流取出一個(gè)或多個(gè)節(jié)目的傳送包,并在輸出端產(chǎn)生不同的傳送碼流;把一個(gè)節(jié)目碼流轉(zhuǎn)換成傳送碼流,使其能夠通過(guò)有損耗的環(huán)境,然后將其恢復(fù)成原來(lái)的節(jié)目碼流。MPEG-2標(biāo)準(zhǔn)化的主要特點(diǎn)是各種數(shù)字視頻和音頻之間的相互作用和可交換性,即作為通用標(biāo)準(zhǔn)的MPEG-2適用于較廣泛的應(yīng)用場(chǎng)合,并且也為比特流交換、兼容性等提供了可能性。MPEG-2標(biāo)準(zhǔn)可以應(yīng)用于(但不限于)以下領(lǐng)域:(1)BSS——衛(wèi)星廣播業(yè)務(wù)至家庭;(2)CATV——在光纖或同軸電纜等網(wǎng)絡(luò)上傳播的有線電視;(3)CDAD——有線數(shù)字音頻傳播;(4)DAB——數(shù)字音頻廣播;(5)DTTB——數(shù)字地面電視廣播;(6)EC——電子電影;(7)ENG——電子新聞收集(包括衛(wèi)星新聞收集);(8)FSS——衛(wèi)星固定業(yè)務(wù);(9)HTT——家庭影院;(10)IPC——個(gè)人間通信;(11)ISM——交互存儲(chǔ)媒體(光盤(pán)等);(12)MM——多媒體郵遞;(13)NCA——新聞和時(shí)事;(14)NDS——網(wǎng)絡(luò)數(shù)據(jù)庫(kù)服務(wù)(通過(guò)ATM通信(會(huì)議電視、可視電話等));(15)RVS——遙控圖像監(jiān)視;(16)SSM——匹配存儲(chǔ)媒體(數(shù)字VTR等)。在MPEG-1基礎(chǔ)上,MPEG-2所作的一個(gè)基本擴(kuò)充就是適合“真正”的視頻應(yīng)用。考慮到視頻信號(hào)隔行掃描特性,MPEC-2標(biāo)準(zhǔn)專門(mén)設(shè)置了“按幀編碼”和“按場(chǎng)編碼”兩種模式,并相應(yīng)地對(duì)運(yùn)動(dòng)補(bǔ)償和DCT方式作了擴(kuò)展,從而顯著提高了編碼效率。MPEG-2所作的另外一個(gè)最重要的擴(kuò)充就是引入了“可分級(jí)性”概念,實(shí)現(xiàn)了分級(jí)視頻壓縮編碼??煞旨?jí)性以空間域、時(shí)間域以及信噪比可分級(jí)為基礎(chǔ),例如在電視傳輸系統(tǒng)中利用分級(jí)視頻編碼技術(shù),可實(shí)現(xiàn)所謂的“逐漸降質(zhì)”。此外,分級(jí)視頻編碼還可實(shí)現(xiàn)對(duì)較低清晰度圖像的向下兼容。在所謂的信息技術(shù)領(lǐng)域(通過(guò)寬帶網(wǎng)絡(luò)傳輸視頻)和多媒體應(yīng)用中,分級(jí)視頻編碼也能起重要作用。為了使MPEG-2標(biāo)準(zhǔn)能通用于上述領(lǐng)域,同時(shí)使最大可交換性和相互作用成為可能,并且在簡(jiǎn)單應(yīng)用中費(fèi)用不是很高,MPEG-2標(biāo)準(zhǔn)引入了“檔次/等級(jí)”結(jié)構(gòu),巧妙地解決了這一問(wèn)題。作為一種“通用”標(biāo)準(zhǔn),MPEG-2支持多種應(yīng)用,因此MPEG-2在MPEG-1的基礎(chǔ)上作了許多重要擴(kuò)展和改進(jìn)。在視頻方面這些擴(kuò)展和改進(jìn)包括以下幾個(gè)方面:考慮到標(biāo)準(zhǔn)的通用性,擴(kuò)大了重要的參數(shù)值,允許有更多的圖像格式、更大的比特率和運(yùn)動(dòng)矢量長(zhǎng)度,還可以在壓縮數(shù)據(jù)流中插入用于譯碼和顯示的預(yù)設(shè)最佳參數(shù);針對(duì)視頻信號(hào)隔行掃描的特點(diǎn),增加了“按場(chǎng)編碼”模式,同時(shí)在“按幀編碼”模式中,允許進(jìn)行以場(chǎng)為基礎(chǔ)的運(yùn)動(dòng)補(bǔ)償和DCT,從而顯著提高了壓縮編碼效率;增加了“可分級(jí)性”,允許通
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 酒店建設(shè)項(xiàng)目招投標(biāo)合同模板
- 電車彩繪施工合同
- 水利工程設(shè)施管理規(guī)范
- 電力行業(yè)會(huì)計(jì)操作指南
- 勞務(wù)派遣合同書(shū)范本
- 財(cái)務(wù)信息系統(tǒng)用戶權(quán)限管理辦法
- 辦公樓煙道系統(tǒng)安裝合同
- 學(xué)校排水管道鋪設(shè)合同
- 美容院建設(shè)簡(jiǎn)易施工合同
- 醫(yī)療機(jī)構(gòu)藥品供應(yīng)合同模板
- 2024年全國(guó)社會(huì)保障基金理事會(huì)招聘18人歷年(高頻重點(diǎn)復(fù)習(xí)提升訓(xùn)練)共500題附帶答案詳解
- 《建筑外墻外保溫系統(tǒng)修繕標(biāo)準(zhǔn) JGJ376-2015》
- 水利水電工程單元工程施工質(zhì)量驗(yàn)收評(píng)定表及填表說(shuō)明
- 2024年全國(guó)初中數(shù)學(xué)競(jìng)賽試題含答案
- 殘疾兒童送教上門(mén)教案
- 醫(yī)療器械(耗材)項(xiàng)目投標(biāo)服務(wù)投標(biāo)方案(技術(shù)方案)
- (完整版)鏈傳動(dòng)習(xí)題
- 2024年江蘇省港口集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 中國(guó)共產(chǎn)主義青年團(tuán)團(tuán)員發(fā)展過(guò)程紀(jì)實(shí)簿
- 出國(guó)留學(xué)高中成績(jī)單最強(qiáng)模板
- 信用管理師(三級(jí))理論考試題庫(kù)(300題)
評(píng)論
0/150
提交評(píng)論