《多媒體技術(shù)》講稿第4章-3-2003_第1頁
《多媒體技術(shù)》講稿第4章-3-2003_第2頁
《多媒體技術(shù)》講稿第4章-3-2003_第3頁
《多媒體技術(shù)》講稿第4章-3-2003_第4頁
《多媒體技術(shù)》講稿第4章-3-2003_第5頁
已閱讀5頁,還剩106頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章---第三部分?jǐn)?shù)據(jù)壓縮標(biāo)準(zhǔn)第4章要點(diǎn)

5.數(shù)據(jù)壓縮的標(biāo)準(zhǔn)

數(shù)據(jù)壓縮標(biāo)準(zhǔn)

<1>衡量壓縮效果的技術(shù)指標(biāo)

<2>幾種典型的音頻壓縮標(biāo)準(zhǔn)

<3>幾種典型的圖像壓縮標(biāo)準(zhǔn)

《返回》數(shù)據(jù)壓縮效果的技術(shù)指標(biāo)一般,人們總是希望壓縮倍數(shù)高,壓縮速度快,并且希望壓縮所需資源、時(shí)間對用戶來講是透明的。但同時(shí)希望確保壓縮的精度。但追求壓縮比率和追求精度往往是矛盾的。從應(yīng)用的角度看,主要的障礙是實(shí)現(xiàn)成本問題。越好的算法,計(jì)算復(fù)雜性越高,實(shí)現(xiàn)成本就越高。數(shù)據(jù)壓縮技術(shù),大致有如下幾項(xiàng)指標(biāo):

(1)壓縮比(數(shù)據(jù)量?。?)壓縮、解壓算法簡單(3)恢復(fù)效果好(4)評價(jià)方法

《返回》第4章要點(diǎn)

5.數(shù)據(jù)壓縮的標(biāo)準(zhǔn)

<1>衡量數(shù)據(jù)壓縮效果好壞的技術(shù)指標(biāo)

①壓縮比:在保證不失真或允許一定失真的前提下,壓縮前后所需的信息存儲(chǔ)量之比。下面給出兩種定義:定義1:即編碼效率:

η=H/R也用數(shù)據(jù)壓縮前后比特?cái)?shù)之比。通常寫成x:1。

第4章要點(diǎn)

5.數(shù)據(jù)壓縮的標(biāo)準(zhǔn)

<1>技術(shù)指標(biāo)定義2:

該式可用來衡量被壓縮的數(shù)據(jù)在原數(shù)據(jù)中所占的比重。當(dāng)沒有引起失真時(shí),表明已消除了多少冗余量。通常寫成x%。

②壓縮、解壓算法簡單:做到壓縮、解壓速度快,實(shí)現(xiàn)壓縮的軟硬件開銷小,盡量滿足實(shí)時(shí)壓縮和解壓需求。

③恢復(fù)效果好:根據(jù)壓縮對象的不同特點(diǎn),保證不失真或允許一定失真情況下,恢復(fù)原始數(shù)據(jù)。

《返回》

評價(jià)方法(4)評價(jià)方法主觀評價(jià)法:圖像、聲音媒體質(zhì)量的評價(jià)方法被稱為平均主觀打分(MOS)方法。

如下表所示??陀^評價(jià)法:信噪比SNR=10lg(δ2/MSE)

均方誤差法,

MSE=1/N2

(xi-xi’)2

《返回》圖像、聲音媒體質(zhì)量的評價(jià)方法返回5.數(shù)據(jù)壓縮的標(biāo)準(zhǔn)

<2>幾種典型的音頻壓縮標(biāo)準(zhǔn)

①聲音壓縮標(biāo)準(zhǔn)按質(zhì)量,音頻信號(hào)可分為電話質(zhì)量的語音、調(diào)幅廣播質(zhì)量的音頻信號(hào)和高保真立體聲信號(hào)。三種音質(zhì)壓縮標(biāo)準(zhǔn)對比。如下表所示。三種音質(zhì)的壓縮標(biāo)準(zhǔn)表頻率范圍

抽樣頻率

量化位數(shù)信號(hào)速率

電話質(zhì)量的語音

200Hz~3.4KHz

8KHz

8比特

64Kbps

調(diào)幅廣播質(zhì)量的音頻

50Hz~7KHz

16KHz

14比特

224Kbps

高保真立體聲音頻(調(diào)頻廣播)

20Hz~20KHz(20Hz

~15KHz)44.1KHz

16比特

單聲道705Kbps

名稱對比項(xiàng)根據(jù)音頻信號(hào)是否損失劃分,分為無損壓縮和有損壓縮。無損壓縮法包括不引入任何數(shù)據(jù)失真的各種熵編碼;有損壓縮法又可分為波形編碼、參數(shù)編碼和同時(shí)利用這兩種技術(shù)的混合編碼方法。波形編碼(預(yù)測編碼)參數(shù)編碼混合編碼音頻壓縮標(biāo)準(zhǔn)如下表所示。

《返回》音頻編碼算法和國際標(biāo)準(zhǔn)返回幾種典型的音頻壓縮標(biāo)準(zhǔn)G.711PCM,采樣8KHz,->64KbpsG.721ADPCM,64kbps->32kbpdG.722高質(zhì)量,SB-ADPCM,量化比特14bitG.728參數(shù)編碼,矢量量化G.729低碼率的音頻壓縮標(biāo)準(zhǔn)->8kbpsG.723.1->5.3kbps,6.3kbps,用在電話網(wǎng)、移動(dòng)網(wǎng)、Intenet的語音通信MPEG1AC-3用于音響,HDTV.對6個(gè)聲道壓縮->320kbps。采樣48KHz《返回》幾種典型的圖像壓縮標(biāo)準(zhǔn)幾種典型的圖像壓縮標(biāo)準(zhǔn)(1)JPEG靜態(tài)圖像壓縮標(biāo)準(zhǔn)(2)JBIG標(biāo)準(zhǔn)(二值圖像標(biāo)準(zhǔn))(3)MPEG動(dòng)態(tài)圖像壓縮標(biāo)準(zhǔn)(4)P×64標(biāo)準(zhǔn)的視頻編碼標(biāo)準(zhǔn)

(5)AVS標(biāo)準(zhǔn)

《返回》第4章要點(diǎn)

5.數(shù)據(jù)壓縮的標(biāo)準(zhǔn)

<3>幾種典型圖像的壓縮標(biāo)準(zhǔn)

①JPEG靜態(tài)圖像壓縮標(biāo)準(zhǔn)(JointPictureExpertsGroup--聯(lián)合圖象專家組)

A.JPEG圖像壓縮的四種工作模式:

a.基于DPCM的無失真壓縮:從左到右、從上到下掃描信號(hào),為每個(gè)圖像元素編碼。DPCM,Huffman,無量化。

b.基于DCT順序工作方式:對變換時(shí)間長的掃描器,以復(fù)合掃描順序進(jìn)行圖像編碼。

c.累進(jìn)工作方式:保證準(zhǔn)確恢復(fù)圖像所有樣本值的圖像編碼。由粗到細(xì),多次掃描,先傳低頻,再傳高頻分量(細(xì)節(jié))。

d.分層工作方式:以多種分辨率進(jìn)行圖像編碼,可直接獲得低分辨率圖像,重建復(fù)原全圖。

JPEG標(biāo)準(zhǔn)B.兩種基本壓縮算法(混合)1?;贒PCM的無失真算法(無量化器)圖2?;贒CT的有失真算法下面介紹JPEG標(biāo)準(zhǔn)的基于DCT的有失真算法壓縮原理:JPEG算法基本步驟:

JPEG算法操作可分成以下三個(gè)步驟:通過離散余弦變換(DCT)去除數(shù)據(jù)冗余;使用量化表對以DCT系數(shù)進(jìn)行量化;對量化后的DCT系數(shù)進(jìn)行編碼使其熵達(dá)到最小。

基于離散余弦變換(DCT)的有失真壓縮編碼的編碼過程如下圖所示JPEG標(biāo)準(zhǔn)算法框圖JPEG標(biāo)準(zhǔn)A.離散余弦變換

JPEG采用8×8子塊的二維離散余弦變換算法。1)DCT的實(shí)質(zhì)與特點(diǎn):①利用正交變換實(shí)現(xiàn)圖象數(shù)據(jù)壓縮的實(shí)質(zhì),是通過圖象取樣信息從空間域轉(zhuǎn)到變換域,其能量集中,保持且近似于不相關(guān),從而保留能量集中部分即可使頻帶壓縮。②DCT的均方誤差編碼性能在理論上最接近于在馬爾科夫模型假定下的最佳統(tǒng)計(jì)匹配正交變換(KLT)。③DCT可用快速算法來實(shí)現(xiàn)?;贒CT的JPEG算法——

離散余弦變換示意圖8×8的子圖像塊的變換示意圖JPEG標(biāo)準(zhǔn)2)DCT過程(DiscreteCosineTransform)對于8×8的FDCT和IDCT數(shù)學(xué)表達(dá)式正交換(正偶數(shù)余弦變換的的歸一化形式)上式表明將圖象f從空間域(xy平面)轉(zhuǎn)換到變換域(uv平面)逆變換圖象譜F從變換域(u,v平面)轉(zhuǎn)換到空間域(x.y平面)。其中:二維DCT可分成行向一維DCT和列向一維DCT組合運(yùn)算,二維快速DCT是把8×8塊不斷分成更小的無交疊子塊,直接對數(shù)據(jù)塊進(jìn)行運(yùn)算操作?;贒CT的JPEG算法——

DCT的可分離性圖示JPEG標(biāo)準(zhǔn)FDCT輸出64個(gè)基信號(hào)的幅值稱作“DCT系數(shù)”,即DCT變換系數(shù)值。64個(gè)變換系數(shù)中包括一個(gè)代表直流分量的“DC系數(shù)”和63個(gè)代表交流分量的“AC”系數(shù)。IDCT是FDCT的逆過程,它把64個(gè)DCT變換系數(shù)經(jīng)逆變換運(yùn)算,重建一個(gè)64點(diǎn)的輸出圖象。在所用設(shè)備的計(jì)算精足夠高的前提下,且系數(shù)未經(jīng)過量化,原始的64點(diǎn)信號(hào)就能夠精確地恢復(fù)。3)量化基于DCT編、解碼框圖為了壓縮數(shù)據(jù),對DCT系數(shù)要作量化處理,量化的作用是在保持一定質(zhì)量前提下,丟棄圖像中對視覺效果影響不入的信息。量化處理是一個(gè)多到1的映射,是造成DCT編解碼信息丟失的根源之一。

JPEG中采用線性非均勻量化器,量化定義為對64個(gè)DCT系數(shù)除以量化步長,四舍五入取整.JPEG標(biāo)準(zhǔn)量化表的尺寸與64個(gè)變換系數(shù)一一對應(yīng)(64個(gè)),量化表元素隨DCT系數(shù)的位置和彩色分量的不同有不同值。它可由用戶規(guī)定(JPEG給出參考值),并作為編碼器的一個(gè)輸入。量化表中每個(gè)元素值為1到255間任意整數(shù),其值規(guī)定了它所對應(yīng)的DCT系數(shù)的量化器步長。JPEG標(biāo)準(zhǔn)量化的作用是在一定的主觀保真度圖象質(zhì)量前提下,丟掉那些對視覺影響不大的信息,不同頻率的余弦函數(shù)對視覺影響不同,可以根據(jù)不同頻率的視覺閾值來選擇量化表中的元素值的大小。這樣通過心理視覺實(shí)驗(yàn),去確定對應(yīng)于不同頻率的視覺閾值,以確定不同頻率的量化器步長。JPEG標(biāo)準(zhǔn)JPEG給出量化特性表(示范),根據(jù)心理視覺加數(shù)函數(shù)而得到亮度分量量化矩陣。同時(shí)還給出根據(jù)心理視覺加權(quán)函數(shù)而得出的色度分量量化矩陣。這是JPEG給出的參考值?;贒CT的JPEG算法——

亮度量化表和色度量化表亮度分量量化矩陣、色度分量量化矩陣(JPEG中給出的參考值)

低頻分量部分,量化步距較小JPEG標(biāo)準(zhǔn)4)系數(shù)編碼

64個(gè)變換系數(shù)經(jīng)量化后,坐標(biāo)U:V=0的DC系數(shù)是直流分量,即64個(gè)空域圖象采樣值的平均值。相鄰塊(8×8)之間的DC系數(shù)相關(guān)性強(qiáng),JPEG對DC系數(shù)采用DPCM(差分編碼)方法,即DIFF=DCJ-DCj-1。即對相鄰像素塊之間的L系數(shù)的差值進(jìn)行編碼?;贒CT的JPEG算法——

對DC系數(shù)的編碼根據(jù)DC系數(shù)的特點(diǎn),JPEG算法使用了差分脈沖調(diào)制編碼(DPCM)技術(shù),即對相鄰塊之間的DC系數(shù)的差值:DIFF=DCi-DCi-1進(jìn)行編碼。JPEG標(biāo)準(zhǔn)其余63個(gè)交流系數(shù)(AC系數(shù))采用行程編碼從左上方Aco1開始,沿對角線方向,以“Z”字形(Zig-Zag)行程掃描,直至AC77掃描結(jié)束。量化后的AC系數(shù)通常會(huì)有許多零值,以“Z”字形路經(jīng)進(jìn)行行程編碼,可增加行程中連續(xù)零的個(gè)數(shù),63個(gè)AC系數(shù)行程編碼的碼字甚至可用兩個(gè)字節(jié)表示.基于DCT的JPEG算法——

Z字形編排

基于DCT的JPEG算法——

對量化AC系數(shù)的Z字形編排編排的方法是按照Z字形的式樣編排。這樣就把一個(gè)8×8的矩陣變成一個(gè)1×64的矢量,頻率較低的系數(shù)放在矢量的頂部。JPEG標(biāo)準(zhǔn)5)熵編碼為了進(jìn)一步壓縮數(shù)據(jù),可對DC和AC行程編碼的碼字再作基于統(tǒng)計(jì)特性的熵編碼,JPEG建議用哈夫曼(Huffman)或自適應(yīng)二進(jìn)制算術(shù)編碼。熵編碼步驟:①熵編碼中的中間格式表示②可變長度熵編碼基于DCT的JPEG算法——

熵編碼的步驟

熵編碼可分成兩步進(jìn)行,首先把DC碼和行程碼字轉(zhuǎn)換成中間符號(hào)序列;然后給這些符號(hào)賦以變長碼字?;贒CT的JPEG算法——

熵編碼的中間格式表示熵編碼的中間格式由兩個(gè)符號(hào)組成:符號(hào)1(行程,尺寸)符號(hào)2(幅值)符號(hào)1的高4位表示前后兩個(gè)非零AC系數(shù)之間連續(xù)“0”的個(gè)數(shù);符號(hào)1的低4位表示對后續(xù)非零系數(shù)進(jìn)行編碼所需要的比特?cái)?shù)。符號(hào)2表示后續(xù)非零系數(shù)的實(shí)際值?;贒CT的JPEG算法——

對符號(hào)1的進(jìn)行哈夫曼編碼對DC系數(shù)和AC系數(shù)中的符號(hào)1采用哈夫曼表中的變長碼(VLC)編碼。哈夫曼變長碼表必須作為JPEG編碼器的輸入。需要注意的是在數(shù)據(jù)流中哈夫曼表的表示格式是一個(gè)間接的說明,在解碼時(shí),解碼器利用這一間接說明重構(gòu)真正的哈夫曼表?;贒CT的JPEG算法——

對符號(hào)2做可變長度熵編碼符號(hào)2用變長整數(shù)(簡稱VLI)碼編碼。VLI是變長碼但不是哈夫曼碼;VLI的碼字是被固化在JPEG建議中,供計(jì)算用;JPEG解碼器能夠同時(shí)存儲(chǔ)最多4套不同的熵編碼表。JPEG標(biāo)準(zhǔn)6)累進(jìn)操作方式編碼上述的是DCT順序操作方式。累進(jìn)操作方式對每個(gè)圖象分量的編碼要經(jīng)過多次掃描未完成,第一次進(jìn)行1次粗糙的壓縮,以便很快地傳輸粗糙圖象,用它來重建一幅度量較低的可識(shí)別圖象;第2次掃描作較細(xì)的壓縮,只傳送增加的信息,可重建一幅質(zhì)量提高了一些的圖象。不斷累進(jìn),直到達(dá)到較滿意的圖象質(zhì)量為止。JPEG標(biāo)準(zhǔn)增加一個(gè)足以存儲(chǔ)量化DCT系數(shù)的緩沖區(qū),對它們在多次掃描中分批進(jìn)行編碼。有兩種累進(jìn)方式:①頻譜選擇法②按位逼近法JPEG標(biāo)準(zhǔn)7)基于DCT的分層操作方式將原始圖象分成多個(gè)分辨率進(jìn)行“錐形”(塔形)編碼方法。水平方向和垂直方向分辨率的下降以2的倍數(shù)因子改變。編碼過程為:①把原始圖象空間分辨率降低。②對"小尺寸"圖采用基于DCT的順序方式,累進(jìn)方式或無失真予測編碼中位一種編碼方法進(jìn)行編碼。③對低分辨率的圖象解碼,重建圖象,使用插值濾波器,對它插值,恢復(fù)圖象的水平和垂直分辨率。④把分辨率已提高的圖象作為原始圖象的預(yù)測值,對它們的差值采用基于DCT的順序方式,或累進(jìn)方式,或無失真方式編碼。⑤重復(fù)③、④直到圖象達(dá)到完整的分辨率編碼。壓縮比與恢復(fù)圖像質(zhì)量的關(guān)系返回針對基于DCT的JPEG壓縮算法,在原始圖像每像素采用8比特編碼條件下,定量描述壓縮比與恢復(fù)圖像質(zhì)量的關(guān)系,如下表所示。第4章要點(diǎn)

5.數(shù)據(jù)壓縮的標(biāo)準(zhǔn)

JPEG2000小波MotionJPEG只進(jìn)行幀內(nèi)編碼

《返回》第4章要點(diǎn)

5.數(shù)據(jù)壓縮的標(biāo)準(zhǔn)

②JBIG標(biāo)準(zhǔn)(JointBilevelImageGroup)

采用無損壓縮技術(shù)。適合于在分組網(wǎng)中傳輸高分辨率的二值圖像(1728×2376或2304×2896),可應(yīng)用于灰度或彩色圖像。有較高壓縮比(10:1)。而傳真標(biāo)準(zhǔn)G3、G4為2:1~4:1。

《返回》③MPEG動(dòng)態(tài)圖像壓縮標(biāo)準(zhǔn)(MotionPictureExpertsGroup)——MPEG-1、2、4、7

MPEG-1是一個(gè)面向家庭電視質(zhì)量級(jí)的視頻、音頻壓縮標(biāo)準(zhǔn);如VCD。

MPEG-2是面向演播級(jí)的視頻、音頻壓縮標(biāo)準(zhǔn)。該類數(shù)據(jù)要求的清晰度較高。如DVD、HDTV。

MPEG-4是基于內(nèi)容的數(shù)據(jù)壓縮標(biāo)準(zhǔn)。

MPEG-7是基于內(nèi)容的描述語言和格式的標(biāo)準(zhǔn)。

《返回》MPEG運(yùn)動(dòng)圖像編解碼標(biāo)準(zhǔn)標(biāo)準(zhǔn)的內(nèi)涵

MPEG的國際標(biāo)準(zhǔn)分為三個(gè)部分,即Systems,Video,audio。①Systems將分別的audio與Video合成為單一數(shù)據(jù)流。②Video和Audio的技術(shù)指標(biāo)給出了兩者編碼位流的句法與語義。MPEG流

①M(fèi)PEG1流結(jié)構(gòu)

MPEG1的流具有兩層:

System層包含定時(shí)與其它信息,去解復(fù)用audio和Video流,并在回放時(shí)同步audio與Video。

壓縮層包括壓縮audio和Video流。下圖表示了MPEG1的解碼系統(tǒng),系統(tǒng)解復(fù)用抽取定時(shí)信息,并傳到系統(tǒng)的有關(guān)單元去。系統(tǒng)層支持以下五個(gè)基本功能:1)解碼時(shí)多條壓縮流的同步;2)多條壓縮流交織為一個(gè)單一流;3)為啟動(dòng)解碼而對緩沖區(qū)進(jìn)行初始化;4)連續(xù)的緩沖區(qū)管理;5)時(shí)間標(biāo)識(shí)。系統(tǒng)還解復(fù)用video與andio流并傳到相應(yīng)的解碼器去。

Video解碼器解壓縮的視頻流在MPEG標(biāo)準(zhǔn)的PartI中描述。C-Cube公司目前有CL450,CL480/484和CL9100等解碼器。②MPEG-2流結(jié)構(gòu)

MPEG-2定義了兩類系統(tǒng)流:Program(節(jié)目流)和transport(傳輸流)。兩者的復(fù)用流組成了Video與audio的基本的流,兩者均被分別捆包傳送。一個(gè)MPEG多路復(fù)用比特流可以是傳輸流(TS)或節(jié)目流(PS)。兩種流均由PES分組包或包含其他必要信息的分組構(gòu)成。兩種流類型均支持來自具有一個(gè)共同時(shí)間基準(zhǔn)節(jié)目的視頻和音頻壓縮流的復(fù)用。傳輸流TS還支持來自具有獨(dú)立時(shí)間基準(zhǔn)的多個(gè)節(jié)目的視頻和音頻壓縮流的復(fù)用。對于幾乎不發(fā)生差錯(cuò)的環(huán)境而言,節(jié)目流通常更為合適,并且支持節(jié)目信息的軟件處理。傳輸流更適合于可能出錯(cuò)的環(huán)境。一個(gè)傳輸流包括一或多個(gè)節(jié)目。視頻與音頻基本流由訪問單元組成。節(jié)目流編碼層允許將具有一個(gè)或多個(gè)基本流的一個(gè)節(jié)目組合成一個(gè)單一流。來自于各基本流的數(shù)據(jù)與那些允許節(jié)目中的基本流同步播放的信息復(fù)用一起。一個(gè)節(jié)目流包含來自于一個(gè)節(jié)目的復(fù)用在一起的一個(gè)或多個(gè)基本流?;玖鲾?shù)據(jù)攜帶于PES分組包中,PES分組包由分組頭及其后的分組包數(shù)據(jù)組成。一個(gè)MPEG多路復(fù)用比特流,不論是傳輸流還是節(jié)目流,其結(jié)構(gòu)分兩層:最外層是系統(tǒng)層,最內(nèi)層是壓縮層。系統(tǒng)層提供了使用系統(tǒng)中一個(gè)或多個(gè)壓縮數(shù)據(jù)流所必需的功能。MPEG規(guī)范的音頻和視頻部分定義了音頻和視頻數(shù)據(jù)的壓縮編碼層,并被系統(tǒng)層支持。③

視頻流數(shù)據(jù)層次

MPEG-1與MPEG-2標(biāo)準(zhǔn)定義了視頻流數(shù)據(jù)結(jié)構(gòu)的層次如下圖所示。比特流的語法層及其功能其中包括:

VIDEOSequence它由一系列的頭,一個(gè)或多個(gè)圖片組,和一個(gè)序列結(jié)束碼組成,它是前面所定義的視頻數(shù)據(jù)流的另一個(gè)術(shù)語。

Groupofpictures它是一個(gè)或多個(gè)圖片系列。允許隨機(jī)訪問其序列。

Picture一個(gè)視頻序列的基本編碼單元,圖片由三個(gè)正交的本色組成,包括亮度Y,兩個(gè)色度CbCr的值,Slice一個(gè)或多個(gè)結(jié)構(gòu)宏塊、在Slice里宏塊的順序是從左到右,從上到下。在差錯(cuò)處理時(shí)Slice是很重要。如果位流有一個(gè)錯(cuò)誤、解碼器可以是下一個(gè)Slice的起點(diǎn),這有利于改善圖像質(zhì)量。Mocroblock一個(gè)16-pixelX16-line的亮度成分區(qū)和相應(yīng)的色度分量的8-pixelX8-line區(qū)。Block幀間圖像編碼(Inter-PictureCoding)①

圖片類型

MPEG標(biāo)準(zhǔn)專門定義3種圖片類型:intra,predicted和Bidirectional。Intra-Pictures即稱Ⅰ圖,編碼時(shí)僅使用本圖信息,Ⅰ圖提供所有可能的隨機(jī)訪問點(diǎn)進(jìn)入壓縮的視頻數(shù)據(jù),Ⅰ圖僅使用變換編碼,因此它提供適度的壓縮倍數(shù),典型的約每象素2位為宜。PredictedPictures稱為P圖,它被編碼時(shí)考慮最接近的前面的Ⅰ或P圖,這種技術(shù)稱之為朝前預(yù)測,如下圖BidirectionalPictures稱為B圖,它使用過去的或前面的圖為參考,這種技術(shù)稱為雙向預(yù)測,如下面圖所示,B類圖提供最大的壓縮并不會(huì)產(chǎn)生誤差,因?yàn)樗鼜牟挥脼閰⒖紙D,雙向預(yù)測還減少了噪聲的影響,由于它對兩幀起了平均作用。②

視頻流I.P.B典型布局MPEG算法允許編碼時(shí)選擇頻率并定位Ⅰ圖,這種選擇基于對隨機(jī)訪問性在應(yīng)用時(shí)的需要,并定位在視頻序列里場景的剪切。在應(yīng)用中隨機(jī)訪問是重要的,I圖典型地用于每秒兩次。編碼器還選擇任意一對(Ⅰ或P)圖片間的雙向圖片數(shù)、這一選擇是基于某種因素,比如在編碼器里的存儲(chǔ)量、以及被編碼對象的特性,對于大的一類場景,工作的參數(shù)必須有雙向圖片分別作為連續(xù)的參考圖。下圖表示一個(gè)典型的I、P和B圖的安排,按顯示順序布局。MPEG編碼器在視頻流里重排圖片順序,提交給解碼器,以最有效的序列方式來表示圖片。實(shí)際上,在組合B圖之前Ⅰ圖需要重構(gòu)B圖來傳送。下圖表示了C-Cube公司的編碼的例子③MotionCompensation運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)補(bǔ)償是用來消除時(shí)域冗余,增強(qiáng)P圖與B圖的壓縮效果的一種技術(shù).運(yùn)動(dòng)補(bǔ)償算法在宏塊內(nèi)進(jìn)行。當(dāng)一個(gè)宏塊由運(yùn)動(dòng)補(bǔ)償來壓縮時(shí),壓縮文件包含以下信息:

a)在基準(zhǔn)和被編碼的宏塊之間存在的空間差異。

b)在基準(zhǔn)和被編碼的宏塊之間存在的內(nèi)容差異。不是在圖片里的所有的信息都可以由前面的圖片來預(yù)測的。例如考慮一個(gè)場景打開一扇門:在門后房間里的細(xì)節(jié)是不可能由前面的幀來預(yù)測的,因?yàn)樵诖酥伴T是關(guān)著的。當(dāng)在某種情況下宏塊用P圖不能用運(yùn)動(dòng)補(bǔ)償來有效的表示。這時(shí)要用Ⅰ圖并使用變換編碼技術(shù)。B和P圖運(yùn)動(dòng)補(bǔ)償之間的差別在于:在P圖里宏塊僅使用前面的參考(I或P-圖),而在B圖里宏塊編碼使用過去的或?qū)淼膱D的任意結(jié)合。幀內(nèi)圖片(變換)編碼MPEG變換編碼算法包括下列步驟;a)離散余弦變換(DCT)b)量化Quantizationc)游程碼RLE編碼圖象塊與預(yù)測誤差塊有高的空域冗余度,為了減少冗余,MPEG算法用DCT變換8×8象元塊或8×8的誤差塊到頻域。下一步算法量化頻率系數(shù),量化是估計(jì)每個(gè)頻率系數(shù)為一個(gè)允許值的有限數(shù)之一的過程。編碼器選擇一個(gè)量化矩陣來決定如何量化8X8塊里的每個(gè)頻率系數(shù)。人類對于高頻的量化誤差感覺是低的,因此高頻比低頻量化得更粗糙些。DCT與量化的結(jié)合引起很多頻率系數(shù)為零,特別對高頻更是如此。為了發(fā)揮其長處,這些系數(shù)被組織為Z順序,用來產(chǎn)生較長的零過程。某些象素塊需要此其它的編碼更精確,例如,較平緩的密度梯度的塊需要精確編碼以避免可看到塊邊緣,為了處理塊之間的這種不均勻性,MPEG算法允許對每個(gè)16×16象元塊做一定的量化修正。這一機(jī)制還可被用來對特殊的位流提供平滑自適應(yīng)。同步MPEG標(biāo)準(zhǔn)提供時(shí)間同步機(jī)制去保證音頻與視頻的同步。MPEG-1標(biāo)準(zhǔn)定義兩個(gè)參數(shù)用來解碼:Systemclockreference(SCR)與Presentationtimestamp(PTS)。

MPER-2標(biāo)準(zhǔn)增加了programclockreference(PCR),同時(shí)也提供SCR與PCR去解決27MHz的擴(kuò)展問題。返回MPEG4—Codingofaudio&Visualobjects.1)基于內(nèi)容(Based-contents)的編碼。2)Integration:考慮單、立體與多通道的音頻,二維、三維單色、立體或多視點(diǎn)的視頻。3)flexibilityandextensibility.MPEG-4編碼器軟件模型框圖返回MPEG-7多媒體內(nèi)容描述接口,規(guī)定一套可用于描述各種多媒體信息的描述符的標(biāo)準(zhǔn),它與多媒體信息內(nèi)容一起,支持用戶對其感興趣的資源快速,有效撿索。應(yīng)用領(lǐng)域:

1)數(shù)字化圖書館(包括圖象分類圖象、音樂字典等)

2)多媒體目錄服務(wù)

3)廣播式媒體選擇(包括個(gè)人電子新聞服務(wù),媒體著作等)

4)旅游、文化、地理信息系統(tǒng)。返回第4章要點(diǎn)

5.數(shù)據(jù)壓縮的標(biāo)準(zhǔn)

④P×64標(biāo)準(zhǔn)的視頻編碼標(biāo)準(zhǔn)電話與會(huì)議電視業(yè)務(wù)的需要視聽業(yè)務(wù)視頻編解碼CODEC,H.261建議,俗稱p64Kbit/s(P=1~30).支持實(shí)時(shí)動(dòng)態(tài)圖像的壓縮編解碼。標(biāo)準(zhǔn)中P是一個(gè)可變參數(shù),取值為1~30。P=1或2時(shí),僅能支持桌面上的面對面直觀通信(即64Kbps或128Kbps);當(dāng)P≥6時(shí),支持通用中間格式每秒幀數(shù)較高活動(dòng)圖像的電視會(huì)議?!斗祷亍?/p>

H.261建議實(shí)際上是H.261標(biāo)準(zhǔn)CIF\QCIF;352*288幀間預(yù)測---DCT---Huffman、I幀/P幀;對稱數(shù)據(jù)流四個(gè)層次:塊層、宏塊層、塊組、圖象層為了適應(yīng)寬帶傳輸需要H.262建議(ISO/IEC13818標(biāo)準(zhǔn))發(fā)展新的預(yù)測法和變換編碼法H.263建議。H.261主要技術(shù)參數(shù)

1)傳輸速率視頻信號(hào)編碼傳輸速率為p64Kbit/s(P=1~30)

建議使用的視頻比特率介于40Kbit/s~2Mbit/s之間。2)圖像尺寸

H.261的圖像尺寸格式如下表(1)H.261建議的圖像尺寸為一幀電視信號(hào)就是一幅圖像、視頻編碼圖像格式可歸納如下表:視頻復(fù)用編碼器1)視頻復(fù)用按4層結(jié)構(gòu)如下圖像層組塊宏塊塊(1)幀圖像層(PICTURELAYER)

每幅圖像的數(shù)據(jù)由圖像頭構(gòu)成,GOB的數(shù)據(jù)緊隨其后,結(jié)構(gòu)如下圖,丟棄的圖像的圖像頭不發(fā)送。(2)塊組層GOB每一幅圖像都被劃分成若干塊組(GOB)。一個(gè)塊組由1/12個(gè)CIF或1/3個(gè)QCIF的圖像區(qū)組成如下圖。一個(gè)GOB由176個(gè)像素乘48行構(gòu)成。(3)宏塊層每個(gè)GOB被劃分成33個(gè)宏塊,如下圖,一個(gè)宏塊為16×16,而Cb,Cr為8×8。宏塊的數(shù)據(jù)由MB頭組成,其后是塊數(shù)據(jù),如下圖。MQUANT,MVD和CBP的存在與否由MYTPE指示。(4)塊層宏塊由4個(gè)亮度塊和2個(gè)色差塊組成如下圖,塊數(shù)據(jù)由變換系數(shù)碼字和跟隨其后的塊終止標(biāo)號(hào)組成。ITU-TH.263建議

H263是ITU-I標(biāo)準(zhǔn),于1995年公布,設(shè)計(jì)來為低比特率通信用,早先的草案指定數(shù)據(jù)率小于64Kbits/s,后來取消了這一限制,希望能適用于寬范圍的比特率,不僅僅是低比特率應(yīng)用,在許多應(yīng)用中H.263取代了H.261。

返回H.263低比特率標(biāo)準(zhǔn)30Kbps用于電信部門,電話線、Modem28.8kbps/33.6Kbps/56Kbps支持多種格式Sub-CIF\QCIF\CIF\4CIF\16CIF效率不高,仍會(huì)有馬賽克

H.263的編碼算法類似于H.261,但有某些改進(jìn)與變化,以利于提高性能和錯(cuò)誤恢復(fù)。H.261與H.263編碼算法的區(qū)別在于:半象素精度(Halfpixelprecision)用于運(yùn)動(dòng)補(bǔ)償,而H.261使用全象素精度和循環(huán)濾波。數(shù)據(jù)的層次結(jié)構(gòu)某些部分是供選擇的,所以Codec能被構(gòu)成為低數(shù)據(jù)率或較好的錯(cuò)誤恢復(fù)。有4種選擇的編碼方法用于改善性能H.263支持五種分辨率,它在H.261支持的QCIF和CIF的基礎(chǔ)上增加了SQCIF,4CIF,16CIF。SQCIF是QCIF的半精度,而4CIF與16CIF是CIF的4倍與16倍分辨率。H.324標(biāo)準(zhǔn)ITU從1993年開始著手制造一套新的多媒體通信技術(shù)標(biāo)準(zhǔn)。概括如下表:H.324多媒體系統(tǒng)總體結(jié)構(gòu)

(1)首要區(qū)別是增加了數(shù)據(jù)接口(2)它把數(shù)據(jù)調(diào)制解調(diào)器也包括了進(jìn)去。它的復(fù)接和解復(fù)接部分H.223比H.221復(fù)雜(H.221只是視頻和音信號(hào)的復(fù)接)。(3)音頻編解碼器G.723主要用來作為語音信號(hào)的壓縮和解壓縮。本來采用G.723代號(hào)但發(fā)現(xiàn)它已被采用為ADPCM標(biāo)準(zhǔn)。所以改為G.723.1。(4)標(biāo)準(zhǔn)的數(shù)據(jù)通信應(yīng)用包括了應(yīng)用于實(shí)時(shí)語音圖形會(huì)議的T.120,用于簡單的點(diǎn)對點(diǎn)靜止傳輸?shù)腡.84,用于簡單的點(diǎn)對點(diǎn)文件傳輸?shù)腡.434,用于遠(yuǎn)維離攝像機(jī)控制的H.224/H.281以及ISO/IECIR9577包括PPP和IP在內(nèi)的網(wǎng)絡(luò)協(xié)議,用戶數(shù)據(jù)緩存的V.14或LAPM/V.42也包括在內(nèi)。實(shí)測表明,當(dāng)用28.8kbpsMODEM連接時(shí),其電視畫面不夠連續(xù),只有在48kbps時(shí),才能得到滿意的圖象。AVS視頻標(biāo)準(zhǔn)AVS視頻標(biāo)準(zhǔn)AVS視頻標(biāo)準(zhǔn)的制定過程方案的討論與確定(02年8月到12月)兩種可能與H.264的基本層兼容完全獨(dú)立的方案技術(shù)的征集和評估(02年12月至今)AVS視頻標(biāo)準(zhǔn)熵編碼反量化反變換運(yùn)動(dòng)補(bǔ)償預(yù)測控制數(shù)據(jù)量化后的變換系數(shù)運(yùn)動(dòng)數(shù)據(jù)幀內(nèi)/幀間編碼控制解碼器運(yùn)動(dòng)估計(jì)變換/量化-0環(huán)濾波幀內(nèi)預(yù)測返回技術(shù)征集技術(shù)類型征集技術(shù)幀間和幀內(nèi)預(yù)測技術(shù)(Inter&IntraPrediction)BFrame(清華)Interlace(清華)Sub-pixelInterpolation(浙大)MVPrediction&Coding(北工大,北航)IntraPrediction(清華)SkipMode變換和量化(Transform&Quantization)WaveletTransform(Integer)(華工)DCT(計(jì)算所,北工大)變換系數(shù)掃描(CoefficientScan)AlternateScan(計(jì)算所)熵編碼器(EntropyCoding)VLC(華工,計(jì)算所,北航)CABAC濾波器(Filtering)In-loopdeblockingfilter(華工,浙大,自動(dòng)化所)文件格式(FileFormat)startcode(華為)High-levelsyntax(華為)AVS視

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論