視頻壓縮國際標準_第1頁
視頻壓縮國際標準_第2頁
視頻壓縮國際標準_第3頁
視頻壓縮國際標準_第4頁
視頻壓縮國際標準_第5頁
已閱讀5頁,還剩126頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

視頻壓縮國際標準第一頁,共一百三十一頁,編輯于2023年,星期一3.2H.26 x 標準

3.2.1H.261標準一.概述

1、1990年12月CCITT(國際電報電話咨詢委員會)(后改為IUT-國際電信聯(lián)盟)通過。2、為P×64kb/s視聽業(yè)務(wù)的視頻編碼器

P=1,2……30,又稱P×64標準3、應(yīng)用H.261為N-ISDN上開展可視通信業(yè)務(wù)而提出。

可視電話,會議電視。第二頁,共一百三十一頁,編輯于2023年,星期一二、圖像格式

1、CIF和QCIF格式

CIFCommonIntermediateFormat,通用中間格式

QCIFQuarterCIF

第三頁,共一百三十一頁,編輯于2023年,星期一2、主要參數(shù)

CIFQCIFY抽樣頻率6.75MHz3.375MHzCr,Cb抽樣頻率3.375MHz1.6875MHzY有效樣點/行352176Cr,Cb有效樣點/行17688Y有效行/幀288144Cr,Cb有效行/幀14472Y:亮度信號Cr:紅色差信號Cb:蘭色差信號由上表可見,QCIF是取CIF縱橫像素的各一半。第四頁,共一百三十一頁,編輯于2023年,星期一3、Y、C樣點位置

第五頁,共一百三十一頁,編輯于2023年,星期一4、幀結(jié)構(gòu)

(1)一幀CIF由12個組塊(GOB-GROUPOFBLOCK)

組成,(QCIF由3個組塊組成)

A.圖CIF

QCIFGOB1GOB2GOB3B.GOB編號:從左到右,從上到下第六頁,共一百三十一頁,編輯于2023年,星期一(2)每個塊組(GOB)由33個宏塊(MB-MACROBLOCK)組成

A.圖

B.MB編號:從左到右,到上到下C.MB是運動補償?shù)幕締卧?/p>

第七頁,共一百三十一頁,編輯于2023年,星期一(3)每個宏塊(MB)由6塊(B-BLOCK)組成。(其中:4個Y塊和2個色差塊——一個Cb,一個Cr組成)

A.圖

B.B編號如圖所示

C.B是DCT的基本單元,即基本編碼單元

D.每塊(B)由8×8像素組成,像素編號:從左到右,從上到下。4個Y塊和Cb,Cr對應(yīng)圖面上的同一區(qū)域。第八頁,共一百三十一頁,編輯于2023年,星期一三、數(shù)據(jù)結(jié)構(gòu)

1、分四層圖象層:PLayer(picturelayer)塊組層:GOBLayer

宏塊層:MBLayer

塊層:BLayer第九頁,共一百三十一頁,編輯于2023年,星期一

P圖像標題(幀頭)主要內(nèi)容:(1)幀開始碼,(2)幀計數(shù)碼,(3)幀類型碼,如CIF或QCIF等,(4)備用插入信息碼

GOB標題主要內(nèi)容:(1)塊組開始,(2)塊組編號,(3)塊組量化步長,(4)備份信息碼,

MB標題主要內(nèi)容:(1)地址碼,(2)類型碼(幀內(nèi),幀間,運動補償,濾波器用否,等),(3)量化步長,(4)運動矢量…第十頁,共一百三十一頁,編輯于2023年,星期一四、源編碼器

1.方框圖

q:量化變換系數(shù)qZ:量化步長指示P:幀內(nèi)/幀間指示v:運動矢量F:環(huán)路濾波開關(guān)指示t:宏塊圖像發(fā)送與否指示第十一頁,共一百三十一頁,編輯于2023年,星期一(1)混合編碼方式:以運動補償幀間預(yù)測和分塊DCT為基礎(chǔ)的混合編碼算法。

A.幀內(nèi),幀間模式

a、幀內(nèi)模式:k1,k2上位置對原圖像進行DCTQ熵編碼。

b、幀間模式:k1,k2下位置(運動補償預(yù)測編碼),對幀間預(yù)測誤差上進行

DCTQ熵編碼

B.量化:對DCT變換系數(shù)進行量化。壓縮

C.熵編碼:游程編碼(RLC),變長編碼(VLC),對符號冗余度進行無損壓縮編碼。(2)傳輸緩沖器協(xié)調(diào)編碼器輸出和傳輸網(wǎng)絡(luò)位率,充分利用網(wǎng)絡(luò)傳輸位率,對于恒定輸出碼率:

第十二頁,共一百三十一頁,編輯于2023年,星期一(3)編碼器控制器

A.根據(jù)緩沖器來的信息控制量化步長

B.控制編碼模式(幀內(nèi),幀間)

C.宏塊傳送與否。(4)熵編碼器除了對量化后的DCT系數(shù)編碼外,還要把許多附加信息組織到(復(fù)用)數(shù)據(jù)流中去,這些信息包括:

A.幀內(nèi)/幀間編碼標志(P)

B.宏塊發(fā)送與否標志(t)

C.使用量化表(q)

D.運動矢量(v)

E.環(huán)路濾波器用與否(f)∴這里熵編碼也被稱為:多路編碼器,復(fù)用編碼器。第十三頁,共一百三十一頁,編輯于2023年,星期一2、幀內(nèi)、幀間編碼判斷方法:以MB為單位,比較前后兩幀圖像的相關(guān)性,通常相關(guān)性小采用幀內(nèi),相關(guān)性強采用幀間模式。下面給出一種幀內(nèi)、幀間編碼判斷方法。設(shè)P(x,y)為前幀MB像素值,C(x,y)為當前幀MB像素值。前幀MB亮度信號方差VAROR為:前后幀像素差方值,VAR

第十四頁,共一百三十一頁,編輯于2023年,星期一

1)當VAR≤64,或VAR>64且VAROR≥VAR時,用幀間;

2)當VAR>64,且VAR>VAROR時,用幀內(nèi)。

該判據(jù)可用下圖表示:

值得說明的是H。261標準,沒有包括上述判定方法,因此可以使用其它判定方法。

第十五頁,共一百三十一頁,編輯于2023年,星期一.

3、量化:

1)采用均勻量化

2)直流系數(shù)量化步長固定為83)其它系數(shù),不同MB可用不同步長,但每個MB步長相同。第十六頁,共一百三十一頁,編輯于2023年,星期一

4熵編碼由行程編碼和Huffman編碼二部分組成。(1)行程編碼

A、對8×8量化系數(shù)(塊)采用Z字形掃描處理,得到一維量化系數(shù)序列。使低頻系數(shù)數(shù)據(jù)排在高頻系數(shù)之前,增加連零的個數(shù),以利于熵編碼。如圖所示:

第十七頁,共一百三十一頁,編輯于2023年,星期一B.將一維量化系數(shù)序列變成若干對數(shù)據(jù)(行程/幅值)行程:指連零的個數(shù);幅值:連零后的非零系數(shù)數(shù)值。

例子:設(shè)塊量化系數(shù)入圖所示。第十八頁,共一百三十一頁,編輯于2023年,星期一

A.05303–100……10B.(1/5),(0/3),(2/-1),(56/1)(2)對(行程/幅值)進行Huffman編碼第十九頁,共一百三十一頁,編輯于2023年,星期一6、附加信息的復(fù)用規(guī)定

從前H.261方框圖(源編碼器中)可知,編碼數(shù)據(jù)流中除了塊數(shù)據(jù)外,與原始圖像的幀,塊組和宏塊相對應(yīng),還需傳幀,塊組和宏塊的結(jié)構(gòu)信息以及宏塊量化編碼的有關(guān)其它信息,例如量化表地址、運動矢量等附加信息,現(xiàn)介紹附加信息的復(fù)用規(guī)定:

(1)圖像層(picturelayer)

A.PSC圖像啟動碼

20bit其值為:00000000000000010000

第二十頁,共一百三十一頁,編輯于2023年,星期一

B.TR時間參考

5bit,表示幀號,形成方法是將前面的圖像頭的值增1,再加上自最近一次發(fā)送后未發(fā)送的圖像數(shù)目。(即在抽幀情況下,在計算幀號時應(yīng)計入未編碼傳送的數(shù)目)

C.PTYPE形成信息,6bitBit1,分裂屏幕指示,“0”非“1”是

Bit2,文件攝像機指示

Bit3凝固圖像釋放指示

Bit4圖像格式指示,“0”為QCIF,“1”為CIFBit5,6備用

D.PEI附加插入信息指示:當PEI=1時,其后跟9bit,其中前8bit是PARE(即圖像層附加信息),1bit為另一個PEI,若它仍為為1,則后面再接著傳送個一個8bit附加信息,直至PEI=0,后面沒有PSPARE為止。

E.PSPARE附加信息,8bit。第二十一頁,共一百三十一頁,編輯于2023年,星期一(2)塊組層(GOBLayer)

A.塊組啟動碼GBSC16bit,碼字為0000000000000001B.組號GN4bit,表示塊組的號碼(1~12),

C.量化器信息QUANTD.

5bit,表示1-31各量化系數(shù)中的某一個量化系數(shù)。它在任何后續(xù)的QUANTD取代前都指示宏塊組所使用的量化器。

D.附加插如信息指示GEI,及附加信息GSAPRE,與圖像層PEI和PAPARE相似,只是這些附加信息嵌在塊碼流中。第二十二頁,共一百三十一頁,編輯于2023年,星期一(3)宏塊(MBLayer)宏塊的數(shù)目較多,為了節(jié)省碼字,基本上采用可變長編碼(VLC)

A.宏塊地址MBAMBA總是含在發(fā)送宏塊中,若某些宏塊所在的圖像部分沒有信息,則該宏塊將不發(fā)送。

B.形成信息MTYPE

可變長碼字該宏塊的有關(guān)信息。

C.量化器MQUANa)僅當MTYPE指出MQUANT存在時才有MQUANTb)5bit,MQUANT碼字與GQUANT相同

D.碼塊圖案CBP用以說明當前MB哪幾塊編碼傳送。第二十三頁,共一百三十一頁,編輯于2023年,星期一

(4)塊層(BLayer)由變換系數(shù)(TCOFEE)和跟隨其后的塊終止標號(EOB)組成。

7、BCH編碼:(1)BCH(n,k),循環(huán)冗余校驗碼

n=511碼長

k=493信息碼元長

n-k=18校驗碼元長第二十四頁,共一百三十一頁,編輯于2023年,星期一(2)糾錯幀安排

A.幀群;8幀組成一幀群(a)一幀:幀首數(shù)據(jù)校驗碼

149318

(b)幀首:每個幀首僅一位,用于同步,八個幀首為S1到S8,各幀首碼位規(guī)定為:(S1S2……S8=00011011)第二十五頁,共一百三十一頁,編輯于2023年,星期一

B.數(shù)據(jù)結(jié)構(gòu):(a)FiL:1位,稱為填滿指示

FiL=1,表明其后有492位數(shù)據(jù)

FiL=0,表明后面無數(shù)據(jù),此時492位全取1。(b)492位有效數(shù)據(jù)(3)BCH碼糾錯能力

BCH碼的碼長n,信息碼元k和糾錯個數(shù)t之間的關(guān)系

n-k≤mtn=2m-1

式中,m為大于3的整數(shù),能糾正所有不大于t個隨機錯誤?,F(xiàn)在:n=511=29-1∴m=9n-k=18≤9tt=2即可糾正2位誤錯。每幀的511位到達解碼器后,解出信息碼元493,當發(fā)現(xiàn)2位或2位以下的錯誤,可以自動糾正。第二十六頁,共一百三十一頁,編輯于2023年,星期一3.2.3H.263標準

H.263標準制定于1995年,是ITU-T針對64kbit/s以下的低比特速率視頻應(yīng)用而制定的標準。它的基本算法與H.261基本相同,但進行了許多改進,使得H.263標準獲得了更好的編碼性質(zhì)。改進主要包括支持更多的圖像格式、更有效的運動預(yù)測、效率更高的三維可變長編碼代替二維可變長編碼以及增加了4個可選模式。第二十七頁,共一百三十一頁,編輯于2023年,星期一1、支持的圖像格式和數(shù)據(jù)組織

1)支持5種數(shù)據(jù)格式參數(shù)Sub-QCIFQCIFCIF4CIF16CIFY有效取樣點數(shù)/行1281763527041408U,V有效取樣點數(shù)/行6488176352704Y有效行數(shù)/幀961442885761152U,V有效行數(shù)/幀4872144288576第二十八頁,共一百三十一頁,編輯于2023年,星期一

2)所有的解碼器必須支持Sub-QCIF和QCIF格式,所有的編碼器必須支持Sub-QCIF和QCIF格式中的一種,是否支持其他格式由用戶決定。

3)與H.261相同,H.263仍然采用圖像層P、塊組層GOB、宏塊層MB和塊層B四個層次的數(shù)據(jù)結(jié)構(gòu)。第二十九頁,共一百三十一頁,編輯于2023年,星期一4)H.263的編碼器框圖

H.263編碼器中沒有環(huán)路濾波器。這是因為H.263采取了更為有效的半像素精度運動矢量預(yù)測,環(huán)路濾波器作用已經(jīng)不明顯。第三十頁,共一百三十一頁,編輯于2023年,星期一2、運動預(yù)測

1)半像素精度運動矢量預(yù)測所謂半像素預(yù)測,就是在整像素精度預(yù)測后再執(zhí)行半像素精度預(yù)測。即首在搜索窗中以整像素精度進行塊全匹配搜索,獲得最佳匹配塊后,再以半像素的精度在最佳匹配塊±1像素的范圍內(nèi)執(zhí)行搜索。第三十一頁,共一百三十一頁,編輯于2023年,星期一進行半像素精度運動預(yù)測需要獲得半像素位置的幅度值,H.263通過線性插值獲得。如圖3-16所示。第三十二頁,共一百三十一頁,編輯于2023年,星期一2)運動矢量預(yù)測編碼對運動矢量采用預(yù)測編碼。預(yù)測編碼采用與當前宏塊相鄰的三個宏塊的運動矢量的均值作為預(yù)測值,如圖3.-17所示。當相鄰宏塊不在當前塊組時,按照下列規(guī)則處理:如果只有一個相鄰宏塊在塊組外,則令該宏塊運動矢量為零計算預(yù)測值;如果有兩個宏塊在塊組外,則直接取剩下的宏塊的運動矢量作為預(yù)測值。第三十三頁,共一百三十一頁,編輯于2023年,星期一MV:當前宏運動矢量MV1,MV2,MV3:用來預(yù)測的相鄰宏塊運動矢量————:GOB邊界第三十四頁,共一百三十一頁,編輯于2023年,星期一3、四種可選模式無限制運動矢量模式、基于語法的算術(shù)編碼模式、先進預(yù)測模式和PB圖像模式。1)無限制運動矢量模式在此種模式下,運動矢量可以指向圖像以外的區(qū)域,這種模式可以改善邊緣宏塊的預(yù)測效果,尤其適合較小的圖像格式(比如QCIF)。采用這種模式時。指向圖像外部的參考像素用最近的邊緣像素替代。如圖3.-18所示。第三十五頁,共一百三十一頁,編輯于2023年,星期一PA有一部分位于預(yù)測幀之外,將該部分分為1,2,4三個小部分。1中的像素點的像素值由預(yù)測幀上邊緣的相應(yīng)像素點的像素值代替。2中的像素點的像素值由預(yù)測幀右上角的相應(yīng)像素點的像素值代替。4中的像素點的像素值由預(yù)測幀右邊緣的相應(yīng)像素點的像素值代替。第三十六頁,共一百三十一頁,編輯于2023年,星期一2)基于語法的算術(shù)編碼模式在相同圖像質(zhì)量下,基于語法的算術(shù)編碼模式可以把比特率降低5%左右

3)先進預(yù)測模式先進預(yù)測模式包含兩方面的內(nèi)容,一方面,在編碼端它允許將一個宏塊分成四個塊分別進行運動估計和補償,使估計更為精確;另一方面,在解碼端它還允許采用重疊塊的運動補償方法(OBMC),這樣可以明顯地消除由塊編碼所帶來的方塊效應(yīng)第三十七頁,共一百三十一頁,編輯于2023年,星期一在先進預(yù)測模式中,既可以對一個宏塊使用一個運動矢量,也可以對宏塊的每個亮度塊各使用一個運動矢量。當一個宏塊使用4個運動矢量時,色度塊的運動矢量是4個亮度塊運動矢量和的1/8。哪些宏塊采用4個運動矢量取決于編碼器。對運動矢量仍采用預(yù)測編碼,取三個預(yù)測矢量的均值作為預(yù)測值。不過預(yù)測矢量MV1、MV2、MV3的位置有所變化,如圖3-19所示,其中,粗線代表宏塊邊界。第三十八頁,共一百三十一頁,編輯于2023年,星期一預(yù)測矢量MV1、MV2、MV3的位置有所變化,如圖3-19所示,其中,粗線代表宏塊邊界。第三十九頁,共一百三十一頁,編輯于2023年,星期一采用OBMC時,解碼端的亮度預(yù)測值是由三個運動矢量計算得到的三個預(yù)測值的加權(quán)和。這三個運動矢量是:當前宏塊的運動矢量、最靠近當前像素的兩個宏塊(上下取一個,左右取一個)的運動矢量。如果一個宏塊采用四個運動矢量,這三個運動矢量是:當前塊的運動矢量、最靠近當前像素的運動矢量。色度預(yù)測值不采用OBMC技術(shù)。第四十頁,共一百三十一頁,編輯于2023年,星期一下面舉例說明OBMC技術(shù)。設(shè)最靠近預(yù)測樣點的兩個塊分別位于當前塊的上方和左方,它們的運動矢量分別是(x1,y1)、(x2,y2),它們確定的樣點亮度預(yù)測值分別為s1,s2;設(shè)當前塊的運動矢量為(x0,y0),它確定的樣點亮度預(yù)測值為s0,則待預(yù)測樣點亮度的預(yù)測值為:式中:(i,j)為當前樣點的坐標;H0、H1、H2分別是加權(quán)矩陣第四十一頁,共一百三十一頁,編輯于2023年,星期一第四十二頁,共一百三十一頁,編輯于2023年,星期一4)PB圖像模式PB幀,一個PB幀由一個P幀和一個B幀組成,一起編碼。其中P幀即在缺省模式中采用幀間編碼的幀,P幀由前面已經(jīng)編碼的P幀或者I幀來預(yù)測。而B幀在時間上處于前一P幀(或者I幀)和當前P幀之間,由二者進行雙向預(yù)測,這種關(guān)系如圖3-21所示。第四十三頁,共一百三十一頁,編輯于2023年,星期一

B幀的前項運動矢量MVF和后向運動矢量MVB由下式獲得。MV為當前P幀的運動矢量,TR0為前P幀與前一P幀的時間間隔,TRB為B幀與前一P幀的時間間隔,MVD為矢量修正值第四十四頁,共一百三十一頁,編輯于2023年,星期一1995年制定H.263標準后,ITU-T于1998年和2000年相繼通過了H.263的第二版和第三版,稱為H.263+和H.263++。在這兩個版本中,一共添加了15個新的可選模式,并修改了一個H.263的已有模式,有效的提高了編碼效果。第四十五頁,共一百三十一頁,編輯于2023年,星期一3.3JPEG標準

3.3.1JPEG一.概述

1、JPEGJointPhotographicExpertsGroup聯(lián)合圖片專家組的縮寫

2、時間:1988年提出標準草案,1990年3月通過,并命名為JPEG。

1992年正式成立國際標準

3、應(yīng)用:連續(xù)色調(diào)靜止圖像壓縮(只要處理速度足夠快,也可以用于實時視頻壓縮)

JPEG應(yīng)用面廣,可以適應(yīng)各種不同的應(yīng)用場合第四十六頁,共一百三十一頁,編輯于2023年,星期一采用JPEG算法對全活動視頻圖像進行壓縮編碼的另一種方法,是運動JPEG(MotionJPEG),簡稱M-JPEG,它是通過對JPEG標準進行擴展來支持活動圖像的壓縮。M-JPEG首先通過對相鄰幀圖像進行簡單的幀間預(yù)測得到預(yù)測誤差,然后利用JPEG算法對預(yù)測誤差進行編碼。第四十七頁,共一百三十一頁,編輯于2023年,星期一

4、四種運行模式:(1)基于DCT的順序工作模式(2)基于DCT的漸進工作模式(3)無失真編碼工作模式(4)多分辨工作模式

5、二種編碼方法(1)Huffman碼(2)算術(shù)編碼

6、三種工作系統(tǒng)(1)基本系統(tǒng)(2)擴展系統(tǒng)(3)信息保持系統(tǒng)是不同編碼方法和工作模式的不同組合。

JPEG編解碼器必須支持基本系統(tǒng),其他系統(tǒng)作為選擇項,根據(jù)不同應(yīng)用目的進行取舍。第四十八頁,共一百三十一頁,編輯于2023年,星期一二.基本系統(tǒng)簡介

1、編、解碼方框圖基本壓縮編碼方法與H.261幀內(nèi)模式類似。第四十九頁,共一百三十一頁,編輯于2023年,星期一

2、DCT系數(shù)量化(1)均勻量化(2)不同位置采用不同的量化步長→利用人眼視覺特性進行量化→是JPEG標準的一個特點(例如:附表2,表3)分亮度量化表(表2)和色度量化表(表3)其量化計算公式:

F(U,V)為DCT系數(shù);S(U,V)量化步長,Q(U,V)量化系數(shù)

3、熵編碼:(1)對直流系數(shù)采用DPCM編碼

A.直流系數(shù)DC:

Q(0,0)為直流系數(shù),用DC表示,如圖3.2-1。代表本塊的平均亮度。第五十頁,共一百三十一頁,編輯于2023年,星期一

B.DPCM:(對相鄰子塊直流系數(shù)進行DPCM編碼

D=DCi-DCi-1DCi:當前塊圖像的直流系數(shù)

DCi-1:為前一塊圖像的直流系數(shù)(2)對交流系數(shù)進行行程編碼:

A.交流系數(shù)ACij

除直流系數(shù)外的63個系數(shù)為交流系數(shù),用ACij表示。

B.交流系數(shù)進行行程編碼第五十一頁,共一百三十一頁,編輯于2023年,星期一(3)編碼過程(與H.261類似)

A.對經(jīng)Z形掃描形成的一維AC系數(shù)序列構(gòu)成若干符號對(中間符號序列);對直流差分數(shù)構(gòu)成符號對;符號對由符號1和符號2組成。符號1符號2

(行程,位長)(振幅)行程:連續(xù)0的個數(shù)非零系數(shù)大?。―C:差分值,

AC:非0系數(shù))位長:后續(xù)AC(非0)系數(shù)的編碼位長

第五十二頁,共一百三十一頁,編輯于2023年,星期一

B.對上述符號對進行變長編碼(Huffman編碼),通過查相應(yīng)編碼表得到。

(a)由符號1查編碼表得一編碼對直流系數(shù)符號查直流差分表。對交流系數(shù)查交流系數(shù)表。(b)由符號2查表得一編碼,查正負值幅度表得(補:表10)(c)由符號1和符號2查得編碼,組成該符號對的碼子。第五十三頁,共一百三十一頁,編輯于2023年,星期一(4)例子設(shè)某一亮度子圖像DCT系數(shù)量化后的系數(shù)如圖3.2-2所示,求該子圖像JPEG編碼后的數(shù)據(jù),(設(shè)前一個子圖像的DC系數(shù)量化值為12)解:a)經(jīng)Z形掃描得一維系數(shù)序列,(150–2-1–1–100–1EOB)

b)符號對:對于DC系數(shù),其D=DCi-DCi-1=15-12=3第五十四頁,共一百三十一頁,編輯于2023年,星期一第五十五頁,共一百三十一頁,編輯于2023年,星期一3.3MPEG標準一、概述1、MPEG:是MovingPictureExpertsGroup(活動圖像專家組——1988年ISO設(shè)立)的縮寫。(其任務(wù)是研究視頻,音頻壓縮)為制定動態(tài)圖像壓縮標準而設(shè)立的專家組。2、主要三種標準(1)MPGE-1A.1992年通過B.以壓縮碼速率為0.9-1.5Mb/s的視頻信號為目標。D.應(yīng)用:數(shù)字存儲媒體第五十六頁,共一百三十一頁,編輯于2023年,星期一(2)MPEG-2A.1994.11通過B.為MPEG-1標準的擴展C.支持2-100Mb/s速率的數(shù)字視頻D.應(yīng)用:高品質(zhì)廣播電視,DVD,DVB,CATV,HDTV等。(3)MPEG-4A.1998.11通過B.位率<64Kb/s,超低碼率視頻壓縮標準。C.主要應(yīng)用:移動多媒體通信第五十七頁,共一百三十一頁,編輯于2023年,星期一3、主要由三部分組成:(1)MPEG視頻(2)MPEG音頻(3)MPEG系統(tǒng):信號格式,壓縮視頻、音頻數(shù)據(jù)流的復(fù)合和同步。4、MPEG視頻壓縮算法,必須具備與存儲相適應(yīng)的性質(zhì):(1)能夠隨機訪問(2)快進/快退檢索,倒放(3)音像同步(4)可編輯性(5)靈活的視頻格式第五十八頁,共一百三十一頁,編輯于2023年,星期一3.3.1MPEG-1

MPEG-1采用SIF視頻格式,SIF(SourceInputFormat)稱為源輸入格式,也稱作標準交換格式(StandardInterchangeFormat),有352×288×25和352×240×30兩種選擇。1、視頻碼流結(jié)構(gòu)公分6個層次(1)圖像序列層(seguence)指整個一個被處理的連續(xù)圖像(MPEG-1:逐行掃描。)由序列頭,一個或若干圖像組和序列結(jié)束標志組成序列頭給出圖像尺寸,幀率碼率,幀組數(shù)等信息,比特率、緩沖器容量大小等解碼器所需信息。插入附加序列頭有助于實現(xiàn)隨機訪問和編輯第五十九頁,共一百三十一頁,編輯于2023年,星期一(2)圖像組層(GOP—GroupofPicture)由圖像組頭和一系列圖像幀組成。第一幀必須是I幀。頭給出組內(nèi)幀數(shù),幀的順序,等信息時間、圖像組終止碼、編輯斷點連接碼等參數(shù)。圖像組進行隨機存取單元第六十頁,共一百三十一頁,編輯于2023年,星期一(3)圖像層(picture)是圖像組的基本單元,為獨立的顯示單元亮度和色度之間的格式:4:1:1由頭和片層數(shù)據(jù)組成頭給出幀(圖像)類型(I.P.B),幀編號,幀內(nèi)片數(shù)等。第六十一頁,共一百三十一頁,編輯于2023年,星期一(4)片層(

Slice)目的,防止錯誤擴散片層最大相當于每幅圖像的宏塊總數(shù),最小時只有一個唯一的宏塊。同一片內(nèi)宏塊的次序從左到右,從上到下。是進行再同步的單元,在每條開始,對運動矢量和DCT系數(shù)值作DPCM的預(yù)測值,都重新置到零,這可防止解碼時的錯誤積累。頭給出同步,片編號,片內(nèi)宏塊數(shù)等信息。第六十二頁,共一百三十一頁,編輯于2023年,星期一(5)宏塊層(MB)由4個8×8像素組成的Y塊和兩個8×8像素組成的色度塊組成。是進行運動補償?shù)幕締卧?。?)塊層(B)8×8像素組成,為最小圖像處理單元,進行DCT的單元。數(shù)據(jù)結(jié)構(gòu)圖:第六十三頁,共一百三十一頁,編輯于2023年,星期一第六十四頁,共一百三十一頁,編輯于2023年,星期一第六十五頁,共一百三十一頁,編輯于2023年,星期一2、三種編碼圖像幀(1)I幀(IntroCodedFrame,內(nèi)幀)類似于H.261的幀內(nèi)編碼模式。A.對像素塊進行二維DCT(類似JPEG)B.作為其它圖像幀編碼的參考幀C.作為隨機存取點D.壓縮比不高,但沒有誤碼擴散。(8倍左右)(2)P幀(PredictivelyCodedFrame,預(yù)測幀)類似于H.261的幀間模式。A.利用前面的I幀或P幀進行預(yù)測編碼,(即對預(yù)測誤差進行編碼傳送。)B.是預(yù)測B幀或下一個P幀的參考幀C.壓縮比較I幀高,但誤碼會擴散。(30倍左右)第六十六頁,共一百三十一頁,編輯于2023年,星期一(3)B幀(BidirectiondlyPredictivelyCodedFrame,雙方預(yù)測幀IBBPBBPA.B幀插在I-P或P-P幀之間。B.同時利用前面和后面(P幀或I幀)圖像進行預(yù)測。C.不作為參考幀D.與H.261相比,是MPEG的特點,提高了壓縮比,改善了圖像質(zhì)量。(50倍左右)第六十七頁,共一百三十一頁,編輯于2023年,星期一(3)I、B幀數(shù)目A、I幀使用頻率和在視頻流的位置的選擇,是根據(jù)滿足圖像序列中隨機存取和景物切換的需要而定。典型每秒鐘2次,即在15幀中案排1次。B、B幀在I、P幀間安排的數(shù)目,基于編碼器中存儲器的數(shù)量和正在編碼圖像的性質(zhì)等a)B幀數(shù)壓縮比圖像質(zhì)量實時性b)典型數(shù):插入2個B幀。第六十八頁,共一百三十一頁,編輯于2023年,星期一3、編碼器

(1)方框圖。其中V:運動矢量q:量化系數(shù)I:幀內(nèi)/幀間指示p:圖像類型第六十九頁,共一百三十一頁,編輯于2023年,星期一與H.261相似主要不同之處:A.兩個幀存儲器B.幀重排輸入:IBBPBBP……輸出:IPBBPBB……∵B幀編碼需要兩個參考幀。C.有三個控制開關(guān)。第七十頁,共一百三十一頁,編輯于2023年,星期一(2)I幀編碼(A)S1,S2,S3,開關(guān)處于I位置。(B)第七十一頁,共一百三十一頁,編輯于2023年,星期一(C)要求精量化幀內(nèi)編碼塊的信號頻率范圍較寬,則應(yīng)采用細粗量化器進行精確編碼,否則,對于哪些光滑的塊,很小的誤差都會產(chǎn)生可觀察的塊邊界(即塊效應(yīng))采用多種專用量化表,按圖像內(nèi)容分類制定量化表:a)≧0.5系數(shù)保留b)按宏塊圖像反差調(diào)整量化表:宏塊反差:c)按輸出碼率高低,調(diào)整量化表。第七十二頁,共一百三十一頁,編輯于2023年,星期一(3)P幀編碼(A)S1,S2,S3開關(guān)處于P位置(B)找出運動矢量:以I幀(或P幀)圖像作為參考(C)運動補償預(yù)測(D)計算預(yù)測誤差(E)對預(yù)測誤差編碼(F)用粗量化。由于預(yù)測誤差主要是高頻信號,可采用粗粒度量化器。第七十三頁,共一百三十一頁,編輯于2023年,星期一(4)B幀編碼幀重排后,輸出幀序為IPBBPB,對B幀編碼時,前面的I,P幀(或P,P幀)已存入編碼器圖中的I,P幀存儲器。A.S1,S2,S3開關(guān)處于B位置。B.找出運動矢量(以I,P為參考幀)C.運動補償預(yù)測D.計算預(yù)測誤差E.預(yù)測誤差編碼:由于S3斷開,,輸出,不存入存儲器,不作為參考幀。F.粗量化第七十四頁,共一百三十一頁,編輯于2023年,星期一4、解碼器(1)方框圖第七十五頁,共一百三十一頁,編輯于2023年,星期一(2)I幀解碼第七十六頁,共一百三十一頁,編輯于2023年,星期一(3.)P幀解碼(4).B幀解碼第七十七頁,共一百三十一頁,編輯于2023年,星期一3.3.2MPEG-2標準1、概述(1)向下兼容MPEG-1和H.261標準。(由MPEG-1發(fā)展而來)(2)作為通用標準,適用于更廣泛的應(yīng)用場合,能滿足廣播、通信、計算機到家庭電子產(chǎn)品。

第七十八頁,共一百三十一頁,編輯于2023年,星期一(3)與MPEG-1相比,在視頻方面進行的擴展和改進主要包括:

(A)擴大了重要的參數(shù)值,允許更大的畫面格式,比特率和運動矢量長度。(B)考慮到電視信號隔行掃描特性,專門設(shè)置了“按幀編碼”和“按場編碼”兩種模式,(對幀/場運動補償、幀/場DCT進行選擇)成為改進圖像質(zhì)量的關(guān)鍵措施之一。(C)定義了檔次和級別的概念,作為其完整句法流的一個子集,使用戶根據(jù)不同的應(yīng)用情況進行選擇。(D)引入了可伸縮(可分級)視頻編碼方式。第七十九頁,共一百三十一頁,編輯于2023年,星期一可伸縮的(SCABLE)視頻編碼是指編碼所產(chǎn)生的碼流具有以下特性:對碼流的一部分進行解碼和對碼流的全部進行解碼能夠獲得不同質(zhì)量的重建圖像。對部分解碼所獲得的圖像比對全部碼流解碼獲得的圖像分辨率(或幀率、或信噪比等)要低。有:空間可伸縮,時間可伸縮,信噪比可伸縮和數(shù)據(jù)分割(Datapartitioning)四種。第八十頁,共一百三十一頁,編輯于2023年,星期一2、類(檔次,配置)/級(等級、級別)結(jié)構(gòu)(profile/level)“類”是集成后的完整碼流的一個子集,而每個類的“級”是對編碼參數(shù)的進一步限制(圖像參數(shù)——格式,采樣高等)。類/級是通過確定碼流中相應(yīng)標題信息和附加信息中的有關(guān)參數(shù)來給定。第八十一頁,共一百三十一頁,編輯于2023年,星期一1)五個類(porfile)A)無B幀的簡單類(SimpleProfile)B)允許B幀的主類(MainProfile)C)在主類基礎(chǔ)上加上SNR分級的SNR可分級類(SNRScalableProfile)D)在C基礎(chǔ)上空域可分級類(SpatialyScalableProfile)E)在D基礎(chǔ)上加上時間域可分級的高類(HighScalableProfile)第八十二頁,共一百三十一頁,編輯于2023年,星期一2)四級

A)MPEG-1格式的低級(LowLevel)(352*288*30)B)標準清晰度電視的主級(MainLevel)(720×480×30,720×576×25)C)每行1440取樣的HDTV的高級(High-1440Level)(1440×1080×30,1440×1152×25)D)每行1920取樣的HDTV的高級(HighLevel)(1920×1080×30,1920×1152×25)第八十三頁,共一百三十一頁,編輯于2023年,星期一第八十四頁,共一百三十一頁,編輯于2023年,星期一

實際應(yīng)用中,有些組合不大可能出現(xiàn),因而未予規(guī)定。如HighProfile,LowLevel就不會出現(xiàn)。其中,SP@ML,MP@ML,MP@HL和MP@H1440被認為是最重要的技術(shù)規(guī)范。

MP@ML,是最早有集成電路的解碼器,應(yīng)用于多種場合,圖像質(zhì)量超過現(xiàn)有電視信號,美國150個衛(wèi)星直播采用,也被采用數(shù)字視盤,DVD。

MP@HL:美國HDTV大聯(lián)盟方案。MP@H1440:歐洲HDTV方案

第八十五頁,共一百三十一頁,編輯于2023年,星期一3、基于幀/場編碼模式(1)幀/場DCTDCT變換是在場內(nèi),還是在幀內(nèi)進行,是基于景物的局部空間內(nèi)容與空間相關(guān)性有關(guān)。雖然場的行距是幀的行距的兩倍,但前者的相關(guān)性并不是總比后者小。若景物中有相當大的運動,幀DCT的效果不如場DCT,這是幀DCT中隔行產(chǎn)生的邊緣效應(yīng),會使大的DCT系數(shù)出現(xiàn)在左下角,而不是右上角。第八十六頁,共一百三十一頁,編輯于2023年,星期一在作DCT之前,要作幀/場編碼的選擇。選擇的方法是對16×16的原圖像或?qū)α炼茸鬟\動補償后的差值作幀的行間和場的行間的相關(guān)系數(shù)的計算。如果幀行的相關(guān)系數(shù)大于場行的相關(guān)系數(shù),就選幀DCT編碼,否則就選場DCT編碼。一般情況小,對細節(jié)多,運動部分少的圖像,選幀DCT;對細節(jié)少,運動部分多的圖像,選場DCT。第八十七頁,共一百三十一頁,編輯于2023年,星期一(a)幀DCT編碼的亮度宏塊結(jié)構(gòu)第八十八頁,共一百三十一頁,編輯于2023年,星期一

(b)場DCT編碼的亮度宏塊結(jié)構(gòu)第八十九頁,共一百三十一頁,編輯于2023年,星期一(2)幀/場的運動補償運動補償,MPEG-1是按幀進行的。MPEG-2考慮到視頻信號隔行掃描的特點,增加了按場補償?shù)姆椒?,以便更有效的提高運動補償?shù)男Ч?,并可能部分解決運動物體遮掩/露出的問題。下面給出具體的混合預(yù)測/內(nèi)插運動補償算法第九十頁,共一百三十一頁,編輯于2023年,星期一(A)P幀運動補償是以過去幀為參考幀,根據(jù)當前幀和參考幀的兩種屬性,奇場和偶場,可以組成四種運動補償方式,與幀補償方式一起共五種不同的補償方式。通過MSE準則選擇P幀最佳運動補償方式。第九十一頁,共一百三十一頁,編輯于2023年,星期一(B)B幀運動補償以過去幀和未來幀為參考幀,可分為前向、后向和雙向預(yù)測三種方式。前兩種方式與P幀運動補償方式相同,分別得五種預(yù)測。第三種預(yù)測利用雙向平均值做運動補償。從以上多種組合中以MSE準則,選出最佳運動補償方式。第九十二頁,共一百三十一頁,編輯于2023年,星期一場圖像的場預(yù)測示意圖第九十三頁,共一百三十一頁,編輯于2023年,星期一

3、可分級編碼技術(shù)目前常用的分級編碼方法有信噪比、空間、時間域分級等。這里介紹信噪比和空間域分級編碼技術(shù)。(1)信噪比可分級編碼技術(shù)主要考慮,是隨接收條件變差圖像質(zhì)量“適度降級”,以避免數(shù)字廣播所特有的“鄰戶突變”現(xiàn)象,即在廣播覆蓋邊緣附近突然一點也沒有信號。第九十四頁,共一百三十一頁,編輯于2023年,星期一(A)方框圖第九十五頁,共一百三十一頁,編輯于2023年,星期一編碼器產(chǎn)生兩個數(shù)據(jù)流,從中可建立兩個視頻信號,其建立圖像尺寸相同,只是圖像質(zhì)量不同,即信噪比的不同。通過可分級改變DCT系數(shù)的量化步長。(B)底層碼流底層碼流MPEG-2基本編碼環(huán)路得到,對DCT系數(shù)粗量化(量化器Q),解碼得到較低質(zhì)量的視頻信號。第九十六頁,共一百三十一頁,編輯于2023年,星期一(C)頂層碼流頂層碼流是通過對底層DCT系數(shù)粗量化的噪聲再進行細量化(Q2),經(jīng)編碼傳輸?shù)玫?。(D)底層碼流以高優(yōu)先級傳輸,頂層碼流以低優(yōu)先級傳輸。這樣,在接收邊緣地區(qū),仍可解出低層碼流,重建較低質(zhì)量的視頻信號。在正常接收地區(qū),接收機可同時解出底層和頂層碼流,產(chǎn)生正常質(zhì)量的視頻信號,從而實現(xiàn)不同質(zhì)量的可分級視頻信號傳輸。第九十七頁,共一百三十一頁,編輯于2023年,星期一(2)空間域可分級編碼技術(shù)空間域可分級的主要目的是實現(xiàn)不同大小的圖像即SDTV和HDTV服務(wù)的兼容性。它的實現(xiàn)框圖如圖3-43所示。第九十八頁,共一百三十一頁,編輯于2023年,星期一(A)方框圖第九十九頁,共一百三十一頁,編輯于2023年,星期一利用對圖像象素的抽取與內(nèi)插來實現(xiàn)不同級別的轉(zhuǎn)換。(B)底層碼流輸入圖像經(jīng)分辨率下抽樣(水平、垂直分別2:1取樣),得到SDTV圖像,經(jīng)過獨立的編碼環(huán)路產(chǎn)生底層碼流。(C)頂層碼流通過內(nèi)插、加權(quán),對全質(zhì)圖像與底層圖像的差值編碼,形成頂層碼流。第一百頁,共一百三十一頁,編輯于2023年,星期一5、MPEG-2系統(tǒng)運輸層MPEG-2標準的系統(tǒng)部分是如何將音頻、視頻以及數(shù)據(jù)的基本碼流組成一個或多個適合存儲或傳送的碼流的規(guī)定。1)系統(tǒng)運輸層的結(jié)構(gòu)第一百零一頁,共一百三十一頁,編輯于2023年,星期一

A)視頻和音頻數(shù)據(jù)經(jīng)編碼器后分別得到視頻、音頻基本碼流(ES—Elementarybitstream)B)經(jīng)過打包器按一定的長度分段,切割成一個個單元,并加入必要的信息。將ES打包為打包基本碼流PES(PacketElementarystream)。

PES的數(shù)據(jù)長度,最大可以216字節(jié),但一般是一個存取單元的長度。一個存取單元相當一幅視頻圖像,或是一個音頻幀。在PES的頭部含有許多信息,借此可識別是視頻還是音頻、數(shù)據(jù),也可以知道小包的長度等。第一百零二頁,共一百三十一頁,編輯于2023年,星期一C)將PES打包為兩類不同的碼流輸出到信道:一種叫節(jié)目碼流(ProgramStream),另一種叫運輸碼流(TransportStream)。節(jié)目碼流適用于相對無誤碼的環(huán)境,如交互式多媒體、CATV中。節(jié)目碼流中小包的長度相對較長,并且是可變的。運輸碼流適合于易發(fā)生錯誤的環(huán)境下,例如網(wǎng)絡(luò)傳輸,衛(wèi)星信道、地面電視廣播等運用環(huán)境中。運輸碼流中的小包長度固定,為188字節(jié),這對處理誤碼有好處。

第一百零三頁,共一百三十一頁,編輯于2023年,星期一

2)PES組成每一個PES分組由PES起始碼、PES頭標志、PES頭域以及凈荷組成,如圖3-45所示。第一百零四頁,共一百三十一頁,編輯于2023年,星期一在PES數(shù)據(jù)塊的前面有一個PES頭,它包含了許多信息。PES包起始碼(packetStartCode):3Byte,共23個“0”和一個“1”,即“000000000000000000000001”。PES的比特構(gòu)成格式是專用的,在碼流中不會有這種組合代表別的意思,它起同步作用。包標識(StreamID):說明這個包碼流的性質(zhì)(視頻、音頻或數(shù)據(jù))及序號。例如:

110×××××——表示音頻碼流,序號為×××××1111××××——表示視頻碼流,序號為××××第一百零五頁,共一百三十一頁,編輯于2023年,星期一PES包長度(PESPacketLength):說明這個字段后面有多少個字節(jié)。PES頭標志(PESHeaderflags):它有14個bit,包含有很多內(nèi)容,如圖3-46所示第一百零六頁,共一百三十一頁,編輯于2023年,星期一SC:表示加擾指示。

PR:表示優(yōu)先級。

DA:表示數(shù)據(jù)匹配指示。

CR:表示有無版權(quán)指示。

OC:表示原版或拷貝。PD:表示是否有PTS(PresentationTimeStamp,顯示時間標志,告訴解碼器一個顯示單元應(yīng)該顯示的時間)或DTS(DecodingTimeStamp,指示一個存儲單元進行解碼的時間)。ESCR:標識PES包頭部是否有ElementaryStreamClockReference,即基本碼流的時鐘基準信息。第一百零七頁,共一百三十一頁,編輯于2023年,星期一RATE:表示PES包頭是否有ElementaryStreamRate,即基本碼流速率信息。TM:表示指示是否有8個比特的字段說明DMS(DigitalStorageMedia)的模式。AC;未定義。CRC:表示是否有CRC字段。EXT:說明是否有擴展標志。第一百零八頁,共一百三十一頁,編輯于2023年,星期一PES分組與一個圖像序列、一個GOP或一幅圖像的起始碼對齊,即PES分組凈荷的第一個字節(jié)要么是圖像序列的起始碼,要么是GOP的起始碼,要么是圖像的起始碼第一百零九頁,共一百三十一頁,編輯于2023年,星期一3)運輸小包運輸小包的結(jié)構(gòu)如圖3-47所示。

(1)固定長度:188字節(jié)

(2)一個新的PES包數(shù)據(jù)總是開始一個新的運輸小包,如果PES包在運輸小包的中間結(jié)束,那么運輸小包的余下長度內(nèi)就用填充字(stuffingbytes)放進去。第一百一十頁,共一百三十一頁,編輯于2023年,星期一(3)運輸小包由包頭和凈負荷數(shù)據(jù)組成,其的頭部分為兩層,一層是固定長的的連接層“LinkLayer”,另一層是可變長長度的適配層“AdaptationLayer

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論