IPTV系統(tǒng)中幾種編碼格式的分析和比較_第1頁
IPTV系統(tǒng)中幾種編碼格式的分析和比較_第2頁
IPTV系統(tǒng)中幾種編碼格式的分析和比較_第3頁
IPTV系統(tǒng)中幾種編碼格式的分析和比較_第4頁
IPTV系統(tǒng)中幾種編碼格式的分析和比較_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、文檔供參考,可復制、編制,期待您的好評與關(guān)注! IPTV系統(tǒng)中幾種編碼格式的分析和比較A few codings format analysis and compare of the IPTV system內(nèi)容摘要:IPTV是近年來迅速發(fā)展起來的、以“電視機+機頂盒”為主要終端設(shè)備、能為用戶提供多種寬帶服務(wù),包括影視服務(wù)、電視節(jié)目在內(nèi)的互動多媒體內(nèi)容的網(wǎng)絡(luò)寬帶增值業(yè)務(wù),它為我國廣大電視用戶提供了全新的寬帶體驗和收視方式。IPTV技術(shù)是一項系統(tǒng)技術(shù),包括多方面的內(nèi)容,本文主要介紹了IPTV系統(tǒng)中的幾種音視頻編碼格式,以及各種格式的分析和比較。Abstract:The IPTV develops

2、quickly in recent years of, regard" television+ set top box" as the main terminal equipments and can provide for the customer various breadths take the service, including the network breadth of the interactive multi-media in inside in service, television program in showbiz contents take to

3、 increase in value the business, it was a large television in our country customer to provide the all new breadth takes to experience personally with accept to see the way. The technique of IPTV is analysis that a few that a system technique, include the various contents, this text introduced the IP

4、TV system inside primarily see the code the format, and every kind of format with compare.關(guān)鍵詞IPTV; MPEG-2; MPEG-4; H.264; AVSKey Word: IPTV; MPEG-2; MPEG-4; H.264; AVS前言IPTV作為IP網(wǎng)絡(luò)上的視頻應(yīng)用,對音視頻編解碼有很高的要求。首先,編碼要有高的壓縮效率和好的圖像質(zhì)量,壓縮效率越高,傳輸占用帶寬越?。粓D像質(zhì)量越高,用戶體驗則越好。其次,IPTV平臺應(yīng)能兼容不同編碼標準的媒體文件,以適應(yīng)今后業(yè)務(wù)的發(fā)展。最后,要求終端支持多種編

5、碼格式或具備解碼能力在線升級功能。目前主流的視頻編碼格式有以下幾種:MPEG-2(ISO/IEC 13818-2)、MPEG-4 Part 2(ISO/IEC14496-2)、H.264/AVC(即MPEG-4 Part10)、AVS、微軟的WMV-9、Real公司的視頻格式、SVC(可伸縮視頻編碼,應(yīng)用于變帶寬、變速率環(huán)境)和VC-1(美國SMPTE 于2004年底頒布的壓縮標準)。常見的標準有MPEG-2、MPEG-4、H.264和AVS,它們有各自的特點。以下主要對MPEG-2、MPEG-4、H.264以及AVS的視頻編碼格式進行簡單的分析和比較。MPEG-2是運動圖像壓縮標準。該標準完

6、全兼容MPEG-1標準,其處理能力可達到廣播級水平,適應(yīng)于1.550Mbit/s編碼范圍。它應(yīng)用于DVD方案,應(yīng)用于高清晰度電視(HDTV)的方案,也應(yīng)用于現(xiàn)在廣播式有線數(shù)字電視系統(tǒng)的編碼。MPEG-4(Part 2)是ISO為傳輸數(shù)碼率低于64kbit/s的實時圖像設(shè)計的,是一種高效的編碼標準。編碼比特率相應(yīng)可分為384kbit/s1Mbit/s、64kbit/s384kbit/s、64kbit/s以下,對多媒體應(yīng)用領(lǐng)域的各種編碼進行兼容。廣泛應(yīng)用于有線、無線、移動通信、Internet以及數(shù)字存儲回放等各個領(lǐng)域。H.264(IEC 14496-10AVC)是2003年ITU-T 通過的數(shù)字

7、視頻編解碼標準。H.264標準有基本子集、主體子集和擴展子集等三個子集,基本子集專為視頻會議應(yīng)用設(shè)計的,它提供了強大的差錯消隱技術(shù),并支持低延時編/解碼技術(shù),使視頻會議顯得更自然。主體子集和擴展子集更適合于電視應(yīng)用(數(shù)字廣播、DVD)和延時顯得不太重要的視頻流應(yīng)用。 AVS是我國創(chuàng)新技術(shù)自行研制的編碼標準。它包括系統(tǒng)、視頻、音頻、數(shù)字版權(quán)等四個主要技術(shù)標準和致性測試等支撐標準。AVS視頻編解碼標準的核心技術(shù)包括:8X8整數(shù)變換、量化、幀內(nèi)預測、1/4精度像素插值、特殊的幀間預測運動補償、二維熵編碼等。該標準達到國際先進水平的數(shù)字音視頻編解碼標準,可應(yīng)用于高清晰度數(shù)字電視、高清晰度激光視盤機、網(wǎng)

8、絡(luò)電視、視頻通信等領(lǐng)域。與MPEG-4相比,其壓縮效率明顯提高;與H.264相比,又減少了CABAC等實現(xiàn)難度大的技術(shù),從而增加了可實現(xiàn)性。一、 各種編解碼技術(shù)的分析1.1 MPEG-2(ISO/EC 13818-2)MPEG-2標準從1990年開始研究,并于1994年由國際標準化組織正式發(fā)布。它是一個直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標準。MPEG-2編碼格式主要是用于傳輸聲音、圖象數(shù)據(jù)壓縮的標準,它是MPEG-1的進一步發(fā)展,碼流在1.5Mb/s到50Mb/s之間。MPEG-2編碼格式與MPEG-1編碼格式的基本編碼算法都相同,但在MPEG-1的基礎(chǔ)上增加了許多新的功能,例如增加

9、了隔行掃描電視的編碼,提供了位速率的可變性能(Scalability)功能。MPEG-2要達到的最基本目標是:位速率為49 Mbit/s,最高達15 Mbit/s。MPEG-2編碼格式的數(shù)據(jù)流有兩種形式,一種稱為程序數(shù)據(jù)流(Program Stream,PS),另一種稱為傳輸數(shù)據(jù)流(Transport Stream,TS)。程序數(shù)據(jù)流是組合一個或者多個規(guī)格化的基本數(shù)據(jù)流(Packetised Elementary Streams,PES)而生成的一種數(shù)據(jù)流,用在出現(xiàn)錯誤相對比較少的環(huán)境下,適合使用軟件處理的應(yīng)用;傳輸數(shù)據(jù)流也是組合一個

10、或者多個PES而生成的一種數(shù)據(jù)流,它用在出現(xiàn)錯誤相對比較多的環(huán)境下,例如在有損失或者有噪聲的傳輸系統(tǒng)中。1.2 MPEG-4 Part 2(ISO/IEC14496-2)MPEG-4標準是國際標準化組織于1998年頒布的又一種新的編碼格式標準,其主要針對互聯(lián)網(wǎng)及無線信道的應(yīng)用,并充分考慮了不同信道傳輸條件的特點,提供了一些關(guān)鍵技術(shù)。1.2.1 編碼理念:引入基于對象的編碼方法(Object-based Coding)MPEG-4標準同以前標準的最顯著的差別在于它是采用基于對象的編碼理念,即在編碼時將1幅景物分成若干在時間和空間上相互聯(lián)系的視頻音頻對象,分別編碼后,再經(jīng)過復用傳輸?shù)浇邮斩耍缓笤?/p>

11、對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象采用不同的編碼方法和表示方法,又有利于不同數(shù)據(jù)類型間的融合,并且這樣也可以方便的實現(xiàn)對于各種對象的操作及編輯。例如,我們可以將一個卡通人物放在真實的場景中,或者將真人置于一個虛擬的演播室里,還可以在互聯(lián)網(wǎng)上方便的實現(xiàn)交互,根據(jù)自己的需要有選擇的組合各種視頻音頻以及圖形文本對象。1.2.2 數(shù)據(jù)結(jié)構(gòu):采用特殊的二進制數(shù)據(jù)結(jié)構(gòu)BIFS(Binary Format for Scenes)及XMT(Extensible Markup Text)考慮到MPEG-4面向?qū)ο蟮木幋a特點,壓縮后的數(shù)據(jù)采用一種特殊的二進制數(shù)據(jù)結(jié)構(gòu)BI

12、FS,這種數(shù)據(jù)結(jié)構(gòu)中封裝了各種媒體對象數(shù)據(jù)流以及表征這些對象間時域空域關(guān)系的信息,為不同媒體數(shù)據(jù)的復用,傳輸和重構(gòu)提供了便利。用戶可以通過和服務(wù)器間的交互,由服務(wù)器發(fā)送特殊的命令(BIFS-COMMAND)來改變各個對象的參數(shù),在重構(gòu)圖像中,我們可以改變物體的大小,物體的位置與傾角,還可以將其它圖像中的物體加到該圖像中。除了這種二進制結(jié)構(gòu),MPEG-4標準又擴展出一種新的原文數(shù)據(jù)格式XMT,即擴展標記文本(Extensible Markup Text),它能夠涵蓋其他的擴展描述語言(XML),可以通過簡單的標記來表示信息的各種含義,并且能夠被編譯成二進制數(shù)據(jù)結(jié)構(gòu)BIFS,這樣我們就可以更加方便

13、直觀的標記出各對象的信息及其相互關(guān)系。1.2.3 時域空域可調(diào)性(Spatial and Temporal Scalability)在互聯(lián)網(wǎng)及無線的應(yīng)用中,都面臨著帶寬受限的問題,為了解決這個問題,MPEG-4提供了一些措施來實現(xiàn)編碼的時域空域可調(diào)性,以便用戶根據(jù)不同的帶寬狀況及接收終端的限制來選擇不同的分辨率,這種技術(shù)廣泛應(yīng)用于多種多媒體應(yīng)用中,比如視頻數(shù)據(jù)庫瀏覽,視頻移分辨率回放等等。1.2.4 有效的抗差錯措施(Error Resilience Tools)互聯(lián)網(wǎng)傳輸面臨的一個重要問題是網(wǎng)絡(luò)阻塞和丟包,而無線傳輸中由于多徑時延與衰落以及多普勒頻移的存在,也同樣面臨著惡劣的信道條件,所以M

14、PEG-4標準制定過程中,考慮了不同的信道條件,提出了多種行之有效的抗差錯措施,例如再同步標志,可逆變長編碼,數(shù)據(jù)分割等等。1.3 H.264/AVC(即MPEG-4 Part10)H.264標準是ITU-T在日本的會議上正式通過,并于2003年5月正式公布的繼MPEG-x系列之后的又一音視頻編碼新標準。國際電信聯(lián)盟將該系統(tǒng)命名為H.264/AVC,國際標準化組織和國際電工委員會將其稱為14496-10/MPEG-4 AVC。H.264和之前的標準一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回歸基本”的簡潔設(shè)計,不用眾多的選項,獲得比H.263+好得多的壓縮性能;加強了對各種信道的適

15、應(yīng)能力,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語法,能很好的處理誤碼和丟包;應(yīng)用目標范圍較寬,可以滿足不同速率、不同解析度以及不同傳輸場合的需求。 同時,H.264提出了一個新的概念,在視頻編碼層(Video Coding Layer, VCL)和網(wǎng)絡(luò)提取層(Network Abstraction Layer, NAL)之間進行概念性分割,前者是視頻內(nèi)容的核心壓縮內(nèi)容之表述,后者是通過特定類型網(wǎng)絡(luò)進行遞送的表述,這樣的結(jié)構(gòu)便于信息的封裝和對信息進行更好的優(yōu)先級控制。 H.264標準的關(guān)鍵技術(shù)包括:1.3.1.幀內(nèi)預測編碼幀內(nèi)編碼用來縮減圖像的空間冗余。為了提高H.264幀內(nèi)編碼的效率,在給定幀中充分利用相鄰

16、宏塊的空間相關(guān)性,相鄰的宏塊通常含有相似的屬性。因此,在對一給定宏塊編碼時,首先可以根據(jù)周圍的宏塊預測,然后對預測值與實際值的差值進行編碼,這樣,相對于直接對該幀編碼而言,可以大大減小碼率。H.264提供6種模式進行4×4像素宏塊預測,包括1種直流預測和5種方向預測。H.264也支持16×16的幀內(nèi)編碼。1.3.2.幀間預測編碼幀間預測編碼利用連續(xù)幀中的時間冗余來進行運動估計和補償。H.264的運動補償支持以往的視頻編碼標準中的大部分關(guān)鍵特性,而且靈活地添加了更多的功能,除了支持P幀、B幀外,H.264還支持一種新的流間傳送幀SP幀。碼流中包含SP幀后,能在有類似內(nèi)容但有不

17、同碼率的碼流之間快速切換,同時支持隨機接入和快速回放模式。(1)不同大小和形狀的宏塊分割 對每一個16×16像素宏塊的運動補償可以采用不同的大小和形狀,H.264支持7種模式。小塊模式的運動補償為運動詳細信息的處理提高了性能,減少了方塊效應(yīng),提高了圖像的質(zhì)量。 (2)高精度的像素運動補償 在H.263中采用的是半像素精度的運動估計,而在H.264中可以采用1/4或者1/8像素精度的運動估值。在要求相同精度的情況下,H.264使用1/4或者1/8像素精度的運動估計后的殘差要比H.263采用半像素精度運動估計后的殘差來得小。這樣在相同精度下,H.264在幀間編碼中所需的碼率更小。 (3)

18、多幀預測 H.264提供可選的多幀預測功能,在幀間編碼時,可選5個不同的參考幀,提供了更好的糾錯性能,這樣更可以改善視頻圖像質(zhì)量。這一特性主要應(yīng)用于以下場合:周期性的運動、平移運動、在兩個不同的場景之間來回變換攝像機的鏡頭。 (4)去塊濾波器 H.264定義了自適應(yīng)去除塊效應(yīng)的濾波器,這可以處理預測環(huán)路中的水平和垂直塊邊緣,大大減少了方塊效應(yīng)。1.2.3.整數(shù)變換在變換方面,H.264使用了基于4×4像素塊的類似于DCT的變換,但使用的是以整數(shù)為基礎(chǔ)的空間變換,不存在反變換,因為取舍而存在誤差的問題。與浮點運算相比,整數(shù)DCT變換會引起一些額外的誤差,但因為DCT變換后的量化也存在量

19、化誤差,與之相比,整數(shù)DCT變換引起的量化誤差影響并不大。此外,整數(shù)DCT變換還具有減少運算量和復雜度,有利于向定點DSP移植的優(yōu)點。1.3.4.量化H.264中可選32種不同的量化步長,這與H.263中有31個量化步長很相似,但是在H.264中,步長是以12.5%的復合率遞進的,而不是一個固定常數(shù)。在H.264中,變換系數(shù)的讀出方式也有兩種:之字形(Zigzag)掃描和雙掃描。大多數(shù)情況下使用簡單的之字形掃描;雙掃描僅用于使用較小量化級的塊內(nèi),有助于提高編碼效率。1.3.5.熵編碼視頻編碼處理的最后一步就是熵編碼,在H.264中采用了兩種不同的熵編碼方法:通用可變長編碼(UVLC)和基于文本

20、的自適應(yīng)二進制算術(shù)編碼(CABAC)。在H.263等標準中,根據(jù)要編碼的數(shù)據(jù)類型如變換系數(shù)、運動矢量等,采用不同的VLC碼表。H.264中的UVLC碼表提供了一個簡單的方法,不管符號表述什么類型的數(shù)據(jù),都使用統(tǒng)一變字長編碼表。其優(yōu)點是簡單;缺點是單一的碼表是從概率統(tǒng)計分布模型得出的,沒有考慮編碼符號間的相關(guān)性,在中高碼率時效果不是很好。1.4 AVS音視頻編碼標準AVS是中國自主制定的音視頻編碼技術(shù)標準。AVS工作組成立于2002年6月,并于2003年12月確定AVS視頻部分。該標準以當前國際上最先進的MPEG-4 AVC/H.264框架為起點,制定適合數(shù)字視頻應(yīng)用的中國標準,其中強調(diào)自主知識

21、產(chǎn)權(quán),同時充分考慮了實現(xiàn)難度。AVS與MPEG-4 AVC/H.264標準的主要技術(shù)差異包括:1.4.1 8x8整數(shù)變換AVS采用整數(shù)8x8變換,它可以在16位處理器上無失配地實現(xiàn),從而克服了視頻壓縮編碼國際標準中采用的8x8 DCT變換存在失配的固有問題。AVS采用了64級量化,可以完全適應(yīng)不同的應(yīng)用和業(yè)務(wù)對碼率和質(zhì)量的要求。目前AVS所采用的8x8變換與量化方案大大降低了芯片的實現(xiàn)難度。1.4.2 幀內(nèi)預測參照MPEG-4 AVC/H.264幀內(nèi)預測的思路,AVS采用幀內(nèi)預測技術(shù),用相鄰塊的像素預測當前塊,同時采用代表空間域紋理方向的多種預測模式。但AVS亮度和色度幀內(nèi)預測都是以8x8塊為

22、單位的。亮度塊采用5種預測模式,色度塊采用4種預測模式,而這4種模式中又有3種和亮度塊的預測模式相同。在編碼質(zhì)量相當?shù)那疤嵯?,AVS采用較少的預測模式,使方案更加簡潔、實現(xiàn)的復雜度大為降低。1.4.3 特殊的幀間預測運動補償幀間運動補償編碼是混合編碼技術(shù)框架中最重要的部分之一。AVS標準采用了16×16,16×8,8×16和8×8的塊模式進行運動補償,而去除了MPEG-4 AVC/H.264標準中的8×4,4×8,4×4的塊模式,能更好地刻畫物體運動,提高運動搜索的準確性。實驗表明,對于高分辨率視頻,AVS選用的塊模式已經(jīng)能

23、足夠精細地表達物體的運動。較少的塊模式,能降低運動矢量和塊模式傳輸?shù)拈_銷,從而提高壓縮效率、降低編解碼實現(xiàn)的復雜度。1.4.4 1/4精度像素插值A(chǔ)VS和MPEG-4 AVC/H.264都采用了1/4像素精度的運動補償技術(shù)。MPEG-4 AVC/H.264采用6抽頭濾波器進行半像素插值并采用雙線性濾波器進行1/4像素插值。而AVS采用了不同的4抽頭濾波器進行半像素插值和1/4像素插值,在不降低性能的情況下減少插值所需要的參考像素點,減小了數(shù)據(jù)存取帶寬需求,這在高分辨率視頻壓縮應(yīng)用中是非常有意義的。 在傳統(tǒng)的視頻編碼標準(MPEG-x系列與H.26x系列)中,雙向預測幀B幀都只有一個前向參考幀與

24、一個后向參考幀,而前向預測幀P 幀則只有一個前向參考幀。而新近的MPEG-4 AVC/H.264充分地利用圖片之間的時域相關(guān)性,允許P幀和B幀有多個參考幀,最多可以有31個參考幀。多幀參考技術(shù)在提高壓縮效率的同時也將極大地增加存儲空間與數(shù)據(jù)存取的開銷。AVS中P幀可以利用至多2幀的前向參考幀,而B幀采用前后各一個參考幀,P幀與B幀(包括后向參考幀)的參考幀數(shù)相同,其參考幀存儲空間與數(shù)據(jù)存取的開銷并不比傳統(tǒng)視頻編碼的標準大,而恰恰是充分利用了必須預留的資源。 AVS的B幀雙向預測使用了直接模式(direct mode)、對稱模式(symmetric mode)和跳躍模式(skip mode)。使

25、用對稱模式時,碼流只需要傳送前向運動矢量,后向運動矢量可由前向運動矢量導出,從而節(jié)省后向運動矢量的編碼開銷。對于直接模式,前塊的前、后向運動矢量都是由后向參考圖像相應(yīng)位置塊的運動矢量導出,無需傳輸運動矢量,因此也可以節(jié)省運動矢量的編碼開銷。跳躍模式的運動矢量導出方法和直接模式的相同,跳躍模式編碼塊的運動補償?shù)臍埐钜簿鶠榱?,即該模式下宏塊只需要傳輸模式信號,而不需要傳輸運動矢量、補償殘差等附加信息。1.4.5二維熵編碼、去塊效應(yīng)環(huán)內(nèi)濾波AVS熵編碼采用自適應(yīng)變長編碼技術(shù)。在AVS熵編碼過程中,所有的語法元素和殘差數(shù)據(jù)都是以指數(shù)哥倫布碼的形式映射成二進制比特流。采用指數(shù)哥倫布碼的優(yōu)勢在于:一方面,它的硬件復雜度比較低,可以根據(jù)閉合公式解析碼字,無需查表;另一方面,它可以根據(jù)編碼元素的概率分布靈活地確定以k階指數(shù)哥倫布碼編碼,如果k選得恰當,則編碼效率可以逼近信息熵。對預測殘差的塊變換系數(shù),經(jīng)掃描形成(level、run)對串,level、run不是獨立事件,而存在著很強的相關(guān)性,在AVS中l(wèi)evel、run采用二維聯(lián)合編碼,并根據(jù)當前l(fā)evel、run的不同概率分布趨勢,自適應(yīng)改變指數(shù)哥倫布碼的階數(shù)。二、 各類編

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論