壓縮編碼技術(shù)課件_第1頁
壓縮編碼技術(shù)課件_第2頁
壓縮編碼技術(shù)課件_第3頁
壓縮編碼技術(shù)課件_第4頁
壓縮編碼技術(shù)課件_第5頁
已閱讀5頁,還剩195頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章壓縮編碼技術(shù)第2章壓縮編碼技術(shù)本章結(jié)構(gòu)壓縮編碼技術(shù)本章結(jié)構(gòu)學(xué)習(xí)目標(biāo)1.知識(shí)目標(biāo):知道流媒體數(shù)據(jù)可以壓縮的原因;了解有損編碼和無損編碼的區(qū)別;了解壓縮編碼的分類;掌握霍夫曼編碼、算術(shù)編碼、行程編碼;了解預(yù)測(cè)編碼和變換編碼的基本原理;了解MPEG-4、MPEG-7、MPEG-21編碼標(biāo)準(zhǔn);了解H.26x標(biāo)準(zhǔn),掌握MPEG-2標(biāo)準(zhǔn);了解音頻壓縮,掌握恒定比特率壓縮與可變比特率壓縮的區(qū)別。2.能力目標(biāo):能按照霍夫曼編碼、算術(shù)編碼、行程編碼的原理,寫出對(duì)數(shù)據(jù)壓縮后的結(jié)果;能對(duì)不同壓縮狀態(tài)下視音頻的數(shù)據(jù)量進(jìn)行計(jì)算。3.素質(zhì)目標(biāo):能根據(jù)不同的網(wǎng)絡(luò)條件選擇合適的編碼方法。學(xué)習(xí)目標(biāo)1.知識(shí)目標(biāo):2.1概述

2.1.1壓縮的必要性2.1.2壓縮的可行性2.1.3壓縮編碼的分類2.1.4常用的壓縮方法2.1概述2.1.1壓縮的必要性2.1.1壓縮的必要性數(shù)字壓縮技術(shù)不僅是音視頻通信的需要,也是高效利用網(wǎng)絡(luò)資源、降低用戶通信費(fèi)用的有效途徑,還是使流媒體走向?qū)嵱没年P(guān)鍵技術(shù)之一。問題:嘗試計(jì)算一個(gè)7GB的DVD視頻文件,在2Mb的理論帶寬下需要下載多少個(gè)小時(shí)?約等于8個(gè)小時(shí)2.1.1壓縮的必要性數(shù)字壓縮技術(shù)不僅是音視頻通信的需要,也2.1.2壓縮的可行性1.空間冗余2.時(shí)間冗余3.信息熵冗余4.結(jié)構(gòu)冗余5.知識(shí)冗余6.視覺冗余2.1.2壓縮的可行性1.空間冗余2.1.2壓縮的可行性1.空間冗余視頻圖像通常與它周圍的某些像素在亮度和色度上相同或非常接近,存在一定的相關(guān)性。這些相關(guān)性的光成像結(jié)果在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)的空間冗余。2.1.2壓縮的可行性1.空間冗余2.1.2壓縮的可行性2.時(shí)間冗余指活動(dòng)圖像連續(xù)的幀之間的冗余。相鄰兩幀圖像的內(nèi)容差別不大,往往背景相同,只不過移動(dòng)物體所在的空間位置略為不同,即后一幀數(shù)據(jù)與前一幀數(shù)據(jù)有諸多相同之處,這就表現(xiàn)為時(shí)間冗余。2.1.2壓縮的可行性2.時(shí)間冗余2.1.2壓縮的可行性3.信息熵冗余信息熵冗余又稱編碼冗余。信息熵是指一組數(shù)據(jù)所攜帶的信息量。而對(duì)于實(shí)際圖像數(shù)據(jù)的每個(gè)像素,很難得到它的信息熵,因此一般是對(duì)每個(gè)像素采用相同的比特?cái)?shù)來表示,這樣就必然存在冗余,這種冗余稱為信息熵冗余。2.1.2壓縮的可行性3.信息熵冗余2.1.2壓縮的可行性4.結(jié)構(gòu)冗余許多圖像存在著較強(qiáng)的紋理結(jié)構(gòu)。在圖像紋理區(qū),圖像的像素值存在著明顯的分布模式,如瓦片構(gòu)成的屋頂、方格狀的地板圖案等,如果對(duì)相似的、對(duì)稱的結(jié)構(gòu)都加以記錄,就會(huì)出現(xiàn)結(jié)構(gòu)冗余。2.1.2壓縮的可行性4.結(jié)構(gòu)冗余2.1.2壓縮的可行性5.知識(shí)冗余有許多圖像的理解與某些先驗(yàn)知識(shí)有相當(dāng)大的相關(guān)性。例如,人臉的圖像有同樣的結(jié)構(gòu):嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中線上等。這些規(guī)律的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,這類冗余稱為知識(shí)冗余。2.1.2壓縮的可行性5.知識(shí)冗余2.1.2壓縮的可行性6.視覺冗余人類視覺系統(tǒng)對(duì)亮度變化敏感,而對(duì)色度變化相對(duì)不敏感。在高亮區(qū),人眼對(duì)亮度變化敏感度下降,致使對(duì)內(nèi)部細(xì)節(jié)相對(duì)不敏感,而對(duì)整體輪廓敏感。因此,人類視覺系統(tǒng)并不是對(duì)圖像的任何變化都能感知出來,表現(xiàn)為視覺冗余。2.1.2壓縮的可行性6.視覺冗余2.1.3壓縮編碼的分類從信息論的角度出發(fā),把它分為無損壓縮和有損壓縮兩大類2.1.3壓縮編碼的分類從信息論的角度出發(fā),把它分為無損壓縮2.1.3壓縮編碼的分類

無損壓縮是利用數(shù)據(jù)的統(tǒng)計(jì)特性對(duì)圖像進(jìn)行的壓縮,即解壓縮后的圖像與原圖像相一致而不存在任何失真,但壓縮率受到數(shù)據(jù)統(tǒng)計(jì)冗余度的理論限制,一般為2:1到5:1。這類方法廣泛用于文本數(shù)據(jù)、程序和特殊應(yīng)用場(chǎng)合的圖像數(shù)據(jù)(如指紋圖像、醫(yī)學(xué)圖像)的壓縮。2.1.3壓縮編碼的分類無損壓縮是利用數(shù)據(jù)的統(tǒng)計(jì)特性對(duì)2.1.3壓縮編碼的分類有損壓縮也稱信息量壓縮方法,即解壓縮后的圖像與原圖像不一致,存在數(shù)據(jù)丟失的現(xiàn)象,并且丟失的這些數(shù)據(jù)不可恢復(fù),但可以利用人的視覺特性使解壓縮后的圖像看起來與原始圖像一樣。有損壓縮的壓縮比一般為100:1~200:1。2.1.3壓縮編碼的分類有損壓縮也稱信息量壓縮方法,即解壓2.1.4常用的壓縮方法1.無損壓縮編碼常用的無損壓縮方法有香農(nóng)-范諾(Shannon-Fano)編碼、哈夫曼(Huffman)編碼、RLE(run-lengthencoding,行程編碼)、LZW(Lempel-Ziv-Welch)編碼和算術(shù)編碼。2.1.4常用的壓縮方法2.1.4常用的壓縮方法1)香農(nóng)-范諾編碼(1)基本概念 ①熵 熵(Entropy)是度量信息量的一種方法,它通常表示事件發(fā)生的概率越大,確定性越強(qiáng),攜帶的消息量越少。信息熵:信息的基本作用就是消除人們對(duì)事物的不確定性。一個(gè)系統(tǒng)越是有序,信息熵就越低;反之,一個(gè)系統(tǒng)越是混亂,信息熵就越高。2.1.4常用的壓縮方法1)香農(nóng)-范諾編碼2.1.4常用的壓縮方法②信源S的熵

按照香農(nóng)的理論,信源S的熵定義為:

pi表示符號(hào)Si在S中出現(xiàn)的概率2.1.4常用的壓縮方法②信源S的熵pi表示符號(hào)Si在S2.1.4常用的壓縮方法(2)算法步驟—從上往下①按照符號(hào)出現(xiàn)的概率減少的順序?qū)⒋幋a的符號(hào)排成序列;②將符號(hào)分成兩組,使這兩組符號(hào)的概率之和相等或幾乎相等;③將第一組賦值為0,第二組賦值為1;④對(duì)每一組,重復(fù)步驟2的操作。2.1.4常用的壓縮方法(2)算法步驟—從上往下香農(nóng)-范諾編碼的應(yīng)用:假設(shè)有一幅80個(gè)像素組成的圖像,顏色共有8種,分別用符號(hào)A、B、C、D、E、F、G和H表示,80個(gè)像素中符號(hào)出現(xiàn)的情況如表2-1所示。香農(nóng)-范諾編碼的應(yīng)用:按照香農(nóng)理論,這幅圖像的熵為:H(S)=(20/80)log2(80/20)+(20/80)log2(80/20)+(10/80)log2(80/10)+…+(5/80)log2(80/5)=2.75這種方法采用從上到下的方法進(jìn)行編碼。最后的編碼如下圖所示:按照香農(nóng)理論,這幅圖像的熵為:具體編碼情況如下圖和表2-2所示。具體編碼情況如下圖和表2-2所示。壓縮率對(duì)比--編碼前:用3個(gè)位表示8個(gè)等級(jí)的顏色值(A~H),也就是每個(gè)像素用3位表示(000~111),編碼這幅圖像總共需要240位。--編碼后:按照這種方法進(jìn)行編碼得到的總位數(shù)為220,壓縮比約為1.09:1。壓縮率對(duì)比--編碼后:按照這種方法進(jìn)行編碼得到的總位數(shù)為22存在問題:1,同步問題,如1100與100要用特殊的間隔符來區(qū)分2,一些碼變長(zhǎng)了,如E~H,變?yōu)榱?位思考一下思考一下2.1.4常用的壓縮方法 2)霍夫曼(Haffman)編碼霍夫曼編碼是依據(jù)香農(nóng)和范諾闡述的編碼思想提出的一種不定長(zhǎng)編碼的方法,其編碼完全依據(jù)字符出現(xiàn)概率來構(gòu)造平均長(zhǎng)度最短的碼字,有時(shí)稱之為最佳編碼。

2.1.4常用的壓縮方法 2)霍夫曼(Haffman)編碼2.1.4常用的壓縮方法(1)基本方法(2)算法步驟—從下往上①按照符號(hào)出現(xiàn)的概率減少的順序?qū)⒋幋a的符號(hào)排成序列;②把概率最小的兩個(gè)符號(hào)組成一個(gè)新節(jié)點(diǎn),其概率等于原兩個(gè)符號(hào)之和;③重復(fù)2,直到形成一個(gè)節(jié)點(diǎn)為止(樹),其概率為1;④從根節(jié)點(diǎn)開始回溯到原始符號(hào),并將每個(gè)下分支賦值為1,上分支賦值為0。2.1.4常用的壓縮方法(1)基本方法2.1.4常用的壓縮方法(3)示例:霍夫曼編碼的過程字母A、B、C、D、E出現(xiàn)的概率為:p(A)=0.16、p(B)=0.51、p(C)=0.09、p(D)=0.13、p(E)=0.11。2.1.4常用的壓縮方法(3)示例:霍夫曼編碼的過程2.1.4常用的壓縮方法與香農(nóng)-范諾編碼相比:1,該方法自含同步碼,在編碼之后的碼串中不需要另外添加標(biāo)記符號(hào)(即在譯碼時(shí)分割符號(hào)的特殊代碼)。例如,碼串中的第一位為0,那么肯定是符號(hào)B,因?yàn)槠渌?hào)沒有一個(gè)是從0開始的。2,霍夫曼編碼的編碼效率比香農(nóng)-范諾編碼效率高。2.1.4常用的壓縮方法與香農(nóng)-范諾編碼相比:2.1.4常用的壓縮方法課題練習(xí):比較香農(nóng)和哈夫曼編碼,將前面的哈夫曼編碼案例進(jìn)行香農(nóng)編碼BADECACDEACDE01100110(0)(100)(101)(110)(111)香農(nóng):從上往下走;哈夫曼:從下往上走2.1.4常用的壓縮方法課題練習(xí):比較香農(nóng)和哈夫曼編碼,將2.1.4常用的壓縮方法3)算術(shù)編碼算術(shù)編碼應(yīng)用于JPEG/JBIG圖像數(shù)據(jù)壓縮,它不用二進(jìn)制代碼來表示符號(hào),而改用[0,1)中的一個(gè)寬度等于其出現(xiàn)概率的實(shí)數(shù)區(qū)間來表示一個(gè)符號(hào),符號(hào)表中的所有符號(hào)剛好布滿整個(gè)[0,1)區(qū)間(概率之和為1,不重不漏)。輸出:把輸入符號(hào)串(數(shù)據(jù)流)映射成[0,1)區(qū)間中的一個(gè)實(shí)數(shù)值。Low=low+range×rangelow(字符分配的間隔低端)High=low+range×rangehigh(字符分配的間隔高端)Range=high-low2.1.4常用的壓縮方法3)算術(shù)編碼算術(shù)編碼的過程設(shè)輸入數(shù)據(jù)為eaiou,其出現(xiàn)的概率和所設(shè)定的取值范圍如表2-3所示表2-3信源符號(hào)、概率和初始編碼間隔初始化,Low=0,high=1;從字母e開始計(jì)算,最后eaiou輸出為0.23396(下界)字符aeiou概率0.20.30.10.20.2初始編碼間隔[0,0.2][0.2,0.5][0.5,0.6][0.6,0.8][0.8,1.0]Low=low+range×rangelow(字符分配的間隔低端)High=low+range×rangehigh(字符分配的間隔高端)Range=high-low算術(shù)編碼的過程設(shè)輸入數(shù)據(jù)為eaio2.1.4常用的壓縮方法算術(shù)編碼具有以下特點(diǎn)①必預(yù)先定義概率模型;②信源符號(hào)概率接近時(shí),建議使用算術(shù)編碼,這種情況下其效率高于哈夫曼編碼;③實(shí)現(xiàn)方法相對(duì)復(fù)雜,但其編碼效率比哈夫曼編碼高5%左右,因此在JPEG擴(kuò)展系統(tǒng)中用算術(shù)編碼取代哈夫曼編碼。2.1.4常用的壓縮方法算術(shù)編碼具有以下特點(diǎn)2.1.4常用的壓縮方法4)RLE編碼RLE又稱“運(yùn)行長(zhǎng)度編碼”或“游程編碼”,是一種統(tǒng)計(jì)編碼?;驹硎牵河靡粋€(gè)符號(hào)值或串長(zhǎng)代替具有相同值的連續(xù)符號(hào)(連續(xù)符號(hào)構(gòu)成了一段連續(xù)的“行程”,行程編碼因此而得名),使符號(hào)長(zhǎng)度少于原始數(shù)據(jù)的長(zhǎng)度。2.1.4常用的壓縮方法4)RLE編碼“5555557777733322221llllll”RLE編碼為:(5,6)(7,5)(3,3)(2,4)(l,7)“5555557777733322221llllll”2.1.4常用的壓縮方法2.預(yù)測(cè)編碼預(yù)測(cè)編碼主要消除圖像的時(shí)間冗余度。常用的預(yù)測(cè)編碼方法包括DPCM(differentialpulsecodemodulation,差分脈沖編碼調(diào)制)、ADPCM(adaptivedifferencepulsecodemodulation,自適應(yīng)差分預(yù)測(cè)編碼)和幀間預(yù)測(cè)編碼。2.1.4常用的壓縮方法2.預(yù)測(cè)編碼2.1.4常用的壓縮方法1)DPCMDPCM的思想是:依據(jù)過去的樣本去估算下一個(gè)樣本信號(hào)的幅度大小,這個(gè)值稱為預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)。2.1.4常用的壓縮方法1)DPCM2.1.4常用的壓縮方法DPCM的工作過程如圖2-5所示。2.1.4常用的壓縮方法DPCM的工作過程如圖2-5所示。2.1.4常用的壓縮方法2)ADPCMADPCM就是預(yù)測(cè)器和量化器的參數(shù)能根據(jù)圖像不同位置的具體特點(diǎn)進(jìn)行自動(dòng)調(diào)節(jié),從而匹配圖像的局部變化,具有更大的靈活性,并獲得進(jìn)一步的壓縮效果或提高壓縮質(zhì)量。2.1.4常用的壓縮方法2)ADPCM2.1.4常用的壓縮方法2.1.4常用的壓縮方法2.1.4常用的壓縮方法3)幀間預(yù)測(cè)編碼幀間預(yù)測(cè)編碼是利用視頻圖像幀間的相關(guān)性,即時(shí)間相關(guān)性,來達(dá)到圖像壓縮的目的,即不直接傳送當(dāng)前幀的像素值,而是傳送當(dāng)前幀與其前一幀或后一幀之間的差值。2.1.4常用的壓縮方法3)幀間預(yù)測(cè)編碼2.1.4常用的壓縮方法3.變換編碼變換編碼就是將圖像時(shí)域信號(hào)(時(shí)間)變換到頻域信號(hào)(頻率)或者將原始數(shù)據(jù)“變換”到另一個(gè)更為緊湊的表示空間,消除空間冗余,進(jìn)行壓縮編碼的方法。2.1.4常用的壓縮方法3.變換編碼1)DCT(離散余弦變換)DCT編碼的基本思想是:源圖像在輸入到編碼器之前,被分割成一系列按順序排列的8×8像素的圖像塊,同時(shí)把作為原始采樣數(shù)據(jù)的無符號(hào)整數(shù)轉(zhuǎn)換成有符號(hào)整數(shù),這一過程叫正交變換。有序1)DCT(離散余弦變換)有序壓縮編碼技術(shù)課件壓縮編碼技術(shù)課件2.1.4常用的壓縮方法2)小波變換編碼小波變換用于圖像編碼的基本思想就是把圖像進(jìn)行多分辨率分解,分解成不同空間、不同頻率的子圖像,然后再對(duì)子圖像進(jìn)行系數(shù)編碼。2.1.4常用的壓縮方法2)小波變換編碼2.1.4常用的壓縮方法4.其他編碼方法1)子帶編碼子帶編碼就是利用數(shù)字濾波器將輸入的數(shù)字信號(hào)分解成頻域不相關(guān)的、具有不同能量成分的頻帶,然后根據(jù)各頻帶的特性進(jìn)行量化、編碼。2.1.4常用的壓縮方法4.其他編碼方法2.1.4常用的壓縮方法2)模型編碼模型編碼是利用計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)的知識(shí)對(duì)圖像信號(hào)的分析與合成。模型編碼中比較典型的是分形編碼。

2.1.4常用的壓縮方法2)模型編碼2.1.4常用的壓縮方法3)矢量量化編碼量化編碼按一次量化的碼元個(gè)數(shù),可分為標(biāo)量量化和矢量量化。標(biāo)量量化就是對(duì)數(shù)字化后的數(shù)據(jù)一個(gè)一個(gè)地量化,而矢量量化就是將這些數(shù)據(jù)分組,每組m個(gè)數(shù)構(gòu)成m維矢量,再以矢量為單元逐個(gè)進(jìn)行量化。2.1.4常用的壓縮方法3)矢量量化編碼2.1.4常用的壓縮方法4)混合編碼混合編碼就是同時(shí)采用多種編碼方法所形成的編碼。例如,將變換編碼和預(yù)測(cè)編碼結(jié)合起來所形成的MPEG編碼。2.1.4常用的壓縮方法4)混合編碼2.2網(wǎng)絡(luò)視頻壓縮編碼的標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)2.2.2H.26X標(biāo)準(zhǔn)2.2網(wǎng)絡(luò)視頻壓縮編碼的標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)1.MPEG概述1)MPEG系統(tǒng)的組成MPEG系統(tǒng)主要由以下部分組成:(1)MPEG系統(tǒng),定義音頻、視頻及有關(guān)數(shù)據(jù)的同步;(2)MPEG視頻,定義視頻數(shù)據(jù)的編碼和重建圖像所需的解碼過程.(3)MPEG音頻,定義音頻數(shù)據(jù)的編碼和解碼;(4)一致性測(cè)試。2.2.1MPEG標(biāo)準(zhǔn)1.MPEG概述2.1.3壓縮編碼的分類2)MPEG視頻編碼技術(shù)MPEG對(duì)視頻壓縮編碼采用兩種基本技術(shù):一種是基于塊的運(yùn)動(dòng)補(bǔ)償技術(shù),以減少時(shí)間冗余;另一種是基于DCT變換的ADCT(adaptiveDCT,自適應(yīng)余弦變換),以減少空間冗余。2.1.3壓縮編碼的分類2)MPEG視頻編碼技術(shù)2.2.1MPEG標(biāo)準(zhǔn)3)MPEG的視頻數(shù)據(jù)流結(jié)構(gòu)MPEG的視頻數(shù)據(jù)流采用分層結(jié)構(gòu),包括序列層、圖像組層、圖像層、片層、宏塊層、塊層等六個(gè)層次。2.2.1MPEG標(biāo)準(zhǔn)3)MPEG的視頻數(shù)據(jù)流結(jié)構(gòu)2.2.1MPEG標(biāo)準(zhǔn)宏塊的3個(gè)類型和結(jié)構(gòu):4:2:04:2:24:4:42.2.1MPEG標(biāo)準(zhǔn)宏塊的3個(gè)類型和結(jié)構(gòu):4:2:04:2.2.1MPEG標(biāo)準(zhǔn)4)MPEG的運(yùn)動(dòng)圖像類型I幀:I幀是幀內(nèi)壓縮,由于I幀不依賴于其他幀,因而是隨機(jī)存取的入點(diǎn),也是解碼中的基準(zhǔn)幀。P幀:用最近的前一個(gè)I幀或P幀預(yù)測(cè)編碼得到(前向預(yù)測(cè)),使用運(yùn)動(dòng)補(bǔ)償算法進(jìn)行壓縮,因而壓縮比要比I幀高,數(shù)據(jù)量平均達(dá)到I幀的1/3左右。P幀是對(duì)前后的B幀和后繼的P幀進(jìn)行解碼的基準(zhǔn)幀。2.2.1MPEG標(biāo)準(zhǔn)4)MPEG的運(yùn)動(dòng)圖像類型2.2.1MPEG標(biāo)準(zhǔn)B幀:B幀基于前后的兩個(gè)I、P幀或P、P幀,它使用雙向預(yù)測(cè),數(shù)據(jù)量平均可以達(dá)到I幀的1/9左右。B幀本身不作為基準(zhǔn),因此可以提供更高的壓縮比。2.2.1MPEG標(biāo)準(zhǔn)B幀:B幀基于前后的兩個(gè)I、P幀或P2.2.1MPEG標(biāo)準(zhǔn)5)運(yùn)動(dòng)補(bǔ)償技術(shù)運(yùn)動(dòng)補(bǔ)償技術(shù)的主要原理是依據(jù)圖像的運(yùn)動(dòng)情況,把圖像分割成靜止部分和運(yùn)動(dòng)部分,并分別進(jìn)行處理。靜止部分可以重復(fù)使用上一幀的數(shù)據(jù),而對(duì)運(yùn)動(dòng)部分則設(shè)法確定其位移量,以位移量來幫助進(jìn)行運(yùn)動(dòng)部分的預(yù)測(cè),即進(jìn)行補(bǔ)償,之后再進(jìn)行幀間預(yù)測(cè)。2.2.1MPEG標(biāo)準(zhǔn)5)運(yùn)動(dòng)補(bǔ)償技術(shù)2.2.1MPEG標(biāo)準(zhǔn)2.MPEG-1

標(biāo)準(zhǔn)MPEG-1標(biāo)準(zhǔn)的主要任務(wù)是將視頻信號(hào)及其伴音以可接收的重建質(zhì)量壓縮到約1.5Mbit/s的碼率,并復(fù)合成一個(gè)單一的MPEG位流,同時(shí)保證視頻和音頻的同步。2.2.1MPEG標(biāo)準(zhǔn)2.MPEG-1

標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)

1)MPEG-1系統(tǒng)MPEG-1系統(tǒng)規(guī)定了有關(guān)同步和多路復(fù)合的技術(shù),用來把數(shù)字視頻圖像和伴音復(fù)合成單一的、位速率為l.5Mbit/s的數(shù)據(jù)位流。2.2.1MPEG標(biāo)準(zhǔn)1)MPEG-1系統(tǒng)2.2.1MPEG標(biāo)準(zhǔn)2)MPEG-1視頻MPEG-1視頻是MPEG-1標(biāo)準(zhǔn)的核心,是為了適應(yīng)在數(shù)字存儲(chǔ)媒體如CD-ROM(數(shù)據(jù)傳輸率不低于150KB/s,容量不低于650MB)上有效地存取視頻圖像而制定的標(biāo)準(zhǔn)。2.2.1MPEG標(biāo)準(zhǔn)2)MPEG-1視頻2.2.1MPEG標(biāo)準(zhǔn)3.MPEG-2標(biāo)準(zhǔn)(1)MPEG-2系統(tǒng)MPEG-2標(biāo)準(zhǔn)的系統(tǒng)功能是將一個(gè)或更多的音頻、視頻或其他的基本數(shù)據(jù)流合成單個(gè)或多個(gè)數(shù)據(jù)流,以適應(yīng)存儲(chǔ)和傳送。適合用于廣播級(jí)的數(shù)字視頻信息編碼的存儲(chǔ)和發(fā)送,被認(rèn)定為SDTV和HDTV的編碼標(biāo)準(zhǔn)。其編碼率從3-100Mbps可變。MPEG-2還專門規(guī)定了多套節(jié)目的復(fù)用分接方式,可用于VOD系統(tǒng)。2.2.1MPEG標(biāo)準(zhǔn)3.MPEG-2標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)4.MPEG-4標(biāo)準(zhǔn)1)MPEG-4的特點(diǎn)(1)基于內(nèi)容的交互性允許用戶加入其中,進(jìn)行交互。MPEG-4提供了多媒體數(shù)據(jù)訪問工具,用戶可索引、上傳、建立鏈接、下載、編輯和刪除等。用戶可方便地選擇所需內(nèi)容,并提供位流編輯功能。應(yīng)用于交互式家庭購(gòu)物和特效的數(shù)字化效果。(2)高效的壓縮性

壓縮比高,三維游戲、電影的多聲道或多視角數(shù)據(jù)同步壓縮(3)通用的訪問性可分級(jí);支持不同帶寬的傳輸信道和不同存儲(chǔ)容量的接收端2.2.1MPEG標(biāo)準(zhǔn)4.MPEG-4標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)2)MPEG-4視頻編碼核心思想在制定MPEG-4之前,MPEG-1、MPEG-2、H.261、H.263都是采用第一代壓縮編碼技術(shù),著眼于圖像信號(hào)的統(tǒng)計(jì)特性來設(shè)計(jì)編碼器,屬于波形編碼的范疇。第一代壓縮編碼方案把視頻序列按時(shí)間先后分為一系列幀,每一幀圖像又分成宏塊以進(jìn)行運(yùn)動(dòng)補(bǔ)償和編碼,這種編碼方案存在以下缺陷:2.2.1MPEG標(biāo)準(zhǔn)2)MPEG-4視頻編碼核心思想2.2.1MPEG標(biāo)準(zhǔn)(1)將圖像固定地分成相同大小的塊,在高壓縮比的情況下會(huì)出現(xiàn)嚴(yán)重的塊效應(yīng),即馬賽克效應(yīng);(2)不能對(duì)圖像內(nèi)容進(jìn)行訪問、編輯和回放等操作;(3)未充分利用HVS(humanvisualsystem,人類視覺系統(tǒng))的特性。HVS,從圖像傳輸?shù)妮喞图y理思路出發(fā),先顯示模糊的輪廓再補(bǔ)充細(xì)節(jié)2.2.1MPEG標(biāo)準(zhǔn)(1)將圖像固定地分成相同大小的塊,2.2.1MPEG標(biāo)準(zhǔn)3)關(guān)鍵技術(shù)

(1)音視頻對(duì)象(AVO,audiovisualobject)提取技術(shù)(2)VOP(視頻對(duì)象平面)視頻編碼技術(shù)(3)視頻編碼可分級(jí)性技術(shù)(4)運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償技術(shù)(5)Sprite視頻編碼技術(shù)Sprite背景圖像2.2.1MPEG標(biāo)準(zhǔn)3)關(guān)鍵技術(shù)Sprite背景圖像2.2.1MPEG標(biāo)準(zhǔn)4)MPEG-4標(biāo)準(zhǔn)的構(gòu)成(1)DMIF(deliverymultimediaintegrationframework,多媒體傳輸集成框架)。(2)場(chǎng)景描述。主要用于描述單個(gè)AVO如何在一個(gè)具體AV場(chǎng)景坐標(biāo)下的組織與同步等問題。(3)音頻編碼。MPEG-4的音頻部分將音頻的合成編碼和自然聲音的編碼相結(jié)合,并支持音頻的對(duì)象特征,支持MIDI和TTS技術(shù)。(4)視頻編碼。MPEG-4也支持對(duì)自然和合成的視覺對(duì)象的編碼,合成的視覺對(duì)象包括2D、3D動(dòng)畫和人面部表情動(dòng)畫等。(5)緩沖區(qū)管理和實(shí)時(shí)解碼。MPEG-4定義了一個(gè)系統(tǒng)解碼模式(SDM),該模式描述了一種理想的處理比特流句法語義的解碼裝置,它要求特殊的緩沖區(qū)和實(shí)時(shí)模式。2.2.1MPEG標(biāo)準(zhǔn)4)MPEG-4標(biāo)準(zhǔn)的構(gòu)成2.2.1MPEG標(biāo)準(zhǔn)5.MPEG-7標(biāo)準(zhǔn)1)MPEG-7標(biāo)準(zhǔn)的研究范圍MPEG-7標(biāo)準(zhǔn)的主要目標(biāo)是建立對(duì)多媒體內(nèi)容的描述標(biāo)準(zhǔn),這里的多媒體內(nèi)容是指圖形、圖像、3D模型、音頻、語音、視頻以及由它們組合在一起所形成的多媒體信息。2)MPEG7標(biāo)準(zhǔn)的描述框架MPEG-7提供了一個(gè)通用的、靈活的和可擴(kuò)展的多媒體內(nèi)容描述框架,它由D(descriptor,描述符)、DS(descriptionscheme,描述方案)、DDL(descriptiondefinitionlanguage,描述定義語言)和對(duì)這些描述進(jìn)行編碼的方法和工具組成。2.2.1MPEG標(biāo)準(zhǔn)5.MPEG-7標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)3)MPEG-7多媒體描述方案MPEG-7多媒體描述方案是描述和注釋多媒體內(nèi)容的元數(shù)據(jù)結(jié)構(gòu),包括通用特征和多媒體描述的描述符和描述方案。4)MPEG-7系統(tǒng)部分MPEG-7系統(tǒng)部分要保證MPEG-7各種描述能夠被快速傳送和存取,并且要保證內(nèi)容與描述之間的同步性,同時(shí)管理和保護(hù)知識(shí)產(chǎn)權(quán)問題。2.2.1MPEG標(biāo)準(zhǔn)3)MPEG-7多媒體描述方案2.2.1MPEG標(biāo)準(zhǔn)5)MPEG-7視頻MPEG-7具體對(duì)視頻方面的描述符和描述方案有以下方面的要求:特征類型。視覺描述允許以下特征:顏色、視覺對(duì)象、紋理、輪廓、形狀、靜止和動(dòng)態(tài)圖像、體積、空間關(guān)系、運(yùn)動(dòng)、變形、視覺對(duì)象的源和它的特性、模型。2.2.1MPEG標(biāo)準(zhǔn)5)MPEG-7視頻2.2.1MPEG標(biāo)準(zhǔn)6)MPEG-7的應(yīng)用MPEG-7可以進(jìn)行檢索/定位(Pull)應(yīng)用和過濾(push)應(yīng)用。同時(shí)MPEG-7可以應(yīng)用在實(shí)時(shí)也可以在非實(shí)時(shí)環(huán)境中。2.2.1MPEG標(biāo)準(zhǔn)6)MPEG-7的應(yīng)用2.2.1MPEG標(biāo)準(zhǔn)6.MPEG-21標(biāo)準(zhǔn)MPEG-21標(biāo)準(zhǔn)其實(shí)就是一些關(guān)鍵技術(shù)的集成,通過這種集成環(huán)境就對(duì)全球數(shù)字媒體資源進(jìn)行透明型和增強(qiáng)型管理,實(shí)現(xiàn)內(nèi)容描述、創(chuàng)建、發(fā)布、使用、識(shí)別、收費(fèi)管理、產(chǎn)權(quán)保護(hù)、用戶隱私權(quán)保護(hù)、終端和網(wǎng)絡(luò)資源抽取、事件報(bào)告等功能。2.2.1MPEG標(biāo)準(zhǔn)6.MPEG-21標(biāo)準(zhǔn)2.2.2H.26X標(biāo)準(zhǔn)1.H.261標(biāo)準(zhǔn)H.261標(biāo)準(zhǔn)主要應(yīng)用在ISDN(integratedservicesdigitalnetwork,綜合業(yè)務(wù)數(shù)字網(wǎng))上傳輸電視電話會(huì)議等低碼率的多媒體領(lǐng)域。2.2.2H.26X標(biāo)準(zhǔn)1.H.261標(biāo)準(zhǔn)2.2.2H.26X標(biāo)準(zhǔn)2)壓縮數(shù)據(jù)的分層為了有序地傳輸每幀圖像的數(shù)據(jù),并有利于圖像數(shù)據(jù)交換和與設(shè)備兼容,把一幀圖像數(shù)據(jù)分成幀、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理,如圖2-18所示。2.2.2H.26X標(biāo)準(zhǔn)2)壓縮數(shù)據(jù)的分層2.2.2H.26X標(biāo)準(zhǔn)3)編碼算法H.261編碼算法類似于MPEG算法,但與后者不兼容。它在實(shí)時(shí)編碼時(shí)所占用的CPU運(yùn)算量比MPEG少得多,原因在于采用了圖像質(zhì)量與運(yùn)動(dòng)幅度相平衡的折衷機(jī)制(也就是說,劇烈運(yùn)動(dòng)的圖像比相對(duì)靜止的圖像質(zhì)量要差),優(yōu)化了帶寬占用量。因此,這種方法屬于恒定碼流可變質(zhì)量編碼。2.2.2H.26X標(biāo)準(zhǔn)3)編碼算法2.2.2H.26X標(biāo)準(zhǔn)2.H.263標(biāo)準(zhǔn)H.263標(biāo)準(zhǔn)是替代H.261的一個(gè)ITU-T標(biāo)準(zhǔn)。1)編碼模式H.263推薦了以下四種幀內(nèi)編碼模式,這些可被分開使用或一起用。一個(gè)例外是先進(jìn)的預(yù)測(cè)模式需要使用無限制的運(yùn)動(dòng)矢量模式。(1)基于句法的算術(shù)編碼模式基于語法的算術(shù)編碼是一種效率較高的自適應(yīng)算術(shù)編碼,用它來代替哈夫曼編碼,使得具有相同恢復(fù)能力的圖像具有更好的壓縮效率。2.2.2H.26X標(biāo)準(zhǔn)2.H.263標(biāo)準(zhǔn)2.2.2H.26X標(biāo)準(zhǔn)(2)PB-幀模式一個(gè)PB幀對(duì)兩幀圖像進(jìn)行統(tǒng)一編碼一個(gè)PB幀包含一個(gè)由前面的P幀圖像預(yù)測(cè)得出的P幀和一個(gè)由前一個(gè)P幀和當(dāng)前解碼的P幀共同預(yù)測(cè)得出的B幀。B幀的得名是由于B幀的許多部分都需要從前面的幀和將來的幀進(jìn)行雙向預(yù)測(cè)共同得到。使用這種模式可以在比特率增加幅度很小的情況下大幅度增加幀頻。2.2.2H.26X標(biāo)準(zhǔn)(2)PB-幀模式2.2.2H.26X標(biāo)準(zhǔn)(3)無限制的運(yùn)動(dòng)矢量模式它為運(yùn)動(dòng)矢量指出圖像外部邊界,這對(duì)運(yùn)動(dòng)方向在邊沿的小圖像運(yùn)動(dòng)特別有用。當(dāng)運(yùn)動(dòng)跨越圖像邊界時(shí),由運(yùn)動(dòng)矢量所確定的宏塊位置可能有一部分落在邊界之外,此時(shí)可以用邊界上的像素值表示界外的像素值,從而降低預(yù)測(cè)誤差。(4)先進(jìn)預(yù)測(cè)模式P-幀亮度使用交疊的塊運(yùn)動(dòng)補(bǔ)償技術(shù),每個(gè)宏塊編碼器能使用一個(gè)16×16矢量或4個(gè)8×8矢量。使用比較小的矢量需要更多的位元但能產(chǎn)生更好的預(yù)測(cè)。2.2.2H.26X標(biāo)準(zhǔn)(3)無限制的運(yùn)動(dòng)矢量模式2.2.2H.26X標(biāo)準(zhǔn)2)H.263標(biāo)準(zhǔn)的改進(jìn)ITU-T在H.263發(fā)布后又進(jìn)行了修訂,非正式地命名為H.263+標(biāo)準(zhǔn)。H.263+在保證原H.263標(biāo)準(zhǔn)核心語法和語義不變的基礎(chǔ)上,提供了12個(gè)新的可協(xié)商模式和其他特征,進(jìn)一步提高了壓縮編碼性能和增強(qiáng)了應(yīng)用的靈活性。為提高壓縮效率,H.263+采用先進(jìn)的幀內(nèi)編碼模式,增強(qiáng)的PB-幀模式改進(jìn)了H.263的不足,增強(qiáng)了幀間預(yù)測(cè)的效果;去塊效應(yīng)濾波器不僅提高了壓縮效率,而且提供重建圖像的主觀質(zhì)量。另一重要的改進(jìn)是可擴(kuò)展性,它允許多顯示率、多速率及多分辨率,增強(qiáng)了視頻信息在易誤碼、易丟包異構(gòu)網(wǎng)絡(luò)環(huán)境下的傳輸。2.2.2H.26X標(biāo)準(zhǔn)2)H.263標(biāo)準(zhǔn)的改進(jìn)2.2.2H.26X標(biāo)準(zhǔn)3.H.264標(biāo)準(zhǔn)H.264是ITU-T的VCEG和ISO/IEC的MPEG的聯(lián)合視頻組開發(fā)的一個(gè)新的數(shù)字視頻編碼標(biāo)準(zhǔn),它既是ITU-T的H.264標(biāo)準(zhǔn),又是ISO/IECRMPEG-4的第10部分。H.264集中體現(xiàn)了當(dāng)今國(guó)際視頻編碼解碼技術(shù)的最新成果。在相同的重建圖像質(zhì)量下,H.264比其他視頻壓縮編碼具有更高的壓縮比、更好的IP和無線網(wǎng)絡(luò)信道適應(yīng)性。2.2.2H.26X標(biāo)準(zhǔn)3.H.264標(biāo)準(zhǔn)2.2.2H.26X標(biāo)準(zhǔn)1)分層設(shè)計(jì)2)高精度、多模式運(yùn)動(dòng)估計(jì)3)4×4塊的整數(shù)變換4)UVLC5)幀內(nèi)預(yù)測(cè)6)面向IP和無線環(huán)境2.2.2H.26X標(biāo)準(zhǔn)1)分層設(shè)計(jì)2.3視頻壓縮中的音頻編碼2.3.1音頻信號(hào)的數(shù)字化2.3.2MP3音頻壓縮編碼2.3視頻壓縮中的音頻編碼2.3.1音頻信號(hào)的數(shù)字化2.3.1音頻信號(hào)的數(shù)字化1.采樣模擬音頻信號(hào)作為連續(xù)信號(hào),可用連續(xù)時(shí)間函數(shù)表示x(t)。數(shù)字化時(shí),必須先對(duì)這種連續(xù)信號(hào)進(jìn)行采樣,即按一定的時(shí)間間隔(T)取值,得到x(nT)(n為整數(shù))。T稱采樣周期,1/T稱為采樣頻率,x(nT)是離散信號(hào)2.3.1音頻信號(hào)的數(shù)字化1.采樣2.3.1音頻信號(hào)的數(shù)字化2.量化量化的過程如下:量化器先將整個(gè)幅度劃分成為有限個(gè)小幅度(量化間隔)的集合,把落入某個(gè)間隔內(nèi)的樣值歸為一類,并賦予相同的量化值,用多位二進(jìn)制表示。量化間隔的數(shù)目,稱為量化級(jí)。量化過程存在量化誤差,在還原信號(hào)的D/A轉(zhuǎn)換后,這種誤差作為噪聲再生,稱為量化噪聲。量化級(jí)數(shù)越多,量化誤差就越小,質(zhì)量就越好。2.3.1音頻信號(hào)的數(shù)字化2.量化2.3.1音頻信號(hào)的數(shù)字化例如,用44.1kHz的采樣頻率進(jìn)行采樣,量化位數(shù)選用16位,則錄制1s的兩聲道立體聲節(jié)目,其波形文件大小為多少字節(jié)(byte)?44100*16*2*1/8=176400(B)2.3.1音頻信號(hào)的數(shù)字化例如,用44.1kHz的采樣頻率進(jìn)2.3.1音頻信號(hào)的數(shù)字化3.編碼編碼是根據(jù)一定的協(xié)議或格式把模擬信息轉(zhuǎn)換成二進(jìn)制比特流的過程。多媒體信息數(shù)字化的過程中,最簡(jiǎn)單的編碼方式就是直接用量化后的二進(jìn)制數(shù)作為輸出的數(shù)字信號(hào),這種編碼方式也就是PCM編碼。2.3.1音頻信號(hào)的數(shù)字化3.編碼2.3.2MP3音頻壓縮編碼Mp3(MPEG-1layer3,MPEG-1的第3層)是目前最常用的音頻壓縮編碼標(biāo)準(zhǔn)之一。它結(jié)合了MUSICAM(掩蔽型通用子帶綜合編碼和復(fù)用)和ASPEC(自適應(yīng)譜分析聽覺熵編碼)兩種算法,壓縮比達(dá)10:1~12:1,能在低碼率下保證音頻的高品質(zhì),因而在網(wǎng)絡(luò)視頻中常用來對(duì)音頻信號(hào)進(jìn)行編碼。2.3.2MP3音頻壓縮編碼Mp3(MPEG-1laye2.3.2MP3音頻壓縮編碼MP3采用每聲道64kbit/s,用混合濾波器組提高頻率分辨率,按信號(hào)分辨率分成6×32或18×32個(gè)子帶,克服了平均32個(gè)子帶的MP1、MP2在中低頻段分辨率偏低的缺點(diǎn)。MP3采用心理聲學(xué)模型(即基于感知的模型)Ⅱ,增設(shè)非均勻量化器,量化值進(jìn)行熵編碼,整個(gè)過程如圖2-19所示。2.3.2MP3音頻壓縮編碼MP3采用每聲道64kbit/2.3.2MP3音頻壓縮編碼2.3.2MP3音頻壓縮編碼2.3.2MP3音頻壓縮編碼1.混合濾波器組混合濾波器組包括子帶濾波器組和MDCT(改進(jìn)的DCT)兩部分。子帶濾波器組編碼完成樣本信號(hào)從時(shí)域到頻域的映射,并將規(guī)定的音頻信號(hào)通過帶通濾波器組分解成32個(gè)子帶輸出。子帶濾波器組輸出的32個(gè)子帶時(shí)等帶寬的,而由心理聲學(xué)模型得出的臨界帶寬則不是等帶寬的,所以為了使得進(jìn)行編碼的各個(gè)比例因子帶與臨界頻帶相匹配,需要對(duì)每個(gè)子帶信號(hào)做MDCT變換。將子帶濾波器組的輸出送到MDCT濾波器組后,每組將細(xì)分為18條頻線,共產(chǎn)生576條頻線。2.3.2MP3音頻壓縮編碼1.混合濾波器組2.3.2MP3音頻壓縮編碼2.非均勻量化

MP3采用的是非均勻量化,或者說是一種非線性的量化關(guān)系,具體采用以下公式:

ix(i)=nint((xr(i)/quant)0.75?0.0946)其中,ix(i)

=第i個(gè)量化的絕對(duì)值,nint指四舍五入地取整數(shù),xr(i)=第i頻率線的絕對(duì)值,quant=實(shí)際的量化器臺(tái)階大小。2.3.2MP3音頻壓縮編碼2.非均勻量化2.3.2MP3音頻壓縮編碼3.編碼量化后信息的編碼有幾種不同的編碼方法。高頻的一串零值用行程編碼,沒超過1的下個(gè)區(qū)域使用四維哈夫曼編碼,其余的大值區(qū)域采用二維哈夫曼編碼方案,而且可選擇地分為三個(gè)亞區(qū),每個(gè)有獨(dú)立選擇的哈夫曼碼表。通過每個(gè)亞區(qū)單獨(dú)的自適應(yīng)碼表,增強(qiáng)了編碼效率,而且同時(shí)降低了對(duì)傳輸誤碼的敏感度。第3層中使用的最大碼表是16×16條目,大值采用ESC機(jī)制來編碼。2.3.2MP3音頻壓縮編碼3.編碼2.3.2MP3音頻壓縮編碼4.比特流組裝比特流組裝在兩個(gè)嵌套的循環(huán)內(nèi)完成頻率線的量化和編碼。在第一個(gè)循環(huán)內(nèi),調(diào)整全部的量化器臺(tái)階大小,以確保編碼信息所需的數(shù)據(jù)量不超過每塊的有效比特?cái)?shù)。在第二個(gè)循環(huán)(外循環(huán)),計(jì)算結(jié)果用以評(píng)估施加了掩蔽條件的心理聲學(xué)要求。這是一個(gè)分析/合成的過程,比較實(shí)際的量化噪聲和先前計(jì)算的掩蔽門限以及對(duì)每個(gè)比例因子通帶采取單獨(dú)的加權(quán)因子。2.3.2MP3音頻壓縮編碼4.比特流組裝2.3.2MP3音頻壓縮編碼5.碼流結(jié)構(gòu)每幀1152個(gè)時(shí)域樣值,并分為每組576個(gè)樣值的兩組。幀頭(MPEG音頻的所有層都使用)后跟著的是所有組的公共邊信息,隨后是組的邊信息塊,所有的模式中它們都是恒定長(zhǎng)度(每個(gè)59比特)。每組的主信息長(zhǎng)度明確地包含在邊信息中,這樣就很容易對(duì)位于每一塊最后的輔助信息尋址。邊信息總長(zhǎng)度以及主信息長(zhǎng)度通常是字節(jié)的整數(shù)倍。2.3.2MP3音頻壓縮編碼5.碼流結(jié)構(gòu)2.4網(wǎng)絡(luò)視頻的壓縮編碼策略2.4.1選擇正確的編碼設(shè)置2.4.2編碼方式2.4網(wǎng)絡(luò)視頻的壓縮編碼策略2.4.1選擇正確的編碼設(shè)置2.4.1選擇正確的編碼設(shè)置1.編碼要符合用戶的網(wǎng)絡(luò)帶寬2.要根據(jù)實(shí)際應(yīng)用選擇碼率3.要根據(jù)應(yīng)用形式選擇編碼方式4.要根據(jù)網(wǎng)站的管理需求選擇編碼方式2.4.1選擇正確的編碼設(shè)置1.編碼要符合用戶的網(wǎng)絡(luò)帶寬2.4.2編碼方式1.CBR(恒定比特率)編碼使用CBR編碼時(shí),比特率在流的進(jìn)行過程中基本保持恒定并且接近目標(biāo)比特率,始終處于由緩沖區(qū)大小確定的時(shí)間窗內(nèi)。CBR編碼的缺點(diǎn)在于編碼內(nèi)容的質(zhì)量不穩(wěn)定。因?yàn)閮?nèi)容的某些片段要比其他片段更難壓縮,所以CBR流的某些部分質(zhì)量就比其他部分差。此外,CBR編碼會(huì)導(dǎo)致相鄰流的質(zhì)量不同。通常在較低比特率下,質(zhì)量的變化會(huì)更加明顯。2.4.2編碼方式1.CBR(恒定比特率)編碼2.4.2編碼方式2.VBR(可變碼率)編碼VBR編碼是很有優(yōu)勢(shì)的:使用VBR編碼時(shí),復(fù)雜的內(nèi)容(例如新聞播音)不會(huì)受益于VBR編碼。對(duì)混合內(nèi)容使用VBR編碼時(shí),在文件大小相同的條件下,VBR編碼的輸出結(jié)果要比CBR編碼的輸出結(jié)果質(zhì)量好得多。在某些情況下,與CBR編碼文件質(zhì)量相同的VBR編碼文件,其大小可能只有前者的一半。2.4.2編碼方式2.VBR(可變碼率)編碼2.4.2編碼方式3.兩次通過編碼對(duì)于一次通過編碼,內(nèi)容通過編碼器的次數(shù)只有一次,并且在遇到內(nèi)容時(shí)即進(jìn)行壓縮。而對(duì)于兩次通過編碼,則在第一次通過時(shí)分析內(nèi)容,然后在第二次通過時(shí)根據(jù)第一次通過時(shí)收集的數(shù)據(jù)進(jìn)行編碼。兩次通過編碼可以生成質(zhì)量更好的內(nèi)容。2.4.2編碼方式3.兩次通過編碼2.4.2編碼方式4.智能流技術(shù)視頻提供商為用戶提供服務(wù)的方法有兩種。一種方法是創(chuàng)建多個(gè)不同連接速率的文件,服務(wù)器依據(jù)用戶連接狀況發(fā)送相應(yīng)文件,但這會(huì)帶來制作和管理上的困難,而且用戶連接狀況是動(dòng)態(tài)變化的,服務(wù)器也無法實(shí)時(shí)協(xié)調(diào)。另一種方法是采用智能流技術(shù)(SureStream)。2.4.2編碼方式4.智能流技術(shù)2.5拓展學(xué)習(xí)王春海.網(wǎng)絡(luò)視頻技術(shù)及應(yīng)用標(biāo)準(zhǔn)教程:第1章網(wǎng)絡(luò)視頻服務(wù)基礎(chǔ),人民郵電出版社,2002。百度百科/view/189681.htm?fr=ala0

胡國(guó)榮.數(shù)字視頻壓縮及其標(biāo)準(zhǔn):第1章、第2章、第4章、第9章,北京廣播學(xué)院出版社,1999。畢厚杰.新一代視頻壓縮編碼標(biāo)準(zhǔn):第2、3、4、5章,人民郵電出版社,2005。2.5拓展學(xué)習(xí)王春海.網(wǎng)絡(luò)視頻技術(shù)及應(yīng)用標(biāo)準(zhǔn)教程:第1章第2章壓縮編碼技術(shù)第2章壓縮編碼技術(shù)本章結(jié)構(gòu)壓縮編碼技術(shù)本章結(jié)構(gòu)學(xué)習(xí)目標(biāo)1.知識(shí)目標(biāo):知道流媒體數(shù)據(jù)可以壓縮的原因;了解有損編碼和無損編碼的區(qū)別;了解壓縮編碼的分類;掌握霍夫曼編碼、算術(shù)編碼、行程編碼;了解預(yù)測(cè)編碼和變換編碼的基本原理;了解MPEG-4、MPEG-7、MPEG-21編碼標(biāo)準(zhǔn);了解H.26x標(biāo)準(zhǔn),掌握MPEG-2標(biāo)準(zhǔn);了解音頻壓縮,掌握恒定比特率壓縮與可變比特率壓縮的區(qū)別。2.能力目標(biāo):能按照霍夫曼編碼、算術(shù)編碼、行程編碼的原理,寫出對(duì)數(shù)據(jù)壓縮后的結(jié)果;能對(duì)不同壓縮狀態(tài)下視音頻的數(shù)據(jù)量進(jìn)行計(jì)算。3.素質(zhì)目標(biāo):能根據(jù)不同的網(wǎng)絡(luò)條件選擇合適的編碼方法。學(xué)習(xí)目標(biāo)1.知識(shí)目標(biāo):2.1概述

2.1.1壓縮的必要性2.1.2壓縮的可行性2.1.3壓縮編碼的分類2.1.4常用的壓縮方法2.1概述2.1.1壓縮的必要性2.1.1壓縮的必要性數(shù)字壓縮技術(shù)不僅是音視頻通信的需要,也是高效利用網(wǎng)絡(luò)資源、降低用戶通信費(fèi)用的有效途徑,還是使流媒體走向?qū)嵱没年P(guān)鍵技術(shù)之一。問題:嘗試計(jì)算一個(gè)7GB的DVD視頻文件,在2Mb的理論帶寬下需要下載多少個(gè)小時(shí)?約等于8個(gè)小時(shí)2.1.1壓縮的必要性數(shù)字壓縮技術(shù)不僅是音視頻通信的需要,也2.1.2壓縮的可行性1.空間冗余2.時(shí)間冗余3.信息熵冗余4.結(jié)構(gòu)冗余5.知識(shí)冗余6.視覺冗余2.1.2壓縮的可行性1.空間冗余2.1.2壓縮的可行性1.空間冗余視頻圖像通常與它周圍的某些像素在亮度和色度上相同或非常接近,存在一定的相關(guān)性。這些相關(guān)性的光成像結(jié)果在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)的空間冗余。2.1.2壓縮的可行性1.空間冗余2.1.2壓縮的可行性2.時(shí)間冗余指活動(dòng)圖像連續(xù)的幀之間的冗余。相鄰兩幀圖像的內(nèi)容差別不大,往往背景相同,只不過移動(dòng)物體所在的空間位置略為不同,即后一幀數(shù)據(jù)與前一幀數(shù)據(jù)有諸多相同之處,這就表現(xiàn)為時(shí)間冗余。2.1.2壓縮的可行性2.時(shí)間冗余2.1.2壓縮的可行性3.信息熵冗余信息熵冗余又稱編碼冗余。信息熵是指一組數(shù)據(jù)所攜帶的信息量。而對(duì)于實(shí)際圖像數(shù)據(jù)的每個(gè)像素,很難得到它的信息熵,因此一般是對(duì)每個(gè)像素采用相同的比特?cái)?shù)來表示,這樣就必然存在冗余,這種冗余稱為信息熵冗余。2.1.2壓縮的可行性3.信息熵冗余2.1.2壓縮的可行性4.結(jié)構(gòu)冗余許多圖像存在著較強(qiáng)的紋理結(jié)構(gòu)。在圖像紋理區(qū),圖像的像素值存在著明顯的分布模式,如瓦片構(gòu)成的屋頂、方格狀的地板圖案等,如果對(duì)相似的、對(duì)稱的結(jié)構(gòu)都加以記錄,就會(huì)出現(xiàn)結(jié)構(gòu)冗余。2.1.2壓縮的可行性4.結(jié)構(gòu)冗余2.1.2壓縮的可行性5.知識(shí)冗余有許多圖像的理解與某些先驗(yàn)知識(shí)有相當(dāng)大的相關(guān)性。例如,人臉的圖像有同樣的結(jié)構(gòu):嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中線上等。這些規(guī)律的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,這類冗余稱為知識(shí)冗余。2.1.2壓縮的可行性5.知識(shí)冗余2.1.2壓縮的可行性6.視覺冗余人類視覺系統(tǒng)對(duì)亮度變化敏感,而對(duì)色度變化相對(duì)不敏感。在高亮區(qū),人眼對(duì)亮度變化敏感度下降,致使對(duì)內(nèi)部細(xì)節(jié)相對(duì)不敏感,而對(duì)整體輪廓敏感。因此,人類視覺系統(tǒng)并不是對(duì)圖像的任何變化都能感知出來,表現(xiàn)為視覺冗余。2.1.2壓縮的可行性6.視覺冗余2.1.3壓縮編碼的分類從信息論的角度出發(fā),把它分為無損壓縮和有損壓縮兩大類2.1.3壓縮編碼的分類從信息論的角度出發(fā),把它分為無損壓縮2.1.3壓縮編碼的分類

無損壓縮是利用數(shù)據(jù)的統(tǒng)計(jì)特性對(duì)圖像進(jìn)行的壓縮,即解壓縮后的圖像與原圖像相一致而不存在任何失真,但壓縮率受到數(shù)據(jù)統(tǒng)計(jì)冗余度的理論限制,一般為2:1到5:1。這類方法廣泛用于文本數(shù)據(jù)、程序和特殊應(yīng)用場(chǎng)合的圖像數(shù)據(jù)(如指紋圖像、醫(yī)學(xué)圖像)的壓縮。2.1.3壓縮編碼的分類無損壓縮是利用數(shù)據(jù)的統(tǒng)計(jì)特性對(duì)2.1.3壓縮編碼的分類有損壓縮也稱信息量壓縮方法,即解壓縮后的圖像與原圖像不一致,存在數(shù)據(jù)丟失的現(xiàn)象,并且丟失的這些數(shù)據(jù)不可恢復(fù),但可以利用人的視覺特性使解壓縮后的圖像看起來與原始圖像一樣。有損壓縮的壓縮比一般為100:1~200:1。2.1.3壓縮編碼的分類有損壓縮也稱信息量壓縮方法,即解壓2.1.4常用的壓縮方法1.無損壓縮編碼常用的無損壓縮方法有香農(nóng)-范諾(Shannon-Fano)編碼、哈夫曼(Huffman)編碼、RLE(run-lengthencoding,行程編碼)、LZW(Lempel-Ziv-Welch)編碼和算術(shù)編碼。2.1.4常用的壓縮方法2.1.4常用的壓縮方法1)香農(nóng)-范諾編碼(1)基本概念 ①熵 熵(Entropy)是度量信息量的一種方法,它通常表示事件發(fā)生的概率越大,確定性越強(qiáng),攜帶的消息量越少。信息熵:信息的基本作用就是消除人們對(duì)事物的不確定性。一個(gè)系統(tǒng)越是有序,信息熵就越低;反之,一個(gè)系統(tǒng)越是混亂,信息熵就越高。2.1.4常用的壓縮方法1)香農(nóng)-范諾編碼2.1.4常用的壓縮方法②信源S的熵

按照香農(nóng)的理論,信源S的熵定義為:

pi表示符號(hào)Si在S中出現(xiàn)的概率2.1.4常用的壓縮方法②信源S的熵pi表示符號(hào)Si在S2.1.4常用的壓縮方法(2)算法步驟—從上往下①按照符號(hào)出現(xiàn)的概率減少的順序?qū)⒋幋a的符號(hào)排成序列;②將符號(hào)分成兩組,使這兩組符號(hào)的概率之和相等或幾乎相等;③將第一組賦值為0,第二組賦值為1;④對(duì)每一組,重復(fù)步驟2的操作。2.1.4常用的壓縮方法(2)算法步驟—從上往下香農(nóng)-范諾編碼的應(yīng)用:假設(shè)有一幅80個(gè)像素組成的圖像,顏色共有8種,分別用符號(hào)A、B、C、D、E、F、G和H表示,80個(gè)像素中符號(hào)出現(xiàn)的情況如表2-1所示。香農(nóng)-范諾編碼的應(yīng)用:按照香農(nóng)理論,這幅圖像的熵為:H(S)=(20/80)log2(80/20)+(20/80)log2(80/20)+(10/80)log2(80/10)+…+(5/80)log2(80/5)=2.75這種方法采用從上到下的方法進(jìn)行編碼。最后的編碼如下圖所示:按照香農(nóng)理論,這幅圖像的熵為:具體編碼情況如下圖和表2-2所示。具體編碼情況如下圖和表2-2所示。壓縮率對(duì)比--編碼前:用3個(gè)位表示8個(gè)等級(jí)的顏色值(A~H),也就是每個(gè)像素用3位表示(000~111),編碼這幅圖像總共需要240位。--編碼后:按照這種方法進(jìn)行編碼得到的總位數(shù)為220,壓縮比約為1.09:1。壓縮率對(duì)比--編碼后:按照這種方法進(jìn)行編碼得到的總位數(shù)為22存在問題:1,同步問題,如1100與100要用特殊的間隔符來區(qū)分2,一些碼變長(zhǎng)了,如E~H,變?yōu)榱?位思考一下思考一下2.1.4常用的壓縮方法 2)霍夫曼(Haffman)編碼霍夫曼編碼是依據(jù)香農(nóng)和范諾闡述的編碼思想提出的一種不定長(zhǎng)編碼的方法,其編碼完全依據(jù)字符出現(xiàn)概率來構(gòu)造平均長(zhǎng)度最短的碼字,有時(shí)稱之為最佳編碼。

2.1.4常用的壓縮方法 2)霍夫曼(Haffman)編碼2.1.4常用的壓縮方法(1)基本方法(2)算法步驟—從下往上①按照符號(hào)出現(xiàn)的概率減少的順序?qū)⒋幋a的符號(hào)排成序列;②把概率最小的兩個(gè)符號(hào)組成一個(gè)新節(jié)點(diǎn),其概率等于原兩個(gè)符號(hào)之和;③重復(fù)2,直到形成一個(gè)節(jié)點(diǎn)為止(樹),其概率為1;④從根節(jié)點(diǎn)開始回溯到原始符號(hào),并將每個(gè)下分支賦值為1,上分支賦值為0。2.1.4常用的壓縮方法(1)基本方法2.1.4常用的壓縮方法(3)示例:霍夫曼編碼的過程字母A、B、C、D、E出現(xiàn)的概率為:p(A)=0.16、p(B)=0.51、p(C)=0.09、p(D)=0.13、p(E)=0.11。2.1.4常用的壓縮方法(3)示例:霍夫曼編碼的過程2.1.4常用的壓縮方法與香農(nóng)-范諾編碼相比:1,該方法自含同步碼,在編碼之后的碼串中不需要另外添加標(biāo)記符號(hào)(即在譯碼時(shí)分割符號(hào)的特殊代碼)。例如,碼串中的第一位為0,那么肯定是符號(hào)B,因?yàn)槠渌?hào)沒有一個(gè)是從0開始的。2,霍夫曼編碼的編碼效率比香農(nóng)-范諾編碼效率高。2.1.4常用的壓縮方法與香農(nóng)-范諾編碼相比:2.1.4常用的壓縮方法課題練習(xí):比較香農(nóng)和哈夫曼編碼,將前面的哈夫曼編碼案例進(jìn)行香農(nóng)編碼BADECACDEACDE01100110(0)(100)(101)(110)(111)香農(nóng):從上往下走;哈夫曼:從下往上走2.1.4常用的壓縮方法課題練習(xí):比較香農(nóng)和哈夫曼編碼,將2.1.4常用的壓縮方法3)算術(shù)編碼算術(shù)編碼應(yīng)用于JPEG/JBIG圖像數(shù)據(jù)壓縮,它不用二進(jìn)制代碼來表示符號(hào),而改用[0,1)中的一個(gè)寬度等于其出現(xiàn)概率的實(shí)數(shù)區(qū)間來表示一個(gè)符號(hào),符號(hào)表中的所有符號(hào)剛好布滿整個(gè)[0,1)區(qū)間(概率之和為1,不重不漏)。輸出:把輸入符號(hào)串(數(shù)據(jù)流)映射成[0,1)區(qū)間中的一個(gè)實(shí)數(shù)值。Low=low+range×rangelow(字符分配的間隔低端)High=low+range×rangehigh(字符分配的間隔高端)Range=high-low2.1.4常用的壓縮方法3)算術(shù)編碼算術(shù)編碼的過程設(shè)輸入數(shù)據(jù)為eaiou,其出現(xiàn)的概率和所設(shè)定的取值范圍如表2-3所示表2-3信源符號(hào)、概率和初始編碼間隔初始化,Low=0,high=1;從字母e開始計(jì)算,最后eaiou輸出為0.23396(下界)字符aeiou概率0.20.30.10.20.2初始編碼間隔[0,0.2][0.2,0.5][0.5,0.6][0.6,0.8][0.8,1.0]Low=low+range×rangelow(字符分配的間隔低端)High=low+range×rangehigh(字符分配的間隔高端)Range=high-low算術(shù)編碼的過程設(shè)輸入數(shù)據(jù)為eaio2.1.4常用的壓縮方法算術(shù)編碼具有以下特點(diǎn)①必預(yù)先定義概率模型;②信源符號(hào)概率接近時(shí),建議使用算術(shù)編碼,這種情況下其效率高于哈夫曼編碼;③實(shí)現(xiàn)方法相對(duì)復(fù)雜,但其編碼效率比哈夫曼編碼高5%左右,因此在JPEG擴(kuò)展系統(tǒng)中用算術(shù)編碼取代哈夫曼編碼。2.1.4常用的壓縮方法算術(shù)編碼具有以下特點(diǎn)2.1.4常用的壓縮方法4)RLE編碼RLE又稱“運(yùn)行長(zhǎng)度編碼”或“游程編碼”,是一種統(tǒng)計(jì)編碼?;驹硎牵河靡粋€(gè)符號(hào)值或串長(zhǎng)代替具有相同值的連續(xù)符號(hào)(連續(xù)符號(hào)構(gòu)成了一段連續(xù)的“行程”,行程編碼因此而得名),使符號(hào)長(zhǎng)度少于原始數(shù)據(jù)的長(zhǎng)度。2.1.4常用的壓縮方法4)RLE編碼“5555557777733322221llllll”RLE編碼為:(5,6)(7,5)(3,3)(2,4)(l,7)“5555557777733322221llllll”2.1.4常用的壓縮方法2.預(yù)測(cè)編碼預(yù)測(cè)編碼主要消除圖像的時(shí)間冗余度。常用的預(yù)測(cè)編碼方法包括DPCM(differentialpulsecodemodulation,差分脈沖編碼調(diào)制)、ADPCM(adaptivedifferencepulsecodemodulation,自適應(yīng)差分預(yù)測(cè)編碼)和幀間預(yù)測(cè)編碼。2.1.4常用的壓縮方法2.預(yù)測(cè)編碼2.1.4常用的壓縮方法1)DPCMDPCM的思想是:依據(jù)過去的樣本去估算下一個(gè)樣本信號(hào)的幅度大小,這個(gè)值稱為預(yù)測(cè)值,然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼,從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)。2.1.4常用的壓縮方法1)DPCM2.1.4常用的壓縮方法DPCM的工作過程如圖2-5所示。2.1.4常用的壓縮方法DPCM的工作過程如圖2-5所示。2.1.4常用的壓縮方法2)ADPCMADPCM就是預(yù)測(cè)器和量化器的參數(shù)能根據(jù)圖像不同位置的具體特點(diǎn)進(jìn)行自動(dòng)調(diào)節(jié),從而匹配圖像的局部變化,具有更大的靈活性,并獲得進(jìn)一步的壓縮效果或提高壓縮質(zhì)量。2.1.4常用的壓縮方法2)ADPCM2.1.4常用的壓縮方法2.1.4常用的壓縮方法2.1.4常用的壓縮方法3)幀間預(yù)測(cè)編碼幀間預(yù)測(cè)編碼是利用視頻圖像幀間的相關(guān)性,即時(shí)間相關(guān)性,來達(dá)到圖像壓縮的目的,即不直接傳送當(dāng)前幀的像素值,而是傳送當(dāng)前幀與其前一幀或后一幀之間的差值。2.1.4常用的壓縮方法3)幀間預(yù)測(cè)編碼2.1.4常用的壓縮方法3.變換編碼變換編碼就是將圖像時(shí)域信號(hào)(時(shí)間)變換到頻域信號(hào)(頻率)或者將原始數(shù)據(jù)“變換”到另一個(gè)更為緊湊的表示空間,消除空間冗余,進(jìn)行壓縮編碼的方法。2.1.4常用的壓縮方法3.變換編碼1)DCT(離散余弦變換)DCT編碼的基本思想是:源圖像在輸入到編碼器之前,被分割成一系列按順序排列的8×8像素的圖像塊,同時(shí)把作為原始采樣數(shù)據(jù)的無符號(hào)整數(shù)轉(zhuǎn)換成有符號(hào)整數(shù),這一過程叫正交變換。有序1)DCT(離散余弦變換)有序壓縮編碼技術(shù)課件壓縮編碼技術(shù)課件2.1.4常用的壓縮方法2)小波變換編碼小波變換用于圖像編碼的基本思想就是把圖像進(jìn)行多分辨率分解,分解成不同空間、不同頻率的子圖像,然后再對(duì)子圖像進(jìn)行系數(shù)編碼。2.1.4常用的壓縮方法2)小波變換編碼2.1.4常用的壓縮方法4.其他編碼方法1)子帶編碼子帶編碼就是利用數(shù)字濾波器將輸入的數(shù)字信號(hào)分解成頻域不相關(guān)的、具有不同能量成分的頻帶,然后根據(jù)各頻帶的特性進(jìn)行量化、編碼。2.1.4常用的壓縮方法4.其他編碼方法2.1.4常用的壓縮方法2)模型編碼模型編碼是利用計(jì)算機(jī)視覺和計(jì)算機(jī)圖形學(xué)的知識(shí)對(duì)圖像信號(hào)的分析與合成。模型編碼中比較典型的是分形編碼。

2.1.4常用的壓縮方法2)模型編碼2.1.4常用的壓縮方法3)矢量量化編碼量化編碼按一次量化的碼元個(gè)數(shù),可分為標(biāo)量量化和矢量量化。標(biāo)量量化就是對(duì)數(shù)字化后的數(shù)據(jù)一個(gè)一個(gè)地量化,而矢量量化就是將這些數(shù)據(jù)分組,每組m個(gè)數(shù)構(gòu)成m維矢量,再以矢量為單元逐個(gè)進(jìn)行量化。2.1.4常用的壓縮方法3)矢量量化編碼2.1.4常用的壓縮方法4)混合編碼混合編碼就是同時(shí)采用多種編碼方法所形成的編碼。例如,將變換編碼和預(yù)測(cè)編碼結(jié)合起來所形成的MPEG編碼。2.1.4常用的壓縮方法4)混合編碼2.2網(wǎng)絡(luò)視頻壓縮編碼的標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)2.2.2H.26X標(biāo)準(zhǔn)2.2網(wǎng)絡(luò)視頻壓縮編碼的標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)1.MPEG概述1)MPEG系統(tǒng)的組成MPEG系統(tǒng)主要由以下部分組成:(1)MPEG系統(tǒng),定義音頻、視頻及有關(guān)數(shù)據(jù)的同步;(2)MPEG視頻,定義視頻數(shù)據(jù)的編碼和重建圖像所需的解碼過程.(3)MPEG音頻,定義音頻數(shù)據(jù)的編碼和解碼;(4)一致性測(cè)試。2.2.1MPEG標(biāo)準(zhǔn)1.MPEG概述2.1.3壓縮編碼的分類2)MPEG視頻編碼技術(shù)MPEG對(duì)視頻壓縮編碼采用兩種基本技術(shù):一種是基于塊的運(yùn)動(dòng)補(bǔ)償技術(shù),以減少時(shí)間冗余;另一種是基于DCT變換的ADCT(adaptiveDCT,自適應(yīng)余弦變換),以減少空間冗余。2.1.3壓縮編碼的分類2)MPEG視頻編碼技術(shù)2.2.1MPEG標(biāo)準(zhǔn)3)MPEG的視頻數(shù)據(jù)流結(jié)構(gòu)MPEG的視頻數(shù)據(jù)流采用分層結(jié)構(gòu),包括序列層、圖像組層、圖像層、片層、宏塊層、塊層等六個(gè)層次。2.2.1MPEG標(biāo)準(zhǔn)3)MPEG的視頻數(shù)據(jù)流結(jié)構(gòu)2.2.1MPEG標(biāo)準(zhǔn)宏塊的3個(gè)類型和結(jié)構(gòu):4:2:04:2:24:4:42.2.1MPEG標(biāo)準(zhǔn)宏塊的3個(gè)類型和結(jié)構(gòu):4:2:04:2.2.1MPEG標(biāo)準(zhǔn)4)MPEG的運(yùn)動(dòng)圖像類型I幀:I幀是幀內(nèi)壓縮,由于I幀不依賴于其他幀,因而是隨機(jī)存取的入點(diǎn),也是解碼中的基準(zhǔn)幀。P幀:用最近的前一個(gè)I幀或P幀預(yù)測(cè)編碼得到(前向預(yù)測(cè)),使用運(yùn)動(dòng)補(bǔ)償算法進(jìn)行壓縮,因而壓縮比要比I幀高,數(shù)據(jù)量平均達(dá)到I幀的1/3左右。P幀是對(duì)前后的B幀和后繼的P幀進(jìn)行解碼的基準(zhǔn)幀。2.2.1MPEG標(biāo)準(zhǔn)4)MPEG的運(yùn)動(dòng)圖像類型2.2.1MPEG標(biāo)準(zhǔn)B幀:B幀基于前后的兩個(gè)I、P幀或P、P幀,它使用雙向預(yù)測(cè),數(shù)據(jù)量平均可以達(dá)到I幀的1/9左右。B幀本身不作為基準(zhǔn),因此可以提供更高的壓縮比。2.2.1MPEG標(biāo)準(zhǔn)B幀:B幀基于前后的兩個(gè)I、P幀或P2.2.1MPEG標(biāo)準(zhǔn)5)運(yùn)動(dòng)補(bǔ)償技術(shù)運(yùn)動(dòng)補(bǔ)償技術(shù)的主要原理是依據(jù)圖像的運(yùn)動(dòng)情況,把圖像分割成靜止部分和運(yùn)動(dòng)部分,并分別進(jìn)行處理。靜止部分可以重復(fù)使用上一幀的數(shù)據(jù),而對(duì)運(yùn)動(dòng)部分則設(shè)法確定其位移量,以位移量來幫助進(jìn)行運(yùn)動(dòng)部分的預(yù)測(cè),即進(jìn)行補(bǔ)償,之后再進(jìn)行幀間預(yù)測(cè)。2.2.1MPEG標(biāo)準(zhǔn)5)運(yùn)動(dòng)補(bǔ)償技術(shù)2.2.1MPEG標(biāo)準(zhǔn)2.MPEG-1

標(biāo)準(zhǔn)MPEG-1標(biāo)準(zhǔn)的主要任務(wù)是將視頻信號(hào)及其伴音以可接收的重建質(zhì)量壓縮到約1.5Mbit/s的碼率,并復(fù)合成一個(gè)單一的MPEG位流,同時(shí)保證視頻和音頻的同步。2.2.1MPEG標(biāo)準(zhǔn)2.MPEG-1

標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)

1)MPEG-1系統(tǒng)MPEG-1系統(tǒng)規(guī)定了有關(guān)同步和多路復(fù)合的技術(shù),用來把數(shù)字視頻圖像和伴音復(fù)合成單一的、位速率為l.5Mbit/s的數(shù)據(jù)位流。2.2.1MPEG標(biāo)準(zhǔn)1)MPEG-1系統(tǒng)2.2.1MPEG標(biāo)準(zhǔn)2)MPEG-1視頻MPEG-1視頻是MPEG-1標(biāo)準(zhǔn)的核心,是為了適應(yīng)在數(shù)字存儲(chǔ)媒體如CD-ROM(數(shù)據(jù)傳輸率不低于150KB/s,容量不低于650MB)上有效地存取視頻圖像而制定的標(biāo)準(zhǔn)。2.2.1MPEG標(biāo)準(zhǔn)2)MPEG-1視頻2.2.1MPEG標(biāo)準(zhǔn)3.MPEG-2標(biāo)準(zhǔn)(1)MPEG-2系統(tǒng)MPEG-2標(biāo)準(zhǔn)的系統(tǒng)功能是將一個(gè)或更多的音頻、視頻或其他的基本數(shù)據(jù)流合成單個(gè)或多個(gè)數(shù)據(jù)流,以適應(yīng)存儲(chǔ)和傳送。適合用于廣播級(jí)的數(shù)字視頻信息編碼的存儲(chǔ)和發(fā)送,被認(rèn)定為SDTV和HDTV的編碼標(biāo)準(zhǔn)。其編碼率從3-100Mbps可變。MPEG-2還專門規(guī)定了多套節(jié)目的復(fù)用分接方式,可用于VOD系統(tǒng)。2.2.1MPEG標(biāo)準(zhǔn)3.MPEG-2標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)4.MPEG-4標(biāo)準(zhǔn)1)MPEG-4的特點(diǎn)(1)基于內(nèi)容的交互性允許用戶加入其中,進(jìn)行交互。MPEG-4提供了多媒體數(shù)據(jù)訪問工具,用戶可索引、上傳、建立鏈接、下載、編輯和刪除等。用戶可方便地選擇所需內(nèi)容,并提供位流編輯功能。應(yīng)用于交互式家庭購(gòu)物和特效的數(shù)字化效果。(2)高效的壓縮性

壓縮比高,三維游戲、電影的多聲道或多視角數(shù)據(jù)同步壓縮(3)通用的訪問性可分級(jí);支持不同帶寬的傳輸信道和不同存儲(chǔ)容量的接收端2.2.1MPEG標(biāo)準(zhǔn)4.MPEG-4標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)2)MPEG-4視頻編碼核心思想在制定MPEG-4之前,MPEG-1、MPEG-2、H.261、H.263都是采用第一代壓縮編碼技術(shù),著眼于圖像信號(hào)的統(tǒng)計(jì)特性來設(shè)計(jì)編碼器,屬于波形編碼的范疇。第一代壓縮編碼方案把視頻序列按時(shí)間先后分為一系列幀,每一幀圖像又分成宏塊以進(jìn)行運(yùn)動(dòng)補(bǔ)償和編碼,這種編碼方案存在以下缺陷:2.2.1MPEG標(biāo)準(zhǔn)2)MPEG-4視頻編碼核心思想2.2.1MPEG標(biāo)準(zhǔn)(1)將圖像固定地分成相同大小的塊,在高壓縮比的情況下會(huì)出現(xiàn)嚴(yán)重的塊效應(yīng),即馬賽克效應(yīng);(2)不能對(duì)圖像內(nèi)容進(jìn)行訪問、編輯和回放等操作;(3)未充分利用HVS(humanvisualsystem,人類視覺系統(tǒng))的特性。HVS,從圖像傳輸?shù)妮喞图y理思路出發(fā),先顯示模糊的輪廓再補(bǔ)充細(xì)節(jié)2.2.1MPEG標(biāo)準(zhǔn)(1)將圖像固定地分成相同大小的塊,2.2.1MPEG標(biāo)準(zhǔn)3)關(guān)鍵技術(shù)

(1)音視頻對(duì)象(AVO,audiovisualobject)提取技術(shù)(2)VOP(視頻對(duì)象平面)視頻編碼技術(shù)(3)視頻編碼可分級(jí)性技術(shù)(4)運(yùn)動(dòng)估計(jì)與運(yùn)動(dòng)補(bǔ)償技術(shù)(5)Sprite視頻編碼技術(shù)Sprite背景圖像2.2.1MPEG標(biāo)準(zhǔn)3)關(guān)鍵技術(shù)Sprite背景圖像2.2.1MPEG標(biāo)準(zhǔn)4)MPEG-4標(biāo)準(zhǔn)的構(gòu)成(1)DMIF(deliverymultimediaintegrationframework,多媒體傳輸集成框架)。(2)場(chǎng)景描述。主要用于描述單個(gè)AVO如何在一個(gè)具體AV場(chǎng)景坐標(biāo)下的組織與同步等問題。(3)音頻編碼。MPEG-4的音頻部分將音頻的合成編碼和自然聲音的編碼相結(jié)合,并支持音頻的對(duì)象特征,支持MIDI和TTS技術(shù)。(4)視頻編碼。MPEG-4也支持對(duì)自然和合成的視覺對(duì)象的編碼,合成的視覺對(duì)象包括2D、3D動(dòng)畫和人面部表情動(dòng)畫等。(5)緩沖區(qū)管理和實(shí)時(shí)解碼。MPEG-4定義了一個(gè)系統(tǒng)解碼模式(SDM),該模式描述了一種理想的處理比特流句法語義的解碼裝置,它要求特殊的緩沖區(qū)和實(shí)時(shí)模式。2.2.1MPEG標(biāo)準(zhǔn)4)MPEG-4標(biāo)準(zhǔn)的構(gòu)成2.2.1MPEG標(biāo)準(zhǔn)5.MPEG-7標(biāo)準(zhǔn)1)MPEG-7標(biāo)準(zhǔn)的研究范圍MPEG-7標(biāo)準(zhǔn)的主要目標(biāo)是建立對(duì)多媒體內(nèi)容的描述標(biāo)準(zhǔn),這里的多媒體內(nèi)容是指圖形、圖像、3D模型、音頻、語音、視頻以及由它們組合在一起所形成的多媒體信息。2)MPEG7標(biāo)準(zhǔn)的描述框架MPEG-7提供了一個(gè)通用的、靈活的和可擴(kuò)展的多媒體內(nèi)容描述框架,它由D(descriptor,描述符)、DS(descriptionscheme,描述方案)、DDL(descriptiondefinitionlanguage,描述定義語言)和對(duì)這些描述進(jìn)行編碼的方法和工具組成。2.2.1MPEG標(biāo)準(zhǔn)5.MPEG-7標(biāo)準(zhǔn)2.2.1MPEG標(biāo)準(zhǔn)3)MPEG-7多媒體描述方案MPEG-7多媒體描述方案是描述和注釋多媒體內(nèi)容的元數(shù)據(jù)結(jié)構(gòu),包括通用特征和多媒體描述的描述符和描述方案。4)MPEG-7系統(tǒng)部分MPEG-7系統(tǒng)部分要保證MPEG-7各種描述能夠被快速傳送和存取,并且要保證內(nèi)容與描述之間的同步性,同時(shí)管理和保護(hù)知識(shí)產(chǎn)權(quán)問題。2.2.1MPEG標(biāo)準(zhǔn)3)MPEG-7多媒體描述方案2.2.1MPEG標(biāo)準(zhǔn)5)MPEG-7視頻MPEG-7具體對(duì)視頻方面的描述符和描述方案有以下方面的要求:特征類型。視覺描述允許以下特征:顏色、視覺對(duì)象、紋理、輪廓、形狀、靜止和動(dòng)態(tài)圖像、體積、空間關(guān)系、運(yùn)動(dòng)、變形、視覺對(duì)象的源和它的特性、模型。2.2.1MPEG標(biāo)準(zhǔn)5)MPEG-7視頻2.2.1MPEG標(biāo)準(zhǔn)6)MPEG-7的應(yīng)用MPEG-7可以進(jìn)行檢索/定位(Pull)應(yīng)用和過濾(push)應(yīng)用。同時(shí)MPEG-7可以應(yīng)用在實(shí)時(shí)也可以在非實(shí)時(shí)環(huán)境中。2.2.1MPEG標(biāo)準(zhǔn)6)MPEG-7的應(yīng)用2.2.1MPEG標(biāo)準(zhǔn)6.MPEG-21標(biāo)準(zhǔn)MPEG-21標(biāo)準(zhǔn)其實(shí)就是一些關(guān)鍵技術(shù)的集成,通過這種集成環(huán)境就對(duì)全球數(shù)字媒體資源進(jìn)行透明型和增強(qiáng)型管理,實(shí)現(xiàn)內(nèi)容描述、創(chuàng)建、發(fā)布、使用、識(shí)別、收費(fèi)管理、產(chǎn)權(quán)保護(hù)、用戶隱私權(quán)保護(hù)、終端和網(wǎng)絡(luò)資源抽取、事件報(bào)告等功能。2.2.1MPEG標(biāo)準(zhǔn)6.MPEG-21標(biāo)準(zhǔn)2.2.2H.26X標(biāo)準(zhǔn)1.H.261標(biāo)準(zhǔn)H.261標(biāo)準(zhǔn)主要應(yīng)用在ISDN(integratedservicesdigitalnetwork,綜合業(yè)務(wù)數(shù)字網(wǎng))上傳輸電視電話會(huì)議等低碼率的多媒體領(lǐng)域。2.2.2H.26X標(biāo)準(zhǔn)1.H.261標(biāo)準(zhǔn)2.2.2H.26X標(biāo)準(zhǔn)2)壓縮數(shù)據(jù)的分層為了有序地傳輸每幀圖像的數(shù)據(jù),并有利于圖像數(shù)據(jù)交換和與設(shè)備兼容,把一幀圖像數(shù)據(jù)分成幀、宏塊組(GOB)層、宏塊(MB)層、塊(Block)層來處理,如圖2-18所示。2.2.2H.26X標(biāo)準(zhǔn)2)壓縮數(shù)據(jù)的分層2.2.2H.26X標(biāo)準(zhǔn)3)編碼算法H.261編碼算法類似于MPEG算法,但與后者不兼容。它在實(shí)時(shí)編碼時(shí)所占用的CPU運(yùn)算量比MPEG少得多,原因在于采用了圖像質(zhì)量與運(yùn)動(dòng)幅度相平衡的折衷機(jī)制(也就是說,劇烈運(yùn)動(dòng)的圖像比相對(duì)靜止的圖像質(zhì)量要差),優(yōu)化了帶寬占用量。因此,這種方法屬于恒定碼流可變質(zhì)量編碼。2.2.2H.26X標(biāo)準(zhǔn)3)編碼算法2.2.2H.26X標(biāo)準(zhǔn)2.H.263標(biāo)準(zhǔn)H.263標(biāo)準(zhǔn)是替代H.261的一個(gè)ITU-T標(biāo)準(zhǔn)。1)編碼模式H.263推薦了以下四種幀內(nèi)編碼模式,這些可被分開使用或一起用。一個(gè)例外是先進(jìn)的預(yù)測(cè)模式需要使用無限制的運(yùn)動(dòng)矢量模式。(1)基于句法的算術(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論