圖像與視頻編碼

上傳人：5*** IP屬地：湖北上傳時間：2022-04-07 格式：PPT 頁數(shù)：88 大?。?.41MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩83頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、課程內(nèi)容圖像壓縮的基本概念圖像壓縮算法圖像壓縮編碼標(biāo)準(zhǔn)為什么需要壓縮？舉例1：一張A4(210mm297mm) 大小的照片，若用中等分辨率(300dpi)的掃描儀按真彩色掃描，其數(shù)據(jù)量為多少？（注：dpi表示每英寸像素，1英寸25.4mm）若按每像素3個字節(jié)計(jì)算，上述結(jié)果為約26M舉例2：目前的WWW包含大量的圖像信息，如果圖像信息的數(shù)據(jù)量太大，會使本來就已經(jīng)非常緊張的網(wǎng)絡(luò)帶寬變得更加不堪重負(fù)（WWW變成了World Wide Wait）q視頻數(shù)據(jù)量：對于電視畫面的分辨率640*480的彩色圖像，每秒30幀，則一秒鐘的數(shù)據(jù)量為：640*480*24*30=221.12M實(shí)時傳輸：在10M帶寬網(wǎng)

2、上實(shí)時傳輸?shù)脑?，需要壓縮到原來數(shù)據(jù)量的0.045存儲： 1張CD可存640M，如果不進(jìn)行壓縮，1張CD則僅可以存放2.89秒的數(shù)據(jù)q可見，單純依靠增加存儲器容量和改善信道帶寬無法滿足需求，必須進(jìn)行壓縮數(shù)據(jù)冗余設(shè)：n1和n2是指原始圖像和編碼后圖像每個像素的平均比特?cái)?shù)壓縮率（壓縮比）用于描述圖像壓縮效果CR = n1 / n2其中，n1是壓縮前的數(shù)據(jù)量，n2是壓縮后的數(shù)據(jù)量相對數(shù)據(jù)冗余：RD = 1 1/CR=(n1-n2)/n2編碼冗余q如果一個圖像的灰度級編碼，使用了多于實(shí)際需要的編碼符號，就稱該圖像包含了編碼冗余例：如果用8位表示下面圖像的像素，我們就說該圖像存在著編碼冗余，因?yàn)樵搱D像的像

3、素只有兩個灰度，用一位即可表示。像素冗余q由于任何給定的像素值，原理上都可以通過它的相鄰像素預(yù)測到，單個像素?cái)y帶的信息相對是小的。對于一個圖像，很多單個像素對視覺的貢獻(xiàn)是冗余的。這是建立在對鄰值預(yù)測的基礎(chǔ)上。例：原圖像數(shù)據(jù)：234 223 231 238 235壓縮后數(shù)據(jù)：234 11 -8 -7 3，我們可以對一些接近于零的像素不進(jìn)行存儲，從而減小了數(shù)據(jù)量視覺信息冗余q一些信息在一般視覺處理中比其它信息的相對重要程度要小，這種信息就被稱為視覺心理冗余。33K15Kq保真度標(biāo)準(zhǔn)評價壓縮算法的標(biāo)準(zhǔn)客觀保真度標(biāo)準(zhǔn)：圖像壓縮過程對圖像信息的損失能夠表示為原始圖像與壓縮并解壓縮后圖像的函數(shù)。一般表示為

4、輸出和輸入之差：兩個圖像之間的總誤差：均方根誤差：主觀保真度標(biāo)準(zhǔn)：通過視覺比較兩個圖像，給出一個定性的評價，如很粗、粗、稍粗、相同、稍好、較好、很好等，可以對所有人的感覺評分計(jì)算平均感覺分來衡量),(),(),(yxfyxfyxe 1010),(),(MxNyyxfyxf2/110102),(),(1 MxNyrmsyxfyxfMNe下表給出一種對電視圖像質(zhì)量進(jìn)行評價打分的分級準(zhǔn)則。評分評價說明1優(yōu)秀圖像質(zhì)量非常好，如同人能想象出的最好質(zhì)量。2良好圖像質(zhì)量高，觀看舒服，有干擾但不影響觀看。3可用圖像質(zhì)量可接受，有干擾但不太影響觀看。4剛可看圖像質(zhì)量差，干擾有些妨礙觀看，觀察者希望改進(jìn)。5差

5、圖像質(zhì)量很差，妨礙觀看的干擾始終存在，幾乎無法觀看。6不能用圖像質(zhì)量極差，不能使用。圖像傳輸模型信源編碼：完成原數(shù)據(jù)的壓縮。信道編碼：為了抗干擾，增加一些容錯、校驗(yàn)位、版權(quán)保護(hù)，實(shí)際上是增加冗余。信道：如Internet、廣播、通訊、可移動介質(zhì)。信源信源編碼編碼信源信源解碼解碼圖像壓縮的分類圖像壓縮有損壓縮無損壓縮行程編碼LZW編碼哈夫曼編碼算術(shù)編碼無損預(yù)測編碼位平面編碼有損預(yù)測編碼分形編碼子帶編碼神經(jīng)網(wǎng)絡(luò)編碼變換編碼K-L變換Haar變換Walsh.Hadamard變換離散余弦變換離散傅立葉變換斜變換小波變換行程編碼（RLE）q行程：具有相同灰度值的像素序列q編碼思想：將一行中顏色值相同的相

6、鄰象素（行程）用一個計(jì)數(shù)值（行程的長度）和該顏色值（行程的灰度）來代替，從而去除像素冗余。例：設(shè)重復(fù)次數(shù)為 iC, 重復(fù)像素值為 iP編碼為：iCiP iCiP iCiP編碼前：aaaaaaabbbbbbcccccccc 編碼后：7a6b8c行程編碼（RLE）q對于有大面積色塊的圖像，壓縮效果很好q對于紛雜的圖像，壓縮效果不好，最壞情況下（圖像中每兩個相鄰點(diǎn)的顏色都不同），會使數(shù)據(jù)量加倍，所以現(xiàn)在單純采用行程編碼的壓縮算法用得并不多，PCX文件算是其中之一二維行程編碼q二維行程編碼要解決的核心問題是：將二維排列的像素，采用某種方式轉(zhuǎn)化成一維排列的方式。之后按照一維行程編碼方式進(jìn)行編碼q兩種典

7、型的二維行程編碼的排列方式二維行程編碼q數(shù)據(jù)量：64*8=512(bit)130130130129134133129130130130130129134133130130130130130129132132130130129130130129130130129129127128127129131 129131 130127128127128127128132132125126129129127129133132127125128128126130131131f二維行程編碼如果按照方式(a)掃描的順序排列的話，數(shù)據(jù)分布為：130，130，130，130，130，130，130，130，130；1

8、29，129，129，129，130，130，129；127，128，127，129，131，130，132，134，134；133，133，132，130，129，128，127，128，127，128，127，125，126，129，129；127，129，133，132，131，129，130，130；129，130，130，130，129，130，132，132；131，131，130，126，128，128，127，127行程編碼為:數(shù)據(jù)量為:43*（3+8）=473(bit) (94.22%)（7，130），（），（2，130），（），（4，129），（），（2，130），（），（

9、1，129）；（）；（1，127），），（1，128），（），（1，127），（），（1，129），（），（1，131），（），（1，130），（），（1，132），），（2，134），（），（2，133），（），（1，132），（），（1，130），（），（1，129），（），（1，128），），（1，127），（），（1，128），（），（1，127），（），（1，128），（），（1，127），（），（1，125），），（1，126），（），（2，129），（），（1，127），（），（1，129），（），（1，133），（），（1，132），），（1，131），（），（1，129），（

10、），（2，130），（），（1，129），（），（3，130），（），（1，129），），（1，130），（），（2，132），（），（2，131），（），（1，130），（），（1，126），（），（2，128），），（2，127）LZW編碼qLZW是一種比較復(fù)雜的壓縮算法，壓縮效率較高q基本原理：每一個第一次出現(xiàn)的字符串用一個數(shù)值來編碼，再將這個數(shù)值還原為字符串。例如：用數(shù)值0 x100代替字符串“abccddeee”，每當(dāng)出現(xiàn)該字符串時，都用0 x100代替，從而起到了壓縮作用。數(shù)值與字符串的對應(yīng)關(guān)系在壓縮過程中動態(tài)生成并隱含在壓縮數(shù)據(jù)中，在解壓縮時逐步得到恢復(fù)。LZW是無損的。GIF和

11、Tiff圖像都采用了這種壓縮算法。qLZW算法由Unisys公司在美國申請了專利，以前要使用它首先要獲得該公司的認(rèn)可哈夫曼編碼q哈夫曼(Huffman)編碼是一種常用的壓縮編碼方法，是Huffman于1952年為壓縮文本文件建立的。q基本思想通過減少編碼冗余來達(dá)到壓縮的目的。統(tǒng)計(jì)符號的出現(xiàn)概率，建立一個概率統(tǒng)計(jì)表將最常出現(xiàn)(概率大的)的符號用最短的編碼，最少出現(xiàn)的符號用最長的編碼。q例子：建立概率統(tǒng)計(jì)表和編碼樹符號概率 1 2 3 4a2 0.4 0.4 0.4 0.4 0.6a6 0.3 0.3 0.3 0.3 0.4a1 0.1 0.1 0.2 0.3a4 0.1 0.1 0.1a3 0

12、.06 0.1a5 0.04 q例子的編碼過程(思考編碼是否唯一)：q解碼過程符號概率編碼 1 2 3 4a20.4 1 0.4 1 0.4 1 0.4 1 0.6 0a60.3 01 0.3 01 0.3 01 0.3 01 0.4 1a10.1 001 0.1 001 0.2 001 0.3 00a40.1 0001 0.1 0001 0.1 000 a30.06 00001 0.1 0000 a50.04 0000000001 001 1 1 01a3 a1 a2 a2 a60.60.4 a20.3 a60.3 0.1 a10.2 0.1 a4 0.04 a50 .06 a30.1

13、0 1 0 1 0 1 0 1 0 1哈夫曼編碼過程(1) 首先統(tǒng)計(jì)出每個符號出現(xiàn)的頻率，比如上例中a1到a6的出現(xiàn)頻率分別為0.1、0.4、0.06、0.1、0.04、0.3。(2) 從左到右把上述頻率按從小到大的順序排列。(3) 每一次選出最小的兩個值，作為二叉樹的兩個葉子節(jié)點(diǎn)，將和作為它們的根節(jié)點(diǎn)，這兩個葉子節(jié)點(diǎn)不再參與比較，新的根節(jié)點(diǎn)參與比較。(4)重復(fù)(3)，直到最后得到和為1的根節(jié)點(diǎn)。(5)將形成的二叉樹的左節(jié)點(diǎn)標(biāo)0，右節(jié)點(diǎn)標(biāo)1。把從最上面的根節(jié)點(diǎn)到最下面的葉子節(jié)點(diǎn)途中遇到的0,1序列串起來，就得到了各個符號的編碼無損預(yù)測編碼q預(yù)測編碼：根據(jù)數(shù)據(jù)在時間和空間上的相關(guān)性，根據(jù)統(tǒng)計(jì)模型

14、利用已有樣本對新樣本進(jìn)行預(yù)測q線性預(yù)測的編碼思想1) 去除像素冗余。2) 認(rèn)為相鄰像素的信息有冗余。當(dāng)前像素值可以用以前的像素值來獲得。3) 用當(dāng)前像素值，通過預(yù)測器得到一個預(yù)測值，對當(dāng)前值和預(yù)測值求差，對差編碼，作為壓縮數(shù)據(jù)流中的下一個元素。由于通常誤差值比樣本值小得多，因而可以達(dá)到數(shù)據(jù)壓縮的效果。大多數(shù)情況下，是通過m個以前像素的線性組合來生成的：nfnfnf)(1miininfaroundfnnnffe預(yù)測編碼器q如果沒有量化器，那么就是無損編碼q如果有量化器，則是有損編碼+ -符號符號編碼編碼壓縮圖像輸入圖像enfn fn量化器量化器n預(yù)測器預(yù)測器預(yù)測解碼器+ +符號符號解碼解

15、碼預(yù)測器預(yù)測器解壓縮圖像壓縮圖像 fn fnn修正后的預(yù)測編碼器q增加一個反饋環(huán)，將量化誤差和過去預(yù)測函數(shù)相加，作為新的預(yù)測函數(shù)符號符號編碼編碼壓縮圖像+ -en輸入圖像fn量化器量化器n預(yù)測器預(yù)測器 fn+ +fn fn = n + fn量化器q量化器基本思想：減少數(shù)據(jù)量的最簡單的辦法是將圖像量化成較少的灰度級，通過減少圖像的灰度級來實(shí)現(xiàn)圖像的壓縮。這種量化是不可逆的，因而解碼時圖像有損失如果輸入是256 個灰度級，對灰度級量化后輸出，只剩下4個層次，數(shù)據(jù)量被大大減少。sts1s2s3t1t2t3變換編碼q基本思想：用一個可逆的、線性的變換（如傅立葉變換），把圖像映射到變換系數(shù)集合，原本比較

16、分散的圖像數(shù)據(jù)在新的坐標(biāo)空間中得到集中，然后對該系數(shù)集合進(jìn)行量化和編碼對于大多數(shù)自然圖像，重要系數(shù)的數(shù)量是比較少的，不重要系數(shù)幅度一般較小，經(jīng)過量化可減少數(shù)據(jù)量，且僅以較小的圖像失真為代價變換編碼q例如，將原始圖像進(jìn)行離散余弦變換（DCT）后，有用的信息集中到左上方，進(jìn)行量化就可以大大壓縮數(shù)據(jù)量52 55 61 66 70 61 64 7363 59 66 90 109 85 69 7262 59 68 113 144 104 66 7363 58 71 122 154 106 70 6967 61 68 104 126 88 68 7079 65 60 70 77 68 58 7585 71

17、 64 59 55 61 65 8387 79 69 68 65 76 78 94-415 -29 -6225 55 -20 -1 3 7 -21 -629 11 -7 -6 6-46 8 77 -25 -30 10 7 -5-50 13 35 -15 -9 6 0 3 11 -8 -13 -2 -1 1 -4 1-10 1 3 -3 -1 0 2 -1-4 -1 2 -1 2 -3 1 -2-1 -1 -1 -2 -1-1 0 -1變換編碼q編碼器：變換編碼首先要將圖像分成若干個（(N/n)2個）nn的子圖像后，再分別進(jìn)行變換和編碼，這是因?yàn)樾K便于處理，而且小塊內(nèi)的像素相關(guān)性較大，存在的冗

18、余度大q解碼器：輸入圖像壓縮圖像壓縮圖像解壓圖像變換的選擇q可以選擇的變換K-L變換、離散傅立葉變換（DFT）、離散余弦變換（DCT）、Walsh-Hadamard變換（WHT）、小波變換q對變換的評價按信息封裝能力排序：KLT，DCT，DFT，WHT，HaarT但KLT的基圖像是數(shù)據(jù)依賴的，因而很少使用。 DFT的塊效應(yīng)嚴(yán)重。常用的是DCT，已被國際標(biāo)準(zhǔn)采納。其優(yōu)點(diǎn)有：基本沒有塊效應(yīng)信息封裝能力強(qiáng)，把最多的信息封裝在最少的系數(shù)中子圖尺寸的選擇q子圖尺寸的選擇要遵循的原則：如果n是子圖的維數(shù)，n應(yīng)該是2的整數(shù)次方。為便于降低計(jì)算復(fù)雜度。n一般選為88或1616。由實(shí)踐得到隨著n的增加，塊效應(yīng)相

19、應(yīng)減少DCT變換編碼qDCT變換和逆變換：q編碼過程：q解碼過程：DCT變換原圖像除以量化系數(shù)取整壓縮圖像DCTDCT逆變換逆變換壓縮圖像壓縮圖像乘以量化系數(shù)乘以量化系數(shù)取整取整解壓解壓圖像圖像1010222) 12(cos) 12(cos),()()(),(MxNyMNMNcyxyxfccF1010222) 12(cos) 12(cos),()()(),(MNMNcMNyxFccyxf1)(21xc0 x1,.,2 , 1Nx其中：其中：DCT變換q可見圖像信號被分解成為直流成分；以及從低頻到高頻的各種余弦成分；而DCT系數(shù)只是表示了該種成分所占原圖像信號的份額大小 q在離散余弦變換的反變換

20、式中，任何像塊都可以表示成64個系數(shù)的不同大小的組合。那么任何像元也可以看成由64個不同幅度的基本圖像的組合。這與任何信號可以分解成基波和不同幅度的諧波的組合具有相同的物理意義。運(yùn)動圖像壓縮q基于如下基本假設(shè)：各連續(xù)幀之間存在著相關(guān)性。q將連續(xù)幀圖像序列，分為參考幀和預(yù)測幀，參考幀用靜止圖像壓縮方法進(jìn)行壓縮（幀內(nèi)編碼），預(yù)測幀對幀差圖像進(jìn)行壓縮（幀間編碼）q由于幀差圖像的數(shù)據(jù)量大大小于參考幀的數(shù)據(jù)量，從而可以達(dá)到很高的壓縮比幀間運(yùn)動補(bǔ)償預(yù)測編碼技術(shù)壓縮圖像塊輸入圖像塊enfn fn運(yùn)動補(bǔ)償預(yù)測幀間誤差圖像運(yùn)動補(bǔ)償預(yù)測圖像幀間預(yù)測編碼qI 幀：不進(jìn)行預(yù)測、進(jìn)行幀內(nèi)編碼（參考幀）qP幀：通過向前預(yù)

21、測得到的誤差編碼幀qB幀：通過雙向預(yù)測得到的誤差編碼幀，因圖像序列存放在存儲器中，可以使用下一幀q向前預(yù)測q雙向預(yù)測前一幀前一幀當(dāng)前幀當(dāng)前幀前一幀前一幀當(dāng)前幀當(dāng)前幀下一幀下一幀運(yùn)動補(bǔ)償q物體在空間上的位移，用有限的運(yùn)動參數(shù)（如運(yùn)動矢量）加以描述，并和預(yù)測誤差一同參與編碼q實(shí)現(xiàn)時，畫面一般劃分成一些不連接的像素塊(在MPEGl和MPEG2標(biāo)準(zhǔn)中一個像素塊為1616像素)，對于每一個這樣的像素塊，只估算一個運(yùn)動矢量K幀K+l 幀塊查找窗口圖像壓縮技術(shù)標(biāo)準(zhǔn)視頻編碼發(fā)展簡史H.261(1988)MPEG-1(1993)H.263(1995)H.263+(1998)H.263+(2000)H.264(

22、MPEG-4Part 10 )(2003)MPEG-4 v1(1999)MPEG-4 v2(2000)MPEG-4 v3(2001) 1988 1990 1992 1994 1996 1998 2000 2002 2003ISO/IECJPEG(1992)ITU-TMPEG-2(H.262)(1994)AVS靜止圖像壓縮編碼標(biāo)準(zhǔn)JPEGqJPEG是Joint Photographic Experts Group的縮寫，即聯(lián)合圖像專家組。該標(biāo)準(zhǔn)是一種適用于靜止圖像壓縮算法的國際標(biāo)準(zhǔn)。在JPEG算法中，共包含四種模式，其中一種是基于DPCM的無損壓縮算法，另外三種是基于DCT的有損壓縮算法。JPE

23、G的編碼模式q無損壓縮編碼模式：采用預(yù)測法和哈夫曼編碼（或算術(shù)編碼）以保證重建圖像與原圖像完全相同（設(shè)均方誤差為零），可見無失真。q基于DCT的順序編碼模式:根據(jù)DCT變換原理，從上到下，從左到右順序地對圖像數(shù)據(jù)進(jìn)行壓縮編碼。信息傳送到接收端時，首先按照上述規(guī)律進(jìn)行解碼，從而還原圖像。在此過程中存在信息丟失，因此這是一種有損圖像壓縮編碼。q基于DCT的累進(jìn)編碼模式：它也是以DCT變換為基礎(chǔ)的，但是其掃描過程不同。它是通過多次掃描的方法來對一幅圖像進(jìn)行數(shù)據(jù)壓縮。其描述過程是由粗到細(xì)逐步累加的方式進(jìn)行的。圖像還原時，在屏幕上首先看到的是圖像的大致情況，而后逐步地細(xì)化，直到全部還原出來為止。q基于D

24、CT的分層編碼模式：這種模式是以圖像分辨率為基準(zhǔn)進(jìn)行圖像編碼的。它首先是從低分辯率開始，逐步提高分辨率，直至與原圖像的分辨率相同為止。圖像重建時也是如此。無損壓縮編碼在傳真機(jī)、靜止畫面的電話電視會議應(yīng)用中，根據(jù)其特點(diǎn)JPEG采用DPCM（差分脈沖編碼調(diào)制）無損壓縮編碼方案，其編碼過程如圖所示。順序編碼模式圖像分量編碼要經(jīng)過多次掃描才完成。q第一次掃描只進(jìn)行一次粗糙圖像的掃描壓縮，以相對于總的傳輸時間快得多的時間傳輸粗糙圖像，并重建一幀質(zhì)量較低的可識別圖像；在隨后的掃描中再對圖像作較細(xì)的壓縮，這時只傳遞增加的信息，可重建一幅質(zhì)量提高一些的圖像。這樣不斷累進(jìn)，直到滿意的圖像為止。q需在量

25、化器的輸出與熵編碼的輸入之間，增加一個足以存儲量化后DCT系數(shù)的緩沖區(qū)，對緩沖區(qū)中存儲的DCT系數(shù)多次掃描，分批編碼。累進(jìn)操作方式編碼累進(jìn)編碼模式(1)把原始圖像空間分辨率降低。(2)對已降低分辨率的圖像采用基于DCT的順序方式、累進(jìn)方式或無失真預(yù)測編碼中的任何一種編碼方法進(jìn)行編碼。(3)對低分辨率的圖像解碼，重建圖像，使用插值濾波器，對它插值，恢復(fù)圖像的水平和垂直分辨率。(4)把分辨率已升高的圖像作為原始圖像的預(yù)測值，對它們的差值采用基于DCT的順序方式、累進(jìn)方式或用無失真方式進(jìn)行編碼。(5)重復(fù)(3)、(4)直到圖像達(dá)到完整的分辨率。分層操作模式JPEG壓縮流程q編碼流程：q解碼流程：量

26、化器DCT變換構(gòu)造8x8的子圖輸入圖像符號編碼器壓縮數(shù)據(jù)量化表碼表壓縮數(shù)據(jù)符號解碼器DCT逆變換反量化器量化表輸出圖像碼表(從壓縮數(shù)據(jù)中得到)顏色空間轉(zhuǎn)換qJPEG使用的顏色空間不是RGB空間，而是YCbCr空間，在進(jìn)行DCT變換之前完成，這是因?yàn)槿搜蹖α炼刃畔⒏舾校嗷ブg的轉(zhuǎn)換為：R = Y + 1.40200(Cr 128)G = Y 0.34414(Cb 128) 0.71414(Cr 128)B = Y + 1.77200(Cb 128)Y = 0.299R + 0.5870G + 0.1140BCb = 0.1787R 0.3313G +0.5000B +128Cr = 0.50

27、00R 0.4187G 0.0813B + 128量化qY為亮度分量，需要細(xì)量化，CbCr為色度分量，可以粗量化，因此量化表有2張），從而提高壓縮比qDCT變換之后低頻分量集中在左上角，代表直流（DC）系數(shù)，由于兩個相鄰的子塊DC系數(shù)相差很小，采用差分編碼（DPCM），可以提高壓縮比后面的63個元素為高頻分量，代表交流（AC）系數(shù)，采用行程編碼，通過“之”字型（Zigzag）排列方法來保證低頻分量先出現(xiàn)，高頻分量后出現(xiàn)熵編碼使用熵編碼還可以對使用熵編碼還可以對DPCMDPCM編碼后的直流編碼后的直流DCDC系數(shù)和系數(shù)和RLERLE編碼后的交流編碼后的交流ACAC系數(shù)作進(jìn)一步的系數(shù)作進(jìn)一步的壓

28、縮。壓縮。 JPEGJPEG標(biāo)準(zhǔn)規(guī)定了兩種熵編碼算法：哈夫標(biāo)準(zhǔn)規(guī)定了兩種熵編碼算法：哈夫曼編碼和自適應(yīng)算術(shù)編碼。哈夫曼編碼采用曼編碼和自適應(yīng)算術(shù)編碼。哈夫曼編碼采用的一般是固定的哈夫曼編碼表，而不是臨時的一般是固定的哈夫曼編碼表，而不是臨時統(tǒng)計(jì)出來的，并且對亮度分量和色度分量采統(tǒng)計(jì)出來的，并且對亮度分量和色度分量采用了不同的哈夫曼表。用了不同的哈夫曼表。組織碼流JPEGJPEG編碼的最后一個步驟是把各種標(biāo)記代編碼的最后一個步驟是把各種標(biāo)記代碼和編碼后的圖像數(shù)據(jù)組成一幀一幀的數(shù)碼和編碼后的圖像數(shù)據(jù)組成一幀一幀的數(shù)據(jù)，為了便于傳輸、存儲和譯碼，據(jù)，為了便于傳輸、存儲和譯碼，q 2000年12月公布

29、的新的JPEG 2000標(biāo)準(zhǔn)(ISO 15444), 其目標(biāo)是在高壓縮率的情況下, 如何保證圖像傳輸?shù)馁|(zhì)量。qJPEG2000與JPEG算法上的區(qū)別：采用了以小波變換為主的多分辨率編碼方式統(tǒng)一了面向灰度圖像和二值圖像的編碼方式JPEG2000(1)高壓縮率。JPEG和JPEG2000在壓縮率相同時， JPEG2000的信噪比將提高30左右；(3)漸進(jìn)傳輸。JPEG2000可實(shí)現(xiàn)依分辨率或者精度的漸進(jìn)傳輸；(4)感興趣區(qū)域壓縮。JPEG2000 支持所謂的“感興趣區(qū)域”。JPEG2000主要特點(diǎn)第一個視頻編碼國際標(biāo)準(zhǔn)H.261視頻數(shù)據(jù)格式采用CIF（通用中間格式）和QCIF格式（1/4CIF）作

30、為視頻輸入格式。H.261的數(shù)據(jù)結(jié)構(gòu)圖像數(shù)據(jù)層次結(jié)構(gòu)幀幀QCIF塊組塊組123456宏塊宏塊8CIF塊塊8圖像層是由幀首和12個塊組層構(gòu)成。其中幀首包括一個20比特幀起始碼和其他標(biāo)志信息，如幀數(shù)、視頻格式（CIF/QCIF）等。塊組層是由GOB首和33個宏塊構(gòu)成，其中GOB首中包含16bit塊組編號、塊組量化步長等標(biāo)志信號。宏塊層是由宏塊首和其后面的6個數(shù)據(jù)塊構(gòu)成，MB首包括宏塊地址、類型信息、運(yùn)動矢量數(shù)據(jù)和編碼塊圖樣等信息。塊層是由DCT系數(shù)（TCOEFT）和塊結(jié)束符（EOB）組成。每塊包含88個數(shù)據(jù)。H.263H.263標(biāo)準(zhǔn)是一種甚低碼率通信的視頻編碼方案。所謂甚低碼率視頻編碼技術(shù)是指

31、壓縮編碼后的碼率低于64kbit/s的各種壓縮編碼方案. H.263能夠支持更多圖像格式采用半精度像素的預(yù)測值基于語法的算術(shù)編碼提高數(shù)據(jù)壓縮效率MPEG系列qMPEG是Moving Picture Experts Group的英文縮寫，其含義是活動圖像專家組。qMPEG-1是1993年8月正式通過的技術(shù)標(biāo)準(zhǔn)，其全稱為“適用于約1.5Mbit/s以下數(shù)字存儲媒體的運(yùn)動圖像及伴音的編碼”。qMPEG-2是1994年11月發(fā)布的“活動圖像及其伴音通用編碼”標(biāo)準(zhǔn)，該標(biāo)準(zhǔn)可以應(yīng)用于（2.048Mbit/s20Mbit/s）的各種速率和各種分辨率的應(yīng)用場合之中。如多媒體計(jì)算機(jī)、多媒體數(shù)據(jù)庫、多媒體通信、常

32、規(guī)數(shù)字電視、高清晰度電視以及交互式電視等。qMPEG-4，1999年1月公布了該標(biāo)準(zhǔn)的V1.0版本，同年12月公布了V2.0版本。該標(biāo)準(zhǔn)主要應(yīng)用于超低速系統(tǒng)之中，例如視頻會議和視頻電視、交互式視頻游戲和多媒體郵件、基于網(wǎng)絡(luò)的數(shù)據(jù)業(yè)務(wù)、遠(yuǎn)程視頻監(jiān)視及無線多媒體通信。特別是它能夠滿足基于內(nèi)容的訪問和檢索的多媒體應(yīng)用，并且其編碼系統(tǒng)是開放的，可隨時加入新的有效算法模塊。qMPEG-7是2000年11月頒布的稱為“多媒體內(nèi)容描述接口”的標(biāo)準(zhǔn)。定義該標(biāo)準(zhǔn)的目的是制定出一系列的標(biāo)準(zhǔn)描述符來描述各種媒體信息。這種描述與多媒體信息的內(nèi)容有關(guān)，這樣將便于用戶進(jìn)行基于內(nèi)容和對象的視聽信息的快速搜索。可見MPEG-

33、7與其他MPEG標(biāo)準(zhǔn)的不同之處在于它只提供了與內(nèi)容有關(guān)的描述符，并不包括具體的視音頻壓縮算法，而且還未形成與內(nèi)容提交有關(guān)的所有標(biāo)準(zhǔn)的總框架。qMPEG-21的全稱為“多媒體框架”。MPEG-1qMPEG-1標(biāo)準(zhǔn)是由三個部分構(gòu)成第二部分為視頻部分，主要規(guī)定了圖像壓縮編碼方法，編號為11172-2。第一部分是系統(tǒng)部分，編號為11172-1。它描述了幾種伴音和圖像壓縮數(shù)據(jù)的復(fù)用以及加入同步信號后的整個系統(tǒng)。第三部分為音頻部分，主要規(guī)定了數(shù)字伴音壓縮編碼，編號為11172-3。MPEG1的系統(tǒng)部分MPEG-1標(biāo)準(zhǔn)的系統(tǒng)部分主要按定時信息的指示，將視頻和音頻數(shù)據(jù)流同步復(fù)合成一個完整的MPEG-1比特流，

34、從而便于信息的存儲與傳輸。在此過程將向數(shù)據(jù)流中加入相關(guān)的識別與同步信息，這樣在接收端，可以根據(jù)這些信息，從接收數(shù)據(jù)流中分離出視頻與音頻數(shù)據(jù)流，并分別送往各自的解碼器進(jìn)行同步解碼和播放。視頻部分MPEG1碼流結(jié)構(gòu)MPEG1 的幀內(nèi)編碼塊匹配塊匹配法（Block Matching Algorithm）需要解決兩個關(guān)鍵問題：（1）匹配準(zhǔn)則（2）搜索算法BMA中常用的匹配準(zhǔn)則：絕對值：均方誤差：平均絕對幀差：二維對數(shù)搜索法三步搜索法對偶搜索法P幀的編碼方法B幀的編碼方法幀類型的安排一個典型的I、P、B圖像安排如下圖所示。編碼參數(shù)為：幀內(nèi)圖像I的距離為N=15，預(yù)測圖像(P)的距離為M=3。I I、P

35、 P和和B B圖像壓縮后，圖像壓縮后，I I幀圖像的數(shù)據(jù)量最大，而幀圖像的數(shù)據(jù)量最大，而B B幀圖幀圖像的數(shù)據(jù)量最小。像的數(shù)據(jù)量最小。MPEG-2MPEG-4q運(yùn)動圖像專家組MPEG 于1999年2月正式公布了MPEG-4（ISO/IEC14496）標(biāo)準(zhǔn)第一版本。同年年底MPEG-4第二版亦確定，且于2000年年初正式成為國際標(biāo)準(zhǔn)。qMPEG-4是一種第二代視音頻編碼技術(shù)。它是一種適用于各種多媒體應(yīng)用的“視音頻對象編碼”標(biāo)準(zhǔn)。（1）MPEG-4與MPEG-1/2標(biāo)準(zhǔn)的根本區(qū)別：MPEG-4是基于內(nèi)容的壓縮編碼方法引入視頻對象VO(Viedo Object)和視頻對象平面VOP(Video O

36、bject Plane)概念（2）MPEG4提供：（1）基于內(nèi)容的交互性（2）高效的壓縮性（3）通用的訪問性（1）基于內(nèi)容的交互性 qMPEG-4提供了基于內(nèi)容的多媒體數(shù)據(jù)訪問工具，如索引、超級鏈接、上下載、刪除等。利用這些工具，用戶可以方便地從多媒體數(shù)據(jù)庫中有選擇地獲取自己所需的與對象有關(guān)的內(nèi)容，并提供了內(nèi)容的操作和位流編輯功能，可應(yīng)用于交互式家庭購物，淡入淡出的數(shù)字化效果等。MPEG-4提供了高效的自然或合成的多媒體數(shù)據(jù)編碼方法。它可以把自然場景或?qū)ο蠼M合起來成為合成的多媒體數(shù)據(jù)。（2）高效的壓縮性q MPEG-4基于更高的編碼效率。同已有的或即將形成的其它標(biāo)準(zhǔn)相比，在相同的比特率下，它基于更高的視覺聽覺質(zhì)量，這就使得在低帶寬的信道上傳送視頻、音頻成為可能。同時MPEG-4還能對同時發(fā)生的數(shù)據(jù)流進(jìn)行編碼。一個場景的多視角或多聲道數(shù)

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

圖像與視頻編碼

文檔簡介

溫馨提示

最新文檔

評論

圖像與視頻編碼

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔