多媒體信息的數(shù)據(jù)壓縮課件

上傳人：t*** IP屬地：貴州上傳時(shí)間：2022-12-28 格式：PPT 頁(yè)數(shù)：94 大?。?32.03KB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩89頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類型1.5.2數(shù)據(jù)壓縮方法1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1編輯版pppt1.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類1.5.1多媒體數(shù)據(jù)的冗余類型圖像數(shù)據(jù)表示中存在著大量的冗余，圖像數(shù)據(jù)壓縮技術(shù)就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下：1.空間冗余2.時(shí)間冗余3.視覺冗余2編輯版pppt1.5.1多媒體數(shù)據(jù)的冗余類型圖像數(shù)據(jù)表示中存在著大量空間冗余一幅圖像表面上各采樣點(diǎn)的顏色之間往往存在著空間連貫性，基于離散像素采樣來表示物體表面顏色的像素存儲(chǔ)方式可利用空間連貫性，達(dá)到減少數(shù)據(jù)量的目的。例如，在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域，在此區(qū)域中所有點(diǎn)的光強(qiáng)和色彩以及飽和度都是相同的，因此數(shù)據(jù)有很大的空間冗余。3編輯版pppt空間冗余一幅圖像表面上各采樣點(diǎn)的顏色之3編輯版pppt時(shí)間冗余運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間的一組連續(xù)畫面，其中的相鄰幀往往包含相同的背景和移動(dòng)物體，只不過移動(dòng)物體所在的空間位置略有不同，所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方，這種共同性是由于相鄰幀記錄了相鄰時(shí)刻的同一場(chǎng)景畫面，所以稱為時(shí)間冗余。同理，語(yǔ)音數(shù)據(jù)中也存在著時(shí)間冗余。4編輯版pppt時(shí)間冗余運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間4編輯版pppt視覺冗余人類的視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感度是非均勻的。但是，在記錄原始的圖像數(shù)據(jù)時(shí)，通常假定視覺系統(tǒng)近似線性的和均勻的，對(duì)視覺敏感和不敏感的部分同等對(duì)待，從而產(chǎn)生比理想編碼（即把視覺敏感和不敏感的部分區(qū)分開來的編碼）更多的數(shù)據(jù)，這就是視覺冗余。5編輯版pppt視覺冗余人類的視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感度5編輯版pppt數(shù)字壓縮技術(shù)三個(gè)重要指標(biāo)1、信息存儲(chǔ)量之比大2、壓縮的算法簡(jiǎn)單3、恢復(fù)效果好6編輯版pppt數(shù)字壓縮技術(shù)三個(gè)重要指標(biāo)1、信息存儲(chǔ)量之比1.5.2數(shù)據(jù)壓縮方法壓縮處理一般是由兩個(gè)過程組成：一是編碼過程，即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮，以便存儲(chǔ)與傳輸；二是解碼過程，此過程對(duì)編碼數(shù)據(jù)進(jìn)行解碼，還原為可以使用的數(shù)據(jù)。數(shù)據(jù)壓縮可分為兩種類型：一種叫做無損壓縮，另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮7編輯版pppt1.5.2數(shù)據(jù)壓縮方法壓縮處理一般是由兩個(gè)過程組成：什么是熵

數(shù)據(jù)壓縮不僅起源于40年代由ClaudeShannon首創(chuàng)的信息論，而且其基本原理即信息究竟能被壓縮到多小，至今依然遵循信息論中的一條定理，這條定理借用了熱力學(xué)中的名詞“熵”(Entropy)來表示一條信息中真正需要編碼的信息量：

考慮用0和1組成的二進(jìn)制數(shù)碼為含有n個(gè)符號(hào)的某條信息編碼，假設(shè)符號(hào)Fn在整條信息中重復(fù)出現(xiàn)的概率為Pn，則該符號(hào)的熵也即表示該符號(hào)所需的位數(shù)位為：

En=-log2(Pn)整條信息的熵也即表示整條信息所需的位數(shù)為：E=∑En

8編輯版pppt什么是熵

數(shù)據(jù)壓縮不僅起源于40年代由Cl舉個(gè)例子，對(duì)下面這條只出現(xiàn)了abc三個(gè)字符的字符串：

aabbaccbaa

字符串長(zhǎng)度為10，字符abc分別出現(xiàn)了532次，則abc在信息中出現(xiàn)的概率分別為0.50.30.2，他們的熵分別為：

Ea=-log2(0.5)=1Eb=-log2(0.3)=1.737Ec=-log2(0.2)=2.322整條信息的熵也即表達(dá)整個(gè)字符串需要的位數(shù)為：

E=Ea*5+Eb*3+Ec*2=14.855位回想一下如果用計(jì)算機(jī)中常用的ASCII編碼，表示上面的字符串我們需要整整80位呢！現(xiàn)在知道信息為什么能被壓縮而不丟失原有的信息內(nèi)容了吧。簡(jiǎn)單地講，用較少的位數(shù)表示較頻繁出現(xiàn)的符號(hào)，這就是數(shù)據(jù)壓縮的基本準(zhǔn)則。

9編輯版pppt舉個(gè)例子，對(duì)下面這條只出現(xiàn)了abc三個(gè)字符的字符串：模型

從上面的描述，我們明白，要壓縮一條信息，首先要分析清楚信息中每個(gè)符號(hào)出現(xiàn)的概率。不同的壓縮程序通過不同的方法確定符號(hào)的出現(xiàn)概率，對(duì)符號(hào)的概率計(jì)算得越準(zhǔn)確，也就越容易得到好的壓縮效果。在壓縮程序中，用來處理輸入信息，計(jì)算符號(hào)的概率并決定輸出哪個(gè)或哪些代碼的模塊叫做模型。

難道對(duì)信息中字符的出現(xiàn)概率這么難以估計(jì)以至于有各種不同的壓縮模型嗎？對(duì)上面的字符串我們不是很容易就知道每個(gè)字符的概率了嗎？不過上面的字符串僅有10個(gè)字符長(zhǎng)呀，那只是例子而已?？紤]我們現(xiàn)實(shí)中要壓縮的文件，大多數(shù)可是有幾十K甚至幾百K長(zhǎng)，幾M字節(jié)的文件不是也屢見不鮮嗎？

是的，我們可以預(yù)先掃描文件中的所有字符，統(tǒng)計(jì)出每個(gè)字符出現(xiàn)的概率，這種方法在壓縮術(shù)語(yǔ)里叫做“靜態(tài)統(tǒng)計(jì)模型”。但是，不同的文件中，字符有不同的分布概率，我們要么先花上大量的時(shí)間統(tǒng)計(jì)我們要壓縮的所有文件中的字符概率，要么為每一個(gè)單獨(dú)的文件保存一份概率表以備解壓縮時(shí)需要。糟糕的是，不但掃描文件要消耗大量時(shí)間，而且保存一份概率表也使壓縮后的文件增大了不少。所以，在實(shí)際應(yīng)用中，“靜態(tài)統(tǒng)計(jì)模型”應(yīng)用的很少。

10編輯版pppt模型

從上面的描述，我們明白，要壓縮一條信息，首先要分析清楚

真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東西。自適應(yīng)模型可以說是一臺(tái)具有學(xué)習(xí)功能的自動(dòng)機(jī)。他在信息被輸入之前對(duì)信息內(nèi)容一無所知并假定每個(gè)字符的出現(xiàn)概率均等，隨著字符不斷被輸入和編碼，他統(tǒng)計(jì)并紀(jì)錄已經(jīng)出現(xiàn)過的字符的概率并將這些概率應(yīng)用于對(duì)后續(xù)字符的編碼。也就是說，自適應(yīng)模型在壓縮開始時(shí)壓縮效果并不理想，但隨著壓縮的進(jìn)行，他會(huì)越來越接近字符概率的準(zhǔn)確值，并達(dá)到理想的壓縮效果。自適應(yīng)模型還可以適應(yīng)輸入信息中字符分布的突然變化，可以適應(yīng)不同的文件中的字符分布而不需要保存概率表。

11編輯版pppt真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東編碼通過模型，我們已經(jīng)確定了對(duì)某一個(gè)符號(hào)該用多少位二進(jìn)制數(shù)進(jìn)行編碼。現(xiàn)在的問題是，如何設(shè)計(jì)一種編碼方案，使其盡量精確地用模型計(jì)算出來的位數(shù)表示某個(gè)符號(hào)。最先被考慮的問題是，如果對(duì)a用3個(gè)二進(jìn)制位就可以表示，而對(duì)b用4個(gè)二進(jìn)制位就可以表示，那么，在解碼時(shí)，面對(duì)一連串的二進(jìn)制流，我怎么知道哪三個(gè)位是a，哪四個(gè)位是b呢？所以，必須設(shè)計(jì)出一種編碼方式，使得解碼程序可以方便地分離每個(gè)字符的編碼部分。于是有了一種叫“前綴編碼”的技術(shù)。該技術(shù)的主導(dǎo)思想是，任何一個(gè)字符的編碼，都不是另一個(gè)字符編碼的前綴。反過來說就是，任何一個(gè)字符的編碼，都不是由另一個(gè)字符的編碼加上若干位0或1組成。看一下前綴編碼的一個(gè)最簡(jiǎn)單的例子12編輯版pppt編碼12編輯版pppt符號(hào)編碼A0B10C110D1110E11110有了上面的碼表，你一定可以輕松地從下面這串二進(jìn)制流中分辨出真正的信息內(nèi)容了：1110010101110110111100010-DABBDCEAAB13編輯版pppt符號(hào)編碼A013編輯版pppt無損壓縮無損壓縮常用在原始數(shù)據(jù)的存檔，如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。其原理是統(tǒng)計(jì)壓縮數(shù)據(jù)中的冗余(重復(fù)的數(shù)據(jù))部分。常用的有：RLE(runlengthencoding)行程編碼Huffman編碼算術(shù)編碼LZW(lempel-ziv-welch)編碼14編輯版pppt無損壓縮無損壓縮常用在原始數(shù)據(jù)的存檔，14編輯版ppptShannon-Fano編碼

討論之前，我們假定要編碼字符的出現(xiàn)概率已經(jīng)由某一模型統(tǒng)計(jì)出來，例如，對(duì)下面這串出現(xiàn)了五種字符的信息(40個(gè)字符長(zhǎng)):

cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別：a-16，b-7，c-6，d-6，e-5。

Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹，構(gòu)造的方式非常簡(jiǎn)單：

15編輯版ppptShannon-Fano編碼

討論之前，我們假定要編碼字Shannon-Fano編碼

進(jìn)入Huffman先生構(gòu)造的神奇二叉樹之前，我們先來看一下它的前身，由ClaudeShannon和R.M.Fano兩人提出的Shannon-Fano編碼。

cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別：a-16，b-7，c-6，d-6，e-5。

Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹，構(gòu)造的方式非常簡(jiǎn)單：

16編輯版ppptShannon-Fano編碼

進(jìn)入Huffman先生構(gòu)1)將給定符號(hào)按照其頻率從大到小排序。對(duì)上面的例子，應(yīng)該得到：a-16b-7c-6d-6e-5

2)將序列分成上下兩部分，使得上部頻率總和盡可能接近下部頻率總和。我們有：a-16b-7-----------------c-6d-6e-5

3)我們把第二步中劃分出的上部作為二叉樹的左子樹，記0，下部作為二叉樹的右子樹，記1。4)分別對(duì)左右子樹重復(fù)23兩步，直到所有的符號(hào)都成為二叉樹的樹葉為止?，F(xiàn)在我們有如下的二叉樹：根(root)0|1+------+------+0|10|1+-----+-----++---+----+||||abc|0|1+-----+-----+||de

17編輯版pppt1)將給定符號(hào)按照其頻率從大到小排序。對(duì)上面的例子，應(yīng)該得于是我們得到了此信息的編碼表：

a-00b-01c-10d-110e-111

可以將例子中的信息編碼為：

cabcedeacacdeddaaabaababaaabbacdebaceada10000110

11111011100100010......碼長(zhǎng)共91位?？紤]用ASCII碼表示上述信息需要8*40=240位，我們確實(shí)實(shí)現(xiàn)了數(shù)據(jù)壓縮

18編輯版pppt于是我們得到了此信息的編碼表：

a-00b-01Huffman編碼Huffman編碼構(gòu)造二叉樹的方法和Shannon-Fano正好相反，不是自上而下，而是從樹葉到樹根生成二叉樹?，F(xiàn)在，我們?nèi)匀皇褂蒙厦娴睦觼韺W(xué)習(xí)Huffman編碼方法。1)將各個(gè)符號(hào)及其出現(xiàn)頻率分別作為不同的小二叉樹（目前每棵樹只有根節(jié)點(diǎn)）。a(16)b(7)c(6)d(6)e(5)

2)在1中得到的樹林里找出頻率值最小的兩棵樹，將他們分別作為左、右子樹連成一棵大一些的二叉樹，該二叉樹的頻率值為兩棵子樹頻率值之和。對(duì)上面的例子，我們得到一個(gè)新的樹林：|(11)a(16)b(7)c(6)+---+---+||de

3)對(duì)上面得到的樹林重復(fù)2的做法，直到所有符號(hào)都連入樹中為止。這一步完成后，我們有這樣的二叉樹：根(root)0|1+------+----------------+|0|1|+---------+-----------+|0|10|1a+-------+------++-------+-------+||||bcde由此，我們可以建立和Shannon-Fano編碼略微不同的編碼表：

a-0b-100c-101d-110e-111

19編輯版ppptHuffman編碼a(16)b(7)對(duì)例子中信息的編碼為：cabcedeacacdeddaaabaababaaabbacdebaceada101010010111111011101010101......

碼長(zhǎng)共88位。這比使用Shannon-Fano編碼要更短一點(diǎn)。讓我們回顧一下熵的知識(shí)，使用我們?cè)诘诙聦W(xué)到的計(jì)算方法，上面的例子中，每個(gè)字符的熵為：Ea=-log2(16/40)=1.322Eb=-log2(7/40)=2.515Ec=-log2(6/40)=2.737Ed=-log2(6/40)=2.737Ee=-log2(5/40)=3.000

信息的熵為：也就是說，表示該條信息最少需要86.601位。我們看到，Shannon-Fano編碼和Huffman編碼都已經(jīng)比較接近該信息的熵值了。20編輯版pppt對(duì)例子中信息的編碼為：20編輯版pppt(1)、行程編碼（RLE） RLE編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號(hào)表示。例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B。 RLE編碼簡(jiǎn)單直觀，編碼/解碼速度快，因此許多圖形和視頻文件，如.BMP.TIFF及AVI等格式文件的壓縮均采用此方法.21編輯版pppt(1)、行程編碼（RLE） RLE編碼簡(jiǎn)單直觀，編碼/解碼速(3)、算術(shù)編碼其方法是將被編碼的信源消息表示成實(shí)數(shù)軸0-1之間的一個(gè)間隔，消息越長(zhǎng)，編碼表示它的間隔就越小，表示這一間隔所需的二進(jìn)制位數(shù)就越多。該方法實(shí)現(xiàn)較為復(fù)雜，常與其它有損壓縮結(jié)合使用，并在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG)中扮演重要角色。22編輯版pppt(3)、算術(shù)編碼該方法實(shí)現(xiàn)較為復(fù)雜，常與其它有22編輯版p(4)、LZW編碼 LZW(Lempel-Ziv-Welch)壓縮使用字典庫(kù)查找方案。它讀入待壓縮的數(shù)據(jù)并與一個(gè)字典庫(kù)(庫(kù)開始是空的)中的字符串對(duì)比，如有匹配的字符串，則輸出該字符串?dāng)?shù)據(jù)在字典庫(kù)中的位置索引，否則將該字符串插入字典中。許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用了設(shè)方法。另外，.GIF和.TIF格式的圖形文件也是按這一文件存儲(chǔ)的。23編輯版pppt(4)、LZW編碼許多商品壓縮軟件如ARJ、PKZIR、2有損壓縮圖像或聲音的頻帶寬、信息豐富，人類視覺和聽覺器官對(duì)頻帶中某些頻率成分不大敏感，有損壓縮以犧牲這部分信息為代價(jià)，換取了較高的壓縮比。常用的有損壓縮方法有：PCM(脈沖編碼調(diào)制)、預(yù)測(cè)編碼、變換編碼、插值與外推等。新一代的數(shù)據(jù)壓縮方法有：矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。24編輯版pppt有損壓縮圖像或聲音的頻帶寬、信息豐富，常用的有損壓縮方法預(yù)測(cè)編碼：根據(jù)某一數(shù)據(jù)模型利用以往的樣本值對(duì)新樣本值進(jìn)行預(yù)測(cè)，然后將樣本實(shí)際值與預(yù)測(cè)值的差值進(jìn)行編碼。如果模型足夠好，且樣本序列的時(shí)間相關(guān)性較強(qiáng)，那么誤差信號(hào)的幅度將遠(yuǎn)小于原始信號(hào)，可以用較少的值對(duì)其差值量化，得到較好的壓縮效果。預(yù)測(cè)編碼常用的是差分脈沖編碼調(diào)制（DPCM）和自適應(yīng)的差分脈沖編碼調(diào)制（ADPCM）。25編輯版pppt預(yù)測(cè)編碼：25編輯版pppt分形編碼：

分形的方法是把一幅數(shù)字圖像，通過一些圖像處理技術(shù)，如顏色分割，邊緣檢測(cè)、頻譜分析、統(tǒng)理變化分析等原始圖像分成一些子圖像。然后在分形集中查找這樣的子圖像。分形集實(shí)際上并不是存儲(chǔ)所有可能的子圖像，而是存儲(chǔ)許多迭代函數(shù)，通過迭代函數(shù)的反復(fù)迭代，可以恢復(fù)出原來的圖像26編輯版pppt26編輯版pppt混合壓縮混合壓縮是利用了各種單一壓縮的長(zhǎng)處，以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。該方法在許多情況下被應(yīng)用，如JPEG和MPEG標(biāo)準(zhǔn)就采用了混合編碼的壓縮方法。27編輯版pppt混合壓縮混合壓縮是利用了各種單一壓縮的27編輯版pppt音頻信號(hào)編碼的分類：1、基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼2、基于音頻的聲學(xué)參數(shù)，進(jìn)行參數(shù)編碼3、基于人的聽覺特性進(jìn)行編碼28編輯版pppt音頻信號(hào)編碼的分類：1、基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼28編音頻信號(hào)的編碼方式：（1）波形編碼，如PCM、APC、ATC等（2）分析合成方法（參數(shù)編碼方法）如PLC（3）混合編碼方法29編輯版pppt音頻信號(hào)的編碼方式：（1）波形編碼，如PCM、APC、ATCMP3的全名是MPEGAudioLayer-3，簡(jiǎn)單的說就是一種聲音文件的壓縮格式。1987年德國(guó)的研究機(jī)構(gòu)IIS(InstituteIntegrierteSchaltungen)開始著手一項(xiàng)聲音編碼及數(shù)字音頻廣播的計(jì)劃，名稱叫做EUREKAEUl47，即MP3的前身。之后，這項(xiàng)計(jì)劃由IIS與Erlangen大學(xué)共同合作，開發(fā)出一套非常強(qiáng)大的算法，經(jīng)由150國(guó)際標(biāo)準(zhǔn)組織認(rèn)證之后，符合ISO-MPEGAudioLayer-3標(biāo)準(zhǔn)，就成為現(xiàn)在的MP3。

30編輯版ppptMP3的全名是MPEGAudioLayer-3，簡(jiǎn)單的說ISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個(gè)使用高性能音頻數(shù)據(jù)壓縮方法的感知編碼方案(perceptualcodingschemes)。按照壓縮質(zhì)量(每Bit的聲音效果)和編碼方案的復(fù)雜程度分別是Layer1、Layer2、Layer3。

所有這三層的編碼采用的基本結(jié)構(gòu)是相同的。它們?cè)诓捎脗鹘y(tǒng)的頻譜分析和編碼技術(shù)的基礎(chǔ)上還應(yīng)用了子帶分析和心理聲學(xué)模型理論。也就是通過研究人耳和大腦聽覺神經(jīng)對(duì)音頻失真的敏感度，在編碼時(shí)先分析聲音文件的波形，利用濾波器找出噪音電平(NoiseLevel)，然后濾去人耳不敏感的信號(hào)，

通過矩陣量化的方式將余下的數(shù)據(jù)每一位打散排列，最后編碼形成MPEG的文件。而音質(zhì)聽起來與CD相差不大。

31編輯版ppptISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個(gè)使用高性能音頻數(shù)據(jù)壓MP3的好處在于大幅降低數(shù)字聲音文件的容量，而不會(huì)破壞原來的音質(zhì)。以CD音質(zhì)的Wave文件來說，如抽樣分辨率為l6bit，抽樣頻率44.1kHz，聲音模式為立體聲，那么存儲(chǔ)l秒鐘CD音質(zhì)的Wave文件，必須要用l6bit*44100Hz*2Stereo=1411200bit，也就是相當(dāng)于1411.2kbit的存儲(chǔ)容量，存儲(chǔ)介質(zhì)的負(fù)擔(dān)相當(dāng)大。不過通過MP3格式壓縮后，文件便可壓縮為原來的1/10到l/12，每l秒鐘的MP3只需大約112-128kbit就可以了。

32編輯版ppptMP3的好處在于大幅降低數(shù)字聲音文件的容量，而不會(huì)破壞原來的聲音品質(zhì)與MP3壓縮比例關(guān)系表如下：

聲音質(zhì)量帶寬模式比特率壓縮比率電話2.5kHz單聲道8kbps*96:1好于短波4.5kHz單聲道16kbps48:1好于調(diào)幅廣播7.5kHz單聲道32kbps24:1類似調(diào)頻廣播11kHz立體聲56-64kbps26-24:1接近CD15kHz立體聲96kbps16:1CD>15kHz立體聲112-128kbps14-12:133編輯版pppt聲音品質(zhì)與MP3壓縮比例關(guān)系表如下：聲音質(zhì)量帶寬模式比特率壓1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)3．視頻通信編碼標(biāo)準(zhǔn)34編輯版pppt1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)靜止圖像壓縮標(biāo)準(zhǔn) 國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的“聯(lián)合照片專家組“JPEG

(jointphotographicexpertsgroup)于1991年提出的“多灰度靜止圖像的數(shù)字壓縮編碼“(簡(jiǎn)稱JPEG標(biāo)準(zhǔn))。這是一個(gè)適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。35編輯版pppt靜止圖像壓縮標(biāo)準(zhǔn) 國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)35編輯

JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率和量化精度。它包含兩部分： 1、基于DCT的有損壓縮方法2、基于預(yù)測(cè)方法的無損壓縮方法36編輯版pppt JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率36編輯版pppt視頻信號(hào)的壓縮編碼

一、視頻信號(hào)的壓縮編碼分類無損壓縮：利用數(shù)據(jù)的統(tǒng)計(jì)特性來進(jìn)行數(shù)據(jù)壓縮，典型的編碼:Huffman編碼、算術(shù)編碼等。不失真壓縮比低有損壓縮：利用人的視覺特性使解壓縮后的圖像看起來與原始圖像一樣。壓縮比高如：預(yù)測(cè)編碼、變換編碼、模型編碼及混合編碼等。37編輯版pppt視頻信號(hào)的壓縮編碼一、視頻信號(hào)的壓縮編碼分類37編輯版pp運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)

視頻圖像壓縮的一個(gè)重要標(biāo)準(zhǔn)是MPEG(MovingPictureExpertsGroup)于1990年形成的一個(gè)標(biāo)準(zhǔn)草案(簡(jiǎn)稱MPEG標(biāo)準(zhǔn))。它兼顧了JPEG標(biāo)準(zhǔn)和CCITT專家組的H.261標(biāo)準(zhǔn)。MPEG制訂過三種版本的運(yùn)動(dòng)圖像及其伴音的編碼標(biāo)準(zhǔn)，即MPEG1、MPEG2和MPEG3。1998年又推出了兩種新的圖像壓縮編碼標(biāo)準(zhǔn)，這就是MPEG4和MPEG738編輯版pppt運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn) 視頻圖像壓縮的一個(gè)重要標(biāo)準(zhǔn)是38編輯版pp圖像壓縮技術(shù)一覽表壓縮標(biāo)準(zhǔn)MPEG4MPEG2MPEG1MJPEG特點(diǎn)兼容前幾種標(biāo)準(zhǔn)，采用更為優(yōu)化的編碼技術(shù)，基于場(chǎng)景描述和面向帶寬設(shè)計(jì)基于幀重建算法進(jìn)行壓縮和傳輸，動(dòng)態(tài)監(jiān)測(cè)圖像變化，根據(jù)對(duì)象的空間及時(shí)間特征來調(diào)整壓縮方法，幀間加入預(yù)測(cè)幀單獨(dú)對(duì)一幀進(jìn)行壓縮,基本不考慮視頻流中不同幀之間的變化優(yōu)點(diǎn)圖像質(zhì)量好;可變帶寬傳輸;錯(cuò)誤恢復(fù)能力強(qiáng)。壓縮比可調(diào)范圍廣，支持包括高速體育運(yùn)動(dòng)在內(nèi)的活動(dòng)圖像在實(shí)時(shí)壓縮、每幀數(shù)據(jù)量和處理速度上優(yōu)于MJPEG圖像質(zhì)量好缺點(diǎn)無現(xiàn)成算法，實(shí)現(xiàn)的技術(shù)難度大壓縮效率仍不理想、窄帶網(wǎng)傳輸質(zhì)量受限，對(duì)媒體的兼容能力有待提高圖像質(zhì)量相當(dāng)于VHS視頻，不能滿足廣播級(jí)的要求；傳輸帶寬有一定的要求。實(shí)時(shí)性差，壓縮效率低,文件量巨大應(yīng)用領(lǐng)域固定和無線網(wǎng)絡(luò)，交互AV服務(wù)以及遠(yuǎn)程傳輸DVD,廣播級(jí)的數(shù)字電視,HDTVVCD,CD-ROM,VOD

39編輯版pppt圖像壓縮技術(shù)一覽表壓縮標(biāo)準(zhǔn)MPEG4MPEG2MPEG1M分辨率768X576（PAL）或720X480(NTSC)NTSC:720X480SIF標(biāo)準(zhǔn)分辨率(NTSC：352X240；PAL：352X288)

碼流多種帶寬可調(diào)分四級(jí)，3-100Mbits/sec最高1.5Mbits/sec

圖像質(zhì)量在各種碼率下畫質(zhì)良好極低碼率下無法保證圖像質(zhì)量基本無法進(jìn)行窄帶傳輸

多路實(shí)時(shí)存儲(chǔ)多路實(shí)時(shí)存儲(chǔ)，占用存儲(chǔ)空間小能實(shí)現(xiàn)多路實(shí)時(shí)存儲(chǔ)，文件量大，消耗硬盤。能實(shí)現(xiàn)多路實(shí)時(shí)存儲(chǔ)，文件量大，消耗硬盤。單路存儲(chǔ)，丟幀切換聯(lián)網(wǎng)要求全帶寬解決方案，支持PSTN，ISDN，DDN，局域網(wǎng)，廣域網(wǎng)等適用于局域網(wǎng)適用于局域網(wǎng)定制帶寬，不支持聯(lián)網(wǎng)。40編輯版pppt分辨率768X576（PAL）或720X480(NTSC)

MPEG標(biāo)準(zhǔn)分成MPEG視頻、MPEG音頻和MPEG系統(tǒng)三大部分。 MPEG算法除了對(duì)單幅圖像進(jìn)行編碼外(幀內(nèi)編碼)，還利用圖像序列的相關(guān)特性去除幀間圖像冗余，大大提高了視頻圖像的壓縮比。壓縮比可達(dá)到60-100倍。41編輯版pppt MPEG標(biāo)準(zhǔn)分成MPEG視頻、MPEG音頻 MPEG算法除MPEG與其它算法或壓縮方案相比有什么優(yōu)點(diǎn)?

一、國(guó)際化的開放標(biāo)準(zhǔn)，兼容性好，代表技術(shù)發(fā)展趨勢(shì)。

二、能夠比其他算法提供更好的壓縮比。

三、MPEG在提供高壓縮比的同時(shí)，對(duì)數(shù)據(jù)的損失很小。42編輯版ppptMPEG與其它算法或壓縮方案相比有什么優(yōu)點(diǎn)?

一、國(guó)際化的JPEG和MPEG的差別

MPEG視頻壓縮技術(shù)是針對(duì)運(yùn)動(dòng)圖像的數(shù)據(jù)壓縮技術(shù)。為了提高壓縮比，幀內(nèi)圖像數(shù)據(jù)和幀間圖像數(shù)據(jù)壓縮技術(shù)必須同時(shí)使用。MPEG通過幀運(yùn)動(dòng)補(bǔ)償有效地壓縮了數(shù)據(jù)的比特?cái)?shù)，它采用了三種圖像，幀內(nèi)圖、預(yù)測(cè)圖和雙向預(yù)測(cè)圖。有效地減少了冗余信息。對(duì)于MPEG來說，幀間數(shù)據(jù)壓縮、運(yùn)動(dòng)補(bǔ)償和雙向預(yù)測(cè)，這是和JPEG主要不同的地方。而JPEG和MPEG相同的地方均采用了DCT幀內(nèi)圖像數(shù)據(jù)壓縮編碼。43編輯版ppptJPEG和MPEG的差別 MPEG視頻壓縮技術(shù)是針對(duì)運(yùn)動(dòng)圖JPEG和MPEG的差別

另外，MPEG中視頻信號(hào)包含有靜止畫面（幀內(nèi)圖）和運(yùn)動(dòng)信息（幀間預(yù)測(cè)圖）等不同的內(nèi)容，量化器的設(shè)計(jì)比JPEG壓縮算法中量化器的設(shè)計(jì)考慮的因素要多。44編輯版ppptJPEG和MPEG的差別另外，MPEG中視頻信號(hào)包含有靜止視頻通信編碼標(biāo)準(zhǔn) 多媒體通信中的電視圖像編碼標(biāo)準(zhǔn)都采用H.261和H.263。H.261主要用來支持電視會(huì)議和可視電話。電視圖像數(shù)據(jù)壓縮后的數(shù)據(jù)速率為P×64kb/s，其中P是一個(gè)可變參數(shù)，取值范圍是1-30。 H.263是在H.261的基礎(chǔ)上開發(fā)的電視圖像編碼標(biāo)準(zhǔn)，用于低位速率通信的電視圖像編碼。45編輯版pppt視頻通信編碼標(biāo)準(zhǔn) 多媒體通信中的電視圖像編碼標(biāo)準(zhǔn) 電視圖像數(shù)關(guān)于壓縮比

衡量一個(gè)壓縮算法好壞的標(biāo)準(zhǔn)，除了解壓后的數(shù)據(jù)有無失真或失真程度之外，是看壓縮比的大小。壓縮比常用的定義有兩種：（1）采樣壓縮比（2）比特壓縮比46編輯版pppt關(guān)于壓縮比衡量一個(gè)壓縮算法好壞的標(biāo)準(zhǔn)，除了解壓后的數(shù)據(jù)有無感謝親觀看此幻燈片，此課件部分內(nèi)容來源于網(wǎng)絡(luò)，如有侵權(quán)請(qǐng)及時(shí)聯(lián)系我們刪除，謝謝配合！47感謝親觀看此幻燈片，此課件部分內(nèi)容來源于網(wǎng)絡(luò)，471.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類型1.5.2數(shù)據(jù)壓縮方法1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)48編輯版pppt1.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類1.5.1多媒體數(shù)據(jù)的冗余類型圖像數(shù)據(jù)表示中存在著大量的冗余，圖像數(shù)據(jù)壓縮技術(shù)就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下：1.空間冗余2.時(shí)間冗余3.視覺冗余49編輯版pppt1.5.1多媒體數(shù)據(jù)的冗余類型圖像數(shù)據(jù)表示中存在著大量空間冗余一幅圖像表面上各采樣點(diǎn)的顏色之間往往存在著空間連貫性，基于離散像素采樣來表示物體表面顏色的像素存儲(chǔ)方式可利用空間連貫性，達(dá)到減少數(shù)據(jù)量的目的。例如，在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域，在此區(qū)域中所有點(diǎn)的光強(qiáng)和色彩以及飽和度都是相同的，因此數(shù)據(jù)有很大的空間冗余。50編輯版pppt空間冗余一幅圖像表面上各采樣點(diǎn)的顏色之3編輯版pppt時(shí)間冗余運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間的一組連續(xù)畫面，其中的相鄰幀往往包含相同的背景和移動(dòng)物體，只不過移動(dòng)物體所在的空間位置略有不同，所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方，這種共同性是由于相鄰幀記錄了相鄰時(shí)刻的同一場(chǎng)景畫面，所以稱為時(shí)間冗余。同理，語(yǔ)音數(shù)據(jù)中也存在著時(shí)間冗余。51編輯版pppt時(shí)間冗余運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間4編輯版pppt視覺冗余人類的視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感度是非均勻的。但是，在記錄原始的圖像數(shù)據(jù)時(shí)，通常假定視覺系統(tǒng)近似線性的和均勻的，對(duì)視覺敏感和不敏感的部分同等對(duì)待，從而產(chǎn)生比理想編碼（即把視覺敏感和不敏感的部分區(qū)分開來的編碼）更多的數(shù)據(jù)，這就是視覺冗余。52編輯版pppt視覺冗余人類的視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感度5編輯版pppt數(shù)字壓縮技術(shù)三個(gè)重要指標(biāo)1、信息存儲(chǔ)量之比大2、壓縮的算法簡(jiǎn)單3、恢復(fù)效果好53編輯版pppt數(shù)字壓縮技術(shù)三個(gè)重要指標(biāo)1、信息存儲(chǔ)量之比1.5.2數(shù)據(jù)壓縮方法壓縮處理一般是由兩個(gè)過程組成：一是編碼過程，即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮，以便存儲(chǔ)與傳輸；二是解碼過程，此過程對(duì)編碼數(shù)據(jù)進(jìn)行解碼，還原為可以使用的數(shù)據(jù)。數(shù)據(jù)壓縮可分為兩種類型：一種叫做無損壓縮，另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮54編輯版pppt1.5.2數(shù)據(jù)壓縮方法壓縮處理一般是由兩個(gè)過程組成：什么是熵

En=-log2(Pn)整條信息的熵也即表示整條信息所需的位數(shù)為：E=∑En

55編輯版pppt什么是熵

數(shù)據(jù)壓縮不僅起源于40年代由Cl舉個(gè)例子，對(duì)下面這條只出現(xiàn)了abc三個(gè)字符的字符串：

aabbaccbaa

字符串長(zhǎng)度為10，字符abc分別出現(xiàn)了532次，則abc在信息中出現(xiàn)的概率分別為0.50.30.2，他們的熵分別為：

Ea=-log2(0.5)=1Eb=-log2(0.3)=1.737Ec=-log2(0.2)=2.322整條信息的熵也即表達(dá)整個(gè)字符串需要的位數(shù)為：

56編輯版pppt舉個(gè)例子，對(duì)下面這條只出現(xiàn)了abc三個(gè)字符的字符串：模型

57編輯版pppt模型

從上面的描述，我們明白，要壓縮一條信息，首先要分析清楚

58編輯版pppt真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東編碼通過模型，我們已經(jīng)確定了對(duì)某一個(gè)符號(hào)該用多少位二進(jìn)制數(shù)進(jìn)行編碼。現(xiàn)在的問題是，如何設(shè)計(jì)一種編碼方案，使其盡量精確地用模型計(jì)算出來的位數(shù)表示某個(gè)符號(hào)。最先被考慮的問題是，如果對(duì)a用3個(gè)二進(jìn)制位就可以表示，而對(duì)b用4個(gè)二進(jìn)制位就可以表示，那么，在解碼時(shí)，面對(duì)一連串的二進(jìn)制流，我怎么知道哪三個(gè)位是a，哪四個(gè)位是b呢？所以，必須設(shè)計(jì)出一種編碼方式，使得解碼程序可以方便地分離每個(gè)字符的編碼部分。于是有了一種叫“前綴編碼”的技術(shù)。該技術(shù)的主導(dǎo)思想是，任何一個(gè)字符的編碼，都不是另一個(gè)字符編碼的前綴。反過來說就是，任何一個(gè)字符的編碼，都不是由另一個(gè)字符的編碼加上若干位0或1組成?？匆幌虑熬Y編碼的一個(gè)最簡(jiǎn)單的例子59編輯版pppt編碼12編輯版pppt符號(hào)編碼A0B10C110D1110E11110有了上面的碼表，你一定可以輕松地從下面這串二進(jìn)制流中分辨出真正的信息內(nèi)容了：1110010101110110111100010-DABBDCEAAB60編輯版pppt符號(hào)編碼A013編輯版pppt無損壓縮無損壓縮常用在原始數(shù)據(jù)的存檔，如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。其原理是統(tǒng)計(jì)壓縮數(shù)據(jù)中的冗余(重復(fù)的數(shù)據(jù))部分。常用的有：RLE(runlengthencoding)行程編碼Huffman編碼算術(shù)編碼LZW(lempel-ziv-welch)編碼61編輯版pppt無損壓縮無損壓縮常用在原始數(shù)據(jù)的存檔，14編輯版ppptShannon-Fano編碼

cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別：a-16，b-7，c-6，d-6，e-5。

Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹，構(gòu)造的方式非常簡(jiǎn)單：

62編輯版ppptShannon-Fano編碼

討論之前，我們假定要編碼字Shannon-Fano編碼

進(jìn)入Huffman先生構(gòu)造的神奇二叉樹之前，我們先來看一下它的前身，由ClaudeShannon和R.M.Fano兩人提出的Shannon-Fano編碼。

cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別：a-16，b-7，c-6，d-6，e-5。

Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹，構(gòu)造的方式非常簡(jiǎn)單：

63編輯版ppptShannon-Fano編碼

進(jìn)入Huffman先生構(gòu)1)將給定符號(hào)按照其頻率從大到小排序。對(duì)上面的例子，應(yīng)該得到：a-16b-7c-6d-6e-5

2)將序列分成上下兩部分，使得上部頻率總和盡可能接近下部頻率總和。我們有：a-16b-7-----------------c-6d-6e-5

64編輯版pppt1)將給定符號(hào)按照其頻率從大到小排序。對(duì)上面的例子，應(yīng)該得于是我們得到了此信息的編碼表：

a-00b-01c-10d-110e-111

可以將例子中的信息編碼為：

cabcedeacacdeddaaabaababaaabbacdebaceada10000110

11111011100100010......碼長(zhǎng)共91位?？紤]用ASCII碼表示上述信息需要8*40=240位，我們確實(shí)實(shí)現(xiàn)了數(shù)據(jù)壓縮

65編輯版pppt于是我們得到了此信息的編碼表：

a-0b-100c-101d-110e-111

66編輯版ppptHuffman編碼a(16)b(7)對(duì)例子中信息的編碼為：cabcedeacacdeddaaabaababaaabbacdebaceada101010010111111011101010101......

信息的熵為：也就是說，表示該條信息最少需要86.601位。我們看到，Shannon-Fano編碼和Huffman編碼都已經(jīng)比較接近該信息的熵值了。67編輯版pppt對(duì)例子中信息的編碼為：20編輯版pppt(1)、行程編碼（RLE） RLE編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號(hào)表示。例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B。 RLE編碼簡(jiǎn)單直觀，編碼/解碼速度快，因此許多圖形和視頻文件，如.BMP.TIFF及AVI等格式文件的壓縮均采用此方法.68編輯版pppt(1)、行程編碼（RLE） RLE編碼簡(jiǎn)單直觀，編碼/解碼速(3)、算術(shù)編碼其方法是將被編碼的信源消息表示成實(shí)數(shù)軸0-1之間的一個(gè)間隔，消息越長(zhǎng)，編碼表示它的間隔就越小，表示這一間隔所需的二進(jìn)制位數(shù)就越多。該方法實(shí)現(xiàn)較為復(fù)雜，常與其它有損壓縮結(jié)合使用，并在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG)中扮演重要角色。69編輯版pppt(3)、算術(shù)編碼該方法實(shí)現(xiàn)較為復(fù)雜，常與其它有22編輯版p(4)、LZW編碼 LZW(Lempel-Ziv-Welch)壓縮使用字典庫(kù)查找方案。它讀入待壓縮的數(shù)據(jù)并與一個(gè)字典庫(kù)(庫(kù)開始是空的)中的字符串對(duì)比，如有匹配的字符串，則輸出該字符串?dāng)?shù)據(jù)在字典庫(kù)中的位置索引，否則將該字符串插入字典中。許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用了設(shè)方法。另外，.GIF和.TIF格式的圖形文件也是按這一文件存儲(chǔ)的。70編輯版pppt(4)、LZW編碼許多商品壓縮軟件如ARJ、PKZIR、2有損壓縮圖像或聲音的頻帶寬、信息豐富，人類視覺和聽覺器官對(duì)頻帶中某些頻率成分不大敏感，有損壓縮以犧牲這部分信息為代價(jià)，換取了較高的壓縮比。常用的有損壓縮方法有：PCM(脈沖編碼調(diào)制)、預(yù)測(cè)編碼、變換編碼、插值與外推等。新一代的數(shù)據(jù)壓縮方法有：矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。71編輯版pppt有損壓縮圖像或聲音的頻帶寬、信息豐富，常用的有損壓縮方法預(yù)測(cè)編碼：根據(jù)某一數(shù)據(jù)模型利用以往的樣本值對(duì)新樣本值進(jìn)行預(yù)測(cè)，然后將樣本實(shí)際值與預(yù)測(cè)值的差值進(jìn)行編碼。如果模型足夠好，且樣本序列的時(shí)間相關(guān)性較強(qiáng)，那么誤差信號(hào)的幅度將遠(yuǎn)小于原始信號(hào)，可以用較少的值對(duì)其差值量化，得到較好的壓縮效果。預(yù)測(cè)編碼常用的是差分脈沖編碼調(diào)制（DPCM）和自適應(yīng)的差分脈沖編碼調(diào)制（ADPCM）。72編輯版pppt預(yù)測(cè)編碼：25編輯版pppt分形編碼：

分形的方法是把一幅數(shù)字圖像，通過一些圖像處理技術(shù)，如顏色分割，邊緣檢測(cè)、頻譜分析、統(tǒng)理變化分析等原始圖像分成一些子圖像。然后在分形集中查找這樣的子圖像。分形集實(shí)際上并不是存儲(chǔ)所有可能的子圖像，而是存儲(chǔ)許多迭代函數(shù)，通過迭代函數(shù)的反復(fù)迭代，可以恢復(fù)出原來的圖像73編輯版pppt26編輯版pppt混合壓縮混合壓縮是利用了各種單一壓縮的長(zhǎng)處，以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。該方法在許多情況下被應(yīng)用，如JPEG和MPEG標(biāo)準(zhǔn)就采用了混合編碼的壓縮方法。74編輯版pppt混合壓縮混合壓縮是利用了各種單一壓縮的27編輯版pppt音頻信號(hào)編碼的分類：1、基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼2、基于音頻的聲學(xué)參數(shù)，進(jìn)行參數(shù)編碼3、基于人的聽覺特性進(jìn)行編碼75編輯版pppt音頻信號(hào)編碼的分類：1、基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼28編音頻信號(hào)的編碼方式：（1）波形編碼，如PCM、APC、ATC等（2）分析合成方法（參數(shù)編碼方法）如PLC（3）混合編碼方法76編輯版pppt音頻信號(hào)的編碼方式：（1）波形編碼，如PCM、APC、ATCMP3的全名是MPEGAudioLayer-3，簡(jiǎn)單的說就是一種聲音文件的壓縮格式。1987年德國(guó)的研究機(jī)構(gòu)IIS(InstituteIntegrierteSchaltungen)開始著手一項(xiàng)聲音編碼及數(shù)字音頻廣播的計(jì)劃，名稱叫做EUREKAEUl47，即MP3的前身。之后，這項(xiàng)計(jì)劃由IIS與Erlangen大學(xué)共同合作，開發(fā)出一套非常強(qiáng)大的算法，經(jīng)由150國(guó)際標(biāo)準(zhǔn)組織認(rèn)證之后，符合ISO-MPEGAudioLayer-3標(biāo)準(zhǔn)，就成為現(xiàn)在的MP3。

77編輯版ppptMP3的全名是MPEGAudioLayer-3，簡(jiǎn)單的說ISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個(gè)使用高性能音頻數(shù)據(jù)壓縮方法的感知編碼方案(perceptualcodingschemes)。按照壓縮質(zhì)量(每Bit的聲音效果)和編碼方案的復(fù)雜程度分別是Layer1、Layer2、Layer3。

通過矩陣量化的方式將余下的數(shù)據(jù)每一位打散排列，最后編碼形成MPEG的文件。而音質(zhì)聽起來與CD相差不大。

78編輯版ppptISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個(gè)使用高性能音頻數(shù)據(jù)壓MP3的好處在于大幅降低數(shù)字聲音文件的容量，而不會(huì)破壞原來的音質(zhì)。以CD音質(zhì)的Wave文件來說，如抽樣分辨率為l6bit，抽樣頻率44.1kHz，聲音模式為立體聲，那么存儲(chǔ)l秒鐘CD音質(zhì)的Wave文件，必須要用l6bit*44100Hz*2Stereo=1411200bit，也就是相當(dāng)于1411.2kbit的存儲(chǔ)容量，存儲(chǔ)介質(zhì)的負(fù)擔(dān)相當(dāng)大。不過通過MP3格式壓縮后，文件便可壓縮為原來的1/10到l/12，每l秒鐘的MP3只需大約112-128kbit就可以了。

79編輯版ppptMP3的好處在于大幅降低數(shù)字聲音文件的容量，而不會(huì)破壞原來的聲音品質(zhì)與MP3壓縮比例關(guān)系表如下：

聲音質(zhì)量帶寬模式比特率壓縮比率電話2.5kHz單聲道8kbps*96:1好于短波4.5kHz單聲道16kbps48:1好于調(diào)幅廣播7.5kHz單聲道32kbps24:1類似調(diào)頻廣播11kHz立體聲56-64kbps26-24:1接近CD15kHz立體聲96kbps16:1CD>15kHz立體聲112-128kbps14-12:180編輯版pppt聲音品質(zhì)與MP3壓縮比例關(guān)系表如下：聲音質(zhì)量帶寬模式比特率壓1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)3．視頻通信編碼標(biāo)準(zhǔn)81編輯版pppt1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)靜止圖像壓縮標(biāo)準(zhǔn) 國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的“聯(lián)合照片專家組“JPEG

(jointphotographicexpertsgroup)于1991年提出的“多灰度靜止圖像的數(shù)字壓縮編碼“(簡(jiǎn)稱JPEG標(biāo)準(zhǔn))。這是一個(gè)適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。82編輯版pppt靜止圖像壓縮標(biāo)準(zhǔn) 國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)35編輯

JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率和量化精度。它包含兩部

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多媒體信息的數(shù)據(jù)壓縮課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

多媒體信息的數(shù)據(jù)壓縮課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔