多媒體信息的數(shù)據(jù)壓縮課件_第1頁(yè)
多媒體信息的數(shù)據(jù)壓縮課件_第2頁(yè)
多媒體信息的數(shù)據(jù)壓縮課件_第3頁(yè)
多媒體信息的數(shù)據(jù)壓縮課件_第4頁(yè)
多媒體信息的數(shù)據(jù)壓縮課件_第5頁(yè)
已閱讀5頁(yè),還剩89頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類型1.5.2數(shù)據(jù)壓縮方法1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1編輯版pppt1.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類1.5.1多媒體數(shù)據(jù)的冗余類型 圖像數(shù)據(jù)表示中存在著大量的冗余,圖像數(shù)據(jù)壓縮技術(shù)就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下:1.空間冗余2.時(shí)間冗余3.視覺冗余2編輯版pppt1.5.1多媒體數(shù)據(jù)的冗余類型 圖像數(shù)據(jù)表示中存在著大量空間冗余 一幅圖像表面上各采樣點(diǎn)的顏色之間往往存在著空間連貫性,基于離散像素采樣來表示物體表面顏色的像素存儲(chǔ)方式可利用空間連貫性,達(dá)到減少數(shù)據(jù)量的目的。 例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在此區(qū)域中所有點(diǎn)的光強(qiáng)和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。3編輯版pppt空間冗余 一幅圖像表面上各采樣點(diǎn)的顏色之3編輯版pppt時(shí)間冗余 運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動(dòng)物體,只不過移動(dòng)物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時(shí)刻的同一場(chǎng)景畫面,所以稱為時(shí)間冗余。 同理,語(yǔ)音數(shù)據(jù)中也存在著時(shí)間冗余。4編輯版pppt時(shí)間冗余 運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間4編輯版pppt視覺冗余 人類的視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感度是非均勻的。但是,在記錄原始的圖像數(shù)據(jù)時(shí),通常假定視覺系統(tǒng)近似線性的和均勻的,對(duì)視覺敏感和不敏感的部分同等對(duì)待,從而產(chǎn)生比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來的編碼)更多的數(shù)據(jù),這就是視覺冗余。5編輯版pppt視覺冗余 人類的視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感度5編輯版pppt數(shù)字壓縮技術(shù)三個(gè)重要指標(biāo)1、信息存儲(chǔ)量之比大2、壓縮的算法簡(jiǎn)單3、恢復(fù)效果好6編輯版pppt數(shù)字壓縮技術(shù)三個(gè)重要指標(biāo)1、信息存儲(chǔ)量之比1.5.2數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個(gè)過程組成:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮,以便存儲(chǔ)與傳輸;二是解碼過程,此過程對(duì)編碼數(shù)據(jù)進(jìn)行解碼,還原為可以使用的數(shù)據(jù)。 數(shù)據(jù)壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮7編輯版pppt1.5.2數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個(gè)過程組成: 什么是熵

數(shù)據(jù)壓縮不僅起源于40年代由ClaudeShannon首創(chuàng)的信息論,而且其基本原理即信息究竟能被壓縮到多小,至今依然遵循信息論中的一條定理,這條定理借用了熱力學(xué)中的名詞“熵”(Entropy)來表示一條信息中真正需要編碼的信息量:

考慮用0和1組成的二進(jìn)制數(shù)碼為含有n個(gè)符號(hào)的某條信息編碼,假設(shè)符號(hào)Fn在整條信息中重復(fù)出現(xiàn)的概率為Pn,則該符號(hào)的熵也即表示該符號(hào)所需的位數(shù)位為:

En=-log2(Pn)整條信息的熵也即表示整條信息所需的位數(shù)為:E=∑En

8編輯版pppt什么是熵

數(shù)據(jù)壓縮不僅起源于40年代由Cl舉個(gè)例子,對(duì)下面這條只出現(xiàn)了abc三個(gè)字符的字符串:

aabbaccbaa

字符串長(zhǎng)度為10,字符abc分別出現(xiàn)了532次,則abc在信息中出現(xiàn)的概率分別為0.50.30.2,他們的熵分別為:

Ea=-log2(0.5)=1Eb=-log2(0.3)=1.737Ec=-log2(0.2)=2.322整條信息的熵也即表達(dá)整個(gè)字符串需要的位數(shù)為:

E=Ea*5+Eb*3+Ec*2=14.855位回想一下如果用計(jì)算機(jī)中常用的ASCII編碼,表示上面的字符串我們需要整整80位呢!現(xiàn)在知道信息為什么能被壓縮而不丟失原有的信息內(nèi)容了吧。簡(jiǎn)單地講,用較少的位數(shù)表示較頻繁出現(xiàn)的符號(hào),這就是數(shù)據(jù)壓縮的基本準(zhǔn)則。

9編輯版pppt舉個(gè)例子,對(duì)下面這條只出現(xiàn)了abc三個(gè)字符的字符串:模型

從上面的描述,我們明白,要壓縮一條信息,首先要分析清楚信息中每個(gè)符號(hào)出現(xiàn)的概率。不同的壓縮程序通過不同的方法確定符號(hào)的出現(xiàn)概率,對(duì)符號(hào)的概率計(jì)算得越準(zhǔn)確,也就越容易得到好的壓縮效果。在壓縮程序中,用來處理輸入信息,計(jì)算符號(hào)的概率并決定輸出哪個(gè)或哪些代碼的模塊叫做模型。

難道對(duì)信息中字符的出現(xiàn)概率這么難以估計(jì)以至于有各種不同的壓縮模型嗎?對(duì)上面的字符串我們不是很容易就知道每個(gè)字符的概率了嗎?不過上面的字符串僅有10個(gè)字符長(zhǎng)呀,那只是例子而已??紤]我們現(xiàn)實(shí)中要壓縮的文件,大多數(shù)可是有幾十K甚至幾百K長(zhǎng),幾M字節(jié)的文件不是也屢見不鮮嗎?

是的,我們可以預(yù)先掃描文件中的所有字符,統(tǒng)計(jì)出每個(gè)字符出現(xiàn)的概率,這種方法在壓縮術(shù)語(yǔ)里叫做“靜態(tài)統(tǒng)計(jì)模型”。但是,不同的文件中,字符有不同的分布概率,我們要么先花上大量的時(shí)間統(tǒng)計(jì)我們要壓縮的所有文件中的字符概率,要么為每一個(gè)單獨(dú)的文件保存一份概率表以備解壓縮時(shí)需要。糟糕的是,不但掃描文件要消耗大量時(shí)間,而且保存一份概率表也使壓縮后的文件增大了不少。所以,在實(shí)際應(yīng)用中,“靜態(tài)統(tǒng)計(jì)模型”應(yīng)用的很少。

10編輯版pppt模型

從上面的描述,我們明白,要壓縮一條信息,首先要分析清楚

真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東西。自適應(yīng)模型可以說是一臺(tái)具有學(xué)習(xí)功能的自動(dòng)機(jī)。他在信息被輸入之前對(duì)信息內(nèi)容一無所知并假定每個(gè)字符的出現(xiàn)概率均等,隨著字符不斷被輸入和編碼,他統(tǒng)計(jì)并紀(jì)錄已經(jīng)出現(xiàn)過的字符的概率并將這些概率應(yīng)用于對(duì)后續(xù)字符的編碼。也就是說,自適應(yīng)模型在壓縮開始時(shí)壓縮效果并不理想,但隨著壓縮的進(jìn)行,他會(huì)越來越接近字符概率的準(zhǔn)確值,并達(dá)到理想的壓縮效果。自適應(yīng)模型還可以適應(yīng)輸入信息中字符分布的突然變化,可以適應(yīng)不同的文件中的字符分布而不需要保存概率表。

11編輯版pppt真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東編碼通過模型,我們已經(jīng)確定了對(duì)某一個(gè)符號(hào)該用多少位二進(jìn)制數(shù)進(jìn)行編碼。現(xiàn)在的問題是,如何設(shè)計(jì)一種編碼方案,使其盡量精確地用模型計(jì)算出來的位數(shù)表示某個(gè)符號(hào)。最先被考慮的問題是,如果對(duì)a用3個(gè)二進(jìn)制位就可以表示,而對(duì)b用4個(gè)二進(jìn)制位就可以表示,那么,在解碼時(shí),面對(duì)一連串的二進(jìn)制流,我怎么知道哪三個(gè)位是a,哪四個(gè)位是b呢?所以,必須設(shè)計(jì)出一種編碼方式,使得解碼程序可以方便地分離每個(gè)字符的編碼部分。于是有了一種叫“前綴編碼”的技術(shù)。該技術(shù)的主導(dǎo)思想是,任何一個(gè)字符的編碼,都不是另一個(gè)字符編碼的前綴。反過來說就是,任何一個(gè)字符的編碼,都不是由另一個(gè)字符的編碼加上若干位0或1組成。看一下前綴編碼的一個(gè)最簡(jiǎn)單的例子12編輯版pppt編碼12編輯版pppt符號(hào)編碼A0B10C110D1110E11110有了上面的碼表,你一定可以輕松地從下面這串二進(jìn)制流中分辨出真正的信息內(nèi)容了:1110010101110110111100010-DABBDCEAAB13編輯版pppt符號(hào)編碼A013編輯版pppt無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。 其原理是統(tǒng)計(jì)壓縮數(shù)據(jù)中的冗余(重復(fù)的數(shù)據(jù))部分。常用的有:RLE(runlengthencoding)行程編碼Huffman編碼算術(shù)編碼LZW(lempel-ziv-welch)編碼14編輯版pppt無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,14編輯版ppptShannon-Fano編碼

討論之前,我們假定要編碼字符的出現(xiàn)概率已經(jīng)由某一模型統(tǒng)計(jì)出來,例如,對(duì)下面這串出現(xiàn)了五種字符的信息(40個(gè)字符長(zhǎng)):

cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別:a-16,b-7,c-6,d-6,e-5。

Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹,構(gòu)造的方式非常簡(jiǎn)單:

15編輯版ppptShannon-Fano編碼

討論之前,我們假定要編碼字Shannon-Fano編碼

進(jìn)入Huffman先生構(gòu)造的神奇二叉樹之前,我們先來看一下它的前身,由ClaudeShannon和R.M.Fano兩人提出的Shannon-Fano編碼。

討論之前,我們假定要編碼字符的出現(xiàn)概率已經(jīng)由某一模型統(tǒng)計(jì)出來,例如,對(duì)下面這串出現(xiàn)了五種字符的信息(40個(gè)字符長(zhǎng)):

cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別:a-16,b-7,c-6,d-6,e-5。

Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹,構(gòu)造的方式非常簡(jiǎn)單:

16編輯版ppptShannon-Fano編碼

進(jìn)入Huffman先生構(gòu)1)將給定符號(hào)按照其頻率從大到小排序。對(duì)上面的例子,應(yīng)該得到:a-16b-7c-6d-6e-5

2)將序列分成上下兩部分,使得上部頻率總和盡可能接近下部頻率總和。我們有:a-16b-7-----------------c-6d-6e-5

3)我們把第二步中劃分出的上部作為二叉樹的左子樹,記0,下部作為二叉樹的右子樹,記1。4)分別對(duì)左右子樹重復(fù)23兩步,直到所有的符號(hào)都成為二叉樹的樹葉為止?,F(xiàn)在我們有如下的二叉樹:根(root)0|1+------+------+0|10|1+-----+-----++---+----+||||abc|0|1+-----+-----+||de

17編輯版pppt1)將給定符號(hào)按照其頻率從大到小排序。對(duì)上面的例子,應(yīng)該得于是我們得到了此信息的編碼表:

a-00b-01c-10d-110e-111

可以將例子中的信息編碼為:

cabcedeacacdeddaaabaababaaabbacdebaceada10000110

11111011100100010......碼長(zhǎng)共91位??紤]用ASCII碼表示上述信息需要8*40=240位,我們確實(shí)實(shí)現(xiàn)了數(shù)據(jù)壓縮

18編輯版pppt于是我們得到了此信息的編碼表:

a-00b-01Huffman編碼Huffman編碼構(gòu)造二叉樹的方法和Shannon-Fano正好相反,不是自上而下,而是從樹葉到樹根生成二叉樹?,F(xiàn)在,我們?nèi)匀皇褂蒙厦娴睦觼韺W(xué)習(xí)Huffman編碼方法。1)將各個(gè)符號(hào)及其出現(xiàn)頻率分別作為不同的小二叉樹(目前每棵樹只有根節(jié)點(diǎn))。a(16)b(7)c(6)d(6)e(5)

2)在1中得到的樹林里找出頻率值最小的兩棵樹,將他們分別作為左、右子樹連成一棵大一些的二叉樹,該二叉樹的頻率值為兩棵子樹頻率值之和。對(duì)上面的例子,我們得到一個(gè)新的樹林:|(11)a(16)b(7)c(6)+---+---+||de

3)對(duì)上面得到的樹林重復(fù)2的做法,直到所有符號(hào)都連入樹中為止。這一步完成后,我們有這樣的二叉樹:根(root)0|1+------+----------------+|0|1|+---------+-----------+|0|10|1a+-------+------++-------+-------+||||bcde由此,我們可以建立和Shannon-Fano編碼略微不同的編碼表:

a-0b-100c-101d-110e-111

19編輯版ppptHuffman編碼a(16)b(7)對(duì)例子中信息的編碼為:cabcedeacacdeddaaabaababaaabbacdebaceada101010010111111011101010101......

碼長(zhǎng)共88位。這比使用Shannon-Fano編碼要更短一點(diǎn)。讓我們回顧一下熵的知識(shí),使用我們?cè)诘诙聦W(xué)到的計(jì)算方法,上面的例子中,每個(gè)字符的熵為:Ea=-log2(16/40)=1.322Eb=-log2(7/40)=2.515Ec=-log2(6/40)=2.737Ed=-log2(6/40)=2.737Ee=-log2(5/40)=3.000

信息的熵為:也就是說,表示該條信息最少需要86.601位。我們看到,Shannon-Fano編碼和Huffman編碼都已經(jīng)比較接近該信息的熵值了。20編輯版pppt對(duì)例子中信息的編碼為:20編輯版pppt(1)、行程編碼(RLE) RLE編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號(hào)表示。 例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B。 RLE編碼簡(jiǎn)單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如.BMP.TIFF及AVI等格式文件的壓縮均采用此方法.21編輯版pppt(1)、行程編碼(RLE) RLE編碼簡(jiǎn)單直觀,編碼/解碼速(3)、算術(shù)編碼 其方法是將被編碼的信源消息表示成實(shí)數(shù)軸0-1之間的一個(gè)間隔,消息越長(zhǎng),編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位數(shù)就越多。 該方法實(shí)現(xiàn)較為復(fù)雜,常與其它有損壓縮結(jié)合使用,并在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG)中扮演重要角色。22編輯版pppt(3)、算術(shù)編碼 該方法實(shí)現(xiàn)較為復(fù)雜,常與其它有22編輯版p(4)、LZW編碼 LZW(Lempel-Ziv-Welch)壓縮使用字典庫(kù)查找方案。它讀入待壓縮的數(shù)據(jù)并與一個(gè)字典庫(kù)(庫(kù)開始是空的)中的字符串對(duì)比,如有匹配的字符串,則輸出該字符串?dāng)?shù)據(jù)在字典庫(kù)中的位置索引,否則將該字符串插入字典中。 許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用了設(shè)方法。 另外,.GIF和.TIF格式的圖形文件也是按這一文件存儲(chǔ)的。23編輯版pppt(4)、LZW編碼 許多商品壓縮軟件如ARJ、PKZIR、2有損壓縮 圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對(duì)頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息為代價(jià),換取了較高的壓縮比。 常用的有損壓縮方法有:PCM(脈沖編碼調(diào)制)、預(yù)測(cè)編碼、變換編碼、插值與外推等。 新一代的數(shù)據(jù)壓縮方法有:矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。24編輯版pppt有損壓縮 圖像或聲音的頻帶寬、信息豐富, 常用的有損壓縮方法預(yù)測(cè)編碼:根據(jù)某一數(shù)據(jù)模型利用以往的樣本值對(duì)新樣本值進(jìn)行預(yù)測(cè),然后將樣本實(shí)際值與預(yù)測(cè)值的差值進(jìn)行編碼。如果模型足夠好,且樣本序列的時(shí)間相關(guān)性較強(qiáng),那么誤差信號(hào)的幅度將遠(yuǎn)小于原始信號(hào),可以用較少的值對(duì)其差值量化,得到較好的壓縮效果。預(yù)測(cè)編碼常用的是差分脈沖編碼調(diào)制(DPCM)和自適應(yīng)的差分脈沖編碼調(diào)制(ADPCM)。25編輯版pppt預(yù)測(cè)編碼:25編輯版pppt分形編碼:

分形的方法是把一幅數(shù)字圖像,通過一些圖像處理技術(shù),如顏色分割,邊緣檢測(cè)、頻譜分析、統(tǒng)理變化分析等原始圖像分成一些子圖像。然后在分形集中查找這樣的子圖像。分形集實(shí)際上并不是存儲(chǔ)所有可能的子圖像,而是存儲(chǔ)許多迭代函數(shù),通過迭代函數(shù)的反復(fù)迭代,可以恢復(fù)出原來的圖像26編輯版pppt26編輯版pppt混合壓縮 混合壓縮是利用了各種單一壓縮的長(zhǎng)處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。 該方法在許多情況下被應(yīng)用,如JPEG和MPEG標(biāo)準(zhǔn)就采用了混合編碼的壓縮方法。27編輯版pppt混合壓縮 混合壓縮是利用了各種單一壓縮的27編輯版pppt音頻信號(hào)編碼的分類:1、基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼2、基于音頻的聲學(xué)參數(shù),進(jìn)行參數(shù)編碼3、基于人的聽覺特性進(jìn)行編碼28編輯版pppt音頻信號(hào)編碼的分類:1、基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼28編音頻信號(hào)的編碼方式:(1)波形編碼,如PCM、APC、ATC等(2)分析合成方法(參數(shù)編碼方法)如PLC(3)混合編碼方法29編輯版pppt音頻信號(hào)的編碼方式:(1)波形編碼,如PCM、APC、ATCMP3的全名是MPEGAudioLayer-3,簡(jiǎn)單的說就是一種聲音文件的壓縮格式。1987年德國(guó)的研究機(jī)構(gòu)IIS(InstituteIntegrierteSchaltungen)開始著手一項(xiàng)聲音編碼及數(shù)字音頻廣播的計(jì)劃,名稱叫做EUREKAEUl47,即MP3的前身。之后,這項(xiàng)計(jì)劃由IIS與Erlangen大學(xué)共同合作,開發(fā)出一套非常強(qiáng)大的算法,經(jīng)由150國(guó)際標(biāo)準(zhǔn)組織認(rèn)證之后,符合ISO-MPEGAudioLayer-3標(biāo)準(zhǔn),就成為現(xiàn)在的MP3。

30編輯版ppptMP3的全名是MPEGAudioLayer-3,簡(jiǎn)單的說ISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個(gè)使用高性能音頻數(shù)據(jù)壓縮方法的感知編碼方案(perceptualcodingschemes)。按照壓縮質(zhì)量(每Bit的聲音效果)和編碼方案的復(fù)雜程度分別是Layer1、Layer2、Layer3。

所有這三層的編碼采用的基本結(jié)構(gòu)是相同的。它們?cè)诓捎脗鹘y(tǒng)的頻譜分析和編碼技術(shù)的基礎(chǔ)上還應(yīng)用了子帶分析和心理聲學(xué)模型理論。也就是通過研究人耳和大腦聽覺神經(jīng)對(duì)音頻失真的敏感度,在編碼時(shí)先分析聲音文件的波形,利用濾波器找出噪音電平(NoiseLevel),然后濾去人耳不敏感的信號(hào),

通過矩陣量化的方式將余下的數(shù)據(jù)每一位打散排列,最后編碼形成MPEG的文件。而音質(zhì)聽起來與CD相差不大。

31編輯版ppptISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個(gè)使用高性能音頻數(shù)據(jù)壓MP3的好處在于大幅降低數(shù)字聲音文件的容量,而不會(huì)破壞原來的音質(zhì)。以CD音質(zhì)的Wave文件來說,如抽樣分辨率為l6bit,抽樣頻率44.1kHz,聲音模式為立體聲,那么存儲(chǔ)l秒鐘CD音質(zhì)的Wave文件,必須要用l6bit*44100Hz*2Stereo=1411200bit,也就是相當(dāng)于1411.2kbit的存儲(chǔ)容量,存儲(chǔ)介質(zhì)的負(fù)擔(dān)相當(dāng)大。不過通過MP3格式壓縮后,文件便可壓縮為原來的1/10到l/12,每l秒鐘的MP3只需大約112-128kbit就可以了。

32編輯版ppptMP3的好處在于大幅降低數(shù)字聲音文件的容量,而不會(huì)破壞原來的聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:

聲音質(zhì)量帶寬模式比特率壓縮比率電話2.5kHz單聲道8kbps*96:1好于短波4.5kHz單聲道16kbps48:1好于調(diào)幅廣播7.5kHz單聲道32kbps24:1類似調(diào)頻廣播11kHz立體聲56-64kbps26-24:1接近CD15kHz立體聲96kbps16:1CD>15kHz立體聲112-128kbps14-12:133編輯版pppt聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:聲音質(zhì)量帶寬模式比特率壓1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)3.視頻通信編碼標(biāo)準(zhǔn)34編輯版pppt1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)靜止圖像壓縮標(biāo)準(zhǔn) 國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的“聯(lián)合照片專家組“JPEG

(jointphotographicexpertsgroup)于1991年提出的“多灰度靜止圖像的數(shù)字壓縮編碼“(簡(jiǎn)稱JPEG標(biāo)準(zhǔn))。 這是一個(gè)適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。35編輯版pppt靜止圖像壓縮標(biāo)準(zhǔn) 國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)35編輯

JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率和量化精度。它包含兩部分: 1、基于DCT的有損壓縮方法2、基于預(yù)測(cè)方法的無損壓縮方法36編輯版pppt JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率36編輯版pppt視頻信號(hào)的壓縮編碼

一、視頻信號(hào)的壓縮編碼分類無損壓縮:利用數(shù)據(jù)的統(tǒng)計(jì)特性來進(jìn)行數(shù)據(jù)壓縮,典型的編碼:Huffman編碼、算術(shù)編碼等。不失真壓縮比低有損壓縮:利用人的視覺特性使解壓縮后的圖像看起來與原始圖像一樣。壓縮比高如:預(yù)測(cè)編碼、變換編碼、模型編碼及混合編碼等。37編輯版pppt視頻信號(hào)的壓縮編碼 一、視頻信號(hào)的壓縮編碼分類37編輯版pp運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)

視頻圖像壓縮的一個(gè)重要標(biāo)準(zhǔn)是MPEG(MovingPictureExpertsGroup)于1990年形成的一個(gè)標(biāo)準(zhǔn)草案(簡(jiǎn)稱MPEG標(biāo)準(zhǔn))。 它兼顧了JPEG標(biāo)準(zhǔn)和CCITT專家組的H.261標(biāo)準(zhǔn)。MPEG制訂過三種版本的運(yùn)動(dòng)圖像及其伴音的編碼標(biāo)準(zhǔn),即MPEG1、MPEG2和MPEG3。1998年又推出了兩種新的圖像壓縮編碼標(biāo)準(zhǔn),這就是MPEG4和MPEG738編輯版pppt運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn) 視頻圖像壓縮的一個(gè)重要標(biāo)準(zhǔn)是38編輯版pp圖像壓縮技術(shù)一覽表壓縮標(biāo)準(zhǔn)MPEG4MPEG2MPEG1MJPEG特點(diǎn)兼容前幾種標(biāo)準(zhǔn),采用更為優(yōu)化的編碼技術(shù),基于場(chǎng)景描述和面向帶寬設(shè)計(jì)基于幀重建算法進(jìn)行壓縮和傳輸,動(dòng)態(tài)監(jiān)測(cè)圖像變化,根據(jù)對(duì)象的空間及時(shí)間特征來調(diào)整壓縮方法,幀間加入預(yù)測(cè)幀單獨(dú)對(duì)一幀進(jìn)行壓縮,基本不考慮視頻流中不同幀之間的變化優(yōu)點(diǎn)圖像質(zhì)量好;可變帶寬傳輸;錯(cuò)誤恢復(fù)能力強(qiáng)。壓縮比可調(diào)范圍廣,支持包括高速體育運(yùn)動(dòng)在內(nèi)的活動(dòng)圖像在實(shí)時(shí)壓縮、每幀數(shù)據(jù)量和處理速度上優(yōu)于MJPEG圖像質(zhì)量好缺點(diǎn)無現(xiàn)成算法,實(shí)現(xiàn)的技術(shù)難度大壓縮效率仍不理想、窄帶網(wǎng)傳輸質(zhì)量受限,對(duì)媒體的兼容能力有待提高圖像質(zhì)量相當(dāng)于VHS視頻,不能滿足廣播級(jí)的要求;傳輸帶寬有一定的要求。實(shí)時(shí)性差,壓縮效率低,文件量巨大應(yīng)用領(lǐng)域固定和無線網(wǎng)絡(luò),交互AV服務(wù)以及遠(yuǎn)程傳輸DVD,廣播級(jí)的數(shù)字電視,HDTVVCD,CD-ROM,VOD

39編輯版pppt圖像壓縮技術(shù)一覽表壓縮標(biāo)準(zhǔn)MPEG4MPEG2MPEG1M分辨率768X576(PAL)或720X480(NTSC)NTSC:720X480SIF標(biāo)準(zhǔn)分辨率(NTSC:352X240;PAL:352X288)

碼流多種帶寬可調(diào)分四級(jí),3-100Mbits/sec最高1.5Mbits/sec

圖像質(zhì)量在各種碼率下畫質(zhì)良好極低碼率下無法保證圖像質(zhì)量基本無法進(jìn)行窄帶傳輸

多路實(shí)時(shí)存儲(chǔ)多路實(shí)時(shí)存儲(chǔ),占用存儲(chǔ)空間小能實(shí)現(xiàn)多路實(shí)時(shí)存儲(chǔ),文件量大,消耗硬盤。能實(shí)現(xiàn)多路實(shí)時(shí)存儲(chǔ),文件量大,消耗硬盤。單路存儲(chǔ),丟幀切換聯(lián)網(wǎng)要求全帶寬解決方案,支持PSTN,ISDN,DDN,局域網(wǎng),廣域網(wǎng)等適用于局域網(wǎng)適用于局域網(wǎng)定制帶寬,不支持聯(lián)網(wǎng)。40編輯版pppt分辨率768X576(PAL)或720X480(NTSC)

MPEG標(biāo)準(zhǔn)分成MPEG視頻、MPEG音頻和MPEG系統(tǒng)三大部分。 MPEG算法除了對(duì)單幅圖像進(jìn)行編碼外(幀內(nèi)編碼),還利用圖像序列的相關(guān)特性去除幀間圖像冗余,大大提高了視頻圖像的壓縮比。 壓縮比可達(dá)到60-100倍。41編輯版pppt MPEG標(biāo)準(zhǔn)分成MPEG視頻、MPEG音頻 MPEG算法除MPEG與其它算法或壓縮方案相比有什么優(yōu)點(diǎn)?

一、國(guó)際化的開放標(biāo)準(zhǔn),兼容性好,代表技術(shù)發(fā)展趨勢(shì)。

二、能夠比其他算法提供更好的壓縮比。

三、MPEG在提供高壓縮比的同時(shí),對(duì)數(shù)據(jù)的損失很小。42編輯版ppptMPEG與其它算法或壓縮方案相比有什么優(yōu)點(diǎn)?

一、國(guó)際化的JPEG和MPEG的差別

MPEG視頻壓縮技術(shù)是針對(duì)運(yùn)動(dòng)圖像的數(shù)據(jù)壓縮技術(shù)。為了提高壓縮比,幀內(nèi)圖像數(shù)據(jù)和幀間圖像數(shù)據(jù)壓縮技術(shù)必須同時(shí)使用。MPEG通過幀運(yùn)動(dòng)補(bǔ)償有效地壓縮了數(shù)據(jù)的比特?cái)?shù),它采用了三種圖像,幀內(nèi)圖、預(yù)測(cè)圖和雙向預(yù)測(cè)圖。有效地減少了冗余信息。對(duì)于MPEG來說,幀間數(shù)據(jù)壓縮、運(yùn)動(dòng)補(bǔ)償和雙向預(yù)測(cè),這是和JPEG主要不同的地方。而JPEG和MPEG相同的地方均采用了DCT幀內(nèi)圖像數(shù)據(jù)壓縮編碼。43編輯版ppptJPEG和MPEG的差別 MPEG視頻壓縮技術(shù)是針對(duì)運(yùn)動(dòng)圖JPEG和MPEG的差別

另外,MPEG中視頻信號(hào)包含有靜止畫面(幀內(nèi)圖)和運(yùn)動(dòng)信息(幀間預(yù)測(cè)圖)等不同的內(nèi)容,量化器的設(shè)計(jì)比JPEG壓縮算法中量化器的設(shè)計(jì)考慮的因素要多。44編輯版ppptJPEG和MPEG的差別 另外,MPEG中視頻信號(hào)包含有靜止視頻通信編碼標(biāo)準(zhǔn) 多媒體通信中的電視圖像編碼標(biāo)準(zhǔn)都采用H.261和H.263。H.261主要用來支持電視會(huì)議和可視電話。 電視圖像數(shù)據(jù)壓縮后的數(shù)據(jù)速率為P×64kb/s,其中P是一個(gè)可變參數(shù),取值范圍是1-30。 H.263是在H.261的基礎(chǔ)上開發(fā)的電視圖像編碼標(biāo)準(zhǔn),用于低位速率通信的電視圖像編碼。45編輯版pppt視頻通信編碼標(biāo)準(zhǔn) 多媒體通信中的電視圖像編碼標(biāo)準(zhǔn) 電視圖像數(shù)關(guān)于壓縮比

衡量一個(gè)壓縮算法好壞的標(biāo)準(zhǔn),除了解壓后的數(shù)據(jù)有無失真或失真程度之外,是看壓縮比的大小。壓縮比常用的定義有兩種:(1)采樣壓縮比(2)比特壓縮比46編輯版pppt關(guān)于壓縮比 衡量一個(gè)壓縮算法好壞的標(biāo)準(zhǔn),除了解壓后的數(shù)據(jù)有無感謝親觀看此幻燈片,此課件部分內(nèi)容來源于網(wǎng)絡(luò),如有侵權(quán)請(qǐng)及時(shí)聯(lián)系我們刪除,謝謝配合!47感謝親觀看此幻燈片,此課件部分內(nèi)容來源于網(wǎng)絡(luò),471.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類型1.5.2數(shù)據(jù)壓縮方法1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)48編輯版pppt1.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類1.5.1多媒體數(shù)據(jù)的冗余類型 圖像數(shù)據(jù)表示中存在著大量的冗余,圖像數(shù)據(jù)壓縮技術(shù)就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下:1.空間冗余2.時(shí)間冗余3.視覺冗余49編輯版pppt1.5.1多媒體數(shù)據(jù)的冗余類型 圖像數(shù)據(jù)表示中存在著大量空間冗余 一幅圖像表面上各采樣點(diǎn)的顏色之間往往存在著空間連貫性,基于離散像素采樣來表示物體表面顏色的像素存儲(chǔ)方式可利用空間連貫性,達(dá)到減少數(shù)據(jù)量的目的。 例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在此區(qū)域中所有點(diǎn)的光強(qiáng)和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。50編輯版pppt空間冗余 一幅圖像表面上各采樣點(diǎn)的顏色之3編輯版pppt時(shí)間冗余 運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動(dòng)物體,只不過移動(dòng)物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時(shí)刻的同一場(chǎng)景畫面,所以稱為時(shí)間冗余。 同理,語(yǔ)音數(shù)據(jù)中也存在著時(shí)間冗余。51編輯版pppt時(shí)間冗余 運(yùn)動(dòng)圖像一般為位于一時(shí)間軸區(qū)間4編輯版pppt視覺冗余 人類的視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感度是非均勻的。但是,在記錄原始的圖像數(shù)據(jù)時(shí),通常假定視覺系統(tǒng)近似線性的和均勻的,對(duì)視覺敏感和不敏感的部分同等對(duì)待,從而產(chǎn)生比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來的編碼)更多的數(shù)據(jù),這就是視覺冗余。52編輯版pppt視覺冗余 人類的視覺系統(tǒng)對(duì)圖像場(chǎng)的敏感度5編輯版pppt數(shù)字壓縮技術(shù)三個(gè)重要指標(biāo)1、信息存儲(chǔ)量之比大2、壓縮的算法簡(jiǎn)單3、恢復(fù)效果好53編輯版pppt數(shù)字壓縮技術(shù)三個(gè)重要指標(biāo)1、信息存儲(chǔ)量之比1.5.2數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個(gè)過程組成:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮,以便存儲(chǔ)與傳輸;二是解碼過程,此過程對(duì)編碼數(shù)據(jù)進(jìn)行解碼,還原為可以使用的數(shù)據(jù)。 數(shù)據(jù)壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮54編輯版pppt1.5.2數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個(gè)過程組成: 什么是熵

數(shù)據(jù)壓縮不僅起源于40年代由ClaudeShannon首創(chuàng)的信息論,而且其基本原理即信息究竟能被壓縮到多小,至今依然遵循信息論中的一條定理,這條定理借用了熱力學(xué)中的名詞“熵”(Entropy)來表示一條信息中真正需要編碼的信息量:

考慮用0和1組成的二進(jìn)制數(shù)碼為含有n個(gè)符號(hào)的某條信息編碼,假設(shè)符號(hào)Fn在整條信息中重復(fù)出現(xiàn)的概率為Pn,則該符號(hào)的熵也即表示該符號(hào)所需的位數(shù)位為:

En=-log2(Pn)整條信息的熵也即表示整條信息所需的位數(shù)為:E=∑En

55編輯版pppt什么是熵

數(shù)據(jù)壓縮不僅起源于40年代由Cl舉個(gè)例子,對(duì)下面這條只出現(xiàn)了abc三個(gè)字符的字符串:

aabbaccbaa

字符串長(zhǎng)度為10,字符abc分別出現(xiàn)了532次,則abc在信息中出現(xiàn)的概率分別為0.50.30.2,他們的熵分別為:

Ea=-log2(0.5)=1Eb=-log2(0.3)=1.737Ec=-log2(0.2)=2.322整條信息的熵也即表達(dá)整個(gè)字符串需要的位數(shù)為:

E=Ea*5+Eb*3+Ec*2=14.855位回想一下如果用計(jì)算機(jī)中常用的ASCII編碼,表示上面的字符串我們需要整整80位呢!現(xiàn)在知道信息為什么能被壓縮而不丟失原有的信息內(nèi)容了吧。簡(jiǎn)單地講,用較少的位數(shù)表示較頻繁出現(xiàn)的符號(hào),這就是數(shù)據(jù)壓縮的基本準(zhǔn)則。

56編輯版pppt舉個(gè)例子,對(duì)下面這條只出現(xiàn)了abc三個(gè)字符的字符串:模型

從上面的描述,我們明白,要壓縮一條信息,首先要分析清楚信息中每個(gè)符號(hào)出現(xiàn)的概率。不同的壓縮程序通過不同的方法確定符號(hào)的出現(xiàn)概率,對(duì)符號(hào)的概率計(jì)算得越準(zhǔn)確,也就越容易得到好的壓縮效果。在壓縮程序中,用來處理輸入信息,計(jì)算符號(hào)的概率并決定輸出哪個(gè)或哪些代碼的模塊叫做模型。

難道對(duì)信息中字符的出現(xiàn)概率這么難以估計(jì)以至于有各種不同的壓縮模型嗎?對(duì)上面的字符串我們不是很容易就知道每個(gè)字符的概率了嗎?不過上面的字符串僅有10個(gè)字符長(zhǎng)呀,那只是例子而已??紤]我們現(xiàn)實(shí)中要壓縮的文件,大多數(shù)可是有幾十K甚至幾百K長(zhǎng),幾M字節(jié)的文件不是也屢見不鮮嗎?

是的,我們可以預(yù)先掃描文件中的所有字符,統(tǒng)計(jì)出每個(gè)字符出現(xiàn)的概率,這種方法在壓縮術(shù)語(yǔ)里叫做“靜態(tài)統(tǒng)計(jì)模型”。但是,不同的文件中,字符有不同的分布概率,我們要么先花上大量的時(shí)間統(tǒng)計(jì)我們要壓縮的所有文件中的字符概率,要么為每一個(gè)單獨(dú)的文件保存一份概率表以備解壓縮時(shí)需要。糟糕的是,不但掃描文件要消耗大量時(shí)間,而且保存一份概率表也使壓縮后的文件增大了不少。所以,在實(shí)際應(yīng)用中,“靜態(tài)統(tǒng)計(jì)模型”應(yīng)用的很少。

57編輯版pppt模型

從上面的描述,我們明白,要壓縮一條信息,首先要分析清楚

真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東西。自適應(yīng)模型可以說是一臺(tái)具有學(xué)習(xí)功能的自動(dòng)機(jī)。他在信息被輸入之前對(duì)信息內(nèi)容一無所知并假定每個(gè)字符的出現(xiàn)概率均等,隨著字符不斷被輸入和編碼,他統(tǒng)計(jì)并紀(jì)錄已經(jīng)出現(xiàn)過的字符的概率并將這些概率應(yīng)用于對(duì)后續(xù)字符的編碼。也就是說,自適應(yīng)模型在壓縮開始時(shí)壓縮效果并不理想,但隨著壓縮的進(jìn)行,他會(huì)越來越接近字符概率的準(zhǔn)確值,并達(dá)到理想的壓縮效果。自適應(yīng)模型還可以適應(yīng)輸入信息中字符分布的突然變化,可以適應(yīng)不同的文件中的字符分布而不需要保存概率表。

58編輯版pppt真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東編碼通過模型,我們已經(jīng)確定了對(duì)某一個(gè)符號(hào)該用多少位二進(jìn)制數(shù)進(jìn)行編碼。現(xiàn)在的問題是,如何設(shè)計(jì)一種編碼方案,使其盡量精確地用模型計(jì)算出來的位數(shù)表示某個(gè)符號(hào)。最先被考慮的問題是,如果對(duì)a用3個(gè)二進(jìn)制位就可以表示,而對(duì)b用4個(gè)二進(jìn)制位就可以表示,那么,在解碼時(shí),面對(duì)一連串的二進(jìn)制流,我怎么知道哪三個(gè)位是a,哪四個(gè)位是b呢?所以,必須設(shè)計(jì)出一種編碼方式,使得解碼程序可以方便地分離每個(gè)字符的編碼部分。于是有了一種叫“前綴編碼”的技術(shù)。該技術(shù)的主導(dǎo)思想是,任何一個(gè)字符的編碼,都不是另一個(gè)字符編碼的前綴。反過來說就是,任何一個(gè)字符的編碼,都不是由另一個(gè)字符的編碼加上若干位0或1組成??匆幌虑熬Y編碼的一個(gè)最簡(jiǎn)單的例子59編輯版pppt編碼12編輯版pppt符號(hào)編碼A0B10C110D1110E11110有了上面的碼表,你一定可以輕松地從下面這串二進(jìn)制流中分辨出真正的信息內(nèi)容了:1110010101110110111100010-DABBDCEAAB60編輯版pppt符號(hào)編碼A013編輯版pppt無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。 其原理是統(tǒng)計(jì)壓縮數(shù)據(jù)中的冗余(重復(fù)的數(shù)據(jù))部分。常用的有:RLE(runlengthencoding)行程編碼Huffman編碼算術(shù)編碼LZW(lempel-ziv-welch)編碼61編輯版pppt無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,14編輯版ppptShannon-Fano編碼

討論之前,我們假定要編碼字符的出現(xiàn)概率已經(jīng)由某一模型統(tǒng)計(jì)出來,例如,對(duì)下面這串出現(xiàn)了五種字符的信息(40個(gè)字符長(zhǎng)):

cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別:a-16,b-7,c-6,d-6,e-5。

Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹,構(gòu)造的方式非常簡(jiǎn)單:

62編輯版ppptShannon-Fano編碼

討論之前,我們假定要編碼字Shannon-Fano編碼

進(jìn)入Huffman先生構(gòu)造的神奇二叉樹之前,我們先來看一下它的前身,由ClaudeShannon和R.M.Fano兩人提出的Shannon-Fano編碼。

討論之前,我們假定要編碼字符的出現(xiàn)概率已經(jīng)由某一模型統(tǒng)計(jì)出來,例如,對(duì)下面這串出現(xiàn)了五種字符的信息(40個(gè)字符長(zhǎng)):

cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別:a-16,b-7,c-6,d-6,e-5。

Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹,構(gòu)造的方式非常簡(jiǎn)單:

63編輯版ppptShannon-Fano編碼

進(jìn)入Huffman先生構(gòu)1)將給定符號(hào)按照其頻率從大到小排序。對(duì)上面的例子,應(yīng)該得到:a-16b-7c-6d-6e-5

2)將序列分成上下兩部分,使得上部頻率總和盡可能接近下部頻率總和。我們有:a-16b-7-----------------c-6d-6e-5

3)我們把第二步中劃分出的上部作為二叉樹的左子樹,記0,下部作為二叉樹的右子樹,記1。4)分別對(duì)左右子樹重復(fù)23兩步,直到所有的符號(hào)都成為二叉樹的樹葉為止?,F(xiàn)在我們有如下的二叉樹:根(root)0|1+------+------+0|10|1+-----+-----++---+----+||||abc|0|1+-----+-----+||de

64編輯版pppt1)將給定符號(hào)按照其頻率從大到小排序。對(duì)上面的例子,應(yīng)該得于是我們得到了此信息的編碼表:

a-00b-01c-10d-110e-111

可以將例子中的信息編碼為:

cabcedeacacdeddaaabaababaaabbacdebaceada10000110

11111011100100010......碼長(zhǎng)共91位??紤]用ASCII碼表示上述信息需要8*40=240位,我們確實(shí)實(shí)現(xiàn)了數(shù)據(jù)壓縮

65編輯版pppt于是我們得到了此信息的編碼表:

a-00b-01Huffman編碼Huffman編碼構(gòu)造二叉樹的方法和Shannon-Fano正好相反,不是自上而下,而是從樹葉到樹根生成二叉樹?,F(xiàn)在,我們?nèi)匀皇褂蒙厦娴睦觼韺W(xué)習(xí)Huffman編碼方法。1)將各個(gè)符號(hào)及其出現(xiàn)頻率分別作為不同的小二叉樹(目前每棵樹只有根節(jié)點(diǎn))。a(16)b(7)c(6)d(6)e(5)

2)在1中得到的樹林里找出頻率值最小的兩棵樹,將他們分別作為左、右子樹連成一棵大一些的二叉樹,該二叉樹的頻率值為兩棵子樹頻率值之和。對(duì)上面的例子,我們得到一個(gè)新的樹林:|(11)a(16)b(7)c(6)+---+---+||de

3)對(duì)上面得到的樹林重復(fù)2的做法,直到所有符號(hào)都連入樹中為止。這一步完成后,我們有這樣的二叉樹:根(root)0|1+------+----------------+|0|1|+---------+-----------+|0|10|1a+-------+------++-------+-------+||||bcde由此,我們可以建立和Shannon-Fano編碼略微不同的編碼表:

a-0b-100c-101d-110e-111

66編輯版ppptHuffman編碼a(16)b(7)對(duì)例子中信息的編碼為:cabcedeacacdeddaaabaababaaabbacdebaceada101010010111111011101010101......

碼長(zhǎng)共88位。這比使用Shannon-Fano編碼要更短一點(diǎn)。讓我們回顧一下熵的知識(shí),使用我們?cè)诘诙聦W(xué)到的計(jì)算方法,上面的例子中,每個(gè)字符的熵為:Ea=-log2(16/40)=1.322Eb=-log2(7/40)=2.515Ec=-log2(6/40)=2.737Ed=-log2(6/40)=2.737Ee=-log2(5/40)=3.000

信息的熵為:也就是說,表示該條信息最少需要86.601位。我們看到,Shannon-Fano編碼和Huffman編碼都已經(jīng)比較接近該信息的熵值了。67編輯版pppt對(duì)例子中信息的編碼為:20編輯版pppt(1)、行程編碼(RLE) RLE編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號(hào)表示。 例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B。 RLE編碼簡(jiǎn)單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如.BMP.TIFF及AVI等格式文件的壓縮均采用此方法.68編輯版pppt(1)、行程編碼(RLE) RLE編碼簡(jiǎn)單直觀,編碼/解碼速(3)、算術(shù)編碼 其方法是將被編碼的信源消息表示成實(shí)數(shù)軸0-1之間的一個(gè)間隔,消息越長(zhǎng),編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位數(shù)就越多。 該方法實(shí)現(xiàn)較為復(fù)雜,常與其它有損壓縮結(jié)合使用,并在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG)中扮演重要角色。69編輯版pppt(3)、算術(shù)編碼 該方法實(shí)現(xiàn)較為復(fù)雜,常與其它有22編輯版p(4)、LZW編碼 LZW(Lempel-Ziv-Welch)壓縮使用字典庫(kù)查找方案。它讀入待壓縮的數(shù)據(jù)并與一個(gè)字典庫(kù)(庫(kù)開始是空的)中的字符串對(duì)比,如有匹配的字符串,則輸出該字符串?dāng)?shù)據(jù)在字典庫(kù)中的位置索引,否則將該字符串插入字典中。 許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用了設(shè)方法。 另外,.GIF和.TIF格式的圖形文件也是按這一文件存儲(chǔ)的。70編輯版pppt(4)、LZW編碼 許多商品壓縮軟件如ARJ、PKZIR、2有損壓縮 圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對(duì)頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息為代價(jià),換取了較高的壓縮比。 常用的有損壓縮方法有:PCM(脈沖編碼調(diào)制)、預(yù)測(cè)編碼、變換編碼、插值與外推等。 新一代的數(shù)據(jù)壓縮方法有:矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。71編輯版pppt有損壓縮 圖像或聲音的頻帶寬、信息豐富, 常用的有損壓縮方法預(yù)測(cè)編碼:根據(jù)某一數(shù)據(jù)模型利用以往的樣本值對(duì)新樣本值進(jìn)行預(yù)測(cè),然后將樣本實(shí)際值與預(yù)測(cè)值的差值進(jìn)行編碼。如果模型足夠好,且樣本序列的時(shí)間相關(guān)性較強(qiáng),那么誤差信號(hào)的幅度將遠(yuǎn)小于原始信號(hào),可以用較少的值對(duì)其差值量化,得到較好的壓縮效果。預(yù)測(cè)編碼常用的是差分脈沖編碼調(diào)制(DPCM)和自適應(yīng)的差分脈沖編碼調(diào)制(ADPCM)。72編輯版pppt預(yù)測(cè)編碼:25編輯版pppt分形編碼:

分形的方法是把一幅數(shù)字圖像,通過一些圖像處理技術(shù),如顏色分割,邊緣檢測(cè)、頻譜分析、統(tǒng)理變化分析等原始圖像分成一些子圖像。然后在分形集中查找這樣的子圖像。分形集實(shí)際上并不是存儲(chǔ)所有可能的子圖像,而是存儲(chǔ)許多迭代函數(shù),通過迭代函數(shù)的反復(fù)迭代,可以恢復(fù)出原來的圖像73編輯版pppt26編輯版pppt混合壓縮 混合壓縮是利用了各種單一壓縮的長(zhǎng)處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。 該方法在許多情況下被應(yīng)用,如JPEG和MPEG標(biāo)準(zhǔn)就采用了混合編碼的壓縮方法。74編輯版pppt混合壓縮 混合壓縮是利用了各種單一壓縮的27編輯版pppt音頻信號(hào)編碼的分類:1、基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼2、基于音頻的聲學(xué)參數(shù),進(jìn)行參數(shù)編碼3、基于人的聽覺特性進(jìn)行編碼75編輯版pppt音頻信號(hào)編碼的分類:1、基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼28編音頻信號(hào)的編碼方式:(1)波形編碼,如PCM、APC、ATC等(2)分析合成方法(參數(shù)編碼方法)如PLC(3)混合編碼方法76編輯版pppt音頻信號(hào)的編碼方式:(1)波形編碼,如PCM、APC、ATCMP3的全名是MPEGAudioLayer-3,簡(jiǎn)單的說就是一種聲音文件的壓縮格式。1987年德國(guó)的研究機(jī)構(gòu)IIS(InstituteIntegrierteSchaltungen)開始著手一項(xiàng)聲音編碼及數(shù)字音頻廣播的計(jì)劃,名稱叫做EUREKAEUl47,即MP3的前身。之后,這項(xiàng)計(jì)劃由IIS與Erlangen大學(xué)共同合作,開發(fā)出一套非常強(qiáng)大的算法,經(jīng)由150國(guó)際標(biāo)準(zhǔn)組織認(rèn)證之后,符合ISO-MPEGAudioLayer-3標(biāo)準(zhǔn),就成為現(xiàn)在的MP3。

77編輯版ppptMP3的全名是MPEGAudioLayer-3,簡(jiǎn)單的說ISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個(gè)使用高性能音頻數(shù)據(jù)壓縮方法的感知編碼方案(perceptualcodingschemes)。按照壓縮質(zhì)量(每Bit的聲音效果)和編碼方案的復(fù)雜程度分別是Layer1、Layer2、Layer3。

所有這三層的編碼采用的基本結(jié)構(gòu)是相同的。它們?cè)诓捎脗鹘y(tǒng)的頻譜分析和編碼技術(shù)的基礎(chǔ)上還應(yīng)用了子帶分析和心理聲學(xué)模型理論。也就是通過研究人耳和大腦聽覺神經(jīng)對(duì)音頻失真的敏感度,在編碼時(shí)先分析聲音文件的波形,利用濾波器找出噪音電平(NoiseLevel),然后濾去人耳不敏感的信號(hào),

通過矩陣量化的方式將余下的數(shù)據(jù)每一位打散排列,最后編碼形成MPEG的文件。而音質(zhì)聽起來與CD相差不大。

78編輯版ppptISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個(gè)使用高性能音頻數(shù)據(jù)壓MP3的好處在于大幅降低數(shù)字聲音文件的容量,而不會(huì)破壞原來的音質(zhì)。以CD音質(zhì)的Wave文件來說,如抽樣分辨率為l6bit,抽樣頻率44.1kHz,聲音模式為立體聲,那么存儲(chǔ)l秒鐘CD音質(zhì)的Wave文件,必須要用l6bit*44100Hz*2Stereo=1411200bit,也就是相當(dāng)于1411.2kbit的存儲(chǔ)容量,存儲(chǔ)介質(zhì)的負(fù)擔(dān)相當(dāng)大。不過通過MP3格式壓縮后,文件便可壓縮為原來的1/10到l/12,每l秒鐘的MP3只需大約112-128kbit就可以了。

79編輯版ppptMP3的好處在于大幅降低數(shù)字聲音文件的容量,而不會(huì)破壞原來的聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:

聲音質(zhì)量帶寬模式比特率壓縮比率電話2.5kHz單聲道8kbps*96:1好于短波4.5kHz單聲道16kbps48:1好于調(diào)幅廣播7.5kHz單聲道32kbps24:1類似調(diào)頻廣播11kHz立體聲56-64kbps26-24:1接近CD15kHz立體聲96kbps16:1CD>15kHz立體聲112-128kbps14-12:180編輯版pppt聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:聲音質(zhì)量帶寬模式比特率壓1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)3.視頻通信編碼標(biāo)準(zhǔn)81編輯版pppt1.5.3視頻編碼的國(guó)際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運(yùn)動(dòng)靜止圖像壓縮標(biāo)準(zhǔn) 國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的“聯(lián)合照片專家組“JPEG

(jointphotographicexpertsgroup)于1991年提出的“多灰度靜止圖像的數(shù)字壓縮編碼“(簡(jiǎn)稱JPEG標(biāo)準(zhǔn))。 這是一個(gè)適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。82編輯版pppt靜止圖像壓縮標(biāo)準(zhǔn) 國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)35編輯

JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率和量化精度。它包含兩部

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論