版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類型1.5.2數(shù)據(jù)壓縮方法1.5.3視頻編碼的國際標(biāo)準(zhǔn)1編輯版pppt1.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類1.5.1多媒體數(shù)據(jù)的冗余類型 圖像數(shù)據(jù)表示中存在著大量的冗余,圖像數(shù)據(jù)壓縮技術(shù)就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下:1.空間冗余2.時間冗余3.視覺冗余2編輯版pppt1.5.1多媒體數(shù)據(jù)的冗余類型 圖像數(shù)據(jù)表示中存在著大量空間冗余 一幅圖像表面上各采樣點的顏色之間往往存在著空間連貫性,基于離散像素采樣來表示物體表面顏色的像素存儲方式可利用空間連貫性,達(dá)到減少數(shù)據(jù)量的目的。 例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在此區(qū)域中所有點的光強和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。3編輯版pppt空間冗余 一幅圖像表面上各采樣點的顏色之3編輯版pppt時間冗余 運動圖像一般為位于一時間軸區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動物體,只不過移動物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時刻的同一場景畫面,所以稱為時間冗余。 同理,語音數(shù)據(jù)中也存在著時間冗余。4編輯版pppt時間冗余 運動圖像一般為位于一時間軸區(qū)間4編輯版pppt視覺冗余 人類的視覺系統(tǒng)對圖像場的敏感度是非均勻的。但是,在記錄原始的圖像數(shù)據(jù)時,通常假定視覺系統(tǒng)近似線性的和均勻的,對視覺敏感和不敏感的部分同等對待,從而產(chǎn)生比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來的編碼)更多的數(shù)據(jù),這就是視覺冗余。5編輯版pppt視覺冗余 人類的視覺系統(tǒng)對圖像場的敏感度5編輯版pppt數(shù)字壓縮技術(shù)三個重要指標(biāo)1、信息存儲量之比大2、壓縮的算法簡單3、恢復(fù)效果好6編輯版pppt數(shù)字壓縮技術(shù)三個重要指標(biāo)1、信息存儲量之比1.5.2數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個過程組成:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮,以便存儲與傳輸;二是解碼過程,此過程對編碼數(shù)據(jù)進(jìn)行解碼,還原為可以使用的數(shù)據(jù)。 數(shù)據(jù)壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮7編輯版pppt1.5.2數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個過程組成: 什么是熵
數(shù)據(jù)壓縮不僅起源于40年代由ClaudeShannon首創(chuàng)的信息論,而且其基本原理即信息究竟能被壓縮到多小,至今依然遵循信息論中的一條定理,這條定理借用了熱力學(xué)中的名詞“熵”(Entropy)來表示一條信息中真正需要編碼的信息量:
考慮用0和1組成的二進(jìn)制數(shù)碼為含有n個符號的某條信息編碼,假設(shè)符號Fn在整條信息中重復(fù)出現(xiàn)的概率為Pn,則該符號的熵也即表示該符號所需的位數(shù)位為:
En=-log2(Pn)整條信息的熵也即表示整條信息所需的位數(shù)為:E=∑En
8編輯版pppt什么是熵
數(shù)據(jù)壓縮不僅起源于40年代由Cl舉個例子,對下面這條只出現(xiàn)了abc三個字符的字符串:
aabbaccbaa
字符串長度為10,字符abc分別出現(xiàn)了532次,則abc在信息中出現(xiàn)的概率分別為0.50.30.2,他們的熵分別為:
Ea=-log2(0.5)=1Eb=-log2(0.3)=1.737Ec=-log2(0.2)=2.322整條信息的熵也即表達(dá)整個字符串需要的位數(shù)為:
E=Ea*5+Eb*3+Ec*2=14.855位回想一下如果用計算機中常用的ASCII編碼,表示上面的字符串我們需要整整80位呢!現(xiàn)在知道信息為什么能被壓縮而不丟失原有的信息內(nèi)容了吧。簡單地講,用較少的位數(shù)表示較頻繁出現(xiàn)的符號,這就是數(shù)據(jù)壓縮的基本準(zhǔn)則。
9編輯版pppt舉個例子,對下面這條只出現(xiàn)了abc三個字符的字符串:模型
從上面的描述,我們明白,要壓縮一條信息,首先要分析清楚信息中每個符號出現(xiàn)的概率。不同的壓縮程序通過不同的方法確定符號的出現(xiàn)概率,對符號的概率計算得越準(zhǔn)確,也就越容易得到好的壓縮效果。在壓縮程序中,用來處理輸入信息,計算符號的概率并決定輸出哪個或哪些代碼的模塊叫做模型。
難道對信息中字符的出現(xiàn)概率這么難以估計以至于有各種不同的壓縮模型嗎?對上面的字符串我們不是很容易就知道每個字符的概率了嗎?不過上面的字符串僅有10個字符長呀,那只是例子而已。考慮我們現(xiàn)實中要壓縮的文件,大多數(shù)可是有幾十K甚至幾百K長,幾M字節(jié)的文件不是也屢見不鮮嗎?
是的,我們可以預(yù)先掃描文件中的所有字符,統(tǒng)計出每個字符出現(xiàn)的概率,這種方法在壓縮術(shù)語里叫做“靜態(tài)統(tǒng)計模型”。但是,不同的文件中,字符有不同的分布概率,我們要么先花上大量的時間統(tǒng)計我們要壓縮的所有文件中的字符概率,要么為每一個單獨的文件保存一份概率表以備解壓縮時需要。糟糕的是,不但掃描文件要消耗大量時間,而且保存一份概率表也使壓縮后的文件增大了不少。所以,在實際應(yīng)用中,“靜態(tài)統(tǒng)計模型”應(yīng)用的很少。
10編輯版pppt模型
從上面的描述,我們明白,要壓縮一條信息,首先要分析清楚
真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東西。自適應(yīng)模型可以說是一臺具有學(xué)習(xí)功能的自動機。他在信息被輸入之前對信息內(nèi)容一無所知并假定每個字符的出現(xiàn)概率均等,隨著字符不斷被輸入和編碼,他統(tǒng)計并紀(jì)錄已經(jīng)出現(xiàn)過的字符的概率并將這些概率應(yīng)用于對后續(xù)字符的編碼。也就是說,自適應(yīng)模型在壓縮開始時壓縮效果并不理想,但隨著壓縮的進(jìn)行,他會越來越接近字符概率的準(zhǔn)確值,并達(dá)到理想的壓縮效果。自適應(yīng)模型還可以適應(yīng)輸入信息中字符分布的突然變化,可以適應(yīng)不同的文件中的字符分布而不需要保存概率表。
11編輯版pppt真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東編碼通過模型,我們已經(jīng)確定了對某一個符號該用多少位二進(jìn)制數(shù)進(jìn)行編碼?,F(xiàn)在的問題是,如何設(shè)計一種編碼方案,使其盡量精確地用模型計算出來的位數(shù)表示某個符號。最先被考慮的問題是,如果對a用3個二進(jìn)制位就可以表示,而對b用4個二進(jìn)制位就可以表示,那么,在解碼時,面對一連串的二進(jìn)制流,我怎么知道哪三個位是a,哪四個位是b呢?所以,必須設(shè)計出一種編碼方式,使得解碼程序可以方便地分離每個字符的編碼部分。于是有了一種叫“前綴編碼”的技術(shù)。該技術(shù)的主導(dǎo)思想是,任何一個字符的編碼,都不是另一個字符編碼的前綴。反過來說就是,任何一個字符的編碼,都不是由另一個字符的編碼加上若干位0或1組成。看一下前綴編碼的一個最簡單的例子12編輯版pppt編碼12編輯版pppt符號編碼A0B10C110D1110E11110有了上面的碼表,你一定可以輕松地從下面這串二進(jìn)制流中分辨出真正的信息內(nèi)容了:1110010101110110111100010-DABBDCEAAB13編輯版pppt符號編碼A013編輯版pppt無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。 其原理是統(tǒng)計壓縮數(shù)據(jù)中的冗余(重復(fù)的數(shù)據(jù))部分。常用的有:RLE(runlengthencoding)行程編碼Huffman編碼算術(shù)編碼LZW(lempel-ziv-welch)編碼14編輯版pppt無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,14編輯版ppptShannon-Fano編碼
討論之前,我們假定要編碼字符的出現(xiàn)概率已經(jīng)由某一模型統(tǒng)計出來,例如,對下面這串出現(xiàn)了五種字符的信息(40個字符長):
cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別:a-16,b-7,c-6,d-6,e-5。
Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹,構(gòu)造的方式非常簡單:
15編輯版ppptShannon-Fano編碼
討論之前,我們假定要編碼字Shannon-Fano編碼
進(jìn)入Huffman先生構(gòu)造的神奇二叉樹之前,我們先來看一下它的前身,由ClaudeShannon和R.M.Fano兩人提出的Shannon-Fano編碼。
討論之前,我們假定要編碼字符的出現(xiàn)概率已經(jīng)由某一模型統(tǒng)計出來,例如,對下面這串出現(xiàn)了五種字符的信息(40個字符長):
cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別:a-16,b-7,c-6,d-6,e-5。
Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹,構(gòu)造的方式非常簡單:
16編輯版ppptShannon-Fano編碼
進(jìn)入Huffman先生構(gòu)1)將給定符號按照其頻率從大到小排序。對上面的例子,應(yīng)該得到:a-16b-7c-6d-6e-5
2)將序列分成上下兩部分,使得上部頻率總和盡可能接近下部頻率總和。我們有:a-16b-7-----------------c-6d-6e-5
3)我們把第二步中劃分出的上部作為二叉樹的左子樹,記0,下部作為二叉樹的右子樹,記1。4)分別對左右子樹重復(fù)23兩步,直到所有的符號都成為二叉樹的樹葉為止?,F(xiàn)在我們有如下的二叉樹:根(root)0|1+------+------+0|10|1+-----+-----++---+----+||||abc|0|1+-----+-----+||de
17編輯版pppt1)將給定符號按照其頻率從大到小排序。對上面的例子,應(yīng)該得于是我們得到了此信息的編碼表:
a-00b-01c-10d-110e-111
可以將例子中的信息編碼為:
cabcedeacacdeddaaabaababaaabbacdebaceada10000110
11111011100100010......碼長共91位??紤]用ASCII碼表示上述信息需要8*40=240位,我們確實實現(xiàn)了數(shù)據(jù)壓縮
18編輯版pppt于是我們得到了此信息的編碼表:
a-00b-01Huffman編碼Huffman編碼構(gòu)造二叉樹的方法和Shannon-Fano正好相反,不是自上而下,而是從樹葉到樹根生成二叉樹?,F(xiàn)在,我們?nèi)匀皇褂蒙厦娴睦觼韺W(xué)習(xí)Huffman編碼方法。1)將各個符號及其出現(xiàn)頻率分別作為不同的小二叉樹(目前每棵樹只有根節(jié)點)。a(16)b(7)c(6)d(6)e(5)
2)在1中得到的樹林里找出頻率值最小的兩棵樹,將他們分別作為左、右子樹連成一棵大一些的二叉樹,該二叉樹的頻率值為兩棵子樹頻率值之和。對上面的例子,我們得到一個新的樹林:|(11)a(16)b(7)c(6)+---+---+||de
3)對上面得到的樹林重復(fù)2的做法,直到所有符號都連入樹中為止。這一步完成后,我們有這樣的二叉樹:根(root)0|1+------+----------------+|0|1|+---------+-----------+|0|10|1a+-------+------++-------+-------+||||bcde由此,我們可以建立和Shannon-Fano編碼略微不同的編碼表:
a-0b-100c-101d-110e-111
19編輯版ppptHuffman編碼a(16)b(7)對例子中信息的編碼為:cabcedeacacdeddaaabaababaaabbacdebaceada101010010111111011101010101......
碼長共88位。這比使用Shannon-Fano編碼要更短一點。讓我們回顧一下熵的知識,使用我們在第二章學(xué)到的計算方法,上面的例子中,每個字符的熵為:Ea=-log2(16/40)=1.322Eb=-log2(7/40)=2.515Ec=-log2(6/40)=2.737Ed=-log2(6/40)=2.737Ee=-log2(5/40)=3.000
信息的熵為:也就是說,表示該條信息最少需要86.601位。我們看到,Shannon-Fano編碼和Huffman編碼都已經(jīng)比較接近該信息的熵值了。20編輯版pppt對例子中信息的編碼為:20編輯版pppt(1)、行程編碼(RLE) RLE編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號表示。 例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B。 RLE編碼簡單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如.BMP.TIFF及AVI等格式文件的壓縮均采用此方法.21編輯版pppt(1)、行程編碼(RLE) RLE編碼簡單直觀,編碼/解碼速(3)、算術(shù)編碼 其方法是將被編碼的信源消息表示成實數(shù)軸0-1之間的一個間隔,消息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位數(shù)就越多。 該方法實現(xiàn)較為復(fù)雜,常與其它有損壓縮結(jié)合使用,并在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG)中扮演重要角色。22編輯版pppt(3)、算術(shù)編碼 該方法實現(xiàn)較為復(fù)雜,常與其它有22編輯版p(4)、LZW編碼 LZW(Lempel-Ziv-Welch)壓縮使用字典庫查找方案。它讀入待壓縮的數(shù)據(jù)并與一個字典庫(庫開始是空的)中的字符串對比,如有匹配的字符串,則輸出該字符串?dāng)?shù)據(jù)在字典庫中的位置索引,否則將該字符串插入字典中。 許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用了設(shè)方法。 另外,.GIF和.TIF格式的圖形文件也是按這一文件存儲的。23編輯版pppt(4)、LZW編碼 許多商品壓縮軟件如ARJ、PKZIR、2有損壓縮 圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息為代價,換取了較高的壓縮比。 常用的有損壓縮方法有:PCM(脈沖編碼調(diào)制)、預(yù)測編碼、變換編碼、插值與外推等。 新一代的數(shù)據(jù)壓縮方法有:矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。24編輯版pppt有損壓縮 圖像或聲音的頻帶寬、信息豐富, 常用的有損壓縮方法預(yù)測編碼:根據(jù)某一數(shù)據(jù)模型利用以往的樣本值對新樣本值進(jìn)行預(yù)測,然后將樣本實際值與預(yù)測值的差值進(jìn)行編碼。如果模型足夠好,且樣本序列的時間相關(guān)性較強,那么誤差信號的幅度將遠(yuǎn)小于原始信號,可以用較少的值對其差值量化,得到較好的壓縮效果。預(yù)測編碼常用的是差分脈沖編碼調(diào)制(DPCM)和自適應(yīng)的差分脈沖編碼調(diào)制(ADPCM)。25編輯版pppt預(yù)測編碼:25編輯版pppt分形編碼:
分形的方法是把一幅數(shù)字圖像,通過一些圖像處理技術(shù),如顏色分割,邊緣檢測、頻譜分析、統(tǒng)理變化分析等原始圖像分成一些子圖像。然后在分形集中查找這樣的子圖像。分形集實際上并不是存儲所有可能的子圖像,而是存儲許多迭代函數(shù),通過迭代函數(shù)的反復(fù)迭代,可以恢復(fù)出原來的圖像26編輯版pppt26編輯版pppt混合壓縮 混合壓縮是利用了各種單一壓縮的長處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。 該方法在許多情況下被應(yīng)用,如JPEG和MPEG標(biāo)準(zhǔn)就采用了混合編碼的壓縮方法。27編輯版pppt混合壓縮 混合壓縮是利用了各種單一壓縮的27編輯版pppt音頻信號編碼的分類:1、基于音頻數(shù)據(jù)的統(tǒng)計特性進(jìn)行編碼2、基于音頻的聲學(xué)參數(shù),進(jìn)行參數(shù)編碼3、基于人的聽覺特性進(jìn)行編碼28編輯版pppt音頻信號編碼的分類:1、基于音頻數(shù)據(jù)的統(tǒng)計特性進(jìn)行編碼28編音頻信號的編碼方式:(1)波形編碼,如PCM、APC、ATC等(2)分析合成方法(參數(shù)編碼方法)如PLC(3)混合編碼方法29編輯版pppt音頻信號的編碼方式:(1)波形編碼,如PCM、APC、ATCMP3的全名是MPEGAudioLayer-3,簡單的說就是一種聲音文件的壓縮格式。1987年德國的研究機構(gòu)IIS(InstituteIntegrierteSchaltungen)開始著手一項聲音編碼及數(shù)字音頻廣播的計劃,名稱叫做EUREKAEUl47,即MP3的前身。之后,這項計劃由IIS與Erlangen大學(xué)共同合作,開發(fā)出一套非常強大的算法,經(jīng)由150國際標(biāo)準(zhǔn)組織認(rèn)證之后,符合ISO-MPEGAudioLayer-3標(biāo)準(zhǔn),就成為現(xiàn)在的MP3。
30編輯版ppptMP3的全名是MPEGAudioLayer-3,簡單的說ISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個使用高性能音頻數(shù)據(jù)壓縮方法的感知編碼方案(perceptualcodingschemes)。按照壓縮質(zhì)量(每Bit的聲音效果)和編碼方案的復(fù)雜程度分別是Layer1、Layer2、Layer3。
所有這三層的編碼采用的基本結(jié)構(gòu)是相同的。它們在采用傳統(tǒng)的頻譜分析和編碼技術(shù)的基礎(chǔ)上還應(yīng)用了子帶分析和心理聲學(xué)模型理論。也就是通過研究人耳和大腦聽覺神經(jīng)對音頻失真的敏感度,在編碼時先分析聲音文件的波形,利用濾波器找出噪音電平(NoiseLevel),然后濾去人耳不敏感的信號,
通過矩陣量化的方式將余下的數(shù)據(jù)每一位打散排列,最后編碼形成MPEG的文件。而音質(zhì)聽起來與CD相差不大。
31編輯版ppptISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個使用高性能音頻數(shù)據(jù)壓MP3的好處在于大幅降低數(shù)字聲音文件的容量,而不會破壞原來的音質(zhì)。以CD音質(zhì)的Wave文件來說,如抽樣分辨率為l6bit,抽樣頻率44.1kHz,聲音模式為立體聲,那么存儲l秒鐘CD音質(zhì)的Wave文件,必須要用l6bit*44100Hz*2Stereo=1411200bit,也就是相當(dāng)于1411.2kbit的存儲容量,存儲介質(zhì)的負(fù)擔(dān)相當(dāng)大。不過通過MP3格式壓縮后,文件便可壓縮為原來的1/10到l/12,每l秒鐘的MP3只需大約112-128kbit就可以了。
32編輯版ppptMP3的好處在于大幅降低數(shù)字聲音文件的容量,而不會破壞原來的聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:
聲音質(zhì)量帶寬模式比特率壓縮比率電話2.5kHz單聲道8kbps*96:1好于短波4.5kHz單聲道16kbps48:1好于調(diào)幅廣播7.5kHz單聲道32kbps24:1類似調(diào)頻廣播11kHz立體聲56-64kbps26-24:1接近CD15kHz立體聲96kbps16:1CD>15kHz立體聲112-128kbps14-12:133編輯版pppt聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:聲音質(zhì)量帶寬模式比特率壓1.5.3視頻編碼的國際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運動圖像壓縮標(biāo)準(zhǔn)3.視頻通信編碼標(biāo)準(zhǔn)34編輯版pppt1.5.3視頻編碼的國際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運動靜止圖像壓縮標(biāo)準(zhǔn) 國際標(biāo)準(zhǔn)化組織(ISO)和國際電報電話咨詢委員會(CCITT)聯(lián)合成立的“聯(lián)合照片專家組“JPEG
(jointphotographicexpertsgroup)于1991年提出的“多灰度靜止圖像的數(shù)字壓縮編碼“(簡稱JPEG標(biāo)準(zhǔn))。 這是一個適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。35編輯版pppt靜止圖像壓縮標(biāo)準(zhǔn) 國際標(biāo)準(zhǔn)化組織(ISO)和國際電報35編輯
JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率和量化精度。它包含兩部分: 1、基于DCT的有損壓縮方法2、基于預(yù)測方法的無損壓縮方法36編輯版pppt JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率36編輯版pppt視頻信號的壓縮編碼
一、視頻信號的壓縮編碼分類無損壓縮:利用數(shù)據(jù)的統(tǒng)計特性來進(jìn)行數(shù)據(jù)壓縮,典型的編碼:Huffman編碼、算術(shù)編碼等。不失真壓縮比低有損壓縮:利用人的視覺特性使解壓縮后的圖像看起來與原始圖像一樣。壓縮比高如:預(yù)測編碼、變換編碼、模型編碼及混合編碼等。37編輯版pppt視頻信號的壓縮編碼 一、視頻信號的壓縮編碼分類37編輯版pp運動圖像壓縮標(biāo)準(zhǔn)
視頻圖像壓縮的一個重要標(biāo)準(zhǔn)是MPEG(MovingPictureExpertsGroup)于1990年形成的一個標(biāo)準(zhǔn)草案(簡稱MPEG標(biāo)準(zhǔn))。 它兼顧了JPEG標(biāo)準(zhǔn)和CCITT專家組的H.261標(biāo)準(zhǔn)。MPEG制訂過三種版本的運動圖像及其伴音的編碼標(biāo)準(zhǔn),即MPEG1、MPEG2和MPEG3。1998年又推出了兩種新的圖像壓縮編碼標(biāo)準(zhǔn),這就是MPEG4和MPEG738編輯版pppt運動圖像壓縮標(biāo)準(zhǔn) 視頻圖像壓縮的一個重要標(biāo)準(zhǔn)是38編輯版pp圖像壓縮技術(shù)一覽表壓縮標(biāo)準(zhǔn)MPEG4MPEG2MPEG1MJPEG特點兼容前幾種標(biāo)準(zhǔn),采用更為優(yōu)化的編碼技術(shù),基于場景描述和面向帶寬設(shè)計基于幀重建算法進(jìn)行壓縮和傳輸,動態(tài)監(jiān)測圖像變化,根據(jù)對象的空間及時間特征來調(diào)整壓縮方法,幀間加入預(yù)測幀單獨對一幀進(jìn)行壓縮,基本不考慮視頻流中不同幀之間的變化優(yōu)點圖像質(zhì)量好;可變帶寬傳輸;錯誤恢復(fù)能力強。壓縮比可調(diào)范圍廣,支持包括高速體育運動在內(nèi)的活動圖像在實時壓縮、每幀數(shù)據(jù)量和處理速度上優(yōu)于MJPEG圖像質(zhì)量好缺點無現(xiàn)成算法,實現(xiàn)的技術(shù)難度大壓縮效率仍不理想、窄帶網(wǎng)傳輸質(zhì)量受限,對媒體的兼容能力有待提高圖像質(zhì)量相當(dāng)于VHS視頻,不能滿足廣播級的要求;傳輸帶寬有一定的要求。實時性差,壓縮效率低,文件量巨大應(yīng)用領(lǐng)域固定和無線網(wǎng)絡(luò),交互AV服務(wù)以及遠(yuǎn)程傳輸DVD,廣播級的數(shù)字電視,HDTVVCD,CD-ROM,VOD
39編輯版pppt圖像壓縮技術(shù)一覽表壓縮標(biāo)準(zhǔn)MPEG4MPEG2MPEG1M分辨率768X576(PAL)或720X480(NTSC)NTSC:720X480SIF標(biāo)準(zhǔn)分辨率(NTSC:352X240;PAL:352X288)
碼流多種帶寬可調(diào)分四級,3-100Mbits/sec最高1.5Mbits/sec
圖像質(zhì)量在各種碼率下畫質(zhì)良好極低碼率下無法保證圖像質(zhì)量基本無法進(jìn)行窄帶傳輸
多路實時存儲多路實時存儲,占用存儲空間小能實現(xiàn)多路實時存儲,文件量大,消耗硬盤。能實現(xiàn)多路實時存儲,文件量大,消耗硬盤。單路存儲,丟幀切換聯(lián)網(wǎng)要求全帶寬解決方案,支持PSTN,ISDN,DDN,局域網(wǎng),廣域網(wǎng)等適用于局域網(wǎng)適用于局域網(wǎng)定制帶寬,不支持聯(lián)網(wǎng)。40編輯版pppt分辨率768X576(PAL)或720X480(NTSC)
MPEG標(biāo)準(zhǔn)分成MPEG視頻、MPEG音頻和MPEG系統(tǒng)三大部分。 MPEG算法除了對單幅圖像進(jìn)行編碼外(幀內(nèi)編碼),還利用圖像序列的相關(guān)特性去除幀間圖像冗余,大大提高了視頻圖像的壓縮比。 壓縮比可達(dá)到60-100倍。41編輯版pppt MPEG標(biāo)準(zhǔn)分成MPEG視頻、MPEG音頻 MPEG算法除MPEG與其它算法或壓縮方案相比有什么優(yōu)點?
一、國際化的開放標(biāo)準(zhǔn),兼容性好,代表技術(shù)發(fā)展趨勢。
二、能夠比其他算法提供更好的壓縮比。
三、MPEG在提供高壓縮比的同時,對數(shù)據(jù)的損失很小。42編輯版ppptMPEG與其它算法或壓縮方案相比有什么優(yōu)點?
一、國際化的JPEG和MPEG的差別
MPEG視頻壓縮技術(shù)是針對運動圖像的數(shù)據(jù)壓縮技術(shù)。為了提高壓縮比,幀內(nèi)圖像數(shù)據(jù)和幀間圖像數(shù)據(jù)壓縮技術(shù)必須同時使用。MPEG通過幀運動補償有效地壓縮了數(shù)據(jù)的比特數(shù),它采用了三種圖像,幀內(nèi)圖、預(yù)測圖和雙向預(yù)測圖。有效地減少了冗余信息。對于MPEG來說,幀間數(shù)據(jù)壓縮、運動補償和雙向預(yù)測,這是和JPEG主要不同的地方。而JPEG和MPEG相同的地方均采用了DCT幀內(nèi)圖像數(shù)據(jù)壓縮編碼。43編輯版ppptJPEG和MPEG的差別 MPEG視頻壓縮技術(shù)是針對運動圖JPEG和MPEG的差別
另外,MPEG中視頻信號包含有靜止畫面(幀內(nèi)圖)和運動信息(幀間預(yù)測圖)等不同的內(nèi)容,量化器的設(shè)計比JPEG壓縮算法中量化器的設(shè)計考慮的因素要多。44編輯版ppptJPEG和MPEG的差別 另外,MPEG中視頻信號包含有靜止視頻通信編碼標(biāo)準(zhǔn) 多媒體通信中的電視圖像編碼標(biāo)準(zhǔn)都采用H.261和H.263。H.261主要用來支持電視會議和可視電話。 電視圖像數(shù)據(jù)壓縮后的數(shù)據(jù)速率為P×64kb/s,其中P是一個可變參數(shù),取值范圍是1-30。 H.263是在H.261的基礎(chǔ)上開發(fā)的電視圖像編碼標(biāo)準(zhǔn),用于低位速率通信的電視圖像編碼。45編輯版pppt視頻通信編碼標(biāo)準(zhǔn) 多媒體通信中的電視圖像編碼標(biāo)準(zhǔn) 電視圖像數(shù)關(guān)于壓縮比
衡量一個壓縮算法好壞的標(biāo)準(zhǔn),除了解壓后的數(shù)據(jù)有無失真或失真程度之外,是看壓縮比的大小。壓縮比常用的定義有兩種:(1)采樣壓縮比(2)比特壓縮比46編輯版pppt關(guān)于壓縮比 衡量一個壓縮算法好壞的標(biāo)準(zhǔn),除了解壓后的數(shù)據(jù)有無感謝親觀看此幻燈片,此課件部分內(nèi)容來源于網(wǎng)絡(luò),如有侵權(quán)請及時聯(lián)系我們刪除,謝謝配合!47感謝親觀看此幻燈片,此課件部分內(nèi)容來源于網(wǎng)絡(luò),471.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類型1.5.2數(shù)據(jù)壓縮方法1.5.3視頻編碼的國際標(biāo)準(zhǔn)48編輯版pppt1.5多媒體數(shù)據(jù)壓縮技術(shù)1.5.1多媒體數(shù)據(jù)的冗余類1.5.1多媒體數(shù)據(jù)的冗余類型 圖像數(shù)據(jù)表示中存在著大量的冗余,圖像數(shù)據(jù)壓縮技術(shù)就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下:1.空間冗余2.時間冗余3.視覺冗余49編輯版pppt1.5.1多媒體數(shù)據(jù)的冗余類型 圖像數(shù)據(jù)表示中存在著大量空間冗余 一幅圖像表面上各采樣點的顏色之間往往存在著空間連貫性,基于離散像素采樣來表示物體表面顏色的像素存儲方式可利用空間連貫性,達(dá)到減少數(shù)據(jù)量的目的。 例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在此區(qū)域中所有點的光強和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余。50編輯版pppt空間冗余 一幅圖像表面上各采樣點的顏色之3編輯版pppt時間冗余 運動圖像一般為位于一時間軸區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動物體,只不過移動物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時刻的同一場景畫面,所以稱為時間冗余。 同理,語音數(shù)據(jù)中也存在著時間冗余。51編輯版pppt時間冗余 運動圖像一般為位于一時間軸區(qū)間4編輯版pppt視覺冗余 人類的視覺系統(tǒng)對圖像場的敏感度是非均勻的。但是,在記錄原始的圖像數(shù)據(jù)時,通常假定視覺系統(tǒng)近似線性的和均勻的,對視覺敏感和不敏感的部分同等對待,從而產(chǎn)生比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來的編碼)更多的數(shù)據(jù),這就是視覺冗余。52編輯版pppt視覺冗余 人類的視覺系統(tǒng)對圖像場的敏感度5編輯版pppt數(shù)字壓縮技術(shù)三個重要指標(biāo)1、信息存儲量之比大2、壓縮的算法簡單3、恢復(fù)效果好53編輯版pppt數(shù)字壓縮技術(shù)三個重要指標(biāo)1、信息存儲量之比1.5.2數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個過程組成:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮,以便存儲與傳輸;二是解碼過程,此過程對編碼數(shù)據(jù)進(jìn)行解碼,還原為可以使用的數(shù)據(jù)。 數(shù)據(jù)壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮54編輯版pppt1.5.2數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個過程組成: 什么是熵
數(shù)據(jù)壓縮不僅起源于40年代由ClaudeShannon首創(chuàng)的信息論,而且其基本原理即信息究竟能被壓縮到多小,至今依然遵循信息論中的一條定理,這條定理借用了熱力學(xué)中的名詞“熵”(Entropy)來表示一條信息中真正需要編碼的信息量:
考慮用0和1組成的二進(jìn)制數(shù)碼為含有n個符號的某條信息編碼,假設(shè)符號Fn在整條信息中重復(fù)出現(xiàn)的概率為Pn,則該符號的熵也即表示該符號所需的位數(shù)位為:
En=-log2(Pn)整條信息的熵也即表示整條信息所需的位數(shù)為:E=∑En
55編輯版pppt什么是熵
數(shù)據(jù)壓縮不僅起源于40年代由Cl舉個例子,對下面這條只出現(xiàn)了abc三個字符的字符串:
aabbaccbaa
字符串長度為10,字符abc分別出現(xiàn)了532次,則abc在信息中出現(xiàn)的概率分別為0.50.30.2,他們的熵分別為:
Ea=-log2(0.5)=1Eb=-log2(0.3)=1.737Ec=-log2(0.2)=2.322整條信息的熵也即表達(dá)整個字符串需要的位數(shù)為:
E=Ea*5+Eb*3+Ec*2=14.855位回想一下如果用計算機中常用的ASCII編碼,表示上面的字符串我們需要整整80位呢!現(xiàn)在知道信息為什么能被壓縮而不丟失原有的信息內(nèi)容了吧。簡單地講,用較少的位數(shù)表示較頻繁出現(xiàn)的符號,這就是數(shù)據(jù)壓縮的基本準(zhǔn)則。
56編輯版pppt舉個例子,對下面這條只出現(xiàn)了abc三個字符的字符串:模型
從上面的描述,我們明白,要壓縮一條信息,首先要分析清楚信息中每個符號出現(xiàn)的概率。不同的壓縮程序通過不同的方法確定符號的出現(xiàn)概率,對符號的概率計算得越準(zhǔn)確,也就越容易得到好的壓縮效果。在壓縮程序中,用來處理輸入信息,計算符號的概率并決定輸出哪個或哪些代碼的模塊叫做模型。
難道對信息中字符的出現(xiàn)概率這么難以估計以至于有各種不同的壓縮模型嗎?對上面的字符串我們不是很容易就知道每個字符的概率了嗎?不過上面的字符串僅有10個字符長呀,那只是例子而已??紤]我們現(xiàn)實中要壓縮的文件,大多數(shù)可是有幾十K甚至幾百K長,幾M字節(jié)的文件不是也屢見不鮮嗎?
是的,我們可以預(yù)先掃描文件中的所有字符,統(tǒng)計出每個字符出現(xiàn)的概率,這種方法在壓縮術(shù)語里叫做“靜態(tài)統(tǒng)計模型”。但是,不同的文件中,字符有不同的分布概率,我們要么先花上大量的時間統(tǒng)計我們要壓縮的所有文件中的字符概率,要么為每一個單獨的文件保存一份概率表以備解壓縮時需要。糟糕的是,不但掃描文件要消耗大量時間,而且保存一份概率表也使壓縮后的文件增大了不少。所以,在實際應(yīng)用中,“靜態(tài)統(tǒng)計模型”應(yīng)用的很少。
57編輯版pppt模型
從上面的描述,我們明白,要壓縮一條信息,首先要分析清楚
真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東西。自適應(yīng)模型可以說是一臺具有學(xué)習(xí)功能的自動機。他在信息被輸入之前對信息內(nèi)容一無所知并假定每個字符的出現(xiàn)概率均等,隨著字符不斷被輸入和編碼,他統(tǒng)計并紀(jì)錄已經(jīng)出現(xiàn)過的字符的概率并將這些概率應(yīng)用于對后續(xù)字符的編碼。也就是說,自適應(yīng)模型在壓縮開始時壓縮效果并不理想,但隨著壓縮的進(jìn)行,他會越來越接近字符概率的準(zhǔn)確值,并達(dá)到理想的壓縮效果。自適應(yīng)模型還可以適應(yīng)輸入信息中字符分布的突然變化,可以適應(yīng)不同的文件中的字符分布而不需要保存概率表。
58編輯版pppt真正的壓縮程序中使用的大多是一種叫“自適應(yīng)模型”的東編碼通過模型,我們已經(jīng)確定了對某一個符號該用多少位二進(jìn)制數(shù)進(jìn)行編碼?,F(xiàn)在的問題是,如何設(shè)計一種編碼方案,使其盡量精確地用模型計算出來的位數(shù)表示某個符號。最先被考慮的問題是,如果對a用3個二進(jìn)制位就可以表示,而對b用4個二進(jìn)制位就可以表示,那么,在解碼時,面對一連串的二進(jìn)制流,我怎么知道哪三個位是a,哪四個位是b呢?所以,必須設(shè)計出一種編碼方式,使得解碼程序可以方便地分離每個字符的編碼部分。于是有了一種叫“前綴編碼”的技術(shù)。該技術(shù)的主導(dǎo)思想是,任何一個字符的編碼,都不是另一個字符編碼的前綴。反過來說就是,任何一個字符的編碼,都不是由另一個字符的編碼加上若干位0或1組成??匆幌虑熬Y編碼的一個最簡單的例子59編輯版pppt編碼12編輯版pppt符號編碼A0B10C110D1110E11110有了上面的碼表,你一定可以輕松地從下面這串二進(jìn)制流中分辨出真正的信息內(nèi)容了:1110010101110110111100010-DABBDCEAAB60編輯版pppt符號編碼A013編輯版pppt無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。 其原理是統(tǒng)計壓縮數(shù)據(jù)中的冗余(重復(fù)的數(shù)據(jù))部分。常用的有:RLE(runlengthencoding)行程編碼Huffman編碼算術(shù)編碼LZW(lempel-ziv-welch)編碼61編輯版pppt無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,14編輯版ppptShannon-Fano編碼
討論之前,我們假定要編碼字符的出現(xiàn)概率已經(jīng)由某一模型統(tǒng)計出來,例如,對下面這串出現(xiàn)了五種字符的信息(40個字符長):
cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別:a-16,b-7,c-6,d-6,e-5。
Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹,構(gòu)造的方式非常簡單:
62編輯版ppptShannon-Fano編碼
討論之前,我們假定要編碼字Shannon-Fano編碼
進(jìn)入Huffman先生構(gòu)造的神奇二叉樹之前,我們先來看一下它的前身,由ClaudeShannon和R.M.Fano兩人提出的Shannon-Fano編碼。
討論之前,我們假定要編碼字符的出現(xiàn)概率已經(jīng)由某一模型統(tǒng)計出來,例如,對下面這串出現(xiàn)了五種字符的信息(40個字符長):
cabcedeacacdeddaaabaababaaabbacdebaceada五種字符的出現(xiàn)次數(shù)分別:a-16,b-7,c-6,d-6,e-5。
Shannon-Fano編碼的核心仍然是構(gòu)造二叉樹,構(gòu)造的方式非常簡單:
63編輯版ppptShannon-Fano編碼
進(jìn)入Huffman先生構(gòu)1)將給定符號按照其頻率從大到小排序。對上面的例子,應(yīng)該得到:a-16b-7c-6d-6e-5
2)將序列分成上下兩部分,使得上部頻率總和盡可能接近下部頻率總和。我們有:a-16b-7-----------------c-6d-6e-5
3)我們把第二步中劃分出的上部作為二叉樹的左子樹,記0,下部作為二叉樹的右子樹,記1。4)分別對左右子樹重復(fù)23兩步,直到所有的符號都成為二叉樹的樹葉為止?,F(xiàn)在我們有如下的二叉樹:根(root)0|1+------+------+0|10|1+-----+-----++---+----+||||abc|0|1+-----+-----+||de
64編輯版pppt1)將給定符號按照其頻率從大到小排序。對上面的例子,應(yīng)該得于是我們得到了此信息的編碼表:
a-00b-01c-10d-110e-111
可以將例子中的信息編碼為:
cabcedeacacdeddaaabaababaaabbacdebaceada10000110
11111011100100010......碼長共91位。考慮用ASCII碼表示上述信息需要8*40=240位,我們確實實現(xiàn)了數(shù)據(jù)壓縮
65編輯版pppt于是我們得到了此信息的編碼表:
a-00b-01Huffman編碼Huffman編碼構(gòu)造二叉樹的方法和Shannon-Fano正好相反,不是自上而下,而是從樹葉到樹根生成二叉樹?,F(xiàn)在,我們?nèi)匀皇褂蒙厦娴睦觼韺W(xué)習(xí)Huffman編碼方法。1)將各個符號及其出現(xiàn)頻率分別作為不同的小二叉樹(目前每棵樹只有根節(jié)點)。a(16)b(7)c(6)d(6)e(5)
2)在1中得到的樹林里找出頻率值最小的兩棵樹,將他們分別作為左、右子樹連成一棵大一些的二叉樹,該二叉樹的頻率值為兩棵子樹頻率值之和。對上面的例子,我們得到一個新的樹林:|(11)a(16)b(7)c(6)+---+---+||de
3)對上面得到的樹林重復(fù)2的做法,直到所有符號都連入樹中為止。這一步完成后,我們有這樣的二叉樹:根(root)0|1+------+----------------+|0|1|+---------+-----------+|0|10|1a+-------+------++-------+-------+||||bcde由此,我們可以建立和Shannon-Fano編碼略微不同的編碼表:
a-0b-100c-101d-110e-111
66編輯版ppptHuffman編碼a(16)b(7)對例子中信息的編碼為:cabcedeacacdeddaaabaababaaabbacdebaceada101010010111111011101010101......
碼長共88位。這比使用Shannon-Fano編碼要更短一點。讓我們回顧一下熵的知識,使用我們在第二章學(xué)到的計算方法,上面的例子中,每個字符的熵為:Ea=-log2(16/40)=1.322Eb=-log2(7/40)=2.515Ec=-log2(6/40)=2.737Ed=-log2(6/40)=2.737Ee=-log2(5/40)=3.000
信息的熵為:也就是說,表示該條信息最少需要86.601位。我們看到,Shannon-Fano編碼和Huffman編碼都已經(jīng)比較接近該信息的熵值了。67編輯版pppt對例子中信息的編碼為:20編輯版pppt(1)、行程編碼(RLE) RLE編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號表示。 例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B。 RLE編碼簡單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如.BMP.TIFF及AVI等格式文件的壓縮均采用此方法.68編輯版pppt(1)、行程編碼(RLE) RLE編碼簡單直觀,編碼/解碼速(3)、算術(shù)編碼 其方法是將被編碼的信源消息表示成實數(shù)軸0-1之間的一個間隔,消息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位數(shù)就越多。 該方法實現(xiàn)較為復(fù)雜,常與其它有損壓縮結(jié)合使用,并在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG)中扮演重要角色。69編輯版pppt(3)、算術(shù)編碼 該方法實現(xiàn)較為復(fù)雜,常與其它有22編輯版p(4)、LZW編碼 LZW(Lempel-Ziv-Welch)壓縮使用字典庫查找方案。它讀入待壓縮的數(shù)據(jù)并與一個字典庫(庫開始是空的)中的字符串對比,如有匹配的字符串,則輸出該字符串?dāng)?shù)據(jù)在字典庫中的位置索引,否則將該字符串插入字典中。 許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用了設(shè)方法。 另外,.GIF和.TIF格式的圖形文件也是按這一文件存儲的。70編輯版pppt(4)、LZW編碼 許多商品壓縮軟件如ARJ、PKZIR、2有損壓縮 圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息為代價,換取了較高的壓縮比。 常用的有損壓縮方法有:PCM(脈沖編碼調(diào)制)、預(yù)測編碼、變換編碼、插值與外推等。 新一代的數(shù)據(jù)壓縮方法有:矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。71編輯版pppt有損壓縮 圖像或聲音的頻帶寬、信息豐富, 常用的有損壓縮方法預(yù)測編碼:根據(jù)某一數(shù)據(jù)模型利用以往的樣本值對新樣本值進(jìn)行預(yù)測,然后將樣本實際值與預(yù)測值的差值進(jìn)行編碼。如果模型足夠好,且樣本序列的時間相關(guān)性較強,那么誤差信號的幅度將遠(yuǎn)小于原始信號,可以用較少的值對其差值量化,得到較好的壓縮效果。預(yù)測編碼常用的是差分脈沖編碼調(diào)制(DPCM)和自適應(yīng)的差分脈沖編碼調(diào)制(ADPCM)。72編輯版pppt預(yù)測編碼:25編輯版pppt分形編碼:
分形的方法是把一幅數(shù)字圖像,通過一些圖像處理技術(shù),如顏色分割,邊緣檢測、頻譜分析、統(tǒng)理變化分析等原始圖像分成一些子圖像。然后在分形集中查找這樣的子圖像。分形集實際上并不是存儲所有可能的子圖像,而是存儲許多迭代函數(shù),通過迭代函數(shù)的反復(fù)迭代,可以恢復(fù)出原來的圖像73編輯版pppt26編輯版pppt混合壓縮 混合壓縮是利用了各種單一壓縮的長處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。 該方法在許多情況下被應(yīng)用,如JPEG和MPEG標(biāo)準(zhǔn)就采用了混合編碼的壓縮方法。74編輯版pppt混合壓縮 混合壓縮是利用了各種單一壓縮的27編輯版pppt音頻信號編碼的分類:1、基于音頻數(shù)據(jù)的統(tǒng)計特性進(jìn)行編碼2、基于音頻的聲學(xué)參數(shù),進(jìn)行參數(shù)編碼3、基于人的聽覺特性進(jìn)行編碼75編輯版pppt音頻信號編碼的分類:1、基于音頻數(shù)據(jù)的統(tǒng)計特性進(jìn)行編碼28編音頻信號的編碼方式:(1)波形編碼,如PCM、APC、ATC等(2)分析合成方法(參數(shù)編碼方法)如PLC(3)混合編碼方法76編輯版pppt音頻信號的編碼方式:(1)波形編碼,如PCM、APC、ATCMP3的全名是MPEGAudioLayer-3,簡單的說就是一種聲音文件的壓縮格式。1987年德國的研究機構(gòu)IIS(InstituteIntegrierteSchaltungen)開始著手一項聲音編碼及數(shù)字音頻廣播的計劃,名稱叫做EUREKAEUl47,即MP3的前身。之后,這項計劃由IIS與Erlangen大學(xué)共同合作,開發(fā)出一套非常強大的算法,經(jīng)由150國際標(biāo)準(zhǔn)組織認(rèn)證之后,符合ISO-MPEGAudioLayer-3標(biāo)準(zhǔn),就成為現(xiàn)在的MP3。
77編輯版ppptMP3的全名是MPEGAudioLayer-3,簡單的說ISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個使用高性能音頻數(shù)據(jù)壓縮方法的感知編碼方案(perceptualcodingschemes)。按照壓縮質(zhì)量(每Bit的聲音效果)和編碼方案的復(fù)雜程度分別是Layer1、Layer2、Layer3。
所有這三層的編碼采用的基本結(jié)構(gòu)是相同的。它們在采用傳統(tǒng)的頻譜分析和編碼技術(shù)的基礎(chǔ)上還應(yīng)用了子帶分析和心理聲學(xué)模型理論。也就是通過研究人耳和大腦聽覺神經(jīng)對音頻失真的敏感度,在編碼時先分析聲音文件的波形,利用濾波器找出噪音電平(NoiseLevel),然后濾去人耳不敏感的信號,
通過矩陣量化的方式將余下的數(shù)據(jù)每一位打散排列,最后編碼形成MPEG的文件。而音質(zhì)聽起來與CD相差不大。
78編輯版ppptISO/MPEG音頻壓縮標(biāo)準(zhǔn)里包括了三個使用高性能音頻數(shù)據(jù)壓MP3的好處在于大幅降低數(shù)字聲音文件的容量,而不會破壞原來的音質(zhì)。以CD音質(zhì)的Wave文件來說,如抽樣分辨率為l6bit,抽樣頻率44.1kHz,聲音模式為立體聲,那么存儲l秒鐘CD音質(zhì)的Wave文件,必須要用l6bit*44100Hz*2Stereo=1411200bit,也就是相當(dāng)于1411.2kbit的存儲容量,存儲介質(zhì)的負(fù)擔(dān)相當(dāng)大。不過通過MP3格式壓縮后,文件便可壓縮為原來的1/10到l/12,每l秒鐘的MP3只需大約112-128kbit就可以了。
79編輯版ppptMP3的好處在于大幅降低數(shù)字聲音文件的容量,而不會破壞原來的聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:
聲音質(zhì)量帶寬模式比特率壓縮比率電話2.5kHz單聲道8kbps*96:1好于短波4.5kHz單聲道16kbps48:1好于調(diào)幅廣播7.5kHz單聲道32kbps24:1類似調(diào)頻廣播11kHz立體聲56-64kbps26-24:1接近CD15kHz立體聲96kbps16:1CD>15kHz立體聲112-128kbps14-12:180編輯版pppt聲音品質(zhì)與MP3壓縮比例關(guān)系表如下:聲音質(zhì)量帶寬模式比特率壓1.5.3視頻編碼的國際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運動圖像壓縮標(biāo)準(zhǔn)3.視頻通信編碼標(biāo)準(zhǔn)81編輯版pppt1.5.3視頻編碼的國際標(biāo)準(zhǔn)1、靜止圖像壓縮標(biāo)準(zhǔn)2、運動靜止圖像壓縮標(biāo)準(zhǔn) 國際標(biāo)準(zhǔn)化組織(ISO)和國際電報電話咨詢委員會(CCITT)聯(lián)合成立的“聯(lián)合照片專家組“JPEG
(jointphotographicexpertsgroup)于1991年提出的“多灰度靜止圖像的數(shù)字壓縮編碼“(簡稱JPEG標(biāo)準(zhǔn))。 這是一個適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。82編輯版pppt靜止圖像壓縮標(biāo)準(zhǔn) 國際標(biāo)準(zhǔn)化組織(ISO)和國際電報35編輯
JPEG標(biāo)準(zhǔn)支持很高的圖像分辨率和量化精度。它包含兩部
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 報廢食品銷售合同
- 舞蹈表演培訓(xùn)課程
- 山西省2024八年級物理上冊第二章聲現(xiàn)象第2節(jié)聲音的特性課件新版新人教版
- 河北省唐山市部分學(xué)校2024-2025學(xué)年高一上學(xué)期11月期中聯(lián)考化學(xué)試卷(含答案)
- 《麻紡織品中木質(zhì)素含量的測定 硫酸溶解法》
- 鋼業(yè)生產(chǎn)安全防范
- 福建省漳州第一中學(xué)2024-2025學(xué)年七年級上學(xué)期11月期中歷史試題
- 企業(yè)植樹節(jié)活動方案
- 城市燃?xì)庀嚓P(guān)行業(yè)投資方案范本
- 老年體位性低血壓的護(hù)理
- 可研勘察設(shè)計費計費標(biāo)準(zhǔn)
- 刮泥機出廠檢測調(diào)試報告
- 工業(yè)管道基礎(chǔ)知識PPT課件
- 運動處方知識點
- 某企業(yè)員工違規(guī)處理登記表(doc 2頁)
- 生物地理學(xué)熱帶生物群
- 小學(xué)數(shù)學(xué)科教師家長會優(yōu)秀PPT完整版
- 養(yǎng)殖恒溫室設(shè)計方案
- 腦出血大病歷.doc
- 人教版小學(xué)語文一年級生字表(打印版)
- 煤礦聯(lián)合試運轉(zhuǎn)方案
評論
0/150
提交評論