多媒體信息的數(shù)據(jù)壓縮_第1頁
多媒體信息的數(shù)據(jù)壓縮_第2頁
多媒體信息的數(shù)據(jù)壓縮_第3頁
多媒體信息的數(shù)據(jù)壓縮_第4頁
多媒體信息的數(shù)據(jù)壓縮_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、整理課件1.5 多媒體數(shù)據(jù)壓縮技術1.5.1 多媒體數(shù)據(jù)的冗余類型1.5.2 數(shù)據(jù)壓縮方法1.5.3 視頻編碼的國際標準整理課件1.5.1 多媒體數(shù)據(jù)的冗余類型圖像數(shù)據(jù)表示中存在著大量的冗余,圖像數(shù)據(jù)壓縮技術就是利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。常見圖像數(shù)據(jù)冗余類型如下:1. 空間冗余2. 時間冗余3. 視覺冗余整理課件空間冗余一幅圖像表面上各采樣點的顏色之間往往存在著空間連貫性,基于離散像素采樣來表示物體表面顏色的像素存儲方式可利用空間連貫性,達到減少數(shù)據(jù)量的目的。例如,在靜態(tài)圖像中有一塊表面顏色均勻的區(qū)域,在此區(qū)域中所有點的光強和色彩以及飽和度都是相同的,因此數(shù)據(jù)有很大的空間冗余

2、。整理課件時間冗余運動圖像一般為位于一時間軸區(qū)間的一組連續(xù)畫面,其中的相鄰幀往往包含相同的背景和移動物體,只不過移動物體所在的空間位置略有不同,所以后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,這種共同性是由于相鄰幀記錄了相鄰時刻的同一場景畫面,所以稱為時間冗余。同理,語音數(shù)據(jù)中也存在著時間冗余。整理課件視覺冗余人類的視覺系統(tǒng)對圖像場的敏感度是非均勻的。但是,在記錄原始的圖像數(shù)據(jù)時,通常假定視覺系統(tǒng)近似線性的和均勻的,對視覺敏感和不敏感的部分同等對待,從而產生比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來的編碼)更多的數(shù)據(jù),這就是視覺冗余。整理課件數(shù)字壓縮技術三個重要指標1、信息存儲量之比 大2

3、、壓縮的算法 簡單3、恢復效果 好整理課件1.5.2 數(shù)據(jù)壓縮方法壓縮處理一般是由兩個過程組成:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進行壓縮,以便存儲與傳輸;二是解碼過程,此過程對編碼數(shù)據(jù)進行解碼,還原為可以使用的數(shù)據(jù)。數(shù)據(jù)壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮整理課件整理課件整理課件整理課件整理課件編碼編碼通過模型,我們已經(jīng)確定了對某一個符號該用多少位二進制數(shù)進行編碼?,F(xiàn)在的問題是,如何設計一種編碼方案,使其盡量精確地用模型計算出來的位數(shù)表示某個符號。最先被考慮的問題是,如果對 a 用 3 個二進制位就可以表示,而對 b 用 4 個二進制位就可以表示

4、,那么,在解碼時,面對一連串的二進制流,我怎么知道哪三個位是 a,哪四個位是 b 呢?所以,必須設計出一種編碼方式,使得解碼程序可以方便地分離每個字符的編碼部分。于是有了一種叫“前綴編碼”的技術。該技術的主導思想是,任何一個字符的編碼,都不是另一個字符編碼的前綴。反過來說就是,任何一個字符的編碼,都不是由另一個字符的編碼加上若干位 0 或 1 組成??匆幌虑熬Y編碼的一個最簡單的例子整理課件符號 編碼 A 0 B 10 C 110 D 1110 E 11110 有了上面的碼表,你一定可以輕松地從下面這串二進制流中分辨出真正的信息內容了:1110010101110110111100010 - DA

5、BBDCEAAB整理課件無損壓縮無損壓縮常用在原始數(shù)據(jù)的存檔,如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。其原理是統(tǒng)計壓縮數(shù)據(jù)中的冗余(重復的數(shù)據(jù))部分。常用的有:RLE (run length encoding)行程編碼Huffman 編碼算術編碼LZW (lempel-ziv-welch)編碼整理課件整理課件整理課件1) 將給定符號按照其頻率從大到小排序。對上面的例子,應該得到: a - 16 b - 7 c - 6 d - 6 e - 5 2) 將序列分成上下兩部分,使得上部頻率總和盡可能接近下部頻率總和。我們有: a - 16 b - 7- c - 6 d - 6 e - 5 3) 我們把

6、第二步中劃分出的上部作為二叉樹的左子樹,記 0,下部作為二叉樹的右子樹,記 1。4) 分別對左右子樹重復 2 3 兩步,直到所有的符號都成為二叉樹的樹葉為止?,F(xiàn)在我們有如下的二叉樹: 根(root) 0 | 1 +-+-+ 0 | 1 0 | 1 +-+-+ +-+-+ | | | | a b c | 0 | 1 +-+-+ | | d e 整理課件整理課件Huffman Huffman 編碼編碼Huffman 編碼構造二叉樹的方法和 Shannon-Fano 正好相反,不是自上而下,而是從樹葉到樹根生成二叉樹?,F(xiàn)在,我們仍然使用上面的例子來學習 Huffman 編碼方法。1) 將各個符號及其

7、出現(xiàn)頻率分別作為不同的小二叉樹(目前每棵樹只有根節(jié)點)。 a(16) b(7) c(6) d(6) e(5) 2) 在 1 中得到的樹林里找出頻率值最小的兩棵樹,將他們分別作為左、右子樹連成一棵大一些的二叉樹,該二叉樹的頻率值為兩棵子樹頻率值之和。對上面的例子,我們得到一個新的樹林: | (11) a(16) b(7) c(6) +-+-+ | | d e 3) 對上面得到的樹林重復 2 的做法,直到所有符號都連入樹中為止。這一步完成后,我們有這樣的二叉樹: 根(root) 0 | 1 +-+-+ | 0 | 1 | +-+-+ | 0 | 1 0 | 1 a +-+-+ +-+-+ | |

8、| | b c d e 由此,我們可以建立和 Shannon-Fano 編碼略微不同的編碼表: a - 0 b - 100 c - 101 d - 110 e - 111 整理課件對例子中信息的編碼為:cabcedeacacdeddaaabaababaaabbacdebaceada101 0 100 101 111 110 111 0 101 0 101 . 碼長共 88 位。這比使用 Shannon-Fano 編碼要更短一點。讓我們回顧一下熵的知識,使用我們在第二章學到的計算方法,上面的例子中,每個字符的熵為:Ea = - log2(16 / 40) = 1.322 Eb = - log2(

9、 7 / 40) = 2.515 Ec = - log2( 6 / 40) = 2.737 Ed = - log2( 6 / 40) = 2.737 Ee = - log2( 5 / 40) = 3.000 信息的熵為:也就是說,表示該條信息最少需要 86.601 位。我們看到,Shannon-Fano 編碼和 Huffman 編碼都已經(jīng)比較接近該信息的熵值了。整理課件(1)、行程編碼(RLE)RLE 編碼是將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符用單一記號表示。例如,字符串AAABCDDDDDDDDBBBBB可以壓縮為3ABC8D5B 。RLE編碼簡單直觀,編碼/解碼速度快,因此許多圖形和視頻文件,如.BM

10、P.TIFF及AVI等格式文件的壓縮均采用此方法.整理課件(3)、算術編碼其方法是將被編碼的信源消息表示成實數(shù)軸0-1之間的一個間隔,消息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進制位數(shù)就越多。該方法實現(xiàn)較為復雜,常與其它有損壓縮結合使用,并在圖像數(shù)據(jù)壓縮標準(如JPEG)中扮演重要角色。整理課件(4)、LZW編碼LZW(Lempel-Ziv-Welch)壓縮使用字典庫查找方案。它讀入待壓縮的數(shù)據(jù)并與一個字典庫(庫開始是空的)中的字符串對比,如有匹配的字符串,則輸出該字符串數(shù)據(jù)在字典庫中的位置索引,否則將該字符串插入字典中。許多商品壓縮軟件如ARJ、PKZIR、ZOO、LHA等都采用

11、了設方法。另外,.GIF 和.TIF 格式的圖形文件也是按這一文件存儲的。整理課件有損壓縮圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息為代價,換取了較高的壓縮比。常用的有損壓縮方法有:PCM(脈沖編碼調制)、預測編碼、變換編碼、插值與外推等。新一代的數(shù)據(jù)壓縮方法有:矢量量化和子帶編碼、基于模型的壓縮、分形壓縮及小波變換等。整理課件整理課件分形的方法是把一幅數(shù)字圖像,通過一分形的方法是把一幅數(shù)字圖像,通過一些圖像處理技術,如顏色分割,邊緣檢些圖像處理技術,如顏色分割,邊緣檢測、頻譜分析、統(tǒng)理變化分析等原始圖測、頻譜分析、統(tǒng)理變化分析等原始

12、圖像分成一些子圖像。然后在分形集中查像分成一些子圖像。然后在分形集中查找這樣的子圖像。分形集實際上并不是找這樣的子圖像。分形集實際上并不是存儲所有可能的子圖像,而是存儲許多存儲所有可能的子圖像,而是存儲許多迭代函數(shù),通過迭代函數(shù)的反復迭代,迭代函數(shù),通過迭代函數(shù)的反復迭代,可以恢復出原來的圖像可以恢復出原來的圖像整理課件混合壓縮混合壓縮是利用了各種單一壓縮的長處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。該方法在許多情況下被應用,如JPEG 和MPEG 標準就采用了混合編碼的壓縮方法。整理課件1、基于音頻數(shù)據(jù)的統(tǒng)計特性進行編碼2、基于音頻的聲學參數(shù),進行參數(shù)編碼3、基于人的聽覺特性進行編

13、碼整理課件整理課件整理課件整理課件整理課件聲音品質與MP3壓縮比例關系表如下:聲音質量帶寬模式比特率壓縮比率電話2.5kHz單聲道8kbps*96:1好于短波4.5kHz單聲道16kbps48:1好于調幅廣播7.5kHz單聲道32kbps24:1類似調頻廣播11kHz立體聲56-64kbps26-24:1接近CD15kHz立體聲96kbps16:1CD15kHz立體聲112-128kbps14-12:1整理課件1.5.3 視頻編碼的國際標準1、靜止圖像壓縮標準2、運動圖像壓縮標準3視頻通信編碼標準整理課件靜止圖像壓縮標準國際標準化組織(ISO)和國際電報電話咨詢委員會(CCITT)聯(lián)合成立的“

14、聯(lián)合照片專家組“ JPEG (joint photographic experts group)于1991年提出的“多灰度靜止圖像的數(shù)字壓縮編碼“(簡稱JPEG標準)。這是一個適應于彩色和單色多灰度或連續(xù)色調靜止數(shù)字圖像的壓縮標準。整理課件JPEG標準支持很高的圖像分辨率和量化精度。它包含兩部分:1、整理課件整理課件運動圖像壓縮標準視頻圖像壓縮的一個重要標準是MPEG (Moving Picture Experts Group)于1990年形成的一個標準草案(簡稱MPEG標準)。它兼顧了JPEG標準和CCITT專家組的H.261標準。 MPEG制訂過三種版本的運動圖像及其伴音的編碼標準,即MP

15、EG1、MPEG2和MPEG3。1998年又推出了兩種新的圖像壓縮編碼標準,這就是MPEG4和MPEG7整理課件圖像壓縮技術一覽表壓縮標準MPEG4 MPEG2MPEG1MJPEG特點兼容前幾種標準,采用更為優(yōu)化的編碼技術,基于場景描述和面向帶寬設計基于幀重建算法進行壓縮和傳輸,動態(tài)監(jiān)測圖像變化,根據(jù)對象的空間及時間特征來調整壓縮方法,幀間加入預測幀單獨對一幀進行壓縮,基本不考慮視頻流中不同幀之間的變化優(yōu)點圖像質量好; 可變帶寬傳輸; 錯誤恢復能力強。壓縮比可調范圍廣,支持包括高速體育運動在內的活動圖像在實時壓縮、每幀數(shù)據(jù)量和處理速度上優(yōu)于MJPEG圖像質量好缺點無現(xiàn)成算法,實現(xiàn)的技術難度大

16、壓縮效率仍不理想、窄帶網(wǎng)傳輸質量受限,對媒體的兼容能力有待提高圖像質量相當于VHS視頻,不能滿足廣播級的要求;傳輸帶寬有一定的要求。實時性差,壓縮效率低, 文件量巨大應用領域固定和無線網(wǎng)絡,交互AV服務以及遠程傳輸DVD, 廣播級的數(shù)字電視, HDTVVCD, CD-ROM, VOD整理課件分辨率768X576(PAL) 或720X480(NTSC)NTSC: 720X480SIF標準分辨率(NTSC:352X240;PAL: 352X288) 碼流多種帶寬可調 分 四 級 , 3 -100Mbits/sec最高1.5Mbits/sec圖像質量在各種碼率下畫質良好極低碼率下無法保證圖像質量基本無法進行窄帶傳輸多路實時存儲多路實時存儲,占用存儲空間小能實現(xiàn)多路實時存儲,文件量大,消耗硬盤。能實現(xiàn)多路實時存儲,文件量大,消耗硬盤。單路存儲,丟幀切換聯(lián)網(wǎng)要求全帶寬解決方案, 支 持 P S T N ,ISDN,DDN,局域網(wǎng),廣域網(wǎng)等適用于局域網(wǎng)適用于局域網(wǎng)定制帶寬,不支持聯(lián)網(wǎng)。整理課件MPEG標準分成MPEG視頻、MPEG音頻和MPEG系統(tǒng)三大部分。MPEG算法除了對單幅圖像進行編碼外(幀內編碼),還利用圖像序列的相關特性去除幀間圖像冗余,大大提高了視頻圖像的壓縮比。壓縮比可達到60-100倍。整理課件MPEG與其它算法或壓縮方案相比有什么優(yōu)點?一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論