第4章多媒體數(shù)據(jù)壓縮技術(shù)課件

上傳人：6*** IP屬地：湖北上傳時間：2023-01-14 格式：PPT 頁數(shù)：64 大?。?83KB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩59頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

多媒體數(shù)據(jù)壓縮技術(shù)已成為當(dāng)今數(shù)字通信、廣播、存儲和多媒體娛樂中的一項(xiàng)關(guān)鍵的共性技術(shù)。

4.1多媒體數(shù)據(jù)壓縮概述

4.2數(shù)據(jù)壓縮的技術(shù)基礎(chǔ)

4.3常用的無損數(shù)據(jù)壓縮方法

4.4常用的有損數(shù)據(jù)壓縮方法

4.5數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)4.1多媒體數(shù)據(jù)壓縮概述4.1.1多媒體數(shù)據(jù)壓縮的必要性⑴原始采樣的媒體數(shù)據(jù)量巨大⑵有效利用存儲器存儲容量⑶提高通信線路的傳輸效率⑷消除計算機(jī)系統(tǒng)處理視頻I/O瓶頸4.1.2多媒體數(shù)據(jù)壓縮的可能性常見的圖像數(shù)據(jù)冗余種類：⑴空間冗余：靜態(tài)圖像中存在的最主要的一種數(shù)據(jù)冗余。⑵時間冗余：運(yùn)動圖像中經(jīng)常包含的冗余。⑶結(jié)構(gòu)冗余：在某些場景中，存在著明顯的圖像分布模式，稱作結(jié)構(gòu)。圖像中重復(fù)出現(xiàn)或相近的紋理結(jié)構(gòu)，結(jié)構(gòu)可以通過特定的過程來生成。⑷知識冗余：這類規(guī)律性的結(jié)構(gòu)可以由經(jīng)驗(yàn)知識和背景知識得到。⑸視覺冗余：人眼對亮度變化敏感，對色度的變化相對不敏感；在高亮度區(qū)，人眼對亮度變化敏感度下降；對物體邊緣敏感，內(nèi)部區(qū)域相對不敏感；對整體結(jié)構(gòu)敏感，而對內(nèi)部細(xì)節(jié)相對不敏感。⑹圖像區(qū)域的相同性冗余：圖像中的兩個或者多個區(qū)域所對應(yīng)的所有像素值相同或者相近，從而產(chǎn)生數(shù)據(jù)重復(fù)性存儲。⑺紋理的統(tǒng)計冗余：有些圖像紋理盡管不嚴(yán)格服從某個分布規(guī)律，但是在統(tǒng)計意義上服從這種規(guī)律。利用這種性質(zhì)可以減少表示圖像的數(shù)據(jù)量，所以被稱為紋理的統(tǒng)計冗余。4.1.3多媒體數(shù)據(jù)壓縮的原理1.圖像壓縮系統(tǒng)的組成由三部分組成：變換器、量化器和編碼器。2.圖像壓縮說明視頻壓縮與語音相比，語音的數(shù)據(jù)量較小，且基本壓縮方法已經(jīng)成熟，目前的數(shù)據(jù)壓縮研究主要集中于圖像和視頻信號的壓縮方面。壓縮處理過程有兩個過程，編碼過程是將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮，以便存儲與傳輸；解碼過程是對編碼數(shù)據(jù)進(jìn)行解碼，還原為可以使用的數(shù)據(jù)。3.與壓縮相關(guān)的指標(biāo)衡量一種數(shù)據(jù)壓縮技術(shù)的好壞有四個重要的指標(biāo)：⑴壓縮比大：即壓縮前后所需要的信息存儲量之比要大。⑵算法簡單：實(shí)現(xiàn)壓縮的算法簡單，壓縮、解壓速度快，盡可能地做到實(shí)時壓縮解壓。⑶恢復(fù)效果好：恢復(fù)效果好，要盡可能地恢復(fù)原始數(shù)據(jù)。⑷壓縮能否用硬件實(shí)現(xiàn)。4.1.4數(shù)據(jù)壓縮方法的分類⑴冗余壓縮法也稱無損壓縮法，是指使用壓縮后的數(shù)據(jù)可以解壓縮，且解壓之后的數(shù)據(jù)與原來的數(shù)據(jù)完全相同。它利用數(shù)據(jù)的統(tǒng)計冗余進(jìn)行壓縮，可完全恢復(fù)原始數(shù)據(jù)而不引入任何失真，但壓縮率受到數(shù)據(jù)統(tǒng)計冗余度的理論限制，一般為2:1到5:1。⑵熵壓縮法也稱有損壓縮法，有失真壓縮，是指使用壓縮后的數(shù)據(jù)進(jìn)行解壓縮，解壓之后的數(shù)據(jù)與原來的數(shù)據(jù)有所不同，但不會讓人對原始資料表達(dá)的信息造成誤解。⑶熵壓縮法與冗余壓縮法的比較在圖像壓縮系統(tǒng)組成中，變換和編碼是無損耗的，而量化是有損耗的。無損壓縮方法僅利用了統(tǒng)計冗余，而沒有利用量化器。有損壓縮方法既利用了統(tǒng)計冗余又采用了量化器，利用了心理視覺冗余。根據(jù)壓縮方法的原理，可將其具體劃分為以下幾種：⑴量化與向量量化編碼⑵預(yù)測編碼⑶變換編碼⑷信息熵編碼⑸混合編碼4.2數(shù)據(jù)壓縮的技術(shù)基礎(chǔ)4.2.1熵的概念表示一條信息中真正需要編碼的信息量，即數(shù)據(jù)壓縮的理論極限。對于任何一種無損數(shù)據(jù)壓縮，最終的數(shù)據(jù)量一定大于信息熵，數(shù)據(jù)量越接近于熵值，說明其壓縮效果越好。信息熵如何計算：在計算機(jī)內(nèi)部是用二進(jìn)制來表示數(shù)據(jù)的，現(xiàn)在要用0和1組成的二進(jìn)制數(shù)碼來為含有n個符號的某條信息編碼，假設(shè)符號Fn在整條信息中重復(fù)出現(xiàn)的概率為Pn，則該符號的熵En也即表示該符號所需的位數(shù)為：En=log2(1/Pn)=-log2(Pn)整條信息的熵E也即表示整條信息所需的位數(shù)為：E=∑En4.2.2數(shù)據(jù)壓縮模型——主要有：靜態(tài)統(tǒng)計模型：預(yù)先掃描文件中的所有字符，統(tǒng)計出每個字符出現(xiàn)的概率。自適應(yīng)模型；在信息被輸入之前對信息內(nèi)容一無所知并假定每個字符的出現(xiàn)概率均等，隨著字符不斷被輸入和編碼，統(tǒng)計并紀(jì)錄已經(jīng)出現(xiàn)過的字符的概率并將這些概率應(yīng)用于對后續(xù)字符的編碼。字典模型：4.2.3數(shù)據(jù)壓縮編碼壓縮=模型+編碼4.3常用的無損數(shù)據(jù)壓縮方法4.3.1香農(nóng)-范諾與哈夫曼編碼1.香農(nóng)-范諾編碼——算法步驟：⑴將待編碼的符號按符號出現(xiàn)概率從大到小進(jìn)行排序。⑵將排好序的符號分成兩組，使這兩組符號概率和相等或盡可能的相近。⑶將第一組賦值為0，第二組賦值為1。⑷對每一組，只要不是一個符號，就重復(fù)步驟2的操作，否則操作完畢。例4-1有一串由6個字母組成的長度為50的字符串，字母分別A、B、C、D、E和F，其中A出現(xiàn)3次，B出現(xiàn)5次，C出現(xiàn)15次，D出現(xiàn)11次，E出現(xiàn)12次，F(xiàn)出現(xiàn)4次，請使用香農(nóng)-范諾對其進(jìn)行編碼。解題步驟：⑴使用下表列出字母在字符串中的概率統(tǒng)計⑵首先對符號按出現(xiàn)次數(shù)的多少進(jìn)行排序，得下表所示。⑶然后對符號進(jìn)行分組，將其分為概率和最接近的兩組即為（C、E）和（D、B、F、A），其中（C、E）賦值為0，（D、B、F、A）賦值為1，依次遞歸下去。使用二叉樹左支為0，右支為1來進(jìn)行編碼，其最終實(shí)現(xiàn)如圖所示。⑷使用香農(nóng)-范諾編碼算法得到的編碼表，如下表所示。⑸總共需要4×3+3×5+2×15+2×11+2×12+4×4=119位，而如果用ASCII來進(jìn)行表示的話，至少要用到50×8=400位；如果用等長碼3位二進(jìn)制來表示六個字母的話，這樣需用到50×3=150位，從這兩方面都實(shí)現(xiàn)數(shù)據(jù)壓縮。⑹再來看一看壓縮效果如何，這時就需來計算數(shù)據(jù)壓縮的極限—熵的值：2.Huffman編碼——算法步驟：⑴初始化，根據(jù)符號出現(xiàn)的次數(shù)按由大到小順序?qū)Ψ栠M(jìn)行排序。⑵把概率最小的兩個符號組成一個節(jié)點(diǎn)，節(jié)點(diǎn)為兩符號次數(shù)之和，去掉已取出的兩個節(jié)點(diǎn)，加入這兩節(jié)點(diǎn)之和，重新排序，直至只有一個數(shù)據(jù)且該數(shù)據(jù)的值所有符號出現(xiàn)的總次數(shù)相同為止，跳向(4)步驟。⑶重復(fù)步驟2，得到新節(jié)點(diǎn)，形成一棵“樹”。⑷從根節(jié)點(diǎn)開始到相應(yīng)于每個符號的“樹葉”，從上到下標(biāo)上“0”或“1”。通常左支標(biāo)為0，右支標(biāo)為1。⑸從根節(jié)點(diǎn)開始順著樹枝到每個葉子分別寫出每個符號的代碼。例4-2就上面關(guān)于Shannon-Fano編碼的例子，現(xiàn)對其使用Huffman進(jìn)行編碼。解題步驟：⑴首先按照符號出現(xiàn)的概率有大到小排序，如表下所示。⑵然后選擇其中最小的兩個符號，組成一個節(jié)點(diǎn)，如圖所示。⑶去掉剛才的兩個符號，加入它們的和，重新排序如下表所示。⑷繼續(xù)選擇其中最小的兩個符號，組成一個新節(jié)點(diǎn)，如圖所示。⑸依次類推，進(jìn)行遞歸，排序如下表所示。生成的二叉樹如圖所示。⑹依次類推，進(jìn)行遞歸，排序如下表所示。生成的二叉樹如圖所示。⑺依次類推，進(jìn)行遞歸，排序如下表所示。生成的二叉樹如圖所示。⑻對其進(jìn)行編碼，左為0，右為1，如圖所示。⑼使用Huffman編碼算法得到的編碼表，如下表所示。⑽總共需要4×3+3×5+2×15+2×11+2×12+4×4=119位，與香農(nóng)-范諾編碼算法得到的最后數(shù)據(jù)相同，也同樣實(shí)現(xiàn)了壓縮，但通常情況下哈夫曼編碼比香農(nóng)-范諾編碼的效率要高一些。3.香農(nóng)-范諾編碼和huffman編碼⑴平均碼長>=熵，但都是接近熵，而且越接近熵，說明壓縮效率越高。⑵保證解碼的唯一性，短字碼不構(gòu)成長字碼的前綴。⑶在接收端需要一個與發(fā)送端相同的代碼表。4.3.2算術(shù)編碼算術(shù)編碼的基本原理是將編碼的消息表示成實(shí)數(shù)0和1之間的一個間隔，取間隔中的一個數(shù)來進(jìn)行表示消息，消息越長，編碼表示它的間隔就越小，表示這一間隔所需的二進(jìn)制位就越多。1.自適應(yīng)統(tǒng)計模型的算術(shù)編碼與解碼例7-3假設(shè)某條信息中可能出現(xiàn)的字符只有a、b、c三種，要壓縮保存的信息為abba。解題步驟：2.靜態(tài)統(tǒng)計模型的算術(shù)編碼與解碼例4-4：假設(shè)信源符號為{a，b，c，d}，這些符號的概率分別為{0.1，0.4，0.2，0.3}，根據(jù)這些概率可把間隔[0，1]分成4個子間隔：[0，0.1]，[0.1，0.5]，[0.5，0.7]，[0.7，1]，其中[x，y]表示半開放間隔，即包含x不包含y。上面的信息表示在下表中統(tǒng)計了每個符號的概率和初始編碼間隔。如果二進(jìn)制消息序列的輸入為：cadacdb。編碼時首先輸入的符號是c，找到它的編碼范圍是[0.5，0.7]。由于消息中第二個符號a的編碼范圍是[0，0.1]，因此它的間隔就取[0.5，0.7]的第一個十分之一作為新間隔[0.5，0.52]。依此類推，編碼第3個符號d時取新間隔為[0.514，0.52]，…。消息的編碼輸出可以是最后一個間隔中的任意數(shù)。整個編碼過程如圖所示。這個例子的編碼過程表示在下表中。這個例子的譯碼過程表示在下表中。3.算術(shù)編碼的特點(diǎn)算術(shù)編碼的模式選擇直接影響編碼效率，有固定模式，也有自適應(yīng)模式。算術(shù)編碼的自適應(yīng)模式無需先定義概率模型，對無法進(jìn)行概率統(tǒng)計的信源合適，在這點(diǎn)上優(yōu)越于哈夫曼編碼。在信源符號概率接近時，算術(shù)編碼比哈夫曼編碼效率高。算術(shù)編碼的硬件實(shí)現(xiàn)比哈夫曼編碼要復(fù)雜些。算術(shù)編碼在JPEG的擴(kuò)展系統(tǒng)中被推薦代替哈夫曼編碼。4.在算術(shù)編碼中有幾個問題需要注意由于實(shí)際的計算機(jī)精度不可能無限長，運(yùn)算中出現(xiàn)溢出是一個明顯的問題，可使用比例縮放方法解決。

算術(shù)編碼器對整個消息只產(chǎn)生一個碼字，這個碼字是在間隔[0，1]中的一個實(shí)數(shù)，因此譯碼器在接受到表示這個實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。算術(shù)編碼也是一種對錯誤很敏感的編碼方法，如果有一位發(fā)生錯誤就會導(dǎo)致整個消息譯錯。4.3.3行程RLE編碼行程編碼是一種統(tǒng)計編碼，該編碼屬于無損壓縮編碼。對于二值圖有效。它的基本原理是：用一個符號值或串長代替具有相同值的連續(xù)符號，使符號長度少于原始數(shù)據(jù)的長度。行程編碼可以分為定長和變長行程編碼兩種方式。行程編碼一般不直接用于多灰度圖像(彩色圖像)中，比較適用于二值圖像的編碼，如傳真圖像的編碼。4.3.4詞典編碼LZW是詞典編碼的一種?；驹硎鞘紫冉⒁粋€字符串表，把每一個第一次出現(xiàn)的字符串放入串表中，并用一個數(shù)字來表示，這個數(shù)字與此字符串在串表中的位置有關(guān)，將這個數(shù)字存入壓縮文件中，如果這個字符串再次出現(xiàn)時，即可用表示它的數(shù)字來代替，并將這個數(shù)字存入文件中。壓縮完成后將串表丟棄。4.4常用的有損數(shù)據(jù)壓縮方法4.4.1預(yù)測編碼預(yù)測編碼是根據(jù)離散信號之間存在著一定關(guān)聯(lián)性的特點(diǎn)，利用前面一個或多個信號對下一個信號進(jìn)行預(yù)測，然后對實(shí)際值和預(yù)測值的差（預(yù)測誤差）進(jìn)行編碼。1.脈沖編碼調(diào)制PCM均勻量化：采用相等的量化間隔處理采樣得到的信號值。非均勻量化：對輸入信號進(jìn)行量化時，大的輸入信號采用大的量化間隔，小的輸入信號采用小的量化間隔，這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。2.差分脈沖編碼調(diào)制DPCM不對每一樣值都進(jìn)行量化，而是預(yù)測下一樣值，并量化實(shí)際值與預(yù)測值之間的差值進(jìn)行壓縮的方法。優(yōu)點(diǎn)是算法簡單，容易硬件實(shí)現(xiàn)，缺點(diǎn)是對信道噪聲很敏感，會產(chǎn)生誤差擴(kuò)散。3.自適應(yīng)脈沖編碼調(diào)制ADPCM核心想法是：①利用自適應(yīng)的思想改變量化階的大小，即使用小的量化階(step-size)去編碼小的差值，使用大的量化階去編碼大的差值，②使用過去的樣本值估算下一個輸入樣本的預(yù)測值，使實(shí)際樣本值和預(yù)測值之間的差值總是最小。4.4.2變換編碼一種間接編碼方法，它將原始信號經(jīng)過數(shù)學(xué)上的正交變換后，得到一系列的變換系數(shù)，再對這些系數(shù)進(jìn)行量化、編碼、傳輸。變換編碼原理框圖變換編碼系統(tǒng)方框圖變換編、解碼過程示意圖變換編碼技術(shù)技術(shù)上比較成熟，理論也比較完備，廣泛用于各種圖像數(shù)據(jù)壓縮，諸如單色圖像、彩色圖像、運(yùn)動圖像、靜止圖像以及多媒體計算機(jī)技術(shù)中的電視幀內(nèi)圖像壓縮和幀間圖像壓縮等。正交變換的種類有很多種，例如傅立葉變換、沃爾什哈達(dá)瑪變換、正弦變換、余弦變換以及K-L變換等。4.5數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)4.5.1JPEG-靜止圖像壓縮標(biāo)準(zhǔn)一個適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。它包括Huffman編碼的無損壓縮算法和基于DPCM（差分脈沖編碼調(diào)制）、DCT（離散余弦變換）的有損壓縮算法兩個部分。JPEG標(biāo)準(zhǔn)有三個范疇：⑴基本順序過程：實(shí)現(xiàn)有損圖像壓縮，重建圖像質(zhì)量達(dá)到人眼難以觀察出來的要求。⑵基于DCT的擴(kuò)展過程：基于DCT的擴(kuò)展過程使用累進(jìn)工作方式，采用自適應(yīng)算術(shù)編碼過程。⑶無失真過程：采用預(yù)測編碼及Huffman編碼（或算術(shù)編碼），可保證重建圖像數(shù)據(jù)與原始圖像數(shù)據(jù)完全相同。JPEG算法操作可分成以下幾個步驟：⑴通過離散余弦變換（DCT）去除數(shù)據(jù)冗余；⑵使用量化表對以DCT系數(shù)進(jìn)行量化；⑶對量化后的DCT系數(shù)進(jìn)行編碼使其熵達(dá)到最小，熵編碼采用Huffman可變字長編碼。⑷熵編碼⑸組成位數(shù)據(jù)流

4.5.2一個JPEG的例子原始圖圖像分塊、計算DCT系數(shù)以及系數(shù)量化系數(shù)編碼4.5.3MPEG-運(yùn)動圖像壓縮標(biāo)準(zhǔn)1.MPEG的標(biāo)準(zhǔn)化MPEG-1、2、4標(biāo)準(zhǔn)已經(jīng)正式發(fā)布，MPEG-7也已完成，在2001年底成為正式標(biāo)準(zhǔn)，MPEG-21在2002年形成。其中MPEG-1和2已經(jīng)得到廣泛應(yīng)用。例如，CD-交互系統(tǒng)，在網(wǎng)絡(luò)上的數(shù)字聲音廣播、數(shù)字電視廣播和視頻點(diǎn)播等。2.MPEG壓縮算法思想MPEG標(biāo)準(zhǔn)有三個組成部分：MPEG視頻；MPEG音頻；視頻與音頻的同步。MPEG視頻是MPEG標(biāo)準(zhǔn)的核心。MPEG視頻壓縮算法中包含兩種基本技術(shù)：一種是基于l6×16子塊的運(yùn)動補(bǔ)償技術(shù)，用來減少幀序列的時域冗余；另一種是基于DCT

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第4章多媒體數(shù)據(jù)壓縮技術(shù)課件

文檔簡介

溫馨提示

最新文檔

評論

第4章 多媒體數(shù)據(jù)壓縮技術(shù)課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第4章多媒體數(shù)據(jù)壓縮技術(shù)課件