第4章 多媒體數(shù)據(jù)壓縮技術(shù)課件_第1頁
第4章 多媒體數(shù)據(jù)壓縮技術(shù)課件_第2頁
第4章 多媒體數(shù)據(jù)壓縮技術(shù)課件_第3頁
第4章 多媒體數(shù)據(jù)壓縮技術(shù)課件_第4頁
第4章 多媒體數(shù)據(jù)壓縮技術(shù)課件_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

多媒體數(shù)據(jù)壓縮技術(shù)已成為當(dāng)今數(shù)字通信、廣播、存儲和多媒體娛樂中的一項(xiàng)關(guān)鍵的共性技術(shù)。

4.1多媒體數(shù)據(jù)壓縮概述

4.2數(shù)據(jù)壓縮的技術(shù)基礎(chǔ)

4.3常用的無損數(shù)據(jù)壓縮方法

4.4常用的有損數(shù)據(jù)壓縮方法

4.5數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)4.1多媒體數(shù)據(jù)壓縮概述4.1.1多媒體數(shù)據(jù)壓縮的必要性⑴原始采樣的媒體數(shù)據(jù)量巨大⑵有效利用存儲器存儲容量⑶提高通信線路的傳輸效率⑷消除計算機(jī)系統(tǒng)處理視頻I/O瓶頸4.1.2多媒體數(shù)據(jù)壓縮的可能性常見的圖像數(shù)據(jù)冗余種類:⑴空間冗余:靜態(tài)圖像中存在的最主要的一種數(shù)據(jù)冗余。⑵時間冗余:運(yùn)動圖像中經(jīng)常包含的冗余。⑶結(jié)構(gòu)冗余:在某些場景中,存在著明顯的圖像分布模式,稱作結(jié)構(gòu)。圖像中重復(fù)出現(xiàn)或相近的紋理結(jié)構(gòu),結(jié)構(gòu)可以通過特定的過程來生成。⑷知識冗余:這類規(guī)律性的結(jié)構(gòu)可以由經(jīng)驗(yàn)知識和背景知識得到。⑸視覺冗余:人眼對亮度變化敏感,對色度的變化相對不敏感;在高亮度區(qū),人眼對亮度變化敏感度下降;對物體邊緣敏感,內(nèi)部區(qū)域相對不敏感;對整體結(jié)構(gòu)敏感,而對內(nèi)部細(xì)節(jié)相對不敏感。⑹圖像區(qū)域的相同性冗余:圖像中的兩個或者多個區(qū)域所對應(yīng)的所有像素值相同或者相近,從而產(chǎn)生數(shù)據(jù)重復(fù)性存儲。⑺紋理的統(tǒng)計冗余:有些圖像紋理盡管不嚴(yán)格服從某個分布規(guī)律,但是在統(tǒng)計意義上服從這種規(guī)律。利用這種性質(zhì)可以減少表示圖像的數(shù)據(jù)量,所以被稱為紋理的統(tǒng)計冗余。4.1.3多媒體數(shù)據(jù)壓縮的原理1.圖像壓縮系統(tǒng)的組成由三部分組成:變換器、量化器和編碼器。2.圖像壓縮說明視頻壓縮與語音相比,語音的數(shù)據(jù)量較小,且基本壓縮方法已經(jīng)成熟,目前的數(shù)據(jù)壓縮研究主要集中于圖像和視頻信號的壓縮方面。壓縮處理過程有兩個過程,編碼過程是將原始數(shù)據(jù)經(jīng)過編碼進(jìn)行壓縮,以便存儲與傳輸;解碼過程是對編碼數(shù)據(jù)進(jìn)行解碼,還原為可以使用的數(shù)據(jù)。3.與壓縮相關(guān)的指標(biāo)衡量一種數(shù)據(jù)壓縮技術(shù)的好壞有四個重要的指標(biāo):⑴壓縮比大:即壓縮前后所需要的信息存儲量之比要大。⑵算法簡單:實(shí)現(xiàn)壓縮的算法簡單,壓縮、解壓速度快,盡可能地做到實(shí)時壓縮解壓。⑶恢復(fù)效果好:恢復(fù)效果好,要盡可能地恢復(fù)原始數(shù)據(jù)。⑷壓縮能否用硬件實(shí)現(xiàn)。4.1.4數(shù)據(jù)壓縮方法的分類⑴冗余壓縮法也稱無損壓縮法,是指使用壓縮后的數(shù)據(jù)可以解壓縮,且解壓之后的數(shù)據(jù)與原來的數(shù)據(jù)完全相同。它利用數(shù)據(jù)的統(tǒng)計冗余進(jìn)行壓縮,可完全恢復(fù)原始數(shù)據(jù)而不引入任何失真,但壓縮率受到數(shù)據(jù)統(tǒng)計冗余度的理論限制,一般為2:1到5:1。⑵熵壓縮法也稱有損壓縮法,有失真壓縮,是指使用壓縮后的數(shù)據(jù)進(jìn)行解壓縮,解壓之后的數(shù)據(jù)與原來的數(shù)據(jù)有所不同,但不會讓人對原始資料表達(dá)的信息造成誤解。⑶熵壓縮法與冗余壓縮法的比較在圖像壓縮系統(tǒng)組成中,變換和編碼是無損耗的,而量化是有損耗的。無損壓縮方法僅利用了統(tǒng)計冗余,而沒有利用量化器。有損壓縮方法既利用了統(tǒng)計冗余又采用了量化器,利用了心理視覺冗余。根據(jù)壓縮方法的原理,可將其具體劃分為以下幾種:⑴量化與向量量化編碼⑵預(yù)測編碼⑶變換編碼⑷信息熵編碼⑸混合編碼4.2數(shù)據(jù)壓縮的技術(shù)基礎(chǔ)4.2.1熵的概念表示一條信息中真正需要編碼的信息量,即數(shù)據(jù)壓縮的理論極限。對于任何一種無損數(shù)據(jù)壓縮,最終的數(shù)據(jù)量一定大于信息熵,數(shù)據(jù)量越接近于熵值,說明其壓縮效果越好。信息熵如何計算:在計算機(jī)內(nèi)部是用二進(jìn)制來表示數(shù)據(jù)的,現(xiàn)在要用0和1組成的二進(jìn)制數(shù)碼來為含有n個符號的某條信息編碼,假設(shè)符號Fn在整條信息中重復(fù)出現(xiàn)的概率為Pn,則該符號的熵En也即表示該符號所需的位數(shù)為:En=log2(1/Pn)=-log2(Pn)整條信息的熵E也即表示整條信息所需的位數(shù)為:E=∑En4.2.2數(shù)據(jù)壓縮模型——主要有:靜態(tài)統(tǒng)計模型:預(yù)先掃描文件中的所有字符,統(tǒng)計出每個字符出現(xiàn)的概率。自適應(yīng)模型;在信息被輸入之前對信息內(nèi)容一無所知并假定每個字符的出現(xiàn)概率均等,隨著字符不斷被輸入和編碼,統(tǒng)計并紀(jì)錄已經(jīng)出現(xiàn)過的字符的概率并將這些概率應(yīng)用于對后續(xù)字符的編碼。字典模型:4.2.3數(shù)據(jù)壓縮編碼壓縮=模型+編碼4.3常用的無損數(shù)據(jù)壓縮方法4.3.1香農(nóng)-范諾與哈夫曼編碼1.香農(nóng)-范諾編碼——算法步驟:⑴將待編碼的符號按符號出現(xiàn)概率從大到小進(jìn)行排序。⑵將排好序的符號分成兩組,使這兩組符號概率和相等或盡可能的相近。⑶將第一組賦值為0,第二組賦值為1。⑷對每一組,只要不是一個符號,就重復(fù)步驟2的操作,否則操作完畢。例4-1有一串由6個字母組成的長度為50的字符串,字母分別A、B、C、D、E和F,其中A出現(xiàn)3次,B出現(xiàn)5次,C出現(xiàn)15次,D出現(xiàn)11次,E出現(xiàn)12次,F(xiàn)出現(xiàn)4次,請使用香農(nóng)-范諾對其進(jìn)行編碼。解題步驟:⑴使用下表列出字母在字符串中的概率統(tǒng)計⑵首先對符號按出現(xiàn)次數(shù)的多少進(jìn)行排序,得下表所示。⑶然后對符號進(jìn)行分組,將其分為概率和最接近的兩組即為(C、E)和(D、B、F、A),其中(C、E)賦值為0,(D、B、F、A)賦值為1,依次遞歸下去。使用二叉樹左支為0,右支為1來進(jìn)行編碼,其最終實(shí)現(xiàn)如圖所示。⑷使用香農(nóng)-范諾編碼算法得到的編碼表,如下表所示。⑸總共需要4×3+3×5+2×15+2×11+2×12+4×4=119位,而如果用ASCII來進(jìn)行表示的話,至少要用到50×8=400位;如果用等長碼3位二進(jìn)制來表示六個字母的話,這樣需用到50×3=150位,從這兩方面都實(shí)現(xiàn)數(shù)據(jù)壓縮。⑹再來看一看壓縮效果如何,這時就需來計算數(shù)據(jù)壓縮的極限—熵的值:2.Huffman編碼——算法步驟:⑴初始化,根據(jù)符號出現(xiàn)的次數(shù)按由大到小順序?qū)Ψ栠M(jìn)行排序。⑵把概率最小的兩個符號組成一個節(jié)點(diǎn),節(jié)點(diǎn)為兩符號次數(shù)之和,去掉已取出的兩個節(jié)點(diǎn),加入這兩節(jié)點(diǎn)之和,重新排序,直至只有一個數(shù)據(jù)且該數(shù)據(jù)的值所有符號出現(xiàn)的總次數(shù)相同為止,跳向(4)步驟。⑶重復(fù)步驟2,得到新節(jié)點(diǎn),形成一棵“樹”。⑷從根節(jié)點(diǎn)開始到相應(yīng)于每個符號的“樹葉”,從上到下標(biāo)上“0”或“1”。通常左支標(biāo)為0,右支標(biāo)為1。⑸從根節(jié)點(diǎn)開始順著樹枝到每個葉子分別寫出每個符號的代碼。例4-2就上面關(guān)于Shannon-Fano編碼的例子,現(xiàn)對其使用Huffman進(jìn)行編碼。解題步驟:⑴首先按照符號出現(xiàn)的概率有大到小排序,如表下所示。⑵然后選擇其中最小的兩個符號,組成一個節(jié)點(diǎn),如圖所示。⑶去掉剛才的兩個符號,加入它們的和,重新排序如下表所示。⑷繼續(xù)選擇其中最小的兩個符號,組成一個新節(jié)點(diǎn),如圖所示。⑸依次類推,進(jìn)行遞歸,排序如下表所示。生成的二叉樹如圖所示。⑹依次類推,進(jìn)行遞歸,排序如下表所示。生成的二叉樹如圖所示。⑺依次類推,進(jìn)行遞歸,排序如下表所示。生成的二叉樹如圖所示。⑻對其進(jìn)行編碼,左為0,右為1,如圖所示。⑼使用Huffman編碼算法得到的編碼表,如下表所示。⑽總共需要4×3+3×5+2×15+2×11+2×12+4×4=119位,與香農(nóng)-范諾編碼算法得到的最后數(shù)據(jù)相同,也同樣實(shí)現(xiàn)了壓縮,但通常情況下哈夫曼編碼比香農(nóng)-范諾編碼的效率要高一些。3.香農(nóng)-范諾編碼和huffman編碼⑴平均碼長>=熵,但都是接近熵,而且越接近熵,說明壓縮效率越高。⑵保證解碼的唯一性,短字碼不構(gòu)成長字碼的前綴。⑶在接收端需要一個與發(fā)送端相同的代碼表。4.3.2算術(shù)編碼算術(shù)編碼的基本原理是將編碼的消息表示成實(shí)數(shù)0和1之間的一個間隔,取間隔中的一個數(shù)來進(jìn)行表示消息,消息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位就越多。1.自適應(yīng)統(tǒng)計模型的算術(shù)編碼與解碼例7-3假設(shè)某條信息中可能出現(xiàn)的字符只有a、b、c三種,要壓縮保存的信息為abba。解題步驟:2.靜態(tài)統(tǒng)計模型的算術(shù)編碼與解碼例4-4:假設(shè)信源符號為{a,b,c,d},這些符號的概率分別為{0.1,0.4,0.2,0.3},根據(jù)這些概率可把間隔[0,1]分成4個子間隔:[0,0.1],[0.1,0.5],[0.5,0.7],[0.7,1],其中[x,y]表示半開放間隔,即包含x不包含y。上面的信息表示在下表中統(tǒng)計了每個符號的概率和初始編碼間隔。如果二進(jìn)制消息序列的輸入為:cadacdb。編碼時首先輸入的符號是c,找到它的編碼范圍是[0.5,0.7]。由于消息中第二個符號a的編碼范圍是[0,0.1],因此它的間隔就取[0.5,0.7]的第一個十分之一作為新間隔[0.5,0.52]。依此類推,編碼第3個符號d時取新間隔為[0.514,0.52],…。消息的編碼輸出可以是最后一個間隔中的任意數(shù)。整個編碼過程如圖所示。這個例子的編碼過程表示在下表中。這個例子的譯碼過程表示在下表中。3.算術(shù)編碼的特點(diǎn)算術(shù)編碼的模式選擇直接影響編碼效率,有固定模式,也有自適應(yīng)模式。算術(shù)編碼的自適應(yīng)模式無需先定義概率模型,對無法進(jìn)行概率統(tǒng)計的信源合適,在這點(diǎn)上優(yōu)越于哈夫曼編碼。在信源符號概率接近時,算術(shù)編碼比哈夫曼編碼效率高。算術(shù)編碼的硬件實(shí)現(xiàn)比哈夫曼編碼要復(fù)雜些。算術(shù)編碼在JPEG的擴(kuò)展系統(tǒng)中被推薦代替哈夫曼編碼。4.在算術(shù)編碼中有幾個問題需要注意由于實(shí)際的計算機(jī)精度不可能無限長,運(yùn)算中出現(xiàn)溢出是一個明顯的問題,可使用比例縮放方法解決。

算術(shù)編碼器對整個消息只產(chǎn)生一個碼字,這個碼字是在間隔[0,1]中的一個實(shí)數(shù),因此譯碼器在接受到表示這個實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。算術(shù)編碼也是一種對錯誤很敏感的編碼方法,如果有一位發(fā)生錯誤就會導(dǎo)致整個消息譯錯。4.3.3行程RLE編碼行程編碼是一種統(tǒng)計編碼,該編碼屬于無損壓縮編碼。對于二值圖有效。它的基本原理是:用一個符號值或串長代替具有相同值的連續(xù)符號,使符號長度少于原始數(shù)據(jù)的長度。行程編碼可以分為定長和變長行程編碼兩種方式。行程編碼一般不直接用于多灰度圖像(彩色圖像)中,比較適用于二值圖像的編碼,如傳真圖像的編碼。4.3.4詞典編碼LZW是詞典編碼的一種?;驹硎鞘紫冉⒁粋€字符串表,把每一個第一次出現(xiàn)的字符串放入串表中,并用一個數(shù)字來表示,這個數(shù)字與此字符串在串表中的位置有關(guān),將這個數(shù)字存入壓縮文件中,如果這個字符串再次出現(xiàn)時,即可用表示它的數(shù)字來代替,并將這個數(shù)字存入文件中。壓縮完成后將串表丟棄。4.4常用的有損數(shù)據(jù)壓縮方法4.4.1預(yù)測編碼預(yù)測編碼是根據(jù)離散信號之間存在著一定關(guān)聯(lián)性的特點(diǎn),利用前面一個或多個信號對下一個信號進(jìn)行預(yù)測,然后對實(shí)際值和預(yù)測值的差(預(yù)測誤差)進(jìn)行編碼。1.脈沖編碼調(diào)制PCM均勻量化:采用相等的量化間隔處理采樣得到的信號值。非均勻量化:對輸入信號進(jìn)行量化時,大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔,這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。2.差分脈沖編碼調(diào)制DPCM不對每一樣值都進(jìn)行量化,而是預(yù)測下一樣值,并量化實(shí)際值與預(yù)測值之間的差值進(jìn)行壓縮的方法。優(yōu)點(diǎn)是算法簡單,容易硬件實(shí)現(xiàn),缺點(diǎn)是對信道噪聲很敏感,會產(chǎn)生誤差擴(kuò)散。3.自適應(yīng)脈沖編碼調(diào)制ADPCM核心想法是:①利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值,②使用過去的樣本值估算下一個輸入樣本的預(yù)測值,使實(shí)際樣本值和預(yù)測值之間的差值總是最小。4.4.2變換編碼一種間接編碼方法,它將原始信號經(jīng)過數(shù)學(xué)上的正交變換后,得到一系列的變換系數(shù),再對這些系數(shù)進(jìn)行量化、編碼、傳輸。變換編碼原理框圖變換編碼系統(tǒng)方框圖變換編、解碼過程示意圖變換編碼技術(shù)技術(shù)上比較成熟,理論也比較完備,廣泛用于各種圖像數(shù)據(jù)壓縮,諸如單色圖像、彩色圖像、運(yùn)動圖像、靜止圖像以及多媒體計算機(jī)技術(shù)中的電視幀內(nèi)圖像壓縮和幀間圖像壓縮等。正交變換的種類有很多種,例如傅立葉變換、沃爾什哈達(dá)瑪變換、正弦變換、余弦變換以及K-L變換等。4.5數(shù)據(jù)壓縮國際標(biāo)準(zhǔn)4.5.1JPEG-靜止圖像壓縮標(biāo)準(zhǔn)一個適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。它包括Huffman編碼的無損壓縮算法和基于DPCM(差分脈沖編碼調(diào)制)、DCT(離散余弦變換)的有損壓縮算法兩個部分。JPEG標(biāo)準(zhǔn)有三個范疇:⑴基本順序過程:實(shí)現(xiàn)有損圖像壓縮,重建圖像質(zhì)量達(dá)到人眼難以觀察出來的要求。⑵基于DCT的擴(kuò)展過程:基于DCT的擴(kuò)展過程使用累進(jìn)工作方式,采用自適應(yīng)算術(shù)編碼過程。⑶無失真過程:采用預(yù)測編碼及Huffman編碼(或算術(shù)編碼),可保證重建圖像數(shù)據(jù)與原始圖像數(shù)據(jù)完全相同。JPEG算法操作可分成以下幾個步驟:⑴通過離散余弦變換(DCT)去除數(shù)據(jù)冗余;⑵使用量化表對以DCT系數(shù)進(jìn)行量化;⑶對量化后的DCT系數(shù)進(jìn)行編碼使其熵達(dá)到最小,熵編碼采用Huffman可變字長編碼。⑷熵編碼⑸組成位數(shù)據(jù)流

4.5.2一個JPEG的例子原始圖圖像分塊、計算DCT系數(shù)以及系數(shù)量化系數(shù)編碼4.5.3MPEG-運(yùn)動圖像壓縮標(biāo)準(zhǔn)1.MPEG的標(biāo)準(zhǔn)化MPEG-1、2、4標(biāo)準(zhǔn)已經(jīng)正式發(fā)布,MPEG-7也已完成,在2001年底成為正式標(biāo)準(zhǔn),MPEG-21在2002年形成。其中MPEG-1和2已經(jīng)得到廣泛應(yīng)用。例如,CD-交互系統(tǒng),在網(wǎng)絡(luò)上的數(shù)字聲音廣播、數(shù)字電視廣播和視頻點(diǎn)播等。2.MPEG壓縮算法思想MPEG標(biāo)準(zhǔn)有三個組成部分:MPEG視頻;MPEG音頻;視頻與音頻的同步。MPEG視頻是MPEG標(biāo)準(zhǔn)的核心。MPEG視頻壓縮算法中包含兩種基本技術(shù):一種是基于l6×16子塊的運(yùn)動補(bǔ)償技術(shù),用來減少幀序列的時域冗余;另一種是基于DCT

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論