多媒體技術(shù)與應(yīng)用.ppt_第1頁
多媒體技術(shù)與應(yīng)用.ppt_第2頁
多媒體技術(shù)與應(yīng)用.ppt_第3頁
多媒體技術(shù)與應(yīng)用.ppt_第4頁
多媒體技術(shù)與應(yīng)用.ppt_第5頁
已閱讀5頁,還剩39頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第3章 多媒體數(shù)據(jù)壓縮技術(shù),3.1 數(shù)據(jù)壓縮技術(shù)概述,3.1 多媒體數(shù)據(jù)壓縮技術(shù)概述,3.1.1 多媒體信息數(shù)字化,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,3.1.3 數(shù)據(jù)壓縮分類,3.1.4 數(shù)據(jù)壓縮技術(shù)的性能指標(biāo),3.1 多媒體數(shù)據(jù)壓縮技術(shù)概述,3.1.1 多媒體信息數(shù)字化,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,3.1.3 數(shù)據(jù)壓縮分類,3.1.4 數(shù)據(jù)壓縮技術(shù)的性能指標(biāo),媒體信息的表示:,3.1.1 多媒體信息數(shù)字化,用聲音錄制軟件記錄的英文單詞“Hello”的示波器顯示波形,聲音=f (頻率、幅度、時間),媒體信息的表示:,3.1.1 多媒體信息數(shù)字化,圖像=f (位置、顏色),模擬信號數(shù)字化:,3.1.1 多媒體信息數(shù)字化,時間軸上離散化,幅度軸上離散化,編碼,3.1.1 多媒體信息數(shù)字化,采樣是在時間軸上對模擬信號進(jìn)行離散化。采樣所得的一系列離散的抽樣數(shù)值,把時間上連續(xù)的模擬信號變成離散的有限個樣值的信號。,采樣,3.1.1 多媒體信息數(shù)字化,奈奎斯特定理 對于一個包含最高頻率f0的模擬信號,選擇的采樣頻率f 滿足 f= 2f0時,經(jīng)過取樣后的離散信號能夠包含原模擬信號的全部信息,并且,經(jīng)過反變換和低通濾波,可以不失真地恢復(fù)出原始信號。,采樣定理,采樣定理應(yīng)用,3.1.1 多媒體信息數(shù)字化,例:CD音響的采樣頻率選用44.1kHz。,含義: CD音響的最高頻率為: 44.1kHz 2 = 22.05kHz,人耳聽覺頻率范圍:20Hz 20kHz,3.1.1 多媒體信息數(shù)字化,量化是在幅度軸上把連續(xù)值的模擬信號變成為離散值的數(shù)字信號 。,量化,量化步驟:,3.1.1 多媒體信息數(shù)字化,設(shè)信號電壓的整個動態(tài)變化范圍為A,共分為M個量化等級;每個量化等級為 A,則有: A =A/M,量化等級通常用二進(jìn)制的位數(shù)n表示, 它與十進(jìn)制數(shù)M之間的關(guān)系為 :M = 2n 或 n =log2M ,通常稱為量化位數(shù)。,量化等級的計算示例:,3.1.1 多媒體信息數(shù)字化,如圖案例中,信號最高幅值為A=10。,若采用 8 位 (bit) 量化,相應(yīng)的十進(jìn)制量化等級M為: M=256(即2的8次方) A= A/M=10/256=0.04,若采用4位 (bit) 量化,相應(yīng)的十進(jìn)制量化等級M為:M=16 (即2的4次方) A= A/M=10/16=0.63,3.1.1 多媒體信息數(shù)字化,量化的作用是在圖像質(zhì)量或聲音質(zhì)量達(dá)到一定保真度的前提下,舍棄那些對視覺或聽覺影響不大的信息。 量化的過程是模擬信號到數(shù)字信號的映射。模擬量是連續(xù)量,而數(shù)字量是離散量,因此量化操作實質(zhì)上是用有限的離散量代替無限的連續(xù)模擬量的多對一的映射操作。,量化,3.1.1 多媒體信息數(shù)字化,編碼是對代表特定量化等級的比較器的輸出狀態(tài)組合,變換成一個n位表示的二進(jìn)制數(shù)碼,即每一組二進(jìn)制碼代表一個取樣值的量化等級。,編碼,練習(xí)題,例:CD音響的采樣頻率選用44.1kHz,16位二進(jìn)制數(shù)量化等級,2聲道立體聲,計算數(shù)字化后所占的存儲容量。如果一首歌曲長度為4分鐘,一張CD容量為600MB,那么一張CD能夠存放幾首這樣的歌曲。,解:每秒鐘的量化量: 44.1KHz1628176.4KB 4分鐘的容量: 176.4KB60442336KB=42.336MB 一張CD存放的歌曲: 600MB 42.336MB 14,3.1 多媒體數(shù)據(jù)壓縮技術(shù)概述,3.1.1 多媒體信息數(shù)字化,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,3.1.3 數(shù)據(jù)壓縮分類,3.1.4 數(shù)據(jù)壓縮技術(shù)的性能指標(biāo),3.1 多媒體數(shù)據(jù)壓縮技術(shù)概述,3.1.1 多媒體信息數(shù)字化,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,3.1.3 數(shù)據(jù)壓縮分類,3.1.4 數(shù)據(jù)壓縮技術(shù)的性能指標(biāo),戰(zhàn)國時,魏將龐涓率軍圍攻趙國都城邯鄲。趙求救于齊,齊王命田忌、孫臏率軍往救。魏軍主力在趙國,內(nèi)部空虛,孫臏就帶兵攻打魏國都城大梁,因而,魏軍不得不從邯鄲撤軍,回救本國,路經(jīng)桂陵要隘,又遭齊兵截?fù)簦瑤缀跞姼矝]。這個典故是指采用包抄敵人的后方來迫使它撤兵的戰(zhàn)術(shù)。,圍魏救趙,使用發(fā)布者和接收者皆認(rèn)可的規(guī)則描述信息,目的,最少的符號描述盡可能多的信息,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,數(shù)據(jù)壓縮就是以最少量的數(shù)碼符號表示信源所發(fā)出的信號,減少容納給定信息或數(shù)據(jù)采樣集合的信號空間。通俗來說,數(shù)據(jù)壓縮就是用最少的符號表達(dá)最豐富的信息內(nèi)容。實際上,這種數(shù)據(jù)壓縮思想在我們?nèi)粘I钪蟹浅3R姟?什么是數(shù)據(jù)壓縮?,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,在多媒體計算系統(tǒng)中,傳輸和處理的數(shù)字化聲音、圖片、影像視頻等信息,數(shù)據(jù)量非常巨大。,數(shù)據(jù)壓縮必要性,數(shù)據(jù)壓縮的必要性,體現(xiàn)在如下幾個方面: 1. 量化后的多媒體信息數(shù)據(jù)量巨大 2. 有效利用存儲器存儲容量 3. 提高通信線路的傳輸效率,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,數(shù)據(jù)壓縮的可能性,主要表現(xiàn)在以下二個方面: 數(shù)據(jù)冗余度:音頻信號和視頻信號等原始數(shù)據(jù)通常存在很多用處不大的空間,空間越多,數(shù)據(jù)的“冗余度”也越大。通過數(shù)據(jù)的壓縮,將把這些不用的空間去掉。 人類不敏感因素:一般而言,人類對某些頻率的音頻信號不敏感,有無這些頻率的音頻,在聽覺上影響不大,因此就可去掉這些不敏感的成分,以使數(shù)據(jù)量減少。根據(jù)人眼對彩色細(xì)節(jié)分辨能力低的特點,通過減少某些人眼不敏感色彩也可以實現(xiàn)圖像存儲數(shù)據(jù)量的減少。,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,數(shù)據(jù)壓縮的可能性,信息量與數(shù)據(jù)量的關(guān)系: 信息論中,編碼數(shù)據(jù)量與所表示的信息量以及冗余信息之間的關(guān)系為: 數(shù)據(jù)量信息量冗余量,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,數(shù)據(jù)壓縮的可能性,熵,如果有一個系統(tǒng)S內(nèi)存在多個事件S = E1,.,En, 每個事件的機(jī)率分布 P = p1, ., pn, 則每個事件本身的信息量為:,Ie = log2pi (對數(shù)以2為底,單位是位元(bit)),整個系統(tǒng)的平均信息量(熵)為:,例1:英語有26個字母,假如每個字母在文章中出現(xiàn)次數(shù)平均的話,每個字母的信息量為:,例2:漢字常用的有2500個,假如每個漢字在文章中出現(xiàn)次數(shù)平均的話,每個漢字的信息量為:,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,數(shù)據(jù)壓縮的可能性,數(shù)據(jù)冗余的類別,空間冗余 時間冗余 信息熵冗余 視覺冗余 聽覺冗余 結(jié)構(gòu)冗余 知識冗余,空間冗余,在同一幅圖像中,規(guī)則物體和規(guī)則背景的表面物理特性具有相關(guān)性,這些相關(guān)性的光成像結(jié)果在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。,時間冗余,這是序列圖像(電視圖像、動畫)和言語數(shù)據(jù)中所經(jīng)常包含的冗余。圖像序列中的兩幅相鄰的圖像,后一幅圖像與前一幅圖像之間有較大的相關(guān)性,這反映為時間冗余。同理,在言語中,由于人在說話時發(fā)音的音頻是一連續(xù)的漸變過程,而不是一個完全在時間上獨立的過程,因而存在時間冗余。,例如大家常見的室內(nèi)情景電視劇,故事主要發(fā)生在特定的房間,故事的發(fā)展過程中,背景(房間和家具)一直是相同的,只有故事中的人物的動作和位置在不斷發(fā)生變化。,熵冗余,同樣長度的編碼可以表示不同的信息。 例如對信源進(jìn)行編碼時,分配給第i個碼元類的比特數(shù)b(yi)=-logpi,才能使編碼后單位數(shù)據(jù)量等于其信源熵,即達(dá)到其壓縮極限。但實際中各碼元類的先驗概率很難預(yù)知,比特分配不能達(dá)到最佳。實際單位數(shù)據(jù)量要大于信息量,即存在信息冗余熵。,視覺冗余 人類的視覺系統(tǒng)由于受生理特性的限制,對于圖像的注意是非均勻的,人對細(xì)微的顏色差異感覺不明顯。 例如,人類視覺的一般分辨能力為26灰度等級,而一般的圖像的量化采用的是28灰度等級,即存在視覺冗余。 人眼對亮度變化敏感,而對色度的變化相對不敏感 在高亮度區(qū),人眼對亮度變化敏感度下降 對物體邊緣敏感,內(nèi)部區(qū)域相對不敏感 對整體結(jié)構(gòu)敏感,而對內(nèi)部細(xì)節(jié)相對不敏感,聽覺冗余 人耳對不同頻率的聲音的敏感性是不同的,并不能察覺所有頻率的變化,對某些頻率不必特別關(guān)注,因此存在聽覺冗余。,人耳聽覺頻率范圍:20Hz 20kHz,結(jié)構(gòu)冗余 在某些場景中,存在著明顯的圖像分布模式,這種分布模式稱作結(jié)構(gòu)。圖像中重復(fù)出現(xiàn)或相近的紋理結(jié)構(gòu), 例如:方格狀的地板,蜂窩,磚墻等。,知識冗余 有些圖像的理解與某些知識有相當(dāng)大的相關(guān)性, 這類規(guī)律性的結(jié)構(gòu)可以由先驗知識和背景知識得到。,例如,下圖中是一些明星的漫畫形象。這些畫像盡管明星們的五官都被夸大和扭曲了,但是熟悉他們的人仍然能夠識別出來。這說明人類根據(jù)先驗知識,只使用少量的圖像特征就能對其內(nèi)容進(jìn)行識別。,3.1 多媒體數(shù)據(jù)壓縮技術(shù)概述,3.1.1 多媒體信息數(shù)字化,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,3.1.3 數(shù)據(jù)壓縮分類,3.1.4 數(shù)據(jù)壓縮技術(shù)的性能指標(biāo),3.1 多媒體數(shù)據(jù)壓縮技術(shù)概述,3.1.1 多媒體信息數(shù)字化,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,3.1.3 數(shù)據(jù)壓縮分類,3.1.4 數(shù)據(jù)壓縮技術(shù)的性能指標(biāo),3.1.3 數(shù)據(jù)壓縮分類,多媒體數(shù)據(jù)壓縮通常是指對模擬信號(聲音、圖像和視頻)數(shù)字化后獲得的數(shù)據(jù)的壓縮,而對于與文字和字符類媒體數(shù)據(jù)的壓縮稱為文本數(shù)據(jù)壓縮。普通文本數(shù)據(jù)的壓縮,必須是無損失的。 多媒體模擬信號在數(shù)字化的過程中引入了誤差,在壓縮階段應(yīng)該也允許有誤差,只要誤差的級別不超過數(shù)字化的階段就可以。 因此,多媒體數(shù)據(jù)的壓縮必須在追求壓縮比率提高的同時充分考慮到視覺和聽覺的感受,而普通數(shù)據(jù)的壓縮則無此顧慮。,按照壓縮效果分類: 有損壓縮和無損壓縮,3.1.3 數(shù)據(jù)壓縮分類,按照壓縮原理分類: 統(tǒng)計編碼、預(yù)測編碼、變換編碼、 混合編碼以及其他編碼等五種。,指原數(shù)據(jù)經(jīng)過壓縮后,還能完全恢復(fù)到壓縮前的原樣,信息不受損失。無損壓縮要求解壓以后的數(shù)據(jù)和原始數(shù)據(jù)完全一致,是一種可逆壓縮。通常無損壓縮的壓縮比小于有損數(shù)據(jù)壓縮的壓縮比。目前,無損壓縮算法一般可以把普通文件的數(shù)據(jù)壓縮到原來的1/21/4。,無損數(shù)據(jù)壓縮(Lossless Compression),無損壓縮算法: (1) 進(jìn)程長度編碼 (2) 霍夫曼編碼 (3) 算術(shù)編碼 (4) 詞典編碼,3.1.3 數(shù)據(jù)壓縮分類,指原數(shù)據(jù)經(jīng)過壓縮后,不能完全恢復(fù)到壓縮前的原樣,信息受到損失。解壓以后的數(shù)據(jù)和原始數(shù)據(jù)不完全一致,所以有損壓縮是不可逆壓縮方式,但是有損壓縮方法能夠獲得較大的壓縮比。,有損數(shù)據(jù)壓縮(Loss Compression),有損壓縮算法: (1) 離散余弦變換 (2) 分形壓縮 (3) 小波壓縮 (4) 向量量化 (5)線性預(yù)測編碼,3.1.3 數(shù)據(jù)壓縮分類,3.1.3 數(shù)據(jù)壓縮分類,壓縮舉例 該圖片采用不同壓縮方法得到的文件大小分別為 :,bmp格式:545KB jpg格式:38KB gif格式:57KB,結(jié)論:盡管gif圖像的顏色層次損失最大,但是生成的文件大小并非最??;而jpg圖像文件的最小,但顏色層次損失并非最大,如果不仔細(xì)比較很難發(fā)現(xiàn)圖像的細(xì)節(jié)損失.這說明jpg圖像的壓縮算法比gif的好。,3.1.3 數(shù)據(jù)壓縮分類,按照壓縮原理分類:,3.1.3 數(shù)據(jù)壓縮分類,按照壓縮原理分類:,統(tǒng)計編碼:根據(jù)信息出現(xiàn)概率的分布特性而進(jìn)行的編碼。 預(yù)測編碼:根據(jù)離散信號之間存在一定相關(guān)性的特點,利用前面的一個或多個信號對下一個信號進(jìn)行預(yù)測,然后對實際值和預(yù)測值的差(預(yù)測誤差)進(jìn)行編碼。 變換編碼:是將圖像的光強(qiáng)矩陣變換到系數(shù)空間上,然后對系數(shù)進(jìn)行編碼。 混合編碼:混合編碼是利用了各種單一壓縮算法的長處,以求在壓縮比、壓縮效率及保真度之間取得最佳折衷。 其他編碼:使用其他不同數(shù)學(xué)變換的編碼方法,3.1 多媒體數(shù)據(jù)壓縮技術(shù)概述,3.1.1 多媒體信息數(shù)字化,3.1.2 為什么進(jìn)行數(shù)據(jù)壓縮,3.1.3 數(shù)據(jù)壓縮分類,3.1.4 數(shù)據(jù)壓縮技術(shù)的性能指標(biāo),3.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論