ch5多媒體數(shù)據(jù)壓縮技術(shù)課件

上傳人：6*** IP屬地：湖北上傳時(shí)間：2023-01-14 格式：PPT 頁(yè)數(shù)：55 大小：1.93MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩50頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

本章內(nèi)容提要F多媒體數(shù)據(jù)的壓縮的可能性和必要性F壓縮基本原理F壓縮基本算法FJPEG編碼FMPEG編碼本章問(wèn)題設(shè)計(jì)：為什么要進(jìn)行多媒體數(shù)據(jù)壓縮？如何壓縮？常見(jiàn)壓縮算法有哪些？影響壓縮算法的因素有哪些？本章教學(xué)目的要求：掌握多媒體數(shù)據(jù)壓縮的基本概念和常用算法。本章教學(xué)重點(diǎn)：掌握多媒體數(shù)據(jù)壓縮的基本概念和基本原理?！?.1概述你想通過(guò)可視通信系統(tǒng)與親朋好友進(jìn)行“面對(duì)面”的通信嗎？

你想通過(guò)利用多媒體教學(xué)手段在家上學(xué)嗎？

你想在計(jì)算機(jī)上親自體念“海灣戰(zhàn)爭(zhēng)”嗎？

你進(jìn)入過(guò)國(guó)家圖書(shū)館的Internet多媒體閱覽室嗎？

你有過(guò)在Internet上看美國(guó)“9.11”事件的實(shí)時(shí)新聞報(bào)道嗎？

你有利用多媒體計(jì)算機(jī)來(lái)控制家中的所有電器的計(jì)劃嗎？無(wú)論你是否有這些想法、或經(jīng)歷，它們賴以實(shí)現(xiàn)的技術(shù)基礎(chǔ)都是多媒體數(shù)據(jù)的壓縮技術(shù)。多媒體數(shù)據(jù)壓縮的必要性⑴多媒體信息的數(shù)據(jù)量●文本：若1024×768顯示分辨率、16×16點(diǎn)陣文字、4Byte/字，則一屏漢字的總數(shù)據(jù)量為:

4×1024×768/（16×16）=12288Byte(12KB)●圖像：若采用800×600分辨率，則滿屏24位真彩色未經(jīng)壓縮的圖像的總數(shù)據(jù)量為

800×600×24/8=1440000Byte(1.37M)

監(jiān)測(cè)衛(wèi)星采用四波段、每天30幅的頻率發(fā)回上述分辨率的圖片，則每天未經(jīng)壓縮的文件數(shù)據(jù)量為：1.37×4×30=164.4M

一年的數(shù)據(jù)量為：

164.4×365=58.6G●音頻：存儲(chǔ)量=(采樣頻率×采樣精度×聲道數(shù)×?xí)r間)／8(B)未經(jīng)壓縮的1分鐘立體CD音樂(lè)所需的存儲(chǔ)量為：

(44.1×1000×16)×2×60/8=10584000(B)≈10.1(M)●視頻:320×233窗口中，以25幀/秒速度播放1分鐘顏色數(shù)為8bit的視頻信號(hào)，其數(shù)據(jù)量為：

320×233×8×25×60/(8×1024×1024)≈107(M)⑵壓縮的必要性—海量數(shù)據(jù)的存儲(chǔ)與傳輸?shù)谋厝灰?/p>

在多媒體系統(tǒng)中圖像和動(dòng)態(tài)視頻信息數(shù)據(jù)量非常之巨大，所需要的存儲(chǔ)空間是十分驚人的。請(qǐng)計(jì)算1GB的容量能存儲(chǔ)約?分鐘的彩色電視信號(hào)數(shù)據(jù)。

一分鐘另外在通信網(wǎng)絡(luò)上，大多數(shù)遠(yuǎn)程通信網(wǎng)絡(luò)的速率都在幾兆位每秒以下，顯然，這樣大的數(shù)據(jù)量不僅超出了計(jì)算機(jī)的存儲(chǔ)和處理能力，更是當(dāng)前通信信道的傳輸速率所不及的。計(jì)算1G文件在2M帶寬下載時(shí)間。因此，為了使多媒體達(dá)到實(shí)用水平，除采用新技術(shù)手段增加存儲(chǔ)空間和通信寬帶外，對(duì)數(shù)據(jù)進(jìn)行有效壓縮是多媒體發(fā)展中最關(guān)鍵的技術(shù)之一。⑶數(shù)據(jù)冗余

數(shù)據(jù)是用來(lái)記錄和傳輸信息的，是視頻信息的載體。

信息量=數(shù)據(jù)量-冗余數(shù)據(jù)量

多媒體聲音信源數(shù)據(jù)有極強(qiáng)的相關(guān)性，存在大量冗余

信息，數(shù)據(jù)壓縮就是去掉冗余信息，減少各種數(shù)據(jù)之間的相關(guān)性?！袢哂嗷靖拍睢袢哂唷畔⑺哂械母鞣N性質(zhì)中多余的無(wú)用空間●冗余度——多余的無(wú)用空間的程度I=D－duI—信息量,D—數(shù)據(jù)量,du—冗余量包含在D中●信息量與冗余的關(guān)系●冗余舉例播音員——180字/分鐘，2Byte一個(gè)字，360Byte(合0.35KB/分鐘)音頻數(shù)據(jù)——8kHz采樣×8bit×60秒=3840KBit(合480KB/分鐘)[1]空間冗余——規(guī)則物體的物理相關(guān)性[2]時(shí)間冗余——視頻與動(dòng)畫(huà)畫(huà)面間的相關(guān)性，或語(yǔ)音也是一個(gè)連續(xù)和漸變的過(guò)程，而非完全時(shí)間上的獨(dú)立過(guò)程。[3]統(tǒng)計(jì)冗余——具有空間冗余和時(shí)間冗余[6]視覺(jué)冗余——視覺(jué)、聽(tīng)覺(jué)敏感度和非線性感覺(jué)[7]知識(shí)冗余——利用先驗(yàn)知識(shí)和背景知識(shí)得到[4]結(jié)構(gòu)冗余——從更大視角看存在規(guī)則紋理、相互重疊的結(jié)構(gòu)表面[5]信息熵冗余——編碼冗余，數(shù)據(jù)與攜帶的信息[8]其他冗余——上述7種以外的冗余。如圖像的空間非定常特性所帶來(lái)的冗余等。10110001110010110001110001011010101010111100010111111010224色28色聲音頻率文字組句色彩漸變主觀意識(shí)::⑷冗余的分類(lèi)多媒體數(shù)據(jù)中存在冗余的種類(lèi)：

多媒體數(shù)據(jù)之所以能夠被壓縮，就是它存在上述冗余。數(shù)據(jù)壓縮條件——●數(shù)據(jù)傳輸與存儲(chǔ)空間的限制(壓縮→傳輸或存儲(chǔ)→解壓縮)■

44.1kHz/Stereo1.3MB■22.0kHz/Nomo0.3MB■Stop●數(shù)據(jù)存在冗余(重復(fù)數(shù)據(jù)、可忽略數(shù)據(jù))重復(fù)數(shù)據(jù)可忽略數(shù)據(jù)●不敏感因素(顏色、亮度、頻率、細(xì)節(jié))224顏色(16,777,216色)28顏色(256色)§2數(shù)據(jù)壓縮基本原理1前言

數(shù)據(jù)壓縮技術(shù)的理論基礎(chǔ)是信息論。根據(jù)信息論的原理，可以找到最佳數(shù)據(jù)壓縮編碼方法，數(shù)據(jù)壓縮的理論極限是信息熵。如果要求在編碼過(guò)程中不丟失信息量，即要求保存信息熵，這種信息保持編碼又叫做熵保存編碼，或者叫熵編碼。熵編碼是無(wú)損數(shù)據(jù)壓縮，用這種編碼結(jié)果經(jīng)解碼后可無(wú)失真地恢復(fù)出原貌。無(wú)損壓縮編碼——壓縮數(shù)據(jù)還原后，與原始數(shù)據(jù)一致，無(wú)損失有損壓縮編碼——壓縮后再還原的數(shù)據(jù)有損失

熵編碼是建筑在隨機(jī)過(guò)程的統(tǒng)計(jì)特性基礎(chǔ)上的。對(duì)于語(yǔ)音、靜圖像、運(yùn)動(dòng)圖像、文字等多媒體數(shù)據(jù)壓縮技術(shù)，其信源編碼的輸入，均可認(rèn)為信源發(fā)出的是一個(gè)隨機(jī)信號(hào)序列。它們是時(shí)間、空間或時(shí)間空間混合變量的函數(shù)。2實(shí)現(xiàn)目標(biāo)統(tǒng)計(jì)編碼是根據(jù)信源出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼，它有別于預(yù)測(cè)編碼。這種編碼的宗旨在于，在消息和碼字之間找到明確的一一對(duì)應(yīng)關(guān)系，以便在恢復(fù)時(shí)能準(zhǔn)確無(wú)誤地再現(xiàn)出來(lái)，或者至少是極相似地找到相當(dāng)?shù)膶?duì)應(yīng)關(guān)系，并把這種失真或不對(duì)應(yīng)概率限制到可容忍的范圍內(nèi)。但不管什么途徑，其最終目標(biāo)總是要使平均碼長(zhǎng)或碼率壓低到最低限度。最常用的方法是變長(zhǎng)碼。變長(zhǎng)編碼的信源符號(hào)與碼字是一一對(duì)應(yīng)的，因此再現(xiàn)也是準(zhǔn)確無(wú)誤的。它在編譯碼過(guò)程中并不損失任何信息，屬于冗余壓縮法。如電報(bào)碼。3引入“熵”值的作用在量化處理中，信源的概率分布、信息量和信息熵之間存在什么關(guān)系？在壓縮技術(shù)中引入“熵”值有什么重要意義？熵：就是信息量的度量方法，它表示某一事件出現(xiàn)的消息越多，時(shí)間發(fā)生的可能性，即概率就越大。下面以一個(gè)信源編碼器模型來(lái)說(shuō)明：信源S的熵的定義信源S={si|i=1,2,…,n}的熵定義為：H(S)=∑piLog2(1/pi)其中pi是符號(hào)si在信源S中出現(xiàn)的概率，Log2(1/pi)表示包含在si中的信息量，即是si所需要的位數(shù)。如一幅256色的圖像，如果每一種顏色的概率為1/256，則編碼每一像素點(diǎn)就需要8位。特別地，當(dāng)P(s1)=1時(shí)，則P(s2)=P(s3)=…=P(sn)=0，此時(shí)熵為：熵值的提高對(duì)提高數(shù)據(jù)壓縮比是不利的。

高階的熵值總是低于低階的熵值，因此熵編碼中要實(shí)現(xiàn)高壓縮比例，必須設(shè)法降低熵值。例1有一幅40個(gè)像素組成的灰度圖像,灰度共有5級(jí),分別用符號(hào)A、B、C、D和E表示，40個(gè)像素中出現(xiàn)灰度A的像素有15個(gè)，出現(xiàn)灰度B的像素有7個(gè)，出現(xiàn)灰度C的像素有7個(gè)等。如果用3個(gè)位表示5個(gè)等級(jí)的灰度值，也就是每個(gè)像素用3位表示，編碼這幅圖像總共需要120位。試求此圖像的熵？

解答：按照熵的定義，可得H(S)=0概率為1的事件是必然事件，所以其熵等于0因此，這幅圖像每個(gè)符號(hào)用2.196位表示，40個(gè)像素需87.84位?！?數(shù)據(jù)壓縮算法經(jīng)過(guò)幾十年的數(shù)據(jù)壓縮研究，已經(jīng)產(chǎn)生了各種各樣針對(duì)不同用途的壓縮算法、壓縮手段和實(shí)現(xiàn)這些算法的大規(guī)模集成電路或計(jì)算機(jī)軟件，并逐漸趨于成熟，走向市場(chǎng)和應(yīng)用。現(xiàn)在成熟的數(shù)據(jù)壓縮方法種類(lèi)繁多，可以分為無(wú)損壓縮和有損壓縮兩大類(lèi)。在通常情況下，數(shù)據(jù)壓縮率越高，信息的損耗或失真也越大，需要進(jìn)行某種折衷，找出一個(gè)相對(duì)平衡點(diǎn)。在多媒體應(yīng)用中常用的壓縮方法有:PCM(脈沖編碼調(diào)制)、預(yù)測(cè)編碼、交換編碼、統(tǒng)計(jì)編碼、靜圖像編碼、電視編碼、其他編碼等。新一代的數(shù)據(jù)壓縮方法、如基于模型的壓縮方法、分形壓縮和小波變換方法等也已經(jīng)接近實(shí)用化水平。

數(shù)據(jù)壓縮實(shí)際上就是一種編碼，也稱為一種算法，即把數(shù)據(jù)表達(dá)成的一種壓縮編碼。編碼是源文到碼字的一個(gè)映射。數(shù)據(jù)壓縮技術(shù)的理論基礎(chǔ)是信息論。■無(wú)損壓縮編碼——壓縮數(shù)據(jù)還原后，與原始數(shù)據(jù)一致，無(wú)損失無(wú)損壓縮編碼(可逆編碼)霍夫曼編碼行程編碼算術(shù)編碼■有損壓縮編碼——壓縮后再還原的數(shù)據(jù)有損失有損壓縮編碼(不可逆編碼)全頻帶編碼PCM/ADPCM混合編碼JPEG/MPEG1多媒體壓縮技術(shù)的分類(lèi)2預(yù)測(cè)編碼①前言

預(yù)測(cè)編碼是數(shù)據(jù)壓縮理論的一個(gè)重要分支。它根據(jù)離散信號(hào)之間存在著一定關(guān)聯(lián)性的特點(diǎn)，利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè)，然后對(duì)實(shí)際值和預(yù)測(cè)值的差（預(yù)測(cè)誤差）進(jìn)行編碼。如果預(yù)測(cè)比較準(zhǔn)確，那么誤差信號(hào)就會(huì)很小。這樣一來(lái)，在同等精度要求的條件下，就可以用比較少的數(shù)碼進(jìn)行編碼，達(dá)到壓縮數(shù)據(jù)的目的。如果能夠準(zhǔn)確地預(yù)測(cè)作為時(shí)間函數(shù)的數(shù)據(jù)源的下一個(gè)輸出將是什么，或者數(shù)據(jù)源可以準(zhǔn)確地被一個(gè)數(shù)學(xué)模型表示，輸出數(shù)據(jù)總是和模型的輸出保持一致，則可以準(zhǔn)確地預(yù)測(cè)數(shù)據(jù)。然而實(shí)際信號(hào)源是不可能滿足這兩個(gè)條件的。因此，只能用一個(gè)預(yù)測(cè)器，預(yù)測(cè)下一個(gè)樣值，允許它有某些誤差。本節(jié)的預(yù)測(cè)編碼方法就是解決這樣問(wèn)題的。預(yù)測(cè)編碼方法在圖像數(shù)據(jù)壓縮和語(yǔ)音信號(hào)的數(shù)據(jù)壓縮中都得到廣泛的應(yīng)用和研究。預(yù)測(cè)器通常設(shè)計(jì)成用前面的幾個(gè)樣值來(lái)預(yù)測(cè)下一樣值，而不是利用整個(gè)數(shù)據(jù)信源模型。這是因?yàn)槟Ｐ吞珡?fù)雜，且是時(shí)變的，在大多數(shù)情況下預(yù)測(cè)幾乎不可能實(shí)現(xiàn)。預(yù)測(cè)可以是線性預(yù)測(cè)或非線性預(yù)測(cè)，但絕大多數(shù)使用的是線性預(yù)測(cè)。

線性預(yù)測(cè)的基本問(wèn)題是：已知實(shí)際值和預(yù)測(cè)值之間差值的誤差函數(shù)和一個(gè)時(shí)序樣值集，對(duì)每一樣值求出加權(quán)常數(shù)因子以使建立在加權(quán)樣值線性和之上的預(yù)測(cè)能使誤差函數(shù)最小。通常使用的誤差函數(shù)是均方誤差（MSE）：MSE=E[(S0-PS0)2]其中；E是數(shù)學(xué)期望，S0是下一樣值的實(shí)際值，PS0是下一樣值的預(yù)測(cè)值。上述公式只是常用的一種誤差函數(shù)，在某些場(chǎng)臺(tái)下可能其它的誤差函數(shù)更適用。預(yù)測(cè)編碼中典型的壓縮方法有DPCM，ADPCM等，它們比較適合用于聲音、圖像數(shù)據(jù)的壓縮。因?yàn)檫@些數(shù)據(jù)均由采樣得到，相鄰樣值之間的差不會(huì)相差很大，可以用較少的位來(lái)表示差值。②基本原理在計(jì)算機(jī)多媒體系統(tǒng)中，聲、文、圖等多媒體信號(hào)的原始信號(hào)，都是連續(xù)量。它們是以時(shí)間變量t和空間坐標(biāo)(x，y)為自變量的連續(xù)函數(shù)，是隨機(jī)分布的。為了能讓計(jì)算機(jī)接收，并處理這些信號(hào)，必須把連續(xù)模擬信號(hào)數(shù)字化(A／D變換)。數(shù)字化處理包括將連續(xù)時(shí)間變量t及連續(xù)空間坐標(biāo)(x，y)的離散化和幅度的數(shù)字化兩個(gè)內(nèi)容。預(yù)測(cè)編碼方法原理：是從相鄰像素之間有強(qiáng)的相關(guān)性特點(diǎn)考慮的，當(dāng)前信號(hào)值，可用前面已出現(xiàn)的信號(hào)值，進(jìn)行預(yù)測(cè)(估計(jì))，得到一個(gè)預(yù)測(cè)值(估計(jì)值)，并將實(shí)際值與預(yù)測(cè)值求差，再對(duì)這個(gè)差值信號(hào)進(jìn)行編碼、傳送，這種編碼方法稱為預(yù)測(cè)編碼方法③分類(lèi)法（補(bǔ)充）⑴預(yù)測(cè)編碼方法分線性預(yù)測(cè)和非線性預(yù)測(cè)編碼兩種。線性預(yù)測(cè)編碼方法也稱差值脈沖編碼調(diào)制法，簡(jiǎn)稱DPCM。⑵DPCM中又可以分為可逆的無(wú)失真的DPCM編碼與不可逆的有失真的DPCM編碼。參見(jiàn)圖6-7(教材P106)不可逆的有失真的DPCM編碼：如果包含量化器，而量化器可能導(dǎo)致不可逆的信息損失，這時(shí)接收端，經(jīng)解碼恢復(fù)出的灰度信號(hào)，就存在失真?？梢?jiàn)引入量化器會(huì)引起一定程度的信息損失，使圖像質(zhì)量受損。但是，為了壓縮比特?cái)?shù)，利用人眼的視覺(jué)特性，對(duì)圖像信息丟失不易覺(jué)察的特點(diǎn)，帶有量化器有失真的DPCM編碼系統(tǒng)還是普遍被采用?？赡娴臒o(wú)失真的DPCM編碼：如果不包含量化器，這時(shí)接收端，經(jīng)解碼恢復(fù)出的灰度信號(hào)，就不存在失真。3數(shù)字音頻技術(shù)（復(fù)習(xí)）⑴概述與文字比較、聲音所攜帶的信息量是不可比擬的。參見(jiàn)下表。聲音就是一種機(jī)械振動(dòng)波。聲音主要有兩個(gè)參數(shù)：頻率和振幅。它可以用正弦波y=Asin(x)或余弦波y=Acos(x)來(lái)模擬表示。數(shù)字音頻：就是利用數(shù)字化形式表示的聲音信號(hào)。表示方式數(shù)據(jù)量表達(dá)的信息ASCII1Byte字符名稱點(diǎn)陣7Byte字符名稱、形狀聲音2000Byte字符名稱、讀音、音色、音調(diào)、情感等音頻可以根據(jù)不同方式劃分成不同的類(lèi)型：語(yǔ)音、音樂(lè)、音效等數(shù)字化聲波MIDI合成來(lái)源于聲音素材庫(kù)波形文件Wav、音頻文件MIDI、CD音頻文件等用途來(lái)源格式音頻類(lèi)型y=Asin(x)A聲波波形簡(jiǎn)圖數(shù)字音頻的優(yōu)點(diǎn)：保真度好，動(dòng)態(tài)范圍大，便于計(jì)算機(jī)處理。⑵關(guān)鍵技術(shù)關(guān)鍵技術(shù)主要有：數(shù)字音頻、音樂(lè)合成、MIDI與音效。①數(shù)字音頻數(shù)字化音頻技術(shù)是把表示聲音強(qiáng)弱的模擬信號(hào)(電壓)用數(shù)字表示，數(shù)字音頻是通過(guò)采樣量化把模擬量表示的音頻信號(hào)轉(zhuǎn)換成許多二進(jìn)制1、0組成的數(shù)字音頻文件，實(shí)現(xiàn)數(shù)字化，為計(jì)算機(jī)處理奠定基礎(chǔ)。聲音/音頻模擬信號(hào)聲音/音頻數(shù)字信息1234采樣采樣：每隔一個(gè)時(shí)間間隔在模擬聲音波形上取一個(gè)幅度值。量化量化：在數(shù)字音頻技術(shù)中，把表示聲音強(qiáng)弱的模擬電壓用數(shù)字表示。而用數(shù)字來(lái)表示音頻幅度時(shí)，只能把無(wú)窮多個(gè)電壓幅度用有限個(gè)數(shù)字表示。即把某一幅度范圍內(nèi)的電壓用一個(gè)數(shù)字表示。編輯編碼：即編輯，把量化數(shù)據(jù)寫(xiě)成計(jì)算機(jī)的數(shù)據(jù)格式，即二進(jìn)制格式模擬聲音在時(shí)間上是連續(xù)的，而以數(shù)字表示的聲音是一個(gè)數(shù)據(jù)序列，在時(shí)間上只能是離散的。數(shù)字聲音是一個(gè)數(shù)據(jù)序列抽樣周期：就是采樣的時(shí)間間隔。其倒數(shù)稱為采樣頻率，即每秒鐘所抽取聲波幅度值樣本的次數(shù)，計(jì)算單位采用Hz（赫茲）。音頻模擬信號(hào)數(shù)字化處理流程簡(jiǎn)圖轉(zhuǎn)音頻信號(hào)轉(zhuǎn)換流程1模擬音頻信號(hào)2音頻信號(hào)的采樣3采樣信號(hào)的量化與編碼音頻數(shù)字化處理簡(jiǎn)圖影響數(shù)字音頻質(zhì)量主要有如下因素：

存儲(chǔ)量=(采樣頻率×采樣精度×聲道數(shù)×?xí)r間)／8(Byte/S)

采樣頻率：采樣頻率越高聲音失真越小，但用于存儲(chǔ)音頻的數(shù)據(jù)量也越大。采樣精度：其值大小決定了聲音的動(dòng)態(tài)范圍，因此，采樣精度越大音質(zhì)越好，數(shù)據(jù)量也越大。通道數(shù)量：?jiǎn)温暸c立體聲……4數(shù)字視頻技術(shù)（補(bǔ)充）數(shù)字視頻是基于數(shù)字技術(shù)以及其他更為拓展的圖像顯示標(biāo)準(zhǔn)。本書(shū)主要討論將模擬視頻信號(hào)輸入計(jì)算機(jī)進(jìn)行數(shù)字化視頻編輯，最后制成數(shù)字視頻產(chǎn)品的數(shù)字視頻技術(shù)，即模擬視頻的數(shù)字化處理、存儲(chǔ)和輸出技術(shù)。其數(shù)字化過(guò)程如下：視頻模擬信號(hào)視頻數(shù)字信息1234采樣量化編輯5量化(補(bǔ)充)量化的目的：量化是降低數(shù)據(jù)量強(qiáng)有力的手段。⑴壓縮編碼的過(guò)程

數(shù)字視頻和音頻技術(shù)中實(shí)現(xiàn)A/D(模/數(shù))轉(zhuǎn)換的關(guān)鍵是將時(shí)間上連續(xù)變化的模擬信號(hào)轉(zhuǎn)變成時(shí)間上離散的數(shù)字信號(hào)，這個(gè)過(guò)程主要包括采樣、量化、編碼三個(gè)步驟。視頻/音頻模擬信號(hào)視頻/音頻數(shù)字信息1234采樣量化量化：把某一幅度范圍內(nèi)的模擬信號(hào)用一個(gè)數(shù)字表示。編輯編碼：即編輯，把量化數(shù)據(jù)寫(xiě)成計(jì)算機(jī)的數(shù)據(jù)格式，即二進(jìn)制格式是一個(gè)數(shù)據(jù)序列視頻、音頻模擬信號(hào)數(shù)字化處理流程簡(jiǎn)圖⑵量化原理

在數(shù)據(jù)壓縮編碼中所指的量化，不是指摸/數(shù)轉(zhuǎn)換中的量化，而是指以PCM(均勻量化)碼作為輸入，經(jīng)正交變換、差分或預(yù)測(cè)處理后，在熵編碼之前，對(duì)正交變換系數(shù)、差分值或預(yù)測(cè)誤差值的量化處理。⑶量化研究對(duì)象

為了計(jì)算機(jī)處理的方便，在離散處理過(guò)程中，總是將量化級(jí)設(shè)定為一個(gè)有限整數(shù)，但現(xiàn)實(shí)中為了更真實(shí)反映客觀世界，又需要越多的量化級(jí)別，因此，在量化處理過(guò)程中，必然會(huì)產(chǎn)生信息的丟失，也就是會(huì)引起量化誤差(量化噪聲)。

如何降低量化誤差就是量化需要研究的主要問(wèn)題。同時(shí)，量化的處理過(guò)程是一個(gè)多對(duì)一的過(guò)程，是不可逆的，因此量化中丟失的信息是不可找回的。⑷量化器的設(shè)計(jì)①量化器的設(shè)計(jì)要求給定量化分層級(jí)數(shù)，滿足量化誤差最小；限定量化誤差，確定分層級(jí)數(shù)，滿足以盡量小的平均比特?cái)?shù)，表示量化輸出。顯然這是一對(duì)“冤家”，因此在設(shè)計(jì)中只能根據(jù)不同目的需要，設(shè)計(jì)不同的量化器，并求得上述問(wèn)題的折中處理。②量化的方法和量化特性均勻量化：就是將輸入數(shù)據(jù)的振幅進(jìn)行等值均分，優(yōu)點(diǎn)是計(jì)算處理簡(jiǎn)單，缺點(diǎn)是量化誤差大；量化矢量量化標(biāo)量量化均勻量化非均勻量化自適應(yīng)量化非均勻量化：就是將輸入數(shù)據(jù)的振幅，按照其變化曲線的曲率大小進(jìn)行不等值劃分。優(yōu)點(diǎn)是量化誤差大，缺點(diǎn)是計(jì)算處理復(fù)雜，需要較多的比特?cái)?shù)。量化過(guò)程示意圖非均勻量化的兩種常用算法：采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間存在不同的對(duì)應(yīng)關(guān)系，常見(jiàn)的有μ律壓擴(kuò)算法和A律壓擴(kuò)算法。它們各有不同的特點(diǎn)和適應(yīng)不同的地區(qū)。自適應(yīng)量化：就是按照輸入數(shù)據(jù)的變化曲線的局部區(qū)域的特點(diǎn)，自適應(yīng)地修改和調(diào)整量化器的箱寬。優(yōu)點(diǎn)是量化誤差小，缺點(diǎn)是計(jì)算處理復(fù)雜。

量化器的設(shè)計(jì)和量化特性的選擇，是數(shù)據(jù)壓縮技術(shù)中的一個(gè)關(guān)鍵問(wèn)題。由于量化是一個(gè)有信息丟失的不可逆轉(zhuǎn)過(guò)程，量化器的好壞不僅直接影響數(shù)據(jù)壓縮率，量化誤差對(duì)解壓后的恢復(fù)視頻/音頻的質(zhì)量存在極大的影響。④自適應(yīng)的差分脈碼調(diào)制(ADPCM)

進(jìn)一步改善量化性能或壓縮數(shù)據(jù)率的方法是采用自適應(yīng)量化或自適應(yīng)預(yù)測(cè)，任一種采用自適應(yīng)的方法都叫做自適應(yīng)的差分脈碼調(diào)制(ADPCM)。1)自適應(yīng)量化為了在一定的量化組數(shù)下減少量化誤差或在同樣的誤差條件下壓縮數(shù)據(jù)率，根據(jù)信號(hào)分布不均勻的特點(diǎn)，希望系統(tǒng)具有隨輸入信號(hào)的變化而改變量化區(qū)間大小，以保持輸入量化器的信號(hào)基本均勻的能力稱為自適應(yīng)量化。自適應(yīng)量化必須有對(duì)輸入信號(hào)的幅值進(jìn)行估計(jì)的能力，有了估值才能確定相應(yīng)的改變量。若估值在信號(hào)的輸入端進(jìn)行，稱前向饋送自適應(yīng)；若在量化輸出端進(jìn)行，稱反饋?zhàn)赃m應(yīng)。信號(hào)的估值必須簡(jiǎn)單，占時(shí)間短，這樣才能達(dá)到實(shí)時(shí)處理的目的。2)自適應(yīng)預(yù)測(cè)預(yù)測(cè)參數(shù)的最佳化依賴于信源的統(tǒng)計(jì)特性，要得到最佳預(yù)測(cè)參數(shù)顯然是一件繁瑣的工作。而采用固定的預(yù)測(cè)參數(shù)往往又得不到較好的性能,為了既能使性能較佳，又不致于有太大的計(jì)算工作量，可以將上述兩種方法折衷考慮，采用自適應(yīng)預(yù)測(cè)。3霍夫曼編碼霍夫曼(Huffman)編碼是一種應(yīng)用十分廣泛的壓縮算法，其理論依據(jù)是變字長(zhǎng)編碼理論?；舴蚵幋a具有即時(shí)性和唯一可譯性，編碼具體步驟如下：對(duì)信源進(jìn)行概率統(tǒng)計(jì)，求得n個(gè)不同概率的信源符號(hào)；將n個(gè)信源符號(hào)的n個(gè)概率，按概率遞減順序排列；把n個(gè)概率中兩個(gè)最小概率相加，并作為新符號(hào)的概率，構(gòu)成n-1個(gè)概率重復(fù)步驟1）、2）直到概率和達(dá)到1為止(實(shí)際上要進(jìn)行n-2次后，可以得到只有兩個(gè)概率的序列)；在每次合并概率時(shí)，將被合并的消息賦以1和0或0和1；尋找從每一信源符號(hào)到概率為1處的路徑，記錄下路徑上的1和0；對(duì)每一符號(hào)寫(xiě)出1、0序列（從碼樹(shù)的根到終節(jié)點(diǎn)）。最后，獲得了一棵用于編碼和譯碼的霍夫曼樹(shù)?！窬幋a特點(diǎn)[1]編碼長(zhǎng)度可變，壓縮與解壓縮較慢[2]硬件實(shí)現(xiàn)困難[3]編碼效率取決于信號(hào)源的數(shù)據(jù)出現(xiàn)概率[4]屬于無(wú)損壓縮霍夫曼(Huffman)編碼是一種應(yīng)用十分廣泛的壓縮算法，其理論依據(jù)是變字長(zhǎng)編碼理論。它是一種不等長(zhǎng)格式的編碼方案、在各編碼輸入信息符號(hào)出現(xiàn)的頻率不均勻的情況下，給輸出碼字分配不同的字長(zhǎng)，如用最短的二進(jìn)制位表示出現(xiàn)頻率最高的碼字，用較長(zhǎng)的位表示出現(xiàn)頻率低的碼字，并且按照概率遞減順序排列，如此編碼方案，由最佳編碼定理可知，這樣輸出碼字的平均碼長(zhǎng)最短，與信源熵值接近，編碼方案最佳。實(shí)例：如下表是7個(gè)信源符號(hào)及其概率分布，請(qǐng)構(gòu)造其霍夫曼樹(shù)。解答：碼字的平均碼長(zhǎng)N采用如下公式計(jì)算=(0.35+0.20)×2+(0.15+0.10+0.10)×2+(0.06+0.04)×4=2.55(bits/pel)信源X={xi|I=1,2,…,7}的熵為=-(0.35*Log20.35+0.20*Log20.20+0.15*Log20.15+(0.10*Log20.10)×2+0.06*Log20.06+0.04*Log20.04)=2.13(bits/pel)0.0440.0640.1030.1030.1530.2020.352輸入概率碼長(zhǎng)X7X6X5X4X3X2X1信源符號(hào)霍夫曼編碼步驟1111411104110301130103102002碼字碼長(zhǎng)X7X6X5X4X3X2X1信源符號(hào)霍夫曼碼字的構(gòu)成對(duì)應(yīng)表)4算術(shù)編碼算術(shù)編碼把一個(gè)信源集合表示為實(shí)數(shù)線上的0到1之間的一個(gè)區(qū)間。這個(gè)集合中的每個(gè)元素都要用來(lái)縮短這個(gè)區(qū)間。信源集合的元素越多，所得到的區(qū)間就越小，當(dāng)區(qū)間變小時(shí)，就需要更多的數(shù)位來(lái)表示這個(gè)區(qū)間，這就是區(qū)間作為代碼的原理。算術(shù)編碼首先假設(shè)一個(gè)信源的概率模型，然后用這些概率來(lái)縮小表示信源集的區(qū)間。優(yōu)點(diǎn)：編碼方法比霍夫曼編碼等簡(jiǎn)單，它還有自適應(yīng)特點(diǎn)。5游程編碼(或行程編碼)游程編碼（簡(jiǎn)寫(xiě)為RLE或RLC）是一種十分簡(jiǎn)單的壓縮方法，它將數(shù)據(jù)流中連續(xù)出現(xiàn)的字符（稱為游程）用單一的記號(hào)來(lái)表示。例如，字符串a(chǎn)bacccbbaaaa,可以壓縮為aba3c2b4a游程編碼的壓縮效果不太好，但由于簡(jiǎn)單編碼／解碼的速度非常快，因此仍然得到廣泛的應(yīng)用。許多圖形和視頻文件，如BMP，TIF及AVI等，都使用了這種壓縮?！?JPEG編碼技術(shù)1什么是JPEG?國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT)聯(lián)合成立的“聯(lián)合照片專(zhuān)家組”JPEG經(jīng)過(guò)五年艱苦細(xì)致工作后，于1991-3提出了JPEG標(biāo)準(zhǔn)——JointPhotographicExpertsGroup的縮寫(xiě)，此小組開(kāi)發(fā)研制出連續(xù)色調(diào)、多級(jí)灰度、靜止圖像的數(shù)字圖像壓縮編碼方法，也稱為JPEG算法，此算法后來(lái)被確定為JPEG壓縮標(biāo)準(zhǔn)。它適用于彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。JPEG專(zhuān)家開(kāi)發(fā)了包括采用以預(yù)測(cè)技術(shù)為基礎(chǔ)的無(wú)損壓縮，和基于離散余弦變換、Huffman編碼的有損壓縮兩個(gè)部分。前者不會(huì)產(chǎn)生失真，但壓縮比很小。后者算法進(jìn)行圖像壓縮時(shí)，信息有損失但壓縮比可以很大。例如使用有損壓縮算法，在壓縮比為20:1～40:1倍時(shí)，人眼基本上看不出失真。壓縮后還原得到的圖像與源圖像相比較，非圖像專(zhuān)家是難于找出它們之間的區(qū)別的，因此得到了廣泛的應(yīng)用。JPEG壓縮是有損壓縮?！馢PEG編碼——有損編碼●壓縮比——10:1~100:1(一般壓縮比≯40:1)●壓縮原理——采用無(wú)失真預(yù)測(cè)編碼、有失真DCT編碼等混合編碼方式●無(wú)失真預(yù)測(cè)編碼——線性預(yù)測(cè)編碼，壓縮比2:1●有失真DCT編碼——[1]離散余弦變換壓縮編碼，壓縮比40:1[2]霍夫曼編碼(增強(qiáng)型編碼)[3]自適應(yīng)算術(shù)編碼(增強(qiáng)型編碼)●特點(diǎn)[1]壓縮比可調(diào)[2]對(duì)CPU的響應(yīng)速度要求不高[3]壓縮算法復(fù)雜(可同時(shí)使用四種壓縮編碼方式)在保證圖像質(zhì)量的前提下為進(jìn)一步提高壓縮比，近年來(lái)JPEG專(zhuān)家組正在制定JPEG2000標(biāo)準(zhǔn)，這個(gè)標(biāo)準(zhǔn)中將采用小波變換Wavelet算法(簡(jiǎn)稱WT)。

2JPEG的實(shí)現(xiàn)目標(biāo)達(dá)到或接近當(dāng)前壓縮比與圖像保真度的技術(shù)水平，能夠覆蓋較寬的圖像質(zhì)量等級(jí)范圍，能達(dá)到“很好”或“較好”的評(píng)估，與原始圖像比較，人的視覺(jué)難以分辨；能適用于任何種類(lèi)的連續(xù)色調(diào)的圖相，并且長(zhǎng)寬比都不受限制，同時(shí)也不受制于景物內(nèi)容、圖像的復(fù)雜程度和統(tǒng)計(jì)特性等；計(jì)算的復(fù)雜性是可控制的，其實(shí)現(xiàn)的軟件可在各種類(lèi)型的CPU上運(yùn)行，當(dāng)然算法也可用硬件實(shí)現(xiàn)。3JPEG的幾種操作方式DCT順序編碼。對(duì)一圖像分量按照從左到右、從上到下掃描，一次完成編碼；DCT累進(jìn)(遞增)編碼。對(duì)圖像分量在多次掃描中，實(shí)現(xiàn)從粗到細(xì)的漸進(jìn)式編碼過(guò)程；無(wú)失真編碼。保證編碼后能夠完全恢復(fù)源目標(biāo)，顯然壓縮比低；分層編碼。對(duì)圖像在多個(gè)空間中采用不同的分辨率進(jìn)行編碼。比如在信道傳輸速率慢、接收端的顯示設(shè)備的分辨率低時(shí)，只需要做低分辨率圖像解碼就可以了，而不需要進(jìn)行高分辨率的解碼運(yùn)算。JPEG壓縮算法的特點(diǎn)____P112圖像質(zhì)量

JPEG給出的幾個(gè)衡量壓縮編碼效果的準(zhǔn)則：0.25～0.5位/像素：中到好，足以滿足一些應(yīng)用；0.5～0.75位/像素：好到很好，足以滿足許多應(yīng)用；0.75～1.5位/像素：優(yōu)秀，足以滿足大多數(shù)應(yīng)用；1.5～2.0位/像素：難于與原圖象區(qū)別，足以滿足絕大多數(shù)應(yīng)用。說(shuō)明：位/像素(bit/pixel)=壓縮圖像總位數(shù)/亮度分量的樣本數(shù)2H.261標(biāo)準(zhǔn)1)什么是H.261標(biāo)準(zhǔn)?

是壓縮圖像編碼國(guó)際標(biāo)準(zhǔn)。它主要用于視頻電話和電視會(huì)議，是可用于傳輸率在n×64kb/s(其中n=1,2,……,30)的視聽(tīng)服務(wù)的視頻編碼器。特別地，當(dāng)n=1、2時(shí)，傳輸率比較低，此時(shí)只適用于臺(tái)式面對(duì)面的可視通信，如可視電話；當(dāng)n≤6時(shí)，傳輸率增加一些，可以較好地傳輸比較復(fù)雜的圖像，適用于電視會(huì)議。2)H.261標(biāo)準(zhǔn)H.261標(biāo)準(zhǔn)的主要目標(biāo)是通過(guò)除去冗余信息來(lái)減少位率，其編碼方式可采用源編碼(信源編碼)和熵編碼。其中源編碼又分為幀內(nèi)和幀間編碼。源編碼：是對(duì)原始圖像進(jìn)行處理，這步處理存在信息丟失，是有失真壓縮，其壓縮后存在圖像質(zhì)量降低的現(xiàn)象；幀內(nèi)編碼：由于第一幅圖像和景物變換后的第一幅圖像，它只除去一幅圖像中的空域冗余信息；幀間編碼：用于相似圖像的序列，包括運(yùn)動(dòng)圖像。它不僅除去一幅圖像中的空域冗余信息，而且還除去了幀間圖像的時(shí)域冗余信息；熵編碼：就是利用信號(hào)的統(tǒng)計(jì)特性減少比特?cái)?shù)，以達(dá)到進(jìn)一步壓縮數(shù)據(jù)的目的。理論上它是無(wú)失真壓縮。3)H.261標(biāo)準(zhǔn)的視頻數(shù)據(jù)結(jié)構(gòu)定義一個(gè)科學(xué)的數(shù)據(jù)結(jié)構(gòu)，以保證解碼器進(jìn)行解碼時(shí)不會(huì)產(chǎn)生二義性，這是H.261標(biāo)準(zhǔn)需要解決的一個(gè)重要問(wèn)題。3JPEG壓縮算法⑴無(wú)失真預(yù)測(cè)編碼無(wú)失真預(yù)測(cè)編碼是基于空間的線性預(yù)測(cè)技術(shù)(即差分脈沖編碼調(diào)制)算法,壓縮比一般2:1。優(yōu)點(diǎn)是硬件實(shí)現(xiàn)容易、還原的圖像基本能亂真，效果較好。一般采用DPCM、霍夫曼編碼算法。⑵有失真DCT編碼有失真DCT編碼是基于DCT——離散余弦變換壓縮算法，是屬于有損壓縮算法類(lèi)型的。壓縮比40:1，按照不同層次它通常被劃分成：①基本系統(tǒng)如霍夫曼編碼②增強(qiáng)型編碼如霍夫曼編碼，自適應(yīng)算術(shù)編碼。兩種工作模式：①順序操作②累進(jìn)操作基本JPEG算法的主要計(jì)算步驟（如圖所示）：①正向離散余弦變換；②量化；③Z字形編碼；④差分編碼：用DPCM對(duì)直流系數(shù)DC進(jìn)行編碼；⑤量化表：用行程長(zhǎng)度編碼對(duì)交流系數(shù)AC進(jìn)行編碼；⑥熵編碼。實(shí)際上，基本JPEG算法操作可分成三個(gè)步驟：⑴顏色空間轉(zhuǎn)換上圖中第一步的顏色轉(zhuǎn)換是去除數(shù)據(jù)冗余量過(guò)程的組成部分，但它并不是JPEG算法的成分，JPEG目標(biāo)是獨(dú)立于色彩空間的。使用離散余弦變換（DCT）去除數(shù)據(jù)冗余。JPEG采用8×8子塊的二維離散余弦變換算法。在編碼器的輸入端，把原始圖像（對(duì)彩色圖像是每個(gè)顏色成分）順序地分割成一系列8×8的子塊。在8×8圖像塊中，像素值一般變化較平緩，因此具有較低的空間頻率。并將原始采樣數(shù)據(jù)的無(wú)符號(hào)整數(shù)轉(zhuǎn)換成符號(hào)整數(shù)，即“正變換”過(guò)程。8×8圖像塊最終是用64個(gè)離散像素點(diǎn)構(gòu)成的，顯然是空間坐標(biāo)(x、y)的函數(shù)。DCT輸入時(shí)經(jīng)過(guò)正交變換，將這64個(gè)像素點(diǎn)分解成64個(gè)正交基信號(hào)，而每個(gè)正交基信號(hào)對(duì)應(yīng)一個(gè)64個(gè)二維空間頻率中的一個(gè)，這些二維空間頻率是由輸入信號(hào)的頻譜組成。DCT輸出的是64個(gè)基信號(hào)的幅度值，或者稱為DCT系數(shù)，顯然DCT系數(shù)由64個(gè)像素點(diǎn)惟一確定。⑵DCT離散余弦變換DCT壓縮算法的實(shí)質(zhì)是：壓縮8×8圖像塊灰度樣本數(shù)據(jù)流。⑶DCT系數(shù)量化

為了達(dá)到壓縮數(shù)據(jù)的目的，對(duì)離散余弦變換DCT系數(shù)需作量化處理。量化的作用是在保持一定質(zhì)量的前提下，丟棄圖像中對(duì)視覺(jué)效果影響不大的信息。量化是多對(duì)一映射，是造成DCT編碼信息損失的根源。JPEG標(biāo)準(zhǔn)中采用線性均勻量化器，量化過(guò)程為對(duì)64個(gè)DCT系數(shù)除以量化步長(zhǎng)并四舍五入取整(見(jiàn)教材P114)，量化步長(zhǎng)由量化表決定。因此，壓縮數(shù)據(jù)的關(guān)鍵是量化表。

量化表元素因DCT系數(shù)位置和彩色分量的不同而取不同值。量化表為8×8矩陣，與DCT變換系數(shù)一一對(duì)應(yīng)。量化表一般由用戶規(guī)定（JPEG標(biāo)準(zhǔn)中給出了參考值），可根據(jù)人類(lèi)視覺(jué)系統(tǒng)和壓縮圖像類(lèi)型的特點(diǎn)進(jìn)行優(yōu)化，并作為編碼器的一個(gè)輸入。量化表中元素為l~255之間的任意整數(shù)，其值規(guī)定了所對(duì)應(yīng)DCT系數(shù)的量化步長(zhǎng)。DCT變換系數(shù)除以量化表中對(duì)應(yīng)位置的量化步長(zhǎng)并舍去小數(shù)部分后，多數(shù)變?yōu)榱悖瑥亩_(dá)到了壓縮的目的。

量化表：下面的表1和表2分別給出了JPEG標(biāo)準(zhǔn)所推薦的亮度量化表和色度量化表。12Z字型掃描和AC系數(shù)的游程編碼為了將相同頻率或近似頻率的系數(shù)排列在相近的位置，采用‘Z’字型排列編碼，這樣得到的AC系數(shù)——即DC系數(shù)經(jīng)過(guò)量化后的系數(shù)，且AC系數(shù)序列中將包含有許多0系數(shù)，并且許多0是連續(xù)的，因此就方便使用非常簡(jiǎn)單和直觀的游程長(zhǎng)度編碼方法。并且量化后的AC系數(shù)通常會(huì)有許多零值，而目零值通常是從左上角開(kāi)始沿對(duì)角線方向分布，因此，以Z字形路徑進(jìn)行游程編碼有效地增加了連續(xù)出現(xiàn)的零值（0游程）個(gè)數(shù)。問(wèn)題：對(duì)AC系數(shù)還可以再壓縮嗎？熵編碼

為了進(jìn)一步壓縮數(shù)據(jù)，對(duì)DC碼和DC行程編碼的碼字再作基于統(tǒng)計(jì)特性的熵編碼，進(jìn)行進(jìn)一步的壓縮操作?！词窃鰪?qiáng)系統(tǒng)的JPEG算法。

JPEG標(biāo)準(zhǔn)建議使用的熵碼方法有霍夫曼編碼和自適應(yīng)二進(jìn)制算術(shù)編碼。例如，在JPEG有損壓縮算法中，使用霍夫曼編碼器來(lái)減少熵的理由是可以使用很簡(jiǎn)單的查表(Lookuptable)方法進(jìn)行編碼，并且壓縮數(shù)據(jù)符號(hào)時(shí)，霍夫曼編碼器對(duì)出現(xiàn)頻度比較高的符號(hào)分配比較短的代碼，而對(duì)出現(xiàn)頻度較低的符號(hào)分配比較長(zhǎng)的代碼，這種可變長(zhǎng)度的霍夫曼碼表可以事先進(jìn)行定義?！?MPEG編碼技術(shù)全屏幕活動(dòng)視頻圖像是多媒體技術(shù)最終要達(dá)到的主要目標(biāo)之一，雖然目前這一目標(biāo)還遠(yuǎn)沒(méi)有實(shí)現(xiàn)，但人們已經(jīng)提出了不少解決方案，以MPEG為核心的壓縮技術(shù)是其中最有希望的一種。1什么是MPEG（即運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn))

MPEG就是運(yùn)動(dòng)圖像的數(shù)字圖像壓縮編碼方法。MPEG標(biāo)準(zhǔn)分成兩個(gè)階段:第一個(gè)階段（MPEG-Ⅰ）是針對(duì)傳輸速率為1MB/s到15MB/s的普通電視質(zhì)量的視頻信號(hào)的壓縮；第二個(gè)階段（MPEG-II）目標(biāo)則是對(duì)每秒3O幀的72Ox572分辨率的視頻信號(hào)進(jìn)行壓縮;在擴(kuò)展模式下，MPEG-II可以對(duì)分辨率達(dá)144Oxll52高清晰度電視的信號(hào)進(jìn)行壓縮。MPEG標(biāo)準(zhǔn)的分類(lèi)：MPEG視頻，MPEG音頻和視頻音頻。下圖是MPEG壓縮的實(shí)施框圖。2MPEG視頻要求通用的壓縮標(biāo)準(zhǔn)。但與H.261標(biāo)準(zhǔn)比較，它的頻帶范圍較窄，它是基于一個(gè)可以接受的視頻質(zhì)量，通過(guò)一個(gè)1.5Mb/s的帶寬得到。MPEG的存儲(chǔ)介質(zhì)和視頻應(yīng)用

MPEG視頻壓縮特點(diǎn)隨機(jī)存取；快速正向、逆向搜索；逆向重播；視聽(tīng)同步；容錯(cuò)性；編碼/解碼延遲。圖像分類(lèi)(P116)①幀內(nèi)圖像；②預(yù)測(cè)圖像；③雙向圖像。

3MPEG壓縮主要解決的問(wèn)題正確區(qū)分靜止與動(dòng)態(tài)的圖像；如何提取動(dòng)態(tài)圖像的活動(dòng)成分；進(jìn)行幀間預(yù)測(cè)，提供壓縮依據(jù)。4幀間預(yù)測(cè)編碼兩種方法：

①條件像素補(bǔ)充法；

②運(yùn)動(dòng)補(bǔ)償法。

運(yùn)動(dòng)補(bǔ)償算法是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法之一，是減少幀序列冗余信息的有效方法。由于幀序列的相鄰畫(huà)面之間的運(yùn)動(dòng)部分具有連續(xù)性，即當(dāng)前圓面上的圖像可以看成是前面某圖像的位移，位移的幅度值和方向在畫(huà)面各處可以不同，因此利用運(yùn)動(dòng)位移信息與前面某時(shí)刻的圖像就可以實(shí)現(xiàn)對(duì)當(dāng)前畫(huà)面圖像進(jìn)行預(yù)測(cè)，此方法稱為前向預(yù)測(cè)。反之，根據(jù)某時(shí)刻的圖像與位移信息預(yù)測(cè)該時(shí)刻之前的圖像，稱為后向預(yù)測(cè)。如果根據(jù)某時(shí)段的平均值預(yù)測(cè)圖像的方法，稱為平均預(yù)測(cè)?；虿捎们?、后預(yù)測(cè)稱為雙向預(yù)測(cè)。參見(jiàn)圖6-14和6-15(P116)5MPEG標(biāo)準(zhǔn)與質(zhì)量編碼與解碼的一致性；分辨率、位率和質(zhì)量；6MPEG標(biāo)準(zhǔn)的進(jìn)展

MPEG是MovingPicturesExpertsGroup(動(dòng)態(tài)圖象專(zhuān)家組)的縮寫(xiě)。這個(gè)專(zhuān)家組始建于1988年，專(zhuān)門(mén)負(fù)責(zé)為CD建立視頻和音頻標(biāo)準(zhǔn)，其成員均為視頻、音頻及系統(tǒng)領(lǐng)域的技術(shù)專(zhuān)家。MPEG的四個(gè)版本：MPEG-Ⅰ

、MPEG-Ⅱ、MPEG-Ⅲ

、MPEG-Ⅳ。由于MPEG-Ⅱ的出色性能表現(xiàn)，已能適用于HDTV，使得原打算為HDTV設(shè)計(jì)的MPEG－Ⅲ，還沒(méi)出世就被拋棄了。MPEG-Ⅰ；MPEG-Ⅱ；MPEG-Ⅳ：MPEG-Ⅶ。新一代聲像編碼國(guó)際標(biāo)準(zhǔn)，其應(yīng)用領(lǐng)域……7已經(jīng)和正在開(kāi)發(fā)的MPEG標(biāo)準(zhǔn)MPEG-1：數(shù)字電視標(biāo)準(zhǔn)，1992年；MPEG-2：數(shù)字電視標(biāo)準(zhǔn)；MPEG-3：92年合并到高清晰度電視工作組HDTV；MPEG-4：多媒體應(yīng)用標(biāo)準(zhǔn)，99年；MPEG-5：至98年還未定義；MPEG-6：至98年還未定義；MPEG-7：多媒體內(nèi)容描述接口標(biāo)準(zhǔn)，正在研究。其中MPEG-1、2標(biāo)準(zhǔn)已經(jīng)正式發(fā)布并且得到廣泛應(yīng)用。8MPEG-4標(biāo)準(zhǔn)的組成DMIF（TheDelliveryMultimediaIntegrationFramework）即多媒體傳送整體框架，它主要解決交互網(wǎng)絡(luò)中、廣

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

ch5多媒體數(shù)據(jù)壓縮技術(shù)課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

ch5多媒體數(shù)據(jù)壓縮技術(shù)課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔